各位读者,新年快乐!
2024年已经过去,人工智能技术突破了所有人的想象力极限。
在24 年初,“是否有其他模型能在年内达到GPT-4水平”还是个很大的问号。而现在,这显然已不再是个能吸引人们关注的话题。
Hugging Face的技术负责人Philipp Schmid回顾道:
这一年的进展令人难以置信,从开源模型到合成数据的应用,AI领域每个月都在发生革命性的突破。
巨头的较量
先来回顾下全球范围内的巨头们。
OpenAI
依然是行业领头羊,正朝着「下一个Google」的方向狂奔。
打响大模型第一枪的OpenAI 显然当属第一天团,在toB、toC、模型能力、多模态、人才密度上都可称得上稳居第一。
其核心逻辑是「计算架构+信息分发」,试图打造一个任务引擎、任务容器。
刚刚发布的o1,o3 模型似乎表示出其兴趣正逐渐往o 系列转移。
或许,其内部已经实现AGI,但因资源或监管等因素,目前甚至将来,都将只是少数人才能用得上的高级武器。
同时,OpenAI 与微软的关系却似乎出现了微妙变化,有传言称「微软可能会投资Anthropic」,以增加对OpenAI 相关不确定性的抗衡。
Anthropic
表现抢眼。
在Coding领域深耕,专注Agent方向,正在打造一个完整生态系统。
核心竞争力在于「端到端垂直整合能力」,从成本优化到模型架构,一条龙全包。
主攻逻辑和AGI,没看到多模态的太多工作,至少没有对外展示太多。
xAI
虽然动作不大,但马斯克和x 平台数据的加持下,可以说是「注定要成功,只是上限有待观察」。
再结合马斯克的特斯拉、FSD、Optimus,甚至SpaceX,可谓最大格局,最具想象力。
Meta
表现也算得上可圈可点。
Llama 3 展现出了比前代提升约10%的性能,并在整个Hugging Face生态系统中得到广泛应用,且达到了GPT-4 级的能力。
4月发布的Llama 3 展示了在文本生成和总结方面的出色表现,随后在9月又推出了Llama 3.2 Vision——一个能够同时理解文本和图像的多模态模型。
占稳了开源生态的话语权,要做AI 界的Linux,这是Meta 在AI 布局中最重要也最成功的一环。
同时还具备与智能眼镜、元宇宙等概念结合的实践和想象力,或许未来有望能一挑大哥苹果。
挑占马斯克,就还是算了吧,至今连架都还没打。
Perplexity
定位更像是一个信息处理的Agent。
其他,Cursor 和Devin 则在Coding领域发力,特别是Devin,被认为是「第一个真正意义上做长距离复杂任务的Agent」。
只是发布之后似乎有些拉垮?我还没用上过。
曾经名躁一时的Mistral 似乎有了新的战略调整,据说「已经正式放弃预训练」。
中国势力的崛起
再来看看国内的模型厂商们。
字节跳动
除了豆包,Coze,还有一众人才、模型和资源,可以说是展现出了最强的决心,听闻不少数倍薪水被挖走的人才,投入和决心之大,在国内可以称是举国无双。
Deepseek
表现堪称今年最大黑马,其开源模型超越了GPT-4o和Sonnet,成为新的SOTA标杆。TheLMWa 称赞说:
「Deepseek的表现令人惊叹」。
千问
在开源生态方面表现出色,影响力持续扩大。
智谱
我没有使用太多,但感受上,是一家踏实做事的公司,口碑似乎不错,有不少人认可。
百度
似乎将重心转向了应用落地?
原因?
不祥。
腾讯
像是采取了相对保守的策略——「有大模型即可,不必争第一」。
也争不了。
快手
主要在于推出了可灵,在逻辑和娱乐之间,坚定地选择了后者,基因上似乎也只能这么选。
至于Kimi,应用和广告可能做得还行?以及除了公关上之外,似乎还需要在技术上有更多突破。
还有百川?最近没关注太多了。
其他,我还有漏了谁吗?
模型能力大爆发
o1系列 证明了LLM具备了推理能力,Sonnet在代码领域展现出惊人实力。
图像生成领域,Grok和Flux的作品已经几乎可以以假乱真。
视频生成更是突飞猛进,Veo 2能够生成超逼真的视频,而Hailuo、Kling和Sora也在紧随其后。
开源领域的Deepseek模型一鸣惊人,超越了GPT-4o和Sonnet,成为新的SOTA标杆。
TheLMWay 对这个中国模型大加称赞:
Deepseek的表现令人惊叹。
summitbytes 分析道:
即使从今天起AI不再有任何进展,AGI所需的所有拼图也已经在这里了。从o3这样的推理模型,到Claude这样的写作模型,再到4o这样的语音和图像识别,以及特斯拉FSD这样的机器人/物理模型,最后是一个知道该在什么时候使用哪个模型的强化学习模型。
AI助手全面升级
今年最显著的变化是AI助手的能力全面提升:
-
电脑代理(Computer agents)能够在我们的电脑上执行各种任务
-
AI编程助手的水平已经能与初级软件工程师媲美
-
非技术人员也能轻松创建RAG聊天机器人和简单的AI代理
Omar Samir感叹道:「2024年是AI的重大胜利!LLM的升级、Sonnet的编码奇迹,以及Veo 2的逼真视频,看到这些进展实在太酷了!」
机器人和自动驾驶的飞跃
机器人领域的进展令人瞩目。
Renita Jade对此充满期待:「我很高兴看到AI取得如此大的进展,实用的人形机器人是我一直最想看到的东西」。
各种人形机器人原型的出现预示着,大规模商用人形机器人可能在5年内成为现实。
汽车公司小鹏甚至放弃了自动驾驶,转攻人形机器人方向。
自动驾驶领域,Waymo已在多个城市投入运营,在旧金山甚至成为了优步打车太慢时的替代选择。
特斯拉也离大规模自动驾驶更近了一步,入华也已是板上钉钉之事。
未来
BLCNYY回顾道:「2024是AI成就的一年,我们比以往任何时候都更接近AGI(也许甚至已经实现了)。推理模型、更自然的AI对话、更多用AI创作内容的方式等等」。
Rethynk AI对2025年做出了大胆预测:
AI代理将主导工作流程
超个性化AI
机器人技术突破
量子计算与AI协同
AI治理成为焦点
这一年,每个拥抱AI的人的生产力至少提升了15%。
也有专家对2025/2026年的关键预测如下:
-
长距离任务规划(Long horizon task)将成为重点
-
全新的交互界面将改变产品形态
-
AI商业模式将迎来重大变革
-
高质量可扩展的数据将成为关键
-
Context的重要性将被更多人认识到
对于AGI来说,我只能想象它将像互联网一样变得更加庞大。
我们正生活在奇点时代,而2025年将会变得更加令人期待。
(文:AGI Hunt)