2024 盘点——AI大爆发之年,我们正生活在奇点时代!

各位读者,新年快乐!

2024年已经过去,人工智能技术突破了所有人的想象力极限。

在24 年初,“是否有其他模型能在年内达到GPT-4水平”还是个很大的问号。而现在,这显然已不再是个能吸引人们关注的话题。

Hugging Face的技术负责人Philipp Schmid回顾道:

这一年的进展令人难以置信,从开源模型到合成数据的应用,AI领域每个月都在发生革命性的突破

巨头的较量

先来回顾下全球范围内的巨头们。

OpenAI

依然是行业领头羊,正朝着「下一个Google」的方向狂奔。

打响大模型第一枪的OpenAI 显然当属第一天团,在toB、toC、模型能力、多模态、人才密度上都可称得上稳居第一。

其核心逻辑是「计算架构+信息分发」,试图打造一个任务引擎、任务容器

刚刚发布的o1,o3 模型似乎表示出其兴趣正逐渐往o 系列转移。

或许,其内部已经实现AGI,但因资源或监管等因素,目前甚至将来,都将只是少数人才能用得上的高级武器

同时,OpenAI 与微软的关系却似乎出现了微妙变化,有传言称「微软可能会投资Anthropic」,以增加对OpenAI 相关不确定性的抗衡。

Anthropic

表现抢眼。

在Coding领域深耕,专注Agent方向,正在打造一个完整生态系统。

核心竞争力在于「端到端垂直整合能力」,从成本优化到模型架构,一条龙全包。

主攻逻辑和AGI,没看到多模态的太多工作,至少没有对外展示太多。

xAI

虽然动作不大,但马斯克和x 平台数据的加持下,可以说是「注定要成功,只是上限有待观察」。

再结合马斯克的特斯拉、FSD、Optimus,甚至SpaceX,可谓最大格局,最具想象力。

Meta

表现也算得上可圈可点。

Llama 3 展现出了比前代提升约10%的性能,并在整个Hugging Face生态系统中得到广泛应用,且达到了GPT-4 级的能力。

4月发布的Llama 3 展示了在文本生成和总结方面的出色表现,随后在9月又推出了Llama 3.2 Vision——一个能够同时理解文本和图像的多模态模型。

占稳了开源生态的话语权,要做AI 界的Linux,这是Meta 在AI 布局中最重要也最成功的一环。

同时还具备与智能眼镜、元宇宙等概念结合的实践和想象力,或许未来有望能一挑大哥苹果。

挑占马斯克,就还是算了吧,至今连架都还没打。

Perplexity

定位更像是一个信息处理的Agent

其他,Cursor Devin 则在Coding领域发力,特别是Devin,被认为是「第一个真正意义上做长距离复杂任务的Agent」。

只是发布之后似乎有些拉垮?我还没用上过。

曾经名躁一时的Mistral 似乎有了新的战略调整,据说「已经正式放弃预训练」。

中国势力的崛起

再来看看国内的模型厂商们。

字节跳动

除了豆包,Coze,还有一众人才、模型和资源,可以说是展现出了最强的决心,听闻不少数倍薪水被挖走的人才,投入和决心之大,在国内可以称是举国无双

Deepseek

表现堪称今年最大黑马,其开源模型超越了GPT-4o和Sonnet,成为新的SOTA标杆。TheLMWa 称赞说:

Deepseek的表现令人惊叹」。

千问

在开源生态方面表现出色,影响力持续扩大。

智谱

我没有使用太多,但感受上,是一家踏实做事的公司,口碑似乎不错,有不少人认可。

百度

似乎将重心转向了应用落地?

原因?

不祥。

腾讯

像是采取了相对保守的策略——「有大模型即可,不必争第一」。

也争不了。

快手

主要在于推出了可灵,在逻辑和娱乐之间,坚定地选择了后者,基因上似乎也只能这么选。

至于Kimi,应用和广告可能做得还行?以及除了公关上之外,似乎还需要在技术上有更多突破。

还有百川?最近没关注太多了。

其他,我还有漏了谁吗?

模型能力大爆发

o1系列 证明了LLM具备了推理能力,Sonnet在代码领域展现出惊人实力。

图像生成领域,GrokFlux的作品已经几乎可以以假乱真。

视频生成更是突飞猛进,Veo 2能够生成超逼真的视频,而HailuoKlingSora也在紧随其后。

开源领域的Deepseek模型一鸣惊人,超越了GPT-4o和Sonnet,成为新的SOTA标杆。

TheLMWay 对这个中国模型大加称赞:

Deepseek的表现令人惊叹

summitbytes 分析道:

即使从今天起AI不再有任何进展,AGI所需的所有拼图也已经在这里了。从o3这样的推理模型,到Claude这样的写作模型,再到4o这样的语音和图像识别,以及特斯拉FSD这样的机器人/物理模型,最后是一个知道该在什么时候使用哪个模型的强化学习模型

AI助手全面升级

今年最显著的变化是AI助手的能力全面提升

  • 电脑代理(Computer agents)能够在我们的电脑上执行各种任务

  • AI编程助手的水平已经能与初级软件工程师媲美

  • 非技术人员也能轻松创建RAG聊天机器人和简单的AI代理

Omar Samir感叹道:「2024年是AI的重大胜利!LLM的升级、Sonnet的编码奇迹,以及Veo 2的逼真视频,看到这些进展实在太酷了!

机器人和自动驾驶的飞跃

机器人领域的进展令人瞩目。

Renita Jade对此充满期待:「我很高兴看到AI取得如此大的进展,实用的人形机器人是我一直最想看到的东西」。

各种人形机器人原型的出现预示着,大规模商用人形机器人可能在5年内成为现实

汽车公司小鹏甚至放弃了自动驾驶,转攻人形机器人方向。

自动驾驶领域,Waymo已在多个城市投入运营,在旧金山甚至成为了优步打车太慢时的替代选择。

特斯拉也离大规模自动驾驶更近了一步,入华也已是板上钉钉之事。

未来

BLCNYY回顾道:「2024是AI成就的一年,我们比以往任何时候都更接近AGI(也许甚至已经实现了)。推理模型、更自然的AI对话、更多用AI创作内容的方式等等」。

Rethynk AI对2025年做出了大胆预测:

  1. AI代理将主导工作流程

  2. 超个性化AI

  3. 机器人技术突破

  4. 量子计算与AI协同

  5. AI治理成为焦点

这一年,每个拥抱AI的人的生产力至少提升了15%。

也有专家对2025/2026年的关键预测如下:

  • 长距离任务规划(Long horizon task)将成为重点

  • 全新的交互界面将改变产品形态

  • AI商业模式将迎来重大变革

  • 高质量可扩展的数据将成为关键

  • Context的重要性将被更多人认识到

对于AGI来说,我只能想象它将像互联网一样变得更加庞大

我们正生活在奇点时代,而2025年将会变得更加令人期待。

(文:AGI Hunt)

欢迎分享

发表评论