我对2025年AI的十点思考

「过去、现在和未来的区别，只不过是一种顽固而持久的幻觉。」

爱因斯坦，1955

时光荏苒，2024一晃而过。

这一年，我们见证了无数次“AI一天，人间一年”的Magic Moment（神奇时刻），目睹了AI给各行各业带来的颠覆性变革与前所未有的挑战。我们亲身体验了形形色色的AI产品，切身感受到AI对工作、生活和学习的提效速度。与此同时，我们也欣喜地看到，更多China AI在全球舞台上崭露头角，大放异彩。

Artificial Intelligence（人工智能，简称AI），就这样从儿时的影像作品中跃出屏幕，走入了我们的寻常生活。

不是我们需要AI，而是AI已经成为了我们不可或缺的基础设施。就像鱼儿离不开水，人类离不开空气一样。AI，不仅定义了我们的现在，也将继续在未来路上不断进化。

站在这样一个时代浪尖，我想跟大家聊聊我对2025年AI的思考，以及我的研判。

1、此智能体，非彼智能体

我最近开始理解到，未来的智能体可能跟现在的智能体完全不一样，不管是定义还是形式，可能都不太一样。

现在的智能体，依托大模型自身平台或第三方LLM应用开发平台（如扣子、腾讯元器）创建的Agent，我理解为更多是智能工具，他们是在某一个功能性上为用户提供智能服务，以软件形式为主。使用方式，离不开手机或电脑，甚至还被困在一个浏览器里。

未来的智能体，我理解为更会像是贾维斯那样个性化、智能化以及多模态感知的超级智能助手，甚至是智能实体。它不只是软件工具，而是我们人类的伙伴，是可以在生活、工作、娱乐、学习等多场景中帮助我们的智能伙伴。

最近，Sam Altman提出AGI层级框架理论：一级指有语言能力的AI；二级拥有人类水准的问题求解能力、推理能力；三级能够使用工具，系统执行；四级AI能够自己发明创新；五级AI可以融入组织或自建组织。

图自智谱

他认为目前AI已经从第一级“聊天机器人”发展到了第二级“推理器”，比如擅长推理的o1模型，可以执行高难度的Python任务；而第三极能够使用工具的“智能体”，将加快智能系统的进化速度，在自主性和决策能力方面带来重大提升，这有望在2025年得以见证。

其实，在2024Q4里，我们已经见到了智能体的雏形。10月23日，Claude 3.5 Sonnet推出Computer Use功能；10月24日，智谱AI推出Phone use产品AutoGLM；11月8日，搭载YOYO智能体的荣耀Magic手机正式上市。

我觉得这样的智能体才是未来的智能体，才是真正的智能体。2025年，我们一定会见到越来越多类似智能体的出现。

2、空间智能迎来突破

2024年，李飞飞不只一次提到“AI发展下一步是空间智能”，并亲自下场开了家公司World Labs，来研究空间智能。12月，他们发布了第一款「空间智能」模型。只需要一张图，即可生成一个逼真的3D世界。

体验地址：https://www.worldlabs.ai/blog

空间智能，同Attention机制、DiT架构一样，是AI向前发展必须要去突破的基础技术，也被称作世界模型。简单来说就是，世界模型能够直接观察现实，并从现实中得出常识，然后基于常识展开预测和行动。有了世界模型，计算机就知道如何在真实的三维世界中行走了。

这一步突破，将是AI技术的重大飞跃。人工智能产业，也将由软件智能走向硬件智能，背后的市场空间远比现在的生产力赛道更大、更广。

畅想未来的人机协作时代，到处都是智能机器（如机器人、AI管家等）与人类交互，不论真实、虚拟的三维世界，这一切都遵循着物理规则，我们同住地球村。

目前，研究世界模型的团队有：World Labs（李飞飞团队）、DeepMind、阿里、智源。相对于LLM来说，真的很少，需要更多资源、企业和市场的跟进。希望，2025年能有新的突破。

3、CoT成为AI产品标配

CoT思维链（Chain of Thought），step by step一步一步思考，原本只是Prompt里的一个小技巧。没承想，却由o1模型把它发扬光大。

图由即梦AI生成，提示词：逻辑，推理，深度思考，标题“CoT”。

今年下半年，行业对Scaling Law（规模定律）有争议，Ilya Sutskever更是直言“预训练时代即将终结（原话Pre-training as we know it will end）”。

顶尖AI公司如OpenAI、Anthropic，在推出ChatGPT 4.0 Turbo、Claude 3.5后的相当长一段时间里都没有发布新模型。数据枯竭、算力昂贵、效果下降……难道Scaling Law“撞墙”了？类似反思频繁出现在AI行业内部。

随后，OpenAI带着具有CoT思维链的o1模型王者归来，其表现出的优秀演绎能力、数学计算和推理能力，为行业再次指明了方向——模型就得上Cot思维链、Self-play RL强化学习，上“慢思考”，要像人一样深入思考，逐步推导。

国内AI，kimi、Qwen、天工、DeepSeek、360、InternThinker等都陆续推出了类o1模型。预计2025年，Cot、Self-play RL将成为大模型的标配技术。

4、万物皆可Agent

通用模型，看起来全知全能，但要真正适用到各行业，通常需要搭配提示词和行业数据使用。其最好的实现形式就是Agent，定制Agent。

图自特工宇宙

今年，已经有很多行业的先行者开始用上了Agent，比如在智能客服、文案生成器、学习助手、信息检索、数据分析、文件处理、图像音视频处理、自动化流程管理等场景。

但总使用人数还比较少，以国内Top级别的Agent开发平台扣子为例，也才刚刚过了100万月活的关口。预计2025年，Agent开发者和应用将会越来越多。

Agent，现已从单Agent，发展到了多Agent协作的新范式。LLM与知识库、workflows（工作流）、RPA（机器人流程自动化）协作，能令Agent收到意想不到的效果，比通用模型更好的效果。业内共识，2025年将是Agent大年。

5、AI普遍开始收费

对于互联网公司来说，收费无非3种：（1）向C端用户收费，比如爱优腾芒，他们以会员制为主；（2）向B、G端收费，比如360安全、微软，他们向C端提供免费产品，然后向B、G端收费；（3）向C端提供免费产品，按流量收广告费，比如字节、百度、谷歌。

目前的AI公司也跳不出这个逻辑，B端就是收API费，C端收会员费，收广告费？目前还没有，AI主打的宣传点就是“没有广告”，短时间内应该还不会屠龙少年变恶龙吧

。

截至目前，收费AI大体上分为这几类：

（1）刚性需求的产品，比如AIPPT、绘图、视频、数字人等，对职场人提效明显，用户愿意付费。

（2）先期产品，如ChatGPT、文心一言，分别代表了国外和国内最早的大模型，有先发优势，最早开启收费。不过，GPT4.0发布一年后，ERNIE才推出4.0（收费）。而现在，GPT早就不用4.0了，而是4o、o1、o3……以及各种mini版、满血版、Pro版。

（3）顶尖产品，如Claude 3.5 Sonnet、Perplexity、Coze，他们在各自领域属于碾压级的存在，所以都开启了收费。

（4）情感陪护产品，如Talkie、Character.AI等，主打感情牌，用户的付费能力和频率一直都比较高。

（5）一些有意思的收费模式，比如智谱清言，它将视频通话、视频生成、AIPPT、AI绘画、AI音效等功能都集合在一块，然后推出大会员体系，不限使用次数。以及Kimi，早期因为算力紧张，推出过打赏服务，氪金可享受算力优先使用权。

预计，随着2025年AI产品市占率的不断提升，将会有越来越多的AI推出收费模式，甚至普遍开启收费。不过，各家在收费模式上还需要推陈出新，得有创新的玩法和过硬的产品。

6、“AI味”基本消除

所谓“AI味”，陈财猫认为“大体是指那些爱用概括性描述、缺乏侧面描写、生硬叙述、死板结构和过度道德正确的AI文风。”

这种文风，最早来源于ChatGPT。OpenAI在做数据标注时，写了不少首先、其次、然后、最后之类的文本，被加入了训练集，然后加上自身又有对齐（即道德正确）的要求，这就导致了AI生成的文字过于一板一眼，一股子废话文学，AI味严重。

现在，随着模型的进步，顶尖模型（如4o、Claude3.5、gemini）的AI味已基本消除。预计，明年国内AI也将陆续消除“AI味”。

无需Prompt，AI自会说人话。

7、“后真相”时代的治理

AI越来越方便，与此同时造假也就越来越便捷，比如P图、视频合成、声音克隆甚至人脸合成，以及AI自带的幻觉问题、对齐问题。这一年，已经有很多起舆情事件，最后都由AI背了“锅”。

预计2025年，还会见到更多的AI造假事件，引发信任危机和法律挑战。

图由即梦AI生成，提示词：新闻，媒体，标题“后真相时代”。

在后真相时代（Post-Truth），不能指望每一位AI使用者，都会生成良善、美好、负责任的AIGC，势必会有一小部分人使用AI来作恶。这需要用户、企业和政府三方合力来解决这个问题。

对于用户，需要明晰安全与法律的边界；对于企业，需要做好AI对齐和应用管理；对于政府，需要通过立法加强监管，例如实施C2PA元数据标记，出台《人工智能法》等。

这个过程，考验我们的治理水平，一方面要加强监管，另一方面又要鼓励创新，避免重蹈欧洲覆辙——在立法上遥遥领先，导致欧洲无论是新能源还是人工智能，都落后于中美。

8、AI视频专业化

12月，AI视频赛道是忙碌的。月初，腾讯混元推出文生视频并开源，初代模型表现非常亮眼；月中，谷歌上线Veo 2视频模型，将Sora风头占尽；月底，可灵推出1.6模型，从1.5到1.6尽管只有0.1的差距，但带来的变化却是巨大的。

这一年，无论是国外的Runway还是国内的可灵、海螺、即梦，每一家的迭代速度都非常之快，常以周为单位进行更新。生成的视频质量也从最初的抽象、离谱变成了如今的专业、影像级，与现实无几。

更多的广告主、导演以及创作者，开始使用AI来制作专业级视频。当然，这里面翻车的也有不少，比如可口可乐2024圣诞宣传片、成龙电影《传说》等，因表情生硬、细节缺失被观众破口大骂。

这是AI视频必须要攻破的难题，也是每位使用者需要恶补的知识。随着AI视频技术的进化以及使用者的强化，预计2025年我们将看到更多AI生成的专业级视频。

AI视频，不是玩具，而是工具。

9、AI搜索快速扩张

这一年，诞生了太多的原生AI搜索产品；同时，传统的搜索引擎也在不断推陈出新；另一边，大模型厂商也对搜索市场蠢蠢欲动。搜索市场，从没像现在这么热闹过。

外有Perplexity、SearchGPT、Genspark、New Bing、Felo等新旧势力轮番登场，以及谷歌一直想做好但就是做不好的AI Overview。内有秘塔、天工、夸克、360、百小应、知乎以及若干垂直领域的AI搜索产品，异军突起。

预计2025年，AI搜索将迎来快速扩张，甚至不乏杀手级应用的出现。比如Perplexity（2022.8成立），最新月活已经来到了1500万。

传统搜索引擎，危也！

10、AI公司已经结束，AI应用刚刚开始

「现在自称AI公司，就像自称互联网公司一样空洞。因为它已经无处不在：每家公司都在使用互联网，未来每家公司也都会使用AI。」Runway创始人Cristóbal Valenzuela今年说过这样一句话。

现在，AI早已像电、互联网一样成为了我们的基础设施。他认为，AI只是一种机制，是支撑宏大愿景的基础设施。真正的革命不在技术本身，而在于它所开启的全新可能：全新的表达形式、讲述故事的新方法、连接人类体验的新途径。

图由即梦AI生成，提示词：办公桌上的电脑屏幕里有个穿中学校服的美女，美女从屏幕里伸出手来拿桌上的粉色耳机，调皮可爱的笑脸，温馨浪漫的场景，治愈的画面，现代化的办公环境，精致的办公桌。

AI公司已经结束，AI应用刚刚开始。如果你现在计划打造一家纯粹的AI公司，多半徒劳无功，难以撼动已有的这几家（不管是六小龙还是四小虎）。

下一波创新浪潮不是来自专注于打造更好模型的公司，而是来自那些懂得如何运用这些AI工具来创造新媒体形式、新体验类型、新叙事方式的人们。

现在，是AI创作最好的时代。

（文：沃垠AI）

2025 年 7 月
一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

发表评论 取消回复

发表评论取消回复