「过去、现在和未来的区别,只不过是一种顽固而持久的幻觉。」
爱因斯坦,1955
这一年,我们见证了无数次“AI一天,人间一年”的Magic Moment(神奇时刻),目睹了AI给各行各业带来的颠覆性变革与前所未有的挑战 。我们亲身体验了形形色色的AI产品,切身感受到AI对工作、生活和学习的提效速度。与此同时,我们也欣喜地看到,更多China AI在全球舞台上崭露头角,大放异彩。
Artificial Intelligence(人工智能,简称AI),就这样从儿时的影像作品中跃出屏幕,走入了我们的寻常生活。
不是我们需要AI,而是AI已经成为了我们不可或缺的基础设施。就像鱼儿离不开水,人类离不开空气一样。AI,不仅定义了我们的现在,也将继续在未来路上不断进化。
站在这样一个时代浪尖,我想跟大家聊聊我对2025年AI的思考,以及我的研判。
我最近开始理解到,未来的智能体可能跟现在的智能体完全不一样,不管是定义还是形式,可能都不太一样。
现在的智能体,依托大模型自身平台或第三方LLM应用开发平台(如扣子、腾讯元器)创建的Agent,我理解为更多是智能工具,他们是在某一个功能性上为用户提供智能服务,以软件形式为主。使用方式,离不开手机或电脑,甚至还被困在一个浏览器里。
未来的智能体,我理解为更会像是贾维斯那样个性化、智能化以及多模态感知的超级智能助手,甚至是智能实体。它不只是软件工具,而是我们人类的伙伴,是可以在生活、工作、娱乐、学习等多场景中帮助我们的智能伙伴。
最近,Sam Altman提出AGI层级框架理论:一级指有语言能力的AI;二级拥有人类水准的问题求解能力、推理能力;三级能够使用工具,系统执行;四级AI能够自己发明创新;五级AI可以融入组织或自建组织。
他认为目前AI已经从第一级“聊天机器人”发展到了第二级“推理器”,比如擅长推理的o1模型,可以执行高难度的Python任务;而第三极能够使用工具的“智能体”,将加快智能系统的进化速度,在自主性和决策能力方面带来重大提升,这有望在2025年得以见证。
其实,在2024Q4里,我们已经见到了智能体的雏形。10月23日,Claude 3.5 Sonnet推出Computer Use功能;10月24日,智谱AI推出Phone use产品AutoGLM;11月8日,搭载YOYO智能体的荣耀Magic手机正式上市。
我觉得这样的智能体才是未来的智能体,才是真正的智能体。2025年,我们一定会见到越来越多类似智能体的出现。
2024年,李飞飞不只一次提到“AI发展下一步是空间智能”,并亲自下场开了家公司World Labs,来研究空间智能。12月,他们发布了第一款「空间智能」模型。只需要一张图,即可生成一个逼真的3D世界。
体验地址:https://www.worldlabs.ai/blog
空间智能,同Attention机制、DiT架构一样,是AI向前发展必须要去突破的基础技术,也被称作世界模型。简单来说就是,世界模型能够直接观察现实,并从现实中得出常识,然后基于常识展开预测和行动。有了世界模型,计算机就知道如何在真实的三维世界中行走了。
这一步突破,将是AI技术的重大飞跃。人工智能产业,也将由软件智能走向硬件智能,背后的市场空间远比现在的生产力赛道更大、更广。

畅想未来的人机协作时代,到处都是智能机器(如机器人、AI管家等)与人类交互,不论真实、虚拟的三维世界,这一切都遵循着物理规则,我们同住地球村。
目前,研究世界模型的团队有:World Labs(李飞飞团队)、DeepMind、阿里、智源。相对于LLM来说,真的很少,需要更多资源、企业和市场的跟进。希望,2025年能有新的突破。
CoT思维链(Chain of Thought),step by step一步一步思考,原本只是Prompt里的一个小技巧。没承想,却由o1模型把它发扬光大。

图由即梦AI生成,提示词:逻辑,推理,深度思考,标题“CoT”。
今年下半年,行业对Scaling Law(规模定律)有争议,Ilya Sutskever更是直言“预训练时代即将终结(原话Pre-training as we know it will end)”。
顶尖AI公司如OpenAI、Anthropic,在推出ChatGPT 4.0 Turbo、Claude 3.5后的相当长一段时间里都没有发布新模型。数据枯竭、算力昂贵、效果下降……难道Scaling Law“撞墙”了?类似反思频繁出现在AI行业内部。
随后,OpenAI带着具有CoT思维链的o1模型王者归来,其表现出的优秀演绎能力、数学计算和推理能力,为行业再次指明了方向——模型就得上Cot思维链、Self-play RL强化学习,上“慢思考”,要像人一样深入思考,逐步推导。
国内AI,kimi、Qwen、天工、DeepSeek、360、InternThinker等都陆续推出了类o1模型。预计2025年,Cot、Self-play RL将成为大模型的标配技术。
通用模型,看起来全知全能,但要真正适用到各行业,通常需要搭配提示词和行业数据使用。其最好的实现形式就是Agent,定制Agent。

图自特工宇宙
今年,已经有很多行业的先行者开始用上了Agent,比如在智能客服、文案生成器、学习助手、信息检索、数据分析、文件处理、图像音视频处理、自动化流程管理等场景。
但总使用人数还比较少,以国内Top级别的Agent开发平台扣子为例,也才刚刚过了100万月活的关口。预计2025年,Agent开发者和应用将会越来越多。
Agent,现已从单Agent,发展到了多Agent协作的新范式。LLM与知识库、workflows(工作流)、RPA(机器人流程自动化)协作,能令Agent收到意想不到的效果,比通用模型更好的效果。业内共识,2025年将是Agent大年。
对于互联网公司来说,收费无非3种:(1)向C端用户收费,比如爱优腾芒,他们以会员制为主;(2)向B、G端收费,比如360安全、微软,他们向C端提供免费产品,然后向B、G端收费;(3)向C端提供免费产品,按流量收广告费,比如字节、百度、谷歌。
目前的AI公司也跳不出这个逻辑,B端就是收API费,C端收会员费,收广告费?目前还没有,AI主打的宣传点就是“没有广告”,短时间内应该还不会屠龙少年变恶龙吧
。
截至目前,收费AI大体上分为这几类:

(1)刚性需求的产品,比如AIPPT、绘图、视频、数字人等,对职场人提效明显,用户愿意付费。
(2)先期产品,如ChatGPT、文心一言,分别代表了国外和国内最早的大模型,有先发优势,最早开启收费。不过,GPT4.0发布一年后,ERNIE才推出4.0(收费)。而现在,GPT早就不用4.0了,而是4o、o1、o3……以及各种mini版、满血版、Pro版。
(3)顶尖产品,如Claude 3.5 Sonnet、Perplexity、Coze,他们在各自领域属于碾压级的存在,所以都开启了收费。
(4)情感陪护产品,如Talkie、Character.AI等,主打感情牌,用户的付费能力和频率一直都比较高。
(5)一些有意思的收费模式,比如智谱清言,它将视频通话、视频生成、AIPPT、AI绘画、AI音效等功能都集合在一块,然后推出大会员体系,不限使用次数。以及Kimi,早期因为算力紧张,推出过打赏服务,氪金可享受算力优先使用权。
预计,随着2025年AI产品市占率的不断提升,将会有越来越多的AI推出收费模式,甚至普遍开启收费。不过,各家在收费模式上还需要推陈出新,得有创新的玩法和过硬的产品。
所谓“AI味”,陈财猫认为“大体是指那些爱用概括性描述、缺乏侧面描写、生硬叙述、死板结构和过度道德正确的AI文风。”
这种文风,最早来源于ChatGPT。OpenAI在做数据标注时,写了不少首先、其次、然后、最后之类的文本,被加入了训练集,然后加上自身又有对齐(即道德正确)的要求,这就导致了AI生成的文字过于一板一眼,一股子废话文学,AI味严重。
现在,随着模型的进步,顶尖模型(如4o、Claude3.5、gemini)的AI味已基本消除。预计,明年国内AI也将陆续消除“AI味”。
AI越来越方便,与此同时造假也就越来越便捷,比如P图、视频合成、声音克隆甚至人脸合成,以及AI自带的幻觉问题、对齐问题。这一年,已经有很多起舆情事件,最后都由AI背了“锅”。
预计2025年,还会见到更多的AI造假事件,引发信任危机和法律挑战。

图由即梦AI生成,提示词:新闻,媒体,标题“后真相时代”。
在后真相时代(Post-Truth),不能指望每一位AI使用者,都会生成良善、美好、负责任的AIGC,势必会有一小部分人使用AI来作恶。这需要用户、企业和政府三方合力来解决这个问题。
对于用户,需要明晰安全与法律的边界;对于企业,需要做好AI对齐和应用管理;对于政府,需要通过立法加强监管,例如实施C2PA元数据标记,出台《人工智能法》等。
这个过程,考验我们的治理水平,一方面要加强监管,另一方面又要鼓励创新,避免重蹈欧洲覆辙——在立法上遥遥领先,导致欧洲无论是新能源还是人工智能,都落后于中美。
12月,AI视频赛道是忙碌的。月初,腾讯混元推出文生视频并开源,初代模型表现非常亮眼;月中,谷歌上线Veo 2视频模型,将Sora风头占尽;月底,可灵推出1.6模型,从1.5到1.6尽管只有0.1的差距,但带来的变化却是巨大的。

这一年,无论是国外的Runway还是国内的可灵、海螺、即梦,每一家的迭代速度都非常之快,常以周为单位进行更新。生成的视频质量也从最初的抽象、离谱变成了如今的专业、影像级,与现实无几。
更多的广告主、导演以及创作者,开始使用AI来制作专业级视频。当然,这里面翻车的也有不少,比如可口可乐2024圣诞宣传片、成龙电影《传说》等,因表情生硬、细节缺失被观众破口大骂。
这是AI视频必须要攻破的难题,也是每位使用者需要恶补的知识。随着AI视频技术的进化以及使用者的强化,预计2025年我们将看到更多AI生成的专业级视频。
这一年,诞生了太多的原生AI搜索产品;同时,传统的搜索引擎也在不断推陈出新;另一边,大模型厂商也对搜索市场蠢蠢欲动。搜索市场,从没像现在这么热闹过。

外有Perplexity、SearchGPT、Genspark、New Bing、Felo等新旧势力轮番登场,以及谷歌一直想做好但就是做不好的AI Overview。内有秘塔、天工、夸克、360、百小应、知乎以及若干垂直领域的AI搜索产品,异军突起。
预计2025年,AI搜索将迎来快速扩张,甚至不乏杀手级应用的出现。比如Perplexity(2022.8成立),最新月活已经来到了1500万。
「现在自称AI公司,就像自称互联网公司一样空洞。因为它已经无处不在:每家公司都在使用互联网,未来每家公司也都会使用AI。」Runway创始人Cristóbal Valenzuela今年说过这样一句话。
现在,AI早已像电、互联网一样成为了我们的基础设施。他认为,AI只是一种机制,是支撑宏大愿景的基础设施。真正的革命不在技术本身,而在于它所开启的全新可能:全新的表达形式、讲述故事的新方法、连接人类体验的新途径。

图由即梦AI生成,提示词:办公桌上的电脑屏幕里有个穿中学校服的美女,美女从屏幕里伸出手来拿桌上的粉色耳机,调皮可爱的笑脸,温馨浪漫的场景,治愈的画面,现代化的办公环境,精致的办公桌 。
AI公司已经结束,AI应用刚刚开始。如果你现在计划打造一家纯粹的AI公司,多半徒劳无功,难以撼动已有的这几家(不管是六小龙还是四小虎)。
下一波创新浪潮不是来自专注于打造更好模型的公司,而是来自那些懂得如何运用这些AI工具来创造新媒体形式、新体验类型、新叙事方式的人们。
(文:沃垠AI)