2024 年,人工智能领域迎来了新一轮的爆发。OpenAI、Anthropic 和 Databricks等巨头继续攀登新高峰,而 Sierra、Cursor、Read AI 等新兴 AI 初创企业也逐渐崭露头角。虽然偶有失望(比如 Rabbit R1),但整体来看,AI 领域的创新步伐仍在加速前进。
那么,2025 年 AI 会带来哪些新变化?在这个几乎所有公司都宣称自己“AI 驱动”的时代,分辨什么是“真正的”AI 变得越来越难。然而,这不会阻止我们根据数据和直觉做出预测。以下五个关键趋势预计将在 2025 年对 AI 产生重大影响。
一、训练范式从“预训练”转向“后训练”
过去几年,AI 模型的进步主要依赖于预训练阶段的数据量。模型在预训练阶段摄取的数据越多,性能通常就越好。例如,GPT-3.5 采用了 1750 亿个参数,而 GPT-4 可能超过了 1 万亿个参数,这显著提升了模型的上下文理解和响应能力。然而,随着互联网数据逐渐接近上限,我们正进入“后训练”(Post-Training)时代。2025 年,AI 训练将从“大量数据堆砌”转向“更智能的优化策略”。
在 2024 年的 NeurIPS 大会上,Ilya Sutskever 提出:
这一观点表明,AI 发展正在从依赖大规模数据预训练,转向如何在已有数据的基础上提升模型智能和效率。
后训练时代的几个关键趋势包括:
-
监督微调(Supervised Finetuning):利用标注数据对模型进行优化,提高学习效率和准确度。
-
两阶段后训练(Two-Phase Post-Training):如 Qwen 2.5 采用的策略,先进行监督微调,再进行进一步优化。
-
长上下文训练(Long-Context Training):增强模型对长文本的处理能力,提高上下文理解力。
-
直接偏好优化(Direct Preference Optimization):利用二元交叉熵目标(binary cross-entropy objective),让模型更贴近用户需求,而无需额外构建奖励模型。
二、测试时计算(Test-Time Compute)成为新范式
AI 领域的一个新兴趋势是“测试时计算”(Test-Time Compute)。这种方法在推理阶段(即模型执行任务时)增加计算能力,以提升模型性能。与过去的“单次推理”不同,测试时计算允许模型生成多个答案,进行系统性评估,并选择最佳结果。测试时计算让 AI 能够“思考得更久”,从而提升智能水平。这一策略有望改变 AI 的交互模式,并推动针对推理优化的硬件(如专用 AI 芯片)发展。
测试时计算的主要实现方式包括:
-
自优化(Self-Refinement):模型不断迭代优化输出,识别并纠正错误。
-
验证器搜索(Search Against a Verifier):生成多个候选答案,并通过验证系统筛选最优结果。
潜在影响:
-
数学、金融、工程领域的突破:AI 过去在这些领域表现较弱,主要因为难以进行多步骤推理和验证。未来,AI 在数学解题、欺诈检测、高级数据分析等方面可能迎来突破。
-
医疗、科研领域的进展:AI 可用于药物研发、临床试验和科学研究,例如优化分子设计、模拟实验过程等。
-
多模态推理增强:AI 可以像人类一样进行逻辑推理,将复杂问题拆解为多个步骤,并整合跨模态信息(文本、图像、数值等)。
三、AI 计算的重点从训练转向推理
2025 年,AI 计算的重点将从模型训练转向推理。随着 AI 推理能力的增强,对专门优化推理的 AI 芯片需求将大幅上升。
目前,NVIDIA 凭借 H100 和 A100 GPU 在 AI 训练市场占据主导地位。然而,推理芯片更侧重于高效执行预训练模型,以便在实际应用中实时做出决策。相比训练芯片,推理芯片需要在计算能力与能耗之间取得平衡,以适应智能手机、物联网等设备。
虽然 NVIDIA 仍将保持市场主导地位,但推理芯片领域可能迎来更多挑战者。2025 年值得关注的推理芯片公司包括:
-
Cerebras:专注于 AI 计算加速。
-
Groq:开发高效推理芯片。
-
SambaNova:提供 AI 推理优化硬件。
四、AI 代理(Agents)真正落地
2024 年,许多公司探索了 AI 代理(Agent)的概念,但大多数仍停留在试验阶段。2025 年,随着基础设施的成熟,AI 代理有望真正投入使用,特别是在企业内部应用场景中。
主要类别:
-
消费级代理:改进 UI/UX,例如语音助手、个性化推荐(旅行预订、健身计划等)。
-
通用代理:支持跨行业任务,如文档处理、信息提取、自动化执行等。
-
行业专用代理:专注于医疗、法律、金融等特定领域。
关键技术突破:
-
更先进的推理能力,使代理能够进行计划、优先级排序和自我验证。
-
统一的 API 编排框架,使代理能与多种数据源集成。
-
更强的安全性,如基于角色的访问控制和零信任模型。
五、早期 GenAI 公司的整合与新商业模式
2022-2023 年,大量 GenAI 初创公司涌现,其中许多公司只是“GPT套壳”,靠炫酷的演示吸引投资。然而,随着融资环境收紧,这些公司面临退出压力,2025 年可能迎来一波收购潮。同时,GenAI 领域将从“概念炒作”走向“真正的商业化应用”。
两种主要的收购模式:
-
技术和人才收购(Acquihires):OpenAI、Anthropic 等 AI 巨头将通过收购吸纳优秀人才,向最优秀的 AI 人才支付数百万美元的薪酬。
-
GenAI+ 业务增强(Gen-Enhanced):即将 IPO 的公司可能收购 AI 初创企业,以增强 AI 叙事,提高市场吸引力。
新商业模式探索:
-
基于结果的定价:按照 AI 交付的实际成果收费(如 Sierra 公司的实验)。
-
“服务即软件”模式:AI 结合人类专业知识,优化业务流程,例如软件开发、客户支持、IT 安全等。
六、全文总结
2025 年,AI 领域将迎来新的变革。从训练转向推理、从预训练转向后训练、AI 代理的崛起、推理芯片市场竞争加剧,以及商业模式的创新,都会对行业产生深远影响。虽然我们距离通用人工智能(AGI)仍有一定距离,但 AI 的进步速度令人惊叹。
此外,2025 年可能在开源模型、小型语言模型、边缘计算和量子计算等方面迎来突破。监管与合规方面的讨论也将成为焦点,以确保技术发展与社会责任并行。
2025,AI 世界会更加智能、高效和实际应用化,让我们拭目以待!
硅谷科技评论(SVTR.AI),在ChatGPT问世之际,创立于美国硅谷,依托#AI创投库、#AI创投会、#AI创投营 和风险投资,打造全球前沿科技(AI)创新生态系统。联系凯瑞(pkcapital2023),加入我们,共创未来。点击文末阅读原文,访问SVTR.AI,发现更多机会与内容!
Startup
+
11x.ai:AI虚拟销售员,半年内突破200万美元 |
AlphaSense,金融界的“谷歌” |
AMP Robotics,如何用AI拯救垃圾场? |
Anduril Industries:AI 重新定义现代战争与和平 |
Anthropic:OpenAI”宫斗”背后的公司 |
Bardeen:让AI代理更稳更快 |
Brightwave,AI驱动的投研助手 |
Calendly:日程安排助手,AI效率工具鼻祖 |
Canva:从Adobe、Figma、Canva 到 OpenAI |
Carta:想要取代纽交所的股权管理工具 |
Cerebras,打造世界最大芯片挑战AI霸主英伟达 |
Cohere:为企业提供大模型 |
Consensus:用AI解锁学术 |
CoreWeave:GPU租赁独角兽,英伟达的好盟友 |
Databricks:从数据湖到大模型丨人工智能战略 |
DeepL:从机器翻译到AI写作的语言沟通利器 |
Discord:腾讯多次押注,打造属于你自己的线上互动社区 |
DoNotPay:世界首款AI机器人律师 |
Duolingo:如何改写语言学习 |
E2B:为 AI 代理构建自动化云平台 |
Figma:从Adobe、Figma、Canva 到 OpenAI |
Figure,从体力劳动中解放全人类 |
Glean:重塑知识工作的未来 |
Grammarly:从论文查重到AI写作的沟通利器 |
Helion,AI的终极能源梦想 |
Hippocratic AI,用AI缓解全球医护人员短缺 |
Hugging Face:开源AI的未来 |
Jenni AI:如何通过AI写作实现年入千万 |
Letta:AI代理技术栈市场地图 |
Marblism:一句AI提示词自动生成各类软件 |
Midjourney:0融资,11人,$1亿收入 |
Mistral,欧洲大模型,性价比之王 |
MultiOn,用人工智能代理给软件装上大脑 |
Neuralink:让失明者重见光明,让瘫患者再次行走,让人类与AI融合永生 |
OpenAI:人工智能突破的前沿丨员工丨董事会丨营销丨GPT Store丨奥特曼丨马斯克丨微软丨产品生态 |
Pika:AI视频的未来 |
Rad AI:如何用 AI 改变医疗保健 |
Reddit:奥特曼押注基于兴趣社交的美版“贴吧” |
Replicate:1人AI公司背后的幕后英雄 |
Replite:教马斯克的儿子如何写代码 |
Rows:一年内用户增长20倍背后的故事 |
Perplexity:挑战谷歌,站在AI搜索最前沿 |
Runway:AI视频的未来 |
Scale AI:如何成为数字世界的“水源” |
Shein:打造下一个“中国首富” |
Skild AI,打造通用机器人“大脑 |
SpaceX:梦想照进现实,人类星际生命的曙光 |
Stability AI:SD 背后的公司和创始人 |
Stripe:马斯克和奥特曼押注的支付王者 |
Substack:美版公众号,为价值付费 |
Superhuman:邮件超人,拥抱 AI |
Telegram,俄罗斯兄弟的密聊纸飞机 |
Vannevar Labs:AI+国防,军事人工智能掘金者 |
Vercel,如何用AI引领技术开发? |
Zapier:ChatGPT最受欢迎插件的过去和未来 |
People(找人) |
如何找到创业合伙人丨如何聘请CEO丨如何确定CEO的薪水丨如何分配股权和头衔丨如何组建和召开董事会丨选择自己的创业导师 丨找这种人实现快速裂变丨如何找到那个“改变命运”的第一位员工? |
Funding(找钱) |
如何写商业计划书丨初创公司估值丨如何做电梯演讲丨如何确认真实投资意愿丨如何选择VC丨早期融资的“科学”与策略丨初创公司的融资生存法则丨风险投资人最关心的一个指标丨“七条法则”让投资人主动“敲门” |
Vision(找方向) |
性格决定创业成败丨如何成为亿万富翁丨如何做出困难的决定丨如何寻找创业方向丨如何在海外启动新产品丨GTM指南丨不要像投资人那样思考丨创始人与市场契合度丨为什么初创公司会失败丨什么决定创业成败丨如何建立社交媒体形象丨PMF决定初创的未来丨创始人的必读书单丨 5 点创业洞见丨如何做增长 |
AI创业 |
如何打造AI驱动的公司丨AI创业如何选赛道丨如何打造AI软件产品丨AI公司要不要融资丨AI初创公司商业模式丨AI原生公司定价策略丨AI初创公司增长策略丨2B还是2C |
Venture
+
A16Z:全球AI产品Top100丨人工智能到底能做什么丨AI将会拯救世界 |
Air Street Capital:State of AI(2024) |
Alphabet谷歌战投:全球最牛AI战投是如何炼成的丨人工智能战略 |
Altimeter:谁是AI C端赢家 |
Amazon:人工智能战略 |
Apple:产品收入变迁丨 AI 并购之王 |
Battery Ventures:AI正推动云计算的下一波增长丨AI正带来 4 万亿美元市场机会 |
Bessemer Venture Partners:Cloud 100(2024)丨如何打造AI核心竞争力 |
Bond:AI将改变教育和教学方法 |
Coatue:AI革命丨AI是超级周期的开始 |
Cowboy:AI大势所趋 |
Daniel Gross:硅谷90后AI投资人 |
Dawn Capital:如何通过人工智能增强人脉 |
Elad Gil:关于人工智能我所不知道的事情 |
Emergence:生成式 AI 六大最新趋势 |
FirstMark:MAD 24问,AI 2023年总结,2024年展望 |
Forerunner:超个性化和动态交互才是未来 |
Foundation Capital:服务即软件的万亿机会 |
Founders Fund:如何投出下一个独角兽丨彼得·泰尔丨泰尔研究员 |
General Catalyst:AI+医疗支持者 |
ICONIQ:小扎的朋友圈丨AI成为大企业战略核心 |
Insight Partners:AI应用将如何实现人机协同丨AI Agent正在颠覆自动化 |
Lightspeed:AI+法律市场机会地图 |
M12(微软):如何抢占AI投资制高点丨收入拆解 |
Menlo Ventures:2024企业Gen AI现状报告丨AI代理全面崛起丨Gen AI 应用拐点已到丨AI+安全市场地图丨企业AI架构的设计原则 |
NVIDIA:收入丨AI投资策略 |
Sam Altman(山姆·奥特曼):如何做早期投资丨地产生意丨投资帝国丨婚礼丨阅读清单 |
Sapphire:AI原生应用丨AI进入调整期丨AI 行研 丨 销售人工智能如何重塑 GTM |
Scale Venture Partners:如何用AI工具解决硬件难题? |
Sequoia(红杉资本):如何做投资丨代理型AI应用崛起丨生成式AI进入第二阶段 |
Sierra Ventures:垂直场景将是最大的创业机会 |
SOSV: 从草根到帝国 |
TRAC:风投界的水晶球 |
Thrive Capital:高位接盘OpenAI |
Union Square Ventures(USV) |
Wing Venture Capital:2024年企业科技 30 强(ET 30) |
YC:全球排名第一的AI投资机构丨给年轻创始人建议丨如何独立思考丨YC与A16Z的押注有何异同 |
20VC:从播客主持人到风投大佬 |
LP |
精品基金/超级基金丨AI驱动VC丨通才/专才风投人丨VC/PE丨孵化器丨加速器丨初创工作室丨如何发掘下一个伟大的投资人 |
GP |
如何及早识别独角兽丨如何避免7大投资陷阱丨合伙人是怎么炼成的丨Souring的艺术丨颜值如何影响VC决策丨如何快速解读对方性格丨硅谷投资人的武器库丨如何用数据控制初创公司团队风险丨什么决定创业成败 |
AI投资 |
如何评估AI初创公司丨海外投资人谈AI新趋势丨应该关注哪些AI公司丨AI 创投七大新趋势丨全球AI创投生态丨全球AI投资机构Top10 |
Technology
+
AI工程师有多强?3天上线全球首个AI数库 |
“AI张雪峰”诞生,北大团队用 AI 重塑教育咨询 |
1人团队,百万营收的AI套壳 |
2024 年必读人工智能书单 |
加密信条:数字货币的前世、今生和未来 |
内容创作指南,如何通过写作赚钱? |
传统公司如何抓住AI浪潮? |
全球七大科技巨头的 4000 亿美元 AI 战略布局 |
全球 Gen AI 独角兽大盘点,中国4家大模型上榜 |
AI大模型:海外 | 数学 | 性价比 | 编程 | 医疗 | 评估 | 训练成本 | 小模型 |
AI 创始人 | 华裔创始人 | 北美科技人才中心地图丨职业经历丨教育背景丨斯坦福丨普林斯顿丨多伦多大学 |
AI 公司地理和行业分布 | 以色列 | 德国 | 旧金山湾区 | 欧洲丨法国 |
福布斯AI 50 | 斯坦福AI指数 | 企业科技AI 30 | 高增长AI 50 | C端AI 50 | 工具AI 50 | SVTR AI 100 | 自力更生AI 25丨2024年全球最具价值独角兽丨Gen AI专利公司 Top20丨开源 AI 初创公司 Top 75丨开源 AI 开发者工具 Top 20丨全球数据中心按功耗排名 Top 50 |
AI代理:创始人该如何站上3000亿美元的风口? |
AI+国防安防:如何重新定义现代战场的核心竞争力 |
AI+人力资源:用科技重塑就业与招聘的未来 |
AI+搜索:全球新锐公司谁能杀出重围? |
AI+社交:该怎么玩? |
AI+编程:公司排行榜丨市场地图丨AI工程师丨SaaS的新曙光 |
AI+金融:如何缔造下一个金融科技传奇丨大模型在金融投资领域的应用丨AI将如何改变会计 |
AI+游戏:市场研究报告丨初创公司Top 10 |
AI+机器人 |
AI+医疗:市场地图丨心理/精神公司 |
AI+教育:市场地图 |
AI+客服:市场地图 |
AI+法律:市场地图 |
AI+视频:市场地图丨3D视频 |
AI+生产力工具市场地图 |
AI+科研 |
Review
+
001 | 002 | 003 | 004 | 005 | 006 | 007 | 008 | 009 | 010 |
011 | 012 | 013 | 014 | 015 | 016 | 017 | 018 | 019 | 020 |
021 | 022 | 023 | 024 | 025 | 026 | 027 | 028 | 029 | 030 |
031 | 032 | 033 | 034 | 035 | 036 | 037 | 038 | 039 | 040 |
041 | 042 | 043 | 044 | 045 | 046 | 047 | 048 |
049 |
050 |
051 | 052 |
053 |
054 |
055 |
056 |
057 |
058 |
059 |
060 |
061 |
062 |
063 |
064 |
065 | 066 |
067 |
068 | 069 | 070 |
071 | 072 | 073 | 074 | 075 | 076 | 077 | 078 | 079 | 080 |
081 | 082 | 083 | 084 | 085 | 086 | 087 | 088 | 089 | 090 |
(文:硅谷科技评论)