从《流浪地球》中MOSS的科幻震撼,到为母亲开发智能评语生成器——16岁的陈君航用自己的AI成长路径,诠释了一个朴素真理:“技术真正的魅力,不是惊艳谁,而是真正解决问题的那一刻。”这也正是百度文心大模型的技术初心。
为什么16岁的高中生使用AI创造的故事能引发众人关注?答案就藏在他的成长轨迹里:从2023年4月收到文心一言内测邀请时手指颤抖地点击链接,到用代码帮助母亲将三天的评语撰写工作压缩到几小时,陈君航完成了从AI体验者到AI开发者的蜕变。
这正是百度希望传递的:当AI技术足够务实、足够贴近真实需求时,每个人能成为技术创新的推动者。陈君航登台的意义并非源于天选设定,而在于他代表了千千万万个普通人都能从AI中受益的可能性。
“那个曾经觉得「AI没啥用」的人,现在成了我生活里最「卷」的AI用户,”陈君航对母亲对AI态度转变的描述,揭示了一个更深层的问题:什么样的技术才能真正走进千家万户?走进每个普通人的生活?
5月20日,在百度AI Day活动上,百度集团副总裁吴甜分享了文心大模型最新技术进展。现场,我们感受到文心4.5系列在多模态、深度思考、智能体等技术方向上的持续演进。Datawhale作为受邀代表,深度参与了这场活动,并在会后对百度集团副总裁吴甜进行了专访。通过这次深入交流,我们对“16岁高中生用AI创造了什么?”有了更清晰的答案。
答案就藏在百度文心大模型的技术选择中。要让AI真正解决现实问题,需要的是多方位的综合优化,技术上要突破多模态、深度思考等深层次的难题。只有当技术基座足够扎实,才能承载起陈君航们的应用创新,让普通人真正从AI中受益。
文心4.5和文心4.5 Turbo都是多模态大模型,百度采用了多模态上异构专家建模的方法。现实世界中,文字、图像、视频各有其独特的信息密度和表达方式,简单的统一处理往往会丢失重要细节。“不同的模态在建模的细节上是不一样的,异构专家建模可以充分照顾到不同模态的特点。”这种尊重差异的技术思路,让文心4.5 Turbo的学习效率提高近2倍,多模态理解效果提升超过30%。
在后训练环节,百度建设自反馈增强技术框架,形成训练、生成、评估、增强的闭环:模型训练完之后,可以去生成结果,对它进行评估,再根据评估的结果进一步增强。
多元统一的奖励机制则解决了AI判断标准过于简化的问题。人类对一件事的评价,从来不是单一维度的对错判断。百度构建的评价体系涵盖答案准确性、执行反馈、思想深度、指令遵循、工具调用合理性等多个方面,让模型学会像人一样进行多角度考量。基于偏好学习的强化学习算法运用,让模型输出的结果更符合人的需求。
百度还进行了深度思考模型的训练。在深度思考模型训练当中,参考人的思维方式,对模型思考的过程进行设计。思考链和行为链是有非常多种不同的路径的,通过强化学习,让模型在不同的任务上逐渐地摸索和探索出相应的思维链和行动链,同时结合多元统一的奖励机制,让模型在解决真实的长程、复杂性的任务上有更好的表现。
针对稀缺数据问题,百度研制了“原理驱动、过程评估与结果校验的数据合成技术”和“知识点驱动的大规模稀缺数据挖掘技术”。通过完整的知识体系,“识别出数据分布中哪些地方欠缺,然后针对性地进行挖掘和补充。”
这种基于第一性原理的数据建设方法,确保数据能够“反映出事物的本质”,为模型训练源源不断地生产“知识密度高、数据多样、领域覆盖广的大规模数据”,这也是基础模型能实现底层突破的重要基础之一。
在这些技术选择背后有一个共同的价值导向:让AI具备自主学习和思考的能力,而不是简单的指令执行。正如吴甜在分享中所说:“如果只是依靠人去告诉AI该怎么做、不该怎么做,这种方式永远无法激发出AI真正的潜力。相比之下,如果告诉AI这样做是好的,那样做是不好的,让它自己去探索,它能通过大量计算找到更优的路径。”
二、智能体:
重新定义技术与人的关系
底层技术的突破为AI普及奠定了基础,但如何让这些先进能力真正为普通人所用?智能体成为连接技术与应用的关键桥梁。
在专访中,吴甜分享了百度对智能体的深度思考。她表示,百度对智能体的理解源于对人类思维的深刻洞察。“智能体我们开展的时间还是比较早的,23年10月,我们就提出了系统1、系统2的理念,类似于人的思考,系统1是一个直觉系统,直接出答案;系统2是理性系统,在做规划和思考、反馈、进化等一些工作。”
这种技术架构带来了AI研发范式的改变。“智能体是基础模型上的复合AI系统,是很重要的发展方向。未来真正在应用当中解决大量问题会以智能体为主。”而智能体与基础模型形成了能力共生关系,“当基础模型能力提升时,智能体的水平自然而然就会上升。”
最令人兴奋的突破在于模型自主能力的实现。百度的代码智能体“充分利用了思考和行动的能力,通过模型的思考,可以把用户用自然语言表达出来的需求,生成代码,自主地进行代码的执行,调试执行结果。基于代码智能体,用户不用写一行代码就可以做到自己想做的事情。
对于专业开发者,智能代码助手提供了更实际的协作方案。百度的智能代码助手,利用了大模型和智能体的能力,为程序员、开发者提供帮助。目前百度新增代码的生成比例也超过了40%,已经服务760多万的开发者。
在智能体的发展路径上,百度采取了通用与专精结合的策略。基础模型往通用的方向发展,解决尽可能多和有深度的通用问题,夯实模型的基本智能水平。真正到行业、到应用当中,在智能体这一层会面向场景和一些垂直的行业,开展专精的工作。
智能体的真正价值在于重新定义了技术与人的关系。越来越多的用户不仅从AI中受益,更通过各自的创新实践为技术进步提供丰富的应用场景和数据反馈。但这种个体突破如何放大为群体效应?如何让技术创新从少数人的行为变为社会现象?答案在于构建一个让创新自然生长的开放生态。
智能体降低了AI使用门槛,让更多普通人有机会成为技术创新的参与者。但一个更深层的问题是:当创新从个体行为变为群体现象时,如何让这种创新力量持续放大?
2185万开发者、67万企业、110万模型——这些数字背后是无数个开发者的成长故事。当我们问及开发者生态对大模型技术演进的作用时,吴甜有着清醒的认识:“人工智能生态的意义和价值是非常大的。通过生态建设,百度AI技术平台把框架、模型等技术能力与各行各业连接起来了。”
这种连接的价值远超技术本身。每个开发者在解决自己问题的过程中,都在无意中为整个技术生态贡献着独特的应用场景和数据反馈。
从学生课程体系到企业AICA项目,从全国多地的产业赋能中心到教育创新中心,百度这种全方位的人才培养正在创造更多具有创新能力的AI开发者。
更重要的是,这种生态模式正在改变技术创新的基本逻辑。过去是应用寻找技术,现在是技术驱动应用。“大量通用性的问题需要更多的应用和行业参与。”当开发者社区足够活跃时,AI的能力边界就会在实际应用中被不断拓展。
生态的真正价值在于它让技术进步有了人文温度:不是冰冷的算法优化,而是来自千千万万个真实需求的推动。这种模式不仅推动了技术进步,更重要的是验证了一个理念:当技术真正服务于人的需求时,创新就会自然涌现。但这种理念如何在激烈的市场竞争中获得验证?
生态建设的理念和技术选择的价值观,最终需要市场的客观检验。百度文心大模型的务实路径是否真的有效?
中国信通院对文心X1 Turbo的权威测评给出了答案:24个能力项中16项满分、7项4分,综合评级达到4+,成为业界首个通过该评级的推理模型。
这一成绩验证了百度务实技术路径的正确性——不是某个单项的极致炫技,而是综合能力的均衡发展。更重要的是成本控制体现的普惠精神:文心X1 Turbo定价仅为DeepSeek-R1的25%,让更多开发者能够负担先进AI能力。
当我们询问对“基模争霸”格局的判断时,吴甜的回答印证了行业的深刻变化:“2023年时可以说是“百模大战‘,到今年,基础模型的数量级已经大幅下降。”
在我们看来,在这种收敛中,真正的竞争力来自“数据、算法、算力、人才等多方面因素”的综合实力,而非单纯的参数军备竞赛。
面对激烈竞争,吴甜展现出冷静的战略思维:“这是一个综合问题,不是一个「一招鲜」的问题。这就像下一盘棋,并不是某一招制胜,而是通盘的问题。”这种长期主义的态度,恰恰体现了百度对技术发展规律的深刻理解。
这些客观数据和市场表现证明,百度选择的“技术服务于人”的路径不仅有温度,更有实效。但技术的最终价值不在于竞争中的输赢,而在于能否真正改变人们的生活。
“AI让我跨越了信息鸿沟,看见了更大的世界,也让我找到了自己的热爱。”陈君航的话道出了技术的意义:不是替代人,而是赋能人。
从《流浪地球》的科幻想象到帮助母亲解决工作难题,这个16岁高中生的成长轨迹揭示了一个重要洞察:最有价值的技术创新,往往不是最复杂的,而是最贴近人类需求的。
当AI真正开始解决现实问题时,它就不再是高高在上的科技概念,而是融入日常生活的智能助手。陈君航的成长是飞桨文心生态中2185万开发者的一个缩影,技术的温度正在一点一滴地改变这个世界。
这是“新一轮的科技革命”。在吴甜看来,“技术变革最快,然后是应用落地,最后才影响日常生活,像涟漪一样从中心向外扩散。”在这场变革中,百度文心大模型的选择体现了难得的人文关怀:不追求技术的炫目,而专注于技术的温度。
陈君航用AI为母亲开发智能评语生成器,这个典型的用户故事如同点滴微光,也侧面反映出百度文心大模型在技术探索道路上的方向——致力于让AI贴近人的需求,服务大众。他的尝试实实在在地展现了百度秉持“技术服务于人”理念所结出的果实。
正如陈君航所说:“技术真正的魅力,不是惊艳谁,而是真正解决问题的那一刻。”当技术有了温度,当AI学会服务而非炫技,当创新的门槛足够低,每个人都可能成为下一个“陈君航”。
我想这就是文心大模型真正想要回答的问题:AI的未来不在实验室的跑分榜上,而在千家万户的日常生活中。
一起“点赞”三连↓
(文:Datawhale)