强化学习上大分!清华团队训练出数学推理超越 GPT-4o 的 7B 模型

清华大学团队提出PRIME方法,仅用8张A100和约1万块花费训练出数学能力超过GPT-4、Llama-3.1-70B的Eurus-2-7B-PRIME模型,在美国IMO选拔考试中准确率达到26.7%,远超基线模型。该方法采用隐式过程奖励解决大模型强化学习中的关键问题,未来有望推动复杂推理能力提升。

周鸿祎:把大模型从“原子弹”变为“茶叶蛋”更适合中国

2025年新年特别报道《AI领先者心声》指出,中国应走应用之路而非AGI之路,强调大模型需聚焦场景化、专业化和垂直化发展方向。文章总结了未来六大应用场景:人人智能、万物智能、数转智改、新兴领域赋能、AI for Science及AI安全。

MIT 公布2025 十大突破技术!

MIT Technology Review发布2025年度十大突破性技术榜单,涵盖AI、清洁能源等领域。其中包括Vera C. Rubin天文台、生成式AI搜索、小型语言模型等技术变革,以及无人驾驶出租车、清洁喷气燃料等应用前景广阔的技术。