2025-03-09 - 第2页共6页

10²⁶参数，AGI还需70年！清华人大预测届时GPU总价达4000万倍苹果市值

下午11时 2025/03/09 作者新智元

盆冷水：人类距离真正的AGI，还有整整70年！若要实现「自主级智能，需要惊人的10²⁶参数，所需GP

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强智者访谈

下午11时 2025/03/09 作者机器之心

示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机

马斯克「大闹白宫」！美政府12000人将被GSAi优化，xAI 100万块GPU巨兽年底建成

下午11时 2025/03/09 作者新智元

人马斯克。他领衔的DOGE正打造一款AI神器GSAi，要提升政府内部12000名员工的效率，甚至还要

从虚拟到现实，Sim2Real Might Actually Work

下午11时 2025/03/09 作者机器之心

本周通讯涵盖机器之心解读的AI及机器人领域内三项专题与30项关键动态。Sim2Real技术的有效性逐步获得认可，被认为比使用真机数据更高效；AIAgent产品被视为先进的RPA；AAAI讨论了2025年人工智能研究趋势。

ICLR 2025 清华、蚂蚁提出大模型推理新范式！将代码形式规划引入推理过程

下午11时 2025/03/09 作者 PaperWeekly

最佳方案吗？
2024 年 9 月，OpenAI 携 o1 模型吹响推理革命的号角，以惊人的思维链长

GPT-4o举步维艰、Claude 3.7险胜，《超级马里奥》成为了检验大模型的新试金石？

下午11时 2025/03/09 作者机器之心

GamingAgent 项目使用《超级马里奥兄弟》等平台游戏测试 AI 性能，通过模拟器和基本指令控制马里奥。结果显示 Claude 3.7 和 GPT-4o 在不同游戏中表现差异显著，GPT-4o 表现较差。专家认为当前评估 AI 智能的方法存在局限性，需要改进衡量标准来评估创造性思维和大胆反常规思考能力。