AlphaGo 归档 - 每时AI

诺奖得主震撼宣言：AI一年完成10亿年「博士研究时间」！

2025年4月14日23时作者新智元

表示，通过AI，DeepMind团队在一年里，完成了10亿年的博士研究时间！10亿年的科学探索被压缩

2025年3月6日12时作者量子位

计算机最高奖图灵奖揭晓。强化学习先驱Andrew Barto与Richard Sutton共同获奖，他们被评价为’引领基础AI技术开发的研究人员’。两位是师徒关系，Barto和他的博士研究生Sutton将马尔可夫决策过程的数学基础应用于强化学习框架中。

2025年3月6日8时作者 AI寒武纪

重磅消息！ACM图灵奖揭晓2024年得主Andrew Barto和Richard Sutton因强化学习领域的奠基性贡献获奖。两位教授是AI核心技术——强化学习的先驱，推动了AlphaGo战胜人类围棋冠军和ChatGPT等技术的发展。

MLNLP社区介绍了DeepSeek R1论文，并重点提到了基于规则的奖励模型和多阶段训练策略，作者通过与AlphaGo的对比分享了个人见解。文章还提及技术交流群邀请函和MLNLP社区介绍。

2024年12月25日18时作者量子位

编辑部整理自 MEET2025
量子位 | 公众号 QbitAI
在大模型尚不是共识，甚至大模型算