阿尔伯塔大学归档

刚刚，2024图灵奖颁给了强化学习之父Richard Sutton与导师Andrew Barto

下午11时 2025/03/05 作者机器之心

强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。他们提出的强化学习理论为 AI 研究奠定了基础，并在机器人技能学习、网络拥堵控制等领域取得了成功。

下午11时 2025/02/04 作者新智元

国外网友发现o3-mini-high在思考过程中经常出现中文！有人猜测是否借鉴了DeepSeek。对此，网友纷纷质问奥特曼和OpenAI：究竟为何使用中文？专家认为这可能与模型处理语言的方式有关。不过目前「语言混杂」问题仍需解决。

下午2时 2024/12/08 作者机器之心

本周会员通讯解读AI & Robotics领域内三则重要资讯：一是探讨如何通过不同思路实现更强的人工智能；二是讨论关于元宇宙、皮卡丘世界模型以及Meta的技术布局；三是诺奖得主论坛的焦点话题及应用中的潜在副作用。

下午3时 2024/11/29 作者机器之心

本文提出了一种名为 stream-x 的深度强化学习算法，用于解决流式障碍问题。该方法无需使用重放缓冲区、批量更新或目标网络，即可从最新的经验中进行学习，并且在样本效率上可与批量强化学习相当。