强化学习归档 - 第21页共29页

超越DeepSeek V3！Ai2再祭开源杀器Tülu 3，强化学习打破性能瓶颈

下午11时 2025/02/05 作者新智元

艾伦人工智能研究所推出的新模型Tülu 3 405B在多项基准测试中超越Deepseek v3和GPT-4，采用全新后训练框架，并提供完全开源的数据、评估、训练代码及开发配方。

下午11时 2025/02/04 作者智东西

饶毅：DeepSeek是鸦片战争以来，中国对人类最大的科技震撼。
作者 |
云鹏
编辑 |
漠影
智

下午12时 2025/02/04 作者机器人大讲堂

单位
：乔治亚理工学院，南加州大学，慕尼黑工业大学，谷歌DeepMind，人工智能研究所，人机认知研

下午4时 2025/02/03 作者 AI寒武纪

OpenAI发布Deep Research模型，旨在通过多步骤互联网研究彻底革新知识工作。该技术移除了传统模型的延迟限制，能够自主完成复杂任务并生成详尽报告，尤其适用于需要广泛网络浏览的应用场景。

上午8时 2025/02/01 作者新智元

新智元报道
编辑：KingHZ 乔杨
【新智元导读】
Ai2研究科学家Nathan Lambert总