200多行代码,超低成本复现DeepSeek R1「Aha Moment」!复旦大学开源
复旦大学知识工场实验室团队基于 GRPO 算法高效复现了 R1-zero 自发反思能力,项目代码简洁,仅依赖基础库实现,训练 7B 模型成本低至 7.3 元。
复旦大学知识工场实验室团队基于 GRPO 算法高效复现了 R1-zero 自发反思能力,项目代码简洁,仅依赖基础库实现,训练 7B 模型成本低至 7.3 元。
DeepSeek吸引顶尖人才加入,通过独特文化与薪酬优势。团队成员来自中国知名大学,如清华大学和北京大学,享受自由的工作环境和激励措施,实现技术突破并获得全球认可。
John Schulman从OpenAI跳槽到Mira Murati的新创业公司,该公司的工作与AGI相关,并已吸引多名顶尖研究员和工程师。