来自上海人工智能实验室归档 - 每时AI

MM-Eureka：极少数据实现多模态推理的R1-Zero时刻

下午12时 2025/03/14 作者机器之心

本文提出MM-Eureka模型，通过开源框架和规则型强化学习方法，在多模态环境中复现DeepSeek-R1的关键特性。