MM-Eureka:极少数据实现多模态推理的R1-Zero时刻 2025-03-14 作者 机器之心 本文提出MM-Eureka模型,通过开源框架和规则型强化学习方法,在多模态环境中复现DeepSeek-R1的关键特性。