MM-Eureka:极少数据实现多模态推理的R1-Zero时刻 下午12时 2025/03/14 作者 机器之心 本文提出MM-Eureka模型,通过开源框架和规则型强化学习方法,在多模态环境中复现DeepSeek-R1的关键特性。