Vision-R1:多模态领域的DeepSeek R1-Zero,7B参数比肩OpenAI O1 上午8时 2025/03/13 作者 AI工程化 Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题,提出冷启动初始化和RL训练方案,并创新性地引入PTST策略和HFRRF奖励函数,显著提升了模型在多个数学推理基准测试中的表现。