R1-V项目:将DeepSeek R1的训练方法用在视觉语言模型上 下午11时 2025/02/03 作者 NLP工程化 R1-V项目展示了DeepSeek RRP在视觉语言模型上的效果,仅需30分钟和不到3美元的训练成本,在100个步骤内超越了72B模型的OOD测试表现。