视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源 下午4时 2025/03/04 作者 机器之心 视觉强化微调项目 Visual-RFT 通过规则奖励和强化学习方法,实现了视觉语言模型在目标检测、分类等任务中的高效提升。项目已开源,欢迎加入。