DeepSeek-R1的风吹到了多模态,Visual-RFT发布,视觉任务性能飙升20%
视觉强化微调(Visual-RFT)通过设计特定的可验证奖励函数提升了语言-视觉双向模型在多模态任务中的性能,并展示了其在细粒度图像分类和少样本目标检测等基准测试中的竞争力。
视觉强化微调(Visual-RFT)通过设计特定的可验证奖励函数提升了语言-视觉双向模型在多模态任务中的性能,并展示了其在细粒度图像分类和少样本目标检测等基准测试中的竞争力。
首届跨域少样本物体检测挑战赛(CD-FSOD)由NTIRE2025举办,旨在提升小样本目标检测模型在不同领域数据上的泛化能力。大赛聚焦跨域场景下的少样本目标检测任务,提供多种验证集用于实验,并鼓励参赛者探索多样化的基础模型和训练策略。