资讯
国际
分享
大模型
学术
开源
机器人
关于我们

细粒度图像分类

DeepSeek-R1的风吹到了多模态，Visual-RFT发布，视觉任务性能飙升20%

2025年3月13日14时作者 PaperAgent

视觉强化微调(Visual-RFT)通过设计特定的可验证奖励函数提升了语言-视觉双向模型在多模态任务中的性能，并展示了其在细粒度图像分类和少样本目标检测等基准测试中的竞争力。

分类分享标签 15.4%、 21.9%、 24.3%、 Visual-RFT、少样本目标检测、细粒度图像分类发表评论

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

分类

分享
国际
大模型
学术
开源
机器人
资讯

与“硅谷精神之父”凯文·凯利(KK)对话，聊聊一万天后的 AI 产品
MiniMax-M1 重磅开源！超越DeepSeek R1，媲美Gemini 2.5 Pro和Claude 4 Opus
这些关于研发提效的深度实践分享，值得每一位开发者关注 AICon
揭秘千卡 GPU 集群如何高效训练多模态大模型：vivo AI 团队实战经验分享｜AICon
小扎疯狂挖角 OpenAI、签约跳槽就发7亿奖金，奥特曼痛批：不懂创新，老“复制”人了

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×