资讯
国际
分享
大模型
学术
开源
机器人
关于我们

大型语言模型 (MLLM)

Vision-R1：多模态领域的DeepSeek R1-Zero，7B参数比肩OpenAI O1

上午8时 2025/03/13 作者 AI工程化

Vision-R1项目通过两阶段策略解决了多模态推理数据稀缺的问题，提出冷启动初始化和RL训练方案，并创新性地引入PTST策略和HFRRF奖励函数，显著提升了模型在多个数学推理基准测试中的表现。

分类分享标签冷启动初始化、多模态、大型语言模型 (MLLM)、强化学习 (RL)、性能提升、研究团队发表评论

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

近期文章

大模型应用的本质是把大模型当做一个人，而不是把大模型当做一个神——把大模型带入人的角色
微软&清北RPT：强化学习的风又吹到了预训练！
“多模态方法无法实现AGI”
员工每天花1000美元也要用ClaudeCode！创始人：太贵了，大公司专属，但它比 Cursor 猛！
即将量产全球首款“空间记忆模组”！「留形科技」完成Pre-A轮融资

分类

分享
国际
大模型
学术
开源
机器人
资讯

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×