多模态模型
想纠正LMM犯错?没用!NUS华人团队:最强o1反馈修正率不到50%
新加坡国立大学华人团队提出InterFeedback框架,评估大规模多模态模型在人类反馈下的表现,结果显示最先进的LMM通过人类反馈纠正结果的比例不到50%。
最低调「六小虎」阶跃星辰开年首秀:Agent落地智能终端,印奇也来了
阶跃星辰在2025年生态开放日上回应DeepSeek,宣布开源两款多模态模型,并提出AGI的下一个阶段应为多模态推理及AI Agent。
清华、中南开源3D交互实体AI Agent LEGENT
专注AIGC领域的专业社区报道了清华大学和中南大学联合开源的可视化交互实体AI Agent模型LEGENT。它允许用户在3D虚拟空间与智能体互动,实现包括物体操作等复杂任务。
DeepSeek与OmniParser V2.0 重构人机协作新范式了
DeepSeek与OmniParser V2.0结合,使得大模型能直接操控计算机系统完成复杂任务,引发人机交互范式迁移和智能体进化。
DeepSeek官方开源多模态视觉理解和生成模型,谁说DeepSeek只能问答了?!
DeepSeek团队发布的新多模态模型Janus-Pro通过优化训练策略、扩展数据集和扩大模型规模提升了性能,实现高质量的文本到图像生成及多模态理解。
大神卡帕西拿DeepSeek R1讲强化学习!最新大模型内部机制视频爆火,“没有技术背景也能看懂”
西风 发自 凹非寺
量子位 | 公众号 QbitAI
宣布全职搞教育的AI大神
Andrej Kar