多模态大模型归档 - 第2页共8页

上海AI“北斗七星”亮了！

2025-05-06 作者财联社AI daily

上海徐汇已汇聚七家AI标杆企业，构建技术研发、场景落地和产业协同创新生态。这些企业在模型能力提升、应用推广和技术商业化等方面发挥作用，推动人工智能发展，并通过高质量孵化器吸引顶尖企业和人才，助力建设全国人工智能高地。

2025-04-29 作者机器之心

文轩和翟子杰，通讯作者是小红书 NLP 团队负责人曹绍升，以及华东师范大学林绍辉研究员。
多模态大模

2025-04-28 作者极市干货

关注极市平台公众号，获取多模态大模型解读专栏、Transformer系列等技术综述文章。

2025-04-25 作者 NLP工程化

Skywork发布R1V 2.0开源多模态大模型，推动开源社区发展并提供基座模型支持。

2025-04-23 作者量子位

拼好乐高吗？
你有没有想过这样的问题：
多模态大语言模型真的具备理解和推理空间结构的能力吗？
在多步

2025-04-19 作者 Hugging Face

上海AI实验室升级并开源了通用多模态大模型书生·万象 3.0 (InternVL3)，在多模态能力方面取得显著突破，成为开源模型中的性能新标杆。

2025-04-18 作者量子位

哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知，解决了传统多模态模型’选择性失明’的问题。通过引入AG-Adapter模块和设计三种专门损失函数，GiVE能灵活调整注意力焦点，提升多模态任务表现。

2025-04-18 作者小兵的AI视界

北京大学团队推出RoboMamba，一款高效多模态机器人模型，旨在提升复杂任务的推理与决策能力。其核心目标是增强视觉和语言集成能力、优化微调策略，并降低训练成本。

2025-04-15 作者量子位

上海交通大学联合团队发布STI-Bench，评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳，准确率低于50%。论文、代码及数据已开源，为改善MLLM空间智能提供了新基准。