智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA

智源研究院发布三款向量模型,包括代码向量模型BGE-Code-v1、多模态向量模型BGE-VL-v1.5和视觉化文档向量模型BGE-VL-Screenshot,它们在代码及多模态检索中取得了最佳效果,并登顶多项测试基准。这些模型目前已向社区开放,支持各类应用场景。

多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

智源研究院联合多所高校发布三款向量模型,包括BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索中表现出色,并登顶多项测试基准。BGE-Code-v1针对代码检索优化,提升跨语言信息获取能力;BGE-VL-v1.5则增强通用多模态理解与检索性能;BGE-VL-Screenshot专为视觉化文档任务设计。智源研究院将持续深耕向量模型和检索技术,推动相关领域发展。

AI能看懂图像却算不好距离,上交时间-空间智能基准难倒9大顶尖多模态模型

上海交通大学联合团队发布STI-Bench,评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳,准确率低于50%。论文、代码及数据已开源,为改善MLLM空间智能提供了新基准。

智源研究院院长王仲远:至少5-10年,具身智能模型才能成熟落地|

智源研究院发布首个跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain,推动单机智能迈向群体智能。王仲远认为具身智能仍处于早期阶段,但具有长期发展优势。通过研发具身大模型提升迭代能力,实现从单机到群体智能的转变。