智源3款向量模型发布!代码检索及多模态维度刷新多项SOTA
智源研究院发布三款向量模型,包括代码向量模型BGE-Code-v1、多模态向量模型BGE-VL-v1.5和视觉化文档向量模型BGE-VL-Screenshot,它们在代码及多模态检索中取得了最佳效果,并登顶多项测试基准。这些模型目前已向社区开放,支持各类应用场景。
智源研究院发布三款向量模型,包括代码向量模型BGE-Code-v1、多模态向量模型BGE-VL-v1.5和视觉化文档向量模型BGE-VL-Screenshot,它们在代码及多模态检索中取得了最佳效果,并登顶多项测试基准。这些模型目前已向社区开放,支持各类应用场景。
智源研究院联合多所高校发布三款向量模型,包括BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索中表现出色,并登顶多项测试基准。BGE-Code-v1针对代码检索优化,提升跨语言信息获取能力;BGE-VL-v1.5则增强通用多模态理解与检索性能;BGE-VL-Screenshot专为视觉化文档任务设计。智源研究院将持续深耕向量模型和检索技术,推动相关领域发展。
智源研究院发布三款向量模型BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot,分别在代码检索、多模态检索和视觉化文档检索中取得最佳效果,并已开源。
智源研究院在2025年发布CCI 4.0-M2 V1数据集,包含3个中英双语言的数据集,总token数量达425B(4250亿),可提升推理能力,已在多个平台开源。
上海交通大学联合团队发布STI-Bench,评估多模态大模型的空间-时间理解能力。结果显示当前最强模型在自动驾驶和机器人操作任务中表现不佳,准确率低于50%。论文、代码及数据已开源,为改善MLLM空间智能提供了新基准。
智源研究院发布首个跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain,推动单机智能迈向群体智能。王仲远认为具身智能仍处于早期阶段,但具有长期发展优势。通过研发具身大模型提升迭代能力,实现从单机到群体智能的转变。