bge开源一系列新向量模型,冲!

近期,bge向量模型来了一波大的更新:多模态、code、重排(段落、文档)。
  • BGE-Code-v1:适用于开发文档搜索、代码库语义检索、跨语言信息获取等场景。
基于Qwen2.5-Coder-1.5B开发,专为代码检索任务设计,具备强大的多语言文本理解能力。模型在CoIR和CodeRAG基准测试中表现优异,超越谷歌、Voyage AI等模型。
  • BGE-VL-v1.5:适用于图文匹配、多模态问答、跨模态推荐等场景。
基于LLaVA-1.6(7.57B参数)训练,显著提升了图文理解能力和检索能力。模型在MMEB基准测试中刷新了zero-shot模型的最佳表现,并在检索任务上登顶SOTA。
  • BGE-VL-Screenshot:适用于可视化信息检索(Vis-IR)任务,如截图检索、复合截图检索、截图QA和开放分类等。
基于Qwen2.5-VL-3B-Instruct开发,适用于网页、文档等多模态任务。模型在MVRB基准测试中表现出色,综合得分达到60.61,登顶SOTA。
https://huggingface.co/BAAIhttps://huggingface.co/BAAI/bge-code-v1https://huggingface.co/BAAI/Matroyshka-ReRanker-document

(文:PaperAgent)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往