多模态检索大升级!智源三大SOTA模型,代码、图文理解能力拉满

智源研究院联合多所高校发布三款向量模型,包括BGE-Code-v1、BGE-VL-v1.5和BGE-VL-Screenshot。这些模型在代码及多模态检索中表现出色,并登顶多项测试基准。BGE-Code-v1针对代码检索优化,提升跨语言信息获取能力;BGE-VL-v1.5则增强通用多模态理解与检索性能;BGE-VL-Screenshot专为视觉化文档任务设计。智源研究院将持续深耕向量模型和检索技术,推动相关领域发展。

智能体零样本解决未见过人类设计环境!全靠这个开放式物理RL环境空间

牛津大学提出Kinetix框架,训练通用RL智能体在2D物理环境中执行多样化任务,涵盖机器人任务、经典RL环境等。通过Jax2D硬件加速引擎模拟数十亿次交互生成多样任务。研究发现微调使通用智能体能显著减少特定任务学习所需样本数,并带来新能力。