图文检索归档

突破AI视觉“选择性失明”，哈工大首次实现指令驱动的全景式感知

下午4时 2025/04/18 作者量子位

哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知，解决了传统多模态模型’选择性失明’的问题。通过引入AG-Adapter模块和设计三种专门损失函数，GiVE能灵活调整注意力焦点，提升多模态任务表现。

下午4时 2025/03/06 作者机器之心

智源研究院联合开发的BGE-VL模型在多模态检索任务中取得最佳效果，通过大规模合成数据MegaPairs训练而成。该方法具备优异的可扩展性和卓越的数据质量优势。