突破AI视觉“选择性失明”,哈工大首次实现指令驱动的全景式感知
哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型’选择性失明’的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力焦点,提升多模态任务表现。
哈工大博士生李俊劼的研究成果GiVE首次实现了指令驱动的全景式感知,解决了传统多模态模型’选择性失明’的问题。通过引入AG-Adapter模块和设计三种专门损失函数,GiVE能灵活调整注意力焦点,提升多模态任务表现。
智源研究院联合开发的BGE-VL模型在多模态检索任务中取得最佳效果,通过大规模合成数据MegaPairs训练而成。该方法具备优异的可扩展性和卓越的数据质量优势。