紫东太初开源视觉神经增强方法,即插即用终结多模态幻觉 ACL 2025
通过识别并增强视觉敏感的注意力头,中科院自动化所联合新加坡国立大学、东南大学提出了一种高效解决大模型幻觉问题的新方法VHR。该技术量化注意力头对视觉信息的敏感度,并动态强化这些视觉感知头,显著降低模型基于语言先验而产生的幻觉现象。
通过识别并增强视觉敏感的注意力头,中科院自动化所联合新加坡国立大学、东南大学提出了一种高效解决大模型幻觉问题的新方法VHR。该技术量化注意力头对视觉信息的敏感度,并动态强化这些视觉感知头,显著降低模型基于语言先验而产生的幻觉现象。
中科院自动化所提出BridgeVLA模型,通过统一2D输入输出实现高效泛化3D机器人操作学习,在仿真和真实场景中均表现出卓越性能,仅需3条轨迹即可在基础任务中达到96.8%的成功率。
中科院自动化所与字节跳动联合提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一的2D空间来改进3D VLA模型设计,大幅提高了数据效率和任务成功率。
中科院自动化所谭铁牛团队提出BridgeVLA,通过将预训练和微调的输入输出对齐到统一2D空间来提升3D VLA模型的数据效率与操作效果。