细粒度对齐无需仔细标注了!淘天提出视觉锚定奖励,自我校准实现多模态对齐
AIxiv专栏介绍及论文《Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards》内容。该研究提出一种创新方法缓解视觉大模型幻觉现象,提升多模态偏好对齐效率和自动化水平。
AIxiv专栏介绍及论文《Token Preference Optimization with Self-Calibrated Visual-Anchored Rewards》内容。该研究提出一种创新方法缓解视觉大模型幻觉现象,提升多模态偏好对齐效率和自动化水平。