打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力 2025年6月29日16时 作者 机器之心 CMU 研究生李浩然团队提出 HoPE,通过混合频率分配策略和动态缩放时间编码提升多模态模型在长视频理解与检索任务中的表现。