ViLAMP:蚂蚁集团和人民大学联手打造的长视频理解利器,单卡处理3小时视频!

蚂蚁集团和中国人民大学联合推出的ViLAMP模型通过混合精度策略和差分蒸馏技术实现高效处理长视频,显著降低计算成本和提高处理效率,在多个视频理解基准测试中表现优异。

ICML 2025 长视频理解新SOTA!蚂蚁&人大开源ViLAMP-7B,单卡可处理3小时视频

蚂蚁和中国人民大学的研究团队提出ViLAMP模型,实现对超长视频的高效处理。ViLAMP通过混合精度策略,在关键帧上保持高精度分析,大幅提升了视频理解效率,并在多个基准测试中超越现有方案。