AI理解27分钟长视频超越GPT-4o,港理工新国立开源新框架:角色化推理+链式LoRA

港理工和新加坡国立大学团队提出VideoMind框架,利用角色化推理和链式LoRA策略提高长视频理解能力。该框架已在多个基准测试中取得显著效果,并通过GitHub开源了代码、数据和模型参数。