YOPO (You Only Prune Once):大幅缩减多模态大模型计算量至12% 下午2时 2024/12/02 作者 PaperWeekly TL;DR 本文提出从参数和计算模式层面对多模态大模型做剪枝,以 LLaVA 为实验对象将计算量压缩