YOPO (You Only Prune Once):给LLaVA做剪枝,大幅缩减多模态大模型计算量至12%! 下午11时 2024/12/02 作者 极市干货 本文提出了一系列剪枝策略,将LLaVA模型的计算量压缩至12%,同时保持了与原始模型同等的性能,并在其他多模态大模型上验证其普适性。
YOPO (You Only Prune Once):大幅缩减多模态大模型计算量至12% 下午2时 2024/12/02 作者 PaperWeekly TL;DR 本文提出从参数和计算模式层面对多模态大模型做剪枝,以 LLaVA 为实验对象将计算量压缩