剪枝策略归档 - 每时AI

YOPO (You Only Prune Once)：给LLaVA做剪枝，大幅缩减多模态大模型计算量至12%！

2024年12月2日23时作者极市干货

本文提出了一系列剪枝策略，将LLaVA模型的计算量压缩至12%，同时保持了与原始模型同等的性能，并在其他多模态大模型上验证其普适性。

YOPO (You Only Prune Once)：大幅缩减多模态大模型计算量至12%

2024年12月2日14时作者 PaperWeekly

TL;DR
本文提出从参数和计算模式层面对多模态大模型做剪枝，以 LLaVA 为实验对象将计算量压缩