稀疏前馈网络归档 - 每时AI

YOPO (You Only Prune Once)：给LLaVA做剪枝，大幅缩减多模态大模型计算量至12%！

2024年12月2日23时作者极市干货

本文提出了一系列剪枝策略，将LLaVA模型的计算量压缩至12%，同时保持了与原始模型同等的性能，并在其他多模态大模型上验证其普适性。