ICLR 2025 计算开销减半!Dynamic-LLaVA刷新多模态大模型推理加速上限 上午8时 2025/04/28 作者 PaperWeekly 段不断生成新的 token,推理过程的计算复杂度和 GPU 显存占用逐渐增加,这导致了多模态大模型推