1比特KV量化,10倍吞吐提升无损性能:多模态适用的KV cache量化策略来了,即插即用无需改原模型 下午11时 2025/04/09 作者 极市干货 读 在InternVL-2.5上实现10倍吞吐量提升,模型性能几乎无损失。 >> 加入极市CV技术交