大模型轻量化解读系列 (五):QuaRot:基于 Rotation 的 4-bit LLM 量化 下午11时 2024/12/30 作者 极市干货 ↑ 点击 蓝字 关注极市平台 作者丨科技猛兽 编辑丨极市平台 极市导读 4-bit 量化 LLaMA