微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持 下午4时 2025/04/29 作者 量子位 微软发布BitNet v2框架,通过引入H-BitLinear模块实现原生4 bit激活值量化,充分利用新一代GPU对4 bit计算的原生支持能力,并显著减少内存带宽和提升计算效率。