微软1bit LLM新研究:原生4bit激活值量化,可充分利用新一代GPU对4bit计算的原生支持 下午4时 2025/04/29 作者 量子位 微软发布BitNet v2框架,通过引入H-BitLinear模块实现原生4 bit激活值量化,充分利用新一代GPU对4 bit计算的原生支持能力,并显著减少内存带宽和提升计算效率。
细水长flow之TARFLOW:流模型满血归来? 下午11时 2025/02/23 作者 PaperWeekly 网络 不知道还有没有读者对这个系列有印象?这个系列取名“细水长 flow”,主要介绍 flow 模型