1-bit大模型还能再突破!新一代BitNet架构启用4位激活值 上午11时 2024/12/05 作者 新智元 BitNet系列原班人马推出新一代架构BitNet a4.8,采用两阶段权重衰减和学习率调度。实验对比显示其在语言模型困惑度和任务准确性方面与LLaMA相当,并且平均精度几乎没有损失。