模型微调与压缩技术归档

Qwen3 8B 的 BitNet 版本

2025年7月9日8时作者 NLP工程化

Qwen3-8B-BitNet是基于Qwen3-8B进行微调的模型，使用Prime Intellect的SYNTHETIC-1数据集，并在每个线性层输入中添加RMSNorm，所有线性层已转换为BitNet。该模型大小压缩至2.5B左右。