算力直降97%,GPT-3存储只用20MB?!这篇直接在1.58-bit下训练模型的新论文火了 下午12时 2024/12/29 作者 量子位 GPT-3模型通过使用1.58-bit低精度训练技术,实现了20MB存储空间的大幅节省,并避免了反向传播和动量加速,引起了广泛关注。