模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了 下午4时 2025/04/28 作者 机器之心 卓越的能力。然而,它们迅速增长的规模给高效部署和推理带来了巨大障碍,特别是在计算或内存资源有限的环境
70%大小,100%准确!完美压缩LLM性能0损失,推理速度最高飙升39倍 下午11时 2025/04/26 作者 新智元 牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局:它将模型压缩30%且输出与原始模