吞吐量提升归档

全球首个，最接近原版DeepSeek开源复现来了！R1四个月狂飙26倍

下午11时 2025/05/08 作者新智元

队发了一篇万字技术报告：短短4个月，他们就让DeepSeek-R1在H100上的性能提升了26倍，吞

下午4时 2025/04/30 作者机器之心

为参与作者。
训练成本高昂已经成为大模型和人工智能可持续发展的主要障碍之一。
大模型的训练往往采用多

下午4时 2025/03/19 作者新智元

CSD全华人团队力作，创新性地提出预填充-解码分离技术。在严格的延迟约束下，相比现有最先进的服务系统

下午10时 2025/01/08 作者 GiantPandaCV

PyTorch通过FSDP2、DTensor和torchao实现Float8训练提升吞吐量50%，展示了Float8在不同模型规模上的有效性，并进行了模型质量和评估基准验证。