Zero归档 - 每时AI

如何估算大模型推理及微调的GPU显存需求？影响因素、计算规则及注意事项

下午2时 2025/05/04 作者老刘说NLP

有介绍过，这次再温习一遍，讲的再细致些
计算LLM的显存需要考虑多个因素，
了解核心组件（参数、优化

Hugging Face 发布并开源大模型训练书籍《Ultra-Scale Playbook》

上午8时 2025/02/21 作者 NLP工程化

Hugging Face发布了《Ultra-Scale Playbook》一书，介绍大模型训练中的5D并行性、ZeRO等技术，并分享了相关实验和工具的使用经验。