训练优化归档

瘦身不降智！大模型训推效率提升30%，京东大模型开发计算研究登Nature旗下期刊

2025年5月21日16时作者量子位

京东探索研究院提出Omniforce系统，通过模型蒸馏、数据治理等创新方法提升大模型效率70%，实现云边协同部署。

2025年2月27日16时作者智东西

DeepSeek开源三大优化策略：DualPipe、EPLB和profile-data。DualPipe实现并行算法减少训练空闲时间；EPLB平衡负载避免GPU闲置。

2025年2月19日23时作者极市干货

.9和9.11谁大更考验Reasoning模型, 似乎很多大模型的答案都做的不好. DeepSeek

2025年2月14日14时作者 AI探索时代

上各种各样关于神经网络的内容，很多想学习神经网络的人都无从下手，包括作者自己；面对各种乱七八糟的概念