瘦身不降智!大模型训推效率提升30%,京东大模型开发计算研究登Nature旗下期刊 2025年5月21日16时 作者 量子位 京东探索研究院提出Omniforce系统,通过模型蒸馏、数据治理等创新方法提升大模型效率70%,实现云边协同部署。
DeepSeek开源周第四弹!3大猛料一口气发完,梁文锋亲自贡献 2025年2月27日16时 作者 智东西 DeepSeek开源三大优化策略:DualPipe、EPLB和profile-data。DualPipe实现并行算法减少训练空闲时间;EPLB平衡负载避免GPU闲置。