“这才是真正的OpenAI”相比于发表技术论文,开源代码库更注重实际应用和社区协作。通过共享可运行的源代码,DeepSeek推动了技术普及和开发者之间的合作。FlashMLA的开源,已经让全球开发者赞叹DeepSeek的开放精神。大模型行业从业者tomsheep认为,FlashMLA的主要贡献在于思路层面,虽然其本身的兼容性有限(例如,可能无法直接用于国产GPU),但这种思路可以启发其他项目开发类似功能。tomsheep表示,他最期待DeepSeek能够开放训练部分的代码和数据流程。不过,根据DeepSeek此前在X上发布的信息,本周开源的5个代码库都是DeepSeek在线服务中的“基础模块”,并且都经过了生产环境的实战检验。DeepSeek官方还在相关repo中发布了一篇关于AI基础设施的文章:《Fire-Flyer AI-HPC: A Cost-Effective Software-Hardware Co-Design for Deep Learning》。“参考OpenAI,先发布的往往是应用范围较窄的技术。FlashMLA更多地针对后端服务器运维的开发者。不过,看起来这一周的开源内容可能都围绕AI基础设施。”绝大多数企业和用户是模型的使用者而非训练者。高效的推理框架能让AI基础设施提供商和终端用户同时受益:用户体验到更快的响应速度,企业也能以更低的成本服务更多客户。通过开源FlashMLA,DeepSeek将成本优势共享给整个AI社区,让更多企业和开发者能够以更低的硬件投入,获得更高的推理性能,真正实现了“DS非常省硬件成本,开源出来大家一起省”。FlashMLA的开源仅是DeepSeek开源周的第一天,不仅展示了DeepSeek的技术实力,更体现了其推动行业生态构建的开放态度,期待接下来会有更多惊喜。