BF16精度归档 - 每时AI

仅靠CPU也能跑DeepSeek、QwQ！浪潮信息发布全新方案，更懂中小企业的AI服务器来了

下午11时 2025/03/24 作者智东西

元脑CPU推理服务器在满足企业日常需求的同时大幅降低硬件成本与运维复杂度，助力中小企业便捷高效地使用AI技术提升业务效率。

下午12时 2025/02/24 作者 AI寒武纪

DeepSeek推出FlashMLA开源项目，专为Hopper架构GPU设计的超高效MLA解码内核现已正式开源。它优化了变长序列场景下的效率，并已在生产环境中使用。亮点包括BF16精度支持、Paged KV Cache以及极高的性能表现。