FlashMLA归档 - 第2页共3页

Claude 3.7、QwQ-Max-Preview等推理大模型发布跟踪：兼看大模型逻辑推理技术总结及几点思考

下午2时 2025/02/25 作者老刘说NLP

近日推理大模型相关前沿回顾包括Claude 3.7的发布，Qwen的QwQ模型开源，FlashMLA的开源及PaliGemma 2 Mix模型的开源。文章还总结了大模型逻辑推理技术，并提出了一些值得思考的问题。

下午7时 2025/02/24 作者 AI先锋官

DeepSeek开源FlashMLA项目，显著提高H800 GPU内存访问性能。该优化方案对国产GPU也有潜在提升效应。

下午4时 2025/02/24 作者 APPSO

今天正式推出DeepSeek开源周，FlashMLA在极短时间内收获超过3.5K Star。它是针对HopperGPU优化的高效MLA解码内核，支持变长序列处理。FlashMLA通过优化减轻了内存占用并加速计算过程。

下午2时 2025/02/24 作者老刘说NLP

今天是2025年02月24日，星期一。文章讨论了mobile agent的思考和开源进展，包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。

下午12时 2025/02/24 作者 Founder Park

DeepSeek开源首个项目FlashMLA，针对英伟达Hopper GPU优化MLA解码内核，提升LLM模型在H800上的性能。