MLA 归档 - 每时AI

把MLA和稀疏激活带到端侧！港科大广州和伦敦大学学院团队联合发布软硬协同设计的边缘语言模型PLM

2025年3月27日16时作者机器之心

）AI 中心汪军教授，香港科技大学（广州）信息枢纽院长陈雷教授联合指导。第一作者邓程是香港科技大学（

2025年2月24日16时作者 APPSO

今天正式推出DeepSeek开源周，FlashMLA在极短时间内收获超过3.5K Star。它是针对HopperGPU优化的高效MLA解码内核，支持变长序列处理。FlashMLA通过优化减轻了内存占用并加速计算过程。

2025年2月24日14时作者老刘说NLP

今天是2025年02月24日，星期一。文章讨论了mobile agent的思考和开源进展，包括MoE小模型Moonlight-16B-A3B、Qwen2.5-VL及deepseek开源周day1开源FlashMLA等项目。此外还介绍了RAG在写作场景中的应用进展。

2025年2月24日12时作者新智元

DeepSeek发布FlashMLA开源库，支持英伟达Hopper GPU。FlashMLA针对变长序列进行优化，显著提高推理速度和性能。

2025年2月14日14时作者 GiantPandaCV

lgorithm-in-cuda 。
这里简要解析了一下SGLang v0.4版本中针对DeepSe