Flash Attention 归档

斯坦福意外用AI生成超强CUDA内核，性能比人类专家优化得还要好！翻倍碾压原生PyTorch，华人主创

2025年5月31日16时作者量子位

斯坦福团队通过意外发现，由AI生成的内核性能超越了人类专家专门优化过的版本。这项研究展示了大模型在探索高级优化和硬件特性的能力。

2025年3月18日23时作者极市干货

绍了FlashAttentionV3（FA3）的前向过程原理，结合代码分析了其数学公式和工程实现的细

2025年3月12日12时作者机器之心

线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。
随之

2025年2月19日16时作者智东西

智东西2月19日报道，在DeepSeek公布最新稀疏注意力框架NSA论文的5小时后，“大模型六小虎”

2024年11月24日23时作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨藤原豆腐皮儿@知乎（已授权）
来源丨https://zhuanl