Transformer架构归档

Transformer八周年！Attention Is All You Need被引破18万封神

下午4时 2025/06/13 作者新智元

新智元报道
编辑：定慧
【新智元导读】
Transformer已满8岁，革命性论文《Attention Is All You Need》被引超18万次，掀起生成式AI革命。
Transformer催生了ChatGPT、Gemini、Claude等诸多前沿产品。它让人类真正跨入了生成式AI时代。
这篇论文的被引次数已经达到了184376！
尽管当年未获「Attention」，但如今Transformer影响仍在继续。
谷歌开始收回对大模型开放使用的「善意」。
人人都爱Transformer，成为严肃学界乐此不疲的玩梗素材。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Transformer八周年！Attention Is All You Need被引破18万封神

小红书hi lab首次开源文本大模型，训练资源不到Qwen2.5 72B 的四分之一

牛津大学等深挖746万成年人健康数据开发早筛算法，基于血液指标实现15种癌症早期预测

小米入局大模型赛道！开源MiMo-7B，性能超o1-mini

只需 0.5B 参数，全面覆盖预训练+SFT + RL！极简自回归视觉生成框架SimpleAR

阿里巴巴开源LHM：只需一张照片，秒变可动画3D数字人！

围观！斯坦福最火AI课全球免费开讲，顶级大佬亲授Transformer精髓，课表全放送

谷歌提出Transformer架构中，表示崩塌、过度压缩的5个解决方法