自注意力机制归档

CVPR 25 全面提升视觉感知鲁棒性，生成模型快速赋能三维检测

下午4时 2025/05/23 作者机器之心

院，导师为李镇老师。目前实验室的研究方向包括：自动驾驶、医学成像和分子理解的多模态数据分析和生成等。

下午11时 2025/05/15 作者机器之心

在 ICML，NeurIPS，ICLR 等顶级会议上发表过论文。
本文提出一个
交替
「推理 – 擦

下午11时 2025/04/28 作者机器之心

建模能力为语言理解与生成带来了前所未有的突破。
然而，随着模型规模的不断扩大和应用场景的日益复杂，传

下午2时 2025/03/21 作者老刘说NLP

知识图谱融合大模型的思路。
也就是Easy Dataset大模型微调数据生成工具的三个问题以及大模型

下午2时 2025/03/11 作者小兵的AI视界

问世，宛如一把神奇钥匙，打开了音乐创作高效与便捷的全新大门。今天，
我们将深度聚焦一款在业内备受瞩目

下午11时 2025/03/10 作者极市干货

类中有效地超过了视觉 Mamba 模型
>>
加入极市CV技术交流群，走在计算机视觉的最前沿
本文目

上午8时 2025/02/25 作者 NLP工程化

Hugging Face博客介绍了如何从零实现稀疏专家混合语言模型（MoE），通过解析代码详解自注意力机制、专家模块等组件。

下午4时 2025/02/10 作者 PaperWeekly

哈工大深圳、鹏城实验室和昆士兰大学合作提出了一种极性感知线性自注意力机制（Polarity-aware Linear Attention），解决了现有方法在保证注意力分数正值性时会忽视掉 Q,K 矩阵中的负值元素的问题，并在多个视觉任务上取得了精度与效率的平衡。

下午11时 2025/01/09 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨
AI
生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读

下午2时 2024/12/30 作者 AI探索时代

Transformer的编码器负责将人类可识别的数据转换为大模型可以处理的形式，并进行特征提取；解码器则用于重建模式，生成新的数据。其架构包括自注意力机制等多重数据处理步骤。