Transformer归档 - 第7页共8页

低空经济万字综述｜基于深度学习的无人机检测和识别研究

下午10时 2024/12/20 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨那振宇，程留洋，孙鸿晨
来源丨信号处理
编辑丨极市平台
本文仅用

上午8时 2024/12/15 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨吴佳龙
来源丨THUML
编辑丨极市平台
极市导读
本文提出一种

下午12时 2024/12/13 作者新智元

新智元报道
编辑：LRS
【新智元导读】
Transformer模型自2017年问世以来，已成为AI

上午8时 2024/12/11 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨PaperWeekly
来源丨PaperWeekly
编辑丨极市

上午11时 2024/12/05 作者新智元

英伟达提出的新技术Star Attention能显著减少Transformer模型长序列推理时的计算量，从而提高效率和准确性。它通过将上下文分成较小块并在每个主机上独立处理这些块来实现，这有助于在不牺牲精度的情况下加速推理过程。

下午4时 2024/12/04 作者量子位

2014年来自Karpathy与Dzmitry Bahdanau的实习生提出的简化注意力机制在机器翻译项目中诞生，后来被应用于Transformer模型。

上午7时 2024/12/04 作者 AI寒武纪

揭秘Transformer‘注意力’机制的起源故事，它源于2014年实习生Dzmitry Bahdanau在Yoshua Bengio实验室中的实践思考与创新。通过软搜索设计解决了序列到序列模型中的瓶颈问题，最终提出RNNSearch架构，并引入softmax加权平均技术。

下午11时 2024/12/03 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨Gsunshine@知乎（已授权）
来源丨https://zhu

上午11时 2024/11/26 作者新智元

新智元报道
编辑：乔杨
【新智元导读】
Ai2和华盛顿大学联合Meta、CMU、斯坦福等机构发布了最

下午10时 2024/11/24 作者 Datawhale

《大模型白盒子构建指南》旨在帮助读者从基础原理出发，独立复现一个清晰、可用的大模型系统。项目涵盖大模型架构、预训练、RAG框架、Agent系统及评估体系等内容，适合有一定深度学习和NLP经验的学习者。