Transformer架构归档 - 第3页共4页

神经网络是怎么学习的？

下午2时 2025/01/11 作者 AI探索时代

本文讨论了神经网络在学习过程中的数学运算机制，并提出了模型如何通过矩阵运算和向量变换来学习数据特征的问题，指出其核心在于动态调整的数学关系（即f(x)）。

下午11时 2025/01/08 作者极市干货

极市平台关注，获取多模态大模型解读专栏、Transformer系列等技术资源。

上午8时 2025/01/03 作者 AIGC开放社区

专注AIGC领域的专业社区分享Meta的Memory layers研究进展，介绍其通过高效查询机制显著增加大模型参数而无需额外算力的方法。

下午2时 2025/01/01 作者 AI探索时代

大模型的核心在于特征提取和重建。Transformer架构在NLP领域表现突出，而CNN则适用于图像处理。序列到序列(Seq2Seq)用于具有连续性内容的生成，如机器翻译、语音识别及视频处理等领域。CNN擅长处理不连续且独立的图像数据。

上午8时 2024/12/24 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨AI生成未来
来源丨AI生成未来
编辑丨极市平台
极市导读
ST

上午8时 2024/12/23 作者 AIGC开放社区

开源语音模型Moonshine在推理效率和性能上进行大幅度优化，输入音频信号压缩高达384倍。它使用RoPE位置编码方式处理可变长度序列，并采用了字节级BPE分词器来提高文本处理灵活性和效率。

下午12时 2024/12/10 作者 Founder Park

OpenAI
发布季第三天，
正式
发布 Sora。
于 2024 年 2 月首次亮相的 Sora，

上午8时 2024/12/10 作者智东西

Sora，终于来了！
作者 |
ZeR0程茜
编辑 |
漠影
掀起视频大模型风暴的Sora，终于正式

下午8时 2024/12/04 作者机器之心

机器之心报道
编辑：张倩、Panda
三人是紧密的
合作伙伴。
最近，OpenAI 又迎来了新的人事

下午7时 2024/12/04 作者量子位

ViT三大核心作者翟晓华、卢卡斯·拜尔和亚历山大·科列斯尼科夫集体离职谷歌DeepMind，加入OpenAI。他们在计算机视觉领域的研究包括ViT及其衍生工作、SigLIP、PaliGamma等。