Transformer架构归档 - 第2页共4页

语音合成也遵循Scaling Law，太乙真人“原声放送”讲解论文港科大等开源

下午4时 2025/02/27 作者量子位

Llasa团队分享了他们基于Transformer的语音合成模型的研究成果，该模型展示了通过扩展计算资源来提高语音合成效果的能力。研究揭示了训练时间和推理时间扩展对性能的影响，并开源了代码和权重以供其他研究人员参考。

下午11时 2025/02/26 作者量子位

能创始人彭博正专注于一个更宏大的愿景。
在他看来，某个模型的爆火只是AI进化的一个普通节点，真正的技

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

下午12时 2025/01/23 作者路过银河AI

大模型已成为中国AI研究主流。DeepSeek在中文语义处理方面表现出色，成功翻译了俄罗斯教授的经济学导论。DeepSeek还提供了文本生成、分类与情感分析、问答系统等多样的功能。

下午11时 2025/01/22 作者 NLP工程化

GitHub上的一个深度学习论文实现项目，包含多种架构和算法的代码实现与详细注释，基于PyTorch框架。

下午2时 2025/01/22 作者小兵的AI视界

在人工智能技术日新月异的当下，多模态大模型已然成为推动行业变革的关键力量。
字节跳动推出的
Vall

下午12时 2025/01/16 作者 PaperWeekly

本文将介绍最近和来自北大，北航，港大，国科大等学校的同学以及阿里，Microsoft，Humanif

下午4时 2025/01/15 作者机器之心

文章介绍了V2PE（Variable Vision Position Embedding），一种用于增强视觉-语言模型在长上下文场景表现的位置编码方法。通过实验验证了其有效性和优势，为视觉-语言模型的发展带来了新的机遇。

下午2时 2025/01/14 作者 AI探索时代

开发大模型包括数据集处理、模型设计与训练等步骤，以Transformer为例详解其结构；主要包含输入嵌入、编码器解码器架构和多头注意力机制等内容。