Transformer归档 - 第4页共8页 - 每时AI

AI语音合成新标杆！开源10小时斩获8K Star！1B参数实现电影级人声!

下午4时 2025/03/15 作者开源星探

一款名为CSM的新开源TTS模型由Sesame最新发布，能够生成带有上下文情感、自然语气和音调变化的人工智能语音。它具有高保真效果、端到端Transformer生成能力、上下文理解以及实时语音生成等功能。

重磅论文！何恺明、Yann LeCun等改造Transformer，CVPR 2025已收录

下午11时 2025/03/14 作者头部科技

Transformer模型可能迎来新变化。一篇最新论文提出无需归一化的Transformer模型能够达到甚至超过带有归一化层的性能，通过动态双曲正切函数（DyT）替代传统归一化层，有望进一步改进AI模型性能。

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

下午11时 2025/03/09 作者新智元

新智元报道
编辑：LRST
近期，来自美国埃默里大学、澳大利亚格里菲斯大学等多地的华人科研团队提出了一种跨架构知识蒸馏框架TimeDistill，将MLP作为学生模型，其他复杂先进架构（如Transformer和CNN）作为教师模型，通过蒸馏复杂模型的优势至轻量级模型，实现计算负担大幅降低的同时显著提升预测精度。

Agent or SFT or RL ? 9个多模态R1推理开源项目核心思路解析

下午2时 2025/03/02 作者老刘说NLP

个整理的技术工作。
DeepSeek-R1在处理数学、编码、谜题和科学问题以及回应一般问题时表现出出

MIT三人团队：用Transformer解决经验贝叶斯问题，比经典方法快100倍

下午11时 2025/02/28 作者机器之心

MIT 研究人员提出一种使用Transformer解决Empirical Bayes(mean estimation)任务的方法，并发现Transformer在该任务上的性能优于经典方法，且运行速度更快。

谷歌提出Titans：突破算力限制，扩展上下文

上午8时 2025/02/25 作者 AIGC开放社区

专注AIGC领域的专业社区，关注微软&OpenAI、百度文心一言等大语言模型发展和应用落地。谷歌发布新研究Titans，通过神经长期记忆模块扩展大模型上下文窗口至200万token，超越现有Transformer模型。

微软发布创新大模型：一张图片就能生成游戏，游戏界ChatGPT来了

上午8时 2025/02/22 作者 AIGC开放社区

专注于AIGC领域的专业社区报道了微软发布的专用于游戏领域的创新大模型——Muse，它通过游戏画面和控制器操作序列化数据生成连贯的游戏场景和玩法。

AAAI 2025 北航团队提出GTG：具备跨城市迁移性的人类移动轨迹生成模型

下午11时 2025/02/21 作者 PaperWeekly

neration Model for Urban Mobility
。本文提出了一种
具备跨城市迁移

两万字长文深度解密DeepSeek-R1、Kimi 1.5，强推理模型凭什么火出圈？

下午12时 2025/02/21 作者机器之心

多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术交流与传播。如果您有优秀的工作想要分享，

深度｜黄仁勋CES演讲：全球开发者正在构建下一代物理AI，具备实体的机器人——人形机器人

上午8时 2025/02/20 作者 Z Potentials

关，GeForce为AI走向大众铺平了道路，而现在，
AI正回归GeForce。
这是我们的全新Ge