Yann LeCun 归档 - 第2页共3页

重磅论文！何恺明、Yann LeCun等改造Transformer，CVPR 2025已收录

2025年3月14日23时作者头部科技

Transformer模型可能迎来新变化。一篇最新论文提出无需归一化的Transformer模型能够达到甚至超过带有归一化层的性能，通过动态双曲正切函数（DyT）替代传统归一化层，有望进一步改进AI模型性能。

2025年2月25日8时作者新智元

Meta等机构提出的新方法RIP通过进化算法筛选低质量数据，提高LLM性能。基于两个假设：无效提示会导致不准确响应和复杂模糊的提示产生多种解释。RIP方法成功筛选高质量提示，提升模型在多个基准上的表现。

2025年2月2日12时作者 AI寒武纪

著名人工智能科学家Yann LeCun批评硅谷某些圈子存在的错位优越感，并将其分为三个阶段的症状：早期、中期和晚期。他认为科学和技术的进步需要更多人参与并积极分享创新成果，强调了开放共享的重要性。

2025年1月29日12时作者机器之心

低成本的DeepSeek模型引发了市场对AI硬件需求的担忧。OpenAI和Meta等公司正准备迎接推理需求的增长，同时专家指出训练成本降低可能不如推理成本降低更重要。

2025年1月27日12时作者 APPSO

在 DeepSeek 激起千层浪的时刻，作为技术开源最忠实的拥趸，杨立昆为 Deepseek 发声：

2025年1月17日16时作者 AIGC开放社区

文章介绍了Evolutionaryscale发布的ESM3生物模型，该模型拥有980亿参数，能够同时处理蛋白质的序列、结构和功能。ESM3在原子级别上生成新蛋白的能力引起了广泛关注，并且免费开放API促进了科学研究加速。