跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

计算效率

ICML 2025 打破残差连接瓶颈,彩云科技&北邮提出MUDDFormer架构让Transformer再进化!

2025年6月27日23时 作者 机器之心

,彩云科技CEO袁行远。
残差连接(residual connections)自何恺明在 2015

分类 学术、 资讯 标签 MUDDFormer、 Transformer架构、 上下文学习能力、 注意力激活比例、 自然语言处理、 计算效率 发表评论

算力终结者来了!华人天团「降维打击」注意力瓶颈,AI狂飙进对数时代

2025年6月8日23时 作者 新智元

enwick树分段,用掩码矩阵,让注意力焕发对数级效率。更厉害的是,它无缝对接线性注意力家族,Mam

分类 资讯 标签 Able-2025、 块间计算、 多任务验证、 线性注意力模型、 自适应λ项参数化、 计算效率 发表评论

专治AI生图「人脸崩坏」,8倍速碾压GPT!新版FLUX.1多方位刷新SOTA

2025年5月30日16时 作者 新智元

到图像生成的新一代模型,支持文本与图像提示,角色一致性强,速度快达GPT-Image-1的8倍。
用

分类 资讯 标签 Flux.1、 KontextBench、 多轮编辑、 统一架构、 计算效率、 风格参考 发表评论

GPT-4o图像生成的「核燃料」找到了!万字长文拆解潜在变量,网友:原来AI在另一个维度作画

2025年5月6日16时 作者 机器之心

成功能爆火,掀起了以吉卜力风为代表的广泛讨论,生成式 AI 的热潮再次席卷网络。
而在这股浪潮背后,

分类 学术、 资讯 标签 似然值、 潜在空间、 生成模型、 端到端学习、 计算效率、 高分辨率 发表评论

深入分析 Llama 4 最新架构

2025年4月22日14时 作者 机器学习算法与自然语言处理

业研究人员。
社区的愿景
是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进

分类 学术 标签 Meta、 MoE架构、 多模态、 文本摘要、 计算效率、 高质量数据 发表评论

Attention is NOT all you need!这个「去Transformer」的玩意直接把我整懵了!

2025年3月25日16时 作者 AGI Hunt

就训练出
一个
完全不用Transformer注意力
的
72B大模型,性能竟超越GPT 3.5?!

分类 分享 标签 FFN/MLP架构、 Qwerky-72B、 RWKV架构、 多语言处理、 数据独立性、 计算效率 发表评论

英伟达全力发展AI Agent!开源专属大模型,最强AI工厂

2025年3月19日8时 作者 AIGC开放社区

英伟达在GTC 2025大会上发布专用于AI Agent的Llama Nemotron模型,并推出了性能更强的Blackwell Ultra AI工厂。

分类 资讯 标签 agent、 Llama Nemotron、 甲骨文、 英伟达、 计算效率、 黑尔韦尔Ultra 发表评论

可视化图解MOE大模型的7个核心问题:专家、路由、负载均衡及其用于视觉模态

2025年3月2日19时 作者 老刘说NLP

,可视化图解moe讲的挺不错,转载过来并做翻译,当作记录,值得收藏慢慢看。
原文在:https://

分类 大模型 标签 MoE、 文本、 稀疏参数、 老刘、 视觉、 计算效率 发表评论

刚刚,GPT-4.5震撼上线情商逆天!OpenAI最大最贵模型最像人类,奥特曼带娃缺席

2025年2月28日8时 作者 新智元

上线了!它并不是推理模型,但是规模最大、知识最丰富,最鲜明的特点就是情商高、很类人。Pro版用户和付

分类 资讯 标签 GPT-4.5、 物理模拟、 社交应用、 视觉处理、 计算效率、 音乐推荐 发表评论

一个有趣却撤稿 ICLR 2025 的工作:并非所有扩散模型噪声本质相同

2025年2月14日23时 作者 极市干货

读
这篇文章发现了并非所有扩散噪声生成质量相同这一问题,并设计了反演稳定度这
一衡量噪声质量的指标。

分类 学术 标签 反演稳定性、 噪声质量、 扩散模型、 计算效率、 评估指标、 迭代优化 发表评论
较早文章
页面1 页面2 下一页 →

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 工业机器人 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
  • 万事俱备不缺东风,宇树科技站在科创板与港交所门口
  • 不死的程序员
  • 开源4小时斩获1.8k星星!用AI记录电脑的全部画面和声音,支持会议纪要。
  • 不学美国砸钱烧AI,欧洲科技巨头另辟蹊径!
  • xAI美国数据中心获批使用天然气发电

2025 年 7 月
一 二 三 四 五 六 日
 123456
78910111213
14151617181920
21222324252627
28293031  
« 6 月    

归档

  • 2025 年 7 月
  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×