学术归档 - 第2页共217页 - 每时AI

具身进化·无界未来：这场论坛引领具身智能模型革命新浪潮

下午11时 2025/05/30 作者机器之心

2025 张江具身智能开发者大会暨国际人形机器人技能大赛召开，论坛聚焦具身 AI 与世界模型、分层决策等热点话题。专家学者分享了新型大物理模型、智能机器人产品化思考、类脑仿生控制、视觉大模型在具身智能中的应用等内容。

ICML 2025 Spotlight 谁导致了多智能体系统的失败？首个「自动化失败归因」研究出炉

下午4时 2025/05/30 作者机器之心

本文介绍了一篇ICML 2025 Spotlight论文，提出自动化失败归因新任务以快速定位多智能体语言模型（LLM）系统的错误。研究构建首个Who&When数据集，并比较了三种方法：All-at-Once、Step-by-Step和Binary Search。实验结果显示当前方法效果有限，准确率较低；但混合策略有一定提升，且现有SOTA模型表现仍不理想。这表明失败归因任务对AI推理与理解能力要求极高。

谷歌之后，英伟达入局扩散大语言模型，Fast-dLLM推理速度狂飙27.6倍

下午4时 2025/05/30 作者机器之心

Fast-dLLM 提出分块 KV 缓存和置信度感知并行解码技术，显著提升扩散模型推理速度至原速的 27.6 倍，同时保持较高生成精度。

大模型智能体如何突破规模化应用瓶颈，核心在于Agentic ROI

下午4时 2025/05/30 作者机器之心

本文提出Agentic ROI概念，用于衡量大模型智能体在实际场景中的信息收益与成本比。研究发现其主要障碍在于信息质量未达实用阈值和使用成本过高，而非单纯的技术能力不足。

多模态扩散模型开始爆发，这次是高速可控还能学习推理的LaViDa

下午4时 2025/05/30 作者机器之心

的视觉-语言模型（VLM）也来了，即能够联合处理视觉和文本信息的模型。今天我们介绍的这个名叫
LaV

美团开放AI代码工具，零代码实现全栈能力，项目负责人揭秘架构细节

下午4时 2025/05/30 作者机器之心

团。
上周，有媒体曝出了美团的 AI 零代码工具 NoCode，这是一款无需编程背景和经验，仅通过自

CVPR 2025｜MetricGrids：基于泰勒展开的任意非线性特征网格神经表征

下午11时 2025/05/29 作者极市干货

任务中展现出强大能力，但现有网格结构多依赖线性插值，难以高效建模非线性信号。本文提出的
Metric

Linear-MoE：线性注意力遇上混合专家的开源实践

下午11时 2025/05/29 作者机器之心

近年来，大语言模型的研究热点转向了线性序列建模和混合专家架构的高效结合。来自上海人工智能实验室团队的Linear-MoE首次系统地实现了这两者的结合，并开源了完整的技术框架，支持层间混合架构。

CVPR’25｜生成性能提升不靠堆参数！MaskUNet：基于掩码的扩散模型生成能力增强方法

下午11时 2025/05/29 作者极市干货

MaskUNet 的新方法，通过对扩散模型中的 U-Net 参数进行掩蔽，显著提升了图像生成质量。

用Veo 3+Suno做了个AI Rapper，吊打音乐节上的流量明星

下午11时 2025/05/29 作者机器之心

AI 生成的嘻哈歌手唱 rap 视频让人真假难辨，文章展示了如何使用 Suno 和 Flow Veo3 创作逼真的音乐视频。