每时AI - 第1133页共1580页 - 你的AI资讯助手

ICLR 2025 Ross: 多模态大模型的 MAE 时刻？

下午11时 2025/01/24 作者极市干货

本文介绍了一篇关于Reconstructive Visual Instruction Tuning (Ross)的工作，该方法通过引入视觉监督来提升多模态大模型的细粒度理解能力，并显著减少幻觉现象。该方法已成功应用于多个基准测试中，与现有技术相比表现出色。

下午11时 2025/01/24 作者极市干货

↑ 点击
蓝字
关注极市平台
作者丨科技猛兽
编辑丨极市平台
极市导读
SpinQuant 结合了可

下午11时 2025/01/24 作者 PaperWeekly

学习对齐答案和未对齐答案之间的残差，要比直接学习问题到答案之间的映射更容易。
背景
当下大语言模型（

下午11时 2025/01/24 作者 AI寒武纪

Andrej Karpathy认为OpenAI的Operator项目类似于数字世界的’人形机器人’，预言未来十年将是智能体（Agent）发展的时代。尽管存在挑战，Karpathy仍对智能体充满信心，并描述了其未来的发展蓝图。

下午11时 2025/01/24 作者机器之心

AI4S攀登者行动计划旨在解决传统研究模式的限制，推动具有重大变革潜力的下一代技术。该计划聚焦发展跨学科颠覆式创新，并通过多维度的支持体系助力科研团队加速项目实施和价值转化。

下午10时 2025/01/24 作者 GiantPandaCV

0x0. 前言
yifuwang 在 https://github.com/yifuwang/sym