ICLR 2025 Ross: 多模态大模型的 MAE 时刻?

本文介绍了一篇关于Reconstructive Visual Instruction Tuning (Ross)的工作,该方法通过引入视觉监督来提升多模态大模型的细粒度理解能力,并显著减少幻觉现象。该方法已成功应用于多个基准测试中,与现有技术相比表现出色。

Andrej Karpathy泼冷水:智能体爆发并非近在眼前,还需十年

Andrej Karpathy认为OpenAI的Operator项目类似于数字世界的’人形机器人’,预言未来十年将是智能体(Agent)发展的时代。尽管存在挑战,Karpathy仍对智能体充满信心,并描述了其未来的发展蓝图。

AI革新科研模式,上海AI Lab「AI4S攀登者行动计划」开放申请

AI4S攀登者行动计划旨在解决传统研究模式的限制,推动具有重大变革潜力的下一代技术。该计划聚焦发展跨学科颠覆式创新,并通过多维度的支持体系助力科研团队加速项目实施和价值转化。

Meta首席科学家LeCun:新一代AI架构3到5年内问世 机器人技术是核心

Meta首席AI科学家Yann LeCun预测未来几年内将出现新的AI架构范式,并认为机器人技术可能成为下一波AI应用的核心。他指出当前的生成式AI和大型语言模型(LLMs)寿命较短且存在不足,如缺乏对物理世界的理解、持久记忆、推理能力和复杂规划能力。