ICLR 2025 自动化所、旷视等提出Ross,多模态大模型的MAE时刻来了?

本文介绍了一篇关于多模态大模型的研究论文《Reconstructive Visual Instruction Tuning》,提出通过重建输入图像作为监督信号来提升视觉部分的学习效果,显著提高模型的细粒度理解能力,并且代码已开源。

“洋悟运动”+“深海巨鲸”:当世界开始仰望中国制造!

木易创建了‘AI信息Gap’公众号,专注于分享AI知识。2025年1月,小红书因用户激增和TikTok禁令引发流量爆发,并被网友戏称为‘洋悟运动’。DeepSeek发布新模型后引起广泛关注并决定开源。文章认为这体现了中国科技的崛起与开放精神。