2025年5月10日16时 - 第3页共6页

Harmon：协调视觉表征，统一多模态理解和生成（模型已开源）

2025年5月10日16时作者机器之心

吴思泽博士生提出Harmon模型，通过统一多模态表征促进图像理解和生成。其框架包括共享MAR编码器和三阶段训练策略，在理解与生成任务中均取得显著效果，并优于现有统一模型。

2025年5月10日16时作者量子位

阶跃星辰表示将继续坚持基础大模型研发，并强调多模态理解生成一体化的重要性。公司已发布22款基座模型，其中16款为多模态模型。姜大昕解释称，多模态理解生成一体化意味着用一个模型同时完成理解和生成任务，而非三段式过程。他认为这需要更强的综合实力，目前在语言和视觉领域的理解生成一体化研究进展正积极推进。

2025年5月10日16时作者 Z Potentials

开始，但我们认为，
过去三年一直支撑经济增长和就业的两个领域
——
高端消费和政府部门，最终也在出现

2025年5月10日16时作者新智元

I。这一次，它真正学会了主动思考，搜商直接爆表！
你有没有这种感受，现在的AI搜索真的又快又方便，但

2025年5月10日16时作者量子位

上海张江的傅利叶机器人宣布未来十年将聚焦康养场景，推出具备温度交互、生动理解与主动执行能力的人形机器人，并发布小尺寸人形机器人Fourier N1。公司已进驻全球3000多家终端医院，提供包括康复治疗和人体运动量化研究在内的多种服务。

2025年5月10日16时作者机器之心

OpenAI 研究科学家 Dan Roberts 在 AI Ascent 上介绍了强化学习和预训练的进步，预测未来 AI 模型将在测试时间扩展方面发挥更大作用，并希望模型能在科学前沿做出重大贡献。他强调需要大规模扩展计算和科学，目标是在 2034 年使 AI 能够进行长达 8 小时的计算与思考。

2025年5月10日16时作者新智元

政府呼吁：一定要放开监管，过早设定标准，对美国AI将是一场灾难！另外他还透露，OpenAI第一个开源

2025年5月10日16时作者机器之心

验室联合领导人、OpenAI 的首位实习生，最近在红杉资本主办的 AI Ascent 上做了一场 1

2025年5月10日14时作者老刘说NLP

否思考方案，从基本逻辑出发看看Qwen3的混合推理的根本实现机制以及如何通过外挂分类器来实现自我决断