AI产品千篇一律?去Google Labs,淘下一个AI爆款

上周谷歌在开发者大会展示了其新作Veo3。为了探索更多创意和科技,作者访问了Google Labs网站,发现这里藏匿着各种AI工具,如能让世界名画「唱歌」的National Gallery Mixtape等。该工具结合伦敦国家美术馆精选的世界名画进行音乐实验。

「具身科技」完成数千万元融资,即将推出首款情感机器人

四川具身科技完成数千万元天使轮融资,计划2025年底发布情感机器人产品爱湫EMO1,并与天府绛溪实验室合作研究脑机接口技术。该公司在四川省人工智能研究院支持下快速发展,已研发出首款人形机器人天行者1号。

多模态模型具备“物理推理能力”了吗?新基准揭示:表现最好的GPT-o4 mini也远不及人类!

香港大学和密歇根大学的研究人员发布首个专门面向多模态大模型物理推理能力的大规模基准测试PhyX,评估结果表明表现最好的GPT-o4 mini准确率仅为45.8%,远不及人类水平。

MiniMax开源首个视觉RL统一框架,闫俊杰领衔!推理感知两手抓,性能横扫MEGA-Bench

MiniMax提出的新框架V-Triune能够实现视觉任务的统一强化学习,通过三层组件设计和动态IoU奖励机制弥补了传统RL方法无法兼顾多重任务的空白。