微软开源多模态AI基础模型!13位作者12位华人,丝滑操控电脑和机器人
微软研究院发布首个多模态AI agents基础模型Magma,能够理解环境、规划行动并在数字及物理空间中执行任务。它以视觉语言(VL)模型为基础,能完成从UI导航到机器人操作等各种agent任务。
微软研究院发布首个多模态AI agents基础模型Magma,能够理解环境、规划行动并在数字及物理空间中执行任务。它以视觉语言(VL)模型为基础,能完成从UI导航到机器人操作等各种agent任务。
作为黄仁勋CES2025严选成员之一,挪威1x发布最新产品Gamma,升级了AI和外观设计,并实现了更加自然的人类步态控制。Gamma在家庭环境中可执行多项任务并与人类互动。
腾讯元宝接入满血版DeepSeek R1 671B,网页版和移动端App均已上线。体验过程流畅无卡顿。智能回答准确、细致且附带科学依据提示。但存在信息可靠性和AI助手在资料整理可靠性上的提升空间。
摩根士丹利发布全球人形机器人产业链百强名单,覆盖驱动器、传感器等核心硬件,其中73%的公司位于亚洲,尤其在中国有45%集成商来自中国。报告还列举了大脑公司、身体公司及集成商三大模块,并预计到2050年中国人形机器人市场规模将达到6万亿元。
Neura Robotics完成9.3亿元人民币融资,该轮融资由多家机构领投,主要用于提升机器人感知和处理信息的能力。公司致力于开发认知机器人和人形机器人,在多个领域已有应用,并推出多款产品,其中4NE-1处于试验阶段。
生成式AI初创公司World Labs发布首个成果——3D世界生成模型。该模型能从单张图片生成逼真的3D场景,支持实时交互和动画效果,允许用户自由移动视角,并可与现有AI工具结合使用加速内容创作。