微软开源多模态AI基础模型!13位作者12位华人,丝滑操控电脑和机器人 下午12时 2025/02/26 作者 智东西 微软研究院发布首个多模态AI agents基础模型Magma,能够理解环境、规划行动并在数字及物理空间中执行任务。它以视觉语言(VL)模型为基础,能完成从UI导航到机器人操作等各种agent任务。