美团提出首个语音交互GUI智能体,端到端语音训练能力优于传统文本训练 2025年6月19日16时 作者 量子位 美团与浙江大学联合推出GUIRoboTron-Speech,通过语音指令和截图实现端到端决策的自主GUI智能体,旨在提升用户体验。该系统解决了现有文本依赖问题,利用声纹识别技术准确区分不同用户并执行个性化任务。