智能手机屏幕截图作为输入,能够自主执行用户指定的任务AgentCPM-GUI,简易的代理框架Minion Agent

AgentCPM-GUI 是由 THUNLP 和 ModelBest 联合开发的 GUI 智能体模型;Node.js Sandbox MCP Server 用于在 Docker 容器中运行 JavaScript 代码并动态安装 npm 依赖项;Scrapling 是高性能 Python 网页抓取库,具备自适应爬取和智能元素追踪功能;Minion Agent 支持浏览器操作、MCP 和自动工具注入等功能;Matrix-Game 是一个交互式世界基础模型,拥有170亿参数,能够生成高质量的游戏世界。

阿里 MinMo 登场,多模态语音交互 “内卷” 升级!

阿里通义实验室推出的MinMo多模态大型语言模型在语音交互领域表现卓越,能够实现无缝语音交互,支持多种任务处理和多样化可控生成。其主要功能包括全双工语音交互、多样化可控生成以及多任务处理能力。应用场景涵盖智能客服、语音助理、人机对话系统及语音翻译等场景。