GUI Agent
通用 Agent 向左,Agentic Browser 向右
Fellou 是全球首个 Agentic Browser,专注于浏览器内的人机协同环境。它支持跨平台搜索、跨网页任务执行和智能感知浏览器环境等功能。尽管存在上手门槛高和执行速度慢等问题,但其GUI Agent技术已达到行业领先水平。
字节、清华开源UI-TARS:像人一样操控电脑的端到端Agent
国产大模型一周动态回顾,包括新发布的UI-TARS GUI Agent模型,这是一个集成了视觉语言模型的原生GUI代理系统,旨在实现端到端任务自动化。