通用 Agent 向左,Agentic Browser 向右

“没有人相信的事物,才不会有那么多的竞争。”
由于 Agent 和 MCP 的爆火,整个四月都处于一种非常繁忙的状态,学习、测评、分享…以至于 Fellou 团队邀请我们前往北京线下发布会,也未能抽出身。
我们此前曾深度测试过 Fellou 团队开源的 Eko 框架,也跟 Fellou 创始人谢扬有许多共同好友,不过和他本人交流较少。
在我的印象里,谢扬非常符合我认为的投资人眼里的“小天才”形象:13 岁开始编程,长期专注于云计算、身份认证、AI 等领域,入选福布斯亚洲 30 Under 30,早年曾任字节跳动核心技术人员,阿里云 MVP,连续创业者…
最近 Fellou 发布后,又从许多朋友那儿,包括王登科的文章中,看到了谢扬和 Fellou 背后更加丰盈的创业故事和理念。
五一假期终于得空,深度体验了下 Fellou,下面是我的一些体验和理解。
很多人会拿 Manus 来对比,尽管解决的都是一些通用任务,技术实现方式也很相近,但在我看来 Manus 和 Fellou 走的是不同的两条路。
Manus 是全球首个通用 Agent,Genspark 和扣子空间等是这个方向;Fellou 是全球首个 Agentic Browser,Dia 和 Browser Operator 等是这个方向。
Manus 团队此前的分享中,有三条结论让我印象深刻。
1. AI 浏览器不是在浏览器里加 AI,而是做给 AI 用的浏览器;
2. 操作 GUI 不应该抢夺用户的控制权,而是让 AI 有自己的虚拟机;
3. Attention 不是 all you need,解放用户的 Attention 才能重新定义 DAU。
Manus 专注的是做 Agent 本身,做浏览器不过也只是为了给 Agent 配了个工具,本质上是为了让 Agent 更好的完成任务,正如官网 slogan 所说:“在你安心休息的同时,一切都能妥善完成。”
Manus 和 Fellou 都做了 Browser、Agent、Workflow 这几件事情,其中 Manus 把 Browser 和 Workflow 作为 Agent 执行 Action 的工具。
而 Fellou 的产品故事会更宏大一些,做的是下一代智能的浏览器,更准确的说,是基于浏览器的全新系统。更详细来说,是融合了各种 Agent 和 Workflow 的 AI 能力,构建于浏览器之上的人机协同的新环境。
全球每个月有超过 50 亿人在使用浏览器,并且深入我们生活各处。我们很难去颠覆掉这种用户习惯,但可以用 AI 去重塑浏览器,Fellou 做的就是这样一件事情。
最近看到一些人吹捧 Dia 浏览器,着实觉得有些尴尬。
我们在 Dia 刚刚内测时就进行了体验,现在版本功能跟装个 Monica 插件体验差距不大,产品完成度不如豆包浏览器。
不是说 Dia 不好,而官网视频里介绍的真正厉害的 Agentic 功能,还只是期货没有上线。但 Fellou 先做了出来。
目前核心功能包括:
1. 跨平台深度搜索
在侧边栏 Agent 会进行任务拆解和规划,待你确认后即可进行并行批量搜索,大大加快了研究速度,并且可生成可共享的可视化报告网页。
其中 Fellou 研发了一个 Shadow window(影子窗口),即给 Agent 的虚拟工作环境。在 Search 任务下触发,不会影响用户其他操作。
Deep Search 功能比较常规,但得益于 Shadow window,Fellou 既可以像 Genspark 那样快速的并行搜索,又能像 Manus 那样访问许多需要登陆网站账号才能进行的操作。
最后也可以将报告生成永久链接进行分享。
2. 跨网页执行任务
Fellou 做了 GUI Agent,可以自动规划任务、调用工具并执行操作,从而协调多个 Web 界面内功能,实现各种浏览器内的任务。包括购物、预约会议、发送电子邮件和发布文章等。
比如让它上小红书给「特工少女」最近的更新内容点个赞,Fellou 精准的实现了这一需求。
此外,Fellou 官方还给出了许多 showcase,包括打开亚马逊将商品添加到购物车、打开 Linkedin 发布文章等等。
https://fellou.ai/blog/post/fellou-introduction/
3. 智能感知浏览器环境
Fellou 可以在对话过程中自动识别打开的网页作为上下文。还允许用户通过@标记来比较和分析多个网页。
此外,用户可以将图片直接拖放到聊天窗口中,无需复制粘贴,从而实现无缝交互。
4. 支持异步操作
Fellou Agent 执行分配的任务时,用户可以在底部切换标签组以继续处理其他任务。
说实话,Fellou 不是完美的。
首先,上手门槛还挺高的,对于从来没用过 AI 浏览器的用户来说肯定是懵的。
开局一个搜索框,剩下全靠自己折腾。
什么时候会操作影子空间?什么时候会调用本地浏览器?什么时候会基于现有网页内容来回答?很多功能我们也是体验了很久才摸清。
Fellou 不能像 Dia 一样无缝同步现有浏览器的 Cookie 数据,各个网站还需要手动登录有些麻烦。此外,Fellou 能力很强,就是很多任务执行的很慢…
Agentic Browser 用户体验不佳?现在下结论还为时尚早。
事实上,Fellou 做的 GUI Agent 已经是行业领先水平,此前开源的 Eko 框架也是在业内饱受好评。整一个 Agentic Browser 的发展还处于早期,与其急于评判,不如共同期待这场浏览器范式转变中的更多可能。无论是 Fellou 还是 Dia,官方都已经预告了后续更加智能的能力,可以一起期待一下。

BTW,创始人谢扬本周六在奇绩创坛有个关于 Agentic System 的分享,如果想了解 Fellou 背后故事的可以报名。
最后,我们也向 Fellou 团队要来了 100 个邀请码。如果对 Fellou 感兴趣的粉丝可以加入我们新的 Agent 交流群,每天会给大家发放一些~

(文:特工宇宙)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往