进步or退化: 记录Agent取代我输出的96小时

这段时间测试的 Agent 真的太多太多了,通用、办公、设计、编程、创作等等等等,

所以,完成这一大串任务需要几步人工?

在 BOSS 直聘查找50个AI 领域的程序员岗位,提取信息并生成 Excel 名单。分析这些职位所属公司的重合度,识别最常见的母公司。再提取该公司官网近一年跟AI相关的招聘岗位及描述,导出为 Excel。针对这些岗位,自动写出定制简历,并通过官网投递。

在 Fellou2.0 这个 Agent 浏览器里,

答案是1步,复制黏贴

但测试多了会有一种错觉,我更像个旁观者,而不是创作者。于是当下我的脑海里蹦出一个奇妙的想法,

AI 是不是在吞噬我的动手能力?当我把所有输出都交由 Agent 完成,本质上是在进步,还是退步?

所以我一拍脑袋,

基于 Fellou 2.0 做了四个难度级别等级的测试,来判断我对Agent的依赖风险,聊一聊这场可能影响我未来工作方式的 Agent 热潮,

Here we go!

我整理好了所有 Fellou 高阶测试任务清单 + 提示词,公众号回复「Fellou」即可获取。欢迎在评论区分享你最想让 Agent 浏览器完成的任务,我随机抽取跑通工作流提示语


 01|先说说 Fellou 是啥? 

Fellou,一款Agent 浏览器,说白了就是:

我可以发消息让它替我完成所有网页上的事情

🔗 fellou.ai

跟一般的 Agent 不一样,它是浏览器的形态,也就说是能保留多个登陆状态,原生支持切换传统搜索和 Agent 式搜索。

布局很简单,左侧搜索、右侧对话

从官方的例子上看,除了基础的3D动画、编程、信息搜索外,它能做一些非常离谱的事。

它可以当客服,将推广信息发送到各个平台,在屏幕前等着用户回复谈价;当甲方找宠物博主们推广猫粮;还可以自己去 Boss 应聘。陆续尝试了 25 个任务后,我开始怀疑人生,甚至 OpenAI 开发布会都没让我转移注意力。。。


 02|四级难度实测 

Fello2 本身是支持并发和多轮对话的,可惜的是没有回放功能,为了展示效果,我将日常零碎的任务们统一成几个大的。

先来一道信息收集+文本创作+代码生成的混合型任务热热身吧,

查找并总结 2025 年全球 AI 浏览器市场的主要参与者,结某乎、某书、某博、X等平台讨论 Fellou 这个Agent浏览器,生成分析报告,包含它们的访问量,用户分析等参数,做成可以访问的网页链接,再撰写一篇不少于6千字的《浏览器已死,Agent 浏览器已来》的科技文章,发布在 Medium 上。

这5个需求完成了4个,这里不得不额外感叹一下,现在 Agent 运行时间越来越长,之后估计分享一个 case 就要录制1小时了。

还是我来浓缩一下,首先 Fello2 这个思考过程就不太一样,会给不同的 Agent分配不同的步骤,代码生成和文章写作就交给了 code agent,信息收集和发布就给了 browser agent。

我很喜欢执行过程中看到不同色块的小框分割网页的内容,以及鼠标移动的轨迹,还有就是超快的打字输入速度。

来看看生成的网页,

跟 Deep Research 相比,我会打一个80的质量分,因为交互、信息以及图表都做的挺好的。

再来说说体验的部分缺点,

  • 有些页面需要登陆,但现在应该是没有主动通知,也没有等待环节,有时候我登陆后,它就应该去搜索其他平台了。
  • 因为网络或者大模型报错后,选择重新运行是默认所有任务都会重跑一次,所以用的时候按照轻量的2-3需求来问,体验感会更好一些

文章开头的简历投递案例还有一个离谱的变体,

在 BOSS 直聘上找到最新发布的前端工程师的岗位,结合对应的岗位描述和我上传的简历内容写一段自我介绍,并通过“立即沟通”将自我介绍发送给招聘者。发送10次。

是真的真的把信息发出去了,

前些年吹的一天投递世界500强的牛圆回来了。

当然作为一个Agent浏览器,我会自然将它看齐到通用Agent的高度,理论上可以访问网页,准确完成点击、滑动、填写等操作的话,

做个设计啥的,应该不难吧。

搜索尤溪县的建筑风格、文化和形象,帮我做一个 logo,文字:尤溪县城市文旅,元素包含朱熹的形象,金柑的造型,八山一水一分田的山水风光形象,最好的是一个元素里体现三个意思。元素要少,避免复杂像徽章,背景白色扁平简洁。中文的占比是 2x,英文是 1x,图形是 6x。颜色严格控制在 2 色以内,矢量,扁平,美观,产出 10 个陈幼坚的设计风格,其中一个要有 尤溪县 的文化底蕴和形象在其中,另外一个要有刘伯温故居的 logo 设计风格,再有一个把朱熹的头像融入进去。

甚至Fellou还能充当 RPA 版人工客服,24小时自动回复的case,遗憾的是我实际并没有对应的使用场景,这里放官方的地址来欣看看:

跨境电商监控谈价任务:监控 SalesSmartly,回答用户的问题,引导用户完成下单,当用户询问价格的时候,按价格表给到报价,当用户询问物流时间的时候,根据物流时间表给到预计的配送时间,当用户砍价的时候,不能低于我们的底价,预计低价持续的和用户沟通,用户确认订单后立刻生成一个下单的 csv 表(包含:商品名称 + 商品数量 + 商品的单价)。
找到X/ins/YT/抖上分别找到粉丝数量在 10k+ 的 20 个宠物博主,同时私信询问她们是否可以合作推广 A 品牌猫粮。把博主信息整理成网页报告.


 03|“我”还在思考吗? 

Fellou,也可以代指 Agent 们,

在它们高度聚合的工作流,以及超长的思考过程里,我开始选择性忽视中间的过程。

我开始有点慌。

因为我已经想不起“我是怎么完成这些事的”,甚至要再现同样的结果的时候,需要先去找当时历史记录的提示语,哪怕只是简单的几句话。

以前写稿要翻文献、做卡片笔记、串联关键词。现在?Agent帮我检索、判断正确与否、输出结论。

路径感,消失了。

等于把我的“学习过程”给隐性删除了。

这,值得吗?

我意识到,自己进入了“Agent 依赖态”,

所以这篇文章成型前,我给自己留了一天,把AI们关掉,

重新回到3年前的原始搜索,

结果就是,写稿前没有自动梳理的信息源,一篇篇看重复的信息,像在深不见底的大海捞一根针一样,

我在做这个搜索的过程中努力的在问自己,我想要什么,哪些信息是重要的,哪些信息是无聊的不需要的,

我在持续思考,反复询问自己,

像今天的AI一样

于是,我重新划分了角色定位:

我不再手动操作,但我可以定义“我要抵达哪里”。

省略掉的这部分思考过程,

到底是进步,还是退化?

我们能不能拥有一个人类 + Agent 的新模式?

答案是:能,

但前提是我们还在提问,我们还在思考,

我们还知道“为什么”比“是什么”更重要。


 写在最后 

Fellou 给我的震撼不只是工具层面的,

它逼着我重新审视“创作”这件事。

当你拥有一个全天候不抱怨不疲惫、能并行跑20个网页任务的浏览器助手,

你就会面临一个问题:

我还在主动参与这个世界吗?

还是只是扮演了一个“发布器”的角色?

我不知道答案是什么,但我愿意尝试一种新的方式:

我发问,它工作。

它执行,我判断。

我和 Agent 一起,

完成我一个人无法完成的结构化认知。

这,不是让渡能力。

Agent 浏览器,不是替代品,是放大器。

真正的边界,是你有没有继续思考。

我思,故我在。


@ 作者 / 卡尔@ 动手学AI知识库 / learnprompt.pro


(文:卡尔的AI沃茨)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往