
最近 Manus、Flowith、GPT-4o 等产品的爆火,又引发了大家对 Agent 的热烈讨论。
一种观点认为 Workflow 会限制模型能力,真正的 Agent 不应该是预设好的 Agentic Workflow。其本身的各种能力,应该是模型自然演化出来的。DeepResearch 的研究员、Kimi 的研究员以及 Manus 团队都是这个观点:Less Structure, More Intelligence.
那么搭建 Workflow 的框架,以及相关无代码平台(例如扣子、ComyfUI)是否就没有太大价值了?
Workflow 是否还有它独特的意义?
Agent 应该走向通用还是垂直?
Agent 的未来将如何发展?
针对这一当下从业者最关心的问题,特工们自己,以及邀请了一些好朋友分享了各自的观点,让我们一起来看看相关从业者、研究员都在如何思考这个问题。
注:如果你对此也有独到的看法,欢迎写在评论区或给特工少女留言,我们遴选后会放在该系列的第二期~
偏向通用 Agent 的观点
lokinko,Agent 工程师:“The wider the base, the taller the spire.” 我认为相似的趋势已经在 LLM 领域上演过一次。Transformer 出世前,NLP 还在研究机器翻译、情感分析、智能问答等非常多细分领域,各类专家系统、网络结构层出不穷,针对每个任务构建专门的架构和 Workflow,但是随着而来的 GPT 横扫了几乎所有榜单,统一了整个 NLP 领域。
即使是 GPT 时代的两三年里,我们看到海量基于 ChatGPT 的「领域模型」爆发出虚假的业务繁荣,随后的 Deepseek 又重构了这一切。Agent 领域目前还远没达到成熟,正像期盼着 ChatGPT 时刻一样,我们正在等待着 Agent Fundation Model 的出现,急忙的在半成品上追求「专精」的后果一定是打上很多补丁、用上很多专业领域的工具与知识库再加上手工 template 与 prompt 去维系脆弱的可靠性,这何尝不是一种 reward hacking 呢?
调研过如 Magentic-One,Manus 和 CAMEL 这些智能体框架后可以发现,当前 Orchestrator 做任务分解和编排的能力非常有限,通用工具如 Browser use,File tool 和 Code interpreter 等的工具也并不充分,Function Calling 的能力还并不稳定和准确。可能垂域应用听起来会有很不错的想象空间,但是垂域产品导向的研究非常容易就将技术路线引入「定制化」、「模板化」的 reward hacking 路线上,毕竟给个合适的 template,模型也能执行下去,但对于 long horizon 的情况就不可控咯,众所周知的「指数魔力」0.95 的五次方 = 0.77, 0.95 的五十次方 = 0.07,基于这个稳定性下尝试解决复杂需求的产品,没有任何的意义。
对于研究者来说,当务之急就是提升 Agent Fundation Model 的能力,而非钻到垂域任务去做产品,Manus 团队在爆火后的第一个新闻就是与千问团队合作,而千问团队是国内最好的开源 Fundation Model 的团队之一。优秀的通用智能体框架与通用工具的组合,能非常迅速落地到各种业务场景中,省去 workflow 里手工定义的部分,等能力成熟后,各类产品的使用体验与现在的水平一定是断代的差距。不然,有谁还记得 Midjourney?
Derek Nee – flowith CEO、产品经理:即便到了 2025 的 Q2,目前所有的 Agent 产品(不管是 Manus、OpenAI 还是 flowith 的产品)均处于非常早期的阶段,近期发布的 Agent 产品都还有很强的更早产品的影子(如 AutoGPT、Devin AI、Operator、Deep Research 等等),还没有太多新的东西。flowith 是在 2024 年年中开始搭建我们自己的 Agent 框架和系统,并在 8 月份就上线了用户可以直接、稳定、高效使用的 Agent 功能 ORACLE,而我们为什么要这么早做 Agent (在去年那个节点 O1、R1 等模型都仍未面世、AutoGPT 也很久未被关注了)、而不是做工作流的原因 — 就是因为我们较早的意识到了在通用场景下,让人搭建 AI 工作流是一个很原始的过渡方案,在未来,AI 完全可以代替人来自适应地搭建工作流、调用工具、管理上下文等等,不需要人来做这些事情。
不过我觉得需要明确的是,Agent 不等于通用、而 Workflow 通常代表垂直,短期来看 Workflow 不会立刻被通用 Agent 替代,因为通用 Agent 想有质的飞跃要难很多,更何况通用 Agent 的终局可能就是 AGI 了,这可能不是所有人的机会。而搭建垂直的 AI 工作流,并把它应用在各类已有的垂直场景中,可能是大部分人的机会,因为它的性价比、速度和可控性依然有优势,而且比通用 Agent 更好集成。Coze 和 ComfyUI 类产品,很快也会有一些 Agent 能力,两者在后续会相互交融。
缱绻怡然,Agent 研究员:首先我觉得应该是 More Intelligence,Less Structure. 如果是一个很聪明的人,我会愿意把需求告诉他直接让他来做,他完成的方式方法和效率可能是出乎意料的。但如果是不太聪明的没接触过的,为保证效果,就得一步步预设指引好。
通用,啥都能干的 Agent 听起来很酷,就像人类社会里的全能通才一样让人着迷,但解决行业痛点问题还是得看懂行的专才。看到小红书的一个帖子说“别再吹通用 Agent 了,其实业务都是 Workflow”,下面有个很有趣的评论是“落地都是 Workflow,3D 打印再通用也抢不了流水线的饭碗”。
所以我觉得这件事可以分 toC/toB 来看,toB 更需要流水线式稳定的 Workflow,toC 用更通用的 Agent 用户容忍度最高,能解锁的玩法和创意会更多一些。
尹伯昊,猴子无限创始人:工作流还会至少为人类健康工作五十年。一个暴论是,在不再需要用户手动配置和查看工作流的前提下,未来 95% 的 AI 能力仍还是以工作流的形式做交付。
以下是三个工作流比智能体更合适的场景,其中第三个最被低估且最为重要:
1️⃣ 确定性需求:人类没有那么多高难度任务,大部分任务中的模型都是智能过剩的,相比因为模型的过度智能而带来的潜在多样性,通过工作流快速激发最必要的领域能力是更合适的。
2️⃣ 需要低成本和短时间完成运行的需求:用户只需要支付真正的生成模块的 token 和占用对应的时间,而无需推理过程的 token 和占用的时间;从这个角度看,工作流是智能体推理过程的数据结构缓存。
3️⃣ 大规模产生高鲁棒性的合成数据的需求:模型能力不是凭空产生的,通过不可 scaling 的小模型和工程方法实现特定任务 SOTA,然后将数据供给给大模型,是某种程度的“反向蒸馏”,通过在每个任务中完成“反向蒸馏”,大模型才能实现有效的能力提升。
特工鲸鱼,特工宇宙学术负责人:传统定义下的 Workflow 没有任何 LLM(Agent) 参与,而我们期望的 Agent 最终形态是没有任何 Workflow 的完全自由的 Agent,但这个最终 Agent 的形态可能还没有很成熟。很多人可能会说,现在有很多 Agent 是没有定义 Workflow,但其实我们不难发现,很多内置的 Prompt 其实充当了“软性”的 Workflow,什么时候该做什么,什么情况思考什么,这些人类沉淀下的规则被放到 Prompt 中,人为地决定 Agent 的行为。不过即使抛开这种情况,现在大部分可用于生产环境的 Agent 系统也是 Agent+Workflow 的组合,可能是 Workflow 里有 Agent,也可能是 Agent 里有 Workflow。
Agent 不是目的,Workflow 也不是妥协。用户只关心最后到手的质量,不关心中间是怎么做的。所以如果某个场景用 Agent+Workflow 的搭配本身最稳定也效果足够好,就完全没必要用纯粹的 Agent,毕竟大多数的场景下我们需要的是 Workflow 的“执行”而非 Agent 的“探索”。
特工阿尔法,Alpha4AGI:未来的模型,会是“通用做底座,垂直做闭环”相辅相成的渐进过程。随着 MCP 思想逐渐成型,Tooling 成为核心能力——如何选工具、如何理解反馈、如何设计多步调用中的容错策略,将决定模型的实际表现。可预见的,若要 Agent 真正落地,每个垂类都应出现自己的 Toolchain,以代替每个行业重复的 Workflow。
当然,垂域标准化的 Tool usage,也只会是这场 「Agentic 演化」的起点。只有当大模型通过足够的经验积累和推理训练,内化出“自主生成 & 高效调度” Agents 的能力时,属于 AI 时代的产品形态才会浮出水面——而我相信这都不会太远,现在或许是“学习 AI,畅想变化,拥抱时代”的最佳时间点。
吕昭波,AI 架构师:模型能力愈发强大,之前通过 Workflow 编排才能实现的能力现在逐步通过模型本身就能实现,无独有偶,DeepSeek 也逐渐吸收了 Prompt,对 Prompt 工程的要求变低。
我的观点是模型会越来越强大,会逐渐吞噬原来 Workflow 中提供的部分能力,但模型需要原子化能力,将所有应用场景中的方案封装为黑盒能力也不现实,所以从上层应用到底层模型之前会有路径也需要解藕,所以还是会需要 Workflow 来串联各种数据&定制化能力等等,只不过 Workflow 也会演进、并非现在的形式。
从应用视角来看,重点需要关注的是上层应用是否匹配需求、解决现在的痛点问题,在这个视角的观点会弱化底层模型能力、中间 Workflow 能力,模型能力和中间 Workflow 的能力边界会变得模糊。
特工十五,特工宇宙产品负责人:用户并不关心产品背后是由强大的大模型自主调用工具,还是工程师搭建的 Workflow,只关心是否开箱即用、需求是否被及时响应和满足。就像我们使用抖音、淘宝、美团时,不会在意背后的技术实现,因为一切都直觉且自然。
而用户与 AI 的交互任务大致分为两类:
-
增强型任务:如研究、学习,LLM 作为决策者,自主规划路径;
-
自动化任务:如流程执行,LLM 作为消息处理节点,按预设路径完成任务。
-
问题小、重复度高 → Workflow 更高效;
-
问题复杂、变量多 → Agent 更灵活健壮。
所以在设计 AI 产品时,首先考虑的是用户上手门槛和 LLM 系统的响应时间,其次才是 Agent 还是 Workflow,
比如以下几点:
-
在 AI 产品中,任务是否复杂到需要 Agent 的适应性决策,还是 Workflow 的确定性方法就足够?
-
更简单的 AI 工具是否能达到相同效果?
-
Workflow 是否涉及不确定性或多步推理,Agent 是否更适合?
-
赋予 Agent 自主性是否带来风险,能否控制?
特工少女,特工宇宙内容运营:Workflow 是一个脚手架,随着模型能力的提升,这个脚手架可能会逐渐被拆除。至于“搭建 Workflow 平台有没有价值”,我觉得取决于时间尺度,五年内还是非常有价值的,尤其是对于工程化落地。
在模型能力尚未成熟前,Workflow 是实现复杂目标的实用方案。很多实际应用场景(如自动化客服、数据分析)更看重稳定性和可控性,而非模型的“自由度”。Workflow 和 Agent 的发展不是对立的,Workflow 的设计经验可以反哺模型训练,形成正反馈。
特工女巫,特工宇宙编辑,某厂 AI 产品经理:从行业发展整体来看,未来有了更智能的基础大模型,会让 Agent 有更强的自主性,能力上具备不需要 Workflow 的条件。这样 Intelligence 升级的模型,应该也是 AI 从业者希望看到的,将减少 Workflow 编排、Prompt 写作的人工开发成本,进一步降低使用门槛,技术普惠给大众。
从实际生产需求出发,如果将 Agent 的目标比为更接近人,现在在人类社会中,有通用自主灵活的做事方式,有严谨规范流程化的做事方式,所以还是取决于具体需求目标。
比如要在企业内应用 Agent,工作本身就存在 SOP,信息在人员部门间随各项事务流转,并且办公生产环境对结果严谨性要求相对更高,让有人为干预定义的 Agentic Workflow 融入,是更合适的选择。
而在日常生活、学习探索中,这类场景需要执行的任务相对灵活、自由、开放,对结果的多样性和容错度相对更高,也需要更普适更易操作,那么 Autonomous Agent 是更值得期待的。
特工小帅,特工宇宙运营助理:通用与垂直的争辩,可以类比成人类社会历史上已经存在的议题。 以史为鉴 ,可以知未来。在工业革命早期,很多工厂使用通用的蒸汽机驱动各种机器, 但随着工业化深入,越来越多的行业开始使用针对特定任务的蒸汽机。工业革命初期依赖通用机器,但最终行业发展需要垂直优化的专业设备。这意味着 AI 可能也是先通用赋能,后垂直优化的路线。
再从人才培养的角度来看,通用 AI 就像通才,可以做各种事情但未必精通。垂直 AI 就像专才,在特定领域内更具竞争力。从一个人才的成长路径来看,大多数人是先接受通识教育,再逐渐走向专业化。这意味着 AI 可能也是先有通用智能,后有针对具体行业的深度优化。
通用和垂直方向各有价值。不过或许垂直方向的 Agent 更易率先商业化。通用系统往往更依赖大科技公司路径更长的变现模式(比如广告模式),而垂直优化的 Agent 容易找到精准用户并形成可持续的商业模式(如医疗 AI、法律 AI)。
从产品策略来看,短期可以优先做垂直 AI,找到一个高价值、刚需的场景切入(如 AI 创作助手、AI 求职助手)。长期再从垂直走向通用,当数据、用户积累到一定程度时,可以扩展成更通用的智能体,从一个垂直细分的需求适当延伸到用户更加多元的需求。


(文:特工宇宙)