Agent or Workflow？通用 or 垂直？丨第一期

最近 Manus、Flowith、GPT-4o 等产品的爆火，又引发了大家对 Agent 的热烈讨论。

一种观点认为 Workflow 会限制模型能力，真正的 Agent 不应该是预设好的 Agentic Workflow。其本身的各种能力，应该是模型自然演化出来的。DeepResearch 的研究员、Kimi 的研究员以及 Manus 团队都是这个观点：Less Structure, More Intelligence.

那么搭建 Workflow 的框架，以及相关无代码平台（例如扣子、ComyfUI）是否就没有太大价值了？

其中：

Workflow：通过预选定义好相关代码路径，来编排大模型和工具的系统。

Agent：由大模型动态规划自身处理流程和工具使用，并能够自主控制如何完成任务的系统。

Workflow 是否还有它独特的意义？

Agent 应该走向通用还是垂直？

Agent 的未来将如何发展？

针对这一当下从业者最关心的问题，特工们自己，以及邀请了一些好朋友分享了各自的观点，让我们一起来看看相关从业者、研究员都在如何思考这个问题。

注：如果你对此也有独到的看法，欢迎写在评论区或给特工少女留言，我们遴选后会放在该系列的第二期～

偏向通用 Agent 的观点

lokinko，Agent 工程师：“The wider the base, the taller the spire.” 我认为相似的趋势已经在 LLM 领域上演过一次。Transformer 出世前，NLP 还在研究机器翻译、情感分析、智能问答等非常多细分领域，各类专家系统、网络结构层出不穷，针对每个任务构建专门的架构和 Workflow，但是随着而来的 GPT 横扫了几乎所有榜单，统一了整个 NLP 领域。

即使是 GPT 时代的两三年里，我们看到海量基于 ChatGPT 的「领域模型」爆发出虚假的业务繁荣，随后的 Deepseek 又重构了这一切。Agent 领域目前还远没达到成熟，正像期盼着 ChatGPT 时刻一样，我们正在等待着 Agent Fundation Model 的出现，急忙的在半成品上追求「专精」的后果一定是打上很多补丁、用上很多专业领域的工具与知识库再加上手工 template 与 prompt 去维系脆弱的可靠性，这何尝不是一种 reward hacking 呢？

调研过如 Magentic-One，Manus 和 CAMEL 这些智能体框架后可以发现，当前 Orchestrator 做任务分解和编排的能力非常有限，通用工具如 Browser use，File tool 和 Code interpreter 等的工具也并不充分，Function Calling 的能力还并不稳定和准确。可能垂域应用听起来会有很不错的想象空间，但是垂域产品导向的研究非常容易就将技术路线引入「定制化」、「模板化」的 reward hacking 路线上，毕竟给个合适的 template，模型也能执行下去，但对于 long horizon 的情况就不可控咯，众所周知的「指数魔力」0.95 的五次方 = 0.77, 0.95 的五十次方 = 0.07，基于这个稳定性下尝试解决复杂需求的产品，没有任何的意义。

对于研究者来说，当务之急就是提升 Agent Fundation Model 的能力，而非钻到垂域任务去做产品，Manus 团队在爆火后的第一个新闻就是与千问团队合作，而千问团队是国内最好的开源 Fundation Model 的团队之一。优秀的通用智能体框架与通用工具的组合，能非常迅速落地到各种业务场景中，省去 workflow 里手工定义的部分，等能力成熟后，各类产品的使用体验与现在的水平一定是断代的差距。不然，有谁还记得 Midjourney？

Derek Nee – flowith CEO、产品经理：即便到了 2025 的 Q2，目前所有的 Agent 产品（不管是 Manus、OpenAI 还是 flowith 的产品）均处于非常早期的阶段，近期发布的 Agent 产品都还有很强的更早产品的影子（如 AutoGPT、Devin AI、Operator、Deep Research 等等），还没有太多新的东西。flowith 是在 2024 年年中开始搭建我们自己的 Agent 框架和系统，并在 8 月份就上线了用户可以直接、稳定、高效使用的 Agent 功能 ORACLE，而我们为什么要这么早做 Agent （在去年那个节点 O1、R1 等模型都仍未面世、AutoGPT 也很久未被关注了）、而不是做工作流的原因 — 就是因为我们较早的意识到了在通用场景下，让人搭建 AI 工作流是一个很原始的过渡方案，在未来，AI 完全可以代替人来自适应地搭建工作流、调用工具、管理上下文等等，不需要人来做这些事情。

不过我觉得需要明确的是，Agent 不等于通用、而 Workflow 通常代表垂直，短期来看 Workflow 不会立刻被通用 Agent 替代，因为通用 Agent 想有质的飞跃要难很多，更何况通用 Agent 的终局可能就是 AGI 了，这可能不是所有人的机会。而搭建垂直的 AI 工作流，并把它应用在各类已有的垂直场景中，可能是大部分人的机会，因为它的性价比、速度和可控性依然有优势，而且比通用 Agent 更好集成。Coze 和 ComfyUI 类产品，很快也会有一些 Agent 能力，两者在后续会相互交融。

倾向 Workflow 的观点

缱绻怡然，Agent 研究员：首先我觉得应该是 More Intelligence，Less Structure. 如果是一个很聪明的人，我会愿意把需求告诉他直接让他来做，他完成的方式方法和效率可能是出乎意料的。但如果是不太聪明的没接触过的，为保证效果，就得一步步预设指引好。

通用，啥都能干的 Agent 听起来很酷，就像人类社会里的全能通才一样让人着迷，但解决行业痛点问题还是得看懂行的专才。看到小红书的一个帖子说“别再吹通用 Agent 了，其实业务都是 Workflow”，下面有个很有趣的评论是“落地都是 Workflow，3D 打印再通用也抢不了流水线的饭碗”。

所以我觉得这件事可以分 toC/toB 来看，toB 更需要流水线式稳定的 Workflow，toC 用更通用的 Agent 用户容忍度最高，能解锁的玩法和创意会更多一些。

尹伯昊，猴子无限创始人：工作流还会至少为人类健康工作五十年。一个暴论是，在不再需要用户手动配置和查看工作流的前提下，未来 95% 的 AI 能力仍还是以工作流的形式做交付。

以下是三个工作流比智能体更合适的场景，其中第三个最被低估且最为重要：

1️⃣ 确定性需求：人类没有那么多高难度任务，大部分任务中的模型都是智能过剩的，相比因为模型的过度智能而带来的潜在多样性，通过工作流快速激发最必要的领域能力是更合适的。

2️⃣ 需要低成本和短时间完成运行的需求：用户只需要支付真正的生成模块的 token 和占用对应的时间，而无需推理过程的 token 和占用的时间；从这个角度看，工作流是智能体推理过程的数据结构缓存。

3️⃣ 大规模产生高鲁棒性的合成数据的需求：模型能力不是凭空产生的，通过不可 scaling 的小模型和工程方法实现特定任务 SOTA，然后将数据供给给大模型，是某种程度的“反向蒸馏”，通过在每个任务中完成“反向蒸馏”，大模型才能实现有效的能力提升。

其他偏中庸的观点

特工鲸鱼，特工宇宙学术负责人：传统定义下的 Workflow 没有任何 LLM（Agent) 参与，而我们期望的 Agent 最终形态是没有任何 Workflow 的完全自由的 Agent，但这个最终 Agent 的形态可能还没有很成熟。很多人可能会说，现在有很多 Agent 是没有定义 Workflow，但其实我们不难发现，很多内置的 Prompt 其实充当了“软性”的 Workflow，什么时候该做什么，什么情况思考什么，这些人类沉淀下的规则被放到 Prompt 中，人为地决定 Agent 的行为。不过即使抛开这种情况，现在大部分可用于生产环境的 Agent 系统也是 Agent+Workflow 的组合，可能是 Workflow 里有 Agent，也可能是 Agent 里有 Workflow。

Agent 不是目的，Workflow 也不是妥协。用户只关心最后到手的质量，不关心中间是怎么做的。所以如果某个场景用 Agent+Workflow 的搭配本身最稳定也效果足够好，就完全没必要用纯粹的 Agent，毕竟大多数的场景下我们需要的是 Workflow 的“执行”而非 Agent 的“探索”。

特工阿尔法，Alpha4AGI：未来的模型，会是“通用做底座，垂直做闭环”相辅相成的渐进过程。随着 MCP 思想逐渐成型，Tooling 成为核心能力——如何选工具、如何理解反馈、如何设计多步调用中的容错策略，将决定模型的实际表现。可预见的，若要 Agent 真正落地，每个垂类都应出现自己的 Toolchain，以代替每个行业重复的 Workflow。

当然，垂域标准化的 Tool usage，也只会是这场「Agentic 演化」的起点。只有当大模型通过足够的经验积累和推理训练，内化出“自主生成 & 高效调度” Agents 的能力时，属于 AI 时代的产品形态才会浮出水面——而我相信这都不会太远，现在或许是“学习 AI，畅想变化，拥抱时代”的最佳时间点。

吕昭波，AI 架构师：模型能力愈发强大，之前通过 Workflow 编排才能实现的能力现在逐步通过模型本身就能实现，无独有偶，DeepSeek 也逐渐吸收了 Prompt，对 Prompt 工程的要求变低。

我的观点是模型会越来越强大，会逐渐吞噬原来 Workflow 中提供的部分能力，但模型需要原子化能力，将所有应用场景中的方案封装为黑盒能力也不现实，所以从上层应用到底层模型之前会有路径也需要解藕，所以还是会需要 Workflow 来串联各种数据&定制化能力等等，只不过 Workflow 也会演进、并非现在的形式。

从应用视角来看，重点需要关注的是上层应用是否匹配需求、解决现在的痛点问题，在这个视角的观点会弱化底层模型能力、中间 Workflow 能力，模型能力和中间 Workflow 的能力边界会变得模糊。

特工十五，特工宇宙产品负责人：用户并不关心产品背后是由强大的大模型自主调用工具，还是工程师搭建的 Workflow，只关心是否开箱即用、需求是否被及时响应和满足。就像我们使用抖音、淘宝、美团时，不会在意背后的技术实现，因为一切都直觉且自然。

而用户与 AI 的交互任务大致分为两类：

增强型任务：如研究、学习，LLM 作为决策者，自主规划路径；
自动化任务：如流程执行，LLM 作为消息处理节点，按预设路径完成任务。
问题小、重复度高 → Workflow 更高效；
问题复杂、变量多 → Agent 更灵活健壮。

所以在设计 AI 产品时，首先考虑的是用户上手门槛和 LLM 系统的响应时间，其次才是 Agent 还是 Workflow，

比如以下几点：

在 AI 产品中，任务是否复杂到需要 Agent 的适应性决策，还是 Workflow 的确定性方法就足够？
更简单的 AI 工具是否能达到相同效果？
Workflow 是否涉及不确定性或多步推理，Agent 是否更适合？
赋予 Agent 自主性是否带来风险，能否控制？

特工少女，特工宇宙内容运营：Workflow 是一个脚手架，随着模型能力的提升，这个脚手架可能会逐渐被拆除。至于“搭建 Workflow 平台有没有价值”，我觉得取决于时间尺度，五年内还是非常有价值的，尤其是对于工程化落地。

在模型能力尚未成熟前，Workflow 是实现复杂目标的实用方案。很多实际应用场景（如自动化客服、数据分析）更看重稳定性和可控性，而非模型的“自由度”。Workflow 和 Agent 的发展不是对立的，Workflow 的设计经验可以反哺模型训练，形成正反馈。

特工女巫，特工宇宙编辑，某厂 AI 产品经理：从行业发展整体来看，未来有了更智能的基础大模型，会让 Agent 有更强的自主性，能力上具备不需要 Workflow 的条件。这样 Intelligence 升级的模型，应该也是 AI 从业者希望看到的，将减少 Workflow 编排、Prompt 写作的人工开发成本，进一步降低使用门槛，技术普惠给大众。

从实际生产需求出发，如果将 Agent 的目标比为更接近人，现在在人类社会中，有通用自主灵活的做事方式，有严谨规范流程化的做事方式，所以还是取决于具体需求目标。

比如要在企业内应用 Agent，工作本身就存在 SOP，信息在人员部门间随各项事务流转，并且办公生产环境对结果严谨性要求相对更高，让有人为干预定义的 Agentic Workflow 融入，是更合适的选择。

而在日常生活、学习探索中，这类场景需要执行的任务相对灵活、自由、开放，对结果的多样性和容错度相对更高，也需要更普适更易操作，那么 Autonomous Agent 是更值得期待的。

特工小帅，特工宇宙运营助理：通用与垂直的争辩，可以类比成人类社会历史上已经存在的议题。以史为鉴，可以知未来。在工业革命早期，很多工厂使用通用的蒸汽机驱动各种机器，但随着工业化深入，越来越多的行业开始使用针对特定任务的蒸汽机。工业革命初期依赖通用机器，但最终行业发展需要垂直优化的专业设备。这意味着 AI 可能也是先通用赋能，后垂直优化的路线。

再从人才培养的角度来看，通用 AI 就像通才，可以做各种事情但未必精通。垂直 AI 就像专才，在特定领域内更具竞争力。从一个人才的成长路径来看，大多数人是先接受通识教育，再逐渐走向专业化。这意味着 AI 可能也是先有通用智能，后有针对具体行业的深度优化。

通用和垂直方向各有价值。不过或许垂直方向的 Agent 更易率先商业化。通用系统往往更依赖大科技公司路径更长的变现模式（比如广告模式），而垂直优化的 Agent 容易找到精准用户并形成可持续的商业模式（如医疗 AI、法律 AI）。

从产品策略来看，短期可以优先做垂直 AI，找到一个高价值、刚需的场景切入（如 AI 创作助手、AI 求职助手）。长期再从垂直走向通用，当数据、用户积累到一定程度时，可以扩展成更通用的智能体，从一个垂直细分的需求适当延伸到用户更加多元的需求。

特工小鹏，特工宇宙技术负责人：Workflow 和 Agent 有几个有意思的共同点：每个人都有自己的理解，看似在谈论同一件事，细究却各有不同；两者都不是新概念，但 LLM 赋予了它们新的生命力。

（黑猫白猫，可爱亲人的都是好猫）我认为 Agent 和 Workflow 二者并不对立，二者都是信息处理系统，只是内部实现形式有所差异。因为是系统，所以可以通过系统性能、系统稳定性、可维护可拓展性、成本等指标进行考量。在系统成长早期，我倾向于优先性能和成本。

关于 Agent or Workflow？垂直 or 通用？可能存在“假共识”（警惕直觉陷阱）：垂直是便宜的，通用是贵的；Workflow 更便宜，Agent 更贵；Workflow 更稳定，Agent 更发散…

系统解决任务可视为在搜索空间中寻找一条连接任务起点和任务终点的有效路径。当前来看，Agent 的整体空间会比较大，Workflow 的整体空间经过人工剪枝则小很多，因而如果是优秀的 Workflow，其目前的解决效率和成本往往更佳。

但在可预期的未来（5-10 年），这些直觉可能会被颠覆。随着算法效率的提升，Agent 或许某一天路径的搜索效率上产生飞跃，从而将目前搜索空间较大的“劣势”转化为更有创造力的“优势”。

此外，Agent 和 Workflow 是可以互相促进的，优秀的 Agent 可以快速寻找到有效路径，人工进行优化/抽取，从而降低成本投入生产。优质的 Workflow 可以被 Agent 学习，并且优质的 Workflow 可以作为 Tool 被 Agent 所使用。

（文：特工宇宙）

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复