秒哒一出,代码全无!Manus:我先做个 PPT 压压惊

作者 | 褚杏娟、Tina

去年 11 月,李彦宏在 2024 百度世界大会现场发布了无代码工具“秒哒”,并称之为“迄今为止人类历史上最复杂的多智能体协作工具”。今天,百度终于宣布秒哒正式全量上线。

我们先看下秒哒的表现如何。文字输入:

“请帮我创建一个俄罗斯方块小游戏,要求如下:1. 支持方向键左右调整方块下落位置;2. 支持空格键对下落方块进行旋转;3. 展示积分,每成功消除一行增加一积分,积分无上限;4. 支持重新开始。”

生成结果如下:

实际上,在开发期间,秒哒调用了架构师、研发工程师、素材设计师三个角色,其中,“架构师”负责整体架构设计、模块设计和技术选型,“研发工程师”负责搭建开发环境、编程和初步测试,“素材设计师”明确风格,调用模型生成文案、调用服务生成图片,优化页面。

秒哒平台上的任务需要消耗秒点,每次生成任务会消耗 10 秒点。根据介绍,秒哒开发一个应用平均耗时约 3 分钟,成本不足 5 元,开发周期相比传统开发缩短至万分之一。

秒哒定位是生成式应用开发平台,它适用于以下用户全体:有个人长尾场景应用,如邀请函、营销页、博客站点等,也有日常工具生成的需求和连接模型输出与落地能力的 C 端用户;企业场景应用开发的 B 端用户。

目前,秒哒支持的场景以轻应用为主,如邀请函、产品营销页、调查问卷等场景下的 H5、长页开发;官网、博客、产品营销站点、电商站点等站点开发;日常办公的小工具与聚会小游戏等场景开发;教育场景、餐饮订餐场景等轻应用开发。后续,秒哒升级会考虑企业级应用的生成。

与 Manus 等有何不用?

相比主流智能体产品,OpenAI Operator 主要侧重于单一任务的自动化处理,AutoGPT 则强调自主推理、规划和连续执行,而秒哒则通过多智能体协作,提供端到端的解决方案,能够覆盖从需求分析到最终交付的全流程,具有更高的集成度和自动化水平。

秒哒和不久前爆火的 Manus 也有相似和不同。两者的共同点是两者都支持多智能体、多工具调用。不过,Manus 在制作 PPT、分析财报等场景表现出色,而秒哒如今还是在聚焦在开发领域;其次,Manus 是作为一个应用拓展自己的业务能力,而秒哒的定位是一个平台,希望借此平台做出更多更好更易用的应用。另外,在开放性上,Manus 仍需邀请码才能使用,秒哒则全面开放。

据介绍,秒哒主打两个特点:一是端到端、无代码生成。目前大部分基于大模型智能开发产品的定位还是开发助手,用来帮助程序员更好写代码,这类产品需要具备一定的技术背景才能用明白。秒哒算是真正意义上的端到端生成,没有技术背景知识的普通用户也可以用。二是 LGUI 结合,即支持 LUI 自然语言修改开发应用,也支持 GUI 可视化修改应用,在提升了智能的同时也兼顾了修改的效率。

“让人人都能成为开发者”,这个理念的核心关键特性是“无代码”,为此,秒哒做了以下几个尝试:

  • 屏蔽代码元素,提供所见即所得预览机制:代码等元素屏蔽封装在后台,无需让用户理解生成的代码是什么。

  • 自然语言交互 + 可视化结合:通过人机自然语言交互大幅度降低了用户的使用门槛,通过 GUI 交互提升微小应用调整的效率。

  • 应用全生命周期的管理能力:应用从生成、修改、发布、部署 、运维监控等,提供全流程的管理能力,不懂工程也能发布部署应用。

李彦宏曾形容秒哒是“迄今为止人类历史上最复杂的多智能体协作工具”,这种复杂性也主要体现在多智能体协作和多工具调用两方面。

秒哒是一个典型的多智能体协作架构,具体包括:负责与用户交互、理解并澄清需求的策划智能体;生成符合需求文案的内容文案智能体;负责收集、生成或优化所需素材的设计师智能体;根据需求生成高质量的项目级代码的程序员智能体。这些智能体通过协同工作,形成一个端到端的解决方案,覆盖从需求分析到最终交付的全流程。

实现多个智能体之间的高效协作是一个技术难点,秒哒团队需要设计合理的通信协议和任务分配机制,来确保各个智能体能够无缝配合,避免冲突和重复工作。

另外,需求澄清智能体和文案智能体需要具备强大的自然语言处理能力,代码智能体需要能够根据需求生成高质量、可维护的代码,这要求团队对于语义理解、文案生成、素材匹配与生成、代码生成、代码优化以及代码风格一致性等技术需进行深入研究。

在多工具调用方面,“秒哒”可以规模化地调用各种工具,如检索、iRAG、第三方 API 等,使得“秒哒”能够满足用户在不同场景下的需求。

同时,秒哒还在探索无缝集成外部 API,扩展其功能和应用场景。通过模块化设计,灵活调用不同的 API,适应多样化的业务需求。这种多智能体模式提升了复杂需求生成的质量与稳定性要求。

百度秒哒产品负责人董恒向 InfoQ 表示,与 Claude MCP 等业界方案比,秒哒的工具调用机制在技术上具有以下几个特点:

  1. API 中心统一管理。秒哒通过建立的 API 中心实现对 API 的统一管理,支持公私域工具的调用。这意味着无论是公共 API 还是私有 API,都可以通过统一的接口进行调用和管理。

  2. 智能体之间的工具共享与复用。通过 API 中心,智能体可以访问和使用其他智能体已经注册的工具,避免重复开发、提高工具的利用率。

  3. 工具的动态加载。秒哒的工具调用机制支持对工具的动态加载,这意味着在运行时,智能体可以根据需要动态加载,而不需要重启或重新配置系统。

  4. 工具调用的安全性与权限控制。秒哒的工具调用机制内置了强大安全性与权限控制机制。通过 API 中心,可以对每个工具的调用进行细粒度的权限控制,确保只有授权的智能体才能调用特定工具。

此外,随着用户的每一次操作,秒哒都会据此做智能分析,然后优化自身的算法,推动整个系统不断改进。“用得越多,它越能够生成更加符合需求的结果”董恒说道。

实现智能体的持续学习和自适应调整是一个挑战。团队需要设计有效的学习算法,确保智能体能够从历史数据中提取有用信息,并根据反馈不断优化自身行为。

如何应对大模型
吞并通用 Agent 危机?

当前行业中存在一种趋势,即大模型逐渐整合、吞并通用 Agent 的功能,使通用 Agent 作为独立工具的价值逐渐降低。

对此,董恒表示,团队认同大模型技术正在加速重构技术生态,但需要强调两点关键认知:

  • 场景价值始终高于技术形态。用户最终需要的是解决实际问题的能力,而非技术形态本身。LLM 的”内化”是技术层演进,但用户需求场景(如效率提升、体验优化、决策辅助)始终需要端到端的服务闭环。

  • 专业化场景存在结构性机会。通用大模型在垂直领域的落地需要场景化改造,涉及行业知识沉淀、业务流程适配、多模态交互等复杂工程,这正是秒哒的核心战场。

面对挑战,董恒表示,秒哒可以通过以下三个方向确保自身的长期价值。

  1. 明确定位,向行业渗透、解决企业痛点。通用任务可能被大模型逐步吸纳,但企业级、行业专属应用研发中,仍然存在大量非标准化、数据私密性要求高的场景,这些场景无法完全被通用模型覆盖。秒哒可聚焦于行业垂直场景构建专属能力,通过私有化方式与企业内部数据、业务规则和系统紧密耦合,创造更强的不可替代性。

  2. 强化“数据飞轮”模式,建立自身生态壁垒。秒哒将围绕“数据 – 模型 – 任务”形成闭环,不断产生高质量的数据资产,在企业业务场景下,积累高价值商业数据,形成数据上的护城河。并通过长期的正反馈机制不断增强 Agent 的核心竞争力,形成深度链路:用户使用数据驱动模型优化 → 提升模型性能 → 提升使用率 → 更多数据产生 → 更强大的模型优化。

  3. 探索模型精细化和推理端的轻量化。在部分企业场景中,企业出于成本和部署灵活性的需求,需要更加轻量化、部署友好的模型和 Agent 架构。秒哒后续将在轻量化领域模型来达到更好的性能、更低的成本、更灵活的部署方式,提升企业级场景下的经济性。

声明:本文为 AI 前线整理,不代表平台观点,未经许可禁止转载。

 直播预告

智能编码工具层出不穷,究竟怎么选、如何用?3 月 5 日 -28 日,InfoQ 极客传媒将发起「智能编码系列」直播,邀请阿里、百度、腾讯、字节、商汤、思码逸等企业一起在线 Coding,与所有开发者直观感受和评测数款国内外在线编码工具在企业真实生产场景中的表现。欢迎扫码或点击按钮一键预约直播、查看回放


今日荐文

Qwen3部分技术细节被扒;年薪达945万!80后女副总裁首登福布斯;字节吴永辉亲自带实习生,取消Seed季度 OKR|AI周报
谷歌史上最大收购:320 亿美元买下了发现 DeepSeek 数据库泄露的那家小企业
李开复:超大模型预训练逐渐寡头化,国内将收敛至 DeepSeek、阿里、字节三家
史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!
你也「在看」吗?👇

(文:AI前线)

欢迎分享

发表评论