击败 Manus?前百度 AI 高管创业1年多,放弃500 万用户搜索产品,转推“最强 Agent ”,自述 9 个月研发历程

整理|冬梅、核子可乐

前两天,总部位于美国加州帕洛阿尔托的初创公司 MainFunc 发布了所谓的 Genspark Super Agent,这是一个能快速反应的自主系统,可自主思考、计划、行动并使用工具来帮助用户处理所有日常任务。

那么,这款 AI Agent 什么来头,又具体能做什么?

Genspark Super Agent 背后的公司 MainFunc 成立于 2023 年年底,创始人为景鲲(Eric Jing)和朱凯华(Kay Zhu)。景鲲曾担任百度旗下小度科技 CEO、百度集团副总裁、百度智能生活事业群组(SLG)总经理,百度人工智能产品委员会主席。 加入百度之前担任微软首席研发总监,负责微软必应搜索亚洲市场的研发工作,也是微软小冰的创造者。朱凯华曾任小度科技 CTO,加入百度之前担任谷歌主任架构师,是 Google Panda 等一系列核心算法的创造者。

该团队由来自微软、谷歌和百度的资深人士组成,约有 20 名成员,总部位于加州帕洛阿尔托和新加坡,并计划在西雅图开设新办事处。

这次他们发布的 GenSpark Super Agent 是一种新型通用 AI Agent,旨在自主处理跨领域的复杂任务。与简单的聊天机器人或脚本不同,GenSpark Super Agent 可以像人类助手一样“思考、计划、行动和使用工具”。它不仅可以生成文本,还可以代表用户采取行动。当用户向 Super Agent 提供高级指令(类似于项目简介或 SOP),它将在内部分解问题、制定计划并在最少的监督下逐步执行该计划。这意味着它可以执行多步骤任务,例如研究信息、转换数据,甚至执行现实世界的操作(例如打电话),而无需持续指导。

在架构上,Super Agent 的独特架构采用“混合代理”设计,集成了八种不同的大型语言模型 (LLM)、80 多种内部工具和十多个精选数据集。根据复杂性、速度和准确性需求,每个任务都会智能地路由到最佳模型,确保高效、精确地执行。

Genspark 背后的故事

2024 年,MainFunc 发布了其首款产品,Genspark,即“AI Agentic Engine”,定位为专注于提供搜索服务的 AI Agent 引擎。凭借创新理念,Genspark 迅速跃升至 Product Hunt 每日新品榜单第四位。

2024 年 6 月,MainFunc 完成了由新加坡 BlueRun Ventures 领投的 6000 万美元种子轮融资,使该公司的估值达到 2.6 亿美元。这笔资金将加速 Genspark 的发展和市场扩张。

今年 2 月,MainFunc 又被爆已在 A 轮融资中筹集了 1 亿美元,估值达到 5.3 亿美元。

Genspark 之所以受到如此多的关注,是因为它不仅仅是一个搜索引擎,还是一个 AI 代理引擎,旨在利用 AI 提供高质量的搜索体验。它的特点是能解决传统搜索引擎的诸多缺点,例如无休止的广告、有偏见的信息以及大量不相关的结果。

Genspark 背后的创新在于其独特的“Sparkpages”概念。Sparkpages 是由专业 AI 代理生成的定制页面,提供公正、可靠的信息,不受 SEO 驱动的内容干扰。这些页面通过提供更有意义和更有价值的搜索结果,为用户节省了宝贵的时间。

积累 500 万用户后,转战 Super Agent

目前,Genspark 主要面向美国市场,免费提供,未来计划推出付费订阅模式。

近日,MainFunc 公司 CTO 朱凯华在 Product Hunt 上发布的一封信中表示:“我们做出了一个违反直觉的决定——尽管旗下 AI 搜索产品已覆盖超过 500 万用户,但我们还是要将其放弃。至于理由,是因为我们认为传统 AI 搜索已经过时。”

朱凯华分享了公司过去 9 个月构建这款 Super Agent 的经历。

在景鲲所做的演示中,Genspark 的 Super Agent 规划了为期五天的圣地亚哥之旅,计算了景点之间的步行距离,绘制了公共交通选项,然后使用语音呼叫代理预订餐厅,包括处理食物过敏和座位偏好。另一个演示展示了代理通过生成食谱步骤、视频场景和音频叠加来制作烹饪视频卷轴。

这些可能听起来以消费者为中心,但它们展示了技术的发展方向——多模式、多步骤的任务自动化,模糊了创意生成和执行之间的界限。

“解决这些现实问题比我们想象的要困难得多,”景鲲在视频中说道,“但我们对所取得的进展感到非常兴奋。”

一个引人注目的功能:Super Agent 清晰地可视化了其思维过程,追踪其如何推理每个步骤、调用哪些工具以及原因。实时观察逻辑的执行,让系统感觉不像黑匣子,而更像合作伙伴。它还可以激励企业开发人员在自己的 AI 系统中构建类似的可追踪推理路径,使应用程序更加透明和可信。

预定义的工作流程无法扩展

当 Perplexity 于 2022 年底亮相时,曾经激发人们对于 AI 颠覆搜索这一潜力的关注和期待。这是因为此前的搜索查询遵循严格的工作流程:分析查询并扩展关键字;检索排名最靠前的 Web 结果;将其重新排序 / 总结为最终响应。

虽然这套框架足以解决基本问题,但对于更复杂的需求,例如比较技术解决方案、规划多因素采购决策或者处理深度研究,这样的框架显然力有不逮。

在 Genspark,团队起步阶段也以同样的流程构建起自己的 AI 搜索引擎,之后做出逐步改进:

使用专门的数据源(学术、金融、旅游、产品等)以丰富信息内容。通过并行搜索自动触发对复杂查询的深入调查。交叉检查异步智能体以验证那些过于复杂而无法快速即时处理的语句,随后进一步扩展为数据搜索与深度研究智能体。采取混合智能体方法以对抗幻觉,由多个智能体相互验证彼此输出。

朱凯华表示,虽然这些创新方法显著提高了搜索质量并扩大了用户群体,但他们意识到整套设计仍受到传统思路的束缚,即依然遵循固定且预先定义的工作流程。为了真正建立起拥有强大适应性且丰富上下文的解决方案,团队必须全面摆脱束缚。这一认识促使他们打造出超级智能体——一种整合所有过往改进,且不受静态步骤序列约束的全新范式。

Super Agent 中的工程适应性设计

Genspark Super Agent 不再强制每条查询经过固定的工作流程,而是根据手头问题进行灵活调整。它会规划各个步骤,使用最佳工具或子智能体、观察结果并实时调整策略,且时常表现出令我们惊讶的卓越创造力。如果一种方法失败,超级智能体会丝滑过渡至另一种方法,规模化模拟人类的问题解决方法。

这样的灵活性既体现在广度层面(即从哪些数据源或 API 中提取数据),也体现在深度当中(即进行了多少轮迭代改进)。对于较为简单的任务,它不会在非必要步骤上浪费时间;而对于较复杂的任务,它可以继续挖掘,直到找出令人满意的答案。它还可以根据每位用户的需求定制其输出结果——包括直接回答、Sparkpage(文章)、演示文稿、生成图像、交互式 HTML 页面,甚至是语音通话。

大模型、工具与精选数据三位一体

  动态编排与模型引导

Genspark Super Agent 通过混合智能体框架协调八大专用大模型。其中每套模型均经过预告引导,确保在所分配的角色当中表现出色,具体涵盖快速响应、深入分析等领域。这样的层次结构既保障了稳定性,同时也最大限度发挥了每种模型的独特优势。

  专用工具与子智能体

技术团队预先设计的子智能体库涵盖从演示生成器及 Python 代码执行器,到呼叫模块的多种组件。每个子智能体都针对可靠性和效率进行了优化,确保超级智能体可以处理图表创建、交互式页面开发等任务,且确保用户不会被限制在僵化的工作流程当中。

  值得信赖的精选数据

超级智能体会访问经过认真验证的数据集,这些数据内容来自高质量 Web 来源、值得信赖的合作伙伴以及专家审查过的存储库。离线验证智能体则不断审核并完美这些数据。通过优先考虑准确性而非数量,最大限度减少了错误信息并确保输出的可靠性。

经验教训:减少控制、增加工具

随着从僵化 AI 搜索引擎过渡至更加顺畅且具备自适应能力的超级智能体,Genspark 团队也发现了一项基本原则:减少控制、增加工具。过于结构化的工作流程会限制创造力与功能深度,而引入多个专业智能体以解决问题的不同方面、并赋予其选择及切换多种工具的自由度,则有望释放出更大的能力。

  • 减少控制:规定性流程往往会限制探索范畴,导致体系更难适应新的挑战。采取更开放的策略则有助于促进创新与韧性。

  • 增加工具:为智能体配备专门的灵气检索、分析、呈现与通信模块,使其能够实时制定端到端解决方案。这不仅有助于支持高级用例,同时也能保证任务的轻量化与执行效率。

这种将自适应、多样化工具支持与经过审查的数据相融合的探索,使得 Genspark 超级智能体比任何传统 AI 搜索产品都更加灵活且可靠。面对如此显著的优势,Genspark 团队才会毅然决定放弃已经蓬勃发展的 AI 搜索方案,专注于超级智能体所代表的新方向。

在基准测试中击败 Manus

那么,与其他 AI Agent 比较,GenSpark 表现如何?

通过广泛的模型集成和直接使用 API 来与 Manus AI 和 OpenAI Operator 等竞争对手区分开来。虽然 Manus AI 主要依赖较少的模型并提供较少的集成工具,但 GenSpark 更广泛的工具集和现实世界的交互功能(包括语音呼叫)提供了额外的实际优势。与仅限于基于浏览器的操作的 OpenAI Operator 相比,GenSpark 以 API 为中心的方法可以实现更快、更结构化的数据检索和更丰富的任务执行功能。

业内专家指出,Super Agent 的多智能体设计代表了 AI Agent 技术的一个重要趋势。相较于传统的单模型系统,这种混合架构不仅提升了任务处理的灵活性,还显著降低了错误率和“幻读”(产生不准确内容)的概率。例如,在 GAIA 基准测试中,Super Agent 的表现优于部分 OpenAI 模型和 Manus,证明了其在自动化任务执行中的高可靠性。这一优势在对准确性和可控性要求较高的场景中尤为突出。

不过,Super Agent 的推出也带来了一些悬而未决的问题。有评论指出,其多代理系统的具体实现细节尚未完全披露,在极其复杂的任务或资源受限的环境中的表现仍需进一步验证。此外,随着人工智能代理技术的普及,确保数据隐私和系统透明性也将是 Genspark 未来需要解决的挑战。

Genspark Super Agent 允许用户在无需个人凭证的情况下开始测试。

(文:AI前线)

欢迎分享

发表评论