超级Agent,鸣枪起跑

机器之心原创

作者:吴昕
一觉醒来,AI 应用变天了。

很多人每天还在搜索框里用手动挡的方式找信息,随着阿里 AI 旗舰应用夸克发布 AI 超级框,超级 Agent 时代呼啸而来,至少 2 亿人顷刻之间开上了具备 L4水平的电动汽车去执行各类复杂任务。

打开全新夸克,长相没有明显变化。


还是那个干净的界面、熟悉的框,带着一个深度思考按钮,几个常用工具服务入口在上、下依次排开。

但,此框已非彼框。

我把电子书拖到AI 超级框,要求给我写个阅读总结」。结果,虎躯一震。

夸克自动进入「 AI 总结,摘要、脑图、PPT 任务,随你指派。

配图不满意?可以 AI 生图替换;字体、内容不满意?直接改。


一套完整 PPT 唾手可得
,直接存网盘就能转给同事。
从要求写总结到拿到 PPT,咱没出过 AI 超级框,看来这里头的灵魂可真变了。
回到主页。想知道宋太祖到底是怎么死的,学术上有哪些研究和说法,夸克跑了很多网页,给我做了一份整理。

点击接着问,他儿子下场如何?又接着问,史书对他是怎么评价的。

夸克没糊涂,知道前面问的是赵德芳等人,后面问的是史书如何评价赵匡胤,回答贼快!

接着,让夸克安排清明节假期行程、又接着问金秀贤最近塌房的八卦,问得很跳跃、但它每次都能精准接招。

点击图片查看细节内容
细思极恐啊。聊了三个话题,互不相干我还是没出过 AI 超级框!只用接着问」,根本不需要退出本次对话,开启新对话 …… 

Manus 还得满世界调接口,而且速度慢到离谱,在全新夸克,都不用去外边折腾了,足不出框、一站搞定。

咱就说,超级 Agent 玩起来还能这么疯。

全新夸克:
一个 AI 超级框、一个超级 Agent

今年,AI Agent 的热度居高不下。在此之前,很多人对 AI Agent 的印象就是 AI Chatbot 。

他们都有一个神奇的通用界面,只有一个对话框,你可以和它唠嗑各种开放性话题,但也就是脑子和嘴皮子好使,真要办事儿可不行。

还有一些智能助手,比如某个理财助理、医疗助手、文生图助手、智能导购甚至 PPT 助手,它们能感知、会说还有点工具调用能力,可以办事,因为专注某个垂直领域,能力比较单一。

但真正的超级 Agent 具备三个核心特征:意图理解、任务规划、自主执行,并不拘泥于具体形式。当很多人执着于炫酷的对话演示、传统产品还在堆砌功能入口时,夸克彻底颠覆了产品架构——用阿里强大的推理模型和多模态打底,全由超级 Agent 来驱动服务、响应用户需求。
一句话,人家现在就是个超级 Agent。

具体来说,超级 Agent 会通过意图理解和自动化调度,将已有的丰富工具和服务转化为呼之则来、挥之则去的智能模块,可以弹性组合,自适应地满足用户在工作、学习和生活中的各种问题和任务。

也就是说,夸克会动态指导自己的流程和工具使用,控制任务完成方式,而不是依赖外部的工作流,不仅深度理解你的需求,还能深度执行完成它。

看吧,没有吸引眼球的炫技,仅靠一个 AI 超级框,夸克就将 Agent 助手能力实实在在地溶于 2 亿用户的生活、学习和工作中。

解剖夸克超级 Agent

所以,现在的夸克不再是一个生产力工具,而是一个集成了推理、多模态大模型的 AI 超级应用。

你也可以把它看做一个诸多 Agent 能力的总成,它们由一个神经中枢负责调度、协同,自主将用户需求转变为现实成果。

当你以各种方式、将千差万别的日常需求——无论是上传文档、截屏搜题、还是手动或者语音输入写个年终总结 PPT 制定日本 7 日游异地恋到底靠不靠谱——扔进 AI 超级框后,超级 Agent 的齿轮开始转动。

先有 Agent 理解你的需求。接着,中枢 Agent 会根据这些判断,对任务进行拆解、分配、思考、推理,决定任务的完成方式——交个单个 Agent 完成,还是需要几个 Agent 搭配搜索工具同时干活,它会安排好工作流程。

例如,给我来份总结,它可能会自动调用 AI 总结夜里咳嗽厉害睡不着,怎么办?,它可能会叫醒 AI 健康助手

如果你说要不要和男友继续异地恋,它可能启动深度思考,run 一波网站,给你一份中肯的建议。面对一道数学中考题,它会调出专属的AI 解题大师 。

最后,还有 Agent 负责结果的输出和呈现。

比如,合不合规、安不安全、用什么方式呈现最好(多模态还是单一文本、要不要表格),同时支持在夸克上编辑文档、转换格式、保存和分享。

举个例子:求出二次函数 y=(x−4)(x+2)y=(x−4)(x+2) 图像的对称轴。

这题难点在于如何将二次函数转换为对称轴公式对应的表达方法。在夸克返回的结果里,方法一详细给出了解题步骤和对应关系,方法二再次验证方法一的答案是对的,验证了结果,也拓展了用户思路。


一个超级框就够用了,自此告别 一个需求,N 个 App 的碎片化体验。

这是一次飞跃——从人找信息,变成直接得到一个结果,可以说这也是当下先进智能能力的最优产品形态。

讲到这里,好像也明白了为什么是夸克打响超级 Agent 第一枪。
五年前,夸克就给自己定位——要成为年轻人的全能助手。这些年积累了不少自研产品,环视四周,围绕 AI 搜索,提供回答、创作、总结、解题、信息存储等一体化服务的产品,似乎并不多见。

如今,再搭配自研新模型的强大能力,终于可以用一个极简的「 AI 超级框,去无限接近「 全能助手这一目标。
由此可见,当大模型规划任务和使用工具的能力变得更好、更强时,AI Agent 的落地速度可能会比很多人想象的要快,尤其是在数字世界、在一个 AI 超级应用身上。

值得一提的是,夸克对全自研的坚持,除了成就超级闭环,还有一点很重要——知道用户要什么,更好地预测用户行为。

例如,用户获得答案之后,往往会有一条支线导向后续动作,如修改、形成文案、做 PPT 、保存等,对这些历史行为的深度学习,也是夸克后续往 Agent 发展,自主帮助用户完成任务的基础。

当你凝视这个小小的AI 超级框时,看到的其实是通向未来信息获取方式的任意门。
阿里巴巴集团副总裁吴嘉说,过去是人在使用搜索,未来是 AI 在使用搜索。人类本身不再需要直接使用搜索等工具,而是把完整的任务指令直接给到 AI 。AI 会思考、执行,并在过程中互动调整,完成最终的任务交付。

这在不久的将来将全部实现,并诞生新的 AI 超级应用。
就像科幻作家 Gibson 说的:未来已经到来了,只是没有均匀分布而已。而作为 AI 时代的第一个超级应用,夸克迈出了宝贵的第一步。

© 

(文:机器之心)

欢迎分享

发表评论