比Manus快10倍、强3倍,这个Agent真干活,真交付

最近,Manus撤出中国后。有群友问:有没有替代的其他Agent?

作为多个Agent的深度体验者,我想说,目前市面上大部分Agent其实都差点意思。

每家都说自己达到SOTA级别,在某某bench上拿下世界第一,看起来什么都会,但一用就废。

PPT是能生成,但一下载排版全乱;报告是能撰写,但一细看全是“百科体”;说是啥都能干,一简单任务,硬是能给我跑几十分钟甚至几个小时。

有点像是,AI Agent给你找来一堆砖家,七嘴八舌帮你“一通胡想”,但就是没人能帮你“完成”。

刚好,最近有网友在文章留言,建议我了解一下百度文库的GenFlow

百度??

这可不能乱说啊,我只有先实际体验了,才能来评论。


PPT能力实测

我们先从PPT开始,因为PPT是所有Agent产品最常见、也最容易翻车的场景。

最近,“vibe coding”很是流行,我想深入了解一下,于是就问Agent。

请你深入研究vibe coding,从以下方面进行分析,生成一份PPT和研究报告。
1.什么是Vibe Coding
2.怎么理解Vibe Coding
3.编程历史和发展趋势
4.Vibe Coding vs 传统编程
5.vibe coding为什么会火
6.vibe coding的优劣势
7.vibe coding的未来展望
8.Vibe Coding工具和模型推荐

我先问了Manus,大概等了二十来分钟吧,给了我9页结果。内容中规中矩,而且每一页尺寸都不一样。

然后,我把PPT下载下来,这时候问题就更多了。PPT里要么出现乱码,要么多出来的画幅被截断,甚至有的图表它直接给我整不见了。

据我体验的多个Agent来看,这些以Claude 4为底模搭建的Agent,尺寸错乱这个问题根本无解。除非Anthropic发布新模型来专门优化这个问题,才行。

那,我们用文库的GenFlow来试下呢?

打开百度文库APP,点底部菜单栏“AI智能助手”,再选择“GenFlow”模式,进行提问。

没想到,不到3分钟,就给我做了23页的PPT。

从字体到配色、配图,以及布局排版,整体都很高级,耐看。仅形式上,这PPT水平差不多已经是发布会、活动演讲级的水平了。

其他Agent常见的尺寸不一、导出错乱、内容丢失等问题,百度文库GenFlow一个都没出现。每一页都是16:9的标准PPT格式,下载直接就能用。

不得不说,文库做PPT确实有两把刷子。不过,Agent可不能只帮我们做PPT。

报告能力实测

最近外卖大战打得不亦乐乎,作为“0元购”用户,我想了解下事情的来龙去脉。

梳理2025年外卖大战的时间线,帮我生成一个思维导图和研究报告。

我把这个Prompt先丢给Manus,又是等了20来分钟,先给我生成了这样一张思维导图。


这是什么东西??有谁是这么画思维导图的吗?


再来看下他的研究报告,既没有封面,也无法编辑,文字还充满了“百科体”。

我接着丢给文库,3分钟给我干了100多页的报告,足足有3万字,还有数据表格。

以及一张外卖大战时间线的思维导图。

报告设计了精美的封面,支持修改、AI润色和各种格式导出,可以直接发到微信或QQ。

包括第一个case,同样也是生成了一份深度研究报告。

回看GenFlow的工作过程,有一个细节很意思,他会检索百度学术、百度文库的数据库。

我们知道,像Manus这类智能体,是没有自己数据库的,只能依靠公网搜索。

GenFlow有百度学术支持的专业文档检索、参考和查重,还有文库自身积累的上亿文档,这行业konw-how远非Manus所能比。

现在,很多Agent喜欢说自己能调很多模型,支持很多工具,但如果没有know-how数据的支持,再多模型,再多工具,只靠联网搜索,也会“降智”。

自然,也就没有“交付”可言。


更多场景实测

光写写文章、做个PPT,还不够。

既然是叫「GenFlow超能搭子」,必须得是啥都能干。于是,我又给文库下了几个任务。

1)做课件

我有个教师朋友最近跟我吐槽,说他教学压力特别大,每天很多时间都忙在备课里。于是,我就GenFlow帮他干活,从百度网盘中调取资料生成课件。

我是一个初中物理老师,正在准备教学生“摩擦力”章节,请参考我网盘中的课程讲义大纲,帮我整理课程思路,做一个教学课件,并制作演示动画,可直观展示小车在斜面上的运动过程,并实时显示速度、位移与时间的关系曲线,适合课堂演示使用,最后再出一些习题。

好家伙,这不光会干活,还直接干了全套啊。

甚至,还做了一个动画,直观展示摩擦力的运动。

⼀句prompt,直接生成“教案+PPT+动画+思维导图+课后题”,这才是真正的智能体。

2)财务计算器

不仅如此,他还具备多模态理解能力。

比如,传了张关税缴费记录给他,如果不亏本,商品售价应该是多少。

GenFlow先是对着图片一通解析,然后调用实时汇率,最终给我生成了一个成本计算器。

这个计算器,既可以实时计算,也可以修改参数自动重算。

这明显,是调用多个智能体协作完成。

Agent揭秘

为啥一个文档PPT玩家,搞Agent这么6?这让我想到,前不久百度文库和百度网盘一起搞了个AI操作系统,叫「沧舟OS」。

为什么Manus一个简单任务动辄要几十分钟甚至一个小时,而文库Genflow再复杂的任务三分钟就能搞定?原因就在于:沧舟OS提供的多Agent调度大脑。

它可以指挥多个专家智能体(比如文库PPT、百度学术、文库文档、百度网盘等)并行干活,高效协作。这个架构,比5月红杉闭门会sam altman、6月硅谷大神Andrej Karpathy提出AI操作系统的概念都要早。

关键是,百度不仅搭出了这个框架,还直接落地到了文库Agent中。


写在最后

一波实测下来,这款Agent输出的格式巨多。

像PPT、策划案、思维导图、⾏业报告、合同、教学课件、习题集、绘本等,都能高质量生成。

既快又准,能做,也能用。

别的Agent,做出来是给AI看;这个Agent,做出来可以直接给老板看。真干活,真交付。

要不是实测一波,我也不信,这居然是百度搞的。

这么好的Agent,百度居然没怎么宣传,是被怼怕了吗?

(文:沃垠AI)

发表评论