颠覆革命还是虚惊一场?客观聊聊Manus究竟怎么样丨评测

作者|王萌‍‍‍‍

编辑|卷毛‍‍

一夜之间,AI圈被Manus刷屏了。


曾打造Monica ai的华人团队,推出了全球首款通用Agent——Manus,在GAIA基准测试中Manus远远甩开OpenAI。



Manus一经发布就引起了不小的轰动,出现了“一码难求”的状况。更离谱的是,一些“嗅觉敏锐”的人已经开始争相试图抓住这一次“风口”,将本来免费的邀请码炒到离谱高价。



不少人在描述Manus时用上了诸如“颠覆性”“大地震”“革命”等让人震惊的词汇,甚至有人表示看到Manus跑起来就好像看到《三体》中的“宇宙闪烁”。


但很快也出现了质疑的声音,“自嗨”“营销”“全靠邀请码”等质问同样不绝于耳。


那么Manus的实际使用效果究竟如何?AI新榜第一时间拿到邀请码并进行了实测,通过一些实际生活中的常用场景来试试Manus功力如何。



实测Manus:一位干劲十足的名校实习生


进入官网https://manus.im/并登录后,我们可以看到一个看起来有点熟悉的页面。


虽然界面和很多问答式AI应用相似,但实际能力却大有不同。


当你输入一个简单的提示词,它会将问题拆解,通过思考和系统规划,分类成不同的任务类型,在自己的虚拟环境中灵活调用各类工具——编写并执行代码、智能浏览网页、操作各类网页应用……


提出制作PPT的需求后,Manus进行了拆解

提出制作“午饭吃什么辩论模拟器”需求时,Manus进行了详细拆分


Manus还提供了两种模式,高投入模式能够将任务进行更详细的任务拆解,但需要更多时间,实测最长可能会超过1个小时,甚至更久。


遇到不明确的需求,Manus会主动提出问题或给出几个选项供用户选择。



Manus还会针对用户的一些特定偏好重点学习记忆,以便高效完成任务。


在内容生成的过程中,我们还可以实时查看Manus工作的内容或接管,提出一些临时的要求。


了解Manus基本功能之后,我们来看它在具体案例中的表现。


首先就是文本创作这类比较简单的任务类型,Manus可以在很短的时间内将任务拆解,生成符合要求的文本。



案例地址:

https://manus.im/share/yK0fA9OOKRfSzpr5meZKTG?replay=1


信息搜集、行业分析等也能很快完成。



案例地址:

https://manus.im/share/jhioWW5NCD8AxDsuXQR9ae?replay=1

PPT任务在官方给出的演示中有亮眼表现,实际测试中虽然信息质量较好,但排版却时时刻刻透露出一种独有的“硅基美感”。


案例地址:

https://manus.im/share/fdY9hbeVbr7hJCj1Z6psue?replay=1

生成旅行指南的任务中,Manus不仅会给出详细的出行攻略,还会给出相应图片,但涉及统计的部分并未标明信息出处,显然受到了幻觉影响。


案例地址:

https://manus.im/share/k0Vu3HyK1B8zeRO3TYYHEv?replay=1

编程任务中,由于首次提出的需求较为笼统,输出的结果也不尽如人意,但在后续协作中得到了很好的修正。


案例地址:

https://manus.im/share/1v4zqCamD96SM6DxVjsay9?replay=1

不只是传统的文字、编程工作,它还可以生成声音,但生成的“鸟鸣”更像是来自某种“赛博鸟类”。


案例地址:

https://manus.im/share/Ay7mChUUDaRWyK4DqA1cgt?replay=1

虽然Manus并不能直接生成歌曲,但可以生成非常详细的风格分析、创作指南


例如,当我们尝试让Manus模仿方大同的风格写一首怀念方大同的歌曲,它会在详细分析歌手风格、旋律、结构等内容后生成歌词及编曲指南。


案例地址:

https://manus.im/share/EynChGT5pIIayn9V7RYZ1a?replay=1


视频同样如此,它会给出一份包括分镜脚本、视觉设计、音乐音效、演员指导、后期制作及预算优化等在内的一份详细文档


案例地址:

https://manus.im/share/T332QRBnGWjNWDHDhWi5RY?replay=1


通过测试我们不难看出,无论你需要深入的市场调研、文件处理、旅行规划还是小程序编程,Manus都能通过思考和系统规划给出结果;在视频、音乐等无法处理的任务中也会给予非常详细的指导建议供专业人士参考。


得益于Manus随时介入指导的协作模式,在处理一些复杂任务时,我们还可以采用渐进的方式,一步一步与它共同完成任务。


Manus只是“看上去很美”?


我用Manus生成了一段自我介绍,它是这样描述自己的:

Manus名称源自拉丁语“manus”(手),象征着它作为人类在数字世界中的延伸,体现了“知行合一”(mens et manus)的理念:知识和智慧必须通过身体力行才能对世界产生正向影响。

这正是Manus的核心追求——为人类提供一双能够在数字世界中巧妙操作的手,将想法转化为实际行动和成果。

抛却宏观上的美好愿景,实际使用中令我印象最深的还是Manus的自主规划、任务拆分系统


正如当DeepSeek将长思维链展示在台前时,很多人会产生“它真的在思考”的主观感受,Manus给我最大的感受是让我有一种请了一位干劲十足的名校实习生帮我工作的感觉。


这在传播方面有着得天独厚对的优势,或许也是很多人在看到官方实例时感到惊艳的来源。


Manus在分享机制上强调直接从网址进入回答页面,让没用到产品的用户也能直观地看到其多任务拆分、执行的动态过程,这对于营造“一码难求”的盛况功不可没。


有网友在征集测试的文章下面调侃:“最大的需求是生成一个邀请码。”


不过,目前Manus还在内测阶段,在测试中我们也发现了一些问题,例如速度比较慢,每个案例都要等上个十几分钟,在处理一些较为复杂的任务时还会耗时更久,甚至出现错误。


在执行一些特定问题时,Manus还会卡在原地,我推测应该是不能完成针对某些网站的浏览任务。


卡在“查看浏览器”10个小时以上

当然,更多人吐槽的还是:“用不了!”不仅全面用上还需等待邀请码,测试阶段还有每日最大配额限制。


针对这一情况Manus团队也发了文章,表达了对业界广泛关注表示感谢。


凤凰网科技报道,Manus AI合伙人张涛回应了目前存在的问题:目前Manus系统容量有限,团队将优先保障现有用户体验,逐步有序地释放新的邀请名额。


针对网络上的一些传闻,他表示:

首先,Manus从未开设任何付费获取邀请码的渠道,所有内测资格均为免费发放;其次,团队至今未投入任何市场推广预算,目前的关注度完全来自产品本身的技术创新和用户口碑。

综合而言,Manus强在多个模型、多个智能体协作,执行过程更加自动化,比Claude等产品做了更多工具组合应用的创新,可以直接交付结果比如文档、html、音频,但是能力边界仍然依赖现有的模型。


无论如何,Manus在多模型整合调用及UI方面的优化,还是为智能工具的实际应用提供了有价值的实践参考。


而Manus团队擅长做应用的优势,在此前的Monica上也有很明显的体现。


团队创始人肖弘是一位毕业于华中科技大学的年轻创业者。在2022年大模型浪潮出现后,他正式创立Monica,专注于通过为海外市场的独立开发者做ChatGPT for Google快速完成冷启动。


此后的Monica.im同样专注于为用户提供更好的应用,早期以浏览器插件的形式提供一站式的AI服务,其产品在策略上强调的就是“场景适配”,在YouTube、X等不同功能的网页中呈现出了不同的交互形态,后来拓展到App、网页端。


在GPT-4o、Claude 3.5等模型上线的第一时间,Monica就整合多个AI模型,并提供记忆、专业搜索等实用功能,实现了爆发式增长。


在Manus上我们可以看到这一思路的延续,即通过多代理架构和场景优化设计,来达成从“对话”到“任务执行”的目标。


不同的是,Manus在此基础上更进了一步。


肖弘分享在即刻平台上的技术采纳定律示意图

在接受媒体人张小珺采访时,肖弘表示,产品不能只有聊天机器人一种形态,Agent会是新增的形态、需要新的产品去承接。


看上去它确实应该就是一个chatbot,这是很符合大家想象的,同时在应用侧却很复杂,和Monica不一样,光用好不同模型就挺复杂。


这是他在Manus发布前对该产品的描述。


他还在即刻平台上分享了一段意味深长的书摘,暗示“高潮”时刻即将来临。



在Manus这一声“发令枪”响之后,2025年,AI Agent会离普通人的生活更近一步,我们将见到更多更好用的通用型Agent。


最后用一段Manus生成的自我介绍文字作为结尾:


Manus打响了2025年AI Agent应用的“发令枪”——AI不再只是回答我们的问题,而是为我们解决问题,执行任务,创造价值,成为人机协作的新起点。



(文:AI新榜)

欢迎分享

发表评论