
继DeepSeek出圈后,又一款中国AI产品火了!
昨天凌晨,Monica.im发布了全球首款通用Agent产品——Manus。
如果说,DeepSeek完成了中国公司在大模型领域的逆袭。那么,Manus就做到了中国公司在Agent领域的超越。
Manus在GAIA(一个通用AI助手能力的基准评测体系)的评分上已经超越OpenAI的DeepResearch,成为GAIA评分第一。
与传统AI助手不同,Manus特点在于:通用任务上的泛化性和自主执行任务最终交付结果。
简单来说,Manus能够解决各类复杂多变的任务,包括撰写研究报告、旅行规划、财报分析等等,并直接交付完整的任务成果。
现在对Manus的讨论很多,它是否真正做到了通用Agent,我们暂且不论,但其背后很多独特的产品理解很值得我们学习。
比如,Manus提出“Less structure, more intelligence”,主张减少对AI的结构化限制,依赖模型自主进化能力,而非人工预设流程。
此前,乌鸦君曾编译过一篇文章《AI创业者的惨痛教训:押注模型准确性是产品陷阱,利用模型灵活性才是答案》。在这篇文章中,作者在调研了100多个AI创业项目后,提出了一个观点:
AI产品不应该在模型的局限性上投入过多精力,相反应该更多利用大模型自主性与灵活性的机会。因为模型的持续进化最终会让软件附加值不断下降,但同时却会大大扩展应用的边界。
这一点,无疑在Manus上得到了印证:他们通过工程能力,把市面上的功能整合在一起,并得到了丝滑体验和更好用的结果。
除了“Less structure, more intelligence”,根据公众号《自动华.AI》透露,在今天的闭门会上,Manus团队还分享了以下4个观点:
/ 01 /
Manus的两个细节
首先,Manus虽然定位于“通用Agent”,但仍然主要聚焦于信息收集与研究。
从官方分享的案例看,既有显而易见的工作场景,也有旅行规划之类的生活场景,包括撰写研究报告、数据分析、寻找潜在客户、生活场景(旅行规划)和教育。
这和智谱的AutoGLM走得路子完全不一样。智谱AutoGLM更像个人生活助理,AI帮用户发红包、点外卖、打车、查询路线。
这背后体现了Manus团队与智谱在Agent上的理解差异:Manus侧重于压榨模型能力,去完成更复杂的任务,而后者希望从简单日常的任务入手,去创造能够让更多大众上手的产品。
相比于AI发红包,文案工作场景显然是更适合当下AI的。因为这类工作往往需要耗费大量时间,需求最刚性,同时也是大模型最擅长的领域,只要提供足够的context和环境,大模型的表现远超人类。
第二,Manus会完整展示它正在执行的所有步骤,并模拟人类的使用习惯。
在演示案例中,Manus会拆解用户的任务,分解成一项项他可以执行的小任务,然后去获取完成任务所需要的信息,允许用户中途暂停工作流,提供反馈,然后让Agent继续。
同时,Manus会把过程中获取到的所有信息都保存下来,然后提供在最后综合输出成用户要求的报告。这有点类似于DeepSeek思维链展示,告诉用户它是如何得出这个结果的,用户自然也会更信任它提供的东西。
不仅如此,乌鸦君还注意到,在演示案例中,Manus会模拟人类行为,比如对PDF进行翻页,或者一个个打开网页浏览。理论上说,大模型可以瞬间阅读大量资料,能够更高效地获取信息。
之所以这么做,一个重要的原因是,现在互联网的环境都是根据人类使用习惯设计的,为了兼容性和通用性,暂时模拟人类的使用习惯。未来随着AI能力的提升,Agent应该会形成更高效的沟通协作模式。
/ 02 /
押注模型灵活性的胜利
Manus真正强大的地方在于两点:通用任务上的泛化性和自主执行任务最终交付结果。
单从功能上看,Manus的每一个功能都有对应的先例,比如Deep Research、Artifact、Web Search。而Manus厉害的地方在于,利用大模型的强大推理和泛化能力,把以上功能整合在一起,避免了用户在多个工具之间跳转并得到了丝滑体验和好用的结果,这就很厉害。
这种通用性不仅来自Manus团队深厚的工程积累,也是其对于AI产品的独特理解。
其中,最重要的是,Manus团队提出,“Less structure, more intelligence”,主张减少对AI的结构化限制,依赖模型自主进化能力,而非人工预设流程。
简单来说,就是减少对大模型的限制,充分利用大模型能力的进化,去更高效地完成更多的任务。
这让乌鸦君想起了不久前Andon Labs联合创始人(YC 24W孵化)Lukas Petersson的观点。
他在调研了100多个YC校友项目后,提出了一个看法:
现在大量AI产品在当前模型的局限性上投入过多精力,但从长期看,创业公司更应该押注那些能够充分利用大模型自主性与灵活性的机会。
在他看来,提示词等优化工程固然可以提升AI的效果,但上限很明显。更好的策略是,等待一个更强大的模型。在这个过程中,那些自主性更强的产品,将取得更好的效果。
这一点,正在得到显现。比如,Manus团队在沟通会上透露:其性能已经能够打败了YCW25上几乎3/4的Agent 初创公司。
Manus恰恰是这一理念的践行者。他们相信AI可以比人更聪明,并给了大模型足够的空间去做自主规划和执行的。
固然,从实际效果看,Manus的使用场景并没有太大突破,但随着模型能力的提升,场景边界可能随时间推移而拓展。
基于此,Manus也提出了新的定义AI价值指标——Agentic Hours per User (AHPU)”,即衡量用户委托AI完成任务的时间效率,目标是通过并行任务提升生产力。
Manus团队在沟通会上透露,目前Manus单任务成本2美元,远低于业内平均的水平,而且仍有继续优化的空间。
除了以上两点,根据公众号《自动华.AI》透露,Manus在小范围闭门分享会上还分享了以下几点认知:
1)Manners产品未来使用体验三板斧
2)AI未来的核心是“劳动力扩展(Labor Scaling)”
即用户以老板身份高效管理多个AI代理,突破人类组织摩擦限制。而在这个路线上,用代码优先策略(利用LLM原生编程能力)、多模态网页交互(优于传统Markdown解析)、动态学习机制(非参数微调)构建技术护城河。
3)Why us,Why manus?
Manus团队凭借快速迭代能力(3个月战略窗口期)、灵活架构(避免大公司层级束缚)和坚定信念(坚持非主流认知)形成核心竞争力。且开始团队对浏览器产品投入开发过程中积累了多项独家创新功能和经验。
大厂决策周期难以跟上AI领域变化,甚至一个OKR都长于技术变化周期(拳拳到肉,某些大厂某些部门某些初创确实这个情况)
文/林白
PS:如果你对AI大模型领域有独特的看法,欢迎扫码加入我们的大模型交流群。
(文:乌鸦智能说)