
Yoky|yokyliu@pingwest.com
当深度思考遇上Agent,真全能的AI来了?
智谱AI在OpenDay上发布了全球首个集深度研究和操作执行于一体的Agent产品——AutoGLM沉思。有别于大多数只会打嘴炮的AI,这款号称“边想边干”的产品不仅能思考,还能实时操作浏览器,像真人一样打开网页、检索信息、生成报告。
我们第一时间进行了一手评测,用三个实际工作场景测试后不得不说:这次不是PPT产品,这次是真的能用!
通用Agent一直面临的最大难题是C端场景过于复杂多变,导致稳定性和准确性难以保证。智谱通过“先思考再执行”的策略解决了一部分准确性的痛点。AutoGLM沉思会先制定完整研究计划,再一步步执行,最后进行系统总结,大大降低了幻觉率和操作失误率。
AutoGLM沉思之所以能真能用,关键在于其背后的技术栈。它基于智谱自研的推理模型GLM-Z1-Air训练,这个模型号称性能比肩DeepSeek-R1,但速度提升最高8倍,价格仅需其1/30。深度推理能力让它不仅能像OpenAI的Deep Research一样进行深度思考,AutoGLM框架则赋予了它真实的操作能力,能自动浏览和操作网页,获取更多高质量信源。
而且对于打工人来说,AutoGLM沉思完全免费且不限次数使用,现场智谱用它演示了“如何赚到100块钱”以及“14天小红书起号计划”,我们实测下来,AutoGLM沉思打破了“通用Agent等于玩具”的刻板印象,不过由于“边想边干”的工作方式,它完成一项复杂任务往往需要5-20分钟不等,效率确实有待提高。但考虑到它能完成的任务复杂度和准确性,这个时间成本其实已经比人工低得多。
当深度调研与实际操作能力相结合,通用Agent终于要从概念走向实用了?
以下是硅星人针对自媒体常见三个场景:热点分析、财务分析和计划制定,对AutoGLM进行了实测。
一、热搜话题评论分析
我让AutoGLM沉思分析一下微博上关于“胖东来店长月薪近8万”这个热门话题的主要观点、大概占比和能得出什么结论,AutoGLM沉思整个运作的过程如下。
本文视频均经过倍速处理
接到任务后,AutoGLM沉思先去了解了胖东来这家公司和这个话题的基本情况,确认了消息来源和薪资数据。它尝试直接去微博抓取和分析讨论,但好像遇到了点技术困难,可以抓取微博帖子,但没法直接看大量的评论。

于是,它换了个思路,开始广泛搜索相关的新闻报道、创始人于东来的发言、以及其他社交平台(像知乎、小红书)上关于这个话题的讨论和帖子。通过阅读这些替代来源的信息,特别是小红书上的一些帖子和评论。

最终还是给出了一个信息量丰富、逻辑清晰的分析报告。值得注意的是不仅回答了我的问题,还深挖了背景信息和商业逻辑,让结论更有说服力。
可以上下滚动的图片
从这个过程来看AutoGLM沉思挺灵活,路子堵了知道换条道走,最后还是把任务完成了。不足是因为没直接看微博,观点比例是靠其他平台的信息,没有严格遵守用户的要求,如果能直接处理微博数据,分析会更扎实。
二、特斯拉股票分析
我们让AutoGLM深思做一份全面的特斯拉股票分析报告,要求包含财务、市场情绪、技术面、竞品对比等方面。

AutoGLM深思接到任务后,先是搜集了特斯拉的基本情况和最新动态,了解了大概的业绩。然后它开始深入挖掘,找详细的财务数据,虽然尝试直接读官方年报没成功,但还是从其他财经网站把关键数据(像营收、利润、现金流)扒拉出来了。接着,它又去查了分析师们怎么看这只股票、市场情绪怎么样、股价图走势如何,还重点比较了特斯拉和比亚迪等竞争对手的优劣。

最后,它把这些信息汇总起来,从价值投资的角度分析了潜力和风险,做了个SWOT总结,并针对不同类型的投资者给出了建议,形成了一份详细的报告。
可以上下滚动的图片
和上面热搜评论分析的情况类似,AutoGLM深思能按照给出的框架一步步去搜集和分析信息,覆盖面很全。即使遇到信息获取的小障碍(比如直接读年报失败),也能换个途径把任务完成。不过整个过程看起来挺繁琐,搜了很多次,花了些时间。
实际上这个股票分析的任务也是Manus的官方案例之一。
对比两个产品完成任务的过程来看,Manus像一个自动化分析师 + 开发者。它明确地执行计划、调用工具、获取特定数据(如股价、财务指标)、进行计算(如DCF估值、技术指标)、生成图表,并且过程非常透明,用户能看到它一步步在做什么。除了生成了详细报告,还做出了一个交互式的数据看板。AutoGLM沉思在信息搜集和总结方面做得不错,但显得工具化和分析能力稍弱一些。
三、日本七日游旅行计划
我们继续让AutoGLM沉思和Manus同题“打擂”,让AutoGLM沉思规划为一对美国公民规划一个4月中从西雅图出发的7天日本行程:预算在2500-5000美元,喜欢历史文化(特别是剑道、茶道)、想看奈良的鹿,而且打算在这次旅行中求婚,需要推荐个特别地点,最后还要个简单的网页版旅行手册。

接到任务后,AutoGLM沉思先去查了西雅图到东京的航班大概价格和时间,确认了美国公民去日本不用签证。然后它研究了在日本几个城市间怎么走最方便(主要是新干线),接着就针对兴趣点(历史、文化体验)去搜东京、京都、奈良的景点和活动,特别找到了东京可以体验茶道和剑道的地方(从小红书上找的信息)。还查了4月份天气怎么样,并且根据别人的经验推荐了东京塔下的公园作为求婚地点。

最后,它把这些信息整合起来,做了一个每天的详细行程安排,加了些日语短语和旅行提示,还生成了一个简单的HTML格式的旅行手册,但可视化程度有限,基本上是提炼了一些要点。
可以上下滚动的图片
总结
对比来看,AutoGLM沉思强项是资料获取和信息收集,但过程有点“黑箱”,不太清楚它怎么筛选信息、怎么做的决策,但遇到问题知道换个法子试试,很喜欢小红书这类社交平台,这让它可能更擅长找到一些普通用户分享的、非官方的、甚至有点“网红”性质的地点或体验。这可能是个优势,能挖到那种更依赖官方或结构化数据的 AI 找不到的信息。对于想直接“抄作业”的用户来说,可能更直接、更省事。
而Manus的过程更透明,用的方法更多样,最后给的东西(行程、求婚指南、手册分开)更规整、更专业。
整体来看,经过这次AutoGLM沉思的评测体验,虽然有一些槽点,但不得不说,AutoGLM沉思给人的印象确实是勤奋得令人印象深刻,而且考虑到其免费特性,它很可能是你能接触到的最好用的免费AI劳动力了。它就像一位不知疲倦的实习生,默默在后台为你搜集信息、整合分析,而且完全免费。这意味着你可以放心尝试各种不同场景,探索它的能力边界。免费的最大好处就是极低的试错成本,用户可以放心地让它尝试各种不同的应用场景和任务。探索它的能力边界。
当然,它也有明显的短板。任务处理速度不算快,有时一个分析可能需要半小时以上。不过好在你不必干等着,完全可以让它在后台默默工作,自己去处理其他事情。唯一的小烦恼是,它会不时地自动打开新网页,如果你正在Chrome浏览器中工作,可能会有些干扰。
这或许是人类与Agent之间的第一次“领地争夺战”——谁才是电脑的真正主人?(笑)

(文:硅星人Pro)