「沉思」实测:第一次,AI 自己把活干、把钱赚(附:10+场景实践)

 

这一幕,我从未见过,来自智谱今天发布会:

“帮我到网上赚 100 块”

在实时演示中,主角 AutoGLM 登场,参与了《读者》的有偿征文,全自动赚金币。


“帮我在小红书上找一找有哪些「非网红、排队少、评分高」的北京宝藏餐厅”
我说。然后,我没动手,AI 动了。

Chrome 被自动打开,搜索、跳转、加载、一页页浏览,一条条复制引用,各种页面陆续弹出。十多分钟后,一份美食报告出现在我眼前。

更令我惊愕的是,执行任务的过程中,它甚至注意到评论区里的提示“福满园 10 年以前还行,去年怀旧又去吃了,质量严重下降。尤其是红烧带鱼!不知道是不是换厨子了。”,然后到知乎、点评等网站去核实信息了

发现有争议观点后,想到去交叉验证

写得不急,也不花哨,像一个刚转正的实习生,稳、慢、细,有点啰嗦,但比我预期的还清楚:会耐着性子跟你反复核实信息的实习生,可不多。

这不是 demo,不是 PPT,是我真实看到的:AI 在我的电脑上,自己动手,把大活干完了

不用反复调 prompt,不用总是来一嘴“再详细一点”,这东西就已经查完、看完、写完,然后安静地做了交付。

它叫「沉思」,现已可用

今天,这个产品正式上线。来自智谱,叫 AutoGLM 沉思

https://autoglm-research.zhipuai.cn/

名字听起来高冷,行为却特别主动。

调研、整理、对比、归档、成稿——你只说要做什么,它就自己去做完。

这不是「热情的但不解决问题的客服经理」,而是一个可以被甩活的 AI。活甩过去,它就真开始干。它干的,不是那种“对答如流”的「暖男活」,而是我们人类最容易拖延的那些任务:

  • • 信息太碎,要翻几十个网页才能理清;
  • • 操作太琐碎,抠公告、筛评论、对比细节;
  • • 不难,但烦,还得最后自己总结。

沉思,就是盯着这些事来的。


比如,我是一个炉石玩家,之前还攒齐了全卡包,包括佣兵模式(为什么要玩佣兵???)

佣兵是什么?正沉迷酒馆

这几天,炉石上了新版本「翡翠梦境」,可惜一直没时间玩。

“炉石新版本翡翠梦境,都更新了啥?”


沉思打开炉石官网、旅法师营地、九游、游民星空,查版本公告、补丁说明、社区蓝贴。

它先给出基础信息:145 张新卡、两大新机制“灌注”和“黑暗之赐”、新增传说荒野之神。

接着查每个职业的灌注技能:德鲁伊召唤植物魔像、猎人随机强化手牌野兽、萨满变形友方随从……都从官方卡牌图鉴和攻略站调出来了。

过程中还遇到页面 404,它自己换源,从另一份攻略补全剩下几个职业。

官网的这个页面,确实打不开

最后,我获得了一份堪称可用的内容整理。

在这个过程中:

  • • 你没问它查每个职业的技能细节,它查了。
  • • 你没让它跳过挂掉的页面,它绕开了。

这里,还有一些来自官方的沉思任务成果,非常有代表性:

“具身智能行业还有哪些标的能投?” 沉思调研最近三个月的行业新闻、券商分析、专家访谈,结合财务指标做出一份主题研报,涵盖趋势判断、竞争格局和风险提示。


“生成式 AI 会不会颠覆知识生产?” 它翻遍医学、法学、经济、艺术等 5 个典型领域的研究范式,对比传统学术流程与 AI 辅助写作的差异,输出了一万字以上的深度报告。


“推荐一款文艺风格的复古相机。” 沉思查遍小红书、B 站、知乎评测,列出不同风格相机的优缺点,区分胶片感、便携度、成像质感、售后口碑,并按风格和预算做了分组推荐。


“2025 年最值得关注的抗老成分是什么?” 它比了胶原仿生肽、第三代玻色因、植物视黄醇的实验室数据和真人实测,还顺手拉上了欧盟新法规和大牌配方复配逻辑,一并做了解读。


“我在选 MacBook Air 还是小米笔记本。” 沉思从参数、重量、电池、热控、社区口碑五个维度做横评,结合用户的出差场景写出推荐意见,并附带了中英文评测引用。


“我要去香港玩三天。” 它制定了包含每日路线的攻略,还逐条查了小红书里每个景点的最新评论,标注了哪些推荐靠谱,哪些过誉,哪些值得错峰。

…(我还想展示更多,但公众号只能插入十个视频)

有的是行业报告,有的是产品选型,有的是深度调研,也有冷门话题的系统梳理。 不光能看,还能直接拿来用。

最小交互单位:是任务

沉思不是 ChatBot,也不是 AI 搜索。它的最小输入单位,不是“prompt”,是“任务”。

  • • “给我做一个入门股市的教程”
  • • “我今天要做一个电动车市场的行业报告”
  • • “我需要一份 10 万以内电车的横向对比”

ChatGPT 会问你一堆问题:

我要是懂,就不问你了

沉思不会,动手就是干

不问我,沉思自己干

执行的过程中,你甚至会看到它点错页面、再退回;跳过一个广告,再手动滑动到底部;或者读了三条知乎长贴,只引用了其中一句。……

你知道它在认真干活,它不吵、不问,不等你指路,闷着头替你把事儿干完。

它不太爱说话,但每次都好好交工

沉思不快、UI 也不炫、不会引导你去分享

一切举止,像个第一次实习的新人,操作上还有点手忙脚乱。

但你看最终结果,会发现它交得踏实:有逻辑、有引用、有结构、能交付。

它会花费老半天,去读完很多材料,标注清楚引用,附上路径说明。没有无中生有,没有套话模板,有逻辑、有证据、有完整的交付物。

我让它写一篇《AI 对高等教育的影响》,它没有问“你想从哪开始”,而是直接去 Google 学术去查:政策、实践案例、研究摘要、在线教学课程,最后形成一篇完整的报告。甚至还总结了哪些观点容易过时、哪些数据有偏、后续建议关注方向。

他知道怎么做学术

但这一刻,我所看到的,不是它“聪明”,而是:AI 真的把你交代的事,当回事了

就如那个不太爱说话,但每次都非常靠得住的同事。

来路正、后路稳、都开源

那它为啥能这么干活?

并不是换了个提示词接口那么简单,它背后用的,是一套为“干活”专门设计的模型体系

它的底层模型叫 GLM-Z1-Air,不是为了陪聊、写诗、讲笑话而训出来的,而是为了完成复杂任务而生的

从对话,到推理

它能理解你要的结果,不是“一段话”,而是“一个完整的东西”; 能拆解任务路径,知道先查什么、再比什么、最后该怎么写。 说白了,它的训练目标,不是“答对”,而是“搞定”。

现在的「沉思」,便是在 Z1-Air 上又叠了一层模型,内部代号叫 Z1-Rumination,专门训练 AI 如何用工具、如何执行流程、如何反思中间步骤。从性能上来说,这东西比肩 DeepSeek-R1,速度最快提升 8 倍,价格只有 1/30,能在消费级显卡上跑,甚至可以本地部署

更快、更便宜

之前说过,智谱今年大开源,沉思这套也是,不藏着掖着的,全栈都会开源

  • • 基座模型 GLM-4-Air-0414
  • • 推理模型 GLM-Z1-Air
  • • 微调出来的沉思模型 GLM-Z1-Rumination
  • • 以及整个智能体执行框架

所有一切,都将在 4 月 14 日正式开源,陆续上线 bigmodel.cn

到时候,不只是“能用”,也“能接入、能跑、能改”。你现在用的「沉思」,就是这套系统的第一个完整体。

再往后,所有人都可以用这套模型搭建自己的 Agent,开源万岁。

有些事,可以不自己做了

这是一次细微、但足以留下重量的改变。

或许你会在某个周三下午、某个 PPT 赶不完的凌晨,或者家人问你“买哪个更划算”的时候,忽然意识到:

有些事,可以不自己做了。

你打开沉思,交代一句话,然后就去忙别的了。它不吵、不问、不等你指路,自己查、自己写、自己交。

留下痕迹的小小迈步

再过不久,你大概率会把它推荐给你团队里那个总是最早加班、最晚下班的人,或者那个总一个人扛下所有的朋友。

因为你知道,沉思这东西,真能替他们分担点什么。




最后,一个彩蛋:由「AutoGLM 沉思」做的小红书账号:2 周 5000+ 粉,还接了一条商单,赚了 500 块

由 AI 全权运营的小红书账号:Della 老师的知识小栈


 

(文:赛博禅心)

欢迎分享

发表评论