「沉思」实测：第一次，AI 自己把活干、把钱赚（附：10+场景实践）

这一幕，我从未见过，来自智谱今天发布会：

“帮我到网上赚 100 块”

在实时演示中，主角 AutoGLM 登场，参与了《读者》的有偿征文，全自动赚金币。

“帮我在小红书上找一找有哪些「非网红、排队少、评分高」的北京宝藏餐厅”
我说。然后，我没动手，AI 动了。

Chrome 被自动打开，搜索、跳转、加载、一页页浏览，一条条复制引用，各种页面陆续弹出。十多分钟后，一份美食报告出现在我眼前。

更令我惊愕的是，执行任务的过程中，它甚至注意到评论区里的提示“福满园 10 年以前还行，去年怀旧又去吃了，质量严重下降。尤其是红烧带鱼！不知道是不是换厨子了。”，然后到知乎、点评等网站去核实信息了

写得不急，也不花哨，像一个刚转正的实习生，稳、慢、细，有点啰嗦，但比我预期的还清楚：会耐着性子跟你反复核实信息的实习生，可不多。

这不是 demo，不是 PPT，是我真实看到的：AI 在我的电脑上，自己动手，把大活干完了。

不用反复调 prompt，不用总是来一嘴“再详细一点”，这东西就已经查完、看完、写完，然后安静地做了交付。

它叫「沉思」，现已可用

今天，这个产品正式上线。来自智谱，叫 AutoGLM 沉思。

名字听起来高冷，行为却特别主动。

调研、整理、对比、归档、成稿——你只说要做什么，它就自己去做完。

这不是「热情的但不解决问题的客服经理」，而是一个可以被甩活的 AI。活甩过去，它就真开始干。它干的，不是那种“对答如流”的「暖男活」，而是我们人类最容易拖延的那些任务：

• 信息太碎，要翻几十个网页才能理清；
• 操作太琐碎，抠公告、筛评论、对比细节；
• 不难，但烦，还得最后自己总结。

沉思，就是盯着这些事来的。

比如，我是一个炉石玩家，之前还攒齐了全卡包，包括佣兵模式（为什么要玩佣兵？？？）

这几天，炉石上了新版本「翡翠梦境」，可惜一直没时间玩。

“炉石新版本翡翠梦境，都更新了啥？”

沉思打开炉石官网、旅法师营地、九游、游民星空，查版本公告、补丁说明、社区蓝贴。

它先给出基础信息：145 张新卡、两大新机制“灌注”和“黑暗之赐”、新增传说荒野之神。

接着查每个职业的灌注技能：德鲁伊召唤植物魔像、猎人随机强化手牌野兽、萨满变形友方随从……都从官方卡牌图鉴和攻略站调出来了。

过程中还遇到页面 404，它自己换源，从另一份攻略补全剩下几个职业。

最后，我获得了一份堪称可用的内容整理。

在这个过程中：

• 你没问它查每个职业的技能细节，它查了。
• 你没让它跳过挂掉的页面，它绕开了。

这里，还有一些来自官方的沉思任务成果，非常有代表性：

“具身智能行业还有哪些标的能投？” 沉思调研最近三个月的行业新闻、券商分析、专家访谈，结合财务指标做出一份主题研报，涵盖趋势判断、竞争格局和风险提示。

“生成式 AI 会不会颠覆知识生产？” 它翻遍医学、法学、经济、艺术等 5 个典型领域的研究范式，对比传统学术流程与 AI 辅助写作的差异，输出了一万字以上的深度报告。

“推荐一款文艺风格的复古相机。” 沉思查遍小红书、B 站、知乎评测，列出不同风格相机的优缺点，区分胶片感、便携度、成像质感、售后口碑，并按风格和预算做了分组推荐。

“2025 年最值得关注的抗老成分是什么？” 它比了胶原仿生肽、第三代玻色因、植物视黄醇的实验室数据和真人实测，还顺手拉上了欧盟新法规和大牌配方复配逻辑，一并做了解读。

“我在选 MacBook Air 还是小米笔记本。” 沉思从参数、重量、电池、热控、社区口碑五个维度做横评，结合用户的出差场景写出推荐意见，并附带了中英文评测引用。

“我要去香港玩三天。” 它制定了包含每日路线的攻略，还逐条查了小红书里每个景点的最新评论，标注了哪些推荐靠谱，哪些过誉，哪些值得错峰。

…（我还想展示更多，但公众号只能插入十个视频）

有的是行业报告，有的是产品选型，有的是深度调研，也有冷门话题的系统梳理。 不光能看，还能直接拿来用。

最小交互单位：是任务

沉思不是 ChatBot，也不是 AI 搜索。它的最小输入单位，不是“prompt”，是“任务”。

• “给我做一个入门股市的教程”
• “我今天要做一个电动车市场的行业报告”
• “我需要一份 10 万以内电车的横向对比”

ChatGPT 会问你一堆问题：

沉思不会，动手就是干：

执行的过程中，你甚至会看到它点错页面、再退回；跳过一个广告，再手动滑动到底部；或者读了三条知乎长贴，只引用了其中一句。……

你知道它在认真干活，它不吵、不问，不等你指路，闷着头替你把事儿干完。

它不太爱说话，但每次都好好交工

沉思不快、UI 也不炫、不会引导你去分享。

一切举止，像个第一次实习的新人，操作上还有点手忙脚乱。

但你看最终结果，会发现它交得踏实：有逻辑、有引用、有结构、能交付。

它会花费老半天，去读完很多材料，标注清楚引用，附上路径说明。没有无中生有，没有套话模板，有逻辑、有证据、有完整的交付物。

我让它写一篇《AI 对高等教育的影响》，它没有问“你想从哪开始”，而是直接去 Google 学术去查：政策、实践案例、研究摘要、在线教学课程，最后形成一篇完整的报告。甚至还总结了哪些观点容易过时、哪些数据有偏、后续建议关注方向。

但这一刻，我所看到的，不是它“聪明”，而是：AI 真的把你交代的事，当回事了

就如那个不太爱说话，但每次都非常靠得住的同事。

来路正、后路稳、都开源

那它为啥能这么干活？

并不是换了个提示词接口那么简单，它背后用的，是一套为“干活”专门设计的模型体系。

它的底层模型叫 GLM-Z1-Air，不是为了陪聊、写诗、讲笑话而训出来的，而是为了完成复杂任务而生的。

它能理解你要的结果，不是“一段话”，而是“一个完整的东西”；能拆解任务路径，知道先查什么、再比什么、最后该怎么写。 说白了，它的训练目标，不是“答对”，而是“搞定”。

现在的「沉思」，便是在 Z1-Air 上又叠了一层模型，内部代号叫 Z1-Rumination，专门训练 AI 如何用工具、如何执行流程、如何反思中间步骤。从性能上来说，这东西比肩 DeepSeek-R1，速度最快提升 8 倍，价格只有 1/30，能在消费级显卡上跑，甚至可以本地部署。

之前说过，智谱今年大开源，沉思这套也是，不藏着掖着的，全栈都会开源：

• 基座模型 GLM-4-Air-0414，
• 推理模型 GLM-Z1-Air，
• 微调出来的沉思模型 GLM-Z1-Rumination，
• 以及整个智能体执行框架

所有一切，都将在 4 月 14 日正式开源，陆续上线 bigmodel.cn。

到时候，不只是“能用”，也“能接入、能跑、能改”。你现在用的「沉思」，就是这套系统的第一个完整体。

再往后，所有人都可以用这套模型搭建自己的 Agent，开源万岁。

有些事，可以不自己做了

这是一次细微、但足以留下重量的改变。

或许你会在某个周三下午、某个 PPT 赶不完的凌晨，或者家人问你“买哪个更划算”的时候，忽然意识到：

有些事，可以不自己做了。

你打开沉思，交代一句话，然后就去忙别的了。它不吵、不问、不等你指路，自己查、自己写、自己交。

再过不久，你大概率会把它推荐给你团队里那个总是最早加班、最晚下班的人，或者那个总一个人扛下所有的朋友。

因为你知道，沉思这东西，真能替他们分担点什么。

最后，一个彩蛋：由「AutoGLM 沉思」做的小红书账号：2 周 5000+ 粉，还接了一条商单，赚了 500 块

由 AI 全权运营的小红书账号：Della 老师的知识小栈

（文：赛博禅心）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

它叫「沉思」，现已可用

最小交互单位：是任务

它不太爱说话，但每次都好好交工

来路正、后路稳、都开源

有些事，可以不自己做了

发表评论 取消回复

发表评论取消回复