一手实测智谱「AutoGLM沉思」：NB

智谱双击666

今天，在北京中关村论坛上，智谱两连发：

先是，智谱清言上线了「沉思」功能，它类似于Open AI的DeepResearch，特别擅长解答复杂问题。可以一边推理，一边搜索，沉思步骤可达20步以上，可浏览上百个网页，并生成长文报告。

体验地址：https://chatglm.cn

同时，智谱还发布了「AutoGLM沉思」Agent，带来了全球首款集深度研究和操作执行于一体的自主Agent。

「AutoGLM沉思」不仅具备DeepResearch的能力，还拥有动手能力。它可以像人一样自主浏览和操作网页，可以一边进行复杂思考，一边执行任务操作。

体验路径：下载智谱清言PC版，在智能体中心搜【AutoGLM沉思】，即可体验。

以上产品发布即上线，所有人都可以免费使用，不限量使用。

一手实测

下面，我们就来实际体验一番。

1）「沉思」功能测试

首先，先来体验下智谱清言的「沉思」功能。

进入chatglm.cn网站，会看到有一个“沉思”的标签，点一下开启。

最近，想买一台提高生产力的笔记本，于是我问智谱清言：

我是一名自媒体博主，想买一台笔记本电脑，预算8000-12000元，主要用于工作（写作、设计、视频编辑以及AI推理），Windows或苹果系统都可以。请从国内外评测网站搜索该价位的笔记本电脑，然后比较他们的核心配置、续航、轻薄程度等方面的优劣，并根据不同价位给出清晰的购买建议。

它沉思了7分55秒。

卧槽，这思考过程是真够久的。

粗略统计了下，整个思考过程它消耗了2万多tokens，回答也是1万多tokens。基本上，一个问题消耗3~5万的tokens，这可都是钱啊。

对于这个功能，要知道OpenAI一个问题就要2美刀，还得魔法上网。

但，智谱既不搞邀请码，也不限体验次数，所有人都可以免费畅用，智谱NB。

我们来看看智谱清言到底是怎么沉思的？

首先，理清楚用户的问题，这个算推理模型的基操了。

然后，开始进行搜索。它知道我要求“从国内、外评测网站搜索”，所以一上来就调用了查汇率的工具，来确认最新的汇率。

接着，进行关键词搜索，查询我要的笔记本电脑。

搜到信息后，它会对每一个链接进行仔细阅读，提取关键信息。

如果有信息丢失或不全的，它会自己进行补充搜索。

直到所有要信息都找齐后，它才会停止搜索，总结内容。这是不是像极了我们人类使用搜索工具的行为？

这个问题，你猜，它一共搜了多少次？

整整20次！！好家伙，这可能是我体验过DeepResearch程度最深的AI了。

看到这里，你可能想说：想那么多干什么？我要的是结果，结果不好有什么用，不过花拳绣腿罢了。

对于这一点，完全不用担心，它为我们生成了一份超详细的长文报告。

报告涵盖了引言、市场概括、推荐产品分类、核心配置对比、续航能力分析、轻薄成都对比、价格与性价比分析、使用场景分析、国内外评测网站评价、购买建议、总结等十多个部分，整整5000多个字。

而且，还有参考资料，方便我溯源。

真就像写论文一样——用户的每一个问题，都值得严肃对待。

整个生成过程，我录了一个视频，全过程未经任何剪辑和加速。

最近，MCP协议很火，火到OpenAI都来支持它竞对这一协议。

我知道，肯定还是有部分小伙伴不太懂MCP是什么，于是我让智谱清言写了篇科普文。

提示词：研究有关MCP（Model Context Protocol，模型上下文协议）的科学文献和资料，撰写一篇关于MCP的科普文章，输出尽量通俗易懂。

智谱哐哐就给我5k字输出，浅显直白，相信你也能看懂。

全部回答见：

https://chatglm.cn/share/FQvKc

最近，GPT-4o的生图能力很强。比如前面大家看到的MCP架构图，就是我用4o直接生成的。全过程，没有任何文字丢失。

为什么这么强？源于OpenAI的原生自回归模型，“自回归”又是个什么鬼，我们让智谱清言来“沉思”一下。

提示词：搜索有关OpenAI自回归模型（AR）的技术文献和资料，写一篇关于自回归的技术论文。论文框架：1.概述；2.介绍自回归模型；3.拆解OpenAI的自回归模型技术；4.剖析自回归模型技术在ChatGPT-4o中的应用；5.分析、对比自回归模型vs扩散模型；6.评估自回归技术的挑战与展望；7.总结。输出一万字的沉思报告。

详细过程，我录了一个视频。

这一万字论文，我也放今天二条了，欢迎大家前往阅读。

2）「AutoGLM沉思」测试

既然「沉思」功能已经这么强了，「AutoGLM沉思」还有什么杀招，我倒要看看。

首先，前往chatglm.cn网站下载智谱清言电脑版，进行安装。

安装过程中，它会自动在chrome浏览器安装一个智谱清言插件。

安装完成后，运行电脑版。在左侧导航栏，找到“AutoGLM沉思版”，就可以使用了。

最近漫威开拍复联5了，老MCU粉想重温下之前的电影，我看看能不能通过「AutoGLM沉思」帮我梳理电影时间线和豆瓣评分。

输入提示词：梳理MCU（漫威）所有超英电影，并按照故事时间线整理，列出每部电影的豆瓣评分。

这个提示词有3个问题，1是要找齐所有MCU超英电影，2是要梳理电影时间线，3是要查询豆瓣评分。让人工来整理，绝对要耗半天时间在这里。

然后，「AutoGLM沉思」就开始工作了。

如果有需要打开网页的，它会自己打开网页，进行关键词搜索，来获取答案。

在等了9分钟左右，它把答案整理出来了。

可以看到，所有电影的时间线和评分，都给整理出来了，非常全面。

全过程，我录了一个视频。

除调整浏览器窗口（给大家展示需要）动了下鼠标以外，其他过程，我没有动过任何鼠标和键盘，全部是「AutoGLM沉思」自己在工作。

太NB了，它就像人一样自主操作和浏览网页，像人一样感知这个世界，像人一样使用工具，完成从数据检索、分析到生成报告。

在我测的其他case里面，它还可以登录邮箱，访问小红书，打开京东，浏览B站，查询巨潮资讯，搜索公众号内容……基本上，所有能在浏览器里操作的事情，它都可以做。

这能解决什么问题？

可以解决目前很多搜索无法破解的内容壁垒问题。比如公众号、小红书、京东、巨潮咨询这些平台，他们基本都不对外提供API，所以不管是传统的搜索引擎还是新兴的AI搜索，都无法浏览这些平台的内容。

而这个智能体，它可以。

NB！以后，还上什么B班，都交给AutoGLM吧。

为什么是智谱？

今年，Agent的发展着实让大家小兴奋了一把。

先是某“通用智能体”凭借优秀的产品封装能力火出圈外，但大家要用上是真困难。而现在，智谱带着自己的自主智能体来了。所有人都可以使用，免费不限量。

国产自主Agent，果然扛大旗的还得是智谱。

在今天的中关村论坛上，我还注意到他们发布了这样一张图，给自己的Agent设计了明确的技术路线。

第一代，工具使用&代码编写。
第二代，智能体编排。
第三代，设备操控&自主智能体。
第四代，复杂问题，边想边干。

从去年的设备操控智能体AutoGLM，到现在的自主智能体AutoGLM沉思，智谱始终引领着Agent的每一个发展阶段，坚持全链路自研。

而且，据智谱介绍，关于「AutoGLM沉思」背后的基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型Z1-Rumination以及智能体框架，都将全部在这个月开源。

这绝非一句“NB”可以形容。

何其有幸，我们生在这样的时代，与一群如此有担当的公司与伙伴，一起见证人工智能的现在和未来。

愿君好运，乘风而行。

（文：沃垠AI）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

发表评论 取消回复

发表评论取消回复