一手实测智谱「AutoGLM沉思」:NB


智谱双击666


今天,在北京中关村论坛上,智谱两连发:


先是,智谱清言上线了「沉思」功能,它类似于Open AI的DeepResearch,特别擅长解答复杂问题。可以一边推理,一边搜索,沉思步骤可达20步以上,可浏览上百个网页,并生成长文报告。


体验地址:https://chatglm.cn


同时,智谱还发布了「AutoGLM沉思」Agent,带来了全球首款集深度研究和操作执行于一体的自主Agent。


「AutoGLM沉思」不仅具备DeepResearch的能力,还拥有动手能力。它可以像人一样自主浏览和操作网页,可以一边进行复杂思考,一边执行任务操作。

体验路径:下载智谱清言PC版,在智能体中心搜【AutoGLM沉思】,即可体验。


以上产品发布即上线,所有人都可以免费使用,不限量使用。


一手实测


下面,我们就来实际体验一番。


1)「沉思」功能测试


首先,先来体验下智谱清言的「沉思」功能。


进入chatglm.cn网站,会看到有一个“沉思”的标签,点一下开启。


最近,想买一台提高生产力的笔记本,于是我问智谱清言:


我是一名自媒体博主,想买一台笔记本电脑,预算8000-12000元,主要用于工作(写作、设计、视频编辑以及AI推理),Windows或苹果系统都可以。请从国内外评测网站搜索该价位的笔记本电脑,然后比较他们的核心配置、续航、轻薄程度等方面的优劣,并根据不同价位给出清晰的购买建议。


它沉思了7分55秒。


卧槽,这思考过程是真够久的。


粗略统计了下,整个思考过程它消耗了2万多tokens,回答也是1万多tokens。基本上,一个问题消耗3~5万的tokens,这可都是钱啊。


对于这个功能,要知道OpenAI一个问题就要2美刀,还得魔法上网。


但,智谱既不搞邀请码,也不限体验次数,所有人都可以免费畅用,智谱NB。


我们来看看智谱清言到底是怎么沉思的?


首先,理清楚用户的问题,这个算推理模型的基操了。


然后,开始进行搜索。它知道我要求“从国内、外评测网站搜索”,所以一上来就调用了查汇率的工具,来确认最新的汇率。


接着,进行关键词搜索,查询我要的笔记本电脑。


搜到信息后,它会对每一个链接进行仔细阅读,提取关键信息。


如果有信息丢失或不全的,它会自己进行补充搜索。


直到所有要信息都找齐后,它才会停止搜索,总结内容。这是不是像极了我们人类使用搜索工具的行为?


这个问题,你猜,它一共搜了多少次?


整整20次!!好家伙,这可能是我体验过DeepResearch程度最深的AI了。


看到这里,你可能想说:想那么多干什么?我要的是结果,结果不好有什么用,不过花拳绣腿罢了。


对于这一点,完全不用担心,它为我们生成了一份超详细的长文报告。


报告涵盖了引言、市场概括、推荐产品分类、核心配置对比、续航能力分析、轻薄成都对比、价格与性价比分析、使用场景分析、国内外评测网站评价、购买建议、总结等十多个部分,整整5000多个字。


而且,还有参考资料,方便我溯源。


真就像写论文一样——用户的每一个问题,都值得严肃对待。


整个生成过程,我录了一个视频,全过程未经任何剪辑和加速。


最近,MCP协议很火,火到OpenAI都来支持它竞对这一协议。


我知道,肯定还是有部分小伙伴不太懂MCP是什么,于是我让智谱清言写了篇科普文。


提示词:研究有关MCP(Model Context Protocol,模型上下文协议) 的科学文献和资料,撰写一篇关于MCP的科普文章,输出尽量通俗易懂。


智谱哐哐就给我5k字输出,浅显直白,相信你也能看懂。


全部回答见:

https://chatglm.cn/share/FQvKc


最近,GPT-4o的生图能力很强。比如前面大家看到的MCP架构图,就是我用4o直接生成的。全过程,没有任何文字丢失。


为什么这么强?源于OpenAI的原生自回归模型,“自回归”又是个什么鬼,我们让智谱清言来“沉思”一下。


提示词:搜索有关OpenAI自回归模型(AR)的技术文献和资料,写一篇关于自回归的技术论文。论文框架:1.概述;2.介绍自回归模型;3.拆解OpenAI的自回归模型技术;4.剖析自回归模型技术在ChatGPT-4o中的应用;5.分析、对比自回归模型vs扩散模型;6.评估自回归技术的挑战与展望;7.总结。输出一万字的沉思报告。


详细过程,我录了一个视频。


这一万字论文,我也放今天二条了,欢迎大家前往阅读。


2)「AutoGLM沉思」测试


既然「沉思」功能已经这么强了,「AutoGLM沉思」还有什么杀招,我倒要看看。


首先,前往chatglm.cn网站下载智谱清言电脑版,进行安装。


安装过程中,它会自动在chrome浏览器安装一个智谱清言插件。


安装完成后,运行电脑版。在左侧导航栏,找到“AutoGLM沉思版”,就可以使用了。


最近漫威开拍复联5了,老MCU粉想重温下之前的电影,我看看能不能通过「AutoGLM沉思」帮我梳理电影时间线和豆瓣评分。


输入提示词:梳理MCU(漫威)所有超英电影,并按照故事时间线整理,列出每部电影的豆瓣评分。


这个提示词有3个问题,1是要找齐所有MCU超英电影,2是要梳理电影时间线,3是要查询豆瓣评分。让人工来整理,绝对要耗半天时间在这里。


然后,「AutoGLM沉思」就开始工作了。


如果有需要打开网页的,它会自己打开网页,进行关键词搜索,来获取答案。


在等了9分钟左右,它把答案整理出来了。


可以看到,所有电影的时间线和评分,都给整理出来了,非常全面。


全过程,我录了一个视频。


除调整浏览器窗口(给大家展示需要)动了下鼠标以外,其他过程,我没有动过任何鼠标和键盘,全部是「AutoGLM沉思」自己在工作。


太NB了,它就像人一样自主操作和浏览网页,像人一样感知这个世界,像人一样使用工具,完成从数据检索、分析到生成报告。


在我测的其他case里面,它还可以登录邮箱,访问小红书,打开京东,浏览B站,查询巨潮资讯,搜索公众号内容……基本上,所有能在浏览器里操作的事情,它都可以做。


这能解决什么问题?


可以解决目前很多搜索无法破解的内容壁垒问题。比如公众号、小红书、京东、巨潮咨询这些平台,他们基本都不对外提供API,所以不管是传统的搜索引擎还是新兴的AI搜索,都无法浏览这些平台的内容。


而这个智能体,它可以。


NB!以后,还上什么B班,都交给AutoGLM吧。


为什么是智谱?


今年,Agent的发展着实让大家小兴奋了一把。


先是某“通用智能体”凭借优秀的产品封装能力火出圈外,但大家要用上是真困难。而现在,智谱带着自己的自主智能体来了。所有人都可以使用,免费不限量。


国产自主Agent,果然扛大旗的还得是智谱。


在今天的中关村论坛上,我还注意到他们发布了这样一张图,给自己的Agent设计了明确的技术路线。


  • 第一代,工具使用&代码编写。

  • 第二代,智能体编排。

  • 第三代,设备操控&自主智能体。

  • 第四代,复杂问题,边想边干。


从去年的设备操控智能体AutoGLM,到现在的自主智能体AutoGLM沉思,智谱始终引领着Agent的每一个发展阶段,坚持全链路自研。


而且,据智谱介绍,关于「AutoGLM沉思」背后的基座模型GLM-4-Air-0414、推理模型GLM-Z1-Air、沉思模型Z1-Rumination以及智能体框架,都将全部在这个月开源。


这绝非一句“NB”可以形容。


何其有幸,我们生在这样的时代,与一群如此有担当的公司与伙伴,一起见证人工智能的现在和未来。


愿君好运,乘风而行。


(文:沃垠AI)

欢迎分享

发表评论