智谱上线AutoGLM沉思,OpenAI不再独享Deep Research

快,这个时刻来得太快了,

刚刚人在中关村参加发布会!

Deeper Research 不再是 OpenAI 专属了

智谱全量上了有 AutoGLM 能力的 Deep Research,

AutoGLM 沉思

结合了推理模型的深度研究能力和 Agent 的浏览器使用能力,AutoGLM 沉思既能轻松访问现有 AI 搜索引擎里需要登陆的网页(知网、某书、公众号、某东等),

又可以输出结构化的研究报告,单次任务的持续操作时间轻松超15分钟,能解决 Manus 里跟信息搜索相关的复杂任务。关键是免费体验不限量。

不限量,不限量,不限量,重要的事说三遍!

OpenAI的 Deep Research一个月10次,Gemini2.0 Deep Search 一个月10次,Manus 复杂任务一个月6-7次。

其实更早之前我们已经做过手机端 Auto-GLM、电脑端 GLM-PC 以及浏览器端的清言,智谱能第一个做出来这个一点都不奇怪。

内测智谱新Agent的72小时里,它接管了我的手机、电脑和浏览器

使用方法和原理我们放在后面,

现在不妨跟我一起深度体验一下AutoGLM 沉思的奇妙之处。我给它安排了地狱级难度,量大管饱。Here we go!

PS:下面跑的案例提示语和分享链接都打包好了,公众号发我“沉思”就行

Q1: 我需要一个从4月15日至23日,从北京出发的7天日本行程,预算为2500-5000美元,这是我和我未婚妻的旅行。我们喜欢历史遗迹、隐藏的宝藏和日本文化(剑道、茶道、禅修)。我们想看奈良的鹿,并步行探索城市。我计划在这趟旅行中求婚,需要推荐一个特别的地点。请提供一个详细的行程和一个简单的HTML旅行手册,包含地图、景点描述、必备的日语短语和旅行提示,以便我们在旅途中参考。

这个问题暗藏玄机,限制了时间、预算、偏好,以及不确定的点,模型要从整个行程里选择适合求婚的地点,同时还有追加需求,地图、景点、语言短语也要满足。

全程18分钟,AutoGLM 沉思完美执行了我的需求,视频是2倍速,强烈建议大家看看交互的细节:

  1. 支持不同的信息源(某乎、某书)的相互验证,很贴合我日常做行程攻略的方式
  2. 预览信息的时候能主动选择一个月内最热只看文章等条件
  3. 单个页面的操作速度很快,遇到搜索条件不满足的页面几乎是秒跳过,不纠结也没卡住
  4. 中间的额外点击、滑动等操作,并不会影响后续的自动操作,如果你不在电脑前也不需要担心卡在登录界面,它会预留出合适的时间,不行就换个信息源

我整体的感觉是舒适,操作网页的时候右下角会主动反馈模型正在做什么,不会有白等的感觉。中间我只切换了几次页面回到对话界面。

中间预览记录会全程留在电脑上,我还可以收藏网站或者做额外的浏览。

广度测试了,第二个例子难度升级,不仅要搜得广,还要够深入,能读懂我框出来的范围,

Q2: 编译一份详细的全球关键 AI 影响者名单,涵盖来自领先 AI 公司高管、投资者和研究人员关于 Deepseek R1 的观点。

这个问题同样有陷阱,第一个我要的是全球范围,英文网站也要能操作。第二我要是某个具体的事物R1的观点汇总,所以要求自然也会更高。

花了18分钟,AutoGLM 沉思给了我一个正儿八经的五千字报告。跟第一个案例不同的是,它可以二次推理,具体来说将第一轮不经过网页操作的信息作为源头,像树根生长一样,跳到同一网站的多个网页。当然它还机智跳到 DeeepSeek 的网站内看发出来的日志。。。

再来看看质量,研究报告的结构从评论分析起步,分析了院士、MIT Technology Review、AI 专家 Yann LeCun、Geoffrey Hinton、Meta、Microsoft、NVIDIA等,涵盖了学术界、投资界、甚至是某书上的高赞帖子里的评价。这种搜索方法也就是 Deep Research 才能做的到了,一句话就可以得到某个物体的全面评价。在这之前我都是要去找论文综述或者花个三四天看看wiki啥的。

Q3: 时尚行业中存在哪些垂直搜索人工智能解决方案?它们在哪些具体场景中得到应用?它们的定价模式是什么?它们服务于价值链的哪些部分?这些产品之间如何相互区分?

在冷门类型的问题里,AutoGLM 沉思是不是还是能保持自己的高水准呢?行业解决方案类的问题通常只会出现在某某白皮书里。这里我截取了部分的输出结果,一字没改:

  • 时尚行业中的AI应用包括:时尚设计、推荐系统、对话机器人、流行趋势分析、智能制造等
  • 有提到几个具体的公司和产品,如 Heuritech、波司登AI系统、Fashion Diffusion 大模型、Style3D AI 产业模型等
  • Heuritech 是一个使用AI技术分析社交图片预测零售趋势的公司,每天分析超过300万张社交图片
  • AI在时尚行业的应用包括虚拟试穿、时尚合成、时尚检索等功能

推理模型的好处就是AutoGLM 沉思在一个完整对话里的每一小节都会回顾自己目前做到了什么,根据现在的状态还需要做什么,以及不同信息源的差别。最6的是连人家定价方案都扒出来了。

AutoGLM 沉思的出现还解决了我一个大难题,

应该没有人没听过这个问题吧,“最好用的XXX是什么?”,这个XXX就很灵性了,可以是大模型、AI生图、AI视频、AI PPT等等一系列,但千人千面,每个人背景不同,很难通过搜索得到满意的答案。

Q4: 作为一名拥有3年以上经验的专注于视频制作(拍摄/剪辑)和叙事设计的自媒体创作者,我需要你获取一些工具来简化剧本创作和情节发展。

主要需求:- 对话/故事板剧本创作工具

得益于推理模型,AutoGLM 沉思可以每一轮都保留我的背景信息,它上来就先给自己定了一个计划:

  1. 深入了解专业剧本创作工具(包括传统软件和AI工具)
  2. 研究故事板制作工具和软件
  3. 探索专为视频创作者设计的叙事结构工具
  4. 寻找能够简化剧本到视频制作流程的综合解决方案
  5. 了解专业创作者(特别是视频和叙事设计领域)的实际使用体验和推荐

跟自己搜索最大的不同的是,AutoGLM 沉思给出结果兼顾了AI工具和传统工具,DeepSeek、Midjourney 跟 Celtx、Final Draft、StoryBoard Quick 有一天会放在一起我是没想到的。

最终的结果考虑到了适用人群、价格范围、场景推荐以及工具里是否内置AI辅助。

最后一个案例是个万金油,

学习一个东西关键是要成体系,尤其是学习语言。所以将AutoGLM 沉思性能拉满的问题就是:

Q5: 你能为我创建学习 language telugu 的资源吗?

这个泰卢固语是基本只在印度东南部使用,该语言的第一批书面材料可追溯到公元 575 年。

AutoGLM 沉思在首轮就找到了50languages清华大学语言教学中心上海外国语大学等资源,比我自己动不动就某盘聪明不少。

同时给出了相当不错的语言学习体系,从在线课程、词汇表、测试系统、发音指导,甚至我自己学语言的私藏小技巧:找平价的口语老师都列出来了。我还刻意去发给了我几个做线上教育的朋友,他们给的回复都挺统一的:

这是一个相当不错的开头!

在我看来,AutoGLM 沉思意味着不需要再设计复杂提示语,

它能够直接展示出它浏览总结的网页,并且保留在我的电脑上方便我扩展阅读或者收藏,

也能够直接操作我的个人账号进行搜索,学习平台推荐的复合我个人偏好的内容,

也不再需要担心模型错过冷门、非直观的信息,

总的来说,它更全面,也更懂我。

发布会上,智谱团队还宣布了用AutoGLM 沉思做了一个某书的知识分享账号,已经超3k粉了。。。(危机感满满)


 如何使用?

满血版的使用方法相当友好,

第一步就是先安装好智谱清言的PC端,安装清言浏览器插件

🔗 autoglm-research.zhipuai.Cn/

第二步就是在点开的界面里选择AutoGLM后直接开问!

想验证是否安装成功的方法非常简单,因为智谱已经提供了很多cases,任意选择一个发送到对话,在对话的过程中AutoGLM 沉思就自动弹出网页操作。

不同于一些类 Manus 的项目完全依赖 Claude 和 GPT 的能力,

AutoGLM 沉思背后支持的大模型用的都是自研的

延续了智谱的一贯风格,推理模型用的是GLM-Z1-Air,为Agent提供推理、规划与反思能力。效果媲美 DeepSeek R1,速度提升8倍,价格是R1的1/30,可以在消费级显卡上运行;

基座模型用的是GLM-Z1-Air-0414,针对推理和智能体任务做了专门的训练,更擅长代码编写、工具调用等智能体任务

在 GLM-Z1-Air 的基础上,通过强化学习训练出了沉思模型GLM-Z1-Rumination,提升了模型结合工具使用完成长程推理的能力。

所以智谱这一条模型进化线路是明确的,很有针对性的。


 写在最后 

我们的源神智谱从来没让大家失望,

之前就宣布的开源年还在发力中,

才过了27天,这次AutoGLM 沉思的基座模型GLM-4-Air0414推理模型 GLM-Z1-Air沉思模型 Z1-rumination、智能体等核心框架,都将在4月14日正式开源,

后续还会有基座模型的免费版本也会升级到GLM-4-Flash-0414,我的常用模型列表又可以升级一波了。

Deep Research 已经推出了56天,它很厉害,后面追随它推出的 Deep Search、Deeper Search们也很厉害,

但用过的人又有多少呢?

就是因为他们的门槛太高,能体验的次数太少,

但智谱一直以来就是在不断缩小门槛,

这不就是科技平权?

这不就是让所有人都有机会用 Agent?

我始终认为,

这是在未来发展,

尤其是AI时代的发展,

最必不可少的且贡献最大的一步。

@ 作者 / 卡尔 & 阿汤 @ 动手学AI知识库 / learnprompt.pro


(文:卡尔的AI沃茨)

欢迎分享

发表评论