大家好我是歸藏(guizang),今天给大家带来秘塔深度研究的体验。
从 Open AI 第一次提出到今天,这类 Deep Research 功能的成本一直都非常高昂,几乎没有产品会给用户免费提供。
秘塔的深度研究(https://metaso.cn/)昨天上线了,这应该是第一个将深度研究当做基础的免费功能提供给用户的产品。

AI 搜索或者 AI 深度研究最重要的就是减少模型幻觉,提高搜索结果和推理结果的准确性,一般大家都会从两个部分进行优化:
- 首先就是通过算法和模型真的提高搜索结果和信息获取的准确性,然后加上模型验证等方式降低模型幻觉。
- 由于我们无法彻底根除模型幻觉,第二个方式就是通过各种交互和展示帮助用户低成本快速的完成信息的验证,给用户信心。
秘塔在这里两部分都做了非常多的工作。
首先秘塔为了降低成本同时保障准确性做了很多工作,他们将深度研究拆分为多个子任务进行分段强化学习,从而大幅降低了降低资源消耗,又能维持非常高的准确性,在BrowseComp等评测集上也体现了这一点。

然后在通过交互和展示帮助用户快速完成信息验证增强信心的方面,秘塔这次用一种非常新颖的交互打开了深度研究算法的黑箱,让用户直观的看到了模型在执行任务过程中的动态“问题链”本身。

这个可以说是在搜索结果后面增加标注后的另一个非常重要的 AI 产品交互创新了。
整个问题链有三个部分:
- 首先是最上面的预览,这部分会跟随模型搜索的进展实时进行推进,你能够聚焦到当前的进度以及模型为什么要进行这次搜索的原因。
- 然后是左下角的 Console 部分,在这里会用纯文本的方式滚动展示搜索进度和每次搜索的摘要,
- 右下角是总览视图,方面你预览你现在看的是整个流程中的哪个部分。

然后在上面这部分我们就可以清晰的理解深度研究的执行逻辑,他用不同的颜色卡片标注了每次推理的结果和原因。
比如绿色的就是这部分结论已经明确了可以放在报告中,紫色的就是结论未完善还需要继续推理,橙色的卡片代表这个推理信息缺失需要补充。
而且每个卡片的连线位置会写出发散这个路径的原因,比如是需要公式推演还是需要补充信息以及具体化。

这套交互一上可以说对搜索结果的置信度提高了非常多。
AI 深度研究的算法对用户来说不再是一个黑盒一个似乎永无止境的进度条,我能够看到他在搜索什么推理什么以及为什么要搜索这部分内容。
除了帮你理解过程外,秘塔深度研究还有一个优势是在研究结果的表现上。
他让 AI 深度研究的结果不再是密密麻麻的文字罗列,他们会用各种模态的信息和表现形式帮你理解结果。
首先是你可以听讲解,每次生成的结果上方都会有个按钮点击以后会生成一个讲解播客,让你在有事情需要做的时候也可以通过耳朵对结果进行核实。

在大家习以为常的搜索结果后面的数字标注上他们也做了非常多的创新,你在 Hover 对应的数字的时候右侧的引用链接会高亮变成卡片,然后你还可以生成单个来源的内容的语音讲解。

对于 PDF、视频在标记上也做了特殊处理,视频是粉色,PDF 文件是红色,如果是 PDF 点击后会直接在侧边栏展开方便你进行对照。

最后你还可以基于搜索结果生成可互动的研究报告网页,里面除了文字和可视化排版外,他还会搜索对应主题的图片和视频填充进去丰富内容,极大的丰富了报告的维度。
比如这个关于娃哈哈宗庆后遗产问题的搜索结果里面,他插入了一个了解宗庆后生平的 B 站视频,非常强。

说完了这么多交互和产品设计上的创新和优化,我们来看看最核心的搜索结果怎么样。
我这里找了三个问题,这次找的社会热点问题(娃哈哈宗庆后遗产争议)、金融热点问题(稳定币是怎么回事)和游戏热点问题(用 AI 帮助我进行三角洲猛攻),老用 AI 信息搜索结果来测试 AI 产品也不太好。
首先是最近闹得很热的关于娃哈哈宗庆后遗产分配的案子。
帮我检索最近关于娃哈哈宗馥莉争家产时间的前因后果,并且给出详细的时间线和报道
他先是非常简单的描述了一下纷争的爆发点和其中的核心争议,而且非常全面和准确。
然后按照我的要求给出了对应的时间线,分别从时间、事件以及这个事情目前的进展或者证据,你可以非常清晰的了解完整的事件信息。


最后他还对时间可能发生的后续影响给出了分析,比如当前大家的争议在什么地方,法律上有什么冲突,以及对公司治理有什么影响。
不是那种又臭又长的废话罗列,整个结果和过程都非常清晰。


搞完了这种热点事件,我们再让他搞一个热点事件延伸出来的知识科普。
最近稳定币很火,但是为啥 Web 3 很多国家都在打击,这个东西也是基于 web3 但又好像变合法了,都是不太清楚的。
解释一下最近很火的稳定币是怎么回事,对国内金融和对 Web3 行业分别有什么影响,各国的进展是什么,涉及海外的信息用英文搜索
他的搜索结果非常的好理解,首先非常简单明了的解释了稳定币的核心机制以及类型,还有什么技术突破让稳定币成为可能。
然后又介绍了对我们中国的影响,尤其抓住了重点就是大陆和香港双轨制这个特色,香港适当放开,内地继续严格管控。


然后才介绍对于整个 Web 3 行业的影响和全球的监管进展。
整个结果非常有条理,是最方便理解的,而且他判断我优先想了解对国内的影响然后才是 Web3 行业和全球监管。


最后我想整个好玩的,游戏攻略一直是我自己搜索的一个非常大的痛点,因为游戏经常因为版本迭代让旧信息失效,搜出来标题上说的是你想搜的,点进去发现内容以及过时很久了。
比如这里我就让他根据《三角洲行动》最新版本的帮我制定一下我的猛攻策略,帮我狂赚哈夫币,这个问题非常考验模型对于时效性内容的核实和理解。
帮我检索三角洲行动这个游戏搜打撤模式的最新版本信息,从武器搭配、改造到刷图方式地点、资金分配制定一套策略,让我猛赚游戏币
结果他洞悉了我的意图,上来就告诉我 7 月份这个大版本更新了哪些内容,武器和地图资源这两个关乎收益最核心的内容有哪些变动。

然后根据武器和地图资源的变动帮我制定了配装方案和地图搜索方案。
甚至为了方便理解还给我画了搜图流程图,让我自己判断高风险和低风险分别走哪部分。


他也没忘记资源最大化这个目标对于收益模型进行了计算,分别从初期积累、中期扩张和高收益攻坚三部分给出了投入成本和收益倍率。
最后还给出了当前版本不应该带的武器和一些由于版本更新带来的认知误区,太强了。


好了今天的测试基本就到这里了。
在 AI 模型和功能越来越贵的今天,秘塔一直坚持搜索是基本服务这个理念,不止基础的 AI 搜索服务一直免费,甚至现在连深度研究这种级别的服务也在免费提供。
秘塔不是简单地做慈善,而是通过技术创新真正降低了成本。他们把复杂的深度研究任务拆解、优化,用更聪明的方式达到同样甚至更好的效果。这种”既要又要”的执着,恰恰是技术进步的原动力。
在商业化浪潮中,依然有人相信,最好的技术应该服务最多的人;最强的能力,应该赋能最普通的探索。
愿更多人能用好这个工具,在信息的迷雾中找到自己的答案。毕竟,独立思考的能力,才是这个时代最宝贵的财富。
整理和探索不易,如果这篇内容对你有帮助,希望帮忙点个赞或者喜欢。我是歸藏(guizang),我们下一篇内容见。
(文:归藏的AI工具箱)