老板沉迷DeepSeek的背后,藏着一个真需求|

AI搜索的结果,有可能干预吗?

作者|王博

大年初二,边锋(化名)看到公司微信群里老板发了一条消息:“为什么没有我们?”


他赶紧点开看了一眼,之前从来不用AI大模型产品的老板用DeepSeek和豆包问了与公司所在行业相关的问题,并让大模型推荐行业内知名的公司,老板晒出了问答截图,但大模型的回答有竞品公司,没有他们公司的信息。


边锋测试了其他大模型产品,有的就能显示他们公司的信息,有的还能排在第一位。他把这些信息反馈给了老板,老板只回答了三个字:“多思考。”


春节假期之后,边锋的老板再次晒出DeepSeek的回答截图,要求团队按照DeepSeek方案去做用户增长并更新了KPI。有同事委婉地向老板提出疑问,老板回应了六个字:“你要被淘汰了。”


边锋的老板因为DeepSeek的回答没有他们公司而生气,但也有商家因为自己在DeepSeek的回答中排名靠前而高兴,并利用DeepSeek的回答做起了营销。


上海一家拉面店在门口打出广告写明DeepSeek推荐(左图),图片来源:小红书用户@柚子
「甲子光年」实际询问DeepSeek得到的回答(右图),图片来源:「甲子光年」截图


甲子光年」注意到,大模型产品的回答,尤其是DeepSeek的回答,正在被越来越多的人认可,且已具有商业价值。


而边锋的老板看似离谱行为的背后,藏着一个真需求——AI搜索引擎优化


边锋所在的这家公司属于传统行业,且是行业头部公司,拥有较高的行业知名度。如果在传统搜索引擎中搜索,只要正常做好SEO(搜索引擎优化),搜索相关内容都会出现该公司的信息。


但是,AI搜索的结果就不一定了。




1.AI搜索的逻辑变了

由于目前越来越多的大模型产品加入了联网搜索功能,因此有联网搜索功能的大模型产品(如ChatGPT、DeepSeek、Kimi、豆包等)和专门的AI搜索产品(Perplexity、夸克、秘塔AI搜索、纳米AI搜索等)都属于AI搜索的范畴。


此前,在《拆解SearchGPT后,我们发现了AI搜索的壁垒、突破和未来》一文中,我们曾说,AI搜索已经不是传统搜索。


为什么会这么说?


AI搜索主要有检索(Retrieval)和生成(Generation)两个步骤。


如果你在大模型产品中打开了联网搜索模式再提问的话,你会发现它会先检索了若干个网页,找到相关参考资料之后,再生成回答。


在检索方面,AI搜索会接入传统搜索引擎API,采用自建索引库,或使用新一代AI搜索引擎架构。在检索步骤里还有很多小步骤,比如意图识别、问题改写、检索结果重排、获取详情内容、内容过滤、上下文增强等。


在生成方面,AI搜索就是根据用户需求,基于检索出来的内容,通过不同的模型生成回答。


AI搜索流程图 ,图片来源:ThinkAny创始人idoubi、AI产品黄叔编辑


如果把检索和生成比作备菜和炒菜的话,那么接入传统搜索引擎API的“备菜”方式是相对粗放的,而使用新的AI搜索引擎架构的“备菜”的食材来源更有保障、质量更高,配料、调味料也更加精细,虽然最后“炒菜”的厨师是不同的大模型,经验能力有高有低,但“备菜”往往决定了最后菜品的口味。


博查AI搜索CTO翁柔莹Eileen告诉「甲子光年」,新一代AI搜索引擎和传统搜索引擎不同,它不再通过关键字密度和PageRank排序,而是通过混合检索和语义排序,为大模型提供最需要的内容。


第一阶段,进行向量+关键词两路混合检索。通过向量关联,直接匹配用户意图,然后通过关键字搜索解决部分直接匹配的需求,之后召回结果进行第一次排序。在这一层中,搜索引擎会沿用谷歌的EEAT原则(专业性、经验、权威性、可信度),对信息源的权威性、原创性、逻辑性等进行评分,增加内容源的排序权重分。


第二阶段,通过Semantic Reranker(语义重排器)进行语义排序。基于用户问题与搜索结果的语义相关性进行评分,并作为最终结果输出给相关AI应用中的大模型。由于Semantic Reranker与大模型都是基于Transformer架构,语义排序后的结果会更受大模型的“喜欢”,更加符合大模型生成内容的需要。


“博查目前在做的就是专为AI设计的世界知识搜索引擎,是基于混合检索和语义排序的新一代搜索引擎。”翁柔莹Eileen说,“目前我们主要服务B端AI应用厂商,承接着国内AI应用60%以上的联网搜索请求。”


AI搜索逻辑变了,就会导致即使是同一个用户用同样的问题,问不同AI搜索产品,也会得出不一样的结果。更不用说不同用户去问了。


这就可以解释前文那位老板的困惑。


那么SEO对于AI搜索还有用吗?


传统搜索引擎支持的是关键字搜索,SEO的核心是通过关键字密度、链接权重、页面结构等技术手段影响网页位置,希望可以获得更高的竞价排名。


而在AI搜索产品中,用户搜索方式转变为使用自然语言提问,必须使用新的AI搜索引擎架构来满足用户需求,这就会带来变化。“学术论文、权威机构网站的内容权重更高,低质量、过度优化或AI生成的SEO内容可能被判定为‘噪声’而过滤。”翁柔莹Eileen说。


总结来说,如果相关AI搜索产品是直接接入传统搜索引擎API的话,SEO还会有一定作用;随着越来越多的AI搜索产品使用新一代AI搜索引擎,SEO的作用将会逐渐下降。


但这并不意味着整体SEO市场已死。


市场研究机构Research and Markets数据显示,2024年全球SEO市场规模为891亿美元,预计到2030年将达到1439亿美元,2024年至2030年的复合年均增长率(CAGR)为 8.3%。


SEO市场规模,图片来源:Research and Markets


不过,AI搜索SEO是一个客观存在的需求,且随着DeepSeek的火热,需求被逐渐放大,这种需求不容忽视。


有人想到了方法——GEO。




2.GEO有效果吗?

2024年6月,来自印度理工学院德里分校、普林斯顿大学的学者和一些独立研究者在arXiv上发表了论文《GEO: Generative Engine Optimization(生成引擎优化)》,提出了GEO(生成引擎优化)概念、 框架及相关的实验设计。


图片来源:《GEO: Generative Engine Optimization》


这篇论文介绍,大模型的出现带来了搜索引擎的新范式,这些搜索引擎利用生成式模型收集和总结信息以回答用户的查询。这一新兴技术,论文作者在统一的框架下称之为生成引擎(Generative Engines)。


虽然生成引擎显著提高了用户效率和相关产品的流量,但它给第三方利益相关者——网站和内容创作者带来了巨大的挑战。由于生成引擎具有黑箱性质且变化迅速,内容创作者几乎无法控制他们的内容何时以及如何被展示。随着生成引擎的普及,论文作者认为,必须确保创作者经济不被边缘化。


因此,这篇论文提出了GEO,这是第一个帮助内容创作者提高其内容在生成引擎响应中可见度的新型框架。作者认为,设计得当的GEO方法相当于一个黑箱优化方法,它可以在不知道生成引擎的具体算法设计的情况下,提升相关网站的可见性。


论文中提出了9种方法:


  • 权威性(Authoritative):将源内容的文本风格修改为更具说服力和权威性。
  • 增加统计数据(Statistics Addition):在可能的情况下,用定量统计数据替代定性讨论。
  • 关键词堆砌(Keyword Stuffing):在内容中加入更多来自查询的关键词,这也是经典的SEO优化方法。
  • 引用来源(Cite Sources):标注相关内容的来源。
  • 添加引语(Quotation Addition):从可信来源添加相关的引用语。
  • 易于理解(Easy-to-Understand):简化网站的语言表达。
  • 优化流畅度(Fluency Optimization):改善网站文本的流畅度。
  • 独特词汇(Unique Words):在可能的地方加入独特的词汇。
  • 技术术语(Technical Terms):在内容中加入更多的技术术语。

由于目前没有公开可用的包含生成引擎相关查询的数据集,论文作者推出了一个名为GEO-bench的基准测试。这是一个涵盖多个领域和相关网页来源的大规模基准测试,用于评估不同用户查询。

测试发现,关键词堆砌和独特词汇的方法没有效果,其他方式都有效果,其中添加引语和增加统计数据的方式效果最好。

不同GEO方式效果对比,图片来源:《GEO: Generative Engine Optimization》

论文中还呈现了GEO方法的定性分析,包含了引用来源、增加统计数据、权威性这三种方法的示例,展示了GEO方法如何在最小变动的情况下提升源网站内容的可见性。

  • 示例一,引用来源。仅仅添加声明的来源就可以显著提升最终答案的可见性。

  • 示例二,增加统计数据。添加相关统计数据可以确保在最终生成引擎的响应中提升来源的可见性。

  • 示例三,权威性。仅仅强调文本的某些部分,并使用说服性的文本风格也可以提升可见性。

GEO优化源网站方法的代表性示例,新增内容用绿色标记,删除内容用红色标记,图片来源:《GEO: Generative Engine Optimization》


论文指出,通过严格的评估,GEO可以将内容在生成引擎响应中的可见度提升多达40%

不过,论文作者也承认,GEO也存在一定局限性。随着生成式引擎的演变,这些方法可能需要随着时间的推移进行适应性调整,这与SEO的演变类似。GEO方法所做出的改变是针对文本内容的针对性改变,与SEO方法有一定相似性,但不会影响其他元数据,例如域名、反向链接等,因此它们不太可能影响搜索引擎的排名。

「甲子光年」注意到,GEO相比SEO更加注重内容的与用户问题的语义相关性,符合EEAT原则的内容质量依然很重要。

翁柔莹Eileen认为,企业通过做GEO来提高内容的质量,相较于传统搜索引擎的SEO成本更低,也更加容易,新一代AI搜索引擎将不再是通过广告竞价排名机制来破坏用户体验,更有可能是通过优质内容获得曝光度,甚至直接获得分润。

企业的GEO策略需要从‘关键词优化’转向‘知识库建设’,可以构建高质量、结构化、多模态的知识库,如技术白皮书、案例研究,去提升推广内容被模型引用的概率。”翁柔莹Eileen告诉「甲子光年」。

大模型知识库旨在通过深度学习和自然语言处理技术,自动化地存储、管理和检索大量信息。随着大模型的快速发展,结合知识库的应用成为提升信息检索和问答系统性能的重要方向。



3.我们与信息的距离

AI搜索主要有检索(Retrieval)和生成(Generation)两个步骤,如果在两个步骤之外再加上推荐(Recommendation)呢?

2024年12月,在火山引擎冬季Force原动力大会上,火山引擎推出全域AI搜索,通过场景化搜索推荐一体化服务、企业私域信息整合服务、联网问答服务,将企业的信息、业务和用户需求紧密结合,帮助企业实现“发现更多,推荐更准,搜索无限可能”。

图片来源:火山引擎


AI搜推引擎的应用场景中,最典型的是电商零售场景。用户可以在大模型产品聊天对话框上传一张场景照片,让AI推荐一些“在这拍照能出片的服装搭配”。

图片来源:火山引擎


用户也可以更详细地描述需求,例如:“我正在寻找完美的滑雪板。在冬季,我主要会在北海道滑雪,每月大约两次。我喜欢平整的滑道,但也希望有一块能够偶尔应对新鲜粉雪的滑雪板……”OpenAI全新的Agent(智能体)deep research就可以给出极为专业的滑雪用具推荐。

图片来源:OpenAI


AI搜推引擎可以广泛覆盖多种应用场景,在电商零售场景之外,还有企业信息检索、媒体内容推送、本地生活服务、游戏、教育等。

火山引擎智能算法负责人吴迪告诉「甲子光年」,搜索和推荐此前在产品层面是比较割裂的,通过传统搜索引擎搜索东西,推荐的可能并不太符合用户需要。而推荐又主要根据用户的兴趣、行为,用户的主动表达没有很好兼顾,“从现在开始,AI搜索推荐将会真正被紧密地融合在一起。”

图片来源:火山引擎


「甲子光年」了解到,火山AI搜索推荐引擎是用Agent-base搜推统一的框架对混合模型进行端到端、轻量、灵活编排调度,具有开放的可扩展功能。

“团队也在技术和算法上面投入了很大的力量,让推荐模型能够对context(上下文)的理解更加深入。” 吴迪说, “强大的AI搜索加强大的AI推荐,可以形成1+1>2的效果。” 

甲子光年」认为,从表面上来看,AI搜推引擎可以帮助企业应对信息获取和搜索推荐的挑战,但在更深维度,它其实是在拉近人与信息之间的距离。

AI搜索的逻辑变了,但没有变的是大家对有价值、更精准信息的需求,这种需求在DeepSeek出圈后更加旺盛了,标准也更高了,无论是从技术角度还是从营销角度,AI搜索及相关的SEO、GEO都值得重新思考和创新。

*王艺对本文亦有贡献
**应受访者要求,边锋为化名

(封面图由AI生成)



(文:甲子光年)

欢迎分享

发表评论