大模型搜广推,“新瓶装旧酒”还是“范式的革新”?

作者 | AICon 全球人工智能开发与应用大会
策划 | 李忠良

随着大模型技术的不断发展,它已广泛应用于多个业务场景,包括搜索、广告、推荐系统、游戏、电商和视频等领域。大模型与传统应用的结合面临着如成本控制、性能优化、效果提升及效率提高等问题,应该如何解决?

12 月 14 日,在 AICon 全球人工智能开发与应用大会2024 北京站,【大模型应用架构的探索与实践】专题圆桌交流中,百度主任架构师、信息流推荐架构负责人颜林担任主持人,与百度资深工程师施刘远、京东算法总监张泽华、枫清科技(Fabarta)AI 负责人张红兵、火山引擎边缘智能技术负责人谢皓,共同探讨大模型技术在应用架构中的创新与实践。

部分精彩观点如下:

  • 需要高度自动化和推理能力的问题,可以利用大模型的优势来解决。

  • 算力本身正变得越来越便宜,而它所带来的价值才是真正值得关注的重点。

  • 范式的革新,更多指的是“知识的理解”。

随着生成式大模型技术的飞速发展,AI 搜索在技术层面和应用领域不断突破,为各行业带来深远变革。在应用领域,AI 搜索的创新应用正在重新定义各行业的业务模式和用户体验。2025 QCon 全球软件开发大会(北京站)策划了「更智能的企业 AI 搜索实践」专题,挖掘 AI 搜索在各行业的实践案例,探讨企业 AI 搜索的最新进展及未来发展趋势。现在专题演讲开放报名中,如果你也有相关案例想要分享,欢迎通过以下链接提交演讲申请:https://jsj.top/f/tUOLpz

以下内容基于现场速记整理,经 InfoQ 删减。


颜林:大模型和互联网传统应用(如搜广推等)的结合,到底是“新瓶装旧酒”还是“范式的革新”?

张泽华: 虽然我们的业务场景仍然集中在搜索和推荐推送上,但我认为这是一种范式的革新。正如我在演讲中提到的,算力和模型定义的边界已经发生了变化。特别是,当我们选择生成式 AI 或大模型作为发展方向时,我们发现了一个新的 scaling law 增长曲线,并在相关的实验和验证中,观察到了超过两位数的增长。因此,我的观点很明确:这是一次范式的革新。

施刘远: 首先,我并不认为大模型只是“新瓶装旧酒”。事实上,大模型确实带来了许多增量的信息。不过,关于是否是一次范式革新,我认为还有一定的差距。主要原因在于,推荐过程依然是在原有流程的基础上进行局部的修改或信息补充,而没有完全改变整个流程,尚未形成一个全新的生成式或类似的范式。


颜林:大模型在大型企业落地有哪些挑战?应该如何应对?

张红兵: 首先,对于企业来说,不同类型的企业和部门,所拥有的数据形态各异。比如我们提到的多模态数据场景,在这些场景中,以数据为中心的作用尤为重要,需要围绕数据进行处理,并结合大模型来实现价值。第二个关键点是如何将大模型与实际业务场景结合。我们在落地过程中,需要结合业务痛点找到高价值场景,同时非常注重应用支撑中心的构建,通过应用支撑中心来助力场景落地。第三个点则是关于效果的高要求。企业特别是在 ToB 业务中,对效果要求高,因为模型的回答结果直接影响到客户的业务,错误的操作手册回答可能导致生产事故。因此,大模型的幻觉问题和不可解释性问题需要通过其他手段进行规避。我们提到的以数据为中心的思路,包括结合图技术来增强模型能力,就是解决这一问题的途径之一。


颜林:如何看待可穿戴设备与大模型的结合?应用架构上会产生哪些变化?

谢皓: 首先,穿戴设备的交互能力相较于我们在使用中心大模型时较弱。基本上,我们还是只能通过语音与穿戴设备进行交互。因此,从基础设施团队的角度来看,这对 RTC 能力以及 ASR 和 TTS 能力提出了更高的要求。

另外,穿戴设备与一般的端侧设备不同。它一方面需要保持轻便,另一方面也需要较长的续航时间。由于这些设备的硬件限制,模型不太可能在设备本身上运行,通常只能在云端运行,或者通过蓝牙与手机连接,依靠手机的算力来进行处理。因此,这种方式可能会对我们的整体架构设计带来一些影响。

在这种情况下,手机的算力差异也是一个需要考虑的问题。如果我们将大模型运行在手机上,虽然有更好的隐私保护,但由于每个手机的算力和型号不同,这会导致我们在推理架构上需要采用一些新的方法。为了应对手机算力的限制,我们可能会将部分算力卸载到云端或边缘服务器,这样就会形成云端和端侧的协同工作模式。最后,隐私保护始终是大家关注的重点,同时,随着智能化水平的提升以及端侧算力的增强,如何平衡隐私和计算能力也是一个关键问题。


颜林:大模型时代到来,哪些传统任务和算法值得升级和用大模型技术重新改变?

张泽华: 以广告业务为例,它本身非常庞大,涵盖了 ToB 和 ToC 两种业务模式。在 ToB 端,我们的目标是帮助广告主更高效地投放广告,提升广告效果和投资回报率。假设一个广告主有 1 万元的广告预算,并希望通过广告投放在电商平台上增加商品销量。

在这种情况下,广告投放的关键挑战是如何最大化这 1 万元预算的效益。投放广告就变成了一个时间、空间和序列的优化问题。我们需要考虑在不同的时间段和位置投放广告,以确保最大化目标用户的覆盖和广告效果。

具体而言,如何让这 1 万元的广告预算花得更值得呢?如果我们从传统广告投放的角度来拆解问题,首先要面对的就是如何进行预算分配。预算如何在不同的时间段和空间(即广告位置)之间进行合理分配,这就涉及到如何确定广告的投放策略。

除了时间和空间的分配外,我们还需要关注广告展示的频次,特别是广告展示给用户的次数。用户可能是第一次看到某个广告,也可能是第二次、第五次,甚至是已经反复浏览过该商品并准备下单。

这些问题可以细分为几个具体的任务。首先是预算分配问题,我们需要解决如何在不同的时间和广告位之间合理分配预算。其次是序列建模问题,在广告投放的过程中,用户的行为和反应会受到之前的广告展示影响,因此,我们需要对用户的广告浏览历史进行建模,以便预测他们的行为并优化广告投放策略。第三个问题是广告创意的生成,包括生成吸引用户的广告标题、图片等内容,这直接关系到广告的吸引力和点击率。此外,还有出价策略的问题,广告主需要根据不同的目标和竞价环境调整出价,确保广告能够有效地投放并带来最大的回报。

张红兵: 目前,在企业中,大家都在探索不同的场景,并且努力找到高价值场景,这些高价值场景对于不同企业来说是不同的。根据我自己的经验,以及与许多客户的接触,客户的认知大致相同:他们往往会从外围的业务切入,逐步过渡到核心业务。

去年 7 月,我们开始与一家制造业头部厂商合作。他们的业务流程中有许多环节希望通过 AI 来进行优化。例如,设备的预测性维护、产线操作的自动化等。在合作初期,客户提出了一个需求,并与我们探讨了逐步实施的方式。最初,我们从 HR 问答系统开始,帮助园区内十几万人回答常见问题。客户之前是通过微信群的方式来解答员工的问题,每个微信群由一个团长管理,团长负责解答数百名员工的提问。

通过我们的合作,我们为他们提供了一种新的解决方案,采用大模型的问答系统,提供自动智能的方式来回答用户的各类提问,尽管这看起来是一个技术通用的方案,但它能够真正解决客户的问题。

现在,园区内的机器人已上线,员工遇到问题时可以直接通过语音与机器人对话,系统后台通过大模型来处理和回应这些问题。这种方式不仅提高了员工的工作效率,也有助于管理层更好地了解和管理园区内的日常事务。基于外围系统的落地实践和成果,逐步跟客户推进更多场景的落地。

谢皓: 我想谈一下边缘计算的相关情况。我们的团队主要将业务划分为两大块,一部分是偏基础设施的业务,主要为内部的 ToC 业务提供支持,这些业务往往依赖于我们建设的基础设施来进行实施。另一部分则是面向外部客户的 ToB 业务,我们面向的客户群体包括很多传统行业的企业,特别是在工业互联网、机器视觉、安防等领域。

从我个人的经验来看,过去在做类似计算机视觉这一类的应用场景时,尤其是在 ToB 业务方面,我们的工作面临着很多挑战,最主要的就是碎片化的问题。传统上,这些应用场景往往是依赖于大数据和小规模任务的模式。每个项目通常需要重新收集大量的数据,这个过程不仅耗时,而且非常依赖人工进行数据标注,接下来还需要重新训练模型。

然而,这种方式往往带来两个问题:一是每个场景需要独立处理,复制性差;二是随着项目数量的增加,投入和回报之间的平衡越来越难以维持,甚至陷入了一种“投入越多,亏损越多”的困境。

随着大模型的出现,情况有了些许变化。大模型的泛化能力较强,能够更好地处理不同场景下的数据,从而提高了模型的适用性和通用性。这使得我们对解决过去“大数据、小任务”模式的问题充满了期待。我们希望通过这种大模型的应用,能够从传统的每个项目都需要大量人力投入的方式,转变为更多依赖算力的模式。换句话说,我们期望能够通过提高计算能力来弥补过去的瓶颈,而不必再在每个单独项目上进行重复的人工工作。

不过,在一些细分场景下,虽然我们尝试采用多模态的方式来解决视觉场景中的问题,但在某些特定应用中,模型的精度并不如预期。这也让我们意识到,即便大模型能够增强泛化能力,但在某些特定领域的精度提升仍然需要进一步优化。

因此,从我们团队目前的工作来看,主要有两个发展方向:一是进一步优化现有的模型和算法,提升其在不同场景下的表现;二是加强算力和数据的结合,探索如何利用更强的计算资源来推动更精确的模型训练和推理。

施刘远: 我从工程角度简单谈一下。大模型的核心能力可以总结为三个方面:一是它能够包含丰富的知识,二是它具备自然语言交流的能力,三是它拥有强大的推理和总结能力。这些能力是我们在推荐系统或者工程领域中能够实际应用的基础。

大模型就像是一个有多项能力的“人”,你可以通过自然语言与它交流,利用它的能力来解决实际问题。举个例子,在工程领域中,我们经常会遇到一些稳定性问题,通常解决问题的过程是通过人工排查。具体来说,我们会一步步分析问题的原因,查找涉及的服务,串联相关信息,最终定位问题的根源,然后进行解决。这是一个典型的依赖人工干预的过程,人的分析和判断在其中发挥着至关重要的作用。

但如果我们使用传统算法或方案来解决这些问题,其实会非常困难,原因在于我们的系统是动态变化的。也就是说,一旦系统发生变化,传统模型的有效性可能就会失效,无法继续提供有效的支持。

然而,使用大模型就能解决这一问题。大模型的泛化能力非常强,它能够适应系统变化,只要输入足够的信息,它就能够自动进行推理和处理,不会像传统模型那样因系统变化而失效。这使得我们可以在工程中更加高效地解决问题,尤其是在系统变化频繁的环境下,大模型展现出其独特的优势。

因此,从这个角度来看,只要我们认真思考,明确我们在工作中需要解决的问题,尤其是那些需要高度自动化和推理能力的问题,就可以利用大模型的优势来解决。


观众:目前国内主流的互联网公司都在进行一项重要的工作,那就是将自己传统的搜广推架构升级到全新的生成式 AI 范式。不论是生成式推荐还是生成式搜索,大家都在朝这个方向努力。如果这个过程完成并且真正实现了,未来那些算法工程师的工作会是什么样的?

张泽华: 生成式 AI 或大模型的目标,并不是取代人类,而是帮助人类变得更加智能。换句话说,生成式 AI 并不会消除传统搜索中涉及的经典问题,例如意图识别和相关性判别。无论大模型如何发展,这些问题依然存在。只是随着大模型和生成式 AI 的应用,我们解决这些问题的手段和方式发生了改变。

举个例子,原来搜索系统中的意图识别可能需要多个小团队分工合作,而在生成式 AI 普及之后,意图识别的工作会被做得更好,处理方式也会更为嵌入和智能化。这并不意味着我们不再需要意图识别,而是生成式 AI 可以使这些环节更加高效和精准。


观众:随着生成式 AI 和大模型的普及,原来需要大量人工干预和复杂分工的工作是否还能容纳现有规模的算法工程师?对于那些计算资源相对有限的公司,尤其是中小型企业,是否意味着他们不再需要像以前那样庞大的团队?

张泽华: 我的观点是,尽管计算资源在过去几十年里取得了爆炸性的增长,始终没有任何一个时代的人认为算力已经足够了。即便在算力相对紧张的时期,我们依然在解决类似的问题。举个例子,像手写字体识别这样的问题,直到今天我们仍然在解决,只是现在的问题变得更深更广了。

针对你刚才提到的问题,我的理解可以分为两个层面。第一个层面是算力如何实现普惠,广泛应用;第二个层面是是否有一些基础性计算任务可以被共享或屏蔽,不需要每个团队都投入大量的计算资源。

如果算力无法普及,那么智能手机就不可能像今天这样普及。如今的智能手机的算力已经远远超出了许多工业场景中所使用的计算资源。算力的普及不仅体现在个人设备和穿戴设备上,甚至在公有云或私有云的租赁服务中也出现了这样的趋势。总体来看,算力本身正变得越来越便宜,而它所带来的价值——无论是娱乐、工业,还是其他创造性价值——才是我们真正关注的重点。

施刘远: 大语言模型无法完全取代推荐系统。推荐系统是一个复杂的封闭系统,涉及大量知识,从用户画像构建到排序和精排等每个环节都很复杂,而这些知识大语言模型很难学到。不过,语言模型可以在提升各个阶段的效率和效果方面发挥作用,正如泽华老师所说,熟练使用语言模型能显著提高工作效率和竞争力。其次,尽管大语言模型不能完全替代推荐或搜索系统,但我们可以从其能力边界来审视。


观众:第一个问题是关于“范式”的定义。这个“范式”是否指的是从统计学到逻辑回归,再到深度学习,以及从 MLP 到基于注意力机制的模型结构的转变?还是说它有更广泛的理解?

张泽华: 关于范式的革新,我认为它更多的是关于“知识的理解”。在大模型和搜广推的场景中,很多时候我们是在猜测用户的意图。这不仅仅是有没有查询的问题,而是我们如何理解上下文、用户过去的行为以及用户画像,这些都直接影响到业务效果。

过去,我们把整个过程拆分成召回、粗排、精排等环节,每个环节都涉及到“理解”。例如,召回是猜测用户可能喜欢的商品,排序则是在此基础上进一步筛选和排序。这些环节通过新的方式理解和抽取更多信息,就可以看作是一种范式的革新。这并不是说从统计学方法变成概率方法,而是如何更有效地理解和利用信息。


观众:关于传统的搜广推,它通常采用的是一个多层漏斗结构。我的问题是,如果现在引入大模型、进行范式革新,是否能够突破这种漏斗式的各层理解?或者从另一个角度讲,漏斗内外是否存在一种更深度的考量?

施刘远: 从目前的研究进展来看,比如 Meta,它在进行生成式的推荐时,仍然采用召回和排序的流程,只不过它将召回和排序过程统一为一个生成式的生成式方式。也就是说,通过生成可能相关的内容后,再进行检索和排序。从现有的研究来看,实际上还是在沿用原有的流程,只不过每个阶段的模型已被替换为新的方法,例如将传统的 CTR、CVR 沉浸网络模型替换为基于序列建模的生成式预估模式。

张泽华: 我通常将这个问题定义为“开放环境问题”,其本质是特定领域的问题。以广告场景为例,虽然它是一个开放性问题,但由于可获取的用户数据和商品数据非常有限,导致它变成了一个数据受限的开放问题。

举个例子,你正在做饭,突然发现酱油用完了,你的第一反应可能是去买酱油或决定不再使用酱油。假设你决定去买酱油,你打开 APP 搜索酱油,但此时你可能还在浏览其它商品(比如新的游戏)。这两者之间并没有直接联系,问题在于当前的在线系统无法捕捉到这种线下突发的需求。

在搜广推的场景中,它本质上是一个开放问题,因为它涉及到对人的理解。人生活在现实世界中,而在虚拟世界中,在线系统只能通过你透露的数据来进行判断和预测,这就形成了一个数据受限的闭环。

(文:AI前线)

欢迎分享

发表评论