行业必读丨OpenAI 最新报告:AI 在企业中的应用

OpenAI 最近发布了三份针对企业客户的研究报告,本次挑选了其中的「AI in the Enterprise」一篇进行了翻译。

另一篇:行业必读丨OpenAI 最新报告:构建 Agents 最佳实践

注:本文章基于 Coze Space 翻译,特工们精校而成。以上三份英文原文件可以加入我们的 ima 知识库免费获取,后续会更新剩下一篇的精校翻译。

以下为正文:

目录

  • 工作方式的新变革

    • 内容概要

  • 企业应用 AI 的七条经验

    • 从效果评估入手

    • 将 AI 融入你的产品

    • 立刻行动,尽早投资

    • 定制并优化你的模型

    • 让 AI 为一线专家所用

    • 解放开发者的生产力

    • 设定长远的自动化目标

  • 结语

工作方式的新变革

作为一家专注人工智能研究与应用的公司,OpenAI 非常重视与全球企业的合作,因为 OpenAI 的 AI 模型要想在那些精密复杂、环环相扣的工作流和系统中发挥最大价值,这种合作必不可少。

我们观察到,人工智能正在三个主要方面带来显著且看得见的提升:

1. 提高工作效率帮助员工在更短时间内完成更高质量的工作。

2. 自动化日常事务把员工从重复枯燥的任务中解放出来,让他们能集中精力做更有价值的事。

3. 赋能产品创新提供关联性更强、反应更灵敏的客户体验。

但是,运用人工智能和开发软件或部署云服务并不相同。那些最成功的公司,往往把它看作一种全新的模式。这种认知带来了一种乐于尝试的心态和不断迭代改进的方法,能更快地创造价值,也更容易获得用户和相关方的支持。

我们的方法:迭代部署,持续进步

OpenAI 内部主要有三个团队。研究团队负责推动人工智能基础理论的发展,开发新的模型和功能。应用团队负责将这些模型转化为实际产品,比如 ChatGPT 企业版和我们的 API 接口。署团队则负责将这些产品带给企业客户,解决他们最迫切需要解决的问题。

我们采用迭代部署的方式,目的是快速从客户的实际应用中学习,并利用这些反馈来加速产品的改进。这意味着我们会定期发布更新,收集用户反馈,并在每一步都提升产品的性能和安全性。

这样做的好处是:用户能尽早并经常体验到人工智能的最新进展,同时,用户的反馈也能帮助我们塑造未来的产品和模型。

内容概要

企业应用 AI 的七条经验

1. 从效果评估入手建立一套系统化的评估方法,衡量 AI 模型在你的具体场景下表现如何。

2. 将 AI 融入你的产品创造全新的客户体验和更有针对性的互动方式。

3. 立刻行动,尽早投资开始得越早,积累的价值就越多,如同滚雪球。

4. 定制并优化你的模型根据你的具体需求调整 AI 模型,能极大地提升其价值。

5. 让 AI 为一线专家所用最了解某个流程的人,往往最清楚如何用 AI 来改进它。

6. 解放开发者的生产力自动化软件开发的流程能让AI带来的好处成倍增加。

7. 设定长远的自动化目标大多数流程里都有大量重复机械的工作,非常适合自动化。眼光要放长远。

下面,我们将结合具体的客户案例,逐一深入探讨这些经验。

经验 1: 从效果评估入手

Morgan Stanley 如何通过反复测试确保应用的质量与安全

作为全球金融服务的领军者,Morgan Stanley 是以人际关系为核心的公司。因此,公司内部自然会有人质疑,人工智能该如何为这种高度个性化且敏感的工作带来价值。

他们的对策是:对每一项提议的 AI 应用都进行深入的效果评估。所谓评估(eval),简单说,就是一套严谨、规范的流程,用来衡量 AI 模型在特定场景下对照基准的实际表现。同时,它也是一个持续改进 AI 应用流程的方法,每一步都有专家的反馈参与。

最初的尝试

Morgan Stanley 的第一个评估项目聚焦于提升财务顾问的工作效率和成效。想法很简单:如果顾问能更快获取信息,减少处理重复事务所花的时间,就能为客户提供更多、更好的专业建议。

他们首先对三个模型应用场景进行了评估:

1. 语言翻译衡量模型翻译结果的准确度和质量。

2. 内容总结依据大家公认的准确性、相关性和逻辑性标准,评估模型压缩信息的效果。

3. 与人类专家对比将 AI 的回答与资深顾问的回答进行比较,从准确性和相关性角度打分。

这些评估以及后续的其他评估,给了 Morgan Stanley 足够的信心,开始将这些 AI 应用逐步投入实际使用。

如今的成果

现在,Morgan Stanley 有 98% 的顾问每天都在使用 OpenAI 的技术;内部文件的查阅率从 20% 大幅提升到 80%,搜索时间显著缩短;同时,由于任务自动化和信息获取速度加快,顾问们能将更多精力投入到维护客户关系上。

顾问们的反馈非常积极。他们能更深入地与客户交流,以前需要几天才能完成的后续工作,现在几小时就能搞定。

凯特琳·艾略特 (Kaitlin Elliott) 全公司生成式 AI 解决方案负责人

什么是效果评估?

效果评估,就是验证和测试你的 AI 模型输出结果的过程。严谨的评估能够确保你的AI应用更稳定、更可靠,并且能更好地适应变化。评估的核心是设计一些任务,用来衡量模型输出的质量是否达到了某个基准——比如,是不是更准确了?是不是更符合规定了?是不是更安全了?具体关注哪些关键指标,取决于每个应用场景下最看重什么。

经验 2: 将 AI 融入你的产品

Indeed 如何让职位匹配更有人情味

当人工智能被用来自动处理那些繁琐重复的工作时,员工就能腾出手来,专注于只有人类才能做好的事情。而且,由于 AI 能处理来自多方面海量的数据,它能创造出更贴合用户需求、更个性化的体验,反而让人感觉更有人情味。

全球最大的招聘网站 Indeed 就利用 GPT-4o mini,以全新的方式为求职者匹配工作岗位。

解释“为什么”很重要

给求职者推荐合适的工作只是 Indeed 服务的第一步。他们还需要向求职者解释,为什么会推荐这个特定的职位。

Indeed 利用 GPT-4o mini 的数据分析和自然语言处理能力,在给求职者的邮件和消息中精心撰写这些解释“为什么”的内容。借助 AI,他们那个很受欢迎的“邀请申请”功能,也能说明为什么某个求职者的背景或工作经历很适合这个职位。

Indeed 团队对比了旧的职位匹配系统和加入了定制化背景信息、由 GPT 驱动的新系统。结果显示,性能提升非常显著:

1. 开始申请工作的求职者数量增加了 20%;

2. 后续的成功率(比如被雇主雇佣)提升了 13%——不仅更多人愿意申请,雇主也更愿意录用他们。

考虑到 Indeed 每月向求职者发送超过 2000 万条信息,并且网站月访问量高达 3.5 亿人次,这些百分比的提升意味着巨大的商业价值。

但是,规模化应用也意味着需要消耗更多的 tokens。为了提高效率,OpenAI 和 Indeed 携手合作,对一个规模较小的 GPT 模型进行了微调。结果,这个小模型用少了 60% 的 tokens,却达到了几乎同样的效果。

帮助求职者找到合适的工作,并让他们明白为什么这个机会适合自己——这本身就是一件非常有意义、充满人情味的事情。Indeed 的团队利用 AI,帮助更多人更快地找到了工作,实现了多方共赢。

我们认为,继续投资于这种新的AI基础设施,将为我们带来巨大的增长机遇,帮助我们提升收入。

克里斯·海姆斯 (Chris Hyams) 首席执行官

经验 3: 立刻行动,尽早投资

Klarna 如何受益于 AI 知识积累的复利效应

人工智能很少能做到“开箱即用”——它的应用效果和影响力是通过不断迭代才逐渐成熟和增强的。你开始得越早,你的组织就能越多地享受到这种知识和经验积累带来的复利效应。

全球支付网络和购物平台 Klarna 推出了一款新的人工智能助手,用于简化客户服务流程。短短几个月内,这款助手就承担了三分之二的客服聊天量——相当于数百名人工的工作量,同时将平均问题解决时间从 11 分钟大幅缩短至 2 分钟。这项举措预计将为公司带来 4000 万美元 的利润增长,而且客户满意度评分与人工客服持平。这些成果并非一蹴而就。Klarna 是通过持续不断地测试和优化这款助手才达到如此效果的。

同样重要的是,Klarna 公司 90% 的员工现在都在日常工作中使用人工智能。随着整个组织对 AI 越来越熟悉,Klarna 得以更快地行动,更高效地推行内部项目,并持续改善客户体验。正是因为尽早投资并鼓励广泛应用,Klarna 看到了AI效益的叠加增长,为整个业务带来了回报。

这次在客户互动方面的人工智能突破,意味着我们的客户能以更优惠的价格享受到更优质的体验,我们的员工面临更有趣的挑战,我们的投资者也能获得更好的回报。

塞巴斯蒂安·西米亚特科夫斯基 (Sebastian Siemiatkowski) 联合创始人兼首席执行官

经验 4: 定制并优化你的模型

Lowe’s 如何改进商品搜索功能

那些在应用 AI 方面最为成功的企业,往往都愿意投入时间和资源来定制和训练专属的 AI 模型。OpenAI 在我们的 API 接口上投入了大量研发,让用户能更方便地定制和微调模型——无论你是想自己动手操作,还是需要借助我们的工具和支持。

我们与《财富》50 强之一的家居装饰零售商 Lowe’s 紧密合作,旨在提升其电商平台搜索功能的准确性和相关性。Lowe’s 有成千上万的供应商,因此经常需要处理那些信息不完整或格式不统一的产品数据。

关键在于提供准确的产品描述和标签。但这还不够,还需要理解顾客的搜索习惯,而这种习惯会因不同的产品类别而变化。这时候,模型微调就派上用场了。

通过对 OpenAI 的模型进行微调,Lowe’s 团队成功将产品标签的准确率提升了 20%,同时错误检测能力提升了 60%

当我们看到用我们自己的产品数据微调 GPT-3.5 模型后的结果时,整个团队都兴奋极了。我们知道,这绝对是个制胜法宝!

尼尚特·古普塔 (Nishant Gupta) 数据、分析与计算智能高级总监

什么是模型微调?

如果把一个通用的 GPT 模型比作一件成衣店买来的西装,那么微调就好比是量身定制服务——它是你根据自己公司的特定数据和需求来调整模型的过程。

为什么它很重要?

1. 提高准确性用你独有的数据(比如产品目录、内部知识库问答)来训练模型,它给出的结果就会更贴切、更符合你的品牌风格。

2. 具备行业知识经过微调的模型能更好地理解你所在行业的专业术语、行文风格和特定语境。

3. 保持语调和风格一致对零售商来说,这意味着所有产品描述都能保持统一的品牌口吻;对律所来说,这意味着每次引用的格式都准确无误。

4. 更快获得成果减少了人工修改或反复检查的需要,你的团队就能把精力集中在更有价值的工作上。

经验 5: 让 AI 为一线专家所用

BBVA 银行采取专家主导的 AI 应用策略

你的员工身处业务第一线,最了解实际流程和存在的问题,因此他们往往最清楚该如何利用 AI 来找到解决方案。把 AI 工具交到这些专家手中,效果可能远胜于尝试开发那些大而全的通用型解决方案。

全球银行业巨头 BBVA 拥有超过 12.5 万名 员工,每个人都面临着不同的挑战和机遇。他们决定将 AI 工具直接提供给员工使用——当然,是在与法务、合规和信息安全部门紧密合作,确保负责任使用的前提下。他们在全球范围内部署了 ChatGPT 企业版,然后鼓励员工自己去探索应用场景。

通常,在我们这样的公司,哪怕只是做一个原型产品,也需要技术资源和时间投入。但有了定制化的 GPT,任何人都能创建应用来解决自己遇到的独特问题——上手非常容易。

BBVA 全球 AI 应用负责人埃琳娜·阿尔法罗 (Elena Alfaro) 

在短短五个月内,BBVA 的员工就创建了超过 2900 个定制化的 GPT 应用,其中一些应用能将原本需要数周完成的项目或流程缩短到几小时内。这种影响遍及了公司的许多不同领域和部门:

1. 信贷风险团队:使用 ChatGPT 更快速、更准确地评估客户的信用状况。

2. 法务团队:利用它每年回答约 4 万个关于公司政策、合规要求等问题。

3. 客户服务团队:自动对客户满意度(NPS)调查结果进行情感分析。

而且,成功的案例还在不断扩展到市场营销、风险管理、运营等更多部门。这一切的发生,都源于他们将 AI 交到了那些真正懂得如何在各自专业领域应用它的人手中。

我们认为,投资 ChatGPT 就是投资我们的员工。AI能够放大我们的潜力,帮助我们变得更高效、更有创造力。

BBVA 全球 AI 应用负责人埃琳娜·阿尔法罗 (Elena Alfaro) 

经验 6: 解放开发者的生产力

Mercado Libre 如何更快、更规范地构建 AI 程序

在很多公司里,开发资源不足是限制发展的主要瓶颈。当工程师团队忙不过来时,创新就会放缓,积压的需求和想法也会越来越多,难以消化。

拉丁美洲最大的电商和金融科技公司 Mercado Libre 与 OpenAI 合作,共同构建了一个开发平台层来解决这个问题。这个平台叫做 Verdi,由 GPT-4o 和 GPT-4o mini 提供技术支持。现在,它帮助公司里 17000 名 开发者统一并加速了他们构建人工智能应用的进程。

Verdi 平台整合了语言模型、Python 编程节点和 API 接口,创建了一个可扩展、规范化的平台,并以自然语言作为核心交互方式。现在,开发者们能够更快地构建出质量稳定可靠的应用,而且无需深入了解底层源代码。平台的安全性、使用规范和流程逻辑都已内置其中。

得益于此,人工智能应用的开发速度大大加快,帮助 Mercado Libre 的员工完成了许多了不起的任务,例如:

1. 提升库存管理能力利用 GPT-4o mini 的视觉识别功能给商品打标签、补全信息,使得 Mercado 能够处理的商品数量增加了 100 倍

2. 侦测欺诈行为每天分析数百万商品信息的数据,将被标记商品中的欺诈检测准确率提高到 近 99%

3. 定制化商品描述翻译商品标题和描述,并根据西班牙语和葡萄牙语不同地区的细微语言差异进行调整。

4. 增加订单量自动生成评论摘要,帮助用户快速了解商品口碑。

5. 个性化推送通知定制化推送消息,以提高用户参与度并优化商品推荐。

下一步计划:利用 Verdi 平台改善物流效率,减少配送延误,并在整个公司范围内承担更多具有重大影响的任务。

我们利用 GPT-4o mini 设计了我们理想中的 AI 平台,核心目标是减轻开发者的认知负担,让整个公司都能更轻松地进行迭代、开发和部署创新的解决方案。

塞巴斯蒂安·巴里奥斯 (Sebastian Barrios)   技术高级副总裁

经验 7: 设定长远的自动化目标

在 OpenAI,如何用 AI 自动化自己的工作

在 OpenAI,人工智能是我们日常工作的一部分,所以我们经常能发现用 AI 自动化自身工作的新机会。

举个例子:我们的客户支持团队曾经被大量琐碎工作所困扰,他们需要花费很多时间去登录不同系统、了解客户情况、草拟回复邮件,并为客户执行正确的操作。

于是,我们内部开发了一个自动化平台。这个平台嫁接在我们现有的工作流程和系统之上,能够自动处理那些重复性的机械工作,加速信息的获取和行动的执行。

我们首先将它应用在 Gmail 上,用来辅助撰写客户回复并触发后续操作。通过这个自动化平台,我们的团队可以即时获取客户数据和相关的知识库文章,然后将这些信息整合进回复邮件或转化为具体行动——比如更新客户账户信息或创建支持工单。

通过将 AI 嵌入到现有的工作流程中,我们的团队工作效率更高,响应速度更快,也更能专注于客户需求。这个平台现在每月处理成千上万项任务,把员工从重复劳动中解放出来,让他们能投入到更有价值的工作中去。不出所料,这个系统正在被推广到公司的其他部门。

这一切之所以能实现,是因为我们从一开始就设定了长远的自动化目标,而不是把低效的流程当作理所当然的运营成本。

结语

相互借鉴,共同进步

正如前面的案例所示,每家企业内部都充满了利用 AI 力量来改善经营成果的机会。具体的应用场景可能因公司和行业而异,但其中蕴含的经验教训却普遍适用。

贯穿始终的主题是:要想成功部署 AI,需要秉持开放和乐于尝试的心态,同时辅以严格的效果评估和安全保障措施。那些取得成功的公司,并非急于将 AI 模型塞进每一个工作流程,而是先聚焦于那些高回报、低投入的应用场景,在实践中不断学习和迭代,然后将学到的经验推广到新的领域。

成果是显而易见且可以量化的:流程更快、更准确;客户体验更个性化;员工的工作也更有意义,因为他们能专注于那些最需要人类智慧和创造力的事情。

我们现在看到,一些公司正在整合 AI 工作流,以实现日益复杂的流程自动化——这通常需要借助各种工具、资源和其他 Agent 来协同完成。

我们将持续从 AI 应用的最前沿发回报道,希望能为你的思考提供借鉴和启发。

值得信赖的企业级 AI 平台

安全与隐私要点

对于我们的企业客户来说,安全、隐私和数据控制权至关重要。我们通过以下方式来保障:

1. 你的数据只属于你:我们绝不会使用你的内容来训练我们的模型;你的企业对数据拥有完全的所有权。

2. 企业级合规标准:数据在传输和存储时都经过加密处理,符合 SOC 2 Type 2、CSA STAR Level 1 等业界顶级安全标准。

3. 精细的访问权限控制:你可以自主决定谁有权查看和管理数据,确保符合内部治理要求和合规规定。

4. 灵活的数据保留策略:你可以根据自己公司的政策,调整日志记录和数据存储的相关设置。

(文:特工宇宙)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往