别被MCP的包装骗了!重构系统、向智能体转型,CEO亲述:关键时刻还是RPA兜底?

作者 | 褚杏娟

当下,智能体的热度已经无需再多赘述。这场智能体竞赛中,除了那些从新开始的“AI 原生”智能体应用外,还有一些应用在逐渐将智能体纳入产品构建中,实在智能便是其中之一。

实在智能成立于 2018 年7月,以RPA为起点,融合AI技术,致力于通过人工智能技术助力人机协同,提供超自动化解决方案。随着技术发展,实在智能对其“数字员工”产品不断升级:对RPA的底层能力做了大量的改造和增强,结合计算机视觉对底层架构进行了重构,并推出了国内首款通用智能体产品。当前,实在智能已为超 4000 家企业客户部署了“数字员工”。

对于业内讨论的一些问题,实在智能通过自身实践也给出了自己的答案。比如自研模型或垂直模型对于具体业务场景中的 Agent 研发是必要的,但大模型自身并不能作为一种产品。又如,在支持 MCP 后,实在智能也发现不能过度依赖 MCP 服务,MCP 只是将一些问题进行了封装,但问题本质并没有得到解决。

近日,InfoQ 对实在智能创始人兼 CEO 孙林君进行了一次采访,期间他详细回答了智能体技术路径选择、产品如何转型、智能体产品收费逻辑等问题。

智能体的实现路径
InfoQ:2018 年那会儿,为什么会想做“数字员工”这件事?

孙林君: 我们想成为数字员工领域的开拓者,这一征程始于 RPA 技术。当时,我们察觉到 RPA 的商业模式极具潜力,其原理是在客户电脑中安装一款软件,该软件能够操控其他各类软件。RPA 在电脑中可视为类似机械臂的存在,用于操作其他软件。

随后,我们很快发现,提供给软件机器人的自动化脚本存在升级空间。我们可以处理更加复杂和高级的任务,集成 OCR(光学字符识别)技术与自然语言处理技术,使其具备识别图片、文字以及处理合同的能力,从而实现一定程度的智能化。

尽管机器人的形态未发生改变,但其任务的复杂度和高级程度却在不断提升。由此,我们联想到可以进一步升级机器人的任务,使其承担更具智能化的工作,比如与大模型相结合,进而使其能够像人类一样开展工作。2019 年,我们洞察到这一发展方向后,便提出了“数字员工”这一概念。我们从 RPA 入手,但目标是将机器人当作人类来培养,期望有一天机器人能够像人类一样自主思考、自主工作。

2023 年,随着 ChatGPT 的爆火,我们看到了新的里程碑,原本设想的愿景大幅提前。大模型具备思考能力,结合视觉技术与 RPA 后,真正能够以人类的形态开展工作。从人工智能的角度来看,这一阶段的成果被称为“智能体”,能够代我们完成某些事务。

InfoQ:你们要取代的是哪部分工作?

孙林君: “数字员工”是一个业务概念。从 2019 年至今,数字员工的发展历程呈现出清晰的阶段性特征:初级阶段可视为 RPA,主要承担简单、重复、规则化的低价值工作;而高级阶段则是智能体,能够独立思考、自主规划任务并自主完成任务。

InfoQ: 实在智能的“数字员工”与 Devin 等类别的 AI 员工有什么不同?

孙林君: 不完全是一回事,大家技术路线选择上存在差异。智能体目前存在着不同的技术路线选择,其中一种完全依赖大模型的能力,认为仅凭大模型自身就能完成操作系统内部软件的自动识别与操作。

然而,从现实情况来看,让一个端到端的大模型独立完成复杂任务仍面临诸多挑战。众所周知,大模型存在幻觉问题,只是幻觉出现的概率有高有低。在这种情况下,若完全依靠大模型自主完成任务,效率可能会相对较低,甚至可能陷入无限循环的困境,且一旦出错,我们难以进行有效干预。这些缺点在实际应用中较为明显,尤其是在用户生产环境中,用户的接受度会受到一定影响,尤其对于面向企业的产品而言更是如此。

另一种技术路线则是将大模型的能力与外部工具相结合。例如,我们采用大模型结合 RPA 和计算机视觉等多模态技术的方式。此外,还有像 Manus 这样采用大模型结合特定工具的方式,还有大模型结合 API 的方式。其中,采用大模型结合外部工具的方式,有以下几点需要关注:

首先,由于大模型存在幻觉问题,我们有必要增强其任务分解、逻辑推理和代码生成等方面的能力。许多数据若脱离了用户的具体场景或用户所使用的软件层面,仅靠大模型的联想能力,难以实现完美的任务分解。 因此,在这种情况下,需要利用特定的数据来训练大模型,即通过垂直领域的大模型来增强基础大模型的能力,从而使智能体减少幻觉,更加实用。

其次,由大模型驱动的工具集,无论是 Manus 的 29 种工具,还是 RPA,或是接口,都必须具备 对操作系统内部操作的完备性。实际上,RPA 的构建理念是将操作系统底层的几乎所有操作原子化,再重新拼装成能力。从 RPA 技术的出现到逐步成熟,本质上都是围绕这一目标展开的。例如,运算本质上由 0 到 9 的数字和加减乘除的运算符构成,RPA 所做的也是将操作系统内的基础操作提炼出来,并将其封装成基础组件,以应对复杂的任务。如果采用其他工具来驱动工具集,同样需要检验其对操作系统内各项操作的完备性。

此外,效率问题也不容忽视。如果采用大模型结合接口的方式,接口的开发效率必须足够高。因为大模型大约每 3-4 个月就会更新一次人类的知识体系,而有些企业花费数年时间都未能完成接口的完全对接,由此可见接口对接效率之低。很多时候,我们无法预先知晓用户会以何种方式使用接口,往往是在实际使用中才发现其不匹配。这种单模型结合接口方式的开发效率相对较低。不同的智能体参与者对行业的理解存在差异,因此所采用的技术方案也各不相同。

如何实现从 RPA 到智能体的产品转型
InfoQ:从最初的 RPA 产品开始到 2023 年推出了第三代 “大模型 + RPA” 的 Agent 产品,实在智能对产品的底层架构进行了重构。为了转型,实在智能在产品架构上做了哪些调整?

孙林君: 在 RPA 领域,我们经历了诸多重构与调整。很多人对 RPA 存在误解,认为只要能编写脚本、使用代码编辑器,就等同于掌握了 RPA。然而,在实际为客户服务的过程中,我们发现诸多限制。例如,面对客户所使用的各种未曾见过的软件,许多 RPA 公司不得不派遣工程师亲赴客户现场,解决这些软件的适配问题。这无疑带来了巨大的成本。当客户数量增多时,工程师甚至难以兼顾 RPA 产品的开发工作。

我们意识到,这种状况限制了 RPA 行业的发展。于是,我们思考整个 RPA 行业需要一种通用能力。过去,RPA 的不通用性导致一些公司只能在特定行业深耕,比如专注于电商、财务或物流供应链等领域,因为这些行业内的软件种类相对有限。但一旦跨出这些行业,实现通用就变得异常困难。

为了解决这一问题,我们推出了“融合拾取”技术。我们将计算机视觉与底层识别技术整合在一起,让用户在视觉方面无需感知差异,每个软件被打开时,都自动具备视觉识别能力和底层识别能力。这一过程中,我们攻克了诸多技术难点,拥有 15 项专利,解决了速度、精度、跨分辨率等诸多极具挑战性的基础问题,并最终得到了良好的验证。

我们在日本拥有一家子公司,并已积累了众多日本客户。在整个过程中,我们的工程师从未前往日本,但我们的软件依然能够很好地适配日本的各种未曾见过的软件,并在其上构建各种自动化流程。这充分验证了通用能力的有效性,也证明了 RPA 行业需要不断被改造,这是我们对 RPA 进行改造的第一个方面。

第二个改造方面源于 RPA 的易用性问题。

许多厂商声称 RPA 易于使用,但实际上当业务人员真正接触后,他们发现很难掌握。原因在于,他们需要学习各种教程,甚至要先把自己变成程序员,才能使用该软件。这显然违背了“第一性原理”,我们不应非得把业务人员变成程序员,才能让他们使用这种产品。因此,我们借鉴了类似于 Excel 中宏录制的方法,在操作系统内使我们的操作能够被记录下来。也就是说,通过算法引导用户识别操作对象,并知晓需要使用哪些组件,从而自动生成代码。

我们推出了全新的 AI-RPA 模式,对 RPA 进行改造并引入了智能化特点,并对底层通信架构进行了大量重构。这样一来,任何一款软件在我们这里都能被默认识别,且效率极高。这并非简单地将 RPA 与大模型结合,而是要解决底层的两个非常困难的问题。解决了这些问题后,我们又接入了自己的垂直大模型。如此一来,我们的技术方案能够很好地适配当前智能体的工作需求。

InfoQ:构建一个智能体原型很容易,但要打造能支撑关键业务应用的可靠系统很难。你们如何解决这个难题?

孙林君: 许多人在理解智能体这一概念时,往往停留在较为浅显的层面。搭建一个初步的框架或许相对容易,但要构建一个真正可靠、稳定的系统,却并非易事。一个可靠的系统,首先必须具备可控性,其次要确保稳定性,即无论运行多少次,都能以相同的方式得出一致的结果。然而,如果仅仅依赖端到端的解决方案,情况就大不相同了,即使是相同的实验,也可能因采用不同的方法而得出多个截然不同的结果,甚至可能出现八次成功、两次失败的情况。这显然无法满足可靠性和稳定性的要求。

前面我们还提到了效率问题。如果一个系统无法同时满足可控、稳定和高效这三个关键特点,那么对于众多企业客户而言,这样的智能体几乎是不可用的。 倘若在技术路线的选择上出现偏差,那么构建可靠系统的难度无疑将大幅增加。

我们引入大模型时,其生成结果本身就存在不确定性,而且大模型还可能产生幻觉,这对系统的稳定性构成了潜在威胁。因此,我们不得不对大模型进行一系列的优化和调整。具体来说,我们为大模型配备外挂知识库,并采用垂直领域的大模型,利用特定的数据来增强其性能。同时,我们还需要精心编写提示词,以对大模型的输出结果进行有效控制。通过综合运用多种手段,我们可以在最大程度上降低幻觉现象的发生概率,从而使大模型的输出结果更加可控。

如今,智能体的概念已经得到了广泛的认可。智能体的大方向无疑是让机器以人类的形态去替代人类完成工作,这已经成为业界的共识。当然,在实现这一目标的过程中,技术路线的选择必然会呈现出多样化的特点。我们可以看到,目前存在多种不同的技术路线,包括端到端的解决方案、大模型结合工具、大模型结合 API,以及 MCP、A2A 等能力整合方式。而我们所采用的技术路线则是将大模型与多模态技术以及 RPA 相结合。这些不同的技术路线,实际上都是基于对行业理解和需求的深入分析而做出的选择。

InfoQ:如何理解智能屏幕语义理解与多模态技术关系?构建 Agent 产品,自研大模型是必要的吗?

孙林君: 智能屏幕语义理解可以被视为多模态技术的一个分支。它主要关注软件界面元素的识别,例如操作类任务的范围。而多模态技术的范围更为广泛,包括但不限于给一张图讲故事、评论语义理解等。目前,我们已经在多模态领域进行了相关工作,例如网页数据提取涉及排序、数据过滤以及基于数据的问答等问题,都可以通过多模态技术获得结果。

InfoQ:之前你提到 Agent 研发中最难的“让大模型对任务理解到位”,具体怎么解决的?

孙林君: 针对这一研发难点,我们的解决方案是训练垂直的大模型。我们实在智能近年来服务了 4000 余家客户,积累了大量的行业 know how。对于一款完全未见过的软件,通用大模型可能只能靠想象去生成任务拆解步骤,出错概率较高。而我们的垂直大模型则能够结合具体行业知识,更准确地完成任务。

从实际效果来看,我们的垂直大模型在一些开放数据集上已经达到了较高的水平,这验证了自研模型或垂直模型在 Agent 产品研发中的必要性和有效性

InfoQ:你们在智能体产品中加入了规划、推理能力吗?

孙林君: 在即将推出的新版本中,我们增加了深度思考的功能。这不仅是基础模型必须具备的能力,也是人工智能发展的一个重要标志,更是智能体基础能力的重要组成部分。

我们的大模型是在一些开源模型的基础上进行微调而来的。我们会将深度思考的特性与我们的数据相结合,构建长思维链的数据,并引入反思机制,以此来训练我们自己的垂直大模型。我们之前使用 DeepSeek作为基础大模型底座,而现在也开始使用千问。

InfoQ:是否需要打通大企业里的不同软件?具体有什么技术挑战吗?

孙林君: 在处理不同软件时,我们的策略是优先使用接口,因为接口能够提供高效且稳定的交互方式。然而,并非所有软件都提供接口。在这种情况下,如果软件支持 MCP,我们会选择使用 MCP 来进行操作。但当软件既没有接口也不支持 MCP 时,我们会采用 RPA 技术。RPA 的优势在于它不需要依赖接口,也能够完成特定的操作,并且在许多情况下能够满足稳定性的要求。不过,RPA 必须具备我之前提到的多种能力,如任务分解、逻辑推理和数据处理等,才能确保其在实际应用中的有效性和可靠性。

InfoQ:MCP 最近火起来了。

孙林君: 人工智能行业目前存在一个问题,那就是很多人只是空谈理论,而真正能够将理论转化为实际成果的人却寥寥无几。像一些人过于夸大新技术的作用,认为有了 MCP 就能解决所有问题,这种观点是不切实际的。实际上,MCP 只是将一些问题进行了封装,问题的本质并没有得到解决。 例如,如果没有相应的接口或能力,仍然需要进行开发工作,然后才能将这些能力对接到 MCP 上,供他人调用。而且,如果过度依赖 MCP 服务,尤其是对于特别简单的任务,可能会导致效率低下。而对于特别复杂的任务,MCP 后面的部分可能会变成一个黑盒,这在调试过程中会带来很大的困难。

我们应该正确看待新技术,承认它的价值和意义,但同时不能过分夸大它的作用。我们应该根据实际情况,灵活选择最适合的技术方案,而不是盲目追求某一种技术。只有这样,我们才能在人工智能领域取得真正的进步和突破。

“大模型不是一个产品”
InfoQ:通用 Agent 和垂类 Agent 的技术实现有什么差异?

孙林君: 按照我的理解,这两类智能体在技术实现上存在差异。对于通用智能体来说,我们需要解决 RPA 底层的通用性问题,而不是针对某个特定行业。例如,如果我专注于垂直的财务智能体,那我可能只需要关注财务领域主流软件的控制即可。通用智能体相对更难实现,但市场空间更大。我们需要克服的问题包括识别的通用性和使用的易用性,这需要很多技术创新来解决。对于垂直类智能体来说,它们需要更深入的行业知识以及其复杂的业务逻辑。

InfoQ:对于 Agent 产品,技术能力和工程、产品设计能力,哪个更重要一些?

孙林君: 产品和工程只是表面现象,真正的核心在于技术能力。正是技术能力的不断提升,才能将一个玩具转变为真正有用的工具。技术能力的持续改进,能够使工具的幻觉率降低到某个阈值以下,从而让用户觉得它真正可用。例如,对于垂直领域的基模能力,需要进行增强,使其在特定领域内具备出色的任务完成能力。

此外,工具的使用完备性也至关重要。我们可以通过各种测试,对同一任务进行细微调整,如采集数据时按页采集、按行采集或全部采集,以及采集哪些列等,这些细粒度的要求能够在测试集中明显体现不同智能体的能力差异。在这方面,我们的技术方案具有显著优势,我们并不是简单地向用户展示几个流程,而是注重技术的深度和实用性。

对于人工智能的落地而言,不应仅仅关注成功的案例,而更应关注那些无法完成的任务,因为这些失败的任务才能真正体现技术的能力边界、决定技术是否能够真正落地。这归根结底还是技术能力的体现。至于产品设计和工程方面,这些是比较容易达成共识的,因为很多产品在外观上可能看起来相似,但底层的技术实现却大相径庭。

InfoQ:智能体产品有没有被过度炒作?

孙林君: 技术行业应该保持本色,避免混淆视听或夸大宣传,不应将一些浅薄的认识误导大众。真正从事技术工作的人应该沉下心来,深入思考行业发展方向和用户真正的需求,这样才能推动技术的进步。过度喧嚣的氛围并不好,对行业发展也未必有利,因为它可能会引发质疑和负面评价。我们应该脚踏实地地前进,为用户提供真实且有价值的产品,这样才能实现长久的发展。

比如,Manus 火了之后,很多人来找我们。他们需要的不是端到端的解决方案,而是满足可控、稳定和高效特点的智能体。不久之后,大量用户被吸引到我们的社区,下载和使用我们的产品,并给出了很好的评价。原因是他们发现原本搭建智能体时,由于没有接口,需要反复调试 RPA,效率极低。而在我们的平台上,一个工具就能搞定他们原来的工作流,效率提升了 N 倍。这显然对他们更有价值。虽然也可以使用端到端的大模型进行尝试,但很少有人会将其应用到真正的生产环境中。

在我们的设计理念中,大模型生成代码后,用户可以编辑生成的代码,运行代码时效率很高。这些因素促使我们宣称自己是产品级别的智能体。

尽管大家对智能体的认识程度有所不同,但有一个共识是智能体的落地已成为当务之急。前段时间我参加了浙江经济百人会,与会的十几家企业都在讨论智能体,覆盖率达到了 100%。这表明大家已经意识到,在以大模型为核心的基础上,人工智能的落地需要以智能体为载体,解决人工智能落地的最后一公里问题。

从这个角度看,智能体的落地是当前迫切的需求。如果犹豫不决,可能会错失参与的机会。因此,我们既要关注科幻小说般的未来愿景,也要脚踏实地地投入生产。立足当下,放眼长远,应该立即行动起来,但行动方式必须是可靠的。

InfoQ:在你看来,大模型是否取代部分智能体能力?

孙林君: 早在 2023 年,我们就已经意识到 大模型不是一个产品, 但很多人却声称大模型可以解决一切问题。现在看来,许多企业也纷纷表示大模型不是一个产品,因为大模型本身存在幻觉问题。

之前展示的大多是成功案例,而非失败案例。如果将大模型作为产品销售,用户关注的是它是否能达到验收标准。从验收标准来看,许多大模型在某些领域无法达标。因此,将大模型作为产品实际上是一个伪命题。随后,RAG 检索增强等辅助性技术开始涌现。片面强调大模型包打天下、一招制敌等观点,都是违背客观规律和现实的。无论是技术、产品、设计还是工程,它们都在不断演进,这是正常的,但最根本的核心仍然是底层技术。

从社区转化客户,价格不由竞争决定
InfoQ:Agent 产品的商业机会具体体现在哪里?

孙林君:Agent 商业机会潜力是巨大的,它并非仅仅是帮助我们完成某一项任务,而是能够引发整个社会的深刻变革。设想在未来的工作场景中,每个人都能拥有众多智能助理,这些智能助理将承担我们工作中需要思考的部分,以及原本需要付出的体力劳动。

对于企业而言,未来大部分工作可能会由智能体来完成,企业规模可能会缩小到一人公司或几人公司,但同时会有大量的数字员工和智能体在背后支持工作。这将导致生产关系因人工智能的加入而发生改变,组织形式也将随之变化,转变为围绕 AI 展开工作。这是一场跨越时代的变革,不应被狭隘地理解为仅解决某一具体问题。

InfoQ:那在成本优化、实现路径上是怎样的?

孙林君:成本降低方面,主要体现在减少了人力需求,此外减少加班以及避免加工资等,也可以视为降本的措施。实际上,在我们追求增效的过程中,已经在不知不觉中实现了降本。

然而,现在我们很多时候需要计算的经济效益,已经不仅仅局限于降本和增效了。我们更应该看到的是它所带来的市场地位变化,以及由此带来的价值提升。举个例子,博尔特在百米赛跑中领先第二名仅仅零点零几秒,但他的身价可能是第二名到第八名的人加起来的总和。同样地,如果将这种情况放在企业行业地位上,情况也是一样的。排名第一的企业与排名第二、第三、第四的企业,在竞争中所处的优势是完全不同的。

InfoQ:你们的产品定价模式是什么样的?

孙林君: 从大的框架上讲,我们的收费模式是按照人头数来计算的。具体来说,我们会根据为客户输出的机器人数量来收取年租费用。这种模式不仅使得费用相对较低,而且能够持续为客户提供升级服务。在这个过程中,我们实际上构建了一种可延续性的收入模式。

打价格战往往是企业陷入同质化竞争的一种表现。价格战本身确实不利于行业的健康发展。如果产品具有足够的差异化,那么就可以避免陷入价格战。

InfoQ:市面上,哪些算是你们的竞争对手?

孙林君: 我不认为我们有很多竞争对手,因为许多表面上看起来的竞争对手,在底层能力上并不具备足够的竞争力。由于实在智能这几年的技术演进,我们已经解决了许多核心痛点。如果这些痛点没有得到解决,那么我并不认为他们是我们的竞争对手。

在商业化方面,价格和价值必须相匹配。对于用户来说,他们也有自己的承受能力。因此,价格不仅由竞争决定,还与客户的预算和他们愿意付出的成本密切相关。

InfoQ:是否会做一些定制化服务?

孙林君: 我们通常不直接进行定制化服务,但我们有许多合作伙伴可以帮助客户完成相应的定制化工作。实际上,由于我们产品的成熟度和易用性,许多客户会选择自行定制,因为他们更了解自己的业务需求。这样可以减少沟通和交流的成本,提高定制的效率。我们为客户提供的平台和产品,使他们能够基于我们的技术构建自己的智能体。

我们有免费的社区版,其实是面向个人的。其中,一些个人用户使用比较多,之后会建议自己的公司来购买这个产品,我们现在的大量客户就是这么转化来的。

InfoQ:当前 Agent 产品的 B 端主流收费模式是怎样的?哪种模式增长最快?

孙林君: 目前,整个行业仍在探索阶段。客户的付费习惯实际上也是可以被引导的。在 SaaS 模式出现之前,大家通常采用系统开发的一次性付费方式,但这种模式并不利于行业的长期发展。SaaS 模式出现后,由于其成本低廉且服务具有较好的延续性,越来越多的客户开始选择这种模式。这对行业的发展是有益的。然而,收费方式需要不断培养用户的习惯,找到一种在商业模式中能够让各方都能生存和发展的方式。否则,如果这种模式只对一方有利,缺乏平衡,最终可能导致行业的消亡。对我们来说,目前我们更倾向于采用年租模式。

当前,C 端和 B 端存在明显区别。目前,C 端的收费模式主要是会员制,而 B 端的收费模式则多为授权费用和私有化部署费用。C 端产品通常客单价较低,且要求易于上手,使用成本低。相比之下,B 端产品客单价较高,对上手成本的要求没有 C 端那么高,但对产品的可靠性、稳定性和高效性有很高的要求。

InfoQ: 客户付费意愿的核心驱动因素是什么?

孙林君: 最核心的驱动因素是人工智能让客户能够实现以前无法完成的事情。过去,许多经验和知识都储存在人们的脑海中,人们也没有能力去构建复杂的系统。但现在,智能体提供了一种高效的方式,帮助客户将自己的想法实现出来。客户无需再构建新的系统,而是可以利用大模型来代替自己进行思考。他们只需要向大模型传达自己的思路,大模型就能帮助他们完成相应的操作。我们只需将工作流沉淀下来,并不断优化,使其准确率越来越符合我们的要求。这样一来,它就像一个人一样,变成了我们的代理人。

InfoQ:实在智能在技术、渠道与生态层面采取了哪些“护城河”策略?

孙林君: 我们的核心竞争力,即所谓的“护城河”,主要体现在对行业的深入思考以及对行业局限性的突破上。在技术积累方面,我们凭借持续的技术进步推动产品的不断演进,进而驱动销售的拓展。因此,归根结底,我们真正的护城河还是在于对行业的深刻理解和持续的创新能力。

InfoQ:Altman 有在采访中提到,2025 年将是智能体完成大规模应用的一年。你认同吗?

孙林君: 他的观点与我们基本一致。今年年初,我们就提出了 2025 年将是智能体的商业化元年。在 2024 年,我们提出了智能体元年的概念。2024 年被称为智能体元年,是因为在人工智能行业,大家开始看到智能体的潜力,并探索其在企业端的应用,但当时企业端可能还没有大规模意识到这个问题。到了 2025 年,整个行业都在关注智能体,并开始将其落地应用。因此,今年可以说是智能体商业化元年的开端,这与 2025 年将是智能体完成大规模应用的说法非常相似。

InfoQ:当前智能体应用发展还面临哪些挑战?

孙林君: 目前,整个行业面临的挑战是,在用户需求如此迫切的情况下,如何实现快速落地。很多时候,我们应该更关注实用性技术,而不是那些仍停留在实验室里的产品。如何能够快速为客户创造出他们想要的价值,这才是最大的挑战,而所有的工作都应该围绕这一点展开。不同的技术路线可以帮助客户解决这个问题,有的人可能会选择大模型,有的人可能会选择大模型加 API,有的人可能会选择大模型加工具,还有的人可能会选择大模型加 RPA。最终,这取决于用户的选择。

InfoQ:你认为,Agent 产品形态最终会是什么样子的?

孙林君: 我认为,最终的产品形态应当是一个助手,可能仅需一个对话框或对话界面就已足够。至于交互方式,更多地应是功能点的呈现,其本质是对话。我们与助手的交互本质上就是对话,因此,一个界面就足以满足需求。甚至在未来,操作系统或许都不再需要界面,我们只需通过语音与内置的助手进行交互即可。

InfoQ:随着“数字员工”越来越多,大众接受度越来越高,你对人类员工有哪些建议?

孙林君:对于人类员工而言,当务之急是掌握人工智能的能力。因为人工智能本质上仍是一种工具,目前尚未达到完全智能化的时代,人机协同才是当下最可靠、最实际的选择。 最先拥抱人工智能的人将率先享受到红利,掌握人工智能的人将成为社会最为需要的人才。因此,我的建议是大家以开放的心态拥抱人工智能时代,深度参与并使用人工智能。

InfoQ:企业员工对 AI 的接受度怎样?

孙林君: 我观察到,企业员工对人工智能的接受度正在逐渐提高。这主要是因为人工智能已经成为一种共识性工具,从最初的焦虑和敬畏,到现在大家开始将其视为一种实用的工具,并积极地使用它。甚至有些人已经深入地将其融入到工作中,实现了较高的应用水平。

以程序员为例,曾经有人认为他们是最早可能被人工智能替代的职业之一。然而,随着时间的推移,大家逐渐意识到,这种替代并非如最初想象的那样简单。许多工作,尤其是编程工作,并不是简单地通过一句话就能完成的,它们的复杂性在于构思和创造的过程。实际上,如果思路已经明确,编写代码只是最后一步,程序员们在此之前需要进行大量的思考和设计工作。因此,要完全替代程序员的工作,并非易事。

目前,大家对人工智能的态度已经发生了积极的转变。人们不再像以前那样焦虑,而是将其视为一个强大的助手和助理。

我们持续关注智能体的前沿技术、产品发展、落地实践等,期待通过系列报道,呈现前沿的实践样本与真实故事。如果您的团队正在做一些有意思的想法和探索,或者已有不错的成果,都 欢迎来找我们聊聊!V:T_demo(请注明来意),让更多人看到你们在智能体时代的独特尝试~

活动推荐

6 月 27~28 日的 AICon 北京站将继续聚焦 AI 技术的前沿突破与产业落地,围绕 AI Agent 构建、多模态应用、大模型推理性能优化、数据智能实践、AI 产品创新等热门议题,深入探讨技术与应用融合的最新趋势。欢迎持续关注,和我们一起探索 AI 应用的无限可能!


今日荐文

天塌了,Claude 全面断供Windsurf!CEO喊冤控诉也挡不住开发者退订,祸起OpenAI收购?

0粉丝狂卷数十亿播放,靠AI流量欺诈获利近亿!网友:这“刑”得离谱

被高薪吸引却遭愚弄!科学家怒曝AI科研黑幕:多为个人“捞金”,DeepMind百万成果是“垃圾”

新存1000万,为客户子女提供实习机会?字节等回应;宇树更名,王兴兴曾称或赴港上市;韦神新成果正式命名“韦东奕定律” | AI周报

Redis 之父:哪怕被喷我也得说,AI 远远落后于人类程序员!开发者跟评:用大模型气得我自己写代码都有劲儿了

你也「在看」吗?👇

(文:AI前线)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往