激辩AI Agent商业化:万亿市场如何破局?|甲子引力X

AI Agent离我们越来越近了。


4月28日,由「甲子光年」主办、上海马桥人工智能创新试验区联合承办的「AI共潮生——2025甲子引力X科技产业新风向」大会在上海工业智能中心盛大启幕。


在下午场的「AI Agent」圆桌对话中,维度AI创始人兼CEO杨宇梁担任主持人,与易点天下技术中心副总经理张奥迪、容联云副总裁,诸葛智能创始人孔淼、e签宝CPO李聪、未来式智能联创&COO邹阳、flowith CMO郭梓溢,围绕AI Agent商业化落地的核心命题,通用与垂直的路径选择、技术瓶颈与行业实践、商业化模式创新及生态博弈等议题展开深度探讨。


易点天下张奥迪认为,通用Agent需达到AGI级别才具普适性,当前更应深耕垂直场景(如营销素材生成、自动化投放),并通过原子化拆分企业能力实现提效;他强调调度准确性、人备机制设计及MCP技术稳定性仍是落地难点。


容联云孔淼提出,Agent本质是任务规划与工具调用的组合,客服场景已从辅助型向自主执行型过渡,大模型显著提升质检与对话洞察效率,但需平衡工程化成本与客户ROI诉求。


e签宝李聪分享了智能合同实践案例:系统可自动识别条款风险并定向推送至交付主管,合同流转效率与风控水平成倍提升;其商业化策略从版本订阅制转向“坐席+调用量”混合计费,以应对Token指数级消耗压力。


未来式智能邹阳直言,当前Agent技术尚未成熟,央企会议室预定项目因模型误选API导致流程混乱,验证了工程化落地必要性;同时指出专家经验书面化难度大,多数场景缺乏SOP基础,规模化依赖持续投入。


flowith郭梓溢作为C端代表,介绍了作为全球最早涉足通用Agent领域的先行者的发现和思索,其Agent框架核心理念强调人机协同,使人不仅是旁观者,而是可实时参与创造过程的主导者;团队即将发布新一代各项能力领先的新Agent,旨在让用户可以将agent使用场景聚焦在实际生产提效上。


以下是本场圆桌的对话实录,「甲子光年」整理:


维度AI创始人兼CEO杨宇梁:今天很高兴有这个机会能够和各位企业代表一起探讨AI Agent商业化的破壁之战。我是维度AI的CEO和创始人。


公司主要致力于打造可靠、有据可依的研究型引擎和Agent,在解决人类知识诞生问题上持续探索迭代。我们坚信AI是系统化的探索并且发现关键知识,深度理解知识,创造新智慧的根本途径。接下来要发布的维度研究型引擎,也会大幅度帮助学生、研究者和专业人士的研究型需求。


维度AI创始人兼CEO杨宇梁


易点天下技术中心副总经理张奥迪:我是张奥迪,是易点天下的技术中心负责人兼AI Lab的负责人。简单点说易点天下,我们是帮助客户做出海全球化增长的。有两个方面:一方面是客户有流量增长需求,我们帮助他做流量增长,另外一方面是帮助客户做变现增长。


我们在AI领域做营销素材,之后又投入到BI也就是数据洞察和AI结合,在今年我们做智能投放。以前可能在整个链路过程中,需要投手大量地研究素材,把他的经验放在投放优化链路上达到高的ROI,但是今年我们通过Agent的方式把这套全部变成一键自动化。包括企业内部的信息化流程,像我们把整个企业的能力全部变成原子化,再通过不管是MCP还是其他的方式通过Agent进行提效和商业化。


易点天下技术中心副总经理张奥迪


容联云副总裁、诸葛智能创始人孔淼:我叫孔淼,我们是容联云是一家以“通讯+数据+智能”为核心能力的企业级产品和解决方案提供商。旗下包括容联云全渠道智能联络中心、容联七陌、诸葛智能,容犀大模型应用等一系列产品,目前差不多有上万家客户,覆盖数百家金融头部机构。


我们大概是从2023年开始发布大模型应用“容犀Copilot & Agent”,覆盖从对话洞察到坐席代理、坐席辅助、智能质检等。今年Agent很火,我们在产品上也做了进一步升级。


容联云副总裁、诸葛智能创始人孔淼


e签宝CPO李聪:我是来自于e签宝的李聪。e签宝有很多人都听过,我们是一家专注为企业和个人提供电子签名及合同管理服务的。我们是一家成立了20多年的公司,我们一直做电子签名和合同管理,到目前累计了大概70多万的付费用户,每天在我们的平台上大概有2500万份合同完成签署。


差不多也是从2023年开始,我们一直在使用大模型提升企业合同智能化,过去更多的是把AI能力嵌入到原有的功能中去,今年我们也在打造智能合同Agent,希望用一个对话框搞定一个合同的签约流程。


e签宝CPO李聪


未来式智能联创&COO邹阳:我是邹阳,我们主要是做AI Agent,应该是国内最早一批,我们之前的核心团队是从阿里巴巴达摩院出来的,ChatGPT出来之后,我们准备开始创业,我们公司在2023年的3月份,定了AI Agent的赛道,一直也在用相应的技术为B端企业市场去做有价值的落地。


未来式智能联创&COO邹阳


flowith CMO郭梓溢:我是Flowith的郭梓溢。与刚才介绍的企业不同,Flowith专注于C端市场,是一款致力于打造AI时代终极的创作工具。


我们去年8月正式发布,是通用Agent领域的先行者。目前已在海外市场积累了数十万用户,我们的通用Agent服务已处理超过2000万次请求。今年1月,我们推出了革新性的知识花园功能,并且具有可交易属性的AI知识市场,这两者功能也将结合起来。接下来,我们将发布更多关于Agent和AI领域的创新功能,持续探索人和AI的终极交互形态。


flowith CMO郭梓溢




1.究竟什么是AI Agent?


杨宇梁(主持):在你们的定义当中,什么才是Agent,它应该有什么样的产品形态,应该具备什么样的能力,才被称之为AIAgent?


张奥迪:大家都在讨论AI Agent,需要理性看待。我们可以从两个角度来看。


第一个角度是把它当作工具来看。


这种情况下,AI Agent本质上是“自动化 + AI”,也可以理解为“RPA + AI”。它的优势在于更加灵活,但缺点是如果流程链路太长,就容易出现不稳定因素。这时候可能需要通过每个单点环节来校准稳定性,或者借助系统性的提示词工程来提升效果。


另一个角度是把AI Agent当做人来看。


目前它还只能相当于一个实习生或助理的角色。现在市面上很火的产品,大家都在尝试使用,无论是生成报告还是其他功能。你会发现,结果本身其实并不那么重要,第一步的数据采集反而更为关键。比如,它虽然能全网搜索大量信息,但如果你要做一份有深度的报告,而你所获取的数据和别人一样,那这份报告的价值在一开始的数据层面就已经降低了。


再谈一下AI Agent的能力边界。如果它能在整个复杂流程中实现自动化,并达到人类完成的效果,那就可以称为AI Agent;但如果只是在某个单一场景解决特定问题,那其实只是一个AI工具,甚至不需要用到AI。


我们之前也踩过这样的坑:原本想用AI Agent完成一个功能需要18秒,而用传统工具只用了9秒。对于用户来说,等待时间是不能接受的。因此,我们要从用户需求出发,优先考虑提供低成本、高效满足用户需求的工具。


孔淼:从两个维度来看,我们从2023年开始接触并尝试AI Agent这个概念。一方面是我们观察行业是如何定义Agent的,另一方面是我们自己如何去理解和应用它。


回顾2023年,当时ChatGPT刚刚兴起,Agent的概念开始受到关注,最早的一些产品,尤其是被称为“四小龙”的公司,已经开始在产品中引入“智能体”这一概念。他们将一个System Prompt所构建的特定角色——例如一位金融工程师的人设视为一个Agent。


随后进入第二阶段,一些flow类的开源工作流编排开始出现,某些人开始认为“编排即Agent”。


到了2024年初,完整的Agent开始被认为应具备几个核心能力:长期记忆、短期记忆、任务规划、工具调用能力以及结果输出能力。


再到Devin出来之后,这种代理自动化编程能力。再到今年的Manus的browser use这种能力。


所以从整个Agent行业发展来看,其实经历了被认为是”智能体”、是”代理”的不同定义的阶段。穿透来看,有人认为LLM大语言模型的一个Feature,就是在特定场景的某种人设是一种Agent,有人认为工作流编排是一种Agent,当然,也有很多走在前沿的开发者,比如Manus,真正实现了让Agent代替人类去使用工具完成任务。


容联云较早地开始了Agent的探索,过程中认知也在不断更新。在服务大模型客户的应用实践中,我们总结出两种主要应用场景:


第一种是辅助坐席型应用,比如在客服或销售坐席的工作流里面,提供提示话术、流程引导或知识检索支持。我们认为这类更接近于Copilot,原因是在既有流程中起辅助作用。


第二种是自主执行型应用,如话术挖掘、话术洞察,甚至包括知识挖掘等任务。我们认为这才是真正的Agent。原因是说,我们会为它定义目标,定义数据API,通过LLM自动理解历史沟通记录和会话记录,并调用一些基础工具——比如函数调用、代码调用或业务API——来挖掘有效话术和服务中的关键信息与结果,实现端到端的自动处理。


但到了今年,我们也发现单纯的端到端方式并不够完善。基于行业前沿的Agent标准——由LLM做决策,结合tool use进行工具调用,并基于业务进行场景设计——如果从这个维度来看,我们需要升维思考。


过去我们的Agent更多是用新的软件替代旧软件,而现在我们开始融合新旧软件体系,借助computer use或者browser use的能力,在基于大模型去做调度,从而构建更前沿的Agent系统。这也是我们在对Agent理解上的不断升级。


李聪:如果这个问题交给AI来回答,它很可能会告诉你,一个合格的Agent需要具备需求理解、任务决策和动态执行能力。这大概就是一个标准答案。


但真正衡量一个Agent是否“合格”,关键在于它的决策预测是否符合用户的实际需求。当我们使用像OpenAI或DeepSeek这样的模型时,会发现它的决策和执行过程往往与我们的预期存在较大偏差。


因此,我认为一个真正合格的Agent,应该能够结合用户的具体背景进行调整。例如在我的产品中,它可以根据历史知识和过往的决策行为,提供辅助性的纠偏,并实现动态执行。


关于产品形态,我认为它并不是单一固定的。在我们的产品中,大多数情况下,Agent在执行合同类任务时是用户“感知不到”的——也就是说,它并不一定需要交互式界面。当然,对于一些高风险操作,我们仍然会保留人工确认环节,由用户点击“确定”来进行最终把关。


邹阳:可以看出来,目前大家对于Agent的概念和定义仍然存在一定的差异。如果让我用一句不容易被挑毛病的话来概括:所有大语言模型的应用都可以称为AIAgent。从当前市场上的情况来看,这句话基本是成立的。


当然,如果非要进行分类,区别主要体现在任务的自主规划能力上。比如最早期的AutoGPT,它是不是AI Agent?当然是。只不过它并没有调用外部工具,而是通过自我对话来拆解问题、回答自身。


而如今更多采用“工具调用+工作流”的方式,比如像Coze或者其它基于Workflow编排的产品,大多数人都认为它们也是AI Agent。


所以如果进一步拆解这种行为差异,我们可以发现背后主要有两种实现方式:一种是由模型自主进行任务规划;另一种则是通过人为设计的工作流进行编排实现。


郭梓溢:前面几位老师分享的内容更多是从技术角度出发,介绍了AI Agent的概念和定义。考虑到在场以及线上可能有不少非技术背景的朋友,我想用两个更贴近生活的例子来帮助大家更容易地理解Agent到底是什么。


第一个例子是:如果把大语言模型(LLM)比作人的“大脑”,那么AI Agent就像是整个“神经系统”。它负责接收大脑发出的指令,并协调身体完成具体任务。比如我现在坐在这个位置,通过话筒讲话,看似是一个简单的动作,其实背后已经完成了从思考到执行的一整套流程,这正是Agent所扮演的角色。


第二个例子是:我们可以把LLM想象成一台“发动机”,而基于LLM构建的Agent就像是利用这台发动机制造出的不同交通工具——比如汽车、飞机、火箭等。也就是说,LLM本身是核心动力来源,而Agent才是真正将这种能力转化为实际应用的系统。


接下来简单介绍一下我们自己开发的flowith Agent。我们和目前市面上一些比较热门的通用Agent产品,有几个共同的核心特征:


1. 主动思考,自主规划路径 :当用户输入一个问题后,Agent能够自动规划出一个工作流来完成这项任务;


2.工具选择 :根据任务的不同阶段,动态选择合适的工具或子Agent来协助处理;


3.具有记忆,交付结果 :最终按照用户最初提出的Prompt要求,返回高质量的结果。


整个过程就像我们之前提到的那样,Agent可以感知环境、调用工具、执行任务,并最终输出符合预期的答案。


不过,在flowith的产品设计中,我们特别强调了一个与众不同的理念——人机协同。这一点与一些其他产品的设计理念略有不同。有些产品主张用户提出问题后,后续全部由Agent自动完成,不需要人工干预。但我们认为,在很多复杂或关键任务中,人类的判断和引导是非常必要的。


因此,在flowith中,我们的工作流是可以被用户主动干预的。例如,在进行信息检索时,用户可以明确告诉Agent:“我需要从小红书或者微博获取数据”,甚至可以指定使用哪些具体的工具。在整个执行过程中,用户也可以随时介入,调整方向或策略。


这种“人可干预、AI辅助”的模式,是我们对Agent的理解和实践方式,也是我们产品区别于很多通用Agent的重要特点之一。




2.通用与垂直应该如何选择?


杨宇梁(主持):各位嘉宾自己企业中提供的产品或者服务,是选择打造通用型的Agent?还是更深耕于垂直市场的产业Agent?


张奥迪:我们坚定地选择做垂直领域的AI Agent 。在我看来,“通用”这个概念太泛了。真正的“通用”可能只有达到AGI(通用人工智能)级别才能实现。而我们所定义的Agent,是在完成一个全链路任务之后,能够像人一样输出稳定且高质量的结果 。


在营销行业,无论是素材生成、广告投放,还是为客户做变现,甚至跑模型验证效果,最终都要看实际产出。过去我们做KreadoAI项目,即使推出了数字人功能,用户也往往只是下载素材后进行二次加工。虽然部分环节实现了提效,但整体上还没有真正达到AI Agent的标准。


今年我们开始聚焦垂直场景,比如易点通过把BI能力、AI创意生成、投放能力等全部拆解为子工具,形成公司在营销领域的AI Agent与MCP server。顶层通过大语言模型加营销行业知识库,构造精准营销的调度系统,配合应用层多Agent平台,解决企业全面AI化提效问题。初期我们也曾尝试通过Workflow串联每个模块,并由大模型作为调度器智能分配任务。但在实践中发现效率较低——每一个子Agent都需要保证效果,一旦某个环节出错就需要重跑整个流程,虽然可以校正,但用户体验不好。


于是我们转变思路:将所有标准操作流程(SOP)整理出来,以单点场景为基础,构建自动化的Agent系统。


以垂直营销为例,客户想通过社交方式获客。虽然方法论已有积累,但我们希望实现批量化的高质量操作。


同时,我们实现了网站内容批量发布,从关键词采集到内容生成、再到搜索引擎抓取优化,整个链路打通。此外还包括自动化投放环节,仅预算分配这一项,人工操作中就有近20个细化步骤,非常复杂。我们认为,在垂直领域做好AI Agent本身就是一项挑战,必须确保每个环节的效果,客户才会愿意买单。也只有这样,才能真正帮助客户实现增长。


孔淼:我们所做的相对比较垂直。


从业务场景来看,比如我们在做辅助、洞察、质检等功能时,虽然在客服领域具有一定的通用性,但在产品内部流程中,例如质检项、话术挖掘、话术助手等模块,则是进一步聚焦细分,属于“垂上加垂”。


整体来看,我们的应用场景本身就有一定的垂直属性,而在具体行业落地时,还会结合行业特点进行针对性的功能封装和应用适配。


李聪:在战略选择上,除了考虑企业的技术能力和客户需求,首先要评估的是:自己的产品被通用型AI颠覆的可能性有多大。


以e签宝为例,我们认为电子签名在现行法律体系下是难以被AI替代的。根据《中华人民共和国电子签名法》,电子签名必须由第三方认证机构完成,而e签宝本身就是具备资质的认证机构。除非未来社会不再需要实体合同,契约关系完全由AI来确认,届时合同本身都不再存在,e签宝自然也会消失。但在当前阶段,我们认为这种颠覆发生的可能性并不大。


当然我们也意识到,如果通用AI足够强大,e签宝的产品价值可能会被压缩到非常薄,最终只剩下“签字”这个动作。比如合同管理、印章管理等环节都被AI接管,我们可能就只扮演一个很小的角色,这是我们目前最大的焦虑所在。


因此,我们的核心方向仍然是深耕垂直场景,把智能化做到极致,构建更深的护城河。


邹阳:因为我们公司本身也是一家创业公司,我认为只有少数具备三个条件的创业公司才敢切入通用场景:一是人才密度足够高,二是资金足够充足,三是足够幸运。只有这三者兼具的公司,才有可能支撑得起通用型产品的探索。


毕竟当前大环境并不乐观,活下去是首要任务。相比之下,聚焦一个细分领域,深入满足特定客户(无论是大B还是小C)的真实需求,并获得他们的认可和付费,显得更为务实和重要。这是我个人的看法。


郭梓溢:我们是面向C端的产品,初期主攻方向是想服务所有用户的通用Agent。在通用Agent的发展过程中,我们确实遇到了一些问题,其中最大的挑战或许不是模型能力,而是用户不清楚它能解决什么实际问题 。


自去年8月推出第一代通用Agent以来,我们累计服务了超过2000万次请求。我们也曾举办过相关比赛活动,了解用户如何使用通用Agent。结果显示,目前大家更多是将其用于生活化或娱乐化的场景,但真正投入生产环境来提升效率或创造价值的场景还有待探索。这可能是当前通用Agent面临的核心瓶颈——执行搜索信息大部分杂糅且只能来自公开互联网,可能无法筛选提取最有价值的信息,从而有效帮助用户实现实际产出与收益。


当然,通用Agent的前景是非常好的。比如做PPT、写研报、追踪新闻热点等媒体类任务,这些都非常适合由通用Agent来完成,并且已经可以达到不错的应用效果,某些产出已经能达到行业专家的水准。


但在B端或企业级场景中,通用Agent面临明显局限。例如,企业的数据、历史知识、人力资源等相关信息,往往无法通过公共互联网获取,这就限制了Agent的理解与执行能力。


很多人可能会问,为什么我们在推出通用Agent之后,在2.0阶段重点建设知识花园? 因为我们认为,真正有价值的信息并不都来自公开网络,而更多存在于人类大脑或行业内部的知识体系中。知识花园不完全等于知识库,它强调的是知识的动态应用和有机链接,通过AI把这些内容拆分成一个个小小的种子,后续智能化地生长与生成因此,我们希望通过构建这样的系统生态,为Agent提供更多核心认知资源。


当更有价值的知识与Agent深度结合 ,将能更好地服务专业用户或企业客户。以我自己的产品为例:如果我让通用Agent帮我生成一份关于flowith的研报或PPT,但许多关于产品的核心理念并未发布,公开信息有限,仅靠通用Agent难以完成高质量输出。但如果结合企业内部的知识库,就能有效补充背景资料,再借助Agent的能力,就可以完成一份具备参考价值的调研报告。


当然,对于像硬件领域或其他高度专业的软件行业来说,除了基础信息之外,还需要更深入的垂直理解和定制化能力,这也是垂类Agent 更具优势的应用方向。




3.AI Agent的业务实践


杨宇梁(主持):从企业业务实际角度出发,你们的业务有哪些典型痛点,AI又是如何解决这个痛点的?


张奥迪:我从“对内”和“对外”两个方面来分享。


对内方面 ,我们公司内部有一个信息化平台项目,涵盖了OA、ERP等近200个审批流程。每个事业部都有自己的服务台,无论是新员工还是日常问题,大家都会通过服务台找流程处理事务。


但随着业务增多,流程查找变得越来越困难,很多时候用户找服务台也会找错部门。


今年我们上线了内部BOT系统“易鲸灵”,定位是一个“All in One”的统一入口。前端作为调度中枢,用户遇到问题时,首先由企业FAQ知识库响应,像差旅审批等常见流程都已集中接入。系统能自动识别需求,调用对应流程并预填信息,用户只需点击确认,即可完成审批、出差等操作。


这个系统最大的难点在于调度的准确性,以及当AI无法解决问题时,如何快速引入人工支持。我们在“人备机制”上也做了很多尝试和调整,比如判断替补人员是否在岗、是否请假等,这部分逻辑也打磨了很久。


对外方面 ,我们也进行了一些实践探索。


我们起初认为聊天对话会是未来最自然的交互方式,因为工程成本低,也能同时部署大量Agent。


但从BI数据来看,情况并不理想:详情页用户转化率有30%左右,但一旦进入操作页面,点击率就大幅下降,用户不知道怎么操作。这让我们意识到:对于单一任务,传统交互更直观;而对于多步骤、需要灵活性和创造性的任务,对话式交互才更有优势。


此外,我们也在智能投放方向做了一些探索。例如,用户仅提供一个产品官网URL,系统就能自动分析产品内容,并基于当前投流市场中的爆款素材进行一键复刻。这样既提升了效率,也更好地保障了投放效果。


孔淼:我们目前的大模型应用主要聚焦在销售与服务的全流程中。


提到大模型,很多人首先想到的就是对智能客服的颠覆。毕竟现在“客服”很多时候已经被称为“智能客服”。但事实上,传统智能客服在中大型企业中的应用效果仍比较有限。


过去以小模型为主的任务型系统,在特定场景下表现良好,但由于沟通本身就是信息长尾型且多样化的,不同用户表达同一问题的方式可能差异很大。如果仅靠小模型穷举各种表达方式,几乎不可行,这也导致了两个核心痛点:


第一是知识运营成本高 :需要专人整理QA知识库,周期长、效率低;第二是模型调优依赖训练师 :影响产品落地和商业可行性。


因此,过去基于小模型的智能客服,始终没有真正跑出大的行业玩家。


而大模型的出现 ,很好地解决了语言泛化的问题。作为Foundation Model(基础模型),它为理解多样化的语言提供了强有力的支撑。在此基础上,再通过轻量级小模型完成意图识别等具体任务,就构成了我们当前做智能客服的核心逻辑。


从业务维度来看,智能客服的应用场景非常广泛。企业普遍采用“机器人先行+人工兜底”的模式:先由在线或语音客服由机器人处理,无法解决时转接人工。这是一套典型的智能客服流程。


而在整个流程中,坐席人员通常会经历事前、事中、事后的多个环节:比如事前的培训、知识准备;事中的实时辅助、智能填单、业务管理;事后的质检、报表监控等。这些环节中,很多原本受限于泛化能力不足、多轮对话处理不佳的问题,现在都通过大模型得到了有效改善。比如:


在通话过程中,机器人能更好地理解打断、上下文切换;在线客服也能更准确地把握用户意图,不再“答非所问”。在质检方面,传统上依靠正则或小模型配置规则,不仅繁琐,而且效果有限。现在我们只需用自然语言定义“问题项”,大模型就能自动挖掘异常行为,极大提升了准确率与召回率。


在对话洞察方面也是如此。以往客户沟通记录海量繁杂,靠人工听录音效率极低,而传统NLP方法又难以深入挖掘。现在我们只需将这些数据交给大模型或Agent,就能从中提取潜在需求、商机线索、服务断点,甚至反向推动智能化流程构建。这种从“看指标”到“读内容”的转变,是对话洞察的一大飞跃。


我们的大模型与Agent能力,主要集中应用于客服场景的各个环节中,真正实现了从效率提效到价值挖掘的升级。


李聪:对e签宝来说,我们的产品核心是帮助企业提升合同签署和管理的效率,同时识别潜在风险。


在座很多同行都是做企业服务的,我举一个实际场景:当甲方提供一份非标合同,销售会将其上传到CRM系统,并进入主管、财务、法务甚至交付主管的审批流程。过程中可能就包含一些不合理或难以执行的SLA条款。


使用e签宝智能合同后,系统会在合同上传后自动识别关键信息,比如合同类型、核心条款,并据此判断应走哪个审批流程。例如,如果架构条款合理、折扣也正常,主管就不需要再审批;如果识别到某项条款存在疑问,则流程将自动流转至交付主管确认。


很多时候,交付主管拿到一份几十页的合同,往往不知从何看起。而我们会基于其角色设定(如交付主管关注哪些条款),在合同进入审批环节时,自动高亮需要关注的内容,并提示潜在风险。这样,他们无需通读整份合同,也不用自己查找重点,效率大幅提升。


整体来看,在合同流转效率和风险条款识别方面,智能合同带来的提升是成倍的。


邹阳:从实际业务落地的角度来看,我们认为当前的大模型技术还不够成熟。


比如大家都很关注MCP这个方向,我们曾为一家央企信息化公司落地了一个会议室预定场景,结果整个过程非常痛苦。这个场景需要对接四五个会议系统,涉及近百个API。虽然我们把这些API都做了MCP化,让模型自己选择调用接口,但效果并不理想——模型经常选错,导致流程混乱。这也说明,这项技术远未达到高度成熟的阶段,还需要大量工程化工作来打通“最后一公里”。


其次,目前智能体的落地形态,大多是模拟某个领域的专家行为。比如用知识库承载专家的显性知识,用工作流承载其经验逻辑。但现实中存在一个问题:很多专家是“老师傅”,他们的经验并未以自然语言形式记录下来,更谈不上数字化。


举个例子,我们在为电网公司做变电站设备检修项目时发现,老专家只要看几个关键数值就能判断问题所在。但这些判断逻辑并没有明文规则,必须通过访谈将其经验书面化、结构化,才能用于建模和落地。


这也意味着,在许多真正有价值的业务场景中,并没有现成的SOP可以参考。如果希望实现技术规模化落地,技术和实施方都需要持续投入与配合。


郭梓溢:我非常认同邹阳老师关于模型能力的观点。我们从去年8月开始推出通用Agent产品,当时还没有像ChatGPT O1、DeepSeek R1等新一代推理模型。在具备初步框架后,我们的交付效果虽然与现在的通用Agent已经比较接近,但最大的问题在于用户感知不足 。


因为我们是C端产品,用户在初期并不清楚Agent和普通模型之间的区别。同时,通用Agent更适合哪些具体场景,也尚未形成清晰认知。


我们曾经与Google官方以及Openai团队有过相应讨论。在O1模型发布之后,以及DeepSeek R1等具备推理能力的模型进入大众视野,普通用户对AI推理过程有了更强的理解——比如思维链、逐步推导等,这让他们更容易接受模型输出的结果。


随着通用Agent概念逐渐走红,用户对Agent的整体认知也在快速提升。这对于Agent行业从业者来说,是一个爆发式增长的机会。


当越来越多的公众、企业用户和C端用户真正理解了Agent的价值,整个行业的发展前景也会更加广阔。


杨宇梁(主持):在Agent和业务结合的过程中,你们企业遇到最大的难点是什么?是如何突破的?


张奥迪:我认为最大的难点在于如何深入理解整个业务流程,并将其转化为Agent可以解决的形式,这是落地过程中最具挑战性的部分。另一个关键问题是控制大模型的稳定性。


此外,要实现理想的业务效果,往往需要多层技术叠加。大模型在其中只承担部分能力,当前我们产品中的比例大概是30%-40%,其余依赖传统工程化手段。随着底座模型的发展,未来这个比例可能逐步向4:6甚至5:5靠拢。


但要注意的是,传统的工程化方法在可预见的未来仍不可替代。最终的核心难题依然是:如何准确理解用户需求,并通过合适的产品形态有效交付。


孔淼:从企业级的Agent落地来看,主要是决策能力、工具调用能力。


从决策能力上来讲,其实是依赖模型能力的。企业级应用的时候有很多企业级内部的领域知识,所以对企业本身的数据工程、知识工程,现在的技术发展很快、概念很快,企业的建设是没跟上的,如果做得不够的话、在任务规划的时候就不会做得很好,不会那么精确。


从工具应用来看,其实现在也是分成两个阶段。前一个阶段主要涉及工程化的手段,但是要把它用好就需要产品技术研发是非常懂业务的,这是一种瓶颈的阻碍。第二个是现在流行MCP新技术手段,就依赖于生态建设和已有的软件工具做结合,所以这两个维度都是属于技术概念和技术都跑得很快,但是企业内部还是处于建设过程,所以最后给人感觉好像什么都可以做、但是做起来效果不是那么好。




4.商业与生态的想象空间在哪里?


杨宇梁(主持):今天的圆桌也是商业化的破壁之战,下一步考虑无论是Agent还是AgentSystem的商业化方式,是按调用量来收费还是借鉴以往SaaS的订阅制收费,还是按结果收费甚至是不收费?


李聪:e签宝现有的产品逻辑是按版本订阅收费,比如专业版、高级版等,版本中会包含一定额度的签署量,类似于手机套餐中“199元含100G流量”的形式,超出部分可以再购买补充包。


但当AI产品上线后,我们发现这套版本制的计费方式不再适用。随着系统提示词组件不断扩展、用户使用频率上升,Token消耗呈现指数级增长,远非线性增加。因此,我们调整为按坐席数量 收费,也就是相当于企业雇佣了多少个AI员工,就购买多少个坐席。


对于一些用户需求强、开发投入大的AI功能,例如合同审查、合同比对等,我们仍采用按调用次数计费 的方式。我们会根据套餐提供一定的免费调用量,超出后可单独购买补充。


邹阳:关于商业化定价,我想先分享一个观察:去年我们免费为多家大型企业提供了一年多的咨询服务,接触了不少董事长。他们有一个共同点——不喜欢听概念,而是直接问:“你这套系统能替代多少人工?”


这让我意识到,企业级智能体的定价,应该与其带来的效率提升挂钩。虽然不同行业、不同产品可能有差异,但从实际客户反馈来看,按“节省人力”这个维度来定价,是有现实依据的。


郭梓溢:我们的定价在通用Agent产品中可以说是一种“用户福利”。目前年费在185美元,远低于部分同类产品,但我们依旧能交付用户同等质量的产出,这得益于我们在框架设计、模型使用做的工程化努力让我们有成本控制上的优势,外加Google官方的支持。


我们即将发布一款新的Agent产品,预计在效果、支持类型和Token消耗能力方面,都是目前通用Agent中最领先的。届时,现有的定价策略也会做相应调整,也会根据任务完成难度进行差异化定价。


杨宇梁(主持):目前很多互联网的巨头,包括一些大厂在打造自己的AI生态,各位企业是更倾向于独立构建的Agent闭环,还是接入一个生态平台,生态合作中的一个核心的博弈点是什么?


张奥迪:这两者并不冲突。我们目前也在同步推进。作为营销领域较早布局的一方,我们在整个营销生态中打造了完整的MCP服务体系,涵盖SDK变现、程序化广告、智能投放工具、智能分析以及LTV预估等ROI模型能力。


同时,我们也接入了更大的外部生态,无论是多云厂商还是其他平台,我们都采用混合云架构,合作的云厂商超过十家,并有自研的混合云方案。在与大厂的合作中,我们借助他们的生态资源,同时也为他们提供垂直行业的解决方案,形成优势互补。


初期双方是相互依赖的关系,大厂需要垂直领域的专业能力,我们需要流量和资源;但随着合作深入,最终会走向共赢的发展模式。因此,内部生态与外部协同之间并不存在冲突。


孔淼:当前云厂商和大模型厂商处于上游生态的位置,但从我们的合作角度来看有所不同。


我们主要对大模型进行微调和本地化部署,对于像上游DeepSeek这类支持开源,或者是千问这种提供良好开发者服务的Model Service可微调的模型,我们都能够较好地适配。


同时,一些大模型厂商虽然具备技术能力,但缺乏具体的业务落地方案,因此我们会作为其下游合作伙伴,将我们的产品与他们的模型结合,共同打造面向行业的解决方案。这是我们对生态的开放态度和落地方式。


而在Agent的工具调用方面,目前企业级生态尚处于早期阶段,还未完全成熟。未来我们也将会积极融入这一生态,推动工具调用能力的发展与协同。


杨宇梁(主持):在商业化的进程当中,设置个爆点时刻,各位认为是一个什么样的事件,在未来5年,AI Agent最先颠覆的是哪一个行业?


李聪:现在很多行业已经被AI所改变。比如日常生活中,给孩子检查作业这件事,过去需要一页页查看,非常繁琐;现在只要用AI拍两张照片上传,就能快速完成。

再比如医疗场景,以前做B超需要医生逐项判断,而现在医生更像是AI的审核员,只需确认AI分析结果是否有误。


在这些具体的小场景中,我认为大多数行业被AI渗透只是时间问题。未来一个重要的爆发点,将是AI实现跨平台数据共享和知识迁移的能力。


比如我让豆包帮我挑选商品时,它能调取我在淘宝、京东的购买记录,结合我的使用习惯和品牌偏好进行推荐和决策。只有到了这个阶段,通用智能体才真正具备广泛的应用价值和商业潜力,迎来使用率和商业化能力的双重爆发。


邹阳:真正的爆点一定来自C端产品,B端再“爆”也很难被普通人感知。比如某个行业被智能体全面替代,虽然市场空间可能只有一两百亿,但这件事做完后,大众其实根本感觉不到。


要形成真正广泛的影响力和商业价值,还是得靠C端产品。只有找到PMF(产品市场匹配),实现用户自发使用并持续带来收入,才算真正“爆”起来。


郭梓溢:今年毫无疑问是AI Agent的元年。我们公司作为C端Agent领域的头部企业之一,也一直在积极探索。正如我之前提到,在5月中旬,即将推出新一代的Agent。


这款Agent解决了当前通用Agent存在的诸多问题,和实际应用中遇到的痛点。作为产品的市场负责人,我肯定衷心希望它能在市场上“爆”起来。


目前我们的收入表现不错,已经初步找到了PMF(产品市场匹配)。但对我而言,关键在于不仅要打造一个成功的产品,更要推动整个Agent领域的发展和普及。


如果AI Agent要实现跨圈层的影响,它的普及程度还有待提高。只有当它像智能手机这样的工具一样被广泛使用时,才能真正为用户持续创造价值。


换句话说,我们要让用户通过使用Agent,赚到比单纯使用AI模型更多的收益。而这,必须依赖垂直领域的深入探索。


因此,我们未来会重点布局垂类场景,也会与更多企业展开合作,共同推动Agent在实际业务中的落地。




(文:甲子光年)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往