西风 发自 凹非寺
量子位 | 公众号 QbitAI
2025年已成为名副其实的Agent元年。
不论是Operator、Manus、Genspark等爆款Agent的相继出现,还是各大厂商陆续发布MCP协议支持,种种迹象都在印证着AI Agent正经历从“玩具”到“工具”的关键转折。
不过现实也有骨感的一面,仍有大把Agent项目卡在POC阶段,开发周期长、商业价值验证难成为两大拦路虎。
就在6月25日的阿里云飞天发布时刻中,阿里云百炼带来3.0全新升级,为开发者提供从技术落地到商业变现的全链路解法,满足企业和开发者大模型应用和大模型Agent开发的“一切所需”。
而这次发布最让人眼前一亮的——当属阿里云百炼联合支付宝推出的业内首个“Agent打赏”功能。
凡是基于阿里云百炼创建的Agent,用户只要觉得好用,动动手指就能给它打赏。
Agent,从此可以直接为开发者赚钱了!
敲重点:
打赏接口还能集成到企业开发者自己的生态或渠道中,无论是网页、社交软件还是其它平台,都能加上打赏功能。

除了打赏功能,阿里云百炼此次还有另一个重磅发布。
早在两个月前的阿里云AI势能大会上,阿里云百炼就透露了要做Agent Store的计划。
现在,这个Agent Store正式上线了,提供了覆盖各行各业的上百个Agent模板。

开发者不仅可以在线体验,还能一键复制Agent配置,基于成熟模板快速启动二次开发项目,无需“从零开始”。

这些其实只是阿里云百炼应用开发平台全面升级的冰山一角,本次还升级了企业级RAG、MCP等能力,全新发布多模态交互开发套件,每一项都直击开发者和企业的实际需求。
咱们拆开细看——
阿里云百炼全新升级:Agent属性拉满
在最新版本的发布中,阿里云百炼应用开发平台的架构全面升级。
为满足企业和开发者开发大模型应用和大模型Agent的一切所需,阿里云百炼提供了从底层模型供给到应用数据、应用组件、应用开发、 应用广场、应用发布的全套能力。

其中Agent应用开发引擎全面升级,阿里云百炼为企业和开发者提供了“开发-测试-发布-观测”全链路的开发工具。
企业和开发者既可以在平台上构建基本的Agent能力,也可以在线实现可视化调试测试,还可以在不同版本之间管理Agent。
用户调用Agent后,平台还会广泛收集用户访问日志,通过加密方式把日志反馈给企业,继而可基于日志和Trace结果进一步优化Agent的调用效果。

而全新Agent Store,含有100+个可在线体验、调用、一键复制的Agent模板,覆盖了各行各业的应用场景。
关键在于,它们不是空壳子,而是连接了实实在在的知识、数据、模型、MCP和插件。

开发者可以通过这些模板更深入地了解不同能力和Agent的结合所能达到的效果,也能基于模板进行灵活的二次开发。
在进行Agent复制时,平台会自动帮助开发者校验Agent的可用性以及它所依赖的各项资源的可用程度,一键开通Agent所依赖的不同资源,实现快速复制。

Agent开发完成后,最难的变现问题,阿里云百炼这次为开发者们提供了一个新解法。
此前常规Agent变现依赖按量付费等模式,变现周期长、转化率低。
阿里云百炼联合支付宝推出了创新的“Agent打赏”功能。
开发者在阿里云百炼上完成Agent开发后,可开启打赏,其他人可以自由为开发者的Agent和创意打call,成果验证变得简单粗暴。
具体怎么玩?
在阿里云百炼平台上仅需两步即可为Agent配置打赏功能。第一步,一键开启「支付宝AI收」功能。

第二步,选择对应Agent完成「赞赏卡片」配置并发布。开发者在创建Agent时,都可以选择开启赞赏功能,还能设置“感谢提示语”等。

打赏金额直达AI钱包,可以累积也可以直接提现。

据介绍,众多企业与开发者依托阿里云百炼整套Agent开发体系,已成功落地数据分析、企业数据问答、客户反馈分析、内部员工助手等多元业务场景。
多行业客户也基于阿里云百炼Agent开发平台,构建了一系列生产级应用,比如与浙一联合打造的麻醉评估助手、联合牧原股份打造的智能兽医问诊系统等等。
此外,在本次发布中,阿里云百炼还带来了更多企业级能力的发布 ——
企业级开发双buff:多模态RAG+MCP升级
一是全面升级RAG能力。
企业开发者最常遇到的问题之一:如何处理复杂的企业数据?
传统RAG在处理企业级复杂文档时经常翻车,PPT的阅读顺序搞不清、复杂表格看不懂、饼图柱状图更是难应对。
这次百炼推出了企业级多模态RAG,直接把RAG能力提升到了千万级文档处理水平,支持实时同步,支持不同模态复杂信息的数据结构。
企业可通过公网数据库、私网数据库、VPC领域数据库直接对接此RAG系统,同时支持将文档、图片、数据库表、视频、语音等多模态文件统一通过RAG技术构建索引。
由此,真正实现企业数据的智能化利用。

值得关注的是,阿里云百炼还开源了V-RAG(视觉RAG)体系,对于有技术实力的企业开发团队,这套开源方案提供了更多定制空间。
此方案完全采用视觉模型直接识别Page内容,把每个Page当做一个切片,避免了传统Chunk切分导致的信息丢失。
对于产品操作手册、长篇论文这类Page结构完整的文档,V-RAG的效果提升立竿见影。
目前这套方案已经在GitHub开源,感兴趣的开发者可以去薅一把。

第二项升级,阿里云百炼全面升级了企业级MCP能力。
企业用MCP服务,最头疼问题之一的就是各种Key的管理,数据库密码明文暴露风险大,不同服务还要管理不同的Key。
这次百炼全面支持了KMS加密,免费提供50个加密Key,密钥托管存储,解决MCP明文账密暴露风险。
结合云市场良好的商业化基础设施,阿里云百炼也实现了MCP服务的统一鉴权和计量计费,一个Key搞定所有服务,再也不用为管理多个Key抓狂了。
所有的MCP服务都支持在Agent和Workflow中实现一键调用,工具链和MCP服务互联互通,可以很好地降低用户的使用成本。
同时,阿里云OpenAPI MCP Server正式发布,支持大模型与2W+OpenAPI互联互通,用户可通过灵活组合API打造运维Agent新体验。

自4月9日阿里云百炼上线业界首个全生命周期MCP服务至今,已有超50个企业级MCP实现上架,超22000个用户开通了相关MCP服务,构建了超3万个MCP Agent。
很多企业已经基于阿里云百炼,开发出在实际应用场景中有价值的应用和Agent。
例如AI青少年学习机听力熊,基于阿里云搭建交互Agent方案,自主扩展了超50种交互技能,实现了自主交互、多模态交互、动态交互的AI Agent内置,支持包括智能讲解、AI写作、智能口语陪练、AI识物、智能陪伴数字熊等多种AI场景,为青少年学习场景带来智能化升级。

以上针对Agent开发、RAG能力、MCP服务的种种升级,已经能够满足大部分企业和开发者的核心需求。对于那些希望将AI能力延伸到硬件设备、或者想要打造沉浸式交互体验的企业和开发者来说,阿里云百炼本次带来了另一个重磅发布——
多模态融合,端云协同:重新定义交互的“大脑”
消费级AI硬件的市场规模逐年迅速增长,特别是在智能可穿戴、智能家居、儿童玩具等领域增长非常迅速,消费者对智能化产品的需求不断增加,而企业也需要快速接入成熟的贴合自身应用场景的多模态交互能力。
阿里云百炼推出的多模态交互开发套件,为企业客户和开发者提供开发成本极低的多模态交互能力,可以为终端用户提供新一代的智能体验。
这套开发套件的核心能力包括:
-
多模态融合理解:基于通义千问模型家族Qwen3、Qwen-Omni、Qwen-VL等视觉、语音、文本模态融合理解,不仅听得见,更能看得懂; -
低延迟全双工对话:支持语义拒识和判停,视频对话延迟最低1.5秒(传统方案3秒以上); -
全场景适配:Agent、技能、模型、提示词、知识库等全链路自由配置,提供覆盖常见品类的开发模板,开箱即用,场景能力自由组合; -
复杂任务自主规划推理,复杂任务执行等。
无论是情感陪伴类的玩具、手办,智能穿戴类的手表、眼镜、耳机,还是桌面机器人、手机、APP,都可以快速接入这一整套多模态能力,万物皆可AI。

阿里云百炼多模态交互控制台还方便开发者进行应用配置,可以像拼乐高一样,实现功能自由组合。
操作起来也十分简单:
-
第一步先选择对应模板,比如要做儿童玩具,阿里云百炼会自动提供这个场景下的最佳方案组合; -
第二步配置语音对话能力,可以选择不同的识别/合成模型,还能配置不同的打断方式等; -
接下来配置理解与生成能力,阿里云百炼提供专属的定制语言模型,另外平台所有官方模型也都可以接入,可以自定义提示词、添加不同的变量、挂载不同的知识库; -
然后一键配置各类技能工具,包括Agent、插件、MCP、设备控制指令等。只要在界面完成勾选和保存,对话中就能够自由调用这些Agent的能力,意图中控将自动进行分发,不需要额外的开发和配置; -
配置好后可以在线预览效果; -
最后发布获取应用ID。

整个配置过程可视化,开箱即用,大大减少了开发成本。
计费方式也很灵活,用多少付多少的后付费模式,或者买断License,怎么划算怎么来。
总的来看,阿里云百炼这次的升级,从应用开发平台到多模态交互套件,直指AI落地最后三公里。而Agent打赏功能的引入,为开发者开辟了全新的价值实现路径。
当AI不仅能解决问题,还能为创作者带来收益时,这场Agent革命才真正有了可持续的生态基础。
阿里云百炼的这次探索,为整个行业提供了一个可参考的商业化样本。
一键三连「点赞」「转发」「小心心」
欢迎在评论区留下你的想法!
— 完 —
🌟 点亮星标 🌟
(文:量子位)