火山引擎AI开发「全家桶」大升级,Agent再也没有门槛。


火山引擎 Force 原动力大会刚结束,有新产品,有新概念,让AI有了新可能,所以快马加鞭赶了一篇热乎的文章,让你们第一时间消除信息差。


最近看到很多AI产品开发者都很迷茫,看完今天这篇文章,你肯定会有收获。


不知道你们有没有发现,海内外比较火的一些AI应用,都可以说是套壳软件。



对于大部分AI软件开发者来说,刚开始就开发底层技术是不高效的,费时费力费钱,可能还没开发完,就淘汰了。


反过来讲,现阶段AI开发者要着重关注已经相对成熟的AI技术、已经开发好的辅助工具。


站在巨人的肩膀上,AI工具的开发就只需要关注用户的需求和使用体验。


吾日三省吾身:做什么;怎么做;怎么卖出去。


开源


字节最近是真的高产,这段时间也经常给大家推荐一些字节系的开源。


这次火山引擎 Force 原动力大会开发者主论坛上我观察到的的三个开源项目还是很有价值的。


DeerFlow


13k stars。


DeerFlow 是一个深度研究框架。它将语言模型与网页搜索、爬虫、Python 执行等工具相结合,实现了从信息收集到报告生成的全流程研究。项目支持多搜索引擎配置、RAG 集成、人机协作编辑及播客 / PPT 生成等功能,采用模块化多智能体架构。



项目链接:https://github.com/bytedance/deer-flow


veRL



24年10月发布的,已经有9.2k stars了,是目前最流行的强化学习框架。


veRL 是《HybridFlow: A Flexible and Efficient RLHF Framework》论文的开源实现。专用于大语言模型后训练,灵活、高效、适合生产。轻松扩展多样 RL 算法,能无缝集成现有 LLM 基础设施,支持灵活的设备映射和并行计算。verl 还支持多种后端,适配不同硬件。



  • 算法灵活性:支持 PPO、GRPO、DAPO 等多种强化学习算法,通过混合控制器编程模型,可轻松扩展复杂算法数据流。

  • 框架兼容性:无缝集成 FSDP、Megatron-LM 等训练框架,以及 vLLM、SGLang 等推理引擎,兼容 Hugging Face 模型。

  • 高效训练能力:采用 3D-HybridEngine 实现高效模型重分片,消除内存冗余,结合 FSDP2 提升吞吐量,支持 671B 级大模型训练。

  • 多模态与工具支持:支持视觉 – 语言模型训练,具备多轮工具调用能力,可集成搜索工具与沙箱环境。

  • 资源优化:支持灵活设备映射、多 GPU LoRA 训练,以及 CPU 卸载等内存优化策略,适配不同集群规模。


项目链接:https://github.com/volcengine/verl


UI-TARS



14.5k stars。


UI-TARS是一个基于视觉语言模型的 GUI Agent应用,可以让你用自然语言控制计算机。它具备自然语言控制、截图与视觉识别、精准鼠标键盘控制等功能,支持 Windows、MacOS、浏览器多平台。


DEMO:识别小票内容并整理到Execl。



项目链接:https://github.com/bytedance/UI-TARS


AI云原生

Agent开发和传统的APP开发都已经发生了变化,代码组织方式已经变成 Agent 具备状态、感知、反应和工具调用的能力。


AI云原生最早是在24年12月份Force大会由火山引擎提出的,并且提出了应用的未来是推理,把CPU中心变为GPU中心,以GPU为核心优化计算、存储、网络架构。


25年2月,AI云原生提出以模型为中心。


这次的Force大会,又提出了豆包大模型 + AI云原生 =智能时代新引擎。


AI云原生是什么


本次火山引擎提出的AI云原生,重新优化和构建了计算、存储、网络、数据、安全等基础设施和技术栈,加上更强的大模型能力和便捷的 Agent 开发平台,提供了端到端全场景的智能生产力,能够高效、低成本、安全地构建、部署和落地生产级 AI Agent。


为什么需要AI云原生


AI 云原生理念的核心就是帮助企业打造Agentic AI,它不只是传统的资源提供者,而且还让Agent的智能价值发挥到最大化,让技术风险降到最小。


归根结底,企业需要的就是降本增效。


简单总结了一下,你就知道为什么AI云原生是必然的,也是大势所趋。


1/模型层面:大模型作为 Agent 的 “大脑”,需具备多模态数据融合、云服务协同及安全机制保障能力。统一的模型管理与部署平台支持模型在不同云环境下的高效调度与优化,确保其在企业级应用中实现客观、深度的决策分析。


2/平台层面:传统开发平台难以实现从需求定义到智能体部署的全链路打通。开发平台通过一站式集成云服务协同能力,解决 MCP 与云服务调度割裂的问题,让 Agent 从试验层面进入实际运行时,提升开发效率与落地速度。


3/数据层面:非结构化数据激增推动大数据从 “数据驱动” 转向 “知识驱动”。


4/云基础设施层面:AI 训练与推理需要密集算力支撑。将云基础设施从 “弹性资源池” 升级为 “密集算力中心”,通过资源池化与智能调度,平衡企业推理效率与成本,满足多模态大模型的算力需求。


5/安全层面:Agent 时代面临大模型幻觉、Prompt 注入等新型安全挑战。安全体系能够构建端到端的信任链,解决 Agent 协作中的安全响应机制脱节问题,防御精准化攻击,保障智能体交互安全。


火山引擎的AI云原生有什么亮点


总的来说,可以让开发者构建 “低门槛、高弹性、强安全” 的 Agentic AI。


这些亮点是我们无法拒绝的。


1/全流程深度协同:工具服务、云服务、字节跳动生态服务全面支持 MCP,实现 “工具调用 — 模型推理 — 部署运营” 深度协同,可复用云服务成熟的部署运维体系,能动态调度算力资源。


2/丰富的实践经验:有丰富的原生 Agent 与 Agent 商用成功经验,可复用解耦模块,帮助企业缩短开发周期,避免 Agent 行为不确定性。


3/强大的模型支持:


  • 豆包大模型具备多模态能力,支持多种交互方式,生成效果佳,LLM 性能突出,延迟低,专业领域表现领先,模型家族覆盖全场景,可满足多种需求。

  • 支持客户使用性能好的三方大模型,如接入 DeepSeek API 服务,具有大流量、低延迟、高稳定性等优势,在 API 响应性能上全面领先。


4/卓越的数据处理能力:


  • 数据平台和模型服务联动,Agent 应用中产生的数据可无缝回流到数据平台。

  • 统一的数据管理,避免数据孤岛,用户可通过数据集、元数据表的方式使用数据。

  • 全链路数据管理,支持多源数据接入,提供数据清洗、标注、版本管理工具。

  • 实时数据驱动决策,提供实时数据看板和分析工具,便于企业监控和调整策略。


5/强大的底层支撑:云基础设施以 GPU 为中心进行了网络、存储、计算的升级,具备高速互联能力,模型加载速度快,整合了全栈推理加速、最佳工程实践、高性价比资源等优势,是平衡算力与成本的保障。


6/安全防护升级:基于字节跳动原生 Agent 安全防护经验,将 “主动安全” 升级为 “智能安全”,能有效降低多种安全风险,可识别高比例隐性攻击,为企业提供安全可信的智能空间。


火山引擎让开发者能够更快地开发、测试和部署AI模型,显著缩短智能应用程序的开发上线时间,应用了新技术的产品上线速度是很重要的。


这也就是我开头说的那样,不要去卷底层技术,要用现成的,不是说必须会训练模型才可以做AI应用,用已有的稳定的新技术,大幅降低成本和风险,还可以快速验证市场。


火山引擎 Agent 开发范式

这次Force 原动力大会上,Agent直接被刷爆,就像是一个零配件工厂一样,采购零部件,拼成一个合格的AI产品。


MCP


前段时间看到很多MCP导航站,我就在想,MCP超市肯定也很快就有了。



果然,火山引擎很快做上了,已经有178个MCP可以调用,上新还是很快的,不止有火山自己的,还有第三方的。


不用再去到处找,以后就用一家的MCP就足够开发AI应用了。


支持用户快速跳转至 火山方舟 或 其他支持 MCP 协议的平台(如 TRAE、Cursor、Python 等)。



PromptPilot



火山方舟推出的PromptPilot是最懂AI开发者的产品。


开发一个体验很棒的AI应用,只有强大的底层模型是不够的,提示词工程肯定也难以避免,之前给大家也分享过,不管是TRAE还是Cursor等等基于AI模型的产品,都有非常完善的提示词。


频繁的去测提示词,真的很繁琐,相信大家都遇到过类似问题,为了得到好的答案测一个问题的提示词都要一整天。


提示词工程本质上是一个搜索问题,所以应该利用好的算法,并非大力出奇迹。



PromptPilot业内首发自动智能优化能力。用机器实现类似人类的反思、类比、错误总结能力,全自动优化Prompt,并支持AI搜索和知识库的调用 。


而且还可以对Prompt进行迭代。


只要用大模型的人,不管是开发者,还是其他行业的从业人员使用,都要写Prompt,所以PromptPilot是一个面向企业、面向个人也面向开发者的平台。



主要功能:


  • Prompt工程(包括Prompt生成、调试、智能优化、版本管理等)


  • AI工程(包括知识加工、问题工程、答案工程、thought工程、metric工程、tools工程等),


  • 联动精调,Solution Out,任务定制的评估服务,


  • 具有probe/反馈等功能的sdk与线上环境形成联动,持续检测/回流线上badcase。


更多新特点:



  • 多轮对话优化:模拟场景调优系统 Prompt;


  • 视觉理解支持:拆解多模态场景(图片 / 视频),生成最优方案;


  • 工具调用精调:同步优化 Prompt 与 Function 描述,解决功能唤醒歧义;


  • SDK 灵活集成:支持线上环境联动调用。


豆包大模型1.6



这次Force大会火山引擎发布的豆包1.6模型,包含3个版本。


  • Doubao-Seed-1.6-thinking,是豆包目前最强的深度思考模型

  • Doubao-Seed-1.6,这个比较有趣,是豆包系列模型的一个新亮点,有thinking/no-thinking/自适应思考三种模式,像是发动机多个档位一样,只不过发动机用好了可以省油,模型的模式用好了可以省算力,归根结底都是省钱。

  • Doubao-Seed-1.6-flash,超低延迟,超强的视觉理解能力,价格也相对会低一些。


总的来说,豆包1.6跟1.5版本相比,推理能力、多模态理解、GUI操作能力、编程能力有了大幅的提升。


随着Agent对AI模型要求越来越高,豆包这次1.6版本的能力升级为 Agent 处理复杂任务提供了智能核心基础。



全系的豆包1.6模型都支持多模态思考,处理速度很快,像是大量图片材料的识别处理已经不需要人工去做了。


GUI能力可能是大家比较感兴趣的一点,之前有给大家推荐过一些专门训练用于识别UI界面再去跟浏览器交互的开源,那么豆包1.6发布后就不需要那么麻烦了,可以直接用它去完成拟人化的浏览器操作。



这就会有巨多的开发场景,比如做一个帮用户对比各电商平台价格的APP。



豆包1.6的编程终于有了我想要的功能,支持在线预览了,做一个简单的原型图、报价DEMO就会很舒服,轻轻松松完成。


TRAE



TRAE今年1月上线至今就有了100w月活用户,已经成为国内最受欢迎的AI产品之一。


据说字节内部已经有80%工程师使AI Coding,还没有用好AI编程工具的开发者要尽快用起来了。



上面这个DEMO,就是字节内部一个技术小白通过TRAE做出来的。


TRAE 围绕AI能力,通过自然语言生成代码,完成整个开发流程,极大降低编程门槛,让人人都是开发者成为可能。



本次会上 TRAE 透露在未来,将通过模型+agent+工具调用,以 AI 为中心打造全新的 AI 协作型开发空间。


扣子



礼貌问一句,前段时间扣子空间服务器都被大家挤爆了,你们最后进去了吗?


扣子感觉就是为了Agent而生,从开发、调试、评估、到监控一系列开发工作都包含在内。


我主要是看好扣子的上手难度低,让不会写代码的人也能在认真学习后用起来。


扣子空间,可以让公司的每一个人都有一个助理,搜索、统计、整理、制作报表,都不需要耗费大量精力,让每一个员工的精力都用在思考上面,让企业的运营更高效。





来看个我认为很有趣的,也是很有用的。


扣子罗盘,一站式的 AI Agent 开发与运维平台,TRAE和扣子空间都是基于扣子罗盘构建和调优。



扣子罗盘的定位是服务于任何搭建形式的 Agent 调优,侧重在 Agent 评测、观测、效果调优、数据飞轮等能力建设,帮助低代码开发者和全代码开发者持续迭代运行 Agent。


这也就意味着Agent托管,开发者不需要频繁的去主动监测迭代Agent,都让扣子罗盘去干就好。


已经有非常多的企业用扣子完成产品落地,在这也给大家分享几个落地案例。


倾听者是一家深耕英语学习领域的科技公司,用扣子搭建了一款智能听力机,
为了实现 KET 口语考试模拟、丰富场景练习、趣味对话角色等功能,基于扣子平台的豆包和 DeepSeek 大模型,打造了能够实时互动、精准模拟考试情境的 AI 口语模拟考试系统、场景互动系统、并新增哪吒和敖丙等趣味角色。



新榜团队基于扣子搭建小红书账号分析智能体,结合新榜数据和 AI 大模型能力快速获取多维度拆解报告,其中包括小红书账号定位分析、受众分析、内容分析、数据表现等分析数据,还提供相似账号列表以供参考,帮助运营人员快速分析该小红书账号的运营现状和未来潜力。


账号分析入口



账号分析页面



扣子,让企业级应用的搭建更智能,更便捷,做更多之前不敢想的功能。


总结

此次火山引擎 Force 原动力大会开发者专场展示的开源项目、火山方舟、TRAE、扣子等产品,让开发者无需从底层技术开始开发,可直接站在巨人的肩膀上,开发者就能专注于用户需求和使用体验,降低开发成本和风险。


从根本上提高开发效率,降低成本,这应该是所有开发者都会考虑的事情。



像扣子这样的工具,上手难度低,让不会写代码的人经过学习也能参与到 Agent 开发中;TRAE 等 AI 编程软件提高了编程效率,降低了编程门槛,全流程 AI 开发能帮助开发者更轻松地完成软件开发过程中的各项任务。


火山方舟肯定是调研了非常多的开发者,才做出这么多有用、好用的产品,真的去帮开发者解决了AI产品开发过程中的难点。


这里划重点,从之前的云原生,到现在的AI云原生,开发者要注意提前做好软件的架构布局,把新技术快速用起来。


“技术产品化 + 能力服务化 + 场景行业化”,这才是现阶段AI开发应该遵循的原则。


想开发者之所想,替开发者做好一些准备工作,给火山引擎点个赞。

(文:开源AI项目落地)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往