WebAgent 是阿里通义实验室开发的开放多智能体信息检索框架,整合 WebWalker、WebDancer、WebSailor 三个子项目,突破了传统 LLM 在复杂网页推理、开放域自主搜索等任务上的能力边界,实现了“超人类”水平的长程、多步骤推理与自主信息寻求。
-
三大子项目定位明确:WebWalker 提供网页遍历基准与多智能体框架;WebDancer 主打自主搜索推理和类 DeepResearch 能力;WebSailor 聚焦极难任务下的超人类推理和信息检索。 -
SOTA 性能:WebSailor-72B 在多个开放基准上超越现有开源系统并逼近封闭商业系统,如 BrowseComp-en(12.0%)、BrowseComp-zh(30.1%)、GAIA(55.4%)。 -
渐进训练方法论:WebDancer 采用四阶段训练(数据构造、轨迹采样、监督微调、强化学习),强化自主推理与搜索技能,并引入 DAPO 流程实现可扩展的 SFT 和 RL 训练。 -
创新训练技术:WebSailor 使用基于图采样与信息混淆的数据合成构建 SailorFog-QA 基准,并通过专家轨迹重建 + 两阶段训练(RFT+DUPO)来高效训练 agent。 -
复杂任务适配:系统擅长于高不确定性、需要大量推理和信息整合的长程任务,如复杂问题解答、网页跨域推理、多步骤规划等。 -
丰富演示与易上手:项目附带了演示视频和快速启动指南(基于 HuggingFace、Gradio、sglang 部署),支持英文和中文任务。 -
数据与框架开放:WebWalker 作为 ACL 2025 接收的工作开放了基准和框架,WebDancer 和 WebSailor 分别在 arXiv 上发布预印本,相关数据、代码和模型逐步开源中。 -
许可证与引用:项目采用 MIT 开源协议,论文引用格式已给出,方便学术引用和二次开发。
这个项目不仅是一套工具链,更是一种完整的、多层次的解决方案,用于探索和验证“自主搜索 + 超长推理”在真实网页环境中的可行性。


参考文献:
[1] https://github.com/Alibaba-NLP/WebAgent/
[2] https://arxiv.org/pdf/2507.02592
[3] https://arxiv.org/pdf/2505.22648
知识星球:Dify源码剖析及答疑,Dify扩展系统源码,AI书籍课程|AI报告论文,公众号付费资料。加微信buxingtianxia21
进NLP工程化资料群,以及Dify交流群。
(文:NLP工程化)