阿里发布信息检索Agent,可自主上网查资料,GAIA基准超越GPT-4o 模型&数据开源

阿里发布WebDancer,作为端到端自主信息搜索智能体。它能实现复杂任务如网页遍历、信息搜索和问答,并已开源训练框架。通过四阶段训练范式提升推理、工具使用及泛化能力,已在GAIA和WebWalkerQA上取得显著成绩。

突破多智能体系统边界,开源方案OWL超越OpenAI Deep Research,获17k star

港大、camel-ai 等机构提出Workforce多智能体框架及OWL训练方法,在GAIA基准测试上取得69.70%准确率,超越多家商业系统和开源方案。该研究将系统分解为规划器、协调器和工作节点三个核心组件,通过解耦设计实现跨领域迁移,并采用两阶段优化训练策略提升规划器能力。

OWL:0天复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

最近AI圈最炸的瓜,无疑是Manus。一个能远程开Ubuntu容器、自动挂载数据、做规划并执行任务的AI Agent。CAMEL-AI团队看到后表示就这?他们0天复刻了OWL项目,并且在开源性能上达到了57.7%,超越Huggingface的Open Deep Research 55.15%表现。Manus内测邀请码被炒到几万块,而OWL则直接免费开源。OWL不仅能在GitHub一键clone,还提供自由外挂、远程操作等工具链和执行环境。通过逆向工程,OWL已将Manus的技术路线拆解成6步工作流,并计划开源其工具包和记忆模块。未来还将引入跨平台操作技术,实现CRAB+OWL的全能版开发。