阿里深夜开源王炸Agent!硬刚OpenAI,性能全面SOTA!
过去半年,开源Agent在解决复杂问题上屡屡受挫,而阿里通义发布的WebSailor模型通过构造L3级别合成数据和DUPO精调算法大幅提升训练效果,为开源Agent挑战闭源系统提供了新思路。
过去半年,开源Agent在解决复杂问题上屡屡受挫,而阿里通义发布的WebSailor模型通过构造L3级别合成数据和DUPO精调算法大幅提升训练效果,为开源Agent挑战闭源系统提供了新思路。
阿里通义团队提出的新范式PARSCALE通过扩展CFG的双路径到P条并行路径,显著提升了1.6B模型的性能,仅占用后者的1/22内存,并将延迟增加量减少至1/6。该方法无需从头训练现有模型(如Qwen-2.5),并在GSM8K数学推理任务中实现了34%的性能提升。