通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

阿里通义实验室开源ZeroSearch,无需真实搜索引擎即可训练大模型检索-推理能力。通过模拟搜索引擎和课程式学习策略,仅需3B参数的LLM即可有效提升搜索性能,节省API成本,并兼容多种强化学习算法。