韩家炜归档 - 每时AI

UIUC联手谷歌发布Search-R1：大模型学会「边想边查」，推理、搜索无缝切换

下午4时 2025/04/21 作者机器之心

本文介绍了一种新的强化学习框架Search-R1，用于训练大语言模型以更有效地利用搜索引擎。通过引入可交互的搜索引擎模块，模型能够在生成答案时随时发起搜索请求，从而提升推理质量。