Deepresearch核心技术:如何通过强化学习增强推理大模型搜索规划及反馈能力? 下午2时 2025/04/05 作者 老刘说NLP 复现和应用越来越多,也对大模型的规划能力有了越来越多的要求。 假设大模型能力很强,我们可以使用 Co