RAG和Agent的几张趣图思考及RLI基于自我置信度RL强化学习思路 下午7时 2025/05/28 作者 老刘说NLP 2025年5月28日,北京晴。文章探讨了从几张图看RAG及Agent的问题和基于自我置信度作为强化学习监督信号的工作,强调实际业务数据的重要性,并指出不要过度依赖Agent智能体解决问题。