实际研发归档

RAG和Agent的几张趣图思考及RLI基于自我置信度RL强化学习思路

2025年5月28日19时作者老刘说NLP

2025年5月28日，北京晴。文章探讨了从几张图看RAG及Agent的问题和基于自我置信度作为强化学习监督信号的工作，强调实际业务数据的重要性，并指出不要过度依赖Agent智能体解决问题。