一个省略号提示+强化学习搞定大模型“过度思考”,中科院自动化所新方法:从强制推理到自主选择 下午4时 2025/05/28 作者 量子位 代, 如何让模型在“难”的问题上展开推理,而不是无差别地“想个不停” ,成为当前智能推理研究的重要课