特定认知归档 - 每时AI

为什么Qwen能自我改进推理，Llama却不行？斯坦福找到了原理

下午4时 2025/03/05 作者机器之心

我们也能让 Llama 学会自我改进。
给到额外的计算资源和「思考」时间，为什么有的模型能好好利用，