LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升 下午12时 2025/02/10 作者 新智元 规模格式调优和大规模自我优化,开发出了Satori,一个在数学推理和跨领域任务中均表现优异的7B参数