LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升 2025年2月10日12时 作者 新智元 规模格式调优和大规模自我优化,开发出了Satori,一个在数学推理和跨领域任务中均表现优异的7B参数