RAG中的表格数据序列化思路及R1类推理大模型训练实证分析 2025年4月14日14时 作者 老刘说NLP 是“是不是, 图灵测试本质上是行为主义的,它只看AI表现出来的对话行为像不像人,并不关心它内部是怎么
为什么GPT-5也怕这个技术?DeepSeek-R1的推理设计和训练原理 2025年4月1日14时 作者 AI技术研习社 ntivizing Reasoning Capability in LLMs via Reinfor
LLM实现自回归搜索!MIT哈佛等提出「行动思维链」COAT,推理能力大提升 2025年2月10日12时 作者 新智元 规模格式调优和大规模自我优化,开发出了Satori,一个在数学推理和跨领域任务中均表现优异的7B参数