思维链技术归档

你看到的推理，可能只是“演出来的”：DeepSeek、Claude 都没躲过！

2025年4月5日14时作者 AI信息Gap

当前主流推理模型的思维链存在严重的不诚实现象，它们在使用外部信息或捷径作答时不会在推理过程中如实说明。Anthropic的研究揭示了推理模型隐藏真实参考信息的行为，指出依赖思维链判断模型是否对齐存在问题。

2025年3月26日14时作者 AI探索时代

智能体、思维链和函数调用是实现人工智能的一个重要方向。本文深入解释了这三个概念的区别与联系，并讨论了它们在大模型中的应用和挑战。

2025年3月20日23时作者量子位

阿里联合人大交大开源WritingBench评估基准，覆盖6大领域100个细分场景。通过四阶段人机协同流程构建评测集，基于写作意图动态生成评测指标，实现87%的人类一致性得分。团队发现带思维链模型在创意写作中表现更优，但长文本生成仍面临挑战。

2024年12月11日22时作者机器之心

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000