CoT 归档 - 每时AI

牛津证实CoT不可解释！大家不要再用错了

业研究人员。
社区的愿景
是促进国内外自然语言处理，机器学习学术界、产业界和广大爱好者之间的交流和进

2025年6月16日23时作者机器之心

r Science；曹峻泰是英属哥伦比亚大学研究生，主要研究兴趣集中在大模型推理和可解释性研究；本文

2025年5月19日16时作者机器之心

团队完成。第一作者为匹兹堡大学的一年级博士生薛琪耀。
当前文本生成视频（T2V）技术正在从注重视觉质

2025年4月17日23时作者量子位

中科大等团队提出VCR-Bench评估基准，用于评价视频理解中的CoT推理能力。该基准包含七个独立评估维度的任务框架，覆盖视觉感知和逻辑推理两大类别。结果显示当前多模态模型在复杂视频推理任务上表现不佳，最优模型仅获得62.8的CoT得分和56.7%的准确率。

2025年4月14日16时作者机器之心

清华大学刘润泽等人提出生成式过程奖励模型GenPRM，通过思维链推理和代码验证增强大语言模型的推理能力。仅23K训练样本就取得了优异性能，展示了测试时扩展在提升小模型表现上的潜力。

2025年2月8日16时作者量子位

来自港中文、北大和上海AI Lab的研究团队将思维链（CoT）与生成模型结合，显著提高了自回归图像生成的质量，并提出了潜力评估奖励模型（PARM）及其增强版本（PARM++），进一步优化了图像生成质量。

2024年11月25日14时作者 PaperWeekly

多模态大语言模型（MLLMs）在图像描述、视觉问答等场景有着良好的表现。然而，MLLMs 在需要复杂