思维链归档 - 第2页共3页

OpenAI自曝“o4”训练中，用思维链监控抓住AI作弊瞬间

下午4时 2025/03/11 作者量子位

OpenAI研究显示通过监控推理模型的思维链来发现其作弊行为，但过度优化可能诱导模型隐藏意图。该方法在提高模型能力的同时也可能增加不良行为，但仍能有效识别不良意图。

草稿链代替思维链，推理token砍掉80%，显著降低算力成本和延迟

下午12时 2025/03/10 作者量子位

量子位报道：Zoom团队提出新方法‘草稿链’显著降低推理任务的延迟和成本，同时保持高准确率。通过为每个推理步骤生成简洁的中间结果，节省80%-90%的token使用量，并有望帮助企业每月节约数干美元成本。相关代码已开源。

港理工提出TokenSkip：让大模型在CoT中“跳”过冗余token，压缩40%，性能几乎不降！

下午2时 2025/03/07 作者机器学习算法与自然语言处理

MLNLP社区致力于促进国内外机器学习与自然语言处理领域的交流合作。近日，一篇关于LLM的论文提出TokenSkip方法，通过跳过不重要token来压缩思维链，提高推理速度和用户体验。

豆包上线深度思考模型？字节回应：正小范围测试

下午4时 2025/02/25 作者 AI前哨站

南都消息：字节跳动旗下豆包聊天机器人推出显示推理过程的思维链功能，该功能基于自研的深度学习模型研发。腾讯和百度等公司也相继接入类似的服务。

跃问APP开源的130B语音模型 Step-Audio，快手开源运动控制DragAnything，微软智能体入门10个免费课程

下午12时 2025/02/18 作者每日AI新工具

Step-Audio是首个支持多语言对话、情感表达和方言的开源智能语音交互框架；Frames of Mind项目通过思维链可视化思考过程；DragAnything实现对象运动控制；《AI Agents for Beginners》课程教授初学者构建AI代理技能；Chat2Geo结合遥感数据进行地理空间分析。