Claude 悄悄进化:全新“思考”工具解锁,AI 也能像人一样“停下来想想”了

Claude 模型新增 ‘think tool’ 功能,可在生成答案过程中暂停思考并整理信息。Anthropic 官方称其特别适合处理信息过载、规则繁琐及步步为营等复杂场景。通过 JSON 配置简单集成到应用中,并在 T-Bench 和 SWE-Bench 测试中证明了显著提升性能。

OpenAI Deep Research被huggingface 24小时复现开源了,冲~

本文介绍了多个OpenAI Deep Research的复现项目,并重点介绍Hugging Face的open-Deep-Research项目,它在GAIA基准测试中的准确率达到了54%。强调了使用代码表达操作的优势以及未来改进的方向,如扩展文件格式数量、提出更细粒度的文件处理等。