





Anthropic还显著减少了Claude 4模型使用快捷方式或漏洞完成任务的行为。与 Sonnet 3.7 相比,这种行为的可能性降低了65%。
Claude Opus 4在内存能力方面的表现也大大优于所有以前的型号。当开发人员构建提供Claude本地文件访问的应用程序时,Opus 4可以熟练地创建和维护“内存文件”来存储关键信息。这可以解锁更好的长期任务意识、连贯性和代理任务的性能——例如 Opus 4 在玩Pokémon时创建“导航指南”。

Claude 4模型还推出了思维链总结功能,可使用较小的模型来浓缩冗长的思维过程。


(文:智东西)