自我增强归档 - 每时AI

红杉中国推出 Agent 基准测试「xbench」，双轨评估体系，关注 AI 真实场景的效用

下午11时 2025/05/26 作者 Founder Park

《xbench: Tracking Agents Productivity，Scaling with

Kimi官方复盘：k1.5复现o1的思考过程

下午11时 2025/01/22 作者 Founder Park

在
Kimi 的多模态思考模型 k1.5 发布后
，Kimi 的技术人员在知乎上分享了他们复现 o1