红杉中国推出 Agent 基准测试「xbench」,双轨评估体系,关注 AI 真实场景的效用 下午11时 2025/05/26 作者 Founder Park 《xbench: Tracking Agents Productivity,Scaling with
Kimi官方复盘:k1.5复现o1的思考过程 下午11时 2025/01/22 作者 Founder Park 在 Kimi 的多模态思考模型 k1.5 发布后 ,Kimi 的技术人员在知乎上分享了他们复现 o1