红杉中国发布 xbench,首个由投资机构打造的 AI 基准测试 下午11时 2025/05/26 作者 特工宇宙 ark) 却面临一个日益尖锐的问题:想要真实地反映 AI 的客观能力正变得越来越困难。 因此,构建更