红杉中国xbench全球首发,AI智能体真实战力揭榜! 下午4时 2025/05/26 作者 新智元 估体系和长青评估机制,追踪模型能力与实际场景价值。 随着基础模型的快速发展和 AI Agent 进入