Agent Leaderboard:为AI Agent任务打造的LLM排行榜 2025年3月3日8时 作者 NLP工程化 Agent Leaderboard:评估12种私有模型和5种开源模型在复杂场景下的工具使用能力,采用TSQ量化工具选择质量,覆盖21个领域和390个API交互场景。