谁是最强AI研究助手?Meta等提出全新基准MLGym:LLM智能体大排名 下午11时 2025/03/07 作者 新智元 于评估和开发LLM智能体的Gym环境。MLGym提供了标准化的基准测试,让LLM智能体在多任务挑战中