MLGym:推进人工智能研究Agent的新框架和基准 上午8时 2025/02/26 作者 NLP工程化 本文提出MLGym框架和基准,评估前沿LLM在AI研究任务上的表现,并强调构建和完善评估体系的重要性。