llm-speedrunner:自动化LLM Speedrunning挑战基准 2025年7月2日8时 作者 NLP工程化 自动化LLM Speedrunning挑战基准,评估前沿LLM Agent复现科学发现和创新的能力,涵盖多种提示格式、实验设置和扩展框架。