Pass@1准确率归档

RL缩放王炸！DeepSWE开源AI Agent登顶榜首，训练方法、权重大公开

2025年7月3日8时作者 AIGC开放社区

AIGC领域专业社区关注微软、百度等LLM发展。著名大模型训练平台Together.ai联合Agentica开源创新AI Agent框架DeepSWE，实现42.2%准确率。

2025年2月12日8时作者 NLP工程化

UC伯克利团队通过RL微调改进Deepseek-R1-Distilled-Qwen-1.5B，使其在AIME基准上Pass@1准确率高达43.1%，参数量仅为1.5B且超越OpenAI o1-preview。