32B IOI奥赛击败DeepSeek-R1!Open R1开源复刻第三弹,下一步R1-Zero 下午4时 2025/03/12 作者 新智元 击败Claude 3.7 Sonnet等一众前沿模型。凭借CodeForces-CoTs数据集的10