优质数据归档

s1推理模型=数据筛选+推理预算强制，也提醒大家不要进入思维误区

MLNLP社区介绍其愿景是促进国内外自然语言处理及相关领域的交流合作。近日，李飞飞团队的《s1: Simple test-time scaling》引起广泛关注。s1主要通过数据筛选与推理预算强制提升模型性能。核心贡献包括开源训练数据及改进效果验证方法。