s1K 归档 - 每时AI

开源22万条DeepSeek R1的高质量数据！你也能复现DeepSeek了

2025年2月11日16时作者机器之心

硅谷的防线之后，在预设中总是落后半拍的中国 AI 军团，这次竟完成了一次反向技术输出，引发了全球范围

2025年2月7日14时作者 AI大模型实验室

文章介绍了通过16块H100 GPU在26分钟内训练出低成本语言模型S1K的方法，该模型与OpenAI的o1系列和DeepSeek R1系列性能相当。但实际研究发现，论文核心是基于开源Qwen2.5-32B模型，进行小数据集监督微调，并非直接复制了DeepSeek R1。

2025年2月5日16时作者机器之心

斯坦福大学和华盛顿大学的研究人员提出了一个新的测试时间扩展方法s1，仅使用1000个样本就实现了与OpenAI o1级别的预览性能。该方法通过预算强制来控制解码时间，并在数学问题上提升了27%的表现。