数据规模化归档

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

下午11时 2025/02/13 作者新智元

OpenThinker-32B 是由斯坦福、UC伯克利等机构联合发布的 SOTA 级推理模型，仅需 1/8 数据就与 DeepSeek-R1 达成同等性能。项目使用精心选择的验证数据集，并通过数据规模化、推理过程验证和模型规模扩展的方法实现。