直逼DeepSeek-R1-32B,碾压李飞飞s1!UC伯克利等开源全新SOTA推理模型
OpenThinker-32B 是由斯坦福、UC伯克利等机构联合发布的 SOTA 级推理模型,仅需 1/8 数据就与 DeepSeek-R1 达成同等性能。项目使用精心选择的验证数据集,并通过数据规模化、推理过程验证和模型规模扩展的方法实现。
OpenThinker-32B 是由斯坦福、UC伯克利等机构联合发布的 SOTA 级推理模型,仅需 1/8 数据就与 DeepSeek-R1 达成同等性能。项目使用精心选择的验证数据集,并通过数据规模化、推理过程验证和模型规模扩展的方法实现。