OpenThinker-32B归档

Deepseek R1及Deep research复现回顾及近期前沿进展速递

下午7时 2025/02/16 作者老刘说NLP

2025年02月16日，北京晴天。社区第39讲《DeepseekR1及Deepresearch复现》顺利结束，老刘报告了4小时深度讨论内容。介绍了大模型推理和复现进展，包括DeepSeek-MoE-ResourceMap、OpenR1-Math-Raw等资源库，并展示了OpenThinker-32B在MATH500测试中的表现。研究发现，长链推理的结构比内容更重要。老刘呼吁社区成员参与讨论。

直逼DeepSeek-R1-32B，碾压李飞飞s1！UC伯克利等开源全新SOTA推理模型

下午11时 2025/02/13 作者新智元

OpenThinker-32B 是由斯坦福、UC伯克利等机构联合发布的 SOTA 级推理模型，仅需 1/8 数据就与 DeepSeek-R1 达成同等性能。项目使用精心选择的验证数据集，并通过数据规模化、推理过程验证和模型规模扩展的方法实现。

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31