全球首次!2B复现DeepSeek-R1「啊哈时刻」,UCLA等用纯RL实现多模态推理

亿参数非SFT模型上,成功实现了多模态推理的DeepSeek-R1「啊哈时刻」!
就在刚刚,我们在未

很快OpenAI能证明陶哲轩错了?陶哲轩一句话,被OpenAI高管怼回去

新智元报道
编辑:桃子 LRS
【新智元导读】
o1推理代表着推理的未来。菲尔兹奖得主陶哲轩在Ope