跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
奖励机制设计
DeepSeek-R1 是怎么训练的|深度拆解
下午2时 2025/02/07
作者
赛博禅心
eepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网:
R1