跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
训练集质量
用极小模型复现R1思维链失败后的感悟
下午2时 2025/03/11
作者
Datawhale
com/p/27699656438
前言
投完 ICML 之后火急火燎的入门 RL,花了一些时间把
下载我们的APP,AI秒送达!
立即下载
×