跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
GRPO 数据采样
大模型Post-Training总结
下午11时 2025/01/10
作者
极市干货
↑ 点击
蓝字
关注极市平台
作者丨hadiii
来源丨https://zhuanlan.zhihu