比DeepSeek、o1高3倍!首创无服务器强化微调,只需十几个数据点, 上午11时 2025/03/20 作者 AIGC开放社区 专注AIGC领域的专业社区报道了Predibase发布的首个端到端强化学习微调(RFT)平台,该平台使用奖励函数和自定义函数加速大模型训练,并展示了其在代码翻译任务上的成功案例。