跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
Reinforcement Learning Teacher
7B小模型也能教出强推理AI
2025年6月26日8时
作者
NLP工程化
Sakana AI提出的新方法RLT让7B模型训练出的学生超过671B模型,且成本仅为传统方法的1/3。
下载我们的APP,AI秒送达!
立即下载
×