跳至内容
每时AI
菜单
菜单
资讯
国际
分享
大模型
学术
开源
机器人
关于我们
最优学习率
阶跃星辰开源LLM最优超参工具
上午8时 2025/03/15
作者
NLP工程化
研究团队通过大规模训练和超参数优化发现了大语言模型的最优学习率与数据规模呈幂律变化的缩放法则。