Mingjie Liu归档 - 每时AI

英伟达笑到最后！训练2000步，1.5B逆袭7B巨兽，Scaling真来了

2025年6月22日16时作者新智元

L用超2000步训练配方给出了响亮的答案。仅15亿参数模型，媲美Deepseek-R1-7B，数学、