英伟达笑到最后!训练2000步,1.5B逆袭7B巨兽,Scaling真来了 2025年6月22日16时 作者 新智元 L用超2000步训练配方给出了响亮的答案。仅15亿参数模型,媲美Deepseek-R1-7B,数学、