400k SFT数据归档

AI能自主出“竞赛题”了！港大&蚂蚁让大模型学会生成难题，水平已接近AIME

2025-03-14 作者量子位

港大和蚂蚁的研究人员提出PromptCoT方法，利用思维链生成高质量问题数据，提高了模型训练的效果。他们基于Llama3.1-8B训练了一个问题生成模型，并用合成的问题数据训练了DeepSeek-R1-Distill-Qwen-7B模型，使其在MATH-500、AIME 2024以及AIME 2025上的表现优于大模型。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30