103K「硬核」题,让大模型突破数学推理瓶颈

本文介绍了一篇关于 DeepMath-103K 数据集的研究论文,该数据集旨在解决当前大语言模型在数学推理训练中的数据瓶颈问题。论文详细描述了其高难度、新颖性和纯净性的特点,并展示了在多个基准测试中的卓越性能。

腾讯发布DeepMath-103K,数学能力断崖式超过所有基线!

MLNLP社区是国内外知名的机器学习与自然语言处理社区。《数学能力的重大突破:腾讯发布的DeepMath-103K》介绍了一种包含10.3万道高难度数学题的数据集,旨在提升模型的数学推理能力。