字节最新大模型秘籍:只挑能有推理潜力的数据训练!1.3B模型无需标签自动挑选 下午4时 2025/05/15 作者 量子位 字节Seed团队提出AttentionInfluence方法,利用小型预训练模型选择对大语言模型推理能力有显著提升的数据。通过屏蔽关键头部并计算损失差异来评估数据重要性,最终在多个基准测试中提高了模型性能。