深入剖析!如何区分有价值和无价值的数据? 下午2时 2025/05/29 作者 机器学习算法与自然语言处理 MLNLP社区分享了关于RHO-1论文的解读,该论文提出了选择性语言建模(SLM),通过分析文本中的不同token对模型学习的影响,提出只对有价值的token进行训练的方法。此方法能够显著提升效率并提高性能。
零基础入门:DeepSeek微调教程来了! 下午2时 2025/02/25 作者 Datawhale 的效果。 微调前: 微调后: 在此处可以看到很明显大模型进行微调后口吻已经发生了更改。据笔者使用下来