训练参数归档 - 每时AI

揭秘！如何微调 DeepSeek-R1 推理模型，提升 AI 性能到极致

下午2时 2025/02/11 作者 AI技术研习社

据的主导地位。
最令人兴奋的是，这些革命性的模型完全免费使用，没有任何限制，任何人都可以随时访问并利

揭秘监督微调（SFT）：语言模型性能跃升的秘密武器！

下午2时 2024/12/19 作者 AI技术研习社

大型语言模型（LLMs）的训练通常分为多个阶段，包括预训练和后续的微调阶段。虽然预训练成本高昂（通常