新手友好的 LLM 微调工具库:unsloth 2025年2月14日8时 作者 NLP工程化 该项目是用于微调和优化大型语言模型(LLM)的Python工具库,通过动态量化和显存优化技术提高模型微调速度并降低80%以上显存占用。
如何将671B满血版DeepSeek R1部署到本地?保姆级教程来了!有手就会 2025年2月5日16时 作者 PaperWeekly ©作者 | 李锡涵 单位 | 伦敦大学学院 来源 | 机器之心 过年这段时间,DeepSeek 算是
完整教程 完整的671B MoE DeepSeek R1怎么塞进本地化! 2025年2月3日14时 作者 机器学习算法与自然语言处理 MLNLP 社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企