新手友好的 LLM 微调工具库:unsloth 上午8时 2025/02/14 作者 NLP工程化 该项目是用于微调和优化大型语言模型(LLM)的Python工具库,通过动态量化和显存优化技术提高模型微调速度并降低80%以上显存占用。
如何将671B满血版DeepSeek R1部署到本地?保姆级教程来了!有手就会 下午4时 2025/02/05 作者 PaperWeekly ©作者 | 李锡涵 单位 | 伦敦大学学院 来源 | 机器之心 过年这段时间,DeepSeek 算是
完整的671B R1塞进本地,详尽教程来了! 下午7时 2025/02/04 作者 Datawhale Datawhale干货 作者:李锡涵,编译 :机器之心 本文作者:李锡涵(Xihan Li) 作者简
完整教程 完整的671B MoE DeepSeek R1怎么塞进本地化! 下午2时 2025/02/03 作者 机器学习算法与自然语言处理 MLNLP 社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企