DeepSick-R1:轻松复现DeepSeek-R1的高效代码库

DeepSick-R1:轻松复现DeepSeek-R1的高效代码库。亮点:

  1. 代码简洁,仅3个核心文件(main.py、trainer.py、utils.py),总825行代码;
  2. 使用vLLM加速生成,效率大幅提升;
  3. 支持多GPU训练,训练速度显著提升。

参考文献:
[1] http://github.com/ByungKwanLee/DeepSick-R1



(文:NLP工程化)

欢迎分享

发表评论