DeepSick-R1:轻松复现DeepSeek-R1的高效代码库。亮点:
-
代码简洁,仅3个核心文件(main.py、trainer.py、utils.py),总825行代码; -
使用vLLM加速生成,效率大幅提升; -
支持多GPU训练,训练速度显著提升。


参考文献:
[1] http://github.com/ByungKwanLee/DeepSick-R1
(文:NLP工程化)
DeepSick-R1:轻松复现DeepSeek-R1的高效代码库。亮点:
参考文献:
[1] http://github.com/ByungKwanLee/DeepSick-R1
(文:NLP工程化)