14G跑满血DeepSeek-R1,清华最新开源力作ktransformers 下午2时 2025/02/17 作者 PaperAgent 清华大学开源框架KTransformers研究显示,仅需14GB GPU和382GB DRAM即可本地运行671B参数的DeepSeek-R1模型,并实现约13.69 tokens/s的推理速度。