4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛 下午11时 2025/02/12 作者 量子位 清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目支持DeepSeek-R1和V3的671B满血版运行,显著提高了推理速度,并通过异构计算优化提升了性能。