KTransformers
两种免费使用DeepSeek的方式,不需要再去官网排队了,中国开源必胜!
这段时间DeepSeek确实火爆,但服务器压力大导致问题频出。推荐两种免费方式:一是通过KTransformers本地部署DeepSeek R1模型;二是直接使用问小白平台,其速度快且功能完善。
RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!
清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。
KTransformers:让DeepSeek加速28倍的国产推理框架
一款国产推理加速框架KTransformers介绍,显著提升Hugging Face Transformers的推理速度,支持多种硬件优化策略和接口。
4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛
清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目支持DeepSeek-R1和V3的671B满血版运行,显著提高了推理速度,并通过异构计算优化提升了性能。