KTransformers 归档

135 个项目、七大趋势、三大赛道：撕开大模型开源生态真相，你会怎么卷？

2025年5月29日16时作者机器之心

Claude
三大开发者大会接连登场的一周里，微软为
Windows
加装模型上下文协议（
MCP

2025年2月20日8时作者 NLP工程化

KTransformers是提升Transformer体验的灵活框架，支持多GPU加速和本地部署优化，适用于24GB显存和382GB系统内存配置。

2025年2月19日23时作者开源AI项目落地

这段时间DeepSeek确实火爆，但服务器压力大导致问题频出。推荐两种免费方式：一是通过KTransformers本地部署DeepSeek R1模型；二是直接使用问小白平台，其速度快且功能完善。

2025年2月18日14时作者老刘说NLP

多，也让人产生了许多误区，社区觉得有必要来谈谈这个话题，当然，跟大家强调一下，我们务必要去看
一手消

2025年2月17日14时作者 AI信息Gap

清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型，包括环境搭建、模型加载及推理参数设置等步骤。

2025年2月12日23时作者量子位

清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目支持DeepSeek-R1和V3的671B满血版运行，显著提高了推理速度，并通过异构计算优化提升了性能。