V3模型归档 - 每时AI

在本地实现接近10倍的加速运行 Deepseek

2025年2月20日8时作者 NLP工程化

KTransformers是提升Transformer体验的灵活框架，支持多GPU加速和本地部署优化，适用于24GB显存和382GB系统内存配置。

2025年2月13日8时作者 NLP工程化

清华大学KVCache.AI团队联合趋境科技发布KTransformers开源项目，支持24G显存在本地运行DeepSeek-R1、V3的671B满血版，预处理和推理速度提升。