跳至内容
每时AI

每时AI

  • 资讯
  • 国际
  • 分享
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 关于我们

KTransformers

135 个项目、七大趋势、三大赛道:撕开大模型开源生态真相,你会怎么卷?

下午4时 2025/05/29 作者 机器之心

Claude
三大开发者大会接连登场的一周里,微软为
Windows
加装模型上下文协议(
MCP

分类 学术、 资讯 标签 KTransformers、 PyTorch、 SGLang、 vLLM、 元数据治理、 数据湖 发表评论

在本地实现接近10倍的加速运行 Deepseek

上午8时 2025/02/20 作者 NLP工程化

KTransformers是提升Transformer体验的灵活框架,支持多GPU加速和本地部署优化,适用于24GB显存和382GB系统内存配置。

分类 开源 标签 DeepSeek-R1、 KTransformers、 MoE机制、 V3模型、 代码生成、 优化技术 发表评论

两种免费使用DeepSeek的方式,不需要再去官网排队了,中国开源必胜!

下午11时 2025/02/19 作者 开源AI项目落地

这段时间DeepSeek确实火爆,但服务器压力大导致问题频出。推荐两种免费方式:一是通过KTransformers本地部署DeepSeek R1模型;二是直接使用问小白平台,其速度快且功能完善。

分类 开源 标签 14GB VRAM、 382GB DRAM、 DeepSeek、 KTransformers、 MoE大模型、 写提示词 发表评论

值得一读之关于ktransformers的一些正确认知和若干细节问题

下午2时 2025/02/18 作者 老刘说NLP

多,也让人产生了许多误区,社区觉得有必要来谈谈这个话题,当然,跟大家强调一下,我们务必要去看
一手消

分类 大模型 标签 GGUF格式、 HuggingFace、 KTransformers、 MoE层、 PyTorch、 依赖包 发表评论

RTX 4090单卡跑满血版DeepSeek-R1?清华&趋境科技联合推出KTransformers方案!

下午2时 2025/02/17 作者 AI信息Gap

清华大学博士生木易介绍如何使用KTransformers库在RTX 4090 GPU上运行DeepSeek-R1/V3模型,包括环境搭建、模型加载及推理参数设置等步骤。

分类 国际、 大模型 标签 Hugging Face、 KTransformers、 NVIDIA A100、 NVIDIA Tesla T4、 PyTorch、 木易 发表评论

KTransformers:让DeepSeek加速28倍的国产推理框架

上午8时 2025/02/14 作者 AI工程化

一款国产推理加速框架KTransformers介绍,显著提升Hugging Face Transformers的推理速度,支持多种硬件优化策略和接口。

分类 分享 标签 24GB、 Hugging Face Transformers、 KTransformers、 MADSys、 Python、 清华大学 发表评论

4090单卡跑满血版DeepSeek-R1,清华团队开源项目再破大模型推理门槛

下午11时 2025/02/12 作者 量子位

清华大学KVCache.AI团队联合趋境科技发布的KTransformers开源项目支持DeepSeek-R1和V3的671B满血版运行,显著提高了推理速度,并通过异构计算优化提升了性能。

分类 资讯 标签 671B模型、 DeepSeek-R1/V3、 Huggingface Transformers、 KTransformers、 清华大学、 趋境科技 发表评论

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM Manus Meta OpenAI Python Sam Altman 人工智能 人形机器人 具身智能 大型语言模型 大模型 大语言模型 字节跳动 开源 强化学习 微软 扩散模型 技术创新 智能体 木易 机器学习 深度学习 清华大学 生成式AI 用户体验 百度 腾讯 自然语言处理 英伟达 谷歌 阿里云 阿里巴巴 马斯克

近期文章

  • 提示工程101第十四课:处理歧义与提升清晰度
  • 未来属于AI SaaS,这8个开源工具必不可少!
  • 95%的人不知道什么是AGI,也不知道他们将很快失业
  • 再见Latex,基于Markdown的多功能排版系统Quarkdown
  • 中美史诗级大团结,在一款被玩家狂喷的游戏里实现了

分类

  • 分享
  • 国际
  • 大模型
  • 学术
  • 开源
  • 机器人
  • 资讯
2025 年 5 月
一 二 三 四 五 六 日
 1234
567891011
12131415161718
19202122232425
262728293031  
« 4 月    

归档

  • 2025 年 5 月
  • 2025 年 4 月
  • 2025 年 3 月
  • 2025 年 2 月
  • 2025 年 1 月
  • 2024 年 12 月
  • 2024 年 11 月

AI新闻 | X平台 | APK反编译 | 京ICP备2024096144号 |
© 2025 每时AI • Built with GeneratePress
 下载我们的APP,AI秒送达!  立即下载
×