资讯
国际
分享
大模型
学术
开源
机器人
关于我们

DeepSeekMLA操作符计算密集度优化

14G跑满血DeepSeek-R1，清华最新开源力作ktransformers

2025年2月17日14时作者 PaperAgent

清华大学开源框架KTransformers研究显示，仅需14GB GPU和382GB DRAM即可本地运行671B参数的DeepSeek-R1模型，并实现约13.69 tokens/s的推理速度。

分类分享标签 13.69 tokens/s、 DeepSeekMLA操作符计算密集度优化、 KTransformers开源框架、混合推理、清华、英特尔AMX加速内核发表评论

搜索

2025年 AGI AI AI技术 Anthropic ChatGPT Claude DeepSeek DeepSeek-R1 DeepSeek R1 GitHub GPT-4o LLM MCP Meta OpenAI Python Sam Altman 人工智能人形机器人具身智能大型语言模型大模型大语言模型字节跳动开源强化学习微软扩散模型技术创新智能体木易机器学习深度学习清华大学生成式AI 用户体验百度腾讯自然语言处理英伟达谷歌阿里云阿里巴巴马斯克

分类

分享
国际
大模型
学术
开源
机器人
资讯

朴素美感，不要NSFW
OpenAI 研究员Noam Brown：将测试时计算从单体推理扩展到多智能体文明
京东集团算法总监韩艾将在 AICon 北京站分享基于强化学习的异构多智能体联合进化算法
一次集成，减少 80% 适配工作！从 0 到 1 开发一款 MCP Server 难不难？
揭秘豆包音视频通话幕后技术，自己开发产品也能用

2025 年 6 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

« 5 月

归档

2025 年 6 月
2025 年 5 月
2025 年 4 月
2025 年 3 月
2025 年 2 月
2025 年 1 月
2024 年 12 月
2024 年 11 月

AI新闻 | X平台｜ APK反编译｜京ICP备2024096144号｜

© 2025 每时AI • Built with GeneratePress

下载我们的APP，AI秒送达！立即下载

×