量化版本归档

1.93bit版DeepSeek-R1编程超过Claude 4 Sonnet，不用GPU也能运行

2025年6月10日16时作者量子位

最新优化版DeepSeek-R1（0528）在编程榜单aider上取得了60%的成绩，超过Claude 4 Sonnet和1月版的满血R1。同时，1.93bit版本R1相比原始版8bit减少了70%以上的文件大小，并且能够在较小的内存条件下运行游戏任务。

2025年5月19日8时作者 NLP工程化

阿里发布Qwen 2.5-Omni-7B量化版模型及演示应用

2025年3月24日14时作者小兵的AI视界

是一个高性能的
C/C++
库，专门用于运行
LLM
，支持多种硬件加速选项。
本文将详细介绍如何