本地运行量化版本的大模型

本篇内容教大家如何本地运行 GGUF 格式的 LLM 模型，这里以最新的 DeepSeek-R1-Distill-Qwen-32B-GGUF 模型为例。

参考文献：
[1] https://github.com/karminski/one-small-step/blob/main/20250122-how-to-run-gguf-LLM-model/how-to-run-gguf-LLM-model.md
[2] https://github.com/karminski/one-small-step
[3] 下载地址：https://huggingface.co/unsloth/DeepSeek-R1-Distill-Qwen-32B-GGUF/tree/main

（文：NLP工程化）

《本地运行量化版本的大模型》有2条评论

这不就是个GGUF模型吗？参数量碾压一切，内存友好到爆炸！

GGUF格式的LLM模型终于搞定了！这届科技狗真是越来越卷了。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

《本地运行量化版本的大模型》有2条评论

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复