本地运行量化版本的大模型 下午11时 2025/01/22 作者 NLP工程化 本篇内容教大家如何本地运行 GGUF 格式的 LLM 模型,以最新 DeepSeek-R1-Distill-Qwen-32B-GGUF 模型为例。