4 种方法在本地部署蒸馏版的DeepSeek-R1

关注我，记得标星⭐️不迷路哦～

拥有本地LLM超能力：DeepSeek-R1本地运行的四种方法

你是否梦想过拥有一个专属的、强大的大型语言模型（LLM），可以随时为你服务，而无需担心高昂的云服务费用或数据隐私泄露？现在，这个梦想可以实现了！本地运行LLM就像拥有了一种超能力，它能为你带来：

成本节约：

不再需要为云服务按使用量付费，本地运行可以显著降低成本。
数据隐私：

你的数据完全保存在你的电脑上，无需上传到任何服务器，最大程度保护隐私。
定制与实验：

你可以自由地调整模型参数、进行各种实验，探索LLM的无限潜力。
离线可用：

即使在没有网络连接的情况下，你也能使用你的LLM。
乐趣无限：

探索和玩转LLM本身就是一件充满乐趣的事情！

今天，我们将一起探索四种让DeepSeek-R1等LLM在你自己的电脑上运行起来的最佳方法，让你轻松拥有这份“超能力”！

✨1. Ollama：极简主义的LLM运行方式

Ollama 是一款极简、易用的LLM运行工具，它的设计理念就是让一切变得简单。通过 Ollama 运行 DeepSeek-R1 模型，你只需要在终端中输入一行命令：

ollama run deepseek-r1

Ollama 会自动处理模型的下载、加载和运行，你只需要静静等待，然后就可以与 DeepSeek-R1 进行交互了。

安装 Ollama 也同样简单，只需一行命令：

curl -fsSL https://ollama.com/install.sh | sh

这个命令会自动下载并安装 Ollama。安装完成后，你就可以使用 ollama run 命令运行任何 Ollama 支持的模型了。

Ollama 的优点：

极简易用：

一行命令即可运行模型，无需任何复杂配置。
自动管理：

自动下载、加载和更新模型。
跨平台：

支持 macOS、Linux 和 Windows（即将推出）。

Ollama 的缺点：

功能相对简单：

相比其他工具，Ollama 的可定制性较弱。

✨2. LM Studio：像操作磁带一样管理LLM

LM Studio 为LLM的本地运行提供了一种更具图形化、更直观的方式。你可以将 LM Studio 安装成一个应用程序，它提供了一个类似于 ChatGPT 的界面，让你可以轻松地与LLM进行交互。

LM Studio 的独特之处在于它的模型管理方式。 你可以像操作磁带一样，加载和卸载不同的模型。这种比喻非常形象，让你能够轻松地在不同的模型之间切换，就像更换不同的磁带一样。

LM Studio 的优点：

图形化界面：

友好的用户界面，易于上手。
模型管理：

像操作磁带一样加载和卸载模型，方便切换。
内置聊天界面：

提供类似 ChatGPT 的聊天界面，方便交互。
跨平台：

支持 macOS、Windows 和 Linux。

LM Studio 的缺点：

资源占用：

相比命令行工具，图形化界面可能会占用更多的系统资源。

✨3. vLLM：追求极致性能的LLM推理引擎

vLLM 是一个专为LLM推理和服务而设计的高性能库。它的目标是提供最先进的吞吐量，让你能够以极快的速度运行LLM。

使用 vLLM，你可以轻松地将 DeepSeek-R1 部署为一个兼容 OpenAI API 的服务器。 这意味着你可以使用任何与 OpenAI API 兼容的客户端或库来与你的本地LLM进行交互。vLLM 还支持推理功能，让你的LLM能够进行更复杂的思考和推理。

vLLM 的优点：

高性能：

提供最先进的吞吐量，快速响应。
OpenAI 兼容：

可以使用任何与 OpenAI API 兼容的工具。
推理支持：

支持推理功能，让LLM更智能。
易于部署：

可以轻松地将LLM部署为服务器。

vLLM 的缺点：

配置相对复杂：

相比 Ollama 和 LM Studio，vLLM 的配置可能需要更多的技术知识。

✨4. LlamaCPP：LLM本地运行的先驱

LlamaCPP 是由 Georgi Gerganov（@ggerganov）开发的，它是最早让LLM在普通消费级硬件上运行成为可能的项目之一。LlamaCPP 以其极简的设置和最先进的性能而闻名。

LlamaCPP 的核心优势在于它的高效性和跨平台兼容性。 它可以在各种硬件上运行，包括 CPU 和 GPU，甚至可以在 Mac Studio 这样的设备上流畅运行 DeepSeek-R1。

LlamaCPP 的优点：

高效性能：

在各种硬件上都能提供出色的性能。
跨平台：

支持 macOS、Windows、Linux 以及各种硬件架构。
社区活跃：

拥有庞大且活跃的社区，提供丰富的资源和支持。
最小化设置

: 非常少的依赖, 容易安装.

LlamaCPP 的缺点：

需要编译：

通常需要从源代码编译，对于不熟悉编译的用户可能有一定门槛。

✨总结：选择适合你的LLM本地运行方式

以上四种方法各有千秋，你可以根据自己的需求和技术水平选择最适合你的方式。

如果你追求极简易用，

Ollama 是你的首选。
如果你喜欢图形化界面和便捷的模型管理，

LM Studio 会让你满意。
如果你追求极致性能和 OpenAI 兼容性，

vLLM 是你的不二之选。
如果你喜欢折腾、追求极致性能和跨平台兼容性，

LlamaCPP 将带给你无限可能。

无论你选择哪种方式，本地运行LLM都将为你打开一扇通往人工智能新世界的大门。你将拥有一个专属的、强大的LLM助手，可以随时为你服务，帮助你完成各种任务，探索无限可能！

（文：每日AI新工具）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31