部署本地的大语言模型，只需几分钟！

2023 年是 AI 高速发展的一年，除了功能强大的商用大语言模型之外，也出现了很多不错的开源大语言模型。比如，Llama2、Codellama、Mistral 和 Vicuna 等。虽然商用的大语言模型 ChatGPT、Bard 和 Claude 功能很强大，但需要支付一定的费用，同时也存在一定的安全问题。对于某些场景，如果你要确保数据安全，那么你可以考虑部署本地大语言模型。

本文我将介绍如何利用 ollama^[1] 这个开源项目，运行 Llama2 和其它的大语言模型。

安装 ollama

目前 ollama 只支持 macOS 和 Linux 系统，Windows 平台正在开发中。我们可以访问 Download Ollama^[2] 这个链接下载指定平台的 ollama。

我下载的是 macOS 版本，成功下载后解压「Ollama-darwin.zip」文件，双击 Ollama 可执行文件，即可以开始安装。

安装时会提示是否把 Ollama 应用移动到系统的 Applications 目录，这里我选择「Move to Applications」：

接着，按照软件安装指南一步步操作即可。

如果你想运行 llama2，只需在终端中运行 ollama run llama2 命令。运行该命令后，会自动下载 llama2 ^[3] 模型：

除了 llama2 模型之外，Ollama 还支持很多模型，完整的模型可以访问模型列表^[4] 查看。

❝

注意：你应该至少有 8 GB 的 RAM 来运行 3B 模型，16 GB 的 RAM 来运行 7B 模型，32 GB 的 RAM 来运行 13B 模型。

❞

成功下载完模型之后，你就可以跟 llama2 模型交互了：

ollama CLI

利用 ollama CLI，我们可以方便地对模型执行各种操作。比如，创建模型、拉取模型、移除模型或复制模型等。

创建模型

ollama create example -f Modelfile

部署本地的大语言模型，只需几分钟！

安装 ollama

ollama CLI

创建模型

相关阅读

最近更新

LLM | 偏好学习算法并不学习偏好排序

YoloCS：有效降低特征图空间复杂度

改进的检测算法：用于高分辨率光学遥感图像目标检测

迈向『闭环』| PlanAgent：基于MLLM的自动驾驶闭环规划新SOTA！