AI大模型本地部署保姆级教程！三种方法教会你如何部署

今天分享下关于大模型本地部署的一些基础知识，做一个简单的入门，并科普相关的工具使用。

Python老猿

11150人浏览 · 2024-12-24 11:24:22

Python老猿 · 2024-12-24 11:24:22 发布

今天分享下关于大模型本地部署的一些基础知识，做一个简单的入门，并科普相关的工具使用。

一、大模型本地部署有哪些方式

大模型本地部署，顾名思义就是把大模型部署到我们本地的笔记本或者台式机上。

由于大模型本身动辄几十亿甚至上百亿的参数，使用普通的方法去部署大模型会非常吃力。为此，研究员们开发了很多本地部署的框架的应用来帮助我们更好的进行本地部署。

按照推理使用的方式不同，可以分为两类，CPU 部署和 GPU 部署。CPU 部署主要是用 CPU 进行推理，因此需要占用大量的内存空间去存放大模型的参数。而 GPU 部署会把大模型部署到 GPU 上，由于 GPU 的价格比较昂贵，现在主流的部署框架都支持这两种方式供大家选择。

按照使用方式的不同，主要分为源码部署和应用部署。源码部署就是自行配置相关的 python 以及开发环境，这种就要求大家需要一定的编程基础才能搞懂。另外应用部署，就是使用一些厂商预先提供好的工具直接安装后进行部署使用，适合新手入门。

常见的源码部署主要有 transformers、vLLM、llama.cpp 等，而应用部署可以选择 ollama 或者 LM Studio。下面，我们将分别讲述几种不同的部署方式。

二、采用 ollama 本地部署

我们简单和大家讲解下 ollama 以及 LM Studio 两种不同应用部署的具体步骤。这两者的基本功能都比较类似，均可以支持不同大模型的本地部署，并且会优先使用 GPU 进行推理。如果没有发现 GPU，就会使用 CPU 推理，因此也会占用一部分内存。从实际使用来看，笔记本内存应该至少为 8GB 才能正常运行。

ollama 的官网：ollama.com/

直接点击下方的 Download 进行下载安装即可，安装完成后会发现一个羊驼一样的图标。

在这里插入图片描述

以 MAC 为例，在启动台可以展示这个图标就表示安装成功。点击就可以运行

在这里插入图片描述

Ollama 运行后，默认是没有 webui 界面的，想要添加 webui，需要自己安装另外的项目。比如可以安装 anythingllm，去配置好本地的端口就可以在 ui 中使用 ollama 的模型了。 anythingllm.com/download

这里，我们重点讲下命令行调用的方式。首先，是安装模型，我们如下图所示，点击网页上的 Models 页面，然后点击红框内的 llama3.1 进入到模型详情页。

在这里插入图片描述

在此页面中，我们可以看到 ollama 支持的llama3.1 的详细信息，8b 的模型大小是 4.7GB,因此至少需要 8GB 显存才能正常使用。使用 ollama run llama3.1:8b 命令就可以直接启动这个模型。如果之前没有下载，该命令还会帮我们直接下载此模型。

在这里插入图片描述

在命令行中执行 ollama list 可以看到我们现在本地存在的模型，并可以使用 run 命令将其启动。

在这里插入图片描述

Run 一个不存在的模型时，会先进行下载，然后再启动。

在这里插入图片描述

下载完成后，就会直接进入回答的窗口，可以直接输入提示词让大模型进行回答。

在这里插入图片描述

使用也比较简单，可以直接进行对话。直接在命令行输入提示词就可以，理论上电脑性能越好，输出的速度就越快。

在这里插入图片描述

输入 /bye 就可以退出这个程序。

在这里插入图片描述

LM Studio

LM Studio 功能比 ollama 更强一些，而且有 UI 界面可以直接使用，更适合新手小白。因此，更加推荐大家尝试和使用这个软件去部署本地大模型。

官网：lmstudio.ai/ 同样，找到对应的版本，直接下载就可以了。

在这里插入图片描述

下载完成后同样会显示一个图标，直接点开登录就可以。

在这里插入图片描述

登录之后，会看到下面这个界面，然后在搜索的地方，可以搜索你喜欢的模型。

在这里插入图片描述

我们以 llama3.1 为例，去使用这个搜索功能。在搜索框中输入 llama3.1，然后点击 Go 按钮。

在这里插入图片描述

LM Studio 会搜索网上的资源，并进行展示。左侧是它搜索出来的所有 llama 3.1 相关的资源，我们可以任意点击一个进去查看更详细的信息。点击之后，会出现右侧所示的内容，可以看到不同版本的模型供我们下载。

在这里插入图片描述

其中，提示语显示为绿色的就是我们电脑支持的模型大小，可以随便下载。而蓝色的则表示，使用时速度会受一些影响，红色的则表示当前模型在我们电脑上无法运行。大家根据实际情况，下载适合自己电脑的版本就可以了。下载完模型后，可以点击左侧红色框的地方，进行和大模型的对话。在上面红色框的地方，可以加载现在安装到你本地的模型。

在这里插入图片描述

下面是展示和 llama3 7b对话的效果。

在这里插入图片描述

另外，LM Studio 和 ollama 都是支持和兼容 Open API的接口的，对开发者也十分友好。限于篇幅，我们后面会给大家详细介绍。

在这里插入图片描述

使用源码部署使用源码部署，需要一定的编程基础，这里我们以 Qwen2 的部署为例，简单给大家介绍下。

根据我们实际体验，建议 transformers>=4.40.0，Python 3.10， Pytorch 2.2，CUDA 12.0 版本比较合适和稳定。

在这里插入图片描述

可以直接参考下面的代码去运行 Qwen2 的模型，红框里的代码会在 HF 上下载相关的模型。这里模型的名字是 Qwen2-7B-Instruct，意思是这是一个指令微调的版本，可以用于和我们进行正常的对话聊天。

在这里插入图片描述

这个代码默认在 GPU 上执行，因此需要至少 16GB 显存，显存不足的可以更换成 0.5B 的模型或者 INT4 量化的版本如果运行顺利，正常会打印类似下面的日志，并根据用户的提示词，输出最终的回答。

在这里插入图片描述

我们简单总结下，今天一共讲了三种不同的本地部署的方法。其中 LM Studio 是推荐新手和小白优先使用的有编程基础的，可以考虑使用源码去本地部署大模型切记，源码部署一定要配置好对应的python环境，否则你会花大量的时间在调试 bug 上面。

如何系统的去学习大模型LLM ？

大模型时代，火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业？”“谁的饭碗又将不保了？”等问题热议不断。

事实上，抢你饭碗的不是AI，而是会利用AI的人。

继科大讯飞、阿里、华为等巨头公司发布AI产品后，很多中小企业也陆续进场！超高年薪，挖掘AI大模型人才！ 如今大厂老板们，也更倾向于会AI的人，普通程序员，还有应对的机会吗？

与其焦虑……

不如成为「掌握AI工具的技术人」，毕竟AI时代，谁先尝试，谁就能占得先机！

但是LLM相关的内容很多，现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学，学习成本和门槛很高。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

一、LLM大模型经典书籍

AI大模型已经成为了当今科技领域的一大热点，那以下这些大模型书籍就是非常不错的学习资源。

在这里插入图片描述

二、640套LLM大模型报告合集

这套包含640份报告的合集，涵盖了大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。(几乎涵盖所有行业)

在这里插入图片描述

三、LLM大模型系列视频教程

在这里插入图片描述

四、LLM大模型开源教程（LLaLA/Meta/chatglm/chatgpt）

在这里插入图片描述

LLM大模型学习路线 ↓

阶段1：AI大模型时代的基础理解

目标：了解AI大模型的基本概念、发展历程和核心原理。
内容：
- L1.1 人工智能简述与大模型起源
- L1.2 大模型与通用人工智能
- L1.3 GPT模型的发展历程
- L1.4 模型工程
- L1.4.1 知识大模型
- L1.4.2 生产大模型
- L1.4.3 模型工程方法论
- L1.4.4 模型工程实践
- L1.5 GPT应用案例

阶段2：AI大模型API应用开发工程

目标：掌握AI大模型API的使用和开发，以及相关的编程技能。
内容：
- L2.1 API接口
- L2.1.1 OpenAI API接口
- L2.1.2 Python接口接入
- L2.1.3 BOT工具类框架
- L2.1.4 代码示例
- L2.2 Prompt框架
- L2.3 流水线工程
- L2.4 总结与展望

阶段3：AI大模型应用架构实践

目标：深入理解AI大模型的应用架构，并能够进行私有化部署。
内容：
- L3.1 Agent模型框架
- L3.2 MetaGPT
- L3.3 ChatGLM
- L3.4 LLAMA
- L3.5 其他大模型介绍

阶段4：AI大模型私有化部署

目标：掌握多种AI大模型的私有化部署，包括多模态和特定领域模型。
内容：
- L4.1 模型私有化部署概述
- L4.2 模型私有化部署的关键技术
- L4.3 模型私有化部署的实施步骤
- L4.4 模型私有化部署的应用场景

这份 LLM大模型资料 包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）👈

2048 AI社区

有“AI”的1024 = 2048，欢迎大家加入2048 AI社区

更多推荐

UFW防火墙安全指南

UFW（Uncomplicated Firewall）是Ubuntu/Debian系统中简化防火墙管理的工具，通过直观命令帮助用户有效控制网络流量，提升系统安全性。文章详细介绍了UFW的基本命令，包括启停防火墙、添加规则、限制连接速率和日志配置等操作，并提供了安全最佳实践，如默认拒绝策略、IP地址限制和服务级规则管理。同时，还涵盖高级配置技巧，例如多网络接口设置、规则优先级调整、IPv6支持及与f