手把手带你本地部署大模型

🕗 发布于 2024-07-09 22:07 LLM 大模型本地部署 LM Studio

这篇文章的唯一目的是实现在本地运行大模型，我们使用LMStudio这个工具协助达成这个目标。

文章目录

一，下载安装LM Studio
二，本地部署大模型

一，下载安装LM Studio

打开下载页面https://lmstudio.ai/下载LM Studio。

在这里插入图片描述
这个工具是免安装的，双击就可以打开软件。

二，本地部署大模型

1，搜索模型

打开LM Studio后，就可以在软件中搜索要部署的模型了，比如我们想部署阿里的通义千问，可以输入关键字qwen。

在这里插入图片描述

搜索结果会以列表的形式罗列出来。

在这里插入图片描述

我们会发现通过关键字搜索出来的模型非常多，选择的依据主要有两个：

模型参数。上面图中每个模型都带有一个参数，比如7B，14B，0.5B，数字越大，说明模型越复杂，耗费的资源越多，一般在自己的电脑上部署大模型，选择0.5B体验下即可。关于模型参数的具体知识，见文章最后一部分。
模型的格式。要选择GGUF，GGUF格式是为了使大型语言模型的推理更加高效、轻量级和易于部署而设计的，特别适用于资源受限的设备或环境。

2，下载大模型

比方说我们选择高亮的Qwen1.5-1.8B-Chat-GGUF模型。

如下图，在右下角找到Download按钮，点击下载。

在这里插入图片描述
可能会遇到下载很慢的情况，耐心等待，或者不通过这里下载，去网站手段下载模型，然后加载进来也行。

3，加载大模型

在这里插入图片描述
如上图，在LM Studio中按如下步骤，加载刚刚下载的大模型，并进行测试。

① 左侧选择chat
② 点击下拉列表，查看已经下载的大模型
③ 选择我们想要加载的大模型

4，测试大模型

加载大模型之后，按照下面步骤测试大模型是否正常加载。

① 点击 New Chat 新建一个会话
② 输入一个问题，根据AI的回答确认模型是否正常加载

在这里插入图片描述

5，部署大模型

在LM Studio中部署大模型，也非常简单。

① 点击左侧菜单，切换到部署界面
② 点击Start Server按钮，开始部署

大模型很快就部署好了，当然，这是因为我们选择的模型比较小，不用耗费很多资源。

6，验证

大模型部署好了之后，LM Studio中还提供了各种访问大模型的Demo。

如下图，我们选择使用Python进行访问，点击chat(python)按钮，copy下面的代码到pycharm中，执行代码。
在这里插入图片描述
如果在LM Studio的控制台能看到类似的日志，说明大模型运行正常。

在这里插入图片描述

关于大模型参数的补充知识

在提及大模型如7B、33B、70B时，这里的数值代表的是模型的参数量，也就是构成神经网络的权重和偏置的数量。在深度学习中，模型的复杂度与其参数量成正比，更多的参数意味着模型具有更强的学习能力和表达能力，但也需要更多的计算资源来进行训练和推理。

7B：指的是模型拥有大约70亿（7 Billion）个参数。
33B：指的是模型拥有大约330亿（33 Billion）个参数。
70B：指的是模型拥有大约700亿（70 Billion）个参数。

这些参数是模型学习得到的，用于捕捉输入数据与输出预测之间的复杂关系。较大的模型通常能够更好地拟合复杂的数据分布，但同时也可能带来过拟合的风险，需要大量的数据进行训练以避免这种情况。

在实际应用中，选择多大的模型取决于多种因素，包括计算资源的限制、模型的预期用途、数据集的大小和复杂性等。例如，对于资源有限的设备，可能需要使用较小的模型（如7B）；而对于云服务或高性能计算集群，则可能使用更大的模型（如70B）。

原文地址：https://blog.csdn.net/epitomizelu/article/details/140294793

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Apache AGE中的图
下一篇：我的创作4096天纪念日

web前端开发--盒子属性
学院介绍
阅读更多2024-11-18
深度学习基础—Seq2Seq模型
decoder网络和编号4的语言模型几乎一模一样，机器翻译模型其实和语言模型非常相似，不同在于语言模型总是以零向量开始，而encoder网络会计算出一系列向量来表示输入的句子。假设输入猫咪图片，经过预
阅读更多2024-11-18
【第三章】Kubernetes资源与对象
文章目录1. Kubernetes资源介绍1.1 Pod1.2 Deployment1.3 Service1.4 Namespace2. Kubernetes资源实践2.1 部署应用2.2 访问应用2
阅读更多2024-11-18
SRT拥塞控制分析
在慢启动阶段，发送端会逐渐增加发送速率，直到网络出现丢包，这时会触发拥塞控制机制，减少发送速率。在拥塞控制中，如果网络出现丢包，发送端可能会增加数据包发送间隔，以减少网络拥塞。：拥塞窗口的大小，用于控
阅读更多2024-11-18
小红书内容推荐算法开发：利用API打造个性化用户体验
小红书，作为国内领先的内容分享社区，其丰富的用户生成内容（UGC）和独特的社区氛围，为推荐算法的开发提供了肥沃的土壤。通过小红书API获取的数据，我们可以构建用户兴趣画像和内容特征，进而实现个性化推荐
阅读更多2024-11-18
详解八大排序（一）------（插入排序，选择排序，冒泡排序，希尔排序）
在日常生活中，我们常常要将各种各样的数据进行排序，例如我要将班上的学生按照数学成绩从大到小的排序，像这种一般情况，编译器自带的sort函数就能满足我们的要求。但是，假如我要将班上姓刘的学生按照数学成绩
阅读更多2024-11-18
量化交易系统开发-实时行情自动化交易-3.4.3.2.期货交易数据
交易数据（Trade Ticks）是进行高频交易策略和市场情绪分析的核心数据之一，通过获取逐笔交易的数据，交易者可以识别大资金动向、市场参与者的行为，以及短时间内的市场动态。以下是通过 Python
阅读更多2024-11-18
Rust：AtomicI8 还是 Mutex＜u8＞?
提供的原子操作（如加载、存储等）在硬件层面得到支持，这些操作是不可分割的，即一旦开始执行，就不会被其他线程的操作打断。如果需要在多个线程之间安全地传递复杂的数据结构或进行复杂的同步操作，那么可能需要考
阅读更多2024-11-18
小程序-基于java+SpringBoot+Vue的智能小程序商城设计与实现
智能小程序商城是一个基于Java和Spring Boot框架开发的电子商务平台，利用微信小程序技术提供便捷的购物体验。系统支持商品浏览、购物车管理、订单处理、用户信息管理等功能，旨在为用户打造一个简洁
阅读更多2024-11-18
华为Ensp模拟器配置OSPF路由协议
开放式最短路径优先 (OSPF) 协议深度解析简介开放式最短路径优先（Open Shortest Path First, OSPF）是一种内部网关协议（IGP），用于在自治系统（AS）内进行动态路由选
阅读更多2024-11-18

手把手带你本地部署大模型

文章目录

一，下载安装LM Studio

二，本地部署大模型

1，搜索模型

2，下载大模型

3，加载大模型

4，测试大模型

5，部署大模型

6， 验证

关于大模型参数的补充知识

相关文章

6，验证