【AIGC】一、本地docker启动私有大模型

🕗 发布于 2024-07-10 01:04 docker 容器运维

一、最终效果

中英文对话

在这里插入图片描述

生成代码

在这里插入图片描述

二、资源配置

本文选择的模型运行内存需要 4G，因此宿主机建议内存大于8G，CPU建议 6 核以上；
参考博主该mac配置可以相对流畅运行。只需要 CPU资源，不需要 GPU。
在这里插入图片描述

三、搭建步骤

启动docker容器

采用open-webui启动一个大模型的交互页面

docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:ollama

由于ghcr.io/open-webui/open-webui:ollama是托管在境外，速度较慢，因此博主把该镜像搬迁到了阿里云。

docker run -d -p 3000:8080 -v ollama:/root/.ollama -v open-webui:/app/backend/data --name open-webui --restart always registry.cn-beijing.aliyuncs.com/xihuanyuyee/xihuanyuye:open-webui-ollama

登录页面

输入地址

http://localhost:3000

首次登录请注册

在这里插入图片描述

登录后的效果

在这里插入图片描述
是不是非常酷炫，一个私有的大模型平台就似乎ok了。

配置模型

尝试使用

但是其实这时候系统还不能使用，例如我们尝试输入问题。
are u ok?
在这里插入图片描述
系统报错未选定模型。

选择模型选项

左上角选定模型的下拉菜单，发现为空。
在这里插入图片描述

下载模型

在这里插入图片描述
操作步骤

step1 点击用户名处，打开配置菜单
step2 点击admin panel，打开配置面板
step3 点击setting，打开配置页面tab
step4 点击 modle选项，打开模块下载页面
step5 输入模型参数版本
step6 点击下载按钮，开始下载

选择适合的模型开始下载

根据你的机器资源情况，你可以选择运行基础版的Meta Llama 3 8B或更大型的Meta Llama 3 70B，但请注意，你需要有足够的内存来在本地运行这些大语言模型。我在一台配备64 GB RAM的M1 Max上测试了Meta Llama 3 70B，性能表现非常好。

模型名称	下载版本号	需要内存
Meta Llama 3 8B	llama3:8b	4.7 GB
Meta Llama 3 70B	llama3:70b	40 GB

下载过程可能会根据你的网络速度耗时一些。
在这里插入图片描述
操作步骤

step1 输入模型版本参数llama3:8b
step2 点击下载按钮
step3 查看下载进度

亲测当前国内网络可以直接下载，如果下载失败，可以重试一下试试。

试用效果

返回首页选择模型

在这里插入图片描述

中英文对话

在这里插入图片描述

生成代码

在这里插入图片描述
是不是非常有成就感！大模型之路从此开启！

四、附录

资源监控

在这里插入图片描述
在输入交互信息hello后，监控后台资源。本机是采用了虚拟机启动，因此可以看到cpu已经满载了。响应也特别慢。

五、参考网站：

苹果Mac用户的福音：本地运行Meta Llama 3的终极指南
 open-webui

原文地址：https://blog.csdn.net/xihuanyuye/article/details/140295852

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：在任何岗位都可以把自己当成一个项目经理
下一篇：PLC通信网关有什么功能特点？PLC通信网关工作原理-天拓四方

leetcode289:生命游戏
根据，简称为，是英国数学家约翰·何顿·康威在 1970 年发明的细胞自动机。给定一个包含m × n个格子的面板，每一个格子都可以看成是一个细胞。每个细胞都具有一个初始状态：1即为（live），或0即为
阅读更多2024-10-20
MongoDB数据恢复
注意：两个MongoDB的版本要一致，本文使用的是mongo:4.2.24。先把K8S上面的MongoDB 容器停止（可以把副本改成0）。1、将容器挂载MongoDB的数据目录备份到本地。经常是数据文
阅读更多2024-10-20
C#中实现事务
C#中实现事务
阅读更多2024-10-20
【LeetCode每日一题】——560.和为 K 的子数组
给你一个整数数组 nums 和一个整数 k ，请你统计并返回该数组中和为 k 的子数组的个数。子数组是数组中元素的连续非空序列。
阅读更多2024-10-20
「漏洞复现」满客宝智慧食堂系统 selectUserByOrgId 未授权访问漏洞
请勿利用文章内的相关技术从事非法测试，由于传播、利用此文所提供的信息而造成的任何直接或者间接的后果及损失，均由使用者本人负责，作者不为此承担任何责任。工具来自网络，安全性自测，如有侵权请联系删除。本次
阅读更多2024-10-20
React面试题目（从基本到高级）
React前端面试常见题目涵盖了React的基础概念、组件、状态管理、生命周期、性能优化等多个方面。
阅读更多2024-10-20
12.个人博客系统（Java项目基于spring和vue）
1 在校学习的学生，可用于日常学习使用或是毕业设计使用 2 毕业一到两年的开发人员，用于锻炼自己的独立功能模块设计能力，增强代码编写能力。 3 亦可以部署为商化项目使用。 4 需要完整资料及源码
阅读更多2024-10-20
YoloV8改进策略：注意力改进|DeBiFormer，可变形双级路由注意力|引入DeBiLevelRoutingAttention注意力模块（全网首发）
本次改进的核心在于将DeBiLevelRoutingAttention模块嵌入到YoloV8的主干网络中，具体位置是在SPPF（Spatial Pyramid Pooling Fast）模块之后。这一
阅读更多2024-10-20
word取消自动单词首字母大写
情况说明：在word输入单词后首字母会自动变成大写取消单词首字母大写步骤：（1）点击菜单栏文件（2）点击“更多”——>“选项”（3）点击“校对”——>“自动更正选项”（4）取消“句首字母大
阅读更多2024-10-20
web前端网页用户注册页面
【代码】web前端网页用户注册页面。
阅读更多2024-10-20

【AIGC】一、本地docker启动私有大模型

本地docker启动私有大模型

一、最终效果

中英文对话

生成代码

二、资源配置

三、搭建步骤

启动docker容器

登录页面

首次登录请注册

登录后的效果

配置模型

尝试使用

选择模型选项

下载模型

选择适合的模型开始下载

试用效果

返回首页选择模型

中英文对话

生成代码

四、附录

资源监控

五、参考网站：

相关文章