在 Windows WSL 上部署 Ollama 和大语言模型：从镜像冗余问题看 Docker 最佳实践20241208

🕗 发布于 2024-12-09 11:55 语言模型 docker 人工智能

🛠️ 在 Windows WSL 上部署 Ollama 和大语言模型：从镜像冗余问题看 Docker 最佳实践

⭐ 引言

随着大语言模型（LLM）和人工智能技术的迅猛发展，开发者们越来越多地尝试在本地环境中部署模型进行实验。
但部署过程中常常会遇到网络限制、资源冲突和工具复杂性等问题。本文聚焦于实际操作中遇到的 Docker 镜像冗余问题，并总结了从问题发现到解决的完整流程。同时，结合 Ollama、Open WebUI 和 Qwen 的联系，分享一套适用于本地 LLM 部署的 Docker 最佳实践工作流，帮助开发者高效部署和管理模型。
在这里插入图片描述

🔍 Ollama、Open WebUI 和 Qwen 的联系

📌 Ollama

定位：本地大语言模型推理工具，支持 RESTful API。
功能：
• 提供 LLM 模型的高效推理能力。
• 通过命令行工具快速部署 RESTful 服务。
优势：
• 轻量化：支持 CPU 和 GPU 环境。
• 离线能力：无需联网即可本地运行模型。

📌 Open WebUI

定位：基于浏览器的交互界面，方便与模型交互。
功能：
• 提供文档导入和 RAG（检索增强生成）支持。
• 可视化界面适合复杂任务的操作。
优势：
• 用户友好：降低命令行门槛。
• 高扩展性：与 Ollama 的后端无缝结合。

📌 Qwen

定位：阿里巴巴推出的大语言模型，支持中英文双语。
功能：
• 文本生成、理解和推理能力强大。
• 可在 Ollama 或 Hugging Face 环境中部署。
优势：
• 任务灵活：适用于对话生成、知识问答等。
• 开放性强：支持自定义训练与开源应用。

📎 三者的协作

Ollama 提供模型推理服务，并通过 API 接口供其他工具调用。
Open WebUI 作为用户界面，与 Ollama 的 API 交互。
Qwen 是核心模型，为用户提供实际生成能力。

🛠️ 镜像冗余问题：从发现到解决的完整分析

📌 问题背景

在通过 Docker 部署 Open WebUI 时，始终无法正常启动容器，日志显示网络无法访问 Hugging Face。但实际根源是 Docker 镜像冗余导致的容器冲突。

现象：
1. 多个停止状态的容器残留。
2. 重复镜像未清理，导致新容器启动失败。
3. 错误日志显示：

Error response from daemon: conflict: unable to delete <image_id> - image is being used by stopped container.

📋 问题排查与解决

1. 检查运行状态的容器：

docker ps -a

输出结果显示多个以相同镜像启动的容器，其中一些处于停止状态。

2. 检查镜像状态：

docker images

发现重复镜像未清理，占用存储空间，可能导致冲突。

3. 停止并删除所有相关容器：

docker stop <container_id>
docker rm <container_id>

4. 强制删除镜像：
即使镜像有残留关联容器，docker rmi 也可以强制删除：

docker rmi <image_id>

• 例如：docker rmi 7d2
此命令只需提供镜像 ID 的前几位即可，Docker 会自动匹配。

5. 删除未使用的镜像：
该命令清理所有未被使用的镜像，释放存储空间。

docker image prune -a

6. 重新加载镜像并启动容器：

加载离线镜像：

docker load < x86-64-images.tar.gz

启动 Open WebUI 容器

docker run -d --network=host \
    -v /home/<user>/.ollama/models:/app/backend/data \
    -e OLLAMA_BASE_URL=http://127.0.0.1:11434 \
    --name open-webui \
    --restart always \
    ghcr.io/open-webui/open-webui:main

以下是对该 docker run 命令的逐步解读，每个选项和参数的详细说明：

**1. 基本命令：docker run **
• 启动一个新的容器实例，基于指定的镜像运行。
• 这是 Docker 最常用的命令，用于容器化服务的启动。

2. 参数解析

-d
• 含义：以后台（detached）模式运行容器。
• 功能：让容器在后台运行，而不是占用当前终端。
• 优势：适合需要长期运行的服务，如 API 或 Web 应用。
–network=host
• 含义：让容器直接使用主机的网络栈，而不启用 Docker 默认的桥接网络。
• 功能：
• 容器中的服务可直接使用主机的 IP 和端口，而不需要端口映射。
• 网络性能更高，避免了容器和主机之间的网络虚拟化开销。
• 注意：
• 使用 --network=host 时，容器内的端口与主机共用，因此可能引发端口冲突。
• 在某些场景下可能降低安全性，因为容器直接暴露于主机网络。
-v /home//.ollama/models:/app/backend/data
• 含义：挂载主机目录 /home//.ollama/models 到容器中的 /app/backend/data。
• 功能：
• 主机的 ~/.ollama/models 目录用于存储模型文件，将其挂载到容器内的对应目录。
• 容器运行期间可以访问主机上的模型文件，实现数据共享。
• 优势：
• 数据持久化：即使容器删除，模型文件仍保留在主机上。
• 方便管理：直接在主机上更新模型文件，无需重启容器。
-e OLLAMA_BASE_URL=http://127.0.0.1:11434
• 含义：通过环境变量 -e 为容器中的服务设置配置。
• 功能：
• 定义 OLLAMA_BASE_URL 环境变量，指定 Ollama 服务的基地址。
• 在该示例中，http://127.0.0.1:11434 表示 Ollama 服务运行在主机的 127.0.0.1 地址和 11434 端口上。
• 优势：
• 配置灵活：通过环境变量可动态调整服务地址，无需修改代码或重新构建镜像。
–name open-webui
• 含义：为容器指定一个唯一的名字 open-webui。
• 功能：
• 方便管理容器，例如 docker stop open-webui。
• 提高可读性，相比于容器的随机 ID，容器名字更易识别。
–restart always
• 含义：设置容器的重启策略为 always。
• 功能：
• 当 Docker 守护进程启动时，自动重启该容器。
• 如果容器崩溃，也会自动尝试重启。
• 优势：
• 提高服务的稳定性和可用性，适合长时间运行的容器化服务。
ghcr.io/open-webui/open-webui:main
• 含义：指定容器镜像来源。
• 解析：
• ghcr.io/open-webui/open-webui：镜像的路径，托管于 GitHub Container Registry。
• main：镜像的标签，通常表示主分支的最新版本。
• 功能：
• Docker 会从注册表拉取 open-webui:main 镜像并创建容器。
• 如果镜像已存在本地，则直接使用，无需重复下载。

技巧总结

1. 缩短 ID 输入：
  无需完整输入容器或镜像的 ID，只需提供前几位即可，Docker 自动匹配：

docker rm 7eb
docker rmi 7d2

1. 强制删除镜像：
  若提示镜像被关联容器占用，可先删除关联的容器或直接用 docker rmi 强制删除。
1. 清理未使用资源：
  使用 docker image prune -a 一次性清理所有未使用的镜像，保持存储空间整洁。

📋 Docker 最佳实践工作流

为避免类似问题，以下是一套系统化的 Docker 清理与部署工作流，帮助开发者优化操作流程：

📌 1. 项目初始化

1. 检查已有容器和镜像状态：

docker ps -a
docker images

2. 清理未使用的容器和镜像：

docker container prune
docker image prune -a

📌 2. 加载或拉取镜像

加载离线镜像：

tar -xzvf x86-64-images.tar.gz
docker load < x86-64-images.tar.gz

拉取远程镜像：

docker pull ghcr.io/open-webui/open-webui:main

📌 3. 部署并启动容器

1. 启动 Open WebUI：

docker run -d --network=host \
    -v /home/<user>/.ollama/models:/app/backend/data \
    -e OLLAMA_BASE_URL=http://127.0.0.1:11434 \
    --name open-webui \
    --restart always \
    ghcr.io/open-webui/open-webui:main

2. 启动 Ollama 服务：

ollama serve

📌 4. 日常维护

查看容器状态：

docker ps

查看容器日志：

docker logs <container_id>

更新镜像：

docker pull ghcr.io/open-webui/open-webui:main

📝 结语

这次部署的最大收获在于：
1. 系统化问题分析：通过逐步排查，从网络问题定位到 Docker 镜像冲突。
2. 工具高效协作：深入理解 Ollama、Open WebUI 和 Qwen 的协作方式，充分发挥其功能。
3. 优化实践工作流：总结出了一套高效的 Docker 清理与部署流程。

希望这篇博客能为遇到类似问题的开发者提供启发和帮助。如果您有任何问题或想法，欢迎留言讨论！ 🚀

原文地址：https://blog.csdn.net/Narutolxy/article/details/144331798

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【Apache Paimon】-- 4 -- Flink 消费 kafka 数据，然后写入 paimon
下一篇：k8s-Informer之Reflector的解析

.NET(C#) 如何配置用户首选项及保存用户设置
.NET(C#) 如何配置用户首选项及保存用户设置
阅读更多2024-12-14
【最新】北大数字普惠金融指数数据集-省市县（2011-2023年）
郭峰,王靖一,王芳,孔涛,张勋,程志云.测度中国数字普惠金融发展:指数编制与空间特征[J].经济学(季刊),2020,19(04):1401-1418.时间跨度：省级和城市级指数时间跨度为2011-2
阅读更多2024-12-14
GESP202412 四级【Recamán】题解（AC）
a11ak−1−kkakak−1−kak−1k小杨想知道 Recamán 数列的前n项从小到大排序后的结果。手动计算非常困难，小杨希望你能帮他解决这个问题。
阅读更多2024-12-14
IDEA遇到EasyConnect中的网络资源无法访问的问题
版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。原文链接：https://blog.csdn.net/wanshanyu_/article/de
阅读更多2024-12-14
双目摄像头标定方法
此时已经完成标定，左下角为反投影误差，右边为外参可视化。将双目左右目拍的图像上传（左右目最好不少于20张）此时回到主页面，即可看到成功导出。把这些误差大的删除即可。
阅读更多2024-12-14
Servlet、omcat服务器架构与工作原理
Servlet是运行在服务器端的Java程序，它的主要职责之一是接收并处理来自客户端（如浏览器）的HTTP请求。当客户端发送一个请求到服务器时，Servlet可以解析请求中的信息，例如请求的URL路径
阅读更多2024-12-14
Vue生命周期钩子函数：深入解析与实践
作为高级Vue前端开发人员，对Vue组件的生命周期钩子函数有着深刻的理解是至关重要的。生命周期钩子函数是指在Vue组件的创建、更新、销毁等过程中，Vue自动调用的一系列方法。通过这些钩子函数，我们可以
阅读更多2024-12-14
安卓开发--使用android studio发布APP
app发布
阅读更多2024-12-14
数据结构与算法学习笔记----拓扑排序
@ author: 明月清了个风。
阅读更多2024-12-14
python 将数据保存到现有的Excel文件的新工作表
out_file = ‘query.xlsx’df1 = pd.DataFrame(out_data)若直接写入：df1.to_excel(out_file, index=False, sheet_n
阅读更多2024-12-14

在 Windows WSL 上部署 Ollama 和大语言模型：从镜像冗余问题看 Docker 最佳实践20241208