【ollama 在linux 上离线部署本地大模型】

🕗 发布于 2024-09-23 22:44 llama 语言模型 人工智能

本文继续来讲如何在linux上部署离线本地智能大模型，前篇如下：window上部署离线大模型

首先还是安装ollama linux版本，如果完全离线的话，可以从github上下载一个linux 版本的压缩包传上去
git hub上搜索ollama 找到右下角

找到linux 版本进行下载

通常情况下的服务器都是amd版本，手机以及一些嵌入式的系统才是arm版本，很多命令都可以看，如下 uname -a

uname -a

如果输出看到X86_64则是amd

模型下载：
有几个大的社区，Hugging face或者国内的魔塔等，都有官网。
比如下面的魔塔，找到模型库，搜一下感兴趣的模型，找到模型文件下载。
ollama可以导入两种格式的自定义模型：GGUF、Safetensors

如果要导入的模型保存为二进制 GGUF 文件，则可以通过 Modelfile（自己创建的一个文件）直接将导入到 Ollama，文件内容如下：

FROM /path/to/file.gguf

如果要导入的模型保存为 Safetensors 文件且采用以下架构之一：LlamaForCausalLM、MistralForCausalLM、GemmaForCausalLM，则也可以通过Modelfile直接将其导入到Ollama中，文件内容如下，跟上面其实一样：

FROM /path/to/safetensors/directory

而上文中我们下载的 Qwen2 采用 Qwen2ForCausalLM 的架构，因此只能使用 GGUF 格式的才能直接导入

具体的做法，举个例子：
vim 新建文件 Modelfile，其中的 qwen2-7b-instruct-q4_0.gguf 指明了采用 4bit 量化的版本：

vim Modelfile

FROM /path/to/ollama/models/qwen2-7b-instruct-q4_0.gguf
然后保存这个文件

然后从Modelfile读取模型，创建名为qwen2的模型

ollama create qwen2-instruct -f ./Modelfile

命令行出现如下，表示成功

// 命令行提示以下信息说明模型创建成功
transferring model data 
using existing layer sha256:c188f9260d419ff6b38c4630f19ffd260caed3559506206ba344aceb9c90f90c 
using autodetected template chatml 
creating new layer sha256:50ba761223141488f01a893a1d79e3ebbb54b18debf629b3ff9b50a7816ba6d1 
writing manifest 
success

原文地址：https://blog.csdn.net/zishuijing_dd/article/details/142467458

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：第四届计算机、信息工程与电子材料国际学术会议 (CTIEEM 2024)
下一篇：传统到AI 大数据分析的演变，颠覆智慧水电的未来？

python自动化接口测试
前情阅读，关于自动化接口测试的基础知识介绍，可以阅读如下文章。
阅读更多2024-09-24
vue3＜script setup＞中使用reactive包裹的对象被重新赋值失去响应式原因和解决方式
Object.assign() 方法用于将所有可枚举属性的值从一个或多个源对象复制到目标对象，它会返回目标对象。
阅读更多2024-09-24
数位dp，LeetCode 2376 统计特殊整数
数位dp如何递推求解？
阅读更多2024-09-24
C#开发记录如何建立虚拟串口，进行串口通信，以及通信模板
记录时间;2024年4月记录如何开启虚拟串口以及进行基础串口通信。
阅读更多2024-09-24
【C++掌中宝】深入理解函数重载：概念、规则与应用
函数重载的概念，规则与应用的相关知识分享
阅读更多2024-09-24
[Matplotlib 教程] 如何用3D折线图直观展示多维数据变化
在数据分析中，我们经常需要展示多个维度的数据变化。最近，我用Python的Matplotlib库绘制了一个非常直观的3D折线图，展示了不同维度的数据随时间的变化。这种图不仅能应用在深度学习模型的训练中
阅读更多2024-09-24
解决银河麒麟桌面操作系统V10SP1 SSH连接“connection reset by ip地址 port 22”问题
遇到SSH连接银河麒麟V10SP1时“connection reset by ip地址 port 22”的错误，可以尝试以下步骤解决：
阅读更多2024-09-24
面经 | css
flex:1是felx:1 1 0的简写，是flex-grow:1;flex-basis:0的简写；掌握熟悉上面的一两种写下就行了。父元素是非static元素。
阅读更多2024-09-24
乐鑫ESP8266/安信可 ESP-01sWiFi模块烧录MQTT AT固件
ESP8266/ESP-01s烧录MQTT AT烧录最新的MQTT AT固件到ESP8266-01s模块的原因是，这一固件版本提供了对MQTT协议的原生支持，这使得模块能够直接作为MQTT客户端进行操
阅读更多2024-09-24
C语言 | Leetcode C语言题解之第430题扁平化多级双向链表
C语言 | Leetcode C语言题解之第430题扁平化多级双向链表
阅读更多2024-09-24

【ollama 在linux 上离线部署 本地大模型】

相关文章

【ollama 在linux 上离线部署本地大模型】