初识AI大模型，ollama使用，llama factory大模型微调，lama.cpp模型转换guff

🕗 发布于 2024-11-08 07:02 人工智能 llama

　　最近了解了下生成式AI对话，下面是自己的一些尝试记录。

ollama 安装及使用

　　1、安装

　　我是在windows环境下安装的，很简单，访问：https://ollama.com/ ，下载windows安装包，打开安装就行了。

　　cmd输入ollama -v检验是否安装成功。

　　2、配置

　　在环境变量的用户变量中加入如下几个：

　　OLLAMA_HOST ollma服务启动的端口。

　　OLLAMA_MODELS 模型下载保存的位置。

　　OLLAMA_ORIGINS 绑定访问的ip。这里*号就是整个局域网都可以访问。

　　3、使用

　　下面是api的调用，model就是要使用的模型名字，prompt就是输入指令。ollama提供很多接口，有兴趣查官网查查询。

　　接下来说下常见的命令行指令

　　ollama list 查询已安装的模型。

ollama run xxx 启动模型，如果模型没安装会自动下载，模型下载地址：library (ollama.com)

　　ollama rm xx 删除已安装的模型

llama factory 使用

　 1、下载

　访问 GitHub - hiyouga/LLaMA-Factory: Unified Efficient Fine-Tuning of 100+ LLMs (ACL 2024) 下载源码，当然也可以通过docker等方式，我这里使用源码启动。请保证本地有python环境。

下载解压后在项目目录执行如下命令：

pip install -e ".[torch,metrics]"

2、启动

执行 llamafactory-cli webui。会自动打开浏览器，就进入了微调训练的web界面。

　　3、训练数据集准备

　　在data目录下新建一个自定义文件，格式参考identity.json，这里的训练数据非常重要，在最近的学习中了解到数据会影响后续的训练结果，并且这个数据阶段还有很重要的岗位。

　　自定义数据准备好后，在dataset_info.json文件中增加对应的描述，还是参考identity部分的数据。

　　4、模型微调训练

　　在web界面选择训练的基座模型，因为我电脑没有显卡，这里选择的最小的通义千问1.5版本的0.5B模型。然后训练方式选择lora模型，数据集选择你新增的数据。点击开始训练就可以开始了。

　　我这里训练了50个数据参数，因为没有显卡的原因，所以很慢。

模型合并

　　微调训练完成后，在目录的saves文件夹下就有你训练的结果，以基座模型/自定义的输出目录命名。因为我们使用的lora方式训练，需要把基座模型和我们训练的结果合并。至于啥是lora模式，感兴趣的可以网上搜下。

　　在examples/merge_lora目录下新建自己的yaml配置文件。

　　model_name_or_path 基座模型地址，如果不知道去哪里下，搜索魔塔社区。

　　adapter_name_or_path 微调训练模型地址，就是上面说的训练输出的目录。

　　export_dir　　合并后导出的目录。

　文件创建后，在项目目录执行如下命令合并。

　　llamafactory-cli export examples/merge_lora/myqwen_merge.yaml

模型转换

　　1、编写配置文件

　　在合并后导出的目录新建一个Modelfile文件，注意没有文件格式，文件内容：FROM E:\LLaMA-Factory-main\merge_mode_lora\myqwen\my_qwen.gguf

　　2、llama.cpp下载

　　下载地址：GitHub - ggerganov/llama.cpp: LLM inference in C/C++

　　解压后cmd进入目录，执行：

　　python convert_lora_to_gguf.py E:\LLaMA-Factory-main\merge_mode_lora\myqwen --outtype f16 --vocab-type bpe --outfile E:\LLaMA-Factory-main\merge_mode_lora\myqwen\my_qwen.gguf

　　E:\LLaMA-Factory-main\merge_mode_lora\myqwen 就是合并的模型目录，E:\LLaMA-Factory-main\merge_mode_lora\myqwen\my_qwen.gguf就是模型转换的路径和模型名称。

导入模型

　　cmd进入模型转换的输出目录，执行 ollama create my_qwen -f Modelfile 开始导入模型。

　　然后使用ollama list查看是否导入成功，使用ollama run my_qwen 就可以使用我们新的模型了。

　　总得来说，有很多包都需要自己想办法，不然要么就下载很慢，要么根据就不能下载。想要自己的微调模型在垂直领域的问答有一定效果，首先得要硬件支持，其次得要海量的有效数据支持，目前我这两都达不到，就当学习了。

原文地址：https://blog.csdn.net/u013811335/article/details/143583517

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：利用字符串的方法，验证用户名长度必须为2~6为，不能包含敏感词“word”含大小写。
下一篇：vscode翻译插件

「C/C++」C/C++ 之变量作用域详解
在C++编程中，变量作用域（Variable Scope）是一个非常重要的概念，它决定了变量在程序中的可见性和生命周期。本文将详细介绍C++中的变量作用域，包括全局作用域、局部作用域、块作用域和文件作
阅读更多2024-11-08
Pytorch学习--神经网络--现有网络模型的使用及修改
Pytorch学习--神经网络--现有网络模型的使用及修改
阅读更多2024-11-08
navicat pg库安装mysql fdw 外表扩展
在Windows上手动安装mysql_fdw（MySQL Foreign Data Wrapper）通常涉及一系列步骤，包括下载源码、编译、配置和测试。
阅读更多2024-11-08
笔记整理—linux驱动开发部分（9）framebuffer驱动框架
整理一下学习的内容，个人观点可能存在错误。本章介绍了什么是framebuffer驱动框架，依x210的显示器驱动来介绍相关框架的使用方法，并详细对probe函数进行分析。并介绍了一些相关使用到的技术，
阅读更多2024-11-08
AutoOps 使每个 Elasticsearch 部署都更易于管理
AutoOps for Elasticsearch 通过性能建议、资源利用率和成本洞察、实时问题检测和解决路径显著简化了集群管理。虽然 Elasticsearch 是一款功能强大且可扩展的搜索引擎，可
阅读更多2024-11-08
Elasticsearch可视化工具Elasticvue插件用法
Elasticsearch可视化工具Elasticvue插件用法
阅读更多2024-11-08
爬虫学习6
5. **解析：** JSONP不需要解析，因为它通过JavaScript执行回调函数来传递数据，而JSON需要在客户端使用JSON解析函数（如`JSON.parse()`）来解析成对象。3. **格
阅读更多2024-11-08
EL表达式和JSTL表达式（详解）
3. varStatus 属性：可选属性，用于指定一个变量名，该变量将保存当前迭代的状态信息，包括索引、计数等。它可以用于各种类型的值，包括字符串、集合、数组和对象等。可以是 List、Set、Map
阅读更多2024-11-08
[HarmonyOS]鸿蒙普通搜索（只是静态的待优化中，无接口无法获取数据）
// 创建一个搜索组件，设置占位符和初始值Search({ placeholder: '商品关键字...', value: $$this.keyword }) // 配置搜索图标，包括图标资源和颜色
阅读更多2024-11-08
django Forbidden (403)错误解决方法
在form表单中加{% csrf_token %}django提交请求时，报403错误；
阅读更多2024-11-08

初识AI大模型，ollama使用，llama factory大模型微调，lama.cpp模型转换guff

相关文章