在colab中微调-合并-量化-导入本地一条龙——仅作参考

🕗 发布于 2024-11-10 23:40 语言模型

引言

本文参考：

推荐视频：

5分钟学会微调大模型Qwen2_哔哩哔哩_bilibili

1.基本使用：

大模型学习-使用colab进行大模型训练_谷歌大模型训练-CSDN博客

2.修改模型：

大模型学习-在colab中训练并更换模型-CSDN博客

看不懂请先看看上面两篇文章，或者看看推荐视频，本文仅作参考

一、准备

1.上传文件

前提，在我的云端硬盘创建文件夹colab，然后上传两个压缩文件，分别是

just_train.zip：用于微调的环境

Qwen2.5-1.5B-Instruct.zip：微调时用于切换的模型

2.配置colab

新建colab，修改笔记本设置，然后连接

二、解压上传

1.解压

挂载云盘

import os
from google.colab import drive
drive.mount('/content/drive')

进入colab目录

%cd /content/drive/MyDrive/colab

解压just_train.zip：大概12分钟左右

!unzip just_train.zip

解压替换模型到model：一分半左右

!unzip Qwen2.5-1.5B-Instruct.zip -d just_train/model

2.清理空间

分别执行下面三个命令：删除压缩文件、原模型文件。最好返回网盘看一下，有时候网盘反应非常慢，需要再手动删除、清理空间

import os
# 删除train_data.json 文件
os.remove("just_train.zip")

# 删除原模型文件
!rm -r /content/drive/MyDrive/colab/just_train/model/Qwen2-0.5B-Instruct

import os
# 删除Qwen2.5-1.5B-Instruct.zip 文件
os.remove("Qwen2.5-1.5B-Instruct.zip")

3.修改数据集

进入just_train并验证

%cd just_train
!pwd

上传数据集

from google.colab import files
 
uploaded = files.upload()

删除默认的数据集

import os
# 删除train_data.json 文件
os.remove("train_data.json")

将上传数据集命名为默认数据集名

import os
 
# 重命名文件
os.rename("总训练集.json", "train_data.json")

三、微调

1.修改训练文件

在文件中找到train.py，双击打开

修改模型

修改训练参数

添加量化代码

model.save_pretrained_gguf("model", tokenizer,)

2.开始微调

执行命令，开始微调-合并-量化：大约两个半小时

微调后会自动合并，然后自动下载llama.cpp进行量化

!./train.sh

四、在本地运行

1.下载gguf文件

完成后根据返回的路径，找到gguf文件，右键下载即可

2.导入ollama

下载完成后，移动到自己保存模型的位置，在同一个目录下新建txt文件，写入下面的内容，修改模型名字，保存退出，重命名为Modelfile，注意，没有后缀

FROM ./your-model-path.gguf

在该目录的空白位置，右键-在终端中打开，输入下面的代码，回车。完成后查看

# 注意修改模型名字model-name
ollama create model-name -f Modelfile

Ollama list

3.运行模型

ollama run GenshinQA:latest

原文地址：https://blog.csdn.net/weixin_74825941/article/details/143656195

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：服务器被攻击排查记录
下一篇：【大模型】Spring AI Alibaba 对接百炼平台大模型使用详解

MinIo在Ubantu和Java中的整合
方法抛出的各种异常进行了捕获，然后打印了异常信息，目前这种处理逻辑，无论Minio是否发生异常，前端在上传文件时，总是会受到成功的响应信息。会处理所有Controller方法抛出的异常，因此Contr
阅读更多2024-11-15
HTTP基础
当浏览者访问一个网页时，浏览者的浏览器会向网页所在服务器发出请求。当浏览器接收并显示网页前，此网页所在的服务器会返回一个包含HTTP状态码的信息头（server header）用以响应浏览器的请求。H
阅读更多2024-11-15
linux phy mdio 读取工具
【代码】linux phy mdio 读取工具。
阅读更多2024-11-15
sql文件
sql文件通常包含SQL语句，用于数据库的创建、修改和数据操作。根据内容的不同，.sql文件的使用方式也有所不同。
阅读更多2024-11-15
MongoDB创建只读用户并授权指定集合的查询权限
创建一个自定义角色，只允许在。集合上执行查询操作。
阅读更多2024-11-15
#渗透测试#SRC漏洞挖掘#云技术基础03之容器相关
Podman是Docker的替代产品，它无守护进程。在运行容器时，若不加sudo启动可能会报错，因为默认禁止侦听1024以下端口，例如运行httpd容器可以使用命令。Kubernetes，通常简称为K
阅读更多2024-11-15
Linux权限和开发工具(3)
我们在做项目的时候可能会遇到对自己的修改不满意,想要回到上一个版本时候,就需要对自己完成一个阶段,对当前阶段进行备份,就方便我们后续进行版本回退了。后的程序可以执行但是文件也会大一些,让生成的程序带上
阅读更多2024-11-15
C++ 编程基础（5）类与对象 | 5.8、面向对象五大原则
在软件开发领域，面向对象编程（OOP）是一种重要的编程范式，它通过封装、继承和多态等特性，提高了代码的可重用性、灵活性和可维护性。C++作为一种强大的面向对象编程语言，充分体现了这些原则。在面向对象的
阅读更多2024-11-15
Tailwind 安装使用
Tailwind 安装使用
阅读更多2024-11-15
JavaScript中的二叉树排序你了解吗？
在计算机科学中，二叉树是一种常见的数据结构，用于存储和组织数据。二叉树排序（Binary Tree Sort）是一种基于二叉搜索树的排序算法。它的基本思想是将待排序的元素插入到二叉搜索树中，然后通过中
阅读更多2024-11-15