自学内容网 自学内容网

在colab中微调-合并-量化-导入本地一条龙——仅作参考

引言

本文参考:

推荐视频:

5分钟学会微调大模型Qwen2_哔哩哔哩_bilibili

1.基本使用:

大模型学习-使用colab进行大模型训练_谷歌大模型训练-CSDN博客

2.修改模型:

大模型学习-在colab中训练并更换模型-CSDN博客

看不懂请先看看上面两篇文章,或者看看推荐视频,本文仅作参考

一、准备

1.上传文件

前提,在我的云端硬盘创建文件夹colab,然后上传两个压缩文件,分别是

        just_train.zip:用于微调的环境

        Qwen2.5-1.5B-Instruct.zip:微调时用于切换的模型

2.配置colab

新建colab,修改笔记本设置,然后连接

二、解压上传

1.解压

挂载云盘

import os
from google.colab import drive
drive.mount('/content/drive')

进入colab目录

%cd /content/drive/MyDrive/colab

解压just_train.zip:大概12分钟左右

!unzip just_train.zip

解压替换模型到model:一分半左右

!unzip Qwen2.5-1.5B-Instruct.zip -d just_train/model

2.清理空间

分别执行下面三个命令:删除压缩文件、原模型文件。最好返回网盘看一下,有时候网盘反应非常慢,需要再手动删除、清理空间

import os
# 删除train_data.json 文件
os.remove("just_train.zip")

# 删除原模型文件
!rm -r /content/drive/MyDrive/colab/just_train/model/Qwen2-0.5B-Instruct

import os
# 删除Qwen2.5-1.5B-Instruct.zip 文件
os.remove("Qwen2.5-1.5B-Instruct.zip")

3.修改数据集

进入just_train并验证

%cd just_train
!pwd

上传数据集 

from google.colab import files
 
uploaded = files.upload()

删除默认的数据集

import os
# 删除train_data.json 文件
os.remove("train_data.json")

将上传数据集命名为默认数据集名

import os
 
# 重命名文件
os.rename("总训练集.json", "train_data.json")

三、微调

1.修改训练文件

在文件中找到train.py,双击打开

修改模型

修改训练参数

添加量化代码

model.save_pretrained_gguf("model", tokenizer,)

2.开始微调

执行命令,开始微调-合并-量化:大约两个半小时

微调后会自动合并,然后自动下载llama.cpp进行量化

!./train.sh

四、在本地运行

1.下载gguf文件

完成后根据返回的路径,找到gguf文件,右键下载即可

2.导入ollama

下载完成后,移动到自己保存模型的位置,在同一个目录下新建txt文件,写入下面的内容,修改模型名字,保存退出,重命名为Modelfile,注意,没有后缀

FROM ./your-model-path.gguf 

在该目录的空白位置,右键-在终端中打开,输入下面的代码,回车。完成后查看

# 注意修改模型名字model-name
ollama create model-name -f Modelfile
Ollama list

3.运行模型

ollama run GenshinQA:latest

原文地址:https://blog.csdn.net/weixin_74825941/article/details/143656195

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!