llama-factory 系列教程 (七)，Qwen2.5-7B-Instruct 模型微调与vllm部署详细流程实战

🕗 发布于 2024-11-27 02:16 自然语言处理 深度学习

文章目录

介绍

时隔已久的 llama-factory 系列教程更新了。本篇文章是第七篇，之前的六篇，大家酌情选看即可。
因为llama-factory进行了更新，我前面几篇文章的实现部分，都不能直接用了。

我将为大家介绍如何使用 llama-factory Lora 微调模型、部署模型、使用python调用API。

llama-factory 安装

首先建议大家阅读一遍两份不错的文章：

我这篇博客的与他们的不同在于，我按照我做实验的流程，给大家演示一遍。方便大家一看就懂，心里对大致的流程有个大概。

装包

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

LLaMA-Factory 默认是从Huggingface 下载模型，建议大家改为从国内下载模型。

如果您在 Hugging Face 模型和数据集的下载中遇到了问题，可以通过下述方法使用魔搭社区。

export USE_MODELSCOPE_HUB=1
Windows 使用 set USE_MODELSCOPE_HUB=1
将 model_name_or_path 设置为模型 ID 来加载对应的模型。在魔搭社区查看所有可用的模型，例如 LLM-Research/Meta-Llama-3-8B-Instruct。

您也可以通过下述方法，使用魔乐社区下载数据集和模型。

export USE_OPENMIND_HUB=1
Windows 使用 set USE_OPENMIND_HUB=1
将 model_name_or_path 设置为模型 ID 来加载对应的模型。在魔乐社区查看所有可用的模型，例如 TeleAI/TeleChat-7B-pt。

下载模型

我喜欢使用可视化的网站页面下载模型权重。

llamafactory-cli webui

在这里插入图片描述
启动服务之后，进入主机对应的 ip 和端口就可以看到网页。

在这里插入图片描述
在 Model name 下拉框中挑选模型，选中之后，再点击下述的加载模型。如果模型权重没有下载，则会进行下载，然后加载进显存中。在下方就会出现对话框就可以与模型进行对话了。

微调模型

数据集

点击 Train 后，就可以看到当前可用的很多数据集。
在这里插入图片描述

在选中数据集后，点击预览数据集，即可看到数据集的样例。如果我们想微调模型，也需要把数据集的样式给整理成上述格式。
在这里插入图片描述

点击查看关于数据集的说明：https://github.com/hiyouga/LLaMA-Factory/tree/v0.9.1/data

大家仿照 alpaca_zh_demo.json 的样式准备好数据集，然后在 dataset_info.json完成数据集的注册。

注册数据集，下图是我在dataset_info.json注册的guihua_ner数据集，然后就可以找到该数据集，并训练模型：
在这里插入图片描述

训练模型

可以直接点击可视化界面的 Start 按钮训练模型。也可点击预览命令查看在终端运行的命令。

我一般不使用可视化窗口训练模型。我喜欢直接运行训练模型的命令
在这里插入图片描述

llamafactory-cli train \
    --stage sft \
    --do_train True \
    --model_name_or_path qwen/Qwen2.5-7B-Instruct \
    --preprocessing_num_workers 16 \
    --finetuning_type lora \
    --template qwen \
    --flash_attn auto \
    --dataset_dir data \
    --dataset alpaca_zh_demo \
    --cutoff_len 2048 \
    --learning_rate 5e-05 \
    --num_train_epochs 3.0 \
    --max_samples 100000 \
    --per_device_train_batch_size 2 \
    --gradient_accumulation_steps 8 \
    --lr_scheduler_type cosine \
    --max_grad_norm 1.0 \
    --logging_steps 5 \
    --save_steps 100 \
    --warmup_steps 0 \
    --packing False \
    --report_to none \
    --output_dir saves/Qwen2.5-7B-Instruct/lora/train_2024-11-25-09-56-29 \
    --bf16 True \
    --plot_loss True \
    --ddp_timeout 180000000 \
    --optim adamw_torch \
    --lora_rank 8 \
    --lora_alpha 16 \
    --lora_dropout 0 \
    --lora_target all

除了使用上述的命令行方式训练模型外，llama-factory还提供了使用 yaml 文件训练模型的方式。
在 example 文件夹下可看到很多训练和推理的 yaml 文件，针对其中的参数就行修改，即可使用。
在这里插入图片描述

我以微调 qwen/Qwen2.5-7B-Instruct 为例：

qwen2.5-7B-ner.yaml 文件内容：

### model
model_name_or_path: qwen/Qwen2.5-7B-Instruct

### method
stage: sft
do_train: true
finetuning_type: lora
lora_target: all

### dataset
dataset: guihua_ner
template: qwen
cutoff_len: 2048
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16

### output
output_dir: saves/qwen2.5-7B/ner_epoch5
logging_steps: 10
save_steps: 500
plot_loss: true
overwrite_output_dir: true

### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 1.0e-4
num_train_epochs: 5.0
lr_scheduler_type: cosine
warmup_ratio: 0.1
bf16: true
ddp_timeout: 180000000

### eval
val_size: 0.1
per_device_eval_batch_size: 1
eval_strategy: steps
eval_steps: 500

在 llamafactory-cli train 后，填入 yaml 文件的路径：

llamafactory-cli train config/qwen2.5-7B-ner.yaml

然后就会开始训练模型，最终训练完成的模型保存在 output_dir: saves/qwen2.5-7B/ner_epoch5。

在输出文件夹路径中，可以找到训练过程的损失值变化图片。
在这里插入图片描述

微调后的模型推理

在完成模型的微调后，测试一下模型的微调效果。对于微调模型推理，除原始模型和模板外，还需要指定适配器路径 adapter_name_or_path 和微调类型 finetuning_type。

lora_vllm.yaml 的文件内容如下：

model_name_or_path: qwen/Qwen2.5-7B-Instruct
adapter_name_or_path: ../saves/qwen2.5-7B/ner_epoch5
template: qwen
finetuning_type: lora
infer_backend: vllm
vllm_enforce_eager: true

运行下述命令，就可以看到下图的对话窗口：

llamafactory-cli webchat lora_vllm.yaml

在这里插入图片描述

根据上图命名实体识别的输出，可以发现微调模型确实有效果。

除了网页聊天的部署之外，还可通过下述多种方式进行部署:

# llamafactory-cli chat xxx.yaml
# llamafactory-cli webchat xxx.yaml
# API_PORT=8000 llamafactory-cli api xxx.yaml

原文地址：https://blog.csdn.net/sjxgghg/article/details/144016723

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：【C语言】前端项目故障处理。
下一篇：【整理】自执行函数

第八章 Spring Boot快速⼊⻔ —— Spring Boot整合thymeleaf模板引擎
Thymeleaf 是一个现代服务器端的 Java 模板引擎，用于Web环境以及非Web环境。它能够处理HTML、XML、JavaScript、CSS甚至纯文本。Thymeleaf的主要目标是提供一种
阅读更多2024-11-27
PostgreSQL外键全解析：从概念到实践的进阶指南
在数据库设计中，外键就像一位严格的“秩序管理员”，它不仅把各个表之间的关系管理得井井有条，还负责保障数据的完整性。PostgreSQL作为开源数据库中的佼佼者，自然也为我们提供了灵活强大的外键约束机制
阅读更多2024-11-27
C语言数据结构——详细讲解《栈》
在 C 语言编程中，数据结构是非常重要的一部分，它能够帮助我们更高效地组织和处理数据。今天，我们就来详细讲解一下其中的栈数据结构。栈的结构通常由一个数组或链表来实现。在数组实现中，栈顶通常由一个变量来
阅读更多2024-11-27
【设计模式】【行为型模式（Behavioral Patterns）】之命令模式（Command Pattern）
命令模式是一种行为设计模式，它将请求封装成对象，从而使你可以用不同的请求对客户进行参数化、队列请求或将请求日志化，同时支持可撤销的操作。通过这种方式，可以将请求发送者与接收者解耦，使得两者之间不再直接
阅读更多2024-11-27
Docker 部署 MongoDB
本文档详细介绍了使用 Docker 部署 MongoDB 的步骤。包括从 Docker Hub 拉取 MongoDB 镜像、准备运行环境、配置 MongoDB 参数、启动容器、创建用户以及进行连接测试
阅读更多2024-11-27
03：（手撸HAL+CubeMX）串口UART篇一
然后CPU就会进入if语句里面去执行关闭串口接收中断。然后执行全部接收完成回调函数。若此时串口的DR还有数据，CPU也不会在进行将DR中的数据搬运到数组里了。
阅读更多2024-11-27
如何使用轻易云平台实现百胜ME3销售退货对接金蝶云星空
本次集成方案名为“百胜ME3销售退货对接金蝶销售退货”，旨在通过API接口实现百胜ME3中的销售退货数据自动抓取，并批量写入到金蝶云星空中。具体涉及的API包括百胜ME3的用于获取数据，以及金蝶云星空
阅读更多2024-11-27
服务器数据恢复—光纤存储FC硬盘数据恢复案例
服务器存储数据恢复环境：某品牌光纤存储上共有16块FC硬盘。存储上的卷映射到Linux操作系统上。Linux操作系统上运行Oracle数据库。服务器存储故障&检测：存储上2块硬盘故障灯亮起，存
阅读更多2024-11-27
jQuery-Json-AJAX-跨域
用于简化JavaScript代码开发主要作用：对于前端来说，写更少代码、做更多事情选择器事件及其事件绑定内置效果显示、隐藏、切换、动画等DOM操作1、获取元素的内容二、JSON1.简介作用：案例：
阅读更多2024-11-27
ubuntu安装conda
安装完成后，您可以创建新的 Conda 环境并安装您需要的 Python 版本或其他包。选择安装路径（默认安装路径是 $HOME/miniconda3，您可以按 Enter 使用默认路径，也可以选择其
阅读更多2024-11-27