华为昇腾910B1基于 LoRA 的 Qwen2.5-7B-Instruct 模型微调

🕗 发布于 2025-01-18 06:06 昇腾 Qwen lora

系统环境

Ascend-hdk-910b-npu-driver_24.1.rc3_linux-aarch64.run
Ascend-hdk-910b-npu-firmware_7.5.0.1.129.run
Ascend-cann-toolkit_8.0.RC3.alpha003_linux-aarch64.run
Ascend-cann-kernels-910b_8.0.RC3.alpha003_linux-aarch64.run

在这里插入图片描述

虚拟环境

默认已安装conda，git

git clone https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory/
conda create -y -n llamafactory python=3.10
conda activate llamafactory
pip install -e ".[torch-npu,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple
pip install -e ".[deepspeed,modelscope]" -i https://pypi.tuna.tsinghua.edu.cn/simple
llamafactory-cli env

在这里插入图片描述

微调模型

export USE_MODELSCOPE_HUB=1
ASCEND_RT_VISIBLE_DEVICES=0,1,2,3,4,5,6,7 llamafactory-cli train examples/train_lora/qwen2__5_lora_sft.yaml

yaml文件

### model
model_name_or_path: qwen/Qwen2.5-7B-Instruct
trust_remote_code: true

### method
stage: sft
do_train: true
finetuning_type: lora
lora_target: q_proj,v_proj

### ddp
ddp_timeout: 180000000
deepspeed: examples/deepspeed/ds_z0_config.json

### dataset
dataset: alpaca_zh_demo
template: qwen
cutoff_len: 2048
max_samples: 1000
overwrite_cache: true
preprocessing_num_workers: 16

### output
output_dir: saves/Qwen2.5-7B-Instruct/lora/sft
logging_steps: 10
save_steps: 1000
plot_loss: true
overwrite_output_dir: true

### train
per_device_train_batch_size: 1
gradient_accumulation_steps: 8
learning_rate: 0.0001
num_train_epochs: 120
lr_scheduler_type: cosine
bf16: true

### eval
val_size: 0.1
per_device_eval_batch_size: 1
evaluation_strategy: steps
eval_steps: 500

training_loss

在这里插入图片描述

training_eval_loss

在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_46398647/article/details/145173058

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：Golang笔记——常用库context和runtime
下一篇：【Linux】Socket编程-TCP构建自己的C++服务器

打家劫舍打家劫舍II 打家劫舍III
如果偷第i房间，那么dp[i] = dp[i - 2] + nums[i] ，即：第i-1房一定是不考虑的，找出下标i-2（包括i-2）以内的房屋，最多可以偷窃的金额为dp[i-2] 加上第i房间偷
阅读更多2025-01-20
vite共享选项之---css.preprocessorOptions
vite共享选项之---css.preprocessorOptions
阅读更多2025-01-20
Linux——线程的慨念及控制
进程是资源分配的基本单位线程是调度的基本单位线程共享进程数据，但也拥有自己的一部分数据:线程ID一组寄存器栈errno信号屏蔽字调度优先级进程的多个线程共享同一地址空间,因此Text Segment
阅读更多2025-01-20
linux 安装Redis
10.redis默认安装路径：/usr/local/bin，将redis配置文件复制到bin目录下（先新建文件夹然后再将redis配置文件coyp进去）之后就是用这个文件启动。11.redis默认不是
阅读更多2025-01-20
架构思考与实践：从通用到场景的转变
在当今复杂多变的商业环境中，企业架构的设计与优化成为了一个关键议题。本文通过一系列随笔，探讨了业务架构的价值、从通用架构到场景架构的转变、恰如其分的架构设计以及如何避免盲目低效等问题。通过对多个实际案
阅读更多2025-01-20
论文速读|ParGo: Bridging Vision-Language with Partial and Global Views.AAAI25
这项工作介绍了ParGo，这是一种新颖的Partial-Globalprojector，旨在连接多模态大型语言模型（MLLM）的视觉和语言模态。与以前依赖基于全局注意力的projector的工作不同，
阅读更多2025-01-20
windows scoop的安装
链接: https://pan.baidu.com/s/1aDxEVms0fojcIb3a8nvRgQ?pwd=ix36 提取码: ix36。那么我们使用管理员方式强制安装，进入下载解压好的scoop
阅读更多2025-01-20
Windows7系统下载安装Source Code Pro字库
SourceCodePro是由Adobe推出的一款专为代码展示和编写设计的开源等宽字体‌。它不仅在编程社区中广受好评，还被广泛应用于各种编辑器环境中，以提升代码的可读性和编程体验‌。
阅读更多2025-01-20
左神算法基础提升--3
依次将数组中的数加入到栈中，如果一个数加入后会破坏其单调性，我们便需要将其弹出，同时使其弹出的数便是从右离这个数最近且比这个数小的数，其在栈中的下个数便是比该数小且左边离该数最近的数。③该点与最右回文
阅读更多2025-01-20
JAVA：解释器模式（Interpreter Pattern）的技术指南
JAVA：解释器模式（InterpreterPattern）的技术指南
阅读更多2025-01-20

华为昇腾910B1基于 LoRA 的 Qwen2.5-7B-Instruct 模型微调

目录

系统环境

虚拟环境

微调模型

yaml文件

training_loss

training_eval_loss

相关文章