基于LLaMA完成第一个微调

🕗 发布于 2024-11-26 15:32 自然语言处理 深度学习 人工智能 大模型技术 llama

一、LLaMA Factory 简介

LLaMA Factory 是一个简单易用且高效的大型语言模型（Large Language Model）训练与微调平台。通过 LLaMA Factory，可以在无需编写任何代码的前提下，在本地完成上百种预训练模型的微调。

# LLaMA Factory 访问地址
https://github.com/hiyouga/LLaMA-Factory/blob/main/README_zh.md

二、LLaMA Factory 搭建

1、下载工程代码

git clone https://github.com/hiyouga/LLaMA-Factory.git

2、创建Conda 环境

# 本机需要提前安装号conda 或者miniconda的环境
# 官方是以python=3.10为基础搭建
conda create -n llama_factory python=3.10
conda activate llama_factory

3、安装LLaMA

# 安装LLaMA-Factory 所需要的第三方基础库（requirements.txt包含的库）
# 安装评估指标所需要的库，包含nltk, jieba, rouge-chinese
# 安装LLaMA-Factory本身，然后在系统中生成一个命令 llamafactory-cli
cd LLaMA-Factory
pip install -e '.[torch,metrics]'

备注，当使用清华源安装时候，默认会安装成torch的cpu版本。本文提供另外的两种方式进行搭建。

# 方案一：
# 在清华源镜像里找到对应的安装包
# https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/linux-64/
pytorch-2.2.2-py3.10_cuda11.8_cudnn8_0.tar.bz2
torchaudio-2.2.2-py310_cu118.tar.bz2
torchvision-0.18.0-py310_cu118.tar.bz2

# 安装
conda install --offline {your_path}.tar.bz2

# 方案二：
# 根据自己nvidia-smi的cuda版本去pytorch官网找对应的下载指令
# https://pytorch.org/get-started/previous-versions/
conda install pytorch==2.2.2 torchvision==0.17.2 torchaudio==2.2.2 pytorch-cuda=11.8 -c pytorch -c nvidia

# 安装完pytorch后，需要匹配Pillow 版本
pip uninstall Pillow
pip install Pillow==11.0.0

# 把环境搭建好以后，最后在执行
cd LLaMA-Factory
pip install -e '.[torch,metrics]'

4、环境验证
pytorch 的环境验证

import torch
torch.cuda.current_device()
torch.cuda.get_device_name(0)
torch.__version__

LLaMA 的环境验证

llamafactory-cli train -h

三、模型推理
1、下载本地模型

# 推荐使用huggingface、modelscope 下载模型
# 以modelscope 为例（不推荐git）
from modelscope import snapshot_download
model_dir = snapshot_download('LLM-Research/Meta-Llama-3-8B-Instruct')

2、使用LLaMA自带的ChatBot推理页面, 帮助做模型效果的测试

# 方法一：
# CUDA_VISIBLE_DEVICES=0 是指定程序使用第0张卡，可以不加
CUDA_VISIBLE_DEVICES=0 llamafactory-cli webchat 
--model_name_or_path ./model/Meta-Llama-3-8B-Instruct  
--template llama3

# 方法二：
# 修改examples/inference/llama3.yaml 文件model_name_or_path
llamafactory-cli webchat examples/inference/llama3.yaml

# 访问地址
http://localhost:7860/

3、使用API的方式启动模型

# api的方式启动，方便Fastgpt 等应用的接入
# 端口号在api.py中设置
python src/api.py --model_name_or_path model/Meta-Llama-3-8B-Instruct --template llama3

# 服务的方式启动
nohup bash -c "python src/api.py --model_name_or_path model/Meta-Llama-3-8B-Instruct --template llama3" > logs/output_llama3.log 2>&1 &

四、模型微调

1、修改数据集样本

# 以官方提供的identity.json 数据集为例
sed -i 's/{{name}}/PonyBot/g'  data/identity.json 
sed -i 's/{{author}}/LLaMA Factory/g'  data/identity.json

2、基于LoRA的sft指令微调

CUDA_VISIBLE_DEVICES=0 llamafactory-cli train \
    --stage sft \
    --do_train \
    --model_name_or_path ./model/Meta-Llama-3-8B-Instruct \
    --dataset alpaca_zh_demo,identity \
    --dataset_dir ./data \
    --template llama3 \
    --finetuning_type lora \
    --output_dir ./saves/LLaMA3-8B/lora/sft \
    --overwrite_cache \
    --overwrite_output_dir \
    --cutoff_len 1024 \
    --preprocessing_num_workers 16 \
    --per_device_train_batch_size 2 \
    --per_device_eval_batch_size 1 \
    --gradient_accumulation_steps 8 \
    --lr_scheduler_type cosine \
    --logging_steps 50 \
    --warmup_steps 20 \
    --save_steps 100 \
    --eval_steps 50 \
    --evaluation_strategy steps \
    --load_best_model_at_end \
    --learning_rate 5e-5 \
    --num_train_epochs 5.0 \
    --max_samples 1000 \
    --val_size 0.1 \
    --plot_loss \
    --fp16

3、通过ChatBot推理页面验证效果

llamafactory-cli webchat  --model_name_or_path ./model/Meta-Llama-3-8B-Instruct  
--adapter_name_or_path ./saves/LLaMA3-8B/lora/sft  
--template llama3  
--finetuning_type lora

如何学习AI大模型？

作为一名热心肠的互联网老兵，我决定把宝贵的AI知识分享给大家。至于能学习到多少就看你的学习毅力和能力了。我已将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

这份完整版的大模型 AI 学习资料已经上传CSDN，朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、全套AGI大模型学习路线

AI大模型时代的学习之旅：从基础到前沿，掌握人工智能的核心技能！

二、640套AI大模型报告合集

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。

三、AI大模型经典PDF籍

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。

四、AI大模型商业化落地方案

作为普通人，入局大模型时代需要持续学习和实践，不断提高自己的技能和认知水平，同时也需要有责任感和伦理意识，为人工智能的健康发展贡献力量。

原文地址：https://blog.csdn.net/python1234567_/article/details/144023772

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：八股文-基础知识-面试题汇总（一）
下一篇：如何在 PyTorch 分布式训练中使用 TORCH_DISTRIBUTED_DEBUG=INFO 进行调试

第八章 Spring Boot快速⼊⻔ —— Spring Boot整合thymeleaf模板引擎
Thymeleaf 是一个现代服务器端的 Java 模板引擎，用于Web环境以及非Web环境。它能够处理HTML、XML、JavaScript、CSS甚至纯文本。Thymeleaf的主要目标是提供一种
阅读更多2024-11-27
PostgreSQL外键全解析：从概念到实践的进阶指南
在数据库设计中，外键就像一位严格的“秩序管理员”，它不仅把各个表之间的关系管理得井井有条，还负责保障数据的完整性。PostgreSQL作为开源数据库中的佼佼者，自然也为我们提供了灵活强大的外键约束机制
阅读更多2024-11-27
C语言数据结构——详细讲解《栈》
在 C 语言编程中，数据结构是非常重要的一部分，它能够帮助我们更高效地组织和处理数据。今天，我们就来详细讲解一下其中的栈数据结构。栈的结构通常由一个数组或链表来实现。在数组实现中，栈顶通常由一个变量来
阅读更多2024-11-27
【设计模式】【行为型模式（Behavioral Patterns）】之命令模式（Command Pattern）
命令模式是一种行为设计模式，它将请求封装成对象，从而使你可以用不同的请求对客户进行参数化、队列请求或将请求日志化，同时支持可撤销的操作。通过这种方式，可以将请求发送者与接收者解耦，使得两者之间不再直接
阅读更多2024-11-27
Docker 部署 MongoDB
本文档详细介绍了使用 Docker 部署 MongoDB 的步骤。包括从 Docker Hub 拉取 MongoDB 镜像、准备运行环境、配置 MongoDB 参数、启动容器、创建用户以及进行连接测试
阅读更多2024-11-27
03：（手撸HAL+CubeMX）串口UART篇一
然后CPU就会进入if语句里面去执行关闭串口接收中断。然后执行全部接收完成回调函数。若此时串口的DR还有数据，CPU也不会在进行将DR中的数据搬运到数组里了。
阅读更多2024-11-27
如何使用轻易云平台实现百胜ME3销售退货对接金蝶云星空
本次集成方案名为“百胜ME3销售退货对接金蝶销售退货”，旨在通过API接口实现百胜ME3中的销售退货数据自动抓取，并批量写入到金蝶云星空中。具体涉及的API包括百胜ME3的用于获取数据，以及金蝶云星空
阅读更多2024-11-27
服务器数据恢复—光纤存储FC硬盘数据恢复案例
服务器存储数据恢复环境：某品牌光纤存储上共有16块FC硬盘。存储上的卷映射到Linux操作系统上。Linux操作系统上运行Oracle数据库。服务器存储故障&检测：存储上2块硬盘故障灯亮起，存
阅读更多2024-11-27
jQuery-Json-AJAX-跨域
用于简化JavaScript代码开发主要作用：对于前端来说，写更少代码、做更多事情选择器事件及其事件绑定内置效果显示、隐藏、切换、动画等DOM操作1、获取元素的内容二、JSON1.简介作用：案例：
阅读更多2024-11-27
ubuntu安装conda
安装完成后，您可以创建新的 Conda 环境并安装您需要的 Python 版本或其他包。选择安装路径（默认安装路径是 $HOME/miniconda3，您可以按 Enter 使用默认路径，也可以选择其
阅读更多2024-11-27