使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调

🕗 发布于 2024-07-25 06:46 llama

文章目录

模型及数据：
- 模型下载
- 数据
LLaMA-Factory启动
- 拉取代码
- 启动webui
模型训练
过程观察
加载模型、对话
模型导出、再次加载

模型及数据：

模型下载

使用基于中文数据训练过的 LLaMA3 8B 模型：
Llama3-8B-Chinese-Chat： https://huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat

可使用命令行下载

pip install -U huggingface_hub #设置加速


export HF_ENDPOINT=https://hf-mirror.com

huggingface-cli download --resume-download shenzhi-wang/Llama3-8B-Chinese-Chat --local-dir /root/autodl-tmp/models/Llama3-8B-Chinese-Chat

数据

COIG-CQIA数据集小红书部分: https://huggingface.co/datasets/m-a-p/COIG-CQIA/tree/main/xhs
identity.json： https://github.com/echonoshy/cgft-llm/blob/master/llama-factory/data/identity.json

对小红书部分做了处理：Python：jsonl文件转json文件，并做字段处理-CSDN博客

最终所用数据：
https://github.com/towenzhi/quick-start-llm/tree/main/LLaMA-Factory/data

LLaMA-Factory启动

Github：https://github.com/hiyouga/LLaMA-Factory

LLaMA-Factory同时提供了命令行和可视化页面两种使用方式，可以不急着训练，先启动页面看看所需参数以便了解。

拉取代码

git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
pip install -e ".[torch,metrics]"

可选的额外依赖项: torch, torch-npu, metrics, deepspeed, bitsandbytes, hqq, eetq, gptq, awq, aqlm, vllm, galore, badam, qwen, modelscope, quality
这些依赖项可以等启动后再根据训练配置选装。

启动webui

在拉取到的目录下运行：

llamafactory-cli webui

启动后便可通过本机的7860端口打开面板http://localhost:7860（若是远程GPU服务器，需要使用公网访问或ssh隧道代理到本地才行）。
在这里插入图片描述

模型训练

数据导入

已经将训练数据COIG-CQIA_xhs.json、identity.json放至/root/autodl-tmp/data目录下。

接下来通过修改LLaMA-Factory项目下的/data/dataset_info.json文件，来指定训练数据位置。

在该文件中新增如下内容，有关字段的解释可看
https://github.com/hiyouga/LLaMA-Factory/blob/main/data/README_zh.md

 "COIG-CQIA_xhs": {
    "file_name": "/root/autodl-tmp/data/COIG-CQIA_xhs.json",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  },
  "identity": {
    "file_name": "/root/autodl-tmp/data/identity.json",
    "columns": {
      "prompt": "instruction",
      "query": "input",
      "response": "output"
    }
  }

在这里插入图片描述

数据预览

若数据导入操作正确，则在面板中刷新数据集即可看到刚才新增的两个数据集选项。
在这里插入图片描述

并可点击预览查看。
在这里插入图片描述

并选中新增的两个数据集。
在这里插入图片描述

设置模型路径

开始时已经模型下载到/root/autodl-tmp/models/Llama3-8B-Chinese-Chat目录，在上方选择对应模型并填入路径即可。
在这里插入图片描述

配置参数及参数的保存

设置完上述内容后即可作参数设置，并可以预览参数命令。
在这里插入图片描述

在这里插入图片描述

开始训练

在这里插入图片描述

过程观察

训练过程中可以观察在运行LLaMA-Factory终端的日志、损失图、以及系统资源占用情况。

在这里插入图片描述

可以安装apt install nvitop观察GPU更方便。

在这里插入图片描述

加载模型、对话

待显示“训练完毕后”即可加载模型，使用对话观察效果。
在这里插入图片描述

在“检查点路径”处填写训练时设置的保存路径，然后在“chat”菜单中加载模型即可。
在这里插入图片描述

训练前：
在这里插入图片描述

训练后：
在这里插入图片描述

模型导出、再次加载

在“检查点路径”处填写训练时设置的保存路径，设置各项导出参数路径。
在这里插入图片描述

导出后的目录内容：
在这里插入图片描述

加载使用：
导出完毕后可以单独加载该模型对话，观察效果。
在这里插入图片描述

原文地址：https://blog.csdn.net/weixin_52341477/article/details/140669948

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

上一篇：学习笔记6：docker swarm
下一篇：Meta 刚刚发布 Llama 3.1 ：在 AI 战斗中向 OpenAI 发起了大规模挑战｜TodayAI

excel如何快速选中某个数字或者某串数字
鼠标光标放在某个数字或者某串数字的末尾，进行双击鼠标左键即可（就会选中当前鼠标光标前相邻的所有数字）：
阅读更多2024-09-17
面试官问：请描述一次你成功解决问题的经历？
面试官为什么要这么问？面试官问你描述一次成功解决问题的经历，主要是为了评估你的几个关键方面：问题解决能力：了解你在面对挑战时的思维方式和应对策略。决策能力：考察你在压力下做出明智决定的能力。沟通技巧：
阅读更多2024-09-17
VLMEvalKit 评测实践:InternVL2 VS Qwen2VL
多模态技术的突破，正在改变我们理解和交互世界的方式。无论是强大的感知能力、复杂的推理分析，还是图文融合的创新应用，InternVL2 与 Qwen2-VL 展现了大模型的无限可能。
阅读更多2024-09-17
mybatis开启日志
步骤很详细，直接上教程……
阅读更多2024-09-17
MySQL——数据库的高级操作（一）数据备份与还原（1）数据的备份
MySQL——数据库的高级操作（一）数据备份与还原（1）数据的备份
阅读更多2024-09-17
Blender渲染太慢怎么办？blender云渲染已开启
此次，渲染101云渲染农场正式加入了对Blender的全面支持，涵盖Blender的所有版本，不论是较新的Blender 4.0还是早期版本，都可轻松对接渲染101平台服务。不论是小型独立项目还是大型
阅读更多2024-09-17
ubuntu安装mysql 8.0忘记root初始密码，如何重新修改密码
修改my.cnf文件，在文件新增 skip-grant-tables，在启动mysql时不启动grant-tables，授权表。5.注释掉skip-grant-tables后重启mysql。2、修改m
阅读更多2024-09-17
JVM面试真题总结（十一）
总的来说，Java内存模型主要解决了多线程环境下共享数据的一致性、可见性等问题，是Java并发编程的基础。这种模型的好处是，由于启动类加载器是最顶部的加载器，因此它加载的都是最可信任的类库（Java的
阅读更多2024-09-17
Ubuntu 软件仓库镜像使用帮助
选择镜像。
阅读更多2024-09-17
用于稀疏自适应深度细化的掩码空间传播网络 CVPR2024
图像引导的深度补全是一项通过利用稀疏深度测量和RGB图像来估计密集深度图的任务；它通过估算深度来填充未测量的区域。由于许多深度传感器（如LiDAR和飞行时间相机（ToF））只能提供稀疏的深度图，这项任
阅读更多2024-09-17

使用LLaMA-Factory对Llama3-8B-Chinese-Chat进行微调

文章目录

模型及数据：

模型下载

数据

LLaMA-Factory启动

拉取代码

启动webui

模型训练

数据导入

数据预览

设置模型路径

配置参数及参数的保存

开始训练

过程观察

加载模型、对话

模型导出、再次加载

相关文章