自学内容网 自学内容网

megatron训练gpt

一 安装docker环境

NVIDIA/Megatron-LM: Ongoing research training transformer models at scale (github.com)

1.1 拉镜像 

docker pull nvcr.io/nvidia/pytorch:24.08-py3

 1.2 下载megatron

git clone https://github.com/NVIDIA/Megatron-LM.git

切换为tag 为core 6的版本

执行命令:

git checkout tag

 1.3 复制数据集

数据集格式为:


原文地址:https://blog.csdn.net/youzjuer/article/details/142956371

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!