megatron训练gpt
一 安装docker环境
NVIDIA/Megatron-LM: Ongoing research training transformer models at scale (github.com)
1.1 拉镜像
docker pull nvcr.io/nvidia/pytorch:24.08-py3
1.2 下载megatron
切换为tag 为core 6的版本
执行命令:
git checkout tag
1.3 复制数据集
数据集格式为:
原文地址:https://blog.csdn.net/youzjuer/article/details/142956371
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!