Pycharm远程调试deepspeed！可用！

🕗 发布于 2024-11-10 17:49 pycharm ide python

本人写代码的习惯就是一定是要从别人优秀的代码中调试学习的，直接运行+看的话，可能知道了大概的逻辑但是缺无法知道细节的话（参数的含义或者某某数据格式类型），可能对整体代码逻辑的把控不是狠好，所以还是从调试中学习，这也是我所推崇的。

初衷

学习大模型LLM，OOM问题大家可能都遇见过，那么deepspeed便是绕不过的弯，但是deep是如何实现zero123的，参数权重、梯度、优化器状态是怎么保存的，需要通过源码和具体代码的调试才能掌握，那么我便想找一个简单的deepspeed demo来学习下具体的原理。
所选取的代码时 https://github.com/bobo0810/LearnDeepSpeed

一般的deepspeed脚本

CUDA_VISIBLE_DEVICES=4,6,7 deepspeed cifar10_deepspeed.py --deepspeed --deepspeed_config ds_config.json

使用deepspeed执行

Pycharm配置

在这里插入图片描述
总体大概这样，下面我将分为几个部分分别讲下：

Module name

在这里插入图片描述
一般我们都是选择Script path的，现在选择Module name，再去选择
deepspeed.launcher.runner
注意：deepspeed.launcher.runner 是通过下拉栏的方式选择的，而不是直接输入
parameter：

相较于正常脚本前面添加：

--include localhost:0
--master_port 5600
--hostfile hostfile_single

再谢要执行的py程序，后面加上python程序的参数。

Enviroment variables

主要设置CUDA_VISIBLE_DEVICES，含义：此时能看见的GPU编号，PATH的作用主要指向ninja的位置，可用通过找到，没有的话，先pip下载一个

which ninja

例子：

PYTHONUNBUFFERED=1;CUDA_VISIBLE_DEVICES=4,6,7;PATH=/root/anaconda3/envs/fs-llm/bin/

Working directory

写正常本机的项目地址就行
在这里插入图片描述

原文地址：https://blog.csdn.net/qq_44608327/article/details/143647521

免责声明：本站文章内容转载自网络资源，如本站内容侵犯了原著者的合法权益，可联系本站删除。更多内容请关注自学内容网（zxcms.com）！

JVM学习路径
JVM学习
阅读更多2024-11-13
鸿蒙进阶篇-属性动画-animateTo&转场动画
大家好啊，这里是鸿蒙开天组，今天我们来学习属性动画-animateTo&转场动画，咱们先来学习属性动画-animateTo。
阅读更多2024-11-13
docker之容器设置开机自启（4）
要确保 Docker 容器在服务器重启后自动启动，并在容器出现故障时自动重启，可以使用 Docker 的内置 --restart 策略。这种设置可以提升容器的可用性，尤其是在生产环境中
阅读更多2024-11-13
css2D变换用法
CSS 2D变换是CSS3引入的一组功能，允许开发者在二维空间内对HTML元素进行移动、旋转、缩放和倾斜等操作。这些变换只是视觉上改变元素的呈现方式，并不会影响其在文档流中的位置或大小。本文将详细介绍
阅读更多2024-11-13
【划分型DP-最优划分】力扣LCR 165. 解密数字
这道题和将字母翻译为数字的逻辑一样，我们只需要定义dp[i]为前i个字符组成的字符串所能解密的字母个数。然后我们开始遍历i，以第i个字符和第i-1个字符进行讨论，当curNum是0-5之间的时候，并且
阅读更多2024-11-13
LeetCode 93-复制 IP地址
【代码】LeetCode 93-复制 IP地址。
阅读更多2024-11-13
SpringBoot下Bean的单例模式详解
希望本文的介绍和示例能帮助你在 Spring Boot 项目中更好地管理和使用单例模式
阅读更多2024-11-13
酷炫的鼠标移入效果(附源码!!)
欢迎大家关注[小白讲前端]
阅读更多2024-11-13
【计算机网络】设备如何监听 ARP 请求广播
在网络通信中，**ARP（地址解析协议）**用于将网络层的 IP 地址解析为链路层的物理地址（MAC 地址）。当一个设备需要发送 IP 数据包时，它需要知道目标设备的 MAC 地址，这时它会发送一个。
阅读更多2024-11-13
7thonline第七在线出席FASHION PRO 30菁英对话：时尚行业深度洞察
赵嘉程表示，AI在时尚行业的应用正逐步深化，它不仅能够提升设计效率，优化生产流程，还能为消费者提供更加个性化、智能化的购物体验。未来，7thonline第七在线将继续致力于时尚科技领域的研发和创新，特
阅读更多2024-11-13