自学内容网 自学内容网

【环境配置】GPU - 加速深度学习

版本对应关系Previous PyTorch Versions | PyTorch

这里具体讨论需要使用GPU时的环境配置。Pytorch 和 torchvision 等框架可以利用 CUDA 和 cuDNN 提供的 GPU 加速功能,高效地处理大规模的深度学习任务,如计算机视觉中的图像分类、目标检测等任务。

1. NVIDIA 显卡硬件条件

先通过

nvidia-smi

看一下NVIDIA 显卡及其当前运行状态

Fri Nov 15 19:21:09 2024
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 556.13                 Driver Version: 556.13         CUDA Version: 12.5     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                  Driver-Model | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA GeForce RTX 3050 ...  WDDM  |   00000000:01:00.0 Off |                  N/A |
| N/A   45C    P8              3W /   70W |      14MiB /   4096MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
+-----------------------------------------------------------------------------------------+

“CUDA Version: 12.5” 表示该驱动所支持的最高 CUDA 版本,而不是你当前系统正在使用的 CUDA 版本。

如果需要同时使用多个不同版本的深度学习框架或软件,且这些框架或软件依赖于不同版本的 CUDA,那么就需要在电脑上安装多个 CUDA 版本。例如,项目 A 需要使用 CUDA 10.2 版本的 PyTorch,而项目 B 需要使用 CUDA 11.3 版本的 TensorFlow,此时就需要在电脑上同时安装 CUDA 10.2 和 CUDA 11.3 两个版本,并进行相应的环境配置,以便在不同项目中切换使用不同的 CUDA 版本。

除了 CUDA 本身,还需要下载对应的 cuDNN(CUDA Deep Neural Network library)。cuDNN 是 NVIDIA 专门为深度学习任务优化的 GPU 加速库,它基于 CUDA 构建,提供了一系列高性能的神经网络原语和函数,能够显著提升深度学习模型的训练和推理速度。在安装 CUDA 后,必须根据 CUDA 的版本下载并安装与之匹配的 cuDNN 版本,并将其正确配置到 CUDA 的安装目录中,才能充分发挥 GPU 在深度学习中的加速作用。

2. CUDA卸载与安装

由于之前安装了多个版本的CUDA,有点占内存,现在暂时不用,所以先把之前安装的CUDA卸载了。彻底卸载CUDA、cuDN


原文地址:https://blog.csdn.net/Winkyyyyyy/article/details/143808242

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!