自学内容网 自学内容网

Centos7.9安装Nvidia驱动

1. 前提准备

1.1 前提机器上面有支持CUDA的Nvidia GPU,查看支持CUDA的GPU列表:

https://developer.nvidia.com/cuda-gpus

 lspci | grep -i nvidia

重装服务器使用GTX750

1.2 验证系统是否是受支持的Linux版本

uname -m && cat /etc/redhat-release

到这里查看受支持的Linux版本:

Installation Guide Linux :: CUDA Toolkit Documentation

1.3 验证系统是否有GCC编译环境

gcc -v

没有的话需要先安装GCC,Centos7的最小化安装一般勾选上开发软件都会自动安装GCC

验证系统是否安装了正确的内核头文件和开发包

sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)

2. 开始安装

2.1 禁用nouveau

nouveau是一个第三方开源的Nvidia驱动,一般Linux安装的时候默认会安装这个驱动。 这个驱动会与Nvidia官方的驱动冲突,在安装Nvidia驱动和和CUDA之前应先禁用nouveau

查看系统是否正在使用nouveau

lsmod | grep nouveau

如果有显示内容,则进行以下的步骤: Centos7禁用方法

#新建一个配置文件
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
#写入以下内容
blacklist nouveau
options nouveau modeset=0
#保存并退出
:wq
#备份当前的镜像
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
#建立新的镜像
sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)
#重启
sudo reboot
#最后输入上面的命令验证
lsmod | grep nouveau

2.2 下载驱动

在这里插入图片描述
可以看到我这个节点有2块Tesla T4显卡,那么在后续在官网去找驱动时,也需要按照型号去寻找对应的驱动。

打开 NVIDIA 驱动下载链接 Advanced Driver Search | NVIDIA
在这里插入图片描述

在这里插入图片描述

2.3 安装依赖环境

方案一:

Centos7.9安装Nvidia驱动

查看Linux内核

cat /proc/version

在这里插入图片描述

查看系统中已有的kernel-devel与kernel-headers

yum info kernel-devel kernel-headers

在这里插入图片描述
发现两者不匹配,Linux内核中的版本是3.10.0-1160.el7,而现有的kernel-devel与kernel-headers的的版本是3.10.0-1160.el7,3.10.0-1160.83.1.el7

现在需要下载和Linux内核中相匹配的kernel-devel与kernel-headers(3.10.0-1160.el7)。

进入网站:https://pkgs.org/download/kernel-headers (老版本没了)

下载网站:
https://rpmfind.net/linux/RPM/centos/updates/7.9.2009/x86_64/Packages/kernel-headers-3.10.0-1160.el7.x86_64.html
或者:
源代码的官网:http://vault.centos.org/
进入官网后,再一次进入7.9/,进入os/,进入Source/,进入SPackages/,找到kernel-3.10.0-1160.el7.src.rpm 下载就行了

可以直接安装?yum install kernel-headers-3.10.0-1127.el7.x86_64

安装

rpm -ivh kernel-3.10.0-1160.el7.src.rpm

安装提示:Warning: user mockbuild does not exist. using root
https://blog.csdn.net/evolay/article/details/110825548
https://blog.csdn.net/xiongzhizhu/article/details/51816243

yum install mock
useradd -s /sbin/nologin mockbuild
# 这时会产生目录/root/rpmbuild/SPECS和/root/rpmbuild/SOURCES。
# 利用find -name directoryname -type d 命令找到这两个文件。
# 进入到SPECS中安装源码包
# 逐一安装上面提示缺少的软件包,用yum install指令。

重启机器

reboot

方案二:

CentOS7.9安装NVidia和CUDA
(1)选择支持 RPM 或者RUN的操作系统,并获取该包的下载链接
(2)使用rpm命令安装 rpm 包。

rpm -i nvidia-diag-driver-local-repo-XXX.rpm

(3)使用yum命令清除缓存。

yum clean all

(4)使用yum命令安装驱动。

yum install cuda-drivers

(5)重启机器

reboot

2.4 安装驱动

# 赋权限
chmod -R 777 NVIDIA-Linux-x86_64-470.94.run
# 运行命令
sudo sh NVIDIA-Linux-x86_64-470.94.run

安装成功
在这里插入图片描述

3. 安装 CUDA

CUDA驱动下载 : CUDA Toolkit Archive | NVIDIA Developer
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/2fd54a36f1074144a9e7e3e3c9241e4c.png

sh cuda_11.3.0_465.19.01_linux.run

根据自己要求选择服务,这里只安装CUDA Toolkit,光标分别移动到Driver、CUDA Demo Suite、CUDA Documentation,按空格键,去掉选择
在这里插入图片描述
在这里插入图片描述
添加环境变量并更新

vim ~/.bashrc
#如果是root用户安装在默认路径,普通用户环境变量配置如下示例:
export PATH=/usr/local/cuda-11.3/bin:$PATH 
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64  
#如果是普通用户安装在用户目录下,环境变量配置如下示例 
export PATH=/home/apps/cuda-11.3/bin:$PATH 
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/apps/cuda-11.3/lib64

#####还是这个??
export PATH=/usr/local/cuda-11.3/bin:$PATH
export CUDA_HOME=/usr/local/cuda-11.3
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH
source ~/.bashrc

然后输入nvcc -V查看CUDA是否安装成功。
在这里插入图片描述

参考:
CentOS7.9安装NVidia和CUDA
Centos7.9安装Nvidia驱动


原文地址:https://blog.csdn.net/weixin_43815222/article/details/143975712

免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!