Centos7.9安装Nvidia驱动
1. 前提准备
1.1 前提机器上面有支持CUDA的Nvidia GPU,查看支持CUDA的GPU列表:
https://developer.nvidia.com/cuda-gpus
lspci | grep -i nvidia
重装服务器使用GTX750
1.2 验证系统是否是受支持的Linux版本
uname -m && cat /etc/redhat-release
到这里查看受支持的Linux版本:
Installation Guide Linux :: CUDA Toolkit Documentation
1.3 验证系统是否有GCC编译环境
gcc -v
没有的话需要先安装GCC,Centos7的最小化安装一般勾选上开发软件都会自动安装GCC
验证系统是否安装了正确的内核头文件和开发包
sudo yum install kernel-devel-$(uname -r) kernel-headers-$(uname -r)
2. 开始安装
2.1 禁用nouveau
nouveau是一个第三方开源的Nvidia驱动,一般Linux安装的时候默认会安装这个驱动。 这个驱动会与Nvidia官方的驱动冲突,在安装Nvidia驱动和和CUDA之前应先禁用nouveau
查看系统是否正在使用nouveau
lsmod | grep nouveau
如果有显示内容,则进行以下的步骤: Centos7禁用方法
#新建一个配置文件
sudo vim /etc/modprobe.d/blacklist-nouveau.conf
#写入以下内容
blacklist nouveau
options nouveau modeset=0
#保存并退出
:wq
#备份当前的镜像
sudo mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak
#建立新的镜像
sudo dracut /boot/initramfs-$(uname -r).img $(uname -r)
#重启
sudo reboot
#最后输入上面的命令验证
lsmod | grep nouveau
2.2 下载驱动
可以看到我这个节点有2块Tesla T4显卡,那么在后续在官网去找驱动时,也需要按照型号去寻找对应的驱动。
打开 NVIDIA 驱动下载链接 Advanced Driver Search | NVIDIA 。
2.3 安装依赖环境
方案一:
查看Linux内核
cat /proc/version
查看系统中已有的kernel-devel与kernel-headers
yum info kernel-devel kernel-headers
发现两者不匹配,Linux内核中的版本是3.10.0-1160.el7,而现有的kernel-devel与kernel-headers的的版本是3.10.0-1160.el7,3.10.0-1160.83.1.el7
现在需要下载和Linux内核中相匹配的kernel-devel与kernel-headers(3.10.0-1160.el7)。
进入网站:https://pkgs.org/download/kernel-headers (老版本没了)
下载网站:
https://rpmfind.net/linux/RPM/centos/updates/7.9.2009/x86_64/Packages/kernel-headers-3.10.0-1160.el7.x86_64.html
或者:
源代码的官网:http://vault.centos.org/
进入官网后,再一次进入7.9/,进入os/,进入Source/,进入SPackages/,找到kernel-3.10.0-1160.el7.src.rpm 下载就行了
可以直接安装?yum install kernel-headers-3.10.0-1127.el7.x86_64
安装
rpm -ivh kernel-3.10.0-1160.el7.src.rpm
安装提示:Warning: user mockbuild does not exist. using root
https://blog.csdn.net/evolay/article/details/110825548
https://blog.csdn.net/xiongzhizhu/article/details/51816243
yum install mock
useradd -s /sbin/nologin mockbuild
# 这时会产生目录/root/rpmbuild/SPECS和/root/rpmbuild/SOURCES。
# 利用find -name directoryname -type d 命令找到这两个文件。
# 进入到SPECS中安装源码包
# 逐一安装上面提示缺少的软件包,用yum install指令。
重启机器
reboot
方案二:
CentOS7.9安装NVidia和CUDA
(1)选择支持 RPM 或者RUN的操作系统,并获取该包的下载链接
(2)使用rpm命令安装 rpm 包。
rpm -i nvidia-diag-driver-local-repo-XXX.rpm
(3)使用yum命令清除缓存。
yum clean all
(4)使用yum命令安装驱动。
yum install cuda-drivers
(5)重启机器
reboot
2.4 安装驱动
# 赋权限
chmod -R 777 NVIDIA-Linux-x86_64-470.94.run
# 运行命令
sudo sh NVIDIA-Linux-x86_64-470.94.run
安装成功
3. 安装 CUDA
CUDA驱动下载 : CUDA Toolkit Archive | NVIDIA Developer
sh cuda_11.3.0_465.19.01_linux.run
根据自己要求选择服务,这里只安装CUDA Toolkit,光标分别移动到Driver、CUDA Demo Suite、CUDA Documentation,按空格键,去掉选择
添加环境变量并更新
vim ~/.bashrc
#如果是root用户安装在默认路径,普通用户环境变量配置如下示例:
export PATH=/usr/local/cuda-11.3/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-11.3/lib64
#如果是普通用户安装在用户目录下,环境变量配置如下示例
export PATH=/home/apps/cuda-11.3/bin:$PATH
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/home/apps/cuda-11.3/lib64
#####还是这个??
export PATH=/usr/local/cuda-11.3/bin:$PATH
export CUDA_HOME=/usr/local/cuda-11.3
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH
source ~/.bashrc
然后输入nvcc -V查看CUDA是否安装成功。
参考:
CentOS7.9安装NVidia和CUDA
Centos7.9安装Nvidia驱动
原文地址:https://blog.csdn.net/weixin_43815222/article/details/143975712
免责声明:本站文章内容转载自网络资源,如本站内容侵犯了原著者的合法权益,可联系本站删除。更多内容请关注自学内容网(zxcms.com)!