NVIDIA驱动出错:NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver. Make sure t

具体症状表现为:
1 . 显示驱动已安装

2 . 输入nvidia-smi,报如下错误:

NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

3 . 在跑深度学习网络时,也显示找不到GPU

操作方式:

方案一:在BIOS界面,禁用secure boot,也就是设置为disable

本人结果:在BIOS界面,早已设置secure boot为disable,并没有解决问题。各位可以先尝试。

方案二:内核版本太高的问题,选择低版本的ubuntu系统进入
开机grub界面是:

第一行默认是高版本的,选择第二行Advanced options for Ubuntu然后再选择低版本的系统。
注:终端输入uname -r可以查看当前内核版本

本人结果:在低版本依旧无法解决问题。各位可以先尝试。

方案三:安装对应的驱动模块

查看对应驱动版本

cd /usr/src

ls

然后安装DKMS(Dynamic Kernel ModuleSupport):

sudo apt-get install dkms

重新安装对应nvidia的驱动模块(根据个人实际的版本号填写)

sudo dkms install -m nvidia -v srv-460.73.01

理论上成功就好了。

然而,我遇到报错:

ERROR: Cannot create report: [Errno 17] File exists: ‘/var/crash/nvidia-dkms-460-server.0.crash’
Error! Bad return status for module build on kernel: 4.15.0-140-generic (x86_64)
Consult /var/lib/dkms/nvidia/srv-460.73.01/build/make.log for more information.

解决方式:重新下载gcc

sudo apt install gcc-8
sudo update-alternatives --config gcc
sudo update-alternatives --remove-all gcc
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-8 10
sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc-8 10

随后,问题解决,安装成功nvidia -v srv-460.73.01

然后输入nvidia-smi,成功!

installusrnvidiabindkms

我来吐槽

*

*