Ubuntu系统GPU掉显卡驱动问题记录

本文最后更新于:2023年12月23日 晚上

前言

由于故障导致服务器显卡驱动掉了,尝试了各种方法都没有解决,记录下最终解决的方法。

报错

执行命令 nvidia-smi,报错:NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA
driver. Make sure that the latest NVIDIA driver is installed and running.

问题原因

内核版本原因,内核版本的头文件不匹配。

解决办法

uname -r 查看内核版本
sudo apt-get install –reinstall linux-headers-generic
sudo apt-get install –reinstall linux-headers-$(uname -r)
sudo apt-get install –reinstall build-essential

再次 modprobe nvidia

安装 NVIDIA*.run

执行nvidia-sm

参考:
https://mcqueen-zero.blog.csdn.net/article/details/124203989?spm=1001.2014.3001.5502
https://spacevision.blog.csdn.net/article/details/123510743