华为云服务器GPU实例启动异常,查看系统日志发现NVIDIA驱动空指针访问怎么办?_云淘科技

问题描述

GPU实例启动异常,检查系统日志,发现NVIDIA驱动空指针访问。如图1所示。

图1 NVIDIA驱动空指针访问

可能原因

GPU驱动异常。

处理方法

卸载驱动。

方法1:执行nvidia-uninstall命令,卸载驱动。

如果提示命令不存在可以执行 查询云服务器安装的驱动版本:whereis n…卸载驱动。

方法2:查询云服务器安装的驱动版本:whereis nvidia

图2 查询安装的驱动版本

根据查询的驱动版本从NVIDIA官网下载驱动包(此处重新下载驱动包是为了执行卸载动作,且后续重新安装驱动时需要此安装包)。

以驱动版本nvidia-396.44为例,执行sh NVIDIA-Linux-x86_64-396.44.run –uninstall,卸载驱动

重装驱动。

操作指导请参考:安装GPU驱动

父主题: GPU驱动故障

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家