华为云服务器T4 GPU设备显示异常_云淘科技

问题描述

使用NVIDIA Tesla T4 GPU的云服务器,例如Pi2或G6规格,执行nvidia-smi命令查看GPU使用情况时,显示如下:

No devices were found

原因分析

NVIDIA Tesla T4 GPU是NVIDIA的新版本,默认使用并开启GSP Firmware,导致GPU无法识别。

处理方法

该处理方法在重启云服务器后失效。

执行以下命令,移除NVIDIA内核模块。

rmmod nvidia_drm

rmmod nvidia_modeset

rmmod nvidia

执行以下命令,关闭GSP Firmware开关,并载入NVIDIA内核模块。

modprobe nvidia NVreg_EnableGpuFirmware=0

modprobe nvidia_drm

modprobe nvidia_modeset

如果问题依然存在,请联系客服。

父主题: GPU驱动故障

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家