TLDR
я пытаюсь получить nvidia-smi
резервную копию, которая работала нормально, пока я не установил cuda-toolkit. Удаление cuda-toolkit не помогло. Как я могу восстановить nvidia-smi
вывод?
Сбой NVIDIA-SMI, потому что он не может связаться с NVIDIA.
Водитель. Убедитесь, что установлена последняя версия драйвера NVIDIA и
Бег.
Подробнее
У меня есть GEFORCE RTX 2070 на моем ноутбуке с Ubuntu 18.04, и я успешно установил его драйвер из официального файла запуска. NVIDIA-Linux-x86_64-470.63.01.run
. Вот результат nvidia-smi
из этой установки:

Затем я установил cuda-toolkit из официального файла запуска. cuda_11.4.2_470.57.02_linux.run
, убедившись, что отменить выбор установка драйвера. Вот окно терминала сразу после завершения установки:

Сразу после того, как я сделал nvidia-smi
, Я получил:
Сбой NVIDIA-SMI, потому что он не может связаться с NVIDIA.
Водитель. Убедитесь, что установлена последняя версия драйвера NVIDIA и
Бег.
Поскольку это была установка cuda-toolkit, которая предположительно "сломалась" nvidia-smi
, я удалил cuda-toolkit (запустив cuda-деинсталлятор
нашел в /USR/местные/куда-11.4/бин
, как указано в сгенерированном тексте после установки).
К сожалению, это не помогает и nvidia-smi
все еще поврежден. Причина, по которой я устанавливаю из официальных файлов запуска NVIDIA, заключается в том, что ранее у меня были проблемы с установкой драйвера из репозиториев Ubuntu, но я мог заставить его работать с официальным драйвером. Поэтому я решил попробовать то же самое с cuda-toolkit.
Как я могу вернуться nvidia-smi
?
Выводы некоторых команд, если применимо
какой nvidia-smi
: /usr/bin/nvidia-smi
мокутил --sb-состояние
: SecureBoot отключен
nvidia-настройки
:
ОШИБКА: Драйвер NVIDIA не загружен
ОШИБКА: невозможно загрузить информацию из любой доступной системы
лс /sys/прошивка/efi/
:
config_table efivars esrt fw_platform_size fw_vendor runtime-map systab vars
lspci -k | grep -EA2 'VGA|3D'
:
00:02.0 VGA-совместимый контроллер: Intel Corporation CometLake-H GT2
[Графика UHD] (версия 05)
Подсистема: Micro-Star International Co., Ltd. [MSI] Устройство 12ae
Используемый драйвер ядра: i915
01:00.0 VGA-совместимый контроллер: NVIDIA Corporation TU106M [GeForce RTX 2070 Mobile / > Max-Q Refresh] (rev a1)
Подсистема: Micro-Star International Co., Ltd. [MSI] Устройство 12ae
Модули ядра: nvidiafb, nouveau
кот /etc/modprobe.d/blacklist-nouveau.conf
:
черный список модерн
черный список vga16b
черный список
черный список
черный список
черный список amd76_edac
псевдоним nouveau off
псевдоним lbm-nouveau off
параметры модерна modeset=0

статус dkms
: нет выхода
lsmod | grep нвидиа
:
эхо $XDG_SESSION_TYPE
: х11
где нвидиа
:
nvidia: /usr/lib/x86_64-linux-gnu/nvidia /usr/lib/nvidia /usr/share/nvidia /usr/src/nvidia-470.63.01/nvidia
grep nvidia /etc/modprobe.d/* /lib/modprobe.d/*
:
/etc/modprobe.d/blacklist-framebuffer.conf:черный список nvidiafb
/etc/modprobe.d/blacklist-nouveau.conf:черный список nvidiafb
/etc/modprobe.d/nvidia-installer-disable-nouveau.conf:# сгенерировано nvidia-installer
/lib/modprobe.d/nvidia-runtimepm.conf:options nvidia "NVreg_DynamicPowerManagement=0x02"
Сообщения/вопросы, которые я уже просмотрел: