Рейтинг:1

Проблемы с удалением драйверов NVIDIA

флаг in

Недавно я установил графические драйверы для nvidia geforce RTX 2070. После этого Ubuntu (версия 21.04) больше не загружалась. (Кажется, у многих людей есть эта проблема, см., например. [1], [2], [3].) Я установил драйвер через встроенное приложение (забыл название и не могу посмотреть, так как не могу загрузиться, думаю "Something & Packages"). Затем мне удалось удалить драйверы, запустив какой-то вариант sudo apt purge nvidia-.* в приглашении Root Shell, доступном через режим восстановления, что позволило мне снова загрузиться.

Затем я попытался установить драйверы, запустив загруженный файл здесь из терминала. Я подумал, что если это не сработает, я могу снова удалить драйверы с помощью приведенной выше команды. Однако на этот раз та же команда вернула сообщение о том, что нет установленных пакетов, начинающихся с «nvidia». В результате я теперь не могу загрузить Ubuntu.

я тоже пробовал

  • Перейдите к файлу (также в корневой оболочке режима восстановления) и запустите его с помощью --удалить вариант. Во время процесса он выдал несколько сообщений об ошибках, но сказал мне, что драйверы были успешно удалены. Тем не менее, я все еще не могу загрузиться.
  • Переустановка и удаление вместе с файлом
  • Переход в /и т.д/ и удаление всех файлов с помощью xorg в их имени (я понятия не имею, что это за файлы, но это было среди предложенных исправлений, которые я нашел.)

Все еще не могу загрузиться. Любые идеи, кроме трех вещей выше или переустановки Ubuntu?

Помимо того, что я не могу загрузиться, мне все еще нужно запустить драйверы. У меня есть только Ubuntu для запуска ML, для которого также требуется работающий графический процессор. Есть ли что-нибудь лучше, чем попробовать другой из предложенных драйверов и надеяться на другой результат?

РЕДАКТИРОВАТЬ: я считаю, что это (также) аппаратная проблема; поведение изменилось после того, как я изменил настройки биоса (описано действие, только в обратную сторону здесь.)

EDIT2: Мне сказали, что мне нужен другой блок питания, я попробую его дальше.

oldfred avatar
флаг cn
В Ubuntu вы никогда не устанавливаете файл .run напрямую из nVidia. По сути, вам придется переустанавливать с каждым обновлением ядра. Но правильная версия из репозитория Ubuntu должна работать. Можете ли вы загрузить старое ядро ​​​​из меню восстановления grub? Удалите драйвер .run nVidia. https://askubuntu.com/questions/219942/how-to-uninstall-manually-installed-nvidia-drivers
silver avatar
флаг in
Я попробую загрузиться с более старой версии. Однако, что касается удаления драйвера .run, сайт, на который вы ссылаетесь, предлагает команду `sudo ./NVIDIA-Linux-x86-310.19.run --uninstall`, которую я уже пробовал (первый элемент в списке)
silver avatar
флаг in
Загрузка с более старой версии работала как шарм. (То есть, если я правильно понимаю, это просто означает выбор третьего пункта из [этого списка] (https://i.ibb.co/hVxG55m/mde.jpg).) Спасибо за это - но это не так. решить мою основную проблему; драйверы nvidia все еще есть в более новой версии.
флаг cc
Многие пакеты nvidia не имеют имени, начинающегося с «nvidia-». Посмотрите на вывод dpkg -l |grep nvidia и очистите все остатки. Вы всегда должны иметь возможность загружаться в режиме восстановления, используя драйвер nouveau, если какой-либо оставшийся элемент конфигурации в /etc/modules.d не внес nouveau в черный список. После очистки установите драйвер 460 или 465 из стандартных репозиториев, и это должно сработать.
silver avatar
флаг in
Я попробую это (но я как раз собираюсь ложиться спать, поэтому отчитаюсь только через несколько часов). Не могли бы вы дать мне версию ELI5 (объясните, как будто мне пять лет), как установить драйвер 460 из стандартных репозиториев?
oldfred avatar
флаг cn
https://ubuntuforums.org/showthread.php?t=2383560&p=13735336#post13735336 Вы можете, но больше не нужно устанавливать ppa. Ubuntu поддерживает текущие версии. Только если очень новая карта/чип nVidia, вам может понадобиться ppa.Примеры добавления ppa: https://askubuntu.com/questions/1026179/how-to-install-a-gtx-1060 & https://askubuntu.com/questions/61396/how-do-i-install-the-nvidia-drivers
Рейтинг:2
флаг hu

Список всех пакетов, связанных с Nvidia

дпкг -л | grep нвидиа

Очистите все связанные с Nvidia пакеты, которые вы видите в списке.

Когда вы сделали это успешно

автоустановка драйверов sudo ubuntu
sudo Prime-выберите nvidia

Перезагрузитесь, и теперь ваша система должна работать нормально.

silver avatar
флаг in
Это позволило мне снова загрузиться, но не установило драйвер; если я подключаю монитор к карте, он все равно не распознается. Запуск torch.cuda.is_available() теперь возвращает [эту новую ошибку](https://i.ibb.co/hWWgmFC/error.png).
Utkarsh Chandra Srivastava avatar
флаг hu
Вы можете запустить nvidia-smi? и можете ли вы опубликовать свой вывод здесь, вы установили факел cuda toolkit, поддерживающий 11.1/10.2? Вы можете опубликовать свой nvcc -V
Utkarsh Chandra Srivastava avatar
флаг hu
Обратите внимание, что после установки драйвера вам нужно зайти в BIOS, убедиться, что безопасная загрузка отключена, и изменить «Основной дисплей» на GPU.
silver avatar
флаг in
Оказывается, мне понадобился новый блок питания, и как только я его установил, не только монитор, подключенный к карте, заработал, но и драйверы, которые я установил с помощью ваших команд, кажется, уже выполняют свою работу. В основном это означает, что ваш ответ решил все проблемы, связанные с программным обеспечением, хотя я не знал этого в то время, поэтому сейчас я отметил его как принятый ответ. Огромное спасибо!
silver avatar
флаг in
(Мне действительно пришлось заняться BIOS, но я уже сделал это до вашего комментария, когда заподозрил аппаратную проблему.Тот факт, что монитор, подключенный к карте, оставался полностью темным, а не работал с дрянным разрешением, вероятно, должен был выдать ее раньше.)
Рейтинг:2
флаг us

I had similar problem. Exact steps might be different but you should get an idea from what I did.

  1. uninstall nvidia drivers as mentioned above.

  2. reboot and instead of login to UI, login to console

  3. make sure nvidia modules are not loaded. You can do that by running command

sudo lsmod  | grep nvidia

This will list any nvidia modules loaded by the kernel. If the modules are loaded that means your nvidia uninstall was not clean and you will need to manually remove the kernel module.

rmmod <name of nvidia modules>
  1. Install xserver-xorg
sudo apt-get install --reinstall xserver-xorg-video-nouveau

This will set your system to use nouveau.

  1. Reboot and connect your monitor. It should detect now.

  2. Use "Additional Drivers" from "Show Application" to install nvidia drivers. (I think latest right now is "nvidia driver metapackage from nvidia-driver-470".

Reboot.

  1. Assuming you don't have secure boot enabled. If secure boot is enable you need to ensure that nvidia kernel modules are signed and loaded.

  2. run sudo lsmod | grep nvidia and nvidia-smi to check if nvidia drivers are loaded.

  3. Now run torch.cuda.is_available() and see if it is able to use GPU.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.