Рейтинг:1

Как сделать графический процессор в новой виртуальной машине Ubuntu 20.04 пригодным для использования?

флаг in

Я весь день пытался заставить этот (v100) GPU работать на новой виртуальной машине Ubuntu. Я пытался установить драйверы и перезагрузиться, а также очистить/удалить все, что связано с nvidia, но ничего из этого не работает.

В частности, я специально запустил это:

удачное обновление;
apt install build-esential;

sudo add-apt-repository ppa:графические драйверы
sudo apt установить ubuntu-драйверы-общие
ubuntu-драйверы устройств
sudo apt-get установить nvidia-driver-460
sudo перезагрузить сейчас

Затем иногда кажется, что nvidia-smi работает (на момент написания этого вопроса это было не так, поэтому я не смог скопировать и вставить то, что сказано, когда он работает), но когда он не работает, он говорит следующее:

(синтез) miranda9@miranda9:~$ nvidia-smi
Не удалось определить дескриптор устройства для графического процессора 0000:00:06.0: неизвестная ошибка

любая помощь приветствуется.

Примечание. У меня также нет доступа к файлу vmx виртуальных машин, поэтому этот вопрос и ответы для меня бесполезны/бессмысленны: https://forums.developer.nvidia.com/t/nvidia-smi-reports-unable-to-determine-the-device-handle-for-gpu/46835

Кроме того, я попытался удалить все из nivida и переустановить его с помощью:

sudo apt-get --purge удалить "*nvidia*"
sudo /usr/bin/nvidia-удалить

тогда

удачное обновление;
apt install build-esential;

sudo add-apt-repository ppa:графические драйверы
sudo apt установить ubuntu-драйверы-общие
ubuntu-драйверы устройств
sudo apt-get установить nvidia-driver-460
sudo перезагрузить сейчас

но это не похоже на работу


Дополнительная информация, если это поможет:

(синтез) miranda9@miranda9:~$ lsb_release -a
Нет доступных модулей LSB.
Идентификатор дистрибьютора: Ubuntu
Описание: Ubuntu 20.04.2 LTS
Релиз: 20.04
Кодовое название: фокальный

также:

(синтез) miranda9@miranda9:~$ питон
Python 3.9.5 (по умолчанию, 4 июня 2021 г., 12:28:51) 
[GCC 7.5.0] :: Anaconda, Inc. для Linux
Введите «помощь», «авторское право», «кредиты» или «лицензия» для получения дополнительной информации.
>>> импортный факел
>>> torch.cuda.is_available()
/home/miranda9/miniconda3/envs/synchronous/lib/python3.9/site-packages/torch/cuda/__init__.py:52: UserWarning: инициализация CUDA: непредвиденная ошибка от cudaGetDeviceCount(). Вы запускали какие-то функции cuda перед вызовом NumCudaDevices(), которые могли уже вызвать ошибку? Ошибка 101: недопустимый порядковый номер устройства (вызвано внутренним образом в /opt/conda/conda-bld/pytorch_1623448238472/work/c10/cuda/CUDAFunctions.cpp:115.)
  вернуть факел._C._cuda_getDeviceCount() > 0
ЛОЖЬ

По запросу комментария:

# лспци
00:00.0 Хост-мост: Intel Corporation 440FX - 82441FX PMC [Natoma] (версия 02)
00:01.0 Мост ISA: Intel Corporation 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 Интерфейс IDE: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 USB-контроллер: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (версия 01)
00:01.3 Мост: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (версия 01)
00:02.0 VGA-совместимый контроллер: Cirrus Logic GD 5446
00:03.0 Контроллер хранилища SCSI: XenSource, Inc. Xen Platform Device (версия 01)
00:05.0 Системное периферийное устройство: XenSource, Inc. Citrix XenServer PCI Device for Windows Update (версия 01)
00:06.0 3D-контроллер: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

другой вм:

$ lspci
00:00.0 Хост-мост: Intel Corporation 440FX - 82441FX PMC [Natoma] (версия 02)
00:01.0 Мост ISA: Intel Corporation 82371SB PIIX3 ISA [Natoma/Triton II]
00:01.1 Интерфейс IDE: Intel Corporation 82371SB PIIX3 IDE [Natoma/Triton II]
00:01.2 USB-контроллер: Intel Corporation 82371SB PIIX3 USB [Natoma/Triton II] (версия 01)
00:01.3 Мост: Intel Corporation 82371AB/EB/MB PIIX4 ACPI (версия 01)
00:02.0 VGA-совместимый контроллер: Cirrus Logic GD 5446
00:03.0 Контроллер хранилища SCSI: XenSource, Inc. Xen Platform Device (версия 01)
00:05.0 Системное периферийное устройство: XenSource, Inc. Citrix XenServer PCI Device for Windows Update (версия 01)
00:06.0 3D-контроллер: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

Ресурсы, которые я искал для помощи:

ChanganAuto avatar
флаг us
В виртуальной машине аппаратное обеспечение виртуализировано. Вы используете не настоящий графический процессор Nvidia, а основную ОС.
флаг cc
Взгляните на результаты Google для виртуальной машины nvidia через GPU.
Charlie Parker avatar
флаг in
@ubfan1 просто чтобы убедиться, что я смотрю в правильном месте. Мне нужно погуглить «passthru», а не «passthrough»? например google `nvidia virtual machine gpu passthru` - верно?
флаг cc
Когда я начал печатать, мне сразу же пришло в голову слово «passthru», поэтому я выбрал его. Мой графический процессор слишком стар для меня, поэтому я не стал больше проверять.
Charlie Parker avatar
флаг in
хотите уточнить отрицательные голоса?
Charlie Parker avatar
флаг in
@NateT да, я рад. Смотрите обновление к вопросу. Однако я подозреваю, что простое удаление всего с nvidia, а затем повторная установка с перезагрузкой должно сработать, но мои попытки сделать это не увенчались успехом.
Irsu85 avatar
флаг cn
Вам нужно использовать сквозную передачу PCIe и 2 физических графических процессора на вашем компьютере, чтобы это работало. Вам также нужен второй монитор, подключенный ко второму графическому процессору. Для практических команд попробуйте использовать https://pve.proxmox.com/wiki/PCI(e)_Passthrough
Nate T avatar
флаг it
Какой образ вы использовали для виртуальной машины. Как в полном названии изображения? Вероятно, отрицательные отзывы связаны с тем, что у виртуальной машины нет графического процессора.Я предполагаю, что вы имеете в виду «как заставить виртуальную машину использовать хост-графический процессор»? Кстати, это был не я, я только в экстремальных ситуациях. Я слишком беден. XD
Рейтинг:0
флаг zw

Виртуальная машина подражает графическая карта, поэтому для гостевой системы должно быть прозрачно, какая родная карта у вас есть в вашей хост-системе. Виртуальные машины предназначены для «разделения» ресурсов, в отличие от реальной системы, которая имеет прямой доступ к своему оборудованию. Поэтому нет смысла устанавливать драйверы Nvidia на хост-систему. Вы можете проверить это, проверив текущие драйверы на вашей виртуальной машине:

инкси -G

(выполняется в терминале) покажет вам драйвер виртуальной машины/оракула, а не вашу родную карту.

Получение высокопроизводительного графического вывода может быть достигнуто с помощью настроек и уловок, но виртуальные машины не предназначены для такой работы....

Charlie Parker avatar
флаг in
привет, спасибо за ответ, было познавательно! У меня нет доступа к хост-системе. Я запрашиваю виртуальную машину и получаю виртуальную машину для использования. Я могу быть sudo в нем, но я, конечно, в виртуальной машине. Как вы думаете, почему способ, которым я устанавливаю драйверы, не работает? Что именно идет не так, на ваш взгляд?
kanehekili avatar
флаг zw
Итак, виртуальная машина находится на удаленном хосте. Что говорит `inxi -G` на вашей «удаленной виртуальной машине»? Если он не существует, попробуйте с помощью `sudo apt install inxi`

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.