я следил за этим официальный учебник чтобы разрешить кластеру k8s с голым железом иметь доступ к GPU. Однако при этом я получил ошибки.
Kubernetes 1.21 containerd 1.4.11 и Ubuntu 20.04.3 LTS (GNU/Linux 5.4.0-91-универсальный x86_64).
Драйвер Nvidia предустановлен в системной ОС версии 495 Headless.
После вставки следующего конфига внутрь /etc/containerd/config.toml
и выполнить перезапуск службы, containerd не запустится с выход 1
.
Контейнер Конфиг.toml
системный журнал здесь.
# постоянное расположение данных
корень = "/var/библиотека/контейнер"
# информация о состоянии выполнения
состояние = "/выполнить/контейнер"
# Kubernetes не использует диспетчер перезапуска containerd.
disabled_plugins = ["перезагрузить"]
# КОНФИГУРАЦИЯ NVIDIA НАЧАТЬ ЗДЕСЬ
версия = 2
[плагины]
[плагины."io.containerd.grpc.v1.cri"]
[плагины."io.containerd.grpc.v1.cri".containerd]
default_runtime_name = "nvidia"
[плагины."io.containerd.grpc.v1.cri".containerd.runtimes]
[плагины."io.containerd.grpc.v1.cri".containerd.runtimes.nvidia]
привилегированный_без_хост_устройства = ложь
runtime_engine = ""
runtime_root = ""
runtime_type = "io.containerd.runc.v2"
[плагины."io.containerd.grpc.v1.cri".containerd.runtimes.nvidia.options]
BinaryName = "/usr/bin/nvidia-container-runtime"
# НАСТРОЙКА NVIDIA ЗАКАНЧИВАЕТСЯ ЗДЕСЬ
[отлаживать]
уровень = ""
[группа]
max_recv_message_size = 16777216
max_send_message_size = 16777216
[плагины.linux]
прокладка = "/usr/bin/containerd-прокладка"
время выполнения = "/usr/bin/runc"
Я могу подтвердить, что драйвер Nvidia обнаруживает GPU (Nvidia GTX 750Ti), запустив nvidia-smi
и получил следующий вывод
+--------------------------------------------- ----------------------------+
| NVIDIA-SMI 495.44 Версия драйвера: 495.44 Версия CUDA: 11.5 |
|-------------------------------+---------------- -----+----------------------+
| Имя GPU Persistence-M| Bus-Id Disp.A | Летучий некорр. ЕСК |
| Мощность вентилятора Temp Perf:Использование/Ограничение| Использование памяти | GPU-Util Compute M. |
| | | МИГ М. |
|===============================+================= =====+======================|
| 0 NVIDIA GeForce ... Выкл. | 00000000:02:00.0 Выкл | Н/Д |
| 34% 34C P8 1 Вт / 38 Вт | 0 МБ / 2000 МБ | 0% По умолчанию |
| | | Н/Д |
+---------------------------------------------+---------------- -----+----------------------+
+--------------------------------------------- ----------------------------+
| Процессы: |
| GPU GI CI PID Тип Имя процесса Память GPU |
| ID Использование ID |
|================================================ =============================|
| Запущенных процессов не найдено |
+--------------------------------------------- ----------------------------+
модифицированный config.toml это заставило его работать.