Спасибо, что прочитали и нашли время, чтобы рассмотреть эту проблему.
У меня проблема с использованием моего кластера Kubernetes.
Он работает под управлением Flatcar Linux производства Kinvolk, недавно приобретенного Microsoft. Я настроил кластер, используя их Локомотив (лококтл
) инструмент.
Всего у меня 4 узла.
- сократ001 (мастер)
- сократ002 (узел)
- сократ003 (узел)
- сократ004 (узел)
Сегодня, около 14:00, мой главный узел перезапустился из-за службы автоматического обновления, предоставляемой Lokomotive (инструмент управления кластером, сделанный Kinvolk).
Моя мастер-нода снова заработала, а k8s — нет.
Результат докер-контейнер ls
побежал на сократ001
заключается в следующем:
ИДЕНТИФИКАТОР КОНТЕЙНЕРА ИЗОБРАЖЕНИЕ КОМАНДА СОЗДАНА СТАТУС ИМЕНА ПОРТОВ
e33995c69e10 quay.io/kinvolk/kubelet:v1.21.4 "/usr/local/bin/kube…" 7 минут назад Up 7 минут назад kubelet
b6093a1f343a quay.io/coreos/etcd:v3.4.16 "/usr/local/bin/etcd" 7 минут назад Up 7 минут etcd
Это указывает на то, что Kubelet и Etcd работают. Однако Kubelet выдает мне много ошибок, и, честно говоря, я не знаю, с чего начать копать...
Когда я бегу журналctl -u кубелет
, это дает мне следующий вывод, я поместил его в Pastebin, потому что он слишком большой. Предупреждение, это большой.
https://pastebin.com/A9Lmf0tc
Вещи, которые я уже пробовал:
- Перезагрузка мастер-узла
- Перезапуск кублета
- Перезапуск etcd
- Вручную пытаюсь запустить kube api, однако это немедленно прекращается (думаю, kubelet)
- Принудительное отключение с помощью
sudo swapoff -a
, однако во время подготовки кластера я совершенно уверен, что Локомотив уже отключил его на Flatcar Linux.
Я понятия не имею, почему это вообще происходит, поэтому все комментарии и ответы приветствуются! Я студент, у меня совсем немного времени, поэтому вы должны получить ответ быстро.
Заранее спасибо!
Редактировать: похоже, в контрольной точке Kubelet есть ошибка. Я подал заявку на Локомотив здесь: https://github.com/kinvolk/lokomotive/issues/1576