Рейтинг:0

Google GCE VM - как убить виртуальные машины, если сценарий запуска не работает

флаг ie

Мы запускаем рабочие нагрузки в GCE с помощью управляемых групп экземпляров (MIG), которые контролируют жизненный цикл и работоспособность этих виртуальных машин.

Новые виртуальные машины снабжены сценарием запуска (bash), который в редких случаях дает сбой. Однако виртуальная машина по-прежнему может запускаться, запускать свою рабочую нагрузку и проходить проверки работоспособности.

Есть ли какая-то настройка в GCE / MIG, которая говорит: «Если сценарий инициализации не выполняется успешно, уничтожьте виртуальную машину и создайте ее заново»?

Я мог бы завершить работу, если произошла ошибка, например:

...
исключение() {
  echo 'ошибка сценария запуска; Выключение!'
  выключение -h сейчас
}

ловушка 'исключение' ERR
...

Но надеялся, что есть более управляемый вариант.

Рейтинг:0
флаг id
Leo

Я хотел бы узнать сообщение об ошибке из вашего журнала MIG, поскольку это может быть связано с начальной задержкой, поэтому я предлагаю проверить, как в вашем MIG настроена политика проверки работоспособности и автоматического восстановления. В этом есть некоторые зонды и настройки, которые вы можете настроить, например, ваш vm --initial-delay. Этот параметр задерживает автоматическое восстановление из-за потенциально преждевременного повторного создания виртуальной машины, если виртуальная машина находится в процессе запуска, и может решить проблему со сценарием запуска. Иногда при запуске виртуальной машины требуется больше времени для выполнения сценария запуска. Это также помогает, если есть некоторая задержка в сети, потому что некоторые проблемы со сценариями запуска связаны с сетевым подключением к серверу метаданных. Таким образом, чтобы избежать этого, вы можете увеличить начальную задержку проверки вашего здоровья. Вы можете получить проверку работоспособности с помощью следующей команды:

проверка работоспособности вычислений gcloud описывает <название проверки работоспособности>

Вы можете обновить проверку работоспособности с помощью команды update, как показано в следующем примере:

управляемое обновление группы экземпляров вычислений gcloud my-mig \
        --health-check пример-проверить \
        --начальная задержка 300 \
        --zone us-east1-b

На этом вы можете видеть, что начальная задержка была установлена ​​​​на 5 минут, в следующем соединять вы найдете дополнительную информацию о том, как настроить проверку работоспособности и автоматическое восстановление в MIG.

Также вы можете проверить свой экземпляр в любое время с помощью этой команды:

группы экземпляров вычислений gcloud управляемый список-экземпляров ваша группа-экземпляров

НАЗВАНИЕ ЗОНА СТАТУС HEALTH_STATE ДЕЙСТВИЕ INSTANCE_TEMPLATE VERSION_NAME LAST_ERROR
igm-with-hc-fvz6 europe-west1 РАБОТАЕТ ЗДОРОВО НЕТ my-template
igm-with-hc-gtz3 europe-west1 РАБОТАЕТ ЗДОРОВО НЕТ my-template
Danielle M. avatar
флаг ie
Привет @Лео! Проблема на самом деле не в проверках работоспособности, а в сценарии запуска. Мне нужно сообщить MIG, что эту виртуальную машину не удалось подготовить и ее необходимо создать заново.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.