Рейтинг:1

Кластер AWS выходит из строя с сигналом MasterServerWaitCondition Received FAILURE, ошибкой версии iptables и шеф-повара

флаг my

Я пытаюсь создать AMI для параллельного кластера. Я использовал стандартный AMI от Amazon (ami-0436692c7b452bae4 для us-west-2, региона, в котором я нахожусь, и alinux) и немного изменил его, добавив несколько пакетов.

Однако, когда я бегу pcluster создать foo --norollback Я получаю сообщение об ошибке:

Начало создания кластера для кластера: stockAWS
Создание стека с именем: parallelcluster-stockAWS
Статус: parallelcluster-stockAWS — ROLLBACK_IN_PROGRESS                         
Не удалось создать кластер. Несостоявшиеся события:
  - Создание ресурса AWS::AutoScaling::AutoScalingGroup ComputeFleet отменено.
  - AWS::CloudFormation::WaitCondition MasterServerWaitCondition получил сигнал FAILURE с уникальным идентификатором i-booyaa

затем я бегу ssh фу и посмотри логи /var/log/cfncluster-init.log который показывает длинный журнал ошибок, нижнюю часть которого я предоставил:

28.07.2021, 23:16:49,659 [ОШИБКА] Команда шеф-повара (chef-client --local-mode --config /etc/chef/client.rb --log_level auto --force-formatter --no-color - -chef-zero-port 8889 --json-attributes /etc/chef/dna.json --override-runlist aws-parallelcluster::_prep_env) не удалось
2021-07-28 23:16:49,659 [DEBUG] Вывод команды Chef: запуск клиента Chef, версия 14.2.0
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ. Предусмотрено переопределение списка выполнения.
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ. Предусмотрено переопределение списка выполнения.
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: исходный список выполнения: [рецепт[aws-parallelcluster::slurm_config]]
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: исходный список выполнения: [рецепт[aws-parallelcluster::slurm_config]]
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: переопределенный список выполнения: [рецепт[aws-parallelcluster::_prep_env]]
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: переопределенный список выполнения: [рецепт[aws-parallelcluster::_prep_env]]
разрешение кулинарных книг для списка выполнения: ["aws-parallelcluster::_prep_env"]
Синхронизация кулинарных книг:
  - aws-параллельный кластер (2.5.1)
  - уравновешенный питон (1.7.0)
  - смола (2.1.1)
  - селинукс (2.1.1)
  - нфс (2.6.4)
  - ням (5.1.0)
  - ням-эпель (3.1.0)
  - опенсш (2.6.3)
  - подходящий (7.0.0)
  - имя хоста (0.4.2)
  - линия (2.4.1)
  - улимит (1.0.0)
  - пьенв (3.1.1)
  - модуль_ядра (1.1.2)
  - уравновешенность (2.8.2)
  - уравновешенные языки (2.1.2)
  - iptables (8.0.0)
  - hostsfile (3.0.1)
  - poise-архив (1.5.0)

Запущенные обработчики:
[2021-07-28T23:16:49+00:00] ОШИБКА: запуск обработчиков исключений
[2021-07-28T23:16:49+00:00] ОШИБКА: запуск обработчиков исключений
Запуск обработчиков завершен
[2021-07-28T23:16:49+00:00] ОШИБКА: завершены обработчики исключений
[2021-07-28T23:16:49+00:00] ОШИБКА: завершены обработчики исключений
Сбой клиента шеф-повара. 0 ресурсов обновлено за 11 секунд
[2021-07-28T23:16:49+00:00] FATAL: Stacktrace сброшен в /etc/chef/local-mode-cache/cache/chef-stacktrace.out
[2021-07-28T23:16:49+00:00] FATAL: Stacktrace сброшен в /etc/chef/local-mode-cache/cache/chef-stacktrace.out
[2021-07-28T23:16:49+00:00] FATAL: предоставьте содержимое файла stacktrace.out, если вы отправляете отчет об ошибке
[2021-07-28T23:16:49+00:00] FATAL: предоставьте содержимое файла stacktrace.out, если вы отправляете отчет об ошибке
[2021-07-28T23:16:49+00:00] FATAL: Chef::Exceptions::CookbookChefVersionMismatch: Cookbook 'iptables' версии '8.0.0' зависит от версии повара [">= 15.3"], но работает версия повара 14.2.0
[2021-07-28T23:16:49+00:00] FATAL: Chef::Exceptions::CookbookChefVersionMismatch: Cookbook 'iptables' версии '8.0.0' зависит от версии повара [">= 15.3"], но работает версия повара 14.2.0

2021-07-28 23:16:49,659 [ОШИБКА] Ошибка во время сборки chefPrepEnv: сбой команды шеф-повара
Traceback (последний последний вызов):
  Файл "/usr/lib/python3.7/site-packages/cfnbootstrap/construction.py", строка 573, в run_config
    CloudFormationCarpenter (config, self._auth_config).build (рабочий журнал)
  Файл "/usr/lib/python3.7/site-packages/cfnbootstrap/construction.py", строка 273, в сборке
    self._config.commands)
  Файл "/usr/lib/python3.7/site-packages/cfnbootstrap/command_tool.py", строка 127, в приложении
    поднять ToolError(u"Команда %s не выполнена" % имя)
cfnbootstrap.construction_errors.ToolError: сбой команды шеф-повара
28.07.2021 23:16:49,661 [ОШИБКА] --------СБОЙ ПОСТРОЙКИ!----------- -------------

Если я побегу iptables --версия я получил v1.8.4. то же самое для запуска с помощью sudo. шеф-повар 14.2.0

разочаровывает то, что если я создам стек параллельного кластера со стандартным AMI aws, я получу точно такое же поведение. Что тут происходит?

digijay avatar
флаг mx
В сообщении об ошибке говорится: «CookbookChefVersionMismatch: Cookbook« iptables »версия« 8.0.0 »зависит от версии шеф-повара ["> = 15.3"], но действующая версия шеф-повара — 14.2.0"
Joe B avatar
флаг my
@digijay Спасибо, я заметил этот момент, но `iptables --version` показывает версию 1.8.4. версия повара 14.2.0. sudo версия iptables такая же.
digijay avatar
флаг mx
Да, версии 8.0 iptabled даже не существует, интересно, где это можно определить. Запустится ли кластер, если вы пропустите кулинарную книгу iptables?

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.