Я пытаюсь создать AMI для параллельного кластера. Я использовал стандартный AMI от Amazon (ami-0436692c7b452bae4 для us-west-2, региона, в котором я нахожусь, и alinux) и немного изменил его, добавив несколько пакетов.
Однако, когда я бегу pcluster создать foo --norollback
Я получаю сообщение об ошибке:
Начало создания кластера для кластера: stockAWS
Создание стека с именем: parallelcluster-stockAWS
Статус: parallelcluster-stockAWS — ROLLBACK_IN_PROGRESS
Не удалось создать кластер. Несостоявшиеся события:
- Создание ресурса AWS::AutoScaling::AutoScalingGroup ComputeFleet отменено.
- AWS::CloudFormation::WaitCondition MasterServerWaitCondition получил сигнал FAILURE с уникальным идентификатором i-booyaa
затем я бегу ssh фу
и посмотри логи /var/log/cfncluster-init.log
который показывает длинный журнал ошибок, нижнюю часть которого я предоставил:
28.07.2021, 23:16:49,659 [ОШИБКА] Команда шеф-повара (chef-client --local-mode --config /etc/chef/client.rb --log_level auto --force-formatter --no-color - -chef-zero-port 8889 --json-attributes /etc/chef/dna.json --override-runlist aws-parallelcluster::_prep_env) не удалось
2021-07-28 23:16:49,659 [DEBUG] Вывод команды Chef: запуск клиента Chef, версия 14.2.0
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ. Предусмотрено переопределение списка выполнения.
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ. Предусмотрено переопределение списка выполнения.
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: исходный список выполнения: [рецепт[aws-parallelcluster::slurm_config]]
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: исходный список выполнения: [рецепт[aws-parallelcluster::slurm_config]]
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: переопределенный список выполнения: [рецепт[aws-parallelcluster::_prep_env]]
[2021-07-28T23:16:47+00:00] ПРЕДУПРЕЖДЕНИЕ: переопределенный список выполнения: [рецепт[aws-parallelcluster::_prep_env]]
разрешение кулинарных книг для списка выполнения: ["aws-parallelcluster::_prep_env"]
Синхронизация кулинарных книг:
- aws-параллельный кластер (2.5.1)
- уравновешенный питон (1.7.0)
- смола (2.1.1)
- селинукс (2.1.1)
- нфс (2.6.4)
- ням (5.1.0)
- ням-эпель (3.1.0)
- опенсш (2.6.3)
- подходящий (7.0.0)
- имя хоста (0.4.2)
- линия (2.4.1)
- улимит (1.0.0)
- пьенв (3.1.1)
- модуль_ядра (1.1.2)
- уравновешенность (2.8.2)
- уравновешенные языки (2.1.2)
- iptables (8.0.0)
- hostsfile (3.0.1)
- poise-архив (1.5.0)
Запущенные обработчики:
[2021-07-28T23:16:49+00:00] ОШИБКА: запуск обработчиков исключений
[2021-07-28T23:16:49+00:00] ОШИБКА: запуск обработчиков исключений
Запуск обработчиков завершен
[2021-07-28T23:16:49+00:00] ОШИБКА: завершены обработчики исключений
[2021-07-28T23:16:49+00:00] ОШИБКА: завершены обработчики исключений
Сбой клиента шеф-повара. 0 ресурсов обновлено за 11 секунд
[2021-07-28T23:16:49+00:00] FATAL: Stacktrace сброшен в /etc/chef/local-mode-cache/cache/chef-stacktrace.out
[2021-07-28T23:16:49+00:00] FATAL: Stacktrace сброшен в /etc/chef/local-mode-cache/cache/chef-stacktrace.out
[2021-07-28T23:16:49+00:00] FATAL: предоставьте содержимое файла stacktrace.out, если вы отправляете отчет об ошибке
[2021-07-28T23:16:49+00:00] FATAL: предоставьте содержимое файла stacktrace.out, если вы отправляете отчет об ошибке
[2021-07-28T23:16:49+00:00] FATAL: Chef::Exceptions::CookbookChefVersionMismatch: Cookbook 'iptables' версии '8.0.0' зависит от версии повара [">= 15.3"], но работает версия повара 14.2.0
[2021-07-28T23:16:49+00:00] FATAL: Chef::Exceptions::CookbookChefVersionMismatch: Cookbook 'iptables' версии '8.0.0' зависит от версии повара [">= 15.3"], но работает версия повара 14.2.0
2021-07-28 23:16:49,659 [ОШИБКА] Ошибка во время сборки chefPrepEnv: сбой команды шеф-повара
Traceback (последний последний вызов):
Файл "/usr/lib/python3.7/site-packages/cfnbootstrap/construction.py", строка 573, в run_config
CloudFormationCarpenter (config, self._auth_config).build (рабочий журнал)
Файл "/usr/lib/python3.7/site-packages/cfnbootstrap/construction.py", строка 273, в сборке
self._config.commands)
Файл "/usr/lib/python3.7/site-packages/cfnbootstrap/command_tool.py", строка 127, в приложении
поднять ToolError(u"Команда %s не выполнена" % имя)
cfnbootstrap.construction_errors.ToolError: сбой команды шеф-повара
28.07.2021 23:16:49,661 [ОШИБКА] --------СБОЙ ПОСТРОЙКИ!----------- -------------
Если я побегу iptables --версия
я получил v1.8.4
. то же самое для запуска с помощью sudo. шеф-повар 14.2.0
разочаровывает то, что если я создам стек параллельного кластера со стандартным AMI aws, я получу точно такое же поведение. Что тут происходит?