Я хотел бы установить SLURM на Clear Linux из-за его хороших тестов. Я следил за учебником на https://docs.01.org/clearlinux/latest/tutorials/hpc.html. Когда я добрался до шага раздела "Создайте файл конфигурации slurm.conf" Я заметил, что служба slurmctld не запускается. Ошибка была связана с файлом slurm.conf. В логе было:
11 июля, 19:20:00 slurm-controller slurmctld[615]: ошибка: игнорирование устаревшей опции FastSchedule=1. Удалите из своей конфигурации.
11 июля 19:20:00 slurm-контроллер slurmctld[615]: фатальный: команда SallocDefaultCommand удалена. Вместо этого рассмотрите возможность установки LaunchParameters=use_interactive_step.
я удалил Быстрое расписание
и SallocDefaultCommand
строки из конфигурационного файла. После этого я добавил эти строки:
LaunchParameters=use_interactive_step
InteractiveStepOptions="srun -n1 -N1 --pty --preserve-env --mpi=pmix_v3 $SHELL"
После того, как я исправил это, я не мог продолжить, потому что в общем объекте есть неопределенный символ.
Это журнал:
[2021-07-11T19:35:14.260] slurmctld версии 20.11.8 запущен в кластере Linux
[2021-07-11T19:35:14.261] cred/munge: init: загружен плагин подписи учетных данных Munge
[2021-07-11T19:35:14.262] отладка: auth/munge: init: загружен плагин аутентификации Munge
[2021-07-11T19:35:14.262] select/cons_res: common_init: select/cons_res загружен
[2021-07-11T19:35:14.263] select/linear: init: подключаемый модуль линейного выбора узла загружается с аргументом 1
[2021-07-11T19:35:14.263] select/cons_tres: common_init: select/cons_tres загружен
[2021-07-11T19:35:14.263] вытеснение/нет загрузки: init: вытеснение/нет загрузки
[2021-07-11T19:35:14.264] отладка: acct_gather_energy/none: init: AcctGatherEnergy НИ ОДИН плагин не загружен
[2021-07-11T19:35:14.264] отладка: acct_gather_Profile/none: init: AcctGatherProfile НИ ОДИН плагин не загружен
[2021-07-11T19:35:14.264] отладка: acct_gather_interconnect/none: init: AcctGatherInterconnect НИ ОДИН плагин не загружен
[2021-07-11T19:35:14.264] отладка: acct_gather_filesystem/none: init: AcctGatherFilesystem НИ ОДИН плагин не загружен
[2021-07-11T19:35:14.265] debug2: Нет файла acct_gather.conf (/etc/slurm/acct_gather.conf)
[2021-07-11T19:35:14.265] отладка: jobacct_gather/none: init: сбор учета заданий, загружен плагин NOT_INVOKED
[2021-07-11T19:35:14.265] ошибка: plugin_load_from_file: dlopen(/usr/lib64/slurm/prep_script.so): /usr/lib64/slurm/prep_script.so: неопределенный символ: run_script
[2021-07-11T19:35:14.265] ошибка: не удалось загрузить указанное имя плагина для подготовки/скрипта: не удалось открыть файл плагина
[2021-07-11T19:35:14.266] ошибка: prep_plugin_init: невозможно создать контекст подготовки для подготовки/скрипта
[2021-07-11T19:35:14.266] фатально: не удалось инициализировать плагин подготовки
Поскольку файл slurm.conf связки (пакета) Clear Linux устарел, я подумал, что, возможно, при использовании более качественного конфигурационного файла ошибка исчезнет. Моя гипотеза заключалась в том, что, возможно, мне нужно было загрузить другой плагин с символом run_script. Затем я попытался создать лучший файл конфигурации, используя https://slurm.schedmd.com/configurator.easy.html. Но я получил ту же ошибку.
Как вы думаете, это баг SLURM, чего-то не хватает в конфигурации или ошибка в компиляции связки (пакета), которую я установил? Я заметил, что в других дистрибутивах Linux есть аналогичные проблемы с предварительно скомпилированными пакетами SLURM. Однако это происходит с другими общими объектами и другими символами.
Если проблема в Clear Linux, какой Linux лучше всего подходит для SLURM?
Я был бы признателен за любую помощь, которую вы можете мне оказать. Большое спасибо заранее.
С наилучшими пожеланиями,
Браулио Дж. Солано-Рохас