Я работаю в среде со встроенным высокодоступным кластером NVMeoF, и мне нужно, чтобы этот кластер был доступен в течение нескольких минут после холодного включения всех узлов, и пытаюсь настроить RAID-10 на этом кластере.
Устаревшая инфраструктура, с которой я работаю, основана на GFS2 и LVM2. К сожалению, опция raid-10 для LVM, по-видимому, разрешает только один журнал для GFS2, когда мне нужно больше. Я начал работать по пути ручной настройки серии массивов RAID-1 с DRBD, поверх которых я мог настроить RAID-0 с LVM2. Я смог настроить это без особых проблем. Однако в этот момент я столкнулся с проблемой: как правильно закрыть и снова запустить узлы для беспрепятственного переноса данных?
Мои первоначальные базовые попытки привели к тому, что каждая плата загружалась в состоянии с синхронизацией на уровне 0%, а их повторная синхронизация занимает несколько часов. Я использовал следующие команды на каждом из четырех узлов, чтобы попытаться завершить работу корректно:
vgchange -an g1 #g1 — логический том, расположенный поверх физических томов r0 и r1.
vgchange --lockstop
drbdadm down r0 Ресурс drbd настроен как физический том
drbdadm down r1 Ресурс drbd настроен как физический том
Затем каждую плату выключают и снова включают, и я пытаюсь запустить резервную копию с помощью следующих команд:
drbdadm до r0
дрбдадм вверх r1
если [`hostname` = "соответствующий-хост"]; затем первичный drbdadm --force r0; фи
если [`hostname` = "соответствующий-хост2"]; затем первичный drbdadm --force r1; фи
vgchange --lockstart
vgchange -asy g1
Я заметил, что иногда это просто работает. В других случаях мне говорят, что мои метаданные недействительны и мне нужно будет создать их заново. После запуска drbdadm create-md r0 или r1 синхронизация через drbd происходит с начальной точки 0%, что занимает часы, которые мои усилия не выдерживают. Я не уверен, что конкретная последовательность запуска/остановки может позволить мне надежно избежать проблем с синхронизацией; если есть способ заставить DRBD ускорить повторную синхронизацию; если переход на конфигурацию RAID-01, в которой DRBD накладывается поверх двух логических томов, может обеспечить более надежную начальную конфигурацию, которая может пропустить первоначальную синхронизацию; или если я использую совершенно неправильные инструменты для работы.
Есть ли у ServerOverflow какая-либо информация, которая поможет мне настроить мою конфигурацию для надежного и чистого запуска и завершения работы? Любая помощь будет принята с благодарностью!