Во-первых, извините, если это не то место, чтобы опубликовать это.
У меня есть установка реплики хранилища, работающая в конфигурации MSCS Stretch Cluster, два набора из двух виртуальных машин, каждый из которых работает на отдельном хосте ESXi, выступающем в качестве файлового сервера. Каждый набор имеет два диска VHDX, подключенных к ним на контроллере SCSI общего доступа к виртуальной шине. Каждая реплика исходного и целевого дисков имеет одинаковые буквы дисков, что и их соответствующий партнер на всех узлах.
Я настроил установку в соответствии с руководством Microsoft здесь:https://docs.microsoft.com/en-us/windows-server/storage/storage-replica/stretch-cluster-replication-using-shared-storage
По большей части все работает как надо, за исключением двух моментов. Когда я отключаю роли или отключаю питание от первого набора узлов кластера, диск, подключенный к ним, передает право собственности одному из узлов в другом наборе, а диск, на который выполняется репликация, остается в автономном режиме.
Насколько я понимаю, что должно было произойти, когда первые два узла были отключены или, что более важно, исходный диск был переведен в автономный режим для имитации сбоя, так это то, что партнерство реплики хранилища автоматически реверсировалось, исходный целевой диск реплики подключился к сети и действовал как исходный диск в роли файлового сервера, предоставляя клиентам доступ ко всем файловым ресурсам, как будто ничего не произошло.
Вместо этого для достижения этой функциональности я должен перевести исходный диск в автономный режим, чтобы имитировать сбой, затем мне нужно щелкнуть правой кнопкой мыши и удалить партнерство с репликой, удалить его из роли файлового сервера, вручную добавить целевой диск в роль файлового сервера. и, наконец, верните роль в онлайн. Затем дополнительно настройте новое партнерство реплики хранилища в качестве активного диска, реплицирующегося на тот, где сбой был смоделирован как новый статус-кво.
На все это уходит менее минуты, но все равно требуется ручная работа, а не автоматическое аварийное переключение, как я понял.
Мой вопрос заключается в том, правильно ли я истолковал, как должна работать система, и что именно так обстоят дела в описанном выше сценарии отработки отказа? Или вы, ребята, думаете, что где-то на линии есть ошибка конфигурации?
В качестве примечания: когда я пытаюсь вручную отменить партнерство (со всеми узлами и дисками) с помощью командлета PowerShell Set-SRPartnership, исходный и конечный диски остаются прежними после выполнения командлета.
Вот схема, которую я сделал при разработке системы, чтобы прояснить настройку: https://i.imgur.com/5STByzZ.png
Приветствуется любой вклад, даже указатели на лучшее место, чтобы опубликовать этот вопрос :)
Пожалуйста, будьте нежны, так как я всего лишь студент, и это мое первое настоящее проектное задание в компании, в которой я работаю, хотя я не могу спросить других коллег из ИТ, так как ни у кого из них нет опыта кластеризации.