Рейтинг:0

Переведите отказоустойчивый кластер Windows в оперативный режим только с одним узлом

флаг in

Я хотел бы установить такую ​​политику, чтобы мой отказоустойчивый кластер всегда работал, даже если доступен только один (из двух узлов).

Справочная информация: у меня есть только два узла в кластере, а также кворум-свидетель в общем ресурсе на контроллере домена. Для этого вопроса предположим, что DC остается в эксплуатации. (Windows Server 2019).

Если я отключу node1, то node2 будет активен. Если я затем выключу узел 2, то кластер будет остановлен (очевидно), однако, если я затем запущу только узел 1, кластер остановится. никогда восстанавливаться. Мало того, что он не восстановится без node2, но я не вижу простого способа заставить кластер работать с менеджером кластера. Только способ, которым я могу восстановить кластер, в этом сценарии должен был бы запустить узел2, однако это не кажется (мне) настоящий высокая доступность. IMO, я должен иметь возможность установить политику или иметь достаточно простой способ вернуть кластер в оперативный режим (возможно, после периода ожидания), даже если node2 никогда выздоравливает.

Я просто думаю об этом неправильно или упускаю что-то очевидное?

ОБНОВЛЕНИЕ: я вижу ошибку:

Узлу SOM2 не удалось сформировать кластер. Это было потому, что 
свидетель был недоступен. Пожалуйста, убедитесь, что свидетель 
ресурс находится в сети и доступен.

Тем не менее, свидетель был доступны в то время, что заставляет меня подозревать, что это проблема с разрешениями, то есть общий ресурс-свидетель доступен для кластера, но не для учетных записей службы кластера на каждом узле. Это возможно?

Существуют ли какие-либо специальные настройки разрешений для общего ресурса-свидетеля, обеспечивающие доступ к нему учетных записей локальных служб на каждом узле?

Обновлять:

Чтобы исправить ошибку разрешения (не центральную проблему), мне нужно было использовать команду powershell из:

https://docs.microsoft.com/en-us/powershell/module/failoverclusters/set-clusterquorum

Проверьте разрешения на свидетеле, чтобы разрешить полный контроль правильным домен учетная запись, например учетная запись службы, срок действия пароля которой не ограничен и не может быть изменен. Затем на узле кластера сначала избавьтесь от текущей конфигурации свидетеля:

Set-ClusterQuorum-NoWitness
Get-кластерресаурце

если нужно:

Remove-ClusterResource -Name "Файловый ресурс-свидетель"

или удалите его с помощью менеджера отказоустойчивого кластера

затем повторно добавьте файл-свидетель с необходимыми домен учетные данные для разрешения доступа:

Set-ClusterQuorum -NodeAndFileShareMajority \server\path-to-witness -Credential $(Get-Credential)
Nikita Kipriyanov avatar
флаг za
Вы говорите об отказоустойчивом кластере Windows? Лучше об этом прямо сказать в заголовке.
Рейтинг:2
флаг cn

Как отметил @stuka, это сделано по замыслу. Файл был заблокирован работающим узлом до того, как весь кластер вышел из строя. Node1 никак не может узнать, что Node2 на самом деле не подключен к сети, но недоступен в сети кластера. Он должен полагаться на заблокированный файл как на правильный. В этом сценарии для узла 1 было бы намного хуже, если бы сеть кластера вышла из строя, и ни один из узлов не смог бы нарушить кворум при голосовании.

Если вы действительно столкнулись с этим сценарием, вам придется отредактировать настройки кворума и принудительно вернуть узел в оперативный режим вручную.

На практике это не должно вызывать беспокойства, поскольку кластер редко полностью отключается.

Кластеры с двумя узлами всегда будут иметь компромисс с точки зрения высокой доступности. Общий файловый ресурс-свидетель устанавливает кворум, но не может охватывать все сценарии. Кластер с 3 узлами (или другими нечетными узлами) обеспечит лучшую отказоустойчивость.

Рейтинг:0
флаг ng

Если общий ресурс-свидетель кворума доступен узлу, находящемуся в сети, он определенно сможет перевести кластер в режим «в сети». Это стандартное поведение WSFC. Если ваш кластер не запускается, а общий ресурс-свидетель находится в сети, что-то должно препятствовать его запуску. Ищите ошибки.

Кроме того, как настраиваются параметры кворума кластера?

См. здесь для справки: https://docs.microsoft.com/en-us/windows-server/failover-clustering/manage-cluster-quorum.

флаг in
Обновлено для добавления информации об ошибке.
Massimo avatar
флаг ng
Кластер представлен в Active Directory учетной записью компьютера с тем же именем, что и сам кластер; этой учетной записи компьютера, также известной как «Сетевой объект кластера», требуются разрешения на полный доступ к общему ресурсу-свидетелю.
Stuka avatar
флаг gb
Я думаю, что поведение, с которым сталкивается ОП, ожидаемо. Узел 2 является владельцем свидетеля (блокирует файловый ресурс). Узел 1 не может его заблокировать. Таким образом, пока узел 2 не вернется в оперативный режим, кластер недоступен, поскольку кворума нет. https://techcommunity.microsoft.com/t5/failover-clustering/understanding-quorum-in-a-failover-cluster/ba-p/371678

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.