Рейтинг:0

Сервер Windows недоступен через rdp или smb после простоя

флаг cn

Попытка выяснить проблему, из-за которой сервер не отвечает на соединения rdp или smb после того, как он не использовался в течение примерно 3 часов (т.е. все пользователи отсутствуют и работают только фоновые службы). Два встроенных сетевых адаптера емкостью 1 ГБ работают в режиме LACP, зависящем от коммутатора, с политикой хэширования Mikrotik RB2011iL 802.3ad l2+l3. Соединение восстанавливается после одного из двух случайным образом:

  1. Вход в систему через интерфейс supermicro kvm и ввод учетных данных (соединение восстанавливается, и сервер снова начинает отвечать, что для меня странно)
  2. То же, что и 1, но соединение восстанавливается только после ручного перезапуска сетевого интерфейса объединения.

Похоже, что сервер по какой-то причине переходит в спящий режим, но некоторые службы все еще работают, например, я могу установить L2TP-соединение с маршрутизатором, который отправляет запрос RADIUS на сервер (так что запрос радиуса проходит нормально, журнал NPS сообщает, что Я успешно авторизовался). Но в этот момент RDP все еще не работает.

Другое дело, что маршрутизатор понятия не имеет, что я перезапускаю интерфейс (когда в обычном случае он сообщает, что ссылка работает / не работает). Кроме того, проблема появилась один раз до использования объединения, но не сохранялась долго, поэтому я понятия не имел, что произошло тогда, теперь она вернулась. В средстве просмотра событий также нет журналов о том, что интерфейс не работает или что-то в этом роде, только такие службы, как NTP, начинают рассылать спам, что они не могут разрешить свои адреса.

Что я пробовал до сих пор:

  1. Обновление сетевых драйверов до последней версии, доступной на сайте Supermicro.
  2. Настройка «разрешить спать» отключена
  3. Отключение энергоэффективного Ethernet на обеих сетевых картах
  4. Перезагрузка сервера

Что еще я могу сделать, чтобы решить эту проблему?

Изменить: установка объекта групповой политики для времени истечения сеанса никогда не кажется временным решением проблемы. Так как у меня были активные сессии, сервер не впадал в свой таинственный сон и был доступен нормально. Но в любом случае это не полный ответ на проблему, просто меняет тему на «почему WS перестает отвечать на rdp/smb/pings/вероятно что-то еще, когда все пользовательские сеансы отсутствуют»

флаг im
Извините, вы можете подтвердить мое понимание: запросы NPS, отправленные маршрутизатором, утверждаются и регистрируются на сервере, но внутренние службы сервера жалуются, что у них нет сетевого подключения? Что говорит статус порта/LACP на коммутаторе, когда сервер не отвечает?
флаг cn
@RobbieCrash да, маршрутизатор позволяет выполнять аутентификацию с помощью NPS, и когда я добираюсь до журналов Windows, появляется запись, в которой говорится, что сервер nps успешно предоставил клиенту учетные данные (поэтому, вероятно, кэширование не задействовано, и аутентификация реальна). Журналы ничего не сообщают о состоянии порта как на маршрутизаторе, так и на окнах (но я не уверен, что отображается в статистике интерфейса об этом, когда проблема возникает, но поскольку событий журнала нет, я предполагаю, что маршрутизатор думает, что ссылка все еще работает) без движения). Как я уже сказал, даже ручной перезапуск интерфейса объединения не приводит к отключению канала на стороне маршрутизатора.
флаг im
Что произойдет, если вы отключите одну из объединенных сетевых карт?
флаг cn
Вы имеете в виду отключить физически или отключить в Windows? @РоббиКраш
флаг im
В любом случае, я думаю, было бы эффективно убедиться, что у вас нет чего-то шаткого в вашей конфигурации LACP. Но отключение его в Windows не исключает проблем на самом сервере. Если вы отключите один из сетевых адаптеров, когда Windows не отвечает, и он снова включится, вы можете сосредоточиться на конфигурации своей команды. Каково использование ресурсов на сервере, когда он не отвечает (в частности, ЦП)?
флаг cn
@RobbieCrash дело в том, что сервер полностью отвечает без падений в течение рабочего дня, но примерно через 3 часа после его окончания (я думаю, это происходит, когда истекает срок действия последней пользовательской сессии), сервер перестает отвечать на попытки rdp-подключения, smb, пинги и т. д. Утром захожу в систему через KVM и он снова становится ответственным на весь день.
флаг cn
Я попытался отключить интерфейсы в Windows один за другим. Маршруты сообщают, что ссылка на порт не работает, но интерфейс соединения остается активным, и соединение rdp также несет ответственность, когда любой из сетевых адаптеров отключен.
флаг im
Проверьте использование ЦП и что произойдет, если вы отключите одну сетевую карту, когда это произойдет в следующий раз.
флаг cn
Использование процессора @RobbieCrash в это время равно нулю, поскольку это терминальный сервер, и его никто не использует. Что я вижу в логах сейчас: последняя сессия истекла в 1:56, в 3:04 NTP-клиент сбросил сообщение о 8 неудачных попытках синхронизации времени, так что около часа сервер начал "спать"

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.