Я новичок в ИТ-индустрии; Я не сисадмин... По профессии я строитель дорог. Так что дайте мне знать, если я перепутал какую-либо терминологию, понятия и т. д.
ИТ-отдел моей организации очень мал. Кажется, мы едва топчемся на месте, когда дело доходит до поддержания наших ИТ-систем в рабочем состоянии.
То, что вызывает большинство сбоев в работе системы, Обновления Windows Server. Обновления Windows выводят из строя наши серверы приложений примерно раз в месяц.
Обновления запланированы автоматически — ежемесячно в нерабочее время.
Вот пример недавнего отключения:
Сервер приложений, содержащий виртуальные машины WebSphere JVM для нашего система управления заказами на работу автоматически обновлялся поздно ночью (по расписанию на 1 месяц).
Сегодня, когда пользователи начали использовать систему управления заказами, мы получили куча ошибок интеграции/java из JVM.
При расследовании стало ясно, что проблема была вызвана обновлениями. У нас никогда не было этой проблемы раньше, и это произошло сразу после применения обновлений.
Наш системный администратор перезапустил сервер, что, похоже, сразу решило проблему. Мы разобрались с сообщениями об ошибках интеграции и т. д., и жизнь продолжалась (по крайней мере, до следующего обновления).
Я знаю, что не только моя организация сталкивается с проблемами обновлений Windows. Похоже, это довольно распространенная проблема.
Но мой вопрос:
Существуют ли методы обработки обновлений, которые моя организация могла упустить из виду?
Например, мне пришло в голову, что мы могли бы:
- Вручную примените обновления и перезапустите серверы в субботу утром.
- Тщательно протестируйте все наши системы
- У вас есть все выходные, чтобы решить проблемы и перезапустить серверы, если это необходимо (вместо того, чтобы делать это в режиме реального времени в рабочее время).
Существуют ли подобные стандартные методы снижения риска, связанного с обновлением серверов Windows?