У меня есть сервер Ubuntu, работающий удаленно в другом офисе. Несколько раз он выключался, и я не могу понять причину. Это сервер, который запрашивает внешний сервис через API. К мертвых
Я имею в виду, что он все еще работает, но просто перестает работать. Сеть сервера, похоже, тоже отключена, и сканирование локальной сети не находит ее.
Он находится за офисным маршрутизатором и работает под управлением ядра 18.04 4.15.0-147-generic. Ни у кого на месте нет учетной записи на этом сервере.
Вот что я пробовал.
последняя перезагрузка
результат:
reboot system boot 4.15.0-151-generer Чт 22 июля 14:49 все еще работает
reboot system boot 4.15.0-147-generer Среда, 21 июля, 15:48, все еще работает
reboot system boot 4.15.0-147-generer Ср 21 июля 14:05 - 15:48 (01:43)
reboot system boot 4.15.0-147-generat Сб 17 июля 18:24 - 15:48 (3+21:24)
reboot system boot 4.15.0-147-generer Чт 15 июл 17:26 - 15:48 (5+22:22)
22 июл 14:49
была перезагрузка, которую я попросил персонал на месте сделать. 21 июля отключили электричество.
- /var/журнал/системный журнал
22 июля, 09:08:50 localhost service_start.sh[946]: INFO:launcher:myjob завершает вывод для 2.
22 июля 09:08:50 localhost service_start.sh[946]: INFO:launcJul 22 14:50:05 localhost systemd[1]: запуск переноса журнала в постоянное хранилище...
22 июля, 14:50:05 localhost systemd[1]: запущен демон метаданных LVM2.
22 июля, 14:50:05 localhost systemd[1]: начата загрузка/сохранение случайного начального числа.
22 июля, 14:50:05 localhost lvm[443]: отслеживаются 2 логических тома(ов) в группе томов «localhost-vg»
22 июля 14:50:05 localhost systemd[1]: Started Установите раскладку клавиатуры консоли.
22 июля, 14:50:05 localhost systemd-modules-load[436]: вставлен модуль 'iscsi_tcp'
Система отключилась после 22 июл 09:08:50
. 22 июл 14:50:05
была перезагрузка, упомянутая ранее.
Похоже, что система не перезагружалась и не выключалась, иначе это должно быть указано в журнале. И в syslog тоже нет журнала системных ошибок.
Есть два пользовательских задания cron, настроенных для запуска каждые 5 и 10 минут, и в системном журнале были записи о запуске cron. 22 июл 09:05:01
прежде чем система стала мертвой вокруг 22 июл 09:08:50
.
На месте нет технических специалистов, и в данный момент я могу подключиться к серверу только через TeamView с другого локального компьютера.
Я запустил htop, и нагрузка на систему была небольшой.
Я сейчас в растерянности. Что еще я должен проверить во время следующего сеанса TeamView?