У меня есть удаленная система Linux, которая вчера стала очень медленной. Поскольку удаленная разблокировка Luks, которую я установил, не работает надежно, и я не смогу физически получить доступ к машине в течение следующих 10 дней, я пытаюсь отладить это вместо перезагрузки.
Инструменты состояния системы, к которым я привык, хтоп
и дстат
и так как у меня было дстат
работая в сеансе ssh, я вижу, что со вчерашнего дня 2021-09-09 08:51:42 одно ядро процессора всегда полностью используется «sys» - что, я думаю, означает ядро?
Я не вижу ни одного виновного процесса или потока в хтоп
.
Я остановил все пользовательские службы и размонтировал все ненужное, что заставило систему снова немного лучше реагировать, но все еще не так быстро, как должно (получил процессор Intel i7 с SSD).
я обнаружил https://tanelpoder.com/posts/high-system-load-low-cpu-utilization-on-linux/ и установил указанный https://0x.tools/ чтобы получить этот результат для psn -G системный вызов, wchan
:
=== Активные темы =========================================== ===========================================
образцы | средние_потоки | связь | состояние | системный вызов | что
--------------------------------------------- --------------------------------------------- -------
100 | 1,00 | (btrfs-очиститель) | Работает (на процессоре) | [работает] | 0
100 | 1,00 | (дпкг) | Диск (бесперебойный) | fsync | btrfs_commit_transaction
100 | 1,00 | (системный журнал) | Диск (бесперебойный) | урезать | wait_current_trans
1 | 0,01 | (сшд) | Работает (на процессоре) | [работает] | 0
1 | 0,01 | (термический) | Диск (бесперебойный) | [работает] | ec_guard
1 | 0,01 | (термический) | Работает (на процессоре) | [работает] | 0
дпкг
процесс можно объяснить тем, что я пытаюсь запустить удачное обновление
который работает на 1/1000 скорости, которую вы обычно ожидаете (просто ощущение, не измерял).
Может быть проблема с моей корневой файловой системой btrfs...? я не могу найти btrfs-очиститель
в хтоп
, я думаю, я собираюсь еще немного изучить, что это такое ..
я провел btrfs скраб
прошлой ночью, которая завершилась очень быстро и не обнаружила никаких проблем:
# статус очистки btrfs /
UUID: 2f38e0ad-7f16-4a36-8096-b7981d47b4ff
Скраб начался: Чт, 9 сен, 23:59:00 2021
Статус: завершен
Продолжительность: 0:00:24
Всего для очистки: 53,09 ГБ
Скорость: 1,78 ГБ/с
Сводка ошибок: ошибок не обнаружено
Но когда я использовал nano для изменения файла конфигурации в корневом разделе, загрузка и сохранение были очень медленными.
Я просто наткнулся на это: https://www.reddit.com/r/btrfs/comments/fmucrq/btrfs_snapshots_make_entire_system_lag_cpu_usage/ который имеет комментарий, похожий на мою проблему:
каждый раз при загрузке и после моментального снимка btrfs-transacti и btrfs-cleaner полностью использовали ядро, вызывая огромные задержки
только это говорит, что это длится всего несколько минут при загрузке и создании моментального снимка, но я отключил свой бтрбк
Настройка резервного копирования в этой системе несколько дней назад, когда один из подключенных дисков начал показывать проблемы.
Я не уверен, использовала ли моя корневая файловая система btrfs qgroups
, но я просто побежал квоты btrfs отключить /
который занял около 10 секунд и не дал никакой обратной связи.
У кого-нибудь есть другие подсказки для меня, как отлаживать/решать эту проблему?