Вам потребуется некоторое размышление и суждение, чтобы понять свою среду и выполнить планирование емкости. Что означает для организации, что этот хост работает хорошо? Подсказка: пользователи заботятся о том, «медленно ли это», а не о загрузке памяти или процессора. Как далеко вы можете увеличить использование и при этом иметь достаточный запас прочности?
Вы, кажется, используете взгляды, монитор ресурсов на основе Python psutil. На первый взгляд (ха) у него приличный UX, вменяемые источники данных, и он сообщает вам о предупреждениях, приятно. Предупреждения памяти по умолчанию составляют 50% 70% 90%, что для меня довольно консервативно и возрастает от более чем достаточного до серьезного нехватки памяти. Проверьте, имеет ли это смысл в вашей среде, при необходимости настройте другие пороговые значения.
Но проценты от какой метрики памяти? В Linux, смотрит на psutil. psutil вычисляет общий минус доступный. Что разумно, кэши и другие легко восстанавливаемые вещи исключены из соотношения. Хотя для старых ядер существуют устаревшие резервные вычисления, способ их измерения может различаться.
Во время этих предупреждений о «высоком» потреблении памяти собирайте необработанные /proc/meminfo
вывод и анализ. Возможно потребление памяти за пределами адресного пространства процесса. Включая сегменты разделяемой памяти или структуры данных ядра.
Этот хост представляет собой систему systemd, которая запускает докер и некоторые другие вещи. Получите использование памяти для каждой группы, запустив systemd-cgtop --order=память
и статистика докера
Часто статистику по группам легче понять, чем учитывать множество процессов в системе. Возможно, контейнеры все еще существуют, хотя большинство их процессов остановлено.