Дайте определение «перегружен».
Если вы просто смотрите на среднюю нагрузку, то да, она перегружена (примерно в 5-7,5 раз). Тем не менее, средняя загрузка является разумной метрикой, которую можно использовать только в том случае, если ваша рабочая нагрузка в значительной степени параллельна и в основном привязана к ЦП. Средняя загрузка по существу отслеживает среднее количество процессов, которые мог пробег за последние 1/5/15 минут.
Однако, судя по двум вашим снимкам экрана, мгновенная загрузка ЦП не всегда составляет 100% от того, на что способна система. Это, в сочетании с высокой средней нагрузкой, означает, что необходимо запустить множество процессов, но они выполняются быстро, а затем завершаются. Это достаточно нормально для системы, предоставляющей сетевые службы, поскольку большинство сетевых служб нет Привязанный к процессору, но вместо этого привязанный к вводу-выводу. Это означает, что средняя нагрузка не является хорошей метрикой для определения использования ресурсов в системе.
На что вам действительно следует обратить внимание (и на что вы действительно должны обращать внимание в первую очередь) Любые network service) — это показатели производительности самой службы.В большинстве случаев релевантными являются измерения задержки для различных типов запросов, обслуживаемых службой (и, более конкретно, вы обычно хотите заботиться о средней задержке и одном из 95-го или 99-го процентиля или пиковой задержки). хтоп
просто не может отследить это для вас, вам нужно посмотреть на другой инструмент, такой как Сетевые данные (отказ от ответственности, я работаю в Netdata) или Прометей.
Но даже лучше этого: пользователи сообщают о проблемах? Если ответ отрицательный, о проблемах не сообщается, то, вероятно, не имеет значения, «перегружен» сервер или нет, потому что все работает достаточно хорошо.