P в этом контексте означает отношение времени ЦП, полученного этим заданием, к общему затраченному времени. Почти 100% означает, что почти все время он был на ЦП, и поэтому ЦП был ограничен для этих прогонов. В отличие от других прогонов, где что-то еще было ограничивающим фактором. Больше системного времени (так называемого ядра), чем системного времени, что типично для тяжелых задач ввода-вывода.
Учитывая, что рабочая нагрузка заключалась в копировании файла размером 6 ГБ, мы можем сделать вывод, что 11-секундные прогоны в среднем составляют более 0,5 ГБ операций записи в секунду. Столбец O каждый раз подтверждает одно и то же количество операций записи в соответствии с процессом простого копирования одного файла.
Однако столбец ввода имеет серьезные колебания. Медленные прогоны имеют примерно одинаковое чтение и запись. Но быстрые прогоны не делают никаких чтений! Я предполагаю, что файл все еще кэшируется в ОЗУ с момента его последнего чтения. DRAM намного быстрее, чем даже твердотельные накопители. Что является большим приростом скорости, пока из-за нехватки памяти ОС не удалит кэшированные данные и не будет вынуждена снова читать из медленного хранилища.
Итак, это 200-секундная задача, которая иногда может занимать 12 секунд. Вероятно, из-за кеша страниц Linux.
Поиск первопричины проблем с производительностью часто требует более глубокого понимания системы в целом, помимо какого-либо конкретного набора показателей.
Используемая файловая система представляет собой удаленное сетевое запоминающее устройство.
Обратите внимание, что ваша копия находится в сетевом хранилище, поэтому это также может быть что угодно в удаленной системе или в сети между ними. Производительность удаленного хранилища. Скорость и использование сети (вероятно, IP). Или это может быть локально для этой виртуальной машины, где гость конкурирует за ресурсы со всем остальным, работающим в вашей инфраструктуре.
Всегда можно углубиться в то, как все работает.Имеет ли вообще значение сетевое хранилище (NFS?), или вы также видите это для локального диска? На самом деле 0,7 секунды пользовательского процессорного времени — это довольно много работы, сколько стоит учет для управления многими системными вызовами? Что на самом деле означает занятость ЦП, когда большая часть этого ожидает медленную память и очень медленное хранилище? Непростые вопросы, на которые нужно ответить, однако, возможно, нет необходимости копать слишком глубоко, когда все работает адекватно.