Отвечая на мой собственный вопрос, я нашел решение.
Убийства oom происходили даже тогда, когда бесплатная статистика выглядела хорошо, например, на 256 ГБ ОЗУ использовалось только 140 ГБ, и все же около 100 ГБ отображались как свободные.
[root@serverxx ~]# бесплатно -g
общее количество использованных бесплатных общих баффов/доступных кешей
Мем: 251 140 108 0 2 108
Обмен: 19 6 13
Убийства oom были вызваны высоким %commit в статистике sar, когда ядро начинает нацеливаться на экземпляры с большим объемом памяти, чтобы освободить .
Чтобы избежать oom kills для гостевых экземпляров с большим объемом памяти, я установил следующее.
vm.oom_kill_allocating_task=1
Когда я сделал sar -r, процент фиксации был намного выше, чем система может выделить, и я понял из ps, что это был контейнер cinder-backup, который был создан по умолчанию из развертываний kolla-ansible, но не был настроен.
Статистика службы резервного копирования Cinder, которую я не настраивал, и она просто работала, оказалось, что ненастроенный контейнер занимает всю память сверхурочно, как видно из вывода команды ps в файле vsz.
ps -eo args,comm,pid,ppid,rss,vsz --sort столбец vsz
ВСЗ чрезвычайно высок
КОМАНДА Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â Â КОМАНДА Â Â Â Â Â Â Â Â Â Â PID Â Â Â PPID Â RSS VS Z Â
/usr/libexec/qemu-kvm -name qemu-kvm 1916998 47324 8094744 13747664
/var/lib/kolla/venv/bin/pyt cinder-backup 43689 43544 170999912 870274784
Статистика Sar для % фиксации возвращается к норме после того, как контейнер резервного копирования был остановлен, и теперь все возвращается к норме. %commit выделен из от 1083,46 до 14,21 после изменений.
14:00:37 kbmemfree kbavail kbmemused %memused kbbuffers kbcached kbcommit %commit kbactive kbinact kbdirty
15:00:37 48843576 49998184 82890508 62,92 9576 5949348 1427280428 1083.46 75646888 2797388 324
15:10:37 48829248 49991284 82904836 62,93 9576 5956544 1427343664 1083.50 75653556 2804592 116
15:20:22 120198612 121445516 11535472 8,76 9576 6042892 18733688 14.22 4887688 2854704 80
15:30:37 120189464 121444176 11544620 8,76 9576 6050200 18725820 14.21 4887752 2862248 88