Рейтинг:1

Резкие сбои выделения страниц, приводящие к сбою системы

флаг it

Мы запускаем платформу, которая использует мост Linux для фильтрации трафика, а также регистрирует эту активность на сервере MySQL. Иногда у нас возникает проблема, когда устройство испытывает очень большую задержку, и в результате мы часто видим повторяющийся сбой выделения страницы в mpt3sas водитель и авторизовался в /var/журнал/сообщения. Похоже, что это происходит во время высокой загрузки системы, а также в системе с, казалось бы, достаточным объемом памяти. У меня нет опыта, чтобы правильно читать эти журналы, и я надеялся, что кто-то может что-то понять.

Я пробовал настроить vm.min_free_kbytes = 65536 (и мы используем vm.reclaim_mode = 1), но это, кажется, не облегчает проблему. У кого-нибудь есть какие-либо идеи? (Журналы следуют :)

ядро ​​localhost: [21572436.601597] sas3ircu: ошибка выделения страницы: порядок: 4, режим: 0xcc0 (GFP_KERNEL), маска узла = (нуль), cpuset =/, mems_allowed = 0
ядро ​​localhost: [21572436.601601] ЦП: 2 PID: 22663 Связь: sas3ircu Заражено: G W O # 1
Ядро localhost: [21572436.601602] Имя оборудования: XXXXXXXXXXX , BIOS 3.1 06/06/2018
Ядро локального хоста: [21572436.601602] Трассировка вызовов:
ядро локального хоста: [21572436.601609] dump_stack+0x7c/0x9c
ядро локального хоста: [21572436.601612] warn_alloc.cold+0x7b/0xdf
ядро локального хоста: [21572436.601615]? _cond_resched+0x15/0x30
ядро локального хоста: [21572436.601617]? __alloc_pages_direct_compact+0x141/0x150
ядро локального хоста: [21572436.601618] __alloc_pages_slowpath+0xd88/0xdc0
ядро локального хоста: [21572436.601622]? node_reclaim+0x2b1/0x310
ядро локального хоста: [21572436.601624]? get_page_from_freelist+0xaf/0x3a0
ядро локального хоста: [21572436.601625] __alloc_pages_nodemask+0x2bf/0x310
ядро локального хоста: [21572436.601628] __dma_direct_alloc_pages+0x137/0x220
ядро локального хоста: [21572436.601630] dma_direct_alloc_pages+0x1c/0x80
ядро локального хоста: [21572436.601639] _ctl_do_mpt_command+0x724/0xc40 [mpt3sas]
ядро локального хоста: [21572436.601642]? ima_file_check+0x59/0x80
ядро локального хоста: [21572436.601646] _ctl_compat_mpt_command+0xd1/0x100 [mpt3sas]
ядро локального хоста: [21572436.601651] _ctl_ioctl_main+0x4e0/0xb80 [mpt3sas]
ядро локального хоста: [21572436.601655]? __ia32_compat_sys_ioctl+0x189/0x210
ядро локального хоста: [21572436.601656] __ia32_compat_sys_ioctl+0x189/0x210
ядро локального хоста: [21572436.601659] do_int80_syscall_32+0x6e/0x1d0
ядро локального хоста: [21572436.601660] entry_INT80_compat+0x85/0x90
Ядро локального хоста: [21572436.601669] Информация о памяти:
ядро локального хоста: [21572436.601672] active_anon: 9743919 inactive_anon: 513867 изолированный_anon: 0
ядро ​​локального хоста: [21572436.601672] активный_файл: 35892 неактивный_файл: 14339 изолированный_файл: 0
ядро ​​localhost: [21572436.601672] невозможное: 0 грязное: 398 обратная запись: 1 нестабильный: 0
ядро локального хоста: [21572436.601672] slab_reclaimable: 51419 slab_unreclaimable: 4912133
ядро ​​localhost: [21572436.601672] сопоставлено: 18355 shmem: 22661 таблицы страниц: 53364 отказов: 0
ядро локального хоста: [21572436.601672] бесплатно: 1065699 free_pcp: 351 free_cma: 0
ядро ​​localhost: [21572436.601675] Узел 0 shmem_pmdmapped: 0 КБ anon_thp: 0 КБ writeback_tmp: 0 КБ нестабильный: 0 КБ all_unreclaimable? нет
ядро ​​localhost: [21572436.601675] Узел 0 DMA свободный: 15884 КБ мин: 12 КБ низкий: 24 КБ высокий: 36 КБ active_anon: 0 КБ inactive_anon: 0 КБ 0kB pagetables:0kB bounce:0kB free_pcp:0kB local_pcp:0kB free_cma:0kB
ядро локального хоста: [21572436.601678] lowmem_reserve []: 0 1784 64117 64117
localhost kernel: [21572436.601679] Node 0 DMA32 free:255804kB min:1892kB low:3788kB high:5684kB active_anon:170384kB inactive_anon:80484kB active_file:0kB inactive_file:0kB unevictable:0kB writepending:0kB present:1965184kB managed:1899648kB mlocked:0kB kernel_stack: 0kB pagetables:56kB bounce:0kB free_pcp:0kB local_pcp:0kB free_cma:0kB
ядро локального хоста: [21572436.601682] lowmem_reserve []: 0 0 62333 62333
localhost kernel: [21572436.601683] Node 0 Normal free:3991108kB min:63624kB low:127460kB high:191296kB active_anon:38805292kB inactive_anon:1974984kB active_file:143684kB inactive_file:57032kB unevictable:0kB writepending:1596kB present:65011712kB managed:63836092kB mlocked:0kB kernel_stack: 5604kB pagetables:213400kB bounce:0kB free_pcp:1404kB local_pcp:232kB free_cma:0kB
ядро локального хоста: [21572436.601686] lowmem_reserve[]: 0 0 0 0
ядро localhost: [21572436.601687] Узел 0 DMA: 1*4 КБ (U) 1*8 КБ (U) 0*16 КБ 0*32 КБ 2*64 КБ (U) 1*128 КБ (U) 1*256 КБ (U) 0*512 КБ 1 *1024 КБ (U) 1*2048 КБ (M) 3*4096 КБ (M) = 15884 КБ
ядро localhost: [21572436.601694] Узел 0 DMA32: 14687*4 КБ (UME) 10010*8 КБ (UME) 7183*16 КБ (UME) 0*32 КБ 0*64 КБ 0*128 КБ 0*256 КБ 0*512 КБ 0*1024 КБ 1*2048 КБ З) 0*4096 КБ = 255804 КБ
ядро localhost: [21572436.601697] Узел 0 Обычный: 297793*4 КБ (UM) 129409*8 КБ (UM) 110330*16 КБ (UME) 0*32 КБ 0*64 КБ 0*128 КБ 0*256 КБ 0*512 КБ 0*1024 КБ 0*2048 КБ *4096 КБ = 3991724 КБ
Ядро локального хоста: [21572436.601701] Узел 0 hugepages_total=0 hugepages_free=0 hugepages_surp=0 hugepages_size=1048576kB
Ядро локального хоста: [21572436.601702] Узел 0 hugepages_total=0 hugepages_free=0 hugepages_surp=0 hugepages_size=2048kB
ядро ​​localhost: [21572436.601702] 107240 всего страниц кеша страниц
ядро ​​localhost: [21572436.601707] 34281 страница в кеше подкачки
ядро ​​localhost: [21572436.601708] Статистика кеша подкачки: добавить 18740072, удалить 18705912, найти 159408767/161694352
ядро ​​локального хоста: [21572436.601708] Свободный обмен = 4913860 КБ
ядро ​​localhost: [21572436.601708] Общий объем подкачки = 33554424 КБ
ядро ​​localhost: [21572436.601709] 16748216 страниц ОЗУ
ядро локального хоста: [21572436.601709] 0 страниц HighMem/MovableOnly
ядро localhost: [21572436.601709] зарезервировано 310310 страниц
ядро localhost: [21572436.601710] 0 страниц cma зарезервировано
ядро ​​localhost: [21572436.601710] 0 страниц hwpoisoned
Ядро localhost: [21572436.601711] сбой в драйверах/scsi/mpt3sas/mpt3sas_ctl.c:763/_ctl_do_mpt_command()!
Wilson Hauck avatar
флаг jp
Запрос дополнительной информации, пожалуйста. Любые устройства SSD или NVME на хост-сервере MySQL? Опубликуйте на pastebin.com и поделитесь ссылками. Из вашего корня входа SSH, текстовые результаты: A) ВЫБРАТЬ COUNT(*) FROM information_schema.tables; B) ПОКАЗАТЬ ГЛОБАЛЬНЫЙ СТАТУС; минимум через 24 часа UPTIME C) ПОКАЗАТЬ ГЛОБАЛЬНЫЕ ПЕРЕМЕННЫЕ; И очень полезная информация об ОС, включая: хтоп вершина ulimit -a для списка ограничений Linux/Unix, iostat -xm 5 3 для IOPS по устройствам и количеству ядер/процессоров, для анализа настройки рабочей нагрузки сервера, чтобы предоставить предложения.
Wilson Hauck avatar
флаг jp
Почему возникает путаница с 12 строками с конца опубликованного журнала с огромным размером страниц 1G и 2M? 2 строки следуют здесь. Ядро локального хоста: [21572436.601701] Узел 0 hugepages_total=0 hugepages_free=0 hugepages_surp=0 hugepages_size=1048576kB Ядро localhost: [21572436.601702] Node 0 hugepages_total=0 hugepages_free=0 hugepages_surp=0 hugepages_size=2048kB Просто любопытно, и похоже, что hugepages никогда не использовали этот сеанс, должны ли они вообще быть включены? Некоторые таланты предполагают, что для MySQL их всегда следует отключать.
Wilson Hauck avatar
флаг jp
Мой анализ рабочей нагрузки по-прежнему доступен для вас после публикации ваших данных. Спасибо

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.