У меня есть несколько пулов zfs, и каждый месяц или около того во время нормальной работы основной пул начинает перестраиваться (восстанавливаться) с запасным и случайным диском. Глядя на dmesg, я вижу это:
[Среда, 24 ноября, 13:20:37 2021] аудит: type=1400 аудит(1637781634.835:321): apparmor="STATUS" operation="profile_replace" info="то же, что и текущий профиль, пропуская" profile="unconfined" name= "snap.canonical-livepatch.hook.connect-plug-etc-update-motd-d" pid=2454976 comm="apparmor_parser"
[Среда, 24 ноября, 13:20:38 2021] loop27: обнаружено изменение емкости с 0 на 8
[Ср, 24 ноября, 13:24:48 2021] sde: sde1 sde9
[Ср, 24 ноября, 13:31:26 2021] sdl: sdl1 sdl9
[Среда, 24 ноября, 15:15:02 2021] kauditd_printk_skb: подавлено 42 обратных вызова
Это через несколько дней после загрузки системы из-за обновлений программного обеспечения. Я предполагаю, что сообщения для sde и sdl указывают на то, что диски каким-то образом ушли из системы и повторно обнаружены? Во время загрузки за сообщением о разделах следует сообщение о прикрепленном диске, здесь это не так.
Ищем причины. sde подключен к карте sas9201, а оттуда к другому корпусу коробки со всеми этими дисками. sdl подключен к контроллеру MB. Обратите внимание, что это всегда два диска на разных контроллерах примерно в одно и то же время. Это всегда были разные диски. 2 разных контроллера.Хотелось бы предположить, что кабели или что-то простое, но разные контроллеры примерно в одно и то же время и каждый раз разные диски? Также, казалось бы, исключается проблема с контроллером. Это система, которая работала больше года, и только несколько месяцев назад начала делать это.
Система работает нормально, в остальном проблем нет. Глюк, каким бы он ни был, не вызывает ничего, кроме перестроения пула zfs, ничего не теряется и больше ничего не глючит. К ИБП подключены как система, так и дисковый массив. Я не вижу других сообщений в файлах журналов, указывающих на какую-либо проблему, ничего, что говорит о том, что что-то исчезло.
Искал какие-то баги, не нашел. Это странная проблема. Ошибок погружения на этих дисках нет, в смарте ничего необычного.
Есть ли что-нибудь, что я могу сделать для дальнейшей отладки? Что-то включить или изменить настройку? Предложения?