Рейтинг:0

Постоянная ошибка Zpool для raidz2

флаг cn

Проблема: Zpool показывает «ошибки: обнаружены постоянные ошибки в следующих файлах: tank/vms/fileserver:<0x0>

На сервере шесть дисков по 12Тб в RAIDZ2. Это вращающиеся диски. Zpool показывает, что все диски подключены к сети. Нет ошибок чтения, записи или cksum. ОС: Ubuntu 20.04.3 и zfsutils-linux 0.8.3-1ubuntu12.13

Я никогда раньше не видел постоянной ошибки и не понимаю, как это исправить. Насколько я понимаю, с raidz2 на машине может выйти из строя до двух дисков, не выходя из строя. Если пойдет третий, то zpool исчезнет. Это верно? В этой ситуации ни один диск не показывает неисправность, и отображается только постоянная ошибка. Если нет неисправных дисков, разве zfs не сможет восстановить или восстановить файл из других исправных копий на raidz2? Там, убрав постоянную ошибку.Или надо переходить на raidz3?

В данном случае это наш резервный сервер. Если виртуальная машина файлового сервера работала на этом компьютере, когда произошла эта постоянная ошибка, будет ли виртуальная машина уничтожена?

Из того, что мне удалось найти, мое сообщение об ошибке связано с повреждением данных объекта. Я заметил это сообщение только потому, что репликация zfs, идущая с нашего основного сервера на этот резервный сервер, зависла при попытке синхронизировать файловый сервер. Чтобы исправить это, я прочитал, что мне нужно удалить рассматриваемый файл. Пометит ли zfs эти блоки как плохие и перестроит файл из хорошей копии в другом месте на диске?

Вот несколько мест, которые я читал до сих пор:

Восстановление поврежденных данных

На что указывает постоянная ошибка ZFS?

С уважением, ожидающий

Рейтинг:0
флаг za

Насколько я понимаю, с raidz2 на машине может выйти из строя до двух дисков, не выходя из строя. Если пойдет третий, то zpool исчезнет. Это верно?

Нет. В массиве может быть до двух дисков без отключения. Это не имеет ничего общего с подъемом или опусканием машины.

В этой ситуации ни один диск не показывает неисправность, и отображается только постоянная ошибка.

Он показывает постоянную ошибку в файле. В уже удаленном файле, насколько я понимаю (но исходный вопрос все еще отсутствует статус пула вывод, у нас есть только ваша потенциально ошибочная интерпретация). Возможности самовосстановления ZFS не являются волшебными, fs может восстанавливаться после ошибок до определенного порога, но затем, как правило, случаются плохие вещи. Типа ваши постоянные ошибки. Чаще всего это когда у вас есть несколько ошибок контрольной суммы на нескольких дисках, пересекающихся в каком-то файле. Без статус пула трудно догадаться.

Если нет неисправных дисков, разве zfs не сможет восстановить или восстановить файл из других исправных копий на raidz2?

Это было бы, но не для удаленного файла.

Там, убрав постоянную ошибку.

Итак, вы хотите, чтобы zfs просто молча проглатывал ошибки. В ИТ дела обстоят не так. Часть ядра zfs жалуется на возникающие ошибки, и это хорошо.

Если виртуальная машина файлового сервера работала на этом компьютере, когда произошла эта постоянная ошибка, будет ли виртуальная машина уничтожена?

Зависит от. Если этот поврежденный файл представляет собой том zfs, который виртуальная машина использует для своего диска, то наверняка так и будет.

Пометит ли zfs эти блоки как плохие и перестроит файл из хорошей копии в другом месте на диске?

Вероятно, это уже произошло. Просто почистите пул, и ошибка исчезнет через некоторое время (хотя и не сразу).

И не используйте zfs на Linux в продакшене. Да, эта часть получит десятки минусов, но это суровая правда. Никто не заботится о zfs на Linux в производстве. Бесстрашный лидер Linux открыто отрицает необходимость в нем и ненавидит его кишки, потому что он происходит от его самой ненавистной Sun Microsystems и распространяется под лицензией CDDL. Используйте FreeBSD или Solaris (да, Joyent SmartOS также является возможным выбором, хотя это немного экзотично), по крайней мере, эти две системы намного надежнее, когда речь идет о zfs. Solaris по-прежнему имеет каноническую реализацию zfs (ни Linux, ни FreeBSD не могут использовать ее в качестве свопа (один раз они заявили, что могут, но после некоторых усилий это оказалось просто неправдой), и не может выполнить аварийный сброс на нее, а в Solaris эти два вещи родные). Да, у Linux такая широкая пользовательская база, что FreeBSD кажется статистической ошибкой по сравнению с ней, но дело в том, что когда дело доходит до людей, использующих zfs, пользовательская база FreeBSD zfs намного больше, чем у Linux.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.