Рейтинг:2

Резервное копирование и восстановление данных пула ZFS

флаг cn

В настоящее время у меня есть пул zfs raidz2, застрявший в цикле повторного использования, когда я пытался заменить диски емкостью 3 ТБ на диски емкостью 8 ТБ. После того, как первый сменный диск был подключен к сети более недели, он, наконец, закончился только для того, чтобы немедленно начать снова.После пометки диска "OFFLINE" второй ресильвер завершился примерно за 2 дня. Я отметил диск онлайн, и все выглядело хорошо (на пару минут), поэтому я заменил второй диск. Как только восстановление началось для второго диска, оно показало, что первый диск также снова подвергается повторному использованию. Сейчас я нахожусь в третьем или четвертом цикле повторного использования этих двух дисков, и при повторном преобразовании двух дисков у меня нет отказоустойчивости. На этом этапе я хотел бы создать резервную копию zpool в общем ресурсе nfs и воссоздать его с новыми дисками, но я не хочу потерять всю свою конфигурацию набора данных, которая включает в себя все мои тюрьмы. Есть ли способ экспортировать весь zpool в качестве резервного образа, который можно как-то восстановить? Файловая система другой машины с достаточным дисковым пространством для хранения всех этих данных уже использует другую файловую систему, поэтому репликация zfs, вероятно, не подходит. Это установка TrueNAS-12.0-U4. Резервная машина работает под управлением Ubuntu 21.04 с LVM/Ext4. Ниже приведен текущий статус пула.


  бассейн: бассейн0
 состояние: ДЕГРАДАЦИЯ
статус: в настоящее время выполняется резервирование одного или нескольких устройств. Бассейн будет
    продолжают функционировать, возможно, в ухудшенном состоянии.
Действие: Дождитесь завершения восстановления.
  сканирование: resilver выполняется с четверга, 29 июля, 00:39:12 2021 г.
    13,8 Тб отсканировано со скоростью 273 Мб/с, 13,0 Тл выдано со скоростью 256 Мб/с, всего 13,8 Тл
    2.17G восстановлено, выполнено 93,77%, осталось 00:58:48
конфигурация:

    ИМЯ СОСТОЯНИЕ ЧТЕНИЕ ЗАПИСЬ CKSUM
    pool0 ДЕГРАДИРОВАННЫЙ 0 0 0
      raidz2-0 ДЕГРАДАЦИЯ 0 0 0
        gptid/55bf3ad6-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0
        gptid/55c837e3-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0
        gptid/55f4786c-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0
        gptid/60dcf0b8-eef3-11eb-92f9-3cecef030ab8 OFFLINE 0 0 0 (повторное серебрение)
        gptid/56702d96-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0
        gptid/5685b5f7-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0
        gptid/8f041954-eef3-11eb-92f9-3cecef030ab8 OFFLINE 0 0 0 (повторное серебрение)
        gptid/56920c3a-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0
    тайник
      gptid/56256b6a-3747-11eb-a0da-3cecef030ab8 ОНЛАЙН 0 0 0

ошибки: Нет известных ошибок данных
Рейтинг:1
флаг ca

Ты можешь использовать моментальный снимок zfs -r pool0@backup; zfs отправить -R pool0@backup > zfs.img для создания реплицированного потока отправки, который вы можете восстановить с помощью zfs recv.

Тем не менее, похоже, что проблема описана здесь Вы также можете попробовать отключить deferred resilver через zfs_resilver_disable_defer настраиваемый.

Jason avatar
флаг cn
Это лучше, чем то, что я собирался сделать. Я установил zfs на другом компьютере и создал пул на разреженном файле vdev, который я собирался реплицировать. Это сэкономит мне место и шаг. Я сейчас пробую zfs resilver_disable_defer. Странно то, что как только он завершается с отключенными устройствами, он отображается как завершенный, а изменения сообщения на одном или нескольких устройствах были переведены в автономный режим ... но при возвращении их в онлайн перезапускает resilver. Я также тестирую очистку, пока два диска все еще отключены, и это позволит мне очистить.
shodanshok avatar
флаг ca
@Jason Джейсон, использующий zpool sparse-vdev, является хорошим решением, так как позволяет вам немедленно получить пул и посмотреть, присутствуют ли все файлы.
Jason avatar
флаг cn
Делает ли эта настройка что-нибудь, если эта функция уже включена для пула? Я попытался включить его в веб-интерфейсе на странице настроек, но, похоже, он ничего не сделал. размещение дисков в сети сразу же превратило мой скраб в еще один resilver. Может быть, я делаю это неправильно. Как мне правильно настроить эту настройку?
shodanshok avatar
флаг ca
Это *должно* быть применимо с включенной соответствующей функцией для пула, но я не уверен, что это решит вашу проблему. Вы можете проверить, включен ли он через командную строку, введя `sysctl -a | grep disable_defer`
Jason avatar
флаг cn
Я думаю, что неправильно понял, что происходит, когда диск показывает OFFLINE (повторное серебрение). Похоже, что он просто сканировал онлайн-диски, пока это происходило, не оставляя диск вне операций чтения и резервируя его. После дальнейших исследований выяснилось, что это и есть предполагаемая функциональность, поэтому я позволю ему завершить расчетный 10-дневный онлайн-реверс для этих дисков и посмотреть, где мы приземлимся, прежде чем отключить мой основной NAS.
Jason avatar
флаг cn
Я запустил резервное копирование моментального снимка в разреженный пул файлов на другой машине, что займет пару дней, так что посмотрим, не потеряю ли я терпение, пытаясь заменить еще 6 дисков по 10 дней за раз.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.