Рейтинг:0

FAILED md RAID10, запутанный вывод

флаг in

Я тестирую здесь массив RAID10 с помощью mdadm. Я хотел посмотреть, сколько неисправных устройств он может выдержать, время восстановления и т. Д. В какой-то момент он выполнил повторную синхронизацию на 5 или 6 устройствах, затем я перезагрузил его. Теперь он показывает неактивность, и я не уверен, что это делает или как вернуть его.

Там нет ничего важного, и я мог бы просто воссоздать его, но я бы предпочел выяснить, что пошло не так, и можно ли его восстановить.

root@netcu1257-vs-02:~# cat /proc/mdstat Личности: [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : неактивный sdz[19] sdy[ 18] sdx[17] sdw[16] sdv[15] sdu[14] sds[12] sdt[13] sdr[11] sdq[10](S) sdp[21] sdn[8] sdm[7] sdo [9] sdl[6] sdj[20](R) sdk[22](S) sdi[4](S) sdh[3] sdf[1] sde[0] sdg[2]
              257812572160 блоков супер 1.2
        root@netcu1257-vs-02:~# mdadm -D /dev/md0
        /dev/md0:
                   Версия : 1.2
             Время создания: пт, 29 октября, 13:59:41 2021
                Уровень рейда: рейд10
             Используемый размер разработчика: 18446744073709551615
              Рейдовые устройства: 20
             Всего устройств: 22
               Постоянство: суперблок постоянен
    
           Время обновления: понедельник, 8 ноября, 09:59:42 2021 г.
                 Состояние: активно, НЕУДАЧНО, Не запущено 
        Активные устройства: 13
       Рабочие устройства: 22
        Неудачные устройства: 0
         Запасные устройства: 9
    
                Макет: почти=2
            Размер блока: 512 КБ
    
    Политика согласованности: неизвестно
    
                  Имя: netcu1257-vs-02:0 (локально для хоста netcu1257-vs-02)
                  UUID: c3418360:4fb5857c:eb952018:163a60c6
                События : 85985
    
        Номер Основной Младший RaidDevice State
           - 0 0 0 удалено
           - 0 0 1 удалено
           - 0 0 2 удалено
           - 0 0 3 удалено
           - 0 0 4 удалено
           - 0 0 5 удалено
           - 0 0 6 удалено
           - 0 0 7 удалено
           - 0 0 8 удалено
           - 0 0 9 удалено
           - 0 0 10 удалено
           - 0 0 11 удалено
           - 0 0 12 удалено
           - 0 0 13 удалено
           - 0 0 14 удалено
           - 0 0 15 удалено
           - 0 0 16 удалено
           - 0 0 17 удалено
           - 0 0 18 удалено
           - 0 0 19 удалено
    
           - 65 112 17 набор синхронизации-B /dev/sdx
           - 8 64 0 запасная пересборка /dev/sde
           - 8 208 8 sync set-A /dev/sdn
           - 65 80 15 sync set-B /dev/sdv
           - 8 176 6 sync set-A /dev/sdl
           - 65 48 13 набор синхронизации-B /dev/sdt
           - 8 144 5 запасных перестроений /dev/sdj
           - 65 16 11 набор синхронизации-B /dev/sdr
           - 8 112 3 sync set-B /dev/sdh
           - 8 240 7 запасных перестроений /dev/sdp
           - 65 128 18 набор синхрониз.-A /dev/sdy
           - 8 80 1 набор синхронизации-B /dev/sdf
           - 8 224 9 запасных перестроений /dev/sdo
           - 65 96 16 набор синхронизации-A /dev/sdw
           - 8 192 10 запасных перестроений /dev/sdm
           - 65 64 14 набор синхронизации-A /dev/sdu
           - 8 160 - запасной /dev/sdk
           - 65 32 12 набор синхронизации-A /dev/sds
           - 8 128 - запасной /dev/sdi
           - 65 0 - запасной /dev/sdq
           - 65 144 19 sync set-B /dev/sdz
           - 8 96 2 запасных ребилда /dev/sdg

Как видите, все мои устройства (/dev/sd[e-z]) отображаются как часть md0, однако также отображаются 20 отсутствующих устройств. Первоначальный формат массива был 20 устройств с 2 запасными. И хотя он говорит, что перестраивается, дисковая активность отсутствует, и /proc/mdstat указывает то же самое.

Это восстановимо? И учитывая, что массив перестраивался до перезагрузки хоста, что я мог сделать, чтобы гарантировать, что перестроение продолжится, а массив останется активным после перезагрузки?

редактировать:

Я обнаружил, что мой файл mdadm.conf был неправильно помещен в /etc/. Я переместил его в /etc/mdadm/ и перезагрузился, теперь мой массив отображается как RAID0, все еще неактивный:

root@netcu1257-vs-02:~# mdadm -D /dev/md0
/dev/md0:
           Версия : 1.2
        Уровень рейда: рейд0
     Всего устройств: 22
       Постоянство: суперблок постоянен

             Состояние: неактивно
   Рабочие устройства: 22

              Имя: netcu1257-vs-02:0 (локально для хоста netcu1257-vs-02)
              UUID: c3418360:4fb5857c:eb952018:163a60c6
            События : 85985

    Номер Основной Младший RaidDevice

       - 65 112 - /dev/sdx
       - 8 64 - /dev/sde
       - 8 208 - /dev/sdn
       - 65 80 - /dev/sdv
       - 8 176 - /dev/sdl
       - 65 48 - /dev/sdt
       - 8 144 - /dev/sdj
       - 65 16 - /dev/sdr
       - 8 112 - /dev/sdh
       - 8 240 - /dev/sdp
       - 65 128 - /dev/sdy
       - 8 80 - /dev/sdf
       - 8 224 - /dev/sdo
       - 65 96 - /dev/sdw
       - 8 192 - /dev/sdm
       - 65 64 - /dev/sdu
       - 8 160 - /dev/sdk
       - 65 32 - /dev/sds
       - 8 128 - /dev/sdi
       - 65 0 - /dev/sdq
       - 65 144 - /dev/sdz
       - 8 96 - /dev/sdg
Nikita Kipriyanov avatar
флаг za
Я сомневаюсь, что это должно быть на ServerFault. Этот сайт посвящен проблемам бизнеса, а не любопытным экспериментам с Linux. Я бы перенес это на Unix&Linux.
флаг in
Почему вы решили, что это не для использования в бизнесе? В каком бизнесе вы участвуете, который не тестирует свою технологию, прежде чем запускать ее в производство?
Рейтинг:0

Вам нужно заново добавить все диски.

Для всех в наборе-А. то же самое для набора-B

mdadm --manage /dev/mdN -a /dev/sdX1

Перед этим попробуйте простой

mdadm --assemble /dev/mdN /dev/sd? ...
Ярослав Рахматуллин avatar
https://www.thomas-krenn.com/en/wiki/Mdadm_recovery_and_resync
Nikita Kipriyanov avatar
флаг za
Скорее всего, они увидят сообщение о том, что устройство занято, если попытаются последовать вашему совету. Потому что устройства уже будут заняты. Также рекомендуемым источником информации является [официальная вики Linux RAID] (https://raid.wiki.kernel.org/index.php/Linux_Raid#When_Things_Go_Wrogn)
флаг in
Спасибо. Я уже просмотрел информацию на странице mdadm в вики, но не видел страницу Assemble Run. Я буду работать с хорошей информацией там, а также в этом ответе.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.