Рейтинг:0

Восстановление RAID1 после деградации

флаг ye

Ниже приведены выходные данные lsblk, mdadm и /proc/mdstat для моего двухдискового массива Raid1.

anand@ironman:~$ lsblk 
НАИМЕНОВАНИЕ MAJ:MIN RM РАЗМЕР RO ТИП ТОЧКА КРЕПЛЕНИЯ
sda 8:0 0 465.8G 0 диск  
|-sda1 8:1 0 976M 0 часть  
| `-md0 9:0 0 975.4M 0 рейд1 
| `-vg_boot-boot (dm-6) 253:6 0 972M 0 lvm /boot
`-sda2 8:2 0 464.8G 0 часть  
sdb 8:16 0 465.8G 0 диск  
|-sdb1 8:17 0 976M 0 часть  
`-sdb2 8:18 0 464.8G 0 часть  
  `-md1 9:1 0 464.7G 0 рейд1 
    |-vg00-root (dm-0) 253:0 0 93.1G 0 лвм /
    |-vg00-home (dm-1) 253:1 0 96.6G 0 lvm /home
    |-vg00-var (дм-2) 253:2 0 46.6G 0 lvm /var
    |-vg00-usr (дм-3) 253:3 0 46.6G 0 lvm /usr
    |-vg00-swap1 (dm-4) 253:4 0 7.5G 0 лвм [СВАП]
    `-vg00-tmp (dm-5) 253:5 0 952M 0 lvm /tmp

anand@ironman:~$ кот /proc/mdstat
Личности: [raid1] 
md1 : активный рейд1 sdb2[1]
      487253824 блока супер 1.2 [2/1] [_U]
      
md0 : активный рейд1 sda1[0]
      998848 блоков супер 1.2 [2/1] [U_]
      
неиспользуемые устройства: <нет>

anand@ironman:~$ sudo mdadm -D /dev/md0 /dev/md1
/dev/md0:
        Версия : 1.2
  Время создания: 22 мая 21:00:35 2013 г.
     Уровень рейда: рейд1
     Размер массива: 998848 (975,60 МБ 1022,82 МБ)
  Используемый размер разработки: 998848 (975,60 МБ 1022,82 МБ)
   Рейдовые устройства: 2
  Всего устройств : 1
    Постоянство: суперблок постоянен

    Время обновления: четверг, 21 октября, 14:35:36 2021 г.
          Состояние: чистый, деградированный 
 Активные устройства: 1
Рабочие устройства: 1
 Неудачные устройства: 0
  Запасные устройства : 0

           Имя: ironman:0 (локальное для хоста ironman)
           UUID: cbcb9fb6:f7727516:9328d30a:0a970c9b
         События : 4415

    Номер Основной Младший RaidDevice State
       0 8 1 0 активная синхронизация /dev/sda1
       1 0 0 1 удалено
/dev/md1:
        Версия : 1.2
  Время создания : среда, 22 мая, 21:00:47 2013 г.
     Уровень рейда: рейд1
     Размер массива: 487253824 (464,68 ГиБ 498,95 ГБ)
  Используемый размер разработки: 487253824 (464,68 ГБ 498,95 ГБ)
   Рейдовые устройства: 2
  Всего устройств : 1
    Постоянство: суперблок постоянен

    Время обновления: четверг, 21 октября, 14:35:45 2021 г.
          Состояние: чистый, деградированный 
 Активные устройства: 1
Рабочие устройства: 1
 Неудачные устройства: 0
  Запасные устройства : 0

           Имя: ironman:1 (локальное для хоста ironman)
           UUID: 3f64c0ce:fcb9ff92:d5fd68d7:844b7e12
         События : 63025777

    Номер Основной Младший RaidDevice State
       0 0 0 0 удалено
       1 8 18 1 активная синхронизация /dev/sdb2

Какие команды можно использовать для восстановления после сбоя raid1?

Должен ли я получить новый жесткий диск, чтобы безопасно собрать рейд1? настраивать?

Обновление 1:

    anand@ironman:~$ sudo smartctl -H /dev/sda 
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (локальная сборка)
Copyright (C) 2002-11 Брюс Аллен, http://smartmontools.sourceforge.net

=== НАЧАЛО ЧТЕНИЯ РАЗДЕЛА SMART DATA ===
Результат теста SMART для самооценки общего состояния здоровья: ПРОЙДЕН
Обратите внимание на следующие маргинальные атрибуты:
ID# ATTRIBUTE_NAME FLAG VALUE HORST THRESH TYPE ОБНОВЛЕНО WHEN_FAILED RAW_VALUE
190 Airflow_Temperature_Cel 0x0022 054 040 045 Old_age Always In_the_past 46 (0 174 46 28)

anand@ironman:~$ sudo smartctl -H /dev/sdb
smartctl 5.41 2011-06-09 r3365 [x86_64-linux-3.2.0-4-amd64] (локальная сборка)
Copyright (C) 2002-11 Брюс Аллен, http://smartmontools.sourceforge.net

=== НАЧАЛО ЧТЕНИЯ РАЗДЕЛА SMART DATA ===
Результат теста SMART для самооценки общего состояния здоровья: ПРОЙДЕН

Ананд@Ironman:~$ 

Информация S.M.A.R.T.:

Вывод из smartctl -a -d ata /dev/sda Вывод из smartctl -a -d ata /dev/sdb

Обновление 2:

anand@ironman:~$ sudo blkid -o список
UUID точки подключения метки fs_type устройства
--------------------------------------------- --------------------------------------------- --------------------------------------------- -
/dev/sda1 linux_raid_member ironman:0 (используется) cbcb9fb6-f772-7516-9328-d30a0a970c9b
/dev/sda2 linux_raid_member ironman:1 (не подключен) 3f64c0ce-fcb9-ff92-d5fd-68d7844b7e12
/dev/sdb1 linux_raid_member ironman:0 (не смонтирован) cbcb9fb6-f772-7516-9328-d30a0a970c9b
/dev/sdb2 linux_raid_member ironman:1 (используется) 3f64c0ce-fcb9-ff92-d5fd-68d7844b7e12
/dev/md0 LVM2_member (используется) JKI3Lr-VdDK-Ogsk-KOQk-jSKJ-udAV-Vt4ckP
/dev/md1 LVM2_member (используется) CAqW3D-WJ7g-2lbw-G3cn-nidp-2jdQ-evFe7r
/dev/mapper/vg00-root корень ext4 / 82334ff8-3eff-4fc7-9b86-b11eeda314ae
/dev/mapper/vg00-home ext4 home /home 8e9f74dd-08e4-45a3-a492-d4eaf22a1d68
/dev/mapper/vg00-var ext4 var /var 0e798199-3219-458d-81b8-b94a5736f1be
/dev/mapper/vg00-usr ext4 usr /usr d8a335fc-72e6-4b98-985e-65cff08c4e22
/dev/mapper/vg00-swap1 своп <своп> b95ee4ca-fcca-487f-b6ff-d6c0d49426d8
/dev/mapper/vg00-tmp ext4 tmp /tmp c879fae8-bd25-431d-be3e-6120d0381cb8
/dev/mapper/vg_boot-boot ext4 boot /boot 12684df6-6c4a-450f-8ed1-d3149609a149

-- Завершить обновление 2

Обновление 3. После выполнения рекомендаций Никиты:

/dev/md0:                                                                           
        Версия: 1.2                                                                           
  Время создания : 22 мая 21:00:35 2013 â                                                                           
     Уровень рейда: рейд1 ✓                                                                           
     Размер массива: 998848 (975,60 МБ 1022,82 МБ) —                                                                           
  Используемый размер разработки: 998848 (975,60 МБ 1022,82 МБ) ✓                                                                           
   Рейдовые устройства: 2 ₽                                                                           
  Всего устройств: 2 ₽                                                                           
    Постоянство: Суперблок постоянен                                                                           
                                                                            ✓                                                                           
    Время обновления: пятница, 22 октября, 21:20:09 2021 —                                                                           
          Состояние: чистое                                                                           
 Активные устройства: 2 ₽                                                                           
Рабочие устройства: 2 шт.                                                                           
 Неудачные устройства: 0 ₽                                                                           
  Запасные устройства: 0 ₽                                                                           
                                                                            ✓                                                                           
           Имя : ironman:0 (локальное для хоста ironman) ✓                                                                           
           UUID: cbcb9fb6:f7727516:9328d30a:0a970c9b –                                                                           
         События : 4478 г.                                                                           
                                                                            ✓                                                                           
    Number Major Minor RaidDevice State â                                                                           
       0 8 1 0 активная синхронизация /dev/sda1 â                                                                           
       2 8 17 1 активная синхронизация /dev/sdb1   



anand@ironman:~/.scripts/automatem/bkp$ sudo mdadm -D /dev/md1 â                                                                           
/dev/md1:                                                                           
        Версия: 1.2                                                                           
  Время создания : 22 мая 21:00:47 2013 â                                                                           
     Уровень рейда: рейд1 ✓                                                                           
     Размер массива: 487253824 (464,68 ГиБ 498,95 ГБ)                                                                           
  Используемый размер разработки: 487253824 (464,68 ГиБ 498,95 ГБ) â                                                                           
   Рейдовые устройства: 2 ₽                                                                           
  Всего устройств: 2 ₽                                                                           
    Постоянство: Суперблок постоянен                                                                           
                                                                            ✓                                                                           
    Время обновления: пятница, 22 октября, 21:21:37 2021 —                                                                           
          Состояние: чистое                                                                           
 Активные устройства: 2 ₽                                                                           
Рабочие устройства: 2 шт.                                                                           
 Неудачные устройства: 0 ₽                                                                           
  Запасные устройства: 0 ₽                                                                           
                                                                            ✓                                                                           
           Имя: ironman:1 (локальное для хоста ironman) ✓                                                                           
           UUID: 3f64c0ce:fcb9ff92:d5fd68d7:844b7e12                                                                           
         События: 63038935 â                                                                           
                                                                            ✓                                                                           
    Number Major Minor RaidDevice State â                                                                           
       2 8 18 0 активная синхронизация /dev/sdb2 â                                                                           
       1 8 34 1 активная синхронизация /dev/sdc2 

Спасибо вам всем!

Ананд

Nikita Kipriyanov avatar
флаг za
Как вы попали в это состояние? См. `dmesg`. Также проверьте S.M.A.R.T. обоих устройств. Да, действия надо предпринимать, но я сомневаюсь, какие именно.
флаг ye
Я обновил информацию S.M.A.R.T.
Nikita Kipriyanov avatar
флаг za
Я бы никогда не стал доверять вердикту диска. Пожалуйста, обратите внимание на `smarctl -A`. Также `blkid`, чтобы проверить, видит ли он какую-либо структуру в `/dev/sda2` и `/dev/sdb1` (теперь неиспользуемые, но похоже, что это вторые ноги RAID1-s).
флаг ye
Добавлен вывод списка blkid -o. Извините, неправильно понял инструкцию. Я скоро обновлю.
Рейтинг:1
флаг za

Кажется, оба ваших диска умирают:

/dev/sda:
  4 Start_Stop_Count 0x0032 096 096 020 Old_age Всегда - 5039
  5 Reallocated_Sector_Ct 0x0033 100 100 036 До отказа Всегда - 240
187 Reported_Uncorrect 0x0032 079 079 000 Old_age Всегда - 21
195 Hardware_ECC_Recovered 0x001a 044 015 000 Old_age Всегда — 26908616

/dev/sdb:
  4 Start_Stop_Count 0x0012 099 099 000 Old_age Всегда - 4911
  5 Reallocated_Sector_Ct 0x0033 088 088 005 До отказа Всегда - 90
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Всегда - 114
197 Current_Pending_Sector 0x0022 001 001 000 Old_age Всегда — 9640

Так что, опять же, никогда не верьте тому, что он говорит о себе, это ложь!

Вам необходимо подключить в третьих диск, разделите его и добавьте в свои RAID-массивы. Подождите, пока он закончит восстановление. Установите там загрузчик. Затем удалите эти два неудачных и подключите четвертый один и повторить снова, чтобы восстановить избыточность.

И настройте периодическую проверку и мониторинг, чтобы избежать такой опасной ситуации в будущем.


Удивительно видеть отдельный загрузочный RAID-массив с LVM на нем. Очень необычно. Первоначальная цель отдельного загрузочного раздела состоит в том, чтобы не размещать его внутри LVM, чтобы к нему можно было получить более легкий доступ (ранние загрузчики ничего не знали о LVM, так что это было требованием).

флаг ye
Хорошо, спасибо за ваш вклад. Я обновлю, как только закончу с предложенными вами шагами.
флаг ye
Вставьте новый диск, скопируйте таблицу разделов с одного из других дисков с помощью sfdisk, а затем добавьте вновь созданные разделы как в md0, так и в md1, и восстановление было завершено. Теперь ждем, пока следующий новый диск завершит шаги. Спасибо!
флаг ye
Могу ли я из любопытства попробовать добавить удаленные разделы /dev/sda2 и /dev/sdc1 (ранее /dev/sdb1) в массив рейда? Что случилось бы?
Nikita Kipriyanov avatar
флаг za
Вы можете сколько угодно играть со старыми жесткими дисками. Единственное, что я советую, это не играть с "производственным" массивом просто из любопытства. Для этого лучше сформировать новый массив из этих старых дисков и нагрузить его, чтобы посмотреть, как он будет работать под нагрузкой. Даже если показывает ошибки или умирает, ваши данные будут в безопасности на новых дисках.
флаг ye
Спасибо, что направили меня.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.