Рейтинг:0

Суперблок xfs поврежден после отключения питания

флаг ng
Ben

Как и другие до меня, супербокс на моем диске xfs был поврежден. Я пробовал xfs_repair и xfs_repair -L восстановить диск, но оба сообщают об одном и том же результате:

Фаза 1 - найти и проверить суперблок...
ошибка чтения суперблока, смещение 0, размер 524288, ag 0, rval -1

фатальная ошибка -- Ошибка ввода/вывода

{mkfs.xfs -Nf /dev/sdb1} сообщает следующее:

meta-data=/dev/sdb1 isize=512 agcount=4, agsize=244188544 BLKS
         = sectsz=4096 attr=2, projid32bit=1
         = crc=1 finobt=1, разреженный=1, rmapbt=0
         = рефссылка=1
данные = bsize = 4096 блоков = 976754176, imaxpct = 5
         = солнце = 0 ширина = 0 блоков
наименование = версия 2 bsize = 4096 ascii-ci = 0, ftype = 1
log = внутренний журнал bsize = 4096 блоков = 476930, версия = 2
         = sectsz=4096 sunit=1 BLKS, lazy-count=1
в реальном времени = нет extsz = 4096 блоков = 0, rtextents = 0

Следя за различными сообщениями на эту тему, которые все говорят о том, что я пробовал выше, у меня возникает ощущение, что содержимое диска потеряно (спасибо EDF Energy). У кого-нибудь есть дальнейшие предложения по восстановлению?

Изменить: результаты сканирования SMART...

=== НАЧАЛО ИНФОРМАЦИОННОГО РАЗДЕЛА ===
Семейство моделей: Western Digital Red
Модель устройства: WDC WD40EFRX-68N32N0 1
Серийный номер: PBGJYR4S
LU WWN Идентификатор устройства: 5 000cca 23dc7b57b
Версия прошивки: MJAOA5F0
Емкость пользователя: 4 000 787 030 016 байт [4,00 ТБ]
Размер сектора: 512 байт логический, 4096 байт физический
Скорость вращения: 7200 об/мин
Форм-фактор: 3,5 дюйма
Устройство находится: в базе данных smartctl [для получения подробной информации используйте: -P show]
Версия ATA: ATA8-ACS T13/1699-D, редакция 4
Версия SATA: SATA 3.0, 6,0 Гбит/с (текущая: 3,0 Гбит/с)
Местное время: пятница, 11 июня, 19:11:40 2021 BST.
Поддержка SMART: Доступна — устройство поддерживает SMART.
Поддержка SMART: включена

=== НАЧАЛО ЧТЕНИЯ РАЗДЕЛА SMART DATA ===
Результат теста SMART для самооценки общего состояния здоровья: ПРОЙДЕН

Общие ценности SMART:
Статус сбора данных в автономном режиме: (0x82) Активность сбора данных в автономном режиме
                                        было выполнено без ошибок.
                                        Автоматический сбор данных в автономном режиме: включен.
Статус выполнения самопроверки: ( 248) Выполняется процедура самопроверки...
                                        Осталось 80% теста.
Общее время для завершения в автономном режиме
сбор данных: ( 24) секунд.
Сбор данных в автономном режиме
возможности: (0x5b) SMART выполнить в автономном режиме немедленно.
                                        Включение/выключение автоматического сбора данных в автономном режиме.
                                        Приостанавливать автономную коллекцию при появлении новых
                                        команда.
                                        Поддерживается автономное сканирование поверхности.
                                        Поддерживается самотестирование.
                                        Самотестирование транспортного средства не поддерживается.
                                        Поддерживается выборочное самотестирование.
Возможности SMART: (0x0003) Сохраняет данные SMART перед вводом
                                        режим энергосбережения.
                                        Поддерживает таймер автоматического сохранения SMART.
Возможность ведения журнала ошибок: (0x01) Поддерживается ведение журнала ошибок.
                                        Поддерживается ведение журнала общего назначения.
Короткая процедура самопроверки
рекомендуемое время опроса: ( 1) минут.
Расширенная программа самопроверки
рекомендуемое время опроса: ( 1) минут.
Возможности SCT: (0x003d) поддерживается статус SCT.
                                        Поддерживается контроль восстановления после ошибок SCT.
                                        Поддерживается управление функциями SCT.
                                        Поддерживается таблица данных SCT.

Номер версии структуры данных атрибутов SMART: 16
Специфичные для поставщика атрибуты SMART с пороговыми значениями:
ID# ATTRIBUTE_NAME FLAG VALUE HORST THRESH TYPE ОБНОВЛЕНО WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x000b 100 100 016 До отказа Всегда - 0
  2 Throughput_Performance 0x0005 136 136 054 До сбоя Автономный режим — 80
  3 Spin_Up_Time 0x0007 176 176 024 До сбоя Всегда — 411 (в среднем 468)
  4 Start_Stop_Count 0x0012 100 100 000 Old_age Всегда - 14
  5 Reallocated_Sector_Ct 0x0033 100 100 005 До отказа Всегда - 0
  7 Seek_Error_Rate 0x000b 100 100 067 До отказа Всегда - 0
  8 Seek_Time_Performance 0x0005 121 121 020 До сбоя Автономный режим — 34
  9 Power_On_Hours 0x0012 100 100 000 Old_age Всегда — 6222
 10 Spin_Retry_Count 0x0013 100 100 060 Предотказ Всегда - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Всегда - 14
192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Всегда - 273
193 Load_Cycle_Count 0x0012 100 100 000 Old_age Всегда - 273
194 Temperature_Celsius 0x0002 142 142 000 Old_age Всегда - 42 (Мин./Макс. 20/42)
196 Reallocated_Event_Count 0x0032 100 100 000 Old_age Всегда - 0
197 Current_Pending_Sector 0x0022 100 100 000 Old_age Всегда - 0
198 Offline_Uncorrectable 0x0008 100 100 000 Old_age Offline - 0
199 UDMA_CRC_Error_Count 0x000a 174 174 000 Old_age Всегда - 1272

Версия журнала ошибок SMART: 1
Количество ошибок ATA: 1272 (журнал устройства содержит только последние пять ошибок)
        CR = регистр команд [HEX]
        FR = Регистр функций [HEX]
        SC = регистр счетчика секторов [HEX]
        SN = регистр номера сектора [HEX]
        CL = нижний регистр цилиндра [HEX]
        CH = верхний регистр цилиндра [HEX]
        DH = регистр устройства/головки [HEX]
        DC = Регистр команд устройства [HEX]
        ER = регистр ошибок [HEX]
        ST = регистр состояния [HEX]
Powered_Up_Time измеряется с момента включения питания и распечатывается как
ДДд+чч:мм:СС.сс, где ДД=дни, чч=часы, мм=минуты,
SS=сек, а sss=миллисек. Он «обертывается» через 49 710 дней.

Возникла ошибка 1272 при включении диска. Срок службы: 6220 часов (259 дней + 4 часа).
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 21 5f b7 c0 01 Ошибка: ICRC, ABRT 33 сектора в LBA = 0x01c0b75f = 29407071

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  25 00 80 00 b7 c0 e0 08 1d+02:04:04.303 ЧТЕНИЕ DMA EXT
  25 00 f8 00 b6 c0 e0 08 1d+02:04:04.303 ЧТЕНИЕ DMA EXT
  25 00 08 f8 b5 c0 e0 08 1d+02:04:04.302 ЧТЕНИЕ DMA EXT
  25 00 08 f0 b5 c0 e0 08 1d+02:04:04.302 ЧТЕНИЕ DMA EXT
  25 00 08 e8 b5 c0 e0 08 1d+02:04:04.302 ЧТЕНИЕ DMA EXT

Ошибка 1271 произошла при включении диска. Срок службы: 6220 часов (259 дней + 4 часа).
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 97 b5 c0 01 Ошибка: ICRC, ABRT 1 сектор в LBA = 0x01c0b597 = 29406615

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  25 00 08 90 b5 c0 e0 08 1d+02:04:04.096 ЧТЕНИЕ DMA EXT
  25 00 08 88 b5 c0 e0 08 1d+02:04:04.095 ЧТЕНИЕ DMA EXT
  25 00 08 80 b5 c0 e0 08 1d+02:04:04.095 ЧТЕНИЕ DMA EXT
  25 00 08 78 b5 c0 e0 08 1d+02:04:04.095 ЧТЕНИЕ DMA EXT
  25 00 08 70 b5 c0 e0 08 1d+02:04:04.095 ЧТЕНИЕ DMA EXT

Возникла ошибка 1270 при включении диска. Срок службы: 6220 часов (259 дней + 4 часа).
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 81 7f b5 c0 01 Ошибка: ICRC, ABRT 129 секторов на LBA = 0x01c0b57f = 29406591

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  25 00 00 00 b4 c0 e0 08 1d+02:04:03.858 ЧТЕНИЕ DMA EXT
  25 00 f8 08 0a 00 e0 08 1d+02:04:03.856 ЧТЕНИЕ DMA EXT
  c8 00 08 f8 08 00 e0 08 1d+02:04:03.856 ЧТЕНИЕ DMA
  c8 00 08 f0 08 00 e0 08 1d+02:04:03.856 ЧТЕНИЕ DMA
  c8 00 08 e8 08 00 e0 08 1d+02:04:03.855 ЧТЕНИЕ DMA

Возникла ошибка 1269 при включении диска. Время жизни: 6220 часов (259 дней + 4 часа).
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 c7 08 00 00 Ошибка: ICRC, ABRT 1 секторов в LBA = 0x000008c7 = 2247

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  c8 00 08 c0 08 00 e0 08 1d+02:04:03.648 ЧТЕНИЕ DMA
  c8 00 08 b8 08 00 e0 08 1d+02:04:03.641 ЧТЕНИЕ DMA
  27 00 00 00 00 00 e0 08 1d+02:04:03.640 ЧТЕНИЕ СОБСТВЕННОГО МАКСИМАЛЬНОГО АДРЕСА EXT [OBS-ACS-3]
  ec 00 00 00 00 00 a0 08 1d+02:04:03.638 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
  ef 03 42 00 00 00 a0 08 1d+02:04:03.636 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]

Ошибка 1268 произошла при включении диска. Срок службы: 6220 часов (259 дней + 4 часа).
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 bf 08 00 00 Ошибка: ICRC, ABRT 1 секторов в LBA = 0x000008bf = 2239

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  c8 00 08 b8 08 00 e0 08 1d+02:04:03.440 ЧТЕНИЕ DMA
  c8 00 08 b0 08 00 e0 08 1d+02:04:03.440 ЧТЕНИЕ DMA
  c8 00 08 a8 08 00 e0 08 1d+02:04:03.440 ЧТЕНИЕ DMA
  c8 00 08 a0 08 00 e0 08 1d+02:04:03.440 ЧТЕНИЕ DMA
  c8 00 08 98 08 00 e0 08 1d+02:04:03.440 ЧТЕНИЕ DMA

Структура журнала самотестирования SMART, редакция 1
Num Test_Description Статус Оставшееся время жизни (часы) LBA_of_first_error
#1 Vendor (0xb0) Выполнено без ошибок 00% 36443 -
# 2 Vendor (0x71) Выполнено без ошибок 00% 36443 -

Структура данных журнала выборочной самопроверки SMART, редакция 1
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Не_тестирование
    2 0 0 Не_тестирование
    3 0 0 Не_тестирование
    4 0 0 Не_тестирование
    5 0 0 Не_тестирование
Флаги выборочной самопроверки (0x0):
  После сканирования выбранных диапазонов НЕ считывайте и не сканируйте оставшуюся часть диска.
Если при включении питания ожидается выборочная самопроверка, возобновите ее после 0-минутной задержки.
Michael Hampton avatar
флаг cz
Похоже, вышел из строя диск, а не файловая система. Протестируйте его и будьте морально готовы к необходимости восстановления из резервной копии.
Michael Hampton avatar
флаг cz
Вывод SMART подтверждает, что он мертв и имеет право на RMA. Сожалею о вашей потере.
Рейтинг:3
флаг ca

Предупреждение Ошибка ввода/вывода означает, что ваш диск вышел из строя, а не ваша файловая система - xfs_repair был не в состоянии для чтения пораженных секторов с дисков.

Ваш вывод SMART подтверждает вышесказанное: он показывает несколько прерываний чтения в 6220 часов, что точно соответствует времени включения вашего жесткого диска (то есть: ошибки произошли только сейчас, а не в далеком прошлом).

XFS поддерживает несколько резервных суперблоков (по одному в каждой группе доступности), но ваш диск, похоже, выдает ошибки для многих разных секторов, поэтому я не рекомендую пытаться обнулить затронутые сектора. Скорее, я бы использовал спасение клонировать диск на другое устройство и сосредоточить все попытки восстановления на клонированном образе.

Очевидно, что если у вас есть работающие и текущие резервные копии, вы можете просто очистить диск и восстановить данные на новом.

Рейтинг:1
флаг in

Я должен сказать, что это похоже на плохой диск или диск, который очень близок к полному катастрофическому отказу. Я надеюсь, у вас есть резервные копии!?!

Если у вас нет резервных копий, вам действительно следует выключить эту систему, загрузиться с другого носителя или перенести неисправный диск на другую систему и попытаться скопировать данные на новый диск. Это можно сделать с помощью dd (или ddrescue) на блочном уровне с несколькими повторными попытками, если у вас нет доступа к автономной рабочей станции для восстановления дисков (по-прежнему лучший гаджет, который я когда-либо покупал!). В ddrescue есть опция max-retries, и иногда с несколькими попытками вы можете успешно прочитать данные на плохом диске. иногда ... Этот инструмент GNU доступен в Trinity Rescue Kit LiveCD. Я не уверен, есть ли он во всех дистрибутивах liveCD. Стоит приобрести и держать под рукой! вот пример из другой статьи, в которой обсуждается это для справки: https://superuser.com/questions/905811/faster-recovery-from-a-disk-with-bad-sectors

Для всех остальных — немного мудрости, которую мне пришлось усвоить на собственном горьком опыте несколько раз за свою карьеру. Лучше иметь резервные копии и никогда не нуждаться в них, чем нуждаться в резервных копиях и ничего не иметь! Настройте резервное копирование! Это должно быть первое, что вы делаете после установки ОС!!! Сделайте это привычкой и/или сейчас, и вы никогда не останетесь без резервных копий!

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.