Рейтинг:0

Диск вышел из строя или его еще можно использовать?

флаг ie

У меня есть следующий диск WD (3 ТБ), который вызвал у меня проблему (я не смог получить доступ ни к одному файлу: даже лс команда на нем вызвала бесконечное ожидание).

Немного подробностей о диске:

Диск /dev/sda: 2,7 ТиБ, 3000592982016 байт, 5860533168 секторов
Модель диска: EZRX-00D8PB0
Единицы: секторы 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 4096 байт
Размер ввода/вывода (минимальный/оптимальный): 4096 байт / 4096 байт
Тип метки диска: gpt

Размер начальных и конечных секторов устройства Тип
/dev/sda1 2048 5860532223 5860530176 2.7T файловая система Linux

После этой проблемы я запускаю тест, чтобы выяснить, какая проблема влияет на нее. В качестве первого шага я запускаю на нем короткий тест. sudo smartctl -t короткий /dev/sda который показал мне следующую ошибку:

=== НАЧАЛО ЧТЕНИЯ РАЗДЕЛА SMART DATA ===
Структура журнала самотестирования SMART, редакция 1
Num Test_Description Статус Оставшееся время жизни (часы) LBA_of_first_error
# 1 Короткий офлайн Завершено: ошибка чтения 90% 17480 8467144

Затем я попытался получить некоторые атрибуты, как описано в этом другом посте. Понимание smartctl -a output с использованием sudo smartctl -a /dev/sda. Здесь вы можете найти таблицу атрибутов и журнал 5 последних ошибок:

Номер версии структуры данных атрибутов SMART: 16
Специфичные для поставщика атрибуты SMART с пороговыми значениями:
ID# ATTRIBUTE_NAME FLAG VALUE HORST THRESH TYPE ОБНОВЛЕНО WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate 0x002f 200 200 051 До отказа Всегда - 71
  3 Spin_Up_Time 0x0027 174 161 021 Предотказ Всегда — 6266
  4 Start_Stop_Count 0x0032 100 100 000 Old_age Всегда - 695
  5 Reallocated_Sector_Ct 0x0033 200 200 140 До отказа Всегда - 0
  7 Seek_Error_Rate 0x002e 200 200 000 Old_age Всегда - 0
  9 Power_On_Hours 0x0032 077 077 000 Old_age Всегда - 17481
 10 Spin_Retry_Count 0x0032 100 100 000 Old_age Всегда - 0
 11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Всегда - 0
 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Всегда - 457
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Всегда - 63
193 Load_Cycle_Count 0x0032 179 179 000 Old_age Всегда — 64193
194 Temperature_Celsius 0x0022 122 101 000 Old_age Всегда - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Всегда - 0
197 Current_Pending_Sector 0x0032 200 197 000 Old_age Всегда - 356
198 Offline_Uncorrectable 0x0030 197 197 000 Old_age Offline - 1691
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Всегда - 0
200 Multi_Zone_Error_Rate 0x0008 196 196 000 Old_age Offline — 1691

Версия журнала ошибок SMART: 1
Количество ошибок ATA: 47 (журнал устройства содержит только последние пять ошибок)
        CR = регистр команд [HEX]
        FR = Регистр функций [HEX]
        SC = регистр счетчика секторов [HEX]
        SN = регистр номера сектора [HEX]
        CL = нижний регистр цилиндра [HEX]
        CH = верхний регистр цилиндра [HEX]
        DH = регистр устройства/головки [HEX]
        DC = Регистр команд устройства [HEX]
        ER = регистр ошибок [HEX]
        ST = регистр состояния [HEX]
Powered_Up_Time измеряется с момента включения питания и распечатывается как
ДДд+чч:мм:СС.сс, где ДД=дни, чч=часы, мм=минуты,
SS=сек, а sss=миллисек. Он «обертывается» через 49 710 дней.

Ошибка 47 произошла при включении диска Срок службы: 232 часа (9 дней + 16 часов)
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 0а 00 00 00 00

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  e0 00 0a 00 00 00 00 00 04:00:17.522 ОЖИДАНИЕ НЕМЕДЛЕННО
  ef 03 46 00 00 00 a0 00 04:00:16.815 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:16.815 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА

Возникла ошибка 46 при включении диска. Срок службы: 232 часа (9 дней + 16 часов).
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 а0 Ошибка устройства; Ошибка: АВРТ

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:16.815 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:16.815 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
  e1 00 0f 00 00 00 00 00 04:00:15.095 ПРОСТОЕ НЕМЕДЛЕННО
  ef 03 46 00 00 00 a0 00 04:00:14.575 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:14.575 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА

Возникла ошибка 45 при включении диска Срок службы: 232 часа (9 дней + 16 часов)
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 0f 00 00 00 00

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  e1 00 0f 00 00 00 00 00 04:00:15.095 ПРОСТОЕ НЕМЕДЛЕННО
  ef 03 46 00 00 00 a0 00 04:00:14.575 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:14.575 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА

Возникла ошибка 44 при включении диска Срок службы: 232 часа (9 дней + 16 часов)
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 а0 Ошибка устройства; Ошибка: АВРТ

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:14.575 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:14.575 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
  ef 03 46 00 00 00 a0 00 04:00:12.170 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]

Ошибка 43 произошла при включении диска Срок службы: 232 часа (9 дней + 16 часов)
  Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.

  После завершения команды регистры были:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  04 61 46 00 00 00 а0 Ошибка устройства; Ошибка: АВРТ

  Команды, ведущие к команде, вызвавшей ошибку:
  CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
  -- -- -- -- -- -- -- -- -- ------------------ ------------------ --
  ef 03 46 00 00 00 a0 00 04:00:12.170 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:12.170 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
  e1 00 0f 00 00 00 00 00 04:00:10.445 ПРОСТОЕ НЕМЕДЛЕННО
  ef 03 46 00 00 00 a0 00 04:00:09.925 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
  ec 00 00 00 00 00 a0 00 04:00:09.925 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА

Структура журнала самотестирования SMART, редакция 1
Num Test_Description Статус Оставшееся время жизни (часы) LBA_of_first_error
# 1 Короткий офлайн Завершено: ошибка чтения 90% 17480 8467144

Структура данных журнала выборочной самопроверки SMART, редакция 1
 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
    1 0 0 Не_тестирование
    2 0 0 Не_тестирование
    3 0 0 Не_тестирование
    4 0 0 Не_тестирование
    5 0 0 Не_тестирование
Флаги выборочной самопроверки (0x0):
  После сканирования выбранных диапазонов НЕ считывайте и не сканируйте оставшуюся часть диска.
Если при включении питания ожидается выборочная самопроверка, возобновите ее после 0-минутной задержки.

Затем я попытался проверить на LBA_of_first_error (8467144) и, следуя части это руководство, Я бегу sudo sg_verify --lba=8467144 /dev/sda получение следующего вывода, подтверждающего наличие аппаратного сбоя:

проверить (10):
Фиксированный формат, текущий; Клавиша Sense: средняя ошибка
Дополнительный смысл: ошибка Id CRC или ECC
VERIFY(10) средняя или аппаратная ошибка рядом с lba=0x8132c8

В качестве последнего шага я безуспешно пытался переназначить блок. sudo sg_reassign --address=8467144 /dev/sda:

ПЕРЕНАЗНАЧЕНИЕ БЛОКОВ: недопустимый запрос, неверный код операции
Ошибка sg_reassign: неверный запрос, неверный код операции.

Итак, подводя итог, я пропустил какой-то шаг в этом исследовании диска? Мой диск мертв или его все еще можно использовать? Я не могу понять, есть ли какие-то серьезные ошибки из списка атрибутов SMART. Можете ли вы помочь мне понять, есть ли на диске другие ошибки?

Brandon Xavier avatar
флаг us
Если он на гарантии, замените его. Если нет, утилизируйте его. Как только диск начинает сообщать об ошибках, глупо пытаться продолжать его использовать.
Michael Hampton avatar
флаг cz
ОДНОЙ ошибки достаточно для RMA диска, даже если никакие SMART-атрибуты еще не сообщают об ошибке (скоро они будут! И к тому времени уже слишком поздно для ваших данных).
Timmy avatar
флаг ie
К сожалению, этому диску уже несколько лет, так что RMA нет :(

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.