У меня есть следующий диск WD (3 ТБ), который вызвал у меня проблему (я не смог получить доступ ни к одному файлу: даже лс
команда на нем вызвала бесконечное ожидание).
Немного подробностей о диске:
Диск /dev/sda: 2,7 ТиБ, 3000592982016 байт, 5860533168 секторов
Модель диска: EZRX-00D8PB0
Единицы: секторы 1 * 512 = 512 байт
Размер сектора (логический/физический): 512 байт / 4096 байт
Размер ввода/вывода (минимальный/оптимальный): 4096 байт / 4096 байт
Тип метки диска: gpt
Размер начальных и конечных секторов устройства Тип
/dev/sda1 2048 5860532223 5860530176 2.7T файловая система Linux
После этой проблемы я запускаю тест, чтобы выяснить, какая проблема влияет на нее.
В качестве первого шага я запускаю на нем короткий тест. sudo smartctl -t короткий /dev/sda
который показал мне следующую ошибку:
=== НАЧАЛО ЧТЕНИЯ РАЗДЕЛА SMART DATA ===
Структура журнала самотестирования SMART, редакция 1
Num Test_Description Статус Оставшееся время жизни (часы) LBA_of_first_error
# 1 Короткий офлайн Завершено: ошибка чтения 90% 17480 8467144
Затем я попытался получить некоторые атрибуты, как описано в этом другом посте. Понимание smartctl -a output с использованием sudo smartctl -a /dev/sda
. Здесь вы можете найти таблицу атрибутов и журнал 5 последних ошибок:
Номер версии структуры данных атрибутов SMART: 16
Специфичные для поставщика атрибуты SMART с пороговыми значениями:
ID# ATTRIBUTE_NAME FLAG VALUE HORST THRESH TYPE ОБНОВЛЕНО WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x002f 200 200 051 До отказа Всегда - 71
3 Spin_Up_Time 0x0027 174 161 021 Предотказ Всегда — 6266
4 Start_Stop_Count 0x0032 100 100 000 Old_age Всегда - 695
5 Reallocated_Sector_Ct 0x0033 200 200 140 До отказа Всегда - 0
7 Seek_Error_Rate 0x002e 200 200 000 Old_age Всегда - 0
9 Power_On_Hours 0x0032 077 077 000 Old_age Всегда - 17481
10 Spin_Retry_Count 0x0032 100 100 000 Old_age Всегда - 0
11 Calibration_Retry_Count 0x0032 100 100 000 Old_age Всегда - 0
12 Power_Cycle_Count 0x0032 100 100 000 Old_age Всегда - 457
192 Power-Off_Retract_Count 0x0032 200 200 000 Old_age Всегда - 63
193 Load_Cycle_Count 0x0032 179 179 000 Old_age Всегда — 64193
194 Temperature_Celsius 0x0022 122 101 000 Old_age Всегда - 28
196 Reallocated_Event_Count 0x0032 200 200 000 Old_age Всегда - 0
197 Current_Pending_Sector 0x0032 200 197 000 Old_age Всегда - 356
198 Offline_Uncorrectable 0x0030 197 197 000 Old_age Offline - 1691
199 UDMA_CRC_Error_Count 0x0032 200 200 000 Old_age Всегда - 0
200 Multi_Zone_Error_Rate 0x0008 196 196 000 Old_age Offline — 1691
Версия журнала ошибок SMART: 1
Количество ошибок ATA: 47 (журнал устройства содержит только последние пять ошибок)
CR = регистр команд [HEX]
FR = Регистр функций [HEX]
SC = регистр счетчика секторов [HEX]
SN = регистр номера сектора [HEX]
CL = нижний регистр цилиндра [HEX]
CH = верхний регистр цилиндра [HEX]
DH = регистр устройства/головки [HEX]
DC = Регистр команд устройства [HEX]
ER = регистр ошибок [HEX]
ST = регистр состояния [HEX]
Powered_Up_Time измеряется с момента включения питания и распечатывается как
ДДд+чч:мм:СС.сс, где ДД=дни, чч=часы, мм=минуты,
SS=сек, а sss=миллисек. Он «обертывается» через 49 710 дней.
Ошибка 47 произошла при включении диска Срок службы: 232 часа (9 дней + 16 часов)
Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.
После завершения команды регистры были:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 0а 00 00 00 00
Команды, ведущие к команде, вызвавшей ошибку:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- -- ------------------ ------------------ --
e0 00 0a 00 00 00 00 00 04:00:17.522 ОЖИДАНИЕ НЕМЕДЛЕННО
ef 03 46 00 00 00 a0 00 04:00:16.815 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:16.815 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
Возникла ошибка 46 при включении диска. Срок службы: 232 часа (9 дней + 16 часов).
Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.
После завершения команды регистры были:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 а0 Ошибка устройства; Ошибка: АВРТ
Команды, ведущие к команде, вызвавшей ошибку:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- -- ------------------ ------------------ --
ef 03 46 00 00 00 a0 00 04:00:16.815 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:16.815 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
e1 00 0f 00 00 00 00 00 04:00:15.095 ПРОСТОЕ НЕМЕДЛЕННО
ef 03 46 00 00 00 a0 00 04:00:14.575 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:14.575 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
Возникла ошибка 45 при включении диска Срок службы: 232 часа (9 дней + 16 часов)
Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.
После завершения команды регистры были:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 0f 00 00 00 00
Команды, ведущие к команде, вызвавшей ошибку:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- -- ------------------ ------------------ --
e1 00 0f 00 00 00 00 00 04:00:15.095 ПРОСТОЕ НЕМЕДЛЕННО
ef 03 46 00 00 00 a0 00 04:00:14.575 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:14.575 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
Возникла ошибка 44 при включении диска Срок службы: 232 часа (9 дней + 16 часов)
Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.
После завершения команды регистры были:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 а0 Ошибка устройства; Ошибка: АВРТ
Команды, ведущие к команде, вызвавшей ошибку:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- -- ------------------ ------------------ --
ef 03 46 00 00 00 a0 00 04:00:14.575 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:14.575 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
ef 03 46 00 00 00 a0 00 04:00:12.170 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
Ошибка 43 произошла при включении диска Срок службы: 232 часа (9 дней + 16 часов)
Когда произошла команда, вызвавшая ошибку, устройство было активным или простаивало.
После завершения команды регистры были:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
04 61 46 00 00 00 а0 Ошибка устройства; Ошибка: АВРТ
Команды, ведущие к команде, вызвавшей ошибку:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- -- ------------------ ------------------ --
ef 03 46 00 00 00 a0 00 04:00:12.170 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:12.170 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
e1 00 0f 00 00 00 00 00 04:00:10.445 ПРОСТОЕ НЕМЕДЛЕННО
ef 03 46 00 00 00 a0 00 04:00:09.925 НАСТРОЙКА ФУНКЦИЙ [Установить режим передачи]
ec 00 00 00 00 00 a0 00 04:00:09.925 ИДЕНТИФИКАЦИЯ УСТРОЙСТВА
Структура журнала самотестирования SMART, редакция 1
Num Test_Description Статус Оставшееся время жизни (часы) LBA_of_first_error
# 1 Короткий офлайн Завершено: ошибка чтения 90% 17480 8467144
Структура данных журнала выборочной самопроверки SMART, редакция 1
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Не_тестирование
2 0 0 Не_тестирование
3 0 0 Не_тестирование
4 0 0 Не_тестирование
5 0 0 Не_тестирование
Флаги выборочной самопроверки (0x0):
После сканирования выбранных диапазонов НЕ считывайте и не сканируйте оставшуюся часть диска.
Если при включении питания ожидается выборочная самопроверка, возобновите ее после 0-минутной задержки.
Затем я попытался проверить на LBA_of_first_error
(8467144) и, следуя части это руководство, Я бегу sudo sg_verify --lba=8467144 /dev/sda
получение следующего вывода, подтверждающего наличие аппаратного сбоя:
проверить (10):
Фиксированный формат, текущий; Клавиша Sense: средняя ошибка
Дополнительный смысл: ошибка Id CRC или ECC
VERIFY(10) средняя или аппаратная ошибка рядом с lba=0x8132c8
В качестве последнего шага я безуспешно пытался переназначить блок. sudo sg_reassign --address=8467144 /dev/sda
:
ПЕРЕНАЗНАЧЕНИЕ БЛОКОВ: недопустимый запрос, неверный код операции
Ошибка sg_reassign: неверный запрос, неверный код операции.
Итак, подводя итог, я пропустил какой-то шаг в этом исследовании диска? Мой диск мертв или его все еще можно использовать? Я не могу понять, есть ли какие-то серьезные ошибки из списка атрибутов SMART. Можете ли вы помочь мне понять, есть ли на диске другие ошибки?