Рейтинг:1

Тесты работоспособности на NVMe

флаг us

На серверах, которые у меня есть, с HDD или SSD периодически запускается cron:

/usr/sbin/smartctl --test=короткий/длинный /dev/sd1

(за каждый диск)

Пока он работает, он просто смотрит на вывод /usr/sbin/smartctl -c /dev/sd1, цикл, пока он больше не содержит:

[0-9]+% оставшегося теста.

А затем проверяет, завершилось ли оно без ошибок:

( 0) Предыдущая процедура самотестирования завершена

Однако оказывается, что смартктл еще не поддерживает тестирование NVMe, начиная с версии 7.0 и согласно: https://www.smartmontools.org/wiki/NVMe_Support

Это говорит, что

Демон smartd отслеживает работоспособность (-H), количество ошибок (-l error) и температуру (-W DIFF,INFO,CRIT)

но что на самом деле запускает тесты? Я не уверен, что вывод -ЧАС и обновить, если мы не проведем короткие/длинные тесты?

Я также читал о nvme-кли, но, похоже, я не нахожу способов запускать с ним тесты работоспособности дисков.

Любые идеи?

Использование CentOS 7 здесь.

Marcus Müller avatar
флаг pt
Я не *знаю*, но я был бы удивлен, если бы выполнение какого-либо явного теста имело бы очень большое преимущество в знаниях для твердотельных накопителей — эти устройства идеально подходят для отслеживания их собственного состояния, поскольку выравнивание износа буквально знает, как часто каждый сегмент памяти был использован, * и * благодаря всеобъемлющему коду исправления ошибок, присущему устройствам NVMe, вы получаете очень хорошую картину старения устройства просто из повседневного использования.
Рейтинг:1
флаг ca

Самопроверка SMART была задумана для механических дисков. Твердотельные накопители SATA почти полностью повторяют более раннее поведение на уровне интерфейса жесткого диска, поддерживая такое самотестирование, но на самом деле мало что делая при его запуске. Диски NVMe полностью отказались от таких процедур самотестирования SMART.

Для дисков на основе флэш-памяти следует действительно отслеживать износ ячеек, количество резервных блоков и перераспределенные сектора, а не полагаться на старые процедуры самотестирования, которые не поддерживаются на дисках NVMe.

Nuno avatar
флаг us
Большое тебе спасибо. Имеет смысл. Знаете ли вы, если я просто оставлю `smartd` запущенным, сообщит ли он мне о любых проблемах с диском NVMe через сообщения системного журнала? Все, что я хочу, это быть уверенным, что я застрахован, а не небрежно :-)
shodanshok avatar
флаг ca
Насколько я знаю, `smartd` должен уметь отслеживать состояние NVMe SSD, а также предупреждать, если сам накопитель сообщает о неработоспособном состоянии.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.