Рейтинг:0

Как получить состояние жесткого диска из RAID с помощью SmartCTL для целей мониторинга?

флаг ru

У меня есть FreeBSD с RAID с тремя жесткими дисками. Мне была поставлена ​​задача контролировать его RAID - если жесткий диск выходит из строя или возникает какая-то проблема, мне нужно знать.

Итак, первое, что я сейчас делаю, это пытаюсь понять, как работает SmartCTL... Команды, которые я использовал до сих пор:

smartctl --scan -j — для сканирования моих устройств и создания структурированного списка JSON.
smartctl -i /dev/device_name — вывести информацию об одном устройстве
smartctl -a /dev/your-device — дополнительная информация, такая как ошибки и т. д. (я думаю, что могу каким-то образом использовать это для поиска только разделов ошибок...)

Существуют ли какие-либо другие параметры SmartCTL, которые проверяют, доступны ли диски для записи, активны ли они и имеют ли их состояние работоспособности в порядке?

Основной целью этого понимания является использование в основном SmartCTL для генерации данных, которые будут использоваться в шаблоне мониторинга pfSense RAID с низкоуровневым обнаружением для программного обеспечения мониторинга Zabbix...

Любая помощь приветствуется.

djdomi avatar
флаг za
ewch raif имеет стандартные устройства. почему ты их не используешь? как sda, b, c, d и т. д.?
флаг ru
Да, но я хочу знать, можно ли использовать параметр smartctl, который сообщает мне, в порядке ли диск или нет... Пример: smartctl --isDiskOK /dev/sda.... Ближайшим решением было использование -a, но мне нужно использовать и другие инструменты, чтобы фильтровать только ту информацию, которую я хочу... Я думал о более простом подходе, если это возможно.
Рейтинг:1
флаг it

ладно, чтобы ответить - нет smartctl --isDiskOK /dev/sda подход, который вы можете принять, насколько я знаю.

Ближайший smartctl может привести вас к этому отчету о количестве перераспределенных секторов. Я не буду подробно объяснять, но, по сути, когда диски начинают выходить из строя, трудные для чтения/записи сектора будут перемещены в запасной сектор. Если происходит больше перераспределений, это означает, что диск близок к полной смерти.

  1. Zabbix может использовать следующий пользовательский параметр:
$ sudo cat /etc/zabbix/zabbix_agent2.d/userparameter_hdd.reallocated.sectors.conf
# получить текущее количество перераспределенных секторов жесткого диска && требуется sudoers
UserParameter=hdd.reallocated.sectors[*],sudo smartctl -a /dev/$1|grep Reallocated_Sector_Ct|awk '{print $$10}'
  1. создайте шаблон zabbix со следующим элементом: введите описание изображения здесь

  2. разрешить пользователю zabbix выполнять smartctl через sudoers:

$ sudo grep zabbix /etc/sudoers.d/*
/etc/sudoers.d/zabbix:zabbix ВСЕ=NOPASSWD:/usr/sbin/hddtemp, /usr/sbin/smartctl, /usr/bin/fping
  1. назначьте шаблон отслеживаемому хосту + перезапустите zabbix_agent для загрузки конфигурации — ваш элемент должен заполниться перераспределенным количеством секторов

  2. Выгода.. :)

в любом случае шаблон zabbix также доступен на моем GitHub https://github.com/RipperSK/zabbix-user-params/blob/master/hdd.reallocated.sectors/userparameter_hdd.reallocated.sectors.conf

наслаждаться.

флаг ru
Спасибо, это получилось.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.