Рейтинг:0

RAID0 на 16 HDD по 8 ТБ пишет только со скоростью 3-4 МБ/с

флаг it

Для этого у меня есть довольно современное оборудование RAID:

  1. Контроллер: Intel RS3SC008
  2. Расширитель SAS: Intel RES3FV288
  3. Жесткие диски: Seagate ST8000AS0002-1NA17Z

На данный момент у меня нет BBU, который должен быть Intel AXXRMFBU4.

Расширитель SAS правильно подключен к контроллеру в порт G (согласно инструкции).

Все части системы имеют правильную температуру и вентиляцию (например, температура на контроллере ROC составляет около 43°С, что более чем оптимально).

Контроллер и расширитель прошиты до последней прошивки.

Жесткие диски также имеют последнюю прошивку.

Моя проблема заключается в том, что какой бы уровень RAID я ни настраивал (пробовал 0, 6) и какие бы конфигурации кеша я ни выбирал, я сталкиваюсь с ошибками при реальной нагрузке:

  1. В некоторых конфигурациях устройство VD переходит в автономный режим, утверждая, что некоторые жесткие диски отключились.
  2. Предполагая, что эти жесткие диски могут быть неисправны, я создал еще один тест без этих жестких дисков, который все еще не работает.
  3. В журналах введите описание изображения здесь Я вижу предупреждения с жалобами на датчики температуры, которых у меня нет, и предупреждения о сбросе некоторых физических устройств. Никаких реальных ошибок, пока виртуальный диск не отключился, потому что один из жестких дисков вел себя неправильно и отключился. Я попытался исключить эти неисправные жесткие диски из последующих тестов. Вот вроде немного оправился от проблемы, но в итоге я в начале.

Я подозреваю, что иметь 4 неисправных жестких диска в связке из 20 новых жестких дисков довольно странно.

Что бы вы предложили в этой ситуации?

В чем может быть проблема?

Несовместимость жесткого диска?

Есть ли способ выйти из этой ситуации?

Michael Hampton avatar
флаг cz
Похоже на проблему с контроллером, кабелем или объединительной платой. Начните перемещать вещи и посмотрите, куда перемещаются ошибки.
флаг it
@MichaelHampton У меня нет задней панели. Жесткие диски просто подключаются к расширителю SAS через SFF 8643 на 4 кабеля SATA. Не могли бы вы предположить, что проблема может заключаться в кабелях SAS?
Michael Hampton avatar
флаг cz
Это вполне возможно!
djdomi avatar
флаг za
я бы определил это, используя 2 диска, 4x 6x 8x, если скорость одинакова, то это действительно похоже
Nikita Kipriyanov avatar
флаг za
Также вы уверены, что вы обеспечиваете достаточно энергии для системы?
флаг it
Я уже проверял мощность с разными блоками питания, и мне хватило на 100%.
флаг it
@MichaelHampton, вы имеете в виду несовместимость жесткого диска? У вас есть идеи, как быть уверенным на 100%?
флаг it
@djdomi Я собираюсь проверить это завтра, также с другими жесткими дисками. Выложу результаты.
Рейтинг:0
флаг it

Окончательный вывод, к сожалению, не решение.

После нескольких серий тестов я могу подтвердить, что упомянутые ранее диски:

  1. Жесткие диски: Seagate ST8000AS0002-1NA17Z
  2. Твердотельные накопители: Crucial CT1000BX500SSD1

находятся полностью несовместим с RAID конфигурации и с очень низкой производительностью.

В качестве примечания, мне совершенно странно, почему они ввели такой же уровень падения производительности после нескольких секунд тяжелой работы. Я предполагаю, что это было связано с использованием одинаковых базовых, медленных, низкоуровневых компонентов.

Я потерял много времени на эту проблему, так что, возможно, этот пост поможет кому-то.

Рейтинг:0
флаг cn

Используйте HD-tune на каждом диске, чтобы увидеть, есть ли проблемы SMART (перераспределенные или поврежденные сектора являются приоритетом).

В более практичном тестовом подходе:

Протестируйте в наборах из 4 дисков. Как и при создании наборов из 4 дисков в RAID 0.

Затем сделайте копии из одного набора в другие.

Таким образом, вы можете относительно быстро определить, какие из них имеют проблемы.

Примечание. RAID 0 для многих Seagate — это готовое самоубийство.

Массивы из 4 дисков, которые вы считаете хорошими, при необходимости объединяют их в один (или подождите ближе к концу тестирования, чтобы вы могли использовать все хорошие диски).

Для тех, кто работает плохо, поменяйте местами некоторые диски или разделите их на массивы из 2 дисков, чтобы вы могли дополнительно отфильтровать их. Попробуйте определить, есть ли неисправные кабели, поменяв местами кабели с хорошего 2-комплекта на плохой 2-комплект.

Кроме того, обратите внимание, что error действительно идентифицирует неисправный порт, поэтому вы можете начать с устранения тех, о которых сигнализируют ошибки.

Ошибка «Тайм-аут команды» может указывать на недоступный жесткий диск.

флаг it
Спасибо за советы.Конечно, я не собираюсь использовать R0 на таком количестве дисков. Это было только для целей тестирования. Изначально я хотел протестировать полную нагрузку со всеми дисками. Следующие анализы сделаю завтра. Пока даже исключенные из ВД неисправные HDD не показывают проблем в SMART. Могу ли я предположить, что 4 HDD, работающие правильно в RAID (любого уровня), подтверждают, что эти HDD с этим контроллером совместимы?

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.