Рейтинг:0

Как я могу протестировать карту контроллера SAS?

флаг by

Мне нужно протестировать карту контроллера Dell SAS. Я вижу слишком много ошибок при установке Raidz2 с июля прошлого года, чем это может быть правдой. Как будто один диск за другим сходит с рельсов.

У меня предположительно "делл" 9207-8л. Я получил его с ebay еще в июле / августе 2020 года. https://www.ebay.com/itm/132663136462 Я так и не смог войти в его настройки. Там написано нажать Ctrl + C, чтобы войти в конфиг. Я пробовал левый и правый crtl, плюс c, также с C (заглавная), так как она пишется заглавной. Он говорит, что войдет в конфигурацию после установки, но никогда этого не делает, просто переходит прямо в биос, если дель был отжат, или сапоги иначе.

Я запускаю zfs-on-linux на rhelx64. Вчера забрал торт. Мне пришлось вытащить несколько устройств по 2 ТБ (6) и сделать пока 3 LVM по 3 ТБ, чтобы поддерживать неисправную систему, и пройти своего рода ад RMA.

# статус пула                                                                               
бассейн: нас
состояние: состояние DEGRADED: в настоящее время выполняется повторное резервирование одного или нескольких устройств. Бассейн будет
        продолжают функционировать, возможно, в ухудшенном состоянии.
Действие: Дождитесь завершения восстановления.
  сканирование: resilver выполняется со среды, 1 декабря, 05:41:15 2021 г.
        665G сканируется со скоростью 24,5 Мбит/с, 640G выдается со скоростью 23,6 Мбит/с, всего 9,78 Тбайт
        182G восстановлено, выполнено 6,40%, осталось 4 дня 16:52:09
конфигурация:

        ИМЯ СОСТОЯНИЕ ЧТЕНИЕ ЗАПИСЬ CKSUM
        nas ДЕГРАДИРОВАННЫЙ 0 0 0
          raidz2-0 ДЕГРАДАЦИЯ 0 0 0
            scsi-35000c50093a9052f DEGRADED 0 0 52 слишком много ошибок
            замена-1 ДЕГРАДИРОВАННЫЙ 0 0 52
              scsi-35000c50084818db7 АВТОНОМНЫЙ 0 0 0
              lvzfs2-lvzfsvol2 ОНЛАЙН 0 0 0 (повторное серебрение)
            scsi-35000c50093a9182b DEGRADED 235 636 52 слишком много ошибок
            scsi-350000c0f01e5dabc DEGRADED 0 0 60 слишком много ошибок
            scsi-35000c5008491a803 DEGRADED 0 0 53 слишком много ошибок (повторное серебрение)
            замена-5 ДЕГРАДИРОВАННЫЙ 0 0 52
              scsi-35000c50084889cf3 АВТОНОМНЫЙ 0 0 0
              lvzfs1-lzfsvol1 ОНЛАЙН 0 0 0 (повторное серебрение)
            scsi-35000c50093a8dfe7 DEGRADED 0 0 52 слишком много ошибок
        запчасти
          lvzfs3-lvzfsvol3 ДОСТУПЕН

ошибки: Обнаружены постоянные ошибки в следующих файлах:

        <метаданные>:<0x0>
root@мерлин ~$

Это повторное серебрение происходит в течение последних месяца или двух, так или иначе. На самом деле все выглядело хорошо в течение коротких периодов времени, когда следующий диск вышел из строя или ранее известный неисправный диск (dd dev/zero'd) снова вышел из строя.

Это буквально сводит меня с ума, и в то же время пугает, так как эти данные являются наиболее важными. Его семейные фотографии 1970-х годов и ранее и т. д.

Помоги пожалуйста?

РЕДАКТИРОВАТЬ: Я добавил комментарий о том, что я на самом деле использую диски, здесь https://www.reddit.com/r/audiophile/comments/bxw38m/bass_vibrations_and_computer_hard_drives/hnvbyj0/ так как я также был обеспокоен тем, что HardHouse и Tidy Tracks раскачивают диски с несколькими сабвуферами. Рассмотрю возможность переноса сервера из офиса в гараж. Мне также удалось создать новый пул zfs, используя порты sata и старые диски емкостью 2 ТБ, и пока никаких проблем. все еще в середине ада resilver, хотя я настроил и даже переместил несколько наборов данных в другой пул.

root@merlin ~$ статус zpool
  бассейн: бак
 состояние: ОНЛАЙН
  скан: не запрошено
конфигурация:

        ИМЯ СОСТОЯНИЕ ЧТЕНИЕ ЗАПИСЬ CKSUM
        бак ОНЛАЙН 0 0 0
          ата-WDC_WD20EZRX-19D8PB0_WD-WCC4M0428332 ОНЛАЙН 0 0 0
          ata-WDC_WD2000FYYZ-01UL1B1_WD-WCC1P0891973 ОНЛАЙН 0 0 0

ошибки: Нет известных ошибок данных

  бассейн: нас
 состояние: ДЕГРАДАЦИЯ
статус: в настоящее время выполняется резервирование одного или нескольких устройств. Бассейн будет
        продолжают функционировать, возможно, в ухудшенном состоянии.
Действие: Дождитесь завершения восстановления.
  сканирование: resilver выполняется с понедельника, 6 декабря, 11:08:12 2021 г.
        7,84T отсканировано со скоростью 37,5M/с, 7,84T выдано со скоростью 37,5M/с, всего 9,78T
        3,39T переработано, выполнено 80,16%, осталось 0 дней 15:03:25
конфигурация:

конфигурация:

        ИМЯ СОСТОЯНИЕ ЧТЕНИЕ ЗАПИСЬ CKSUM
        nas ДЕГРАДИРОВАННЫЙ 0 0 0
          raidz2-0 ДЕГРАДАЦИЯ 0 0 0
            scsi-35000c50093a9052f DEGRADED 0 0 0 слишком много ошибок
            замена-1 ОНЛАЙН 0 0 0
              scsi-35000c50084818db7 ONLINE 0 0 0 (повторное серебрение)
              lvzfs2-lvzfsvol2 ОНЛАЙН 0 0 0 (повторное серебрение)
            замена-2 ДЕГРАДАЦИЯ 0 0 0
              17084797086424522076 НЕДОСТУПЕН 0 0 0 был /dev/disk/by-id/scsi-35000c50093a9182b-part1
              scsi-350000c0f012efb7c ONLINE 0 0 0 (повторное серебрение)
            scsi-350000c0f01e5dabc DEGRADED 0 0 0 слишком много ошибок (повторное серебрение)
            scsi-35000c5008491a803 DEGRADED 0 0 0 слишком много ошибок
            замена-5 ДЕГРАДАЦИЯ 0 0 0
              scsi-35000c50084889cf3 DEGRADED 0 0 0 слишком много ошибок (повторное серебрение)
              lvzfs1-lzfsvol1 DEGRADED 0 0 0 слишком много ошибок (повторное серебрение)
            scsi-35000c50093a8dfe7 DEGRADED 0 0 0 слишком много ошибок

ошибки: 2 ошибки данных, используйте '-v' для списка

К вашему сведению, были ошибки контрольной суммы, но они исчезли после перезагрузки.

Ошибки настолько минимальны, что я серьезно впечатлен надежностью ZFS, поэтому я продолжаю использовать ее для своих основных резервных копий. Лучше, чем резервное копирование на один диск.

Еще одна ошибка, которую я совершил, у меня есть 5 новых дисков, которые лежат здесь уже почти неделю, но я не могу использовать их, пока тома LVM не закончат повторное резервирование, так как я так близок к ошибкам данных, что я хочу, чтобы это закончилось первым, стреляя в себя ногу за то, что не дождался доставки дисков по почте, прежде чем я случайно запустил эту операцию по замене, не понимая, что на завершение всех этих операций с резервным копированием потребуются недели. Сумасшедшее безумие!

Я провел некоторые расчеты для хранилища glacier (0,004/ГБ), которое будет стоить 20 долларов в месяц за 5 ТБ, а не вариант. Если мне когда-нибудь понадобятся эти данные, забудьте об исходящих расходах. Также мне очень нравится использовать для этого ZFS на домашнем сервере. предыдущим дискам массива было 8 лет, когда они были сняты, и я использовал только известные плохие диски во всем массиве, и мне все же удалось z2 мой путь к успеху. Я полагал, что новый набор отремонтированных или обновленных дисков решит эту проблему. Извините, думаю, я выдыхаюсь, но я хотел бы услышать больше о том, что я могу делать неправильно...

Между прочим, я заставил компанию заплатить (в данном случае deepdiscountserver) за замену дисков разных моделей. мне больше не нужны ремонты IBM. собираюсь протестировать HGST, так как в прошлом они хорошо работали для меня.

Будьте уверены, новая карта SAS будет в пути, если у них возникнут проблемы, как только это безумие resilver закончится, если оно когда-либо закончится. Если нет, мне придется сделать еще одну полную резервную копию, которая занимает почти столько же времени, сколько и resilver ... По крайней мере, я уже переместил живые данные из массива, поэтому никаких потерь не произойдет, если я не потеряю свои основные диски в другой системе в течение всего времени. это... Думаю, я могу сказать, что данные чрезвычайно важны, но у меня все еще есть их копия, но пока я могу терпеть потерю. Уточнение «важной» части: это будет СРОЧНО, если массив ZFS начнет извергать ошибки, потому что у меня есть только один диск здесь и там, который содержит главные копии.

Рейтинг:3
флаг cn

Мне нужно протестировать карту контроллера Dell SAS.

Простой. Замените другим. Тогда вы узнаете, есть ли проблемы с картой.

Нет доступных? Можем ли мы вернуться к «профессионализму» и «лучшим практикам» в правилах сайта? Попросите компанию сделать это (и заплатить). Проверка замены — практически единственный (и, безусловно, самый эффективный) способ убедиться, что деталь не неисправна.

так как эти данные являются наиболее важными. Его семейные фотографии 1970-х годов и раньше и тд...

Кроме того, что это не по теме здесь...

...это ВООБЩЕ ДЛЯ ВАС НЕ ВАЖНО. Я придерживаюсь принципа «деньги там, где рот». Если бы это БЫЛО важно для вас, это было бы подкреплено. Я имею в виду, я учился в школе — более 30 лет назад — что резервное копирование — это мысль и необходимость. Итак, не приходите с «важным», когда в конце вы отказываетесь делать то, что люди делают с важными данными. Начните внедрять резервное копирование — вокруг полно недорогих услуг.

Brian Thomas avatar
флаг by
спасибо, замена не совсем полезна, я уже подумал об этом, жена уже катается на рождество, тут говорили о потере данных.. иногда просто не можешь позволить себе что-то, если понимаешь, о чем я.. Кстати, к твоим резервным копиям, это резерв!! Я играю рано, я не хочу терять свои основные данные (на одном диске) в то же время, когда я исправляю массив. Меня всегда удивляет, когда кто-то говорит бросить на это деньги. уже рассматривал, поверьте мне... Я ценю совет, что нет другого выхода, кроме как заменить его, но на самом деле? Придется раскошелиться... ой...
флаг cn
"спасибо, замена не совсем помогает" - да, ок. Итак, в вашем мире было бы полезно получить схемы и лабораторию электроники и протестировать каждое отдельное соединение пайки И запустить логическое тестовое оборудование на всех микросхемах? Профессиональный способ (требуемый правилами сайта, помогает он вам или нет) — это эффективный способ: заменить, проверить, тогда вы ЗНАЕТЕ, где искать. И это НАМНОГО дешевле, чем проводить многодневные тесты в лаборатории, а потом просто понять, что кабель — это дерьмо. Или ваш блок питания. Это даже не выбрасывание денег - важно иметь готовую замену.
флаг cn
Если это ваша резервная копия, проверьте реальность и начните использовать службы резервного копирования. У AWS, Azure, Backblaze есть неплохие сервисы, которые НАМНОГО более гарантированы, чем рейд на основе SAS низкого уровня.
Brian Thomas avatar
флаг by
платить ежемесячную подписку вместо этого? пшшш. Поделиться с большими данными? пшшш.. Я уже в области SRE. Я представляю вам, ZFS на домашнем сервере в качестве резервной копии ... Я почти уверен, что это карта, так как теперь почти все диски показывают плохие результаты. Я собираюсь переустановить его. Я также не говорил о лабораторных испытаниях, я спрашивал, есть ли другие программные способы тестирования, о которых я, возможно, не знаю.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.