Рейтинг:0

как работает чередующийся RAID с большим количеством дисков?

флаг jp

все еще пытаюсь настроить мой большой (24) массив дисков (2,4 ТБ) для архива / nas смешанных больших и маленьких файлов. Но помимо этого, я теперь больше сосредоточен на том, чтобы понять, как работают чередующиеся RAID под капотом, но я больше читаю и больше запутываюсь, потому что большинство примеров в литературе основаны на «малом» количестве дисков (я спросил производителя, но он не хотел публично отвечать на некоторые из этих вопросов, потому что «зарезервированная информация»)

  • размер полосы обычно (количество дисков данных) x (размер полосы) (или кусок) Например. 8x64 КБ = 512 КБ или 10x256 КБ = 2560 КБ
  • как файлы разбиваются и сохраняются в полоса? один файл на страйп (остальные страйпы заполняются нулями) или много файлов на страйп, пока он не заполнит все его страйпы?
  • для большого массива размер полосы по-прежнему важен? Я имею в виду, что обнаружил, что мой PERC использует фиксированное значение 1 МБ для размера полосы, если его значение больше 1 МБ (например, 8x256 КБ). Как в этом случае должна располагаться полоса? он по-прежнему велик, как 8x256 КБ = 2 МБ и внутренне разделен на 2x 1 МБ? или это большой 1мб разделенный на 8 дисков с данными?
  • в настоящее время я должен настроить чередующийся RAID с учетом «степени 2»? мой PERC позволяет мне настроить любое количество дисков для любого уровня RAID, которые не являются степенью 2
  • зная эти ограничения(?), стоит ли ставить массив в виде 2x12Дисков RAID60 и размером полосы 256Кб? нам не нужно тратить слишком много места
Рейтинг:2
флаг br

как файлы разбиваются и сохраняются в страйпе? один файл на полосу (остальные полоски заполнены нулями) или много файлов для чередовать, пока все его полоски не будут заполнены?

Подобные массивы не думают о файлах, а только о блоках, сама файловая система определяет, какие файлы состоят из каких блоков, а не базовая дисковая система.

Так что не думайте об этом как о файлах просто как о блоках, представьте себе все файлы в вашей файловой системе, но уберите все данные о папках и файлах, это просто одна большая куча блоков — и именно эти блоки чередуются на доступных дисках для повышения производительности. и устойчивость.

Вообще говоря, настройки по умолчанию для файловых систем и RAID-массивов, подобные этому, прекрасно подходят для 95% всех приложений. Возможность их настройки великолепна, если у вас есть время, чтобы поиграться и протестировать все различные комбинации, или если у вас есть приложение, которое имеет необычные требования (например, оно постоянно читает или записывает либо множество крошечных случайных файлов, либо на другом конце огромные последовательные файлы) - в этих случаях да, некоторые настройки могут иметь значительные преимущества. Но опять же, вообще говоря, значения по умолчанию обычно довольно хороши для большинства случаев использования. Я использую VoD, поэтому мы часто настраиваем наши тома хранения, чтобы иметь очень большие полосы/блоки, потому что мы знаем, что все они представляют собой большие последовательные файлы, но затем мы не помещаем наши файлы БД или журналы и т. д. в эти массивы/тома, потому что они было бы ужасно для такого использования.

В любом случае, вернемся к рекомендациям, рад, что вы, кажется, остановились на R60 — к нам постоянно приходят люди с проблемами с R5/50, он мертв, не используйте его вообще — R6/60 и R1/10 — единственная игра. в городе, если у вас в любом случае нет промаха для ZFS :) - в любом случае, если бы я делал это, я бы сделал именно то, что вы предлагаете - R60 состоит из 2 x 12-дисковых R6, оставьте полосу по умолчанию, а затем как ваше приложение начинает использовать этот массив, вы можете посмотреть, как он работает, и если вы действительно чувствуете, что вам нужно его настроить, и вы получите большую выгоду от этого, тогда продолжайте, но я уверен, что вы будете в порядке со значениями по умолчанию .

Удачи.

pink0.pallino avatar
флаг jp
Спасибо, еще один кирпичик в стену моих знаний. Мне нравится ZFS, но используется только внутри встроенного программного обеспечения NAS, а не с ОС с нуля. Также кажется мощным контроллером, каковы преимущества использования «программного рейда» по сравнению с HW? Что касается других моих сомнений, из вашего ответа я теперь догадываюсь, что «полоса полос» заполняется до «завершения», а затем используется следующая. Что делать, если контроллер использует «размер полосы» короче, чем значение, которое я установил? использование числа дисков «степень 2» повысит производительность, потому что выравнивание «кусок-страйп-PV/LVM-XFS» идеально?
Zac67 avatar
флаг ru
@pink0.pallino Как правило, полосы большего размера лучше работают с большими последовательными записями (из-за меньших затрат на обработку) и хуже с небольшими случайными записями (из-за усиления записи). Вы должны выбрать размер полосы, который соответствует вашему приложению. Если вы не знаете, проведите тесты. Все варианты RAID обычно работают лучше всего, когда количество дисков равно степени двойки плюс диски, добавленные для избыточности, например. 4, 6, 10 или 18 для RAID 6 или 8, 12, 20, 36 для RAID 60.
pink0.pallino avatar
флаг jp
@ Zac67 Zac67 да, я выбираю размер полосы 256 КБ для массива 2x (10 + 2 RAID6). Это должно соответствовать нашим потребностям. Мое любопытство заключалось в том, как контроллер управляет этой большой полосой (2560 КБ), если в таком случае он использует свои собственные полосы размером 1 МБ, что не кратно тому, что я выбираю, и я не хотел устанавливать его «неправильно». Можете ли вы объяснить, почему для RAID60 правило «степень двойки» равно 8, 12, 20, 36, а не то же самое для RAID6? Я всегда думал, что есть RAID0 поверх двух массивов RAID6 и для каждого из них правило 4, 6, 10, 18
Zac67 avatar
флаг ru
RAID 60 (также называемый RAID 6+0) состоит из двух подмассивов RAID 6, которые чередуются, как RAID 0, см. https://en.wikipedia.org/wiki/Nested_RAID_levels#RAID_60_(RAID_6+0)

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.