Помимо метаданных, которые использует RAID-контроллер, есть ли какие-либо различия между этими двумя массивами (с точки зрения размещения данных, производительности, надежности)?
Да. RAID5 использует одну циклическую четность, а RAID6 использует две. Вы можете визуализировать выделенные диски четности, но на самом деле они вращаются.
RAID5 должен быть довольно простым:
Представьте, что с RAID6 отсутствует последний диск:
диаграммы предоставлены Википедия [*1]
Макеты, очевидно, различаются, и ухудшенный RAID6 требует значительной дополнительной выборки и пересчета, чтобы компенсировать отсутствующий диск, в отличие от неповрежденного массива RAID5.
Например, вместо непосредственного чтения B3 любые три фрагмента из [B1, B2, Bp, Bq] должны быть прочитаны для восстановления B3 — обратите внимание, что это временно и должно выполняться каждый раз при доступе к B3. Также обратите внимание, что это «усиление чтения» для случайного чтения увеличивается с количеством дисков. Для более длинных последовательных чтений другие фрагменты все равно должны быть прочитаны.
Ожидается, что ухудшенный массив RAID6 будет работать намного хуже, в зависимости от рабочей нагрузки, реализации RAID-контроллера и кэширования. Реализации RAID, как правило, оптимизированы для нормальной работы и стабильности, поэтому производительность ухудшенного массива может оказаться ниже ожидаемой даже при наличии большого кэша.
Могу ли я преобразовать массив RAID6 с одним отсутствующим диском в RAID5 с одним менее ожидаемым диском с минимальным «изменением формы» / «перезаписью»?
Да, теоретически, поскольку все данные можно восстановить. На практике это зависит от возможностей имеющегося RAID-контроллера. Поскольку для этого требуется специальный алгоритм миграции, реализация маловероятна. Лично я не думаю, что когда-либо видел этот вариант, но, опять же, я его и не искал.
[*1] Обратите внимание, что существуют разные способы сопоставления данных в массивах RAID. На приведенных выше диаграммах показаны самые простые, неоптимизированные схемы. Другие схемы оптимизируют определенные рабочие нагрузки, а схема RAID5 для последовательного доступа на чтение может быть
A1-A2-A3-Ар
B2-B3-Bp-B1
C3-Cp-C1-C2
Дп-Д1-Д2-Д3