Работая учеными в корпоративной среде, мы получаем ресурсы хранения из SAN внутри виртуальной машины Ubuntu 20.04 (Proxmox). Контроллер SAN передается непосредственно на виртуальную машину (переход PCIe).
Сама SAN использует аппаратный Raid 60 (другого варианта у нас нет) и предоставляет нам 380 ТБ, которые мы можем разделить на несколько LUN. Мы хотели бы воспользоваться функциями сжатия ZFS и моментальных снимков. Мы выбрали 30 LUN по 11 ТБ, которые затем организовали как чередующийся RAID-Z. Настройка избыточна (два сервера), у нас есть резервные копии, и производительность хорошая, что сориентировало нас в пользу чередующегося RAID-Z в пользу обычных чередующихся зеркал.
Независимо от геометрии ZFS мы заметили, что высокая нагрузка записи (> 1 ГБ/с) во время очистки ZFS приводит к ошибкам диска, что в конечном итоге приводит к неисправным устройствам. Просмотрев файлы с ошибками, мы можем связать эту проблему с процессом очистки, пытающимся получить доступ к данным, все еще присутствующим в кэше SAN. При умеренных нагрузках во время очистки процесс завершается без ошибок.
Существуют ли параметры конфигурации для ZFS или для многопутевого доступа, которые можно настроить внутри виртуальной машины, чтобы предотвратить эту проблему с кэшем SAN?
Вывод состояния zpool
бассейн: санпул
состояние: ОНЛАЙН
сканирование: скраб восстановил 0B за 2 дня 02:05:53 с 0 ошибками в четверг 17 марта 15:50:34 2022
конфигурация:
ИМЯ СОСТОЯНИЕ ЧТЕНИЕ ЗАПИСЬ CKSUM
санпул ОНЛАЙН 0 0 0
raidz1-0 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000002e ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000002f ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000031 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000032 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000033 ОНЛАЙН 0 0 0
raidz1-1 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000034 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000035 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000036 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000037 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000038 ОНЛАЙН 0 0 0
raidz1-2 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000062 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000063 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000064 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000065 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000066 ОНЛАЙН 0 0 0
raidz1-3 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000006a ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000006b ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000006c ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000006d ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000006f ОНЛАЙН 0 0 0
raidz1-4 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000070 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000071 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000072 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000073 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000074 ОНЛАЙН 0 0 0
raidz1-5 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000075 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000076 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000077 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b00300000079 ОНЛАЙН 0 0 0
wwn-0x60060e8012b003005040b0030000007a ОНЛАЙН 0 0 0
ошибки: Нет известных ошибок данных
Вывод multipath -ll
mpathr (360060e8012b003005040b00300000074) dm-18 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:25 сдз 65:144 активен готов работает
`- 8:0:0:25 sdbd 67:112 активен готов работает
mpathe (360060e8012b003005040b00300000064) dm-5 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:13 sdn 8:208 активен готов работает
`- 8:0:0:13 sdar 66:176 активен готов работает
mpathq (360060e8012b003005040b00300000073) dm-17 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:24 sdy 65:128 активен готов работает
`- 8:0:0:24 sdbc 67:96 активен готов работает
mpathd (360060e8012b003005040b00300000063) dm-4 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:12 sdm 8:192 активен готов работает
`- 8:0:0:12 sdaq 66:160 активен готов работает
mpathp (360060e8012b003005040b00300000072) dm-16 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:23 sdx 65:112 активен готов работает
`- 8:0:0:23 sdbb 67:80 активен готов работает
mpathc (360060e8012b003005040b00300000062) dm-3 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:11 sdl 8:176 активен готов работает
`- 8:0:0:11 sdap 66:144 активен готов работает
мпато (360060e8012b003005040b00300000071) dm-15 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:22 sdw 65:96 активен готов работает
`- 8:0:0:22 sdba 67:64 активен готов работает
mpathb (360060e8012b003005040b00300000038) dm-2 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:10 sdk 8:160 активен готов работает
`- 8:0:0:10 sdao 66:128 активен готов работает
mpathn (360060e8012b003005040b00300000070) dm-14 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:21 sdv 65:80 активен готов работает
`- 8:0:0:21 sdaz 67:48 активен готов работает
mpatha (360060e8012b003005040b0030000002e) dm-1 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:1 sdb 8:16 активен готов работает
`- 8:0:0:1 sdaf 65:240 активен готов работает
mpathz (360060e8012b003005040b00300000033) dm-26 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:5 sdf 8:80 активен готов работает
`- 8:0:0:5 sdaj 66:48 активен готов работает
mpathm (360060e8012b003005040b0030000006f) dm-13 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:20 sdu 65:64 активен готов работает
`- 8:0:0:20 sday 67:32 активен готов работает
mpathy (360060e8012b003005040b00300000032) dm-25 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:4 sde 8:64 активно готово работает
`- 8:0:0:4 sdai 66:32 активен готов работает
mpathl (360060e8012b003005040b0030000002f) dm-12 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:2 sdc 8:32 активен готов работает
`- 8:0:0:2 sdag 66:0 активен готов работает
mpathx (360060e8012b003005040b0030000007a) dm-24 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:30 sdae 65:224 активен готов работает
`- 8:0:0:30 sdbi 67:192 активен готов работает
mpathad (360060e8012b003005040b00300000037) dm-30 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:9 sdj 8:144 активен готов работает
`- 8:0:0:9 sdan 66:112 активен готов работает
mpathk (360060e8012b003005040b0030000006d) dm-11 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:19 sdt 65:48 активен готов работает
`- 8:0:0:19 sdax 67:16 активен готов работает
mpathw (360060e8012b003005040b00300000031) dm-23 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:3 sdd 8:48 активен готов работает
`- 8:0:0:3 sdah 66:16 активен готов работает
mpathac (360060e8012b003005040b00300000036) dm-29 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:8 sdi 8:128 активен готов работает
`- 8:0:0:8 sdam 66:96 активен готов работает
mpathj (360060e8012b003005040b0030000006c) dm-10 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:18 sds 65:32 активен готов работает
`- 8:0:0:18 sdaw 67:0 активен готов работает
mpathv (360060e8012b003005040b00300000079) dm-22 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:29 sdad 65:208 активен готов работает
`- 8:0:0:29 sdbh 67:176 активен готов работает
mpathab (360060e8012b003005040b00300000035) dm-28 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:7 sdh 8:112 активен готов работает
`- 8:0:0:7 sdal 66:80 активен готов работает
mpathi (360060e8012b003005040b0030000006b) dm-9 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:17 sdr 65:16 активен готов работает
`- 8:0:0:17 sdav 66:240 активен готов работает
mpathu (360060e8012b003005040b00300000077) dm-21 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:28 sdac 65:192 активен готов работает
`- 8:0:0:28 sdbg 67:160 активен готов работает
mpathaa (360060e8012b003005040b00300000034) dm-27 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:6 sdg 8:96 активен готов работает
`- 8:0:0:6 sdak 66:64 активен готов работает
mpathh (360060e8012b003005040b0030000006a) dm-8 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:16 sdq 65:0 активен готов работает
`- 8:0:0:16 sdau 66:224 активен готов работает
mpatht (360060e8012b003005040b00300000076) dm-20 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:27 sdab 65:176 активен готов работает
`- 8:0:0:27 sdbf 67:144 активен готов работает
mpathg (360060e8012b003005040b00300000066) dm-7 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:15 sdp 8:240 активно готово работает
`- 8:0:0:15 sdat 66:208 активен готов работает
mpaths (360060e8012b003005040b00300000075) dm-19 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:26 sdaa 65:160 активен готов работает
`- 8:0:0:26 sdbe 67:128 активен готов работает
mpathf (360060e8012b003005040b00300000065) dm-6 HITACHI,OPEN-V
size=11T features='0' hwhandler='0' wp=rw
`-+- policy='service-time 0' prio=1 status=active
|- 7:0:0:14 sdo 8:224 активен готов работает
`- 8:0:0:14 sdas 66:192 активен готов работает