у нас есть кластер Kafka с RHEL 7.6, все Kafka - это виртуальные машины
на одной из машин Kafka мы заметили, что диск sdb стал доступен только для чтения (когда sda является диском ОС)
гора | grep сдб
/dev/sdb в /var/data/kafka_DB типа ext4 (ro,noatime,data=ordered)
с моей точки зрения немного странно, что DISK VMDK стал только для чтения (потому что это не механический диск)
из красной шляпы я нахожу следующее
https://access.redhat.com/solutions/1273213
https://access.redhat.com/solutions/35329
но не уверен, что приведенные выше предложения от RedHat являются ответом, почему диск стал доступен только для чтения
какие еще мнения?
из логов ядра видим:
[1642397.157193] sd 0:0:2:0: [sdb] FAILED Результат: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157200] sd 0:0:2:0: [sdb] CDB: Write(10) 2a 00 12 c0 01 00 00 00 08 00
[1642397.157214] blk_update_request: ошибка ввода-вывода, dev sdb, сектор 314573056
[1642397.157242] Ошибка ввода-вывода буфера на dev sdb, логический блок 39321632, потеря записи асинхронной страницы
[1642397.157806] sd 0:0:2:0: [sdb] FAILED Результат: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157808] sd 0:0:2:0: [sdb] CDB: чтение(10) 28 00 12 c4 03 58 00 00 08 00
[1642397.157810] blk_update_request: ошибка ввода-вывода, dev sdb, сектор 314835800
[1642397.157843] sd 0:0:2:0: [sdb] FAILED Результат: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT
[1642397.157845] sd 0:0:2:0: [sdb] CDB: чтение(10) 28 00 12 c4 0b a0 00 00 08 00
[1642397.157847] blk_update_request: ошибка ввода-вывода, dev sdb, сектор 314837920
[1642578.412306] sd 0:0:2:0: [sdb] прерывание задачи на хосте 0, ffff8c147c189880
[1642924.513605] sd 0:0:2:0: [sdb] прерывание задачи на хосте 0, ffff8c16a4f01880
[1643034.935334] JBD2: обнаружены ошибки ввода-вывода при сбросе данных файла на sdb-8.
[1643035.002651] Ошибка EXT4-fs (устройство sdb): __ext4_new_inode:989: comm pool-6-thread-1: не удалось вставить inode 8126474: выделено дважды?
[1643036.753397] Прерывание журнала на устройстве sdb-8.
[1643036.754490] Ошибка EXT4-fs (устройство sdb): ext4_journal_check_start:56: обнаружен прерванный журнал
[1643036.754496] EXT4-fs (sdb): перемонтирование файловой системы только для чтения
[1643226.599854] sd 0:0:2:0: [sdb] прерывание задачи на хосте 0, ffff8c14a4bd3800
[1694249.598258] EXT4-fs (sdb): количество ошибок с момента последнего fsck: 17
[1694249.598269] EXT4-fs (sdb): начальная ошибка во время 1629844995: ext4_find_entry:1312: inode 656236
[1694249.598273] EXT4-fs (sdb): последняя ошибка в момент времени 1630003886: ext4_journal_check_start:56
[1780756.527074] EXT4-fs (sdb): количество ошибок с момента последнего fsck: 17
[1780756.527086] EXT4-fs (sdb): начальная ошибка во время 1629844995: ext4_find_entry:1312: индексный дескриптор 656236
[1780756.527088] EXT4-fs (sdb): последняя ошибка в момент времени 1630003886: ext4_journal_check_start:56
что мы думаем сделать, это обновить /система/блок/
базовое имя /dev/sdb/устройство/тайм-аут
например значение по умолчанию 180
и мы думаем установить новое значение обновления как
echo 3600 > /sys/block/`basename/dev/sda`/device/timeout
мы хотим знать, находимся ли мы в правильном направлении с вышеуказанным решением?