Рейтинг:1

сломанное монтирование iscsid после восстановления

флаг kr
dna

я играю с Open-iSCSI и столкнулся с некоторыми неприятностями. Когда сетевое соединение между моим инициатором и целью терпит неудачу, iscsid восстановит соединение, что хорошо. Но мое крепление сломано и уступает Ошибка ввода/вывода пока не перемонтируется.

Есть ли чистое решение для автоматического перемонтирования луны? Что-то вроде хука на пост-восстановление или настройку конфига, которую я как-то пропустил? Я пытаюсь избежать сценария опроса или чего-то в этом роде :)

журнал iscsid
14 января 08:03:45 localhost iscsid [1415]: iscsid: ядро ​​сообщило об ошибке соединения iSCSI 1:0 (1022 — ISCSI_ERR_NOP_TIMEDOUT: время ожидания NOP истекло) состояние (3)
14 января 08:04:22 localhost iscsid[1415]: iscsid: не удалось подключиться к 10.0.2.100:9999 (нет маршрута к хосту)
[...]
14 января 08:38:43 localhost iscsid[1415]: iscsid: не удалось подключиться к 10.0.2.100:9999 (нет маршрута к хосту)
14 января, 08:38:47 localhost iscsid[1415]: iscsid: connection1:0 работает после восстановления (195 попыток)
14 января 08:39:52 localhost iscsid [1415]: iscsid: ядро ​​сообщило об ошибке соединения iSCSI 1:0 (1020 — ISCSI_ERR_TCP_CONN_CLOSE: соединение TCP закрыто) состояние (3)
14 января 08:40:11 localhost iscsid[1415]: iscsid: connection1:0 работает после восстановления (2 попытки)
фстаб
UUID=cf3d20cd-a8cd-4a9a-acbf-1c61289a37bb /data xfs defaults,_netdev,x-systemd.requires=iscsid.service 0 0
Рейтинг:0
флаг ng

Короче говоря, нет, волшебно чистого решения не существует. Самое чистое восстановление - перезагрузка.

Проблема в том, что когда соединение отсутствует дольше, чем iscsid replace_timeout, файловая система начинает получать ошибки ввода-вывода. Если у вас нет очень специального приложения, обычно нет возврата к ошибке ввода-вывода. Это сеет все виды хаоса с услугами. Почти всегда лучше перезагрузиться, чем пытаться разобраться, почему все программы перестали работать.

Сказав это, что вы можете сделать, это подтолкнуть это replace_timeout насколько вам удобно. В Интернете вы найдете ссылки на такие приложения, как базы данных, которые рекомендуют часовой тайм-аут (3600 секунд) или даже больше. Это подталкивает проблему к чему-то вроде зависания жесткого монтирования NFS. Если вам нужно спроектировать систему, которая выдерживает сбои, когда человеку приходится вмешиваться, чтобы исправить это, лучше использовать гораздо более длительный тайм-аут. Система просто зависает, пока ссылка не вернется.

Вы можете установить значение по умолчанию для всей системы в /etc/iscsi/iscsid.conf. Отредактируйте эту строку:

node.session.timeo.replacement_timeout = 120

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.