Короче говоря, нет, волшебно чистого решения не существует. Самое чистое восстановление - перезагрузка.
Проблема в том, что когда соединение отсутствует дольше, чем iscsid replace_timeout
, файловая система начинает получать ошибки ввода-вывода. Если у вас нет очень специального приложения, обычно нет возврата к ошибке ввода-вывода. Это сеет все виды хаоса с услугами. Почти всегда лучше перезагрузиться, чем пытаться разобраться, почему все программы перестали работать.
Сказав это, что вы можете сделать, это подтолкнуть это replace_timeout
насколько вам удобно. В Интернете вы найдете ссылки на такие приложения, как базы данных, которые рекомендуют часовой тайм-аут (3600 секунд) или даже больше. Это подталкивает проблему к чему-то вроде зависания жесткого монтирования NFS. Если вам нужно спроектировать систему, которая выдерживает сбои, когда человеку приходится вмешиваться, чтобы исправить это, лучше использовать гораздо более длительный тайм-аут. Система просто зависает, пока ссылка не вернется.
Вы можете установить значение по умолчанию для всей системы в /etc/iscsi/iscsid.conf
. Отредактируйте эту строку:
node.session.timeo.replacement_timeout = 120