Рейтинг:2

Восстановление данных из массива Dell MD3220 после того, как оба контроллера имеют поврежденные базы данных

флаг ve

Я работал над восстановлением данных из массива, созданного на устройстве хранения данных Dell MD3220 PowerVault. Разговаривает по телефону с Dell и другой группой поддержки уже несколько недель и натыкается на кирпичные стены. Я надеялся, что у кого-то здесь может быть идея, которую я мог бы попробовать в надежде восстановить данные. Устройство хранения имеет 24 отсека для дисков, обозначенных основанием 0 (поэтому диск 24 называется 23, а диск 1 — 0).

MD3220 ФронтMD3220 Назад

В устройстве произошло отключение питания, и я предполагаю, что причиной проблемы было отключение хранилища до того, как два сервера получили доступ к данным (через кабели SAS). Таким образом, базы данных, содержащие конфигурацию массива, расположенную на каждом контроллере в MD3220 (их два), стали поврежденными.

  • Мы попытались восстановить БД, заменив текущую БД последней резервной копией, найденной на самом контроллере (распространенный сценарий). Казалось, это не удалось.

  • Мы даже дошли до того, что попытались перестроить базу данных с помощью файлов, хранящихся на моем сервере (файлы DBM), которые я использую для управления устройством. Мы попросили Dell сгенерировать ключ Validator для использования при восстановлении баз данных. Похоже, это тоже не удалось.

Ошибка, которую я продолжаю видеть, что я не могу обойти, Тип исключения N3adp6Device24ExtentAllocatedExceptionE сообщение «N3adp6Device24ExtentAllocatedExceptionE» с экстентом: 553 размера: 1106 для порядкового номера диска 22.

29.09.21–19:24:37 (tRAID): ПРЕДУПРЕЖДЕНИЕ: UWManager::initializeNvsramIWLog: IWLog признан недействительным
29.09.21–19:24:37 (tRAID): ПРИМЕЧАНИЕ. UWMgr findIWLogs: найден диск журнала IW. Devnum 0x10001 лоток=0 слот=2 ssd=0 qos=3 контроллер=0
29.09.21–19:24:37 (tRAID): ПРИМЕЧАНИЕ. UWMgr findIWLogs: найден диск журнала IW. Devnum 0x10002 лоток = 0 слот = 3 ssd = 0 qos = 3 контроллер = 0
29.09.21-19:24:37 (IWTask): ПРИМЕЧАНИЕ. UWMgr: начато ведение журнала IW.
29.09.21–19:24:41 (tRAID): ОШИБКА: CrushDrive::allocateExtent — тип исключения N3adp6Device24ExtentAllocatedExceptionE, сообщение «N3adp6Device24ExtentAllocatedExceptionE» с экстентом: 553 размера: 1106 для порядкового номера диска 22
29.09.21-19:24:41 (tRAID): ОШИБКА: десериализация CrushStripe — не удалось выделить экстент! CrushDrive 22 Том 1 CrushPiece 2 Объем 553
29.09.21–19:24:41 (tRAID): ОШИБКА: исключение при выделении полосы в vdm::CrushStripePersistenceManager::initialize(1)
29.09.21–19:24:41 (tRAID): ОШИБКА: обнаружен vdm::CrushInvalidCfgMgr DB_CORRUPT
29.09.21-19:24:41 (tRAID): ПРИМЕЧАНИЕ: lockdownPrimaryDBInvalidWorker: OBB уже в pcache, не обновляется.
29.09.21–19:24:41 (tRAID): ПРЕДУПРЕЖДЕНИЕ: BackupDatabaseManager:lockdownPrimaryDBInvalid Exception IconSendInfeasibleException Ошибка
29.09.21–19:24:41 (tRAID): ПРЕДУПРЕЖДЕНИЕ: BDBM: клиент обнаружил повреждение основной базы данных. Принудительный дуалконтроллерлокдаун.
29.09.21-19:24:41 (tRAID): ПРЕДУПРЕЖДЕНИЕ: Ctl Перезагрузка:
                                Перезагрузка CompID: 0x407
                                Причина перезагрузки: 0x11
                                Дополнительная причина перезагрузки: 0x2
29.09.21-19:24:41 (tRAID): ПРЕДУПРЕЖДЕНИЕ: Перезагрузка этого контроллера сейчас

Я предполагаю, что «порядковый номер 22» говорит о диске 23 (из 24 дисков)? Хотя не уверен, на что жалуется. Диск 23 плохой? Есть ли база данных на всех дисках, а БД на диске 23 плохая? Есть ли способ восстановить эту базу данных дисков, например скопировать ее из другой и т. Д.? Это вообще говорит о диске 23? Любая помощь, которую кто-либо может бросить мне, будет иметь кучу.

Спасибо!!

флаг br
Это 10-летняя модель - я удивлен, что она до сих пор поддерживается! Когда вы говорите базы данных, вы имеете в виду макет массива или ваши фактические базы данных приложения? Нельзя ли просто полностью стереть массив, перестроить массив и восстановить данные из резервной копии?
djdomi avatar
флаг za
открыть тикет на Dell, если все-таки купил
флаг ve
@djdomi не совсем уверен, как ответить на этот комментарий. В своем вопросе я сказал, что работаю с Dell уже несколько недель. Итак, да, у меня есть билет, который я открыл в Dell и... да, я его купил..?
флаг ve
@ Chopper3 у него нет контракта, и нам пришлось дорого заплатить за возможность «одноразовой поддержки». Под БД я подразумеваю макет массива. Dell называет это базой данных на RAID-контроллерах. На нем есть несколько вещей, которые не были подкреплены. Так что да, я мог бы, но я бы потерял некоторые данные, которые я бы предпочел не делать. Это может сэкономить мне много недель на восстановление, поэтому стоит попытаться восстановиться.
djdomi avatar
флаг za
Короче говоря, платите за поддержку Dell, пока вы используете этот элемент. У нас было подобное устройство, которое сломалось из-за того, что перестали работать контроллеры. Последней критической точкой было то, что Dell была на стороне, все было отключено, последний из обоих контроллеров вышел из строя в этот момент .... обновление прошивки их оживило.
Zac67 avatar
флаг ru
> В устройстве произошло отключение питания, и я предполагаю, что причиной проблемы было отключение хранилища до того, как два сервера получили доступ к данным (через кабели SAS). Это то, что вам *действительно* нужно предотвратить. В коробке есть два блока питания, и по крайней мере один из них должен быть подключен к ИБП (или оба к разным ИБП). Внезапное отключение питания может повредить настройку RAID (как в вашем случае) или данные, хранящиеся на устройстве, даже незаметно, поэтому вы заметите это только через несколько дней/недель или, возможно, никогда. У меня был MD3220i, который интенсивно использовался в течение многих лет, и я помню, что оригинальная прошивка вызвала несколько проблем.

Ответить или комментировать

Большинство людей не понимают, что склонность к познанию нового открывает путь к обучению и улучшает межличностные связи. В исследованиях Элисон, например, хотя люди могли точно вспомнить, сколько вопросов было задано в их разговорах, они не чувствовали интуитивно связи между вопросами и симпатиями. В четырех исследованиях, в которых участники сами участвовали в разговорах или читали стенограммы чужих разговоров, люди, как правило, не осознавали, что задаваемый вопрос повлияет — или повлиял — на уровень дружбы между собеседниками.