Можете ли восстановить данные raid после логического сбоя на разделе и последующей проверки диска FSCK
Добрый день! Подскажите, возникла такая ситуация с одной из СХД, которая привела к потере данных. Можно ли узнать, возможно ли, потенциально, восстановление данных? 1.1 Описание технической части. Есть главный сервер (StorageMaster), он же "голова", к которому посредством 10G Etehernet (орптика/медь) подключаются разные хранилки посредством iScsi, (соответственно, как блочные устройства) в том числе и та, на которой был инцидент, далее StorageMaster "раздает" ресурсы потребителям по NFS/SMB/FTP. Данная хранилка самособорная, на базе сервера Supermicro, у нас проходит под именем хоста - StorageMaster2. Это 4U сервер, который имеет на борту 24 HDD диска SATA диска Seagate объемом 16Тб, которые собраны в два пула по 11 дисков, используется Raid 6 и 2 hotspare диска на базе контроллера LSI MegaRAID SAS 9280-24i4e, батарея резервного питания (BBU) исправна. На пулах созданы разделы по 130Тб. Блочныу устройства монтируются на StorageMaster Разделы простым скриптом по UUID. Также в момент инцидента на StorageMaster2 был установлен PCI NVME диск Samsung PM1735 1.6Тб. Операционные системы на обоих серверах (StorageMaster и StorageMaster2) Linux OpenSuse, администрируются смешанным образом (CLI/GUI). 1.2 Хронология инцидента: - StorageMaster2 выключен - NVME диск извлечен - StorageMaster2 включен - На StorageMaster не смонтировался раздел /san5lun1 - Перезагрузка StorageMaster2, безрезультатно Далее действия происходят только на StorageMaster2 (чтобы исключить сетевую часть) - в GUI StorageMaster2 пытаюсь монтировать диски поочередно, показывается ДВА смонтированных /dev/sdb и /dev/sdb*, вижу такое в первый раз. - у обоих блочных устройств одинаковый UUID и изменены названия устройств - командой tunefs произведена попытка назначить правильный UUID устройству /dev/sdc - устройство не монтируется, т.к требуется fsck - fsck с первого раза не прошел, т.к. выяснилось в ходе экспериментов, что для такого емкого устройства для fsck необходимо 24Гб ОЗУ, а установлено только 8Гб -StorageMaster2 выключен и установлено 96Гб ОЗУ. - StorageMaster включен - fsck прошел - UUID по прежнему неверный, - раздел подмонтирован, данных нет.
Привозите. Будем разбираться. Телепатически, после FSCK, ничего не продиагностировать. Нужно брать и работать. Везти лучше сразу всю хранилку.
Подскажите, а есть ли возможность выезда вашего специалиста для первичного анализа? В хранилке есть вторая часть, которая не повреждена, разбирать бы сразу не хотелось. Если возможности нет, то что в минимальном составе вам необходимо для анализа?
Подобные случаи мы делаем только на месте. Для первоначального анализа нам нужна полка, на которой находится массив на котором произошла потеря данных.
Добрый день! Понял, спасибо. Обсуждаем с руководством, если дадут согласие, то привезем.
Принято. Ожидаем.