Восстановление данных Москва С.-Петербург Новосибирск Другие города » Все города »
Звоните нам в Москве:  +7 495 230−1000

сбой диска на массиве RAID5 (Adaptec ASR-5805)

сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: smol74 23 мая 2011 г. 19:01

Всем доброе время суток!
Помогите пожалуйста решить проблему. В рабочей станции (Win7 x64 ultimate) имею массив RAID5 на контроллере Adaptec ASR-5805 и дисках 2.0Tb SATA-II Seagate Barracuda LP <ST32000542AS> 5900rpm 32Mb (firmaware CC34) 8шт. ОС установлена вне массива на отдельном диске. Основные настройки контроллера - по умолчанию. Кроме того установлен background consistency check period - 1 month. Вся эта система устанавливалась всего 3 месяца назад.

03/04/2011 примерно в 5:00 контроллер стал подавать сигнал о неисправности, но в такое время суток я решил просто выключить комп и начать разбираться с проблемой утром. Днем  03/04/2011 примерно в 12:00 запустил комп, контроллер в процессе загрузки BIOS снова начал сигналить с сообщением о деградации массива. Я никак не прореагировал на сообщение с помощью клавиатуры, и контроллер через 30сек (по-моему такой интервал стоял по умолчанию) разрешил продолжить загрузку компа. После запуска ОС и затем ASM я обнаружил что контроллер в состоянии degraded выполняет rebuilding диска (conn.1, dev.0). После примерно 8 часов процедура была завершена, диск и массив получили статус optimal. Ну вроде все ОК, подумал я, хотя и интуиция мне подсказывала, что все равно что-то не так.
Увы, мои опасения оправдались. Примерно в полночь на 04/04/2011 сигнал о неисправности возобновился, я временно включил silence и вот что я обнаружил, открыв ASM. Массив в статусе degraded, но тот же самый диск имеет статус optimal, при этом и массив и диск помечены восклицательным знаком. Судя по журналу именно в момент подачи звукового сигнала появилось сообщение об обнаружении SMART (в первом скриншоте это зафиксировано), но смысл данного сообщения мне не понятен. Подскажите пожалуйста в чем может быть проблема и как ее предположительно решать? На мой взгляд необходимые скриншоты прилагаю.

[url=http://radikal.ru/F/i037.radikal.ru/1104/93/bdcde5a124c1.jpg.html]
[url=http://radikal.ru/F/i018.radikal.ru/1104/c5/2bff8a065a3b.jpg.html]
[url=http://radikal.ru/F/s60.radikal.ru/i170/1104/95/f7aa7f6c5bb5.jpg.html]
[url=http://radikal.ru/F/s003.radikal.ru/i204/1104/09/bdb93c21a8fa.jpg.html]
[url=http://radikal.ru/F/s55.radikal.ru/i149/1104/9f/2267ebf8c45c.jpg.html]
Мне посоветовали поменять диск, т.к. смарт алерт - это предупреждение о выходе какого-то из параметров диска из рабочего диапазона, т.е. фактически предсказание надвигающейся неисправности. По [url=http://3nity.ru/viewtopic.php?f=6&t=15866&start=0]рекомендации специалистов[/url] я выключил комп, отключил питание с дисков в массиве, а также вынул контроллер из слота. Дефектный диск (CN1 device 0) сдал в сервис, вроде признали его бракованным, но проблема теперь в другом. Купил абсолютно идентичную модель диска на замену, вставил, все подключил, запустил. В итоге в контроллер сообщил мне что массив FAILED :(
в ASM я увидел, что не только CN1 device 0 имеет статус READY (тот который изначально был с ошибками smart), но и вдруг откуда ни возьмись, еще и CN0 device 0 имеет статус READY. Единственное что я сделал, это пометил CN1 device 0 как HOT SPARE. На всякий случай выключил комп, проверил все коннекторы дисков, включил комп. Статус массива по-прежнему FAILED, но CN0 device 0 теперь имеет статус OPTIMAL, т.е. как неожиданно стал READY, также внезапно вернулся в положение OPTIMAL :?  Что это может быть? Глюк? Посоветуйте пжл что делать в этой ситуации?
Картинку текущего состояния прикладываю:
[url=http://radikal.ru/F/s007.radikal.ru/i301/1105/30/9879baa867d7.jpg.html]
Сначала [url=http://3nity.ru/viewtopic.php?f=6&t=15866&start=0]эту тему[/url] несколько подробнее я обсуждал на форуме [url=http://3nity.ru/viewtopic.php?f=6&t=15866&start=0]Тринити[/url], но в итоге они посоветовали обратиться к вам, как к более продвинутым специалистам в области восстановления данных.
Заранее благодарен за любую помощь! Она очень мне нужна.

P.S. Указанные диски есть в [url=http://download.adaptec.com/pdfs/compatibility_report/arc-sas_cr_01-17-11_series5_lowport.pdf] HCL таблице совместимости[/url] данного контроллера, и именно той же ревизии CC34.

Re: сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: Fader 23 мая 2011 г. 21:57

Добрый день, я следил за этой темой на форуме Тринити, но не успел ответить. Я вам опишу свое видение проблемы либо сегодня попозже, либо завтра утром.
Если есть срочные вопросы, можете попробовать стукнуть в аську.

Re: сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: smol74 23 мая 2011 г. 22:48

[quote author=Fader link=topic=1004.msg5142#msg5142 date=1306169823]
Добрый день, я следил за этой темой на форуме Тринити, но не успел ответить. Я вам опишу свое видение проблемы либо сегодня попозже, либо завтра утром.
Если есть срочные вопросы, можете попробовать стукнуть в аську.
[/quote]

Спасибо, буду ждать вашего ответа. Срочности нет, комп домашний, но некоторая информация массива безусловно дорога. Поэтому для меня важнее не сделать ничего лишнего, в смысле хуже, хочется двигаться в правильном направлении.

Re: сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: Fader 24 мая 2011 г. 16:46

Итак, ознакомился с темой.
Проблема на винте возникла, скорее всего из-за появления дефектов, вот контроллер и ругался на СМАРТ диска и отключил его. Не исключено, что проблемы со вторым диском были из-за того, что у вас либо проблемы с бэкплэйном либо со шлейфами. Вы не пробовали отключить диск и продиагностировать его на другом компьютере ?  К примеру, это можно сделать программой HDDScan, найти её можно у нас в разделе программы.
Что касается восстановления данных, то в данном случае вам может помочь RAID Reconstructor, если вы хотите самостоятельно это попытаться поднять, либо если нет желания самостоятельно возиться- можете привезти его к нам.
Что касается реконструктора, то им вы можете определить размер блока, если вы его не помните и порядок дисков, что является очень важной информацией для восстановления данных.  И после того, как порядок будет найден, массив можно будет собрать практически любой софтиной. Мы пользуемся для этого UFS Explorer-ом.  Будут вопросы - обязательно задавайте, все растолкую.

Re: сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: smol74 24 мая 2011 г. 18:29

[quote author=Fader link=topic=1004.msg5144#msg5144 date=1306237605]
Итак, ознакомился с темой.
Проблема на винте возникла, скорее всего из-за появления дефектов, вот контроллер и ругался на СМАРТ диска и отключил его. Не исключено, что проблемы со вторым диском были из-за того, что у вас либо проблемы с бэкплэйном либо со шлейфами. Вы не пробовали отключить диск и продиагностировать его на другом компьютере ?   К примеру, это можно сделать программой HDDScan, найти её можно у нас в разделе программы.[/quote]

Да, я теперь тоже думаю, что проблема со вторым диском возникла из-за плохого соединения. Тем более, как я уже рассказывал в теме (хотя наверно не очень подробно), проблема со вторым диском CN0 device 0 возникла как раз при первом запуске вновь вставленного в PCI-E слот контроллера с подключенным питанием ко всем дискам массива, в т.ч. к замененному на новый CN1 device 0. Бэкплэйна у меня нет, только обычные две штатные "холодные" (в смысле НЕ с горячей заменой) корзины по 4 в диска каждой, и соединяются диски с контроллером фирменными полуметровыми кабелями [url=http://www.adaptec.com/ru-ru/products/cables/cables/sas?productId=SAS-5805&dn=Adaptec+RAID+5805]mSASx4 (SFF-8087) to SATA (4)x1 with sideband (SFF-8448)[/url] (номер продукта 2247000-R), прилагавшимися к купленному контроллеру в [url=http://www.adaptec.com/ru-ru/products/controllers/hardware/sas/performance/sas-5805/]RTL-варианте[/url].

[url=http://www.adaptec.com/ru-ru/products/cables/cables/sas?productId=SAS-5805&dn=Adaptec+RAID+5805]
И главное, именно пытаясь избежать проблем с кабелями в будущем, я специально приобретал контроллер в ритэйл варианте с родными кабелями. И опят же, на всякий случай, вынимая первый раз контроллер из слота и снимая питание с дисков, я предусмотрительно оставил диски с подключенными к ним коннекторами от контроллера, а отсоединил лишь только тот диск, который нужно было заменить. Затем я аккуратно положил контроллер внутри системного блока, а на компе все это время работал уже без массива. Так вот после первого запуска вновь подключенного контроллера и всех дисков и возникшей второй проблемой я отключил питание компа и проверил (вынул-вставил) все коннекторы дисков и уже после повторного перезапуска проблема со вторым диском CN0 device 0 вроде бы исчезла - он снова перешел из состояния READY в OPTIMAL. Значит ли это, что во второй проблеме и правда скорее всего поучаствовал кабель/плохое соединение коннектора? Тем более учитывая то, что мне приходилось забираться во внутренности компа, отключать/подключать - может и правда мог случайно задеть тот самый коннектор второго диска? Правильно ли я понимаю, что контроллер, несмотря на вроде как решенную вторую проблему, запомнил свое предыдущее состояние FAILED и теоритически его можно вывести из этого состояния уже только вручную, применив FORCE ONLINE? Тогда по идее он должен будет стать DEGRADED и начать reduild с учетом того первого замененного диска, который я обозначил как HOT SPARE? Или это все-таки слишком опасно запускать FORCE ONLINE?

Re: сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: smol74 24 мая 2011 г. 18:33

[quote author=Fader link=topic=1004.msg5144#msg5144 date=1306237605]
Что касается восстановления данных, то в данном случае вам может помочь RAID Reconstructor, если вы хотите самостоятельно это попытаться поднять, либо если нет желания самостоятельно возиться- можете привезти его к нам.
Что касается реконструктора, то им вы можете определить размер блока, если вы его не помните и порядок дисков, что является очень важной информацией для восстановления данных.  И после того, как порядок будет найден, массив можно будет собрать практически любой софтиной. Мы пользуемся для этого UFS Explorer-ом.  Будут вопросы - обязательно задавайте, все растолкую.
[/quote]

Или мне уже в любом случае предстоит кропотливая работа над восстановлением данных? :( Я бы конечно с огромным удовольствием доверил эту процедуру вам специалистам, но к моему большому сожалению я живу далековато от Москвы - в Калининграде.

Re: сбой диска на массиве RAID5 (Adaptec ASR-5805)  

  От: Fader 24 мая 2011 г. 20:44

Попробовать принудительно вывести его в онлайн можно, но я бы это белел без одного диска и не запускав ребилд. После того, как будут видны данные, их лучше слить, а массив создать заново. Если это не поможет, то прийдется немного попотеть и получая консультации от нас восстановить самостоятельно  или же дать удаленный доступ к машине и мы восстановим его удаленно.



Телефон: +7 495 230−1000

E-mail:
Telegram: Консультация у специалистов R.LAB через бота (@rlabsupportbot)
WhatsApp: Консультации по восстановлению данных (74952301000)

VK: Паблик компании
YouTube: Наш канал

Адрес: 119049, Москва, Коровий Вал, д. 1А, стр. 1 (здание универмага «Добрынинский»), 6 этаж, офис R.LAB

Полная контактная информация и приёмные часы »