сбой диска на массиве RAID5 (Adaptec ASR-5805) ¶
От: smol74 23 мая 2011 г. 19:01
Всем доброе время суток!
Помогите пожалуйста решить проблему. В рабочей станции (Win7 x64 ultimate) имею массив RAID5 на контроллере Adaptec ASR-5805 и дисках 2.0Tb SATA-II Seagate Barracuda LP <ST32000542AS> 5900rpm 32Mb (firmaware CC34) 8шт. ОС установлена вне массива на отдельном диске. Основные настройки контроллера - по умолчанию. Кроме того установлен background consistency check period - 1 month. Вся эта система устанавливалась всего 3 месяца назад.
03/04/2011 примерно в 5:00 контроллер стал подавать сигнал о неисправности, но в такое время суток я решил просто выключить комп и начать разбираться с проблемой утром. Днем 03/04/2011 примерно в 12:00 запустил комп, контроллер в процессе загрузки BIOS снова начал сигналить с сообщением о деградации массива. Я никак не прореагировал на сообщение с помощью клавиатуры, и контроллер через 30сек (по-моему такой интервал стоял по умолчанию) разрешил продолжить загрузку компа. После запуска ОС и затем ASM я обнаружил что контроллер в состоянии degraded выполняет rebuilding диска (conn.1, dev.0). После примерно 8 часов процедура была завершена, диск и массив получили статус optimal. Ну вроде все ОК, подумал я, хотя и интуиция мне подсказывала, что все равно что-то не так.
Увы, мои опасения оправдались. Примерно в полночь на 04/04/2011 сигнал о неисправности возобновился, я временно включил silence и вот что я обнаружил, открыв ASM. Массив в статусе degraded, но тот же самый диск имеет статус optimal, при этом и массив и диск помечены восклицательным знаком. Судя по журналу именно в момент подачи звукового сигнала появилось сообщение об обнаружении SMART (в первом скриншоте это зафиксировано), но смысл данного сообщения мне не понятен. Подскажите пожалуйста в чем может быть проблема и как ее предположительно решать? На мой взгляд необходимые скриншоты прилагаю.
[url=http://radikal.ru/F/i037.radikal.ru/1104/93/bdcde5a124c1.jpg.html]
[url=http://radikal.ru/F/i018.radikal.ru/1104/c5/2bff8a065a3b.jpg.html]
[url=http://radikal.ru/F/s60.radikal.ru/i170/1104/95/f7aa7f6c5bb5.jpg.html]
[url=http://radikal.ru/F/s003.radikal.ru/i204/1104/09/bdb93c21a8fa.jpg.html]
[url=http://radikal.ru/F/s55.radikal.ru/i149/1104/9f/2267ebf8c45c.jpg.html]
Мне посоветовали поменять диск, т.к. смарт алерт - это предупреждение о выходе какого-то из параметров диска из рабочего диапазона, т.е. фактически предсказание надвигающейся неисправности. По [url=http://3nity.ru/viewtopic.php?f=6&t=15866&start=0]рекомендации специалистов[/url] я выключил комп, отключил питание с дисков в массиве, а также вынул контроллер из слота. Дефектный диск (CN1 device 0) сдал в сервис, вроде признали его бракованным, но проблема теперь в другом. Купил абсолютно идентичную модель диска на замену, вставил, все подключил, запустил. В итоге в контроллер сообщил мне что массив FAILED :(
в ASM я увидел, что не только CN1 device 0 имеет статус READY (тот который изначально был с ошибками smart), но и вдруг откуда ни возьмись, еще и CN0 device 0 имеет статус READY. Единственное что я сделал, это пометил CN1 device 0 как HOT SPARE. На всякий случай выключил комп, проверил все коннекторы дисков, включил комп. Статус массива по-прежнему FAILED, но CN0 device 0 теперь имеет статус OPTIMAL, т.е. как неожиданно стал READY, также внезапно вернулся в положение OPTIMAL :? Что это может быть? Глюк? Посоветуйте пжл что делать в этой ситуации?
Картинку текущего состояния прикладываю:
[url=http://radikal.ru/F/s007.radikal.ru/i301/1105/30/9879baa867d7.jpg.html]
Сначала [url=http://3nity.ru/viewtopic.php?f=6&t=15866&start=0]эту тему[/url] несколько подробнее я обсуждал на форуме [url=http://3nity.ru/viewtopic.php?f=6&t=15866&start=0]Тринити[/url], но в итоге они посоветовали обратиться к вам, как к более продвинутым специалистам в области восстановления данных.
Заранее благодарен за любую помощь! Она очень мне нужна.
P.S. Указанные диски есть в [url=http://download.adaptec.com/pdfs/compatibility_report/arc-sas_cr_01-17-11_series5_lowport.pdf] HCL таблице совместимости[/url] данного контроллера, и именно той же ревизии CC34.