Программа для диагностики жёстких дисков R.tester

Бесплатная программа для восстановления файлов R.saver

Неофициальный блог R.LAB, заходите!

Восстановление данных
восстановление данных
Звоните нам в Москве: +7(495) 230−1000
22.01.2021, 08:30:54 *
Добро Пожаловать, гость. Пожалуйста войдите или зарегистрируйтесь, если хотите стать полноправным участником форума. Не получили активационное письмо?

Страницы: [1]
  Печать  
автор Тема: сбой диска на массиве RAID5 (Adaptec ASR-5805)  (прочитано 9749 раз)
smol74
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« было: 23.05.2011, 18:01:07 »

Всем доброе время суток!
Помогите пожалуйста решить проблему. В рабочей станции (Win7 x64 ultimate) имею массив RAID5 на контроллере Adaptec ASR-5805 и дисках 2.0Tb SATA-II Seagate Barracuda LP <ST32000542AS> 5900rpm 32Mb (firmaware CC34) 8шт. ОС установлена вне массива на отдельном диске. Основные настройки контроллера - по умолчанию. Кроме того установлен background consistency check period - 1 month. Вся эта система устанавливалась всего 3 месяца назад.

03/04/2011 примерно в 5:00 контроллер стал подавать сигнал о неисправности, но в такое время суток я решил просто выключить комп и начать разбираться с проблемой утром. Днем  03/04/2011 примерно в 12:00 запустил комп, контроллер в процессе загрузки BIOS снова начал сигналить с сообщением о деградации массива. Я никак не прореагировал на сообщение с помощью клавиатуры, и контроллер через 30сек (по-моему такой интервал стоял по умолчанию) разрешил продолжить загрузку компа. После запуска ОС и затем ASM я обнаружил что контроллер в состоянии degraded выполняет rebuilding диска (conn.1, dev.0). После примерно 8 часов процедура была завершена, диск и массив получили статус optimal. Ну вроде все ОК, подумал я, хотя и интуиция мне подсказывала, что все равно что-то не так.
Увы, мои опасения оправдались. Примерно в полночь на 04/04/2011 сигнал о неисправности возобновился, я временно включил silence и вот что я обнаружил, открыв ASM. Массив в статусе degraded, но тот же самый диск имеет статус optimal, при этом и массив и диск помечены восклицательным знаком. Судя по журналу именно в момент подачи звукового сигнала появилось сообщение об обнаружении SMART (в первом скриншоте это зафиксировано), но смысл данного сообщения мне не понятен. Подскажите пожалуйста в чем может быть проблема и как ее предположительно решать? На мой взгляд необходимые скриншоты прилагаю.











Мне посоветовали поменять диск, т.к. смарт алерт - это предупреждение о выходе какого-то из параметров диска из рабочего диапазона, т.е. фактически предсказание надвигающейся неисправности. По рекомендации специалистов я выключил комп, отключил питание с дисков в массиве, а также вынул контроллер из слота. Дефектный диск (CN1 device 0) сдал в сервис, вроде признали его бракованным, но проблема теперь в другом. Купил абсолютно идентичную модель диска на замену, вставил, все подключил, запустил. В итоге в контроллер сообщил мне что массив FAILED Sad
в ASM я увидел, что не только CN1 device 0 имеет статус READY (тот который изначально был с ошибками smart), но и вдруг откуда ни возьмись, еще и CN0 device 0 имеет статус READY. Единственное что я сделал, это пометил CN1 device 0 как HOT SPARE. На всякий случай выключил комп, проверил все коннекторы дисков, включил комп. Статус массива по-прежнему FAILED, но CN0 device 0 теперь имеет статус OPTIMAL, т.е. как неожиданно стал READY, также внезапно вернулся в положение OPTIMAL :?  Что это может быть? Глюк? Посоветуйте пжл что делать в этой ситуации?
Картинку текущего состояния прикладываю:


Сначала эту тему несколько подробнее я обсуждал на форуме Тринити, но в итоге они посоветовали обратиться к вам, как к более продвинутым специалистам в области восстановления данных.
Заранее благодарен за любую помощь! Она очень мне нужна.

P.S. Указанные диски есть в HCL таблице совместимости данного контроллера, и именно той же ревизии CC34.
« Последняя правка: 23.05.2011, 18:35:14 от smol74 » Авторизирован
Fader
RAID EXPERT
Global Moderator
Hero Member
*

Репутация: 30
сообщений: 1102



просмотр профиля
« Ответить #1 было: 23.05.2011, 20:57:03 »

Добрый день, я следил за этой темой на форуме Тринити, но не успел ответить. Я вам опишу свое видение проблемы либо сегодня попозже, либо завтра утром.
Если есть срочные вопросы, можете попробовать стукнуть в аську.
Авторизирован

RAID RECOVERY EXPERT
smol74
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« Ответить #2 было: 23.05.2011, 21:48:26 »

Добрый день, я следил за этой темой на форуме Тринити, но не успел ответить. Я вам опишу свое видение проблемы либо сегодня попозже, либо завтра утром.
Если есть срочные вопросы, можете попробовать стукнуть в аську.

Спасибо, буду ждать вашего ответа. Срочности нет, комп домашний, но некоторая информация массива безусловно дорога. Поэтому для меня важнее не сделать ничего лишнего, в смысле хуже, хочется двигаться в правильном направлении.
Авторизирован
Fader
RAID EXPERT
Global Moderator
Hero Member
*

Репутация: 30
сообщений: 1102



просмотр профиля
« Ответить #3 было: 24.05.2011, 15:46:45 »

Итак, ознакомился с темой.
Проблема на винте возникла, скорее всего из-за появления дефектов, вот контроллер и ругался на СМАРТ диска и отключил его. Не исключено, что проблемы со вторым диском были из-за того, что у вас либо проблемы с бэкплэйном либо со шлейфами. Вы не пробовали отключить диск и продиагностировать его на другом компьютере ?   К примеру, это можно сделать программой HDDScan, найти её можно у нас в разделе программы.
Что касается восстановления данных, то в данном случае вам может помочь RAID Reconstructor, если вы хотите самостоятельно это попытаться поднять, либо если нет желания самостоятельно возиться- можете привезти его к нам.
Что касается реконструктора, то им вы можете определить размер блока, если вы его не помните и порядок дисков, что является очень важной информацией для восстановления данных.  И после того, как порядок будет найден, массив можно будет собрать практически любой софтиной. Мы пользуемся для этого UFS Explorer-ом.  Будут вопросы - обязательно задавайте, все растолкую.
Авторизирован

RAID RECOVERY EXPERT
smol74
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« Ответить #4 было: 24.05.2011, 17:29:37 »

Итак, ознакомился с темой.
Проблема на винте возникла, скорее всего из-за появления дефектов, вот контроллер и ругался на СМАРТ диска и отключил его. Не исключено, что проблемы со вторым диском были из-за того, что у вас либо проблемы с бэкплэйном либо со шлейфами. Вы не пробовали отключить диск и продиагностировать его на другом компьютере ?   К примеру, это можно сделать программой HDDScan, найти её можно у нас в разделе программы.

Да, я теперь тоже думаю, что проблема со вторым диском возникла из-за плохого соединения. Тем более, как я уже рассказывал в теме (хотя наверно не очень подробно), проблема со вторым диском CN0 device 0 возникла как раз при первом запуске вновь вставленного в PCI-E слот контроллера с подключенным питанием ко всем дискам массива, в т.ч. к замененному на новый CN1 device 0. Бэкплэйна у меня нет, только обычные две штатные "холодные" (в смысле НЕ с горячей заменой) корзины по 4 в диска каждой, и соединяются диски с контроллером фирменными полуметровыми кабелями mSASx4 (SFF-8087) to SATA (4)x1 with sideband (SFF-8448) (номер продукта 2247000-R), прилагавшимися к купленному контроллеру в RTL-варианте.



И главное, именно пытаясь избежать проблем с кабелями в будущем, я специально приобретал контроллер в ритэйл варианте с родными кабелями. И опят же, на всякий случай, вынимая первый раз контроллер из слота и снимая питание с дисков, я предусмотрительно оставил диски с подключенными к ним коннекторами от контроллера, а отсоединил лишь только тот диск, который нужно было заменить. Затем я аккуратно положил контроллер внутри системного блока, а на компе все это время работал уже без массива. Так вот после первого запуска вновь подключенного контроллера и всех дисков и возникшей второй проблемой я отключил питание компа и проверил (вынул-вставил) все коннекторы дисков и уже после повторного перезапуска проблема со вторым диском CN0 device 0 вроде бы исчезла - он снова перешел из состояния READY в OPTIMAL. Значит ли это, что во второй проблеме и правда скорее всего поучаствовал кабель/плохое соединение коннектора? Тем более учитывая то, что мне приходилось забираться во внутренности компа, отключать/подключать - может и правда мог случайно задеть тот самый коннектор второго диска? Правильно ли я понимаю, что контроллер, несмотря на вроде как решенную вторую проблему, запомнил свое предыдущее состояние FAILED и теоритически его можно вывести из этого состояния уже только вручную, применив FORCE ONLINE? Тогда по идее он должен будет стать DEGRADED и начать reduild с учетом того первого замененного диска, который я обозначил как HOT SPARE? Или это все-таки слишком опасно запускать FORCE ONLINE?
Авторизирован
smol74
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« Ответить #5 было: 24.05.2011, 17:33:56 »

Что касается восстановления данных, то в данном случае вам может помочь RAID Reconstructor, если вы хотите самостоятельно это попытаться поднять, либо если нет желания самостоятельно возиться- можете привезти его к нам.
Что касается реконструктора, то им вы можете определить размер блока, если вы его не помните и порядок дисков, что является очень важной информацией для восстановления данных.  И после того, как порядок будет найден, массив можно будет собрать практически любой софтиной. Мы пользуемся для этого UFS Explorer-ом.  Будут вопросы - обязательно задавайте, все растолкую.

Или мне уже в любом случае предстоит кропотливая работа над восстановлением данных? Sad Я бы конечно с огромным удовольствием доверил эту процедуру вам специалистам, но к моему большому сожалению я живу далековато от Москвы - в Калининграде.
Авторизирован
Fader
RAID EXPERT
Global Moderator
Hero Member
*

Репутация: 30
сообщений: 1102



просмотр профиля
« Ответить #6 было: 24.05.2011, 19:44:42 »

Попробовать принудительно вывести его в онлайн можно, но я бы это белел без одного диска и не запускав ребилд. После того, как будут видны данные, их лучше слить, а массив создать заново. Если это не поможет, то прийдется немного попотеть и получая консультации от нас восстановить самостоятельно  или же дать удаленный доступ к машине и мы восстановим его удаленно.
Авторизирован

RAID RECOVERY EXPERT
Страницы: [1]
  Печать  
 
Перейти в раздел:  

Яндекс.Метрика
Восстановление данных - R.LAB
Москва, Коровий Вал, д. 1А  (схема проезда). Телефон: +7 (495) 230−1000; e-mail: 
Другие города »