Программа для диагностики жёстких дисков R.tester

Бесплатная программа для восстановления файлов R.saver

Неофициальный блог R.LAB, заходите!

Восстановление данных
восстановление данных
Звоните нам в Москве: +7(495) 230−1000
12.08.2020, 03:21:14 *
Добро Пожаловать, гость. Пожалуйста войдите или зарегистрируйтесь, если хотите стать полноправным участником форума. Не получили активационное письмо?

Страницы: [1]
  Печать  
автор Тема: Windows 2008 Server - BSOD. LSI 3041X-R.  (прочитано 1871 раз)
AnteC
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« было: 21.03.2016, 12:01:37 »

Здравствуйте!
Имеется DEPO сервер с контроллером LSI 3041X-R (на нем 2 Raid-1 массива, на одном из которых стоит ОС, на другом данные)
Недавно сервер начал самопроизвольно перезагружаться - причем дампы не сохраняются, в логах ничего нет только Предыдущее завершение работы системы в - было неожиданным.
Проверял температуру - заметил повышенную (70 С) одной планки памяти - которая находится прямо над северным мостом - заменил на всех радиаторах термопасту + поставил доп вентилятор на мост, проверил БП - все напряжения в норме, конденсаторы не вздутые, но перезагрузки продолжились.
Заметил что массив с ОС перешел в состояние Rebuild, поэтому проверил диски этого массива викторией 1й 1Tb WD RED (насколько я понимаю с TLER) на который идет rebuild - проверял 2 раза - ошибок нет, смарт чистый, 2й диск WD4001ABYS (который RE с TLER) с которого идет ребилд при просмотре смарт - показал 1 кандидата в bad (current pending sector - 1) и при проверке викторией 1 сектор был успешно заремаплен, других видимых ошибок не было - только 5 секторов со временем 200ms). Удивительно, но после этого в смарте этот ребилд никак не отразился - reallocated sector count = 0, Reallocated Event Count = 0, current pending sector стал тоже 0), но 2й раз проверить диск не успел - сервер очень боевой, и постоянно нужен в работе. Попытался клонировать посекторно со 2го диска на 1й, и загрузиться только с 1го, но контроллер определил состояние массива как fail. Еще просматривая advanced options в bios контроллера увидел, что Report Device Missing Delay = 0 и IO Device Missing Delay = 0. Установил их в значение 10 сек. Вернул 1й и 2й диски на место, сейчас идет ребилд. Но с 26.03 по сегодня ребилд в прошел только на 36%.
Вопросы 1. Нормально ли то, что смарт WD RE после ремапа не показывает этих событий?
2. Столь долгий ребилд для Raid-1 это нормально?
3. Может быть есть какие-нибудь мысли в чем может быть проблема - может дохнет контроллер, может проблемы по питанию и т.п.?
Авторизирован
OLiMP
Global Moderator
Hero Member
*

Репутация: 143
сообщений: 2586

HDD Research Group member


просмотр профиля WWW
« Ответить #1 было: 21.03.2016, 12:41:15 »

1. Remap в программе Виктория это запись блока 256 секторов, чтение записанных 256 секторов, если после записи битые сектора не прочитались то диск самостоятельно производит функцию переназначения сектора. Если сектор после записи начал читать то никакого переназначения сектора не происходит и в смарте отображаться нечему.

2. Сегодня 21.03.16, как ребилд мог идти с 26.03 мне не понятно. Ребилд массива может длиться более суток.

3. В чём может быть проблема можно только гадать. Если есть подозрение на проблемы с железом то отвозите его в гарантию, пусть тестируют. Мы диагностикой и ремонтом железа не занимаемся.
« Последняя правка: 21.03.2016, 15:08:53 от OLiMP » Авторизирован
AnteC
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« Ответить #2 было: 21.03.2016, 13:00:15 »

Да ошибся, конечно - ребилд идет с 19.03.
Гарантии естественно давно нет - сервер 2007г, однако похожая ситуация была изначально с первыми дисками установленными в сервер изначально (но в том случае были BSOD'ы указывающие на hdd, при этом тест в виктории дефектов в хдд не выявлял), после замены дисков по гарантии на WD RE, BSODы перестали возникать. Надеюсь все же это проблема в хдд и опции Report Device Missing Delay и IO Device Missing Delay нивелируют ее. (после ребилда естественно заменю WD RE). Но очень напрягает ребилд тянущийся уже 2е суток.
Авторизирован
OLiMP
Global Moderator
Hero Member
*

Репутация: 143
сообщений: 2586

HDD Research Group member


просмотр профиля WWW
« Ответить #3 было: 21.03.2016, 13:28:39 »

Да уж, если ребилд идёт больше двух суток то это очень долго, вероятно есть какие то проблемы, и возможно с дисками. Я бы для начала сделал бэкап важной информации и уже потом искал причину. И начал бы с замены дисков в массиве.
Авторизирован
AnteC
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« Ответить #4 было: 21.03.2016, 13:48:22 »

Бэкапы конечно есть.
В том то и непонятность, что виктория и смарт вроде бы говорят о исправности hdd. Поэтому и смотрю в сторону контроллера (фирмваре последний). Не хочется покупать диски на 100% не уверенным в том, что причина в них.
Авторизирован
AnteC
Newbie
*

Репутация: 0
сообщений: 4


просмотр профиля
« Ответить #5 было: 21.03.2016, 14:08:28 »

Нашел у WD интересное обновление firmware, подходящее к моему диску - http://support.wdc.com/downloads.aspx?p=57&lang=ru
только не знаю насколько это мой случай - т.к. пока не могу посмотреть версию прошивки

Модель не та. к WD4001ABYS прошивка не подходит.
« Последняя правка: 21.03.2016, 15:02:35 от AnteC » Авторизирован
OLiMP
Global Moderator
Hero Member
*

Репутация: 143
сообщений: 2586

HDD Research Group member


просмотр профиля WWW
« Ответить #6 было: 21.03.2016, 15:11:32 »

Не думаю что замена прошивки решит проблему. Ранее проблем с этой прошивкой не наблюдалось. Либо сами диски дурят, либо кабеля интерфейса, либо источник питания, либо перегрев.
« Последняя правка: 21.03.2016, 15:13:15 от OLiMP » Авторизирован
Страницы: [1]
  Печать  
 
Перейти в раздел:  

Яндекс.Метрика
Восстановление данных - R.LAB
Москва, Коровий Вал, д. 1А  (схема проезда). Телефон: +7 (495) 230−1000; e-mail: 
Другие города »