Программа для диагностики жёстких дисков R.tester

Бесплатная программа для восстановления файлов R.saver

Неофициальный блог R.LAB, заходите!

Восстановление данных
восстановление данных
Звоните нам в Москве: +7(495) 230−1000
16.06.2019, 16:40:53 *
Добро Пожаловать, гость. Пожалуйста войдите или зарегистрируйтесь, если хотите стать полноправным участником форума. Не получили активационное письмо?

Страницы: [1]
  Печать  
автор Тема: Интерпретация результатов б/у SAS дисков  (прочитано 2748 раз)
freebird
Newbie
*

Репутация: 0
сообщений: 10


просмотр профиля
« было: 17.07.2017, 01:04:58 »

Добрый день,
Прошу помощи с оценкой б/у SAS дисков при помощи R.tester

Началось всё с темы по интерпретации результатов HDDScan и Victoria и чтобы не повторяться дам ссылку на топик - http://rlab.ru/forum/topic,2090.0

Так как информации по этим дискам через стандартный SMART очень мало, решил воспользоваться программой R.tester. Видно что программа может очень много, но страшно запускать то, что не понимаешь. Скажу сразу, что на дисках пока нет информации, поэтому могу запускать и те тесты, которые могут разрушать данные (если такие будут необходимы)

Выкладываю SMART, который получил при помощи R.tester и дампы.
Буду очень благодарен, если поможете в интерпретации.

линк на скачивание дампов (диска 2, дампа 4, потому что сделаны из разных мест программы, не знаю сильно ли  они отличаются):
https://app.box.com/s/w0quukpph8ha1syu4u3kz68b0aq4nsi9

Поправьте если не прав. Диски явно были откуда-то переставлены, не стояли они вместе в RAID. Разное количество циклов. Разное количество записаных данных. Но важно не это. Мне нужно понять можно ли эти диски использовать или они скоро посыпятся? Стоит ли их объединять в MIRROR или "не да бог" Smiley в STRIPE. Или лучше по отдельности. Или в ведро?
0   G-LIST - это видимо хорошо. С ошибками записи мне менее понятно.

================================
; Model:   WD WD6001BKHG-50D22
; Serial:   WXU1E83NFCK9
; Firmware:   SFX9
;
   0   G-LIST   Number of reallocated sectors (pCHS)  ** GROWN **      
   1930   P-LIST   Number of Primary defects (pCHS)  ** FACTORY **      
   00-00   PFA   Status: ** GOOD **      
   35'C   T   Current Temperature      
   35'C   T   Current Temperature      
   69'C   T   Reference Temperature      
   213   CSS   Accumulated Start/Stop Cycles      
   453127   WRITE   Error Corrected Without Substantial Delay      
   842   WRITE   Error Corrected With Possible Delays      
   844   WRITE   Total Error Corrected With Retries      
   453969   WRITE   Total Error Corrected      
   842   WRITE   Total Times Correction Algorithm Processed      
   24373917970432   WRITE   Total Bytes Processed ( 22.17 Tb )      
   0   WRITE   Total Uncorrected Errors      
   14695   READ   Error Corrected Without Substantial Delay      
   26   READ   Error Corrected With Possible Delays      
   57   READ   Total Error Corrected With Retries      
   14721   READ   Total Error Corrected      
   26   READ   Total Times Correction Algorithm Processed      
   7845358983168   READ   Total Bytes Processed ( 7.14 Tb )      
   0   READ   Total Uncorrected Errors      
   0   VERIFY   Error Corrected Without Substantial Delay      
   0   VERIFY   Error Corrected With Possible Delays      
   0   VERIFY   Total Error Corrected With Retries      
   0   VERIFY   Total Error Corrected      
   0   VERIFY   Total Times Correction Algorithm Processed      
   0   VERIFY   Total Bytes Processed      
   0   VERIFY   Total Uncorrected Errors      
   287616   -   Recoverable Non-Medium Error Events      


===========
; Model:   SEAGATE ST600MM0006
; Serial:   S0M1C2LJ
; Firmware:   6102
;
   0   G-LIST   Number of reallocated sectors (pCHS)  ** GROWN **      
   1408   P-LIST   Number of Primary defects (pCHS)  ** FACTORY **      
   00-00   PFA   Status: ** GOOD **      
   35'C   T   Current Temperature      
   68'C   T   Reference Temperature      
   225d 17h   POH   Power-On Time (325042 minutes)      
   35'C   T   Current Temperature      
   68'C   T   Reference Temperature      
   702   CSS   Accumulated Start/Stop Cycles      
   0   WRITE   Error Corrected With Possible Delays      
   0   WRITE   Total Error Corrected With Retries      
   0   WRITE   Total Error Corrected      
   0   WRITE   Total Times Correction Algorithm Processed      
   3308097849856   WRITE   Total Bytes Processed ( 3.01 Tb )      
   0   WRITE   Total Uncorrected Errors      
   2079063422   READ   Error Corrected Without Substantial Delay      
   0   READ   Error Corrected With Possible Delays      
   0   READ   Total Error Corrected With Retries      
   2079063422   READ   Total Error Corrected      
   0   READ   Total Times Correction Algorithm Processed      
   2018569198080   READ   Total Bytes Processed ( 1.84 Tb )      
   0   READ   Total Uncorrected Errors      
   0   VERIFY   Error Corrected Without Substantial Delay      
   0   VERIFY   Error Corrected With Possible Delays      
   0   VERIFY   Total Error Corrected With Retries      
   0   VERIFY   Total Error Corrected      
   0   VERIFY   Total Times Correction Algorithm Processed      
   0   VERIFY   Total Bytes Processed      
   0   VERIFY   Total Uncorrected Errors      
   2228   -   Recoverable Non-Medium Error Events    
« Последняя правка: 17.07.2017, 01:33:29 от freebird » Авторизирован
OLiMP
Global Moderator
Hero Member
*

Репутация: 143
сообщений: 2525

HDD Research Group member


просмотр профиля WWW
« Ответить #1 было: 17.07.2017, 07:59:20 »

Судя по полученным дампам с дисками всё в порядке. SAS диски нужно прогнать обычным скриптом чтения в CERT Tool - он идёт в комплекте. И по графику уже всё будет видно.
..\CERT\DefectScan\READ_ScanOnly_Block(4096)_MaxErr(128K)_Timeout(100ms_50ms).cert
Авторизирован
mike.m
Moderator
Newbie
*

Репутация: 0
сообщений: 3


просмотр профиля
« Ответить #2 было: 17.07.2017, 11:01:26 »

freebird

В текущем архиве есть примеры тестовых скриптов.

Запустите две копии R.tester, выберите в каждой по одному из ваших дисков, далее Toolbox -> CERT Tool

Т.к. дефектов на диске нет - выберите базовый скрипт ("Load script"):
\CERT\READ Bench-and-Scan\READ_BenchAndScan_Any(HDD-only)_Block(4096)_MaxErr(4K)_Timeout(200ms_100ms).cert

Ну и СТАРТ Smiley
После прохождения тестов - можно сохранить текстовый отчёт (Save report) и накопленные тестовые данные (Save all data).

Если вам интересна моя интерпретация результатов - скриншоты не нужны: просто заархивируйте файл с данными теста (*.dat) и пришлите ссылку.

P.S. В ближайшие несколько дней мы обновим архив на сайте - кроме массы полезных и дружественных изменений, новая версия позволит вам редактировать скрипты и/или формировать тесты на своё усмотрение.

С уважением,
Михаил Маврицин
Авторизирован

С уважением,
Михаил Маврицин
freebird
Newbie
*

Репутация: 0
сообщений: 10


просмотр профиля
« Ответить #3 было: 17.07.2017, 11:43:18 »

Спасибо большое. Запускаю тесты. Выложу ссылку на результаты после тестов.
Авторизирован
freebird
Newbie
*

Репутация: 0
сообщений: 10


просмотр профиля
« Ответить #4 было: 17.07.2017, 14:36:03 »

Выкладываю результаты прогона CERT Tool
папка в которой результаты по отдельности:
https://app.box.com/s/uxgeryiysgqk9ywip82yvqilbyxix6l6

и ссылка на архив с двумя .dat файлами:
https://app.box.com/s/rwyrdt3fdvac8b2ung3ok7iytrgor96e
Заранее большое спасибо за Вашу оценку и интерперетацию
« Последняя правка: 17.07.2017, 17:39:15 от freebird » Авторизирован
freebird
Newbie
*

Репутация: 0
сообщений: 10


просмотр профиля
« Ответить #5 было: 18.07.2017, 22:26:43 »

Если у вас есть возможность ответить - буду рад. Мне по прежнему интересно ваше мнение по поводу дисков. Что показали дополнительные тесты R.tester?
Авторизирован
mike.m
Moderator
Newbie
*

Репутация: 0
сообщений: 3


просмотр профиля
« Ответить #6 было: 19.07.2017, 00:35:48 »

Графики посмотрел.

Основной вопрос - что такое SAS от Intel?
Я материнки с таким чипсетом (8086:1D68 = C600/X79) лично не встречал и даже не имею представления, что это за SAS такой.
Если честно - это либо фейковый SAS, либо он как-то эмулируется в чипсете, либо что-то третье.

По графикам могу сказать, что контроллер и/или драйвер либо очень похабные (50:50, ничего личного!!), либо вмешиваются  (тем или иным образом) постоянно даже в при прямой подаче SCSI-команд.
Замечу, что т.к. контроллер якобы RAID (софтовый, конечно же), то высоковероятно, что там все описанные проблемы присутствуют разом вместе.
При случае - обязательно найду такую m/b и посмотрю, как оно работает повнимательнее.

В целом:
- график Seek Accordion на Seagate = не идеален: распределение времени доступа по поверхности относительно-стабильное, но очень много вылетов (точки со временем доступа больше среднего на каждом участке).
** для Seagate SAS 10K/15K такое очень не типично.

- графики линейного чтения на обоих дисках = весьма не идеальны, НО в связи с неизвестным мне SAS-контроллером не могу поручиться, что виноваты только диски.

- явных ошибок во время тестов не было вообще = значит, ни реаллокейтов, ни дефектов нет.

В общем и целом, при работе с SAS накопителями я очень настоятельно рекомендую использовать исключительно контроллеры на чипах LSI. За всю мою практику (17+ лет) лучше и стабильнее SAS HBA я не встречал.
** Исключение - LSI 3G SAS, первое поколение. Там были некоторые некритичные баги при работе с SATA.


Ваш диск WDC 0x127 "Sirius 3D":






Заведомо хороший сэмпл (тот же размер и семейство):






Вполне очевидно, что "что-то идёт не так" - либо с дисками, либо (и/или) из-за особенностей контроллера.

P.S. Контроллер Intel и его странности мне интересны. Спасибо, добавил в список TO DO для изучения.
« Последняя правка: 21.07.2017, 09:21:21 от Dmitri » Авторизирован

С уважением,
Михаил Маврицин
freebird
Newbie
*

Репутация: 0
сообщений: 10


просмотр профиля
« Ответить #7 было: 19.07.2017, 12:34:13 »

Михаил, спасибо за ответ.
Честно говоря, проверять виноват ли SAS контроллер покупкой нового SAS диска как-то не хочется. Другого SAS контроллера у меня нет, так что диски отдельно от контроллера проверить я тоже не могу.

Пока для себя решил, что не буду использовать RAID возможности этого контроллера и подключу имеющиеся диски в режиме NON-RAID. Я понимаю, диски по прежнему останутся подключены к тому же контроллеру, но хотя бы не будут использоваться в заведомо более "сложных" режимах типа STRIPE или MIRROR.

Подскажите пожалуйста, какие есть возможности следить состоянием здоровья дисков в моей ситуации? Стандартный смарт ничего не показывает. Достаточно ли периодически запускать SMART от R.tester и смотреть на PFAStatus и G-LIST?

Нужно ли учитывать изменяющиеся показания ошибок? Вроде: "Error Corrected Without Substantial Delay" и "Recoverable Non-Medium Error Events" ?
Какой тест вы бы рекомендовали периодически запускать для оценки состояния дисков?

Кстати, если вам интересно, то вот ссылка на Data Sheet материнской платы от моей рабочей станции FUJITSU CELSIUS R920
https://sp.ts.fujitsu.com/dmsp/Publications/public/ds-CELSIUS-R920.pdf
(SAS Controller type optional upgrade to 8 ports, Intel C606)
С этим контроллером точно что-то не то, потому как новенький SATA SSD Kingston подключенный через этот контроллер выдаёт кучу "оранжевых", чего не наблюдается при подключении к SATA контроллеру. Этот SAS контроллер явно вносит свои задержки. Никаких настроек у него нет, кроме того случая, когда выбираешь страйп, там можно задать размер буфера. Рабочая станция изначально сконфигурирована именно на страйп, для более высоких скоростных показателей, возможно это оптимальный режим для данного контроллера.



« Последняя правка: 19.07.2017, 14:35:28 от freebird » Авторизирован
Страницы: [1]
  Печать  
 
Перейти в раздел:  

Яндекс.Метрика
Восстановление данных - R.LAB
Москва, Коровий Вал, д. 1А  (схема проезда). Телефон: +7 (495) 230−1000; e-mail: 
Другие города »