Восстановление данных Москва С.-Петербург Новосибирск Другие города » Все города »
Звоните нам в Москве:  +7 495 230−1000

Интерпретация результатов б/у SAS дисков

Интерпретация результатов б/у SAS дисков  

  От: freebird 17 июля 2017 г. 1:04

Добрый день,
Прошу помощи с оценкой б/у SAS дисков при помощи R.tester

Началось всё с темы по интерпретации результатов HDDScan и Victoria и чтобы не повторяться дам ссылку на топик - http://rlab.ru/forum/topic,2090.0

Так как информации по этим дискам через стандартный SMART очень мало, решил воспользоваться программой R.tester. Видно что программа может очень много, но страшно запускать то, что не понимаешь. Скажу сразу, что на дисках пока нет информации, поэтому могу запускать и те тесты, которые могут разрушать данные (если такие будут необходимы)

Выкладываю SMART, который получил при помощи R.tester и дампы.
Буду очень благодарен, если поможете в интерпретации.

линк на скачивание дампов (диска 2, дампа 4, потому что сделаны из разных мест программы, не знаю сильно ли  они отличаются):
[url=https://app.box.com/s/w0quukpph8ha1syu4u3kz68b0aq4nsi9]https://app.box.com/s/w0quukpph8ha1syu4u3kz68b0aq4nsi9[/url]

Поправьте если не прав. Диски явно были откуда-то переставлены, не стояли они вместе в RAID. Разное количество циклов. Разное количество записаных данных. Но важно не это. Мне нужно понять можно ли эти диски использовать или они скоро посыпятся? Стоит ли их объединять в MIRROR или "не да бог" :) в STRIPE. Или лучше по отдельности. Или в ведро?
0   G-LIST - это видимо хорошо. С ошибками записи мне менее понятно.

================================
; Model:   WD WD6001BKHG-50D22
; Serial:   WXU1E83NFCK9
; Firmware:   SFX9
;
  0   G-LIST   Number of reallocated sectors (pCHS)  ** GROWN **      
  1930   P-LIST   Number of Primary defects (pCHS)  ** FACTORY **      
  00-00   PFA   Status: ** GOOD **      
  35'C   T   Current Temperature      
  35'C   T   Current Temperature      
  69'C   T   Reference Temperature      
  213   CSS   Accumulated Start/Stop Cycles      
  453127   WRITE   Error Corrected Without Substantial Delay      
  842   WRITE   Error Corrected With Possible Delays      
  844   WRITE   Total Error Corrected With Retries      
  453969   WRITE   Total Error Corrected      
  842   WRITE   Total Times Correction Algorithm Processed      
  24373917970432   WRITE   Total Bytes Processed ( 22.17 Tb )      
  0   WRITE   Total Uncorrected Errors      
  14695   READ   Error Corrected Without Substantial Delay      
  26   READ   Error Corrected With Possible Delays      
  57   READ   Total Error Corrected With Retries      
  14721   READ   Total Error Corrected      
  26   READ   Total Times Correction Algorithm Processed      
  7845358983168   READ   Total Bytes Processed ( 7.14 Tb )      
  0   READ   Total Uncorrected Errors      
  0   VERIFY   Error Corrected Without Substantial Delay      
  0   VERIFY   Error Corrected With Possible Delays      
  0   VERIFY   Total Error Corrected With Retries      
  0   VERIFY   Total Error Corrected      
  0   VERIFY   Total Times Correction Algorithm Processed      
  0   VERIFY   Total Bytes Processed      
  0   VERIFY   Total Uncorrected Errors      
  287616   -   Recoverable Non-Medium Error Events      


===========
; Model:   SEAGATE ST600MM0006
; Serial:   S0M1C2LJ
; Firmware:   6102
;
  0   G-LIST   Number of reallocated sectors (pCHS)  ** GROWN **      
  1408   P-LIST   Number of Primary defects (pCHS)  ** FACTORY **      
  00-00   PFA   Status: ** GOOD **      
  35'C   T   Current Temperature      
  68'C   T   Reference Temperature      
  225d 17h   POH   Power-On Time (325042 minutes)      
  35'C   T   Current Temperature      
  68'C   T   Reference Temperature      
  702   CSS   Accumulated Start/Stop Cycles      
  0   WRITE   Error Corrected With Possible Delays      
  0   WRITE   Total Error Corrected With Retries      
  0   WRITE   Total Error Corrected      
  0   WRITE   Total Times Correction Algorithm Processed      
  3308097849856   WRITE   Total Bytes Processed ( 3.01 Tb )      
  0   WRITE   Total Uncorrected Errors      
  2079063422   READ   Error Corrected Without Substantial Delay      
  0   READ   Error Corrected With Possible Delays      
  0   READ   Total Error Corrected With Retries      
  2079063422   READ   Total Error Corrected      
  0   READ   Total Times Correction Algorithm Processed      
  2018569198080   READ   Total Bytes Processed ( 1.84 Tb )      
  0   READ   Total Uncorrected Errors      
  0   VERIFY   Error Corrected Without Substantial Delay      
  0   VERIFY   Error Corrected With Possible Delays      
  0   VERIFY   Total Error Corrected With Retries      
  0   VERIFY   Total Error Corrected      
  0   VERIFY   Total Times Correction Algorithm Processed      
  0   VERIFY   Total Bytes Processed      
  0   VERIFY   Total Uncorrected Errors      
  2228   -   Recoverable Non-Medium Error Events    

Re: Интерпретация результатов б/у SAS дисков  

  От: OLiMP 17 июля 2017 г. 7:59

Судя по полученным дампам с дисками всё в порядке. SAS диски нужно прогнать обычным скриптом чтения в CERT Tool - он идёт в комплекте. И по графику уже всё будет видно.
..\CERT\DefectScan\READ_ScanOnly_Block(4096)_MaxErr(128K)_Timeout(100ms_50ms).cert

Re: Интерпретация результатов б/у SAS дисков  

  От: mike.m 17 июля 2017 г. 11:01

[b]freebird[/b]

В текущем архиве есть примеры тестовых скриптов.

Запустите две копии [b]R.tester[/b], выберите в каждой по одному из ваших дисков, далее [b]Toolbox[/b] -> [b]CERT Tool[/b]

Т.к. дефектов на диске нет - выберите базовый скрипт ("[i]Load script[/i]"):
\CERT\READ Bench-and-Scan\READ_BenchAndScan_Any(HDD-only)_Block(4096)_MaxErr(4K)_Timeout(200ms_100ms).cert

Ну и СТАРТ :)
После прохождения тестов - можно сохранить текстовый отчёт ([i]Save report[/i]) и накопленные тестовые данные ([i]Save all data[/i]).

Если вам интересна моя интерпретация результатов - скриншоты не нужны: просто заархивируйте файл с данными теста ([b]*.dat[/b]) и пришлите ссылку.

[b]P.S.[/b] В ближайшие несколько дней мы обновим архив на сайте - кроме массы полезных и дружественных изменений, новая версия позволит вам редактировать скрипты и/или формировать тесты на своё усмотрение.

С уважением,
Михаил Маврицин

Re: Интерпретация результатов б/у SAS дисков  

  От: freebird 17 июля 2017 г. 11:43

Спасибо большое. Запускаю тесты. Выложу ссылку на результаты после тестов.

Re: Интерпретация результатов б/у SAS дисков  

  От: freebird 17 июля 2017 г. 14:36

Выкладываю результаты прогона CERT Tool
папка в которой результаты по отдельности:
https://app.box.com/s/uxgeryiysgqk9ywip82yvqilbyxix6l6

и ссылка на архив с двумя .dat файлами:
https://app.box.com/s/rwyrdt3fdvac8b2ung3ok7iytrgor96e
Заранее большое спасибо за Вашу оценку и интерперетацию

Re: Интерпретация результатов б/у SAS дисков  

  От: freebird 18 июля 2017 г. 22:26

Если у вас есть возможность ответить - буду рад. Мне по прежнему интересно ваше мнение по поводу дисков. Что показали дополнительные тесты R.tester?

Re: Интерпретация результатов б/у SAS дисков  

  От: mike.m 19 июля 2017 г. 0:35

Графики посмотрел.

Основной вопрос - что такое SAS от Intel?
Я материнки с таким чипсетом (8086:1D68 = C600/X79) лично не встречал и даже не имею представления, что это за SAS такой.
Если честно - это либо фейковый SAS, либо он как-то эмулируется в чипсете, либо что-то третье.

По графикам могу сказать, что контроллер и/или драйвер либо очень похабные (50:50, ничего личного!!), либо вмешиваются  (тем или иным образом) постоянно даже в при прямой подаче SCSI-команд.
Замечу, что т.к. контроллер якобы RAID (софтовый, конечно же), то высоковероятно, что там все описанные проблемы присутствуют разом вместе.
При случае - обязательно найду такую m/b и посмотрю, как оно работает повнимательнее.

В целом:
- график Seek Accordion на Seagate = не идеален: распределение времени доступа по поверхности относительно-стабильное, но очень много вылетов (точки со временем доступа больше среднего на каждом участке).
** для Seagate SAS 10K/15K такое очень [b]не[/b] типично.

- графики линейного чтения на обоих дисках = весьма не идеальны, НО в связи с неизвестным мне SAS-контроллером не могу поручиться, что виноваты только диски.

- явных ошибок во время тестов не было вообще = значит, ни реаллокейтов, ни дефектов нет.

В общем и целом, при работе с SAS накопителями я очень настоятельно рекомендую использовать исключительно контроллеры на чипах LSI. За всю мою практику (17+ лет) лучше и стабильнее SAS HBA я не встречал.
** Исключение - LSI 3G SAS, первое поколение. Там были некоторые некритичные баги при работе с SATA.


[b]Ваш диск WDC 0x127 "Sirius 3D":[/b]




[b]Заведомо хороший сэмпл (тот же размер и семейство)[/b]:




Вполне очевидно, что "что-то идёт не так" - либо с дисками, либо (и/или) из-за особенностей контроллера.

P.S. Контроллер Intel и его странности мне интересны. Спасибо, добавил в список TO DO для изучения.

Re: Интерпретация результатов б/у SAS дисков  

  От: freebird 19 июля 2017 г. 12:34

Михаил, спасибо за ответ.
Честно говоря, проверять виноват ли SAS контроллер покупкой нового SAS диска как-то не хочется. Другого SAS контроллера у меня нет, так что диски отдельно от контроллера проверить я тоже не могу.

Пока для себя решил, что не буду использовать RAID возможности этого контроллера и подключу имеющиеся диски в режиме NON-RAID. Я понимаю, диски по прежнему останутся подключены к тому же контроллеру, но хотя бы не будут использоваться в заведомо более "сложных" режимах типа STRIPE или MIRROR.

Подскажите пожалуйста, какие есть возможности следить состоянием здоровья дисков в моей ситуации? Стандартный смарт ничего не показывает. Достаточно ли периодически запускать SMART от R.tester и смотреть на PFAStatus и G-LIST?

Нужно ли учитывать изменяющиеся показания ошибок? Вроде: "Error Corrected Without Substantial Delay" и "Recoverable Non-Medium Error Events" ?
Какой тест вы бы рекомендовали периодически запускать для оценки состояния дисков?

Кстати, если вам интересно, то вот ссылка на Data Sheet материнской платы от моей рабочей станции FUJITSU CELSIUS R920
https://sp.ts.fujitsu.com/dmsp/Publications/public/ds-CELSIUS-R920.pdf
(SAS Controller type optional upgrade to 8 ports, Intel C606)
С этим контроллером точно что-то не то, потому как новенький SATA SSD Kingston подключенный через этот контроллер выдаёт кучу "оранжевых", чего не наблюдается при подключении к SATA контроллеру. Этот SAS контроллер явно вносит свои задержки. Никаких настроек у него нет, кроме того случая, когда выбираешь страйп, там можно задать размер буфера. Рабочая станция изначально сконфигурирована именно на страйп, для более высоких скоростных показателей, возможно это оптимальный режим для данного контроллера.



Контакты
Центральный офис

телефон: +7 495 230−1000
e-mail:
адрес: 119049, Москва, Коровий Вал, д. 1А, стр. 1 (здание универмага «Добрынинский»), 6 этаж, офис R.LAB

Социальные сети и мессенджеры

VK: Паблик компании
YouTube: Наш канал
Telegram: Консультация у специалистов R.LAB через бота (@rlabsupportbot)
WhatsApp: Консультации по восстановлению данных (74952301000)