Hilfe mit SMART-Bewertung
Hi, ich habe hier eine Platte, die eben ein fsck beim Booten verlangt hat. Wenn ich mit smartctl drauf schaue, bekomme ich folgendes: SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 121151640 3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 86997164 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15743 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 061 056 045 Old_age Always - 39 (Min/Max 29/39) 194 Temperature_Celsius 0x0022 039 044 000 Old_age Always - 39 (0 18 0 0 0) 195 Hardware_ECC_Recovered 0x001a 054 009 000 Old_age Always - 121151640 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 153734059408767 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483200717 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2193954941 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 4204 - SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch. Der short und der offline Test haben keinen Fehler ergeben. Was denkt Ihr ? Bernd -- Bernd Lentes Systemadministration Institut für Entwicklungsgenetik Gebäude 35.34 - Raum 208 HelmholtzZentrum münchen bernd.lentes@helmholtz-muenchen.de phone: +49 89 3187 1241 fax: +49 89 3187 2294 http://www.helmholtz-muenchen.de/idg Die Freiheit wird nicht durch weniger Freiheit verteidigt Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671 -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 10.09.2014 17:57, schrieb Lentes, Bernd:
Hi,
ich habe hier eine Platte, die eben ein fsck beim Booten verlangt hat. Wenn ich mit smartctl drauf schaue, bekomme ich folgendes:
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 117 099 006 Pre-fail Always - 121151640 3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 86997164 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15743 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 061 056 045 Old_age Always - 39 (Min/Max 29/39) 194 Temperature_Celsius 0x0022 039 044 000 Old_age Always - 39 (0 18 0 0 0) 195 Hardware_ECC_Recovered 0x001a 054 009 000 Old_age Always - 121151640 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 153734059408767 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483200717 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2193954941
SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Short offline Completed without error 00% 4204 -
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch. Der short und der offline Test haben keinen Fehler ergeben. Was denkt Ihr ?
Bernd
-- Bernd Lentes
Systemadministration Institut für Entwicklungsgenetik Gebäude 35.34 - Raum 208 HelmholtzZentrum münchen bernd.lentes@helmholtz-muenchen.de phone: +49 89 3187 1241 fax: +49 89 3187 2294 http://www.helmholtz-muenchen.de/idg
Die Freiheit wird nicht durch weniger Freiheit verteidigt
Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671 Die Platte läuft dauernd, ist sie für Serverbetrieb ? Der Controller kann offensichtich die Fehler noch korrigieren, aber ich würde die Platte sofort austauschen (ggf. nach letztem Backup). Meine Laptop-Platte ist ca. 5J. alt und hat 0 Fehler !
mfg K. Müller
2014-09-10 17:57 GMT+02:00 Lentes, Bernd <bernd.lentes@helmholtz-muenchen.de>:
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch. Der short und der offline Test haben keinen Fehler ergeben. Was denkt Ihr ?
https://en.wikipedia.org/wiki/S.M.A.R.T. Sieht alles gut aus. Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Martin schrieb:
2014-09-10 17:57 GMT+02:00 Lentes, Bernd <bernd.lentes@helmholtz- muenchen.de>:
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch. Der short und der offline Test haben keinen Fehler ergeben. Was denkt Ihr ?
https://en.wikipedia.org/wiki/S.M.A.R.T.
Sieht alles gut aus.
Hm, der RAW-Wert ist sehr hoch (übrigens identisch mit Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist. Schwierig, da klare Aussagen zu treffen. Bernd Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671
Am 10.09.2014 23:49, schrieb Lentes, Bernd:
Martin schrieb:
2014-09-10 17:57 GMT+02:00 Lentes, Bernd <bernd.lentes@helmholtz- muenchen.de>:
Was mich ein wenig beunruhigt ist "195 Hardware_ECC_Recovered". Der "worst" mit 9 ist niedrig und der RAW-Wert ist recht hoch. Der short und der offline Test haben keinen Fehler ergeben. Was denkt Ihr ?
https://en.wikipedia.org/wiki/S.M.A.R.T.
Sieht alles gut aus.
Hm,
der RAW-Wert ist sehr hoch (übrigens identisch mit Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist. Schwierig, da klare Aussagen zu treffen.
Bernd
Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671 Rgbx������ץ���r���҉碝��V������uﮞ˛���m�)z{.��+�I�zr�ק٢�+-��h�;����r���brG�J'��w�j)Z��^�ˬy� ޮ�^�ˬz�
Hi, Du hast uns den Wert von SMART overall-health self-assessment test result: vorenthalten. "PASSED" ? Das ist dann die Gesamtbewertung. Bei mir (Areca-RAID 1 mit 2 WD1003FBYX) zeigt smartctl allerdings jeden "Raw_Read_Error" (bzw. vielleicht auch eine Gruppe davon) einzeln an (ich lasse alle smartctl-Werte regelmäßig gegen ihre Vorgängerwerte testen und Unterschiede bei den relevanten melden). Ich habe aber nur ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 27 und das bei Power-On-Hours: 24576 (die andere RAID-Platte hat nach 11000 Power-on-hours noch 0). Vor 2 Jahren hat mir das RAID mal eine Platte degraded, die hatte bei 14000 Power-on-hours reichlich 15000 Raw_Read_Errors (aktuell benutze ich sie allerdings als Testplatte, habe gerade 3x nacheinander OS13.1 drauf installiert, keine Fehler zu bemerken). wenn Dein Raw_Read_Error_Rate wirklich bei 121151640 liegt, kann die Platte eigentlich nur fast tot sein. Hat sich der Wert übrigens seit Deiner Mail massiv geändert? Wie hoch ist er jetzt? Abweichend von wiki würde ich der "seek error rate" doch etwas Gewicht beimessen, auch wenn man nicht genau sagen kann, für welche Menge an Fehlern er steht. Bei mir ist er jedenfalls auf beiden RAID-Platten 0. Insgesamt würde ich sagen... Zeit für einen Wechsel, vielleicht brauchst Du ja auch immer mal eine Platte für Testinstallationen, deren Verlust harmlos wäre... cu jth -- www.teddylinx.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Jörg schrieb:
-----Ursprüngliche Nachricht----- Von: Joerg Thuemmler [mailto:listen@vordruckleitverlag.de] Gesendet: Donnerstag, 11. September 2014 08:20 An: opensuse-de@opensuse.org Betreff: Re: Hilfe mit SMART-Bewertung
Hm,
der RAW-Wert ist sehr hoch (übrigens identisch mit Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist. Schwierig, da klare Aussagen zu treffen.
Bernd
Hi,
Du hast uns den Wert von SMART overall-health self-assessment test result: vorenthalten. "PASSED" ?
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
Das ist dann die Gesamtbewertung. Bei mir (Areca-RAID 1 mit 2 WD1003FBYX) zeigt smartctl allerdings jeden "Raw_Read_Error" (bzw. vielleicht auch eine Gruppe davon) einzeln an (ich lasse alle smartctl-Werte regelmäßig gegen ihre Vorgängerwerte testen und Unterschiede bei den relevanten melden). Ich habe aber nur
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 27
und das bei Power-On-Hours: 24576 (die andere RAID-Platte hat nach 11000 Power-on-hours noch 0).
Vor 2 Jahren hat mir das RAID mal eine Platte degraded, die hatte bei 14000 Power-on-hours reichlich 15000 Raw_Read_Errors (aktuell benutze ich sie allerdings als Testplatte, habe gerade 3x nacheinander OS13.1 drauf installiert, keine Fehler zu bemerken).
wenn Dein Raw_Read_Error_Rate wirklich bei 121151640 liegt, kann die Platte eigentlich nur fast tot sein. Hat sich der Wert übrigens seit Deiner Mail massiv geändert? Wie hoch ist er jetzt?
Abweichend von wiki würde ich der "seek error rate" doch etwas Gewicht beimessen, auch wenn man nicht genau sagen kann, für welche Menge an Fehlern er steht. Bei mir ist er jedenfalls auf beiden RAID-Platten 0.
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 58304224 3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 87096287 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15763 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 059 056 045 Old_age Always - 41 (Min/Max 29/43) 194 Temperature_Celsius 0x0022 041 044 000 Old_age Always - 41 (0 18 0 0 0) 195 Hardware_ECC_Recovered 0x001a 055 009 000 Old_age Always - 58304224 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 87625922788755 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483201189 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2832839630 Hi, der RAW-Wert von "Raw_Read_Eroor_rate" hat sich verringert, auch der von "Hardware_ECC_Recovered". Scheint also nicht einfach nur die Zahl der Fehler zu sein, denn die hätte ja zunehmen müssen. Viell. ist es hier so wie Wiki schreibt, und die Hersteller kochen bei diesen Werten ihr eigenes Süppchen. Die Seek-Error-Rate ist zwar im RAW-Wert hoch, aber nicht im normalisierten Wert. Egal, ich tausche die Platte. Ist mir zu heiß, da laufen ein paar wichtige VM's drauf. Bernd Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671
Am 11.09.2014 13:28, schrieb Lentes, Bernd:
Jörg schrieb:
-----Ursprüngliche Nachricht----- Von: Joerg Thuemmler [mailto:listen@vordruckleitverlag.de] Gesendet: Donnerstag, 11. September 2014 08:20 An: opensuse-de@opensuse.org Betreff: Re: Hilfe mit SMART-Bewertung
Hm,
der RAW-Wert ist sehr hoch (übrigens identisch mit Raw_Read_Error_Rate), andererseits sagt die engl. Wikipedia das bei diesen Attributen die angegebene Zahl wohl u.U. nicht einfach als Dezimalzahl zu verstehen ist und je nach Hersteller unterschiedlich zu interpretieren ist. Schwierig, da klare Aussagen zu treffen.
Bernd
Hi,
Du hast uns den Wert von SMART overall-health self-assessment test result: vorenthalten. "PASSED" ?
=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED
Das ist dann die Gesamtbewertung. Bei mir (Areca-RAID 1 mit 2 WD1003FBYX) zeigt smartctl allerdings jeden "Raw_Read_Error" (bzw. vielleicht auch eine Gruppe davon) einzeln an (ich lasse alle smartctl-Werte regelmäßig gegen ihre Vorgängerwerte testen und Unterschiede bei den relevanten melden). Ich habe aber nur
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 200 200 051 Pre-fail Always - 27
und das bei Power-On-Hours: 24576 (die andere RAID-Platte hat nach 11000 Power-on-hours noch 0).
Vor 2 Jahren hat mir das RAID mal eine Platte degraded, die hatte bei 14000 Power-on-hours reichlich 15000 Raw_Read_Errors (aktuell benutze ich sie allerdings als Testplatte, habe gerade 3x nacheinander OS13.1 drauf installiert, keine Fehler zu bemerken).
wenn Dein Raw_Read_Error_Rate wirklich bei 121151640 liegt, kann die Platte eigentlich nur fast tot sein. Hat sich der Wert übrigens seit Deiner Mail massiv geändert? Wie hoch ist er jetzt?
Abweichend von wiki würde ich der "seek error rate" doch etwas Gewicht beimessen, auch wenn man nicht genau sagen kann, für welche Menge an Fehlern er steht. Bei mir ist er jedenfalls auf beiden RAID-Platten 0.
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 58304224 3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 87096287 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15763 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 059 056 045 Old_age Always - 41 (Min/Max 29/43) 194 Temperature_Celsius 0x0022 041 044 000 Old_age Always - 41 (0 18 0 0 0) 195 Hardware_ECC_Recovered 0x001a 055 009 000 Old_age Always - 58304224 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 87625922788755 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483201189 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2832839630
Hi,
der RAW-Wert von "Raw_Read_Eroor_rate" hat sich verringert, auch der von "Hardware_ECC_Recovered". Scheint also nicht einfach nur die Zahl der Fehler zu sein, denn die hätte ja zunehmen müssen. Viell. ist es hier so wie Wiki schreibt, und die Hersteller kochen bei diesen Werten ihr eigenes Süppchen. Die Seek-Error-Rate ist zwar im RAW-Wert hoch, aber nicht im normalisierten Wert. Egal, ich tausche die Platte. Ist mir zu heiß, da laufen ein paar wichtige VM's drauf.
Bernd
Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671 Rgbx������ץ���r���҉碝��V������uﮞ˛���m�)z{.��+�I�zr�ק٢�+-��h�;����r���brG�J'��w�j)Z��^�ˬy� ޮ�^�ˬz�
Hi, kann sein, es ist, wie bei manchen Herstellern mit der Temperatur, die die als (z.B) 100-Wert angeben. Dann kriegt man automatisch 0, wenn der kritische Wert erreicht ist. Ich würde auch tauschen... so teuer ist so ein Blech ja nicht und es gibt sicher noch eine unkritische Ecke dafür... cu jth -- www.teddylinx.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo Bernd, Am 11.09.2014 13:28, schrieb Lentes, Bernd: [..]
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 113 099 006 Pre-fail Always - 58304224
Sehr seltsamer Wert, möglicherweise Fehlinterpretation
3 Spin_Up_Time 0x0003 100 100 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 34 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 079 060 030 Pre-fail Always - 87096287 9 Power_On_Hours 0x0032 083 083 000 Old_age Always - 15763 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 34 183 Runtime_Bad_Block 0x0032 100 100 000 Old_age Always - 0 184 End-to-End_Error 0x0032 100 100 099 Old_age Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 188 Command_Timeout 0x0032 100 099 000 Old_age Always - 1 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 059 056 045 Old_age Always - 41 (Min/Max 29/43) 194 Temperature_Celsius 0x0022 041 044 000 Old_age Always - 41 (0 18 0 0 0) 195 Hardware_ECC_Recovered 0x001a 055 009 000 Old_age Always - 58304224
Ist die Platte vielleicht eine Samsung? oder ein Abkömmling davon? Ich habe in meinem Raid 3 Samsung stecken (2x1TB und 1x1,5TB, und die brachten schon vom ersten Tag an massive "Hardware_ECC_Recovered" Fehler, die auch mal mehr und mal weniger waren stets im laufenden Betrieb. Ich denke das ist da ein Wrap-Around. Diesem Wert würde ich erst mal keine weitere Beachtung schenken.
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 240 Head_Flying_Hours 0x0000 100 253 000 Old_age Offline - 87625922788755 241 Total_LBAs_Written 0x0000 100 253 000 Old_age Offline - 1483201189 242 Total_LBAs_Read 0x0000 100 253 000 Old_age Offline - 2832839630
Hi,
der RAW-Wert von "Raw_Read_Eroor_rate" hat sich verringert, auch der von "Hardware_ECC_Recovered". Scheint also nicht einfach nur die Zahl der Fehler zu sein, denn die hätte ja zunehmen müssen. Viell. ist es hier so wie Wiki schreibt, und die Hersteller kochen bei diesen Werten ihr eigenes Süppchen. Die Seek-Error-Rate ist zwar im RAW-Wert hoch, aber nicht im normalisierten Wert. Egal, ich tausche die Platte. Ist mir zu heiß, da laufen ein paar wichtige VM's drauf. Ist bestimmt nicht das Verkehrteste, die Platte zu tauschen. Hast Du denn eine identische Platte mit korrekten Wertem nur so zum Vergleich?
Ich traue seit einiger Zeit diesen Smart-Werten überhaupt nicht mehr über den Weg. Habe da schon viel zu viel Sonderbarkeiten erlebt. Beispielsweise bei einer 2,5" 500GB WDC Platte auf der definitiv immer mal defekte Sektoren drauf waren, die ich durch Beschreiben dieser wieder entfernen konnte, aber der "Reallocated_Sector_Ct" Wert ging nie in die Höhe. Nach kurzer Zeit waren die defekten Sektoren dann an anderer Stelle. Gruß Manfred -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
participants (5)
-
Joerg Thuemmler
-
Kasimir Müller
-
Lentes, Bernd
-
Manfred Kreisl
-
Martin Schröder