in /var/log/messages findet sich häufug Failed SMART usage Attribute: 190 Airflow_Temperature_Cel. Wenn ich mir die Werte anschaue und berücksichtige das laut "http://linuxwiki.de/SmartMonTools Die jeweiligen Werte sind keine absoluten Angaben, sondern sind normalisiert. Je höher der Wert, desto besser der Zustand. So beginnen die Werte oft bei 100 oder 200 und werden bei Fehlern allmählich herunter gezählt. " gilt würde ich sagen das die Platte ein Temeperatur-Problem hat. Liege ich damit richtig? Kann jemand hier mal darlegen warum bei den Smartmon-Tools mit normalisierten Werten gearbietet wird? system:~ # smartctl -H /dev/sdb smartctl 5.39 2008-05-08 21:56 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-8 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED Please note the following marginal Attributes: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 190 Airflow_Temperature_Cel 0x0022 052 039 045 Old_age Always In_the_past 48 (Lifetime Min/Max 41/55) system~ # smartctl -A /dev/sdb smartctl 5.39 2008-05-08 21:56 [i686-pc-linux-gnu] (local build) Copyright (C) 2002-8 by Bruce Allen, http://smartmontools.sourceforge.net === START OF READ SMART DATA SECTION === SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 108 091 006 Pre-fail Always - 207129147 3 Spin_Up_Time 0x0003 094 092 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 147 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 084 060 030 Pre-fail Always - 4584896346 9 Power_On_Hours 0x0032 096 096 000 Old_age Always - 4276 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 147 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 189 High_Fly_Writes 0x003a 100 100 000 Old_age Always - 0 190 Airflow_Temperature_Cel 0x0022 052 039 045 Old_age Always In_the_past 48 (Lifetime Min/Max 41/55) 194 Temperature_Celsius 0x0022 048 061 000 Old_age Always - 48 (0 18 0 0) 195 Hardware_ECC_Recovered 0x001a 063 058 000 Old_age Always - 156719256 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 Ralf Prengel Manager Customer Care Comline AG Hauert 8 D-44227 Dortmund/Germany Fon +49 231 97575 904 Fax +49 231 97575 257 Mobil +49 151 10831 157 EMail Ralf.Prengel@comline.de www.comline.de Vorstand Stephan Schilling, Erwin Leonhardi Aufsichtsrat Dr. Franz Schoser (Vorsitzender) HR Dortmund B 14570 USt.-ID-Nr. DE 124727422 -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
"prengel"
in /var/log/messages findet sich häufug Failed SMART usage Attribute: 190 Airflow_Temperature_Cel.
Wenn ich mir die Werte anschaue und berücksichtige das laut "http://linuxwiki.de/SmartMonTools Die jeweiligen Werte sind keine absoluten Angaben, sondern sind normalisiert. Je höher der Wert, desto besser der Zustand. So beginnen die Werte oft bei 100 oder 200 und werden bei Fehlern allmählich herunter gezählt. " gilt würde ich sagen das die Platte ein Temeperatur-Problem hat. Liege ich damit richtig?
Kann jemand hier mal darlegen warum bei den Smartmon-Tools mit normalisierten Werten gearbietet wird?
smartctl(8) sagt da etwas anderes. In der Spalte RAW_VALUE wird der numerische Wert ausgegeben, die Einheit für den Wert kann differieren, in Abhängigkeit vom Hersteller (d.h. es können z.B. Stunden oder Minuten sein). In der Spalte VALUE wird der normalisierte Werte ausgegeben, der normalisierte Wert kann zwischen 1 - 254 liegen, wobei jeder Hersteller seinen eigenen Algorithmus zur Normalisierung verwendet. Die Normalisierung muss sein, da die Messeinheiten nicht standardisiert sind, man aber einen einheitlichen, vergleichbaren physikalischen Wert benötigt. Die Rohwerte werden durch die Normalisierung in enterpretierbare physikalische Einheiten gewandelt. Der Algorithmus zur Normalisierung wird in den Spezifikationen zu SMART nicht beschrieben. -Dieter -- Dieter Klünter | Systemberatung http://dkluenter.de GPG Key ID:8EF7B6C6 53°37'09,95"N 10°08'02,42"E -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Don, 18 Feb 2010, prengel schrieb: [..]
4 Start_Stop_Count 0x0032 100 100 020 Old_age Always - 147 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
Gut.
9 Power_On_Hours 0x0032 096 096 000 Old_age Always - 4276
Ziemlich lang für 147 Start/Stops. Läuft die Platte 24/7? Darauf sind normale IDE/SATA nicht ausgelegt.
10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0
Gut.
12 Power_Cycle_Count 0x0032 100 100 020 Old_age Always - 147
s.o.
190 Airflow_Temperature_Cel 0x0022 052 039 045 Old_age Always In_the_past 48 (Lifetime Min/Max 41/55) 194 Temperature_Celsius 0x0022 048 061 000 Old_age Always - 48 (0 18 0 0)
Bissl arg warm. Lüfter? Das Attribut 190 kannst du ignorieren. Ergänze -I 190 in der /etc/smartd.conf. Zum Beispiel hab ich: DEVICESCAN -a -d ata -I 194 -I 190 -I 231 -I 9 Die Temperatur überwache ich per gkrellm (oder manuell mit nem kl. Script, das smartctl -A aufruft), will mir damit nicht die Logs vollmüllen, denn die Temperatur ändert sich doch sehr oft.
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
Gut. http://en.wikipedia.org/wiki/S.M.A.R.T.#Known_ATA_S.M.A.R.T._attributes HTH, -dnh -- Und dann steht die Merkel dann da. Wie sie so da steht, wenn sie so da steht. Wenn's schwierig wird, dann steht sie ja immer erstmal da, und dann guckt sie so. Dann guckt sie so und dann denk ich immer: "Die is genauso gespannt, was sie gleich sagen wird, wie ich." -- Volker Pispers, "Bis neulich" (2007) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am 18.02.2010 20:16, schrieb David Haller: - 48 (0 18 0 0)
Bissl arg warm. Lüfter? Das Attribut 190 kannst du ignorieren. Ergänze -I 190 in der /etc/smartd.conf. Zum Beispiel hab ich:
DEVICESCAN -a -d ata -I 194 -I 190 -I 231 -I 9
Die Temperatur überwache ich per gkrellm (oder manuell mit nem kl. Script, das smartctl -A aufruft), will mir damit nicht die Logs vollmüllen, denn die Temperatur ändert sich doch sehr oft.
197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0
Gut.
http://en.wikipedia.org/wiki/S.M.A.R.T.#Known_ATA_S.M.A.R.T._attributes
Danke für die Infos. Wir haben uns ein nadios-script angepasst und überwachen die Platten dann mit nagios/groundworks. Gruß Ralf Prengel Manager Customer Care Comline AG Hauert 8 D-44227 Dortmund/Germany Fon +49 231 97575 904 Fax +49 231 97575 257 Mobil +49 151 10831 157 EMail Ralf.Prengel@comline.de www.comline.de Vorstand Stephan Schilling, Erwin Leonhardi Aufsichtsrat Dr. Franz Schoser (Vorsitzender) HR Dortmund B 14570 USt.-ID-Nr. DE 124727422 -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (3)
-
David Haller
-
Dieter Kluenter
-
prengel