-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Hallo, bei mir läuft der smartd. Heute hat er mir zum ersten Mal eine Mail geschickt: The following warning/error was logged by the smartd daemon: Device: /dev/hda, ATA error count increased from 2220 to 2225 Ich habe dann smartctl -a aufgerufen, werde aber aus dem Output nicht so recht schlau. Wieviele Fehler darf die Platte denn machen, bevor ich mir Sorgen machen muss? Danke, Torsten -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.4 (GNU/Linux) iD8DBQFBZ6M9wicyCTir8T4RAopVAJ9DqaLT+FQZI/TJsWhhJU1lRbFQHwCfQJLC e+DQkdTrbbnGUsjTyLyUuG8= =oafD -----END PGP SIGNATURE-----
Hallo thorsten, da ich vor kurzem mit dem selben Problem zu kämpfen hatte will ich dir sagen das bei 10% fehler du dir ordentlich sorgen machen solltest ich hatte nur 8% errors... Wenn Fehler einmal auf der Platte sind verschwinden diese ja nicht durch "fsck" sondern dann liegt meist ein Hardware defekt vor - also Tonne auf und tschüß vorher sichern nicht vergessen Torsten Förtsch (torsten.foertsch@gmx.net) schrieb:
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hallo,
bei mir läuft der smartd. Heute hat er mir zum ersten Mal eine Mail geschickt:
The following warning/error was logged by the smartd daemon: Device: /dev/hda, ATA error count increased from 2220 to 2225
Ich habe dann smartctl -a aufgerufen, werde aber aus dem Output nicht so recht schlau. Wieviele Fehler darf die Platte denn machen, bevor ich mir Sorgen machen muss?
Danke, Torsten -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.4 (GNU/Linux)
iD8DBQFBZ6M9wicyCTir8T4RAopVAJ9DqaLT+FQZI/TJsWhhJU1lRbFQHwCfQJLC e+DQkdTrbbnGUsjTyLyUuG8= =oafD -----END PGP SIGNATURE-----
-- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Am Sa, den 09.10.2004 schrieb Christian Weiligmann um 13:07:
da ich vor kurzem mit dem selben Problem zu kämpfen hatte will ich dir sagen das bei 10% fehler du dir ordentlich sorgen machen solltest ich hatte nur 8% errors...
Welcher Wert ist denn ausschlaggebend? Seek_Error_Rate oder Raw_Read_Error_Rate oder beide? Bye Michael -- Weil du die Augen offen hast, glaubst du, du siehst. -- Goethe, 1749-1832, Egmont ________________________________________________________________________ http://macbyte.info/ ICQ #151172379 http://dattuxi.de/
Hallo Thorsten, ich denke du hast irgendwo am ende der Zeile nach dem Befehl smartctl /dev/hdXX -a diese Info stehen... und bei mir waren damals 8% fähig einen Datenverlust zu erreichen. SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA _of_first_error # 1 Short offline Completed without error 00% 2269 - Michael Raab (ml-lists@macbyte.info) schrieb:
Am Sa, den 09.10.2004 schrieb Christian Weiligmann um 13:07:
da ich vor kurzem mit dem selben Problem zu kämpfen hatte will ich dir sagen das bei 10% fehler du dir ordentlich sorgen machen solltest ich hatte nur 8% errors...
Welcher Wert ist denn ausschlaggebend?
Seek_Error_Rate oder Raw_Read_Error_Rate oder beide?
Bye Michael
-- Weil du die Augen offen hast, glaubst du, du siehst. -- Goethe, 1749-1832, Egmont ________________________________________________________________________ http://macbyte.info/ ICQ #151172379 http://dattuxi.de/
-- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Am Sa, den 09.10.2004 schrieb Christian Weiligmann um 14:38:
ich denke du hast irgendwo am ende der Zeile nach dem Befehl
smartctl /dev/hdXX -a diese Info stehen... und bei mir waren damals 8% fähig einen Datenverlust zu erreichen.
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA _of_first_error # 1 Short offline Completed without error 00% 2269 -
Ja, das steht bei mir auch und auch folgendes ----8<---- Device does not support Selective Self Tests/Logging ---->8---- Wenn ich das richtige verstehe, kann meine Platte kein self-test. Bei der Platte handelt es sich um eine SAMSUNG SP1604N, Firmware Version TM100-23. Auch die übrigen Ausgaben, die sich auf Fehler beziehen, zeigen den Wert Null an. Bye Michael -- Welcome to Hell! Here's your copy of Windows! ________________________________________________________________________ http://macbyte.info/ ICQ #151172379 http://dattuxi.de/
* Samstag, 09. Oktober 2004 um 15:01 (+0200) schrieb Michael Raab:
----8<---- Device does not support Selective Self Tests/Logging ---->8----
Wenn ich das richtige verstehe, kann meine Platte kein self-test.
Nein, deine Platte "kann" keinen "Selective Self Test".
Bei der Platte handelt es sich um eine SAMSUNG SP1604N, Firmware Version TM100-23. Auch die übrigen Ausgaben, die sich auf Fehler beziehen, zeigen den Wert Null an.
Die letzten 5 (ATA-)Fehler sollten durch
'smartctl -l error /dev/<deinePlatte>' angezeigt werden.
Gruß
Andreas
--
Andreas Könecke "Andreas Koenecke
* Samstag, 09. Oktober 2004 um 14:38 (+0200) schrieb Christian Weiligmann:
ich denke du hast irgendwo am ende der Zeile nach dem Befehl
smartctl /dev/hdXX -a diese Info stehen... und bei mir waren damals 8% fähig einen Datenverlust zu erreichen.
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA _of_first_error # 1 Short offline Completed without error 00% 2269 ->
Quatsch!
Die %-Remaining gibt lediglich an, dass der Self-Test nicht beendet wurde und
das muss nicht unbeding an der Festplatte liegen, wie z.B. hier:
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours)
# 1 Short offline Aborted by host 20% 777
Aussagekräftiger ist da schon die Status-Spalte, aber für eine Entscheidung
"Ab in die Tonne ..." sollte man sich alle SMART-Werte und insbesonders das
SMART-Error-Log aufmerksam ansehen.
Gruß
Andreas
--
Andreas Könecke "Andreas Koenecke
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 On Saturday 09 October 2004 15:52, Andreas Koenecke wrote:
Quatsch!
Die %-Remaining gibt lediglich an, dass der Self-Test nicht beendet wurde und das muss nicht unbeding an der Festplatte liegen, wie z.B. hier:
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) # 1 Short offline Aborted by host 20% 777 Aussagekräftiger ist da schon die Status-Spalte, aber für eine Entscheidung "Ab in die Tonne ..." sollte man sich alle SMART-Werte und insbesonders das SMART-Error-Log aufmerksam ansehen.
Hier also meine 5 letzten Fehler. Was will uns der Erfinder damit sagen? Error 2237 occurred at disk power-on lifetime: 6453 hours When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 b9 94 3e e3 Error: ICRC, ABRT 1 sectors at LBA = 0x033e94b9 = 54432953 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name -- -- -- -- -- -- -- -- --------- -------------------- c8 00 18 a2 94 3e e3 00 3531.727 READ DMA c8 00 78 22 94 3e e3 00 3531.725 READ DMA c8 00 00 22 93 3e e3 00 3531.442 READ DMA c8 00 00 22 92 3e e3 00 3531.222 READ DMA c8 00 50 d2 91 3e e3 00 3531.026 READ DMA Error 2236 occurred at disk power-on lifetime: 6452 hours When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 89 8e 53 e3 Error: ICRC, ABRT 1 sectors at LBA = 0x03538e89 = 55807625 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name -- -- -- -- -- -- -- -- --------- -------------------- c8 00 80 0a 8e 53 e3 00 2775.682 READ DMA c8 00 08 9a 73 53 e3 00 2775.671 READ DMA c8 00 08 d2 66 a5 e3 00 2775.641 READ DMA c8 00 70 b2 4d 12 e3 00 2775.608 READ DMA c8 00 50 8a 6e 53 e3 00 2775.604 READ DMA Error 2235 occurred at disk power-on lifetime: 6452 hours When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 4c ef 03 e0 Error: ICRC, ABRT 1 sectors at LBA = 0x0003ef4c = 257868 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name -- -- -- -- -- -- -- -- --------- -------------------- c8 00 40 0d ef 03 e0 00 2756.809 READ DMA c8 00 40 4d 4e 05 e0 00 2756.798 READ DMA c8 00 08 8d d7 05 e0 00 2756.795 READ DMA c8 00 08 9d d7 05 e0 00 2756.787 READ DMA c8 00 10 75 2f 08 e0 00 2756.722 READ DMA Error 2234 occurred at disk power-on lifetime: 6452 hours When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 29 1e e0 e3 Error: ICRC, ABRT 1 sectors at LBA = 0x03e01e29 = 65019433 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name -- -- -- -- -- -- -- -- --------- -------------------- c8 00 68 c2 1d e0 e3 00 2755.814 READ DMA c8 00 08 aa 1d e0 e3 00 2755.814 READ DMA c8 00 18 12 15 e0 e3 00 2755.810 READ DMA c8 00 08 ea 14 e0 e3 00 2755.809 READ DMA c8 00 10 c2 14 e0 e3 00 2755.804 READ DMA Error 2233 occurred at disk power-on lifetime: 6452 hours When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 24 8e 09 e0 Error: ICRC, ABRT 1 sectors at LBA = 0x00098e24 = 626212 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name -- -- -- -- -- -- -- -- --------- -------------------- c8 00 18 0d 8e 09 e0 00 2753.729 READ DMA c8 00 08 35 8e 09 e0 00 2753.729 READ DMA c8 00 08 45 8e 09 e0 00 2753.723 READ DMA c8 00 40 0d 15 0b e0 00 2753.717 READ DMA c8 00 08 85 36 09 e0 00 2753.716 READ DMA Danke, Torsten -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.4 (GNU/Linux) iD8DBQFBaAIMwicyCTir8T4RAvhRAJ9rHSQwZGEqDcxHDwsfytBhPUfM8gCfRhuO J6jK822PFGtDUjtIwQjTwZw= =/00x -----END PGP SIGNATURE-----
* Samstag, 09. Oktober 2004 um 17:21 (+0200) schrieb Torsten Förtsch:
Hier also meine 5 letzten Fehler. Was will uns der Erfinder damit sagen?
Error 2237 occurred at disk power-on lifetime: 6453 hours When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 b9 94 3e e3 Error: ICRC, ABRT 1 sectors at LBA = 0x033e94b9 = 54432953
Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Timestamp Command/Feature_Name -- -- -- -- -- -- -- -- --------- -------------------- c8 00 18 a2 94 3e e3 00 3531.727 READ DMA c8 00 78 22 94 3e e3 00 3531.725 READ DMA c8 00 00 22 93 3e e3 00 3531.442 READ DMA c8 00 00 22 92 3e e3 00 3531.222 READ DMA c8 00 50 d2 91 3e e3 00 3531.026 READ DMA [ ... ]
Hm, ich kann die Ausgaben auch nur anhand der Man-Page zu 'smartctl'
interpretieren:
Anscheinend treten CRC-Fehler beim Lesen (per DMA) verschiedener Blöcke auf.
Aber warum ...?
Natürlich kann ich einen Festplattendefekt nicht aussschliessen, aber ich
würde die Platte noch nicht so schnell abschreiben:
- Sieh' doch mal in "/var/log/messages" nach, ob es entsprechende Meldungen des
Kernels gibt ("DMA read timed out" o.ä.) und füttere damit Google. Eventuell
hast du ja lediglich einen nicht vollständig unterstützten Chipsatz oder so
etwas ähnliches.
- "Schalte" doch mit 'hdparm' testweise 1 oder 2 UDMA-"Gänge herunter" und
kontrolliere, ob die Häufigkeit der Fehler abnimmt.
- Oder (nicht unwahrscheinlich!) das IDE-Kabel ist beschädigt oder zu
lang. Probiere es doch einmal mit einem neuen Kabel ...
Gruß
Andreas
--
Andreas Könecke "Andreas Koenecke
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 On Saturday 09 October 2004 14:38, Christian Weiligmann wrote:
smartctl /dev/hdXX -a diese Info stehen... und bei mir waren damals 8% fähig einen Datenverlust zu erreichen.
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA _of_first_error # 1 Short offline Completed without error 00% 2269 -
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 6456 - # 2 Extended offline Completed without error 00% 6444 - # 3 Extended offline Completed without error 00% 6434 - # 4 Extended offline Completed without error 00% 6421 - # 5 Extended offline Completed without error 00% 6405 - # 6 Extended offline Completed without error 00% 6390 - # 7 Extended offline Completed without error 00% 6377 - # 8 Extended offline Completed without error 00% 6366 - # 9 Extended offline Completed without error 00% 6351 - #10 Extended offline Completed without error 00% 6347 - #11 Short offline Completed without error 00% 6346 - Ich kann also wohl noch beruhigt schlafen, oder? Torsten -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.2.4 (GNU/Linux) iD8DBQFBaABDwicyCTir8T4RAhjQAJ9awlJdLItYi5+55T1fewRDKukolgCfSklZ Cv8kbpBibj99w4G2Tij+YyU= =BtlT -----END PGP SIGNATURE-----
participants (4)
-
Andreas Koenecke
-
Christian Weiligmann
-
Michael Raab
-
Torsten Förtsch