Hi, ich habe hier den Rechner eines Freundes mit einem Festplattenproblem. Beim Booten beham ich folgende Meldung: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } hda: dma_intr: error=0x84 { DriveStatusError BadCRC } Diese wurde mehrfach wiederholt, danach kam eine ähnliche MNeldung mit der Fehlernummer 0x40. Nachdem ich einen reiserfsck auf allen Partitionen gemacht habe, ließ sich der Rechner wieder booten, aber die oben zitierte Meldung bleibt. Nun habe ich danach gegooglet und habe herausgefunden, dass möglicherweise ein HW-Defekt vorliegt. Aber Was könnte die wahrscheinlichste Ursache sein? (Der Rechner ist ca. 1 Jahr alt) In Frage kommen: -Stecker ziehen oder Ausschalten ohne ordnungsgemäßes runterfahren -Der Rechner bekam einen Stoß -Herstellungsfehler (Gewährleistung?) -Schmutz (Der Besitzer ist Kettenraucher und hat mehrere Katzen - Entsprechend sah das Innenleben aus) Dazu kommt meine eigene Erfahrung. Ich hatte das Problem auch mal und habe es zunächst ignoriert. Nach einer routinemäßigen Neupartitionierung der Platte trat es nicht mehr auf. Dies könnte auf einen Schaden bei den Metadaten der Platte, also Partitionstabelle etc. hindeuten. Daher wäre noch meine Frage, gibt es ein Programm, mit dem man diese überprüfen und ggf. reparieren kann? Stefan
Hi, Am Samstag, 3. Dezember 2005 02:43 schrieb Stefan Fricke:
-Schmutz (Der Besitzer ist Kettenraucher und hat mehrere Katzen - Entsprechend sah das Innenleben aus)
Ich kann Dir nicht sagen wo genau das Problem bei diesem Rechner liegt, aber meine Katze hat mir schon zwei Festplatten durch "anfassen" kaputt gemacht. Katzenhaare sind Gift für Elektrogeräte. Gruss Karl
Hallo, Am Sat, 03 Dec 2005, Stefan Fricke schrieb:
Koennte ein zu langes oder zu schlechtes Kabel sein (fuer den eingestellten (U)DMA Modus) bzw. ein nicht richtig sitzender Stecker.
s.o. Dass die Platte selbst hops geht vermute ich erstmal nicht, da bekommt man klassischweise einen Fehler mit 'IO-Error' oder so. Die Fehlernummer weiss ich aber nicht, zeig mal die andere Meldung. -dnh -- Digital files cannot be made uncopyable, any more than water can be made not wet. --Bruce Schneier on `copy protection' schemes
Am Samstag, 3. Dezember 2005 02:43 schrieb Stefan Fricke:
Sowas wie hda: dma_intr: error=0x40 { UncorrectableError }, LBAsect=xxxxxx, sector=yyyyyyyy und danach kernel: end_request: I/O error, dev 03:06 (hda), sector yyyyyyyy
Die Meldung bezeichnet einen Hardwaredefekt, reiserfsck darauf ist eher kontraproduktiv, sprich sehr mutig.
Aus meiner Erfahrung ist bei diesen Fehlermeldungen entweder die Verkabelung defekt, d.h. Kabel der Platte auf korrekten Sitz prüfen bzw. abziehen und wieder dran stecken (auf beiden Seiten) oder die Festplatte stirbt. Wenn der Fehler vorher nicht auftrat meistens letzteres.
Sollte man bei sowas nicht tun.
Nein. Wenn dann hat Platte beim erneuten Beschreiben des defekten Sektors diesen umbeleget, das machen die automatisch. Allerdings bleibt es oft nicht bei einem defekten Sektor, sondern es gehen mit der Zeit weitere kaputt. Solchen Platten würde ich nichts im Ansatz wichtiges mehr anvertrauen! Sie rettet man in der Regel mit dd_rescue in eine Datei, läßt darauf(sic!) dann erst reiserfsck laufen, mountet diese Datei über loopback und kopiert die wichtigen Dinge.
In dem Paket "smartmontools" gibt es das Programm "smartctl". "smartctl -a /dev/hda" zeigt dir sehr viel. Wichtig sind erstmal alle Werte des Typs "Pre-Fail". Davon insbesondere "Reallocated_Sector_Ct" und "UDMA_CRC_Error_Count". Ersterer zeigt dir die oben erwähnten, umbelegten Sektoren an. Letzterer zeigt die Fehler zwischen Platte und "Rechner" an, d.h. die ganz oben erwähnte Fehlermöglichkeit des Kabels. Wenn ersterer auf "0" steht läßt du die Platte sich am besten einfach selbst testen mit z.B. "smartctl -t long /dev/hda". Es wird dir auch mitgeteilt, wie lange das ungefähr dauern wird. Weiter unten steht das error log der Platte, dort wirst du in der Regel die DMA-Fehler finden, die auch der Kernel im Log ausgespuckt hat. Das self-test log steht ganz am Ende, worin du letztlich auch deinen Selbsttest aufgeführt finden wirst; wenn du Pech hast mit Angabe eines Fehlers bzw. der LBA an welcher der Fehler auftritt. In diesem Fall neue Platte kaufen und defekte Platte mit dd_rescue retten. Gruß Jan -- Bureaucracy is the art of making the possible impossible.
Hi, Am Samstag, 3. Dezember 2005 02:43 schrieb Stefan Fricke:
-Schmutz (Der Besitzer ist Kettenraucher und hat mehrere Katzen - Entsprechend sah das Innenleben aus)
Ich kann Dir nicht sagen wo genau das Problem bei diesem Rechner liegt, aber meine Katze hat mir schon zwei Festplatten durch "anfassen" kaputt gemacht. Katzenhaare sind Gift für Elektrogeräte. Gruss Karl
Hallo, Am Sat, 03 Dec 2005, Stefan Fricke schrieb:
Koennte ein zu langes oder zu schlechtes Kabel sein (fuer den eingestellten (U)DMA Modus) bzw. ein nicht richtig sitzender Stecker.
s.o. Dass die Platte selbst hops geht vermute ich erstmal nicht, da bekommt man klassischweise einen Fehler mit 'IO-Error' oder so. Die Fehlernummer weiss ich aber nicht, zeig mal die andere Meldung. -dnh -- Digital files cannot be made uncopyable, any more than water can be made not wet. --Bruce Schneier on `copy protection' schemes
Am Samstag, 3. Dezember 2005 02:43 schrieb Stefan Fricke:
Sowas wie hda: dma_intr: error=0x40 { UncorrectableError }, LBAsect=xxxxxx, sector=yyyyyyyy und danach kernel: end_request: I/O error, dev 03:06 (hda), sector yyyyyyyy
Die Meldung bezeichnet einen Hardwaredefekt, reiserfsck darauf ist eher kontraproduktiv, sprich sehr mutig.
Aus meiner Erfahrung ist bei diesen Fehlermeldungen entweder die Verkabelung defekt, d.h. Kabel der Platte auf korrekten Sitz prüfen bzw. abziehen und wieder dran stecken (auf beiden Seiten) oder die Festplatte stirbt. Wenn der Fehler vorher nicht auftrat meistens letzteres.
Sollte man bei sowas nicht tun.
Nein. Wenn dann hat Platte beim erneuten Beschreiben des defekten Sektors diesen umbeleget, das machen die automatisch. Allerdings bleibt es oft nicht bei einem defekten Sektor, sondern es gehen mit der Zeit weitere kaputt. Solchen Platten würde ich nichts im Ansatz wichtiges mehr anvertrauen! Sie rettet man in der Regel mit dd_rescue in eine Datei, läßt darauf(sic!) dann erst reiserfsck laufen, mountet diese Datei über loopback und kopiert die wichtigen Dinge.
In dem Paket "smartmontools" gibt es das Programm "smartctl". "smartctl -a /dev/hda" zeigt dir sehr viel. Wichtig sind erstmal alle Werte des Typs "Pre-Fail". Davon insbesondere "Reallocated_Sector_Ct" und "UDMA_CRC_Error_Count". Ersterer zeigt dir die oben erwähnten, umbelegten Sektoren an. Letzterer zeigt die Fehler zwischen Platte und "Rechner" an, d.h. die ganz oben erwähnte Fehlermöglichkeit des Kabels. Wenn ersterer auf "0" steht läßt du die Platte sich am besten einfach selbst testen mit z.B. "smartctl -t long /dev/hda". Es wird dir auch mitgeteilt, wie lange das ungefähr dauern wird. Weiter unten steht das error log der Platte, dort wirst du in der Regel die DMA-Fehler finden, die auch der Kernel im Log ausgespuckt hat. Das self-test log steht ganz am Ende, worin du letztlich auch deinen Selbsttest aufgeführt finden wirst; wenn du Pech hast mit Angabe eines Fehlers bzw. der LBA an welcher der Fehler auftritt. In diesem Fall neue Platte kaufen und defekte Platte mit dd_rescue retten. Gruß Jan -- Bureaucracy is the art of making the possible impossible.
participants (7)
-
Daniel Bauer
-
David Haller
-
Jan Ritzerfeld
-
Karl Sinn
-
Norbert Vohwinkel
-
Stefan Fricke
-
Wolfgang Golder