Interpretation von DMA-Fehlermeldungen
Hallo, heute morgen habe ich ein DVD ISO-image (auf hdb) erstellt, als die Maus plötzlich ruckelte. Da das beim ISO-Erstellen normalerweise nicht passiert und cron gerade aus war, wunderte ich mich etwas. Als ich kwrite öffnete, waren dessen Einstellungen auf die Standard-Werte zurückgesetzt, was vorher noch nie passiert war. Heute mittag bootete ich wieder ganz normal und mir wurde gemeldet, dass meine Home-Partition (ext3) einen Dateisystemfehler hat. Der wurde auch direkt korrigiert. Also sehe ich mir las nächstes die SMART-Werte der Platte an, da ich in letzter Zeit bei einer anderen Platte Probleme hatte, und finde die unten angehängte Meldung. Die Attribute sind alle ok. Knoppix 4.0 gebootet, alle Dateisysteme gecheckt. Merkwürdigerweise wurde bei allen ersten Durchläufen von ext3-Partitionen eine Änderung am FS vorgenommen, mir aber trotz "-v" nicht mitgeteilt, was da geändert wurde. Nach dem erneuten Booten kam ich endlich mal auf die Idee, auch in /var/log/messages nachzusehen (spät, aber immerhin... ;-)). Meldungen sind unten angehängt. Die Platte hdb ist noch recht neu und wurde bisher praktisch nicht benutzt (Zeitmangel). Warum ich diese Mail gepostet habe: Ich kann die Fehler nicht interpretieren. Sieht es Eurer Meinung nach eher nach einer Inkompatibilität zwischen den Festplatten/IDE-Controller, einem Defekt oder einem schlechten Kabel aus? Diese DMA DriveReady SeekComplete Errors sind zum ersten Mal in der log Datei aufgetaucht. Vielen Dank schon mal für alle Antworten. Gruß, Christian P.S.: System: SuSE 9.0 MoBo: Asus P4PE --- hwinfo --disk --- 16: IDE 00.0: 10600 Disk [Created at ide.127] Unique ID: nBbg._Ho2Fz646AA Parent ID: 3p2J.ZgWbAdRicUC Hardware Class: disk Model: "ST3120022A" Device: "ST3120022A" Revision: "3.06" Serial ID: "3JT09HAB" Driver: "ide-disk" Device File: /dev/hda Geometry (Physical): CHS 14593/255/63 Geometry (Logical): CHS 14593/255/63 Size: 234441648 sectors a 512 bytes Cache: 2048 kb Config Status: cfg=yes, avail=yes, need=no, active=unknown Attached to: #10 (IDE interface) 17: IDE 01.0: 10600 Disk [Created at ide.127] Unique ID: ENrk.oE86739X+95 Parent ID: 3p2J.ZgWbAdRicUC Hardware Class: disk Model: "SAMSUNG SP2014N" Device: "SAMSUNG SP2014N" Revision: "VC100-33" Serial ID: "S088J1RY605216" Driver: "ide-disk" Device File: /dev/hdb Geometry (Physical): CHS 24321/255/63 Geometry (Logical): CHS 24321/255/63 Size: 390721968 sectors a 512 bytes Cache: 8192 kb Config Status: cfg=no, avail=yes, need=no, active=unknown Attached to: #10 (IDE interface) --- Ende: hwinfo --disk --- --- Ausschnitt aus smartctl -a /dev/hda --- SMART Error Log Version: 1 ATA Error Count: 1 CR = Command Register [HEX] FR = Features Register [HEX] SC = Sector Count Register [HEX] SN = Sector Number Register [HEX] CL = Cylinder Low Register [HEX] CH = Cylinder High Register [HEX] DH = Device/Head Register [HEX] DC = Device Command Register [HEX] ER = Error register [HEX] ST = Status register [HEX] Powered_Up_Time is measured from power on, and printed as DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes, SS=sec, and sss=millisec. It "wraps" after 49.710 days. Error 1 occurred at disk power-on lifetime: 3618 hours (150 days + 18 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 84 51 01 c6 a5 a2 e0 Error: ICRC, ABRT 1 sectors at LBA = 0x00a2a5c6 = 10659270 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 00 08 bf a5 a2 e0 00 02:35:02.868 READ DMA EXT 35 00 08 71 fc a4 e0 00 02:35:02.853 WRITE DMA EXT 35 00 08 29 3e a4 e0 00 02:35:02.851 WRITE DMA EXT 35 00 10 21 3e a4 e0 00 02:35:02.545 WRITE DMA EXT 35 00 08 a9 3c a4 e0 00 02:35:02.544 WRITE DMA EXT --- Ende: Ausschnitt aus smartctl -a /dev/hda --- --- /var/log/messages --- Aug 27 03:38:01 client2 kernel: hdb: dma_timer_expiry: dma status == 0x61 Aug 27 03:38:11 client2 kernel: hdb: timeout waiting for DMA Aug 27 03:38:11 client2 kernel: hdb: timeout waiting for DMA Aug 27 03:38:11 client2 kernel: hdb: (__ide_dma_test_irq) called while not waiting Aug 27 03:38:11 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:11 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948002880, high=20560, low=8441920, sector=524288 Aug 27 03:38:11 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 524288 Aug 27 03:38:12 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:12 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948002880, high=20560, low=8441920, sector=0 Aug 27 03:38:12 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 0 Aug 27 03:38:12 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:12 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948002880, high=20560, low=8441920, sector=8 Aug 27 03:38:12 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 8 Aug 27 03:38:19 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:19 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948265152, high=20560, low=8704192, sector=262176 Aug 27 03:38:19 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 262176 Aug 27 03:38:19 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:19 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948265152, high=20560, low=8704192, sector=262216 Aug 27 03:38:19 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 262216 Aug 27 03:38:19 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:19 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344679829568, high=20544, low=8704064, sector=262592 Aug 27 03:38:19 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 262592 Aug 27 03:38:19 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:19 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948265024, high=20560, low=8704064, sector=262600 Aug 27 03:38:19 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 262600 Aug 27 03:38:19 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:19 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=344948265168, high=20560, low=8704208, sector=311312 Aug 27 03:38:19 client2 kernel: end_request: I/O error, dev 03:05 (hda), sector 311312 Aug 27 03:38:19 client2 kernel: hda: dma_intr: status=0x51 { DriveReady SeekComplete Error } Aug 27 03:38:19 client2 kernel: hda: dma_intr: error=0x90 { BadSector SectorIdNotFound }, LBAsect=275960090832, high=16448, low=8442064, sector=12736944 Aug 27 03:38:19 client2 kernel: end_request: I/O error, dev 03:06 (hda), sector 12736944 Aug 27 03:38:19 client2 kernel: vs-13050: reiserfs_update_sd: i/o failure occurred trying to update [30 810933 0x0 SD] stat datahdb: status timeout: status=0xd0 { Busy } Aug 27 03:38:19 client2 kernel: Aug 27 03:38:19 client2 kernel: hda: DMA disabled Aug 27 03:38:19 client2 kernel: hdb: drive not ready for command Aug 27 03:38:19 client2 kernel: ide0: reset: success Aug 27 03:38:58 client2 kernel: EXT3-fs error (device ide0(3,5)): ext3_free_blocks: bit already cleared for block 68442 Aug 27 03:39:09 client2 kernel: spurious 8259A interrupt: IRQ7. --- Ende: /var/log/messages ---
Hallo Christian, Am Sonntag, 28. August 2005 16:31 schrieb Christian Schneider: [...]
Warum ich diese Mail gepostet habe: Ich kann die Fehler nicht interpretieren. Sieht es Eurer Meinung nach eher nach einer Inkompatibilität zwischen den Festplatten/IDE-Controller, einem Defekt oder einem schlechten Kabel aus? Diese DMA DriveReady SeekComplete Errors sind zum ersten Mal in der log Datei aufgetaucht.
Nun, ich habe 3 verschiedenen Samsung-Platten (SP1213N, SV1604N und SP1614N) bei mir im Rechner und bei allen dreien habe ich diese Meldung - da dies jedoch nur beim booten auftritt und nicht im laufenden Betrieb mache ich mir darüber keine weiteren Sorgen. Ich gehe davon aus, dass es an dem ASUS Board liegt (A7N8X Deluxe). Weitere von Dir genannte Symptome habe ich bei mir allerdings noch nicht beobachtet. Muss also nicht unbedingt miteinander Zusammenhängen. Übrigens habe ich anfangs auch versucht, diese Meldungen wegzubekommen. Aber auch Kabeltauschen brachte nichts...
Vielen Dank schon mal für alle Antworten.
Gruß, Christian
[...] Gruss Mario
Mario van der Linde schrieb:
Nun, ich habe 3 verschiedenen Samsung-Platten (SP1213N, SV1604N und SP1614N) bei mir im Rechner und bei allen dreien habe ich diese Meldung
Kann ich bestätigen, eine SV0802N gibt bei mir an drei verschiedenen Mainboards (Gigabyte GA-6BXE mit SiL0680A Controller, GA-6VXD7-4X und Asus A8N-E) genau diese Meldung { DriveReady SeekComplete Error } aus. Allerdings deutet die zweite Meldung { BadSector SectorIdNotFound } darauf hin dass tatsächlich ein Fehler aufgetreten ist. Das und die anderen Meldungen sind kein direktes Anzeichen für einen Hardwaredefekt, sondern können auch eine Inkompatibilität zwischen Festplatte und Controller bedeuten (kam bei mir auch schon vor). Dadurch können auch die Dateisystemfehler entstehen von denen Christian Schneider berichtet hat. Um einen Defekt an der Platte aber definitiv ausschließen zu können, würde ich das Teil mal (falls möglich) an einem anderen Rechner betreiben (eventuell ohne DMA-Modus) und ganz dringend einen Sektorcheck durchführen. Festplatten von Samsung sind schon durch manche Bewertungen dafür bekannt geworden, gelegentlich wenige Wochen nach Inbetriebnahme auszufallen.
Hallo Philipp, Am Sonntag, 28. August 2005 19:36 schrieb Philipp Gröschler:
Um einen Defekt an der Platte aber definitiv ausschließen zu können, würde ich das Teil mal (falls möglich) an einem anderen Rechner betreiben (eventuell ohne DMA-Modus) und ganz dringend einen Sektorcheck durchführen. [...]
Hmm, ich habe gerade alles zu Ende gebaut und keine große Lust, wieder die Rechner auseinander zu nehmen... :-( Der Sector-Check (= "long" SMART selftest) findet keine Probleme. Alle Attribute im grünen Bereich und der Raw Value des "Reallocated_Sector_Ct" ist bei beiden Platten "0".
Festplatten von Samsung sind schon durch manche Bewertungen dafür bekannt geworden, gelegentlich wenige Wochen nach Inbetriebnahme auszufallen.
Mach mir keine Angst. Mir wurde die Platte gerade deshalb verkauft, weil die Samsung-Platten momemtan wohl nicht überdurchschnittlich oft versagen. Das einzige, was mich bei den Samsung-Platten (in einem anderen PC läuft seit kurzem eine entsprechende 80GB Platte) im Gegensatz zu der "alten" Seagate-Platte nervt, ist ihre Lautstärke (stärkeres Virbrieren und deutlich lautere Lese-/ Schreibkopf-Aktivität). Da das aber scheinbar bei beiden Samsung-Platten auftritt, handelt es sich vermutlich um ein normales Verhalten. Wahrscheinlich bin ich von der Seagate-Lautstärke bloß etwas verwöhnt. ;-) Gruß, Christian
Hallo, Am Sonntag, 28. August 2005 23:14 schrieb Christian Schneider: [...]
Mach mir keine Angst. Mir wurde die Platte gerade deshalb verkauft, weil die Samsung-Platten momemtan wohl nicht überdurchschnittlich oft versagen. Das einzige, was mich bei den Samsung-Platten (in
Da kann ich Dich eigentlich beruhigen: Mit Samsung habe ich im Gegensatz zu Maxtor oder IBM oder auch Seagate noch keinen Ausfall gehabt. (Nein das soll jetzt nicht in die Richtung "Welcher Plattenhersteller ist der beste" abgleiten!)
einem anderen PC läuft seit kurzem eine entsprechende 80GB Platte) im Gegensatz zu der "alten" Seagate-Platte nervt, ist ihre Lautstärke (stärkeres Virbrieren und deutlich lautere Lese-/ Schreibkopf-Aktivität). Da das aber scheinbar bei beiden
Meine sind alle flüsterleise. Mit hdparm kannst Du die Lautstärke beeinflussen. Z.B. linux:~ # hdparm -M 128 /dev/hdX Je kleiner der Parameter (zw. 128 und 254) desto leiser die Platte. Der Performanceverlust liegt dadurch bei 0-1% (ist also zu vernachlässigen)...
Samsung-Platten auftritt, handelt es sich vermutlich um ein normales Verhalten. Wahrscheinlich bin ich von der Seagate-Lautstärke bloß etwas verwöhnt. ;-)
Gruß, Christian
Gruss Mario
Christian Schneider schrieb:
Hallo Philipp,
Mach mir keine Angst. Mir wurde die Platte gerade deshalb verkauft, weil die Samsung-Platten momemtan wohl nicht überdurchschnittlich oft versagen. Das einzige, was mich bei den Samsung-Platten (in einem anderen PC läuft seit kurzem eine entsprechende 80GB Platte) im Gegensatz zu der "alten" Seagate-Platte nervt, ist ihre Lautstärke (stärkeres Virbrieren und deutlich lautere Lese-/ Schreibkopf-Aktivität).
Ich wollte auch keine Angst machen oder diese leidige Diskussion lostreten, nur erwähnen dass in den einschlägigen Bewertungsforen öfters mal zu lesen ist dass diese Dinger, wenn sie denn ausfallen, es recht bald nach dem Kauf tun. Natürlich sind die negativen Bewertungen immer in der Überzahl wenn man es relativ betrachtet, Leute die mit ihrem Produkt zufrieden sind sehen darin meist weniger einen Anlass es anderen mitzuteilen. Was das Laufgeräusch angeht wundert mich das doch etwas. Ich hab auch zwei 80er von Samsung hier (die mit 5400 UpM, die mit 7200 sind im Datenblatt aber mit genau dem gleichen Schallpegel angegeben) und die sind aus einem Meter Abstand, frei"hängend" auf dem Schreibtisch, nicht mehr zu hören. Beim Gehäuseeinbau hab ich auch festgestellt dass das Zugriffsgeräusch plötzlich sehr stark wahrnehmbar ist, dann hab ich mir die zwei alten original "no vibes" HDD-Dämpfungsrahmen aus dem Regal geschnappt und die Samsungs dort eingebaut. Seitdem herrscht Totenstille.
Hallo, Am Sun, 28 Aug 2005, Christian Schneider schrieb:
Am Sonntag, 28. August 2005 19:36 schrieb Philipp Gröschler:
Um einen Defekt an der Platte aber definitiv ausschließen zu können, würde ich das Teil mal (falls möglich) an einem anderen Rechner betreiben (eventuell ohne DMA-Modus) und ganz dringend einen Sektorcheck durchführen. [...]
Hmm, ich habe gerade alles zu Ende gebaut und keine große Lust, wieder die Rechner auseinander zu nehmen... :-(
Der Sector-Check (= "long" SMART selftest) findet keine Probleme. Alle Attribute im grünen Bereich und der Raw Value des "Reallocated_Sector_Ct" ist bei beiden Platten "0".
Der von hda?
Festplatten von Samsung sind schon durch manche Bewertungen dafür bekannt geworden, gelegentlich wenige Wochen nach Inbetriebnahme auszufallen.
Mach mir keine Angst. Mir wurde die Platte gerade deshalb verkauft, weil die Samsung-Platten momemtan wohl nicht überdurchschnittlich oft versagen.
Aeh? Hallo? Die "BadSector"-Fehler waren von hda, also der Seagate! -dnh -- Fighting for peace is like fucking for virginity.
Hallo, Am Montag, 29. August 2005 19:18 schrieb David Haller:
Am Sun, 28 Aug 2005, Christian Schneider schrieb:
Der Sector-Check (= "long" SMART selftest) findet keine Probleme. Alle Attribute im grünen Bereich und der Raw Value des "Reallocated_Sector_Ct" ist bei beiden Platten "0".
Der von hda?
Sowohl von hda als auch von hdb. Beide Platte lassen keinerlei Probleme an ihren SMART-Attributen erkennen. Die Frage ist, wie aussagekräftig das ist.
Festplatten von Samsung sind schon durch manche Bewertungen dafür bekannt geworden, gelegentlich wenige Wochen nach Inbetriebnahme auszufallen.
Mach mir keine Angst. Mir wurde die Platte gerade deshalb verkauft, weil die Samsung-Platten momemtan wohl nicht überdurchschnittlich oft versagen.
Aeh? Hallo? Die "BadSector"-Fehler waren von hda, also der Seagate!
Das ist mir schon klar. Das mit den Ausfällen von Samsung-Platten habe ich auch eher allgemein verstanden. Außerdem ist mir jedenfalls nicht ganz klar, welche Platte hier der "Übeltäter" ist. Immerhin hatte hdb zuerst Probleme in Bezug auf DMA gehabt, dann erst ist der Fehler von hda aufgetreten (siehe Log-Meldungen). Gruß, Christian
Hallo Mario! Am Sonntag, 28. August 2005 17:11 schrieb Mario van der Linde:
Hallo Christian,
Am Sonntag, 28. August 2005 16:31 schrieb Christian Schneider: [...]
Warum ich diese Mail gepostet habe: Ich kann die Fehler nicht interpretieren. Sieht es Eurer Meinung nach eher nach einer Inkompatibilität zwischen den Festplatten/IDE-Controller, einem Defekt oder einem schlechten Kabel aus? Diese DMA DriveReady SeekComplete Errors sind zum ersten Mal in der log Datei aufgetaucht.
Nun, ich habe 3 verschiedenen Samsung-Platten (SP1213N, SV1604N und SP1614N) bei mir im Rechner und bei allen dreien habe ich diese Meldung - da dies jedoch nur beim booten auftritt und nicht im laufenden Betrieb mache ich mir darüber keine weiteren Sorgen.
Sind die bei dir auch mit "BadSector SectorIdNotFound"? Leider trat das bei mir im laufenden Betrieb mitten drin auf und so ein Plattenhänger + IDE-Reset ist nicht sehr gesund für die lieben Daten (wie man sieht, beschwert sich das Dateisystem ;-)).
Ich gehe davon aus, dass es an dem ASUS Board liegt (A7N8X Deluxe). Weitere von Dir genannte Symptome habe ich bei mir allerdings noch nicht beobachtet. Muss also nicht unbedingt miteinander Zusammenhängen. Übrigens habe ich anfangs auch versucht, diese Meldungen wegzubekommen. Aber auch Kabeltauschen brachte nichts...
Dann stelle ich das erst mal hinten an.
Gruss Mario
Gruß, Christian
Hallo, Am Sonntag, 28. August 2005 16:31 schrieb Christian Schneider: [...]
03:39:09 client2 kernel: spurious 8259A interrupt: IRQ7. --- Ende: /var/log/messages ---
Ich habe gerade Davids Post von gestern gelesen und mir daraufhin noch mal Dein erstes Posting angeschaut... Unabhängig von Deinem eigentlichen Problem: Wenn Du keinen Drucker o.ä. an Deiner Parralelschnittstelle hängen hast schalte diese mal im BIOS ab. Dann verschwindet diese o.a. Meldung... Zu Deinem Problem: Du solltest über einen Tausch von hda und ein Backup nachdenken. hdb wird dann keine Probleme mehr verursachen. Gruss Mario
participants (4)
-
Christian Schneider
-
David Haller
-
Mario van der Linde
-
Philipp Gröschler