Re: Festplatte defekt oder nur das Filesystem
Jan Ritzerfeld wrote:
[...] Das steht im Gegensatz zu meinen Erfahrungen mit dem DFT, welcher genauso blind wie "smartctl -t long ..." war -> nix mit error code, angeblich war alles in Ordnung. [...] Wie ich schon geschrieben habe, bei den Deathstar-Platten sehe ich das absolut genauso. Laut SMART und(sic!) DFT alles toll, aber das BIOS findet die Platten halt recht selten. [...] Ich persönlich hatte bei meine drei oder vier defekten Deathstar-Platten nie das Glück, daß der DFT der Meinung war, daß die Platten defekt wären. Das hielt sie nicht davon ab, mit DMA-Fehlern im syslog um sich zu schmeißen und sich letztlich vorm BIOS zu verstecken, und selbst dann waren sie laut DFT vollkommen in Ordnung.
Vielleicht ist die Platte ja auch in Ordnung. DMA-Fehler sind nun einmal DMA-Fehler und muessen nicht unbedingt Plattenfehler sein. Genau so gut kann bei Deinen Problemen a) das BIOS einen Fehler haben, oder b) der Kernel ein DMA-Problem haben in Kombination mit den Platten, oder c) das Motherboard einen Defekt haben, oder d) die IDE-Kabel defekt sein, oder e) ... Wenn die Festplattentools der Hersteller nichts finden, die i.d.R. die SMART-Daten der Platte auslesen *und* einen Lese-Test machen, und wenn auch die smartmontools nichts finden (selbst mit self-test), dann solltest Du vielleicht mal drueber nachdenken... CU, Th.
Am Dienstag, 20. Dezember 2005 09:44 schrieb Thomas Hertweck:
(...). Wenn die Festplattentools der Hersteller nichts finden, die i.d.R. die SMART-Daten der Platte auslesen *und* einen Lese-Test machen, und wenn auch die smartmontools nichts finden (selbst mit self-test), dann solltest Du vielleicht mal drueber nachdenken...
Wenn die Platte auch noch komische Geräusche macht und eine IBM Deskstar ist, dann wird sie höchstwahrscheinlich kaputt sein. Naja, sorry, ich dachte der Name "Deathstar" würde den meisten schon genug sagen ... X-) Gruß Jan -- Mediocrity thrives on standardization.
Jan Ritzerfeld wrote:
[...]
Wenn die Platte auch noch komische Geräusche macht und eine IBM Deskstar ist, dann wird sie höchstwahrscheinlich kaputt sein. Naja, sorry, ich dachte der Name "Deathstar" würde den meisten schon genug sagen ... X-)
Ja, ich kenne die Geschichten und weiss, dass einige Deskstar-Serien maechtig Probleme hatten. Und? Ich habe gelernt, primaer mir selbst zu vertrauen und nicht den Informationen aus dritter Hand, die gerne die Runde machen... Bevor du fragst: $> hdparm -i /dev/hde /dev/hde: Model=IBM-DHEA-36481, FwRev=HP6OA20C, [...] [...] Ja, bei mir werkelt unter anderem eine aeltere IBM 6.4GB Deskstar Platte, und das seit mehreren Jahren ohne Probleme. So what?! CU, Th.
Am Dienstag, 20. Dezember 2005 22:37 schrieb Thomas Hertweck:
Jan Ritzerfeld wrote:
[...]
Wenn die Platte auch noch komische Geräusche macht und eine IBM Deskstar ist, dann wird sie höchstwahrscheinlich kaputt sein. Naja, sorry, ich dachte der Name "Deathstar" würde den meisten schon genug sagen ... X-)
Ja, ich kenne die Geschichten und weiss, dass einige Deskstar-Serien maechtig Probleme hatten.
DTLA und IC35L IIRC.
Und? Ich habe gelernt, primaer mir selbst zu vertrauen und
Habe ich geschrieben, daß ich das nicht mache? Die Platte hat die typischen Geräusche gemacht und dabei kamen die DMA-Fehler im syslog. Eindeutiger gehts kaum. Der Sysadmin der Firma für die ich arbeite hat so ähnlich geredet wie du, bis ihm dann auch seine IBMs anfingen wegzusterben. Zur Zeit sterben Maxtor-Platten nach anderthalb Jahren recht gerne.
nicht den Informationen aus dritter Hand, die gerne die Runde machen...
Meine Platte ist erst gestorben und dann habe ich die Informationen aus dritter Hand gefunden. Und glaub mir, ich habe danach nicht einfach die Platte weggeschmissen oder ähnliches sondern Tage versucht, Fehler in der Verkabelung o. ä. zu finden. Zusätzliche Kühlung hat auch nichts genutzt. Mehrmaliges DFT-Formatieren in verschiedenen Rechnern mit verschiedenen Kabeln, anderem BIOS ... halt das volle Programm.
(...). Ja, bei mir werkelt unter anderem eine aeltere IBM 6.4GB Deskstar Platte, und das seit mehreren Jahren ohne Probleme. So what?!
Ist ja auch die "falsche" Baureihe. Gruß Jan -- Beware of all enterprises that require new clothes.
Jan Ritzerfeld wrote:
[...]
DTLA und IC35L IIRC. [...]
Ach so, habe ich auch zu bieten: $> hdparm -i /dev/hdb /dev/hdb: Model=IBM-DTLA-307060, FwRev=TX8OA50C, [...] [...] $> hdparm -i /dev/hdg /dev/hdg: Model=IC35L120AVVA07-0, FwRev=VA6OA52A, [...] [...] Laufen beide seit Jahren ohne Probleme. :-) Th.
Am Dienstag, 20. Dezember 2005 23:33 schrieb Thomas Hertweck:
(...). Laufen beide seit Jahren ohne Probleme.
:-)
Genau das ist der Grund warum ich nicht von Anfang an einfach IBM-Bashing betrieben habe sondern die Problematik nur angedeutet habe: Viele haben keinerlei Probleme mit diesen Platten. Ich mag Aussagen wie "IBM-Platten sind alle scheiße" genauso wenig wie "ReiserFS ist scheiße". Was ich allerdings unterschreiben kann ist: Wenn plötzlich (d. h. nach langer Zeit der Problemlosigkeit) DMA-Fehler im Log auftreten, dann ist im günstigsten Fall das Kabel locker aber oft eher die Platte das Problem. Sprich, solche Meldungen sollte man nicht auf die leichte Schulter nehmen. Gruß Jan -- Optimization hinders evolution.
Hallo, Am Wed, 21 Dec 2005, Jan Ritzerfeld schrieb:
Am Dienstag, 20. Dezember 2005 23:33 schrieb Thomas Hertweck: [IBM DHEA, DTLA, IC35...]
(...). Laufen beide seit Jahren ohne Probleme.
*g* Meine DTLA/60G hat's allerdings schnell verwischt ;) Das ist IIRC die "Deathstar" Serie. Allerdings hatten auch viele DHEA Probleme, und meine DHEA mit 6.4 GB war eine davon.
Genau das ist der Grund warum ich nicht von Anfang an einfach IBM-Bashing betrieben habe sondern die Problematik nur angedeutet habe: Viele haben keinerlei Probleme mit diesen Platten. Ich mag Aussagen wie "IBM-Platten sind alle scheiße" genauso wenig wie "ReiserFS ist scheiße".
Du haettest aber schreiben sollen, dass du z.B. das Kabel schon geprueft hast und dass du ne "verdaechtige" IBM hast. Generell gilt bei solchen DMA-Fehlern das, was ich in meiner letzten Mail schrieb, dass es (ausser bei verdaechtigen Platten) wahrscheinlicher ist, dass es ein zu langes / schlechtes Kabel ist, schlechter Kontakt an den Steckern etc. pp. Bei I/O-Fehlern ist das was anderes. Aber es gibt viele dieser Platten, die jahrelang zuverlaessig laufen. Da gibt es wohl eine Serienstreuung zwischen "DOA" und "zuverlaessig ueber Jahre".
Was ich allerdings unterschreiben kann ist: Wenn plötzlich (d. h. nach langer Zeit der Problemlosigkeit) DMA-Fehler im Log auftreten, dann ist im günstigsten Fall das Kabel locker aber oft eher die Platte das Problem. Sprich, solche Meldungen sollte man nicht auf die leichte Schulter nehmen.
ACK. Es kommt aber auch auf die Fehlermeldung und die Geraeusche der Platte an. Meine DHEA und DTLA haben jeweils "Laut" gegeben, besonders die "Deathstar" DTLA mit dem wohl typischen wiederholten "*schnieeek* *schnieeek* *schnieeek* *KLACK*" beim vergeblichen Versuch die defekten Sektoren noch zu lesen. Evtl. ungewoehnlichen Geraeusche gehoeren einfach mit dazu wenn man einen Fehler beschreibt. Verdammt noch mal!@#! -dnh, der sich gerade nicht erinnert ob du der OP warst, ggfs. entschuldige ich mich und meine natuerlich den OP mit der ungenauen Beschreibung. PS: Reiserfs ist scheisse *nananananaaaanaaaa* *zungerausstreck* -- [Schild "Cafe, Hasret"] Tja, über das e hat er [der Kapostroph] nicht mehr gepaßt, und rechts konnte er sich nicht lange halten, pardauz. -- Philipp Oelwein auf http://www.apostroph.de/display.php?k=willenlos&p=2
Am Mittwoch, 21. Dezember 2005 06:23 schrieb David Haller:
Hallo,
Am Wed, 21 Dec 2005, Jan Ritzerfeld schrieb:
Am Dienstag, 20. Dezember 2005 23:33 schrieb Thomas Hertweck:
[IBM DHEA, DTLA, IC35...]
(...). Laufen beide seit Jahren ohne Probleme.
*g* Meine DTLA/60G hat's allerdings schnell verwischt ;)
Meine Austausch-IC35... auch nach kürzester Zeit. Naja, jetzt werkelt sie als Backup-Platte, die nur jede Woche "angeworfen" wird.
Das ist IIRC die "Deathstar" Serie. Allerdings hatten auch viele DHEA Probleme, und meine DHEA mit 6.4 GB war eine davon.
Genau das ist der Grund warum ich nicht von Anfang an einfach IBM-Bashing betrieben habe sondern die Problematik nur angedeutet habe: Viele haben keinerlei Probleme mit diesen Platten. Ich mag Aussagen wie "IBM-Platten sind alle scheiße" genauso wenig wie "ReiserFS ist scheiße".
Du haettest aber schreiben sollen, dass du z.B. das Kabel schon geprueft hast und dass du ne "verdaechtige" IBM hast.
Eigentlich ging es irgendwann "nur" noch um die Zuverlässigkeit von SMART. Ganz unabhängig von konkreten Problemen. Sprich, ich bin erst später in den Thread eingestiegen, mit dem Problem des OP hatte das zugegebnermaßen nicht mehr sooo viel zu tun.
Generell gilt bei solchen DMA-Fehlern das, was ich in meiner letzten Mail schrieb, dass es (ausser bei verdaechtigen Platten) wahrscheinlicher ist, dass es ein zu langes / schlechtes Kabel ist, schlechter Kontakt an den Steckern etc. pp. Bei I/O-Fehlern ist das was anderes.
"DriveReady SeekComplete" gefolgt von "end_request: I/O error, dev...".
Aber es gibt viele dieser Platten, die jahrelang zuverlaessig laufen. Da gibt es wohl eine Serienstreuung zwischen "DOA" und "zuverlaessig ueber Jahre".
Und soweit ich mich erinnere konnte man kein Muster erkennen. Egal ob die Platten 24/7 in Betrieb waren oder nicht optimal gekühlt ... Irgendwie schienen die Ausfälle von sowas komplett unabhängig zu sein. Meine letzte IBM starb sogar erst nachdem ich sie vorsorglich besser gekühlt/belüftet hatte.
Was ich allerdings unterschreiben kann ist: Wenn plötzlich (d. h. nach langer Zeit der Problemlosigkeit) DMA-Fehler im Log auftreten, dann ist im günstigsten Fall das Kabel locker aber oft eher die Platte das Problem. Sprich, solche Meldungen sollte man nicht auf die leichte Schulter nehmen.
ACK.
Es kommt aber auch auf die Fehlermeldung und die Geraeusche der Platte an. Meine DHEA und DTLA haben jeweils "Laut" gegeben, besonders die "Deathstar" DTLA mit dem wohl typischen wiederholten "*schnieeek* *schnieeek* *schnieeek* *KLACK*" beim vergeblichen Versuch die defekten Sektoren noch zu lesen.
Hehe. Mein damalige Freundin hatte ich so darauf konditioniert, daß ihr bei diesem Geräusch das Blut in den Adern gefroren ist. Nach zwei Platten mit diesem Geräusch und der nachfolgenden, entsprechend panischen Reaktion meinerseits irgendwie kein Wunder.
Evtl. ungewoehnlichen Geraeusche gehoeren einfach mit dazu wenn man einen Fehler beschreibt. Verdammt noch mal!@#!
Klar, ich wollte aber nur "einstreuen", daß eine sterbende bis tote Platte via SMART durchaus noch behaupten kann, daß alles in bester Ordnung ist. Trotz komischer Geräusche. Und trotz ihrer zeitweise fehlender Fähigkeit vom BIOS erkannt zu werden. :)
-dnh, der sich gerade nicht erinnert ob du der OP warst, ggfs. entschuldige ich mich und meine natuerlich den OP mit der ungenauen Beschreibung.
Ich hatte mich in den Thread nur eingemischt und bin nicht der OP. Zudem bin ich nicht sonderlich empfindlich, aber meine Andeutungen später im Thread waren in der Tat und absichtlich ungenau. :)
PS: Reiserfs ist scheisse *nananananaaaanaaaa* *zungerausstreck*
Hehe. :-D Gruß Jan -- The mind is like a parachute, it works better when it's open.
* Jan Ritzerfeld wrote on Tue, Dec 20, 2005 at 23:21 +0100:
DTLA und IC35L IIRC.
Die IBM Teile mit den Servo-Problemen, was erst abgestritten und dann später angeblich durch eine Firmware, die hin- und wieder die Köpfe bewegt, umgangen wurde? War die IC35 Serie nicht die mit dem Fix (die also schon wieder ging)? Na, ist ja auch egal. Sind eh /alles/ Verschleissteile. Mir sind jedenfalls verschiedenste Platten von verschiedensten Herstellern gestorben...
Zur Zeit sterben Maxtor-Platten nach anderthalb Jahren recht gerne.
Prima, da bin ich vielleicht wieder dran, hab so ein Ding, und auch noch privat... So eine Schwach-Serie kommt bei RAID gut. Hatte mal ein RAID5 über drei Platten plus Spare. Eine Platte starb nach ein paar Monaten, na gut, gewechselt. Noch ein paar Monate später starben zwei recht schnell hintereinander. Dank Spare war das RAID ja noch in Ordnung (auf zwei Platten). Die dritte aus der Serie fing aber auch schon an, für bestimmte Sektoren länger zu brauchen - ihr kennt das - fiel mir beim Filesystemcopy auf. Na, dann halt neuen Server und Backup rückgespielt. Der alte Server hielt glücklicherweise lange genug durch. Nach reboot und dem fsck ging dann einiges nicht mehr (libs kaputt, was weiss ich), --> troz der Tolerierung von zwei Plattenausfällen "nur gerade mit dem blauen Auge davongekommen" (sonst trotz Backup ja längere Ausfallzeit). Na, kommt davon, wenn man in ein RAID gleiche Platten einbaut - man soll ja verschiedene nehmen. Ein anderes RAID - übrigens mit 4 DTLA und 2 IC35 Platten[1] (waren ursprünglich 6 DTLA :)) lief nach den zwei Ausfällen jahrelang (damals war SuSE 7.1 neu, müsste also schon ein Weilchen her sein ;)) Problemlos. Gut, das reiserfs dadrauf ist auch keine so gute Idee, aber ext3 gab's ja damals noch nicht. Gibt da ein paar Files, die man da nicht lesen sollte (kernel PANIC). Beispielsweise /install/linux/suse/7.1 oder sowas. "chmod 0" gemacht, liest keiner mehr :) Diese RAID hat jetzt eigentlich keine Funktion mehr - aber läuft... Weiss nicht, ob man da ein System erkennen kann, ausser vielleicht Murphys Law... oki, Steffen [1] falls mich meine Erinnerung nicht täuscht, aber den dort verbauten Platten wurde jedenfalls so ein Servo-Problem oder weiss ich was nachgesagt -- Dieses Schreiben wurde maschinell erstellt, es trägt daher weder Unterschrift noch Siegel.
participants (4)
-
David Haller
-
Jan Ritzerfeld
-
Steffen Dettmer
-
Thomas Hertweck