Am Dienstag, 20. Dezember 2005 20:07 schrieb Steffen Dettmer:
* Jan Ritzerfeld wrote on Mon, Dec 19, 2005 at 22:38 +0100:
Am Samstag, 17. Dezember 2005 23:29 schrieb Steffen Dettmer:
[...]
würde ich nicht unbedingt mit einer guten (sondern mit einer billigen) SMART-Implementierung rechnen.
Wenn es nur das wäre, der Drive-Fitness-Test scheint keinen Deut besser zu sein, bzw. sich auf die SMART-Implementierung der Platten zu verlassen. So ein Tool kann man sich unter dann auch gleich sparen, da hat man ja smartmontools. Interessant ist höchstens noch dftview, damit kann man die Logs, welcher der DFT auf eine eingelegte Floppy schreibt aufschlüssen.
Selbst wenn man von "aussen" alle Sektoren liest und schreibt (letzteres geht i.d.R. schon ohne Datenverlust, man kann ja lesen, schreiben, restaurieren), weiss man noch lange nicht, was sich denn die Plattenfirmware nu genau denkt.
Eben. Die mappt eh fleißig defekte Sektoren um. Und von diese Reservesektoren gibt es wohl ne ganze Menge. Richtig paranoid ist ja IIRC die Man-Page zu wipe.
Würde mich ja mal interessieren, wie gross so ne Plattenfirmware eigentlich ist.
Gute Frage, der gesamte Installer ist natürlich riesig: http://www-307.ibm.com/pc/support/site.wss/document.do?sitestyle=lenovo&lndocid=MIGR-43972
Wäre nicht überrascht, wäre es ein komplexes Stück Software (mit den naturgemäss zahlreich vorhandenen Bugs).
Hehe, sowas: http://www.heise.de/security/artikel/60711/0 ? Trotzdem sehe ich die Plattenfirmware als noch relativ fehlerfrei an, normale Applikationen stürzen deutlich häufiger ab. Gut, Autos werden auch immer buganfälliger, aber im Vergleich zu "normaler" Software geht das ja noch.
Gaaaanz früher - ich glaub bei MFM Platten -
So wie die Floppys für den C64 und den Amiga? :)
gabs Tools, die haben jeden Sektor mehrfach gelesen, die Sektor-Prüfdaten (wie auch immer die korrekt heissen) geprüft (die man heute meines Wissens nach überhaupt nicht mehr aus einer Platte rauskriegt). (...).
Das wird echt schon lang her sein, oder? Also vor SCSI-Bus-Platten.
Irgendwie wirkt daher ein "Test von aussen" etwa so, als ob ich Motorabnutzung "messe", in den ich probiere, ob das Auto noch von Hamburg nach München fahren kann. Kommt es an, weiss ich nicht, ob der Motor kurz vor dem Tot ist, das Öl auf "Minimal" steht und das Auto vielleicht in Berlin in einer Werkstatt war (gut, ein Blick ins Wartungs-("Smart")-Scheckheft sollte einen reallocate-Eintrag haben, FALLS denn das Scheckheft überhaupt gepflegt wird)...
So ähnlich sehe ich das auch. Daher rate ich von einem Test von außen eher ab, also z. B. mit badblocks, um frühzeitig Fehler zu finden. Wenn der Selbstest der Platte sagt, daß alles okay sei, wird die Platte bestimmt nicht dem badblocks-Programm plötzlich Fehler offenbaren (sondern die Sektoren stillschweigen ummappen o. ä.). Mit dftview kann man dem DFT-Logs allerdings nette Details entlocken, welche meines Wissens auch nicht über SMART propagiert werden: "Defect map", "Time-ordered relocations", "Scratch list" und "Problematic LBA list". Deine Skepsis gegenüber SMART ist also in der Tat angebracht, die herstellerspezifischen Tests sind detailierter, aber halt auch nur mit spezieller Software; die oben genannten Daten verrät der DFT nämlich auch nicht wirklich.
(...).
Es gilt schon prinzipiell nur diese Richtung: SMART sagt kaputt -> die Platte ist wohl kaputt
In der Praxis sagt SMART vermutlich meistens gar nichts, weil die Platten gar nicht mehr antworten :)
Der war gut! :D
Weiss nicht, vielleicht spielen da auch Gewährleistungsgründe ne Rolle. Hat eine Platte Fehlereinträge etc., könnte ich sie ja tauschen wollen. Überzeugenden Gerüchten zufolge haben Platte eh /immer/ Fehler, weil das eine Staubkorn pro Kubikmeter irgendwo dann doch ein Loch geschlagen hat, diese aber automatisch reallokiert werden, so dass man es nicht sieht.
Ohne die Schwelle zu kennen, ab wann der SMART-Wert, der angibt wieviele Sektoren umgemappt wurden, erhöht wird, ist ein Wert von 0 nicht sonderlich vertrauenserweckend. Ein Wert von größer als 0 ist IMHO aber auch ohne Kenntnis der Schwelle besorgniserregend, denn SMART schönt die Werte eher.
Früher waren Aufkleber mit der "defect block list" drauf, heute ist das in Software versteckt. Aber der gleiche Fakt. Schon alleine, dass man diese im SMART nicht sieht, zeigt ja, dass SMART "lügt".
Klar, die Folgerung "SMART sagt ok -> Platte ist ok" kann nie richtig sein; aber unabhängig davon wie ehrlich SMART ist.
So kann man nicht einschätzen, ob man orginal 5 kaputte Sektoren (gute Platte) oder 50 (schlechte Platte - Zahlen geraten) hatte. Vermutlich eher 50, weil die mit 5 vermutlich ein SCSI Interface bekommen haben, um überhaupt irgendein Argument zu haben, warum Platten mit solchen Kontrollern plötzlich deutlich teuerer sind (und noch teurer, wenn links und rechts ein Spannungspin am Stecker mit dran ist - sicherlich liegt der Preisunterschied nicht am Stecker selbst ;)).
Du bist echt ein Realist. :-D
Eine Anekdote aus den letzten Wochen: Lernpartner hat seinen PC umgebaut und eine Platte im Wechselramen mit einem 40-poligen IDE-Kabel angeschlossen. Naja, im Log fanden sich dann natürlich die typischen Platte-liegt-im-Sterben-DMA-Fehlermeldungen. Fehlerlog der Platte sah das ähnlich, aber "UDMA_CRC_Error_Count" war recht hoch,
Da gibt's also mindestens eine SMART-Implementierung, die etwas tut :)
Perfekt ausgedrückt. ;) Ganz nutzlos ist es also nicht.
(...). Da es für Kunden sicherlich besser aussieht, wenn bei SMART nix kommt, und Firmen ja es für die Kunden immer besser aussehen lassen wollen, liegt der Verdacht nahe (und zeigt meine minimale persönliche Erfahrung), dass bei SMART halt (fast) nix kommt. Ist ne Platte wirklich kaputt, ist's nämlich eh egal.
Traurig, aber wohl ziemlich wahr.
Sprich, SMART ist genauso nützlich wie jeder andere Test auch.
Oder wie Studien. Da kann man sich über den Sponsor auch aussuchen, was bei rauskommen soll :-)
Obwohl, daß was in http://www.heise.de/newsticker/meldung/66769 steht klingt für mich ziemlich nachvollziehbar: | Studien, die im Sinne des Auftraggebers bilanzieren, würden gezielt zu | Marketing-Zwecken eingesetzt. Studien mit negativer Bilanz hingegen | dienten den Entwicklern zur Produktverbesserung und blieben | unveröffentlicht. So entstehe in der Öffentlichkeit ein verzerrtes Bild | von Auftragsstudien.
Wenn der Test erfolgreich ist (d. h. es wurde ein Fehler gefunden), dann weiß man, daß das Testobjekt fehlerhaft ist, ansonsten ist man aber keinen Deut schlauer als vorher.
Ja, Du willst auf die "logische" Limitierung ("Testen kann man nur die Anwesenheit von Fehlern, nicht deren Abwesenheit"), hinaus, die natürlich vollkommen richtig und eh immer da ist - aber ich denke, SMART ist längst nicht so gut/genau/ehrlich.
IMHO: Ein schlechter Test ist besser als gar keiner, solange man um obige Limitierung weiß.
00 00 3f 00 00 00 b0 10 25.500
muss zugeben, dass mir das überhaupt nichts sagt :-)
Hmm. Bei der Augabe von meinem smartctl ist da noch eine Spalte "Command/Feature_Name".
Gut, mein tool ist sicherlich etwas ältlich ;)
BTW, der Autor von den smartmontools schreibt oder schrieb lustigerweise auch in de.comp...festplatten.
Ich hab einen Log-Eintrag von meinem Versuch den Write-Cache auszuschalten:
(auch so ein Ding, warum geht das nicht absolut immer? Vielleicht geht es ja NIE, aber manche Platten melden den Fehler bloss nicht :))
Du bist böse! ;) http://wipe.sourceforge.net/ | (...). Unfortunetly, not all drives actually disable write cache when | asked to. Those drives are broken. Write caching should always be | disabled, unless your system is battery backed and always powers down | cleanly. See this thread from the linux kernel list: | | http://www.uwsg.iu.edu/hypermail/linux/kernel/0103.0/0331.html
(...). "Set transfer mode" war vorher? Oder hat es tatsächlich etwas mit Setting cache mode zu tun? Kann ja sein, dass in irgendeinem IDE Standard sowas steht, hab da NULL Ahnung, aber klingt zumindestens nicht wirklich hilfreich.
Ich bin mir ziemlich sicher, daß das der Versuch war, den Write-Cache auszuschalten. Vor allem wegen der "Powered_Up_Time" von 6 Minuten, denn das hab ich so ziemlich als erstes probiert.
(...).
"smartctl -l selftest /dev/hda" zeigt dann das Log der Selbsttests an
Hast Du da mehr als einen Eintrag?
Ja, pro Selbsttest einen. Bei meiner kaputten IBM also 6 Stück oder so.
Ich hab auf zwei verschiedenen Platten genau einen Eintrag (wie auch immer der da reingekommen ist), obwohl schon mehrmals smartctl -t etc. gemacht.
Du verunsicherst mich immer mehr! :-P Also meine Seagate-, Samsung- und IBM-Platten haben bzw. hatten alle mehr als einen Eintrag.
Vielleicht ist der Eintrag hardcoded, damit (halb-)schlaue monitortools "ihrern" Testversuch immer "sehen" und nicht warnen, dass SMART "komisch" ist :-)
Hatte ich schon erwähnt, daß du böse bist! :)
Natürlich alle ohne Fehler. X-)
Muss dann wohl am Kabel liegen :-)
Hatte ich schon erwähnt, daß du ... Danke für diese spannende und anspruchsvolle Diskussion Jan -- Vulcan Borg: Live long and assimilate!