Hallo Ich lasse seit gestern abend 22 Uhr Memtest auf meinem PC laufen. Es werden 256 MB geprüft. CPU = PIII 933 Mhz Hierzu zwei Fragen: 1. Ist es normal, dass dieser Test mittlerweile 13 Stunden läuft und ich erst bei 50 % im Test 5 von 11 angelangt bin? 2. In der Spalte Errors finde ich bisher 16000 Fehler. Die Ausgabe sieht so aus Es wird Spaltenweise ausgegeben: Test, Pass, Failing Adress, Good, Bad, Err-Bits, Count Die Fehler entstehen in Test 4 Pass 8, Adressen komen so ziemlich alle vor, Unterschied zwischen Good und Bad ist jeweils ein Bit und die Error-Bits haben ein sehr gleichmässiges Muster (auch jeweils ein Bit) 00000010 00000020 00000040 00000080 00000100 00000200 00000400 00000800 etc nur jeweils um eine Stelle nach links verschoben. Ist der Speicherriegel nun defekt oder nicht? Denn komischerweise läuft ja mein Testlinux stundenlang völlig problemlos. Ich bin einfach kein Hardwarefreak und bin für jede Hilfe dankbar Andy
Andreas Schott schrieb:
Hallo
Ich lasse seit gestern abend 22 Uhr Memtest auf meinem PC laufen. Es werden 256 MB geprüft. CPU = PIII 933 Mhz Hierzu zwei Fragen:
1. Ist es normal, dass dieser Test mittlerweile 13 Stunden läuft und ich erst bei 50 % im Test 5 von 11 angelangt bin?
Na ich frag mich ob memtest überhaupt mal aufhört zu testen, oder obs ne Endlosschleife ist. Hat das auch mal 3 Tage am Stück laufen, und er hat nicht aufgehört. (512 MB)
2. In der Spalte Errors finde ich bisher 16000 Fehler. Die Ausgabe sieht so aus Es wird Spaltenweise ausgegeben: Test, Pass, Failing Adress, Good, Bad, Err-Bits, Count
Die Fehler entstehen in Test 4 Pass 8, Adressen komen so ziemlich alle vor, Unterschied zwischen Good und Bad ist jeweils ein Bit und die Error-Bits haben ein sehr gleichmässiges Muster (auch jeweils ein Bit) 00000010 00000020 00000040 00000080 00000100 00000200 00000400 00000800 etc nur jeweils um eine Stelle nach links verschoben.
Ist der Speicherriegel nun defekt oder nicht? Denn komischerweise läuft ja mein Testlinux stundenlang völlig problemlos.
Ich bin einfach kein Hardwarefreak und bin für jede Hilfe dankbar
Irgendwas scheint faul zu sein. Sonst wären keine Fehler da. Normalerweise sollten keine Fehler auftreten. Naja wenn der Speicher am oberen Ende liegt. Dann greift ja Linux nicht effektiv drauf zu. Also ich würde ihn austauschen. Vielleicht kannst Du ja mal die Speichertakt-Frequenz runterfahren von 133 auf 100 MHz oder so. Manche Speicherbausteine funktionieren oft bei 133 nicht richtig, laufen aber bei 100 Mhz noch gut. Gruss Patrick
Andreas Schott wrote:
Ich lasse seit gestern abend 22 Uhr Memtest auf meinem PC laufen. Es werden 256 MB geprüft. CPU = PIII 933 Mhz Hierzu zwei Fragen:
1. Ist es normal, dass dieser Test mittlerweile 13 Stunden läuft und ich erst bei 50 % im Test 5 von 11 angelangt bin?
memtest laeuft in einer Endlosschleife. Es gibt die einzelnen Tests, und irgendwo muesste noch etwas von "Passes" (Durchlaeufe) stehen. Man sollte auf alle Faelle einige Durchlaeufe machen, hier traten manche Speicherfehler erst ab dem 15. Durchlauf oder so auf. Deswegen wird geraten, memtest immer mind. ueber Nacht laufen zu lassen. Ich denke, Du wirst nicht mehr beim 1. Durchlauf sein, sondern bereits etliche hinter Dir haben...
2. In der Spalte Errors finde ich bisher 16000 Fehler. [...] Ist der Speicherriegel nun defekt oder nicht? Denn komischerweise läuft ja mein Testlinux stundenlang völlig problemlos.
Es gibt mit Sicherheit Probleme, wobei es nicht nur der Speicher sein kann, sondern auch das Motherboard oder die CPU oder der Cache etc. Siehe dafuer auch die Homepage von memtest[1]. Auf der Seite findest Du auch Moeglichkeiten, die Fehler evtl. naeher einzugrenzen. Um einen gewissen Hardwaretausch zum Testen, was genau los ist, wirst Du aber vermutlich nicht herum kommen - am einfachsten faengt man hier eben mal mit dem Tausch des RAM an... CU, Th. [1] http://www.memtest86.com/
Moin, Am Do, den 10.06.2004 um 11:13 Uhr +0200 schrieb Andreas Schott:
2. In der Spalte Errors finde ich bisher 16000 Fehler.
Ist der Speicherriegel nun defekt oder nicht? Denn komischerweise läuft ja mein Testlinux stundenlang völlig problemlos.
Wenn dein Linux /wirklich/ problemlos läuft, würde ich das auch mal kritisch hinterfragen. Als guter Speichertest gilt das kompilieren eines eigenen Kernels, denn dabei kriegt das System richtig Last auf allen Komponenten. Wenn das klappt und der Kernel stabil rennt, ist das ein gutes Zeichen. Hättest du nur ein paar Kippelbits, würde ich das so nicht sagen, aber mit tausenden von Fehlern kann das eigentlich nicht durchlaufen (Wenn die "echt" sind). Ich verstehe nicht viel von Hardware, aber kann es sein, daß der Ramtest falsch konfiguriert ist und wohlmöglich den Speicher der Grafikkarte mittestet, während sich der Bildschirminhalt ändert? Oder so? Gruß, Ratti -- -o) fontlinge | Fontmanagement for Linux | Schriftenverwaltung in Linux /\\ http://freshmeat.net/projects/fontlinge/ _\_V http://www.gesindel.de https://sourceforge.net/projects/fontlinge/
Am Montag, 14. Juni 2004 23:06 schrieb Joerg Rossdeutscher:
Moin,
Am Do, den 10.06.2004 um 11:13 Uhr +0200 schrieb Andreas Schott:
2. In der Spalte Errors finde ich bisher 16000 Fehler.
Ist der Speicherriegel nun defekt oder nicht? Denn komischerweise läuft ja mein Testlinux stundenlang völlig problemlos.
Wenn dein Linux /wirklich/ problemlos läuft, würde ich das auch mal kritisch hinterfragen. Als guter Speichertest gilt das kompilieren eines eigenen Kernels, denn dabei kriegt das System richtig Last auf allen Komponenten. Wenn das klappt und der Kernel stabil rennt, ist das ein gutes Zeichen. Hättest du nur ein paar Kippelbits, würde ich das so nicht sagen, aber mit tausenden von Fehlern kann das eigentlich nicht durchlaufen (Wenn die "echt" sind).
Hallo, zum Thema "kaputter Speicher": ich habe knapp drei Jahre lang zwei Server unter (Debian) Linux im Cluster (heartbeat + drbd) betrieben, die ungefähr alle drei bis vier MONATE wegen "i/o errors" und merkwürdigen Dateisystem-Inkonsistenzen und nichtlesbaren Dateien rebooted werden mussten. Mehrere Versuche, auf den Rechnern NT und Win2k zu installieren (weil die dortigen "Verantwortlichen" meinten, das liefe sicherlich stabiler) scheiterten bereits durch Totalhänger während der Installation. Meistens wurde nicht einmal der erste Bootvorgang beendet. Wir haben alles getauscht, Platten, Mainboards, bloss - rückblickend - das RAM irgendwie nie, wohl weil das noch PS/2-Module waren und die heute kaum noch zu kriegen sind und wir keinen Ersatz hatten. Irgendwann bin ich dann auf den Trichter gekommen, mal memtest zu machen. (Fragt mich nicht wieso nicht schon vorher) ... und siehe da, hunderte von jumping bits auf dem Cluster-Master. Wir haben das RAM getauscht (bzw. das noch heile RAM zwischen den Rechnern aufgeteilt) und seitdem laufen die Kisten wieder 1A stabil. Soviel zur Robustheit von Linux ... -- Dipl.-Ing. Jens Benecke http://www.hitchhikers.de - Europas kostenlose Mitfahrzentrale seit 1998 http://www.rb-hosting.de - Webhosting mit Extras - PHP ab €9 - SSH ab €19 http://www.spamfreemail.de - 100% saubere Postfächer, garantiert!
Jens Benecke wrote:
[...] Soviel zur Robustheit von Linux ...
Ich verstehe nicht, was das alles mit Robustheit von Linux oder Windows zu tun hat. Wenn die Hardware (in diesem Falle der RAM) kaputt ist, wird jedes Betriebssystem frueher oder spaeter in die Knie gehen (solange der Fehler unentdeckt bleibt und nicht auf andere Weise korrigiert wird, was aber sehr aufwaendig oder teuer sein kann) und der Rechner wird unter Garantie nie stabil laufen. Manchmal treten so viele Fehler auf, dass man sofort auf Probleme mit der Hardware/dem Speicher schliesst. In manchen Faellen sind die Fehler sehr subtil (hier stuerzt mal ein Programm ab, dort bricht mal ein scp-Befehl ab, mal stimmt die MD5-Summe nach einem Download nicht, usw.), sodass man ein Problem eher in einem anderen Bereich und nicht bei der Hardware sucht. Wenn aber Hardware kaputt ist (und die Chancen dafuer stehen recht hoch, wenn memtest Fehler meldet -> RAM, Cache, Motherboard, CPU, ...), dann sollte das getauscht werden - das Risiko unberechenbarer Folgen ist einfach viel zu hoch. Wir haben hier ja doch so einige Rechner, und es war noch jedesmal so, dass wenn memtest Fehler gemeldet hat und im Anschluss daran Hardware getauscht wurde, die urspruenglichen Probleme verschwunden waren. CU, Th.
Am Dienstag, 15. Juni 2004 09:24 schrieb Thomas Hertweck:
Jens Benecke wrote:
[...] Soviel zur Robustheit von Linux ...
Ich verstehe nicht, was das alles mit Robustheit von Linux oder Windows zu tun hat. Wenn die Hardware (in diesem Falle der RAM)
Ganz einfach: Ich finde es *verdammt* erstaunlich, dass Linux auf einer Kiste mit total korruptem RAM uptimes von mehreren Monaten (und dann noch einen sauberen shutdown) hinbekommt, und nur gelegentliche segfaults, die mir aber erst nach Studieren der system-logs auffielen und den Betrieb überhaupt nicht beeinflusst haben.
haben hier ja doch so einige Rechner, und es war noch jedesmal so, dass wenn memtest Fehler gemeldet hat und im Anschluss daran Hardware getauscht wurde, die urspruenglichen Probleme verschwunden waren.
So wars hier ja auch ... ;) -- Dipl.-Ing. Jens Benecke http://www.hitchhikers.de - Europas kostenlose Mitfahrzentrale seit 1998 http://www.rb-hosting.de - Webhosting mit Extras - PHP ab €9 - SSH ab €19 http://www.spamfreemail.de - 100% saubere Postfächer, garantiert!
Hi Jens Jens Benecke wrote:
Am Dienstag, 15. Juni 2004 09:24 schrieb Thomas Hertweck:
Jens Benecke wrote:
[...] Soviel zur Robustheit von Linux ...
Ich verstehe nicht, was das alles mit Robustheit von Linux oder Windows zu tun hat. Wenn die Hardware (in diesem Falle der RAM)
Ganz einfach: Ich finde es *verdammt* erstaunlich, dass Linux auf einer Kiste mit total korruptem RAM uptimes von mehreren Monaten (und dann noch einen sauberen shutdown) hinbekommt, und nur gelegentliche segfaults, die mir aber erst nach Studieren der system-logs auffielen und den Betrieb überhaupt nicht beeinflusst haben.
Tja da hast du Glück Ich hatte vor einigen Wochen einen kaputten Ramriegel wo der memtest nur gerade an zwei orten fehler feststellte. ausserdem warens die höchsten 64MB im System (MB 256-320) und das System braucht nur etwa 150MB von einem RAM... Dennoch hatte ich von einem Tag auf den anderen tonnenweise fehler im Filesystem (das messages-log kriegte ca 100 fehlernachrichten pro sekunde ab...).. auch ein mehrmalsdurchgeführter fsck auf das reisersystem brachte nur eine verschlechterung... in jedem durchgang fand er wieder ein paar mehr 'fehler'... bis ich schliesslich vom Verdacht auf die HD zum Verdacht aufs RAM kam.. raus damit, fsck durchlaufen lassen und - läuft wieder.. mit ein paar verlusten die gut wiederherstellbar waren... Aber ich bin der Meinung wenn memtest fehler MELDET dann SIND da irgendwo irgenwelche fehler....denn memtest basiert ja IMHO darauf dass es muster ins RAM schreibt und dann schaut ob sie beim lesen noch dieselben sind.... Also mal RAM austauschen und wenns das nicht ist, dann wirds wohl an der cpu oder mainboard oder .... liegen... Gruss Matti
Jens Benecke wrote:
[...] Ganz einfach: Ich finde es *verdammt* erstaunlich, dass Linux auf einer Kiste mit total korruptem RAM uptimes von mehreren Monaten (und dann noch einen sauberen shutdown) hinbekommt, und nur gelegentliche segfaults, die mir aber erst nach Studieren der system-logs auffielen und den Betrieb überhaupt nicht beeinflusst haben.
Wenn der Fehler im "unteren" Speicherbereich auftritt, wo fuer das System "lebensnotwendige" Resourcen geladen werden, dann duerfte das System vermutlich nicht weit kommen. Wenn der Fehler im "oberen" Speicherbereich liegt, dann ist vielleicht hpts. der Cache betroffen, evtl. manchmal ein Anwendungsprogramm, dann kann so ein Fehler auch - wie ich schon schrieb - recht lange unentdeckt bleiben und wird evtl. eher auf andere Gruende zurueckgefuehrt. CU, Th.
participants (7)
-
fanclub.ostkurve@t-online.de
-
Jens Benecke
-
Jens Benecke
-
Joerg Rossdeutscher
-
Matthias Keller
-
Patrick Klaus
-
Thomas Hertweck