Hallo zusammen, hier steht ein Rechner, bei dem ich mir nicht sicher bin, ob die Hardware noch OK ist, d.h. ob die vereinzelten Abstürze eine softwaremäßige oder eine hardwaremäßige Ursache haben. Da der Server vor ca. vier Jahren gut 3.500 EUR gekostet hat, möchte ich ihn auch ungern einfach auf den Müll werfen. Hat jemand eine Idee, wie ich die Hardware testen könnte? Was ich schon probiert habe: - memtest - cat /dev/urandom | gzip > /dev/null - smartctl -t long /dev/sda Letzteres ist der Versuch, die CPU zu braten und zu sehen, ob es vielleicht eine thermische Instabilität gibt. Bis jetzt konnte ich keine Fehler erkennen. Dann dachte ich noch an - dd if=/dev/sda1 of=/dev/null um zu sehen, ob die Platten vollständig lesbar sind. Hat jemand noch andere Vorschläge, wie man die Hardware prüfen könnte? -- Andre Tann -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Andre Tann´s Tastaturgeklapper am Donnerstag, 19. Juni 2008 :
Hallo zusammen,
hier steht ein Rechner, bei dem ich mir nicht sicher bin, ob die Hardware noch OK ist, d.h. ob die vereinzelten Abstürze eine softwaremäßige oder eine hardwaremäßige Ursache haben.
Andre Tann
Hallo Andre, ich würde auf Netzteil tippen. Vielleicht einfach mal entstauben, schauen obs läuft wenn nicht austauschen Gruß Lutz -- http://www.linux-beginnerforum.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am 19. Juni 2008 15:02 schrieb Andre Tann
Hat jemand noch andere Vorschläge, wie man die Hardware prüfen könnte?
Kernel oder Mozilla oder OpenOffice bauen. Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Donnerstag 19 Juni 2008 15:41:45 schrieb Martin Schröder:
Am 19. Juni 2008 15:02 schrieb Andre Tann
: Hat jemand noch andere Vorschläge, wie man die Hardware prüfen könnte?
Kernel oder Mozilla oder OpenOffice bauen.
OOo bauen ist sicher eine gute Idee. Da das Bauen relativ lange dauert und auch anspruchsvoll für den Rechner sein kann, ist dies eine gute Streßtest für den Rechner. Allerdings um den Fehler einzugrenzen, muss man viele Einzelteile nacheinander wechseln, um - wie bei mir - letztlich festzustellen, dass das Mainboard einen Tick hat. Gruß Andreas -- ## Content Developer OpenOffice.org: lang/DE ## Freie Office-Suite für Linux, Mac, Windows, Solaris ## http://de.openoffice.org ## OpenOffice.org Portable: http://oooportable.org ## Meine Seite: http://www.amantke.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, On Donnerstag, 19. Juni 2008, Martin Schröder wrote:
Am 19. Juni 2008 15:02 schrieb Andre Tann
: Hat jemand noch andere Vorschläge, wie man die Hardware prüfen könnte?
Kernel oder Mozilla oder OpenOffice bauen.
Genau: http://en.opensuse.org/SDB:Checking_System_Stability Schöne Grüße aus Bremen hartmut -- Hartmut Meyer, Technical Support Engineer, EMEA Services Center Novell GmbH; GF: Volker Smid, Djamel Souici; HRB 21108 (AG Düsseldorf) Nördlicher Zubringer 9-11, D-40470 Düsseldorf T: +49 421 3073626 - M: +49 179 2279480 F: +49 421 8095944 - hartmut.meyer@novell.com ---------------------------------------------------- SUSE® Linux Enterprise 10 - Your Linux is ready http://www.novell.com/linux
Am Donnerstag 19 Juni 2008 schrieb Andre Tann:
Hat jemand eine Idee, wie ich die Hardware testen könnte? Was ich schon probiert habe:
- memtest - cat /dev/urandom | gzip > /dev/null - smartctl -t long /dev/sda
- filesystem check - badblocks Hatte auch mal auf einem Rechner immer wieder unerklärliche Abstürze, waren dann ein paar defekte Sektoren, durch die mir immer wieder das Filesystem geschrottet wurde und die Kiste dann in die Knie ging. Ein fsck behob das dann wieder für eine weile, bis die Sektoren wieder mal angesprochen wurden. -- Machs gut | http://www.iivs.de/schwinde/buerger/tremmel/ | http://packman.links2linux.de/ Manfred | http://www.knightsoft-net.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Don, 19 Jun 2008, Manfred Tremmel schrieb: [..]
- filesystem check - badblocks
Hatte auch mal auf einem Rechner immer wieder unerklärliche Abstürze, waren dann ein paar defekte Sektoren, durch die mir immer wieder das Filesystem geschrottet wurde und die Kiste dann in die Knie ging. Ein fsck behob das dann wieder für eine weile, bis die Sektoren wieder mal angesprochen wurden.
Die 'smartctl -A' Ausgabe dazu wäre interessant (gewesen)... Auf jeden Fall sollten sich dazu "I/O Error" Fehlermeldungen mit Angabe der (LBA) Sektornummer im Log finden lassen... -dnh -- 159: Hochleistungswebspace Das sind public-html-Verzeichnisse, die jeden Morgen zwanzig Liegestütze machen, und mit Testosteron vollgepumpt sind. (Markus Schaber) -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Don, 19 Jun 2008, Andre Tann schrieb:
hier steht ein Rechner, bei dem ich mir nicht sicher bin, ob die Hardware noch OK ist, d.h. ob die vereinzelten Abstürze eine softwaremäßige oder eine hardwaremäßige Ursache haben.
Kommt darauf an, wobei die Kiste absemmelt ;) V.a. ob das bei bestimmten Aktionen passiert oder "zufällig"...
Hat jemand eine Idee, wie ich die Hardware testen könnte? Was ich schon probiert habe:
- memtest - cat /dev/urandom | gzip > /dev/null - smartctl -t long /dev/sda
Letzteres ist der Versuch, die CPU zu braten und zu sehen, ob es vielleicht eine thermische Instabilität gibt.
smartctl belastet die CPU gar nicht, und auch die Platte AFAIK nur bedingt, die Ausgabe von 'smartctl -A /dev/sda' könnte aber schonmal interessant sein. Auch HDD testen: mit dd lesen und schreiben, z.B. Lesen: dd if=/dev/hdXY of=/dev/null bs=8M Schreiben: dd if=/dev/zero of=PFAD/DATEI_MIT_NULLEN bs=8M Achso, man sollte dabei ein 'tail -f /var/log/messages /var/log/warn' mitlaufen lassen, um evtl. Fehlermeldungen des Kernels (Sektordefekte) mitzubekommen. CPU + Speicher Lasttest bei (sehr?) geringer HDD-Belastung: Video kodieren, besonders CPU-lastig ist der H.246 Codec. Bsp.: mencoder -oac mp3lame -ovc x264 -o test_x264.avi test.avi (Eingabedatei kann alles sein, was mplayer/mencoder lesen können, AVI, MPEG (z.B. auch direkt von DVD), ... lavc mit 'mpeg4' (DiVX) als Codec kann man auch gut skalieren, per threads= an die CPU-Kernzahl anpassen, so daß man Volllast bekommt, per Filter (z.B. -vf hqdn3d) die CPU-Last noch deutlich nach oben anpassen... Man könnte das Ergebnis wohl auch nach /dev/null schreiben... ;) Kompilieren (z.B. Kernel) ist auch ein guter Lasttest für CPU und RAM. Generell hab ich erstmal das RAM im Verdacht, zumal sich das recht einfach und günstig tauschen läßt, auch wenn memtest nix meldet... Bei mir haben sich die Abstürze unter Last deutlich verringert seit ich den einen RAM-Riegel ausgebaut habe (DVD-Rips umkodieren läuft jetzt eigentlich immer durch, davor lief selten mal ein Kodierdurchgang (2pass) durch)... Memtest hab ich mal 3 Durchgänge machen lassen (nur 4h lang), hat nix gefunden. Die Abstürze beim mencoder waren aber wie gesagt häufig, jetzt sind sie nur selten (und der 2te Riegel unter Verdacht wg. der restlichen Abstürze, werde ich demnächst mal tauschen). HTH, -dnh -- Textverarbeitungsprogramme haben gegenueber der Gesellschaft einen Vorteil: Man kann den rechten Rand einstellen. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am Donnerstag, 19. Juni 2008 schrieb Andre Tann:
Hallo zusammen,
hier steht ein Rechner, bei dem ich mir nicht sicher bin, ob die Hardware noch OK ist, d.h. ob die vereinzelten Abstürze eine softwaremäßige oder eine hardwaremäßige Ursache haben. ... - smartctl -t long /dev/sda Das belastet die CPU überhaupt nicht, es wird ausschließlich innerhalb der Platte abgehandelt. Interessant wäre aber danach eine Ausgabe von smartctl -a ...
Letzteres ist der Versuch, die CPU zu braten und zu sehen, ob es vielleicht eine thermische Instabilität gibt. ... - dd if=/dev/sda1 of=/dev/null
um zu sehen, ob die Platten vollständig lesbar sind. smartctl -a sollte nach einem langen Test genauer sein; dd zeigt ja nur, was die Platte nach außen hin tut, smartctl dagegen den inneren Zustand ... Hat jemand noch andere Vorschläge, wie man die Hardware prüfen könnte? Such mal nach prime95, das gibt es unter Win und unter Linux. Hat einen Torture-Modus, der wirklich die CPU brät und auch verrät, ob dabei noch alles mit rechten Dingen zugeht. Das Programm hat bei mir ein defektes Mainboard ermittelt, dass mir kein anderer Test angezeigt hat (und nach dem Wechsel hörten die Abstürze wirklich auf, das RAM hatte ich schon vorher getauscht) und bei einem zweiten Rechner einen defekten Speicherriegel entlarvt, dem alle anderen Memorytester perfekte Funktion bescheinigten. Nach dem Entfernen des Riegels lief auch dieser Rechner wieder absolut stabil...
Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (8)
-
Andre Tann
-
Andreas Mantke
-
David Haller
-
Hartmut Meyer
-
Lutz Weber
-
Manfred Tremmel
-
Martin Hofius
-
Martin Schröder