Mysteriöse Abstürze - wie Ursache finden?
Guten Morgen! Wir haben seit ein paar Monaten einen Server mit Suse Linux 9.2 in Betrieb. Samba, nfs, nis, dns, dhcp, Webserver usw. laufen darauf. Nun fängt dieser Server aber genauso wie sein Vorgänger an, mitten in der Nacht, wenn er die wenigste Last hat, abzustürzen. Die Logfiles geben keinen Aufschluß über die Ursache und der Server selbst ist nach dem Crash nicht mehr ansprechbar (=Monitor schwarz, eventuelle Meldungen können nicht gelesen werden). Iinen Hardwaredefekt möchte ich eigentlich auch erst einmal ausschließen (wird aber parrallel hierzu getestet). Was kann ich tun, um den Fehler zu finden? Wo könnten weitere Logs stehen? Gibt es Tools/Programme, die mir helfen könnten, den Fehler einzugrenzen? MfG A. Bitz ______________________________________________________________ Verschicken Sie romantische, coole und witzige Bilder per SMS! Jetzt bei WEB.DE FreeMail: http://f.web.de/?mc=021193
Och des kenn ich doch irgendwo her. Also bei meinem Via Epia Board war der Powersave dran schuld. Schalt diesen doch mal aus und schau ob er immer noch abstuerzt (killall powersaved). Ansonnsten: - wird er zu heis? (glaub eher nicht) - /var/log/warn - mach mal wenn du reiserfs benutzt ein reiserfsck MFG Michael On Wednesday 28 September 2005 08:51, a.bitz@web.de wrote:
Guten Morgen!
Wir haben seit ein paar Monaten einen Server mit Suse Linux 9.2 in Betrieb. Samba, nfs, nis, dns, dhcp, Webserver usw. laufen darauf.
Nun fängt dieser Server aber genauso wie sein Vorgänger an, mitten in der Nacht, wenn er die wenigste Last hat, abzustürzen. Die Logfiles geben keinen Aufschluß über die Ursache und der Server selbst ist nach dem Crash nicht mehr ansprechbar (=Monitor schwarz, eventuelle Meldungen können nicht gelesen werden). Iinen Hardwaredefekt möchte ich eigentlich auch erst einmal ausschließen (wird aber parrallel hierzu getestet).
Was kann ich tun, um den Fehler zu finden? Wo könnten weitere Logs stehen? Gibt es Tools/Programme, die mir helfen könnten, den Fehler einzugrenzen?
MfG A. Bitz ______________________________________________________________ Verschicken Sie romantische, coole und witzige Bilder per SMS! Jetzt bei WEB.DE FreeMail: http://f.web.de/?mc=021193
a.bitz@web.de schrieb:
Guten Morgen!
Wir haben seit ein paar Monaten einen Server mit Suse Linux 9.2 in Betrieb. Samba, nfs, nis, dns, dhcp, Webserver usw. laufen darauf.
Nun fängt dieser Server aber genauso wie sein Vorgänger an, mitten in der Nacht, wenn er die wenigste Last hat, abzustürzen. Die Logfiles geben keinen Aufschluß über die Ursache und der Server selbst ist nach dem Crash nicht mehr ansprechbar (=Monitor schwarz, eventuelle Meldungen können nicht gelesen werden). Iinen Hardwaredefekt möchte ich eigentlich auch erst einmal ausschließen (wird aber parrallel hierzu getestet).
Ist ein zugriff noch über Netz möglich ? Bei mir gab es mit einem AMD64 Probleme mit X, teilweise ist der Rechner eingefroren Tastatureingaben gingen ins Lehre, Monitor zeigte starres Bild. Zugriff über ssh war möglich, konnte dadurch X abschießen. Gruß von Carl
On Wednesday 28 September 2005 08:51, a.bitz@web.de wrote:
Guten Morgen!
Hallo,
Wir haben seit ein paar Monaten einen Server mit Suse Linux 9.2 in Betrieb. Samba, nfs, nis, dns, dhcp, Webserver usw. laufen darauf.
Nun fängt dieser Server aber genauso wie sein Vorgänger an, mitten in der Nacht, wenn er die wenigste Last hat, abzustürzen. Die Logfiles geben keinen Aufschluß über die Ursache und der Server selbst ist nach dem Crash nicht mehr ansprechbar (=Monitor schwarz, eventuelle Meldungen können nicht gelesen werden). Iinen Hardwaredefekt möchte ich eigentlich auch erst einmal ausschließen (wird aber parrallel hierzu getestet).
ich gehe mal davon aus, das es keine richtige Serverhardware ist, die ein Lights-Out Management bietet? Sonst könnte man ja mal dort in den Logs schauen bzw. mal den Zustand des Rechners prüfen wenn er gecrasht ist. Wenn der alte Server auch das gleiche Probleme hat, sind äußere Einflüsse über die Stromversorgung etc. denkbar? Ist der Rechner mit einer vernünftigen USV gesichert, die vom Stromnetz entkoppelt?
Was kann ich tun, um den Fehler zu finden? Wo könnten weitere Logs stehen? Gibt es Tools/Programme, die mir helfen könnten, den Fehler einzugrenzen?
Man könnte dem syslog sagen das er alles übers Netz an einen zweiten Rechner loggt. Ich leite alle Systemprotokolle grundsätzlich auf einen dezidierten syslog Server um. Mit syslog-ng geht das auch über stabilere TCP Verbindungen. Ich weiss aber nicht, ob der Rechner noch die Chance hat was per syslog herauszuposaunen. Da solltest Du Dir nicht zu viel Hoffnungen machen. Gruß Thomas
On Wednesday 28 September 2005 11:37, Thomas Vollmer wrote:
Man könnte dem syslog sagen das er alles übers Netz an einen zweiten Rechner loggt. Ich leite alle Systemprotokolle grundsätzlich auf einen dezidierten syslog Server um. Mit syslog-ng geht das auch über stabilere TCP Verbindungen.
Ich weiss aber nicht, ob der Rechner noch die Chance hat was per syslog herauszuposaunen. Da solltest Du Dir nicht zu viel Hoffnungen machen.
Gruß
Thomas
Man koennte aber einfach auch eine serielle Konsole oeffnen. Schafft die es nicht die Warnungen / Fehler einzufangen bringst des mit dem syslog auch net.
On Wednesday 28 September 2005 11:46, Michael Skibbe wrote:
On Wednesday 28 September 2005 11:37, Thomas Vollmer wrote:
Man könnte dem syslog sagen das er alles übers Netz an einen zweiten Rechner loggt. Ich leite alle Systemprotokolle grundsätzlich auf einen dezidierten syslog Server um. Mit syslog-ng geht das auch über stabilere TCP Verbindungen.
Ich weiss aber nicht, ob der Rechner noch die Chance hat was per syslog herauszuposaunen. Da solltest Du Dir nicht zu viel Hoffnungen machen.
[...]
Man koennte aber einfach auch eine serielle Konsole oeffnen. Schafft die es nicht die Warnungen / Fehler einzufangen bringst des mit dem syslog auch net.
Klar, nur hab ich nie ein passendes serielles Kabel zur Hand. Und bei meinen Server sehe ich die Konsole über ein Webfrontend. Gruß Thomas PS: Ich lese die Liste, ein CC ist daher nicht nötig.
On Wednesday 28 September 2005 12:14, Thomas Vollmer wrote:
On Wednesday 28 September 2005 11:46, Michael Skibbe wrote:
On Wednesday 28 September 2005 11:37, Thomas Vollmer wrote:
Man könnte dem syslog sagen das er alles übers Netz an einen zweiten Rechner loggt. Ich leite alle Systemprotokolle grundsätzlich auf einen dezidierten syslog Server um. Mit syslog-ng geht das auch über stabilere TCP Verbindungen.
Ich weiss aber nicht, ob der Rechner noch die Chance hat was per syslog herauszuposaunen. Da solltest Du Dir nicht zu viel Hoffnungen machen.
[...]
Man koennte aber einfach auch eine serielle Konsole oeffnen. Schafft die es nicht die Warnungen / Fehler einzufangen bringst des mit dem syslog auch net.
Klar, nur hab ich nie ein passendes serielles Kabel zur Hand. Und bei meinen Server sehe ich die Konsole über ein Webfrontend.
ja aber webfrontend ist schon wieder viel zu viel tam tam. Die chance das dir das abkackt ist groeser und warscheinlicher als bei einer seriellen Konsole. Und warscheinlich geht der Webserver auch _viel_ schneller Floeten als die serielle Konsole. Schaden tuts auf jeden Fall nicht. Aber ich denke das Problem liegt am Powersave aber das sehen wir ja bald.
Gruß
Thomas
PS: Ich lese die Liste, ein CC ist daher nicht nötig.
tja.. daher ich z.Z. andauernd antworten _nur_ an mich bekomm dachte ich es schadet nicht. Auserdem ist es Voreinstellung in der Liste (afaik). aber egal.
On Wednesday 28 September 2005 12:23, Michael Skibbe wrote:
On Wednesday 28 September 2005 12:14, Thomas Vollmer wrote:
On Wednesday 28 September 2005 11:46, Michael Skibbe wrote:
On Wednesday 28 September 2005 11:37, Thomas Vollmer wrote:
[...]
Klar, nur hab ich nie ein passendes serielles Kabel zur Hand. Und bei meinen Server sehe ich die Konsole über ein Webfrontend.
ja aber webfrontend ist schon wieder viel zu viel tam tam. Die chance das dir das abkackt ist groeser und warscheinlicher als bei einer seriellen Konsole. Und warscheinlich geht der Webserver auch _viel_ schneller Floeten als die serielle Konsole. Schaden tuts auf jeden Fall nicht.
Nicht unbedingt. Das ist halt Lights-Out Management und hat mit dem Rechner gar nix zu tun. Das Board hat eine eigene Stromversorgung, einen Netzwerkanschluß etc. und ist völlig autark. Gruß Thomas
wurde der server neu aufgesetzt? wir hatten vor kurzem das problem das ein "ram" speicher defekt war. es war nichts in der log oder so zu finden. nachdem wir einfach den speicher ausgebaut hatten, lief der server wieder. die abstürze kammen in sehr unterschiedlichen abständen, 10 - 15 stunden intervall. gruß marc -----Ursprüngliche Nachricht----- Von: Thomas Vollmer [mailto:thomas-ml@vollmeronline.de] Gesendet: Mittwoch, 28. September 2005 12:15 An: suse-linux@suse.com Betreff: Re: Mysteriöse Abstürze - wie Ursache finden? On Wednesday 28 September 2005 11:46, Michael Skibbe wrote:
On Wednesday 28 September 2005 11:37, Thomas Vollmer wrote:
Man könnte dem syslog sagen das er alles übers Netz an einen zweiten Rechner loggt. Ich leite alle Systemprotokolle grundsätzlich auf einen dezidierten syslog Server um. Mit syslog-ng geht das auch über stabilere TCP Verbindungen.
Ich weiss aber nicht, ob der Rechner noch die Chance hat was per syslog herauszuposaunen. Da solltest Du Dir nicht zu viel Hoffnungen machen.
[...]
Man koennte aber einfach auch eine serielle Konsole oeffnen. Schafft die es nicht die Warnungen / Fehler einzufangen bringst des mit dem syslog auch net.
Klar, nur hab ich nie ein passendes serielles Kabel zur Hand. Und bei meinen Server sehe ich die Konsole über ein Webfrontend. Gruß Thomas PS: Ich lese die Liste, ein CC ist daher nicht nötig.
On Wednesday 28 September 2005 12:30, Marc Querling wrote:
wurde der server neu aufgesetzt? wir hatten vor kurzem das problem das ein "ram" speicher defekt war. es war nichts in der log oder so zu finden.
nachdem wir einfach den speicher ausgebaut hatten, lief der server wieder. die abstürze kammen in sehr unterschiedlichen abständen, 10 - 15 stunden intervall.
gruß marc
kann man ja ganz einfach mit dem ramtest auf der CD - UEberpruefen. Einfach von CD starten und den Memory Test ausfuehren. Wenn er nach dem 10. mal durchlaufen immer noch keinen einzigen Fehler gefunden hat wuerde ich sagen er ist sauber. Mfg Michael
Am Mittwoch, den 28.09.2005, 08:51 +0200 schrieb a.bitz@web.de:
dem Crash nicht mehr ansprechbar (=Monitor schwarz, eventuelle Meldungen können nicht gelesen werden).
Sorge als erstes dafür, dass der Rechner den Monitor nicht mehr ins Powersaving schickt. Dann siehst du, was passiert ist. Es kann nichts schaden, schonmal generell ein tail -f aufs syslog zu starten. Gruß, Ratti -- -o) fontlinge | Fontmanagement for Linux | Schriftenverwaltung in Linux /\\ http://freshmeat.net/projects/fontlinge/ _\_V http://www.gesindel.de https://sourceforge.net/projects/fontlinge/
participants (6)
-
a.bitz@web.de
-
Carl Tenschert
-
Joerg Rossdeutscher
-
Marc Querling
-
Michael Skibbe
-
Thomas Vollmer