Mario van der Linde wrote:
Mein Backup-Server verhält sich sehr destruktiv (anders kann man das nicht nennen)... Das Teil hat bis heute in der Ecke gestanden und nie Aufmerksamkeit erregt. Bis ich vorhin feststellte , dass das Teil abgeschmiert ist.
Wenn es lange Zeit ohne Probleme lief und auf einmal treten massiv Probleme auf, dann spricht das oft fuer Hardwareprobleme...
Das hat sich wie folgt bemerkbar gemacht: ssh login funktionierte, jegliche Schreibversuche wurden mit einem (sinngemäss) "Fehler: Kann Datei XY in nur lesbarem Dateisystem nicht schreiben!"
Das heisst wohl, Deine Partition befand sich im read-only Modus.
ein shutdown per ssh brachte die Fehlermeldung, das /sbin/shutdown nicht ausgeführt werden kann. SysRQ ist auf der Kiste leider nicht aktiviert, nach mehreren fruchtlosen Versuchen, die Kiste halbwegs gesteuert runterfahren zu können hat schliesslich nur noch ein harter Reset geholfen. Nachdem ich dann einen Monitor angeschlossen hatte und im Runlevel S booten wollte blieb das Teil mit einem Kernelpanic stehen. Ein fsck per Rettungs-CD hat die Fehler behoben - booten tut die Kiste trotzdem nicht. Sobald / gemountet wird hängt die Kiste und zerlegt dabei das Dateisystem. Ein fsck dauert anschliessend rund 10 Min (die Partition ist 20GB gross). Normalerweise dauert das nach einem unsauberen Reset nur ca. 30 Sec...
Ueberpruefe mit einem Hersteller-Tool die Festplatten. Ueberpruefe den Speicher mit memtest. Wie sieht es mit Ueberhitzung aus? Momentan ist es (zumindest hier) doch recht warm... Prozessorluefter laeuft?
Ich hab Kiste mit Knoppix gebootet, fsck ausgeführt und kann voll auf die Partition zugreifen. Die Partition sieht eigentlich recht normal aus, ich kann jedenfalls nichts finden was ungewöhnlich ist. Zumindest keine zerhackten Dateien, Ordner oder ähnliches... Die Partition auf die die anderen Rechner die Backups ablegen ist nicht betroffen. D.h.
Frage: Wo kann ich jetzt von Knoppix aus SysRQ aktivieren, damit ich ein vernünftiges Logfile bekomme und den Fehler finden kann. Ohne sync geht mir nämlich immer alles mit über den Jordan.
/etc/sysconfig/sysctl Das Boot-Skript boot.proc in /etc/init.d wertet diese Konfig-Datei aus und schaltet bei Bedarf sysrq ein. Gesteuert wird das uebrigens im laufenden Betrieb ueber /proc/sys/kernel/sysrq - 0 bedeutet, sysrq abgeschaltet, 1 hingegen schaltet die Benutzung von sysrq ein. Nichts anderes macht letztendlich das Bootskript.
Lohnt sich überhaupt eine aufwändige Fehlersuche (eine Neuinstallation dauert schliesslich nur 20 Min. - dieses Windoofverhalten habe ich mir aber eigentlich erfolgreich abgewöhnt)?
Naja, wer sagt Dir, dass der Fehler nicht wieder auftritt? Gerade wenn es ein Hardwareproblem sein sollte. Zu wissen, was passiert ist, faende ich da schon beruhigend. CU, Th.