-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Hallo Liste, mein Server (SuSE 7.2, Kernel 2.4.4-4GB) lief lange Zeit sehr stabil (uptime war 164 Tage) Bis gestern abend, dann dass: Mar 4 23:20:43 gini kernel: vs-3050: wait_buffer_until_released: nobody releases buffer (dev 3a:00, size 4096, blocknr 29090, count 2, list 0, state 0x19, page c12b786c, (UPTODATE, CLEAN, UNLOCKED)). Still waiting (-1200000000) !JDIRTY !JWAIT Zunächst dachte ich mein KDE hätte es erwischt und meinen Client runtergefahren. Aber als ich vorhin booten wollte, wollte der Clientrechner nicht so ganz. Dank Windows un PuTTY kam ich nochmal kurz als root auf die Maschine. Es waren dutzende sh- Prozesse als zombie in der Prozesstabelle eingetragen und andere Prozesse die reelmäßig per cron Dienst tun, waren fast alle im Status D. Seltsamerweise ging einiges noch, z.B. das Routing ins Inet und squid taten problemlos. Ich hab /var/log/messages mal durchforstet, aber keinen anderen verdächtigen Eintrag gefunden, was passiert sein könnte. Obige Meldung hat sich dann so ca. alle 10 Sekunden bis zum Reset vor 5min geschrieben. Der reboot-Befehl brachte zwar noch die Meldung, dass das System zwecks reboot runterfahren wird, sonst ist aber nix passiert. Was hab ich am Server verändert? Fast nix, (ja, ich weiß, üblicher Spruch des DAU ;-) ) Gemäß Security-Bulletin für sendmail hab ich per fou4s geupdated. Es wurden openssl-0.9.6a-78, libmcrypt-2.4.10-59 und sendmail-8.11.3-106 neu eingespielt. Das ahb ich aber vor etwas 24h gemacht, also deutlich vor der ersten Meldung des Kernel. Vielleicht noch was zum Dateisystem: reiserfs z.T auf lvm Ehrlich gesagt, bin ich ein wenig ratlos. Ich hoffe, ihr könnt mir helfen Danke schon mal Andreas - -- - --------------------------------------------------------------------- Andreas Bock registered Linux User #136542 mailto:Andreas.Bock@amselweg.org ICQ #59734306 http://www.amselweg.org - --------------------------------------------------------------------- -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.0.6 (GNU/Linux) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iD8DBQE+ZjuDkNVkdkLjbOoRAlr2AKDFcTvom60t8bW1E76O6NSQsopFBQCbBfrh 54bTfVkNbJbG/LgnhV+jhsk= =GEQy -----END PGP SIGNATURE-----
Andreas Bock wrote:
mein Server (SuSE 7.2, Kernel 2.4.4-4GB) lief lange Zeit sehr stabil (uptime war 164 Tage) Bis gestern abend, dann dass: [...] Ehrlich gesagt, bin ich ein wenig ratlos.
In solchen Faellen wuerde ich immer empfehlen: RAM testen, Filesystem checken, Festplatte checken (z.B. Drive Fitness Test). Falls alles OK, dann muss man weiter sehen. Gruesse, Th. -- Thomas Hertweck, Dipl.-Geophys., GPI Universitaet Karlsruhe
Hallo, Am Mittwoch, 5. März 2003 19:01 schrieb Andreas Bock:
Mar 4 23:20:43 gini kernel: vs-3050: wait_buffer_until_released: nobody releases buffer (dev 3a:00, size 4096, blocknr 29090, count 2, list 0, state 0x19, page c12b786c, (UPTODATE, CLEAN, UNLOCKED)). Still waiting (-1200000000) !JDIRTY !JWAIT
klingt nach ReiserFS...
Ich hab /var/log/messages mal durchforstet, aber keinen anderen verdächtigen Eintrag gefunden, was passiert sein könnte. Obige Meldung hat sich dann so ca. alle 10 Sekunden bis zum Reset vor 5min geschrieben.
Komplett selbige Meldung oder waren da auch andere bufferangaben drin?
Vielleicht noch was zum Dateisystem: reiserfs z.T auf lvm
ahja, genau... gruß, sven
Hallo, On Wed, 05 Mar 2003, Sven Schupp wrote:
Am Mittwoch, 5. März 2003 19:01 schrieb Andreas Bock:
Mar 4 23:20:43 gini kernel: vs-3050: wait_buffer_until_released: nobody releases buffer (dev 3a:00, size 4096, blocknr 29090, count 2, list 0, state 0x19, page c12b786c, (UPTODATE, CLEAN, UNLOCKED)). Still waiting (-1200000000) !JDIRTY !JWAIT
klingt nach ReiserFS...
Ist aber LVM! less /usr/src/linux/Documentation/devices.txt, 58 block. Aber daran liegt's wohl weniger, offenbar kann lvm den Block nicht auf HD schreiben... Riecht nach HW-Problem... -dnh -- 21: HTML-Programmierer Grafiker (Kristian Köhntopp)
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 David Haller schrieb: | | less /usr/src/linux/Documentation/devices.txt, 58 block. | | Aber daran liegt's wohl weniger, offenbar kann lvm den Block nicht auf | HD schreiben... | | Riecht nach HW-Problem... Danke für Eure Hilfe, ist schon seltsam, das da nur der LVM gemault hat und icht der IDE-Treiber. Wär Mist, wenn die HDD abraucht, erstens ist die noch nicht so alt und zweitens die Arbeit, alles wieder einzurichten... Ich werd das ganze mal im Auge behalten. Andreas - -- - --------------------------------------------------------------------- Andreas Bock registered Linux User #136542 mailto:Andreas.Bock@amselweg.org ICQ #59734306 http://www.amselweg.org - --------------------------------------------------------------------- -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.0.6 (GNU/Linux) Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org iD8DBQE+Z49fkNVkdkLjbOoRAm4qAJ9FuzGNfR9KM4NhpMpz8eOxLDPDLgCgl0Xq Z3aiUl/hDQy6fRY9ToY2ZOU= =dREz -----END PGP SIGNATURE-----
Am Mit, 2003-03-05 um 19.01 schrieb Andreas Bock:
Hallo Liste,
mein Server (SuSE 7.2, Kernel 2.4.4-4GB) lief lange Zeit sehr stabil (uptime war 164 Tage) Bis gestern abend, dann dass:
Mar 4 23:20:43 gini kernel: vs-3050: wait_buffer_until_released: nobody releases buffer (dev 3a:00, size 4096, blocknr 29090, count 2, list 0, state 0x19, page c12b786c, (UPTODATE, CLEAN, UNLOCKED)). Still waiting (-1200000000) !JDIRTY !JWAIT
Hallo Andreas, ich hatte mit 7.2 mal das Problem, dass der Rechner nur noch mit sich selbst beschäftigt war. Er war nicht abgestürzt, reagierte aber fast überhaupt nicht mehr. Ursache dafür war ein Kernel-Fehler im 2.4.4, der erst ab Version 2.4.10(?) behoben sein soll. Der Fehler betrifft die Speicherverwaltung des Kernels. Sie wurde im späteren Versionen komplett erneuert. Möglicherweise liegt unter 7.2 ein Update für den SuSE-Kernel, sonst soll 7.3 stabil sein, soweit ich gehört habe. Ich benutze 8.1, das seit den Updates von Ende 02 stabil läuft. HTH, Wolfgang
participants (5)
-
Andreas Bock
-
David Haller
-
Sven Schupp
-
Thomas Hertweck
-
Wolfgang Hinsch