Lars Ziegler schrieb:
Sandy Drobic schrieb:
Lars Ziegler wrote:
Sandy Drobic schrieb:
Lars Ziegler wrote:
Hallo alle zusammen,
ich hab einen Server mit Opensuse 10.3 (inkl. aller Updates) laufen. Der Server ist NFS-Server, Mail-Server, Proxy-Server und Anmelde-Server (Openldap). Im Netzwerk befinden sich ca. 70 Linux-Clients (OpensSuSE 10.3).
Wenn sich zu viele Benutzer anmelden (KDE), reagiert plötzlich kein Linux-Client mehr und man kann auf der Konsole ein Timeout für lockd sehen. Der Fehler ist nur zu beheben, wenn man den Server neu starten, oder den NFS-Server stoppt, die Module nfsd und lockd neu lädt und den NFS-Server wieder startet. Allerdings ist der Erfolg immer nur von kurzer Dauer. Die Meldungen auf dem Server lauten
lockd: couldn't create rpc handle kernel: statd: server localhost not responding, timed out
Der Befehl rpcinfo -u localhost 100021 ergibt dann einen Timout-Error. Ich hab auch schon einen neuen Kernel aus der OS-Factory-Version probiert, aber es hat nichts geholfen.
Wahrscheinlich hat der lockd keine file handles mehr anlegen dürfen.
Was steht den in /etc/security/limits.conf? Unter welchem User läuft lockd?
Also wenn mich nicht alles täuscht läuft lockd zusammen mit dem nfsserver unter dem root-Benutzer.
Okay...
In Datei steht eigentliche nur auskommentiertes drin:
Dann solltest du vielleicht die Grenzen anpassen. "ulimit -a" zeigt die Einstellungen. Dein Problem wird vermutlich durch "ulimit -n" gezeigt.
Kann das denn dazu führen, dass der lockd abstürzt, wenn keine file handles mehr angelegt werden dürfen?
Ich vermute, dass er (NFS) nicht abstürzt, sondern hängt, während er auf Antwort von lockd wartet.
Hebe die limits an, dann sollte das Problem zuende sein, wenn der Server das verkraftet.
Also ulimit -x zeigt:
core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited scheduling priority (-e) 0 file size (blocks, -f) unlimited pending signals (-i) 41984 max locked memory (kbytes, -l) 32 max memory size (kbytes, -m) 3497835 open files (-n) 1024 pipe size (512 bytes, -p) 8 POSIX message queues (bytes, -q) 819200 real-time priority (-r) 0 stack size (kbytes, -s) 8192 cpu time (seconds, -t) unlimited max user processes (-u) 41984 virtual memory (kbytes, -v) 4975680 file locks (-x) unlimited
open files lässt sich allerdings nicht auf unlimited setzen. Also verkraften sollte der Server das schon (2x Dual-Core-Opteron, 4GB Speicher, 4 SCSI-HDD im Raid 5 (Hardware) Modus). Ich dachte, dass er abstürzt. Allerdings wenn man über ps -A alle laufenden Programme anzeigen lässt, steht hinter lockd zumindest nicht <defunct>.
Was mich übrigens wundert: ich hatte vorher opensuse 10.2 laufen, da sind nie Fehler aufgetreten. Das Limit für open files war da auch schon auf 1024 gesetzt und die Anzahl der Clients war gleich. Im übrigen tritt der Fehler schon auf, wenn schnell (1 min) hintereinander ca. 10 - 15 Rechner anmelde. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org