Lars Ziegler wrote:
Sandy Drobic schrieb:
Lars Ziegler wrote:
Sandy Drobic schrieb:
Lars Ziegler wrote:
Hallo alle zusammen,
ich hab einen Server mit Opensuse 10.3 (inkl. aller Updates) laufen. Der Server ist NFS-Server, Mail-Server, Proxy-Server und Anmelde-Server (Openldap). Im Netzwerk befinden sich ca. 70 Linux-Clients (OpensSuSE 10.3).
Wenn sich zu viele Benutzer anmelden (KDE), reagiert plötzlich kein Linux-Client mehr und man kann auf der Konsole ein Timeout für lockd sehen. Der Fehler ist nur zu beheben, wenn man den Server neu starten, oder den NFS-Server stoppt, die Module nfsd und lockd neu lädt und den NFS-Server wieder startet. Allerdings ist der Erfolg immer nur von kurzer Dauer. Die Meldungen auf dem Server lauten
lockd: couldn't create rpc handle kernel: statd: server localhost not responding, timed out
Der Befehl rpcinfo -u localhost 100021 ergibt dann einen Timout-Error. Ich hab auch schon einen neuen Kernel aus der OS-Factory-Version probiert, aber es hat nichts geholfen. Wahrscheinlich hat der lockd keine file handles mehr anlegen dürfen.
Was steht den in /etc/security/limits.conf? Unter welchem User läuft lockd?
Also wenn mich nicht alles täuscht läuft lockd zusammen mit dem nfsserver unter dem root-Benutzer. Okay...
In Datei steht eigentliche nur auskommentiertes drin:
Dann solltest du vielleicht die Grenzen anpassen. "ulimit -a" zeigt die Einstellungen. Dein Problem wird vermutlich durch "ulimit -n" gezeigt.
Kann das denn dazu führen, dass der lockd abstürzt, wenn keine file handles mehr angelegt werden dürfen? Ich vermute, dass er (NFS) nicht abstürzt, sondern hängt, während er auf Antwort von lockd wartet.
Hebe die limits an, dann sollte das Problem zuende sein, wenn der Server das verkraftet.
Also ulimit -x zeigt:
nicht "ulimit -a"?
core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited scheduling priority (-e) 0 file size (blocks, -f) unlimited pending signals (-i) 41984 max locked memory (kbytes, -l) 32 max memory size (kbytes, -m) 3497835 open files (-n) 1024
Das scheint die einzige Engstelle zu sein. Hebe das doch mal auf 4096 für root. root soft nofiles 4096 Im laufenden Betrieb geht das auch, aber AFAIK nur für die Shell, in der du als root eingeloggt bist. ulimit -n 4096
open files lässt sich allerdings nicht auf unlimited setzen. Also verkraften sollte der Server das schon (2x Dual-Core-Opteron, 4GB Speicher, 4 SCSI-HDD im Raid 5 (Hardware) Modus).
Ja, da sollten auch noch mehr offene Dateien kein Problem sein. Teste es mal. -- Sandy Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org