Hallo Listen-Teilnehmer, habe momentan grundlegende Probleme mit NFS. Habe bei einem NFS-Server (SNAP-Server von Adaptec) eine Freigabe erstellt: /shares/share1 *(rw,async,no_root_squash,no_all_squash) wenn ich es über den Opensuse 10.2 -Server einmounten möchte: (/etc/fstab-Eintrag:) snap1:/share1 /lw/snap1 nfs auto,exec 0 0 dann mount /lw/snap1 kann ich problemlos Daten drauf kopieren. Wenn ich jetzt aber einen Link erzeuge (altes Verzeichnis vorher umbenannt): ln -s /lw/snap1/mail /var/spool/mail (das Verzeichnis gibt es dort auf /lw/snap1/) und es dann durch Postfix verwenden lasse (Mails darauf ablegen möchte), kommen seltsame Lock-Fehler: # l /lw/snap1/mail total 0 drwxrwxrwx 2 root root 37 Mar 6 20:54 ./ drwxrwxrwx 10 root root 130 Mar 3 22:04 ../ -rw------- 1 office users 0 Mar 6 20:54 office ---------- 1 office users 0 Mar 6 20:54 office.lock # mailq -Queue ID- --Size-- ----Arrival Time---- -Sender/Recipient------- 0B68B4C38F* 1200 Tue Mar 6 20:53:03 root@localhost root@localhost 7998F4C3CC 1200 Tue Mar 6 20:54:01 root@localhost (cannot update mailbox /var/mail/office for user office. unable to create lock file /var/mail/office.lock: File exists) office@localhost root@localhost ... Mar 6 20:55:06 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:55:06 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:55:06 s1 kernel: lockd: failed to monitor snap1 Mar 6 20:55:37 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:55:37 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:55:37 s1 kernel: lockd: failed to monitor snap1 Mar 6 20:56:08 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:56:08 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:56:08 s1 kernel: lockd: failed to monitor snap1 ... ich habe auch schon den Link gegen einen echten Mountpoint ersetzt, ohne Erfolg. ich habe auch schon als Server einen Debian-Sarge (Kernel 2.6.18.3) Server verwendet, selbes Problem. Drauf schreiben geht ohne Probleme, aber sobald ein Lock angelegt werden soll, streikt er. Probeweise habe ich auch diesen Opensuse 10.2-Server als NFS-Server aktiviert und die Freigabe über diesen 10.2-Server gemountet. Mit noch weniger Erfolg, beim mounten blieb er minutenlang hängen. auf dem 10.2-Server (NFS-Client) sind folgende Dienste gestartet: nfs (automatisches Mounten beim Start) portmap nfsserver (probehalber) Die Firewall habe ich inzwischen auch schon komplett ausgeschaltet. # rpcinfo -p snap1 program vers proto port 100000 2 tcp 111 portmapper 100000 2 udp 111 portmapper 351396 1 udp 765 351396 1 tcp 767 100005 1 udp 16406 mountd 100005 1 tcp 33155 mountd 100005 2 udp 16406 mountd 100005 2 tcp 33155 mountd 100005 3 udp 16406 mountd 100005 3 tcp 33155 mountd 100003 2 udp 2049 nfs 100003 3 udp 2049 nfs 100003 2 tcp 2049 nfs 100003 3 tcp 2049 nfs 100021 1 udp 16407 nlockmgr 100021 3 udp 16407 nlockmgr 100021 4 udp 16407 nlockmgr 100021 1 tcp 33156 nlockmgr 100021 3 tcp 33156 nlockmgr 100021 4 tcp 33156 nlockmgr 100024 1 udp 16408 status 100024 1 tcp 33157 status # rpcinfo -p localhost program vers proto port 100000 2 tcp 111 portmapper 100000 2 udp 111 portmapper 100024 1 udp 32770 status 100021 1 udp 32770 nlockmgr 100021 3 udp 32770 nlockmgr 100021 4 udp 32770 nlockmgr 100024 1 tcp 39143 status 100021 1 tcp 39143 nlockmgr 100021 3 tcp 39143 nlockmgr 100021 4 tcp 39143 nlockmgr # rcnfsserver start Starting kernel based NFS server done # rpcinfo -p localhost program vers proto port 100000 2 tcp 111 portmapper 100000 2 udp 111 portmapper 100024 1 udp 32770 status 100021 1 udp 32770 nlockmgr 100021 3 udp 32770 nlockmgr 100021 4 udp 32770 nlockmgr 100024 1 tcp 39143 status 100021 1 tcp 39143 nlockmgr 100021 3 tcp 39143 nlockmgr 100021 4 tcp 39143 nlockmgr 100003 2 udp 2049 nfs 100003 3 udp 2049 nfs 100003 4 udp 2049 nfs 100003 2 tcp 2049 nfs 100003 3 tcp 2049 nfs 100003 4 tcp 2049 nfs 100005 1 udp 669 mountd 100005 1 tcp 670 mountd 100005 2 udp 669 mountd 100005 2 tcp 670 mountd 100005 3 udp 669 mountd 100005 3 tcp 670 mountd Es läuft ein 2.6.20.1-Kernel (Vanilla, fast ohne zusätzliche Patches, außer einen ipmi-Patch), das Problem tritt aber auch beim Original-2.6.18-Kernel von Suse auf, wenn auch nicht ständig (mal geht es für ein paar Stunden, dann steht es wieder für eine Stunde). Wo kann ich noch nachforschen, welche Dienste sollten noch laufen, welche Mechanismen sind für's Locking zuständig? Besten Dank im voraus, Günther -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Günther Zisham wrote:
Hallo Listen-Teilnehmer,
habe momentan grundlegende Probleme mit NFS. Habe bei einem NFS-Server (SNAP-Server von Adaptec) eine Freigabe erstellt: /shares/share1 *(rw,async,no_root_squash,no_all_squash)
wenn ich es über den Opensuse 10.2 -Server einmounten möchte: (/etc/fstab-Eintrag:) snap1:/share1 /lw/snap1 nfs auto,exec 0 0
dann mount /lw/snap1
kann ich problemlos Daten drauf kopieren.
Wenn ich jetzt aber einen Link erzeuge (altes Verzeichnis vorher umbenannt): ln -s /lw/snap1/mail /var/spool/mail (das Verzeichnis gibt es dort auf /lw/snap1/)
und es dann durch Postfix verwenden lasse (Mails darauf ablegen möchte), kommen seltsame Lock-Fehler:
# l /lw/snap1/mail total 0 drwxrwxrwx 2 root root 37 Mar 6 20:54 ./ drwxrwxrwx 10 root root 130 Mar 3 22:04 ../ -rw------- 1 office users 0 Mar 6 20:54 office ---------- 1 office users 0 Mar 6 20:54 office.lock
Postfix und NFS kann etwas trickreich sein. Stelle auf jeden Fall sicher, dass du keinen soft mount verwendest, da dies zu Datenkorruption führen wird. Wenn du mbox verwendest, siehe auch nach, welches Lockverfahren eingestellt ist für Postfix und für den NSF-Server (flock|fcntl). Alle Applikationen müssen sich einig sein. Defaults für Postfix sind bei mir: deliver_lock_attempts = 20 deliver_lock_delay = 1s mailbox_delivery_lock = fcntl, dotlock stale_lock_time = 500s virtual_mailbox_lock = fcntl, dotlock http://www.postfix.org/NFS_README.html -- Sandy Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo Sandy, Sandy Drobic schrieb:
Günther Zisham wrote:
Hallo Listen-Teilnehmer,
habe momentan grundlegende Probleme mit NFS. Habe bei einem NFS-Server (SNAP-Server von Adaptec) eine Freigabe erstellt: /shares/share1 *(rw,async,no_root_squash,no_all_squash)
wenn ich es über den Opensuse 10.2 -Server einmounten möchte: (/etc/fstab-Eintrag:) snap1:/share1 /lw/snap1 nfs auto,exec 0 0
dann mount /lw/snap1
kann ich problemlos Daten drauf kopieren.
Wenn ich jetzt aber einen Link erzeuge (altes Verzeichnis vorher umbenannt): ln -s /lw/snap1/mail /var/spool/mail (das Verzeichnis gibt es dort auf /lw/snap1/)
und es dann durch Postfix verwenden lasse (Mails darauf ablegen möchte), kommen seltsame Lock-Fehler:
# l /lw/snap1/mail total 0 drwxrwxrwx 2 root root 37 Mar 6 20:54 ./ drwxrwxrwx 10 root root 130 Mar 3 22:04 ../ -rw------- 1 office users 0 Mar 6 20:54 office ---------- 1 office users 0 Mar 6 20:54 office.lock
Postfix und NFS kann etwas trickreich sein. Stelle auf jeden Fall sicher, dass du keinen soft mount verwendest, da dies zu Datenkorruption führen wird. Wenn du mbox verwendest, siehe auch nach, welches Lockverfahren eingestellt ist für Postfix und für den NSF-Server (flock|fcntl). Alle Applikationen müssen sich einig sein.
Defaults für Postfix sind bei mir: deliver_lock_attempts = 20 deliver_lock_delay = 1s mailbox_delivery_lock = fcntl, dotlock stale_lock_time = 500s virtual_mailbox_lock = fcntl, dotlock
Danke, das ist mir schon eine große Hilfe. ich hatte fast alle Einstellungen in diesem Block gleich, nur virtual_mailbox_lock = fcntl mußte ich in virtual_mailbox_lock = fcntl, dotlock ändern. Habe mir mal QPopper beim Vorgänger-Server (SuSE 9.0) gesehen, da wird beim Locking beim Lesen noch ein weiterer Punkt ganz vorne angestellt und ".pop" hinter dem Usernamen (.username.pop). Ob das noch immer so ist, ob das dann zum Postfix-Locking kompatibel ist? Bin gerade noch dabei, den Einfluß des Kernels (Version / Suse-Patches) am Problem abzugrenzen. Danke, Günther -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Günther Zisham wrote:
Habe mir mal QPopper beim Vorgänger-Server (SuSE 9.0) gesehen, da wird beim Locking beim Lesen noch ein weiterer Punkt ganz vorne angestellt und ".pop" hinter dem Usernamen (.username.pop). Ob das noch immer so ist, ob das dann zum Postfix-Locking kompatibel ist?
Das kann ich leider nicht sagen, ich verwende weder QPopper noch NFS.
Bin gerade noch dabei, den Einfluß des Kernels (Version / Suse-Patches) am Problem abzugrenzen.
Bei Kernel 2.6.8 soll es ein übles Problem mit NFS gegeben haben, das hatte ich in einem Beitrag von Michael Tokarev gelesen, 2.6.12 soll wieder in Ordnung gewesen sein. -- Sandy Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Günther Zisham schrieb:
... Mar 6 20:55:06 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:55:06 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:55:06 s1 kernel: lockd: failed to monitor snap1 Mar 6 20:55:37 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:55:37 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:55:37 s1 kernel: lockd: failed to monitor snap1 Mar 6 20:56:08 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:56:08 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:56:08 s1 kernel: lockd: failed to monitor snap1 ...
habe das Problem inzwischen etwas eingrenzen können: mit dem Orignal-Opensuse-Kernel geht es (fast) problemlos mit NFS. Leider kann ich ihn aufgrund von anderen Problemen nicht verwenden (System hängt bei USB-Erkennung wenn eine 3. Gigabit-Netzwerkkarte drinnen ist), darum habe ich mir einen Vanilla-Kernel (2.6.20.2) kompiliert, der wenigstens richtig bootet. Nur habe ich dabei halt auch die NFS-Lock-Probleme. Nun habe ich versucht, die Suse-Patches (patches.arch, patches.drivers, patches.fixes,...) auf die 2.6.20.2 anzuwenden, was überhaupt nicht funktioniert hat (..,"Reversed (or previously applied) patch detected"...). Weiß jemand, wie ich genau diesen einen NFS-Patch irgendwo herbekomme, damit NFS-Locks beim 2.6.20.2-Vanilla-Kernel genauso gut funktionieren, wie beim Original-Suse-Kernel? Besten Dank im voraus, Günther -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Meine Erfahrung: NFS und Locking, lass es besser bleiben. IMO funktioniert das auch heutzutage nicht zuverlaessig... Cheers, Th. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo Thomas! Thomas Hertweck schrieb:
Meine Erfahrung: NFS und Locking, lass es besser bleiben. IMO funktioniert das auch heutzutage nicht zuverlaessig...
Cheers, Th.
Ja gerne, aber was ist die Alternative? Ich möchte von 2 Servern auf ein gemeinsames Share zugreifen, das von einem Snap-Server angeboten wird. iscsi? smbfs? cifs? ??? Habe auch schon iSCSI versucht und festgestellt, dass da das Locking gar keine Probleme macht, dafür sieht der eine Server nicht, was der andere etwa zur selben Zeit auf das Share schreibt. Auch nicht Minuten später!! Auch "sync"-mounten bringt nichts. Ich vertraue schon seit Jahren auf Deine Howto's. Hast Du nich auch dieses Mal einen guten Tipp bereit, was ich als Alternative nehmen kann oder wie ich NFS stabiler machen kann? Bis dann, Günther -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Günther Zisham wrote:
[...] Ja gerne, aber was ist die Alternative? [...]
Ich habe den Thread nur am Rande verfolgt, weil ich kein Experte fuer Postfix bin und das Teil der urspruenglichen Frage war. NFS und Locking ist generell ein Problem meiner Meinung nach. Wir haben zum Teil in unsere eigene Software zusaetzliche Locking-Mechanismen einbauen muessen, die Probleme verhindert (insbesondere Datenkorruption). Oder wir benutzen eben kein NFS. Darueber kann ich allerdings keine weitere Auskunft in der Oeffentlichkeit geben. Gruesse, Th. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am Samstag, 10. März 2007 21:02 schrieb Günther Zisham: ..
Nun habe ich versucht, die Suse-Patches (patches.arch, patches.drivers, patches.fixes,...) auf die 2.6.20.2 anzuwenden, was überhaupt nicht funktioniert hat (..,"Reversed (or previously applied) patch detected"...). ..
Hier http://repos.opensuse.org/Kernel:/HEAD/openSUSE_10.2/ habe ich letztens einen prima passenden Suse-Kernel gefunden. -- Viele Grüße ------------------------------------------------------------------------ Michael ________________________________________________________________________ PROSTEP AG, Dolivostraße 11, D-64293 Darmstadt HR: Amtsgericht Darmstadt, HRB 8383 Vorstand: Dr. Bernd Pätzold (Vorsitz), Reinhard Betz Aufsichtsrat: Dr. Heinz-Gerd Lehnhoff (Vorsitz) ________________________________________________________________________ -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Michael Behrens schrieb:
Am Samstag, 10. März 2007 21:02 schrieb Günther Zisham:
..
Nun habe ich versucht, die Suse-Patches (patches.arch, patches.drivers, patches.fixes,...) auf die 2.6.20.2 anzuwenden, was überhaupt nicht funktioniert hat (..,"Reversed (or previously applied) patch detected"...). ..
Hier http://repos.opensuse.org/Kernel:/HEAD/openSUSE_10.2/ habe ich letztens einen prima passenden Suse-Kernel gefunden.
Vielen Dank, das hilft mir schon mal etwas weiter. Ich muß mir aber noch überlegen, wie ich noch ein paar Patches (ipmisensors/bmcsensors ist leider noch nicht im offiziellen Kernel) und meine eigene Kernel-Konfiguration da hineinbringe. Danke, Günther -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Moin, lang, lang ist's her, aber vielleicht hilft's ja noch... On Tue, 06 Mar 2007, 21:17:06 +0100, Günther Zisham wrote:
[...] habe momentan grundlegende Probleme mit NFS. [...] Wenn ich jetzt aber einen Link erzeuge (altes Verzeichnis vorher umbenannt): ln -s /lw/snap1/mail /var/spool/mail (das Verzeichnis gibt es dort auf /lw/snap1/)
und es dann durch Postfix verwenden lasse (Mails darauf ablegen möchte), kommen seltsame Lock-Fehler:
# l /lw/snap1/mail total 0 drwxrwxrwx 2 root root 37 Mar 6 20:54 ./ drwxrwxrwx 10 root root 130 Mar 3 22:04 ../ -rw------- 1 office users 0 Mar 6 20:54 office ---------- 1 office users 0 Mar 6 20:54 office.lock
# mailq -Queue ID- --Size-- ----Arrival Time---- -Sender/Recipient------- 0B68B4C38F* 1200 Tue Mar 6 20:53:03 root@localhost root@localhost
7998F4C3CC 1200 Tue Mar 6 20:54:01 root@localhost (cannot update mailbox /var/mail/office for user office. unable to create lock file /var/mail/office.lock: File exists) office@localhost root@localhost
... Mar 6 20:55:06 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:55:06 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:55:06 s1 kernel: lockd: failed to monitor snap1 Mar 6 20:55:37 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:55:37 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:55:37 s1 kernel: lockd: failed to monitor snap1 Mar 6 20:56:08 s1 kernel: statd: server localhost not responding, timed out Mar 6 20:56:08 s1 kernel: lockd: cannot monitor snap1 Mar 6 20:56:08 s1 kernel: lockd: failed to monitor snap1 ... Es läuft ein 2.6.20.1-Kernel (Vanilla, fast ohne zusätzliche Patches, außer einen ipmi-Patch), das Problem tritt aber auch beim Original-2.6.18-Kernel von Suse auf, wenn auch nicht ständig (mal geht es für ein paar Stunden, dann steht es wieder für eine Stunde).
Hier liegt genau das Problem/die Ursache. NFS-Locking passiert in einem nicht-SUSE Kernel in einem Userspace-Daemon ("rpc.statd"), der normalerweise zum nfs-utils Paket gehoert. In einem SUSE Kernel laeuft dies aber in einem Kernel-Thread, so dass der rpc.statd eben nicht mehr benoetigt wird und deshalb auch gar nicht im nfs-utils Paket enthalten ist :-( seit openSUSE 10.3 unterscheidet sich der SUSE Kernel - Gott sei Dank - nicht mehr ;-). Falls du noch eine Loesung fuer die 10.2 brauchen solltest, ich habe mal die zwei Dateien angehaengt, mit denen ich aus dem Original-SRPM zwei RPMs baue, von denen das neue "nfs-utils-statd" dann auch mit einem Vanilla-Kernel genutzt werden kann. Hier ein Kochrezept, wie du die Dinger verwendest: rpm2cpio /pfad/zu/dem/original/oder/update/nfs-utils.src.rpm | cpio -ivm patch -b < /pfad/zu/anhaengendem/nfs-utils.spec.diff cp /pfad/zu/anhaengendem/nfsserver.init.diff . mkdir `pwd`/root-`uname-i` env BUILD_RPM_BUILD_STAGE="-ba" build --root `pwd`/root-`uname-i` nfs-utils.spec Die dann erzeugten RPMS findest du unter: `pwd`/root-`uname-i`/usr/src/packages/RPMS/i586 (oder x86_64) `pwd`/root-`uname-i`/usr/src/packages/SRPMS
Wo kann ich noch nachforschen, welche Dienste sollten noch laufen, welche Mechanismen sind für's Locking zuständig?
Besten Dank im voraus, Günther
HTH, cheers. l8er manfred
participants (5)
-
Günther Zisham
-
Manfred Hollstein
-
Michael Behrens
-
Sandy Drobic
-
Thomas Hertweck