9.2, 2.6.8-24.19: kernel: nfsd: non-standard errno: -16
Hilfe! Der Suse-Kernel von suse 9.2 kommt auch in der aktuellesten Variante nicht mit einem schon etwas älteren ASUS A7N8X-E zurecht! NForce Chipsatz, Barton 3000, 1GB RAM, die 1GBit Netzwerkkarte ist in Betrieb. kernel: nfsd: non-standard errno: -16 oder: kernel BUG at fs/lockd/host.c:275! (bisher nur bei 2.6.8-24-standard erschienen) Der PC bleibt ca. alle 3 Stunden stehen. Es sind 5 Clients (DLC, Disklessclients) über NFS angeschlossen, die HD's (2 STück) sind S-ATA's. Bei dem neusten KErnel 2.6.8-24.19 (läuft seit 1 Stunde) gabs noch keinen Hänger, aber ich rechne jeden Augenblick damit. In der Konstellation des 2.6.8-24.14 mit Abit KV7-Mainboard und einem 3ware-Raid-SATA-Controller mit den zwei gespiegelten S-ATA's daran hat es 1/2 Jahr gut funktioniert. jmd einen Tipp? Mainboard evtl. defekt? 1GBit LAN onboard vielleicht der Schuldige? Gruss Ekkard Anhang: ======= Hier die log-Meldungen bis zu jeweiligen syslog restart nachdem der Rechner ausgeschaltet wurde: Jan 17 13:50:35 pserver kdm: thinkpad:1[21716]: pam_unix2: session started for user empf3, service xdm Jan 17 13:54:31 pserver rpc.mountd: authenticated unmount request from ersatzpc:801 for /home/win_xp (/home/win _xp) Jan 17 13:54:31 pserver kernel: nfsd: non-standard errno: -16 Jan 17 13:54:31 pserver rpc.mountd: authenticated unmount request from ersatzpc:806 for /home (/home) Jan 17 14:04:53 pserver syslogd 1.4.1: restart. 2006-01-17 18:31 () Jan 17 12:19:58 pserver FaxGetty[5832]: MODEM VER. 1.00 VOM 06.09.1997 282/ Jan 17 12:19:58 pserver FaxGetty[5832]: <-- [5:ATM0\r] Jan 17 12:19:58 pserver FaxGetty[5832]: --> [2:OK] Jan 17 12:19:58 pserver FaxGetty[5832]: MODEM input buffering disabled Jan 17 12:39:11 pserver syslogd 1.4.1: restart. Jan 17 12:39:14 pserver /etc/dev.d/block/50-hwscan.dev[5325]: new block device /block/hdc Jan 17 12:39:14 pserver /etc/dev.d/block/51-subfs.dev[5336]: mount block device /block/hdc Jan 17 11:40:54 pserver ntpdate[5394]: step time server 192.53.103.107 offset -3501.249188 sec Jan 17 11:40:54 pserver ntpd[5413]: ntpd 4.2.0a@1.1190-r Wed Jan 26 17:34:57 UTC 2005 (1) Jan 17 11:40:54 pserver ntpd[5413]: precision = 1.000 usec -- Jan 17 11:43:10 pserver nmbd[5181]: [2006/01/17 11:43:10, 0] nmbd/nmbd.c:terminate(56) Jan 17 11:43:10 pserver nmbd[5181]: Got SIGTERM: going down... Jan 17 11:43:10 pserver kernel: Kernel logging (proc) stopped. Jan 17 11:43:10 pserver kernel: Kernel log daemon terminating. Jan 17 11:43:11 pserver exiting on signal 15 Jan 17 11:46:36 pserver syslogd 1.4.1: restart. Jan 17 11:46:37 pserver /etc/dev.d/block/50-hwscan.dev[5342]: new block device /block/hdc Jan 17 11:46:37 pserver /etc/dev.d/block/51-subfs.dev[5353]: mount block device /block/hdc Jan 17 11:46:41 pserver isdnlog: (HiSax driver detected) Jan 17 11:46:41 pserver isdnlog: Jan 17 11:46:41 * Call to tei 127 from +7 218307934, Russische Forderation (ostl.), on ddddd RING (Data) Jan 17 11:46:41 pserver isdnlog: Jan 17 11:46:41 Call to tei 67 from +7 218307934, Russische Forderation (ostl.), on ddddd CONNECT (Data) -- Jan 17 13:49:57 pserver isdnlog: 17.Jan 13:49:57 * Notification: Deactivated Diversion CFNR (all services), (all) Jan 17 13:50:35 pserver kdm: thinkpad:1[21716]: pam_unix2: session started for user empf3, service xdm Jan 17 13:54:31 pserver rpc.mountd: authenticated unmount request from ersatzpc:801 for /home/win_xp (/home/win_xp) Jan 17 13:54:31 pserver kernel: nfsd: non-standard errno: -16 Jan 17 13:54:31 pserver rpc.mountd: authenticated unmount request from ersatzpc:806 for /home (/home) Jan 17 14:04:53 pserver syslogd 1.4.1: restart. Jan 17 14:04:54 pserver isdnlog: (HiSax driver detected) Jan 17 14:04:54 pserver isdnlog: Jan 17 14:04:54 * Call to tei 127 from +7 218307934, Russische Forderation (ostl.), on ddddd RING (Data) Jan 17 14:04:54 pserver isdnlog: Jan 17 14:04:54 Call to tei 68 from +7 218307934, Russische Forderation (ostl.), on ddddd CONNECT (Data) Jan 17 14:04:54 pserver isdnlog: Jan 17 14:04:54 Call to tei 68 from +7 218307934, Russische Forderation (ostl.), on ddddd INTERFACE ippp1 called by 007218307934 Jan 17 14:04:54 pserver isdnlog: OK 0^M ------ Jan 17 16:40:38 pserver sshd[27642]: Accepted publickey for cleo from ::ffff:192.168.10.9 port 32791 ssh2 Jan 17 16:40:39 pserver dollar1: cleo Jan 17 17:07:20 pserver syslogd 1.4.1: restart. ---- Jan 17 21:07:25 pserver FaxGetty[6309]: MODEM set DTR OFF Jan 17 21:07:26 pserver su: (to david) root on /dev/console Jan 17 21:07:26 pserver su: pam_unix2: session started for user david, service su Jan 17 21:07:26 pserver su: pam_unix2: session finished for user david, service su Jan 17 21:07:27 pserver xinetd[5969]: Exiting... Jan 17 21:07:28 pserver kdm: :0[6039]: pam_unix2: session finished for user gerlach, service xdm-np Jan 17 21:07:29 pserver kernel: lockd: host still in use after nlmsvc_free_host_resources!------------[ cut here ]------------ Jan 17 21:07:29 pserver kernel: kernel BUG at fs/lockd/host.c:275! Jan 17 21:07:29 pserver kernel: invalid operand: 0000 [#4] Jan 17 21:07:29 pserver kernel: Modules linked in: af_packet thermal processor nvram usbserial parport_pc lp parport nfsd exportfs snd_pcm_oss snd_mixer_oss snd_via82xx snd_ac97_codec snd_pcm snd_timer snd_page_alloc gameport snd_mpu401_uart snd_rawmidi snd_seq_device snd ipv6 soundcore edd forcedeth sk98lin joydev sg st sr_mod hisax crc_ccitt isdn slhc ide_cd cdrom ohci1394 ieee1394 nvidia_agp agpgart ehci_hcd ohci_hcd evdev subfs dm_mod usbcore ext3 jbd sata_sil libata sd_mod scsi_mod Jan 17 21:07:29 pserver kernel: CPU: 0 Jan 17 21:07:29 pserver kernel: EIP: 0060:[<c01acb6c>] Not tainted VLI Jan 17 21:07:29 pserver kernel: EFLAGS: 00010286 (2.6.8-24-default 20041006091623) Jan 17 21:07:29 pserver kernel: EIP is at nlm_release_host+0x1c/0x40 Jan 17 21:07:29 pserver kernel: eax: ffffffff ebx: d3982860 ecx: f6a45fd0 edx: c0327498 Jan 17 21:07:29 pserver kernel: esi: cdfd2800 edi: f9109080 ebp: cdff4260 esp: f6a45fc8 Jan 17 21:07:29 pserver kernel: ds: 007b es: 007b ss: 0068 Jan 17 21:07:29 pserver kernel: Process lockd (pid: 5843, threadinfo=f6a44000 task=f796caa0) Jan 17 21:07:29 pserver kernel: Stack: d3982860 c01afbf4 7fffffff c01ad246 fffcc680 cdfd2800 c01ad030 00000000 Jan 17 21:07:29 pserver kernel: 00000000 00000000 c0104255 cdfd2800 00000000 00000000 Jan 17 21:07:29 pserver kernel: Call Trace: Jan 17 21:07:29 pserver kernel: [<c01afbf4>] nlmsvc_invalidate_all+0x34/0x41 Jan 17 21:07:29 pserver kernel: [<c01ad246>] lockd+0x216/0x230 Jan 17 21:07:29 pserver kernel: [<c01ad030>] lockd+0x0/0x230 Jan 17 21:07:29 pserver kernel: [<c0104255>] kernel_thread_helper+0x5/0x10 Jan 17 21:07:29 pserver kernel: Code: db fe f6 ff 58 5a eb c7 8d b4 26 00 00 00 00 53 85 c0 89 c3 74 13 80 3d fc c4 45 c0 00 78 16 ff 4b 4c8b 43 4c 85 c0 78 02 5b c3 <0f> 0b 13 01 94 22 32 c0 eb f4 8d 40 18 50 68 a4 22 32 c0 e8 9c Jan 17 21:07:29 pserver FaxQueuer[5814]: QUIT Jan 17 21:07:30 pserver kernel: <4>lockd_down: lockd failed to exit, clearing pid Jan 17 21:07:30 pserver kernel: nfsd: last server has exited Jan 17 21:07:30 pserver kernel: nfsd: unexporting all filesystems Jan 17 21:07:30 pserver rpc.mountd: Caught signal 15, un-registering and exiting. Jan 17 21:07:30 pserver sshd[5728]: Received signal 15; terminating. Jan 17 21:07:31 pserver nmbd[5578]: [2006/01/17 21:07:31, 0] nmbd/nmbd.c:terminate(56) Jan 17 21:07:31 pserver nmbd[5578]: Got SIGTERM: going down... Jan 17 21:07:31 pserver kernel: Kernel logging (proc) stopped. Jan 17 21:07:31 pserver kernel: Kernel log daemon terminating. Jan 17 21:07:32 pserver exiting on signal 15 Jan 17 21:30:49 pserver syslogd 1.4.1: restart. -- Jan 18 14:30:13 pserver xinetd[5799]: Exiting... Jan 18 14:30:14 pserver kdm: :0[5867]: pam_unix2: session finished for user gerlach, service xdm-np Jan 18 14:30:14 pserver kdm: :0[5867]: pam_setcred(DELETE_CRED) for gerlach failed: System error Jan 18 14:30:14 pserver kernel: lockd: host still in use after nlmsvc_free_host_resources!------------[ cut here ]------------ Jan 18 14:30:14 pserver kernel: kernel BUG at fs/lockd/host.c:275! Jan 18 14:30:14 pserver kernel: invalid operand: 0000 [#1] Jan 18 14:30:14 pserver kernel: Modules linked in: nls_utf8 nvram usbserial parport_pc lp parport nfsd exportfs snd_pcm_oss snd_mixer_oss snd_via82xx snd_ac97_codec snd_pcm snd_timer snd_page_alloc gameport snd_mpu401_uart snd_rawmidi snd_seq_device snd soundcore ipv6 hisax crc_ccitt isdn slhc edd joydev sg st sr_mod ide_cd cdrom subfs forcedeth sk98lin ehci_hcd ohci_hcd nvidia_agp agpgart ohci1394 ieee1394 evdev dm_mod usbcore ext3 jbd sata_sil libata sd_mod scsi_mod Jan 18 14:30:14 pserver kernel: CPU: 0 Jan 18 14:30:14 pserver kernel: EIP: 0060:[<c01ad0cc>] Not tainted VLI Jan 18 14:30:14 pserver kernel: EFLAGS: 00010286 (2.6.8-24.14-default SL92_BRANCH-200503290927430000) Jan 18 14:30:14 pserver kernel: EIP is at nlm_release_host+0x1c/0x40 Jan 18 14:30:14 pserver kernel: eax: ffffffff ebx: c7383160 ecx: f69f1fd0 edx: c0327bec Jan 18 14:30:14 pserver kernel: esi: c19a2e00 edi: f9112080 ebp: cdff47a0 esp: f69f1fc8 Jan 18 14:30:14 pserver kernel: ds: 007b es: 007b ss: 0068 Jan 18 14:30:14 pserver kernel: Process lockd (pid: 5707, threadinfo=f69f0000 task=f7f2baa0) Jan 18 14:30:14 pserver kernel: Stack: c7383160 c01b0154 7fffffff c01ad7a6 fffdec72 c19a2e00 c01ad590 00000000 Jan 18 14:30:14 pserver kernel: 00000000 00000000 c0104255 c19a2e00 00000000 00000000 Jan 18 14:30:14 pserver kernel: Call Trace: Jan 18 14:30:14 pserver kernel: [<c01b0154>] nlmsvc_invalidate_all+0x34/0x41 Jan 18 14:30:14 pserver kernel: [<c01ad7a6>] lockd+0x216/0x230 Jan 18 14:30:14 pserver kernel: [<c01ad590>] lockd+0x0/0x230 Jan 18 14:30:14 pserver kernel: [<c0104255>] kernel_thread_helper+0x5/0x10 Jan 18 14:30:14 pserver kernel: Code: 0b fa f6 ff 58 5a eb c7 8d b4 26 00 00 00 00 53 85 c0 89 c3 74 13 80 3d 7c c5 45 c0 00 78 16 ff 4b 4c 8b 43 4c 85 c0 78 02 5b c3 <0f> 0b 13 01 e6 29 32 c0 eb f4 8d 40 18 50 68 f6 29 32 c0 e8 cc Jan 18 14:30:14 pserver FaxQueuer[5772]: QUIT Jan 18 14:30:15 pserver kernel: <4>lockd_down: lockd failed to exit, clearing pid Jan 18 14:30:15 pserver kernel: nfsd: last server has exited Jan 18 14:30:15 pserver kernel: nfsd: unexporting all filesystems Jan 18 14:30:15 pserver rpc.mountd: Caught signal 15, un-registering and exiting. Jan 18 14:30:15 pserver sshd[5569]: Received signal 15; terminating. Jan 18 14:30:16 pserver modprobe: FATAL: Could not load /lib/modules/2.6.8-24.14-default/modules.dep: No such file or directory Jan 18 14:30:16 pserver last message repeated 9 times Jan 18 14:30:16 pserver nmbd[5478]: [2006/01/18 14:30:16, 0] nmbd/nmbd.c:terminate(56) Jan 18 14:30:16 pserver nmbd[5478]: Got SIGTERM: going down... Jan 18 14:30:17 pserver kernel: Kernel logging (proc) stopped. Jan 18 14:30:17 pserver kernel: Kernel log daemon terminating. Jan 18 14:30:18 pserver exiting on signal 15 Jan 18 14:32:06 pserver syslogd 1.4.1: restart.
Kernel 2.6.x bis mindestens einschliesslich x=13 hatten etliche Probleme mit NFS (siehe auch Kernel Bugliste). Wir haben mehrere Tage damit verbracht, Problemen auf die Spur zu kommen unter FC4. Ich weiss nicht, inwieweit SuSE die Patches zurueckportiert hat - schau Dir mal die Kernel Bugliste an und probiere evtl. einen spaeteren Kernel (dann allerdings mit Update von udev, etc.). Cheers, Th.
Hallo Thomas, * Thomas Hertweck schrieb:
Kernel 2.6.x bis mindestens einschliesslich x=13 hatten etliche Probleme mit NFS (siehe auch Kernel Bugliste). Wir haben mehrere Tage damit verbracht, Problemen auf die Spur zu kommen unter FC4. Ich weiss nicht, inwieweit SuSE die Patches zurueckportiert hat - schau Dir mal die Kernel Bugliste an und probiere evtl. einen spaeteren Kernel (dann allerdings mit Update von udev, etc.).
Der im OP genannte Kernel von Suse, die 2.6.8-24.19 scheint den Bug gefixt zu haben. Das System läuft seit 30 Stunden mit 5 DLC (Disk less clients, angebunden über NFS) und 3 XDMCP Clients störungsfrei , also ohne Absturz (Suse sei an dieser Stelle große Dank ausgesprochen für das backward fixing!!!!), allerding läuft auch ein Prozess, der alle 2 Sekunden sync't: nohup bash -c "while true; do sync; sleep 2; done" http://www.linuxburg.de
Cheers, Th.
-- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
participants (2)
-
Ekkard Gerlach
-
Thomas Hertweck