Systemstillstand - Hardware- oder Softwareproblem ?
Ein (fast) neuer Rechner (Athlon 64 4400, Board Asus A8V, Suse 10.0) hat folgendes Problem: Per NFS ist ein Verzeichznis freigegeben. Über diese Freigabe wird im Hintergrund von einem anderen Rechner eine große Datei (250Mb) herunterkopiert. An diesem Rechner starte ich nun Konqueror und surfe im Internet. Der Internetzugang wird auch über einem anderen Rechner bereitgestellt, geht dann über dieselbe Netzwerkleitung, über die auch schon die Datei kopiert wird. Nun kriege ich innerhalb kürzester Zeit einen Systemstillstand (Mauszeiger läßt sich nicht mehr bewegen, alles 'tot'). Innerhalb von 10 Minuten konnte ich das dreimal provozieren. Was könnte die Ursache sein ? Ist das ein bekannter Bug der Suse 10.0 ? Onlineupdatetechnisch ist der Rechner aktuell. Jürgen -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Jürgen Hochwald schrieb:
Ein (fast) neuer Rechner (Athlon 64 4400, Board Asus A8V, Suse 10.0) hat folgendes Problem:
Per NFS ist ein Verzeichznis freigegeben. Über diese Freigabe wird im Hintergrund von einem anderen Rechner eine große Datei (250Mb) herunterkopiert.
An diesem Rechner starte ich nun Konqueror und surfe im Internet. Der Internetzugang wird auch über einem anderen Rechner bereitgestellt, geht dann über dieselbe Netzwerkleitung, über die auch schon die Datei kopiert wird.
Nun kriege ich innerhalb kürzester Zeit einen Systemstillstand (Mauszeiger läßt sich nicht mehr bewegen, alles 'tot'). Innerhalb von 10 Minuten konnte ich das dreimal provozieren.
Was könnte die Ursache sein ? Ist das ein bekannter Bug der Suse 10.0 ? Onlineupdatetechnisch ist der Rechner aktuell.
Welche Platte(n) sind/ist eingebaut? IDE/SCSI/... Auf welches Dateisystem kopierst du? Wie groß sind die Platte(n)? Wie viel Speicher ist noch frei? Ist DMA eingeschaltet? Verdacht: Eher nicht, denn dann muss die CPU das mit übernehmen und wird dann wohl langsam. Passiert der Stillstand nur, wenn du auch kopierst? Passiert der Stillstand auch, wenn du nur kopieren lässt? Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Am Donnerstag, 29. Juni 2006 23:35 schrieb Martin Ereth:
Welche Platte(n) sind/ist eingebaut? IDE/SCSI/... Auf welches Dateisystem kopierst du? Wie groß sind die Platte(n)? Wie viel Speicher ist noch frei? In dem Rechner sind zwei IDE-Patten, nur eine wird für Linux genutzt. Größe 160 Mb, auf root 15% belegt, auf home 9%. Dateisystem ist Reiserfs. DMA ist eingeschaltet (Modus DMA an in Yast, aber keine spezielle Auswahl wie 'UltraDMA100' oder so). auch mit hdparm geprüft.
Ist DMA eingeschaltet? Verdacht: Eher nicht, denn dann muss die CPU das mit übernehmen und wird dann wohl langsam.
Passiert der Stillstand nur, wenn du auch kopierst? Passiert der Stillstand auch, wenn du nur kopieren lässt?
heute habe ich den Test in die andere Richtung gemacht: Der Problemrechner importiert ein Verzeichnis per NFS von einem anderen Rechner, auf dem Problemrechner wird auch der Kopiervorgang gestartet. Dann reichen teilweise nur heftige Mausbewegungen, un den Rechner zum Stillstand zu bringen. Während des Kopiervorganges ist auch das Internet nicht mehr nutzbar (geht über dieselbe Netzwerkstrippe, sofern der Rechner nicht schon vorher absemmelt). Das Aufrufen einer einfachen HTML-Seite (ca .30kb) dauert mehr als 5 Minuten (mit DSL). Das Bandbreitenmanagement scheint wohl ziemlich daneben zu sein ...? Ach ja, das Netzwerk ist noch 10Mbit Koax, das dürfe aber nicht das Problem sein. Jürgen -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Hallo, Am Fre, 30 Jun 2006, Jürgen Hochwald schrieb:
heute habe ich den Test in die andere Richtung gemacht: Der Problemrechner importiert ein Verzeichnis per NFS von einem anderen Rechner, auf dem Problemrechner wird auch der Kopiervorgang gestartet. Dann reichen teilweise nur heftige Mausbewegungen, un den Rechner zum Stillstand zu bringen.
Während des Kopiervorganges ist auch das Internet nicht mehr nutzbar (geht über dieselbe Netzwerkstrippe, sofern der Rechner nicht schon vorher absemmelt). Das Aufrufen einer einfachen HTML-Seite (ca .30kb) dauert mehr als 5 Minuten (mit DSL). Das Bandbreitenmanagement scheint wohl ziemlich daneben zu sein ...?
Das riecht verdammt nach Ressourcen-Konflikt (IRQ, IO-Port o.ae.) Gibt /var/log/messages was her? Es kann aber auch ein Hardwareproblem sein, da kommt's drauf an, was (nicht) in der messages steht. -dnh -- PANIC YE NOT: go have a drink -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Nach was muß sich da suchen, das einzige verdächtige sind die 'Lost Interrupt', ansonsten die normalen kernel-Bootmeldungen. Jürgen .... Jun 30 22:08:27 bastau su: FAILED SU (to root) cfjh on /dev/pts/3 Jun 30 22:13:49 bastau kernel: NETDEV WATCHDOG: eth0: transmit timed out Jun 30 22:13:49 bastau kernel: eth0: Tx timed out, lost interrupt? TSR=0x3, ISR=0x3, t=55. Jun 30 22:14:53 bastau kernel: NETDEV WATCHDOG: eth0: transmit timed out Jun 30 22:14:53 bastau kernel: eth0: Tx timed out, lost interrupt? TSR=0x3, ISR=0x3, t=60. Jun 30 22:17:22 bastau syslog-ng[5540]: syslog-ng version 1.6.8 starting Jun 30 22:17:22 bastau syslog-ng[5540]: Changing permissions on special file /dev/xconsole Jun 30 22:17:22 bastau syslog-ng[5540]: Changing permissions on special file /dev/tty10 ..... -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Hier noch was ähnliches ... Jul 1 17:21:32 bastau mDNSResponder (Engineering Build) (Sep 9 2005 17:22:16) [5992]: starting Jul 1 17:21:35 bastau kernel: klogd 1.4.1, log source = /proc/kmsg started. Jul 1 17:21:35 bastau kernel: hda: dma_intr: status=0x58 { DriveReady SeekComplete DataRequest } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: hda: status timeout: status=0xd0 { Busy } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: hda: DMA disabled Jul 1 17:21:35 bastau kernel: hdb: DMA disabled Jul 1 17:21:35 bastau kernel: hda: drive not ready for command Jul 1 17:21:35 bastau kernel: hdb: set_drive_speed_status: status=0x58 { DriveReady SeekComplete DataRequest } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: ide0: reset: success -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Am Samstag, 1. Juli 2006 17:41 schrieb Jürgen Hochwald:
Hier noch was ähnliches ...
Jul 1 17:21:32 bastau mDNSResponder (Engineering Build) (Sep 9 2005 17:22:16) [5992]: starting Jul 1 17:21:35 bastau kernel: klogd 1.4.1, log source = /proc/kmsg started. Jul 1 17:21:35 bastau kernel: hda: dma_intr: status=0x58 { DriveReady SeekComplete DataRequest } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: hda: status timeout: status=0xd0 { Busy } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: hda: DMA disabled Jul 1 17:21:35 bastau kernel: hdb: DMA disabled Jul 1 17:21:35 bastau kernel: hda: drive not ready for command Jul 1 17:21:35 bastau kernel: hdb: set_drive_speed_status: status=0x58 { DriveReady SeekComplete DataRequest } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: ide0: reset: success
Das kommt mir bekannt vor: Obwohl sowohl IDE-Controller als auch die Festplatte laut Hersteller UDMA-133 vertragen sollten schmierte mir die Kiste auch immer ab (selbe Symptome wie bei Dir, selbe Logs). Nachdem ich von UDMA-133 auf UDMA-66 gestellt hatte ist kein Hänger mehr aufgetreten. Gruss Mario
Am Samstag, 1. Juli 2006 17:51 schrieb Mario van der Linde:
Das kommt mir bekannt vor: Obwohl sowohl IDE-Controller als auch die Festplatte laut Hersteller UDMA-133 vertragen sollten schmierte mir die Kiste auch immer ab (selbe Symptome wie bei Dir, selbe Logs). Nachdem ich von UDMA-133 auf UDMA-66 gestellt hatte ist kein Hänger mehr aufgetreten. Ich hatte in yast lediglich 'DMA an' eingestellt, aber nicht einen Eintrag mit einer expliziten Geschwindigkeit. Oder ist das genau der Fehler - ich muß die DMA-Geschwindihkeit explizit angeben, weil sonst eine falsche Einstellung gesetzt wird.
Inzwischen hatte ich es heute öfters, das die Kiste schon beim Booten (wo man das grüne 'done' sieht) einfach stehen geblieben ist. Jürgen -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Hallo, Am Sam, 01 Jul 2006, Jürgen Hochwald schrieb:
Hier noch was ähnliches ...
Jul 1 17:21:32 bastau mDNSResponder (Engineering Build) (Sep 9 2005 17:22:16) [5992]: starting Jul 1 17:21:35 bastau kernel: klogd 1.4.1, log source = /proc/kmsg started. Jul 1 17:21:35 bastau kernel: hda: dma_intr: status=0x58 { DriveReady SeekComplete DataRequest } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: hda: status timeout: status=0xd0 { Busy } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: hda: DMA disabled Jul 1 17:21:35 bastau kernel: hdb: DMA disabled Jul 1 17:21:35 bastau kernel: hda: drive not ready for command Jul 1 17:21:35 bastau kernel: hdb: set_drive_speed_status: status=0x58 { DriveReady SeekComplete DataRequest } Jul 1 17:21:35 bastau kernel: ide: failed opcode was: unknown Jul 1 17:21:35 bastau kernel: ide0: reset: success
*au* - Pruefe die IRQ-Verteilung => /proc/interrupts - Setze den DMA-Modus von hda und hdb mal niedriger => hdparm '-X 65' fuer den Anfang, bzw. schau, wie du das Yast beibiegst => /etc/sysconfig/ide => DEVICES_FORCE_IDE_DMA="/dev/hda:udma2 /dev/hdb:udma2" - Pruefe die IDE-Kabel - Pruefe, ob du ein Hitzeproblem hast / ob die Luefter laufen... - ... -dnh -- "Real stupidity beats artificial intelligence every time." -- Bursar 1 - Hex 0 (Terry Pratchett, Hogfather) -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Die Probleme wurden im Laufe des Tages immer schlimmer, zum Schluß ist die Kiste schon während des Bootens (also noch VOR der grafischen Benutzeranmeldung) stehen geblieben. Da ich weiterkommen muß, habe ich jetzt in der Nacht SL 10.1 installiert. Hier hatte ich (allerdings bis jetzt nur ein einziges mal) einen Hänger während des Startes von KDE gleich nach der Neuinstallation (KDE wurde also das allerserte mal gestartet). Jürgen Hier die Proc/interrupts: (Im Bios ist Plug&Pray-OS auf 'no' gesetzt.) CPU0 CPU1 0: 871549 0 IO-APIC-edge timer 1: 3678 0 IO-APIC-edge i8042 8: 0 0 IO-APIC-edge rtc 9: 0 0 IO-APIC-level acpi 12: 73540 0 IO-APIC-edge i8042 14: 94205 0 IO-APIC-edge ide0 15: 10314 0 IO-APIC-edge ide1 169: 0 0 IO-APIC-level libata 177: 0 0 IO-APIC-level ehci_hcd:usb1, uhci_hcd:usb2, uhci_h cd:usb3, uhci_hcd:usb4, uhci_hcd:usb5 185: 632610 0 IO-APIC-level skge, eth1 193: 3637 0 IO-APIC-level VIA8237 NMI: 590 214 LOC: 871507 871909 ERR: 0 MIS: 0 -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Am Donnerstag, 29. Juni 2006 21:46 schrieb Jürgen Hochwald:
Nun kriege ich innerhalb kürzester Zeit einen Systemstillstand (Mauszeiger läßt sich nicht mehr bewegen, alles 'tot'). Innerhalb von 10 Minuten konnte ich das dreimal provozieren.
Was könnte die Ursache sein ? Ist das ein bekannter Bug der Suse 10.0 ? Onlineupdatetechnisch ist der Rechner aktuell.
Hi :) Ich glaube zwar kaum, das du NFS in Version 4 einsetzt, aber damit hatte ich ähnliche Probleme. Hier hatte ich auf dem NFS-Server massenweise RPC-Fehler in /var/log/messages. Im Normalfall sollte NFS 3 laufen. Poste mal die relevanten Teile deiner /etc/fstab. Gruß Udo -- /* Host controller interrupts must not be running while calling this * function or the penguins will get angry. */ linux-2.2.16/drivers/usb/ohci.c -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Am Donnerstag, 29. Juni 2006 21:46 schrieb Jürgen Hochwald:
Was könnte die Ursache sein ? Ist das ein bekannter Bug der Suse 10.0 ? Onlineupdatetechnisch ist der Rechner aktuell.
Es gibt anscheinend bei ein paar wenigen Rechnern Probleme mit dem Kernel der SUSE 10.0, die zum kompletten Einfrieren des Rechners führen. Hatte die selben Probleme mit meinem Centrino Notebook. Seit 10.1 hat sich das glücklicherweise erledigt. -- Machs gut | http://www.iivs.de/schwinde/buerger/tremmel/ | http://packman.links2linux.de/ Manfred | http://www.knightsoft-net.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
Nachem sich unter Suse 10.1 nach anfänglich problemlosen Betrieb auch wieder die Systemstillstände wiederholten, hatte ich den Rechner wieder zurückgebracht. Dortige Tests zeigten ein Problem/Defekt des Motherboard (Asus A8N), die Southbridge/Northbridge war defekt. Jürgen -- Um die Liste abzubestellen, schicken Sie eine Mail an: suse-linux-unsubscribe@suse.com Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: suse-linux-help@suse.com
participants (6)
-
David Haller
-
Jürgen Hochwald
-
Manfred Tremmel
-
Mario van der Linde
-
Martin Ereth
-
Udo Neist