
Hallo, in mehr oder weniger regelmäßigen Abständen friert der Rechner ein (keine Reaktion auf irgendeine Taste, nur Reset möglich) oder unterbricht alle Netzwerkverbindungen (LAN und DSL). Suse 9.0, Kernel 2.4... Was sollen mir solche Fehlermedungen sagen? Schon jetzt vielen Dank für die Hilfe. Marcel Irsfeld Nov 30 20:40:35 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=90 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=50 Nov 30 20:40:35 server last message repeated 3 times Nov 30 20:40:35 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=99 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=59 Nov 30 20:40:35 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=97 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=57 Nov 30 20:40:36 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=90 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=50 Nov 30 20:40:36 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=90 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=50 Nov 30 20:40:36 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:1418:0013:0001:0000:0000:0000:0001 LEN=89 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=49 Nov 30 20:40:37 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=95 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=55 Nov 30 20:40:37 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:a83e:0000:0000:0000:0002:0030 LEN=95 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=55 Nov 30 20:40:37 server kernel: SuSE-FW-OUT-IPv6_PROHIB IN= OUT=eth0 SRC=fe80:0000:0000:0000:0204:61ff:fe4d:a648 DST=2001:0503:231d:0000:0000:0000:0002:0030 LEN=90 TC=0 HOPLIMIT=64 FLOWLBL=0 PROTO=UDP SPT=32769 DPT=53 LEN=50 Nov 30 20:39:33 server pppd[1088]: Couldn't increase MRU to 1500 Nov 30 20:39:38 server kernel: isdn_dc2minor: di(0) ch(- 1072539488) invalid Nov 30 20:39:38 server kernel: ip6_tables: (C) 2000-2002 Netfilter core team Nov 30 20:39:38 server kernel: ip_tables: (C) 2000-2002 Netfilter core team Nov 30 20:39:38 server kernel: ip_conntrack version 2.1 (2047 buckets, 16376 max) - 304 bytes per conntrack Nov 30 20:39:38 server kernel: PCI: 00:1d.7 PCI cache line size set incorrectly (0 bytes) by BIOS/FW. Nov 30 20:39:38 server kernel: PCI: 00:1d.7 PCI cache line size corrected to 32. Nov 30 20:39:38 server kernel: usb-uhci.c: Detected 2 ports Nov 30 20:39:38 server last message repeated 3 times Nov 30 20:39:46 server named[1731]: binding TCP socket: address in use Nov 30 20:20:31 server pppd[1197]: Couldn't increase MRU to 1500 Nov 30 20:20:37 server pppd[1197]: Doing disconnect Nov 30 20:20:46 server kernel: eth1: Too much work at interrupt, IntrStatus=0x0040. Nov 30 20:21:18 server last message repeated 13 times Nov 30 20:22:27 server last message repeated 3 times Nov 30 20:23:28 server last message repeated 23 times Nov 30 20:24:29 server last message repeated 15 times Nov 30 20:25:30 server last message repeated 22 times Nov 30 20:26:32 server last message repeated 12 times Nov 30 20:27:33 server last message repeated 25 times Nov 30 20:27:35 server pppd[5211]: Couldn't increase MRU to 1500 Nov 30 20:27:35 server kernel: eth1: Too much work at interrupt, IntrStatus=0x0040. Nov 30 20:27:42 server pppd[5260]: Couldn't increase MRU to 1500 Nov 30 20:28:05 server kernel: eth1: Too much work at interrupt, IntrStatus=0x0040. Nov 30 20:28:36 server last message repeated 11 times Nov 30 20:29:36 server last message repeated 22 times Nov 30 20:30:38 server last message repeated 24 times Nov 30 20:30:53 server last message repeated 6 times Nov 30 20:30:54 server pppd[5375]: Couldn't increase MRU to 1500 Nov 30 20:31:05 server kernel: eth1: Too much work at interrupt, IntrStatus=0x0040. Nov 30 20:31:36 server last message repeated 13 times

Hallo, Am Dienstag, 30. November 2004 21:29 schrieb Marcel Irsfeld:
Hier scheint es irgendwie Probleme mit der SuSE-Firewall zu geben. Schalte diese doch mal testweise ab.
Ist das nur dann, wenn du online bist?
Scheint so, als wären da zu viele Hardwareteile auf diesem IRQ. Guck doch mal mit cat /proc/interrupts nach, welche HW da noch drauf sitzt. Dann vergib vielleicht mal an die anderen Module irgendwelche Parameter, sodass sie einen anderen IRQ verwenden, oder tausche (sofern möglich) mal Steckplätze, wobei das sehr schnell sehr nervig werden kann...
Gruß Sören

On 30 Nov 2004 at 21:57, Sören Wengerowsky wrote:
Vielen Dank für deine Mühe.
Die ganze Firewall, das möchte ich ungern. Oder soll ich nur einzelne Bereiche deaktivieren?
Das habe ich noch nicht herausgefunden.
CPU0 CPU1 0: 831277 0 IO-APIC-edge timer 1: 188 0 IO-APIC-edge keyboard 2: 0 0 XT-PIC cascade 8: 2 0 IO-APIC-edge rtc 12: 20549 0 IO-APIC-edge PS/2 Mouse 14: 26789 1 IO-APIC-edge ide0 15: 2332 0 IO-APIC-edge ide1 16: 0 0 IO-APIC-level usb-uhci, usb-uhci 17: 5807 0 IO-APIC-level eth0, Intel ICH5 18: 0 0 IO-APIC-level usb-uhci 19: 0 0 IO-APIC-level usb-uhci 21: 381103 164681 IO-APIC-level eth1 22: 15 0 IO-APIC-level fcpci 23: 15237 9440 IO-APIC-level ide2, ide3, ehci_hcd NMI: 0 0 LOC: 832832 873142 ERR: 0 MIS: 0 Ist das so richtig? Wie kann ich denn irgendwelche Parameter vergeben? Marcel

Am Dienstag, 30. November 2004 23:17 schrieb Marcel Irsfeld:
Hm.. ist der Rechner im Produktiveinsatz? Ansonsten mach die einfach mal weg... Kannst ja vorher noch n YOU laufen lassen, um sicher zu sein, dass die Dienste halbwegs auf dem neusten Stand (bug-fix) sind.
Versuch das mal. Das könnte das Problem sehr eingrenzen (evtl noch IPv6 deaktivieren..). Ich habe aber sowieso die IRQs im Verdacht.
Wo ich hier grade solche Fehlermeldungen sehe: Nov 30 20:28:05 server kernel: eth1: Too much work at interrupt, Denke ich mal, dass du auch etwas erreichen könntest, wenn du am bootprompt noapic angibst. Denn APIC ist in dem Fall mit eth1 auf einem IRQ.
Ist das so richtig? Wie kann ich denn irgendwelche Parameter vergeben?
Wenn dann in der Modules.conf oder am bootloader. Das kommt aber auf die Module an, die für welche Hardware geladen werden. Das (sofern möglich) umstecken bzw. herausnehmen von Hardware ist sicher erstmal einfacher, sofern du nicht darauf bestehst, auf jeden IRQ nur eine HW zu lassen.. Was ist eth1 für ein Gerät? Kannst du das eventuell mal entfernen und gucken, ob es dann noch auftritt? Also für mich spricht alles dafür, dass es an diesen IRQs liegt. Ich hab auch vorhin mal gegooglet: http://www.google.de/search?hl=de&q=epox+board+einfrieren+linux&btnG=Suche&m... Insbesondere das hier: http://www.onlinekosten.de/forum_archiv/showflat.php?Board=Forum10&Number=30... die ersten 10 Treffer alle das gleiche Problem... und auch so ziemlich alle die gleiche Lösung. Aber ist es wirklich der IRQ 21? Guck mal in den Logs, ob da noch was über andere interrupts steht, was irgendwie nach Fehlermeldung aussieht. BTW: mal nen memory-Test gemacht? Gruß Sören

Am Dienstag, 30. November 2004 23:17 schrieb Marcel Irsfeld:
On 30 Nov 2004 at 21:57, Sören Wengerowsky wrote:
Ich habe inzwischen das Board ausgetauscht. Das Problem besteht weiterhin, sobald die auf bestimmte Verzeichnisse der gespiegelten Festplate zugreife. Wie kann ich diese synchronisieren? Welche Auswirkungen haben Fehler dann auf der HD1? Oders soll ich besser die HD1 neu auf die HD2 spiegeln? Vielen Dank. Marcel -- GMX ProMail mit bestem Virenschutz http://www.gmx.net/de/go/mail +++ Empfehlung der Redaktion +++ Internet Professionell 10/04 +++

Am Freitag, 3. Dezember 2004 17:01 schrieb Marcel Irsfeld:
Wie kann ich diese synchronisieren?
Willst du jetzt die Daten der kaputten Platte auf eine andere übertragen? oder ein Raid aufbauen..?
Welche Auswirkungen haben Fehler dann auf der HD1?
Tja.. also irgendwie kann ich dir nicht so richtig folgen... Mach mal ein Dateisystemcheck von Knoppix aus. Das bringt uns vielleicht mehr weiter, wenn du schon festgestellt hast, dass es an der Platte liegt. Einfach auf eine andere Platte zu kopieren um dann zu gucken, obs daran lag, halte ich für etwas zu aufwendig. Welches Dateisystem verwendest du? ReiserFS? Dann mach mal von Knoppix aus: reiserfsck --check /dev/sonstewas und falls es Fehler ergibt: reiserfsck --fix-fixable /dev/sonstewas HTH Gruß Sören

Am Dienstag, 30. November 2004 21:58 schrieb Roland May:
Ich weiss ja nicht, was Du für ein Board hast, bzw. wie aktuell das ist. Aber bevor Du anfängst, die Karten umzustöpseln würde ich erst den Versuch machen, am Bootprompt von Grub (vorausgesetzt, Du benutzt Grub - wie das bei Lilo funktioniert kann ich Dir nicht sagen) den Bootparameter <apic> und/oder <pci=bios> anzugeben. Das hat bei mir zu einer ziemliche Entlastung und Entspannung bei der IRQ-Verteilung geführt. Ich denke nicht, dass Du da viel Schaden mit anrichten kannst (falls ich falsch liege möge mich bitte jemand berichtigen). Gruss Mario

[...]
Hat bei mir nicht geholfen
Ganz sooooo schlimm sind 15 Monate ja auch nicht.
und Epox
Aber das ist schlimm. Ich hatte dieses Board auch mal, und ähnliche Probleme. Tlw. Nicht reproduzierbar, sporadisch und unerklärlich. Ich habe damals viel Zeit und Energie investiert. Letztendlich habe ich das Teil einfach in die Tonne geschmissen. Asus, Gigabyte und Asrock sind heute meine Favoriten. -- mit freundlichen Grüßen Roland Kruggel -- cu Roland Kruggel mailto: rk-liste at bbf7 dot de // PM mailto: rkruggel at bbf7 dot de System: Intel 3.2Ghz, Debian sid, 2.6.7, KDE 3.3.1

Hallo Marcel, das selbige Problem habe ich auch. Bei mir ist es eine SuSE 9.2, ohne DSL aber mit 2 NICs. Punkt 18.30 bleibt das Ding stehen. Vermute auch das es an den IRQs liegt. Hast Du den ersten PCI Platz unter der Grafikkarte verwendet? Gruß Stefan Am Dienstag, 30. November 2004 21:29 schrieb Marcel Irsfeld:

Am Mittwoch, 1. Dezember 2004 09:54 schrieb Roland May:
Ne, das Ding steht total. Auch direkt an der Konsole ist keine Eingabe mehr möglich. Hardware ist auch schon sehr alt, setze gerade ein neues System mit neuer Hardware auf. Zudem ist der Server nicht DSL Angebunden, sondern an einer 2MBit

Hallo, Am Dienstag, 30. November 2004 21:29 schrieb Marcel Irsfeld:
Hier scheint es irgendwie Probleme mit der SuSE-Firewall zu geben. Schalte diese doch mal testweise ab.
Ist das nur dann, wenn du online bist?
Scheint so, als wären da zu viele Hardwareteile auf diesem IRQ. Guck doch mal mit cat /proc/interrupts nach, welche HW da noch drauf sitzt. Dann vergib vielleicht mal an die anderen Module irgendwelche Parameter, sodass sie einen anderen IRQ verwenden, oder tausche (sofern möglich) mal Steckplätze, wobei das sehr schnell sehr nervig werden kann...
Gruß Sören

On 30 Nov 2004 at 21:57, Sören Wengerowsky wrote:
Vielen Dank für deine Mühe.
Die ganze Firewall, das möchte ich ungern. Oder soll ich nur einzelne Bereiche deaktivieren?
Das habe ich noch nicht herausgefunden.
CPU0 CPU1 0: 831277 0 IO-APIC-edge timer 1: 188 0 IO-APIC-edge keyboard 2: 0 0 XT-PIC cascade 8: 2 0 IO-APIC-edge rtc 12: 20549 0 IO-APIC-edge PS/2 Mouse 14: 26789 1 IO-APIC-edge ide0 15: 2332 0 IO-APIC-edge ide1 16: 0 0 IO-APIC-level usb-uhci, usb-uhci 17: 5807 0 IO-APIC-level eth0, Intel ICH5 18: 0 0 IO-APIC-level usb-uhci 19: 0 0 IO-APIC-level usb-uhci 21: 381103 164681 IO-APIC-level eth1 22: 15 0 IO-APIC-level fcpci 23: 15237 9440 IO-APIC-level ide2, ide3, ehci_hcd NMI: 0 0 LOC: 832832 873142 ERR: 0 MIS: 0 Ist das so richtig? Wie kann ich denn irgendwelche Parameter vergeben? Marcel

Am Dienstag, 30. November 2004 23:17 schrieb Marcel Irsfeld:
Hm.. ist der Rechner im Produktiveinsatz? Ansonsten mach die einfach mal weg... Kannst ja vorher noch n YOU laufen lassen, um sicher zu sein, dass die Dienste halbwegs auf dem neusten Stand (bug-fix) sind.
Versuch das mal. Das könnte das Problem sehr eingrenzen (evtl noch IPv6 deaktivieren..). Ich habe aber sowieso die IRQs im Verdacht.
Wo ich hier grade solche Fehlermeldungen sehe: Nov 30 20:28:05 server kernel: eth1: Too much work at interrupt, Denke ich mal, dass du auch etwas erreichen könntest, wenn du am bootprompt noapic angibst. Denn APIC ist in dem Fall mit eth1 auf einem IRQ.
Ist das so richtig? Wie kann ich denn irgendwelche Parameter vergeben?
Wenn dann in der Modules.conf oder am bootloader. Das kommt aber auf die Module an, die für welche Hardware geladen werden. Das (sofern möglich) umstecken bzw. herausnehmen von Hardware ist sicher erstmal einfacher, sofern du nicht darauf bestehst, auf jeden IRQ nur eine HW zu lassen.. Was ist eth1 für ein Gerät? Kannst du das eventuell mal entfernen und gucken, ob es dann noch auftritt? Also für mich spricht alles dafür, dass es an diesen IRQs liegt. Ich hab auch vorhin mal gegooglet: http://www.google.de/search?hl=de&q=epox+board+einfrieren+linux&btnG=Suche&m... Insbesondere das hier: http://www.onlinekosten.de/forum_archiv/showflat.php?Board=Forum10&Number=30... die ersten 10 Treffer alle das gleiche Problem... und auch so ziemlich alle die gleiche Lösung. Aber ist es wirklich der IRQ 21? Guck mal in den Logs, ob da noch was über andere interrupts steht, was irgendwie nach Fehlermeldung aussieht. BTW: mal nen memory-Test gemacht? Gruß Sören

Am Dienstag, 30. November 2004 23:17 schrieb Marcel Irsfeld:
On 30 Nov 2004 at 21:57, Sören Wengerowsky wrote:
Ich habe inzwischen das Board ausgetauscht. Das Problem besteht weiterhin, sobald die auf bestimmte Verzeichnisse der gespiegelten Festplate zugreife. Wie kann ich diese synchronisieren? Welche Auswirkungen haben Fehler dann auf der HD1? Oders soll ich besser die HD1 neu auf die HD2 spiegeln? Vielen Dank. Marcel -- GMX ProMail mit bestem Virenschutz http://www.gmx.net/de/go/mail +++ Empfehlung der Redaktion +++ Internet Professionell 10/04 +++

Am Freitag, 3. Dezember 2004 17:01 schrieb Marcel Irsfeld:
Wie kann ich diese synchronisieren?
Willst du jetzt die Daten der kaputten Platte auf eine andere übertragen? oder ein Raid aufbauen..?
Welche Auswirkungen haben Fehler dann auf der HD1?
Tja.. also irgendwie kann ich dir nicht so richtig folgen... Mach mal ein Dateisystemcheck von Knoppix aus. Das bringt uns vielleicht mehr weiter, wenn du schon festgestellt hast, dass es an der Platte liegt. Einfach auf eine andere Platte zu kopieren um dann zu gucken, obs daran lag, halte ich für etwas zu aufwendig. Welches Dateisystem verwendest du? ReiserFS? Dann mach mal von Knoppix aus: reiserfsck --check /dev/sonstewas und falls es Fehler ergibt: reiserfsck --fix-fixable /dev/sonstewas HTH Gruß Sören
participants (7)
-
Marcel Irsfeld
-
Marcel Irsfeld
-
Mario van der Linde
-
Roland M. Kruggel
-
Roland May
-
Stefan Eggert
-
Sören Wengerowsky