Instabilität von OpenSuSE 10.3 auf Asus K8N4-E
Hallo Liste, ich habe eine Frage bezüglich der Stabilität von OpenSuSE 10.3 mit Kernel 2.6.22.17-0.1. Ich vermute, dass hier auch der Zusammenhang mit einem von mir bereits zuvor geschilderten Problem unter dem Titel "shutdown Probleme" liegt. Ich betreibe ca. 60 Rechner mit Asus K8N4-E Mainboard, 512 MB Infineon Speicher, Asus X300 Series Grafikkarte und Maxtor Festplatten. Auf allen Rechner befindet sich OpenSuSE 10.3 mit dem neusten Kernel. Leider muss ich feststellen, dass die Rechner relativ häufig abstürzen. Erst heute ist mir von 3 Kernel-Panics berichtet worden. Ich finde leider die Ursache dafür nicht. Es muss aber nicht unbedingt ein Kernel-Panic sein. Manchmal hängen sich die Rechner bereits beim Start auf (ohne blinkende Tastatur), oder eben beim Shutdown. Anfänglich dachte ich, dass es vielleicht mit dem Bios zusammen hängt. Ich habe alle verfügbaren Versionen getestet (auch unveröffentlichte Beta), jedoch ohne Erfolg. Dann kam mir der Gedanke, dass es ein Wärme-Problem ist. Alle Mainboards sind jedoch aktiv gekühlt, die Grafikkarten wurden nachträglich mit aktiven Lüftern ausgestattet. Jedoch auch ohne Erfolg. Asus selbst scheint mit seinem Latein am Ende zu sein, die Ratschläge zur Lösung des Problems werden immer schlechter. Inzwischen kamen auch Antworten wie: "reklamieren sie die Komponenten bei ihrem Händler" - wohl gemerkt es handelt sich um 60 Rechner, bei denen der Fehler sporadisch auftritt und damit ein Defekt wohl ausgeschlossen werden kann. Jetzt zu meinen Fragen: 1. Kann ein Wärme-Problem eine Kernel-Panic auslösen? 2. Hat jemand ähnliche Erfahrungen mit dieser Hardware-Kombination gemacht und kennt die Lösung? 3. Hilfe !!!!!! Vielen Dank für eure Hilfe Lars PS. Speicher ist getestet und in Ordnung -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Jetzt zu meinen Fragen: 1. Kann ein Wärme-Problem eine Kernel-Panic auslösen?
Generell ja. Habe die Erfahrung schon an einem älteren PC (allerdings unter Windows) machen dürfen. Abhilfe schaffte ein Haushaltsventilator, der vor das geöffnete Gehäuse gestellt wurde. Mit dieser "Zwangsbelüftung" lief das System stabil. Wärmeprobleme treten allerdings meist im laufenden Betrieb auf, nicht bereits beim booten (Neustart mal ausgenommen) Sind die Rechner aus einer Großserie? Möglicherweise ein Serienfehlerin der Hardware (z.B. Bus "übertaktet").
2. Hat jemand ähnliche Erfahrungen mit dieser Hardware-Kombination gemacht und kennt die Lösung?
Leider nein.
3. Hilfe !!!!!!
11880, da werden sie geholfen! Gruß Uli -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Ulrich Gehauf schrieb:
Jetzt zu meinen Fragen: 1. Kann ein Wärme-Problem eine Kernel-Panic auslösen?
Generell ja. Habe die Erfahrung schon an einem älteren PC (allerdings unter Windows) machen dürfen. Abhilfe schaffte ein Haushaltsventilator, der vor das geöffnete Gehäuse gestellt wurde. Mit dieser "Zwangsbelüftung" lief das System stabil. Das mit der Zwangsbelüftung wird leider nichts, da die Computer in Tischen fest verbaut sind, damit keiner daran hantieren kann. Im Übrigen zeigt die Hardwareüberwachung normale Temperaturen an.
Wärmeprobleme treten allerdings meist im laufenden Betrieb auf, nicht bereits beim booten (Neustart mal ausgenommen)
Sind die Rechner aus einer Großserie? Möglicherweise ein Serienfehlerin der Hardware (z.B. Bus "übertaktet").
Die Computer sind nicht aus einer Großserie. Alle selbst zusammengebaut und ausschließlich Markenkomponenten verwendet. Zu den bereits erwähnten Bauteilen kommen noch Toshiba DVD-Laufwerke und Enermax Netzteile. Ich hatte auch schon mal einen Massekurzschluss am Gehäuse in Verdacht, jedoch selbst im ausgebauten Zustand treten die selben Fehler auf. Die Computer sind nicht übertaktet. Ich hab sowohl automatische Takterkennung des Speichers getestet sowie manuelle.
2. Hat jemand ähnliche Erfahrungen mit dieser Hardware-Kombination gemacht und kennt die Lösung?
Leider nein.
3. Hilfe !!!!!!
11880, da werden sie geholfen!
Wenn die da den gleichen Schmarrn Erzählen wie Asus, dann hab ich so meine Zweifel. Ich hab eigentlich auch einen Bios-Fehler in Verdacht. Warum? Naja von Zeit zu Zeit kommt es vor, dass beim Start die Grafikkarte nicht erkannt wird. Der Rechner piept dann 3x kurz und 1x lang und startet dann ganz "normal" mit schwarzem Bildschirm Linux. Eine der Bios-Versionen erkennt zudem meine SATA Platten von Maxtor nicht. Von Hitachi hingegen schon, bzw. Maxtor-Platten einer anderen Serie ebenfalls. Da hab ich allerdings schon einen harten Kampf mit Maxtor gekämpft, die allerdings ums verrecken kein Firmware-Update für die Platten hatten, da es sich um OEM-Ware gehandelt hat. Im Nachhinein hab ich erfahren, dass die ihre Schrott-Platten an andere Firmen verschachern, die dann eine eigene Firmware einspielen. Nur komischerweise wissen sie nicht einmal, an wen sie welche Platte verkauft haben. Einfach nur Misst. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Lars Ziegler schrieb:
Ulrich Gehauf schrieb:
Jetzt zu meinen Fragen: 1. Kann ein Wärme-Problem eine Kernel-Panic auslösen?
Das mit der Zwangsbelüftung wird leider nichts, da die Computer in Tischen fest verbaut sind, damit keiner daran hantieren kann. Im Übrigen
Vielleicht liegts daran? Zu wenig Frischluftzufuhr.
zeigt die Hardwareüberwachung normale Temperaturen an.
Die misst halt nur 1 oder 2 bestimmte Punkte im System. Möglicherweise liegt das Thermoproblem aber nicht unter dem Messpunkt (z.B. im Chipsatz)
Sind die Rechner aus einer Großserie? Möglicherweise ein Serienfehlerin der Hardware (z.B. Bus "übertaktet").
Die Computer sind nicht aus einer Großserie. Alle selbst zusammengebaut und ausschließlich Markenkomponenten verwendet.
Also die einzelnen Bauteile definitiv aus unterschiedlichen Margen?
Zu den bereits erwähnten Bauteilen kommen noch Toshiba DVD-Laufwerke und Enermax Netzteile. Ich hatte auch schon mal einen Massekurzschluss am Gehäuse in Verdacht, jedoch selbst im ausgebauten Zustand treten die selben Fehler auf.
Spannungsprobleme mit dem Netzteil vielleicht? Zu klein oder groß dimensioniert? Wie sehen die 50Hz aus der Steckdose aus? Sind dort vielleicht zu viele HF oder NF Einstreuungen von den 59 anderen Rechnern drauf?
Die Computer sind nicht übertaktet. Ich hab sowohl automatische Takterkennung des Speichers getestet sowie manuelle.
Speicherbausteine werden i.d.R. in einer Marge erstellt und danach einzeln getestet, bis zu welcher Geschwindigkeit sie funktionieren. Dass ist dann die nominale Taktgeschwindigkeit. Möglicherweise hast du Speicher erwischt, der die nötige Taktfrequenz nur mit Mühe gerissen hat und daher eigentlich "übertaktet" ist.
Ich hab eigentlich auch einen Bios-Fehler in Verdacht. Warum? Naja von Zeit zu Zeit kommt es vor, dass beim Start die Grafikkarte nicht erkannt wird. Der Rechner piept dann 3x kurz und 1x lang und startet dann ganz "normal" mit schwarzem Bildschirm Linux.
Hmm... das Problem hatte ich vor einigen Wochen am Rechner daheim auch. Selbst ein Kartentausch hat nix gebracht. Irgendwann nach viel Wackeln, neustecken, Festdrücken,... gings dann plötzlich wieder mit der "orginalen" Karte. Einige Male zuvor ist das Problem schon aufgetaucht, dann allerdings mit einem einfachen Reset wieder behoben worden (sprich, Reset gedrückt und die GraKa war wieder erkannt) Vielleicht hast du ja deine Boards beim Einbau etwas zu stark gebogen (beim Einstecken der Karten oder des Speichers z.B.) und feine Haarrisse zieren nun einige Leiterbahnen. Irgendwann, wenns zu warm wird, dehnt sich der Spalt zu sehr aus und die Verbindung "reißt ab". -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Lars Ziegler schrieb:
Ulrich Gehauf schrieb:
Jetzt zu meinen Fragen: 1. Kann ein Wärme-Problem eine Kernel-Panic auslösen?
Das mit der Zwangsbelüftung wird leider nichts, da die Computer in Tischen fest verbaut sind, damit keiner daran hantieren kann. Im Übrigen
Vielleicht liegts daran? Zu wenig Frischluftzufuhr. Ich hab schon extra Luftschlitze gefräst. Hoffe also dass die ausreichen. Sind auch entsprechend dem Luftstrom im Gehäuse angepasst.
zeigt die Hardwareüberwachung normale Temperaturen an.
Die misst halt nur 1 oder 2 bestimmte Punkte im System. Möglicherweise liegt das Thermoproblem aber nicht unter dem Messpunkt (z.B. im Chipsatz) Das wäre durchaus denkbar. Bei zwei Rechnern hab ich schon mal den Lüfter auf dem Chipsatz ausgetauscht, da die Lager kaputt waren. Dabei habe ich zunächst einen größeren Kühlkörper montiert und den dann mit einem aktiven Lüfter versehen. Dabei ist mir aufgefallen, dass beim
Ulrich Gehauf schrieb: passiven Kühlen der Kühlkörper innerhalb von Minuten eine enorme Temperatur erreicht.
Sind die Rechner aus einer Großserie? Möglicherweise ein Serienfehlerin der Hardware (z.B. Bus "übertaktet").
Die Computer sind nicht aus einer Großserie. Alle selbst zusammengebaut und ausschließlich Markenkomponenten verwendet.
Also die einzelnen Bauteile definitiv aus unterschiedlichen Margen?
Nicht alle, aber wohl schon einige. Bei den Netzwerkkarten der Boards ist mir aufgefallen, dass dieses Teilweise fast identische MAC-Adressen haben, die sich nur in den beiden letzten Stellen unterscheiden. Daher vermute ich, dass diese Teilweise aus der gleichen Marge sind. Konnte da aber noch keinen Zusammenhang feststellen.
Zu den bereits erwähnten Bauteilen kommen noch Toshiba DVD-Laufwerke und Enermax Netzteile. Ich hatte auch schon mal einen Massekurzschluss am Gehäuse in Verdacht, jedoch selbst im ausgebauten Zustand treten die selben Fehler auf.
Spannungsprobleme mit dem Netzteil vielleicht? Zu klein oder groß dimensioniert? Wie sehen die 50Hz aus der Steckdose aus? Sind dort vielleicht zu viele HF oder NF Einstreuungen von den 59 anderen Rechnern drauf?
Ich hab nur Sempron 2600+ verbaut und eine magere Radeon X300 verbaut und hab mich deshalb für 365 Watt Enermax entschieden. Sollte eigentlich nicht sein. Die Stromkreise sind auf etwa 10 Sicherungen aufgeteilt worden. Ein Elektriker hat auch schon mal das Stromnetz gemessen, bzw. speziell auch einzelne PCs. Keine Besonderheiten!
Die Computer sind nicht übertaktet. Ich hab sowohl automatische Takterkennung des Speichers getestet sowie manuelle.
Speicherbausteine werden i.d.R. in einer Marge erstellt und danach einzeln getestet, bis zu welcher Geschwindigkeit sie funktionieren. Dass ist dann die nominale Taktgeschwindigkeit. Möglicherweise hast du Speicher erwischt, der die nötige Taktfrequenz nur mit Mühe gerissen hat und daher eigentlich "übertaktet" ist.
Würde mich schockieren, wenn dies bei so vielen Bausteinen der Fall wäre. Und das von Infineon.
Ich hab eigentlich auch einen Bios-Fehler in Verdacht. Warum? Naja von Zeit zu Zeit kommt es vor, dass beim Start die Grafikkarte nicht erkannt wird. Der Rechner piept dann 3x kurz und 1x lang und startet dann ganz "normal" mit schwarzem Bildschirm Linux.
Hmm... das Problem hatte ich vor einigen Wochen am Rechner daheim auch. Selbst ein Kartentausch hat nix gebracht. Irgendwann nach viel Wackeln, neustecken, Festdrücken,... gings dann plötzlich wieder mit der "orginalen" Karte.
Einige Male zuvor ist das Problem schon aufgetaucht, dann allerdings mit einem einfachen Reset wieder behoben worden (sprich, Reset gedrückt und die GraKa war wieder erkannt)
Das mit dem Reset funktioniert bei auch immer. Manchmal muss man auch 2 mal Reset drücken.
Vielleicht hast du ja deine Boards beim Einbau etwas zu stark gebogen (beim Einstecken der Karten oder des Speichers z.B.) und feine Haarrisse zieren nun einige Leiterbahnen. Irgendwann, wenns zu warm wird, dehnt sich der Spalt zu sehr aus und die Verbindung "reißt ab".
Hab ich drauf geachtet, dass die Boards nicht gebogen sind. Allerdings hab ich mich schon über die extrem dünnen Bleche der Mainboardaufnahme der Gehäuse geärgert. Die sind meiner Meinung nach zu flexibel. Aber dann hätte der Fehler im ausgebauten Zustand nicht auftreten dürfen. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Probiere es doch mal mit der Bootoption acpi=off. Das powermanagment kann manchmal solche Auswirkungen haben . http://de.opensuse.org/SDB:Kernelparameter_f%C3%BCr_ACPI/APIC Falls es funktioniert kannst du den erfolgreichen Bootparameter ja dauerhaft eintragen. mfg Stefan -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Stefan Kunze schrieb:
Probiere es doch mal mit der Bootoption acpi=off.
Das powermanagment kann manchmal solche Auswirkungen haben .
http://de.opensuse.org/SDB:Kernelparameter_f%C3%BCr_ACPI/APIC
Falls es funktioniert kannst du den erfolgreichen Bootparameter ja dauerhaft eintragen.
mfg
Stefan
Hab ich auch schon gehört, allerdings kann ich nicht auf acpi verzichten. Die Computer sind in Schränken fest eingebaut und müssen sich zwingend automatisch nach dem Herunterfahren abschalten. Aber danke für den Hinweis.
-- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
"shutdown Probleme" liegt.
neusten Kernel. Leider muss ich feststellen, dass die Rechner relativ häufig abstürzen. Erst heute ist mir von 3 Kernel-Panics berichtet worden. Ich finde leider die Ursache dafür nicht. Es muss aber nicht
ich habe hier ein Asus K8N unter Suse 10.3. Seit ich es habe, das Board, gelingt mir ein Warmboot nur, wenn der Rechner noch "kalt" ist. Bei längerem Betrieb kann muss ich für ein Reboot den Rechner abschalten, mindesten zwei Minuten warten, dann kann ich ihn wieder einschalten. Bisher konnte ich auch noch keinen Ansatz finden Gruß Peter -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (4)
-
Lars Ziegler
-
Peter Mc Donough
-
Stefan Kunze
-
Ulrich Gehauf