Hallo an alle Linux-Admins, Ich hab ein Problem mit einem Linux-Server. SuSE 6.2 mit 2.2.17er Kernel(SMP) (original) 2 x PPro 200MHz 256MB ram Mylex DAC960 (RAID5 m. Standby) 3Com-Karte (Modul 3c59x) Auf der Maschine laeuft, ausser Oracle und einer kleinen Anwendung dafuer, nichts. Es wird von verschiedenen Unices (Reliant, SCO) per NFS auf die Kiste zugegriffen (knfsd) Die Maschine langweilt sich eigendlich. Aber jetzt kommts: Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Oft uebers Wochenende. Ping geht noch. Konsolenumschalten geht noch. Auf Konsole 10 steht nix Bemerkenswertes. rlogin, ftp, nfs, telnet, ssh geht alles nicht. Beim einloggen an der Konsole ist nach dem Usernamen+Enter schluss. Man kommt nicht mehr dran dann AUS-AN(AUA) ;) (Ja, es gibt sysrq) Wenn ich nun in dei messages schaue: da steht nix auffaelliges drin! Die logs hoeren auf, wen ich maschine sich weghaengt, und gehen dann beim reboot weiter... Weiss jemand was das sein kann, bzw wie man da weiterforschen koennte? (Jetzt versuch ich mal, die Logs in eine Ramdisk zu schreiben. Von da werden sie alle paar Minuten auf floppy getarzippt -> vielleicht kommt da mehr bei rum...) Gruss -Marc -- +------------------------------------------------------------------+ | --> http://www.links2linux.de <-- Jetzt mit neuen Features! | | wie z.B. [EasyLink] | +---Registered-Linux-User-#136487------------http://counter.li.org + --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Hallo Marc, Marc Schiffbauer wrote:
Auf der Maschine laeuft, ausser Oracle und einer kleinen Anwendung dafuer, nichts. Es wird von verschiedenen Unices (Reliant, SCO) per NFS auf die Kiste zugegriffen (knfsd)
Da koennte der Knackpunkt liegen. Ich hatte mal zimlich Probleme mit einem Rechner, der ebenfalls fast ausschliesslich als NFS-Server gedient hat. Lief als knfsd und blieb voellig liegen. NFS ging nicht mehr, Rechner lief noch. Der SuSE-Mitarbeiter war zugleich zur Stelle (passierte auf dem Linuxtag in Stuttgart) und hat das Ding nach langem basteln auf userspace-nfs umgestellt. Lief sofort und bis heute problemlos. Was soll man da noch sagen? Ok, ist schon eine Weile her, inzwischen duerfte knfsd ausgereifter sein, aber solche Tuecken sind druchaus nicht auszuschliessen. Tschuess, Jan -- ETES - Espenhain & Theofel EDV-Systeme GbR ACHTUNG - NEUE ADRESSE! ACHTUNG - NEUE ADRESSE! Libanonstrasse 58 A * D-70184 Stuttgart Phone +49 711 4895550 * Fax +49 711 4809761 EMail: info@etes.de --- URL: www.etes.de --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Jan Theofel wrote:
Hallo Marc,
Marc Schiffbauer wrote:
Auf der Maschine laeuft, ausser Oracle und einer kleinen Anwendung dafuer, nichts. Es wird von verschiedenen Unices (Reliant, SCO) per NFS auf die Kiste zugegriffen (knfsd)
Da koennte der Knackpunkt liegen. Ich hatte mal zimlich Probleme mit einem Rechner, der ebenfalls fast ausschliesslich als NFS-Server gedient hat. Lief als knfsd und blieb voellig liegen. NFS ging nicht mehr, Rechner lief noch.
Der SuSE-Mitarbeiter war zugleich zur Stelle (passierte auf dem Linuxtag in Stuttgart) und hat das Ding nach langem basteln auf userspace-nfs umgestellt. Lief sofort und bis heute problemlos.
Was soll man da noch sagen?
Hmm... aber mit Userspace-NFS (war vorher konfiguriert) passierte genau das gleiche. Gruss -Marc -- +------------------------------------------------------------------+ | --> http://www.links2linux.de <-- Jetzt mit neuen Features! | | wie z.B. [EasyLink] | +---Registered-Linux-User-#136487------------http://counter.li.org + --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Hi, Marc Schiffbauer wrote:
Ich hab ein Problem mit einem Linux-Server. SuSE 6.2 mit 2.2.17er Kernel(SMP) (original)
Was macht ein anderer Kernel ? 2.2.15 oder 2.2.18preXX? mit 2.2.16/17 und den pre 18 Kernels (bis pre18) hatte ich auch massive probleme. allerdings auf 6.4/7.0 -- MfG, M.Stahn ++ May you live in interesting times. ++ --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Martin Stahn wrote:
Hi,
Marc Schiffbauer wrote:
Ich hab ein Problem mit einem Linux-Server. SuSE 6.2 mit 2.2.17er Kernel(SMP) (original)
Was macht ein anderer Kernel ? 2.2.15 oder 2.2.18preXX?
Also der SuSE-6.2er Kernel (2.2.10 glaub ich) hat das selbe gemacht.
mit 2.2.16/17 und den pre 18 Kernels (bis pre18) hatte ich auch massive probleme. allerdings auf 6.4/7.0
Ehrlich? Aber dann nur als SMP oder? Weil privat als SingleCPU laeuft er doch bombig... DIe besgte Maschine laeuft jetzt mit "maxcpus=1" als Kernel-Parameter. Wenn jetzt das Problem weg ist, liegts wohl am SMP... Gruss -Marc -- +------------------------------------------------------------------+ | --> http://www.links2linux.de <-- Jetzt mit neuen Features! | | wie z.B. [EasyLink] | +---Registered-Linux-User-#136487------------http://counter.li.org + --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Thus spake Marc Schiffbauer
Hallo an alle Linux-Admins,
Hallo
Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Oft uebers Wochenende. Ping geht noch. Konsolenumschalten geht noch. Auf Konsole 10 steht nix Bemerkenswertes. rlogin, ftp, nfs, telnet, ssh geht alles nicht. Beim einloggen an der Konsole ist nach dem Usernamen+Enter schluss.
Man kommt nicht mehr dran
dann AUS-AN(AUA) ;) (Ja, es gibt sysrq) Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin. Da läuft X auch mit dem "standard" svga Server unter XFree 3.x.x. So hatte ich es anfangs. Ich hatte nie Probleme damit, im schlimmsten Fall stürzte mal der XServer ab, aber net die ganze Maschine. Ich hab aber vor zwei Wochen XFree 4 eingerichtet, jetzt läuft es auch und von jetzt an hab ich dieselben Probs. Der XFree läd bei mir das "NVidia" und "agpgart" Kernelmodul. Ab und zu hängt sich der Ganze Rechner auf und reagiert auch nicht mehr übers netz. Eigendlich will ich das auch jetzt mit XFree 4 so lassen, weil ich mich an der besseren Performance gewöhnt hab. Ich hab keinen SMP Kernel, nur Standard Kernel mit APM Unterstütz. Ich weis natürlich net ob auf eueren Rechner/Server überhaupt X läuft. Aber vielleicht hilfts Dir oder jemand anderen trotzdem.
Tschau Heiko -- --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Heiko Meusel wrote:
Thus spake Marc Schiffbauer
: Hallo an alle Linux-Admins,
Hallo
Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen.
Man kommt nicht mehr dran
dann AUS-AN(AUA) ;) (Ja, es gibt sysrq) Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin.
Bei mir: Elsa Gladiac.
Ich hab aber vor zwei Wochen XFree 4 eingerichtet, jetzt läuft es auch und von jetzt an hab ich dieselben Probs. Der XFree läd bei mir das "NVidia" und "agpgart" Kernelmodul. Interessant. Wieder jemand mit NVidia und agpart.
Auch ich verwende den NVidia-Treiber und XFree-4.0.1 und leider unter dem gleichen Problem wie ihr (Harte Lockups). Auch ich habe den NVidia Treiber oder dessen Zusammenspiel mit SuSE's Kernel bzw. der von SuSE verwendeten glibc2 (NVidia mutmasst Probleme dynamischen Libs/ld.so) im Verdacht, da dieses Problem bei mir _nur_ beim Start von OpenGL-Programmen auftritt. Da ich allerdings eine SMP Maschine verwende, hatte ich mein Problem auf die von NVidia eingestandenen Probleme ihrer Treiber mit SMP zurückgeführt.
Ab und zu hängt sich der Ganze Rechner auf und reagiert auch nicht mehr übers netz. Eigendlich will ich das auch jetzt mit XFree 4 so lassen, weil ich mich an der besseren Performance gewöhnt hab. Ich hab keinen SMP Kernel, nur Standard Kernel mit APM Unterstütz. Ich weis natürlich net ob auf eueren Rechner/Server überhaupt X läuft. Aber vielleicht hilfts Dir oder jemand anderen trotzdem. Damit's vielleicht hilft, diesmal CC: an feedback.
Vielleicht möchte sich ja mal jemand von SuSE mit NVidia in Verbindung setzen und für Abhilfe oder zumindest für Klärung sorgen? Ralf --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Hi, Ralf Corsepius wrote:
Heiko Meusel wrote:
Thus spake Marc Schiffbauer
: Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Man kommt nicht mehr dran dann AUS-AN(AUA) ;) (Ja, es gibt sysrq) Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin.
Bei mir: Elsa Gladiac.
Tja, 1GHz Athlon, ASUS 7700vt, keine Probleme, derzeit mit Kernel 2.2.18.-pre21. Probleme gibts nur seit 2.4.0-test10 weil sich dann der NVidia Treiber nicht mehr kompilieren laesst. Ansonsten ist die Kiste trotz SuSE 7.0 ;-) absolut stabil.
Interessant. Wieder jemand mit NVidia und agpart. Auch ich verwende den NVidia-Treiber und XFree-4.0.1 und leider unter dem gleichen Problem wie ihr (Harte Lockups). Auch ich habe den NVidia Treiber oder dessen Zusammenspiel mit SuSE's Kernel bzw. der von SuSE verwendeten glibc2 (NVidia mutmasst Probleme dynamischen Libs/ld.so) im Verdacht, da dieses Problem bei mir _nur_ beim Start von OpenGL-Programmen auftritt.
Hier nicht nachvollziehbar.
Da ich allerdings eine SMP Maschine verwende, hatte ich mein Problem auf die von NVidia eingestandenen Probleme ihrer Treiber mit SMP zurückgeführt.
das kann gut sein.
Vielleicht möchte sich ja mal jemand von SuSE mit NVidia in Verbindung setzen und für Abhilfe oder zumindest für Klärung sorgen?
Obs es sind macht ? Dann koennten die bitte gleich noch bei ATI nachfragen, da naemlich mein Knotebook seit SuSE 7.0 mit allen Kernels ab 2.2.15 nur noch abstuertzt. Xfree86 4.0.1 (SuSE rpms), ati 3D Rage P/M Mobility, alle updates von SuSE drauf. Ulkigerweise sind die 2.4.0-test11-preX Kernels bisher die stabilsten ... hm ... Was mir noch aufgefallen ist, Netscape macht wahnsinnige Schwierigkeiten. Meistens bleibt die Kiste bei irgendwelchen Aktionen mit Netscape stehen, das schiebe ich derzeit auf den TokenRing Treiber fuer PCMCIA, da klappt wohl was nicht ganz, da mit 3Com Ethernet diese probleme nicht auftreten. Allerdings stuerzt das Ding dann halt so einfach mal ab ... :-(( -- MfG, M.Stahn ++ FOR SALE: 1 set of morals, never used, will sell cheap. ++ --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
* Mittwoch, 22. November 2000 um 10:39 (+0100) schrieb Martin Stahn:
Tja, 1GHz Athlon, ASUS 7700vt, keine Probleme, derzeit mit Kernel 2.2.18.-pre21. Probleme gibts nur seit 2.4.0-test10 weil sich dann der NVidia Treiber nicht mehr kompilieren laesst.
Im Anhang findest du den Patch von der Kernel-Liste, um den
nvidia-Kernel-0.9.5-Treiber auch unter Kerneln > 2.4.0-test10 zu
kompilieren.
(Ich habe es nicht geschafft, die diffs mit "patch ..." einzuspielen,
aber die paar Zeilen lassen sich auch schnell per Hand
"einpfriemeln"...)
Gruß
Andreas
--
Andreas Könecke "Andreas Koenecke
Hi, Andreas Koenecke wrote:
* Mittwoch, 22. November 2000 um 10:39 (+0100) schrieb Martin Stahn:
Tja, 1GHz Athlon, ASUS 7700vt, keine Probleme, derzeit mit Kernel 2.2.18.-pre21. Probleme gibts nur seit 2.4.0-test10 weil sich dann der NVidia Treiber nicht mehr kompilieren laesst.
Im Anhang findest du den Patch von der Kernel-Liste, um den nvidia-Kernel-0.9.5-Treiber auch unter Kerneln > 2.4.0-test10 zu kompilieren.
(Ich habe es nicht geschafft, die diffs mit "patch ..." einzuspielen, aber die paar Zeilen lassen sich auch schnell per Hand "einpfriemeln"...)
den patch hab ich schon (lese selber lkm), funktioniert nicht, gipts probleme beim kompilieren, zumindest dann bei 2.4.0-test11-preX ... nicht so wild, die kiste laeuft mit 2.2.18pre21 saugut. mich haette nur die performance interessiert, da zumindest auf meinem knotebook der 2.4.0-test11-pre7 subjektiv schneller ist als 2.2.x. Abstuerzen tun eh alle. -- MfG, M.Stahn ++ Clark Kent is a transvestite. ++ --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Am Donnerstag, 23. November 2000 10:06 schrieb Martin Stahn: [...]
den patch hab ich schon (lese selber lkm), funktioniert nicht, gipts probleme beim kompilieren, zumindest dann bei 2.4.0-test11-preX ...
nicht so wild, die kiste laeuft mit 2.2.18pre21 saugut. mich haette nur die performance interessiert, da zumindest auf meinem knotebook der 2.4.0-test11-pre7 subjektiv schneller ist als 2.2.x. Abstuerzen tun eh alle.
Ich setze hier 2.4.0test11 (ohne pre!) ein und muss sagen: Der läuft bis jetzt genial! Werde die Teile am Wochenende auf unseren Produktionsservern installieren. -- mfg Peter Kuechler, UVF --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Hi, Peter Kuechler wrote:
Ich setze hier 2.4.0test11 (ohne pre!) ein und muss sagen: Der läuft bis jetzt genial!
Jep, wenn man die halbe SuSE umgebaut hat damit die anforderungen erfuellt sind ;-)))
Werde die Teile am Wochenende auf unseren Produktionsservern installieren.
Das wuerde ich wiederum noch nicht machen ;-) -- MfG, M.Stahn ++ Kill them all! .... Let God sort them out. ++ --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Am Donnerstag, 23. November 2000 10:53 schrieb Martin Stahn:
Hi,
Peter Kuechler wrote:
Ich setze hier 2.4.0test11 (ohne pre!) ein und muss sagen: Der läuft bis jetzt genial!
Jep, wenn man die halbe SuSE umgebaut hat damit die anforderungen erfuellt sind ;-)))
Werde die Teile am Wochenende auf unseren Produktionsservern installieren.
Das wuerde ich wiederum noch nicht machen ;-)
Ich schon, Grund: Ich habe hier bei mir im Büro einen Server stehen, der hardwaremäßig unseren Produktionsservern entspricht, steht nur mir zur Verfügung zum testen;-)) (konnte meinen Chef überzeugen) Da läuft der Kernel seit einer guten Woche mit aktivem NFSv3, das von einer SPARC mit Solaris7 im Testbetrieb gequält wird. Bis jetzt noch nicht ein Fehler!!! Ich geb es ja zu, mit vollen Hosen ist gut stinken...;-)) -- mfg Peter Kuechler, UVF --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
* Donnerstag, 23. November 2000 um 10:06 (+0100) schrieb Martin Stahn:
den patch hab ich schon (lese selber lkm), funktioniert nicht, gipts probleme beim kompilieren, zumindest dann bei 2.4.0-test11-preX ...
Das kann ich nicht nachvolziehen: Mit dem Patch kompiliert und
arbeitet der Kernel-Treiber hier auch unter 2.4.0-test11-final.
Gruß
Andreas
--
Andreas Könecke "Andreas Koenecke
Kollektives ausheulen über die NVidia-Treiber, da muß ich mitmachen ;-) Am Mittwoch, 22. November 2000 09:44 schrieb Ralf Corsepius:
Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin.
Bei mir: Elsa Gladiac.
Hab hier ne nicht mehr ganz so junge Diamond Viper 550 (TNT mit 16 MB) mit SuSE 7.0, XFree 4.0.1 (SuSE-RPM's) und dem NVidia 0.9-5er Treiber, dazu nen selbst compilierten Kernel 2.2.17 mit ReiserFS 3.5.25 Patch, Alsa 0.5.9d, i2c 2.5.4 und lm-sensors 2.5.4 und natürlich das Nvidia Kernel Modul, kein agpart. Ach ja Dual PentiumII 400 und entsprechend ist der Kernel ein SMP-Kernel und 256 MB Ram.
Auch ich verwende den NVidia-Treiber und XFree-4.0.1 und leider unter dem gleichen Problem wie ihr (Harte Lockups). Auch ich habe
Machen wir doch mal Nägel mit Köpfen, Lockups (Rechner hängt ein paar Sekunden, dann läuft's wieder) die sich in /var/log/messages und /var/log/warn wie folgt niederschlagen: Nov 22 20:46:09 eddie kernel: stuck on TLB IPI wait (CPU#0) Nov 22 20:46:09 eddie kernel: stuck on TLB IPI wait (CPU#1) Kann ich hier jederzeit reproduzieren mit folgenden Programmen: - StarOffice 5.1a und 5.2 bei 3D-Diagrammen und eingeschalteter OpenGL- Unterstützung (beim ersten Aufruf des Diagramms). - Java 3D 1.1.3, egal welches JDK (immer beim Start eines Programms). - Terminus Demo (beim Start, wärend des Laufens müllt es mir dann den Speicher voll bis es ans swappen geht und die Sache zur Slideshow wird). Wenn jemand noch weitere Programme hinzufügen kann, immer her damit. Wird mal wieder Zeit für nen dicken Bug-Report. Seit über zwei Monaten kein Update trotz deutlicher Probleme, da muß was gemacht werden.
den NVidia Treiber oder dessen Zusammenspiel mit SuSE's Kernel bzw. der von SuSE verwendeten glibc2 (NVidia mutmasst Probleme dynamischen Libs/ld.so) im Verdacht, da dieses Problem bei mir _nur_ beim Start von OpenGL-Programmen auftritt.
Hm, bei mir hakt es gelegentlich auch beim Wechsel auf den X-Server, da steht der Rechner dann komplett, nicht mal mehr das Num-Lock-Lämpchen läst sich einschalten, auch remote ist der Rechner nicht ansprechbar. Kommt nicht oft vor aber doch gelegentlich.
Da ich allerdings eine SMP Maschine verwende, hatte ich mein Problem auf die von NVidia eingestandenen Probleme ihrer Treiber mit SMP zurückgeführt.
Vermutlich, die Hinweise sind seit der ersten Version in der Faq, sollte vielleicht mal jemand angehen bei NVidia. Wenn sie es nicht auf die Reihe kriegen sollen sie endlich die Sourcen rausrücken.
Vielleicht möchte sich ja mal jemand von SuSE mit NVidia in Verbindung setzen und für Abhilfe oder zumindest für Klärung sorgen?
Werd am Wochenende mal direkt an NVidia schreiben. Hab ich damals bei Erscheinen von XFree 4.0.1 (gab damals nur für 4.0 Treiber) auch gemacht und prompt ne Antwort gekriegt, ein paar Tage später gabs die neue Version. -- Machs gut | http://www.iiv.de/schwinde/buerger/tremmel/ | http://www.knightsoft.de Manfred | http://www.knightsoft-net.de -> Bundesliga-Tipprunde! --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Manfred Tremmel wrote:
Kollektives ausheulen über die NVidia-Treiber, da muß ich mitmachen ;-)
Am Mittwoch, 22. November 2000 09:44 schrieb Ralf Corsepius:
Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin.
Bei mir: Elsa Gladiac.
Hab hier ne nicht mehr ganz so junge Diamond Viper 550 (TNT mit 16 MB) mit SuSE 7.0, XFree 4.0.1 (SuSE-RPM's) und dem NVidia 0.9-5er Treiber,
Dito.
dazu nen selbst compilierten Kernel 2.2.17 mit ReiserFS 3.5.25 Patch, Alsa 0.5.9d, i2c 2.5.4 und lm-sensors 2.5.4 und natürlich das Nvidia Kernel Modul, kein agpart. SuSE-2.2.16-SMP Kernel (von SuSE-7.0), agpart, alsa-0.5.9c.
[Aus deinem Setup folgere ich, dass ich mir die für nächstes Wochenende vorgenommenen Versuche mit 2.2.17 sparen kann :(]
Ach ja Dual PentiumII 400 und entsprechend ist der Kernel ein SMP-Kernel und 256 MB Ram. Dual PII 266, 256 MB RAM
Auch ich verwende den NVidia-Treiber und XFree-4.0.1 und leider unter dem gleichen Problem wie ihr (Harte Lockups). Auch ich habe
Machen wir doch mal Nägel mit Köpfen, Lockups (Rechner hängt ein paar Sekunden, dann läuft's wieder)
Die habe ich auch, allerdings bezog ich mich auf die "ganz harte Sorte": Desktop friert ein, kein rlogin, telnet, ping o.ä., kein Ctrl-Alt-Del, Alt-SysRq, Ctrl-Alt-F* .. nur noch der Resettaster und der Netzschalter reagieren auf "Eingaben". Tritt bei mir im Schnitt ca. bei jedem 10-50 Start eines OpenGL-Programmes auf, d.h. 1-2 mal pro Tag (Ich entwickle z.Zt. OpenGL-Programme :).
die sich in /var/log/messages und /var/log/warn wie folgt niederschlagen:
Nov 22 20:46:09 eddie kernel: stuck on TLB IPI wait (CPU#0) Nov 22 20:46:09 eddie kernel: stuck on TLB IPI wait (CPU#1)
Sieht bei mir so aus: Nov 22 14:17:39 magnum kernel: stuck on TLB IPI wait (CPU#1) Nov 22 14:17:39 magnum kernel: NVRM: freed 258 AGP pages Nov 22 14:17:49 magnum kernel: NVRM: allocated 258 AGP pages
Kann ich hier jederzeit reproduzieren mit folgenden Programmen:
- StarOffice 5.1a und 5.2 bei 3D-Diagrammen und eingeschalteter OpenGL- Unterstützung (beim ersten Aufruf des Diagramms). - Java 3D 1.1.3, egal welches JDK (immer beim Start eines Programms). - Terminus Demo (beim Start, wärend des Laufens müllt es mir dann den Speicher voll bis es ans swappen geht und die Sache zur Slideshow wird).
Wenn jemand noch weitere Programme hinzufügen kann, immer her damit. SGI-OpenInventor, Coin3D und einiges an selbstgeschriebenen OpenGL Programmen, vermutlich schlichtweg jedes OpenGL-Programm.
Wird mal wieder Zeit für nen dicken Bug-Report. Seit über zwei Monaten kein Update trotz deutlicher Probleme, da muß was gemacht werden.
:)
den NVidia Treiber oder dessen Zusammenspiel mit SuSE's Kernel bzw. der von SuSE verwendeten glibc2 (NVidia mutmasst Probleme dynamischen Libs/ld.so) im Verdacht, da dieses Problem bei mir _nur_ beim Start von OpenGL-Programmen auftritt.
Hm, bei mir hakt es gelegentlich auch beim Wechsel auf den X-Server, da steht der Rechner dann komplett, nicht mal mehr das Num-Lock-Lämpchen läst sich einschalten, auch remote ist der Rechner nicht ansprechbar. Kommt nicht oft vor aber doch gelegentlich.
Treten bei mir ungefähr gleich oft auf, nur fallen Systemhänger mit anschliessendem Reset und fschk wesentlich deutlicher ins Gewicht wie ein "paar Sekunden Stillstand".
Da ich allerdings eine SMP Maschine verwende, hatte ich mein Problem auf die von NVidia eingestandenen Probleme ihrer Treiber mit SMP zurückgeführt.
Vermutlich, die Hinweise sind seit der ersten Version in der Faq, sollte vielleicht mal jemand angehen bei NVidia. Wenn sie es nicht auf die Reihe kriegen sollen sie endlich die Sourcen rausrücken.
Vielleicht möchte sich ja mal jemand von SuSE mit NVidia in Verbindung setzen und für Abhilfe oder zumindest für Klärung sorgen?
Werd am Wochenende mal direkt an NVidia schreiben. Hab ich schon vor Wochen auch schon getan, doch die Reaktion von NVidia war die gleiche, wie die bisherige von SuSE auf diese Mail
Hab ich damals bei Erscheinen von XFree 4.0.1 (gab damals nur für 4.0 Treiber) auch gemacht und prompt ne Antwort gekriegt, ein paar Tage später gabs die neue Version. Glück gehabt :)
Ralf --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Am Donnerstag, 23. November 2000 22:31 schrieb Ralf Corsepius:
Die habe ich auch, allerdings bezog ich mich auf die "ganz harte Sorte": Desktop friert ein, kein rlogin, telnet, ping o.ä., kein Ctrl-Alt-Del, Alt-SysRq, Ctrl-Alt-F* .. nur noch der Resettaster und der Netzschalter reagieren auf "Eingaben".
Hatte ich bisher glücklicherweise noch nicht, bisher konnte ich noch jeden OpenGL-Hänger "aussitzen", von ein paar Sekunden bis zu einer halben Minute kann sich das schon mal ziehen, aber dann gehts hier eigentlich immer noch weiter.
Tritt bei mir im Schnitt ca. bei jedem 10-50 Start eines OpenGL-Programmes auf, d.h. 1-2 mal pro Tag (Ich entwickle z.Zt. OpenGL-Programme :).
Vielleicht hängt es ja auch mit agpart zusammen, oder mit dem Grafik-Chip...
- StarOffice 5.1a und 5.2 bei 3D-Diagrammen und eingeschalteter OpenGL- Unterstützung (beim ersten Aufruf des Diagramms). - Java 3D 1.1.3, egal welches JDK (immer beim Start eines Programms). - Terminus Demo (beim Start, wärend des Laufens müllt es mir dann den Speicher voll bis es ans swappen geht und die Sache zur Slideshow wird).
Wenn jemand noch weitere Programme hinzufügen kann, immer her damit.
SGI-OpenInventor, Coin3D und einiges an selbstgeschriebenen OpenGL Programmen, vermutlich schlichtweg jedes OpenGL-Programm.
Glaub ich eher nicht, Quacke3Arena hatte hier noch keine Probleme, ebenso TuxRacer, die Mesa-Demos (die die laufen) und ne Beta von Blender 3.
Treten bei mir ungefähr gleich oft auf, nur fallen Systemhänger mit anschliessendem Reset und fschk wesentlich deutlicher ins Gewicht wie ein "paar Sekunden Stillstand".
Da lob ich mir mein ReiserFS, da zieht sich der Start nur ein paar Sekunden und die Geschichte läuft wieder. Hab hier alles ausser /boot "reiserfiziert".
Hab ich schon vor Wochen auch schon getan, doch die Reaktion von NVidia war die gleiche, wie die bisherige von SuSE auf diese Mail
Wenn genügend Leutchen sich melden, reagiert vielleicht jemand.
Hab ich damals bei Erscheinen von XFree 4.0.1 (gab damals nur für 4.0 Treiber) auch gemacht und prompt ne Antwort gekriegt, ein paar Tage später gabs die neue Version.
Glück gehabt :)
Vielleicht, es fällt sicher leichter zu antworten, wenn man die Lösung schon in der Hinterhand hat. -- Machs gut | http://www.iiv.de/schwinde/buerger/tremmel/ | http://www.knightsoft.de Manfred | http://www.knightsoft-net.de -> Bundesliga-Tipprunde! --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Heiko Meusel wrote:
Thus spake Marc Schiffbauer
: Hallo an alle Linux-Admins,
Hallo
Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Oft uebers Wochenende. Ping geht noch. Konsolenumschalten geht noch. Auf Konsole 10 steht nix Bemerkenswertes. rlogin, ftp, nfs, telnet, ssh geht alles nicht. Beim einloggen an der Konsole ist nach dem Usernamen+Enter schluss.
Man kommt nicht mehr dran
dann AUS-AN(AUA) ;) (Ja, es gibt sysrq)
Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin. Da läuft X auch mit dem "standard" svga Server unter XFree 3.x.x. So hatte ich es anfangs. Ich hatte nie Probleme damit, im schlimmsten Fall stürzte mal der XServer ab, aber net die ganze Maschine. Ich hab aber vor zwei Wochen XFree 4 eingerichtet, jetzt läuft es auch und von jetzt an hab ich dieselben Probs. Der XFree läd bei mir das "NVidia" und "agpgart" Kernelmodul. Ab und zu
Hi Heiko, probiert das dochmal ohne das agpgart-Modul. Bei ist es damit 20-30% schneller... Gruss -Marc -- +------------------------------------------------------------------+ | --> http://www.links2linux.de <-- Jetzt mit neuen Features! | | wie z.B. [EasyLink] | +---Registered-Linux-User-#136487------------http://counter.li.org + --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
On Wednesday 22 November 2000 08:59, Heiko Meusel wrote:
Ich hab hier einen Ahtlon 700 und eine Elsa Eraser III drin. Da läuft X auch mit dem "standard" svga Server unter XFree 3.x.x. So hatte ich es anfangs. Ich hatte nie Probleme damit, im schlimmsten Fall stürzte mal der XServer ab, aber net die ganze Maschine. Ich hab aber vor zwei Wochen XFree 4 eingerichtet, jetzt läuft es auch und von jetzt an hab ich dieselben Probs. Der XFree läd bei mir das "NVidia" und "agpgart" Kernelmodul. Ab und zu hängt sich der Ganze Rechner auf und reagiert auch nicht mehr übers netz. Eigendlich will ich das auch jetzt mit XFree 4 so lassen, weil ich mich an der besseren Performance gewöhnt hab. Ich hab keinen SMP Kernel, nur Standard Kernel mit APM Unterstütz. Ich weis natürlich net ob auf eueren Rechner/Server überhaupt X läuft. Aber vielleicht hilfts Dir oder jemand anderen trotzdem.
Tschau Heiko
Also ich konnte meine Probleme jetzt auch definitiv auf die Kombi RIVA TNT2 (Diamond Viper 770) und die NVIDIA-Treiber mit XFree 4 zurückführen. fahre jetzt wieder wie Du (Heiko) früher XFree 3 mit dem standard-server und seitdem ohne jegliche Probleme. Ich kann auch damit leben, ist eh nur ne Workstation zum "arbeiten", steckte halt nur die (früher mal) ganz fixe Grafikkarte drinnen. Kann also auf 3D verzichten, entwickle eh nur Perl/SQL-Sachen drauf. jedenfalls hängt er jetzt nicht mehr. Kann jetzt aber nicht sagen, ob es an dem NVIDIA-Treiber allein liegt, oder an der Kombination des Treibers mit irgendwas anderem, obwohl hier eigentlich nix besonderes läuft, auch nur der APM-Suse-Standard-Kernel der 7.0. Na ja, wer also damit leben kann, der soll doch wieder Xfree 3 nehmen, wenn man damit leben kann. Hoffentlich gibts bald nen neuen NVidia-Treiber... Ciao Jan --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
* Marc Schiffbauer
Hallo an alle Linux-Admins,
Ich hab ein Problem mit einem Linux-Server. SuSE 6.2 mit 2.2.17er Kernel(SMP) (original)
2 x PPro 200MHz 256MB ram Mylex DAC960 (RAID5 m. Standby) 3Com-Karte (Modul 3c59x)
Auf der Maschine laeuft, ausser Oracle und einer kleinen Anwendung dafuer, nichts. Es wird von verschiedenen Unices (Reliant, SCO) per NFS auf die Kiste zugegriffen (knfsd)
Die Maschine langweilt sich eigendlich.
Aber jetzt kommts:
Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Oft uebers Wochenende. Ping geht noch. Konsolenumschalten geht noch. Auf Konsole 10 steht nix Bemerkenswertes. rlogin, ftp, nfs, telnet, ssh geht alles nicht. Beim einloggen an der Konsole ist nach dem Usernamen+Enter schluss.
Man kommt nicht mehr dran
dann AUS-AN(AUA) ;) (Ja, es gibt sysrq)
Wenn ich nun in dei messages schaue: da steht nix auffaelliges drin! Die logs hoeren auf, wen ich maschine sich weghaengt, und gehen dann beim reboot weiter...
Weiss jemand was das sein kann, bzw wie man da weiterforschen koennte?
(Jetzt versuch ich mal, die Logs in eine Ramdisk zu schreiben. Von da werden sie alle paar Minuten auf floppy getarzippt -> vielleicht kommt da mehr bei rum...) Hatte auf einem Rechner genau die gleichen Probleme (1-2 Abstürze pro Tag), begonnen hat dies glaube ich mit SuSE 6.1. Desweiteren gab es auch noch Probleme mit dem ReiserFs. Auf diesen Rechner habe ich jetzt mal Debian und RedHat ausprobiert, seitdem sind die Probleme weg.
bye Bruno --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Bruno Semrau wrote:
Hatte auf einem Rechner genau die gleichen Probleme (1-2 Abstürze pro Tag), begonnen hat dies glaube ich mit SuSE 6.1. Desweiteren gab es auch noch Probleme mit dem ReiserFs. Auf diesen Rechner habe ich jetzt mal Debian und RedHat ausprobiert, seitdem sind die Probleme weg.
hallo bruno, was fuer einen kernel benutzt du denn? bei mir ist es zum beispiel mit original und "fast" ungepatchten kernel 2.4test9 aufgetreten. mit fast meine ich das ich den quotasupport mit einem patch aus der kernel mailing list patchen musste. ansonsten wirklich original kernel ohne suse patches. kann dann ja eigentlich nicht an suse liegen, oder? der standard smp kernel (monolitisch) laeuft jetzt seit fast vier wochen. eigentlich hatte wir ja jetzt das problem auf den kernel smp support geschoben. mhhh, kann mir eigentlich nicht vorstellen das es am suse kernel liegt. was koennte denn ansonsten dafuer verantwortlich sein? bis spaeter thomas --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
* Thomas Winkler
Bruno Semrau wrote:
Hatte auf einem Rechner genau die gleichen Probleme (1-2 Abstürze pro Tag), begonnen hat dies glaube ich mit SuSE 6.1. Desweiteren gab es auch noch Probleme mit dem ReiserFs. Auf diesen Rechner habe ich jetzt mal Debian und RedHat ausprobiert, seitdem sind die Probleme weg.
hallo bruno, was fuer einen kernel benutzt du denn? bei mir ist es zum beispiel mit original und "fast" ungepatchten kernel 2.4test9 aufgetreten. mit fast meine ich das ich den quotasupport mit einem patch aus der kernel mailing list patchen musste. ansonsten wirklich original kernel ohne suse patches. kann dann ja eigentlich nicht an suse liegen, oder? der standard smp kernel (monolitisch) laeuft jetzt seit fast vier wochen.
eigentlich hatte wir ja jetzt das problem auf den kernel smp support geschoben.
mhhh, kann mir eigentlich nicht vorstellen das es am suse kernel liegt. was koennte denn ansonsten dafuer verantwortlich sein?
Hatte auch immer nur orginal Kernel am laufen, zuletzt 2.2.17. Wiegesagt, seit einigen Wochen laeuft Debian ohne Probleme auf diesem Rechner, zuerst mit Kernel 2.2.17 jetzt mit 2.4.0-test10. Mir ist auch aufgefallen, dass die Probleme eigentlich nur unter X auftraten, z.B. beim surfen mit Netscape. Ploetzlich fing die Festplatte an zu roedeln und nichts ging mehr, kein umschalten auf die Konsolen, kein telnet,ssh, nicht mal Magic SysRq, nur noch ein Ping auf diesen Rechner ging. bye Bruno --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Marc Schiffbauer wrote:
Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Oft uebers Wochenende. Ping geht noch. Konsolenumschalten geht noch. Auf Konsole 10 steht nix Bemerkenswertes. rlogin, ftp, nfs, telnet, ssh geht alles nicht. Beim einloggen an der Konsole ist nach dem Usernamen+Enter schluss.
Die Maschine laeuft jetzt seit ueber einer Woche stabil! Ich hab die Sache jetzt etwas eingrenzen koennen: Und zwar laeuft das Ding jetzt mit dem Kernelparameter "maxcpus=1". Also nur mit einem Prozessor. HW-Defekt kann ich also weitestgehend ausschliessen. [1] Es hängt also irgendwie mit dem SMP-Support zusammen. Jetzt koennste es ja noch an einem nicht SMP-Faehigen Modul liegen... Es gab da mal ein Problem mit SMP und dem 3c90x-Modul... Ob es vielleicht mal hilft, einen komplett Monolithischen Kernel zu bauen (Alle Module fest reinpacken)? Gruss -Marc [1} Oder weiss jemand, wie ich dem Kernel sagen kann, welche CPU bzw. dass er *nur* die 2.te CPU benutzen soll? -- +------------------------------------------------------------------+ | --> http://www.links2linux.de <-- Jetzt mit neuen Features! | | wie z.B. [EasyLink] | +---Registered-Linux-User-#136487------------http://counter.li.org + --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Marc Schiffbauer wrote:
Alle paar Tage (nicht nachvollziehbar) bleibt die Kiste einfach haengen. Oft uebers Wochenende. Ping geht noch. Konsolenumschalten geht noch. Auf Konsole 10 steht nix Bemerkenswertes. rlogin, ftp, nfs, telnet, ssh geht alles nicht. Beim einloggen an der Konsole ist nach dem Usernamen+Enter schluss.
Die Maschine laeuft jetzt seit ueber einer Woche stabil!
Ich hab die Sache jetzt etwas eingrenzen koennen:
Und zwar laeuft das Ding jetzt mit dem Kernelparameter "maxcpus=1". Also nur mit einem Prozessor. HW-Defekt kann ich also weitestgehend ausschliessen. [1]
Es hängt also irgendwie mit dem SMP-Support zusammen. Jetzt koennste es ja noch an einem nicht SMP-Faehigen Modul liegen...
Es gab da mal ein Problem mit SMP und dem 3c90x-Modul...
Ob es vielleicht mal hilft, einen komplett Monolithischen Kernel zu bauen (Alle Module fest reinpacken)?
hallo marc, da unsere diskussion etwas abgeglitten ist in richtung xserver freut es mich mal wieder was vom eigentlichen problem zu hoeren (besonders weil dein rechner stabil laeuft). denke auchn och das es am smp liegt. jedoch kann es doch keine loesung sein maxcpus auf 1 zu setzen. das problem einschraenken tut es jedoch schon. vielleicht sollte man mal an die kernel mailing list mailen und dort nachfragen ob denen ein solches verhalten bekannt ist. mein server laeuft uebrigens auch noch. koennte auch daran liegen das ich keinerlei module einbinde sondern alles einkompiliert habe, wie du vorgeschlagen hattest. vielleicht macht es das stehenbleiben des servers nur unwahrscheinlicher, auf keinen fall jedoch unmöglich. leider bin ich kein kernelhacker und kann an dieser stelle nicht mehr sagen. wie gesagt gab es bei mir keinerlei weitere anzeichen. hat jemand per strace was neues herausgefunden? bis spaeter thomas --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Thomas Winkler schrieb in 2,0K (52 Zeilen):
denke auchn och das es am smp liegt. jedoch kann es doch keine loesung sein maxcpus auf 1 zu setzen. das problem einschraenken tut es jedoch schon. vielleicht sollte man mal an die kernel mailing list mailen und
Wenn du Kernelmodule ohne Source einsetzt, wird dir die Liste sagen: "Ohne Source koenne wir nix debuggen, geh zu dem, der das Modul einsetzt!"[1] Wenn du natuerlich das Problem ohne derartige Module reproduzieren kannst. -Wolfgang [1] Das Spiel war bei vmware schonmal da -- und natuerlich hat die Liste da recht. --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
Marc Schiffbauer schrieb in 1,5K (47 Zeilen):
[1} Oder weiss jemand, wie ich dem Kernel sagen kann, welche CPU bzw. dass er *nur* die 2.te CPU benutzen soll?
Das kannst du dem Kernel AFAIK nicht sagen; du koenntest aber die CPUs vertauschen... -Wolfgang --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
participants (12)
-
akoenecke@akoenecke.de
-
bsemrau@t-online.de
-
corsepiu@faw.uni-ulm.de
-
heme@gmx.de
-
kirchhoff@interactix.de
-
Manfred.Tremmel@iiv.de
-
marc.schiffbauer@links2linux.de
-
martin.stahn@sskm.de
-
pkuechle@uvf.de
-
t.winkler@itcampus.de
-
theofel@etes.de
-
weissel@netcologne.de