Hallo alle zusammen, erstmal hoffe ich das ich die Etikette ware. Wenn nicht bitte ich mir auf die Füße zu treten:-). Also folgendes. Ich betreibe einen Oracle 8.1.7 Server auf SuSE 7.3 mit Kernel 2.4.18. Alle 14 Tage hängt das System aber komplett. Weder die Instanzen noch der Server sind erreichbar. Kein ping, nichts. Aber auch lokal ist da nicht ran zu kommen weil sich der Bildschirm nicht aktiviert und das Tastartur nicht mehr funktioniert. Kurzum das System ist einfach tot. Abhilfe schafft da nur ein Hardware reset.Weder die warn noch die messges melden irgendwelche Fehler. Hier mal nen Auszug aus der messages: ---schnipp--- Jun 24 18:43:20 oracle sshd[15998]: Accepted password for xyz from ::ffff:192.168.1.28 port 4927 Jun 24 18:43:22 oracle sshd[15998]: Received disconnect from ::ffff:192.168.1.28: Jun 24 18:59:00 oracle /USR/SBIN/CRON[16596]: (root) CMD ( rm -f /var/spool/cron/lastrun/cron.hourly) Jun 24 19:21:33 oracle syslogd 1.4.1: restart. Jun 24 19:21:34 oracle rpc.statd[417]: Version 0.3.1 Starting Jun 24 19:21:38 oracle kernel: klogd 1.4.1, log source = /proc/kmsg started. Jun 24 19:21:38 oracle kernel: Inspecting /boot/System.map-2.4.18-4GB ---schnapp--- Also wie man schön sieht scheint alles normal zu funktionieren und eine halbe Stunde später ist der Server down. Das System ist ein ganz normaler P4 1.6 GHZ, 1 GB Ram. Er hat noch nen 3ware Escalde Raid 1 Kontroller, der aber offiziel Unterstützt wird von SuSE. Es laufen 8 Oracle Instanzen, ein CVS Server und ein NFS Server, sowie der Uagent von ArcServIT 2000. Wirklich keine exotische Konfiguration. Hat einer von euch eine Idee woran diese Abstürze liegen könnten? :-)Helft mir ObiWan, Ihr seit meine letzte Hoffnung:-) -- Greetings, Dotzi -- cya all Timo "Dotzi" Dotzauer Mail: tdotzauer@online.de Voice2Mail: 0721 - 151 239033 Fax2Mail: 0721 - 151 239033 http://www.dotzi.net -- Die Menschen helfen lieber dem, der ihrer Hilfe nicht bedarf, als dem, welchem sie nötig ist. --
Am Mittwoch, 25. Juni 2003 10:19 schrieb Timo Dotzauer:
Also folgendes. Ich betreibe einen Oracle 8.1.7 Server auf SuSE 7.3 mit Kernel 2.4.18. Alle 14 Tage hängt das System aber komplett. Weder
Der SuSE (!!) 2.4.18 Kernel hatte ein Problem mit mehr als einem IDE Device. Vielleicht liegt es daran. Der Fehler äußerte sich so wie von Dir beschrieben. cu stonki -- www.proftpd.de: Deutsche ProFTPD Dokumentation www.krename.net: Der Batch Renamer für KDE www.kbarcode.net: Die Barcode Solution für KDE www.stonki.de
Hallo, Vielen Dank. Ich informiere mich mal ob das, das Problem ist. On Wed, 2003-06-25 at 11:02, Stefan Onken wrote:
Am Mittwoch, 25. Juni 2003 10:19 schrieb Timo Dotzauer:
Also folgendes. Ich betreibe einen Oracle 8.1.7 Server auf SuSE 7.3 mit Kernel 2.4.18. Alle 14 Tage hängt das System aber komplett. Weder
Der SuSE (!!) 2.4.18 Kernel hatte ein Problem mit mehr als einem IDE Device. Vielleicht liegt es daran. Der Fehler äußerte sich so wie von Dir beschrieben.
cu stonki
-- www.proftpd.de: Deutsche ProFTPD Dokumentation www.krename.net: Der Batch Renamer für KDE www.kbarcode.net: Die Barcode Solution für KDE www.stonki.de -- Greetings, Dotzi
-- cya all Timo "Dotzi" Dotzauer Mail: tdotzauer@online.de Voice2Mail: 0721 - 151 239033 Fax2Mail: 0721 - 151 239033 http://www.dotzi.net -- Die Menschen helfen lieber dem, der ihrer Hilfe nicht bedarf, als dem, welchem sie nötig ist. --
Timo Dotzauer wrote:
Alle 14 Tage hängt das System aber komplett.
Wirklich so genau, oder MTBF?
Kein ping, nichts. Aber auch lokal ist da nicht ran zu kommen weil sich der Bildschirm nicht aktiviert und das Tastartur nicht mehr funktioniert.
Diesen Eintrag in /etc/init.d/boot.local setzen, damit das abschalten des Screens verhindert wird: for konsole in /dev/tty[0-9]* ; do echo -e "\e[9;0]" >> $konsole; done und auf den naechsten Absturz warten. Dann sollte ein ein panic log auf der Konsole abzulesen sein. Achja, und auf Konsole 10 schalten (Alt+F10). Der Hinweis auf das Kernel-Update ist auch nicht schlecht. Peter
participants (3)
-
Peter Wiersig
-
Stefan Onken
-
Timo Dotzauer