SCSI Streamer blockiert das System -> wie Fehlersuche?
Hallo Liste, seit Juni habe ich folgendes Problem, was plötzlich aufgetaucht ist: System: SuSE-Linux 9.3, SCSI UW Bus mit Tandberg SLR75 Bandlaufwerk. Problem: sobald ich das Bandlaufwerk anspreche steht das Linux-System. Manchmal kommt noch die Ausschrift "Protection Fault", manchmal nicht. Beispiel: mt /dev/tape status -> System steht Wie kann ich sowas debuggen ? Woran kann es liegen ? Weitere Informationen: * Streamer ist schon getauscht * Am SCSI-Bus hängen noch 2 Festplatten (als RAID) die funktionnieren. * SCSI-Controler findet Bandlaufwerk * Linux findet Bandlaufwerk und läd tape driver * cat /proc/scsi/scsi Attached devices: Host: scsi0 Channel: 00 Id: 00 Lun: 00 Vendor: Intel Model: Host Drive #00 Rev: Type: Direct-Access ANSI SCSI revision: 02 Host: scsi0 Channel: 01 Id: 04 Lun: 00 Vendor: TANDBERG Model: SLR60 Rev: 0595 Type: Sequential-Access ANSI SCSI revision: 02 Vielen Dank, Harald
Hallo Harald, könnte ein Terminierungs- und/oder Kabel-Problem sein!! Du könntest auch mal mit strace mt /dev/tape status schau'n was sich kurz vor dem Aufhängen des Systems so tut!!! Wie gesagt, erst mal Kabel und Terminierung überprüfen (bzw. tauschen - kürzeres Kabel, mech. Verbindung usw.) Grüße Mike Am So Oktober 30 2005 18:15 schrieb Harald Oehlmann Elmicron:
Hallo Liste,
seit Juni habe ich folgendes Problem, was plötzlich aufgetaucht ist:
System: SuSE-Linux 9.3, SCSI UW Bus mit Tandberg SLR75 Bandlaufwerk.
Problem: sobald ich das Bandlaufwerk anspreche steht das Linux-System. Manchmal kommt noch die Ausschrift "Protection Fault", manchmal nicht.
Beispiel: mt /dev/tape status -> System steht
Wie kann ich sowas debuggen ? Woran kann es liegen ?
Weitere Informationen:
* Streamer ist schon getauscht * Am SCSI-Bus hängen noch 2 Festplatten (als RAID) die funktionnieren. * SCSI-Controler findet Bandlaufwerk * Linux findet Bandlaufwerk und läd tape driver * cat /proc/scsi/scsi Attached devices: Host: scsi0 Channel: 00 Id: 00 Lun: 00 Vendor: Intel Model: Host Drive #00 Rev: Type: Direct-Access ANSI SCSI revision: 02 Host: scsi0 Channel: 01 Id: 04 Lun: 00 Vendor: TANDBERG Model: SLR60 Rev: 0595 Type: Sequential-Access ANSI SCSI revision: 02
Vielen Dank, Harald
Harald Oehlmann Elmicron wrote:
Hallo Liste,
seit Juni habe ich folgendes Problem, was plötzlich aufgetaucht ist:
System: SuSE-Linux 9.3, SCSI UW Bus mit Tandberg SLR75 Bandlaufwerk.
Problem: sobald ich das Bandlaufwerk anspreche steht das Linux-System. Manchmal kommt noch die Ausschrift "Protection Fault", manchmal nicht.
Zusätzliche Info: Welcher SCSI-Controller? Ich gehe mal davon aus, dass du nichts physikalisch geändert hast, seit diese Probleme auftauchten. Meine Vermutung ist, dass ds Treiber Modul anscheinend Mist baut. Ich nehme an, dass dies passiert, seit du ein Upgrade gemacht hast oder zumindest den Kernel upgedatet hast. Wenn du das Problem schnell lösen willst, nimm einfach einen anderen zusätzlichen SCSI-Kontroller, hänge dort das Bandlaufwerk dran, und nimm das neue Treibermodul mit in die Liste auf, die beim Start geladen werden. Sandy -- Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com
Sandy Drobic schrieb:
Harald Oehlmann Elmicron wrote:
seit Juni habe ich folgendes Problem, was plötzlich aufgetaucht ist:
System: SuSE-Linux 9.3, SCSI UW Bus mit Tandberg SLR75 Bandlaufwerk.
Problem: sobald ich das Bandlaufwerk anspreche steht das Linux-System. Manchmal kommt noch die Ausschrift "Protection Fault", manchmal nicht.
Zusätzliche Info: Welcher SCSI-Controller?
SYM53c875, Adaptek Chip auf einem Intel Mainboard. Meldet sich als Intel RAID Controler SRCZCR Kernelmodule: /lib/modules/2.6.11.4-21.9-smp/kernel/drivers/scsi/sg.ko /lib/modules/2.6.11.4-21.9-smp/kernel/drivers/scsi/gdth.ko
Ich gehe mal davon aus, dass du nichts physikalisch geändert hast, seit diese Probleme auftauchten.
Nein ;-)
Meine Vermutung ist, dass ds Treiber Modul anscheinend Mist baut. Ich nehme an, dass dies passiert, seit du ein Upgrade gemacht hast oder zumindest den Kernel upgedatet hast.
Ich vermute dies auch. Ist leider nicht mehr 100% klar.
Wenn du das Problem schnell lösen willst, nimm einfach einen anderen zusätzlichen SCSI-Kontroller, hänge dort das Bandlaufwerk dran, und nimm das neue Treibermodul mit in die Liste auf, die beim Start geladen werden.
Sieht mir nach verzweifelter Endlösung aus, aber o.k. Danke, Harald
Hi Harald, Am So 30.Oktober 2005 19:05 schrieb Harald Oehlmann Elmicron:
Sandy Drobic schrieb:
Wenn du das Problem schnell lösen willst, nimm einfach einen anderen zusätzlichen SCSI-Kontroller, hänge dort das Bandlaufwerk dran, und nimm das neue Treibermodul mit in die Liste auf, die beim Start geladen werden.
Sieht mir nach verzweifelter Endlösung aus, aber o.k.
Nun gut wenn du bock auf ein bischen spielen hast dann kannst du ja mal nen Neuen Vanilla Kern probieren _nachdem_ du akribisch alles in der SCSI Verkabelung/Terminierung in Frage gestellt und kontrolliert hast! (egal wie lange das vorher schon so funktioniert hat) Danach wird vermutlich das Eine oder Andere Modul was in dem SuseKern schon eingepatcht ist fehlen damit verbringst du dann noch ein paar Stündchen. Linux ist sehr empfindlich was Störungen auf dem SCSI Bus angeht und hängt sich bei sowas mindestens so schnell auf wie die Konkurrenz, für aussagekräftige Fehlermeldungen bleibt dabei idr. keine Zeit mehr. Um auf die Schnelle herauszukriegen ob es der Treiber/Controller ist, ist ein anderer (standardmässig unterstützter) SCSI Adapter durchaus nicht die dümmste Lösung. Gruss Falk
Falk Sauer wrote:
Wenn du das Problem schnell lösen willst, nimm einfach einen anderen zusätzlichen SCSI-Kontroller, hänge dort das Bandlaufwerk dran, und nimm das neue Treibermodul mit in die Liste auf, die beim Start geladen werden.
Sieht mir nach verzweifelter Endlösung aus, aber o.k.
Nun gut wenn du bock auf ein bischen spielen hast dann kannst du ja mal nen Neuen Vanilla Kern probieren _nachdem_ du akribisch alles in der SCSI Verkabelung/Terminierung in Frage gestellt und kontrolliert hast! (egal wie lange das vorher schon so funktioniert hat)
Danach wird vermutlich das Eine oder Andere Modul was in dem SuseKern schon eingepatcht ist fehlen damit verbringst du dann noch ein paar Stündchen.
Linux ist sehr empfindlich was Störungen auf dem SCSI Bus angeht und hängt sich bei sowas mindestens so schnell auf wie die Konkurrenz, für aussagekräftige Fehlermeldungen bleibt dabei idr. keine Zeit mehr.
Um auf die Schnelle herauszukriegen ob es der Treiber/Controller ist, ist ein anderer (standardmässig unterstützter) SCSI Adapter durchaus nicht die dümmste Lösung.
Eigentlich ist es sogar die empfohlene Lösung. In den meisten Installationsanleitungen für Bandlaufwerke steht, dass das Gerät wenn irgend möglich an einen eigenen Controller angeschlossen werden soll, und möglichst nicht an den gleichen Controller mit den Festplatten, die gesichert werden sollen. Auch wegen des Zeitaufwandes der Fehlersuche und des damit verbundenen Ausfalles der Serverdienste ist es eine Sache der Abwägung, welcher Aufwand mit welcher Wahrscheinlichkeit zur Lösung des Problems führt. Ein neuer Kernel macht mit Sicherheit mehr Probleme als ein zusätzlicher Controller. Du könntest höchstens versuchen, das Modul neu zu kompilieren, wenn du den Sourcecode des Moduls hast. Sandy -- Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com
Am Montag 31 Oktober 2005 10:30 schrieb Sandy Drobic:
Eigentlich ist es sogar die empfohlene Lösung. In den meisten Installationsanleitungen für Bandlaufwerke steht, dass das Gerät wenn irgend möglich an einen eigenen Controller angeschlossen werden soll, und möglichst nicht an den gleichen Controller mit den Festplatten, die gesichert werden sollen.
ich hatte damit noch nie Probleme mit meinen HP-DAT 2 und DAT 4 Laufwerken, diversen Rechnern und allen SuSE Kernen seit SuSE 6.x oder so. Meist waren es Adaptec SCSI-Kontroller (auf dem Mainboard eingebaut oder extern).
Auch wegen des Zeitaufwandes der Fehlersuche und des damit verbundenen Ausfalles der Serverdienste ist es eine Sache der Abwägung, welcher Aufwand mit welcher Wahrscheinlichkeit zur Lösung des Problems führt. Ein neuer Kernel macht mit Sicherheit mehr Probleme als ein zusätzlicher Controller. Du könntest höchstens versuchen, das Modul neu zu kompilieren, wenn du den Sourcecode des Moduls hast.
Ich würde _dringend_ mal das komplette SCSI Kabel samt Terminator austauschen. Das machte mir auch schon mal Probleme. Bei einer Rechnerumbauaktion hat es wohl Schaden erlitten.... Das passiert ziemlich schnell. Bye Jürgen -- Dr.rer.nat. Juergen Vollmer, Viktoriastrasse 15, D-76133 Karlsruhe Tel: +49(721) 92 04 87 1 Fax: +49(721) 92 04 87 2 Juergen.Vollmer@informatik-vollmer.de www.informatik-vollmer.de Internet-Telefonie: www.skype.com Benutzer: juergen.vollmer
Dr. Jürgen Vollmer schrieb:
Am Montag 31 Oktober 2005 10:30 schrieb Sandy Drobic:
Eigentlich ist es sogar die empfohlene Lösung. In den meisten Installationsanleitungen für Bandlaufwerke steht, dass das Gerät wenn irgend möglich an einen eigenen Controller angeschlossen werden soll, und möglichst nicht an den gleichen Controller mit den Festplatten, die gesichert werden sollen. Ich würde _dringend_ mal das komplette SCSI Kabel samt Terminator austauschen. Das machte mir auch schon mal Probleme. Bei einer Rechnerumbauaktion hat es wohl Schaden erlitten.... Das passiert ziemlich schnell.
Danke für die vielen Antworten (10min nach Posten am Sanstag schon 3 Stück). Ich werde die Sache wieder an einem Wochenende angehen. Viele Grüße, Harald
participants (5)
-
Dr. Jürgen Vollmer
-
Falk Sauer
-
Harald Oehlmann Elmicron
-
Mike Philipp
-
Sandy Drobic