Dateioperationen mit adaptec 2940uw brechen ab und destabilisieren das system
Hallo ML!
auf meinem Suse 7.1 sys mit kernel 2.4.10 kann ich keine langeren
kopieroperationen
auf/von meinen SCSIlws durchfuhren. Nach einiger zeit bricht dieser ab, und
der
SCSIbus wird reseted. nach einigen minuten fahrt der kopiervorgang kurz fort
stoppt dann aber endgultig. Ab diesem Zeitpunkt funktionieren die meisten
prg
nicht mehr wie zB halt oder shutdown. Kabel und terminierung habe ich ge-
checkt. Weiss jemand woran es noch liegen konnte?
-Syslogd-
sirocco kernel: scsi0:0:1:0: Attempting to queue an ABORT message
sirocco kernel: scsi0:0:1:0: Device is active, asserting ATN
sirocco kernel: Recovery code sleeping
sirocco kernel: Recovery code awake
sirocco kernel: Timer Expired
sirocco kernel: aic7xxx_abort returns 8195
sirocco kernel: scsi0:0:1:0: Attempting to queue an ABORT message
sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO
sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO
sirocco kernel: aic7xxx_abort returns 8194
[..repeated 6 mal..]
sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO
sirocco kernel: aic7xxx_abort returns 8194
sirocco kernel: scsi0:0:1:0: Attempting to queue a TARGET RESET message
sirocco kernel: aic7xxx_dev_reset returns 8195
sirocco kernel: Recovery SCB completes
- relevante hardware: -
Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.1
From: Andre Rothardt
Hallo ML!
auf meinem Suse 7.1 sys mit kernel 2.4.10 kann ich keine langeren kopieroperationen auf/von meinen SCSIlws durchfuhren. Nach einiger zeit bricht dieser ab, und der SCSIbus wird reseted. nach einigen minuten fahrt der kopiervorgang kurz fort stoppt dann aber endgultig. Ab diesem Zeitpunkt funktionieren die meisten prg nicht mehr wie zB halt oder shutdown. Kabel und terminierung habe ich ge- checkt. Weiss jemand woran es noch liegen konnte?
-Syslogd- sirocco kernel: scsi0:0:1:0: Attempting to queue an ABORT message sirocco kernel: scsi0:0:1:0: Device is active, asserting ATN sirocco kernel: Recovery code sleeping sirocco kernel: Recovery code awake sirocco kernel: Timer Expired sirocco kernel: aic7xxx_abort returns 8195 sirocco kernel: scsi0:0:1:0: Attempting to queue an ABORT message sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO sirocco kernel: aic7xxx_abort returns 8194
Das sieht mir so aus, als ob die Platten nicht mehr wollen.
[..repeated 6 mal..]
[...]
- relevante hardware: - Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.1
aic7870: Single Channel A, SCSI Id=7, 16/255 SCBs IBM Model: DPES-31080 Rev: S31Q Type: Direct-Access ANSI SCSI revision: 02 IBM Model: DPES-31080 Rev: S31Q Type: Direct-Access ANSI SCSI revision: 02 QUANTUM Model: FIREBALL_TM2110S Rev: 300X Type: Direct-Access ANSI SCSI revision: 02 [+ 2 CDrom laufwerke]
Das sind ja recht 'alte' Teile ;)
scsi0:0:0:0: Tagged Queuing enabled. Depth 5 scsi0:0:1:0: Tagged Queuing enabled. Depth 5 scsi0:0:2:0: Tagged Queuing enabled. Depth 5 Attached scsi disk sda at scsi0, channel 0, id 0, lun 0 Attached scsi disk sdb at scsi0, channel 0, id 1, lun 0 Attached scsi disk sdc at scsi0, channel 0, id 2, lun 0 (scsi0:A:0): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sda: 2118144 512-byte hdwr sectors (1084 MB) sda: sda1 sda2 < sda5 > scsi0:A:1): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sdb: 2118144 512-byte hdwr sectors (1084 MB) sdb: sdb1 < sdb5 > (scsi0:A:2): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sdc: 4124736 512-byte hdwr sectors (2112 MB) sdc: sdc1 < sdc5 >
Hast Du das vor, wahrend oder nach dem Fehler geloggt?
Revisionsnummern: Systemboot: Adaptec-2940 V1.1\SNI unterseite Karte: FAB 566507-00 REV F ; SNI BARCODE 39079572 ; unbeschriftete plakette: BE0E52003 UR; Chip beschr: S26361-D8030-V1 Adaptec GS=2 oberseite karte: ASSY 566506-00 ; gr. Chip: AHA-2940 S5 593300 D 9520 ; kl Chip: Adaptec Inc 589202-00 D 81051E00 '1994
Ist der Adapter vom BIOS her auf SCSI Auto-Reset eingestellt? Kontrolliere das mal (CTRL-A wahrend der Adapter-BIOS Meldung). Es kann auch sein, da? es sich bei Deinen Platten um welche handelt, die einen Software-Bug haben. Ich meine vor urlanger Zeit mal sowas gehort zu haben. Es betraf IBM Platten, die nicht fur Serverbetrieb geeignet waren und nach 72 Stunden einen Plattenreset machten. Ich kann mich aber da auch tauschen. Gru? Martin
Hallo Martin und alle anderen die das lesen :P
- relevante hardware: - Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.1
aic7870: Single Channel A, SCSI Id=7, 16/255 SCBs IBM Model: DPES-31080 Rev: S31Q Type: Direct-Access ANSI SCSI revision: 02 IBM Model: DPES-31080 Rev: S31Q Type: Direct-Access ANSI SCSI revision: 02 QUANTUM Model: FIREBALL_TM2110S Rev: 300X Type: Direct-Access ANSI SCSI revision: 02 [+ 2 CDrom laufwerke]
Das sind ja recht 'alte' Teile ;)
hm nunja :) bis auf dieses kopierproblem fehlerlos. und die fehler treten ja auch nicht immer an den gleichen stellen auf...
scsi0:0:0:0: Tagged Queuing enabled. Depth 5 scsi0:0:1:0: Tagged Queuing enabled. Depth 5 scsi0:0:2:0: Tagged Queuing enabled. Depth 5 Attached scsi disk sda at scsi0, channel 0, id 0, lun 0 Attached scsi disk sdb at scsi0, channel 0, id 1, lun 0 Attached scsi disk sdc at scsi0, channel 0, id 2, lun 0 (scsi0:A:0): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sda: 2118144 512-byte hdwr sectors (1084 MB) sda: sda1 sda2 < sda5 > scsi0:A:1): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sdb: 2118144 512-byte hdwr sectors (1084 MB) sdb: sdb1 < sdb5 > (scsi0:A:2): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sdc: 4124736 512-byte hdwr sectors (2112 MB) sdc: sdc1 < sdc5 >
Hast Du das vor, wahrend oder nach dem Fehler geloggt?
Das sind nur die aktuellen daten die beim booten angezeigt werden
Ist der Adapter vom BIOS her auf SCSI Auto-Reset eingestellt? Kontrolliere das mal (CTRL-A wahrend der Adapter-BIOS Meldung).
diese option hat mein uralt adaptec gar net... einstellungen fur alle lw: symc: y, max rate: 10, disconnection: y, start unit cmd: y, bios scan: y das einzige was da noch mit reset steht ist "reset scsi bu at ic inititialization: enabled" ich weiss aber nicht ob das relevant ist. an den einstellungen hatte ich zuvor nie was verandert.
Es betraf IBM Platten, die nicht fur Serverbetrieb geeignet waren und nach 72 Stunden einen Plattenreset machten. Ich kann mich aber da auch tauschen.
zeitabhangig ist das problem nicht. cya und thx so far andre
From: Andre Rothardt
Hallo Martin und alle anderen die das lesen :P
- relevante hardware: - Adaptec AIC7XXX EISA/VLB/PCI SCSI HBA DRIVER, Rev 6.2.1
aic7870: Single Channel A, SCSI Id=7, 16/255 SCBs IBM Model: DPES-31080 Rev: S31Q Type: Direct-Access ANSI SCSI revision: 02 IBM Model: DPES-31080 Rev: S31Q Type: Direct-Access ANSI SCSI revision: 02 QUANTUM Model: FIREBALL_TM2110S Rev: 300X Type: Direct-Access ANSI SCSI revision: 02 [+ 2 CDrom laufwerke]
Das sind ja recht 'alte' Teile ;)
hm nunja :) bis auf dieses kopierproblem fehlerlos. und die fehler treten ja auch nicht immer an den gleichen stellen auf...
Bist Du absolut sicher, da? Du die Terminierung richtig gesetzt hast?
scsi0:0:0:0: Tagged Queuing enabled. Depth 5 scsi0:0:1:0: Tagged Queuing enabled. Depth 5 scsi0:0:2:0: Tagged Queuing enabled. Depth 5 Attached scsi disk sda at scsi0, channel 0, id 0, lun 0 Attached scsi disk sdb at scsi0, channel 0, id 1, lun 0 Attached scsi disk sdc at scsi0, channel 0, id 2, lun 0 (scsi0:A:0): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sda: 2118144 512-byte hdwr sectors (1084 MB) sda: sda1 sda2 < sda5 > scsi0:A:1): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sdb: 2118144 512-byte hdwr sectors (1084 MB) sdb: sdb1 < sdb5 > (scsi0:A:2): 8.064MB/s transfers (8.064MHz, offset 15) SCSI device sdc: 4124736 512-byte hdwr sectors (2112 MB) sdc: sdc1 < sdc5 >
Hast Du das vor, wahrend oder nach dem Fehler geloggt?
Das sind nur die aktuellen daten die beim booten angezeigt werden
Die Werte sehen recht normal aus.
Ist der Adapter vom BIOS her auf SCSI Auto-Reset eingestellt? Kontrolliere das mal (CTRL-A wahrend der Adapter-BIOS Meldung).
diese option hat mein uralt adaptec gar net...
Den wurde ich nun gerade nicht als uralt bezeichnen. Gemeint waren eigentlich die Platten.
einstellungen fur alle lw: symc: y, max rate: 10, disconnection: y, start unit cmd: y, bios scan: y
Hat er also doch diese Option, bist ja ins Adapter BIOS reingekommen.
das einzige was da noch mit reset steht ist "reset scsi bus at inititialization: enabled" ich weiss aber nicht ob das relevant ist. an den einstellungen hatte ich zuvor nie was verandert.
Genau diese Einstellung meinte ich. Nur dann macht der Adapter namlich auch bei einem Warmstart einen SCSI-Bus Reset.
Es betraf IBM Platten, die nicht fur Serverbetrieb geeignet waren und nach 72 Stunden einen Plattenreset machten. Ich kann mich aber da auch tauschen.
zeitabhangig ist das problem nicht.
Ja, habe ich denn da was uberlesen oder falsch verstanden? Wovon hangt es denn ab? Ist es reproduzierbar? Gleiche Dateien kopiert und Fehler an der selben Stelle? Oder x MB kopiert und Fehler nach y kB? Was hast Du bisher selbst ausprobiert? Ist der Fehler plotz- lich aufgetreten? Wenn Du vor Auftreten des Fehlers nichts verandert hast, deutet alles auf einen Hardwarefehler hin. Pufferuberlauf.
cya und thx so far andre
Gru? Martin P.S. Antwort bitte nur uber die Liste, sonst bekomme ich sie doppelt.
Moin moin,
Kabel und terminierung habe ich gecheckt.
Sicher ? welches Gerät terminiert als letztes den Bus, hoffentlich nicht eines der CDROM-Laufwerke?
sirocco kernel: aic7xxx_abort returns 8195 sirocco kernel: scsi0:0:1:0: Attempting to queue an ABORT message sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO sirocco kernel: aic7xxx_abort returns 8194 [..repeated 6 mal..] sirocco kernel: scsi0:0:1:0: Cmd aborted from QINFIFO sirocco kernel: aic7xxx_abort returns 8194 sirocco kernel: scsi0:0:1:0: Attempting to queue a TARGET RESET message
könnte es sein, das eins der am SCSI-Bus angeschlossenen Geräte Probleme mit disconnect/reconnect hat? Probeweise im Adaptec-Bios abschalten.
IBM Model: DPES-31080 Rev: S31Q
wenn ich das jetzt noch richtig behalten habe, hatten diese IBM-Platten bei Revision S31Q einige Firmwarebugs (sync/async?) Selbst im 2.4.13 kernel findet man in ein paar ncr5380 modulen noch Sonderbehandlungen für diese Modelle. Versuch doch mal im Bios des Adaptec sync für die beiden IBM-Platten abzuschalten (sync negotiation=off)
scsi0:0:0:0: Tagged Queuing enabled. Depth 5
kannst Du über passende parameter in modules.conf oder lilo.conf beeinflussen, siehe hierzu /usr/src/linux/drivers/scsi/README.aic7xxx Sollten die IBM-Platten sich allerdings bei einigen "device selection sequences" als etwas träge erweisen könnte auch "aic7xxx=seltime:0" helfen.
Revisionsnummern: Systemboot: Adaptec-2940 V1.1\SNI oberseite karte: ASSY 566506-00 ; gr. Chip: AHA-2940 S5 593300 D 9520 ;
sieht so aus, als wenn das noch die ganz alte Version des AIC-7870 ohne Autotermination ist. Mit altem Bios V1.1 Bei ftp.adaptec.com sollte es eigentlich noch eine V1.16 geben, hiess früher mal 2940V116.EXE Ohne Eprom-brenner kannst Du damit allerdings wenig anfangen.
kl Chip: Adaptec Inc 589202-00 D 81051E00 '1994
nicht 81051E00 sondern BIOS 1E00 das ist das Eprom (V1.1) mit Bios Checksumme 1E00 tschüss Carsten
participants (3)
-
Andre Rothardt
-
Carsten Hesberg
-
Martin Falley