Mailinglist Archive: opensuse-es (1031 mails)

< Previous Next >
Re: [opensuse-es] OT: SATA RAID 1 ¿Es tan m ala como parece?
  • From: Pablo Zuñiga <pablo@xxxxxxxx>
  • Date: Fri, 20 Apr 2007 17:28:10 +0200
  • Message-id: <4628DC0A.40508@xxxxxxxx>
Camaleón escribió:
El 20/04/07, Pablo Zuñiga escribió:

Tengo varias instalaciones con raid 1 sata

¿Raid por software o con controladora?

Siempre Hard
y me preocupa que últimamente
el indice de error es elevado, es más el problema está en que cuando un
disco se está deteriorando no se comporta como las RAID 1 de toda la
vida (SCSI), tarda en marcar como erroneo un disco el tiempo suficiente
para que la información del filesystem se corrompa. No me ha pasado una
vez, ni con un hardware concreto y no me ha pasado solo con linux (lo he
visto en un W2003)... ¿Soy gafe? o ¿Hay un problema de diseño intrinseco
a los SATA y sus controladoras?

Dependerá en gran medida del tipo de controladora que utilices y del driver.

Suse 9, SLES 8, SLES 9 LSI, Adaptec, Intel...
1.- Bloqueo del servidor sin causa aparente (se reinicia y funciona bien)
2.- Nuevos bloqueos con menos tiempo cada vez (no indica errores pero se
queda "frito" de vez en cuando)
3.- Bloqueo seguido de corrupción de filesystem

Puede ser por el sistema de archivos (ReiserFS), me pasó lo mismo en
un servidor supermicro con controladora raid adaptec.

Es posible...Pero con SCSI núnca he tenido este tipo de "putadas"
4.- Chequeo y puesta en marcha (sin errores hard aparentes)
5.- Chequeos independientes de cada disco (exaustivos) y ENTONCES
aparece que uno de ellos efectívamente tiene fallos....(De echo los
fallos son tan graves que entonces si que lo marca como "chungo")

No entiendo. ¿Quién verifica, reiserfsck, el driver o la controladora?

fsck.reiserfs se ralentizaba con uno de los discos por la gran cantidad de errores (a pesar de ser evidentemente un fallo hard) pero tardaba una eternidad en darse cuenta que el fallo no era de arbol si no de sectores erroneos. (En uno de los casos lo tenía que parar a mano por que no había manera de que la controladora se diera cuenta que el disco FALLABA)
Puestos a "jugar" lo marque como bueno y el tio seguia tan pancho con
bloqueos y todo...

Si usas md no sé a qué puede ser debido.

Si usas raid 1 con controladora puede ser que el driver utilizado no
gestione bien las operaciones de disco o que con carga elevada "caiga"
o cause errores, varía mucho según la tarjeta utilizada.

En todos los casos ha sido un error finalmente de Hard, a pesar de sospechar de drivers (el chequeo de la RAID decia que todo era cosa de mi imaginación).
Los cables y las conexiones también pueden afectan, algunas
controladoras son más sensibles. De vez en cuando se me cae una array
en "raid 6", siempre un disco en concreto, ante lo cual sólo puedo
reconstruirla y volver a iniciar el sistema.

Saludos,


Gracias, en una ocasión cambié todos los cables (tenía un mosqueo de narices) pero sospecho que tanto cable fallando es mucha casualidad.

De todas maneras el número de discos SATA de menos de 2 años de funcionamiento que tengo que cambiar parece un número más elevado que otras tecnologías (IDE, SCSI).. No sé.
---------------------------------------------------------------------
Para dar de baja la suscripción, mande un mensaje a:
  opensuse-es+unsubscribe@xxxxxxxxxxxx
Para obtener el resto de direcciones-comando, mande
un mensaje a:
  opensuse-es+help@xxxxxxxxxxxx

< Previous Next >
Follow Ups