Hola :) El Sábado, 1 de Abril de 2006 21:20, Victor Hugo dos Santos escribió:
2006/4/1, rafagriman@gmail.com <rafagriman@gmail.com>:
Hola :)
Vengo a contarons mis penas ... Estoy montando un cluster de HA y LB con la siguiente configuraci�n en cada m�quina:
16 CPUs 32 GB de RAM 8 tarjetas de red GigE (1 para heartbeat y 6 para channel
bonding)
te queda sobrando 1 tarjeta !!!! :-D
Sí, al final no la usamos 0:)
por cierto.. entiendo que estas usando cables UTP cierto ???
UTP cat 6. En cuanto al cableado de los patch pannel al switch, ... no te puedo decir nada porque ya estaba, si tengo tiempo levanto el suelo y miro.
3 cabinas de discos a 4 gbit switch con backplane de 40 GB
hehehehe.... que buenos juguetes encuentra usted y en especial este tipo de switch !!! lo vi una sola vez y no creia mucho en lo que miraba y mucho menos en los datos que me pasaron sobre ellos !!!
Te lo cambio ;) La verdad es que pienso que es el switch, que o bien está mal configurado o bien le "falta algo", pero no puedo/debo tocarlo.
clientes IBM (no s� el modelo) con MS-WinXP SP2 Samba
Resulta que la red da como m�ximo 20 MB/s lo cual me parece absurdo puesto que todo te�ricamente es Gbit lo cual deber�a dar como m�ximo de 125 MB/s en cada tarjeta de red (sea servidor o cliente) aunque en un mondo real se suele conseguir unos 70 MB/s sin tunear nada. Lo curioso es que da 20 MB/s, independientemente del n�mero de clientes, lo que escribas o leas, ...
te recomendaria iniciar vuestros diagnosticos por los cables de red... talvez el cable este "medio raro" y no logre las tasas de transferencias que deberia !!!!
OK :) Pediré a ver si alguien tiene un "FLUKE" y haremos pruebas. Prefiero el "FLUKE" a lo que comentaba Carlos porque soy un poco "ignorante" en esto de redes 0;)
Pruebas que he hecho:
netbench xdd copiar entre servidores*
tines mas de un servidor ???
Dos servidores como lo descrito anteriormente en HA y haciendo balanceo de carga.
se es asi... (y se puedes) desconecta todos los demas pcs/servidores del switch y deje solamente los dos servidores (antes revisa los cables como mencione) y entonces haga las prubeas.
OK :)
copiar entre PCs* copiar PCs-Servidor y a la inversa* al copiar hemos usado scp y SMB
Da igual lo que hagas que s�lo consigues 20 MB/s. Adem�s, llegamos a un cuello de botella de 140 MB/s.
no entiendo la ultima frase !!!!
Es verdad 0:) Lo máximo que consigo en cada PC son 20 MB/s y en el servidor 140 MB/s (channel bonding). Si en el servidor mido cada tarjeta por separado me da 20 MB/s ... luego no tiene sentido: channel bonding: 140 MB/s tarjeta sola: 20 MB/s
como que llegan a un cuello de botella de 140MB/s ??? supostamente no logras transferencias mayores que 20MB/s o si ???
Esa es una de las dudas. No tiene sentido lo que está ocurriendo ... No se me había ocurrido "snifar" la red por si hay alguna máquina "haciendo ruido" ... apuntado en el todo list.
Posibles cuellos de botella:
cabina de discos - servidor: comprobado, est�n dando 350-400
MB/s por lo que no hay cuello de botella aqu�
CPUs: de las 16 CPUs, s�lo llegamos a usar 6 en momentos de "m�xima carga" (20 PCs leyendo y/o escribiendo) por lo que a�n nos quedan 10 libres RAM: llega a consumir los 30 GB de RAM y no llega a usar la swap T. Red: lo compruebo esta semana, me llevo un switch para hacer pruebas, adem�s de hacer pruebas con channel bonding con 1, 2, 3, 4, 5 y 6 tarjetas para ver si cambia el rendimiento
esta es una excelente prueba... personalemente creo que el problema vaya por este lado (cables y/o switch)
switch: no tengo acceso aunque la persona que lo administra est� all� y puedo darle la barrila
buuuu !!!!!
:-(
Eso mismo pienso yo ... :(
Lo malo es que:
- no quieren habilitar Jumbo Frames
algun motivo en especial ???
Habría que habilitarlo en todos los PCs (según dicen) yo tengo entendido que no. Además, los PCs clientes no soportan jumbos ... o por lo menos en el driver de MS-Windows no aparece. Descargaron drivers de la web oficial y seguía sin aparecer la opción. Lo que sí aparece es la posibilidad de activar el QoS.
segun vosotros mismo deberia de ser una excelente altenartiva caso toda la red lo suporte !!!
Eso creo yo, intentaré presionar :)
Herramientas usadas para monitorizar: saidar xosview pcp (herramienta de SGI)
generalmente lo que hago para comprobar la performance de la red es crear una serie de 20 archivos de 10,100,500 y 1000 MiB con "dd" y copiarlos por la red atraves de scp. mmmm...no me pregunte el porque de tantos archivos de diferentes tamanos... creo que sea una costumbre mia de hace mucho tiempo !!!
Haré la prueba con ficheros pequeños también ... vaya lista me está saliendo ;)
*Los ficheros que copiamos son v�deo e im�genes iso. El tama�o m�s peque�o es de unos 6 GB. Otros ficheros los creamos con:
mmmm.. por curiosidad, que sistema de archivos estas usando ???
XFS en los servidores y NTFS en los clientes. En el caso de XFS (y a la hora de crear los volúmenes) se han tenido muy en cuenta cosas como tamaño de bloque, ...
Por cierto, el sistema se usa para v�deo. Abriendo v�deos, cada PC consume unos 8 MB/s de red por lo que no se conseguir�a llegar al cuello de botella (140 MB/s) hasta los 17,5 PCs. Lo malo es que van a ser unos 30 PCs.
mmmm.. complicado el tema !!!!
Ni te lo imaginas ;)
Vamos que si a alguien se le ocurre algo ... se lo agradecer�a ;) Si alguien sabe de switches o herramientas buenas para monitorizar un switch, pruebas de rendimiento, ... y me puede echar una mano ... se agradecer�a :)
podrias revisar este sitio http://www.psc.edu/networking/projects/tcptune/ acabo de encontrarlo y se ve algo interessante
Muchas gracias !!! Rafa -- "Even paranoids have enemies." OpenWengo: rgriman Skype: rgriman