Re: [opensuse-es] Xeon Woodcrest frente a Opteron

27 Feb 2007

      Hola :)

Juan, ya te he dicho muchas veces que no hace falta que me pongas en copia 
porque leo las listas. Te lo vuelvo a repetir por n-ésima vez: no hace falta 
que me pongas en copia. No es que me moleste, pero conoces muy bien la 
netiquette y no la aplicas en este caso.

El Martes, 27 de Febrero de 2007 00:59, Juan Erbes escribió:
...
El 26/02/07, Rafa Grimán  escribió:
...
Hola :)
El Lunes, 26 de Febrero de 2007 19:24, Francisco Javier Martínez de Pisón
Ascacíbar (UR) escribió:
...
Hola,
Tenemos que comprar unos servidores duales para cálculo intensivo con
16Gigas de ram. Nos surge la duda de si comprarlos con 2 Opteron 2.4GHz
(3500)o 2 XEON Woodcrest 2.33GHz (5400). La diferencia es de 1800
entre uno y otro.
Queríamos sabes si OPENSUSE trabaja bien con Woodcrest y si la
diferencia de precio creéis que merece la pena...
Funcionar, funciona. Nuestros servidores son Woodcrest (Intel Xeon 51xx)
y funcionan muy bien.
Los sistemas que vendemos nosotros tienen un FSB de 1333 MHz, esto
consigue unos anchos de banda de RAM <-> CPU de 20 GB/s por socket. Este
ancho de banda es superior al de los AMD actuales. Si el FSB es de 1066,
el ancho de banda será menor (18 GB/s).
Rafa, me parece que la estas pifiando:
http://img.hexus.net/v2/cpu/intel/xeon5160/images/cpuz.png
Una cosa es el FSB, que segun ese grafico es 333 y otra es el ancho de
banda, que es dependiente
Rafa, como tu bien sabes, los micros AMD64 corren con la ventaja del
controlador de memoria integrado en el micro, lo cual les permite NUMA
y operaciones como iommu no soportadas por los micros intel.
Esos anchos de banda a los que haces alusión, son teoricos, pero en la
practica, siguen ganado los AMD64 en ancho de banda por un 80%:
http://img.hexus.net/v2/cpu/intel/xeon5160/images/bench-membandwidth.png
Juan, como tu bien sabes ... fuimos el primer fabricante en apostar por NUMA y 
somos el único fabricante que realmente le sacamos partido. De ahí que seamos 
el único fabricante que podamos escalar LINEALMENTE hasta 1024 CPUs y 128 TB 
de RAM en una única imagen de sistema operativo. Igual que sabrás que somos 
el único fabricante capaz de conseguir latencias menores a 1 microsegundo en 
tecnología NUMA.

Así que sí Juan, sé que AMD utiliza tecnología NUMA y también sé que si no 
utilizas correctamente los bancos de memoria de las placas SMP de AMD ... el 
rendimiento es MUY malo.
...
Xeon remains underfed compared to Opteron, even at higher memory
frequencies. A single Opteron on its own can stream data from memory
at nearly the rates that two new Xeons can. The FB-DIMM setup and
5000X MCH does offer up nearly 80% more bandwidth than the old
shared-bus scheme with Paxville or Nocona, though.
http://www.hexus.net/content/item.php?item=6256&page=5
Paralelamente, los AMD64, tienen un 25% menos de latencia en acceso a
memoria. (mismo link).
http://img.hexus.net/v2/cpu/intel/xeon5160/images/bench-memaccess.png
En cuanto a la potencia de calculo, es muy similar gracias a que el
XEON Woodcrest corre a 3.0 GHz, contra los 2.6 GHz del Opteron 285.
http://www.hexus.net/content/item.php?item=6256&page=7
Juan, sabes que la potencia de cálculo no depende sólo de los ciclos de reloj. 
Si una aplicación requiere ciclos de reloj ... sí, correrá mejor en un equipo 
con más MHz. Pero, si por ejemplo lo que demanda es una buena FPU ... por 
muchos MHz que le pongas, no sacarás nada en limpio.
...
Pero en tu caso Francisco, la frecuencia de reloj es menor en el Xeon
que en el Opteron (2.33 contra 2.4), por lo tanto vas a lograr mayor
rendimiento con los Opteron, ademas de ahorrarte 1800  (mas del 50%).
Son muy útiles tus links Juan, pero no voy a discutir contigo porque es 
inútil, me acabarás llamando ladrón o "vendido" por vender HW de Intel (como 
has hecho en otra ocasión) y no llegaremos a ningún sitio. Por muchos 
benchmarks (que no son de SGI ni de Intel) que yo te ponga contrarrestando tu 
información sacarás tu otro "demostrando" que miento.

Como decía en el correo original, lo importante no es comparar CPU a CPU, hay 
más cosas a tener en cuenta cuando hablamos de HPC y/o de benchmarks. En mi 
correo original ponía estos párrafos (que no sé por qué los has borrado ni 
has hecho mención a ellos):

	"Hablar de procesadores únicamente no es suficiente, tienes que
	 contarnos qué placas base pondrías a cada fabricante de
	 procesadores, qué tipo de memoria, qué tipo de discos, cuántos
	 discos, qué configuración de discos, qué aplicación vas a ejecutar,
	 será un único nodo, será un cluster, si es un cluster, qué tipo de
	 conectividad entre nodos, ...

	No es tan sencillo como hablar del fabricante de procesadores, hacen
	falta más datos."

Francisco, tendrías que darnos más información como por ejemplo (y no limitado 
a):
	- qué placas base estás teniendo en cuenta para alojar las CPUs
	- tipo de memoria
	- discos:
		* tipo de discos
		* configuración de los discos
		* sistema de ficheros
		* configuración del sistema de ficheros
		* número de discos
		* dónde vas a almacenar los datos (remoto o local)
	- aplicación que vas a ejecutar
		* si lo que importa a la aplicación es I/O
		* si lo que importa a la aplicación es RAM
		* si lo que importa a la aplicación es ancho de banda RAM-CPU
		* si lo que importa a la aplicación es CPU:
			- si lo que cuenta son los ciclos de reloj
			- si lo que cuenta es la caché de la CPU
		* ¿la aplicación corre mejor en cluster o en SMP o en NUMA?
		* ¿la compilas tu o viene precompilada?
		* ¿en qué librerías se basa?

	- ...

Otras cosas a tener en cuenta son, una vez comparados ambos sistemas, si ves 
que uno u otro dan mejor rendimiento, pensar si la mejora de rendimiento es 
rentable. Me explico: nuestras máquinas no son baratas, pero:

	- a un cliente le redujimos el tiempo de renderizado de
	  3 meses a 3 semanas. A este cliente sí le salía rentable.

	- otro ejemplo, un cliente nuestro de F1 ha migrado de otro fabricante
	  a nuestros servidores, no sólo ha reducido el tiempo de renderizado
	  sino que ha conseguido diseños que le permiten al coche sacar 2
	  segundos de ventaja por vuelta. También le sale rentable.

	- otro cliente de gas y petróleo tiene una estación gráfica con 128
	  CPUs + 512 GB de RAM + 16 pipes gráficos, puede visualizar en tiempo
	  real una prospección petrolífera (incluyendo presiones, temperaturas,
	  bolsas de petróleo y gas, capas de sedimentos, ...) desde cualquier
	  punto del mundo. También le sale rentable.

	- otro cliente ha migrado su base de datos (980 GB de BBDD) a un
	 servidor nuestro con 128 CPUs y 1.2 TB de RAM. Le hemos conseguido
	 pasar de 200 millones de consultas/hora a más de 1 Billón consultas/hora.
	 También le sale rentable.

La pregunta es, Francisco, ¿la inversión que vas a hacer te sale rentable? 
¿Tienes todos los datos necesarios para saber si te va a ser rentable la 
inversión?

No pretendo meterte miedo, pero en el mundo HPC hay que tener en cuenta que o 
bien conoces muy bien lo que estás haciendo ... o bien otro se te puede 
adelantar y has tirado toda tu inversión y tiempo a la basura. He visto estos 
casos desde empresas pequeñas (de diseño gráfico) hasta inversiones 
millonarias hechas por gobiernos. El mundo HPC (por mucho que insistan los 
fabricantes) no es sencillo, no es fácil y da muchos quebraderos de cabeza ya 
que el "out of the box" no existe.

HTH

   Rafa

-- 
"Even paranoids have enemies."

Rafa Grimán
Systems Engineer

Silicon Graphics Spain
Santa Engracia, 120 - Planta Baja
28003 Madrid
Spain

Tel: +34 91 3984200
Tel: +34 91 3984201
Móvil: +34 628 117 940

http://www.sgi.com

OpenWengo: rgriman
Skype:     rgriman
---------------------------------------------------------------------
Para dar de baja la suscripciÃ³n, mande un mensaje a:
   opensuse-es+unsubscribe@opensuse.org
Para obtener el resto de direcciones-comando, mande
un mensaje a:
   opensuse-es+help@opensuse.org