Hola :) Juan, ya te he dicho muchas veces que no hace falta que me pongas en copia porque leo las listas. Te lo vuelvo a repetir por n-ésima vez: no hace falta que me pongas en copia. No es que me moleste, pero conoces muy bien la netiquette y no la aplicas en este caso. El Martes, 27 de Febrero de 2007 00:59, Juan Erbes escribió:
El 26/02/07, Rafa Grimán
escribió: Hola :)
El Lunes, 26 de Febrero de 2007 19:24, Francisco Javier Martínez de Pisón
Ascacíbar (UR) escribió:
Hola,
Tenemos que comprar unos servidores duales para cálculo intensivo con 16Gigas de ram. Nos surge la duda de si comprarlos con 2 Opteron 2.4GHz (3500)o 2 XEON Woodcrest 2.33GHz (5400). La diferencia es de 1800 entre uno y otro.
Queríamos sabes si OPENSUSE trabaja bien con Woodcrest y si la diferencia de precio creéis que merece la pena...
Funcionar, funciona. Nuestros servidores son Woodcrest (Intel Xeon 51xx) y funcionan muy bien.
Los sistemas que vendemos nosotros tienen un FSB de 1333 MHz, esto consigue unos anchos de banda de RAM <-> CPU de 20 GB/s por socket. Este ancho de banda es superior al de los AMD actuales. Si el FSB es de 1066, el ancho de banda será menor (18 GB/s).
Rafa, me parece que la estas pifiando: http://img.hexus.net/v2/cpu/intel/xeon5160/images/cpuz.png Una cosa es el FSB, que segun ese grafico es 333 y otra es el ancho de banda, que es dependiente
Rafa, como tu bien sabes, los micros AMD64 corren con la ventaja del controlador de memoria integrado en el micro, lo cual les permite NUMA y operaciones como iommu no soportadas por los micros intel. Esos anchos de banda a los que haces alusión, son teoricos, pero en la practica, siguen ganado los AMD64 en ancho de banda por un 80%: http://img.hexus.net/v2/cpu/intel/xeon5160/images/bench-membandwidth.png
Juan, como tu bien sabes ... fuimos el primer fabricante en apostar por NUMA y somos el único fabricante que realmente le sacamos partido. De ahí que seamos el único fabricante que podamos escalar LINEALMENTE hasta 1024 CPUs y 128 TB de RAM en una única imagen de sistema operativo. Igual que sabrás que somos el único fabricante capaz de conseguir latencias menores a 1 microsegundo en tecnología NUMA. Así que sí Juan, sé que AMD utiliza tecnología NUMA y también sé que si no utilizas correctamente los bancos de memoria de las placas SMP de AMD ... el rendimiento es MUY malo.
Xeon remains underfed compared to Opteron, even at higher memory frequencies. A single Opteron on its own can stream data from memory at nearly the rates that two new Xeons can. The FB-DIMM setup and 5000X MCH does offer up nearly 80% more bandwidth than the old shared-bus scheme with Paxville or Nocona, though. http://www.hexus.net/content/item.php?item=6256&page=5
Paralelamente, los AMD64, tienen un 25% menos de latencia en acceso a memoria. (mismo link). http://img.hexus.net/v2/cpu/intel/xeon5160/images/bench-memaccess.png
En cuanto a la potencia de calculo, es muy similar gracias a que el XEON Woodcrest corre a 3.0 GHz, contra los 2.6 GHz del Opteron 285. http://www.hexus.net/content/item.php?item=6256&page=7
Juan, sabes que la potencia de cálculo no depende sólo de los ciclos de reloj. Si una aplicación requiere ciclos de reloj ... sí, correrá mejor en un equipo con más MHz. Pero, si por ejemplo lo que demanda es una buena FPU ... por muchos MHz que le pongas, no sacarás nada en limpio.
Pero en tu caso Francisco, la frecuencia de reloj es menor en el Xeon que en el Opteron (2.33 contra 2.4), por lo tanto vas a lograr mayor rendimiento con los Opteron, ademas de ahorrarte 1800 (mas del 50%).
Son muy útiles tus links Juan, pero no voy a discutir contigo porque es inútil, me acabarás llamando ladrón o "vendido" por vender HW de Intel (como has hecho en otra ocasión) y no llegaremos a ningún sitio. Por muchos benchmarks (que no son de SGI ni de Intel) que yo te ponga contrarrestando tu información sacarás tu otro "demostrando" que miento. Como decía en el correo original, lo importante no es comparar CPU a CPU, hay más cosas a tener en cuenta cuando hablamos de HPC y/o de benchmarks. En mi correo original ponía estos párrafos (que no sé por qué los has borrado ni has hecho mención a ellos): "Hablar de procesadores únicamente no es suficiente, tienes que contarnos qué placas base pondrías a cada fabricante de procesadores, qué tipo de memoria, qué tipo de discos, cuántos discos, qué configuración de discos, qué aplicación vas a ejecutar, será un único nodo, será un cluster, si es un cluster, qué tipo de conectividad entre nodos, ... No es tan sencillo como hablar del fabricante de procesadores, hacen falta más datos." Francisco, tendrías que darnos más información como por ejemplo (y no limitado a): - qué placas base estás teniendo en cuenta para alojar las CPUs - tipo de memoria - discos: * tipo de discos * configuración de los discos * sistema de ficheros * configuración del sistema de ficheros * número de discos * dónde vas a almacenar los datos (remoto o local) - aplicación que vas a ejecutar * si lo que importa a la aplicación es I/O * si lo que importa a la aplicación es RAM * si lo que importa a la aplicación es ancho de banda RAM-CPU * si lo que importa a la aplicación es CPU: - si lo que cuenta son los ciclos de reloj - si lo que cuenta es la caché de la CPU * ¿la aplicación corre mejor en cluster o en SMP o en NUMA? * ¿la compilas tu o viene precompilada? * ¿en qué librerías se basa? - ... Otras cosas a tener en cuenta son, una vez comparados ambos sistemas, si ves que uno u otro dan mejor rendimiento, pensar si la mejora de rendimiento es rentable. Me explico: nuestras máquinas no son baratas, pero: - a un cliente le redujimos el tiempo de renderizado de 3 meses a 3 semanas. A este cliente sí le salía rentable. - otro ejemplo, un cliente nuestro de F1 ha migrado de otro fabricante a nuestros servidores, no sólo ha reducido el tiempo de renderizado sino que ha conseguido diseños que le permiten al coche sacar 2 segundos de ventaja por vuelta. También le sale rentable. - otro cliente de gas y petróleo tiene una estación gráfica con 128 CPUs + 512 GB de RAM + 16 pipes gráficos, puede visualizar en tiempo real una prospección petrolífera (incluyendo presiones, temperaturas, bolsas de petróleo y gas, capas de sedimentos, ...) desde cualquier punto del mundo. También le sale rentable. - otro cliente ha migrado su base de datos (980 GB de BBDD) a un servidor nuestro con 128 CPUs y 1.2 TB de RAM. Le hemos conseguido pasar de 200 millones de consultas/hora a más de 1 Billón consultas/hora. También le sale rentable. La pregunta es, Francisco, ¿la inversión que vas a hacer te sale rentable? ¿Tienes todos los datos necesarios para saber si te va a ser rentable la inversión? No pretendo meterte miedo, pero en el mundo HPC hay que tener en cuenta que o bien conoces muy bien lo que estás haciendo ... o bien otro se te puede adelantar y has tirado toda tu inversión y tiempo a la basura. He visto estos casos desde empresas pequeñas (de diseño gráfico) hasta inversiones millonarias hechas por gobiernos. El mundo HPC (por mucho que insistan los fabricantes) no es sencillo, no es fácil y da muchos quebraderos de cabeza ya que el "out of the box" no existe. HTH Rafa -- "Even paranoids have enemies." Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia, 120 - Planta Baja 28003 Madrid Spain Tel: +34 91 3984200 Tel: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com OpenWengo: rgriman Skype: rgriman --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org