Hola :) El Friday 28 November 2008, Shinji Ikari escribió:
On Friday 28 November 2008 09:01:08 Rafa Grimán wrote:
Hola :)
El Friday 28 November 2008, miguel gmail escribió:
Tened cuidado e intentad comparar igual a igual.
En realidad... lo que pretend�a con ese gr�fico era ver en qu� nivel estamos en Espa�a en supercomputaci�n... lo pongas como lo pongas, estamos mal.
No me refería al gráfico. El gráfico es interesante. lo que me refiero es que hay que ver las cosas con cuidado ya uqe no podemos comparar NASA Ames con NMCAC: el primero es NUMA y el segundo es cluster.
Compara las máquinas españolas con otras similares de otros países. Resulta que son más potentes que las nuestras ... "pasmao". Algo estamos haciendo mal.
Algo falla en España.
Rafa
-- "We cannot treat computers as Humans. Computers need love."
rgriman@skype.com
o.O? se refiere a esto: http://www.top500.org/stats/list/32/archtype el tipo de arquitectura; o esto: http://www.top500.org/stats/list/32/procarch la arquitectura del procesador, ¿vector, escalar?
Ambos. En el caso de archtype, tenemos 3 tipos: Constellation (creo que se refieren a lo que ha sacado Sun, que en realidad sería un cluster), MPP y cluster. Pero en el enlace que pegas abajo del todo con la lista de los 500 ... se mezclan los 3 tipos. MPP y cluster no funcionan igual y no sirven para las mismas tareas.
lo que es la generación del procesador, tampoco ayuda mucho a aclarar =/ http://www.top500.org/stats/list/32/procgen
Esto también sería interesante tener en cuenta, pero no suele producir tanta diferencia entre uno y otro. Suele afectar más las latencias y los anchos de bandas de la comunicaciones que el procesador en sí. Pero sí, también es interesante ver/comparar sistemas con los mismos procesadores. Veremos diferencias, principalmente debido a los sistemas de interconexión.
En familia de interconexión e interconexión, mencionan NUMA: http://www.top500.org/stats/list/32/connfam http://www.top500.org/stats/list/32/conn
Aquí tampoco estoy yo muy de acuerdo, porque NUMALink (que no NUMA) es una interconexión entre CPUs y no entre máquinas (como puede ser Infiniband, Gigbit, Myrinet, Quadrics). Es decir, es como una especie de Front Side Bus o de HyperTransport. Por eso digo que los sistemas MPP deberían tener su propio Top500 (bueno, a lo mejor algo menos que 500 ;) y los clusters el suyo. Aquí hay dos cosas a tener en cuenta a la hora de separarlos, desde mi punto de vista: - las tareas que se suelen ejecutar en uno u otro. - la "entidad" que tien el sistema: NUMA hay un único "ente" (imagen de sistema operativo), en cambio en los clusters hay tantos como nodos. Esto redunda en diferencias de latencias, por ejemplo.
Tema relacionado pero añadiendo, los gráficos se ven interesantes: http://www.top500.org/charts/list/32/countries España figura entre los países con superordenadores pero no en el gráfico de rendimiento.
España no pinta bien, tenemos sistemas muy grandes (ejemplo BSC con 10240 procesadores) y, efectivamente, no aparece en el gráfico de rendimiento :(
No se detalla como calculan el rendimiento, seguro sumando los valores mencionados por el Sr. Alienígena Pingüino Melenudo y dividiéndolos. Lo cual debe ser incorrecto si como dice los diseños no se deberían de mezclar.
Lo de no mezclar es MHO, lo cual no significa que sea "la verdad" ;) Los rendimientos se calculan en función del Rmax que da el sistema ejecutando Linpack. EMHO, debería ser en función de la distanciación que hay entre Rmax y Rpeak ya que el sistema de mayor rendimiento tendría que dar 1, es decir Rmax=Rpeak.
Aquí mencionan el software que utilizan para medir los sistemas: http://www.top500.org/project/linpack se puede bajar, aparentemente y claro indica que si bien no es el mejor, es el adecuado para comparar a todas las máquinas: <quote>For the TOP500, we used that version of the benchmark that allows the user to scale the size of the problem and to optimize the software in order to achieve the best performance for a given machine. This performance does not reflect the overall performance of a given system, as no single number ever can. It does, however, reflect the performance of a dedicated system for solving a dense system of linear equations. Since the problem is very regular, the performance achieved is quite high, and the performance numbers give a good correction of peak performance.</quote> Bueno hay que leer todo para entenderlo mejor.
Sí, pero ... echad un vistazo a la página de LAPACK: http://www.netlib.org/lapack/ "The original goal of the LAPACK project was to make the widely used EISPACK and LINPACK libraries run efficiently on shared-memory vector and parallel processors. On these machines, LINPACK and EISPACK are inefficient because their memory access patterns disregard the multi-layered memory hierarchies of the machines, thereby spending too much time moving data instead of doing useful floating-point operations." Es interesante ver que la web de linpack y lapack son: http://www.netlib.org/linpack/ http://www.netlib.org/lapack/ Luego no es que lo haya escrito una persona de la "competencia" y sea una crítica desde "el otro lado". Son los mismos los que escriben ambos benchmarks. Y en la propia FAQ de LINPACK dice: http://www.netlib.org/utk/people/JackDongarra/faq-linpack.html?#_Toc27885735 "What is LAPACK? LAPACK is a software collection to solve various matrix problem in linear algebra. In particular, systems of linear equations, least squares problems, eigenvalue problems, and singular value decomposition. The software is based on the use of block partitioned matrix techniques that aid in achieving high performance on RISC based systems, vector computers, and shared memory parallel processors."
Luego y para terminar y no aburrirlos e irme de una vez a bañar que vengo de correr ;P La lista de los Mejores 500 está aquí: http://www.top500.org/lists/2008/11 se puede descargar en varios formatos y "trabajarlos" para obtener otras estadísticas o filtrar la información. Aunque, si la medición real de la capacidad pico no es la apropiada, entonces estamos en las mismas.
Se usa Rmax, no el Rpeak. Si ordenas dicha lista por Rpeak verás como, por ejemplo, el puesto 5 tiene mayor Rmax, pero menor Rpeak y el puesto 6 tiene menor Rmax y mayor Rpeak.
Pero compararlas según su arquitectura y la capacidad teórica es posible. Y podrían hacer gráficos guay (¿así se escribe?) =P
Sí, así se escribe ;) Rafa -- "We cannot treat computers as Humans. Computers need love." rgriman@skype.com -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org