Re: [opensuse-es] OT: Superordenadores

1 Dec 2008

      Hola :)

El Friday 28 November 2008, Shinji Ikari escribió:
...
On Friday 28 November 2008 09:01:08 Rafa Grimán wrote:
...
Hola :)
El Friday 28 November 2008, miguel gmail escribió:
...
...
Tened cuidado e intentad comparar igual a igual.
En realidad... lo que pretend�a con ese gr�fico era ver en qu� nivel
estamos en Espa�a en supercomputaci�n... lo pongas como lo pongas,
estamos mal.
No me refería al gráfico. El gráfico es interesante. lo que me refiero es
que hay que ver las cosas con cuidado ya uqe no podemos comparar NASA
Ames con NMCAC: el primero es NUMA y el segundo es cluster.
Compara las máquinas españolas con otras similares de otros países.
Resulta que son más potentes que las nuestras ... "pasmao". Algo estamos
haciendo mal.
Algo falla en España.
Rafa
--
"We cannot treat computers as Humans. Computers need love."
rgriman@skype.com
o.O?
se refiere a esto: http://www.top500.org/stats/list/32/archtype
el tipo de arquitectura;
o esto: http://www.top500.org/stats/list/32/procarch
la arquitectura del procesador, ¿vector, escalar?
Ambos. En el caso de archtype, tenemos 3 tipos: Constellation (creo que se 
refieren a lo que ha sacado Sun, que en realidad sería un cluster), MPP y 
cluster. Pero en el enlace que pegas abajo del todo con la lista de los 
500 ... se mezclan los 3 tipos. MPP y cluster no funcionan igual y no sirven 
para las mismas tareas.
...
lo que es la generación del procesador, tampoco ayuda mucho a aclarar =/
http://www.top500.org/stats/list/32/procgen
Esto también sería interesante tener en cuenta, pero no suele producir tanta 
diferencia entre uno y otro. Suele afectar más las latencias y los anchos de 
bandas de la comunicaciones que el procesador en sí.

Pero sí, también es interesante ver/comparar sistemas con los mismos 
procesadores. Veremos diferencias, principalmente debido a los sistemas de 
interconexión.
...
En familia de interconexión e interconexión, mencionan NUMA:
http://www.top500.org/stats/list/32/connfam
http://www.top500.org/stats/list/32/conn
Aquí tampoco estoy yo muy de acuerdo, porque NUMALink (que no NUMA) es una 
interconexión entre CPUs y no entre máquinas (como puede ser Infiniband, 
Gigbit, Myrinet, Quadrics). Es decir, es como una especie de Front Side Bus o 
de HyperTransport.

Por eso digo que los sistemas MPP deberían tener su propio Top500 (bueno, a lo 
mejor algo menos que 500 ;) y los clusters el suyo.

Aquí hay dos cosas a tener en cuenta a la hora de separarlos, desde mi punto 
de vista:

	- las tareas que se suelen ejecutar en uno u otro.

	- la "entidad" que tien el sistema: NUMA hay un único "ente"
	  (imagen de sistema operativo), en cambio en los clusters
	  hay tantos como nodos. Esto redunda en diferencias de
	  latencias, por ejemplo.
...
Tema relacionado pero añadiendo, los gráficos se ven interesantes:
http://www.top500.org/charts/list/32/countries
España figura entre los países con superordenadores pero no en el gráfico
de rendimiento.
España no pinta bien, tenemos sistemas muy grandes (ejemplo BSC con 10240 
procesadores) y, efectivamente, no aparece en el gráfico de rendimiento :(
...
No se detalla como calculan el rendimiento, seguro sumando 
los valores mencionados por el Sr. Alienígena Pingüino Melenudo y
dividiéndolos. Lo cual debe ser incorrecto si como dice los diseños no se
deberían de mezclar.
Lo de no mezclar es MHO, lo cual no significa que sea "la verdad" ;)

Los rendimientos se calculan en función del Rmax que da el sistema ejecutando 
Linpack. EMHO, debería ser en función de la distanciación que hay entre Rmax 
y Rpeak ya que el sistema de mayor rendimiento tendría que dar 1, es decir 
Rmax=Rpeak.
...
Aquí mencionan el software que utilizan para medir los sistemas:
http://www.top500.org/project/linpack
se puede bajar, aparentemente y claro indica que si bien no es el mejor, es
el adecuado para comparar a todas las máquinas:
<quote>For the TOP500, we used that version of the benchmark that allows
the user to scale the size of the problem and to optimize the software in
order to achieve the best performance for a given machine. This performance
does not reflect the overall performance of a given system, as no single
number ever can. It does, however, reflect the performance of a dedicated
system for solving a dense system of linear equations. Since the problem is
very regular, the performance achieved is quite high, and the performance
numbers give a good correction of peak performance.</quote>
Bueno hay que leer todo para entenderlo mejor.
Sí, pero ... echad un vistazo a la página de LAPACK:

	http://www.netlib.org/lapack/

	"The original goal of the LAPACK project was to make the widely
	 used EISPACK and LINPACK libraries run efficiently on
	 shared-memory vector and parallel processors. On these machines,
	 LINPACK and EISPACK are inefficient because their memory access
	 patterns disregard the multi-layered memory hierarchies of the
	 machines, thereby spending too much time moving data instead of
	 doing useful floating-point operations."

Es interesante ver que la web de linpack y lapack son:

	http://www.netlib.org/linpack/

	http://www.netlib.org/lapack/

Luego no es que lo haya escrito una persona de la "competencia" y sea una 
crítica desde "el otro lado". Son los mismos los que escriben ambos 
benchmarks.

Y en la propia FAQ de LINPACK dice:

	http://www.netlib.org/utk/people/JackDongarra/faq-linpack.html?#_Toc27885735

	"What is LAPACK?

	LAPACK is a software collection to solve various matrix problem in linear
 	algebra. In particular, systems of linear equations, least squares problems,
	eigenvalue problems, and singular value decomposition. The software is based
	on the use of block partitioned matrix techniques that aid in achieving high
	performance on RISC based systems, vector computers, and shared memory
	parallel processors."
...
Luego y para terminar y no aburrirlos e irme de una vez a bañar que vengo
de correr ;P
La lista de los Mejores 500 está aquí: http://www.top500.org/lists/2008/11
se puede descargar en varios formatos y "trabajarlos" para obtener otras
estadísticas o filtrar la información. Aunque, si la medición real de la
capacidad pico no es la apropiada, entonces estamos en las mismas.
Se usa Rmax, no el Rpeak. Si ordenas dicha lista por Rpeak verás como, por 
ejemplo, el puesto 5 tiene mayor Rmax, pero menor Rpeak y el puesto 6 tiene 
menor Rmax y mayor Rpeak.
...
Pero 
compararlas según su arquitectura y la capacidad teórica es posible.
Y podrían hacer gráficos guay (¿así se escribe?) =P
Sí, así se escribe ;)

   Rafa

-- 
"We cannot treat computers as Humans. Computers need love."

rgriman@skype.com
-- 
Para dar de baja la suscripción, mande un mensaje a:
   opensuse-es+unsubscribe@opensuse.org
Para obtener el resto de direcciones-comando, mande
un mensaje a:
   opensuse-es+help@opensuse.org