El Viernes, 23 de Enero de 2009, Juan Manuel R. escribió:
hola :
Hace 1 mes instale en un servidor, dell con doble procesador xeon 2.8 GHZ , 4GB de RAM y raid 1 por hardware en 2 discos sata de 500GB, un opensuse 11.0 64 bits ( actualizada hasta ayer ) , configure dns,dhcp,samba,ldap,squid,sarg, webmin .
* ¿los procesadores son de 64 bits? * Instala el kernel-default lleva soporte smp incorporado y borra desinstala el "pae" * Activa SysRQ, por si no fuera un cuelgue total, incrementa el debug del kernel y redirige a la consola actual los mensajes. * pon limites de uso en ulimit * Activa y asigna quotas por usuario o grupo * /tmp esta en la particion raid?, asignale particion aparte, puede ser que llenen / utilizando /tmp (cds, grabaciones, etc)
El servidor lo enciende el jefe a las 7:O0 am y trabaja bien. El personal ( unas 20 personas) comienza a llegar a las 8:00am encienden sus estaciones y se loguean.
* amplia lo de se loguean, nx, ltsp, grafico, consola, base de datos, dominio windows, ldap, etc ......
y a eso de las 8:30 el servidor se congela , generalmente todos los dias . va uno a revisar el servidor y al darle la contraseña del root no deja entrar. esta totalmente congelado. En algunas ocasiones hemos esperado hasta media hora haber si despega y nada.
* si no das con el kid , hay que enviar las salidas del kernel con netconsole a otra maquina, netconsole no tira de irq asi que tiene ciertas limitaciones pero esta diseñado para ser instantaneo, asi que es apropiado para cuelgues.
Toca resetearlo a las malas, el servidor nuevamente arranca, los usuarios se loguean y el resto del dia trabaja bien.
* verifica que /var/log/messages rote con frecuencia y no sea gigantesco.
Antes dicho servidor tenia instalado suse 10.0 64bits y nunca llego a pasar eso. Reviso los log del sistema y no encuentro errores ( o por lo menos no los veo aun ).
* Es probable un modulo para manejo de hardware con algun fallo, video, aceleracion 3d, vmware, la tarjeta raid, etc....