[opensuse-es] congelamiento servidor opensuse
hola : Hace 1 mes instale en un servidor, dell con doble procesador xeon 2.8 GHZ , 4GB de RAM y raid 1 por hardware en 2 discos sata de 500GB, un opensuse 11.0 64 bits ( actualizada hasta ayer ) , configure dns,dhcp,samba,ldap,squid,sarg, webmin . El servidor lo enciende el jefe a las 7:O0 am y trabaja bien. El personal ( unas 20 personas) comienza a llegar a las 8:00am encienden sus estaciones y se loguean. y a eso de las 8:30 el servidor se congela , generalmente todos los dias . va uno a revisar el servidor y al darle la contraseña del root no deja entrar. esta totalmente congelado. En algunas ocasiones hemos esperado hasta media hora haber si despega y nada. Toca resetearlo a las malas, el servidor nuevamente arranca, los usuarios se loguean y el resto del dia trabaja bien. Antes dicho servidor tenia instalado suse 10.0 64bits y nunca llego a pasar eso. Reviso los log del sistema y no encuentro errores ( o por lo menos no los veo aun ). Alguna experiencia similar , sera el hardware ? o definitivamente la opensuse 11.0 64 bits es muy inestable ?. la 11.1 esta mejor ( en lo referente ha estabilidad ) Antes de realizar la instalacion recomende la SLES 10 SP2 pues nunca he tenido inconvenientes de ese tipo con una version enterprise, pero el jefe por ahorrase unos pesos decidio hacerlo con opensuse 11.0 . Muchas gracias por sus aportes atte , Juan Manuel R -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Juan Manuel R. escribió:
hola :
Hace 1 mes instale en un servidor, dell con doble procesador xeon 2.8 GHZ , 4GB de RAM y raid 1 por hardware en 2 discos sata de 500GB, un opensuse 110 64 bits ( actualizada hasta ayer ) , configure dns,dhcp,samba,ldap,squid,sarg, webmin .
El servidor lo enciende el jefe a las 7:O0 am y trabaja bien. El personal ( unas 20 personas) comienza a llegar a las 8:00am encienden sus estaciones y se loguean. y a eso de las 8:30 el servidor se congela , generalmente todos los dias . va uno a revisar el servidor y al darle la contraseña del root no deja entrar. esta totalmente congelado. En algunas ocasiones hemos esperado hasta media hora haber si despega y nada.
Toca resetearlo a las malas, el servidor nuevamente arranca, los usuarios se loguean y el resto del dia trabaja bien.
Antes dicho servidor tenia instalado suse 10.0 64bits y nunca llego a pasar eso. Reviso los log del sistema y no encuentro errores ( o por lo menos no los veo aun ).
Alguna experiencia similar , sera el hardware ? o definitivamente la opensuse 11.0 64 bits es muy inestable ?. la 11.1 esta mejor ( en lo referente ha estabilidad )
Antes de realizar la instalacion recomende la SLES 10 SP2 pues nunca he tenido inconvenientes de ese tipo con una version enterprise, pero el jefe por ahorrase unos pesos decidio hacerlo con opensuse 11.0 .
Muchas gracias por sus aportes
atte ,
Juan Manuel R
Revisaste los de samba? Probaste a ver si por ssh podias entrar para ver en consola un top o similar? revisa la rotacion del syslog a ver si lo hace a esa hora mira el cron a ver si hay algun trabajito que salte Cuando se cuelgue desconectalo de la red a ver si se recupera, si ocurre, seguro algun cliente tiene la tarjeta jorobada. -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
2009/1/23, Juan Manuel R.:
Alguna experiencia similar , sera el hardware ? o definitivamente la opensuse 11.0 64 bits es muy inestable ?. la 11.1 esta mejor ( en lo referente ha estabilidad )
Como tienes un hardware muy concreto (servidor Dell), lo primero que haría sería revisar los foros de Dell para ver si hay algún caso similar de cuelgues extraños. Yo también creo que puede ser cosa de la red (¿tarjetas con chipset broadcom? creo que han estado dando problemas...), por lo que o bien probaba pinchando una tarjeta de otro fabricante (chipset realtek) o haría pruebas de estabilidad sin red. Supongo que no tendrás cargado ni instalado ningún entorno ni servidor gráfico, y si es así, prueba iniciando sin cargarlo, en consola. Un fallo de hardware (memoria, calor, polvo, fuente de alimentación, etc...) también podría ser causante del cuelgue, pero si es un servidor reciente y ha estado funcionando bien con la 10.0, parece poco probable. Saludos, -- Camaleón -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
El Viernes, 23 de Enero de 2009, Juan Manuel R. escribió:
hola :
Hace 1 mes instale en un servidor, dell con doble procesador xeon 2.8 GHZ , 4GB de RAM y raid 1 por hardware en 2 discos sata de 500GB, un opensuse 11.0 64 bits ( actualizada hasta ayer ) , configure dns,dhcp,samba,ldap,squid,sarg, webmin .
* ¿los procesadores son de 64 bits? * Instala el kernel-default lleva soporte smp incorporado y borra desinstala el "pae" * Activa SysRQ, por si no fuera un cuelgue total, incrementa el debug del kernel y redirige a la consola actual los mensajes. * pon limites de uso en ulimit * Activa y asigna quotas por usuario o grupo * /tmp esta en la particion raid?, asignale particion aparte, puede ser que llenen / utilizando /tmp (cds, grabaciones, etc)
El servidor lo enciende el jefe a las 7:O0 am y trabaja bien. El personal ( unas 20 personas) comienza a llegar a las 8:00am encienden sus estaciones y se loguean.
* amplia lo de se loguean, nx, ltsp, grafico, consola, base de datos, dominio windows, ldap, etc ......
y a eso de las 8:30 el servidor se congela , generalmente todos los dias . va uno a revisar el servidor y al darle la contraseña del root no deja entrar. esta totalmente congelado. En algunas ocasiones hemos esperado hasta media hora haber si despega y nada.
* si no das con el kid , hay que enviar las salidas del kernel con netconsole a otra maquina, netconsole no tira de irq asi que tiene ciertas limitaciones pero esta diseñado para ser instantaneo, asi que es apropiado para cuelgues.
Toca resetearlo a las malas, el servidor nuevamente arranca, los usuarios se loguean y el resto del dia trabaja bien.
* verifica que /var/log/messages rote con frecuencia y no sea gigantesco.
Antes dicho servidor tenia instalado suse 10.0 64bits y nunca llego a pasar eso. Reviso los log del sistema y no encuentro errores ( o por lo menos no los veo aun ).
* Es probable un modulo para manejo de hardware con algun fallo, video, aceleracion 3d, vmware, la tarjeta raid, etc....
Hola :) El Friday 23 January 2009, Juan Manuel R. escribió:
hola :
Hace 1 mes instale en un servidor, dell con doble procesador xeon 2.8 GHZ , 4GB de RAM y raid 1 por hardware en 2 discos sata de 500GB, un opensuse 11.0 64 bits ( actualizada hasta ayer ) , configure dns,dhcp,samba,ldap,squid,sarg, webmin .
Está corriendo unos cuantos servicios. ¿Qué tarjeta de red tienes? ¿Gigabit? ¿Channel bonding? ¿Jumbo frames? ¿Qué controladora de discos tienes? ¿Qué sistema de ficheros? ¿Cuánta swap?
El servidor lo enciende el jefe a las 7:O0 am y trabaja bien. El personal ( unas 20 personas) comienza a llegar a las 8:00am encienden sus estaciones y se loguean. y a eso de las 8:30 el servidor se congela , generalmente todos los dias . va uno a revisar el servidor y al darle la contrase�a del root no deja entrar. esta totalmente congelado. En algunas ocasiones hemos esperado hasta media hora haber si despega y nada.
Toca resetearlo a las malas, el servidor nuevamente arranca, los usuarios se loguean y el resto del dia trabaja bien.
Pueden ser muchas cosas. Cosa que se me ocurren: - mucho I/O (IOPS) por lo que los discos están que no pueden más - poca CPU -> se producen muchas peticiones (proxy, LDAP, ...) - poca RAM -> hace mucho swap Doy estas opciones porque parece ser que es durante el login de la gente. Luego se produce un cuello de otella en ese momento. Puedes probar a que la gente se conecte de uno en uno o de 5 en 5 para analizar si ocurre lo mismo. Si el resto del día funciona todo, comprueba la carga del sistema y analiza RAM, IOPS, CPU y Red.
Antes dicho servidor tenia instalado suse 10.0 64bits y nunca llego a pasar eso. Reviso los log del sistema y no encuentro errores ( o por lo menos no los veo aun ).
Posiblemente no le dé tiempo de escribirlo a disco.
Alguna experiencia similar , sera el hardware ? o definitivamente la opensuse 11.0 64 bits es muy inestable ?. la 11.1 esta mejor ( en lo referente ha estabilidad )
Antes de realizar la instalacion recomende la SLES 10 SP2 pues nunca he tenido inconvenientes de ese tipo con una version enterprise, pero el jefe por ahorrase unos pesos decidio hacerlo con opensuse 11.0 .
Típico ... :( Verifica lo que te han contestado Jose Mª y los demás colisteros: kernel, conectividad ssh, ... Si te puedes conectar remotamente, usa herramientas como: ps axfu, free y vmstat para monitorizar ya que cargan poco el sistema. Otras herramientas interesantes son las que vienen en el paquete sysstat. Rafa -- "We cannot treat computers as Humans. Computers need love." rgriman@skype.com -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
participants (5)
-
admin-listas
-
Camaleón
-
jose maria
-
Juan Manuel R.
-
Rafa Grimán