Hola :) cartman wrote:
Claro, todo lo que han respondido es de gran ayuda; y he aclarado mucho al respecto; pero una cosa más, el equipo sufrió por apagones repentinos y luego se optó por colocarle una UPS (SAI). Creo que a partir de esos apagones el sistema quedó fallando hasta que un día se produjo el unerror al inicio, que decía que no se podía acceder a /proc y que estaba de solo lectura, asi como otros directorios. Que pudo pasar???
Si es /proc lo que ha cascado ... no es un sistema de ficheros que se monta en disco. Es un sistema de ficheros en RAM por lo que ... puede ser: - problema de RAM: se debió a un fallo eléctrico luego los chips de la RAM pueden haber cascado - problema del kernel: el disco fue dañado en un punto del kernel y al cargar en RAM falla. (/proc refleja el kernel) - ambos problemas Estoy un poco de acuerdo con todo lo que han aportado los compañeros. Te puedo aconsejar otras cosas que no se han comentado como por ejemplo: drbd. Algunos de nuestros clientes simplemente hacen una imagen del disco y otros optan por RAID-1. Personalmente optaría por: - instalar de nuevo un sistema fiable y migrar todos los datos - crear una imagen del disco en correctas condiciones (para esto tienes desde un simple cat hasta herramientas como xfsdump pasando por dd y otras tantas que habrá por ahí) - guardar esa imagen como oro en paño - usar un SAI - puedes usar drbd para duplicar los datos (/home) de un equipo a otro en "tiempo real" - un buen sistema de copias de seguridad Si se vuelve a ir la luz y se te estropea el disco duro (o la RAM) simplemente: - enchufas otro disco duro nuevo (y la RAM nueva si se te ha dañado la anterior) - vuelcas la imagen del sistema - recuperas los datos (/home) de la copia de seguridad (o de la copia hecha con drbd) - a funcionar Obviamente tendrías un downtime por lo que puedes pensar en un sistema en HA: dos servidores, sistema de almacenamiento en cluster (GFS, por ejemplo), ... todo el HW redundante. -> mucho dinero. Esto es un ejemplo, donde he puesto drbd, se puede poner RAID 5, por ejemplo. Puedes usar LVM para que te haga snapshots, ... Por cierto, ten cuidado con los SAI porque no todos ofrecen protección frente a picos de tensión, sólo te ofrecen protección frente a caídas del sistema eléctrico. También hay que tener en cuenta que un SAI te suele dar una autonomía de 10 minutos (lo justo para guardar los datos y apagar la máquina), si lo que quieres es seguir trabajando (y no tener sólo 10 minutos), necesitarás más baterías o un SAI sobredimensionado. Más cosas respecto a los SAI. Hay que vigilarlos porque los 10 minutos te los dan si las baterías están cargadas, hay quien no vigila esto y los 10 minutos se convierten en 5 ... HTH Rafa -- Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia , 120 - Planta Baja 28003 Madrid, Spain Tel: +34 91 3984200 Fax: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com