Hola, Ayer me sucedió algo similar a lo de este mensaje* que envié hace un mes, lo cual pensaba que se había solucionado pero parece ser que no, aunque el error no es exactamente el mismo, ahora es peor porque no sé de dónde viene. El problema es que al ir a apagar el equipo mediante el comando "shutdown -h now" me dice que que no encuentra el comando. Temiéndome lo peor, le digo que ejecute "mc" para ver los errores del registro y me dice lo mismo. Le digo que haga un "ls" para ver los directorios y me responde como debe (muestra los directorios) pero me dice que en los directorios de root tengo "permission denied". La ejecución de "man" tampoco me la lleva a cabo y no puedo hacer nada. Esperando que ReiserFS no se me enfade mucho, hago un reset manual desde el botón del servidor, me tose un poco ReiserFS y me inicia sin mayores problemas. Entro en una sesión como root y veo que en /var/log/warn no hay nada raro salvo los típicos errores de lectura del dvd, la unidad de disquete que no la puede montar y errores de la gestión de la energía y los módulos cargados, pero nada relacionado con el tema anterior, ni errores de disco, ni del raid. La pregunta es ¿cómo puedo saber qué es lo que ha pasado? ¿Y qué hacer en ese tipo de situaciones en las que no te reconoce ningún comando, te da errores del tipo "input/output error" y no responde a nada? Es un problema que no he visto nunca, desconozco porqué se puede dar y además, se produce de forma aleatoria (desde el día 3/03/2006 que me dio ese error - similar- no había tenido problemas). ¿Algún consejo para este tipo de situaciones, dónde mirar y qué buscar? * http://lists.suse.com/archive/suse-linux-s/2006-Mar/0178.html Saludos, -- Camaleón
Hola :) El Sábado, 1 de Abril de 2006 10:44, Camaleón escribió:
Hola,
Ayer me sucedi� algo similar a lo de este mensaje* que envi� hace un mes, lo cual pensaba que se hab�a solucionado pero parece ser que no, aunque el error no es exactamente el mismo, ahora es peor porque no s� de d�nde viene.
El problema es que al ir a apagar el equipo mediante el comando "shutdown -h now" me dice que que no encuentra el comando. Temi�ndome lo peor, le digo que ejecute "mc" para ver los errores del registro y me dice lo mismo. Le digo que haga un "ls" para ver los directorios y me responde como debe (muestra los directorios) pero me dice que en los directorios de root tengo "permission denied". La ejecuci�n de "man" tampoco me la lleva a cabo y no puedo hacer nada.
Esperando que ReiserFS no se me enfade mucho, hago un reset manual desde el bot�n del servidor, me tose un poco ReiserFS y me inicia sin mayores problemas. Entro en una sesi�n como root y veo que en /var/log/warn no hay nada raro salvo los t�picos errores de lectura del dvd, la unidad de disquete que no la puede montar y errores de la gesti�n de la energ�a y los m�dulos cargados, pero nada relacionado con el tema anterior, ni errores de disco, ni del raid.
La pregunta es �c�mo puedo saber qu� es lo que ha pasado? �Y qu� hacer en ese tipo de situaciones en las que no te reconoce ning�n comando, te da errores del tipo "input/output error" y no responde a nada? Es un problema que no he visto nunca, desconozco porqu� se puede dar y adem�s, se produce de forma aleatoria (desde el d�a 3/03/2006 que me dio ese error - similar- no hab�a tenido problemas).
�Alg�n consejo para este tipo de situaciones, d�nde mirar y qu� buscar?
En los logs: /var/log/messages /var/log/boot* /var/log/ histórico de comandos: tecleando: history, lastcomm, ... ~/.bash_history Una posibilidad es que hayas cambiado permisos sin darte cuenta, crees que estás en un directorio y resulta que estás en otro y tecleas: chmod 0600 * Otra posibilidad es que haya habido un problema durante el arranque y no se hayan montado bien las particiones o algunas no se hayan montado, esto ocurre si tienes /usr en otra partición, por ejemplo. También puede ocurrir que el sistema de ficheros esté corrupto. HTH Rafa -- "Even paranoids have enemies." Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia, 120 - Planta Baja 28003 Madrid Spain Tel: +34 91 3984200 Tel: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com OpenWengo: rgriman Skype: rgriman
2006/4/1, rafagriman: Perdón por lo haber contestado antes así como por el tamaño del mensaje, que seguro que sale gordo :-O. Aquí abajo reviso los ficheros que comentas...
En los logs:
/var/log/messages
Parece que el correo que había enviado con los registros es demasiado grande y el servidor de la lista me lo ha devuelto... de todas formas, en los registros no hay nada raro, nada relacionado con el problema, copio y pego lo más relevante: Mar 31 23:40:04 linux syslog-ng[6028]: syslog-ng version 1.6.8 starting Mar 31 23:40:06 linux syslog-ng[6028]: Changing permissions on special file /dev/xconsole Mar 31 23:40:06 linux syslog-ng[6028]: Changing permissions on special file /dev/tty10 Mar 31 23:40:06 linux master[6127]: setrlimit: Unable to set file descriptors limit to -1: Operation not permitted Mar 31 23:40:06 linux master[6127]: retrying with 1024 (current max) Mar 31 23:40:08 linux saslauthd[6125]: detach_tty : master pid is: 6125 Mar 31 23:40:08 linux saslauthd[6125]: ipc_init : listening on socket: /var/run/sasl2//mux Mar 31 23:40:08 linux master[6127]: process started Mar 31 23:40:09 linux master[6189]: about to exec /usr/lib/cyrus/bin/ctl_cyrusdb Mar 31 23:40:09 linux kernel: klogd 1.4.1, log source = /proc/kmsg started. Mar 31 23:40:09 linux kernel: parport0: PC-style at 0x378 (0x778) [PCSPP,TRISTATE,EPP] Mar 31 23:40:09 linux kernel: parport0: irq 7 detected Mar 31 23:40:09 linux kernel: lp0: using parport0 (polling). Mar 31 23:40:09 linux kernel: i8xx TCO timer: initialized (0x1060). heartbeat=30 sec (nowayout=0) Mar 31 23:40:09 linux kernel: usbcore: registered new driver usbfs Mar 31 23:40:09 linux kernel: usbcore: registered new driver hub Mar 31 23:40:09 linux kernel: ACPI-0212: *** Warning: Device is not power manageable Mar 31 23:40:09 linux kernel: ACPI: PCI Interrupt 0000:00:1d.7[D] -> GSI 23 (level, low) -> IRQ 193 Mar 31 23:40:09 linux kernel: PCI: Setting latency timer of device 0000:00:1d.7 to 64 Mar 31 23:40:09 linux kernel: ehci_hcd 0000:00:1d.7: EHCI Host Controller Mar 31 23:40:09 linux kernel: ehci_hcd 0000:00:1d.7: debug port 1 Mar 31 23:40:09 linux kernel: ehci_hcd 0000:00:1d.7: new USB bus registered, assigned bus number 1 Mar 31 23:40:09 linux kernel: ehci_hcd 0000:00:1d.7: irq 193, io mem 0xd4001400 Mar 31 23:40:09 linux kernel: PCI: cache line size of 128 is not supported by device 0000:00:1d.7 Mar 31 23:40:09 linux kernel: ehci_hcd 0000:00:1d.7: USB 2.0 initialized, EHCI 1.00, driver 10 Dec 2004 Mar 31 23:40:09 linux kernel: hub 1-0:1.0: USB hub found Mar 31 23:40:09 linux kernel: hub 1-0:1.0: 4 ports detected Mar 31 23:40:09 linux kernel: USB Universal Host Controller Interface driver v2.3 Mar 31 23:40:09 linux kernel: ACPI: PCI Interrupt 0000:00:1d.0[A] -> GSI 16 (level, low) -> IRQ 169 Mar 31 23:40:09 linux kernel: PCI: Setting latency timer of device 0000:00:1d.0 to 64 Mar 31 23:40:09 linux kernel: uhci_hcd 0000:00:1d.0: UHCI Host Controller Mar 31 23:40:09 linux kernel: uhci_hcd 0000:00:1d.0: new USB bus registered, assigned bus number 2 Mar 31 23:40:09 linux kernel: uhci_hcd 0000:00:1d.0: irq 169, io base 0x00001400 Mar 31 23:40:09 linux kernel: hub 2-0:1.0: USB hub found Mar 31 23:40:09 linux kernel: hub 2-0:1.0: 2 ports detected Mar 31 23:40:09 linux kernel: ACPI: PCI Interrupt 0000:00:1d.1[B] -> GSI 19 (level, low) -> IRQ 201 Mar 31 23:40:09 linux kernel: PCI: Setting latency timer of device 0000:00:1d.1 to 64 Mar 31 23:40:09 linux kernel: uhci_hcd 0000:00:1d.1: UHCI Host Controller Mar 31 23:40:09 linux kernel: uhci_hcd 0000:00:1d.1: new USB bus registered, assigned bus number 3 Mar 31 23:40:09 linux kernel: uhci_hcd 0000:00:1d.1: irq 201, io base 0x00001420 Mar 31 23:40:09 linux kernel: hub 3-0:1.0: USB hub found Mar 31 23:40:09 linux kernel: hub 3-0:1.0: 2 ports detected Mar 31 23:40:09 linux kernel: pci_hotplug: PCI Hot Plug PCI Core version: 0.5 Mar 31 23:40:09 linux kernel: shpchp: shpc_init : shpc_cap_offset == 0 Mar 31 23:40:09 linux kernel: shpchp: shpc_init : shpc_cap_offset == 0 Mar 31 23:40:09 linux kernel: shpchp: shpc_init : shpc_cap_offset == 0 Mar 31 23:40:09 linux kernel: shpchp: shpc_init : shpc_cap_offset == 0 Mar 31 23:40:09 linux kernel: shpchp: Standard Hot Plug PCI Controller Driver version: 0.4 Mar 31 23:40:09 linux kernel: Floppy drive(s): fd0 is 1.44M Mar 31 23:40:09 linux kernel: hw_random: RNG not detected Mar 31 23:40:09 linux kernel: FDC 0 is a post-1991 82077 Mar 31 23:40:09 linux kernel: hdd: packet command error: status=0x51 { DriveReady SeekComplete Error } Mar 31 23:40:09 linux kernel: hdd: packet command error: error=0x50 { LastFailedSense=0x05 } Mar 31 23:40:09 linux kernel: ide: failed opcode was: unknown Mar 31 23:40:09 linux kernel: Intel(R) PRO/1000 Network Driver - version 6.0.60-k2-NAPI Mar 31 23:40:09 linux kernel: Copyright (c) 1999-2005 Intel Corporation. Mar 31 23:40:09 linux kernel: ACPI: PCI Interrupt 0000:06:01.0[A] -> GSI 24 (level, low) -> IRQ 209 Mar 31 23:40:09 linux kernel: CSLIP: code copyright 1989 Regents of the University of California Mar 31 23:40:09 linux kernel: ISDN subsystem Rev: 1.1.2.3/1.1.2.3/1.1.2.2/1.1.2.3/1.1.2.2/1.1.2.2 loaded Mar 31 23:40:09 linux kernel: e1000: eth0: e1000_probe: Intel(R) PRO/1000 Network Connection Mar 31 23:40:09 linux kernel: ACPI: PCI Interrupt 0000:06:02.0[A] -> GSI 25 (level, low) -> IRQ 217 Mar 31 23:40:09 linux kernel: e1000: eth1: e1000_probe: Intel(R) PRO/1000 Network Connection Mar 31 23:40:09 linux kernel: e1000: eth1: e1000_watchdog_task: NIC Link is Up 1000 Mbps Full Duplex Mar 31 23:40:09 linux kernel: ACPI: Power Button (FF) [PWRF] Mar 31 23:40:09 linux kernel: ACPI: Power Button (CM) [PWRB] Mar 31 23:40:10 linux kernel: NET: Registered protocol family 10 Mar 31 23:40:10 linux kernel: Disabled Privacy Extensions on device ffffffff803fa060(lo) Mar 31 23:40:10 linux kernel: IPv6 over IPv4 tunneling driver Mar 31 23:40:10 linux sshd[6205]: Server listening on :: port 22. Mar 31 23:38:28 linux ntpdate[6170]: step time server 192.53.103.107 offset -102.797298 sec Mar 31 23:38:30 linux smpppd[6130]: smpppd version 1.59 started Mar 31 23:38:33 linux ctl_cyrusdb[6189]: recovering cyrus databases Mar 31 23:38:33 linux upsmon[6094]: Start UpsAgent. [ Version 4.4B (003) ] Mar 31 23:38:33 linux ifup: No configuration found for sit0 Mar 31 23:38:33 linux FaxQueuer[6280]: HylaFAX (tm) Version 4.2.1 Mar 31 23:38:33 linux FaxQueuer[6280]: Copyright (c) 1990-1996 Sam Leffler Mar 31 23:38:33 linux FaxQueuer[6280]: Copyright (c) 1991-1996 Silicon Graphics, Inc. Mar 31 23:38:33 linux ntpd[6283]: ntpd 4.2.0a@1.1191-r Fri Sep 9 19:05:27 UTC 2005 (1) Mar 31 23:38:33 linux ntpd[6283]: precision = 1.000 usec Mar 31 23:38:33 linux ntpd[6283]: Listening on interface wildcard, 0.0.0.0#123 Mar 31 23:38:33 linux ntpd[6283]: Listening on interface wildcard, ::#123 Mar 31 23:38:33 linux ntpd[6283]: Listening on interface lo, 127.0.0.1#123 Mar 31 23:38:33 linux ntpd[6283]: Listening on interface eth1, 172.16.0.12#123 Mar 31 23:38:33 linux ntpd[6283]: kernel time sync status 0040 Mar 31 23:38:33 linux ntpd[6283]: frequency initialized 22.751 PPM from /var/lib/ntp/drift/ntp.drift Mar 31 23:38:34 linux smbd[6154]: [2006/03/31 23:38:34, 0] printing/print_cups.c:cups_cache_reload(85) Mar 31 23:38:34 linux smbd[6154]: Unable to connect to CUPS server localhost - Connection refused Mar 31 23:38:34 linux smbd[6154]: [2006/03/31 23:38:34, 0] printing/print_cups.c:cups_cache_reload(85) Mar 31 23:38:34 linux smbd[6154]: Unable to connect to CUPS server localhost - Connection refused Mar 31 23:38:34 linux HylaFAX[6300]: HylaFAX INET Protocol Server: restarted. Mar 31 23:38:34 linux HylaFAX[6300]: HylaFAX Old Protocol Server: restarted. Mar 31 23:38:34 linux HylaFAX[6300]: HylaFAX SNPP Protocol Server: restarted. Mar 31 23:38:34 linux ctl_cyrusdb[6189]: skiplist: recovered /var/lib/imap/mailboxes.db (1 record, 312 bytes) in 1 second Mar 31 23:38:36 linux ctl_cyrusdb[6189]: skiplist: recovered /var/lib/imap/annotations.db (0 records, 144 bytes) in 2 seconds Mar 31 23:38:37 linux ctl_cyrusdb[6189]: done recovering cyrus databases Mar 31 23:38:37 linux master[6329]: about to exec /usr/lib/cyrus/bin/idled Mar 31 23:38:38 linux kernel: eth1: no IPv6 routers present Mar 31 23:38:39 linux master[6127]: SLPRegister [service:imap://linux.:143] Mar 31 23:38:39 linux master[6127]: Error registering service with slp -20 Mar 31 23:38:39 linux master[6127]: SLPRegister [service:pop3://linux.:110] Mar 31 23:38:39 linux master[6127]: Error registering service with slp -20 Mar 31 23:38:39 linux master[6127]: SLPRegister [service:sieve://linux.:2000] Mar 31 23:38:39 linux master[6127]: Error registering service with slp -20 Mar 31 23:38:39 linux master[6127]: ready for work Mar 31 23:38:39 linux master[6408]: about to exec /usr/lib/cyrus/bin/ctl_cyrusdb Mar 31 23:38:39 linux master[6409]: about to exec /usr/lib/cyrus/bin/pop3d Mar 31 23:38:39 linux master[6410]: about to exec /usr/lib/cyrus/bin/timsieved Mar 31 23:38:39 linux master[6411]: about to exec /usr/lib/cyrus/bin/pop3d Mar 31 23:38:39 linux master[6412]: about to exec /usr/lib/cyrus/bin/timsieved Mar 31 23:38:39 linux ctl_cyrusdb[6408]: checkpointing cyrus databases Mar 31 23:38:39 linux ctl_cyrusdb[6408]: archiving database file: /var/lib/imap/annotations.db Mar 31 23:38:40 linux ctl_cyrusdb[6408]: archiving log file: /var/lib/imap/db/log.0000000001 Mar 31 23:38:41 linux master[6413]: about to exec /usr/lib/cyrus/bin/pop3d Mar 31 23:38:41 linux master[6414]: about to exec /usr/lib/cyrus/bin/pop3d Mar 31 23:38:41 linux master[6415]: about to exec /usr/lib/cyrus/bin/timsieved Mar 31 23:38:41 linux master[6416]: about to exec /usr/lib/cyrus/bin/timsieved Mar 31 23:38:41 linux master[6417]: about to exec /usr/lib/cyrus/bin/pop3d Mar 31 23:38:41 linux master[6418]: about to exec /usr/lib/cyrus/bin/pop3d Mar 31 23:38:41 linux master[6419]: about to exec /usr/lib/cyrus/bin/timsieved Mar 31 23:38:41 linux master[6420]: about to exec /usr/lib/cyrus/bin/timsieved Mar 31 23:38:41 linux pop3[6413]: executed Mar 31 23:38:41 linux pop3[6414]: executed Mar 31 23:38:41 linux pop3[6411]: executed Mar 31 23:38:41 linux pop3[6409]: executed Mar 31 23:38:41 linux pop3[6418]: executed Mar 31 23:38:41 linux pop3[6417]: executed Mar 31 23:38:41 linux sieve[6410]: executed Mar 31 23:38:41 linux sieve[6416]: executed Mar 31 23:38:41 linux sieve[6412]: executed Mar 31 23:38:41 linux sieve[6415]: executed Mar 31 23:38:41 linux sieve[6419]: executed Mar 31 23:38:41 linux sieve[6420]: executed Mar 31 23:38:41 linux ctl_cyrusdb[6408]: archiving database file: /var/lib/imap/mailboxes.db Mar 31 23:38:41 linux ctl_cyrusdb[6408]: archiving log file: /var/lib/imap/db/log.0000000001 Mar 31 23:38:41 linux ctl_cyrusdb[6408]: done checkpointing cyrus databases Mar 31 23:38:41 linux master[6127]: process 6408 exited, status 0 Mar 31 23:38:42 linux kernel: BIOS EDD facility v0.16 2004-Jun-25, 2 devices found Mar 31 23:38:43 linux /usr/sbin/cron[6512]: (CRON) STARTUP (V5.0) Mar 31 23:38:46 linux [powersave]: ERROR (CPUFreq_Kernel:21) Can not set ondemand governor, maybe your cpufreq driver is too slow. Mar 31 23:38:46 linux [powersave]: ERROR (CPUFreq_Kernel:23) Try CPUFREQ_CONTROL=userspace in /etc/sysconfig/powersave/cpufreq. Mar 31 23:38:46 linux [powersave]: ERROR (PM_Interface:231) Cannot create cpufreq objects Mar 31 23:38:46 linux FaxGetty[6574]: OPEN /dev/ttyS0 HylaFAX (tm) Version 4.2.1 Mar 31 23:38:48 linux hal-subfs-mount[6830]: By hald-subfs-mount created dir /media/floppy got removed. Mar 31 23:38:48 linux hal-subfs-mount[6830]: MOUNTPOINT:: /media/floppy Mar 31 23:38:48 linux kernel: subfs 0.9 Mar 31 23:38:48 linux hal-subfs-mount[6830]: Collected mount options and Called(0) /bin/mount -t subfs -o fs=floppyfss,noatime,procuid,nosuid,nodev,exec /dev/fd0 "/media/floppy" Mar 31 23:38:49 linux kernel: end_request: I/O error, dev fd0, sector 0 Mar 31 23:38:49 linux kernel: end_request: I/O error, dev fd0, sector 0 Mar 31 23:38:49 linux kernel: end_request: I/O error, dev fd0, sector 0 Mar 31 23:38:49 linux kernel: end_request: I/O error, dev fd0, sector 0 Mar 31 23:38:49 linux submountd: mount failure, No such device or address Mar 31 23:38:49 linux kernel: subfs: unsuccessful attempt to mount media (256) Mar 31 23:38:56 linux FaxGetty[6574]: MODEM ROCKWELL RC288DPi/ACF3_V1.088-V90_P21_FSH Mar 31 23:40:35 linux kernel: e1000: eth0: e1000_watchdog_task: NIC Link is Up 1000 Mbps Full Duplex Mar 31 23:40:36 linux kernel: ip_tables: (C) 2000-2002 Netfilter core team Mar 31 23:40:45 linux kernel: eth0: no IPv6 routers present Mar 31 23:42:38 linux kernel: e1000: eth0: e1000_watchdog_task: NIC Link is Up 1000 Mbps Full Duplex Mar 31 23:42:41 linux kernel: e1000: eth1: e1000_watchdog_task: NIC Link is Up 1000 Mbps Full Duplex Mar 31 23:42:49 linux kernel: eth0: no IPv6 routers present Mar 31 23:42:49 linux kernel: eth1: no IPv6 routers present Mar 31 23:43:18 linux upsmon[6285]: SAI 1 (600) 00 Communication is lost. [N] Mar 31 23:43:18 linux upsmon[6285]: SAI 2 (330) 00 Communication is lost. [N] Mar 31 23:43:19 linux upsmon[6285]: SAI RACK (330) 00 Communication is lost. [N] Mar 31 23:44:11 linux nmbd[6211]: [2006/03/31 23:44:11, 0] nmbd/nmbd_become_lmb.c:become_local_master_stage2(396) Mar 31 23:44:11 linux nmbd[6211]: ***** Mar 31 23:44:11 linux nmbd[6211]: Mar 31 23:44:11 linux nmbd[6211]: Samba name server LINUX is now a local master browser for workgroup WORKGROUP on subnet 172.16.0.13 Mar 31 23:44:11 linux nmbd[6211]: Mar 31 23:44:11 linux nmbd[6211]: ***** Mar 31 23:44:11 linux nmbd[6211]: [2006/03/31 23:44:11, 0] nmbd/nmbd_become_lmb.c:become_local_master_stage2(396) Mar 31 23:44:11 linux nmbd[6211]: ***** Mar 31 23:44:11 linux nmbd[6211]: Mar 31 23:44:11 linux nmbd[6211]: Samba name server LINUX is now a local master browser for workgroup WORKGROUP on subnet 172.16.0.12 Mar 31 23:44:11 linux nmbd[6211]: Mar 31 23:44:11 linux nmbd[6211]: ***** Mar 31 23:49:17 linux kernel: e1000: eth1: e1000_watchdog_task: NIC Link is Up 1000 Mbps Full Duplex Mar 31 23:49:22 linux upsmon[6285]: SAI RACK (330) 01 Communication is established. Mar 31 23:49:22 linux upsmon[6285]: SAI 1 (600) 01 Communication is established. Mar 31 23:49:22 linux upsmon[6285]: SAI 2 (330) 01 Communication is established. Mar 31 23:49:25 linux kernel: eth1: no IPv6 routers present Mar 31 23:50:24 linux init: Switching to runlevel: 0 Mar 31 23:50:24 linux FaxGetty[6574]: CAUGHT SIGNAL 15 Mar 31 23:50:24 linux FaxGetty[6574]: CLOSE /dev/ttyS0 Mar 31 23:50:31 linux sshd[6205]: Received signal 15; terminating. Mar 31 23:50:31 linux smpppd[6222]: terminating on signal 15 Mar 31 23:50:31 linux FaxQueuer[6280]: QUIT Mar 31 23:50:31 linux nmbd[6211]: [2006/03/31 23:50:31, 0] nmbd/nmbd.c:terminate(58) Mar 31 23:50:31 linux nmbd[6211]: Got SIGTERM: going down... Mar 31 23:50:31 linux nmbd[6211]: [2006/03/31 23:50:31, 0] libsmb/nmblib.c:send_udp(791) Mar 31 23:50:31 linux nmbd[6211]: Packet send failed to 172.16.0.255(138) ERRNO=Invalid argument Mar 31 23:50:31 linux nmbd[6211]: [2006/03/31 23:50:31, 0] libsmb/nmblib.c:send_udp(791) Mar 31 23:50:31 linux nmbd[6211]: Packet send failed to 172.16.0.255(138) ERRNO=Invalid argument Mar 31 23:50:32 linux master[6127]: SLPderegister [service:imap://linux.:143] Mar 31 23:50:32 linux master[6127]: SLPderegister [service:pop3://linux.:110] Mar 31 23:50:32 linux master[6127]: SLPderegister [service:sieve://linux.:2000] Mar 31 23:50:32 linux master[6127]: exiting on SIGTERM/SIGINT Mar 31 23:50:32 linux saslauthd[6125]: server_exit : master exited: 6125 Mar 31 23:50:32 linux kernel: Kernel logging (proc) stopped. Mar 31 23:50:32 linux kernel: Kernel log daemon terminating. Mar 31 23:50:33 linux syslog-ng[6028]: syslog-ng version 1.6.8 going down
histórico de comandos:
tecleando: history, lastcomm, ...
Me muestra los últimos comandos eejcutados: mc, shutdown -h now, logout... nada raro.
~/.bash_history
Una posibilidad es que hayas cambiado permisos sin darte cuenta, crees que estás en un directorio y resulta que estás en otro y tecleas:
chmod 0600 *
Ein? No, no puede ser, porque no entré en sesión ssh con el equipo hasta que fui a apagarlo. La pantalla me pedía el login, entré como root, puse la contraseña y me empezó a soltar los errores.
Otra posibilidad es que haya habido un problema durante el arranque y no se hayan montado bien las particiones o algunas no se hayan montado, esto ocurre si tienes /usr en otra partición, por ejemplo.
Tampoco. Tengo dos discos en raid1 s-ata de 200 gb. para el sistema operativo con las siguientes particiones: sda swap -- 1 GB. data1 --> ReiserFS de 80 GB. (SuSE 10.0) data2 --> ReiserFS de 80 GB. data3 --> ReiserFS de 40 GB. El disco sdb es una partición ext3 de 1,2 TB. en raid 5 (4 discos s-ata de 400 GB. para backup). De momento no hay ningún dato.
También puede ocurrir que el sistema de ficheros esté corrupto.
Pero entonces estaría corrpupto siempre hasta que no lo reparara, y no es el caso. ReiserFS me dice "Filesystem is clean" una vez que he iniciado esta mañana y ahora (de momento) todo funciona bien. :-? -- Camaleón
Hola :) El Sábado, 1 de Abril de 2006 19:38, Camaleón escribió:
2006/4/1, rafagriman:
Perd�n por lo haber contestado antes as� como por el tama�o del mensaje, que seguro que sale gordo :-O.
No pasa nada ;)
Aqu� abajo reviso los ficheros que comentas...
En los logs:
/var/log/messages
Parece que el correo que hab�a enviado con los registros es demasiado grande y el servidor de la lista me lo ha devuelto... de todas formas,
El messages puede crecer mucho, como ejemplo, esta semana que hemos estado montando el cluster, hemos conseguido un messages de 107 MB en unas 4 horas. La razón es que pusimos un par de cosas a debug y claro ...
en los registros no hay nada raro, nada relacionado con el problema, copio y pego lo m�s relevante:
Mar 31 23:40:09 linux kernel: hdd: packet command error: status=0x51 { DriveReady SeekComplete Error } Mar 31 23:40:09 linux kernel: hdd: packet command error: error=0x50 { LastFailedSense=0x05 } Mar 31 23:40:09 linux kernel: ide: failed opcode was: unknown
Esto no es bueno, mi equipo me decía esto mismo, pasé de él y reventó un disco duro (y otro está a punto). Suele ocurrir cuando: - el cable IDE no es bueno (está partido, defectuoso, ...) - el cable, el disco duro y/o la controladora no tienen la misma "velocidad". Si el disco y la controladora son UDMA 100 (por ejemplo) comprueba que el cable sea de 80 cables.
hist�rico de comandos:
tecleando: history, lastcomm, ...
Me muestra los �ltimos comandos eejcutados: mc, shutdown -h now, logout... nada raro.
OK :) Más que nada te lo decía para revisar por si había algún comando que no debería estar ;)
~/.bash_history
Una posibilidad es que hayas cambiado permisos sin darte cuenta, crees que est�s en un directorio y resulta que est�s en otro y tecleas:
chmod 0600 *
Ein? No, no puede ser, porque no entr� en sesi�n ssh con el equipo hasta que fui a apagarlo. La pantalla me ped�a el login, entr� como root, puse la contrase�a y me empez� a soltar los errores.
OK, descartado también, hubiera saltado en los comandos anteriores.
Otra posibilidad es que haya habido un problema durante el arranque y no se hayan montado bien las particiones o algunas no se hayan montado, esto ocurre si tienes /usr en otra partici�n, por ejemplo.
Tampoco. Tengo dos discos en raid1 s-ata de 200 gb. para el sistema operativo con las siguientes particiones:
RAID 1 para sistema operativo ... mmmm no me gusta mucho. Te cuento, el problema de RAID 1 para SO es que si actualizas/modificas y hay algo que falla ... falla en los dos discos :( Algunos clientes nuestros se empeñan en RAID 1 ... hasta que les falla y viene el llanto y el rechinar de dientes. Yo prefiero hacer imágenes de disco, de esta manera actualizas una imagen y si falla ... tienes la otra que contiene una imagen del momento anterior a la actualización.
sda swap -- 1 GB. data1 --> ReiserFS de 80 GB. (SuSE 10.0) data2 --> ReiserFS de 80 GB. data3 --> ReiserFS de 40 GB.
El disco sdb es una partici�n ext3 de 1,2 TB. en raid 5 (4 discos s-ata de 400 GB. para backup). De momento no hay ning�n dato.
¿Es RAID por SW o por "HW"? Lo digo porque no soy muy partidario del de SW, aunque hay otra gente que lo prefiere. NO FLAMES, sólo MHO ;)
Tambi�n puede ocurrir que el sistema de ficheros est� corrupto.
Pero entonces estar�a corrpupto siempre hasta que no lo reparara, y no es el caso. ReiserFS me dice "Filesystem is clean" una vez que he iniciado esta ma�ana y ahora (de momento) todo funciona bien.
Me rindo 0;) Pues lo único que queda es lo que dice Carlos. No conozco el problema al que se refiere Carlos puesto que sólo he usado reiser cuando salió y hasta que aparecieron XFS y ext3 ... es decir, hace mucho ;)
:-?
Estamos igual :( Carlos ... necesitamos un poco de sabiduría ;) ¿Cuál es el problema del que hablas? Rafa -- "Even paranoids have enemies." OpenWengo: rgriman Skype: rgriman
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 20:30 +0200, rafagriman@gmail.com escribió:
Mar 31 23:40:09 linux kernel: hdd: packet command error: status=0x51 { DriveReady SeekComplete Error } Mar 31 23:40:09 linux kernel: hdd: packet command error: error=0x50 { LastFailedSense=0x05 } Mar 31 23:40:09 linux kernel: ide: failed opcode was: unknown
Esto no es bueno, mi equipo me decía esto mismo, pasé de él y reventó un disco duro (y otro está a punto). Suele ocurrir cuando:
Depende. Si sólo pasa una vez durante todos los aranques, yo pasaría de él. Si pasa durante el funcionamiento, de manera aleatoria, entonces me preocupo y mucho. Es que algunas veces es problema del driver que se está inicializando y aprendiendo lo que puede hacer - es mi interpretación. Por ejemplo, siempre que suspendo el equipo se me producen estos errores: Apr 1 20:24:53 nimrodel kernel: Freeing memory... done (188994 pages freed) Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:53 nimrodel kernel: ide: failed opcode was: unknown Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:53 nimrodel kernel: ide: failed opcode was: unknown Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:53 nimrodel kernel: ide: failed opcode was: unknown Apr 1 20:24:57 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:57 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:57 nimrodel kernel: ide: failed opcode was: unknown Y así unos cuantos. Pero es sólo en esa fase, y sospecho que es porque algún módulo necesario está descargado. Después funciona tan campante... y llevo ya meses, si no años, viendo esos errores. Es algo de software, la autocomprobación smart larga no dice nada de nada (nada malo).
Carlos ... necesitamos un poco de sabiduría ;) ¿Cuál es el problema del que hablas?
Sé muy poco. Aparece a veces, una corrupción del reiserfs que el chequeo de arranque no detecta, y que se manifiesta con la imposibilidad del root de escribir y tocar permisos en algunos ficheros o directorios. Sólo se corrige a partición desmontada, por lo que si es la raiz, debe ser reparada con CD de rescate. Me tengo que ir, preguntadme luego. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELswStTMYHG2NR9URArZYAJ9rf8eGSARmT9k0jXbh+5iPwh/BdgCffIwj TWp/4/6MUZ2hwAEWK356p8c= =XuWn -----END PGP SIGNATURE-----
Hola :) El Sábado, 1 de Abril de 2006 20:53, Carlos E. R. escribió:
El 2006-04-01 a las 20:30 +0200, rafagriman@gmail.com escribi�:
Mar 31 23:40:09 linux kernel: hdd: packet command error: status=0x51 { DriveReady SeekComplete Error } Mar 31 23:40:09 linux kernel: hdd: packet command error: error=0x50 { LastFailedSense=0x05 } Mar 31 23:40:09 linux kernel: ide: failed opcode was: unknown
Esto no es bueno, mi equipo me dec�a esto mismo, pas� de �l y revent� un disco duro (y otro est� a punto). Suele ocurrir cuando:
Depende. Si s�lo pasa una vez durante todos los aranques, yo pasar�a de �l. Si pasa durante el funcionamiento, de manera aleatoria, entonces me preocupo y mucho. Es que algunas veces es problema del driver que se est� inicializando y aprendiendo lo que puede hacer - es mi interpretaci�n.
Por ejemplo, siempre que suspendo el equipo se me producen estos errores:
Apr 1 20:24:53 nimrodel kernel: Freeing memory... done (188994 pages freed) Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:53 nimrodel kernel: ide: failed opcode was: unknown Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:53 nimrodel kernel: ide: failed opcode was: unknown Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:53 nimrodel kernel: ide: failed opcode was: unknown Apr 1 20:24:57 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:57 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError } Apr 1 20:24:57 nimrodel kernel: ide: failed opcode was: unknown
A mi es que me pasaba mientras trabajaba y pensé "Bah, paso ... total, es un sistema para guarrear".
Y as� unos cuantos. Pero es s�lo en esa fase, y sospecho que es porque alg�n m�dulo necesario est� descargado. Despu�s funciona tan campante... y llevo ya meses, si no a�os, viendo esos errores. Es algo de software, la autocomprobaci�n smart larga no dice nada de nada (nada malo).
Carlos ... necesitamos un poco de sabidur�a ;) �Cu�l es el problema del que hablas?
S� muy poco. Aparece a veces, una corrupci�n del reiserfs que el chequeo de arranque no detecta, y que se manifiesta con la imposibilidad del root de escribir y tocar permisos en algunos ficheros o directorios. S�lo se corrige a partici�n desmontada, por lo que si es la raiz, debe ser reparada con CD de rescate.
Ahhhhh ... entonces puede ocurrir una cosa ... <intentando pensar> ... ... Bueno, lo digo, en algunos casos si falla el testeo del sistema de ficheros (aka fsck), la partición se monta de solo lectura por lo que escribir no te deja, aunque leer sí. Luego tecleas: mount -o rw,remount / y ya está montada rw. No creo que sea el caso porque sí te deberías poder leer/ejecutar comandos si fuera el caso.
Me tengo que ir, preguntadme luego.
Como sé que vas a leer el correo luego ... le doy a enviar ahora ;) Rafa -- "Even paranoids have enemies." OpenWengo: rgriman Skype: rgriman
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 21:15 +0200, rafagriman@gmail.com escribió: ...
corrige a partici[f3]n desmontada, por lo que si es la raiz, debe ser reparada con CD de rescate.
Ahhhhh ... entonces puede ocurrir una cosa ...
<intentando pensar>
...
...
Bueno, lo digo, en algunos casos si falla el testeo del sistema de ficheros (aka fsck), la partición se monta de solo lectura por lo que escribir no te deja, aunque leer sí. Luego tecleas:
mount -o rw,remount /
y ya está montada rw. No creo que sea el caso porque sí te deberías poder leer/ejecutar comandos si fuera el caso.
No, no es el caso. Es un fallo peculiar de reiser, que por otra parte trabaja normalmente, salvo algún directorio corrupto. Es el problema de reiser, que nadie entendemos realmente como funciona. Otro fallo peculiar que tuvo hace un par de años es que determinados nombres de ficheros en el directorio raiz de cualquier partición decía que era el mismo nombre de fichero. Debe hacer algún tipo de hash o algo para buscar rápidamente los nombres (recuerda que permite millones de ficheros en un sólo directorio) y había un error y no distinguía algunos nombres. Bueno, pues por sólo probarlo se me corrompió el filesystem.
Me tengo que ir, preguntadme luego.
Como sé que vas a leer el correo luego ... le doy a enviar ahora ;)
No problem :-) - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELtxKtTMYHG2NR9URAsbNAJ9OT8viroWdWAsMiQdnpDNX1HEdJgCfR/dF BuBh+B3xDCHcfff9oEMExzQ= =mkTj -----END PGP SIGNATURE-----
El 1/04/06, Carlos E. R.
-----BEGIN PGP SIGNED MESSAGE-----
[...]
y ya está montada rw. No creo que sea el caso porque sí te deberías poder leer/ejecutar comandos si fuera el caso.
No, no es el caso. Es un fallo peculiar de reiser, que por otra parte trabaja normalmente, salvo algún directorio corrupto. Es el problema de reiser, que nadie entendemos realmente como funciona.
ojo... no se a que version de resiser te menciona, pero Hans Reiser a modificado bastante el codigo de ReiserFS y has echo el posible para que el mismo sea mas legible ahora en la version 4 !!! hay una discussion bastante interessante (y sangrienta!!! :-D) en esta direccion http://kerneltrap.org/node/5679 sobre el asunto!!! salu2 -- -- Victor Hugo dos Santos Linux Counter #224399
El Sábado, 1 de Abril de 2006 4:20 PM, Victor Hugo dos Santos escribió:
El 1/04/06, Carlos E. R.
escribió: -----BEGIN PGP SIGNED MESSAGE-----
[...]
y ya está montada rw. No creo que sea el caso porque sí te deberías poder leer/ejecutar comandos si fuera el caso.
No, no es el caso. Es un fallo peculiar de reiser, que por otra parte trabaja normalmente, salvo algún directorio corrupto. Es el problema de reiser, que nadie entendemos realmente como funciona.
ojo... no se a que version de resiser te menciona, pero Hans Reiser a modificado bastante el codigo de ReiserFS y has echo el posible para que el mismo sea mas legible ahora en la version 4 !!!
hay una discussion bastante interessante (y sangrienta!!! :-D) en esta direccion http://kerneltrap.org/node/5679 sobre el asunto!!!
Concuerdo con Robinson en no utilizar ReiserFS, a pesar de su característica de ahorro de espacio, pero varias veces explotó el PC y tuve que reinstalar linux, cosa que solo me pasaba con un sistema operatívo que creo que nadie sabe cuál es y no lo voy a nombrar. En mi PC de escritorio, la última instalación estuve dormido y no cambié el FS a ext3 y quedó reiser, hasta que no me dió el primer error no me percaté y ahora sigo sufriendo las consecuencias. ERRORES en los datos de NUEVO, colgadas inesperadas, inestabilidad en los programas, y mas. Tuve la sensanción en algún momento como la de Victor Hugo, en cuanto a que debió madurar, pero con un PC totalmente nuevo y con suse 10, me dió errores. Por los momentos yo (particularmente) prefiero el ext3. SaludoX -- ************************ Hugo Sandoval Consultor http://www.softwarelibre.com.ve http://www.virtualnet.com.ve ************************ <*******> HACKER Persona que disfruta del reto intelectual de superar o rodear las limitaciones de forma creativa... El resto es simple delincuencia. <*******>
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 17:18 -0400, Hugo Sandoval escribió:
Concuerdo con Robinson en no utilizar ReiserFS, a pesar de su característica de ahorro de espacio, pero varias veces explotó el PC y tuve que reinstalar
Si utilizo reiser, pero no en el sistema, y menos en el raiz, sólo en datos. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELv3BtTMYHG2NR9URAn5YAKCNn54EuGvDhEXOmeV0xXDt+8Tx+wCeIdSb QDL5woip6J6q/3Jjb3MF4nE= =dJaX -----END PGP SIGNATURE-----
Hola Con SuSE 9.1 me daba este error: hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error } hda: drive_cmd: error=0x04 { DriveStatusError }
Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError }
que se me hace que es el mismo que comentas. Lo cierto que en SuSE 10.0 ya no da esta falla; y si mal no recuerdo era un problema de programación y creo que estaba explicado en la base de soporte de SuSE. Alfredo
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-03 a las 02:46 -0300, Alfredo Jesús Delaiti Iannelli escribió:
Con SuSE 9.1 me daba este error:
hda: drive_cmd: status=0x51 { DriveReady SeekComplete Error } hda: drive_cmd: error=0x04 { DriveStatusError }
Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: status=0x51 { DriveReady SeekComplete Error } Apr 1 20:24:53 nimrodel kernel: hdb: task_no_data_intr: error=0x04 { DriveStatusError }
que se me hace que es el mismo que comentas. Lo cierto que en SuSE 10.0 ya no da esta falla; y si mal no recuerdo era un problema de programación y creo que estaba explicado en la base de soporte de SuSE.
¿Te suena donde? He buscado por "task_no_data_intr", "SeekComplete" "DriveReady" y nanay. Lo peculiar de mi caso es que sólo ocurre durante la suspensión a swap, nunca durante el uso, por muy intensivo que sea. Y no supone problema "real", funciona. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFEMjkmtTMYHG2NR9URAoiVAJwN5fSTVjuh6gaKDk17EcmtpbPxOACeOO+B smE5w6AWnGa/lDRzgOSYYQQ= =1WtF -----END PGP SIGNATURE-----
2006/4/1, rafagriman:
Mar 31 23:40:09 linux kernel: hdd: packet command error: status=0x51 { DriveReady SeekComplete Error } Mar 31 23:40:09 linux kernel: hdd: packet command error: error=0x50 { LastFailedSense=0x05 } Mar 31 23:40:09 linux kernel: ide: failed opcode was: unknown
Esto no es bueno, mi equipo me decía esto mismo, pasé de él y reventó un disco duro (y otro está a punto). Suele ocurrir cuando:
- el cable IDE no es bueno (está partido, defectuoso, ...)
- el cable, el disco duro y/o la controladora no tienen la misma "velocidad". Si el disco y la controladora son UDMA 100 (por ejemplo) comprueba que el cable sea de 80 cables.
Jo, qué susto me has dado. El registro que comentas es de la unidad lectora de DVDs, no es un disco duro, y sí, veo la luz parpadenado continuamente... revisaré el cable y las conexiones.
RAID 1 para sistema operativo ... mmmm no me gusta mucho. Te cuento, el problema de RAID 1 para SO es que si actualizas/modificas y hay algo que falla ... falla en los dos discos :( Algunos clientes nuestros se empeñan en RAID 1 ... hasta que les falla y viene el llanto y el rechinar de dientes.
Sí, eso está claro. Ningún nivel de raid te protege de errores humanos... ;-).
Yo prefiero hacer imágenes de disco, de esta manera actualizas una imagen y si falla ... tienes la otra que contiene una imagen del momento anterior a la actualización.
Es una buena idea, pero tienes que saber trabajar con imágenes y puede ser complicado ("keep it simple"). Ojo, que para mi los nieveles de raid son una complicación más, pero si se puede evitar un fallo físico de disco, pues bienvenida sea la complicación.
¿Es RAID por SW o por "HW"? Lo digo porque no soy muy partidario del de SW, aunque hay otra gente que lo prefiere. NO FLAMES, sólo MHO ;)
Pues no sabría decirte, tal y como está este tema hoy en día :-P. Es una tarjeta Adaptec Zero Channel 2020SA* que va conectada físicamente al puerto pci de la placa base e interactúa con una controladora de 8 puertos s-ata Marvell de la placa.
Me rindo 0;)
Y yo, es que es muy raro... hay errores y errores, pero que no te reconozca ningún comando, no te deje apagar ni reiniciar, nada... es muy extraño e inquietante. :-S
Pues lo único que queda es lo que dice Carlos. No conozco el problema al que se refiere Carlos puesto que sólo he usado reiser cuando salió y hasta que aparecieron XFS y ext3 ... es decir, hace mucho ;)
Yo tampoco sabía de estos errores en el sistema de archivos ReiserFS, sé que no le sientan nada bien los apagones bruscos (por eso detrás tengo un sai) pero dejarte el sistema bloqueado es un tema serio. * http://linuxmafia.com/faq/Hardware/sata.html#adaptec-zcr Saludos, -- Camaleón
Hola :) El Sábado, 1 de Abril de 2006 20:55, Camaleón escribió:
2006/4/1, rafagriman:
Mar 31 23:40:09 linux kernel: hdd: packet command error: status=0x51 { DriveReady SeekComplete Error } Mar 31 23:40:09 linux kernel: hdd: packet command error: error=0x50 { LastFailedSense=0x05 } Mar 31 23:40:09 linux kernel: ide: failed opcode was: unknown
Esto no es bueno, mi equipo me dec�a esto mismo, pas� de �l y revent� un disco duro (y otro est� a punto). Suele ocurrir cuando:
- el cable IDE no es bueno (est� partido, defectuoso, ...)
- el cable, el disco duro y/o la controladora no tienen la misma "velocidad". Si el disco y la controladora son UDMA 100 (por ejemplo) comprueba que el cable sea de 80 cables.
Jo, qu� susto me has dado. El registro que comentas es de la unidad lectora de DVDs, no es un disco duro, y s�, veo la luz parpadenado continuamente... revisar� el cable y las conexiones.
Lo siento, no me he dado cuenta que era sábado y un susto así no se debe dar en fines de semana 0;) Siendo el DVD, es "menos" grave.
RAID 1 para sistema operativo ... mmmm no me gusta mucho. Te cuento, el problema de RAID 1 para SO es que si actualizas/modificas y hay algo que falla ... falla en los dos discos :( Algunos clientes nuestros se empe�an en RAID 1 ... hasta que les falla y viene el llanto y el rechinar de dientes.
S�, eso est� claro. Ning�n nivel de raid te protege de errores humanos... ;-).
;)
Yo prefiero hacer im�genes de disco, de esta manera actualizas una imagen y si falla ... tienes la otra que contiene una imagen del momento anterior a la actualizaci�n.
Es una buena idea, pero tienes que saber trabajar con im�genes y puede ser complicado ("keep it simple"). Ojo, que para mi los nieveles de raid son una complicaci�n m�s, pero si se puede evitar un fallo f�sico de disco, pues bienvenida sea la complicaci�n.
En el caso de XFS es muy simple y rápido hacer una imágen:
mount -o xfs /dev/
�Es RAID por SW o por "HW"? Lo digo porque no soy muy partidario del de SW, aunque hay otra gente que lo prefiere. NO FLAMES, s�lo MHO ;)
Pues no sabr�a decirte, tal y como est� este tema hoy en d�a :-P. Es una tarjeta Adaptec Zero Channel 2020SA* que va conectada f�sicamente al puerto pci de la placa base e interact�a con una controladora de 8 puertos s-ata Marvell de la placa.
Ni idea, no conozco esta placa 0:)
Me rindo 0;)
Y yo, es que es muy raro... hay errores y errores, pero que no te reconozca ning�n comando, no te deje apagar ni reiniciar, nada... es muy extra�o e inquietante. :-S
Esto de que no reconozca ningún comando (al no reconocer ningún comando,
tampoco te reconoce halt/reboot/shutdown/init) se produce, por ejemplo si se
monta una partición "errónea" en un lugar "erróneo". Un ejemplo, si tecleas:
mount -t <filesystem> /dev/
Pues lo �nico que queda es lo que dice Carlos. No conozco el problema al que se refiere Carlos puesto que s�lo he usado reiser cuando sali� y hasta que aparecieron XFS y ext3 ... es decir, hace mucho ;)
Yo tampoco sab�a de estos errores en el sistema de archivos ReiserFS, s� que no le sientan nada bien los apagones bruscos (por eso detr�s tengo un sai) pero dejarte el sistema bloqueado es un tema serio.
Yo por eso me pasé al ext3 y al XFS ;) Me voy a dar una vuelta yo también ;) Rafa -- "Even paranoids have enemies." OpenWengo: rgriman Skype: rgriman
2006/4/1, rafagriman:
Hola :)
Como Carlos nos ha dejado se ha ido de "parranda" :-D, pues continuamos con la conversación...
Lo siento, no me he dado cuenta que era sábado y un susto así no se debe dar en fines de semana 0;) Siendo el DVD, es "menos" grave.
-5 puntos. Ahora eres vulnerable a todo tipos de ataques de fuego... Ains, qué recuerdos "roleros". Hombre, un susto así no se da un sábado. >:)
En el caso de XFS es muy simple y rápido hacer una imágen:
mount -o xfs /dev/
/mnt xfs_dump -l 0 -J - / | xfs_restore - /mnt
Un disco con unos 3 GB tarda unos 7 minutos.
¿7 minutos --> 3 GB.? Es una buena solución para copias de seguridad...
Ni idea, no conozco esta placa 0:)
Nada, nada, yo os presento...: http://www.supermicro.es/products/motherboard/Xeon800/E7520/X6DHT-G.html
Obviamente estas cosas no ocurren al azar o por fuerzas electromagnéticas de las mareas cuando hay un eclipse parcial en día par de mes impar. Ocurre: - cuando fstab es incorrecto
Una posibilidad, pero en cada arranque me daría el mismo error (salvo que lo corrijiera), y no es el caso porque sin hacer nada, se inicia tan fresco.
- te equivocas y lo haces a mano como el ejemplo anterior
El equipo se inició, nadie inició sesión y al intentar apagar, error al canto.
- escribes el ejemplo anterior para fastidiar a alguien
Nadie ha iniciado sesión en el equipo, además eso deja rastro.
Yo por eso me pasé al ext3 y al XFS ;)
Pues a partir de ahora lo voy a pensar... detenidamente. Si finalmente descubrimos que es un error exclusivo de ReiserFS, formateo, instalo y pongo ext3 (xfs me da miedo... :-S) Saludos, -- Camaleón
El 1/04/06, Camaleón
2006/4/1, rafagriman:
[...]
En el caso de XFS es muy simple y rápido hacer una imágen:
mount -o xfs /dev/
/mnt xfs_dump -l 0 -J - / | xfs_restore - /mnt
Un disco con unos 3 GB tarda unos 7 minutos.
¿7 minutos --> 3 GB.? Es una buena solución para copias de seguridad...
siiii.. se ve algo bastante interessante !!! existira algo asi para otros FS ??? [...]
Yo por eso me pasé al ext3 y al XFS ;)
Pues a partir de ahora lo voy a pensar... detenidamente. Si finalmente descubrimos que es un error exclusivo de ReiserFS, formateo, instalo y pongo ext3 (xfs me da miedo... :-S)
mmmm.. pero hombre, se no te diera miedo, no haberia aventura !!!! yo uso reiserfs hace bastante tiempo y hasta el momento no me ha dado problemas (tanto en mis estaciones de trabajo como en servidores).. pero utilizar XFS seria una opcion interessante algun dia !!!! :-D salu2 -- -- Victor Hugo dos Santos Linux Counter #224399
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 21:43 +0200, Camaleón escribió:
Yo por eso me pasé al ext3 y al XFS ;)
Pues a partir de ahora lo voy a pensar... detenidamente. Si finalmente descubrimos que es un error exclusivo de ReiserFS, formateo, instalo y pongo ext3 (xfs me da miedo... :-S)
El problema sólo se manifiesta en la partición raiz, no en las demás; el motivo es que la partición raiz se comprueba durante el arranque estando montada ro, mientras que las demás están totalmente desmontadas. Es decir, se puede presentar, pero se corrige sin que te des cuenta. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELt24tTMYHG2NR9URAjbRAJ0RYX+/DBo597sXcbXwMTKsU2ox3gCfe3pu uYdKziz8DyledyT9C0sgIWQ= =8gZX -----END PGP SIGNATURE-----
Hola :) El Sábado, 1 de Abril de 2006 21:43, Camaleón escribió:
2006/4/1, rafagriman:
Hola :)
Como Carlos nos ha dejado se ha ido de "parranda" :-D, pues continuamos con la conversaci�n...
Lo siento, no me he dado cuenta que era s�bado y un susto as� no se debe dar en fines de semana 0;) Siendo el DVD, es "menos" grave.
-5 puntos. Ahora eres vulnerable a todo tipos de ataques de fuego... Ains, qu� recuerdos "roleros".
Hombre, un susto as� no se da un s�bado. >:)
Y eso que no celebro April's Fools ;) (Día de los Inocentes en países anglosajobes, el 1 de abril).
En el caso de XFS es muy simple y r�pido hacer una im�gen:
mount -o xfs /dev/
/mnt xfs_dump -l 0 -J - / | xfs_restore - /mnt
Un disco con unos 3 GB tarda unos 7 minutos.
�7 minutos --> 3 GB.? Es una buena soluci�n para copias de seguridad...
no está mal ;) Ojo, depende del disco. Son discos SCSI a 15000 rpm y es una máquina de 16 CPUs y 23 GB de RAM. Si alguien está interesado, lo puedo probar en mi casa: AMD k7 1330 + 1.5 GB de RAM + 2 HDD IDE.
Ni idea, no conozco esta placa 0:)
Nada, nada, yo os presento...:
http://www.supermicro.es/products/motherboard/Xeon800/E7520/X6DHT-G.html
Obviamente estas cosas no ocurren al azar o por fuerzas electromagn�ticas de las mareas cuando hay un eclipse parcial en d�a par de mes impar. Ocurre: - cuando fstab es incorrecto
Una posibilidad, pero en cada arranque me dar�a el mismo error (salvo que lo corrijiera), y no es el caso porque sin hacer nada, se inicia tan fresco.
- te equivocas y lo haces a mano como el ejemplo anterior
El equipo se inici�, nadie inici� sesi�n y al intentar apagar, error al canto.
- escribes el ejemplo anterior para fastidiar a alguien
Nadie ha iniciado sesi�n en el equipo, adem�s eso deja rastro.
Correcto :)
Yo por eso me pas� al ext3 y al XFS ;)
Pues a partir de ahora lo voy a pensar... detenidamente. Si finalmente descubrimos que es un error exclusivo de ReiserFS, formateo, instalo y pongo ext3 (xfs me da miedo... :-S)
ext3 me funciona muy bien para / y XFS lo uso para /home. No suelo hacer más particiones. En el cao de nuestros servidores, lo que usamos es XFS sólo (cuestiones de soporte). HTH Rafa -- "Even paranoids have enemies." Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia, 120 - Planta Baja 28003 Madrid Spain Tel: +34 91 3984200 Tel: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com OpenWengo: rgriman Skype: rgriman
El 1/04/06, Camaleón escribió:
Pues a partir de ahora lo voy a pensar... detenidamente. Si finalmente descubrimos que es un error exclusivo de ReiserFS, formateo, instalo y pongo ext3 (xfs me da miedo... :-S)
Buenas... perdón por retomar el hilo, pero me ha vuelto a pasar lo mismo, se me ha quedado colgado en el mismo equipo, sin ejecutar nada especial, sin carga. Los mensajes que veo pulsando Crtl + Alt + F11 dicen: ReiserFS warning vs-13070: reiserfs_read_locked_inode: i/o failure occurred trying to findstat data of [5437674 0x0 SD] Y un montón de sda2 i/o error... Este error se debe de producir por algún motivo y no tiene nada que ver con la controladora raid, ya cuando me estaba dando estos errores le he quitado el segundo disco del array y ni se ha enterado, se ha puesto a pitar y acto seguido se pone a reconstruir el array de nuevo (una vez insertado el disco). No sé cómo solucionarlo si no es formateando el sistema y utilizando ext3, tal y como tengo en los discos de back-up que están en raid5. Si tenéis alguna pista más, se agradece. Por mi parte voy a terminar de ejecutar algunas pruebas y lo doy por terminado, no puede ser que en una semana suceda esto en dos ocasiones. :-( Saludos, -- Camaleón
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-07 a las 20:35 +0200, Camaleón escribió:
ReiserFS warning vs-13070: reiserfs_read_locked_inode: i/o failure occurred trying to findstat data of [5437674 0x0 SD]
Y un montón de sda2 i/o error...
El reiser se queja porque se topa con un error de entrada salida con el disco. Puede ser la controladora, puede ser el disco (lo más probable, creo). ¿SMART? - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFENvWRtTMYHG2NR9URArJXAJ4vkXSoQsqYrhA4xhXygwfnC43vXwCfRnm4 s/C70Y6rv0DySI9xj1cVfw4= =ubMq -----END PGP SIGNATURE-----
El 8/04/06, Carlos E. R. escribió:
El reiser se queja porque se topa con un error de entrada salida con el disco. Puede ser la controladora, puede ser el disco (lo más probable, creo).
Eso es lo que voy intentar descifrar. En primer lugar voy a actualizar el firmware de la controladora ya que las arrays se me caen de vez en cuando y eso desde luego, nada tiene que ver con ReiserFS. Una vez actualizado el firmware, veré qué sudece. Si me sigue sucediendo los mismo con el sistema (quedarse bloqueado), pasaré a verificar el disco. Primero desde la propia controladora RAID que tiene la opción de "Verify disk media" para detectar posibles errores en los discos, ya que como están en raid 1 puede estar fallando cualquiera de los dos. Si no encuentra ningún error, la segunda opción es quitar uno de los dicos en raid y trabajar sólo con el otro, para ver si me da el fallo. Si no da ningún error, pondré el otro disco, y a ver si falla. Son varias opciones, no se me ocurren más. Si no consigo un sistema estable tendré que pasarme a ext3. De todas formas, me temo que esto es un problema de ReiserFS bajo determinadas circunstancias, porque si se trata de un fallo del disco ¿para qué demonios me sirve tener un raid si ReiserFS se me queda colgado, no tendría que evitar precisamente ese error?
¿SMART?
Puedo verificar los discos desde la bios de la controladora raid, a ver qué me cuentan. Saludos, -- Camaleón
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-08 a las 15:35 +0200, Camaleón escribió:
Son varias opciones, no se me ocurren más. Si no consigo un sistema estable tendré que pasarme a ext3. De todas formas, me temo que esto es un problema de ReiserFS bajo determinadas circunstancias, porque si se trata de un fallo del disco ¿para qué demonios me sirve tener un raid si ReiserFS se me queda colgado, no tendría que evitar precisamente ese error?
No si el fallo está precisamente en la controladora, y ambos discos están en la misma controladora: pero eso se recomienda raid con distintas controladoras. Es una de las ventajas del raid en softare ;-) - -- Saludos -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFEP+xItTMYHG2NR9URAsQUAJ40RlK2E8zuvFG0byTS/eqk/1WgUACglVD7 GYRH+ha7nBDcZBV8N+TO3mY= =YYai -----END PGP SIGNATURE-----
El Viernes, 14 de Abril de 2006 2:39 PM, Carlos E. R. escribió:
El 2006-04-08 a las 15:35 +0200, Camaleón escribió:
Son varias opciones, no se me ocurren más. Si no consigo un sistema estable tendré que pasarme a ext3. De todas formas, me temo que esto es un problema de ReiserFS bajo determinadas circunstancias, porque si se trata de un fallo del disco ¿para qué demonios me sirve tener un raid si ReiserFS se me queda colgado, no tendría que evitar precisamente ese error?
No si el fallo está precisamente en la controladora, y ambos discos están en la misma controladora: pero eso se recomienda raid con distintas controladoras.
Es una de las ventajas del raid en softare ;-)
Díganme como quieran, yo sigo prefiriendo el ext3 x-D -- ************************ Hugo Sandoval Consultor http://www.softwarelibre.com.ve http://www.virtualnet.com.ve ************************ <*******> HACKER Persona que disfruta del reto intelectual de superar o rodear las limitaciones de forma creativa... El resto es simple delincuencia. <*******>
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 20:30 +0200, rafagriman@gmail.com escribió:
Tampoco. Tengo dos discos en raid1 s-ata de 200 gb. para el sistema operativo con las siguientes particiones:
RAID 1 para sistema operativo ... mmmm no me gusta mucho. Te cuento, el problema de RAID 1 para SO es que si actualizas/modificas y hay algo que falla ... falla en los dos discos :( Algunos clientes nuestros se empeñan en RAID 1 ... hasta que les falla y viene el llanto y el rechinar de dientes.
Yo prefiero hacer imágenes de disco, de esta manera actualizas una imagen y si falla ... tienes la otra que contiene una imagen del momento anterior a la actualización.
Pero es que son cosas distintas. Tu puedes tener el sistema operativo en raid para evitar que problemas del disco te paren el sistema, y mantener imágenes, o un sistema de backup histórico para recuperarte de cualquier cambio, o imágenes si se prefiere.
¿Es RAID por SW o por "HW"? Lo digo porque no soy muy partidario del de SW, aunque hay otra gente que lo prefiere. NO FLAMES, sólo MHO ;)
A mi me gusta el de software, pero simplemente porque es más flexible y controlable. También me gusta el de hardware, rinde más - siempre y cuando sea verdadero raid en hardware, y no un engendro a base de drivers. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELttAtTMYHG2NR9URAofTAJ0bKzBm4U/0LRcfSXouVsq0xypVOgCdHnQp RmaDWMbqyiyMW+5xBoM+7sM= =/hKp -----END PGP SIGNATURE-----
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 10:44 +0200, Camaleón escribió:
El problema es que al ir a apagar el equipo mediante el comando "shutdown -h now" me dice que que no encuentra el comando. Temiéndome lo peor, le digo que ejecute "mc" para ver los errores del registro y me dice lo mismo. Le digo que haga un "ls" para ver los directorios y me responde como debe (muestra los directorios) pero me dice que en los directorios de root tengo "permission denied". La ejecución de "man" tampoco me la lleva a cabo y no puedo hacer nada.
Esperando que ReiserFS
Vale, no sigas. ¿Tienes reiser? Es un problema típico, y es el motivo por el que no lo pongo en la partición raiz. Arranca el CD/dvd de rescate, llega a consola, y haz un fsck manual de las particiones reiserfs.
en ese tipo de situaciones en las que no te reconoce ningún comando, te da errores del tipo "input/output error" y no responde a nada?
Llorar... Trato de desmontar todas las particiones que pueda, y parar todos los servicios que pueda, aunque sea con kill, y después de unos instantes de inactividad, apago. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELlA+tTMYHG2NR9URAtW6AJwOz5WoOGCs/H8vpve8HLCgW7l0rACfS/U/ XPA6JuSDLmF55xFsKfiGsZI= =FFD1 -----END PGP SIGNATURE-----
El 1/04/06, Carlos E. R. escribió:
Vale, no sigas. ¿Tienes reiser? Es un problema típico, y es el motivo por el que no lo pongo en la partición raiz.
¿Problema típico? :-O Pues no me ha pasado en ningún otro equipo. ¿Y el motivo, cuál es exactamente, está documentado? ¿Cuándo sucede, bajo alguna circunstancia especial?
Arranca el CD/dvd de rescate, llega a consola, y haz un fsck manual de las particiones reiserfs.
Al reiniciar el equipo me dice "Filesystem is clean" ¿me lo creo o no?
Llorar...
:_(
Trato de desmontar todas las particiones que pueda, y parar todos los servicios que pueda, aunque sea con kill, y después de unos instantes de inactividad, apago.
¿Pero te deja apagar al cabo de un rato y te deja ejecutar kill? Vaya... ¿Y de verdad es normal este error del sistema de archivos? Me deja el servidor muerto, si tuviera algún cliente conectado leyendo el correo o intentando enviar un fax no hubiera podido... me parece muy serio. Saludos, -- Camaleón
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 19:29 +0200, Camaleón escribió:
El 1/04/06, Carlos E. R. escribió:
Vale, no sigas. ¿Tienes reiser? Es un problema típico, y es el motivo por el que no lo pongo en la partición raiz.
¿Problema típico? :-O Pues no me ha pasado en ningún otro equipo. ¿Y el motivo, cuál es exactamente, está documentado? ¿Cuándo sucede, bajo alguna circunstancia especial?
Está documentado... en las listas. Me pasó una vez, y le ha pasado a 3 o 4 personas más. Es bastante raro, pero tiene esos sintomas, no poder escribir en algún sitio siendo root.
Arranca el CD/dvd de rescate, llega a consola, y haz un fsck manual de las particiones reiserfs.
Al reiniciar el equipo me dice "Filesystem is clean" ¿me lo creo o no?
Normalmente, si. En este caso, no. ;-)
Llorar...
:_(
Trato de desmontar todas las particiones que pueda, y parar todos los servicios que pueda, aunque sea con kill, y después de unos instantes de inactividad, apago.
¿Pero te deja apagar al cabo de un rato y te deja ejecutar kill?
A veces... depende de lo gordo que sea el casque y donde afectó...
Vaya... ¿Y de verdad es normal este error del sistema de archivos? Me deja el servidor muerto, si tuviera algún cliente conectado leyendo el correo o intentando enviar un fax no hubiera podido... me parece muy serio.
No, lo más normal es no poder escribir en un directorio. Tan gordo como el tuyo, no es corriente, dentro de lo raro que es. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELskqtTMYHG2NR9URAiirAJ9rNfdk73FY6InQFbulSH4jEkrzaACfUcbw Txm3oCij3/o0mCimILqJN/Y= =ygEY -----END PGP SIGNATURE-----
El 1/04/06, Carlos E. R. escribió:
Está documentado... en las listas. Me pasó una vez, y le ha pasado a 3 o 4 personas más. Es bastante raro, pero tiene esos sintomas, no poder escribir en algún sitio siendo root.
Pero es que me pasa lo mismo (no me reconoce ningún comando) con un usuario del sistema, no es exclusivo de root. :-? Me voy a dar una vuelta por la lista de ReiserFS a ver si cazo alguna situación similar... Saludos, -- Camaleón
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-04-01 a las 20:59 +0200, Camaleón escribió:
Está documentado... en las listas. Me pasó una vez, y le ha pasado a 3 o 4 personas más. Es bastante raro, pero tiene esos sintomas, no poder escribir en algún sitio siendo root.
Pero es que me pasa lo mismo (no me reconoce ningún comando) con un usuario del sistema, no es exclusivo de root.
Por supuesto, claro; pero cuando ni el root no puede tocar los ficheros, estonces es muy llamativo, ya no es problema de permisos.
Me voy a dar una vuelta por la lista de ReiserFS a ver si cazo alguna situación similar...
En la lista inglesa lo hemos visto de vez en cuando, pero de uvas a peras. En esa a lo mejor incluso saben el motivo. Tu haz lo que digo, pásale el fsck a sistema parado, desde el CD. Sólo pierdes tiempo, y ganas seguridad. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFELt5ItTMYHG2NR9URAg2CAKCSCpw14hpvlWYkWgQfCbBpoo/2xgCdHpTF NH6Xbh8i0Sv4pat4W0iizeQ= =08S6 -----END PGP SIGNATURE-----
participants (7)
-
Alfredo Jesús Delaiti Iannelli
-
Camaleón
-
Carlos E. R.
-
Carlos E. R.
-
Hugo Sandoval
-
rafagriman@gmail.com
-
Victor Hugo dos Santos