[opensuse-es] Smart me arrojo un mensaje de falla. :-( OpenSuSE 10.3
Hola lista, Eso, al arrancar OpenSuSE 10.3 y al entrar al escritorio KDE Smart me arrojo el siguiente menasaje: Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors Puchas la mala suerte; justo en ese disco tengo las particiones linux y por ende mi instalación OpenSuSE. No quiero darme la pega de nuevo si ocurre un desastre, a saber que todo a estas alturas marcha de perlas. He tratado de buscar acronis para ver como funciona y sacar una imagen del sistema a estas alturas pero no se de donde descargarlo, y con el cd de Ghost Linux no se como diablos generar la imagen del sistema y por ende las particiones. :-( Tiene el mensaje de error solución?. Gracias. --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-29 a las 15:14 -0300, Familia Lema Haeger. escribió:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Buff. :-(
Tiene el mensaje de error solución?.
Reemplazar el disco rápidamente... Hombre, compruebalo primero. Mira primero el log del smart, para ver más detalles (smartctl -a /dev/hdb), luego lanzas la prueba larga, y miras el resultado de nuevo. Los sectores con errores de lectura pueden ser mapeados, y eso se dispara escribiendo en ellos. Una de las maneras es machacar todo el disco, o al menos la zona con errores, pero claro, pierdes lo que haya grabado. - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHTwg9tTMYHG2NR9URApfdAJ9VpvrDmJN9o3gP8D74nKDy0/YbwQCfSypT nHY7oHiUZ3iLTDKMP7FY0Bg= =sE/r -----END PGP SIGNATURE-----
Familia Lema Haeger. escribió:
Hola lista,
Eso, al arrancar OpenSuSE 10.3 y al entrar al escritorio KDE Smart me arrojo el siguiente menasaje:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Puchas la mala suerte; justo en ese disco tengo las particiones linux y por ende mi instalación OpenSuSE. No quiero darme la pega de nuevo si ocurre un desastre, a saber que todo a estas alturas marcha de perlas.
He tratado de buscar acronis para ver como funciona y sacar una imagen del sistema a estas alturas pero no se de donde descargarlo, y con el cd de Ghost Linux no se como diablos generar la imagen del sistema y por ende las particiones. :-(
Tiene el mensaje de error solución?.
Gracias.
Por las dudas te tiro una experiencia propia y reciente: Para saber el estado del disco, desde consola hacé: smartctl -t long /dev/hdb ... te informará una hora. Unos minutos después que se cumpla, hacé: smartctl -l selftest /dev/hdb ... y te mostrará el resultado. En mi caso el sistema de archivos era ext3 y no lo montaba. Pero SI lo montó como ext2, y así pude rescatar casi todo el contenido. ¡Suerte! --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Alberto Vicat escribió:
Familia Lema Haeger. escribió:
Hola lista,
Eso, al arrancar OpenSuSE 10.3 y al entrar al escritorio KDE Smart me arrojo el siguiente menasaje:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Puchas la mala suerte; justo en ese disco tengo las particiones linux y por ende mi instalación OpenSuSE. No quiero darme la pega de nuevo si ocurre un desastre, a saber que todo a estas alturas marcha de perlas.
He tratado de buscar acronis para ver como funciona y sacar una imagen del sistema a estas alturas pero no se de donde descargarlo, y con el cd de Ghost Linux no se como diablos generar la imagen del sistema y por ende las particiones. :-(
Tiene el mensaje de error solución?.
Gracias.
Por las dudas te tiro una experiencia propia y reciente: Para saber el estado del disco, desde consola hacé:
smartctl -t long /dev/hdb
... te informará una hora. Unos minutos después que se cumpla, hacé:
smartctl -l selftest /dev/hdb
... y te mostrará el resultado. En mi caso el sistema de archivos era ext3 y no lo montaba. Pero SI lo montó como ext2, y así pude rescatar casi todo el contenido.
¡Suerte!
--------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Hice lo que me indicas, pero me sale esto: linux-lemahaeger:/home/lemahaeger # smartctl -t long /dev/hdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/ Smartctl open device: /dev/hdb failed: No such file or directory linux-lemahaeger:/home/lemahaeger # Estuve viendo mis particiones y estas son las que tengo: /dev/sdb 140 GB sdb1 /swap sdb2 /native sdb3 /home Entonces el smart me avisa de un error en sdb, pero no especifica en que partición, cierto?. Debia ejecutar ese comando para cada una de las particiones? Saludos. :-) --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Familia Lema Haeger. escribió:
Alberto Vicat escribió:
Por las dudas te tiro una experiencia propia y reciente: Para saber el estado del disco, desde consola hacé:
smartctl -t long /dev/hdb
... te informará una hora. Unos minutos después que se cumpla, hacé:
smartctl -l selftest /dev/hdb
... y te mostrará el resultado. En mi caso el sistema de archivos era ext3 y no lo montaba. Pero SI lo montó como ext2, y así pude rescatar casi todo el contenido.
¡Suerte!
Hice lo que me indicas, pero me sale esto:
linux-lemahaeger:/home/lemahaeger # smartctl -t long /dev/hdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
Smartctl open device: /dev/hdb failed: No such file or directory linux-lemahaeger:/home/lemahaeger #
Estuve viendo mis particiones y estas son las que tengo: /dev/sdb 140 GB sdb1 /swap sdb2 /native sdb3 /home
Entonces el smart me avisa de un error en sdb, pero no especifica en que partición, cierto?. Debia ejecutar ese comando para cada una de las particiones?
Saludos. :-)
No, no, analiza disco entero, no particiones. No se de dónde saqué yo que tu disco era hdb, reemplazá donde puse hdb por tu sdb (/dev/sdb), el resto igual. Suerte --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Alberto Vicat escribió:
Familia Lema Haeger. escribió:
Alberto Vicat escribió:
Por las dudas te tiro una experiencia propia y reciente: Para saber el estado del disco, desde consola hacé:
smartctl -t long /dev/hdb
... te informará una hora. Unos minutos después que se cumpla, hacé:
smartctl -l selftest /dev/hdb
... y te mostrará el resultado. En mi caso el sistema de archivos era ext3 y no lo montaba. Pero SI lo montó como ext2, y así pude rescatar casi todo el contenido.
¡Suerte!
Hice lo que me indicas, pero me sale esto:
linux-lemahaeger:/home/lemahaeger # smartctl -t long /dev/hdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
Smartctl open device: /dev/hdb failed: No such file or directory linux-lemahaeger:/home/lemahaeger #
Estuve viendo mis particiones y estas son las que tengo: /dev/sdb 140 GB sdb1 /swap sdb2 /native sdb3 /home
Entonces el smart me avisa de un error en sdb, pero no especifica en que partición, cierto?. Debia ejecutar ese comando para cada una de las particiones?
Saludos. :-)
No, no, analiza disco entero, no particiones. No se de dónde saqué yo que tu disco era hdb, reemplazá donde puse hdb por tu sdb (/dev/sdb), el resto igual.
Suerte
--------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Es verdad, ni yo me di cuenta de ese detalle, ahora hice: linux-lemahaeger:/home/lemahaeger # smartctl -t long /dev/sdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Extended self-test routine immediately in off-line mode". Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 54 minutes for test to complete. Test will complete after Fri Nov 30 00:30:43 2007 Use smartctl -X to abort test. Esta bien eso, cierto?. Tengo que esperar hasta las 12:30 para que termine, cierto?. Y luego hacer el otro comando que indica, es decir; smartctl -l selftest /dev/sdb Saludos. --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Familia Lema Haeger. escribió:
Alberto Vicat escribió:
No, no, analiza disco entero, no particiones. No se de dónde saqué yo que tu disco era hdb, reemplazá donde puse hdb por tu sdb (/dev/sdb), el resto igual.
Suerte
Es verdad, ni yo me di cuenta de ese detalle, ahora hice:
linux-lemahaeger:/home/lemahaeger # smartctl -t long /dev/sdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Extended self-test routine immediately in off-line mode". Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 54 minutes for test to complete. Test will complete after Fri Nov 30 00:30:43 2007
Use smartctl -X to abort test.
Esta bien eso, cierto?. Tengo que esperar hasta las 12:30 para que termine, cierto?. Y luego hacer el otro comando que indica, es decir; smartctl -l selftest /dev/sdb
Saludos.
Correcto. Y si podés dale algunos minutitos más por las dudas. Él queda haciendo el test en segundo plano y te permite seguir trabajando con la PC, por eso te informa la hora en que estima terminar. Pero de cualquier manera, si ya S.M.A.R.T. te avisó... el pronóstico es negro. :-( Saludos --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Alberto Vicat escribió:
Familia Lema Haeger. escribió:
Alberto Vicat escribió:
No, no, analiza disco entero, no particiones. No se de dónde saqué yo que tu disco era hdb, reemplazá donde puse hdb por tu sdb (/dev/sdb), el resto igual.
Suerte
Es verdad, ni yo me di cuenta de ese detalle, ahora hice:
linux-lemahaeger:/home/lemahaeger # smartctl -t long /dev/sdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF OFFLINE IMMEDIATE AND SELF-TEST SECTION === Sending command: "Execute SMART Extended self-test routine immediately in off-line mode". Drive command "Execute SMART Extended self-test routine immediately in off-line mode" successful. Testing has begun. Please wait 54 minutes for test to complete. Test will complete after Fri Nov 30 00:30:43 2007
Use smartctl -X to abort test.
Esta bien eso, cierto?. Tengo que esperar hasta las 12:30 para que termine, cierto?. Y luego hacer el otro comando que indica, es decir; smartctl -l selftest /dev/sdb
Saludos.
Correcto. Y si podés dale algunos minutitos más por las dudas. Él queda haciendo el test en segundo plano y te permite seguir trabajando con la PC, por eso te informa la hora en que estima terminar. Pero de cualquier manera, si ya S.M.A.R.T. te avisó... el pronóstico es negro. :-(
Saludos
--------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Listo con la primera instrucción. Ahora al hacer el segundo comando (smartctl -l selftest /dev/sdb), me tira esto: linux-lemahaeger:/home/lemahaeger # smartctl -l selftest /dev/sdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 7449 - # 2 Extended offline Completed without error 00% 0 - Que significa?. Estoy bien al interpretar de que no hay errores?. Saludos. --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Familia Lema Haeger. escribió:
Listo con la primera instrucción. Ahora al hacer el segundo comando (smartctl -l selftest /dev/sdb), me tira esto:
linux-lemahaeger:/home/lemahaeger # smartctl -l selftest /dev/sdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 7449 - # 2 Extended offline Completed without error 00% 0 -
Que significa?. Estoy bien al interpretar de que no hay errores?.
Saludos.
Pues parece que si: "Completed without error" = completado sin error, y se le falta el 00% es porque pasó el 100% sin errores. Yo me pondría contento con ese resultado. Me descoloca que S.M.A.R.T. le acuse fallas. Supongo que estarás bien seguro de que en ambos casos se trata del sdb, del mismo disco. Reporta dos tests largos efectuados, uno cuando tenía 0 horas de uso y el otro cuando tenía 7449 horas de uso (el de anoche). Y en ambos casos sin errores. ¿S.M.A.R.T. te lo sigue dando como fallado? Saludos --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 07:31 -0300, Alberto Vicat escribió:
¿S.M.A.R.T. te lo sigue dando como fallado?
Se puede mirar "smartctl -a /dev/sdb", y sale el log de errores anteriores. - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHT+mDtTMYHG2NR9URAsRkAKCCm8U+MsPKvHn66bq8V84tJf27mgCeNFRp PI+hl3gsPGw1pVhV0Xc6rJo= =rFIJ -----END PGP SIGNATURE-----
Carlos E. R. escribió:
El 2007-11-30 a las 07:31 -0300, Alberto Vicat escribió:
¿S.M.A.R.T. te lo sigue dando como fallado?
Se puede mirar "smartctl -a /dev/sdb", y sale el log de errores anteriores.
-- Saludos Carlos E.R.
Esta es la salida del sitado comando: linux-lemahaeger:/home/lemahaeger # smartctl -a /dev/sdb smartctl version 5.37 [i686-suse-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/ === START OF INFORMATION SECTION === Model Family: Seagate Barracuda 7200.9 family Device Model: ST3160812AS Serial Number: 4LS0H80J Firmware Version: 3.AAD User Capacity: 160,041,885,696 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 7 ATA Standard is: Exact ATA specification draft version not indicated Local Time is: Fri Nov 30 10:03:15 2007 CLST SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x82) Offline data collection activity was completed without error. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 430) seconds. Offline data collection capabilities: (0x5b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. No Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 54) minutes. SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 119 075 006 Pre-fail Always - 213836503 3 Spin_Up_Time 0x0003 099 099 000 Pre-fail Always - 0 4 Start_Stop_Count 0x0032 098 098 020 Old_age Always - 2322 5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0 7 Seek_Error_Rate 0x000f 085 060 030 Pre-fail Always - 384680920 9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 7450 10 Spin_Retry_Count 0x0013 100 100 097 Pre-fail Always - 0 12 Power_Cycle_Count 0x0032 098 098 020 Old_age Always - 3018 187 Unknown_Attribute 0x0032 001 001 000 Old_age Always - 244 189 Unknown_Attribute 0x003a 100 100 000 Old_age Always - 0 190 Temperature_Celsius 0x0022 071 050 045 Old_age Always - 488046621 194 Temperature_Celsius 0x0022 029 050 000 Old_age Always - 29 (Lifeti me Min/Max 0/12) 195 Hardware_ECC_Recovered 0x001a 068 045 000 Old_age Always - 220491154 197 Current_Pending_Sector 0x0012 001 001 000 Old_age Always - 4294967294 198 Offline_Uncorrectable 0x0010 001 001 000 Old_age Offline - 4294967294 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Always - 0 200 Multi_Zone_Error_Rate 0x0000 100 253 000 Old_age Offline - 0 202 TA_Increase_Count 0x0032 100 253 000 Old_age Always - 0 SMART Error Log Version: 1 ATA Error Count: 444 (device log contains only the most recent five errors) CR = Command Register [HEX] FR = Features Register [HEX] SC = Sector Count Register [HEX] SN = Sector Number Register [HEX] CL = Cylinder Low Register [HEX] CH = Cylinder High Register [HEX] DH = Device/Head Register [HEX] DC = Device Command Register [HEX] ER = Error register [HEX] ST = Status register [HEX] Powered_Up_Time is measured from power on, and printed as DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes, SS=sec, and sss=millisec. It "wraps" after 49.710 days. Error 444 occurred at disk power-on lifetime: 7285 hours (303 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 03 08 d7 07 60 e0 00 01:23:04.986 READ DMA EXT 25 03 80 67 6a 8b e0 00 01:23:04.985 READ DMA EXT 25 03 80 e7 69 8b e0 00 01:23:04.985 READ DMA EXT 25 03 80 67 69 8b e0 00 01:23:04.984 READ DMA EXT 25 03 80 e7 68 8b e0 00 01:23:04.983 READ DMA EXT Error 443 occurred at disk power-on lifetime: 7285 hours (303 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 03 08 d7 07 60 e0 00 01:23:01.555 READ DMA EXT 25 03 80 6f 1d 03 e0 00 01:23:01.554 READ DMA EXT 25 03 80 ef 1c 03 e0 00 01:23:02.125 READ DMA EXT 25 03 80 6f 1c 03 e0 00 01:23:01.565 READ DMA EXT 25 03 80 ef 1b 03 e0 00 01:23:01.564 READ DMA EXT Error 442 occurred at disk power-on lifetime: 7285 hours (303 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 03 08 d7 07 60 e0 00 01:22:58.903 READ DMA EXT 25 03 80 af 0d 71 e0 00 01:22:58.902 READ DMA EXT 25 03 80 2f 0d 71 e0 00 01:22:58.900 READ DMA EXT 25 03 80 af 0c 71 e0 00 01:22:58.899 READ DMA EXT 25 03 80 2f 0c 71 e0 00 01:22:58.898 READ DMA EXT Error 441 occurred at disk power-on lifetime: 7285 hours (303 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 03 08 d7 07 60 e0 00 01:22:55.075 READ DMA EXT 25 03 01 00 00 00 e0 00 01:22:55.075 READ DMA EXT 25 03 01 00 00 00 e0 00 01:22:53.262 READ DMA EXT c6 03 10 01 a5 a5 a0 00 01:22:53.249 SET MULTIPLE MODE 91 03 3f 01 a5 a5 af 00 01:22:53.221 INITIALIZE DEVICE PARAMETERS [OBS-6] Error 440 occurred at disk power-on lifetime: 7285 hours (303 days + 13 hours) When the command that caused the error occurred, the device was active or idle. After command completion occurred, registers were: ER ST SC SN CL CH DH -- -- -- -- -- -- -- 40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469 Commands leading to the command that caused the error were: CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name -- -- -- -- -- -- -- -- ---------------- -------------------- 25 03 08 d7 07 60 e0 00 01:22:50.280 READ DMA EXT 25 03 01 00 00 00 e0 00 01:22:50.280 READ DMA EXT c6 03 10 01 a5 a5 a0 00 01:22:53.262 SET MULTIPLE MODE 91 03 3f 01 a5 a5 af 00 01:22:53.249 INITIALIZE DEVICE PARAMETERS [OBS-6] f5 03 0c 01 a5 a5 a0 00 01:22:53.221 SECURITY FREEZE LOCK SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 7449 - # 2 Extended offline Completed without error 00% 0 - SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. linux-lemahaeger:/home/lemahaeger # Saludos. --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 10:15 -0300, Familia Lema Haeger. escribió:
=== START OF INFORMATION SECTION === Model Family: Seagate Barracuda 7200.9 family Device Model: ST3160812AS
Buenos discos.
SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 119 075 006 Pre-fail Always - 213836503
Este parece que es malo cuando más pequeño es, y el tope es 6. Vale 119 y lo más bajo ha sido 075. Si pasa del margen es un preaviso de fallo, y se actualiza siempre. Eso es mi interpretación de los valores, pero puedo estar equivocado.
5 Reallocated_Sector_Ct 0x0033 100 100 036 Pre-fail Always - 0
No hay sectores remapeados. Eso es bueno.
9 Power_On_Hours 0x0032 092 092 000 Old_age Always - 7450
7450 horas de uso real.
12 Power_Cycle_Count 0x0032 098 098 020 Old_age Always - 3018
3018 encendidos.
190 Temperature_Celsius 0x0022 071 050 045 Old_age Always - 488046621 194 Temperature_Celsius 0x0022 029 050 000 Old_age Always - 29 (Lifetime Min/Max 0/12)
Esos dos siempre me confunden.
195 Hardware_ECC_Recovered 0x001a 068 045 000 Old_age Always - 220491154
Esto puede ser el número total de errores de ese tipo en la vida del cacharro. Pero no lo sé. Yo lo tengo parecido: 195 Hardware_ECC_Recovered 0x001a 066 047 000 Old_age Always - 128114487
197 Current_Pending_Sector 0x0012 001 001 000 Old_age Always - 4294967294 198 Offline_Uncorrectable 0x0010 001 001 000 Old_age Offline - 4294967294
Pero esos dos los tengo a cero: 197 Current_Pending_Sector 0x0012 100 100 000 Old_age Always - 0 198 Offline_Uncorrectable 0x0010 100 100 000 Old_age Offline - 0
SMART Error Log Version: 1 ATA Error Count: 444 (device log contains only the most recent five errors)
Y aquí es donde lista los errores que han habido, un total de 444, de los cuales se guardan los cinco ultimos:
Error 444 occurred at disk power-on lifetime: 7285 hours (303 days + 13 hours)
Ha ocurrido en la hora 7285, y tiene un total de 7450, luego el último fallo no es de ahora.
40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469
Y creo que esto fué el error, un error no corregible en el sector LBA de ese número. Sin embargo no hay errores mapeados.
40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469
40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469
40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469
40 51 00 dd 07 60 e0 Error: UNC at LBA = 0x006007dd = 6293469
Los cinco errores registrados son en el mismo sector.
SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 7449 - # 2 Extended offline Completed without error 00% 0 -
Bueno, el test ha dado bien. Ahora que sabes como hacerlos, hazlo periodicamente. Puedes también usar la opción --health para que te diga directamente si la tabla de parámetros esa de arriba tiene algún problema registrado o no.
SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing
Al parecer, estos discos pueden efectuar el test por zonas, pero no me he aclarado nunca sobre como hacerlo realmente. - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD4DBQFHUDkWtTMYHG2NR9URAtNHAJ9D88o914ZBiXl373M0y7WtGliHBgCWPOSW GcSu8rJmxZdJg+gVJX1Jsw== =eMaD -----END PGP SIGNATURE-----
El 30/11/07, Familia Lema Haeger. escribió:
=== START OF READ SMART DATA SECTION === SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 7449 - # 2 Extended offline Completed without error 00% 0 -
Que significa?. Estoy bien al interpretar de que no hay errores?.
Eso parece, pero no estaría de más utilizar algún otro programa de diagnóstico (el del fabricante del disco), para que te dé una segunda opinión :-) Y lo que sí debes hacer, si tienes aprecio a los datos del disco, es hacer una copia cuanto antes. Si pasa algo, ya la tienes, y si no pasa nada, sólo has perdido un poco de tiempo... Un sólo disco me ha dado problemas de smart (me avisó porque lo tenía activado en la bios) que era de marca Samsung (8 GB.), y lo pasé a la reserva (como almacenamiento de datos secundario)... ahora está jubilado. En su día le pasé el diagnóstico de Seagate y no me dio errores, pero no me fio. Lo dejé en la reserva funcionando, pero no lo volvería a utilizar salvo causa de fuerza mayor. Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 11:34 +0100, Camaleón escribió:
Un sólo disco me ha dado problemas de smart (me avisó porque lo tenía activado en la bios) que era de marca Samsung (8 GB.), y lo pasé a la reserva (como almacenamiento de datos secundario)... ahora está jubilado.
Con ocho gigas ya sólo sirve de posaplatos o pisapapeles :-P - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHT+nYtTMYHG2NR9URAu0+AJ93QX2nwrP3wEG6jbSihkIzLnR2awCgiegj JTOyYR37M/x+VUYYhl+eOrw= =Fmk5 -----END PGP SIGNATURE-----
El 30/11/07, Carlos E. R. escribió:
Con ocho gigas ya sólo sirve de posaplatos o pisapapeles :-P
:-) En el armario de mi derecha tengo una torre de discos de capacidades variopintas (1,2 GB / 4 GB / 8 GB / 2x20 GB.). Lo curisoso es que todos funcionan y están como se dejaron en su día (unos con datos, otros con suse 8.2 y con la 9.2, con windows 98...). Cuando tenga tiempo sí me gustaría ponerlos todos en un chasis y "jugar" un poco con el LVM o como sea que se llame ahora... aunque siga resultando un tamaño ridículo, me sirve para probarlo. Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 12:23 +0100, Camaleón escribió:
Con ocho gigas ya sólo sirve de posaplatos o pisapapeles :-P
:-)
En el armario de mi derecha tengo una torre de discos de capacidades variopintas (1,2 GB / 4 GB / 8 GB / 2x20 GB.). Lo curisoso es que todos funcionan y están como se dejaron en su día (unos con datos, otros con suse 8.2 y con la 9.2, con windows 98...).
Si, yo también tengo alguno por ahí, y uno escacharrao que quiero abrir un dia.
Cuando tenga tiempo sí me gustaría ponerlos todos en un chasis y "jugar" un poco con el LVM o como sea que se llame ahora... aunque siga resultando un tamaño ridículo, me sirve para probarlo.
Claro, como las cajas tienen docenas de cables IDE para enchuar todos los discos que quieras... :-P Que yo sepa sólo vienen dos cables, cuatro discos. ¿O estás hablando de chasis industriales de almacenamiento con más buses? - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHUAxUtTMYHG2NR9URAsrhAKCP3q5eGf52NibQYQxt3RVQkViq2QCfUpfA a6Xb/urHTO2G+NKVMcUUkds= =qW5F -----END PGP SIGNATURE-----
El 30/11/07, Carlos E. R. escribió:
Si, yo también tengo alguno por ahí, y uno escacharrao que quiero abrir un dia.
Date prisa... antes de que te des cuenta los discos en estado sólido (ssd) habrán acabado con los magnéticos de plato convecionales y ya no habrá misterio ni nada que abrir... salvo que te gusten los chips de memoria flash >:-) http://en.wikipedia.org/wiki/Image:Disassembled_HDD_and_SSD.JPG
Claro, como las cajas tienen docenas de cables IDE para enchuar todos los discos que quieras... :-P
Que yo sepa sólo vienen dos cables, cuatro discos.
¿O estás hablando de chasis industriales de almacenamiento con más buses?
Huy, no, no pensaba en nada sofisticado. Una "torreta" alta y gordita con buena ventilación con un par de controladoras ide adicionales de 4/8 puertos y suse en el disco de 1,2 GB. que ya veo que con el uso de patrones de texto me sobra espacio ;-) La ventaja de una caja / torre (o el chasis industrial que dices) "al uso" es que no te vas a quedar corto en espacio para discos y te da más juego para estas cosas... la desventaja, que ocupa mucho espacio y necesitas componentes adicionales (placa, memoria y micro) :-/ Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
El 30/11/2007 11:34:49 Camaleón escribió: noelamac> Eso parece, pero no estaría de más utilizar algún otro programa de noelamac> diagnóstico (el del fabricante del disco), para que te dé una segunda noelamac> opinión :-) El mesaje de error que le daba es diferente que el mío. A mi me avisa de una "prefailure", pero mucho me temo que se trata de una "feature" del SMART de la 10.3, ya que me da el aviso en dos de las 3 máquinas con la 10.3 (la tercera no está monitorizada) Es que es mucha casualidad que me fallen dos discos en "/dev/sdb" en dos máquinas con la 10.3 recien instalada. Ese es una de los "logs" en LogWatch: /dev/sdb : Prefailure: Raw_Read_Error_Rate (1) changed to 109, 107, 108, 107, 108, 107, 108, 107, 93, 96, 93, 91, 93, 94, 95, 96, 97, 98, 99, 110, 106, 107, 108, 106, 107, 109, 110, 109, 110, 109, 105, 106, Usage: Hardware_ECC_Recovered (195) changed to 52, 54, 52, 49, 50, 49, 50, 49, 50, 49, 51, 50, 49, 50, 51, 50, 51, 54, 55, 54, 53, 54, Como digo, yo no lo había comentado porque el error que él decía era diferente. -- Saludos, Josep M. Queralt http://www.queralt.org/
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 15:29 +0100, Josep M. Queralt escribió:
El mesaje de error que le daba es diferente que el mío. A mi me avisa de una "prefailure", pero mucho me temo que se trata de una "feature" del SMART de la 10.3, ya que me da el aviso en dos de las 3 máquinas con la 10.3 (la tercera no está monitorizada)
Es que es mucha casualidad que me fallen dos discos en "/dev/sdb" en dos máquinas con la 10.3 recien instalada.
Ese es una de los "logs" en LogWatch:
/dev/sdb : Prefailure: Raw_Read_Error_Rate (1) changed to 109, 107, 108, 107, 108, 107, 108, 107, 93, 96, 93, 91, 93, 94, 95, 96, 97, 98, 99, 110, 106, 107, 108, 106, 107, 109, 110, 109, 110, 109, 105, 106, Usage: Hardware_ECC_Recovered (195) changed to 52, 54, 52, 49, 50, 49, 50, 49, 50, 49, 51, 50, 49, 50, 51, 50, 51, 54, 55, 54, 53, 54,
Ese mensaje no tiene importancia, y es un error de configuración o exceso de celo. Lo que dice es que el parámetro tal, que si pasa de cierto valor preavisa de fallo, ha cambiado de tal valor a tal otro. Pero mientras no pase del valor límite no es problemático en absoluto. Lo que pasa es que la lectura de un bit en el disco, con tanta concentración de bits por centímetro cuadrado, es casi marginal y milagrosa. Hay interferencias, ruidos, cosas, y la lectura de un byte o de un sector falla momentaneamente, pero el hardware del disco supera el error, reintentandolo, usando códigos de corrección, lo que sea. Ese valor lo unico que indica es que la tasa de errores ha cambiado, hacia arriba o hacia abajo: Nov 30 14:21:04 nimrodel smartd[5186]: Device: /dev/hda, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 68 to 69 Nov 30 14:21:04 nimrodel smartd[5186]: Device: /dev/hdb, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 60 to 61 Nov 30 14:38:38 nimrodel smartd[5186]: Device: /dev/hdb, SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 61 to 60 Nov 30 14:38:39 nimrodel smartd[5186]: Device: /dev/hdd, SMART Usage Attribute: 194 Temperature_Celsius changed from 32 to 33 Si miro la linea completa en el log interno, veo: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 112 093 006 Pre-fail Always - 43939304 No sé descifrar cual es el valor límite, pero: # smartctl --health /dev/hda ... === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED Así que carece de importancia. Un día que tenga ganas y tiempo me meto y le digo que no me jorobe y se calle. - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHUCLntTMYHG2NR9URAgyOAJ0WXyS+2YcZy24gx3zJ7p5px+O7pgCcDade /6Sa45H3tQ7pHNY+u8Y5pvM= =Wdir -----END PGP SIGNATURE-----
El 30/11/07, Carlos E. R. escribió:
El 2007-11-30 a las 15:29 +0100, Josep M. Queralt escribió:
Prefailure: Raw_Read_Error_Rate (1) changed to 109, 107, 108, 107, 108, 107, 108, 107, 93, 96, 93, 91, 93, 94, 95, 96, 97, 98, 99, 110, 106, 107, 108, 106, 107, 109, 110, 109, 110, 109, 105, 106,
Usage: Hardware_ECC_Recovered (195) changed to 52, 54, 52, 49, 50, 49, 50, 49, 50, 49, 51, 50, 49, 50, 51, 50, 51, 54, 55, 54, 53, 54,
Hum, hace falta un "intérprete" para saber a qué está diciendo... vale, sí, que ha habido un cambio en uno de los valores que monitoriza, pero ¿qué significa, es bueno, es malo, indica sólo un estado...? Deberían poner los valores normales mínimos y máximo normales (como en las analíticas de sangre :-P) para saber si hay que preocuparse o no.
Así que carece de importancia. Un día que tenga ganas y tiempo me meto y le digo que no me jorobe y se calle.
En el archivo de configuración de smartd.conf tendrá que haber una opción que permita definir los tests que realiza y los que no :-?... ... ah, pues si el manual de la página web no falla >:-), se define por medio del modificador "-a" que está habilitado por defecto y que activa la mayor parte de las directivas de monitorización. Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 16:33 +0100, Camaleón escribió:
Usage: Hardware_ECC_Recovered (195) changed to 52, 54, 52, 49, 50, 49, 50, 49, 50, 49, 51, 50, 49, 50, 51, 50, 51, 54, 55, 54, 53, 54,
Hum, hace falta un "intérprete" para saber a qué está diciendo... vale, sí, que ha habido un cambio en uno de los valores que monitoriza, pero ¿qué significa, es bueno, es malo, indica sólo un estado...?
Mi bola de cristal dicque que sólo es un estado. Digamos que es un log de debug "verboso".
Deberían poner los valores normales mínimos y máximo normales (como en las analíticas de sangre :-P) para saber si hay que preocuparse o no.
Sueñas...
Así que carece de importancia. Un día que tenga ganas y tiempo me meto y le digo que no me jorobe y se calle.
En el archivo de configuración de smartd.conf tendrá que haber una opción que permita definir los tests que realiza y los que no :-?...
Sí, sí que lo dice. Pero hay que leerse el manual y tirarse un rato cambiando parámetros y luego observando el resultado durante varios dias. Yo antes no lo tenía así, pero esta vez creo que dejé los valores que trae por defecto y tendré que quitarlos. Pero me da pereza. - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHUDQEtTMYHG2NR9URAkZEAJ99MYP4jEhn+zll53r9/n86UuYXsACeLrlj yccxoKr9PcuX747UvHoVTd8= =jFod -----END PGP SIGNATURE-----
El 30/11/2007 15:49:03 Carlos E. R. escribió: robin.listas> robin.listas> robin.listas> Así que carece de importancia. Un día que tenga ganas y tiempo me meto y robin.listas> le digo que no me jorobe y se calle. robin.listas> Me medio mosqueaba la parte del "Prefailure", eso siempre pone nervioso, sobretodo a primera hora de la mañana cuando llegan los "logs". Es curioso que solo afecte al segundo disco en las dos máquinas. En ambas máquinas el segundo HD solo hace funciones de respaldo, quiero decir que tiene muy poca actividad, salvo cuando toca backup. Sería mucho más lógico que apareciera en el primer disco, donde está el sistema y los "home" Además son dos discos muy distintos. Uno es un sata de 500 Gb. y tiene un año escaso, mientras que el otro es un ide de toda la vida y superviviente de muchas máquinas con 120 Gb. La conclusión es que con la 10.3 la "verbosidad" del SMART ha aumentado, por lo que, sip, habrá que bajarla en el fichero de configuración -- Saludos, Josep M. Queralt http://www.queralt.org/
El 30/11/07, Josep M. Queralt escribió:
Me medio mosqueaba la parte del "Prefailure", eso siempre pone nervioso, sobretodo a primera hora de la mañana cuando llegan los "logs".
En este artículo de linux journal (aunque antiguo) lo explican bastante bien: http://www.linuxjournal.com/article/6983 La columna de TYPE indica el "tipo de gravedad" del atributo al que hace referencia (los catalogados como "pre-fail" son los graves... si fallan en las pruebas).
Es curioso que solo afecte al segundo disco en las dos máquinas.
En ambas máquinas el segundo HD solo hace funciones de respaldo, quiero decir que tiene muy poca actividad, salvo cuando toca backup.
Sería mucho más lógico que apareciera en el primer disco, donde está el sistema y los "home"
Además son dos discos muy distintos. Uno es un sata de 500 Gb. y tiene un año escaso, mientras que el otro es un ide de toda la vida y superviviente de muchas máquinas con 120 Gb.
La conclusión es que con la 10.3 la "verbosidad" del SMART ha aumentado, por lo que, sip, habrá que bajarla en el fichero de configuración
Bueno, según la página de smartmontools los valores de los resultados varían según el fabricante del disco, el firmware del disco, la especificación (ata3, ata4, ata7...), que esté incluido el modelo de disco en la base de datos de smartmontools, etc, por lo que comparar esos valores no siempre resulta acertado. Vaya, que me quedo con el resultado del test "de salud": passed / not passed / ok / not ok :-) Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-30 a las 18:14 +0100, Camaleón escribió:
El 30/11/07, Josep M. Queralt escribió:
Me medio mosqueaba la parte del "Prefailure", eso siempre pone nervioso, sobretodo a primera hora de la mañana cuando llegan los "logs".
En este artículo de linux journal (aunque antiguo) lo explican bastante bien:
http://www.linuxjournal.com/article/6983
La columna de TYPE indica el "tipo de gravedad" del atributo al que hace referencia (los catalogados como "pre-fail" son los graves... si fallan en las pruebas).
To understand how smartmontools works, it's helpful to know the history of SMART. The original SMART spec (SFF-8035i) was written by a group of disk drive manufacturers. In Revision 2 (April 1996) disks keep an internal list of up to 30 Attributes corresponding to different measures of performance and reliability, such as read and seek error rates. Each Attribute has a one-byte normalized value ranging from 1 to 253 and a corresponding one-byte threshold. If one or more of the normalized Attribute values less than or equal to its corresponding threshold, then either the disk is expected to fail in less than 24 hours or it has exceeded its design or usage lifetime. Some of the Attribute values are updated as the disk operates. Others are updated only through off-line tests that temporarily slow down disk reads/writes and, thus, must be run with a special command. In late 1995, parts of SFF-8035i were merged into the ATA-3 standard. Jo. O sea, que son valores de 1 a 253, y es malo cuanto más pequeño... justo alberres. Each Attribute has a six-byte raw value (RAW_VALUE) and a one-byte normalized value (VALUE). In this case, the raw value stores three temperatures: the disk's temperature in Celsius (29), plus its lifetime minimum (23) and maximum (33) values. The format of the raw data is vendor-specific and not specified by any standard. To track disk reliability, the disk's firmware converts the raw value to a normalized value ranging from 1 to 253. If this normalized value is less than or equal to the threshold (THRESH), the Attribute is said to have failed, as indicated in the WHEN_FAILED column. The column is empty because none of these Attributes has failed. The lowest (WORST) normalized value also is shown; it is the smallest value attained since SMART was enabled on the disk. The TYPE of the Attribute indicates if Attribute failure means the device has reached the end of its design life (Old_age) or it's an impending disk failure (Pre-fail). For example, disk spin-up time (ID #3) is a prefailure Attribute. If this (or any other prefail Attribute) fails, disk failure is predicted in less than 24 hours. O sea, si hay un parámetro mal, la columna WHEN_FAILED lo indicará. Bueno es saberlo, basta con mirar esa. The smartctl -t offline command can be used to carry out off-line tests. These off-line tests do not make entries in the self-test log. They date back to the SFF-8035i standard, and update values of the Attributes that are not updated automatically under normal disk operation (see the UPDATED column in Listing 3). Some disks support automatic off-line testing, enabled by smartctl -o on, which automatically runs an off-line test every few hours. o sea... hay algunas variables que sólo se actualizan con el test "offline", que no es ni el corto ni el largo. No me había coscado de eso, sabía que existía eso de "offline test" pero no sabía que eran. Buen artículo.
La conclusión es que con la 10.3 la "verbosidad" del SMART ha aumentado, por lo que, sip, habrá que bajarla en el fichero de configuración
Bueno, según la página de smartmontools los valores de los resultados varían según el fabricante del disco, el firmware del disco, la especificación (ata3, ata4, ata7...), que esté incluido el modelo de disco en la base de datos de smartmontools, etc, por lo que comparar esos valores no siempre resulta acertado.
Es que a esta gente les gusta mandar todo al log. Incluso te pueden mandar correos que pueden terminar en tu movil a las cuatro de la madrugada ;-)
Vaya, que me quedo con el resultado del test "de salud": passed / not passed / ok / not ok :-)
:-) - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHUHq6tTMYHG2NR9URArTgAJ96DTHOh+7oeRR8rU9JxanWiQtu7gCeOd+3 2aWZOT/B5y9KMJUDT0y90Fk= =NiOO -----END PGP SIGNATURE-----
Familia Lema Haeger. escribió:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Mi mas sentido pésame por tu disco duro, respalda tu información lo antes posible y visita tu tienda mas cercana para adquirir un reemplazo. :( -- "The only thing that interferes with my learning is my education." - Albert Einstein Cristian Rodríguez R. Platform/OpenSUSE - Core Services SUSE LINUX Products GmbH Research & Development http://www.opensuse.org/ --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Cristian Rodríguez escribió:
Familia Lema Haeger. escribió:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Mi mas sentido pésame por tu disco duro, respalda tu información lo antes posible y visita tu tienda mas cercana para adquirir un reemplazo. :(
Como no va a existir solución. Puchas. :-( Saludos. --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
Familia Lema Haeger. escribió:
Como no va a existir solución. Puchas. :-(
El programa solo reporta lo que la funcionalidad "S.M.A.R.T"[1] del BIOS dice del disco duro, no tiene absolutamente nada que ver con el sistema operativo que el PC este corriendo, el fallo en tu hardware existira en windows, linux, macosx, BSD.. etc.. [1] http://es.wikipedia.org/wiki/S.M.A.R.T. -- "The only thing that interferes with my learning is my education." - Albert Einstein Cristian Rodríguez R. Platform/OpenSUSE - Core Services SUSE LINUX Products GmbH Research & Development http://www.opensuse.org/ --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2007-11-29 a las 23:21 -0300, Familia Lema Haeger. escribió:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Mi mas sentido pésame por tu disco duro, respalda tu información lo antes posible y visita tu tienda mas cercana para adquirir un reemplazo. :(
Como no va a existir solución. Puchas. :-(
Hay un detalle que se me pasó antes. Si lo de arriba dice que tienes ese número tan "diminuto" (4294967294, más de cuatro mil millones) de sectores ilegibles... ciertamente ese disco está acabado. Si significa que el sector número tal es ilegible, entonces sí tiene arreglo, que es mapear ese sector. Algo no me encaja. - -- Saludos Carlos E.R. -----BEGIN PGP SIGNATURE----- Version: GnuPG v2.0.4-svn0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFHT3xEtTMYHG2NR9URAlmxAJ9ATKS0V+9wGFzz8yfr0bjCumuqUACfeeEP 69fiHkebKE3AtpBDUsu9dds= =J825 -----END PGP SIGNATURE-----
Cristian Rodríguez escribió:
Familia Lema Haeger. escribió:
Your hard disk drive is failing! S.M.A.R.T. message: Device: /dev/sdb, 4294967294 Currently unreadable (pending) sectors
Mi mas sentido pésame por tu disco duro, respalda tu información lo antes posible y visita tu tienda mas cercana para adquirir un reemplazo. :(
Quién tiene acronis que me lo pase. Por favor. Dicen que ese programa viene bien para respaldar todo el sistema y su estructura de particiones. Saludos. :-) --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
participants (6)
-
Alberto Vicat
-
Camaleón
-
Carlos E. R.
-
Cristian Rodríguez
-
Familia Lema Haeger.
-
Josep M. Queralt