System hängt, wenn auch nicht richtig...
Hallo ML, seit einiger Zeit will mein PC nach einiger Zeit, ca 45 Minuten, nicht mehr richtig arbeiten. Er hängt sich auf. Zwar ist der Mauszeiger noch aktiv, aber ich kann nichts mehr anklicken. Die typischen Desktop-Icons sind auch verschwunden. Ein Konsolen-Login ist nicht mehr möglich. Es bleibt nur ein Kaltstart. Mit einem tail konnte ich folgendes einfangen: (suse 12.3, Fehler tat auch schion mit 12.2 auf)
2013-09-02T20:16:36.967072+02:00 Mypc kernel: [ 3607.189188] ata7.00: > status: { DRDY } 2013-09-02T20:16:36.967072+02:00 Mypc kernel: [ 3607.189190] ata7.00: failed command: WRITE FPDMA QUEUED 2013-09-02T20:16:36.967073+02:00 Mypc kernel: [ 3607.189192] ata7.00: cmd 61/08:10:08:08:00/00:00:00:00:00/40 tag 2 ncq 4096 out 2013-09-02T20:16:36.967073+02:00 Mypc kernel: [ 3607.189192] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) 2013-09-02T20:16:36.967074+02:00 Mypc kernel: [ 3607.189193] ata7.00: status: { DRDY } 2013-09-02T20:16:36.967074+02:00 Mypc kernel: [ 3607.189194] ata7.00: failed command: WRITE FPDMA QUEUED 2013-09-02T20:16:36.967075+02:00 Mypc kernel: [ 3607.189197] ata7.00: cmd 61/08:18:30:08:40/00:00:00:00:00/40 tag 3 ncq 4096 out 2013-09-02T20:16:36.967075+02:00 Mypc kernel: [ 3607.189197] res 40/00:00:00:00:00/00:00:00:00:00/00 Emask 0x4 (timeout) 2013-09-02T20:16:36.967075+02:00 Mypc kernel: [ 3607.189198] ata7.00: status: { DRDY } 2013-09-02T20:16:36.967076+02:00 Mypc kernel: [ 3607.189201] ata7: hard resetting link
Any Idea? Scheinbar hat es mit einem Laufwerk zu tun. Wie kann ich herausfinden, um welches es sich handelt. Ich könnte das eventuell ausbauen? Ein anderer Verdächtiger ist eine Cronzeile zu einem Weblink (wget ....), die ich längst auskommentierte, die aber im Tail dennoch auftaucht. -- Mit freundlichen Grüßen Pitt Leidner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 8. September 2013 16:21 schrieb Pitt Leidner <pitt.leidner@gmx.net>:
2013-09-02T20:16:36.967072+02:00 Mypc kernel: [ 3607.189188] ata7.00: > status: { DRDY } 2013-09-02T20:16:36.967072+02:00 Mypc kernel: [ 3607.189190] ata7.00: failed command: WRITE FPDMA QUEUED
Was sagt smartctl? Du hast Backups?
Scheinbar hat es mit einem Laufwerk zu tun. Wie kann ich herausfinden, um welches es sich handelt. Ich könnte das eventuell ausbauen?
Studiere mal die dmesg. Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Sonntag, 8. September 2013, 17:56:22 schrieb Martin Schröder:
Am 8. September 2013 16:21 schrieb Pitt Leidner <pitt.leidner@gmx.net>:
2013-09-02T20:16:36.967072+02:00 Mypc kernel: [ 3607.189188] ata7.00: > status: { DRDY } 2013-09-02T20:16:36.967072+02:00 Mypc kernel: [ 3607.189190] ata7.00: failed command: WRITE FPDMA QUEUED
Was sagt smartctl?
sehr mächtiger Befehl; was genau soll mir das helfen?
Du hast Backups?
Ja, das ist nicht mein Problem
Scheinbar hat es mit einem Laufwerk zu tun. Wie kann ich herausfinden, um welches es sich handelt. Ich könnte das eventuell ausbauen?
Studiere mal die dmesg.
Es ist die SSD, als Patition für das System selbst. Das war auch meine Vermutung. Was aber kann ich tun? Die "Platte" lief unter 12.2 ziemlich schnell und bis vor ein paar Wochen auch stabil. Ist die hin? Ich hatte versehentlich noch einen Swap auf dieser Platte liegen. War das ein Fehler, fals 'Ja', warum? TIA -- Mit freundlichen Grüßen Pitt Leidner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 8. September 2013 23:02 schrieb Pitt Leidner <pitt.leidner@gmx.net>:
Was sagt smartctl?
sehr mächtiger Befehl; was genau soll mir das helfen?
Wirf ein smartctl -t long auf das Device und poste bitte den Output von smartctl -a, wenn der Test durch ist.
Du hast Backups?
Ja, das ist nicht mein Problem
Gut. Entweder die Platte oder Kabel oder Controller sind kaputt.
Ich hatte versehentlich noch einen Swap auf dieser Platte liegen. War das ein Fehler, fals 'Ja', warum?
Nein. Läuft hier seit Jahren problemlos. Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo ML, Am Montag, 9. September 2013, 01:15:37 schrieb Martin Schröder: Überhaupt erst mal herzlichen Dank für die Hilfe!
Am 8. September 2013 23:02 schrieb Pitt Leidner <pitt.leidner@gmx.net>:
Was sagt smartctl?
sehr mächtiger Befehl; was genau soll mir das helfen?
Wirf ein smartctl -t long auf das Device und poste bitte den Output von smartctl -a, wenn der Test durch ist.
OK, nichts leichter als das: // Start von smartctl -a ***************************************************** smartctl 6.0 2012-10-10 r3643 [x86_64-linux-3.7.10-1.16-desktop] (SUSE RPM) Copyright (C) 2002-12, Bruce Allen, Christian Franke, www.smartmontools.org === START OF INFORMATION SECTION === Model Family: Crucial/Micron RealSSD C300/C400/m4 Device Model: M4-CT128M4SSD2 Serial Number: XXX LU WWN Device Id: XXX Firmware Version: 0009 User Capacity: 128,035,676,160 bytes [128 GB] Sector Size: 512 bytes logical/physical Rotation Rate: Solid State Device Device is: In smartctl database [for details use: -P show] ATA Version is: ACS-2, ATA8-ACS T13/1699-D revision 6 SATA Version is: SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s) Local Time is: Mon Sep 9 15:24:56 2013 CEST SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x80) Offline data collection activity was never started. Auto Offline Data Collection: Enabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 595) seconds. Offline data collection capabilities: (0x7b) SMART execute Offline immediate. Auto Offline data collection on/off support. Suspend Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 2) minutes. Extended self-test routine recommended polling time: ( 9) minutes. Conveyance self-test routine recommended polling time: ( 3) minutes. SCT capabilities: (0x003d) SCT Status supported. SCT Error Recovery Control supported. SCT Feature Control supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x002f 100 100 050 Pre-fail Always - 0 5 Reallocated_Sector_Ct 0x0033 100 100 010 Pre-fail Always - 0 9 Power_On_Hours 0x0032 100 100 001 Old_age Always - 5654 12 Power_Cycle_Count 0x0032 100 100 001 Old_age Always - 1035 170 Grown_Failing_Block_Ct 0x0033 100 100 010 Pre-fail Always - 0 171 Program_Fail_Count 0x0032 100 100 001 Old_age Always - 0 172 Erase_Fail_Count 0x0032 100 100 001 Old_age Always - 0 173 Wear_Leveling_Count 0x0033 100 100 010 Pre-fail Always - 3 174 Unexpect_Power_Loss_Ct 0x0032 100 100 001 Old_age Always - 0 181 Non4k_Aligned_Access 0x0022 100 100 001 Old_age Always - 27 0 27 183 SATA_Iface_Downshift 0x0032 100 100 001 Old_age Always - 0 184 End-to-End_Error 0x0033 100 100 050 Pre-fail Always - 0 187 Reported_Uncorrect 0x0032 100 100 001 Old_age Always - 0 188 Command_Timeout 0x0032 100 100 001 Old_age Always - 0 189 Factory_Bad_Block_Ct 0x000e 100 100 001 Old_age Always - 132 194 Temperature_Celsius 0x0022 100 100 000 Old_age Always - 0 195 Hardware_ECC_Recovered 0x003a 100 100 001 Old_age Always - 0 196 Reallocated_Event_Count 0x0032 100 100 001 Old_age Always - 0 197 Current_Pending_Sector 0x0032 100 100 001 Old_age Always - 0 198 Offline_Uncorrectable 0x0030 100 100 001 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x0032 100 100 001 Old_age Always - 0 202 Perc_Rated_Life_Used 0x0018 100 100 001 Old_age Offline - 0 206 Write_Error_Rate 0x000e 100 100 001 Old_age Always - 0 SMART Error Log Version: 1 No Errors Logged SMART Self-test log structure revision number 1 Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error # 1 Extended offline Completed without error 00% 5653 - # 2 Vendor (0xff) Completed without error 00% 0 - SMART Selective self-test log data structure revision number 1 SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay. // Ende von smartctl -a ***************************************************** Hier fällt mir nichts in Auge(?).
Du hast Backups?
Ja, das ist nicht mein Problem
Gut. Entweder die Platte oder Kabel oder Controller sind kaputt.
Controller (OnBoard) wurde inzwischen getauscht. Kabel sind von der besseren Sorte, kann ich aber mal checken ... Die SSD wäre noch in der Garantie ...
Ich hatte versehentlich noch einen Swap auf dieser Platte liegen. War das ein Fehler, fals 'Ja', warum?
Nein. Läuft hier seit Jahren problemlos.
Tröstlich zu wissen (Seit Jahren?) -- Mit freundlichen Grüßen Pitt Leidner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Montag, 9. September 2013, 15:47:03 schrieb Pitt Leidner:
(...). Model Family: Crucial/Micron RealSSD C300/C400/m4 (...). Firmware Version: 0009 (...). 9 Power_On_Hours 0x0032 100 100 001 Old_age Always - 5654
BTW, die Crucial m4 mit dieser Firmware verabschiedet sich ab 5184 Betriebsstunden jede Stunde: http://www.heise.de/ct/meldung/Crucial-SSD-m4-Firmware-Update-gegen-Bluescre... Gruß Jan -- I already came, so stop jerking me off. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 09.09.2013 20:36, schrieb Jan Ritzerfeld:
Am Montag, 9. September 2013, 15:47:03 schrieb Pitt Leidner:
(...). Model Family: Crucial/Micron RealSSD C300/C400/m4 (...). Firmware Version: 0009 (...). 9 Power_On_Hours 0x0032 100 100 001 Old_age Always - 5654
BTW, die Crucial m4 mit dieser Firmware verabschiedet sich ab 5184 Betriebsstunden jede Stunde: http://www.heise.de/ct/meldung/Crucial-SSD-m4-Firmware-Update-gegen-Bluescre...
Gruß Jan
das riecht ja gewaltig nach geplanter Verschrottung... 5000 Stunden sind etwas mehr als 2 Arbeitsjahre... Wie war noch mal dieser Potter-Zauberspruch für die Schmerzen ... <<crucio>>? scnr cu jth -- www.teddylinx.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Montag, 9. September 2013, 20:36:49 schrieb Jan Ritzerfeld:
Am Montag, 9. September 2013, 15:47:03 schrieb Pitt Leidner:
(...). Model Family: Crucial/Micron RealSSD C300/C400/m4 (...). Firmware Version: 0009 (...).
9 Power_On_Hours 0x0032 100 100 001 Old_age Always
- 5654
BTW, die Crucial m4 mit dieser Firmware verabschiedet sich ab 5184 Betriebsstunden jede Stunde: http://www.heise.de/ct/meldung/Crucial-SSD-m4-Firmware-Update-gegen-Bluescre ens-1402530.html
Ist ja echt ein Unding. Man ahnte ja, dass in Waschmaschinen, etc. Sollbruchstellen eingebaut sind - aber das hier: i aM NOT aMUSED! Für den Firmwareupdate müsste ich mir jetzt Windows kaufen ... 5600 h sind kein Jahr - ärgerlich, so ein Mist, Garantie hin oder her. Danke für die klaren Infos hier in der ML! -- Mit freundlichen Grüßen Pitt Leidner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 11.09.2013 19:18, schrieb Pitt Leidner:
BTW, die Crucial m4 mit dieser Firmware verabschiedet sich ab 5184 Betriebsstunden jede Stunde: http://www.heise.de/ct/meldung/Crucial-SSD-m4-Firmware-Update-gegen-Bluescre ens-1402530.html
Ist ja echt ein Unding. Man ahnte ja, dass in Waschmaschinen, etc. Sollbruchstellen eingebaut sind - aber das hier: i aM NOT aMUSED!
Für den Firmwareupdate müsste ich mir jetzt Windows kaufen ... 5600 h sind kein Jahr - ärgerlich, so ein Mist, Garantie hin oder her.
Danke für die klaren Infos hier in der ML!
Das geht auch ohne Windows. Ich habe auch die M4 und das Update (längst) eingespielt. Wenn Du bei den Download-Varianten "Manual Boot File for Windows and Mac" nimmst, bekommst Du ein bootfähiges Image, was über USB-Stick oder CD zu verwendet ist. Gruß, Hendrik -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo ML, Am Mittwoch, 11. September 2013, 21:43:58 schrieb Hendrik Woltersdorf:
Am 11.09.2013 19:18, schrieb Pitt Leidner:
BTW, die Crucial m4 mit dieser Firmware verabschiedet sich ab 5184 Betriebsstunden jede Stunde: http://www.heise.de/ct/meldung/Crucial-SSD-m4-Firmware-Update-gegen-Blues cre ens-1402530.html
Ist ja echt ein Unding. Man ahnte ja, dass in Waschmaschinen, etc. Sollbruchstellen eingebaut sind - aber das hier: i aM NOT aMUSED!
Für den Firmwareupdate müsste ich mir jetzt Windows kaufen ... 5600 h sind kein Jahr - ärgerlich, so ein Mist, Garantie hin oder her.
Danke für die klaren Infos hier in der ML!
Das geht auch ohne Windows. Ich habe auch die M4 und das Update (längst) eingespielt. Wenn Du bei den Download-Varianten "Manual Boot File for Windows and Mac" nimmst, bekommst Du ein bootfähiges Image, was über USB-Stick oder CD zu verwendet ist.
Danke, damit geht's ja problemlos |-) Jetzt läuft also die SSD schon wieder 3 h am Stück - Wahnsinn, dass man sich selbst über sowas freuen muss ;-{ -- Mit freundlichen Grüßen Pitt Leidner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
participants (5)
-
Hendrik Woltersdorf
-
Jan Ritzerfeld
-
Joerg Thuemmler
-
Martin Schröder
-
Pitt Leidner