Tools für Hardwareanalysen
Hallo, ich habe seit ein paar Tagen öfters Verbindungsabbrüche im WLan (siehe dazu meinen anderen Thread von Vorgestern. Mittlerweile bin ich mir nicht mehr so sicher, ob da nur der WLan-Stick schuld ist, denn ich hatte in der Zwischenzeit auch zwei komplette Systemfreezes. Ich war mit Firefox im Flashplayer unterwegs, als das System (OS12.3, KDE) vollständig einfror. Nix ging mehr, kein Wechsel in die Konsole, kein Reboot mit Ctlr-Alt-Del. Welche Tools gibt es, um die Hardware zu testen? Ich kenne memtest und das war's dann auch schon, vlt noch sensors Dass was mit dem WLan nicht stimmt, zeigt schon ifconfig wlan0 Link encap:Ethernet Hardware Adresse xx:xx:xx:xx:xx:xx inet Adresse:192.168.1.136 Bcast:192.168.1.255 Maske:255.255.255.0 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:6026 errors:0 dropped:0 overruns:0 frame:0 TX packets:5878 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 Sendewarteschlangenlänge:1000 RX bytes:4586870 (4.3 Mb) TX bytes:1374392 (1.3 Mb) Seit letzter Woche habe ich auch einen neuen Router, einen Sitecom N300 X2, Modell WLR-2100 v2 001. Die anderen Clients, einmal Win7 und einmal OS13.1 zeigen allerdings keine Auffälligkeiten wie Freezes oder Abbrüche, zumindest aber der Lappi mit OS13.1 auffällig viele Fehler in der Übertragung RX/TX ähnlich den Angaben oben. Welche Fehlerraten sind denn da "üblich"? Der Desktop hat ca. 10000 nach 40 Min uptime und der Läppi ca. 1000 nach 10 Min. Die Netzperformance ist aber anscheinend OK. Mit meiner 8000er Verbindung habe ich gerade 7500kbit/s im download und 413 im Upload gemessen, drei Clients am Laufen, zwei im Leerlauf und einer mit laufendem Flash und Online free2play Game. Nochmal zusammenfassend: *) WLan-Probleme aber nicht kritisch *) evtl. zusätzliche Hardwareprobleme, die zum Einfrieren des Systems führen. Dazu wüsste ich gerne welche Tools man heutzutage zur Verfügung hat, um Komponenten zu testen.oder zumindest Hinweise zu finden, ob was faul ist. Gruß Joachim -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Sun, 04 May 2014 10:43:06 +0200
schrieb "Joachim H."
Welche Tools gibt es, um die Hardware zu testen?
Keine, wenn man mal von Logikanalysatoren absieht (und den Aufwand willst Du nicht treiben). Man kann allerdings den laufenden Betrieb sorgfältiger und automatisiert beobachten. Ursachen bei Deinem Fehlerbild können sein: Übertemperatur einer Komponente, Speicherleck einer Applikation oder im Kernel, fehlerhaftes interrupt handling. Insbesondere solltest Du kernel log und /var/log/messages analysieren. Es ist selten, dass hier nichts zu finden ist.
Dass was mit dem WLan nicht stimmt, zeigt schon ifconfig
wlan0 Link encap:Ethernet Hardware Adresse xx:xx:xx:xx:xx:xx inet Adresse:192.168.1.136 Bcast:192.168.1.255 Maske:255.255.255.0 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:6026 errors:0 dropped:0 overruns:0 frame:0 TX packets:5878 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 Sendewarteschlangenlänge:1000 RX bytes:4586870 (4.3 Mb) TX bytes:1374392 (1.3 Mb)
Ich kann da nichts ungewöhnliches erkennen.
Seit letzter Woche habe ich auch einen neuen Router, einen Sitecom N300 X2, Modell WLR-2100 v2 001.
Der könnte höchstens mittelbar verantwortlich sein, wenn er einen Bug in Deinem Rechner anspricht. Gruß, Tobias. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hi Tobias, Am 04.05.2014 14:56, schrieb Tobias Crefeld:
Am Sun, 04 May 2014 10:43:06 +0200 schrieb "Joachim H."
: Welche Tools gibt es, um die Hardware zu testen?
Keine, wenn man mal von Logikanalysatoren absieht (und den Aufwand willst Du nicht treiben).
Ist schon klar, dass es keine Software gibt, die z.B. ausspuckt, dass ein Chip der Grafikkarte defekt ist und einen Nadeladapter will ich auch nicht bauen. Die von dir angesprochene Beobachtung des Systems könnte aber durch Software unterstützt werden. Die Temperaturen kann ich mit dem Tool sensors auslesen und Speichersprobleme evtl. mit memtest. Meine Frage war, ob es weitere Tools gibt, die mir hier bei der Beobachtung helfen könnten.
Dass was mit dem WLan nicht stimmt, zeigt schon ifconfig
wlan0 Link encap:Ethernet Hardware Adresse xx:xx:xx:xx:xx:xx inet Adresse:192.168.1.136 Bcast:192.168.1.255 Maske:255.255.255.0 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:6026 errors:0 dropped:0 overruns:0 frame:0 TX packets:5878 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 Sendewarteschlangenlänge:1000 RX bytes:4586870 (4.3 Mb) TX bytes:1374392 (1.3 Mb)
Ich kann da nichts ungewöhnliches erkennen.
Sind die Fehlerraten bei TX und RX denn normal? Gruß Joachim -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Joachim H. [06.05.2014 11:59]:
Dass was mit dem WLan nicht stimmt, zeigt schon ifconfig
wlan0 Link encap:Ethernet Hardware Adresse xx:xx:xx:xx:xx:xx inet Adresse:192.168.1.136 Bcast:192.168.1.255 Maske:255.255.255.0 UP BROADCAST RUNNING MULTICAST MTU:1500 Metric:1 RX packets:6026 errors:0 dropped:0 overruns:0 frame:0 TX packets:5878 errors:0 dropped:0 overruns:0 carrier:0 collisions:0 Sendewarteschlangenlänge:1000 RX bytes:4586870 (4.3 Mb) TX bytes:1374392 (1.3 Mb)
Ich kann da nichts ungewöhnliches erkennen.
Sind die Fehlerraten bei TX und RX denn normal?
Ja, 0 errors sind nicht ungewöhnlich. 6026 sind Received Packets 0 sind Fehler usw. -- -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hi Werner, Am 06.05.2014 12:10, schrieb Werner Flamme:
Sind die Fehlerraten bei TX und RX denn normal?
Ja, 0 errors sind nicht ungewöhnlich.
6026 sind Received Packets 0 sind Fehler
arghss, OK ich schwenke die Peinlichkeitsfahne. Mea culpa. Wer lesen kann ist eindeutig im Vorteil. :-( Danke für die Klärung! J. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Tue, 06 May 2014 11:59:47 +0200 schrieb "Joachim H."
Die von dir angesprochene Beobachtung des Systems könnte aber durch Software unterstützt werden. Die Temperaturen kann ich mit dem Tool sensors auslesen und Speichersprobleme evtl. mit memtest. Meine Frage war, ob es weitere Tools gibt, die mir hier bei der Beobachtung helfen könnten.
Ein Hardware-Problem halte ich (auch) für wahrscheinlich. memtest hat mir ehrlich gesagt noch nie weitergeholfen. Es gibt Leute, die sagen, dass ein memtest mind. 24 h durchlaufen muss, um der Speichereinheit ein OK zu geben. sensors ist da in Sachen Spannung und Temperatur schon eher mal erfolgreich gewesen. Vorausgesetzt, die betroffene Komponente ist auch tatsächlich temperaturüberwacht UND von sensors-detect erkannt worden. Ansonsten ist die Standard-Methode aller Desktop-PC-Supporter noch immer die erfolgversprechendste: Ausschlussverfahren! Also sukzessive (!) alle Hard- und Softwarekomponenten ausbauen oder austauschen und testen. Bei professioneller Serverhardware ist man da meist besser bedient. Selbst eine x86-Maschine von Sun(Oracle) sagt einem bis aufs Speicherriegelpaar genau, welches Teil defekt ist. Einfache Server oder Desktop-PC bieten sowas nur selten. Womit man dann bei Laptops meist am Ende seiner Möglichkeiten angelangt ist, weil man dort außer Software (z.B. OS, Stichwort Live-CD) kaum was tauschen kann. -- Gruß, Tobias. xmpp: crefeld@xabber.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo Tobias, memtest hat nix gefunden, sensors ist unauffällig. Es muss die Hardware sein, da es ein Dualboot System ist und auch Win7 schon unverhofft stehen blieb. Da war klar, kein OS oder Treiberproblem sondern Hardware. Die neue Hardware wird voraussichtlich morgen geliefert. Das alte System war immerhin knapp 6 Jahre alt und fast täglich gelaufen. Da möchte ich mich nicht beschweren und ich habe da auch nicht lange gezögert mit der Neubestellung. Jede Komponente austauschen und mal sehen, ob der Fehler weg ist, ist mir zu aufwendig, da es ja mal 3 oder 4 Tage dauern kann, bis wieder ein Ereignis auftritt und ich auch nicht alles doppelt hier rumliegen habe. Gruß Joachim Am 08.05.2014 21:29, schrieb Tobias Crefeld:
Am Tue, 06 May 2014 11:59:47 +0200 schrieb "Joachim H."
: Die von dir angesprochene Beobachtung des Systems könnte aber durch Software unterstützt werden. Die Temperaturen kann ich mit dem Tool sensors auslesen und Speichersprobleme evtl. mit memtest. Meine Frage war, ob es weitere Tools gibt, die mir hier bei der Beobachtung helfen könnten.
Ein Hardware-Problem halte ich (auch) für wahrscheinlich.
memtest hat mir ehrlich gesagt noch nie weitergeholfen. Es gibt Leute, die sagen, dass ein memtest mind. 24 h durchlaufen muss, um der Speichereinheit ein OK zu geben.
sensors ist da in Sachen Spannung und Temperatur schon eher mal erfolgreich gewesen. Vorausgesetzt, die betroffene Komponente ist auch tatsächlich temperaturüberwacht UND von sensors-detect erkannt worden.
Ansonsten ist die Standard-Methode aller Desktop-PC-Supporter noch immer die erfolgversprechendste: Ausschlussverfahren! Also sukzessive (!) alle Hard- und Softwarekomponenten ausbauen oder austauschen und testen. Bei professioneller Serverhardware ist man da meist besser bedient. Selbst eine x86-Maschine von Sun(Oracle) sagt einem bis aufs Speicherriegelpaar genau, welches Teil defekt ist. Einfache Server oder Desktop-PC bieten sowas nur selten. Womit man dann bei Laptops meist am Ende seiner Möglichkeiten angelangt ist, weil man dort außer Software (z.B. OS, Stichwort Live-CD) kaum was tauschen kann.
-- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 04.05.2014 14:56, schrieb Tobias Crefeld:
Insbesondere solltest Du kernel log und /var/log/messages analysieren. Es ist selten, dass hier nichts zu finden ist.
Grad eben wieder abgeschmiert. Die letzten Einträge in /var/log/messages lauten: ... 2014-05-06T20:04:25.224630+02:00 Eleonora dbus[795]: [system] Successfully activated service 'org.freedesktop.PackageKit' 2014-05-06T20:09:12.696221+02:00 Eleonora dbus-daemon[795]: dbus[795]: [system] Activating service name='org.freedesktop.PackageKit' (using servicehelper) 2014-05-06T20:09:12.696276+02:00 Eleonora dbus[795]: [system] Activating service name='org.freedesktop.PackageKit' (using servicehelper) 2014-05-06T20:09:13.545436+02:00 Eleonora dbus-daemon[795]: dbus[795]: [system] Successfully activated service 'org.freedesktop.PackageKit' 2014-05-06T20:09:13.545678+02:00 Eleonora dbus[795]: [system] Successfully activated service 'org.freedesktop.PackageKit' 2014-05-06T20:12:05.845233+02:00 Eleonora rsyslogd: [origin software="rsyslogd" swVersion="7.2.7" x-pid="759" x-info="http://www.rsyslog.com"] start 2014-05-06T20:12:05.845254+02:00 Eleonora systemd[1]: Started Collect Read-Ahead Data. 2014-05-06T20:12:05.845413+02:00 Eleonora systemd[1]: Started Replay Read-Ahead Data. ... Also letzter Eintrag vor dem Crash um 20:09:13. Mir fällt da nix auf In den Minuten vorher seh ich auch keine Fehlermeldung oder so was. Sieht so als ob von einer Sekunde zur nächsten das System einfriert. Gruß Joachim -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
participants (3)
-
Joachim H.
-
Tobias Crefeld
-
Werner Flamme