hohe load average obwohl alles idle und nichts auf IO wartet
Hi, top liefert mir im Moment folgendes: ========================================= 27:49 up 37 days, 3:13, 3 users, load average: 6.00, 6.00, 6.00 Tasks: 103 total, 1 running, 102 sleeping, 0 stopped, 0 zombie Cpu(s): 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 2060308k total, 2040456k used, 19852k free, 163836k buffers Swap: 2104504k total, 180k used, 2104324k free, 1442716k cached PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND 26346 root 15 0 1044 544 364 R 0 0.0 0:00.03 top 1 root 15 0 804 304 244 S 0 0.0 0:00.81 init 2 root RT 0 0 0 0 S 0 0.0 0:00.00 migration/0 ... ========================================= CPU hat nichts zu tun (100% idle), nichts muß auf IO warten (0% wa), und trotzdem habe ich eine load average von 6 (schon über die letzten zwei Stunden beobachtet). Wie kann das sein ? Ich habe außerdem ein find abgesetzt, was auch schon seit zwei Stunden läuft und noch nichts gefunden hat. Diesen find-Prozess kann ich auch nicht beenden, er ist lt ps "uninterruptable sleep" (D+). Aber seit zwei Stunden ? Der Rechner hat ein SuSE 10.2 32bit. Momentan bin ich als root allein angemeldet: ================================= pc52879:~ # w 16:37:18 up 37 days, 3:23, 3 users, load average: 6.00, 6.02, 6.00 USER TTY LOGIN@ IDLE JCPU PCPU WHAT root pts/0 13:15 3:11m 0.52s 0.41s find / -iname save root pts/1 13:30 9:47 1.02s 0.79s top root pts/2 16:10 0.00s 0.05s 0.00s w ================================= ================================= pc52879:~ # cat /proc/loadavg 6.00 6.00 6.00 1/166 26517 ================================= Woher kommt eine load average von 6, wenn lt. "cat /proc/loadavg" nur ein Prozess in der Verarbeitungsschlange steht ? Any ideas ? Bernd -- Bernd Lentes Systemadministration Institut für Entwicklungsgenetik Gebäude 35.34 - Raum 208 HelmholtzZentrum münchen bernd.lentes@helmholtz-muenchen.de phone: +49 89 3187 1241 fax: +49 89 3187 2294 http://www.helmholtz-muenchen.de/idg Die Freiheit wird nicht durch weniger Freiheit verteidigt Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671 -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
On Wed, 13 Nov 2013 16:52:31 +0100
"Lentes, Bernd"
27:49 up 37 days, 3:13, 3 users, load average: 6.00, 6.00, 6.00 Tasks: 103 total, 1 running, 102 sleeping, 0 stopped, 0 zombie Cpu(s): 0.0%us, 0.0%sy, 0.0%ni,100.0%id, 0.0%wa, 0.0%hi, 0.0%si, 0.0%st Mem: 2060308k total, 2040456k used, 19852k free, 163836k buffers Swap: 2104504k total, 180k used, 2104324k free, 1442716k cached
Was das wirklich ist kann Dir wahrscheinlich niemand sagen. Aber bei solchen Merkwuerdigkeiten mache ich das naechstliegende: neuen Kernel drauf. Bei 10.2 ist ja der SuSE-gelieferte Kernel wirklich steinalt. Aber das System geht ziemlich sicher mit einem 3.10.X Kernel. -- MfG, Stephan -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 13. November 2013 17:11 schrieb Stephan von Krawczynski
Was das wirklich ist kann Dir wahrscheinlich niemand sagen. Aber bei solchen
Flasch.
Merkwuerdigkeiten mache ich das naechstliegende: neuen Kernel drauf. Bei 10.2 ist ja der SuSE-gelieferte Kernel wirklich steinalt. Aber das System geht ziemlich sicher mit einem 3.10.X Kernel.
Ach. Wirklich? Der Umstieg 2 -> 3 war nicht völlig schmerzlos. Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 13. November 2013 16:52 schrieb Lentes, Bernd
CPU hat nichts zu tun (100% idle), nichts muß auf IO warten (0% wa), und trotzdem habe ich eine load average von 6 (schon über die letzten zwei Stunden beobachtet). Wie kann das sein ?
https://en.wikipedia.org/wiki/Load_%28computing%29 Wieviele Prozesse im Status "D"? Was sagt vmstat?
Der Rechner hat ein SuSE 10.2 32bit. Momentan bin ich als root allein angemeldet:
10.3? Updaten! Gruß Martin -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
On Wed, 13 Nov 2013 17:18:18 +0100
Martin Schröder
Am 13. November 2013 16:52 schrieb Lentes, Bernd
: CPU hat nichts zu tun (100% idle), nichts muß auf IO warten (0% wa), und trotzdem habe ich eine load average von 6 (schon über die letzten zwei Stunden beobachtet). Wie kann das sein ?
https://en.wikipedia.org/wiki/Load_%28computing%29
Wieviele Prozesse im Status "D"? Was sagt vmstat?
Der Rechner hat ein SuSE 10.2 32bit. Momentan bin ich als root allein angemeldet:
10.3? Updaten!
Gruß Martin
Klingt ja alles sehr schlau, aber manche koennen nicht so einfach das System updaten. Und wenn wirklich herumhaengende Zombies die Load hochtreiben wird ihm das ganze in naechster Zeit wieder genau so passieren. -- MfG, Stephan -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Martin Schröder schrieb:
Am 13. November 2013 16:52 schrieb Lentes, Bernd
: CPU hat nichts zu tun (100% idle), nichts muß auf IO warten (0% wa), und trotzdem habe ich eine load average von 6 (schon über die letzten zwei Stunden beobachtet). Wie kann das sein ?
https://en.wikipedia.org/wiki/Load_%28computing%29
Wieviele Prozesse im Status "D"? Was sagt vmstat?
Das war ein guter Tipp: ============================================== pc52879:~ # ps aux|grep D[s\+]|wc -l 6 ============================================== entspricht ja auch genau der load average. ============================================== pc52879:~ # vmstat 10 10 procs -----------memory---------- ---swap-- -----io---- -system-- ----cpu---- r b swpd free buff cache si so bi bo in cs us sy id wa 0 0 180 25236 169896 1432408 0 0 7 2 3 6 0 0 100 0 0 0 180 25236 169904 1432408 0 0 0 4 395 231 0 0 100 0 0 0 180 25236 169912 1432408 0 0 0 4 396 233 0 0 100 0 0 0 180 25236 169912 1432408 0 0 0 0 402 238 0 0 100 0 0 0 180 25236 169920 1432408 0 0 0 2 398 233 0 0 100 0 0 0 180 25236 169928 1432408 0 0 0 2 394 232 0 0 100 0 0 0 180 25112 169932 1432408 0 0 0 3 397 253 0 0 100 0 0 0 180 25112 169932 1432408 0 0 0 0 389 224 0 0 100 0 0 0 180 25112 169940 1432408 0 0 0 2 403 235 0 0 100 0 0 0 180 25112 169944 1432404 0 0 0 2 403 228 0 0 100 0 pc52879:~ # ============================================== Es wird nicht geswappt, und IO-mäßig passiert auch nichts (bi,bo). wa=0 bestätigt das. Was ich nicht verstehe: Lt. manpage von vmstat bedeutet "b" unter procs die Anzahl der Prozesse in "uninterruptable sleep". Lt. ps (s.o.) sind das 6 Prozesse, lt. vmstat 0. Kann mir jemand die Differenz erklären ? Zwischen "/proc/loadavg" und der load average nach top bestand ja auch eine grosse Differenz (siehe meine erste email zum thread). Bernd Helmholtz Zentrum München Deutsches Forschungszentrum für Gesundheit und Umwelt (GmbH) Ingolstädter Landstr. 1 85764 Neuherberg www.helmholtz-muenchen.de Aufsichtsratsvorsitzende: MinDir´in Bärbel Brumme-Bothe Geschäftsführer: Prof. Dr. Günther Wess, Dr. Nikolaus Blum, Dr. Alfons Enhsen Registergericht: Amtsgericht München HRB 6466 USt-IdNr: DE 129521671 -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am 13.11.2013 um 16:52 schrieb Lentes, Bernd
Ich habe außerdem ein find abgesetzt, was auch schon seit zwei Stunden läuft und noch nichts gefunden hat. Diesen find-Prozess kann ich auch nicht beenden, er ist lt ps "uninterruptable sleep" (D+). Aber seit zwei Stunden ?
Irgendwelche stale nfs mounts? Rainer
participants (4)
-
Lentes, Bernd
-
Martin Schröder
-
Rainer Sokoll
-
Stephan von Krawczynski