Mata pisze:
Witam Wszystkich!
I ja witam Ciebie.
Czy ktoś z Was spotkał się może że wraz z komunikatem Kernel Panic.... mrugają diody od Caps lock i scroll lock? Czy można to uznać jednoznacznie za błąd hardwerowy np. dysku? Niestety z komunikatu który wyrzucał kernel panic niewiele na pierwszy rzut oka mozna bylo wywnioskowac, na drugi zreszta tez nie:)
Tak, spotkałem się. Generalnie błąd jądra systemu jest ciężki do zdiagnozowania i najlepszą, chociaż czasochłonną, metodą wydaje się reprodukcja błędu. Biorąc jednak pod uwagę, iż kernel panic jest z reguły niepowszednio występującym zjawiskiem, wspomniana metoda może nastręczać pewnych trudności. Mówiąc ogólnie kernel panic występuje w sytuacji w której jądro nie wie co ma dalej zrobić. I kiedy pojawia się taka sytuacja, jądro stara się podać możliwie najwięcej informacji o występującym problemie. Natomiast bardziej technicznie, kernel panic może zostać spowodowany poprzez awarię modułu ładowanego dynamicznie, bądź wkompilowanego w jądro statycznie. Istnieją dwa głowne rodzaje kernel panic (czyt. zwiechy systemu): 1. Hard Panic - inaczej znany jako Aieee! 2. Soft Panic - inaczej zwany jako Oops AD 1. Jako symptomy wystąpienia Hard Panic uznajemy: - komputer jest kompletnie zablokowany i nie reaguje na nasze działania - migają światełka informujące o stanie klawiszy Caps Lock/Num Lock/Screll Lock. - Na monitorze pokazany jest kernel dump z napisem "Aieee!" - Błąd tego rodzaju zaliczamy do BSOD Najczęściej występującą przyczyną tego rodzaju błędu jest sytuacja w której moduł (sterownik) przestaje funkcjonować w procedurze obsługi przerwania (interrupt hander), ponieważ stara się uzyskać dostęp do pustego wskaznika (null pointer). W wyniku czego sterownik nie moze przyjmować nowych przerwać i doprowadza do wstrzymania pracy systemu. Z reguły jest to awaria sprzętu. W zależności od natury zjawiska kernel postara się zebrać możliwie najwięcej informacji przed wstrzymaniem pracy, lecz uznając, że Hard Panic jest dość drastycznym błędem nie jest pewne jaka ilość informacji zostanie zgromadzona. W związku z Twoim przypadkiem, bez dodatkowych informacji nie mogę zdiagnozować poprawnie problemu i określić miejsca w którym wspomniany błąd wystąpił. Gdybyś zdecydował się je dostarczyć, potrzebuję: - /var/log/messages - czasami jądro zdąży zapisać cały stos błędu - informacja co było robione przed wystąpieniem błędu - zrzut z ekranu w momencie wystąpienia błędu, ze wzgłedu na wstrzymanie pracy systemu niemożliwe jest skopiowanie/wklejenie informacji, dlatego dobrym pomysłem wydaje się zrobienie zdjęcia, bądź ręczne przepisanie. AD 2. Czysto informacyjnie Jako symptomy wystąpenia Soft Panic uznajemy: - znacznie mniej poważny niz Hard Panic - skutkuje segmentation fault - widać informację Oops w /var/log/messages/ - komputer będzie pracował w ograniczonym zakresie, restart jest zalecany Praktycznie wszystko związane z zatrzymaniem pracy modułu będzie uznawane jako soft panic. Jednakże w tym wypadku wstrzymanie pracy sterownika nie powoduje katastroficznego wstrzymania systemu, gdyż moduł nie jest zablokowany w procedurze obsługi przerwania. Podobnie jak w Hard Panic błędne dzialanie może wystąpic przy próbie odwołania do pustego wskaźnika.
Błąd ten wyskoczył mi na serwerze, który od roku nie sprawiał żadnych problemów a tu nagle taki zonk. Niestety sprawa powtórzyła sie po dwóch tygodniach.
Czy ktoś z Was spotkał się z taką reakcją kernela?
Tak. Reakcja w tym przypadku jest jedna Hard Panic, natomiast nie znane są przyczyny wystąpienia, które są niepomiernie istotniejsze.
Pozdrawiam marcin matyla
-- Pozdrawiam, Krzysztof Janusz hevilath@gmail.com --------------------------------------------------------------------- To unsubscribe, e-mail: opensuse-pl+unsubscribe@opensuse.org For additional commands, e-mail: opensuse-pl+help@opensuse.org