Hilfe - Uptime plötzlich auf 0 !!!
Hallo an alle,
ich habe soeben folgendes Problem bemerkt:
Auf meinem Rechner (9.0 Pro), der für's interne
Netz als Multi-Kulti-Server fungiert und gleichzeitig
Gateway für's Internet ist, ist die Uptime plötzlich
auf 0 gestellt worden und fängt wieder an, von vorne
los zu zählen.
Diese Rücksetzung scheint (so glaube ich) um 09:44 Uhr passiert zu
sein, denn um 09:00 Uhr sah die Uptime so aus:
-----------------------------------
9:00am up 49 days 16:18, 0 users, load average: 0.00, 0.00, 0.00
-----------------------------------
Und um 10:00 Uhr sah sie so aus:
-----------------------------------
10:00am up 0:16, 1 user, load average: 0.01, 0.02, 0.00
-----------------------------------
Was ist hier passiert?? Wo kann ich meine Suche starten?
In der allmessages kann ich leider *gar nichts* unnormales
finden. Leider.
Die boot.msg wurde *nicht* angefasst.
Also *kann* das System keinen automatischen Reboot gemacht
haben... ??? :-?
Wodurch kann so etwas passieren??
Ach so, die Firewall lässt nur ein paar Ports durch...
25, 143, 80 und ich glaube einen oder zwei mehr...
Folgendes kann ich gleich schon mal als Infos mitschicken:
-----------------------------------
stargate:/var/log # ll boot*
-rw-r----- 1 root root 0 Dec 20 14:35 boot.log
-rw-r--r-- 1 root root 23168 Mar 30 17:01 boot.msg
-rw-r--r-- 1 root root 27988 Mar 30 16:51 boot.omsg
stargate:/var/log #
-----------------------------------
-----------------------------------
stargate:/var/log # ls -la --sort=t
total 56862
-rw-r----- 1 root root 4274228 May 19 13:59 allmessages
-rw-r----- 1 root root 2603221 May 19 13:59 mail
-rw-r----- 1 root root 2603221 May 19 13:59 mail.info
-rw-r----- 1 root root 2393207 May 19 13:59 warn
-rw-r----- 1 root root 3078509 May 19 13:59 messages
-rw-r----- 1 root root 2226834 May 19 13:57 mail.err
-rw-r----- 1 root root 2228587 May 19 13:57 mail.warn
-rw-r----- 1 root root 3900310 May 19 13:57 localmessages
-rw-r--r-- 1 root tty 146292 May 19 13:53 lastlog
-rw-rw-r-- 1 root tty 14592 May 19 13:53 wtmp
-rw-r--r-- 1 root root 352669 May 19 11:10 isdn.log
-rw------- 1 root root 20988 May 19 05:25 netdate.log
-----------------------------------
-----------------------------------
less /var/log/allmessages
-----------------------------------
[...] einen Haufen DHCP-Requests und ACK's [...]
May 19 09:35:13 stargate smbd[6074]: [2004/05/19 09:35:13, 0]
smbd/service.c:make_connection(381)
May 19 09:35:13 stargate smbd[6074]: make_connection: swami logged
in as admin user (root privileges)
[...] einen Haufen DHCP-Requests und ACK's [...]
May 19 09:38:14 stargate innd: ME time 300001 hishave 0(0) hiswrite
0(0) hissync 0(2) idle 300000(1) artclean 0(0) artwrite 0(0)
sitesend 0(0) overv 0(0) per
l 0(0) nntpread 0(0) artparse 0(0) artlog/artparse 0(0) artlog 0(0)
datamove 0(0)
May 19 09:38:14 stargate innd: ME HISstats 0 hitpos 0 hitneg 0
missed 0 dne
[...] einen Haufen DHCP-Requests und ACK's [...]
May 19 09:42:54 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=82.137.45.2 DST=82.139.196.198 LEN=48 TOS=0x00 PREC=0x00 TTL=120
ID=1464 DF PROTO=TCP SPT=487
3 DPT=135 WINDOW=16384 RES=0x00 SYN URGP=0
May 19 09:42:57 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=82.137.45.2 DST=82.139.196.198 LEN=48 TOS=0x00 PREC=0x00 TTL=120
ID=1643 DF PROTO=TCP SPT=487
3 DPT=135 WINDOW=16384 RES=0x00 SYN URGP=0
May 19 09:43:14 stargate innd: ME time 300000 hishave 0(0) hiswrite
0(0) hissync 0(1) idle 300000(1) artclean 0(0) artwrite 0(0)
sitesend 0(0) overv 0(0) per
l 0(0) nntpread 0(0) artparse 0(0) artlog/artparse 0(0) artlog 0(0)
datamove 0(0)
May 19 09:43:14 stargate innd: ME HISstats 0 hitpos 0 hitneg 0
missed 0 dne
May 19 09:44:22 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=82.139.72.178 DST=82.139.196.198 LEN=48 TOS=0x00 PREC=0x00
TTL=117 ID=32653 DF PROTO=TCP SPT=
4553 DPT=5000 WINDOW=64240 RES=0x00 SYN URGP=0
May 19 09:44:24 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=82.139.72.178 DST=82.139.196.198 LEN=48 TOS=0x00 PREC=0x00
TTL=117 ID=32873 DF PROTO=TCP SPT=
4958 DPT=135 WINDOW=64240 RES=0x00 SYN URGP=0
May 19 09:44:34 stargate exim[6134]: 2004-05-19 09:44:34 no IP
address found for host no (during SMTP connection from
ckmail.chefkoch.de [213.131.250.40])
May 19 09:44:36 stargate exim[6134]: 2004-05-19 09:44:36
H=ckmail.chefkoch.de (chefkoch.de) [213.131.250.40] Warning: reverse
host lookup failed
May 19 09:44:36 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=213.131.250.40 DST=82.139.196.198 LEN=60 TOS=0x00 PREC=0x00
TTL=56 ID=7926 DF PROTO=TCP SPT=5
9447 DPT=113 WINDOW=5840 RES=0x00 SYN URGP=0
May 19 09:44:39 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=213.131.250.40 DST=82.139.196.198 LEN=60 TOS=0x00 PREC=0x00
TTL=56 ID=7927 DF PROTO=TCP SPT=5
9447 DPT=113 WINDOW=5840 RES=0x00 SYN URGP=0
May 19 09:44:45 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=213.131.250.40 DST=82.139.196.198 LEN=60 TOS=0x00 PREC=0x00
TTL=56 ID=7928 DF PROTO=TCP SPT=5
9447 DPT=113 WINDOW=5840 RES=0x00 SYN URGP=0
May 19 09:44:57 stargate kernel: DropLog: IN=ppp0 OUT= MAC=
SRC=213.131.250.40 DST=82.139.196.198 LEN=60 TOS=0x00 PREC=0x00
TTL=56 ID=7929 DF PROTO=TCP SPT=5
9447 DPT=113 WINDOW=5840 RES=0x00 SYN URGP=0
[...] einen Haufen DHCP-Requests und ACK's [...]
May 19 09:45:00 stargate /USR/SBIN/CRON[6146]: (root) CMD (
/admin/cronjobs/./t-dsl-check.sh)
May 19 09:45:04 stargate spamd[2869]: connection from localhost
[127.0.0.1] at port 43752
May 19 09:45:04 stargate spamd[6170]: checking message
<20040519080003.22150.qmail@chefkoch.de> for nobody:80.
May 19 09:45:05 stargate spamd[6170]: clean message (0.5/4.0) for
nobody:80 in 0.9 seconds, 11105 bytes.
May 19 09:45:05 stargate exim[6134]: 2004-05-19 09:45:05
1BQLl8-0001aw-Rz <=
dailynews-return-470-reg=swanni-und-michi.de@chefkoch.de
H=ckmail.chefkoch.de (c
hefkoch.de) [213.131.250.40] P=smtp S=12580
id=20040519080003.22150.qmail@chefkoch.de
May 19 09:45:05 stargate exim[6171]: 2004-05-19 09:45:05
1BQLl8-0001aw-Rz => reg
Hallo, das Problem tritt mit dem 2.4.xyz Kerneln auf. siehe auch: http://www.uwsg.iu.edu/hypermail/linux/kernel/0310.3/1245.html Ist einfach ein Variablen-Überlauf. Gruß, Anderas
Dazu sind aber ca. 495 Tage notwendig !! Andreas Kern schrieb:
Hallo, das Problem tritt mit dem 2.4.xyz Kerneln auf. siehe auch: http://www.uwsg.iu.edu/hypermail/linux/kernel/0310.3/1245.html
Ist einfach ein Variablen-Überlauf.
Gruß, Anderas
-- Mit freundlichen Grüßen Frank Jäschke Deutsche Telekom Network Projects & Services GmbH Tech. & Produktsup. Data
Hallo Andreas! Andreas Kern schrieb:
Hallo, das Problem tritt mit dem 2.4.xyz Kerneln auf. Ist einfach ein Variablen-Überlauf.
Vielen Dank für Deine Antwort. Dass das allerdings so ein Fehler ist, hätte ich nicht gedacht. Kann man denn irgendwie die Uptime wiederherstellen?? So wie es scheint, wird es den Fehler in der 9.1er nicht mehr geben (da 2.6.x) ?? Michael
Andreas Kern wrote:
das Problem tritt mit dem 2.4.xyz Kerneln auf. siehe auch: http://www.uwsg.iu.edu/hypermail/linux/kernel/0310.3/1245.html
Ist einfach ein Variablen-Überlauf.
Das halte ich fuer ein Geruecht. Es geht hier um eine Uptime von 49 Tagen und einigen Stunden, da hast Du noch lange keinen Ueberlauf... CU, Th.
Hallo, Am Wed, 19 May 2004, Thomas Hertweck schrieb:
Andreas Kern wrote:
das Problem tritt mit dem 2.4.xyz Kerneln auf. siehe auch: http://www.uwsg.iu.edu/hypermail/linux/kernel/0310.3/1245.html
Ist einfach ein Variablen-Überlauf.
Das halte ich fuer ein Geruecht. Es geht hier um eine Uptime von 49 Tagen und einigen Stunden, da hast Du noch lange keinen Ueberlauf...
Wetten, Andreas hat mit dem Parameter "desktop" gebootet, so dass HZ 1000 statt 100 ist. Dadurch kommt es eben auch 10mal frueher (nach 49.5 Tagen) zum Ueberlauf der Variablen. -dnh -- If you haven't got time to RTFM, you haven't got time to whine on this mailing list.
David Haller wrote:
[...] Wetten, Andreas hat mit dem Parameter "desktop" gebootet, so dass HZ 1000 statt 100 ist. Dadurch kommt es eben auch 10mal frueher (nach 49.5 Tagen) zum Ueberlauf der Variablen.
Das ist aber dann ein recht unschoener Bug... Wird die Uptime nicht ueber /proc/uptime ermittelt von uptime.c (coreutils)? Nur weil HZ erhoeht wird, darf ja dadurch die uptime nicht falsch berechnet werden. Ich wuesste auch nicht, wo das HZ direkt einfliesst, ausser eben in den Wert, den man in /proc/uptime findet. Das User-Space Programm uptime sollte ja eigentlich keine Kernel-Header einbinden. Meinst Du also, bereits das durch den Kernel erstellte /proc/uptime hat einen Ueberlauf? CU, Th.
Thomas Hertweck wrote: [Wednesday 19 May 2004 20:43]
David Haller wrote:
[...] Wetten, Andreas hat mit dem Parameter "desktop" gebootet, so dass HZ 1000 statt 100 ist. Dadurch kommt es eben auch 10mal frueher (nach 49.5 Tagen) zum Ueberlauf der Variablen.
Das ist aber dann ein recht unschoener Bug... Wird die Uptime nicht ueber /proc/uptime ermittelt von uptime.c (coreutils)? Nur weil HZ erhoeht wird, darf ja dadurch die uptime nicht falsch berechnet werden.
Die uptime wird ja auch nicht falsch berechnet. Der Kernel interne jiffies counter wird HZ mal pro Sekunde erhöht und läuft eben 10 mal früher über.
Ich wuesste auch nicht, wo das HZ direkt einfliesst, ausser eben in den Wert, den man in /proc/uptime findet.
Richtig, für die Ermittlung der /proc/uptime dividiert der Kernel die jiffies durch HZ.
Das User-Space Programm uptime sollte ja eigentlich keine Kernel-Header einbinden.
Muß es auch nicht.
Meinst Du also, bereits das durch den Kernel erstellte /proc/uptime hat einen Ueberlauf?
Müßte so sein. Thomas.
Thomas Hofer wrote:
[...] Die uptime wird ja auch nicht falsch berechnet. Der Kernel interne jiffies counter wird HZ mal pro Sekunde erhöht und läuft eben 10 mal früher über. [...]
Du hast glaube ich recht, ja. Jiffies ist ein "unsigned long", also IIRC mit einem Wertebereich von 0 bis 4294967295. Teilt man das nun durch HZ=1000, und rechnet in Tage um, so ergeben sich 49.7103 Tage, das entspricht ca. 49 Tage, 17 Stunden, 2 Minuten und rund 46 Sekunden. Michael hatte eine Uptime von 49 Tagen, 16 Stunden und 18 Minuten um exakt 9 Uhr. Berechnet man die Differenz, so musste der Ueberlauf um ca. 9:44 Uhr eintreten, was genau seiner Beobachtung entspricht. War also die Implementierung fuer jiffies fuer HZ=100 eigentlich schon unguenstig, so ist sie mit HZ=1000 wahrlich unbrauchbar... Tja, wieder etwas gelernt. CU, Th.
Thomas Hertweck schrieb:
Thomas Hofer wrote:
[...] Die uptime wird ja auch nicht falsch berechnet. Der Kernel interne jiffies counter wird HZ mal pro Sekunde erhöht und läuft eben 10 mal früher über. [...]
Du hast glaube ich recht, ja. Jiffies ist ein "unsigned long", also IIRC mit einem Wertebereich von 0 bis 4294967295. Teilt man das nun durch HZ=1000, und rechnet in Tage um, so ergeben sich 49.7103 Tage, das entspricht ca. 49 Tage, 17 Stunden, 2 Minuten und rund 46 Sekunden. Michael hatte eine Uptime von 49 Tagen, 16 Stunden und 18 Minuten um exakt 9 Uhr. Berechnet man die Differenz, so musste der Ueberlauf um ca. 9:44 Uhr eintreten, was genau seiner Beobachtung entspricht. War also die Implementierung fuer jiffies fuer HZ=100 eigentlich schon unguenstig, so ist sie mit HZ=1000 wahrlich unbrauchbar... Tja, wieder etwas gelernt.
CU, Th.
Guten Morgen, jetzt die Frage eines technisch nicht so versierten: Ist das auch wieder ein Grund, um auf ein 64-bit-System umzusteigen? Der Wertebereich eines unsigned long ist doch wesentlich höher als bei 32 bit. Oder irre ich da? mfg Adolf
Adolf Kreet wrote:
jetzt die Frage eines technisch nicht so versierten: Ist das auch wieder ein Grund, um auf ein 64-bit-System umzusteigen? Der Wertebereich eines unsigned long ist doch wesentlich höher als bei 32 bit. Oder irre ich da?
Hmm, also den Grund auf 64 bit umzusteigen, weil dort evtl. jiffies und damit auch die Uptime keinen Ueberlauf bekommt, finde ich ja nun schon recht seltsam :-) Ich denke, da gibt es bessere Argumente. Unterschiede zwischen 32 und 64 bit Systemen findest Du ganz einfach via google, ich denke, das muss hier nicht zum Thema werden. CU, Th.
Hallo, also entnehme ich es den ganzen Antworten auf diesen Thread richtig, dass es keine Lösung gibt, die Uptime wiederherzustellen?? Michael
Hi Michael On Thursday 20 May 2004 19.54, Swantje & Michael Ludwig wrote:
also entnehme ich es den ganzen Antworten auf diesen Thread richtig, dass es keine Lösung gibt, die Uptime wiederherzustellen??
Also, die Uptime ist nun wirklich nicht etwas, das man wiederherstellen müsste. Die Uptime ist zum plagieren da: Mein OS ist besser als Deines. Mein System ist besser abgestimmt als Deines. Ich crashe meine Kiste weniger als Du. Klar ist eine hohe Uptime ein Indiz für all das, aber auch dafür, dass Du keine Kernel Updates einspielst. Ich gab früher auch viel mehr drauf. Abgesehen davon sollte die Uptime schon richtig sein, ich will wissen wann die Kiste das letzte mal gebooted hat. Gruss Jürg
Swantje & Michael Ludwig wrote:
also entnehme ich es den ganzen Antworten auf diesen Thread richtig, dass es keine Lösung gibt, die Uptime wiederherzustellen??
Was sollte das fuer einen Sinn haben? Warum liegt Dir die Uptime gar so am Herzen? Die waere nur wirklich wichtig fuer Dich, wenn Du sie irgendwie auswertest. Ansonsten ist es wohl nur eine eher unwichtige Info. Es wuerde Dir auch nichts helfen, sie momentan wiederherzustellen, in 49.7 Tagen haettest Du die gleiche Situation wieder... CU, Th.
Am Donnerstag, 20. Mai 2004 19:54 schrieb Swantje & Michael Ludwig:
also entnehme ich es den ganzen Antworten auf diesen Thread richtig, dass es keine Lösung gibt, die Uptime wiederherzustellen??
Was liegt Dir eigentlich so viel an der Uptime? Ehrlich gesagt würd ich nen Admin feuern, wenn er ne 49 Tage Uptime auf der Kiste hätte, weil da offensichtlich die ganzen Kernel-Sicherheitslöcher und zugehörigen Bugfixes ignoriert worden sind. -- Machs gut | http://www.iivs.de/schwinde/buerger/tremmel/ | http://packman.links2linux.de/ Manfred | http://www.knightsoft-net.de
Hallo an alle, zuerst einmal möchte ich vorneweg nehmen, dass ich absolut nicht verstehen kann, wieso es sich einige Abonennten dieser Liste herausnehmen, mir vorzuwerfen, dass ich ein Uptime-Junkie, SecurityFix-Bugfix-Ignorierer oder ähnliches bin. Muss so etwas sein??? Manfred Tremmel schrieb:
Was liegt Dir eigentlich so viel an der Uptime? Ehrlich gesagt würd ich nen Admin feuern, wenn er ne 49 Tage Uptime auf der Kiste hätte, weil da offensichtlich die ganzen Kernel-Sicherheitslöcher und zugehörigen Bugfixes ignoriert worden sind.
Mir persönlich liegt viel an der Uptime, da ich sie für statistische Zwecke benötige. Ganz einfach. Ist das verboten? Möchtest Du mir, mit anderen, das verwehren??? Auch wenn sich das für Dich als schwachsinnig darstellen mag, es bleibt immer noch meine Sache. Und ich bin nicht besonders glücklich, dass der Kernel *solch* ein Problem hat. Nun muss ich halt manuell überall eingreifen und die "alte" Uptime zur "neuen" Uptime addieren (natürlich nur bis zum nächsten restart). So etwas ist nicht nur nervig, sondern nutzlos und *echte* Zeitverschwendung. Zudem hatte ich genau dieses Problem schon einmal, habe es aber nicht weiter verfolgt, da ich es mir *überhaupt* nicht erklären konnte. Nun ist es zum zweiten Mal passiert - und da dachte ich mir, frag' doch einfach mal auf der suse-linux-Liste. Das die uptime - neben anderen Themen - ein sehr diffiziles Thema ist, dessen war ich mir sehr wohl bewusst. Denn genau in diese Richtung geht die Diskussion immer sehr schnell. Leider. <Sarkasmus> Aber - mal ganz ehrlich - wieso erstellt ihr uptime-Gegner nicht einfach mal ein Skript, was die uptime beständig auf "0" hält ? Vielleicht kann dieses dann auch bald in die Standard-SuSE-Distri einfliessen, sodass die uptime *endlich* komplett nutzlos wird??? </Sarkasmus> Im übrigen ist mehr relativ egal, wen Du feuern möchtest, ich werde *nie* Dein Angestellter sein, sofern Du überhaupt über welche verfügst... Juerg Schneider schrieb:
Also, die Uptime ist nun wirklich nicht etwas, das man wiederherstellen müsste. Die Uptime ist zum plagieren da: Mein OS ist besser als Deines. Mein System ist besser abgestimmt als Deines. Ich crashe meine Kiste weniger als Du.
Klar ist eine hohe Uptime ein Indiz für all das, aber auch dafür, dass Du keine Kernel Updates einspielst. Ich gab früher auch viel mehr drauf.
Lieber Jürg, das ist doch Blödsinn! In meinem Bekanntenkreis benutzt keiner dieses "beschissene" Linux, weil "Windows doch *viiiiel* besser, sicherer und stabiler" ist - weshalb sonst gibt es um ein vielfaches mehr Software für Windows als für Linux??? (Das war natürlich wiedermal sehr sarkastisch, ich weiss ;-) ) Also die uptime benötige *ich* definitiv nicht als "Potenzverlängerung" oder Profilierungs-Instrument. Du solltest nicht so vorschnell über Menschen urteilen, die Du überhaupt nicht kennst! Denk' mal drüber nach! Alle anderen Punkte gelten auch nicht für mich. Zu den Kernel-Updates siehe unten.
Abgesehen davon sollte die Uptime schon richtig sein, ich will wissen wann die Kiste das letzte mal gebooted hat.
Siehst Du, vielleicht ist das ja ein *Grund* ??? Ich benötige die uptime, wie unten geschrieben, für statistische Zwecke, weil ich sie in vielen Skripten verarbeite und auch archiviere. Da ist so ein Kernel-Fehler, wie der, in den ich nun geraten bin, mehr als ärgerlich. Thomas Hertweck schrieb:
Was sollte das fuer einen Sinn haben? Warum liegt Dir die Uptime gar so am Herzen? Die waere nur wirklich wichtig fuer Dich, wenn Du sie irgendwie auswertest. Ansonsten ist es wohl nur eine eher unwichtige Info. Es wuerde Dir auch nichts helfen, sie momentan wiederherzustellen, in 49.7 Tagen haettest Du die gleiche Situation wieder...
Auch hierzu kann ich nur sagen: Siehe unten. Im übrigen kann ich Euch nicht verstehen, warum hier schon wieder ein Mega-Thread entsteht (zu dem ich mit diesem Posting sehr wohl beitrage, das weiss ich), nur weil einige Listen-Subscriber meinen, dass die Uptime schwachsinnig und nutzlos ist. Aber weswegen gibt es sie überhaupt?? Das ist eine ernsthafte Frage: Wieso wurde sie eingeführt? Kann jemand da etwas zu sagen (schreiben) ?? Wäre echt interessant zu wissen... So wg. historischer Hintergründe usw. usf. ... Meine Meinung und warum ich die Uptime für wichtig halte: Ich benötige die uptime für statistische Zwecke, um sie von eigenen Skripten auswerten zu lassen und fortschreiben zu lassen. Das gibt mir, über eine längere Zeit hinweg, die Möglichkeit, Durchschnitts-uptimes berechnen zu lassen und mein System noch "besser" kontrollieren, beobachten und beurteilen zu können. Ansonsten kann ich nur noch sagen... Das neueste Kernel-Update für den default-Kernel von k_deflt-2.4.21-199 auf k_deflt-2.4.21-215 gibt es seit dem 27.04.2004, alles über suse.de nachvollziehbar. So weit, so gut. Das ist nun 24 Tage her, und ich schäme mich, noch nicht das Kernel-Update installiert zu haben. Wirklich! Allerdings - und das gebe ich hier zu bedenken - kann es denn sein, dass man auch mal etwas anderes zu tun hat, ausser täglich die SuSE-WebSite zu besuchen und nach Updates zu durch- forsten bzw. YOU zu starten?? Ich zumindest habe auch viele andere Dinge zu erledigen, die mich stark daran hindern, andauernd nach Updates zu suchen. In meinem nun ganz "speziellen", aber doch sehr normalen Fall, denn ich betreibe privat zu Hause einen simplen Multi-Kulti- Familien-Server, sehe ich es das alles auch nicht als ganz so dringlich an, denn ich schaue ca. allle 30-35 Tage nach Updates. Das dürfte nach meinem Verständnis "for home use" ausreichen. Selbstverständlich handhabe ich Updates in meinem Arbeitsleben anders - und spiele sofort Security-Fixes auf den Servern ein. (solange keine anderen etwaigen Unverträglichkeiten dem entgegenstehen) Nichts für ungut, Michael
Swantje & Michael Ludwig wrote:
zuerst einmal möchte ich vorneweg nehmen, dass ich absolut nicht verstehen kann, wieso es sich einige Abonennten dieser Liste herausnehmen, mir vorzuwerfen, dass ich ein Uptime-Junkie, SecurityFix-Bugfix-Ignorierer oder ähnliches bin.
Nun, jetzt beruhig Dich mal wieder - ich verstehe nicht so ganz, warum Du die Kommentare und Fragen alle persoenlich nimmst... Wie bekommen wohl all die Leute (und es waren ja mehrere) den Eindruck, den sie genannt haben? Sie kennen Dich nicht persoenlich und ziehen daher ihre Schlussfolgerungen aus dem, was Du schreibst. Und wenn Du eine hohe Uptime hast, dann heisst das, dass Du auf alle Faelle keine groesseren Kernel-Fixes eingespielt hast, denn dazu musst Du rebooten. Das ist eine logische Schlussfolgerung, an der Du schlecht ruetteln kannst. Und in dieser Hinsicht ist Deine Vorgehensweise, Fixes nicht einzuspielen, auch nicht besonders ratsam. Der Rest Deiner Emails, in dem Du mehrfach nachfraegst, wie man eine Uptime wieder herstellen kann, laesst dann den Eindruck entstehen, Du moechtest diese Uptime-Zahl irgendwie in die Hoehe treiben. Da fragt man sich schon, warum, und man zieht seine Schluesse. Um so etwas zu vermeiden, sollte man immer dazu schreiben, warum man evtl. eine Aktion genau so und nicht anders machen moechte. Viele werden die Uptime noch nie wirklich gebraucht oder ausgewertet haben, und wenn sie ein richtig kritisches Problem darstellen wuerde, waere ich mir sicher, dass das Problem mit der ueberlaufenden Variablen bereits geloest waere. Versuche mal, Deine Email und Deine Fragen aus einer anderen Sichtweise zu betrachten, dann wirst Du wohl eher verstehen, warum Du die bisherigen Antworten bekamst - ich bin mir sicher, dass sie nicht persoenlich gemeint waren. Ansonsten kann ich nur sagen, dass Du wohl ein wenig heftig reagierst - wenn Du genau und in Ruhe gelesen haettest, stand z.B. bei mir "Die waere nur wirklich wichtig fuer Dich, wenn Du sie irgendwie auswertest. Ansonsten ist es wohl nur eine eher unwichtige Info." und das fasst ja wohl alles recht gut zusammen, oder? Wenn Du willst, kannst Du natuerlich das Programm uptime umschreiben, so dass es im laufenden Betrieb irgendwie den Ueberlauf erkennt und intern weiter rechnet und die Anzeige der Uptime korrekt ist; musst dann natuerlich einen Reboot entsprechend behandeln etc.; ist vermutlich nicht einfach und man muss sicher gut programmieren koennen, um das zu machen. CU, Th.
Am Freitag, 21. Mai 2004 08:55 schrieb Thomas Hertweck:
[wg falscher Uptime] natuerlich das Programm uptime umschreiben, so dass es im laufenden Betrieb irgendwie den Ueberlauf erkennt und intern weiter rechnet und die Anzeige der Uptime korrekt ist; musst dann natuerlich einen Reboot entsprechend behandeln etc.; ist vermutlich nicht einfach und man muss sicher gut programmieren koennen, um das zu machen.
Na, eigentlich brauchte man nur Zeit und Datum von /var/log/boot.msg auswerten. Das traue sogar ich mir zu. Also gerade so.... Gruß Harald
Swantje & Michael Ludwig wrote: [Friday 21 May 2004 07:21]
zuerst einmal möchte ich vorneweg nehmen, dass ich absolut nicht verstehen kann, wieso es sich einige Abonennten dieser Liste herausnehmen, mir vorzuwerfen, dass ich ein Uptime-Junkie, SecurityFix-Bugfix-Ignorierer oder ähnliches bin.
Deine Aufregung verstehe ich auch nicht wirklich.
Aber - mal ganz ehrlich - wieso erstellt ihr uptime-Gegner nicht einfach mal ein Skript, was die uptime beständig auf "0" hält ?
http://lists.suse.com/archive/suse-linux/2001-Nov/6427.html Wenn du ganz lieb zu mir bist, dann schreibe ich dir einen Kernel-Patch, mit dem du einen konfigurierbaren Betrag zur Uptime addieren kannst. Da müßtest du aber wirklich vieeeel entspannter, toleranter, ausgeglichener und freudespendender sein als du es bisher warst. Ich arbeite nur für Wonnepfropfen. Grüße, Thomas.
Swantje & Michael Ludwig
zuerst einmal möchte ich vorneweg nehmen, dass ich absolut nicht verstehen kann, wieso es sich einige Abonennten dieser Liste herausnehmen, mir vorzuwerfen, dass ich ein Uptime-Junkie, SecurityFix-Bugfix-Ignorierer oder ähnliches bin. Muss so etwas sein???
Hier wirft Dir niemand was vor, wir machen uns nur Lustig darüber, daß Dir die Uptime so wichtig ist. ;-)
Mir persönlich liegt viel an der Uptime, da ich sie für statistische Zwecke benötige. Ganz einfach.
*gröhl* Dann werte doch einfach das Datum irgendeiner Datei aus, die zum Bootzeitpunkt angelegt wird. Martin
Am Freitag, 21. Mai 2004 07:21 schrieb Swantje & Michael Ludwig:
Mir persönlich liegt viel an der Uptime, da ich sie für statistische Zwecke benötige. Ganz einfach. Ist das verboten? Möchtest Du mir, mit anderen, das verwehren???
Nö, natürlich nicht.
Auch wenn sich das für Dich als schwachsinnig darstellen mag, es bleibt immer noch meine Sache.
Sorry, wenn ich etwas mies drauf war/bin, es war nicht meine Absicht Dich zu Beleidigen, oder Dir etwas zu unterstellen. Vergiss mein Geschwafel am besten. -- Machs gut | http://www.iivs.de/schwinde/buerger/tremmel/ | http://packman.links2linux.de/ Manfred | http://www.knightsoft-net.de
Hallo, Am Fri, 21 May 2004, Swantje & Michael Ludwig schrieb:
Mir persönlich liegt viel an der Uptime, da ich sie für statistische Zwecke benötige. Ganz einfach.
Dann boote ohne 'desktop' Kernel-Parameter. Dann laeuft die Uptime erst nach 497 Tagen ueber. -dnh -- If you haven't got time to RTFM, you haven't got time to whine on this mailing list.
Manfred Tremmel
Was liegt Dir eigentlich so viel an der Uptime? Ehrlich gesagt würd ich nen Admin feuern, wenn er ne 49 Tage Uptime auf der Kiste hätte, weil da offensichtlich die ganzen Kernel-Sicherheitslöcher und zugehörigen Bugfixes ignoriert worden sind.
Und ich würde wohl einen nicht unerheblichen Teil meiner Wartungsverträge verlieren, wenn ich z.B. einen Webserver wegen jedem lokalen Exploit herunterfahren würde. ;-) Martin
On Friday 21 May 2004 10.57, Martin Schmitz wrote:
Und ich würde wohl einen nicht unerheblichen Teil meiner Wartungsverträge verlieren, wenn ich z.B. einen Webserver wegen jedem lokalen Exploit herunterfahren würde. ;-)
Und wieviele verlierst Du wenn Deine Server gerooted werden? Siehe die kombinierten Einbrüche letzten Winter. Ein unprivilegierter Account und anschliessend ein local root exploit. Du verliert Deine Wartungsverträge wegen längeren downtimes, nicht wegen eines Service Reboots. Gruss Jürg
Juerg Schneider
On Friday 21 May 2004 10.57, Martin Schmitz wrote:
Und ich würde wohl einen nicht unerheblichen Teil meiner Wartungsverträge verlieren, wenn ich z.B. einen Webserver wegen jedem lokalen Exploit herunterfahren würde. ;-)
Und wieviele verlierst Du wenn Deine Server gerooted werden? Siehe die kombinierten Einbrüche letzten Winter. Ein unprivilegierter Account und anschliessend ein local root exploit.
Ich habe auf meinen Webservern keine Benutzer-Accounts, denen ich nicht trauen könnte.
Du verliert Deine Wartungsverträge wegen längeren downtimes, nicht wegen eines Service Reboots.
Außerdem hast Du den Smiley übersehen. Ich halte aber tatsächlich nicht viel davon, auf Teufel komm raus *jeden* Patch einzuspielen. Wenn die gepatchte Schwachstelle auf die Sicherheit meiner Systeme keine erkennbaren Auswirkungen hat, laß ich es. Martin
Am Montag, 24. Mai 2004 00:07 schrieb Martin Schmitz:
Juerg Schneider
writes: On Friday 21 May 2004 10.57, Martin Schmitz wrote:
Und ich würde wohl einen nicht unerheblichen Teil meiner Wartungsverträge verlieren, wenn ich z.B. einen Webserver wegen jedem lokalen Exploit herunterfahren würde. ;-)
Und wieviele verlierst Du wenn Deine Server gerooted werden? Siehe die kombinierten Einbrüche letzten Winter. Ein unprivilegierter Account und anschliessend ein local root exploit.
Ich habe auf meinen Webservern keine Benutzer-Accounts, denen ich nicht trauen könnte.
Dachten die Debian-Leute offenbar auch. Es geht nicht darum, ob Du allen Leuten trauen kannst, die auf Deinem Server unterwegs sind, es geht darum, dass (über Sniffer, "Social Engineering" oder wie auch immer) ein lokaler Benutzeraccount plötzlich kompromittiert sein kann.
Du verliert Deine Wartungsverträge wegen längeren downtimes, nicht wegen eines Service Reboots.
Außerdem hast Du den Smiley übersehen. Ich halte aber tatsächlich nicht viel davon, auf Teufel komm raus *jeden* Patch einzuspielen. Wenn die gepatchte Schwachstelle auf die Sicherheit meiner Systeme keine erkennbaren Auswirkungen hat, laß ich es.
Und das kannst immer in voller Tragweite beurteilen, ja? Dachten die Debian-Leute auch. Ich halte Deine Einstellung für extrem fahrlässig. Ein öffentlich zugänglicher Webserver sollte IMHO mindestens _täglich_ aktualisiert werden, wenn Security-Updates vorliegen - sowas lässt sich sicher auch automatisieren. Wenn Du Deinen Kunden 24x7-Server verkauft hast, ohne über Hochverfügbarkeit nachgedacht zu haben, dann hast Du IMHO ziemlich blauäugig gehandelt. In jedem anderen Fall sind Offline-Zeiten zur Wartung normal und im Bereich von ein paar Minuten pro Tag auch vertretbar. Jan
Jan.Trippler@t-online.de (Jan Trippler) writes:
Am Montag, 24. Mai 2004 00:07 schrieb Martin Schmitz:
Außerdem hast Du den Smiley übersehen. Ich halte aber tatsächlich nicht viel davon, auf Teufel komm raus *jeden* Patch einzuspielen. Wenn die gepatchte Schwachstelle auf die Sicherheit meiner Systeme keine erkennbaren Auswirkungen hat, laß ich es.
Und das kannst immer in voller Tragweite beurteilen, ja?
Immer nicht, aber oft. Wenn zum Beispiel eine Symlink-Schwachstelle existiert, aber der einzige, der auf dem Rechner Symlinks anlegt, bin ich, dann brauche ich den Patch nicht. Ich spiele ihn ein, wenn es im Rahmen von anderen Wartungsarbeiten passt. Oder Apache: da gibt es z.B. eine Schwachstelle in Apache <= 1.3.29, die ermöglicht, daß ein "Angreifer" Escape-Sequenzen in Deine Logfiles schreiben kann, die ggf. einen Exploit für ein Terminal enthalten könnten, so es denn einen solchen Exploit gäbe und man sich die Logfiles eben mit diesem Terminal ansieht. -> Kann ich ausschließen; brauch ich nicht (den Patch mein ich - für Debian gibt's ohnehin noch keinen).
Debian-Leute auch. Ich halte Deine Einstellung für extrem fahrlässig. Ein öffentlich zugänglicher Webserver sollte IMHO mindestens _täglich_ aktualisiert werden, wenn Security-Updates vorliegen - sowas lässt sich sicher auch automatisieren.
Automatisieren tue ich das nicht. Aber aus Erfahrung weiß ich, daß ich sehr vorsichtig bin und kein bißchen fahrlässig.
Wenn Du Deinen Kunden 24x7-Server verkauft hast, ohne über Hochverfügbarkeit nachgedacht zu haben, dann hast Du IMHO ziemlich blauäugig gehandelt.
Hab ich nicht.
In jedem anderen Fall sind Offline-Zeiten zur Wartung normal und im Bereich von ein paar Minuten pro Tag auch vertretbar.
Sie sind nicht nur vertretbar, es würde bei vielen Rechnern vermutlich nichtmal auffallen, wenn sie des Nachts mal für ein paar Stunden nicht verfügbar wären. ;-) Martin
participants (13)
-
Adolf Kreet
-
Andreas Kern
-
Andreas Winkelmann
-
David Haller
-
frank jaeschke
-
Harald_mail@t-online.de
-
Jan.Trippler@t-online.de
-
Juerg Schneider
-
Manfred Tremmel
-
Martin Schmitz
-
Swantje & Michael Ludwig
-
Thomas Hertweck
-
Thomas Hofer