
Hallo Sascha, hallo Leute, Am Samstag, 24. August 2002 18:23 schrieb Sascha Andres:
Am 24.08.2002 (13:27) schrieb David Haller:
On Sat, 24 Aug 2002, Sascha Andres wrote: [..] Das könnte man ja zum Beispiel so lösen: Alle From's[1] des Monats herauslesen (aus der eigenen mbox für SuSE, und als Mail an synch@service, zurück kommen dann die, die nicht drin sind.
Einziges Problem: 4000 Mails = ~4000 From's * ~90 Zeichen / 8 = ~45000 KB / 1024 = ~ 43MB ;((
Huch? Kann es sein, dass Du Dich hier "ein wenig" vertan hast? ;-) Richtig kann es wohl nicht sein, da bei mir ein komplettes Monatsarchiv max. 20 MB hat. Da kann es wohl nicht sein, dass eine Zeile pro Mail mehr Platz braucht ;-) Nochmal rechnen: 4000 Headerzeilen * 90 Zeichen = 360.000 Byte = ~351 kByte Wieso teilst Du eigentlich durch 8, die Headerzeilen bestehen doch aus Bytes und nicht aus Bits (ja, ich weiß, strenggenommen aus Bits, aber Du hast wohl durchschnittlich 90 _Byte_ gezählt.)
Oder (Wenn man die ML-ID heraustrennt:
Was keine schlechte Idee ist, die Nummer aus dem Return-Path ist ja der interessante Teil ;-)
~4000 From's * 6 Zeichen / 8 = ~3000KB / 1024 = ~2MB
Nochmal rechnen: 4000 Mails * 7 Zeichen (Nummer aus dem Return-Path + Zeilenumbruch) = 28.000 Byte bzw. rund 27 kByte. Das jagst Du noch durch gzip/bzip2 und die Mail ist wohl kleiner als eine durchschnittliche Mail auf der Liste ;-) Gerade mal getestet: cb@tux:/tmp> for i in `seq 200000 204000`; do echo $i >> tmp; done [...] cb@tux:/tmp> ls -l tmp* -rw-r--r-- 1 cb users 28007 Aug 24 19:54 tmp -rw-r--r-- 1 cb users 8002 Aug 24 19:54 tmp.gz -rw-r--r-- 1 cb users 3623 Aug 24 19:54 tmp.bz2
[Datenmenge]
Rechne nochmal nach ;-) Die größte Datenmenge dürfte wohl durch den Versand der nachbestellten Nachrichten anfallen. Auch hier empfiehlt sich gzip oder bzip2. Gruß Christian Boltz -- Registrierter Linux-Nutzer #239431 Linux - life is too short for reboots.