Re: Monatsarchive im mbox Format

24 Aug 2002

      Hallo Sascha, hallo Leute,

Am Samstag, 24. August 2002 18:23 schrieb Sascha Andres:
...
Am 24.08.2002 (13:27) schrieb David Haller:
...
On Sat, 24 Aug 2002, Sascha Andres wrote:
[..]
Das könnte man ja zum Beispiel so lösen: Alle From's[1] des
Monats herauslesen (aus der eigenen mbox für SuSE, und als
Mail an synch@service, zurück kommen dann die, die nicht
drin sind.
Einziges Problem: 4000 Mails = ~4000 From's * ~90 Zeichen / 8
= ~45000 KB / 1024 = ~ 43MB ;((
Huch? Kann es sein, dass Du Dich hier "ein wenig" vertan hast? ;-)
Richtig kann es wohl nicht sein, da bei mir ein komplettes Monatsarchiv 
max. 20 MB hat. Da kann es wohl nicht sein, dass eine Zeile pro Mail 
mehr Platz braucht ;-)

Nochmal rechnen:
4000 Headerzeilen * 90 Zeichen = 360.000 Byte = ~351 kByte

Wieso teilst Du eigentlich durch 8, die Headerzeilen bestehen doch aus 
Bytes und nicht aus Bits (ja, ich weiß, strenggenommen aus Bits, aber 
Du hast wohl durchschnittlich 90 _Byte_ gezählt.)
...
Oder (Wenn man die ML-ID heraustrennt:
Was keine schlechte Idee ist, die Nummer aus dem Return-Path ist ja der 
interessante Teil ;-)
...
~4000 From's * 6 Zeichen / 8 = ~3000KB / 1024 = ~2MB
Nochmal rechnen:
4000 Mails * 7 Zeichen (Nummer aus dem Return-Path + Zeilenumbruch) = 
28.000 Byte bzw. rund 27 kByte.

Das jagst Du noch durch gzip/bzip2 und die Mail ist wohl kleiner als 
eine durchschnittliche Mail auf der Liste ;-)

Gerade mal getestet:
cb@tux:/tmp> for i in `seq 200000 204000`; do echo $i >> tmp; done
[...]
cb@tux:/tmp>  ls -l tmp*
-rw-r--r--    1 cb       users       28007 Aug 24 19:54 tmp
-rw-r--r--    1 cb       users        8002 Aug 24 19:54 tmp.gz
-rw-r--r--    1 cb       users        3623 Aug 24 19:54 tmp.bz2
...
[Datenmenge]
Rechne nochmal nach ;-)
Die größte Datenmenge dürfte wohl durch den Versand der nachbestellten 
Nachrichten anfallen. Auch hier empfiehlt sich gzip oder bzip2.

Gruß

Christian Boltz
-- 
Registrierter Linux-Nutzer #239431
Linux - life is too short for reboots.