Mailinglist Archive: opensuse-de (6551 mails)

< Previous Next >
Re: Monatsarchive im mbox Format
  • From: Christian Boltz <christian.boltz@xxxxxxxx>
  • Date: Sat, 24 Aug 2002 20:06:32 +0200
  • Message-id: <200208241959.39747@xxxxxxxxxxxxxxx>
Hallo Sascha, hallo Leute,

Am Samstag, 24. August 2002 18:23 schrieb Sascha Andres:
Am 24.08.2002 (13:27) schrieb David Haller:
On Sat, 24 Aug 2002, Sascha Andres wrote:
[..]
Das könnte man ja zum Beispiel so lösen: Alle From's[1] des
Monats herauslesen (aus der eigenen mbox für SuSE, und als
Mail an synch@service, zurück kommen dann die, die nicht
drin sind.

Einziges Problem: 4000 Mails = ~4000 From's * ~90 Zeichen / 8
= ~45000 KB / 1024 = ~ 43MB ;((

Huch? Kann es sein, dass Du Dich hier "ein wenig" vertan hast? ;-)
Richtig kann es wohl nicht sein, da bei mir ein komplettes Monatsarchiv
max. 20 MB hat. Da kann es wohl nicht sein, dass eine Zeile pro Mail
mehr Platz braucht ;-)

Nochmal rechnen:
4000 Headerzeilen * 90 Zeichen = 360.000 Byte = ~351 kByte

Wieso teilst Du eigentlich durch 8, die Headerzeilen bestehen doch aus
Bytes und nicht aus Bits (ja, ich weiß, strenggenommen aus Bits, aber
Du hast wohl durchschnittlich 90 _Byte_ gezählt.)

Oder (Wenn man die ML-ID heraustrennt:

Was keine schlechte Idee ist, die Nummer aus dem Return-Path ist ja der
interessante Teil ;-)

~4000 From's * 6 Zeichen / 8 = ~3000KB / 1024 = ~2MB

Nochmal rechnen:
4000 Mails * 7 Zeichen (Nummer aus dem Return-Path + Zeilenumbruch) =
28.000 Byte bzw. rund 27 kByte.

Das jagst Du noch durch gzip/bzip2 und die Mail ist wohl kleiner als
eine durchschnittliche Mail auf der Liste ;-)

Gerade mal getestet:
cb@tux:/tmp> for i in `seq 200000 204000`; do echo $i >> tmp; done
[...]
cb@tux:/tmp> ls -l tmp*
-rw-r--r-- 1 cb users 28007 Aug 24 19:54 tmp
-rw-r--r-- 1 cb users 8002 Aug 24 19:54 tmp.gz
-rw-r--r-- 1 cb users 3623 Aug 24 19:54 tmp.bz2

[Datenmenge]

Rechne nochmal nach ;-)
Die größte Datenmenge dürfte wohl durch den Versand der nachbestellten
Nachrichten anfallen. Auch hier empfiehlt sich gzip oder bzip2.


Gruß

Christian Boltz
--
Registrierter Linux-Nutzer #239431
Linux - life is too short for reboots.



< Previous Next >
Follow Ups