Mailinglist Archive: opensuse-de (6551 mails)
| < Previous | Next > |
Re: Monatsarchive im mbox Format
- From: Christian Boltz <christian.boltz@xxxxxxxx>
- Date: Sat, 24 Aug 2002 20:06:32 +0200
- Message-id: <200208241959.39747@xxxxxxxxxxxxxxx>
Hallo Sascha, hallo Leute,
Am Samstag, 24. August 2002 18:23 schrieb Sascha Andres:
Huch? Kann es sein, dass Du Dich hier "ein wenig" vertan hast? ;-)
Richtig kann es wohl nicht sein, da bei mir ein komplettes Monatsarchiv
max. 20 MB hat. Da kann es wohl nicht sein, dass eine Zeile pro Mail
mehr Platz braucht ;-)
Nochmal rechnen:
4000 Headerzeilen * 90 Zeichen = 360.000 Byte = ~351 kByte
Wieso teilst Du eigentlich durch 8, die Headerzeilen bestehen doch aus
Bytes und nicht aus Bits (ja, ich weiß, strenggenommen aus Bits, aber
Du hast wohl durchschnittlich 90 _Byte_ gezählt.)
Was keine schlechte Idee ist, die Nummer aus dem Return-Path ist ja der
interessante Teil ;-)
Nochmal rechnen:
4000 Mails * 7 Zeichen (Nummer aus dem Return-Path + Zeilenumbruch) =
28.000 Byte bzw. rund 27 kByte.
Das jagst Du noch durch gzip/bzip2 und die Mail ist wohl kleiner als
eine durchschnittliche Mail auf der Liste ;-)
Gerade mal getestet:
cb@tux:/tmp> for i in `seq 200000 204000`; do echo $i >> tmp; done
[...]
cb@tux:/tmp> ls -l tmp*
-rw-r--r-- 1 cb users 28007 Aug 24 19:54 tmp
-rw-r--r-- 1 cb users 8002 Aug 24 19:54 tmp.gz
-rw-r--r-- 1 cb users 3623 Aug 24 19:54 tmp.bz2
Rechne nochmal nach ;-)
Die größte Datenmenge dürfte wohl durch den Versand der nachbestellten
Nachrichten anfallen. Auch hier empfiehlt sich gzip oder bzip2.
Gruß
Christian Boltz
--
Registrierter Linux-Nutzer #239431
Linux - life is too short for reboots.
Am Samstag, 24. August 2002 18:23 schrieb Sascha Andres:
Am 24.08.2002 (13:27) schrieb David Haller:
On Sat, 24 Aug 2002, Sascha Andres wrote:Das könnte man ja zum Beispiel so lösen: Alle From's[1] des
[..]
Monats herauslesen (aus der eigenen mbox für SuSE, und als
Mail an synch@service, zurück kommen dann die, die nicht
drin sind.
Einziges Problem: 4000 Mails = ~4000 From's * ~90 Zeichen / 8
= ~45000 KB / 1024 = ~ 43MB ;((
Huch? Kann es sein, dass Du Dich hier "ein wenig" vertan hast? ;-)
Richtig kann es wohl nicht sein, da bei mir ein komplettes Monatsarchiv
max. 20 MB hat. Da kann es wohl nicht sein, dass eine Zeile pro Mail
mehr Platz braucht ;-)
Nochmal rechnen:
4000 Headerzeilen * 90 Zeichen = 360.000 Byte = ~351 kByte
Wieso teilst Du eigentlich durch 8, die Headerzeilen bestehen doch aus
Bytes und nicht aus Bits (ja, ich weiß, strenggenommen aus Bits, aber
Du hast wohl durchschnittlich 90 _Byte_ gezählt.)
Oder (Wenn man die ML-ID heraustrennt:
Was keine schlechte Idee ist, die Nummer aus dem Return-Path ist ja der
interessante Teil ;-)
~4000 From's * 6 Zeichen / 8 = ~3000KB / 1024 = ~2MB
Nochmal rechnen:
4000 Mails * 7 Zeichen (Nummer aus dem Return-Path + Zeilenumbruch) =
28.000 Byte bzw. rund 27 kByte.
Das jagst Du noch durch gzip/bzip2 und die Mail ist wohl kleiner als
eine durchschnittliche Mail auf der Liste ;-)
Gerade mal getestet:
cb@tux:/tmp> for i in `seq 200000 204000`; do echo $i >> tmp; done
[...]
cb@tux:/tmp> ls -l tmp*
-rw-r--r-- 1 cb users 28007 Aug 24 19:54 tmp
-rw-r--r-- 1 cb users 8002 Aug 24 19:54 tmp.gz
-rw-r--r-- 1 cb users 3623 Aug 24 19:54 tmp.bz2
[Datenmenge]
Rechne nochmal nach ;-)
Die größte Datenmenge dürfte wohl durch den Versand der nachbestellten
Nachrichten anfallen. Auch hier empfiehlt sich gzip oder bzip2.
Gruß
Christian Boltz
--
Registrierter Linux-Nutzer #239431
Linux - life is too short for reboots.
| < Previous | Next > |