Hallo, On Mon, 16 Sep 2002, Ekkard Gerlach wrote:
ich will in einem 1GB großen Mailarchiv die footer abtrennen um Platz zu sparen und das Recherchieren zu beschleunigen.
Mit footer meine ich alles was in einer Mail unterhalb "--" steht , bis zur nächsten Mail. Wenn in einigen wenigen Fällen mal mehr als gewünscht weggeschnitten wird als der footer, dann macht das nichts.
Dafuer kann ich dir die relevanten Perl-Schnipsel aus dem Statistik-script[1] mailen -- inkl. Erkennung ob sig oder Footer.
Problem: nicht alle Mails beginnen brav mit "From ", ^^^^^^^^ sondern manchmal recht kunterbunt. Viele Mails kommen auch aus Newsgruppen (herauskopiert) oder aus digest-Mails.
Dann ist das kein MBox Format, und du "hast verloren"... (es sei denn es ist Maildir/MH oder so)... Ohne eine zuverlaessige Regex wird das kaum klappen. Die beste (einzige?) Loesung waere dann wohl die Mails nach "Kategorie" (mbox-konform, diverse andere Varianten) zu trennen und dann jew. gesondert zu behandeln... Bei 1 GB duerfte sich der Aufwand wohl sogar lohnen ;) -dnh PS: was packst du sowas auch in ein gemeinsames Archiv?!?! *tstst* PPS: achso, wenn die jew. "Formen" in einzelnen Dateien vorliegen, dann vereinfacht sich alles weitere natuerlich betraechtlich... [1] die sind noch nicht in der "publizierten" Version, da nur ad-hoc drangebastelt. -- Wer braucht schon ein Leben wenn man suse-talk hat? Oder anders: Wer suse-talk hat muß sich um sein Leben keine Gedanken mehr machen, dafür bleibt eh keine Zeit mehr... oder... wer braucht überhaupt ein Leben wenn er suse-talk hat...? -- Christian Mueller in suse-talk