Heinz P Hallo,
mit mutt habe ich aus den 6500 Mails im maildir-Format inzwischen
eine korrekt sortierte mbox-Datei erstellt.
Leider wurden dabei natürlich auch die Header exportiert, die ich
jetzt löschen möchte.
Dummerweise scheitere ich schon an der Such-Regex. Die Header sehen
in etwa so aus:
Received: from pop.gmx.net (212.227.17.185:110) by pahlke-online.invalid with
POP3; 09 Sep 2013 09:10:54 -0000
Received: from mc004.v300.gmx.net ([213.165.65.4]) by mx-ha.gmx.net
(mxgmx108) with ESMTP (Nemesis) id 0LhCod-1Vmq5E0CMp-00oSgQ for
Hallo Heinz, die Strategie: eine mbox-Datei enthält eine Folge on Header- und Body-Blöcken.
Der Header beginnt jeweils mit From. Es gibt eine Sonderbehandlung, damit das Wort "From"
im Text nicht falsch interpretiert wird.
Zwischen Header und Body ist eine Leerzeile, aber natürlich können im Body auch Leerzeilen sein
Im Header Abschnitt sind alle Zeilen, die mit Leerzeichen oder Tab beginnen, Fortsetzungszeilen
Hier mal eine Idee wie das in Perl aussehen könnte
$headers = 0;
while(<>)
{ if(!$headers && /^From /) { $headers = 1; $suppress = 0; } elsif($headers && /^\r?$/) { $headers = 0; }
if($headers)
{ if(/^Received/) { $suppress = 1; next; }
elsif($suppress && /^[ \t]/) { next; }
else { $suppress = 0; }
}
print;
}
Wolfgang Hamann
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+unsubscribe@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+owner@opensuse.org