Hallo, Am Fri, 21 Nov 2003, Mathias Bauer schrieb:
* David Haller <david@dhaller.de> [2003-11-20 13:50] schrieb:
Am Thu, 20 Nov 2003, Mathias Bauer schrieb:
Das =?iso-8859-1?q?= etc. habe ich nie genauer analysiert. Meist steht danach irgend ein Umlaut und manchmal heißt es statt -1 eben -15 etc.
Das ist eine Kodierung lt. RfC 1342, 1522, 2047.
[... viel interessantes gekürzt ...]
Ja, das geht mit recode, allerdings muss man vorher das encoding und das charset ausfiltern und die =????= wegmachen. Z.B.:
==== for x in $header # wortweise betrachten, s.o. do if echo "$x" grep -q '^=?'
Müsste es -- nur so auf die Schnelle -- nicht heißen: if echo "$x" | grep -q '^=?'
Ja! [snippetry]
In Perl laesst sich das etwas eleganter loesen, da kann man sogar manche Defekte reparieren. Bei Interesse kann ich meine Perl-Scriptfragmente mal ueberarbeiten (und moeglichst so, dass es sich mit perlcc (5.8.0) kompilieren laesst).
Hey danke für die Infos! Allein bis ich die passenden RFCs rausgesucht habe... Leider bin ich von Ideen noch nicht zu Fragmenten gekommen :-( Ich werde wohl zuerst mal Perl lernen, was ich mir eh schon lange vorgenommen habe und danach sicher noch einige kalte Wintertage brauchen, bis was brauchbares heraus kommt.
Ok, ich versuch dann mal die Fragmente zu was einzeln tauglichem zusammenzufuegen.
Außerdem finde ich es problematisch, wenn zur Gesamtverarbeitung (incl. Filter) einer Email 100000 mal awk, formail, grep, sed etc. verwendet wird. Ich bin ja kein Freund von monolithischen Gesamtlösungen aber irgendwann scheint mir das nicht mehr besonders praktikabel. Obwohl es natürlich schon funktioniert! Wie denkt ihr darüber?
Also, bei mir bremst bisher eigentlich nur spamassassin, den ich dementsprechend weit hinten in der Filterkette habe. Davor sind viele normale procmail-Regeln, aber auch eine, die fuer alles, was bis dahin durchkommt ein gawk-script + antivir aufruft. Das ist aber immernoch viel schneller als SA... Im Moment habe ich hier also folgende Filter: ==== ## filter for base64-encoded MZ-exe-files :0 B: * ^TV[qpro][iw5QJB]AAMAAAAEAAAA exe-files # suse-linux "killfile" INCLUDERC=/home/dh/.procmail/kill-suse.rc # general sorting / whitelist INCLUDERC=/home/dh/.procmail/sort.rc :0 fw | /home/dh/bin/avcheck-mail :0 H * ^X-AVCheck-Mail: virii-new # noch zwei spezifische Filter (einer fuer die ct-register-Mails, der # den Anhang extrahiert und direkt ins Register einpflegt) # spamassassin :0 fw | /usr/local/bin/spamassassin :0 H * ^X-Spam-Level:.*\*\*\*\*\*\* spammed-sure :0 H * ^X-Spam-Level:.*\*\*\*\* spammed-probable :0 inbox ==== /home/dh/bin/avcheck-mail ist dabei ein gawk-Wrapper um antivir, den ich hier IIRC sogar schonmal gemailt habe... Im Vergleich zu SA ist der uebrigens _sehr_ performant...
Äh noch was ... könntest Du mir evtl. Deine Skriptfragmente zum Austoben überlassen???
Klar, s.o. Im Moment sind die aber "so" untauglich ;)
Evtl. über einen Link auf der HP. Wenn man schon mal ne Ausgangsbasis für ein interessantes Problem hat, ist's ja leichter als sich anhand diverser Hello-World-Progrämmchen zu motivieren.
Mach ich. -dnh -- Qual Qual oh Qual wo bist Du oh Qual oh Qual -- B. Brodesser in suse-talk