Für die Konfiguration unseres Spamfilters brauche ich mal einen Tip: Welche Wortlisten verwenden? Wo und wie oft aktualisieren? Welche Wörter filtern Mails die eigentlich durchgehen sollen? Dankeschön vorab.
* Am Mit, 31 Mär 2004 schrieb Andrea:
Für die Konfiguration unseres Spamfilters brauche ich mal einen Tip:
Welche Wortlisten verwenden? Wo und wie oft aktualisieren? Welche Wörter filtern Mails die eigentlich durchgehen sollen?
Ich glaube, das ist keine Frage, die man so einfach allgemeingültig beantworten kann, da das ganz stark davon abhängt, was man für Mails bekommt. White- und Blacklists sind eine Sache, die man höchstens für eine Firma, vielleicht aber sogar nur personenspezifisch trainieren kann. Ich würde an Deiner Stelle einen Bayesian Spam Filter aufsetzen und mit einem Haufen Spam und Ham von Euch trainieren! Jeweils 2000 Mails sollten ein guter Anfang sein. Gruß Christoph
Am Mittwoch, 31. März 2004 08:57 fragte Andrea: (Aus Versehen auch pm gepostet. Tschuldige Andrea)
Für die Konfiguration unseres Spamfilters brauche ich mal einen Tip: Welche Wortlisten verwenden?
Ich gebe unten ein paar Links an wo es SA Rules gibt und was dabei beachtet werden sollte, wenn eigene Regeln geschrieben werden. Auch Anleitungen, wie eigene Regex Regeln erstellt werden und was reguläre Ausdrücke sind. Grundsätzlich: -Regeln sollten den Bedürfnissen entsprechend übernommen oder selber erstellt werden. Was bei dem einen Spam ist, ist bei dem anderen gewünscht. -Viele Regeln mit niedrigem score, ergeben weniger "false positive" als eine Regel mit high score. -Eigene Regeln auf Funktion oder Tippfehler vor dem Einsatz testen mit "spamassassin --lint -D"
Wo und wie oft aktualisieren?
Auf den de und en wiki-Seiten (exit0) gibt es scripte, um deren Rules automatisch zu aktualisieren. Nutze ich aber nicht. Ich suche die mir passenden raus, nehme sie als Anregung für eigene oder ändere mir welche für mich um. Wie oft, sollte von nicht erkannter Spam der bestehenden Regeln abhängen. Wenn nahezu keine unerwünschte mail durchkommt, braucht es keine neuen Regeln.
Welche Wörter filtern Mails die eigentlich durchgehen sollen?
Auch individuell. Eine Buchhandlung hat andere "wanted", als ein Börsenmakler. Die eigene Anschrift, eigene Mail-Header, Kd-Nr. usw. kann z.B. geeignet sein. http://www.exit0.us/index.php/GermanRules http://www.merchantsoverseas.com/wwwroot/gorilla/sa_rules.htm http://mywebpages.comcast.net/mkettler/sa/SA-rules-howto.txt http://www.exit0.us/ PS: bei Bedarf kann ich meine SA_DE_RULES (von Daniel Roethlisberger) zusenden. Auf der Seite von Daniel gibt es die nicht mehr, sie sind aber mit in die sa_wiki_de Rules übernommen, zum Teil überarbeitet. -- Ciao Marco, registered GNU/Linux-User 313353 Keine Macht George W.Bush und seiner Junta zur Ausbeutung, Unterdrückung, Weltmacht &'BigBrother-watching'; kauft keine U$-Waren!
Moin, * Andrea wrote (2004-03-31 08:57):
Für die Konfiguration unseres Spamfilters brauche ich mal einen Tip:
Welche Wortlisten verwenden?
Eigene, nur so bekommst Du optimale Trefferquoten. Das Stichwort lautet Bayes.
Wo und wie oft aktualisieren?
Was, die Wortlisten?
Welche Wörter filtern Mails die eigentlich durchgehen sollen?
Willst Du mit Deinen Kommunikationspartnern Passörter vereinbaren? Nützlich, aber umständlich. Anders machen Whitelists keinen Sinn, weil Spams schon mal zufällige Wörter enthalten. Thorsten -- The privacy of correspondence, posts and telecommunications shall be inviolable. - German Grundgesetz, Article 10, Sec. 1
participants (4)
-
Andrea
-
Christoph Maurer
-
Marco Maske
-
Thorsten Haude