Hallo, On 2/20/2007 9:12 PM, Dirk Schneider wrote:
Christian Banek schrieb am 16.02.2007 21:19:
Als root habe ich die Db gefüttert (ca. 10.000 Mails), aber die
Erkennungsrate ist nicht so doll.
Ja, klar. Die so angelegte Datenbank ist nicht userspezifisch und wird nicht bei der Prüfung der Email eines Users herangezogen.
Habe den thread nicht so detailliert verfolgt, aber wird in diesem Fall hier nicht die eine systemweite Datenbank benutzt? Sprich, die Datenbank wird herangezogen, für jeden Account? (Immer vorausgesetzt die ist für den richtigen User zugänglich...)
Lass sa-learn als root über die EMails _eines_ Users laufen und kopiere nach so einem Lauf die Datenbaken in's entsprechende SA-Verzeichnis des Users, dann wird für jeden User extra gelernt. Denn was SPAM beim einen ist muss nicht zwangläufig auch beim anderen SPAM sein.
Der Grund den du gibst st ja richtig, aber ist das kopieren wirklich sinnvoll? Denn entweder kann ich dann die Datenbank nicht modifizieren, oder ich habe eine Hin-und-her-kopierorgie... wenn ich mich nicht täusche gibt es durchaus Möglichkeiten spamassasin die Mails eines anderen Accounts lernen zu lassen... wie man das dann aber mit amavis nutzt weiss ich nicht.
Geschickterweise übergibst Du bei so einem Lauf über die EMails noch einen Flag an sa-learn, ob gerade die HAMs eines Users oder seine SPAMs gelernt werden,
Das ist nicht nur geschickt, das ist ja wohl die Voraussetzung :-) Arno
dann wird der Bayes mit allen Daten gefüttert die er für eine hohe Erkennungsrate benötigt.
Bei uns macht dies ein nächtlich laufendes Skript. Die Erkennungsrate ist bei über 99%. _Ohne_ Online-Tests, es laufen lediglich die lokalen und eben der trainierte Bayes-Test.
Gruß, Dirk
-- IT-Service Lehmann al@its-lehmann.de Arno Lehmann http://www.its-lehmann.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org