[opensuse-es] preguntas sobre bayes
señores disculpen que pregunte tanto ,pero yo se que en esta lista hay gente que sabe y conoce mas que yo de spamassassin , estoy entrenando spamassassin manualmente con el entrenamiento bayesiano , en un cuenta que tengo meto los correos que considero spam y no spam , en un anterior correo Camalion me hablo que lo mínimo para que el SA fuera efectivo eran 500 correos de c/u , ahora mi duda es esta: una ves que el SA aprendió de esos correos yo sigo metiendo los correos que se logren colar para seguir entrenando pero borro los correos anteriores que hay en cada carpeta o los dejo , por ejemplo he realizado a esta altura dos entrenamientos y en el ultimo me envió un mensaje asi: Learned tokens from 40 message(s) (814 message(s) examined) osea si el sobreescribio la base de datos anterior que se hicieron los 774 no habria tomado los 814 de nuevo , igual pasa si borro la base de datos que crea dentro ./spamassassin , la guarda en cache? , me aparecia igual ? , ojo suponiendo que me caigan dos spam nuevos los meto en la carpeta , hago el entrenamiento me diria : Learned tokens from 2 message(s) (816 message(s) espero haber sido explicativo :( salduoss -- rickygm http://gnuforever.homelinux.com -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
El 2009-10-08 a las 00:43 -0600, troxlinux escribió:
señores disculpen que pregunte tanto ,pero yo se que en esta lista hay gente que sabe y conoce mas que yo de spamassassin , estoy entrenando spamassassin manualmente con el entrenamiento bayesiano , en un cuenta que tengo meto los correos que considero spam y no spam , en un anterior correo Camalion me hablo que lo mínimo para que el SA fuera efectivo eran 500 correos de c/u ,
Recuerda que necesita que le des ambos: mensajes de spam y mensajes que no consideras que no son spam (ham). Y de ambos necesita una buena cantidad (>500).
ahora mi duda es esta: una ves que el SA aprendió de esos correos yo sigo metiendo los correos que se logren colar para seguir entrenando pero borro los correos anteriores que hay en cada carpeta o los dejo , por ejemplo he realizado a esta altura dos entrenamientos y en el ultimo me envió un mensaje asi: Learned tokens from 40 message(s) (814 message(s) examined)
De los correos que ya ha aprendido algo no los vuelve a analizar. Los puedes borrar (los mensajes), no hay problema. El archivo que necesita el SA es la base de datos bayesiana (bayes_toks).
osea si el sobreescribio la base de datos anterior que se hicieron los 774 no habria tomado los 814 de nuevo ,
Los correos que ya ha analizado, los omite.
igual pasa si borro la base de datos que crea dentro ./spamassassin , la guarda en cache? ,
No, ojo, esa es la que usa para puntuar los mensajes, no la borres salvo que quieras empezar el entrenamiento desde cero :-(
aparecia igual ? , ojo suponiendo que me caigan dos spam nuevos los meto en la carpeta , hago el entrenamiento me diria : Learned tokens from 2 message(s) (816 message(s)
Yo hace... ¿años? que no entreno al filtro bayesiano. Lo entrené una vez (con miles -más de 2.000- de spam y unos mil de no spam) y de momento sparece que igue con la puntería fina :-) Saludos, -- Camaleón -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
El día 8 de octubre de 2009 00:55, Camaleón
Recuerda que necesita que le des ambos: mensajes de spam y mensajes que no consideras que no son spam (ham). Y de ambos necesita una buena cantidad (>500).
si claro , solo mande los de spam , pero siempre los hago ambos
De los correos que ya ha aprendido algo no los vuelve a analizar. Los puedes borrar (los mensajes), no hay problema. El archivo que necesita el SA es la base de datos bayesiana (bayes_toks).
si , ahorita ve que crecio a 3.5 MB porquito :(
Los correos que ya ha analizado, los omite.
perfecto eso queria saber
No, ojo, esa es la que usa para puntuar los mensajes, no la borres salvo que quieras empezar el entrenamiento desde cero :-(
oki oki
Yo hace... ¿años? que no entreno al filtro bayesiano. Lo entrené una vez (con miles -más de 2.000- de spam y unos mil de no spam) y de momento sparece que igue con la puntería fina :-)
super ... veré el mio como va ..
Saludos,
= -- rickygm http://gnuforever.homelinux.com -- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org
participants (2)
-
Camaleón
-
troxlinux