[suse-linux-s] Alucino con el spam... [+/-OT]
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 Hola: Estos espammers cada vez son más listos. Vengo observando un montón de spam que no contiene texto, sólo una imagen en gif o jpg con el texto de su anuncio. Pero he visto también otros que, en vez de una imagen, traen una docena, que hay que componer como un mosaico para poder leerlos. El único motivo que se me ocurre para hacer eso es que haya por ahí programas antispam capaces de leer el texto contenido en una imagen gráfica... desde luego, nuestro spamassassin no es capaz de hacer eso. ¿Estoy en lo cierto, hay programas antispam con esa capacidad? Afortunadamente, el SA me los está cazando, pero no faltará mucho para que se escapen, me temo. ]content analysis details: (12.9 points, 5.0 required) ] ] pts rule name description ]---- ---------------------- -------------------------------------------------- ] 2.9 FROM_LOCAL_NOVOWEL From: localpart has series of non-vowel letters ] 1.1 EXTRA_MPART_TYPE Header has extraneous Content-type:...type= entry ] 0.1 HTML_90_100 BODY: Message is 90% to 100% HTML ] 1.1 MIME_HTML_MOSTLY BODY: Multipart message mostly text/html MIME ] 0.2 HTML_MESSAGE BODY: HTML included in message ] 5.0 BAYES_99 BODY: Bayesian spam probability is 99 to 100% ] [score: 1.0000] ] 0.5 HTML_IMAGE_ONLY_16 BODY: HTML: images with 1200-1600 bytes of words ] 1.0 RCVD_IN_SORBS_DUL RBL: SORBS: sent directly from dynamic IP address ] [80.141.57.154 listed in dnsbl.sorbs.net] ] 1.0 RCVD_IN_NJABL_DUL RBL: NJABL: dialup sender did non-local SMTP ] [80.141.57.154 listed in combined.njabl.org] - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFElnIOtTMYHG2NR9URAuc4AJ0ZaUd8HAHVBjg45u2BjXFnJtrcQQCgkKDC 2HjImDSBTgXqjVIPGoGOH7I= =R05U -----END PGP SIGNATURE----- -- Para dar de baja la suscripci�n, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
El 19/06/2006 11:44:45 Carlos E. R. escribió: robin.listas> Vengo observando un montón de spam que no contiene texto, sólo una imagen robin.listas> en gif o jpg con el texto de su anuncio. Pero he visto también otros que, robin.listas> en vez de una imagen, traen una docena, que hay que componer como un robin.listas> mosaico para poder leerlos. El único motivo que se me ocurre para hacer robin.listas> eso es que haya por ahí programas antispam capaces de leer el texto robin.listas> contenido en una imagen gráfica... desde luego, nuestro spamassassin no es robin.listas> capaz de hacer eso. ¿Estoy en lo cierto, hay programas antispam con esa robin.listas> capacidad? En principio cualquier programa OCR es capaz de leer un texto desde un fichero con formato de imagen, por lo que imagino que el tema no es tan difícil. :-) Es más existen algunos OCR que funcionan como "applets" de Java, como por ejemplo http://www.javaocr.com/. robin.listas> Afortunadamente, el SA me los está cazando, pero no faltará mucho para que robin.listas> se escapen, me temo. Yo también lo había detectado. Empezaron con un solo fichero en formato GIF y ahora van a por el puzzle. De momento la solución más sencilla está en que, CASI todos vienen con el "body" del mensaje vacío, por lo que la regla para mandarlos a /dev/null es sencilla. :-) -- Saludos, Josep M. Queralt
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-06-19 a las 16:00 +0200, Josep M. Queralt escribió:
En principio cualquier programa OCR es capaz de leer un texto desde un fichero con formato de imagen, por lo que imagino que el tema no es tan difícil. :-)
Computacionalmente es pesado, y los que he probado en linux van bastante mal. Igual han mejorado. O hay alguna manera de saber que es una foto con texto, sin decodificarlo. :-?
Es más existen algunos OCR que funcionan como "applets" de Java, como por ejemplo http://www.javaocr.com/.
¡Anda! :-o
robin.listas> Afortunadamente, el SA me los está cazando, pero no faltará mucho para que robin.listas> se escapen, me temo.
Yo también lo había detectado. Empezaron con un solo fichero en formato GIF y ahora van a por el puzzle.
De momento la solución más sencilla está en que, CASI todos vienen con el "body" del mensaje vacío, por lo que la regla para mandarlos a /dev/null es sencilla. :-)
Si... pero tengo algún amigo que me envia fotos sin texto. O ficheros anexados del word en el outlook sin una sola palabra en el email. Es bastante habitual. Y otros spammers te meten un trozo de una novela en el texto, que no tiene nada que ver con el anuncio. Es más, el texto no se ve. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFElrCAtTMYHG2NR9URAvcdAJ91q85M1Hyk+HO1iMGvhS3ldMabiACfUSBm pR0R31ZH+OJj+BuxVJFYAgA= =6sYF -----END PGP SIGNATURE----- -- Para dar de baja la suscripci�n, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
El 19/06/2006 16:11:00 Carlos E. R. escribió: robin.listas> robin.listas> O hay alguna manera de saber que es una foto con texto, sin decodificarlo. :-? Si, claro, al igual que si fuera un ejecutable o cualquier otro formato "civilizado". La cabecera del fichero define que tipo de imagen es (gif, jpg...) así como otras características del fichero. Como curiosidad, si la imagen ha sido tratada con "Photoshop" este añade su (c) y el nº de licencia del programa, pero otros muchos programas de gráficos añaden también sus propias líneas robin.listas> robin.listas> Y otros spammers te meten un trozo de una novela en el texto, que no tiene robin.listas> nada que ver con el anuncio. Es más, el texto no se ve. Si claro, por eso puse el "casi" en mayúsculas .... Algo tiene que haber, ya que en muchos sitios para efectuar un "alta" o una consulta te obligan a teclear una serie de números y/o letras que ellos te enseñan mediante una imagen, a veces difíciles de distinguir, para asegurarse de que el consultante pertenece a la especie humana. -- Saludos, Josep M. Queralt
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-06-19 a las 16:26 +0200, Josep M. Queralt escribió:
robin.listas> robin.listas> O hay alguna manera de saber que es una foto con texto, robin.listas> sin decodificarlo. :-?
Si, claro, al igual que si fuera un ejecutable o cualquier otro formato "civilizado". La cabecera del fichero define que tipo de imagen es (gif, jpg...) así como otras características del fichero. Como curiosidad, si la imagen ha sido tratada con "Photoshop" este añade su (c) y el nº de licencia del programa, pero otros muchos programas de gráficos añaden también sus propias líneas
Es verdad, pero acabo de mirar una de las imagenes y no tiene nada.
Algo tiene que haber, ya que en muchos sitios para efectuar un "alta" o una consulta te obligan a teclear una serie de números y/o letras que ellos te enseñan mediante una imagen, a veces difíciles de distinguir, para asegurarse de que el consultante pertenece a la especie humana.
Si, lo he visto. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFEluAEtTMYHG2NR9URAk/7AJ9x4TFxL+31dosX2f7X2+Ie36vWewCfW2cC gxtMVg0Llv61L3ZRpNXrerk= =JJ0c -----END PGP SIGNATURE----- -- Para dar de baja la suscripci�n, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
El 19/06/06, Josep M. Queralt
El 19/06/2006 16:11:00 Carlos E. R. escribió:
Algo tiene que haber, ya que en muchos sitios para efectuar un "alta" o una consulta te obligan a teclear una serie de números y/o letras que ellos te enseñan mediante una imagen, a veces difíciles de distinguir, para asegurarse de que el consultante pertenece a la especie humana.
Si, eso se le llama Captcha http://en.wikipedia.org/wiki/Captcha Lo utiliza por ejemplo Passport Network (Hotmail, etc...) Roberto
El 19/06/06, Carlos E. R.
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hola:
Estos espammers cada vez son más listos.
ley de murph !!! ;-)
Vengo observando un montón de spam que no contiene texto, sólo una imagen en gif o jpg con el texto de su anuncio. Pero he visto también otros que, en vez de una imagen, traen una docena, que hay que componer como un mosaico para poder leerlos.
esto es un poco antiguol... talvez antes no te enviaban asi por que tenias conexcion por telefono y no banda ancha !!! :D seran capaces los spammers de saber esto ??? seran algun don extrasensorial ??? hehehe
El único motivo que se me ocurre para hacer eso es que haya por ahí programas antispam capaces de leer el texto contenido en una imagen gráfica...
exactamente ... como la mayoria de los programas anti-spam trabajan basados en patrones, no pueden comparar el texto de la imagen con los patrones de su bd. :(
desde luego, nuestro spamassassin no es capaz de hacer eso.
mmm.. no puede leer los texto de los mensajes.. mmm .. y "creo" que "nunca" lo sera.. es un trabajo muy duro reconocer un OCR al 100%.. pero por otro lado (vea vuestro propio ejemplo) existe la posibilidad de analizar el mensaje y averiguar que hay adentro y se es puramente imagen entonces agregar una puntuacion alta al correo... el malo es que se vuestra polola te envia una foto (por telefono, p.ej.) que saco en su ultimo paseo a la sauna/spa nudista, entonces llegara mas imagen que texto y posiblemente sera considerada spam y sera (infelizmente ??? ) enviado a /dev/null !!! :(
¿Estoy en lo cierto, hay programas antispam con esa capacidad?
no creo. al menos por el momento !!! salu2 y buen inicio de semana a todos. -- -- Victor Hugo dos Santos Linux Counter #224399 -- Para dar de baja la suscripción, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-06-19 a las 10:10 -0400, Victor Hugo dos Santos escribió:
esto es un poco antiguol... talvez antes no te enviaban asi por que tenias conexcion por telefono y no banda ancha !!! :D seran capaces los spammers de saber esto ??? seran algun don extrasensorial ??? hehehe
No, ya había recibido antes spam de varias docenas de K.
El único motivo que se me ocurre para hacer eso es que haya por ahí programas antispam capaces de leer el texto contenido en una imagen gráfica...
exactamente ... como la mayoria de los programas anti-spam trabajan basados en patrones, no pueden comparar el texto de la imagen con los patrones de su bd. :(
Claro. Pero descomponer el texto no en una imagen, sino en varias, y que para leerlo hay que poner las imagenes yustapuestas correctamente (cosa que debe hacer el contenido html del correo), pues es ir un paso más allá de simplemente enviar las fotos, como hacían antes. El unico sentido que le veo a eso es que alguien estaba aplicando OCR a las fotos. Y eso me sorprende. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFEluFNtTMYHG2NR9URAsSbAJ424KPXo8ksqOtfLRBHTj/jZDAjKACeKi9l 7iEmFgR+strPc0AM+NocboY= =fR0X -----END PGP SIGNATURE----- -- Para dar de baja la suscripci�n, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
El 19/06/06, Carlos E. R.
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
Hola:
Hola
Estos espammers cada vez son más listos.
Sip
Vengo observando un montón de spam que no contiene texto, sólo una imagen en gif o jpg con el texto de su anuncio. Pero he visto también otros que, en vez de una imagen, traen una docena, que hay que componer como un mosaico para poder leerlos. El único motivo que se me ocurre para hacer eso es que haya por ahí programas antispam capaces de leer el texto contenido en una imagen gráfica... desde luego, nuestro spamassassin no es capaz de hacer eso. ¿Estoy en lo cierto, hay programas antispam con esa capacidad?
Mira esto http://wiki.apache.org/spamassassin/OcrPlugin Roberto
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-06-20 a las 10:04 +0200, Roberto Pineda escribió:
Mira esto
¡Ondiá! :-O Bueno... necesita gocr, que a mi no me va bien. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFEl9fCtTMYHG2NR9URAtMxAJ0dTSFGQDnUEMmMdLlyJuR4RAMRQgCfQsST gboWMwfLsve7Bjp2QnLf8xY= =Lk2v -----END PGP SIGNATURE----- -- Para dar de baja la suscripci�n, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
Como veo que ahora se ha puesto de moda en la lista hablar de Spam,os pregunto. Donde puedo sacar un manual en condiciones para instalar, configurar, etc del spamassassin + Clam av. He leido que el simscam funciona de maravilla, si alguien me puede decir como instalarlo tambien se lo agradezco. El servidor de correo es Qmail, si necesitais mas datos os los mando. Un saludo To~o -- Para dar de baja la suscripción, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2006-06-20 a las 13:59 +0200, Antonio Moreno escribió:
Donde puedo sacar un manual en condiciones para instalar, configurar, etc del spamassassin + Clam av.
En inglés, supongo que mirando en su página web. En SuSE lo habitual es usar el amavis-new como envolvente de ambos. Como se le pone al qmail, ni idea. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFEl+jJtTMYHG2NR9URAg0pAJ47t+uhxeaOFJcVv62zE6gCg7nKlgCcCZg3 nu1Xtke+wBVBbnrc+30n+HU= =QNcS -----END PGP SIGNATURE----- -- Para dar de baja la suscripci�n, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
El 20/06/06, Carlos E. R.
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1
El 2006-06-20 a las 10:04 +0200, Roberto Pineda escribió:
Mira esto
¡Ondiá! :-O
Bueno... necesita gocr, que a mi no me va bien.
mmmm.. hace un par de anos buscaba una solucion de digitalizacion de documentos y me depare con la tarea de probar varios OCRs y el que mejor resultado tuvo, fue justamente gocr !!!! :) salu2 -- -- Victor Hugo dos Santos Linux Counter #224399 -- Para dar de baja la suscripción, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com
participants (5)
-
Antonio Moreno
-
Carlos E. R.
-
Josep M. Queralt
-
Roberto Pineda
-
Victor Hugo dos Santos