Re: [suse-linux-s] Servidor de Aplicacion
Hola :) Juan Gustavo Fogelman wrote:
no hay alguna forma de mandarlo a una impresora de imagenes (algun jpg o algo) y entubarlo a un ocr? para evitar la impresion en papel y hacerlo mas "automatico"
La verdad es que no lo he probado 0:) Es una idea buena: ecológico (ya está bien de deforestación), ahorras papel y tinta, es más cómodo, ... Si tengo tiempo lo pruebo. Lo malo es si no tienes ambas cosas (el PDF y el scanner) ... bueno, seguro que hay un USB, correo electrónico, ... para que te lo puedas llevar a un equipo con scanner ;) Rafa
----- Original Message ----- From: "Rafa Grimán"
Cc: "Lista de Suse Linux Español" Sent: Monday, December 12, 2005 1:58 PM Subject: Re: [suse-linux-s] Servidor de Aplicacion Hola :)
da al traste con inversiones en features estupidas. En cuanto a lo de abrir un fichero NO cifrado y extraer su contenido, que te has creido tu eso, se trata de conseguir la informacion no su representacion en pantalla de forma "bonita".
Yo no se como lo hacen en el acrobat 7, si es mediante cifrado o no. Lo que si se es que al abrir ciertos ficheros la función del menú de "grabar" el fichero actual (con otro nombre, se supone) desaparece. Te vas a "propiedades" y ves que es que no tienes permiso para grabarlo, pero si para leerlo.
Eso existe, y en linux. Está ahí. Ignoro si esos ficheros se pueden abrir con otros programas como xpdf.
Este fin de semana estuve leyendo un PDF de esos que comentas y el KPDF sí lo abre, pdf2ps lo transfroma a ps y ps2pdf (probé los 3 ó 4 que vienen en SUSE 10) lo transforma de ps a pdf.
En NINGUNO de los casos pude copiar y pegar texto del documento. No con el propio Acrobat Reader. Se copiaba, pero al pegar ... sólo aparecía basura.
Aquí en el curro lo he probado con MS-Windows XP y el Acrobat Reader (versión 7 en ambos casos: Linux y MS-Windows) y TAMPOCO me deja copiar texto ...
No sé cómo lo harán, pero lo hacen. Lo que dice Jose María es verdad: un sw para capturar pantallas (shutterbug, ksnapshot, ...) es útil ... pero pesado porque luego hay que echar mano de la "tecnología digital" y escribirse "amanuense" el texto. También lo puedes imprimir y pasar un OCR ;)
Rafa
-- Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia , 120 - Planta Baja 28003 Madrid, Spain Tel: +34 91 3984200 Fax: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com
lo que yo proponia lo hice hace mucho en windows
en vez de imprimir en papel, lo imprimia en archivos jpg (lo guarda en jpg)
luego desde el ocr lo tomaba y escaneaba la imagen, no el papel
luego el ocr lo mandaba a un txt o lo que sea
en linux debe poder hacerce y de manera mas automatica, desde linea de
comandos
no creo que sea necesario un scanner para usar ocr
aunque nunca lo usé porque no lo he necesitado.
----- Original Message -----
From: "Rafa Grimán"
no hay alguna forma de mandarlo a una impresora de imagenes (algun jpg o algo) y entubarlo a un ocr? para evitar la impresion en papel y hacerlo mas "automatico"
La verdad es que no lo he probado 0:) Es una idea buena: ecológico (ya está bien de deforestación), ahorras papel y tinta, es más cómodo, ... Si tengo tiempo lo pruebo. Lo malo es si no tienes ambas cosas (el PDF y el scanner) ... bueno, seguro que hay un USB, correo electrónico, ... para que te lo puedas llevar a un equipo con scanner ;) Rafa
----- Original Message ----- From: "Rafa Grimán"
Cc: "Lista de Suse Linux Español" Sent: Monday, December 12, 2005 1:58 PM Subject: Re: [suse-linux-s] Servidor de Aplicacion Hola :)
da al traste con inversiones en features estupidas. En cuanto a lo de abrir un fichero NO cifrado y extraer su contenido, que te has creido tu eso, se trata de conseguir la informacion no su representacion en pantalla de forma "bonita".
Yo no se como lo hacen en el acrobat 7, si es mediante cifrado o no. Lo que si se es que al abrir ciertos ficheros la función del menú de "grabar" el fichero actual (con otro nombre, se supone) desaparece. Te vas a "propiedades" y ves que es que no tienes permiso para grabarlo, pero si para leerlo.
Eso existe, y en linux. Está ahí. Ignoro si esos ficheros se pueden abrir con otros programas como xpdf.
Este fin de semana estuve leyendo un PDF de esos que comentas y el KPDF sí lo abre, pdf2ps lo transfroma a ps y ps2pdf (probé los 3 ó 4 que vienen en SUSE 10) lo transforma de ps a pdf.
En NINGUNO de los casos pude copiar y pegar texto del documento. No con el propio Acrobat Reader. Se copiaba, pero al pegar ... sólo aparecía basura.
Aquí en el curro lo he probado con MS-Windows XP y el Acrobat Reader (versión 7 en ambos casos: Linux y MS-Windows) y TAMPOCO me deja copiar texto ...
No sé cómo lo harán, pero lo hacen. Lo que dice Jose María es verdad: un sw para capturar pantallas (shutterbug, ksnapshot, ...) es útil ... pero pesado porque luego hay que echar mano de la "tecnología digital" y escribirse "amanuense" el texto. También lo puedes imprimir y pasar un OCR ;)
Rafa
-- Rafa Grimán Systems Engineer Silicon Graphics Spain Santa Engracia , 120 - Planta Baja 28003 Madrid, Spain Tel: +34 91 3984200 Fax: +34 91 3984201 Móvil: +34 628 117 940 http://www.sgi.com -- Para dar de baja la suscripción, mande un mensaje a: suse-linux-s-unsubscribe@suse.com Para obtener el resto de direcciones-comando, mande un mensaje a: suse-linux-s-help@suse.com __________ Información de NOD32, revisión 1.1319 (20051212) __________ Este mensaje ha sido analizado con NOD32 antivirus system http://www.nod32.com
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2005-12-12 a las 14:37 -0300, Juan Gustavo Fogelman escribió:
lo que yo proponia lo hice hace mucho en windows en vez de imprimir en papel, lo imprimia en archivos jpg (lo guarda en jpg) luego desde el ocr lo tomaba y escaneaba la imagen, no el papel luego el ocr lo mandaba a un txt o lo que sea
Existen fuentes de letra anti-ocr. No las he tenido en mis manos, pero me han dicho que existen, el documento en papel no se puede escanear y pasar a texto, no funciona. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFDnc7qtTMYHG2NR9URAhLbAJ9/xcniAIa+yc1qpeWQChEXPP5cQACeLAcN CFUb/HAKjtg1UaeUoJBg7GQ= =Ia29 -----END PGP SIGNATURE-----
No se si me inmiscuyo, pero, ¿qué ocr funciona bien?¿El de kooka funciona? A mi no me reconoce nada. Gracias de antemano. -- Vicente González Valle Profesor de secundaria de Matemáticas Badajoz (España) Suse 9.3 - Kde 3.5.0
-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2005-12-12 a las 22:22 +0100, Vicente González Valle escribió:
No se si me inmiscuyo, pero, ¿qué ocr funciona bien?¿El de kooka funciona? A mi no me reconoce nada.
Hace tiempo que no pruebo, pero los que he probado en linux me han ido fatal. Hace un par de versiones probé uno comercial que venía con el kooka, pero ahora no me funciona: Kooka supports OCR (Optical Character Recognition) on your scans. The SuSE version of Kooka was linked with KADMOS, a commercial ICR/OCR library that gives best detection results for different languages. sin embargo, me da error, el kooka dice que "el motor de kadmos no está disponible en esta versión de Kooka". Fale. :-/ Así que le he dicho que use el ocrad, y el resultado es totalmente inutil: observa el resultado: | INUN ' | | | h Muc f h hnur ' | | | Whw w fwu h kh wh n hm ml úar `n | h m fir h hnuw hc Nly n h wr h R | rh f houh n& hy wr w hm r muh | wm Ww n h rk o hm orwanw hm | hrm f muk kna hy n fr rm* u h w | u fr on wW' hy n ny M p o Su | fw r w rw hrkk fr MR omrrp Luego lo he configurado para que use gocr, lo he reiniciado, y sigue usando ocrad. Así que lo he arrancado como aplicación independiente (gtk-ocr), le he dado a escanear el mismo fichero (out.png), y me ha escupido este error: cer@nimrodel:~> sh: /usr/bin/goca: No such file or directory Ese tal "goca" no existe en el dvd. Me encanta el control de calidad de SuSE :-( Así que intento usar "gocr" directamente, es una aplicación de consola. la primera traba es que el fichero de entrada ha de ser en formatos "PNM, PGM, PBM, PPM, PCX - de cosas modernas como png, nada. Así que lo convierto y lo analizo: cer@nimrodel:~/tmp> convert out.png out.pnm cer@nimrodel:~/tmp> gocr -i out.pnm -o out-gocr.txt El resultado es medianamente aceptable: | AINULTNDAL_ | | | | The Music or the Ainur ' | | | | | There was Eru, the One, who in Arda is called Ilúvatar; and | he made _rst the Aìnur, the Holy Ones, th_i t were the off- | spring of hìs thought, and they were wìth hím berore aught | elsewas made. An_ he spoke to them, propounding to them | En su dia hice la prueba de ese mismo fichero desde windows, pero no lo encuentro para comparar, otro dia lo hago de nuevo. En windows he pasado articulos de periodico y salen decentes, hasta me saca la fuente de letra y formato en el word. La pega es que el $%&%" no admite ficheros, tiene que escanear el fichero cada vez: es una manera de blindaje comercial, no te puedes llevar el programa a otro ordenador porque sólo funciona con el escanner que compré. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFDnhm3tTMYHG2NR9URAvMeAJwI4PKGb6EO1ARrcIFykTQUnAVD9wCdFaCV 08CU7nM8J9DoM076GOjWV3k= =4cab -----END PGP SIGNATURE-----
participants (4)
-
Carlos E. R.
-
Juan Gustavo Fogelman
-
Rafa Grimán
-
Vicente González Valle