-----BEGIN PGP SIGNED MESSAGE----- Hash: SHA1 El 2005-12-12 a las 18:03 -0300, Victor Hugo dos Santos escribió:
las aplicaciones OCR trabajan con imagen...
Je, la que vino con mi escaner, para windows, es incapaz de reconocer una imagen, tiene que explorar la imagen desde el escanner cada una de las veces: para que sea inutil copiara si no tienes el escanner.
le comento que estaba pesquisando como montar una suite de aplicaciones para scannear y guardar documentos (facturas/boletas entre otros)... los documentos después de scaneados eran guardados en JPG y con un software de OCR creaba un archivo de texto con su contenido.. que despues lo indexaba para busquedas...
Hay un formato que resulta ideal para guardar documentos escaneados, que es el djvu. Comprime mejor que el jpg o el pdf, y las letras tienen definición, sin artefactos. Además, puedes guardar el texto ascii en el mismo fichero. Tienes el rpm en la distro, djvulibre. La pega es que el sistema para generarlos, en su versión libre, es bastante "ortopédico", y que no tiene soporte desde programas como el gimp o el OOo, aunque si en el mozilla y el iexplorer, con el plugin adecuado. Más info en http://djvu.sourceforge.net. Y también hay aplicaciones comerciales, que tengo entendido son más sencillas de manejar para generarlos. - -- Saludos Carlos Robinson -----BEGIN PGP SIGNATURE----- Version: GnuPG v1.4.0 (GNU/Linux) Comment: Made with pgp4pine 1.76 iD8DBQFDniBxtTMYHG2NR9URAqZpAJ0dH7gjmr01lH1E3X5ivEZtXJbMhQCfYCna zWhAqA6zKEU/hUb2VQi6Pr0= =zx3A -----END PGP SIGNATURE-----