El 13/09/07, miguel gmail escribió:
Es emiratos - Abu Dhabi (que todo lo queréis saber :P)
Es que el escenario que propones es un poco "peculiar", por eso :-).
El problema de externalizar el escaneado es que NO se pueden sacar los documentos del edificio donde están. De esto me acabo de enterar.
:-O :-O :-O Al menos sí podrás alquilar el equipo por tiempo ¿no? Al final te va a tocar sub-sub-sub contratar los servicios de digitalización de Google X-)
Ni hablar. Los traductores son lo suficientemente malos como para fiarme de mi ingles, sobre un texto mal traducido, para deducir que el OCR se ha hecho mal.
Miguel, el proceso de escaneo + ocr es, básicamente, poner el original (si son hojas sueltas se puede automatizar), escanear con el programa a resolución alta para texto -y en árabe supongo que mayor aún-, seleccionar el área de escaneo (por lo general toda la superficie), y guardar el resultado en formato editable (que para eso es ocr) como texto plano, xml, pdf o similar, no sé si djvu es editable. Si la salida es un formato imagen (jpeg) el ocr no te hace ninguna función :-? Lo del traductor te hará falta para evaluar el contenido (la calidad) de la salida, es decir, comprobar que si en el original pone "casa" en el texto digitalizado no pone "pasa", por hace falta una persona que sepa árabe. Los ocr caseros fallan más que una escopeta de feria (en español y en inglés, en árabe supongo que más aún :-P) Saludos, -- Camaleón --------------------------------------------------------------------- Para dar de baja la suscripción, mande un mensaje a: opensuse-es+unsubscribe@opensuse.org Para obtener el resto de direcciones-comando, mande un mensaje a: opensuse-es+help@opensuse.org