El Monday 27 October 2008 20:29:02 Carlos E. R. escribió:
Está el "gocr", pero yo nunca lo he conseguido hacer funcionar bien.
Yo tampoco
Ah, buscando veo que la distro trae uno que no me suena: ocrad-0.17-43.1
Algo mejor, pero de acertar un 5% (gocr) a un 10% (ocrad) aproximadamente...
tampoco es para echar cohetes.
Tambien he probado Tesseract. Hay una serie de plantillas con un texto
prefijado en multiples idiomas (incluido castellano) y diferentes fuentes
para poder "entrenarlo".
El resultado es mucho mejor, pero el ratio de aciertos lo estimo como mucho en
un 35% y dependes de que el texto a reconocer este en una de las fuentes
entrenadas para que mejore el resultado.
El tesseract se puede combinar con ocropus y dicen (no lo he probado) que asi
mejora "MUCHO". Tienes ambos en un repositorio (aunque las versiones no son
las ultimas):
http://download.opensuse.org/repositories/home:/jnweiger/openSUSE_11.0/
Suerte. Yo me cansé de hacer pruebas, pero es cierto que lo hice solo por
curiosear.
Alfredo
--
"Una vez que se descarta lo imposible, lo que queda es la verdad por
improbable que parezca" (Sherlock Holmes