Mailinglist Archive: opensuse-es (1502 mails)

< Previous Next >
Re: [opensuse-es] ocr y pdf
  • From: "Carlos E. R." <robin.listas@xxxxxxxxxxxxxx>
  • Date: Mon, 27 Oct 2008 20:29:02 +0100 (CET)
  • Message-id: <alpine.LSU.2.00.0810272005000.4842@xxxxxxxxxxxxxxxx>
-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

Content-ID: <alpine.LSU.2.00.0810272008010.4842@xxxxxxxxxxxxxxxx>


El 2008-10-27 a las 19:59 +0100, Nacho escribió:

Hola a todos,
mi pregunta es la siguiente, conoce alguien algun buen programa de ocr
para archivos pdf...

Bueno, y sobre linux, no, no conozco ninguno. Ni para PDF ni nada. Es un area pobre.

Y por cierto, los textos escaneados funcionan mejor con el formato djvu
que sobre pdf. Pero dejavú es casi desconocido (viene en la distro).

Está el "gocr", pero yo nunca lo he conseguido hacer funcionar bien. Y una vez la distro trajo uno propietario que iba algo, en kde.

Ah, buscando veo que la distro trae uno que no me suena: ocrad-0.17-43.1

GNU Ocrad is an OCR (Optical Character Recognition) program implemented
as a filter and based on a feature extraction method. It reads a bitmap
image in PBM format and outputs text in the ISO-8859-1 (Latin-1)
charset. It can be used as a stand-alone console application or as a
back-end to other programs.

gocr is another interesting command line OCR tool. Both can be plugged
into Kooka, the KDE scan and OCR program.


Lo instalare. El autor tiene nombre español.

[...]

anda, si lo tengo instalado... Lo pruebo.

[...]


El resultado es simplemente _horrible_:

, \ , R,`\'\(\hh\\\\\WW\ ww m \ \ ,,
,,, '
'`
' ,

, a Meac Row '


' herf uaPr' mout reQaind oen for arm írmrme

' tnal lhmer, u aoth ete firín oxdew o' '

' myhg et íuPa Prefrom. Qn tn rm

Aod llle, hre úrrímg rm r, a mu4t| \

' rooDSing oun, ere of pur| eaks through hP

osphere rdí&tg aay framl RdolOh yP's ck B '



Compara con lo que hizo el windows con el mismo párrafo hace años (es que lo guardo para comparar, para ver si el OCR alguna vez funciona en linux):


Robot AL-76 Goes Astray 91 bottom of the trees; at the end he was swinging wildly from one of the topmost branches. The same impulse that had driven the posse horizontally had driven him vertically.
As to how he had covered the fifty feet from roots to top - whether he had climbed, jumped, or flown - he did not know, and he didn't give a particle of never-mind.





- -- Saludos
Carlos E.R.
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v2.0.9 (GNU/Linux)

iEYEARECAAYFAkkGFoIACgkQtTMYHG2NR9XYhACfb5R2o5dX28bPJ6uEbHvQ/gKb
sukAnR+sl5/xYp29edP4M6yD6tGZmohd
=669f
-----END PGP SIGNATURE-----
< Previous Next >
Follow Ups
References