Mailinglist Archive: opensuse-de (1438 mails)

< Previous Next >
Re: OCR in Gang setzen
Hallo,

helfen kann ich Dir leider nicht. Aber passen zum Thema:

Ich versuche mich gerade auch an OCR. An gocr hatte ich mich vor längerer Zeit mal probiert und es dann wieder aufgegeben. Ich fand es zu umständlich und die Ergebnisse waren - jedenfalls bei mir - nicht berauschend.

Ich bin dann später eher durch Zufall auf cuneiform gestoßen. Zwar muss man auch hier die Bilder am besten ins bmp-Format bringen (jgeg ist wirklich kein gutes Format für OCR schon wegen der Artefakte). Aber das Umwandeln ist dank convert kein Problem und lässt sich in einem Skript machen. Von den ersten Ergebnissen war ich sehr beeindruckt. Wir archivieren unsere Schreiben hier im verlustfreien und vor allem offenen png-Format. Da die Bilder recht groß werden, haben sie in Anlehnung an die immer noch übliche Fax-Auflösung nur 200 dpi in X- und Y-Richtung bei teilweise sehr kleiner Schrift. Ich habe einfach mit diesen Bildern begonnen.

Dennoch fand ich die Ergebnisse beeindruckend. Es gibt - so nebenbei - im Netz auch ein schönes howto, wie man z.B. sog. Sandwich-pdf damit erstellen kann:
http://www.auxnet.de/blog/blog-post/2009/04/02/cuneiform-und-hocr2pdf-unter-ubuntulinux-installieren-und-einsetzen.html

Wenn Du die Bilder nicht neu einscannen kannst und womöglich nur als jpeg hast, dann dürfte das schwierig werden.

Gruß, Alex
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+unsubscribe@xxxxxxxxxxxx
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@xxxxxxxxxxxx

< Previous Next >