Re: Texterkennung in pdf-Datei

22 Sep 2016

      Am 22.09.2016 um 10:33 schrieb Handwerker, Jan (IMK):
...
Liebe Liste,
manchmal bekomme ich pdf-Dateien zugemailt, die ganz offensichtlich
eingescannte Dokumente enthalten (man sieht den Briefbogen,
Unterschriften und Stempel) und trotzdem kann ich nach Texten suchen
und Text markieren. Offensichtlich ist eine OCR über den Scan
gegangen und hat den (ASCII-)Text mit der Grafik verknüpft.
Ich finde das absolut genial.
Nun wüsste ich natürlich gerne, ob ich das mit meinen eigenen Scans
auch irgendwie bewerkstelligen kann. Gibt es ein Tool, dem ich eine
reine Grafik-pdf Datei geben kann und das mir dann eine verknüpfte
Text- und Grafik-pdf Datei ausspuckt? Eine reine OCR meine ich nicht.
Herzliche Grüße
Jan
Es könnte aber auch genau umgekehrt sein.

Man nehme, z.B. in LibreOffice, ein leeres Textdokument, plaziere 
"Briefbogen, Unterschriften und Stempel", wie Du es nennst, als 
grafische Images. Dann den Text schreiben und das ganze als PDF exportieren.

Schon hast Du genau das was Du manchmal zugemailt bekommst. Text mit 
Bildern "gemischt".

Habe vor einigen Jahren mal viele viele Stunden mit OCR "verbraten". Es 
war nur frustrierend.
Vielleicht ist es ja jetzt besser, aber damals war absolut kein 
brauchbares Ergebnis zu bekommen.

Grüße,
Norbert

-- 
Um die Liste abzubestellen, schicken Sie eine Mail an:
    opensuse-de+unsubscribe@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+owner@opensuse.org

Re: Texterkennung in pdf-Datei

Norbert Zawodsky