Am 22.09.2016 um 10:33 schrieb Handwerker, Jan (IMK):
Liebe Liste,
manchmal bekomme ich pdf-Dateien zugemailt, die ganz offensichtlich eingescannte Dokumente enthalten (man sieht den Briefbogen, Unterschriften und Stempel) und trotzdem kann ich nach Texten suchen und Text markieren. Offensichtlich ist eine OCR über den Scan gegangen und hat den (ASCII-)Text mit der Grafik verknüpft.
Ich finde das absolut genial.
Nun wüsste ich natürlich gerne, ob ich das mit meinen eigenen Scans auch irgendwie bewerkstelligen kann. Gibt es ein Tool, dem ich eine reine Grafik-pdf Datei geben kann und das mir dann eine verknüpfte Text- und Grafik-pdf Datei ausspuckt? Eine reine OCR meine ich nicht.
Herzliche Grüße Jan
Es könnte aber auch genau umgekehrt sein. Man nehme, z.B. in LibreOffice, ein leeres Textdokument, plaziere "Briefbogen, Unterschriften und Stempel", wie Du es nennst, als grafische Images. Dann den Text schreiben und das ganze als PDF exportieren. Schon hast Du genau das was Du manchmal zugemailt bekommst. Text mit Bildern "gemischt". Habe vor einigen Jahren mal viele viele Stunden mit OCR "verbraten". Es war nur frustrierend. Vielleicht ist es ja jetzt besser, aber damals war absolut kein brauchbares Ergebnis zu bekommen. Grüße, Norbert -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org