... und wie wird die bpm-Datei dann weiterverarbeitet? ocrad verlangt eine pbm-Datei ... mfG Bernward Otto Heiner Kuhlmann schrieb:
Am Mittwoch, 22. Februar 2006 15:33 schrieb Bernward Otto - SuSE-Linux-Liste:
... die Datei wird mit der Scan-Einheit eines Kopierers erzeugt, der automatisch das Scanergebnis in eine TIFF- oder PDF-Datei umwandelt (die PDF-Datei enthält dabei nicht den Text!) und die so entstandene Datei in einem Linux-Server-Verzeichnis ablegt. Ich habe jetzt testweise eine solche TIFF-Datei (Originaltextausdruck Schriftart Arial 12-Punkt, mit 600dpi eingescant) mit
convert datei.tif datei.pgm
ins pgm-Format umgewandelt und anschließend mit
pgmtopbm datei.pgm > datei.pbm
eine pbm-Datei erzeugt, die ich wiederum mit
cat datei.pbm | ocrad -v -o datei.txt
in eine Textdatei umgewandelt habe. Das Ergebnis ist allerdings nicht zu gebrauchen. Der Text läßt sich nur erahnen ...
Irgendwelche anderen Ideen?
convert datei.tif datei.bpm
ginge auch. Das Problem scheint aber die Konvertierung eines farbigen Bildes in ein schwarz-weißes zu sein. Eventuell helfen Funktionen (Optionen) von convert: man convert und man ImageMagick.
Hast Du Dir das Bild datei.bpm mal angesehen?
Heiner