Am Donnerstag, 1. April 2004 20:28 schrieb Torsten Hallmann:
Am Fr, 2004-03-26 um 16.42 schrieb Heiner Gewiehs:
die Texterkennung mit kooka stellt mich vor ziemlich blöde Schwierigkeiten.
Hallo Heiner,
Ich bin mir nach deiner Beschreibung nicht so ganz sicher ob es wirklich ein OCR Problem ist.
Das Beispiel: ich will ein Textfeld aus der Seite einer Illustrierten erkennen lassen, um es zu speichern und zu bearbeiten Die Vorschau zeigt mir die ganze Seite, den zweispaltigen Text
Du hast also eine aktuelle "Vorschau" erstellt.
markiere ich mit dem Hilfsrahmen, das Programm zeigt mir jetzt eine markierte Größe des Objektes von 92 mm x 76 mm an, bei einer Dateigröße von 231,6 KB an.
In der Vorschau markierst Du nun den Bereich, welchen Du mit Klick auf "Scan" endgültig einscannen möchtest. Ich weiß nicht wie die Größenangabe ermittelt wird, da Du zu diesem Zeitpunkt noch nicht das Dateiformat ausgewählt wurde (das passiert erst nach den Scan).
Nach endgültigem Einlesen habe ich in der Galerie eine JPEG- Datei von 1125 x 218.
Die Pixel*Pixel Größe ermittelt sich aus der Auflösung, welche Du für den Scan verwendet hast. Allerdings wird anhand dieser beiden Werte schon deutlich, das hier was aus dem Ruder läuft, denn daß Verhältnis von 92x76 spiegelt sich nicht in den Pixeln wieder.
Es stellt sich die folgenden Fragen:
Hallo Torsten,
- Welchen Scanner verwendest Du? Microtek ScanMaker 330 als SCSI- Scanner
- Welche Auflösung verwendest Du? bei OCR- Versuchen 300 dpi
- Hast Du das Problem bei einer anderen Auflösung auch? ja, hab ich! Wähl ich die Auflösung niedriger ändert sich nur der erste Wert: also, bei obiger Größe von z.B. 1125 x 218 wird dann vielleicht 750 x 218 aber nur ganz grob als Anhalt, habe die genauen Daten nicht im Kopf.
- Welches SANE-Backend verwendest Du? Die Frage war interessant! Habe da ein bischen rumgespielt und bin von der Einstellung "generic und microtek2" auf Plustek gesprungen und siehe da, das System behielt die Scanner - Einstellungen und hat sie nach Neustart nicht wieder herausgeschmissen!
Das Ergebnis beim Scannen hat sich allerdings nicht geändert. Nur, was ich bei dem ganzen Versuchen und Probieren herausfand ist, das XSANE auch die Möglichkeit mit OCR bietet. XSANE verstaucht nichts und die Erkennung ist eigentlich ganz akzeptabel. Auf jeden Fall vielen Dank für Deine Mühe, ein schönes Wochenende Heiner -- ************************* Heiner Gewiehs Marketing-Fachkaufmann 63868 Gro0wallstadt heiner.gewiehs@gewiehs.de *************************