
Am Dienstag, 8. Oktober 2013, 19:31:11 schrieb Heiner Kuhlmann:
On Tue, 08 Oct 2013 18:39:06 +0200
Herbert Albert <h.albert@odn.de> wrote:
Hallo,
durch den Artikel "PDF-Sandwich" in der aktuellen c't bin ich wieder mal auf das Thema OCR unter Linux gekommen.
Manche von den in dem Artikel erwähnten Programmen, z. B. gscan2pdf, verwende ich bereits. Doch wenn ich unter http://software.opensuse.org nach "tesseract" für mein OS 12.2 x86_64 suche, finde ich eine große Liste mit möglichen unstable packages: home:Lazy_Kent home:MasterPatricko:... home:Strahlex home:ailin_nemui:tes... home:cabelo:software home:frispete:testing home:gberh home:illuusio:gscan2... home:koprok home:vjt:ifad home:vodoo
Hallo Herbert,
bei mit arbeitet seit längerem unter openSUSE_12.2 tesseract 3.02.831-20.1
Repository openSUSE_12.2 for home:ailin_nemui:tesseract / tesseract
https://build.opensuse.org/package/binaries?package=tesseract&project=home%3 Aailin_nemui%3Atesseract&repository=openSUSE_12.2
http://download.opensuse.org/repositories/home:/ailin_nemui:/tesseract/openS USE_12.2/
Ich habe auch Gimagereader getestet aber für zu leicht befunden und eine eigene GUI in Perl/Tk geschrieben.
Abbyyocr ist so eine Sache. Die Scan-Ergebnisse sind etwas besser als tesseract mit den Sprachereweiterungen. Die Lizenzpolitik ist aber grenzwertig. Vor allem haben die Leute ihre Lizenz-Verwaltung nicht im Griff:
Fehlerhafte Dateirechte
Der Versuch Ihre Versionsverwaltung durch komplizierte Pfade zu verschleiern.
Fehlermeldungen, die der Service nicht einmal verseht.
Gruß Heiner
wie ist es mit den deutschen Sprachpaketen, sind die im Standard-RPM enthalten? In dem c't Artikel wird als Beispiel ubuntu angeführt mit tesseract-ocr.deu. Herbert -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org