Hallo, durch den Artikel "PDF-Sandwich" in der aktuellen c't bin ich wieder mal auf das Thema OCR unter Linux gekommen. Manche von den in dem Artikel erwähnten Programmen, z. B. gscan2pdf, verwende ich bereits. Doch wenn ich unter http://software.opensuse.org nach "tesseract" für mein OS 12.2 x86_64 suche, finde ich eine große Liste mit möglichen unstable packages: home:Lazy_Kent home:MasterPatricko:... home:Strahlex home:ailin_nemui:tes... home:cabelo:software home:frispete:testing home:gberh home:illuusio:gscan2... home:koprok home:vjt:ifad home:vodoo Ähnlich ist es mit "cuneiform". Gibt es hier eine Empfehlung? Gruß Herbert -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo Herbert, ich habe Suse 12.3, tesseract von home:Lazy_Kent und python-gimagereader von home:malcolmlewis. Es funktioniert ganz gut. Ich bin zufrieden. viele Grüße Günter Ohmer -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
On Tue, 08 Oct 2013 18:39:06 +0200
Herbert Albert
Hallo,
durch den Artikel "PDF-Sandwich" in der aktuellen c't bin ich wieder mal auf das Thema OCR unter Linux gekommen.
Manche von den in dem Artikel erwähnten Programmen, z. B. gscan2pdf, verwende ich bereits. Doch wenn ich unter http://software.opensuse.org nach "tesseract" für mein OS 12.2 x86_64 suche, finde ich eine große Liste mit möglichen unstable packages: home:Lazy_Kent home:MasterPatricko:... home:Strahlex home:ailin_nemui:tes... home:cabelo:software home:frispete:testing home:gberh home:illuusio:gscan2... home:koprok home:vjt:ifad home:vodoo
Hallo Herbert, bei mit arbeitet seit längerem unter openSUSE_12.2 tesseract 3.02.831-20.1 Repository openSUSE_12.2 for home:ailin_nemui:tesseract / tesseract https://build.opensuse.org/package/binaries?package=tesseract&project=home%3Aailin_nemui%3Atesseract&repository=openSUSE_12.2 http://download.opensuse.org/repositories/home:/ailin_nemui:/tesseract/openS... Ich habe auch Gimagereader getestet aber für zu leicht befunden und eine eigene GUI in Perl/Tk geschrieben. Abbyyocr ist so eine Sache. Die Scan-Ergebnisse sind etwas besser als tesseract mit den Sprachereweiterungen. Die Lizenzpolitik ist aber grenzwertig. Vor allem haben die Leute ihre Lizenz-Verwaltung nicht im Griff: Fehlerhafte Dateirechte Der Versuch Ihre Versionsverwaltung durch komplizierte Pfade zu verschleiern. Fehlermeldungen, die der Service nicht einmal verseht. Gruß Heiner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Am Dienstag, 8. Oktober 2013, 19:31:11 schrieb Heiner Kuhlmann:
On Tue, 08 Oct 2013 18:39:06 +0200
Herbert Albert
wrote: Hallo,
durch den Artikel "PDF-Sandwich" in der aktuellen c't bin ich wieder mal auf das Thema OCR unter Linux gekommen.
Manche von den in dem Artikel erwähnten Programmen, z. B. gscan2pdf, verwende ich bereits. Doch wenn ich unter http://software.opensuse.org nach "tesseract" für mein OS 12.2 x86_64 suche, finde ich eine große Liste mit möglichen unstable packages: home:Lazy_Kent home:MasterPatricko:... home:Strahlex home:ailin_nemui:tes... home:cabelo:software home:frispete:testing home:gberh home:illuusio:gscan2... home:koprok home:vjt:ifad home:vodoo
Hallo Herbert,
bei mit arbeitet seit längerem unter openSUSE_12.2 tesseract 3.02.831-20.1
Repository openSUSE_12.2 for home:ailin_nemui:tesseract / tesseract
https://build.opensuse.org/package/binaries?package=tesseract&project=home%3 Aailin_nemui%3Atesseract&repository=openSUSE_12.2
http://download.opensuse.org/repositories/home:/ailin_nemui:/tesseract/openS USE_12.2/
Ich habe auch Gimagereader getestet aber für zu leicht befunden und eine eigene GUI in Perl/Tk geschrieben.
Abbyyocr ist so eine Sache. Die Scan-Ergebnisse sind etwas besser als tesseract mit den Sprachereweiterungen. Die Lizenzpolitik ist aber grenzwertig. Vor allem haben die Leute ihre Lizenz-Verwaltung nicht im Griff:
Fehlerhafte Dateirechte
Der Versuch Ihre Versionsverwaltung durch komplizierte Pfade zu verschleiern.
Fehlermeldungen, die der Service nicht einmal verseht.
Gruß Heiner
wie ist es mit den deutschen Sprachpaketen, sind die im Standard-RPM enthalten? In dem c't Artikel wird als Beispiel ubuntu angeführt mit tesseract-ocr.deu. Herbert -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
Hallo, Am Tue, 08 Oct 2013, Herbert Albert schrieb:
Manche von den in dem Artikel erwähnten Programmen, z. B. gscan2pdf, verwende ich bereits. Doch wenn ich unter http://software.opensuse.org nach "tesseract" für mein OS 12.2 x86_64 suche, finde ich eine große Liste mit möglichen unstable packages: home:Lazy_Kent home:illuusio:gscan2pdf
Würde aus einem der beiden, habe mit beiden Repos schon gute Erfahrungen.
Ähnlich ist es mit "cuneiform". Gibt es hier eine Empfehlung?
Aus dem Publishing Repo oder ebenfalls aus einem der beiden home: Repos. -dnh -- Merke: die Nutzer von Facebook sind nicht "Kunden". Sie sind die Ware. -- Konni Scheller -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
On Tue, 08 Oct 2013 19:47:37 +0200
Herbert Albert
Am Dienstag, 8. Oktober 2013, 19:31:11 schrieb Heiner Kuhlmann:
On Tue, 08 Oct 2013 18:39:06 +0200
Herbert Albert
wrote: Hallo,
durch den Artikel "PDF-Sandwich" in der aktuellen c't bin ich wieder mal auf das Thema OCR unter Linux gekommen.
Manche von den in dem Artikel erwähnten Programmen, z. B. gscan2pdf, verwende ich bereits. Doch wenn ich unter http://software.opensuse.org nach "tesseract" für mein OS 12.2 x86_64 suche, finde ich eine große Liste mit möglichen unstable packages: home:Lazy_Kent home:MasterPatricko:... home:Strahlex home:ailin_nemui:tes... home:cabelo:software home:frispete:testing home:gberh home:illuusio:gscan2... home:koprok home:vjt:ifad home:vodoo
Hallo Herbert,
bei mit arbeitet seit längerem unter openSUSE_12.2 tesseract 3.02.831-20.1
Repository openSUSE_12.2 for home:ailin_nemui:tesseract / tesseract
https://build.opensuse.org/package/binaries?package=tesseract&project=home%3 Aailin_nemui%3Atesseract&repository=openSUSE_12.2
http://download.opensuse.org/repositories/home:/ailin_nemui:/tesseract/openS USE_12.2/
Ich habe auch Gimagereader getestet aber für zu leicht befunden und eine eigene GUI in Perl/Tk geschrieben.
Abbyyocr ist so eine Sache. Die Scan-Ergebnisse sind etwas besser als tesseract mit den Sprachereweiterungen. Die Lizenzpolitik ist aber grenzwertig. Vor allem haben die Leute ihre Lizenz-Verwaltung nicht im Griff:
Fehlerhafte Dateirechte
Der Versuch Ihre Versionsverwaltung durch komplizierte Pfade zu verschleiern.
Fehlermeldungen, die der Service nicht einmal verseht.
Gruß Heiner
wie ist es mit den deutschen Sprachpaketen, sind die im Standard-RPM enthalten? In dem c't Artikel wird als Beispiel ubuntu angeführt mit tesseract-ocr.deu.
Herbert
Unter http://download.opensuse.org/repositories/home:/ailin_nemui:/tesseract/openS... gibt es tesseract-3.02.842-21.1.x86_64.rpm und weitere Pakte. RPM wird Die sagen was Du noch brauchst. Die Sprachpakete stehen unter http://download.opensuse.org/repositories/home:/ailin_nemui:/tesseract/openS... gibt es tesseract-data-deu-3.02.831-20.1.noarch.rpm und tesseract-data-eng-3.02.831-20.1.noarch.rpm Gruß Heiner -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
participants (4)
-
David Haller
-
Günter Ohmer
-
Heiner Kuhlmann
-
Herbert Albert