Hallo! Ich habe mir noch letztes Jahr einen Scanner gekauft, einen Microtek Scanmaker E6. Unter NT funktioniert er, aber um ihn unter Linux zu betreiben, brauche ich anscheinend SANE 1.0, da die SANE-Version, die bei 5.3 dabei ist, ihn noch nicht unterstuetzt. Wo ich aktuelle SANE-Files finde, habe ich schon gefunden, jetzt weiss ich nur nicht genau, wie ich nun vorgehe. Da gab es RPM-Files fuer RedHat und welche fuer SuSE 6.0. Was nehme ich nun fuer 5.3 ? Funktionieren die Binaries auch unter 5.3, oder lade ich mir besser die Sourcen und kompilier ich sie mir neu ? Und was mach ich mit .rpm-Files ueberhaupt genau? Und habe mir die Man-Pages zu rpm mal angeschaut, aber irgendwie hat es nicht geklappt, als ich mal ausprobiert habe, so ein .rpm-Paket zu installieren. Was ich mit dem Scanner mal ausprobiert habe, ist, 3D-Bilder zu scannen, wie es in der c't beschrieben war. Dazu scannt man einen recht flachen Gegenstand, ich habe ein Holzdoeschen mit geschnitztem Deckel genommen, verschiebt ihn ein paar Zentimeter senkrecht zur Scannrichtung und scannt ihn nochmal. Dann habe ich die beiden Bilder nebeneinander auf den Bildschirm gepackt und ohne Brille ziemlich dicht vorm Bildschirm draufgeblickt. Und ich sah das Doeschen wirklich in 3D! :-) (Klappt bei mir auch deshalb gut, weil ich wegen meiner Kurzsichtigkeit gut in die Ferne schauen kann und trotzdem alles in 10 Zentimetern Abstand scharf zu sehen ist ( weiter kann ich ohne Brille auch gar nicht scharf sehen.).) Gibt es eigentlich schon sowas wie OCR unter Linux ? Tschau, Sabine -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On Mon, Jan 04, 1999 at 04:29:20PM +0100, Sabine Friederike Wolf wrote:
Hallo!
Holla!
besser die Sourcen und kompilier ich sie mir neu ? Und was mach ich mit .rpm-Files ueberhaupt genau? Und habe mir die Man-Pages zu rpm mal angeschaut, aber irgendwie hat es nicht geklappt, als ich mal ausprobiert habe, so ein .rpm-Paket zu installieren.
Der einfache Weg: YaST aufrufen Installation festlegen/starten Pakete einspielen als Quelle das Verz. waehlen, in dem das rpm-file liegt rpm-file auswaehlen F10 Der andere Weg fuehrt wohl unweigerlich zu man rpm. mfg, Peter -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On 04-Jan-99 Sabine Friederike Wolf wrote:
Gibt es eigentlich schon sowas wie OCR unter Linux ?
Jein. Ich zitiere hier mal aus einer Antwort in einer Newsgroup zu dieser Frage: ---------------------------schnipp--------------------------------
vividata (sp?). Basiert angeblich auf der Omnipage OCR Engine. Hat das schon jemand probiert? (Eine Zeitbeschraenkte Demoversion gibts auf der Homepage von Vividata)
... hab es (OCR-Shop) probiert, ist echt Klasse. Besonders sie Moeglichkeit, das Program ueber Kommandozeile zu starten finde ich gut. Leider ist das Teil aber auch recht teuer. ----------------------------schnapp--------------------------------- Ansonsten gibt es noch xocr, mit dem bisher aber wohl noch niemand einen Text "erkannt" hat. Gruß, Heinz. -- E-Mail: Heinz W. Pahlke <h.pahlke@berlin.de> Date: 04-Jan-99 Time: 21:17:32 This message was sent by XFMail via S.u.S.E. Linux 5.3 -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
Hallo Heinz!
vividata (sp?). Basiert angeblich auf der Omnipage OCR Engine. Hat das schon jemand probiert? (Eine Zeitbeschraenkte Demoversion gibts auf der Homepage von Vividata)
... hab es (OCR-Shop) probiert, ist echt Klasse. Besonders sie Moeglichkeit, das Program ueber Kommandozeile zu starten finde ich gut. Leider ist das Teil aber auch recht teuer.
Tja, wohl eher auf die SGI-Nutzer, die eh schon Unsummen fuer ihre Rechner ausgeben, gedacht, als fuer den normalen Linux-Anwender. Gibt es eigentlich ne Moeglichkeit, einem Programm eine bestimmte Systemzeit vorzugaukeln, um Demo-Versionen laenger nutzen zu koennen, ohne gleich die Systemzeit zu verstellen ? Hmm, ein OCR-Programm fuer Linux waere ein interessantes Projekt, vielleicht finde ich ja auch was ueber die zugrundeliegenden Prinzipien, aber bis zu einem ausgereiften Programm ist es sicher ein steiniger Weg. Tschau, Sabine -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On 05-Jan-99 Sabine F. Wolf wrote:
Tja, wohl eher auf die SGI-Nutzer, die eh schon Unsummen fuer ihre Rechner ausgeben, gedacht, als fuer den normalen Linux-Anwender. Gibt es eigentlich ne Moeglichkeit, einem Programm eine bestimmte Systemzeit vorzugaukeln, um Demo-Versionen laenger nutzen zu koennen, ohne gleich die Systemzeit zu verstellen ?
Ich kenne keines, denke aber auch, daß es unter Linux nicht ratsam ist, an den Zeiteinstellungen herumzuspielen. Zumindest lief in irgendeiner Newsgroup mal eine Diskussion in der Richtung, daß man dadurch sein gesamtes System bis zu einer Neuinstallation lahmlegen könnte.
Hmm, ein OCR-Programm fuer Linux waere ein interessantes Projekt, vielleicht finde ich ja auch was ueber die zugrundeliegenden Prinzipien, aber bis zu einem ausgereiften Programm ist es sicher ein steiniger Weg.
Mit xocr liegt ja eigentlich ein Ansatz vor (oder ist doch schon der Ansatz verkehrt), aber das Programm müßte auf alle Fälle grundlegend überarbeitet werden. Eigenartigerweise scheint OCR aber für Linuxprogrammierer derzeit kein Thema zu sein. Und kommerzielle Anbieter scheinen die geringen Gewinnspannen abzuschrecken. Jedenfalls habe ich kürzlich mal bei Abbyy Soft nachgefragt, wie die Chancen stünden, daß FineReader auf Unix portiert würde, und die Antwort erhalten, daß es keine entsprechenden Überlegungen gebe. Also bleibt es für OCR wohl vorerst bei Windows, zumal die Windows-OCR-Programme nicht einmal unter Wabi oder Wine laufen. Aber man soll ja die Hoffnung nie aufgeben. Beste Grüße, Heinz. -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On Tue, 5 Jan 1999, Heinz W. Pahlke wrote:
On 05-Jan-99 Sabine F. Wolf wrote:
Eigenartigerweise scheint OCR aber für Linuxprogrammierer derzeit kein Thema zu sein. Und kommerzielle Anbieter scheinen die geringen Gewinnspannen abzuschrecken. Jedenfalls habe ich kürzlich mal bei Abbyy Soft nachgefragt, wie die Chancen stünden, daß FineReader auf Unix portiert würde, und die Antwort erhalten, daß es keine entsprechenden Überlegungen gebe.
Es muss ja nicht gleich das blanke Linux sein, derart "lediglich" verarbeitende Schritte sollten doch halbwegs zum Portabelsten zaehlen, was so an Projekten existiert. BTW wuerde ich von den Blinden-Projekten noch am ehesten entsprechende Initiativen erwarten. Dokumentenverwaltung findet mit Sicherheit auf anderen Maschinen (und in anderen Preisregionen) statt.
Also bleibt es für OCR wohl vorerst bei Windows, zumal die Windows-OCR-Programme nicht einmal unter Wabi oder Wine laufen.
Ob's noch andere Plattformen gibt ? Wenn ich so an LaTeX denke (rennt ueberall, wo's einen C-Compiler gibt -- das sind eine MENGE potentielle Zielrechner :) ... Gerhard Sittig -- If you don't understand or are scared by any of the above ask your parents or an adult to help you. -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On 05-Jan-99 Gerhard Sittig wrote:
Eigenartigerweise scheint OCR aber für Linuxprogrammierer derzeit kein Thema zu sein. Und kommerzielle Anbieter scheinen die geringen Gewinnspannen abzuschrecken. Jedenfalls habe ich kürzlich mal bei Abbyy Soft nachgefragt, wie die Chancen stünden, daß FineReader auf Unix portiert würde, und die Antwort erhalten, daß es keine entsprechenden Überlegungen gebe.
Es muss ja nicht gleich das blanke Linux sein, derart "lediglich" verarbeitende Schritte sollten doch halbwegs zum Portabelsten zaehlen, was so an Projekten existiert. BTW wuerde ich von den Blinden-Projekten noch am ehesten entsprechende Initiativen erwarten. Dokumentenverwaltung findet mit Sicherheit auf anderen Maschinen (und in anderen Preisregionen) statt.
Dort scheint sich derzeit aber sowohl hinsichtlich OCR als auch Spracherkennung wenig zu tun. Da mich beide Themen interessieren, habe ich die entsprechenden Mailinglisten über mehrere Monate intensiv mitgelesen, OCR (undSpracherkennung) spielten aber keine Rolle.
Also bleibt es für OCR wohl vorerst bei Windows, zumal die Windows-OCR-Programme nicht einmal unter Wabi oder Wine laufen.
Ob's noch andere Plattformen gibt ? Wenn ich so an LaTeX denke (rennt ueberall, wo's einen C-Compiler gibt -- das sind eine MENGE potentielle Zielrechner :) ...
In einer Newsgroup gab es kürzlich folgenden Tip (ist natürlich keine Antwort auf deine obige Frage): -------------------------------schnipp-------------------------------- Mir ist da neulich unverhofft eine m=F6gliche L=F6sung untergekommen. Es gibt f=FCr Atari ein ocr-Programm, das auch so hei=DFt. Archie findet sicher irgendwo die Datei ocr14e.lzh. Das Programm selbst = ist frei, allerdings braucht man f=FCr den Atari Simulator STonX ein = lizensiertes TOS.img. Das funktioniert auch ihne lizensiertes TOS, = aber ist dann illegal :-( (OT: Wer wei=DF, wo man noch eine Lizenz f=FCr = TOS 2.06 herbekommt?). Die mitgeliederten Dateien kann man recht = problemlos erkennen. F=FCr eigene Versuche fehlt mir der Scanner, ich = habe aber mal eine PostScriptdatei in PCX umgewandelt und auch erkannt bekommen. Man mu=DF allerdings aufpassen, da=DF die Datei wirklich nur = /w ist. 8-bit Modus funktioniert nicht. Man sollte STonX auch in = der Version, die mehr Speicher (14MB?) emuliert, verwenden, sonst = macht es wenig Sinn. F=FCr ab und zu ein paar Seiten ist das m. E. = eine brauchbare L=F6sung. -------------------------------schnapp----------------------------- Mit ist diese Lösung allerdings etwas zu aufwendig. Vorerst muß ich also weiterhin mit einer kleinen Win3.1-Partition leben, zumal es auch für verschiedene andere Aufgaben bisher keine Linux-SW gibt. Gruß, Heinz. -- E-Mail: Heinz W. Pahlke <h.pahlke@berlin.de> Date: 07-Jan-99 Time: 08:40:06 This message was sent by XFMail via S.u.S.E. Linux 5.3 -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On 05-Jan-99 Sabine F. Wolf wrote:
Tja, wohl eher auf die SGI-Nutzer, die eh schon Unsummen fuer ihre Rechner ausgeben, gedacht, als fuer den normalen Linux-Anwender. Gibt es eigentlich ne Moeglichkeit, einem Programm eine bestimmte Systemzeit vorzugaukeln, um Demo-Versionen laenger nutzen zu koennen, ohne gleich die Systemzeit zu verstellen ? Hmm, ein OCR-Programm fuer Linux waere ein interessantes Projekt, vielleicht finde ich ja auch was ueber die zugrundeliegenden Prinzipien, aber bis zu einem ausgereiften Programm ist es sicher ein steiniger Weg.
Vor langer langer Zeit gab es mal sowas bei der c't.(wenn mein Gedächnis mich nicht im Stich läßt) evtl. find ich den Artikel ja beim Aufräumen wieder. Wäre aber wirklich ein interessantes Projekt, tät ich ja glatt mitmachen. MfG/regards Jens Link -- FAX: 089-66617-31040 and soon: http://.... ---- Reduzieren Sie ihre Ansprüche auf das Maximum----- -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
Hallo Jens!
Vor langer langer Zeit gab es mal sowas bei der c't.(wenn mein Gedächnis mich nicht im Stich läßt) evtl. find ich den Artikel ja beim Aufräumen wieder. Wäre aber wirklich ein interessantes Projekt, tät ich ja glatt mitmachen.
Ich denke, da gibt es den Ansatz, aus dem Bild die Buchstaben in Striche umzuwandeln, und dann aus dem Wissen heraus, welche Art von Striche welche Buchstaben ergeben (ein H etwa aus zwei senkrechten und einen waagerechten dazwischen) daraus dann die Zeichen abzuleiten. Das hat auch den Vorteil, dass es ziemlich universell fuer alle Schriftentypen, incl. Blockschrift sich eignet. Ich faende aber einen anderen Ansatz erstmal einfacher, naemlich Bilder von jedem Buchstaben zu haben, und diese dann versuchen mit dem Bild in Deckung zu bringen und da wo es gut passt, da kommt da dann der entspechende Buchstabe hin. Blockschrift wird man damit wohl nicht erkennen, aber fuer Schreibmaschinenschrift halte ich dieses Verfahren sogar fuer besser, weil Schreibmaschinentypen oft unterbrochen sind, was eine Erkennung von Linien erschwert. Ich habe mal eine Seite der c't gescannt, ein kleines e herausgegriffen und mit einem kleinen C-Programm versucht, alle es in dem Text zu finden, in dem ich das e ueber das ganze bild in x- und y-Richtung geschoben haben und den Unterschied in Pixeln gezaehlt habe. Diese Unterschiede habe ich als Bild ausgegeben ( toll die Bildformate, die unter Linux gibt, das C-Header-Format, um das Bild und das e einzubinden und das pgm-Format fuer die Ausgabe :-)).So konnte ich visuell die Erkennung beurteilen. In der ersten Version reichte aber die Erkennung nicht aus, als das e auf einem c lag, gab es einmal bloss 38 Fehler, waehrend es eine e-e-Deckung mit 41 Fehlern gab. Dann habe ich das e noch um eine Maske ergaenzt, die einen 2-Pixel-Rand um das e von der Differenz ausschloss, weil die es ja alle etwas in ihrer Form variiieren. Damit konnte ich dann mit einem Threshold von 25 Fehlerpixel eindeutig alle es in dem Text erkennen,keine zuwenig und keine zuviel. Fuer eine Erkennung eines vollstaendigen Textes braeuchte fuer jedes Zeichen halt ein Bildchen und man muesste vorher schonmal das Bild etwas strukturell untersuchen, um zu wissen wo die Zeilen sind, damit man Zeichen fuer Zeichen erkennen kann und nicht das ganze Bild absuchen muss. Wenn man dann noch eine Tabelle mit Folgewahrscheinlichkeiten hat, kann man auch immer nach den an der Stelle wahrscheinlichsten Buchstaben zuerst suchen, was die Suche beschleunigt bzw. die Erkennungsgenauigkeit verbessern kann. Das Verfahren haette natuerlich den Nachteil, dass es fuer jede Schriftart Training braucht, um erstmal die Bildchen fuer jedes Zeichen zu haben. Tschau, Sabine -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
On Fri, 8 Jan 1999, Sabine F. Wolf wrote: |> Vor langer langer Zeit gab es mal sowas bei der c't.(wenn mein |> Gedächnis mich nicht im Stich läßt) evtl. find ich den Artikel ja beim |> Aufräumen wieder. Wäre aber wirklich ein interessantes Projekt, tät ich |> ja glatt mitmachen. | |Ich denke, da gibt es den Ansatz, aus dem Bild die Buchstaben in Striche [ wildeste dinge...] ich glaube du solltest *jetzt* anfangen mit neuronalen netzen zu arbeiten. ich habe mich da mal mit befasst; falls es dich wirklich *soo* begeistert meld' dich mal privat.. Gruss / with best regards Jens-Eike Jesau <jesau@warpserv.fh-bielefeld.de> You trust in 32 bit extensions for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microproccessor written by a 2 bit company that can't stand 1 bit of competition ============================================================================== Linux on a single Floppy : <A HREF="http://www.toms.net/rb"><A HREF="http://www.toms.net/rb</A">http://www.toms.net/rb</A</A>> ============================================================================== -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
Hallo Jens!
| |Ich denke, da gibt es den Ansatz, aus dem Bild die Buchstaben in Striche [ wildeste dinge...]
ich glaube du solltest *jetzt* anfangen mit neuronalen netzen zu arbeiten. ich habe mich da mal mit befasst; falls es dich wirklich *soo* begeistert meld' dich mal privat..
Stimmt, so langsam wird das zu speziell fuer diese Liste. :-) Neuronale Netze taeten mich schon interessieren, gibt es die Bibliotheken dafuer, die man in eigenen Programmen verwenden kann, damit man nicht alles selber schreiben muss ? Was hast du denn so mit neuronalen Netzen gemacht ? Habe mir heute mal ein Buch ueber OCR ausgeliehen, viel gelesen habe ich aber noch nicht drinn, eins fand ich aber lustig, OCR wird z.B. dazu benutzt, um Dateien von Grossrechnern uebertragen zu bekommen: Einfach die Dateien ausdrucken und dann wieder per OCR einlesen. :-) Tschau, Sabine -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
participants (6)
-
G.Sittig@abo.FreiePresse.DE
-
h.pahlke@berlin.de
-
j.link@linux.e.ruhr.de
-
jesau@warpserv.fh-bielefeld.de
-
linux@friederike.de
-
PSchneewind@t-online.de