Hallo, Am Mon, 21 Dez 2009, Joerg Thuemmler schrieb:
Eventuell geht folgendes: Teste einen Farbscan aus, der einigermaßen bei allen Papieren ein brauchbares Ergebnis liefert. Nutze die eingestellten Parameter und filtere mit convert oder gimp im Batch-Modus die Farben weg, am besten erstmal manuell mit gimp (Stichwort "Auswahl nach Farbe", hier ein wenig mit dem Schwellwert experimentieren). Dann kannst Du damit und mit Posterisieren arbeiten. In convert könnten -white-threshold -black-threshold u.a. Optionen interessant sein.
Ist generell ein Thema für viele zeitraubende Experimente. Bei manchen Scannern kannst Du auch angeben, mit welcher Farbe schwarz/weiß bzw. Graustufen gescannt werden sollen, (scanimage --gray-mode-color Red|Green|Blue [Green]), generell ist es eine gute Idee, mal
scanimage -h
für Deinen Scanner aufzurufen, dann wird auch angezeigt, welche Optionen Du nutzen kannst (bei den anderen steht "inactive"). Hier gibts manche Perle ;-)
Evtl. hilft auch 'xscanimage' beim rantasten an die Parameter ... Ausserdem gibt's ja netpbm, mit dem man die scanimage-Ausgabe (default ist da ja pnm, d.h. je nach Farbstufe ppm, pgm oder pbm) evtl. direkt weiterverwursten kann, was teilweise durchaus besser als per 'convert' klappen kann (per ppmtopgm, pgmtopbm, pnmquant, ...). netpbm ist halt ein bisserl wie ein Tool je Funktion, statt wie bei convert/mogrify alles in einem mit einem Haufen Optionen ;) Apropos: evtl. ist pbm.{gz,bz2,lz} o.ä. ein interessantes Ziel-Dateiformat (Wahlweise ASCII oder Binär-kodiert). Nur mal so, ne angepasste identify-Ausgabe: foo.png PNG 1820x684+0+0 8-bit 187.4k foo-bw.pbm PNM 1820x684+0+0 2c 8-bit 152.3k foo-bw.jpg JPEG 1820x684+0+0 256c 8-bit 72.8k foo-bw.gif GIF 1820x684+0+0 4c 8-bit 13.0k foo-bw.png PNG 1820x684+0+0 8-bit 11.4k foo-bw.pbm.gz PNM 1820x684+0+0 2c 8-bit 11.0k foo-bw.pbm.bz2 PNM 1820x684+0+0 2c 8-bit 8.2k foo-bw.pbm.lzma PNM 1820x684+0+0 2c 8-bit 7.4k [Warum mein 'identify' beim -bw.gif '4c' ausgibt weiß ich nicht, sind jedenfalls lt. gimp ebenfalls nur 2 Farben ;)] Achso, das Testbild ist ein Scan meiner Unterschrift ;) Viel Weiß, ein fast formatfüllender "schwarzer" Schriftzug ;) P{A,N,P,G,B}M als Dateiformat ist vorteilhaft, da extrem simpel (Farbwerte als n-Tupel), gut dokumentiert, patentfrei, in einer ASCII und binären Variante spezifiziert/verfügbar (erstere ist AFAIK praktisch (der immer ASCII) Header + Hexdump der binären Variante). Das Kompressionsverfahren kann man sich anschließend aussuchen, gzip z.B. gibt's seit Jahrzehnten, und div. Bildbetrachter (mind. xv und display (aus dem ImageMagick-Paket) und gimp können die .pbm.gz (und andere "p?m.gz") direkt anzeigen/öffnen). Und, da sogar schon das .pbm.gz bei dieser Testdatei kleiner als das GIF ist... Kurzum: IMO spricht alles für .pbm.{gz,bz2,lz(ma)}. PPM und evtl. schon PGM werden allerdings wohl meist von JPEG/PNG/GIF effektiver komprimiert als per gzip/bzip2/lzma/..., da dort die jew. relevanten Kompressionsalgorithmen erst richtig greifen (v.a. bei JPEG). Mit auf die HW/Dokumentarten angepasste(n|m) Script(en) müßte sich das auch recht gut automatisieren lassen, zumal die netpbm-Tools per default jew. von stdin lesen und nach stdout schreiben ;) Ja, das geht auch mit convert per z.B. pnm:- o.ä. ;) Ich mag convert ja auch. HTH, -dnh -- Carter: He s right. Inventing technology with this level of sophistication would require a zero. Daniel: Why? Carter: Just trust me. It s a math thing. -- Stargate SG-1, 4x14 -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org