Moin, Am Sonntag, den 26.12.2004, 11:34 +0100 schrieb Christian Mang:
Hallo Liste,
der Ansatz von Bodo hat mich auf eine Idee gebracht. Es gibt in der Mustererkennung viele (>50) solcher Klassifikationskriterien, teils auch sehr mathematik-lastige (Schwarzanteil, Verteilung, ...). Die Grundlage ist fast immer die gleiche - von einem auf schwarz-weiß normierten Bild werden die Klassifikationskriterien berechnet und dann von jedem Kriterium einzeln der Abstand von einer Refernz (anderen Schrift) bestimmt. Diese Abstände können dann noch (gewichtet) Addiert werden und man hat eine Zahl, die die Ähnlichkeit einer Schrift mit der anderen beschreibt. Es ist sogar sinnvoller, die Kriterien in der Datenbank zu speichern als nur den Schwarzanteil der Teilbilder.
Das bedeutet, statt 64 Zahlen, die in unterschiedlichen Bildbereichen die selbe Operation durchführen, nimmt man einfach deutlich weniger Methoden, die aber alle etwas völlig unterschiedliches berechnen... Also, sagenwirmal zum Beispiel folgende Zahlen: - Die Anzahl der schwarzen Pixel - Das Verhältnis der schwarzen Pixel in der oberen Hälfte zur unteren - Wie oft wechselt eine Diagonale die Pixelfarbe? - Die Farbe des Pixel exakt in der Mitte - Die vorrangige Farbe im Quadraten rechts unten - Die Länge der längsten horizontalen schwarze Linie Jede dieser Eigenschaften ergibt keine komplexen Fingerprint, sondern eine simple Zahl. Da der Scan kein 100%iges Abbild ist, liegen einige dieser Zahlen daneben, aber viele werden stimmen. Mit einer MySQL-Funktion (Wahrscheinlich irgendwas mit ORDER und Absolutwerten von Soll minus Ist) könnte ich die nächsten Treffer herausfinden. Mit denen geht's dann gleich in die grafische Vergleichsfunktion. Subba! Gibt es da vielleicht zum Googeln einen schönen Fachbegriff? "Mustererkennung" ist etwas schwammig... Übrigens, wen es interessiert: Es gibt sowas schon im Web, kommerziell, arbeitet mit Worten statt einem Einzelbuchstaben und ist sehr schnell: http://www.myfonts.com/WhatTheFont/ Technisch gesehen das gleiche. Inhaltlich indizieren die natürlich nur Löhn-Fonts, und man bekommt nicht den Font, sondern einen Kauflink. Ich will natürlich nur die lokalen Fonts indizieren, denn was nützt einem sonst die Fundstelle, wenn sie bloß ein Preisettiket zeigt statt einer Fontdatei. :-) Gruß und DANKE! Ratti -- -o) fontlinge | Fontmanagement for Linux | Schriftenverwaltung in Linux /\\ http://freshmeat.net/projects/fontlinge/ _\_V http://www.gesindel.de https://sourceforge.net/projects/fontlinge/