Hallo Liste, der Ansatz von Bodo hat mich auf eine Idee gebracht. Es gibt in der Mustererkennung viele (>50) solcher Klassifikationskriterien, teils auch sehr mathematik-lastige (Schwarzanteil, Verteilung, ...). Die Grundlage ist fast immer die gleiche - von einem auf schwarz-weiß normierten Bild werden die Klassifikationskriterien berechnet und dann von jedem Kriterium einzeln der Abstand von einer Refernz (anderen Schrift) bestimmt. Diese Abstände können dann noch (gewichtet) Addiert werden und man hat eine Zahl, die die Ähnlichkeit einer Schrift mit der anderen beschreibt. Es ist sogar sinnvoller, die Kriterien in der Datenbank zu speichern als nur den Schwarzanteil der Teilbilder. Vielleicht findest Du in veröffentlichten Mustererkennungs-Skripten von Uni's oder FH's etwas darüber. Gruß Christian Am Samstag, 25. Dezember 2004 23:38 schrieb Bodo Kaelberer:
Dazu könnte man ein paar Kriterien erarbeiten, deren Ergebnis sich je in einer kleinen Zahl ausdrücken läßt. Was mir einfällt:
A: Der summierte Schwarzanteil in allen 64 Werten. Mit einem solchen Wert lassen sich dicke Fonts von eher zarten trennen.
B: Die Wahrscheinlichkeit, dass im Umfeld eines Wertes ein ähnlicher Wert kommt, daß also z.B. neben einem schwarzen Punkt wieder ein schwarzer kommt. Dieser Wert müsste beim serifenlosen Schriften niedriger sein als bei Schriften mit Serifen.
Weitere Kriterien fallen mir nicht ein, aber bei Durchsicht Deiner 400.000 Fonts wirst Du sicher ein paar weitere finden.