Torsten Foertsch schrieb:
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht.
Danke, Torsten Hallo Torsten - ich kenn weder [i|hun|a]spell, aber weil ich zufällig gerade syntax lerne, weiß ich, dass du auf jeden fall ein lexikon brauchst. vielleicht hilft dir das hier weiter: http://www.cis.uni-muenchen.de/~leiss/computerlinguistik-II-04-05/skript_wen...
viel erfolg, marco -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org