Am Freitag, 31. Oktober 2008 11:10:11 schrieb Torsten Foertsch:
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht.
Danke, Torsten
-- Need professional mod_perl support? Just hire me: torsten.foertsch@gmx.net
Hallo Torsten Wie heißt es so schön, Deutsche Sprache, schwere Sprache, Als es in der Dudenreihe ein Fremdwörterbuch gab, habe ich es mir sofort gekauft, da ich Schwierigkeiten hatte mir die ganzen Wörter zu merken. Die Deutsche Sprache besteht immer mehr aus Fremdwötern als deutschen. Die Word-Programme kennen viele Fremdwörter und lang zusammengesetzte Wörter nicht und kreiden sie rot an. Im englischen wirst du auch Probleme haben. Ich versuche ein engl. Handbuch zu übersetzen. Einigen Wörter haben im täglichen Sprache andere Bedeutung als in der Fachsprache der PC-Welt, wodurch ich nicht weiterkomme. MfG Stefan -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org