Torsten Foertsch wrote:
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht.
Ich befürchte, dass du hier ein echtes Monster an den Hörnern hast. Vor kurzem kam ein Test über automatische Übersetzungsprogramme, da hat auch keines vernünftige Ergebnisse gebracht. Ähnlich sieht es mit der semantischen Suchmaschine aus. Auf dem Gebiet ist wohl noch eine Menge Forschungsarbeit notwendig, bevor solche Anforderungen möglich sind. -- Sandy Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org