Re: Text Normalisierung?

31 Oct 2008


      Torsten Foertsch schrieb:
...
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten 
zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der 
Länder Europas unterwegs" "ich sein in den haupt stadt der land europa 
unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, 
Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter 
trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch 
und Türkisch funktionieren und irgendeine Programmierschnittstelle 
bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe 
mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt 
aber keines davon mit Deutsch zurecht.
Danke,
Torsten
Hallo Torsten -
ich kenn weder [i|hun|a]spell, aber weil ich zufällig gerade syntax
lerne, weiß ich, dass du auf jeden fall ein lexikon brauchst.
vielleicht hilft dir das hier weiter:
http://www.cis.uni-muenchen.de/~leiss/computerlinguistik-II-04-05/skript_wen...
viel erfolg,
marco
-- 
Um die Liste abzubestellen, schicken Sie eine Mail an:
    opensuse-de+unsubscribe@opensuse.org
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@opensuse.org

Re: Text Normalisierung?

Hungerpirat