Hallo, ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache. Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen). Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten. Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht. Danke, Torsten -- Need professional mod_perl support? Just hire me: torsten.foertsch@gmx.net -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Torsten Foertsch wrote:
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht.
Ich befürchte, dass du hier ein echtes Monster an den Hörnern hast. Vor kurzem kam ein Test über automatische Übersetzungsprogramme, da hat auch keines vernünftige Ergebnisse gebracht. Ähnlich sieht es mit der semantischen Suchmaschine aus. Auf dem Gebiet ist wohl noch eine Menge Forschungsarbeit notwendig, bevor solche Anforderungen möglich sind. -- Sandy Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Torsten Foertsch schrieb:
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht.
Danke, Torsten Hallo Torsten - ich kenn weder [i|hun|a]spell, aber weil ich zufällig gerade syntax lerne, weiß ich, dass du auf jeden fall ein lexikon brauchst. vielleicht hilft dir das hier weiter: http://www.cis.uni-muenchen.de/~leiss/computerlinguistik-II-04-05/skript_wen...
viel erfolg, marco -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Am Freitag, 31. Oktober 2008 11:10:11 schrieb Torsten Foertsch:
Hallo,
ich suche ein Programm, das Text gut in normalisierte Wortlisten zerlegt, natürlich unter Berücksichtigung der Sprache.
Im Deutschen sollte das Ding z.B aus "ich war in den Hauptstädten der Länder Europas unterwegs" "ich sein in den haupt stadt der land europa unterwegs" oder sowas ähnliches machen (Lautverschiebung aufheben, Plural, Konjugation und Deklination entfernen, zusammengesetzte Wörter trennen).
Das Ganze sollte möglichst in den europäischen Sprachen inkl. Polnisch und Türkisch funktionieren und irgendeine Programmierschnittstelle bieten. Deutsch und Englisch sind am wichtigsten.
Wie stehen meine Chancen irgendetwas brauchbares zu finden? Ich habe mich kurz an ispell, hunspell und aspell versucht. So richtig gut kommt aber keines davon mit Deutsch zurecht.
Danke, Torsten
-- Need professional mod_perl support? Just hire me: torsten.foertsch@gmx.net
Hallo Torsten Wie heißt es so schön, Deutsche Sprache, schwere Sprache, Als es in der Dudenreihe ein Fremdwörterbuch gab, habe ich es mir sofort gekauft, da ich Schwierigkeiten hatte mir die ganzen Wörter zu merken. Die Deutsche Sprache besteht immer mehr aus Fremdwötern als deutschen. Die Word-Programme kennen viele Fremdwörter und lang zusammengesetzte Wörter nicht und kreiden sie rot an. Im englischen wirst du auch Probleme haben. Ich versuche ein engl. Handbuch zu übersetzen. Einigen Wörter haben im täglichen Sprache andere Bedeutung als in der Fachsprache der PC-Welt, wodurch ich nicht weiterkomme. MfG Stefan -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (4)
-
Hungerpirat
-
Sandy Drobic
-
Stefan Plenert
-
Torsten Foertsch