Liebe Liste, gibt es ein Programm, welches mir auf einfache Weise doppelte Textpassagen (*nicht* doppelte Textdateien) anzeigt und ggf. entfernt. Evtl. auch Funktionen in OpenOffice. Ich konnte da leider nichts finden. Ich habe hier einen vollkommen unformatierten Text, der ist 150 DIN-A4-Seiten lang. Davon sind aber ca. 40 Seiten an unterschiedlicher Stelle doppelt. Ich habe schon mal eine Suchmaschine bemüht. Ich konnte aber nur Ergebnisse finden, welche mir bei der Suche nach doppelte Dateien helfen. Danke für Hinweise Alex -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hi Alex! On Tue, 25 Nov 2008, Alex Winzer wrote:
gibt es ein Programm, welches mir auf einfache Weise doppelte Textpassagen (*nicht* doppelte Textdateien) anzeigt und ggf. entfernt. Evtl. auch Funktionen in OpenOffice. Ich konnte da leider nichts finden.
Kommt drauf an, wie du doppelte Textpassagen definierst. Wenn dir zeilenweise reicht, dann sollte folgendes reichen, um sie zu entfernen: awk '{ a[$0]=1} END { for (i in a) print i; }' filename >output.txt Mit freundlichen Grüßen Christian -- hundred-and-one symptoms of being an internet addict: 26. You check your mail. It says "no new messages." So you check it again. -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (2)
-
Alex Winzer
-
Christian Brabandt