Hallo, * Daniel Lord textete am 09.06.03:
On Mon, Jun 09, 2003 at 04:05:28PM +0200, Wolfgang Erlenkötter wrote:
Ich versuche gerade mit der Hilfe von regulären Ausdrücken und sed alle HTML-Tags aus einer Datei zu entfernen. Stehen die Tags in einer Zeile, werden sie gelöscht. Ziehen sich die Tags aber über mehrere Zeilen hin, klappt das nicht.
äh willst Du das wirklich mit regex machen? wie währe es damit?
lynx -dump /path/to/html/datei.htm > /path/to/txt/datei.txt
Vielleicht reicht auch schon html2text. cu flo --
ein newsgroup unbewanderter fef hat mich im icq gefragt ob man was gegen den kurzzeitgedächtnis verlust beim kiffen tun kann? (wobei er sich glaub ich ned einschränken will in seinem konsum) ... gibz da was? || Ja natürlich, habe kürzlich was gehört..... aber vergessen. ['Max' und Micha Rieser in dsd]