On Fri, 18 May 2001 at 22:34 +0200, Ulrich Klenk wrote:
Hallo Liste,
bin mal wieder auf der Suche nach einem kleinen Skript zur Textkonvertierung: Es sollen HTML-Dokumente eingelesen und in txt-Dateien umgewandelt werden, ohne dass Formatierungen verloren gehen. Gleichzeitig sollen vorhandene Bilder durch Links auf eben jenige ersetzt werden.
Mein Ansatz wäre hier ein Shell-Skript und sed und/oder awk... Oder hat jemand so was schon auf seiner Festplatte.....
Danke für Hinweise wo ich sowas finden kann, bzw. Anregungen.....
Grundsätzlich mache ich sowas mit w3m -dump test.html > test.txt Damit wird z. B. die Etikette konvertiert. Wie das mit den Bildern aussieht, weiß ich nicht. Aufzählungen werden in der Form * sdfadsf * adsfds wiedergegeben. Gruß, Bernhard -- ----------------------------------------------------------------- -> http://www.links2linux.de <-> http://packman.links2linux.de <- ----------------------------------------------------------------- ******************** Gnu PGP-Key: DDAF6454 * Tux# 171705 * ICQ# 98361051