Hallo und danke an alle Helfer Am Dienstag, 15. November 2005 03.19 schrieb David Haller:
Hallo,
Am Mon, 14 Nov 2005, Manfred Tremmel schrieb:
Am Montag 14 November 2005 17:31 schrieb Bernhard Bühler:
[..]
Die Codierung der genannten Zeichen entspricht tatsächlich der Codepage 437, sollte der Rest vermutlich auch passen.
Jup.
Ich sollte alle diese Zeichen in das Pendant UTF-8 umsetzen. Kann mir hier jemand helfen wie ich vorgehen soll (iconv, uniconv, recode)?
Ein
iconv -f CP437 -t utf-8 dokument.txt >> dokument_neu.txt iconv hat einwandfrei gefunkt.
recode cp437..utf-8 dokument.txt ### aendert die Datei! Nur nach Test! recode wollte nicht: failed: Mehrdeutige Ausgabe in step `CR-LF..data
recode cp437..utf-8 < dokument.txt > dokument_utf8.txt ### aendert die Original nicht.
Praktischerweise kann man bei recode auch die Zeilenumbrueche auch gleich explizit (und unabhaengig vom Zeichensatz) umkodieren, z.B.:
recode cp437/CR-LF..utf-8/LF < dokument.txt > dokument_utf8.txt
wollte auch nicht: recode: Request `cp437/CR-LF..utf-8/LF' is erroneous
Danke und Grüsse Bernhard