Hallo, Am Mon, 14 Nov 2005, Manfred Tremmel schrieb:
Am Montag 14 November 2005 17:31 schrieb Bernhard Bühler: [..] Die Codierung der genannten Zeichen entspricht tatsächlich der Codepage 437, sollte der Rest vermutlich auch passen.
Jup.
Ich sollte alle diese Zeichen in das Pendant UTF-8 umsetzen. Kann mir hier jemand helfen wie ich vorgehen soll (iconv, uniconv, recode)?
Ein
iconv -f CP437 -t utf-8 dokument.txt >> dokument_neu.txt
recode cp437..utf-8 dokument.txt ### aendert die Datei! Nur nach Test! recode cp437..utf-8 < dokument.txt > dokument_utf8.txt ### aendert die Original nicht. Praktischerweise kann man bei recode auch die Zeilenumbrueche auch gleich explizit (und unabhaengig vom Zeichensatz) umkodieren, z.B.: recode cp437/CR-LF..utf-8/LF < dokument.txt > dokument_utf8.txt (das ist in diesem Fall der default) aber z.B. utf-8 mit CR-LF Umbruechen geht eben auch ;) echo 'üèöä' | recode latin9..cp437 | recode cp437..utf-8/CR-LF | hex 00000000 C3 BC C3 A8 C3 B6 C3 A4 0D 0A .......... ^^^^^ HTH, -dnh -- The social dynamics of the net are a direct consequence of the fact that nobody has yet developed a Remote Strangulation Protocol. -- Larry Wall