Re: Textconvert SCO-UNIX ? nach UTF-8

15 Nov 2005

      Hallo,

Am Mon, 14 Nov 2005, Manfred Tremmel schrieb:
...
Am Montag 14 November 2005 17:31 schrieb Bernhard Bühler:
[..]
Die Codierung der genannten Zeichen entspricht tatsächlich der Codepage 
437, sollte der Rest vermutlich auch passen.
Jup.
...
...
Ich sollte alle diese Zeichen in das Pendant UTF-8 umsetzen. Kann mir
hier jemand helfen wie ich vorgehen soll (iconv, uniconv, recode)?
Ein
iconv -f CP437 -t utf-8 dokument.txt >> dokument_neu.txt
recode cp437..utf-8 dokument.txt ### aendert die Datei! Nur nach Test!

recode cp437..utf-8 < dokument.txt > dokument_utf8.txt
    ### aendert die Original nicht.

Praktischerweise kann man bei recode auch die Zeilenumbrueche auch
gleich explizit (und unabhaengig vom Zeichensatz) umkodieren, z.B.:

  recode cp437/CR-LF..utf-8/LF < dokument.txt > dokument_utf8.txt

(das ist in diesem Fall der default) aber z.B. utf-8 mit CR-LF
Umbruechen geht eben auch ;)

echo 'üèöä' | recode latin9..cp437 | recode cp437..utf-8/CR-LF | hex
00000000  C3 BC C3 A8  C3 B6 C3 A4  0D 0A                     ..........
                                    ^^^^^

HTH,
-dnh

-- 
The social dynamics of the net are a direct consequence of the fact that
nobody has yet developed a Remote Strangulation Protocol.   -- Larry Wall

Re: Textconvert SCO-UNIX ? nach UTF-8

David Haller