Re: Lösung: Re: OT: wer kann mir mit recode / Zeichensätzen helfen

1 Jun 2002


      On Sat, 01 Jun 2002 at 15:38 (+0200), Carsten Ungewitter wrote:
...
Am Mittwoch, 29. Mai 2002 13:51 schrieb Helga Fischer:
...
Am Mittwoch, 29. Mai 2002 10:53 schrieb Carsten Ungewitter:
...
Ich hätte gerne den Text mit 8859-5 (kyrillisch) oder Unicode
kodiert, so daß ich ihn auch für's Web verwenden kann (auch dann,
wenn der andere Nutzer nicht so einen seltsamen Zeichensatz hat.)
Bin leider auch keine recode-Expertin, aber vielleicht hilft's.
...
Vermutlich ist recode das Programm der Wahl. Nur leider bin ich
nicht firm genug, was Zeichensätze und kodierungen anbelangt, um
das Problem zu lösen (und habe auch grade keine Zeit mich durch
das komplette Manual durchzuwühlen, um zu sehen, ob das was ich
will überhaupt geht.)
recode 8859-5 DATEI
funktioniert leider nicht... (das wäre auch zu einfach gewesen
;-).
recode will immer eine Angabe 'aktueller Zeichensatz'..'neuer
Zeichensatz' DATEI.
Du mußt also wissen, in welchem Zeichensatz liegt die Datei vor und
in welchen soll es konvertiert werden. Die beiden Pünktchen sagen
recode, daß es konvertieren soll.
recode -l (wie Ludwig) spuckt eine Liste der Zeichensätze, die es
kennt einschließlich derer aliase aus. Das hilft Dir vielleicht
eher weiter als die komplette Manualpage.
Erfolg hatte ich schließlich mit Hilfe von myudit (Unicode-Editor).
Vorgehen folgendermaßen: 
Textdatei in yudit (oder myudit o.ä.) laden. Dann ausprobieren, mit welchem 
"Encoding" etwas vernünftiges angezeigt wird. In meinem Fall war es CP1251, 
also (soviel ich weiß ...) der Windows-Standard (der alte... mittlerweile 
verwendet auch Word AFAIK Unicode...).
Der Windows-Standard ist cp-1252, es handelt sich dabei um eine
Latin-1-Erweiterung. cp-1251 ist der Windows-Standard für Kyrillisch.
Eigentlich nicht schwierig zu erraten, wenn man bedenkt, dass es sich
um kyrillischen Text handelte. ;-)


Gruß,
Bernhard

-- 
* Linux Viruscan.....
  Windows 95 found.  Remove it? (y/n)

Re: Lösung: Re: OT: wer kann mir mit recode / Zeichensätzen helfen

Bernhard Walle