Lösung: Re: OT: wer kann mir mit recode / Zeichensätzen helfen

1 Jun 2002

      Am Mittwoch, 29. Mai 2002 13:51 schrieb Helga Fischer:
...
Hi Carsten,
Am Mittwoch, 29. Mai 2002 10:53 schrieb Carsten Ungewitter:
...
Ich hätte gerne den Text mit 8859-5 (kyrillisch) oder Unicode
kodiert, so daß ich ihn auch für's Web verwenden kann (auch dann,
wenn der andere Nutzer nicht so einen seltsamen Zeichensatz hat.)
Bin leider auch keine recode-Expertin, aber vielleicht hilft's.
...
Vermutlich ist recode das Programm der Wahl. Nur leider bin ich
nicht firm genug, was Zeichensätze und kodierungen anbelangt, um
das Problem zu lösen (und habe auch grade keine Zeit mich durch
das komplette Manual durchzuwühlen, um zu sehen, ob das was ich
will überhaupt geht.)
recode 8859-5 DATEI
funktioniert leider nicht... (das wäre auch zu einfach gewesen
;-).
recode will immer eine Angabe 'aktueller Zeichensatz'..'neuer
Zeichensatz' DATEI.
Du mußt also wissen, in welchem Zeichensatz liegt die Datei vor und
in welchen soll es konvertiert werden. Die beiden Pünktchen sagen
recode, daß es konvertieren soll.
recode -l (wie Ludwig) spuckt eine Liste der Zeichensätze, die es
kennt einschließlich derer aliase aus. Das hilft Dir vielleicht
eher weiter als die komplette Manualpage.
Hallo, Danke für Eure Tipps.
Erfolg hatte ich schließlich mit Hilfe von myudit (Unicode-Editor).

Vorgehen folgendermaßen: 
Textdatei in yudit (oder myudit o.ä.) laden. Dann ausprobieren, mit welchem 
"Encoding" etwas vernünftiges angezeigt wird. In meinem Fall war es CP1251, 
also (soviel ich weiß ...) der Windows-Standard (der alte... mittlerweile 
verwendet auch Word AFAIK Unicode...).

Wichtig: man muß jedesmal ->File ->reload machen, damit er die Datei neu 
lädt. Wenn Sie einmal im Editor angezeigt wird, kann man sie dann nach 
Herzenslust in verschiedenen Codierungen speichern.

Das ganze funktioniert sicher auch mit recode. Aber da dauert das 
rumprobieren, wenn man nicht genau weiß, mit welchem Encoding die Datei 
geschrieben ist, einfach länger... ich probier es spaßeshalber mal aus ...
ja, der Befehl wäre entsprechend: "recode  windows-1251..ISO-8859-5 
russisch.txt".

Das Problem war, daß ich nicht wußte, in welchem Encoding die Datei stand, 
und nicht wußte, wie man das herausbekommt.

Vielleicht hilft es ja noch jemandem ;-)

grüße
carsten
--