On Sat, 01 Jun 2002 at 15:38 (+0200), Carsten Ungewitter wrote:
Am Mittwoch, 29. Mai 2002 13:51 schrieb Helga Fischer:
Am Mittwoch, 29. Mai 2002 10:53 schrieb Carsten Ungewitter:
Ich hätte gerne den Text mit 8859-5 (kyrillisch) oder Unicode kodiert, so daß ich ihn auch für's Web verwenden kann (auch dann, wenn der andere Nutzer nicht so einen seltsamen Zeichensatz hat.)
Bin leider auch keine recode-Expertin, aber vielleicht hilft's.
Vermutlich ist recode das Programm der Wahl. Nur leider bin ich nicht firm genug, was Zeichensätze und kodierungen anbelangt, um das Problem zu lösen (und habe auch grade keine Zeit mich durch das komplette Manual durchzuwühlen, um zu sehen, ob das was ich will überhaupt geht.)
recode 8859-5 DATEI funktioniert leider nicht... (das wäre auch zu einfach gewesen ;-).
recode will immer eine Angabe 'aktueller Zeichensatz'..'neuer Zeichensatz' DATEI.
Du mußt also wissen, in welchem Zeichensatz liegt die Datei vor und in welchen soll es konvertiert werden. Die beiden Pünktchen sagen recode, daß es konvertieren soll.
recode -l (wie Ludwig) spuckt eine Liste der Zeichensätze, die es kennt einschließlich derer aliase aus. Das hilft Dir vielleicht eher weiter als die komplette Manualpage.
Erfolg hatte ich schließlich mit Hilfe von myudit (Unicode-Editor).
Vorgehen folgendermaßen: Textdatei in yudit (oder myudit o.ä.) laden. Dann ausprobieren, mit welchem "Encoding" etwas vernünftiges angezeigt wird. In meinem Fall war es CP1251, also (soviel ich weiß ...) der Windows-Standard (der alte... mittlerweile verwendet auch Word AFAIK Unicode...).
Der Windows-Standard ist cp-1252, es handelt sich dabei um eine Latin-1-Erweiterung. cp-1251 ist der Windows-Standard für Kyrillisch. Eigentlich nicht schwierig zu erraten, wenn man bedenkt, dass es sich um kyrillischen Text handelte. ;-) Gruß, Bernhard -- * Linux Viruscan..... Windows 95 found. Remove it? (y/n)