Am Mittwoch, 29. Mai 2002 13:51 schrieb Helga Fischer:
Hi Carsten,
Am Mittwoch, 29. Mai 2002 10:53 schrieb Carsten Ungewitter:
Ich hätte gerne den Text mit 8859-5 (kyrillisch) oder Unicode kodiert, so daß ich ihn auch für's Web verwenden kann (auch dann, wenn der andere Nutzer nicht so einen seltsamen Zeichensatz hat.)
Bin leider auch keine recode-Expertin, aber vielleicht hilft's.
Vermutlich ist recode das Programm der Wahl. Nur leider bin ich nicht firm genug, was Zeichensätze und kodierungen anbelangt, um das Problem zu lösen (und habe auch grade keine Zeit mich durch das komplette Manual durchzuwühlen, um zu sehen, ob das was ich will überhaupt geht.)
recode 8859-5 DATEI funktioniert leider nicht... (das wäre auch zu einfach gewesen ;-).
recode will immer eine Angabe 'aktueller Zeichensatz'..'neuer Zeichensatz' DATEI.
Du mußt also wissen, in welchem Zeichensatz liegt die Datei vor und in welchen soll es konvertiert werden. Die beiden Pünktchen sagen recode, daß es konvertieren soll.
recode -l (wie Ludwig) spuckt eine Liste der Zeichensätze, die es kennt einschließlich derer aliase aus. Das hilft Dir vielleicht eher weiter als die komplette Manualpage.
Hallo, Danke für Eure Tipps. Erfolg hatte ich schließlich mit Hilfe von myudit (Unicode-Editor). Vorgehen folgendermaßen: Textdatei in yudit (oder myudit o.ä.) laden. Dann ausprobieren, mit welchem "Encoding" etwas vernünftiges angezeigt wird. In meinem Fall war es CP1251, also (soviel ich weiß ...) der Windows-Standard (der alte... mittlerweile verwendet auch Word AFAIK Unicode...). Wichtig: man muß jedesmal ->File ->reload machen, damit er die Datei neu lädt. Wenn Sie einmal im Editor angezeigt wird, kann man sie dann nach Herzenslust in verschiedenen Codierungen speichern. Das ganze funktioniert sicher auch mit recode. Aber da dauert das rumprobieren, wenn man nicht genau weiß, mit welchem Encoding die Datei geschrieben ist, einfach länger... ich probier es spaßeshalber mal aus ... ja, der Befehl wäre entsprechend: "recode windows-1251..ISO-8859-5 russisch.txt". Das Problem war, daß ich nicht wußte, in welchem Encoding die Datei stand, und nicht wußte, wie man das herausbekommt. Vielleicht hilft es ja noch jemandem ;-) grüße carsten --