Hallo zusammen, mich würde mal interessieren, warum AWK (gawk) bzw. reguläre Ausdrücke in einem AWK-Programm nicht mit Zeichenketten in Dateien umgehen können, die in "ibmpc" kodiert sind. Ich habe folgendes gemacht: tom@tomcat:~/> transformer.awk source.idl > dest.idl tom@tomcat:~/> === Kurz zur Motivation: transformer.awk ist ein Programm, das aus einer IDL-Datei (source.idl, Interface Definition Language, das nur nebenbei) liest, in manche Zeilen Steuerzeichen für DoxyGen einfügt, und die so manipulierten und die nicht angetasteten Zeilen in eine IDL-Datei (dest.idl) schreibt, so daß eine DoxyGen-taugliche IDL-Datei entsteht. === Die Datei source.idl kommt von einem Windows-System und es wird vom AWK-Programm unverändert nach dest.idl ausgegeben. Die Datei wird aber von less und emacs korrekt angezeigt, d.h. insbesondere die Umlaute und ß. Erst wenn man sie nach ISO-8859-1 umkodiert (s.u. source.lat1.idl), kann das AWK-Programm etwas damit anfangen, und erzeugt einen vernünftigen DoxyGen-Output. tom@tomcat:~/> recode ..lat1 < source.idl > source.lat1.idl Danach werden weder die Umlaute noch ß in less oder emacs korrekt angezeigt. tom@tomcat:~/> recode ..ibmpc < source.lat1.idl > source.ibmpc.idl source.ibmpc.idl kann jetzt wieder korrekt dargestellt werden. Daraus schließe ich messerscharf ;-) daß mein SuSE-Linux als Zeichensatz derzeit "ibmpc" verwendet (wo kann man das einstellen?). Interessant dabei ist, daß tom@tomcat:~/> recode -l | grep ibm gar nichts liefert, im Gegensatz zu tom@tomcat:~/> recode -l | grep lat1 ISO-8859-1 819/CR-LF CP819/CR-LF csISOLatin1 IBM819/CR-LF ISO8859-1 iso-ir-100 ISO_8859-1 ISO_8859-1:1987 l1 lat1 latin1 Latin-1 Wo ist denn nur das alias "ibmpc" definiert? Nun ist die Frage, ob man AWK den Umgang mit beliebigen Zeichensätzen schmackhaft machen kann. Bei UNIX/Liux geht ja bekanntlich alles, aber wie? Übrigens kann AWK auch in einer CygWin-Umgebung unter Windows scheinbar auch nichts mit ibmpc-kodierten Dateien anfangen. Wenn man das ändern kann, dann bitte ich sehr herzlich um einen Hinweis darauf. Vielen Dank schon im voraus. Gruß, Thomas