Hallo, Am Sat, 20 Sep 2003, Joerg Rossdeutscher schrieb:
Vom Prinzip her - ja. Allerdings ist der Unterschied zwischen -1 und -15 nur ein einziges Zeichen. -15 enthält den Euro.
Es sind noch ein paar mehr. z.B. 0xA8, 0xB4, 0xB8, 0xBC, 0xBD, 0xBE...
Es gibt aber noch viel mehr Codierungen als nur die beiden. Solltest du zufällig "recode" installiert haben, tipp mal "recode - l", dann bekommst du eine seeeehr lange Liste, welche Codierungen der kennt und verarbeiten kann. Irgendwo da drin sind auch 8859-1 und -15.
'man grep' ist da sehr hilfreich...
evtl. ein Konflikt mit UTF8 oder dergleichen... Sprich: Dein Evolution hat beschlossen, daß am "ä" Schluß ist, das ändert sich nicht dadurch, daß du den Buchstaben eine andere Gestalt gibst. ÄHM? Was ist UTF8?
Ich kenne mich da nicht so richtig gut aus, aber ich probiere es mal:
UTF8 ist ebenso wie 8859-15 eine bestimmte Codierung. Das ist der kommende Standard für Linux. Der Umstieg ist ein ziemlicher Brocken, denn Codierungen wie 8859 "können" nur 255 Zeichen, während solche wie UTF auch Chinesisch und englisch in einer Datei erfassen.
*moep* UTF-8 ist eine bestimmte Variante die 32bit Unicode Zeichen zu kodieren, bei der "zufaelligerweise" die ersten 7bit US-ASCII entsprechen. UTF-8 hat den Vorteil, dass fuer US-ASCII Zeichen auch jew. nur ein Byte benotigt wird. Gehen die Zeichen ueber 7bit/US-ASCII hinaus, so kodiert UTF-8 zuerst mit 2 Bytes, dann mit 3, dann mit 4 und (AFAIK) schliesslich mit 5 Bytes. Ist das Bit 8 == 1, dann heisst das nix anderes, als dass das UTF-8 Zeichen unvollstaendig ist, und dass das naechste Byte herangezogen werden soll -- ebenso bei Bit 15, 23 und 31. Die Details weiss ich jetzt allerdings auch nicht. Da gibt es aber genug Doku zu.
Die Methode ist relativ komplex, das lasse ich jetzt mal außen vor,
Ja. -dnh -- :Mamma, kuck ma, ich bin in der Sicknatur! [Dieter Bruegmann in dag°]