Hallo Helga, hallo Leute, Am Sonntag, 8. Mai 2005 19:20 schrieb Helga Fischer:
Das ist ein neuer Text (in der ursprünglichen Datei):
So siehts im Browser aus: Und es kann passieren, daß eine Liste nicht mehr zu reagieren scheint. Das Àußert sich darin, daß Deine geschriebenen Mails nicht mehr zurÌckkommen...
Quältext so: Und es kann passieren, daà eine Liste nicht mehr zu reagieren scheint. Das ÀuÃert sich darin, daà Deine geschriebenen Mails nicht mehr
Das erklärt die Anzeige im Browser - Du befiehlst ihm ja ausdrücklich, z. B. Ã (Ã) und Ÿ () anzuzeigen.
Ursprünglich waren das mal ä und ß.
Jepp - allerdings in utf-8.
Am Sonntag 8 Mai 2005 18:55 schrieb Helga Fischer:
recode sollte mir nur die Umlaute kodieren.
Hier habe ich wohl ein wenig geschludert, recode ist (in Quanta) ein alias auf: /usr/bin/recode -d latin9..h4. ^^^^^^ Das dürfte der Fehler sein - man latin9 bringt mich zur iso-8859-15 Manpage. Ändere das mal auf utf-8 als Quellcodierung.
Jetzt die Preisfrage: Wenn ich eine alte Datei von SuSE 8.2 nach SuSE 9.2 rüberkopiere, welche Codierung hat die Datei denn nun? (Dem mount der alten /home-Partition habe ich keine besonderen Schalter mitgegeben).
Der Datei_inhalt_ ändert sich nicht, ist also noch iso-8859-1(5)- codiert.
Und wenn ich jetzt auf der SuSE 9.2 drin rumarbeite, ist die Datei jetzt zweifach kodiert? Ich steig' da irgendwie nicht durch.
Wenn Dein Editor nicht aufpasst, bekommst Du einen Mischmasch aus iso-8859-15 und utf-8 :-/
Ich nehme auch liebend gerne ein zweckdienliches RTFM entgegen.
Ein recode-Aufruf zur Konvertierung von iso-8859-15 nach utf-8 müsste genügen. Oder Du konvertierst gleich zu HTML-Entities - das ist zeichensatz-sicher ;-) Stolperfalle: In der HTML-Datei muss im <head> bei <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> der richtige Zeichensatz eingestellt sein. (Es sei denn, Du codierst _alle_ Umlaute, dann ist es egal ;-) Ich habe übrigens ein vim-Plugin im Einsatz, das mir sämtliche Umlaute gleich beim Tippen codiert. Ich tippe "ü" und erhalte ü :-) Das w3c empfiehlt zwar die Codierung sämtlicher Umlaute nicht ("should not" [1]) - aber es ist IMHO die zuverlässigste Variante ;-) Gruß Christian Boltz PS: Trotz 9.3 verwende ich immer noch iso-8859-15 als systemweiten Zeichensatz... [1] "should not" meint beim w3c sowas wie "tu es nur, wenn Du die Folgen genau abschätzen kannst". Das kann ich, die HTML-Datei wird ein paar Byte größer ;-) -- [SuSE-Plugger] Ist auch nichts von KDE, sondern ist eine SuSE- spezifische Fehlentwicklung. [Manfred Tremmel in suse-linux]