Re: utf8 macht mir Probleme

8 May 2005

      Hallo Helga, hallo Leute,

Am Sonntag, 8. Mai 2005 19:20 schrieb Helga Fischer:
...
Das ist ein neuer Text (in der ursprünglichen Datei):
So siehts im Browser aus:
Und es kann passieren, daÃŸ eine Liste nicht mehr zu reagieren
scheint. Das Ã€uÃŸert sich darin, daÃŸ Deine geschriebenen Mails
nicht mehr zurÃŒckkommen...
Quältext so:
Und es kann passieren, daÃŸ eine Liste nicht mehr zu
reagieren scheint. Das Ã€uÃŸert sich darin,
daÃŸ Deine geschriebenen Mails nicht mehr
Das erklärt die Anzeige im Browser - Du befiehlst ihm ja ausdrücklich, 
z. B. Ã (Ã) und Ÿ (Ÿ) anzuzeigen.
...
Ursprünglich waren das mal ä und ß.
Jepp - allerdings in utf-8.
...
Am Sonntag  8 Mai 2005 18:55 schrieb Helga Fischer:
...
recode sollte mir nur die Umlaute kodieren.
Hier habe ich wohl ein wenig geschludert, recode ist (in Quanta) ein
alias auf: /usr/bin/recode -d latin9..h4.
                                ^^^^^^
Das dürfte der Fehler sein -   man latin9   bringt mich zur iso-8859-15 
Manpage. Ändere das mal auf utf-8 als Quellcodierung.
...
Jetzt die Preisfrage: Wenn ich eine alte Datei von SuSE 8.2 nach SuSE
9.2 rüberkopiere, welche Codierung hat die Datei denn nun? (Dem
mount der alten /home-Partition habe ich keine besonderen Schalter
mitgegeben).
Der Datei_inhalt_ ändert sich nicht, ist also noch iso-8859-1(5)-
codiert.
...
Und wenn ich jetzt auf der SuSE 9.2 drin rumarbeite, ist die Datei
jetzt zweifach kodiert? Ich steig' da irgendwie nicht durch.
Wenn Dein Editor nicht aufpasst, bekommst Du einen Mischmasch aus 
iso-8859-15 und utf-8 :-/
...
Ich nehme auch liebend gerne ein zweckdienliches RTFM entgegen.
Ein recode-Aufruf zur Konvertierung von iso-8859-15 nach utf-8 müsste 
genügen. Oder Du konvertierst gleich zu HTML-Entities - das ist 
zeichensatz-sicher ;-)

Stolperfalle: In der HTML-Datei muss im <head> bei   <meta 
http-equiv="content-type" content="text/html; charset=ISO-8859-1">   
der richtige Zeichensatz eingestellt sein. (Es sei denn, Du codierst 
_alle_ Umlaute, dann ist es egal ;-)

Ich habe übrigens ein vim-Plugin im Einsatz, das mir sämtliche Umlaute 
gleich beim Tippen codiert. Ich tippe "ü" und erhalte ü   :-)

Das w3c empfiehlt zwar die Codierung sämtlicher Umlaute nicht ("should 
not" [1]) - aber es ist IMHO die zuverlässigste Variante ;-)

Gruß

Christian Boltz

PS: Trotz 9.3 verwende ich immer noch iso-8859-15 als systemweiten 
    Zeichensatz...

[1] "should not" meint beim w3c sowas wie "tu es nur, wenn Du die Folgen 
    genau abschätzen kannst". Das kann ich, die HTML-Datei wird ein paar 
    Byte größer ;-)
-- 
[SuSE-Plugger] Ist auch nichts von KDE, sondern ist eine SuSE-
spezifische Fehlentwicklung.   [Manfred Tremmel in suse-linux]