Re: utf8 macht mir Probleme

8 May 2005


      Hallo Christian,

Am Sonntag  8 Mai 2005 21:52 schrieb Christian Boltz:
...
Am Sonntag, 8. Mai 2005 19:20 schrieb Helga Fischer:
[...]
...
Das erklärt die Anzeige im Browser - Du befiehlst ihm ja
ausdrücklich, z. B. Ã (Ã) und Ÿ (Ÿ) anzuzeigen.
...
Ursprünglich waren das mal ä und ß.
Jepp - allerdings in utf-8.
Ja, dem widerspreche ich nicht.
...
...
Am Sonntag  8 Mai 2005 18:55 schrieb Helga Fischer:
...
recode sollte mir nur die Umlaute kodieren.
Hier habe ich wohl ein wenig geschludert, recode ist (in Quanta)
ein alias auf: /usr/bin/recode -d latin9..h4.
^^^^^^
Das dürfte der Fehler sein -   man latin9   bringt mich zur
iso-8859-15 Manpage. Ändere das mal auf utf-8 als Quellcodierung.
Gut, mache ich.
...
...
Jetzt die Preisfrage: Wenn ich eine alte Datei von SuSE 8.2 nach
SuSE 9.2 rüberkopiere, welche Codierung hat die Datei denn nun?
(Dem mount der alten /home-Partition habe ich keine besonderen
Schalter mitgegeben).
Der Datei_inhalt_ ändert sich nicht, ist also noch iso-8859-1(5)-
codiert.
Dh, wenn ich Ergänzungen reinhaue, sind die utf-8 codiert und ich 
erhalte einen Mischmasch.
...
...
Und wenn ich jetzt auf der SuSE 9.2 drin rumarbeite, ist die
Datei jetzt zweifach kodiert? Ich steig' da irgendwie nicht
durch.
Wenn Dein Editor nicht aufpasst, bekommst Du einen Mischmasch aus
iso-8859-15 und utf-8 :-/
Quantalein hat gar nichts dazu gesagt. Ich befürchte aber, der paßt 
da nicht auf.
...
...
Ich nehme auch liebend gerne ein zweckdienliches RTFM entgegen.
Ein recode-Aufruf zur Konvertierung von iso-8859-15 nach utf-8
müsste genügen.
Ich kann ja wohl schlecht all meinen Krimskrams umcodieren? Ich habe 
nämlich reichlichst alte Datenbestände, weswegen ich eigentlich auch 
gar nicht umziehen wollte.
...
Oder Du konvertierst gleich zu HTML-Entities - das 
ist zeichensatz-sicher ;-)
Das mache ich sowieso. Da scheint's aber jetzt auch andere zu geben 
statt des ü und Co.
...
Stolperfalle: In der HTML-Datei muss im <head> bei   <meta
http-equiv="content-type" content="text/html; charset=ISO-8859-1">
der richtige Zeichensatz eingestellt sein. (Es sei denn, Du
codierst _alle_ Umlaute, dann ist es egal ;-)
Ja, ich guck' mal nach, was ich drin stehen habe. Meine Seiten sind 
schon etwas angegraut.
...
Ich habe übrigens ein vim-Plugin im Einsatz, das mir sämtliche
Umlaute gleich beim Tippen codiert. Ich tippe "ü" und erhalte
ü   :-)
Quanta konnte das mal in Urzeiten, dann war die Funktion weg und ich 
habe mit recode gearbeitet. Muß mal gucken, vielleicht kann er es 
jetzt wieder. Was ich aber nicht glaube.
...
Das w3c empfiehlt zwar die Codierung sämtlicher Umlaute nicht
("should not" [1]) - aber es ist IMHO die zuverlässigste Variante
;-)
...
PS: Trotz 9.3 verwende ich immer noch iso-8859-15 als systemweiten
    Zeichensatz...
Hmmm... soll ich umstellen probieren? Bisher scheint das utf-8 sich 
ja nicht so grauslig negativ bemerkbar zu machen. Eine 
gnupg-Passphrase geht wohl deswegen nicht mehr; sie enthält Umlaute. 
Die andere funktioniert - keine Umlaute.
...
[1] "should not" meint beim w3c sowas wie "tu es nur, wenn Du die
Folgen genau abschätzen kannst". Das kann ich, die HTML-Datei wird
ein paar Byte größer ;-)
;))
Helga

-- 
## OpenSource-Werkstatt in Reutlingen -- http://www.eschkitai.de/
## Etikette - Nein Danke? -- http://www.suse-etikette.de.vu/
## Wer hilft? -- http://hsqldb.sourceforge.net/web/openoffice.html