Hallo Christian, Am Sonntag 8 Mai 2005 21:52 schrieb Christian Boltz:
Am Sonntag, 8. Mai 2005 19:20 schrieb Helga Fischer:
[...]
Das erklärt die Anzeige im Browser - Du befiehlst ihm ja ausdrücklich, z. B. Ã (Ã) und Ÿ () anzuzeigen.
Ursprünglich waren das mal ä und ß.
Jepp - allerdings in utf-8.
Ja, dem widerspreche ich nicht.
Am Sonntag 8 Mai 2005 18:55 schrieb Helga Fischer:
recode sollte mir nur die Umlaute kodieren.
Hier habe ich wohl ein wenig geschludert, recode ist (in Quanta) ein alias auf: /usr/bin/recode -d latin9..h4.
^^^^^^ Das dürfte der Fehler sein - man latin9 bringt mich zur iso-8859-15 Manpage. Ändere das mal auf utf-8 als Quellcodierung.
Gut, mache ich.
Jetzt die Preisfrage: Wenn ich eine alte Datei von SuSE 8.2 nach SuSE 9.2 rüberkopiere, welche Codierung hat die Datei denn nun? (Dem mount der alten /home-Partition habe ich keine besonderen Schalter mitgegeben).
Der Datei_inhalt_ ändert sich nicht, ist also noch iso-8859-1(5)- codiert.
Dh, wenn ich Ergänzungen reinhaue, sind die utf-8 codiert und ich erhalte einen Mischmasch.
Und wenn ich jetzt auf der SuSE 9.2 drin rumarbeite, ist die Datei jetzt zweifach kodiert? Ich steig' da irgendwie nicht durch.
Wenn Dein Editor nicht aufpasst, bekommst Du einen Mischmasch aus iso-8859-15 und utf-8 :-/
Quantalein hat gar nichts dazu gesagt. Ich befürchte aber, der paßt da nicht auf.
Ich nehme auch liebend gerne ein zweckdienliches RTFM entgegen.
Ein recode-Aufruf zur Konvertierung von iso-8859-15 nach utf-8 müsste genügen.
Ich kann ja wohl schlecht all meinen Krimskrams umcodieren? Ich habe nämlich reichlichst alte Datenbestände, weswegen ich eigentlich auch gar nicht umziehen wollte.
Oder Du konvertierst gleich zu HTML-Entities - das ist zeichensatz-sicher ;-)
Das mache ich sowieso. Da scheint's aber jetzt auch andere zu geben statt des ü und Co.
Stolperfalle: In der HTML-Datei muss im <head> bei <meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"> der richtige Zeichensatz eingestellt sein. (Es sei denn, Du codierst _alle_ Umlaute, dann ist es egal ;-)
Ja, ich guck' mal nach, was ich drin stehen habe. Meine Seiten sind schon etwas angegraut.
Ich habe übrigens ein vim-Plugin im Einsatz, das mir sämtliche Umlaute gleich beim Tippen codiert. Ich tippe "ü" und erhalte ü :-)
Quanta konnte das mal in Urzeiten, dann war die Funktion weg und ich habe mit recode gearbeitet. Muß mal gucken, vielleicht kann er es jetzt wieder. Was ich aber nicht glaube.
Das w3c empfiehlt zwar die Codierung sämtlicher Umlaute nicht ("should not" [1]) - aber es ist IMHO die zuverlässigste Variante ;-)
PS: Trotz 9.3 verwende ich immer noch iso-8859-15 als systemweiten Zeichensatz...
Hmmm... soll ich umstellen probieren? Bisher scheint das utf-8 sich ja nicht so grauslig negativ bemerkbar zu machen. Eine gnupg-Passphrase geht wohl deswegen nicht mehr; sie enthält Umlaute. Die andere funktioniert - keine Umlaute.
[1] "should not" meint beim w3c sowas wie "tu es nur, wenn Du die Folgen genau abschätzen kannst". Das kann ich, die HTML-Datei wird ein paar Byte größer ;-) ;))
Helga -- ## OpenSource-Werkstatt in Reutlingen -- http://www.eschkitai.de/ ## Etikette - Nein Danke? -- http://www.suse-etikette.de.vu/ ## Wer hilft? -- http://hsqldb.sourceforge.net/web/openoffice.html