Moin, Am Mit, 2003-07-30 um 23.52 schrieb Christian Boltz:
Es scheint also als wäre der String "doppelt" utf-8 kodiert!
Ja :-(
Bei den Fontlingen plagt sich Ratti gerade mit einem ähnlichen Problem rum. Mit "use bytes; no utf8;" hat er schon die Fehlermeldungen losbekommen [1], aber die Ausgabe bringt immer noch die uft8-Doppelbytes (aber immerhin nur einmal codiert ;-)
Falls Du eine Lösung findest, lass es mich wissen ;-)
use bytes; hat mich weitergebracht, wenn auch nicht ans Ziel. no utf8 kann man vergessen, das besagt lediglich, das der perl-Quelltext nicht utf8-codiert ist. Zu dem Kram findet man einen Haufen Doku unter perldoc.com, suchen nach utf8 und neben dem gefundenen Text auch mal ein paar Verweise lesen. Nur: Ich verstehe echt nur Bahnhof.
[1] die kamen übrigens daher, dass Binärdaten (!) in einer RegEx verarbeitet werden und Perl dann "halbe" utf8-Bytes gemeldet hat ;-)
Schwieriges Thema. Sehr schwieriges Thema. Da muß echt mal jemand ein HowTo schreiben. Da hat man eine ordentliche Zeichenkette, in der halt ein CHR(190) vorkommt, und plötzlich fängt perl an, Zweibyte-Characters zu basteln. Kann man mit "use bytes" abstellen, und plötzlich sind die ganz normalen einByte-Umlaute wech. Stöhn. Gibt es VisualBasic für Linux? :-) Gruß, Ratti -- -o) fontlinge | Font management for Linux | Schriftenverwaltung in Linux /\\ http://freshmeat.net/projects/fontlinge/ _\_V http://www.gesindel.de https://sourceforge.net/projects/fontlinge/