Re: Perl und utf-8

30 Jul 2003

      Moin,

Am Mit, 2003-07-30 um 23.52 schrieb Christian Boltz:
...
...
Es scheint also als wäre der String "doppelt" utf-8 kodiert!
Ja :-(
Bei den Fontlingen plagt sich Ratti gerade mit einem ähnlichen Problem 
rum. Mit "use bytes; no utf8;" hat er schon die Fehlermeldungen 
losbekommen [1], aber die Ausgabe bringt immer noch die 
uft8-Doppelbytes (aber immerhin nur einmal codiert ;-)
Falls Du eine Lösung findest, lass es mich wissen ;-)
use bytes; hat mich weitergebracht, wenn auch nicht ans Ziel. no utf8
kann man vergessen, das besagt lediglich, das der perl-Quelltext nicht
utf8-codiert ist.

Zu dem Kram findet man einen Haufen Doku unter perldoc.com, suchen nach
utf8 und neben dem gefundenen Text auch mal ein paar Verweise lesen.

Nur: Ich verstehe echt nur Bahnhof.
...
[1] die kamen übrigens daher, dass Binärdaten (!) in einer RegEx
    verarbeitet werden und Perl dann "halbe" utf8-Bytes gemeldet hat ;-)
Schwieriges Thema. Sehr schwieriges Thema. Da muß echt mal jemand ein
HowTo schreiben. 
Da hat man eine ordentliche Zeichenkette, in der halt ein CHR(190)
vorkommt, und plötzlich fängt perl an, Zweibyte-Characters zu basteln.
Kann man mit "use bytes" abstellen, und plötzlich sind die ganz normalen
einByte-Umlaute wech. Stöhn. Gibt es VisualBasic für Linux? :-)

Gruß, Ratti

-- 
 -o)    fontlinge  | Font management for Linux  | Schriftenverwaltung in Linux
 /\\                                  http://freshmeat.net/projects/fontlinge/
_\_V    http://www.gesindel.de     https://sourceforge.net/projects/fontlinge/

Re: Perl und utf-8

Joerg Rossdeutscher