New subject: Nachtrag

11 Apr 2005

      Hi

Sed läuft bei mir mit utf-8 sehr langsam. Ich habe eine 7 MB-Datei aus 
Labview mit sed bearbeitet "sed 's/,/./g'" . Dabei stellte sich heraus 
das mein Rechner dafür etwa 6-7 Minuten braucht (SuSE 9.2 AMD Athlon XP 
2000+ mit 512 MB RAM, sed-Version 4.1.2). Bei meinem Bürokollegen auf 
seinem Laptop (Debian unstable, Pentium M 1,6 GHz, 512 MB RAM, 
sed-Version 4.1.4) dauert der gleiche Aufruf mit der identischen Datei 
nur zwischen 0,95 und 1,5 Sekunden. 
Da die Rechner zumindest bis auf eine Größenordnung gleich schnell sein 
müssten haben wir nach einer Erklärung gesucht, denn das ist immerhin 
ein Geschwindigkeitsunterschied um den Faktor 400 bis 600. 

Zum Test habe ich bei mir mal LANG und LC_CTYPE auf "de_DE@euro" 
umgestellt. 
Siehe da nun braucht mein Rechner auch nur noch zwischen 0,6 und 0,7 
Sekunden. Was soll denn das? Da mir der Language/Codepage-Horror seit 
langem ein Ärgernis ist, benutze ich aus Überzeugung utf-8. Aber nun 
frage ich mich doch: "zu welchem Preis?". Ein Gewschwindigkeitsnachteil 
um Faktor 500 bei sed kommt mir irgendwie etwas arg viel vor. 

mfg
	Axel

sed bei utf-8 500 mal langsamer

Axel Heinrici

Axel Heinrici

tags

participants (1)