Am Montag 04 Mai 2009 02:46:58 schrieb David Haller: Hallo David,
==== #!/bin/bash sanitize_utf8() { perl -wpe 'BEGIN { use Encode; binmode(STDIN, ":encoding(utf8)"); binmode(STDOUT, ":encoding(utf8)"); } s/[^[:print:]]//g; # undruckbares lᅵschen s/.*/\L$&/g if /Muster1|Muster2/; # nur wenn Muster1 oder Muster2 # in der Zeile vorkommt # erster Buchstabe eines Wortes groᅵ, Rest klein: # s/\b(\w+)\b/\u\L$1\E/g; # weiᅵ jetzt nicht, wie das \w auf # z.B. griechisch passt, aber mit # deinem Beispiel klappts (aus "ta" # wird "Ta") ... ' }
var="Ä°ndim Havuz BaÅına (΀ι Ïα ΞÎÎ»ÎµÎ¹Ï Ïα λεÏÏά)" echo "$var" var="$(echo "$var" | sanitize_utf8)" echo "$var" ====
Im uxterm auf der 11.1 sieht's perfekt aus :) Und wenn ich das \u Escape im letzten (auskommentierten) s/// rausnehm wird auch das à zu Ã.
Bei mir klappt es nicht. Ich schick dir mein kleines Script per PM. Al -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org