Am Mo, 30 Aug 2010 14:44:20 CEST schrieb Martin Blank: Hallo Martin, Vorbemerkung. Gerade sind die anderen Mails reingekommen. Ich schick das Mail ab, um zu zeigen, was ich herausgefunden habe.
Diese Zeichen sollen also erhalten bleiben: http://de.wikipedia.org/wiki/Unicode-Block_Griechisch_und_Koptisch U+0370 (880) - U+03FF (1023)
U+0000 (0) - U+036F (879) soll gelöscht werden. http://de.wikipedia.org/wiki/Liste_der_Unicode-Bl%C3%B6cke
Al
echo "SONDERZEICHEN (Άναψε)" | sed -e 's/[^\xce\x86-\xce\xbf]//g' Άναε
Es ist anscheinend grundsätzlich möglich, allerdings: Die Zeichen, die erhalten bleiben sollen, bilden keinen geschlossenen Block.
Komisch, echo "SONDERZEICHEN (φχψωϊ)" | sed -e 's/[^\xce\x86-\xce\xbf]//g' ϊ Die Zeichen sollten lt. Unicode-Liste in einem Block sein. echo "SONDERZEICHEN (Αα Ββ Γγ Δδ Εε Ζζ Ηη Θθ Ιι Κκ Λλ Μμ Νν Ξξ Οο Ππ Ρρ Σσ Ττ Υυ Φφ Χχ Ψψ Ωω)" | sed -e 's/[^\xce\x86-\xce\xbf]//g' (in 1 Zeile) ergibt αΒβΓγΔδΕεΖζΗηΘθΙιΚκΛλΜμΝνΞξΟοΠΡρΣΤΥΦΧΨΩ Es fehlt also: Α τ υ φ χ ψ ω Letztlich brauche ich nur eine Entscheidung, griechische Zeichen in einer Variable vorhanden, ja oder nein. Ich denke die Wahrscheinlichkeit ist sehr groß, dass es zur richtigen Entscheidung kommt Es sieht danach aus, dass das große griech. Αlfa noch gelöscht wird und ab dem kleinen τ wieder gelöscht wird. U+0391 Α 0xce 0x91 Α Α GREEK CAPITAL LETTER ALPHA U+03C4 τ 0xcf 0x84 τ τ GREEK SMALL LETTER TAU U+03C5 υ 0xcf 0x85 υ υ GREEK SMALL LETTER UPSILON U+03C6 φ 0xcf 0x86 φ φ GREEK SMALL LETTER PHI U+03C7 χ 0xcf 0x87 χ χ GREEK SMALL LETTER CHI U+03C8 ψ 0xcf 0x88 ψ ψ GREEK SMALL LETTER PSI U+03C9 ω 0xcf 0x89 ω ω GREEK SMALL LETTER OMEGA echo "SONDERZEICHEN (ϊϋόύώϏϐϑϒϓϔϕϖϗ)" | sed -e 's/[^\xce\x86-\xce\xbf]//g' ϊϐϑϒϓϔ Ist das ein Bug in sed? Al -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org