Mailinglist Archive: opensuse-de (1367 mails)

< Previous Next >
Re: sed: Bis Unicode U+0370 (880) alles loeschen
  • From: Al Bogner <suse-linux@xxxxxxxxxxxxxxxxxxxx>
  • Date: Mon, 30 Aug 2010 16:07:59 +0200
  • Message-id: <20100830160759.589ae5c6@xxxxxxxxxxxxxxxxxxxx>
Am Mo, 30 Aug 2010 14:44:20 CEST schrieb Martin Blank:

Hallo Martin,

Vorbemerkung. Gerade sind die anderen Mails reingekommen. Ich schick
das Mail ab, um zu zeigen, was ich herausgefunden habe.


Diese Zeichen sollen also erhalten bleiben:
http://de.wikipedia.org/wiki/Unicode-Block_Griechisch_und_Koptisch
U+0370 (880) - U+03FF (1023)

U+0000 (0) - U+036F (879) soll gelöscht werden.
http://de.wikipedia.org/wiki/Liste_der_Unicode-Bl%C3%B6cke

Al

echo "SONDERZEICHEN (Άναψε)" | sed -e 's/[^\xce\x86-\xce\xbf]//g'
Άναε

Es ist anscheinend grundsätzlich möglich, allerdings: Die Zeichen, die
erhalten bleiben sollen, bilden keinen geschlossenen Block.

Komisch,

echo "SONDERZEICHEN (φχψωϊ)" | sed -e 's/[^\xce\x86-\xce\xbf]//g'
ϊ

Die Zeichen sollten lt. Unicode-Liste in einem Block sein.


echo "SONDERZEICHEN (Αα Ββ Γγ Δδ Εε Ζζ Ηη Θθ Ιι Κκ Λλ Μμ Νν Ξξ Οο Ππ Ρρ
Σσ Ττ Υυ Φφ Χχ Ψψ Ωω)" | sed -e 's/[^\xce\x86-\xce\xbf]//g'
(in 1 Zeile)
ergibt
αΒβΓγΔδΕεΖζΗηΘθΙιΚκΛλΜμΝνΞξΟοΠΡρΣΤΥΦΧΨΩ

Es fehlt also:
Α τ υ φ χ ψ ω

Letztlich brauche ich nur eine Entscheidung, griechische Zeichen in
einer Variable vorhanden, ja oder nein. Ich denke die
Wahrscheinlichkeit ist sehr groß, dass es zur richtigen Entscheidung
kommt

Es sieht danach aus, dass das große griech. Αlfa noch gelöscht wird und
ab dem kleinen τ wieder gelöscht wird.

U+0391 Α 0xce 0x91 &#x391; Α GREEK
CAPITAL LETTER ALPHA

U+03C4 τ 0xcf 0x84 &#x3C4; τ GREEK
SMALL LETTER TAU

U+03C5 υ 0xcf 0x85 &#x3C5; υ GREEK
SMALL LETTER UPSILON

U+03C6 φ 0xcf 0x86 &#x3C6; φ GREEK
SMALL LETTER PHI

U+03C7 χ 0xcf 0x87 &#x3C7; χ GREEK
SMALL LETTER CHI

U+03C8 ψ 0xcf 0x88 &#x3C8; ψ GREEK
SMALL LETTER PSI

U+03C9 ω 0xcf 0x89 &#x3C9; ω GREEK
SMALL LETTER OMEGA


echo "SONDERZEICHEN (ϊϋόύώϏϐϑϒϓϔϕϖϗ)" | sed -e
's/[^\xce\x86-\xce\xbf]//g'

ϊϐϑϒϓϔ

Ist das ein Bug in sed?

Al
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+unsubscribe@xxxxxxxxxxxx
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@xxxxxxxxxxxx

< Previous Next >