Christian Brabandt schrieb:
Hi Martin!
On Mo, 30 Aug 2010, Martin Blank wrote:
echo "SONDERZEICHEN (Άναψε)" | sed -e 's/[^\xce\x86-\xce\xbf]//g' Άναε
Es ist anscheinend grundsätzlich möglich, allerdings: Die Zeichen, die erhalten bleiben sollen, bilden keinen geschlossenen Block. Es sind Lücken vorhanden. In diesen Lücken sind u.a. offensichtlich Zeichen, die nicht im Suchmuster vertreten sein dürfen. Das Ersetzen des rechten Intervallgrenzen 'bf' durch 'c0' führt zu einer Fehlermeldung von sed.
Dadurch wird es erforderlich, für jeden Block eigene Intervallgrenzen anzugeben. Ggf. kommen auch noch einzelne Zeichen dazu.
Ich weiß nicht, wie es bei sed ist, aber im vi ist es so, dass eine Character Range nicht größer als 256 Zeichen sein kann. Ich denke, es ist im sed genau so und daher rühren diese Fehlermeldungen.
regards, Christian
Hmm, das wäre eine Erklärung - dann müßtest Du das halt in Bereiche aufteilen: [\\u0000-\\u00ff] [\\u0100-\\u01ff] [\\u0200-\\u02ff] [\\u0300-\\u036f] sollte dann funzen. Versuchs doch erstmal mit den ersten 256 Zeichen aus dem ersten Bereich, obs geht und was passiert... cu jth -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org