Mailinglist Archive: opensuse-de (1367 mails)

< Previous Next >
Re: sed: Bis Unicode U+0370 (880) alles loeschen
  • From: Martin Blank <blankmrty@xxxxxx>
  • Date: Mon, 30 Aug 2010 13:21:22 +0200
  • Message-id: <4C7B9432.507@xxxxxx>
Martin Blank schrieb:
Al Bogner schrieb:

Ich möchte bis ausschließlich U+0370 (hex) bzw. 880 (dezimal) unter
UTF-8 alles löschen. tr dürfte das nicht können. Ich habe das probiert:

tr -d '[\0-\879]'

Mit sed komme ich mit der Syntax dazu nicht klar. Wie macht man das mit
sed? Andere Lösungen als mit sed sind natürlich auch willkommen.

Sollte nach U+03FF (1023) unerwarteter Weise noch was bleiben, so
sollte das optimalerweise auch noch gelöscht werden, wenn das nicht zu
rechenaufwendig ist.

Al


Ungetestet: sed -e '/\\U0370/d' für das eine Zeichen, '/\\U0370*/d' bis
zum Zeilenende, '/\\U0370/,/$/d' für alle Zeilen ab der ersten
Fundstelle. Die Zeile, die das Zeichen enthält, wird dann auch
vollständig - inklusiv der Zeichen vom Zeilenanfang bis zur Fundstelle -
gelöscht.


Es muss natürlich '/\\U0370.*/d' heissen;-)

--
Mit freundlichen Grüßen

Martin Blank

--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+unsubscribe@xxxxxxxxxxxx
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@xxxxxxxxxxxx

< Previous Next >
References