Hallo, Am Mon, 30 Aug 2010, Al Bogner schrieb:
Es geht darum, dass ?????????? übrigbleibt, es sollen also nur griechische Zeichen übrig bleiben, _alle_ anderen, und nicht nur ein bestimmtes Zeichen, sollen gelöscht werden.
Diese Zeichen sollen also erhalten bleiben: http://de.wikipedia.org/wiki/Unicode-Block_Griechisch_und_Koptisch U+0370 (880) - U+03FF (1023)
Dann mach das auch (wenn du rausgefunden hast, wie man die UTF-Sachen an sed verfüttert. Um mal bei der \Uxxxx Version zu bleiben: sed 's/[^\U370-\U03FF]//g' Testen kannst du auch noch: perl -ne 'use Encode; $_ = decode("ut8", $_); s/[^\x{0370}-\x{03FF}]//g; print encode("utf8",$_);' Soweit ich das hier testen kann sollte das klappen ;) $ echo 'äöü µ' | recode latin9..utf8 | perl -ne 'use Encode; $_=decode("8", $_);s/[\x{00F5}-\x{00FF}]//g; print encode("utf8",$_);' | recode utf8..latin9 ä µ $ :) HTH, -dnh -- In the beginning the Universe was created. This has made a lot of people very angry and been widely regarded as a bad move. -- THHGTTG, Douglas Adams -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org