Am Montag, 5. Januar 2004 23:40 schrieb Herbert Graeber:
Am Montag, 5. Januar 2004 23:03 schrieb Andreas Feile:
Hallo Liste.
[...]
# cat index.html <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> <HTML>
[...]
Verwendet die Datei eine UTF-Codierung? Da gibt es spezielle Bytes am Anfang der Datei, die u. A. die Byte-Reihenfolge codieren. Dann gehören diese Bytes dahin, wo sie sind. Aber ob das Programm das eine solche Datei liest auch damit klar kommt, steht auf einem anderen Blatt... Eventuell musst du dieses erst über diesen Umstand aufklären.
Frage: Wie bekomme ich das hin? Ich höre schon Vorschläge a la pearl, aber davon verstehe ich leider überhaupt nichts... Gibt es einen schnellen Weg?
sed '1s/^...//' <input-file >output-file
Oh, wenn es eine UTF-Kennung ist, sollte man 4 statt 3 Punkte benutzen. Dann ist da noch ein viertes Zeichen, wenn man es auch nicht sieht.
[...]
Herbert