Am Montag, 5. Januar 2004 23:03 schrieb Andreas Feile:
Hallo Liste.
Ich nutze zum Erstellen meiner Bildgalerien JAlbum. Die von JAlbum generierten html-Dateien beginnen so:
# cat index.html <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN"> <HTML> [...]
Woher die ersten drei Zeichen kommen weiß ich nicht, und ich kann sie auch nicht wegbekommen, indem ich die Skins ändere oder andere Skins benutze. Also möchte ich ein Bash-Skript bauen, welches die ersten drei Zeichen einer Datei feststellt, und sie ggf. entfernt.
Verwendet die Datei eine UTF-Codierung? Da gibt es spezielle Bytes am Anfang der Datei, die u. A. die Byte-Reihenfolge codieren. Dann gehören diese Bytes dahin, wo sie sind. Aber ob das Programm das eine solche Datei liest auch damit klar kommt, steht auf einem anderen Blatt... Eventuell musst du dieses erst über diesen Umstand aufklären.
Frage: Wie bekomme ich das hin? Ich höre schon Vorschläge a la pearl, aber davon verstehe ich leider überhaupt nichts... Gibt es einen schnellen Weg?
sed '1s/^...//' <input-file >output-file ist das erste, was mir einfällt (Nur eine von tausend Möglichkeiten). Herbert