Re: Unsinnige Zeichen aus Datei entfernen

5 Jan 2004

      Am Montag, 5. Januar 2004 23:03 schrieb Andreas Feile:
...
Hallo Liste.
Ich nutze zum Erstellen meiner Bildgalerien JAlbum. Die von JAlbum
generierten html-Dateien beginnen so:
# cat index.html
ï»¿<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2 Final//EN">
<HTML>
[...]
Woher die ersten drei Zeichen kommen weiß ich nicht, und ich kann
sie auch nicht wegbekommen, indem ich die Skins ändere oder andere
Skins benutze. Also möchte ich ein Bash-Skript bauen, welches die
ersten drei Zeichen einer Datei feststellt, und sie ggf. entfernt.
Verwendet die Datei eine UTF-Codierung? Da gibt es spezielle Bytes am 
Anfang der Datei, die u. A. die Byte-Reihenfolge codieren. Dann 
gehören diese Bytes dahin, wo sie sind. Aber ob das Programm das eine 
solche Datei liest auch damit klar kommt, steht auf einem anderen 
Blatt... Eventuell musst du dieses erst über diesen Umstand 
aufklären.
...
Frage: Wie bekomme ich das hin? Ich höre schon Vorschläge a la
pearl, aber davon verstehe ich leider überhaupt nichts... Gibt es
einen schnellen Weg?
sed '1s/^...//' <input-file >output-file

ist das erste, was mir einfällt (Nur eine von tausend Möglichkeiten).

Herbert

Re: Unsinnige Zeichen aus Datei entfernen

Herbert Graeber