From lists@feile.net Mon Jan 5 22:03:53 2004 From: Andreas Feile To: users-de@lists.opensuse.org Subject: Unsinnige Zeichen aus Datei entfernen Date: Mon, 05 Jan 2004 23:03:50 +0100 Message-ID: <200401052303.50198@inter.netz> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2314393248345230542==" --===============2314393248345230542== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Hallo Liste. Ich nutze zum Erstellen meiner Bildgalerien JAlbum. Die von JAlbum generierten html-Dateien beginnen so: # cat index.html  [...] Woher die ersten drei Zeichen kommen weiß ich nicht, und ich kann sie auch nicht wegbekommen, indem ich die Skins ändere oder andere Skins benutze. Also möchte ich ein Bash-Skript bauen, welches die ersten drei Zeichen einer Datei feststellt, und sie ggf. entfernt. Frage: Wie bekomme ich das hin? Ich höre schon Vorschläge a la pearl, aber davon verstehe ich leider überhaupt nichts... Gibt es einen schnellen Weg? -- Andreas Feile www.feile.net --===============2314393248345230542==-- From thojens@gmx.de Mon Jan 5 22:29:41 2004 From: Thorsten Jens To: users-de@lists.opensuse.org Subject: Re: Unsinnige Zeichen aus Datei entfernen Date: Mon, 05 Jan 2004 23:29:19 +0100 Message-ID: <20040105222919.GA17254@thojens.de> In-Reply-To: <200401052303.50198@inter.netz> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============3711717395654914128==" --===============3711717395654914128== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit * Andreas Feile: > Ich nutze zum Erstellen meiner Bildgalerien JAlbum. Die von JAlbum > generierten html-Dateien beginnen so: > > # cat index.html >  > > [...] Ich denke, dass es sich dabei um eine Markierung handelt, dass die Datei in UTF-8 kodiert ist. Sagt jedenfalls 'file'. Genau kenne ich mich mit Unicode auch nicht aus, aber es gibt so etwas wie Byteorder- Markierungen in den ersten Zeichen einer Datei. gvim zeigt die ersten Zeichen dann auch nicht an. Thorsten -- You talkin' to me? Get my public GPG key: 0xF99C905C --===============3711717395654914128==-- From lists@graeber-clan.de Mon Jan 5 22:46:19 2004 From: Herbert Graeber To: users-de@lists.opensuse.org Subject: Re: Unsinnige Zeichen aus Datei entfernen Date: Mon, 05 Jan 2004 23:40:37 +0100 Message-ID: <200401052340.38227.lists@graeber-clan.de> In-Reply-To: <200401052303.50198@inter.netz> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8640725764524687570==" --===============8640725764524687570== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Am Montag, 5. Januar 2004 23:03 schrieb Andreas Feile: > Hallo Liste. > > Ich nutze zum Erstellen meiner Bildgalerien JAlbum. Die von JAlbum > generierten html-Dateien beginnen so: > > # cat index.html >  > > [...] > > Woher die ersten drei Zeichen kommen weiß ich nicht, und ich kann > sie auch nicht wegbekommen, indem ich die Skins ändere oder andere > Skins benutze. Also möchte ich ein Bash-Skript bauen, welches die > ersten drei Zeichen einer Datei feststellt, und sie ggf. entfernt. Verwendet die Datei eine UTF-Codierung? Da gibt es spezielle Bytes am Anfang der Datei, die u. A. die Byte-Reihenfolge codieren. Dann gehören diese Bytes dahin, wo sie sind. Aber ob das Programm das eine solche Datei liest auch damit klar kommt, steht auf einem anderen Blatt... Eventuell musst du dieses erst über diesen Umstand aufklären. > Frage: Wie bekomme ich das hin? Ich höre schon Vorschläge a la > pearl, aber davon verstehe ich leider überhaupt nichts... Gibt es > einen schnellen Weg? sed '1s/^...//' output-file ist das erste, was mir einfällt (Nur eine von tausend Möglichkeiten). Herbert --===============8640725764524687570==-- From lists@feile.net Mon Jan 5 22:55:24 2004 From: Andreas Feile To: users-de@lists.opensuse.org Subject: Re: Unsinnige Zeichen aus Datei entfernen Date: Mon, 05 Jan 2004 23:55:21 +0100 Message-ID: <200401052355.22248@inter.netz> In-Reply-To: <200401052340.38227.lists@graeber-clan.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8184212096292147539==" --===============8184212096292147539== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Herbert Graeber, Montag, 5. Januar 2004 23:40: > Verwendet die Datei eine UTF-Codierung? Da gibt es spezielle > Bytes am Anfang der Datei, die u. A. die Byte-Reihenfolge > codieren. Dann gehören diese Bytes dahin, wo sie sind. Aber ob > das Programm das eine solche Datei liest auch damit klar kommt, > steht auf einem anderen Blatt... Eventuell musst du dieses erst > über diesen Umstand aufklären. Diese Programme heißen u.a. Internet Explorer ;) , und kommen leider nicht immer damit klar. > sed '1s/^...//' output-file OK, damit werde ich experimentieren. Danke. -- Andreas Feile www.feile.net --===============8184212096292147539==-- From lists@graeber-clan.de Mon Jan 5 23:04:09 2004 From: Herbert Graeber To: users-de@lists.opensuse.org Subject: Re: Unsinnige Zeichen aus Datei entfernen Date: Mon, 05 Jan 2004 23:59:46 +0100 Message-ID: <200401052359.47068.lists@graeber-clan.de> In-Reply-To: <200401052340.38227.lists@graeber-clan.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8390547442711694634==" --===============8390547442711694634== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Am Montag, 5. Januar 2004 23:40 schrieb Herbert Graeber: > Am Montag, 5. Januar 2004 23:03 schrieb Andreas Feile: > > Hallo Liste. > > > > [...] > > > > # cat index.html > >  > > > > [...] > > Verwendet die Datei eine UTF-Codierung? Da gibt es spezielle Bytes > am Anfang der Datei, die u. A. die Byte-Reihenfolge codieren. Dann > gehören diese Bytes dahin, wo sie sind. Aber ob das Programm das > eine solche Datei liest auch damit klar kommt, steht auf einem > anderen Blatt... Eventuell musst du dieses erst über diesen Umstand > aufklären. > > > Frage: Wie bekomme ich das hin? Ich höre schon Vorschläge a la > > pearl, aber davon verstehe ich leider überhaupt nichts... Gibt es > > einen schnellen Weg? > > sed '1s/^...//' output-file Oh, wenn es eine UTF-Kennung ist, sollte man 4 statt 3 Punkte benutzen. Dann ist da noch ein viertes Zeichen, wenn man es auch nicht sieht. > [...] Herbert --===============8390547442711694634==-- From Jan.Trippler@t-online.de Tue Jan 6 00:33:48 2004 From: Jan.Trippler@t-online.de To: users-de@lists.opensuse.org Subject: Re: Unsinnige Zeichen aus Datei entfernen Date: Tue, 06 Jan 2004 01:34:57 +0100 Message-ID: <200401060134.57440.Jan.Trippler@t-online.de> In-Reply-To: <200401052359.47068.lists@graeber-clan.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6846090527446367886==" --===============6846090527446367886== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 7bit Am Montag, 5. Januar 2004 23:59 schrieb Herbert Graeber: [...] > Oh, wenn es eine UTF-Kennung ist, sollte man 4 statt 3 Punkte > benutzen. Dann ist da noch ein viertes Zeichen, wenn man es auch > nicht sieht. Warum nicht einfach auf das < matchen? sed '1s/^.*output-file Jan --===============6846090527446367886==-- From cb.suse@wein-vin-vinum.net Tue Jan 6 23:47:25 2004 From: Christian Boltz To: users-de@lists.opensuse.org Subject: Re: Unsinnige Zeichen aus Datei entfernen Date: Wed, 07 Jan 2004 00:39:16 +0100 Message-ID: <200401062303.17454@tux.boltz.de.vu> In-Reply-To: <200401060134.57440.Jan.Trippler@t-online.de> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6374582436754436666==" --===============6374582436754436666== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Hallo Jan, hallo Herbert, hallo Leute, Am Dienstag, 06. Januar 2004 01:34 schrieb Jan Trippler: > Am Montag, 5. Januar 2004 23:59 schrieb Herbert Graeber: > [...] > > > Oh, wenn es eine UTF-Kennung ist, sollte man 4 statt 3 Punkte > > benutzen. Dann ist da noch ein viertes Zeichen, wenn man es auch > > nicht sieht. > > Warum nicht einfach auf das < matchen? > sed '1s/^.*output-file Besser: sed '1s/^[^<]*