Mailinglist Archive: opensuse-programming-de (149 mails)
| < Previous | Next > |
Re: Kommentare aus HTML-Dateien extrahieren
- From: Bodo Kaelberer <BodoKaelberer@xxxxxxxxxx>
- Date: Wed, 2 Jul 2003 00:04:11 +0200
- Message-id: <39488331.20030702000411@xxxxxxxxxx>
Abend
>> ich möchte mit Perl gerne einfache Kommentare (z.B. "<!-- Ich bin ein
>> Kommentar -->") aus einer HTML-Datei extrahieren. Dazu habe ich mir
>> folgenden Code ausgedacht:
> Am einfachsten geht das, wenn Du die ganze Datei auf einmal in einen String
> einliest:
> {
> local $/;
> my $content = <IN>;
> $content =~ s/<!--.*?-->//gsx;
> }
Was ist mit Zeichenfolgen <!--, die nicht Einleitungen fuer Kommentare
sind (z.B. als Wert fuer ein Attribut oder Javascript)? Und selbiges
mit dem Ende-Marker?
Sind die HTML-Seiten garantiert standard-konform (z.b. sämtliche nicht
zu einem Tag gehoerende > als >)? Das ist nämlich keineswegs Alltag
im Web.
Bye
--
1 Bodo Kaelberer
123 http://www.webkind.de/
3
4 "A button I have made must be pushed." (ip)
>> ich möchte mit Perl gerne einfache Kommentare (z.B. "<!-- Ich bin ein
>> Kommentar -->") aus einer HTML-Datei extrahieren. Dazu habe ich mir
>> folgenden Code ausgedacht:
> Am einfachsten geht das, wenn Du die ganze Datei auf einmal in einen String
> einliest:
> {
> local $/;
> my $content = <IN>;
> $content =~ s/<!--.*?-->//gsx;
> }
Was ist mit Zeichenfolgen <!--, die nicht Einleitungen fuer Kommentare
sind (z.B. als Wert fuer ein Attribut oder Javascript)? Und selbiges
mit dem Ende-Marker?
Sind die HTML-Seiten garantiert standard-konform (z.b. sämtliche nicht
zu einem Tag gehoerende > als >)? Das ist nämlich keineswegs Alltag
im Web.
Bye
--
1 Bodo Kaelberer
123 http://www.webkind.de/
3
4 "A button I have made must be pushed." (ip)
| < Previous | Next > |