Mailinglist Archive: opensuse-programming-de (149 mails)

< Previous Next >
Re: Kommentare aus HTML-Dateien extrahieren
  • From: Bodo Kaelberer <BodoKaelberer@xxxxxxxxxx>
  • Date: Wed, 2 Jul 2003 00:04:11 +0200
  • Message-id: <39488331.20030702000411@xxxxxxxxxx>
Abend


>> ich möchte mit Perl gerne einfache Kommentare (z.B. "<!-- Ich bin ein
>> Kommentar -->") aus einer HTML-Datei extrahieren. Dazu habe ich mir
>> folgenden Code ausgedacht:

> Am einfachsten geht das, wenn Du die ganze Datei auf einmal in einen String
> einliest:

> {
> local $/;
> my $content = <IN>;
> $content =~ s/<!--.*?-->//gsx;
> }

Was ist mit Zeichenfolgen <!--, die nicht Einleitungen fuer Kommentare
sind (z.B. als Wert fuer ein Attribut oder Javascript)? Und selbiges
mit dem Ende-Marker?
Sind die HTML-Seiten garantiert standard-konform (z.b. sämtliche nicht
zu einem Tag gehoerende > als &gt;)? Das ist nämlich keineswegs Alltag
im Web.


Bye

--
1 Bodo Kaelberer
123 http://www.webkind.de/
3
4 "A button I have made must be pushed." (ip)


< Previous Next >
Follow Ups