Mailinglist Archive: opensuse-programming-de (244 mails)

< Previous Next >
Re: Kommentare aus HTML-Dateien extrahieren
  • From: David Haller <lists@xxxxxxxxxx>
  • Date: Tue, 1 Jul 2003 19:32:55 +0200
  • Message-id: <20030701173255.GA2233@xxxxxxxxxxxxxxxxxx>
Hello,

On Tue, 01 Jul 2003, Werner Schalk wrote:
>ich möchte mit Perl gerne einfache Kommentare (z.B. "<!-- Ich bin ein
>Kommentar -->") aus einer HTML-Datei extrahieren.

Hier noch mit HTML::Parser:

====
#! /usr/bin/perl -w
use strict;
use HTML::Parser;

my $p = HTML::Parser->new( comment_h => [ sub{print @_;}, "text"]);
$p->parse_file(*STDIN);
====

Ein "html2text" waere z.B.:

my $p = HTML::Parser->new( text_h => [ sub{print @_;}, "dtext"]);
$p->parse_file(*STDIN);

Man kann sich also fuer jeden Teil eigene "handler" definieren ;)

-dnh

--
166: Wiedervereinigung
Verschmelzung zweier Staaten ohne Rücksicht auf die Geschichte
(Ralf Muschall)

< Previous Next >
List Navigation
References