Mailinglist Archive: opensuse-programming-de (244 mails)
| < Previous | Next > |
Re: Kommentare aus HTML-Dateien extrahieren
- From: David Haller <lists@xxxxxxxxxx>
- Date: Tue, 1 Jul 2003 19:32:55 +0200
- Message-id: <20030701173255.GA2233@xxxxxxxxxxxxxxxxxx>
Hello,
On Tue, 01 Jul 2003, Werner Schalk wrote:
>ich möchte mit Perl gerne einfache Kommentare (z.B. "<!-- Ich bin ein
>Kommentar -->") aus einer HTML-Datei extrahieren.
Hier noch mit HTML::Parser:
====
#! /usr/bin/perl -w
use strict;
use HTML::Parser;
my $p = HTML::Parser->new( comment_h => [ sub{print @_;}, "text"]);
$p->parse_file(*STDIN);
====
Ein "html2text" waere z.B.:
my $p = HTML::Parser->new( text_h => [ sub{print @_;}, "dtext"]);
$p->parse_file(*STDIN);
Man kann sich also fuer jeden Teil eigene "handler" definieren ;)
-dnh
--
166: Wiedervereinigung
Verschmelzung zweier Staaten ohne Rücksicht auf die Geschichte
(Ralf Muschall)
On Tue, 01 Jul 2003, Werner Schalk wrote:
>ich möchte mit Perl gerne einfache Kommentare (z.B. "<!-- Ich bin ein
>Kommentar -->") aus einer HTML-Datei extrahieren.
Hier noch mit HTML::Parser:
====
#! /usr/bin/perl -w
use strict;
use HTML::Parser;
my $p = HTML::Parser->new( comment_h => [ sub{print @_;}, "text"]);
$p->parse_file(*STDIN);
====
Ein "html2text" waere z.B.:
my $p = HTML::Parser->new( text_h => [ sub{print @_;}, "dtext"]);
$p->parse_file(*STDIN);
Man kann sich also fuer jeden Teil eigene "handler" definieren ;)
-dnh
--
166: Wiedervereinigung
Verschmelzung zweier Staaten ohne Rücksicht auf die Geschichte
(Ralf Muschall)
| < Previous | Next > |