Re: Links aus html-Seite extrahieren

10 Mar 2003


      * Werner Schalk  [030310 14:36]:
...
Hallo,
nachdem mir beim letzten Mal so toll geholfen
worden ist (nochmals vielen Dank an alle),
habe ich eine erneute Frage und hoffe, daß
mir jemand helfen kann. Ich würde gerne alle
Links innerhalb einer HTML-Seite extrahieren.
Die Ursprungsdatei sieht u.a. so aus, wobei
der hier beispielhaft enthaltene Link mehrfach
vorhanden ist (immer mit so fiesen Zeilenumbrüchen):
<html><title>bla</title>
bla
blubb
<h1>bla</h1>
<a 
href="/cgi-bin/search/query.cgi&artikel=A18X55"><img border="0"
src="/pics/query.gif" /></a>
<h1>bla</h1>
<hr>
bla
blubb
</html>
Wie kann ich alle Links, die das o.g. Format haben
aus einer HTML-Datei extrahieren? Ich würde gerne
nur den Teil haben wollen, der innerhalb der Anführungszeichen
(z.B./cgi-bin/search/query.cgi&artikel=A18X55) steht.
Vielen Dank für Eure Hilfe und schönen Gruß,
Werner.
use perl
use HTML::Parser


cu
-- 
echo '@a=(A..Z,a..z," ");$t="a"x16;{for($x=0,$|=$n=30; $n--;){for($l=$t;
1

Re: Links aus html-Seite extrahieren

Remo Behn