Frage zu Datensammeln mit wget

2 Jun 2020

      Hallo Liste!

Ich habe ein kleines bash-Skript gebaut, das Suchergebnisse von der
www-Seite von Der Spiegel sammeln sollte. Die entsprechende URL ist: 
https://www.spiegel.de/suche/?suchbegriff=green+deal&seite=1

Der letzte Parameter (seite) wird in einer Schleife inkrementiert.

Die Seite soll mit wget herunterladen werden (wget -O - "<URL>" >>
Resultate.html).

Nun aber spuckt wget nur eine ergebnislose Seite aus, d.h. die
Seitenstruktur ist schon korrekt, es fehlen aber alle Links zu den
Suchergebnissen. Bei genauerem Hinschauen habe ich festgestellt, dass
dort steht "Keine Ergebnisse für den Suchbegriff "" " (oder so
ähnlich). Also wird der Suchbegriff in der URL gar nicht übermittelt,
wenn ich das richtig verstehe.

Meine Frage: kann ich das mit wget machen, und falls ja, wie muss der
Befehl aufgebaut werden (welche Optionen)?

Ich habe mich nicht an wget festgenagelt :-) Wenn es eine bessere
Methode oder bessere Tools gibt, mit denen ich mein Datensammeln
erfolgreich hinkriege, bin ich offen für Vorschläge. Ich habe schon
Dumping mit w3m versucht, auch das haut nicht hin...

Vielen Dank schon im Voraus!

Gruß,

Kimmo

-- 
Um die Liste abzubestellen, schicken Sie eine Mail an:
    opensuse-de+unsubscribe@opensuse.org
Um den Listen Administrator zu erreichen, schicken
Sie eine Mail an: opensuse-de+owner@opensuse.org

Kimmo Elo

Matthias Fehring

tags

participants (2)