headless webseite mit javascript lesen
Hi, lange Zeit konnte ich mit wget -O .log --header='Accept-Charset: utf-8' --header='Accept-Language: de' https://www.dhl.de/de/privatkunden/pakete-empfangen/verfolgen.html?idc=[Paketnummer]&zip=[plz]&lang=de schön die Zustellinfos von uns versandter Pakete bei DHL abholen, ein bißchen Scripting und fertig. (Die Daten nach erfolgter Zustellung kriege ich via DHL-Report, aber nicht, dass das Paket grad im Zustellzentrum X lagert, weil...) Die Privatkundenseite oben geht manuell wie gehabt... aber die konkret interessierende Info zum Paket wird nun per Javascript eingeblendet. Was mich zu der Frage führt, ob man das headless hinbekommt, sie mit JS abzurufen. Für w3m sollte es irgendeine JS-Extension geben, aber die habe ich nicht gefunden. Phantomjs sieht ganz erfolgversprechend aus, aber da fehlt mir ktuell noch der zündende Gedanke... Vielleicht hat sich hier ja schonmal wer damit rumgeschlagen... Thx für jeden Hinweis! -- cu jth
participants (1)
-
Jörg Thümmler