Am Sonntag, 3. August 2003 15:16 schrieb Christian Ullrich:
* Michael Hoeller schrieb am Sonntag, 2003-08-03:
Ein Provider stellt Bilder zum Download zur Verfügung. Das Problem ist wohl die Rechte Struktur ich kann jedes Bild der Homepage wenn ich es anklicke runterladen, Auch so wenn ich den URL explizit angebe. Wenn ich aber mit www.provider/.../* zu spiegeln versuche bekomme ich einer 403, forbidden. Wie kann ich die Bilder automatisch runterladen? Jedes einzeln auf der Homepage anzuklicken und explizit zu speichern ist mir zu viel Arbeit.
Das kann zwei Gründe haben:
1. Du versuchst, die falsche Stelle zu spiegeln. Worin auch immer die Links auf die Bilder enthalten sind, könnte ein Frameset sein, dessen Frameseite irgendwo ganz woanders ist.
2. Der Anbieter möchte nicht, daß jemand genau das tut, was du zu tun versuchst, und prüft beim Zugriff den "User-Agent"-Header.
Bei mir lags mal an folgendem: Es gibt im HTTP Header ein "Reference" Tag, das soweit ich weiß die URL bezeichnet, von der aus man auf die neue (angeforderte) Seite kommt. Steht da, wie bei Defaultverwendung von wget z.B. nix drin, bemängelt der Server das aus diesem Grunde. Hab das mit nem Downloadmanager "pavuk" (oder so ähnlich) mal runterladen können. Fragt sich eh, ob es nicht bessere Alternativen zu Wget gibt... Michael