From joerg.kositza@tks-cs.thyssenkrupp.com Mon Nov 17 09:01:08 2003 From: joerg.kositza@tks-cs.thyssenkrupp.com To: users-de@lists.opensuse.org Subject: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?= Date: Mon, 17 Nov 2003 10:02:35 +0100 Message-ID: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============6674498686434326867==" --===============6674498686434326867== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Hallo, ich habe folgendes Problem: Ich möchte in einer HTML-Datei alle Java-Script-Einträge herauslöschen. Der Hintergrund ist folgender: Wenn man eine HTML-Seite aus dem Internet saugt ist in der Regel Javascript enthalten. Das führt zu unerlaubten Internetzugriffen beim Aufruf der gespeicherten Seite. z. B.: HTML-Text: aaa bbb ccc daraus soll werden: aaa bbb ccc Ich glaube,es müßte mit dem Streameditor (sed) irgendwie gehen. Wer kann mir helfen ? Gruß Jörg Kositza Mit freundlichen Grüßen Jörg Kositza Thyssen Krupp Stahl AG WBW BO-A Essener Str. 244 44782 Bochum E-Mail: joerg.kositza(a)tks-cs.thyssenkrupp.com --===============6674498686434326867==-- From david@dhaller.de Mon Nov 17 17:43:15 2003 From: David Haller To: users-de@lists.opensuse.org Subject: Re: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?= Date: Mon, 17 Nov 2003 18:41:03 +0100 Message-ID: <20031117174103.GH3633@feersum.endjinn.de> In-Reply-To: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============8981239003067671753==" --===============8981239003067671753== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Hallo, Am Mon, 17 Nov 2003, joerg.kositza(a)tks-cs.thyssenkrupp.com schrieb: >Ich möchte in einer HTML-Datei alle Java-Script-Einträge herauslöschen. [..] >Ich glaube,es müßte mit dem Streameditor (sed) irgendwie gehen. Nur sehr schlecht, da sed eben nur Zeilenweise arbeitet. und die script-Tags ja gern ueber mehrere Zeilen laufen... Am einfachsten ist's wohl mit perl hinzubekommen: $ perl -we '{local$/;$_=<>;}s///sgm;print;' \ < foo.html > bar.html HTH, -dnh -- Wenn man keine Vögel mag, ist es völlig in Ordnung, mit Kanonen auf Spatzen zu schiessen. -- ratti in suse-linux --===============8981239003067671753==-- From florian@grossing.de Mon Nov 17 18:15:25 2003 From: Florian Gross To: users-de@lists.opensuse.org Subject: Re: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?= Date: Mon, 17 Nov 2003 12:15:19 +0100 Message-ID: <20031117111518.GB2597@grossing.de> In-Reply-To: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2880333910653102522==" --===============2880333910653102522== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: quoted-printable Hallo, * joerg.kositza(a)tks-cs.thyssenkrupp.com textete am 17.11.03: >=20 > ich habe folgendes Problem: > Ich m=C3=B6chte in einer HTML-Datei alle Java-Script-Eintr=C3=A4ge herausl= =C3=B6schen. > Der Hintergrund ist folgender: Wenn man eine HTML-Seite > aus dem Internet saugt ist in der Regel Javascript > enthalten. Das f=C3=BChrt zu unerlaubten Internetzugriffen > beim Aufruf der gespeicherten Seite. >=20 > z. B.: HTML-Text: >=20 > aaa > > bbb > > ccc >=20 > daraus soll werden: >=20 > aaa > bbb > ccc Wenn das immer so wie in deinem obigem Beispiel aussieht, da=C3=9F das JavaScript- Zeug komplett in einer Zeile steht, dann reicht ein grep -v \ quelldatei.html > datei_ohne_JavaScript.html v=C3=B6llig aus. Wenn aber noch was anderes in der Zeile steht, mu=C3=9F wohl sed ran. Dabei kann ich dir leider nicht weiterhelfen. Sowas l=C3=A4=C3=9Ft sich aber sicher mit Java oder sed realisieren. cu flo --=20 Ich mu=C3=9F in meinem Leben schon bl=C3=B6dsinnigeres getan haben,=20 wei=C3=9F aber leider nicht, wann. [Douglas Adams in "Die letzten ihrer= Art"] --===============2880333910653102522== Content-Type: application/pgp-signature Content-Transfer-Encoding: base64 Content-Disposition: attachment; filename="attachment.sig" MIME-Version: 1.0 LS0tLS1CRUdJTiBQR1AgU0lHTkFUVVJFLS0tLS0KVmVyc2lvbjogR251UEcgdjEuMi4yIChHTlUv TGludXgpCgppRDhEQlFFL3VLM0dPSC9rd2RzVGtyY1JBa1V3QUo0MklackdIb29SZmVzMVF0MGNG QUxuc2ErYy93Q2ZST3BWCkFpSjBPT2s1ZW5iS3JsNWs2SGJYTDFZPQo9dzdjNgotLS0tLUVORCBQ R1AgU0lHTkFUVVJFLS0tLS0K --===============2880333910653102522==-- From cb.suse@wein-vin-vinum.net Mon Nov 17 23:19:40 2003 From: Christian Boltz To: users-de@lists.opensuse.org Subject: Re: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?= Date: Tue, 18 Nov 2003 00:17:03 +0100 Message-ID: <200311172330.00840@tux.boltz.de.vu> In-Reply-To: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com> MIME-Version: 1.0 Content-Type: multipart/mixed; boundary="===============2930446432432728211==" --===============2930446432432728211== Content-Type: text/plain; charset="utf-8" Content-Transfer-Encoding: 8bit Hallo joerg, hallo Leute, Am Montag, 17. November 2003 10:02 schrieb joerg.kositza(a)tks-cs.thyssenkrupp.com: ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ Wie wärs (falls möglich) mit dem Realname im Absender? > ich habe folgendes Problem: > Ich möchte in einer HTML-Datei alle Java-Script-Einträge > herauslöschen. Der Hintergrund ist folgender: Wenn man eine > HTML-Seite > aus dem Internet saugt ist in der Regel Javascript > enthalten. Das führt zu unerlaubten Internetzugriffen > beim Aufruf der gespeicherten Seite. >[...] > Ich glaube,es müßte mit dem Streameditor (sed) irgendwie gehen. > Wer kann mir helfen ? Die Lösung mit Perl wurde Dir ja schon empfohlen. Aber: Was hältst Du von einem ganz anderen Ansatz? Du könntest das Javascript (und sonstiges) schon vor dem Browser rausfischen lassen - wwwoffle oder WebWasher können das ;-) Bei Fragen zu wwwoffle kannst Du Dich gern melden. WebWasher kenne ich nur vom Namen und muss diesbezüglich an die Liste verweisen ;-) Gruß Christian Boltz -- >>Wozu braucht root einen Browser? > Fürs Internet? *wuuhahaha* Der Tag faengt echt gut an... Gleich so ein Highlight am Morgen, herrlich... [> Marcel Stein und Thomas Hertweck in suse-linux] --===============2930446432432728211==--