From joerg.kositza@tks-cs.thyssenkrupp.com Mon Nov 17 09:01:08 2003
From: joerg.kositza@tks-cs.thyssenkrupp.com
To: users-de@lists.opensuse.org
Subject: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?=
Date: Mon, 17 Nov 2003 10:02:35 +0100
Message-ID: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com>
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="===============6674498686434326867=="
--===============6674498686434326867==
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: 8bit
Hallo,
ich habe folgendes Problem:
Ich möchte in einer HTML-Datei alle Java-Script-Einträge herauslöschen.
Der Hintergrund ist folgender: Wenn man eine HTML-Seite
aus dem Internet saugt ist in der Regel Javascript
enthalten. Das führt zu unerlaubten Internetzugriffen
beim Aufruf der gespeicherten Seite.
z. B.: HTML-Text:
aaa
bbb
ccc
daraus soll werden:
aaa
bbb
ccc
Ich glaube,es müßte mit dem Streameditor (sed) irgendwie gehen.
Wer kann mir helfen ?
Gruß
Jörg Kositza
Mit freundlichen Grüßen
Jörg Kositza
Thyssen Krupp Stahl AG
WBW BO-A
Essener Str. 244
44782 Bochum
E-Mail: joerg.kositza(a)tks-cs.thyssenkrupp.com
--===============6674498686434326867==--
From david@dhaller.de Mon Nov 17 17:43:15 2003
From: David Haller
To: users-de@lists.opensuse.org
Subject: Re: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?=
Date: Mon, 17 Nov 2003 18:41:03 +0100
Message-ID: <20031117174103.GH3633@feersum.endjinn.de>
In-Reply-To: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com>
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="===============8981239003067671753=="
--===============8981239003067671753==
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: 8bit
Hallo,
Am Mon, 17 Nov 2003, joerg.kositza(a)tks-cs.thyssenkrupp.com schrieb:
>Ich möchte in einer HTML-Datei alle Java-Script-Einträge herauslöschen.
[..]
>Ich glaube,es müßte mit dem Streameditor (sed) irgendwie gehen.
Nur sehr schlecht, da sed eben nur Zeilenweise arbeitet. und die
script-Tags ja gern ueber mehrere Zeilen laufen... Am einfachsten
ist's wohl mit perl hinzubekommen:
$ perl -we '{local$/;$_=<>;}s///sgm;print;' \
< foo.html > bar.html
HTH,
-dnh
--
Wenn man keine Vögel mag, ist es völlig in Ordnung, mit Kanonen auf
Spatzen zu schiessen. -- ratti in suse-linux
--===============8981239003067671753==--
From florian@grossing.de Mon Nov 17 18:15:25 2003
From: Florian Gross
To: users-de@lists.opensuse.org
Subject: Re: Java-Script aus HTML-Datei =?utf-8?q?l=C3=B6schen?=
Date: Mon, 17 Nov 2003 12:15:19 +0100
Message-ID: <20031117111518.GB2597@grossing.de>
In-Reply-To: <4940237D07435647BAD1B0C5D30A36D8AFA86B@SRV172.thyssen.com>
MIME-Version: 1.0
Content-Type: multipart/mixed; boundary="===============2880333910653102522=="
--===============2880333910653102522==
Content-Type: text/plain; charset="utf-8"
Content-Transfer-Encoding: quoted-printable
Hallo,
* joerg.kositza(a)tks-cs.thyssenkrupp.com textete am 17.11.03:
>=20
> ich habe folgendes Problem:
> Ich m=C3=B6chte in einer HTML-Datei alle Java-Script-Eintr=C3=A4ge herausl=
=C3=B6schen.
> Der Hintergrund ist folgender: Wenn man eine HTML-Seite
> aus dem Internet saugt ist in der Regel Javascript
> enthalten. Das f=C3=BChrt zu unerlaubten Internetzugriffen
> beim Aufruf der gespeicherten Seite.
>=20
> z. B.: HTML-Text:
>=20
> aaa
>
> bbb
>
> ccc
>=20
> daraus soll werden:
>=20
> aaa
> bbb
> ccc
Wenn das immer so wie in deinem obigem Beispiel aussieht, da=C3=9F das
JavaScript- Zeug komplett in einer Zeile steht, dann reicht ein
grep -v \