Suche komplexen Shell-Befehl (oder Skript?)
Moin Liste, Ich will aus einer Netscape-Mailfolder-Datei nacheinander alle Strings der Art: "Subject: " "http://* " "www.* " extrahieren und die Ausgabe in 'sample.file' schreiben lassen. Ausserdem sollen alle der "http://* " und "www.* " Strings, die die Zeichenfolge " *egroups.com* " enthalten ignoriert, oder im nachhinein wieder aus der Datei entfernt werden. Hintergrund: Es handelt sich hier um das Archiv einer ML für Webdesign, deren primärer Sinn darin besteht, im WWW gesichtete URLs zu sammeln. Ich möchte nun die ganzen einzelnen Mails löschen, aber vorher halt das Wesentliche in der Form: Subjekt: ... http://... www.... in eine Textdatei packen. Da sich in jeder Listen-Mail mindestens eine egroups-URL befindet, sollte diese natürlich praktischerweise nicht mit reingenommen werden. Kann mir da jemand helfen, bitte? gruss, Dominic --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
* Dominic Valerie Casare schrieb am 13.Mai.2000:
Ich will aus einer Netscape-Mailfolder-Datei nacheinander alle Strings der Art:
"Subject: " "http://* " "www.* "
extrahieren und die Ausgabe in 'sample.file' schreiben lassen.
Ausserdem sollen alle der "http://* " und "www.* " Strings, die die Zeichenfolge " *egroups.com* " enthalten ignoriert, oder im nachhinein wieder aus der Datei entfernt werden.
grep "^Subject: \|http://\|www\." MAILFOLDER | grep -v "http://.*egroups.com\|www\..*egroups.com" > sample.file In einer Zeile geschrieben und anstelle von MAILFOLDER steht natürlich der tatsächliche Dateiname. Dabei muß Subject am Zeilenanfang stehen. Wenn das nicht gewünscht ist, so mußt Du das ^ vor dem S wegmachen. Es werden alle Zeilen genommen, in denen Subject:, http:// oder www. vorkommt, außer es kommt in der Zeile auch egroups.com vor. Weiteres siehe: man grep Bernd -- Bitte die Etikette von Christian beachten: http://www.ndh.net/home/schult/ Bitte Realnamen angeben, kein Vollquoting, kein Html, PGP oder Visitenkarten benutzen. Signatur mit "-- " abtrennen, bei Antworten "Re: " voranstellen, sonst nichts. |Zufallssignatur 4 --------------------------------------------------------------------- To unsubscribe, e-mail: suse-linux-unsubscribe@suse.com For additional commands, e-mail: suse-linux-help@suse.com
On Sat, 13 May 2000, Dominic Valerie Casare wrote:
Ich will aus einer Netscape-Mailfolder-Datei nacheinander alle Strings der Art:
"Subject: " "http://* " "www.* "
extrahieren und die Ausgabe in 'sample.file' schreiben lassen.
Ausserdem sollen alle der "http://* " und "www.* " Strings, die die Zeichenfolge " *egroups.com* " enthalten ignoriert, oder im nachhinein wieder aus der Datei entfernt werden.
wie wärs mit selber programmieren ? als erste adresse wäre hier sicher:
http://www.cclabs.missouri.edu/things/instruction/perl/perlshow.html
und das resultat sieht dann etwa so aus: (aus dem kopf raus)
perl -e '/([Subject:\ |http:\/\/|www\.])/'
participants (3)
-
B.Brodesser@online-club.de
-
Dominic.XXX@t-online.de
-
jhe@lihas.de