Al Bogner schrieb:
Am Sa, 18 Sep 2010 12:47:10 CEST schrieb Juergen L:
Die gibt es mit sicherheit
Was ist "die"?
Oeffe einfach den dump
Wenn du ein Feld mit Email-Adressen meinst, dann ist dem leider nicht so.
Schau zB hier: http://www.euroyage.org/xicoeatl-75
Da gibt es ein Schema "E-Mail:" am Ende eines Rahmens.
Im Dump sieht das dann etwa so aus:
</table>\n <table cellpadding=\"5\" border=\"0\" width=\"100%\">\n <tbody>\n <tr>\n <td class=\"grey\">\n <p class=\"fliess\"><b>E-Mail:</b> <a href=\"mailto:patricia@bla.tld\">patricia@bla.tld</a> <br />\n <b>Internet:</b> <a href=\"http://www.patriciacaicedo.com/\" target=\"_blank\">www.patriciacaicedo.com</a></p>\n </td>\
Es könnte aber auch nicht mit "mailto" geschrieben sein.
Al
Hi, wie hier ja sicher schon auffiel, perl ist nicht mein Ding (das soll keine Herabsetzung sein, der Mangel liegt bei mir ;-) ), ich würde mit sed/grep/sort folgendes machen (eine Zeile) sed -e 's/[^@.[:alnum:]_-]/\n/g' <file | grep "^[[:alnum:]._-]*@" | sort -u das sollte alle Sonderzeichen, die in E-Mail-Adressen nicht vorkommen dürfen, zu Zeilentrennern machen, dann davon nur die Zeilen ausgeben, die bis zum Klammeraffen gültige Namen darstellen (ich gehe mal davon aus, dass für Mails nur alphanumeric, "._-" erlaubt sind, fall ich was vergessen habe, halt in beide regex einfügen). Doppelungen sollten gelöscht werden. Funzt zumindest sofort mit Deinem Beispiel. cu jth -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org