Hallo, Am Sam, 18 Sep 2010, Al Bogner schrieb:
Ich habe die Aufgabe erhalten alle Email-Adressen aus einem MySQL-Dump (Drupal CMS) zu extrahieren um alle Bekannten eines verstorbenen Freundes zu kontaktieren. Der Dump soll so um die 20MB _komprimiert_ haben. Um vorbereitet zu sein, ersuche ich um Anregungen wie ich die Email-Adressen möglichst sauber herausbekomme. Ich suche nach @ bzw .at. (eher selten), doch wie erkenne ich Anfang und Ende einer Email-Adresse. Es könnte sein, dass Leerzreichen Anfang und Ende die Email-Adresse begrenzen, eventuell könnte der Beginn ein Doppelpunkt sein. Jedenfalls kann ich nicht immer davon ausgehen, dass es korrekte HMTL-Syntax ist.
"korrekte HTML-Syntax"??? Wo gibt's denn sowas? Wie ist die Tabelle aufgebaut? Hat die E-Mail-Adresse ne eigene Spalte? Ansonsten ist vermutlich perl das Mittel der Wahl: perl - Practical Extraction and Report Language ^^^^^^^^^^ *nudge* *nudge* Mit Email::Address + Regexp::Common::Email::Address gibt es sogar schon ein Modul um E-Mail-Adressen (zuverlässig!) per Regex zu erkennen, den Zugriff auf den Dump gibt's evtl. sogar obendrauf (im Zweifelsfall könntest du den Dump in dein mysql importieren und dann per DBI aus perl drauf zugreifen, was, besonders wenn die Adresse ne eigene Spalte hat, vermutlich eh das sinnvollste ist). Und dann bietet es sich auch an, auch das Erstellen und den Versand der Mails auch gleich noch im selben perlscript "abzufeiern" ;) Außer du willst die Adressen eh nochmal seperat als Datei ablegen, dann könnte auch die nebenan genannte mutt-Lösung praktischer sein. Die Mail-Module von perl lassen sich nur eher umständlich "verallgemeinert" verwenden, d.h. nur spezifische Scripte für große oder häufige Sachen lohnen sich wirklich ... Für kleinere "einmal" Sachen ist ein mutt (in default-Konfiguration + Kommandozeile) praktischer. HTH, -dnh -- "Where's the kaboom? There was supposed to be an Earth-shattering kaboom!" -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org