Mailinglist Archive: opensuse-de (1185 mails)
| < Previous | Next > |
Re: Email-Adressen aus MySQL-Dump extrahieren
- From: David Haller <dnh@xxxxxxxxxxxx>
- Date: Sat, 18 Sep 2010 04:36:23 +0200
- Message-id: <20100918023623.GC5653@xxxxxxxxxxxxxxxxxx>
Hallo,
Am Sam, 18 Sep 2010, Al Bogner schrieb:
"korrekte HTML-Syntax"??? Wo gibt's denn sowas?
Wie ist die Tabelle aufgebaut? Hat die E-Mail-Adresse ne eigene
Spalte?
Ansonsten ist vermutlich perl das Mittel der Wahl:
perl - Practical Extraction and Report Language
^^^^^^^^^^ *nudge* *nudge*
Mit Email::Address + Regexp::Common::Email::Address gibt es sogar
schon ein Modul um E-Mail-Adressen (zuverlässig!) per Regex zu
erkennen, den Zugriff auf den Dump gibt's evtl. sogar obendrauf (im
Zweifelsfall könntest du den Dump in dein mysql importieren und dann
per DBI aus perl drauf zugreifen, was, besonders wenn die Adresse ne
eigene Spalte hat, vermutlich eh das sinnvollste ist). Und dann bietet
es sich auch an, auch das Erstellen und den Versand der Mails auch
gleich noch im selben perlscript "abzufeiern" ;)
Außer du willst die Adressen eh nochmal seperat als Datei ablegen,
dann könnte auch die nebenan genannte mutt-Lösung praktischer sein.
Die Mail-Module von perl lassen sich nur eher umständlich
"verallgemeinert" verwenden, d.h. nur spezifische Scripte für große
oder häufige Sachen lohnen sich wirklich ... Für kleinere "einmal"
Sachen ist ein mutt (in default-Konfiguration + Kommandozeile)
praktischer.
HTH,
-dnh
--
"Where's the kaboom? There was supposed to be an Earth-shattering kaboom!"
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+unsubscribe@xxxxxxxxxxxx
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@xxxxxxxxxxxx
Am Sam, 18 Sep 2010, Al Bogner schrieb:
Ich habe die Aufgabe erhalten alle Email-Adressen aus einem MySQL-Dump
(Drupal CMS) zu extrahieren um alle Bekannten eines verstorbenen
Freundes zu kontaktieren. Der Dump soll so um die 20MB _komprimiert_
haben. Um vorbereitet zu sein, ersuche ich um Anregungen wie ich die
Email-Adressen möglichst sauber herausbekomme. Ich suche nach @
bzw .at. (eher selten), doch wie erkenne ich Anfang und Ende einer
Email-Adresse. Es könnte sein, dass Leerzreichen Anfang und Ende die
Email-Adresse begrenzen, eventuell könnte der Beginn ein Doppelpunkt
sein. Jedenfalls kann ich nicht immer davon ausgehen, dass es korrekte
HMTL-Syntax ist.
"korrekte HTML-Syntax"??? Wo gibt's denn sowas?
Wie ist die Tabelle aufgebaut? Hat die E-Mail-Adresse ne eigene
Spalte?
Ansonsten ist vermutlich perl das Mittel der Wahl:
perl - Practical Extraction and Report Language
^^^^^^^^^^ *nudge* *nudge*
Mit Email::Address + Regexp::Common::Email::Address gibt es sogar
schon ein Modul um E-Mail-Adressen (zuverlässig!) per Regex zu
erkennen, den Zugriff auf den Dump gibt's evtl. sogar obendrauf (im
Zweifelsfall könntest du den Dump in dein mysql importieren und dann
per DBI aus perl drauf zugreifen, was, besonders wenn die Adresse ne
eigene Spalte hat, vermutlich eh das sinnvollste ist). Und dann bietet
es sich auch an, auch das Erstellen und den Versand der Mails auch
gleich noch im selben perlscript "abzufeiern" ;)
Außer du willst die Adressen eh nochmal seperat als Datei ablegen,
dann könnte auch die nebenan genannte mutt-Lösung praktischer sein.
Die Mail-Module von perl lassen sich nur eher umständlich
"verallgemeinert" verwenden, d.h. nur spezifische Scripte für große
oder häufige Sachen lohnen sich wirklich ... Für kleinere "einmal"
Sachen ist ein mutt (in default-Konfiguration + Kommandozeile)
praktischer.
HTH,
-dnh
--
"Where's the kaboom? There was supposed to be an Earth-shattering kaboom!"
--
Um die Liste abzubestellen, schicken Sie eine Mail an:
opensuse-de+unsubscribe@xxxxxxxxxxxx
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@xxxxxxxxxxxx
| < Previous | Next > |