New subject: Email-Adressen aus MySQL-Dump extrahieren

18 Sep 2010

      Am Sa, 18 Sep 2010 12:47:10 CEST schrieb Juergen L:
...
Die gibt es mit sicherheit
Was ist "die"?
...
Oeffe einfach den dump
Wenn du ein Feld mit Email-Adressen meinst, dann ist dem leider nicht
so.

Schau zB hier:
http://www.euroyage.org/xicoeatl-75

Da gibt es ein Schema "E-Mail:" am Ende eines Rahmens.

Im Dump sieht das dann etwa so aus:

         </table>\n            \n                <tbody>\n
         <tr>\n                        \n                        <b>E-Mail:</b> patricia@bla.tld</a>
         <br />\n                        <b>Internet:</b> http://www.patriciacaicedo.com/\"
         target=\"_blank\">www.patriciacaicedo.com</a></p>\n
         </td>\

Es könnte aber auch nicht mit "mailto" geschrieben sein.

Al
-- 
Um die Liste abzubestellen, schicken Sie eine Mail an:
    opensuse-de+unsubscribe@opensuse.org
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@opensuse.org

					 0

				 0

            Reply

                Sign in to reply online

            Use email software

                        Show replies by date

                    Joerg Thuemmler

                20 Sep

                20 Sep

                07:20

          New subject: Email-Adressen aus MySQL-Dump extrahieren

      Al Bogner schrieb:
...
Am Sa, 18 Sep 2010 12:47:10 CEST schrieb Juergen L:
...
Die gibt es mit sicherheit
Was ist "die"?
...
Oeffe einfach den dump
Wenn du ein Feld mit Email-Adressen meinst, dann ist dem leider nicht
so.
Schau zB hier:
http://www.euroyage.org/xicoeatl-75
Da gibt es ein Schema "E-Mail:" am Ende eines Rahmens.
Im Dump sieht das dann etwa so aus:
</table>\n            \n                <tbody>\n
         <tr>\n                        \n                        <b>E-Mail:</b> patricia@bla.tld</a>
         <br />\n                        <b>Internet:</b> http://www.patriciacaicedo.com/\"
         target=\"_blank\">www.patriciacaicedo.com</a></p>\n
         </td>\
Es könnte aber auch nicht mit "mailto" geschrieben sein.
Al
Hi,

wie hier ja sicher schon auffiel, perl ist nicht mein Ding (das soll
keine Herabsetzung sein, der Mangel liegt bei mir ;-) ), ich würde mit
sed/grep/sort folgendes machen (eine Zeile)

sed -e 's/[^@.[:alnum:]_-]/\n/g' 

					 0

				 0

            Reply

                Sign in to reply online

            Use email software

                       Al Bogner

                10:28

          New subject: Email-Adressen aus MySQL-Dump extrahieren

      Am Mo, 20 Sep 2010 09:20:12 CEST schrieb Joerg Thuemmler:
...
Al Bogner schrieb:
...
Am Sa, 18 Sep 2010 12:47:10 CEST schrieb Juergen L:
...
Die gibt es mit sicherheit
Was ist "die"?
...
Oeffe einfach den dump
Wenn du ein Feld mit Email-Adressen meinst, dann ist dem leider
nicht so.
Schau zB hier:
http://www.euroyage.org/xicoeatl-75
Da gibt es ein Schema "E-Mail:" am Ende eines Rahmens.
Im Dump sieht das dann etwa so aus:
</table>\n            \n                <tbody>\n
         <tr>\n                        \n                        <b>E-Mail:</b> patricia@bla.tld</a>
         <br />\n                        <b>Internet:</b> http://www.patriciacaicedo.com/\"
         target=\"_blank\">www.patriciacaicedo.com</a></p>\n
         </td>\
Es könnte aber auch nicht mit "mailto" geschrieben sein.
Al
Hi,
wie hier ja sicher schon auffiel, perl ist nicht mein Ding (das soll
keine Herabsetzung sein, der Mangel liegt bei mir ;-) ), ich würde mit
sed/grep/sort folgendes machen (eine Zeile)
sed -e 's/[^@.[:alnum:]_-]/\n/g' 
Danke, ich hatte das probiert:

cat sql |  sed -e "s/ /\n/g" | grep  "@" | grep -v ^@ | sort -u >
aaa.txt

Wenn ich das nun zusammenfüge, eventuell nicht optimal, dann ist es
schon fast perfekt

cat sql | \
sed -e "s/ /\n/g" | grep  "@" | grep -v ^@ | \
sed -e 's/[^@.[:alnum:]_-]/\n/g' | \
grep "^[[:alnum:]._-]*@"| grep -v ^@ | \
tr '[[:upper:]]' '[[:lower:]]' | sort -u > bbb.txt

So was bleibt noch übrig:
n@font-face
n@page
n@text
n@uri
...
das sollte alle Sonderzeichen, die in E-Mail-Adressen nicht vorkommen
dürfen, zu Zeilentrennern machen, dann davon nur die Zeilen ausgeben,
die bis zum Klammeraffen gültige Namen darstellen (ich gehe mal davon
aus, dass für Mails nur alphanumeric, "._-" erlaubt sind, fall ich was
vergessen habe, halt in beide regex einfügen). Doppelungen sollten
gelöscht werden.
Funzt zumindest sofort mit Deinem Beispiel.
Mein Beispiel ist problematisch, da einerseits im Mail auf Zeilen
umbrochen wurde, und es auch Adressen onne maito gibt. Aber wie oben
schon erwähnt, das Ziel ist fast erreicht und wenn ein paar Mails dann
wegen ungültiger Email-Adresse verschickt werden können, ist das auch
nicht so tragisch.

Al
-- 
Um die Liste abzubestellen, schicken Sie eine Mail an:
    opensuse-de+unsubscribe@opensuse.org
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@opensuse.org

					 0

				 0

            Reply

                Sign in to reply online

            Use email software

                       Al Bogner

                11:05

          New subject: Email-Adressen aus MySQL-Dump extrahieren

      Am Mo, 20 Sep 2010 12:28:08 CEST schrieb Al Bogner:
...
Am Mo, 20 Sep 2010 09:20:12 CEST schrieb Joerg Thuemmler:
...
Al Bogner schrieb:
...
Am Sa, 18 Sep 2010 12:47:10 CEST schrieb Juergen L:
...
Die gibt es mit sicherheit
Was ist "die"?
...
Oeffe einfach den dump
Wenn du ein Feld mit Email-Adressen meinst, dann ist dem leider
nicht so.
Schau zB hier:
http://www.euroyage.org/xicoeatl-75
Da gibt es ein Schema "E-Mail:" am Ende eines Rahmens.
Im Dump sieht das dann etwa so aus:
</table>\n            \n                <tbody>\n
         <tr>\n                        \n                        <b>E-Mail:</b> patricia@bla.tld</a>
         <br />\n                        <b>Internet:</b> http://www.patriciacaicedo.com/\"
         target=\"_blank\">www.patriciacaicedo.com</a></p>\n
         </td>\
Es könnte aber auch nicht mit "mailto" geschrieben sein.
Al
Hi,
wie hier ja sicher schon auffiel, perl ist nicht mein Ding (das soll
keine Herabsetzung sein, der Mangel liegt bei mir ;-) ), ich würde
mit sed/grep/sort folgendes machen (eine Zeile)
sed -e 's/[^@.[:alnum:]_-]/\n/g' 
Danke, ich hatte das probiert:
cat sql |  sed -e "s/ /\n/g" | grep  "@" | grep -v ^@ | sort -u >
aaa.txt
Wenn ich das nun zusammenfüge, eventuell nicht optimal, dann ist es
schon fast perfekt
cat sql | \
sed -e "s/ /\n/g" | grep  "@" | grep -v ^@ | \
sed -e 's/[^@.[:alnum:]_-]/\n/g' | \
grep "^[[:alnum:]._-]*@"| grep -v ^@ | \
tr '[[:upper:]]' '[[:lower:]]' | sort -u > bbb.txt
So was bleibt noch übrig:
n@font-face
n@page
n@text
n@uri
Ganz vergessen dazu zu schreiben, dass man natürlich noch nach dem Punkt
"greppen" könnte.

 | grep "\." 

Aber vielleicht kann nun wer das "schöner" formulieren

Al
-- 
Um die Liste abzubestellen, schicken Sie eine Mail an:
    opensuse-de+unsubscribe@opensuse.org
Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken
Sie eine Mail an: opensuse-de+help@opensuse.org

					 0

				 0

            Reply

                Sign in to reply online

            Use email software

        4973

          Age (days ago)

        4975

          Last active (days ago)

            List overview

         Download

        3 comments

        2 participants

                Add to favorites

                Remove from favorites

        tags 

        participants (2)

                    Al Bogner

                    Joerg Thuemmler

            Powered by HyperKitty version 1.3.9.

Re: Email-Adressen aus MySQL-Dump extrahieren

Al Bogner

Joerg Thuemmler

Al Bogner

Al Bogner

tags

participants (2)