Entfernen des Headers aus Textdateien
Hallo zusammen, ich habe folgendes Problem. Ich habe eine größere Sammlung von Textdateien die noch den kompletten Mailheader enthalten. Dieser soll nun entfernt werden. Meine Idee war das ganze einfach mit sed zu machen. Aber wie bekomme ich sed dazu alle Zeichen vor einem bestimmten Ausdruck zu löschen. Zusätzlich wäre noch interessant wie alle Zeichen zwischen einem Ausdruck und dem nächsten Zeilenwechsel zu finden/ersetzen sind. Gibt es vielleicht sogar eine einfachere Lösung?? Vielen Dank Christian
Hallo Christian, Am Montag, 14. April 2003 13:10 schrieb Christian Herzyk:
ich habe folgendes Problem. Ich habe eine größere Sammlung von Textdateien die noch den kompletten Mailheader enthalten. Dieser soll nun entfernt werden. Meine Idee war das ganze einfach mit sed zu machen. Aber wie bekomme ich sed dazu alle Zeichen vor einem bestimmten Ausdruck zu löschen. Zusätzlich wäre noch interessant wie alle Zeichen zwischen einem Ausdruck und dem nächsten Zeilenwechsel zu finden/ersetzen sind.
Gibt es vielleicht sogar eine einfachere Lösung??
wie wäre es mit $ formail -I "", siehe man formail. Gruß Kai
From: Kai Lindenberg [mailto:kai@ldbg.de]
Hallo Christian,
Am Montag, 14. April 2003 13:10 schrieb Christian Herzyk:
ich habe folgendes Problem. Ich habe eine größere Sammlung von Textdateien die noch den kompletten Mailheader enthalten. Dieser soll nun entfernt werden. Meine Idee war das ganze einfach mit sed zu machen. Aber wie bekomme ich sed dazu alle Zeichen vor einem bestimmten Ausdruck zu löschen. Zusätzlich wäre noch interessant wie alle Zeichen zwischen einem Ausdruck und dem nächsten Zeilenwechsel zu finden/ersetzen sind.
Gibt es vielleicht sogar eine einfachere Lösung??
wie wäre es mit $ formail -I "", siehe man formail.
Perfekt!! Danke. Christian
cherzyk@systrade.de fragte:
ich habe folgendes Problem. Ich habe eine größere Sammlung von Textdateien die noch den kompletten Mailheader enthalten. Dieser soll nun entfernt werden. Meine Idee war das ganze einfach mit sed zu machen.
(Ich nehme an daß Du mit "Textdateien" eine mbox-Datei meinst.) Mit sed kann ich nicht helfen, aber formail kann das auch. Ralph (der leider gerade nicht an seinem Linux-PC sitzt, und daher keine näheren Infos liefern kann.) -- +++ GMX - Mail, Messaging & more http://www.gmx.net +++ Bitte lächeln! Fotogalerie online mit GMX ohne eigene Homepage!
Hallo, On Mon, 14 Apr 2003, Christian Herzyk wrote:
ich habe folgendes Problem. Ich habe eine größere Sammlung von Textdateien die noch den kompletten Mailheader enthalten. Dieser soll nun entfernt werden. Meine Idee war das ganze einfach mit sed zu machen. Aber wie bekomme ich sed dazu alle Zeichen vor einem bestimmten Ausdruck zu löschen. Zusätzlich wäre noch interessant wie alle Zeichen zwischen einem Ausdruck und dem nächsten Zeilenwechsel zu finden/ersetzen sind.
Da hab ich IIRC mal was ausfuehrlich geschrieben, das funktioniert ueber die "Adressen" in sed.
Gibt es vielleicht sogar eine einfachere Lösung??
sed '/^From/,/^$/d' < alte.mbox > nur.bodies Fragen dazu? -dnh -- Fear was there for a purpose. It was wired into any creature that had not completely turned its back on its evolutionary inheritance and so remade itself in whatever image it coveted. The more sophisticated you became, the less you relied on fear and pain to keep you alive; you could afford to ignore them because you had other means of coping with the consequences if things went badly. -- Scholar Uagen Zlepe, "Look to Windward" by Iain M. Banks
From: David Haller [mailto:david@dhaller.de]
Hallo,
On Mon, 14 Apr 2003, Christian Herzyk wrote:
ich habe folgendes Problem. Ich habe eine größere Sammlung von Textdateien die noch den kompletten Mailheader enthalten. Dieser soll nun entfernt werden. Meine Idee war das ganze einfach mit sed zu machen. Aber wie bekomme ich sed dazu alle Zeichen vor einem bestimmten Ausdruck zu löschen. Zusätzlich wäre noch interessant wie alle Zeichen zwischen einem Ausdruck und dem nächsten Zeilenwechsel zu finden/ersetzen sind.
Da hab ich IIRC mal was ausfuehrlich geschrieben, das funktioniert ueber die "Adressen" in sed.
Werde mal mit diesen Stichworten im Archiv suchen.
Gibt es vielleicht sogar eine einfachere Lösung??
sed '/^From/,/^$/d' < alte.mbox > nur.bodies
Fragen dazu?
Bestimmt, aber erst probier ich mal ob mir das ganze mit den RegEx Howtos die ich habe klar wird. Auch wenn die Lösung mit formail perfekt und einfach ist, merke ich, daß es höchste Zeit wird diese Dinger mal zu kapieren. Leider sind die meisten Howtos dazu nicht gerade anschaulich. Danke Christian
participants (4)
-
Christian Herzyk
-
David Haller
-
Kai Lindenberg
-
Ralph Mueller