OT: Wie Daten aus einer HTML-Seite nach OpenOffice übernehmen?
Hallo Liste, bin woanders nicht fündig geworden und versuchs halt hier mal, auch auf die Gefahr, dass die Sache OT ist: Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen. Hat jemand einen Tipp, wie ich das bewerkstelligen kann? Gibt es irgendein Programm/Script dafür? Für Hinweise wäre ich sehr dankbar. -- Schöne Grüße Mathias -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Samstag, 6. Februar 2010 schrieb Mathias Klose:
Hallo Liste,
bin woanders nicht fündig geworden und versuchs halt hier mal, auch auf die Gefahr, dass die Sache OT ist:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen. Was sind das für Daten?
Copy 'n' Paste sollte auf jeden Fall funktionieren. Danach Strg-A um alles zu merkieren und mit dem Stylisten das Format auf Standard stellen. -- Mit freundlichen Grüßen Matthias Müller (Benutzer #439779 im Linux-Counter http://counter.li.org) PS: Bitte senden Sie als Antwort auf meine E-Mails reine Text-Nachrichten!
Am 06.02.2010 21:42, schrieb Matthias Müller:
Hallo,
Am Samstag, 6. Februar 2010 schrieb Mathias Klose:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen.
Was sind das für Daten?
Copy 'n' Paste sollte auf jeden Fall funktionieren. Danach Strg-A um alles zu merkieren und mit dem Stylisten das Format auf Standard stellen.
Ich mach das auch oft so, wie von Matthias Müller vorgeschlagen: Copy and Paste und dann den Absatzstil auf 'Standard' setzen. Das löscht zB die enthaltenen Hyperlinks. Noch besser ist es, den kopierten Text zunächst in einem einfachen Editor einzufügen. Damit sind die farbigen Bestandteile weg, die enthaltenen Hyperlinks und - je nach Editor - auch die Frames oder andere Tabellenelemente. Den so "bereinigten" Text kannst du dann nach OOo kopieren und dort so anhübschen, wie du es brauchst. Hdh, Detlef -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Mathias Klose schrieb:
Hallo Liste,
bin woanders nicht fündig geworden und versuchs halt hier mal, auch auf die Gefahr, dass die Sache OT ist:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen.
Hat jemand einen Tipp, wie ich das bewerkstelligen kann? Gibt es irgendein Programm/Script dafür?
Für Hinweise wäre ich sehr dankbar. --
Schöne Grüße Mathias
Hi hast Du schon mal copy und paste probiert? oder die html Datei in ooo direkt einzulesen? Gruß Reimar ------------------------------------------------------------------------------------------------ ------------------------------------------------------------------------------------------------ Forschungszentrum Juelich GmbH 52425 Juelich Sitz der Gesellschaft: Juelich Eingetragen im Handelsregister des Amtsgerichts Dueren Nr. HR B 3498 Vorsitzende des Aufsichtsrats: MinDir'in Baerbel Brumme-Bothe Geschaeftsfuehrung: Prof. Dr. Achim Bachem (Vorsitzender), Dr. Ulrich Krafft (stellv. Vorsitzender), Prof. Dr.-Ing. Harald Bolt, Prof. Dr. Sebastian M. Schmidt ------------------------------------------------------------------------------------------------ ------------------------------------------------------------------------------------------------ -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Mathias Klose schrieb:
Hallo Liste,
bin woanders nicht fündig geworden und versuchs halt hier mal, auch auf die Gefahr, dass die Sache OT ist:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen.
Hat jemand einen Tipp, wie ich das bewerkstelligen kann? Gibt es irgendein Programm/Script dafür?
Falls es mit copy/paste nicht getan ist: die letzte c't hatte ein paar Anregungen, wie man Daten aus Webseiten automatisch extrahiert Wolfgang -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo, Am Sam, 06 Feb 2010, Mathias Klose schrieb:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen.
HTML direkt mit OOo öffnen. Als .odt speichern. Ggfs. im HTML kopieren und mit oder ohne Formate in ein "neues" OOo-Dokument einfügen und das dann speichern. -dnh -- "Sometimes I think the surest sign that intelligent life exists elsewhere in the universe, is that none of it has tried to contact us." -- Calvin & Hobbes by Bill Watterson -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo Liste, danke für die bisherigen Antworten. Zum Verständnis möchte ich nochmals erklären worum es mir geht. Vielleicht habe ich zu wenig geschrieben. Es geht NICHT um Copy & Paste. Es sollen Daten aus Webseiten automatisch (z.B. durch ein Skript manuell gestartet) extrahiert und in ein vorbereitetes OOO-Dokument übertragen werden. Mit wget kann ich zwar die Daten perfekt auslesen, jedoch gelingt es nicht ohne Weiteres, bestimmte Daten (z.B. Feldinhalte) aus der Webseite in das OOO-Dokument zu übertragen. Dafür gibt es wohl u.a. sogen. Parser (auch HTML-Parser). Wie funktioniert das genau oder wie und mit welchen Mitteln (ggf. Skripte) kann ich nun die Daten automatisch auslesen und in das OOO-Dokument übernehmen? Danke schon mal für weitere Rückmeldungen. -- Schöne Grüße Mathias Am 06.02.2010 19:37, schrieb Mathias Klose:
Hallo Liste,
bin woanders nicht fündig geworden und versuchs halt hier mal, auch auf die Gefahr, dass die Sache OT ist:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen.
Hat jemand einen Tipp, wie ich das bewerkstelligen kann? Gibt es irgendein Programm/Script dafür?
Für Hinweise wäre ich sehr dankbar. --
Schöne Grüße Mathias
-- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
Hallo Mathias Klose, hast Du es schon mit quanta versucht ??? bzw. mit quanta+ (Quanta-plus) ??? einfach die webpage kopieren und einfuegen mit bzw. in quanta und von dort uebernehmen nach OOO. quanta uebernimmt den code generell zu 100 %. viel spass ! Val. cv.schmitt@googlemail.com Am 09.02.2010 20:07, schrieb Mathias Klose:
Hallo Liste,
danke für die bisherigen Antworten.
Zum Verständnis möchte ich nochmals erklären worum es mir geht. Vielleicht habe ich zu wenig geschrieben.
Es geht NICHT um Copy & Paste.
Es sollen Daten aus Webseiten automatisch (z.B. durch ein Skript manuell gestartet) extrahiert und in ein vorbereitetes OOO-Dokument übertragen werden.
Mit wget kann ich zwar die Daten perfekt auslesen, jedoch gelingt es nicht ohne Weiteres, bestimmte Daten (z.B. Feldinhalte) aus der Webseite in das OOO-Dokument zu übertragen.
Dafür gibt es wohl u.a. sogen. Parser (auch HTML-Parser).
Wie funktioniert das genau oder wie und mit welchen Mitteln (ggf. Skripte) kann ich nun die Daten automatisch auslesen und in das OOO-Dokument übernehmen?
Danke schon mal für weitere Rückmeldungen. --
Schöne Grüße Mathias
Am 06.02.2010 19:37, schrieb Mathias Klose:
Hallo Liste,
bin woanders nicht fündig geworden und versuchs halt hier mal, auch auf die Gefahr, dass die Sache OT ist:
Ich möchte unter OS11.2 Daten aus einer HTML-Seite nach OpenOffice übernehmen. Irgendwie soll das mit Parsern gehen.
Hat jemand einen Tipp, wie ich das bewerkstelligen kann? Gibt es irgendein Programm/Script dafür?
Für Hinweise wäre ich sehr dankbar. --
Schöne Grüße Mathias
-- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org
participants (7)
-
David Haller
-
Detlef Wiese
-
dschinn
-
hamann.w@t-online.de
-
Mathias Klose
-
Matthias Müller
-
Reimar Bauer