Html-Tags mit vim (?) automatisch einfuegen

Hallo, ich muss aus PDF-Dateien Epub-Ebooks erstellen. Theoretisch geht das mit Adobe Acrobat 9 Pro (unter Windows) und Speichern als XML sehr gut. Praktisch ist es aber sehr mühsam, weil zahlreiche Absätze nicht erkannt werden, sondern von mir von Hand eingefügt werden. Derzeit mache ich das mit dem vim, in dem ich an den entsprechenden Stellen </p> eingebe, zwei Mal die Returntaste drücke und dann <p> eingebe. Bei mehreren Hundert zu korrigierenden Stellen ist das allerdings alles andere als lustig. Hat jemand vielleicht eine Idee, wie sich das im vim vereinfachen ließe? Theoretisch müsste das doch über einen Shortcut möglich sein. Wenn es mit dem vim zu kompliziert ist, ginge natürlich auch ein anderer Editor. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

On Mon, April 23, 2012 14:48, Heinz W. Pahlke wrote:
Woran erkennt man so einen nicht erkannten Absatz? Grüße, Christian -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Hallo, Am Mon, 23 Apr 2012, Christian Brabandt schrieb
Woran erkennt man so einen nicht erkannten Absatz?
Nur daran, dass man ihn in der PDF-Datei sieht, er aber in der xml-Datei fehlt :-(( Sonst wäre es eine Kleinigkeit. Hoffe ich jedenfalls. Aber inzwischen habe ich die Lösung. Ein :imap <F2> </p><CR><CR><p> macht genau, was ich will. Ich sollte mich wirklich mal genauer mit dem Mapping beschäftigen. Warum sich mehr Arbeit machen als nötig. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Am 23.04.2012 14:48, schrieb Heinz W. Pahlke:
Hallo, um PDF's in Epubs umzuwandeln, kann ich das Programm calibre empfehlen. Das gibt es für Linux, Windows und MacOS. Calibre ist die eierlegende Wollmilchsau im Umgang mit Ebooks, finde ich jedenfalls. Gruß Erhard -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Hallo, Am Mon, 23 Apr 2012, Erhard schrieb
Mit selten validen Ergebnissen :-(( Okay, das wäre hier nicht weiter schlimm, aber die Absätze werden von calibre genauso wenig erkannt. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Am Montag, 23. April 2012, 15:26:42 schrieb Heinz W. Pahlke:
Okay, das wäre hier nicht weiter schlimm, aber die Absätze werden von calibre genauso wenig erkannt.
Im Prinzip suchst du doch eine Art OCR für PDFs, oder? Ich weiß nicht ob es nützlich ist, aber irgendwo im Aktenschrank meines Hirns taucht da der Name ABBYY-Finereader auf, kannst ja mal schauen ob dir das hilft. Grüße, Michael

Hallo, Am Mon, 23 Apr 2012, Michael Skiba schrieb
Im Prinzip suchst du doch eine Art OCR für PDFs, oder? Ich weiß nicht ob es
Nein, natürlich nicht. Da kein OCR-Programm alles absolut richtig erkennt, kommt da dann sogar noch ein kompletter Korrekturdurchgang hinzu. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Heinz W. Pahlke, Montag 23 April 2012:
Wie man es mappt hast Du ja schon herausgefunden. Möglicherweise noch einfacher wäre es, diese Änderung genau einmal vorzunehmen, dann mit ESC den Einfügemodus wieder zu verlassen, und dann die nächste zu bearbeitende Stelle aufzusuchen. Ein Druck auf . nimmt dann die zuletzt gemachte Änderung erneut vor. Enorm praktisch, sozusagen ein Automapping auf die zuletzt gemachte Änderung. -- Andre Tann -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Hallo, Am Mon, 23 Apr 2012, Andre Tann schrieb
Das wäre zwar auch eine Möglichkeit (an die ich übrigens nie denke), hat hier aber den Nachteil, dass ich beim Einfügen der Umbrüche gleich noch Fehler korrigiere wie fehlende Leerzeichen usw. Und mit dem Mapping reduziert sich der Aufwand ja auch auf nur noch einen Tastendruck. Aber ich sollte sie mir mal endlich merken, weil ich sie tatsächlich häufig sehr gut gebrauchen könnte. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Am Mon, 23 Apr 2012 14:48:44 +0200 schrieb "Heinz W. Pahlke" <h.pahlke@gmx.de>:
Zu vim habe ich keinen Rat, mein bevorzugter Editor ist XEmacs, da gibt es die Möglichkeit Makros zu definieren und aufzuzeichnen. Also einfach Makro starten, deine Editor Operationen ausführen, Makro beenden und ein Tastenkürzel vergeben. -Dieter -- Dieter Klünter | Systemberatung http://dkluenter.de GPG Key ID:DA147B05 53°37'09,95"N 10°08'02,42"E -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

On Mon, April 23, 2012 14:48, Heinz W. Pahlke wrote:
Woran erkennt man so einen nicht erkannten Absatz? Grüße, Christian -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Hallo, Am Mon, 23 Apr 2012, Christian Brabandt schrieb
Woran erkennt man so einen nicht erkannten Absatz?
Nur daran, dass man ihn in der PDF-Datei sieht, er aber in der xml-Datei fehlt :-(( Sonst wäre es eine Kleinigkeit. Hoffe ich jedenfalls. Aber inzwischen habe ich die Lösung. Ein :imap <F2> </p><CR><CR><p> macht genau, was ich will. Ich sollte mich wirklich mal genauer mit dem Mapping beschäftigen. Warum sich mehr Arbeit machen als nötig. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Am 23.04.2012 14:48, schrieb Heinz W. Pahlke:
Hallo, um PDF's in Epubs umzuwandeln, kann ich das Programm calibre empfehlen. Das gibt es für Linux, Windows und MacOS. Calibre ist die eierlegende Wollmilchsau im Umgang mit Ebooks, finde ich jedenfalls. Gruß Erhard -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Hallo, Am Mon, 23 Apr 2012, Erhard schrieb
Mit selten validen Ergebnissen :-(( Okay, das wäre hier nicht weiter schlimm, aber die Absätze werden von calibre genauso wenig erkannt. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org

Am Montag, 23. April 2012, 15:26:42 schrieb Heinz W. Pahlke:
Okay, das wäre hier nicht weiter schlimm, aber die Absätze werden von calibre genauso wenig erkannt.
Im Prinzip suchst du doch eine Art OCR für PDFs, oder? Ich weiß nicht ob es nützlich ist, aber irgendwo im Aktenschrank meines Hirns taucht da der Name ABBYY-Finereader auf, kannst ja mal schauen ob dir das hilft. Grüße, Michael

Hallo, Am Mon, 23 Apr 2012, Michael Skiba schrieb
Im Prinzip suchst du doch eine Art OCR für PDFs, oder? Ich weiß nicht ob es
Nein, natürlich nicht. Da kein OCR-Programm alles absolut richtig erkennt, kommt da dann sogar noch ein kompletter Korrekturdurchgang hinzu. Beste Grüße Heinz -- Buchsatz für Autoren. Vom Manuskript zum Buch www.pahlke-online.de Bücher abseits des Mainstreams www.buchentdeckungen.de Barrierefreies Webdesign www.Pahlke-KunstWebDesign.de -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org
participants (6)
-
Andre Tann
-
Christian Brabandt
-
Dieter Klünter
-
Erhard
-
Heinz W. Pahlke
-
Michael Skiba