Hallo, ich fragte ja letztens nach einem Tool zur PS2RTF-Konvertierung. Das scheint es nicht zu geben. Alles was ich zum Thema WP und RTF gefunden habe, waren Berichte über eine fehlerhafte Kodierung der Umlaute im RTF-Export von WordPerfect. Ich habe mir nun ein sed-Script gemacht, daß diese Konvertierung des Zeichnesatzes vornimmt. Eventuell muß da noch nachgearbeitet werden, da ich noch nicht sicher weiss, welche Codepage des IBM-Zeichensatzes WordPerfect zugrundelegt, aber für die gängigen Sonderzeichen scheint es zu stimmen; reparierte WP-RTF-Dokumente erscheinen nun sowohl unter Linux (z. B. dargestellt mit Ted und unter WordPad/Word unter Windows korrekt. Bei Interesse an dem Script, einfach EMail an mich. -- Gruss Marcus Marcus Roeckrath -- Vikarsbusch 8 -- D-48308 Senden -- Germany Phone : +49-2536-9944 -- Mailer/BBS/Fax : +49-2536-9943 (V34, X75) FidoNet: 2:2449/523 E-Mail : marcus.roeckrath@gmx.de WWW : http://home.foni.net/~marcusroeckrath/
On Tue, 22 Oct 2002 at 10:37 (+0200), Marcus Roeckrath wrote:
ich fragte ja letztens nach einem Tool zur PS2RTF-Konvertierung.
Das scheint es nicht zu geben. Alles was ich zum Thema WP und RTF gefunden habe, waren Berichte über eine fehlerhafte Kodierung der Umlaute im RTF-Export von WordPerfect.
Ich habe mir nun ein sed-Script gemacht, daß diese Konvertierung des Zeichnesatzes vornimmt. Eventuell muß da noch nachgearbeitet werden, da ich noch nicht sicher weiss, welche Codepage des IBM-Zeichensatzes WordPerfect zugrundelegt, aber für die gängigen Sonderzeichen scheint es zu stimmen; reparierte WP-RTF-Dokumente erscheinen nun sowohl unter Linux (z. B. dargestellt mit Ted und unter WordPad/Word unter Windows korrekt.
Statt sed kannst Du recode verwenden. Das konvertiert wirklich alle Zeichen richtig. Ich tippe auf cp850 oder cp437, probier einfach mal durch. Gruß, Bernhard -- _________ http://www.bwalle.de _________________________________________________ Alles, das erfunden werden kann, ist erfunden worden. -- C. H. Duell, Beauftragter des US-Patentamts (1899)
Hallo Bernhard, Bernhard Walle wrote on Dienstag, 22. Oktober 2002 16:38 about Re: WP und RTF-Export:
Das scheint es nicht zu geben. Alles was ich zum Thema WP und RTF gefunden habe, waren Berichte über eine fehlerhafte Kodierung der Umlaute im RTF-Export von WordPerfect.
Statt sed kannst Du recode verwenden. Das konvertiert wirklich alle Zeichen richtig. Ich tippe auf cp850 oder cp437, probier einfach mal durch.
Dürfte wohl nicht gehen, weil in RTF die Sonderzeichen (>=128) nicht als Zeichen sondern Code angegeben sind, z. B. \'8e ist ein Ä im WP-RTF, müßte allerdings korrekterweise \'c4 sein. -- Gruss Marcus Marcus Roeckrath -- Vikarsbusch 8 -- D-48308 Senden -- Germany Phone : +49-2536-9944 -- Mailer/BBS/Fax : +49-2536-9943 (V34, X75) FidoNet: 2:2449/523 E-Mail : marcus.roeckrath@gmx.de WWW : http://home.foni.net/~marcusroeckrath/
Hallo, On Tue, 22 Oct 2002, Marcus Roeckrath wrote:
Bernhard Walle wrote on Dienstag, 22. Oktober 2002 16:38 about Re: WP und RTF-Export:
Statt sed kannst Du recode verwenden. Das konvertiert wirklich alle Zeichen richtig. Ich tippe auf cp850 oder cp437, probier einfach mal durch.
Dürfte wohl nicht gehen, weil in RTF die Sonderzeichen (>=128) nicht als Zeichen sondern Code angegeben sind, z. B. \'8e ist ein Ä im WP-RTF, müßte allerdings korrekterweise \'c4 sein.
Dann nimm doch perl und recode (mit sed hab ich's net hinbekommen): ,----[ rtfrecode.pl ] | #!/usr/local/bin/perl -w | use strict; | while(<>) { | s/\\'([[:xdigit:]]+)/chr(hex("0x". $1))/eg; | print; | } `---- rtfrecode.pl < test.rtf | recode ms-ansi..latin9 > test_lx.rtf Ggfs. ms-ansi durch die passende DOS-Codepage (cp437 fuer Englisch/US, cp850 fuer Deutsch). HTH, -dnh -- Es gibt in C keine Strings. Wenn man das kapiert hat, kann man anfangen mit Strings in C zu arbeiten. [Christoph Berg]
participants (3)
-
Bernhard Walle
-
David Haller
-
Marcus Roeckrath