Karl Sinn wrote at Thursday, October 06, 2005 1:29 PM
Oder hab ich da jetzt etwas falsch verstanden?
Die ISBN!! Das suche ich :-) Ich versuche hier Stück für Stück an die ISBN ranzukommen. Es wäre halt im Moment Übersichtlicher wenn ich "Klartext" anstelle von HTML hätte.
Naja mit sed ist das möglich ... Siehe auch David Hallers Postings. Im Prinzip müsstest Du zunächst ein Charakteristikum für die Zeile des HTML-Codes finden, die einzigartig in der HTML Datei ist, vielleicht ja sogar der String "ISBN", kenne ja die Seite nicht. Einfach mal den Quellcode in einem Texteditor analysieren. Im zweiten Schritt dann die ISBN in der Zeile finden. Wenn ich mich recht entsinne, dann ist eine ISBN 13 stellig, 10 Ziffern und drei Bindestriche, letztere nicht am Anfang und am Ende. Die letzte "Ziffer" kann auch ein "X" sein ... Sollte so aussehen, wenn am Anfang "ISBN" gefolgt von einem Leerzeichen steht, ansonsten den entsprechenden Teil einfach weglassen oder adaptieren. ^ISBN\s(?=[-0-9xX ]{13}$)(?:[0-9]+[- ]){3}[0-9]*[xX0-9]$ (nur kurz getesteter Schnellschuss ...) Naja und wie man das ganze an sed verfüttert hat David Haller schon erklärt. HTH Grüße, Markus