Hallo, Am Thu, 06 Oct 2005, Karl Sinn schrieb:
ich habe jetzt eine Weile in sed reingeschaut, muss aber sagen: Ich versteh nur Bahnhof..
Das gibt sich, wenn man mal systematisch rumprobiert ;) Und such ggfs. mal hier im Archiv, da haben andere und ich schon haeufiger auch Grundlagen zu sed erklaert bzw. die Punkte, bei denen es besonders gern zum "Bahnhofs"-Syndrom kommt ;)
Am Donnerstag, 6. Oktober 2005 13:47 schrieb Markus Heidinger:
^ISBN\s(?=[-0-9xX ]{13}$)(?:[0-9]+[- ]){3}[0-9]*[xX0-9]$
Ist das denn immer so kompliziert?
Nein. Und obiges ist keine Regex, die sed versteht. Obiges ist eine Perl-Regex, die sich auch nicht in eine POSIX-BRE (-Basic Regular Expression) die sed versteht uebersetzen laesst. Ich wuerde das spontan so schreiben: sed -n 's/ISBN \+\([0-9-]*\) /\1/; s/-//gp;' Das macht aber etwas leicht anderes.
Ich habe das Ergebniss der ersten Seite mal untersucht. Dort steht die ISBN nicht direkt drin, sondern nur eine ProductID und zwar in der Form PRID=654548754&
kann man nicht irgendwie mit PRID=.*& diese Nummer auslesen?
Doch. sed -n 's/PRID=\([0-9]\+\)&/\1/p' Vielleicht kannst du uns ja mal verraten um welche Webseite es geht und was du daraus auslesen willst (und was du dann weiter damit machen willst). -dnh -- Speed doesn't kill... Impact does. -- David Wilcox