Hallo Axel, zwar bin ich nicht sehr erfahren im Umgang mit pdf-Dateien, aber Du hast doch schon alles beisammen, was man braucht. Ohne jetzt das Skript wirklich probiert zu haben, wie wäre etwa folgendes: #!/bin/bash NTot=0 for f in `find . -iname \*.pdf` do N=`pdftk $f dump_data | grep NumberOfPages | cut -f2 -d:` NTot=`expr $NTot + $N` done echo Zusammen $NTot Seiten. Ha, und nun darf ich endlich mal Donald Knuth zitieren: Be aware of the above code. I only proved it correct, not tested it. Gruß Jan Am 15.02.2018 um 12:49 schrieb Alex Winzer:
Hallo,
ich habe ein System mit extrem vielen pdf-Dateien. Ich muss nun aus logistischen Gründen wissen, wie viel Seiten das insgesamt sind. Um genauer zu werden: wenn ich 3 pdf-Dateien mit 1, 2 und 3 Seiten habe, sind es in Summe als 6 Seiten. Mittels "find | grep -i \.pdf" kann ich mir die Dateien auflisten lassen. Ich habe auch gefunden, dass man mit "pdftk beispiel.pdf dump_data output info.txt" in der erzeugten info.txt "NumberOfPages: 4" findet und ggf. auswerten kann. Bei 3 Seiten ist das evtl. machbar. Aber bei mehreren tausend ist das unschön. Ich habe dann diesen Befehl gefunden "cat *.pdf | grep -c --binary-files=text '/Page'". Allerdings passt das Ergebnis nicht. Ich habe es mit ein paar Dateien probiert und die Seiten händisch addiert. Statt 28 (reell) werden 34 (grep) bei gerade einmal 3 Dateien ausgegeben. Diese Abweichung ist mir deutlich zu groß. Mit "NumberOfPages" funktioniert es leider nicht ...
Gibt es dafür ein Tool oder muss ich mir selbst etwas basteln? Fall ich selbst basteln muss, gibt es eine Alternative zu pdftk, mit der man schneller an diese Informationen kommt?
Gruß & Dank, Alex
-- _________________________________________________________________ Jan Handwerker http://www.imk-tro.kit.edu/jan.handwerker.php