* Miklas Neugebauer schrieb am 18.Mai.2003: Hier fehlt eine Autorenangebe. Es ist Kristian.
On Sun, May 18, 2003 at 08:48:41PM +0200, Miklas Neugebauer wrote:
Ich dachte da an eine Kompination von ls, find und grep .. aber wie verbinde ich diese tollen Tools miteinander am besten?
Eine Liste aller Dateien bekommst Du mit find:
$ find / -type f -print
Wenn Du eine Prüfsumme aller dieser Dateien berechnest, kannst Du Dateien mit identischer Prüfsumme finden:
$ find / -type f -print0 | xargs -0 md5sum > ~/md5sum.out $ cat md5sum.out
[...]
Indem Du nach Prüfsumme sortierst, und dann auf der Prüfsumme faltest, bekommst Du die gewünschte Information:
$ sort md5sum.out | uniq -w32 -D > uniq.out
Willst Du jetzt noch nur die Namen der Dateien haben, mußt Du die ersten 35 Zeichen jeder Zeile wegwerfen:
$ cut -b35- < uniq.out > cut.out
Das System ist ja nicht schlecht, aber meiner Meinung nach erkennt er mir somit keine doppelt heruntergeladenen Dateien oder später Kopierte.
Wieso nicht? Wenn die Dateien gleich sind, haben sie auch gleiche Prüfsumme. Umgekehrt kann es zu Problemen führen. So unwahrscheinlich es auch sein mag, aber zwei verschiedene Dateien können die gleiche Prüfsumme haben.
Mir würde es, glaube ich zumindest, reichen, wenn er nach Name und Grösse sortiert.
Namen sind Schall und Rauch.
Das Script läuft zur Zeit und ich bin auf das Ergebnis erstmal gespannt .
Ich schätze mal, das dauert noch eine ganze Weile. Bernd -- Alle meine Signaturen sind rein zufällig und haben nichts mit dem Text oder dem Schreiber zu tun, dem ich antworte. Falls irgendwelche Unrichtigkeiten dabei sein sollten, so bedauere ich das. Es wäre nett, wenn Du mich benachrichtigen würdest. |Zufallssignatur 0