Gleiche Sounddateien finden?
![](https://seccdn.libravatar.org/avatar/52ea74c99bb2d750cbed66670f259a69.jpg?s=120&d=mm&r=g)
Hallo, ich bin mir ziemlich sicher, dass es hier schonmal einen Thread dazu gab, aber ich habe ihn nicht gefunden.. Also mein Problem ist, dass ich hier jede Menge Audio-Dateien habe (ogg, mp3 und flac), von denen ich viele doppelt habe, aber unter anderem Namen. Ich suche nun ein Programm/Script, mit dem man die heraussuchen kann und die mir dann die, die gleich/ähnlich klingen, zur Auswahl übergibt, damit ich entscheiden kann, ob ich eins davon löschen möchte.. Kann mir da jemand helfen? Für jegliche Anregungen bzw. Tips bin ich dankbar Gruß Sören
![](https://seccdn.libravatar.org/avatar/53a6cf42dedfb6fc1a0ab35224022f75.jpg?s=120&d=mm&r=g)
Hallo Sören, Am Samstag, 20. November 2004 18:27 schrieb Sören Wengerowsky:
Hallo,
ich bin mir ziemlich sicher, dass es hier schonmal einen Thread dazu gab, aber ich habe ihn nicht gefunden..
Also mein Problem ist, dass ich hier jede Menge Audio-Dateien habe (ogg, mp3 und flac), von denen ich viele doppelt habe, aber unter anderem Namen.
Ich suche nun ein Programm/Script, mit dem man die heraussuchen kann und die mir dann die, die gleich/ähnlich klingen, zur Auswahl übergibt, damit ich entscheiden kann, ob ich eins davon löschen möchte..
Kann mir da jemand helfen?
Für jegliche Anregungen bzw. Tips bin ich dankbar
Gruß Sören
Ich bastel gerade an einem Perl-Script, das unter anderem Deine Anforderung erfüllt. Ausgangspunkt meines Scriptes ist folgender: Auf dem Rechner meines Vaters herscht ein hoffnungsloses Chaos. Anstatt Ordnung zu halten hat er halt immer grössere Festplatten eingebaut die mit der Zeit immer mehr vollgemüllt wurden. Um das Drama perfekt zu machen hat er bei jedem BS-Upgrade die komplette alte Installation gesichert und behalten. Das Ergebnis: 150 GB teilweise redundanter Daten von 5 verschiedenen Windowsversionen, vermischt mit seinen Anwenderdaten. Da ich es mir nicht antun werde das ganze per Hand zu sortieren und zu bereinigen, werde ich das per Script machen. Dieses liest die Eigenschaften (Grösse, md5-Summe, etc.) der Daten (Ordner und Dateien) in ein Array ein, macht aus identischen Dateien Hardlinks und brennt das ganze anschliessend auf DVD. Ein erster Probelauf hat auch schon funktioniert und mir den Inhalt von einigen Testverzeichnissen von 20 GB auf 8 GB reduziert. Es hakt aber noch an ein paar Ecken - d.h. das Script ist noch im Beta-Stadium... Ähnliche Dateien findet es übrigens nicht, d.h. die Datei x.mp3 mit 128kb/s wird nicht als "Bruder" von x2.mp3 (mit 192kb/s) erkannt, und die Ausgangsdatei x.wav schon gar nicht... - und Du wirst wahrscheinlich nur eine von beiden behalten wollen. Falls Du interesse hast kann ich Dir das Script ja per PM zuschicken. Gruss Mario
![](https://seccdn.libravatar.org/avatar/52ea74c99bb2d750cbed66670f259a69.jpg?s=120&d=mm&r=g)
Hallo, Am Samstag, 20. November 2004 18:52 schrieb Mario van der Linde: [...]
Ich bastel gerade an einem Perl-Script, das unter anderem Deine Anforderung erfüllt. Ausgangspunkt meines Scriptes ist folgender: Auf dem Rechner meines Vaters herscht ein hoffnungsloses Chaos. Anstatt Ordnung zu halten hat er halt immer grössere Festplatten eingebaut die mit der Zeit immer mehr vollgemüllt wurden. Um das Drama perfekt zu machen hat er bei jedem BS-Upgrade die komplette alte Installation gesichert und behalten. Das Ergebnis: 150 GB teilweise redundanter Daten von 5 verschiedenen Windowsversionen, vermischt mit seinen Anwenderdaten. Hehe, das Problem kenne ich ;) Unter Windows hatte ich dazu schonmal irgendein Programm gefunden, dass auch ähnliche Dateien findet und aufzeigt, daher meine genauen vorstellungen der Features ;) Nur jetzt bei den MP3s müsste ich alles irgendwie auf eine Win-Partition kopieren (auf einer Uralten und ziemlich sehr lauten Festplatte ist bei mir noch ein Windows XP. Dort müsste ich die Ordner der Musik auch häppchenweise rüberkopieren, weil die Festplatte nur sehr klein ist.... außerdem will man solche Probleme ja schon unter Linux lösen ;-)
Da ich es mir nicht antun werde das ganze per Hand zu sortieren und zu bereinigen, werde ich das per Script machen. IMO eine gute idee.
Dieses liest die Eigenschaften (Grösse, md5-Summe, etc.) der Daten (Ordner und Dateien) in ein Array ein, macht aus identischen Dateien Hardlinks und brennt das ganze anschliessend auf DVD. Ein erster Probelauf hat auch schon funktioniert und mir den Inhalt von einigen Testverzeichnissen von 20 GB auf 8 GB reduziert. Hui.. das hat sich ja schon gelohnt...
Es hakt aber noch an ein paar Ecken - d.h. das Script ist noch im Beta-Stadium... Ähnliche Dateien findet es übrigens nicht, d.h. die Datei x.mp3 mit 128kb/s wird nicht als "Bruder" von x2.mp3 (mit 192kb/s) erkannt, und die Ausgangsdatei x.wav schon gar nicht... - und Du wirst wahrscheinlich nur eine von beiden behalten wollen. Ja. Allerdings löst dein Skript ja immerhin das Problem mit dem "gleiche Datei, aber anderer Dateiname". Da das bei verschiedenen Quellen von denen ich die Lieder habe, zwar noch keine endgültige Lösung darstellt, aber es wird wohl ein paar MB freien Plattenplatz liefern.
Falls Du interesse hast kann ich Dir das Script ja per PM zuschicken. Wäre echt nett von dir :-)
Gruß Sören
![](https://seccdn.libravatar.org/avatar/53a6cf42dedfb6fc1a0ab35224022f75.jpg?s=120&d=mm&r=g)
Am Samstag, 20. November 2004 19:32 schrieb Sören Wengerowsky: [...]
Allerdings löst dein Skript ja immerhin das Problem mit dem "gleiche Datei, aber anderer Dateiname". Da das bei verschiedenen Quellen von denen ich die Lieder habe, zwar noch keine endgültige Lösung darstellt, aber es wird wohl ein paar MB freien Plattenplatz liefern.
Falls Du interesse hast kann ich Dir das Script ja per PM zuschicken.
Wäre echt nett von dir :-)
Gruß Sören
Hat es geholfen? Ich habe eine Kleinigkeit vergessen...: Falls Du iso-Images zwischen Deinen Dateien herumfliegen hast, könnte es Probleme geben. Eine Datei darf nicht grösser sein als der Arbeitsspeicher (ob mit oder ohne swap weiss ich nicht) um die md5-Summe mit dem Perl-Modul zu berechnen. Was passiert, wenn die Datei grösser ist kann ich nicht sagen, da die Speicherausstattung auf meinem Rechner ausreicht...;) Falls also diesbezüglich Fehler auftauchen sollten ändere folgende Zeile # if ( $size < 1000000000 ) { in # if ( $size < $DeinArbeitsspeicher ) { um, dann sollte alles funktionuckeln... Gruss Mario
![](https://seccdn.libravatar.org/avatar/52ea74c99bb2d750cbed66670f259a69.jpg?s=120&d=mm&r=g)
Hallo, Am Sonntag, 21. November 2004 13:21 schrieb Mario van der Linde: [..]
Hat es geholfen? Ich habe deine Mail gestern Nacht/Heute morgen noch gelesen, aber hatte das noch nicht ausprobiert. Allerdings überlege ich noch, wie ich das sinnvoll mit dem Quell- und zielverzeichnis machen kann.
Ich habe ja wie gesagt (fast) alle Dateien, die ich überprüfen wollte in einem Ordner (habe ich das oben nicht geschrieben?) Soll ich den dann als Quell- und Zielverzeichnis angeben? IMHO bringt das nichts..
Ich habe eine Kleinigkeit vergessen...: Falls Du iso-Images zwischen Deinen Dateien herumfliegen hast, könnte es Probleme geben. Eine Datei darf nicht grösser sein als der Arbeitsspeicher (ob mit oder ohne swap weiss ich nicht) um die md5-Summe mit dem Perl-Modul zu berechnen. Naja... ich wollte damit ja Ordnung in meine Musiksammlung bringen. Da stellt sich das Problem mit dem Speicher nicht so ;) Was passiert, wenn die Datei grösser ist kann ich nicht sagen, da die Speicherausstattung auf meinem Rechner ausreicht...;) Falls also diesbezüglich Fehler auftauchen sollten ändere folgende Zeile # if ( $size < 1000000000 ) { in # if ( $size < $DeinArbeitsspeicher ) { um, dann sollte alles funktionuckeln...
Vielen Dank Gruß Sören
participants (2)
-
Mario van der Linde
-
Sören Wengerowsky