
Hallo Alex, Am 26.06.20 um 10:48 schrieb Alex Winzer:
Am 23.06.2020 um 17:20 schrieb Jan Handwerker:
Am 23.06.20 um 15:43 schrieb Alex Winzer:
Ich möchte gern alte Datenbestände von meinen Navigationssystemem sichern. Diese sind auf SD-Karten und nehmen ca. 16 GB Platz ein. Insgesamt 3 Stück also mehr als 42 GB. Dazu ist zu sagen, dass viele Daten/Dateien redundant sind. Mittels CloneSpy (aus der Windows-Welt und mangels Kenntnis von Alternativen), konnte ich Hardlinks anlegen lassen und das ganze so auf ca. 28 GB "verkleinern". Die größten und identischen Dateien sind dabei so ca. 800 MB groß.
[...]
zunächst einmal vermute ich, dass Dein Kompressionsverfahren die Hardlinks nicht erkannt hat und deshalb jede einzelne Version wieder getrennt komprimiert hat, so dass die Wirkung der Hardlinks aufgehoben wurde. Da wäre es ein Ansatz, nicht Hardlinks, sonder Softlinks zu verwenden und nur die Dateien zu komprimieren.
Welcher Kompressor erkennt denn Softlinks? Alle?
Hast Du denn den Unterschied zwischen Softlinks und Hardlinks verinnerlicht? Bei einem Hardlink wird ein weiterer Eintrag in der FAT (File Allocation Table) gemacht. (Das hängt im Detail vom Filesystem ab, Feinheiten brauchen wir aber mal nicht.) Wenn Du eine Datei "Beispiel" anlegst und einen Hardlink "MeinBeispiel" dazu anlegst, hast Du zwei gleichberechtigte Einträge in der FAT, die auf den gleichen Speicherbereich auf der Festplatte verweisen. So können beliebig viele Einträge in der Fat für einen Speicherbereich der Festplatte angelegt werden. Alle Einträge sind gleichberechtigt, alle glauben, den Platz auf der Platte für sich zu haben und so fällt unter Umständen du (disk usage) darauf herein und sagt Du hast das Fünffache des Platzes verbraucht, obwohl nur 5 Hardlinks auf die immer gleiche Datei verweisen. Der Speicherbereich wird erst dann wieder frei gegeben, wenn alle 5 Einträge in der FAT gelöscht werden. Ein Softlink zeigt im Gegensatz dazu nicht auf den Inhalt auf der Platte, sondern auf den anderen Eintrag in der FAT. Das ist im Ergebnis etwas ganz anderes. Ein Softlink ist auch nur ein Eintrag in der FAT, aber er zeigt nicht auf einen Speicherbereich der Festplatte, sondern nur auf einen anderen Eintrag. Da ist nix mit gleichberechtigt. Der Softlink ist jederzeit von der eigentlichen Datei zu unterscheiden. Löscht Du die Zieldatei, dann bleibt der Softlink bestehen, zeigt aber ins Leere. Hardlinks funktionieren nur innerhalb einer Partition. Softlinks können an beliebig andere Stellen im Filesystem verweisen. Wenn sich nun Dein Kompressionsprogramm durch das Filesystem arbeitet, findet es jede einzige Kopie des Hardlinks, komprimiert die Datei und reduziert den Zähler der Hardlinks, die auf die Datei zeigen. Die komprimierten Versionen der Hardlinks sind dann nicht mehr eine komprimierte Datei mit mehreren Hardlinks darauf, sondern jede komprimierte Datei braucht wieder den vollen Platz. - Das kann hinterher mehr Platz als vorher sein. Bei einem Softlink wird der Softlink gar nicht komprimiert. Nur die eine Version der Datei auf der Festplatte wird komprimiert. Da sich der Dateiname dann ändert (es wird z.B. ein .gz angehängt), zeigen die Softlinks ins Leere. Entweder man lebt damit ("ich weiß ja, dass jetzt die .gz-Datei gemeint ist") oder man macht sich neue Softlinks. Es verhindert aber erfolgreich den benötigten Plattenplatz.
Weiter weiß ich nicht genau, was Du da für Datenbestände hast. Sind es die Landkarten oder geht es um Deine Routen, die als gpx-Dateien (oder was ähnlichem) gespeichert sind?
Das weiß ich selbst nicht so genau. Denkst Du, VW hat das irgendwo öffentlich gemacht, so dass sich eine Suche lohnen würde?
Glaub ich auch nicht. Aber schau Dir doch die Dateien an (head "file") oder frage das Tool "file" danach: "file -i datei" gibt Dir eine Einschätzung, was das für eine Datei ist. gpx-Tracks sind reiner Text.
Ich verwende für solche Aufgaben meist gzip. Das bedeutet auch, ich packe nicht mehrere Dateien in ein Archiv, sondern jede Datei einzeln wird verpackt. Mit Parameter -9 wird langsam aber gut komprimiert.
Damit wäre aber mein Plan, explizit die Redundanz auszunuten, nicht mehr umsetzbar.
Mit Hardlinks nicht. Mit Softlinks schon.
Vielleicht noch als Ergänzung/Erklärung zum Hinweis "rm -f":
Der stammt nicht von mir.
Im Grunde hat Manfred recht. Allerdings sind es nicht meine Daten und sie sollen in einer Cloud zwischengebunkert werden. Dort kostet Platz aber etwas. Und ich habe ab und an ein ähnliches Problem mit anderen Daten.
Ich unterlag insoweit dem Irrglauben, dass man bei einer Wörterbuchgröße von z.B. 4 GB genau das hinbekommt. Mir geht es also nicht um diese 13 GB, sondern darum, das Prinzip etwas besser zu verstehen. Ich fühle mich daher von solchen Kommentaren ehrlich gesagt ein wenig auf den Schlips getreten :-D
Kann ich verstehen. Je nach Datenbestand hat Manfred ja durchaus recht, denn ich halte es für unwahrscheinlich, dass Du je auf alte Navi-Karten zurückgreifen willst (außer Du hast ein historisches Interesse daran). Ich habe auch nie den Versuch gestartet, mit einem Atlas aus den 50er Jahren eine Urlaubsreise anzutreten. Das grundsätzliche Problem, wie bekomme ich meine Daten sinnvoll komprimiert, wurde damit nicht diskutiert. Die Frage bleibt für mich aber wichtig, denn leider wachsen mit den Speichermöglichkeiten auch die Datenmengen. ("Daten sind ein ideales Gas. Sie nehmen den ihnen zur Verfügung gestellten Platz stets voll ein.) Auf Dauer sind immer größere Speicher nicht die Lösung des Problems. Herzliche Grüße Jan -- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um den Listen Administrator zu erreichen, schicken Sie eine Mail an: opensuse-de+owner@opensuse.org