Bernhard Vornefeld, Samstag, 29. Mai 2004 14:28:
Hallo Matthias
Außerdem: Wer seine Daten vernünftig ablegt, hat auch kein Problem mit dem Wiederfinden. Gut, bei Privatusern wird das wohl immer ein Problem bleiben ;-)
Das mit dem "vernünftig ablegen" ist ein weites Feld. Derzeit steht unter den meisten Betriebssystemen nur ein hierarchisches Dateisystem für diesen Zweck zur Verfügung, leicht aufgeweicht durch die Möglichkeit, symbolische Links zu setzen. Das war's. Je nach Beschaffenheit der Daten und der gewünschten Suchheuristiken ist diese Art der Datenverwaltung nicht hinreichend.
Ich denke mal, in den meisten Fällen ist das schon hinreichend. Andernfalls steht es dir frei, eine Datenbank anzulegen, in der du alle (dir wichtigen) Dateien erfasst, die entsprechenden Merkmale dazu trägst und ggf. auch Verknüpfungen und Indexe anlegst. So eine Datenbank wird allerdings genaueste Vorüberlegungen für jeden speziellen Anwendungsfall erfordern. Sowas kann es kaum generell für alle Möglichkeiten geben, wenn es denn auch effizient sein soll. Es steht dir auch frei, eine solche Datenbank mit direktem Zugriff z.B. auf die Node-Einträge von ext2 unter GPL zu entwickeln. Sei dir aber dessen bewusst, dass du diese Datenbank aber auch sorgfältig mit Meta-Daten füttern musst, damit es funktioniert. Das wird sich nur ansatzweise automatisieren lassen.
Andere Verfahren: - Metadatenbasierte Suche - Ähnlichkeitssuche (fehlertolerant) - Suche aufgrund phonetischer und visuellar Ähnlichkeit ("Zeige mir Objekte, die diesem gleichen"),... - Inhaltsbasierte Suche (Volltextsuche) - Suche nach Formalia ("Zeige alle Objekte, zu denen kein Autor eingegeben wurde" (zwecks anschließender Vervollständigung))
Mit ein bisschen Verständnis für den Aufbau der einzelnen Dateiformate sollte das durchaus machbar sein. Übrigens können das viele Programme mit den von ihnen selbst erstellten Dateien schon. Ich kenne aber z.B. nur eine Firma (und ich kenne viele), in der die Metadaten der MS-Office-Dateien wirklich genutzt werden (und auch das nur sehr halbherzig).
Da helfen keine Symlinks. Hierrchische Dateisysteme alleine sind nur begrenzt zur Speicherung von Metadaten geeignet. Bislang müssen Metadaten (Beispiele: id3, IPTC, RTF) irgendwie in die Dateien selbst eingebettet werden, was eher leidlich klappt. Öffnet man die Files mit dem falschen Programm, sind die Metadaten futsch.
Das kann passieren. Dann darf man eben solche Programme nicht nutzen. Speichert man aber Metadaten nicht in der Datei selbst, sind sie futsch, wenn man die Datei auf ein anderes System weitergibt.
Außerdem: In wenigen Jahren werden Massenspeicher nicht mehr in Gigabyte, sondern in Terabyte bemessen. Und eins ist gewiß: die User werden auch 3-Terabyte HDs vollkriegen. Es scheint mir nicht mehr praktikabel, hier mit find, locate und grep in vernünftigem Zeitrahmen etwas wiederfinden zu wollen.
Aha. Womit schreiben denn jetzt die Leute ihre 80 GB Platten voll? Doch nicht mit Texten und Tabellen. Also wird grep und find auch weiter funktionieren.
Es mag zwar auch dann noch Leute geben, die auf diesen Volumina noch die komplette Orientierung haben, doch dürfte es sich dabei hauptsächlich um zwangsneurotische Pedanten oder um autistische Gedächtnisakrobaten handeln, nicht mehr um Durchschnittsuser.
Nein, es wird sich dabei um User handeln, die sich der Problematik einer logischen Ordnung bewusst sind. Aber auch nur diese wären willens und bereit, so eine Metadatenbank zu pflegen und zu nutzen (wenn sie es brauchen). Und solche Systeme gab und gibt es auch schon.
Das haben eigentlich auch schon einige Entwickler erkannt und so gibt es schon eine Reihe von kleineren Mediendatenbanken mit begrenztem Fokus: Hier mal wieder eine neue MP3-Datenbank, da mal wieder ein Bildkatalogisierer. Ein großer, integrierender Wurf war bislang nicht dabei, jedenfalls nichts, das kommerziellen Tools wie Cumulus Paroli bieten könnte. Was m.E. fehlt ist eine flexibele, vernetzbare Desktopdatenbank mit auswechselbarem Backend und einer ganzen Reihe von fertigen Applikationen für die wichtigsten Anwendungen in Heim und Büro: Beliebige Dokumente verwalten (inkl. Versionsmanagement und Workflow), mit Notizen und Anmerkungen versehen, sicher ablegen (inkl. Handreichnungen beim Backup) und jederzeit wiederfinden, auch auf Wechseldatenträgern. Und dieses Ding muss sich nahtlos in den Desktop integrieren, so dass es für jeden *einfach da* ist, nichts an dem man Stundenlang herumkonfigurieren *muss* (wohl kann). Das Ding soll die Fotosammlung vom letzten Urlaub genauso verwalten können, wie die Literaturliste meiner Diplomarbeit und die Adressen meines Taubenzüchtervereins. Wenn ein System das nicht bieten kann und statt dessen seine Anhänger weiter das hohe Lied von find, grep und locate, gewürzt mit einer PRISE bash und Perl singen, bleibt es ein Nischenprodukt. Ich weiß, dass WinFS derzeit noch ziemlich wie eine Luftnummer aussieht. Der Kuchen ist noch nicht verspeist. Hier ist eine Chance zum vorher Zuschnappen, nicht zum Däumchen drehen.
Na dann: Ärmel hoch und ran an die Arbeit. Die Lorbeeren des Erfolgs und der weltweiten Anerkennung warten auf dich. -- Gruß MaxX 8-) Hinweis 1: PMs an diese Adresse werden automatisch vernichtet. Hinweis 2: Bitte unbedingt beachten: http://www.suse-etikette.de.vu