Hallo Sandy danke für deine Ausführungen. ich antworte mal dazu direkt hier oben (in der Mail): Ich habe die Datenmenge auch nur mal "über den Daumen" geschätzt. Es ist klar, dass die Hardware diesbezüglich den Anforderungen genügen muss. Ich denke da an ein SCSI-Raid mit Ausbaureserven. Es stehen beide Varianten zur Wahl, schlüsselfertig oder zum anpassen zB. mit Standardpaketen und Ergänzungen individueller Art. Die Suchfunktionen dürften schon so ausführlich wie möglich sein. Eigentlich stelle ich mir eine relationale Datenbank vor, die auch bei grossem Datenvolumen immer noch performant ist und dazu eine Benutzeroberfläche die die erw. Suchmöglichkeiten bietet. Eine gefundene Mail sollte sich dann auch relativ einfach aufrufen und zB. drucken lassen. Domino schaue ich mir mal näher an. Es ist klar, dass es etwas kostet. Ich meine nicht, dass alles mit Linux immer total gratis sein muss. Die Daten sollen über den vorgesehen Zeitraum zugänglich (lesbar) sein. Der Zugriffschutz wird organisatorisch geregelt (Zugang zum Serverraum). Ein Backup der Platte(n) muss vorhanden sein. Ich kenne das Index-System für Cyrus (noch) nicht. Aktuell haben wir einen neuen Kolab-Server in Betrieb, brauchen natürlich relativ viel Platz, da die Mails unkomprimiert abgelegt sind. Persönlich glaube ich im Moment nicht, dass sich die erwarteten Datenmengen auch mit Cyrus speichern und verwalten liessen. Was ich dazu auch vermisse, ist eine einfache grafische GUI um so einige Verwaltungsaufgaben durchzuführen. Nicht alle Leute arbeiten gerne mit dem cyradm auf der Kommandozeile. Weist du hier ein Produkt? Mit Squatter habe ich mich noch nicht beschäftigt. Ich sehe nur in den Kolab-Logs immer die Hinweise auf fehlende Indexe. - Priorität ist eine betriebssichere und stabile Lösung - Suchfunktionen für Headers, Sender, Empfänger, Datumsbereich - Einfaches Wählen der gefundenen Mails und Ausdruck - ev. Userstatistik (wer wie viel Mails und Speicherplatz) - Datenverlust darf niemals passieren! Danke und Grüsse Bernhard Am Montag, 29. Januar 2007 20.05 schrieb Sandy Drobic:
Bernhard Bühler wrote:
Hallo und danke für die Antwort
Primär habe ich nur die Aufgabenstellung für Mails. Ich rechne mit einem jährlichen Datenaufkommen von ca. 100 GB, dies auf fünf oder 10 Jahre.
Vertue dich da besser nicht. Die normale Annahme ist, dass die Datenmenge eines Unternehmens sich etwa alle zwei Jahre verdoppelt. Anhand unseres Mailvolumens kann ich das locker bestätigen. Vor etwa drei Jahren brauchte unser Dominoserver etwa 10GB, inzwischen gehen sind wir 90GB zu, obwohl wir die Leute dazu anhalten, Schrott zu löschen. Der Trend geht rasant nach oben.
Ein Budget besteht aktuell noch nicht, es darf jedoch etwas kosten.
Da müsst ihr vorab auswählen, ob ihr selbst Arbeit und Entwicklung in den Aufbau des Archivs stecken wollt oder für eine schlüsselfertige Lösung eine entsprechend größere Investition tätigen wollt.
Entscheidend ist auch, wie gut die Suchfunktionen sein sollen. Wenn auch die Anhänge indiziert werden sollen, dann gibt es eigentlich nur die Wahl zwischen teuer: kommerzielle Lösung verwenden unsicher: eine Desktop-Suchmaschine verwenden mühselig: Apache-Suchfunktionen in Verbindung mit Imapserver begrenzt: Cyrus-Server mit Squatter als Volltext-Index ohne Anhänge
Daneben gibt es noch Zwischenlösungen wie etwa einen Dominoserver, in dem alle Daten in Lotus-Datenbanken einfließen. Dieser kann PDF, Word, und Excel indizieren. Die Kosten sind für einen lokalen Server nur ein paar hundert Euro. Dafür kann die Datenbank verschlüsselt werden und fein granuliert Zugriffsrechte auf Datenbanken und sogar einzelne Dokumente gegeben werden.
Appropos "darf etwas kosten":
Schon die Hardware allein für ein paar Terabyte Speicherkapazität kostet schon einiges, die Sicherung des ganzen noch einiges mehr (ihr plant doch ein Backup dieser Daten, oder?). Ich wäre erstaunt, wenn eine Lösung mit einigen wenigen Terabyte für einen vierstelligen Betrag zu haben ist. Ich würde als grobe Gesamtsumme für Hardware + Software + Entwicklung + Anpassung + Schulung grob etwa 10-15 kEuro ansetzen. Ohne irgendwelche Sonderwünsche.
Es gibt nur wenige Anwender (einfache Authentifikation)
Das ist schon einmal gut. Ist das ein rein interner Server oder ist es auch gedacht als Archiv, das jederzeit von überall erreichbar sein soll?
Es werden nur Mails und allenfalls Mail-Anhänge gespeichert (PDFs, Excel, Word-Docs)
Auch das sollte machbar sein.
Der Zugriffschutz wird organisatorisch geregelt, die Daten müssen aber absolut sicher sein (während der Zeitdauer).
Das habe ich nicht ganz verstanden. Wovor sollen die Daten sicher sein? Gegen unberechtigen Zugriff oder vor Zerstörung/Manipulation?
Ich stelle mir das so vor, dass jede ankommende und ausgehende Mail in ein Archiv aufgenommen wird. Dazu sollen relevante Daten in einer Datenbank mit entsprechender Referenz zur Mail (Sender, Empfänger, Datum, Betrifft, usw.) gespeichert werden. Anhand von Suchkriterien sollen Mails später wieder gefunden und danach zB. gedruckt werden können.
Das ist das geringste Problem. Dazu gibt es Lösungen wie Mailinglisten-Manager bzw. deren Webarchive. Das ist sogar mit Cyrus sehr einfach machbar. Obwohl squatter nicht gerade ein Platzsparer ist, eigentlich ist es sogar ein ziemlicher Verwender. (^-^)
Wo sind eure Prioritäten? Was muss erfüllt sein? Was darf auf keinen Fall passieren?
-- Sandy
Antworten bitte nur in die Mailingliste! PMs bitte an: news-reply2 (@) japantest (.) homelinux (.) com
-- Um die Liste abzubestellen, schicken Sie eine Mail an: opensuse-de+unsubscribe@opensuse.org Um eine Liste aller verfuegbaren Kommandos zu bekommen, schicken Sie eine Mail an: opensuse-de+help@opensuse.org