Hi Hagen, hi Marc, hi Liste, Hagen Kühnel wrote:
an Marc Mc Guinness 's Tastatur wurde am Mittwoch, 21. November 2001 14:50 folgendes notiert:
Eine Oracle-Lizenz hätte ich auch noch, aber mit Oracle habe administrationstechnisch noch keinerlei Erfahrungen gemacht...
Oracle ist hierfür wohl angeblich geeignet, habe ich mal von jemandem gehört, der es irgendwo gehört hat und sich dunkel dran erinnern konnte - sprich: noch nie getestet, hat bestimmt auch Tücken.
IMHO, ist Oracle etwas oversized, MySql ist schon gut AFAIR ist MySql nur ein Sql-fähiges ISAM-Filesystem, mit dem schon seit Generationen Text-Daten verwaltet werden, die Nachteile die im Vergleich zu anderen Datenbanken immer genannt werden ( z. B. Transaktion ) sind für diesen Einsatzzweck unerheblich, da eh nur lesend darauf zugegriffen wird. Wenn ich irgendwelche große Zahlen über Datenbanken höre, werde ich immer vorsichtig, da in den meisten Fällen die Hardwarevoraussetzung eine ganz andere ist. Viel wichtiger ist das Datenbankdesign, hier spricht man wohl besser von Datendesign und Abfragedesign. Die Datenmenge wird auch erheblich schrumpfen, wenn man alle überflüssigen Daten, die in einer mail zwangsläufig sind wegläßt. Ich habe ein ähnliches Project auf Client/Server-Basis mit Kylix angfangen, ist aber noch im Anfangsstadium, hab mich in der Client-programmierung verstrickt, will zuviel auf einmal, serverseitig steht es aber soweit, war auch einfacher, da das mein Fach ist, relevanten Daten, Daten sie in die Datenbank kommen sind für mich nur folgende: From-Header, Datum-Zeit, Referenz-Header, Body-Text in ASCII und Verweis für Anhänge. Aus Bequemlichkeits- und Performensgründen habe ich nur leicht Normalisiert d.h. es liegen viele Daten redundant vor.
MySQL ist mir eigentlich am sympathischsten aber, Mir auch, deswegen die Einwände.
MySql bietet ja auch alles was man braucht, wichtigste dürfte Volltextsuche über Textattribute sein. Bei einer Datenbank, die einen hohen Abfrageverkehr hat, muß man die Abfragen so einstellen, daß z.B. nicht der ganze Bodytext durchsucht werden kann, sonder nur einen maximale vorgegebenen Zeitraum z. B 2 Monate, zudem sollten die Ergebnisse in einer seperaten Relation eine zeitlang zwischen gespeichert werden, bzw es solte eine Relation für eine Indezierung angelegt werden, die die häufigsten Suchbegriffe beinhaltet, und immer aktuell gehalten wird, es geht schneller 100 mails nach Begriffen wie z. B. sendmail, kernel zu durchsuchen und sie entsprechend einzutragen, als immer wieder eine Vollindizierung durchzuführen. Die Einwände sind OK, aber man sollte auch bedenken, daß eine gut designte und gewartete MySql wohl schneller sein kann als eine schlecht designte und gewartete Oracle und letzteres wäre ja der Fall, da MySql-Wissen vorhanden ist und Oracle-Wissen weniger bis garnicht. Oracle lernt man auch nicht so mal eben, schaut euch mal die Stundensätze von Oracle-Administratorn an, die kommen nicht von ungefähr.
news://....../de.alt.comp.datenbanken oder so ähnlich
PS: werde mir mal am Wochenende MySQL 4 beta zu Gemüte ziehen. wichtig ist IMHO das absichern von DOS, sprich: Suchabfragen dürfen ab einem Last-Schwellenwert nicht mehr angenommen werden und nach einer bestimmten Zeit (PHP: 30sek -> SQL equivalent) gekillt werden. Frage mich nicht wie es geht, aber es muss ja irgendwie gehen, zur Not muss halt ein cron top auswerten. Ziel sollte aber schon eine Indizierung des Textes sein.
FAC my 2¢ cu Gerald PS: Marc kannst auf mich zählen in Bezug auf Datenbankdesign, ich persönlich würde eine MySql-Lösung vorziehen. Webdesigner hast du ja auch schon und den Rest kannst ja du, also: Let's fetz