Hallo Liste, wir, d.h. das Institut an dem ich arbeite, planen unsere Rechnerkapazitaet stark auszuweiten. Derzeit haben wir einen Cluster von Sun-Workstations bzw. Sun-Servern. Die Gesamtleistung unseres Clusters entspricht derzeit ca. 16 x 170 MHz CPUs. Uns stehen fuer die geplanten Investition ca. 200 kDM zur Verfuegung. Bei Sun kann man fuer dieses viele Geld leider nur eine eher bescheidene Erweiterung unseres Clusters erstehen (2-4 x 250-300MHz). Mit Intel/Linux sieht es natuerlich viel guenstiger aus... Wenn ich z.B. bei SuSE auf der Homepage nachschaue, finde ich folgenden Number-Cruncher:
SMP-Cruncher II 2 x Intel P2 333MHz ASUS P2L97-DS Dual-P2 Motherboard 512MB SDRAM Adaptec UW-SCSI Controller OnBoard IBM DDRS 4,3GB UW-SCSI Festplatte Viper 330 AGP 4MB SGRAM Toshiba 32x SCSI CDROM TEAC FD 235HF 3,5" Floppy-Laufwerk Logitech Pilot Mouse Cherry-Tastatur ATX Tower +Netzwerkkarte = 8.9 kDM (Brutto)
Nehme ich hiervon 16 Stueck und zusaetzlich noch einen RAID5 Server:
Raid5-Server Intel P2 233MHz Asus P2L97-S Motherboard (3 x dimm) 128MB SDRAM Adaptec AHA-2940 Ultra-Wide SCSI-Controller OnBoard S3 VGA 2MB Toshiba 32x SCSI CDROM TEAC FD 235HF 3,5Zoll Floppy-Laufwerk Logitech Pilot Mouse 3T Cherry-Tastatur Server-Tower mit 2 redundanten Netzteile +2 Netzwerkkarten PCI/100MBit +108GB UW-SCSI (7 x 18GB IBM-DGHS, GDT6527/32MB) = 37.6 kDM (Brutto)
Jetzt brauche ich noch ein oder zwei Hubs/Switches, um alle Maschinen mit guter Bandbreite an den RAID-Server zu haengen, der die Daten zur Verfuegung stellt. Ggf. auch noch eine kombinierte Tastatur, Maus und Bildschirm Weiche, um jeweils eine Console realisieren zu koennen. Insgesammt komme ich dann auf etwa den Betrag, den wir zur Verfuegung haben. Und das bei einer Vervierfachung der Leistung (wenn man lediglich die Taktraten hochrechnet). Meine Frage ist nun, gibt es Mitleser in dieser Liste, die solch ein System oder ein aehnliches realisiert haben und mir mit ihren Erfahrung helfen koennen, Fehler zu vermeiden? Wie kann ich z.B. ein Backup von dem System sicherstellen? Wo liegen evtl. Fallstricke? PS. Das Parallelisieren an sich ist bereits geschehen und findet auch schon erfolgreich im Sun-Cluster statt. Auch die Interprozesskommunikation stellt keinen besonderen Flaschenhals dar. Ledig muessen haeufig groessere aber statische Datenmengen vom RAID-Server auf die Number-Cruncher gebracht werden, wenn Prozesse anlaufen. Viele Gruesse, Ruben -- Ruben Schattevoy Institut fuer Molekulare Biotechnologie, Beutenbergstrasse 11, 07745 Jena, Germany -- Um aus der Liste ausgetragen zu werden, eine Mail an majordomo@suse.com schicken, mit dem Text: unsubscribe suse-linux
participants (1)
-
schattev@imb-jena.de