Schrödinger II

von Peter Marksteiner (Ausgabe 03/1, März 2003)

 

Wer nicht täglich einen Schritt nach vorne geht, bleibt täglich einen Schritt zurück. - Nirgends gilt dieses Sprichwort so sehr wie in der Informationstechnologie, wo der technische Fortschritt sehr viel schneller ist als in fast allen anderen Bereichen. Beispielsweise hat der Supercomputer der Uni Wien, Schrödinger I (siehe Comment 01/2) im Februar 2002 beim Linpack-Test 204,5 GFlops erzielt: Im November 2001 hätte er damit Platz 147 der Weltrangliste der 500 schnellsten Supercomputer erreicht, im Juni 2002 belegte er Platz 264, und im November 2002 war er auf Platz 370 zurückgefallen.

Bereits bei der Planung des auf vier Jahre befristeten Supercomputing-Projekts wurde berücksichtigt, daß ein Supercomputer nach vier Jahren hoffnungslos veraltet ist, und Budgetmittel für mindestens zwei Ausbaustufen vorgesehen. Die Planung der ersten Ausbaustufe begann im November 2002; Mitte März 2003 sollen die Umbauten abgeschlossen sein.

Bei allen Komponenten des Supercomputers wurde genau untersucht, wie sie erweitert oder durch leistungsfähigere ersetzt werden sollten:

  • Prozessor: Im ewigen Wettlauf zwischen Intel und AMD um den schnellsten Prozessor hat Intel gerade die Nase vorne (in einigen Wochen kann sich das wieder ändern): Bei Benchmark-Tests war der Pentium 4-Prozessor mit 2,4 GHz von Intel meistens mehr als doppelt so schnell wie der AMD Athlon XP 1700+, der bisher in Schrödinger I eingesetzt wurde.
  • Hauptspeicher: Für einen Supercomputer ist schneller Speicher mit hoher Bandbreite mindestens genauso wichtig wie leistungsfähige Prozessoren. Bei den Benchmark-Tests konnten durch schnelleren Rambus-Speicher in fast allen Fällen erhebliche Performance-Gewinne gegenüber dem bisher verwendeten DDR RAM erzielt werden - in manchen Fällen mehr als 100%. Trotz des beträchtlichen Preises war die Entscheidung zugunsten von Rambus schon fast gefallen, als von Intel der neue Chipset E7205 vorgestellt wurde, der mit DDR RAM eine ebenso hohe Bandbreite erreichen sollte wie die bisherigen Chipsets mit Rambus. In der Praxis stellte sich heraus, daß Rambus immer noch um einige Prozent schneller ist; das Preis-/Leistungsverhältnis ist jedoch bei DDR RAM mit dem neuen Chipset wesentlich besser.
  • Vernetzung: Der Anteil an parallelen Programmen, die eine leistungsfähige Netzwerk-Verbindung der Knoten untereinander benötigen, wird immer größer. Bisher waren 96 Knoten mit Fast Ethernet und 64 Knoten mit Gigabit Ethernet ausgerüstet. Für eine noch schnellere Verbindung als Gigabit Ethernet (z.B. Myrinet) besteht wenig Bedarf, Fast Ethernet ist aber eindeutig zu wenig.
  • Massenspeicher: Mehr Plattenplatz ist dringend notwendig - der Fileserver ist chronisch überfüllt.

Nach einer eingehenden Analyse des Bedarfs, der vorhandenen Budgetmittel und der am Markt verfügbaren Komponenten wurde folgende Ausbau-Variante gewählt:

  • Austausch sämtlicher Motherboards und Prozessoren durch Asus P4G8X Deluxe Motherboards mit dem E7205-Chipset und einem Intel Pentium 4-Prozessor mit 2,53 GHz. Der bisherige Hauptspeicher (1 GB DDR RAM pro Knoten) wird weiterverwendet.
  • Vernetzung des gesamten Clusters mit Gigabit Ethernet. Die Motherboards haben bereits einen Gigabit-Anschluß, sodaß keine zusätzlichen Gigabit-Karten erforderlich sind. Die bisher verwendeten Ethernet-Switches von HP werden durch einen einzigen Cisco 4500-Switch ersetzt.
  • Der Plattenspeicher wird ausgebaut und auf zwei Fileserver verteilt. Beide Fileserver gemeinsam verfügen über eine Plattenkapazität von etwa 1,5 TB, das ist ungefähr das Sechsfache des bisherigen Speicherplatzes.
  • Der Cluster wird um 32 zusätzliche Knoten erweitert und hat somit insgesamt 192 Knoten.
  • Für einzelne Applikationen mit hohem Speicherbedarf (insbesondere Gaussian 98) wären mehr als 1 GB Hauptspeicher pro Knoten wünschenswert. Vorerst wird versucht, dieses Problem durch Parallelisierung zu lösen; falls das nicht ausreicht, werden einige Knoten mit 2 GB Hauptspeicher ausgerüstet.
  • Neben der Parallelisierung von Gaussian wird es noch einige Verbesserungen beim Software-Angebot geben: Das Softwarepaket Amber 7 (Molekulardynamik für Biomoleküle) steht seit einiger Zeit zur Verfügung und wird ebenfalls parallelisiert. Das bisher verwendete Batchsystem PBS soll durch die modernere und leistungsfähigere Sun ONE Grid Engine ersetzt werden.

In Summe ist das eher ein Austausch als ein Ausbau: Außer den Gehäusen bleibt von Schrödinger I wenig übrig. Naheliegenderweise erhält der neue Cluster den Namen Schrödinger II. Selbstverständlich erfolgt der Ausbau nicht, um einen guten Platz in der Liste der Top 500 zu erreichen, sondern um ausreichend Rechenleistung für Spitzenforschung zur Verfügung zu stellen. Dennoch ist zu hoffen, daß Schrödinger II die 500 GFlops-Marke zumindest annähernd erreicht und damit die Position vom Juni 2002 halten oder sogar verbessern kann.