Technologie-Partner
Gold-Sponsor:
Dienstag, 26.06.2012
Brutus - der Monster-Rechnercluster der ETH

Computersimulationen aller Art sind heute an Hochschulen alltäglich geworden, sie bilden eine eigenständige Disziplin der Informatikanwendung. Gemeinsam ist wissenschaftlichen Computersimulationen, dass sie in der Regel sehr rechenintensiv und darum auf Hochleistungsrechner angewiesen sind.
 
An der ETH Zürich hat sich schon vor Jahren die High Performance Computing (HPC) Gruppe gebildet. Diese von Olivier Byrde geleitete Gruppe evaluiert, beschafft, installiert und betreibt Supercomputersysteme im Rahmen der IT Services der ETH. Dazu bietet die Gruppe den Benutzern und Benutzerinnen - die aus allen ETH-Bereichen stammen und meist keine Supercomputerspezialisten sind - umfangreiche Unterstützung. Schon früh, etwa um das Jahr 2000, betrieb die HPC-Gruppe grosse Cluster-Rechner, die sich aus Standard-Komponenten zusammensetzten. Meistens handelte es sich dabei um über lokale Netzwerke oder Hochgeschwindigkeitsnetze verbundene Personalcomputer mit entsprechenden Speichereinrichtungen, die vor allem den Physikern und Chemikern dienten. Als die Zahl der Benutzer zunahm, entstand in der HPC-Gruppe eine aus der Wirtschaft entlehnte Organisationsstruktur, eine Aktiengesellschaft für Rechnercluster.
 
Aktiengesellschaft als Organisationsstruktur
Die seit dem Jahr 2000 auf ein Riesencluster angewachsene Rechenanlage hat heute eine Spitzenleistung von rund 190 TeraFlops (190'000'000'000'000 Fliesskomaoperationen pro Sekunde) und konsumiert 450 Kilowatt an Strom - das Maximum, das die Elektrizitätswerke der Stadt Zürich dem Rechenzentrum der ETH liefern können, was sich zu einer jährlchen Stromrechnung von rund 630'000 Franken summiert.
 
Dennoch macht sich die HPC-Gruppe kaum Sorgen um die Möglichkeit zum weiteren Ausbau ihrer Rechenanlage. Denn deren Energie-Effizienz hat allein in den letzten fünf Jahren um rund das Zehnfache zugenommen, von knapp 50 auf rund 440 MegaFlop pro Watt. Und es ist abzusehen, dass sich dieser Effizienzanstieg mindestens in gleichem Mass, wenn nicht sogar deutlich stärker, fortsetzen wird, so dass mit der gleichen Energiemenge eine bedeutend höhere Rechenleistung erzielbar ist.
 
Schon die ersten Cluster um die Jahrtausendwende wurden als Gemeinschaft von Anteilseignern betrieben, wobei diese gemeinsam die Investitions- und Betriebskosten aufbrachten. Die ersten Cluster trugen noch germanisch anmutende Namen wie Asgar und Hreidar, dann folgte der spanisch klingende Namen Gonzales, und ab 2008 heisst die ETH-Rechenanlage Brutus, die Abkürzung für die etwas gestelzte, aber zutreffende Bezeichnung "Better Reliability and Usability Thanks to Unified Systems".
 
Dabei erreichten die einzelnen Cluster ein für Computerhardware geradezu methusalemisches Alter. Die Komponenten von Hreidar und Gonzales aus den Jahren 2004 und 2005 wurden 2008 zu Brutus integriert und dienten vor allem dem Machbarkeitsnachweis des sich über mehrere Gerätegenerationen erstreckenden Anlagekonzepts. Die Hreidar- und Gonzales-Komponenten wurden erst 2010 und 2011 ausser Dienst gestellt, lange nach der normalen Benutzungsdauer von Personalcomputern. Ein eigentlicher Effizienzschub setzte im Jahr 2008 ein, als zunehmend sehr kompakte Blade-Systeme in die Anlage integriert werden konnten.
 
Brutus wurde von allem Anfang mit der Absicht ausgelegt, dass mehrere Generationen der Cluster Hardware und -Software im gleichen System zusammenarbeiten sollten. Dies erlaubt den laufenden Upgrade und Ausbau der Anlage, ohne dass die einzelnen Benutzer ihre Arbeit unterbrechen müssen. Heute enthält Brutus 983 Rechnerknoten mit insgesamt 18'400 Prozessorkernen. Damit fände Brutus, auch wenn die HPC-Gruppe der ETH in der weltweiten Supercomputer-Konkurrenz der "Top 500" nicht mitmacht, in der vorderen Hälfte der 500 grössten Rechneranlagen der Welt Platz. Sie befindet sich im tiefsten Kellergeschoss des ETH-Rechenzentrums und der Zugang ist hoch gesichert, ein Überbleibsel aus den Tages des Kalten Krieges, als die Amerikaner auf strenge Sicherheitsmassnahmen für die dort installierten Cray-Supercomputer bestanden. Bedeutendster Brutus-Lieferant ist heute Hewlett-Packard (HP), insbesondere dank den modernen, sehr kompakten Blade-Systemen der achten Generation.
 
Von der Klimaforschung bis zu Finanzwissenschaften
Insgesamt zählt Brutus heute 14 Anteilseigner von sehr unterschiedlicher Grösse. Darunter ist die Einheit CHAB (Chemie und angewandte Biosciences) mit 21,4 Prozent Anteil die grösste, und die Mathematiker sind mit nur einem Prozent die kleinste. Zu den Benutzern zählen mehr als 50 Professuren und Forschungsgruppen aus nahezu allen Bereichen der ETH.
 
Zur Demonstration der Wirksamkeit und Praxisnähe der auf Brutus gefahrenen Simulationen wurden zwei Beispiele vorgeführt. Prof. Reto Knutti vom ETH-Institut für Atmosphärenphysik und Klimaforschung demonstrierte seine langfristigen Klimamodelle, die Voraussagen über Zeiträume von mehreren Jahrzehnten erlauben. Solche Klimamodelle gehören zu den komplexesten Computersimulationen und beanspruchen trotz der ernormen Rechenkapaztiät, die dank Brutus zur Verfügung steht, immer noch mehrere Tage an Rechenzeit. "Wir werden trotz aller Fortschritte kaum je genügend Rechenkapazizät zur Verfügung haben", meinte Prof. Knutti.
 
Ähnliches gilt für The Financial Bubble Experiment, die Simulation aussergewöhnlicher Ereignisse auf den Finanzmärkten, die gegenwärtig von Dr. Ryan Wooodward an der Professur für unternehmerisches Risiko von Prof. Didier Sornette durchgeführt wird. Wie in der Klimaforschung müssen in diesem Forschungsbereich ungeheure, aus der ganzen Welt zusammengetragene Datenberge verarbeitet werden, um die signifikanten Ereignisse sogenannter Bubbles herauszufiltern und zu analysieren, damit sie simuliert und vorausgesagt werden können.
 
Rechenanlagen wie Brutus sind die unverzichtbaren Werkzeugmaschinen für solche und viele weitere Simulationen aus dem breiten Forschungsspektrum der ETH. (Gregor Henger)
Kommentar schreiben
 
Newsletter abonnieren
E-Mail-Adresse
HOT Stories
Neu auf altText
Kolumnen
Features