CSCS: Darum bauen wir einen Software-definierten Supercomputer

23. März 2021, 10:57
  • schweiz
  • innovation
  • hochschule
  • hpe
  • eth
image

CSCS-Direktor Thomas Schulthess erklärt, wie es um den Aufbau von "Alps" steht und was die neue Architektur bringen soll.

Der frühere Flaggschiff-​Supercomputer des Schweizerischen Hochleistungsrechenzentrums (CSCS), der "Piz Daint", kommt in die Jahre und muss ersetzt werden. Die Installation des Nachfolgerechners "Alps" begann im vergangenen Jahr und erfolgt in drei Phasen. 2023 soll der Bau abgeschlossen sein.
In einem von 'ETH News' publizierten Interview erklärte der CSCS-Direktor Thomas Schulthess, warum "Alps" nicht einfach ein neuer Rechner ist und was ihn so besonders macht. Hier eine gekürzte Fassung dieses Interviews. In voller Länge findet man das Interview bei 'ETH News'. 
Letztes Jahr startete die erste Phase der Installation des neuen Supercomputers "Alps", des Nachfolgers von "Piz Daint". Wie liefen die Arbeiten bisher während der Corona-​Krise?
Thomas Schulthess: Wir mussten unser Vorgehen zwar umstellen, doch wir konnten den Zeitplan mehr oder weniger einhalten, auch wenn es ein paar kleinere Verschiebungen gab. Während des ersten Lockdowns war es nicht möglich, die ersten vier Schränke des neuen Rechners wie vorgesehen von den USA in die Schweiz zu bringen. Aber die Herstellerfirma HPE hat es trotzdem geschafft, die Hardware zu bauen, so dass wir im Juni und Juli Zugang zu unseren Maschinen in den USA hatten und darauf arbeiten konnten. Daher lief die Abnahme der Rechnerschränke in Lugano im Herbst ohne grössere Probleme ab.
Der Ausbau von "Alps" wird noch bis im Frühjahr 2023 dauern. Warum geht das so lange?
Weil das Produkt, das wir möchten, noch gar nicht vollständig entwickelt ist. Das zentrale Element des neuen Rechners ist der Cray Shasta Software-​Stack, an dessen Entwicklung wir uns mit anderen Rechenzentren beteiligt haben. Dieser Software-​Stack ist nun operativ einsetzbar. Dennoch braucht es noch zwei Jahre, bis die gewünschte Rechnerinfrastruktur vollständig fertig sein wird.
Was ist denn das Besondere an der neuen Rechnerinfrastruktur?
Mit dem Cray Shasta Software-​Stack haben wir uns für eine Software-​definierte Infrastruktur entschieden. Das ist für mich der entscheidende Punkt. Ohne diesen Software-​Stack würde die neue Maschine für mich extrem an Wert verlieren. "Alps" wäre zwar immer noch die beste Variante im Bereich High-​Performance-Computing, die es in absehbarer Zeit auf dem Markt geben wird. Aber wir haben ganz klar höhere Ziele, die wir nicht erreichen würden. Das wäre eine grosse Enttäuschung.
Was heisst das genau?
Wir betreiben am CSCS in erster Linie eine Forschungsinfrastruktur, die wir unter anderem als User Lab Forschenden zur Verfügung stellen. Das ist unsere Kernaufgabe. Im Gegensatz zu anderen Forschungsinfrastrukturen, wie beispielsweise dem SwissFEL am PSI (Paul Scherrer Institut, Anm. d. Red.), machen wir jedoch selbst praktisch keine eigene Forschung an unseren Instrumenten. Wir müssen deshalb einen kreativen Weg finden, wie wir unser eigenes Fachwissen erweitern, um die Forschungsinfrastruktur mitentwickeln zu können. Deshalb arbeiten wir eng mit Forschenden von verschiedenen Schweizer Hochschulen zusammen.
Das CSCS versteht sich primär also nicht als Dienstleister?
Doch, aber nicht im Sinne eines IT-​Unternehmens, das Computer betreibt, um Rechenzeit anbieten zu können. Der Computer ist für uns das Mittel zum Zweck und der Zweck ist die Forschungsinfrastruktur, die wir mit Mitteln des ETH Rats zusammen mit Forschenden bauen und weiterentwickeln und mit Beiträgen der ETH Zürich betreiben. Diese Forschungsinfrastruktur wollen wir nun mit dem Kathmandu-​Programm weiterentwickeln.
Worum geht es bei diesem Programm genau?
Das Kathmandu-​Programm ist ein wichtiger Teil der erwähnten Neubeschaffung. Wir beschaffen nicht einfach einen neuen Rechner, der ins unveränderte Rechenzentrum integriert wird, sondern wir bauen in mehreren Ausbauphasen das Rechenzentrum um. Heute betreiben wir am CSCS verschiedene Rechnersysteme für unterschiedliche Bedürfnisse. In Zukunft wird es nur noch eine Infrastruktur geben. Für MeteoSchweiz haben wir zum Beispiel bisher einen eigenen Rechner betrieben. In der Zukunft wird MeteoSchweiz auf einer oder mehreren Partitionen dieser neuen Infrastruktur rechnen.
Was ist der Vorteil dieser Lösung?
Wir haben am CSCS immer schon verschiedene Services für die Forschenden angeboten, aber die Systemarchitektur war nicht serviceorientiert. Deshalb mussten wir jeweils mit grossem Personalaufwand diese Services gemäss den Anforderungen der Benutzer und der Architektur der Maschinen definieren. Dieser Prozess wird nun einfacher, denn wir haben eine Software-​definierte Infrastruktur.
Was muss man sich unter einer Software-​definierten Infrastruktur vorstellen?
Wenn wir zusammen mit HPE alles richtig machen, können wir unsere Hardware künftig sehr flexibel einsetzen. Welche Services wir anbieten, definieren wir künftig über die Software, nicht mehr über die Hardware. Dazu kombinieren wir sogenannte Microservices. Damit definieren wir die Partitionen für die verschiedenen Benutzer, die wir ihnen dann über standardisierte Schnittstellen zur Verfügung stellen. Das können virtuelle Ad-​hoc-Cluster für einzelne Benutzer sein, aber auch vordefinierte Cluster, die Forschungsinfrastrukturen wie zum Beispiel das PSI mit uns zusammenstellen und dann selber betreiben. Wir können mit den Mikroservices auch Daten-​Plattformen kreieren. Geplant ist beispielsweise, dass wir mit verschiedenen Partnern eine sogenannte Domain-​Plattform für Wetter-​ und Klimasimulationen entwickeln.
Sie nennen explizit den Bereich Wetter und Klima. Wird "Alps" auch für andere Wissenschaftsbereiche von Nutzen sein?
Ja, wir entwickeln mit "Alps" einen "General Purpose Supercomputer". Unsere Ziele hören ganz und gar nicht bei Klimasimulationen auf. Jedoch sind diese ein extrem gutes Mittel zum Zweck, da bei Klimasimulationen die Problemstellung sehr klar formuliert ist. Zudem bilden sie alle Anforderungen an eine moderne Supercomputing-​ und Dateninfrastruktur ab. Wir reagieren auf diese ganz konkreten Anforderungen mit einer Infrastruktur, die wir dann auch anderen Forschungsbereichen anbieten können.
Thomas Schulthess ist seit Oktober 2008 Direktor des Schweizerischen Hochleistungsrechenzentrums (CSCS) in Lugano. Er ist gleichzeitig Professor für Computational Physics an der ETH Zürich.

Loading

Mehr zum Thema

image

Google will ChatGPT-Konkurrenz öffentlich zugänglich machen

OpenAI hat mit Microsoft den Kampf um die Zukunft des Internets eröffnet, nun zieht Google nach. Das bedeutet ein Umdenken im Suchmaschinenkonzern.

publiziert am 3.2.2023
image

In der Schweizer IT-Branche steigen die Löhne weiter

Michael Page hat seine neue Lohnübersicht veröffentlicht. Kandidatenmangel und Inflation führen zu steigenden Lohnerwartungen. Mit welchen Löhnen IT-Beschäftigte rechnen können.

publiziert am 2.2.2023
image

ChatGPT: OpenAI entwickelt KI, um eigene KI zu entlarven

Die Firma hat ein neues Tool auf den Markt gebracht, das erkennen soll, ob ein Text von einem Menschen oder einer KI geschrieben wurde.

publiziert am 1.2.2023
image

Basel führt Pflichtfach Medien und Informatik in der Sek ein

Bislang wurden die Themenbereiche Medien und Informatik in anderen Fächern zusammen gebündelt. Ab dem Schuljahr 2024/2025 will Basel-Stadt das ändern.

publiziert am 1.2.2023