ScalNEXT
Optimierung des Datenmanagements und des Kontrollflusses von Rechenknoten für Supercomputing

Description

Motivation

High-Performance Computing (HPC) gehört heute in vielen wissenschaftlichen Disziplinen zu den grundlegenden Forschungsmethoden. Höchstleistungsrechner erreichen seit diesem Jahr die Exaflop-Leistungsklasse (mindestens 1018 Operationen pro Sekunde). Damit Anwendungen die Leistung von Exascale-Systemen effizient ausnutzen können, muss die Skalierbarkeit auf sehr großen und heterogenen Systemen verbessert werden. Eine Vielzahl von Komponenten sind für moderne Höchstleistungsrechner notwendig: vom Prozessor über Datenspeicher und Dateisystem bis zu Software und Algorithmen. Für alle diese Komponenten sind auch neue Technologien und Anpassungen an bestimmte Anwendungen und Schnittstellen notwendig.

Ziele und Vorgehen

Ziel des Vorhabens ist die Entwicklung von Softwarelösungen, die die Auslagerung des Datenmanagements und des Kontrollflusses von den Rechenknoten in das Netzwerk ermöglichen. Dadurch sollen rekonfigurierbare, smarte Netzwerke in modernen HPC-Systemen möglich werden, wie sie in der Telekommunikation und in Datenzentren bereits eingesetzt werden. So werden Rechenknoten entlastet, was zu einer deutlichen Steigerung der Recheneffizienz führt. Die Ergebnisse werden in den drei Kernbereichen Modellierung und Simulation, Datenanalyse und Input/Output sowie maschinelles Lernen angewendet, und die Effizienzsteigerung wird innerhalb des Vorhabens experimentell auf einem mittelgroßen Testsystem verifiziert.

Innovationen und Perspektiven

Der innovative Kern ist eine neue HPC-Systemarchitektur, mit der Rechenknoten von Steuerungs- und Managementaufgaben befreit und effizienter für die eigentlichen Berechnungen genutzt werden. Dies spart Ressourcen und senkt die benötigte Rechenzeit. Es ist eine hohe Breitenwirksamkeit gegeben, da sich die angestrebten Lösungen gut auf andere HPC-Systeme übertragen lassen.