ENVELOPE
Effizienz und Zuverlässigkeit - Selbstorganisation in HPC-Systemen

Overview

Icon date
Project duration
January 2017 - December 2019
Icon government building

Funders

Description

Heterogene High Performance Computing (HPC) Systeme sind neben ihrem hohen Grad an Parallelverarbeitung durch ihre Diversität gekennzeichnet. Eine weitere Leistungssteigerung von Parallelsystemen wird vermutlich mit einer stetig wachsenden Anzahl von Knoten einhergehen. Aufgrund der technologischen Entwicklung und fortschreitenden Miniaturisierung der Bauteile erhöht sich die Wahrscheinlichkeit des Ausfalls von Komponenten und damit die Fehleranfälligkeit des Gesamtsystems. Ziel des Projekts ist, die Komplexität heterogener HPC-Systeme vor dem Anwendungsprogrammierer zu verbergen und gleichzeitig eine effiziente Nutzung der zur Verfügung stehenden Ressourcen der Zielplattform zu ermöglichen und die Zuverlässigkeit und Ausfallsicherheit zu erhöhen. Um diese Ziele zu erreichen, verfolgt das Projekt einen ganzheitlichenAnsatz: Dieser vereint eine lokale Betrachtung der einzelnen Rechenknoten mit einer globalen Sichtweise auf das ganze System und mit Techniken auf der Anwendungsebene. Hierfür werden Methoden aus dem Bereich der Selbstorganisation erforscht. Zur Validierung der Strategien und Konzepte wird ein Demonstrator bereitgestellt.

Contact

Prof. Dr. Wolfgang Karl

Administrative contact

Institut für Technische Informatik
Lehrstuhl Prof. Dr. Wolfgang Karl
Haid-und-Neu-Straße 7
76131 Karlsruhe
Deutschland