HPC rechnet sich ::: Wissens- & Technologietransfer

SIOX
Scalable I/O For Extreme Performance

Überblick
Beschreibung
Anwendungen auf Hochleistungsrechnern speichern in den angeschlossenen Dateisystemen Ein- und Ausgabedaten sowie Zwischenstände, aus denen ein Programmlauf nach einem Rechnerausfall mit nur geringen Verlusten an Laufzeit wieder aufgenommen werden kann. Damit diese Ein- und Ausgabe nicht zum Engpass bei der Skalierung von Anwendungen auf großen Rechnersystemen wird, müssen die Dateisysteme und die unterstützende Infrastruktur mit der Leistungsfähigkeit und der Anzahl der Cores in einem System mitwachsen. Aufgrund der verschiedenen Anforderungen der unterschiedlichen Nutzergruppen ist eine globale Optimierung des Dateisystems derzeit schwierig bis unmöglich. Zudem existieren derzeit keine Ansätze, die das typische E/A-Verhalten eines Systems aufzeichnen, um in einem akuten Problemfall zumindest den verursachenden Nutzer identifizieren zu können.
Hauptziel von SIOX ist es, einen Überblick über alle E/A-Aufrufe auf einem HPC-Dateisystem zu gewinnen und diese Informationen für seine Optimierung zu verwenden. Im Rahmen des Projektes werden zunächst standardisierte Schnittstellen geschaffen, um von allen relevanten Ebenen Leistungsdaten zu sammeln, diese im Anschluss zu komprimieren und permanent zu speichern. Die aufgezeichneten Leistungsdaten werden analysiert und mit beobachteten Zugriffmustern korreliert, um Wissen über die Charaktistika des Rechensystems und die kausalen Zusammenhänge zu gewinnen.
Dieses Wissen ist Ausgangspunkt für eine Reihe von nutzer- bzw. anwendungsspezifischen Leistungsoptimierungen, die sich z. B. durch das automatische Setzen von Optionen für OpenMPI oder von Optimierungsparametern für das Dateisystem realisieren lassen. Diese Nutzungsprofile sollen kontinuierlich erstellt werden und neben der Optimierung auch zur Analyse akuter Probleme sowie zur Planung von Neubeschaffungen dienen.
Im Verlauf des Projektes soll die Erstellung, Umsetzung und Anwendung eines Konzeptes zur ganzheitlichen E/A-Analyse realisiert werden, das zunächst speziell auf HPC-Umgebungen ausgerichtet, jedoch nicht darauf beschränkt ist. So kann die integrierte Analyse von Anwendung, Dateisystem und Infrastruktur in Zukunft auch für die Optimierung anderer Szenarien Anwendung finden, bspw. das Design von Dateisystem-Caches für Mail-Server.
Kontakt / Ansprechpartner

Dr.-Ing. Michael Kluge

Organisatorischer Kontakt

Zentrum für Informationsdienste und Hochleistungsrechnen
Zellescher Weg 12
01069 Dresden
Germany