9. HPC-Status-Konferenz der Gauß-Allianz
Paderborn Center for Parallel Computing, Paderborn, 17. und 18. Okt. 2019

Go to first section
17. - 18. Oktober 2019
Konferenz
Pohlweg 51, 33098 Paderborn
Konferenzregistrierung über Converia
Anmeldung
Konferenzprogramm
Am 17. und 18. Oktober 2019 findet am Paderborn Center for Parallel Computing (PC2) die 9. HPC-Status-Konferenz der Gauß-Allianz statt.

Die HPC-Status-Konferenz bietet Wissenschaftlern und Anwendern eine Plattform zum interdisziplinären Austausch zu aktuellen Forschungsaktivitäten und Fragestellungen im Bereich des Hoch- und Höchstleistungsrechnens in Deutschland (HPC). Eine Besonderheit dieser Veranstaltung liegt im themenübergreifenden Austausch der verschiedenen Disziplinen. Darüber hinaus fördert diese Veranstaltung die Netzwerkbildung der Communities sowie die Sichtbarkeit des deutschen Forschungsschwerpunkts im Bereich des HPC.

Dieses Jahr werden durch BMBF und DFG geförderte HPC-Projekte ihre Forschungsgebiete mit aktuellen Ergebnissen präsentieren und zur Diskussion stellen. Wir erwarten Präsentationen von Projekten in den Gebieten
  • Anwendungsorientierte HPC-Software für das Hoch- und Höchstleistungsrechnen in Wissenschaft und Wirtschaft unter anderem für die Software-Verifikation, die Simulation und Optimierung in der Energietechnik, Material- und Geowissenschaften
  • Grundlagenorientierten Forschung für HPC-Software, z. B. Task-basierte Programmieransätze, Metaprogrammierung, Compilerinfrastrukturen u. v. m.
  • Performance Engineering für wissenschaftliche Software
Weiterhin wird es am Donnerstag, den 17. Oktober 2019, Vorträge zu den Ausschreibungen von EuroHPC sowie dem dazugehörigen administrativen Bewerbungsverfahren geben. Darüber hinaus findet am Donnerstag der Feierliche Spatenstich für den Forschungsbau Noctua (Einladung und Details ) statt, zu dem alle Teilnehmer/-innen der Konferenz herzlich eingeladen sind.

Die Einladung richtet sich an alle Nutzergruppen sowie Interessierte, die Hoch- und Höchstleistungsrechnen nutzen bzw. einsetzen wollen.

Registrierung

Der Konferenzbeitrag beträgt 120 Euro. Dieser wird vom lokalen Veranstalter zur Deckung der Unkosten im Rahmen der Ausrichtung der HPC-Status-Konferenz vereinnahmt und verantwortet. Die Gauß-Allianz hat im Zusammenhang mit dieser Veranstaltung keine Einnahmen und auch kein finanzielles Interesse.

Bitte melden Sie sich bis spätestens zum 7. Oktober 2019 hier im Registrierungssystem (Converia) an. Ab dem 8. Oktober 2019 beträgt der Konferenzbeitrag 150,00 Euro.

Organisatorische Fragen richten Sie bitte an pc2-hpc2019@uni-paderborn.de. Für alle anderen Fragen stehen wir Ihnen unter der Adresse service@gauss-allianz.de zur Verfügung.
Hotels
In den nachfolgenden Hotels haben wir für Sie Zimmer reserviert. Diese können Sie mittels dem Kennwort GA-HPC-2019 abrufen. Bitte reservieren Sie Ihr Zimmer selbstständig.

Weitere Hotels sind über die einschlägigen Hotelportale verfügbar.
Programm
Registrierung: Donnerstag, 17. Oktober 2019, 09:00 - 10:00 Uhr

Beginn: Donnerstag, 17. Oktober 2019, 10:00 Uhr
Ende: Freitag, 18. Oktober 2019, 16:15 Uhr

Das aktuelle Programm finden Sie hier.


09:00
60'
Registrierung
PC2, Universität Paderborn
Pohlweg 51, 33098 Paderborn
10:00
5'
Eröffnung der 9. HPC-Status-Konferenz
Prof. Dr. Christian Plessl
PC2, Universität Paderborn
PC2, Gebäude O, Hörsaal O1
10:05
5'
Grusswort der Hochschulleitung
Prof. Dr. Johannes Blömer
Vizepräsident für Forschung und wissenschaftlichen Nachwuchs, Universität Paderborn
PC2, Gebäude O, Hörsaal O1
10:10
40'
Keynote: Wie HPC beim Verständnis elektromagnetische Nahfelder hilft.
Prof. Dr. Jens Förstner
PC2, Gebäude O, Hörsaal O1
Beschreibung
Die klassische elektromagnetische Theorie von Maxwell hat eine erstaunlich weitreichende Gültigkeit, die von statischen elektrischen Feldern über Radiosignale, Mikrowellen, Wi-Fi, Mobilfunk, Licht im Infraroten über das Sichtbare bis zum Ultraviolettbereich, zu Röntgenstrahlen und hochenergetischer kosmischer Strahlung reicht. In exakt gleicher Form beschreiben die Maxwellgleichungen die Dynamik von elektromagnetischen Feldern aller Frequenzen. Materie verhält sich jedoch je nach Frequenz unterschiedlich und kann auf verschiedenen räumlichen Skalen unterschiedlich strukturiert sein. Insbesondere auf der mesoskopischen elektromagnetischen Skala, d.h. wenn Objekte mit Dimensionen im Bereich der elektromagnetischen Wellenlänge betrachtet werden, sind Nahfeldeffekte wichtig, da das Feld ist keine einfache ebene Welle mehr ist und übliche Näherungsmethoden und analytische Ansätze scheitern. Dann sind numerische Simulationen erforderlich, um die elektromagnetische Dynamik zu analysieren. Wir werfen einen Blick auf mehrere Systeme, die in der Gruppe Theoretische Elektrotechnik in Paderborn betrachtet werden - sie reichen von optischen Antennen und biologischen photonischen Kristallen, zu interplanetaren Staubpartikeln und Metamaterialien für Frequenzkonversion.
10:50
15' Pause
Abschlussvorträge Projekte des 4. BMBF-HPC-Calls • Chair: Dr. Christian Terboven
11:05
25'
Ultra-Skalierbare Multiphysiksimulationen für Erstarrungsprozesse in Metallen (SKAMPY)
Prof. Dr. Harald Köstler
Lehrstuhl für Systemsimulation , Friedrich-Alexander-Universität Erlangen-Nürnberg
PC2, Gebäude O, Hörsaal O1
Beschreibung
Für die Entwicklung neuer Materialien, für die Verbesserung von Werkstoffeigenschaften sowie für die Optimierung von Herstellungs- und Fertigungsprozessen haben moderne und hocheffiziente Simulationstechniken eine unverzichtbare Bedeutung in der akademischen und industriellen Forschung erreicht.
Wir zeigen auf, welche hochparallelen Phasenfeldsimulationen auf aktuellen Supercomputern durchgeführt werden können und wie dadurch das Verständnis für die Ausbildung der Mikrostruktur beim Herstellungsprozess – der Erstarrung aus der Schmelze – verbessert werden kann.
11:30
25'
HPC-Toolbox zur Simulation und Inversion von Wellenfeldern
Tilman Steinweg
Lehrstuhl Angewandte Geophysik , Karlsruher Institut für Technologie
PC2, Gebäude O, Hörsaal O1
Beschreibung
Wir entwickeln eine HPC-Toolbox zur Simulation und Inversion vollständiger seismischer Wellenfelder. In dem neu entwickelten C++ Software-Paket werden Finite-Differenzen-Berechnungen in Matrix-Vektor-Formulierung mit der Bibliothek LAMA durchgeführt, die Berechnungen auf verschiedenen Architekturen (CPU/GPU) ermöglicht. Die FD-Berechnung auf einem diskontinuierlichen Gitter mit variabler Genauigkeit der FD-Operatoren führt zu einem Ungleichgewicht der Rechenlast. Eine Lastbalanzierung soll eine optimale Ausnutzung der verfügbaren Rechenkapazität ermöglichen.
Es werden Performance-Benchmarks auf dem Supercomputer JUWELS und Anwendungen der HPC-Toolbox vorgestellt. WAVE
11:50
25'
ELPA eigensolvers: autotunable, energy-efficient, optimized
Dr. Hermann Lederer
PC2, Gebäude O, Hörsaal O1
Beschreibung
Recent overall improvements on ELPA eigensolvers (ELPA-AEO) will be presented. These include autotuning features, algorithmic improvements, the configurable elimination of unnecessary calculations in specific cases, mixed precision, and architecture specific optimizations.
12:30
30'
Feierlicher Spatenstich Forschungsbau Noctua (Neues Rechenzentrum Paderborn Center for Parallel Computing)
Einladung und Details zum Feierlichen Spatenstich
13:00
60' Mittagspause
13:55
5'
Fototermin – Gruppenfoto
Universität Paderborn, Pressestelle
vor dem Gebäude O
EuroHPC • Chair: Dr. Franz-Josef Pfreundt
14:00
10'
Einführung zu EuroHPC
Dr. Roland Krüppel
BMBF
PC2, Gebäude O, Hörsaal O1
14:10
20'
EuroHPC und die aktuellen Calls
Evangelia Markidou
DG Connect, High Performance Computing and Quantum Technology
PC2, Gebäude O, Hörsaal O1
14:30
20'
Europäische Förderregularien im Rahmen von EuroHPC
Dr. Uwe-Michael Schmidt
Nationale Kontaktstelle IKT
PC2, Gebäude O, Hörsaal O1
14:50
30'
Fragen zu EuroHPC
15:20
10' Pause
Abschlussvorträge Projekte des 4. BMBF-HPC-Calls • Chair: Dr. Franz-Josef Pfreundt
15:30
25'
PARADOM: Parallele Algorithmische Differentiation in OpenModelica für energietechnische Simulationen und Optimierungen
Martin Schroschk
ZIH, TU Dresden
PC2, Gebäude O, Hörsaal O1
Beschreibung
Ziele des Projekts PARADOM sind die Bereitstellung moderner mathematischer Methoden, welche exakte Ableitungsinformationen benötigen, sowie die Entwicklung entsprechender paralleler Algorithmen für die effiziente Simulation und Optimierung komplexer energietechnischer Anlagen mit OpenModelica auf HPC-Systemen. Die entwickelten Methoden für die geplanten Erweiterungen von OpenModelica in Verbindung mit der zugehörigen HPC-Parallelisierung werden als quelloffene Pakete für einen breiten Anwenderkreis verfügbar sein. Damit werden die Nutzbarkeit und Attraktivität von HPC-Systemen für technische Simulationen deutlich verbessert.
15:55
25'
Hochparallele Software-Verifikation nebenläufiger Anwendungen in der Automobilindustrie
Prof. Dr. Dirk Nowotka
PC2, Gebäude O, Hörsaal O1
Beschreibung
Das Projekt "Hochparallele Software-Verifikation nebenläufiger Anwendungen in der Automobilindustrie" (HPSV) hat zum Ziel, Methoden aus dem HPC-Bereich für die Analyse komplexer nebenläufiger Softwaresysteme zu entwickeln und einzusetzen. Als konkretes Anwendungsfeld dient dabei die Software automobiler eingebetteter Systeme.

Die Anwendung von Techniken des Hochleistungsrechnens auf die Sicherheitsanalyse und Fehlersuche in Software eingebetteter Systeme ist neu und eröffnet die Möglichkeit größere Codemengen mit höherer Genauigkeit zu analysieren. Bei der Entwicklung von Analysealgorithmen steht deren Skalierbarkeit sowohl auf Manycore-Architekturen als auch auf modernen HPC-Architekturen mit sehr vielen Kernen im Vordergrund. Dadurch ist sichergestellt, dass weniger komplexe Verifikationsprojekte auch auf preisgünstigeren Manycore-Clustern vor Ort beim Anwender ausgeführt werden können, während für sehr große Simulationsprozesse die Dienstleistungen der HPC-Zentren genutzt werden können.
16:20
30' Pause
Vorträge der Projekte des 5. BMBF-HPC-Calls • Chair: Dr. Herrmann Lederer
16:50
20'
ENVELOPE - Effizienz und Zuverlässigkeit: Selbstorganisation in HPC-Systemen - ein Zwischenbericht
Prof. Dr. Wolfgang Karl
Lehrstuhl für Rechnerarchitektur und Parallelverarbeitung , Institut für Technische Informatik, Karlsruher Institut für Technologie
PC2, Gebäude O, Hörsaal O1
Beschreibung
Das Projekt ENVELOPE hat sich zum Ziel gesetzt, zum einen die Komplexität heterogener HPC-Systeme vor dem Anwendungsprogrammierer zu verbergen und gleichzeitig eine effiziente Nutzung der zur Verfügung stehenden Ressourcen der Zielplattform zu ermöglichen und zum anderen die Zuverlässigkeit und Ausfallsicherheit zu erhöhen. Hierfür werden Methoden aus dem Bereich der Selbstorganisation erforscht.
17:10
20'
Ein Werkzeugkasten zur Integration von Selbstadaption in zeitschrittbasierte Simulationen
PD Dr. Matthias Korch
Angewandte Informatik II , Universität Bayreuth
PC2, Gebäude O, Hörsaal O1
Beschreibung
Im BMBF-Projekt SeASiTe (Selbstadaption für zeitschrittbasierteSimulationstechniken auf heterogenen HPC-Systemen) untersuchen wir systematisch Selbstadaptionsansätze für zeitschrittbasierteSimulationstechniken auf heterogenen HPC-Systemen.
Ziel ist der Entwurfund die Bereitstellung des Prototypen eines Werkzeugkastens, mit dessenHilfe Programmierer ihre Anwendungen mit effizientenSelbstadaptionstechniken ausstatten können.
In diesem Vortrag stellen wir unser Konzept zum Aufbau des Werkzeugkastens und zur Integration der einzelnen Werkzeuge vor.
17:30
20'
Towards a machine learning model for predicting time and power consumption of compute kernels.
Sotirios Nikas
PC2, Gebäude O, Hörsaal O1
Beschreibung
The BMBF Mekong-Projekts Project, among others, aims to deploy a machine learning model to predict the most suitable processor for the given workload in terms of performance and power consumption. Performance prediction is helpful for various scheduling tasks, and predicting power consumption is beneficial for systems with hard power budgets. To do so, we predict performance and power consumption at compile time using static code analysis of numerous applications in combination with a Random Forest model. The prediction can be used for scheduling decisions, among others, by allowing for a reasoning of time, power, or energy. In this talk, we detail our methodology, model and results.
17:50
20'
Deep Learning on HPC Systems
Dr. Peter Labus
PC2, Gebäude O, Hörsaal O1
Beschreibung
In this talk, I will give an overview of parallelization strategies for the training of Deep Neural Networks. In particular, I will focus on their trade-offs and challenges, and will present the core ideas for their implementation using GPI.
18:15
45'
Führung Paderborn Center for Parallel Computing
20:00
120'
Social Event – Schützenhof Paderborn
Schützenhof Paderborn, Schützenplatz 1, 33102 Paderborn
Beschreibung
Das Social-Event der 9. HPC-Status-Konferenz findet im Schützenhof Paderborn statt.
Informationen zur individuellen Anreise finden Sie unter https://www.schuetzenhof.de/kontakt/anfahrt/ .

Route mit Google-Maps (3,3km per Fuß, 4,7km mit dem Auto): https://goo.gl/maps/vbkXZEdV9cTcVN3x6

Verbindung mit dem Bus: https://www.padersprinter.de/wp-content/uploads/2019/10/Liniennetzplan-Tag.pdf

Taxiunternehmen
  • Taxi Hermesmeyer 05251 - 35050
  • Taxi Klima 05251 - 61111
  • Taxi Wientzek 05254 - 999050
Vorträge der Projekte des DFG-PE • Performance Engineering • Chair: Prof. Dr. Ulrich Lang
09:00
20'
Enabling Performance Engineering in Hesse and Rhineland-Palatinate - An overview
Dr. Alexandru Calotoiu
PC2, Gebäude O, Hörsaal O1
Beschreibung
The project "Enabling Performance Engineering in Hesse and Rhineland-Palatinate" or, short, EPE, has as a main objective to expand and deepen HPC support in areas where existing scientific expertise coincides with critical user needs. Our approach is to bundle the distributed expertise for HPC support and performance engineering within the HKHLR and the AHRP under a new umbrella to support scientists to efficiently use the HPC resources in Hesse and Rhineland-Palatinate. The presentation will focus on the main accomplishment of the project.
09:20
20'
PeCoH - Performance Concious HPC - Status 2019
Dr. Hinnerk Stüben
Regionales Rechenzentrum , Universität Hamburg
PC2, Gebäude O, Hörsaal O1
Beschreibung
Statusbericht des DFG Projects PeCoH (Performance Concious HPC).
09:40
20'
Azat Khuziyakhmetov
PC2, Gebäude O, Hörsaal O1
Beschreibung
Profiling Toolkit for HPC Applications
10:00
20'
ProPE - Status and current results
Dr.-Ing. Jan Eitzinger
RRZE, Friedrich-Alexander-Universität Erlangen-Nürnberg
PC2, Gebäude O, Hörsaal O1
Beschreibung
Large HPC systems are expensive, and so is their operation, which makes their efficient use a crucial goal. However, those systems are complex with regard to hardware architectures, network topologies, tool chains and software environments. Particularly in academic computing centers there is a vast variety of applications with very different hard- and software demands. Furthermore, small- to medium-sized HPC sites tend to have only limited resources for user support and application performance tuning. For them it is a challenge to ensure an efficient use of the systems on their own. The DFG ProPE project is an effort to address critical components for a service infrastructure for Performance Engineering (PE)in cooperating scientific computing centers. This involves a process that describes how to systematically handle and, if necessary, delegate a PE project within a network of HPC centers, but it also covers tools for job-specific application performance monitoring that assist the staff in detecting pathological jobs or jobs that expose a significant optimization potential. Another focus is on giving central access to HPC related knowledge. This talk will give the status of the project and present initial results, work products and general recommendations.
10:20
20'
Fortschritt im SES-HPC-Projekt
Jan Steiner
PC2, Gebäude O, Hörsaal O1
Beschreibung
Services for Experienced and Starting HPC Tier 3 Users (SES-HPC)

While support and training is widely available for users of Tier-1 and Tier-0 computing centers, this is less so for lower-tier centers. The project SES-HPC aims to improve support, both technical and administrative, and training for users of Tier-3 high-performance computing resources, both those who intend to eventually run their applications on higher-tier hardware and those who do not.
The project includes the development of a training course program, the support of scientists in developing and optimizing their software as well as running off-the-shelf computing software, administrative help for users who want to switch to higher-tier centers, and the organization of knowledge transfer and documentation. In this talk, the project focus and current status of SES-HPC are outlined.

Während Support und Training für Tier-1- und Tier-0-Rechenzentren gut verfügbar sind, ist dies bei Rechenzentren auf niedrigen Tiers weniger der Fall. Das Projekt SES-HPC soll dazu dienen, die Unterstützung für Nutzern von Tier-3-Ressourcen zu verbessern, sowohl auf technischer als auch auf administrativer Ebene. Dabei sollen sowohl Nutzer erreicht werden, die später auf höheren Tiers rechnen wollen, als auch solche die dies nicht planen. Das Projekt beinhaltet die Entwicklung eines Schulungsprogramms, die Unterstützung von Wissenschaftlern bei der Entwicklung und Optimierung ihrer Software sowie bei Rechnungen mit kommerzieller oder frei erhältlicher Software. Weiterhin wird administrative Unterstützung für Nutzer, die auf höhere Tiers wechseln wollen, angeboten. Es werden außerdem Wissenstransfer und Dokumentation verbessert.
In diesem Vortrag werden die Schwerpunkte sowie der aktuelle Stand des Projekts dargestellt.
10:40
20'
Performance und Effizienz in HPC mit Custom Computing
Prof. Dr. Christian Plessl
PC2, Universität Paderborn
PC2, Gebäude O, Hörsaal O1
Beschreibung
Das PerficienCC Projekt zielt darauf ab, die Verwendung von FPGAs zur Beschleunigung von HPC Anwendungen zu erforschen und gemeinsam mit den Methoden- und Code-Entwicklern die performance-kritischen Anwendungsteile für FPGAs anzupassen und zu portieren. In meinem Vortrag werde ich über unsere Zwischenresultate aus den ersten beiden Projektjahren berichten, in dem wir uns auf Anwendungen aus dem Bereich der Elektrodynamik und aus dem Bereich der Ab-Initio Molekulardynamik konzentriert haben. Weiter werde ich über unsere Aktivitäten zur Vereinfachung der Nutzbarkeit von FPGAs für HPC und die Schulung von Nutzern berichten.
11:00
30' Pause
11:30
45'
Keynote: Innovative Computing-Architekturen mit FPGAs
Michaela Blott
Xilinx Research, Dublin, Irland
PC2, Gebäude O, Hörsaal O1
Beschreibung
Herkömmliche von-Neumann-Architekturen leiden unter steigenden Energiedichten und eingeschränkter Leistungsskalierung mit zukünftigen Technologieknoten. Gleichzeitig sind wir mit einer Explosion von Daten und himmelhohen Rechenanforderungen konfrontiert, die mit Exascale-Computing und der Einführung von Algorithmen für maschinelles Lernen verbunden sind. Rekonfigurierbare Logik mit FPGAs kann die Hardware durch innovative, maßgeschneiderte Rechenarchitekturen an die jeweiligen Anwendung anpassen und so die Energieeffizienz und Leistung im Vergleich zu herkömmlichen CPU- und GPU-basierten Lösungen weiter skalieren. In diesem Vortrag beschreiben wir eine Reihe von Anwendungen und untersuchen, wie durch diese innovativen Rechenarchitekturen neue Ebenen der Leistungsskalierbarkeit und Recheneffizienz erreicht werden können.
Vorträge der Projekte des 5. BMBF-HPC-Calls • Chair: Prof. Dr. Wolfgang E. Nagel
12:20
20'
Recent advances for code generation in the HPC²SE project
Prof. Dr. Christian Engwer
PC2, Gebäude O, Hörsaal O1
Beschreibung
The complexity of numerical simulations makes the use of software framework inevitable in order to benefit from code reuse. At the same time the challenges of modern hardware require platform specific changes to the numerical kernels to achieve a significant performance. The goal of the HPC²SE project was to assist users by automatically generating computational kernels from a domain specific input.

We present recent advances in the project and show how the developed code generation pipeline can be used to generate kernels for very different software frameworks. Different strategies are available for low-order and high-order methods. In a multi-stage process we apply different optimizations.
12:40
20'
Increasing FPGA Usability through OpenMP Support
Dr. Thomas Steinke
PC2, Gebäude O, Hörsaal O1
Beschreibung
We present the current status of the ORKA-HPC projects with the goal of lowering the barrier to using reconfigurable processors by supporting the OpenMP programming model.
13:00
60' Mittagspause
Vorträge des 5. BMBF-HPC-Calls • Chair: Prof. Dr. Christian Plessl
14:00
20'
Prinzipien der task-basierten Programmierung und Ausführung
PC2, Gebäude O, Hörsaal O1
Beschreibung
Task-basierte Anwendungen im HPC Bereich haben normalerweise zur Folge, dass die individuellen Teilaufgaben (Tasks) grob-granular definiert werden müssen, um den Verwaltungsaufwand zu kompensieren. Mit ProThOS bieten wir eine Programmier-Methode und eine Ausführungsumgebung, die so aufeinander abgestimmt sind, dass der Verwaltungsaufwand auf ein Minimum reduziert wird und auch fein-granulare Aufgaben effizient verarbeitet werden können.
14:20
20'
HighPerMeshes - Ein Framework zur verteilten Task basierten Ausführung von iterativen Verfahren auf unstrukturierten Gittern
Dr. Daniel Grünewald
PC2, Gebäude O, Hörsaal O1
Beschreibung
Im Projekt HighPerMeshes wird ein in der Praxis einsetzbares domänenspezifisches Framework zur effizienten, parallelen und skalierenden Implementierung iterativer Algorithmen auf unstrukturierten Gittern entwickelt.
Der Vortrag gibt einen Überblick über den Stand des Projektes und beschreibt dessen zentrale Komponenten, wie die zur Verfügung gestellten domänenspezifischen Sprachkonstrukte, das Task-basierte verteilte Laufzeitsystem (ACE/Gaspi) und die Transformations-Infrastruktur samt deren Zusammenspiel. Nach einer kurzen Einführung des Konzeptes wird gezeigt, wie domänenspezifzisches Wissen dazu benutzt wird, konkrete durch die DSL beschriebene Probleme zu partitionieren, Datenabhängigkeiten zu extrahieren und letztendlich den Task-Graphen aufzubauen, der dann durch das Laufzeitsystem auf der jeweiligen (heterogenen) Zielplattform ausgeführt wird. Dies geschieht völlig transparent für den Anwender.

Der Nutzen der bisherigen Projektergebnisse wird anhand eines Beispiels demonstriert.
14:40
20'
TaLPas: Task-basierte Lastverteilung und Auto-Tuning in der Partikelsimulation
Prof. Dr. Philipp Neumann
Lehrstuhl für High-Performance Computing , Helmut-Schmidt-Universität
PC2, Gebäude O, Hörsaal O1
Beschreibung
Im Projekt TaLPas werden innovative, Auto-Tuning-basierte Softwarelösungen für Node-Level optimierte Partikelsimulationen und hochskalierbare, taskbasierte Samplingverfahren entwickelt. Dies inkludiert insbesondere (1) die Bibliothek AutoPas für Node-Level optimierte, Auto-Tuning-basierte Partikelsimulation, (2) einen um Performancevorhersage erweiterten, Python-basierten Workflow-Manager sowie (3) Erweiterungen um Visualisierung und Resilienz.
Für (1) wurden verschiedene Optimierungsansätze sowie deren Zusammenspiel für den Linked Cells-Algorithmus beleuchtet. Für Verlet Listen-basierte Algorithmen wurden neue Parallelisierungsstrategien implementiert wie z.B. Gebietsfärbungen unter Nutzung der Linked Cells-Struktur, welche zum Aufbauen der Listen verwendet wurde, oder eine Strategie für Verlet Cluster Lists, welche die Größen der Listen zur Verteilung der Arbeit nutzt. Durch die implementierten Optimierungen bzgl. der Node-Level-Performance und auf Grund der Integration von AutoPas in die MD-Software ls1 können nun produktiv Verdampfungsszenarien aus der Verfahrenstechnik simuliert werden, bei denen das Gasvolumen so groß gewählt werden kann, dass dessen Rand bis zum Euler-Regime reicht, in dem Kontinuumsbedingungen gelten. Die Ergebnisse solcher Simulationen können daher direkt mit denen von Kontinuumsmethoden (z.B. CFD) verglichen werden und ggf. als Benchmark dafür dienen.
Jedoch vergrößert sich durch die Vielzahl an Simulationsvarianten stetig der Suchraum nach optimalen Konfigurationen. Daher ist die derzeitig implementierte Auto-Tuning-Methodik, welche alle Kombinationen testet, ineffizient—neuartige Tuningstrategien basierend auf Maschinellem Lernen und Bayesscher Statistik sind notwendig und in Untersuchung.
Der (2) Workflow Manager wurde im letzten Jahr um verschiedene Funktionalitäten erweitert, und es wurden Verbesserungen an den Schnittstellen zu Performance-Modellen vorgenommen. Zwei Modelle basierend auf Extra-P und Dünngitter-Regression sind derzeit in Arbeit. Hinsichtlich Extra-P wurde ein Reinforcement-Learning-basiertes Verfahren untersucht, welches die derzeit in der Parameteranzahl exponentiell anwachsende Zahl an Messwerten, die Extra-P benötigt, auf eine quasi linear anwachsende Anzahl reduzieren soll.
Zur Integration von In-Situ-Visualisierung (3) wurden Entwicklungen an der Schnittstelle der Visualisierungssoftware MegaMol und der MD-Software ls1, welche AutoPas nutzt, vorgenommen. Eine erste Version läuft stabil und wurde auf bis zu 128 Knoten / 5888 Threads auf dem Supercomputer Stampede2 getestet. Die Kopplung erfolgt lose über Shared Memory, wodurch die Stabilität eines Simulationslaufes nicht durch Fehler in der Visualisierung beeinträchtigt werden kann.
Künftig ist die Integration aller Komponenten (1)-(3) geplant. Eines der dabei zu untersuchenden Szenarios soll Adsorptionsprozesse auf der molekularen Skala beleuchten. In ersten Studien wurden 350 Simulationen über einen weiten Parameterraum (Temperatur, Fluid-Wand Interaktion, Wanddichten) untersucht und erste Arbeiten hinsichtlich der Nutzung des Workflow-Managers für dieses Szenario durchgeführt.
15:00
20'
METACCA - Metaprogramming for Accelerators
Dr. Roland Leißa
Compiler Design Lab , Universität des Saarlandes
PC2, Gebäude O, Hörsaal O1
Beschreibung
Die Rechnerlandschaft wird heutzutage immer heterogener und derzeit ist keine Trendwende in Sicht. Insbesondere wird die Hardware immer spezialisierter und weist verschiedene Formen der Parallelität auf. Für performante Programme ist es unabdingbar, hardwarespezifische Eigenheiten zu adressieren. Wegen des Halteproblems ist es allerdings unrealistisch anzunehmen, dass ein Programm, das in einer universell einsetzbaren Programmiersprache implementiert ist, vollautomatisch auf solche spezialisierte Hardware übersetzt werden kann und dabei noch Spitzenleistung erzielt. Aus diesem Grund nutzen HPC-Programmierer viele Techniken, die den Quellcode unleserlich, schwer zu verstehen und vor allem in der Regel unportierbar machen. Insbesondere ist diese Anpassung enorm zeitaufwendig und kann für verschiedene Hardwareplattformen komplett unterschiedlich aussehen.

Im Rahmen des METACCA-Projektes beschäftigen wir uns damit, Algorithmen so zu implementieren, dass sie einer Lehrbuchimplementierung ähneln. Durch verschiedene Abstraktionen können wir mithilfe eines partiellen Auswerters, hardwarespezifische Anpassungen im Nachhinein in die Implementierung hineinweben. Der Programmierer muss diese Anpassungen nicht mehr händisch erledigen. Wir verwenden unser Rahmenwerk in drei Anwendungen: Bildverarbeitung, Ray-Tracing und Genomsequenzausrichtung. Dort können wir hochperformante Implementierungen für CPUs und GPUs aus einer Sprache und einer Codebasis auf generische Weise erhalten. Die Performance unserer Codes ist vergleichbar mit industrietauglichen Codes, die über Jahre hinweg von Experten optimiert worden sind. Desweiteren beschäftigen wir uns mit Performance-Modellierung, um a priori abzuschätzen, ob bestimmte Optimierungen überhaupt lohnenswert sind.
15:20
20'
MEPHISTO – Metaprogramming for Heterogeneous Distributed Systems
PC2, Gebäude O, Hörsaal O1
Beschreibung
The aim of the project is to achieve the performance of modern HPC systems easily for the application programmer and to achieve high performance on all current high-performance computers without changing the source code. We show advances when using the C++ STL algorithms with the combination of C++ executor policies, introduces in C++17. Furthermore we show results from a performance portable N-Body simulation on Power9+V100 hardware.
15:40
20'
Chameleon: Reactive Task Migration for Hybrid MPI+OpenMP Applications
Jannis Klinkenberg
IT Center, RWTH Aachen
PC2, Gebäude O, Hörsaal O1
Beschreibung
Many HPC applications are designed based on underlying performance and execution models. These models could successfully be employed in the past for balancing load within and between compute nodes. However, the increasing complexity of modern software and hardware makes performance predictability and load balancing much more difficult. Tackling these challenges in search for a generic solution, we present a novel library for fine-granular task-based reactive load balancing in distributed memory based on MPI and OpenMP. Our concept allows creating individual migratable tasks that can be executed on any MPI rank. Migration decisions are performed at run time based on online performance or load data in order to overlap migration communication with useful computation. Further, we show performance improvements when dealing with hardware-induced imbalances and demonstrate robustness against work-induced imbalances for an AMR application.
16:00
15'
Abschluss der 9. HPC-Status-Konferenz
Prof. Dr. Christian Plessl
PC2, Gebäude O, Hörsaal O1
 
 
Anfahrt und Veranstaltungsort
Paderborn Center for Parallel Computing (PC2)
Pohlweg 51
33098 Paderborn

Informationen zur Anfahrt finden Sie hier .