9. HPC-Status-Konferenz der Gauß-Allianz
Paderborn Center for Parallel Computing, Paderborn, 17. und 18. Okt. 2019

17. - 18. Oktober 2019

Konferenz

Pohlweg 51, 33098 Paderborn

Geb. O, PC² (Google)

Konferenzregistrierung über Converia

Anmeldung

Konferenzprogramm

Programm

Am 17. und 18. Oktober 2019 findet am Paderborn Center for Parallel Computing (PC²) die 9. HPC-Status-Konferenz der Gauß-Allianz statt.

Die HPC-Status-Konferenz bietet Wissenschaftlern und Anwendern eine Plattform zum interdisziplinären Austausch zu aktuellen Forschungsaktivitäten und Fragestellungen im Bereich des Hoch- und Höchstleistungsrechnens in Deutschland (HPC). Eine Besonderheit dieser Veranstaltung liegt im themenübergreifenden Austausch der verschiedenen Disziplinen. Darüber hinaus fördert diese Veranstaltung die Netzwerkbildung der Communities sowie die Sichtbarkeit des deutschen Forschungsschwerpunkts im Bereich des HPC.

Dieses Jahr werden durch BMBF und DFG geförderte HPC-Projekte ihre Forschungsgebiete mit aktuellen Ergebnissen präsentieren und zur Diskussion stellen. Wir erwarten Präsentationen von Projekten in den Gebieten

Anwendungsorientierte HPC-Software für das Hoch- und Höchstleistungsrechnen in Wissenschaft und Wirtschaft unter anderem für die Software-Verifikation, die Simulation und Optimierung in der Energietechnik, Material- und Geowissenschaften
Grundlagenorientierten Forschung für HPC-Software, z. B. Task-basierte Programmieransätze, Metaprogrammierung, Compilerinfrastrukturen u. v. m.
Performance Engineering für wissenschaftliche Software

Weiterhin wird es am Donnerstag, den 17. Oktober 2019, Vorträge zu den Ausschreibungen von EuroHPC sowie dem dazugehörigen administrativen Bewerbungsverfahren geben. Darüber hinaus findet am Donnerstag der Feierliche Spatenstich für den Forschungsbau Noctua (Einladung und Details ) statt, zu dem alle Teilnehmer/-innen der Konferenz herzlich eingeladen sind.

Die Einladung richtet sich an alle Nutzergruppen sowie Interessierte, die Hoch- und Höchstleistungsrechnen nutzen bzw. einsetzen wollen.

Registrierung

Der Konferenzbeitrag beträgt 120 Euro. Dieser wird vom lokalen Veranstalter zur Deckung der Unkosten im Rahmen der Ausrichtung der HPC-Status-Konferenz vereinnahmt und verantwortet. Die Gauß-Allianz hat im Zusammenhang mit dieser Veranstaltung keine Einnahmen und auch kein finanzielles Interesse.

Bitte melden Sie sich bis spätestens zum 7. Oktober 2019 hier im Registrierungssystem (Converia) an. Ab dem 8. Oktober 2019 beträgt der Konferenzbeitrag 150,00 Euro.

Organisatorische Fragen richten Sie bitte an pc2-hpc2019@uni-paderborn.de. Für alle anderen Fragen stehen wir Ihnen unter der Adresse service@gauss-allianz.de zur Verfügung.

Hotels

In den nachfolgenden Hotels haben wir für Sie Zimmer reserviert. Diese können Sie mittels dem Kennwort GA-HPC-2019 abrufen. Bitte reservieren Sie Ihr Zimmer selbstständig.

IBIS Hotel Paderborn City^** (2,6 km), Preis pro EZ/Nacht: 70,39 Euro (Reservierung bis zum 13. September 2019)
Welcome Hotel^**** (3,2 km), Preis pro Nacht 98,00 Euro (Reservierung bis zum 19. September 2019)
Best Western Plus Arosa Hotel^**** (2,4 km), Zimmer pro Nacht 74,00 Euro (Reservierung bis zum 20. September 2019)
Campus Lounge (0,1 km), Zimmer pro Nacht 52,00 Euro (Reservierung bis zum 30. September 2019)

Weitere Hotels sind über die einschlägigen Hotelportale verfügbar.

Programm

Registrierung: Donnerstag, 17. Oktober 2019, 09:00 - 10:00 Uhr

Beginn: Donnerstag, 17. Oktober 2019, 10:00 Uhr
Ende: Freitag, 18. Oktober 2019, 16:15 Uhr

Das aktuelle Programm finden Sie hier.

October 17, 2019
October 18, 2019

09:00
60'

Registrierung

PC², Universität Paderborn

Pohlweg 51, 33098 Paderborn

10:00
5'

Eröffnung der 9. HPC-Status-Konferenz

Prof. Dr. Christian Plessl

PC², Universität Paderborn

PC², Gebäude O, Hörsaal O1

10:05
5'

Grusswort der Hochschulleitung

Prof. Dr. Johannes Blömer

Vizepräsident für Forschung und wissenschaftlichen Nachwuchs, Universität Paderborn

PC², Gebäude O, Hörsaal O1

10:10
40'

Keynote: Wie HPC beim Verständnis elektromagnetische Nahfelder hilft.

Prof. Dr. Jens Förstner

Fachgebiet Theoretische Elektrotechnik (TET) , Universität Paderborn

PC², Gebäude O, Hörsaal O1

Description

Die klassische elektromagnetische Theorie von Maxwell hat eine erstaunlich weitreichende Gültigkeit, die von statischen elektrischen Feldern über Radiosignale, Mikrowellen, Wi-Fi, Mobilfunk, Licht im Infraroten über das Sichtbare bis zum Ultraviolettbereich, zu Röntgenstrahlen und hochenergetischer kosmischer Strahlung reicht. In exakt gleicher Form beschreiben die Maxwellgleichungen die Dynamik von elektromagnetischen Feldern aller Frequenzen. Materie verhält sich jedoch je nach Frequenz unterschiedlich und kann auf verschiedenen räumlichen Skalen unterschiedlich strukturiert sein. Insbesondere auf der mesoskopischen elektromagnetischen Skala, d.h. wenn Objekte mit Dimensionen im Bereich der elektromagnetischen Wellenlänge betrachtet werden, sind Nahfeldeffekte wichtig, da das Feld ist keine einfache ebene Welle mehr ist und übliche Näherungsmethoden und analytische Ansätze scheitern. Dann sind numerische Simulationen erforderlich, um die elektromagnetische Dynamik zu analysieren. Wir werfen einen Blick auf mehrere Systeme, die in der Gruppe Theoretische Elektrotechnik in Paderborn betrachtet werden - sie reichen von optischen Antennen und biologischen photonischen Kristallen, zu interplanetaren Staubpartikeln und Metamaterialien für Frequenzkonversion.

10:50

15' Pause

Abschlussvorträge Projekte des 4. BMBF-HPC-Calls • Chair: Dr. Christian Terboven

11:05
25'

Ultra-Skalierbare Multiphysiksimulationen für Erstarrungsprozesse in Metallen (SKAMPY)

Prof. Dr. Harald Köstler

Lehrstuhl für Systemsimulation , Friedrich-Alexander-Universität Erlangen-Nürnberg

PC², Gebäude O, Hörsaal O1

Description

Für die Entwicklung neuer Materialien, für die Verbesserung von Werkstoffeigenschaften sowie für die Optimierung von Herstellungs- und Fertigungsprozessen haben moderne und hocheffiziente Simulationstechniken eine unverzichtbare Bedeutung in der akademischen und industriellen Forschung erreicht.
Wir zeigen auf, welche hochparallelen Phasenfeldsimulationen auf aktuellen Supercomputern durchgeführt werden können und wie dadurch das Verständnis für die Ausbildung der Mikrostruktur beim Herstellungsprozess – der Erstarrung aus der Schmelze – verbessert werden kann.

11:30
25'

HPC-Toolbox zur Simulation und Inversion von Wellenfeldern

Tilman Steinweg

Lehrstuhl Angewandte Geophysik , Karlsruher Institut für Technologie

PC², Gebäude O, Hörsaal O1

Portable HPC Toolbox for Simulation and Inversion of Waves – 9. HPC-Status-Konferenz (pdf)

Description

Wir entwickeln eine HPC-Toolbox zur Simulation und Inversion vollständiger seismischer Wellenfelder. In dem neu entwickelten C++ Software-Paket werden Finite-Differenzen-Berechnungen in Matrix-Vektor-Formulierung mit der Bibliothek LAMA durchgeführt, die Berechnungen auf verschiedenen Architekturen (CPU/GPU) ermöglicht. Die FD-Berechnung auf einem diskontinuierlichen Gitter mit variabler Genauigkeit der FD-Operatoren führt zu einem Ungleichgewicht der Rechenlast. Eine Lastbalanzierung soll eine optimale Ausnutzung der verfügbaren Rechenkapazität ermöglichen.
Es werden Performance-Benchmarks auf dem Supercomputer JUWELS und Anwendungen der HPC-Toolbox vorgestellt. WAVE

11:50
25'

ELPA eigensolvers: autotunable, energy-efficient, optimized

Dr. Hermann Lederer

MPCDF

PC², Gebäude O, Hörsaal O1

ELPA eigensolvers: autotunable, energy-efficient, optimized - 9. HPC-Status-Konferenz (pdf)

Description

Recent overall improvements on ELPA eigensolvers (ELPA-AEO) will be presented. These include autotuning features, algorithmic improvements, the configurable elimination of unnecessary calculations in specific cases, mixed precision, and architecture specific optimizations.

12:30
30'

Feierlicher Spatenstich Forschungsbau Noctua (Neues Rechenzentrum Paderborn Center for Parallel Computing)
Einladung und Details zum Feierlichen Spatenstich

13:00

60' Mittagspause

13:55
5'

Fototermin – Gruppenfoto

Universität Paderborn, Pressestelle

vor dem Gebäude O

EuroHPC • Chair: Dr. Franz-Josef Pfreundt

14:00
10'

Einführung zu EuroHPC

Dr. Roland Krüppel

BMBF

PC², Gebäude O, Hörsaal O1

Einführung zu EuroHPC (pdf)

14:10
20'

EuroHPC und die aktuellen Calls

Evangelia Markidou

DG Connect, High Performance Computing and Quantum Technology

PC², Gebäude O, Hörsaal O1

EuroHPC Joint Undertaking - Calls 2019 (pdf)

14:30
20'

Europäische Förderregularien im Rahmen von EuroHPC

Dr. Uwe-Michael Schmidt

Nationale Kontaktstelle IKT

PC², Gebäude O, Hörsaal O1

High Performance Computing Joint Undertaking Einführung in EU-Regularien bei der Antragstellung (pdf)

14:50
30'

Fragen zu EuroHPC

15:20

10' Pause

Abschlussvorträge Projekte des 4. BMBF-HPC-Calls • Chair: Dr. Franz-Josef Pfreundt

15:30
25'

PARADOM: Parallele Algorithmische Differentiation in OpenModelica für energietechnische Simulationen und Optimierungen

Martin Schroschk

ZIH, TU Dresden

PC², Gebäude O, Hörsaal O1

Description

Ziele des Projekts PARADOM sind die Bereitstellung moderner mathematischer Methoden, welche exakte Ableitungsinformationen benötigen, sowie die Entwicklung entsprechender paralleler Algorithmen für die effiziente Simulation und Optimierung komplexer energietechnischer Anlagen mit OpenModelica auf HPC-Systemen. Die entwickelten Methoden für die geplanten Erweiterungen von OpenModelica in Verbindung mit der zugehörigen HPC-Parallelisierung werden als quelloffene Pakete für einen breiten Anwenderkreis verfügbar sein. Damit werden die Nutzbarkeit und Attraktivität von HPC-Systemen für technische Simulationen deutlich verbessert.

15:55
25'

Hochparallele Software-Verifikation nebenläufiger Anwendungen in der Automobilindustrie

Prof. Dr. Dirk Nowotka

Arbeitsgruppe Zuverlässige Systeme , Universität Kiel

PC², Gebäude O, Hörsaal O1

Description

Das Projekt "Hochparallele Software-Verifikation nebenläufiger Anwendungen in der Automobilindustrie" (HPSV) hat zum Ziel, Methoden aus dem HPC-Bereich für die Analyse komplexer nebenläufiger Softwaresysteme zu entwickeln und einzusetzen. Als konkretes Anwendungsfeld dient dabei die Software automobiler eingebetteter Systeme.

Die Anwendung von Techniken des Hochleistungsrechnens auf die Sicherheitsanalyse und Fehlersuche in Software eingebetteter Systeme ist neu und eröffnet die Möglichkeit größere Codemengen mit höherer Genauigkeit zu analysieren. Bei der Entwicklung von Analysealgorithmen steht deren Skalierbarkeit sowohl auf Manycore-Architekturen als auch auf modernen HPC-Architekturen mit sehr vielen Kernen im Vordergrund. Dadurch ist sichergestellt, dass weniger komplexe Verifikationsprojekte auch auf preisgünstigeren Manycore-Clustern vor Ort beim Anwender ausgeführt werden können, während für sehr große Simulationsprozesse die Dienstleistungen der HPC-Zentren genutzt werden können.

16:20

30' Pause

Vorträge der Projekte des 5. BMBF-HPC-Calls • Chair: Dr. Herrmann Lederer

16:50
20'

ENVELOPE - Effizienz und Zuverlässigkeit: Selbstorganisation in HPC-Systemen - ein Zwischenbericht

Prof. Dr. Wolfgang Karl

Lehrstuhl für Rechnerarchitektur und Parallelverarbeitung , Institut für Technische Informatik, Karlsruher Institut für Technologie

PC², Gebäude O, Hörsaal O1

ENVELOPE - Effizienz und Zuverlässigkeit: Selbstorganisation in HPC-Systemen – 9. HPC-Status-Konferenz (pdf)

Description

Das Projekt ENVELOPE hat sich zum Ziel gesetzt, zum einen die Komplexität heterogener HPC-Systeme vor dem Anwendungsprogrammierer zu verbergen und gleichzeitig eine effiziente Nutzung der zur Verfügung stehenden Ressourcen der Zielplattform zu ermöglichen und zum anderen die Zuverlässigkeit und Ausfallsicherheit zu erhöhen. Hierfür werden Methoden aus dem Bereich der Selbstorganisation erforscht.

17:10
20'

Ein Werkzeugkasten zur Integration von Selbstadaption in zeitschrittbasierte Simulationen

PD Dr. Matthias Korch

Angewandte Informatik II , Universität Bayreuth

PC², Gebäude O, Hörsaal O1

Ein Werkzeugkasten zur Integration von Selbstadaption in zeitschrittbasierte Simulationen – 9. HPC-Status-Konferenz (pdf)

Description

Im BMBF-Projekt SeASiTe (Selbstadaption für zeitschrittbasierteSimulationstechniken auf heterogenen HPC-Systemen) untersuchen wir systematisch Selbstadaptionsansätze für zeitschrittbasierteSimulationstechniken auf heterogenen HPC-Systemen.
Ziel ist der Entwurfund die Bereitstellung des Prototypen eines Werkzeugkastens, mit dessenHilfe Programmierer ihre Anwendungen mit effizientenSelbstadaptionstechniken ausstatten können.
In diesem Vortrag stellen wir unser Konzept zum Aufbau des Werkzeugkastens und zur Integration der einzelnen Werkzeuge vor.

17:30
20'

Towards a machine learning model for predicting time and power consumption of compute kernels.

Sotirios Nikas

Engineering Mathematics and Computing Lab , Universität Heidelberg

PC², Gebäude O, Hörsaal O1

Description

The BMBF Mekong-Projekts Project, among others, aims to deploy a machine learning model to predict the most suitable processor for the given workload in terms of performance and power consumption. Performance prediction is helpful for various scheduling tasks, and predicting power consumption is beneficial for systems with hard power budgets. To do so, we predict performance and power consumption at compile time using static code analysis of numerous applications in combination with a Random Forest model. The prediction can be used for scheduling decisions, among others, by allowing for a reasoning of time, power, or energy. In this talk, we detail our methodology, model and results.

17:50
20'

Deep Learning on HPC Systems

Dr. Peter Labus

Competence Center High Performance Computing , Fraunhofer ITWM

PC², Gebäude O, Hörsaal O1

DEEP LEARNING ON HPC SYSTEMS – 9. HPC-Status-Konferenz (pdf)

Description

In this talk, I will give an overview of parallelization strategies for the training of Deep Neural Networks. In particular, I will focus on their trade-offs and challenges, and will present the core ideas for their implementation using GPI.

18:15
45'

Führung Paderborn Center for Parallel Computing

20:00
120'

Social Event – Schützenhof Paderborn

Schützenhof Paderborn, Schützenplatz 1, 33102 Paderborn

Description

Das Social-Event der 9. HPC-Status-Konferenz findet im Schützenhof Paderborn statt.
Informationen zur individuellen Anreise finden Sie unter https://www.schuetzenhof.de/kontakt/anfahrt/ .

Route mit Google-Maps (3,3km per Fuß, 4,7km mit dem Auto): https://goo.gl/maps/vbkXZEdV9cTcVN3x6

Verbindung mit dem Bus: https://www.padersprinter.de/wp-content/uploads/2019/10/Liniennetzplan-Tag.pdf

Taxiunternehmen

Taxi Hermesmeyer 05251 - 35050
Taxi Klima 05251 - 61111
Taxi Wientzek 05254 - 999050

Vorträge der Projekte des DFG-PE • Performance Engineering • Chair: Prof. Dr. Ulrich Lang

09:00
20'

Enabling Performance Engineering in Hesse and Rhineland-Palatinate - An overview

Dr. Alexandru Calotoiu

Arbeitsgebiet Parallele Programmierung , TU Darmstadt

PC², Gebäude O, Hörsaal O1

Description

The project "Enabling Performance Engineering in Hesse and Rhineland-Palatinate" or, short, EPE, has as a main objective to expand and deepen HPC support in areas where existing scientific expertise coincides with critical user needs. Our approach is to bundle the distributed expertise for HPC support and performance engineering within the HKHLR and the AHRP under a new umbrella to support scientists to efficiently use the HPC resources in Hesse and Rhineland-Palatinate. The presentation will focus on the main accomplishment of the project.

09:20
20'

PeCoH - Performance Concious HPC - Status 2019

Dr. Hinnerk Stüben

Regionales Rechenzentrum , Universität Hamburg

PC², Gebäude O, Hörsaal O1

PeCoH – Performance Concious HPC Status 2019 – 9. HPC-Status-Konferenz (pdf)

Description

Statusbericht des DFG Projects PeCoH (Performance Concious HPC).

09:40
20'

ProfiT-HPC

Azat Khuziyakhmetov

GWD Göttingen mbH

PC², Gebäude O, Hörsaal O1

Description

Profiling Toolkit for HPC Applications

10:00
20'

ProPE - Status and current results

Dr.-Ing. Jan Eitzinger

RRZE, Friedrich-Alexander-Universität Erlangen-Nürnberg

PC², Gebäude O, Hörsaal O1

Description

Large HPC systems are expensive, and so is their operation, which makes their efficient use a crucial goal. However, those systems are complex with regard to hardware architectures, network topologies, tool chains and software environments. Particularly in academic computing centers there is a vast variety of applications with very different hard- and software demands. Furthermore, small- to medium-sized HPC sites tend to have only limited resources for user support and application performance tuning. For them it is a challenge to ensure an efficient use of the systems on their own. The DFG ProPE project is an effort to address critical components for a service infrastructure for Performance Engineering (PE)in cooperating scientific computing centers. This involves a process that describes how to systematically handle and, if necessary, delegate a PE project within a network of HPC centers, but it also covers tools for job-specific application performance monitoring that assist the staff in detecting pathological jobs or jobs that expose a significant optimization potential. Another focus is on giving central access to HPC related knowledge. This talk will give the status of the project and present initial results, work products and general recommendations.

10:20
20'

Fortschritt im SES-HPC-Projekt

Jan Steiner

Zentrum für Informations- und Medientechnologie , Universität Siegen

PC², Gebäude O, Hörsaal O1

Progress of the SES-HPC Project at Uni Siegen – 9. HPC-Status-Konferenz (pdf)

Description

Services for Experienced and Starting HPC Tier 3 Users (SES-HPC)

While support and training is widely available for users of Tier-1 and Tier-0 computing centers, this is less so for lower-tier centers. The project SES-HPC aims to improve support, both technical and administrative, and training for users of Tier-3 high-performance computing resources, both those who intend to eventually run their applications on higher-tier hardware and those who do not.
The project includes the development of a training course program, the support of scientists in developing and optimizing their software as well as running off-the-shelf computing software, administrative help for users who want to switch to higher-tier centers, and the organization of knowledge transfer and documentation. In this talk, the project focus and current status of SES-HPC are outlined.

Während Support und Training für Tier-1- und Tier-0-Rechenzentren gut verfügbar sind, ist dies bei Rechenzentren auf niedrigen Tiers weniger der Fall. Das Projekt SES-HPC soll dazu dienen, die Unterstützung für Nutzern von Tier-3-Ressourcen zu verbessern, sowohl auf technischer als auch auf administrativer Ebene. Dabei sollen sowohl Nutzer erreicht werden, die später auf höheren Tiers rechnen wollen, als auch solche die dies nicht planen. Das Projekt beinhaltet die Entwicklung eines Schulungsprogramms, die Unterstützung von Wissenschaftlern bei der Entwicklung und Optimierung ihrer Software sowie bei Rechnungen mit kommerzieller oder frei erhältlicher Software. Weiterhin wird administrative Unterstützung für Nutzer, die auf höhere Tiers wechseln wollen, angeboten. Es werden außerdem Wissenstransfer und Dokumentation verbessert.
In diesem Vortrag werden die Schwerpunkte sowie der aktuelle Stand des Projekts dargestellt.

10:40
20'

Performance und Effizienz in HPC mit Custom Computing

Prof. Dr. Christian Plessl

PC², Universität Paderborn

PC², Gebäude O, Hörsaal O1

PerficienCC – Performance and Efficiency in HPC with Custom Computing Status Report – Second project year – 9. HPC-Status-Konferenz (pdf)

Description

Das PerficienCC Projekt zielt darauf ab, die Verwendung von FPGAs zur Beschleunigung von HPC Anwendungen zu erforschen und gemeinsam mit den Methoden- und Code-Entwicklern die performance-kritischen Anwendungsteile für FPGAs anzupassen und zu portieren. In meinem Vortrag werde ich über unsere Zwischenresultate aus den ersten beiden Projektjahren berichten, in dem wir uns auf Anwendungen aus dem Bereich der Elektrodynamik und aus dem Bereich der Ab-Initio Molekulardynamik konzentriert haben. Weiter werde ich über unsere Aktivitäten zur Vereinfachung der Nutzbarkeit von FPGAs für HPC und die Schulung von Nutzern berichten.

11:00

30' Pause

11:30
45'

Keynote: Innovative Computing-Architekturen mit FPGAs

Michaela Blott

Xilinx Research, Dublin, Irland

PC², Gebäude O, Hörsaal O1

Description

Herkömmliche von-Neumann-Architekturen leiden unter steigenden Energiedichten und eingeschränkter Leistungsskalierung mit zukünftigen Technologieknoten. Gleichzeitig sind wir mit einer Explosion von Daten und himmelhohen Rechenanforderungen konfrontiert, die mit Exascale-Computing und der Einführung von Algorithmen für maschinelles Lernen verbunden sind. Rekonfigurierbare Logik mit FPGAs kann die Hardware durch innovative, maßgeschneiderte Rechenarchitekturen an die jeweiligen Anwendung anpassen und so die Energieeffizienz und Leistung im Vergleich zu herkömmlichen CPU- und GPU-basierten Lösungen weiter skalieren. In diesem Vortrag beschreiben wir eine Reihe von Anwendungen und untersuchen, wie durch diese innovativen Rechenarchitekturen neue Ebenen der Leistungsskalierbarkeit und Recheneffizienz erreicht werden können.

Vorträge der Projekte des 5. BMBF-HPC-Calls • Chair: Prof. Dr. Wolfgang E. Nagel

12:20
20'

Recent advances for code generation in the HPC²SE project

Prof. Dr. Christian Engwer

Arbeitsgruppe für Anwendungen partieller Differentialgleichungen , Universität Münster

PC², Gebäude O, Hörsaal O1

Recent advances for code generation in the HPC2SE project – 9. HPC-Status-Konferenz (pdf)

Description

The complexity of numerical simulations makes the use of software framework inevitable in order to benefit from code reuse. At the same time the challenges of modern hardware require platform specific changes to the numerical kernels to achieve a significant performance. The goal of the HPC²SE project was to assist users by automatically generating computational kernels from a domain specific input.

We present recent advances in the project and show how the developed code generation pipeline can be used to generate kernels for very different software frameworks. Different strategies are available for low-order and high-order methods. In a multi-stage process we apply different optimizations.

12:40
20'

Increasing FPGA Usability through OpenMP Support

Dr. Thomas Steinke

Zuse Institute Berlin

PC², Gebäude O, Hörsaal O1

Description

We present the current status of the ORKA-HPC projects with the goal of lowering the barrier to using reconfigurable processors by supporting the OpenMP programming model.

13:00

60' Mittagspause

Vorträge des 5. BMBF-HPC-Calls • Chair: Prof. Dr. Christian Plessl

14:00
20'

Prinzipien der task-basierten Programmierung und Ausführung

Lutz Schubert

Institut für Organisation und Management von Informationssystemen , Universität Ulm

PC², Gebäude O, Hörsaal O1

Description

Task-basierte Anwendungen im HPC Bereich haben normalerweise zur Folge, dass die individuellen Teilaufgaben (Tasks) grob-granular definiert werden müssen, um den Verwaltungsaufwand zu kompensieren. Mit ProThOS bieten wir eine Programmier-Methode und eine Ausführungsumgebung, die so aufeinander abgestimmt sind, dass der Verwaltungsaufwand auf ein Minimum reduziert wird und auch fein-granulare Aufgaben effizient verarbeitet werden können.

14:20
20'

HighPerMeshes - Ein Framework zur verteilten Task basierten Ausführung von iterativen Verfahren auf unstrukturierten Gittern

Dr. Daniel Grünewald

Competence Center High Performance Computing , Fraunhofer ITWM

PC², Gebäude O, Hörsaal O1

HighPerMeshes Ein Framework zur verteilten Task basierten Ausführung von iterativen Verfahren auf unstrukturierten Gittern – 9. HPC-Status-Konferenz (pdf)

Description

Im Projekt HighPerMeshes wird ein in der Praxis einsetzbares domänenspezifisches Framework zur effizienten, parallelen und skalierenden Implementierung iterativer Algorithmen auf unstrukturierten Gittern entwickelt.
Der Vortrag gibt einen Überblick über den Stand des Projektes und beschreibt dessen zentrale Komponenten, wie die zur Verfügung gestellten domänenspezifischen Sprachkonstrukte, das Task-basierte verteilte Laufzeitsystem (ACE/Gaspi) und die Transformations-Infrastruktur samt deren Zusammenspiel. Nach einer kurzen Einführung des Konzeptes wird gezeigt, wie domänenspezifzisches Wissen dazu benutzt wird, konkrete durch die DSL beschriebene Probleme zu partitionieren, Datenabhängigkeiten zu extrahieren und letztendlich den Task-Graphen aufzubauen, der dann durch das Laufzeitsystem auf der jeweiligen (heterogenen) Zielplattform ausgeführt wird. Dies geschieht völlig transparent für den Anwender.

Der Nutzen der bisherigen Projektergebnisse wird anhand eines Beispiels demonstriert.

14:40
20'

TaLPas: Task-basierte Lastverteilung und Auto-Tuning in der Partikelsimulation

Prof. Dr. Philipp Neumann

Lehrstuhl für High-Performance Computing , Helmut-Schmidt-Universität

PC², Gebäude O, Hörsaal O1

TaLPas: Task-BasedLoadBalancingand Auto-Tuning in Particle Simulations – 9. HPC-Status-Konferenz (pdf)

Description

Im Projekt TaLPas werden innovative, Auto-Tuning-basierte Softwarelösungen für Node-Level optimierte Partikelsimulationen und hochskalierbare, taskbasierte Samplingverfahren entwickelt. Dies inkludiert insbesondere (1) die Bibliothek AutoPas für Node-Level optimierte, Auto-Tuning-basierte Partikelsimulation, (2) einen um Performancevorhersage erweiterten, Python-basierten Workflow-Manager sowie (3) Erweiterungen um Visualisierung und Resilienz.
Für (1) wurden verschiedene Optimierungsansätze sowie deren Zusammenspiel für den Linked Cells-Algorithmus beleuchtet. Für Verlet Listen-basierte Algorithmen wurden neue Parallelisierungsstrategien implementiert wie z.B. Gebietsfärbungen unter Nutzung der Linked Cells-Struktur, welche zum Aufbauen der Listen verwendet wurde, oder eine Strategie für Verlet Cluster Lists, welche die Größen der Listen zur Verteilung der Arbeit nutzt. Durch die implementierten Optimierungen bzgl. der Node-Level-Performance und auf Grund der Integration von AutoPas in die MD-Software ls1 können nun produktiv Verdampfungsszenarien aus der Verfahrenstechnik simuliert werden, bei denen das Gasvolumen so groß gewählt werden kann, dass dessen Rand bis zum Euler-Regime reicht, in dem Kontinuumsbedingungen gelten. Die Ergebnisse solcher Simulationen können daher direkt mit denen von Kontinuumsmethoden (z.B. CFD) verglichen werden und ggf. als Benchmark dafür dienen.
Jedoch vergrößert sich durch die Vielzahl an Simulationsvarianten stetig der Suchraum nach optimalen Konfigurationen. Daher ist die derzeitig implementierte Auto-Tuning-Methodik, welche alle Kombinationen testet, ineffizient—neuartige Tuningstrategien basierend auf Maschinellem Lernen und Bayesscher Statistik sind notwendig und in Untersuchung.
Der (2) Workflow Manager wurde im letzten Jahr um verschiedene Funktionalitäten erweitert, und es wurden Verbesserungen an den Schnittstellen zu Performance-Modellen vorgenommen. Zwei Modelle basierend auf Extra-P und Dünngitter-Regression sind derzeit in Arbeit. Hinsichtlich Extra-P wurde ein Reinforcement-Learning-basiertes Verfahren untersucht, welches die derzeit in der Parameteranzahl exponentiell anwachsende Zahl an Messwerten, die Extra-P benötigt, auf eine quasi linear anwachsende Anzahl reduzieren soll.
Zur Integration von In-Situ-Visualisierung (3) wurden Entwicklungen an der Schnittstelle der Visualisierungssoftware MegaMol und der MD-Software ls1, welche AutoPas nutzt, vorgenommen. Eine erste Version läuft stabil und wurde auf bis zu 128 Knoten / 5888 Threads auf dem Supercomputer Stampede2 getestet. Die Kopplung erfolgt lose über Shared Memory, wodurch die Stabilität eines Simulationslaufes nicht durch Fehler in der Visualisierung beeinträchtigt werden kann.
Künftig ist die Integration aller Komponenten (1)-(3) geplant. Eines der dabei zu untersuchenden Szenarios soll Adsorptionsprozesse auf der molekularen Skala beleuchten. In ersten Studien wurden 350 Simulationen über einen weiten Parameterraum (Temperatur, Fluid-Wand Interaktion, Wanddichten) untersucht und erste Arbeiten hinsichtlich der Nutzung des Workflow-Managers für dieses Szenario durchgeführt.

15:00
20'

METACCA - Metaprogramming for Accelerators

Dr. Roland Leißa

Compiler Design Lab , Universität des Saarlandes

PC², Gebäude O, Hörsaal O1

Description

Die Rechnerlandschaft wird heutzutage immer heterogener und derzeit ist keine Trendwende in Sicht. Insbesondere wird die Hardware immer spezialisierter und weist verschiedene Formen der Parallelität auf. Für performante Programme ist es unabdingbar, hardwarespezifische Eigenheiten zu adressieren. Wegen des Halteproblems ist es allerdings unrealistisch anzunehmen, dass ein Programm, das in einer universell einsetzbaren Programmiersprache implementiert ist, vollautomatisch auf solche spezialisierte Hardware übersetzt werden kann und dabei noch Spitzenleistung erzielt. Aus diesem Grund nutzen HPC-Programmierer viele Techniken, die den Quellcode unleserlich, schwer zu verstehen und vor allem in der Regel unportierbar machen. Insbesondere ist diese Anpassung enorm zeitaufwendig und kann für verschiedene Hardwareplattformen komplett unterschiedlich aussehen.

Im Rahmen des METACCA-Projektes beschäftigen wir uns damit, Algorithmen so zu implementieren, dass sie einer Lehrbuchimplementierung ähneln. Durch verschiedene Abstraktionen können wir mithilfe eines partiellen Auswerters, hardwarespezifische Anpassungen im Nachhinein in die Implementierung hineinweben. Der Programmierer muss diese Anpassungen nicht mehr händisch erledigen. Wir verwenden unser Rahmenwerk in drei Anwendungen: Bildverarbeitung, Ray-Tracing und Genomsequenzausrichtung. Dort können wir hochperformante Implementierungen für CPUs und GPUs aus einer Sprache und einer Codebasis auf generische Weise erhalten. Die Performance unserer Codes ist vergleichbar mit industrietauglichen Codes, die über Jahre hinweg von Experten optimiert worden sind. Desweiteren beschäftigen wir uns mit Performance-Modellierung, um a priori abzuschätzen, ob bestimmte Optimierungen überhaupt lohnenswert sind.

15:20
20'

MEPHISTO – Metaprogramming for Heterogeneous Distributed Systems

Pascal Jungblut

Lehr- und Forschungseinheit für Kommunikationssysteme und Systemprogrammierung , LMU München

PC², Gebäude O, Hörsaal O1

Description

The aim of the project is to achieve the performance of modern HPC systems easily for the application programmer and to achieve high performance on all current high-performance computers without changing the source code. We show advances when using the C++ STL algorithms with the combination of C++ executor policies, introduces in C++17. Furthermore we show results from a performance portable N-Body simulation on Power9+V100 hardware.

15:40
20'

Chameleon: Reactive Task Migration for Hybrid MPI+OpenMP Applications

Jannis Klinkenberg

IT Center, RWTH Aachen

PC², Gebäude O, Hörsaal O1

Chameleon: Reactive Task Migration for Hybrid MPI + OpenMP Applications – 9. HPC-Status-Konferenz (pdf)

Description

Many HPC applications are designed based on underlying performance and execution models. These models could successfully be employed in the past for balancing load within and between compute nodes. However, the increasing complexity of modern software and hardware makes performance predictability and load balancing much more difficult. Tackling these challenges in search for a generic solution, we present a novel library for fine-granular task-based reactive load balancing in distributed memory based on MPI and OpenMP. Our concept allows creating individual migratable tasks that can be executed on any MPI rank. Migration decisions are performed at run time based on online performance or load data in order to overlap migration communication with useful computation. Further, we show performance improvements when dealing with hardware-induced imbalances and demonstrate robustness against work-induced imbalances for an AMR application.

16:00
15'

Abschluss der 9. HPC-Status-Konferenz

Prof. Dr. Christian Plessl

PC², Gebäude O, Hörsaal O1

Anfahrt und Veranstaltungsort

Paderborn Center for Parallel Computing (PC²)
Pohlweg 51
33098 Paderborn

Informationen zur Anfahrt finden Sie hier .

9. HPC-Status-Konferenz der Gauß-Allianz
Paderborn Center for Parallel Computing, Paderborn, 17. und 18. Okt. 2019

Registrierung

Credits

About Gauß-Allianz

9. HPC-Status-Konferenz der Gauß-Allianz Paderborn Center for Parallel Computing, Paderborn, 17. und 18. Okt. 2019

Registrierung

Credits

About Gauß-Allianz

Search

9. HPC-Status-Konferenz der Gauß-Allianz
Paderborn Center for Parallel Computing, Paderborn, 17. und 18. Okt. 2019