September 2020

Gauß-Allianz newsletter - Issue 83

10. HPC-Statuskonferenz

Die HPC-Statuskonferenz der Gauß-Allianz bietet Wissenschaftler/innen eine Plattform zum interdisziplinären Austausch zu aktuellen Forschungsaktivitäten und Fragestellungen im Bereich Hoch- und Höchstleistungsrechnen (HPC) in Deutschland sowie zur Netzwerkbildung. Erstmals in der zehnjährigen Historie der Konferenzserie werden die Vortragenden am 1. Oktober ihre aktuellen und zukünftigen Aktivitäten aus den Bereichen Maschinen, Methoden und Anwendungen in einer virtuellen Konferenz präsentieren. Weitere Informationen und Anmeldung: gauss-allianz.de/de/hpc-status-konferenz-2020

TU Darmstadt nimmt Lichtenberg II in Betrieb

Die TU Darmstadt wird voraussichtlich im September die erste Ausbaustufe des Nachfolgesystems Lichtenberg II in Betrieb nehmen. Von der Firma MEGWARE hergestellt, übersteigt es die Rechenleistung von Lichtenberg I um das 4-Fache. Zusammen mit der für 2021 geplanten zweiten Ausbaustufe wird das Gesamtsystem vom Bund und vom Land Hessen mit rund 15 Mio. Euro gefördert. Allein die erste Ausbaustufe schafft eine real erreichbare Spitzenleistung von 3 PetaFlop/s und stellt 234 Terabyte RAM zur Verfügung. Ein dazu gehörendes leistungsfähiges Storage-System mit rund 3 Petabyte für Daten ist bereits seit 2019 im Betrieb. Im Detail enthält die Hardware der Phase I 596 Rechenknoten mit jeweils 96 Rechenkernen und mindestens 384 Gigabyte RAM. So erreichte Lichtenberg II im Juni Platz 92 in der TOP500 und setzt mit Platz 48 in der Green500 neue Maßstäbe. In Deutschland ist es damit nicht nur das schnellste Universitäts-Cluster, sondern dank der Warmwasserkühlung das effizienteste gelistete HPC-Cluster. Ökologisch sinnvoll ergänzt wird der Betrieb, durch die geplante Nachnutzung der Abwärme. Damit das System auch seitens der Nutzenden effizient betrieben werden kann, stehen die Mitarbeiter/innen des Hessischen Kompetenzzentrums für Hochleistungsrechnen (HKHLR) beratend zur Seite und bieten Schulungen an. Weitere Informationen: hhlr.tu-darmstadt.de/hhlr/index.de.jsp

Max-Planck-Supercomputer Raven

Um dem gestiegenen Rechenbedarf der Max-Planck-Institute Rechnung zu tragen, geht ein weiterer Hochleistungsrechner der MPG an der MPCDF in Betrieb: neben dem bisherigen Hauptsystem „Cobra“ nun „Raven“. Ein Interimssystem hierfür wurde auf Basis von Intel-Prozessoren des Typs Xeon CascadeLake-AP installiert und geht im September in Betrieb. Es beinhaltet über 500 Rechenknoten mit je 96 Prozessorkernen und nutzt ein Netzwerk mit Mellanox HDR-InfiniBand (100 Gigabit/s) in einer „non-blocking fat-tree“-Topologie über alle Knoten. In der ersten Hälfte 2021 soll dieses Interimssystem durch ein finales System auf Basis von Intel-Xeon-IceLake-Prozessoren abgelöst werden. Dieses wird dann auch mit 768 GPUs des Typs NVIDIA A100 ausgestattet sein. Weitere Informationen: mpcdf.mpg.de/BB/255

2-Faktor-Login für HPC-Systeme des KIT

Nach den weltweiten IT-Sicherheitsvorfällen im Mai konnten die meisten HPC-Systeme wieder zur Nutzung freigegeben werden, oft mit deutlichen Einschränkungen. Am KIT wurde der Nutzerbetrieb Mitte Juni wieder aufgenommen. In der ersten von drei Phasen der föderativ abgestimmten Inbetriebnahme war u. a. die Verwendung von SSH-Keys unterbunden. Dies war eine massive Einschränkung, da die HPC-Systeme nicht mehr automatisiert in wissenschaftliche Workflows eingebunden werden konnten, was die Forschung erheblich beeinträchtigte. Am SCC wurde deshalb nun eine 2-Faktor-Authentifizierung für alle HPC-Systeme mit zeitbasierten Einmalpasswörtern (TOTP) eingeführt. Für die Generierung der TOTPs können Hardware- oder Software-Token verwendet werden. Beschäftigten des KIT stehen mit der IT-Grundausstattung automatisch Hardware-Token bereit; auch Nutzenden anderer Standorte wird das 2-Faktor-Login mittels Software-Token über gängige Apps für Mobilgeräte zur Verfügung gestellt. Die Registrierung und Verwaltung der Token erfolgt über das Portal des föderativen Identitätsmanagementsystems für Hochschulen des Landes Baden-Württemberg (bwIDM). Weitere Informationen: scc.kit.edu/ueberuns/13907.php

Neue Software für virtuelle Meetings

Eine unter der Federführung des Höchstleistungsrechenzentrums Stuttgart (HLRS) im Projekt „Virtuelle Kollaborationslabore Baden-Württemberg“ (KoLab-BW) entwickelte VR-Software ermöglicht es Nutzenden an verteilten Standorten, sich unter Verwendung kommerziell verfügbarer VR-Brillen und Controller in einem virtuellen Meeting-Raum zu treffen. Repräsentiert durch Avatare interagieren die Nutzenden in diesem virtuellen Raum miteinander und analysieren gemeinsam 3D-Visualisierungen. Die neue Technologie soll dazu beitragen, wissenschaftliche Erkenntnisse zu beschleunigen oder die Einführungszeit neuer Produkte am Markt deutlich zu verkürzen – und das nicht nur in Szenarien, die ein spontanes persönliches Zusammenkommen erschweren, wie aufgrund der aktuellen Corona-Pandemie. Zudem kann die neue Software z. B. im Bereich Schulung und Training die Ausbildung von Studierenden maßgeblich unterstützen oder für moderne Methoden des Distance Learnings eingesetzt werden. Am KoLab-BW-Projekt sind neben dem HLRS auch das Visualisierungsinstitut der Universität Stuttgart (VISUS), die Universität Ulm, das Kompetenzzentrum Virtuelle Realität der Hochschule Mannheim (KVE), die Hochschule Albstadt-Sigmaringen sowie die Hochschule Ravensburg-Weingarten beteiligt. Gefördert wird das Projekt durch das Ministerium für Wissenschaft, Forschung und Kunst Baden-Württemberg. Weitere Informationen: hlrs.de/de/whats-new/news/detail-view/2020-07-08/

AlphaNumerics Zero: KI für Numerik

Das Projekt „AlphaNumerics Zero“ (ɑN0), das vom JSC zusammen mit Forschenden des Steinbuch-Centers für Computing am KIT geleitet wird, hat zum Ziel, numerische Methoden auf Hochleistungsrechnern neu zu überdenken. Traditionell wird viel Aufwand in den Entwurf, die Implementierung und Optimierung von Lösern für Differentialgleichungen, numerischen Bibliotheken usw. gesteckt. Neue Ideen sind dringend erforderlich, da die Entwicklung von Methoden für die kommenden extrem skalierenden Supercomputer immer schwieriger wird. Geplant ist der Einsatz von Reinforcement-Learning-Techniken, so dass der Computer die im Durchschnitt optimale numerische Lösungsmethode für ein gegebenes Simulationsproblem selbst lernt. Die Arbeitsergebnisse des Projekts sollen ein funktionierendes Framework und die Demonstration in einem Anwendungsfall unter Verwendung einer zeitabhängigen partiellen Differentialgleichung umfassen. Das Projekt wird für 30 Monate aus dem Impuls- und Vernetzungsfond der Helmholtz-Gemeinschaft gefördert.

HPC für den europäischen Mittelstand

Das HLRS übernimmt ab Herbst 2020 die Koordination eines weiteren europäischen HPC-Projekts. FF4EuroHPC ist das Nachfolgeprojekt der erfolgreich abgeschlossenen EU-Projekte Fortissimo und Fortissimo 2, die den Einsatz von HPC in der Industrie durch sogenannte Testläufe bzw. Experimente förderten. Die „Lessons Learned“ und „Best Practices“ wurden in einem Anwendungsportfolio zusammengetragen und stehen interessierten Unternehmen zur Verfügung. FF4EuroHPC setzt – mit dem Fokus auf kleine und mittlere Unternehmen (KMUs) in Europa – auf diese Erkenntnisse auf und bietet Einführung, Beratung und Unterstützung für HPC, High-Performance-Datenanalyse (HPDA) sowie im Bereich Künstlicher Intelligenz (KI) und Deep Learning (DL). Das Projektziel ist, dass teilnehmende KMUs optimierte Design- und Entwicklungsprozesse ableiten, somit bessere Produkte und Dienstleistungen generieren und dadurch ihre Wettbewerbsfähigkeit erhöhen. Erfolgreiche Maßnahmen werden anschließend als Erfolgsgeschichten veröffentlicht, um die Vorteile von HPC und verwandter Technologien wie KI oder HPDA einem noch breiteren Kreis von KMUs nahe zu bringen. KMUs mit Vorschlägen für Probeprojekte können sich für Rechenzeitkontingente bewerben. Offizieller Starttermin für FF4EuroHPC ist der 1. September. Weitere Informationen: hlrs.de/en/news/detail-view/2020-07-09/ Kontakt: Bastian Koller, HLRS@GCS)