Das DFG-Projekt „A Fast and Fault-tolerant Microkernel-based System for Exascale Computing (FFMK)“ widmet sich wichtigen Herausforderungen zukünftiger Exascale-Systeme. Diese sind hohe Anfälligkeit gegenüber temporären Fehlern und Ausfällen von Systemkomponenten sowie Leistungseinbußen durch unzureichende Lastbalancierung und Beeinträchtigung durch das Betriebssystem (OS-Noise). Dazu werden drei Technologien integriert: Hauptspeicherbasiertes Checkpoint/Restart mit fehlerkorrigierenden Codes, um der steigenden Ausfallrate zu begegnen, Lastbalancierung von HPC-Anwendungen durch aus dem Cluster-Managementsystem MosiX bekannten Verfahren sowie ein auf dem Mikrokern L4 basierendes Betriebssystem. Ziel ist die Konstruktion eines sich weitgehend selbst organisierenden Systems für Exascale-Anwendungen. Ein limitierter Prototyp soll innerhalb der ersten Förderperiode des DFG-Schwerpunktprogramms SPPEXA entwickelt und anhand geeigneter HPC-Anwendungen evaluiert werden. Projektpartner sind die Technische Universität Dresden, das Zuse-Institut Berlin und die Hebrew University of Jerusalem. Weitere Informationen: http://ffmk.tudos.org