Motiviert durch den Bedarf der Ingenieur- und Naturwissenschaften nach immer längeren und größeren Simula-tionsläufen, haben Wissenschaftler der TU München (TUM) gemeinsam mit dem Leibniz-Rechenzentrum in München (LRZ) sowie den Thermodynamik-Lehrstühlen der TU Kaiserslautern und der Uni Paderborn den Molekulardynamik-Code ls1 mardyn für den Intel Sandy Bridge EP Prozessor – das Herzstück des SuperMUC am LRZ – optimiert. Um die Performance hinsichtlich starker Skalierbarkeit auf SuperMUC zu evaluieren, wurden Läufe mit 4,8 Milliarden Partikeln ausgeführt. Dabei wurde eine sehr gute Skalierbarkeit auf 146.000 Kernen bei einer parallelen Effizienz von 42 % erreicht. Für die derzeit weltweit größte Molekulardynamik-Simulation mit 4,125 Billionen Partikeln dauerte die Berechnung eines Zeitschritts ca. 40 Sekunden. Für dieses Szenario wurde eine absolute Performance von 591,2 Teraflop/s erreicht, was einem Speedup von 133.200 bezogen auf einen einzelnen Kern entspricht. Die single-precision Sustained Performance lag damit bei 9,4 % der Peak Performance.