Das Leibniz-Rechenzentrum hat zwei neue Systeme für Big Data und Machine Learning in Betrieb genommen: Teramem1 und DGX-1. Für Big-Data-Anwendungen stehen nun mit vier Broadwell-Prozessoren mit insgesamt 96 Rechenkernen 6 Terabyte Cache-kohärenter Speicher zur Verfügung. Das System ist besonders für Anwendungen wie Genom-Analysen, die Durchforstung großer Datenbanken oder die Auswertung riesiger Datenbestände – wie sie zum Beispiel auf den großen Supercomputern am LRZ anfallen – geeignet, die wenige Rechenkerne aber riesigen Hauptspeicher benötigen. Da Teramem1 in das Linux-Cluster des LRZ integriert ist, steht das gesamte dortige Software-Angebot zur Verfügung. Das Machine-Learning-System DGX-1 ist ein „Supercomputer in a box“ mit acht hochwertigen NVIDIA-Tesla-P100-Grafikprozessoren. Die 28.672 NVIDIA-CUDA-Recheneinheiten sind über einen NVLink Interconnect verbunden und können 170 TeraFlop/s Rechenleistung erbringen. Es verfügt über 16 Gigabyte Speicher und besitzt einen „Host-Prozessor“ auf Intel X86-Basis mit 40 Kernen. DGX-1 kann flexibel mit Docker-Images für die jeweiligen Anwendungen bestückt werden. Besonders oft nachgefragte Softwarepakete wie TensorFlow, Theano, CNTK, Torch, Digits und Caffe sind bereits vorinstalliert. Das Betriebsmodell ist so dynamisch wie das gesamte Forschungsgebiet. Einzelne Nutzer können das gesamte DGX-1-System exklusiv für sich reservieren, um ihre komplexen Machine-Learning-Aufgaben interaktiv zu bearbeiten zum Beispiel riesige neuronale Netze trainieren, die anschließend auf wesentlich weniger leistungsfähiger Hardware zur Mustererkennung eingesetzt werden können.