In Zusammenarbeit mit dem FZJ und DLR hat das SCC am KIT in der Zeitschrift Communications Biology eine Studie veröffentlicht, die moderne und klassische Ansätze des tiefen maschinellen Lernens (Deep-Learning) kombiniert, um auch für datenarme Szenarien Vorhersagemodelle entwerfen zu können. Das vorgeschlagene Modell, BARNACLE, verwendet einen Deep-Learning-Ansatz in der biologischen Strukturvorhersage: Für die Vorhersage räumlicher Nachbarschaften zwischen RNA-Bausteinen, nutzen die Forschenden die Tatsache, dass Nukleotide, die in der RNA räumlich nahe beieinander liegen, während der Evolution auch mit größerer Wahrscheinlichkeit gemeinsam mutieren. Genau nach diesen Mutationsmustern sucht das Modell, dessen Trainingsgrundlage eine Kombination aus selbstüberwachtem Vortraining auf vielen Sequenzdaten und die effiziente Nutzung der wenigen Strukturdaten ist. Mit diesem Ansatz konnte eine signifikante Verbesserung gegenüber klassischen statistischen Ansätzen sowie anderen neuronalen Netzen gezeigt werden. Die Methode ist zudem auf verwandte Aufgaben mit ähnlichen Datenbeschränkungen übertragbar. Weitere Informationen: scc.kit.edu/ueberuns/17136 .