Eine Frage von Raum und Zeit – Proteine in der Computersimulation

Die letzten beiden Jahre in der Corona-Endlosschleife haben laut Umfragen das Ansehen der Wissenschaft in der eher wissenschaftsskeptischen deutschen Gesellschaft erheblich verbessert. In Echtzeit konnten die Menschen miterleben, wie täglich neue Erkenntnisse über das Virus unser Verhalten gegenüber diesem hochinfektiösen Erreger beeinflussten, in Rekordzeit neue Impfstoffe und Medikamente entwickelt wurden und mathematische Modelle und Prognosen das öffentliche Leben bestimmten. Sie bekamen Einblicke in Labore, Reagenzgläser und Erlenmeyerkolben, Expert*innen erklärten ihnen – mal mit, mal ohne weiße Kittel – wie aus experimentellen Daten Wissen entsteht, das schließlich in konkreten Anwendungen mündet. Auch das Heidelberger Institut für Theoretische Studien (HITS) war mit mehreren Forschungsgruppen aus verschiedenen wissenschaftlichen Disziplinen aktiv an der Erforschung der Pandemie beteiligt (eine Liste der Projekte finden Sie am Ende dieses Beitrags).

Um die Pandemie soll es aber in diesem Blogbeitrag gar nicht in erster Linie gehen. Vielmehr möchte ich im ersten Teil der neuen Via-Data-Reihe „Wie aus Computerdaten Wissenschaft wird“ gemeinsam mit der Doktorandin Isabel Martin der Frage nachgehen, wie das denn ganz allgemein so ist am HITS mit der Wissenschaft, die ausschließlich am Computer stattfindet, und ihre Ergebnisse in Simulationen, Modellen und Prognosen darstellt.

Dazu treffen wir uns in dem dunkelroten Klinkerbau am Schloss-Wolfsbrunnenweg, hoch über den Dächern der Heidelberger Altstadt. Die Büros am HITS sehen aus wie ganz normale Arbeitsplätze, ausgestattet mit Computern und Bildschirmen. Nichts deutet auf den ersten Blick darauf hin, dass hier tagtäglich Grundlagenforschung auf höchstem Niveau betrieben wird.

An einem dieser Computer sitzt Isabel Martin. Sie promoviert im Fachbereich Molekulare Biomechanik, und ihre Welt sind die Proteine. Ohne Proteine gäbe es kein Leben, nirgendwo auf dieser Welt – jedenfalls nicht so, wie wir es kennen. Proteine verleihen unseren Zellen Struktur, arbeiten rund um die Uhr als Boten, Lastesel und Beschleuniger und sind so an nahezu allen lebenswichtigen Prozessen im Körper beteiligt. Beim Menschen geht man derzeit von mehreren hunderttausend verschiedenen Proteinsorten aus, die sich vor allem in ihrer Struktur und damit in ihrer Funktion unterscheiden.

„In meiner Forschung schaue ich Proteinen dabei zu, wie sie sich bewegen. Jedes Molekül, und damit auch jedes Protein, hat zusätzlich zu seiner Struktur auch eine genau definierte Eigenbewegung. Diese Bewegung macht aus starren Proteinen flexible Mitarbeiter im Körper. Ich mache diese Bewegung aber nicht in Experimenten im Labor sichtbar, sondern mit sogenannten ‚Molekulardynamik-Simulationen‘ am Computer. Daraus kann ich dann Informationen über die Funktion von Proteinen gewinnen.“

Diese von Isabel Martin erwähnten Molekulardynamischen Simulationen sind nicht ganz neu. Bereits in den späten fünfziger Jahren führten die US-amerikanischen Physiker Bernie Alder und Thomas E. Wainwright die ersten Simulationen von einfachen Gasen durch. Die erste Molekulardynamische Simulation eines Proteins gelang Andrew McCammon Ende der 70er Jahre. Seitdem hat diese Methode stetig an Einfluss gewonnen und ist heute aus der modernen Biologie nicht mehr wegzudenken.

Doch was passiert bei einer solchen Simulation eigentlich? Welche Voraussetzungen müssen gegeben sein und was genau kann man mit ihrer Hilfe herausfinden?

„Zuerst brauche ich die dreidimensionale Struktur des Proteins. Anders gesagt: Ich muss wissen, wo sich jedes Atom im Protein befindet. Die Informationen darüber bekomme ich zum Teil von anderen experimentellen Technologien, wie zum Beispiel der Röntgenkristallographie oder der Kryo-Elektronenmikroskopie. Mit den Newtongleichungen, die viele aus der Schule kennen, wird dann am Computer berechnet, wo sich jedes einzelne Atom nach einer winzig kleinen Zeit befindet. Diese Berechnung wird dann bis zu einer Milliarde mal wiederholt. So können wir die Bewegung des Proteins wie in einem Daumenkino aus einer Milliarde Bilder beobachten. Allerdings deckt dieser Film auch nur einen winzigen Bruchteil einer Sekunde im Leben des Proteins ab.“



„In einem meiner Projekte habe ich zum Beispiel Stellen im Protein identifiziert, die wichtig für die Funktion des Proteins waren. In Zusammenarbeit mit einem experimentellen Labor haben wir genau diese Stellen mutiert, das heißt, wie haben sie so verändert, dass sie funktionsuntüchtig wurden. Damit konnten wir überprüfen, ob diese Stellen tatsächlich für das Protein relevant sind und welche Funktion das Protein damit in der Zelle hat. So fügen sich Simulation und Experiment wie ein Puzzle zusammen und ergeben ein vollständiges Bild der Funktionsweise des Proteins.“

Und ihre computerbasierten Simulationen liefern nicht nur wichtige Informationen für das aktuelle Forschungsprojekt, sondern geben in manchen Fällen auch die Richtung für potentielle Anschlussprojekte vor. So führte zum Beispiel die Arbeit eines ihrer Kollegen über das Protein Kollagen, das unserem Bindegewebe in Knochen, Bändern und Haut strukturelle und mechanische Stabilität verleiht, zur Gründung eines experimentellen Labors an der Universität Heidelberg. Dies alles zusammengenommen macht die Molekulardynamische Simulation so attraktiv für unterschiedliche Fachrichtungen in Biologie und Medizin.

Meine Simulationen haben gegenüber laborbasierten Experimenten mehrere Vorteile: Auf der einen Seite kann ich schnell und ressourcenschonend verschiedene Ansätze und Szenarien testen, ohne dafür jedes Mal einen aufwändigen Versuchsaufbau zu konstruieren. So kann eine genaue Vorauswahl getroffen werden für weiterführende Experimente. Auf der anderen Seite kann ich mit meinen Simulationen in sehr kleine Zeit- und Längenskalen vordringen. Damit kann ich Prozesse sichtbar machen, die Experimenten verschlossen bleiben. Meine Beobachtungen von Proteinbewegungen auf den kleinsten Skalen tragen so dazu bei, die Funktion des Proteins auf den größeren Skalen einer Zelle zu erklären.“

Die Grundlagenforschung von Isabel Martin in der Gruppe „Molekulare Biomechanik“ unter Leitung von Frauke Gräter trägt dazu bei, unser Wissen über die Funktionsweise von Proteinen zu erweitern, ohne die Leben undenkbar wäre. Dabei profitiert sie auch von der exzellenten Computerinfrastruktur am HITS und der Universität Heidelberg, denn die enorme Rechenleistung und Speicherkapazität der Rechen-Cluster machen Molekulardynamische Simulationen an großen Proteinen und Proteinkomplexen erst möglich.

Davon profitieren auch andere Fachbereiche am HITS, wie wir im nächsten Teil der Reihe „Wie aus Computerdaten Wissenschaft wird“ im April sehen werden, wenn es bei der Forschungsgruppe „Computational Carbon Chemistry“ um die Suche nach umweltfreundlichen Katalysatoren geht.

Dieser Beitrag entstand in enger Zusammenarbeit mit Isabel Martin, der ich an dieser Stelle herzlich für ihre Unterstützung danke!


Mehr über die Forschung der Gruppe „Molekulare Biomechanik“ allgemein unter https://www.h-its.org/de/forschung/mbm/.

Die im Text erwähnten Projekte:
https://www.h-its.org/de/projects/mechanokinases-deutsch/
https://www.h-its.org/de/projects/mechanoradicals-and-dopa-in-collagen-tissue-deutsch/
https://www.h-its.org/de/2022/03/17/ilk-pnas/


Mehr über die COVID-19- Forschungsprojekte des HITS:
https://www.h-its.org/de/2022/01/27/serratus-nature/
https://www.h-its.org/de/2021/10/01/brave-projekt/
https://www.h-its.org/de/2021/09/29/covid-19-forecast-hub/
https://www.h-its.org/de/2021/04/12/sars-cov-2-trapp/
https://www.h-its.org/de/2020/08/13/phylogenetische-analyse-von-sars-cov-2-daten/
https://www.h-its.org/de/forschung/mcm/aktuelles/

Avatar-Foto

Das Heidelberger Institut für Theoretische Studien (HITS) betreibt Grundlagenforschung in den Naturwissenschaften, der Mathematik und der Informatik. Dabei werden große Datenmengen verarbeitet, strukturiert und analysiert. Der methodische Schwerpunkt liegt auf der Theorie- und Modellbildung. Die rund 120 HITS-Forscherinnen und -Forscher aus 22 Ländern befassen sich unter anderem mit theoretischer Biochemie, molekularer Biomechanik, wissenschaftlichen Datenbanken, Computerlinguistik, theoretischer Astrophysik, statistischen Methoden und Informatik.

4 Kommentare

  1. Ja, molekulardynamische Simulationen wären/sind das ideale Mittel um etwa Enzymen bei ihrer Arbeit zuzusehen oder auch das ideale Mittel um die aktiven Stellen von Proteinen bis ins letzte zu verstehen. Nur gerade die beschränkte Rechenkapazität und die praktischen Beschränkungen in der Modellierung von komplexen Molekülen setzen hier schwer zu überwindende Grenzen.

    Doch Machine Learning dringt auch in diesen Bereich vor, denn Deep Learning und künstliche neuronale Netze haben sich als geradezu phantastisch gute Funktionsapproximatoren für komplizierte, hochdimensionale Funktionen erwiesen, wie sie auch bei der Modellierung von molekularen Dynamiken auftreten.

    Auf der Website Combined Artificial Intelligence and Molecular Dynamics (AI-MD) Methods liest man dazu:

    Die Simulation der Molekulardynamik (MD) ist ein leistungsstarkes „White-Box“-Tool (definiert als ein Tool mit transparenten und verständlichen internen Mechanismen), das natürliche Prozesse reproduzieren, überwachen und vorhersagen kann. Typischerweise als „Blackbox“- oder „Graybox“-Tool (ein Tool mit unbekannten oder nicht transparenten internen Mechanismen) betrachtet, hat „Künstliche Intelligenz“ (KI, wie z. B. Regressionsmodelle) bei der Parametrisierung, Featureisierung und Verallgemeinerung von MD-Simulationen geholfen in seinen Anfängen. In den letzten Jahren haben Deep-Learning-Methoden gezeigt, dass sie das Potenzial haben, Proteinstrukturvorhersagen, Nukleinsäureforschung, Designs kleiner Moleküle, Materialdesigns usw. zu unterstützen. MD-Simulationen zeichnen sich zwar durch Interpretierbarkeit und Datengenerierung aus, es fehlt ihnen jedoch in der Regel an Effizienz und Umfang. KI-Methoden mangelt es manchmal an Interpretierbarkeit, könnten aber mit den durch Simulationen und Experimente generierten Daten für Effizienz und Skalierbarkeit sorgen. Daher ist es von großem Wert, Schnittstellen zwischen neuartigen Deep-Learning-Technologien und MD-Simulationen aufzubauen, die beiden Interessengebieten zugute kommen könnten.

    Ausblick: Mir scheint, HITS ist eine ideale Forschungsinitiative um unter anderem den Einsatz von Machine Learning und Deep-Learning in der molekulardynamischen Simulation zu untersuchen und weiter zu bringen.

  2. Ein sehr interessanter Beitrag, vielen Dank dafür. Eine Frage: in dem Artikel wurden Newtongleichungen angesprochen das deutet darauf hin, dass reine Kraftfeldrechnungen durchgeführt werden. Vor 30 Jahren wurde versucht, Kraftfeld- mit semiempirischen Rechnungen zu kombinieren, natürlich nicht an Proteinen sondern an viel kleineren Molekülen (kann mich an cyclische Hexapeptide erinnern).
    Das könnte erhebliche Vorteile haben, gerade wenn das Protein vielleicht ein aktives Zentrum mit einem Übergangsmetall aufweist wie etwa das Hämoglobin. Funktioniert diese Kombination für Proteine auch mit den modernen Rechnern immer noch nicht (denn der Rechenaufwand für semiempirische Verfahren ist natürlich wesentlich grösser als reine Kraftfeldrechnungen)?

    • Sehr geehrter Herr Dunsbach, vielen Dank für die Frage. Ja, in der Tat, wurden die genannten Molekular Dynamik Simulationen mithilfe von Kraftfeldern durchgeführt. Die Genauigkeit dieser Simulationen könnten durch semiempirische Methoden verbessert werden, allerdings bringt dies, wie Sie richtig anmerkten, einen deutlich höheren Rechenaufwand mit. Effizienter ist daher die Kombination von quantenmechanischen Rechnungen (QM) mit Molekularmechanischen (MM). Dies ist nochmal aufwändiger, der Sprung in Genauigkeit ist aber größer im Vergleich zu semiempirischen Methoden. Insbesondere für größeren Systeme mit bekannte reaktive Zentren sind diese QM/MM Simulationen interessant und werden auch in der Praxis eingesetzt.
      Viele Grüße,
      Kai Riedmiller
      Molekulare Biomechanik, HITS

Schreibe einen Kommentar


E-Mail-Benachrichtigung bei weiteren Kommentaren.
-- Auch möglich: Abo ohne Kommentar. +