Dissertation/Thesis Abstract

Leveraging Novel Information for Coarse-Grained Prediction of Protein Motion
by Putz, Ines, Ph.D., Technische Universitaet Berlin (Germany), 2018, 185; 27610097
Abstract (Summary)

Proteine sind an fast allen Funktionen in unseren Zellen beteiligt aufgrund ihrer Fähigkeit, Konformationsbewegungen mit chemischer Spezifität zu kombinieren. Informationen über die Bewegungen eines Proteins liefern somit Einblicke in seine Funktion. Proteine bewegen sich auf einer zerklüfteten Energielandschaft mit vielen lokalen Minima über ihrem hochdimensionalen Konformationsraum. Eine erschöpfende Abtastung dieses Raums übersteigt die verfügbaren Rechenressourcen für alle bis auf die kleinsten Proteine. Computergestützte Ansätze müssen daher die Energiefunktion und/oder die Auflösung des Modells vereinfachen aufgrund von Informationen darüber, was relevant ist und was ignoriert werden kann. Die Genauigkeit der Approximation hängt von der Genauigkeit der verwendeten Information ab. Informationen, die spezifisch für die Problemdomäne sind, d. h. Proteinbewegung in unserem Fall, führen normalerweise zu besseren Modellen.

In dieser Arbeit stelle ich ein neuartiges elastisches Netzwerkmodell von erlernten erhaltenen Kontakten, genannt lmcENM, vor. Es erweitert die Bewegungsreichweite, die durch diese Netzwerke erfasst werden können, durch das Ausnutzen neuer Informationen über die Struktur eines Proteins. Dies verbessert die allgemeine Anwendbarkeit von elastischen Netzwerkmodellen.

Elastische Netzwerkmodelle (ENMs) sind eine sehr populäre grobkörnige Methode zur Untersuchung von Proteinbewegungen. Sie nehmen an, dass Proteinbewegungen harmonisch um eine Gleichgewichtskonformation verlaufen und weitgehend von der strukturellen Konnektivität des Proteins bestimmt werden. Dies führt zur vereinfachten Darstellung eines Proteins als elastisches Masse-Feder-Netzwerk auf der Basis von Residue-Interaktionen. Trotz ihrer Einfachheit sagen ENMs intrinsische Proteinbewegungen mit überraschender biologischer Relevanz voraus. Genaue ENM-Vorhersagen erfordern jedoch, dass die anfängliche Kontakttopologie während der Bewegung eines Proteins aufrechterhalten wird. Dies ist natürlicherweise für hoch kollektive Bewegungen erfüllt, was zu ihrer erfolgreichen Vorhersagen führt. Lokalisierte Funktionsbewegungen, die wesentliche Änderungen in der Kontakttopologie beinhalten, werden jedoch oft nur unzureichend erklärt. Dies begrenzt die praktische Relevanz von ENMs, da der Bewegungstyp eines Proteins a priori unbekannt ist und daher unbekannt ist, ob ENMs es erfassen können.

lmcENM überwindet diese Einschränkung, indem Informationen über das dynamische Verhalten von Kontakten genutzt werden, d. h. ob sie brechen oder erhalten bleiben, wenn sich das Protein bewegt. Die erhaltenen Kontakte bleiben übrig, nachdem die brechenden Kontakte aus dem ursprünglichen Netzwerk entfernt wurden. Im Gegensatz zu existierenden ENM-Varianten ist lmcENM in der Lage, Proteinbewegungen auch für lokalisierte und unkorrelierte Funktionstransitionen mit sich ändernder Kontakttopologie genau vorherzusagen. Im ersten Teil meiner Arbeit zeige ich, dass die Abwesenheit von beobachteten brechenden Kontakten ENMs in die Lage versetzt, lokalisierte Funktionstransitionen genau zu erklären. Das resultierende Netzwerk von beobachteten bleibenden Kontakten, mcENM, kann erstellt werden, wenn die Anfangs- und Endkonformation eines Funktionsübergangs bekannt ist. Um diese Strategie im Standardfall anzuwenden, wenn nur eine einzige Proteinkonformation zur Verfügung steht, müssen wir diese brechenden Kontakte natürlich vorhersagen können.

Im zweiten Teil meiner Arbeit zeige ich, wie die brechenden Kontakte vorhergesagt werden können. Um dies zu erreichen, entwickelte ich einen maschinell lernenden Klassifikator, der die brechenden von den bleibenden Kontakten unterscheidet auf Grundlage einer graph-basierten Kodierung ihres strukturellen Kontexts. Die physikalisch-chemischen Eigenschaften des strukturellen Kontexts eines Kontakts erfassen, wie stark verschiedene Teile des Proteins miteinander verbunden sind, wie sich dies auf ihre Bewegungen und letztendlich auf ihre Kontakttopologie auswirkt. Zum Erstellen von lmcENM werden die vorhergesagten brechenden Kontakte aus dem ursprünglichen Netzwerk entfernt. Anhand eines großen Datensatzes von Proteinen, die verschiedene Bewegungstypen abdecken, demonstriere ich die Effektivität von lmcENM.

Meine Dissertation erschließt brechende Kontakte oder allgemein dynamische Kontaktänderungen als eine neue Informationsquelle, die sich bei der grobkörnigen Vorhersage von Proteinbewegung als wertvoll erwiesen hat. Da diese dynamische Kontaktänderungen auf einem vereinfachten Modell der strukturellen Konnektivität eines Proteins definiert sind, sind sie unempfindlich gegenüber strukturellen Details, die ansonsten ihre Identifizierung und Vorhersage erschweren würden. Die Existenz und Nützlichkeit von brechenden Kontakten, die in meiner Dissertation gezeigt wurden, ermöglicht zukünftige Forschung, um die Bedingungen, unter denen sie auftreten, zu untersuchen sowie die Merkmale, die am meisten zu ihrer genauen Vorhersage beigetragen haben. Unser Framework für die Vorhersage von brechenden Kontakten kann leicht erweitert werden, um unser Verständnis der Proteinbewegung weiter voranzutreiben.

Indexing (document details)
Advisor: Brock, Oliver
Commitee:
School: Technische Universitaet Berlin (Germany)
School Location: Germany
Source: DAI-C 81/4(E), Dissertation Abstracts International
Source Type: DISSERTATION
Subjects: Analytical chemistry, Biochemistry
Keywords: Protein motion, Novel information, Coarse-grained prediction
Publication Number: 27610097
ISBN: 9781392615119
Copyright © 2019 ProQuest LLC. All rights reserved. Terms and Conditions Privacy Policy Cookie Policy
ProQuest