Ligandenbestimmung für Proteine
Die vorliegende Erfindung betrifft ein Verfahren zur Bestimmung von Liganden für Proteine gemäß den Merkmalen des Patentanspruches 1.
In der Biochemie versteht man unter Liganden biologische aktive Substanzen meist niedermolekularer Art, die durch Bindung an eine spezifische Bindungsstelle eines Makromoleküls eine bestimmte Wirkung auf das Makromolekül ausüben. Bei den hier betreffenden Makromolekülen kann es sich um Enzyme, Rezeptoren, DNA, RNA usw. handeln.
Durch Bindung des Liganden an das Makromolekül können beispielsweise der katalytische Umsatz eines Enzyms, die Aktivierung bzw. Inaktivierung eines Enzyms sowie Konfor ations- änderungen von Makromolekülen bewirkt werden.
In der pharmazeutischen Industrie werden bisher zwei Strategien zur Identifizierung biologischer aktiver Substanzen, d.h. Liganden, angewandt.
Die Unternehmen verfügen in der Regel über große Substanz- sammlungen vieler verschiedener Einzelverbindungen. Diese Substanzen werden in biologischen Systemen, z.B. Zellassays, mittels Hochdurchsatzverfahren in Form von Pipettierstraßen mit automatischer Auswertung auf bestimmte Aktivitäten getestet. Treffer bei diesen Verfahren sind allerdings nur zufällig, sie treten aber mit bestimmten Wahrscheinlichkeiten auf.
Die Alternative dazu ist eine andere Strategie, die mit Hilfe von Computern durchgeführt wird. Unter Berechnung der Kräfte zwischen Molekülen werden am Computer Verbindungen, die an
bestimmte Proteinoberflächen binden sollen, virtuell erstellt und dann erst synthetisiert. So werden im Gegensatz zum obigen Verfahren weniger Substanzen synthetisiert und getestet. Es werden auch virtuelle Substanzbibliotheken von Molekülen, die nicht als Substanz vorliegen müssen, im Dockingverfahren am Computer auf eine Bindung an eine bestimmte Proteinoberfläche getestet. Wiederum werden dann nur die Treffer synthe- Atisiert und in biologischen Testsystemen eingesetzt. Verfahren dieser Art sind bereits in den US-Patenten 5,495,423, 5,579,250 und 5,612,895 beschrieben worden.
In der Praxis wurden auch Kombinationen der oben beschriebenen Verfahren angewendet.
Bei diesen Verfahren wurden aber keine in der Natur vorkommenden Interaktionen ausgenutzt. Des weiteren sind viele bekannte Verfahren der Zufälligkeit ausgesetzt und müssen sich oftmals auf die virtuelle Beobachtung stützen. Dieses führt zu beträchtlichen Zeitverlusten und Ungenauigkeiten.
Es ist daher Aufgabe der vorliegenden Erfindung, ein Verfahren zur Verfügung zu stellen, bei dem die Liganden für Proteine schnell und zuverlässig bestimmt werden können.
Die Aufgabe wird mit einem Verfahren gemäß Patentanspruch 1 gelöst.
Die Unteransprüche betreffen bevorzugte Auεführungsfor en des erfindungsgemäßen Verfahrens.
Die Erfindung betrifft weiterhin Liganden, die nach dem erfindungsgemäßen Verfahren hergestellt sind.
Das erfindungsgemäße Verfahren zur Bestimmung von Liganden für Proteine umfaßt folgende Schritte:
a) Bestimmung derjenigen Sekundärstrukturelemente eines ge- . gebenen Proteins, die den Bindungsort für den Liganden bilden. Insbesondere wird ein Oberflächenbereich des gegebenen Proteins bestimmt, der einen Bindungsort für einen vorherzusagenden Liganden bildet.
b) Zerlegung der molekularen Oberfläche eines gegebenen Proteins in molekulare Oberflächenelemente. Insbesondere werden die Sekundärstrukturelemente eines Modelles des gegebenen Proteins anhand von Wasserstoffbrückenverbin- dungen definiert, wobei in Abhängigkeit des in a) bestimmtes Oberflächenbereiches benachbarte Sekundärstrukturelemente zusätzlich zusammengefaßt und große Sekundärstrukturelemente, die über den Oberflächenbereich hinausragen, zusätzlich geteilt werden.
c) Bestimmen von bekannten ähnlichen molekularen Oberflächenteilen zu denjenigen Oberflächenelementen, die den Bindungsort für den Liganden definieren, wobei die gefundenen molekularen Oberflächenteile ein komplementäres Nachbarelement besitzen. Insbesondere werden Atome eines jeden zu dem in a) definierten Oberflächenbereich gehörenden Sekundärstrukturelementes bestimmt, die einem umgebenden Lösungsmittel ausgesetzt sind. Dadurch werden Suchflächen definiert. Die Atombestimmung geschieht durch Abtasten der Oberfläche mit dem Modell eines Wassermole- küles auf einer Conolly-Oberflache .
Dabei wird insbesondere eine Suchdatenbasis generiert, indem Paare miteinander in Kontakt tretender Flächen bestimmt werden anhand aller oder eines Teiles der Proteine oder Proteinkomplexe mit bekannter dreidimensionaler Struktur. Die Modelle der Proteine werden in Sekundärstrukturelemente und Teile der Sekundärstrukturelemente anhand der Wasserstoffbrücken zerlegt und die Atome eines Sekundärstrukturelementes, nämlich die Kontaktfläche, die mit einem anderen oder dem umgebenden Lösungsmittel in
Van der Waals-Abstand stehen, werden bestimmt.
Insbesondere werden ähnliche Flächen zu denjenigen Oberflächenelementen bestimmt, die den zu bestimmenden Bindungsort für den Liganden definieren, wobei die gefundenen molekularen Oberflächen ein komplementäres Nachbarelement besitzen. Dabei werden der Schwerpunkt und die Hauptausdehnung aller Suchflächen mit allen oder einem Teil der bestimmten Fläche überlagert. Die Überlagerung wird durch Maximierung der überlagerten Atome und Minimierung der quadratischen Fehlerabweichung optimiert.
d) Koordinatentransformation des gefundenen ähnlichen molekularen Oberflächenteils mit Nachbarelement auf ein Ausgangselement bei einem rmε-Wert unterhalb von 2A. Insbesondere wird eine Koordinatentransformation der gefundenen Fläche in die Suchfläche für gegebene Protein durchgeführt.
e) Beurteilung der Paßfähigkeit des Liganden gemäß lokaler Packungsdichte. Insbesondere wird die Überlagerung nach Anzahl der überlagerten Atome, nach Anzahl der überlagerten Atome gleicher Atomsorte und der quadratischen Fehlerabweichung durchgeführt. Ein Treffer kann anhand der lokalen Packungsdichte bewertet werden, die durch das Gegenüber der gefundenen Fläche und dem gegebenen Protein bestimmt ist.
Der Ablauf des erfindungsgemäßen Verfahrens wird anhand des in Fig. 1 gezeigten Fließdiagramms erläutert.
Vorzugsweise wird das erfindungsgemäße Verfahren insbesondere nach Schritt e) auf der Grundlage einer Datenbank durchgeführt. Es hat sich als zweckmäßig erwiesen, die Datenbank ''Dictionary of Interfaces in Proteins (DIP) M Journal of Molecular Biology, Bd. 280, S. 535ff, 1998, zu verwenden. Die Datenbank DIP stellt Flächen zwischen Sekundärstrukturen
(SSE) aller strukturell bekannten Proteine zur Verfügung. Diese Interfaces bestehen aus zwei Atommengen (Patches) , die Teile von benachbarten Sekundärstrukturen sind und zusammen den Kontakt dieser beiden Strukturen ausmachen.
Bei der Bestimmung von Liganden, dem sogenannten " drug de- sign", stellt sich die Frage, welche chemische Verbindung zu einer gegebenen Proteinεtruktur paßt. Erfindungsgemäß werden die Sekundärstrukturelemente eines gegebenen Proteins, die den Bindungsort für den Liganden bilden, bestimmt. Dann wird die molekulare Oberfläche eines gegebenen Proteins zunächst in molekulare Oberflächenteile (MSP = molecular surface patches) zerlegt. Zu denjenigen Elementen, die potentiell die Bindungsregion definieren, werden beispielsweise aus der oben beεchriebenen Datenbank ähnliche Flächen herausgesucht. Als Nebenbedingung wird bei dem Screening auf Ähnlichkeit verlangt, daß die gefundenen MSPs bereits ein komplementäres Nachbarelement besitzen. Eine Transformation, beispielsweise Koordinatentransformation, des gefundenen MSP mit Nachbarelement auf das Ausgangselement ist dann ausεichtεreich , wenn der rmε-Wert (mittlerer Fehler) unterhalb von 2A liegt. Vorzugsweise liegt der Wert bei 1,5 A. Für die Beurteilung der Paßfähigkeit des Liganden gegenüber dem Original hat εich die lokale Packungsdichte nach Goede et al., Journal of Computa- tional Chemistry, Bd. 18, Nr. 9, S. 1114ff, 1997, bewährt.
Bei dem erfindυngsgemäßen Verfahren sollen die Außenflächen der Sekundarstrukturen bestimmt werden. Die Außenflächen, die den Kontakt herstellen, sind die MSP. Ähnliche molekulare Oberflächenteile werden überlagert. Nach der Koordinatentransformation liegen die gefundenen molekularen Oberflächenteile auf Atomen des Bindungsortes . Die besten potentiellen Liganden bilden die Leitverbindung. Der Vergleich der besten potentiellen Liganden mit einem bekannten Ausgangsprotein pluε Ligand erfolgt alε letztes.
Somit erfolgt erfindungsgemäß die Bestimmung eines komplementären Bindungεpartnerε dadurch, daß ähnliche Elemente bestimmt werden, die bereits einen Bindungspartner besitzen.
Wenn die Liganden, bei denen es sich um Sekundärstrukturelemente aus ca. 10 Aminosäuren handelt, bestimmt sind, müssen sie für den Einsatz als Phar akon noch optimiert werden, da Peptide aus den natürlichen L-Aminosäuren vielen Anforderungen nicht entsprechen.
Es gibt experimentelle Verfahren zur synthetischen Umwandlung von Peptiden in Peptidmi etika , z.B. Peptoide, die vom phar- makologiεchen Standpunkt aus betrachtet, häufig wesentlich günstigere Eigenschaften aufweisen. Die Verbindungen durchlaufen dabei in der Regel verschiedene Opti ierungszyklen, in denen die Moleküle auch wirklich als Substanzen vorliegen.
Eine weitere Möglichkeit, Leitverbindungen zu finden, besteht in der Suche in Datenbanken niedermolekularer Verbindungen. In diesem Falle werden die Koordinaten des entεprechenden passfähigen Peptids oder Teile davon verwendet, um in einer entsprechenden Datenbank nach dem angegebenen Überlagerungε- verfahren (Vergleichεverfahren) zu suchen. Damit ist eε möglich, völlig unabhängig von der peptidischen Grundstruktur Leitverbindungen zu finden.
Das erfindungsgemäße Verfahren zur Bestimmung von Liganden wird vorzugsweise für die aktiven Zentren von Enzymen beschrieben. Das Verfahren ist allerdings auch auf andere Makromoleküle (Proteine, DNA,RNA) übertragbar, sofern sie geeignete Oberflächen besitzen. Folgende Anwendungsgebiete kommen beispielsweise in Betracht:
* Bindungs- und/oder Nachweiε oleküle in diagnoεtischen Assayε
* Lebensmittelindustrie: Suche von Liganden für Geschmacksrezeptoren und Verwendung als Geεchmackszuεatzstoff
* Biotechnologie: Moleküle für die Affinitätsreinigung
* Proteine, die im therapeutischen Bereich gebunden werden müssen: Enzyme, Rezeptoren, DNA, RNA
Zytokine oder Wachstumsfaktoren und ihre
Rezeptoren, insbeεondere diejenigen, die der
Stoffwechselregulation dienen
Zelladhäεionsproteine und ihre Rezeptoren
Proteine der Signaltranεduktionεwege und ihre
Bindungεpartner zytosolische Rezeptoren, Steroidrezeptoren
Proteine der Blutgerinnung
Neurotranεmitter und ihre Rezeptoren
Proteine der Stoffwechselwege
Proteine der Replikation, Transkription und
Translation
Proteine von Krankheitserregern (Bakterien,
Viren, eukaryotische Einzeller, Parasiten)
Das erfindungsgemäße Verfahren läßt sich auch zur Bestimmung von Proteinstrukturen anwenden. Es ist nicht auf alleinige Sequenzähnlichkeit angewiesen, sondern verwendet Strukturähnlichkeit von molekularen Grenzflächen von Sekundärstruktur- elementen zur Vorhersage ihrer Wechεelwirkungεpartner. Dabei wird der Tatsache Rechnung getragen, daß gleiche (ähnliche) Grenzflächen auch bei unterschiedlichen Sequenzen entstehen können.
Beispielhaft soll im folgenden daε Verfahren der Proteinstrukturbestimmung in seinen Schritten geschildert werden.
Im ersten Schritt wird eine gegebene Pri ärεtruktur in ihrer vollen Länge in eine repetitive Sekundärstruktur ''gewik- kelt". Dies bedeutet, daß mit Standard φ, φ und χ-Winkeln ß- Faltblätter bzw. -Helices über die volle Länge der Primärstruktur errechnet werden.
Im zweiten Schritt werden die entstandenen molekularen Grenz-' flächen dieser Sekundärstrukturelemente geclustert und mit einem artifiziellen neuronalen Netz bewertet, dessen Eingangsdaten sich aus den molekularen Oberflächen der ge- clusterten Strukturelemente ergeben. Die Bewertung erfolgt mit dem Ziel, einerseits zu bestätigen, ob überhaupt mit der gegebenen Primärεtruktur molekulare Oberflächen bei dem Sekundärstrukturelement zu gestalten sind, die repräsentativ für das gegebene Strukturelement sind. Wenn nicht, wird die Sekundärstruktur verworfen. Damit ergibt sich ein neues Verfahren der Sekundärεtrukturvorherεage . Das neuronale Netz wird anhand der bekannten Proteinεtrukturen trainiert.
Alternativ zur allgemeinen Strukturbildung auf der Grundlage von Standard φ, <p und χ-Winkeln für Helices bzw. Faltblättern können bekannte Sekundärstrukturvorherεagealgorithmen angewendet werden, εo daß das vorgenannte Verfahren nur auf die vorhergesagten Strukturen (Teile der Sequenz) angewandt wird. In einem weiteren Schritt werden die gefundenen Cluster, die Kontakt zu einem bestimmten Sekundärstrukturelement (oder Solvent) haben, verwendet, um in der Datenbank DIP gleiche oder ähnliche molekulare Oberflächen und deren Nachbarn zu suchen. Dies geschieht mit dem weiter oben schon beschriebenen biaε-freien Überlagerungεalgorith uε für atomare Sets.
Auε dem vorgenannten Arbeitεεchritt ergeben sich eine Reihe von MPS , deren Partnerelement sicher bzw. weniger sicher (Variantenplanung) festliegt. Wird dabei ''nicht-Solvent" vorhergesagt, versucht ein einfacher Docking-Algorith us im dritten Schritt eine pasεende Fläche in anderen Sekundärstrukturelementen alε dem direkt betrachteten zu lokalisieren. Der einfache Docking-Algorithmus beruht auf der Tatsache, daß molekulare Grenzflächenpartner zwischen Sekundarstrukturen innerhalb eines gegebenen Abstandeε der beiden Schwerpunkte bzw. einem beεtimmten Winkel der ausgezeichneten Richtung geεucht werden kann. Die Qualität der Paßfähigkeit wird mit Hilfe der molekularen Dichtebeεtimmung überprüft
(siehe oben, Goede et al.). Liegen die potentiellen Partner fest, wird in einem vierten Schritt die prinzipielle Faltbarkeit unter Einhaltung aller vorhergesagten Nachbarschaften
(Solvent, Helix-Helix, Helix-coil, Helix-extended) überprüft und die allgemeine Faltung oder mehrere Varianten von der gegebenen Sequenz angenommen.
Das folgende Beispiel soll das erfindungsgemäße Verfahren erläutern.
Beispiel
Inhibitor-Design für das Proteaso
Ausgehend von einem Bindungsort einer aktiven Untereinheit des Proteaεomε bei Hefe werden die Sekundärelemente bestimmt, die den Bindungsort bilden. Es stellt sich heraus, daß fünf Elemente beteiligt sind, wobei zwei größere Elemente den Bindungsort bestimmen. Anschließend werden die Außenflächen dieser Sekundarstrukturen bestimmt. Mit den Teilen der Außenflächen, die den Kontakt ausmachen und 12 bis 22 Atome umfasεen, werden in der DIP-Datenbank ähnliche MSPε geεucht. Die ähnlichen MSPε von einer bestimmten Mindestgüte, wobei mindeεtens 70% der Atome überlagert εind und der rmε-Wert 1 , 0A beträgt, werden mit den Ausgangsflächen überlagert, wobei die Aminosäuren, die die Gegenseite der MSPε bilden bei der Koordi- natentranεformation der MSPs einbezogen werden. Nach der Ko- ordinatentranεformation liegen die gefundenen MSPs auf den Atomen des Bindungsortes, die Gegenseiten der MSPε in der Bindungstasche .
Die Gegenseiten der gefundenen MSPs, die die potentiellen Liganden darstellen, werden dahingehend überprüft, ob sie die Bindungstasche ausfüllen und ob die Abstände zu den Atomen der Bindungstasche groß genug sind. Dafür wird die lokale Dichte in der Bindungεtaεche berechnet. Die beεten potentiellen Liganden bilden die Leitverbindungen.
Ein Vergleich der zehn besten potentiellen Liganden mit einer Proteasom-Struktur des Archaebakteriumε , die mit Ligand vorliegt, ergibt, daß die Hauptkette von einer der auf diese Weise berechneten Strukturen völlig identisch zu dem bekannten Inhibitor des Proteasoms deε Archebakteriums ist.