-
Die
Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäureketten.
Die Grundlage der Methode ist die Detektion von Fluoreszenzsignalen
einzelner mit Farbstoffen markierter Nukleotidmoleküle, die
durch eine Polymerase in eine wachsende Nukleinsäurekette eingebaut werden.
Die Reaktion verläuft
auf einer planen Oberfläche.
Auf dieser Oberfläche
sind viele einzelne Nukleinsäure-Moleküle immobilisiert.
Alle diese Nukleinsäure-Moleküle sind
gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig
eine Aufbaureaktion ablaufen kann.
-
Das
Verfahren umfaßt
im wesentlichen folgende Schritte:
- 1) Immobilisierung
der Nukleinsäureketten
auf einer planen Oberfläche.
- 2) Durchführen
einer zyklischen Aufbaureaktion, wobei jeder Zyklus aus folgenden
Schritten besteht:
a) Zugabe einer Lösung mit markierten Nukleotiden
(NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
b)
Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter
Bedingungen, die zur Verlängerung
der komplementären
Stränge
um ein NT geeignet sind,
c) Waschen,
d) Detektion der
Signale von einzelnen Molekülen,
e)
Entfernung der Markierung von den eingebauten Nukleotiden,
f)
Waschen.
Gegebenenfalls erfolgt eine mehrfache Wiederholung
des Zyklus.
- 3) Analyse der detektierten Signale der einzelnen Moleküle.
- 4) Rekonstruktion der Sequenzen aus den Einzeldaten.
-
1. Abkürzungen
und Begriffserläuterungen
-
-
- DNA
- – Desoxyribonukleinsäure verschiedenen
Ursprungs und unterschiedlicher Länge: (genomische DNA, cDNA,
ssDNA, dsDNA)
- RNA
- – Ribonukleinsäure (meist
mRNA)
- Polymerasen
- – Enzyme, die komplementäre Nukleotide
in einen wachsenden DNA- oder RNA-Strang einbauen können (z.B.
DNA-Polymerasen, Reverse-Transkriptasen, RNA-Polymerasen)
- dNTP
- – 2'-deoxi-Nucleosid-Triphosphate für DNA-Polymerasen
und Reverse-Transkriptasen
- NTP
- – Nukleosid-Triphosphate für RNA-Polymerasen
- NT
- – natürliches Nukleotid, meist dNTP,
wenn nicht ausdrücklich
anders gekennzeichnet.
-
Abkürzung "NT" wird auch bei der
Längenangabe
einer Nukleinsäuresequenz
verwendet, z.B. 1.000 NT. In diesem Fall steht "NT" für Nukleotid-Monophosphate.
-
Im
Text wird bei Abkürzungen
die Mehrzahl durch Verwendung des Suffixes "s" gebildet, "NT" steht zum Beispiel
für "Nukleotid", "NTs" steht für mehrere
Nukleotide.
- NT*
- – modifiziertes Nukleotid,
meist dNTP, wenn nicht ausdrücklich
anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleotide
- NSK
- – Nukleinsäurekette. DNA oder RNA in ihrer
ursprünglichen
Länge
- NSKF
- – Nukleinsäurekettenfragment, NSKFs – Nukleinsäurekettenfragmente.
Fragmente von DNA oder RNA, die nach einem Fragmentierungsschritt
entstehen.
-
Plane
Oberfläche:
Oberfläche,
die vorzugsweise folgende Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne
Moleküle,
vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem jeweiligen
gegebenen Objektiv-Oberfläche-Abstand
bei einer Objektivposition gleichzeitig zu detektieren. 2) Die immobilisierten
einzelnen Moleküle
befinden sich in derselben Fokusebene, die reproduzierbar eingestellt
werden kann.
-
Sterisches
Hindernis: Sterisch anspruchsvolle Gruppe, die durch ihre chemische
Struktur die Eigenschaften der mit dieser Gruppe gekoppelten NTs*
so verändert,
daß diese
durch eine Polymerase in einer Extensionsreaktion nicht nacheinander
eingebaut werden können.
-
Definition
der Termination: Als Termination wird in dieser Anmeldung der reversible
Stop des Einbaus der modifizierten ungespalteten NTs* bezeichnet.
-
Dieser
Begriff ist von dem üblichen
Gebrauch des Wortes "Termination" durch Dideoxy-NTP
bei einer konventionellen Sequenzierung zu trennen.
-
Die
Termination kommt nach dem Einbau eines modifizierten NT* zustande.
Das modifizierte eingebaute NT* trägt eine an die Base reversibel
gekoppelte sterische Gruppe, die zur Behinderung des Einbaus eines
nächsten
komplementären
NT* in den wachsenden Strang durch eine Polymerase führt.
-
Genprodukte – Bei den
Genprodukten handelt es sich um die primären Genprodukte der Gene. Im
wesentlichen handelt es sich dabei um RNA-Transkripte der genannten
Gene, welche auch als Target-Sequenzen (oder Target-Nukleinsäuresequenzen)
bezeichnet werden. Diese Target-Sequenzen schließen neben mRNA auch davon abgeleitete
einzelsträngige
und doppelsträngige
cDNA, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA ein.
-
SNP – single
nucleotide polymorphism
-
Die
Nukleinsäurenketten-Sequenzanalyse
ist in vielen Bereichen der Wissenschaft, Medizin und Industrie
zu einem wichtigen Werkzeug geworden. Zur Analyse wurden mehrere
Verfahren entwickelt.
-
Die
bekanntesten Verfahren sind die Ketten-Terminations-Sequenzierung
nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 5463), die auf
dem Einbau von Kettenterminatoren basiert, und die Maxam-Gilbert-Methode,
die auf Basen-spezifischer Modifikation und Spaltung von Nukleinsäureketten
beruht (A. M. Maxam and W. Gilbert PNAS 1977, v. 74 S. 560). Beide
Methoden liefern eine Anzahl von Nukleinsäurekettenfragmenten verschiedener
Längen.
Diese Fragmente werden der Länge
nach in einem Gel aufgetrennt. Dabei müssen alle Nachteile der Elektrophorese
(wie z.B. lange Laufzeit, relativ kurze Strecken von Sequenzen,
die in einem Ansatz bestimmt werden können, begrenzte Anzahl der
parallelen Ansätze
sowie relativ große
Mengen an DNA) in Kauf genommen werden. Diese Methoden sind sehr
arbeitsintensiv und langsam.
-
Ein
weiteres Verfahren zur Sequenzierung basiert auf der Hybridisierung
von Nukleinsäureketten
mit kurzen Oligonukleotiden. Dabei wird mit mathematischen Methoden
berechnet, wie viele Oligonukleotide einer bestimmten Länge vorhanden
sein müssen,
um eine komplette Sequenz zu ermitteln (Z. T. Strezoska et al. PNAS
1991 v. 88 S. 10089, R. S. Drmanac et al. Science 1993 v. 260 S.
1649). Auch dieses Verfahren ist mit Problemen behaftet: Es kann
nur eine Sequenz in einem Ansatz bestimmt werden, sekundäre Strukturen
stören
die Hybridisierung und Sequenzwiederholungen verhindern die korrekte
Analyse.
-
Eine
andere Möglichkeit
zur Sequenzierung haben Arbeitsgruppen von (Dower US Patent 5.547.839, Canard
et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999,
v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et
al. Nucleosides & Nucleotides
1999, v. 18, S. 197) entwickelt. Diese Methode wird abgekürzt als
BASS (Base Addition Sequencing Scheme) bezeichnet. Dabei wird eine
große
Anzahl gleicher einzelsträngiger
DNA-Stücke
an einem definierten Ort auf einer Oberfläche fixiert und das Signal von
der Gesamtheit dieser vielen identischen DNA-Stücke analysiert. Zu dieser fixierten
DNA wird eine Lösung mit
Polymerase und Nukleotiden zugegeben, so daß ein komplementärer Strang
synthetisiert werden kann. Dabei soll die Polymerase schrittweise
arbeiten: in jedem Schritt wird nur ein einziges Nukleotid eingebaut. Dieses
wird detektiert, worauf die Polymerase in einem nächsten Zyklus
das nächste
Nukleotid einbaut.
-
Die
Methode hat folgende Nachteile: Beim Aufbau der komplementären Stränge tritt
sehr schnell eine Desynchronisation der Synthese auf, so daß bei jedem
Schritt die Fehler akkumulieren. Deshalb können nur sehr kurze Fragmente
sequenziert werden. Es ist zu betonen, daß alle beschriebenen BASS-Methoden
nicht auf der Detektion von einzelnen Molekülen beruhen. Das Signal wird
stattdessen von einer großen
Anzahl identischer an einem defi nierten Ort immobilisierter Moleküle registriert.
Die in diesen Methoden übliche
Verwendung der Begriffe "einzelne
Moleküle" und "Moleküle" zielt dabei nicht
auf individuelle, voneinander getrennte Moleküle, sondern auf eine Population,
die aus vielen identischen Molekülen
besteht. Identisch heißt in
diesem Fall, daß die
Moleküle
die gleiche Sequenz haben.
-
Die
Aufgabe der vorliegenden Erfindung besteht daher darin, ein Verfahren
zur Sequenzanalyse von Nukleinsäureketten
bereitzustellen, das die Nachteile der oben erwähnten Methoden nicht aufweist
und vor allem eine billigere, schnellere und effizientere Analyse
von Nukleinsäuresequenzen
ermöglicht.
Insbesondere soll das Verfahren in der Lage sein, viele Sequenzen
parallel zu bestimmen, vorzugsweise soll es die Analyse sehr langer
Nukleinsäureketten
(mehrere Mb) in einem Ansatz ermöglichen.
-
3. Kurze Beschreibung
-
Die
Aufgabe wird erfindungsgemäß durch
ein Verfahren zur Sequenzanalyse von Nukleinsäuresequenzen (Nulcleinsäureketten,
NSKs) gelöst,
bei dem man Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von
etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der
Gesamtsequenzen darstellen, man die NSKFs auf einer Reaktionsoberfläche in einer
Dichte von 10 bis 100 NSKFs pro 100 μm2 immobilisiert
(stationäre
Phase), man eine zyklische Aufbaureaktion des komplementären Stranges
der NSKFs unter Verwendung eines oder mehrerer Primer und einer
oder mehrerer Polymerasen durchführt,
indem man
- a) zu den immobilisierten NSKFs eine
Lösung
zugibt, die eine oder mehrere Polymerasen und ein bis vier modifizierte
Nukleotide (NTs*) enthält,
die mit Fluoreszenzfarbstoffen markiert sind, wobei die bei gleichzeitiger
Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen
Fluoreszenzfarbstoffe so gewählt
sind, daß sich
die verwendeten NTs* durch Messung unterschiedlicher Fluoreszenzsignale
voneinander unterscheiden lassen, wobei die NTs* strukturell so
modifiziert sind, daß die
Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang
nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen,
wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle
Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist,
man
- b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen
inkubiert, die zur Verlängerung
der komplementären
Stränge
geeignet sind, wobei die komplementären Stränge jeweils um ein NT* verlängert werden,
man
- c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen
wäscht,
die zur Entfernung nicht in einen komplementären Strang eingebauter NTs*
geeignet sind, man
- d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch
Messen des für
den jeweiligen Fluoreszenzfarbstoff charakteristischen Signals detektiert,
wobei man gleichzeitig die relative Position der einzelnen Fluoreszenzsignale
auf der Reaktionsoberfläche
bestimmt, man
- e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluoreszenzfarbstoffe
und die sterisch anspruchsvollen Liganden von den am komplementären Strang
angefügten
NTs* abspaltet, man
- f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen
wäscht,
die zur Entfernung der Fluoreszenzfarbstoffe und der Liganden geeignet
sind, man
die Stufen a) bis f) gegebenenfalls mehrfach
wiederholt,
wobei man die relative Position einzelner NSKFs
auf der Reaktionsoberfläche
und die Sequenz dieser NSKFs durch spezifische Zuordnung der in
Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen
detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus
den ermittelten überlappenden
Teilsequenzen die Gesamtsequenz der NSKs bestimmt.
-
Die
erhaltene Population von überlappenden
Teilsequenzen läßt sich
mit kommerziell erhältlichen
Programmen zur Gesamtsequenz der NSK zusammenfügen (Huang et al. Genom Res.
1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al.
NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1
S. 257).
-
Gemäß einer
besonderen Ausführungsform
der Erfindung kann das Verfahren durchgeführt werden, indem man die Stufen
a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei
man
- a) in jedem Zyklus nur jeweils ein markiertes
NT*,
- b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs*
oder
- c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs*
einsetzt.
-
Wenn
die NSKs Varianten einer bekannten Referenzsequenz sind kann das
Verfahren auch durchgeführt
werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion
mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils
zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt
und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz
ermittelt.
-
Gegenstand
der vorliegenden Erfindung sind ferner die in den 7e, 7f und 7g dargestellten
Nukleotide und die entsprechenden markierten Nukleotide, die beispielsweise
an die terminale Aminofunktion angeheftete Fluoreszenzfarbstoffe aufweisen,
oder die in den 7h, 7i oder 7j dargestellten markierten Nukleotide.
-
Gegenstand
der Erfindung ist ferner ein Kit zur Durchführung des Verfahrens das eine
Reaktionsoberfläche,
zur Durchführung
des Verfahrens erforderliche Reaktionslösungen, eine oder mehrere Polymerasen, und
Nukleotide (NTs) enthält,
von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind,
wobei die NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*),
daß die
Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang
nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen,
wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle
Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist.
Bei den Nukleotiden handelt es sich vorzugsweise um die oben genannten
erfindungsgemäßen Nukleotide.
-
Gemäß einer
besonderen Ausführungsform
der Erfindung enthält
das Kit ferner zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche
Reagenzien, einzelsträngige
Nukleinsäuremoleküle, die
als PBS in die KSKFs eingeführt
werden, Oligonukleotid-Primer,
zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen
Liganden erforderliche Reagenzien und/oder Waschlösungen.
-
Die
erfindungsgemäße Methode
dient zur Ermittlung der Nukleinsäuresequenzen und kann in verschiedenen
Bereichen der Genetik eingesetzt werden. Dazu zählen insbesondere die Bestimmung
unbekannter, langer Sequenzen, Analysen von Sequenz-Polymorphismen
und Punktmutationen sowie die parallele Analyse einer großen Zahl
an Gensequenzen.
-
Die
Vorbereitung des zu analysierenden Materials (einzel- und doppelsträngige Nukleinsäuresequenzen)
hängt von
der Aufgabestellung ab und hat das Ziel, aus einer langen Nukleinsäurekette
eine Population an relativ kleinen, einzelsträngigen Nukleinsäurekettenfragmenten
(NSKFs) zu bilden, diese Fragmente mit einem für den Start der Sequenzierungsreaktion
geeigneten Primer zu versehen und auf einer planen Oberfläche zu fixieren.
-
Dabei
werden einzelne NSKFs auf einer planen Oberfläche in einer solchen Weise
fixiert, daß eine enzymatische
Reaktion an diesen Molekülen
ablaufen kann. Prinzipiell sind verschiedene Arten der Immobilisation
möglich,
die von der Zielsetzung, der Art der NSK und der für die Reaktion
eingesetzten Polymerase abhängen.
Die NSKFs werden bei der Immobilisierung zufällig auf der Oberfläche verteilt,
d.h. es muß also nicht
auf eine exakte Positionierung der einzelnen Ketten geachtet werden.
Die Nukleinsäureketten
müssen dabei
in einer solchen Dichte auf der Oberfläche fixiert werden, daß eine eindeutige
Zuordnung der später
detektierten Signale zu einzelnen NSKFs gewährleistet ist.
-
Nach
der Vorbereitung der NSKFs startet man mit allen auf der Oberfläche immobilisierten
Molekülen die
Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient die
Synthese des komplementären Stranges
zu jedem einzelnen immobilisierten NSKF. Dabei werden in den neu
synthetisierten Strang markierte NTs* eingebaut. Die Polymerase
baut nur ein einziges markiertes NT* in die wachsende Kette ein.
Dies wird durch die reversible Ankopplung einer zur Termination
führenden,
sterisch anspruchsvollen Gruppe an die NTs* erreicht. Der Einbau
eines weiteren markierten NT* wird dadurch unmöglich gemacht. Diese sterisch
anspruchsvolle Gruppe ist vorzugsweise ein Fluoreszenzfarbstoff.
-
Die
Sequenzierungsreaktion verläuft
in mehreren Zyklen. Ein Zyklus umfasst folgende Schritte:
- a) Zugabe einer Lösung mit markierten Nukleotiden
(NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter
Bedingungen, die zur Verlängerung
der komplementären
Stränge
um ein NT geeignet sind,
- c) Waschen,
- d) Detektion der Signale von einzelnen Molekülen,
- e) Entfernung der Markierung von den eingebauten Nukleotiden,
- f) Waschen.
-
Gegebenenfalls
erfolgt eine mehrfache Wiederholung des Zyklus (a–f).
-
Die
Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden so
gewählt,
daß die
Polymerasen an mehr als 50% der an der Sequenzierungsreaktion beteiligten
NSKFs in einem Zyklus ein markiertes NT* einbauen können, vorzugsweise
an mehr als 90%.
-
Die
Anzahl der durchzuführenden
Zyklen hängt
dabei von der jeweiligen Aufgabenstellung ab, ist theoretisch nicht
beschränkt
und liegt vorzugsweise zwischen 20 und 5000.
-
Danach
wird für
jedes fixierte NSKF seine spezifische Sequenz aus der Reihenfolge
der eingebauten NTs* ermittelt. Aus den überlappenden NSKF-Sequenzen
kann die ursprüngliche
NSK-Sequenz rekonstruiert werden ("Automated DNA sequencing and analysis" S. 231 ff. 1994
M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v.
9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995
v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).
Dabei sucht man in der gesamten Population von NSKF-Sequenzen nach Übereinstimmungen/Überlappungen
in den Sequenzen von NSKFs. Durch diese Übereinstimmungen/Überlappungen
kann man die NSKF in eine Reihe bringen, z.B.:
-
In
der Praxis hat sich bei einer Sequenzierung von unbekannten Sequenzen
bewährt,
eine Länge
der sequenzierten Stücke
von mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung
von Genomen aus Eukaryonten im Schrotschuss-Verfahren.
-
Dabei
können
die Fehler der Methode mit verschiedenen Mitteln erfasst und korrigiert
werden. Sämtliche
Schritte des Verfahrens können
weitgehend automatisiert werden.
-
Durch
die Arbeit mit einzelnen Molekülen
ergeben sich mehrere Vorteile gegenüber der früher beschriebenen BASS-Methode:
- 1. Da die Moleküle einzeln detektiert werden,
besteht keine Gefahr, daß das
Signal durch die Desynchronisation in der Population fehlerhaft
wird. Für
jedes fixierte NSKF wird eine eigene Sequenz erstellt. Daher spielt
es keine Rolle, ob an einem benachbarten Molekül die Synthese bereits weiter
fortgeschritten oder zurückgeblieben
ist:
- 2. Es ist nicht notwendig, Moleküle in einer definierten Anordnung
auf der Oberfläche
zu fixieren, da das Signal von einzelnen Molekülen ausgeht und nicht von einer
räumlich
definierten Population (was bei BASS-Methoden notwendig ist).
-
Kurze Beschreibung
der Figuren
-
1: Allgemeines
Prinzip der Sequenzierung einer langen Nukleinsäurekette (schematische Darstellung)
-
- 1) Ausgangsmaterial – die zu analysierende lange
Nukleinsäuresequenz,
Gesamtsequenz
- 2) Fragmente von 50–1000
bp – die
im Fragmentierungsschritt aus der Gesamtsequenz erzeugten NSKFs
- 3) Fragmente mit jeweils einem Primer – NSKF-Primer-Hybridisierungsprodukte
- 4) Immobilisierte Fragmente – an die plane Oberfläche gebundene
NSKF-Primer-Hybridisierungsprodukte, in dieser Ausführungsform
erfolgt die Bindung am 3'-Ende
der NSKFs
- 5) Zugabe einer Lösung
mit Polymerasen und NT*s als erster Schritt in einem Zyklus der
Sequenzierungsreaktion
- 6) Waschschritt – nach
dem Einbauschritt wird die Oberfläche gewaschen
- 7) Detektion – die
Signale von einzelnen eingebauten NT*s werden detektiert
- 8) Entfernung der Markierung und der zur Terminierung führenden
Gruppe – zur
Fortsetzung der Sequenzierungs reaktion werden die Markierung und
das sterische Hindernis entfernt
-
2: Beispiele
für die
allgemeine Struktur von immbolilisierten Nukleinsäurefragmenten
-
Diese
Figur zeigt eine an das 3'-Ende
der NSKFs (3) angekoppelte einheitliche Primerbindungsstelle (PBS;
2) und einen an diese PBS gebundenen einheitlichen Primer (1).
-
3: Oligonukleotid-Konstruktion
mit einer Primerbindungsstelle und blockierten Enden
-
Ein
doppelsträngiger
Oligonukleotidkomplex (3a), der eine Primerbindungsstelle (PBS)
umfaßt,
kann auf einer Seite des Oligonukleotids an beiden Strängen modifiziert
sein (3b), damit nur eine PBS an das NSKF ligiert wird. Nach Ligation
an die doppelsträngigen
NSKFs und nach Denaturierung (3c) entstehen einzelsträngige NSKFs
mit einheitlicher PBS und modifizierten Enden (3d).
-
4: Nukleotid-Tailing
-
An
das 3'-Ende eines
einzelsträngigen
DNA-Fragmentes (NSKFs) werden durch sogenanntes „Tailing" mit Hilfe einer terminalen Deoxynukleotidyltransferase
mehrere Nukleosid-monophosphate angeknüpft (dargestellt sind Guanosin-Monophosphate
und das sogenannte (G)n-Tailing).
Bei Verwendung einheitlicher Nukleosid-monophosphate entsteht eine einheitliche
PBS.
-
5: Beispiele
für die
Bindung von NSKFs an eine gelartige Reaktionsoberfläche
-
- a) Auf einer festen Oberfläche (1) haftet ein Gel (2),
z.B. ein Polyacrylamidgel. An dessen kontinuierliche Oberfläche binden über an dem
Gel gebundene Gruppen (3) (z.B. Streptavidin oder Avidin) NSKFs
(4) mit einer funktionellen, zur Immobilisierung geeigneten Gruppe
(3), z.B. Biotin.
- b) Anordnung wie in 5b, jedoch
erfolgt die Bindung der NSKFs über
eine diskontinuierliche Oberfläche zusammengesetzt
aus einer Anzahl von Gelkügelchen
(5), z.B. Agarosekügelchen,
an die feste Oberfläche.
-
6: Beispiel
eines Durchflußsystems
-
Eine
gelartige Reaktionsoberfläche
(1) ist auf einer für
das Anregungs- und Fluoreszenzlicht durchlässigen festen Unterlage (2)
befestigt. Sie bildet zusammen den Deckel der Reaktionskammer (z.B.
Flow-Cell). Die Flüssigkeiten
in der Reaktionskammer können
kontrolliert ausgetauscht werden, wobei die Reaktionskammer zusammen
mit dem Vorratsbehälter
(3), der Pumpe (4) und dem Ventil (5) ein Durchflußsystem
bilden. Die Signale der in die auf der Reaktionsoberfläche gebundenen
NSKF-Primer-Hybridisierungsprodukte (hier nicht abgebildet) eingebauten
NT*s werden über
das zur Detektionsapparatur gehörende
Objektiv des Mikroskops (6) detektiert.
-
7: Allgemeine
Strukturen der NT* (markierte 2'-Deoxynukleosidtriphosphate)
-
- a) Schematische Darstellung der NT-Struktur
der Semitterminatoren, bei denen an der Base über einen spaltbaren Linker
(A-E) eine sterische Gruppe (D) und der Fluoreszenzmarker (F) gebunden
sind.
A,C,E – Verbindungselemente
im Linker; A – Linkerrest
nach der Spaltung; B – spaltbare
Verbindung/Gruppe; D – sterisch
anspruchsvolle, zur Termination führende Gruppe; F – Fluoreszenzfarbstoff
(Marker).
- b) Schematische Darstellung der NT-Struktur, bei welcher der
Fluoreszenzfarbstoff gleichzeitig die Funktion der sterisch anspruchsvollen
Gruppe übernimmt.
A,C – Linker;
A – Linkerrest
nach der Spaltung; B – spaltbare
Verbindung/Gruppe; D – sterisch
anspruchsvolle, zur Termination führende Gruppe; F – Fluoreszenzfarbstoff
(Marker).
- c) Schematische Darstellung der Struktur von eingebauten NT*s
nach dem Abspaltungsschritt. Dargestellt sind zwei NT*s mit dem
verbliebenen Linkerrest (A).
- d) Schematische Darstellung der NT-Struktur, bei welcher die
spaltbare Gruppe, die gleichzeitig die sterisch anspruchsvolle,
zur Termination führende
Gruppe ist, einen Teil des Linkers darstellt. Diese sterische Gruppe
kann eine photolabile Gruppe sein.
A,C – Linker; A – Linkerrest
nach der Spaltung; B – spaltbare
Verbindung/Gruppe; D – sterisch
anspruchsvolle, zur Termination führende Gruppe; F – Fluoreszenzfarbstoff
(Marker).
- e) Darstellung von bevorzugten NT-Strukturen, bei denen der
Linker an die 5-Position im Pyrimidinring gekoppelt ist (e-1: Uracil;
e-2: Cytosin).
- f) Darstellung weiterer bevorzugter NT-Strukturen, bei denen
der Linker an die 5-Position im Pyrimidinring angekoppelt ist (f-1
und f-2 jeweils Uracil; f-3 und f-4 jeweils Cytosin).
- g) Darstellung von bevorzugten NT-Strukturen, bei denen der
Linker an die 7-Position im Purinring gekoppelt ist (g-1: Adenin;
g-2: Guanin).
- h-j) Beispiele für
die Ankopplung von Farbstoffen an den Linker, der an die Base des
Nukleotid gekoppelt ist. (7h) dNTP-SS-TRITC; 7i) dNTP-SS-Cy3; 7j)
dNTP-SS-TRITC)
-
8 Beispiel
für eine
Detektionsvorrichtung
-
Dargestellt
ist eine Weitfeld-Optik-Detektionsvorrichtung mit einer Lichtquelle
zur Anregung der Fluoreszenz (1), einem lichtleitendem Teil (2),
einem Scanntisch (3), einer Vorrichtung zur Selektion der Spektren (4),
einer Detektionsvorrichtung (5), einem Computer mit Steuerungs-
und Analysefunktion (6) und einer Oberfläche mit immobilisierten NSFKs
(7), die nach dem Einbau von markierten NT*s abgescannt wird, wobei
die Fluoreszenzsignale von einzelnen, an die NTs gekoppelten Farbstoffmolekülen detektiert
werden.
-
- a) Schematische Darstellung eines Abschnittes
der Reaktionsoberfläche
(grau), der schrittweise abgescannt wird. Die Kreise entsprechen
jeweils der Aufnahme ei nes 2D-Bildes und repräsentieren die Flächen, von
denen die Fluoreszenzsignale detektiert werden.
- b) Darstellung einer Aufnahme (ein 2D-Bild) mit Fluoreszenzsignalen
der einzelnen, eingebauten NT*s. Es können pro Aufnahme mehrere Signale
(beispielsweise 100 bis 10.000) von einzelnen Molekülen gleichzeitig
registriert werden.
- c) Ausschnitt aus 8b. Der Ausschnitt
zeigt Signale von eingebauten NT*s. Jedem der identifizierten Signale
werden die entsprechenden X,Y-Koordinaten zugeordnet. Jedes Signal
besitzt charakteristische Eigenschaften und kann aufgrund dieser
identifiziert werden (vorzugsweise mit Hilfe eines Computerprogramms).
-
9: Sequenzierungsreaktion
auf zwei getrennten Oberflächen
-
Der
Durchsatz wird durch Verwendung von zwei getrennten Durchflußsystemen
(z.B. Flow-Cells (Mikroflüssigkeitskanäle, MFK))
erhöht.
Während
auf der einen Oberfläche
biochemische und chemische Reaktionen ablaufen, wird auf der anderen
die Detektion durchgeführt.
Anschließend
tauschen die Oberflächen
in den Flow-Cells ihre Positionen.
-
4. Detaillierte Beschreibung
-
Die
Abk. "M", "mM" und "μM" stehen für die Einheiten mol/l, mmol/l
bzw. μmol/l.
-
4.1 Allgemeine Prinzipien
der Reaktion
-
Im
folgenden sollen anhand der Sequenzierung eines mehrere Mb langen
DNA-Stückes
beispielhaft die allgemeinen Prinzipien der Reaktion dargestellt
werden (1). Der Sequenzierung und der
Rekonstruktion von Nukleinsäurensequenzen
liegt das Shotgun-Prinzip
zugrunde ("Automated
DNA sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S.868, Huang Genomics 1996 v. 33 S.21, Bonfield et
al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994
v. 1 S.257). Die Sequenz eines langen DNA-Stücks wird dabei durch die Sequenzierung
kleiner DNA-Fragmente und nachfolgender Rekonstruktion ermittelt.
Das zu analysierende Material (1) wird für die Sequenzierungsreaktion vorbereitet,
indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt
wird (2). Jedes Fragment wird anschließend mit einer Primerbindungsstelle
und einem Primer versehen (3). Dieses Gemisch aus verschiedenen
DNA-Fragmenten wird
nun auf einer planen Oberfläche
fixiert (4). Die nicht gebundenen DNA-Fragmente werden durch einen
Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an
der gesamten
-
Reaktionsoberfläche durchgeführt. Diese
Reaktion verläuft
zyklisch. Im 1. Schritt des Zyklus wird ein mit einem Fluoreszenzfarbstoff
markiertes NT* in den wachsenden Strang eingebaut: Dabei wird die
Reaktion so gesteuert, daß in
jedem Zyklus jeweils nur ein markiertes NT* von einer Polymerase
in den wachsenden Strang eingebaut werden kann. Das wird durch die
Verwendung von NTs* erreicht, die eine reversibel gekoppelte, zur
Termination führende
Gruppe tragen. Der Einbau eines weiteren markierten NT* wird dadurch
unmöglich
gemacht. Die Polymerase und die markierten NTs* werden gleichzeitig
in die Reaktion eigesetzt (5). Danach wird das Reaktionsgemisch
entfernt und die Oberfläche
in geeigneter Art und Weise gewaschen (6). Nun folgt ein Detektionsschritt
(7): Die Oberfläche
wird mit einer für
die Einzelmoleküldetektion
geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, Kamera,
Scantisch, Computer mit Steuerungs- und Bilderkennungs- bzw. Bildverarbeitungssoftware)
abgescannt und die Signale der einzelnen, eingebauten markierten NTs*
identifiziert. Nach dem Detektionsschritt wird die Markierung und
die zur Termination führende
Gruppe von allen eingebauten NTs* entfernt (8). Nach einem sich
anschließenden
Waschschritt kann ein neuer Zyklus beginnen. Zur Rekonstruktion
einer größeren ursprünglichen
DNA-Sequenz (z.B. mehrere Mb langes DNA-Stück)
sollen die DNA-Fragmente einige Hundert NT lang sein, falls man
die Rekonstruktion nach dem Shotgun-Prinzip durchführt ("Automated DNA sequencing
and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield
et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994
v. 1 S. 257). Da pro Zyklus nur jeweils ein markiertes NT* eingebaut
wird, sind mindestens 300 Zyklen zur Sequenzierung notwendig.
-
4.2 Auswahl des Materials
-
Mit
Hilfe der erfindungsgemäßen Methode
ist es möglich,
sowohl vorselektionierte DNA-Sequenzen (z.B. in YAC-, PAC-, oder
BAC-Vektoren (R.
Anand et al. NAR 1989 v. 17 S. 3425, H. Shizuya et al. PNAS 1992 v.
89 S. 8794, "Construction
of bacterial artificial chromosome libraries using the modified
PAC system" in "Current Protocols
in Human genetics" 1996
John Wiley & Sons
Inc.) klonierte Abschnitte eines Genoms) als auch nicht vorselektionierte
DNA (z.B. genomische DNA, cDNA-Gemische) zu analysieren. Durch eine
Vorselektion ist es möglich,
im Vorfeld relevante Informationen, wie z.B. Sequenz-Abschnitte
aus einem Genom oder Populationen an Genprodukten, aus der große Menge
genetischer Informationen herauszufiltern und damit die Menge der
zu analysierenden Sequenzen einzuschränken.
-
4.3 Vorbereitung des Materials
-
Ziel
der Materialvorbereitung ist es, immobilisierte einzelsträngige NSKFs
mit einer Länge
von vorzugsweise 50–1000
NTs, einer einzelnen Primerbindungsstelle und einem hybridisierten
Primer zu erhalten. Diese Fragmente haben vorzugsweise die in 2 dargestellte
Struktur. Im einzelnen können
sehr variable Konstruktionen aus dieser allgemeinen Struktur abgeleitet
werden. Zur Verbesserung der Anschaulichkeit folgen nun einige Beispiele,
wobei die angeführten
Methoden einzeln oder in Kombination eingesetzt werden können.
-
4.3.1 Erzeugung kurzer
Nukleinsäurekettenfragmente
(50–1000
NTs)
-
Wichtig
ist, daß die
Fragmentierung der NSKs so erfolgt, daß Fragmente erhalten werden,
die überlappende
Teilsequenzen der Gesamtsequenzen darstellen. Dies wird durch Verfahren
erreicht, bei denen unterschiedlich lange Fragmente als Spaltprodukte
in zufallsmäßiger Verteilung
entstehen.
-
Erfindungsgemäß kann die
Erzeugung der Nukleinsäurekettenfragmente
(NSKFs) durch mehrere Methoden erfolgen, z.B. durch die Fragmentierung
des Ausgangsmaterials mit Ultraschall oder durch Endonukleasen ("Molecular cloning" 1989 J. Sambrook
et al. Cold Spring Harbor Laborotary Press), wie z.B. durch unspezifische
Endonukleasegemische. Erfindungsgemäß wird die Ultraschall-Fragmentierung
bevorzugt. Man kann die Bedingungen so einstellen, daß Fragmente
mit einer durchschnittlichen Länge
von 100 bp bis 1 kb entstehen. Diese Fragmente werden anschließend an
ihren Enden durch das Klenow-Fragment (E.coli-Polymerase I) oder
durch die T4-DNA-Polymerase aufgefüllt ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring
Harbor Laborotary Press).
-
Ausserdem
können
aus einer langen NSK unter Verwendung randomisierter Primer komplementäre kurze
NSKFs synthetisiert werden. Besonders bevorzugt wird diese Methode
bei der Analyse der Gen-Sequenzen.
Dabei werden an der mRNA einzelsträngige DNA-Fragmente mit randomisierten
Primern und einer reversen Transkriptase gebildet (Zhang-J et al.
Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994
v. 269 S. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 S. 264,
Decraene et al. Biotechniques 1999 v. 27 S. 962).
-
4.3.2 Einführung einer
Primerbindungsstelle in das NSKF.
-
Die
Primerbindungsstelle ist ein Sequenzabschnitt, der eine selektive
Bindung des Primers an das NSKF ermöglichen soll.
-
Aus
Gründen
der Vereinfachung der Analyse ist es günstig, wenn eine möglichst
einheitliche Primerbindungsstelle in allen NSKFs vorhanden ist.
Gemäß einer
bevorzugten Ausführungsform
der Erfindung werden die Primerbindungsstellen daher in die NSKFs
extra eingeführt.
Auf diese Weise können
Primer mit einheitlicher Struktur für die Reaktion eingesetzt werden.
-
Die
Zusammensetzung der Primerbindungsstelle ist nicht eingeschränkt. Ihre
Länge beträgt vorzugsweise
zwischen 20 und 50 NTs. Die Primerbindungsstelle kann eine funktionelle
Gruppe zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe
kann z.B. eine Biotingruppe sein.
-
Als
Beispiel für
die Einführung
einer Primerbindungsstelle werden im folgenden die Ligation und
das Nukleotid-Tailing an DNA-Fragmente
beschrieben.
-
a) Ligation:
-
Dabei
wird ein doppelsträngiger
Oligonukleotidkomplex mit einer Primerbindungsstelle verwendet (3a). Dieser wird mit kommerziell erhältlichen
Ligasen an die DNA-Fragmente ligiert ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring
Harbor Laborotary Press). Es ist wichtig, daß nur eine einzige Primerbindungsstelle
an das DNA-Fragment ligiert wird. Das erreicht man z.B. durch eine
Modifikation einer Seite des Oligonukleotidkomplexes an beiden Strängen (3b). Die Resultate nach der Ligation bzw.
nach anschließender
Denaturierung sind in 3c und 3d dargestellt. Die modifizierenden Gruppen
am Oligonukleotidkompex können
zur Immobilisation dienen. Die Synthese und die Modifikation eines
solchen Oligonukleotidkomplexes kann nach standardisierten Vorschriften
durchgeführt
werden. Zur Synthese kann z.B. der DNA-Synthesizer 380 A Applied
Biosystems verwendet werden. Oligonucleotide mit einer bestimmten
Zusammensetzung mit oder ohne Modifikationen sind aber auch als
Auftragssynthese kommerziell erhältlich,
z.B. von MWG-Biotech GmbH, Germany.
-
b) Nukleotid-Tailing:
-
Statt
der Ligation mit einem Oligonukleotid kann man mit einer terminalen
Deoxynucleotidyltransferase mehrere (z.B. zwischen 10 und 20) Nukleosid-monophosphate
an das 3'-Ende eines
ss-DNA-Fragments
anknüpfen
("Molecular cloning" 1989 J. Sambrook
et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v. 303, S. 37–38) (4), z.B.
mehrere Guanosin-Monophosphate ((G)n-Tailing genannt). Das entstehende
Fragment wird zur Bindung des Primers, in diesem Beispiel eines
(C)n-Primers, verwendet.
-
4.3.3 Einzelstrang-Vorbereitung
-
Für die Sequenzierungsreaktion
werden einzelsträngige
NSKFs benötigt.
Falls das Ausgangsmaterial in doppelsträngiger Form vorliegt, gibt
es mehrere Möglichkeiten,
aus doppelsträngiger
DNA eine einzelsträngige
Form zu erzeugen (z.B. Hitze-Denaturierung oder Alkali-Denaturierung)
("Molecular cloning" 1989 J. Sambrook
et al. Cold Spring Harbor Laborotary Press).
-
4.3.4 Primer für die Sequenzierungsreaktion
-
Dieser
hat die Funktion, den Start an einer einzigen Stelle des NSKF zu
ermöglichen.
Vorzugsweise bindet er an die Primerbindungsstelle im NSKF. Die
Zusammensetzung und die Länge
des Primers sind nicht eingeschränkt.
Außer
der Startfunktion kann der Primer auch andere Funktionen übernehmen,
wie z.B. eine Verbindung zur Reaktionsoberfläche zu schaffen. Primer sollten
so an die Länge
und Zusammensetzung der Primerbindungsstelle angepaßt werden,
daß der
Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase
ermöglicht.
-
Vorzugsweise
beträgt
die Länge
des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und
30 NTs. Der Primer kann eine Funktionsgruppe tragen, die zur Immobilisierung
des NSKF dient, vorzugsweise ist eine solche Funktionsgruppe eine
Biotingruppe (s. Abschnitt Immobilisierung). Sie soll die Sequenzierung
nicht stören.
Die Synthese eines solchen Primers kann z.B. mit dem DNA-Synthesizer 380 A
Applied Biosystems ausgeführt
werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter,
z.B. MWG-Biotech
GmbH, Germany erstellt werden).
-
Der
Primer kann vor der Hybridisierung an die zu analysierenden Fragmente
auf der Oberfläche
mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert
werden (McGall et al. US Patent 5412087, Barrett et al. US Patent
5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton
Publishing, "DNA
Microarrays" 1999
M. Schena Oxfoxrd University Press, Fodor et al. Science 1991 v.
285 S. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v.
24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al.
NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).
-
Der
Primer oder das Primergemisch wird mit NSKFs unter Hybridisierungsbedingungen
inkubiert, die ihn selektiv an die Primerbindungsstelle des NSKF
binden lassen. Diese Primer-Hybridisierung kann vor, während oder
nach der Immobilisierung der NSKFs erfolgen. Die Optimierung der
Hybridisierungsbedingungen hängt von
der genauen Struktur der Primerbindungsstelle und des Primers ab
und läßt sich
nach Rychlik et al. NAR 1990 v. 18 S. 6409 berechnen. Im folgenden
werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen
bezeichnet.
-
Falls
eine für
alle NSKFs gemeinsame Primerbindungsstelle mit bekannter Struktur
durch Ligation eigeführt
wird, können
Primer mit einheitlicher Struktur eingesetzt werden. Die Primerbindungsstelle
kann an ihrem 3'-Ende
eine funktionelle Gruppe tragen, die z.B. zur Immobilisation dient.
Vorzugsweise ist diese Gruppe eine Biotin-Gruppe. Der Primer hat
eine zur Primerbindungsstelle komplementäre Struktur.
-
Ein
Beispiel einer Primerbindungstelle und eines Primers ist nachfolgend
dargestellt.
-
-
4.3.5 Immobilisation
-
Ziel
der Immobilisierung ist es, NSKFs auf einer geeigneten planen Oberfläche in einer
Art und Weise zu fixieren, daß eine
zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Oberfläche und
Reaktionsoberfläche
sind in dieser Anmeldung als gleichwertige Begriffe aufzufassen,
außer
wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient
die Oberfläche
einer festen Phase eines beliebigen Materials. Dieses Material ist
vorzugsweise enzymatischen Reaktionen gegenüber inert und verursacht keine
Störungen
der Detektion. Silicon, Glas, Keramik, Kunststoff (z.B. Polycarbonate
oder Polystyrole) oder beliebiges anderes Material, das diesen funktionalen
Anforderungen genügt,
kann verwendet werden. Vorzugsweise ist die Oberfläche nicht
verformbar, denn sonst ist mit einer Verzerrung der Signale bei
der wiederholten Detektion zu rechnen.
-
Falls
eine gelartige feste Phase verwendet wird, so kann dieses Gel z.B.
ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise
für Moleküle mit einer
Molekularmasse unter 5000 Da frei passierbar (beispielsweise kann
ein 1 bis 2% Agarose-Gel oder 10 bis 15% Polyacrylamid Gel verwendet
werden). Eine solche Geloberfläche
hat anderen festen Oberflächen
gegenüber
den Vorteil, daß die
markierten NSKFs im Gegensatz zu freien NTs* auf der Oberfläche festgehalten
werden. Durch die Immobilisation der NSKFs auf der Oberfläche ist
die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die
Signale von freien NTs* werden nicht detektiert, weil sie nicht
an das Material des Gels binden und somit nicht immobilisiert werden.
Das Gel ist vorzugsweise auf einer festen Unterlage befestigt (5a). Die Dicke des Gels beträgt vorzugsweise
nicht mehr als 0,1 mm. Die Geldicke muß jedoch größer als die einfache Tiefenschärfe des
Objektivs sein, damit unspezifisch an die feste Unterlage gebundene
NTs* nicht in die Fokusebene gelangen und damit detektiert werden.
Wenn die Tiefenschärfe
z.B. 0,3 μm
beträgt,
so liegt die Geldicke vorzugsweise zwischen 1 μm und 100 μm. Die Oberfläche kann
als eine kontinuierliche Oberfläche
oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen
(z.B. Agarose-Kügelchen)
zusammengesetzte Oberfläche
hergestellt werden (5b). Die Reaktionsoberfläche muß groß genug
sein, um die notwendige Anzahl der NSKFs bei entsprechender Dichte
immobilisieren zu können.
Die Reaktionsoberfläche
sollte vorzugsweise nicht größer als
20 cm2 sein.
-
Die
verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen
Reaktionslösungen über der
Oberfläche.
Die Reaktionsoberfläche
ist vorzugsweise Bestandteil eines Reaktionsgefäßes. Das Reaktionsgefäß ist wiederum
vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die
Durchflußvorrichtung
ermöglicht
einen Austausch der Lösungen
im Reaktionsgefäß. Der Austausch
kann mit einer durch einen Computer gesteuerten Pumpvorrichtung
oder manuell erfolgen. Wichtig dabei ist, daß die Oberfläche nicht
austrocknet. Vorzugsweise beträgt
das Volumen des Reaktionsgefäßes weniger
als 50 μl. Idealerweise
beträgt
sein Volumen weniger als 1 μl.
Ein Beispiel eines solchen Duchflußsystems ist in 6 gegeben.
-
Die
Immobilisierung der NSKFs erfolgt vorzugsweise an einem der beiden
Ketten-Enden. Dies kann durch entsprechende kovalente, affine oder
andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung
von Nukleinsäuren
bekannt (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287,
Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip
technology" 2000
M. Schena Eaton Publishing, "DNA
Microarrays" 1999
M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry
v. 198, S. 138, Allemand et al. Biophysical Journal 1997, v. 73,
S. 2064, Trabesinger et al. Analytical Chemistry 1999, v. 71, S.
279, Osborne et al. Analytical Chemistry 2000, v. 72, S. 3678, Timofeev
et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et
al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373,
Maskos et al. NAR 1992 v. 20 S.1679).
-
Die
NSKFs werden auf der Oberfläche
vorzugsweise in einer Dichte zwischen 10 und 100 NSKFs pro 100 μm2 immobilisiert. Beispielhaft werden im folgenden
zwei Methoden zur Immobilisierung näher dargestellt: In einer bevorzugten
Ausführungsform
erfolgt die Immobilisierung der NSKFs über Biotin-Avidin oder Biotin-Streptavidin-Bindung.
Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent
gebunden, das 5'-Ende
des Primers enthält
Biotin. Nach der Hybridisierung der markierten Primer mit den NSKFs
werden diese auf der mit Avidin/Streptavidin modifizierten Oberfläche fixiert.
Die Konzentration der mit Biotin markierten Hybridisierungs-Produkte
sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird
so gewählt,
daß eine
für die
Sequenzierung geeignete Dichte erreicht wird.
-
In
einer anderen bevorzugten Ausführungsform
werden die für
die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungsreaktion
auf der Oberfläche
mit geeigneten Methoden fixiert (s.o.). Die einzelsträngigen NSKFs
mit jeweils einer Primerbindungsstelle pro NSKF werden damit unter
Hybridisierungsbedingungen inkubiert. Dabei binden sie an die fixierten
Primer und werden dadurch immobilisiert. Die Konzentration der einzelsträngigen NSKFs
wird so gewählt,
daß man
eine für
die Sequenzie rung geeignete Immobilisationsdichte von 10 bis 100
NSKFs pro 100 μm2 erreicht. Nach der Immobilisierung werden
ungebundene NSKFs durch einen Waschschritt entfernt. Falls die Oberfläche einer
festen Phase (z.B. Silikon oder Glas) zur Immobilisation verwendet
wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor
dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer
unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen
für eine
Blockierlösung
erfüllt
beispielsweise eine Albuminlösung
(BSA) mit einem pH-Wert zwischen 8 und 10.
-
4.4 Wahl der Polymerase
-
Als
Polymerasen eignen sich prinzipiell alle DNA-abhängigen DNA-Polymerasen ohne 3'-5' Exonuklease-Aktivität (DNA-Replication" 1992 Ed. A. Kornberg,
Freeman and company NY), z.B. modifizierte T7-Polymerase vom Typ "Sequenase Version
2" (Amersham Pharmacia
Biotech), 3'-5' exonuklease freies
Klenow Fragment der DNA-Polymerase I (Amersham Pharmacia Biotech),
Polymerase Beta verschiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M., CRC
Press Inc., kommerziell erhältlich
bei Chimerx) thermostabile Polymerasen wie Taq-Polymerase (GibcoBRL),
proHATM Polymerase (Eurogentech).
-
Polymerasen
mit 3'-5' Exonuklease-Aktivität können eingesetzt
werden (z.B. Klenow-Fragment der E.coli-Polymerase I), sofern Reaktionsbedingungen
gewählt
werden, die vorhandene 3'-5' Exonuklease-Aktivität unterdrücken, wie
z.B. ein niedriger pH-Wert (pH 6.5) beim Klenow-Fragment (Lehman
and Richardson, J. Biol. Chem. 1964 v. 239 S. 233). Eine andere
Möglichkeit
besteht in der Verwendung von NTs* mit einer Phosphorothioate-Verbindung
(Kunkel et al. PNAS 1981, v. 78 S. 6734). Dabei werden eingebaute
NTs* von der 3'-5' Exonuklease-Aktivität der Polymerase
nicht angegriffen. Im folgenden werden all diese Polymerasearten
als "Polymerase" bezeichnet.
-
4.5 Chemie
-
4.5.1 Allgemeines Prinzip
-
Für die Sequenzierungsreaktion
ist wichtig, daß jedes
eingebaute NT* identifiziert wird. Eine Voraussetzung dafür ist, daß nur ein
einziges NT* pro Zyklus in die Nukleinsäurekette eingebaut wird. Falls
eine Polymerase mehrere NTs* nacheinander im selben Zyklus einbaut,
so führt
dies zu einem Fehler in der Sequenzermittlung. Aus diesem Grund
muß man
den Einbau der NTs* steuern. In diesem Zusammenhang sind verschiedene
Möglichkeiten
der Steuerung der enzymatischen Reaktion denkbar, wie z.B.
- 1) einzelne Zugabe von NT, so daß die Polymerase
nur einen einzigen Schritt macht und stoppt (Substrat Limitierung),
- 2) Änderungen
der äußeren Bedingungen
(Temperatur, pH, Salz usw.), so daß die Polymerasen ihre Funktion
anders ausüben
(s. Optimierung der Reaktionsbedingngen),
- 3) durch bestimmte kompetetive und nichtkompetetive Inhibitoren
(als Beispiel seien antivirale Medikamente genannt)
- 4) Durch bestimmte Mutationen und andere Veränderungen an der Polymerase
als solcher,
- 5) Durch die Struktur der NT. Diese Strukturänderungen können sein:
a) irreversibel
(wie z.B. bei dideoxyNTPs)
b) reversibel.
-
Vorzugsweise
erfolgt die Steuerung durch eine bestimmte Struktur der NTs*, wobei
reversible Strukturveränderungen
besonders bevorzugt sind. Die reversiblen Strukturveränderungen
erfolgen beispielsweise durch Anheftung eines sterisch anspruchsvollen
Liganden, d.h. eines Liganden, der die Polymerase vom Einbau eines
weiteren NT abhält.
Die Steuerung infolge einer sterischen Blockierung der enzymatischen
Reaktion durch reversible Semiterminatoren wird unten genauer beschrieben.
Gemäß einer
bevorzugten Ausführungsform
der Erfindung werden die Basen durch Ankopplung eines Fluoreszenzfarbstoffs
strukturell verändert
bzw. modifiziert.
-
Es
gibt mehrere prinzipielle Varianten der NT*-Struktur, die zur Behinderung
bzw. zum Stop der Extensionsreaktion führt: Z.B. wurden in der BASS-Methode
reversible 3'-OH
modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard
et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999,
v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et
al. Nucleosides & Nucleotides
1999, v. 18, S. 197). Die Spaltung soll dabei unter milden Bedingungen
photochemisch (Dower US Patent 5.547.839, Welch et al. Nucleosides & Nucleotides 1999,
v. 18, S. 197) oder chemisch (Canard et al. US Patent 5.798.210,
Rasolonjatovo Nucleosides & Nucleotides
1999, v. 18 S.1021) erfolgen.
-
Die
Synthese der 3'-OH-modifizierten
photochemisch spaltbaren NTs* ist sehr aufwendig. Die Polymerasen
weisen eine sehr unterschiedliche Affinität zu diesen Nukleotidanalogen
auf, so daß die
Nukleinsäuresynthese
sehr ungleichmäßig bzw.
an manchen DNA-Stellen
gar nicht abläuft
(Metzker et al. NAR 1994 v. 22 S. 4259, Welch et al. Nucleosides & Nucleotides 1999,
v. 18 S. 197). Aus diesem Grund eignen sich diese Analoga nur bedingt
für die
Sequenzierungsreaktion. Eine spaltbare 3'-Ester-Verknüpfung (Canard et al. US Patent 5.798.210)
kommt als Grundlage für
eine reversible Termination der Synthese auch nicht in Betracht.
Die meisten Polymerasen spalten bei Verfügbarkeit eines nächsten komplementären NT 3'-OH-Ester-Verbindungen,
so daß die
an die 3'-OH-Gruppe gebundene
Markierung in die Lösung
freigesetzt wird und nicht mehr als Terminator wirken kann (Rasolonjatovo
et al. Nucleosides & Nucleotides
1999, v. 18 S. 1021, Canard et al. PNAS 1995 v. 92 S. 10859). In
Positionen, an denen eine Polymerase mehrere gleiche NTs* nacheinander
einbauen kann, führt
das zu einem fehlerhaften Signal.
-
Erfindungsgemäß werden
für die
Sequenzierung NTs* mit einer sterisch anspruchsvollen Gruppe an der
Base verwendet. Eine an die Base. gekoppelte sterisch anspruchsvolle
Gruppe kann zur Behinderung der weiteren Synthese führen. Biotin,
Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine,
Cy3-Farbstoff stellen
Beispiele einer solchen sterisch anspruchs vollen Gruppe dar (Zhu
et al. Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22,
S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al.
Analytical Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques
1994 v. 16 S. 54). Die Polymerasen können zwar solche NTs* in größeren Abständen einbauen,
haben allerdings Schwierigkeiten, diese NTs* nacheinander einzubauen.
-
Bei
der Sequenzierungsreaktion im erfindungsgemäßen Verfahren werden markierte
NTs* mit einer Polymerase und Nukleinsäureketten inkubiert. Die NTs*
tragen dabei eine an die Base reversibel gekoppelte sterisch anspruchsvolle
Gruppe. Wenn ein Reaktionsgemisch, das nur modifizierte NTs* enthält, in der
Reaktion eingesetzt wird, dann kann die Polymerase nur ein einziges
NT* einbauen. Der Einbau eines nächsten
NT* wird sterisch gehemmt. Diese NTs* treten somit als Terminatoren
der Synthese auf. Nach der Entfernung der sterisch anspruchsvollen
Gruppe kann das nächste
komplementäre
NT* eingebaut werden. Weil diese NTs* kein absolutes Hindernis zur
weiteren Synthese darstellen, sondern nur für den Einbau eines weiteren
markierten NT*, werden sie als Semiterminatoren bezeichnet.
-
Der
Unterschied zur 3'-OH
Terminatoren-Methode besteht darin, daß nicht eine Blockade der für die Synthese
notwendigen 3'-OH
Gruppe angestrebt wird, sondern eine an die Base geknüpfte Gruppe
als sterisches Hindernis für
den weiteren Einbau genutzt wird. Die 3'-OH Gruppe bleibt dabei die ganze Zeit
frei.
-
4.5.2 Allgemeine Struktur
des NT*
-
Die
Semiterminatoren können
verschiedene Strukturen haben. Ihre gemeinsamen Merkmale sind in 7a dargestellt. Diese Struktur ist dadurch
charakterisiert, daß an
der Base über
einen spaltbaren Linker (A-E) eine sterische Gruppe (D) und der
Fluoreszenzmarker (F) gebunden sind.
-
Als
Grundlage für
die NTs* dienen Deoxynukleosid-Triphosphate mit Adenosin (A), Guanosin
(G), Cytidin (C) und Thymidin (T) als Nukleosidrest. Anstelle von
Thymidin wird bevorzugt Uridin als Nukleosidrest verwendet. Anstelle
von Guanosin kann Inosin verwendet werden.
-
4.5.3 Marker, Fluorophore
-
Jede
Base ist mit einem für
sie charakteristischen Marker (F) markiert (7). Der
Marker ist ein fluoreszierender Farbstoff. Mehrere Faktoren beeinflussen
die Wahl des Fluoreszenzfarbstoffes. Die Wahl ist nicht eingeschränkt, sofern
der Farbstoff folgenden Anforderungen genügt:
- a)
Die verwendete Detektionsapparatur muß diesen Marker als einziges
Molekül
gebunden an DNA unter milden Bedingungen (vorzugsweise Reaktionsbedingungen)
identifizieren können.
Die Farbstoffe haben vorzugsweise große Photostabilität. Ihre
Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich
gequencht.
- b) Der an das NT gebundene Farbstoff darf keine irreversible
Störung
der enzymatischen Reaktion verursachen.
- c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in
die Nukleinsäurekette
eingebaut werden.
- d) Bei einer Markierung mit verschiedenen Farbstoffen sollen
diese Farbstoffe keine beträchtlichen Überlappungen
in ihren Emissionsspektren aufweisen.
-
Im
Rahmen der vorliegenden Erfindung verwendbare Fluoreszenzfarbstoffe
sind in "Handbook
of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular
Probes mit Strukturformeln zusammengestellt. Erfindungsgemäß werden
vorzugsweise folgende Farbstoffklassen als Marker eingesetzt: Cyanin-Farbstoffe
und deren Abkömmlinge
(z.B. Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent
5.268.486), Rhodamine und deren Abkömmlinge (z.B. TAMRA, TRITC,
RG6, R110, ROX, Molecular Probes, s. Handbuch), Xanthene-Derivate
(z.B. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US-Patent
6.130.101). Diese Farbstoffe sind kommerziell erhältlich.
-
Dabei
kann man je nach spektralen Eigenschaften und vorhandener Apparatur
entsprechende Farbstoffe auswählen.
Die Farbstoffe werden an den Linker z.B. über Thiocyanat- oder Ester-Bindung
gekoppelt ("Handbook
of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular
Probes, Jameson et al. Methods in Enzymology 1997 v. 278 S. 363,
Waggoner Methods in Enzymology 1995 v. 246 S. 362), s. Beispiele
1 und 2.
-
4.5.4 Natur der sterisch
anspruchsvollen Gruppe
-
Die
Gruppe (D) (7) stellt ein Hindernis für den Einbau
eines weiteren komplementären
markierten NT* durch eine Polymerase dar. Biotin, Digoxigenin und
Fluoreszenzfarbstoffe stellen Beispiele einer solchen sterisch anspruchsvollen
Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S.206, Zhu et al.
NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513,
Wiemann et l1. Analytical Biochemistry 1996, v. 234, S. 166, Heer
et al. BioTechniques 1994 v. 16 S. 54). Die chemische Struktur dieser
Gruppe ist nicht eingeschränkt, sofern
sie den Einbau des markierten NT*, an das sie geknüpft ist,
nicht wesentlich stört
und keine irreversible Störung
der enzymatischen Reaktion verursacht.
-
Diese
Gruppe kann als selbständiger
Teil im Linker (7a) auftreten oder mit dem Farbstoff (7b) oder der spaltbaren
Gruppe (7d) identisch sein. Durch die Spaltung des Linkers wird
diese sterisch anspruchsvolle Gruppe (D) nach der Detektion des
Signals entfernt, so daß die
Polymerase ein weiteres markiertes NT* einbauen kann. Bei einer
Struktur wie in 7d wird die sterische Gruppe durch die Spaltung
beseitigt.
-
In
einer bevorzugten Ausführungsform übernimmt
der Fluoreszenzfarbstoff die Funktion einer solchen sterisch anspruchsvollen
Gruppe, so daß ein
markiertes Nukleotid eine in 7b dargestellte
Struktur aufweist.
-
In
einer anderen bevorzugten Ausführungsform übernimmt
die photolabile spaltbare Gruppe die Funktion einer solchen sterisch
anspruchsvollen Gruppe (7d).
-
4.5.5 Linker
-
Der
Marker ist an die Base vorzugsweise über einen Abstandhalter unterschiedlicher
Länge;
einen sog. Linker, gebunden. Beispiele für Linker sind in 7e, f, h, i, j gegeben. Vorzugsweise ist
dieser Linker an einer der Stellen an die Base gebunden, die nicht
an der Basenpaarung teilnimmt. Im bevorzugten Fall sind die Stellen,
an die der Linker gebunden ist: die 5-Position im Pyrimidinring
und die 7-Position im Purinring. Beispiele der Ankoppelung eines
Linkers an die Base können
aus folgenden Quellen entnommen werden (Hobbs et al. US. Patent
5.047.519, Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology
1996 v. 274, S. 403, Zhu et al. NAR 1994 v. 22 S. 3418, Herman et
al. Methods in Enzymology 1990 v. 184 S. 584).
-
Die
gesamte Länge
des Linkers kann variieren. Sie entspricht der Anzahl der Kohlenstoff-Atome
in den Abschnitten A, C, E und liegt vorzugsweise zwischen 3 und
20. Optimalerweise beträgt
sie zwischen 4 und 10 Atomen. Die chemische Zusammensetzung des
Linkers (Abschnitte A,C,E in 7a) ist
nicht eingeschränkt, sofern
sie unter Reaktionsbedingungen stabil bleibt und keine Störung der
enzymatischen Reaktion verursacht.
-
4.5.6 Spaltbare Verbindung,
Spaltung
-
Der
Linker trägt
eine spaltbare Verbindung oder spaltbare Gruppe (B). Diese spaltbare
Verbindung ermöglicht
die Entfernung des Markers und des sterischen Hindernisses am Ende
jedes Zyklus. Ihre Wahl ist nicht eingeschränkt, sofern sie unter den Bedingungen
der enzymatischen Sequenzierungsreaktion stabil bleibt, keine irreversible
Störung
der Polymerase verursacht und unter milden Bedingungen abgespalten
werden kann. Unter "milden
Bedingungen" sind
solche Bedingungen zu verstehen, die den NSKF-Primer-Komplex nicht zerstören, wobei
z.B. der pH-Wert vorzugs weise zwischen 3 und 11 liegt, die Temperatur
zwischen 0°C und
einem Temperaturwert (x). Dieser Temperaturwert (x) hängt von
der Tm des NSKF-Primer-Komplexes (Tm ist "melting Point") und wird als Tm (NSKF-Primer-Komplex)
minus 5°C
errechnet (z.B. Tm ist 47°C,
dann liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen
eignen sich besonders Disulfid-Verbindungen und photolabile Verbindungen
als spaltbare Verbindungen).
-
Vorzugsweise
gehört
die genannte Verbindung zu chemisch oder enzymatisch spaltbaren
oder photolabilen Verbindungen. Als Beispiele von chemisch spaltbaren
Gruppen sind Ester- und Disulfid-Verbindungen bevorzugt (Herman
et al. Method in Enzymology 1990 v. 184 S.584, Lomant et al. J.
Mol. Biol. 1976 v. 104 243, "Chemistry
of carboxylic acid and esters" S.
Patai 1969 Interscience Publ.). Beispiele für photolabile Verbindungen
können
in folgenden Literaturstellen gefunden werden: "Protective groups in organic synthesis" 1991 John Wiley & Sons, Inc., V.
Pillai Synthesis 1980 S. 1, V. Pillai Org. Photochem. 1987 v. 9
S. 225.
-
Die
Position der spaltbaren Verbindung/Gruppe im Linker ist vorzugsweise
nicht weiter als 10 Atome von der Base entfernt, noch bevorzugter
nicht weiter als 3 Atome. Besonders bevorzugt liegt die spaltbare
Verbindung oder Gruppe direkt an der Base.
-
Der
Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vorhanden
und muß unter
milden Bedingungen (s.o.) verlaufen, so daß die Nukleinsäuren nicht
beschädigt
oder modifiziert werden.
-
Die
Spaltung läuft
bevorzugt chemisch (z.B. in milder saurer oder basischer Umgebung
für eine
Ester-Verbindung oder durch Zugabe eines Reduktionsmittel, z.B.
Dithiothreitol (Sigma) bei der Spaltung einer Disulfid-Verbindung),
siehe Beispiel 1, oder physikalisch (z.B. durch Beleuchtung der
Oberfläche
mit Licht einer bestimmten Wellenlänge für die Spaltung einer photolabilen
Gruppe) ab.
-
Nach
der Spaltung verbleibt an der Base ein Linkerrest (A) (7c).
-
Die
Synthese eines spaltbaren Linkers wird an Beispielen gezeigt (vgl.
Beispiele 1 und 2).
-
4.5.7 Kombination von
Polymerase und NT*
-
Insgesamt
spielen die Größe, die
Ladung und die chemische Struktur des Markers, die Länge des spaltbaren
Linkers und des Linker-Rests
sowie auch die Wahl der Polymerase eine wichtige Rolle. Sie bestimmen
gemeinsam, ob das markierte NT* durch die Polymerase in die wachsende
Nukleinsäurekette
eingebaut wird, und ob dadurch der Einbau des nächsten markierten NT* verhindert
wird. Zwei Bedingungen sind dabei besonders zu berücksichtigen:
Einerseits
ist es wichtig, daß die
Polymerase die Nukleinsäurekette
mit dem eingebauten modifizierten NT* nach der Spaltung des Linkers
weiter verlängern
kann. Es ist also wichtig, daß der
Linkerrest "A" (7c)
nach der Spaltung keine wesentliche Störung für die weitere Synthese darstellt.
Andererseits müssen
eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es können viele
für die
Reaktion geeignete NTs* synthetisiert werden. Im einzelnen muß für jede Kombination
aus Polymerase und NTs* eine Vorversuchsreihe durchgeführt werden,
in der die Tauglichkeit eines bestimmten NT*-Typs für die Sequenzierung
erprobt wird.
-
Die
Pufferbedingungen werden nach Angaben des Polymeraseherstellers
gewählt.
Die Reaktionstemperatur wird für
nicht thermostabile Polymerasen nach Angaben des Herstellers gewählt (z.B.
37°C für Sequenase
Version 2), für
thermostabile Polymerasen (z.B. Taq-Polymerase) beträgt die Reaktionstemperatur
maximal den Temperaturwert (x). Dieser Temperaturwert (x) hängt von
der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex)
minus 5°C
errechnet (z.B. Tm ist 47°C,
dann liegt die maximale Reaktionstemperatur bei 42°C). Diese
Pufferbedingungen und Reaktionstemperatur werden weiter als "optimale Puffer-
und Temperaturbedingungen" bezeichnet.
-
Die
Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in einem
Zyklus) beträgt
vorzugsweise weniger als eine Stunde, Idealerweise liegt die Reaktionszeit
zwischen 10 sec und 10 min.
-
Als
Beispiele von geeigneten Kombinationen zwischen NT* und Polymerase
sind folgende Kombinationen zu nennen:
- a) NT*
mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, 7e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3
(L11) in Kombination mit Sequenase Version 2, Taq-Polymerase (GibcoBRL), ProHA-DNA-Polymerase (Eurogentec)
oder DNA-Polymerase Beta aus Säugetieren
(Chimerx).
- b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel
1, 7f, g, j): dNTP-SS-TRITC (L14)
in Kombination mit Sequenase Version 2 oder oder ProHATM-Polymerase
(Eurogentech).
-
Die
Tauglichkeit eines Linkerrests an der Base (A) für die Reaktion kann man in
einem Testsystem prüfen.
Dabei werden gespaltene NTs* in eine Nukleinsäurekette nacheinander einbaut.
Man verwendet z.B. dUTP* mit dem gewünschten gespaltenen Linkerrest,
poly-dA als Matrize, Oligo-dT20-Primer, die gewünschte Polymerase und führt unter
für die
jeweilige Polymerase geeigneten optimalen Puffer- und Temperaturbedingungen
eine Reaktion durch. Die NT*-Konzentration
liegt vorzugsweise zwischen 5 μM
und 200 μM.
Nach der Reaktion wird die Anzahl der in die Nukleinsäurekette
eingebauten NTs* analysiert, z.B. durch die Auftrennung der Länge nach
in einem Gel. Für
die Rückschlüsse auf
die Tauglichkeit des Linkerrests kann man folgende Angaben verwenden:
Wenn die Polymerase mehr als 20 NTs* einbauen kann, so ist dieser
Linkerrest für
eine Sequenzierungsreaktion geeignet. Beim Einbau von weniger als
20 gespaltenen NTs* ist diese Kombination aus NT* und Polymerase
nicht optimal für
die Sequenzierungsreaktion.
-
Wenn
ein passender Linkerrest feststeht, muß man in einem weiteren Testsystem
prüfen,
ob die markierten, nicht gespaltenen NTs* als Semiterminatoren funktionieren.
Das wird geprüft,
indem die markierten NTs* unter für die Reaktion geeigneten optimalen
Puffer- und Temperaturbedingungen mit der Polymerase und einer Matrize
inkubiert werden. Die NT*-Konzentration liegt vorzugsweise zwischen
5 μM und
200 μM.
Die Matrize ist so zu wählen,
daß der
Einbau mehrerer NTs* nacheinander zu erwarten wäre, z.B. für dUTP* kann man polydA, wie
im oben dargestellten Beispiel verwenden. Idealerweise baut die
Polymerase nur ein einziges NT* ein.
-
Falls
bei gegebenen optimalen Puffer- und Temperaturbedingungen durch
eine Polymerase mehrere NTs* nacheinander eingebaut werden, kann
man die Reaktionsparameter (z.B. NT*-Konzentration, Reaktionstemperatur)
verändern
und der jeweiligen Kombination aus Polymerase und NT* anpassen.
Das wichtigste dabei ist, daß die
Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen
10 sec und 10 min) ein zweites NT* nicht einbaut.
-
Erfindungsgemäß erfolgt
diese Anpassung in einer Ausführungsform
durch die Veränderung
der Reaktionstemperatur. Die anderen Parameter der Reaktion werden
dabei konstant gehalten.
-
Als
Polymerasen werden beipielsweise Polymerasen verwendet, die Polymerasen
ohne 3'-5'-Endonukleaseaktivität sind,
vorzugsweise aus der Gruppe bestehend aus viralen Polymerasen vom
Sequenase-Typ, Beta-Polymerasen
aus Eukaryonten, und thermostabilen Polymerasen. Insbesondere kommen
Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder
ProHATM-Polymerase in Betracht.
-
Die
NT*-Konzentration liegt bei diesen Experimenten üblicherweise zwischen 5 μM und 200 μM, vorzugsweise
zwischen 10 und 100 μM.
Die Konzentration der Polymerase und die Pufferbedingungen werden nach
Angaben vom Hersteller gewählt.
Die Dauer der Reaktion kann variieren und liegt vorzugsweise zwischen
10 sec und 10 min, was der Dauer des Einbau-Schrittes (a) in einem
Zyklus entsprechen würde.
Bei nicht thermostabilen Polymerasen wie z.B. Sequenase Version
2 (Amersham Pharmacia Biotech), exonuclease free Klenow-Fragment der DNA
Polymerase I (Amersham Pharmacia Biotech) wird die Reaktionsthemperatur
von konventionellen 37°C
vorzugsweise auf 20°C
bis 30°C
reduziert. Bei thermostabilen Polymerasen wie z.B. Taq-Polymerase
(GibcoBRL), ProHATM-Polymerase (Eurogentech) wird die Reaktionstemperatur
von konventionellen 70–75°C vorzugsweise
auf Werte reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen.
Dieser Temperaturwert (x) hängt
von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet
(z.B. Tm ist 47°C,
dann liegt der Temperaturwert (x) bei 42°C).
-
In
einer anderen bevorzugten Ausführungsform
der Erfindung erfolgt die Anpassung der Reaktionsbedingungen durch
die Verminderung der NT*-Konzentration auf unter 5 μM, die anderen
Parameter der Reaktion (Pufferbedingungen, Temperaturbedingungen)
werden konstant gehalten. Die Konzentration der NT* liegt vorzugsweise
bei dieser Anpassung zwischen 0,5 und 5 μM. Die Dauer der Reaktion liegt
zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*-Konzentration
ist, daß die
Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen
10 sec und 10 min) ein zweites NT* nicht einbaut.
-
Nach
Optimierung der Reaktionsbedingungen für den Einbau eines einzelnen
NT* muß man
die Reaktion mit gespaltenen NTs* wiederholen. Unter entsprechend
geänderten
Reaktionsparameter muß Polymerase
die gespaltenen NTs* nacheinander einbauen können.
-
Die
Optimierungsreaktion korreliert mit dem Einbauschritt, Schritt (b),
in einem Zyklus. Die für
die Optimierungsreaktion ermittelten Bedingungen, die Temperatur,
die Konzentration an NT*, die Pufferbedingungen, die Dauer der Reaktion
werden für
die Reaktion auf der Oberfläche übernommen.
-
Unter
diesen Reaktionsbedingungen erfolgt der Einbau von NT* in die NSKFs
vorzugsweise so, daß an
mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs
in einem Zyklus ein markiertes NT* eingebaut wird, vorzugsweise
an mehr als 90%. Das hängt
damit zusammen, daß an
manchen Nukleinsäureketten.
die Reaktion sehr langsam abläuft.
Ein Einbau der NTs* an jeder komplementären Position in jedem Zyklus
wird angestrebt, ist aber nicht erforderlich, weil nur die erfolgreichen
Einbaureaktionen detektiert und ausgewertet werden; eine verzögerte Reation
im Nachfolgenden Zyklus führt
nicht zu einem Sequenzierungsfehler.
-
Vorzugsweise
wird für
alle NTs* dieselbe Polymerase verwendet. Es können aber auch verschiedene Polymerasen
für verschiedene
NTs* eingesetzt werden.
-
4.5.8 Farbiges Kodierungsschema,
Anzahl der Farbstoffe
-
Einen
Zyklus kann man durchführen
mit:
- a) vier verschieden markierten NT*s
- b) zwei verschieden markierten NT*s
- c) einem markierten NT*
- d)zwei verschieden markierten NT*s und zwei unmarkierten NTs,
d.h.
- a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren
und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht
man die Sequenzierung einer Nukleinsäurekette mit einer minimalen
Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings
hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe
müssen
in jedem Zyklus identifiziert werden.
- b) Zur Vereinfachung der Detektion kann eine Markierung mit
zwei Farbstoffen gewählt
werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden
markiert sind, z.B. A und G tragen die Markierung "X", C und U tragen die Markierung "Y". In die Reaktion in einem Zyklus (n)
werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt,
z.B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n
+ 1) werden dann U* und G* zugegeben.
- c) Man kann auch nur einen einzigen Farbstoff zur Markierung
aller 4 NTs* verwenden und pro Zyklus nur ein NT* einsetzen.
- d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus
zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte
NTs (sogen. 2NT*s/2NTs-Methode). Diese Ausführungsform kann verwendet werden,
um Varianten (z.B. Mutationen, oder alternativ gespleißte Gene)
einer bereits bekannten Sequenz zu ermitteln.
-
4.6 Detektionsapparatur
-
Einzelne
Moleküle
auf einer Oberfläche
kann man mit verschiedenen Methoden untersuchen. Es sind mehrere
Verfahren bekannt: z.B. AtomForce-Mikroscopie, Elektronen-Mikroskopie,
Nahfeld-Fluoreszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie,
TIR-Mikroskopie
usw. (Science 1999 v. 283 1667, Unger et al. BioTechniques 1999
v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S.161, Dickson et
al. Science 1996 v. 274 S. 966, Xie et al. Science 1994 v. 265 S.
361, Nie et al. Science 1994 v. 266 S. 1018, Betzig et al. Science
1993 v. 262 S. 1422).
-
Erfindungsgemäß werden
Fluoreszenz-Signale einzelner in die Nukleinsäurekette eingebauter NTs* vorzugsweise
mit einem Weitfeld-Fluoreszenz-Mikroskop oder einem Laser-Scanning-Mikroskop oder einem TIRF-Microskop
(Total Internal Reflection Fluorescence Microscope).
-
Es
sind verschiedene Varianten der Konstruktion einer solchen Apparatur
möglich
(Weston et al. J. Chem. Phys. 1998 v. 109 S.7474, Trabesinger et
al. Anal Chem. 1999 v. 71 S. 279, Adachi et al. Journal of Microscopy
1999 v. 195 S.125, Unger et al. BioTechniques 1999 v. 27 S. 1008,
Ishijaima et al. Cell 1998 v. 92 S. 161, Dickson et al. Science
1996 v. 274 S. 966, Tokunaga et al. Bichem. Biophys. Res. Com.
1997 v. 235 S. 47, "Confocal
Laser Scanning Microscopy" 1997
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy
and microspectroscopy" 1991
Ed. R. Cherry CRC Press, Inc., "Fluorescence
microscopy" 1998
2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum
Press ). Unterschiede in ihrem konkreten Aufbau ergeben sich aus
der Variation ihrer Einzelteile. Die Vorrichtung für das Anregungslicht
kann z.B. auf der Basis eines Lasers, einer Lampe oder von Dioden
funktionieren. Für
die Detektionsvorrichtung können
sowohl CCD-Kameras als auch PMT dienen. Andere Beispiele für technische
Details siehe ("Confocal
Laser Scanning Microscopy" 1997
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy
and microspectroscopy" 1991
Ed. R. Cherry CRC Press, Inc., "Fluorescence
microscopy" 1998
2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum
Press). Es ist nicht die Aufgabe dieser Erfindung, alle möglichen
technischen Varianten einer Detektionsvorrichtung aufzuzählen. Der
prinzipielle Aufbau einer geeigneten Apparatur wird in einem Schema 8 erläutert. Sie
besteht aus folgenden Elementen:
Lichtquelle zur Anregung der
Fluoreszenz (1)
Lichtleitender Teil (2)
Scantisch (3)
Vorrichtung
zur Selektion von Spektren (4)
Detektionsvorrichtung (5)
Computer
mit Steuerungs- und Analysefunktionen (6)
-
Diese
Elemente der Apparatur können
kommerziell erworben werden (Mikroskop-Firmen: Zeiss, Leica, Nikon).
-
Im
folgenden soll beispielsweise eine für die Detektion einzelner Moleküle geeignete
Kombination aus diesen Elementen vorgestellt werden:
Weitfeld-Fluoreszenz-Mikroskop
Axioplan 2 (Zeiss) mit Quecksilberdampflampe
Objektiv Planneofluar
100x, NA 1.4 (Zeiss)
Kamera Photometrix
Computer mit Software
zur Steuerung und Analyse
-
Nachfolgend
soll die Vorgehensweise bei der Detektion erläutert werden. Man beachte dabei
die allgemeinen Regeln der Fluoreszezmikroskopie ("Confocal Laser Scanning
Microscopy" 1997
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy
and microspectroscopy" 1991
Ed. R. Cherry CRC Press, Inc., "Fluorescence
microscopy" 1998
2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum
Press).
-
Die
Detektion umfaßt
folgende Phasen:
- 1) Vorbereitung zur Detektion
- 2) Durchführung
eines Detektionsschrittes in jedem Zyklus, wobei jeder Detektionsschritt
als Scanvorgang abläuft
und folgende Operationen umfaßt:
a)
Einstellung der Position des Objektivs (X,Y-Achse),
b) Einstellung
der Fokusebene (Z-Achse),
c) Detektion der Signale einzelner
Moleküle,
Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen
NSKF,
d) Verschiebung zur nächsten
Position auf der Oberfläche.
-
Die
Signale von in die NSKFs eingebauten NTs* werden durch das Abscannen
der Oberfläche
registriert. Der Scanvorgang kann in verschiedener Weise ausgeführt werden
("Confocal Laser
Scanning Microscopy" 1997
Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy
and microspectroscopy" 1991
Ed. R. Cherry CRC Press, Inc., "Fluorescence
microscopy" 1998
2.ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum
Press). Vorzugsweise wird ein diskontinuierlicher Scanvorgang gewählt. Dabei
wird das Objektiv schrittweise über
die Oberfläche
bewegt (8a), so daß von jeder Oberflächenposition
ein zweidimensionales Bild (2D-Bild)
entsteht (8b, c).
-
Dieses
2D-Bild kann mit verschiedenen Methoden erstellt werden: z.B. durch
den Laser-Scan einer Position des Mikroskopfeldes (Laser-Scanning-Microskopie)
oder durch eine Kameraaufnahme an einer Position (vgl. Handbücher der
Mikroskopie). Als Beispiel wird die Detektion einzelner Moleküle mit einer
CCD-Kamera beschrieben.
-
Die
Detektion wird am Beispiel der Sequenzierung eines 1 Mb langen DNA-Stücks erläutert:
-
1) Vorbereitung zur Detektion:
-
Am
Anfang wird festgelegt, wie viele NSKFs zur Rekonstruktion der ursprünglichen
Sequenz analysiert werden müssen.
Im Fall einer Rekonstruktion nach dem Schrotschuß-Verfahren ("Automated DNA sequencing
and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield
et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994
v. 1 S. 257) spielen folgende Faktoren eine Rolle: 1) Von jedem
NSKF wird bei der Sequenzierung eine Sequenz von ca. 300–500 NTs
bestimmt. 2) Die Gesamtlänge
der zu analysierenden Sequenz ist wichtig. 3) Bei der Sequenzierung
muß ein
bestimmtes Maß an
Redundanz erreicht werden, um die Genauigkeit zu steigern und eventuelle
Fehler zu korrigieren. Insgesamt ist zur Rekonstruktion des größten Teils
der ursprünglichen
Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich,
d.h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb Rohsequenzdaten
gebraucht. Bei einer durchschnittlichen Sequenzlänge von 400 bp pro NSKF benötigt man
entsprechend 25.000 bis 250.000 DNA-Fragmente.
-
2) Durchführung eines
Detektionsschrittes in jedem Zyklus
-
Zur
Sequenzierung müssen
die Positionen der NSKFs bestimmt werden, damit man eine Grundlage für die Zuordnung
der Signale hat. Die Kenntnis dieser Positionen erlaubt eine Aussage
darüber,
ob die Signale einzelner Moleküle
von eingebauten NTs* stammen oder von zufällig an die Oberfläche gebundenen
NTs*. Diese Positionen können
mit verschiedenen Methoden identifiziert werden.
-
In
einer bevorzugten Ausführungsform
werden die Positionen immobilisierter NSKF während der Sequenzierung identifiziert.
Dabei wird die Tatsache genutzt, daß die Signale von den in die
Nukleinsäurekette eingebauten
NTs* immer dieselben Koordinaten haben. Das ist durch die Fixierung
der Nukleinsäureketten
gewährleistet.
Die unspezifisch gebundenen NTs* binden zufällig an verschieden Stellen
der Oberfläche.
-
Zur
Identifizierung der Positionen von fixierten NSKFs werden die Signale
auf Übereinstimmung
ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen überprüft. Das
kann z.B. am Anfang der Sequenzierung erfolgen. Die übereinstimmende
Koordinaten werden als Koordinaten der DNA-Fragmente bewertet und gespeichert.
-
Das
Scan-System muß reproduzierbar über mehrere
Zyklen die Oberfläche
abscannen können.
X,Y und Z-Achsen-Einstellungen an jeder Oberflächenposition können von
einem Computer kontrolliert werden. Stabilität und Reproduzierbarkeit der
Einstellung von Objektivpositionen in jedem Scanvorgang entscheiden über die
Qualität
der Detektion und somit über
die Identifizierung der Signale einzelner Moleküle.
-
a.) Einstellung der Position
des Objektivs (X,Y-Achse)
-
Die
mechanische Instabilität
der kommerziell erhältlichen
Scantische und die geringe Reproduzierbarkeit der wiederholten Einstellung
derselben X,Y-Positionen machen eine präzise Analysen der Signale einzelner
Moleküle über mehrere
Zyklen schwierig. Es existieren viele Möglichkeiten, eine Übereinstimmung
der Koordinaten bei wiederholten Einstellungen zu verbessern bzw.
mögliche
Abweichungen zu kontrollieren. Als Beispiel wird eine Kontrollmöglichkeit
angeführt.
Nach einer groben mechanischen Einstellung der Objektivposition
wird ein Kontrollbild von einem mit der Oberfläche fest verbundenen Muster
gemacht. Auch wenn die mechanische Einstellung nicht exakt dieselben
Koordinaten aufweist (Abweichungen bis zu 10 μm sind durchaus möglich),
kann man mittels optischer Kontrolle eine Korrektur vornehmen. Das Kontrollbild
vom Muster dient als Koordinatensystem für das Bild mit Signalen von
eingebauten NTs*. Eine Voraussetzung für eine solche Korrektur ist,
daß keine
weiteren Bewegungen der Oberfläche
zwischen diesen beiden Aufnahmen gemacht werden. Signale von einzelnen
Molekülen
werden in Relation zum Muster gesetzt, so daß eine X,Y-Abweichung in der
Musterposition gleiche X,Y-Abweichung
in der Position der Signale einzelner Moleküle bedeutet. Das Kontrollbild
vom Muster kann vor, während
oder nach der Detektion einzelner Moleküle gemacht werden. Ein solches
Kontrollbild muß entsprechend
bei jeder Einstellung auf einer neuen Oberflächenposition gemacht werden.
-
b) Einstellung der Fokusebene
(Z-Achse)
-
Die
Oberfläche
ist nicht absolut plan und weist verschiedene Unebenheiten auf.
Dadurch verändert sich
der Oberfläche-Objektiv-Abstand beim abscannen
benachbarter Stellen. Diese Unterschiede im Abstand können dazu
führen,
daß einzelne
Moleküle
die Fokusebene verlassen und so der Detektion entgehen.
-
Aus
diesem Grund ist es wichtig, daß beim
Abscannen der Oberfläche
eine reproduzierbare Einstellung der Fokusebene an jeder Objektivposition
erreicht wird.
-
Es
gibt verschiedene Möglichkeiten,
die Fokusebene reproduzierbar einzustellen. Beispielsweise kann
folgende Methode angewendet werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer
Fluoreszenz führen
kann, wird auf die Oberfläche
ein Marker aufgebracht, der zur Einstellung der Fokusebene dient.
Danach erfolgt die Detektion der Signale einzelner Moleküle. Der
Marker kann beliebiger Natur sein (z.B. Farbstoff oder Muster),
darf aber die Detektion und die Reaktion nicht beeinträchtigen.
-
c) Detektion der Signale
einzelner Moleküle,
Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen
NSKF.
-
Das
mit Hilfe des Detektionssystems erzeugte zweidimensionale Bild der
Reaktionsoberfläche
enthält die
Signalinformationen von in die NSKFs eingebauten NT*s. Diese müssen vor
der weiteren Verarbeitung aus der Gesamtdatenmenge der Bildinformationen
mit geeigneten Methoden extrahiert werden. Die dazu notwendigen
Algorithmen zur Skalierung, Transformation und Filterung der Bildinformationen
zählen
zum Standardrepertoir der digitalen Bildverarbeitung und Mustererkennung
(Haberäcker
P. "Praxis der Digitalen
Bildverarbeitung und Mustererkennung". Hanser-Verlag, München, Wien, 1995; Galbiati
L. J. "Machine vision
and digital image processing fundamentals". Prentice Hall, Englewood Cliffs, New
Jersey, 1990). Die Signalextraktion erfolgt vorzugsweise über ein
Grauwertbild, das die Helligkeitsverteilung der Reaktionsoberfläche für den jeweiligen
Fluoreszenzkanal abbildet. Wenn bei der Sequenzierungsreaktion mehrere
Nukleotide mit unterschiedlichen Fluoreszenz-Farbstoffen verwendet
werden, kann zunächst
für jedes
verwendete fluoreszenzmarkierte Nukleotid (A,T,C,G oder U) ein separates
Grauwert-Bild erzeugt werden. Dafür können prinzipiell 2 Verfahren angewendet
werden:
- 1. Durch Verwendung von geeigneten
Filtern (Zeiss-Filtersätze)
wird für
jeden Fluoreszenzkanal ein Grauwertbild erzeugt.
- 2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe
eines geeigneten Algorithmus durch ein Bildverarbeitungsprogramm
die relevanten Farbkanäle
extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet.
Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer
Farb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus
einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese
Bilder definieren sich wie folgt:
GBN =
(s(x,y)) einkanaliges Grauwertbild
N = {1, ..., Anzahl der
Fluoreszenzkanäle}.
M
= {0,1, ..., 255} Grauwertmenge
S = (s(x,y)) Bildmatrix des
Grauwertbildes
x = 0, 1, ..., L-1 Bildzeilen
y = 0, 1,
..., R-1 Bildspalten
(x,y) Ortskoordinaten eines Bildpunktes
s(x,y) ∊ M
Grauwert des Bildpunktes.
-
Aus
dieser Datenmenge wird nun durch ein geeignetes Programm die relevante
Bildinformation extrahiert. Ein solches Programm sollte folgende
Arbeitsschritte realisieren:
Für GB1 bis
GBN durchführen:
- I.
Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion
des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens,
etwa durch Grauwertglättung.
- II. Prüfung
jedes Bildpunkt (x,y) des Grauwertbildes, ob dieser Punkt im Zusammenhang
mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten
die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter
anderem von der verwendeten Detektionsapparatur und der Auflösung des
Grauwertbildes ab. Sie können
beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer
den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden
der Bildsegmentierung reichen von einfachen Schwellwertverfahren
bis hin zur Verwendung neuronaler Netze.
-
Erfüllt ein
Bildpunkt (x,y) diese Anforderungen, dann folgt ein Vergleich mit
den Koordinaten von in bisher durchgeführten Sequenzierungszyklen
identifizierten NSKFs. Bei einer Übereinstimmung erfolgt die
Zuordnung des Signals mit dem aus dem jeweiligen Fluoreszenzkanal
hervorgehenden Nukleotid zu diesem NSKF. Signale mit nicht übereinstimmenden
Koordinaten werden als Hintergrundsignale bewertet und verworfen.
Die Analyse der Signale kann parallel zum Scanvorgang erfolgen.
-
In
einer beispielhaften Ausführung
wurde ein 8-Bit-Grauwertbild mit einer Auflösung von 1317 × 1035 Pixel
verwendet. Um die durch die Digitalisierung entstandenen Veränderungen
am Bild zu reduzieren, erfolgte zunächst eine Vorverarbeitung des
Gesamtbildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten
seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung entsteht dadurch ein für einen
Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt mit
dem größten Helligkeitswert
und Nachbarbildpunkten mit nach allen Seiten hin abfallenden Helligkeiten.
Erfüllte
ein Bildpunkt diese Kritierien und Überschritt der zentrifugale Helligkeitsabfall
einen bestimmten Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte),
dann wurde dieser zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes
gewertet.
-
d) Verschiebung des Objektivs
zur nächsten
Position auf der Oberfläche.
Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer
anderen Position der Oberfläche
positioniert.
-
Insgesamt
kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der
X,Y-Position, der Einstellung der Fokusebene und mit der Detektion
einzelner Moleküle
bei jeder neuen Objektivposition gemacht werden. Diese Schritte
können
durch einen Computer gesteuert werden.
-
4.7 Zeitlicher Ablauf
der Verfahrensschritte
-
Der
Scanvorgang sowie die biochemische Reaktion nehmen eine gewisse
Zeit in Anspruch. Wenn man diese Vorgänge nacheinander schaltet,
kann man eine optimale Leistung der Apparatur erreichen. In einer
bevorzugten Ausführung
wird die Reaktion auf zwei getrennten Oberflächen durchgeführt (9).
-
Als
Beispiel kann eine Oberfläche
mit immobilisierten NSKFs in 2 räumlich
isolierte Teile getrennt werden, so daß Reaktionen auf diesen beiden
Teilen unabhängig
voneinander ablaufen können.
In einem anderen Beispiel können
NSKFs auch von vornherein auf 2 getrennten Oberflächen immobilisiert
werden.
-
Danach
wird die Reaktion gestartet. Das Prinzip dabei ist, daß während auf
einem Teil der Oberfläche die
Reaktions- und Waschschritte ablaufen, der zweite Teil abgescannt
wird. Dadurch kann man einen kontinuierlichen Ablauf der Analyse
erreichen und die Geschwindigkeit der Sequenzierung steigern.
-
Die
Anzahl der Oberflächen,
auf denen die Reaktion abläuft,
kann auch größer als
2 sein. Das erscheint dann sinnvoll, wenn die Reaktion als zeitlich
limitierender Schritt auftritt, d.h. die Detektion der Signale auf
der Oberfläche
schneller als die Reaktions- und Waschschritte abläuft. Um
die Gesamtdauer der Reaktion an die Detektionsdauer anzupassen,
kann jeder einzelne Schritt der Reaktion auf einer einzelnen Oberfläche mit
einer zeitlichen Verzögerung
im Vergleich zur nächsten
Oberfläche
ablaufen.
-
Die
Erfindung wird nachfolgend anhand von Beispielen verdeutlicht.
-
Beispiele
-
Beispiel 1:
-
Modifiziertes
dUTP mit einem langen spaltbaren Linker (7f-1)
Als Ausgangssubstanzen dienen 5-(3-Aminoallyl)-2'-deoxyuridin-5'-triphosphat,
AA-dUTP, (Sigma), 3,3'-Dithio-bis(propionsäure-N-Nydroxysuccinimidester),
DTBP-NHS, (Sigma), 2-Mercaproethanolamin, MEA, (Sigma). Zu 100 μl 50 mM Lösung von AA-dUTP
in 100 mM Borat-Puffer pH 8.5 werden 3 Äquivalente an DTBP-NHS in DMF
(25 μl 0.4
M Lösung) zugegeben.
Das Reaktionsgemisch wird 4 Stunden bei RT. inkubiert. Anschließend wird
konz. Ammoniumacetat-Lösung
(pH 9) zugegeben bis die Gesamtkonzentration an CH3COONH4 in der Reaktionslösung 100 mM ist, und die Reaktion
wird eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch
200 μl 1
M MEA-Lösung,
pH 9, zugegeben und eine Stunde bei RT inkubiert. Anschließend wird
zu diesem Gemisch solange eine gesätigte Lösung an I2 in
0.3 M KI-Lösung
zugetropft, bis die Iodfarbe bestehen bleibt. Die modifizierten
Nukleotide werden auf einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient
(pH 8.5) von anderen Reaktionsprodukten abgetrennt. Isolierung des
Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An diesen
Linker können
nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent
Probes und Research Chemicals" 6th
ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology
1995 v. 246, S.362, Jameson et al. Method in Enzymology 1997, v.
278, S. 363).
-
Auch
andere Nukleotidanaloga (z.B. nach Hobbs et al. US Patent 5,047,519,
Khan et al. US Patent 5,821,356) können in die Reaktion eingesetzt
werden, so daß Nukleotidanaloga
mit Strukturen in 7f-2, 3, 4 und 7g-1, 2 erzeugt werden können.
-
Als
Beispiel der Ankopplung eines Farbstoffs an den Linker wird die
Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat) angegeben
(NT*-Struktur 7j)
-
Das
mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 μl 100 mM
Natrium-Borat-Puffer pH 9 aufgelöst
(10 mM NT*). Dazu werden 10 μl
10 mM TRITC in Dimethylformamid (DMF) gegeben und 4 h bei RT inkubiert.
Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC
in einem Methanol-Wasser Gradienten.
-
Beispiel
der Spaltung der Disulphidverbindung im modifizierten NT*. Die Spaltung
erfolgt durch eine Zugabe von 20 bis 50 mM Dithiothreitol-Lösung DTT
(Sigma) Lösung
pH 8 auf die Reaktionsoberfläche.
Die Oberfläche
wird 10 min. mit dieser Lösung
inkubiert, danach wird die Lösung
entfernt und die Oberfläche
mit einer Pufferlösung
zur Entfernung von DTT-Resten gewaschen.
-
Beispiel 2
-
Modifiziertes
dUTP (dUTP-SS-CH2CH2NH2) mit einem kurzen spaltbaren Linker (7e-1). Als Ausgangssubstanzen dienen:
Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, v.
180, S. 383), 2-Mercaptoethanolamin (MEA) (Sigma).
-
Zu
400 μl 100
mM Bis-dUTP in 40 mM Boratpuffer pH 8.5 werden 100 μl 100 mM
MEA-Lösung
pH 8.5 in H2O zugegeben und 1 Stunde bei
RT inkubiert. Anschließend
wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in
0.3 M KI-Lösung
zugetropft, bis die Iodfarbe bestehen bleibt. Die Nukleotide (Bis-dUTP und
dUTP-SS-CH2CH2NH2)
können
z.B. durch eine Ethanol-Präzipitation
oder auf einer DEAE-Cellulose-Säule
im Ammoniumcarbonat-Gradienten (pH 8.5) von anderen Reaktionsprodukten
abgetrennt werden. Bis-dUTP stört
bei der anschließenden
Ankopplung eines Farbstoffs an die Aminogruppe des Linkers nicht,
so daß die
Abtrennung des dUTP-SS-CH2CH2NH2 von
bis-dUTP im Endreinigungsschritt erfolgen kann.
-
In
einer ähnlichen
Weise kann auch dCTP (7-e2) modifiziert
werden, dabei dient Bis-dCTP als Ausgangssubstanz (synthetisiert
nach Hanna et al. Nucleic Acid Research 1993, v. 21, S.2073).
-
An
den Linker können
nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent
Probes und Research Chemicals" 6th
ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology
1995 v. 246, S. 362, Jameson et al. Method in Enzymology 1997, v.
278, S.363).
-
Als
Beispiel der Ankopplung eines Farbstoffs an den Linker wird die
Ankopplung des FluoroLinkTM Cy3 monofunktional
dye (Amersham Pharmacia biotech) (NT*-Struktur 7i)
angegeben. Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstoff.
Die Reaktion wird nach Angaben des Herstellers durchgeführt:
Das
mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 μl 100 mM
Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird Farbstoff (300
nmol) gegeben und 1h bei RT inkubiert. Die Reinigung des mit dem Farbstoff
modifizierten NT* erfolgt über
RP-HPLC in einem Methanol-Wasser Gradienten.
-
Ein
weiteres Beispiel der Ankopplung eines Farbstoffs an den Linker
wird die Ankopplung von TRITC (Tetramethylrhodamin-5-isothiocyanat, Molecular
Probes) angegeben (dUTP-SS-TRITC 7h).
-
Das
mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 μl 100 mM
Natrium-Borat-Puffer pH 9 aufgelöst
(10 mM NT*). Dazu werden 10 μl
10 mM TRITC in DMF gegeben und 4 h bei RT inkubiert. Die Reinigung
des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser
Gradienten.
-
Beispiel 3:
-
Sequenzanalyse mit 4 markierten
NTs*
-
Bei
einer bevorzugten Ausführungsform
der Erfindung werden alle vier in die Reaktion eingesetzten NTs*
mit Fluoreszenzfarbstoffen markiert.
-
3A.
-
Rekonstruktion
der ursprünglichen
Sequenzen nach dem Schrotschuß-Prinzip
("Automated DNA
sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield
et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994
v. 1 S. 257). (Dieses Prinzip ist insbesondere bei der Analyse neuer,
unbekannter Sequenzen geeignet.)
-
3A-1 Sequenzierung eines
langen DNA-Stücks
(1)
-
Im
folgenden soll anhand der Sequenzierung eines 1 Mb langen DNA-Stückes schematisch
die Sequenzierung langer Nukleinsäureketten dargestellt werden
(1). Der Sequenzierung liegt das Shotgun-Prinzip
zugrunde ("Automated
DNA sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield
et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994
v. 1 S. 257). Das zu analysierende Material wird für die Sequenzierungsreaktion
vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000
bp Länge
zerlegt wird. Jedes Fragment wird anschließend mit einer Primerbindungsstelle
und einem Primer versehen. Dieses Gemisch aus verschiedenen DNA-Fragmenten
wird nun auf einer planen Oberfläche
fixiert. Die nicht gebundenen DNA-Fragmente werden durch einen Waschschritt
entfernt. Danach wird die Sequenzierungsreaktion an der gesamten
Reaktionsoberfläche
durchgeführt.
Zur Rekonstruktion einer 1 Mb langen DNA-Sequenz sollten die Sequenzen
von NSKFs vorzugsweise länger
als 300 NTs sein, durchschnittlich ca. 400 bp.
-
Da
pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens
400 Zyklen zur Sequenzierung notwendig.
-
Insgesamt
ist zur Rekonstruktion der ursprünglichen
Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich,
d.h. 10 bis 100 Mb. Bei einer durchschnittlichen Sequenzlänge von
ca. 400 bp pro NSKF benötigt
man entsprechend 25.000 bis 250.000 DNA-Fragmente, um mehr als 99,995%
der Gesamtsequenz abzudecken.
-
Die
ermittelten NSKF-Sequenzen stellen eine Population von überlappenden
Teilsequenzen dar, die sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz
der NSK zusammenfügen
lassen ("Automated
DNA sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res.
1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al.
NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1
S. 257).
-
3A-2 Sequenzierung der
Genprodukte am Beispiel der cDNA-Sequenzierung
-
In
einer bevorzugten Ausführungsform
können
statt einer Sequenz mehrere Sequenzen in einem Ansatz analysiert
werden. Die ursprünglichen
Sequenzen können
aus den gewonnen Rohdaten z.B. nach dem Schrotschuß-Prinzip
rekonstruiert werden.
-
Zunächst werden
NSKFs erzeugt. Man kann z.B. mRNA in eine doppelsträngige cDNA überführen und diese
cDNA mit Ultraschall fragmentieren. Anschließend werden diese NSKFs mit
einer Primerbindungsstelle versehen, denaturiert, immobilisiert
und mit einem Primer hybridisiert. Zu beachten ist bei dieser Variante
der Probenvorbereitung, daß die
cDNA-Moleküle unvollständige mRNA-Sequenzen
darstellen können
(Method in Enzymology 1999, v. 303, S. 19 und andere Artikel in
diesem Band, "cDNA
library protocols" 1997
Humana Press).
-
Eine
andere Möglichkeit
bei der Generierung einzelsträngiger
NSKFs von mRNA besteht in der reversen Transkription der mRNA mit
randomisierten Primern. Dabei werden viele relativ kurze antisense DNA-Fragmente
gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter
et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Biochem.
1993 v. 208 S. 264, Decraene et l1. Biotechniques 1999 v. 27 S. 962).
Diese Fragmente können
anschließend
mit einer Primerbindungstelle versehen werden (s.o). Weitere Schritte
entsprechen oben beschriebenen Vorgängen. Mit dieser Methode können komplette
mRNA-Sequenzen (vom 5'-
bis zum 3'-Ende)
analysiert werden, da die randomisierten Primer über die gesamte Länge der mRNA
binden.
-
Immobilisierte
NSKFs werden mit einer der oben angeführten Ausführungsformen der Sequenzierung analysiert.
Da mRNA-Sequenzen
wesentlich weniger repetitive Sequenzen aufweisen als z.B. genomische DNA,
kann die Anzahl der detektierten Signale der eingebauten NTs* von
einem NSKF geringer als 300 sein und liegt vorzugsweise zwischen
20 und 1000. Die Anzahl der NSKFs, die analysiert werden müssen, errechnet
sich nach denselben Prinzipien wie bei einer Schrotschuß-Rekonstruktion
einer langen Sequenz.
-
Aus
NSKF-Sequenzen werden nach den Prinzipien des Schrotschuß-Verfahrens
die ursprünglichen Gensequenzen
rekonstruiert.
-
Diese
Methode erlaubt die gleichzeitige Sequenzierung von vielen mRNAs
ohne vorherige Klonierung.
-
3B. Analyse von Sequenzvarianten
-
Die
Bestätigung
einer bereits bekannten Sequenz oder der Nachweis von Varianten
dieser Sequenz stellt sehr viel geringere Ansprüche an die Länge und
Redundanz der ermittelten NSKFs. Auch die Sequenzbearbeitung ist
in diesem Fall einfacher. Die Vollsequenz braucht nicht neu rekonstruiert zu
werden. Die NSKF-Sequenzen werden vielmehr mit Hilfe eines kommerziell
erhältlichen
Programms der Vollsequenz zugeordnet und eventuelle Abweichungen
detektiert. Einem solchen Programm kann z.B. BLAST oder FASTA Algorithmus
zugrunde liegen ("Introduction
to computational Biology" 1995
M. S. Waterman Chapman & Hall).
-
Die
zu analysierende Sequenz wird in NSKFs mit einer der oben genannten
Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren
sequenziert. Anschließend
werden die ermittelten Sequenzen von NSKFs nicht nach dem Schrotschuß-Verfahren
zusammengestzt, sondern mit der Referenzsequenz verglichen und auf
diese Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei
kann es sich um genomische oder cDNA-Sequenzen handeln.
-
Im
Gegensatz zu einer Rekonstruktion nach dem Schrotschuß-Verfahren braucht
man für
die Analyse einer Sequenzvariante erheblich weniger Rohsequenzdaten.
So kann die 5- bis 10-fache
Rohsequenzmenge ausreichend für
die Wiederherstellung einer neuen Variante einer Vollsequenz sein.
Mit dem Schrotschuß-Verfahren
wird für
eine Wiederherstellung eine 10- bis 100-fache Menge an Rohsequenzen
benötigt
("Automated DNA
sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield
et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994
v. 1 S. 257).
-
Die
Länge der
ermittelten NSKF-Sequenzen soll für eine eindeutige Zuordnung
zu einer bestimmten Position in der Referenzsequenz ausreichend
sein, so können
z.B bereits Sequenzen mit einer Länge von 20 NTs (z.B. aus nicht
repetitiven Abschnitten im menschlichen Genom) eindeutig identifiziert
werden. Für
die Vergleichsanalyse der repetitiven Abschnitte werden längere Sequenzen
benötigt.
Die genaue Länge
der Sequenzen hängt
dabei von der Aufgabenstellung ab. Vorzugsweise beträgt die Länge der
ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten
mehr als 20 NTs. Für
die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500
NTs.
-
Die
Zielsetzungen bei der Sequenzierung neuer Varianten einer bereits
bekannten Vollsequenz können
sehr unterschiedlich sein. Meist wird ein Vergleich der neu ermittelten
Sequenz mit der bekannten Vollsequenz/Referenzsequenz angestrebt.
Dabei können
die beiden Sequenzen aus evolutionär unterschiedlich weit auseinanderliegenden
Spezies stammen. Verschiedene Parameter der Zusammensetzung dieser
beiden Sequenzen können
verglichen werden. Als Beispiele für eine solche Analyse dienen:
Mutations- oder Polymorphismusanalysen und die Analyse von alternativ
gespleißten
Genprodukten.
-
Nachfolgend
soll beispielhaft ein Vergleich der zu untersuchenden Sequenz mit
einer Referenzsequenz ohne vorherige Rekonstruktion der zu analysierenden
Sequenz betrachtet werden. Ein solcher Vergleich kann z.B. zur Mutations-
oder SNP-Analyse dienen.
-
3B-1
-
Eine
lange, zu analysierende Sequenz, z.B. 1 Mb, wird in NSKFs mit einer
der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren
sequenziert. Die ermittelten Sequenzen von jedem einzelnen NSKF
werden direkt mit der Referenzsequenz verglichen. Die Referenzsequenz dient
dabei als Grundlage für
die Zuordnung ermittelter NSKF-Sequenzen, so daß die aufwendige Rekonstruktion
nach dem Schrotschuß-Verfahren
entfällt.
Vorzugsweise beträgt
die Länge
der ermittelten NSKF-Sequenzen bei der Analyse von nicht-repetitiven
Abschnitten mehr als 20 NTs. Für
die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500
NTs. Die Anzahl der zu analysierenden NSKFs richtet sich dabei nach
der Gesamtlänge
der zu untersuchenden Sequenz, der durchschnittlichen Länge der
NSKF-Sequenzen und der notwendigen Genauigkeit der Sequen zierung.
Bei einer durchschnittlichen Länge
der ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlänge der
zu untersuchenden Sequenz von 1 Mb und einer Genauigkeit, die der
Rohsequenzermittlung entspricht (d.h. jede Stelle soll möglichst
nur einmal sequenziert werden) benötigt man z.B. die ca. 5-fache
Menge an Rohsequenzen, d.h. 5 Mb, weil die Verteilung der NSKFs über die Gesamtsequenz
zufällig
erfolgt. Insgesamt müssen
50.000 NSKFs analysiert werden, um mehr als 99% der Gesamtstrecke
abzudecken.
-
Anschließend werden
die ermittelten NSKF-Sequenzen mit Hilfe eines kommerziell erhältlichen
Programms der Vollsequenz zugeordnet und eventuelle Abweichungen
detektiert. Einem solchen Programm kann z.B. BLAST oder FASTA Algorithmus
zugrunde liegen ("Introduction
to computational Biology" 1995
M. S. Waterman Chapman & Hall).
-
Beispiel 4:
-
Sequenzanalyse mit 2 markierten
NTs* und 2 unmarkierten NTs (2NTs*/2NTs-Methode).
-
In
einer anderen Ausführungsform
werden für
die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte
NTs eingesetzt.
-
Diese
Methode eignet sich besonders zur Analyse der Sequenzvarianten (z.B.
SNP- oder Mutationsanalyse) und setzt die Kenntnis einer Referenzsequenz
voraus. Dabei wird die Vollsequenz nicht rekonstruiert, sondern
die ermittelten Sequenzen werden mit Hilfe eines Programms der Referenzsequenz
zugeordnet und eventuelle Abweichungen registriert. Einem solchen
Programm kann z.B. der BLAST oder FASTA Algorithmus zugrunde liegen
("Introduction to
computational Biology" 1995
M. S. Waterman Chapman & Hall).
-
Diese
Ausführungsform
beruht auf dem Prinzip, daß eine
Abfolge aus 2 Signalen (markierte NT*s) genügend Informationen zur Identifizierung
einer Sequenz enthalten kann. Die ermittelte Sequenz wird mit der Referenzsequenz
verglichen und einer bestimmten Position zugeordnet, z.B.:
-
Die
unbekannte, zu analysierende Variante der Referenzsequenz wird wie
oben beschrieben zur Sequenzierung vorbereitet (NSK wird in NSKFs überführt, diese
werden mit PBS ligiert, anschließend mit einem Primer hybridisiert
und auf Reaktionsoberfläche
immobilisiert). Auf diese Weise vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode
sequenziert. Man erhält
NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge aus 2NTs* darstellt.
Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten
Referenzsequenz zu ermöglichen,
muß diese
Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen mehr als
40 NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen,
ist die Gesamtlänge
des synthetisierten komplementären
Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs*
(bei 40 detektierten NTs* beträgt
die Gesamtlänge
z.B. durchschnittlich 80 NTs).
-
Zur
Synthese eines komplementären
Stranges werden 4 Nukleotide benötigt.
Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden
Erfindung als Semiterminatoren auftreten, d.h. die Termination ausschließlich bei
Verfügbarkeit
modifizierter NTs* auftritt, müssen
unmodifizierte NTs in einem zusätzlichen
Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue
Position dieses Schrittes in dem Zyklus kann variieren. Wichtig
dabei ist, daß die
markierten NTs* und die unmodifizierte NTs getrennt verwendet werden.
-
Ein
Zyklus bei dieser Ausführungsform
kann beispielhaft folgendermaßen
aussehen:
- a) Zugabe einer Lösung mit modifizierten NTs*
und Polymerasen auf die Oberfläche
mit den bereitgestellten NSKFs
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter
Bedingungen, die zur Verlängerung
der komplementären
Stränge
um ein NT geeignet sind
- c) Waschen
- d) Detektion der Signale von einzelnen, modifizierten und in
die den NSKFs komplementären
neusynthetisierten Strängen
eingebauten NTs*-Molekülen
- e) Entfernung der Markierung und der terminierenden Gruppe bei
den eingebauten Nukleotiden
- f) Waschen
- g) Zugabe von 2 unmodifizierten NTs und Polymerasen
- h) Waschen.
-
Die
Konzentration der NTs liegt vorzugsweise unter 1 mM, idealerweise
unter 10 μM.
-
Diese
2NT*s/2NTs-Methode eignet sich beispielsweise für die SNP-Analyse einer genomischen Strecke eines
Gens oder für
doppelsträngige
cDNA-Analyse. Ihr liegen folgende Prinzipien zugrunde:
- 1) Die genetische Information in jedem der beiden komplementären DNA-Stränge ist
identisch, so daß fehlende
Informationen in einem Strang durch die Information aus dem anderen
Strang vervollständingt
werden können.
- 2) Durch bestimmte Paarkombinationen markierter NTs* kann man
mit nur 2 NTs* die komplette Information aus einer doppelsträngigen DNA
erhalten. Zulässige
Kombinationen von NT*s bei dieser Ausführungsform sind: A*C*; A*G*;
C*T*/C*U*; G*T*/G*U*. Bevorzugt wird die Kombination C* und U*.
- 3) Als Grundlage der Analyse dient eine bereits bekannte Referenzsequenz.
- 4) Die NSKFs stammen von beiden Strängen der zu analysierenden
NSK und die ermittelten NSKF-Sequenzen decken die gesamte Länge der
zu analysierenden Sequenz ab.
-
Am
folgenden Beispiel wird erklärt,
wie die Information aus einem doppelsträngigen DNA-Fragment mit nur
2 markierten NTs* gewonnen wird und wie die Unterschiede zur ursprünglichen
oder nicht mutierten Sequenz (Referenzsequenz/Vergleichsequenz)
festgestellt werden können.
Sequenzen unter (1) und (2) sind bis auf eine Stelle identisch (unterstrichen).
A* und C* sind markiert.
-
1) zu prüfende Sequenz:
-
Die
zu prüfende
Sequenz wird mit 2NT*s/2NTs-Methode sequenziert, so daß eine Population
an NSKF-Sequenzen (ermittelte NSKF-Sequenzen(n)) entsteht. Diese ermittelten
NSKF-Sequenzen enthalten Information von jedem Strang:
-
2) Vergleichsequenz:
-
Zur
Analyse ist eine Vergleichsequenz (Referenzsequenz) erforderlich:
-
3) Vergleichsequenz mit
angepaßten
ermittelten NSKF-Sequenzen:
-
Mit
Hilfe eines Programms werden ermittelte NSKF-Sequenzen bestimmten
Stellen in der Vergleichsequenz zugeordnet und eventuelle Abweichungen
detektiert:
-
Mit
dieser Ausführungsform
kann man eine doppelsträngige
Nukleinsäure
auf SNP oder Mutationen untersuchen. Dabei werden die ermittelten
NSKF-Sequenzen mit einer Referenzsequenz verglichen. Die Grundregeln
des Vergleichs einer Teilsequenz und einer kompletten Sequenz bei
der Analyse mit nur 2 markierten NTs unterscheiden sich nicht prinzipiell
von denen, die bei dem Vergleich der Sequenzen anhand aller 4 markierten
NTs* gelten. Näheres
s. Sequenzvergleich bei Mutationsanalyse und SNP-Analyse mit 4NTs* (Beispiel
3B).
-
-