[go: up one dir, main page]

DE10120797A1 - Verfahren zur Analyse von Nukleinsäureketten - Google Patents

Verfahren zur Analyse von Nukleinsäureketten

Info

Publication number
DE10120797A1
DE10120797A1 DE10120797A DE10120797A DE10120797A1 DE 10120797 A1 DE10120797 A1 DE 10120797A1 DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A1 DE10120797 A1 DE 10120797A1
Authority
DE
Germany
Prior art keywords
nts
nskfs
reaction
polymerase
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
DE10120797A
Other languages
English (en)
Other versions
DE10120797B4 (de
Inventor
Dmitri Tcherkassov
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genovoxx GmbH
Original Assignee
Genovoxx GmbH
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genovoxx GmbH filed Critical Genovoxx GmbH
Priority to DE10120797A priority Critical patent/DE10120797B4/de
Priority to AU2002304705A priority patent/AU2002304705A1/en
Priority to PCT/EP2002/004659 priority patent/WO2002088382A2/de
Priority to EP02732680A priority patent/EP1381698A2/de
Priority to JP2002585662A priority patent/JP2004529650A/ja
Publication of DE10120797A1 publication Critical patent/DE10120797A1/de
Application granted granted Critical
Publication of DE10120797B4 publication Critical patent/DE10120797B4/de
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Physics & Mathematics (AREA)
  • Biotechnology (AREA)
  • Analytical Chemistry (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Immunology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Saccharide Compounds (AREA)

Abstract

Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäureketten. Grundlage der Methode ist die Detektion von Fluoreszenzsignalen einzelner, mit Farbstoffen markierter Nukleotidmoleküle, die durch eine Polymerase in wachsende Nukleinsäureketten eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. Auf dieser Oberfläche sind viele einzelne Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure-Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann.

Description

Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäu­ reketten. Die Grundlage der Methode ist die Detektion von Fluo­ reszenzsignalen einzelner mit Farbstoffen markierter Nukleotid­ moleküle, die durch eine Polymerase in eine wachsende Nuklein­ säurekette eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. Auf dieser Oberfläche sind viele einzelne Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure- Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann.
Das Verfahren umfaßt im wesentlichen folgende Schritte:
  • 1. Immobilisierung der Nukleinsäureketten auf einer planen Oberfläche.
  • 2. Durchführen einer zyklischen Aufbaureaktion, wobei jeder Zyklus aus folgenden Schritten besteht:
    • a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
    • b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind,
    • c) Waschen,
    • d) Detektion der Signale von einzelnen Molekülen,
    • e) Entfernung der Markierung von den eingebauten Nukleoti­ den,
    • f) Waschen.
    Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus.
  • 3. Analyse der detektierten Signale der einzelnen Moleküle.
  • 4. Rekonstruktion der Sequenzen aus den Einzeldaten.
1. Abkürzungen und Begriffserläuterungen
DNA - Desoxyribonukleinsäure verschiedenen Ursprungs und unter­ schiedlicher Länge: (genomische DNA, cDNA, ssDNA, dsDNA)
RNA - Ribonukleinsäure (meist mRNA)
Polymerasen - Enzyme, die komplementäre Nukleotide in einen wachsenden DNA- oder RNA-Strang einbauen können (z. B. DNA-Poly­ merasen, Reverse-Transkriptasen, RNA-Polymerasen)
dNTP - 2'-deoxi-Nucleosid-Triphosphate für DNA-Polymerasen und Reverse-Transkriptasen
NTP - Nukleosid-Triphosphate für RNA-Polymerasen
NT - natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet.
Abkürzung "NT" wird auch bei der Längenangabe einer Nukleinsäu­ resequenz verwendet, z. B. 1000 NT. In diesem Fall steht "NT" für Nukleosid-Monophosphate.
Im Text wird bei Abkürzungen die Mehrzahl durch Verwendung des Suffixes "s" gebildet, "NT" steht zum Beispiel für "Nukleotid", "NTs" steht für mehrere Nukleotide.
NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrück­ lich anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleo­ tide
NSK - Nukleinsäurekette. DNA oder RNA in ihrer ursprünglichen Länge
NSKF - Nukleinsäurekettenfragment, NSKFs - Nukleinsäureketten­ fragmente. Fragmente von DNA oder RNA, die nach einem Fragmen­ tierungsschritt entstehen.
Plane Oberfläche
Oberfläche, die vorzugsweise folgende Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Moleküle, vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem jeweiligen gegebenen Objektiv-Oberfläche-Abstand bei einer Objektivposition gleichzeitig zu detektieren. 2) Die immobilisierten einzelnen Moleküle befinden sich in derselben Fokusebene, die reproduzier­ bar eingestellt werden kann.
Sterisches Hindernis
Sterisch anspruchsvolle Gruppe, die durch ihre chemische Struktur die Eigenschaften der mit dieser Gruppe gekoppelten NTs* so verändert, daß diese durch eine Polymerase in einer Extensionsreaktion nicht nacheinander eingebaut werden können.
Definition der Termination
Als Termination wird in dieser An­ meldung der reversible Stop des Einbaus der modifizierten unge­ spalteten NTs* bezeichnet.
Dieser Begriff ist von dem üblichen Gebrauch des Wortes "Termi­ nation" durch Dideoxy-NTP bei einer konventionellen Sequenzierung zu trennen.
Die Termination kommt nach dem Einbau eines modifizierten NT* zustande. Das modifizierte eingebaute NT* trägt eine an die Base reversibel gekoppelte sterische Gruppe, die zur Behinderung des Einbaus eines nächsten komplementären NT* in den wachsenden Strang durch eine Polymerase führt.
Genprodukte - Bei den Genprodukten handelt es sich um die primären Genprodukte der Gene. Im wesentlichen handelt es sich dabei um RNA-Transkripte der genannten Gene, welche auch als Target-Sequenzen (oder Target-Nukleinsäuresequenzen) bezeichnet werden. Diese Target-Sequenzen schließen neben mRNA auch davon abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA abgeleitete RNA oder von cDNA amplifizierte DNA ein.
SNP - single nucleotide polymorphism
2. Stand der Technik
Die Nukleinsäurenketten-Sequenzanalyse ist in vielen Bereichen der Wissenschaft, Medizin und Industrie zu einem wichtigen Werk­ zeug geworden. Zur Analyse wurden mehrere Verfahren entwickelt.
Die bekanntesten Verfahren sind die Ketten-Terminations-Sequen­ zierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 5463), die auf dem Einbau von Kettenterminatoren basiert, und die Maxam- Gilbert-Methode, die auf Basen-spezifischer Modifikation und Spaltung von Nukleinsäureketten beruht (A. M. Maxam and W. Gilbert PNAS 1977, v. 74 S. 560). Beide Methoden liefern eine Anzahl von Nukleinsäurekettenfragmenten verschiedener Längen. Diese Fragmente werden der Länge nach in einem Gel aufgetrennt. Dabei müssen alle Nachteile der Elektrophorese (wie z. B. lange Laufzeit, relativ kurze Strecken von Sequenzen, die in einem Ansatz bestimmt werden können, begrenzte Anzahl der parallelen Ansätze sowie relativ große Mengen an DNA) in Kauf genommen werden. Diese Methoden sind sehr arbeitsintensiv und langsam.
Ein weiteres Verfahren zur Sequenzierung basiert auf der Hybri­ disierung von Nukleinsäureketten mit kurzen Oligonukleotiden. Dabei wird mit mathematischen Methoden berechnet, wie viele Oligonukleotide einer bestimmten Länge vorhanden sein müssen, um eine komplette Sequenz zu ermitteln (Z. T. Strezoska et al. PNAS 1991 v. 88 S. 10089, R. S. Drmanac et al. Science 1993 v. 260 S. 1649). Auch dieses Verfahren ist mit Problemen behaftet: Es kann nur eine Sequenz in einem Ansatz bestimmt werden, sekundäre Struktu­ ren stören die Hybridisierung und Sequenzwiederholungen verhin­ dern die korrekte Analyse.
Eine andere Möglichkeit zur Sequenzierung haben Arbeitsgruppen von (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197) entwickelt. Diese Methode wird abgekürzt als BASS (Base Addition Sequencing Scheme) bezeichnet. Dabei wird eine große Anzahl gleicher einzelsträngi­ ger DNA-Stücke an einem definierten Ort auf einer Oberfläche fixiert und das Signal von der Gesamtheit dieser vielen iden­ tischen DNA-Stücke analysiert. Zu dieser fixierten DNA wird eine Lösung mit Polymerase und Nukleotiden zugegeben, so daß ein komplementärer Strang synthetisiert werden kann. Dabei soll die Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein einziges Nukleotid eingebaut. Dieses wird detektiert, worauf die Polymerase in einem nächsten Zyklus das nächste Nukleotid einbaut.
Die Methode hat folgende Nachteile: Beim Aufbau der komplementä­ ren Stränge tritt sehr schnell eine Desynchronisation der Syn­ these auf, so daß bei jedem Schritt die Fehler akkumulieren. Deshalb können nur sehr kurze Fragmente sequenziert werden. Es ist zu betonen, daß alle beschriebenen BASS-Methoden nicht auf der Detektion von einzelnen Molekülen beruhen. Das Signal wird stattdessen von einer großen Anzahl identischer an einem definierten Ort immobilisierter Moleküle registriert. Die in diesen Methoden übliche Verwendung der Begriffe "einzelne Moleküle" und "Moleküle" zielt dabei nicht auf individuelle, voneinander ge­ trennte Moleküle, sondern auf eine Population, die aus vielen identischen Molekülen besteht. Identisch heißt in diesem Fall, daß die Moleküle die gleiche Sequenz haben.
Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein Verfahren zur Sequenzanalyse von Nukleinsäureketten bereitzustel­ len, das die Nachteile der oben erwähnten Methoden nicht aufweist und vor allem eine billigere, schnellere und effizientere Analyse von Nukleinsäuresequenzen ermöglicht. Insbesondere soll das Verfahren in der Lage sein, viele Sequenzen parallel zu bestim­ men, vorzugsweise soll es die Analyse sehr langer Nukleinsäure­ ketten (mehrere Mb) in einem Ansatz ermöglichen.
3. Kurze Beschreibung
Die Aufgabe wird erfindungsgemäß durch ein Verfahren zur Sequenzanalyse von Nukleinsäuresequenzen (Nukleinsäureketten, NSKs) gelöst, bei dem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
  • a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifi­ zierte Nukleotide (NTs*) enthält, die mit Fluoreszenz­ farbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedli­ cher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang ein­ zubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer ste­ risch anspruchsvoller Ligand ist, man
  • b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der kom­ plementären Stränge geeignet sind, wobei die komplemen­ tären Stränge jeweils um ein NT* verlängert werden, man
  • c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man
  • d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarb­ stoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluo­ reszenzsignale auf der Reaktionsoberfläche bestimmt, man
  • e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo­ reszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man
  • f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz­ farbstoffe und der Liganden geeignet sind, man
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, wobei man die relative Position einzelner NSKFs auf der Reak­ tionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.
Die erhaltene Population von überlappenden Teilsequenzen läßt sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammenfügen (Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).
Gemäß einer besonderen Ausführungsform der Erfindung kann das Verfahren durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man
  • a) in jedem Zyklus nur jeweils ein markiertes NT*,
  • b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oder
  • c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs*
einsetzt.
Wenn die NSKs Varianten einer bekannten Referenzsequenz sind kann das Verfahren auch durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz er­ mittelt.
Gegenstand der vorliegenden Erfindung sind ferner die in den Fig. 7e, 7f und 7g dargestellten Nukleotide und die ent­ sprechenden markierten Nukleotide, die beispielsweise an die terminale Aminofunktion angeheftete Fluoreszenzfarbstoffe aufweisen, oder die in den Fig. 7h, 7i oder 7j dargestellten markierten Nukleotide.
Gegenstand der Erfindung ist ferner ein Kit zur Durchführung des Verfahrens das eine Reaktionsoberfläche, zur Durchführung des Verfahrens erforderliche Reaktionslösungen, eine oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*), daß die Poly­ merase nach Einbau eines solchen NT* in einen wachsenden komple­ mentären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist. Bei den Nukleotiden handelt es sich vorzugsweise um die oben genannten erfindungsgemäßen Nukleotide.
Gemäß einer besonderen Ausführungsform der Erfindung enthält das Kit ferner zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien, einzelsträngige Nukleinsäuremoleküle, die als PBS in die KSKFs eingeführt werden, Oligonukleotid- Primer, zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien und/oder Wasch­ lösungen.
Die erfindungsgemäße Methode dient zur Ermittlung der Nukleinsäu­ resequenzen und kann in verschiedenen Bereichen der Genetik eingesetzt werden. Dazu zählen insbesondere die Bestimmung unbekannter, langer Sequenzen, Analysen von Sequenz-Polymor­ phismen und Punktmutationen sowie die parallele Analyse einer großen Zahl an Gensequenzen.
Die Vorbereitung des zu analysierenden Materials (einzel- und doppelsträngige Nukleinsäuresequenzen) hängt von der Aufgabestel­ lung ab und hat das Ziel, aus einer langen Nukleinsäurekette eine Population an relativ kleinen, einzelsträngigen Nukleinsäureket­ tenfragmenten (NSKFs) zu bilden, diese Fragmente mit einem für den Start der Sequenzierungsreaktion geeigneten Primer zu versehen und auf einer planen Oberfläche zu fixieren.
Dabei werden einzelne NSKFs auf einer planen Oberfläche in einer solchen Weise fixiert, daß eine enzymatische Reaktion an diesen Molekülen ablaufen kann. Prinzipiell sind verschiedene Arten der Immobilisation möglich, die von der Zielsetzung, der Art der NSK und der für die Reaktion eingesetzten Polymerase abhängen. Die NSKFs werden bei der Immobilisierung zufällig auf der Oberfläche verteilt, d. h. es muß also nicht auf eine exakte Positionierung der einzelnen Ketten geachtet werden. Die Nukleinsäureketten müssen dabei in einer solchen Dichte auf der Oberfläche fixiert werden, daß eine eindeutige Zuordnung der später detektierten Signale zu einzelnen NSKFs gewährleistet ist.
Nach der Vorbereitung der NSKFs startet man mit allen auf der Oberfläche immobilisierten Molekülen die Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient die Synthese des komple­ mentären Stranges zu jedem einzelnen immobilisierten NSKF. Dabei werden in den neu synthetisierten Strang markierte NTs* einge­ baut. Die Polymerase baut nur ein einziges markiertes NT* in die wachsende Kette ein. Dies wird durch die reversible Ankopplung einer zur Termination führenden, sterisch anspruchsvollen Gruppe an die NTs* erreicht. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht. Diese sterisch anspruchsvolle Gruppe ist vorzugsweise ein Fluoreszenzfarbstoff.
Die Sequenzierungsreaktion verläuft in mehreren Zyklen. Ein Zyklus umfasst folgende Schritte:
  • a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
  • b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der kom­ plementären Stränge um ein NT geeignet sind,
  • c) Waschen,
  • d) Detektion der Signale von einzelnen Molekülen,
  • e) Entfernung der Markierung von den eingebauten Nukleotiden,
  • f) Waschen.
Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus (a-­ f).
Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden so gewählt, daß die Polymerasen an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* einbauen können, vorzugsweise an mehr als 90%.
Die Anzahl der durchzuführenden Zyklen hängt dabei von der je­ weiligen Aufgabenstellung ab, ist theoretisch nicht beschränkt und liegt vorzugsweise zwischen 20 und 5000.
Danach wird für jedes fixierte NSKF seine spezifische Sequenz aus der Reihenfolge der eingebauten NTs* ermittelt. Aus den überlap­ penden NSKF-Sequenzen kann die ursprüngliche NSK-Sequenz rekonstruiert werden ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Dabei sucht man in der gesamten Population von NSKF- Sequenzen nach Übereinstimmungen/Überlappungen in den Sequenzen von NSKFs. Durch diese Übereinstimmungen/Überlappungen kann man die NSKF in eine Reihe bringen, z. B.:
In der Praxis hat sich bei einer Sequenzierung von unbekannten Sequenzen bewährt, eine Länge der sequenzierten Stücke von mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung von Genomen aus Eukaryonten im Schrotschuss-Verfahren.
Dabei können die Fehler der Methode mit verschiedenen Mitteln erfasst und korrigiert werden. Sämtliche Schritte des Verfahrens können weitgehend automatisiert werden.
Durch die Arbeit mit einzelnen Molekülen ergeben sich mehrere Vorteile gegenüber der früher beschriebenen BASS-Methode:
  • 1. Da die Moleküle einzeln detektiert werden, besteht keine Gefahr, daß das Signal durch die Desynchronisation in der Population fehlerhaft wird. Für jedes fixierte NSKF wird eine eigene Sequenz erstellt. Daher spielt es keine Rolle, ob an einem benachbarten Molekül die Synthese bereits weiter fortgeschritten oder zurückgeblieben ist.
  • 2. Es ist nicht notwendig, Moleküle in einer definierten Anord­ nung auf der Oberfläche zu fixieren, da das Signal von einzelnen Molekülen ausgeht und nicht von einer räumlich definierten Population (was bei BASS-Methoden notwendig ist).
4. Detaillierte Beschreibung 4.1 Allgemeine Prinzipien der Reaktion
Im folgenden sollen anhand der Sequenzierung eines mehrere Mb langen DNA-Stückes beispielhaft die allgemeinen Prinzipien der Reaktion dargestellt werden (Fig. 1). Der Sequenzierung und der Rekonstruktion von Nukleinsäurensequenzen liegt das Shotgun- Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Die Sequenz eines langen DNA-Stücks wird dabei durch die Sequenzierung kleiner DNA-Fragmente und nachfolgender Rekon­ struktion ermittelt. Das zu analysierende Material (1) wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird (2). Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen (3). Dieses Gemisch aus verschiedenen DNA- Fragmenten wird nun auf einer planen Oberfläche fixiert (4). Die nicht gebundenen DNA-Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktionsoberfläche durchgeführt. Diese Reaktion verläuft zyklisch. Im 1. Schritt des Zyklus wird ein mit einem Fluo­ reszenzfarbstoff markiertes NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion so gesteuert, daß in jedem Zyklus jeweils nur ein markiertes NT* von einer Polymerase in den wachsenden Strang eingebaut werden kann. Das wird durch die Verwendung von NTs* erreicht, die eine reversibel gekoppelte, zur Termination führende Gruppe tragen. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht. Die Polymerase und die markierten NTs* werden gleichzeitig in die Reaktion eigesetzt (5). Danach wird das Reaktionsgemisch entfernt und die Oberfläche in geeigneter Art und Weise gewaschen (6). Nun folgt ein Detektionsschritt (7): Die Oberfläche wird mit einer für die Einzelmoleküldetektion geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, Kamera, Scantisch, Computer mit Steue­ rungs- und Bilderkennungs- bzw. Bildverarbeitungssoftware) abgescannt und die Signale der einzelnen, eingebauten markierten NTs* identifiziert. Nach dem Detektionsschritt wird die Markie­ rung und die zur Termination führende Gruppe von allen eingebau­ ten NTs* entfernt (8). Nach einem sich anschließenden Wasch­ schritt kann ein neuer Zyklus beginnen. Zur Rekonstruktion einer größeren ursprünglichen DNA-Sequenz (z. B. mehrere Mb langes DNA- Stück) sollen die DNA-Fragmente einige Hundert NT lang sein, falls man die Rekonstruktion nach dem Shotgun-Prinzip durchführt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 300 Zyklen zur Sequenzierung notwendig.
4.2 Auswahl des Materials
Mit Hilfe der erfindungsgemäßen Methode ist es möglich, sowohl vorselektionierte DNA-Sequenzen (z. B. in YAC-, PAC-, oder BAC- Vektoren (R. Anand et al. NAR 1989 v. 17 S. 3425, H. Shizuya et al. PNAS 1992 v. 89 S. 8794, "Construction of bacterial artificial chromosome libraries using the modified PAC system" in "Current Protocols in Human genetics" 1996 John Wiley & Sons Inc.) klonierte Abschnitte eines Genoms) als auch nicht vorselektio­ nierte DNA (z. B. genomische DNA, cDNA-Gemische) zu analysieren. Durch eine Vorselektion ist es möglich, im Vorfeld relevante Informationen, wie z. B. Sequenz-Abschnitte aus einem Genom oder Populationen an Genprodukten, aus der große Menge genetischer Informationen herauszufiltern und damit die Menge der zu analysierenden Sequenzen einzuschränken.
4.3 Vorbereitung des Materials
Ziel der Materialvorbereitung ist es, immobilisierte einzel­ strängige NSKFs mit einer Länge von vorzugsweise 50-1000 NTs, einer einzelnen Primerbindungsstelle und einem hybridisierten Primer zu erhalten. Diese Fragmente haben vorzugsweise die in Fig. 2 dargestellte Struktur. Im einzelnen können sehr variable Konstruktionen aus dieser allgemeinen Struktur abgeleitet werden. Zur Verbesserung der Anschaulichkeit folgen nun einige Beispiele, wobei die angeführten Methoden einzeln oder in Kombination eingesetzt werden können.
4.3.1 Erzeugung kurzer Nukleinsäurekettenfragmente (50-1000 NTs)
Wichtig ist, daß die Fragmentierung der NSKs so erfolgt, daß Fragmente erhalten werden, die überlappende Teilsequenzen der Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht, bei denen unterschiedlich lange Fragmente als Spaltprodukte in zufallsmäßiger Verteilung entstehen.
Erfindungsgemäß kann die Erzeugung der Nukleinsäureketten­ fragmente (NSKFs) durch mehrere Methoden erfolgen, z. B. durch die Fragmentierung des Ausgangsmaterials mit Ultraschall oder durch Endonukleasen ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press), wie z. B. durch unspezifische Endonukleasegemische. Erfindungsgemäß wird die Ultraschall-Frag­ mentierung bevorzugt. Man kann die Bedingungen so einstellen, daß Fragmente mit einer durchschnittlichen Länge von 100 bp bis 1 kb entstehen. Diese Fragmente werden anschließend an ihren Enden durch das Klenow-Fragment (E.coli-Polymerase I) oder durch die T4-DNA-Polymerase aufgefüllt ("Molecular cloning" 1989 J. Sam­ brook et al. Cold Spring Harbor Laborotary Press).
Ausserdem können aus einer langen NSK unter Verwendung randomi­ sierter Primer komplementäre kurze NSKFs synthetisiert werden. Besonders bevorzugt wird diese Methode bei der Analyse der Gen- Sequenzen. Dabei werden an der mRNA einzelsträngige DNA-Fragmente mit randomisierten Primern und einer reversen Transkriptase gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Bio­ chem. 1993 v. 208 S. 264, Decraene et al. Biotechniques 1999 v. 27 S. 962).
4.3.2 Einführung einer Primerbindungsstelle in das NSKF
Die Primerbindungsstelle ist ein Sequenzabschnitt, der eine selektive Bindung des Primers an das NSKF ermöglichen soll.
Aus Gründen der Vereinfachung der Analyse ist es günstig, wenn eine möglichst einheitliche Primerbindungsstelle in allen NSKFs vorhanden ist. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Primerbindungsstellen daher in die NSKFs extra eingeführt. Auf diese Weise können Primer mit einheitlicher Struktur für die Reaktion eingesetzt werden.
Die Zusammensetzung der Primerbindungsstelle ist nicht einge­ schränkt. Ihre Länge beträgt vorzugsweise zwischen 20 und 50 NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann z. B. eine Biotingruppe sein.
Als Beispiel für die Einführung einer Primerbindungsstelle werden im folgenden die Ligation und das Nukleotid-Tailing an DNA- Fragmente beschrieben.
a) Ligation
Dabei wird ein doppelsträngiger Oligonukleotidkomplex mit einer Primerbindungsstelle verwendet (Fig. 3a). Dieser wird mit kom­ merziell erhältlichen Ligasen an die DNA-Fragmente ligiert ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). Es ist wichtig, daß nur eine einzige Primer­ bindungsstelle an das DNA-Fragment ligiert wird. Das erreicht man z. B. durch eine Modifikation einer Seite des Oligonukleotidkom­ plexes an beiden Strängen (Fig. 3b). Die Resultate nach der Ligation bzw. nach anschließender Denaturierung sind in Fig. 3c und 3d dargestellt. Die modifizierenden Gruppen am Oligonukleo­ tidkompex können zur Immobilisation dienen. Die Synthese und die Modifikation eines solchen Oligonukleotidkomplexes kann nach standardisierten Vorschriften durchgeführt werden. Zur Synthese kann z. B. der DNA-Synthesizer 380 A Applied Biosystems verwendet werden. Oligonucleotide mit einer bestimmten Zusammensetzung mit oder ohne Modifikationen sind aber auch als Auftragssynthese kommerziell erhältlich, z. B. von MWG-Biotech GmbH, Germany.
b) Nukleotid-Tailing
Statt der Ligation mit einem Oligonukleotid kann man mit einer terminalen Deoxynucleotidyltransferase mehrere (z. B. zwischen 10 und 20) Nukleosid-monophosphate an das 3'-Ende eines ss-DNA- Fragments anknüpfen ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v. 303, S. 37-38) (Fig. 4), z. B. mehrere Guanosin-Monophosphate ((G)n-Tailing genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem Beispiel eines (C)n-Primers, verwendet.
4.3.3 Einzelstrang-Vorbereitung
Für die Sequenzierungsreaktion werden einzelsträngige NSKFs benötigt. Falls das Ausgangsmaterial in doppelsträngiger Form vorliegt, gibt es mehrere Möglichkeiten, aus doppelsträngiger DNA eine einzelsträngige Form zu erzeugen (z. B. Hitze-Denaturierung oder Alkali-Denaturierung) ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).
4.3.4 Primer für die Sequenzierungsreaktion
Dieser hat die Funktion, den Start an einer einzigen Stelle des NSKF zu ermöglichen. Vorzugsweise bindet er an die Primerbin­ dungsstelle im NSKF. Die Zusammensetzung und die Länge des Pri­ mers sind nicht eingeschränkt. Außer der Startfunktion kann der Primer auch andere Funktionen übernehmen, wie z. B. eine Verbin­ dung zur Reaktionsoberfläche zu schaffen. Primer sollten so an die Länge und Zusammensetzung der Primerbindungsstelle angepaßt werden, daß der Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase ermöglicht.
Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF dient, vorzugsweise ist eine solche Funktionsgruppe eine Biotingruppe (s. Abschnitt Immobilisierung). Sie soll die Sequenzierung nicht stören. Die Synthese eines solchen Primers kann z. B. mit dem DNA- Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter, z. B. MWG- Biotech GmbH, Germany erstellt werden).
Der Primer kann vor der Hybridisierung an die zu analysierenden Fragmente auf der Oberfläche mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert werden (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v. 285 S. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).
Der Primer oder das Primergemisch wird mit NSKFs unter Hybridi­ sierungsbedingungen inkubiert, die ihn selektiv an die Primerbin­ dungsstelle des NSKF binden lassen. Diese Primer-Hybridisierung kann vor, während oder nach der Immobilisierung der NSKFs erfolgen. Die Optimierung der Hybridisierungsbedingungen hängt von der genauen Struktur der Primerbindungsstelle und des Primers ab und läßt sich nach Rychlik et al. NAR 1990 v. 18 S. 6409 berechnen. Im folgenden werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen bezeichnet.
Falls eine für alle NSKFs gemeinsame Primerbindungsstelle mit bekannter Struktur durch Ligation eigeführt wird, können Primer mit einheitlicher Struktur eingesetzt werden. Die Primerbin­ dungsstelle kann an ihrem 3'-Ende eine funktionelle Gruppe tra­ gen, die z. B. zur Immobilisation dient. Vorzugsweise ist diese Gruppe eine Biotin-Gruppe. Der Primer hat eine zur Primer­ bindungsstelle komplementäre Struktur.
Ein Beispiel einer Primerbindungstelle und eines Primers ist nachfolgend dargestellt.
4.3.5 Immobilisation
Ziel der Immobilisierung ist es, NSKFs auf einer geeigneten planen Oberfläche in einer Art und Weise zu fixieren, daß eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Oberfläche und Reaktionsoberfläche sind in dieser Anmeldung als gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient die Oberfläche einer festen Phase eines beliebigen Materials. Dieses Material ist vorzugsweise enzymatischen Reaktionen gegen­ über inert und verursacht keine Störungen der Detektion. Silicon, Glas, Keramik, Kunststoff (z. B. Polycarbonate oder Polystyrole) oder beliebiges anderes Material, das diesen funktionalen Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung der Signale bei der wiederholten Detektion zu rechnen.
Falls eine gelartige feste Phase verwendet wird, so kann dieses Gel z. B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da frei passierbar (beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% Polyacrylamid Gel verwendet werden). Eine solche Geloberfläche hat anderen festen Oberflächen gegenüber den Vorteil, daß die markierten NSKFs im Gegensatz zu freien NTs* auf der Oberfläche festgehalten werden. Durch die Immobilisation der NSKFs auf der Oberfläche ist die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die Signale von freien NTs* werden nicht detektiert, weil sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das Gel ist vorzugsweise auf einer festen Unterlage befestigt (Fig. 5a). Die Dicke des Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke muß jedoch größer als die einfache Tiefenschärfe des Objektivs sein, damit unspezifisch an die feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen und damit detektiert werden. Wenn die Tiefenschärfe z. B. 0,3 µm beträgt, so liegt die Geldicke vorzugs­ weise zwischen 1 µm und 100 µm. Die Oberfläche kann als eine kontinuierliche Oberfläche oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen (z. B. Agarose-Kügelchen) zusammengesetzte Oberfläche hergestellt werden (Fig. 5b). Die Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl der NSKFs bei entsprechender Dichte immobilisieren zu können. Die Reaktionsoberfläche sollte vorzugsweise nicht größer als 20 cm2 sein.
Die verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen Reaktionslösungen über der Oberfläche. Die Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktions­ gefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchfluß­ vorrichtung ermöglicht einen Austausch der Lösungen im Reaktions­ gefäß. Der Austausch kann mit einer durch einen Computer gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei ist, daß die Oberfläche nicht austrocknet. Vorzugsweise beträgt das Volumen des Reaktionsgefäßes weniger als 50 µl. Idealerweise beträgt sein Volumen weniger als 1 µl. Ein Beispiel eines solchen Duchflußsystems ist in Fig. 6 gegeben.
Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem der beiden Ketten-Enden. Dies kann durch entsprechende kovalente, affine oder andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, S. 138, Allemand et al. Biophysical Journal 1997, v. 73, S. 2064, Trabesin­ ger et al. Analytical Chemistry 1999, v. 71, S. 279, Osborne et al. Analytical Chemistry 2000, v. 72, S. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).
Die NSKFs werden auf der Oberfläche vorzugsweise in einer Dichte zwischen 10 und 100 NSKFs pro 100 µm2 immobilisiert. Beispielhaft werden im folgenden zwei Methoden zur Immobilisierung näher dargestellt: In einer bevorzugten Ausführungsform erfolgt die Immobilisierung der NSKFs über Biotin-Avidin oder Biotin- Streptavidin-Bindung. Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent gebunden, das 5'-Ende des Primers enthält Biotin. Nach der Hybridisierung der markierten Primer mit den NSKFs werden diese auf der mit Avidin/Streptavidin modifizierten Oberfläche fixiert. Die Konzentration der mit Biotin markierten Hybridisierungs-Produkte sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird so gewählt, daß eine für die Sequenzierung geeignete Dichte erreicht wird.
In einer anderen bevorzugten Ausführungsform werden die für die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungs­ reaktion auf der Oberfläche mit geeigneten Methoden fixiert (s. o.). Die einzelsträngigen NSKFs mit jeweils einer Primerbin­ dungsstelle pro NSKF werden damit unter Hybridisierungsbedingun­ gen inkubiert. Dabei binden sie an die fixierten Primer und werden dadurch immobilisiert. Die Konzentration der einzel­ strängigen NSKFs wird so gewählt, daß man eine für die Sequenzierung geeignete Immobilisationsdichte von 10 bis 100 NSKFs pro 100 µm2 erreicht. Nach der Immobilisierung werden ungebundene NSKFs durch einen Waschschritt entfernt. Falls die Oberfläche einer festen Phase (z. B. Silikon oder Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen für eine Blockierlösung erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert zwischen 8 und 10.
4.4 Wahl der Polymerase
Als Polymerasen eignen sich prinzipiell alle DNA-abhängigen DNA- Polymerasen ohne 3'-5' Exonuklease-Aktivität (DNA-Replication" 1992 Ed. A. Kornberg, Freeman and company NY), z. B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia Biotech), 3'-5' exonuklease freies Klenow Fragment der DNA-Poly­ merase I (Amersham Pharmacia Biotech), Polymerase Beta ver­ schiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M., CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile Polymerasen wie Taq-Polymerase (GibcoBRL), proHATM Polymerase (Eurogentech).
Polymerasen mit 3'-5' Exonuklease-Aktivität können eingesetzt werden (z. B. Klenow-Fragment der E.coli-Polymerase I), sofern Reaktionsbedingungen gewählt werden, die vorhandene 3'-5' Exonu­ klease-Aktivität unterdrücken, wie z. B. ein niedriger pH-Wert (pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. Biol. Chem. 1964 v. 239 S. 233). Eine andere Möglichkeit besteht in der Verwendung von NTs* mit einer Phosphorothioate-Verbindung (Kunkel et al. PNAS 1981, v. 78 S. 6734). Dabei werden eingebaute NTs* von der 3'-5' Exonuklease-Aktivität der Polymerase nicht angegriffen. Im folgenden werden all diese Polymerasearten als "Polymerase" bezeichnet.
4.5 Chemie 4.5.1 Allgemeines Prinzip
Für die Sequenzierungsreaktion ist wichtig, daß jedes eingebaute NT* identifiziert wird. Eine Voraussetzung dafür ist, daß nur ein einziges NT* pro Zyklus in die Nukleinsäurekette eingebaut wird. Falls eine Polymerase mehrere NTs* nacheinander im selben Zyklus einbaut, so führt dies zu einem Fehler in der Sequenzermittlung. Aus diesem Grund muß man den Einbau der NTs* steuern. In diesem Zusammenhang sind verschiedene Möglichkeiten der Steuerung der enzymatischen Reaktion denkbar, wie z. B.
  • 1. einzelne Zugabe von NT, so daß die Polymerase nur einen einzigen Schritt macht und stoppt (Substrat Limitierung),
  • 2. Änderungen der äußeren Bedingungen (Temperatur, pH, Salz usw.), so daß die Polymerasen ihre Funktion anders ausüben (s. Optimierung der Reaktionsbedingngen),
  • 3. durch bestimmte kompetetive und nichtkompetetive Inhibitoren (als Beispiel seien antivirale Medikamente genannt)
  • 4. Durch bestimmte Mutationen und andere Veränderungen an der Polymerase als solcher,
  • 5. Durch die Struktur der NT. Diese Strukturänderungen können sein:
    • a) irreversibel (wie z. B. bei dideoxyNTPs)
    • b) reversibel.
Vorzugsweise erfolgt die Steuerung durch eine bestimmte Struktur der NTs*, wobei reversible Strukturveränderungen besonders bevorzugt sind. Die reversiblen Strukturveränderungen erfolgen beispielsweise durch Anheftung eines sterisch anspruchsvollen Liganden, d. h. eines Liganden, der die Polymerase vom Einbau eines weiteren NT abhält. Die Steuerung infolge einer sterischen Blockierung der enzymatischen Reaktion durch reversible Semi­ terminatoren wird unten genauer beschrieben. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Basen durch Ankopplung eines Fluoreszenzfarbstoffs strukturell verändert bzw. modifiziert.
Es gibt mehrere prinzipielle Varianten der NT*-Struktur, die zur Behinderung bzw. zum Stop der Extensionsreaktion führt: z. B. wurden in der BASS-Methode reversible 3'-OH modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197). Die Spaltung soll dabei unter milden Bedingungen photochemisch (Dower US Patent 5.547.839, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197) oder chemisch (Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021) erfolgen.
Die Synthese der 3'-OH-modifizierten photochemisch spaltbaren NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter­ schiedliche Affinität zu diesen Nukleotidanalogen auf, so daß die Nukleinsäuresynthese sehr ungleichmäßig bzw. an manchen DNA- Stellen gar nicht abläuft (Metzker et al. NAR 1994 v. 22 S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18 S. 197). Aus diesem Grund eignen sich diese Analoga nur bedingt für die Sequenzierungsreaktion. Eine spaltbare 3'-Ester-Verknüpfung (Canard et al. US Patent 5.798.210) kommt als Grundlage für eine reversible Termination der Synthese auch nicht in Betracht. Die meisten Polymerasen spalten bei Verfügbarkeit eines nächsten komplementären NT 3'-OH-Ester-Verbindungen, so daß die an die 3'- OH-Gruppe gebundene Markierung in die Lösung freigesetzt wird und nicht mehr als Terminator wirken kann (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v. 18 S. 1021, Canard et al. PNAS 1995 v. 92 S. 10859). In Positionen, an denen eine Polymerase mehrere gleiche NTs* nacheinander einbauen kann, führt das zu einem fehlerhaften Signal.
Erfindungsgemäß werden für die Sequenzierung NTs* mit einer sterisch anspruchsvollen Gruppe an der Base verwendet. Eine an die Base gekoppelte sterisch anspruchsvolle Gruppe kann zur Behinderung der weiteren Synthese führen. Biotin, Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine, Cy3- Farbstoff stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die Polymerasen können zwar solche NTs* in größeren Abständen einbauen, haben allerdings Schwierigkeiten, diese NTs* nacheinander einzubauen.
Bei der Sequenzierungsreaktion im erfindungsgemäßen Verfahren werden markierte NTs* mit einer Polymerase und Nukleinsäureketten inkubiert. Die NTs* tragen dabei eine an die Base reversibel gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions­ gemisch, das nur modifizierte NTs* enthält, in der Reaktion eingesetzt wird, dann kann die Polymerase nur ein einziges NT* einbauen. Der Einbau eines nächsten NT* wird sterisch gehemmt. Diese NTs* treten somit als Terminatoren der Synthese auf. Nach der Entfernung der sterisch anspruchsvollen Gruppe kann das nächste komplementäre NT* eingebaut werden. Weil diese NTs* kein absolutes Hindernis zur weiteren Synthese darstellen, sondern nur für den Einbau eines weiteren markierten NT*, werden sie als Semiterminatoren bezeichnet.
Der Unterschied zur 3'-OH Terminatoren-Methode besteht darin, daß nicht eine Blockade der für die Synthese notwendigen 3'-OH Gruppe angestrebt wird, sondern eine an die Base geknüpfte Gruppe als sterisches Hindernis für den weiteren Einbau genutzt wird. Die 3'-OH Gruppe bleibt dabei die ganze Zeit frei.
4.5.2 Allgemeine Struktur des NT*
Die Semiterminatoren können verschiedene Strukturen haben. Ihre gemeinsamen Merkmale sind in Fig. 7a dargestellt. Diese Struktur ist dadurch charakterisiert, daß an der Base über einen spalt­ baren Linker (A-E) eine sterische Gruppe (D) und der Fluores­ zenzmarker (F) gebunden sind.
Als Grundlage für die NTs* dienen Deoxynukleosid-Triphosphate mit Adenosin (A), Guanosin (G), Cytidin (C) und Thymidin (T) als Nukleosidrest. Anstelle von Thymidin wird bevorzugt Uridin als Nukleosidrest verwendet. Anstelle von Guanosin kann Inosin ver­ wendet werden.
4.5.3 Marker, Fluorophore
Jede Base ist mit einem für sie charakteristischen Marker (F) markiert (Fig. 7). Der Marker ist ein fluoreszierender Farbstoff. Mehrere Faktoren beeinflussen die Wahl des Fluoreszenzfarb­ stoffes. Die Wahl ist nicht eingeschränkt, sofern der Farbstoff folgenden Anforderungen genügt:
  • a) Die verwendete Detektionsapparatur muß diesen Marker als einziges Molekül gebunden an DNA unter milden Bedingungen (vor­ zugsweise Reaktionsbedingungen) identifizieren können. Die Farb­ stoffe haben vorzugsweise große Photostabilität. Ihre Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich ge­ quencht.
  • b) Der an das NT gebundene Farbstoff darf keine irreversible Störung der enzymatischen Reaktion verursachen.
  • c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in die Nukleinsäurekette eingebaut werden.
  • d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine beträchtlichen Überlappungen in ihren Emissionsspektren aufweisen.
Im Rahmen der vorliegenden Erfindung verwendbare Fluoreszenzfarb­ stoffe sind in "Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes mit Strukturformeln zusammengestellt. Erfindungsgemäß werden vorzugsweise folgende Farbstoffklassen als Marker eingesetzt: Cyanin-Farbstoffe und deren Abkömmlinge (z. B. Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), Rhodamine und deren Abkömmlinge (z. B. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, s. Handbuch), Xanthene-Derivate (z. B. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US-Patent 6.130.101). Diese Farbstoffe sind kommerziell erhältlich.
Dabei kann man je nach spektralen Eigenschaften und vorhandener Apparatur entsprechende Farbstoffe auswählen. Die Farbstoffe werden an den Linker z. B. über Thiocyanat- oder Ester-Bindung gekoppelt ("Handbook of Fluorescent Probes und Research Chemi­ cals" 6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. 278 S. 363, Waggoner Methods in Enzymology 1995 v. 246 S. 362), s. Beispiele 1 und 2.
4.5.4 Natur der sterisch anspruchsvollen Gruppe
Die Gruppe (D) (Fig. 7) stellt ein Hindernis für den Einbau eines weiteren komplementären markierten NT* durch eine Polymerase dar. Biotin, Digoxigenin und Fluoreszenzfarbstoffe stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al. Analyti­ cal Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die chemische Struktur dieser Gruppe ist nicht eingeschränkt, sofern sie den Einbau des markierten NT*, an das sie geknüpft ist, nicht wesentlich stört und keine irreversible Störung der enzymatischen Reaktion verursacht.
Diese Gruppe kann als selbständiger Teil im Linker (7a) auftreten oder mit dem Farbstoff (7b) oder der spaltbaren Gruppe (7d) identisch sein. Durch die Spaltung des Linkers wird diese sterisch anspruchsvolle Gruppe (D) nach der Detektion des Signals entfernt, so daß die Polymerase ein weiteres markiertes NT* einbauen kann. Bei einer Struktur wie in 7d wird die sterische Gruppe durch die Spaltung beseitigt.
In einer bevorzugten Ausführungsform übernimmt der Fluoreszenz­ farbstoff die Funktion einer solchen sterisch anspruchsvollen Gruppe, so daß ein markiertes Nukleotid eine in Fig. 7b dar­ gestellte Struktur aufweist.
In einer anderen bevorzugten Ausführungsform übernimmt die photolabile spaltbare Gruppe die Funktion einer solchen sterisch anspruchsvollen Gruppe (Fig. 7d).
4.5.5 Linker
Der Marker ist an die Base vorzugsweise über einen Abstandhalter unterschiedlicher Länge, einen sog. Linker, gebunden. Beispiele für Linker sind in Fig. 7e, f, h, i, j gegeben. Vorzugsweise ist dieser Linker an einer der Stellen an die Base gebunden, die nicht an der Basenpaarung teilnimmt. Im bevorzugten Fall sind die Stellen, an die der Linker gebunden ist: die 5-Position im Pyrimidinring und die 7-Position im Purinring. Beispiele der Ankoppelung eines Linkers an die Base können aus folgenden Quellen entnommen werden (Hobbs et al. US Patent 5.047.519, Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 1996 v. 274, S. 403, Zhu et al. NAR 1994 v. 22 S. 3418, Herman et al. Methods in Enzymology 1990 v. 184 S. 584).
Die gesamte Länge des Linkers kann variieren. Sie entspricht der Anzahl der Kohlenstoff-Atome in den Abschnitten A, C, E und liegt vorzugsweise zwischen 3 und 20. Optimalerweise beträgt sie zwischen 4 und 10 Atomen. Die chemische Zusammensetzung des Linkers (Abschnitte A, C, E in Fig. 7a) ist nicht eingeschränkt, sofern sie unter Reaktionsbedingungen stabil bleibt und keine Störung der enzymatischen Reaktion verursacht.
4.5.6 Spaltbare Verbindung, Spaltung
Der Linker trägt eine spaltbare Verbindung oder spaltbare Gruppe (B). Diese spaltbare Verbindung ermöglicht die Entfernung des Markers und des sterischen Hindernisses am Ende jedes Zyklus. Ihre Wahl ist nicht eingeschränkt, sofern sie unter den Bedin­ gungen der enzymatischen Sequenzierungsreaktion stabil bleibt, keine irreversible Störung der Polymerase verursacht und unter milden Bedingungen abgespalten werden kann. Unter "milden Bedingungen" sind solche Bedingungen zu verstehen, die den NSKF- Primer-Komplex nicht zerstören, wobei z. B. der pH-Wert vorzugsweise zwischen 3 und 11 liegt, die Temperatur zwischen 0°C und einem Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes (Tm ist "melting Point") und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen eignen sich besonders Disulfid-Verbindungen und photolabile Verbindungen als spaltbare Verbindungen).
Vorzugsweise gehört die genannte Verbindung zu chemisch oder enzymatisch spaltbaren oder photolabilen Verbindungen. Als Beispiele von chemisch spaltbaren Gruppen sind Ester- und Disulfid-Verbindungen bevorzugt (Herman et al. Method in Enzymology 1990 v. 184 S. 584, Lomant et al. J. Mol. Biol. 1976 v. 104 243, "Chemistry of carboxylic acid and esters" S. Patai 1969 Interscience Publ.). Beispiele für photolabile Verbindungen können in folgenden Literaturstellen gefunden werden: "Protective groups in organic synthesis" 1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 S. 1, V. Pillai Org. Photochem. 1987 v. 9 S. 225.
Die Position der spaltbaren Verbindung/Gruppe im Linker ist vorzugsweise nicht weiter als 10 Atome von der Base entfernt, noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt liegt die spaltbare Verbindung oder Gruppe direkt an der Base.
Der Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vor­ handen und muß unter milden Bedingungen (s. o.) verlaufen, so daß die Nukleinsäuren nicht beschädigt oder modifiziert werden.
Die Spaltung läuft bevorzugt chemisch (z. B. in milder saurer oder basischer Umgebung für eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittel, z. B. Dithiothreitol (Sigma) bei der Spaltung einer Disulfid-Verbindung), siehe Beispiel 1, oder physikalisch (z. B. durch Beleuchtung der Oberfläche mit Licht einer bestimmten Wellenlänge für die Spaltung einer photolabilen Gruppe) ab.
Nach der Spaltung verbleibt an der Base ein Linkerrest (A) (Fig. 7c).
Die Synthese eines spaltbaren Linkers wird an Beispielen gezeigt (vgl. Beispiele 1 und 2).
4.5.7 Kombination von Polymerase und NT*
Insgesamt spielen die Größe, die Ladung und die chemische Struk­ tur des Markers, die Länge des spaltbaren Linkers und des Linker- Rests sowie auch die Wahl der Polymerase eine wichtige Rolle. Sie bestimmen gemeinsam, ob das markierte NT* durch die Polymerase in die wachsende Nukleinsäurekette eingebaut wird, und ob dadurch der Einbau des nächsten markierten NT* verhindert wird. Zwei Bedingungen sind dabei besonders zu berücksichtigen:
Einerseits ist es wichtig, daß die Polymerase die Nukleinsäure­ kette mit dem eingebauten modifizierten NT* nach der Spaltung des Linkers weiter verlängern kann. Es ist also wichtig, daß der Linkerrest "A" (Fig. 7c) nach der Spaltung keine wesentliche Störung für die weitere Synthese darstellt. Andererseits müssen eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es können viele für die Reaktion geeignete NTs* synthetisiert wer­ den. Im einzelnen muß für jede Kombination aus Polymerase und NTs* eine Vorversuchsreihe durchgeführt werden, in der die Taug­ lichkeit eines bestimmten NT*-Typs für die Sequenzierung erprobt wird.
Die Pufferbedingungen werden nach Angaben des Polymeraseherstel­ lers gewählt. Die Reaktionstemperatur wird für nicht thermostabi­ le Polymerasen nach Angaben des Herstellers gewählt (z. B. 37°C für Sequenase Version 2), für thermostabile Polymerasen (z. B. Taq-Polymerase) beträgt die Reaktionstemperatur maximal den Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt die maximale Reaktionstemperatur bei 42°C). Diese Pufferbedingungen und Reaktionstemperatur werden weiter als "optimale Puffer- und Temperaturbedingungen" bezeichnet.
Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in einem Zyklus) beträgt vorzugsweise weniger als eine Stunde, idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 min.
Als Beispiele von geeigneten Kombinationen zwischen NT* und Polymerase sind folgende Kombinationen zu nennen:
  • a) NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, Fig. 7e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) in Kombina­ tion mit Sequenase Version 2, Taq-Polymerase (GibcoBRL), ProHA- DNA-Polymerase (Eurogentec) oder DNA-Polymerase Beta aus Säugetieren (Chimerx).
  • b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, Fig. 7f, g, j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase Version 2 oder oder ProHATM-Polymerase (Eurogentech).
Die Tauglichkeit eines Linkerrests an der Base (A) für die Reak­ tion kann man in einem Testsystem prüfen. Dabei werden gespaltene NTs* in eine Nukleinsäurekette nacheinander einbaut. Man verwendet z. B. dUTP* mit dem gewünschten gespaltenen Linkerrest, poly-dA als Matrize, Oligo-dT20-Primer, die gewünschte Polymerase und führt unter für die jeweilige Polymerase geeigneten optimalen Puffer- und Temperaturbedingungen eine Reaktion durch. Die NT*- Konzentration liegt vorzugsweise zwischen 5 µM und 200 µM. Nach der Reaktion wird die Anzahl der in die Nukleinsäurekette eingebauten NTs* analysiert, z. B. durch die Auftrennung der Länge nach in einem Gel. Für die Rückschlüsse auf die Tauglichkeit des Linkerrests kann man folgende Angaben verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kann, so ist dieser Linkerrest für eine Sequenzierungsreaktion geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist diese Kombination aus NT* und Polymerase nicht optimal für die Sequenzierungsreaktion.
Wenn ein passender Linkerrest feststeht, muß man in einem weiteren Testsystem prüfen, ob die markierten, nicht gespaltenen NTs* als Semiterminatoren funktionieren. Das wird geprüft, indem die markierten NTs* unter für die Reaktion geeigneten optimalen Puffer- und Temperaturbedingungen mit der Polymerase und einer Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugs­ weise zwischen 5 µM und 200 µM. Die Matrize ist so zu wählen, daß der Einbau mehrerer NTs* nacheinander zu erwarten wäre, z. B. für dUTP* kann man polydA, wie im oben dargestellten Beispiel ver­ wenden. Idealerweise baut die Polymerase nur ein einziges NT* ein.
Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen durch eine Polymerase mehrere NTs* nacheinander eingebaut werden, kann man die Reaktionsparameter (z. B. NT*-Konzentration, Reaktionstemperatur) verändern und der jeweiligen Kombination aus Polymerase und NT* anpassen. Das wichtigste dabei ist, daß die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.
Erfindungsgemäß erfolgt diese Anpassung in einer Ausführungsform durch die Veränderung der Reaktionstemperatur. Die anderen Para­ meter der Reaktion werden dabei konstant gehalten.
Als Polymerasen werden beipielsweise Polymerasen verwendet, die Polymerasen ohne 3'-5'-Endonukleaseaktivität sind, vorzugsweise aus der Gruppe bestehend aus viralen Polymerasen vom Sequenase- Typ, Beta-Polymerasen aus Eukaryonten, und thermostabilen Polymerasen. Insbesondere kommen Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder ProHATM-Polymerase in Betracht.
Die NT*-Konzentration liegt bei diesen Experimenten üblicherweise zwischen 5 µM und 200 µN, vorzugsweise zwischen 10 und 100 µM. Die Konzentration der Polymerase und die Pufferbedingungen werden nach Angaben vom Hersteller gewählt. Die Dauer der Reaktion kann variieren und liegt vorzugsweise zwischen 10 sec und 10 min. was der Dauer des Einbau-Schrittes (a) in einem Zyklus entsprechen würde. Bei nicht thermostabilen Polymerasen wie z. B. Sequenase Version 2 (Amersham Pharmacia Biotech), exonuclease free Klenow- Fragment der DNA Polymerase I (Amersham Pharmacia Biotech) wird die Reaktionsthemperatur von konventionellen 37°C vorzugsweise auf 20°C bis 30°C reduziert. Bei thermostabilen Polymerasen wie z. B. Taq-Polymerase (GibcoBRL), ProHATM-Polymerase (Eurogentech) wird die Reaktionstemperatur von konventionellen 70-75°C vorzugsweise auf Werte reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen. Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer- Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt der Temperaturwert (x) bei 42°C).
In einer anderen bevorzugten Ausführungsform der Erfindung er­ folgt die Anpassung der Reaktionsbedingungen durch die Verminde­ rung der NT*-Konzentration auf unter 5 µM, die anderen Parameter der Reaktion (Pufferbedingungen, Temperaturbedingungen) werden konstant gehalten. Die Konzentration der NT* liegt vorzugsweise bei dieser Anpassung zwischen 0,5 und 5 µM. Die Dauer der Reaktion liegt zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*-Konzentration ist, daß die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.
Nach Optimierung der Reaktionsbedingungen für den Einbau eines einzelnen NT* muß man die Reaktion mit gespaltenen NTs* wieder­ holen. Unter entsprechend geänderten Reaktionsparameter muß Polymerase die gespaltenen NTs* nacheinander einbauen können.
Die Optimierungsreaktion korreliert mit dem Einbauschritt, Schritt (b), in einem Zyklus. Die für die Optimierungsreaktion ermittelten Bedingungen, die Temperatur, die Konzentration an NT*, die Pufferbedingungen, die Dauer der Reaktion werden für die Reaktion auf der Oberfläche übernommen.
Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in die NSKFs vorzugsweise so, daß an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. Das hängt damit zusammen, daß an manchen Nukleinsäureketten die Reaktion sehr langsam abläuft. Ein Einbau der NTs* an jeder komplementären Position in jedem Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur die erfolgreichen Einbaureaktionen detektiert und ausgewertet werden; eine verzögerte Reation im Nachfolgenden Zyklus führt nicht zu einem Sequenzierungsfehler.
Vorzugsweise wird für alle NTs* dieselbe Polymerase verwendet. Es können aber auch verschiedene Polymerasen für verschiedene NTs* eingesetzt werden.
4.5.8 Farbiges Kodierungsschema, Anzahl der Farbstoffe
Einen Zyklus kann man durchführen mit:
  • a) vier verschieden markierten NT*s
  • b) zwei verschieden markierten NT*s
  • c) einem markierten NT*
  • d) zwei verschieden markierten NT*s und zwei unmarkierten NTs,
d. h.
  • a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht man die Sequenzierung einer Nukleinsäurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe müssen in jedem Zyklus identifiziert werden.
  • b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen gewählt werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden markiert sind, z. B. A und G tragen die Markierung "X", C und U tragen die Markierung "Y". In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt, z. B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n + 1) werden dann U* und G* zugegeben.
  • c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NTs* einsetzen.
  • d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s/2NTs-Methode). Diese Ausführungsform kann verwendet werden, um Varianten (z. B. Muta­ tionen, oder alternativ gespleißte Gene) einer bereits bekannten Sequenz zu ermitteln.
4.6 Detektionsapparatur
Einzelne Moleküle auf einer Oberfläche kann man mit verschiedenen Methoden untersuchen. Es sind mehrere Verfahren bekannt: z. B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahfeld-Fluo­ reszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR- Mikroskopie usw. (Science 1999 v. 283 1667, Unger et al. BioTech­ niques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161, Dickson et al. Science 1996 v. 274 S. 966, Xie et al. Science 1994 v. 265 S. 361, Nie et al. Science 1994 v. 266 S. 1018, Betzig et al. Science 1993 v. 262 S. 1422).
Erfindungsgemäß werden Fluoreszenz-Signale einzelner in die Nukleinsäurekette eingebauter NTs* vorzugsweise mit einem Weitfeld-Fluoreszenz-Mikroskop oder einem Laser-Scanning- Mikroskop oder einem TIRF-Microskop (Total Internal Reflection Fluorescence Microscope).
Es sind verschiedene Varianten der Konstruktion einer solchen Apparatur möglich (Weston et al. J. Chem. Phys. 1998 v. 109 S. 7474, Trabesinger et al. Anal. Chem. 1999 v. 71 S. 279, Adachi et al. Journal of Microscopy 1999 v. 195 S. 125, Unger et al. BioTech­ niques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161, Dickson et al. Science 1996 v. 274 S. 966, Tokunaga et al. Bichem. Biophys. Res. Com. 1997 v. 235 S. 47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Unterschiede in ihrem konkreten Aufbau ergeben sich aus der Variation ihrer Einzelteile. Die Vorrichtung für das Anregungslicht kann z. B. auf der Basis eines Lasers, einer Lampe oder von Dioden funktionie­ ren. Für die Detektionsvorrichtung können sowohl CCD-Kameras als auch PMT dienen. Andere Beispiele für technische Details siehe ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluores­ cence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Es ist nicht die Aufgabe dieser Erfindung, alle möglichen technischen Varianten einer Detektionsvorrichtung aufzuzählen. Der prinzipielle Aufbau einer geeigneten Apparatur wird in einem Schema Fig. 8 erläutert. Sie besteht aus folgenden Elementen: 1 Lichtquelle zur Anregung der Fluoreszenz
2 Lichtleitender Teil
3 Scantisch
4 Vorrichtung zur Selektion von Spektren
5 Detektionsvorrichtung
6 Computer mit Steuerungs- und Analysefunktionen
Diese Elemente der Apparatur können kommerziell erworben werden (Mikroskop-Firmen: Zeiss, Leica, Nikon).
Im folgenden soll beispielsweise eine für die Detektion einzelner Moleküle geeignete Kombination aus diesen Elementen vorgestellt werden:
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil­ berdampflampe
Objektiv Planneofluar 100x, NA 1.4 (Zeiss)
Kamera Photometrix
Computer mit Software zur Steuerung und Analyse
Nachfolgend soll die Vorgehensweise bei der Detektion erläutert werden. Man beachte dabei die allgemeinen Regeln der Fluo­ reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press).
Die Detektion umfaßt folgende Phasen:
  • 1. Vorbereitung zur Detektion
  • 2. Durchführung eines Detektionsschrittes in jedem Zyklus, wobei jeder Detektionsschritt als Scanvorgang abläuft und folgende Operationen umfaßt:
    • a) Einstellung der Position des Objektivs (X,Y-Achse),
    • b) Einstellung der Fokusebene (Z-Achse),
    • c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF,
    • d) Verschiebung zur nächsten Position auf der Oberfläche.
Die Signale von in die NSKFs eingebauten NTs* werden durch das Abscannen der Oberfläche registriert. Der Scanvorgang kann in verschiedener Weise ausgeführt werden ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Vorzugsweise wird ein diskontinuierlicher Scanvorgang gewählt. Dabei wird das Objektiv schrittweise über die Oberfläche bewegt (Fig. 8a), so daß von jeder Oberflächenposition ein zweidimensionales Bild (2D- Bild) entsteht (Fig. 8b, c).
Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: z. B. durch den Laser-Scan einer Position des Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an einer Position (vgl. Handbücher der Mikroskopie). Als Beispiel wird die Detektion einzelner Moleküle mit einer CCD-Kamera beschrieben.
Die Detektion wird am Beispiel der Sequenzierung eines 1 Mb langen DNA-Stücks erläutert:
1) Vorbereitung zur Detektion
Am Anfang wird festgelegt, wie viele NSKFs zur Rekonstruktion der ursprünglichen Sequenz analysiert werden müssen. Im Fall einer Rekonstruktion nach dem Schrotschuß-Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs bestimmt. 2) Die Gesamtlänge der zu analysie­ renden Sequenz ist wichtig. 3) Bei der Sequenzierung muß ein bestimmtes Maß an Redundanz erreicht werden, um die Genauigkeit zu steigern und eventuelle Fehler zu korrigieren. Insgesamt ist zur Rekonstruktion des größten Teils der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d. h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb Rohsequenzdaten gebraucht. Bei einer durchschnittlichen Sequenz­ länge von 400 bp pro NSKF benötigt man entsprechend 25 000 bis 250 000 DNA-Fragmente.
2) Durchführung eines Detektionsschrittes in jedem Zyklus
Zur Sequenzierung müssen die Positionen der NSKFs bestimmt wer­ den, damit man eine Grundlage für die Zuordnung der Signale hat. Die Kenntnis dieser Positionen erlaubt eine Aussage darüber, ob die Signale einzelner Moleküle von eingebauten NTs* stammen oder von zufällig an die Oberfläche gebundenen NTs*. Diese Positionen können mit verschiedenen Methoden identifiziert werden.
In einer bevorzugten Ausführungsform werden die Positionen immo­ bilisierter NSKF während der Sequenzierung identifiziert. Dabei wird die Tatsache genutzt, daß die Signale von den in die Nu­ kleinsäurekette eingebauten NTs* immer dieselben Koordinaten haben. Das ist durch die Fixierung der Nukleinsäureketten ge­ währleistet. Die unspezifisch gebundenen NTs* binden zufällig an verschieden Stellen der Oberfläche.
Zur Identifizierung der Positionen von fixierten NSKFs werden die Signale auf Übereinstimmung ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen überprüft. Das kann z. B. am Anfang der Sequenzierung erfolgen. Die übereinstimmende Koordinaten werden als Koordinaten der DNA-Fragmente bewertet und gespei­ chert.
Das Scan-System muß reproduzierbar über mehrere Zyklen die Ober­ fläche abscannen können. X, Y und Z-Achsen-Einstellungen an jeder Oberflächenposition können von einem Computer kontrolliert wer­ den. Stabilität und Reproduzierbarkeit der Einstellung von Ob­ jektivpositionen in jedem Scanvorgang entscheiden über die Qua­ lität der Detektion und somit über die Identifizierung der Si­ gnale einzelner Moleküle.
a) Einstellung der Position des Objektivs (X, Y-Achse)
Die mechanische Instabilität der kommerziell erhältlichen Scan­ tische und die geringe Reproduzierbarkeit der wiederholten Ein­ stellung derselben X, Y-Positionen machen eine präzise Analysen der Signale einzelner Moleküle über mehrere Zyklen schwierig. Es existieren viele Möglichkeiten, eine Übereinstimmung der Koor­ dinaten bei wiederholten Einstellungen zu verbessern bzw. mögli­ che Abweichungen zu kontrollieren. Als Beispiel wird eine Kontrollmöglichkeit angeführt. Nach einer groben mechanischen Einstellung der Objektivposition wird ein Kontrollbild von einem mit der Oberfläche fest verbundenen Muster gemacht. Auch wenn die mechanische Einstellung nicht exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 µm sind durchaus möglich), kann man mittels optischer Kontrolle eine Korrektur vornehmen. Das Kontrollbild vom Muster dient als Koordinatensystem für das Bild mit Signalen von eingebauten NTs*. Eine Voraussetzung für eine solche Korrektur ist, daß keine weiteren Bewegungen der Ober­ fläche zwischen diesen beiden Aufnahmen gemacht werden. Signale von einzelnen Molekülen werden in Relation zum Muster gesetzt, so daß eine X, Y-Abweichung in der Musterposition gleiche X, Y- Abweichung in der Position der Signale einzelner Moleküle bedeu­ tet. Das Kontrollbild vom Muster kann vor, während oder nach der Detektion einzelner Moleküle gemacht werden. Ein solches Kon­ trollbild muß entsprechend bei jeder Einstellung auf einer neuen Oberflächenposition gemacht werden.
b) Einstellung der Fokusebene (Z-Achse)
Die Oberfläche ist nicht absolut plan und weist verschiedene Unebenheiten auf. Dadurch verändert sich der Oberfläche-Objektiv- Abstand beim abscannen benachbarter Stellen. Diese Unterschiede im Abstand können dazu führen, daß einzelne Moleküle die Fokusebene verlassen und so der Detektion entgehen.
Aus diesem Grund ist es wichtig, daß beim Abscannen der Ober­ fläche eine reproduzierbare Einstellung der Fokusebene an jeder Objektivposition erreicht wird.
Es gibt verschiedene Möglichkeiten, die Fokusebene reproduzierbar einzustellen. Beispielsweise kann folgende Methode angewendet werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer Fluoreszenz führen kann, wird auf die Oberfläche ein Marker aufgebracht, der zur Einstellung der Fokusebene dient. Danach erfolgt die Detektion der Signale einzelner Moleküle. Der Marker kann beliebiger Natur sein (z. B. Farbstoff oder Muster), darf aber die Detektion und die Reaktion nicht beeinträchtigen.
c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF
Das mit Hilfe des Detektionssystems erzeugte zweidimensionale Bild der Reaktionsoberfläche enthält die Signalinformationen von in die NSKFs eingebauten NT*s. Diese müssen vor der weiteren Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit geeigneten Methoden extrahiert werden. Die dazu notwendigen Algorithmen zur Skalierung, Transformation und Filterung der Bildinformationen zählen zum Standardrepertoir der digitalen Bildverarbeitung und Mustererkennung (Haberäcker P. "Praxis der Digitalen Bildverarbeitung und Mustererkennung". Hanser-Verlag, München, Wien, 1995; Galbiati L. J. "Machine vision and digital image processing fundamentals". Prentice Hall, Englewood Cliffs, New Jersey, 1990). Die Signalextraktion erfolgt vorzugsweise über ein Grauwertbild, das die Helligkeitsverteilung der Reaktions­ oberfläche für den jeweiligen Fluoreszenzkanal abbildet. Wenn bei der Sequenzierungsreaktion mehrere Nukleotide mit unterschied­ lichen Fluoreszenz-Farbstoffen verwendet werden, kann zunächst für jedes verwendete fluoreszenzmarkierte Nukleotid (A, T, C, G oder U) ein separates Grauwert-Bild erzeugt werden. Dafür können prinzipiell 2 Verfahren angewendet werden:
  • 1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersätze) wird für jeden Fluoreszenzkanal ein Grauwertbild erzeugt.
  • 2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines geeigneten Algorithmus durch ein Bildverarbeitungsprogramm die relevanten Farbkanäle extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer Farb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt:
GBN
= (s(x, y)) einkanaliges Grauwertbild
N{1, . . ., Anzahl der Fluoreszenzkanäle}.
M = {0, 1, . . ., 255} Grauwertmenge
S = (s(x, y)) Bildmatrix des Grauwertbildes
x = 0, 1, . . ., L-1 Bildzeilen
y = 0, 1, . . ., R-1 Bildspalten
(x, y) Ortskoordinaten eines Bildpunktes
s(x, y) ∈ M Grauwert des Bildpunktes.
Aus dieser Datenmenge wird nun durch ein geeignetes Programm die relevante Bildinformation extrahiert. Ein solches Programm sollte folgende Arbeitsschritte realisieren:
Für GB1 bis GBN durchführen:
  • A) Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa durch Grauwertglättung.
  • B) Prüfung jedes Bildpunkt (x, y) des Grauwertbildes, ob dieser Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter anderem von der verwendeten Detektionsapparatur und der Auflösung des Grauwertbildes ab. Sie können beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der Bildsegmentierung reichen von einfachen Schwellwert­ verfahren bis hin zur Verwendung neuronaler Netze.
Erfüllt ein Bildpunkt (x, y) diese Anforderungen, dann folgt ein Vergleich mit den Koordinaten von in bisher durchgeführten Sequenzierungszyklen identifizierten NSKFs. Bei einer Über­ einstimmung erfolgt die Zuordnung des Signals mit dem aus dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem NSKF. Signale mit nicht übereinstimmenden Koordinaten werden als Hintergrundsignale bewertet und verworfen. Die Analyse der Signale kann parallel zum Scanvorgang erfolgen.
In einer beispielhaften Ausführung wurde ein 8-Bit-Grauwertbild mit einer Auflösung von 1317 × 1035 Pixel verwendet. Um die durch die Digitalisierung entstandenen Veränderungen am Bild zu reduzieren, erfolgte zunächst eine Vorverarbeitung des Gesamt­ bildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung entsteht dadurch ein für einen Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt mit dem größten Helligkeitswert und Nachbarbildpunkten mit nach allen Seiten hin abfallenden Helligkeiten. Erfüllte ein Bildpunkt diese Kritierien und Überschritt der zentrifugale Helligkeitsabfall einen bestimmten Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte), dann wurde dieser zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes gewertet.
  • a) Verschiebung des Objektivs zur nächsten Position auf der Oberfläche. Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer anderen Position der Oberfläche positioniert.
Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der X, Y-Position, der Einstellung der Fokusebene und mit der Detektion einzelner Moleküle bei jeder neuen Objek­ tivposition gemacht werden. Diese Schritte können durch einen Computer gesteuert werden.
4.7 Zeitlicher Ablauf der Verfahrensschritte
Der Scanvorgang sowie die biochemische Reaktion nehmen eine gewisse Zeit in Anspruch. Wenn man diese Vorgänge nacheinander schaltet, kann man eine optimale Leistung der Apparatur errei­ chen. In einer bevorzugten Ausführung wird die Reaktion auf zwei getrennten Oberflächen durchgeführt (Fig. 9).
Als Beispiel kann eine Oberfläche mit immobilisierten NSKFs in 2 räumlich isolierte Teile getrennt werden, so daß Reaktionen auf diesen beiden Teilen unabhängig voneinander ablaufen können. In einem anderen Beispiel können NSKFs auch von vornherein auf 2 getrennten Oberflächen immobilisiert werden.
Danach wird die Reaktion gestartet. Das Prinzip dabei ist, daß während auf einem Teil der Oberfläche die Reaktions- und Wasch­ schritte ablaufen, der zweite Teil abgescannt wird. Dadurch kann man einen kontinuierlichen Ablauf der Analyse erreichen und die Geschwindigkeit der Sequenzierung steigern.
Die Anzahl der Oberflächen, auf denen die Reaktion abläuft, kann auch größer als 2 sein. Das erscheint dann sinnvoll, wenn die Reaktion als zeitlich limitierender Schritt auftritt, d. h. die Detektion der Signale auf der Oberfläche schneller als die Reak­ tions- und Waschschritte abläuft. Um die Gesamtdauer der Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne Schritt der Reaktion auf einer einzelnen Oberfläche mit einer zeitlichen Verzögerung im Vergleich zur nächsten Oberfläche ablaufen.
Die Erfindung wird nachfolgend anhand von Beispielen verdeut­ licht.
Beispiele Beispiel 1
Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 7f-1) Als Ausgangssubstanzen dienen 5-(3-Aminoallyl)-2'-deoxyuridin- 5'-triphosphat, AA-dUTP, (Sigma), 3,3'-Dithio-bis(propionsäure- N-Nydroxysuccinimidester), DTBP-NHS, (Sigma), 2-Mercaproethanol­ amin, MEA, (Sigma). Zu 100 µl 50 mM Lösung von AA-dUTP in 100 mM Borat-Puffer pH 8.5 werden 3 Äquivalente an DTBP-NHS in DMF (25 µl 0.4M Lösung) zugegeben. Das Reaktionsgemisch wird 4 Stunden bei RT. inkubiert. Anschließend wird konz. Ammonium­ acetat-Lösung (pH 9) zugegeben bis die Gesamtkonzentration an CH3COONH4 in der Reaktionslösung 100 mM ist, und die Reaktion wird eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch 200 µl 1M MEA-Lösung, pH 9, zugegeben und eine Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die Iodfarbe bestehen bleibt. Die modifizierten Nukleotide werden auf einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient (pH 8.5) von anderen Reaktionsprodukten abgetrennt. Isolierung des Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An diesen Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in Enzymology 1997, v. 278, S. 363).
Auch andere Nukleotidanaloga (z. B. nach Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356) können in die Reaktion eingesetzt werden, so daß Nukleotidanaloga mit Struktu­ ren in Fig. 7f-2, 3, 4 und 7g-1, 2 erzeugt werden können.
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat) angegeben (NT*-Struktur Fig. 7j)
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 µl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*). Dazu werden 10 µl 10 mM TRITC in Dimethylformamid (DMF) gegeben und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
Beispiel der Spaltung der Disulphidverbindung im modifizierten NT*. Die Spaltung erfolgt durch eine Zugabe von 20 bis 50 mM Dithiothreitol-Lösung DTT (Sigma) Lösung pH 8 auf die Reaktions­ oberfläche. Die Oberfläche wird 10 min. mit dieser Lösung inkubiert, danach wird die Lösung entfernt und die Oberfläche mit einer Pufferlösung zur Entfernung von DTT-Resten gewaschen.
Beispiel 2
Modifiziertes dUTP (dUTP-SS-CH2CH2NH2) mit einem kurzen spaltbaren Linker (Fig. 7e-1). Als Ausgangssubstanzen dienen: Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, v. 180, S. 383), 2-Mercaptoethanolamin (MEA) (Sigma).
Zu 400 µl 100 mM Bis-dUTP in 40 mM Boratpuffer pH 8.5 werden 100 µl 100 mM MEA-Lösung pH 8.5 in H2O zugegeben und 1 Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die Iodfarbe bestehen bleibt. Die Nukleotide (Bis-dUTP und dUTP-SS- CH2CH2NH2) können z. B. durch eine Ethanol-Präzipitation oder auf einer DEAE-Cellulose-Säule im Ammoniumcarbonat-Gradienten (pH 8.5) von anderen Reaktionsprodukten abgetrennt werden. Bis-dUTP stört bei der anschließenden Ankopplung eines Farbstoffs an die Aminogruppe des Linkers nicht, so daß die Abtrennung des dUTP-SS- CH2CH2NH2 von bis-dUTP im Endreinigungsschritt erfolgen kann.
In einer ähnlichen Weise kann auch dCTP (Fig. 7-e2) modifiziert werden, dabei dient Bis-dCTP als Ausgangssubstanz (synthetisiert nach Hanna et al. Nucleic Acid Research 1993, v. 21, S. 2073).
An den Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in Enzymology 1997, v. 278, S. 363).
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung des FluoroLinkTM Cy3 monofunktional dye (Amersham Pharmacia biotech) (NT*-Struktur Fig. 71) angegeben. Das ist ein monofunktionaler NHS-Ester-Fluoreszenzfarbstoff. Die Reaktion wird nach Angaben des Herstellers durchgeführt:
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 µl 100 mM Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird Farbstoff (300 nmol) gegeben und 1 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5- isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC Fig. 7h).
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 µl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*). Dazu werden 10 µl 10 mM TRITC in DMF gegeben und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
Beispiel 3 Sequenzanalyse mit 4 markierten NTs*
Bei einer bevorzugten Ausführungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenzfarbstoffen markiert.
3A. Rekonstruktion der ursprünglichen Sequenzen nach dem Schrot­ schuß-Prinzip ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. 16523 00070 552 001000280000000200012000285911641200040 0002010120797 00004 16404Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Com­ put. Biol. 1994 v. 1 S. 257). (Dieses Prinzip ist insbesondere bei der Analyse neuer, unbekannter Sequenzen geeignet.) 3A-1 Sequenzierung eines langen DNA-Stücks (Fig. 1)
Im folgenden soll anhand der Sequenzierung eines 1 Mb langen DNA-Stückes schematisch die Sequenzierung langer Nukleinsäu­ reketten dargestellt werden (Fig. 1). Der Sequenzierung liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequen­ cing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Das zu analysierende Material wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird. Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen. Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen Oberfläche fixiert. Die nicht gebundenen DNA- Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktions­ oberfläche durchgeführt. Zur Rekonstruktion einer 1 Mb langen DNA-Sequenz sollten die Sequenzen von NSKFs vorzugs­ weise länger als 300 NTs sein, durchschnittlich ca. 400 bp.
Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 400 Zyklen zur Sequenzierung notwendig.
Insgesamt ist zur Rekonstruktion der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforder­ lich, d. h. 10 bis 100 Mb. Bei einer durchschnittlichen Sequenzlänge von ca. 400 bp pro NSKF benötigt man entspre­ chend 25 000 bis 250 000 DNA-Fragmente, um mehr als 99,995% der Gesamtsequenz abzudecken.
Die ermittelten NSKF-Sequenzen stellen eine Population von überlappenden Teilsequenzen dar, die sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammen­ fügen lassen ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).
3A-2 Sequenzierung der Genprodukte am Beispiel der cDNA- Sequenzierung
In einer bevorzugten Ausführungsform können statt einer Sequenz mehrere Sequenzen in einem Ansatz analysiert werden. Die ursprünglichen Sequenzen können aus den gewonnen Rohdaten z. B. nach dem Schrotschuß-Prinzip rekonstruiert werden.
Zunächst werden NSKFs erzeugt. Man kann z. B. mRNA in eine doppelsträngige cDNA überführen und diese cDNA mit Ul­ traschall fragmentieren. Anschließend werden diese NSKFs mit einer Primerbindungsstelle versehen, denaturiert, immobili­ siert und mit einem Primer hybridisiert. Zu beachten ist bei dieser Variante der Probenvorbereitung, daß die cDNA- Moleküle unvollständige mRNA-Sequenzen darstellen können (Method in Enzymology 1999, v. 303, S. 19 und andere Artikel in diesem Band, "cDNA library protocols" 1997 Humana Press).
Eine andere Möglichkeit bei der Generierung einzelsträngiger NSKFs von mRNA besteht in der reversen Transkription der mRNA mit randomisierten Primern. Dabei werden viele relativ kurze antisense DNA-Fragmente gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 S. 264, Decraene et al. Biotechniques 1999 v. 27 S. 962). Diese Fragmente können anschließend mit einer Primerbindungstelle versehen werden (s. o). Weitere Schritte entsprechen oben beschriebenen Vorgängen. Mit dieser Methode können komplette mRNA-Sequenzen (vom 5'- bis zum 3'-Ende) analysiert werden, da die randomisierten Primer über die gesamte Länge der mRNA binden.
Immobilisierte NSKFs werden mit einer der oben angeführten Ausführungsformen der Sequenzierung analysiert. Da mRNA- Sequenzen wesentlich weniger repetitive Sequenzen aufweisen als z. B. genomische DNA, kann die Anzahl der detektierten Signale der eingebauten NTs* von einem NSKF geringer als 300 sein und liegt vorzugsweise zwischen 20 und 1000. Die Anzahl der NSKFs, die analysiert werden müssen, errechnet sich nach denselben Prinzipien wie bei einer Schrotschuß-Rekonstruk­ tion einer langen Sequenz.
Aus NSKF-Sequenzen werden nach den Prinzipien des Schrot­ schuß-Verfahrens die ursprünglichen Gensequenzen rekon­ struiert.
Diese Methode erlaubt die gleichzeitige Sequenzierung von vielen mRNAs ohne vorherige Klonierung.
3B. Analyse von Sequenzvarianten
Die Bestätigung einer bereits bekannten Sequenz oder der Nachweis von Varianten dieser Sequenz stellt sehr viel geringere Ansprüche an die Länge und Redundanz der ermittel­ ten NSKFs. Auch die Sequenzbearbeitung ist in diesem Fall einfacher. Die Vollsequenz braucht nicht neu rekonstruiert zu werden. Die NSKF-Sequenzen werden vielmehr mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z. B. BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).
Die zu analysierende Sequenz wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequenziert. Anschließend werden die ermittelten Sequenzen von NSKFs nicht nach dem Schrot­ schuß-Verfahren zusammengestzt, sondern mit der Referenz­ sequenz verglichen und auf diese Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei kann es sich um genomische oder cDNA-Sequenzen handeln.
Im Gegensatz zu einer Rekonstruktion nach dem Schrotschuß- Verfahren braucht man für die Analyse einer Sequenzvariante erheblich weniger Rohsequenzdaten. So kann die 5- bis 10- fache Rohsequenzmenge ausreichend für die Wiederherstellung einer neuen Variante einer Vollsequenz sein. Mit dem Schrot­ schuß-Verfahren wird für eine Wiederherstellung eine 10- bis 100-fache Menge an Rohsequenzen benötigt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).
Die Länge der ermittelten NSKF-Sequenzen soll für eine eindeutige Zuordnung zu einer bestimmten Position in der Referenzsequenz ausreichend sein, so können z. B. bereits Sequenzen mit einer Länge von 20 NTs (z. B. aus nicht repetitiven Abschnitten im menschlichen Genom) eindeutig identifiziert werden. Für die Vergleichsanalyse der repet­ itiven Abschnitte werden längere Sequenzen benötigt. Die genaue Länge der Sequenzen hängt dabei von der Aufgaben­ stellung ab. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs.
Die Zielsetzungen bei der Sequenzierung neuer Varianten einer bereits bekannten Vollsequenz können sehr unter­ schiedlich sein. Meist wird ein Vergleich der neu ermittel­ ten Sequenz mit der bekannten Vollsequenz/Referenzsequenz angestrebt. Dabei können die beiden Sequenzen aus evolutio­ när unterschiedlich weit auseinanderliegenden Spezies stammen. Verschiedene Parameter der Zusammensetzung dieser beiden Sequenzen können verglichen werden. Als Beispiele für eine solche Analyse dienen: Mutations- oder Polymorphismus­ analysen und die Analyse von alternativ gespleißten Gen­ produkten.
Nachfolgend soll beispielhaft ein Vergleich der zu unter­ suchenden Sequenz mit einer Referenzsequenz ohne vorherige Rekonstruktion der zu analysierenden Sequenz betrachtet werden. Ein solcher Vergleich kann z. B. zur Mutations- oder SNP-Analyse dienen.
3B-1
Eine lange, zu analysierende Sequenz, z. B. 1 Mb, wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequen­ ziert. Die ermittelten Sequenzen von jedem einzelnen NSKF werden direkt mit der Referenzsequenz verglichen. Die Referenzsequenz dient dabei als Grundlage für die Zuordnung ermittelter NSKF-Sequenzen, so daß die aufwendige Rekon­ struktion nach dem Schrotschuß-Verfahren entfällt. Vorzugs­ weise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs. Die Anzahl der zu analysierenden NSKFs richtet sich dabei nach der Gesamtlänge der zu untersuchenden Sequenz, der durchschnittlichen Länge der NSKF-Sequenzen und der notwendigen Genauigkeit der Sequenzierung. Bei einer durchschnittlichen Länge der ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlänge der zu unter­ suchenden Sequenz von 1 Mb und einer Genauigkeit, die der Rohsequenzermittlung entspricht (d. h. jede Stelle soll möglichst nur einmal sequenziert werden) benötigt man z. B. die ca. 5-fache Menge an Rohsequenzen, d. h. 5 Mb, weil die Verteilung der NSKFs über die Gesamtsequenz zufällig erfolgt. Insgesamt müssen 50 000 NSKFs analysiert werden, um mehr als 99% der Gesamtstrecke abzudecken.
Anschließend werden die ermittelten NSKF-Sequenzen mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z. B. BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).
Beispiel 4 Sequenzanalyse mit 2 markierten NTs* und 2 unmarkierten NTs (2NTs*/2NTs-Methode)
In einer anderen Ausführungsform werden für die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs einge­ setzt.
Diese Methode eignet sich besonders zur Analyse der Sequenzva­ rianten (z. B. SNP- oder Mutationsanalyse) und setzt die Kenntnis einer Referenzsequenz voraus. Dabei wird die Vollsequenz nicht rekonstruiert, sondern die ermittelten Sequenzen werden mit Hilfe eines Programms der Referenzsequenz zugeordnet und eventuelle Abweichungen registriert. Einem solchen Programm kann z. B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).
Diese Ausführungsform beruht auf dem Prinzip, daß eine Abfolge aus 2 Signalen (markierte NT*s) genügend Informationen zur Identifizierung einer Sequenz enthalten kann. Die ermittelte Sequenz wird mit der Referenzsequenz verglichen und einer bestimmten Position zugeordnet, z. B.:
Die unbekannte, zu analysierende Variante der Referenzsequenz wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK wird in NSKFs überführt, diese werden mit PBS ligiert, anschließend mit einem Primer hybridisiert und auf Reaktionsoberfläche immobilisiert). Auf diese Weise vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode sequenziert. Man erhält NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge aus 2NTs* darstellt. Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten NSKF- Sequenzen mehr als 40 NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, ist die Gesamtlänge des synthetisierten komplementären Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 40 detektierten NTs* beträgt die Gesamt­ länge z. B. durchschnittlich 80 NTs).
Zur Synthese eines komplementären Stranges werden 4 Nukleotide benötigt. Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden Erfindung als Semiterminatoren auftreten, d. h. die Termination ausschließlich bei Verfügbarkeit modifi­ zierter NTs* auftritt, müssen unmodifizierte NTs in einem zu­ sätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue Position dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei ist, daß die markierten NTs* und die unmodifizierte NTs getrennt verwendet werden.
Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgen­ dermaßen aussehen:
  • a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten NSKFs
  • b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der kom­ plementären Stränge um ein NT geeignet sind
  • c) Waschen
  • d) Detektion der Signale von einzelnen, modifizierten und in die den NSKFs komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülen
  • e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotiden
  • f) Waschen
  • g) Zugabe von 2 unmodifizierten NTs und Polymerasen
  • h) Waschen.
Die Konzentration der NTs liegt vorzugsweise unter 1 mM, idealer­ weise unter 10 µM.
Diese 2NT*s/2NTs-Methode eignet sich beispielsweise für die SNP- Analyse einer genomischen Strecke eines Gens oder für doppel­ strängige cDNA-Analyse. Ihr liegen folgende Prinzipien zugrunde:
  • 1. Die genetische Information in jedem der beiden komplementä­ ren DNA-Stränge ist identisch, so daß fehlende Informationen in einem Strang durch die Information aus dem anderen Strang vervollständingt werden können.
  • 2. Durch bestimmte Paarkombinationen markierter NTs* kann man mit nur 2NTs* die komplette Information aus einer doppel­ strängigen DNA erhalten. Zulässige Kombinationen von NT*s bei dieser Ausführungsform sind: A*C*; A*G*; C*T*/C*U*; G*T*/G*U*. Bevorzugt wird die Kombination C* und U*
  • 3. Als Grundlage der Analyse dient eine bereits bekannte Refe­ renzsequenz.
  • 4. Die NSKFs stammen von beiden Strängen der zu analysierenden NSK und die ermittelten NSKF-Sequenzen decken die gesamte Länge der zu analysierenden Sequenz ab.
Am folgenden Beispiel wird erklärt, wie die Information aus einem doppelsträngigen DNA-Fragment mit nur 2 markierten NTs* gewonnen wird und wie die Unterschiede zur ursprünglichen oder nicht mutierten Sequenz (Referenzsequenz/Vergleichsequenz) festge­ stellt werden können. Sequenzen unter (1) und (2) sind bis auf eine Stelle identisch (unterstrichen). A* und C* sind markiert.
1) zu prüfende Sequenz
Die zu prüfende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert, so daß eine Population an NSKF-Sequenzen (ermittelte NSKF- Sequenzen(n)) entsteht. Diese ermittelten NSKF-Sequenzen enthalten Information von jedem Strang:
2) Vergleichsequenz
Zur Analyse ist eine Vergleichsequenz (Referenzsequenz) erforder­ lich:
3) Vergleichsequenz mit angepaßten ermittelten NSKF-Sequenzen
Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen bestimmten Stellen in der Vergleichsequenz zugeordnet und eventuelle Abweichungen detektiert:
Mit dieser Ausführungsform kann man eine doppelsträngige Nukleinsäure auf SNP oder Mutationen untersuchen. Dabei werden die ermittelten NSKF-Sequenzen mit einer Referenzsequenz verglichen. Die Grundregeln des Vergleichs einer Teilsequenz und einer kompletten Sequenz bei der Analyse mit nur 2 markierten NTs unterscheiden sich nicht prinzipiell von denen, die bei dem Vergleich der Sequenzen anhand aller 4 markierten NTs* gelten. Näheres s. Sequenzvergleich bei Mutationsanalyse und SNP-Analyse mit 4NTs* (Beispiel 3B).
SEQUENZPROTOKOLL

Claims (42)

1. Verfahren zur Sequenzanalyse von Nukleinsäuresequenzen (Nu­ kleinsäureketten, NSKs), bei dem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
  • a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifi­ zierte Nukleotide (NTs*) enthält, die mit Fluoreszenz­ farbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedli­ cher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang ein­ zubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer ste­ risch anspruchsvoller Ligand ist, man
  • b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplemen­ tären Stränge jeweils um ein NT* verlängert werden, man
  • c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man
  • d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarb­ stoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluo­ reszenzsignale auf der Reaktionsoberfläche bestimmt, man
  • e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo­ reszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man
  • f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz­ farbstoffe und der Liganden geeignet sind, man
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,
wobei man die relative Position einzelner NSKFs auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spe­ zifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluores­ zenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus nur jeweils ein markiertes NT* einsetzt.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils zwei unter­ schiedlich markierte NTs* einsetzt.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in jedem Zyklus jeweils vier unter­ schiedlich markierte NTs* einsetzt.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die NSKs Varianten einer bekannten Referenzsequenz sind und man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz ermittelt.
6. Verfahren nach den Ansprüchen 1 bis 5, dadurch gekenn­ zeichnet, daß man in die NSKFs jeweils eine Primerbin­ dungsstelle (PBS) einführt, wobei man bei doppelsträngigen NSKs an beiden komplementären Einzelsträngen jeweils eine PBS einführt und wobei die Primerbindungsstellen für alle NSKFs jeweils gleiche oder verschiedene Sequenzen aufweisen.
7. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekenn­ zeichnet, daß man die NSKFs mit Primern unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen, und man die NSKFs anschließend auf der Reaktions­ oberfläche immobilisiert.
8. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekenn­ zeichnet, daß man die NSKFs zunächst auf der Reaktionsober­ fläche immobilisiert und erst anschließend mit Primern unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.
9. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekenn­ zeichnet, daß man die Primer zunächst auf der Reaktionsober­ fläche immobilisiert und erst anschließend mit NSKFs unter Bedingungen in Kontakt bringt, die zur Hybridisierung der Primer an die Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei die Primer untereinander gleiche oder verschiedene Sequenzen aufweisen.
10. Verfahren nach den Ansprüchen 1 bis 9, dadurch gekenn­ zeichnet, daß der zur strukturellen Modifikation verwendete sterisch anspruchsvolle Ligand der zur Markierung verwendete Fluoreszenzfarbstoff ist.
11. Verfahren nach den Ansprüchen 1 bis 10, dadurch gekenn­ zeichnet, daß die Reaktionsoberfläche aus der Gruppe bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die Kunststoffe Polycarbonate oder Polystyrole sind.
13. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die Gele Agarose- oder Polyacrylamidgele sind.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß die Gele 1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamid- Gele sind.
15. Verfahren nach den Ansprüchen 1 bis 14, dadurch gekennzeich­ net, daß die DNA-Polymerase eine DNA-Polymerase ohne 3'-5'- Endonukleaseaktivität ist.
16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, daß die Polymerase aus der Gruppe bestehend aus viralen DNA-Polymerasen vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten und thermostabilen Polymerasen ausgewählt ist.
17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die DNA-Polymerase Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder ProHA-DNA-Polymerase ist.
18. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die DNA-Polymerase Sequenase Version 2 ist.
19. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die DNA-Folymerase Taq-Polymerase ist.
20. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die DNA-Polymerase ProHa-DNA-Polymerase ist.
21. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die DNA-Polymerase DNA-Polymerase Beta aus Säugetieren ist.
22. Verfahren nach den Ansprüchen 1 bis 14, dadurch gekennzeich­ net, daß die NTs* alpha-Phosphorothioat-NTs* sind und die Polymersase das Klenow-Fragment von E.coli-Polymerase I oder T4-DNA-Polymerase ist.
23. Verfahren nach den Ansprüchen 1 bis 18, dadurch gekennzeich­ net, daß die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten ausgewählt sind.
24. Kit zur Durchführung des Verfahrens nach den Ansprüchen 1 bis 23, dadurch gekennzeichnet, daß es eine Reaktionsober­ fläche (einen festen Träger), zur Durchführung des Verfah­ rens erforderliche Reaktionslösungen, ein oder mehrere Poly­ merasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die markierten NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*), daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Li­ gand ist.
25. Kit nach Anspruch 20, dadurch gekennzeichnet, daß der zur strukturellen Modifikation verwendete sterisch anspruchs­ volle Ligand der zur Markierung verwendete Fluoreszenzfarb­ stoff ist.
26. Kit nach Anspruch 24 oder 25, dadurch gekennzeichnet, daß es ferner Bestandteile enthält:
  • a) zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien,
  • b) Nukleinsäuremoleküle, die als PBS in die NSKFs einge­ führt werden,
  • c) Oligonukleotid-Primer,
  • d) zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien,
und/oder
  • a) Waschlösungen.
27. Kit nach den Ansprüchen 24 bis 26, dadurch gekennzeichnet, daß die Reaktionsoberfläche aus der Gruppe bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.
28. Kit nach Anspruch 27, dadurch gekennzeichnet, daß die Kunst­ stoffe Polycarbonate oder Polystyrole sind.
29. Kit nach Anspruch 27, dadurch gekennzeichnet, daß die Gele Agarose- oder Polyacrylamidgele sind.
30. Kit nach Anspruch 29, dadurch gekennzeichnet, daß die Gele 1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamid-Gele sind.
31. Kit nach den Ansprüchen 24 bis 30, dadurch gekennzeichnet, daß die DNA-Polymerase eine DNA-Polymerase ohne 3'-5'- Endonukleaseaktivität ist.
32. Kit nach Anspruch 31, dadurch gekennzeichnet, daß die Poly­ merase aus der Gruppe bestehend aus viralen DNA-Polymerasen vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten und thermostabilen DNA-Polymerasen ausgewählt ist.
33. Kit nach Anspruch 32, dadurch gekennzeichnet, daß die DNA- Polymerase Sequenase Version 2, Polymerase Beta aus Säuge­ tieren, Taq-Polymerase oder ProHa-DNA-Polymerase ist.
34. Kit nach den Ansprüchen 24 bis 30, dadurch gekennzeichnet, daß die NT* alpha-Phosphorothioat-NTs* sind und die Polymer­ sase das Klenow-Fragment von E.coli-Polymerase I oder T4- DNA-Polymerase ist.
35. Kit nach den Ansprüchen 24 bis 34, dadurch gekennzeichnet, daß die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten ausgewählt sind.
36. Nukleotid der Formel
37. Nukleotid der Formel
38. Nukleotid der Formel
39. Nukleotid nach Anspruch 36 bis 38, dadurch gekennzeichnet, daß an die terminale Aminogruppe ein Fluoreszenzfarbstoff angeheftet ist.
40. Nukleotid der Formel
41. Nukleotid der Formel
42. Nukleotid der Formel
DE10120797A 2001-04-27 2001-04-27 Verfahren zur Analyse von Nukleinsäureketten Expired - Lifetime DE10120797B4 (de)

Priority Applications (5)

Application Number Priority Date Filing Date Title
DE10120797A DE10120797B4 (de) 2001-04-27 2001-04-27 Verfahren zur Analyse von Nukleinsäureketten
AU2002304705A AU2002304705A1 (en) 2001-04-27 2002-04-26 Method for analysing nucleic acid chains
PCT/EP2002/004659 WO2002088382A2 (de) 2001-04-27 2002-04-26 Verfahren zur analyse von nukleinsäureketten
EP02732680A EP1381698A2 (de) 2001-04-27 2002-04-26 Verfahren zur analyse von nukleinsäureketten
JP2002585662A JP2004529650A (ja) 2001-04-27 2002-04-26 核酸鎖の解析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
DE10120797A DE10120797B4 (de) 2001-04-27 2001-04-27 Verfahren zur Analyse von Nukleinsäureketten

Publications (2)

Publication Number Publication Date
DE10120797A1 true DE10120797A1 (de) 2002-11-21
DE10120797B4 DE10120797B4 (de) 2005-12-22

Family

ID=7683014

Family Applications (1)

Application Number Title Priority Date Filing Date
DE10120797A Expired - Lifetime DE10120797B4 (de) 2001-04-27 2001-04-27 Verfahren zur Analyse von Nukleinsäureketten

Country Status (5)

Country Link
EP (1) EP1381698A2 (de)
JP (1) JP2004529650A (de)
AU (1) AU2002304705A1 (de)
DE (1) DE10120797B4 (de)
WO (1) WO2002088382A2 (de)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10214395A1 (de) * 2002-03-30 2003-10-23 Dmitri Tcherkassov Verfahren zur Analyse von Einzelnukleotidpolymorphismen
DE10149786B4 (de) * 2001-10-09 2013-04-25 Dmitry Cherkasov Oberfläche für Untersuchungen aus Populationen von Einzelmolekülen

Families Citing this family (67)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6780591B2 (en) 1998-05-01 2004-08-24 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7875440B2 (en) 1998-05-01 2011-01-25 Arizona Board Of Regents Method of determining the nucleotide sequence of oligonucleotides and DNA molecules
US7501245B2 (en) 1999-06-28 2009-03-10 Helicos Biosciences Corp. Methods and apparatuses for analyzing polynucleotide sequences
US6818395B1 (en) 1999-06-28 2004-11-16 California Institute Of Technology Methods and apparatus for analyzing polynucleotide sequences
ATE356222T1 (de) 2000-10-06 2007-03-15 Univ Columbia Massives parallelverfahren zur dekodierung von dna und rna
US9708358B2 (en) 2000-10-06 2017-07-18 The Trustees Of Columbia University In The City Of New York Massive parallel method for decoding DNA and RNA
JP2004523243A (ja) 2001-03-12 2004-08-05 カリフォルニア インスティチュート オブ テクノロジー 非同期性塩基伸長によってポリヌクレオチド配列を分析するための方法および装置
DE10239504A1 (de) * 2001-08-29 2003-04-24 Genovoxx Gmbh Verfahren zur Analyse von Nukleinsäurekettensequenzen und der Genexpression
US20050227231A1 (en) * 2001-10-04 2005-10-13 Dimitri Tcherkassov Device for sequencing nucleic acid molecules
GB0129012D0 (en) 2001-12-04 2002-01-23 Solexa Ltd Labelled nucleotides
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
US7414116B2 (en) 2002-08-23 2008-08-19 Illumina Cambridge Limited Labelled nucleotides
US11008359B2 (en) 2002-08-23 2021-05-18 Illumina Cambridge Limited Labelled nucleotides
US7541444B2 (en) 2002-08-23 2009-06-02 Illumina Cambridge Limited Modified nucleotides
PT3147292T (pt) 2002-08-23 2018-11-22 Illumina Cambridge Ltd Nucleótidos identificados
US8637650B2 (en) 2003-11-05 2014-01-28 Genovoxx Gmbh Macromolecular nucleotide compounds and methods for using the same
US7169560B2 (en) 2003-11-12 2007-01-30 Helicos Biosciences Corporation Short cycle methods for sequencing polynucleotides
ATE463584T1 (de) 2004-02-19 2010-04-15 Helicos Biosciences Corp Verfahren zur analyse von polynukleotidsequenzen
DE602005027700D1 (de) 2004-05-25 2011-06-09 Helicos Biosciences Corp Verfahren zur nukleinsäureimmobilisierung
US7476734B2 (en) 2005-12-06 2009-01-13 Helicos Biosciences Corporation Nucleotide analogs
US7220549B2 (en) 2004-12-30 2007-05-22 Helicos Biosciences Corporation Stabilizing a nucleic acid for nucleic acid sequencing
US7482120B2 (en) 2005-01-28 2009-01-27 Helicos Biosciences Corporation Methods and compositions for improving fidelity in a nucleic acid synthesis reaction
GB0517097D0 (en) 2005-08-19 2005-09-28 Solexa Ltd Modified nucleosides and nucleotides and uses thereof
US7666593B2 (en) 2005-08-26 2010-02-23 Helicos Biosciences Corporation Single molecule sequencing of captured nucleic acids
US7397546B2 (en) 2006-03-08 2008-07-08 Helicos Biosciences Corporation Systems and methods for reducing detected intensity non-uniformity in a laser beam
JP5220596B2 (ja) * 2006-05-24 2013-06-26 独立行政法人産業技術総合研究所 DNAポリメラーゼβを用いた核酸合成法及び1分子シーケンス法
EP2548972A1 (de) 2006-06-14 2013-01-23 Verinata Health, Inc Verfahren zur Diagnose fötaler Missbildungen
US8399188B2 (en) 2006-09-28 2013-03-19 Illumina, Inc. Compositions and methods for nucleotide sequencing
WO2008069973A2 (en) 2006-12-01 2008-06-12 The Trustees Of Columbia University In The City Of New York Four-color dna sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
EP2209911B1 (de) 2007-10-19 2013-10-16 The Trustees of Columbia University in the City of New York Dna-sequenzierung mit reversiblen nicht-fluoreszenz-nukleotid-terminatoren und mit einer spaltbaren markierung modifizierten nukleotidterminatoren und eine deoxyinosineverbindung mit einer reversiblen terminatorgruppe
WO2009051807A1 (en) 2007-10-19 2009-04-23 The Trustees Of Columbia University In The City Of New York Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis
JP4621926B2 (ja) * 2008-07-24 2011-02-02 国立大学法人九州大学 酵素基質修飾ヌクレオシド三リン酸、核酸プローブ、マルチラベル化核酸プローブ、マルチラベル化核酸プローブの製造方法および標的核酸の検出方法
JP5146785B2 (ja) * 2008-07-24 2013-02-20 国立大学法人九州大学 酵素基質修飾ヌクレオシド三リン酸誘導体
US10174368B2 (en) 2009-09-10 2019-01-08 Centrillion Technology Holdings Corporation Methods and systems for sequencing long nucleic acids
US10072287B2 (en) 2009-09-10 2018-09-11 Centrillion Technology Holdings Corporation Methods of targeted sequencing
WO2011050938A1 (de) 2009-10-26 2011-05-05 Genovoxx Gmbh Konjugate von nukleotiden und methoden zu deren anwendung
CA2779750C (en) 2009-11-06 2019-03-19 The Board Of Trustees Of The Leland Stanford Junior University Non-invasive diagnosis of graft rejection in organ transplant patients
JP5704481B2 (ja) * 2010-01-22 2015-04-22 国立大学法人九州大学 核酸検出用キット
US9646134B2 (en) 2010-05-25 2017-05-09 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
CA2797645C (en) 2010-05-25 2020-09-22 The Regents Of The University Of California Bambam: parallel comparative analysis of high-throughput sequencing data
EP2670863B1 (de) 2011-01-31 2018-06-27 H. Hoffnabb-La Roche Ag Verfahren zur identifizierung mehrerer epitope in zellen
US20120252682A1 (en) 2011-04-01 2012-10-04 Maples Corporate Services Limited Methods and systems for sequencing nucleic acids
WO2012146377A1 (de) 2011-04-27 2012-11-01 Dmitry Cherkasov Methoden und komponenten zur detektion von nukleinsäureketten
EP2705161A1 (de) 2011-05-04 2014-03-12 Genovoxx GmbH Nukleosid-triphosphat-konjugate und methoden zu deren anwendung
WO2013070634A1 (en) 2011-11-07 2013-05-16 Ingenuity Systems, Inc. Methods and systems for identification of causal genomic variants
US10174310B2 (en) 2012-08-08 2019-01-08 Roche Sequencing Solutions, Inc. Increasing dynamic range for identifying multiple epitopes in cells
GB2519255B (en) 2013-02-01 2016-01-06 Univ California Methods for genome assembly and haplotype phasing
US9411930B2 (en) 2013-02-01 2016-08-09 The Regents Of The University Of California Methods for genome assembly and haplotype phasing
WO2014144883A1 (en) 2013-03-15 2014-09-18 The Trustees Of Columbia University In The City Of New York Raman cluster tagged molecules for biological imaging
AU2013382358B2 (en) 2013-03-15 2017-01-12 Illumina Cambridge Limited Modified nucleosides or nucleotides
US10058839B2 (en) 2013-03-15 2018-08-28 Lineage Biosciences, Inc. Methods and compositions for tagging and analyzing samples
CN103484106B (zh) * 2013-09-05 2015-08-19 上海交通大学 四色荧光标记可逆终端及其在dna测序中的用途
KR20240038168A (ko) 2013-11-07 2024-03-22 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산
EP3540074A1 (de) 2013-12-11 2019-09-18 The Regents of the University of California Verfahren zur markierung innerer regionen von nukleinsäuremolekülen
WO2016019360A1 (en) 2014-08-01 2016-02-04 Dovetail Genomics Llc Tagging nucleic acids for sequence assembly
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
KR102721363B1 (ko) 2015-02-17 2024-10-23 더브테일 제노믹스 엘엘씨 핵산 서열 어셈블리
WO2016154540A1 (en) 2015-03-26 2016-09-29 Dovetail Genomics Llc Physical linkage preservation in dna storage
CN108368542B (zh) 2015-10-19 2022-04-08 多弗泰尔基因组学有限责任公司 用于基因组组装、单元型定相以及独立于靶标的核酸检测的方法
SG11201807117WA (en) 2016-02-23 2018-09-27 Dovetail Genomics Llc Generation of phased read-sets for genome assembly and haplotype phasing
WO2017197300A1 (en) 2016-05-13 2017-11-16 Dovetail Genomics Llc Recovering long-range linkage information from preserved samples
WO2018195091A1 (en) 2017-04-18 2018-10-25 Dovetail Genomics, Llc Nucleic acid characteristics as guides for sequence assembly
CA3068273A1 (en) 2017-06-21 2018-12-27 Bluedot Llc Systems and methods for identification of nucleic acids in a sample
WO2019060716A1 (en) 2017-09-25 2019-03-28 Freenome Holdings, Inc. SAMPLE EXTRACTION METHODS AND SYSTEMS
WO2019152543A1 (en) 2018-01-31 2019-08-08 Dovetail Genomics, Llc Sample prep for dna linkage recovery
US11166996B2 (en) 2018-12-12 2021-11-09 Flagship Pioneering Innovations V, Inc. Anellovirus compositions and methods of use
EP3990920B1 (de) 2019-06-27 2025-02-12 Dovetail Genomics, LLC Verfahren und zusammensetzungen zur näherungsligation

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000050642A1 (en) * 1999-02-23 2000-08-31 Caliper Technologies Corp. Sequencing by incorporation
WO2000070073A1 (en) * 1999-05-19 2000-11-23 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
WO2001025247A1 (en) * 1999-10-05 2001-04-12 Quiatech Ab Compounds for protecting hydroxyls and methods for their use

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9208733D0 (en) * 1992-04-22 1992-06-10 Medical Res Council Dna sequencing method
US5986076A (en) * 1994-05-11 1999-11-16 Trustees Of Boston University Photocleavable agents and conjugates for the detection and isolation of biomolecules
US6136543A (en) * 1997-01-31 2000-10-24 Hitachi, Ltd. Method for determining nucleic acids base sequence and apparatus therefor
WO1999049082A2 (en) * 1998-03-23 1999-09-30 Invitrogen Corporation Modified nucleotides and methods useful for nucleic acid sequencing
DE19844931C1 (de) * 1998-09-30 2000-06-15 Stefan Seeger Verfahren zur DNS- oder RNS-Sequenzierung
EP1961826A3 (de) * 1999-03-10 2008-09-17 ASM Scientific, Inc. Verfahren zur direkten Sequenzierung von Nukleinsäuren
GB0013276D0 (en) * 2000-06-01 2000-07-26 Amersham Pharm Biotech Uk Ltd Nucleotide analogues

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000050642A1 (en) * 1999-02-23 2000-08-31 Caliper Technologies Corp. Sequencing by incorporation
WO2000070073A1 (en) * 1999-05-19 2000-11-23 Cornell Research Foundation, Inc. Method for sequencing nucleic acid molecules
WO2001025247A1 (en) * 1999-10-05 2001-04-12 Quiatech Ab Compounds for protecting hydroxyls and methods for their use

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE10149786B4 (de) * 2001-10-09 2013-04-25 Dmitry Cherkasov Oberfläche für Untersuchungen aus Populationen von Einzelmolekülen
DE10214395A1 (de) * 2002-03-30 2003-10-23 Dmitri Tcherkassov Verfahren zur Analyse von Einzelnukleotidpolymorphismen

Also Published As

Publication number Publication date
JP2004529650A (ja) 2004-09-30
WO2002088382A3 (de) 2003-08-28
WO2002088382A2 (de) 2002-11-07
EP1381698A2 (de) 2004-01-21
AU2002304705A1 (en) 2002-11-11
DE10120797B4 (de) 2005-12-22

Similar Documents

Publication Publication Date Title
DE10120797B4 (de) Verfahren zur Analyse von Nukleinsäureketten
DE10120798B4 (de) Verfahren zur Bestimmung der Genexpression
DE10239504A1 (de) Verfahren zur Analyse von Nukleinsäurekettensequenzen und der Genexpression
DE3854743T2 (de) Verfahren zur schnellen basensequenzierung in dns und rns.
DE69314951T2 (de) Dns sequenzierungsverfahren
DE112007002932B4 (de) Vierfarben DNA-Sequenzierung mittels Synthese unter Verwendung von abspaltbaren, reversiblen, fluoreszierenden Nucleotidterminatoren
DE69928683T2 (de) Verfahren zur amplifikation und zur sequenzierung von nukleinsäuren
DE69837913T2 (de) Verfahren zur vervielfältigung von nukleinsäure
DE69834056T2 (de) De novo oder "universaler" sequenzierungs-array
DE60125243T2 (de) Polynukleotid-sequenzassay
DE69711895T2 (de) Characterisierung von dna
DE69233458T2 (de) Nukleinsäuretypisierung durch polymeraseverlängerung von oligonukleotiden unter verwendung von terminator-mischungen
DE69322266T2 (de) Proben zusammensetzung und verfahren
DE10246005A1 (de) Gerät zur Sequenzierung von Nukleinsäuremolekülen
EP1204765B1 (de) Verfahren zur relativen quantifizierung der methylierung von cytosin basen in dna-proben
DE69924140T2 (de) Bestimmung der länge von repetitiven nukleinsäure-sequenzen durch eine diskontinuierliche primerverlängerung
DE20122767U1 (de) Massives Parallelverfahren zur Dekodierung von DNA und RNA
DE10015797A1 (de) Multiplex-Analyse von DNA-Gemischen mittels photolytisch ablesbarer DNA-Chips
DE10214395A1 (de) Verfahren zur Analyse von Einzelnukleotidpolymorphismen
DE102004025744A1 (de) Oberfläche für die Analysen an einzelnen Nukleinsäuremolekülen
DE102004025695A1 (de) Verfahren und Oberfläche zur parallelen Sequenzierung von Nukleinsäureketten
DE102004025694A1 (de) Verfahren und Oberfläche zu hochparallelen Analysen von Nukleinsäureketten
DE102004025745A1 (de) Oberfläche für die Analysen an einzelnen Molekülen
WO2008080629A2 (de) Verbesserte molekularbiologische prozessanlage
EP1458892B1 (de) Evaneszenz-basierendes multiplex-sequenzierungsverfahren

Legal Events

Date Code Title Description
OP8 Request for examination as to paragraph 44 patent law
8364 No opposition during term of opposition
R071 Expiry of right