DE10120797A1 - Verfahren zur Analyse von Nukleinsäureketten - Google Patents
Verfahren zur Analyse von NukleinsäurekettenInfo
- Publication number
- DE10120797A1 DE10120797A1 DE10120797A DE10120797A DE10120797A1 DE 10120797 A1 DE10120797 A1 DE 10120797A1 DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A1 DE10120797 A1 DE 10120797A1
- Authority
- DE
- Germany
- Prior art keywords
- nts
- nskfs
- reaction
- polymerase
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 120
- 150000007523 nucleic acids Chemical group 0.000 title claims abstract description 56
- 238000004458 analytical method Methods 0.000 title description 40
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 193
- 239000002773 nucleotide Substances 0.000 claims abstract description 181
- 238000006243 chemical reaction Methods 0.000 claims abstract description 125
- 239000000975 dye Substances 0.000 claims abstract description 35
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 20
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 20
- 239000013615 primer Substances 0.000 claims description 81
- 108020004414 DNA Proteins 0.000 claims description 44
- 239000012634 fragment Substances 0.000 claims description 40
- 239000007850 fluorescent dye Substances 0.000 claims description 35
- 230000000295 complement effect Effects 0.000 claims description 33
- 239000000499 gel Substances 0.000 claims description 21
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 19
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 17
- 238000009434 installation Methods 0.000 claims description 17
- 239000000126 substance Substances 0.000 claims description 15
- 239000003446 ligand Substances 0.000 claims description 13
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 claims description 12
- 238000009396 hybridization Methods 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 9
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 9
- 230000005526 G1 to G0 transition Effects 0.000 claims description 8
- 108010006785 Taq Polymerase Proteins 0.000 claims description 8
- 230000036961 partial effect Effects 0.000 claims description 8
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 7
- 238000012300 Sequence Analysis Methods 0.000 claims description 6
- 229920002401 polyacrylamide Polymers 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 5
- 229920000936 Agarose Polymers 0.000 claims description 4
- 241000588724 Escherichia coli Species 0.000 claims description 4
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 239000011521 glass Substances 0.000 claims description 4
- 229920003023 plastic Polymers 0.000 claims description 4
- 239000004033 plastic Substances 0.000 claims description 4
- 239000007787 solid Substances 0.000 claims description 4
- 108010042407 Endonucleases Proteins 0.000 claims description 3
- 241000206602 Eukaryota Species 0.000 claims description 3
- 239000004793 Polystyrene Substances 0.000 claims description 3
- 239000002253 acid Substances 0.000 claims description 3
- 239000011543 agarose gel Substances 0.000 claims description 3
- 239000000919 ceramic Substances 0.000 claims description 3
- 239000004744 fabric Substances 0.000 claims description 3
- 239000004417 polycarbonate Substances 0.000 claims description 3
- 229920000515 polycarbonate Polymers 0.000 claims description 3
- 229920002223 polystyrene Polymers 0.000 claims description 3
- 108010001132 DNA Polymerase beta Proteins 0.000 claims description 2
- 102000001996 DNA Polymerase beta Human genes 0.000 claims description 2
- 125000003277 amino group Chemical group 0.000 claims description 2
- 229920001296 polysiloxane Polymers 0.000 claims description 2
- 239000010703 silicon Substances 0.000 claims description 2
- 229910052710 silicon Inorganic materials 0.000 claims description 2
- 102100031780 Endonuclease Human genes 0.000 claims 2
- 108020005202 Viral DNA Proteins 0.000 claims 2
- 238000002372 labelling Methods 0.000 claims 2
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 claims 2
- 150000003732 xanthenes Chemical class 0.000 claims 2
- 239000003155 DNA primer Substances 0.000 claims 1
- 229920000642 polymer Polymers 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 41
- 239000002987 primer (paints) Substances 0.000 description 66
- 238000012163 sequencing technique Methods 0.000 description 60
- 239000000243 solution Substances 0.000 description 29
- 238000003786 synthesis reaction Methods 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 18
- 239000002585 base Substances 0.000 description 17
- 238000005406 washing Methods 0.000 description 15
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 14
- 239000000872 buffer Substances 0.000 description 14
- 239000000203 mixture Substances 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 108090000623 proteins and genes Proteins 0.000 description 13
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 12
- 239000002777 nucleoside Substances 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 238000005859 coupling reaction Methods 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 238000001712 DNA sequencing Methods 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 125000003835 nucleoside group Chemical group 0.000 description 8
- -1 nucleoside triphosphates Chemical class 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 229960002685 biotin Drugs 0.000 description 7
- 235000020958 biotin Nutrition 0.000 description 7
- 239000011616 biotin Substances 0.000 description 7
- 238000006911 enzymatic reaction Methods 0.000 description 7
- 239000003068 molecular probe Substances 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 238000000799 fluorescence microscopy Methods 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 230000003252 repetitive effect Effects 0.000 description 6
- 108060002716 Exonuclease Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 102000013165 exonuclease Human genes 0.000 description 5
- 125000000524 functional group Chemical group 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 238000000386 microscopy Methods 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 5
- 238000000018 DNA microarray Methods 0.000 description 4
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 238000001218 confocal laser scanning microscopy Methods 0.000 description 4
- 238000004624 confocal microscopy Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000002427 irreversible effect Effects 0.000 description 4
- 238000001634 microspectroscopy Methods 0.000 description 4
- 238000000399 optical microscopy Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004007 reversed phase HPLC Methods 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- GBMDVOWEEQVZKZ-UHFFFAOYSA-N methanol;hydrate Chemical compound O.OC GBMDVOWEEQVZKZ-UHFFFAOYSA-N 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 3
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 2
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-WFVLMXAXSA-N DEAE-cellulose Chemical compound OC1C(O)C(O)C(CO)O[C@H]1O[C@@H]1C(CO)OC(O)C(O)C1O GUBGYTABKSRVRQ-WFVLMXAXSA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 235000012501 ammonium carbonate Nutrition 0.000 description 2
- 239000001099 ammonium carbonate Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 125000001369 canonical nucleoside group Chemical group 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000004163 cytometry Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 150000002019 disulfides Chemical class 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 239000011630 iodine Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000012047 saturated solution Substances 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- WNDKIGQUFDOYIB-UHFFFAOYSA-N 1-hydroxypyrrolidine-2,5-dione;propanoic acid Chemical compound CCC(O)=O.ON1C(=O)CCC1=O WNDKIGQUFDOYIB-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- MBXADFLSFSJJOZ-SNAWJCMRSA-N 2-[1-[(4-ethoxyphenyl)methyl]-4-[(e)-3-(4-methoxyphenyl)prop-2-enyl]piperazin-2-yl]ethanol Chemical compound C1=CC(OCC)=CC=C1CN1C(CCO)CN(C\C=C\C=2C=CC(OC)=CC=2)CC1 MBXADFLSFSJJOZ-SNAWJCMRSA-N 0.000 description 1
- OBYNJKLOYWCXEP-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-4-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC(N=C=S)=CC=C1C([O-])=O OBYNJKLOYWCXEP-UHFFFAOYSA-N 0.000 description 1
- IJSMFQNTEUNRPY-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-5-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC=C(N=C=S)C=C1C([O-])=O IJSMFQNTEUNRPY-UHFFFAOYSA-N 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical group N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108050001427 Avidin/streptavidin Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- OHOQEZWSNFNUSY-UHFFFAOYSA-N Cy3-bifunctional dye zwitterion Chemical compound O=C1CCC(=O)N1OC(=O)CCCCCN1C2=CC=C(S(O)(=O)=O)C=C2C(C)(C)C1=CC=CC(C(C1=CC(=CC=C11)S([O-])(=O)=O)(C)C)=[N+]1CCCCCC(=O)ON1C(=O)CCC1=O OHOQEZWSNFNUSY-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical class C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 238000003505 heat denaturation Methods 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 235000021190 leftovers Nutrition 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000036647 reaction Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000004621 scanning probe microscopy Methods 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 125000001834 xanthenyl group Chemical class C1=CC=CC=2OC3=CC=CC=C3C(C12)* 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Saccharide Compounds (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäureketten. Grundlage der Methode ist die Detektion von Fluoreszenzsignalen einzelner, mit Farbstoffen markierter Nukleotidmoleküle, die durch eine Polymerase in wachsende Nukleinsäureketten eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. Auf dieser Oberfläche sind viele einzelne Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure-Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann.
Description
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäu
reketten. Die Grundlage der Methode ist die Detektion von Fluo
reszenzsignalen einzelner mit Farbstoffen markierter Nukleotid
moleküle, die durch eine Polymerase in eine wachsende Nuklein
säurekette eingebaut werden. Die Reaktion verläuft auf einer
planen Oberfläche. Auf dieser Oberfläche sind viele einzelne
Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure-
Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen
Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen
kann.
Das Verfahren umfaßt im wesentlichen folgende Schritte:
- 1. Immobilisierung der Nukleinsäureketten auf einer planen Oberfläche.
- 2. Durchführen einer zyklischen Aufbaureaktion, wobei jeder
Zyklus aus folgenden Schritten besteht:
- a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind,
- c) Waschen,
- d) Detektion der Signale von einzelnen Molekülen,
- e) Entfernung der Markierung von den eingebauten Nukleoti den,
- f) Waschen.
- 3. Analyse der detektierten Signale der einzelnen Moleküle.
- 4. Rekonstruktion der Sequenzen aus den Einzeldaten.
DNA - Desoxyribonukleinsäure verschiedenen Ursprungs und unter
schiedlicher Länge: (genomische DNA, cDNA, ssDNA, dsDNA)
RNA - Ribonukleinsäure (meist mRNA)
Polymerasen - Enzyme, die komplementäre Nukleotide in einen wachsenden DNA- oder RNA-Strang einbauen können (z. B. DNA-Poly merasen, Reverse-Transkriptasen, RNA-Polymerasen)
dNTP - 2'-deoxi-Nucleosid-Triphosphate für DNA-Polymerasen und Reverse-Transkriptasen
NTP - Nukleosid-Triphosphate für RNA-Polymerasen
NT - natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet.
RNA - Ribonukleinsäure (meist mRNA)
Polymerasen - Enzyme, die komplementäre Nukleotide in einen wachsenden DNA- oder RNA-Strang einbauen können (z. B. DNA-Poly merasen, Reverse-Transkriptasen, RNA-Polymerasen)
dNTP - 2'-deoxi-Nucleosid-Triphosphate für DNA-Polymerasen und Reverse-Transkriptasen
NTP - Nukleosid-Triphosphate für RNA-Polymerasen
NT - natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich anders gekennzeichnet.
Abkürzung "NT" wird auch bei der Längenangabe einer Nukleinsäu
resequenz verwendet, z. B. 1000 NT. In diesem Fall steht "NT" für
Nukleosid-Monophosphate.
Im Text wird bei Abkürzungen die Mehrzahl durch Verwendung des
Suffixes "s" gebildet, "NT" steht zum Beispiel für "Nukleotid",
"NTs" steht für mehrere Nukleotide.
NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrück lich anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleo tide
NSK - Nukleinsäurekette. DNA oder RNA in ihrer ursprünglichen Länge
NSKF - Nukleinsäurekettenfragment, NSKFs - Nukleinsäureketten fragmente. Fragmente von DNA oder RNA, die nach einem Fragmen tierungsschritt entstehen.
NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrück lich anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleo tide
NSK - Nukleinsäurekette. DNA oder RNA in ihrer ursprünglichen Länge
NSKF - Nukleinsäurekettenfragment, NSKFs - Nukleinsäureketten fragmente. Fragmente von DNA oder RNA, die nach einem Fragmen tierungsschritt entstehen.
Oberfläche, die vorzugsweise folgende Merkmale
aufweist: 1) Sie erlaubt, mehrere einzelne Moleküle, vorzugsweise
mehr als 100, noch besser mehr als 1000, mit dem jeweiligen
gegebenen Objektiv-Oberfläche-Abstand bei einer Objektivposition
gleichzeitig zu detektieren. 2) Die immobilisierten einzelnen
Moleküle befinden sich in derselben Fokusebene, die reproduzier
bar eingestellt werden kann.
Sterisch anspruchsvolle Gruppe, die durch
ihre chemische Struktur die Eigenschaften der mit dieser Gruppe
gekoppelten NTs* so verändert, daß diese durch eine Polymerase in
einer Extensionsreaktion nicht nacheinander eingebaut werden
können.
Als Termination wird in dieser An
meldung der reversible Stop des Einbaus der modifizierten unge
spalteten NTs* bezeichnet.
Dieser Begriff ist von dem üblichen Gebrauch des Wortes "Termi
nation" durch Dideoxy-NTP bei einer konventionellen Sequenzierung
zu trennen.
Die Termination kommt nach dem Einbau eines modifizierten NT*
zustande. Das modifizierte eingebaute NT* trägt eine an die Base
reversibel gekoppelte sterische Gruppe, die zur Behinderung des
Einbaus eines nächsten komplementären NT* in den wachsenden
Strang durch eine Polymerase führt.
Genprodukte - Bei den Genprodukten handelt es sich um die
primären Genprodukte der Gene. Im wesentlichen handelt es sich
dabei um RNA-Transkripte der genannten Gene, welche auch als
Target-Sequenzen (oder Target-Nukleinsäuresequenzen) bezeichnet
werden. Diese Target-Sequenzen schließen neben mRNA auch davon
abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA
abgeleitete RNA oder von cDNA amplifizierte DNA ein.
SNP - single nucleotide polymorphism
SNP - single nucleotide polymorphism
Die Nukleinsäurenketten-Sequenzanalyse ist in vielen Bereichen
der Wissenschaft, Medizin und Industrie zu einem wichtigen Werk
zeug geworden. Zur Analyse wurden mehrere Verfahren entwickelt.
Die bekanntesten Verfahren sind die Ketten-Terminations-Sequen
zierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 5463),
die auf dem Einbau von Kettenterminatoren basiert, und die Maxam-
Gilbert-Methode, die auf Basen-spezifischer Modifikation und
Spaltung von Nukleinsäureketten beruht (A. M. Maxam and W. Gilbert
PNAS 1977, v. 74 S. 560). Beide Methoden liefern eine Anzahl von
Nukleinsäurekettenfragmenten verschiedener Längen. Diese
Fragmente werden der Länge nach in einem Gel aufgetrennt. Dabei
müssen alle Nachteile der Elektrophorese (wie z. B. lange
Laufzeit, relativ kurze Strecken von Sequenzen, die in einem
Ansatz bestimmt werden können, begrenzte Anzahl der parallelen
Ansätze sowie relativ große Mengen an DNA) in Kauf genommen
werden. Diese Methoden sind sehr arbeitsintensiv und langsam.
Ein weiteres Verfahren zur Sequenzierung basiert auf der Hybri
disierung von Nukleinsäureketten mit kurzen Oligonukleotiden.
Dabei wird mit mathematischen Methoden berechnet, wie viele
Oligonukleotide einer bestimmten Länge vorhanden sein müssen, um
eine komplette Sequenz zu ermitteln (Z. T. Strezoska et al. PNAS
1991 v. 88 S. 10089, R. S. Drmanac et al. Science 1993 v. 260 S. 1649).
Auch dieses Verfahren ist mit Problemen behaftet: Es kann nur
eine Sequenz in einem Ansatz bestimmt werden, sekundäre Struktu
ren stören die Hybridisierung und Sequenzwiederholungen verhin
dern die korrekte Analyse.
Eine andere Möglichkeit zur Sequenzierung haben Arbeitsgruppen
von (Dower US Patent 5.547.839, Canard et al. US Patent
5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18
S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al.
Nucleosides & Nucleotides 1999, v. 18, S. 197) entwickelt. Diese
Methode wird abgekürzt als BASS (Base Addition Sequencing Scheme)
bezeichnet. Dabei wird eine große Anzahl gleicher einzelsträngi
ger DNA-Stücke an einem definierten Ort auf einer Oberfläche
fixiert und das Signal von der Gesamtheit dieser vielen iden
tischen DNA-Stücke analysiert. Zu dieser fixierten DNA wird eine
Lösung mit Polymerase und Nukleotiden zugegeben, so daß ein
komplementärer Strang synthetisiert werden kann. Dabei soll die
Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein
einziges Nukleotid eingebaut. Dieses wird detektiert, worauf die
Polymerase in einem nächsten Zyklus das nächste Nukleotid
einbaut.
Die Methode hat folgende Nachteile: Beim Aufbau der komplementä
ren Stränge tritt sehr schnell eine Desynchronisation der Syn
these auf, so daß bei jedem Schritt die Fehler akkumulieren.
Deshalb können nur sehr kurze Fragmente sequenziert werden. Es
ist zu betonen, daß alle beschriebenen BASS-Methoden nicht auf
der Detektion von einzelnen Molekülen beruhen. Das Signal wird
stattdessen von einer großen Anzahl identischer an einem definierten
Ort immobilisierter Moleküle registriert. Die in diesen
Methoden übliche Verwendung der Begriffe "einzelne Moleküle" und
"Moleküle" zielt dabei nicht auf individuelle, voneinander ge
trennte Moleküle, sondern auf eine Population, die aus vielen
identischen Molekülen besteht. Identisch heißt in diesem Fall,
daß die Moleküle die gleiche Sequenz haben.
Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein
Verfahren zur Sequenzanalyse von Nukleinsäureketten bereitzustel
len, das die Nachteile der oben erwähnten Methoden nicht aufweist
und vor allem eine billigere, schnellere und effizientere Analyse
von Nukleinsäuresequenzen ermöglicht. Insbesondere soll das
Verfahren in der Lage sein, viele Sequenzen parallel zu bestim
men, vorzugsweise soll es die Analyse sehr langer Nukleinsäure
ketten (mehrere Mb) in einem Ansatz ermöglichen.
Die Aufgabe wird erfindungsgemäß durch ein Verfahren zur
Sequenzanalyse von Nukleinsäuresequenzen (Nukleinsäureketten,
NSKs) gelöst, bei dem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
- a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifi zierte Nukleotide (NTs*) enthält, die mit Fluoreszenz farbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedli cher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang ein zubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer ste risch anspruchsvoller Ligand ist, man
- b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der kom plementären Stränge geeignet sind, wobei die komplemen tären Stränge jeweils um ein NT* verlängert werden, man
- c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man
- d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarb stoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluo reszenzsignale auf der Reaktionsoberfläche bestimmt, man
- e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo reszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man
- f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz farbstoffe und der Liganden geeignet sind, man
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt,
wobei man die relative Position einzelner NSKFs auf der Reak
tionsoberfläche und die Sequenz dieser NSKFs durch spezifische
Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den
jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs
bestimmt und man aus den ermittelten überlappenden Teilsequenzen
die Gesamtsequenz der NSKs bestimmt.
Die erhaltene Population von überlappenden Teilsequenzen läßt
sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz
der NSK zusammenfügen (Huang et al. Genom Res. 1999 v. 9 S. 868,
Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23
S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).
Gemäß einer besonderen Ausführungsform der Erfindung kann das
Verfahren durchgeführt werden, indem man die Stufen a) bis f) der
zyklischen Aufbaureaktion mehrfach wiederholt, wobei man
- a) in jedem Zyklus nur jeweils ein markiertes NT*,
- b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oder
- c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs*
einsetzt.
Wenn die NSKs Varianten einer bekannten Referenzsequenz sind kann
das Verfahren auch durchgeführt werden, indem man die Stufen a)
bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei
man in den Zyklen abwechselnd jeweils zwei unterschiedlich
markierte NTs* und zwei unmarkierte NTs einsetzt und man die
Gesamtsequenzen durch Vergleich mit der Referenzsequenz er
mittelt.
Gegenstand der vorliegenden Erfindung sind ferner die in den
Fig. 7e, 7f und 7g dargestellten Nukleotide und die ent
sprechenden markierten Nukleotide, die beispielsweise an die
terminale Aminofunktion angeheftete Fluoreszenzfarbstoffe
aufweisen, oder die in den Fig. 7h, 7i oder 7j dargestellten
markierten Nukleotide.
Gegenstand der Erfindung ist ferner ein Kit zur Durchführung des
Verfahrens das eine Reaktionsoberfläche, zur Durchführung des
Verfahrens erforderliche Reaktionslösungen, eine oder mehrere
Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier
mit Fluoreszenzfarbstoffen markiert sind, wobei die NTs ferner
strukturell so modifiziert sind (NT* bzw. NTs*), daß die Poly
merase nach Einbau eines solchen NT* in einen wachsenden komple
mentären Strang nicht in der Lage ist, ein weiteres NT* in
denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff
abspaltbar ist und die strukturelle Modifikation ein abspaltbarer
sterisch anspruchsvoller Ligand ist. Bei den Nukleotiden handelt
es sich vorzugsweise um die oben genannten erfindungsgemäßen
Nukleotide.
Gemäß einer besonderen Ausführungsform der Erfindung enthält das
Kit ferner zur Erzeugung von Einzelsträngen aus Doppelsträngen
erforderliche Reagenzien, einzelsträngige Nukleinsäuremoleküle,
die als PBS in die KSKFs eingeführt werden, Oligonukleotid-
Primer, zur Abspaltung der Fluoreszenzfarbstoffe und sterisch
anspruchsvollen Liganden erforderliche Reagenzien und/oder Wasch
lösungen.
Die erfindungsgemäße Methode dient zur Ermittlung der Nukleinsäu
resequenzen und kann in verschiedenen Bereichen der Genetik
eingesetzt werden. Dazu zählen insbesondere die Bestimmung
unbekannter, langer Sequenzen, Analysen von Sequenz-Polymor
phismen und Punktmutationen sowie die parallele Analyse einer
großen Zahl an Gensequenzen.
Die Vorbereitung des zu analysierenden Materials (einzel- und
doppelsträngige Nukleinsäuresequenzen) hängt von der Aufgabestel
lung ab und hat das Ziel, aus einer langen Nukleinsäurekette eine
Population an relativ kleinen, einzelsträngigen Nukleinsäureket
tenfragmenten (NSKFs) zu bilden, diese Fragmente mit einem für
den Start der Sequenzierungsreaktion geeigneten Primer zu
versehen und auf einer planen Oberfläche zu fixieren.
Dabei werden einzelne NSKFs auf einer planen Oberfläche in einer
solchen Weise fixiert, daß eine enzymatische Reaktion an diesen
Molekülen ablaufen kann. Prinzipiell sind verschiedene Arten der
Immobilisation möglich, die von der Zielsetzung, der Art der NSK
und der für die Reaktion eingesetzten Polymerase abhängen. Die
NSKFs werden bei der Immobilisierung zufällig auf der Oberfläche
verteilt, d. h. es muß also nicht auf eine exakte Positionierung
der einzelnen Ketten geachtet werden. Die Nukleinsäureketten
müssen dabei in einer solchen Dichte auf der Oberfläche fixiert
werden, daß eine eindeutige Zuordnung der später detektierten
Signale zu einzelnen NSKFs gewährleistet ist.
Nach der Vorbereitung der NSKFs startet man mit allen auf der
Oberfläche immobilisierten Molekülen die Sequenzierungsreaktion.
Als Grundlage der Sequenzierung dient die Synthese des komple
mentären Stranges zu jedem einzelnen immobilisierten NSKF. Dabei
werden in den neu synthetisierten Strang markierte NTs* einge
baut. Die Polymerase baut nur ein einziges markiertes NT* in die
wachsende Kette ein. Dies wird durch die reversible Ankopplung
einer zur Termination führenden, sterisch anspruchsvollen Gruppe
an die NTs* erreicht. Der Einbau eines weiteren markierten NT*
wird dadurch unmöglich gemacht. Diese sterisch anspruchsvolle
Gruppe ist vorzugsweise ein Fluoreszenzfarbstoff.
Die Sequenzierungsreaktion verläuft in mehreren Zyklen. Ein
Zyklus umfasst folgende Schritte:
- a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der kom plementären Stränge um ein NT geeignet sind,
- c) Waschen,
- d) Detektion der Signale von einzelnen Molekülen,
- e) Entfernung der Markierung von den eingebauten Nukleotiden,
- f) Waschen.
Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus (a-
f).
Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden
so gewählt, daß die Polymerasen an mehr als 50% der an der
Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein
markiertes NT* einbauen können, vorzugsweise an mehr als 90%.
Die Anzahl der durchzuführenden Zyklen hängt dabei von der je
weiligen Aufgabenstellung ab, ist theoretisch nicht beschränkt
und liegt vorzugsweise zwischen 20 und 5000.
Danach wird für jedes fixierte NSKF seine spezifische Sequenz aus
der Reihenfolge der eingebauten NTs* ermittelt. Aus den überlap
penden NSKF-Sequenzen kann die ursprüngliche NSK-Sequenz
rekonstruiert werden ("Automated DNA sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et
al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1
S. 257). Dabei sucht man in der gesamten Population von NSKF-
Sequenzen nach Übereinstimmungen/Überlappungen in den Sequenzen
von NSKFs. Durch diese Übereinstimmungen/Überlappungen kann man
die NSKF in eine Reihe bringen, z. B.:
In der Praxis hat sich bei einer Sequenzierung von unbekannten
Sequenzen bewährt, eine Länge der sequenzierten Stücke von mehr
als 300 bp zu erreichen. Das erlaubt die Sequenzierung von
Genomen aus Eukaryonten im Schrotschuss-Verfahren.
Dabei können die Fehler der Methode mit verschiedenen Mitteln
erfasst und korrigiert werden. Sämtliche Schritte des Verfahrens
können weitgehend automatisiert werden.
Durch die Arbeit mit einzelnen Molekülen ergeben sich mehrere
Vorteile gegenüber der früher beschriebenen BASS-Methode:
- 1. Da die Moleküle einzeln detektiert werden, besteht keine Gefahr, daß das Signal durch die Desynchronisation in der Population fehlerhaft wird. Für jedes fixierte NSKF wird eine eigene Sequenz erstellt. Daher spielt es keine Rolle, ob an einem benachbarten Molekül die Synthese bereits weiter fortgeschritten oder zurückgeblieben ist.
- 2. Es ist nicht notwendig, Moleküle in einer definierten Anord nung auf der Oberfläche zu fixieren, da das Signal von einzelnen Molekülen ausgeht und nicht von einer räumlich definierten Population (was bei BASS-Methoden notwendig ist).
Im folgenden sollen anhand der Sequenzierung eines mehrere Mb
langen DNA-Stückes beispielhaft die allgemeinen Prinzipien der
Reaktion dargestellt werden (Fig. 1). Der Sequenzierung und der
Rekonstruktion von Nukleinsäurensequenzen liegt das Shotgun-
Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231
ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res.
1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al.
NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1
S. 257). Die Sequenz eines langen DNA-Stücks wird dabei durch die
Sequenzierung kleiner DNA-Fragmente und nachfolgender Rekon
struktion ermittelt. Das zu analysierende Material (1) wird für
die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von
vorzugsweise 50 bis 1000 bp Länge zerlegt wird (2). Jedes
Fragment wird anschließend mit einer Primerbindungsstelle und
einem Primer versehen (3). Dieses Gemisch aus verschiedenen DNA-
Fragmenten wird nun auf einer planen Oberfläche fixiert (4). Die
nicht gebundenen DNA-Fragmente werden durch einen Waschschritt
entfernt. Danach wird die Sequenzierungsreaktion an der gesamten
Reaktionsoberfläche durchgeführt. Diese Reaktion verläuft
zyklisch. Im 1. Schritt des Zyklus wird ein mit einem Fluo
reszenzfarbstoff markiertes NT* in den wachsenden Strang
eingebaut: Dabei wird die Reaktion so gesteuert, daß in jedem
Zyklus jeweils nur ein markiertes NT* von einer Polymerase in den
wachsenden Strang eingebaut werden kann. Das wird durch die
Verwendung von NTs* erreicht, die eine reversibel gekoppelte, zur
Termination führende Gruppe tragen. Der Einbau eines weiteren
markierten NT* wird dadurch unmöglich gemacht. Die Polymerase und
die markierten NTs* werden gleichzeitig in die Reaktion eigesetzt
(5). Danach wird das Reaktionsgemisch entfernt und die Oberfläche
in geeigneter Art und Weise gewaschen (6). Nun folgt ein
Detektionsschritt (7): Die Oberfläche wird mit einer für die
Einzelmoleküldetektion geeigneten Vorrichtung (bestehend aus
Lichtquelle, Mikroskop, Kamera, Scantisch, Computer mit Steue
rungs- und Bilderkennungs- bzw. Bildverarbeitungssoftware)
abgescannt und die Signale der einzelnen, eingebauten markierten
NTs* identifiziert. Nach dem Detektionsschritt wird die Markie
rung und die zur Termination führende Gruppe von allen eingebau
ten NTs* entfernt (8). Nach einem sich anschließenden Wasch
schritt kann ein neuer Zyklus beginnen. Zur Rekonstruktion einer
größeren ursprünglichen DNA-Sequenz (z. B. mehrere Mb langes DNA-
Stück) sollen die DNA-Fragmente einige Hundert NT lang sein,
falls man die Rekonstruktion nach dem Shotgun-Prinzip durchführt
("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams
et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868,
Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23
S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Da pro
Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind
mindestens 300 Zyklen zur Sequenzierung notwendig.
Mit Hilfe der erfindungsgemäßen Methode ist es möglich, sowohl
vorselektionierte DNA-Sequenzen (z. B. in YAC-, PAC-, oder BAC-
Vektoren (R. Anand et al. NAR 1989 v. 17 S. 3425, H. Shizuya et al.
PNAS 1992 v. 89 S. 8794, "Construction of bacterial artificial
chromosome libraries using the modified PAC system" in "Current
Protocols in Human genetics" 1996 John Wiley & Sons Inc.)
klonierte Abschnitte eines Genoms) als auch nicht vorselektio
nierte DNA (z. B. genomische DNA, cDNA-Gemische) zu analysieren.
Durch eine Vorselektion ist es möglich, im Vorfeld relevante
Informationen, wie z. B. Sequenz-Abschnitte aus einem Genom oder
Populationen an Genprodukten, aus der große Menge genetischer
Informationen herauszufiltern und damit die Menge der zu
analysierenden Sequenzen einzuschränken.
Ziel der Materialvorbereitung ist es, immobilisierte einzel
strängige NSKFs mit einer Länge von vorzugsweise 50-1000 NTs,
einer einzelnen Primerbindungsstelle und einem hybridisierten
Primer zu erhalten. Diese Fragmente haben vorzugsweise die in
Fig. 2 dargestellte Struktur. Im einzelnen können sehr variable
Konstruktionen aus dieser allgemeinen Struktur abgeleitet werden.
Zur Verbesserung der Anschaulichkeit folgen nun einige Beispiele,
wobei die angeführten Methoden einzeln oder in Kombination
eingesetzt werden können.
Wichtig ist, daß die Fragmentierung der NSKs so erfolgt, daß
Fragmente erhalten werden, die überlappende Teilsequenzen der
Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht,
bei denen unterschiedlich lange Fragmente als Spaltprodukte in
zufallsmäßiger Verteilung entstehen.
Erfindungsgemäß kann die Erzeugung der Nukleinsäureketten
fragmente (NSKFs) durch mehrere Methoden erfolgen, z. B. durch die
Fragmentierung des Ausgangsmaterials mit Ultraschall oder durch
Endonukleasen ("Molecular cloning" 1989 J. Sambrook et al. Cold
Spring Harbor Laborotary Press), wie z. B. durch unspezifische
Endonukleasegemische. Erfindungsgemäß wird die Ultraschall-Frag
mentierung bevorzugt. Man kann die Bedingungen so einstellen, daß
Fragmente mit einer durchschnittlichen Länge von 100 bp bis 1 kb
entstehen. Diese Fragmente werden anschließend an ihren Enden
durch das Klenow-Fragment (E.coli-Polymerase I) oder durch die
T4-DNA-Polymerase aufgefüllt ("Molecular cloning" 1989 J. Sam
brook et al. Cold Spring Harbor Laborotary Press).
Ausserdem können aus einer langen NSK unter Verwendung randomi
sierter Primer komplementäre kurze NSKFs synthetisiert werden.
Besonders bevorzugt wird diese Methode bei der Analyse der Gen-
Sequenzen. Dabei werden an der mRNA einzelsträngige DNA-Fragmente
mit randomisierten Primern und einer reversen Transkriptase
gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter
et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Bio
chem. 1993 v. 208 S. 264, Decraene et al. Biotechniques 1999 v. 27
S. 962).
Die Primerbindungsstelle ist ein Sequenzabschnitt, der eine
selektive Bindung des Primers an das NSKF ermöglichen soll.
Aus Gründen der Vereinfachung der Analyse ist es günstig, wenn
eine möglichst einheitliche Primerbindungsstelle in allen NSKFs
vorhanden ist. Gemäß einer bevorzugten Ausführungsform der
Erfindung werden die Primerbindungsstellen daher in die NSKFs
extra eingeführt. Auf diese Weise können Primer mit einheitlicher
Struktur für die Reaktion eingesetzt werden.
Die Zusammensetzung der Primerbindungsstelle ist nicht einge
schränkt. Ihre Länge beträgt vorzugsweise zwischen 20 und 50 NTs.
Die Primerbindungsstelle kann eine funktionelle Gruppe zur
Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann
z. B. eine Biotingruppe sein.
Als Beispiel für die Einführung einer Primerbindungsstelle werden
im folgenden die Ligation und das Nukleotid-Tailing an DNA-
Fragmente beschrieben.
Dabei wird ein doppelsträngiger Oligonukleotidkomplex mit einer
Primerbindungsstelle verwendet (Fig. 3a). Dieser wird mit kom
merziell erhältlichen Ligasen an die DNA-Fragmente ligiert
("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor
Laborotary Press). Es ist wichtig, daß nur eine einzige Primer
bindungsstelle an das DNA-Fragment ligiert wird. Das erreicht man
z. B. durch eine Modifikation einer Seite des Oligonukleotidkom
plexes an beiden Strängen (Fig. 3b). Die Resultate nach der
Ligation bzw. nach anschließender Denaturierung sind in Fig. 3c
und 3d dargestellt. Die modifizierenden Gruppen am Oligonukleo
tidkompex können zur Immobilisation dienen. Die Synthese und die
Modifikation eines solchen Oligonukleotidkomplexes kann nach
standardisierten Vorschriften durchgeführt werden. Zur Synthese
kann z. B. der DNA-Synthesizer 380 A Applied Biosystems verwendet
werden. Oligonucleotide mit einer bestimmten Zusammensetzung mit
oder ohne Modifikationen sind aber auch als Auftragssynthese
kommerziell erhältlich, z. B. von MWG-Biotech GmbH, Germany.
Statt der Ligation mit einem Oligonukleotid kann man mit einer
terminalen Deoxynucleotidyltransferase mehrere (z. B. zwischen 10
und 20) Nukleosid-monophosphate an das 3'-Ende eines ss-DNA-
Fragments anknüpfen ("Molecular cloning" 1989 J. Sambrook et al.
Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999
v. 303, S. 37-38) (Fig. 4), z. B. mehrere Guanosin-Monophosphate
((G)n-Tailing genannt). Das entstehende Fragment wird zur Bindung
des Primers, in diesem Beispiel eines (C)n-Primers, verwendet.
Für die Sequenzierungsreaktion werden einzelsträngige NSKFs
benötigt. Falls das Ausgangsmaterial in doppelsträngiger Form
vorliegt, gibt es mehrere Möglichkeiten, aus doppelsträngiger DNA
eine einzelsträngige Form zu erzeugen (z. B. Hitze-Denaturierung
oder Alkali-Denaturierung) ("Molecular cloning" 1989 J. Sambrook
et al. Cold Spring Harbor Laborotary Press).
Dieser hat die Funktion, den Start an einer einzigen Stelle des
NSKF zu ermöglichen. Vorzugsweise bindet er an die Primerbin
dungsstelle im NSKF. Die Zusammensetzung und die Länge des Pri
mers sind nicht eingeschränkt. Außer der Startfunktion kann der
Primer auch andere Funktionen übernehmen, wie z. B. eine Verbin
dung zur Reaktionsoberfläche zu schaffen. Primer sollten so an
die Länge und Zusammensetzung der Primerbindungsstelle angepaßt
werden, daß der Primer den Start der Sequenzierungsreaktion mit
der jeweiligen Polymerase ermöglicht.
Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100
NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine
Funktionsgruppe tragen, die zur Immobilisierung des NSKF dient,
vorzugsweise ist eine solche Funktionsgruppe eine Biotingruppe
(s. Abschnitt Immobilisierung). Sie soll die Sequenzierung nicht
stören. Die Synthese eines solchen Primers kann z. B. mit dem DNA-
Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber
als Auftragssynthese bei einem kommerziellen Anbieter, z. B. MWG-
Biotech GmbH, Germany erstellt werden).
Der Primer kann vor der Hybridisierung an die zu analysierenden
Fragmente auf der Oberfläche mit verschiedenen Techniken fixiert
oder direkt auf der Oberfläche synthetisiert werden (McGall et
al. US Patent 5412087, Barrett et al. US Patent 5482867,
Mirzabekov et al. US Patent 5981734, "Microarray biochip
technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays"
1999 M. Schena Oxford University Press, Fodor et al. Science 1991
v. 285 S. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996,
v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al.
NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).
Der Primer oder das Primergemisch wird mit NSKFs unter Hybridi
sierungsbedingungen inkubiert, die ihn selektiv an die Primerbin
dungsstelle des NSKF binden lassen. Diese Primer-Hybridisierung
kann vor, während oder nach der Immobilisierung der NSKFs
erfolgen. Die Optimierung der Hybridisierungsbedingungen hängt
von der genauen Struktur der Primerbindungsstelle und des Primers
ab und läßt sich nach Rychlik et al. NAR 1990 v. 18 S. 6409
berechnen. Im folgenden werden diese Hybridisierungsbedingungen
als standardisierte Hybridisierungsbedingungen bezeichnet.
Falls eine für alle NSKFs gemeinsame Primerbindungsstelle mit
bekannter Struktur durch Ligation eigeführt wird, können Primer
mit einheitlicher Struktur eingesetzt werden. Die Primerbin
dungsstelle kann an ihrem 3'-Ende eine funktionelle Gruppe tra
gen, die z. B. zur Immobilisation dient. Vorzugsweise ist diese
Gruppe eine Biotin-Gruppe. Der Primer hat eine zur Primer
bindungsstelle komplementäre Struktur.
Ein Beispiel einer Primerbindungstelle und eines Primers ist
nachfolgend dargestellt.
Ziel der Immobilisierung ist es, NSKFs auf einer geeigneten
planen Oberfläche in einer Art und Weise zu fixieren, daß eine
zyklische enzymatische Sequenzierungsreaktion ablaufen kann.
Oberfläche und Reaktionsoberfläche sind in dieser Anmeldung als
gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine
andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient
die Oberfläche einer festen Phase eines beliebigen Materials.
Dieses Material ist vorzugsweise enzymatischen Reaktionen gegen
über inert und verursacht keine Störungen der Detektion. Silicon,
Glas, Keramik, Kunststoff (z. B. Polycarbonate oder Polystyrole)
oder beliebiges anderes Material, das diesen funktionalen
Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die
Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung
der Signale bei der wiederholten Detektion zu rechnen.
Falls eine gelartige feste Phase verwendet wird, so kann dieses
Gel z. B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist
vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da
frei passierbar (beispielsweise kann ein 1 bis 2% Agarose-Gel
oder 10 bis 15% Polyacrylamid Gel verwendet werden). Eine solche
Geloberfläche hat anderen festen Oberflächen gegenüber den
Vorteil, daß die markierten NSKFs im Gegensatz zu freien NTs* auf
der Oberfläche festgehalten werden. Durch die Immobilisation der
NSKFs auf der Oberfläche ist die Detektion der Fluoreszenzsignale
von eingebauten NTs* möglich. Die Signale von freien NTs* werden
nicht detektiert, weil sie nicht an das Material des Gels binden
und somit nicht immobilisiert werden. Das Gel ist vorzugsweise
auf einer festen Unterlage befestigt (Fig. 5a). Die Dicke des
Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke muß
jedoch größer als die einfache Tiefenschärfe des Objektivs sein,
damit unspezifisch an die feste Unterlage gebundene NTs* nicht in
die Fokusebene gelangen und damit detektiert werden. Wenn die
Tiefenschärfe z. B. 0,3 µm beträgt, so liegt die Geldicke vorzugs
weise zwischen 1 µm und 100 µm. Die Oberfläche kann als eine
kontinuierliche Oberfläche oder als diskontinuierliche, aus
einzelnen kleinen Bestandteilen (z. B. Agarose-Kügelchen)
zusammengesetzte Oberfläche hergestellt werden (Fig. 5b). Die
Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl
der NSKFs bei entsprechender Dichte immobilisieren zu können. Die
Reaktionsoberfläche sollte vorzugsweise nicht größer als 20 cm2
sein.
Die verschiedenen Zyklusschritte erfordern einen Austausch der
unterschiedlichen Reaktionslösungen über der Oberfläche. Die
Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktions
gefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil
einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchfluß
vorrichtung ermöglicht einen Austausch der Lösungen im Reaktions
gefäß. Der Austausch kann mit einer durch einen Computer
gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei
ist, daß die Oberfläche nicht austrocknet. Vorzugsweise beträgt
das Volumen des Reaktionsgefäßes weniger als 50 µl. Idealerweise
beträgt sein Volumen weniger als 1 µl. Ein Beispiel eines solchen
Duchflußsystems ist in Fig. 6 gegeben.
Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem der
beiden Ketten-Enden. Dies kann durch entsprechende kovalente,
affine oder andere Bindungen erreicht werden. Es sind viele
Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall
et al. US Patent 5412087, Nikiforov et al. US Patent 5610287,
Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent
5981734, "Microarray biochip technology" 2000 M. Schena Eaton
Publishing, "DNA Microarrays" 1999 M. Schena Oxford University
Press, Rasmussen et al. Analytical Biochemistry v. 198, S. 138,
Allemand et al. Biophysical Journal 1997, v. 73, S. 2064, Trabesin
ger et al. Analytical Chemistry 1999, v. 71, S. 279, Osborne et al.
Analytical Chemistry 2000, v. 72, S. 3678, Timofeev et al. Nucleic
Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15
S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR
1992 v. 20 S. 1679).
Die NSKFs werden auf der Oberfläche vorzugsweise in einer Dichte
zwischen 10 und 100 NSKFs pro 100 µm2 immobilisiert. Beispielhaft
werden im folgenden zwei Methoden zur Immobilisierung näher
dargestellt: In einer bevorzugten Ausführungsform erfolgt die
Immobilisierung der NSKFs über Biotin-Avidin oder Biotin-
Streptavidin-Bindung. Dabei wird Avidin oder Streptavidin auf der
Oberfläche kovalent gebunden, das 5'-Ende des Primers enthält
Biotin. Nach der Hybridisierung der markierten Primer mit den
NSKFs werden diese auf der mit Avidin/Streptavidin modifizierten
Oberfläche fixiert. Die Konzentration der mit Biotin markierten
Hybridisierungs-Produkte sowie die Zeit der Inkubation dieser
Lösung mit der Oberfläche wird so gewählt, daß eine für die
Sequenzierung geeignete Dichte erreicht wird.
In einer anderen bevorzugten Ausführungsform werden die für die
Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungs
reaktion auf der Oberfläche mit geeigneten Methoden fixiert
(s. o.). Die einzelsträngigen NSKFs mit jeweils einer Primerbin
dungsstelle pro NSKF werden damit unter Hybridisierungsbedingun
gen inkubiert. Dabei binden sie an die fixierten Primer und
werden dadurch immobilisiert. Die Konzentration der einzel
strängigen NSKFs wird so gewählt, daß man eine für die Sequenzierung
geeignete Immobilisationsdichte von 10 bis 100 NSKFs pro 100 µm2
erreicht. Nach der Immobilisierung werden ungebundene NSKFs
durch einen Waschschritt entfernt. Falls die Oberfläche einer
festen Phase (z. B. Silikon oder Glas) zur Immobilisation
verwendet wird, wird vorzugsweise eine Blockierungslösung auf die
Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur
Vermeidung einer unspezifischen Adsorbtion von NTs* an der
Oberfläche dient. Diese Bedingungen für eine Blockierlösung
erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert
zwischen 8 und 10.
Als Polymerasen eignen sich prinzipiell alle DNA-abhängigen DNA-
Polymerasen ohne 3'-5' Exonuklease-Aktivität (DNA-Replication"
1992 Ed. A. Kornberg, Freeman and company NY), z. B. modifizierte
T7-Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia
Biotech), 3'-5' exonuklease freies Klenow Fragment der DNA-Poly
merase I (Amersham Pharmacia Biotech), Polymerase Beta ver
schiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M.,
CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile
Polymerasen wie Taq-Polymerase (GibcoBRL), proHATM Polymerase
(Eurogentech).
Polymerasen mit 3'-5' Exonuklease-Aktivität können eingesetzt
werden (z. B. Klenow-Fragment der E.coli-Polymerase I), sofern
Reaktionsbedingungen gewählt werden, die vorhandene 3'-5' Exonu
klease-Aktivität unterdrücken, wie z. B. ein niedriger pH-Wert (pH
6.5) beim Klenow-Fragment (Lehman and Richardson, J. Biol. Chem.
1964 v. 239 S. 233). Eine andere Möglichkeit besteht in der
Verwendung von NTs* mit einer Phosphorothioate-Verbindung (Kunkel
et al. PNAS 1981, v. 78 S. 6734). Dabei werden eingebaute NTs* von
der 3'-5' Exonuklease-Aktivität der Polymerase nicht angegriffen.
Im folgenden werden all diese Polymerasearten als "Polymerase"
bezeichnet.
Für die Sequenzierungsreaktion ist wichtig, daß jedes eingebaute
NT* identifiziert wird. Eine Voraussetzung dafür ist, daß nur ein
einziges NT* pro Zyklus in die Nukleinsäurekette eingebaut wird.
Falls eine Polymerase mehrere NTs* nacheinander im selben Zyklus
einbaut, so führt dies zu einem Fehler in der Sequenzermittlung.
Aus diesem Grund muß man den Einbau der NTs* steuern. In diesem
Zusammenhang sind verschiedene Möglichkeiten der Steuerung der
enzymatischen Reaktion denkbar, wie z. B.
- 1. einzelne Zugabe von NT, so daß die Polymerase nur einen einzigen Schritt macht und stoppt (Substrat Limitierung),
- 2. Änderungen der äußeren Bedingungen (Temperatur, pH, Salz usw.), so daß die Polymerasen ihre Funktion anders ausüben (s. Optimierung der Reaktionsbedingngen),
- 3. durch bestimmte kompetetive und nichtkompetetive Inhibitoren (als Beispiel seien antivirale Medikamente genannt)
- 4. Durch bestimmte Mutationen und andere Veränderungen an der Polymerase als solcher,
- 5. Durch die Struktur der NT. Diese Strukturänderungen können
sein:
- a) irreversibel (wie z. B. bei dideoxyNTPs)
- b) reversibel.
Vorzugsweise erfolgt die Steuerung durch eine bestimmte Struktur
der NTs*, wobei reversible Strukturveränderungen besonders
bevorzugt sind. Die reversiblen Strukturveränderungen erfolgen
beispielsweise durch Anheftung eines sterisch anspruchsvollen
Liganden, d. h. eines Liganden, der die Polymerase vom Einbau
eines weiteren NT abhält. Die Steuerung infolge einer sterischen
Blockierung der enzymatischen Reaktion durch reversible Semi
terminatoren wird unten genauer beschrieben. Gemäß einer
bevorzugten Ausführungsform der Erfindung werden die Basen durch
Ankopplung eines Fluoreszenzfarbstoffs strukturell verändert bzw.
modifiziert.
Es gibt mehrere prinzipielle Varianten der NT*-Struktur, die zur
Behinderung bzw. zum Stop der Extensionsreaktion führt: z. B.
wurden in der BASS-Methode reversible 3'-OH modifizierte NTs
beschrieben (Dower US Patent 5.547.839, Canard et al. US Patent
5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18
S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al.
Nucleosides & Nucleotides 1999, v. 18, S. 197). Die Spaltung soll
dabei unter milden Bedingungen photochemisch (Dower US Patent
5.547.839, Welch et al. Nucleosides & Nucleotides 1999, v. 18,
S. 197) oder chemisch (Canard et al. US Patent 5.798.210,
Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021)
erfolgen.
Die Synthese der 3'-OH-modifizierten photochemisch spaltbaren
NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter
schiedliche Affinität zu diesen Nukleotidanalogen auf, so daß die
Nukleinsäuresynthese sehr ungleichmäßig bzw. an manchen DNA-
Stellen gar nicht abläuft (Metzker et al. NAR 1994 v. 22 S. 4259,
Welch et al. Nucleosides & Nucleotides 1999, v. 18 S. 197). Aus
diesem Grund eignen sich diese Analoga nur bedingt für die
Sequenzierungsreaktion. Eine spaltbare 3'-Ester-Verknüpfung
(Canard et al. US Patent 5.798.210) kommt als Grundlage für eine
reversible Termination der Synthese auch nicht in Betracht. Die
meisten Polymerasen spalten bei Verfügbarkeit eines nächsten
komplementären NT 3'-OH-Ester-Verbindungen, so daß die an die 3'-
OH-Gruppe gebundene Markierung in die Lösung freigesetzt wird und
nicht mehr als Terminator wirken kann (Rasolonjatovo et al.
Nucleosides & Nucleotides 1999, v. 18 S. 1021, Canard et al. PNAS
1995 v. 92 S. 10859). In Positionen, an denen eine Polymerase
mehrere gleiche NTs* nacheinander einbauen kann, führt das zu
einem fehlerhaften Signal.
Erfindungsgemäß werden für die Sequenzierung NTs* mit einer
sterisch anspruchsvollen Gruppe an der Base verwendet. Eine an
die Base gekoppelte sterisch anspruchsvolle Gruppe kann zur
Behinderung der weiteren Synthese führen. Biotin, Digoxigenin und
Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine, Cy3-
Farbstoff stellen Beispiele einer solchen sterisch anspruchsvollen
Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S. 206, Zhu
et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15,
S. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234,
S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die Polymerasen
können zwar solche NTs* in größeren Abständen einbauen, haben
allerdings Schwierigkeiten, diese NTs* nacheinander einzubauen.
Bei der Sequenzierungsreaktion im erfindungsgemäßen Verfahren
werden markierte NTs* mit einer Polymerase und Nukleinsäureketten
inkubiert. Die NTs* tragen dabei eine an die Base reversibel
gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions
gemisch, das nur modifizierte NTs* enthält, in der Reaktion
eingesetzt wird, dann kann die Polymerase nur ein einziges NT*
einbauen. Der Einbau eines nächsten NT* wird sterisch gehemmt.
Diese NTs* treten somit als Terminatoren der Synthese auf. Nach
der Entfernung der sterisch anspruchsvollen Gruppe kann das
nächste komplementäre NT* eingebaut werden. Weil diese NTs* kein
absolutes Hindernis zur weiteren Synthese darstellen, sondern nur
für den Einbau eines weiteren markierten NT*, werden sie als
Semiterminatoren bezeichnet.
Der Unterschied zur 3'-OH Terminatoren-Methode besteht darin, daß
nicht eine Blockade der für die Synthese notwendigen 3'-OH Gruppe
angestrebt wird, sondern eine an die Base geknüpfte Gruppe als
sterisches Hindernis für den weiteren Einbau genutzt wird. Die
3'-OH Gruppe bleibt dabei die ganze Zeit frei.
Die Semiterminatoren können verschiedene Strukturen haben. Ihre
gemeinsamen Merkmale sind in Fig. 7a dargestellt. Diese Struktur
ist dadurch charakterisiert, daß an der Base über einen spalt
baren Linker (A-E) eine sterische Gruppe (D) und der Fluores
zenzmarker (F) gebunden sind.
Als Grundlage für die NTs* dienen Deoxynukleosid-Triphosphate mit
Adenosin (A), Guanosin (G), Cytidin (C) und Thymidin (T) als
Nukleosidrest. Anstelle von Thymidin wird bevorzugt Uridin als
Nukleosidrest verwendet. Anstelle von Guanosin kann Inosin ver
wendet werden.
Jede Base ist mit einem für sie charakteristischen Marker (F)
markiert (Fig. 7). Der Marker ist ein fluoreszierender Farbstoff.
Mehrere Faktoren beeinflussen die Wahl des Fluoreszenzfarb
stoffes. Die Wahl ist nicht eingeschränkt, sofern der Farbstoff
folgenden Anforderungen genügt:
- a) Die verwendete Detektionsapparatur muß diesen Marker als einziges Molekül gebunden an DNA unter milden Bedingungen (vor zugsweise Reaktionsbedingungen) identifizieren können. Die Farb stoffe haben vorzugsweise große Photostabilität. Ihre Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich ge quencht.
- b) Der an das NT gebundene Farbstoff darf keine irreversible Störung der enzymatischen Reaktion verursachen.
- c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in die Nukleinsäurekette eingebaut werden.
- d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine beträchtlichen Überlappungen in ihren Emissionsspektren aufweisen.
Im Rahmen der vorliegenden Erfindung verwendbare Fluoreszenzfarb
stoffe sind in "Handbook of Fluorescent Probes und Research
Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes mit
Strukturformeln zusammengestellt. Erfindungsgemäß werden
vorzugsweise folgende Farbstoffklassen als Marker eingesetzt:
Cyanin-Farbstoffe und deren Abkömmlinge (z. B. Cy2, Cy3, Cy5, Cy7
Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486),
Rhodamine und deren Abkömmlinge (z. B. TAMRA, TRITC, RG6, R110,
ROX, Molecular Probes, s. Handbuch), Xanthene-Derivate (z. B.
Alexa 568, Alexa 594, Molecular Probes, Mao et al. US-Patent
6.130.101). Diese Farbstoffe sind kommerziell erhältlich.
Dabei kann man je nach spektralen Eigenschaften und vorhandener
Apparatur entsprechende Farbstoffe auswählen. Die Farbstoffe
werden an den Linker z. B. über Thiocyanat- oder Ester-Bindung
gekoppelt ("Handbook of Fluorescent Probes und Research Chemi
cals" 6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al.
Methods in Enzymology 1997 v. 278 S. 363, Waggoner Methods in
Enzymology 1995 v. 246 S. 362), s. Beispiele 1 und 2.
Die Gruppe (D) (Fig. 7) stellt ein Hindernis für den Einbau eines
weiteren komplementären markierten NT* durch eine Polymerase dar.
Biotin, Digoxigenin und Fluoreszenzfarbstoffe stellen Beispiele
einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al.
Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22, S. 3418,
Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al. Analyti
cal Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques
1994 v. 16 S. 54). Die chemische Struktur dieser Gruppe ist nicht
eingeschränkt, sofern sie den Einbau des markierten NT*, an das
sie geknüpft ist, nicht wesentlich stört und keine irreversible
Störung der enzymatischen Reaktion verursacht.
Diese Gruppe kann als selbständiger Teil im Linker (7a) auftreten
oder mit dem Farbstoff (7b) oder der spaltbaren Gruppe (7d)
identisch sein. Durch die Spaltung des Linkers wird diese
sterisch anspruchsvolle Gruppe (D) nach der Detektion des Signals
entfernt, so daß die Polymerase ein weiteres markiertes NT*
einbauen kann. Bei einer Struktur wie in 7d wird die sterische
Gruppe durch die Spaltung beseitigt.
In einer bevorzugten Ausführungsform übernimmt der Fluoreszenz
farbstoff die Funktion einer solchen sterisch anspruchsvollen
Gruppe, so daß ein markiertes Nukleotid eine in Fig. 7b dar
gestellte Struktur aufweist.
In einer anderen bevorzugten Ausführungsform übernimmt die
photolabile spaltbare Gruppe die Funktion einer solchen sterisch
anspruchsvollen Gruppe (Fig. 7d).
Der Marker ist an die Base vorzugsweise über einen Abstandhalter
unterschiedlicher Länge, einen sog. Linker, gebunden. Beispiele
für Linker sind in Fig. 7e, f, h, i, j gegeben. Vorzugsweise ist
dieser Linker an einer der Stellen an die Base gebunden, die
nicht an der Basenpaarung teilnimmt. Im bevorzugten Fall sind die
Stellen, an die der Linker gebunden ist: die 5-Position im
Pyrimidinring und die 7-Position im Purinring. Beispiele der
Ankoppelung eines Linkers an die Base können aus folgenden
Quellen entnommen werden (Hobbs et al. US Patent 5.047.519, Khan
et al. US Patent 5.821.356, Hanna M. Method in Enzymology 1996
v. 274, S. 403, Zhu et al. NAR 1994 v. 22 S. 3418, Herman et al.
Methods in Enzymology 1990 v. 184 S. 584).
Die gesamte Länge des Linkers kann variieren. Sie entspricht der
Anzahl der Kohlenstoff-Atome in den Abschnitten A, C, E und liegt
vorzugsweise zwischen 3 und 20. Optimalerweise beträgt sie
zwischen 4 und 10 Atomen. Die chemische Zusammensetzung des
Linkers (Abschnitte A, C, E in Fig. 7a) ist nicht eingeschränkt,
sofern sie unter Reaktionsbedingungen stabil bleibt und keine
Störung der enzymatischen Reaktion verursacht.
Der Linker trägt eine spaltbare Verbindung oder spaltbare Gruppe
(B). Diese spaltbare Verbindung ermöglicht die Entfernung des
Markers und des sterischen Hindernisses am Ende jedes Zyklus.
Ihre Wahl ist nicht eingeschränkt, sofern sie unter den Bedin
gungen der enzymatischen Sequenzierungsreaktion stabil bleibt,
keine irreversible Störung der Polymerase verursacht und unter
milden Bedingungen abgespalten werden kann. Unter "milden
Bedingungen" sind solche Bedingungen zu verstehen, die den NSKF-
Primer-Komplex nicht zerstören, wobei z. B. der pH-Wert vorzugsweise
zwischen 3 und 11 liegt, die Temperatur zwischen 0°C und
einem Temperaturwert (x). Dieser Temperaturwert (x) hängt von der
Tm des NSKF-Primer-Komplexes (Tm ist "melting Point") und wird
als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z. B. Tm ist
47°C, dann liegt die maximale Temperatur bei 42°C; unter diesen
Bedingungen eignen sich besonders Disulfid-Verbindungen und
photolabile Verbindungen als spaltbare Verbindungen).
Vorzugsweise gehört die genannte Verbindung zu chemisch oder
enzymatisch spaltbaren oder photolabilen Verbindungen. Als
Beispiele von chemisch spaltbaren Gruppen sind Ester- und
Disulfid-Verbindungen bevorzugt (Herman et al. Method in
Enzymology 1990 v. 184 S. 584, Lomant et al. J. Mol. Biol. 1976 v. 104
243, "Chemistry of carboxylic acid and esters" S. Patai 1969
Interscience Publ.). Beispiele für photolabile Verbindungen
können in folgenden Literaturstellen gefunden werden: "Protective
groups in organic synthesis" 1991 John Wiley & Sons, Inc., V.
Pillai Synthesis 1980 S. 1, V. Pillai Org. Photochem. 1987 v. 9
S. 225.
Die Position der spaltbaren Verbindung/Gruppe im Linker ist
vorzugsweise nicht weiter als 10 Atome von der Base entfernt,
noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt
liegt die spaltbare Verbindung oder Gruppe direkt an der Base.
Der Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vor
handen und muß unter milden Bedingungen (s. o.) verlaufen, so daß
die Nukleinsäuren nicht beschädigt oder modifiziert werden.
Die Spaltung läuft bevorzugt chemisch (z. B. in milder saurer oder
basischer Umgebung für eine Ester-Verbindung oder durch Zugabe
eines Reduktionsmittel, z. B. Dithiothreitol (Sigma) bei der
Spaltung einer Disulfid-Verbindung), siehe Beispiel 1, oder
physikalisch (z. B. durch Beleuchtung der Oberfläche mit Licht
einer bestimmten Wellenlänge für die Spaltung einer photolabilen
Gruppe) ab.
Nach der Spaltung verbleibt an der Base ein Linkerrest (A)
(Fig. 7c).
Die Synthese eines spaltbaren Linkers wird an Beispielen gezeigt
(vgl. Beispiele 1 und 2).
Insgesamt spielen die Größe, die Ladung und die chemische Struk
tur des Markers, die Länge des spaltbaren Linkers und des Linker-
Rests sowie auch die Wahl der Polymerase eine wichtige Rolle. Sie
bestimmen gemeinsam, ob das markierte NT* durch die Polymerase in
die wachsende Nukleinsäurekette eingebaut wird, und ob dadurch
der Einbau des nächsten markierten NT* verhindert wird. Zwei
Bedingungen sind dabei besonders zu berücksichtigen:
Einerseits ist es wichtig, daß die Polymerase die Nukleinsäure kette mit dem eingebauten modifizierten NT* nach der Spaltung des Linkers weiter verlängern kann. Es ist also wichtig, daß der Linkerrest "A" (Fig. 7c) nach der Spaltung keine wesentliche Störung für die weitere Synthese darstellt. Andererseits müssen eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es können viele für die Reaktion geeignete NTs* synthetisiert wer den. Im einzelnen muß für jede Kombination aus Polymerase und NTs* eine Vorversuchsreihe durchgeführt werden, in der die Taug lichkeit eines bestimmten NT*-Typs für die Sequenzierung erprobt wird.
Einerseits ist es wichtig, daß die Polymerase die Nukleinsäure kette mit dem eingebauten modifizierten NT* nach der Spaltung des Linkers weiter verlängern kann. Es ist also wichtig, daß der Linkerrest "A" (Fig. 7c) nach der Spaltung keine wesentliche Störung für die weitere Synthese darstellt. Andererseits müssen eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es können viele für die Reaktion geeignete NTs* synthetisiert wer den. Im einzelnen muß für jede Kombination aus Polymerase und NTs* eine Vorversuchsreihe durchgeführt werden, in der die Taug lichkeit eines bestimmten NT*-Typs für die Sequenzierung erprobt wird.
Die Pufferbedingungen werden nach Angaben des Polymeraseherstel
lers gewählt. Die Reaktionstemperatur wird für nicht thermostabi
le Polymerasen nach Angaben des Herstellers gewählt (z. B. 37°C
für Sequenase Version 2), für thermostabile Polymerasen (z. B.
Taq-Polymerase) beträgt die Reaktionstemperatur maximal den
Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm
des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex)
minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt die maximale
Reaktionstemperatur bei 42°C). Diese Pufferbedingungen und
Reaktionstemperatur werden weiter als "optimale Puffer- und
Temperaturbedingungen" bezeichnet.
Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in
einem Zyklus) beträgt vorzugsweise weniger als eine Stunde,
idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 min.
Als Beispiele von geeigneten Kombinationen zwischen NT* und
Polymerase sind folgende Kombinationen zu nennen:
- a) NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, Fig. 7e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) in Kombina tion mit Sequenase Version 2, Taq-Polymerase (GibcoBRL), ProHA- DNA-Polymerase (Eurogentec) oder DNA-Polymerase Beta aus Säugetieren (Chimerx).
- b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, Fig. 7f, g, j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase Version 2 oder oder ProHATM-Polymerase (Eurogentech).
Die Tauglichkeit eines Linkerrests an der Base (A) für die Reak
tion kann man in einem Testsystem prüfen. Dabei werden gespaltene
NTs* in eine Nukleinsäurekette nacheinander einbaut. Man
verwendet z. B. dUTP* mit dem gewünschten gespaltenen Linkerrest,
poly-dA als Matrize, Oligo-dT20-Primer, die gewünschte Polymerase
und führt unter für die jeweilige Polymerase geeigneten optimalen
Puffer- und Temperaturbedingungen eine Reaktion durch. Die NT*-
Konzentration liegt vorzugsweise zwischen 5 µM und 200 µM. Nach
der Reaktion wird die Anzahl der in die Nukleinsäurekette
eingebauten NTs* analysiert, z. B. durch die Auftrennung der Länge
nach in einem Gel. Für die Rückschlüsse auf die Tauglichkeit des
Linkerrests kann man folgende Angaben verwenden: Wenn die
Polymerase mehr als 20 NTs* einbauen kann, so ist dieser
Linkerrest für eine Sequenzierungsreaktion geeignet. Beim Einbau
von weniger als 20 gespaltenen NTs* ist diese Kombination aus NT*
und Polymerase nicht optimal für die Sequenzierungsreaktion.
Wenn ein passender Linkerrest feststeht, muß man in einem
weiteren Testsystem prüfen, ob die markierten, nicht gespaltenen
NTs* als Semiterminatoren funktionieren. Das wird geprüft, indem
die markierten NTs* unter für die Reaktion geeigneten optimalen
Puffer- und Temperaturbedingungen mit der Polymerase und einer
Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugs
weise zwischen 5 µM und 200 µM. Die Matrize ist so zu wählen, daß
der Einbau mehrerer NTs* nacheinander zu erwarten wäre, z. B. für
dUTP* kann man polydA, wie im oben dargestellten Beispiel ver
wenden. Idealerweise baut die Polymerase nur ein einziges NT*
ein.
Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen
durch eine Polymerase mehrere NTs* nacheinander eingebaut werden,
kann man die Reaktionsparameter (z. B. NT*-Konzentration,
Reaktionstemperatur) verändern und der jeweiligen Kombination aus
Polymerase und NT* anpassen. Das wichtigste dabei ist, daß die
Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen
10 sec und 10 min) ein zweites NT* nicht einbaut.
Erfindungsgemäß erfolgt diese Anpassung in einer Ausführungsform
durch die Veränderung der Reaktionstemperatur. Die anderen Para
meter der Reaktion werden dabei konstant gehalten.
Als Polymerasen werden beipielsweise Polymerasen verwendet, die
Polymerasen ohne 3'-5'-Endonukleaseaktivität sind, vorzugsweise
aus der Gruppe bestehend aus viralen Polymerasen vom Sequenase-
Typ, Beta-Polymerasen aus Eukaryonten, und thermostabilen
Polymerasen. Insbesondere kommen Sequenase Version 2, Polymerase
Beta aus Säugetieren, Taq-Polymerase oder ProHATM-Polymerase in
Betracht.
Die NT*-Konzentration liegt bei diesen Experimenten üblicherweise
zwischen 5 µM und 200 µN, vorzugsweise zwischen 10 und 100 µM.
Die Konzentration der Polymerase und die Pufferbedingungen werden
nach Angaben vom Hersteller gewählt. Die Dauer der Reaktion kann
variieren und liegt vorzugsweise zwischen 10 sec und 10 min. was
der Dauer des Einbau-Schrittes (a) in einem Zyklus entsprechen
würde. Bei nicht thermostabilen Polymerasen wie z. B. Sequenase
Version 2 (Amersham Pharmacia Biotech), exonuclease free Klenow-
Fragment der DNA Polymerase I (Amersham Pharmacia Biotech) wird
die Reaktionsthemperatur von konventionellen 37°C vorzugsweise
auf 20°C bis 30°C reduziert. Bei thermostabilen Polymerasen wie
z. B. Taq-Polymerase (GibcoBRL), ProHATM-Polymerase (Eurogentech)
wird die Reaktionstemperatur von konventionellen 70-75°C
vorzugsweise auf Werte reduziert, die zwischen 30°C und dem
Temperaturwert (x) liegen. Dieser Temperaturwert (x) hängt von
der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-
Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt der
Temperaturwert (x) bei 42°C).
In einer anderen bevorzugten Ausführungsform der Erfindung er
folgt die Anpassung der Reaktionsbedingungen durch die Verminde
rung der NT*-Konzentration auf unter 5 µM, die anderen Parameter
der Reaktion (Pufferbedingungen, Temperaturbedingungen) werden
konstant gehalten. Die Konzentration der NT* liegt vorzugsweise
bei dieser Anpassung zwischen 0,5 und 5 µM. Die Dauer der
Reaktion liegt zwischen 10 sec und 10 min. Das wichtigste bei der
Wahl der NT*-Konzentration ist, daß die Polymerase in der
vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min)
ein zweites NT* nicht einbaut.
Nach Optimierung der Reaktionsbedingungen für den Einbau eines
einzelnen NT* muß man die Reaktion mit gespaltenen NTs* wieder
holen. Unter entsprechend geänderten Reaktionsparameter muß
Polymerase die gespaltenen NTs* nacheinander einbauen können.
Die Optimierungsreaktion korreliert mit dem Einbauschritt,
Schritt (b), in einem Zyklus. Die für die Optimierungsreaktion
ermittelten Bedingungen, die Temperatur, die Konzentration an
NT*, die Pufferbedingungen, die Dauer der Reaktion werden für die
Reaktion auf der Oberfläche übernommen.
Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in
die NSKFs vorzugsweise so, daß an mehr als 50% der an der
Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein
markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. Das
hängt damit zusammen, daß an manchen Nukleinsäureketten die
Reaktion sehr langsam abläuft. Ein Einbau der NTs* an jeder
komplementären Position in jedem Zyklus wird angestrebt, ist aber
nicht erforderlich, weil nur die erfolgreichen Einbaureaktionen
detektiert und ausgewertet werden; eine verzögerte Reation im
Nachfolgenden Zyklus führt nicht zu einem Sequenzierungsfehler.
Vorzugsweise wird für alle NTs* dieselbe Polymerase verwendet. Es
können aber auch verschiedene Polymerasen für verschiedene NTs*
eingesetzt werden.
Einen Zyklus kann man durchführen mit:
- a) vier verschieden markierten NT*s
- b) zwei verschieden markierten NT*s
- c) einem markierten NT*
- d) zwei verschieden markierten NT*s und zwei unmarkierten NTs,
d. h.
- a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht man die Sequenzierung einer Nukleinsäurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe müssen in jedem Zyklus identifiziert werden.
- b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen gewählt werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden markiert sind, z. B. A und G tragen die Markierung "X", C und U tragen die Markierung "Y". In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt, z. B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n + 1) werden dann U* und G* zugegeben.
- c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NTs* einsetzen.
- d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s/2NTs-Methode). Diese Ausführungsform kann verwendet werden, um Varianten (z. B. Muta tionen, oder alternativ gespleißte Gene) einer bereits bekannten Sequenz zu ermitteln.
Einzelne Moleküle auf einer Oberfläche kann man mit verschiedenen
Methoden untersuchen. Es sind mehrere Verfahren bekannt: z. B.
AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahfeld-Fluo
reszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR-
Mikroskopie usw. (Science 1999 v. 283 1667, Unger et al. BioTech
niques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161,
Dickson et al. Science 1996 v. 274 S. 966, Xie et al. Science 1994
v. 265 S. 361, Nie et al. Science 1994 v. 266 S. 1018, Betzig et al.
Science 1993 v. 262 S. 1422).
Erfindungsgemäß werden Fluoreszenz-Signale einzelner in die
Nukleinsäurekette eingebauter NTs* vorzugsweise mit einem
Weitfeld-Fluoreszenz-Mikroskop oder einem Laser-Scanning-
Mikroskop oder einem TIRF-Microskop (Total Internal Reflection
Fluorescence Microscope).
Es sind verschiedene Varianten der Konstruktion einer solchen
Apparatur möglich (Weston et al. J. Chem. Phys. 1998 v. 109 S. 7474,
Trabesinger et al. Anal. Chem. 1999 v. 71 S. 279, Adachi et al.
Journal of Microscopy 1999 v. 195 S. 125, Unger et al. BioTech
niques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161,
Dickson et al. Science 1996 v. 274 S. 966, Tokunaga et al.
Bichem. Biophys. Res. Com. 1997 v. 235 S. 47, "Confocal Laser Scanning
Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New
Techniques of optical microscopy and microspectroscopy" 1991 Ed.
R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed.
Herman BIOS Scientific Publishers, "Handbook of biological
confocal microscopy" 1995 J. Pawley Plenum Press). Unterschiede
in ihrem konkreten Aufbau ergeben sich aus der Variation ihrer
Einzelteile. Die Vorrichtung für das Anregungslicht kann z. B. auf
der Basis eines Lasers, einer Lampe oder von Dioden funktionie
ren. Für die Detektionsvorrichtung können sowohl CCD-Kameras als
auch PMT dienen. Andere Beispiele für technische Details siehe
("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS
Scientific Publishers, "New Techniques of optical microscopy and
microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluores
cence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers,
"Handbook of biological confocal microscopy" 1995 J. Pawley Plenum
Press). Es ist nicht die Aufgabe dieser Erfindung, alle
möglichen technischen Varianten einer Detektionsvorrichtung
aufzuzählen. Der prinzipielle Aufbau einer geeigneten Apparatur
wird in einem Schema Fig. 8 erläutert. Sie besteht aus folgenden
Elementen:
1 Lichtquelle zur Anregung der Fluoreszenz
2 Lichtleitender Teil
3 Scantisch
4 Vorrichtung zur Selektion von Spektren
5 Detektionsvorrichtung
6 Computer mit Steuerungs- und Analysefunktionen
2 Lichtleitender Teil
3 Scantisch
4 Vorrichtung zur Selektion von Spektren
5 Detektionsvorrichtung
6 Computer mit Steuerungs- und Analysefunktionen
Diese Elemente der Apparatur können kommerziell erworben werden
(Mikroskop-Firmen: Zeiss, Leica, Nikon).
Im folgenden soll beispielsweise eine für die Detektion einzelner
Moleküle geeignete Kombination aus diesen Elementen vorgestellt
werden:
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil berdampflampe
Objektiv Planneofluar 100x, NA 1.4 (Zeiss)
Kamera Photometrix
Computer mit Software zur Steuerung und Analyse
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil berdampflampe
Objektiv Planneofluar 100x, NA 1.4 (Zeiss)
Kamera Photometrix
Computer mit Software zur Steuerung und Analyse
Nachfolgend soll die Vorgehensweise bei der Detektion erläutert
werden. Man beachte dabei die allgemeinen Regeln der Fluo
reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 Ed.
Sheppard, BIOS Scientific Publishers, "New Techniques of optical
microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press,
Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific
Publishers, "Handbook of biological confocal microscopy" 1995
J. Pawley Plenum Press).
Die Detektion umfaßt folgende Phasen:
- 1. Vorbereitung zur Detektion
- 2. Durchführung eines Detektionsschrittes in jedem Zyklus,
wobei jeder Detektionsschritt als Scanvorgang abläuft und
folgende Operationen umfaßt:
- a) Einstellung der Position des Objektivs (X,Y-Achse),
- b) Einstellung der Fokusebene (Z-Achse),
- c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF,
- d) Verschiebung zur nächsten Position auf der Oberfläche.
Die Signale von in die NSKFs eingebauten NTs* werden durch das
Abscannen der Oberfläche registriert. Der Scanvorgang kann in
verschiedener Weise ausgeführt werden ("Confocal Laser Scanning
Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New
Techniques of optical microscopy and microspectroscopy" 1991 Ed.
R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed.
Herman BIOS Scientific Publishers, "Handbook of biological
confocal microscopy" 1995 J. Pawley Plenum Press). Vorzugsweise
wird ein diskontinuierlicher Scanvorgang gewählt. Dabei wird das
Objektiv schrittweise über die Oberfläche bewegt (Fig. 8a), so
daß von jeder Oberflächenposition ein zweidimensionales Bild (2D-
Bild) entsteht (Fig. 8b, c).
Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden:
z. B. durch den Laser-Scan einer Position des Mikroskopfeldes
(Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an
einer Position (vgl. Handbücher der Mikroskopie). Als Beispiel
wird die Detektion einzelner Moleküle mit einer CCD-Kamera
beschrieben.
Die Detektion wird am Beispiel der Sequenzierung eines 1 Mb langen
DNA-Stücks erläutert:
Am Anfang wird festgelegt, wie viele NSKFs zur Rekonstruktion der
ursprünglichen Sequenz analysiert werden müssen. Im Fall einer
Rekonstruktion nach dem Schrotschuß-Verfahren ("Automated DNA
sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic
Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics
1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et
al. J. Comput. Biol. 1994 v. 1 S. 257) spielen folgende Faktoren eine
Rolle: 1) Von jedem NSKF wird bei der Sequenzierung eine Sequenz
von ca. 300-500 NTs bestimmt. 2) Die Gesamtlänge der zu analysie
renden Sequenz ist wichtig. 3) Bei der Sequenzierung muß ein
bestimmtes Maß an Redundanz erreicht werden, um die Genauigkeit
zu steigern und eventuelle Fehler zu korrigieren. Insgesamt ist
zur Rekonstruktion des größten Teils der ursprünglichen Sequenz
die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich,
d. h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb
Rohsequenzdaten gebraucht. Bei einer durchschnittlichen Sequenz
länge von 400 bp pro NSKF benötigt man entsprechend 25 000 bis
250 000 DNA-Fragmente.
Zur Sequenzierung müssen die Positionen der NSKFs bestimmt wer
den, damit man eine Grundlage für die Zuordnung der Signale hat.
Die Kenntnis dieser Positionen erlaubt eine Aussage darüber, ob
die Signale einzelner Moleküle von eingebauten NTs* stammen oder
von zufällig an die Oberfläche gebundenen NTs*. Diese Positionen
können mit verschiedenen Methoden identifiziert werden.
In einer bevorzugten Ausführungsform werden die Positionen immo
bilisierter NSKF während der Sequenzierung identifiziert. Dabei
wird die Tatsache genutzt, daß die Signale von den in die Nu
kleinsäurekette eingebauten NTs* immer dieselben Koordinaten
haben. Das ist durch die Fixierung der Nukleinsäureketten ge
währleistet. Die unspezifisch gebundenen NTs* binden zufällig an
verschieden Stellen der Oberfläche.
Zur Identifizierung der Positionen von fixierten NSKFs werden die
Signale auf Übereinstimmung ihrer Koordinaten aus mehreren
aufeinander folgenden Zyklen überprüft. Das kann z. B. am Anfang
der Sequenzierung erfolgen. Die übereinstimmende Koordinaten
werden als Koordinaten der DNA-Fragmente bewertet und gespei
chert.
Das Scan-System muß reproduzierbar über mehrere Zyklen die Ober
fläche abscannen können. X, Y und Z-Achsen-Einstellungen an jeder
Oberflächenposition können von einem Computer kontrolliert wer
den. Stabilität und Reproduzierbarkeit der Einstellung von Ob
jektivpositionen in jedem Scanvorgang entscheiden über die Qua
lität der Detektion und somit über die Identifizierung der Si
gnale einzelner Moleküle.
Die mechanische Instabilität der kommerziell erhältlichen Scan
tische und die geringe Reproduzierbarkeit der wiederholten Ein
stellung derselben X, Y-Positionen machen eine präzise Analysen
der Signale einzelner Moleküle über mehrere Zyklen schwierig. Es
existieren viele Möglichkeiten, eine Übereinstimmung der Koor
dinaten bei wiederholten Einstellungen zu verbessern bzw. mögli
che Abweichungen zu kontrollieren. Als Beispiel wird eine
Kontrollmöglichkeit angeführt. Nach einer groben mechanischen
Einstellung der Objektivposition wird ein Kontrollbild von einem
mit der Oberfläche fest verbundenen Muster gemacht. Auch wenn die
mechanische Einstellung nicht exakt dieselben Koordinaten
aufweist (Abweichungen bis zu 10 µm sind durchaus möglich), kann
man mittels optischer Kontrolle eine Korrektur vornehmen. Das
Kontrollbild vom Muster dient als Koordinatensystem für das Bild
mit Signalen von eingebauten NTs*. Eine Voraussetzung für eine
solche Korrektur ist, daß keine weiteren Bewegungen der Ober
fläche zwischen diesen beiden Aufnahmen gemacht werden. Signale
von einzelnen Molekülen werden in Relation zum Muster gesetzt,
so daß eine X, Y-Abweichung in der Musterposition gleiche X, Y-
Abweichung in der Position der Signale einzelner Moleküle bedeu
tet. Das Kontrollbild vom Muster kann vor, während oder nach der
Detektion einzelner Moleküle gemacht werden. Ein solches Kon
trollbild muß entsprechend bei jeder Einstellung auf einer neuen
Oberflächenposition gemacht werden.
Die Oberfläche ist nicht absolut plan und weist verschiedene
Unebenheiten auf. Dadurch verändert sich der Oberfläche-Objektiv-
Abstand beim abscannen benachbarter Stellen. Diese Unterschiede
im Abstand können dazu führen, daß einzelne Moleküle die
Fokusebene verlassen und so der Detektion entgehen.
Aus diesem Grund ist es wichtig, daß beim Abscannen der Ober
fläche eine reproduzierbare Einstellung der Fokusebene an jeder
Objektivposition erreicht wird.
Es gibt verschiedene Möglichkeiten, die Fokusebene reproduzierbar
einzustellen. Beispielsweise kann folgende Methode angewendet
werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer
Fluoreszenz führen kann, wird auf die Oberfläche ein Marker
aufgebracht, der zur Einstellung der Fokusebene dient. Danach
erfolgt die Detektion der Signale einzelner Moleküle. Der Marker
kann beliebiger Natur sein (z. B. Farbstoff oder Muster), darf
aber die Detektion und die Reaktion nicht beeinträchtigen.
Das mit Hilfe des Detektionssystems erzeugte zweidimensionale
Bild der Reaktionsoberfläche enthält die Signalinformationen von
in die NSKFs eingebauten NT*s. Diese müssen vor der weiteren
Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit
geeigneten Methoden extrahiert werden. Die dazu notwendigen
Algorithmen zur Skalierung, Transformation und Filterung der
Bildinformationen zählen zum Standardrepertoir der digitalen
Bildverarbeitung und Mustererkennung (Haberäcker P. "Praxis der
Digitalen Bildverarbeitung und Mustererkennung". Hanser-Verlag,
München, Wien, 1995; Galbiati L. J. "Machine vision and digital
image processing fundamentals". Prentice Hall, Englewood Cliffs,
New Jersey, 1990). Die Signalextraktion erfolgt vorzugsweise über
ein Grauwertbild, das die Helligkeitsverteilung der Reaktions
oberfläche für den jeweiligen Fluoreszenzkanal abbildet. Wenn bei
der Sequenzierungsreaktion mehrere Nukleotide mit unterschied
lichen Fluoreszenz-Farbstoffen verwendet werden, kann zunächst
für jedes verwendete fluoreszenzmarkierte Nukleotid (A, T, C, G oder
U) ein separates Grauwert-Bild erzeugt werden. Dafür können
prinzipiell 2 Verfahren angewendet werden:
- 1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersätze) wird für jeden Fluoreszenzkanal ein Grauwertbild erzeugt.
- 2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines geeigneten Algorithmus durch ein Bildverarbeitungsprogramm die relevanten Farbkanäle extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer Farb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt:
GBN
= (s(x, y)) einkanaliges Grauwertbild
N{1, . . ., Anzahl der Fluoreszenzkanäle}.
M = {0, 1, . . ., 255} Grauwertmenge
S = (s(x, y)) Bildmatrix des Grauwertbildes
x = 0, 1, . . ., L-1 Bildzeilen
y = 0, 1, . . ., R-1 Bildspalten
(x, y) Ortskoordinaten eines Bildpunktes
s(x, y) ∈ M Grauwert des Bildpunktes.
N{1, . . ., Anzahl der Fluoreszenzkanäle}.
M = {0, 1, . . ., 255} Grauwertmenge
S = (s(x, y)) Bildmatrix des Grauwertbildes
x = 0, 1, . . ., L-1 Bildzeilen
y = 0, 1, . . ., R-1 Bildspalten
(x, y) Ortskoordinaten eines Bildpunktes
s(x, y) ∈ M Grauwert des Bildpunktes.
Aus dieser Datenmenge wird nun durch ein geeignetes Programm die
relevante Bildinformation extrahiert. Ein solches Programm sollte
folgende Arbeitsschritte realisieren:
Für GB1 bis GBN durchführen:
- A) Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa durch Grauwertglättung.
- B) Prüfung jedes Bildpunkt (x, y) des Grauwertbildes, ob dieser Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter anderem von der verwendeten Detektionsapparatur und der Auflösung des Grauwertbildes ab. Sie können beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der Bildsegmentierung reichen von einfachen Schwellwert verfahren bis hin zur Verwendung neuronaler Netze.
Erfüllt ein Bildpunkt (x, y) diese Anforderungen, dann folgt ein
Vergleich mit den Koordinaten von in bisher durchgeführten
Sequenzierungszyklen identifizierten NSKFs. Bei einer Über
einstimmung erfolgt die Zuordnung des Signals mit dem aus dem
jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem
NSKF. Signale mit nicht übereinstimmenden Koordinaten werden als
Hintergrundsignale bewertet und verworfen. Die Analyse der
Signale kann parallel zum Scanvorgang erfolgen.
In einer beispielhaften Ausführung wurde ein 8-Bit-Grauwertbild
mit einer Auflösung von 1317 × 1035 Pixel verwendet. Um die durch
die Digitalisierung entstandenen Veränderungen am Bild zu
reduzieren, erfolgte zunächst eine Vorverarbeitung des Gesamt
bildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten
seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung
entsteht dadurch ein für einen Fluoreszenzpunkt typisches Muster
eines zentralen Bildpunkt mit dem größten Helligkeitswert und
Nachbarbildpunkten mit nach allen Seiten hin abfallenden
Helligkeiten. Erfüllte ein Bildpunkt diese Kritierien und
Überschritt der zentrifugale Helligkeitsabfall einen bestimmten
Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte),
dann wurde dieser zentrale Bildpunkt als Koordinate eines
Fluoreszenzpunktes gewertet.
- a) Verschiebung des Objektivs zur nächsten Position auf der Oberfläche. Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer anderen Position der Oberfläche positioniert.
Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der
Kontrolle der X, Y-Position, der Einstellung der Fokusebene und
mit der Detektion einzelner Moleküle bei jeder neuen Objek
tivposition gemacht werden. Diese Schritte können durch einen
Computer gesteuert werden.
Der Scanvorgang sowie die biochemische Reaktion nehmen eine
gewisse Zeit in Anspruch. Wenn man diese Vorgänge nacheinander
schaltet, kann man eine optimale Leistung der Apparatur errei
chen. In einer bevorzugten Ausführung wird die Reaktion auf zwei
getrennten Oberflächen durchgeführt (Fig. 9).
Als Beispiel kann eine Oberfläche mit immobilisierten NSKFs in
2 räumlich isolierte Teile getrennt werden, so daß Reaktionen auf
diesen beiden Teilen unabhängig voneinander ablaufen können. In
einem anderen Beispiel können NSKFs auch von vornherein auf 2
getrennten Oberflächen immobilisiert werden.
Danach wird die Reaktion gestartet. Das Prinzip dabei ist, daß
während auf einem Teil der Oberfläche die Reaktions- und Wasch
schritte ablaufen, der zweite Teil abgescannt wird. Dadurch kann
man einen kontinuierlichen Ablauf der Analyse erreichen und die
Geschwindigkeit der Sequenzierung steigern.
Die Anzahl der Oberflächen, auf denen die Reaktion abläuft, kann
auch größer als 2 sein. Das erscheint dann sinnvoll, wenn die
Reaktion als zeitlich limitierender Schritt auftritt, d. h. die
Detektion der Signale auf der Oberfläche schneller als die Reak
tions- und Waschschritte abläuft. Um die Gesamtdauer der Reaktion
an die Detektionsdauer anzupassen, kann jeder einzelne Schritt
der Reaktion auf einer einzelnen Oberfläche mit einer zeitlichen
Verzögerung im Vergleich zur nächsten Oberfläche ablaufen.
Die Erfindung wird nachfolgend anhand von Beispielen verdeut
licht.
Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 7f-1)
Als Ausgangssubstanzen dienen 5-(3-Aminoallyl)-2'-deoxyuridin-
5'-triphosphat, AA-dUTP, (Sigma), 3,3'-Dithio-bis(propionsäure-
N-Nydroxysuccinimidester), DTBP-NHS, (Sigma), 2-Mercaproethanol
amin, MEA, (Sigma). Zu 100 µl 50 mM Lösung von AA-dUTP in 100 mM
Borat-Puffer pH 8.5 werden 3 Äquivalente an DTBP-NHS in DMF
(25 µl 0.4M Lösung) zugegeben. Das Reaktionsgemisch wird 4
Stunden bei RT. inkubiert. Anschließend wird konz. Ammonium
acetat-Lösung (pH 9) zugegeben bis die Gesamtkonzentration an
CH3COONH4 in der Reaktionslösung 100 mM ist, und die Reaktion wird
eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch
200 µl 1M MEA-Lösung, pH 9, zugegeben und eine Stunde bei RT
inkubiert. Anschließend wird zu diesem Gemisch solange eine
gesätigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die
Iodfarbe bestehen bleibt. Die modifizierten Nukleotide werden auf
einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient (pH 8.5)
von anderen Reaktionsprodukten abgetrennt. Isolierung des
Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An
diesen Linker können nun Farbstoffe mit verschiedenen Methoden
gekoppelt werden ("Handbook of Fluorescent Probes und Research
Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner
Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in
Enzymology 1997, v. 278, S. 363).
Auch andere Nukleotidanaloga (z. B. nach Hobbs et al. US Patent
5,047,519, Khan et al. US Patent 5,821,356) können in die
Reaktion eingesetzt werden, so daß Nukleotidanaloga mit Struktu
ren in Fig. 7f-2, 3, 4 und 7g-1, 2 erzeugt werden können.
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird
die Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat)
angegeben (NT*-Struktur Fig. 7j)
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird
in 30 µl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*).
Dazu werden 10 µl 10 mM TRITC in Dimethylformamid (DMF) gegeben
und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff
modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser
Gradienten.
Beispiel der Spaltung der Disulphidverbindung im modifizierten
NT*. Die Spaltung erfolgt durch eine Zugabe von 20 bis 50 mM
Dithiothreitol-Lösung DTT (Sigma) Lösung pH 8 auf die Reaktions
oberfläche. Die Oberfläche wird 10 min. mit dieser Lösung
inkubiert, danach wird die Lösung entfernt und die Oberfläche mit
einer Pufferlösung zur Entfernung von DTT-Resten gewaschen.
Modifiziertes dUTP (dUTP-SS-CH2CH2NH2) mit einem kurzen spaltbaren
Linker (Fig. 7e-1). Als Ausgangssubstanzen dienen: Bis-dUTP,
synthetisiert nach Hanna (Method in Enzymology 1989, v. 180,
S. 383), 2-Mercaptoethanolamin (MEA) (Sigma).
Zu 400 µl 100 mM Bis-dUTP in 40 mM Boratpuffer pH 8.5 werden 100 µl
100 mM MEA-Lösung pH 8.5 in H2O zugegeben und 1 Stunde bei RT
inkubiert. Anschließend wird zu diesem Gemisch solange eine
gesätigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die
Iodfarbe bestehen bleibt. Die Nukleotide (Bis-dUTP und dUTP-SS-
CH2CH2NH2) können z. B. durch eine Ethanol-Präzipitation oder auf
einer DEAE-Cellulose-Säule im Ammoniumcarbonat-Gradienten (pH
8.5) von anderen Reaktionsprodukten abgetrennt werden. Bis-dUTP
stört bei der anschließenden Ankopplung eines Farbstoffs an die
Aminogruppe des Linkers nicht, so daß die Abtrennung des dUTP-SS-
CH2CH2NH2 von bis-dUTP im Endreinigungsschritt erfolgen kann.
In einer ähnlichen Weise kann auch dCTP (Fig. 7-e2) modifiziert
werden, dabei dient Bis-dCTP als Ausgangssubstanz (synthetisiert
nach Hanna et al. Nucleic Acid Research 1993, v. 21, S. 2073).
An den Linker können nun Farbstoffe mit verschiedenen Methoden
gekoppelt werden ("Handbook of Fluorescent Probes und Research
Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner
Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in
Enzymology 1997, v. 278, S. 363).
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird
die Ankopplung des FluoroLinkTM Cy3 monofunktional dye (Amersham
Pharmacia biotech) (NT*-Struktur Fig. 71) angegeben. Das ist ein
monofunktionaler NHS-Ester-Fluoreszenzfarbstoff. Die Reaktion
wird nach Angaben des Herstellers durchgeführt:
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 µl 100 mM Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird Farbstoff (300 nmol) gegeben und 1 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 300 µl 100 mM Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird Farbstoff (300 nmol) gegeben und 1 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den
Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5-
isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC
Fig. 7h).
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird
in 30 µl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*).
Dazu werden 10 µl 10 mM TRITC in DMF gegeben und 4 h bei RT
inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT*
erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.
Bei einer bevorzugten Ausführungsform der Erfindung werden alle
vier in die Reaktion eingesetzten NTs* mit Fluoreszenzfarbstoffen
markiert.
Im folgenden soll anhand der Sequenzierung eines 1 Mb langen
DNA-Stückes schematisch die Sequenzierung langer Nukleinsäu
reketten dargestellt werden (Fig. 1). Der Sequenzierung
liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequen
cing and analysis" S. 231 ff. 1994 M. Adams et al. Academic
Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang
Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23
S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Das zu
analysierende Material wird für die Sequenzierungsreaktion
vorbereitet, indem es in Fragmente von vorzugsweise 50 bis
1000 bp Länge zerlegt wird. Jedes Fragment wird anschließend
mit einer Primerbindungsstelle und einem Primer versehen.
Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf
einer planen Oberfläche fixiert. Die nicht gebundenen DNA-
Fragmente werden durch einen Waschschritt entfernt. Danach
wird die Sequenzierungsreaktion an der gesamten Reaktions
oberfläche durchgeführt. Zur Rekonstruktion einer 1 Mb
langen DNA-Sequenz sollten die Sequenzen von NSKFs vorzugs
weise länger als 300 NTs sein, durchschnittlich ca. 400 bp.
Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird,
sind mindestens 400 Zyklen zur Sequenzierung notwendig.
Insgesamt ist zur Rekonstruktion der ursprünglichen Sequenz
die etwa 10- bis 100-fache Menge an Rohsequenzen erforder
lich, d. h. 10 bis 100 Mb. Bei einer durchschnittlichen
Sequenzlänge von ca. 400 bp pro NSKF benötigt man entspre
chend 25 000 bis 250 000 DNA-Fragmente, um mehr als 99,995%
der Gesamtsequenz abzudecken.
Die ermittelten NSKF-Sequenzen stellen eine Population von
überlappenden Teilsequenzen dar, die sich mit kommerziell
erhältlichen Programmen zur Gesamtsequenz der NSK zusammen
fügen lassen ("Automated DNA sequencing and analysis" S. 231
ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield
et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol.
1994 v. 1 S. 257).
In einer bevorzugten Ausführungsform können statt einer
Sequenz mehrere Sequenzen in einem Ansatz analysiert werden.
Die ursprünglichen Sequenzen können aus den gewonnen
Rohdaten z. B. nach dem Schrotschuß-Prinzip rekonstruiert
werden.
Zunächst werden NSKFs erzeugt. Man kann z. B. mRNA in eine
doppelsträngige cDNA überführen und diese cDNA mit Ul
traschall fragmentieren. Anschließend werden diese NSKFs mit
einer Primerbindungsstelle versehen, denaturiert, immobili
siert und mit einem Primer hybridisiert. Zu beachten ist bei
dieser Variante der Probenvorbereitung, daß die cDNA-
Moleküle unvollständige mRNA-Sequenzen darstellen können
(Method in Enzymology 1999, v. 303, S. 19 und andere Artikel
in diesem Band, "cDNA library protocols" 1997 Humana Press).
Eine andere Möglichkeit bei der Generierung einzelsträngiger
NSKFs von mRNA besteht in der reversen Transkription der
mRNA mit randomisierten Primern. Dabei werden viele relativ
kurze antisense DNA-Fragmente gebildet (Zhang-J et al.
Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem.
1994 v. 269 S. 31544, Kolls et al. Anal. Biochem. 1993 v. 208
S. 264, Decraene et al. Biotechniques 1999 v. 27 S. 962). Diese
Fragmente können anschließend mit einer Primerbindungstelle
versehen werden (s. o). Weitere Schritte entsprechen oben
beschriebenen Vorgängen. Mit dieser Methode können komplette
mRNA-Sequenzen (vom 5'- bis zum 3'-Ende) analysiert werden,
da die randomisierten Primer über die gesamte Länge der mRNA
binden.
Immobilisierte NSKFs werden mit einer der oben angeführten
Ausführungsformen der Sequenzierung analysiert. Da mRNA-
Sequenzen wesentlich weniger repetitive Sequenzen aufweisen
als z. B. genomische DNA, kann die Anzahl der detektierten
Signale der eingebauten NTs* von einem NSKF geringer als 300
sein und liegt vorzugsweise zwischen 20 und 1000. Die Anzahl
der NSKFs, die analysiert werden müssen, errechnet sich nach
denselben Prinzipien wie bei einer Schrotschuß-Rekonstruk
tion einer langen Sequenz.
Aus NSKF-Sequenzen werden nach den Prinzipien des Schrot
schuß-Verfahrens die ursprünglichen Gensequenzen rekon
struiert.
Diese Methode erlaubt die gleichzeitige Sequenzierung von
vielen mRNAs ohne vorherige Klonierung.
Die Bestätigung einer bereits bekannten Sequenz oder der
Nachweis von Varianten dieser Sequenz stellt sehr viel
geringere Ansprüche an die Länge und Redundanz der ermittel
ten NSKFs. Auch die Sequenzbearbeitung ist in diesem Fall
einfacher. Die Vollsequenz braucht nicht neu rekonstruiert
zu werden. Die NSKF-Sequenzen werden vielmehr mit Hilfe
eines kommerziell erhältlichen Programms der Vollsequenz
zugeordnet und eventuelle Abweichungen detektiert. Einem
solchen Programm kann z. B. BLAST oder FASTA Algorithmus
zugrunde liegen ("Introduction to computational Biology"
1995 M. S. Waterman Chapman & Hall).
Die zu analysierende Sequenz wird in NSKFs mit einer der
oben genannten Methode geteilt. Diese NSKFs werden mit dem
erfindungsgemäßen Verfahren sequenziert. Anschließend werden
die ermittelten Sequenzen von NSKFs nicht nach dem Schrot
schuß-Verfahren zusammengestzt, sondern mit der Referenz
sequenz verglichen und auf diese Weise ihren Positionen in
der Vollsequenz zugeordnet. Dabei kann es sich um genomische
oder cDNA-Sequenzen handeln.
Im Gegensatz zu einer Rekonstruktion nach dem Schrotschuß-
Verfahren braucht man für die Analyse einer Sequenzvariante
erheblich weniger Rohsequenzdaten. So kann die 5- bis 10-
fache Rohsequenzmenge ausreichend für die Wiederherstellung
einer neuen Variante einer Vollsequenz sein. Mit dem Schrot
schuß-Verfahren wird für eine Wiederherstellung eine 10- bis
100-fache Menge an Rohsequenzen benötigt ("Automated DNA
sequencing and analysis" S. 231 ff. 1994 M. Adams et al.
Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868,
Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23
S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).
Die Länge der ermittelten NSKF-Sequenzen soll für eine
eindeutige Zuordnung zu einer bestimmten Position in der
Referenzsequenz ausreichend sein, so können z. B. bereits
Sequenzen mit einer Länge von 20 NTs (z. B. aus nicht
repetitiven Abschnitten im menschlichen Genom) eindeutig
identifiziert werden. Für die Vergleichsanalyse der repet
itiven Abschnitte werden längere Sequenzen benötigt. Die
genaue Länge der Sequenzen hängt dabei von der Aufgaben
stellung ab. Vorzugsweise beträgt die Länge der ermittelten
NSKF-Sequenzen bei der Analyse von nicht repetitiven
Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven
Abschnitte liegt sie vorzugsweise über 500 NTs.
Die Zielsetzungen bei der Sequenzierung neuer Varianten
einer bereits bekannten Vollsequenz können sehr unter
schiedlich sein. Meist wird ein Vergleich der neu ermittel
ten Sequenz mit der bekannten Vollsequenz/Referenzsequenz
angestrebt. Dabei können die beiden Sequenzen aus evolutio
när unterschiedlich weit auseinanderliegenden Spezies
stammen. Verschiedene Parameter der Zusammensetzung dieser
beiden Sequenzen können verglichen werden. Als Beispiele für
eine solche Analyse dienen: Mutations- oder Polymorphismus
analysen und die Analyse von alternativ gespleißten Gen
produkten.
Nachfolgend soll beispielhaft ein Vergleich der zu unter
suchenden Sequenz mit einer Referenzsequenz ohne vorherige
Rekonstruktion der zu analysierenden Sequenz betrachtet
werden. Ein solcher Vergleich kann z. B. zur Mutations- oder
SNP-Analyse dienen.
Eine lange, zu analysierende Sequenz, z. B. 1 Mb, wird in
NSKFs mit einer der oben genannten Methode geteilt. Diese
NSKFs werden mit dem erfindungsgemäßen Verfahren sequen
ziert. Die ermittelten Sequenzen von jedem einzelnen NSKF
werden direkt mit der Referenzsequenz verglichen. Die
Referenzsequenz dient dabei als Grundlage für die Zuordnung
ermittelter NSKF-Sequenzen, so daß die aufwendige Rekon
struktion nach dem Schrotschuß-Verfahren entfällt. Vorzugs
weise beträgt die Länge der ermittelten NSKF-Sequenzen bei
der Analyse von nicht repetitiven Abschnitten mehr als 20
NTs. Für die Analyse der repetitiven Abschnitte liegt sie
vorzugsweise über 500 NTs. Die Anzahl der zu analysierenden
NSKFs richtet sich dabei nach der Gesamtlänge der zu
untersuchenden Sequenz, der durchschnittlichen Länge der
NSKF-Sequenzen und der notwendigen Genauigkeit der Sequenzierung.
Bei einer durchschnittlichen Länge der ermittelten
NSKF-Sequenz von 100 NTs, einer Gesamtlänge der zu unter
suchenden Sequenz von 1 Mb und einer Genauigkeit, die der
Rohsequenzermittlung entspricht (d. h. jede Stelle soll
möglichst nur einmal sequenziert werden) benötigt man z. B.
die ca. 5-fache Menge an Rohsequenzen, d. h. 5 Mb, weil die
Verteilung der NSKFs über die Gesamtsequenz zufällig
erfolgt. Insgesamt müssen 50 000 NSKFs analysiert werden, um
mehr als 99% der Gesamtstrecke abzudecken.
Anschließend werden die ermittelten NSKF-Sequenzen mit Hilfe
eines kommerziell erhältlichen Programms der Vollsequenz
zugeordnet und eventuelle Abweichungen detektiert. Einem
solchen Programm kann z. B. BLAST oder FASTA Algorithmus
zugrunde liegen ("Introduction to computational Biology"
1995 M. S. Waterman Chapman & Hall).
In einer anderen Ausführungsform werden für die Analyse der
Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs einge
setzt.
Diese Methode eignet sich besonders zur Analyse der Sequenzva
rianten (z. B. SNP- oder Mutationsanalyse) und setzt die Kenntnis
einer Referenzsequenz voraus. Dabei wird die Vollsequenz nicht
rekonstruiert, sondern die ermittelten Sequenzen werden mit Hilfe
eines Programms der Referenzsequenz zugeordnet und eventuelle
Abweichungen registriert. Einem solchen Programm kann z. B. der
BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to
computational Biology" 1995 M. S. Waterman Chapman & Hall).
Diese Ausführungsform beruht auf dem Prinzip, daß eine Abfolge
aus 2 Signalen (markierte NT*s) genügend Informationen zur
Identifizierung einer Sequenz enthalten kann. Die ermittelte
Sequenz wird mit der Referenzsequenz verglichen und einer
bestimmten Position zugeordnet, z. B.:
Die unbekannte, zu analysierende Variante der Referenzsequenz
wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK wird
in NSKFs überführt, diese werden mit PBS ligiert, anschließend
mit einem Primer hybridisiert und auf Reaktionsoberfläche
immobilisiert). Auf diese Weise vorbereitete NSKFs werden mit
2NTs*/2NTs-Methode sequenziert. Man erhält NSKF-Sequenzen, wobei
jede NSKF-Sequenz eine Abfolge aus 2NTs* darstellt. Um eine
eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten
Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug
sein. Vorzugsweise beträgt die Länge der ermittelten NSKF-
Sequenzen mehr als 40 NT*s. Da 2 markierte NTs* nur einen Teil
der Sequenz darstellen, ist die Gesamtlänge des synthetisierten
komplementären Strangs ca. doppelt so lang, wie die Abfolge der
detektierten NTs* (bei 40 detektierten NTs* beträgt die Gesamt
länge z. B. durchschnittlich 80 NTs).
Zur Synthese eines komplementären Stranges werden 4 Nukleotide
benötigt. Da die mit einem Fluoreszenzfarbstoff markierten NTs*
in der vorliegenden Erfindung als Semiterminatoren auftreten,
d. h. die Termination ausschließlich bei Verfügbarkeit modifi
zierter NTs* auftritt, müssen unmodifizierte NTs in einem zu
sätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben
werden. Die genaue Position dieses Schrittes in dem Zyklus kann
variieren. Wichtig dabei ist, daß die markierten NTs* und die
unmodifizierte NTs getrennt verwendet werden.
Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgen
dermaßen aussehen:
- a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten NSKFs
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der kom plementären Stränge um ein NT geeignet sind
- c) Waschen
- d) Detektion der Signale von einzelnen, modifizierten und in die den NSKFs komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülen
- e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotiden
- f) Waschen
- g) Zugabe von 2 unmodifizierten NTs und Polymerasen
- h) Waschen.
Die Konzentration der NTs liegt vorzugsweise unter 1 mM, idealer
weise unter 10 µM.
Diese 2NT*s/2NTs-Methode eignet sich beispielsweise für die SNP-
Analyse einer genomischen Strecke eines Gens oder für doppel
strängige cDNA-Analyse. Ihr liegen folgende Prinzipien zugrunde:
- 1. Die genetische Information in jedem der beiden komplementä ren DNA-Stränge ist identisch, so daß fehlende Informationen in einem Strang durch die Information aus dem anderen Strang vervollständingt werden können.
- 2. Durch bestimmte Paarkombinationen markierter NTs* kann man mit nur 2NTs* die komplette Information aus einer doppel strängigen DNA erhalten. Zulässige Kombinationen von NT*s bei dieser Ausführungsform sind: A*C*; A*G*; C*T*/C*U*; G*T*/G*U*. Bevorzugt wird die Kombination C* und U*
- 3. Als Grundlage der Analyse dient eine bereits bekannte Refe renzsequenz.
- 4. Die NSKFs stammen von beiden Strängen der zu analysierenden NSK und die ermittelten NSKF-Sequenzen decken die gesamte Länge der zu analysierenden Sequenz ab.
Am folgenden Beispiel wird erklärt, wie die Information aus einem
doppelsträngigen DNA-Fragment mit nur 2 markierten NTs* gewonnen
wird und wie die Unterschiede zur ursprünglichen oder nicht
mutierten Sequenz (Referenzsequenz/Vergleichsequenz) festge
stellt werden können. Sequenzen unter (1) und (2) sind bis auf
eine Stelle identisch (unterstrichen). A* und C* sind markiert.
Die zu prüfende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert,
so daß eine Population an NSKF-Sequenzen (ermittelte NSKF-
Sequenzen(n)) entsteht. Diese ermittelten NSKF-Sequenzen
enthalten Information von jedem Strang:
Zur Analyse ist eine Vergleichsequenz (Referenzsequenz) erforder
lich:
Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen
bestimmten Stellen in der Vergleichsequenz zugeordnet und
eventuelle Abweichungen detektiert:
Mit dieser Ausführungsform kann man eine doppelsträngige
Nukleinsäure auf SNP oder Mutationen untersuchen. Dabei werden
die ermittelten NSKF-Sequenzen mit einer Referenzsequenz
verglichen. Die Grundregeln des Vergleichs einer Teilsequenz und
einer kompletten Sequenz bei der Analyse mit nur 2 markierten NTs
unterscheiden sich nicht prinzipiell von denen, die bei dem
Vergleich der Sequenzen anhand aller 4 markierten NTs* gelten.
Näheres s. Sequenzvergleich bei Mutationsanalyse und SNP-Analyse
mit 4NTs* (Beispiel 3B).
Claims (42)
1. Verfahren zur Sequenzanalyse von Nukleinsäuresequenzen (Nu
kleinsäureketten, NSKs), bei dem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
wobei man die relative Position einzelner NSKFs auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spe zifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluores zenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
- a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifi zierte Nukleotide (NTs*) enthält, die mit Fluoreszenz farbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedli cher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang ein zubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer ste risch anspruchsvoller Ligand ist, man
- b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplemen tären Stränge jeweils um ein NT* verlängert werden, man
- c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man
- d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarb stoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluo reszenzsignale auf der Reaktionsoberfläche bestimmt, man
- e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo reszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man
- f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz farbstoffe und der Liganden geeignet sind, man
wobei man die relative Position einzelner NSKFs auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spe zifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluores zenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.
2. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man
die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach
wiederholt, wobei man in jedem Zyklus nur jeweils ein
markiertes NT* einsetzt.
3. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man
die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach
wiederholt, wobei man in jedem Zyklus jeweils zwei unter
schiedlich markierte NTs* einsetzt.
4. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß man
die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach
wiederholt, wobei man in jedem Zyklus jeweils vier unter
schiedlich markierte NTs* einsetzt.
5. Verfahren nach Anspruch 1, dadurch gekennzeichnet, daß die
NSKs Varianten einer bekannten Referenzsequenz sind und man
die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach
wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei
unterschiedlich markierte NTs* und zwei unmarkierte NTs
einsetzt und man die Gesamtsequenzen durch Vergleich mit der
Referenzsequenz ermittelt.
6. Verfahren nach den Ansprüchen 1 bis 5, dadurch gekenn
zeichnet, daß man in die NSKFs jeweils eine Primerbin
dungsstelle (PBS) einführt, wobei man bei doppelsträngigen
NSKs an beiden komplementären Einzelsträngen jeweils eine
PBS einführt und wobei die Primerbindungsstellen für alle
NSKFs jeweils gleiche oder verschiedene Sequenzen aufweisen.
7. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekenn
zeichnet, daß man die NSKFs mit Primern unter Bedingungen in
Kontakt bringt, die zur Hybridisierung der Primer an die
Primerbindungsstellen (PBSs) der NSKFs geeignet sind, wobei
die Primer untereinander gleiche oder verschiedene Sequenzen
aufweisen, und man die NSKFs anschließend auf der Reaktions
oberfläche immobilisiert.
8. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekenn
zeichnet, daß man die NSKFs zunächst auf der Reaktionsober
fläche immobilisiert und erst anschließend mit Primern unter
Bedingungen in Kontakt bringt, die zur Hybridisierung der
Primer an die Primerbindungsstellen (PBSs) der NSKFs
geeignet sind, wobei die Primer untereinander gleiche oder
verschiedene Sequenzen aufweisen.
9. Verfahren nach den Ansprüchen 1 bis 6, dadurch gekenn
zeichnet, daß man die Primer zunächst auf der Reaktionsober
fläche immobilisiert und erst anschließend mit NSKFs unter
Bedingungen in Kontakt bringt, die zur Hybridisierung der
Primer an die Primerbindungsstellen (PBSs) der NSKFs
geeignet sind, wobei die Primer untereinander gleiche oder
verschiedene Sequenzen aufweisen.
10. Verfahren nach den Ansprüchen 1 bis 9, dadurch gekenn
zeichnet, daß der zur strukturellen Modifikation verwendete
sterisch anspruchsvolle Ligand der zur Markierung verwendete
Fluoreszenzfarbstoff ist.
11. Verfahren nach den Ansprüchen 1 bis 10, dadurch gekenn
zeichnet, daß die Reaktionsoberfläche aus der Gruppe
bestehend aus Silicon, Glas, Keramik, Kunststoffen, Gelen
ausgewählt ist.
12. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die
Kunststoffe Polycarbonate oder Polystyrole sind.
13. Verfahren nach Anspruch 11, dadurch gekennzeichnet, daß die
Gele Agarose- oder Polyacrylamidgele sind.
14. Verfahren nach Anspruch 13, dadurch gekennzeichnet, daß die
Gele 1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamid-
Gele sind.
15. Verfahren nach den Ansprüchen 1 bis 14, dadurch gekennzeich
net, daß die DNA-Polymerase eine DNA-Polymerase ohne 3'-5'-
Endonukleaseaktivität ist.
16. Verfahren nach Anspruch 15, dadurch gekennzeichnet, daß die
Polymerase aus der Gruppe bestehend aus viralen DNA-Polymerasen
vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten
und thermostabilen Polymerasen ausgewählt ist.
17. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die
DNA-Polymerase Sequenase Version 2, Polymerase Beta aus
Säugetieren, Taq-Polymerase oder ProHA-DNA-Polymerase ist.
18. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die
DNA-Polymerase Sequenase Version 2 ist.
19. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die
DNA-Folymerase Taq-Polymerase ist.
20. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die
DNA-Polymerase ProHa-DNA-Polymerase ist.
21. Verfahren nach Anspruch 16, dadurch gekennzeichnet, daß die
DNA-Polymerase DNA-Polymerase Beta aus Säugetieren ist.
22. Verfahren nach den Ansprüchen 1 bis 14, dadurch gekennzeich
net, daß die NTs* alpha-Phosphorothioat-NTs* sind und die
Polymersase das Klenow-Fragment von E.coli-Polymerase I oder
T4-DNA-Polymerase ist.
23. Verfahren nach den Ansprüchen 1 bis 18, dadurch gekennzeich
net, daß die Fluoreszenzfarbstoffe aus der Gruppe bestehend
aus Cyanin-Farbstoffen, Rhodamine, Xanthene und deren
Derivaten ausgewählt sind.
24. Kit zur Durchführung des Verfahrens nach den Ansprüchen 1
bis 23, dadurch gekennzeichnet, daß es eine Reaktionsober
fläche (einen festen Träger), zur Durchführung des Verfah
rens erforderliche Reaktionslösungen, ein oder mehrere Poly
merasen, und Nukleotide (NTs) enthält, von denen ein bis
vier mit Fluoreszenzfarbstoffen markiert sind, wobei die
markierten NTs ferner strukturell so modifiziert sind (NT*
bzw. NTs*), daß die Polymerase nach Einbau eines solchen NT*
in einen wachsenden komplementären Strang nicht in der Lage
ist, ein weiteres NT* in denselben Strang einzubauen, wobei
der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle
Modifikation ein abspaltbarer sterisch anspruchsvoller Li
gand ist.
25. Kit nach Anspruch 20, dadurch gekennzeichnet, daß der zur
strukturellen Modifikation verwendete sterisch anspruchs
volle Ligand der zur Markierung verwendete Fluoreszenzfarb
stoff ist.
26. Kit nach Anspruch 24 oder 25, dadurch gekennzeichnet, daß es
ferner Bestandteile enthält:
- a) zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien,
- b) Nukleinsäuremoleküle, die als PBS in die NSKFs einge führt werden,
- c) Oligonukleotid-Primer,
- d) zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien,
- a) Waschlösungen.
27. Kit nach den Ansprüchen 24 bis 26, dadurch gekennzeichnet,
daß die Reaktionsoberfläche aus der Gruppe bestehend aus
Silicon, Glas, Keramik, Kunststoffen, Gelen ausgewählt ist.
28. Kit nach Anspruch 27, dadurch gekennzeichnet, daß die Kunst
stoffe Polycarbonate oder Polystyrole sind.
29. Kit nach Anspruch 27, dadurch gekennzeichnet, daß die Gele
Agarose- oder Polyacrylamidgele sind.
30. Kit nach Anspruch 29, dadurch gekennzeichnet, daß die Gele
1 bis 2% Agarose-Gele oder 10 bis 15% Polyacrylamid-Gele
sind.
31. Kit nach den Ansprüchen 24 bis 30, dadurch gekennzeichnet,
daß die DNA-Polymerase eine DNA-Polymerase ohne 3'-5'-
Endonukleaseaktivität ist.
32. Kit nach Anspruch 31, dadurch gekennzeichnet, daß die Poly
merase aus der Gruppe bestehend aus viralen DNA-Polymerasen
vom Sequenase-Typ, Beta-Polymerasen aus Eukaryonten und
thermostabilen DNA-Polymerasen ausgewählt ist.
33. Kit nach Anspruch 32, dadurch gekennzeichnet, daß die DNA-
Polymerase Sequenase Version 2, Polymerase Beta aus Säuge
tieren, Taq-Polymerase oder ProHa-DNA-Polymerase ist.
34. Kit nach den Ansprüchen 24 bis 30, dadurch gekennzeichnet,
daß die NT* alpha-Phosphorothioat-NTs* sind und die Polymer
sase das Klenow-Fragment von E.coli-Polymerase I oder T4-
DNA-Polymerase ist.
35. Kit nach den Ansprüchen 24 bis 34, dadurch gekennzeichnet,
daß die Fluoreszenzfarbstoffe aus der Gruppe bestehend aus
Cyanin-Farbstoffen, Rhodamine, Xanthene und deren Derivaten
ausgewählt sind.
36. Nukleotid der Formel
37. Nukleotid der Formel
38. Nukleotid der Formel
39. Nukleotid nach Anspruch 36 bis 38, dadurch gekennzeichnet,
daß an die terminale Aminogruppe ein Fluoreszenzfarbstoff
angeheftet ist.
40. Nukleotid der Formel
41. Nukleotid der Formel
42. Nukleotid der Formel
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10120797A DE10120797B4 (de) | 2001-04-27 | 2001-04-27 | Verfahren zur Analyse von Nukleinsäureketten |
| AU2002304705A AU2002304705A1 (en) | 2001-04-27 | 2002-04-26 | Method for analysing nucleic acid chains |
| PCT/EP2002/004659 WO2002088382A2 (de) | 2001-04-27 | 2002-04-26 | Verfahren zur analyse von nukleinsäureketten |
| EP02732680A EP1381698A2 (de) | 2001-04-27 | 2002-04-26 | Verfahren zur analyse von nukleinsäureketten |
| JP2002585662A JP2004529650A (ja) | 2001-04-27 | 2002-04-26 | 核酸鎖の解析方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10120797A DE10120797B4 (de) | 2001-04-27 | 2001-04-27 | Verfahren zur Analyse von Nukleinsäureketten |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE10120797A1 true DE10120797A1 (de) | 2002-11-21 |
| DE10120797B4 DE10120797B4 (de) | 2005-12-22 |
Family
ID=7683014
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE10120797A Expired - Lifetime DE10120797B4 (de) | 2001-04-27 | 2001-04-27 | Verfahren zur Analyse von Nukleinsäureketten |
Country Status (5)
| Country | Link |
|---|---|
| EP (1) | EP1381698A2 (de) |
| JP (1) | JP2004529650A (de) |
| AU (1) | AU2002304705A1 (de) |
| DE (1) | DE10120797B4 (de) |
| WO (1) | WO2002088382A2 (de) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10214395A1 (de) * | 2002-03-30 | 2003-10-23 | Dmitri Tcherkassov | Verfahren zur Analyse von Einzelnukleotidpolymorphismen |
| DE10149786B4 (de) * | 2001-10-09 | 2013-04-25 | Dmitry Cherkasov | Oberfläche für Untersuchungen aus Populationen von Einzelmolekülen |
Families Citing this family (67)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
| US7875440B2 (en) | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
| US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
| US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
| ATE356222T1 (de) | 2000-10-06 | 2007-03-15 | Univ Columbia | Massives parallelverfahren zur dekodierung von dna und rna |
| US9708358B2 (en) | 2000-10-06 | 2017-07-18 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding DNA and RNA |
| JP2004523243A (ja) | 2001-03-12 | 2004-08-05 | カリフォルニア インスティチュート オブ テクノロジー | 非同期性塩基伸長によってポリヌクレオチド配列を分析するための方法および装置 |
| DE10239504A1 (de) * | 2001-08-29 | 2003-04-24 | Genovoxx Gmbh | Verfahren zur Analyse von Nukleinsäurekettensequenzen und der Genexpression |
| US20050227231A1 (en) * | 2001-10-04 | 2005-10-13 | Dimitri Tcherkassov | Device for sequencing nucleic acid molecules |
| GB0129012D0 (en) | 2001-12-04 | 2002-01-23 | Solexa Ltd | Labelled nucleotides |
| US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
| US7414116B2 (en) | 2002-08-23 | 2008-08-19 | Illumina Cambridge Limited | Labelled nucleotides |
| US11008359B2 (en) | 2002-08-23 | 2021-05-18 | Illumina Cambridge Limited | Labelled nucleotides |
| US7541444B2 (en) | 2002-08-23 | 2009-06-02 | Illumina Cambridge Limited | Modified nucleotides |
| PT3147292T (pt) | 2002-08-23 | 2018-11-22 | Illumina Cambridge Ltd | Nucleótidos identificados |
| US8637650B2 (en) | 2003-11-05 | 2014-01-28 | Genovoxx Gmbh | Macromolecular nucleotide compounds and methods for using the same |
| US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
| ATE463584T1 (de) | 2004-02-19 | 2010-04-15 | Helicos Biosciences Corp | Verfahren zur analyse von polynukleotidsequenzen |
| DE602005027700D1 (de) | 2004-05-25 | 2011-06-09 | Helicos Biosciences Corp | Verfahren zur nukleinsäureimmobilisierung |
| US7476734B2 (en) | 2005-12-06 | 2009-01-13 | Helicos Biosciences Corporation | Nucleotide analogs |
| US7220549B2 (en) | 2004-12-30 | 2007-05-22 | Helicos Biosciences Corporation | Stabilizing a nucleic acid for nucleic acid sequencing |
| US7482120B2 (en) | 2005-01-28 | 2009-01-27 | Helicos Biosciences Corporation | Methods and compositions for improving fidelity in a nucleic acid synthesis reaction |
| GB0517097D0 (en) | 2005-08-19 | 2005-09-28 | Solexa Ltd | Modified nucleosides and nucleotides and uses thereof |
| US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
| US7397546B2 (en) | 2006-03-08 | 2008-07-08 | Helicos Biosciences Corporation | Systems and methods for reducing detected intensity non-uniformity in a laser beam |
| JP5220596B2 (ja) * | 2006-05-24 | 2013-06-26 | 独立行政法人産業技術総合研究所 | DNAポリメラーゼβを用いた核酸合成法及び1分子シーケンス法 |
| EP2548972A1 (de) | 2006-06-14 | 2013-01-23 | Verinata Health, Inc | Verfahren zur Diagnose fötaler Missbildungen |
| US8399188B2 (en) | 2006-09-28 | 2013-03-19 | Illumina, Inc. | Compositions and methods for nucleotide sequencing |
| WO2008069973A2 (en) | 2006-12-01 | 2008-06-12 | The Trustees Of Columbia University In The City Of New York | Four-color dna sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators |
| EP2209911B1 (de) | 2007-10-19 | 2013-10-16 | The Trustees of Columbia University in the City of New York | Dna-sequenzierung mit reversiblen nicht-fluoreszenz-nukleotid-terminatoren und mit einer spaltbaren markierung modifizierten nukleotidterminatoren und eine deoxyinosineverbindung mit einer reversiblen terminatorgruppe |
| WO2009051807A1 (en) | 2007-10-19 | 2009-04-23 | The Trustees Of Columbia University In The City Of New York | Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis |
| JP4621926B2 (ja) * | 2008-07-24 | 2011-02-02 | 国立大学法人九州大学 | 酵素基質修飾ヌクレオシド三リン酸、核酸プローブ、マルチラベル化核酸プローブ、マルチラベル化核酸プローブの製造方法および標的核酸の検出方法 |
| JP5146785B2 (ja) * | 2008-07-24 | 2013-02-20 | 国立大学法人九州大学 | 酵素基質修飾ヌクレオシド三リン酸誘導体 |
| US10174368B2 (en) | 2009-09-10 | 2019-01-08 | Centrillion Technology Holdings Corporation | Methods and systems for sequencing long nucleic acids |
| US10072287B2 (en) | 2009-09-10 | 2018-09-11 | Centrillion Technology Holdings Corporation | Methods of targeted sequencing |
| WO2011050938A1 (de) | 2009-10-26 | 2011-05-05 | Genovoxx Gmbh | Konjugate von nukleotiden und methoden zu deren anwendung |
| CA2779750C (en) | 2009-11-06 | 2019-03-19 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
| JP5704481B2 (ja) * | 2010-01-22 | 2015-04-22 | 国立大学法人九州大学 | 核酸検出用キット |
| US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
| CA2797645C (en) | 2010-05-25 | 2020-09-22 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
| EP2670863B1 (de) | 2011-01-31 | 2018-06-27 | H. Hoffnabb-La Roche Ag | Verfahren zur identifizierung mehrerer epitope in zellen |
| US20120252682A1 (en) | 2011-04-01 | 2012-10-04 | Maples Corporate Services Limited | Methods and systems for sequencing nucleic acids |
| WO2012146377A1 (de) | 2011-04-27 | 2012-11-01 | Dmitry Cherkasov | Methoden und komponenten zur detektion von nukleinsäureketten |
| EP2705161A1 (de) | 2011-05-04 | 2014-03-12 | Genovoxx GmbH | Nukleosid-triphosphat-konjugate und methoden zu deren anwendung |
| WO2013070634A1 (en) | 2011-11-07 | 2013-05-16 | Ingenuity Systems, Inc. | Methods and systems for identification of causal genomic variants |
| US10174310B2 (en) | 2012-08-08 | 2019-01-08 | Roche Sequencing Solutions, Inc. | Increasing dynamic range for identifying multiple epitopes in cells |
| GB2519255B (en) | 2013-02-01 | 2016-01-06 | Univ California | Methods for genome assembly and haplotype phasing |
| US9411930B2 (en) | 2013-02-01 | 2016-08-09 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
| WO2014144883A1 (en) | 2013-03-15 | 2014-09-18 | The Trustees Of Columbia University In The City Of New York | Raman cluster tagged molecules for biological imaging |
| AU2013382358B2 (en) | 2013-03-15 | 2017-01-12 | Illumina Cambridge Limited | Modified nucleosides or nucleotides |
| US10058839B2 (en) | 2013-03-15 | 2018-08-28 | Lineage Biosciences, Inc. | Methods and compositions for tagging and analyzing samples |
| CN103484106B (zh) * | 2013-09-05 | 2015-08-19 | 上海交通大学 | 四色荧光标记可逆终端及其在dna测序中的用途 |
| KR20240038168A (ko) | 2013-11-07 | 2024-03-22 | 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 | 인간 마이크로바이옴 및 그의 성분의 분석을 위한 무세포 핵산 |
| EP3540074A1 (de) | 2013-12-11 | 2019-09-18 | The Regents of the University of California | Verfahren zur markierung innerer regionen von nukleinsäuremolekülen |
| WO2016019360A1 (en) | 2014-08-01 | 2016-02-04 | Dovetail Genomics Llc | Tagging nucleic acids for sequence assembly |
| GB201414098D0 (en) | 2014-08-08 | 2014-09-24 | Illumina Cambridge Ltd | Modified nucleotide linkers |
| KR102721363B1 (ko) | 2015-02-17 | 2024-10-23 | 더브테일 제노믹스 엘엘씨 | 핵산 서열 어셈블리 |
| WO2016154540A1 (en) | 2015-03-26 | 2016-09-29 | Dovetail Genomics Llc | Physical linkage preservation in dna storage |
| CN108368542B (zh) | 2015-10-19 | 2022-04-08 | 多弗泰尔基因组学有限责任公司 | 用于基因组组装、单元型定相以及独立于靶标的核酸检测的方法 |
| SG11201807117WA (en) | 2016-02-23 | 2018-09-27 | Dovetail Genomics Llc | Generation of phased read-sets for genome assembly and haplotype phasing |
| WO2017197300A1 (en) | 2016-05-13 | 2017-11-16 | Dovetail Genomics Llc | Recovering long-range linkage information from preserved samples |
| WO2018195091A1 (en) | 2017-04-18 | 2018-10-25 | Dovetail Genomics, Llc | Nucleic acid characteristics as guides for sequence assembly |
| CA3068273A1 (en) | 2017-06-21 | 2018-12-27 | Bluedot Llc | Systems and methods for identification of nucleic acids in a sample |
| WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | SAMPLE EXTRACTION METHODS AND SYSTEMS |
| WO2019152543A1 (en) | 2018-01-31 | 2019-08-08 | Dovetail Genomics, Llc | Sample prep for dna linkage recovery |
| US11166996B2 (en) | 2018-12-12 | 2021-11-09 | Flagship Pioneering Innovations V, Inc. | Anellovirus compositions and methods of use |
| EP3990920B1 (de) | 2019-06-27 | 2025-02-12 | Dovetail Genomics, LLC | Verfahren und zusammensetzungen zur näherungsligation |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000050642A1 (en) * | 1999-02-23 | 2000-08-31 | Caliper Technologies Corp. | Sequencing by incorporation |
| WO2000070073A1 (en) * | 1999-05-19 | 2000-11-23 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
| WO2001025247A1 (en) * | 1999-10-05 | 2001-04-12 | Quiatech Ab | Compounds for protecting hydroxyls and methods for their use |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB9208733D0 (en) * | 1992-04-22 | 1992-06-10 | Medical Res Council | Dna sequencing method |
| US5986076A (en) * | 1994-05-11 | 1999-11-16 | Trustees Of Boston University | Photocleavable agents and conjugates for the detection and isolation of biomolecules |
| US6136543A (en) * | 1997-01-31 | 2000-10-24 | Hitachi, Ltd. | Method for determining nucleic acids base sequence and apparatus therefor |
| WO1999049082A2 (en) * | 1998-03-23 | 1999-09-30 | Invitrogen Corporation | Modified nucleotides and methods useful for nucleic acid sequencing |
| DE19844931C1 (de) * | 1998-09-30 | 2000-06-15 | Stefan Seeger | Verfahren zur DNS- oder RNS-Sequenzierung |
| EP1961826A3 (de) * | 1999-03-10 | 2008-09-17 | ASM Scientific, Inc. | Verfahren zur direkten Sequenzierung von Nukleinsäuren |
| GB0013276D0 (en) * | 2000-06-01 | 2000-07-26 | Amersham Pharm Biotech Uk Ltd | Nucleotide analogues |
-
2001
- 2001-04-27 DE DE10120797A patent/DE10120797B4/de not_active Expired - Lifetime
-
2002
- 2002-04-26 EP EP02732680A patent/EP1381698A2/de not_active Withdrawn
- 2002-04-26 AU AU2002304705A patent/AU2002304705A1/en not_active Abandoned
- 2002-04-26 WO PCT/EP2002/004659 patent/WO2002088382A2/de not_active Ceased
- 2002-04-26 JP JP2002585662A patent/JP2004529650A/ja active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000050642A1 (en) * | 1999-02-23 | 2000-08-31 | Caliper Technologies Corp. | Sequencing by incorporation |
| WO2000070073A1 (en) * | 1999-05-19 | 2000-11-23 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
| WO2001025247A1 (en) * | 1999-10-05 | 2001-04-12 | Quiatech Ab | Compounds for protecting hydroxyls and methods for their use |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10149786B4 (de) * | 2001-10-09 | 2013-04-25 | Dmitry Cherkasov | Oberfläche für Untersuchungen aus Populationen von Einzelmolekülen |
| DE10214395A1 (de) * | 2002-03-30 | 2003-10-23 | Dmitri Tcherkassov | Verfahren zur Analyse von Einzelnukleotidpolymorphismen |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004529650A (ja) | 2004-09-30 |
| WO2002088382A3 (de) | 2003-08-28 |
| WO2002088382A2 (de) | 2002-11-07 |
| EP1381698A2 (de) | 2004-01-21 |
| AU2002304705A1 (en) | 2002-11-11 |
| DE10120797B4 (de) | 2005-12-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE10120797B4 (de) | Verfahren zur Analyse von Nukleinsäureketten | |
| DE10120798B4 (de) | Verfahren zur Bestimmung der Genexpression | |
| DE10239504A1 (de) | Verfahren zur Analyse von Nukleinsäurekettensequenzen und der Genexpression | |
| DE3854743T2 (de) | Verfahren zur schnellen basensequenzierung in dns und rns. | |
| DE69314951T2 (de) | Dns sequenzierungsverfahren | |
| DE112007002932B4 (de) | Vierfarben DNA-Sequenzierung mittels Synthese unter Verwendung von abspaltbaren, reversiblen, fluoreszierenden Nucleotidterminatoren | |
| DE69928683T2 (de) | Verfahren zur amplifikation und zur sequenzierung von nukleinsäuren | |
| DE69837913T2 (de) | Verfahren zur vervielfältigung von nukleinsäure | |
| DE69834056T2 (de) | De novo oder "universaler" sequenzierungs-array | |
| DE60125243T2 (de) | Polynukleotid-sequenzassay | |
| DE69711895T2 (de) | Characterisierung von dna | |
| DE69233458T2 (de) | Nukleinsäuretypisierung durch polymeraseverlängerung von oligonukleotiden unter verwendung von terminator-mischungen | |
| DE69322266T2 (de) | Proben zusammensetzung und verfahren | |
| DE10246005A1 (de) | Gerät zur Sequenzierung von Nukleinsäuremolekülen | |
| EP1204765B1 (de) | Verfahren zur relativen quantifizierung der methylierung von cytosin basen in dna-proben | |
| DE69924140T2 (de) | Bestimmung der länge von repetitiven nukleinsäure-sequenzen durch eine diskontinuierliche primerverlängerung | |
| DE20122767U1 (de) | Massives Parallelverfahren zur Dekodierung von DNA und RNA | |
| DE10015797A1 (de) | Multiplex-Analyse von DNA-Gemischen mittels photolytisch ablesbarer DNA-Chips | |
| DE10214395A1 (de) | Verfahren zur Analyse von Einzelnukleotidpolymorphismen | |
| DE102004025744A1 (de) | Oberfläche für die Analysen an einzelnen Nukleinsäuremolekülen | |
| DE102004025695A1 (de) | Verfahren und Oberfläche zur parallelen Sequenzierung von Nukleinsäureketten | |
| DE102004025694A1 (de) | Verfahren und Oberfläche zu hochparallelen Analysen von Nukleinsäureketten | |
| DE102004025745A1 (de) | Oberfläche für die Analysen an einzelnen Molekülen | |
| WO2008080629A2 (de) | Verbesserte molekularbiologische prozessanlage | |
| EP1458892B1 (de) | Evaneszenz-basierendes multiplex-sequenzierungsverfahren |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8364 | No opposition during term of opposition | ||
| R071 | Expiry of right |