DE10120797A1 - Methods for the analysis of nucleic acid chains - Google Patents
Methods for the analysis of nucleic acid chainsInfo
- Publication number
- DE10120797A1 DE10120797A1 DE10120797A DE10120797A DE10120797A1 DE 10120797 A1 DE10120797 A1 DE 10120797A1 DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A DE10120797 A DE 10120797A DE 10120797 A1 DE10120797 A1 DE 10120797A1
- Authority
- DE
- Germany
- Prior art keywords
- nts
- nskfs
- reaction
- polymerase
- sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 120
- 150000007523 nucleic acids Chemical group 0.000 title claims abstract description 56
- 238000004458 analytical method Methods 0.000 title description 40
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 193
- 239000002773 nucleotide Substances 0.000 claims abstract description 181
- 238000006243 chemical reaction Methods 0.000 claims abstract description 125
- 239000000975 dye Substances 0.000 claims abstract description 35
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 20
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 20
- 239000013615 primer Substances 0.000 claims description 81
- 108020004414 DNA Proteins 0.000 claims description 44
- 239000012634 fragment Substances 0.000 claims description 40
- 239000007850 fluorescent dye Substances 0.000 claims description 35
- 230000000295 complement effect Effects 0.000 claims description 33
- 239000000499 gel Substances 0.000 claims description 21
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 19
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 17
- 238000009434 installation Methods 0.000 claims description 17
- 239000000126 substance Substances 0.000 claims description 15
- 239000003446 ligand Substances 0.000 claims description 13
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 claims description 12
- 238000009396 hybridization Methods 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 10
- 230000004048 modification Effects 0.000 claims description 10
- 108010017826 DNA Polymerase I Proteins 0.000 claims description 9
- 102000004594 DNA Polymerase I Human genes 0.000 claims description 9
- 230000005526 G1 to G0 transition Effects 0.000 claims description 8
- 108010006785 Taq Polymerase Proteins 0.000 claims description 8
- 230000036961 partial effect Effects 0.000 claims description 8
- 125000004122 cyclic group Chemical group 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 7
- 238000012300 Sequence Analysis Methods 0.000 claims description 6
- 229920002401 polyacrylamide Polymers 0.000 claims description 6
- 241000124008 Mammalia Species 0.000 claims description 5
- 229920000936 Agarose Polymers 0.000 claims description 4
- 241000588724 Escherichia coli Species 0.000 claims description 4
- 239000003153 chemical reaction reagent Substances 0.000 claims description 4
- 239000011521 glass Substances 0.000 claims description 4
- 229920003023 plastic Polymers 0.000 claims description 4
- 239000004033 plastic Substances 0.000 claims description 4
- 239000007787 solid Substances 0.000 claims description 4
- 108010042407 Endonucleases Proteins 0.000 claims description 3
- 241000206602 Eukaryota Species 0.000 claims description 3
- 239000004793 Polystyrene Substances 0.000 claims description 3
- 239000002253 acid Substances 0.000 claims description 3
- 239000011543 agarose gel Substances 0.000 claims description 3
- 239000000919 ceramic Substances 0.000 claims description 3
- 239000004744 fabric Substances 0.000 claims description 3
- 239000004417 polycarbonate Substances 0.000 claims description 3
- 229920000515 polycarbonate Polymers 0.000 claims description 3
- 229920002223 polystyrene Polymers 0.000 claims description 3
- 108010001132 DNA Polymerase beta Proteins 0.000 claims description 2
- 102000001996 DNA Polymerase beta Human genes 0.000 claims description 2
- 125000003277 amino group Chemical group 0.000 claims description 2
- 229920001296 polysiloxane Polymers 0.000 claims description 2
- 239000010703 silicon Substances 0.000 claims description 2
- 229910052710 silicon Inorganic materials 0.000 claims description 2
- 102100031780 Endonuclease Human genes 0.000 claims 2
- 108020005202 Viral DNA Proteins 0.000 claims 2
- 238000002372 labelling Methods 0.000 claims 2
- ANRHNWWPFJCPAZ-UHFFFAOYSA-M thionine Chemical compound [Cl-].C1=CC(N)=CC2=[S+]C3=CC(N)=CC=C3N=C21 ANRHNWWPFJCPAZ-UHFFFAOYSA-M 0.000 claims 2
- 150000003732 xanthenes Chemical class 0.000 claims 2
- 239000003155 DNA primer Substances 0.000 claims 1
- 229920000642 polymer Polymers 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 41
- 239000002987 primer (paints) Substances 0.000 description 66
- 238000012163 sequencing technique Methods 0.000 description 60
- 239000000243 solution Substances 0.000 description 29
- 238000003786 synthesis reaction Methods 0.000 description 19
- 230000015572 biosynthetic process Effects 0.000 description 18
- 239000002585 base Substances 0.000 description 17
- 238000005406 washing Methods 0.000 description 15
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 14
- 239000000872 buffer Substances 0.000 description 14
- 239000000203 mixture Substances 0.000 description 13
- 230000008569 process Effects 0.000 description 13
- 108090000623 proteins and genes Proteins 0.000 description 13
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-Dimethylformamide Chemical compound CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 12
- 239000002299 complementary DNA Substances 0.000 description 12
- 239000002777 nucleoside Substances 0.000 description 12
- 108020004999 messenger RNA Proteins 0.000 description 11
- 238000003776 cleavage reaction Methods 0.000 description 10
- 230000008878 coupling Effects 0.000 description 10
- 238000010168 coupling process Methods 0.000 description 10
- 238000005859 coupling reaction Methods 0.000 description 10
- 239000003550 marker Substances 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 238000001712 DNA sequencing Methods 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 150000001875 compounds Chemical class 0.000 description 8
- 230000035772 mutation Effects 0.000 description 8
- 125000003835 nucleoside group Chemical group 0.000 description 8
- -1 nucleoside triphosphates Chemical class 0.000 description 8
- 230000002441 reversible effect Effects 0.000 description 8
- 102000053602 DNA Human genes 0.000 description 7
- 229960002685 biotin Drugs 0.000 description 7
- 235000020958 biotin Nutrition 0.000 description 7
- 239000011616 biotin Substances 0.000 description 7
- 238000006911 enzymatic reaction Methods 0.000 description 7
- 239000003068 molecular probe Substances 0.000 description 7
- 238000002360 preparation method Methods 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000011160 research Methods 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- 238000000799 fluorescence microscopy Methods 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 230000003252 repetitive effect Effects 0.000 description 6
- 108060002716 Exonuclease Proteins 0.000 description 5
- 238000013459 approach Methods 0.000 description 5
- 102000013165 exonuclease Human genes 0.000 description 5
- 125000000524 functional group Chemical group 0.000 description 5
- 238000011534 incubation Methods 0.000 description 5
- 238000000386 microscopy Methods 0.000 description 5
- 238000010369 molecular cloning Methods 0.000 description 5
- JGVWCANSWKRBCS-UHFFFAOYSA-N tetramethylrhodamine thiocyanate Chemical compound [Cl-].C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=C(SC#N)C=C1C(O)=O JGVWCANSWKRBCS-UHFFFAOYSA-N 0.000 description 5
- 238000000018 DNA microarray Methods 0.000 description 4
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 description 4
- NYHBQMYGNKIUIF-UUOKFMHZSA-N Guanosine Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O NYHBQMYGNKIUIF-UUOKFMHZSA-N 0.000 description 4
- IQFYYKKMVGJFEH-XLPZGREQSA-N Thymidine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](O)C1 IQFYYKKMVGJFEH-XLPZGREQSA-N 0.000 description 4
- 238000001218 confocal laser scanning microscopy Methods 0.000 description 4
- 238000004624 confocal microscopy Methods 0.000 description 4
- 238000009826 distribution Methods 0.000 description 4
- 230000002427 irreversible effect Effects 0.000 description 4
- 238000001634 microspectroscopy Methods 0.000 description 4
- 238000000399 optical microscopy Methods 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 238000004007 reversed phase HPLC Methods 0.000 description 4
- 102100034343 Integrase Human genes 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 125000004429 atom Chemical group 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 229910021538 borax Inorganic materials 0.000 description 3
- 238000004140 cleaning Methods 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 150000002148 esters Chemical class 0.000 description 3
- 230000002068 genetic effect Effects 0.000 description 3
- 239000011159 matrix material Substances 0.000 description 3
- GBMDVOWEEQVZKZ-UHFFFAOYSA-N methanol;hydrate Chemical compound O.OC GBMDVOWEEQVZKZ-UHFFFAOYSA-N 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 235000010339 sodium tetraborate Nutrition 0.000 description 3
- 239000007790 solid phase Substances 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 239000001226 triphosphate Substances 0.000 description 3
- 235000011178 triphosphate Nutrition 0.000 description 3
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 3
- ZCYVEMRRCGMTRW-UHFFFAOYSA-N 7553-56-2 Chemical compound [I] ZCYVEMRRCGMTRW-UHFFFAOYSA-N 0.000 description 2
- ATRRKUHOCOJYRX-UHFFFAOYSA-N Ammonium bicarbonate Chemical compound [NH4+].OC([O-])=O ATRRKUHOCOJYRX-UHFFFAOYSA-N 0.000 description 2
- DWRXFEITVBNRMK-UHFFFAOYSA-N Beta-D-1-Arabinofuranosylthymine Natural products O=C1NC(=O)C(C)=CN1C1C(O)C(O)C(CO)O1 DWRXFEITVBNRMK-UHFFFAOYSA-N 0.000 description 2
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 2
- MIKUYHXYGGJMLM-GIMIYPNGSA-N Crotonoside Natural products C1=NC2=C(N)NC(=O)N=C2N1[C@H]1O[C@@H](CO)[C@H](O)[C@@H]1O MIKUYHXYGGJMLM-GIMIYPNGSA-N 0.000 description 2
- NYHBQMYGNKIUIF-UHFFFAOYSA-N D-guanosine Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(CO)C(O)C1O NYHBQMYGNKIUIF-UHFFFAOYSA-N 0.000 description 2
- GUBGYTABKSRVRQ-WFVLMXAXSA-N DEAE-cellulose Chemical compound OC1C(O)C(O)C(CO)O[C@H]1O[C@@H]1C(CO)OC(O)C(O)C1O GUBGYTABKSRVRQ-WFVLMXAXSA-N 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 description 2
- DRTQHJPVMGBUCF-XVFCMESISA-N Uridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-XVFCMESISA-N 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 2
- 235000012501 ammonium carbonate Nutrition 0.000 description 2
- 239000001099 ammonium carbonate Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- IQFYYKKMVGJFEH-UHFFFAOYSA-N beta-L-thymidine Natural products O=C1NC(=O)C(C)=CN1C1OC(CO)C(O)C1 IQFYYKKMVGJFEH-UHFFFAOYSA-N 0.000 description 2
- 125000001369 canonical nucleoside group Chemical group 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 239000007795 chemical reaction product Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000004163 cytometry Methods 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 description 2
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 description 2
- 150000002019 disulfides Chemical class 0.000 description 2
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 229940029575 guanosine Drugs 0.000 description 2
- 229910052740 iodine Inorganic materials 0.000 description 2
- 239000011630 iodine Substances 0.000 description 2
- 238000002493 microarray Methods 0.000 description 2
- 238000003909 pattern recognition Methods 0.000 description 2
- 230000035484 reaction time Effects 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 239000000523 sample Substances 0.000 description 2
- 239000012047 saturated solution Substances 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- ABZLKHKQJHEPAX-UHFFFAOYSA-N tetramethylrhodamine Chemical compound C=12C=CC(N(C)C)=CC2=[O+]C2=CC(N(C)C)=CC=C2C=1C1=CC=CC=C1C([O-])=O ABZLKHKQJHEPAX-UHFFFAOYSA-N 0.000 description 2
- 229940104230 thymidine Drugs 0.000 description 2
- 238000002604 ultrasonography Methods 0.000 description 2
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 1
- UHDGCWIWMRVCDJ-UHFFFAOYSA-N 1-beta-D-Xylofuranosyl-NH-Cytosine Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(CO)O1 UHDGCWIWMRVCDJ-UHFFFAOYSA-N 0.000 description 1
- WNDKIGQUFDOYIB-UHFFFAOYSA-N 1-hydroxypyrrolidine-2,5-dione;propanoic acid Chemical compound CCC(O)=O.ON1C(=O)CCC1=O WNDKIGQUFDOYIB-UHFFFAOYSA-N 0.000 description 1
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 description 1
- MBXADFLSFSJJOZ-SNAWJCMRSA-N 2-[1-[(4-ethoxyphenyl)methyl]-4-[(e)-3-(4-methoxyphenyl)prop-2-enyl]piperazin-2-yl]ethanol Chemical compound C1=CC(OCC)=CC=C1CN1C(CCO)CN(C\C=C\C=2C=CC(OC)=CC=2)CC1 MBXADFLSFSJJOZ-SNAWJCMRSA-N 0.000 description 1
- OBYNJKLOYWCXEP-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-4-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC(N=C=S)=CC=C1C([O-])=O OBYNJKLOYWCXEP-UHFFFAOYSA-N 0.000 description 1
- IJSMFQNTEUNRPY-UHFFFAOYSA-N 2-[3-(dimethylamino)-6-dimethylazaniumylidenexanthen-9-yl]-5-isothiocyanatobenzoate Chemical compound C=12C=CC(=[N+](C)C)C=C2OC2=CC(N(C)C)=CC=C2C=1C1=CC=C(N=C=S)C=C1C([O-])=O IJSMFQNTEUNRPY-UHFFFAOYSA-N 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical group N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- 102100027211 Albumin Human genes 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- USFZMSVCRYTOJT-UHFFFAOYSA-N Ammonium acetate Chemical compound N.CC(O)=O USFZMSVCRYTOJT-UHFFFAOYSA-N 0.000 description 1
- 239000005695 Ammonium acetate Substances 0.000 description 1
- 108020004491 Antisense DNA Proteins 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 108050001427 Avidin/streptavidin Proteins 0.000 description 1
- 239000002126 C01EB10 - Adenosine Substances 0.000 description 1
- OHOQEZWSNFNUSY-UHFFFAOYSA-N Cy3-bifunctional dye zwitterion Chemical compound O=C1CCC(=O)N1OC(=O)CCCCCN1C2=CC=C(S(O)(=O)=O)C=C2C(C)(C)C1=CC=CC(C(C1=CC(=CC=C11)S([O-])(=O)=O)(C)C)=[N+]1CCCCCC(=O)ON1C(=O)CCC1=O OHOQEZWSNFNUSY-UHFFFAOYSA-N 0.000 description 1
- UHDGCWIWMRVCDJ-PSQAKQOGSA-N Cytidine Natural products O=C1N=C(N)C=CN1[C@@H]1[C@@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-PSQAKQOGSA-N 0.000 description 1
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 1
- 102100033215 DNA nucleotidylexotransferase Human genes 0.000 description 1
- 230000004543 DNA replication Effects 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 229960005305 adenosine Drugs 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 235000019257 ammonium acetate Nutrition 0.000 description 1
- 229940043376 ammonium acetate Drugs 0.000 description 1
- 210000004102 animal cell Anatomy 0.000 description 1
- 239000003816 antisense DNA Substances 0.000 description 1
- 239000003443 antiviral agent Substances 0.000 description 1
- 210000004436 artificial bacterial chromosome Anatomy 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- DRTQHJPVMGBUCF-PSQAKQOGSA-N beta-L-uridine Natural products O[C@H]1[C@@H](O)[C@H](CO)O[C@@H]1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-PSQAKQOGSA-N 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000004432 carbon atom Chemical group C* 0.000 description 1
- 150000001732 carboxylic acid derivatives Chemical class 0.000 description 1
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- UHDGCWIWMRVCDJ-ZAKLUEHWSA-N cytidine Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O1 UHDGCWIWMRVCDJ-ZAKLUEHWSA-N 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 238000001493 electron microscopy Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000000295 emission spectrum Methods 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 230000004992 fission Effects 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical class C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 1
- 235000013928 guanylic acid Nutrition 0.000 description 1
- 238000003505 heat denaturation Methods 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- 238000003709 image segmentation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 235000021190 leftovers Nutrition 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 238000012067 mathematical method Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000003340 mental effect Effects 0.000 description 1
- QSHDDOUJBYECFT-UHFFFAOYSA-N mercury Chemical compound [Hg] QSHDDOUJBYECFT-UHFFFAOYSA-N 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 125000006239 protecting group Chemical group 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 230000036647 reaction Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 238000004621 scanning probe microscopy Methods 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- DRTQHJPVMGBUCF-UHFFFAOYSA-N uracil arabinoside Natural products OC1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 DRTQHJPVMGBUCF-UHFFFAOYSA-N 0.000 description 1
- 229940045145 uridine Drugs 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 125000001834 xanthenyl group Chemical class C1=CC=CC=2OC3=CC=CC=C3C(C12)* 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biotechnology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Immunology (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Investigating Or Analysing Materials By The Use Of Chemical Reactions (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Saccharide Compounds (AREA)
Abstract
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäureketten. Grundlage der Methode ist die Detektion von Fluoreszenzsignalen einzelner, mit Farbstoffen markierter Nukleotidmoleküle, die durch eine Polymerase in wachsende Nukleinsäureketten eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. Auf dieser Oberfläche sind viele einzelne Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure-Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann.The invention relates to a method for analyzing nucleic acid chains. The method is based on the detection of fluorescence signals from individual nucleotide molecules labeled with dyes, which are incorporated into growing nucleic acid chains by a polymerase. The reaction takes place on a flat surface. Many individual nucleic acid molecules are immobilized on this surface. All of these nucleic acid molecules are exposed to the same conditions, so that a build-up reaction can take place simultaneously on all nucleic acid molecules.
Description
Die Erfindung betrifft ein Verfahren zur Analyse von Nukleinsäu reketten. Die Grundlage der Methode ist die Detektion von Fluo reszenzsignalen einzelner mit Farbstoffen markierter Nukleotid moleküle, die durch eine Polymerase in eine wachsende Nuklein säurekette eingebaut werden. Die Reaktion verläuft auf einer planen Oberfläche. Auf dieser Oberfläche sind viele einzelne Nukleinsäure-Moleküle immobilisiert. Alle diese Nukleinsäure- Moleküle sind gleichen Bedingungen ausgesetzt, so daß an allen Nukleinsäure-Molekülen gleichzeitig eine Aufbaureaktion ablaufen kann. The invention relates to a method for analyzing nucleic acid reketten. The basis of the method is the detection of fluo Resence signals of individual nucleotides labeled with dyes molecules created by a polymerase in a growing nucleus acid chain can be installed. The reaction is one plan surface. There are many individuals on this surface Immobilized nucleic acid molecules. All of these nucleic acid Molecules are exposed to the same conditions, so that at all Nucleic acid molecules undergo a building reaction at the same time can.
Das Verfahren umfaßt im wesentlichen folgende Schritte:
The process essentially comprises the following steps:
- 1. Immobilisierung der Nukleinsäureketten auf einer planen Oberfläche.1. Immobilize the nucleic acid chains on a plan Surface.
-
2. Durchführen einer zyklischen Aufbaureaktion, wobei jeder
Zyklus aus folgenden Schritten besteht:
- a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der komplementären Stränge um ein NT geeignet sind,
- c) Waschen,
- d) Detektion der Signale von einzelnen Molekülen,
- e) Entfernung der Markierung von den eingebauten Nukleoti den,
- f) Waschen.
- a) adding a solution with labeled nucleotides (NTs * ) and polymerase to immobilized nucleic acid chains,
- b) incubation of the immobilized nucleic acid chains with this solution under conditions which are suitable for extending the complementary strands by one NT,
- c) washing,
- d) detection of signals from individual molecules,
- e) removing the marker from the built-in nucleotides,
- f) washing.
- 3. Analyse der detektierten Signale der einzelnen Moleküle.3. Analysis of the detected signals of the individual molecules.
- 4. Rekonstruktion der Sequenzen aus den Einzeldaten.4. Reconstruction of the sequences from the individual data.
DNA - Desoxyribonukleinsäure verschiedenen Ursprungs und unter
schiedlicher Länge: (genomische DNA, cDNA, ssDNA, dsDNA)
RNA - Ribonukleinsäure (meist mRNA)
Polymerasen - Enzyme, die komplementäre Nukleotide in einen
wachsenden DNA- oder RNA-Strang einbauen können (z. B. DNA-Poly
merasen, Reverse-Transkriptasen, RNA-Polymerasen)
dNTP - 2'-deoxi-Nucleosid-Triphosphate für DNA-Polymerasen und
Reverse-Transkriptasen
NTP - Nukleosid-Triphosphate für RNA-Polymerasen
NT - natürliches Nukleotid, meist dNTP, wenn nicht ausdrücklich
anders gekennzeichnet.DNA - deoxyribonucleic acid of various origins and of different lengths: (genomic DNA, cDNA, ssDNA, dsDNA)
RNA - ribonucleic acid (mostly mRNA)
Polymerases - Enzymes that can incorporate complementary nucleotides into a growing strand of DNA or RNA (e.g. DNA polymerases, reverse transcriptases, RNA polymerases)
dNTP - 2'-deoxi nucleoside triphosphates for DNA polymerases and reverse transcriptases
NTP - nucleoside triphosphates for RNA polymerases
NT - natural nucleotide, usually dNTP, unless expressly stated otherwise.
Abkürzung "NT" wird auch bei der Längenangabe einer Nukleinsäu resequenz verwendet, z. B. 1000 NT. In diesem Fall steht "NT" für Nukleosid-Monophosphate.Abbreviation "NT" is also used when specifying the length of a nucleic acid resequence used, e.g. B. 1000 NT. In this case "NT" stands for Nucleoside monophosphate.
Im Text wird bei Abkürzungen die Mehrzahl durch Verwendung des
Suffixes "s" gebildet, "NT" steht zum Beispiel für "Nukleotid",
"NTs" steht für mehrere Nukleotide.
NT* - modifiziertes Nukleotid, meist dNTP, wenn nicht ausdrück
lich anders gekennzeichnet. NTs* bedeutet: modifizierte Nukleo
tide
NSK - Nukleinsäurekette. DNA oder RNA in ihrer ursprünglichen
Länge
NSKF - Nukleinsäurekettenfragment, NSKFs - Nukleinsäureketten
fragmente. Fragmente von DNA oder RNA, die nach einem Fragmen
tierungsschritt entstehen.The majority of abbreviations in the text are formed by using the suffix "s", for example "NT" stands for "nucleotide", "NTs" stands for several nucleotides.
NT * - modified nucleotide, usually dNTP, unless expressly stated otherwise. NTs * means: modified nucleotides
NSK - nucleic acid chain. DNA or RNA in their original length
NSKF - nucleic acid chain fragment, NSKFs - nucleic acid chain fragments. Fragments of DNA or RNA that arise after a fragmentation step.
Oberfläche, die vorzugsweise folgende Merkmale aufweist: 1) Sie erlaubt, mehrere einzelne Moleküle, vorzugsweise mehr als 100, noch besser mehr als 1000, mit dem jeweiligen gegebenen Objektiv-Oberfläche-Abstand bei einer Objektivposition gleichzeitig zu detektieren. 2) Die immobilisierten einzelnen Moleküle befinden sich in derselben Fokusebene, die reproduzier bar eingestellt werden kann.Surface that preferably has the following characteristics comprises: 1) It allows several individual molecules, preferably more than 100, better still more than 1000, with each given lens-surface distance at a lens position to detect simultaneously. 2) The immobilized individual Molecules are in the same focal plane that reproduce bar can be set.
Sterisch anspruchsvolle Gruppe, die durch ihre chemische Struktur die Eigenschaften der mit dieser Gruppe gekoppelten NTs* so verändert, daß diese durch eine Polymerase in einer Extensionsreaktion nicht nacheinander eingebaut werden können.Sterically demanding group, whose chemical structure changes the properties of the NTs * coupled with this group in such a way that they cannot be successively incorporated into one extension reaction by a polymerase.
Als Termination wird in dieser An meldung der reversible Stop des Einbaus der modifizierten unge spalteten NTs* bezeichnet. As a termination in this An message the reversible stop of the installation of the modified ununge labeled NTs *.
Dieser Begriff ist von dem üblichen Gebrauch des Wortes "Termi nation" durch Dideoxy-NTP bei einer konventionellen Sequenzierung zu trennen.This term is from the usual use of the word "termi nation "by dideoxy-NTP in conventional sequencing to separate.
Die Termination kommt nach dem Einbau eines modifizierten NT* zustande. Das modifizierte eingebaute NT* trägt eine an die Base reversibel gekoppelte sterische Gruppe, die zur Behinderung des Einbaus eines nächsten komplementären NT* in den wachsenden Strang durch eine Polymerase führt.The termination comes after the installation of a modified NT * . The modified built-in NT * carries a steric group which is reversibly coupled to the base and which prevents the incorporation of a next complementary NT * into the growing strand by a polymerase.
Genprodukte - Bei den Genprodukten handelt es sich um die
primären Genprodukte der Gene. Im wesentlichen handelt es sich
dabei um RNA-Transkripte der genannten Gene, welche auch als
Target-Sequenzen (oder Target-Nukleinsäuresequenzen) bezeichnet
werden. Diese Target-Sequenzen schließen neben mRNA auch davon
abgeleitete einzelsträngige und doppelsträngige cDNA, von cDNA
abgeleitete RNA oder von cDNA amplifizierte DNA ein.
SNP - single nucleotide polymorphismGene products - The gene products are the primary gene products of the genes. Essentially, these are RNA transcripts of the genes mentioned, which are also referred to as target sequences (or target nucleic acid sequences). In addition to mRNA, these target sequences also include single-stranded and double-stranded cDNA derived therefrom, RNA derived from cDNA or DNA amplified from cDNA.
SNP - single nucleotide polymorphism
Die Nukleinsäurenketten-Sequenzanalyse ist in vielen Bereichen der Wissenschaft, Medizin und Industrie zu einem wichtigen Werk zeug geworden. Zur Analyse wurden mehrere Verfahren entwickelt.Nucleic acid chain sequence analysis is in many areas science, medicine and industry to an important work become a witness. Several methods have been developed for analysis.
Die bekanntesten Verfahren sind die Ketten-Terminations-Sequen zierung nach Sanger (F. Sanger et al. PNAS 1977 v. 74 s. 5463), die auf dem Einbau von Kettenterminatoren basiert, und die Maxam- Gilbert-Methode, die auf Basen-spezifischer Modifikation und Spaltung von Nukleinsäureketten beruht (A. M. Maxam and W. Gilbert PNAS 1977, v. 74 S. 560). Beide Methoden liefern eine Anzahl von Nukleinsäurekettenfragmenten verschiedener Längen. Diese Fragmente werden der Länge nach in einem Gel aufgetrennt. Dabei müssen alle Nachteile der Elektrophorese (wie z. B. lange Laufzeit, relativ kurze Strecken von Sequenzen, die in einem Ansatz bestimmt werden können, begrenzte Anzahl der parallelen Ansätze sowie relativ große Mengen an DNA) in Kauf genommen werden. Diese Methoden sind sehr arbeitsintensiv und langsam.The best known methods are the chain termination sequences ornamentation according to Sanger (F. Sanger et al. PNAS 1977 v. 74 p. 5463), which is based on the installation of chain terminators, and the Maxam- Gilbert method based on base-specific modification and Cleavage of nucleic acid chains is based (A.M. Maxam and W. Gilbert PNAS 1977, v. 74 p. 560). Both methods provide a number of Nucleic acid chain fragments of various lengths. This Fragments are separated lengthwise in a gel. there all disadvantages of electrophoresis (such as long Runtime, relatively short stretches of sequences in one Approach can be determined, limited number of parallel Approaches and relatively large amounts of DNA) are accepted become. These methods are very labor intensive and slow.
Ein weiteres Verfahren zur Sequenzierung basiert auf der Hybri disierung von Nukleinsäureketten mit kurzen Oligonukleotiden. Dabei wird mit mathematischen Methoden berechnet, wie viele Oligonukleotide einer bestimmten Länge vorhanden sein müssen, um eine komplette Sequenz zu ermitteln (Z. T. Strezoska et al. PNAS 1991 v. 88 S. 10089, R. S. Drmanac et al. Science 1993 v. 260 S. 1649). Auch dieses Verfahren ist mit Problemen behaftet: Es kann nur eine Sequenz in einem Ansatz bestimmt werden, sekundäre Struktu ren stören die Hybridisierung und Sequenzwiederholungen verhin dern die korrekte Analyse.Another method for sequencing is based on the Hybri dosing of nucleic acid chains with short oligonucleotides. Mathematical methods are used to calculate how many Oligonucleotides of a certain length must be present in order to to determine a complete sequence (Z. T. Strezoska et al. PNAS 1991 v. 88 p. 10089, R. S. Drmanac et al. Science 1993 v. 260 p. 1649). This method also has problems: it can only a sequence can be determined in one approach, secondary structure or interfere with hybridization and repeat repetitions the correct analysis.
Eine andere Möglichkeit zur Sequenzierung haben Arbeitsgruppen von (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197) entwickelt. Diese Methode wird abgekürzt als BASS (Base Addition Sequencing Scheme) bezeichnet. Dabei wird eine große Anzahl gleicher einzelsträngi ger DNA-Stücke an einem definierten Ort auf einer Oberfläche fixiert und das Signal von der Gesamtheit dieser vielen iden tischen DNA-Stücke analysiert. Zu dieser fixierten DNA wird eine Lösung mit Polymerase und Nukleotiden zugegeben, so daß ein komplementärer Strang synthetisiert werden kann. Dabei soll die Polymerase schrittweise arbeiten: in jedem Schritt wird nur ein einziges Nukleotid eingebaut. Dieses wird detektiert, worauf die Polymerase in einem nächsten Zyklus das nächste Nukleotid einbaut.Working groups have another option for sequencing by (Dower U.S. Patent 5,547,839, Canard et al. U.S. Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 P. 1021, Metzker et al. NAR 1994, v. 22, p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197). This Method is abbreviated as BASS (Base Addition Sequencing Scheme) designated. A large number of identical single strands are used pieces of DNA at a defined location on a surface fixed and the signal from the entirety of these many iden table pieces of DNA analyzed. This fixed DNA becomes a Solution with polymerase and nucleotides added, so that a complementary strand can be synthesized. Thereby the Work polymerase step by step: in each step there is only one only nucleotide incorporated. This is detected, whereupon the Polymerase in a next cycle the next nucleotide installs.
Die Methode hat folgende Nachteile: Beim Aufbau der komplementä ren Stränge tritt sehr schnell eine Desynchronisation der Syn these auf, so daß bei jedem Schritt die Fehler akkumulieren. Deshalb können nur sehr kurze Fragmente sequenziert werden. Es ist zu betonen, daß alle beschriebenen BASS-Methoden nicht auf der Detektion von einzelnen Molekülen beruhen. Das Signal wird stattdessen von einer großen Anzahl identischer an einem definierten Ort immobilisierter Moleküle registriert. Die in diesen Methoden übliche Verwendung der Begriffe "einzelne Moleküle" und "Moleküle" zielt dabei nicht auf individuelle, voneinander ge trennte Moleküle, sondern auf eine Population, die aus vielen identischen Molekülen besteht. Identisch heißt in diesem Fall, daß die Moleküle die gleiche Sequenz haben.The method has the following disadvantages: When building the complementary ren desynchronization of the syn occurs very quickly thesis so that the errors accumulate with each step. Therefore only very short fragments can be sequenced. It It should be emphasized that all described BASS methods are not based on based on the detection of individual molecules. The signal will instead of a large number of identical to a defined one Location of immobilized molecules registered. The one in these Methods usual use of the terms "single molecules" and "Molecules" is not aimed at individual, mutually different separated molecules but on a population made up of many identical molecules. In this case, identical means that the molecules have the same sequence.
Die Aufgabe der vorliegenden Erfindung besteht daher darin, ein Verfahren zur Sequenzanalyse von Nukleinsäureketten bereitzustel len, das die Nachteile der oben erwähnten Methoden nicht aufweist und vor allem eine billigere, schnellere und effizientere Analyse von Nukleinsäuresequenzen ermöglicht. Insbesondere soll das Verfahren in der Lage sein, viele Sequenzen parallel zu bestim men, vorzugsweise soll es die Analyse sehr langer Nukleinsäure ketten (mehrere Mb) in einem Ansatz ermöglichen.The object of the present invention is therefore a To provide methods for sequence analysis of nucleic acid chains len, which does not have the disadvantages of the methods mentioned above and above all a cheaper, faster and more efficient analysis of nucleic acid sequences. In particular, that should Procedures to be able to determine many sequences in parallel Men, preferably it should analyze very long nucleic acid enable chains (several Mb) in one approach.
Die Aufgabe wird erfindungsgemäß durch ein Verfahren zur
Sequenzanalyse von Nukleinsäuresequenzen (Nukleinsäureketten,
NSKs) gelöst, bei dem man
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa
50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen
der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10
bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der
NSKFs unter Verwendung eines oder mehrerer Primer und einer oder
mehrerer Polymerasen durchführt, indem man
The object is achieved according to the invention by a method for sequence analysis of nucleic acid sequences (nucleic acid chains, NSKs), in which
Fragments (NSKFs) of single-stranded NSKs with a length of about 50 to 1000 nucleotides are generated, which represent overlapping partial sequences of the total sequences
the NSKFs immobilized on a reaction surface in a density of 10 to 100 NSKFs per 100 µm 2 (stationary phase), one
cyclically build the complementary strand of NSKFs using one or more primers and one or more polymerases by
- a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifi zierte Nukleotide (NTs*) enthält, die mit Fluoreszenz farbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedli cher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang ein zubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer ste risch anspruchsvoller Ligand ist, mana) adds a solution to the immobilized NSKFs that one or more polymerases and one to four modifi graced nucleotides (NTs *) containing fluorescence dyes are marked, with the simultaneous Use of at least two NTs * each on the NTs * located fluorescent dyes are chosen so that the NTs * used differ by measurement cher distinguish fluorescence signals from each other let, the NTs * are structurally modified so that the polymerase after incorporation of such an NT * in a growing complementary strand not in the Is able to insert another NT * in the same strand build, the fluorescent dye is cleavable and the structural modification is a cleavable ste is a demanding ligand, one
- b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der kom plementären Stränge geeignet sind, wobei die komplemen tären Stränge jeweils um ein NT* verlängert werden, manb) the stationary phase obtained in stage a) below Conditions incubated to extend the com complementary strands are suitable, the complemen tary strands are extended by one NT * each, one
- c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, manc) the stationary phase obtained in stage b) below Washing conditions that are not in one for removal complementary strand of built-in NTs * are suitable, you
- d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarb stoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluo reszenzsignale auf der Reaktionsoberfläche bestimmt, mand) the individual NTs built into complementary strands * by measuring that for the respective fluorescent color Characteristic signal detected, where one at the same time the relative position of the individual fluo determined resence signals on the reaction surface, you
- e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo reszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, mane) to generate unlabeled (NTs or) NSKFs the fluo resence dyes and the sterically demanding Ligands from those attached to the complementary strand Split off NTs *, one
- f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz farbstoffe und der Liganden geeignet sind, manf) the stationary phase obtained in stage e) below Conditions washes to remove the fluorescence dyes and the ligand are suitable, man
die Stufen a) bis f) gegebenenfalls mehrfach wiederholt, wobei man die relative Position einzelner NSKFs auf der Reak tionsoberfläche und die Sequenz dieser NSKFs durch spezifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluoreszenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.stages a) to f) are repeated several times, if necessary, where the relative position of individual NSKFs on the reac tion surface and the sequence of these NSKFs by specific Assignment of the in stage d) in successive cycles to the respective positions detected fluorescence signals to the NTs determined and one from the determined overlapping partial sequences the overall sequence of NSKs is determined.
Die erhaltene Population von überlappenden Teilsequenzen läßt sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammenfügen (Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).The population of overlapping partial sequences obtained leaves with commercially available programs for the overall sequence of the NSK (Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 P. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257).
Gemäß einer besonderen Ausführungsform der Erfindung kann das
Verfahren durchgeführt werden, indem man die Stufen a) bis f) der
zyklischen Aufbaureaktion mehrfach wiederholt, wobei man
According to a particular embodiment of the invention, the process can be carried out by repeating steps a) to f) of the cyclic build-up reaction several times, with
- a) in jedem Zyklus nur jeweils ein markiertes NT*,a) only one marked NT * in each cycle,
- b) in jedem Zyklus jeweils zwei unterschiedlich markierte NTs* oderb) in each cycle two differently marked NTs * or
- c) in jedem Zyklus jeweils vier unterschiedlich markierte NTs*c) four differently marked in each cycle NTs *
einsetzt.starts.
Wenn die NSKs Varianten einer bekannten Referenzsequenz sind kann das Verfahren auch durchgeführt werden, indem man die Stufen a) bis f) der zyklischen Aufbaureaktion mehrfach wiederholt, wobei man in den Zyklen abwechselnd jeweils zwei unterschiedlich markierte NTs* und zwei unmarkierte NTs einsetzt und man die Gesamtsequenzen durch Vergleich mit der Referenzsequenz er mittelt.If the NSKs can be variants of a known reference sequence the process can also be carried out by following steps a) to f) the cyclic build-up reaction is repeated several times, wherein you alternate two different cycles marked NTs * and two unmarked NTs and the Total sequences by comparison with the reference sequence averages.
Gegenstand der vorliegenden Erfindung sind ferner die in den Fig. 7e, 7f und 7g dargestellten Nukleotide und die ent sprechenden markierten Nukleotide, die beispielsweise an die terminale Aminofunktion angeheftete Fluoreszenzfarbstoffe aufweisen, oder die in den Fig. 7h, 7i oder 7j dargestellten markierten Nukleotide.The present invention furthermore relates to the nucleotides shown in FIGS . 7e, 7f and 7g and the corresponding labeled nucleotides which, for example, have fluorescent dyes attached to the terminal amino function, or the labeled nucleotides shown in FIGS . 7h, 7i or 7j.
Gegenstand der Erfindung ist ferner ein Kit zur Durchführung des Verfahrens das eine Reaktionsoberfläche, zur Durchführung des Verfahrens erforderliche Reaktionslösungen, eine oder mehrere Polymerasen, und Nukleotide (NTs) enthält, von denen ein bis vier mit Fluoreszenzfarbstoffen markiert sind, wobei die NTs ferner strukturell so modifiziert sind (NT* bzw. NTs*), daß die Poly merase nach Einbau eines solchen NT* in einen wachsenden komple mentären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang einzubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer sterisch anspruchsvoller Ligand ist. Bei den Nukleotiden handelt es sich vorzugsweise um die oben genannten erfindungsgemäßen Nukleotide.The invention further relates to a kit for carrying out the method which contains a reaction surface, reaction solutions required for carrying out the method, one or more polymerases, and nucleotides (NTs), one to four of which are labeled with fluorescent dyes, the NTs also structurally so are modified (NT * or NTs *) that the polymerase after installing such an NT * in a growing complementary strand is not able to install another NT * in the same strand, the fluorescent dye being removable and the structural Modification is a cleavable, sterically demanding ligand. The nucleotides are preferably the above-mentioned nucleotides according to the invention.
Gemäß einer besonderen Ausführungsform der Erfindung enthält das Kit ferner zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien, einzelsträngige Nukleinsäuremoleküle, die als PBS in die KSKFs eingeführt werden, Oligonukleotid- Primer, zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien und/oder Wasch lösungen.According to a particular embodiment of the invention, this contains Kit also for producing single strands from double strands required reagents, single-stranded nucleic acid molecules, which are introduced as PBS in the KSKFs, oligonucleotide Primer, for splitting off the fluorescent dyes and sterically demanding ligands required reagents and / or washing solutions.
Die erfindungsgemäße Methode dient zur Ermittlung der Nukleinsäu resequenzen und kann in verschiedenen Bereichen der Genetik eingesetzt werden. Dazu zählen insbesondere die Bestimmung unbekannter, langer Sequenzen, Analysen von Sequenz-Polymor phismen und Punktmutationen sowie die parallele Analyse einer großen Zahl an Gensequenzen.The method according to the invention is used to determine the nucleic acid resequences and can be found in different areas of genetics be used. In particular, this includes the determination unknown long sequences, analysis of sequence polymor phisms and point mutations as well as the parallel analysis of a large number of gene sequences.
Die Vorbereitung des zu analysierenden Materials (einzel- und doppelsträngige Nukleinsäuresequenzen) hängt von der Aufgabestel lung ab und hat das Ziel, aus einer langen Nukleinsäurekette eine Population an relativ kleinen, einzelsträngigen Nukleinsäureket tenfragmenten (NSKFs) zu bilden, diese Fragmente mit einem für den Start der Sequenzierungsreaktion geeigneten Primer zu versehen und auf einer planen Oberfläche zu fixieren.The preparation of the material to be analyzed (single and double-stranded nucleic acid sequences) depends on the place of delivery lung and aims to create a long nucleic acid chain Population of relatively small, single-stranded nucleic acid chains fragments (NSKFs) to form these fragments with a for suitable primers at the start of the sequencing reaction provided and fixed on a flat surface.
Dabei werden einzelne NSKFs auf einer planen Oberfläche in einer solchen Weise fixiert, daß eine enzymatische Reaktion an diesen Molekülen ablaufen kann. Prinzipiell sind verschiedene Arten der Immobilisation möglich, die von der Zielsetzung, der Art der NSK und der für die Reaktion eingesetzten Polymerase abhängen. Die NSKFs werden bei der Immobilisierung zufällig auf der Oberfläche verteilt, d. h. es muß also nicht auf eine exakte Positionierung der einzelnen Ketten geachtet werden. Die Nukleinsäureketten müssen dabei in einer solchen Dichte auf der Oberfläche fixiert werden, daß eine eindeutige Zuordnung der später detektierten Signale zu einzelnen NSKFs gewährleistet ist.Individual NSKFs are placed on a flat surface in one fixed in such a way that an enzymatic reaction to this Molecules can run off. In principle, there are different types of Immobilization possible, depending on the objective, the type of NSK and depend on the polymerase used for the reaction. The NSKFs become random on the surface during immobilization distributed, d. H. So it doesn't have to be an exact positioning of the individual chains. The nucleic acid chains must be fixed in such a density on the surface be that an unambiguous assignment of those later detected Signals to individual NSKFs is guaranteed.
Nach der Vorbereitung der NSKFs startet man mit allen auf der Oberfläche immobilisierten Molekülen die Sequenzierungsreaktion. Als Grundlage der Sequenzierung dient die Synthese des komple mentären Stranges zu jedem einzelnen immobilisierten NSKF. Dabei werden in den neu synthetisierten Strang markierte NTs* einge baut. Die Polymerase baut nur ein einziges markiertes NT* in die wachsende Kette ein. Dies wird durch die reversible Ankopplung einer zur Termination führenden, sterisch anspruchsvollen Gruppe an die NTs* erreicht. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht. Diese sterisch anspruchsvolle Gruppe ist vorzugsweise ein Fluoreszenzfarbstoff.After preparing the NSKFs, you start with everyone at the Surface immobilized molecules the sequencing reaction. The synthesis of the comple serves as the basis for sequencing mental strand to every single immobilized NSKF. there marked NTs * are inserted into the newly synthesized strand builds. The polymerase only builds a single labeled NT * into the growing chain. This is due to the reversible coupling a sterically demanding group leading to the termination reached to the NTs *. The installation of another marked NT * this makes it impossible. This sterically sophisticated Group is preferably a fluorescent dye.
Die Sequenzierungsreaktion verläuft in mehreren Zyklen. Ein
Zyklus umfasst folgende Schritte:
The sequencing reaction proceeds in several cycles. A cycle comprises the following steps:
- a) Zugabe einer Lösung mit markierten Nukleotiden (NTs*) und Polymerase zu immobilisierten Nukleinsäureketten,a) adding a solution with labeled nucleotides (NTs * ) and polymerase to immobilized nucleic acid chains,
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der kom plementären Stränge um ein NT geeignet sind,b) Incubation of the immobilized nucleic acid chains with them Solution under conditions that extend the com complementary strands around an NT are suitable,
- c) Waschen,c) washing,
- d) Detektion der Signale von einzelnen Molekülen,d) detection of signals from individual molecules,
- e) Entfernung der Markierung von den eingebauten Nukleotiden, e) removing the label from the incorporated nucleotides,
- f) Waschen.f) washing.
Gegebenenfalls erfolgt eine mehrfache Wiederholung des Zyklus (a- f).If necessary, the cycle is repeated several times (a- f).
Die Reaktionsbedingungen des Schrittes (b) in einem Zyklus werden so gewählt, daß die Polymerasen an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* einbauen können, vorzugsweise an mehr als 90%.The reaction conditions of step (b) in one cycle chosen so that the polymerases on more than 50% of those on the Sequencing reaction involved NSKFs in one cycle marked NT * can be installed, preferably on more than 90%.
Die Anzahl der durchzuführenden Zyklen hängt dabei von der je weiligen Aufgabenstellung ab, ist theoretisch nicht beschränkt und liegt vorzugsweise zwischen 20 und 5000.The number of cycles to be carried out depends on each the task in hand is not theoretically limited and is preferably between 20 and 5000.
Danach wird für jedes fixierte NSKF seine spezifische Sequenz aus
der Reihenfolge der eingebauten NTs* ermittelt. Aus den überlap
penden NSKF-Sequenzen kann die ursprüngliche NSK-Sequenz
rekonstruiert werden ("Automated DNA sequencing and analysis" S.
231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom
Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et
al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1
S. 257). Dabei sucht man in der gesamten Population von NSKF-
Sequenzen nach Übereinstimmungen/Überlappungen in den Sequenzen
von NSKFs. Durch diese Übereinstimmungen/Überlappungen kann man
die NSKF in eine Reihe bringen, z. B.:
Then, for each fixed NSKF, its specific sequence is determined from the order of the installed NTs *. The original NSK sequence can be reconstructed from the overlapping NSKF sequences ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p . 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257). The entire population of NSKF sequences is searched for matches / overlaps in the sequences of NSKFs. Through these matches / overlaps one can bring the NSKF in a row, e.g. B .:
In der Praxis hat sich bei einer Sequenzierung von unbekannten Sequenzen bewährt, eine Länge der sequenzierten Stücke von mehr als 300 bp zu erreichen. Das erlaubt die Sequenzierung von Genomen aus Eukaryonten im Schrotschuss-Verfahren.In practice, there has been a sequencing of unknowns Sequences proven, a length of the sequenced pieces of more to reach 300 bp. This allows the sequencing of Eukaryotic genomes in shotgun process.
Dabei können die Fehler der Methode mit verschiedenen Mitteln erfasst und korrigiert werden. Sämtliche Schritte des Verfahrens können weitgehend automatisiert werden. The method errors can be done by various means be recorded and corrected. All steps of the process can be largely automated.
Durch die Arbeit mit einzelnen Molekülen ergeben sich mehrere
Vorteile gegenüber der früher beschriebenen BASS-Methode:
Working with individual molecules has several advantages over the BASS method described earlier:
- 1. Da die Moleküle einzeln detektiert werden, besteht keine Gefahr, daß das Signal durch die Desynchronisation in der Population fehlerhaft wird. Für jedes fixierte NSKF wird eine eigene Sequenz erstellt. Daher spielt es keine Rolle, ob an einem benachbarten Molekül die Synthese bereits weiter fortgeschritten oder zurückgeblieben ist.1. Since the molecules are detected individually, there is none Risk of the signal being desynchronized in the Population becomes faulty. For each fixed NSKF created its own sequence. So it doesn't matter whether synthesis continues on a neighboring molecule advanced or lagged.
- 2. Es ist nicht notwendig, Moleküle in einer definierten Anord nung auf der Oberfläche zu fixieren, da das Signal von einzelnen Molekülen ausgeht und nicht von einer räumlich definierten Population (was bei BASS-Methoden notwendig ist).2. It is not necessary to arrange molecules in a defined order fixation on the surface because the signal from single molecules and not spatially defined population (which is necessary for BASS methods is).
Im folgenden sollen anhand der Sequenzierung eines mehrere Mb langen DNA-Stückes beispielhaft die allgemeinen Prinzipien der Reaktion dargestellt werden (Fig. 1). Der Sequenzierung und der Rekonstruktion von Nukleinsäurensequenzen liegt das Shotgun- Prinzip zugrunde ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Die Sequenz eines langen DNA-Stücks wird dabei durch die Sequenzierung kleiner DNA-Fragmente und nachfolgender Rekon struktion ermittelt. Das zu analysierende Material (1) wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird (2). Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen (3). Dieses Gemisch aus verschiedenen DNA- Fragmenten wird nun auf einer planen Oberfläche fixiert (4). Die nicht gebundenen DNA-Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktionsoberfläche durchgeführt. Diese Reaktion verläuft zyklisch. Im 1. Schritt des Zyklus wird ein mit einem Fluo reszenzfarbstoff markiertes NT* in den wachsenden Strang eingebaut: Dabei wird die Reaktion so gesteuert, daß in jedem Zyklus jeweils nur ein markiertes NT* von einer Polymerase in den wachsenden Strang eingebaut werden kann. Das wird durch die Verwendung von NTs* erreicht, die eine reversibel gekoppelte, zur Termination führende Gruppe tragen. Der Einbau eines weiteren markierten NT* wird dadurch unmöglich gemacht. Die Polymerase und die markierten NTs* werden gleichzeitig in die Reaktion eigesetzt (5). Danach wird das Reaktionsgemisch entfernt und die Oberfläche in geeigneter Art und Weise gewaschen (6). Nun folgt ein Detektionsschritt (7): Die Oberfläche wird mit einer für die Einzelmoleküldetektion geeigneten Vorrichtung (bestehend aus Lichtquelle, Mikroskop, Kamera, Scantisch, Computer mit Steue rungs- und Bilderkennungs- bzw. Bildverarbeitungssoftware) abgescannt und die Signale der einzelnen, eingebauten markierten NTs* identifiziert. Nach dem Detektionsschritt wird die Markie rung und die zur Termination führende Gruppe von allen eingebau ten NTs* entfernt (8). Nach einem sich anschließenden Wasch schritt kann ein neuer Zyklus beginnen. Zur Rekonstruktion einer größeren ursprünglichen DNA-Sequenz (z. B. mehrere Mb langes DNA- Stück) sollen die DNA-Fragmente einige Hundert NT lang sein, falls man die Rekonstruktion nach dem Shotgun-Prinzip durchführt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 300 Zyklen zur Sequenzierung notwendig.In the following, the general principles of the reaction are to be illustrated by way of example using the sequencing of a piece of DNA of several Mb length ( FIG. 1). The sequencing and reconstruction of nucleic acid sequences is based on the shotgun principle ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868 , Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257). The sequence of a long piece of DNA is determined by sequencing small DNA fragments and subsequent reconstruction. The material to be analyzed (1) is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length (2). Each fragment is then provided with a primer binding site and a primer (3). This mixture of different DNA fragments is now fixed on a flat surface (4). The unbound DNA fragments are removed by a washing step. The sequencing reaction is then carried out on the entire reaction surface. This reaction is cyclical. In the first step of the cycle, an NT * labeled with a fluorescent dye is incorporated into the growing strand: the reaction is controlled so that only one labeled NT * from a polymerase can be incorporated into the growing strand in each cycle. This is achieved through the use of NTs * which carry a reversibly coupled group leading to termination. This makes it impossible to install another marked NT *. The polymerase and the labeled NTs * are used simultaneously in the reaction (5). The reaction mixture is then removed and the surface is washed in a suitable manner (6). Now there is a detection step (7): The surface is scanned with a device suitable for single-molecule detection (consisting of light source, microscope, camera, scanning table, computer with control and image recognition or image processing software) and the signals of the individual, built-in are marked NTs * identified. After the detection step, the marking and the group leading to the termination are removed from all installed NTs * (8). After a subsequent washing step, a new cycle can begin. For the reconstruction of a larger original DNA sequence (eg a piece of DNA that is several Mb long), the DNA fragments should be a few hundred NT long if the reconstruction is carried out according to the shotgun principle ("Automated DNA sequencing and analysis" p . 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257). Since only one marked NT * is installed per cycle, at least 300 cycles are required for sequencing.
Mit Hilfe der erfindungsgemäßen Methode ist es möglich, sowohl vorselektionierte DNA-Sequenzen (z. B. in YAC-, PAC-, oder BAC- Vektoren (R. Anand et al. NAR 1989 v. 17 S. 3425, H. Shizuya et al. PNAS 1992 v. 89 S. 8794, "Construction of bacterial artificial chromosome libraries using the modified PAC system" in "Current Protocols in Human genetics" 1996 John Wiley & Sons Inc.) klonierte Abschnitte eines Genoms) als auch nicht vorselektio nierte DNA (z. B. genomische DNA, cDNA-Gemische) zu analysieren. Durch eine Vorselektion ist es möglich, im Vorfeld relevante Informationen, wie z. B. Sequenz-Abschnitte aus einem Genom oder Populationen an Genprodukten, aus der große Menge genetischer Informationen herauszufiltern und damit die Menge der zu analysierenden Sequenzen einzuschränken.With the help of the method according to the invention it is possible to both preselected DNA sequences (e.g. in YAC, PAC, or BAC Vectors (R. Anand et al. NAR 1989 v. 17 p. 3425, H. Shizuya et al. PNAS 1992 v. 89 p. 8794, "Construction of bacterial artificial chromosome libraries using the modified PAC system "in" Current Protocols in Human Genetics "1996 John Wiley & Sons Inc.) cloned sections of a genome) and not pre-selection to analyze nated DNA (e.g. genomic DNA, cDNA mixtures). A pre-selection makes it possible to find relevant ones in advance Information such as B. sequence sections from a genome or Populations of gene products, from the large amount of genetic Filtering out information and hence the amount of restrict analyzing sequences.
Ziel der Materialvorbereitung ist es, immobilisierte einzel strängige NSKFs mit einer Länge von vorzugsweise 50-1000 NTs, einer einzelnen Primerbindungsstelle und einem hybridisierten Primer zu erhalten. Diese Fragmente haben vorzugsweise die in Fig. 2 dargestellte Struktur. Im einzelnen können sehr variable Konstruktionen aus dieser allgemeinen Struktur abgeleitet werden. Zur Verbesserung der Anschaulichkeit folgen nun einige Beispiele, wobei die angeführten Methoden einzeln oder in Kombination eingesetzt werden können.The aim of the material preparation is to obtain immobilized single-stranded NSKFs with a length of preferably 50-1000 NTs, a single primer binding site and a hybridized primer. These fragments preferably have the structure shown in FIG. 2. In particular, very variable constructions can be derived from this general structure. To improve the clarity, here are some examples, whereby the methods listed can be used individually or in combination.
Wichtig ist, daß die Fragmentierung der NSKs so erfolgt, daß Fragmente erhalten werden, die überlappende Teilsequenzen der Gesamtsequenzen darstellen. Dies wird durch Verfahren erreicht, bei denen unterschiedlich lange Fragmente als Spaltprodukte in zufallsmäßiger Verteilung entstehen.It is important that the NSKs are fragmented in such a way that Fragments are obtained, the overlapping partial sequences of the Display overall sequences. This is accomplished through procedures in which fragments of different lengths as fission products in random distribution arise.
Erfindungsgemäß kann die Erzeugung der Nukleinsäureketten fragmente (NSKFs) durch mehrere Methoden erfolgen, z. B. durch die Fragmentierung des Ausgangsmaterials mit Ultraschall oder durch Endonukleasen ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press), wie z. B. durch unspezifische Endonukleasegemische. Erfindungsgemäß wird die Ultraschall-Frag mentierung bevorzugt. Man kann die Bedingungen so einstellen, daß Fragmente mit einer durchschnittlichen Länge von 100 bp bis 1 kb entstehen. Diese Fragmente werden anschließend an ihren Enden durch das Klenow-Fragment (E.coli-Polymerase I) oder durch die T4-DNA-Polymerase aufgefüllt ("Molecular cloning" 1989 J. Sam brook et al. Cold Spring Harbor Laborotary Press).According to the invention, the generation of the nucleic acid chains fragments (NSKFs) are made by several methods, e.g. B. by the Fragmentation of the starting material with ultrasound or by Endonucleases ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press), e.g. B. by unspecific Endonukleasegemische. According to the ultrasound question mentation preferred. You can set the conditions so that Fragments with an average length of 100 bp to 1 kb arise. These fragments are then terminated by the Klenow fragment (E. coli polymerase I) or by the T4 DNA polymerase filled in ("Molecular cloning" 1989 J. Sam brook et al. Cold Spring Harbor Laborotary Press).
Ausserdem können aus einer langen NSK unter Verwendung randomi sierter Primer komplementäre kurze NSKFs synthetisiert werden. Besonders bevorzugt wird diese Methode bei der Analyse der Gen- Sequenzen. Dabei werden an der mRNA einzelsträngige DNA-Fragmente mit randomisierten Primern und einer reversen Transkriptase gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Bio chem. 1993 v. 208 S. 264, Decraene et al. Biotechniques 1999 v. 27 S. 962).It can also randomize from a long NSK using complemented short NSKFs are synthesized primer. This method is particularly preferred when analyzing the genetic Sequences. Single-stranded DNA fragments are thereby on the mRNA with randomized primers and a reverse transcriptase formed (Zhang-J et al. Biochem. J. 1999 v. 337 p. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 p. 31544, Kolls et al. Anal. Bio chem. 1993 v. 208 p. 264, Decraene et al. Biotechniques 1999 v. 27 P. 962).
Die Primerbindungsstelle ist ein Sequenzabschnitt, der eine selektive Bindung des Primers an das NSKF ermöglichen soll.The primer binding site is a sequence section which is a to enable selective binding of the primer to the NSKF.
Aus Gründen der Vereinfachung der Analyse ist es günstig, wenn eine möglichst einheitliche Primerbindungsstelle in allen NSKFs vorhanden ist. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Primerbindungsstellen daher in die NSKFs extra eingeführt. Auf diese Weise können Primer mit einheitlicher Struktur für die Reaktion eingesetzt werden.For the sake of simplifying the analysis, it is convenient if a primer binding site that is as uniform as possible in all NSKFs is available. According to a preferred embodiment of the The primer binding sites are therefore invented in the NSKFs specially introduced. This allows primers with more uniform Structure can be used for the reaction.
Die Zusammensetzung der Primerbindungsstelle ist nicht einge schränkt. Ihre Länge beträgt vorzugsweise zwischen 20 und 50 NTs. Die Primerbindungsstelle kann eine funktionelle Gruppe zur Immobilisation des NSKF tragen. Diese funktionelle Gruppe kann z. B. eine Biotingruppe sein.The composition of the primer binding site is not specified limits. Their length is preferably between 20 and 50 NTs. The primer binding site can be a functional group Wear immobilization of the NSKF. This functional group can z. B. be a biotin group.
Als Beispiel für die Einführung einer Primerbindungsstelle werden im folgenden die Ligation und das Nukleotid-Tailing an DNA- Fragmente beschrieben. As an example of the introduction of a primer binding site in the following the ligation and nucleotide tailing of DNA Fragments described.
Dabei wird ein doppelsträngiger Oligonukleotidkomplex mit einer Primerbindungsstelle verwendet (Fig. 3a). Dieser wird mit kom merziell erhältlichen Ligasen an die DNA-Fragmente ligiert ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). Es ist wichtig, daß nur eine einzige Primer bindungsstelle an das DNA-Fragment ligiert wird. Das erreicht man z. B. durch eine Modifikation einer Seite des Oligonukleotidkom plexes an beiden Strängen (Fig. 3b). Die Resultate nach der Ligation bzw. nach anschließender Denaturierung sind in Fig. 3c und 3d dargestellt. Die modifizierenden Gruppen am Oligonukleo tidkompex können zur Immobilisation dienen. Die Synthese und die Modifikation eines solchen Oligonukleotidkomplexes kann nach standardisierten Vorschriften durchgeführt werden. Zur Synthese kann z. B. der DNA-Synthesizer 380 A Applied Biosystems verwendet werden. Oligonucleotide mit einer bestimmten Zusammensetzung mit oder ohne Modifikationen sind aber auch als Auftragssynthese kommerziell erhältlich, z. B. von MWG-Biotech GmbH, Germany.A double-stranded oligonucleotide complex with a primer binding site is used ( FIG. 3a). This is ligated to the DNA fragments using commercially available ligases ("molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). It is important that only a single primer binding site be ligated to the DNA fragment. This is achieved e.g. B. by a modification of one side of the Oligonucleotidkom complex on both strands ( Fig. 3b). The results after the ligation or after subsequent denaturation are shown in FIGS. 3c and 3d. The modifying groups on the oligonucleotide complex can serve for immobilization. The synthesis and modification of such an oligonucleotide complex can be carried out according to standardized regulations. For synthesis, e.g. B. the DNA synthesizer 380 A Applied Biosystems can be used. Oligonucleotides with a certain composition with or without modifications are also commercially available as custom synthesis, e.g. B. from MWG-Biotech GmbH, Germany.
Statt der Ligation mit einem Oligonukleotid kann man mit einer terminalen Deoxynucleotidyltransferase mehrere (z. B. zwischen 10 und 20) Nukleosid-monophosphate an das 3'-Ende eines ss-DNA- Fragments anknüpfen ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v. 303, S. 37-38) (Fig. 4), z. B. mehrere Guanosin-Monophosphate ((G)n-Tailing genannt). Das entstehende Fragment wird zur Bindung des Primers, in diesem Beispiel eines (C)n-Primers, verwendet.Instead of ligation with an oligonucleotide, a terminal deoxynucleotidyl transferase can be used to attach several (eg between 10 and 20) nucleoside monophosphates to the 3 'end of an ss-DNA fragment ("Molecular cloning" 1989 J. Sambrook et al Cold Spring Harbor Laborotary Press, "Method in Enzymology" 1999 v. 303, pp. 37-38) ( Fig. 4), e.g. B. several guanosine monophosphates (called (G) n-tailing). The resulting fragment is used to bind the primer, in this example a (C) n primer.
Für die Sequenzierungsreaktion werden einzelsträngige NSKFs benötigt. Falls das Ausgangsmaterial in doppelsträngiger Form vorliegt, gibt es mehrere Möglichkeiten, aus doppelsträngiger DNA eine einzelsträngige Form zu erzeugen (z. B. Hitze-Denaturierung oder Alkali-Denaturierung) ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press). Single-stranded NSKFs are used for the sequencing reaction needed. If the starting material is in double-stranded form there are several ways to do it from double-stranded DNA create a single-stranded shape (e.g. heat denaturation or alkali denaturation) ("Molecular cloning" 1989 J. Sambrook et al. Cold Spring Harbor Laborotary Press).
Dieser hat die Funktion, den Start an einer einzigen Stelle des NSKF zu ermöglichen. Vorzugsweise bindet er an die Primerbin dungsstelle im NSKF. Die Zusammensetzung und die Länge des Pri mers sind nicht eingeschränkt. Außer der Startfunktion kann der Primer auch andere Funktionen übernehmen, wie z. B. eine Verbin dung zur Reaktionsoberfläche zu schaffen. Primer sollten so an die Länge und Zusammensetzung der Primerbindungsstelle angepaßt werden, daß der Primer den Start der Sequenzierungsreaktion mit der jeweiligen Polymerase ermöglicht.This has the function of starting at a single point on the To enable NSKF. It preferably binds to the primer application office in the NSKF. The composition and length of the Pri mers are not restricted. In addition to the start function, the Primers also take on other functions, such as. B. a verb to create the reaction surface. Primers should look like this adapted the length and composition of the primer binding site be that the primer starts the sequencing reaction with of the respective polymerase.
Vorzugsweise beträgt die Länge des Primers zwischen 6 und 100 NTs, optimalerweise zwischen 15 und 30 NTs. Der Primer kann eine Funktionsgruppe tragen, die zur Immobilisierung des NSKF dient, vorzugsweise ist eine solche Funktionsgruppe eine Biotingruppe (s. Abschnitt Immobilisierung). Sie soll die Sequenzierung nicht stören. Die Synthese eines solchen Primers kann z. B. mit dem DNA- Synthesizer 380 A Applied Biosystems ausgeführt werden oder aber als Auftragssynthese bei einem kommerziellen Anbieter, z. B. MWG- Biotech GmbH, Germany erstellt werden).The length of the primer is preferably between 6 and 100 NTs, ideally between 15 and 30 NTs. The primer can Carry a functional group that serves to immobilize the NSKF, such a functional group is preferably a biotin group (see section Immobilization). It is not supposed to be sequencing to disturb. The synthesis of such a primer can e.g. B. with the DNA Synthesizer 380 A Applied Biosystems can be executed or as custom synthesis at a commercial provider, e.g. B. MWG- Biotech GmbH, Germany).
Der Primer kann vor der Hybridisierung an die zu analysierenden Fragmente auf der Oberfläche mit verschiedenen Techniken fixiert oder direkt auf der Oberfläche synthetisiert werden (McGall et al. US Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v. 285 S. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).The primer can be analyzed prior to hybridization Fragments fixed on the surface using various techniques or synthesized directly on the surface (McGall et al. U.S. Patent 5412087, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology "2000 M. Schena Eaton Publishing," DNA Microarrays " 1999 M. Schena Oxford University Press, Fodor et al. Science 1991 v. 285 p. 767, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. 15 p. 5353, Gingeras et al. NAR 1987 v. 15 p. 5373, Maskos et al. NAR 1992 v. 20 p. 1679).
Der Primer oder das Primergemisch wird mit NSKFs unter Hybridi sierungsbedingungen inkubiert, die ihn selektiv an die Primerbin dungsstelle des NSKF binden lassen. Diese Primer-Hybridisierung kann vor, während oder nach der Immobilisierung der NSKFs erfolgen. Die Optimierung der Hybridisierungsbedingungen hängt von der genauen Struktur der Primerbindungsstelle und des Primers ab und läßt sich nach Rychlik et al. NAR 1990 v. 18 S. 6409 berechnen. Im folgenden werden diese Hybridisierungsbedingungen als standardisierte Hybridisierungsbedingungen bezeichnet.The primer or the primer mixture is mixed with NSKFs under Hybridi incubation conditions, which selectively attached it to the primerbin have the NSKF binding agency tied up. This primer hybridization can be before, during or after the immobilization of NSKFs respectively. The optimization of the hybridization conditions depends the exact structure of the primer binding site and the primer and can be according to Rychlik et al. NAR 1990 v. 18 p. 6409 to calculate. The following are these hybridization conditions referred to as standardized hybridization conditions.
Falls eine für alle NSKFs gemeinsame Primerbindungsstelle mit bekannter Struktur durch Ligation eigeführt wird, können Primer mit einheitlicher Struktur eingesetzt werden. Die Primerbin dungsstelle kann an ihrem 3'-Ende eine funktionelle Gruppe tra gen, die z. B. zur Immobilisation dient. Vorzugsweise ist diese Gruppe eine Biotin-Gruppe. Der Primer hat eine zur Primer bindungsstelle komplementäre Struktur.If there is a primer binding site common to all NSKFs known structure introduced by ligation, primers with a uniform structure. The primer at the 3 'end can be a functional group gene, the z. B. is used for immobilization. This is preferably Group a biotin group. The primer has one to the primer complementary structure.
Ein Beispiel einer Primerbindungstelle und eines Primers ist nachfolgend dargestellt.An example of a primer binding site and primer is shown below.
Ziel der Immobilisierung ist es, NSKFs auf einer geeigneten planen Oberfläche in einer Art und Weise zu fixieren, daß eine zyklische enzymatische Sequenzierungsreaktion ablaufen kann. Oberfläche und Reaktionsoberfläche sind in dieser Anmeldung als gleichwertige Begriffe aufzufassen, außer wenn explizit auf eine andere Bedeutung hingewiesen wird. Als Reaktionsoberfläche dient die Oberfläche einer festen Phase eines beliebigen Materials. Dieses Material ist vorzugsweise enzymatischen Reaktionen gegen über inert und verursacht keine Störungen der Detektion. Silicon, Glas, Keramik, Kunststoff (z. B. Polycarbonate oder Polystyrole) oder beliebiges anderes Material, das diesen funktionalen Anforderungen genügt, kann verwendet werden. Vorzugsweise ist die Oberfläche nicht verformbar, denn sonst ist mit einer Verzerrung der Signale bei der wiederholten Detektion zu rechnen.The aim of immobilization is to put NSKFs on a suitable plan to fix surface in a way that a cyclic enzymatic sequencing reaction can take place. Surface and reaction surface are in this application as to understand equivalent terms, unless explicitly referring to one other meaning is pointed out. Serves as the reaction surface the surface of a solid phase of any material. This material is preferably against enzymatic reactions over inert and does not interfere with detection. Silicon, Glass, ceramic, plastic (e.g. polycarbonate or polystyrene) or any other material that makes this functional Requirements can be used. Preferably, the Surface not deformable, otherwise there is a distortion of the signals to be expected in the case of repeated detection.
Falls eine gelartige feste Phase verwendet wird, so kann dieses Gel z. B. ein Agarose- oder Polyacrylamidgel sein. Das Gel ist vorzugsweise für Moleküle mit einer Molekularmasse unter 5000 Da frei passierbar (beispielsweise kann ein 1 bis 2% Agarose-Gel oder 10 bis 15% Polyacrylamid Gel verwendet werden). Eine solche Geloberfläche hat anderen festen Oberflächen gegenüber den Vorteil, daß die markierten NSKFs im Gegensatz zu freien NTs* auf der Oberfläche festgehalten werden. Durch die Immobilisation der NSKFs auf der Oberfläche ist die Detektion der Fluoreszenzsignale von eingebauten NTs* möglich. Die Signale von freien NTs* werden nicht detektiert, weil sie nicht an das Material des Gels binden und somit nicht immobilisiert werden. Das Gel ist vorzugsweise auf einer festen Unterlage befestigt (Fig. 5a). Die Dicke des Gels beträgt vorzugsweise nicht mehr als 0,1 mm. Die Geldicke muß jedoch größer als die einfache Tiefenschärfe des Objektivs sein, damit unspezifisch an die feste Unterlage gebundene NTs* nicht in die Fokusebene gelangen und damit detektiert werden. Wenn die Tiefenschärfe z. B. 0,3 µm beträgt, so liegt die Geldicke vorzugs weise zwischen 1 µm und 100 µm. Die Oberfläche kann als eine kontinuierliche Oberfläche oder als diskontinuierliche, aus einzelnen kleinen Bestandteilen (z. B. Agarose-Kügelchen) zusammengesetzte Oberfläche hergestellt werden (Fig. 5b). Die Reaktionsoberfläche muß groß genug sein, um die notwendige Anzahl der NSKFs bei entsprechender Dichte immobilisieren zu können. Die Reaktionsoberfläche sollte vorzugsweise nicht größer als 20 cm2 sein.If a gel-like solid phase is used, this gel can e.g. B. be an agarose or polyacrylamide gel. The gel is preferably freely passable for molecules with a molecular mass below 5000 Da (for example a 1 to 2% agarose gel or 10 to 15% polyacrylamide gel can be used). Such a gel surface has the advantage over other solid surfaces that the marked NSKFs, in contrast to free NTs *, are held on the surface. The immobilization of the NSKFs on the surface makes it possible to detect the fluorescence signals from built-in NTs *. The signals from free NTs * are not detected because they do not bind to the material of the gel and are therefore not immobilized. The gel is preferably attached to a solid base ( Fig. 5a). The thickness of the gel is preferably not more than 0.1 mm. However, the gel thickness must be greater than the simple depth of field of the lens, so that NTs * bound non-specifically to the solid base do not reach the focal plane and are therefore detected. If the depth of field e.g. B. is 0.3 microns, the Gelicke preference is between 1 micron and 100 microns. The surface can be produced as a continuous surface or as a discontinuous surface composed of individual small components (e.g. agarose beads) ( FIG. 5b). The reaction surface must be large enough to be able to immobilize the necessary number of NSKFs with the appropriate density. The reaction surface should preferably not be larger than 20 cm 2 .
Die verschiedenen Zyklusschritte erfordern einen Austausch der unterschiedlichen Reaktionslösungen über der Oberfläche. Die Reaktionsoberfläche ist vorzugsweise Bestandteil eines Reaktions gefäßes. Das Reaktionsgefäß ist wiederum vorzugsweise Bestandteil einer Reaktionsapparatur mit Durchflußvorrichtung. Die Durchfluß vorrichtung ermöglicht einen Austausch der Lösungen im Reaktions gefäß. Der Austausch kann mit einer durch einen Computer gesteuerten Pumpvorrichtung oder manuell erfolgen. Wichtig dabei ist, daß die Oberfläche nicht austrocknet. Vorzugsweise beträgt das Volumen des Reaktionsgefäßes weniger als 50 µl. Idealerweise beträgt sein Volumen weniger als 1 µl. Ein Beispiel eines solchen Duchflußsystems ist in Fig. 6 gegeben. The different cycle steps require an exchange of the different reaction solutions above the surface. The reaction surface is preferably part of a reaction vessel. The reaction vessel is in turn preferably part of a reaction apparatus with a flow device. The flow device allows an exchange of the solutions in the reaction vessel. The exchange can take place with a pump device controlled by a computer or manually. It is important that the surface does not dry out. The volume of the reaction vessel is preferably less than 50 μl. Ideally, its volume is less than 1 µl. An example of such a flow system is given in FIG. 6.
Die Immobilisierung der NSKFs erfolgt vorzugsweise an einem der beiden Ketten-Enden. Dies kann durch entsprechende kovalente, affine oder andere Bindungen erreicht werden. Es sind viele Beispiele der Immobilisierung von Nukleinsäuren bekannt (McGall et al. US Patent 5412087, Nikiforov et al. US Patent 5610287, Barrett et al. US Patent 5482867, Mirzabekov et al. US Patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, S. 138, Allemand et al. Biophysical Journal 1997, v. 73, S. 2064, Trabesin ger et al. Analytical Chemistry 1999, v. 71, S. 279, Osborne et al. Analytical Chemistry 2000, v. 72, S. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 S. 3142, Ghosh et al. NAR 1987 v. 15 S. 5353, Gingeras et al. NAR 1987 v. 15 S. 5373, Maskos et al. NAR 1992 v. 20 S. 1679).The NSKFs are preferably immobilized on one of the two chain ends. This can be done by appropriate covalent, affine or other bonds can be achieved. There are many Examples of immobilization of nucleic acids are known (McGall et al. U.S. Patent 5412087, Nikiforov et al. US patent 5610287, Barrett et al. U.S. Patent 5482867, Mirzabekov et al. U.S. patent 5981734, "Microarray biochip technology" 2000 M. Schena Eaton Publishing, "DNA Microarrays" 1999 M. Schena Oxford University Press, Rasmussen et al. Analytical Biochemistry v. 198, p. 138, Allemand et al. Biophysical Journal 1997, v. 73, p. 2064, Trabesin ger et al. Analytical Chemistry 1999, v. 71, p. 279, Osborne et al. Analytical Chemistry 2000, v. 72, p. 3678, Timofeev et al. Nucleic Acid Research (NAR) 1996, v. 24 p. 3142, Ghosh et al. NAR 1987 v. 15 P. 5353, Gingeras et al. NAR 1987 v. 15 p. 5373, Maskos et al. NAR 1992 v. 20 p. 1679).
Die NSKFs werden auf der Oberfläche vorzugsweise in einer Dichte zwischen 10 und 100 NSKFs pro 100 µm2 immobilisiert. Beispielhaft werden im folgenden zwei Methoden zur Immobilisierung näher dargestellt: In einer bevorzugten Ausführungsform erfolgt die Immobilisierung der NSKFs über Biotin-Avidin oder Biotin- Streptavidin-Bindung. Dabei wird Avidin oder Streptavidin auf der Oberfläche kovalent gebunden, das 5'-Ende des Primers enthält Biotin. Nach der Hybridisierung der markierten Primer mit den NSKFs werden diese auf der mit Avidin/Streptavidin modifizierten Oberfläche fixiert. Die Konzentration der mit Biotin markierten Hybridisierungs-Produkte sowie die Zeit der Inkubation dieser Lösung mit der Oberfläche wird so gewählt, daß eine für die Sequenzierung geeignete Dichte erreicht wird.The NSKFs are immobilized on the surface preferably in a density between 10 and 100 NSKFs per 100 µm 2 . Two methods of immobilization are described in more detail below by way of example: In a preferred embodiment, the NSKFs are immobilized via biotin-avidin or biotin-streptavidin binding. Avidin or streptavidin is covalently bound on the surface, the 5 'end of the primer contains biotin. After hybridization of the labeled primers with the NSKFs, they are fixed on the surface modified with avidin / streptavidin. The concentration of the hybridization products labeled with biotin and the time of incubation of this solution with the surface is selected so that a density suitable for sequencing is achieved.
In einer anderen bevorzugten Ausführungsform werden die für die Sequenzierungsreaktion geeigneten Primer vor der Sequenzierungs reaktion auf der Oberfläche mit geeigneten Methoden fixiert (s. o.). Die einzelsträngigen NSKFs mit jeweils einer Primerbin dungsstelle pro NSKF werden damit unter Hybridisierungsbedingun gen inkubiert. Dabei binden sie an die fixierten Primer und werden dadurch immobilisiert. Die Konzentration der einzel strängigen NSKFs wird so gewählt, daß man eine für die Sequenzierung geeignete Immobilisationsdichte von 10 bis 100 NSKFs pro 100 µm2 erreicht. Nach der Immobilisierung werden ungebundene NSKFs durch einen Waschschritt entfernt. Falls die Oberfläche einer festen Phase (z. B. Silikon oder Glas) zur Immobilisation verwendet wird, wird vorzugsweise eine Blockierungslösung auf die Oberfläche vor dem Schritt (a) in jedem Zyklus gebracht, die zur Vermeidung einer unspezifischen Adsorbtion von NTs* an der Oberfläche dient. Diese Bedingungen für eine Blockierlösung erfüllt beispielsweise eine Albuminlösung (BSA) mit einem pH-Wert zwischen 8 und 10.In another preferred embodiment, the primers suitable for the sequencing reaction are fixed on the surface using suitable methods before the sequencing reaction (see above). The single-stranded NSKFs, each with one primer binding site per NSKF, are thus incubated under hybridization conditions. They bind to the fixed primers and are thereby immobilized. The concentration of the single-stranded NSKFs is chosen so that an immobilization density of 10 to 100 NSKFs per 100 µm 2 suitable for sequencing is achieved. After immobilization, unbound NSKFs are removed by a washing step. If the surface of a solid phase (e.g. silicone or glass) is used for immobilization, a blocking solution is preferably applied to the surface before step (a) in each cycle in order to avoid non-specific adsorption of NTs * on the surface serves. For example, an albumin solution (BSA) with a pH between 8 and 10 fulfills these conditions for a blocking solution.
Als Polymerasen eignen sich prinzipiell alle DNA-abhängigen DNA- Polymerasen ohne 3'-5' Exonuklease-Aktivität (DNA-Replication" 1992 Ed. A. Kornberg, Freeman and company NY), z. B. modifizierte T7-Polymerase vom Typ "Sequenase Version 2" (Amersham Pharmacia Biotech), 3'-5' exonuklease freies Klenow Fragment der DNA-Poly merase I (Amersham Pharmacia Biotech), Polymerase Beta ver schiedenen Ursprungs (Animal Cell DNA Polymerases" 1983, Fry M., CRC Press Inc., kommerziell erhältlich bei Chimerx) thermostabile Polymerasen wie Taq-Polymerase (GibcoBRL), proHATM Polymerase (Eurogentech).In principle, all DNA-dependent DNA- Polymerases without 3'-5 'exonuclease activity (DNA replication " 1992 Ed. A. Kornberg, Freeman and company NY), e.g. B. modified Sequenase Version 2 type T7 polymerase (Amersham Pharmacia Biotech), 3'-5 'exonuclease-free Klenow fragment of the DNA poly merase I (Amersham Pharmacia Biotech), polymerase beta ver of various origins (Animal Cell DNA Polymerases "1983, Fry M., CRC Press Inc., commercially available from Chimerx) thermostable Polymerases such as Taq polymerase (GibcoBRL), proHATM polymerase (Euro GM).
Polymerasen mit 3'-5' Exonuklease-Aktivität können eingesetzt werden (z. B. Klenow-Fragment der E.coli-Polymerase I), sofern Reaktionsbedingungen gewählt werden, die vorhandene 3'-5' Exonu klease-Aktivität unterdrücken, wie z. B. ein niedriger pH-Wert (pH 6.5) beim Klenow-Fragment (Lehman and Richardson, J. Biol. Chem. 1964 v. 239 S. 233). Eine andere Möglichkeit besteht in der Verwendung von NTs* mit einer Phosphorothioate-Verbindung (Kunkel et al. PNAS 1981, v. 78 S. 6734). Dabei werden eingebaute NTs* von der 3'-5' Exonuklease-Aktivität der Polymerase nicht angegriffen. Im folgenden werden all diese Polymerasearten als "Polymerase" bezeichnet. Polymerases with 3'-5 'exonuclease activity can be used (e.g. Klenow fragment of E. coli polymerase I), provided that reaction conditions are selected, suppress the existing 3'-5' exonuclease activity, e.g. , B. a low pH (pH 6.5) in the Klenow fragment (Lehman and Richardson, J. Biol. Chem. 1964 v. 239 p. 233). Another possibility is to use NTs * with a phosphorothioate compound (Kunkel et al. PNAS 1981, v. 78 p. 6734). Built-in NTs * are not attacked by the 3'-5 'exonuclease activity of the polymerase. All these types of polymerases are referred to below as "polymerase".
Für die Sequenzierungsreaktion ist wichtig, daß jedes eingebaute NT* identifiziert wird. Eine Voraussetzung dafür ist, daß nur ein einziges NT* pro Zyklus in die Nukleinsäurekette eingebaut wird. Falls eine Polymerase mehrere NTs* nacheinander im selben Zyklus einbaut, so führt dies zu einem Fehler in der Sequenzermittlung. Aus diesem Grund muß man den Einbau der NTs* steuern. In diesem Zusammenhang sind verschiedene Möglichkeiten der Steuerung der enzymatischen Reaktion denkbar, wie z. B.For the sequencing reaction, it is important that each is built in NT * is identified. A prerequisite for this is that only one only NT * is inserted into the nucleic acid chain per cycle. If a polymerase has several NTs * in succession in the same cycle installed, this leads to an error in the sequence determination. For this reason you have to control the installation of the NTs *. In this There are various ways of controlling the context enzymatic reaction conceivable, such as. B.
- 1. einzelne Zugabe von NT, so daß die Polymerase nur einen einzigen Schritt macht und stoppt (Substrat Limitierung),1. Single addition of NT so that the polymerase only one single step and stop (substrate limitation),
- 2. Änderungen der äußeren Bedingungen (Temperatur, pH, Salz usw.), so daß die Polymerasen ihre Funktion anders ausüben (s. Optimierung der Reaktionsbedingngen),2. Changes in external conditions (temperature, pH, salt etc.), so that the polymerases perform their function differently (see optimization of reaction conditions),
- 3. durch bestimmte kompetetive und nichtkompetetive Inhibitoren (als Beispiel seien antivirale Medikamente genannt)3. by certain competitive and non-competitive inhibitors (antiviral drugs are an example)
- 4. Durch bestimmte Mutationen und andere Veränderungen an der Polymerase als solcher,4. Through certain mutations and other changes to the Polymerase as such,
-
5. Durch die Struktur der NT. Diese Strukturänderungen können
sein:
- a) irreversibel (wie z. B. bei dideoxyNTPs)
- b) reversibel.
- a) irreversible (such as with dideoxyNTPs)
- b) reversible.
Vorzugsweise erfolgt die Steuerung durch eine bestimmte Struktur der NTs*, wobei reversible Strukturveränderungen besonders bevorzugt sind. Die reversiblen Strukturveränderungen erfolgen beispielsweise durch Anheftung eines sterisch anspruchsvollen Liganden, d. h. eines Liganden, der die Polymerase vom Einbau eines weiteren NT abhält. Die Steuerung infolge einer sterischen Blockierung der enzymatischen Reaktion durch reversible Semi terminatoren wird unten genauer beschrieben. Gemäß einer bevorzugten Ausführungsform der Erfindung werden die Basen durch Ankopplung eines Fluoreszenzfarbstoffs strukturell verändert bzw. modifiziert. The control is preferably carried out by a certain structure of the NTs *, with reversible structural changes especially are preferred. The reversible structural changes take place for example by attaching a sterically sophisticated Ligands, i.e. H. of a ligand that prevents the polymerase from incorporation another NT holds. The control due to a steric Blocking of the enzymatic reaction by reversible semi terminators are described in more detail below. According to one preferred embodiment of the invention, the bases by Coupling of a fluorescent dye structurally changed or modified.
Es gibt mehrere prinzipielle Varianten der NT*-Struktur, die zur Behinderung bzw. zum Stop der Extensionsreaktion führt: z. B. wurden in der BASS-Methode reversible 3'-OH modifizierte NTs beschrieben (Dower US Patent 5.547.839, Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021, Metzker et al. NAR 1994, v. 22, S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197). Die Spaltung soll dabei unter milden Bedingungen photochemisch (Dower US Patent 5.547.839, Welch et al. Nucleosides & Nucleotides 1999, v. 18, S. 197) oder chemisch (Canard et al. US Patent 5.798.210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 S. 1021) erfolgen.There are several basic variants of the NT * structure that are used for Disability or stop of the extension reaction leads to: B. were reversible 3'-OH modified NTs in the BASS method (Dower U.S. Patent 5,547,839, Canard et al. U.S. Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 P. 1021, Metzker et al. NAR 1994, v. 22, p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18, p. 197). The split is supposed to thereby photochemically under mild conditions (Dower US Patent 5,547,839, Welch et al. Nucleosides & Nucleotides 1999, v. 18 P. 197) or chemical (Canard et al. U.S. Patent 5,798,210, Rasolonjatovo Nucleosides & Nucleotides 1999, v. 18 p. 1021) respectively.
Die Synthese der 3'-OH-modifizierten photochemisch spaltbaren NTs* ist sehr aufwendig. Die Polymerasen weisen eine sehr unter schiedliche Affinität zu diesen Nukleotidanalogen auf, so daß die Nukleinsäuresynthese sehr ungleichmäßig bzw. an manchen DNA- Stellen gar nicht abläuft (Metzker et al. NAR 1994 v. 22 S. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18 S. 197). Aus diesem Grund eignen sich diese Analoga nur bedingt für die Sequenzierungsreaktion. Eine spaltbare 3'-Ester-Verknüpfung (Canard et al. US Patent 5.798.210) kommt als Grundlage für eine reversible Termination der Synthese auch nicht in Betracht. Die meisten Polymerasen spalten bei Verfügbarkeit eines nächsten komplementären NT 3'-OH-Ester-Verbindungen, so daß die an die 3'- OH-Gruppe gebundene Markierung in die Lösung freigesetzt wird und nicht mehr als Terminator wirken kann (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v. 18 S. 1021, Canard et al. PNAS 1995 v. 92 S. 10859). In Positionen, an denen eine Polymerase mehrere gleiche NTs* nacheinander einbauen kann, führt das zu einem fehlerhaften Signal.The synthesis of the 3'-OH-modified photochemically cleavable NTs * is very complex. The polymerases have a very different affinity for these nucleotide analogs, so that the nucleic acid synthesis is very uneven or does not take place at some DNA sites (Metzker et al. NAR 1994 v. 22 p. 4259, Welch et al. Nucleosides & Nucleotides 1999, v. 18 p. 197). For this reason, these analogs are only of limited suitability for the sequencing reaction. A cleavable 3'-ester linkage (Canard et al. US Pat. No. 5,798,210) is also not considered as the basis for a reversible termination of the synthesis. Most polymerases cleave 3'-OH ester compounds when a next complementary NT is available, so that the label bound to the 3'-OH group is released into the solution and can no longer act as a terminator (Rasolonjatovo et al. Nucleosides & Nucleotides 1999, v. 18 p. 1021, Canard et al. PNAS 1995 v. 92 p. 10859). In positions where a polymerase can insert several identical NTs * one after the other, this leads to an incorrect signal.
Erfindungsgemäß werden für die Sequenzierung NTs* mit einer sterisch anspruchsvollen Gruppe an der Base verwendet. Eine an die Base gekoppelte sterisch anspruchsvolle Gruppe kann zur Behinderung der weiteren Synthese führen. Biotin, Digoxigenin und Fluoreszenzfarbstoffe wie Fluoreszein, Tetramethylrhodamine, Cy3- Farbstoff stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die Polymerasen können zwar solche NTs* in größeren Abständen einbauen, haben allerdings Schwierigkeiten, diese NTs* nacheinander einzubauen.According to the invention, NTs * with a sterically demanding group on the base are used for sequencing. A sterically demanding group coupled to the base can hinder further synthesis. Biotin, digoxigenin and fluorescent dyes such as fluorescein, tetramethylrhodamine, Cy3 dye are examples of such a sterically demanding group (Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22, p. 3418, Gebeyehu et al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analytical Biochemistry 1996, v. 234, p. 166, Heer et al. BioTechniques 1994 v. 16 p. 54). The polymerases can incorporate such NTs * at larger intervals, but have difficulty in integrating these NTs * one after the other.
Bei der Sequenzierungsreaktion im erfindungsgemäßen Verfahren werden markierte NTs* mit einer Polymerase und Nukleinsäureketten inkubiert. Die NTs* tragen dabei eine an die Base reversibel gekoppelte sterisch anspruchsvolle Gruppe. Wenn ein Reaktions gemisch, das nur modifizierte NTs* enthält, in der Reaktion eingesetzt wird, dann kann die Polymerase nur ein einziges NT* einbauen. Der Einbau eines nächsten NT* wird sterisch gehemmt. Diese NTs* treten somit als Terminatoren der Synthese auf. Nach der Entfernung der sterisch anspruchsvollen Gruppe kann das nächste komplementäre NT* eingebaut werden. Weil diese NTs* kein absolutes Hindernis zur weiteren Synthese darstellen, sondern nur für den Einbau eines weiteren markierten NT*, werden sie als Semiterminatoren bezeichnet.In the sequencing reaction in the method according to the invention are labeled NTs * with a polymerase and nucleic acid chains incubated. The NTs * are reversibly attached to the base coupled sterically demanding group. If a reaction mixture containing only modified NTs * in the reaction then the polymerase can only use a single NT * Install. The installation of a next NT * is sterically inhibited. These NTs * thus act as terminators of the synthesis. To removing the sterically demanding group can do that next complementary NT * will be installed. Because these NTs * no represent absolute obstacle to further synthesis, but only for the installation of another marked NT *, they are called Termed semiterminators.
Der Unterschied zur 3'-OH Terminatoren-Methode besteht darin, daß nicht eine Blockade der für die Synthese notwendigen 3'-OH Gruppe angestrebt wird, sondern eine an die Base geknüpfte Gruppe als sterisches Hindernis für den weiteren Einbau genutzt wird. Die 3'-OH Gruppe bleibt dabei die ganze Zeit frei.The difference to the 3'-OH terminator method is that not a blockade of the 3'-OH group necessary for the synthesis is aimed for, but a group linked to the base as steric obstacle is used for further installation. The 3'-OH group remains free all the time.
Die Semiterminatoren können verschiedene Strukturen haben. Ihre gemeinsamen Merkmale sind in Fig. 7a dargestellt. Diese Struktur ist dadurch charakterisiert, daß an der Base über einen spalt baren Linker (A-E) eine sterische Gruppe (D) und der Fluores zenzmarker (F) gebunden sind.The semiterminators can have different structures. Their common features are shown in Fig. 7a. This structure is characterized in that a steric group (D) and the fluorescent marker (F) are bound to the base via a cleavable linker (AE).
Als Grundlage für die NTs* dienen Deoxynukleosid-Triphosphate mit Adenosin (A), Guanosin (G), Cytidin (C) und Thymidin (T) als Nukleosidrest. Anstelle von Thymidin wird bevorzugt Uridin als Nukleosidrest verwendet. Anstelle von Guanosin kann Inosin ver wendet werden.Deoxynucleoside triphosphates also serve as the basis for the NTs * Adenosine (A), guanosine (G), cytidine (C) and thymidine (T) as Nucleoside residue. Instead of thymidine, uridine is preferred as Nucleoside residue used. Instead of guanosine, inosine can be used be applied.
Jede Base ist mit einem für sie charakteristischen Marker (F)
markiert (Fig. 7). Der Marker ist ein fluoreszierender Farbstoff.
Mehrere Faktoren beeinflussen die Wahl des Fluoreszenzfarb
stoffes. Die Wahl ist nicht eingeschränkt, sofern der Farbstoff
folgenden Anforderungen genügt:
Each base is marked with a marker (F) which is characteristic of it ( FIG. 7). The marker is a fluorescent dye. Several factors influence the choice of the fluorescent dye. The choice is not restricted if the dye meets the following requirements:
- a) Die verwendete Detektionsapparatur muß diesen Marker als einziges Molekül gebunden an DNA unter milden Bedingungen (vor zugsweise Reaktionsbedingungen) identifizieren können. Die Farb stoffe haben vorzugsweise große Photostabilität. Ihre Fluoreszenz wird vorzugsweise von der DNA nicht oder nur unwesentlich ge quencht.a) The detection equipment used must be this marker as only molecule bound to DNA under mild conditions (before can also identify reaction conditions). The color fabrics preferably have great photostability. Your fluorescence is preferably not or only insignificantly from the DNA quenches.
- b) Der an das NT gebundene Farbstoff darf keine irreversible Störung der enzymatischen Reaktion verursachen.b) The dye bound to the NT must not be irreversible Cause disturbance of the enzymatic reaction.
- c) mit dem Farbstoff markierte NTs* müssen von der Polymerase in die Nukleinsäurekette eingebaut werden.c) NTs * marked with the dye must be from the polymerase in the nucleic acid chain are installed.
- d) Bei einer Markierung mit verschiedenen Farbstoffen sollen diese Farbstoffe keine beträchtlichen Überlappungen in ihren Emissionsspektren aufweisen.d) When marking with different dyes these dyes have no significant overlap in theirs Have emission spectra.
Im Rahmen der vorliegenden Erfindung verwendbare Fluoreszenzfarb stoffe sind in "Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes mit Strukturformeln zusammengestellt. Erfindungsgemäß werden vorzugsweise folgende Farbstoffklassen als Marker eingesetzt: Cyanin-Farbstoffe und deren Abkömmlinge (z. B. Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner US-Patent 5.268.486), Rhodamine und deren Abkömmlinge (z. B. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, s. Handbuch), Xanthene-Derivate (z. B. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US-Patent 6.130.101). Diese Farbstoffe sind kommerziell erhältlich.Fluorescent color that can be used in the context of the present invention fabrics are in "Handbook of Fluorescent Probes and Research Chemicals "6th ed. 1996, R. Haugland, Molecular Probes Structural formulas compiled. According to the invention preferably the following dye classes are used as markers: Cyanine dyes and their descendants (e.g. Cy2, Cy3, Cy5, Cy7 Amersham Pharmacia Biotech, Waggoner U.S. Patent 5,268,486), Rhodamine and its descendants (e.g. TAMRA, TRITC, RG6, R110, ROX, Molecular Probes, see Manual), xanthene derivatives (e.g. Alexa 568, Alexa 594, Molecular Probes, Mao et al. US Patent 6130101). These dyes are commercially available.
Dabei kann man je nach spektralen Eigenschaften und vorhandener Apparatur entsprechende Farbstoffe auswählen. Die Farbstoffe werden an den Linker z. B. über Thiocyanat- oder Ester-Bindung gekoppelt ("Handbook of Fluorescent Probes und Research Chemi cals" 6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. 278 S. 363, Waggoner Methods in Enzymology 1995 v. 246 S. 362), s. Beispiele 1 und 2.You can do this depending on the spectral properties and available Select appropriate dyes for the equipment. The dyes are sent to the linker z. B. via thiocyanate or ester bond coupled ("Handbook of Fluorescent Probes and Research Chemi cals "6th ed. 1996, R. Haugland, Molecular Probes, Jameson et al. Methods in Enzymology 1997 v. 278 p. 363, Waggoner Methods in Enzymology 1995 v. 246 p. 362), p. Examples 1 and 2.
Die Gruppe (D) (Fig. 7) stellt ein Hindernis für den Einbau eines weiteren komplementären markierten NT* durch eine Polymerase dar. Biotin, Digoxigenin und Fluoreszenzfarbstoffe stellen Beispiele einer solchen sterisch anspruchsvollen Gruppe dar (Zhu et al. Cytometry 1997, v. 28, S. 206, Zhu et al. NAR 1994, v. 22, S. 3418, Gebeyehu et al., NAR 1987, v. 15, S. 4513, Wiemann et al. Analyti cal Biochemistry 1996, v. 234, S. 166, Heer et al. BioTechniques 1994 v. 16 S. 54). Die chemische Struktur dieser Gruppe ist nicht eingeschränkt, sofern sie den Einbau des markierten NT*, an das sie geknüpft ist, nicht wesentlich stört und keine irreversible Störung der enzymatischen Reaktion verursacht.Group (D) ( FIG. 7) represents an obstacle to the incorporation of a further complementary labeled NT * by a polymerase. Biotin, digoxigenin and fluorescent dyes are examples of such a sterically demanding group (Zhu et al. Cytometry 1997, v. 28, p. 206, Zhu et al. NAR 1994, v. 22, p. 3418, Gebeyehu et al., NAR 1987, v. 15, p. 4513, Wiemann et al. Analyti cal Biochemistry 1996, v. 234, P. 166, Heer et al. BioTechniques 1994 v. 16 p. 54). The chemical structure of this group is not restricted provided that it does not significantly interfere with the incorporation of the labeled NT * to which it is attached and does not cause an irreversible disturbance in the enzymatic reaction.
Diese Gruppe kann als selbständiger Teil im Linker (7a) auftreten oder mit dem Farbstoff (7b) oder der spaltbaren Gruppe (7d) identisch sein. Durch die Spaltung des Linkers wird diese sterisch anspruchsvolle Gruppe (D) nach der Detektion des Signals entfernt, so daß die Polymerase ein weiteres markiertes NT* einbauen kann. Bei einer Struktur wie in 7d wird die sterische Gruppe durch die Spaltung beseitigt.This group can appear as an independent part in the linker ( 7 a) or can be identical to the dye ( 7 b) or the cleavable group ( 7 d). By cleaving the linker, this sterically demanding group (D) is removed after detection of the signal, so that the polymerase can incorporate another labeled NT *. With a structure as in Figure 7d, the steric group is removed by the cleavage.
In einer bevorzugten Ausführungsform übernimmt der Fluoreszenz farbstoff die Funktion einer solchen sterisch anspruchsvollen Gruppe, so daß ein markiertes Nukleotid eine in Fig. 7b dar gestellte Struktur aufweist. In a preferred embodiment, the fluorescent dye takes over the function of such a sterically demanding group, so that a labeled nucleotide has a structure shown in FIG. 7b.
In einer anderen bevorzugten Ausführungsform übernimmt die photolabile spaltbare Gruppe die Funktion einer solchen sterisch anspruchsvollen Gruppe (Fig. 7d).In another preferred embodiment, the photolabile cleavable group takes over the function of such a sterically demanding group ( FIG. 7d).
Der Marker ist an die Base vorzugsweise über einen Abstandhalter unterschiedlicher Länge, einen sog. Linker, gebunden. Beispiele für Linker sind in Fig. 7e, f, h, i, j gegeben. Vorzugsweise ist dieser Linker an einer der Stellen an die Base gebunden, die nicht an der Basenpaarung teilnimmt. Im bevorzugten Fall sind die Stellen, an die der Linker gebunden ist: die 5-Position im Pyrimidinring und die 7-Position im Purinring. Beispiele der Ankoppelung eines Linkers an die Base können aus folgenden Quellen entnommen werden (Hobbs et al. US Patent 5.047.519, Khan et al. US Patent 5.821.356, Hanna M. Method in Enzymology 1996 v. 274, S. 403, Zhu et al. NAR 1994 v. 22 S. 3418, Herman et al. Methods in Enzymology 1990 v. 184 S. 584).The marker is preferably bound to the base via a spacer of different lengths, a so-called linker. Examples of linkers are given in Fig. 7e, f, h, i, j. This linker is preferably attached to the base at one of the sites which does not participate in the base pairing. In the preferred case, the positions to which the linker is attached are: the 5-position in the pyrimidine ring and the 7-position in the purine ring. Examples of coupling a linker to the base can be found in the following sources (Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356, Hanna M. Method in Enzymology 1996 v. 274, p. 403, Zhu et al. NAR 1994 v. 22 p. 3418, Herman et al. Methods in Enzymology 1990 v. 184 p. 584).
Die gesamte Länge des Linkers kann variieren. Sie entspricht der Anzahl der Kohlenstoff-Atome in den Abschnitten A, C, E und liegt vorzugsweise zwischen 3 und 20. Optimalerweise beträgt sie zwischen 4 und 10 Atomen. Die chemische Zusammensetzung des Linkers (Abschnitte A, C, E in Fig. 7a) ist nicht eingeschränkt, sofern sie unter Reaktionsbedingungen stabil bleibt und keine Störung der enzymatischen Reaktion verursacht.The total length of the linker can vary. It corresponds to the number of carbon atoms in sections A, C, E and is preferably between 3 and 20. Optimally, it is between 4 and 10 atoms. The chemical composition of the linker (sections A, C, E in FIG. 7a) is not restricted, provided that it remains stable under reaction conditions and does not cause any disturbance in the enzymatic reaction.
Der Linker trägt eine spaltbare Verbindung oder spaltbare Gruppe (B). Diese spaltbare Verbindung ermöglicht die Entfernung des Markers und des sterischen Hindernisses am Ende jedes Zyklus. Ihre Wahl ist nicht eingeschränkt, sofern sie unter den Bedin gungen der enzymatischen Sequenzierungsreaktion stabil bleibt, keine irreversible Störung der Polymerase verursacht und unter milden Bedingungen abgespalten werden kann. Unter "milden Bedingungen" sind solche Bedingungen zu verstehen, die den NSKF- Primer-Komplex nicht zerstören, wobei z. B. der pH-Wert vorzugsweise zwischen 3 und 11 liegt, die Temperatur zwischen 0°C und einem Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes (Tm ist "melting Point") und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt die maximale Temperatur bei 42°C; unter diesen Bedingungen eignen sich besonders Disulfid-Verbindungen und photolabile Verbindungen als spaltbare Verbindungen).The linker carries a fissile compound or fissile group (B). This fissile connection enables the removal of the Markers and the steric obstacle at the end of each cycle. Your choice is not restricted, provided it is under the conditions the enzymatic sequencing reaction remains stable, no irreversible polymerase disruption caused and under mild conditions can be split off. Under "mild Conditions "are to be understood as conditions that the NSKF Do not destroy the primer complex. B. the pH is preferred is between 3 and 11, the temperature between 0 ° C and a temperature value (x). This temperature value (x) depends on the Tm of the NSKF primer complex (Tm is "melting point") and will calculated as Tm (NSKF primer complex) minus 5 ° C (e.g. Tm 47 ° C, then the maximum temperature is 42 ° C; Under these Conditions are particularly suitable for disulfide compounds and photolabile compounds as cleavable compounds).
Vorzugsweise gehört die genannte Verbindung zu chemisch oder enzymatisch spaltbaren oder photolabilen Verbindungen. Als Beispiele von chemisch spaltbaren Gruppen sind Ester- und Disulfid-Verbindungen bevorzugt (Herman et al. Method in Enzymology 1990 v. 184 S. 584, Lomant et al. J. Mol. Biol. 1976 v. 104 243, "Chemistry of carboxylic acid and esters" S. Patai 1969 Interscience Publ.). Beispiele für photolabile Verbindungen können in folgenden Literaturstellen gefunden werden: "Protective groups in organic synthesis" 1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 S. 1, V. Pillai Org. Photochem. 1987 v. 9 S. 225.The compound mentioned preferably belongs to chemical or enzymatically cleavable or photolabile compounds. As Examples of chemically cleavable groups are ester and Disulfide compounds preferred (Herman et al. Method in Enzymology 1990 v. 184 p. 584, Lomant et al. J. Mol. Biol. 1976 v. 104 243, "Chemistry of carboxylic acid and esters" S. Patai 1969 Interscience Publ.). Examples of photolabile compounds can be found in the following references: "Protective groups in organic synthesis "1991 John Wiley & Sons, Inc., V. Pillai Synthesis 1980 p. 1, V. Pillai Org. Photochem. 1987 v. 9 P. 225.
Die Position der spaltbaren Verbindung/Gruppe im Linker ist vorzugsweise nicht weiter als 10 Atome von der Base entfernt, noch bevorzugter nicht weiter als 3 Atome. Besonders bevorzugt liegt die spaltbare Verbindung oder Gruppe direkt an der Base.The position of the fissile link / group in the linker is preferably no more than 10 atoms from the base, more preferably no more than 3 atoms. Particularly preferred the cleavable compound or group lies directly on the base.
Der Spaltungs- und Entfernungs-Schritt ist in jedem Zyklus vor handen und muß unter milden Bedingungen (s. o.) verlaufen, so daß die Nukleinsäuren nicht beschädigt oder modifiziert werden.The cleavage and removal step is before each cycle act and must run under mild conditions (see above), so that the nucleic acids are not damaged or modified.
Die Spaltung läuft bevorzugt chemisch (z. B. in milder saurer oder basischer Umgebung für eine Ester-Verbindung oder durch Zugabe eines Reduktionsmittel, z. B. Dithiothreitol (Sigma) bei der Spaltung einer Disulfid-Verbindung), siehe Beispiel 1, oder physikalisch (z. B. durch Beleuchtung der Oberfläche mit Licht einer bestimmten Wellenlänge für die Spaltung einer photolabilen Gruppe) ab. The cleavage is preferably chemical (e.g. in mild acidic or basic environment for an ester compound or by adding a reducing agent, e.g. B. Dithiothreitol (Sigma) at the Cleavage of a disulfide compound), see Example 1, or physically (e.g. by illuminating the surface with light a certain wavelength for the cleavage of a photolabile Group).
Nach der Spaltung verbleibt an der Base ein Linkerrest (A) (Fig. 7c).After the cleavage, a linker residue (A) remains on the base ( FIG. 7c).
Die Synthese eines spaltbaren Linkers wird an Beispielen gezeigt (vgl. Beispiele 1 und 2).The synthesis of a cleavable linker is shown using examples (see Examples 1 and 2).
Insgesamt spielen die Größe, die Ladung und die chemische Struk
tur des Markers, die Länge des spaltbaren Linkers und des Linker-
Rests sowie auch die Wahl der Polymerase eine wichtige Rolle. Sie
bestimmen gemeinsam, ob das markierte NT* durch die Polymerase in
die wachsende Nukleinsäurekette eingebaut wird, und ob dadurch
der Einbau des nächsten markierten NT* verhindert wird. Zwei
Bedingungen sind dabei besonders zu berücksichtigen:
Einerseits ist es wichtig, daß die Polymerase die Nukleinsäure
kette mit dem eingebauten modifizierten NT* nach der Spaltung des
Linkers weiter verlängern kann. Es ist also wichtig, daß der
Linkerrest "A" (Fig. 7c) nach der Spaltung keine wesentliche
Störung für die weitere Synthese darstellt. Andererseits müssen
eingebaute, nicht gespaltene NTs* ein Hindernis darstellen. Es
können viele für die Reaktion geeignete NTs* synthetisiert wer
den. Im einzelnen muß für jede Kombination aus Polymerase und
NTs* eine Vorversuchsreihe durchgeführt werden, in der die Taug
lichkeit eines bestimmten NT*-Typs für die Sequenzierung erprobt
wird.Overall, the size, the charge and the chemical structure of the marker, the length of the cleavable linker and the linker residue and also the choice of polymerase play an important role. Together they determine whether the labeled NT * is incorporated into the growing nucleic acid chain by the polymerase and whether this prevents the insertion of the next labeled NT *. Two conditions are particularly important:
On the one hand, it is important that the polymerase can further extend the nucleic acid chain with the built-in modified NT * after the linker has been cleaved. It is therefore important that the linker residue "A" ( FIG. 7c) after cleavage does not represent a significant disturbance for the further synthesis. On the other hand, built-in, non-split NTs * must be an obstacle. Many NTs * suitable for the reaction can be synthesized. In particular, a preliminary test series must be carried out for each combination of polymerase and NTs * , in which the suitability of a specific NT * type for sequencing is tested.
Die Pufferbedingungen werden nach Angaben des Polymeraseherstel lers gewählt. Die Reaktionstemperatur wird für nicht thermostabi le Polymerasen nach Angaben des Herstellers gewählt (z. B. 37°C für Sequenase Version 2), für thermostabile Polymerasen (z. B. Taq-Polymerase) beträgt die Reaktionstemperatur maximal den Temperaturwert (x). Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer-Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt die maximale Reaktionstemperatur bei 42°C). Diese Pufferbedingungen und Reaktionstemperatur werden weiter als "optimale Puffer- und Temperaturbedingungen" bezeichnet.The buffer conditions are chosen according to the polymerase manufacturer. The reaction temperature is chosen for non-thermostable polymerases according to the manufacturer (e.g. 37 ° C for Sequenase Version 2 ), for thermostable polymerases (e.g. Taq polymerase) the reaction temperature is at most the temperature value (x). This temperature value (x) depends on the Tm of the NSKF primer complex and is calculated as Tm (NSKF primer complex) minus 5 ° C (e.g. Tm is 47 ° C, then the maximum reaction temperature is 42 ° C). These buffer conditions and reaction temperature are further referred to as "optimal buffer and temperature conditions".
Die Reaktionszeit (entspricht der Dauer des Einbau-Schrittes in einem Zyklus) beträgt vorzugsweise weniger als eine Stunde, idealerweise liegt die Reaktionszeit zwischen 10 sec und 10 min.The reaction time (corresponds to the duration of the installation step in one cycle) is preferably less than one hour, ideally the reaction time is between 10 sec and 10 min.
Als Beispiele von geeigneten Kombinationen zwischen NT* und
Polymerase sind folgende Kombinationen zu nennen:
The following combinations may be mentioned as examples of suitable combinations between NT * and polymerase:
- a) NT* mit einem kurzen Linkerrest (Synthese siehe Beispiel 2, Fig. 7e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) in Kombina tion mit Sequenase Version 2, Taq-Polymerase (GibcoBRL), ProHA- DNA-Polymerase (Eurogentec) oder DNA-Polymerase Beta aus Säugetieren (Chimerx).a) NT * with a short linker residue (synthesis see Example 2, Fig. 7e, h, i): dNTP-SS-TRITC (L7), dNTP-SS-Cy3 (L11) in combination with Sequenase Version 2, Taq- Polymerase (GibcoBRL), ProHA-DNA polymerase (Eurogentec) or DNA polymerase beta from mammals (Chimerx).
- b) NT* mit einem langen Linkerrest (Synthese siehe Beispiel 1, Fig. 7f, g, j): dNTP-SS-TRITC (L14) in Kombination mit Sequenase Version 2 oder oder ProHATM-Polymerase (Eurogentech).b) NT * with a long linker residue (synthesis see Example 1, Fig. 7f, g, j): dNTP-SS-TRITC (L14) in combination with Sequenase version 2 or or ProHATM polymerase (Eurogentech).
Die Tauglichkeit eines Linkerrests an der Base (A) für die Reak tion kann man in einem Testsystem prüfen. Dabei werden gespaltene NTs* in eine Nukleinsäurekette nacheinander einbaut. Man verwendet z. B. dUTP* mit dem gewünschten gespaltenen Linkerrest, poly-dA als Matrize, Oligo-dT20-Primer, die gewünschte Polymerase und führt unter für die jeweilige Polymerase geeigneten optimalen Puffer- und Temperaturbedingungen eine Reaktion durch. Die NT*- Konzentration liegt vorzugsweise zwischen 5 µM und 200 µM. Nach der Reaktion wird die Anzahl der in die Nukleinsäurekette eingebauten NTs* analysiert, z. B. durch die Auftrennung der Länge nach in einem Gel. Für die Rückschlüsse auf die Tauglichkeit des Linkerrests kann man folgende Angaben verwenden: Wenn die Polymerase mehr als 20 NTs* einbauen kann, so ist dieser Linkerrest für eine Sequenzierungsreaktion geeignet. Beim Einbau von weniger als 20 gespaltenen NTs* ist diese Kombination aus NT* und Polymerase nicht optimal für die Sequenzierungsreaktion. The suitability of a link remnant at base (A) for the reak tion can be checked in a test system. This will split NTs * built into a nucleic acid chain one after the other. you uses z. B. dUTP * with the desired split linker residue, poly-dA as a template, oligo-dT20 primer, the desired polymerase and leads under optimal for the respective polymerase Buffer and temperature conditions cause a reaction. The NT * Concentration is preferably between 5 µM and 200 µM. To the reaction is the number of in the nucleic acid chain built-in NTs * analyzed, e.g. B. by separating the length after in a gel. For conclusions about the suitability of the Leftovers can use the following information: If the Polymerase can incorporate more than 20 NTs *, this is it Linker residue suitable for a sequencing reaction. During installation of less than 20 split NTs * this combination of NT * and polymerase not optimal for the sequencing reaction.
Wenn ein passender Linkerrest feststeht, muß man in einem weiteren Testsystem prüfen, ob die markierten, nicht gespaltenen NTs* als Semiterminatoren funktionieren. Das wird geprüft, indem die markierten NTs* unter für die Reaktion geeigneten optimalen Puffer- und Temperaturbedingungen mit der Polymerase und einer Matrize inkubiert werden. Die NT*-Konzentration liegt vorzugs weise zwischen 5 µM und 200 µM. Die Matrize ist so zu wählen, daß der Einbau mehrerer NTs* nacheinander zu erwarten wäre, z. B. für dUTP* kann man polydA, wie im oben dargestellten Beispiel ver wenden. Idealerweise baut die Polymerase nur ein einziges NT* ein.If a suitable link remnant has been determined, another test system must be used to check whether the marked, non-split NTs * function as semiterminators. This is checked by incubating the labeled NTs * with the polymerase and a template under optimal buffer and temperature conditions suitable for the reaction. The NT * concentration is preferably between 5 µM and 200 µM. The matrix must be selected so that the installation of several NTs * would be expected one after the other, e.g. B. for dUTP * you can use polydA, as in the example above ver. Ideally, the polymerase incorporates only a single NT *.
Falls bei gegebenen optimalen Puffer- und Temperaturbedingungen durch eine Polymerase mehrere NTs* nacheinander eingebaut werden, kann man die Reaktionsparameter (z. B. NT*-Konzentration, Reaktionstemperatur) verändern und der jeweiligen Kombination aus Polymerase und NT* anpassen. Das wichtigste dabei ist, daß die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.If several NTs * are installed one after the other under given optimal buffer and temperature conditions, the reaction parameters (e.g. NT * concentration, reaction temperature) can be changed and adapted to the respective combination of polymerase and NT * . The most important thing is that the polymerase does not incorporate a second NT * in the specified time (preferably between 10 sec and 10 min).
Erfindungsgemäß erfolgt diese Anpassung in einer Ausführungsform durch die Veränderung der Reaktionstemperatur. Die anderen Para meter der Reaktion werden dabei konstant gehalten.According to the invention, this adaptation takes place in one embodiment by changing the reaction temperature. The other para reaction meters are kept constant.
Als Polymerasen werden beipielsweise Polymerasen verwendet, die Polymerasen ohne 3'-5'-Endonukleaseaktivität sind, vorzugsweise aus der Gruppe bestehend aus viralen Polymerasen vom Sequenase- Typ, Beta-Polymerasen aus Eukaryonten, und thermostabilen Polymerasen. Insbesondere kommen Sequenase Version 2, Polymerase Beta aus Säugetieren, Taq-Polymerase oder ProHATM-Polymerase in Betracht.As polymerases, for example, polymerases are used that Polymerases without 3'-5'-endonuclease activity are preferred from the group consisting of viral polymerases from sequenase Type, beta polymerases from eukaryotes, and thermostable Polymerases. In particular come Sequenase Version 2, Polymerase Beta from mammals, Taq polymerase or ProHATM polymerase in Consideration.
Die NT*-Konzentration liegt bei diesen Experimenten üblicherweise zwischen 5 µM und 200 µN, vorzugsweise zwischen 10 und 100 µM. Die Konzentration der Polymerase und die Pufferbedingungen werden nach Angaben vom Hersteller gewählt. Die Dauer der Reaktion kann variieren und liegt vorzugsweise zwischen 10 sec und 10 min. was der Dauer des Einbau-Schrittes (a) in einem Zyklus entsprechen würde. Bei nicht thermostabilen Polymerasen wie z. B. Sequenase Version 2 (Amersham Pharmacia Biotech), exonuclease free Klenow- Fragment der DNA Polymerase I (Amersham Pharmacia Biotech) wird die Reaktionsthemperatur von konventionellen 37°C vorzugsweise auf 20°C bis 30°C reduziert. Bei thermostabilen Polymerasen wie z. B. Taq-Polymerase (GibcoBRL), ProHATM-Polymerase (Eurogentech) wird die Reaktionstemperatur von konventionellen 70-75°C vorzugsweise auf Werte reduziert, die zwischen 30°C und dem Temperaturwert (x) liegen. Dieser Temperaturwert (x) hängt von der Tm des NSKF-Primer-Komplexes und wird als Tm (NSKF-Primer- Komplex) minus 5°C errechnet (z. B. Tm ist 47°C, dann liegt der Temperaturwert (x) bei 42°C).The NT * concentration is usually in these experiments between 5 µM and 200 µN, preferably between 10 and 100 µM. The concentration of the polymerase and the buffer conditions will selected according to the manufacturer. The duration of the reaction can vary and is preferably between 10 sec and 10 min. What correspond to the duration of the installation step (a) in one cycle would. With non-thermostable polymerases such. B. Sequenase Version 2 (Amersham Pharmacia Biotech), exonuclease free Klenow- Fragment of DNA polymerase I (Amersham Pharmacia Biotech) is the reaction temperature of conventional 37 ° C is preferred reduced to 20 ° C to 30 ° C. With thermostable polymerases such as z. B. Taq polymerase (GibcoBRL), ProHATM polymerase (Eurogentech) the reaction temperature of conventional 70-75 ° C preferably reduced to values between 30 ° C and Temperature value (x). This temperature value (x) depends on the Tm of the NSKF primer complex and is called Tm (NSKF primer Complex) minus 5 ° C calculated (e.g. Tm is 47 ° C, then the Temperature value (x) at 42 ° C).
In einer anderen bevorzugten Ausführungsform der Erfindung er folgt die Anpassung der Reaktionsbedingungen durch die Verminde rung der NT*-Konzentration auf unter 5 µM, die anderen Parameter der Reaktion (Pufferbedingungen, Temperaturbedingungen) werden konstant gehalten. Die Konzentration der NT* liegt vorzugsweise bei dieser Anpassung zwischen 0,5 und 5 µM. Die Dauer der Reaktion liegt zwischen 10 sec und 10 min. Das wichtigste bei der Wahl der NT*-Konzentration ist, daß die Polymerase in der vorgegebenen Zeit (liegt vorzugsweise zwischen 10 sec und 10 min) ein zweites NT* nicht einbaut.In another preferred embodiment of the invention, the reaction conditions are adjusted by reducing the NT * concentration to below 5 μM, the other parameters of the reaction (buffer conditions, temperature conditions) are kept constant. With this adaptation, the concentration of the NT * is preferably between 0.5 and 5 μM. The duration of the reaction is between 10 sec and 10 min. The most important thing when choosing the NT * concentration is that the polymerase does not incorporate a second NT * in the specified time (preferably between 10 sec and 10 min).
Nach Optimierung der Reaktionsbedingungen für den Einbau eines einzelnen NT* muß man die Reaktion mit gespaltenen NTs* wieder holen. Unter entsprechend geänderten Reaktionsparameter muß Polymerase die gespaltenen NTs* nacheinander einbauen können.After optimizing the reaction conditions for the installation of a single NT * you have to react with split NTs * again to fetch. Under correspondingly changed reaction parameters Polymerase can incorporate the cleaved NTs * one after the other.
Die Optimierungsreaktion korreliert mit dem Einbauschritt, Schritt (b), in einem Zyklus. Die für die Optimierungsreaktion ermittelten Bedingungen, die Temperatur, die Konzentration an NT*, die Pufferbedingungen, die Dauer der Reaktion werden für die Reaktion auf der Oberfläche übernommen.The optimization reaction correlates with the installation step, Step (b) in one cycle. The one for the optimization reaction determined conditions, the temperature, the concentration NT *, the buffer conditions, the duration of the reaction are for the Reaction on the surface adopted.
Unter diesen Reaktionsbedingungen erfolgt der Einbau von NT* in die NSKFs vorzugsweise so, daß an mehr als 50% der an der Sequenzierungsreaktion beteiligten NSKFs in einem Zyklus ein markiertes NT* eingebaut wird, vorzugsweise an mehr als 90%. Das hängt damit zusammen, daß an manchen Nukleinsäureketten die Reaktion sehr langsam abläuft. Ein Einbau der NTs* an jeder komplementären Position in jedem Zyklus wird angestrebt, ist aber nicht erforderlich, weil nur die erfolgreichen Einbaureaktionen detektiert und ausgewertet werden; eine verzögerte Reation im Nachfolgenden Zyklus führt nicht zu einem Sequenzierungsfehler.Under these reaction conditions, the incorporation of NT * into the NSKFs is preferably such that a labeled NT * is incorporated into more than 50% of the NSKFs involved in the sequencing reaction, preferably over 90%. This is due to the fact that the reaction takes place very slowly on some nucleic acid chains. An installation of the NTs * at every complementary position in each cycle is aimed for, but is not necessary because only the successful installation reactions are detected and evaluated; a delayed reaction in the subsequent cycle does not lead to a sequencing error.
Vorzugsweise wird für alle NTs* dieselbe Polymerase verwendet. Es können aber auch verschiedene Polymerasen für verschiedene NTs* eingesetzt werden.The same polymerase is preferably used for all NTs *. It can also use different polymerases for different NTs * be used.
Einen Zyklus kann man durchführen mit:
A cycle can be carried out with:
- a) vier verschieden markierten NT*sa) four differently marked NT * s
- b) zwei verschieden markierten NT*sb) two differently marked NT * s
- c) einem markierten NT*c) a marked NT *
- d) zwei verschieden markierten NT*s und zwei unmarkierten NTs,d) two differently marked NT * s and two unmarked NTs
d. h.d. H.
- a) Man kann alle 4 NTs mit verschiedenen Farbstoffen markieren und alle 4 gleichzeitig in die Reaktion einsetzten. Dabei erreicht man die Sequenzierung einer Nukleinsäurekette mit einer minimalen Anzahl von Zyklen. Diese Variante der Erfindung stellt allerdings hohe Anforderungen an das Detektionssystem: 4 verschiedene Farbstoffe müssen in jedem Zyklus identifiziert werden.a) You can use all 4 NTs with different dyes Mark and use all 4 in the reaction at the same time. The sequencing of a nucleic acid chain is also achieved a minimum number of cycles. This variant of the invention however, places high demands on the detection system: 4 different dyes have to be identified in each cycle become.
- b) Zur Vereinfachung der Detektion kann eine Markierung mit zwei Farbstoffen gewählt werden. Dabei werden 2 Paare von NTs* gebildet, die jeweils verschieden markiert sind, z. B. A und G tragen die Markierung "X", C und U tragen die Markierung "Y". In die Reaktion in einem Zyklus (n) werden 2 unterschiedlich markierte NTs* gleichzeitig eingesetzt, z. B. C* in Kombination mit A*, und im darauffolgenden Zyklus (n + 1) werden dann U* und G* zugegeben.b) To simplify the detection, a label with two dyes can be selected. Two pairs of NTs * are formed, each marked differently, e.g. B. A and G are marked "X", C and U are marked "Y". Two differently marked NTs * are used simultaneously in the reaction in one cycle (s), e.g. B. C * in combination with A * , and in the subsequent cycle (n + 1) then U * and G * are added.
- c) Man kann auch nur einen einzigen Farbstoff zur Markierung aller 4 NTs* verwenden und pro Zyklus nur ein NTs* einsetzen.c) You can also use only a single dye for marking Use all 4 NTs * and use only one NTs * per cycle.
- d) In einer technisch vereinfachten Ausführungsform werden pro Zyklus zwei unterschiedlich markierte NT*s eingesetzt und zwei unmarkierte NTs (sogen. 2NT*s/2NTs-Methode). Diese Ausführungsform kann verwendet werden, um Varianten (z. B. Muta tionen, oder alternativ gespleißte Gene) einer bereits bekannten Sequenz zu ermitteln.d) In a technically simplified embodiment used two differently marked NT * s per cycle and two unmarked NTs (so-called 2NT * s / 2NTs method). This Embodiment can be used to designate variants (e.g. Muta tions, or alternatively spliced genes) of an already known To determine the sequence.
Einzelne Moleküle auf einer Oberfläche kann man mit verschiedenen Methoden untersuchen. Es sind mehrere Verfahren bekannt: z. B. AtomForce-Mikroscopie, Elektronen-Mikroskopie, Nahfeld-Fluo reszenz-Mikroscopie, Weitfeld-Fluoreszenz-Mikroskopie, TIR- Mikroskopie usw. (Science 1999 v. 283 1667, Unger et al. BioTech niques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161, Dickson et al. Science 1996 v. 274 S. 966, Xie et al. Science 1994 v. 265 S. 361, Nie et al. Science 1994 v. 266 S. 1018, Betzig et al. Science 1993 v. 262 S. 1422).Individual molecules on a surface can be used with different Examine methods. Several methods are known: e.g. B. AtomForce microscopy, electron microscopy, near-field fluo rescence microscopy, wide field fluorescence microscopy, TIR Microscopy etc. (Science 1999 v. 283 1667, Unger et al. BioTech niques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. 92 p. 161, Dickson et al. Science 1996 v. 274 p. 966, Xie et al. Science 1994 v. 265 p. 361, Nie et al. Science 1994 v. 266 p. 1018, Betzig et al. Science 1993 v. 262 p. 1422).
Erfindungsgemäß werden Fluoreszenz-Signale einzelner in die Nukleinsäurekette eingebauter NTs* vorzugsweise mit einem Weitfeld-Fluoreszenz-Mikroskop oder einem Laser-Scanning- Mikroskop oder einem TIRF-Microskop (Total Internal Reflection Fluorescence Microscope).According to the invention, fluorescence signals are transmitted individually into the Nucleic acid chain of incorporated NTs * preferably with one Wide-field fluorescence microscope or a laser scanning Microscope or a TIRF microscope (Total Internal Reflection Fluorescence Microscope).
Es sind verschiedene Varianten der Konstruktion einer solchen
Apparatur möglich (Weston et al. J. Chem. Phys. 1998 v. 109 S. 7474,
Trabesinger et al. Anal. Chem. 1999 v. 71 S. 279, Adachi et al.
Journal of Microscopy 1999 v. 195 S. 125, Unger et al. BioTech
niques 1999 v. 27 S. 1008, Ishijaima et al. Cell 1998 v. 92 S. 161,
Dickson et al. Science 1996 v. 274 S. 966, Tokunaga et al.
Bichem. Biophys. Res. Com. 1997 v. 235 S. 47, "Confocal Laser Scanning
Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New
Techniques of optical microscopy and microspectroscopy" 1991 Ed.
R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed.
Herman BIOS Scientific Publishers, "Handbook of biological
confocal microscopy" 1995 J. Pawley Plenum Press). Unterschiede
in ihrem konkreten Aufbau ergeben sich aus der Variation ihrer
Einzelteile. Die Vorrichtung für das Anregungslicht kann z. B. auf
der Basis eines Lasers, einer Lampe oder von Dioden funktionie
ren. Für die Detektionsvorrichtung können sowohl CCD-Kameras als
auch PMT dienen. Andere Beispiele für technische Details siehe
("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS
Scientific Publishers, "New Techniques of optical microscopy and
microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluores
cence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers,
"Handbook of biological confocal microscopy" 1995 J. Pawley Plenum
Press). Es ist nicht die Aufgabe dieser Erfindung, alle
möglichen technischen Varianten einer Detektionsvorrichtung
aufzuzählen. Der prinzipielle Aufbau einer geeigneten Apparatur
wird in einem Schema Fig. 8 erläutert. Sie besteht aus folgenden
Elementen:
1 Lichtquelle zur Anregung der Fluoreszenz
2 Lichtleitender Teil
3 Scantisch
4 Vorrichtung zur Selektion von Spektren
5 Detektionsvorrichtung
6 Computer mit Steuerungs- und Analysefunktionen
Various variants of the construction of such an apparatus are possible (Weston et al. J. Chem. Phys. 1998 v. 109 p. 7474, Trabesinger et al. Anal. Chem. 1999 v. 71 p. 279, Adachi et al. Journal of Microscopy 1999 v. 195 p. 125, Unger et al. BioTech niques 1999 v. 27 p. 1008, Ishijaima et al. Cell 1998 v. 92 p. 161, Dickson et al. Science 1996 v. 274 p. 966, Tokunaga et al. Bichem. Biophys. Res. Com. 1997 v. 235 p. 47, "Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Differences in their concrete structure result from the variation of their individual parts. The device for the excitation light can, for. B. on the basis of a laser, a lamp or diodes function. For the detection device, both CCD cameras and PMT can be used. For other examples of technical details see ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2 ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). It is not the object of this invention to list all possible technical variants of a detection device. The basic structure of a suitable apparatus is explained in a diagram in FIG. 8. It consists of the following elements: 1 light source to excite fluorescence
2 Light guiding part
3 scanning table
4 Spectra selection device
5 detection device
6 computers with control and analysis functions
Diese Elemente der Apparatur können kommerziell erworben werden (Mikroskop-Firmen: Zeiss, Leica, Nikon).These elements of the apparatus can be purchased commercially (Microscope companies: Zeiss, Leica, Nikon).
Im folgenden soll beispielsweise eine für die Detektion einzelner
Moleküle geeignete Kombination aus diesen Elementen vorgestellt
werden:
Weitfeld-Fluoreszenz-Mikroskop Axioplan 2 (Zeiss) mit Quecksil
berdampflampe
Objektiv Planneofluar 100x, NA 1.4 (Zeiss)
Kamera Photometrix
Computer mit Software zur Steuerung und AnalyseIn the following, for example, a combination of these elements suitable for the detection of individual molecules will be presented:
Axioplan 2 (Zeiss) wide-field fluorescence microscope with mercury vapor lamp
Lens Planneofluar 100x, NA 1.4 (Zeiss)
Photometrix camera
Computer with software for control and analysis
Nachfolgend soll die Vorgehensweise bei der Detektion erläutert werden. Man beachte dabei die allgemeinen Regeln der Fluo reszezmikroskopie ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press).The procedure for detection is explained below become. Note the general rules of the fluo Resence microscopy ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy "1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2nd ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press).
Die Detektion umfaßt folgende Phasen:
The detection comprises the following phases:
- 1. Vorbereitung zur Detektion1. Preparation for detection
-
2. Durchführung eines Detektionsschrittes in jedem Zyklus,
wobei jeder Detektionsschritt als Scanvorgang abläuft und
folgende Operationen umfaßt:
- a) Einstellung der Position des Objektivs (X,Y-Achse),
- b) Einstellung der Fokusebene (Z-Achse),
- c) Detektion der Signale einzelner Moleküle, Zuordnung des Signals zu NT* und Zuordnung des Signals zum jeweiligen NSKF,
- d) Verschiebung zur nächsten Position auf der Oberfläche.
- a) Setting the position of the lens (X, Y axis),
- b) setting the focal plane (Z axis),
- c) detection of the signals of individual molecules, assignment of the signal to NT * and assignment of the signal to the respective NSKF,
- d) Shift to the next position on the surface.
Die Signale von in die NSKFs eingebauten NTs* werden durch das Abscannen der Oberfläche registriert. Der Scanvorgang kann in verschiedener Weise ausgeführt werden ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). Vorzugsweise wird ein diskontinuierlicher Scanvorgang gewählt. Dabei wird das Objektiv schrittweise über die Oberfläche bewegt (Fig. 8a), so daß von jeder Oberflächenposition ein zweidimensionales Bild (2D- Bild) entsteht (Fig. 8b, c). The signals from NTs * built into the NSKFs are registered by scanning the surface. The scanning process can be carried out in various ways ("Confocal Laser Scanning Microscopy" 1997 Ed. Sheppard, BIOS Scientific Publishers, "New Techniques of optical microscopy and microspectroscopy" 1991 Ed. R. Cherry CRC Press, Inc., "Fluorescence microscopy" 1998 2. ed. Herman BIOS Scientific Publishers, "Handbook of biological confocal microscopy" 1995 J. Pawley Plenum Press). A discontinuous scanning process is preferably selected. The lens is moved step by step over the surface ( FIG. 8a), so that a two-dimensional image (2D image) is produced from each surface position ( FIG. 8b, c).
Dieses 2D-Bild kann mit verschiedenen Methoden erstellt werden: z. B. durch den Laser-Scan einer Position des Mikroskopfeldes (Laser-Scanning-Microskopie) oder durch eine Kameraaufnahme an einer Position (vgl. Handbücher der Mikroskopie). Als Beispiel wird die Detektion einzelner Moleküle mit einer CCD-Kamera beschrieben.This 2D image can be created using various methods: z. B. by the laser scan of a position of the microscope field (Laser scanning microscopy) or through a camera recording a position (cf. microscopy manuals). As an an example is the detection of individual molecules with a CCD camera described.
Die Detektion wird am Beispiel der Sequenzierung eines 1 Mb langen DNA-Stücks erläutert:The detection is based on the example of sequencing a 1 Mb long DNA piece explained:
Am Anfang wird festgelegt, wie viele NSKFs zur Rekonstruktion der ursprünglichen Sequenz analysiert werden müssen. Im Fall einer Rekonstruktion nach dem Schrotschuß-Verfahren ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257) spielen folgende Faktoren eine Rolle: 1) Von jedem NSKF wird bei der Sequenzierung eine Sequenz von ca. 300-500 NTs bestimmt. 2) Die Gesamtlänge der zu analysie renden Sequenz ist wichtig. 3) Bei der Sequenzierung muß ein bestimmtes Maß an Redundanz erreicht werden, um die Genauigkeit zu steigern und eventuelle Fehler zu korrigieren. Insgesamt ist zur Rekonstruktion des größten Teils der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforderlich, d. h. bei diesem Beispiel mit einer Mb, werden 10 bis 100 Mb Rohsequenzdaten gebraucht. Bei einer durchschnittlichen Sequenz länge von 400 bp pro NSKF benötigt man entsprechend 25 000 bis 250 000 DNA-Fragmente.At the beginning it is determined how many NSKFs to reconstruct the original sequence must be analyzed. In the case of one Reconstruction according to the shotgun method ("Automated DNA sequencing and analysis "p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257) the following factors play a role Role: 1) Each NSKF becomes a sequence when sequencing of approximately 300-500 NTs. 2) The total length of the analysis sequence is important. 3) When sequencing a certain level of redundancy can be achieved to the accuracy to increase and correct any errors. Overall is to reconstruct most of the original sequence about 10 to 100 times the amount of raw sequences required, d. H. in this example with one Mb, 10 to 100 Mb Raw sequence data needed. With an average sequence Lengths of 400 bp per NSKF are required from 25,000 to 250,000 DNA fragments.
Zur Sequenzierung müssen die Positionen der NSKFs bestimmt wer den, damit man eine Grundlage für die Zuordnung der Signale hat. Die Kenntnis dieser Positionen erlaubt eine Aussage darüber, ob die Signale einzelner Moleküle von eingebauten NTs* stammen oder von zufällig an die Oberfläche gebundenen NTs*. Diese Positionen können mit verschiedenen Methoden identifiziert werden. The positions of the NSKFs must be determined for sequencing, so that one has a basis for the assignment of the signals. Knowing these positions allows a statement to be made as to whether the signals of individual molecules come from built-in NTs * or from randomly bound NTs * . These positions can be identified using various methods.
In einer bevorzugten Ausführungsform werden die Positionen immo bilisierter NSKF während der Sequenzierung identifiziert. Dabei wird die Tatsache genutzt, daß die Signale von den in die Nu kleinsäurekette eingebauten NTs* immer dieselben Koordinaten haben. Das ist durch die Fixierung der Nukleinsäureketten ge währleistet. Die unspezifisch gebundenen NTs* binden zufällig an verschieden Stellen der Oberfläche.In a preferred embodiment, the positions are immo bilized NSKF identified during sequencing. there the fact is used that the signals from the Nu Small acid chain built NTs * always the same coordinates to have. This is due to the fixation of the nucleic acid chains guaranteed. The non-specifically bound NTs * bind at random different places on the surface.
Zur Identifizierung der Positionen von fixierten NSKFs werden die Signale auf Übereinstimmung ihrer Koordinaten aus mehreren aufeinander folgenden Zyklen überprüft. Das kann z. B. am Anfang der Sequenzierung erfolgen. Die übereinstimmende Koordinaten werden als Koordinaten der DNA-Fragmente bewertet und gespei chert.To identify the positions of fixed NSKFs, the Signals matching their coordinates from several consecutive cycles checked. That can e.g. B. at the beginning sequencing. The matching coordinates are evaluated and saved as coordinates of the DNA fragments chert.
Das Scan-System muß reproduzierbar über mehrere Zyklen die Ober fläche abscannen können. X, Y und Z-Achsen-Einstellungen an jeder Oberflächenposition können von einem Computer kontrolliert wer den. Stabilität und Reproduzierbarkeit der Einstellung von Ob jektivpositionen in jedem Scanvorgang entscheiden über die Qua lität der Detektion und somit über die Identifizierung der Si gnale einzelner Moleküle.The scan system must be reproducible over several cycles can scan the surface. X, Y and Z axis settings on each Surface position can be controlled by a computer the. Stability and reproducibility of the setting of Ob Lens positions in each scan process determine the quality lity of detection and thus the identification of the Si single molecules.
Die mechanische Instabilität der kommerziell erhältlichen Scan tische und die geringe Reproduzierbarkeit der wiederholten Ein stellung derselben X, Y-Positionen machen eine präzise Analysen der Signale einzelner Moleküle über mehrere Zyklen schwierig. Es existieren viele Möglichkeiten, eine Übereinstimmung der Koor dinaten bei wiederholten Einstellungen zu verbessern bzw. mögli che Abweichungen zu kontrollieren. Als Beispiel wird eine Kontrollmöglichkeit angeführt. Nach einer groben mechanischen Einstellung der Objektivposition wird ein Kontrollbild von einem mit der Oberfläche fest verbundenen Muster gemacht. Auch wenn die mechanische Einstellung nicht exakt dieselben Koordinaten aufweist (Abweichungen bis zu 10 µm sind durchaus möglich), kann man mittels optischer Kontrolle eine Korrektur vornehmen. Das Kontrollbild vom Muster dient als Koordinatensystem für das Bild mit Signalen von eingebauten NTs*. Eine Voraussetzung für eine solche Korrektur ist, daß keine weiteren Bewegungen der Ober fläche zwischen diesen beiden Aufnahmen gemacht werden. Signale von einzelnen Molekülen werden in Relation zum Muster gesetzt, so daß eine X, Y-Abweichung in der Musterposition gleiche X, Y- Abweichung in der Position der Signale einzelner Moleküle bedeu tet. Das Kontrollbild vom Muster kann vor, während oder nach der Detektion einzelner Moleküle gemacht werden. Ein solches Kon trollbild muß entsprechend bei jeder Einstellung auf einer neuen Oberflächenposition gemacht werden.The mechanical instability of the commercially available scan tables and the low reproducibility of repeated inputs Positioning the same X, Y positions make a precise analysis of single molecule signals over multiple cycles difficult. It there are many ways to match the Koor dinaten to improve with repeated settings or poss control deviations. As an example, one Control option mentioned. After a rough mechanical Setting the lens position becomes a control image of a made patterns firmly attached to the surface. Even if the mechanical adjustment not exactly the same coordinates exhibits (deviations up to 10 µm are quite possible), can make a correction using optical control. The The control image from the sample serves as the coordinate system for the image with signals from built-in NTs *. A prerequisite for one such correction is that no further movements of the waiter area between these two shots. signals of individual molecules are placed in relation to the pattern, so that an X, Y deviation in the pattern position is equal to X, Y- Deviation in the position of the signals of individual molecules is important tet. The control image of the pattern can be before, during or after the Detection of individual molecules can be made. Such a con trollbild must accordingly with each setting on a new one Surface position can be made.
Die Oberfläche ist nicht absolut plan und weist verschiedene Unebenheiten auf. Dadurch verändert sich der Oberfläche-Objektiv- Abstand beim abscannen benachbarter Stellen. Diese Unterschiede im Abstand können dazu führen, daß einzelne Moleküle die Fokusebene verlassen und so der Detektion entgehen.The surface is not absolutely flat and has different features Bumps on. This changes the surface lens Distance when scanning neighboring places. Those differences at a distance, individual molecules can cause the Leave the focal plane and thus avoid detection.
Aus diesem Grund ist es wichtig, daß beim Abscannen der Ober fläche eine reproduzierbare Einstellung der Fokusebene an jeder Objektivposition erreicht wird.For this reason it is important that when scanning the upper a reproducible setting of the focus level on each Lens position is reached.
Es gibt verschiedene Möglichkeiten, die Fokusebene reproduzierbar einzustellen. Beispielsweise kann folgende Methode angewendet werden: Da die Anregung einzelner Moleküle zum Auslöschen ihrer Fluoreszenz führen kann, wird auf die Oberfläche ein Marker aufgebracht, der zur Einstellung der Fokusebene dient. Danach erfolgt die Detektion der Signale einzelner Moleküle. Der Marker kann beliebiger Natur sein (z. B. Farbstoff oder Muster), darf aber die Detektion und die Reaktion nicht beeinträchtigen.There are various ways to make the focus level reproducible adjust. For example, the following method can be used : Because the excitation of individual molecules to extinguish their Fluorescence can result in a marker on the surface applied, which is used to adjust the focus level. After that the signals of individual molecules are detected. The marker can be of any nature (e.g. dye or pattern), may but do not interfere with detection and response.
Das mit Hilfe des Detektionssystems erzeugte zweidimensionale
Bild der Reaktionsoberfläche enthält die Signalinformationen von
in die NSKFs eingebauten NT*s. Diese müssen vor der weiteren
Verarbeitung aus der Gesamtdatenmenge der Bildinformationen mit
geeigneten Methoden extrahiert werden. Die dazu notwendigen
Algorithmen zur Skalierung, Transformation und Filterung der
Bildinformationen zählen zum Standardrepertoir der digitalen
Bildverarbeitung und Mustererkennung (Haberäcker P. "Praxis der
Digitalen Bildverarbeitung und Mustererkennung". Hanser-Verlag,
München, Wien, 1995; Galbiati L. J. "Machine vision and digital
image processing fundamentals". Prentice Hall, Englewood Cliffs,
New Jersey, 1990). Die Signalextraktion erfolgt vorzugsweise über
ein Grauwertbild, das die Helligkeitsverteilung der Reaktions
oberfläche für den jeweiligen Fluoreszenzkanal abbildet. Wenn bei
der Sequenzierungsreaktion mehrere Nukleotide mit unterschied
lichen Fluoreszenz-Farbstoffen verwendet werden, kann zunächst
für jedes verwendete fluoreszenzmarkierte Nukleotid (A, T, C, G oder
U) ein separates Grauwert-Bild erzeugt werden. Dafür können
prinzipiell 2 Verfahren angewendet werden:
The two-dimensional image of the reaction surface generated with the aid of the detection system contains the signal information from NT * s built into the NSKFs. Before further processing, these must be extracted from the total amount of image information using suitable methods. The algorithms required for scaling, transforming and filtering the image information are part of the standard repertoire of digital image processing and pattern recognition (Haberäcker P. "Practice of digital image processing and pattern recognition". Hanser-Verlag, Munich, Vienna, 1995; Galbiati LJ "Machine vision and digital image processing fundamentals ". Prentice Hall, Englewood Cliffs, New Jersey, 1990). The signal extraction is preferably carried out via a gray value image, which depicts the brightness distribution of the reaction surface for the respective fluorescence channel. If several nucleotides with different fluorescent dyes are used in the sequencing reaction, a separate gray value image can first be generated for each fluorescence-labeled nucleotide (A, T, C, G or U). In principle, two methods can be used for this:
- 1. Durch Verwendung von geeigneten Filtern (Zeiss-Filtersätze) wird für jeden Fluoreszenzkanal ein Grauwertbild erzeugt.1. By using suitable filters (Zeiss filter sets) a gray-scale image is generated for each fluorescence channel.
- 2. Aus einem aufgenommenen Mehrkanal-Farb-Bild werden mit Hilfe eines geeigneten Algorithmus durch ein Bildverarbeitungsprogramm die relevanten Farbkanäle extrahiert und jeweils als Grauwertbild einzeln weiterverarbeitet. Zur Kanalextraktion wird dabei ein für den jeweiligen Kanal spezifischer Farb-Schwellwertalgorithmus eingesetzt. So entstehen zunächst aus einem Mehrkanal-Farbbild einzelne Grauwertbilder 1 bis N. Diese Bilder definieren sich wie folgt:2. Using a captured multi-channel color image a suitable algorithm by an image processing program the relevant color channels extracted and each as a gray scale image processed individually. A channel extraction is used for the respective channel-specific color threshold algorithm used. This is how a multi-channel color image is created individual gray-scale images 1 to N. These images are defined as follows:
GBN GB N
= (s(x, y)) einkanaliges Grauwertbild
N{1, . . ., Anzahl der Fluoreszenzkanäle}.
M = {0, 1, . . ., 255} Grauwertmenge
S = (s(x, y)) Bildmatrix des Grauwertbildes
x = 0, 1, . . ., L-1 Bildzeilen
y = 0, 1, . . ., R-1 Bildspalten
(x, y) Ortskoordinaten eines Bildpunktes
s(x, y) ∈ M Grauwert des Bildpunktes.
= (s (x, y)) single-channel gray value image
N {1,. , ., Number of fluorescence channels}.
M = {0, 1,. , ., 255} Gray value set
S = (s (x, y)) image matrix of the gray scale image
x = 0, 1,. , ., L-1 image lines
y = 0, 1,. , ., R-1 image columns
(x, y) location coordinates of a pixel
s (x, y) ∈ M gray value of the pixel.
Aus dieser Datenmenge wird nun durch ein geeignetes Programm die relevante Bildinformation extrahiert. Ein solches Programm sollte folgende Arbeitsschritte realisieren:This amount of data is then converted into a suitable program relevant image information extracted. Such a program should implement the following steps:
Für GB1 bis GBN durchführen:
For GB 1 to GB N :
- A) Vorverarbeitung des Bildes, so zum Beispiel gegebenenfalls Reduktion des durch die Digitalisierung der Bildinformation entstandenen Bildrauschens, etwa durch Grauwertglättung.A) preprocessing the image, for example if necessary Reduction of the by digitizing the image information resulting image noise, for example by gray value smoothing.
- B) Prüfung jedes Bildpunkt (x, y) des Grauwertbildes, ob dieser Punkt im Zusammenhang mit den ihn umgebenden unmittelbaren und weiter entfernten Nachbarbildpunkten die Eigenschaften eines Fluoreszenzpunktes erfüllt. Diese Eigenschaften hängen unter anderem von der verwendeten Detektionsapparatur und der Auflösung des Grauwertbildes ab. Sie können beispielsweise ein typisches Verteilungsmuster von Helligkeits-Intensitätswerten über einer den Bildpunkt umgebenden Matrix darstellen. Die dazu verwendbaren Methoden der Bildsegmentierung reichen von einfachen Schwellwert verfahren bis hin zur Verwendung neuronaler Netze.B) Checking each pixel (x, y) of the gray value image, whether this Point related to the immediate and surrounding further away neighboring pixels the properties of a Fluorescence point met. These properties depend on other of the detection equipment used and the resolution of the gray scale image. For example, you can use a typical Distribution pattern of brightness intensity values over one represent the matrix surrounding the pixel. The usable ones Image segmentation methods range from simple threshold process up to the use of neural networks.
Erfüllt ein Bildpunkt (x, y) diese Anforderungen, dann folgt ein Vergleich mit den Koordinaten von in bisher durchgeführten Sequenzierungszyklen identifizierten NSKFs. Bei einer Über einstimmung erfolgt die Zuordnung des Signals mit dem aus dem jeweiligen Fluoreszenzkanal hervorgehenden Nukleotid zu diesem NSKF. Signale mit nicht übereinstimmenden Koordinaten werden als Hintergrundsignale bewertet und verworfen. Die Analyse der Signale kann parallel zum Scanvorgang erfolgen.If a pixel (x, y) fulfills these requirements, then follows Comparison with the coordinates of previously performed in Sequencing cycles identified NSKFs. With an over the signal is matched with that from the respective fluorescence channel emerging nucleotide to this NACF. Signals with mismatched coordinates are shown as Background signals evaluated and rejected. The analysis of the Signals can be made in parallel with the scanning process.
In einer beispielhaften Ausführung wurde ein 8-Bit-Grauwertbild mit einer Auflösung von 1317 × 1035 Pixel verwendet. Um die durch die Digitalisierung entstandenen Veränderungen am Bild zu reduzieren, erfolgte zunächst eine Vorverarbeitung des Gesamt bildes: Jedem Bildpunkt wurde der Mittelwert der Helligkeiten seiner 8-Nachbarn zugewiesen. Bei der gewählten Auflösung entsteht dadurch ein für einen Fluoreszenzpunkt typisches Muster eines zentralen Bildpunkt mit dem größten Helligkeitswert und Nachbarbildpunkten mit nach allen Seiten hin abfallenden Helligkeiten. Erfüllte ein Bildpunkt diese Kritierien und Überschritt der zentrifugale Helligkeitsabfall einen bestimmten Schwellenwert (zur Exklusion zu schwacher Fluoreszenzpunkte), dann wurde dieser zentrale Bildpunkt als Koordinate eines Fluoreszenzpunktes gewertet.In an exemplary embodiment, an 8-bit gray scale image was created with a resolution of 1317 × 1035 pixels. To the through digitization has brought about changes in the image reduce, the whole was preprocessed picture: Each pixel was the mean of the brightness assigned to its 8 neighbors. At the chosen resolution this creates a pattern typical of a fluorescence spot a central pixel with the greatest brightness value and Neighbor pixels with falling on all sides Brightness. Did a pixel meet these criteria and The centrifugal drop in brightness exceeded a certain one Threshold (to exclude weak fluorescence spots), then this central pixel became the coordinate of one Fluorescence point scored.
- a) Verschiebung des Objektivs zur nächsten Position auf der Oberfläche. Nach der Detektion der Signale einzelner Moleküle wird das Objektiv über einer anderen Position der Oberfläche positioniert.a) Moving the lens to the next position on the Surface. After the detection of the signals of individual molecules the lens will be over a different position of the surface positioned.
Insgesamt kann beispielsweise eine Folge von Aufnahmen mit der Kontrolle der X, Y-Position, der Einstellung der Fokusebene und mit der Detektion einzelner Moleküle bei jeder neuen Objek tivposition gemacht werden. Diese Schritte können durch einen Computer gesteuert werden.Overall, for example, a sequence of recordings with the Control of the X, Y position, the adjustment of the focus plane and with the detection of individual molecules for each new object active position. These steps can be done by one Computer controlled.
Der Scanvorgang sowie die biochemische Reaktion nehmen eine gewisse Zeit in Anspruch. Wenn man diese Vorgänge nacheinander schaltet, kann man eine optimale Leistung der Apparatur errei chen. In einer bevorzugten Ausführung wird die Reaktion auf zwei getrennten Oberflächen durchgeführt (Fig. 9).The scanning process and the biochemical reaction take a certain amount of time. If you switch these processes one after the other, you can achieve optimal performance of the equipment. In a preferred embodiment, the reaction is carried out on two separate surfaces ( FIG. 9).
Als Beispiel kann eine Oberfläche mit immobilisierten NSKFs in 2 räumlich isolierte Teile getrennt werden, so daß Reaktionen auf diesen beiden Teilen unabhängig voneinander ablaufen können. In einem anderen Beispiel können NSKFs auch von vornherein auf 2 getrennten Oberflächen immobilisiert werden.As an example, a surface with immobilized NSKFs in 2 spatially isolated parts are separated so that reactions to these two parts can run independently. In In another example, NSKFs can also be set to 2 from the start separate surfaces can be immobilized.
Danach wird die Reaktion gestartet. Das Prinzip dabei ist, daß während auf einem Teil der Oberfläche die Reaktions- und Wasch schritte ablaufen, der zweite Teil abgescannt wird. Dadurch kann man einen kontinuierlichen Ablauf der Analyse erreichen und die Geschwindigkeit der Sequenzierung steigern. The reaction is then started. The principle here is that while on part of the surface the reaction and washing steps, the second part is scanned. This can to achieve a continuous flow of analysis and the Increase the speed of sequencing.
Die Anzahl der Oberflächen, auf denen die Reaktion abläuft, kann auch größer als 2 sein. Das erscheint dann sinnvoll, wenn die Reaktion als zeitlich limitierender Schritt auftritt, d. h. die Detektion der Signale auf der Oberfläche schneller als die Reak tions- und Waschschritte abläuft. Um die Gesamtdauer der Reaktion an die Detektionsdauer anzupassen, kann jeder einzelne Schritt der Reaktion auf einer einzelnen Oberfläche mit einer zeitlichen Verzögerung im Vergleich zur nächsten Oberfläche ablaufen.The number of surfaces on which the reaction takes place can also be larger than 2. That makes sense if the Reaction occurs as a time-limiting step, d. H. the Detection of signals on the surface faster than the reak tion and washing steps. To the total duration of the reaction Each step can be adapted to the detection duration the reaction on a single surface with a temporal Delay compared to the next surface expire.
Die Erfindung wird nachfolgend anhand von Beispielen verdeut licht.The invention is illustrated below using examples light.
Modifiziertes dUTP mit einem langen spaltbaren Linker (Fig. 7f-1) Als Ausgangssubstanzen dienen 5-(3-Aminoallyl)-2'-deoxyuridin- 5'-triphosphat, AA-dUTP, (Sigma), 3,3'-Dithio-bis(propionsäure- N-Nydroxysuccinimidester), DTBP-NHS, (Sigma), 2-Mercaproethanol amin, MEA, (Sigma). Zu 100 µl 50 mM Lösung von AA-dUTP in 100 mM Borat-Puffer pH 8.5 werden 3 Äquivalente an DTBP-NHS in DMF (25 µl 0.4M Lösung) zugegeben. Das Reaktionsgemisch wird 4 Stunden bei RT. inkubiert. Anschließend wird konz. Ammonium acetat-Lösung (pH 9) zugegeben bis die Gesamtkonzentration an CH3COONH4 in der Reaktionslösung 100 mM ist, und die Reaktion wird eine weitere Stunde inkubiert. Danach werden zu diesem Gemisch 200 µl 1M MEA-Lösung, pH 9, zugegeben und eine Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die Iodfarbe bestehen bleibt. Die modifizierten Nukleotide werden auf einer DEAE-Cellulose-Säule in Ammoniumcarbonat-Gradient (pH 8.5) von anderen Reaktionsprodukten abgetrennt. Isolierung des Nukleotids mit dem spaltbaren Linker erfolgt auf RP-HPLC. An diesen Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in Enzymology 1997, v. 278, S. 363).Modified dUTP with a long cleavable linker ( Fig. 7f-1) 5- (3-aminoallyl) -2'-deoxyuridine- 5'-triphosphate, AA-dUTP, (Sigma), 3,3'-dithio- are used as starting substances. bis (propionic acid-N-hydroxysuccinimide ester), DTBP-NHS, (Sigma), 2-mercaproethanol amine, MEA, (Sigma). 3 equivalents of DTBP-NHS in DMF (25 µl 0.4M solution) are added to 100 µl 50 mM solution of AA-dUTP in 100 mM borate buffer pH 8.5. The reaction mixture is 4 hours at RT. incubated. Then conc. Ammonium acetate solution (pH 9) is added until the total concentration of CH 3 COONH 4 in the reaction solution is 100 mM, and the reaction is incubated for an additional hour. Then 200 μl of 1M MEA solution, pH 9, are added to this mixture and incubated for one hour at RT. A saturated solution of I 2 in 0.3M KI solution is then added dropwise to this mixture until the iodine color remains. The modified nucleotides are separated from other reaction products on a DEAE cellulose column in an ammonium carbonate gradient (pH 8.5). The nucleotide with the cleavable linker is isolated on RP-HPLC. Dyes can now be coupled to this linker using various methods ("Handbook of Fluorescent Probes and Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, p. 362, Jameson et al. Method in Enzymology 1997, v. 278, p. 363).
Auch andere Nukleotidanaloga (z. B. nach Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356) können in die Reaktion eingesetzt werden, so daß Nukleotidanaloga mit Struktu ren in Fig. 7f-2, 3, 4 und 7g-1, 2 erzeugt werden können.Other nucleotide analogs (e.g. according to Hobbs et al. US Patent 5,047,519, Khan et al. US Patent 5,821,356) can also be used in the reaction, so that nucleotide analogs with structures in FIGS . 7f-2, 3, 4 and 7g -1, 2 can be generated.
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-isothiocyanat) angegeben (NT*-Struktur Fig. 7j)The coupling of TRITC (tetramethylrhodamine isothiocyanate) is given as an example of the coupling of a dye to the linker (NT * structure Fig. 7j)
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 µl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*). Dazu werden 10 µl 10 mM TRITC in Dimethylformamid (DMF) gegeben und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten.The dNTP (300 nmol) modified with the cleavable linker becomes dissolved in 30 ul 100 mM sodium borate buffer pH 9 (10 mM NT *). 10 µl of 10 mM TRITC in dimethylformamide (DMF) are added and incubated at RT for 4 h. Cleaning the with the dye modified NT * takes place via RP-HPLC in a methanol-water Gradient.
Beispiel der Spaltung der Disulphidverbindung im modifizierten NT*. Die Spaltung erfolgt durch eine Zugabe von 20 bis 50 mM Dithiothreitol-Lösung DTT (Sigma) Lösung pH 8 auf die Reaktions oberfläche. Die Oberfläche wird 10 min. mit dieser Lösung inkubiert, danach wird die Lösung entfernt und die Oberfläche mit einer Pufferlösung zur Entfernung von DTT-Resten gewaschen.Example of cleavage of the disulphide compound in the modified NT * . The cleavage is carried out by adding 20 to 50 mM dithiothreitol solution DTT (Sigma) solution pH 8 to the reaction surface. The surface is 10 min. incubated with this solution, then the solution is removed and the surface washed with a buffer solution to remove DTT residues.
Modifiziertes dUTP (dUTP-SS-CH2CH2NH2) mit einem kurzen spaltbaren Linker (Fig. 7e-1). Als Ausgangssubstanzen dienen: Bis-dUTP, synthetisiert nach Hanna (Method in Enzymology 1989, v. 180, S. 383), 2-Mercaptoethanolamin (MEA) (Sigma).Modified dUTP (dUTP-SS-CH 2 CH 2 NH 2 ) with a short cleavable linker ( Fig. 7e-1). The starting substances are: bis-dUTP, synthesized according to Hanna (Method in Enzymology 1989, v. 180, p. 383), 2-mercaptoethanolamine (MEA) (Sigma).
Zu 400 µl 100 mM Bis-dUTP in 40 mM Boratpuffer pH 8.5 werden 100 µl 100 mM MEA-Lösung pH 8.5 in H2O zugegeben und 1 Stunde bei RT inkubiert. Anschließend wird zu diesem Gemisch solange eine gesätigte Lösung an I2 in 0.3M KI-Lösung zugetropft, bis die Iodfarbe bestehen bleibt. Die Nukleotide (Bis-dUTP und dUTP-SS- CH2CH2NH2) können z. B. durch eine Ethanol-Präzipitation oder auf einer DEAE-Cellulose-Säule im Ammoniumcarbonat-Gradienten (pH 8.5) von anderen Reaktionsprodukten abgetrennt werden. Bis-dUTP stört bei der anschließenden Ankopplung eines Farbstoffs an die Aminogruppe des Linkers nicht, so daß die Abtrennung des dUTP-SS- CH2CH2NH2 von bis-dUTP im Endreinigungsschritt erfolgen kann.100 μl of 100 mM MEA solution pH 8.5 in H 2 O are added to 400 μl of 100 mM bis-dUTP in 40 mM borate buffer pH 8.5 and incubated for 1 hour at RT. A saturated solution of I 2 in 0.3M KI solution is then added dropwise to this mixture until the iodine color remains. The nucleotides (bis-dUTP and dUTP-SS-CH 2 CH 2 NH 2 ) can e.g. B. by ethanol precipitation or on a DEAE cellulose column in an ammonium carbonate gradient (pH 8.5) from other reaction products. Bis-dUTP does not interfere with the subsequent coupling of a dye to the amino group of the linker, so that the dUTP-SS-CH 2 CH 2 NH 2 can be separated from bis-dUTP in the final cleaning step.
In einer ähnlichen Weise kann auch dCTP (Fig. 7-e2) modifiziert werden, dabei dient Bis-dCTP als Ausgangssubstanz (synthetisiert nach Hanna et al. Nucleic Acid Research 1993, v. 21, S. 2073).DCTP ( Fig. 7-e2) can also be modified in a similar manner, bis-dCTP serving as the starting substance (synthesized according to Hanna et al. Nucleic Acid Research 1993, v. 21, p. 2073).
An den Linker können nun Farbstoffe mit verschiedenen Methoden gekoppelt werden ("Handbook of Fluorescent Probes und Research Chemicals" 6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, S. 362, Jameson et al. Method in Enzymology 1997, v. 278, S. 363).Dyes can now be attached to the linker using various methods be coupled ("Handbook of Fluorescent Probes and Research Chemicals "6th ed. 1996, R. Haugland, Molecular Probes, Waggoner Method in Enzymology 1995 v. 246, p. 362, Jameson et al. Method in Enzymology 1997, v. 278, p. 363).
Als Beispiel der Ankopplung eines Farbstoffs an den Linker wird
die Ankopplung des FluoroLinkTM Cy3 monofunktional dye (Amersham
Pharmacia biotech) (NT*-Struktur Fig. 71) angegeben. Das ist ein
monofunktionaler NHS-Ester-Fluoreszenzfarbstoff. Die Reaktion
wird nach Angaben des Herstellers durchgeführt:
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird
in 300 µl 100 mM Natrium-Borat-Puffer pH 8.5 aufgelöst. Dazu wird
Farbstoff (300 nmol) gegeben und 1 h bei RT inkubiert. Die
Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über
RP-HPLC in einem Methanol-Wasser Gradienten.The coupling of the FluoroLinkTM Cy3 monofunctional dye (Amersham Pharmacia biotech) (NT * structure Fig. 71) is given as an example of coupling a dye to the linker. It is a monofunctional NHS ester fluorescent dye. The reaction is carried out according to the manufacturer:
The dNTP (300 nmol) modified with the cleavable linker is dissolved in 300 ul 100 mM sodium borate buffer pH 8.5. For this, dye (300 nmol) is added and incubated for 1 h at RT. The NT * modified with the dye is cleaned by RP-HPLC in a methanol-water gradient.
Ein weiteres Beispiel der Ankopplung eines Farbstoffs an den Linker wird die Ankopplung von TRITC (Tetramethylrhodamin-5- isothiocyanat, Molecular Probes) angegeben (dUTP-SS-TRITC Fig. 7h).Another example of the coupling of a dye to the linker is the coupling of TRITC (tetramethylrhodamine-5-isothiocyanate, Molecular Probes) (dUTP-SS-TRITC Fig. 7h).
Das mit dem spaltbaren Linker modifizierte dNTP (300 nmol) wird in 30 µl 100 mM Natrium-Borat-Puffer pH 9 aufgelöst (10 mM NT*). Dazu werden 10 µl 10 mM TRITC in DMF gegeben und 4 h bei RT inkubiert. Die Reinigung des mit dem Farbstoff modifizierten NT* erfolgt über RP-HPLC in einem Methanol-Wasser Gradienten. The dNTP (300 nmol) modified with the cleavable linker becomes dissolved in 30 ul 100 mM sodium borate buffer pH 9 (10 mM NT *). 10 µl of 10 mM TRITC are added to DMF and 4 h at RT incubated. Cleaning the NT * modified with the dye takes place via RP-HPLC in a methanol-water gradient.
Bei einer bevorzugten Ausführungsform der Erfindung werden alle vier in die Reaktion eingesetzten NTs* mit Fluoreszenzfarbstoffen markiert.In a preferred embodiment of the invention, all four NTs * used in the reaction with fluorescent dyes marked.
Im folgenden soll anhand der Sequenzierung eines 1 Mb langen DNA-Stückes schematisch die Sequenzierung langer Nukleinsäu reketten dargestellt werden (Fig. 1). Der Sequenzierung liegt das Shotgun-Prinzip zugrunde ("Automated DNA sequen cing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257). Das zu analysierende Material wird für die Sequenzierungsreaktion vorbereitet, indem es in Fragmente von vorzugsweise 50 bis 1000 bp Länge zerlegt wird. Jedes Fragment wird anschließend mit einer Primerbindungsstelle und einem Primer versehen. Dieses Gemisch aus verschiedenen DNA-Fragmenten wird nun auf einer planen Oberfläche fixiert. Die nicht gebundenen DNA- Fragmente werden durch einen Waschschritt entfernt. Danach wird die Sequenzierungsreaktion an der gesamten Reaktions oberfläche durchgeführt. Zur Rekonstruktion einer 1 Mb langen DNA-Sequenz sollten die Sequenzen von NSKFs vorzugs weise länger als 300 NTs sein, durchschnittlich ca. 400 bp. In the following, the sequencing of long nucleic acid chains will be shown schematically based on the sequencing of a 1 Mb long piece of DNA ( FIG. 1). The sequencing is based on the shotgun principle ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257). The material to be analyzed is prepared for the sequencing reaction by breaking it down into fragments of preferably 50 to 1000 bp in length. Each fragment is then provided with a primer binding site and a primer. This mixture of different DNA fragments is now fixed on a flat surface. The unbound DNA fragments are removed by a washing step. The sequencing reaction is then carried out on the entire reaction surface. To reconstruct a 1 Mb long DNA sequence, the sequences of NSKFs should preferably be longer than 300 NTs, on average approx. 400 bp.
Da pro Zyklus nur jeweils ein markiertes NT* eingebaut wird, sind mindestens 400 Zyklen zur Sequenzierung notwendig.Since only one marked NT * is installed per cycle, at least 400 cycles are required for sequencing.
Insgesamt ist zur Rekonstruktion der ursprünglichen Sequenz die etwa 10- bis 100-fache Menge an Rohsequenzen erforder lich, d. h. 10 bis 100 Mb. Bei einer durchschnittlichen Sequenzlänge von ca. 400 bp pro NSKF benötigt man entspre chend 25 000 bis 250 000 DNA-Fragmente, um mehr als 99,995% der Gesamtsequenz abzudecken.Overall, the original sequence is to be reconstructed which requires approximately 10 to 100 times the amount of raw sequences Lich, d. H. 10 to 100 Mb. At an average A sequence length of approx. 400 bp per NSKF is required accordingly 25,000 to 250,000 DNA fragments by more than 99.995% to cover the entire sequence.
Die ermittelten NSKF-Sequenzen stellen eine Population von überlappenden Teilsequenzen dar, die sich mit kommerziell erhältlichen Programmen zur Gesamtsequenz der NSK zusammen fügen lassen ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).The NSKF sequences determined represent a population of overlapping partial sequences that deal with commercial available programs to the total sequence of the NSK together have added ("Automated DNA sequencing and analysis" p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. genome Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 p. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257).
In einer bevorzugten Ausführungsform können statt einer Sequenz mehrere Sequenzen in einem Ansatz analysiert werden. Die ursprünglichen Sequenzen können aus den gewonnen Rohdaten z. B. nach dem Schrotschuß-Prinzip rekonstruiert werden.In a preferred embodiment, instead of one Sequence multiple sequences can be analyzed in one approach. The original sequences can be obtained from the Raw data e.g. B. reconstructed according to the shotgun principle become.
Zunächst werden NSKFs erzeugt. Man kann z. B. mRNA in eine doppelsträngige cDNA überführen und diese cDNA mit Ul traschall fragmentieren. Anschließend werden diese NSKFs mit einer Primerbindungsstelle versehen, denaturiert, immobili siert und mit einem Primer hybridisiert. Zu beachten ist bei dieser Variante der Probenvorbereitung, daß die cDNA- Moleküle unvollständige mRNA-Sequenzen darstellen können (Method in Enzymology 1999, v. 303, S. 19 und andere Artikel in diesem Band, "cDNA library protocols" 1997 Humana Press). First, NSKFs are created. You can e.g. B. mRNA in a Transfer double-stranded cDNA and this cDNA with Ul fragmenting sonic. Then these NSKFs with provided a primer binding site, denatured, immobilized and hybridized with a primer. Please note at this variant of sample preparation that the cDNA Molecules can represent incomplete mRNA sequences (Method in Enzymology 1999, v. 303, p. 19 and other articles in this volume, "cDNA library protocols" 1997 Humana Press).
Eine andere Möglichkeit bei der Generierung einzelsträngiger NSKFs von mRNA besteht in der reversen Transkription der mRNA mit randomisierten Primern. Dabei werden viele relativ kurze antisense DNA-Fragmente gebildet (Zhang-J et al. Biochem. J. 1999 v. 337 S. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 S. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 S. 264, Decraene et al. Biotechniques 1999 v. 27 S. 962). Diese Fragmente können anschließend mit einer Primerbindungstelle versehen werden (s. o). Weitere Schritte entsprechen oben beschriebenen Vorgängen. Mit dieser Methode können komplette mRNA-Sequenzen (vom 5'- bis zum 3'-Ende) analysiert werden, da die randomisierten Primer über die gesamte Länge der mRNA binden.Another possibility when generating single-stranded NSKFs of mRNA consist in the reverse transcription of the mRNA with randomized primers. Many become relative short antisense DNA fragments formed (Zhang-J et al. Biochem. J. 1999 v. 337 p. 231, Ledbetter et al. J. Biol. Chem. 1994 v. 269 p. 31544, Kolls et al. Anal. Biochem. 1993 v. 208 P. 264, Decraene et al. Biotechniques 1999 v. 27 p. 962). This Fragments can then be linked to a primer be provided (see above). Further steps are the same as above described operations. With this method you can complete mRNA sequences (from the 5 'to the 3' end) are analyzed, since the randomized primers span the entire length of the mRNA tie.
Immobilisierte NSKFs werden mit einer der oben angeführten Ausführungsformen der Sequenzierung analysiert. Da mRNA- Sequenzen wesentlich weniger repetitive Sequenzen aufweisen als z. B. genomische DNA, kann die Anzahl der detektierten Signale der eingebauten NTs* von einem NSKF geringer als 300 sein und liegt vorzugsweise zwischen 20 und 1000. Die Anzahl der NSKFs, die analysiert werden müssen, errechnet sich nach denselben Prinzipien wie bei einer Schrotschuß-Rekonstruk tion einer langen Sequenz.Immobilized NSKFs are listed with one of the above Embodiments of sequencing analyzed. Because mRNA Sequences have significantly fewer repetitive sequences as z. B. genomic DNA, the number of detected Signals of the built-in NTs * from an NSKF less than 300 and is preferably between 20 and 1000. The number the NSKFs that need to be analyzed are calculated the same principles as for a shotgun reconstruction tion of a long sequence.
Aus NSKF-Sequenzen werden nach den Prinzipien des Schrot schuß-Verfahrens die ursprünglichen Gensequenzen rekon struiert.NSKF sequences are made according to the principles of the shot shot method to reconstruct the original gene sequences struiert.
Diese Methode erlaubt die gleichzeitige Sequenzierung von vielen mRNAs ohne vorherige Klonierung.This method allows the sequencing of many mRNAs without prior cloning.
Die Bestätigung einer bereits bekannten Sequenz oder der Nachweis von Varianten dieser Sequenz stellt sehr viel geringere Ansprüche an die Länge und Redundanz der ermittel ten NSKFs. Auch die Sequenzbearbeitung ist in diesem Fall einfacher. Die Vollsequenz braucht nicht neu rekonstruiert zu werden. Die NSKF-Sequenzen werden vielmehr mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z. B. BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).Confirmation of an already known sequence or the Detection of variants of this sequence represents a great deal lower demands on the length and redundancy of the determined ten NSKFs. Sequence editing is also in this case easier. The full sequence does not need to be reconstructed to become. The NSKF sequences are rather using a commercially available full sequence program assigned and any deviations detected. a such a program can e.g. B. BLAST or FASTA algorithm underlying ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).
Die zu analysierende Sequenz wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequenziert. Anschließend werden die ermittelten Sequenzen von NSKFs nicht nach dem Schrot schuß-Verfahren zusammengestzt, sondern mit der Referenz sequenz verglichen und auf diese Weise ihren Positionen in der Vollsequenz zugeordnet. Dabei kann es sich um genomische oder cDNA-Sequenzen handeln.The sequence to be analyzed is in NSKFs with one of the shared above method. These NSKFs are with the sequenced inventive methods. Then be the sequences of NSKFs not determined after the shot shot method, but with the reference sequence and in this way their positions in assigned to the full sequence. This can be genomic or cDNA sequences.
Im Gegensatz zu einer Rekonstruktion nach dem Schrotschuß- Verfahren braucht man für die Analyse einer Sequenzvariante erheblich weniger Rohsequenzdaten. So kann die 5- bis 10- fache Rohsequenzmenge ausreichend für die Wiederherstellung einer neuen Variante einer Vollsequenz sein. Mit dem Schrot schuß-Verfahren wird für eine Wiederherstellung eine 10- bis 100-fache Menge an Rohsequenzen benötigt ("Automated DNA sequencing and analysis" S. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 S. 868, Huang Genomics 1996 v. 33 S. 21, Bonfield et al. NAR 1995 v. 23 S. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 S. 257).In contrast to a reconstruction after the shotgun Procedures are needed for the analysis of a sequence variant significantly less raw sequence data. So the 5- to 10- times the raw sequence quantity is sufficient for the restoration a new variant of a full sequence. With the shot Shot procedure will be a 10- to restoration 100 times the amount of raw sequences required ("Automated DNA sequencing and analysis "p. 231 ff. 1994 M. Adams et al. Academic Press, Huang et al. Genom Res. 1999 v. 9 p. 868, Huang Genomics 1996 v. 33 p. 21, Bonfield et al. NAR 1995 v. 23 P. 4992, Miller et al. J. Comput. Biol. 1994 v. 1 p. 257).
Die Länge der ermittelten NSKF-Sequenzen soll für eine eindeutige Zuordnung zu einer bestimmten Position in der Referenzsequenz ausreichend sein, so können z. B. bereits Sequenzen mit einer Länge von 20 NTs (z. B. aus nicht repetitiven Abschnitten im menschlichen Genom) eindeutig identifiziert werden. Für die Vergleichsanalyse der repet itiven Abschnitte werden längere Sequenzen benötigt. Die genaue Länge der Sequenzen hängt dabei von der Aufgaben stellung ab. Vorzugsweise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs.The length of the NSKF sequences determined should be for one unique assignment to a specific position in the Reference sequence be sufficient, z. B. already Sequences with a length of 20 NTs (e.g. from not repetitive sections in the human genome) be identified. For the comparative analysis of the repet Itative sections require longer sequences. The Exact length of the sequences depends on the task position. The length of the determined is preferably NSKF sequences when analyzing non-repetitive Sections more than 20 NTs. For the analysis of repetitive Sections it is preferably over 500 NTs.
Die Zielsetzungen bei der Sequenzierung neuer Varianten einer bereits bekannten Vollsequenz können sehr unter schiedlich sein. Meist wird ein Vergleich der neu ermittel ten Sequenz mit der bekannten Vollsequenz/Referenzsequenz angestrebt. Dabei können die beiden Sequenzen aus evolutio när unterschiedlich weit auseinanderliegenden Spezies stammen. Verschiedene Parameter der Zusammensetzung dieser beiden Sequenzen können verglichen werden. Als Beispiele für eine solche Analyse dienen: Mutations- oder Polymorphismus analysen und die Analyse von alternativ gespleißten Gen produkten.The objectives when sequencing new variants an already known full sequence can be very under be different. A comparison of the new ones is usually made th sequence with the known full sequence / reference sequence sought. The two sequences from evolution species differing widely come. Different parameters of the composition of these the two sequences can be compared. As examples of such an analysis serve: mutation or polymorphism analyze and the analysis of alternatively spliced gene products.
Nachfolgend soll beispielhaft ein Vergleich der zu unter suchenden Sequenz mit einer Referenzsequenz ohne vorherige Rekonstruktion der zu analysierenden Sequenz betrachtet werden. Ein solcher Vergleich kann z. B. zur Mutations- oder SNP-Analyse dienen.The following is an example of a comparison of the below searching sequence with a reference sequence without previous Reconstruction of the sequence to be analyzed become. Such a comparison can e.g. B. for mutation or Serve SNP analysis.
Eine lange, zu analysierende Sequenz, z. B. 1 Mb, wird in NSKFs mit einer der oben genannten Methode geteilt. Diese NSKFs werden mit dem erfindungsgemäßen Verfahren sequen ziert. Die ermittelten Sequenzen von jedem einzelnen NSKF werden direkt mit der Referenzsequenz verglichen. Die Referenzsequenz dient dabei als Grundlage für die Zuordnung ermittelter NSKF-Sequenzen, so daß die aufwendige Rekon struktion nach dem Schrotschuß-Verfahren entfällt. Vorzugs weise beträgt die Länge der ermittelten NSKF-Sequenzen bei der Analyse von nicht repetitiven Abschnitten mehr als 20 NTs. Für die Analyse der repetitiven Abschnitte liegt sie vorzugsweise über 500 NTs. Die Anzahl der zu analysierenden NSKFs richtet sich dabei nach der Gesamtlänge der zu untersuchenden Sequenz, der durchschnittlichen Länge der NSKF-Sequenzen und der notwendigen Genauigkeit der Sequenzierung. Bei einer durchschnittlichen Länge der ermittelten NSKF-Sequenz von 100 NTs, einer Gesamtlänge der zu unter suchenden Sequenz von 1 Mb und einer Genauigkeit, die der Rohsequenzermittlung entspricht (d. h. jede Stelle soll möglichst nur einmal sequenziert werden) benötigt man z. B. die ca. 5-fache Menge an Rohsequenzen, d. h. 5 Mb, weil die Verteilung der NSKFs über die Gesamtsequenz zufällig erfolgt. Insgesamt müssen 50 000 NSKFs analysiert werden, um mehr als 99% der Gesamtstrecke abzudecken.A long sequence to be analyzed, e.g. B. 1 Mb, is in NSKFs shared using one of the above methods. This NSKFs are sequenced using the method according to the invention ed. The sequences determined from each individual NSKF are compared directly with the reference sequence. The The reference sequence serves as the basis for the assignment determined NSKF sequences, so that the complex recon Structure according to the shotgun method is omitted. virtue the length of the NSKF sequences determined is the analysis of non-repetitive sections more than 20 NTs. It lies for the analysis of the repetitive sections preferably over 500 NTs. The number of to analyze NSKFs are based on the total length of the investigating sequence, the average length of the NSKF sequences and the necessary accuracy of sequencing. With an average length of the determined NSKF sequence of 100 NTs, a total length of under Seeking sequence of 1 Mb and an accuracy that the Raw sequence determination corresponds (i.e. each position should be sequenced only once if possible) B. about 5 times the amount of raw sequences, d. H. 5 Mb because that Random distribution of NSKFs over the entire sequence he follows. A total of 50,000 NSKFs must be analyzed in order to cover more than 99% of the total distance.
Anschließend werden die ermittelten NSKF-Sequenzen mit Hilfe eines kommerziell erhältlichen Programms der Vollsequenz zugeordnet und eventuelle Abweichungen detektiert. Einem solchen Programm kann z. B. BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).Then the determined NSKF sequences with the help a commercially available full sequence program assigned and any deviations detected. a such a program can e.g. B. BLAST or FASTA algorithm underlying ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).
In einer anderen Ausführungsform werden für die Analyse der Sequenzen 2 modifizierte NTs* und 2 unmodifizierte NTs einge setzt.In another embodiment, the analysis of the Sequences 2 modified NTs * and 2 unmodified NTs inserted puts.
Diese Methode eignet sich besonders zur Analyse der Sequenzva rianten (z. B. SNP- oder Mutationsanalyse) und setzt die Kenntnis einer Referenzsequenz voraus. Dabei wird die Vollsequenz nicht rekonstruiert, sondern die ermittelten Sequenzen werden mit Hilfe eines Programms der Referenzsequenz zugeordnet und eventuelle Abweichungen registriert. Einem solchen Programm kann z. B. der BLAST oder FASTA Algorithmus zugrunde liegen ("Introduction to computational Biology" 1995 M. S. Waterman Chapman & Hall).This method is particularly suitable for analyzing the sequence va rianten (e.g. SNP or mutation analysis) and sets the knowledge ahead of a reference sequence. The full sequence is not reconstructed, but the identified sequences are created using a program assigned to the reference sequence and any Deviations registered. Such a program can e.g. B. the BLAST or FASTA algorithm are based ("Introduction to computational biology "1995 M. S. Waterman Chapman & Hall).
Diese Ausführungsform beruht auf dem Prinzip, daß eine Abfolge
aus 2 Signalen (markierte NT*s) genügend Informationen zur
Identifizierung einer Sequenz enthalten kann. Die ermittelte
Sequenz wird mit der Referenzsequenz verglichen und einer
bestimmten Position zugeordnet, z. B.:
This embodiment is based on the principle that a sequence of 2 signals (marked NT * s) can contain enough information to identify a sequence. The determined sequence is compared with the reference sequence and assigned to a specific position, e.g. B .:
Die unbekannte, zu analysierende Variante der Referenzsequenz wird wie oben beschrieben zur Sequenzierung vorbereitet (NSK wird in NSKFs überführt, diese werden mit PBS ligiert, anschließend mit einem Primer hybridisiert und auf Reaktionsoberfläche immobilisiert). Auf diese Weise vorbereitete NSKFs werden mit 2NTs*/2NTs-Methode sequenziert. Man erhält NSKF-Sequenzen, wobei jede NSKF-Sequenz eine Abfolge aus 2NTs* darstellt. Um eine eindeutige Zuordnung der ermittelten Sequenz zu einer bekannten Referenzsequenz zu ermöglichen, muß diese Abfolge lang genug sein. Vorzugsweise beträgt die Länge der ermittelten NSKF- Sequenzen mehr als 40 NT*s. Da 2 markierte NTs* nur einen Teil der Sequenz darstellen, ist die Gesamtlänge des synthetisierten komplementären Strangs ca. doppelt so lang, wie die Abfolge der detektierten NTs* (bei 40 detektierten NTs* beträgt die Gesamt länge z. B. durchschnittlich 80 NTs).The unknown variant of the reference sequence to be analyzed is prepared for sequencing as described above (NSK will transferred to NSKFs, these are ligated with PBS, then hybridized with a primer and on reaction surface immobilized). NSKFs prepared in this way are included 2NTs * / 2NTs method sequenced. NSKF sequences are obtained, whereby each NSKF sequence represents a sequence of 2NTs *. To one clear assignment of the determined sequence to a known one To enable the reference sequence, this sequence must be long enough his. The length of the NSKF- Sequences more than 40 NT * s. Since 2 marked NTs * only a part represent the sequence is the total length of the synthesized complementary strand about twice as long as the sequence of detected NTs * (with 40 detected NTs * the total is length z. B. on average 80 NTs).
Zur Synthese eines komplementären Stranges werden 4 Nukleotide benötigt. Da die mit einem Fluoreszenzfarbstoff markierten NTs* in der vorliegenden Erfindung als Semiterminatoren auftreten, d. h. die Termination ausschließlich bei Verfügbarkeit modifi zierter NTs* auftritt, müssen unmodifizierte NTs in einem zu sätzlichen Schritt in jedem Zyklus in die Reaktion zugegeben werden. Die genaue Position dieses Schrittes in dem Zyklus kann variieren. Wichtig dabei ist, daß die markierten NTs* und die unmodifizierte NTs getrennt verwendet werden. 4 nucleotides are used to synthesize a complementary strand needed. Since the NTs marked with a fluorescent dye * appear as semiterminators in the present invention, d. H. the termination is only modifiable when available ornamental NTs * must occur, unmodified NTs in one too added additional step in each cycle in the reaction become. The exact position of this step in the cycle can vary. It is important that the marked NTs * and the unmodified NTs can be used separately.
Ein Zyklus bei dieser Ausführungsform kann beispielhaft folgen
dermaßen aussehen:
A cycle in this embodiment may look like this, for example:
- a) Zugabe einer Lösung mit modifizierten NTs* und Polymerasen auf die Oberfläche mit den bereitgestellten NSKFsa) Add a solution with modified NTs * and polymerases on the surface with the NSKFs provided
- b) Inkubation der immobilisierten Nukleinsäureketten mit dieser Lösung unter Bedingungen, die zur Verlängerung der kom plementären Stränge um ein NT geeignet sindb) Incubation of the immobilized nucleic acid chains with them Solution under conditions that extend the com complementary strands around an NT are suitable
- c) Waschenc) washing
- d) Detektion der Signale von einzelnen, modifizierten und in die den NSKFs komplementären neusynthetisierten Strängen eingebauten NTs*-Molekülend) detection of signals from individual, modified and in the newly synthesized strands complementary to the NSKFs built-in NTs * molecules
- e) Entfernung der Markierung und der terminierenden Gruppe bei den eingebauten Nukleotidene) removal of the marker and the terminating group at the built-in nucleotides
- f) Waschenf) washing
- g) Zugabe von 2 unmodifizierten NTs und Polymeraseng) addition of 2 unmodified NTs and polymerases
- h) Waschen.h) washing.
Die Konzentration der NTs liegt vorzugsweise unter 1 mM, idealer weise unter 10 µM.The concentration of the NTs is preferably below 1 mM, more ideal less than 10 µM.
Diese 2NT*s/2NTs-Methode eignet sich beispielsweise für die SNP-
Analyse einer genomischen Strecke eines Gens oder für doppel
strängige cDNA-Analyse. Ihr liegen folgende Prinzipien zugrunde:
This 2NT * s / 2NTs method is suitable, for example, for the SNP analysis of a genomic stretch of a gene or for double-stranded cDNA analysis. It is based on the following principles:
- 1. Die genetische Information in jedem der beiden komplementä ren DNA-Stränge ist identisch, so daß fehlende Informationen in einem Strang durch die Information aus dem anderen Strang vervollständingt werden können.1. The genetic information in each of the two complementary Ren DNA strands are identical, so missing information in one strand by the information from the other strand can be completed.
- 2. Durch bestimmte Paarkombinationen markierter NTs* kann man mit nur 2NTs* die komplette Information aus einer doppel strängigen DNA erhalten. Zulässige Kombinationen von NT*s bei dieser Ausführungsform sind: A*C*; A*G*; C*T*/C*U*; G*T*/G*U*. Bevorzugt wird die Kombination C* und U* 2. By means of certain combinations of pairs of labeled NTs *, the complete information can be obtained from a double-stranded DNA with only 2NTs *. Permissible combinations of NT * s in this embodiment are: A * C *; A * G *; C * T * / C * U *; G * T * / G * U *. The combination C * and U * is preferred
- 3. Als Grundlage der Analyse dient eine bereits bekannte Refe renzsequenz. 3. An already known Refe serves as the basis for the analysis Conference sequence.
- 4. Die NSKFs stammen von beiden Strängen der zu analysierenden NSK und die ermittelten NSKF-Sequenzen decken die gesamte Länge der zu analysierenden Sequenz ab.4. The NSKFs come from both strands of the one to be analyzed NSK and the NSKF sequences determined cover the whole Length of the sequence to be analyzed.
Am folgenden Beispiel wird erklärt, wie die Information aus einem doppelsträngigen DNA-Fragment mit nur 2 markierten NTs* gewonnen wird und wie die Unterschiede zur ursprünglichen oder nicht mutierten Sequenz (Referenzsequenz/Vergleichsequenz) festge stellt werden können. Sequenzen unter (1) und (2) sind bis auf eine Stelle identisch (unterstrichen). A* und C* sind markiert.The following example explains how the information is obtained from a double-stranded DNA fragment with only 2 labeled NTs * and how the differences to the original or non-mutated sequence (reference sequence / comparison sequence) can be determined. Sequences under (1) and (2) are identical except for one position (underlined). A * and C * are marked.
Die zu prüfende Sequenz wird mit 2NT*s/2NTs-Methode sequenziert,
so daß eine Population an NSKF-Sequenzen (ermittelte NSKF-
Sequenzen(n)) entsteht. Diese ermittelten NSKF-Sequenzen
enthalten Information von jedem Strang:
The sequence to be checked is sequenced using the 2NT * s / 2NTs method, so that a population of NSKF sequences (determined NSKF sequences (n)) is formed. The NSKF sequences determined contain information from each strand:
Zur Analyse ist eine Vergleichsequenz (Referenzsequenz) erforder
lich:
A comparison sequence (reference sequence) is required for analysis:
Mit Hilfe eines Programms werden ermittelte NSKF-Sequenzen
bestimmten Stellen in der Vergleichsequenz zugeordnet und
eventuelle Abweichungen detektiert:
With the help of a program, determined NSKF sequences are assigned to specific points in the comparison sequence and possible deviations are detected:
Mit dieser Ausführungsform kann man eine doppelsträngige Nukleinsäure auf SNP oder Mutationen untersuchen. Dabei werden die ermittelten NSKF-Sequenzen mit einer Referenzsequenz verglichen. Die Grundregeln des Vergleichs einer Teilsequenz und einer kompletten Sequenz bei der Analyse mit nur 2 markierten NTs unterscheiden sich nicht prinzipiell von denen, die bei dem Vergleich der Sequenzen anhand aller 4 markierten NTs* gelten. Näheres s. Sequenzvergleich bei Mutationsanalyse und SNP-Analyse mit 4NTs* (Beispiel 3B). With this embodiment, a double-stranded nucleic acid can be examined for SNP or mutations. The NSKF sequences determined are compared with a reference sequence. The basic rules of comparing a partial sequence and a complete sequence in the analysis with only 2 marked NTs do not differ fundamentally from those that apply when comparing the sequences using all 4 marked NTs *. For more information, see Sequence comparison in mutation analysis and SNP analysis with 4NTs * (Example 3B).
Claims (42)
Fragmente (NSKFs) einzelsträngiger NSKs mit einer Länge von etwa 50 bis 1000 Nukleotiden erzeugt, die überlappende Teilsequenzen der Gesamtsequenzen darstellen, man
die NSKFs auf einer Reaktionsoberfläche in einer Dichte von 10 bis 100 NSKFs pro 100 µm2 immobilisiert (stationäre Phase), man
eine zyklische Aufbaureaktion des komplementären Stranges der NSKFs unter Verwendung eines oder mehrerer Primer und einer oder mehrerer Polymerasen durchführt, indem man
- a) zu den immobilisierten NSKFs eine Lösung zugibt, die eine oder mehrere Polymerasen und ein bis vier modifi zierte Nukleotide (NTs*) enthält, die mit Fluoreszenz farbstoffen markiert sind, wobei die bei gleichzeitiger Verwendung von mindestens zwei NTs* jeweils an den NTs* befindlichen Fluoreszenzfarbstoffe so gewählt sind, daß sich die verwendeten NTs* durch Messung unterschiedli cher Fluoreszenzsignale voneinander unterscheiden lassen, wobei die NTs* strukturell so modifiziert sind, daß die Polymerase nach Einbau eines solchen NT* in einen wachsenden komplementären Strang nicht in der Lage ist, ein weiteres NT* in denselben Strang ein zubauen, wobei der Fluoreszenzfarbstoff abspaltbar ist und die strukturelle Modifikation ein abspaltbarer ste risch anspruchsvoller Ligand ist, man
- b) die in Stufe a) erhaltene stationäre Phase unter Bedingungen inkubiert, die zur Verlängerung der komplementären Stränge geeignet sind, wobei die komplemen tären Stränge jeweils um ein NT* verlängert werden, man
- c) die in Stufe b) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung nicht in einen komplementären Strang eingebauter NTs* geeignet sind, man
- d) die einzelnen, in komplementäre Stränge eingebauten NTs* durch Messen des für den jeweiligen Fluoreszenzfarb stoff charakteristischen Signals detektiert, wobei man gleichzeitig die relative Position der einzelnen Fluo reszenzsignale auf der Reaktionsoberfläche bestimmt, man
- e) zur Erzeugung unmarkierter (NTs oder) NSKFs die Fluo reszenzfarbstoffe und die sterisch anspruchsvollen Liganden von den am komplementären Strang angefügten NTs* abspaltet, man
- f) die in Stufe e) erhaltene stationäre Phase unter Bedingungen wäscht, die zur Entfernung der Fluoreszenz farbstoffe und der Liganden geeignet sind, man
wobei man die relative Position einzelner NSKFs auf der Reaktionsoberfläche und die Sequenz dieser NSKFs durch spe zifische Zuordnung der in Stufe d) in aufeinanderfolgenden Zyklen an den jeweiligen Positionen detektierten Fluores zenzsignale zu den NTs bestimmt und man aus den ermittelten überlappenden Teilsequenzen die Gesamtsequenz der NSKs bestimmt.1. Method for sequence analysis of nucleic acid sequences (Nu small acid chains, NSKs), in which one
Fragments (NSKFs) of single-stranded NSKs with a length of about 50 to 1000 nucleotides are generated, which represent overlapping partial sequences of the total sequences
the NSKFs immobilized on a reaction surface in a density of 10 to 100 NSKFs per 100 µm 2 (stationary phase), one
cyclically build the complementary strand of NSKFs using one or more primers and one or more polymerases by
- a) a solution is added to the immobilized NSKFs which contains one or more polymerases and one to four modified nucleotides (NTs *) which are labeled with fluorescent dyes, the simultaneous use of at least two NTs * each on the NTs * located fluorescent dyes are selected so that the NTs * used can be distinguished from one another by measuring different fluorescence signals, the NTs * being structurally modified such that the polymerase is unable to incorporate such an NT * into a growing complementary strand, to install another NT * in the same strand, the fluorescent dye being cleavable and the structural modification being a cleavable sterically demanding ligand, one
- b) the stationary phase obtained in stage a) is incubated under conditions which are suitable for the extension of the complementary strands, the complementary strands being extended by one NT * each, one
- c) the stationary phase obtained in stage b) is washed under conditions which are not suitable for the removal of NTs * which are not incorporated into a complementary strand
- d) the individual NTs * built into complementary strands are detected by measuring the signal characteristic of the respective fluorescent dye, at the same time determining the relative position of the individual fluorescent signals on the reaction surface, one
- e) to generate unlabelled (NTs or) NSKFs, the fluorescent dyes and the sterically demanding ligands are split off from the NTs * attached to the complementary strand, one
- f) the stationary phase obtained in step e) is washed under conditions which are suitable for removing the fluorescent dyes and the ligands, one
wherein the relative position of individual NSKFs on the reaction surface and the sequence of these NSKFs are determined by specific assignment of the fluorescence signals detected in step d) in successive cycles at the respective positions to the NTs, and the total sequence of the NSKs is determined from the overlapping partial sequences determined ,
- a) zur Erzeugung von Einzelsträngen aus Doppelsträngen erforderliche Reagenzien,
- b) Nukleinsäuremoleküle, die als PBS in die NSKFs einge führt werden,
- c) Oligonukleotid-Primer,
- d) zur Abspaltung der Fluoreszenzfarbstoffe und sterisch anspruchsvollen Liganden erforderliche Reagenzien,
- a) Waschlösungen.
- a) reagents required for producing single strands from double strands,
- b) nucleic acid molecules which are introduced as PBS into the NSKFs,
- c) oligonucleotide primers,
- d) reagents required for cleaving off the fluorescent dyes and bulky ligands,
- a) Wash solutions.
36. Nucleotide of the formula
37. Nucleotide of the formula
38. Nucleotide of the formula
40. Nucleotide of the formula
41. Nucleotide of the formula
42. Nucleotide of the formula
Priority Applications (5)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10120797A DE10120797B4 (en) | 2001-04-27 | 2001-04-27 | Method for analyzing nucleic acid chains |
| AU2002304705A AU2002304705A1 (en) | 2001-04-27 | 2002-04-26 | Method for analysing nucleic acid chains |
| PCT/EP2002/004659 WO2002088382A2 (en) | 2001-04-27 | 2002-04-26 | Method for analysing nucleic acid chains |
| EP02732680A EP1381698A2 (en) | 2001-04-27 | 2002-04-26 | Method for analysing nucleic acid chains |
| JP2002585662A JP2004529650A (en) | 2001-04-27 | 2002-04-26 | Analysis method of nucleic acid strand |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE10120797A DE10120797B4 (en) | 2001-04-27 | 2001-04-27 | Method for analyzing nucleic acid chains |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| DE10120797A1 true DE10120797A1 (en) | 2002-11-21 |
| DE10120797B4 DE10120797B4 (en) | 2005-12-22 |
Family
ID=7683014
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| DE10120797A Expired - Lifetime DE10120797B4 (en) | 2001-04-27 | 2001-04-27 | Method for analyzing nucleic acid chains |
Country Status (5)
| Country | Link |
|---|---|
| EP (1) | EP1381698A2 (en) |
| JP (1) | JP2004529650A (en) |
| AU (1) | AU2002304705A1 (en) |
| DE (1) | DE10120797B4 (en) |
| WO (1) | WO2002088382A2 (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10214395A1 (en) * | 2002-03-30 | 2003-10-23 | Dmitri Tcherkassov | Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide |
| DE10149786B4 (en) * | 2001-10-09 | 2013-04-25 | Dmitry Cherkasov | Surface for studies of populations of single molecules |
Families Citing this family (67)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6780591B2 (en) | 1998-05-01 | 2004-08-24 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
| US7875440B2 (en) | 1998-05-01 | 2011-01-25 | Arizona Board Of Regents | Method of determining the nucleotide sequence of oligonucleotides and DNA molecules |
| US7501245B2 (en) | 1999-06-28 | 2009-03-10 | Helicos Biosciences Corp. | Methods and apparatuses for analyzing polynucleotide sequences |
| US6818395B1 (en) | 1999-06-28 | 2004-11-16 | California Institute Of Technology | Methods and apparatus for analyzing polynucleotide sequences |
| ATE356222T1 (en) | 2000-10-06 | 2007-03-15 | Univ Columbia | MASSIVE PARALLEL METHOD FOR DECODING DNA AND RNA |
| US9708358B2 (en) | 2000-10-06 | 2017-07-18 | The Trustees Of Columbia University In The City Of New York | Massive parallel method for decoding DNA and RNA |
| JP2004523243A (en) | 2001-03-12 | 2004-08-05 | カリフォルニア インスティチュート オブ テクノロジー | Method and apparatus for analyzing polynucleotide sequences by asynchronous base extension |
| DE10239504A1 (en) * | 2001-08-29 | 2003-04-24 | Genovoxx Gmbh | Parallel sequencing of nucleic acid fragments, useful e.g. for detecting mutations, comprises sequential single-base extension of immobilized fragment-primer complex |
| US20050227231A1 (en) * | 2001-10-04 | 2005-10-13 | Dimitri Tcherkassov | Device for sequencing nucleic acid molecules |
| GB0129012D0 (en) | 2001-12-04 | 2002-01-23 | Solexa Ltd | Labelled nucleotides |
| US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
| US7414116B2 (en) | 2002-08-23 | 2008-08-19 | Illumina Cambridge Limited | Labelled nucleotides |
| US11008359B2 (en) | 2002-08-23 | 2021-05-18 | Illumina Cambridge Limited | Labelled nucleotides |
| US7541444B2 (en) | 2002-08-23 | 2009-06-02 | Illumina Cambridge Limited | Modified nucleotides |
| PT3147292T (en) | 2002-08-23 | 2018-11-22 | Illumina Cambridge Ltd | Labelled nucleotides |
| US8637650B2 (en) | 2003-11-05 | 2014-01-28 | Genovoxx Gmbh | Macromolecular nucleotide compounds and methods for using the same |
| US7169560B2 (en) | 2003-11-12 | 2007-01-30 | Helicos Biosciences Corporation | Short cycle methods for sequencing polynucleotides |
| ATE463584T1 (en) | 2004-02-19 | 2010-04-15 | Helicos Biosciences Corp | METHOD FOR ANALYZING POLYNUCLEOTIDE SEQUENCES |
| DE602005027700D1 (en) | 2004-05-25 | 2011-06-09 | Helicos Biosciences Corp | PROCESS FOR NUCLEIC ACID IMMOBILIZATION |
| US7476734B2 (en) | 2005-12-06 | 2009-01-13 | Helicos Biosciences Corporation | Nucleotide analogs |
| US7220549B2 (en) | 2004-12-30 | 2007-05-22 | Helicos Biosciences Corporation | Stabilizing a nucleic acid for nucleic acid sequencing |
| US7482120B2 (en) | 2005-01-28 | 2009-01-27 | Helicos Biosciences Corporation | Methods and compositions for improving fidelity in a nucleic acid synthesis reaction |
| GB0517097D0 (en) | 2005-08-19 | 2005-09-28 | Solexa Ltd | Modified nucleosides and nucleotides and uses thereof |
| US7666593B2 (en) | 2005-08-26 | 2010-02-23 | Helicos Biosciences Corporation | Single molecule sequencing of captured nucleic acids |
| US7397546B2 (en) | 2006-03-08 | 2008-07-08 | Helicos Biosciences Corporation | Systems and methods for reducing detected intensity non-uniformity in a laser beam |
| JP5220596B2 (en) * | 2006-05-24 | 2013-06-26 | 独立行政法人産業技術総合研究所 | Nucleic acid synthesis method and single molecule sequencing method using DNA polymerase β |
| EP2548972A1 (en) | 2006-06-14 | 2013-01-23 | Verinata Health, Inc | Methods for the diagnosis of fetal abnormalities |
| US8399188B2 (en) | 2006-09-28 | 2013-03-19 | Illumina, Inc. | Compositions and methods for nucleotide sequencing |
| WO2008069973A2 (en) | 2006-12-01 | 2008-06-12 | The Trustees Of Columbia University In The City Of New York | Four-color dna sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators |
| EP2209911B1 (en) | 2007-10-19 | 2013-10-16 | The Trustees of Columbia University in the City of New York | Dna sequencing with non-fluorescent nucleotide reversible terminators and cleavable label modified nucleotide terminators and a deoxyinosine analogue with a reversible terminator group |
| WO2009051807A1 (en) | 2007-10-19 | 2009-04-23 | The Trustees Of Columbia University In The City Of New York | Design and synthesis of cleavable fluorescent nucleotides as reversible terminators for dna sequencing by synthesis |
| JP4621926B2 (en) * | 2008-07-24 | 2011-02-02 | 国立大学法人九州大学 | Enzyme substrate-modified nucleoside triphosphate, nucleic acid probe, multilabeled nucleic acid probe, method for producing multilabeled nucleic acid probe, and method for detecting target nucleic acid |
| JP5146785B2 (en) * | 2008-07-24 | 2013-02-20 | 国立大学法人九州大学 | Enzyme substrate modified nucleoside triphosphate derivatives |
| US10174368B2 (en) | 2009-09-10 | 2019-01-08 | Centrillion Technology Holdings Corporation | Methods and systems for sequencing long nucleic acids |
| US10072287B2 (en) | 2009-09-10 | 2018-09-11 | Centrillion Technology Holdings Corporation | Methods of targeted sequencing |
| WO2011050938A1 (en) | 2009-10-26 | 2011-05-05 | Genovoxx Gmbh | Conjugates of nucleotides and method for the application thereof |
| CA2779750C (en) | 2009-11-06 | 2019-03-19 | The Board Of Trustees Of The Leland Stanford Junior University | Non-invasive diagnosis of graft rejection in organ transplant patients |
| JP5704481B2 (en) * | 2010-01-22 | 2015-04-22 | 国立大学法人九州大学 | Nucleic acid detection kit |
| US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
| CA2797645C (en) | 2010-05-25 | 2020-09-22 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
| EP2670863B1 (en) | 2011-01-31 | 2018-06-27 | H. Hoffnabb-La Roche Ag | Methods of identifying multiple epitopes in cells |
| US20120252682A1 (en) | 2011-04-01 | 2012-10-04 | Maples Corporate Services Limited | Methods and systems for sequencing nucleic acids |
| WO2012146377A1 (en) | 2011-04-27 | 2012-11-01 | Dmitry Cherkasov | Method and components for detecting nucleic acid chains |
| EP2705161A1 (en) | 2011-05-04 | 2014-03-12 | Genovoxx GmbH | Nucleoside-triphosphate conjugate and methods for the use thereof |
| WO2013070634A1 (en) | 2011-11-07 | 2013-05-16 | Ingenuity Systems, Inc. | Methods and systems for identification of causal genomic variants |
| US10174310B2 (en) | 2012-08-08 | 2019-01-08 | Roche Sequencing Solutions, Inc. | Increasing dynamic range for identifying multiple epitopes in cells |
| GB2519255B (en) | 2013-02-01 | 2016-01-06 | Univ California | Methods for genome assembly and haplotype phasing |
| US9411930B2 (en) | 2013-02-01 | 2016-08-09 | The Regents Of The University Of California | Methods for genome assembly and haplotype phasing |
| WO2014144883A1 (en) | 2013-03-15 | 2014-09-18 | The Trustees Of Columbia University In The City Of New York | Raman cluster tagged molecules for biological imaging |
| AU2013382358B2 (en) | 2013-03-15 | 2017-01-12 | Illumina Cambridge Limited | Modified nucleosides or nucleotides |
| US10058839B2 (en) | 2013-03-15 | 2018-08-28 | Lineage Biosciences, Inc. | Methods and compositions for tagging and analyzing samples |
| CN103484106B (en) * | 2013-09-05 | 2015-08-19 | 上海交通大学 | Four look fluorescent mark Reversible terminal and the purposes in DNA sequencing thereof |
| KR20240038168A (en) | 2013-11-07 | 2024-03-22 | 더 보드 어브 트러스티스 어브 더 리랜드 스탠포드 주니어 유니버시티 | Cell-free nucleic acids for the analysis of the human microbiome and components thereof |
| EP3540074A1 (en) | 2013-12-11 | 2019-09-18 | The Regents of the University of California | Method of tagging internal regions of nucleic acid molecules |
| WO2016019360A1 (en) | 2014-08-01 | 2016-02-04 | Dovetail Genomics Llc | Tagging nucleic acids for sequence assembly |
| GB201414098D0 (en) | 2014-08-08 | 2014-09-24 | Illumina Cambridge Ltd | Modified nucleotide linkers |
| KR102721363B1 (en) | 2015-02-17 | 2024-10-23 | 더브테일 제노믹스 엘엘씨 | Nucleic acid sequence assembly |
| WO2016154540A1 (en) | 2015-03-26 | 2016-09-29 | Dovetail Genomics Llc | Physical linkage preservation in dna storage |
| CN108368542B (en) | 2015-10-19 | 2022-04-08 | 多弗泰尔基因组学有限责任公司 | Methods for genome assembly, haplotype phasing, and target-independent nucleic acid detection |
| SG11201807117WA (en) | 2016-02-23 | 2018-09-27 | Dovetail Genomics Llc | Generation of phased read-sets for genome assembly and haplotype phasing |
| WO2017197300A1 (en) | 2016-05-13 | 2017-11-16 | Dovetail Genomics Llc | Recovering long-range linkage information from preserved samples |
| WO2018195091A1 (en) | 2017-04-18 | 2018-10-25 | Dovetail Genomics, Llc | Nucleic acid characteristics as guides for sequence assembly |
| CA3068273A1 (en) | 2017-06-21 | 2018-12-27 | Bluedot Llc | Systems and methods for identification of nucleic acids in a sample |
| WO2019060716A1 (en) | 2017-09-25 | 2019-03-28 | Freenome Holdings, Inc. | Methods and systems for sample extraction |
| WO2019152543A1 (en) | 2018-01-31 | 2019-08-08 | Dovetail Genomics, Llc | Sample prep for dna linkage recovery |
| US11166996B2 (en) | 2018-12-12 | 2021-11-09 | Flagship Pioneering Innovations V, Inc. | Anellovirus compositions and methods of use |
| EP3990920B1 (en) | 2019-06-27 | 2025-02-12 | Dovetail Genomics, LLC | Methods and compositions for proximity ligation |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000050642A1 (en) * | 1999-02-23 | 2000-08-31 | Caliper Technologies Corp. | Sequencing by incorporation |
| WO2000070073A1 (en) * | 1999-05-19 | 2000-11-23 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
| WO2001025247A1 (en) * | 1999-10-05 | 2001-04-12 | Quiatech Ab | Compounds for protecting hydroxyls and methods for their use |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB9208733D0 (en) * | 1992-04-22 | 1992-06-10 | Medical Res Council | Dna sequencing method |
| US5986076A (en) * | 1994-05-11 | 1999-11-16 | Trustees Of Boston University | Photocleavable agents and conjugates for the detection and isolation of biomolecules |
| US6136543A (en) * | 1997-01-31 | 2000-10-24 | Hitachi, Ltd. | Method for determining nucleic acids base sequence and apparatus therefor |
| WO1999049082A2 (en) * | 1998-03-23 | 1999-09-30 | Invitrogen Corporation | Modified nucleotides and methods useful for nucleic acid sequencing |
| DE19844931C1 (en) * | 1998-09-30 | 2000-06-15 | Stefan Seeger | Procedures for DNA or RNA sequencing |
| EP1961826A3 (en) * | 1999-03-10 | 2008-09-17 | ASM Scientific, Inc. | A method for direct nucleic acid sequencing |
| GB0013276D0 (en) * | 2000-06-01 | 2000-07-26 | Amersham Pharm Biotech Uk Ltd | Nucleotide analogues |
-
2001
- 2001-04-27 DE DE10120797A patent/DE10120797B4/en not_active Expired - Lifetime
-
2002
- 2002-04-26 EP EP02732680A patent/EP1381698A2/en not_active Withdrawn
- 2002-04-26 AU AU2002304705A patent/AU2002304705A1/en not_active Abandoned
- 2002-04-26 WO PCT/EP2002/004659 patent/WO2002088382A2/en not_active Ceased
- 2002-04-26 JP JP2002585662A patent/JP2004529650A/en active Pending
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2000050642A1 (en) * | 1999-02-23 | 2000-08-31 | Caliper Technologies Corp. | Sequencing by incorporation |
| WO2000070073A1 (en) * | 1999-05-19 | 2000-11-23 | Cornell Research Foundation, Inc. | Method for sequencing nucleic acid molecules |
| WO2001025247A1 (en) * | 1999-10-05 | 2001-04-12 | Quiatech Ab | Compounds for protecting hydroxyls and methods for their use |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE10149786B4 (en) * | 2001-10-09 | 2013-04-25 | Dmitry Cherkasov | Surface for studies of populations of single molecules |
| DE10214395A1 (en) * | 2002-03-30 | 2003-10-23 | Dmitri Tcherkassov | Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2004529650A (en) | 2004-09-30 |
| WO2002088382A3 (en) | 2003-08-28 |
| WO2002088382A2 (en) | 2002-11-07 |
| EP1381698A2 (en) | 2004-01-21 |
| AU2002304705A1 (en) | 2002-11-11 |
| DE10120797B4 (en) | 2005-12-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| DE10120797B4 (en) | Method for analyzing nucleic acid chains | |
| DE10120798B4 (en) | Method for determining gene expression | |
| DE10239504A1 (en) | Parallel sequencing of nucleic acid fragments, useful e.g. for detecting mutations, comprises sequential single-base extension of immobilized fragment-primer complex | |
| DE3854743T2 (en) | METHOD FOR QUICK BASE SEQUENCING IN DNA AND RNS. | |
| DE69314951T2 (en) | DNS SEQUENCING PROCEDURE | |
| DE112007002932B4 (en) | Four-color DNA sequencing by synthesis using cleavable, reversible, fluorescent nucleotide terminators | |
| DE69928683T2 (en) | PROCESS FOR THE AMPLIFICATION AND SEQUENCING OF NUCLEIC ACIDS | |
| DE69837913T2 (en) | PROCESS FOR THE MAKING OF NUCLEIC ACID | |
| DE69834056T2 (en) | DE NOVO OR "UNIVERSAL" SEQUENCING ARRAY | |
| DE60125243T2 (en) | POLYNUCLEOTIDE SEQUENCE ASSAY | |
| DE69711895T2 (en) | CHARACTERIZATION OF DNA | |
| DE69233458T2 (en) | NUCLEIC ACIDIFYING BY POLYMERASE EXTENSION OF OLIGONUCLEOTIDES USING TERMINATOR MIXTURES | |
| DE69322266T2 (en) | SAMPLES COMPOSITION AND METHOD | |
| DE10246005A1 (en) | Automated nucleic acid sequencer, useful e.g. for analyzing gene expression, based on parallel incorporation of fluorescently labeled terminating nucleotides | |
| EP1204765B1 (en) | Method for relative quantization of methylation of cytosin-type bases in dna samples | |
| DE69924140T2 (en) | DETERMINATION OF THE LENGTH OF REPETITIVE NUCLEIC ACID SEQUENCES BY A DISCONTINUOUS PRIMER EXTENSION | |
| DE20122767U1 (en) | Massive parallel method for the decoding of DNA and RNA | |
| DE10015797A1 (en) | Multiplex analysis of DNA mixtures using photolytically readable DNA chips | |
| DE10214395A1 (en) | Parallel sequencing of nucleic acid segments, useful for detecting single-nucleotide polymorphisms, by single-base extensions with labeled nucleotide | |
| DE102004025744A1 (en) | Surface of a solid support, useful for multiple parallel analysis of nucleic acids by optical methods, having low non-specific binding of labeled components | |
| DE102004025695A1 (en) | Optical fluorescent parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex | |
| DE102004025694A1 (en) | Optical fluorescent ultra-high parallel process to analyse nucleic acid chains in which a sample solid is bound with a primer-matrix complex | |
| DE102004025745A1 (en) | Surface of solid phase, useful for parallel, optical analysis of many nucleic acids, has reduced non-specific binding of labeled components | |
| WO2008080629A2 (en) | Improved molecular biological processing system | |
| EP1458892B1 (en) | Evanescence-based multiplex sequencing method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| OP8 | Request for examination as to paragraph 44 patent law | ||
| 8364 | No opposition during term of opposition | ||
| R071 | Expiry of right |