LT6019B - Kompozicijos, būdai ir susiję panaudojimai, skirti modifikuotos dnr skaldymui - Google Patents
Kompozicijos, būdai ir susiję panaudojimai, skirti modifikuotos dnr skaldymui Download PDFInfo
- Publication number
- LT6019B LT6019B LT2012062A LT2012062A LT6019B LT 6019 B LT6019 B LT 6019B LT 2012062 A LT2012062 A LT 2012062A LT 2012062 A LT2012062 A LT 2012062A LT 6019 B LT6019 B LT 6019B
- Authority
- LT
- Lithuania
- Prior art keywords
- lys
- asp
- hmc
- glu
- ile
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000000203 mixture Substances 0.000 title claims abstract description 10
- 108020004414 DNA Proteins 0.000 claims abstract description 100
- 102000004190 Enzymes Human genes 0.000 claims abstract description 87
- 108090000790 Enzymes Proteins 0.000 claims abstract description 87
- 239000012634 fragment Substances 0.000 claims abstract description 74
- 238000003776 cleavage reaction Methods 0.000 claims abstract description 72
- 230000007017 scission Effects 0.000 claims abstract description 72
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims abstract description 28
- 102000053602 DNA Human genes 0.000 claims abstract description 16
- 108090000623 proteins and genes Proteins 0.000 claims description 60
- 102000004169 proteins and genes Human genes 0.000 claims description 57
- 125000003729 nucleotide group Chemical group 0.000 claims description 43
- 239000002773 nucleotide Substances 0.000 claims description 39
- 108091034117 Oligonucleotide Proteins 0.000 claims description 26
- 230000000694 effects Effects 0.000 claims description 22
- 238000006243 chemical reaction Methods 0.000 claims description 20
- 238000002360 preparation method Methods 0.000 claims description 18
- 230000027455 binding Effects 0.000 claims description 17
- 239000000872 buffer Substances 0.000 claims description 16
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 12
- 238000001514 detection method Methods 0.000 claims description 12
- 102000037865 fusion proteins Human genes 0.000 claims description 9
- 108020001507 fusion proteins Proteins 0.000 claims description 9
- 230000003197 catalytic effect Effects 0.000 claims description 8
- 238000013507 mapping Methods 0.000 claims description 8
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 claims description 8
- 150000003839 salts Chemical class 0.000 claims description 8
- 108091008324 binding proteins Proteins 0.000 claims description 7
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 claims description 6
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 claims description 6
- 230000000295 complement effect Effects 0.000 claims description 6
- 238000010367 cloning Methods 0.000 claims description 5
- 230000014509 gene expression Effects 0.000 claims description 5
- 230000017730 intein-mediated protein splicing Effects 0.000 claims description 5
- 239000011159 matrix material Substances 0.000 claims description 5
- 229920002101 Chitin Polymers 0.000 claims description 4
- HSCJRCZFDFQWRP-JZMIEXBBSA-N UDP-alpha-D-glucose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OP(O)(=O)OP(O)(=O)OC[C@@H]1[C@@H](O)[C@@H](O)[C@H](N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-JZMIEXBBSA-N 0.000 claims description 4
- 230000008569 process Effects 0.000 claims description 4
- 239000011535 reaction buffer Substances 0.000 claims description 4
- 229910019142 PO4 Inorganic materials 0.000 claims description 3
- HSCJRCZFDFQWRP-UHFFFAOYSA-N Uridindiphosphoglukose Natural products OC1C(O)C(O)C(CO)OC1OP(O)(=O)OP(O)(=O)OCC1C(O)C(O)C(N2C(NC(=O)C=C2)=O)O1 HSCJRCZFDFQWRP-UHFFFAOYSA-N 0.000 claims description 3
- 238000009472 formulation Methods 0.000 claims description 3
- 150000002460 imidazoles Chemical class 0.000 claims description 3
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 claims description 2
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 claims description 2
- VEXZGXHMUGYJMC-UHFFFAOYSA-M Chloride anion Chemical compound [Cl-] VEXZGXHMUGYJMC-UHFFFAOYSA-M 0.000 claims description 2
- KRKNYBCHXYNGOX-UHFFFAOYSA-K Citrate Chemical compound [O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O KRKNYBCHXYNGOX-UHFFFAOYSA-K 0.000 claims description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 2
- 229910002651 NO3 Inorganic materials 0.000 claims description 2
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 claims description 2
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 claims description 2
- 150000001450 anions Chemical class 0.000 claims description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 claims description 2
- 239000010452 phosphate Substances 0.000 claims description 2
- 102000014914 Carrier Proteins Human genes 0.000 claims 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 2
- 108020004682 Single-Stranded DNA Proteins 0.000 claims 1
- 150000001413 amino acids Chemical group 0.000 description 43
- 235000018102 proteins Nutrition 0.000 description 39
- 235000001014 amino acid Nutrition 0.000 description 28
- 239000000758 substrate Substances 0.000 description 27
- 239000000047 product Substances 0.000 description 25
- 239000000499 gel Substances 0.000 description 21
- 238000003752 polymerase chain reaction Methods 0.000 description 16
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Chemical class Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 12
- 238000012163 sequencing technique Methods 0.000 description 11
- 210000004899 c-terminal region Anatomy 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 229920002401 polyacrylamide Polymers 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 239000003153 chemical reaction reagent Substances 0.000 description 7
- 229940104302 cytosine Drugs 0.000 description 7
- 230000007018 DNA scission Effects 0.000 description 6
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 6
- 239000000853 adhesive Substances 0.000 description 6
- 230000001070 adhesive effect Effects 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 238000007031 hydroxymethylation reaction Methods 0.000 description 6
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 6
- ZQUKYJOKQBRBCS-GLLZPBPUSA-N Thr-Gln-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N)O ZQUKYJOKQBRBCS-GLLZPBPUSA-N 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 108010038633 aspartylglutamate Proteins 0.000 description 5
- 210000004556 brain Anatomy 0.000 description 5
- 238000003199 nucleic acid amplification method Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000007787 solid Substances 0.000 description 5
- 238000013518 transcription Methods 0.000 description 5
- 230000035897 transcription Effects 0.000 description 5
- 230000002103 transcriptional effect Effects 0.000 description 5
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 4
- CSOBBJWWODOYGW-ILWGZMRPSA-N Trp-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CNC4=CC=CC=C43)N)C(=O)O CSOBBJWWODOYGW-ILWGZMRPSA-N 0.000 description 4
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 102000023732 binding proteins Human genes 0.000 description 4
- 239000004202 carbamide Substances 0.000 description 4
- 210000001671 embryonic stem cell Anatomy 0.000 description 4
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 4
- 108010050848 glycylleucine Proteins 0.000 description 4
- 238000012165 high-throughput sequencing Methods 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 108010003700 lysyl aspartic acid Proteins 0.000 description 4
- 108010038320 lysylphenylalanine Proteins 0.000 description 4
- 108091008146 restriction endonucleases Proteins 0.000 description 4
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 3
- ZWASIOHRQWRWAS-UGYAYLCHSA-N Asn-Asp-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZWASIOHRQWRWAS-UGYAYLCHSA-N 0.000 description 3
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 3
- BPHKULHWEIUDOB-FXQIFTODSA-N Cys-Gln-Gln Chemical compound SC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O BPHKULHWEIUDOB-FXQIFTODSA-N 0.000 description 3
- KBKGRMNVKPSQIF-XDTLVQLUSA-N Glu-Ala-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KBKGRMNVKPSQIF-XDTLVQLUSA-N 0.000 description 3
- LGYCLOCORAEQSZ-PEFMBERDSA-N Glu-Ile-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O LGYCLOCORAEQSZ-PEFMBERDSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- TZCGZYWNIDZZMR-UHFFFAOYSA-N Ile-Arg-Ala Natural products CCC(C)C(N)C(=O)NC(C(=O)NC(C)C(O)=O)CCCN=C(N)N TZCGZYWNIDZZMR-UHFFFAOYSA-N 0.000 description 3
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 3
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 3
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 3
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 3
- JGKHAFUAPZCCDU-BZSNNMDCSA-N Leu-Tyr-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=C(O)C=C1 JGKHAFUAPZCCDU-BZSNNMDCSA-N 0.000 description 3
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 3
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 3
- DSZFTPCSFVWMKP-DCAQKATOSA-N Met-Ser-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN DSZFTPCSFVWMKP-DCAQKATOSA-N 0.000 description 3
- XZFYRXDAULDNFX-UHFFFAOYSA-N N-L-cysteinyl-L-phenylalanine Natural products SCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XZFYRXDAULDNFX-UHFFFAOYSA-N 0.000 description 3
- WFHRXJOZEXUKLV-IRXDYDNUSA-N Phe-Gly-Tyr Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 WFHRXJOZEXUKLV-IRXDYDNUSA-N 0.000 description 3
- JMZKMSTYXHFYAK-VEVYYDQMSA-N Thr-Arg-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O JMZKMSTYXHFYAK-VEVYYDQMSA-N 0.000 description 3
- DCLBXIWHLVEPMQ-JRQIVUDYSA-N Thr-Asp-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 DCLBXIWHLVEPMQ-JRQIVUDYSA-N 0.000 description 3
- 108010047495 alanylglycine Proteins 0.000 description 3
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 3
- 108010008355 arginyl-glutamine Proteins 0.000 description 3
- 108010093581 aspartyl-proline Proteins 0.000 description 3
- 108010047857 aspartylglycine Proteins 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical class O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000006911 enzymatic reaction Methods 0.000 description 3
- 108010049041 glutamylalanine Proteins 0.000 description 3
- 108010010147 glycylglutamine Proteins 0.000 description 3
- 108010020688 glycylhistidine Proteins 0.000 description 3
- 108010015792 glycyllysine Proteins 0.000 description 3
- 238000009396 hybridization Methods 0.000 description 3
- 238000002372 labelling Methods 0.000 description 3
- 108010012058 leucyltyrosine Proteins 0.000 description 3
- 108010009298 lysylglutamic acid Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 108010089198 phenylalanyl-prolyl-arginine Proteins 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 239000000243 solution Substances 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 108010033670 threonyl-aspartyl-tyrosine Proteins 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- -1 500 mM Chemical compound 0.000 description 2
- 241000588626 Acinetobacter baumannii Species 0.000 description 2
- GGNHBHYDMUDXQB-KBIXCLLPSA-N Ala-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](C)N GGNHBHYDMUDXQB-KBIXCLLPSA-N 0.000 description 2
- KLALXKYLOMZDQT-ZLUOBGJFSA-N Ala-Ser-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(N)=O KLALXKYLOMZDQT-ZLUOBGJFSA-N 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- GNYUVVJYGJFKHN-RVMXOQNASA-N Arg-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N GNYUVVJYGJFKHN-RVMXOQNASA-N 0.000 description 2
- HJDNZFIYILEIKR-OSUNSFLBSA-N Arg-Ile-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O HJDNZFIYILEIKR-OSUNSFLBSA-N 0.000 description 2
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 2
- XLZCLJRGGMBKLR-PCBIJLKTSA-N Asn-Ile-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XLZCLJRGGMBKLR-PCBIJLKTSA-N 0.000 description 2
- FTSAJSADJCMDHH-CIUDSAMLSA-N Asn-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N FTSAJSADJCMDHH-CIUDSAMLSA-N 0.000 description 2
- ZYPWIUFLYMQZBS-SRVKXCTJSA-N Asn-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ZYPWIUFLYMQZBS-SRVKXCTJSA-N 0.000 description 2
- QUMKPKWYDVMGNT-NUMRIWBASA-N Asn-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QUMKPKWYDVMGNT-NUMRIWBASA-N 0.000 description 2
- VFUXXFVCYZPOQG-WDSKDSINSA-N Asp-Glu-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VFUXXFVCYZPOQG-WDSKDSINSA-N 0.000 description 2
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 2
- ZEDBMCPXPIYJLW-XHNCKOQMSA-N Asp-Glu-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)O)N)C(=O)O ZEDBMCPXPIYJLW-XHNCKOQMSA-N 0.000 description 2
- YFSLJHLQOALGSY-ZPFDUUQYSA-N Asp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N YFSLJHLQOALGSY-ZPFDUUQYSA-N 0.000 description 2
- MYOHQBFRJQFIDZ-KKUMJFAQSA-N Asp-Leu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O MYOHQBFRJQFIDZ-KKUMJFAQSA-N 0.000 description 2
- KESWRFKUZRUTAH-FXQIFTODSA-N Asp-Pro-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O KESWRFKUZRUTAH-FXQIFTODSA-N 0.000 description 2
- AHWRSSLYSGLBGD-CIUDSAMLSA-N Asp-Pro-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AHWRSSLYSGLBGD-CIUDSAMLSA-N 0.000 description 2
- UVZFZTWNHOQWNK-NAKRPEOUSA-N Cys-Ile-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O UVZFZTWNHOQWNK-NAKRPEOUSA-N 0.000 description 2
- HEPLXMBVMCXTBP-QWRGUYRKSA-N Cys-Phe-Gly Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O HEPLXMBVMCXTBP-QWRGUYRKSA-N 0.000 description 2
- 108010042407 Endonucleases Proteins 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- LOJYQMFIIJVETK-WDSKDSINSA-N Gln-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LOJYQMFIIJVETK-WDSKDSINSA-N 0.000 description 2
- IHSGESFHTMFHRB-GUBZILKMSA-N Gln-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCC(N)=O IHSGESFHTMFHRB-GUBZILKMSA-N 0.000 description 2
- ZJICFHQSPWFBKP-AVGNSLFASA-N Glu-Asn-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZJICFHQSPWFBKP-AVGNSLFASA-N 0.000 description 2
- LVCHEMOPBORRLB-DCAQKATOSA-N Glu-Gln-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O)C(O)=O LVCHEMOPBORRLB-DCAQKATOSA-N 0.000 description 2
- AUTNXSQEVVHSJK-YVNDNENWSA-N Glu-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O AUTNXSQEVVHSJK-YVNDNENWSA-N 0.000 description 2
- KRGZZKWSBGPLKL-IUCAKERBSA-N Glu-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N KRGZZKWSBGPLKL-IUCAKERBSA-N 0.000 description 2
- ZMVCLTGPGWJAEE-JYJNAYRXSA-N Glu-His-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)O ZMVCLTGPGWJAEE-JYJNAYRXSA-N 0.000 description 2
- RBXSZQRSEGYDFG-GUBZILKMSA-N Glu-Lys-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O RBXSZQRSEGYDFG-GUBZILKMSA-N 0.000 description 2
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 2
- 102000000340 Glucosyltransferases Human genes 0.000 description 2
- 108010055629 Glucosyltransferases Proteins 0.000 description 2
- NPSWCZIRBAYNSB-JHEQGTHGSA-N Gly-Gln-Thr Chemical compound [H]NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NPSWCZIRBAYNSB-JHEQGTHGSA-N 0.000 description 2
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 2
- ZZLWLWSUIBSMNP-CIUDSAMLSA-N His-Asp-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZZLWLWSUIBSMNP-CIUDSAMLSA-N 0.000 description 2
- IDQNVIWPPWAFSY-AVGNSLFASA-N His-His-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(O)=O IDQNVIWPPWAFSY-AVGNSLFASA-N 0.000 description 2
- RPZFUIQVAPZLRH-GHCJXIJMSA-N Ile-Asp-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](C)C(=O)O)N RPZFUIQVAPZLRH-GHCJXIJMSA-N 0.000 description 2
- HVWXAQVMRBKKFE-UGYAYLCHSA-N Ile-Asp-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HVWXAQVMRBKKFE-UGYAYLCHSA-N 0.000 description 2
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 2
- FUOYNOXRWPJPAN-QEWYBTABSA-N Ile-Glu-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N FUOYNOXRWPJPAN-QEWYBTABSA-N 0.000 description 2
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 2
- NZGTYCMLUGYMCV-XUXIUFHCSA-N Ile-Lys-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N NZGTYCMLUGYMCV-XUXIUFHCSA-N 0.000 description 2
- PZWBBXHHUSIGKH-OSUNSFLBSA-N Ile-Thr-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PZWBBXHHUSIGKH-OSUNSFLBSA-N 0.000 description 2
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 2
- GRZSCTXVCDUIPO-SRVKXCTJSA-N Leu-Arg-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O GRZSCTXVCDUIPO-SRVKXCTJSA-N 0.000 description 2
- YVKSMSDXKMSIRX-GUBZILKMSA-N Leu-Glu-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YVKSMSDXKMSIRX-GUBZILKMSA-N 0.000 description 2
- QNTJIDXQHWUBKC-BZSNNMDCSA-N Leu-Lys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QNTJIDXQHWUBKC-BZSNNMDCSA-N 0.000 description 2
- ICYRCNICGBJLGM-HJGDQZAQSA-N Leu-Thr-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(O)=O ICYRCNICGBJLGM-HJGDQZAQSA-N 0.000 description 2
- UCRJTSIIAYHOHE-ULQDDVLXSA-N Leu-Tyr-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N UCRJTSIIAYHOHE-ULQDDVLXSA-N 0.000 description 2
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 2
- RDFIVFHPOSOXMW-ACRUOGEOSA-N Leu-Tyr-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O RDFIVFHPOSOXMW-ACRUOGEOSA-N 0.000 description 2
- AXVIGSRGTMNSJU-YESZJQIVSA-N Leu-Tyr-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N2CCC[C@@H]2C(=O)O)N AXVIGSRGTMNSJU-YESZJQIVSA-N 0.000 description 2
- VHNOAIFVYUQOOY-XUXIUFHCSA-N Lys-Arg-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VHNOAIFVYUQOOY-XUXIUFHCSA-N 0.000 description 2
- 108010062166 Lys-Asn-Asp Proteins 0.000 description 2
- PRSBSVAVOQOAMI-BJDJZHNGSA-N Lys-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN PRSBSVAVOQOAMI-BJDJZHNGSA-N 0.000 description 2
- XREQQOATSMMAJP-MGHWNKPDSA-N Lys-Ile-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XREQQOATSMMAJP-MGHWNKPDSA-N 0.000 description 2
- YUAXTFMFMOIMAM-QWRGUYRKSA-N Lys-Lys-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O YUAXTFMFMOIMAM-QWRGUYRKSA-N 0.000 description 2
- YFQSSOAGMZGXFT-MEYUZBJRSA-N Lys-Thr-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YFQSSOAGMZGXFT-MEYUZBJRSA-N 0.000 description 2
- 108700020482 Maltose-Binding protein Proteins 0.000 description 2
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 2
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 2
- ONORAGIFHNAADN-LLLHUVSDSA-N Phe-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N ONORAGIFHNAADN-LLLHUVSDSA-N 0.000 description 2
- AUJWXNGCAQWLEI-KBPBESRZSA-N Phe-Lys-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O AUJWXNGCAQWLEI-KBPBESRZSA-N 0.000 description 2
- CZQZSMJXFGGBHM-KKUMJFAQSA-N Phe-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O CZQZSMJXFGGBHM-KKUMJFAQSA-N 0.000 description 2
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 2
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 2
- HJSCRFZVGXAGNG-SRVKXCTJSA-N Pro-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H]1CCCN1 HJSCRFZVGXAGNG-SRVKXCTJSA-N 0.000 description 2
- 108010003201 RGH 0205 Proteins 0.000 description 2
- HJEBZBMOTCQYDN-ACZMJKKPSA-N Ser-Glu-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HJEBZBMOTCQYDN-ACZMJKKPSA-N 0.000 description 2
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 2
- PPCZVWHJWJFTFN-ZLUOBGJFSA-N Ser-Ser-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O PPCZVWHJWJFTFN-ZLUOBGJFSA-N 0.000 description 2
- YZUWGFXVVZQJEI-PMVVWTBXSA-N Thr-Gly-His Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O YZUWGFXVVZQJEI-PMVVWTBXSA-N 0.000 description 2
- GXUWHVZYDAHFSV-FLBSBUHZSA-N Thr-Ile-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GXUWHVZYDAHFSV-FLBSBUHZSA-N 0.000 description 2
- YEGMNOHLZNGOCG-UBHSHLNASA-N Trp-Asn-Asn Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O YEGMNOHLZNGOCG-UBHSHLNASA-N 0.000 description 2
- OFCKFBGRYHOKFP-IHPCNDPISA-N Trp-Asp-Tyr Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N OFCKFBGRYHOKFP-IHPCNDPISA-N 0.000 description 2
- XHALUUQSNXSPLP-UFYCRDLUSA-N Tyr-Arg-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 XHALUUQSNXSPLP-UFYCRDLUSA-N 0.000 description 2
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 2
- ZOBLBMGJKVJVEV-BZSNNMDCSA-N Tyr-Lys-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O ZOBLBMGJKVJVEV-BZSNNMDCSA-N 0.000 description 2
- CWVHKVVKAQIJKY-ACRUOGEOSA-N Tyr-Lys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC2=CC=C(C=C2)O)N CWVHKVVKAQIJKY-ACRUOGEOSA-N 0.000 description 2
- 238000001261 affinity purification Methods 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 2
- 229960000723 ampicillin Drugs 0.000 description 2
- 108010062796 arginyllysine Proteins 0.000 description 2
- 108010077245 asparaginyl-proline Proteins 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000010835 comparative analysis Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 2
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 2
- 238000002405 diagnostic procedure Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000001973 epigenetic effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000002950 fibroblast Anatomy 0.000 description 2
- 108010080575 glutamyl-aspartyl-alanine Proteins 0.000 description 2
- 230000013595 glycosylation Effects 0.000 description 2
- 238000006206 glycosylation reaction Methods 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010087823 glycyltyrosine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 239000000543 intermediate Substances 0.000 description 2
- 108010034529 leucyl-lysine Proteins 0.000 description 2
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 235000011056 potassium acetate Nutrition 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 238000013207 serial dilution Methods 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 2
- 108010051110 tyrosyl-lysine Proteins 0.000 description 2
- 108010020532 tyrosyl-proline Proteins 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- FDKWRPBBCBCIGA-REOHCLBHSA-N (2r)-2-azaniumyl-3-$l^{1}-selanylpropanoate Chemical compound [Se]C[C@H](N)C(O)=O FDKWRPBBCBCIGA-REOHCLBHSA-N 0.000 description 1
- NTUPOKHATNSWCY-PMPSAXMXSA-N (2s)-2-[[(2s)-1-[(2r)-2-amino-3-phenylpropanoyl]pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound C([C@@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)C1=CC=CC=C1 NTUPOKHATNSWCY-PMPSAXMXSA-N 0.000 description 1
- AXFMEGAFCUULFV-BLFANLJRSA-N (2s)-2-[[(2s)-1-[(2s,3r)-2-amino-3-methylpentanoyl]pyrrolidine-2-carbonyl]amino]pentanedioic acid Chemical compound CC[C@@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O AXFMEGAFCUULFV-BLFANLJRSA-N 0.000 description 1
- JBFQOLHAGBKPTP-NZATWWQASA-N (2s)-2-[[(2s)-4-carboxy-2-[[3-carboxy-2-[[(2s)-2,6-diaminohexanoyl]amino]propanoyl]amino]butanoyl]amino]-4-methylpentanoic acid Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)C(CC(O)=O)NC(=O)[C@@H](N)CCCCN JBFQOLHAGBKPTP-NZATWWQASA-N 0.000 description 1
- JFOWDKWFHZIMTR-RUCXOUQFSA-N (2s)-2-aminopentanedioic acid;(2s)-2,5-diamino-5-oxopentanoic acid Chemical compound OC(=O)[C@@H](N)CCC(N)=O.OC(=O)[C@@H](N)CCC(O)=O JFOWDKWFHZIMTR-RUCXOUQFSA-N 0.000 description 1
- OWEGMIWEEQEYGQ-UHFFFAOYSA-N 100676-05-9 Natural products OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OC2C(OC(O)C(O)C2O)CO)O1 OWEGMIWEEQEYGQ-UHFFFAOYSA-N 0.000 description 1
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- WQVFQXXBNHHPLX-ZKWXMUAHSA-N Ala-Ala-His Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O WQVFQXXBNHHPLX-ZKWXMUAHSA-N 0.000 description 1
- DVWVZSJAYIJZFI-FXQIFTODSA-N Ala-Arg-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O DVWVZSJAYIJZFI-FXQIFTODSA-N 0.000 description 1
- UCIYCBSJBQGDGM-LPEHRKFASA-N Ala-Arg-Pro Chemical group C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N UCIYCBSJBQGDGM-LPEHRKFASA-N 0.000 description 1
- CVGNCMIULZNYES-WHFBIAKZSA-N Ala-Asn-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CVGNCMIULZNYES-WHFBIAKZSA-N 0.000 description 1
- WXERCAHAIKMTKX-ZLUOBGJFSA-N Ala-Asp-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O WXERCAHAIKMTKX-ZLUOBGJFSA-N 0.000 description 1
- KIUYPHAMDKDICO-WHFBIAKZSA-N Ala-Asp-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O KIUYPHAMDKDICO-WHFBIAKZSA-N 0.000 description 1
- GWFSQQNGMPGBEF-GHCJXIJMSA-N Ala-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N GWFSQQNGMPGBEF-GHCJXIJMSA-N 0.000 description 1
- ZIWWTZWAKYBUOB-CIUDSAMLSA-N Ala-Asp-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O ZIWWTZWAKYBUOB-CIUDSAMLSA-N 0.000 description 1
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 1
- HFBFSOAKPUZCCO-ZLUOBGJFSA-N Ala-Cys-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N HFBFSOAKPUZCCO-ZLUOBGJFSA-N 0.000 description 1
- LGFCAXJBAZESCF-ACZMJKKPSA-N Ala-Gln-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O LGFCAXJBAZESCF-ACZMJKKPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- FAJIYNONGXEXAI-CQDKDKBSSA-N Ala-His-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CNC=N1 FAJIYNONGXEXAI-CQDKDKBSSA-N 0.000 description 1
- CKLDHDOIYBVUNP-KBIXCLLPSA-N Ala-Ile-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O CKLDHDOIYBVUNP-KBIXCLLPSA-N 0.000 description 1
- RZZMZYZXNJRPOJ-BJDJZHNGSA-N Ala-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](C)N RZZMZYZXNJRPOJ-BJDJZHNGSA-N 0.000 description 1
- QCTFKEJEIMPOLW-JURCDPSOSA-N Ala-Ile-Phe Chemical compound C[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCTFKEJEIMPOLW-JURCDPSOSA-N 0.000 description 1
- YHKANGMVQWRMAP-DCAQKATOSA-N Ala-Leu-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YHKANGMVQWRMAP-DCAQKATOSA-N 0.000 description 1
- SUMYEVXWCAYLLJ-GUBZILKMSA-N Ala-Leu-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O SUMYEVXWCAYLLJ-GUBZILKMSA-N 0.000 description 1
- DPNZTBKGAUAZQU-DLOVCJGASA-N Ala-Leu-His Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N DPNZTBKGAUAZQU-DLOVCJGASA-N 0.000 description 1
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- SDZRIBWEVVRDQI-CIUDSAMLSA-N Ala-Lys-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O SDZRIBWEVVRDQI-CIUDSAMLSA-N 0.000 description 1
- PIXQDIGKDNNOOV-GUBZILKMSA-N Ala-Lys-Gln Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O PIXQDIGKDNNOOV-GUBZILKMSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- VCSABYLVNWQYQE-UHFFFAOYSA-N Ala-Lys-Lys Natural products NCCCCC(NC(=O)C(N)C)C(=O)NC(CCCCN)C(O)=O VCSABYLVNWQYQE-UHFFFAOYSA-N 0.000 description 1
- NLOMBWNGESDVJU-GUBZILKMSA-N Ala-Met-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLOMBWNGESDVJU-GUBZILKMSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- HYIDEIQUCBKIPL-CQDKDKBSSA-N Ala-Phe-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N HYIDEIQUCBKIPL-CQDKDKBSSA-N 0.000 description 1
- OSRZOHXQCUFIQG-FPMFFAJLSA-N Ala-Phe-Pro Chemical compound C([C@H](NC(=O)[C@@H]([NH3+])C)C(=O)N1[C@H](CCC1)C([O-])=O)C1=CC=CC=C1 OSRZOHXQCUFIQG-FPMFFAJLSA-N 0.000 description 1
- XAXHGSOBFPIRFG-LSJOCFKGSA-N Ala-Pro-His Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XAXHGSOBFPIRFG-LSJOCFKGSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- LSMDIAAALJJLRO-XQXXSGGOSA-N Ala-Thr-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O LSMDIAAALJJLRO-XQXXSGGOSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- ALZVPLKYDKJKQU-XVKPBYJWSA-N Ala-Tyr Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 ALZVPLKYDKJKQU-XVKPBYJWSA-N 0.000 description 1
- MCYJBCKCAPERSE-FXQIFTODSA-N Arg-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N MCYJBCKCAPERSE-FXQIFTODSA-N 0.000 description 1
- VYSRNGOMGHOJCK-GUBZILKMSA-N Arg-Ala-Met Chemical compound C[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N VYSRNGOMGHOJCK-GUBZILKMSA-N 0.000 description 1
- XPSGESXVBSQZPL-SRVKXCTJSA-N Arg-Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XPSGESXVBSQZPL-SRVKXCTJSA-N 0.000 description 1
- XEPSCVXTCUUHDT-AVGNSLFASA-N Arg-Arg-Leu Natural products CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCN=C(N)N XEPSCVXTCUUHDT-AVGNSLFASA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- SIFXMYAHXJGAFC-WDSKDSINSA-N Arg-Asp Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O SIFXMYAHXJGAFC-WDSKDSINSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 1
- SQKPKIJVWHAWNF-DCAQKATOSA-N Arg-Asp-Lys Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(O)=O SQKPKIJVWHAWNF-DCAQKATOSA-N 0.000 description 1
- VDBKFYYIBLXEIF-GUBZILKMSA-N Arg-Gln-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O VDBKFYYIBLXEIF-GUBZILKMSA-N 0.000 description 1
- HPKSHFSEXICTLI-CIUDSAMLSA-N Arg-Glu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O HPKSHFSEXICTLI-CIUDSAMLSA-N 0.000 description 1
- PBSOQGZLPFVXPU-YUMQZZPRSA-N Arg-Glu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O PBSOQGZLPFVXPU-YUMQZZPRSA-N 0.000 description 1
- OHYQKYUTLIPFOX-ZPFDUUQYSA-N Arg-Glu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O OHYQKYUTLIPFOX-ZPFDUUQYSA-N 0.000 description 1
- XUUXCWCKKCZEAW-YFKPBYRVSA-N Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N XUUXCWCKKCZEAW-YFKPBYRVSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- AUFHLLPVPSMEOG-YUMQZZPRSA-N Arg-Gly-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AUFHLLPVPSMEOG-YUMQZZPRSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- ZJEDSBGPBXVBMP-PYJNHQTQSA-N Arg-His-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O ZJEDSBGPBXVBMP-PYJNHQTQSA-N 0.000 description 1
- NVUIWHJLPSZZQC-CYDGBPFRSA-N Arg-Ile-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NVUIWHJLPSZZQC-CYDGBPFRSA-N 0.000 description 1
- YKBHOXLMMPZPHQ-GMOBBJLQSA-N Arg-Ile-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O YKBHOXLMMPZPHQ-GMOBBJLQSA-N 0.000 description 1
- AGVNTAUPLWIQEN-ZPFDUUQYSA-N Arg-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AGVNTAUPLWIQEN-ZPFDUUQYSA-N 0.000 description 1
- LKDHUGLXOHYINY-XUXIUFHCSA-N Arg-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N LKDHUGLXOHYINY-XUXIUFHCSA-N 0.000 description 1
- GXXWTNKNFFKTJB-NAKRPEOUSA-N Arg-Ile-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O GXXWTNKNFFKTJB-NAKRPEOUSA-N 0.000 description 1
- ZDBWKBCKYJGKGP-DCAQKATOSA-N Arg-Leu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O ZDBWKBCKYJGKGP-DCAQKATOSA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- OGSQONVYSTZIJB-WDSOQIARSA-N Arg-Leu-Trp Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCN=C(N)N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(O)=O OGSQONVYSTZIJB-WDSOQIARSA-N 0.000 description 1
- XUGATJVGQUGQKY-ULQDDVLXSA-N Arg-Lys-Phe Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XUGATJVGQUGQKY-ULQDDVLXSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- AMIQZQAAYGYKOP-FXQIFTODSA-N Arg-Ser-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O AMIQZQAAYGYKOP-FXQIFTODSA-N 0.000 description 1
- DDBMKOCQWNFDBH-RHYQMDGZSA-N Arg-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O DDBMKOCQWNFDBH-RHYQMDGZSA-N 0.000 description 1
- CTAPSNCVKPOOSM-KKUMJFAQSA-N Arg-Tyr-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O CTAPSNCVKPOOSM-KKUMJFAQSA-N 0.000 description 1
- XRLOBFSLPCHYLQ-ULQDDVLXSA-N Arg-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O XRLOBFSLPCHYLQ-ULQDDVLXSA-N 0.000 description 1
- NMTANZXPDAHUKU-ULQDDVLXSA-N Arg-Tyr-Lys Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCCCN)C(O)=O)CC1=CC=C(O)C=C1 NMTANZXPDAHUKU-ULQDDVLXSA-N 0.000 description 1
- CMLGVVWQQHUXOZ-GHCJXIJMSA-N Asn-Ala-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O CMLGVVWQQHUXOZ-GHCJXIJMSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical group [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- HOIFSHOLNKQCSA-FXQIFTODSA-N Asn-Arg-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O HOIFSHOLNKQCSA-FXQIFTODSA-N 0.000 description 1
- MEFGKQUUYZOLHM-GMOBBJLQSA-N Asn-Arg-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MEFGKQUUYZOLHM-GMOBBJLQSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- APHUDFFMXFYRKP-CIUDSAMLSA-N Asn-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N APHUDFFMXFYRKP-CIUDSAMLSA-N 0.000 description 1
- KXEGPPNPXOKKHK-ZLUOBGJFSA-N Asn-Asp-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O KXEGPPNPXOKKHK-ZLUOBGJFSA-N 0.000 description 1
- BHQQRVARKXWXPP-ACZMJKKPSA-N Asn-Asp-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N BHQQRVARKXWXPP-ACZMJKKPSA-N 0.000 description 1
- FJIRXKVEDFLLOQ-SRVKXCTJSA-N Asn-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)N)N FJIRXKVEDFLLOQ-SRVKXCTJSA-N 0.000 description 1
- FAEFJTCTNZTPHX-ACZMJKKPSA-N Asn-Gln-Ala Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O FAEFJTCTNZTPHX-ACZMJKKPSA-N 0.000 description 1
- QNJIRRVTOXNGMH-GUBZILKMSA-N Asn-Gln-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC(N)=O QNJIRRVTOXNGMH-GUBZILKMSA-N 0.000 description 1
- UEONJSPBTSWKOI-CIUDSAMLSA-N Asn-Gln-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCSC)C(O)=O UEONJSPBTSWKOI-CIUDSAMLSA-N 0.000 description 1
- OKZOABJQOMAYEC-NUMRIWBASA-N Asn-Gln-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OKZOABJQOMAYEC-NUMRIWBASA-N 0.000 description 1
- ULRPXVNMIIYDDJ-ACZMJKKPSA-N Asn-Glu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N ULRPXVNMIIYDDJ-ACZMJKKPSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- OGMDXNFGPOPZTK-GUBZILKMSA-N Asn-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N OGMDXNFGPOPZTK-GUBZILKMSA-N 0.000 description 1
- OLGCWMNDJTWQAG-GUBZILKMSA-N Asn-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC(N)=O OLGCWMNDJTWQAG-GUBZILKMSA-N 0.000 description 1
- COUZKSSMBFADSB-AVGNSLFASA-N Asn-Glu-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC(=O)N)N COUZKSSMBFADSB-AVGNSLFASA-N 0.000 description 1
- XVBDDUPJVQXDSI-PEFMBERDSA-N Asn-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N XVBDDUPJVQXDSI-PEFMBERDSA-N 0.000 description 1
- KMCRKVOLRCOMBG-DJFWLOJKSA-N Asn-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N KMCRKVOLRCOMBG-DJFWLOJKSA-N 0.000 description 1
- HDHZCEDPLTVHFZ-GUBZILKMSA-N Asn-Leu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O HDHZCEDPLTVHFZ-GUBZILKMSA-N 0.000 description 1
- WIDVAWAQBRAKTI-YUMQZZPRSA-N Asn-Leu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O WIDVAWAQBRAKTI-YUMQZZPRSA-N 0.000 description 1
- GLWFAWNYGWBMOC-SRVKXCTJSA-N Asn-Leu-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O GLWFAWNYGWBMOC-SRVKXCTJSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- QJMCHPGWFZZRID-BQBZGAKWSA-N Asn-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(N)=O QJMCHPGWFZZRID-BQBZGAKWSA-N 0.000 description 1
- FBODFHMLALOPHP-GUBZILKMSA-N Asn-Lys-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O FBODFHMLALOPHP-GUBZILKMSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- XMHFCUKJRCQXGI-CIUDSAMLSA-N Asn-Pro-Gln Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CC(=O)N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O XMHFCUKJRCQXGI-CIUDSAMLSA-N 0.000 description 1
- VWADICJNCPFKJS-ZLUOBGJFSA-N Asn-Ser-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O VWADICJNCPFKJS-ZLUOBGJFSA-N 0.000 description 1
- VLDRQOHCMKCXLY-SRVKXCTJSA-N Asn-Ser-Phe Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VLDRQOHCMKCXLY-SRVKXCTJSA-N 0.000 description 1
- FMNBYVSGRCXWEK-FOHZUACHSA-N Asn-Thr-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O FMNBYVSGRCXWEK-FOHZUACHSA-N 0.000 description 1
- PUUPMDXIHCOPJU-HJGDQZAQSA-N Asn-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O PUUPMDXIHCOPJU-HJGDQZAQSA-N 0.000 description 1
- SKQTXVZTCGSRJS-SRVKXCTJSA-N Asn-Tyr-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O SKQTXVZTCGSRJS-SRVKXCTJSA-N 0.000 description 1
- QNNBHTFDFFFHGC-KKUMJFAQSA-N Asn-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O QNNBHTFDFFFHGC-KKUMJFAQSA-N 0.000 description 1
- GBAWQWASNGUNQF-ZLUOBGJFSA-N Asp-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)O)N GBAWQWASNGUNQF-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- ILJQISGMGXRZQQ-IHRRRGAJSA-N Asp-Arg-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ILJQISGMGXRZQQ-IHRRRGAJSA-N 0.000 description 1
- UQBGYPFHWFZMCD-ZLUOBGJFSA-N Asp-Asn-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O UQBGYPFHWFZMCD-ZLUOBGJFSA-N 0.000 description 1
- FRYULLIZUDQONW-IMJSIDKUSA-N Asp-Asp Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(O)=O FRYULLIZUDQONW-IMJSIDKUSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- AAIUGNSRQDGCDC-ZLUOBGJFSA-N Asp-Cys-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(=O)O)N)C(=O)O AAIUGNSRQDGCDC-ZLUOBGJFSA-N 0.000 description 1
- UWOPETAWXDZUJR-ACZMJKKPSA-N Asp-Cys-Glu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O UWOPETAWXDZUJR-ACZMJKKPSA-N 0.000 description 1
- PMEHKVHZQKJACS-PEFMBERDSA-N Asp-Gln-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PMEHKVHZQKJACS-PEFMBERDSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- IJHUZMGJRGNXIW-CIUDSAMLSA-N Asp-Glu-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IJHUZMGJRGNXIW-CIUDSAMLSA-N 0.000 description 1
- QCVXMEHGFUMKCO-YUMQZZPRSA-N Asp-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(O)=O QCVXMEHGFUMKCO-YUMQZZPRSA-N 0.000 description 1
- SNDBKTFJWVEVPO-WHFBIAKZSA-N Asp-Gly-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](CO)C(O)=O SNDBKTFJWVEVPO-WHFBIAKZSA-N 0.000 description 1
- SVABRQFIHCSNCI-FOHZUACHSA-N Asp-Gly-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O SVABRQFIHCSNCI-FOHZUACHSA-N 0.000 description 1
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 1
- CJUKAWUWBZCTDQ-SRVKXCTJSA-N Asp-Leu-Lys Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O CJUKAWUWBZCTDQ-SRVKXCTJSA-N 0.000 description 1
- OAMLVOVXNKILLQ-BQBZGAKWSA-N Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC(O)=O OAMLVOVXNKILLQ-BQBZGAKWSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- NVFSJIXJZCDICF-SRVKXCTJSA-N Asp-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N NVFSJIXJZCDICF-SRVKXCTJSA-N 0.000 description 1
- ZXRQJQCXPSMNMR-XIRDDKMYSA-N Asp-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)O)N ZXRQJQCXPSMNMR-XIRDDKMYSA-N 0.000 description 1
- WWOYXVBGHAHQBG-FXQIFTODSA-N Asp-Met-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O WWOYXVBGHAHQBG-FXQIFTODSA-N 0.000 description 1
- RPUYTJJZXQBWDT-SRVKXCTJSA-N Asp-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC(=O)O)N RPUYTJJZXQBWDT-SRVKXCTJSA-N 0.000 description 1
- USNJAPJZSGTTPX-XVSYOHENSA-N Asp-Phe-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O USNJAPJZSGTTPX-XVSYOHENSA-N 0.000 description 1
- UKGGPJNBONZZCM-WDSKDSINSA-N Asp-Pro Chemical compound OC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O UKGGPJNBONZZCM-WDSKDSINSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- NAAAPCLFJPURAM-HJGDQZAQSA-N Asp-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O NAAAPCLFJPURAM-HJGDQZAQSA-N 0.000 description 1
- GXHDGYOXPNQCKM-XVSYOHENSA-N Asp-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O GXHDGYOXPNQCKM-XVSYOHENSA-N 0.000 description 1
- LEYKQPDPZJIRTA-AQZXSJQPSA-N Asp-Trp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LEYKQPDPZJIRTA-AQZXSJQPSA-N 0.000 description 1
- HCOQNGIHSXICCB-IHRRRGAJSA-N Asp-Tyr-Arg Chemical compound N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)O HCOQNGIHSXICCB-IHRRRGAJSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- 108090001008 Avidin Proteins 0.000 description 1
- 241000194107 Bacillus megaterium Species 0.000 description 1
- 241000281532 Bacillus megaterium DSM 319 Species 0.000 description 1
- 241000186016 Bifidobacterium bifidum Species 0.000 description 1
- 241000933531 Bifidobacterium bifidum NCIMB 41171 Species 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 108091029430 CpG site Proteins 0.000 description 1
- JIVJXVJMOBVCJF-ZLUOBGJFSA-N Cys-Asn-Cys Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CS)N)C(=O)N JIVJXVJMOBVCJF-ZLUOBGJFSA-N 0.000 description 1
- UPJGYXRAPJWIHD-CIUDSAMLSA-N Cys-Asn-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UPJGYXRAPJWIHD-CIUDSAMLSA-N 0.000 description 1
- MKMKILWCRQLDFJ-DCAQKATOSA-N Cys-Lys-Arg Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MKMKILWCRQLDFJ-DCAQKATOSA-N 0.000 description 1
- LHMSYHSAAJOEBL-CIUDSAMLSA-N Cys-Lys-Asn Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O LHMSYHSAAJOEBL-CIUDSAMLSA-N 0.000 description 1
- FDKWRPBBCBCIGA-UWTATZPHSA-N D-Selenocysteine Natural products [Se]C[C@@H](N)C(O)=O FDKWRPBBCBCIGA-UWTATZPHSA-N 0.000 description 1
- 230000033616 DNA repair Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- OVQXQLWWJSNYFV-XEGUGMAKSA-N Gln-Ala-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCC(N)=O)C)C(O)=O)=CNC2=C1 OVQXQLWWJSNYFV-XEGUGMAKSA-N 0.000 description 1
- RGXXLQWXBFNXTG-CIUDSAMLSA-N Gln-Arg-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O RGXXLQWXBFNXTG-CIUDSAMLSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- PGPJSRSLQNXBDT-YUMQZZPRSA-N Gln-Arg-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O PGPJSRSLQNXBDT-YUMQZZPRSA-N 0.000 description 1
- AJDMYLOISOCHHC-YVNDNENWSA-N Gln-Gln-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O AJDMYLOISOCHHC-YVNDNENWSA-N 0.000 description 1
- GHYJGDCPHMSFEJ-GUBZILKMSA-N Gln-Gln-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCC(=O)N)N GHYJGDCPHMSFEJ-GUBZILKMSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KCJJFESQRXGTGC-BQBZGAKWSA-N Gln-Glu-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O KCJJFESQRXGTGC-BQBZGAKWSA-N 0.000 description 1
- ZNZPKVQURDQFFS-FXQIFTODSA-N Gln-Glu-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O ZNZPKVQURDQFFS-FXQIFTODSA-N 0.000 description 1
- FGYPOQPQTUNESW-IUCAKERBSA-N Gln-Gly-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N FGYPOQPQTUNESW-IUCAKERBSA-N 0.000 description 1
- LKVCNGLNTAPMSZ-JYJNAYRXSA-N Gln-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)N)N LKVCNGLNTAPMSZ-JYJNAYRXSA-N 0.000 description 1
- KHGGWBRVRPHFMH-PEFMBERDSA-N Gln-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N KHGGWBRVRPHFMH-PEFMBERDSA-N 0.000 description 1
- ITZWDGBYBPUZRG-KBIXCLLPSA-N Gln-Ile-Ser Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O ITZWDGBYBPUZRG-KBIXCLLPSA-N 0.000 description 1
- HYPVLWGNBIYTNA-GUBZILKMSA-N Gln-Leu-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HYPVLWGNBIYTNA-GUBZILKMSA-N 0.000 description 1
- VZRAXPGTUNDIDK-GUBZILKMSA-N Gln-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N VZRAXPGTUNDIDK-GUBZILKMSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- JRHPEMVLTRADLJ-AVGNSLFASA-N Gln-Lys-Lys Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N JRHPEMVLTRADLJ-AVGNSLFASA-N 0.000 description 1
- SFAFZYYMAWOCIC-KKUMJFAQSA-N Gln-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N SFAFZYYMAWOCIC-KKUMJFAQSA-N 0.000 description 1
- PBYFVIQRFLNQCO-GUBZILKMSA-N Gln-Pro-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O PBYFVIQRFLNQCO-GUBZILKMSA-N 0.000 description 1
- NPMFDZGLKBNFOO-SRVKXCTJSA-N Gln-Pro-His Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CN=CN1 NPMFDZGLKBNFOO-SRVKXCTJSA-N 0.000 description 1
- XKPACHRGOWQHFH-IRIUXVKKSA-N Gln-Thr-Tyr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O XKPACHRGOWQHFH-IRIUXVKKSA-N 0.000 description 1
- KGNSGRRALVIRGR-QWRGUYRKSA-N Gln-Tyr Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KGNSGRRALVIRGR-QWRGUYRKSA-N 0.000 description 1
- WIMVKDYAKRAUCG-IHRRRGAJSA-N Gln-Tyr-Glu Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O WIMVKDYAKRAUCG-IHRRRGAJSA-N 0.000 description 1
- WZZSKAJIHTUUSG-ACZMJKKPSA-N Glu-Ala-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O WZZSKAJIHTUUSG-ACZMJKKPSA-N 0.000 description 1
- BPDVTFBJZNBHEU-HGNGGELXSA-N Glu-Ala-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 BPDVTFBJZNBHEU-HGNGGELXSA-N 0.000 description 1
- ITYRYNUZHPNCIK-GUBZILKMSA-N Glu-Ala-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O ITYRYNUZHPNCIK-GUBZILKMSA-N 0.000 description 1
- CGYDXNKRIMJMLV-GUBZILKMSA-N Glu-Arg-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O CGYDXNKRIMJMLV-GUBZILKMSA-N 0.000 description 1
- WOSRKEJQESVHGA-CIUDSAMLSA-N Glu-Arg-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O WOSRKEJQESVHGA-CIUDSAMLSA-N 0.000 description 1
- AFODTOLGSZQDSL-PEFMBERDSA-N Glu-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCC(=O)O)N AFODTOLGSZQDSL-PEFMBERDSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- SBCYJMOOHUDWDA-NUMRIWBASA-N Glu-Asp-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SBCYJMOOHUDWDA-NUMRIWBASA-N 0.000 description 1
- OBIHEDRRSMRKLU-ACZMJKKPSA-N Glu-Cys-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)O)C(=O)O)N OBIHEDRRSMRKLU-ACZMJKKPSA-N 0.000 description 1
- ALCAUWPAMLVUDB-FXQIFTODSA-N Glu-Gln-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ALCAUWPAMLVUDB-FXQIFTODSA-N 0.000 description 1
- PXHABOCPJVTGEK-BQBZGAKWSA-N Glu-Gln-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O PXHABOCPJVTGEK-BQBZGAKWSA-N 0.000 description 1
- WPLGNDORMXTMQS-FXQIFTODSA-N Glu-Gln-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O WPLGNDORMXTMQS-FXQIFTODSA-N 0.000 description 1
- NKLRYVLERDYDBI-FXQIFTODSA-N Glu-Glu-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O NKLRYVLERDYDBI-FXQIFTODSA-N 0.000 description 1
- APHGWLWMOXGZRL-DCAQKATOSA-N Glu-Glu-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O APHGWLWMOXGZRL-DCAQKATOSA-N 0.000 description 1
- IQACOVZVOMVILH-FXQIFTODSA-N Glu-Glu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O IQACOVZVOMVILH-FXQIFTODSA-N 0.000 description 1
- QYPKJXSMLMREKF-BPUTZDHNSA-N Glu-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCC(=O)O)N QYPKJXSMLMREKF-BPUTZDHNSA-N 0.000 description 1
- MTAOBYXRYJZRGQ-WDSKDSINSA-N Glu-Gly-Asp Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MTAOBYXRYJZRGQ-WDSKDSINSA-N 0.000 description 1
- ZJFNRQHUIHKZJF-GUBZILKMSA-N Glu-His-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O ZJFNRQHUIHKZJF-GUBZILKMSA-N 0.000 description 1
- VGUYMZGLJUJRBV-YVNDNENWSA-N Glu-Ile-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VGUYMZGLJUJRBV-YVNDNENWSA-N 0.000 description 1
- BKRQSECBKKCCKW-HVTMNAMFSA-N Glu-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)O)N BKRQSECBKKCCKW-HVTMNAMFSA-N 0.000 description 1
- VMKCPNBBPGGQBJ-GUBZILKMSA-N Glu-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VMKCPNBBPGGQBJ-GUBZILKMSA-N 0.000 description 1
- PJBVXVBTTFZPHJ-GUBZILKMSA-N Glu-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N PJBVXVBTTFZPHJ-GUBZILKMSA-N 0.000 description 1
- FBEJIDRSQCGFJI-GUBZILKMSA-N Glu-Leu-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O FBEJIDRSQCGFJI-GUBZILKMSA-N 0.000 description 1
- IOUQWHIEQYQVFD-JYJNAYRXSA-N Glu-Leu-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O IOUQWHIEQYQVFD-JYJNAYRXSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- YGLCLCMAYUYZSG-AVGNSLFASA-N Glu-Lys-His Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 YGLCLCMAYUYZSG-AVGNSLFASA-N 0.000 description 1
- YKBUCXNNBYZYAY-MNXVOIDGSA-N Glu-Lys-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YKBUCXNNBYZYAY-MNXVOIDGSA-N 0.000 description 1
- OFIHURVSQXAZIR-SZMVWBNQSA-N Glu-Lys-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O OFIHURVSQXAZIR-SZMVWBNQSA-N 0.000 description 1
- LHIPZASLKPYDPI-AVGNSLFASA-N Glu-Phe-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LHIPZASLKPYDPI-AVGNSLFASA-N 0.000 description 1
- FQFWFZWOHOEVMZ-IHRRRGAJSA-N Glu-Phe-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O FQFWFZWOHOEVMZ-IHRRRGAJSA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- JPUNZXVHHRZMNL-XIRDDKMYSA-N Glu-Pro-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O JPUNZXVHHRZMNL-XIRDDKMYSA-N 0.000 description 1
- MRWYPDWDZSLWJM-ACZMJKKPSA-N Glu-Ser-Asp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O MRWYPDWDZSLWJM-ACZMJKKPSA-N 0.000 description 1
- RFTVTKBHDXCEEX-WDSKDSINSA-N Glu-Ser-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RFTVTKBHDXCEEX-WDSKDSINSA-N 0.000 description 1
- QVXWAFZDWRLXTI-NWLDYVSISA-N Glu-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QVXWAFZDWRLXTI-NWLDYVSISA-N 0.000 description 1
- VHPVBPCCWVDGJL-IRIUXVKKSA-N Glu-Thr-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VHPVBPCCWVDGJL-IRIUXVKKSA-N 0.000 description 1
- VJVAQZYGLMJPTK-QEJZJMRPSA-N Glu-Trp-Asp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CCC(=O)O)N VJVAQZYGLMJPTK-QEJZJMRPSA-N 0.000 description 1
- UCZXXMREFIETQW-AVGNSLFASA-N Glu-Tyr-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O UCZXXMREFIETQW-AVGNSLFASA-N 0.000 description 1
- QOOFKCCZZWTCEP-AVGNSLFASA-N Glu-Tyr-Cys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O QOOFKCCZZWTCEP-AVGNSLFASA-N 0.000 description 1
- MFYLRRCYBBJYPI-JYJNAYRXSA-N Glu-Tyr-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N)O MFYLRRCYBBJYPI-JYJNAYRXSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- OCQUNKSFDYDXBG-QXEWZRGKSA-N Gly-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OCQUNKSFDYDXBG-QXEWZRGKSA-N 0.000 description 1
- GWCRIHNSVMOBEQ-BQBZGAKWSA-N Gly-Arg-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O GWCRIHNSVMOBEQ-BQBZGAKWSA-N 0.000 description 1
- DTPOVRRYXPJJAZ-FJXKBIBVSA-N Gly-Arg-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N DTPOVRRYXPJJAZ-FJXKBIBVSA-N 0.000 description 1
- JVACNFOPSUPDTK-QWRGUYRKSA-N Gly-Asn-Phe Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JVACNFOPSUPDTK-QWRGUYRKSA-N 0.000 description 1
- SUDUYJOBLHQAMI-WHFBIAKZSA-N Gly-Asp-Cys Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CS)C(O)=O SUDUYJOBLHQAMI-WHFBIAKZSA-N 0.000 description 1
- LXXLEUBUOMCAMR-NKWVEPMBSA-N Gly-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)CN)C(=O)O LXXLEUBUOMCAMR-NKWVEPMBSA-N 0.000 description 1
- VOCMRCVMAPSSAL-IUCAKERBSA-N Gly-Gln-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)CN VOCMRCVMAPSSAL-IUCAKERBSA-N 0.000 description 1
- AYBKPDHHVADEDA-YUMQZZPRSA-N Gly-His-Asn Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(N)=O)C(O)=O AYBKPDHHVADEDA-YUMQZZPRSA-N 0.000 description 1
- ORXZVPZCPMKHNR-IUCAKERBSA-N Gly-His-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CNC=N1 ORXZVPZCPMKHNR-IUCAKERBSA-N 0.000 description 1
- VIIBEIQMLJEUJG-LAEOZQHASA-N Gly-Ile-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O VIIBEIQMLJEUJG-LAEOZQHASA-N 0.000 description 1
- DENRBIYENOKSEX-PEXQALLHSA-N Gly-Ile-His Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 DENRBIYENOKSEX-PEXQALLHSA-N 0.000 description 1
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- DHNXGWVNLFPOMQ-KBPBESRZSA-N Gly-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)CN DHNXGWVNLFPOMQ-KBPBESRZSA-N 0.000 description 1
- SCJJPCQUJYPHRZ-BQBZGAKWSA-N Gly-Pro-Asn Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O SCJJPCQUJYPHRZ-BQBZGAKWSA-N 0.000 description 1
- ZZJVYSAQQMDIRD-UWVGGRQHSA-N Gly-Pro-His Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O ZZJVYSAQQMDIRD-UWVGGRQHSA-N 0.000 description 1
- FGPLUIQCSKGLTI-WDSKDSINSA-N Gly-Ser-Glu Chemical compound NCC(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O FGPLUIQCSKGLTI-WDSKDSINSA-N 0.000 description 1
- YXTFLTJYLIAZQG-FJXKBIBVSA-N Gly-Thr-Arg Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YXTFLTJYLIAZQG-FJXKBIBVSA-N 0.000 description 1
- PYFHPYDQHCEVIT-KBPBESRZSA-N Gly-Trp-Gln Chemical compound [H]NCC(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(N)=O)C(O)=O PYFHPYDQHCEVIT-KBPBESRZSA-N 0.000 description 1
- XBGGUPMXALFZOT-VIFPVBQESA-N Gly-Tyr Chemical compound NCC(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-VIFPVBQESA-N 0.000 description 1
- KOYUSMBPJOVSOO-XEGUGMAKSA-N Gly-Tyr-Ile Chemical compound [H]NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KOYUSMBPJOVSOO-XEGUGMAKSA-N 0.000 description 1
- 102220550418 High affinity immunoglobulin alpha and immunoglobulin mu Fc receptor_I80P_mutation Human genes 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- SOFSRBYHDINIRG-QTKMDUPCSA-N His-Arg-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC1=CN=CN1)N)O SOFSRBYHDINIRG-QTKMDUPCSA-N 0.000 description 1
- VOKCBYNCZVSILJ-KKUMJFAQSA-N His-Asn-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC2=CN=CN2)N)O VOKCBYNCZVSILJ-KKUMJFAQSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- LIEIYPBMQJLASB-SRVKXCTJSA-N His-Gln-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 LIEIYPBMQJLASB-SRVKXCTJSA-N 0.000 description 1
- NWGXCPUKPVISSJ-AVGNSLFASA-N His-Gln-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NWGXCPUKPVISSJ-AVGNSLFASA-N 0.000 description 1
- JWLWNCVBBSBCEM-NKIYYHGXSA-N His-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N)O JWLWNCVBBSBCEM-NKIYYHGXSA-N 0.000 description 1
- BQFGKVYHKCNEMF-DCAQKATOSA-N His-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 BQFGKVYHKCNEMF-DCAQKATOSA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- AKAPKBNIVNPIPO-KKUMJFAQSA-N His-His-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1NC=NC=1)C1=CN=CN1 AKAPKBNIVNPIPO-KKUMJFAQSA-N 0.000 description 1
- OZBDSFBWIDPVDA-BZSNNMDCSA-N His-His-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CC3=CN=CN3)N OZBDSFBWIDPVDA-BZSNNMDCSA-N 0.000 description 1
- QPSCMXDWVKWVOW-BZSNNMDCSA-N His-His-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O QPSCMXDWVKWVOW-BZSNNMDCSA-N 0.000 description 1
- ORERHHPZDDEMSC-VGDYDELISA-N His-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ORERHHPZDDEMSC-VGDYDELISA-N 0.000 description 1
- AIPUZFXMXAHZKY-QWRGUYRKSA-N His-Leu-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O AIPUZFXMXAHZKY-QWRGUYRKSA-N 0.000 description 1
- YAALVYQFVJNXIV-KKUMJFAQSA-N His-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CN=CN1 YAALVYQFVJNXIV-KKUMJFAQSA-N 0.000 description 1
- UXSATKFPUVZVDK-KKUMJFAQSA-N His-Lys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC1=CN=CN1)N UXSATKFPUVZVDK-KKUMJFAQSA-N 0.000 description 1
- WHKLDLQHSYAVGU-ACRUOGEOSA-N His-Phe-Tyr Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O WHKLDLQHSYAVGU-ACRUOGEOSA-N 0.000 description 1
- CHIAUHSHDARFBD-ULQDDVLXSA-N His-Pro-Tyr Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 CHIAUHSHDARFBD-ULQDDVLXSA-N 0.000 description 1
- CCUSLCQWVMWTIS-IXOXFDKPSA-N His-Thr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O CCUSLCQWVMWTIS-IXOXFDKPSA-N 0.000 description 1
- WSWAUVHXQREQQG-JYJNAYRXSA-N His-Tyr-Gln Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O WSWAUVHXQREQQG-JYJNAYRXSA-N 0.000 description 1
- HYXQKVOADYPQEA-CIUDSAMLSA-N Ile-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HYXQKVOADYPQEA-CIUDSAMLSA-N 0.000 description 1
- TZCGZYWNIDZZMR-NAKRPEOUSA-N Ile-Arg-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C)C(=O)O)N TZCGZYWNIDZZMR-NAKRPEOUSA-N 0.000 description 1
- ASCFJMSGKUIRDU-ZPFDUUQYSA-N Ile-Arg-Gln Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O ASCFJMSGKUIRDU-ZPFDUUQYSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- YKRIXHPEIZUDDY-GMOBBJLQSA-N Ile-Asn-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKRIXHPEIZUDDY-GMOBBJLQSA-N 0.000 description 1
- XENGULNPUDGALZ-ZPFDUUQYSA-N Ile-Asn-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N XENGULNPUDGALZ-ZPFDUUQYSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- UDLAWRKOVFDKFL-PEFMBERDSA-N Ile-Asp-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N UDLAWRKOVFDKFL-PEFMBERDSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- QSPLUJGYOPZINY-ZPFDUUQYSA-N Ile-Asp-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QSPLUJGYOPZINY-ZPFDUUQYSA-N 0.000 description 1
- DCQMJRSOGCYKTR-GHCJXIJMSA-N Ile-Asp-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O DCQMJRSOGCYKTR-GHCJXIJMSA-N 0.000 description 1
- UBHUJPVCJHPSEU-GRLWGSQLSA-N Ile-Glu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N UBHUJPVCJHPSEU-GRLWGSQLSA-N 0.000 description 1
- DFJJAVZIHDFOGQ-MNXVOIDGSA-N Ile-Glu-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DFJJAVZIHDFOGQ-MNXVOIDGSA-N 0.000 description 1
- SPQWWEZBHXHUJN-KBIXCLLPSA-N Ile-Glu-Ser Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O SPQWWEZBHXHUJN-KBIXCLLPSA-N 0.000 description 1
- JXMSHKFPDIUYGS-SIUGBPQLSA-N Ile-Glu-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N JXMSHKFPDIUYGS-SIUGBPQLSA-N 0.000 description 1
- CDGLBYSAZFIIJO-RCOVLWMOSA-N Ile-Gly-Gly Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O CDGLBYSAZFIIJO-RCOVLWMOSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- QNBYCZTZNOVDMI-HGNGGELXSA-N Ile-His Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 QNBYCZTZNOVDMI-HGNGGELXSA-N 0.000 description 1
- SVBAHOMTJRFSIC-SXTJYALSSA-N Ile-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N SVBAHOMTJRFSIC-SXTJYALSSA-N 0.000 description 1
- SJLVSMMIFYTSGY-GRLWGSQLSA-N Ile-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N SJLVSMMIFYTSGY-GRLWGSQLSA-N 0.000 description 1
- PFPUFNLHBXKPHY-HTFCKZLJSA-N Ile-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)O)N PFPUFNLHBXKPHY-HTFCKZLJSA-N 0.000 description 1
- AXNGDPAKKCEKGY-QPHKQPEJSA-N Ile-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N AXNGDPAKKCEKGY-QPHKQPEJSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- GAZGFPOZOLEYAJ-YTFOTSKYSA-N Ile-Leu-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N GAZGFPOZOLEYAJ-YTFOTSKYSA-N 0.000 description 1
- RMNMUUCYTMLWNA-ZPFDUUQYSA-N Ile-Lys-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N RMNMUUCYTMLWNA-ZPFDUUQYSA-N 0.000 description 1
- FFAUOCITXBMRBT-YTFOTSKYSA-N Ile-Lys-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FFAUOCITXBMRBT-YTFOTSKYSA-N 0.000 description 1
- USXAYNCLFSUSBA-MGHWNKPDSA-N Ile-Phe-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N USXAYNCLFSUSBA-MGHWNKPDSA-N 0.000 description 1
- NLZVTPYXYXMCIP-XUXIUFHCSA-N Ile-Pro-Lys Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O NLZVTPYXYXMCIP-XUXIUFHCSA-N 0.000 description 1
- TWVKGYNQQAUNRN-ACZMJKKPSA-N Ile-Ser Chemical compound CC[C@H](C)[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O TWVKGYNQQAUNRN-ACZMJKKPSA-N 0.000 description 1
- JODPUDMBQBIWCK-GHCJXIJMSA-N Ile-Ser-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O JODPUDMBQBIWCK-GHCJXIJMSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- AGGIYSLVUKVOPT-HTFCKZLJSA-N Ile-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N AGGIYSLVUKVOPT-HTFCKZLJSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- HJDZMPFEXINXLO-QPHKQPEJSA-N Ile-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)O)N HJDZMPFEXINXLO-QPHKQPEJSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- QGXQHJQPAPMACW-PPCPHDFISA-N Ile-Thr-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)O)N QGXQHJQPAPMACW-PPCPHDFISA-N 0.000 description 1
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 1
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- ZRLUISBDKUWAIZ-CIUDSAMLSA-N Leu-Ala-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O ZRLUISBDKUWAIZ-CIUDSAMLSA-N 0.000 description 1
- HASRFYOMVPJRPU-SRVKXCTJSA-N Leu-Arg-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O HASRFYOMVPJRPU-SRVKXCTJSA-N 0.000 description 1
- UILIPCLTHRPCRB-XUXIUFHCSA-N Leu-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(C)C)N UILIPCLTHRPCRB-XUXIUFHCSA-N 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- UCOCBWDBHCUPQP-DCAQKATOSA-N Leu-Arg-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O UCOCBWDBHCUPQP-DCAQKATOSA-N 0.000 description 1
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 1
- IGUOAYLTQJLPPD-DCAQKATOSA-N Leu-Asn-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IGUOAYLTQJLPPD-DCAQKATOSA-N 0.000 description 1
- ILJREDZFPHTUIE-GUBZILKMSA-N Leu-Asp-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ILJREDZFPHTUIE-GUBZILKMSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- IASQBRJGRVXNJI-YUMQZZPRSA-N Leu-Cys-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)NCC(O)=O IASQBRJGRVXNJI-YUMQZZPRSA-N 0.000 description 1
- VPKIQULSKFVCSM-SRVKXCTJSA-N Leu-Gln-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPKIQULSKFVCSM-SRVKXCTJSA-N 0.000 description 1
- FQZPTCNSNPWHLJ-AVGNSLFASA-N Leu-Gln-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(O)=O FQZPTCNSNPWHLJ-AVGNSLFASA-N 0.000 description 1
- GPICTNQYKHHHTH-GUBZILKMSA-N Leu-Gln-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O GPICTNQYKHHHTH-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- WMTOVWLLDGQGCV-GUBZILKMSA-N Leu-Glu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N WMTOVWLLDGQGCV-GUBZILKMSA-N 0.000 description 1
- BABSVXFGKFLIGW-UWVGGRQHSA-N Leu-Gly-Arg Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N BABSVXFGKFLIGW-UWVGGRQHSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- VBZOAGIPCULURB-QWRGUYRKSA-N Leu-Gly-His Chemical compound CC(C)C[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N VBZOAGIPCULURB-QWRGUYRKSA-N 0.000 description 1
- UCDHVOALNXENLC-KBPBESRZSA-N Leu-Gly-Tyr Chemical compound CC(C)C[C@H]([NH3+])C(=O)NCC(=O)N[C@H](C([O-])=O)CC1=CC=C(O)C=C1 UCDHVOALNXENLC-KBPBESRZSA-N 0.000 description 1
- XQXGNBFMAXWIGI-MXAVVETBSA-N Leu-His-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CC(C)C)CC1=CN=CN1 XQXGNBFMAXWIGI-MXAVVETBSA-N 0.000 description 1
- MPSBSKHOWJQHBS-IHRRRGAJSA-N Leu-His-Met Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCSC)C(=O)O)N MPSBSKHOWJQHBS-IHRRRGAJSA-N 0.000 description 1
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 1
- AVEGDIAXTDVBJS-XUXIUFHCSA-N Leu-Ile-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AVEGDIAXTDVBJS-XUXIUFHCSA-N 0.000 description 1
- HGFGEMSVBMCFKK-MNXVOIDGSA-N Leu-Ile-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O HGFGEMSVBMCFKK-MNXVOIDGSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- MJWVXZABPOKJJF-ACRUOGEOSA-N Leu-Phe-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O MJWVXZABPOKJJF-ACRUOGEOSA-N 0.000 description 1
- YUTNOGOMBNYPFH-XUXIUFHCSA-N Leu-Pro-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O YUTNOGOMBNYPFH-XUXIUFHCSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 1
- HGLKOTPFWOMPOB-MEYUZBJRSA-N Leu-Thr-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 HGLKOTPFWOMPOB-MEYUZBJRSA-N 0.000 description 1
- LFXSPAIBSZSTEM-PMVMPFDFSA-N Leu-Trp-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=CC=C3)C(=O)O)N LFXSPAIBSZSTEM-PMVMPFDFSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- WUHBLPVELFTPQK-KKUMJFAQSA-N Leu-Tyr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O WUHBLPVELFTPQK-KKUMJFAQSA-N 0.000 description 1
- SEOXPEFQEOYURL-PMVMPFDFSA-N Leu-Tyr-Trp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SEOXPEFQEOYURL-PMVMPFDFSA-N 0.000 description 1
- MPOHDJKRBLVGCT-CIUDSAMLSA-N Lys-Ala-Asn Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N MPOHDJKRBLVGCT-CIUDSAMLSA-N 0.000 description 1
- PNPYKQFJGRFYJE-GUBZILKMSA-N Lys-Ala-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PNPYKQFJGRFYJE-GUBZILKMSA-N 0.000 description 1
- NPBGTPKLVJEOBE-IUCAKERBSA-N Lys-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N NPBGTPKLVJEOBE-IUCAKERBSA-N 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- NTEVEUCLFMWSND-SRVKXCTJSA-N Lys-Arg-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O NTEVEUCLFMWSND-SRVKXCTJSA-N 0.000 description 1
- JGAMUXDWYSXYLM-SRVKXCTJSA-N Lys-Arg-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O JGAMUXDWYSXYLM-SRVKXCTJSA-N 0.000 description 1
- YNNPKXBBRZVIRX-IHRRRGAJSA-N Lys-Arg-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O YNNPKXBBRZVIRX-IHRRRGAJSA-N 0.000 description 1
- CKSXSQUVEYCDIW-AVGNSLFASA-N Lys-Arg-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N CKSXSQUVEYCDIW-AVGNSLFASA-N 0.000 description 1
- WALVCOOOKULCQM-ULQDDVLXSA-N Lys-Arg-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O WALVCOOOKULCQM-ULQDDVLXSA-N 0.000 description 1
- GGAPIOORBXHMNY-ULQDDVLXSA-N Lys-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)N)O GGAPIOORBXHMNY-ULQDDVLXSA-N 0.000 description 1
- BYPMOIFBQPEWOH-CIUDSAMLSA-N Lys-Asn-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N BYPMOIFBQPEWOH-CIUDSAMLSA-N 0.000 description 1
- YKIRNDPUWONXQN-GUBZILKMSA-N Lys-Asn-Gln Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N YKIRNDPUWONXQN-GUBZILKMSA-N 0.000 description 1
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 1
- ZQCVMVCVPFYXHZ-SRVKXCTJSA-N Lys-Asn-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN ZQCVMVCVPFYXHZ-SRVKXCTJSA-N 0.000 description 1
- QUCDKEKDPYISNX-HJGDQZAQSA-N Lys-Asn-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QUCDKEKDPYISNX-HJGDQZAQSA-N 0.000 description 1
- CIOWSLJGLSUOME-BQBZGAKWSA-N Lys-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O CIOWSLJGLSUOME-BQBZGAKWSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- NRQRKMYZONPCTM-CIUDSAMLSA-N Lys-Asp-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O NRQRKMYZONPCTM-CIUDSAMLSA-N 0.000 description 1
- NTBFKPBULZGXQL-KKUMJFAQSA-N Lys-Asp-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 NTBFKPBULZGXQL-KKUMJFAQSA-N 0.000 description 1
- ZAENPHCEQXALHO-GUBZILKMSA-N Lys-Cys-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZAENPHCEQXALHO-GUBZILKMSA-N 0.000 description 1
- DFXQCCBKGUNYGG-GUBZILKMSA-N Lys-Gln-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCCCN DFXQCCBKGUNYGG-GUBZILKMSA-N 0.000 description 1
- MRWXLRGAFDOILG-DCAQKATOSA-N Lys-Gln-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MRWXLRGAFDOILG-DCAQKATOSA-N 0.000 description 1
- QQUJSUFWEDZQQY-AVGNSLFASA-N Lys-Gln-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN QQUJSUFWEDZQQY-AVGNSLFASA-N 0.000 description 1
- MQMIRLVJXQNTRJ-SDDRHHMPSA-N Lys-Gln-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N)C(=O)O MQMIRLVJXQNTRJ-SDDRHHMPSA-N 0.000 description 1
- PBIPLDMFHAICIP-DCAQKATOSA-N Lys-Glu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PBIPLDMFHAICIP-DCAQKATOSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- DCRWPTBMWMGADO-AVGNSLFASA-N Lys-Glu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O DCRWPTBMWMGADO-AVGNSLFASA-N 0.000 description 1
- GHOIOYHDDKXIDX-SZMVWBNQSA-N Lys-Glu-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 GHOIOYHDDKXIDX-SZMVWBNQSA-N 0.000 description 1
- ODUQLUADRKMHOZ-JYJNAYRXSA-N Lys-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N)O ODUQLUADRKMHOZ-JYJNAYRXSA-N 0.000 description 1
- GQFDWEDHOQRNLC-QWRGUYRKSA-N Lys-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCCN GQFDWEDHOQRNLC-QWRGUYRKSA-N 0.000 description 1
- GTAXSKOXPIISBW-AVGNSLFASA-N Lys-His-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N GTAXSKOXPIISBW-AVGNSLFASA-N 0.000 description 1
- WOEDRPCHKPSFDT-MXAVVETBSA-N Lys-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CCCCN)N WOEDRPCHKPSFDT-MXAVVETBSA-N 0.000 description 1
- IUWMQCZOTYRXPL-ZPFDUUQYSA-N Lys-Ile-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O IUWMQCZOTYRXPL-ZPFDUUQYSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- QOJDBRUCOXQSSK-AJNGGQMLSA-N Lys-Ile-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O QOJDBRUCOXQSSK-AJNGGQMLSA-N 0.000 description 1
- KEPWSUPUFAPBRF-DKIMLUQUSA-N Lys-Ile-Phe Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O KEPWSUPUFAPBRF-DKIMLUQUSA-N 0.000 description 1
- NCZIQZYZPUPMKY-PPCPHDFISA-N Lys-Ile-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NCZIQZYZPUPMKY-PPCPHDFISA-N 0.000 description 1
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- MUXNCRWTWBMNHX-SRVKXCTJSA-N Lys-Leu-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O MUXNCRWTWBMNHX-SRVKXCTJSA-N 0.000 description 1
- AIRZWUMAHCDDHR-KKUMJFAQSA-N Lys-Leu-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O AIRZWUMAHCDDHR-KKUMJFAQSA-N 0.000 description 1
- ALGGDNMLQNFVIZ-SRVKXCTJSA-N Lys-Lys-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)O)C(=O)O)N ALGGDNMLQNFVIZ-SRVKXCTJSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- ZCWWVXAXWUAEPZ-SRVKXCTJSA-N Lys-Met-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZCWWVXAXWUAEPZ-SRVKXCTJSA-N 0.000 description 1
- QCZYYEFXOBKCNQ-STQMWFEESA-N Lys-Phe Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QCZYYEFXOBKCNQ-STQMWFEESA-N 0.000 description 1
- ZJSZPXISKMDJKQ-JYJNAYRXSA-N Lys-Phe-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CCC(O)=O)C(O)=O)CC1=CC=CC=C1 ZJSZPXISKMDJKQ-JYJNAYRXSA-N 0.000 description 1
- LMGNWHDWJDIOPK-DKIMLUQUSA-N Lys-Phe-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LMGNWHDWJDIOPK-DKIMLUQUSA-N 0.000 description 1
- AIXUQKMMBQJZCU-IUCAKERBSA-N Lys-Pro Chemical compound NCCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O AIXUQKMMBQJZCU-IUCAKERBSA-N 0.000 description 1
- SBQDRNOLGSYHQA-YUMQZZPRSA-N Lys-Ser-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SBQDRNOLGSYHQA-YUMQZZPRSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- DYJOORGDQIGZAS-DCAQKATOSA-N Lys-Ser-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCCCN)N DYJOORGDQIGZAS-DCAQKATOSA-N 0.000 description 1
- PLOUVAYOMTYJRG-JXUBOQSCSA-N Lys-Thr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O PLOUVAYOMTYJRG-JXUBOQSCSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- CUHGAUZONORRIC-HJGDQZAQSA-N Lys-Thr-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCCN)N)O CUHGAUZONORRIC-HJGDQZAQSA-N 0.000 description 1
- GIKFNMZSGYAPEJ-HJGDQZAQSA-N Lys-Thr-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O GIKFNMZSGYAPEJ-HJGDQZAQSA-N 0.000 description 1
- GUBGYTABKSRVRQ-PICCSMPSSA-N Maltose Natural products O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1O[C@@H]1[C@@H](CO)OC(O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-PICCSMPSSA-N 0.000 description 1
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 1
- IIPHCNKHEZYSNE-DCAQKATOSA-N Met-Arg-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O IIPHCNKHEZYSNE-DCAQKATOSA-N 0.000 description 1
- IYXDSYWCVVXSKB-CIUDSAMLSA-N Met-Asn-Glu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O IYXDSYWCVVXSKB-CIUDSAMLSA-N 0.000 description 1
- DRXODWRPPUFIAY-DCAQKATOSA-N Met-Asn-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCCN DRXODWRPPUFIAY-DCAQKATOSA-N 0.000 description 1
- TUSOIZOVPJCMFC-FXQIFTODSA-N Met-Asp-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O TUSOIZOVPJCMFC-FXQIFTODSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- SDTSLIMYROCDNS-FXQIFTODSA-N Met-Cys-Asn Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(O)=O SDTSLIMYROCDNS-FXQIFTODSA-N 0.000 description 1
- GETCJHFFECHWHI-QXEWZRGKSA-N Met-Ile-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)O)NC(=O)[C@H](CCSC)N GETCJHFFECHWHI-QXEWZRGKSA-N 0.000 description 1
- FWAHLGXNBLWIKB-NAKRPEOUSA-N Met-Ile-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCSC FWAHLGXNBLWIKB-NAKRPEOUSA-N 0.000 description 1
- LCPUWQLULVXROY-RHYQMDGZSA-N Met-Lys-Thr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LCPUWQLULVXROY-RHYQMDGZSA-N 0.000 description 1
- LUYURUYVNYGKGM-RCWTZXSCSA-N Met-Pro-Thr Chemical compound CSCC[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O LUYURUYVNYGKGM-RCWTZXSCSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- VOAKKHOIAFKOQZ-JYJNAYRXSA-N Met-Tyr-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CCSC)CC1=CC=C(O)C=C1 VOAKKHOIAFKOQZ-JYJNAYRXSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- BBDSZDHUCPSYAC-QEJZJMRPSA-N Phe-Ala-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BBDSZDHUCPSYAC-QEJZJMRPSA-N 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- LZDIENNKWVXJMX-JYJNAYRXSA-N Phe-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CC=CC=C1 LZDIENNKWVXJMX-JYJNAYRXSA-N 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- IWRZUGHCHFZYQZ-UFYCRDLUSA-N Phe-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 IWRZUGHCHFZYQZ-UFYCRDLUSA-N 0.000 description 1
- MECSIDWUTYRHRJ-KKUMJFAQSA-N Phe-Asn-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O MECSIDWUTYRHRJ-KKUMJFAQSA-N 0.000 description 1
- CDNPIRSCAFMMBE-SRVKXCTJSA-N Phe-Asn-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O CDNPIRSCAFMMBE-SRVKXCTJSA-N 0.000 description 1
- ZENDEDYRYVHBEG-SRVKXCTJSA-N Phe-Asp-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ZENDEDYRYVHBEG-SRVKXCTJSA-N 0.000 description 1
- RJYBHZVWJPUSLB-QEWYBTABSA-N Phe-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N RJYBHZVWJPUSLB-QEWYBTABSA-N 0.000 description 1
- WYPVCIACUMJRIB-JYJNAYRXSA-N Phe-Gln-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N WYPVCIACUMJRIB-JYJNAYRXSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 1
- HGNGAMWHGGANAU-WHOFXGATSA-N Phe-Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HGNGAMWHGGANAU-WHOFXGATSA-N 0.000 description 1
- VADLTGVIOIOKGM-BZSNNMDCSA-N Phe-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CN=CN1 VADLTGVIOIOKGM-BZSNNMDCSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- SMFGCTXUBWEPKM-KBPBESRZSA-N Phe-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 SMFGCTXUBWEPKM-KBPBESRZSA-N 0.000 description 1
- DMEYUTSDVRCWRS-ULQDDVLXSA-N Phe-Lys-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=CC=C1 DMEYUTSDVRCWRS-ULQDDVLXSA-N 0.000 description 1
- RMKGXGPQIPLTFC-KKUMJFAQSA-N Phe-Lys-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O RMKGXGPQIPLTFC-KKUMJFAQSA-N 0.000 description 1
- XZQYIJALMGEUJD-OEAJRASXSA-N Phe-Lys-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XZQYIJALMGEUJD-OEAJRASXSA-N 0.000 description 1
- OXKJSGGTHFMGDT-UFYCRDLUSA-N Phe-Phe-Arg Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O)C1=CC=CC=C1 OXKJSGGTHFMGDT-UFYCRDLUSA-N 0.000 description 1
- JLLJTMHNXQTMCK-UBHSHLNASA-N Phe-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 JLLJTMHNXQTMCK-UBHSHLNASA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- FZBGMXYQPACKNC-HJWJTTGWSA-N Phe-Pro-Ile Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FZBGMXYQPACKNC-HJWJTTGWSA-N 0.000 description 1
- ZVRJWDUPIDMHDN-ULQDDVLXSA-N Phe-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 ZVRJWDUPIDMHDN-ULQDDVLXSA-N 0.000 description 1
- WEDZFLRYSIDIRX-IHRRRGAJSA-N Phe-Ser-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=CC=C1 WEDZFLRYSIDIRX-IHRRRGAJSA-N 0.000 description 1
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 1
- PTDAGKJHZBGDKD-OEAJRASXSA-N Phe-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O PTDAGKJHZBGDKD-OEAJRASXSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- IWNOFCGBMSFTBC-CIUDSAMLSA-N Pro-Ala-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O IWNOFCGBMSFTBC-CIUDSAMLSA-N 0.000 description 1
- XROLYVMNVIKVEM-BQBZGAKWSA-N Pro-Asn-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O XROLYVMNVIKVEM-BQBZGAKWSA-N 0.000 description 1
- XWYXZPHPYKRYPA-GMOBBJLQSA-N Pro-Asn-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XWYXZPHPYKRYPA-GMOBBJLQSA-N 0.000 description 1
- JARJPEMLQAWNBR-GUBZILKMSA-N Pro-Asp-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JARJPEMLQAWNBR-GUBZILKMSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- KIGGUSRFHJCIEJ-DCAQKATOSA-N Pro-Asp-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O KIGGUSRFHJCIEJ-DCAQKATOSA-N 0.000 description 1
- LANQLYHLMYDWJP-SRVKXCTJSA-N Pro-Gln-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O LANQLYHLMYDWJP-SRVKXCTJSA-N 0.000 description 1
- LQZZPNDMYNZPFT-KKUMJFAQSA-N Pro-Gln-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LQZZPNDMYNZPFT-KKUMJFAQSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- BFXZQMWKTYWGCF-PYJNHQTQSA-N Pro-His-Ile Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O BFXZQMWKTYWGCF-PYJNHQTQSA-N 0.000 description 1
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 1
- RMODQFBNDDENCP-IHRRRGAJSA-N Pro-Lys-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O RMODQFBNDDENCP-IHRRRGAJSA-N 0.000 description 1
- DWGFLKQSGRUQTI-IHRRRGAJSA-N Pro-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1 DWGFLKQSGRUQTI-IHRRRGAJSA-N 0.000 description 1
- ANESFYPBAJPYNJ-SDDRHHMPSA-N Pro-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ANESFYPBAJPYNJ-SDDRHHMPSA-N 0.000 description 1
- FYKUEXMZYFIZKA-DCAQKATOSA-N Pro-Pro-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O FYKUEXMZYFIZKA-DCAQKATOSA-N 0.000 description 1
- SNGZLPOXVRTNMB-LPEHRKFASA-N Pro-Ser-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N2CCC[C@@H]2C(=O)O SNGZLPOXVRTNMB-LPEHRKFASA-N 0.000 description 1
- BNUKRHFCHHLIGR-JYJNAYRXSA-N Pro-Trp-Asp Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CNC3=CC=CC=C32)C(=O)N[C@@H](CC(=O)O)C(=O)O BNUKRHFCHHLIGR-JYJNAYRXSA-N 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N Propene Chemical compound CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 241001472782 Proteus penneri Species 0.000 description 1
- 241000588767 Proteus vulgaris Species 0.000 description 1
- 241000589515 Pseudoalteromonas atlantica Species 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 241000220010 Rhode Species 0.000 description 1
- MMGJPDWSIOAGTH-ACZMJKKPSA-N Ser-Ala-Gln Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O MMGJPDWSIOAGTH-ACZMJKKPSA-N 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- WTUJZHKANPDPIN-CIUDSAMLSA-N Ser-Ala-Lys Chemical compound C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N WTUJZHKANPDPIN-CIUDSAMLSA-N 0.000 description 1
- YQHZVYJAGWMHES-ZLUOBGJFSA-N Ser-Ala-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YQHZVYJAGWMHES-ZLUOBGJFSA-N 0.000 description 1
- JPIDMRXXNMIVKY-VZFHVOOUSA-N Ser-Ala-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JPIDMRXXNMIVKY-VZFHVOOUSA-N 0.000 description 1
- RZEQTVHJZCIUBT-WDSKDSINSA-N Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N RZEQTVHJZCIUBT-WDSKDSINSA-N 0.000 description 1
- OBXVZEAMXFSGPU-FXQIFTODSA-N Ser-Asn-Arg Chemical compound C(C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CO)N)CN=C(N)N OBXVZEAMXFSGPU-FXQIFTODSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- FTVRVZNYIYWJGB-ACZMJKKPSA-N Ser-Asp-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O FTVRVZNYIYWJGB-ACZMJKKPSA-N 0.000 description 1
- BGOWRLSWJCVYAQ-CIUDSAMLSA-N Ser-Asp-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O BGOWRLSWJCVYAQ-CIUDSAMLSA-N 0.000 description 1
- KJMOINFQVCCSDX-XKBZYTNZSA-N Ser-Gln-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KJMOINFQVCCSDX-XKBZYTNZSA-N 0.000 description 1
- SQBLRDDJTUJDMV-ACZMJKKPSA-N Ser-Glu-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQBLRDDJTUJDMV-ACZMJKKPSA-N 0.000 description 1
- WBINSDOPZHQPPM-AVGNSLFASA-N Ser-Glu-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N)O WBINSDOPZHQPPM-AVGNSLFASA-N 0.000 description 1
- AEGUWTFAQQWVLC-BQBZGAKWSA-N Ser-Gly-Arg Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O AEGUWTFAQQWVLC-BQBZGAKWSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- DJACUBDEDBZKLQ-KBIXCLLPSA-N Ser-Ile-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O DJACUBDEDBZKLQ-KBIXCLLPSA-N 0.000 description 1
- NFDYGNFETJVMSE-BQBZGAKWSA-N Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CO NFDYGNFETJVMSE-BQBZGAKWSA-N 0.000 description 1
- LRWBCWGEUCKDTN-BJDJZHNGSA-N Ser-Lys-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O LRWBCWGEUCKDTN-BJDJZHNGSA-N 0.000 description 1
- PPQRSMGDOHLTBE-UWVGGRQHSA-N Ser-Phe Chemical compound OC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PPQRSMGDOHLTBE-UWVGGRQHSA-N 0.000 description 1
- PJIQEIFXZPCWOJ-FXQIFTODSA-N Ser-Pro-Asp Chemical compound [H]N[C@@H](CO)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O PJIQEIFXZPCWOJ-FXQIFTODSA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- XZKQVQKUZMAADP-IMJSIDKUSA-N Ser-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(O)=O XZKQVQKUZMAADP-IMJSIDKUSA-N 0.000 description 1
- FLMYSKVSDVHLEW-SVSWQMSJSA-N Ser-Thr-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O FLMYSKVSDVHLEW-SVSWQMSJSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- PLQWGQUNUPMNOD-KKUMJFAQSA-N Ser-Tyr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O PLQWGQUNUPMNOD-KKUMJFAQSA-N 0.000 description 1
- HKHCTNFKZXAMIF-KKUMJFAQSA-N Ser-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CC1=CC=C(O)C=C1 HKHCTNFKZXAMIF-KKUMJFAQSA-N 0.000 description 1
- DWAQJAXMDSEUJJ-UHFFFAOYSA-M Sodium bisulfite Chemical compound [Na+].OS([O-])=O DWAQJAXMDSEUJJ-UHFFFAOYSA-M 0.000 description 1
- NHUHCSRWZMLRLA-UHFFFAOYSA-N Sulfisoxazole Chemical compound CC1=NOC(NS(=O)(=O)C=2C=CC(N)=CC=2)=C1C NHUHCSRWZMLRLA-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- HYLXOQURIOCKIH-VQVTYTSYSA-N Thr-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCCNC(N)=N HYLXOQURIOCKIH-VQVTYTSYSA-N 0.000 description 1
- LHUBVKCLOVALIA-HJGDQZAQSA-N Thr-Arg-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(O)=O LHUBVKCLOVALIA-HJGDQZAQSA-N 0.000 description 1
- MQBTXMPQNCGSSZ-OSUNSFLBSA-N Thr-Arg-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)[C@@H](C)O)CCCN=C(N)N MQBTXMPQNCGSSZ-OSUNSFLBSA-N 0.000 description 1
- GZYNMZQXFRWDFH-YTWAJWBKSA-N Thr-Arg-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(=O)O)N)O GZYNMZQXFRWDFH-YTWAJWBKSA-N 0.000 description 1
- YBXMGKCLOPDEKA-NUMRIWBASA-N Thr-Asp-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O YBXMGKCLOPDEKA-NUMRIWBASA-N 0.000 description 1
- NLSNVZAREYQMGR-HJGDQZAQSA-N Thr-Asp-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O NLSNVZAREYQMGR-HJGDQZAQSA-N 0.000 description 1
- UCCNDUPVIFOOQX-CUJWVEQBSA-N Thr-Cys-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 UCCNDUPVIFOOQX-CUJWVEQBSA-N 0.000 description 1
- LIXBDERDAGNVAV-XKBZYTNZSA-N Thr-Gln-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O LIXBDERDAGNVAV-XKBZYTNZSA-N 0.000 description 1
- FHDLKMFZKRUQCE-HJGDQZAQSA-N Thr-Glu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FHDLKMFZKRUQCE-HJGDQZAQSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- WDFPMSHYMRBLKM-NKIYYHGXSA-N Thr-Glu-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N)O WDFPMSHYMRBLKM-NKIYYHGXSA-N 0.000 description 1
- LKEKWDJCJSPXNI-IRIUXVKKSA-N Thr-Glu-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 LKEKWDJCJSPXNI-IRIUXVKKSA-N 0.000 description 1
- KCRQEJSKXAIULJ-FJXKBIBVSA-N Thr-Gly-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O KCRQEJSKXAIULJ-FJXKBIBVSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- UBDDORVPVLEECX-FJXKBIBVSA-N Thr-Gly-Met Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCSC)C(O)=O UBDDORVPVLEECX-FJXKBIBVSA-N 0.000 description 1
- JQAWYCUUFIMTHE-WLTAIBSBSA-N Thr-Gly-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JQAWYCUUFIMTHE-WLTAIBSBSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- URPSJRMWHQTARR-MBLNEYKQSA-N Thr-Ile-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O URPSJRMWHQTARR-MBLNEYKQSA-N 0.000 description 1
- FQPDRTDDEZXCEC-SVSWQMSJSA-N Thr-Ile-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O FQPDRTDDEZXCEC-SVSWQMSJSA-N 0.000 description 1
- TZJSEJOXAIWOST-RHYQMDGZSA-N Thr-Lys-Arg Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N TZJSEJOXAIWOST-RHYQMDGZSA-N 0.000 description 1
- BDGBHYCAZJPLHX-HJGDQZAQSA-N Thr-Lys-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O BDGBHYCAZJPLHX-HJGDQZAQSA-N 0.000 description 1
- XSEPSRUDSPHMPX-KATARQTJSA-N Thr-Lys-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O XSEPSRUDSPHMPX-KATARQTJSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- FWTFAZKJORVTIR-VZFHVOOUSA-N Thr-Ser-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O FWTFAZKJORVTIR-VZFHVOOUSA-N 0.000 description 1
- NQQMWWVVGIXUOX-SVSWQMSJSA-N Thr-Ser-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NQQMWWVVGIXUOX-SVSWQMSJSA-N 0.000 description 1
- CSNBWOJOEOPYIJ-UVOCVTCTSA-N Thr-Thr-Lys Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O CSNBWOJOEOPYIJ-UVOCVTCTSA-N 0.000 description 1
- RPECVQBNONKZAT-WZLNRYEVSA-N Thr-Tyr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H]([C@@H](C)O)N RPECVQBNONKZAT-WZLNRYEVSA-N 0.000 description 1
- NMCBVGFGWSIGSB-NUTKFTJISA-N Trp-Ala-Leu Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N NMCBVGFGWSIGSB-NUTKFTJISA-N 0.000 description 1
- KZTLJLFVOIMRAQ-IHPCNDPISA-N Trp-Asn-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZTLJLFVOIMRAQ-IHPCNDPISA-N 0.000 description 1
- GTNCSPKYWCJZAC-XIRDDKMYSA-N Trp-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N GTNCSPKYWCJZAC-XIRDDKMYSA-N 0.000 description 1
- RXEQOXHCHQJMSO-IHPCNDPISA-N Trp-His-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O RXEQOXHCHQJMSO-IHPCNDPISA-N 0.000 description 1
- AZBIIKDSDLVJAK-VHWLVUOQSA-N Trp-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N AZBIIKDSDLVJAK-VHWLVUOQSA-N 0.000 description 1
- YDTKYBHPRULROG-LTHWPDAASA-N Trp-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N YDTKYBHPRULROG-LTHWPDAASA-N 0.000 description 1
- GWBWCGITOYODER-YTQUADARSA-N Trp-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N GWBWCGITOYODER-YTQUADARSA-N 0.000 description 1
- YPBYQWFZAAQMGW-XIRDDKMYSA-N Trp-Lys-Asn Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(=O)N)C(=O)O)N YPBYQWFZAAQMGW-XIRDDKMYSA-N 0.000 description 1
- NWQCKAPDGQMZQN-IHPCNDPISA-N Trp-Lys-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O NWQCKAPDGQMZQN-IHPCNDPISA-N 0.000 description 1
- LFMLXCJYCFZBKE-IHPCNDPISA-N Trp-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CNC3=CC=CC=C32)N LFMLXCJYCFZBKE-IHPCNDPISA-N 0.000 description 1
- GQNCRIFNDVFRNF-BPUTZDHNSA-N Trp-Pro-Asp Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O GQNCRIFNDVFRNF-BPUTZDHNSA-N 0.000 description 1
- KBKTUNYBNJWFRL-UBHSHLNASA-N Trp-Ser-Asn Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O)=CNC2=C1 KBKTUNYBNJWFRL-UBHSHLNASA-N 0.000 description 1
- WBZOZLNLXVBCNW-LTHWPDAASA-N Trp-Thr-Ile Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)CC)C(O)=O)[C@@H](C)O)=CNC2=C1 WBZOZLNLXVBCNW-LTHWPDAASA-N 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- IIJWXEUNETVJPV-IHRRRGAJSA-N Tyr-Arg-Ser Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N)O IIJWXEUNETVJPV-IHRRRGAJSA-N 0.000 description 1
- PZXUIGWOEWWFQM-SRVKXCTJSA-N Tyr-Asn-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O PZXUIGWOEWWFQM-SRVKXCTJSA-N 0.000 description 1
- ZNFPUOSTMUMUDR-JRQIVUDYSA-N Tyr-Asn-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZNFPUOSTMUMUDR-JRQIVUDYSA-N 0.000 description 1
- JWHOIHCOHMZSAR-QWRGUYRKSA-N Tyr-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JWHOIHCOHMZSAR-QWRGUYRKSA-N 0.000 description 1
- NRFTYDWKWGJLAR-MELADBBJSA-N Tyr-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N)C(=O)O NRFTYDWKWGJLAR-MELADBBJSA-N 0.000 description 1
- TZXFLDNBYYGLKA-BZSNNMDCSA-N Tyr-Asp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 TZXFLDNBYYGLKA-BZSNNMDCSA-N 0.000 description 1
- IYHNBRUWVBIVJR-IHRRRGAJSA-N Tyr-Gln-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 IYHNBRUWVBIVJR-IHRRRGAJSA-N 0.000 description 1
- KCPFDGNYAMKZQP-KBPBESRZSA-N Tyr-Gly-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O KCPFDGNYAMKZQP-KBPBESRZSA-N 0.000 description 1
- NXRGXTBPMOGFID-CFMVVWHZSA-N Tyr-Ile-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O NXRGXTBPMOGFID-CFMVVWHZSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- ILTXFANLDMJWPR-SIUGBPQLSA-N Tyr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N ILTXFANLDMJWPR-SIUGBPQLSA-N 0.000 description 1
- DZKFGCNKEVMXFA-JUKXBJQTSA-N Tyr-Ile-His Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](N)Cc1ccc(O)cc1)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O DZKFGCNKEVMXFA-JUKXBJQTSA-N 0.000 description 1
- WSFXJLFSJSXGMQ-MGHWNKPDSA-N Tyr-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N WSFXJLFSJSXGMQ-MGHWNKPDSA-N 0.000 description 1
- HFJJDMOFTCQGEI-STECZYCISA-N Tyr-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N HFJJDMOFTCQGEI-STECZYCISA-N 0.000 description 1
- YMUQBRQQCPQEQN-CXTHYWKRSA-N Tyr-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N YMUQBRQQCPQEQN-CXTHYWKRSA-N 0.000 description 1
- KSCVLGXNQXKUAR-JYJNAYRXSA-N Tyr-Leu-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O KSCVLGXNQXKUAR-JYJNAYRXSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- SBLZVFCEOCWRLS-BPNCWPANSA-N Tyr-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CC1=CC=C(C=C1)O)N SBLZVFCEOCWRLS-BPNCWPANSA-N 0.000 description 1
- FDKDGFGTHGJKNV-FHWLQOOXSA-N Tyr-Phe-Gln Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N FDKDGFGTHGJKNV-FHWLQOOXSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- RWOKVQUCENPXGE-IHRRRGAJSA-N Tyr-Ser-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O RWOKVQUCENPXGE-IHRRRGAJSA-N 0.000 description 1
- QPOUERMDWKKZEG-HJPIBITLSA-N Tyr-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 QPOUERMDWKKZEG-HJPIBITLSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- LVILBTSHPTWDGE-PMVMPFDFSA-N Tyr-Trp-Lys Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(O)=O)C1=CC=C(O)C=C1 LVILBTSHPTWDGE-PMVMPFDFSA-N 0.000 description 1
- HZDQUVQEVVYDDA-ACRUOGEOSA-N Tyr-Tyr-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HZDQUVQEVVYDDA-ACRUOGEOSA-N 0.000 description 1
- KHPLUFDSWGDRHD-SLFFLAALSA-N Tyr-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O KHPLUFDSWGDRHD-SLFFLAALSA-N 0.000 description 1
- 241001135251 Yersinia kristensenii Species 0.000 description 1
- 241001095402 Yersinia kristensenii ATCC 33638 Species 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 150000001242 acetic acid derivatives Chemical class 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070783 alanyltyrosine Proteins 0.000 description 1
- 108010013835 arginine glutamate Proteins 0.000 description 1
- 108010080488 arginyl-arginyl-leucine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010052670 arginyl-glutamyl-glutamic acid Proteins 0.000 description 1
- 108010009111 arginyl-glycyl-glutamic acid Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 229940002008 bifidobacterium bifidum Drugs 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 238000001369 bisulfite sequencing Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 230000011712 cell development Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 150000001805 chlorine compounds Chemical class 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 150000001860 citric acid derivatives Chemical class 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000030609 dephosphorylation Effects 0.000 description 1
- 238000006209 dephosphorylation reaction Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000012631 diagnostic technique Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 230000005782 double-strand break Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000006718 epigenetic regulation Effects 0.000 description 1
- 238000013401 experimental design Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 108010072405 glycyl-aspartyl-glycine Proteins 0.000 description 1
- 108010059898 glycyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 239000008187 granular material Substances 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 108010036413 histidylglycine Proteins 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000003100 immobilizing effect Effects 0.000 description 1
- 238000005470 impregnation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 108010053037 kyotorphin Proteins 0.000 description 1
- 108010089256 lysyl-aspartyl-glutamyl-leucine Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 108091008104 nucleic acid aptamers Proteins 0.000 description 1
- 102000039446 nucleic acids Human genes 0.000 description 1
- 108020004707 nucleic acids Proteins 0.000 description 1
- 239000005022 packaging material Substances 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010084525 phenylalanyl-phenylalanyl-glycine Proteins 0.000 description 1
- 108010024654 phenylalanyl-prolyl-alanine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 108010018625 phenylalanylarginine Proteins 0.000 description 1
- 108010073025 phenylalanylphenylalanine Proteins 0.000 description 1
- 150000008300 phosphoramidites Chemical class 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 230000007026 protein scission Effects 0.000 description 1
- 229940007042 proteus vulgaris Drugs 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000007634 remodeling Methods 0.000 description 1
- ZKZBPNGNEQAJSX-UHFFFAOYSA-N selenocysteine Natural products [SeH]CC(N)C(O)=O ZKZBPNGNEQAJSX-UHFFFAOYSA-N 0.000 description 1
- 235000016491 selenocysteine Nutrition 0.000 description 1
- 229940055619 selenocysteine Drugs 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 235000010267 sodium hydrogen sulphite Nutrition 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 108010005652 splenotritin Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 125000001424 substituent group Chemical group 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 108010078580 tyrosylleucine Proteins 0.000 description 1
- 239000011345 viscous material Substances 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K1/00—General methods for the preparation of peptides, i.e. processes for the organic chemical preparation of peptides or proteins of any length
- C07K1/14—Extraction; Separation; Purification
- C07K1/16—Extraction; Separation; Purification by chromatography
- C07K1/22—Affinity chromatography or related techniques based upon selective absorption processes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/331—Methylation site specific nuclease
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- General Engineering & Computer Science (AREA)
- Medicinal Chemistry (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Biomedical Technology (AREA)
- Enzymes And Modification Thereof (AREA)
- Saccharide Compounds (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Išradime aprašyta kompozicijos, būdai ir rinkinys, susiję su nauja fermentų šeima, kurie pirmenybiškai rišasi prie hidroksimetilinto citozino arba gliukozilinto hidroksimetilinto citozino ir skaldo dvigrandę DNR nustatytame atstume nuo atpažinimo vietos 3' galo, gaunant suskaldytus fragmentus su 1-3 bazių lipniais galais.
Description
TECHNIKOS LYGIS
Pastaruoju metu buvo manoma, kad 5-hidroksimetilcitozinas (hmC) vaidina vaidmenį žinduolių genų ekspresijoje, ypatingai embrioninių kamieninių ląstelių ir neuronų ląstelių vystimesi kaip tarpinė pakopa demetilinimo procese. (Tahiliani etai., Science 324 (5929); 930-5 (2009); Kriaucionis and Heinz, Science 324 (5929): 92930 (2009)). Aprašyta TET fermentų šeima, kuri katalizuoja 5-metilinto citozino (mC) konversiją į hmC (WO 2010/037001). Hidroksimetilinimo aptikimas patvirtino sunkumus. Cheminiai būdai, dažniausiai natrio bisulfito sekvenavimas naudotas aptikti mC, neatskyrė mC ir hmC (Cokus et ai., Nature 452: 215-219 (2008). PCT publikacija WO 2010/037001 aprašo antikūnų, kurie tiesiogiai rišasi prie hmC, panaudojimą. Produktas, kuris apima endonukleazių mišinius, leidžia aptikti hmC subtrakcijos būdu (EpiMark™, New England Biolabs, Ine. (NEB) ir PCT/US10/46632). Šis produktas naudoja T4 β-gliukoziltransferazę (BGT) gliukozilinti hmC, kuris tada yra atsparus endonukleazės skėlimui, leidžiančiam diferencijuotis nuo mC. Būtų pageidautina išplėtoti paprastus greitus ir tiesioginius metodus aptikti ir išanalizuoti hmC buvimą polinukleotido sekos kontekste, kuris papildomai įgalina atskirti hemi-hmC nuo simetrinio hmC taip, kad tiksliai identifikuotų citoziną (C), kuris yra hidroksimetilintas.
IŠRADIMO ESMĖ
Išradimo įgyvendinime siūlomas preparatas, kuris apima: vieną arba daugiau išgrynintų rekombinantiniu baltymų, kuriame baltymai yra ZZYZ baltymų šeimos nariai; ir reakcijos buferį. Išradimo įgyvendinime, kiekvienas ZZYZ baltymų šeimos narys turi katalitinį domeną ir surišimo domeną. Įgyvendinime, surišimo domenas DNR-įe pirmenybiškai rišasi prie hmC ir gliukozilinto hidroksimetilinto citozino (ghmC). Įgyvendinime, katalitinis domenas skelia DNR nustatytu atstumu (3‘) nuo hmC arba ghmC. Nustatytas atstumas dar gali būti charakterizuotas kaip 11-13 nukloeotidai grandinėje, turinčioje hmC arba ghmC ir 9-10 nukloeotidai komplementarioje grandinėje (3‘). Kiekvienas ZZYZ baltymų šeimos narys dar gali būti charakterizuotas modifikuoto nukleotido atpažinimu, parinktu iš hmC arba ghmC
DNR-je taip, kad ghmC arba hmC su mC skilimo santykis yra mažiausiai 8:1.
Išradimo įgyvendinime, kiekvienas ZZYZ baltymų šeimos narys turi N-galinį domeną, apimantį aminorūgščių seką su mažiausiai 95 % aminorūgščių sekos homologija su RX7KX2EXYXi8QQXii-i6DLX2PX6EXDEX2HX6.26DX2RX3l (SEQ ID NO:14). Kitame įgyvendinime, kiekvienas ZZYZ baltymų šeimos narys turi C-galinį domeną, apimantį aminorūgščių seką su mažiausiai 95 % aminorūgščių sekos homologija su WXNX30.40AX12-13FXGXi6.i8R (SEQ ID NO: 15) C-galiniame domene. Dar kitame įgyvendinime, mažiausiai vienas narys apima aminorūgščių seką RX7KX2EXYXi8QQX1i.16DLX2PX6EXDEX2HX6.26DX2RX3I (SEQ ID NO: 14). Dar kitame įgyvendinime, mažiausiai vienas išgrynintas baltymas turi aminorūgščių seką su mažiausiai 95 % sekos homologija su SEQ ID NO: 7. Kitame įgyvendinime, mažiausiai vienas išgrynintas baltymas turi aminorūgščių seką, apimančią mažiausiai 95 % sekos homologija su fermentu, parinktu iš PvuRtsll, PpeHI, EsaSS310P, EsaRBORFBP, PatTI, Ykrl, EsaNI, SpeAI, BbiDI, PfrCORFI I80P, PcoORF314P, BmeDI, AbaSDFI, AbaCI, AbaAI, AbaSI, AbaUMB3ORFAP ir Asp6ORFAP. Kitame įgyvendinime, mažiausiai vienas iš išgrynintų baltymų parinktas iš grupės, susidedančios iš: PvuRtsll, PpeHI, EsaSS310P, EsaRBORFBP, PatTI, Ykrl, EsaNI, SpeAI, BbiDI, PfrCORFII80P, PcoORF314P, BmeDI, AbaSDFI, AbaCI, AbaAI, AbaSI, AbaUMB3ORFAP ir Asp6ORFAP ir katalikiškai aktyvių mutantų ir jų darinių.
Išradimo įgyvendinime, buferis preparate gali apimti druską, turinčią anijoną, parinktą iš sulfato, fosfato, acetato arba citrato. Kitame įgyvendinime, buferis neturi chlorido, nitrato, karbonato arba imidazolo druskos. Druskos koncentracija gali būti 50-500 mM srityje.
Išradimo įgyvendinime, būdas siūlo hmC aptikimą genominiame DNR mėginyje. Būdas apima pridėjimą preparato, kaip anksčiau aprašyta, į genominės DNR mėginį; leidimą baltymui skelti genominę DNR skilimo saite; nustatymą DNR sekos bent jau vienoje skilimo saito pusėje; pasirinktinai, DNR sekos kartografavimą ant referencinės genominės DNR sekos; ir hmC aptikimą. Preparatas, naudojamas būde, gali apimti: vieną arba daugiau DNR polimerazių, pradmenų ir adaptorių.
Dar kitame įgyvendinime, būdas apima skilusios genominės DNR amplifikavimą prieš nustatant DNR seką. Aukščiau minėtuose būdo įgyvendinimuose, genominė DNR gali pirma sureaguoti su β-gliukoziltransferaze (BGT) arba pažymėta
BGT arba BGT dariniu prieš sumaišant reakcijos inde genominę DNR su aukščiau apibūdintu preparatu. Įgyvendinime, būdas gali būti įvykdytas viename reakcijos inde arba mikrofluidiniame įtaise.
Papildomame išradimo įgyvendinime, siūlomas būdas išgryninti ZZYZ šeimos baltymą, kuris apima: klonavimą ir ekspresavimą sulieto baltymo, apimančio ZZYZ šeimos baltymą, inteiną ir afiniškai surišantį baltymą, pailiustruotą chitiną surišančiu domenu (CGD), maltozę surišančiu domenu (MBP) arba bet kuriuo tinkamu baltymu, galinčiu pririšti prie matricos; priversti sulietam baltymui prisijungti prie matricos afiniškai surišančio baltymo priemonėmis; atskelti ZZYZ šeimos baltymą nuo inteino; ir išgryninto baltymo regeneravimą eliuate. Viename įgyvendinime, afiniškai surišantis baltymas yra chitiną surišantis domenas.
Išradimo įgyvendinime, siūlomas fragmentų rinkinys, kuris apima mažiausiai vieną iš a) oligonukleotidų fragmentų, turinčių 20-23 nukleotidų dydį su patalpintu centre hmC arba ghmC; arba b) didelės DNR arba oligonukleotidų fragmentų, turinčių hmC arba ghmC, patalpintų DNR dvigubos spiralės vienguboje grandinėje 11-13 nukleotidų lokacijoje nuo grandinės 3‘ galo.
Išradimo įgyvendinime, siūlomas rinkinys, kuris apima: vieną arba daugiau išgrynintų ZZYZ baltymų šeimos rekombinantiniu baltymų, jų funkcinių darinių arba jų katalitinių fragmentų efektyviame buferyje, sudarančiame galimybę fermento aktyvumui; ir naudojimo instrukciją. Rinkinys dar gali turėti BGT ir UDP-gliukozę. Rinkinys dar gali turėti pradmenų. Rinkinys dar gali turėti adaptorių, skirtų panaudoti sekvenavimo platformose.
TRUMPAS BRĖŽINIŲ FIGŪRŲ APRAŠYMAS
Fig. 1 parodo pavyzdinio fermento iš ZZYZ šeimos išgrynintą produktą ant 10-20 % denatūruoto poliakrilamido gelio. 1 juosta yra dydžio žymuo. 2 juosta yra PvuRtsI I, 3 juosta - PpeHI, 4 juosta - AbaSDFI, 5 juosta - PatTI, 6 juosta - EsaNI ir 7 juosta -Ykrl.
Fig. 2 parodo DNR substrato (SEQ ID NO:1) seką, naudojamą 3-5 figūrose.
Substratas pagamintas polimerazinės grandininės reakcijos (PGR) amplifikacija taip, kad kiekvienas citozinas buvo arba nemodifikuotas arba pakeistas per mC, hmC arba ghmC. mCs ir hmCs buvo įjungti į substratą PGR metu, to tarpu ghmC buvo gliukoziltransferazės reakcijos su hmCs produktas substrate. Pradmens seka tarp fragmento citozino neturi. Išorinis Mfel saitas buvo sukonstruotas j PGR seką tam, kad kontroliuotų gliukozilinimo statusą.
Fig. 3-5 parodo reakcijos produktą tarp pavyzdinių fermentų ZZYZ šeimoje 2kartinio serijinio praskiedimo ir substrato iš Fig. 2, kurioje visi Cs yra nemodifikuoti, visi Cs pakeisti į mCs, visi Cs pakeisti į ghmCs (pghmCs) ir visi Cs pakeisti į hmCs. Pirma ir paskutinė juostos turi PGR žymenį. Juostos tarp žymenų parodo atskiro fermento du-kartinį serijinį praskiedimą. Reakcijos sąlygos buvo 23°C, 20 min NEB4 buferyje (New England Biolabs, Ine., Ipsvvich, MA (NEB)) su galutine KOAc 250 mM koncentracija.
Fig. 3 parodo PvuRtsll rezultatus, kur santykis hmC:ghmC:mC:C = 2000:2000:8:1. Fermento kiekis pirmoje juostoje, gretimoje kairės pusės žymeniui, yra 33 pg.
Fig. 4 parodo PpeHI rezultatus, kur santykis hmC:ghmC:mC:C = 128:256:2:1. Fermento kiekis pirmoje juostoje, gretimoje kairės pusės žymeniui, yra 123 pg.
Fig. 5 parodo AbaSDFI rezultatus, kur santykis hmC:ghmC:mC:C = 500:8000:1:ND (neaptiktas). Fermento kiekis pirmoje juostoje, gretimoje kairės pusės žymeniui, yra 52 pg.
Fig. 6A ir 6B parodo, kad ZZYZ fermentų šeima skelia pilnai hidroksimetilintus oligosubstatus.
Fig. 6A parodo išgryninto rekombinantinio PpeHI aktyvumą 56 bazių porų sintetinio nukleotido substrate, turinčiame AhmCGT. 1 juosta: tik DNR, 2-8 juostos: fermento 2-gubą praskiedimą. Reakcijos buvo inkubuotos 37°C temperatūroje 1 valandai ir atskirtos 20 % TBE poliakrilamido gelyje.
Fig. 6B parodo schematinį oligonukleotido substrato skaldymo vaizdą, rodantį skėlimo produktus. PpeHI skelia bet kurioje atpažinimo saito (parodyta strėlėmis) pusėje, kad sukurtų 20 bazių porų fragmentą.
Fig. 7 parodo ZZYZ fermentų aktyvumą simetriškai hidroksimetilintuose oligonukleotiduose ir hemi-hidroksimetilintuose oligonukleotiduose. Gelis parodo rezultatus naudojant PpeHI. Skaldymo produktai buvo analizuoti 20 % poliakrilamido denatūruotame gelyje su 7M karbamidu. Sunumeruotos juostos gelyje atitinka skėlimo vaizdams, parodytiems piešiniu dešinėje gelio pusėje. Pavyzdžiui, 1 juosta atitinka skėlimo vaizdui, gautam iš hmCG/GhmC viršutinėje ir apatinėje grandinėse tik su pažymėta viršutine grandine.
Fig. 8A-B parodo ZZYZ šeimos fermentų skėlimo saitus kaip atskirai nustatytus dvigubos grandinės DNR kiekvienai grandinei, turinčiai vienoje grandinėje hmC arba ghmC.
Fig. 8A parodo skėlimo produktą dviguboje grandinėje, komplementarios grandinei, turinčiai hmC, atitinkančiai 3 ir 4 juostoms gelyje. Naudojamų oligonukleotidų sekos yra parodytos gretimai geliui. Gelis yra toks pat kaip parodytas Fig. 7. Sintetiniai oligonukleotidų žymenys (M1, M5 ir M2, M3) siūlo gidą skėlimo saitų aptikimui. Oligonukleotidų substratai ir sintetiniai žymenys buvo pažymėti FAM fluorescuojančia grupe ir atskirti denatūruoto 20 % poliakrilamido gelyje su 7M karbamidu. Skėlimo fragmentai atitinka M2 ir M3 (3 juosta) ir M1 ir M5 (4 juosta) ir pažymėti oligonukleotido sekoje (SEQ ID NO:2), sekančioje geliui.
Fig. 8B parodo skėlimo produktą dviguboje grandinėje, turinčioje ghmC. Substratas (R2), turintis parodytas sekas (SEQ ID NO:3 ir 4), kiekviename gale (*) buvo pažymėtas su alfa-33P dATP. Žymenys (M1 ir M2) pažymėti su gama-33P ATP naudojant polinukleotidkinazę.
Fig. 8C parodo, kad ZZYZ baltymas skelia DNR, turinčią ghmC arba hmC tame pačiame 3‘ atstume nuo modifikuoto nukleotido. Gliukozilinimas neveikia skėlimo atstumo. Reakcijoje buvo naudojami skirtingi substratų rinkiniai, arba su hmC (1 ir 3 juostos) arba su ghmC (2 ir 4 juostos). Fluorescentiniai žymenys (FAM) Figūroje parodyti kaip užpildyti apskritimai. Laukiamos skėlimo vietos pažymėtos linijomis. Čia buvo naudotas fermentas AbaSDFI. Lyginant 3 ir 4 juostas, gali būti padaryta išvada, kad skėlimo atstumai modifikacijų dviejų tipų priešingose grandinėse yra tokie pat.
Fig. 9 parodo hmC vietų identifikavimo būdą žiurkių smegenyse genominėje DNR. Genominė DNR buvo paveikta su T4 BGT, kad gliukozilintų bet kuriuos hmCs ir po to skaldoma ZZYZ fermentu (pvz. AbaSDFI). Skaldyti produktai buvo liguoti su sintetiniu dvigubos grandinės oligonukleotido adaptoriumi, kaip pailiustruota. Ligatabilus galas turi 2 bp degeneruotų nukleotidų. Liguoti fragmentai buvo atrinkti pagal dydį nuo maždaug 1 kb-3 kb. Šie buvo PGR amplifikuoti naudojant įprastą pradmenį, specifinį adapteriui. Po to amplifikuoti PCR produktai gali būti klonuoti į įprastą klonavimo vektorių ir sekvenuoti, kad nustatytų, kuris iš gretimų citozinų yra hidroksimetilintas.
Fig. 10 parodo klonuotų fragmentų iš žiurkių smegenų genominės DNR, gautos pagal Fig. 9, pavyzdinę logo seką. Visi klonuoti fragmentai atitiko pavyzdiniam žiurkės genomui. Skaldymo saito 40 bp langai kairėje ir dešinėje buvo išekstrahuoti ir įvertinti, kaip pailiustruota Figūroje.
Fig. 11 aprašo didelio našumo sekvenavimo protokolą, kad nustatytų, kuris iš citozinų, gretimuose CpG motyvuose yra hidroksimetilinti ir tarnauja kaip substratas ZZYZ šeimos narių skėlmui. (A): DNR fragmento laisvieji galai apklausai yra užblokuoti. Skėlimas įvyksta saite, esančiame tarp dviejų identifikuotų citozinų su ZZYZ fermentu, besibaigiančiu 1-3 baze lipniame gale. (B): Lipnus DNR galas pašalinamas DNR fragmento buku galu. (C): Žinomos sekos adapteris yra liguotas prie abiejų skėlimo fragmentų bukų galų, kur adapteris turi nemodifikuotą CC/GG viename gale ir žymenį X - kitame. Neliguotas adapteris pašalinamas sukinio kolonėle. (D): Adapteris, liguotas DNR, yra skeliamas antrą kartą su ZZYZ fermentu, kad išlaisvintų adapterį, liekantį už CC kaip lipnusis galas nuo fragmento, turinčio hmC. Fragmentas, kuris turi nemodifikuotą citoziną, yra neskeliamas. Yra naudojama sukinio kolonėlė, kad pašalintų skeltą adapteri. (E): Antrasis adapteris pridedamas skelti fragmentą su CC lipniu galu. Antras adapteris turi Y žymenį. Citozinas, kuris yra modifikuotas, gali būti nustatytas iš sekvenavimo fragmento su Y žymeniu. Nemodifikuotas citozinas gali būti patvirtintas sekvenuojant fragmentą su X žymeniu. (F): Nesuskaldytas fragmentas sekvenuojamas transkripcijos kryptimi nuo hmC (5hmC) saitų. (G): hemi-hmC (5-hmC) yra kartografuotas ant referencinio genomo.
Fig. 12 parodo sekvenavimo schemos pavyzdį hidroksimetilomos dekodavimui. Genominė DNR yra pirmiausiai paveikiama su BGT, o po to skaldoma su 7ΖΧΊ. šeimos fermentu (pvz. AbaSDFI). Atskiri adapteriai, arba su 2-degeneruotos bazės 3‘ lipniu galu arba su 3-degeneruotos bazės 3‘ lipniu galu, tada yra liguojami prie suskaldytų produktų. DNR adapteris turi žymę (tokią kaip biotinas), kad palengvintų gryninimą transkripcijos kryptimi. Liguota DNR yra sukarpoma į mažesnius fragmentus. Šie fragmentai su adapteriais, liguotais prie galų, yra ištempiami naudojant avidino rutuliukus. Po to fragmentai liguojami su antru sekvenuojančiu adapteriu. Liguoti produktai yra PGR-amplifikuoti naudojant sekvenavimui specifinius pradmenis.
Fig. 13 parodo Promals'o (Pei & Grishin, Bioinformatics, 23(7):802-808 (2007)) naujos fermentų šeimos narių pirminę struktūros sulyginamąją analizę, čia identifikuotą kaip ZZYZ šeimą (SEQ ID NO: 5-13). Parodyti devyni šeimos nariai, kur kiekvienas fermentas turi hmC arba ghmC pirmenybinj skėlimo aktyvumą, palyginus su mC arba nemodifikuotu citozinu dvigrandėje DNR (dsDNR).
Fig. 14 parodo, kad PvuRtsll gali išskirti DNRs su hmC skirtingais lygiais skirtingose ląstelėse. Čia hmC lygiai embrioninėse kamieninėse ląstelėse buvo sulyginti su fibroblastais. E-14 genominė DNR buvo suskaldyta į lipnią klampią medžiagą, tuo tarpu kai NIH3T3 DNR buvo suskaldyta tik truputį, patvirtinant žymų hemi-metilinto hmC buvimą E-14 ląstelėse ir žymiai mažesnius bet kurio hmC lygius fibroblastuose.
DETALUS ĮGYVENDINIMŲ APRAŠYMAS
Čia aprašyti fermentų šeimos unikalūs požymiai yra jų rišamosios savybės ir specifinis skėlimas, kuris pirmiausiai siūlo tiesioginį fermentinį būdą aptikti hmC genome, apimant hemi-hidroksimetilintuoses saituose, kiekybiškai ir sekų kontekste.
Čia aprašyti naujai apibrėžtų ZZYZ šeimos fermentai yra ypatingo dėmesio dėl priežasčių, kurios apima jų gebėjimą atskirti hmC (taip pat ir ghmC) liekanas nuo mCs arba nemetilinto citozino, kad gautų DNR fragmentų rinkinį, kur skėlimas įvyksta pagrindinai fiksuoto atstumo transkripcijos kryptimi nuo fermento atpažinimo saito DNR-je. Fragmentų narių dydis fragmentų rinkinyje, atsiradusių iš skėlimo su ZZYZ fermentais, gali būti pilnai heterogeninis. Kai DNR turi hemi-hmC arba hemi-ghmC, dviguba grandinė trūksta tik ant modifikuoto nukleotido vienos pusės(3‘), kad generuotų kintamo ilgio dsDNR fragmentus. dsDNR fragmentai bus generuojami 2023 nukleotidų dydžio, kai hmC arba ghmC yra simetriškai išsidėstę CpG saituose.
Tam tikri terminai aprašyti žemiau.
„Didelė DNR“ skirtas nurodyti bet kuriai natūralios kilmės arba sintetinei
DNR, turinčiai dydį, didesnį negu 100 nukleotidų iki genomo dydžio.
„Panašus dydis“ su nuoroda į fragmentų „rinkinys“ skirtas nurodyti fragmentams, kurie kinta ne daugiau negu apie ± 5 nukleotidai pagal ilgį.
„Patalpintas centre“ skirtas nurodyti modifikuoto nukleotido atitikimu! lokacijai vienoje grandinėje, kuri yra apytiksliai centruota dsDNR fragmento toje pačioje grandinėje. Lokacija pagrindinai yra tarp 5 centre nustatytų nukleotidų skaičiuojant nukleotidus nuo fragmento bet kurio galo.
„N-galinis domenas“ nurodo j sritį, ištęstą iki baltymo aminorūgščių sekos apie 50 %. „C-galinis domenas“ nurodo į sritį, ištęstą iki baltymo aminorūgščių sekos apie 50 %.
„Matrica“ skirtas įjungti bet kurią struktūrą, turinčią paviršių, tinkamą imobilizuoti molekulę, kuri turi giminingumą matricai ir apima, pavyzdžiui, granules (rutuliukus), kolonėles, plokščius paviršius, tokius kaip popierius arba stiklas, viso paviršiaus vidus arba tuščia forma, ir t.t.
„Fragmentų rinkinys“ gaunamas skeliant didelę dsDNR su ZZYZ šeimos fermento nariu. Fragmentų rinkinys apima dvigubos grandinės oligonukleotidus, kurie yra didelės DNR skėlimo produktas simetrinėje hmC arba ghmC (hmCG/GhmC) abiejose pusėse ir kintamo dydžio fragmentus, kuriuose hemi-hmC arba hemi-ghmC yra išsidėstęs fiksuotoje padėtyje nuo skaldymo saito (pvz., 9-13 nukleotidai). Jeigu genomas, kuris susideda iš daugybinių didelių DNR (pvz., chromosomų), yra suskaldytas, tai kiekviena didelė DNR turės duoti daug fragmentų rinkinių. Fragmentų mišinys, gautas iš viso žmogaus genomo, gali būti laikomas kaip daugybė fragmentų rinkinių, kai kiekvienas rinkinys išvestas iš chromosomos arba kaip fragmentų vienas rinkinys, priklausomai nuo konteksto. įgyvendinime, fragmentų rinkinys apima mažiausiai 6 nukleotidų fragmentus su skirtingomis DNR sekomis. Pavyzdžiui, nukleotidų rinkinys gali apimti mažiausiai 10 fragmentų su skirtingomis sekomis arba mažiausiai 20 fragmentų su skirtingomis sekomis. Viename įgyvendinime, nukleotidų rinkinys apima vieną arba daugiau panašaus dydžio fragmentų su centre patalpintu hmC arba ghmC.
„Fermento preparatas“ skirtas nurodyti reagentui ir niekam kitam, kilusiam jo natūralioje būsenoje in vivo.
„X“, kai naudojamas aminorūgščių sekoje, reiškia bet kurią aminorūgštj.
čia identifikuota DNR skelianti nauja šeima kaip 2Z32. šeima, kur šeimos nariai pirmenybiškai atpažįsta hmC ir ghmC ir nemetilintą (mC) arba nemodifikuotus citozinus dsDR-je ir po to skelia DNR neatstikitiniame atstume transkripcijos kryptimi (3‘ krytimi) nuo hmC arba ghmC nukleotido kiekvienoje DNR grandinėje, kuri turi hmC arba ghmC. Šios šeimos nariai apima, bet yra neapriboti bakterinių restrikcijos endonukleazių.
Šeimos nariai gali būti apibūdinti struktūriškai skirtingu skėlimo domenu ir surišimo domenu ir ypatingai N-galiniu konservatyviu domenu su didesniu negu 85 % aminorūgščių sekos homologiškumu, pavyzdžiui, didesniu negu 90 % aminorūgščių sekos homologiškumu, pavyzdžiui, didesniu negu 98 % aminorūgščių sekos homologiškumu su RX7KX2EXYX18QQX11.16DLX2PX6EXDEX2HX6-26DX2RX3l (SEQ ID NO: 14) N-galiniame domene, ir/arba daugiau negu 85 % arba 90 % arba 98 % aminorūgščių sekos homologiškumu su WXNX3O^oAXi2-i3FXGXi6.i8R (SEQ ID NO: 15) C-galiniame domene. Viename įgyvendinime, baltymas (pailiustruotas per AbaSDFI) su RX7KX2EXYX18QQXi1.16DLX2PX6EXDEX2HX26DX2RX3l (SEQ ID NO: 16) su N-galine seka, turi didelį selektyvumo laipsnį tarp ghmC/hmC/ ir mC.
ZZYZ šeimos nariai (pavyzdžiui, žiūr. Fig. 13) apima rekombinantinius baltymus, variantus ir darinius. Variantų pavyzdžiai apima mutantus, kuriuose, pavyzdžiui, katalitinis domenas buvo modifikuotas arba pašalintas iš baltymo ir liko tik DNR surišantis domenas, skirtas hmC ir ghmC. Variantų papildomi pavyzdžiai yra sulieti baltymai. Šie sulieti baltymai gali tarnauti kaip reagentai arba gali būti tarpiniai junginiai fermentų gryninime arba hidroksimetilintų nukleotidų kartografijoje.
Sulietų baltymų variantai ZZYZ baltymų šeimoje gali būti sulieti su antru baltymu arba daugybe baltymų, kurie tarnauja kaip žymė, žymelė arba žymuo vizualizacijai in situ baltymui, prijungtam prie hmC arba ghmC arba afininiam gryninimui. Sulietų partnerių pavyzdžiai apima inteinus (JAV patentas Nr. 5643758), maltozę surišančius baltymus (MBPs) (JAV patentas Nrr. 5643758 ir 7825218; ir PCT publikacija WO 2010/114532), SNAP-TAG® (JAV publikacija Nr. US-2004-0115130) arba gali turėti pakaitą, kuris veikia kaip žymė, pavyzdžiui, pakeičiant cisteiną į selenocisteiną (žiūr. JAV patentas Nr. 7141366). Alternatyviai, sulietas baltymas gali apimti nukleorūgšties aptamerą žymėjimui arba gryninimui (pavyzdžiui, žiūr. JAV patentus 5670637; 5696249; 5874557; 5693502).
Šeimos nariai dalijasi vienas su kitu mažiausiai 30 % aminorūgščių sekos identiškumu, pavyzdžiui mažiausiai 40 %, pavyzdžiui mažiausiai 50 %, pavyzdžiui mažiausiai 60 %, pavyzdžiui mažiausiai 70 %, pavyzdžiui mažiausiai 80 %, pavyzdžiui mažiausiai 90 %, arba mažiausiai 95 % aminorūgščių sekos tapatumo kaip pareikšta Promals‘o pirminės struktūros sulyginamojoje analizėje (Pei & Grishin, Bioinformatics, 23(7):802-808 (2007)) ir apima PvuRtsll, PpeHI, AbaSDFI, EsaSS310P, EsaRBORFBP, PatTI, Ykrl, EsaNI, SpeAI, BbiDI, PfrCORF1l80P, PcoORF314P ir BmeD1, kai kurie iš jų aprašyti 1 lentelėje ir Fig. 13. Pavyzdžiui, vienas šeimos narys yra AbaSDFI, kur variantai AbaCI (GenBankas:ACQB1000053), Abal (GenBankas: ΑΒΧΚ01000045), AbaSI (GenBankas: NC_009085), AbaUMB3ORFAP (GenBankas: AEPM01000006) ir Asp6ORFAP (GenBankas: ACYS1000207) dalijasi mažiausiai 95 % sekos tapatumu su AbaSDFI. Šie fermentai neįtraukti į 1 lentelę. Jų savybės yra iš esmės tokios pat kaip ir AbaSDFI. Nuoroda į šeimos atskirus narius yra skirtas apimti jo darinius ir katalikiškai aktyvius fragmentus.
Antikūnai gali būti pakelti iki ZZYZ fermentų šeimos narių naudojant standartines technikas, skirtas sukurti monokloninius arba poliklonininius antikūnus arba antikūnų fragmentus. Šie antikūnai arba jų fragmentai gali būti panaudoti ZZYZ fermento šeimos nario in situ žymėjimui, prijungtam prie hidroksimetilintos arba gliukozilintos hidroksimetilintos didelės DNR.
Vienas ZZYZ fermentų šeimos narys yra PvuRtsll. Ši restrikcijos endonukleazė pirmiausia buvo aprašyta lshaq & Kaji (Biological Chemistry 255(9):4040-4047 (1980)) ir parodyta, kad ji yra hmC-specifinė restrikcijos endonukleazė, koduota plazmide Rts1. PvuRtsll genas buvo klonuotas ir ekspresuotas (Janosi and Kaji, FASEB J. 6:A216 (1992); Janosi et ai., Journal of Molecular Biology 242: 45-61 (1994)) ir Rts1 plazmidė buvo pilnai sekvenuota (Murata etai., Journal of Molecular Biology 184 (12):3194-202 (2002)).
Tačiau nėra atlikta šio fermento gilesnės studijos arba publikacijos. Be to, po pirmųjų publikacijų, šiuo fermentu buvo menkai domimasi. Tai ryškiausiai buvo atsispindėta PCT publikacijoje WO 2010/037001, kuri turėjo skyrių apie hmC ir ghmC aptikimo būdus, bet nebuvo jokių užuominų apie šį fermentą. WO 2010/037001 aprašo būdus, kurie yra cheminės prigimties arba apima baltymų, tokių kaip antikūnai, surišimą. Kur fermentai yra paminėti, tai tokie iliustruoti išimtinai gliukoziltransferazėmis.
Tam, kad būtų ištirtos šios šeimos savybės kaip specifinės, reikėjo fermentus išgryninti. Po rūpestingų analizių ir išplėstinių eksperimentų atrasta, kad daug įprastai gryninimui naudojamų joninių reagentų, tokių kaip NaCI, fermentus išaktyvuoja. Dar atrasta, kad skirtingų tipų druskų ir jų koncentracijų panaudojimas paveikia aktyvumą. Rasta, kad ZZYZ fermentų šeima buvo išaktyvuota dalyvaujant druskoms, tokioms kaip chloridai, nitratai, karbonatai arba imidazolo druskos. Todėl buvo padaryta išvada, kad šių druskų reikia vengti. Pasirodė, kad kitos druskos, tokios kaip sulfatai, fosfatai, acetatai ir citratai aiškiai slopina fermentų aktyvumą esant didelėms koncentracijoms ir todėl geriau fermentus laikyti arba naudoti 50-500 mM koncentracijų ribose.
Kitas svarbus svarstymas buvo fermentus skiriančios savybės hmC nuo mC ir C. Nuo tada, kai nustatyta, kad genome hmC pasitaiko labai retai, maži skėlimo lygiai prie mC arba C galėtų išplaukti j didelę genetinę apsuptį, kuri paveiktų galimybę aptikti hmC.
ZZYZ šeimos narių gryninimas sudarytų galimybę fermentų šeimos skėlimo savybių studijai. Pirminės pastangos išgryninti gamtinį arba rekombinantinį PvuRtsI I buvo problematinės, nes visos standartinės kolonėlės, naudojamos gryninimui, vedė j žymų fermento aktyvumo praradimą. Rekombinantinis PvuRtsI I buvo gautas kaip sulietas baltymas su 6xHis žymele PvuRtsI I N-gale, turėjo fermento labai didėjančio skėlimo aktyvumo ant nemodifikuoto substrato nepageidautiną efektą, kas sumažino fermento pritaikymą aptikti hmC tiesiogiai. C-galinės 6xHis žymelės pridėjimas nepakeitė santykinio aktyvumo skirtingų metilinimo statusų ant kiekvieno substrato, bet fermento specifinis aktyvumas buvo ženkliai sumažintas.
Rekombinantinis PvuRtsI I buvo taip pat sulietas su intein-CBD (IMPACT™ rinkiniu, NEB), kuris po to buvo skeliamas, kad atpalaiduotų gryną fermentą. Šiuo keliu galėjo būti gauta aktyvaus fermento didelė išeiga (žiūr. 1 pavyzdį).
Rekombinantinis baltymas arba vienas, modifikuotas arba sulietas su žyme gali būti pažymėtas vaizdo gavimo tikslais panaudojant spektroskopinį žymėjimą, tokį kaip fluorescentinį arba chemiliuminescentinį žymėjimą, radioaktyvųjį žymėjimą arba kitą reakcingą cheminį agentą, arba žymėtą cukrų, žymėtą antikūną arba kitą žymėtą baltymo žymę (apimant pavyzdžiui SNAP-TAG®, NEB) (taip pat žiūr. Chung-Xiao
Song etai., Nature Biotechnology29:68-72 (2011)).
Tyrimo taikymas, parodytas Fig. 3-5, fermentų koncentracijų nustatymui, prie kurių atsiranda maksimalus ghmC- ir hmC-specifinis skėlimas ir aptiktas minimalus mC ir C skėlimas įgalino identifikuoti ZZYZ šeimos narių skėlimo savybes. Rezultatai, gauti iš specifinių analizių (pavyzdžiui, žiūr. 1 lentelę) parodė, kad šios šeimos nariai pateikė žymiai pagerintą ir paprastesnį būdą specifiniam hmC nustatymui ir kartografavimui DNR-je.
Efektyvesnei hmC analizei genome, reagentų požymiai apima reagentų atskyrimų savybes hmC ir/arba ghmC nuo mC ir C. Taigi, buvo nustatyti santykiai fermento skėlimo specifiškumui. Santykių pavyzdžiai skirtingiems fermentams ZZYZ šeimoje pateikti 1 lentelėje.
Rasta, kad išgryninti fermentai ZZYZ šeimoje turi hmC arba ghmC:mC minimalų skėlimo santykį mažiausiai 8:1, pavyzdžiui, 50:1, pavyzdžiui, mažiausiai 100:1, pavyzdžiui mažiausiai 200:1 arba pavyzdžiui mažiausiai 250:1; ir hmC arba ghmC:C minimalų skaldymo santykį mažiausiai 50:1, pavyzdžiui, mažiausiai 100:1, pavyzdžiui mažiausiai 200:1 arba pavyzdžiui mažiausiai 250:1. Šie santykiai gali būti nustatyti pagal tiriamąjį pavyzdį, aprašytą 1 pavyzdyje ir Fig. 3-5.
Tiriamojo pavyzdžio konsistencijos pagerinimui, PGR DNRs buvo naudoti kaip substratas vietoje fago T4 ir ADNR, hmC-, mC- ir C-, turintys DNR substratus buvo gauti simetrinių oligonukleotidų, gautų komerciškai, PCR būdu (Integruotos DNR technologijos (IDT), Coralville, IA), kuriame hidroksimetilintas deoksicitidino trifosfatas (hmdCTP) arba metilintas deoksicitidino trifosfatas (mdCTP) buvo pakeistas į dCTP kaip aprašyta. hmC PGR fragmentas toliau buvo gliukozilintas naudojant BGT, kad taptų ghmC PGR DNR fragmentu. Šio tyrimo rezultatai parodė, pavyzdžiui, kad PvuRtsll turi hmC:ghmC:5-mC:C=2000:2000:8:1 aktyvumo santykį; PpeHI jis yra 12:250:2:1; AbaSDFI jis yra 500:8000:1 :ND, ND čia reiškia, kad skėlimas nestebimas net prie didžiausių fermento koncentracijų.
ΖΖΥΧ šeimos narių požymis yra tas, kad tikslus hmC arba ghmC skėlimo saitas gali kisti 3‘ transkripcijos kryptimi nuo hmC arba ghmC ne daugiau kaip 5 nukleotidais, pavyzdžiui, ne daugiau kaip 3 nukleotidais. Pavyzdžiui, naudojant sintetinius substratus (žiūr., pavyzdžiui, 3 pavyzdį ir Fig. 6-8) parodyta, kad nors ΖΖΥΧ šeimos nariai daugiausia skėlė dsDNR viename nustatytame atstume nuo hmC arba ghmC, skėlimo saitas gali būti stebimas 11-13 nukleotidų atstumu nuo hmC arba ghmC vienoje grandinėje ir 9-10 nukleotidų atstumu nuo hmC arba ghmC priešingoje grandinėje (ghmCNn.n/Ng^o). Apie 20-23 bp skėlimo fragmentas atsiranda iš skėlimo simetriniame hmC saite (hmCG/GhmC) dviejų grandinių DNR.
Įvairovės įvertinimas dėl skėlimo atstumo ZZYZ fermentų šeimos pagalba yra svarbus hmC bazių lokacijos kartografavimui genome. Fig. 8C taip pat atskleista, kad ghmC buvimas hmC vietoje neturi pastebimo efekto skėlimo atstumui. Atkreiptas dėmesys, vis dėlto, kad skėlimo aktyvumas gali būti padidintas, jeigu G yra fiksuotas prie 21-22 nukleotidų iš ZZYZ atpažinimo saito priešingoje vijoje, net jei čia nėra absoliutaus reikalavimo, skirto G šioje lokacijoje, net jei čia yra bet koks žymus arba net aptinkamas nukleotido nuokrypis tuojau pat flankuojantis ghmC arba hmC.
hmC arba ghmC lokacija didelėje DNR gali būti nustatyta klonuojant skėlimo produktus ir/arba sekvenuojant, pavyzdžiui, ultra didelio našumo sekvenavimo platformomis (žiūr. 7 pavyzdį). Naudojant ZZYZ šeimos narius, yra galimybė nustatyti ir kartografuoti hmC arba ghmC ir juos diferencijuoti iš mCs vienoje fermento reakcijoje. Kur du hemi-metilinti CpG saitai yra arti vienas kito, yra galimybė nustatyti, kuri iš 4 galimų pozicijų turi hmC (pavyzdžiui, Fig. 9-11).
ZZYZ fermentų šeimos narių panaudojimas generuoti fragmentų rinkinius hidroksimetilinimo genominei analizei arba kitiems tikslams, galima pasikliauti pavieniu fermentu arba galima įjungti fermentų gausybę, kur keli arba visi iš fermentų yra: ZZYZ šeimos nariai; kildinti iš ZZYZ šeimos narių; MspJI fermentų šeimos įjungti nariai (PCT publikacija WO2010/075375) ir/arba Mmel-kaip endonukleazių restrikcijos šeima; ir/arba endonukleazių restrikcijos kiti tipai.
Vienas iš požymių, kuris charakterizuoja ZZYZ baltymų šeimą yra surišimo domeno (C-galinio) ir katalitinio domeno buvimas. ZZYZ panašių fermentų surišimo domenas gali būti panaudotas abiems in vivo ir in vitro pritaikymams. Surišimo domeno panaudojimo pavyzdžiai apima: hmC turinčio DNR in vitro praturtinimą, pavyzdžiui, kaip reagentą afininiam gryninimui arba hmC in vitro taiknį. Pastarasis gali būti pasiektas pažymint surišimo domeną arba suliejant surišimo domeną su kitais domenais įvedant jį į hmC saitus genome. Surišimo domenas taip pat gali būti sulietas su nukleazės domenu, kad iššauktų dvigubos grandinės trūkius gretimuose hmC saituose, kad aktyvuotų DNR reparacijos kelią taip, kad šių saitų epigenetinis statusas galėtų būti pakeistas.
Epigenetinėms studijoms yra svarbus DNR pavyzdžių hidroksimetilinimo lygio nustatymas. Genomo epigenetinė reguliacija apima chromatino remodeliavimą, kuris dalinai liečia mC konvertavimą į hmC. Skirtumai hidroksimetilinimo modeliuose gali būti lemiamas indikatorius netinkamų vystimosi procesų, pavyzdžiui, embrioninėms kamieninėms ląstelėms. Dabar šie skirtumai gali būti tiriami įprastu būdu panaudojant fermentus iš ZZYZ baltymų šeimos, kuri selektyviai nukreipia taikinį į hmC ir ghmC. Šios nukleotido modifikacijos tada gali būti kartografuotos ant metilomos arba genomo.
PCT paraiška PCT/US2010/046632, kuri čia įtraukta visa apimtimi, toliau detaliau aiškina apie kartografavimo reikšmę hidroksimetilintų nukleotidų genome, kad būtų suprastas ląstelės šeimininkės ir organizmo fenotipas. ZZYZ šeima viena arba kartu su kitais fermentais (pavyzdžiui, MspJI šeimos nariu arba Mspl arba fermentų, funkciškai giminingų Mspl) gali būti panaudota pateikti metilomą arba hidroksimetilomą kartu panaudojant sekvenavimo techniką, aprašytą čia arba kitas sekvenavimo technikas, žinomas iš technikos lygio.
Fragmentų rinkinys(iai), gautas(ti) iš fermentų skaldymo su vienu arba daugiau fermentų iš ZZYZ šeimos ir pasirinktinai kitų DNR skėlimo fermentų, kurie skelia modifikuotus nukleotidus, gali būti sekvenuojami panaudojant didelio našumo įvairių rūšių sekvenavimo būdus, kurie šiuo metu prieinami naudojant, pavyzdžiui, NextGen sekvenavimo metodus, kad identifikuotų ir kartografuotų hmCs arba ghmCs DNR-įe. Specifinių skaldymo produktų parinkimas, kurie genome hibridizuoja tam tikrus regionus, gali būti panaudoti greitiems diagnostikos būdams, atskleidžiantiems nenormalų hmCs arba ghmCs buvimą arba nebuvimą, koreliuojantį su liga, tokia kaip vėžys. Individo konkretaus fenotipo nustatymui gali būti panaudoti specifiniai oligonukleotidai. Pavyzdžiui, fragmentų rinkinio hibridizacija apibrėžtai sekai arba sekų rinkiniui, esančioms ant kieto paviršiaus (hibridizacijos nustatymas) arba pažymėtoms tirpale (arba visa versa) gali atskleisti skirtumus tarp fragmentų rinkinyje ir standartinių fragmentų rinkinių, kurie charakterizuoja metilomą. qPGR arba hibridizacijos nustatymas taip pat gali būti panaudoti detaliai ištirti vieną arba daugiau žinomų tiriamų lokacijų kopijavimui. hmCs arba ghmC arba surišimo domenas gali būti pažymėti fluorescentine arba chemiliuminescentine žyme arba kitais žymėjimo būdais, žinomais technikos lygyje, kad palengvintų aptikimą.
ZZYZ fermentų šeimos narių gryninimas ir jų skaldymo specifiškumo charakterizavimas ir jų gebėjimas atskirti hemi-hmC nuo simetrinio hmC pirmiausiai pateikia duomenų generacijos tipą, kuris reikalingas tyrime, medicininėje diagnostikoje ir gydyme, kad būtų suprasta hidroksimetilintos DNR rolė ir prasmė bet kuriam specialiam fenotipui.
Medicininių sąlygų detalus aprašymas pateiktas PCT publikacijoje WO2010/037001, kuri čia įtraukta kaip nuoroda visa apimtimi. Kiekvienu atveju, kur TET baltymai yra įtraukti į genų ekspresiją, bus būtina nustatyti, kur hmC, kuri yra sukurta TET baltymų, yra lokalizuota, ir tokiu būdu bus pageidautina panaudoti ZZYZ šeimą, čia aprašytą.
Lentelė: ZZYZ baltymų šeimos narių pavyzdžiai
| Pavadini- mas | Alternatyvus pavadinimas | hmC | ghmC | mCG | C | Ilgis, panašumas ir tapatumas su PvuRtsll | Šaltinis |
| PvuRtsll | PvuRtsI 1 | 2000 | 2000 | 8 | 1 | 293, 100%, 100% | Pmteus vulgaris (Rts1) |
| PpeHI | PROPEN_01738 | 128 | 256 | 2 | 1 | 294, 72.5 %, 64.6 % | Pmteus penneri ATCC 35198 |
| PatTI | Pat_1499 | 2000 | 8000 | 128 | 1 | 306, 51.4%, 36.5 % | Pseudoaltemmonas Atlantica T6c ATCC BAA-1087 |
| Ykri | Ykris0001_38440 | 250 | 1000 | 64 | 1 | 299, 49.6 %, 36.1 % | Yersinia kristensenii ATCC33638 |
| EsaNI | GOS_7810815 | 128 | 64 | 8 | 1 | 299, 47.8 %, 39.6 % | Jūrinis metagenomas |
| AbaSDFI | ABSDF3356 | 500 | 8000 | 1 | 0 | 317, 47.8 %, 35.4 % | Acinetobacter baumanii SDF |
| SpeAI | Spea_2956 | 285, 47.1 %, 35.6 % | Shevvanella pealeana ATCC 7000345 | ||||
| BbiDI | BbifN4_02244 | 311, 43.3 %, 32.0 % | Bifidobacterium bifidum NCIMB 41171 | ||||
| BmeDI | 300, 40.0 %, 30.5 % | Bacillus megaterium kamienas DSM319 |
Pateikti eksperimentų protokolai nenumatyti, kad būtų apribojami. Bet kuris, patyręs šioje srityje, galėtų panaudoti eksperimentinį planą kaip pasiūlymą bet kuriam naujai nustatytos šeimos papildomam nariui.
Visos čia cituojamos nuorodos, įskaitant JAV atskirtas paraiškas 61/376932, pateiktą 2010 metų rugpjūčio 25 dieną ir 61/296630, pateiktą 2010 metų sausio 20 dieną, yra įtrauktos kaip nuorodos.
PAVYZDŽIAI pavyzdys: ZZYZ baltymu gryninimas ir aktyvumo bei specifiškumo tyrimas
Pasirinktos sekos atpažįstamos BLAST paieškos sistema (Zhang et ai., J. Comput. Biol. 7(1-2): 203-214 (2000)) ir tiriamasis yra ZZYZ šeimos narys, kuris gali būti ekspresuotas dabar žinomomis technikomis, pavyzdžiui in vitro transkripcijatransliacija (PURExpress®, NEB). Genas gali būti pasirinktinai kodono optimizuotas ir po to klonuotas kaip aprašyta žemiau PvuRtsll baltymui.
PvuRtsll buvo išgrynintas sekančiu būdu: A genas, koduojantis PvuRtsll, buvo įterptas į pTXB1 vektorių (NEB), klonuotas į ER2566 (T7 ekspresijos šeimininkas) ir augintas LB kultūroje su Ampicilinu (100 pg/ml) 30°C temperatūroje 4x10 ml, kad gautų naktinę kultūrą. 4*10 ml naktinės kultūros buvo pasėtos į 2x1 L LB su Ampicilinu (100 pg/ml). Po to 1L kultūros buvo augintas 30°C temperatūroje 6 valandas, į kultūrą pridėtas IPTG iki galutinės 500 pM koncentracijos. Kultūra dar buvo inkubuota 16°C temperatūroje per naktį. PvuRtsll buvo išgrynintas naudojant chitino granulių gravitacinę kolonėlę. Po to PvuRtsll buvo patalpintas į kolonėlę druskingame buferyje (10 mM tris-acetatas, 500 mM, KOAc, pH 8.0), kolonėlė buvo plaunama vėl druskingu buferiu. Druskingo buferio, turinčio 30 mM DTT, trys kolonėlės tūriai buvo panaudoti perpilti per kolonėlę. Kolonėlė buvo inkubuota 16 valandų 4°C temperatūroje druskingame buferyje su DDT. Baltymas buvo eliuotas ir sukoncentruotas. Bendrai buvo gauta apie 10 mg PvuRtsll. Baltymas buvo pridėtas į 50 % glicerolį ir laikytas -20°C temperatūroje tolimesniam gelio charakterizavimui. Kai 1 pg eliuanto nubėgo ant nuo 10 % iki 20 % poliakrilamido gelio, buvo aptiktos išgryninto fermento juostos, patvirtinančios fermentų grynumą (žiūr. Fig. 1). Šis būdas buvo taip pat pritaikytas išgryninti kitus ZZYZ šeimos narius, tokius kaip
PpeHI, AbaSDFI, PatTI, EsaNI ir Ykrl.
Išgryninto fermento substrato aktyvumui ir specifiškumui ištirti, sintetinis substratas buvo amplifikuotas panaudojant PGR kaip aprašyta Fig. 2. Citozinas, mC arba hmC buvo panaudoti PGR reakcijoje, kad gautų produktą su arba nemodifikuotu C, arba pilnai modifikuotu C. PGR produktas su hmC vėliau įvestas į reakciją su BGT ir UDP-gliukoze, kad konvertuotų hmC į ghmC.
Substrato specifiškumo ir aktyvumo analizės buvo atliktos sekančiai: buvo sudarytas reakcijos mišinys, kuris turėjo fermentą (3 μΙ, turintį 33-123 μg fermento), 3 μΙ kalio acetato (galutinė koncentracija 250 mM) ir NEB4 buferio (NEB), 50 ng DNR substrato, kuriame citozinas yra nepakeistas arba pakeistas į hmC, ghmC arba mC, ir pridėta 30 μΙ vandens iki galutinio reakcijos tūrio.
Fermentas buvo nuosekliai praskiestas ir pridėtas j reakcijos mišinį, kuris buvo inkubuotas 20 minučių kambario temperatūroje (23°C) ir po to patalpintas j 1,8 % agarozės gelį. Reakcija buvo sustabdyta stop-reagentu, o rezultatai parodyti Fig. 3-5 ir susumuoti 1 lentelėje.
Skėlimo sritis 1 lentelėje parodo, kad hmC buvo atpažintas ir suskaldytas mažiausiai 50 kartų aktyviau negu citozinas ir daugiau negu 8 kartus už mC. Kas dėl AbaSDFI, tai jo santykinis skėlimo aktyvumas buvo 8000 kartų aktyvesnis ghmC atžvilgiu, negu hmC ir 500 kartų aktyvesnis hmC atžvilgiu, negu mC ir nebuvo aptiktas aktyvumas C atžvilgiu.
Priedui prie aktyvumo ir santykinio specifiškumo (greičių) tyrimo, ZZYZ šeimos nariams gali būti nustatyta disociacijos pusiausvyros konstanta (Kd). Atitinkamai, fermentų reakcijos greitis su skirtingai modifikuotais substrato oligonukleotidais gali būti nustatytas panaudojant gelio mobiliojo poslinkio tyrimus panaudojant mikrogrynas-EZ kolonėles (Millipore, Billerica, MA). Pavyzdžiui, žymėtų oligonukleotidų pastovūs kiekiai gali būti sumaišyti su fermento didėjančiais kiekiais neskėlimo sąlygose, pvz. be Mg2+, ir fermento-DNR mišinys analizuotas ant gamtinio poliakrilamido gelio, arba panaudojant sukinio kolonėles, kurios tik atpalaiduoja DNR oligonukleotidus (skėlimo produktus), kai fermentas yra prijungtas. Kd duomenys gali būti panaudoti įmirkymo eksperimentuose, kad įgytų kokristalus. Priedo, C-galinio domeno Kd , kuris tarnauja kaip surišimo modulis hidroksimetilintai bazei ir jo flankuojančios sekos substrate gali būti paprastai nustatytos.
pavyzdys: Skėlimo lokacijos nustatymas substrate ZZYZ šeimos nariais
Patvirtinimui, kad ZZYZ baltymų šeima skelia dsDNR, pažinimo nukleotido 3‘ transkripcijos kryptimi fiksuotoje padėtyje, buvo sukurti sintetiniai nukleotidai, kurie buvo pažymėti vienoje grandinėje arba abiejose grandinėse, ir kurie turėjo simetrinius hmC arba ghmC nukleotidus arba buvo hemi-hidroksimetilinti kaip parodyta Fig. 7. Visi nukleotidai su fluorescentinėmis žymėmis buvo pagaminti panaudojant organinės sintezės standartines metodikas panaudojant hmC fosforamiditą (Glen Research, sterling,VA). dsDNRs buvo gautos leidžiant dviems oligonukleotidams aneliuoti į 10 μΜ tirpalą. Visi skaldymai buvo atlikti NEB4 buferyje (NEB). Kiekviename skaldyme 10 pmol substrato buvo inkubuota su 1 PpeHI vienetu 37°C temperatūroje 1 valandai. Vienas vienetas yra apibrėžtas kaip fermento kiekis, reikalingas suskaldyti T4gt DNR 1 pg į stabilų mažų fragmentų vaizdą 37°C temperatūroje 1 valandai. Tada 2 μΙ kiekvieno reakcijos mišinio buvo patalpinta j 20 % poliakrilamido gelį su 7M karbamido. Rezultatai yra parodyti Fig. 7. Strėlės rodos juostas, atitinkančias suskilusiems fragmentams, parodytiems gelio dešinėje. Rezultatai rodo, kad fermentai gali skelti atpažinimo sekos abiejose pusėse apytiksliai iš esmės fiksuotame atstume nuo atpažinimo saito.
pavyzdys: Skėlimo atstumo nustatymas kiekvienoje dviguboje DNR grandinėje
Taip pat buvo nustatytas skėlimo atstumo specifiškumas. Pažymėti ir nepažymėti nukleotidai, turintys hmC, buvo susintetinti panaudojant organinės sintezės standartines metodikas kaip aprašyta 2 pavyzdyje. Oligonukleotido dydžio žymuo buvo taip susintetintas, kad nustatytų skėlimo saitus kaip parodyta Fig. 8A. 3 ir 4 juostos parodo, kad skėlimo saitai hmC turinčios grandinės komplementarioje grandinėje buvo 9-10 nt ant 3‘ pusės nuo hmC.
Kad būtų nustatyti skėlimo saitai hmC toje pačioje grandinėje, dsDNRs buvo sudaryti leidžiant oligonukleotidams, turintiems hmC, aneliuoti j oligonukleotidus, turinčius nemodifikuotą citoziną į 20 μΜ tirpalą. 40 μΙ aneliuotos DNR buvo paveikta su T4 BGT (NEB) pagal gamintojo protokolą. Po reakcijos DNR buvo išgryninta per QIAquick® nukleotido pašalinimo rinkinį (Quigen, Germantovvn, MD) ir eliuuota 30 μΙ tūryje. 3‘ žymėjimo reakcija atlikta panaudojant Taq polimerazę (NEB) dalyvaujant alfa-33P dATP pagal standartinius protokolus. Apie 10 pmol substrato buvo inkubuota su AbaSDFI 1 vienetu 4 buferyje 37°C temperatūroje 1 valandai. 2 μΙ reakcijos turinio, kartu su žymenimis, buvo patalpinti į 20 % poliakrilamido gelį su 7M karbamido. Žymenys buvo pagaminti sintetiškai ir pažymėti su gama-33P ATP naudojant T4 polinukleotido kinazę (NEB). Gelis buvo išdžiovintas, eksponuotas į fosforo ekraną ir nuskenuotas. Rezultatai yra parodyti Fig. 8B. Fig. 8B skėlimo vietos gali būti išvestos, kad yra 12-13 nukleotidai nuo hmC toje pačioje grandinėje.
Nors specifiniai dydžio skėlimo fragmentai vyrauja Fig. 8A ir 8B, rasta, kad sekos kontekstas ir fermento koncentracija gali sukelti abejones dėl fermento skėlimo saito, tokias kaip skėlimo saitai gali kisti vienu arba dviem nukleotidais.
Pavyzdys: Nustatymas, ar ghmC turi skirtinga ar toki pat poveiki i hmC skėlimo vaizdus
Naudojant metodus, aprašytus aukščiau, buvo palygintas skėlimo specifiškumas saitams, modifikuotiems su hmC ir ghmC.
Visi nukleotidai su fluorescentiniais žymenimis ir hmC buvo gauti organinės sintezės būdu, kaip aprašyta aukščiau. hmC turintys substratai buvo konvertuoti j ghmC turinčius substratus naudojant T4 BGT (NEB) pagal gamintojo instrukcijas. Rezultatai Fig. 8C parodė, kad hmC turinti DNR 1 ir 3 juostose turi tokį pat skėlimo atstumo specifiškumą kaip ir ghmC 2 ir 4 juostose.
Pavyzdys: hmC fragmentu klonavimas iš žiurkės smegenų genominės
DNR
Buvo ištirtas ZZYZ fermentų naudingumas atskleidžiant hmC saitus žiurkės smegenų genominėje DNR. 1 pg žiurkės smegenų genominės DNR pradžioje buvo paveiktas su T4 BGT, kad hmC konvertuotų į ghmC. DNR po reakcijos buvo išsodinta ir buvo pajungta AbaSDFI skaldymui. Suskaldyti DNR produktai buvo vėl išgryninti ir pateikti ligavimo reakcijai su sintetiniu dsDNR adapteriu. Vienas adapterio galas turėjo 3‘ lipnų galą su dviem degeneruotomis bazėmis taip, kad ji galėjo liguoti skeltų produktų galus su 2-bazės 3‘-lipniu galu. Tada liguoti produktai nupilti ant žemai besilydančios agarozės gelio ir parinktas dydis buvo nuo 1 kb iki 3 kb. Tada parinkto dydžio DNR PGR amplifikuota naudojant specifinį pradmenį liguotam adapteriui. PGR pradmuo gali būti suplanuotas turėti daug restrikcijos saitų. Šiame pavyzdyje Xbal buvo naudojamas klonavimo palengvinimui. PGR produktai buvo išgryninti ir suskaldyti su Xbal ir liguoti iki atitinkamo vektoriaus, skirto transformacijai. Kolonijos buvo augintos ir sekvenuotos, kad nustatytų klonuotus įterpimus.
Vėlesnėje kompiuterinėje analizėje klonuotų įterpimų sekose viskas atitiko nurodytam žiurkės genomui. Šių sekų galai, pažymėti 2 bp 3‘-lipniu galu, kuriuos generavo AbaSDFI. Tada mes išekstrahavome 40 bp sekos langą abiems - kairiam ir dešiniam aplink skėlimo saitą ir išdėstėm sekas atskleisdami potencialų kosensusą, kaip parodyta Fig. 10. Buvo stebimi du matomi CG klasteriai prie abiejų skėlimo saitų dešinės ir kairės pusės. Atstumas tarp šių CG klasterių ir skėlimo saito atitiko AbaSDFI fermento skėlimo atstumui. Kol nenorima, kad būtų apribota teorijos, siūloma, kad AbaSDFI dimerizacija gali realizuotis apie 22 nukleotidų skėlimų atstume modifikuoto citozino vienoje pusėje. Taigi, gali būti padaryta išvada, kad mažiausiai vienas iš CG saitų yra hidroksimetilintas.
Pavyzdys: Hidroksimetilintu bazių genominėje DNR aptikimas
E14 pelės embrioninės kamieninės ląstelės ir NIH3T3 pelės genominės DNR ~ 500 ng buvo pajungta skaldymui su padidintos koncentracijos PvuRtsll 25°C temperatūroje valandai NEB4 buferyje. Molekulinės masės žymenys buvo pBR322 DNR skaldymo su Mspl, su kelių juostų dydžiu, išvardintu dešinėje. Suskaldytas produktas buvo paskleistas ant 20 % TBE gelio 2 valandoms prie 140 V, nudažytas su SYBER®Gold nukleorūgšties gelio dažikliu (Invitrogen, dabar Life Technologies, Carlsbad, CA) ir kiekybiškai nustatytas naudojant Typhoon skanerj (GE Healthcare Life Sciences, Piscatavvay, NJ) naudojant 488 nM lazerį (žiūr. Fig. 15).
Pavyzdys: Seku, turinčiu hmCs, kartografavimas
Kai hmC pasitaiko genome, atrodo, kad tai dažniausiai pasitaiko CpG saite. Vis dėl to taip pat tikėtina, kad DNR yra hemi-hidroksimetilinta CpG saite. Jeigu čia
DNR sekoje yra du kaimyniniai CpG saitai ir skėlimo vaizdas rodo hemihidroksimetilinimą, tai būtina nustatyti, kuris iš dviejų galimų CpGs yra hidroksimetilintas. Sekantis eksperimentas iliustruoja kaip hemi-hidroksimetilinto saito lokacija net gali būti nustatyta kai yra du kaimyniniai CpGs.
DNR fragmentai yra sukurti po specifinio arba nespecifinio genomo skėlimo. Egzistuojantys trys galai ant šių fragmentų yra blokuoti, pavyzdžiui, „užbukinimu“ arba defosforilinimu. Skeliami fragmentai yra liguojami prie oligonukleotidų adapterio, tada fragmentai pajungiami skėlimui fermentu iš 72X7 šeimos (pavyzdžiui, AbaSDFI). Kad nustatytų, ar DNR skėlimo saito ant abiejų pusių turi hmC ar tik viena pusė turi hmC, skaldyta genominė DNR yra „užbukinama“ ir liguojama prie Xkontrolės-koduoto SOLID™ pradmens ir P1 pradmens naudojant NEBNext® greito ligavimo modulį (NEB M2200). Po ligavimo, DNR yra vėl skaldoma ZZYZ fermentų šeima, ir fragmentai, kurie negali būti nuskelti nuo X-kontrolės-koduoto SOLID™ pradmens (Applied Biosystems, dabar Life Technologies, Carlsbad, CA) turės seką hmC transkripcijos kryptimi. Fragmentai, kurie gali būti suskaldyti, gamins produktą su specifiniu 2 nt 3‘ galu, kuris yra iš X-kontrolės-koduoto pradmens. Tada antras Ykontrolės-koduotas SOLID™ pradmuo yra liguotas prie laisvojo galo; šis SOLID™ judantis ratu sekvenavimas atskleis seką, turinčią hmC. Nesvarbu, jeigu šio metodo 5-hmC saitai yra sugrupuoti arba atsitiktinai paskirstyti (Fig. 11).
hmC pozicijos nustatymas DNR sekoje ir sekos kartografavimas ant genomo žemėlapio įgalina hidroksimetilomos sukūrimą. Tai taip pat įgalina diagnostikos testą nustatyti hmC buvimą ant taikinio DNR ir po to tai palyginti su etalonine hidroksimetiloma, kad nustatytų koreliaciją su fenotipu. Šalia specifinio fermentinio skaldymo su arba be gliukozilinimo, surišto su qPCR, gali būti nustatytas kiekybinis hidroksimetilinimas specifiniuose saituose.
Identifikuojant poziciją ir hmC kiekį iš skirtingų šaltinių, apimant skirtingus audinius ir ląstelės kultūrą prie skirtingu laiko taškų, galima pateikti svarbių įžvalgų į genų ekspresiją ir reguliaciją.
Pavyzdys: hmC aptikimo būdas DNR pavyzdyje
ZZYZ baltymų šeimos charakterizavimas atidaro naujas galimybes didelio skaičiaus mėginių greitai analizei arba diagnostiniams testams, skiriamiems gydytojo priimamajame.
Kadaise hmCs yra kartografuoti ant hidroksimetilomos ir parinkta hmC pozicija koreliavo su fenotipu, todėl norėsis nustatyti specifinių hmCs buvimą genomo taikinio regionuose. Tai gali būti lengvai pasiekiama naudojant ZZYZ baltymų šeimą. Jeigu DNR yra simetriškai hidroksimetilinta, tai atsiras specifinio dydžio fragmentas (20-30 nt). Jeigu DNR yra hemi- hidroksimetilinta, tai hmC buvimas gali būti nusisytas kaip nurodyta žemiau.
Genomini DNR yra pasirinktinai gliukozilinama ir po to paveikiama fermentu iš ZZYZ baltymų šeimos atitinkamame buferyje, tokiame kaip 250 mM kalio acetate, kad leistų skėlimą į fragmentus prie nukleotidų 11-13 saitų 3‘ transkripcijos kryptimi nuo hmC toje pačioje grandinėje ir 9-10 nukleotidų 3‘ transkripcijos kryptimi nuo hmC komplementarioje grandinėje. Yra parinkti pradmenys, kurie yra komplementarūs sekoms bet kurioje ZZYZ baltymo skėlimo saito pusėje, tokia kaip DNR, kuri nėra skelta yra amplifikuota. Tada aptikti fragmentai atitiks hmC nebuvimui. Kur DNR yra skelta ZZYZ baltymu, nurodančiu hmC buvimą, jokio amplifikacijos produkto nebus aptikta. Sulyginant amplifikacijos produktą genominiame bandinyje paveiktus ir nepaveiktus ZZYZ baltymu, pastarasis gali potencialiai įvertinti hidroksimetilinimo procentinį dydį. Alternatyviai, adapteriai, turintys pradmens seką gali būti liguoti prie pakopinių galų prie 3‘ skilimo saito arba liguoti prie DNR „užbukintų galų“ ir tik tokie fragmentai, turintys hmC, bus amplifikuoti nuo pradmens priklausančia amplifikacija. Taigi, hmC buvimas bus aptiktas kaip amplifikacijos produktas. Šiuo atveju amplifikuoti fragmentai gali būti sekvenuoti.
Šio metodo pranašumas yra tas, kad visos reakcijos gali būti įvykdytos paprastame reakcijos inde arba mikrofluidiniame įtaise arba luste.
Pavyzdys: Rinkinys, skirtas aptikti hmC DNR mėginyje
Pateikiamas rinkinys, kuris turi vieną arba daugiau išgrynintų rekombinantinių baltymų iš ZZYZ baltymų šeimos, jų funkcinių darinių arba jų katalitinių fragmentų, pavyzdžiui AbaSDFI, kartu su atitinkamu reakcijos buferiu ir papildomai BGT ir UDPgliukoze. Be to, rinkinys turi oligonukleotidų adapterius, kad palengvintų didelio našumo sekvenavimą. Be to, rinkinys dar gali apimti fermentus, tinkančius „galų užbukinimui“ ir ligavimui, ir papildomuose įgyvendinimuose gali apimti specifinius pradmenis. Išradimo įgyvendinime, rinkinys dar apima įpakavimo medžiagas ir rinkinių naudojimo instrukcijas.
SEKŲ SĄRAŠAS <110> New England Biolabs, Ine.
Zhu, Zhenyu Guan, Shengxi Zheng, Yu Wang, Hua Quimby, Aine Zhang, Penghua Apone, Lynne <120> Kompozicijos, būdai ir susiję panaudojimai modifikuotos DNR skėlimui <130> NEB-328-PCT <150> 61/296,630 <151> 2010-01-20 <150> 61/376,932 <151> 2010-08-25 <160> 16 <170> Patentas 3.5 versijoje <210> 1 <211> 948 <212> DNR <213> dirbtinė <220>
<223> oligonukleotidas <400> 1 ttttaaatta aaaatgaagt tttaaatcaa tctaaagtat atatgagtaa acttggtctg 60 acagttacca atgcttaatc agtgaggcac ctatctcagc gatctgtcta tttcgttcat 120 ccatagttgc ctgactcccc gtcgtgtaga taactacgat acgggagggc ttaccatctg 180 gccccagtgc tgcaatgata ccgcgagacc cacgctcacc ggctccagat ttatcagcaa 240 taaaccagcc agccggaagg gccgagcgca gaagtggtcc tgcaacttta tccgcctcca 300 tccagtctat caattgttgc cgggaagcta gagtaagtag ttcgccagtt aatagtttgc 360 gcaacgttgt tgccattgct acaggcatcg tggtgtcacg ctcgtcgttt ggtatggctt 420 cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg ttgtgcaaaa 480 aagcggttag ctccttcggt cctccgatcg ttgtcagaag taagttggcc gcagtgttat 540 cactcatggt tatggcagca ctgcataatt ctcttactgt catgccatcc gtaagatgct 600 tttctgtgac tggtgagtac tcaaccaagt cattctgaga atagtgtatg cggcgaccga 660 gttgctcttg cccggcgtca atacgggata ataccgcgcc acatagcaga actttaaaag 720 tgctcatcat tggaaaacgt tcttcggggc gaaaactctc aaggatctta ccgctgttga 780 gatccagttc gatgtaaccc actcgtgcac ccaactgatc ttcagcatct tttactttca 840 ccagcgtttc tgggtgagca aaaacaggaa ggcaaaatgc cgcaaaaaag ggaataaggg 900 cgacacggaa atgttgaata ctcatactct tcctttttca atattatt 948 <210> 2 <211> 56 <212> DNR <213> dirbtinė <220>
<223> oligonukleotidas <400> 2 cggcgtttcc gggttccata ggctccgcca cgtactctga tgaccagggc atcaca <210> 3 <211> 55 <212> DNR <213> dirbtinė <220>
<223> oligonukleotidas <400> 3 ccatacatat cccttacttc tcctaacgtg gatgataaag gtagtttatg tggaa 55 <210> 4 <211> 55 <212> DNR <213> dirbtinė <220>
<223> oligonukleotidas <400> 4 tccacataaa ctacctttat catccacgtt aggagaagta agggatatgt atgga 55 <210> 5 <211> 334 <212> PRT <213> Bacillus megaterium <400> 5
Met Asn Lys Tyr Asp Tyr Ile Lys Arg Gln Leu Ala Lys Thr Asn Lys 1 5 10 15
Lys Asn Asp Glu Asn Tyr Ile Vai Thr Arg Ile Trp His Leu Leu Asp
25 30
Asn Tyr Asp Ile Lys Ile Asn Thr Gln Gln Tyr Vai Vai Arg Ser Asn
40 45
Lys Asn Gln Lys Ala Glu Tyr Gly Leu Ile Asp Leu Tyr Phe Pro Gln
55 60
Phe Asn Leu Ala Vai Glu Ile Asp Glu Ala His His Lys Asn Asp Ile 65 70 75 80
Asn Gln Thr Leu Asp Glu Ile Arg Lys Asn Asp Ile Vai Asn Ala Leu
90 95
Asp Cys Glu Phe Ile Arg Ile Asp Ala Thr Gln Ser Phe Glu Lys Ile
100 105 110
His Glu Lys Ile Asp Gln Vai Vai Glu Lys Ile Asn Leu Leu Thr Lys
115 120 125
Glu Lys Trp Phe Ile Pro Trp Asp Leu Glu Lys Glu Tyr Asp Pro Asn
130 135 140
Thr Tyr Ile Glu Gln Gly Tyr Ile Asp Ala Asp Asp Asn Vai Ser Leu
145 150 155 160
Arg Leu Vai Ala Asp Cys Cys Asn Vai Phe Gly Ala Gly Tyr Ala His 165 170 175
Gly Ile Gln Lys Ser Gly Ala Pro His Lys Phe Glu Glu Asp Thr Asp 180 185 190
Ile Lys Arg Leu Lys Phe Phe Pro Asn Glu Thr Trp Asn Asn Gln Leu
195 200 205
Leu Glu Asn Glu Glu Ile Phe Ile Glu Tyr Asn Thr Ile Pro Glu Glu
210 215 220
Asn Glu Ala Tyr Phe Gln Lys Arg Met Tyr Gln Leu Asn Gln Lys Ile
225 230 235 240
Ala Leu Phe Ala Tyr Ala Lys Thr Ser Ser Gly Arg Phe Glu Ala Ile
245 250 255
Phe Lys Gly Leu Tyr Leu Leu Asn Arg Glu Lys Ser Lys Asn Thr Gly
260 265 270
Vai Leu Thr Tyr Asn Arg Ile Ser Thr Ile Met Pro Thr Tyr Tyr Pro
275 280 285
Lys Asp Vai Lys Gln Pro Leu Arg Ile Ala Glu Ala Tyr Asn Asn Asp
290 295 300
Glu Tyr Lys Vai Ala His Phe Tyr Thr Glu Asn Gln Vai Arg Lys Phe 305 310 315 320
Glu Gly Lys Tyr Lys Lys Arg Tyr Lys Ile Ile Ser Tyr Ser
325 330 <210> 6 <211> 309 <212> PRT <213> Bifidobacterium bifidum <400> 6
Met Ser Gly Ala Asp Lys Leu Gly Tyr Leu Ile Arg Ala Leu Ser Arg 15 10 15
Thr Lys Arg Lys Asp Tyr Glu Asn Tyr Vai Vai Asn Ala Ile Trp Asn
25 30
Arg Leu Ala Met Asp Asp Vai Lys Pro Vai Thr Gln Gln Leu Vai Leu
40 45
Trp Pro Asp Gly Arg Arg Ser Phe Vai Asp Leu Tyr Phe Pro Gln Ala
55 60
Met Ile Gly Vai Glu Cys Asp Glu Ala Tyr His Gln Arg Gln Arg Glu 65 70 75 80
Arg Asp Arg Glu Arg Glu Ile Thr Ile Thr Asp Vai Leu Arg Gln Ile
90 95
Arg Gly Glu Asp Tyr Arg Ala Leu His Vai Asp Vai Ser Gly Ser Tyr
100 105 110
Glu Gln Vai Glu Arg Ser Ile Asp Asp Cys Vai Arg Arg Ile Arg Ala
115 120 125
Glu Ile Glu Arg Arg Arg Gln Ala Asn Glu Phe Thr Pro Trp Thr Glu
130 135 140
Ala Tyr Vai Asp Tyr Lys Glu Phe Tyr Lys Thr Arg Asp Ala Vai Ser
145 150 155 160
Vai Ala Asp Asp Vai Gly Phe Pro Arg Ile Ala Asp Ala Vai Asn Thr
165 170 175
Leu Cys Gly Ser Glu Tyr Lys Arg Phe Gln Glu Ser Trp Phe Vai Pro
180 185 190
Ser Vai Met Arg Gln Trp Tyr Gly Asp Arg Tyr Arg Vai Trp Phe Pro
195 200 205
Lys Leu Ala Ile Gly Gly Lys Ala Vai Ala Asn Gly Trp Asn Asn Arg
210 215 220
Leu Ser Asp Asp Gly Thr Tyr Ile Tyr Glu Tyr Asn Glu Asp Ala Asp 225 230 235 240
Leu Vai Asp Pro Vai Gly Asp Gly Asp Pro Asn Asp Ile Arg Ile Thr
245
250
255
Phe Ala Lys Ser Ala Asp Pro Vai Thr Arg Ile Gln Ala Tyr Arg Phe 260 265 270
Vai Gly Vai Phe Arg Arg Ile Ser Asn Ser Glu Asp Gly Thr Arg Lys 275 280 285
Arg Tyr Gln Arg Ile Glu Thr Vai Phe Pro Ile His Arg Thr Pro Cys 290 295 300
Leu Pro Ile His Arg
305 <210> 7 <211> 321 <212> PRT <213> Acinetobacter baumannii <400> 7
Met Cys Asn Lys Ala Ser Ser Asp Leu Thr Asp Tyr Vai Ile Arg Gln 15 10 15
Leu Gly Arg Thr Lys Asn Lys Arg Tyr Glu Ala Tyr Vai Vai Ser Arg 20 25 30
Ile Ile His Leu Leu Asn Asp Phe Thr Leu Lys Phe Vai Thr Gln Gln
40 45
Phe Vai Arg Leu Ser Asn Lys Lys Ile Ala Leu Thr Asp Leu Tyr Phe
55 60
Pro Gln Leu Gly Ile His Ile Glu Vai Asp Glu Gly His His Phe Leu
70 75 80
Arg Asn Ser Lys Met Glu Tyr Ser Leu Asn Gln Ile Asp Glu Pro Leu
Tyr Ser Ile Ser Gln Thr Glu Ser Asp Ala Met Arg Glu Glu Asp Ile 100 105 110
Ile Ser Ile Thr Gly His Lys Ile Phe Arg Vai Asn Vai Phe Lys Asn 115 120 125
Gln Glu Gly Gln Pro Gln Asn Leu Glu Asn Ile His Gln Gln Ile Asp 130 135 140
Lys Ile Ile Glu Glu Ile Lys Thr Ala Lys Asn Lys Leu Ile Glu Ala 145 150 155 160
Ser Thr Phe Lys Glu Trp Asn Ile Glu Thr Glu Tyr Asn Pro Gln Thr
165 170 175
Tyr Ile Asp Leu Gly Arg Ile Ser Leu Ala Asp Asn Vai Vai Leu Lys
180 185 190
Thr Thr Lys Asp Vai Cys Asn Cys Phe Gly Tyr Ser Tyr Lys Asn Tyr
195 200 205
Gln Arg Gly Gly Ala Leu His Pro Tyr Lys Lys Asp Thr Leu Ile Trp
210 215 220
Phe Pro Arg Leu Tyr Glu Asn Lys Asp Trp Ile Asn Thr Ile Ser Pro
225 230 235 240
Asp Gly Leu Thr Ile Thr Glu Lys Ser Thr Asp Glu Thr Ile Thr Leu
245 250 255
Lys Lys Leu Glu Glu Trp Lys Asn Gly Pro Gln Lys Arg Ile Vai Phe
260 265 270
Ala Arg Vai Lys Asp Asn Leu Ser Ser Arg Ala Met Tyr Arg Phe Met
275 280 285
Gly Leu Tyr Glu Phe Gln Lys Ala Asp Leu Lys Asp Gly Ala Vai Trp
290
295
300
Lys Arg Vai Lys Cys Glu Vai Gln Thr Tyr Ser Pro Lys Glu Thr Lys 305 310 315 320
Cys <210> 8 <211> 285 <212> PRT <213> Pseudoalteromonas atlantica <400> 8
Met Asp Lys Lys Glu Tyr lle lle Arg Gln Leu Gly Arg Thr Lys Asn
5 10 15
Lys Lys Tyr Glu Ala Tyr Vai Vai Thr Arg lle lle His Leu Leu Asn
25 30
Asp Phe Ser lle Lys Phe lle Thr Gln Gln Tyr Vai Thr Arg Pro Lys
40 45
Gly Arg Ala Leu Thr Asp Leu Tyr Phe Pro Gln Phe Ala Phe His lle
55 60
Glu Vai Asp Glu Gly Gln His Phe Asn Gln Ala Asn lle Glu Ala Asp
70 75 80
Lys lle Arg Glu Ala Asp lle lle Asn Ala Thr Gly His Glu lle Leu
90 95
Arg lle Asp Vai Thr Lys Ser Phe Asp Asp lle Asn Thr Gln lle Asp
100 105 110
Ala Ala Vai Asn Lys lle Lys Ser Met Arg Gln Glu lle Ser Phe lle
115 120 125
Pro Trp Asp Ile Asp Ser Glu Phe Asp Ser Ala Thr Tyr Ile Lys Arg
130 135 140
Gly Tyr Ile Asp Ile Lys Asp Asn Vai Ala Phe Lys Thr Ile Lys Asp 145 150 155 160
Ala Cys Asn Cys Phe Gly His Asn Tyr Thr Gly Tyr Gln Arg Ala Gly
165 170 175
Ala Ala His Pro Asp His Tyr Ile Met Leu Trp Phe Pro Lys Leu Phe
180 185 190
Pro Asn Gly Glu Trp Asp Asn Gln Ile Ser Ser Asp Glu Glu Vai Ile
195 200 205
Thr Glu Arg Asn Glu Asp Asp Lys Lys Ala Lys Gln His Vai Ser Ser
210 215 220
His Vai Asn Asn Lys Glu Lys His Lys His Gln Arg Ile Vai Phe Ala
225 230 235 240
Lys Vai Arg Gly Asn Leu Gly Asp Vai Leu Tyr Arg Phe Arg Gly Gln
245 250 255
Tyr Gln Leu Asp Vai Lys Asp Ser Asn Glu Lys Thr Gly Leu Ile Trp
260 265 270
Arg Arg Ile Lys Thr Arg Vai Lys Thr Tyr Glu Gln Asn
275 280 285 <210> 9 <211> 289 <212> PRT <213> Yersinia kristensenii <400> 9
Met Ile Ser Gln Tyr Glu Tyr Vai Vai Arg Gln Leu Ala Arg Thr Lys 1 5 10 15
Asn Lys Lys His Glu Gln Tyr Vai Vai Thr Gly Ile Vai His Lys Leu
25 30
Asn Arg Asp Asp Ile Lys Phe Vai Thr Gln Gln Tyr Vai Lys Arg Glu
40 45
Ser Gly Arg Ala Leu Thr Asp Leu Tyr Phe Pro Ala Ile Asn Leu His
55 60
Ile Glu Ile Asp Glu Pro Phe His Leu Lys Gln Ala Glu His Asp Asn
70 75 80
Leu Arg Glu Ala Asp Ile Ile Asp Ala Thr Gly His Glu Vai Ile Arg
90 95
Ile Ser Vai Asp Gly Ser Leu Arg Gln Met Asn Glu Arg Ile Asp Asp
100 105 110
Cys Vai Ala Ala Ile Lys Ser Lys Ile Ser Ala Leu Gly Asp Cys Phe
115 120 125
Glu Pro Trp Asp Met Asp Lys Glu Leu Ser Ile Glu Pro His Ile Arg
130 135 140
Arg Gly Tyr Ile Asp Vai Lys Asp Asn Vai Ala Phe Arg Arg Ile Thr 145 150 155 160
Asp Ala Cys Asn Cys Phe Gly His Asn Tyr Lys Phe Leu Gln Lys Ala
165 170 175
Gly Ala Lys His Pro Tyr His Asp Asp Ile Leu Ile Trp Leu Pro Lys
180 185 190
Leu Phe Asp Asn Glu His Trp Ser Asn Gln Ile Ser Asn Asp Glu Asn
195 200 205
Vai Ile Thr Glu Ile Pro Lys Ser Glu Asp Ala Gln Ala Ala His Phe
210 215 220
Asp Lys Trp Met Ala Glu Thr Arg Asn Lys Arg Leu Vai Phe Ala Lys 225 230 235 240
Ala Lys Asp Asn Leu Gly Met Thr Leu Tyr Arg Phe Lys Gly Leu Tyr
245 250 255
Glu Leu Asn Pro Lys Lys Ser Asn Arg Thr Ile Gly Leu Tyr Trp Gln
260 265 270
Arg Ile Ser Thr Arg Vai Lys Thr Tyr Pro Ser Pro Ala Arg Asn Pro
275 280 285
Asp
210> 10 <211> 283 <212> PRT <213> Shevvanella pealeana <400> 10
Met Lys Thr Leu His Met Thr Arg Gln Leu Gln Arg Cys Lys Asn Lys
10 15
Arg Phe Glu Leu Tyr Ala Ile Thr Arg Ile Ile His Lys Vai Asp Asp
25 30
Leu Asp Ile Lys Phe Ile Thr Gln Gln Tyr Vai Ala Arg Pro Asp Gly
40 45
Phe Ala Leu Thr Asp Leu Tyr Leu Pro Gln Leu Lys Leu His Ile Glu
Ile Asp Glu Gly Phe His Lys Gln Gln Vai Asp Ala Asp Lys Vai Arg 65 70 75 80
Glu Leu Asp Ile Ile Thr Ala Thr Asp His Gln Vai Lys Arg Ile Asp
90 95
Ala SerVal Ala Ile Glu Gln Ile Asn Leu Gln Vai Asp Gln Ile Vai
100 105 110
Ala Glu Ile Leu Gln Ser Vai Glu Vai Gln Lys Ala Ala Gly Asn Phe
115 120 125
Gln Ala Trp Asp Pro Glu Thr Glu His Ser Vai Ser Tyr Leu Gln Ser
130 135 140
Arg Gly Vai Ile Arg Ala Ser Glu Asn Vai Ala Leu Arg Thr Ser Ala 145 150 155 160
Glu Vai Cys Asn Leu Leu Gly His Asn Tyr Lys Gly Trp Gln Arg Ser
165 170 175
Ser Ala Ser Vai Pro His Tyr Pro Asn Ile Arg Leu Trp Phe Pro Lys
180 185 190
Leu Tyr Pro Asn Glu Gln Trp Phe Asn His Ile Ser Tyr Asp Gly Cys
195 200 205
Glu Ile His Glu Tyr Cys Ile Glu Ser Glu Thr Lys Lys Arg Gln Phe
210 215 220
Ile Asp Lys Asn Leu Ser Glu Asn Ile Gln Gln Met Vai Phe Ala Arg
225 230 235 240
Vai Lys Asp Glu Leu Gly Gln Thr Met Tyr Arg Phe Lys Gly Leu Phe
245 250 255
Ile Leu Asp Arg Asp Lys Thr Cys His Glu Ser Gly Vai Tyr Trp Lys
260
265
270
Arg Vai Ala Thr Glu Phe Glu Leu Gly Leu Thr 275 280 <210> 11 <211> 296 <212> PRT <213> Aplinkos mėginys, Nevvport Harbor, Rhode Island <400> 11
Met Ser Lys Phe Thr Lys Glu Thr Tyr Vai Thr Arg Asn Phe Gln Lys 1 5 10 15
Ile Ser Gly Lys Arg Trp Glu Leu Tyr Vai Ile Thr Arg Vai Ile His
25 30
Leu Leu Asn Asp Pro Asp Ile Glu Tyr Vai Cys Gln Gln Tyr Ile Asn
40 45
Pro Pro Gln Asn Lys Asp Tyr Tyr Leu Ala Asp Leu Ala Phe Pro Ser
55 60
Leu Lys Leu Tyr Leu Glu Ile Asp Glu Gly Gln His Gly Ser Glu Met
70 75 80
His Gln Thr Ser Asp Leu Lys Arg Asp Ala Glu Ile Leu Glu Ala Thr
90 95
Asp Trp Thr Cys Lys Arg Ile Pro Vai Phe Vai Lys Lys Gly Ser Ser
100 105 110
Lys Ile Asp Lys Ser Leu Glu Ala Leu Asn Lys Glu Ile Asp Asp Phe
115 120 125
Vai Ser Tyr Vai Glu Gln Lys Lys Gln Lys Met Vai Ser Ala Gly His
130
135
140
Lys Ile Ser Trp Asn Tyr Glu Gln Lys Phe Ser Pro Asp Thr Phe Ile 145 150 155 160
Ala Lys Glu Lys Ile Lys Vai Ser Asp Asn Vai Ala Leu Leu Asn His
165 170 175
Arg Asp Vai Leu Arg Leu Phe Gly Tyr Lys Lys Gly His Tyr Gln Arg 180 185 190
Ala Vai Trp Thr Ile Lys Lys Thr Asn Gln Met Vai Trp Phe Pro Lys
195 200 205
Leu Tyr Pro Asn Ser Asp Trp Vai Asn Ser Phe Asp Asp Lys Ser Gly
210 215 220
Tyr Ile His Gln Phe Arg Lys Asp Asn Gln Pro His Pro Met Pro Lys
225 230 235 240
Glu Gly Asp Pro Asp Arg Ile Vai Phe Ala His Gln Lys Asn Ile Phe
245 250 255
Gly Gln Thr Vai Tyr Lys Phe Phe Gly Ile Phe Arg Ala Asp Leu Asn
260 265 270
Lys Thr Asp Pro Vai His His Tyr Phe Lys Arg Ile Asn Thr Cys Leu
275 280 285
Asp Leu Ser Arg Tyr Ser Ala Asn
290 295 <210> 12 <211> 293 <212> PRT <213> Proteus penneri <400> 12
Met Ser Lys Thr Asp Tyr Ile Leu Arg Ser Leu Ser Lys Ile Thr Lys 15 10 15
Lys Arg Trp Glu His Tyr Vai Ile Asn Arg Ile Phe His Lys Leu Asp
25 30
Asp Pro Glu Ile Glu Phe Vai Cys Gln Gln Cys Ile Arg Lys Ala Asn
40 45
Ser Pro Asp Lys Ile Tyr Leu Ala Asp Leu Phe Phe Pro Gln Leu Ala
55 60
Leu Tyr Leu Glu Ile Asp Glu Glu His His Asp Ser Asp Glu Ala Lys 65 70 75 80
Lys Lys Asp Ala Lys Arg Arg Leu Asp Ile Ile Glu Ala Thr Gly Phe
90 95
Ile Glu Lys Arg Ile Pro Ala Ser Asn Vai Thr Ile Glu Gln Leu Asn
100 105 110
Thr Ser Ile Asp Glu Phe Vai Lys Leu Leu Ile Asp Thr Lys Glu Lys
115 120 125
Gln Lys Ala Gln Lys Lys Phe Ile Pro Trp Asp Tyr Ser Ala Gln Tyr
130 135 140
Thr Ala Lys Arg His Ile Asp Ala Gly Phe Ile Glu Vai Gly Pro His
145 150 155 160
Ala Ile Phe Arg Tyr His Arg Asp Ala Leu Glu Cys Phe Gly Tyr Ile
165 170 175
Asn Lys Gly His His Gln Ser Gly Ser Trp Lys Leu Pro Glu Asn Ile
180 185 190
Vai Arg Glu Ile Gly Leu Ser Gly Arg Ile Met Vai Trp Phe Pro Arg
195
200
205
Leu Tyr Asn Ala Gly Vai Trp Asn Asn Glu Leu Ser Pro Asp Gly Glu 210 215 220
Trp Ile Thr Glu Glu Ser Leu Glu Vai Asp Asn Asn Tyr Ile Glu Asp 225 230 235 240
Trp Asp Tyr Arg Ile Vai Met Ala His Ser Arg Asp Glu Leu Asn Arg
245 ! 250 255
Vai Leu Tyr Arg Phe Leu Gly Vai Phe Gln Ile Asp Lys Asn Lys Ser
260 265 270
Vai Glu Gly Lys Asn Ile Phe Lys Arg Ile Asn Thr Lys Vai Lys Vai
275 280 285
Phe Asn Ser Tyr Asn
290 <210> 13 <211> 293 <212> PRT <213> Proteus vulgaris <400> 13
Met Ser Lys Thr Asp Tyr Ile Leu Arg Ala Leu Ser Lys Ile Ser His
5 10 15
Lys Arg Trp Glu His Tyr Ile Ile Asn Arg Vai Vai His Thr Leu Asp
25 30
Asp Pro Asp Ile Glu Phe Vai Cys Gln Gln Cys Ile Arg Lys Glu Gly 35 40 45
His Leu Gly Lys Ile Tyr Leu Ala Asp Leu Leu Phe Pro Gln Leu Asn
Leu Tyr Leu Glu Ile Asp Glu Ala His His Asp Ser Asn Asp Ala Arg 65 70 75 80
Lys Ala Asp Ala Vai Arg Arg Leu Asp Ile Vai Glu Ala Thr Gly Phe
90 95
Gln Glu Glu Arg Ile Pro Ala Ser Asn Ile Thr Leu Ser Glu Vai Asn
100 105 110
Lys Leu Vai Asp Glu Phe Vai Arg Leu Vai Lys Asp Lys Lys Glu Glu
115 120 125
Leu Glu Asn Gln Gly Leu Phe Phe Arg Trp Asp Tyr Asp Glu Arg Tyr
130 135 140
Ser Ala Lys Lys His Ile Asn Thr Gly Tyr Met Ala Vai Gly Pro Asn
145 150 155 160
Ser Vai Phe Arg Tyr His Arg Asp Ala Leu Gln Cys Phe Gly Tyr Arg
165 170 175
Arg Glu Gly His His Gln Ser Gly Gly Trp Ala Leu Pro Ala Glu Vai
180 185 190
Ala Gln Ser Ile Gly Leu Thr Gly Arg Vai Met Vai Trp Phe Pro Arg 195 200 205
Leu Tyr Glu Ala Gly Glu Trp Lys Asn Ala Leu Ser Ala Asp Gly Asn 210 215 220
Lys Ile Thr Glu Gln Ser Leu Asn Ala Thr Arg Asn Tyr Gln Glu Thr 225 230 235 240
Trp Asp Tyr Arg Ile Vai Met Ala His Ser Arg Asp Glu Leu Asn Arg
245
250
255
Thr Leu Tyr Arg Phe Leu Gly Vai Phe Ala Ile Asp Vai Asp Lys Ser
260
265
270
Ser Asp Glu Vai Lys Vai Phe Ser Arg Vai Tyr Ser Arg Vai Asn Vai 275 280 285
Tyr Arg Ser Gln Asn
290 <210> 14 <211> 102 <212> PRT <213> dirbtinė <220>
<223> konservatyvi seka N-galiniame domene <220>
<221> ĮVAIRŪS POŽYMIAI <222> (2)..(8) <223> X = bet kuri aminorūgštis <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (10)..(11) <223> X= bet kuri aminorūgštis <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (13)..(13) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (15)..(32) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (35)..(50) <223> X gali būti pakartota minimaliai 11 kartų ir maksimaliai 16 kartų <220>
<221> ĮVAIRŪS POŽYMIAI <222> (53)..(54) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (56)..(61) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (63)..(63) <223> X— bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (66)..(67) <223> X— bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (69)..(94) <223> X gali būti pakartota minimaliai 6 kartus ir maksimaliai 26 kartus <220>
<221 > {VAIRŪS POŽYMIAI <222> (96)..(97) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (99)..(101) <223> X= bet kuri aminorūgštis <400> 14
Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa Xaa Glu Xaa Tyr Xaa Xaa
10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25 30
Gln Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
40 45
Xaa Xaa Asp Leu Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Glu Xaa Asp
Glu Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asp Xaa
90 95
Xaa Arg Xaa Xaa Xaa lle
100 <210> 15 <211> 79 <212> PRT <213> dirbtinė <220>
<223> konservatyvi seka C-galiniame domene <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (2)..(2) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (4)..(43) <223> X— bet kuri aminorūgštis; X gali būti pakartota minimaliai 30 kartų ir maksimaliai 40 kartų <220>
<221 > {VAIRŪS POŽYMIAI <222> (45)..(57) <223> X= bet kuri aminorūgštis; X gali būti pakartota minimaliai 12 kartų ir maksimaliai 13 kartų <220>
<221> ĮVAIRŪS POŽYMIAI <222> (59)..(59) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (61)..(78) <223> X= bet kuri aminorūgštis; X gali būti pakartota minimaliai 16 kartų ir maksimaliai 18 kartų <400> 15
Trp Xaa Asn Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
5 10 15
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25 30
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Xaa Xaa Xaa Xaa
40 45
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Phe Xaa Gly Xaa Xaa Xaa Xaa
55 60
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg <210> 16 <211> 102 <212> PRT <213> dirbtinė <220>
<223> konservatyvi seka N-galiniame domene <220>
<221> ĮVAIRŪS POŽYMIAI <222> (2)..(8) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (10)..(11) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (13)..(13) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (15)..(32) <223> X= bet kuri aminorūgštis <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (35)..(50) <223> X= bet kuri aminorūgštis, X gali būti pakartota minimaliai 11 kartų ir maksimaliai 16tų <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (53)..(54) <223> X— bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (56)..(61) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (63)..(63) <223> X= bet kuri aminorūgštis <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (66)..(67) <223> X= bet kuri aminorūgštis <220>
<221> ĮVAIRŪS POŽYMIAI <222> (69)..(94) <223> X= bet kuri aminorūgštis <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (96)..(97) <223> X= bet kuri aminorūgštis <220>
<221 > ĮVAIRŪS POŽYMIAI <222> (99)..(101) <223> X= bet kuri aminorūgštis <400> 16
Arg Xaa Xaa Xaa Xaa Xaa Xaa Xaa Lys Xaa Xaa Glu Xaa Tyr Xaa Xaa
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
25 30
Gln Gln Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
40 45
Xaa Xaa Asp Leu Xaa Xaa Pro Xaa Xaa Xaa Xaa Xaa Xaa Glu Xaa Asp
55 60
Glu Xaa Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa
70 75 80
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Asp Xaa
90 95
Xaa Arg Xaa Xaa Xaa lle
Claims (25)
1. Preparatas besiskiriantis tuo, kad apima vieną arba daugiau išgrynintų rekombinantiniu baltymų, kuriame baltymai yra ZZYZ baltymų šeimos nariai, kai kiekvienas ZZYZ baltymų šeimos narys turi N-galinj domeną, kur N-galinis domenas turi mažiausiai 95 % homologiją su SEQ ID Nr. 14; ir reakcijos buferį.
Išradimo apibrėžtis
2. Preparatas pagal 1 punktą, besiskiriantis tuo, kad vienas arba daugiau išgrynintų baltymų pirmenybiškai rišasi prie hidroksimetilinto citozino (hmC) ir/arba prie glikozilinto hidroksimetilinto citozino (ghmC), palyginus su rišimusi prie DNR metilinto citozino (mC).
3. Preparatas pagal bet kurį iš nuo 1 iki 2 punktą, besiskiriantis tuo, kad vienas arba daugiau išgrynintų baltymų pirmenybiškai skelia DNR hmC arba ghmC nustatytu atstumu nuo 3‘.
4. Preparatas pagal bet kurį iš nuo 1 iki 3 punktų, besiskiriantis tuo, kad nustatytas atstumas yra 11-13 nukleotidų grandinėje, turinčioje hmC arba ghmC, arba 9-10 nukleotidų komplementarioje grandinėje.
5. Preparatas pagal bet kurį iš nuo 1 iki 4 punktų, besiskiriantis tuo, kad vienas arba daugiau išgrynintų baltymų skelia DNR, turinčią ghmC, hmC ir/arba mC santykiu mažiausiai 8:1 pagal ghmC arba hmC su mC.
6. Preparatas pagal bet kurį iš nuo 1 iki 5 punktų besiskiriantis tuo, kad buferis apima druską, besiskiriančią anijonu, parinktu iš grupės, susidedančios iš sulfato, fosfato, acetato ir citrato.
7. Preparatas pagal bet kurį nuo 1 punkto iki 6 punktų, besiskiriantis tuo, kad buferis neturi chlorido, nitrato, karbonato arba imidazolo druskų.
8. Preparatas pagal 6 punktą, besiskiriantis tuo, kad druskos koncentracija yra 50-500 mM.
9. Preparatas pagal bet kurį iš nuo 1 iki 8 punktą, besiskiriantis tuo, kad bent vienas narys apima SEQ ID Nr. 14.
10. Preparatas pagal bet kurį iš nuo 1 iki 9 punktą, besiskiriantis tuo, kad bent vienas išgrynintas baltymas turi aminorūgščių seką su mažiausiai 95 % sekos homologija su SEQ ID Nr. 7.
11. Preparatas pagal bet kurį iš nuo 1 iki 10 punktą, besiskiriantis tuo, kad bent vienas išgrynintas baltymas turi aminorūgščių seką, apimančią mažiausiai 95 % sekos homologiją su fermentu, parinktu iš PvuRtsll, PpeHI, EsaSS310P, EsaRBORFBP, PatTI, Ykrl, EsaNI, SpeAI, BbiDI, PfrCORF1l80P, PcoORF314P, BmeD1, AbaSDFI, AbaCI, AbaAI, AbaSI, AbaUMB3ORFAP ir Asp6ORFAP.
12. Preparatas pagal bet kurį iš nuo 1 iki 11 punktą, besiskiriantis tuo, kad bent vienas iš išgrynintų baltymų yra parinktas iš grupės, susidedančios iš: PvuRtsll, PpeHI, EsaSS310P, EsaRBORFBP, PatTI, Ykrl, EsaNI, SpeAI, BbiDI, PfrCORF1l80P, PcoORF314P, BmeD1, AbaSDFI, AbaCI, AbaAI, AbaSI, AbaUMB3ORFAP ir Asp6ORFAP ir jų katalitiškai aktyvių mutantų ir jų darinių.
13. hmC aptikimo būdas genominės DNR mėginyje, apimantis:
a) preparato pagal bet kurį iš nuo 1 iki 12 punktų pridėjimą j genominės DNR mėginį;
b) sudarymą galimybės baltymui skelti genominę DNR skėlimo vietoje;
c) skėlimo vietos DNR sekos bent vienos pusės nustatymą;
d) pasirinktinai, DNR sekos kartografavimą ant referencinės genominės DNR sekos; ir
e) hmC aptikimą.
14. Būdas pagal 13 punktą, besiskiriantis tuo, kad preparatas a) pakopoje dar apima: vieną arba daugiau DNR polimerazių, pradmenų ir adapterių.
15. Būdas pagal bet kurį iš nuo 13 iki 14 punktų, besiskiriantis tuo, kad dar apima: prieš nustatant DNR seką c) pakopoje, suskaldytos genominės DNR amplifikaciją b) pakopoje.
16. Būdas pagal bet kurį iš nuo 13 iki 15 punktų, besiskiriantis tuo, kad prieš a) pakopą genominė DNR reaguoja su β-gliukoziltransferaze (BGT).
17. Būdas pagal bet kurį iš nuo 13 iki 16 punktų imtinai, dar apimantis: a)-c) pakopų vykdymą viename reakcijos inde arba mikrofliuidiniame įtaise.
18. Rekombinantinio ZZYZ šeimos baltymo gryninimo būdas, apimantis:
klonavimą ir ekspresavimą sulietų baltymų, apimančių ZZYZ baltymus, inteiną ir afininio surišimo baltymą;
sukėlimą sulieto baltymo rišimosi prie matricos afininio surišimo baltymo priemonėmis;
ZZYZ baltymo atskėlimą nuo inteino; ir išgryninto baltymo regeneravimą eliuate.
19. Būdas pagal 18 punktą, besiskiriantis tuo, kad afininio surišimo baltymas yra chitiną surišantis domenas.
20. Fragmentų rinkinys, besiskiriantis tuo, kad apima mažiausiai vieną iš a) oligonukleotido fragmentą, turintį 20-23 nukleotidų dydį su patalpintu centre hmC arba ghmC; arba b) didelę DNR arba oligonukleotidų fragmentus, turinčius hmC arba ghmC, patalpintus DNR duplekso vienguboje grandinėje prie 1113 nukleotidų padėtimi nuo grandinės 3‘ galo.
21. Rinkinys, besiskiriantis tuo, kad apima: vieną arba daugiau išgrynintų rekombinantinių ZZYZ baltymų šeimos baltymų, jų funkcinių darinių arba jų katalitinių fragmentų veiksmingame buferyje fermento aktyvumui; ir naudojimo instrukciją.
22. Rinkinys pagal 21 punktą, besiskiriantis tuo, kad dar apima BGT ir UDP-gliukozę.
23. Rinkinys pagal 21 arba 22 punktą, besiskiriantis tuo, kad dar apima pradmenis.
24. Reakcijos indas, apimantis: preparatą pagal bet kurį iš 1-12 punktų, pradmenis ir/arba adapterius ir termostabilią polimerazę.
25. Preparatas, besiskiriantis tuo, kad apima: ZZYZ baltymų šeimos nario baltymo funkcinius darinius arba katalitinius fragmentus; ir reakcijos buferį.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US29663010P | 2010-01-20 | 2010-01-20 | |
| US37693210P | 2010-08-25 | 2010-08-25 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| LT2012062A LT2012062A (lt) | 2014-01-27 |
| LT6019B true LT6019B (lt) | 2014-04-25 |
Family
ID=43797755
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| LT2012062A LT6019B (lt) | 2010-01-20 | 2012-07-16 | Kompozicijos, būdai ir susiję panaudojimai, skirti modifikuotos dnr skaldymui |
Country Status (5)
| Country | Link |
|---|---|
| US (1) | US8969061B2 (lt) |
| DE (1) | DE112011100297B4 (lt) |
| GB (1) | GB2489187B (lt) |
| LT (1) | LT6019B (lt) |
| WO (1) | WO2011091146A1 (lt) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US9115386B2 (en) | 2008-09-26 | 2015-08-25 | Children's Medical Center Corporation | Selective oxidation of 5-methylcytosine by TET-family proteins |
| WO2011025819A1 (en) | 2009-08-25 | 2011-03-03 | New England Biolabs, Inc. | Detection and quantification of hydroxymethylated nucleotides in a polynucleotide preparation |
| US20140178873A1 (en) | 2011-03-04 | 2014-06-26 | Andreas Brachmann | Novel methods for detecting hydroxymethylcytosine |
| EP3904533B1 (en) | 2011-12-13 | 2025-02-26 | Oslo Universitetssykehus HF | Method for detection of hydroxymethylation status |
| US10081827B2 (en) | 2012-03-15 | 2018-09-25 | New England Biolabs, Inc. | Mapping cytosine modifications |
| US9200260B2 (en) * | 2012-03-15 | 2015-12-01 | New England Biolabs, Inc. | Compositions and methods for the transfer of a hexosamine to a modified nucleotide in a nucleic acid |
| GB2523919B (en) * | 2012-11-06 | 2017-07-05 | New England Biolabs Inc | Mapping cytosine modifications |
| WO2014083118A1 (en) | 2012-11-30 | 2014-06-05 | Cambridge Epigenetix Limited | Oxidising agent for modified nucleotides |
| WO2014210444A1 (en) * | 2013-06-28 | 2014-12-31 | New England Biolabs, Inc. | Compositions and methods for identifying hydroxymethylcytosine in a dna |
| WO2015021282A1 (en) * | 2013-08-09 | 2015-02-12 | New England Biolabs, Inc. | Detecting, sequencing and/or mapping 5-hydroxymethylcytosine and 5-formylcytosine at single-base resolution |
| EP3355939A4 (en) | 2015-09-30 | 2019-04-17 | Trustees of Boston University | MICROBIAL DEADMAN AND PASS CODE EMERGENCY STOP SWITCHES |
| AU2017246318B2 (en) * | 2016-04-07 | 2023-07-27 | The Board Of Trustees Of The Leland Stanford Junior University | Noninvasive diagnostics by sequencing 5-hydroxymethylated cell-free DNA |
| US20170298422A1 (en) | 2016-04-18 | 2017-10-19 | The Board Of Trustees Of The Leland Stanford Junior University | Simultaneous single-molecule epigenetic imaging of dna methylation and hydroxymethylation |
| JP2023535636A (ja) | 2020-07-30 | 2023-08-18 | ケンブリッジ エピジェネティックス リミテッド | 核酸解析のための組成物および方法 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
| WO2011025819A1 (en) | 2009-08-25 | 2011-03-03 | New England Biolabs, Inc. | Detection and quantification of hydroxymethylated nucleotides in a polynucleotide preparation |
Family Cites Families (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US1046632A (en) | 1911-11-27 | 1912-12-10 | Martin Nesheim | Spacing-tool. |
| GB8313232D0 (en) | 1983-05-13 | 1983-06-22 | Causton B E | Prevention of undesired adsorption on surfaces |
| US5643758A (en) | 1987-03-10 | 1997-07-01 | New England Biolabs, Inc. | Production and purification of a protein fused to a binding protein |
| EP1493825A3 (en) | 1990-06-11 | 2005-02-09 | Gilead Sciences, Inc. | Method for producing nucleic acid ligands |
| US5693502A (en) | 1990-06-11 | 1997-12-02 | Nexstar Pharmaceuticals, Inc. | Nucleic acid ligand inhibitors to DNA polymerases |
| US5874557A (en) | 1990-06-11 | 1999-02-23 | Nexstar Pharmaceuticals, Inc. | Nucleic acid ligand inhibitors to DNA polymerases |
| JPH05244946A (ja) | 1992-03-03 | 1993-09-24 | Akira Kaji | 新規制限酵素 |
| WO2000070100A1 (en) | 1999-05-14 | 2000-11-23 | New England Biolabs, Inc. | Surface display of selenocysteine-containing peptides |
| ATE331220T1 (de) | 2001-04-10 | 2006-07-15 | Ecole Polytech | Verfahren zur verwendung von o6-alkylguanin-dna alkyltransferasen |
| JP2009533058A (ja) | 2006-04-14 | 2009-09-17 | ニユー・イングランド・バイオレイブス・インコーポレイテツド | 変異体マルトース結合タンパク質に融合された標的タンパク質の可溶化及び精製 |
| ATE490648T1 (de) | 2006-07-27 | 2010-12-15 | Ericsson Telefon Ab L M | Technik zur medien-rahmen-decodierung |
| JP2013514758A (ja) | 2008-12-23 | 2013-05-02 | ニユー・イングランド・バイオレイブス・インコーポレイテツド | 修飾dnaを切断するための組成物、方法および関連する使用 |
| WO2010114532A1 (en) | 2009-04-01 | 2010-10-07 | New England Biolabs, Inc. | Solubilization and purification of a target protein fused to a mutant maltose-binding protein |
-
2011
- 2011-01-20 GB GB1213167.8A patent/GB2489187B/en active Active
- 2011-01-20 DE DE112011100297.1T patent/DE112011100297B4/de active Active
- 2011-01-20 US US13/522,224 patent/US8969061B2/en active Active
- 2011-01-20 WO PCT/US2011/021879 patent/WO2011091146A1/en not_active Ceased
-
2012
- 2012-07-16 LT LT2012062A patent/LT6019B/lt not_active IP Right Cessation
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010037001A2 (en) | 2008-09-26 | 2010-04-01 | Immune Disease Institute, Inc. | Selective oxidation of 5-methylcytosine by tet-family proteins |
| WO2011025819A1 (en) | 2009-08-25 | 2011-03-03 | New England Biolabs, Inc. | Detection and quantification of hydroxymethylated nucleotides in a polynucleotide preparation |
Non-Patent Citations (2)
| Title |
|---|
| COKUS SH. ET AL.: "Shotgun bisulphite sequencing of the Arabidopsis genome reveals DNA methylation patterning", NATURE, 2008, pages 215 - 219, XP055190075, DOI: doi:10.1038/nature06745 |
| SKIRMANTAS KRIAUCIONIS AND NATHANIEL HEINTZ: "The nuclear DNA base, 5-hydroxymethylcytosine is present in brain and enriched in Purkinje neurons", SCIENCE, 2009, pages 930 - 959 |
Also Published As
| Publication number | Publication date |
|---|---|
| US8969061B2 (en) | 2015-03-03 |
| LT2012062A (lt) | 2014-01-27 |
| DE112011100297B4 (de) | 2017-08-24 |
| GB201213167D0 (en) | 2012-09-05 |
| GB2489187A (en) | 2012-09-19 |
| GB2489187B (en) | 2015-02-11 |
| DE112011100297T5 (de) | 2013-01-31 |
| US20120301881A1 (en) | 2012-11-29 |
| WO2011091146A1 (en) | 2011-07-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| LT6019B (lt) | Kompozicijos, būdai ir susiję panaudojimai, skirti modifikuotos dnr skaldymui | |
| CN114599666B (zh) | 一种Pif1-like解旋酶及其应用 | |
| CN113930406B (zh) | 一种Pif1-like解旋酶及其应用 | |
| EP2875154B1 (en) | SSB method for characterising a nucleic acid | |
| Ramamurthy et al. | Topology of the integral membrane form of Escherichia coli SecA protein reveals multiple periplasmically exposed regions and modulation by ATP binding | |
| EP2798084A2 (en) | Enzyme method | |
| Leoni et al. | Genome walking in eukaryotes | |
| Tirumalai et al. | Recognition of core-type DNA sites by λ integrase | |
| CN113584134A (zh) | 一种基于CRISPR-Cas9的等温核酸检测系统及其方法和应用 | |
| CN104342412B (zh) | 用于生产(s)-4-氯-3-羟基丁酸乙酯的酮还原酶突变体 | |
| Deveryshetty et al. | Novel RNA and DNA strand exchange activity of the PALB2 DNA binding domain and its critical role for DNA repair in cells | |
| Nikolakaki et al. | RNA association or phosphorylation of the RS domain prevents aggregation of RS domain-containing proteins | |
| Murphy et al. | Multiple forms of formamidopyrimidine-DNA glycosylase produced by alternative splicing in Arabidopsis thaliana | |
| Perera et al. | Amidst multiple binding orientations on fork DNA, Saccharolobus MCM helicase proceeds N-first for unwinding | |
| US20030059812A1 (en) | HDAC9 polypeptides and polynucleotides and uses thereof | |
| KR20090086870A (ko) | 염색체 특정 부위 제거용 재조합 벡터 및 이를 이용한미생물 내 염색체 특정 부위의 제거방법 | |
| CN113528450B (zh) | 一种水稻原生质体高效生物素标记体系的建立及应用 | |
| ES2221172T3 (es) | Procedimiento para detectar la presencia de materias biologicas de origen bovino, y oligonucleotidos para su realizacion. | |
| Priestman et al. | Light-mediated remote control of signaling pathways | |
| CA2474130C (en) | Enzyme activation protease assay | |
| EP4434533B1 (en) | Artificial complex for tethering chromatids of chromosomes | |
| WO2024112948A1 (en) | Chromatin profiling compositions and methods | |
| CN113755518B (zh) | 一种构建重组解脂耶氏酵母的方法与应用 | |
| de Francisco et al. | Isolation and characterization of microsatellites in three overexploited penaeid shrimp species along the Brazilian coastline | |
| Bucci et al. | Expression analysis and chromosomal assignment of PRA1 and RILP genes |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| BB1A | Patent application published |
Effective date: 20140127 |
|
| FG9A | Patent granted |
Effective date: 20140425 |
|
| MM9A | Lapsed patents |
Effective date: 20220120 |