CN110408636B - 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 - Google Patents
多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 Download PDFInfo
- Publication number
- CN110408636B CN110408636B CN201810404013.3A CN201810404013A CN110408636B CN 110408636 B CN110408636 B CN 110408636B CN 201810404013 A CN201810404013 A CN 201810404013A CN 110408636 B CN110408636 B CN 110408636B
- Authority
- CN
- China
- Prior art keywords
- sequence
- protein
- polynucleotide
- vitro
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108090000623 proteins and genes Proteins 0.000 title claims abstract description 173
- 102000004169 proteins and genes Human genes 0.000 title claims abstract description 157
- 230000014509 gene expression Effects 0.000 title abstract description 46
- 238000000746 purification Methods 0.000 title abstract description 42
- 108091028043 Nucleic acid sequence Proteins 0.000 title abstract description 15
- 108091026890 Coding region Proteins 0.000 claims abstract description 60
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 47
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 43
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 43
- 108010076504 Protein Sorting Signals Proteins 0.000 claims abstract description 29
- 230000015572 biosynthetic process Effects 0.000 claims abstract description 26
- 239000002773 nucleotide Substances 0.000 claims abstract description 18
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 18
- 230000014616 translation Effects 0.000 claims description 88
- 238000000338 in vitro Methods 0.000 claims description 82
- 102000040430 polynucleotide Human genes 0.000 claims description 65
- 108091033319 polynucleotide Proteins 0.000 claims description 65
- 239000002157 polynucleotide Substances 0.000 claims description 65
- 238000001243 protein synthesis Methods 0.000 claims description 64
- 239000013598 vector Substances 0.000 claims description 29
- 238000000034 method Methods 0.000 claims description 25
- 108010048367 enhanced green fluorescent protein Proteins 0.000 claims description 24
- 229920001184 polypeptide Polymers 0.000 claims description 13
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 13
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 13
- 230000000295 complement effect Effects 0.000 claims description 12
- 108010090804 Streptavidin Proteins 0.000 claims description 11
- 230000001851 biosynthetic effect Effects 0.000 claims description 5
- 230000002194 synthesizing effect Effects 0.000 claims description 5
- 239000003153 chemical reaction reagent Substances 0.000 claims description 3
- 150000001875 compounds Chemical class 0.000 claims description 3
- 125000003275 alpha amino acid group Chemical group 0.000 claims 1
- 238000001308 synthesis method Methods 0.000 claims 1
- 108090000848 Ubiquitin Proteins 0.000 abstract description 9
- 102000044159 Ubiquitin Human genes 0.000 abstract description 9
- 238000003786 synthesis reaction Methods 0.000 abstract description 8
- 235000018102 proteins Nutrition 0.000 description 103
- 210000004027 cell Anatomy 0.000 description 56
- 108020004414 DNA Proteins 0.000 description 31
- 102000053602 DNA Human genes 0.000 description 31
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 30
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 30
- 150000001413 amino acids Chemical group 0.000 description 24
- 238000013519 translation Methods 0.000 description 21
- 210000005253 yeast cell Anatomy 0.000 description 19
- 241001138401 Kluyveromyces lactis Species 0.000 description 18
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 16
- 210000003527 eukaryotic cell Anatomy 0.000 description 15
- 230000000694 effects Effects 0.000 description 14
- 108060001084 Luciferase Proteins 0.000 description 13
- 239000005089 Luciferase Substances 0.000 description 13
- 235000001014 amino acid Nutrition 0.000 description 13
- 229940024606 amino acid Drugs 0.000 description 13
- 239000013612 plasmid Substances 0.000 description 13
- 238000010276 construction Methods 0.000 description 11
- 241000235649 Kluyveromyces Species 0.000 description 10
- 239000000284 extract Substances 0.000 description 10
- NOESYZHRGYRDHS-UHFFFAOYSA-N insulin Chemical compound N1C(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(NC(=O)CN)C(C)CC)CSSCC(C(NC(CO)C(=O)NC(CC(C)C)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CCC(N)=O)C(=O)NC(CC(C)C)C(=O)NC(CCC(O)=O)C(=O)NC(CC(N)=O)C(=O)NC(CC=2C=CC(O)=CC=2)C(=O)NC(CSSCC(NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2C=CC(O)=CC=2)NC(=O)C(CC(C)C)NC(=O)C(C)NC(=O)C(CCC(O)=O)NC(=O)C(C(C)C)NC(=O)C(CC(C)C)NC(=O)C(CC=2NC=NC=2)NC(=O)C(CO)NC(=O)CNC2=O)C(=O)NCC(=O)NC(CCC(O)=O)C(=O)NC(CCCNC(N)=N)C(=O)NCC(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC=CC=3)C(=O)NC(CC=3C=CC(O)=CC=3)C(=O)NC(C(C)O)C(=O)N3C(CCC3)C(=O)NC(CCCCN)C(=O)NC(C)C(O)=O)C(=O)NC(CC(N)=O)C(O)=O)=O)NC(=O)C(C(C)CC)NC(=O)C(CO)NC(=O)C(C(C)O)NC(=O)C1CSSCC2NC(=O)C(CC(C)C)NC(=O)C(NC(=O)C(CCC(N)=O)NC(=O)C(CC(N)=O)NC(=O)C(NC(=O)C(N)CC=1C=CC=CC=1)C(C)C)CC1=CN=CN1 NOESYZHRGYRDHS-UHFFFAOYSA-N 0.000 description 10
- 239000001226 triphosphate Substances 0.000 description 9
- 235000011178 triphosphate Nutrition 0.000 description 9
- 102000016938 Catalase Human genes 0.000 description 8
- 108010053835 Catalase Proteins 0.000 description 8
- 101000585157 Homo sapiens CST complex subunit STN1 Proteins 0.000 description 8
- DRBBFCLWYRJSJZ-UHFFFAOYSA-N N-phosphocreatine Chemical compound OC(=O)CN(C)C(=N)NP(O)(O)=O DRBBFCLWYRJSJZ-UHFFFAOYSA-N 0.000 description 8
- 102100021683 Stonin-1 Human genes 0.000 description 8
- 229960002685 biotin Drugs 0.000 description 8
- 235000020958 biotin Nutrition 0.000 description 8
- 239000011616 biotin Substances 0.000 description 8
- 238000005119 centrifugation Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 description 8
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 description 8
- 239000002777 nucleoside Substances 0.000 description 8
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 8
- 102000052866 Amino Acyl-tRNA Synthetases Human genes 0.000 description 7
- 108700028939 Amino Acyl-tRNA Synthetases Proteins 0.000 description 7
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 7
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 7
- 108090000331 Firefly luciferases Proteins 0.000 description 7
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 7
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 7
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 7
- 101000820457 Homo sapiens Stonin-2 Proteins 0.000 description 7
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 7
- 102100021684 Stonin-2 Human genes 0.000 description 7
- 238000002474 experimental method Methods 0.000 description 7
- 239000005090 green fluorescent protein Substances 0.000 description 7
- 239000003550 marker Substances 0.000 description 7
- 229920001223 polyethylene glycol Polymers 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 7
- 238000005406 washing Methods 0.000 description 7
- 102000007469 Actins Human genes 0.000 description 6
- 108010085238 Actins Proteins 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 6
- 241000238631 Hexapoda Species 0.000 description 6
- -1 MBP Proteins 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 150000003833 nucleoside derivatives Chemical class 0.000 description 6
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 6
- LOGFVTREOLYCPF-KXNHARMFSA-N (2s,3r)-2-[[(2r)-1-[(2s)-2,6-diaminohexanoyl]pyrrolidine-2-carbonyl]amino]-3-hydroxybutanoic acid Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H]1CCCN1C(=O)[C@@H](N)CCCCN LOGFVTREOLYCPF-KXNHARMFSA-N 0.000 description 5
- UBAVPHLFRVPRCI-CRBCFSCISA-N 2-[[(e)-2-carboxyethenyl]amino]-n-methoxy-2-oxoethanimine oxide Chemical compound CO\[N+]([O-])=C\C(=O)N\C=C\C(O)=O UBAVPHLFRVPRCI-CRBCFSCISA-N 0.000 description 5
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 5
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 5
- 101710121765 Endo-1,4-beta-xylanase Proteins 0.000 description 5
- 108091029865 Exogenous DNA Proteins 0.000 description 5
- 108010073141 Hepatitis C virus glycoprotein E2 Proteins 0.000 description 5
- 102000008394 Immunoglobulin Fragments Human genes 0.000 description 5
- 108010021625 Immunoglobulin Fragments Proteins 0.000 description 5
- 102000004877 Insulin Human genes 0.000 description 5
- 108090001061 Insulin Proteins 0.000 description 5
- 102100040018 Interferon alpha-2 Human genes 0.000 description 5
- 108010078049 Interferon alpha-2 Proteins 0.000 description 5
- 102000003777 Interleukin-1 beta Human genes 0.000 description 5
- 108090000193 Interleukin-1 beta Proteins 0.000 description 5
- 102000016943 Muramidase Human genes 0.000 description 5
- 108010014251 Muramidase Proteins 0.000 description 5
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 5
- 239000002202 Polyethylene glycol Substances 0.000 description 5
- 102000007562 Serum Albumin Human genes 0.000 description 5
- 108010071390 Serum Albumin Proteins 0.000 description 5
- 229930006000 Sucrose Natural products 0.000 description 5
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 5
- 102000003425 Tyrosinase Human genes 0.000 description 5
- 108060008724 Tyrosinase Proteins 0.000 description 5
- 102000004139 alpha-Amylases Human genes 0.000 description 5
- 108090000637 alpha-Amylases Proteins 0.000 description 5
- 229940024171 alpha-amylase Drugs 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 230000008901 benefit Effects 0.000 description 5
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 229940125396 insulin Drugs 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 239000004325 lysozyme Substances 0.000 description 5
- 229960000274 lysozyme Drugs 0.000 description 5
- 235000010335 lysozyme Nutrition 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- 239000004417 polycarbonate Substances 0.000 description 5
- 239000002243 precursor Substances 0.000 description 5
- 230000001105 regulatory effect Effects 0.000 description 5
- 239000005720 sucrose Substances 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 241000283973 Oryctolagus cuniculus Species 0.000 description 4
- 108010071690 Prealbumin Proteins 0.000 description 4
- 102000009190 Transthyretin Human genes 0.000 description 4
- 241000209140 Triticum Species 0.000 description 4
- 235000021307 Triticum Nutrition 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 229950007002 phosphocreatine Drugs 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 210000001995 reticulocyte Anatomy 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 241000206602 Eukaryota Species 0.000 description 3
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 108010020764 Transposases Proteins 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- VHJLVAABSRFDPM-QWWZWVQMSA-N dithiothreitol Chemical compound SC[C@@H](O)[C@H](O)CS VHJLVAABSRFDPM-QWWZWVQMSA-N 0.000 description 3
- 229940079593 drug Drugs 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 238000010353 genetic engineering Methods 0.000 description 3
- UEGPKNKPLBYCNK-UHFFFAOYSA-L magnesium acetate Chemical compound [Mg+2].CC([O-])=O.CC([O-])=O UEGPKNKPLBYCNK-UHFFFAOYSA-L 0.000 description 3
- 239000011654 magnesium acetate Substances 0.000 description 3
- 229940069446 magnesium acetate Drugs 0.000 description 3
- 235000011285 magnesium acetate Nutrition 0.000 description 3
- 235000011056 potassium acetate Nutrition 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 241000589158 Agrobacterium Species 0.000 description 2
- PHQXWZGXKAFWAZ-ZLIFDBKOSA-N Ala-Trp-Lys Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O)=CNC2=C1 PHQXWZGXKAFWAZ-ZLIFDBKOSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 238000011537 Coomassie blue staining Methods 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 235000014663 Kluyveromyces fragilis Nutrition 0.000 description 2
- 241000235058 Komagataella pastoris Species 0.000 description 2
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 102000043856 Leucine-tRNA ligase Human genes 0.000 description 2
- 108010071170 Leucine-tRNA ligase Proteins 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- 102000001253 Protein Kinase Human genes 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000283984 Rodentia Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- NADLKBTYNKUJEP-KATARQTJSA-N Ser-Thr-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O NADLKBTYNKUJEP-KATARQTJSA-N 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 101710137500 T7 RNA polymerase Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000009471 action Effects 0.000 description 2
- 229940041514 candida albicans extract Drugs 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- NKLPQNGYXWVELD-UHFFFAOYSA-M coomassie brilliant blue Chemical compound [Na+].C1=CC(OCC)=CC=C1NC1=CC=C(C(=C2C=CC(C=C2)=[N+](CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=CC(=CC=2)N(CC)CC=2C=C(C=CC=2)S([O-])(=O)=O)C=C1 NKLPQNGYXWVELD-UHFFFAOYSA-M 0.000 description 2
- 239000000287 crude extract Substances 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- DBLXOVFQHHSKRC-UHFFFAOYSA-N ethanesulfonic acid;2-piperazin-1-ylethanol Chemical compound CCS(O)(=O)=O.OCCN1CCNCC1 DBLXOVFQHHSKRC-UHFFFAOYSA-N 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229940031154 kluyveromyces marxianus Drugs 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 108091027963 non-coding RNA Proteins 0.000 description 2
- 102000042567 non-coding RNA Human genes 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 230000001717 pathogenic effect Effects 0.000 description 2
- 239000012994 photoredox catalyst Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 108060006633 protein kinase Proteins 0.000 description 2
- 238000001742 protein purification Methods 0.000 description 2
- 239000011541 reaction mixture Substances 0.000 description 2
- 210000003370 receptor cell Anatomy 0.000 description 2
- 210000003705 ribosome Anatomy 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000006228 supernatant Substances 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 231100000331 toxic Toxicity 0.000 description 2
- 230000002588 toxic effect Effects 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000014621 translational initiation Effects 0.000 description 2
- 230000032258 transport Effects 0.000 description 2
- 239000012138 yeast extract Substances 0.000 description 2
- MTCFGRXMJLQNBG-REOHCLBHSA-N (2S)-2-Amino-3-hydroxypropansäure Chemical compound OC[C@H](N)C(O)=O MTCFGRXMJLQNBG-REOHCLBHSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical group C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 1
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 1
- FUSPCLTUKXQREV-ACZMJKKPSA-N Ala-Glu-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O FUSPCLTUKXQREV-ACZMJKKPSA-N 0.000 description 1
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 1
- YNOCMHZSWJMGBB-GCJQMDKQSA-N Ala-Thr-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O YNOCMHZSWJMGBB-GCJQMDKQSA-N 0.000 description 1
- VHAQSYHSDKERBS-XPUUQOCRSA-N Ala-Val-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O VHAQSYHSDKERBS-XPUUQOCRSA-N 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- DCGLNNVKIZXQOJ-FXQIFTODSA-N Arg-Asn-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N DCGLNNVKIZXQOJ-FXQIFTODSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- FRMQITGHXMUNDF-GMOBBJLQSA-N Arg-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N FRMQITGHXMUNDF-GMOBBJLQSA-N 0.000 description 1
- DNUKXVMPARLPFN-XUXIUFHCSA-N Arg-Leu-Ile Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DNUKXVMPARLPFN-XUXIUFHCSA-N 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- LEFKSBYHUGUWLP-ACZMJKKPSA-N Asn-Ala-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O LEFKSBYHUGUWLP-ACZMJKKPSA-N 0.000 description 1
- BVLIJXXSXBUGEC-SRVKXCTJSA-N Asn-Asn-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BVLIJXXSXBUGEC-SRVKXCTJSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- LJRPYAZQQWHEEV-FXQIFTODSA-N Asp-Gln-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O LJRPYAZQQWHEEV-FXQIFTODSA-N 0.000 description 1
- DTNUIAJCPRMNBT-WHFBIAKZSA-N Asp-Gly-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)NCC(=O)N[C@@H](C)C(O)=O DTNUIAJCPRMNBT-WHFBIAKZSA-N 0.000 description 1
- YNCHFVRXEQFPBY-BQBZGAKWSA-N Asp-Gly-Arg Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N YNCHFVRXEQFPBY-BQBZGAKWSA-N 0.000 description 1
- NJLLRXWFPQQPHV-SRVKXCTJSA-N Asp-Tyr-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O NJLLRXWFPQQPHV-SRVKXCTJSA-N 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- YHZQPWIAFHYDJG-UHFFFAOYSA-M C(C)S(=O)(=O)[O-].OCCN1CCNCC1.[K+] Chemical compound C(C)S(=O)(=O)[O-].OCCN1CCNCC1.[K+] YHZQPWIAFHYDJG-UHFFFAOYSA-M 0.000 description 1
- 108010078791 Carrier Proteins Proteins 0.000 description 1
- 108091028732 Concatemer Proteins 0.000 description 1
- 150000008574 D-amino acids Chemical class 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 101900264058 Escherichia coli Beta-galactosidase Proteins 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- QKCZZAZNMMVICF-DCAQKATOSA-N Gln-Leu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O QKCZZAZNMMVICF-DCAQKATOSA-N 0.000 description 1
- SZXSSXUNOALWCH-ACZMJKKPSA-N Glu-Ala-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O SZXSSXUNOALWCH-ACZMJKKPSA-N 0.000 description 1
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 1
- XUORRGAFUQIMLC-STQMWFEESA-N Gly-Arg-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)CN)O XUORRGAFUQIMLC-STQMWFEESA-N 0.000 description 1
- JLJLBWDKDRYOPA-RYUDHWBXSA-N Gly-Gln-Tyr Chemical compound NCC(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 JLJLBWDKDRYOPA-RYUDHWBXSA-N 0.000 description 1
- VAXIVIPMCTYSHI-YUMQZZPRSA-N Gly-His-Asp Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)CN VAXIVIPMCTYSHI-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- UMBDRSMLCUYIRI-DVJZZOLTSA-N Gly-Trp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)CN)O UMBDRSMLCUYIRI-DVJZZOLTSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- TWROVBNEHJSXDG-IHRRRGAJSA-N His-Leu-Val Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O TWROVBNEHJSXDG-IHRRRGAJSA-N 0.000 description 1
- KAXZXLSXFWSNNZ-XVYDVKMFSA-N His-Ser-Ala Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O KAXZXLSXFWSNNZ-XVYDVKMFSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- BEWFWZRGBDVXRP-PEFMBERDSA-N Ile-Glu-Asn Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O BEWFWZRGBDVXRP-PEFMBERDSA-N 0.000 description 1
- FQYQMFCIJNWDQZ-CYDGBPFRSA-N Ile-Pro-Pro Chemical compound CC[C@H](C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 FQYQMFCIJNWDQZ-CYDGBPFRSA-N 0.000 description 1
- COWHUQXTSYTKQC-RWRJDSDZSA-N Ile-Thr-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N COWHUQXTSYTKQC-RWRJDSDZSA-N 0.000 description 1
- YBKKLDBBPFIXBQ-MBLNEYKQSA-N Ile-Thr-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(=O)O)N YBKKLDBBPFIXBQ-MBLNEYKQSA-N 0.000 description 1
- KBDIBHQICWDGDL-PPCPHDFISA-N Ile-Thr-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N KBDIBHQICWDGDL-PPCPHDFISA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 241000235650 Kluyveromyces marxianus Species 0.000 description 1
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 150000008575 L-amino acids Chemical class 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical compound NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 1
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 1
- HNDVDQJCIGZPNO-YFKPBYRVSA-N L-histidine Chemical compound OC(=O)[C@@H](N)CC1=CN=CN1 HNDVDQJCIGZPNO-YFKPBYRVSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- AYFVYJQAPQTCCC-GBXIJSLDSA-N L-threonine Chemical compound C[C@@H](O)[C@H](N)C(O)=O AYFVYJQAPQTCCC-GBXIJSLDSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 239000012880 LB liquid culture medium Substances 0.000 description 1
- QUAAUWNLWMLERT-IHRRRGAJSA-N Leu-Arg-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O QUAAUWNLWMLERT-IHRRRGAJSA-N 0.000 description 1
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- GCMWRRQAKQXDED-IUCAKERBSA-N Lys-Glu-Gly Chemical compound [NH3+]CCCC[C@H]([NH3+])C(=O)N[C@@H](CCC([O-])=O)C(=O)NCC([O-])=O GCMWRRQAKQXDED-IUCAKERBSA-N 0.000 description 1
- OJDFAABAHBPVTH-MNXVOIDGSA-N Lys-Ile-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(N)=O)C(O)=O OJDFAABAHBPVTH-MNXVOIDGSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- AWOMRHGUWFBDNU-ZPFDUUQYSA-N Met-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCSC)N AWOMRHGUWFBDNU-ZPFDUUQYSA-N 0.000 description 1
- 241001529936 Murinae Species 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000008118 PEG 6000 Substances 0.000 description 1
- FPTXMUIBLMGTQH-ONGXEEELSA-N Phe-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 FPTXMUIBLMGTQH-ONGXEEELSA-N 0.000 description 1
- RGMLUHANLDVMPB-ULQDDVLXSA-N Phe-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N RGMLUHANLDVMPB-ULQDDVLXSA-N 0.000 description 1
- 229920000604 Polyethylene Glycol 200 Polymers 0.000 description 1
- 229920002560 Polyethylene Glycol 3000 Polymers 0.000 description 1
- 229920002562 Polyethylene Glycol 3350 Polymers 0.000 description 1
- 229920002584 Polyethylene Glycol 6000 Polymers 0.000 description 1
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 1
- LGMBKOAPPTYKLC-JYJNAYRXSA-N Pro-Phe-Arg Chemical compound C([C@@H](C(=O)N[C@@H](CCCNC(=N)N)C(O)=O)NC(=O)[C@H]1NCCC1)C1=CC=CC=C1 LGMBKOAPPTYKLC-JYJNAYRXSA-N 0.000 description 1
- POQFNPILEQEODH-FXQIFTODSA-N Pro-Ser-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O POQFNPILEQEODH-FXQIFTODSA-N 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- BRKHVZNDAOMAHX-BIIVOSGPSA-N Ser-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N BRKHVZNDAOMAHX-BIIVOSGPSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- BTPAWKABYQMKKN-LKXGYXEUSA-N Ser-Asp-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BTPAWKABYQMKKN-LKXGYXEUSA-N 0.000 description 1
- CAOYHZOWXFFAIR-CIUDSAMLSA-N Ser-His-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O CAOYHZOWXFFAIR-CIUDSAMLSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- VMHLLURERBWHNL-UHFFFAOYSA-M Sodium acetate Chemical compound [Na+].CC([O-])=O VMHLLURERBWHNL-UHFFFAOYSA-M 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 1
- DXNUZQGVOMCGNS-SWRJLBSHSA-N Thr-Gln-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O DXNUZQGVOMCGNS-SWRJLBSHSA-N 0.000 description 1
- YOOAQCZYZHGUAZ-KATARQTJSA-N Thr-Leu-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YOOAQCZYZHGUAZ-KATARQTJSA-N 0.000 description 1
- VRUFCJZQDACGLH-UVOCVTCTSA-N Thr-Leu-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VRUFCJZQDACGLH-UVOCVTCTSA-N 0.000 description 1
- MXNAOGFNFNKUPD-JHYOHUSXSA-N Thr-Phe-Thr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MXNAOGFNFNKUPD-JHYOHUSXSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- CSZFFQBUTMGHAH-UAXMHLISSA-N Thr-Thr-Trp Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O CSZFFQBUTMGHAH-UAXMHLISSA-N 0.000 description 1
- NDLHSJWPCXKOGG-VLCNGCBASA-N Thr-Trp-Tyr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)O)N)O NDLHSJWPCXKOGG-VLCNGCBASA-N 0.000 description 1
- REJRKTOJTCPDPO-IRIUXVKKSA-N Thr-Tyr-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O REJRKTOJTCPDPO-IRIUXVKKSA-N 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 102000011923 Thyrotropin Human genes 0.000 description 1
- 108010061174 Thyrotropin Proteins 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- WDIGUPHXPBMODF-UMNHJUIQSA-N Val-Glu-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N WDIGUPHXPBMODF-UMNHJUIQSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- RWOGENDAOGMHLX-DCAQKATOSA-N Val-Lys-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](C(C)C)N RWOGENDAOGMHLX-DCAQKATOSA-N 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- OIRDTQYFTABQOQ-KQYNXXCUSA-N adenosine Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](CO)[C@@H](O)[C@H]1O OIRDTQYFTABQOQ-KQYNXXCUSA-N 0.000 description 1
- 238000001261 affinity purification Methods 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 239000003125 aqueous solvent Substances 0.000 description 1
- OIRDTQYFTABQOQ-UHFFFAOYSA-N ara-adenosine Natural products Nc1ncnc2n(cnc12)C1OC(CO)C(O)C1O OIRDTQYFTABQOQ-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000000975 co-precipitation Methods 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 210000000805 cytoplasm Anatomy 0.000 description 1
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000007877 drug screening Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 238000005538 encapsulation Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012869 ethanol precipitation Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 108010042598 glutamyl-aspartyl-glycine Proteins 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 210000005260 human cell Anatomy 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- 108010031424 isoleucyl-prolyl-proline Proteins 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000010297 mechanical methods and process Methods 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 229920000515 polycarbonate Polymers 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 229960004109 potassium acetate Drugs 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 230000003161 proteinsynthetic effect Effects 0.000 description 1
- 239000002994 raw material Substances 0.000 description 1
- 230000035484 reaction time Effects 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 238000010188 recombinant method Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000003161 ribonuclease inhibitor Substances 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000013605 shuttle vector Substances 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 239000001632 sodium acetate Substances 0.000 description 1
- 235000017281 sodium acetate Nutrition 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 229950001470 thyrotrophin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000003151 transfection method Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 229910021642 ultra pure water Inorganic materials 0.000 description 1
- 239000012498 ultrapure water Substances 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 230000009614 wildtype growth Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/21—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/23—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a GST-tag
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/20—Fusion polypeptide containing a tag with affinity for a non-protein ligand
- C07K2319/24—Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a MBP (maltose binding protein)-tag
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Life Sciences & Earth Sciences (AREA)
- Gastroenterology & Hepatology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了一种多重标签串联的DNA序列及其在蛋白质表达纯化系统的应用,具体地,本发明提供了一种核酸构建物,所述核酸构建物具有从5’至3’的式I结构:Z1‑Z2‑Z3‑Z4‑Z5 (I);式中,Z1-Z5分别为用于构成所述构建物的元件;各“‑”独立地为键或核苷酸连接序列;Z1为前导肽的编码序列;Z2为无或泛素的编码序列;Z3为标签蛋白的编码序列;Z4为连接序列;Z5为无或外源蛋白的编码序列。本发明的核酸构建物可显著提高外源蛋白合成的效率,并简化目标外源蛋白的表达与纯化过程。
Description
技术领域
本发明涉及生物技术领域,具体地,涉及多重标签串联的DNA序列及其在 蛋白质表达纯化系统的应用。
背景技术
蛋白质是细胞中的重要分子,几乎参与了细胞所有功能的执行。蛋白的序 列和结构不同,决定了其功能的不同[1]。在细胞内,蛋白可以作为酶类催化 各种生化反应,可以作为信号分子协调生物体的各种活动,可以支持生物形态, 储存能量,运输分子,并使生物体运动[1]。在生物医学领域,蛋白质抗体作 为靶向药物,是治疗癌症等疾病的重要手段[1,2]。
在从酵母到人类的细胞内都发现了一些翻译增强编码序列和用于蛋白表达纯 化的亲和序列,而针对细胞内源的这些元件的研究并不充分,主要是因为细胞内源 性元件的作用受别的细胞作用因子等因素的影响,会影响起始蛋白质翻译的效率, 而且在纯化过程中容易发生非特异性结合[3,4]。不同于病毒中表达蛋白较为简单, 不同的细胞内源性表达蛋白不具有序列和结构上的共性,通常很难进行高通量具有 共性的翻译增强编码序列和用于蛋白表达纯化的亲和序列进行表达纯化[3,4]。
在体外合成所使用的DNA模板通常不具有多标签串联元件,而对不同的蛋白 进行设计不同的标签和纯化方法时间和成本都相对较高[5]。而目前使用真核细胞 多标签串联元件在体外起始蛋白质的表达与纯化的应用还比较少。
因此,本领域迫切需要开发一种可提升目标蛋白的表达效率并可用于蛋白质 表达纯化的DNA序列。
发明内容
本发明的目的在于提供一种可提升目标蛋白的表达效率并可用于蛋白质 表达纯化的DNA序列。
本发明第一方面提供了一种核酸构建物,所述核酸构建物具有从5’至3’ 的式I结构:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为前导肽的编码序列;
Z2为无或泛素的编码序列;
Z3为标签蛋白的编码序列;
Z4为连接序列;
Z5为无或外源蛋白的编码序列;
其中,所述前导肽的编码序列选自下组:
(a)编码如SEQ ID NO.:2所示多肽(前导肽的氨基酸序列: ITETSSPFRSIFSHSGK)的多核苷酸;
(b)序列如SEQ ID NO.:1所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1所示多核苷酸的5'端和/或3'端截短或添加1-60个(较 佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述前导肽的编码序列为密码子优化的编码序列。
在另一优选例中,所述前导肽的编码序列如SEQ ID NO.:1所示。
在另一优选例中,所述前导肽的氨基酸序列具有SEQ ID NO.:2所示的序列 或其活性片段,或者具有与SEQ ID NO:2所示氨基酸序列≥85%的同源性,优 选地≥90%的同源性;更优选地≥95%的同源性;最优选地,≥97%的同源性, 如98%以上,99%以上)且具有与SEQ ID NO.:2序列相同活性的多肽。
在另一优选例中,所述泛素的编码序列选自下组:
(a)编码如SEQ ID NO.:4所示多肽(泛素的氨基酸序列: MQIFVKTLTGKTITLEVEPSDTIENVKAKIQDKEGIPPDQQRLIFAGKQLEDGRTLSDYNIQKESTLHLVL RLRGG)的多核苷酸;
(b)序列如SEQ ID NO.:3所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:3所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:3所示多核苷酸的5'端和/或3'端截短或添加1-60个(较 佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述标签蛋白为野生型或优化的标签蛋白。
在另一优选例中,所述标签蛋白选自下组:链霉亲和素、MBP、GST、Protein、 CBP、6His、8His、或其组合。
在另一优选例中,所述标签蛋白包括优化的链霉亲和素。
在另一优选例中,所述标签蛋白带有Biotin标记。
在另一优选例中,所述标签蛋白具有(Kd)不大于10-6mol/L,(Kd<=10 -6mol/L);或在10-6mol/L至10-17mol/L之间的编码的蛋白质结合Biotin 的结合常数。
在另一优选例中,所述标签蛋白的编码序列选自下组;
(a)编码如SEQ ID NO.:6所示多肽(链霉亲和素的氨基酸序列: EAGITGTWYNQLGSTFIVTAGADGALTGTYESAVGNAESRYVLTGRYDSAPATDGSGTALGWTVAWKNNYR NAHSATTWSGQYVGGAEARINTQWLLTSGTTEANAWKSTLVGHDTFTKVKPSAAS)的多核苷酸;
(b)序列如SEQ ID NO.:5或8所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:5或8所示序列的同源性≥30%,较佳地,75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:5或8所示多核苷酸的5'端和/或3'端截短或添加1-60 个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述标签蛋白具有SEQ ID NO.:6所示的序列或其活性 片段,或者具有与SEQ ID NO:6所示氨基酸序列≥30%同源性(优选地,≥85% 的同源性,优选地≥90%的同源性;更优选地≥95%的同源性;最优选地,≥97% 的同源性,如98%以上,99%以上)且具有与SEQ ID NO.:6序列相同活性的多 肽。
在另一优选例中,所述连接序列为密码子优化的连接序列。
在另一优选例中,所述连接序列具有不易形成二级结构的序列(如AT-rich 序列,无发卡结构,无G-quadruplex等等),不富含稀有密码子。
在另一优选例中,所述连接序列选自下组;
(i)序列如SEQ ID NO.:7或9所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:7或9所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:7或9所示多核苷酸的5'端和/或3'端截短或添加1-60 个(较佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物, 啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列选自下组:编码荧光素蛋白、 或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成 酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域的外源DNA、 萤光素酶突变体的DNA、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火 虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸 脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、 肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、 溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚 糖酶、或其组合。
在另一优选例中,所述核酸构建物的5’端上游还包括启动子。
在另一优选例中,所述启动子选自下组:T7启动子、T3启动子、SP6启动子、 或其组合。
在另一优选例中,所述核酸构建物还包括增强子元件、RBS核糖体结合序列、Spacer间隔序列、其他供RNA转录、翻译的相关序列、或其组合。
在另一优选例中,所述增强子元件包括IRES元件、RBS元件、非编码序列、 或其组合。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:原核细胞、 真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述IRES元件包括内源性IRES元件和外源性IRES元件。
在另一优选例中,所述IRES元件来源选自下组的一种或多种细胞:人(human)、 中国仓鼠卵巢细胞(Chinese hamster ovary cell,CHO)、昆虫细胞(insect)、麦 胚(Wheatgerm cells)、兔网织红细胞(Rabbit reticulocyte)。
在另一优选例中,所述IRES元件选自下组:ScGPR1、ScFLO8、ScNCE102、 ScMSN1、KlFLO8、KlNCE102、KlMSN1、GAA、Omega、Omega10A、或其组合。
本发明第二方面提供了一种载体或载体组合,所述的载体或载体组合含有本 发明第一方面所述的核酸构建物。
本发明第三方面提供了一种基因工程细胞,所述基因工程细胞的基因组的 一个或多个位点整合有本发明第一方面所述的构建物,或者所述基因工程细胞 中含有本发明第一方面所述的载体或载体组合。
在另一优选例中,所述基因工程细胞包括原核细胞、真核细胞。
在另一优选例中,所述真核细胞包括高等真核细胞。
在另一优选例中,所述基因工程细胞选自下组:人源细胞(如Hela细胞)、 中国仓鼠卵巢细胞、昆虫细胞、麦胚细胞、兔网织红细胞、酵母细胞、或其组 合。
在另一优选例中,所述基因工程细胞为酵母细胞。
在另一优选例中,所述酵母细胞选自下组:酿酒酵母、克鲁维酵母属酵母、 或其组合。
在另一优选例中,所述克鲁维酵母属酵母选自下组:乳酸克鲁维酵母、马克斯 克鲁维酵母、多布克鲁维酵母、或其组合。
本发明第四方面提供了一种试剂盒,其特征在于,所述试剂盒中包含的试 剂选自下组中的一种或多种:
(a)本发明第一方面所述的构建物;
(b)本发明第二方面所述的载体或载体组合;和
(c)本发明第三方面所述的基因工程细胞。
在另一优选例中,所述试剂盒还包括(d)真核体外生物合成体系(如真核体外 蛋白合成体系)。
在另一优选例中,所述真核体外生物合成体系选自下组:酵母体外生物合成 体系、中国仓鼠卵巢细胞体外生物合成体系、昆虫细胞体外生物合成体系、Hela 细胞体外生物合成体系、或其组合。
在另一优选例中,所述真核体外生物合成体系包括真核体外蛋白合成体系。
在另一优选例中,所述真核体外蛋白合成体系选自下组:酵母体外蛋白合成 体系、中国仓鼠卵巢细胞体外蛋白合成体系、昆虫细胞体外蛋白合成体系、Hela 细胞体外蛋白合成体系、或其组合。
在另一优选例中,所述试剂盒还包括(e)酵母体外生物合成体系(如酵母体外 蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系) 为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克 鲁维酵母体外生物合成体系)(如乳酸克鲁维酵母体外蛋白合成体系)。
本发明第五方面提供了一种如本发明第一方面所述的构建物、本发明第二方 面所述的载体或载体组合、本发明第三方面所述的基因工程细胞或本发明第四方面 所述试剂盒的用途,用于进行高通量的体外蛋白合成。
本发明第六方面提供了一种体外高通量的外源蛋白合成方法,包括步骤:
(i)在真核体外生物合成体系存在下,提供本发明第一方面所述的核酸构 建物;
(ii)在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间 T1,从而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述真核体外生物合成 体系中,分离或检测所述外源蛋白。
在另一优选例中,所述真核体外生物合成体系为酵母体外生物合成体系(如 酵母体外蛋白合成体系)。
在另一优选例中,所述酵母体外生物合成体系(如酵母体外蛋白合成体系) 为克鲁维酵母体外生物合成体系(如克鲁维酵母体外蛋白合成体系)(优选乳酸克 鲁维酵母体外生物合成体系)(如乳酸克鲁维酵母体外蛋白合成体系)。
在另一优选例中,所述外源蛋白的编码序列来自原核生物、真核生物。
在另一优选例中,所述外源蛋白的编码序列来自动物、植物、病原体。
在另一优选例中,所述外源蛋白的编码序列来自哺乳动物,较佳地灵长动物, 啮齿动物,包括人、小鼠、大鼠。
在另一优选例中,所述的外源蛋白的编码序列编码选自下组的外源蛋白:荧 光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰 tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、 萤光素酶突变体、α-淀粉酶、肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、 干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状 腺素运载蛋白、酪氨酸酶、木聚糖酶、或其组合。
在另一优选例中,所述外源蛋白选自下组:荧光素蛋白、或荧光素酶(如萤火 虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸 脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区域、萤光素酶突变、α-淀粉酶、 肠道菌素A、丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1 β、溶菌酶素、血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、 木聚糖酶、或其组合。
在另一优选例中,所述步骤(ii)中,反应温度为20-37℃,较佳地,22-35℃。
在另一优选例中,所述步骤(ii)中,反应时间为1-10h,较佳地,2-8h。
本发明第七方面提供了一种分离的多核苷酸,所述多核苷酸选自下组:
(a)编码如SEQ ID NO.:2所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1所示多核苷酸的5'端和/或3'端截短或添加1-60个(较 佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在另一优选例中,所述多核苷酸为编码前导肽的核苷酸序列。
在另一优选例中,所述多核苷酸包括DNA序列。
本发明第八方面提供了一种前导肽,所述前导肽的氨基酸序列选自下组:
(A)具有SEQ ID NO:2所示氨基酸序列的多肽;(B)具有与SEQ ID NO:2 所示氨基酸序列≥80%同源性(优选地,≥90%的同源性;等优选地≥95%的同源 性;最优选地,≥97%的同源性,如98%以上,99%以上)的多肽,且所述多肽具 有提高外源蛋白表达效率的功能或活性;
(C)将SEQ ID NO:2中任一所示氨基酸序列经过1-15(较佳地,2-10,更佳 地,3-8)个氨基酸残基的取代、缺失或添加而形成的,且具有提高外源蛋白表 达效率的功能或活性的衍生多肽。
本发明第九方面提供了一种连接序列,所述连接序列选自下组:
(i)序列如SEQ ID NO.:7所示的多核苷酸;
(ii)核苷酸序列与SEQ ID NO.:7所示序列的同源性≥75%(较佳地≥85%,更 佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(iii)在SEQ ID NO.:7所示多核苷酸的5'端和/或3'端截短或添加1-60个(较 佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(iv)与(i)-(iii)任一所述的多核苷酸互补的多核苷酸。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施 例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技 术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了mRNA被核糖体复合物识别,并翻译起始的过程。ATG起始密 码子之后的20-300个核苷酸序列对于mRNA的翻译效率有决定性作用。
图2显示了11种真核细胞一种或多种标签元件串联组合在酵母体外蛋白 质合成体系中起始合成的增强型绿色荧光蛋白(Enhanced green fluorescent protein,eGFP)的相对荧光单位值(Relative Fluorescence Units,RFUs), 包括前导肽(leading peptide,lp)、泛素(UBA)相关序列、多His标签、 Streptavidin序列(STN1/STN2,STN1是直接从基因库调取的Streptavidin 氨基酸对应的核酸序列,STN2是在氨基酸序列不改变的前提下根据全序列特征 采用同义密码子替换的方式修改了部分碱基)及其组合;将一种或多种标签元 件与增强型绿色荧光蛋白编码序列之间通过Linker进行连接,形成了 lp-L2_eGFP、UBA-L2_eGFP、STN2-L2_eGFP、STN1-L2_eGFP、8His-STN2-L2_eGFP、 8His-STN1-L2_eGFP、lp-STN1-L2_eGFP、lp-8His-L2_eGFP、 lp-8His-STN1-L2_eGFP、L2_PC、L1_PC和PC;部分含有表达纯化标签的实验 组的相对荧光单位值高于300,蛋白表达量可以进行纯化实验。
图3显示了在带有STN(STN1、STN2)核酸构建物的反应液中加入biotin beads去结合目标外源蛋白,并进行SDS-PAGE蛋白胶检测结果,考马斯亮蓝染 色结果显示条带大小正确并清晰可见。STN1、STN2分别是不连接目标蛋白的实 验组,STN1-eGFP、STN2-eGFP分别对应STN(STN1,STN2)后连接目标蛋白(eGFP) 的实验组。
图4显示了在带有多标签串联序列的核酸构建物(lp-8His-STN1和 8His-STN1)以及部分测试蛋白(TP1-4)的反应液中加入biotin beads去结 合目标外源蛋白,并进行SDS-PAGE蛋白胶检测结果,考马斯亮蓝染色结果显 示条带大小正确并清晰可见。
图5显示了带有多标签串联序列的核酸构建物应用于蛋白质表达纯化的 基本原理,多标签串联序列连同目标蛋白编码序列被转录翻译之后,通过与 biotin beads特异性结合,从而在反应液中抓取到目标蛋白。Tag I用于提升 蛋白质的合成效率,Tag II用于提升蛋白质的纯化效果,Tag III为连接序列, 部分序列可以同时兼具Tag I、Tag II和TagIII的功能(如多His标签序列)。
具体实施方式
经过广泛而深入的研究,通过大量筛选和摸索,首次意外地发现 了一种用于蛋白质表达纯化的DNA序列的核酸构建物,本发明的核酸构建物由前 导肽的编码序列(如密码子优化的前导肽的编码序列)、任选的泛素的编码序 列、体外蛋白质表达纯化序列(如链霉亲和素、MBP、GST、Protein、CBP等)、 连接序列(如密码子优化的连接序列)以及外源蛋白的编码序列构成,在任选的 5’UTR之后使用。
实验表明,在体外蛋白质合成体系(如酵母体外蛋白质合成体系)中应用 本发明的核酸构建物,所合成的外源蛋白(如增强型绿色荧光蛋白)活性的相 对荧光单位值(RFU)非常高,高达705,与不含多重标签串联的DNA序列的PC 相比,所合成的外源蛋白(如增强型绿色荧光蛋白)活性的相对荧光单位值(RFU) 提高了2倍,本发明还简化了外源蛋白的表达和纯化方式。在此基础上,本发 明人完成了本发明。
蛋白质合成体系
蛋白质合成是指生物按照从脱氧核糖核酸(DNA)转录得到的信使核糖核酸(mRNA)上的遗传信息合成蛋白质的过程。蛋白质生物合成亦称为翻译 (Translation),即把mRNA分子中碱基排列顺序转变为蛋白质或多肽链中的氨基 酸排列顺序过程。这是基因表达的第二步,产生基因产物蛋白质的最后阶段。不同 的组织细胞具有不同的生理功能,是因为它们表达不同的基因,产生具有特殊功能 的蛋白质,参与蛋白质生物合成的成份至少有200种,其主要体是由mRNA、tRNA、 核糖核蛋白体以及有关的酶和蛋白质因子共同组成。
蛋白质体外合成系统一般是指在细菌、真菌、植物细胞或动物细胞的裂解体系中,加入mRNA或者DNA模板、RNA聚合酶及氨基酸和ATP等组分,完成外源蛋白 的快速高效翻译。目前,经常实验的商业化体外蛋白表达系统包括大肠杆菌系统 (E.coli extract,ECE)、兔网织红细胞(Rabbit reticulocyte lysate,RRL)、麦 胚(Wheat germ extract,WGE)、昆虫(Insect cell extract,ICE)和人源系统。 与传统的体内重组表达系统相比,体外无细胞合成系统具有多种优点,如可表达对 细胞有毒害作用或含有非天然氨基酸(如D-氨基酸)的特殊蛋白质,能够直接以PCR 产物作为模板同时平行合成多种蛋白质,开展高通量药物筛选和蛋白质组学的研 究。
其中,酵母(yeast)兼具培养简单、高效蛋白质折叠、和翻译后修饰的优势。 其中酿酒酵母(Saccharomyces cerevisiae)和毕氏酵母(Pichia pastoris)是表达 复杂真核蛋白质和膜蛋白的模式生物,酵母也可作为制备体外翻译系统的原料。
克鲁维酵母(Kluyveromyces)是一种子囊孢子酵母,其中的马克斯克鲁维酵母(Kluyveromyces marxianus)和乳酸克鲁维酵母(Kluyveromyces lactis)是工业上 广泛使用的酵母。与其他酵母相比,乳酸克鲁维酵母具有许多优点,如超强的分泌 能力,更好的大规模发酵特性、食品安全的级别、以及同时具有蛋白翻译后修饰的 能力等。
在本发明中,一种优选的蛋白合成体系为体外蛋白合成体系。本发明的体 外蛋白质合成体系不受特别限制,一种优选的体外蛋白质合成体系为克鲁维酵 母表达系统(更佳地,乳酸克鲁维酵母表达系统)。
在本发明中,所述体外蛋白质合成体系包括:
(a)酵母细胞提取物;
(b)聚乙二醇;
(c)任选的外源蔗糖;和
(d)任选的溶剂,所述溶剂为水或水性溶剂。
在一特别优选的实施方式中,本发明提供的体外蛋白合成体系包括:酵母细 胞提取物,4-羟乙基哌嗪乙磺酸,醋酸钾,醋酸镁,腺嘌呤核苷三磷酸(ATP),鸟 嘌呤核苷三磷酸(GTP),胞嘧啶核苷三磷酸(CTP),胸腺嘧啶核苷三磷酸(TTP),氨 基酸混合物,磷酸肌酸,二硫苏糖醇(DTT),磷酸肌酸激酶,RNA酶抑制剂,荧光 素,萤光素酶DNA,RNA聚合酶。
在本发明中,RNA聚合酶没有特别限制,可以选自一种或多种RNA聚合酶,典 型的RNA聚合酶为T7RNA聚合酶。
在本发明中,所述酵母细胞提取物在体外蛋白合成体系中的比例不受特别 限制,通常所述酵母细胞提取物在体外蛋白质合成蛋白合成体系中所占体系为 20-70%,较佳地,30-60%,更佳地,40-50%。
在本发明中,所述的酵母细胞提取物不含完整的细胞,典型的酵母细胞提取 物包括用于蛋白翻译的核糖体、转运RNA、氨酰tRNA合成酶、蛋白质合成需要的 起始因子和延伸因子以及终止释放因子。此外,酵母提取物中还含有一些源自酵母 细胞的细胞质中的其他蛋白,尤其是可溶性蛋白。
在本发明中,所述的酵母细胞提取物所含蛋白含量为20-100mg/mL,较佳为 50-100mg/mL。所述的测定蛋白含量方法为考马斯亮蓝测定方法。
在本发明中,所述的酵母细胞提取物的制备方法不受限制,一种优选的制备 方法包括以下步骤:
(i)提供酵母细胞;
(ii)对酵母细胞进行洗涤处理,获得经洗涤的酵母细胞;
(iii)对经洗涤的酵母细胞进行破细胞处理,从而获得酵母粗提物;
(iv)对所述酵母粗提物进行固液分离,获得液体部分,即为酵母细胞提取物。
在本发明中,所述的固液分离方式不受特别限制,一种优选的方式为离心。
在一优选实施方式中,所述离心在液态下进行。
在本发明中,所述离心条件不受特别限制,一种优选的离心条件为 5000-100000g,较佳地,8000-30000g。
在本发明中,所述离心时间不受特别限制,一种优选的离心时间为0.5min-2 h,较佳地,20min-50min。
在本发明中,所述离心的温度不受特别限制,优选的,所述离心在1-10℃下 进行,较佳地,在2-6℃下进行。
在本发明中,所述的洗涤处理方式不受特别限制,一种优选的洗涤处理方式 为采用洗涤液在pH为7-8(较佳地,7.4)下进行处理,所述洗涤液没有特别限制, 典型的所述洗涤液选自下组:4-羟乙基哌嗪乙磺酸钾、醋酸钾、醋酸镁、或其组 合。
在本发明中,所述破细胞处理的方式不受特别限制,一种优选的所述的破 细胞处理包括高压破碎、冻融(如液氮低温)破碎。
所述体外蛋白质合成体系中的核苷三磷酸混合物为腺嘌呤核苷三磷酸、鸟嘌 呤核苷三磷酸、胞嘧啶核苷三磷酸和尿嘧啶核苷三磷酸。在本发明中,各种单核苷 酸的浓度没有特别限制,通常每种单核苷酸的浓度为0.5-5mM,较佳地为1.0-2.0 mM。
所述体外蛋白质合成体系中的氨基酸混合物可包括天然或非天然氨基酸,可 包括D型或L型氨基酸。代表性的氨基酸包括(但并不限于)20种天然氨基酸:甘 氨酸、丙氨酸、缬氨酸、亮氨酸、异亮氨酸、苯丙氨酸、脯氨酸、色氨酸、丝氨酸、 酪氨酸、半胱氨酸、蛋氨酸、天冬酰胺、谷氨酰胺、苏氨酸、天冬氨酸、谷氨酸、 赖氨酸、精氨酸和组氨酸。每种氨基酸的浓度通常为0.01-0.5mM,较佳地0.02-0.2 mM,如0.05、0.06、0.07、0.08mM。
在优选例中,所述体外蛋白质合成体系还含有聚乙二醇或其类似物。聚乙 二醇或其类似物的浓度没有特别限制,通常,聚乙二醇或其类似物的浓度(w/v) 为0.1-8%,较佳地,0.5-4%,更佳地,1-2%,以所述蛋白合成体系的总重量计。 代表性的PEG例子包括(但并不限于):PEG3000,PEG8000,PEG6000和PEG3350。 应理解,本发明的体系还可包括其他各种分子量的聚乙二醇(如PEG200、400、 1500、2000、4000、6000、8000、10000等)。
在优选例中,所述体外蛋白质合成体系还含有蔗糖。蔗糖的浓度没有特别 限制,通常,蔗糖的浓度为0.03-40wt%,较佳地,0.08-10wt%,更佳地,0.1-5wt%, 以所述蛋白合成体系的总重量计。
一种特别优选的体外蛋白质合成体系,除了酵母提取物之外,还含有以下 组分:22mM,pH为7.4的4-羟乙基哌嗪乙磺酸,30-150mM醋酸钾,1.0-5.0 mM醋酸镁,1.5-4mM核苷三磷酸混合物,0.08-0.24mM的氨基酸混合物,25mM 磷酸肌酸,1.7mM二硫苏糖醇,0.27mg/mL磷酸肌酸激酶,1%-4%聚乙二醇, 0.5%-2%蔗糖,8-20ng/μL萤火虫荧光素酶的DNA,0.027-0.054mg/mL T7RNA 聚合酶。
外源蛋白的编码序列(外源DNA)
如本文所用,术语“外源蛋白的编码序列”与“外源DNA”可互换使用,均 指外源的用于指导蛋白质合成的DNA分子。通常,所述的DNA分子为线性的或环状 的。所述的DNA分子含有编码外源蛋白的序列。
在本发明中,所述的编码外源蛋白的序列的例子包括(但并不限于):基因组 序列、cDNA序列。所述的编码外源蛋白的序列还含有启动子序列、5’非翻译序列、 3’非翻译序列。
在本发明中,所述外源DNA的选择没有特别限制,通常,外源DNA选自下组: 编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色荧光蛋白、黄色荧光蛋白、 氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、肌动蛋白、抗体的可变区 域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源DNA还可以选自下组:编码α-淀粉酶、肠道菌素A、丙型肝炎病毒E2 糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、血清白蛋白、 单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶的外源DNA、或其组 合。
在一优选实施方式中,所述外源DNA编码选自下组的蛋白:绿色荧光蛋白(enhanced GFP,eGFP)、黄色荧光蛋白(YFP)、大肠杆菌β-半乳糖苷酶 (β-galactosidase,LacZ)、人赖氨酸-tRNA合成酶(Lysine-tRNA synthetase)、 人亮氨酸-tRNA合成酶(Leucine-tRNA synthetase)、拟南芥甘油醛3-磷酸脱氢酶 (Glyceraldehyde-3-phosphate dehydrogenase)、鼠过氧化氢酶(Catalase)、或 其组合。
核酸构建物
本发明第一方面提供了一种核酸构建物,所述的构建物具有从5’至3’ 的式I结构:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1、Z2、Z3、Z4、Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为前导肽的编码序列;
Z2为无或泛素的编码序列;
Z3为标签蛋白的编码序列;
Z4为连接序列;
Z5为无或外源蛋白的编码序列;其中,所述前导肽的编码序列选自下组:
(a)编码如SEQ ID NO.:2所示多肽的多核苷酸;
(b)序列如SEQ ID NO.:1所示的多核苷酸;
(c)核苷酸序列与SEQ ID NO.:1所示序列的同源性≥75%(较佳地≥85%,更佳地≥90%或≥95%或≥98%或≥99%)的多核苷酸;
(d)在SEQ ID NO.:1所示多核苷酸的5'端和/或3'端截短或添加1-60个(较 佳地1-30,更佳地1-10个)核苷酸的多核苷酸;
(e)与(a)-(d)任一所述的多核苷酸互补的多核苷酸。
在本发明中,Z1、Z2、Z3、Z4、Z5元件的来源没有特别限制。
在本发明中,所述外源蛋白的编码序列的选择没有特别限制,通常,外源蛋 白的编码序列选自下组:编码荧光素蛋白、或荧光素酶(如萤火虫荧光素酶)、绿色 荧光蛋白、黄色荧光蛋白、氨酰tRNA合成酶、甘油醛-3-磷酸脱氢酶、过氧化氢酶、 肌动蛋白、抗体的可变区域的外源DNA、萤光素酶突变体的DNA、或其组合。
外源蛋白的编码序列还可以编码选自下组的蛋白:α-淀粉酶、肠道菌素A、 丙型肝炎病毒E2糖蛋白、胰岛素前体、干扰素αA、白细胞介素-1β、溶菌酶素、 血清白蛋白、单链抗体段(scFV)、甲状腺素运载蛋白、酪氨酸酶、木聚糖酶、或其 组合。
此外,本发明的所述核酸构建物可以是线性的,也可以是环状的。本发明的 所述核酸构建物可以是单链的,也可以是双链的。本发明的所述核酸构建物可以是 DNA,也可以是RNA,或DNA/RNA杂合。
在一优选实施方式中,本发明的核酸构建物的序列如表1所示。
在另一优选例中,所述的构建物还包括选自下组的元件或其组合:启动子、 终止子、poly(A)元件、转运元件、基因靶向元件、筛选标记基因、增强子、抗 性基因、转座酶编码基因。
多种选择性标志基因均可应用于本发明,包括但不限于:营养缺陷型标记, 抗性标记,报告基因标记。选择性标志的应用对于重组细胞(重组子)的筛选起到作 用,使得受体细胞能够与未转化的细胞进行显著区分。营养缺陷型标记是通过转入 的标记基因与受体细胞突变基因互补,从而使受体细胞表现野生型生长。抗性标记 是指将抗性基因转入受体细胞中,转入的基因使受体细胞在一定的药物浓度下表现 抗药性。作为本发明的优选方式,应用抗性标记来实现重组细胞的便捷筛选。
在本发明中,在蛋白质合成体系中应用本发明的核酸构建物,并在反应完成 后使用biotin-binding技术,可以完成外源蛋白的表达和纯化,具体地,应用 本发明的核酸构建物所合成的增强型绿色荧光蛋白量的相对荧光单位值相对较 高。
载体,基因工程细胞
本发明还提供了一种载体或载体组合,所述载体含有本发明的核酸构建物。 优选地,所述载体选自:细菌质粒、噬菌体、酵母质粒、或动物细胞载体、穿 梭载体;所述的载体为转座子载体。用于制备重组载体的方法是本领域普通技术 人员所熟知的。只要其能够在宿主体内复制和稳定,任何质粒和载体都是可以 被采用的。
本领域普通技术人员可以使用熟知的方法构建含有本发明所述的启动子和 /或目的基因序列的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、 体内重组技术等。
本发明还提供了一种基因工程细胞,所述的基因工程细胞含有所述的构建物 或载体或载体组合,或所述的基因工程细胞染色体整合有所述的构建物或载体。 在另一优选例中,所述的基因工程细胞还包括含有编码转座酶基因的载体或其染色 体上整合有转座酶基因。
优选地,所述的基因工程细胞为真核细胞。
在另一优选例中,所述真核细胞,包括(但不限于):酵母细胞(优选,克鲁 维酵母细胞,更优选乳酸克鲁维酵母细胞)。
本发明的构建物或载体,可以用于转化适当的基因工程细胞。基因工程细 胞可以是原核细胞,如大肠杆菌,链霉菌属、农杆菌:或是低等真核细胞,如 酵母细胞;或是高等动物细胞,如昆虫细胞。本领域一般技术人员都清楚如何 选择适当的载体和基因工程细胞。用重组DNA转化基因工程细胞可用本领域技术 人员熟知的常规技术进行。当宿主为原核生物(如大肠杆菌)时,可以用CaCl2法处理,也可用电穿孔法进行。当宿主是真核生物,可选用如下的DNA转染方 法:磷酸钙共沉淀法,常规机械方法(如显微注射、电穿孔、脂质体包装等)。 转化植物也可使用农杆菌转化或基因枪转化等方法,例如叶盘法、幼胚转化法、 花芽浸泡法等。
体外高通量的蛋白合成方法
本发明提供了一种体外高通量的蛋白合成方法,包括步骤:
(i)在体外蛋白合成体系存在下,提供本发明第一方面所述的核酸构建 物;
(ii)在适合的条件下,孵育步骤(i)的体外蛋白合成体系一段时间T1,从 而合成所述外源蛋白。
在另一优选例中,所述方法还包括:(iii)任选地从所述体外蛋白合成体系 中,分离或检测所述外源蛋白。
本发明的主要优点包括:
(1)本发明首次发现,将任选的改变蛋白质起始翻译效率的编码序列、蛋白 质表达纯化序列以及外源蛋白的编码序列构成的核酸构建物,应用于本发明的体外 蛋白质合成体系中,可显著提高目标蛋白的产量,并可用于外源蛋白的表达与纯化。
(2)本发明的蛋白质表达纯化序列能够特异性识别并高效结合beads。这些序 列的识别结合效率不仅超过传统的特异性氨基酸biotin序列,而且可以应用于蛋 白质合成体系(尤其是体外蛋白合成体系)。
(3)本发明应用的可改变蛋白质起始翻译效率的编码序列可增强翻译起始的 效率不仅超过传统的翻译增强子Omega序列及部分起始编码序列,而且可以应用于 蛋白质合成体系(尤其是体外蛋白合成体系)。
(4)与其他系统相比,乳酸克鲁维酵母因其安全性和高效性可以被应用于食品 和药品领域蛋白质的生产,加上体外蛋白质合成体系的优点,如适应于高通量的蛋 白质合成筛选,合成毒性蛋白质和时间短成本低等,所以乳酸克鲁维酵母细胞来源 的体外蛋白质合成体系在相关领域也能够得到广泛的应用。
(5)本发明提供的蛋白质表达纯化序列不仅能够提升目标外源蛋白的表达和 纯化效果,更主要的是能够增加蛋白质合成体系的针对不同蛋白质合成的可能性。
(6)本发明首次开发一种用于蛋白质表达纯化的DNA序列的核酸构建 物,本发明的核酸构建物由前导肽的编码序列(如密码子优化的前导肽的编码序 列)、任选的泛素的编码序列、体外蛋白质表达纯化序列(如链霉亲和素、MBP、 GST、Protein、CBP等)、连接序列(如密码子优化的连接序列)以及外源蛋白的 编码序列构成,本发明的核酸构建物可显著提高所合成的外源蛋白(如增强型绿色 荧光蛋白)的活性,其相对荧光单位值(RFU)非常高,高达705,与不含多重标签 串联的DNA序列相比,其相对荧光单位值(RFU)提高了2倍。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说 明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方 法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York: Cold Spring HarborLaboratory Press,1989)中所述的条件,或按照制造厂 商所建议的条件。除非另外说明,否则百分比和份数是重量百分比和重量份数。
如无特别说明,则本发明实施例中所用的材料和试剂均为市售产品。
外源蛋白以eGFP为例。
实施例1:真核细胞改变蛋白质起始翻译效率的编码序列和蛋白质表达纯 化序列
1.1在基因库中找出相关的核酸序列(表1)。STN1序列是Streptavidin 基因序列,STN2序列是在氨基酸序列不改变前提下根据全序列特征采用同义密 码子替换的方式修改了部分碱基。表1中标注Tag I的为改变蛋白质起始翻译 效率的编码序列,标注Tag II的为蛋白质表达纯化结合序列,标注为Tag III 的为连接序列。
表1 Multi-Tag中相关核酸序列
实施例2:含有真核细胞翻译调控序列和蛋白质表达纯化序列的体外蛋白 质合成体系质粒的构建
2.1全基因合成:将STN1,STN2核酸序列、前导肽序列和泛素序列串联 起来,并使用全基因合成的方法进行合成。His标签序列直接采用两对引物在 模板上扩增。
2.2质粒的构建:构建质粒模板为pD2P质粒,将翻译调控序列和蛋白质 表达纯化序列插入到翻译起始密码子ATG和eGFP之间。不同的翻译调控序列 和蛋白质表达纯化序列可组合,具体实验组合见表2。
具体构建过程如下:
以pD2P为模板进行质粒构建,使用两对引物分别进行PCR扩增,并各取 10μL扩增产物进行混合;向20μL扩增产物中加入1μL Dpn I,37℃孵育 6h;将DpnI处理后产物4μL加入50μL DH5α感受态细胞中,冰上放置 30min,42℃热激45s后,冰上放置3min,加入200μLLB液体培养基37℃ 振荡培养4h,涂布于含有Amp抗生素的LB固体培养基上过夜培养;挑取6个单克隆进行扩大培养后,进行测序确认正确后,提取质粒保存。
表2.真核细胞翻译调控序列和蛋白质表达纯化序列及其组合
实施例3:真核细胞翻译调控序列和蛋白质表达纯化序列在酵母体外蛋 白质合成体系中的应用
3.1利用PCR的方法,并使用引物pD2P_F: CGCGAAATTAATACGACTCACTATAGG和pD2P_R:TCCGGATATAGTTCCTCCTTTCAG将所 有质粒中位于转录起始序列5`UTR和终止序列3`UTR之间包含一种或多种翻 译调控序列和蛋白质表达纯化序列标签元件串联组合的片段和pD2P-eGFP片 段进行扩增。
并将扩增得到的DNA片段用乙醇沉淀的方法进行纯化和富集:向PCR产 物中加入1/10体积的3M醋酸钠(pH5.2),然后再加入2.5-3倍体积(该体 积为加入醋酸钠之后的体积)的95%的乙醇,置于冰上孵育15min;室温条 件下以高于14000g的速度离心30min,弃掉上清;使用70%乙醇进行清洗, 然后再离心15min,弃掉上清,并用超纯水将沉淀溶解,测定DNA浓度。
3.2按照使用说明,将纯化的DNA片段加入到自制的乳酸克鲁维酵母体 外蛋白质合成体系中。并将上述反应体系置于22-30℃的环境中,静置孵育 约2-6h。反应结束后,立即放置于Envision 2120多功能酶标仪(Perkin Elmer),读数,检测eGFP信号强弱,相对荧光单位值(Relative Fluorescence Unit,RFU)作为活性单位,如图1所示。
3.3将部分在反应液中加入biotin beads去结合目标外源蛋白,并进行 SDS-PAGE蛋白胶检测,如图2所示。
实验结果
1.蛋白质合成体系质粒的构建
经过多次尝试,最终构建成功11个蛋白质合成体系质粒,其中包括5 个含有翻译调控序列和蛋白质表达纯化序列以多种标签元件进行串联组合的 质粒。
2.真核细胞多种标签元件串联组合在酵母体外蛋白质合成体系中的应 用
如图1所示,筛选的11个真核细胞多种标签元件串联组合在酵母体外蛋 白质合成体系中引起增强型绿色荧光蛋白发出的相对荧光单位值(Relative Fluorescence Units,RFU)均达到较高值,部分带有蛋白质表达纯化序列的实 验组活性高于200以至于可以进行蛋白纯化实验。
本发明结果表明:真核细胞中多种标签元件串联组合序列可以提升目标蛋 白的翻译效率并用于检测蛋白质表达纯化效果,并能够应用于酵母体外蛋白质 合成体系中,起始蛋白质合成的效率能够达到或者超过不含标签的序列。增加 了乳酸克鲁维酵母体外合成体系进行蛋白质表达纯化方式的选择性,极大增强 了乳酸克鲁维酵母体外蛋白质合成体系的可用性。
如图2所示,本发明的核酸构建物中,使用优化的前导肽编码序列,外源 蛋白的RFU相比未优化的前导肽的编码序列,提高了1.5倍。本发明的核酸构 建物中,使用优化的前导肽编码序列和多His标签串联的编码序列,提高了大 约2倍。本发明的核酸构建物中,使用优化的linker,外源蛋白的RFU相比未 优化的linker,提高了1.5倍。
本发明的核酸构建物中,使用优化的前导肽编码序列和优化的linker构 成的核酸构建物,所得到的外源蛋白的RFU相比使用未优化的前导肽编码序列 和未优化的linker组合的核酸构建物,提高了2.25倍。
如图3所示,利用STN1和STN2的亲和纯化序列进行SDS-PAGE跑胶并进 行考马斯亮蓝染色检测,所得到的特异性目标条带非常明显,表明了经过优化 后的标签的序列非常适合反应后的蛋白纯化实验。
如图4所示,利用含有多标签序列的4种测试蛋白进行的纯化实验结果表 明,可以看到清晰的目标条带,证明此序列拥有比较广泛的适用性。
并且如图5所示,本发明的研究还发现,将结构简单、效率很高5`UTR(强 启动子(如T7启动子、T3启动子、SP6启动子)、不同的IRES元件,RBS元 件),3`UTR与不同的多种标签元件串联组合序列Multi-tag进行组合,也可 提高目标蛋白的翻译效率和获得非常好的蛋白表达纯化效果,其中,目标蛋白 (eGFP)的RFU值高达705,与不含多重标签串联的DNA序列相比,其相对荧 光单位值(RFU)提高了2倍。
对比例
在本发明的核酸构建物中,使用未优化的前导肽的编码序列,外源蛋白的 RFU为375。
在本发明的核酸构建物中,使用链霉亲和素本身的前导肽,外源蛋白的RFU 大约为325。
在本发明的核酸构建物中,无前导肽,外源蛋白的RFU为300。
在本发明的核酸构建物中,无linker,外源蛋白的RFU为225。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献 被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后, 本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申 请所附权利要求书所限定的范围。
参考文献:
1.Garcia RA,Riley MR.Applied biochemistry and biotechnology. HumanaPress;1981.263-264.
2.Fromm HJ,Hargrove M.Essentials of Biochemistry.2012.
3.S,Nordlund P,Weigelt J,Hallberg BM,Bray J,Gileadi O,etal.Protein production and purification.Nat Methods. 2008;5(2):135–46.
4.IP,Skerra A.Improved affinity of engineeredstreptavidin for the Strep-tag II peptide is due to a fixed open conformationof the lid-like loop at the binding site.Protein Sci. 2002;11(4):883–93.
5.Hyre DE,Trong I Le,Merritt EA,Eccleston JF,Green NM, Stenkamp RE,etal.Cooperative hydrogen bond interactions in the streptavidin–biotinsystem.Protein Sci.2006;15(3):459–67.
序列表
<110> 康码(上海)生物科技有限公司
<120> 多重标签串联的DNA序列及其在蛋白质表达纯化系统的应用
<130> P2018-0725
<141> 2018-04-28
<160> 11
<170> SIPOSequenceListing 1.0
<210> 1
<211> 51
<212> DNA
<213> 人工序列(artificial sequence)
<400> 1
attacagaaa catcatcacc gttcagatct atattctccc acagtgggaa a 51
<210> 2
<211> 17
<212> PRT
<213> 人工序列(artificial sequence)
<400> 2
Ile Thr Glu Thr Ser Ser Pro Phe Arg Ser Ile Phe Ser His Ser Gly
1 5 10 15
Lys
<210> 3
<211> 225
<212> DNA
<213> 人工序列(artificial sequence)
<400> 3
cagattttcg tgaaaaccct tacggggaag accatcaccc tcgaggttga accctcggat 60
acgatagaaa atgtaaaggc caagatccag gataaggaag gaattcctcc tgatcagcag 120
agactgatct ttgctggcaa gcagctggaa gatggacgta ctttgtctga ctacaatatt 180
caaaaggagt ctactcttca tcttgtgttg agacttcgtg gtggt 225
<210> 4
<211> 76
<212> PRT
<213> 人工序列(artificial sequence)
<400> 4
Met Gln Ile Phe Val Lys Thr Leu Thr Gly Lys Thr Ile Thr Leu Glu
1 5 10 15
Val Glu Pro Ser Asp Thr Ile Glu Asn Val Lys Ala Lys Ile Gln Asp
20 25 30
Lys Glu Gly Ile Pro Pro Asp Gln Gln Arg Leu Ile Phe Ala Gly Lys
35 40 45
Gln Leu Glu Asp Gly Arg Thr Leu Ser Asp Tyr Asn Ile Gln Lys Glu
50 55 60
Ser Thr Leu His Leu Val Leu Arg Leu Arg Gly Gly
65 70 75
<210> 5
<211> 378
<212> DNA
<213> 人工序列(artificial sequence)
<400> 5
gaagccggta tcacaggaac atggtataat cagctgggta gcactctgat cgttaccgct 60
ggagcagatg gtgctctgac tggcacctat gttacagcac gtggtaatgc tgaaggctcg 120
tatgtcctga caggtcgcta tgattctgcc ccggcaactg atggatctgg aacagcgctg 180
ggatggactg ttgcttggaa aaacaactat cgtaatgccc attccgccac cacatggagt 240
ggtcagtatg ttggaggcgc cgaagctcgt attaatacac agtggctgct gacaagtggt 300
acaactgaag ccaatgcctg gaaatcaacc ctggttggcc atgacacctt tacaaaagtc 360
aaaccgtccg ccgcttct 378
<210> 6
<211> 126
<212> PRT
<213> 人工序列(artificial sequence)
<400> 6
Glu Ala Gly Ile Thr Gly Thr Trp Tyr Asn Gln Leu Gly Ser Thr Phe
1 5 10 15
Ile Val Thr Ala Gly Ala Asp Gly Ala Leu Thr Gly Thr Tyr Glu Ser
20 25 30
Ala Val Gly Asn Ala Glu Ser Arg Tyr Val Leu Thr Gly Arg Tyr Asp
35 40 45
Ser Ala Pro Ala Thr Asp Gly Ser Gly Thr Ala Leu Gly Trp Thr Val
50 55 60
Ala Trp Lys Asn Asn Tyr Arg Asn Ala His Ser Ala Thr Thr Trp Ser
65 70 75 80
Gly Gln Tyr Val Gly Gly Ala Glu Ala Arg Ile Asn Thr Gln Trp Leu
85 90 95
Leu Thr Ser Gly Thr Thr Glu Ala Asn Ala Trp Lys Ser Thr Leu Val
100 105 110
Gly His Asp Thr Phe Thr Lys Val Lys Pro Ser Ala Ala Ser
115 120 125
<210> 7
<211> 60
<212> DNA
<213> 人工序列(artificial sequence)
<400> 7
ggttctccct gtttgcatat gttacctcat cttcactttg gcctcaaaga caaggaaaca 60
<210> 8
<211> 378
<212> DNA
<213> 人工序列(artificial sequence)
<400> 8
gaggcaggca ttacaggcac gtggtataac cagttggggt caacctttat cgtgacagcc 60
ggggccgacg gagcattgac tgggacctat gagagtgccg ttggcaatgc tgagtcaaga 120
tatgttctta ccggcaggta cgattcagct ccggcaacgg acgggtctgg aactgccttg 180
ggatggactg ttgcttggaa aaacaactat aggaacgctc attcggccac aacatggtcg 240
ggacagtacg tcggaggtgc cgaggctagg ataaacacgc agtggttgct aacatcaggc 300
acaactgaag ccaatgcctg gaagtctacg cttgttggac acgacacatt taccaaggtg 360
aaacctagtg ctgcatcc 378
<210> 9
<211> 27
<212> DNA
<213> 人工序列(artificial sequence)
<400> 9
ggtagtggag gaagtggtgg aagtgga 27
<210> 10
<211> 18
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
caccatcacc accatcac 18
<210> 11
<211> 24
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
caccaccacc atcaccacca tcac 24
Claims (10)
1.一种核酸构建物,其特征在于,所述核酸构建物具有从5’至3’的式I结构:
Z1-Z2-Z3-Z4-Z5 (I)
式中,
Z1-Z5分别为用于构成所述构建物的元件;
各“-”独立地为键或核苷酸连接序列;
Z1为前导肽的编码序列;
Z2为无;
Z3为标签蛋白的编码序列,所述标签蛋白选自下组: 8His、链霉亲和素STN及其组合8His-STN;
Z4为连接序列;
Z5为无或外源蛋白的编码序列;
其中,所述前导肽的编码序列选自下组:
(a) 序列如SEQ ID NO:1所示的多核苷酸;和
(b) 与(a)所述的多核苷酸互补的多核苷酸;
其中,所述链霉亲和素的序列选自下组:
(a) 编码如SEQ ID NO:6所示多肽的多核苷酸;
(b) 序列如SEQ ID NO:5或8所示的多核苷酸;
(c) 与(a)或(b)所述的多核苷酸互补的多核苷酸;
其中,所述连接序列选自下组:
(i) 序列如SEQ ID NO:7或9所示的多核苷酸;和
(ii) 与(i)所述的多核苷酸互补的多核苷酸。
2.如权利要求1所述的核酸构建物,其特征在于,所述Z5为增强型绿色荧光蛋白的编码序列。
3.一种载体或载体组合,其特征在于,所述的载体或载体组合含有权利要求1所述的核酸构建物。
4.一种基因工程细胞,其特征在于,所述基因工程细胞的基因组的一个或多个位点整合有权利要求1所述的构建物,或者所述基因工程细胞中含有权利要求3所述的载体或载体组合。
5.一种试剂盒,其特征在于,所述试剂盒中包含的试剂选自下组中的一种或多种:
(a) 权利要求1所述的构建物;
(b) 权利要求3所述的载体或载体组合;和
(c) 权利要求4所述的基因工程细胞。
6.一种如权利要求1所述的构建物、权利要求3所述的载体或载体组合、权利要求4所述的基因工程细胞或权利要求5所述试剂盒的用途,其特征在于,用于进行高通量的体外蛋白合成。
7.一种体外高通量的外源蛋白合成方法,其特征在于,包括步骤:
(i) 在真核体外生物合成体系存在下,提供权利要求1所述的核酸构建物;
(ii) 在适合的条件下,孵育步骤(i)的真核体外生物合成体系一段时间T1,从而合成所述外源蛋白。
8.如权利要求7所述的方法,其特征在于,所述方法还包括:(iii)从所述真核体外生物合成体系中,分离或检测所述外源蛋白。
9.一种分离的多核苷酸,其特征在于,所述多核苷酸选自下组:
(a) 编码如SEQ ID NO:2所示多肽的多核苷酸;
(b) 序列如SEQ ID NO:1所示的多核苷酸;和
(c) 与(a)或(b)所述的多核苷酸互补的多核苷酸。
10.一种前导肽,其特征在于,所述前导肽为SEQ ID NO:2所示氨基酸序列的多肽。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810404013.3A CN110408636B (zh) | 2018-04-28 | 2018-04-28 | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201810404013.3A CN110408636B (zh) | 2018-04-28 | 2018-04-28 | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN110408636A CN110408636A (zh) | 2019-11-05 |
| CN110408636B true CN110408636B (zh) | 2021-07-30 |
Family
ID=68357171
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201810404013.3A Active CN110408636B (zh) | 2018-04-28 | 2018-04-28 | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN110408636B (zh) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN111484998B (zh) | 2019-05-30 | 2023-04-21 | 康码(上海)生物科技有限公司 | 体外定量共表达多种蛋白的方法及其应用 |
| CN112876536A (zh) * | 2019-11-30 | 2021-06-01 | 康码(上海)生物科技有限公司 | 一种多肽标签及其在体外蛋白合成中的应用 |
| US20230134868A1 (en) | 2019-11-30 | 2023-05-04 | Kangma-Healthcode (Shanghai) Biotech Co., Ltd | Biomagnetic microsphere and preparation method therefor and use thereof |
| CN116370335A (zh) | 2021-12-31 | 2023-07-04 | 康码(上海)生物科技有限公司 | 用于擦拭的病毒防护溶液以及病毒防护擦拭产品 |
| CN117683804A (zh) * | 2022-09-09 | 2024-03-12 | 康码(上海)生物科技有限公司 | 一种核酸构建物以及在ivtt体系中的应用 |
| CN117942275A (zh) * | 2022-10-31 | 2024-04-30 | 康码(上海)生物科技有限公司 | 一种基于病毒阻断剂的洗手液及其应用 |
| EP4628511A1 (en) | 2022-11-30 | 2025-10-08 | Kangma-Healthcode (Shanghai) Biotech Co., Ltd | Recombinant hemoglobin |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0366400A2 (en) * | 1988-10-26 | 1990-05-02 | Tonen Corporation | DNA encoding human serum albumin a (HSA), plasmids and hosts containing such DNA, and the production of HSA |
| WO2004007388A1 (fr) * | 2002-07-03 | 2004-01-22 | Saint-Gobain Glass France | Marquage de substrats traites thermiquement |
| CN105367662A (zh) * | 2014-08-29 | 2016-03-02 | 汤正好 | 一种hbv相关的融合蛋白、其制备方法及其应用 |
| CN106978349A (zh) * | 2016-09-30 | 2017-07-25 | 康码(上海)生物科技有限公司 | 一种体外蛋白质合成的试剂盒及其制备方法 |
-
2018
- 2018-04-28 CN CN201810404013.3A patent/CN110408636B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP0366400A2 (en) * | 1988-10-26 | 1990-05-02 | Tonen Corporation | DNA encoding human serum albumin a (HSA), plasmids and hosts containing such DNA, and the production of HSA |
| WO2004007388A1 (fr) * | 2002-07-03 | 2004-01-22 | Saint-Gobain Glass France | Marquage de substrats traites thermiquement |
| CN105367662A (zh) * | 2014-08-29 | 2016-03-02 | 汤正好 | 一种hbv相关的融合蛋白、其制备方法及其应用 |
| CN106978349A (zh) * | 2016-09-30 | 2017-07-25 | 康码(上海)生物科技有限公司 | 一种体外蛋白质合成的试剂盒及其制备方法 |
Non-Patent Citations (3)
| Title |
|---|
| "meiotic recombination protein 2 [Saccharomyces cerevisiae]",GenBank: AAA34772.1;Engebrecht,J.A. et al.;《GenBank》;19930427;第1页 * |
| Improved tandem affinity purification tag and methods for isolation of protein heterocomplexes from plants;Jai S Rohila et al.;《The Plant Journal》;20041231;第38卷;第172-181页 * |
| 串联亲和纯化中应用不同标签组合的研究进展;魏衍全等;《中国兽医科学》;20121231;第42卷(第09期);第987-990页 * |
Also Published As
| Publication number | Publication date |
|---|---|
| CN110408636A (zh) | 2019-11-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110408636B (zh) | 多重标签串联的dna序列及其在蛋白质表达纯化系统的应用 | |
| CN110408635B (zh) | 一种含有链霉亲和素元件的核酸构建物在蛋白质表达、纯化中的应用 | |
| CN113481226B (zh) | 信号肽相关序列及其在蛋白质合成中的应用 | |
| CN111778169B (zh) | 一种提高体外蛋白合成效率的方法 | |
| CN110551745A (zh) | 一种多重组氨酸序列标签及其在蛋白质表达、纯化中的应用 | |
| WO2010102085A4 (en) | Stabilized reverse transcriptase fusion proteins | |
| CN119391700A (zh) | 利用人工构建rna编辑酶进行rna定点编辑及相关应用 | |
| AU2020242724B2 (en) | Aminoacyl-tRNA synthetase for efficiently introducing lysine derivative in protein | |
| JP2020528760A (ja) | 新規融合タンパク質の調製およびそのタンパク質合成の向上における使用 | |
| US12286659B2 (en) | Tandem DNA element capable of enhancing protein synthesis efficiency | |
| JP2021525528A (ja) | Adhタンパク質ファミリー変異体およびその使用 | |
| CN114057861A (zh) | 一种靶向UBE2C的bio-PROTAC人工蛋白 | |
| CN119529023A (zh) | 一种增强无细胞体系蛋白质表达的信号肽及其在d2p中的应用 | |
| CN111718419B (zh) | 含有rna结合蛋白的融合蛋白及其配合使用的表达载体 | |
| EP4067492A1 (en) | Polypeptide tag and application thereof in in vitro protein synthesis | |
| WO2024051855A1 (zh) | 一种核酸构建物以及在ivtt体系中的应用 | |
| CN119530258A (zh) | 一种增强无细胞表达蛋白的dna元件及其在d2p中的应用 | |
| RU2790662C1 (ru) | АМИНОАЦИЛ-тРНК-СИНТЕТАЗА, ЭФФЕКТИВНОЕ ВВЕДЕНИЕ ПРОИЗВОДНЫХ ЛИЗИНА | |
| CN120380161A (zh) | 一种用于插入非天然氨基酸的体外无细胞蛋白质合成体系、方法及应用 | |
| CN120210144A (zh) | 一种改造的氨酰-tRNA合成酶、核酸构建物以及基因工程菌株 | |
| WO2025092824A1 (zh) | 一种基于tRNA改造的基因工程菌株及其制备方法和应用 | |
| HK40081975A (zh) | 一种多肽标签及其在体外蛋白合成中的应用 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: Multiple tag concatenated DNA sequences and their application in protein expression and purification systems Granted publication date: 20210730 Pledgee: China Construction Bank Corporation Shanghai Fengxian Branch Pledgor: KANGMA-HEATHCODE (SHANGHAI) BIOTECH Co.,Ltd. Registration number: Y2024980016719 |
|
| PE01 | Entry into force of the registration of the contract for pledge of patent right |