TW201127957A - Modified oil encapsulating proteins and uses thereof - Google Patents
Modified oil encapsulating proteins and uses thereof Download PDFInfo
- Publication number
- TW201127957A TW201127957A TW099137420A TW99137420A TW201127957A TW 201127957 A TW201127957 A TW 201127957A TW 099137420 A TW099137420 A TW 099137420A TW 99137420 A TW99137420 A TW 99137420A TW 201127957 A TW201127957 A TW 201127957A
- Authority
- TW
- Taiwan
- Prior art keywords
- oleosin
- plant
- modified
- polynucleotide
- oil
- Prior art date
Links
- 108090000623 proteins and genes Proteins 0.000 title claims description 174
- 102000004169 proteins and genes Human genes 0.000 title claims description 149
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 193
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 193
- 239000002157 polynucleotide Substances 0.000 claims abstract description 182
- 238000000034 method Methods 0.000 claims abstract description 167
- 235000018417 cysteine Nutrition 0.000 claims abstract description 117
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims abstract description 110
- 239000000203 mixture Substances 0.000 claims abstract description 36
- 241001465754 Metazoa Species 0.000 claims abstract description 22
- 239000002551 biofuel Substances 0.000 claims abstract description 13
- 238000000338 in vitro Methods 0.000 claims abstract description 6
- 101710089395 Oleosin Proteins 0.000 claims description 385
- 241000196324 Embryophyta Species 0.000 claims description 302
- 210000004027 cell Anatomy 0.000 claims description 182
- 235000018102 proteins Nutrition 0.000 claims description 146
- 150000003626 triacylglycerols Chemical class 0.000 claims description 103
- 150000002632 lipids Chemical class 0.000 claims description 85
- 230000014509 gene expression Effects 0.000 claims description 46
- 150000007523 nucleic acids Chemical group 0.000 claims description 45
- 108020001507 fusion proteins Proteins 0.000 claims description 43
- 102000037865 fusion proteins Human genes 0.000 claims description 43
- 108050004099 Diacylglycerol O-acyltransferase 1 Proteins 0.000 claims description 37
- 125000000151 cysteine group Chemical group N[C@@H](CS)C(=O)* 0.000 claims description 33
- 210000004899 c-terminal region Anatomy 0.000 claims description 32
- 238000004132 cross linking Methods 0.000 claims description 32
- 230000015572 biosynthetic process Effects 0.000 claims description 28
- 239000002253 acid Substances 0.000 claims description 27
- UFTFJSFQGQCHQW-UHFFFAOYSA-N triformin Chemical compound O=COCC(OC=O)COC=O UFTFJSFQGQCHQW-UHFFFAOYSA-N 0.000 claims description 26
- 230000002068 genetic effect Effects 0.000 claims description 25
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 24
- 102000039446 nucleic acids Human genes 0.000 claims description 24
- 108020004707 nucleic acids Proteins 0.000 claims description 24
- 102000003960 Ligases Human genes 0.000 claims description 21
- 108090000364 Ligases Proteins 0.000 claims description 21
- 239000000839 emulsion Substances 0.000 claims description 17
- 238000004519 manufacturing process Methods 0.000 claims description 17
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 claims description 12
- 230000004927 fusion Effects 0.000 claims description 12
- 150000003904 phospholipids Chemical class 0.000 claims description 12
- 230000001276 controlling effect Effects 0.000 claims description 8
- 239000000463 material Substances 0.000 claims description 8
- 230000001105 regulatory effect Effects 0.000 claims description 7
- 230000001580 bacterial effect Effects 0.000 claims description 6
- 241000238631 Hexapoda Species 0.000 claims description 5
- 241000282412 Homo Species 0.000 claims description 5
- 239000007788 liquid Substances 0.000 claims description 5
- 238000011068 loading method Methods 0.000 claims description 5
- 230000001131 transforming effect Effects 0.000 claims description 5
- 210000005253 yeast cell Anatomy 0.000 claims description 5
- 238000009472 formulation Methods 0.000 claims description 4
- 230000001939 inductive effect Effects 0.000 claims description 4
- 229960003151 mercaptamine Drugs 0.000 claims description 4
- 244000046052 Phaseolus vulgaris Species 0.000 claims description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 claims description 3
- 238000012258 culturing Methods 0.000 claims description 3
- UFULAYFCSOUIOV-UHFFFAOYSA-N cysteamine Chemical compound NCCS UFULAYFCSOUIOV-UHFFFAOYSA-N 0.000 claims description 3
- 230000002538 fungal effect Effects 0.000 claims description 3
- 235000016709 nutrition Nutrition 0.000 claims description 3
- 235000020777 polyunsaturated fatty acids Nutrition 0.000 claims description 3
- 239000002537 cosmetic Substances 0.000 claims description 2
- 230000008520 organization Effects 0.000 claims description 2
- 210000002784 stomach Anatomy 0.000 claims description 2
- 150000001945 cysteines Chemical class 0.000 claims 4
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 claims 1
- 229920000388 Polyphosphate Polymers 0.000 claims 1
- 229910052802 copper Inorganic materials 0.000 claims 1
- 239000010949 copper Substances 0.000 claims 1
- 239000000446 fuel Substances 0.000 claims 1
- 235000011187 glycerol Nutrition 0.000 claims 1
- 102000035118 modified proteins Human genes 0.000 claims 1
- 108091005573 modified proteins Proteins 0.000 claims 1
- 230000000050 nutritive effect Effects 0.000 claims 1
- 239000001205 polyphosphate Substances 0.000 claims 1
- 235000011176 polyphosphates Nutrition 0.000 claims 1
- 238000001727 in vivo Methods 0.000 abstract description 7
- 239000003921 oil Substances 0.000 description 240
- 235000019198 oils Nutrition 0.000 description 239
- 108090000765 processed proteins & peptides Proteins 0.000 description 158
- 239000002773 nucleotide Substances 0.000 description 121
- 125000003729 nucleotide group Chemical group 0.000 description 121
- 102000004196 processed proteins & peptides Human genes 0.000 description 89
- 229920001184 polypeptide Polymers 0.000 description 88
- 102100036869 Diacylglycerol O-acyltransferase 1 Human genes 0.000 description 85
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 82
- 101000927974 Homo sapiens Diacylglycerol O-acyltransferase 1 Proteins 0.000 description 69
- 235000003434 Sesamum indicum Nutrition 0.000 description 48
- 241000207961 Sesamum Species 0.000 description 43
- 241000894007 species Species 0.000 description 42
- 229930182558 Sterol Natural products 0.000 description 38
- 235000003702 sterols Nutrition 0.000 description 38
- 241000219194 Arabidopsis Species 0.000 description 37
- 108020004414 DNA Proteins 0.000 description 37
- 210000001519 tissue Anatomy 0.000 description 36
- 150000003432 sterols Chemical class 0.000 description 34
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 30
- 239000000523 sample Substances 0.000 description 28
- 239000011575 calcium Substances 0.000 description 27
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 25
- BTWMICVCQLKKNR-DCAQKATOSA-N Val-Leu-Ser Chemical compound CC(C)[C@H]([NH3+])C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C([O-])=O BTWMICVCQLKKNR-DCAQKATOSA-N 0.000 description 25
- 240000008042 Zea mays Species 0.000 description 25
- 229910052791 calcium Inorganic materials 0.000 description 25
- 235000014113 dietary fatty acids Nutrition 0.000 description 25
- 239000000194 fatty acid Substances 0.000 description 25
- 229930195729 fatty acid Natural products 0.000 description 25
- 230000009261 transgenic effect Effects 0.000 description 25
- 235000001014 amino acid Nutrition 0.000 description 24
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 23
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 23
- 150000004665 fatty acids Chemical class 0.000 description 23
- 108010050848 glycylleucine Proteins 0.000 description 23
- 230000009466 transformation Effects 0.000 description 23
- 241000219198 Brassica Species 0.000 description 21
- 230000035508 accumulation Effects 0.000 description 21
- 238000009825 accumulation Methods 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 21
- 230000000694 effects Effects 0.000 description 21
- 238000002290 gas chromatography-mass spectrometry Methods 0.000 description 21
- 230000002209 hydrophobic effect Effects 0.000 description 21
- 230000001965 increasing effect Effects 0.000 description 21
- 240000002791 Brassica napus Species 0.000 description 19
- 244000068988 Glycine max Species 0.000 description 19
- 150000001413 amino acids Chemical class 0.000 description 19
- 239000000872 buffer Substances 0.000 description 19
- 210000003000 inclusion body Anatomy 0.000 description 19
- 235000011293 Brassica napus Nutrition 0.000 description 18
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 18
- 239000012528 membrane Substances 0.000 description 17
- 235000010469 Glycine max Nutrition 0.000 description 16
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 16
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 16
- 238000007792 addition Methods 0.000 description 16
- 108010076324 alanyl-glycyl-glycine Proteins 0.000 description 16
- 238000005119 centrifugation Methods 0.000 description 16
- ZQPPMHVWECSIRJ-KTKRTIGZSA-N oleic acid group Chemical group C(CCCCCCC\C=C/CCCCCCCC)(=O)O ZQPPMHVWECSIRJ-KTKRTIGZSA-N 0.000 description 16
- 101100371686 Arabidopsis thaliana UBQ10 gene Proteins 0.000 description 15
- 240000007124 Brassica oleracea Species 0.000 description 15
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 15
- 108091026890 Coding region Proteins 0.000 description 15
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 15
- QSWKNJAPHQDAAS-MELADBBJSA-N Phe-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CC2=CC=CC=C2)N)C(=O)O QSWKNJAPHQDAAS-MELADBBJSA-N 0.000 description 15
- 102100035762 Diacylglycerol O-acyltransferase 2 Human genes 0.000 description 14
- 241000588724 Escherichia coli Species 0.000 description 14
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 14
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 14
- 101000930020 Homo sapiens Diacylglycerol O-acyltransferase 2 Proteins 0.000 description 14
- VDIARPPNADFEAV-WEDXCCLWSA-N Leu-Thr-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O VDIARPPNADFEAV-WEDXCCLWSA-N 0.000 description 14
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 14
- XSQUKJJJFZCRTK-UHFFFAOYSA-N Urea Chemical compound NC(N)=O XSQUKJJJFZCRTK-UHFFFAOYSA-N 0.000 description 14
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 14
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 14
- 239000003638 chemical reducing agent Substances 0.000 description 14
- 235000005822 corn Nutrition 0.000 description 14
- 239000000499 gel Substances 0.000 description 14
- 235000019333 sodium laurylsulphate Nutrition 0.000 description 14
- UGVQELHRNUDMAA-BYPYZUCNSA-N Gly-Ala-Gly Chemical compound [NH3+]CC(=O)N[C@@H](C)C(=O)NCC([O-])=O UGVQELHRNUDMAA-BYPYZUCNSA-N 0.000 description 13
- KXUZHWXENMYOHC-QEJZJMRPSA-N Phe-Leu-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O KXUZHWXENMYOHC-QEJZJMRPSA-N 0.000 description 13
- 239000012634 fragment Substances 0.000 description 13
- 238000009396 hybridization Methods 0.000 description 13
- 108010090894 prolylleucine Proteins 0.000 description 13
- 238000000746 purification Methods 0.000 description 13
- SOBIAADAMRHGKH-CIUDSAMLSA-N Ala-Leu-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O SOBIAADAMRHGKH-CIUDSAMLSA-N 0.000 description 12
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 12
- QOIGKCBMXUCDQU-KDXUFGMBSA-N Ala-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C)N)O QOIGKCBMXUCDQU-KDXUFGMBSA-N 0.000 description 12
- 235000003351 Brassica cretica Nutrition 0.000 description 12
- 235000003343 Brassica rupestris Nutrition 0.000 description 12
- 240000007594 Oryza sativa Species 0.000 description 12
- 235000007164 Oryza sativa Nutrition 0.000 description 12
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 12
- 108010087924 alanylproline Proteins 0.000 description 12
- QKSKPIVNLNLAAV-UHFFFAOYSA-N bis(2-chloroethyl) sulfide Chemical compound ClCCSCCCl QKSKPIVNLNLAAV-UHFFFAOYSA-N 0.000 description 12
- 235000010460 mustard Nutrition 0.000 description 12
- 210000002706 plastid Anatomy 0.000 description 12
- 235000009566 rice Nutrition 0.000 description 12
- 210000004767 rumen Anatomy 0.000 description 12
- 239000008159 sesame oil Substances 0.000 description 12
- 235000011803 sesame oil Nutrition 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 235000012905 Brassica oleracea var viridis Nutrition 0.000 description 11
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- 241000880493 Leptailurus serval Species 0.000 description 11
- GNLJXWBNLAIPEP-MELADBBJSA-N Lys-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCCCN)N)C(=O)O GNLJXWBNLAIPEP-MELADBBJSA-N 0.000 description 11
- DYEGCOJHFNJBKB-UFYCRDLUSA-N Tyr-Arg-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 DYEGCOJHFNJBKB-UFYCRDLUSA-N 0.000 description 11
- 229940088598 enzyme Drugs 0.000 description 11
- 108010077435 glycyl-phenylalanyl-glycine Proteins 0.000 description 11
- 239000010410 layer Substances 0.000 description 11
- 230000007935 neutral effect Effects 0.000 description 11
- 238000003752 polymerase chain reaction Methods 0.000 description 11
- 238000002360 preparation method Methods 0.000 description 11
- 108010053725 prolylvaline Proteins 0.000 description 11
- 241000219743 Lotus Species 0.000 description 10
- IMNFDUFMRHMDMM-UHFFFAOYSA-N N-Heptane Chemical compound CCCCCCC IMNFDUFMRHMDMM-UHFFFAOYSA-N 0.000 description 10
- IIEOLPMQYRBZCN-SRVKXCTJSA-N Phe-Ser-Cys Chemical compound N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O IIEOLPMQYRBZCN-SRVKXCTJSA-N 0.000 description 10
- CLNJSLSHKJECME-BQBZGAKWSA-N Pro-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H]1CCCN1 CLNJSLSHKJECME-BQBZGAKWSA-N 0.000 description 10
- TYVAWPFQYFPSBR-BFHQHQDPSA-N Thr-Ala-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)NCC(O)=O TYVAWPFQYFPSBR-BFHQHQDPSA-N 0.000 description 10
- 108090000190 Thrombin Proteins 0.000 description 10
- 244000042324 Trifolium repens Species 0.000 description 10
- 239000004202 carbamide Substances 0.000 description 10
- 238000003776 cleavage reaction Methods 0.000 description 10
- 235000021323 fish oil Nutrition 0.000 description 10
- 230000007017 scission Effects 0.000 description 10
- 238000006467 substitution reaction Methods 0.000 description 10
- 229960004072 thrombin Drugs 0.000 description 10
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 10
- 235000013540 Trifolium repens var repens Nutrition 0.000 description 9
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 9
- 125000003275 alpha amino acid group Chemical group 0.000 description 9
- 210000003763 chloroplast Anatomy 0.000 description 9
- 239000011536 extraction buffer Substances 0.000 description 9
- 235000009973 maize Nutrition 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 230000037361 pathway Effects 0.000 description 9
- 108010051242 phenylalanylserine Proteins 0.000 description 9
- 239000011780 sodium chloride Substances 0.000 description 9
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 235000011331 Brassica Nutrition 0.000 description 8
- 102000017278 Glutaredoxin Human genes 0.000 description 8
- 108050005205 Glutaredoxin Proteins 0.000 description 8
- 108010053070 Glutathione Disulfide Proteins 0.000 description 8
- PZUZIHRPOVVHOT-KBPBESRZSA-N His-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CN=CN1 PZUZIHRPOVVHOT-KBPBESRZSA-N 0.000 description 8
- WQWSMEOYXJTFRU-GUBZILKMSA-N Leu-Glu-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(O)=O WQWSMEOYXJTFRU-GUBZILKMSA-N 0.000 description 8
- 241000209082 Lolium Species 0.000 description 8
- STASJMBVVHNWCG-IHRRRGAJSA-N Pro-His-Leu Chemical compound C([C@@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)NC(=O)[C@H]1[NH2+]CCC1)C1=CN=CN1 STASJMBVVHNWCG-IHRRRGAJSA-N 0.000 description 8
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 8
- 229930006000 Sucrose Natural products 0.000 description 8
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 8
- 102000004903 Troponin Human genes 0.000 description 8
- 108090001027 Troponin Proteins 0.000 description 8
- 108010047495 alanylglycine Proteins 0.000 description 8
- 230000003043 biohydrogenation Effects 0.000 description 8
- 239000012530 fluid Substances 0.000 description 8
- 239000004459 forage Substances 0.000 description 8
- YPZRWBKMTBYPTK-BJDJZHNGSA-N glutathione disulfide Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@H](C(=O)NCC(O)=O)CSSC[C@@H](C(=O)NCC(O)=O)NC(=O)CC[C@H](N)C(O)=O YPZRWBKMTBYPTK-BJDJZHNGSA-N 0.000 description 8
- 238000010369 molecular cloning Methods 0.000 description 8
- 239000012071 phase Substances 0.000 description 8
- 239000008363 phosphate buffer Substances 0.000 description 8
- 239000005720 sucrose Substances 0.000 description 8
- 238000013519 translation Methods 0.000 description 8
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 7
- SVBXIUDNTRTKHE-CIUDSAMLSA-N Ala-Arg-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O SVBXIUDNTRTKHE-CIUDSAMLSA-N 0.000 description 7
- 241000219195 Arabidopsis thaliana Species 0.000 description 7
- 102000007590 Calpain Human genes 0.000 description 7
- 108010032088 Calpain Proteins 0.000 description 7
- 241000701489 Cauliflower mosaic virus Species 0.000 description 7
- WNGHUXFWEWTKAO-YUMQZZPRSA-N Gly-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN WNGHUXFWEWTKAO-YUMQZZPRSA-N 0.000 description 7
- ZZWUYQXMIFTIIY-WEDXCCLWSA-N Gly-Thr-Leu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O ZZWUYQXMIFTIIY-WEDXCCLWSA-N 0.000 description 7
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 7
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 description 7
- QRHWTCJBCLGYRB-FXQIFTODSA-N Met-Ala-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CS)C(O)=O QRHWTCJBCLGYRB-FXQIFTODSA-N 0.000 description 7
- YYEIFXZOBZVDPH-DCAQKATOSA-N Met-Lys-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O YYEIFXZOBZVDPH-DCAQKATOSA-N 0.000 description 7
- 102000035195 Peptidases Human genes 0.000 description 7
- 108091005804 Peptidases Proteins 0.000 description 7
- ROHDXJUFQVRDAV-UWVGGRQHSA-N Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 ROHDXJUFQVRDAV-UWVGGRQHSA-N 0.000 description 7
- -1 TAG sterol esters Chemical class 0.000 description 7
- 241000219793 Trifolium Species 0.000 description 7
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 7
- 108010041407 alanylaspartic acid Proteins 0.000 description 7
- 108010005233 alanylglutamic acid Proteins 0.000 description 7
- 230000000295 complement effect Effects 0.000 description 7
- 239000002299 complementary DNA Substances 0.000 description 7
- 235000013601 eggs Nutrition 0.000 description 7
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 7
- 238000003119 immunoblot Methods 0.000 description 7
- 210000000056 organ Anatomy 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000005215 recombination Methods 0.000 description 7
- 238000012552 review Methods 0.000 description 7
- 239000002689 soil Substances 0.000 description 7
- VGPWRRFOPXVGOH-BYPYZUCNSA-N Ala-Gly-Gly Chemical compound C[C@H](N)C(=O)NCC(=O)NCC(O)=O VGPWRRFOPXVGOH-BYPYZUCNSA-N 0.000 description 6
- 244000105624 Arachis hypogaea Species 0.000 description 6
- HEDRZPFGACZZDS-UHFFFAOYSA-N Chloroform Chemical compound ClC(Cl)Cl HEDRZPFGACZZDS-UHFFFAOYSA-N 0.000 description 6
- 108020004705 Codon Proteins 0.000 description 6
- 240000007154 Coffea arabica Species 0.000 description 6
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 6
- 101000842280 Drosophila melanogaster Protein HIRA homolog Proteins 0.000 description 6
- 108010067770 Endopeptidase K Proteins 0.000 description 6
- 240000005979 Hordeum vulgare Species 0.000 description 6
- 235000007340 Hordeum vulgare Nutrition 0.000 description 6
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 6
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 6
- OKKJLVBELUTLKV-UHFFFAOYSA-N Methanol Chemical compound OC OKKJLVBELUTLKV-UHFFFAOYSA-N 0.000 description 6
- HNFUGJUZJRYUHN-JSGCOSHPSA-N Phe-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 HNFUGJUZJRYUHN-JSGCOSHPSA-N 0.000 description 6
- XDKKMRPRRCOELJ-GUBZILKMSA-N Pro-Val-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C(C)C)NC(=O)[C@@H]1CCCN1 XDKKMRPRRCOELJ-GUBZILKMSA-N 0.000 description 6
- KHRLUIPIMIQFGT-AVGNSLFASA-N Pro-Val-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O KHRLUIPIMIQFGT-AVGNSLFASA-N 0.000 description 6
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 6
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 6
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 6
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 6
- 102000005488 Thioesterase Human genes 0.000 description 6
- IGROJMCBGRFRGI-YTLHQDLWSA-N Thr-Ala-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(O)=O IGROJMCBGRFRGI-YTLHQDLWSA-N 0.000 description 6
- QWMPARMKIDVBLV-VZFHVOOUSA-N Thr-Cys-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O QWMPARMKIDVBLV-VZFHVOOUSA-N 0.000 description 6
- SPVHQURZJCUDQC-VOAKCMCISA-N Thr-Lys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O SPVHQURZJCUDQC-VOAKCMCISA-N 0.000 description 6
- CKHWEVXPLJBEOZ-VQVTYTSYSA-N Thr-Val Chemical compound CC(C)[C@@H](C([O-])=O)NC(=O)[C@@H]([NH3+])[C@@H](C)O CKHWEVXPLJBEOZ-VQVTYTSYSA-N 0.000 description 6
- 241000219977 Vigna Species 0.000 description 6
- 230000015556 catabolic process Effects 0.000 description 6
- 239000002285 corn oil Substances 0.000 description 6
- 235000005687 corn oil Nutrition 0.000 description 6
- 238000013461 design Methods 0.000 description 6
- 238000001914 filtration Methods 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 230000003053 immunization Effects 0.000 description 6
- 238000002649 immunization Methods 0.000 description 6
- 238000003780 insertion Methods 0.000 description 6
- 230000037431 insertion Effects 0.000 description 6
- 239000000178 monomer Substances 0.000 description 6
- 230000002018 overexpression Effects 0.000 description 6
- 230000026731 phosphorylation Effects 0.000 description 6
- 238000006366 phosphorylation reaction Methods 0.000 description 6
- 239000000843 powder Substances 0.000 description 6
- 239000013615 primer Substances 0.000 description 6
- 239000002987 primer (paints) Substances 0.000 description 6
- 230000009758 senescence Effects 0.000 description 6
- 150000003431 steroids Chemical class 0.000 description 6
- 238000009482 thermal adhesion granulation Methods 0.000 description 6
- 108020002982 thioesterase Proteins 0.000 description 6
- 238000013518 transcription Methods 0.000 description 6
- 230000035897 transcription Effects 0.000 description 6
- 108010073969 valyllysine Proteins 0.000 description 6
- 235000015112 vegetable and seed oil Nutrition 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 102100022089 Acyl-[acyl-carrier-protein] hydrolase Human genes 0.000 description 5
- RDIKFPRVLJLMER-BQBZGAKWSA-N Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)N RDIKFPRVLJLMER-BQBZGAKWSA-N 0.000 description 5
- BLTRAARCJYVJKV-QEJZJMRPSA-N Ala-Lys-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](Cc1ccccc1)C(O)=O BLTRAARCJYVJKV-QEJZJMRPSA-N 0.000 description 5
- OINVDEKBKBCPLX-JXUBOQSCSA-N Ala-Lys-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OINVDEKBKBCPLX-JXUBOQSCSA-N 0.000 description 5
- OMSKGWFGWCQFBD-KZVJFYERSA-N Ala-Val-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OMSKGWFGWCQFBD-KZVJFYERSA-N 0.000 description 5
- 235000017060 Arachis glabrata Nutrition 0.000 description 5
- VKKYFICVTYKFIO-CIUDSAMLSA-N Arg-Ala-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N VKKYFICVTYKFIO-CIUDSAMLSA-N 0.000 description 5
- DJAIOAKQIOGULM-DCAQKATOSA-N Arg-Glu-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O DJAIOAKQIOGULM-DCAQKATOSA-N 0.000 description 5
- OERMIMJQPQUIPK-FXQIFTODSA-N Asp-Arg-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O OERMIMJQPQUIPK-FXQIFTODSA-N 0.000 description 5
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 5
- 108010039731 Fatty Acid Synthases Proteins 0.000 description 5
- IGOYNRWLWHWAQO-JTQLQIEISA-N Gly-Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 IGOYNRWLWHWAQO-JTQLQIEISA-N 0.000 description 5
- YABRDIBSPZONIY-BQBZGAKWSA-N Gly-Ser-Met Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CCSC)C(O)=O YABRDIBSPZONIY-BQBZGAKWSA-N 0.000 description 5
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 5
- XDIVYNSPYBLSME-DCAQKATOSA-N His-Met-Asp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N XDIVYNSPYBLSME-DCAQKATOSA-N 0.000 description 5
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 5
- WPTHAGXMYDRPFD-SRVKXCTJSA-N Met-Lys-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O WPTHAGXMYDRPFD-SRVKXCTJSA-N 0.000 description 5
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 5
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 5
- KPDRZQUWJKTMBP-DCAQKATOSA-N Pro-Asp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 KPDRZQUWJKTMBP-DCAQKATOSA-N 0.000 description 5
- ZMLRZBWCXPQADC-TUAOUCFPSA-N Pro-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@@H]2CCCN2 ZMLRZBWCXPQADC-TUAOUCFPSA-N 0.000 description 5
- 239000004365 Protease Substances 0.000 description 5
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 description 5
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 description 5
- 244000000231 Sesamum indicum Species 0.000 description 5
- 108700031397 Sesamum indicum oleosin Proteins 0.000 description 5
- SLLKXDSRVAOREO-KZVJFYERSA-N Val-Ala-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C)NC(=O)[C@H](C(C)C)N)O SLLKXDSRVAOREO-KZVJFYERSA-N 0.000 description 5
- XBJKAZATRJBDCU-GUBZILKMSA-N Val-Pro-Ala Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O XBJKAZATRJBDCU-GUBZILKMSA-N 0.000 description 5
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- 230000001086 cytosolic effect Effects 0.000 description 5
- 235000013365 dairy product Nutrition 0.000 description 5
- 239000000539 dimer Substances 0.000 description 5
- 235000013399 edible fruits Nutrition 0.000 description 5
- 239000003995 emulsifying agent Substances 0.000 description 5
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 239000000284 extract Substances 0.000 description 5
- 230000004136 fatty acid synthesis Effects 0.000 description 5
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 5
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 5
- 235000021374 legumes Nutrition 0.000 description 5
- 239000012160 loading buffer Substances 0.000 description 5
- 235000015097 nutrients Nutrition 0.000 description 5
- 239000007800 oxidant agent Substances 0.000 description 5
- 230000001590 oxidative effect Effects 0.000 description 5
- 235000020232 peanut Nutrition 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 235000019419 proteases Nutrition 0.000 description 5
- 108020003175 receptors Proteins 0.000 description 5
- 102000005962 receptors Human genes 0.000 description 5
- 230000009467 reduction Effects 0.000 description 5
- 239000002356 single layer Substances 0.000 description 5
- 239000000243 solution Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 150000003573 thiols Chemical group 0.000 description 5
- 238000011282 treatment Methods 0.000 description 5
- PHYFQTYBJUILEZ-IUPFWZBJSA-N triolein Chemical compound CCCCCCCC\C=C/CCCCCCCC(=O)OCC(OC(=O)CCCCCCC\C=C/CCCCCCCC)COC(=O)CCCCCCC\C=C/CCCCCCCC PHYFQTYBJUILEZ-IUPFWZBJSA-N 0.000 description 5
- 238000003260 vortexing Methods 0.000 description 5
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 4
- 229920001817 Agar Polymers 0.000 description 4
- JBVSSSZFNTXJDX-YTLHQDLWSA-N Ala-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@H](C)N JBVSSSZFNTXJDX-YTLHQDLWSA-N 0.000 description 4
- HWPXGQCMZITGFN-XVYDVKMFSA-N Ala-Cys-His Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HWPXGQCMZITGFN-XVYDVKMFSA-N 0.000 description 4
- 108700023425 Arabidopsis DGAT1 Proteins 0.000 description 4
- 235000010777 Arachis hypogaea Nutrition 0.000 description 4
- 235000018262 Arachis monticola Nutrition 0.000 description 4
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 4
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 4
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- PAWIVEIWWYGBAM-YUMQZZPRSA-N Gly-Leu-Ala Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O PAWIVEIWWYGBAM-YUMQZZPRSA-N 0.000 description 4
- 244000020551 Helianthus annuus Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- XVZCXCTYGHPNEM-UHFFFAOYSA-N Leu-Leu-Pro Natural products CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O XVZCXCTYGHPNEM-UHFFFAOYSA-N 0.000 description 4
- 102000004882 Lipase Human genes 0.000 description 4
- 108090001060 Lipase Proteins 0.000 description 4
- 239000004367 Lipase Substances 0.000 description 4
- VHGIWFGJIHTASW-FXQIFTODSA-N Met-Ala-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(O)=O VHGIWFGJIHTASW-FXQIFTODSA-N 0.000 description 4
- 241000283973 Oryctolagus cuniculus Species 0.000 description 4
- DRKAXLDECUGLFE-ULQDDVLXSA-N Pro-Leu-Phe Chemical compound CC(C)C[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O DRKAXLDECUGLFE-ULQDDVLXSA-N 0.000 description 4
- XSLXHSYIVPGEER-KZVJFYERSA-N Thr-Ala-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O XSLXHSYIVPGEER-KZVJFYERSA-N 0.000 description 4
- VPRHDRKAPYZMHL-SZMVWBNQSA-N Trp-Leu-Glu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O)=CNC2=C1 VPRHDRKAPYZMHL-SZMVWBNQSA-N 0.000 description 4
- 239000008272 agar Substances 0.000 description 4
- 230000032683 aging Effects 0.000 description 4
- 108010060035 arginylproline Proteins 0.000 description 4
- 230000004071 biological effect Effects 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 238000004945 emulsification Methods 0.000 description 4
- 210000003527 eukaryotic cell Anatomy 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 238000010353 genetic engineering Methods 0.000 description 4
- 230000035784 germination Effects 0.000 description 4
- 238000011534 incubation Methods 0.000 description 4
- 239000000543 intermediate Substances 0.000 description 4
- 230000014634 leaf senescence Effects 0.000 description 4
- 235000019421 lipase Nutrition 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 210000003463 organelle Anatomy 0.000 description 4
- 238000007254 oxidation reaction Methods 0.000 description 4
- 238000010647 peptide synthesis reaction Methods 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 229910052717 sulfur Inorganic materials 0.000 description 4
- 239000011593 sulfur Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 108010015666 tryptophyl-leucyl-glutamic acid Proteins 0.000 description 4
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 3
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid Chemical compound CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 3
- 102100039736 Adhesion G protein-coupled receptor L1 Human genes 0.000 description 3
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 3
- SMCGQGDVTPFXKB-XPUUQOCRSA-N Ala-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@H](C)N SMCGQGDVTPFXKB-XPUUQOCRSA-N 0.000 description 3
- AUFACLFHBAGZEN-ZLUOBGJFSA-N Ala-Ser-Cys Chemical compound N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)O AUFACLFHBAGZEN-ZLUOBGJFSA-N 0.000 description 3
- MMLHRUJLOUSRJX-CIUDSAMLSA-N Ala-Ser-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCCN MMLHRUJLOUSRJX-CIUDSAMLSA-N 0.000 description 3
- CGXQUULXFWRJOI-SRVKXCTJSA-N Arg-Val-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O CGXQUULXFWRJOI-SRVKXCTJSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 3
- 244000020518 Carthamus tinctorius Species 0.000 description 3
- RGJOEKWQDUBAIZ-IBOSZNHHSA-N CoASH Chemical compound O[C@@H]1[C@H](OP(O)(O)=O)[C@@H](COP(O)(=O)OP(O)(=O)OCC(C)(C)[C@@H](O)C(=O)NCCC(=O)NCCS)O[C@H]1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-IBOSZNHHSA-N 0.000 description 3
- 244000124209 Crocus sativus Species 0.000 description 3
- 101100136092 Drosophila melanogaster peng gene Proteins 0.000 description 3
- 239000005561 Glufosinate Substances 0.000 description 3
- RLFSBAPJTYKSLG-WHFBIAKZSA-N Gly-Ala-Asp Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(O)=O RLFSBAPJTYKSLG-WHFBIAKZSA-N 0.000 description 3
- HQRHFUYMGCHHJS-LURJTMIESA-N Gly-Gly-Arg Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCCN=C(N)N HQRHFUYMGCHHJS-LURJTMIESA-N 0.000 description 3
- DKEXFJVMVGETOO-LURJTMIESA-N Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CN DKEXFJVMVGETOO-LURJTMIESA-N 0.000 description 3
- FFJQHWKSGAWSTJ-BFHQHQDPSA-N Gly-Thr-Ala Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O FFJQHWKSGAWSTJ-BFHQHQDPSA-N 0.000 description 3
- 101000959588 Homo sapiens Adhesion G protein-coupled receptor L1 Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 3
- LEVWYRKDKASIDU-IMJSIDKUSA-N L-cystine Chemical compound [O-]C(=O)[C@@H]([NH3+])CSSC[C@H]([NH3+])C([O-])=O LEVWYRKDKASIDU-IMJSIDKUSA-N 0.000 description 3
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 3
- HYIFFZAQXPUEAU-QWRGUYRKSA-N Leu-Gly-Leu Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(C)C HYIFFZAQXPUEAU-QWRGUYRKSA-N 0.000 description 3
- BRTVHXHCUSXYRI-CIUDSAMLSA-N Leu-Ser-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O BRTVHXHCUSXYRI-CIUDSAMLSA-N 0.000 description 3
- 241000209510 Liliopsida Species 0.000 description 3
- FZIJIFCXUCZHOL-CIUDSAMLSA-N Lys-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN FZIJIFCXUCZHOL-CIUDSAMLSA-N 0.000 description 3
- 241000218922 Magnoliophyta Species 0.000 description 3
- 241000124008 Mammalia Species 0.000 description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 3
- 244000061176 Nicotiana tabacum Species 0.000 description 3
- 239000000020 Nitrocellulose Substances 0.000 description 3
- CMHTUJQZQXFNTQ-OEAJRASXSA-N Phe-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O CMHTUJQZQXFNTQ-OEAJRASXSA-N 0.000 description 3
- 240000004713 Pisum sativum Species 0.000 description 3
- 206010036790 Productive cough Diseases 0.000 description 3
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 3
- 241000220317 Rosa Species 0.000 description 3
- 240000000111 Saccharum officinarum Species 0.000 description 3
- 235000007201 Saccharum officinarum Nutrition 0.000 description 3
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 3
- GZSZPKSBVAOGIE-CIUDSAMLSA-N Ser-Lys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O GZSZPKSBVAOGIE-CIUDSAMLSA-N 0.000 description 3
- 239000006180 TBST buffer Substances 0.000 description 3
- 244000269722 Thea sinensis Species 0.000 description 3
- CAGTXGDOIFXLPC-KZVJFYERSA-N Thr-Arg-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CCCN=C(N)N CAGTXGDOIFXLPC-KZVJFYERSA-N 0.000 description 3
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 3
- 235000004424 Tropaeolum majus Nutrition 0.000 description 3
- 240000001260 Tropaeolum majus Species 0.000 description 3
- YQYFYUSYEDNLSD-YEPSODPASA-N Val-Thr-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O YQYFYUSYEDNLSD-YEPSODPASA-N 0.000 description 3
- AOILQMZPNLUXCM-AVGNSLFASA-N Val-Val-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCCN AOILQMZPNLUXCM-AVGNSLFASA-N 0.000 description 3
- 235000010726 Vigna sinensis Nutrition 0.000 description 3
- 239000004164 Wax ester Substances 0.000 description 3
- 241000209149 Zea Species 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- 108010070944 alanylhistidine Proteins 0.000 description 3
- 238000004873 anchoring Methods 0.000 description 3
- 239000012223 aqueous fraction Substances 0.000 description 3
- 108010013835 arginine glutamate Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 description 3
- 150000001720 carbohydrates Chemical class 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 230000003196 chaotropic effect Effects 0.000 description 3
- 239000003795 chemical substances by application Substances 0.000 description 3
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 3
- RGJOEKWQDUBAIZ-UHFFFAOYSA-N coenzime A Natural products OC1C(OP(O)(O)=O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 RGJOEKWQDUBAIZ-UHFFFAOYSA-N 0.000 description 3
- 239000005516 coenzyme A Substances 0.000 description 3
- 229940093530 coenzyme a Drugs 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- KDTSHFARGAKYJN-UHFFFAOYSA-N dephosphocoenzyme A Natural products OC1C(O)C(COP(O)(=O)OP(O)(=O)OCC(C)(C)C(O)C(=O)NCCC(=O)NCCS)OC1N1C2=NC=NC(N)=C2N=C1 KDTSHFARGAKYJN-UHFFFAOYSA-N 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 230000018109 developmental process Effects 0.000 description 3
- 238000010790 dilution Methods 0.000 description 3
- 239000012895 dilution Substances 0.000 description 3
- 238000005538 encapsulation Methods 0.000 description 3
- 241001233957 eudicotyledons Species 0.000 description 3
- 239000007789 gas Substances 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 150000002314 glycerols Chemical class 0.000 description 3
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 3
- 108010001064 glycyl-glycyl-glycyl-glycine Proteins 0.000 description 3
- 238000003306 harvesting Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000002347 injection Methods 0.000 description 3
- 239000007924 injection Substances 0.000 description 3
- 150000002500 ions Chemical class 0.000 description 3
- 108010034529 leucyl-lysine Proteins 0.000 description 3
- 230000033001 locomotion Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 108010005942 methionylglycine Proteins 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 229920001220 nitrocellulos Polymers 0.000 description 3
- 229910052757 nitrogen Inorganic materials 0.000 description 3
- 239000002777 nucleoside Substances 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 108010004914 prolylarginine Proteins 0.000 description 3
- 238000001742 protein purification Methods 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000035945 sensitivity Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 229910000029 sodium carbonate Inorganic materials 0.000 description 3
- 239000001488 sodium phosphate Substances 0.000 description 3
- 229910000162 sodium phosphate Inorganic materials 0.000 description 3
- 239000012064 sodium phosphate buffer Substances 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 235000012424 soybean oil Nutrition 0.000 description 3
- 239000003549 soybean oil Substances 0.000 description 3
- 210000003802 sputum Anatomy 0.000 description 3
- 208000024794 sputum Diseases 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000007704 transition Effects 0.000 description 3
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 229940088594 vitamin Drugs 0.000 description 3
- 239000011782 vitamin Substances 0.000 description 3
- 235000013343 vitamin Nutrition 0.000 description 3
- 229930003231 vitamin Natural products 0.000 description 3
- 150000003722 vitamin derivatives Chemical class 0.000 description 3
- 235000019386 wax ester Nutrition 0.000 description 3
- KPDTZVSUQCBOAE-HTFCKZLJSA-N (2s)-2-[[(2s)-1-[(2s)-2-[[(2s)-2-[[(2s)-2-aminopropanoyl]amino]propanoyl]amino]propanoyl]pyrrolidine-2-carbonyl]amino]propanoic acid Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O KPDTZVSUQCBOAE-HTFCKZLJSA-N 0.000 description 2
- QMOQBVOBWVNSNO-UHFFFAOYSA-N 2-[[2-[[2-[(2-azaniumylacetyl)amino]acetyl]amino]acetyl]amino]acetate Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(O)=O QMOQBVOBWVNSNO-UHFFFAOYSA-N 0.000 description 2
- 241000238876 Acari Species 0.000 description 2
- RLMISHABBKUNFO-WHFBIAKZSA-N Ala-Ala-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O RLMISHABBKUNFO-WHFBIAKZSA-N 0.000 description 2
- LSLIRHLIUDVNBN-CIUDSAMLSA-N Ala-Asp-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LSLIRHLIUDVNBN-CIUDSAMLSA-N 0.000 description 2
- WJRXVTCKASUIFF-FXQIFTODSA-N Ala-Cys-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WJRXVTCKASUIFF-FXQIFTODSA-N 0.000 description 2
- ZVFVBBGVOILKPO-WHFBIAKZSA-N Ala-Gly-Ala Chemical compound C[C@H](N)C(=O)NCC(=O)N[C@@H](C)C(O)=O ZVFVBBGVOILKPO-WHFBIAKZSA-N 0.000 description 2
- JDIQCVUDDFENPU-ZKWXMUAHSA-N Ala-His-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CNC=N1 JDIQCVUDDFENPU-ZKWXMUAHSA-N 0.000 description 2
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 2
- 235000017334 Alcea rosea Nutrition 0.000 description 2
- 240000000530 Alcea rosea Species 0.000 description 2
- 235000017303 Althaea rosea Nutrition 0.000 description 2
- 241001553178 Arachis glabrata Species 0.000 description 2
- 241000239290 Araneae Species 0.000 description 2
- XVLLUZMFSAYKJV-GUBZILKMSA-N Arg-Asp-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O XVLLUZMFSAYKJV-GUBZILKMSA-N 0.000 description 2
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 2
- OMKZPCPZEFMBIT-SRVKXCTJSA-N Arg-Met-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OMKZPCPZEFMBIT-SRVKXCTJSA-N 0.000 description 2
- AWMAZIIEFPFHCP-RCWTZXSCSA-N Arg-Pro-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O AWMAZIIEFPFHCP-RCWTZXSCSA-N 0.000 description 2
- PCKRJVZAQZWNKM-WHFBIAKZSA-N Asn-Asn-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O PCKRJVZAQZWNKM-WHFBIAKZSA-N 0.000 description 2
- FTNVLGCFIJEMQT-CIUDSAMLSA-N Asp-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CC(=O)O)N FTNVLGCFIJEMQT-CIUDSAMLSA-N 0.000 description 2
- BYLPQJAWXJWUCJ-YDHLFZDLSA-N Asp-Tyr-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O BYLPQJAWXJWUCJ-YDHLFZDLSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 235000018185 Betula X alpestris Nutrition 0.000 description 2
- 235000018212 Betula X uliginosa Nutrition 0.000 description 2
- 102000005701 Calcium-Binding Proteins Human genes 0.000 description 2
- 108010045403 Calcium-Binding Proteins Proteins 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 2
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 2
- 235000015655 Crocus sativus Nutrition 0.000 description 2
- SZQCDCKIGWQAQN-FXQIFTODSA-N Cys-Arg-Ala Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O SZQCDCKIGWQAQN-FXQIFTODSA-N 0.000 description 2
- XLLSMEFANRROJE-GUBZILKMSA-N Cys-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CS)N XLLSMEFANRROJE-GUBZILKMSA-N 0.000 description 2
- 101150042222 DGAT1 gene Proteins 0.000 description 2
- 102000053602 DNA Human genes 0.000 description 2
- 101710088194 Dehydrogenase Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 244000166124 Eucalyptus globulus Species 0.000 description 2
- 241000220485 Fabaceae Species 0.000 description 2
- AZKVWQKMDGGDSV-BCMRRPTOSA-N Genipin Chemical compound COC(=O)C1=CO[C@@H](O)[C@@H]2C(CO)=CC[C@H]12 AZKVWQKMDGGDSV-BCMRRPTOSA-N 0.000 description 2
- UTKUTMJSWKKHEM-WDSKDSINSA-N Glu-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O UTKUTMJSWKKHEM-WDSKDSINSA-N 0.000 description 2
- HPJLZFTUUJKWAJ-JHEQGTHGSA-N Glu-Gly-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O HPJLZFTUUJKWAJ-JHEQGTHGSA-N 0.000 description 2
- BPLNJYHNAJVLRT-ACZMJKKPSA-N Glu-Ser-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O BPLNJYHNAJVLRT-ACZMJKKPSA-N 0.000 description 2
- NNCSJUBVFBDDLC-YUMQZZPRSA-N Gly-Leu-Ser Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O NNCSJUBVFBDDLC-YUMQZZPRSA-N 0.000 description 2
- LNDVNHOSZQPJGI-AVGNSLFASA-N His-Pro-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNDVNHOSZQPJGI-AVGNSLFASA-N 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 2
- XBBKIIGCUMBKCO-JXUBOQSCSA-N Leu-Ala-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XBBKIIGCUMBKCO-JXUBOQSCSA-N 0.000 description 2
- WXHFZJFZWNCDNB-KKUMJFAQSA-N Leu-Asn-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXHFZJFZWNCDNB-KKUMJFAQSA-N 0.000 description 2
- IFMPDNRWZZEZSL-SRVKXCTJSA-N Leu-Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(O)=O IFMPDNRWZZEZSL-SRVKXCTJSA-N 0.000 description 2
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 2
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 2
- 239000000232 Lipid Bilayer Substances 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- RFQATBGBLDAKGI-VHSXEESVSA-N Lys-Gly-Pro Chemical compound C1C[C@@H](N(C1)C(=O)CNC(=O)[C@H](CCCCN)N)C(=O)O RFQATBGBLDAKGI-VHSXEESVSA-N 0.000 description 2
- YKBSXQFZWFXFIB-VOAKCMCISA-N Lys-Thr-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCCN)C(O)=O YKBSXQFZWFXFIB-VOAKCMCISA-N 0.000 description 2
- 239000004472 Lysine Substances 0.000 description 2
- 241001508691 Martes zibellina Species 0.000 description 2
- ONGCSGVHCSAATF-CIUDSAMLSA-N Met-Ala-Glu Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O ONGCSGVHCSAATF-CIUDSAMLSA-N 0.000 description 2
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 2
- 241000736262 Microbiota Species 0.000 description 2
- 102000007474 Multiprotein Complexes Human genes 0.000 description 2
- 108010085220 Multiprotein Complexes Proteins 0.000 description 2
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 2
- AUEJLPRZGVVDNU-UHFFFAOYSA-N N-L-tyrosyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CC1=CC=C(O)C=C1 AUEJLPRZGVVDNU-UHFFFAOYSA-N 0.000 description 2
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 108010079364 N-glycylalanine Proteins 0.000 description 2
- 102000004316 Oxidoreductases Human genes 0.000 description 2
- 108090000854 Oxidoreductases Proteins 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- GLUBLISJVJFHQS-VIFPVBQESA-N Phe-Gly Chemical compound OC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 GLUBLISJVJFHQS-VIFPVBQESA-N 0.000 description 2
- WWPAHTZOWURIMR-ULQDDVLXSA-N Phe-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC1=CC=CC=C1 WWPAHTZOWURIMR-ULQDDVLXSA-N 0.000 description 2
- NWVMQNAELALJFW-RNXOBYDBSA-N Phe-Trp-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NWVMQNAELALJFW-RNXOBYDBSA-N 0.000 description 2
- ISWSIDIOOBJBQZ-UHFFFAOYSA-N Phenol Chemical compound OC1=CC=CC=C1 ISWSIDIOOBJBQZ-UHFFFAOYSA-N 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- HMNSRTLZAJHSIK-YUMQZZPRSA-N Pro-Arg Chemical compound NC(=N)NCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 HMNSRTLZAJHSIK-YUMQZZPRSA-N 0.000 description 2
- KWMZPPWYBVZIER-XGEHTFHBSA-N Pro-Ser-Thr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KWMZPPWYBVZIER-XGEHTFHBSA-N 0.000 description 2
- VDHGTOHMHHQSKG-JYJNAYRXSA-N Pro-Val-Phe Chemical compound CC(C)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](Cc1ccccc1)C(O)=O VDHGTOHMHHQSKG-JYJNAYRXSA-N 0.000 description 2
- 238000012228 RNA interference-mediated gene silencing Methods 0.000 description 2
- 235000019484 Rapeseed oil Nutrition 0.000 description 2
- 108700008625 Reporter Genes Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- BKOKTRCZXRIQPX-ZLUOBGJFSA-N Ser-Ala-Cys Chemical compound C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CO)N BKOKTRCZXRIQPX-ZLUOBGJFSA-N 0.000 description 2
- KCFKKAQKRZBWJB-ZLUOBGJFSA-N Ser-Cys-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O KCFKKAQKRZBWJB-ZLUOBGJFSA-N 0.000 description 2
- VMLONWHIORGALA-SRVKXCTJSA-N Ser-Leu-Leu Chemical compound CC(C)C[C@@H](C([O-])=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CO VMLONWHIORGALA-SRVKXCTJSA-N 0.000 description 2
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 2
- JZRYFUGREMECBH-XPUUQOCRSA-N Ser-Val-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O JZRYFUGREMECBH-XPUUQOCRSA-N 0.000 description 2
- ANOQEBQWIAYIMV-AEJSXWLSSA-N Ser-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CO)N ANOQEBQWIAYIMV-AEJSXWLSSA-N 0.000 description 2
- 235000009367 Sesamum alatum Nutrition 0.000 description 2
- 244000044822 Simmondsia californica Species 0.000 description 2
- 235000004433 Simmondsia californica Nutrition 0.000 description 2
- PMZURENOXWZQFD-UHFFFAOYSA-L Sodium Sulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=O PMZURENOXWZQFD-UHFFFAOYSA-L 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- BSNZTJXVDOINSR-JXUBOQSCSA-N Thr-Ala-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O BSNZTJXVDOINSR-JXUBOQSCSA-N 0.000 description 2
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 2
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 2
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 2
- GXDLGHLJTHMDII-WISUUJSJSA-N Thr-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CO)C(O)=O GXDLGHLJTHMDII-WISUUJSJSA-N 0.000 description 2
- 108091023040 Transcription factor Proteins 0.000 description 2
- 102000040945 Transcription factor Human genes 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 239000007983 Tris buffer Substances 0.000 description 2
- CNNVVEPJTFOGHI-ACRUOGEOSA-N Tyr-Lys-Tyr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CNNVVEPJTFOGHI-ACRUOGEOSA-N 0.000 description 2
- ZLFHAAGHGQBQQN-GUBZILKMSA-N Val-Ala-Pro Natural products CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O ZLFHAAGHGQBQQN-GUBZILKMSA-N 0.000 description 2
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 2
- KISFXYYRKKNLOP-IHRRRGAJSA-N Val-Phe-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)O)N KISFXYYRKKNLOP-IHRRRGAJSA-N 0.000 description 2
- CEKSLIVSNNGOKH-KZVJFYERSA-N Val-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](C(C)C)N)O CEKSLIVSNNGOKH-KZVJFYERSA-N 0.000 description 2
- ZLMFVXMJFIWIRE-FHWLQOOXSA-N Val-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](C(C)C)N ZLMFVXMJFIWIRE-FHWLQOOXSA-N 0.000 description 2
- 235000013832 Valeriana officinalis Nutrition 0.000 description 2
- 244000126014 Valeriana officinalis Species 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 239000013543 active substance Substances 0.000 description 2
- 238000005054 agglomeration Methods 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 108010069926 arginyl-glycyl-serine Proteins 0.000 description 2
- 108010068380 arginylarginine Proteins 0.000 description 2
- 235000003704 aspartic acid Nutrition 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 238000009395 breeding Methods 0.000 description 2
- 235000009120 camo Nutrition 0.000 description 2
- 235000005607 chanvre indien Nutrition 0.000 description 2
- 238000002983 circular dichroism Methods 0.000 description 2
- 230000004186 co-expression Effects 0.000 description 2
- 238000004581 coalescence Methods 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000004883 computer application Methods 0.000 description 2
- 238000006482 condensation reaction Methods 0.000 description 2
- 238000001816 cooling Methods 0.000 description 2
- 239000010779 crude oil Substances 0.000 description 2
- XVOYSCVBGLVSOL-UHFFFAOYSA-N cysteic acid Chemical compound OC(=O)C(N)CS(O)(=O)=O XVOYSCVBGLVSOL-UHFFFAOYSA-N 0.000 description 2
- 108010016616 cysteinylglycine Proteins 0.000 description 2
- 229960003067 cystine Drugs 0.000 description 2
- 210000000805 cytoplasm Anatomy 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- MWKFXSUHUHTGQN-UHFFFAOYSA-N decan-1-ol Chemical compound CCCCCCCCCCO MWKFXSUHUHTGQN-UHFFFAOYSA-N 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 239000003623 enhancer Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000032050 esterification Effects 0.000 description 2
- 238000005886 esterification reaction Methods 0.000 description 2
- 239000012467 final product Substances 0.000 description 2
- 239000005357 flat glass Substances 0.000 description 2
- 230000002431 foraging effect Effects 0.000 description 2
- 235000021588 free fatty acids Nutrition 0.000 description 2
- 230000008014 freezing Effects 0.000 description 2
- 238000007710 freezing Methods 0.000 description 2
- 229930182830 galactose Natural products 0.000 description 2
- 230000030279 gene silencing Effects 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 238000012226 gene silencing method Methods 0.000 description 2
- AZKVWQKMDGGDSV-UHFFFAOYSA-N genipin Natural products COC(=O)C1=COC(O)C2C(CO)=CCC12 AZKVWQKMDGGDSV-UHFFFAOYSA-N 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010081551 glycylphenylalanine Proteins 0.000 description 2
- 108010084389 glycyltryptophan Proteins 0.000 description 2
- 108010037850 glycylvaline Proteins 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- VNSFGLSIVSOPEC-UHFFFAOYSA-N guanidine;urea Chemical compound NC(N)=N.NC(N)=O VNSFGLSIVSOPEC-UHFFFAOYSA-N 0.000 description 2
- 239000001307 helium Substances 0.000 description 2
- 229910052734 helium Inorganic materials 0.000 description 2
- SWQJXJOGLNCZEY-UHFFFAOYSA-N helium atom Chemical compound [He] SWQJXJOGLNCZEY-UHFFFAOYSA-N 0.000 description 2
- 239000011487 hemp Substances 0.000 description 2
- 108010040030 histidinoalanine Proteins 0.000 description 2
- 108010085325 histidylproline Proteins 0.000 description 2
- 238000000265 homogenisation Methods 0.000 description 2
- 230000007062 hydrolysis Effects 0.000 description 2
- 238000006460 hydrolysis reaction Methods 0.000 description 2
- 230000001900 immune effect Effects 0.000 description 2
- 238000005470 impregnation Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 239000002054 inoculum Substances 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 235000020978 long-chain polyunsaturated fatty acids Nutrition 0.000 description 2
- 230000014759 maintenance of location Effects 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 238000004949 mass spectrometry Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 235000013622 meat product Nutrition 0.000 description 2
- 230000001404 mediated effect Effects 0.000 description 2
- 210000000473 mesophyll cell Anatomy 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 108010085203 methionylmethionine Proteins 0.000 description 2
- 235000013336 milk Nutrition 0.000 description 2
- 239000008267 milk Substances 0.000 description 2
- 210000004080 milk Anatomy 0.000 description 2
- 239000013642 negative control Substances 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 229960005489 paracetamol Drugs 0.000 description 2
- 239000003415 peat Substances 0.000 description 2
- 230000000704 physical effect Effects 0.000 description 2
- 230000008635 plant growth Effects 0.000 description 2
- 230000037039 plant physiology Effects 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 2
- 230000008488 polyadenylation Effects 0.000 description 2
- 238000006116 polymerization reaction Methods 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 230000000750 progressive effect Effects 0.000 description 2
- 108010031719 prolyl-serine Proteins 0.000 description 2
- 108010070643 prolylglutamic acid Proteins 0.000 description 2
- 108010029020 prolylglycine Proteins 0.000 description 2
- 230000007115 recruitment Effects 0.000 description 2
- 238000004064 recycling Methods 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 235000013974 saffron Nutrition 0.000 description 2
- 239000004248 saffron Substances 0.000 description 2
- 239000012723 sample buffer Substances 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 229920006395 saturated elastomer Polymers 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 108010026333 seryl-proline Proteins 0.000 description 2
- 230000001568 sexual effect Effects 0.000 description 2
- 239000004460 silage Substances 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 229910052938 sodium sulfate Inorganic materials 0.000 description 2
- 239000007790 solid phase Substances 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 230000035882 stress Effects 0.000 description 2
- 235000000346 sugar Nutrition 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 230000000699 topical effect Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 239000013638 trimer Substances 0.000 description 2
- 238000005829 trimerization reaction Methods 0.000 description 2
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 2
- 108010080629 tryptophan-leucine Proteins 0.000 description 2
- 108010078580 tyrosylleucine Proteins 0.000 description 2
- 235000016788 valerian Nutrition 0.000 description 2
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 1
- GJLXVWOMRRWCIB-MERZOTPQSA-N (2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-acetamido-5-(diaminomethylideneamino)pentanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-3-(4-hydroxyphenyl)propanoyl]amino]-5-(diaminomethylideneamino)pentanoyl]amino]-3-(1H-indol-3-yl)propanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanoyl]amino]-6-aminohexanamide Chemical compound C([C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)C)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(N)=O)C1=CC=C(O)C=C1 GJLXVWOMRRWCIB-MERZOTPQSA-N 0.000 description 1
- XVZCXCTYGHPNEM-IHRRRGAJSA-N (2s)-1-[(2s)-2-[[(2s)-2-amino-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(O)=O XVZCXCTYGHPNEM-IHRRRGAJSA-N 0.000 description 1
- HKZAAJSTFUZYTO-LURJTMIESA-N (2s)-2-[[2-[[2-[[2-[(2-aminoacetyl)amino]acetyl]amino]acetyl]amino]acetyl]amino]-3-hydroxypropanoic acid Chemical compound NCC(=O)NCC(=O)NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O HKZAAJSTFUZYTO-LURJTMIESA-N 0.000 description 1
- PORPENFLTBBHSG-MGBGTMOVSA-N 1,2-dihexadecanoyl-sn-glycerol-3-phosphate Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP(O)(O)=O)OC(=O)CCCCCCCCCCCCCCC PORPENFLTBBHSG-MGBGTMOVSA-N 0.000 description 1
- RTBFRGCFXZNCOE-UHFFFAOYSA-N 1-methylsulfonylpiperidin-4-one Chemical compound CS(=O)(=O)N1CCC(=O)CC1 RTBFRGCFXZNCOE-UHFFFAOYSA-N 0.000 description 1
- HEWZVZIVELJPQZ-UHFFFAOYSA-N 2,2-dimethoxypropane Chemical compound COC(C)(C)OC HEWZVZIVELJPQZ-UHFFFAOYSA-N 0.000 description 1
- HXUVTXPOZRFMOY-NSHDSACASA-N 2-[[(2s)-2-[[2-[(2-aminoacetyl)amino]acetyl]amino]-3-phenylpropanoyl]amino]acetic acid Chemical compound NCC(=O)NCC(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 HXUVTXPOZRFMOY-NSHDSACASA-N 0.000 description 1
- BZSXEZOLBIJVQK-UHFFFAOYSA-N 2-methylsulfonylbenzoic acid Chemical compound CS(=O)(=O)C1=CC=CC=C1C(O)=O BZSXEZOLBIJVQK-UHFFFAOYSA-N 0.000 description 1
- 101710168795 3-oxoacyl-[acyl-carrier-protein] synthase 1 Proteins 0.000 description 1
- 108050003185 3-oxoacyl-[acyl-carrier-protein] synthase 2 Proteins 0.000 description 1
- 101710168866 3-oxoacyl-[acyl-carrier-protein] synthase 3 Proteins 0.000 description 1
- 101710158551 3-oxoacyl-[acyl-carrier-protein] synthase I, chloroplastic Proteins 0.000 description 1
- 101710130360 3-oxoacyl-[acyl-carrier-protein] synthase III, chloroplastic Proteins 0.000 description 1
- 101150096316 5 gene Proteins 0.000 description 1
- QCVGEOXPDFCNHA-UHFFFAOYSA-N 5,5-dimethyl-2,4-dioxo-1,3-oxazolidine-3-carboxamide Chemical compound CC1(C)OC(=O)N(C(N)=O)C1=O QCVGEOXPDFCNHA-UHFFFAOYSA-N 0.000 description 1
- 102000005416 ATP-Binding Cassette Transporters Human genes 0.000 description 1
- 108010006533 ATP-Binding Cassette Transporters Proteins 0.000 description 1
- 244000298697 Actinidia deliciosa Species 0.000 description 1
- 102100027841 Acyl-CoA wax alcohol acyltransferase 2 Human genes 0.000 description 1
- 101710104255 Acyl-CoA wax alcohol acyltransferase 2 Proteins 0.000 description 1
- 102100036791 Adhesion G protein-coupled receptor L2 Human genes 0.000 description 1
- TWCMVXMQHSVIOJ-UHFFFAOYSA-N Aglycone of yadanzioside D Natural products COC(=O)C12OCC34C(CC5C(=CC(O)C(O)C5(C)C3C(O)C1O)C)OC(=O)C(OC(=O)C)C24 TWCMVXMQHSVIOJ-UHFFFAOYSA-N 0.000 description 1
- 241000589158 Agrobacterium Species 0.000 description 1
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 1
- JAMAWBXXKFGFGX-KZVJFYERSA-N Ala-Arg-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O JAMAWBXXKFGFGX-KZVJFYERSA-N 0.000 description 1
- YAXNATKKPOWVCP-ZLUOBGJFSA-N Ala-Asn-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O YAXNATKKPOWVCP-ZLUOBGJFSA-N 0.000 description 1
- GORKKVHIBWAQHM-GCJQMDKQSA-N Ala-Asn-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O GORKKVHIBWAQHM-GCJQMDKQSA-N 0.000 description 1
- BVSGPHDECMJBDE-HGNGGELXSA-N Ala-Glu-His Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N BVSGPHDECMJBDE-HGNGGELXSA-N 0.000 description 1
- HMRWQTHUDVXMGH-GUBZILKMSA-N Ala-Glu-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN HMRWQTHUDVXMGH-GUBZILKMSA-N 0.000 description 1
- VBRDBGCROKWTPV-XHNCKOQMSA-N Ala-Glu-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N VBRDBGCROKWTPV-XHNCKOQMSA-N 0.000 description 1
- CXISPYVYMQWFLE-VKHMYHEASA-N Ala-Gly Chemical compound C[C@H]([NH3+])C(=O)NCC([O-])=O CXISPYVYMQWFLE-VKHMYHEASA-N 0.000 description 1
- BEMGNWZECGIJOI-WDSKDSINSA-N Ala-Gly-Glu Chemical compound [H]N[C@@H](C)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O BEMGNWZECGIJOI-WDSKDSINSA-N 0.000 description 1
- ZPXCNXMJEZKRLU-LSJOCFKGSA-N Ala-His-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CN=CN1 ZPXCNXMJEZKRLU-LSJOCFKGSA-N 0.000 description 1
- 108010076441 Ala-His-His Proteins 0.000 description 1
- ATAKEVCGTRZKLI-UWJYBYFXSA-N Ala-His-His Chemical compound C([C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 ATAKEVCGTRZKLI-UWJYBYFXSA-N 0.000 description 1
- CCDFBRZVTDDJNM-GUBZILKMSA-N Ala-Leu-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O CCDFBRZVTDDJNM-GUBZILKMSA-N 0.000 description 1
- MNZHHDPWDWQJCQ-YUMQZZPRSA-N Ala-Leu-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O MNZHHDPWDWQJCQ-YUMQZZPRSA-N 0.000 description 1
- OPZJWMJPCNNZNT-DCAQKATOSA-N Ala-Leu-Met Chemical compound C[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)O)N OPZJWMJPCNNZNT-DCAQKATOSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- LDLSENBXQNDTPB-DCAQKATOSA-N Ala-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LDLSENBXQNDTPB-DCAQKATOSA-N 0.000 description 1
- MFMDKJIPHSWSBM-GUBZILKMSA-N Ala-Lys-Glu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O MFMDKJIPHSWSBM-GUBZILKMSA-N 0.000 description 1
- JWUZOJXDJDEQEM-ZLIFDBKOSA-N Ala-Lys-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C)C(O)=O)=CNC2=C1 JWUZOJXDJDEQEM-ZLIFDBKOSA-N 0.000 description 1
- YCRAFFCYWOUEOF-DLOVCJGASA-N Ala-Phe-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 YCRAFFCYWOUEOF-DLOVCJGASA-N 0.000 description 1
- IPZQNYYAYVRKKK-FXQIFTODSA-N Ala-Pro-Ala Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C)C(O)=O IPZQNYYAYVRKKK-FXQIFTODSA-N 0.000 description 1
- BTRULDJUUVGRNE-DCAQKATOSA-N Ala-Pro-Lys Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(O)=O BTRULDJUUVGRNE-DCAQKATOSA-N 0.000 description 1
- OLVCTPPSXNRGKV-GUBZILKMSA-N Ala-Pro-Pro Chemical compound C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N1[C@H](C(O)=O)CCC1 OLVCTPPSXNRGKV-GUBZILKMSA-N 0.000 description 1
- IPWKGIFRRBGCJO-IMJSIDKUSA-N Ala-Ser Chemical compound C[C@H]([NH3+])C(=O)N[C@@H](CO)C([O-])=O IPWKGIFRRBGCJO-IMJSIDKUSA-N 0.000 description 1
- RTZCUEHYUQZIDE-WHFBIAKZSA-N Ala-Ser-Gly Chemical compound C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RTZCUEHYUQZIDE-WHFBIAKZSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- NCQMBSJGJMYKCK-ZLUOBGJFSA-N Ala-Ser-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O NCQMBSJGJMYKCK-ZLUOBGJFSA-N 0.000 description 1
- ARHJJAAWNWOACN-FXQIFTODSA-N Ala-Ser-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O ARHJJAAWNWOACN-FXQIFTODSA-N 0.000 description 1
- BUQICHWNXBIBOG-LMVFSUKVSA-N Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)N BUQICHWNXBIBOG-LMVFSUKVSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- WNHNMKOFKCHKKD-BFHQHQDPSA-N Ala-Thr-Gly Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O WNHNMKOFKCHKKD-BFHQHQDPSA-N 0.000 description 1
- JJHBEVZAZXZREW-LFSVMHDDSA-N Ala-Thr-Phe Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](C)N)C(=O)N[C@@H](Cc1ccccc1)C(O)=O JJHBEVZAZXZREW-LFSVMHDDSA-N 0.000 description 1
- XSLGWYYNOSUMRM-ZKWXMUAHSA-N Ala-Val-Asn Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O XSLGWYYNOSUMRM-ZKWXMUAHSA-N 0.000 description 1
- DHONNEYAZPNGSG-UBHSHLNASA-N Ala-Val-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DHONNEYAZPNGSG-UBHSHLNASA-N 0.000 description 1
- NLYYHIKRBRMAJV-AEJSXWLSSA-N Ala-Val-Pro Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N NLYYHIKRBRMAJV-AEJSXWLSSA-N 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 101100438273 Arabidopsis thaliana CAN1 gene Proteins 0.000 description 1
- 101100499137 Arabidopsis thaliana DGAT1 gene Proteins 0.000 description 1
- 101100049737 Arabidopsis thaliana WRI1 gene Proteins 0.000 description 1
- 235000019054 Arachis glabrata var glabrata Nutrition 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- OTOXOKCIIQLMFH-KZVJFYERSA-N Arg-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCCN=C(N)N OTOXOKCIIQLMFH-KZVJFYERSA-N 0.000 description 1
- OMLWNBVRVJYMBQ-YUMQZZPRSA-N Arg-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O OMLWNBVRVJYMBQ-YUMQZZPRSA-N 0.000 description 1
- SYAUZLVLXCDRSH-IUCAKERBSA-N Arg-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCCN=C(N)N)N SYAUZLVLXCDRSH-IUCAKERBSA-N 0.000 description 1
- WVNFNPGXYADPPO-BQBZGAKWSA-N Arg-Gly-Ser Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O WVNFNPGXYADPPO-BQBZGAKWSA-N 0.000 description 1
- IRRMIGDCPOPZJW-ULQDDVLXSA-N Arg-His-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O IRRMIGDCPOPZJW-ULQDDVLXSA-N 0.000 description 1
- ZDBWKBCKYJGKGP-DCAQKATOSA-N Arg-Leu-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O ZDBWKBCKYJGKGP-DCAQKATOSA-N 0.000 description 1
- YBZMTKUDWXZLIX-UWVGGRQHSA-N Arg-Leu-Gly Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YBZMTKUDWXZLIX-UWVGGRQHSA-N 0.000 description 1
- NGTYEHIRESTSRX-UWVGGRQHSA-N Arg-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N NGTYEHIRESTSRX-UWVGGRQHSA-N 0.000 description 1
- NPAVRDPEFVKELR-DCAQKATOSA-N Arg-Lys-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NPAVRDPEFVKELR-DCAQKATOSA-N 0.000 description 1
- VIINVRPKMUZYOI-DCAQKATOSA-N Arg-Met-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(O)=O)C(O)=O VIINVRPKMUZYOI-DCAQKATOSA-N 0.000 description 1
- NYDIVDKTULRINZ-AVGNSLFASA-N Arg-Met-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NYDIVDKTULRINZ-AVGNSLFASA-N 0.000 description 1
- DTBPLQNKYCYUOM-JYJNAYRXSA-N Arg-Met-Phe Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DTBPLQNKYCYUOM-JYJNAYRXSA-N 0.000 description 1
- RFNDQEWMNJMQHD-SZMVWBNQSA-N Arg-Met-Trp Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RFNDQEWMNJMQHD-SZMVWBNQSA-N 0.000 description 1
- MNBHKGYCLBUIBC-UFYCRDLUSA-N Arg-Phe-Phe Chemical compound C([C@H](NC(=O)[C@H](CCCNC(N)=N)N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MNBHKGYCLBUIBC-UFYCRDLUSA-N 0.000 description 1
- LQJAALCCPOTJGB-YUMQZZPRSA-N Arg-Pro Chemical compound NC(N)=NCCC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O LQJAALCCPOTJGB-YUMQZZPRSA-N 0.000 description 1
- JJIBHAOBNIFUEL-SRVKXCTJSA-N Arg-Pro-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CCCN=C(N)N)N JJIBHAOBNIFUEL-SRVKXCTJSA-N 0.000 description 1
- IJYZHIOOBGIINM-WDSKDSINSA-N Arg-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCN=C(N)N IJYZHIOOBGIINM-WDSKDSINSA-N 0.000 description 1
- KMFPQTITXUKJOV-DCAQKATOSA-N Arg-Ser-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O KMFPQTITXUKJOV-DCAQKATOSA-N 0.000 description 1
- WCZXPVPHUMYLMS-VEVYYDQMSA-N Arg-Thr-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O WCZXPVPHUMYLMS-VEVYYDQMSA-N 0.000 description 1
- ZJBUILVYSXQNSW-YTWAJWBKSA-N Arg-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)O ZJBUILVYSXQNSW-YTWAJWBKSA-N 0.000 description 1
- PJOPLXOCKACMLK-KKUMJFAQSA-N Arg-Tyr-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O PJOPLXOCKACMLK-KKUMJFAQSA-N 0.000 description 1
- 239000004475 Arginine Chemical group 0.000 description 1
- 240000003291 Armoracia rusticana Species 0.000 description 1
- 239000000592 Artificial Cell Substances 0.000 description 1
- RZVVKNIACROXRM-ZLUOBGJFSA-N Asn-Ala-Asp Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N RZVVKNIACROXRM-ZLUOBGJFSA-N 0.000 description 1
- NPDLYUOYAGBHFB-WDSKDSINSA-N Asn-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NPDLYUOYAGBHFB-WDSKDSINSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- XVVOVPFMILMHPX-ZLUOBGJFSA-N Asn-Asp-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O XVVOVPFMILMHPX-ZLUOBGJFSA-N 0.000 description 1
- PNHQRQTVBRDIEF-CIUDSAMLSA-N Asn-Leu-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CC(=O)N)N PNHQRQTVBRDIEF-CIUDSAMLSA-N 0.000 description 1
- NLRJGXZWTKXRHP-DCAQKATOSA-N Asn-Leu-Arg Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NLRJGXZWTKXRHP-DCAQKATOSA-N 0.000 description 1
- UHGUKCOQUNPSKK-CIUDSAMLSA-N Asn-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N UHGUKCOQUNPSKK-CIUDSAMLSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- WCRQQIPFSXFIRN-LPEHRKFASA-N Asn-Met-Pro Chemical compound CSCC[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N WCRQQIPFSXFIRN-LPEHRKFASA-N 0.000 description 1
- GADKFYNESXNRLC-WDSKDSINSA-N Asn-Pro Chemical compound NC(=O)C[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GADKFYNESXNRLC-WDSKDSINSA-N 0.000 description 1
- YUOXLJYVSZYPBJ-CIUDSAMLSA-N Asn-Pro-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O YUOXLJYVSZYPBJ-CIUDSAMLSA-N 0.000 description 1
- SNYCNNPOFYBCEK-ZLUOBGJFSA-N Asn-Ser-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O SNYCNNPOFYBCEK-ZLUOBGJFSA-N 0.000 description 1
- HPNDBHLITCHRSO-WHFBIAKZSA-N Asp-Ala-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)NCC(O)=O HPNDBHLITCHRSO-WHFBIAKZSA-N 0.000 description 1
- ZLGKHJHFYSRUBH-FXQIFTODSA-N Asp-Arg-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O ZLGKHJHFYSRUBH-FXQIFTODSA-N 0.000 description 1
- NYLBGYLHBDFRHL-VEVYYDQMSA-N Asp-Arg-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NYLBGYLHBDFRHL-VEVYYDQMSA-N 0.000 description 1
- JGDBHIVECJGXJA-FXQIFTODSA-N Asp-Asp-Arg Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JGDBHIVECJGXJA-FXQIFTODSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- WMLFFCRUSPNENW-ZLUOBGJFSA-N Asp-Ser-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O WMLFFCRUSPNENW-ZLUOBGJFSA-N 0.000 description 1
- BRRPVTUFESPTCP-ACZMJKKPSA-N Asp-Ser-Glu Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O BRRPVTUFESPTCP-ACZMJKKPSA-N 0.000 description 1
- MNQMTYSEKZHIDF-GCJQMDKQSA-N Asp-Thr-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O MNQMTYSEKZHIDF-GCJQMDKQSA-N 0.000 description 1
- CZIVKMOEXPILDK-SRVKXCTJSA-N Asp-Tyr-Ser Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O CZIVKMOEXPILDK-SRVKXCTJSA-N 0.000 description 1
- HTSSXFASOUSJQG-IHPCNDPISA-N Asp-Tyr-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O HTSSXFASOUSJQG-IHPCNDPISA-N 0.000 description 1
- GFYOIYJJMSHLSN-QXEWZRGKSA-N Asp-Val-Arg Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O GFYOIYJJMSHLSN-QXEWZRGKSA-N 0.000 description 1
- XWKPSMRPIKKDDU-RCOVLWMOSA-N Asp-Val-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O XWKPSMRPIKKDDU-RCOVLWMOSA-N 0.000 description 1
- PLMKQQMDOMTZGG-UHFFFAOYSA-N Astrantiagenin E-methylester Natural products CC12CCC(O)C(C)(CO)C1CCC1(C)C2CC=C2C3CC(C)(C)CCC3(C(=O)OC)CCC21C PLMKQQMDOMTZGG-UHFFFAOYSA-N 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 102100021277 Beta-secretase 2 Human genes 0.000 description 1
- 101710150190 Beta-secretase 2 Proteins 0.000 description 1
- 239000002028 Biomass Substances 0.000 description 1
- 241001674044 Blattodea Species 0.000 description 1
- 240000008564 Boehmeria nivea Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 101100459438 Caenorhabditis elegans nac-1 gene Proteins 0.000 description 1
- 241000316922 Caldicoprobacter faecalis Species 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 108010049994 Chloroplast Proteins Proteins 0.000 description 1
- 241000723343 Cichorium Species 0.000 description 1
- 108091062157 Cis-regulatory element Proteins 0.000 description 1
- 235000008733 Citrus aurantifolia Nutrition 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 101800004637 Communis Proteins 0.000 description 1
- 241000218631 Coniferophyta Species 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- 239000004971 Cross linker Substances 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 240000000163 Cycas revoluta Species 0.000 description 1
- MBPKYKSYUAPLMY-DCAQKATOSA-N Cys-Arg-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O MBPKYKSYUAPLMY-DCAQKATOSA-N 0.000 description 1
- YZFCGHIBLBDZDA-ZLUOBGJFSA-N Cys-Asp-Ser Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O YZFCGHIBLBDZDA-ZLUOBGJFSA-N 0.000 description 1
- UXIYYUMGFNSGBK-XPUUQOCRSA-N Cys-Gly-Val Chemical compound [H]N[C@@H](CS)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O UXIYYUMGFNSGBK-XPUUQOCRSA-N 0.000 description 1
- ABLJDBFJPUWQQB-DCAQKATOSA-N Cys-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CS)N ABLJDBFJPUWQQB-DCAQKATOSA-N 0.000 description 1
- VOBMMKMWSIVIOA-SRVKXCTJSA-N Cys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CS)N VOBMMKMWSIVIOA-SRVKXCTJSA-N 0.000 description 1
- NMWZMKLDGZXRKP-BZSNNMDCSA-N Cys-Phe-Phe Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O NMWZMKLDGZXRKP-BZSNNMDCSA-N 0.000 description 1
- FNXOZWPPOJRBRE-XGEHTFHBSA-N Cys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CS)N)O FNXOZWPPOJRBRE-XGEHTFHBSA-N 0.000 description 1
- 102100028717 Cytosolic 5'-nucleotidase 3A Human genes 0.000 description 1
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 1
- 101150023395 DGA1 gene Proteins 0.000 description 1
- 102100037458 Dephospho-CoA kinase Human genes 0.000 description 1
- 101001031598 Dictyostelium discoideum Probable serine/threonine-protein kinase fhkC Proteins 0.000 description 1
- RWSOTUBLDIXVET-UHFFFAOYSA-N Dihydrogen sulfide Chemical class S RWSOTUBLDIXVET-UHFFFAOYSA-N 0.000 description 1
- 241000219762 Dioclea grandiflora Species 0.000 description 1
- 241000195634 Dunaliella Species 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 241000380130 Ehrharta erecta Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241001517310 Eria Species 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 241000206602 Eukaryota Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000234642 Festuca Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 238000005033 Fourier transform infrared spectroscopy Methods 0.000 description 1
- 241000287828 Gallus gallus Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 1
- NCWOMXABNYEPLY-NRPADANISA-N Glu-Ala-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O NCWOMXABNYEPLY-NRPADANISA-N 0.000 description 1
- OJGLIOXAKGFFDW-SRVKXCTJSA-N Glu-Arg-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCC(=O)O)N OJGLIOXAKGFFDW-SRVKXCTJSA-N 0.000 description 1
- LTUVYLVIZHJCOQ-KKUMJFAQSA-N Glu-Arg-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LTUVYLVIZHJCOQ-KKUMJFAQSA-N 0.000 description 1
- SYDJILXOZNEEDK-XIRDDKMYSA-N Glu-Arg-Trp Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O SYDJILXOZNEEDK-XIRDDKMYSA-N 0.000 description 1
- DYFJZDDQPNIPAB-NHCYSSNCSA-N Glu-Arg-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(O)=O DYFJZDDQPNIPAB-NHCYSSNCSA-N 0.000 description 1
- ZOXBSICWUDAOHX-GUBZILKMSA-N Glu-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCC(O)=O ZOXBSICWUDAOHX-GUBZILKMSA-N 0.000 description 1
- CGOHAEBMDSEKFB-FXQIFTODSA-N Glu-Glu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O CGOHAEBMDSEKFB-FXQIFTODSA-N 0.000 description 1
- VGOFRWOTSXVPAU-SDDRHHMPSA-N Glu-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)[C@H](CCC(=O)O)N)C(=O)O VGOFRWOTSXVPAU-SDDRHHMPSA-N 0.000 description 1
- ATVYZJGOZLVXDK-IUCAKERBSA-N Glu-Leu-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O ATVYZJGOZLVXDK-IUCAKERBSA-N 0.000 description 1
- BBBXWRGITSUJPB-YUMQZZPRSA-N Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(O)=O BBBXWRGITSUJPB-YUMQZZPRSA-N 0.000 description 1
- OCJRHJZKGGSPRW-IUCAKERBSA-N Glu-Lys-Gly Chemical compound NCCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CCC(O)=O OCJRHJZKGGSPRW-IUCAKERBSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- MIIGESVJEBDJMP-FHWLQOOXSA-N Glu-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@H](CCC(O)=O)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 MIIGESVJEBDJMP-FHWLQOOXSA-N 0.000 description 1
- PAZQYODKOZHXGA-SRVKXCTJSA-N Glu-Pro-His Chemical compound N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O PAZQYODKOZHXGA-SRVKXCTJSA-N 0.000 description 1
- IDEODOAVGCMUQV-GUBZILKMSA-N Glu-Ser-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IDEODOAVGCMUQV-GUBZILKMSA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- VNCNWQPIQYAMAK-ACZMJKKPSA-N Glu-Ser-Ser Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O VNCNWQPIQYAMAK-ACZMJKKPSA-N 0.000 description 1
- DLISPGXMKZTWQG-IFFSRLJSSA-N Glu-Thr-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O DLISPGXMKZTWQG-IFFSRLJSSA-N 0.000 description 1
- HVKAAUOFFTUSAA-XDTLVQLUSA-N Glu-Tyr-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O HVKAAUOFFTUSAA-XDTLVQLUSA-N 0.000 description 1
- VIPDPMHGICREIS-GVXVVHGQSA-N Glu-Val-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O VIPDPMHGICREIS-GVXVVHGQSA-N 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- PYTZFYUXZZHOAD-WHFBIAKZSA-N Gly-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)CN PYTZFYUXZZHOAD-WHFBIAKZSA-N 0.000 description 1
- MZZSCEANQDPJER-ONGXEEELSA-N Gly-Ala-Phe Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MZZSCEANQDPJER-ONGXEEELSA-N 0.000 description 1
- QSDKBRMVXSWAQE-BFHQHQDPSA-N Gly-Ala-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN QSDKBRMVXSWAQE-BFHQHQDPSA-N 0.000 description 1
- JXYMPBCYRKWJEE-BQBZGAKWSA-N Gly-Arg-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O JXYMPBCYRKWJEE-BQBZGAKWSA-N 0.000 description 1
- CLODWIOAKCSBAN-BQBZGAKWSA-N Gly-Arg-Asp Chemical compound NC(N)=NCCC[C@H](NC(=O)CN)C(=O)N[C@@H](CC(O)=O)C(O)=O CLODWIOAKCSBAN-BQBZGAKWSA-N 0.000 description 1
- RJIVPOXLQFJRTG-LURJTMIESA-N Gly-Arg-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N RJIVPOXLQFJRTG-LURJTMIESA-N 0.000 description 1
- KFMBRBPXHVMDFN-UWVGGRQHSA-N Gly-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCNC(N)=N KFMBRBPXHVMDFN-UWVGGRQHSA-N 0.000 description 1
- KKBWDNZXYLGJEY-UHFFFAOYSA-N Gly-Arg-Pro Natural products NCC(=O)NC(CCNC(=N)N)C(=O)N1CCCC1C(=O)O KKBWDNZXYLGJEY-UHFFFAOYSA-N 0.000 description 1
- IWAXHBCACVWNHT-BQBZGAKWSA-N Gly-Asp-Arg Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IWAXHBCACVWNHT-BQBZGAKWSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- LGQZOQRDEUIZJY-YUMQZZPRSA-N Gly-Cys-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CS)NC(=O)CN)C(O)=O LGQZOQRDEUIZJY-YUMQZZPRSA-N 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- GDOZQTNZPCUARW-YFKPBYRVSA-N Gly-Gly-Glu Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O GDOZQTNZPCUARW-YFKPBYRVSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- OLPPXYMMIARYAL-QMMMGPOBSA-N Gly-Gly-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)CNC(=O)CN OLPPXYMMIARYAL-QMMMGPOBSA-N 0.000 description 1
- MVORZMQFXBLMHM-QWRGUYRKSA-N Gly-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CN=CN1 MVORZMQFXBLMHM-QWRGUYRKSA-N 0.000 description 1
- TVUWMSBGMVAHSJ-KBPBESRZSA-N Gly-Leu-Phe Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 TVUWMSBGMVAHSJ-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- GMTXWRIDLGTVFC-IUCAKERBSA-N Gly-Lys-Glu Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMTXWRIDLGTVFC-IUCAKERBSA-N 0.000 description 1
- HFPVRZWORNJRRC-UWVGGRQHSA-N Gly-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)CN HFPVRZWORNJRRC-UWVGGRQHSA-N 0.000 description 1
- BCCRXDTUTZHDEU-VKHMYHEASA-N Gly-Ser Chemical compound NCC(=O)N[C@@H](CO)C(O)=O BCCRXDTUTZHDEU-VKHMYHEASA-N 0.000 description 1
- OHUKZZYSJBKFRR-WHFBIAKZSA-N Gly-Ser-Asp Chemical compound [H]NCC(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O OHUKZZYSJBKFRR-WHFBIAKZSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- RHRLHXQWHCNJKR-PMVVWTBXSA-N Gly-Thr-His Chemical compound NCC(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 RHRLHXQWHCNJKR-PMVVWTBXSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 101150106864 HR gene Proteins 0.000 description 1
- BIAKMWKJMQLZOJ-ZKWXMUAHSA-N His-Ala-Ala Chemical compound C[C@H](NC(=O)[C@H](C)NC(=O)[C@@H](N)Cc1cnc[nH]1)C(O)=O BIAKMWKJMQLZOJ-ZKWXMUAHSA-N 0.000 description 1
- PDSUIXMZYNURGI-AVGNSLFASA-N His-Arg-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CC1=CN=CN1 PDSUIXMZYNURGI-AVGNSLFASA-N 0.000 description 1
- ZIMTWPHIKZEHSE-UWVGGRQHSA-N His-Arg-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)NCC(O)=O ZIMTWPHIKZEHSE-UWVGGRQHSA-N 0.000 description 1
- LYSMQLXUCAKELQ-DCAQKATOSA-N His-Asp-Arg Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N LYSMQLXUCAKELQ-DCAQKATOSA-N 0.000 description 1
- ZYDYEPDFFVCUBI-SRVKXCTJSA-N His-Glu-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CC1=CN=CN1)N ZYDYEPDFFVCUBI-SRVKXCTJSA-N 0.000 description 1
- VFBZWZXKCVBTJR-SRVKXCTJSA-N His-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N VFBZWZXKCVBTJR-SRVKXCTJSA-N 0.000 description 1
- VGYOLSOFODKLSP-IHPCNDPISA-N His-Leu-Trp Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(O)=O)C1=CN=CN1 VGYOLSOFODKLSP-IHPCNDPISA-N 0.000 description 1
- FHGVHXCQMJWQPK-SRVKXCTJSA-N His-Lys-Asn Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O FHGVHXCQMJWQPK-SRVKXCTJSA-N 0.000 description 1
- XIGFLVCAVQQGNS-IHRRRGAJSA-N His-Pro-His Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 XIGFLVCAVQQGNS-IHRRRGAJSA-N 0.000 description 1
- MDOBWSFNSNPENN-PMVVWTBXSA-N His-Thr-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O MDOBWSFNSNPENN-PMVVWTBXSA-N 0.000 description 1
- JUCZDDVZBMPKRT-IXOXFDKPSA-N His-Thr-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O JUCZDDVZBMPKRT-IXOXFDKPSA-N 0.000 description 1
- ALPXXNRQBMRCPZ-MEYUZBJRSA-N His-Thr-Phe Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ALPXXNRQBMRCPZ-MEYUZBJRSA-N 0.000 description 1
- UWSMZKRTOZEGDD-CUJWVEQBSA-N His-Thr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O UWSMZKRTOZEGDD-CUJWVEQBSA-N 0.000 description 1
- NBWATNYAUVSAEQ-ZEILLAHLSA-N His-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N)O NBWATNYAUVSAEQ-ZEILLAHLSA-N 0.000 description 1
- CSTDQOOBZBAJKE-BWAGICSOSA-N His-Tyr-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)NC(=O)[C@H](CC2=CN=CN2)N)O CSTDQOOBZBAJKE-BWAGICSOSA-N 0.000 description 1
- FFYYUUWROYYKFY-IHRRRGAJSA-N His-Val-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O FFYYUUWROYYKFY-IHRRRGAJSA-N 0.000 description 1
- 101000928189 Homo sapiens Adhesion G protein-coupled receptor L2 Proteins 0.000 description 1
- 101001130226 Homo sapiens Phosphatidylcholine-sterol acyltransferase Proteins 0.000 description 1
- 102000004867 Hydro-Lyases Human genes 0.000 description 1
- 108090001042 Hydro-Lyases Proteins 0.000 description 1
- VEXZGXHMUGYJMC-UHFFFAOYSA-N Hydrochloric acid Chemical compound Cl VEXZGXHMUGYJMC-UHFFFAOYSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010025815 Kanamycin Kinase Proteins 0.000 description 1
- IBMVEYRWAWIOTN-UHFFFAOYSA-N L-Leucyl-L-Arginyl-L-Proline Natural products CC(C)CC(N)C(=O)NC(CCCN=C(N)N)C(=O)N1CCCC1C(O)=O IBMVEYRWAWIOTN-UHFFFAOYSA-N 0.000 description 1
- 235000019766 L-Lysine Nutrition 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 1
- QLROSWPKSBORFJ-BQBZGAKWSA-N L-Prolyl-L-glutamic acid Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 QLROSWPKSBORFJ-BQBZGAKWSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-BYPYZUCNSA-P L-argininium(2+) Chemical group NC(=[NH2+])NCCC[C@H]([NH3+])C(O)=O ODKSFYDXXFIFQN-BYPYZUCNSA-P 0.000 description 1
- QOOWRKBDDXQRHC-BQBZGAKWSA-N L-lysyl-L-alanine Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN QOOWRKBDDXQRHC-BQBZGAKWSA-N 0.000 description 1
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- BQSLGJHIAGOZCD-CIUDSAMLSA-N Leu-Ala-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O BQSLGJHIAGOZCD-CIUDSAMLSA-N 0.000 description 1
- SUPVSFFZWVOEOI-CQDKDKBSSA-N Leu-Ala-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-CQDKDKBSSA-N 0.000 description 1
- SUPVSFFZWVOEOI-UHFFFAOYSA-N Leu-Ala-Tyr Natural products CC(C)CC(N)C(=O)NC(C)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 SUPVSFFZWVOEOI-UHFFFAOYSA-N 0.000 description 1
- NTRAGDHVSGKUSF-AVGNSLFASA-N Leu-Arg-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O NTRAGDHVSGKUSF-AVGNSLFASA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- IBMVEYRWAWIOTN-RWMBFGLXSA-N Leu-Arg-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N1CCC[C@@H]1C(O)=O IBMVEYRWAWIOTN-RWMBFGLXSA-N 0.000 description 1
- JKGHDYGZRDWHGA-SRVKXCTJSA-N Leu-Asn-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JKGHDYGZRDWHGA-SRVKXCTJSA-N 0.000 description 1
- TWQIYNGNYNJUFM-NHCYSSNCSA-N Leu-Asn-Val Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TWQIYNGNYNJUFM-NHCYSSNCSA-N 0.000 description 1
- YKNBJXOJTURHCU-DCAQKATOSA-N Leu-Asp-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N YKNBJXOJTURHCU-DCAQKATOSA-N 0.000 description 1
- ZDSNOSQHMJBRQN-SRVKXCTJSA-N Leu-Asp-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N ZDSNOSQHMJBRQN-SRVKXCTJSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- HIZYETOZLYFUFF-BQBZGAKWSA-N Leu-Cys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CS)C(O)=O HIZYETOZLYFUFF-BQBZGAKWSA-N 0.000 description 1
- DKEZVKFLETVJFY-CIUDSAMLSA-N Leu-Cys-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(=O)N)C(=O)O)N DKEZVKFLETVJFY-CIUDSAMLSA-N 0.000 description 1
- YORLGJINWYYIMX-KKUMJFAQSA-N Leu-Cys-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O YORLGJINWYYIMX-KKUMJFAQSA-N 0.000 description 1
- VWHGTYCRDRBSFI-ZETCQYMHSA-N Leu-Gly-Gly Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)NCC(O)=O VWHGTYCRDRBSFI-ZETCQYMHSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- POZULHZYLPGXMR-ONGXEEELSA-N Leu-Gly-Val Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O POZULHZYLPGXMR-ONGXEEELSA-N 0.000 description 1
- VZBIUJURDLFFOE-IHRRRGAJSA-N Leu-His-Arg Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VZBIUJURDLFFOE-IHRRRGAJSA-N 0.000 description 1
- IEWBEPKLKUXQBU-VOAKCMCISA-N Leu-Leu-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IEWBEPKLKUXQBU-VOAKCMCISA-N 0.000 description 1
- UCNNZELZXFXXJQ-BZSNNMDCSA-N Leu-Leu-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 UCNNZELZXFXXJQ-BZSNNMDCSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- BGZCJDGBBUUBHA-KKUMJFAQSA-N Leu-Lys-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O BGZCJDGBBUUBHA-KKUMJFAQSA-N 0.000 description 1
- VCHVSKNMTXWIIP-SRVKXCTJSA-N Leu-Lys-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O VCHVSKNMTXWIIP-SRVKXCTJSA-N 0.000 description 1
- OVZLLFONXILPDZ-VOAKCMCISA-N Leu-Lys-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O OVZLLFONXILPDZ-VOAKCMCISA-N 0.000 description 1
- CPONGMJGVIAWEH-DCAQKATOSA-N Leu-Met-Ala Chemical compound CSCC[C@H](NC(=O)[C@@H](N)CC(C)C)C(=O)N[C@@H](C)C(O)=O CPONGMJGVIAWEH-DCAQKATOSA-N 0.000 description 1
- DDVHDMSBLRAKNV-IHRRRGAJSA-N Leu-Met-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O DDVHDMSBLRAKNV-IHRRRGAJSA-N 0.000 description 1
- IBSGMIPRBMPMHE-IHRRRGAJSA-N Leu-Met-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O IBSGMIPRBMPMHE-IHRRRGAJSA-N 0.000 description 1
- BIZNDKMFQHDOIE-KKUMJFAQSA-N Leu-Phe-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(N)=O)C(O)=O)CC1=CC=CC=C1 BIZNDKMFQHDOIE-KKUMJFAQSA-N 0.000 description 1
- FYPWFNKQVVEELI-ULQDDVLXSA-N Leu-Phe-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=CC=C1 FYPWFNKQVVEELI-ULQDDVLXSA-N 0.000 description 1
- JDBQSGMJBMPNFT-AVGNSLFASA-N Leu-Pro-Val Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O JDBQSGMJBMPNFT-AVGNSLFASA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- SQUFDMCWMFOEBA-KKUMJFAQSA-N Leu-Ser-Tyr Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 SQUFDMCWMFOEBA-KKUMJFAQSA-N 0.000 description 1
- LINKCQUOMUDLKN-KATARQTJSA-N Leu-Thr-Cys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(C)C)N)O LINKCQUOMUDLKN-KATARQTJSA-N 0.000 description 1
- ILDSIMPXNFWKLH-KATARQTJSA-N Leu-Thr-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O ILDSIMPXNFWKLH-KATARQTJSA-N 0.000 description 1
- FPFOYSCDUWTZBF-IHPCNDPISA-N Leu-Trp-Leu Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@@H]([NH3+])CC(C)C)C(=O)N[C@@H](CC(C)C)C([O-])=O)=CNC2=C1 FPFOYSCDUWTZBF-IHPCNDPISA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- VQHUBNVKFFLWRP-ULQDDVLXSA-N Leu-Tyr-Val Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 VQHUBNVKFFLWRP-ULQDDVLXSA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- 240000001221 Leucaena esculenta Species 0.000 description 1
- 235000010643 Leucaena leucocephala Nutrition 0.000 description 1
- 240000004296 Lolium perenne Species 0.000 description 1
- 241001480167 Lotus japonicus Species 0.000 description 1
- 241000750632 Lotus pedunculatus Species 0.000 description 1
- 241000750617 Lotus tenuis Species 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- GJJQCBVRWDGLMQ-GUBZILKMSA-N Lys-Glu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O GJJQCBVRWDGLMQ-GUBZILKMSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- ATIPDCIQTUXABX-UWVGGRQHSA-N Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CCCCN ATIPDCIQTUXABX-UWVGGRQHSA-N 0.000 description 1
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 1
- JQSIGLHQNSZZRL-KKUMJFAQSA-N Lys-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N JQSIGLHQNSZZRL-KKUMJFAQSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- YSZNURNVYFUEHC-BQBZGAKWSA-N Lys-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(O)=O YSZNURNVYFUEHC-BQBZGAKWSA-N 0.000 description 1
- WQDKIVRHTQYJSN-DCAQKATOSA-N Lys-Ser-Arg Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N WQDKIVRHTQYJSN-DCAQKATOSA-N 0.000 description 1
- IOQWIOPSKJOEKI-SRVKXCTJSA-N Lys-Ser-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O IOQWIOPSKJOEKI-SRVKXCTJSA-N 0.000 description 1
- MIFFFXHMAHFACR-KATARQTJSA-N Lys-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CCCCN MIFFFXHMAHFACR-KATARQTJSA-N 0.000 description 1
- TVHCDSBMFQYPNA-RHYQMDGZSA-N Lys-Thr-Arg Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TVHCDSBMFQYPNA-RHYQMDGZSA-N 0.000 description 1
- MYTOTTSMVMWVJN-STQMWFEESA-N Lys-Tyr Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 MYTOTTSMVMWVJN-STQMWFEESA-N 0.000 description 1
- MIMXMVDLMDMOJD-BZSNNMDCSA-N Lys-Tyr-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O MIMXMVDLMDMOJD-BZSNNMDCSA-N 0.000 description 1
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 1
- 240000003183 Manihot esculenta Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 229930195725 Mannitol Natural products 0.000 description 1
- 244000246386 Mentha pulegium Species 0.000 description 1
- 235000016257 Mentha pulegium Nutrition 0.000 description 1
- 235000004357 Mentha x piperita Nutrition 0.000 description 1
- SBSIKVMCCJUCBZ-GUBZILKMSA-N Met-Asn-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N SBSIKVMCCJUCBZ-GUBZILKMSA-N 0.000 description 1
- TWTNGJMBFRTKEX-FXQIFTODSA-N Met-Cys-Cys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CS)C(O)=O TWTNGJMBFRTKEX-FXQIFTODSA-N 0.000 description 1
- QXOHLNCNYLGICT-YFKPBYRVSA-N Met-Gly Chemical compound CSCC[C@H](N)C(=O)NCC(O)=O QXOHLNCNYLGICT-YFKPBYRVSA-N 0.000 description 1
- FYRUJIJAUPHUNB-IUCAKERBSA-N Met-Gly-Arg Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCCNC(N)=N FYRUJIJAUPHUNB-IUCAKERBSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- JYPITOUIQVSCKM-IHRRRGAJSA-N Met-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCSC)N JYPITOUIQVSCKM-IHRRRGAJSA-N 0.000 description 1
- KMSMNUFBNCHMII-IHRRRGAJSA-N Met-Leu-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCCN KMSMNUFBNCHMII-IHRRRGAJSA-N 0.000 description 1
- AOFZWWDTTJLHOU-ULQDDVLXSA-N Met-Lys-Tyr Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AOFZWWDTTJLHOU-ULQDDVLXSA-N 0.000 description 1
- HGCNKOLVKRAVHD-RYUDHWBXSA-N Met-Phe Chemical compound CSCC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-RYUDHWBXSA-N 0.000 description 1
- GRKPXCKLOOUDFG-UFYCRDLUSA-N Met-Phe-Tyr Chemical compound C([C@H](NC(=O)[C@@H](N)CCSC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 GRKPXCKLOOUDFG-UFYCRDLUSA-N 0.000 description 1
- LXCSZPUQKMTXNW-BQBZGAKWSA-N Met-Ser-Gly Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O LXCSZPUQKMTXNW-BQBZGAKWSA-N 0.000 description 1
- GMMLGMFBYCFCCX-KZVJFYERSA-N Met-Thr-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMMLGMFBYCFCCX-KZVJFYERSA-N 0.000 description 1
- YGNUDKAPJARTEM-GUBZILKMSA-N Met-Val-Ala Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O YGNUDKAPJARTEM-GUBZILKMSA-N 0.000 description 1
- 241001074116 Miscanthus x giganteus Species 0.000 description 1
- 244000111261 Mucuna pruriens Species 0.000 description 1
- 235000008540 Mucuna pruriens var utilis Nutrition 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010002311 N-glycylglutamic acid Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 108091092724 Noncoding DNA Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 101710152905 Oleosin 5 Proteins 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 244000178706 Ornithopus sativus Species 0.000 description 1
- 101100008883 Oryza sativa subsp. japonica DGAT1-1 gene Proteins 0.000 description 1
- 241000346285 Ostrinia furnacalis Species 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 108010084214 Peptide PHI Proteins 0.000 description 1
- 241000745991 Phalaris Species 0.000 description 1
- 235000005632 Phalaris canariensis Nutrition 0.000 description 1
- ULECEJGNDHWSKD-QEJZJMRPSA-N Phe-Ala-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=CC=C1 ULECEJGNDHWSKD-QEJZJMRPSA-N 0.000 description 1
- METZZBCMDXHFMK-BZSNNMDCSA-N Phe-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N METZZBCMDXHFMK-BZSNNMDCSA-N 0.000 description 1
- MSHZERMPZKCODG-ACRUOGEOSA-N Phe-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 MSHZERMPZKCODG-ACRUOGEOSA-N 0.000 description 1
- DOXQMJCSSYZSNM-BZSNNMDCSA-N Phe-Lys-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O DOXQMJCSSYZSNM-BZSNNMDCSA-N 0.000 description 1
- UXQFHEKRGHYJRA-STQMWFEESA-N Phe-Met-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O UXQFHEKRGHYJRA-STQMWFEESA-N 0.000 description 1
- ACJULKNZOCRWEI-ULQDDVLXSA-N Phe-Met-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O ACJULKNZOCRWEI-ULQDDVLXSA-N 0.000 description 1
- CBENHWCORLVGEQ-HJOGWXRNSA-N Phe-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 CBENHWCORLVGEQ-HJOGWXRNSA-N 0.000 description 1
- MRWOVVNKSXXLRP-IHPCNDPISA-N Phe-Ser-Trp Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O MRWOVVNKSXXLRP-IHPCNDPISA-N 0.000 description 1
- BSKMOCNNLNDIMU-CDMKHQONSA-N Phe-Thr-Gly Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O BSKMOCNNLNDIMU-CDMKHQONSA-N 0.000 description 1
- MSSXKZBDKZAHCX-UNQGMJICSA-N Phe-Thr-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O MSSXKZBDKZAHCX-UNQGMJICSA-N 0.000 description 1
- JSGWNFKWZNPDAV-YDHLFZDLSA-N Phe-Val-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 JSGWNFKWZNPDAV-YDHLFZDLSA-N 0.000 description 1
- MWQXFDIQXIXPMS-UNQGMJICSA-N Phe-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CC1=CC=CC=C1)N)O MWQXFDIQXIXPMS-UNQGMJICSA-N 0.000 description 1
- 102100031538 Phosphatidylcholine-sterol acyltransferase Human genes 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 241001127637 Plantago Species 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 241000219000 Populus Species 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- IFMDQWDAJUMMJC-DCAQKATOSA-N Pro-Ala-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O IFMDQWDAJUMMJC-DCAQKATOSA-N 0.000 description 1
- NHDVNAKDACFHPX-GUBZILKMSA-N Pro-Arg-Ala Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C)C(O)=O NHDVNAKDACFHPX-GUBZILKMSA-N 0.000 description 1
- QBFONMUYNSNKIX-AVGNSLFASA-N Pro-Arg-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O QBFONMUYNSNKIX-AVGNSLFASA-N 0.000 description 1
- CYQQWUPHIZVCNY-GUBZILKMSA-N Pro-Arg-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CYQQWUPHIZVCNY-GUBZILKMSA-N 0.000 description 1
- MTHRMUXESFIAMS-DCAQKATOSA-N Pro-Asn-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O MTHRMUXESFIAMS-DCAQKATOSA-N 0.000 description 1
- YTWNSIDWAFSEEI-RWMBFGLXSA-N Pro-His-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)N3CCC[C@@H]3C(=O)O YTWNSIDWAFSEEI-RWMBFGLXSA-N 0.000 description 1
- XFFIGWGYMUFCCQ-ULQDDVLXSA-N Pro-His-Tyr Chemical compound C1=CC(O)=CC=C1C[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)[C@H]1[NH2+]CCC1)CC1=CN=CN1 XFFIGWGYMUFCCQ-ULQDDVLXSA-N 0.000 description 1
- FXGIMYRVJJEIIM-UWVGGRQHSA-N Pro-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H]1CCCN1 FXGIMYRVJJEIIM-UWVGGRQHSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- MRYUJHGPZQNOAD-IHRRRGAJSA-N Pro-Leu-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 MRYUJHGPZQNOAD-IHRRRGAJSA-N 0.000 description 1
- HATVCTYBNCNMAA-AVGNSLFASA-N Pro-Leu-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCSC)C(O)=O HATVCTYBNCNMAA-AVGNSLFASA-N 0.000 description 1
- RVQDZELMXZRSSI-IUCAKERBSA-N Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1 RVQDZELMXZRSSI-IUCAKERBSA-N 0.000 description 1
- ULWBBFKQBDNGOY-RWMBFGLXSA-N Pro-Lys-Pro Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N2CCC[C@@H]2C(=O)O ULWBBFKQBDNGOY-RWMBFGLXSA-N 0.000 description 1
- FRVUYKWGPCQRBL-GUBZILKMSA-N Pro-Met-Cys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@@H]1CCCN1 FRVUYKWGPCQRBL-GUBZILKMSA-N 0.000 description 1
- DSGSTPRKNYHGCL-JYJNAYRXSA-N Pro-Phe-Met Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O DSGSTPRKNYHGCL-JYJNAYRXSA-N 0.000 description 1
- KDBHVPXBQADZKY-GUBZILKMSA-N Pro-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 KDBHVPXBQADZKY-GUBZILKMSA-N 0.000 description 1
- PCWLNNZTBJTZRN-AVGNSLFASA-N Pro-Pro-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 PCWLNNZTBJTZRN-AVGNSLFASA-N 0.000 description 1
- GMJDSFYVTAMIBF-FXQIFTODSA-N Pro-Ser-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O GMJDSFYVTAMIBF-FXQIFTODSA-N 0.000 description 1
- QKDIHFHGHBYTKB-IHRRRGAJSA-N Pro-Ser-Phe Chemical compound N([C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C(=O)[C@@H]1CCCN1 QKDIHFHGHBYTKB-IHRRRGAJSA-N 0.000 description 1
- UGDMQJSXSSZUKL-IHRRRGAJSA-N Pro-Ser-Tyr Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)O UGDMQJSXSSZUKL-IHRRRGAJSA-N 0.000 description 1
- PRKWBYCXBBSLSK-GUBZILKMSA-N Pro-Ser-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O PRKWBYCXBBSLSK-GUBZILKMSA-N 0.000 description 1
- KIDXAAQVMNLJFQ-KZVJFYERSA-N Pro-Thr-Ala Chemical compound C[C@@H](O)[C@H](NC(=O)[C@@H]1CCCN1)C(=O)N[C@@H](C)C(O)=O KIDXAAQVMNLJFQ-KZVJFYERSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- UEKYKRQIAQHOOZ-KBPBESRZSA-N Pro-Trp Chemical compound N([C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)[O-])C(=O)[C@@H]1CCC[NH2+]1 UEKYKRQIAQHOOZ-KBPBESRZSA-N 0.000 description 1
- 101710091608 Probable diacyglycerol O-acyltransferase tgs2 Proteins 0.000 description 1
- 102000001253 Protein Kinase Human genes 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- 206010037549 Purpura Diseases 0.000 description 1
- 241001672981 Purpura Species 0.000 description 1
- 241000220324 Pyrus Species 0.000 description 1
- 108020005067 RNA Splice Sites Proteins 0.000 description 1
- 101100029566 Rattus norvegicus Rabggta gene Proteins 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 240000007651 Rubus glaucus Species 0.000 description 1
- 235000011034 Rubus glaucus Nutrition 0.000 description 1
- 235000009122 Rubus idaeus Nutrition 0.000 description 1
- 241000282849 Ruminantia Species 0.000 description 1
- 108091006629 SLC13A2 Proteins 0.000 description 1
- 101150055709 SNF1 gene Proteins 0.000 description 1
- 235000019485 Safflower oil Nutrition 0.000 description 1
- HBZBPFLJNDXRAY-FXQIFTODSA-N Ser-Ala-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](C(C)C)C(O)=O HBZBPFLJNDXRAY-FXQIFTODSA-N 0.000 description 1
- WDXYVIIVDIDOSX-DCAQKATOSA-N Ser-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N WDXYVIIVDIDOSX-DCAQKATOSA-N 0.000 description 1
- WXUBSIDKNMFAGS-IHRRRGAJSA-N Ser-Arg-Tyr Chemical compound NC(N)=NCCC[C@H](NC(=O)[C@H](CO)N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WXUBSIDKNMFAGS-IHRRRGAJSA-N 0.000 description 1
- VAUMZJHYZQXZBQ-WHFBIAKZSA-N Ser-Asn-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O VAUMZJHYZQXZBQ-WHFBIAKZSA-N 0.000 description 1
- GHPQVUYZQQGEDA-BIIVOSGPSA-N Ser-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CO)N)C(=O)O GHPQVUYZQQGEDA-BIIVOSGPSA-N 0.000 description 1
- MMAPOBOTRUVNKJ-ZLUOBGJFSA-N Ser-Asp-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CO)N)C(=O)O MMAPOBOTRUVNKJ-ZLUOBGJFSA-N 0.000 description 1
- MUARUIBTKQJKFY-WHFBIAKZSA-N Ser-Gly-Asp Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(O)=O MUARUIBTKQJKFY-WHFBIAKZSA-N 0.000 description 1
- GZFAWAQTEYDKII-YUMQZZPRSA-N Ser-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO GZFAWAQTEYDKII-YUMQZZPRSA-N 0.000 description 1
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 1
- XXXAXOWMBOKTRN-XPUUQOCRSA-N Ser-Gly-Val Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXXAXOWMBOKTRN-XPUUQOCRSA-N 0.000 description 1
- FYUIFUJFNCLUIX-XVYDVKMFSA-N Ser-His-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(O)=O FYUIFUJFNCLUIX-XVYDVKMFSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- QYSFWUIXDFJUDW-DCAQKATOSA-N Ser-Leu-Arg Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QYSFWUIXDFJUDW-DCAQKATOSA-N 0.000 description 1
- IUXGJEIKJBYKOO-SRVKXCTJSA-N Ser-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CO)N IUXGJEIKJBYKOO-SRVKXCTJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- SRKMDKACHDVPMD-SRVKXCTJSA-N Ser-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)N SRKMDKACHDVPMD-SRVKXCTJSA-N 0.000 description 1
- XUDRHBPSPAPDJP-SRVKXCTJSA-N Ser-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO XUDRHBPSPAPDJP-SRVKXCTJSA-N 0.000 description 1
- JAWGSPUJAXYXJA-IHRRRGAJSA-N Ser-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](CO)N)CC1=CC=CC=C1 JAWGSPUJAXYXJA-IHRRRGAJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- KQNDIKOYWZTZIX-FXQIFTODSA-N Ser-Ser-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KQNDIKOYWZTZIX-FXQIFTODSA-N 0.000 description 1
- SRSPTFBENMJHMR-WHFBIAKZSA-N Ser-Ser-Gly Chemical compound OC[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O SRSPTFBENMJHMR-WHFBIAKZSA-N 0.000 description 1
- BMKNXTJLHFIAAH-CIUDSAMLSA-N Ser-Ser-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O BMKNXTJLHFIAAH-CIUDSAMLSA-N 0.000 description 1
- XJDMUQCLVSCRSJ-VZFHVOOUSA-N Ser-Thr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O XJDMUQCLVSCRSJ-VZFHVOOUSA-N 0.000 description 1
- SNXUIBACCONSOH-BWBBJGPYSA-N Ser-Thr-Ser Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CO)C(O)=O SNXUIBACCONSOH-BWBBJGPYSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- FVFUOQIYDPAIJR-XIRDDKMYSA-N Ser-Trp-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FVFUOQIYDPAIJR-XIRDDKMYSA-N 0.000 description 1
- FRPNVPKQVFHSQY-BPUTZDHNSA-N Ser-Trp-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)NC(=O)[C@H](CO)N FRPNVPKQVFHSQY-BPUTZDHNSA-N 0.000 description 1
- PIQRHJQWEPWFJG-UWJYBYFXSA-N Ser-Tyr-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O PIQRHJQWEPWFJG-UWJYBYFXSA-N 0.000 description 1
- UKKROEYWYIHWBD-ZKWXMUAHSA-N Ser-Val-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O UKKROEYWYIHWBD-ZKWXMUAHSA-N 0.000 description 1
- YEDSOSIKVUMIJE-DCAQKATOSA-N Ser-Val-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O YEDSOSIKVUMIJE-DCAQKATOSA-N 0.000 description 1
- HSWXBJCBYSWBPT-GUBZILKMSA-N Ser-Val-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CO)C(C)C)C(O)=O HSWXBJCBYSWBPT-GUBZILKMSA-N 0.000 description 1
- 108020004459 Small interfering RNA Proteins 0.000 description 1
- 241000862632 Soja Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 108010043934 Sucrose synthase Proteins 0.000 description 1
- QAOWNCQODCNURD-UHFFFAOYSA-L Sulfate Chemical compound [O-]S([O-])(=O)=O QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 101150088517 TCTA gene Proteins 0.000 description 1
- 241000209124 Thinopyrum Species 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- JVTHIXKSVYEWNI-JRQIVUDYSA-N Thr-Asn-Tyr Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JVTHIXKSVYEWNI-JRQIVUDYSA-N 0.000 description 1
- ASJDFGOPDCVXTG-KATARQTJSA-N Thr-Cys-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CS)C(=O)N[C@@H](CC(C)C)C(O)=O ASJDFGOPDCVXTG-KATARQTJSA-N 0.000 description 1
- CQNFRKAKGDSJFR-NUMRIWBASA-N Thr-Glu-Asn Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CQNFRKAKGDSJFR-NUMRIWBASA-N 0.000 description 1
- MPUMPERGHHJGRP-WEDXCCLWSA-N Thr-Gly-Lys Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CCCCN)C(=O)O)N)O MPUMPERGHHJGRP-WEDXCCLWSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- WXVIGTAUZBUDPZ-DTLFHODZSA-N Thr-His Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CN=CN1 WXVIGTAUZBUDPZ-DTLFHODZSA-N 0.000 description 1
- XSTGOZBBXFKGHA-YJRXYDGGSA-N Thr-His-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O XSTGOZBBXFKGHA-YJRXYDGGSA-N 0.000 description 1
- KRGDDWVBBDLPSJ-CUJWVEQBSA-N Thr-His-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(O)=O KRGDDWVBBDLPSJ-CUJWVEQBSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- PRNGXSILMXSWQQ-OEAJRASXSA-N Thr-Leu-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PRNGXSILMXSWQQ-OEAJRASXSA-N 0.000 description 1
- KZSYAEWQMJEGRZ-RHYQMDGZSA-N Thr-Leu-Val Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O KZSYAEWQMJEGRZ-RHYQMDGZSA-N 0.000 description 1
- MGJLBZFUXUGMML-VOAKCMCISA-N Thr-Lys-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MGJLBZFUXUGMML-VOAKCMCISA-N 0.000 description 1
- QHUWWSQZTFLXPQ-FJXKBIBVSA-N Thr-Met-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(=O)NCC(O)=O QHUWWSQZTFLXPQ-FJXKBIBVSA-N 0.000 description 1
- SIEZEMFJLYRUMK-YTWAJWBKSA-N Thr-Met-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N1CCC[C@@H]1C(=O)O)N)O SIEZEMFJLYRUMK-YTWAJWBKSA-N 0.000 description 1
- KPNSNVTUVKSBFL-ZJDVBMNYSA-N Thr-Met-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N)O KPNSNVTUVKSBFL-ZJDVBMNYSA-N 0.000 description 1
- BIBYEFRASCNLAA-CDMKHQONSA-N Thr-Phe-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CC=CC=C1 BIBYEFRASCNLAA-CDMKHQONSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- PRTHQBSMXILLPC-XGEHTFHBSA-N Thr-Ser-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O PRTHQBSMXILLPC-XGEHTFHBSA-N 0.000 description 1
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 1
- UQCNIMDPYICBTR-KYNKHSRBSA-N Thr-Thr-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O UQCNIMDPYICBTR-KYNKHSRBSA-N 0.000 description 1
- LECUEEHKUFYOOV-ZJDVBMNYSA-N Thr-Thr-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@@H](N)[C@@H](C)O LECUEEHKUFYOOV-ZJDVBMNYSA-N 0.000 description 1
- BEZTUFWTPVOROW-KJEVXHAQSA-N Thr-Tyr-Arg Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O BEZTUFWTPVOROW-KJEVXHAQSA-N 0.000 description 1
- BZTSQFWJNJYZSX-JRQIVUDYSA-N Thr-Tyr-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O BZTSQFWJNJYZSX-JRQIVUDYSA-N 0.000 description 1
- OGOYMQWIWHGTGH-KZVJFYERSA-N Thr-Val-Ala Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O OGOYMQWIWHGTGH-KZVJFYERSA-N 0.000 description 1
- 235000011941 Tilia x europaea Nutrition 0.000 description 1
- 241000592342 Tracheophyta Species 0.000 description 1
- 108700009124 Transcription Initiation Site Proteins 0.000 description 1
- 108020004566 Transfer RNA Proteins 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 241001410998 Trifolium affine Species 0.000 description 1
- 235000010729 Trifolium repens Nutrition 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- XNRJFXBORWMIPY-DCPHZVHLSA-N Trp-Ala-Phe Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XNRJFXBORWMIPY-DCPHZVHLSA-N 0.000 description 1
- RNFZZCMCRDFNAE-WFBYXXMGSA-N Trp-Asn-Ala Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O RNFZZCMCRDFNAE-WFBYXXMGSA-N 0.000 description 1
- RZRDCZDUYHBGDT-BVSLBCMMSA-N Trp-Met-Tyr Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RZRDCZDUYHBGDT-BVSLBCMMSA-N 0.000 description 1
- UGFOSENEZHEQKX-PJODQICGSA-N Trp-Val-Ala Chemical compound CC(C)[C@H](NC(=O)[C@@H](N)Cc1c[nH]c2ccccc12)C(=O)N[C@@H](C)C(O)=O UGFOSENEZHEQKX-PJODQICGSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- HPYDSVWYXXKHRD-VIFPVBQESA-N Tyr-Gly Chemical compound [O-]C(=O)CNC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 HPYDSVWYXXKHRD-VIFPVBQESA-N 0.000 description 1
- AKLNEFNQWLHIGY-QWRGUYRKSA-N Tyr-Gly-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)O)C(=O)O)N)O AKLNEFNQWLHIGY-QWRGUYRKSA-N 0.000 description 1
- HIINQLBHPIQYHN-JTQLQIEISA-N Tyr-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=C(O)C=C1 HIINQLBHPIQYHN-JTQLQIEISA-N 0.000 description 1
- FIRUOPRJKCBLST-KKUMJFAQSA-N Tyr-His-Asp Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)O)C(=O)O)N)O FIRUOPRJKCBLST-KKUMJFAQSA-N 0.000 description 1
- ARJASMXQBRNAGI-YESZJQIVSA-N Tyr-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)N ARJASMXQBRNAGI-YESZJQIVSA-N 0.000 description 1
- WOAQYWUEUYMVGK-ULQDDVLXSA-N Tyr-Lys-Arg Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WOAQYWUEUYMVGK-ULQDDVLXSA-N 0.000 description 1
- WURLIFOWSMBUAR-SLFFLAALSA-N Tyr-Phe-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=CC=C2)NC(=O)[C@H](CC3=CC=C(C=C3)O)N)C(=O)O WURLIFOWSMBUAR-SLFFLAALSA-N 0.000 description 1
- XOVDRAVPGHTYLP-JYJNAYRXSA-N Tyr-Pro-Met Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCSC)C(O)=O XOVDRAVPGHTYLP-JYJNAYRXSA-N 0.000 description 1
- HRHYJNLMIJWGLF-BZSNNMDCSA-N Tyr-Ser-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 HRHYJNLMIJWGLF-BZSNNMDCSA-N 0.000 description 1
- WYOBRXPIZVKNMF-IRXDYDNUSA-N Tyr-Tyr-Gly Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)NCC(O)=O)C1=CC=C(O)C=C1 WYOBRXPIZVKNMF-IRXDYDNUSA-N 0.000 description 1
- RGJZPXFZIUUQDN-BPNCWPANSA-N Tyr-Val-Ala Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O RGJZPXFZIUUQDN-BPNCWPANSA-N 0.000 description 1
- RVGVIWNHABGIFH-IHRRRGAJSA-N Tyr-Val-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O RVGVIWNHABGIFH-IHRRRGAJSA-N 0.000 description 1
- 208000025865 Ulcer Diseases 0.000 description 1
- 101710159648 Uncharacterized protein Proteins 0.000 description 1
- DDRBQONWVBDQOY-GUBZILKMSA-N Val-Ala-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O DDRBQONWVBDQOY-GUBZILKMSA-N 0.000 description 1
- ASQFIHTXXMFENG-XPUUQOCRSA-N Val-Ala-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O ASQFIHTXXMFENG-XPUUQOCRSA-N 0.000 description 1
- ZLFHAAGHGQBQQN-AEJSXWLSSA-N Val-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N ZLFHAAGHGQBQQN-AEJSXWLSSA-N 0.000 description 1
- UUYCNAXCCDNULB-QXEWZRGKSA-N Val-Arg-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O UUYCNAXCCDNULB-QXEWZRGKSA-N 0.000 description 1
- HNWQUBBOBKSFQV-AVGNSLFASA-N Val-Arg-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HNWQUBBOBKSFQV-AVGNSLFASA-N 0.000 description 1
- IVXJODPZRWHCCR-JYJNAYRXSA-N Val-Arg-Phe Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N IVXJODPZRWHCCR-JYJNAYRXSA-N 0.000 description 1
- DNOOLPROHJWCSQ-RCWTZXSCSA-N Val-Arg-Thr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DNOOLPROHJWCSQ-RCWTZXSCSA-N 0.000 description 1
- COSLEEOIYRPTHD-YDHLFZDLSA-N Val-Asp-Tyr Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 COSLEEOIYRPTHD-YDHLFZDLSA-N 0.000 description 1
- LHADRQBREKTRLR-DCAQKATOSA-N Val-Cys-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](C(C)C)N LHADRQBREKTRLR-DCAQKATOSA-N 0.000 description 1
- NXRAUQGGHPCJIB-RCOVLWMOSA-N Val-Gly-Asn Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O NXRAUQGGHPCJIB-RCOVLWMOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- XXROXFHCMVXETG-UWVGGRQHSA-N Val-Gly-Val Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H](C(C)C)C(O)=O XXROXFHCMVXETG-UWVGGRQHSA-N 0.000 description 1
- CHWRZUGUMAMTFC-IHRRRGAJSA-N Val-His-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)CC1=CNC=N1 CHWRZUGUMAMTFC-IHRRRGAJSA-N 0.000 description 1
- YTUABZMPYKCWCQ-XQQFMLRXSA-N Val-His-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N YTUABZMPYKCWCQ-XQQFMLRXSA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- SYSWVVCYSXBVJG-RHYQMDGZSA-N Val-Leu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](C(C)C)N)O SYSWVVCYSXBVJG-RHYQMDGZSA-N 0.000 description 1
- DIOSYUIWOQCXNR-ONGXEEELSA-N Val-Lys-Gly Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O DIOSYUIWOQCXNR-ONGXEEELSA-N 0.000 description 1
- JVGHIFMSFBZDHH-WPRPVWTQSA-N Val-Met-Gly Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)NCC(=O)O)N JVGHIFMSFBZDHH-WPRPVWTQSA-N 0.000 description 1
- UXODSMTVPWXHBT-ULQDDVLXSA-N Val-Phe-His Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N UXODSMTVPWXHBT-ULQDDVLXSA-N 0.000 description 1
- GIAZPLMMQOERPN-YUMQZZPRSA-N Val-Pro Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(O)=O GIAZPLMMQOERPN-YUMQZZPRSA-N 0.000 description 1
- NHXZRXLFOBFMDM-AVGNSLFASA-N Val-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)C(C)C NHXZRXLFOBFMDM-AVGNSLFASA-N 0.000 description 1
- DEGUERSKQBRZMZ-FXQIFTODSA-N Val-Ser-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O DEGUERSKQBRZMZ-FXQIFTODSA-N 0.000 description 1
- UJMCYJKPDFQLHX-XGEHTFHBSA-N Val-Ser-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N)O UJMCYJKPDFQLHX-XGEHTFHBSA-N 0.000 description 1
- HWNYVQMOLCYHEA-IHRRRGAJSA-N Val-Ser-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N HWNYVQMOLCYHEA-IHRRRGAJSA-N 0.000 description 1
- LCHZBEUVGAVMKS-RHYQMDGZSA-N Val-Thr-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)C(C)C)[C@@H](C)O)C(O)=O LCHZBEUVGAVMKS-RHYQMDGZSA-N 0.000 description 1
- JAIZPWVHPQRYOU-ZJDVBMNYSA-N Val-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N)O JAIZPWVHPQRYOU-ZJDVBMNYSA-N 0.000 description 1
- ZNGPROMGGGFOAA-JYJNAYRXSA-N Val-Tyr-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C(C)C)C(O)=O)CC1=CC=C(O)C=C1 ZNGPROMGGGFOAA-JYJNAYRXSA-N 0.000 description 1
- 240000001866 Vernicia fordii Species 0.000 description 1
- 235000011453 Vigna umbellata Nutrition 0.000 description 1
- 240000001417 Vigna umbellata Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000269370 Xenopus <genus> Species 0.000 description 1
- 108010055615 Zein Proteins 0.000 description 1
- 101150067314 aadA gene Proteins 0.000 description 1
- 206010000210 abortion Diseases 0.000 description 1
- 231100000176 abortion Toxicity 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 210000000577 adipose tissue Anatomy 0.000 description 1
- 239000002671 adjuvant Substances 0.000 description 1
- 238000001042 affinity chromatography Methods 0.000 description 1
- 238000004220 aggregation Methods 0.000 description 1
- 150000001298 alcohols Chemical class 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- JFCQEDHGNNZCLN-UHFFFAOYSA-N anhydrous glutaric acid Natural products OC(=O)CCCC(O)=O JFCQEDHGNNZCLN-UHFFFAOYSA-N 0.000 description 1
- 239000008346 aqueous phase Substances 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Chemical group OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 108010043240 arginyl-leucyl-glycine Proteins 0.000 description 1
- 108010018691 arginyl-threonyl-arginine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 108010077245 asparaginyl-proline Proteins 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010092854 aspartyllysine Proteins 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 244000000005 bacterial plant pathogen Species 0.000 description 1
- 239000012148 binding buffer Substances 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Chemical compound BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 230000006860 carbon metabolism Effects 0.000 description 1
- 239000012159 carrier gas Substances 0.000 description 1
- 230000001925 catabolic effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 241000902900 cellular organisms Species 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 235000013330 chicken meat Nutrition 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 229960001231 choline Drugs 0.000 description 1
- OEYIOHPDSNJKLS-UHFFFAOYSA-N choline Chemical compound C[N+](C)(C)CCO OEYIOHPDSNJKLS-UHFFFAOYSA-N 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 210000000078 claw Anatomy 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 238000003501 co-culture Methods 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 230000000112 colonic effect Effects 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000003431 cross linking reagent Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 108010069495 cysteinyltyrosine Proteins 0.000 description 1
- 210000000172 cytosol Anatomy 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000007257 deesterification reaction Methods 0.000 description 1
- 230000035613 defoliation Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 108010049285 dephospho-CoA kinase Proteins 0.000 description 1
- 238000001212 derivatisation Methods 0.000 description 1
- 239000003599 detergent Substances 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 235000018823 dietary intake Nutrition 0.000 description 1
- 238000006471 dimerization reaction Methods 0.000 description 1
- 125000000118 dimethyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 238000002224 dissection Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000014103 egg white Nutrition 0.000 description 1
- 210000000969 egg white Anatomy 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000001804 emulsifying effect Effects 0.000 description 1
- 238000004146 energy storage Methods 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002615 epidermis Anatomy 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000003925 fat Substances 0.000 description 1
- 235000019197 fats Nutrition 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 238000005187 foaming Methods 0.000 description 1
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 1
- 238000004817 gas chromatography Methods 0.000 description 1
- 238000002873 global sequence alignment Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 125000000291 glutamic acid group Chemical group N[C@@H](CCC(O)=O)C(=O)* 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- 229930182470 glycoside Natural products 0.000 description 1
- 150000002338 glycosides Chemical class 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010062266 glycyl-glycyl-argininal Proteins 0.000 description 1
- 108010084264 glycyl-glycyl-cysteine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- 239000011544 gradient gel Substances 0.000 description 1
- 238000000227 grinding Methods 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 239000002515 guano Substances 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- PFOARMALXZGCHY-UHFFFAOYSA-N homoegonol Natural products C1=C(OC)C(OC)=CC=C1C1=CC2=CC(CCCO)=CC(OC)=C2O1 PFOARMALXZGCHY-UHFFFAOYSA-N 0.000 description 1
- 235000001050 hortel pimenta Nutrition 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- 238000005984 hydrogenation reaction Methods 0.000 description 1
- 238000011065 in-situ storage Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 210000000936 intestine Anatomy 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000004571 lime Substances 0.000 description 1
- 230000006372 lipid accumulation Effects 0.000 description 1
- 239000013554 lipid monolayer Substances 0.000 description 1
- 230000013190 lipid storage Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010062385 long-chain-alcohol O-fatty-acyltransferase Proteins 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 235000018977 lysine Nutrition 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010025153 lysyl-alanyl-alanine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 239000000594 mannitol Substances 0.000 description 1
- 235000010355 mannitol Nutrition 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000001819 mass spectrum Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 239000013028 medium composition Substances 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 108700023046 methionyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010090114 methionyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000013508 migration Methods 0.000 description 1
- 230000005012 migration Effects 0.000 description 1
- 229910000402 monopotassium phosphate Inorganic materials 0.000 description 1
- 239000004570 mortar (masonry) Substances 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 229930014626 natural product Natural products 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 238000006384 oligomerization reaction Methods 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 150000002923 oximes Chemical class 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 235000021017 pears Nutrition 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 210000002824 peroxisome Anatomy 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 108010074082 phenylalanyl-alanyl-lysine Proteins 0.000 description 1
- 108010082795 phenylalanyl-arginyl-arginine Proteins 0.000 description 1
- 108010065135 phenylalanyl-phenylalanyl-phenylalanine Proteins 0.000 description 1
- 108010024607 phenylalanylalanine Proteins 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 238000003976 plant breeding Methods 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920000136 polysorbate Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000037452 priming Effects 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 210000001236 prokaryotic cell Anatomy 0.000 description 1
- 230000009465 prokaryotic expression Effects 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 150000003147 proline derivatives Chemical class 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 108700042769 prolyl-leucyl-glycine Proteins 0.000 description 1
- AOHJOMMDDJHIJH-UHFFFAOYSA-N propylenediamine Chemical group CC(N)CN AOHJOMMDDJHIJH-UHFFFAOYSA-N 0.000 description 1
- 235000019833 protease Nutrition 0.000 description 1
- 108060006633 protein kinase Proteins 0.000 description 1
- 230000002797 proteolythic effect Effects 0.000 description 1
- 229940024999 proteolytic enzymes for treatment of wounds and ulcers Drugs 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 239000002516 radical scavenger Substances 0.000 description 1
- 238000003259 recombinant expression Methods 0.000 description 1
- 230000009712 regulation of translation Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 239000003813 safflower oil Substances 0.000 description 1
- 235000005713 safflower oil Nutrition 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 230000005562 seed maturation Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000012772 sequence design Methods 0.000 description 1
- 108010048818 seryl-histidine Proteins 0.000 description 1
- 108010048397 seryl-lysyl-leucine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 230000011664 signaling Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 239000002884 skin cream Substances 0.000 description 1
- 239000002002 slurry Substances 0.000 description 1
- 235000011152 sodium sulphate Nutrition 0.000 description 1
- AKHNMLFCWUSKQB-UHFFFAOYSA-L sodium thiosulfate Chemical compound [Na+].[Na+].[O-]S([O-])(=O)=S AKHNMLFCWUSKQB-UHFFFAOYSA-L 0.000 description 1
- 235000019345 sodium thiosulphate Nutrition 0.000 description 1
- AIDBEARHLBRLMO-UHFFFAOYSA-M sodium;dodecyl sulfate;2-morpholin-4-ylethanesulfonic acid Chemical compound [Na+].OS(=O)(=O)CCN1CCOCC1.CCCCCCCCCCCCOS([O-])(=O)=O AIDBEARHLBRLMO-UHFFFAOYSA-M 0.000 description 1
- WGRULTCAYDOGQK-UHFFFAOYSA-M sodium;sodium;hydroxide Chemical compound [OH-].[Na].[Na+] WGRULTCAYDOGQK-UHFFFAOYSA-M 0.000 description 1
- 239000011537 solubilization buffer Substances 0.000 description 1
- 239000002904 solvent Substances 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000010186 staining Methods 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 229910021653 sulphate ion Inorganic materials 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 235000012976 tarts Nutrition 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- RTKIYNMVFMVABJ-UHFFFAOYSA-L thimerosal Chemical compound [Na+].CC[Hg]SC1=CC=CC=C1C([O-])=O RTKIYNMVFMVABJ-UHFFFAOYSA-L 0.000 description 1
- 229960004906 thiomersal Drugs 0.000 description 1
- 230000035922 thirst Effects 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000005026 transcription initiation Effects 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- 239000012137 tryptone Substances 0.000 description 1
- 108010045269 tryptophyltryptophan Proteins 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010017949 tyrosyl-glycyl-glycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 108010071635 tyrosyl-prolyl-arginine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 230000036269 ulceration Effects 0.000 description 1
- 235000021081 unsaturated fats Nutrition 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 230000002485 urinary effect Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1025—Acyltransferases (2.3)
- C12N9/1029—Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/64—Fats; Fatty oils; Ester-type waxes; Higher fatty acids, i.e. having at least seven carbon atoms in an unbroken chain bound to a carboxyl group; Oxidised oils or fats
- C12P7/6436—Fatty acid esters
- C12P7/6445—Glycerides
- C12P7/6463—Glycerides obtained from glyceride producing microorganisms, e.g. single cell oil
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oil, Petroleum & Natural Gas (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Coloring Foods And Improving Nutritive Qualities (AREA)
- Liquid Carbonaceous Fuels (AREA)
- Fats And Perfumes (AREA)
- Fodder In General (AREA)
- Feed For Specific Animals (AREA)
Description
201127957 六、發明說明: 【發明所屬之技術領域】 本發明係關於用於在各種宿主細胞類型中產生油體及對 油體改質之組合物及方法。 【先前技術】 在自然界中’開花植物經由在其種子中積聚油(亦即三 酸甘油酯(TAG))有效地儲存能量,且藉由將磷脂蛋白單層 嵌入油體周圍而在個別油體中儲存能量。此等種子作物已 作為飼料用於多種農業應用中且近年來亦已用作生物燃料 之原料源。以單位重量計,脂質之能量含量大致為蛋白質 或碳水化合物之兩倍且因此格外關注提高各種物種(最值 得注意地’植物)之油含量。除能量態樣以外,油體自身 亦具有獨特特性且構成許多生物技術應用之基礎,該等應 用包括(但不限於)重組蛋白質之純化、多聚蛋白質複合物 之形成、乳化作用及生物活性物之傳遞。 遺憾的是,植物種子僅佔全部植物生物質量之極小百分 比且隨著對改良農業生產率及替代性能量之需要,認識到 當前由多種所投入的種子作物獲得之油產量係不足的。研 究工作不僅集中於提高植物種子内油生產之生產率且亦集 中於提高其他細胞類型及物種中之油生產的生產率。 傳統育種及突變誘發已在此領域中獲得愈來愈多的成 功;而遺傳工程改造已在產生提高的油含量之經改質有機 體中取得長足進步。某些團體已對油合成途徑之各個部分 進行研究以上調種子中之油產量,而另外一些團體則致力 151910.doc 201127957 於增加表示更大部分之生物質量的細胞類型中之油β 雖然遺傳工程改造已針對某些目標在提高油含量方面取 得一些進展,但仍留有重要難題。仍要實現種子中油體產 生之生產率的進一步提高且尚未實現在其他細胞類型及物 種中類似於植物種子中產生油體之方法。 【發明内容】 本發明提供用於產生具有不同穩定程度之油體的組合物 及方法。纟發明涉及產生具有Α工引入的半胱胺酸殘基之 呈改質油質蛋白。較佳在經改質《由質蛋白之N端及c端親 水性臂中引入人工引入之半胱胺酸殘基。 、經改質:¾質蛋白之表現允許在除維管植物之生殖組織以 外的新細胞類型及甚至其他物種中生成穩^性油體。當與 TAG合成酶組合時,本發明導sTAG以穩定性油體形式在 真核細胞中積聚及儲存。與未經改質細胞或甚至僅表現
另外’由宿主細胞(諸如大腸桿_、f醇酵母(户 加^)、釀酒酵母(& 、杜氏藻屬 *當脣組織中具有提高含量之TAG的植物提供用於動物 原料及生物燃料原料應用中之有用能源。
油質蛋白或由轉型細胞純化獲得之經 純化得到之重組經 油體。人造油體中之經改質 得之經改質油質蛋白可視情 151910.doc 201127957 況經由經改質油質蛋白中之半胱胺酸殘基進行交聯。可藉 由操縱氧化還原環境來控制交聯程度。亦可藉由改變經改 質油質蛋白中之半胱胺酸數量來調適交聯程度。 使用此等技術之組合,由經改質油質蛋白形成之油體可 針對其乳化特性經調適,以調節熱穩定性、化學穩定性及 肽酶抗性。 經改質油質蛋白亦可融合至相關蛋白質以形成融合蛋 白。融合蛋白(經改質油質蛋白加上相關蛋白質)可重組表 現於細胞或有機體中。以此方式,含有經表現融合蛋白之 油體可用於純化及傳遞相關蛋白質以供多種應用。 另外,油體可保護動物之胃及/或瘤胃内之TAG或至少延 遲TAG在其中之降解及/或生物氫化作用,使得來自丁八〇之 完整個別脂質由動物之腸吸收。因此,本發明亦適用於動 物之膳食攝取方面,尤其經由在植物中表現經改質油質蛋 白0 編碼具有人工引入之半胱胺酸的經改質油質蛋白之聚核苷酸 在第一態樣中,本發明提供編碼包括至少一個人工引 之半胱胺酸的經改質油質蛋白之聚核苷酸。術語油質蛋〇 亦包括油體固醇蛋白及油體鈣蛋白 '經改質油質蛋白因此 可選自經改質油質蛋白、經改質油體鈣蛋白或經改質油體 固醇蛋白。在-實施例中,㈣質油質蛋白為經改質油質 蛋白。在另一實施例中,經改質油質蛋 变白為經改質油體鈣 蛋白。在另一實施例中,經改質油質蛋 货白為經改質油體固 醇蛋白。各類型之油質蛋白(油質蛋白 冲體鈣蛋白及油 151910.doc 201127957 體固醇蛋白)之實例均在本文中描述。 在一實施例中,經改質油質蛋白包括至少兩個半胱胺 酸纟中至少-者經人工引入。在另一實施例中,經改質 油質蛋白包括至少兩個至至少十三個(亦即2、3、4、5、 8 9 1〇、1、12、13、14個或14個以上)人工引入 之半胱胺酸。在—實施例中,半耽胺酸經人工引入油質蛋 白之N端親水區中或油質蛋白之C端親水區中。在另一實 鲁 %例中,經改質油質蛋白包括至少一個在N端親水區中之 半胱胺酸及至少-個在c端親水區中之半耽胺酸。在另一 實施例巾胱胺酸實質上均勻地分佈於油質蛋白之_ 及C端親水區。 在另實施例令,聚核苷酸編碼包括經改質油質蛋白融 合至相關蛋白之融合蛋白。 構築體 在另一態樣中’本發明提供包含本發明之聚核苷酸的遺 # 傳構築體。在另一態樣中’本發明提供包含本發明之聚核 苷酸的表現構築體。在一實施例中,構築體中之聚核苷酸 可操作地連接於啟動子序列。在一實施例中,啟動子序列 能夠在植物之營養組織中驅動聚核苷酸之表現。在另一實 施例中’啟動子序列能夠在植物之種子中驅動聚核苷酸之 表現。在另一實施例中,啟動子序列能夠在植物之花粉中 驅動聚核苷酸之表現。在另一實施例中,啟動子序列能夠 在大腸桿菌細胞中驅動聚核苷酸之表現。在另一實施例 中,啟動子序列能夠在酵母細胞中驅動聚核苷酸之表現。 151910.doc 201127957 在另實施例中’啟動子序列能夠在藻類細胞中驅動聚核 苷酸之表現。 在另-態樣中’本發明提供含有編碼經改質中性脂質蛋 白之聚核苦酸的構築體。在一實施例中,構築體亦含有編 碼二酸甘油酯(TAG)合成酶之第二聚核苷酸。在各種實施 例中,構築體可連接至能夠在各種宿主細胞中驅動其表現 的啟動子序列。因此,本發明亦提供構築體誘導宿主細胞 表現經改質油質蛋白及/或TAG合成酶的用途。在各種實施 例中,表現經改質油質蛋白之構築體及表現TAG合成酶之 構築體可由相同或不同啟動子驅動。在又一實施例中,構 築體以適當位置及取向定位於適當功能性内源啟動子中以 便進行構築體之表現。在各種實施例中,構築體可表現於 細菌、植物、真菌或藻類細胞中。在一實施例中,當構築 體表現於植物細胞中時,該細胞可為營養、種子、花粉或 果實組織。 宿主細胞 在另一態樣中,本發明提供包含本發明之構築體的宿主 細胞。在另一態樣中,本發明提供經遺傳改質以包含本發 明之聚核苷酸的宿主細胞。在另一態樣中,本發明提供經 遺傳改質以表現本發明之聚核苷酸的宿主細胞。 亦表現TAG合成酶之宿主細胞 在另一實施例中,宿主細胞亦經遺傳改質以表現三酸甘 油酯(TAG)合成酶。在另一實施例中,宿主細胞經遺傳改 質以包含編碼三酸甘油酯(TAG)合成酶之核酸序列。在另 151910.doc 201127957 實施例中’宿主細胞包含表現構築體,其包括編碼三酸 甘油g旨(TAG)合成酶之核酸序列。 在另一實施例中’核酸可操作地連接於啟動子序列。在 另實施例中,啟動子序列能夠在植物之營養組織中驅動 核酸序列之表現。在一實施例中,啟動子序列能夠在植物 之種子中驅動核酸序列之表現。在一實施例中,啟動子序 列能夠在植物之花粉中驅動核酸序列之表現。 • 在另一實施例中,啟動子序列能夠在大腸桿菌細胞中驅 動聚核苷酸之表現。在另一實施例中,啟動子序列能夠在 酵母細胞中驅動聚核苷酸之表現。在另一實施例中,啟動 子序列能夠在藻類細胞中驅動聚核苷酸之表現。 宿主細胞類型 佰主細胞可為任何類型之細胞。在一實施例中,宿主細 胞為原核細胞。在另一實施例中,宿主細胞為真核細胞。 在一實施例中,宿主細胞係選自細菌細胞、酵母細胞、真 • 菌細胞、昆蟲細胞、藻類細胞及植物細胞《在一實施例 中,宿主細胞為細菌細胞。在另—實施例中,宿主細胞為 酵母細胞。在另-實施例中,宿主細胞為真菌細胞。在另 一實施例中,宿主細胞為昆蟲細胞。在另一實施例中,宿 主細胞為藻類細胞。在另一實施例中,宿主細胞為植物細 胞。 植物 在另二樣中本發明提供包含本發明之植物細胞的植 物。在另一態樣中,本發明提供包含本發明之構築體的植 151910.doc -9. 201127957 物。在另一態樣中,本發明提供經遺傳改質以包含本發明 之聚核苷酸的植物。在另一態樣中,本發明提供經遺傳改 質以表現本發明之聚核苷酸的植物。在另一實施例中,植 物表現由本發明之聚核苷酸編碼的經改質油質蛋白。 在另一實施例中,經改質油質蛋白表現於植物之營養組 織中。在另一實施例中’經改質油質蛋白表現於植物之種 子中。在另一實施例中,經改質油質蛋白表現於植物之花 粉中。 亦表現TAG酶之植物 在另一實施例中,植物亦經遺傳改質以表現三酸甘油酯 (TAG)合成酶。在另一實施例中,三酸甘油酯(TAG)合成酶 以經改質油質蛋白形式表現於相同組織中。 在另一實施例中’植物經遺傳改質以包含編碼三酸甘油 酯(TAG)合成酶之核酸序列。在另一實施例中,植物包含 表現構築體,其包括編碼三酸甘油酯(tag)合成酶之核酸 序列。 在另一實施例令,核酸可操作地連接於啟動子序列。 在另一實施例中’啟動子序列能夠在植物之營養組織中 驅動核酸序列之表現。在一實施例中,啟動子序列能夠在 植物之種子中驅動核酸序列之表現。在一實施例中,啟動 子序列能夠在植物之花粉中驅動核酸序列之表現。 具有人工引入之半珑胺酸的經改質油質蛋白多狀 在另一態樣中,本發明提供包括至少一個人工引入之半 脱胺酸的經改質油質蛋白。在另一態樣中,本發明提供由 131910.doc •10· 201127957 本發明之聚㈣酸編碼的經改質油質蛋白。在—實施例 中,經改質油質蛋白包括至少兩個半胱胺酸,其中至少一 者厶人工引入。在另一實施例中,經改質油質蛋白包括至 少兩個至至少十三個(亦即2、3、4、5、6、7、8、9、 12 13 14個或14個以上)人工引入之半胱胺酸。 在另-實施例中’經改質油質蛋白包括至少一個在_ 親水區中之半胱胺酸及至少一個在c端親水區中之半耽胺 φ S文在較佳貫施例中,半胱胺酸經人工引入油質蛋白之 N端親水區中或油f蛋白之c端親水區中。半胱胺酸較佳 實質上均勻地分佈於油f蛋白之N端與c端親水區之間。 具有包括人工引人之半脱胺酸的經改質油質蛋白之融合蛋白 在另〜、樣中本發明提供包含本發明之經改質油質蛋 白及相關蛋白質之融合蛋白。融合蛋白由此包含經改質油 質蛋白部分及相關蛋白質部分。 包含經改質油質蛋白之油體 • 在另一態樣中,本發明提供包含本發明之經改質油質蛋 白的油體。在另-態樣中,本發明提供包含至少兩個本發 明之經改質油質蛋白的油體。在一實施例中,至少兩個經 改質油質蛋白經由在經改質油質蛋白中之半耽胺酸殘基之 間的一硫橋彼此交聯。在另一實施例中,經改質油質蛋白 經由經改質油質蛋白中的人工引入之半胱胺酸殘基交聯在 —起0 在另一實施例中,油體另外包含融合蛋白,其中融合蛋 白包括油質蛋白融合至相關蛋白質。在此實施例中,融合 151910.doc •11- 201127957 蛋白中之油質蛋白無需包括人工引入之半胱胺酸。融合蛋 白中之油質蛋白較佳不包括人工引入之半胱胺酸。 此實施例之油體適用於純化及傳遞相關蛋白質’如在 Roberts等人,(2008)中所論述。 然而’在此實施例中’有可能藉由經改質油質蛋白存在 於油體中而任選改變油體之穩定性/完整性,由此實現更 嚴格之純化及傳遞程序。 包含具有經改質油質蛋白之融合蛋白的油體 在另一態樣中,本發明提供包含本發明之融合蛋白的油 體,融合蛋白包含本發明之經改質油質蛋白及相關蛋白 質。融合蛋白因此包含經改質油質蛋白部分及相關蛋白質 部分。 在一實施例中,油體包含至少兩個本發明之融合蛋白。 在一實施例中,至少兩個融合蛋白經由在融合蛋白之經 改質油質蛋白部分中的半胱胺酸殘基之間的二硫橋彼此交 聯》在一實施例中,融合蛋白經由融合蛋白之經改質油質 蛋白部分中的人工引入之半胱胺酸殘基交聯在一起。 在另一實施例中,油體包含至少一個本發明之經改質油 質蛋白。在另一實施例中,至少一個融合蛋白交聯至至少 一個經改質油質蛋白,其中經由在融合蛋白之經改質油質 蛋白部分中的半胱胺酸及在經改質油質蛋白中之半胱胺酸 進行交聯。 同樣,此實施例之油體適用於純化及傳遞相關蛋白質, 如在Roberts等人,(2008)中所論述。 151910.doc -12- 201127957 然而’在此實施例中’有可能藉由經改質油質蛋白存在 於油體中而任選改變油體之穩定性/完整性,由此實現更 嚴格之純化及傳遞程序。 匕實見更 乳液 在另-態樣中,本發明提供包含本發明之經改質油質蛋 白的乳液。在—實施例中,乳液包含經改質油質蛋白及適
合之載劑。載劑可經緩衝以具有適當氧化還原環境,由此 達到油質蛋白之所要交聯程度。 為:將經改質油質蛋白再懸浮於載财,可需要音波處 理或局壓均質化’接著暴露於適當氧化條件下。 組合物 在另〜樣中纟發明提供包含本發明之經改質油質蛋 白的、’且σ物。在一實施例中,組合物包含經改質油質蛋白 及適合之載劑。載劑可經緩衝以具有適當氧化還原環境, 由此達到經改質油質蛋白之所要交聯程度。 • 為了將經改質油質蛋白再懸浮於載劑中,可需要音波處 理或高壓均質化,接著暴露於適當氧化條件下。 在另-態樣中,本發明提供包含本發明之油體的組合 物。在一實施例中,組合物包含油體及適合之載劑。載劑 可、星緩衝以具有適當氧化還原環境,由此達到經改質油質 蛋白之所要交聯程度。在另一實施例中,本發明提供包含 本發明之油體的組合物,其經調配以供施用於皮膚。 包含本發明之油體之植物及其部分 在另態樣中,本發明提供包含本發明之油體的植物或 151910.doc -13- 201127957 其部分。在另-態樣中,本發明提供包含本發明之油體的 植物營養組織。在另—態樣中,本發明提供包含本發明之 油體的植物種子。 包含本發明之油體的動物飼料 在另-態樣中’本發明提供包含本發明之油體的動物飼 料。在另-態樣中,本發明提供包含本發明之植物或其部 分的動物飼料。 產生油體之方法 在另一態樣中’本發明提供產生油體之方法,該方法包 含組合以下之步驟: a) 至少兩個經改質油質蛋白,其各自包括至少一個人工引 入之半胱胺酸, b) 三酸甘油醋,及 c) 磷脂。 在一實施射,經改f油質蛋白各自包括至少兩個半胱 胺酸’其中至少一者經人工引入。在另一實施例中,經改 質油質蛋白各自包括至少一個在油質蛋白端親水區中 之半耽胺酸及至少一個在油質蛋白之c端親水區中之半胱 胺酸。 在另一實施例中,經改質油質蛋白包括至少兩個至至少 十三個(亦即 14個或14個以上)人工引入之半胱胺酸。 :::施例中’半胱胺酸經人工引入油質蛋白之N端親 水區中或油質蛋白之C端親水區中。在另-實施例中,半 1519I0.doc 201127957 胱胺酸實質上均勻地分佈於油質蛋白之N端與c端親水區 之間。在另一實施例中’經改質油質蛋白經由在油質蛋白 中之半胱胺酸殘基之間的二硫橋交聯在一起。在另一實施 例中’經改質油質蛋白於油質蛋白中的人工引入之半胱胺 酸殘基之間交聯。 在一實施例中,經改質油質蛋白為融合蛋白之一部分, 其中融合蛋白包含經改質油質蛋白及相關蛋白質。 在一實施例中,該方法包含藉由控制所產生油體之氧化 還原環境來調節油體中經改質油質蛋白之交聯程度的額外 步驟。 在活體内組合之所有組份(活體内油體) 在貫施例中,在宿主細胞内組合a)、b)及c)組份。在 此實施例中’經改質油質蛋白較佳表現於宿主細胞中。 宿主細胞較佳經遺傳改質以表現經改質油質蛋白。 估主細胞較佳包含本發明之構築體。宿主細胞較佳經遺 傳改質以包含本發明之聚核苷酸。宿主細胞較佳經遺傳改 質以表現本發明之聚核苦酸。 亦表現TAG合成酶之宿主細胞 在另一實施例中,宿主細胞亦經遺傳改質以表現三酸甘 油酯(TAG)合成酶。在另一實施例中,宿主細胞包含表現 構築體’其包括編碼三酸甘油酯(TAG)合成酶之核酸序 列。 在另一實施例中,核酸序列可操作地連接於啟動子序 列。在一實施例中,啟動子序列能夠在植物之營養組織中 151910.doc 15 201127957 驅動核酸序列之表現。在一實施例中,啟動子序列能夠在 植物之種子中驅動核酸序列之表現。在一實施例中,啟動 子序列能夠在植物之花粉中驅動核酸序列之表現。 在另一實施例中,宿主細胞亦經遺傳改質以包含編碼三 酸甘油醋(TAG)合成酶之核酸序列。在另一實施例中,宿 主細胞亦經遺傳改質以表現編碼三酸甘油酯(TAG)合成酶 之核酸序列。 熟習此項技術者應理解,編碼經改質油質蛋白之聚核苷 酸及編碼二酸甘油酯(TAG)合成酶之核酸序列可置於待轉 型至宿主細胞中的同一構築體或不同構築體中。其每一者 之表現可由相同或不同啟動子驅動,該等啟動子可包括於 待轉型之構築體中。熟習此項技術者亦應理解,聚核苷酸 及核酸或可轉型至不含啟動子之細胞中,但聚核苷酸及核 酸之表現可由轉型細胞之一或多個内源啟動子驅動。 在另一實施例中’宿主細胞構成有機體之一部分。在一 較佳實施例中,有機體為植物。 在另一實施例中,在植物之營養組織中產生油。 在該方法之一實施例中,植物積聚比適合之對照植物多 約50%至約400%之脂質。在該方法之另一實施例中,植物 積聚比適合之對照植物多約1 〇〇。/。至約3〇〇%之脂質。在該 方法之另一實施例中,植物積聚比適合之對照植物多約 150°/。至約250%之脂質。適合之對照植物包括品種及/或物 種與本發明方法中所用之轉型植物相同的植物之非轉型或 野生型型式。 151910.doc -16· 201127957 在另一實施例中,植物經加工為動物飼料。 在另一實施例中’植物經加工為生物燃料原料。 純化活體内產生之油體的額外方法步驟 在-實施例中’該方法包括自細胞或有機體純化油體之 額外步驟。 改變活體内產生之經純化油體之交聯程度的額外方法步驟 在另-實施例中,該方法包含藉由控制活體内產生之經 φ 純化油體之氧化還原環境來調節經純化油體中的經改質油 質蛋白之交聯程度的額外步驟。在一實施例中,藉由使用 氧化環境來提高交聯程度。在另一實施例中,藉由使用還 原環境來降低交聯程度。 活體外組合之組份(活體外/人造油體) 在某些實施例中,a)、b)及c)組份可於活體外組合。 在一實施例中,a)之經改質油質蛋白已重組表現於本發 明之宿主細胞中且自本發明之宿主細胞純化,隨後與…及 φ c)之組份組合。 改變活體外丨人造油體之交聯程度的額外方法步驟 在另一實施例中,該方法包含藉由控制氧化還原環境來 調節交聯程度之額外步驟’其中a)、b)及c)之組份經組 合。在一實施例中,藉由在氧化環境中組合a)、…及^之 組份來提尚交聯程度。在另一實施例中’藉由在還原環境 中組合a)、b)及c)之組份來降低交聯程度。交聯程度亦可 在油體形成之後藉由控制容納油體之氧化還原環境來調
ArAr 即 〇 151910.doc 201127957 在另一態樣中,本發明提供產生比適合之對照植物積聚 更多油之植物的方法,該方法包含提供用本發明之聚核苷 酉文轉型的植物,該聚核苷酸表現由其編碼之經改質油質蛋 在一實施例中,亦用編碼TAG合成酶之聚核苷酸轉型植 物以表現TAG合成酶且由此合成tag。 在一貫施例中,藉由以本發明之任一聚核苷酸及編碼 TAG合成酶之聚核苷酸轉型單一植物或植物細胞來產生植 物。 在另一實施例中’藉由使以本發明之任一聚核苷酸轉型 之第一植物與以編碼TAG合成酶之聚核苷酸轉型的第二植 物雜交來產生植物,從而產生以本發明之聚核苷酸及編碼 TAG合成酶之聚核苷酸轉型的植物。 在另一實施例中,油為TAG。在另一實施例中,在植物 之營養組織中產生油。 在該方法之一貫施例中,植物積聚比適合之對照植物多 約50°/。至約400。/。之脂質。在該方法之另一實施例中,植物 積聚比適合之對照植物多約1 〇〇%至約300%之脂質。在該 方法之另一實施例中’植物積聚比適合之對照植物多約 150%至約250%之脂質。 在另一實施例中’植物經加工為動物飼料。 在另一實施例中,植物經加工為生物燃料原料。 在另一態樣中,本發明提供在宿主細胞中產生油體之方 法,該方法包含: 151910.doc -18- 201127957 a) 將至少一個編碼本發明之經改質油質蛋白之核酸分子引 入宿主細胞中;及 b) 培養宿主細胞以表現經改質油質蛋白。 在另一態樣中’本發明提供在宿主細胞中產生油體之方 法,該方法包含: a)將至少一個編碼本發明之經改質油質蛋白之核酸分子及 一個編碼TAG合成酶之核酸分子引入宿主細胞中;及 φ b)培養宿主細胞以表現經改質油質蛋白及TAG合成酶。 宿主細胞可為如本文中所述之宿主細胞。 油體 在另一態樣中,本發明提供由本發明方法產生的油體。 組合物 在另一態樣中,本發明提供包含本發明之油體的組合 物。在-實施例中,組合物包含油體及適合之載劑。載劑 可經緩衝以提供適當氧化還原環境,從而保持經改質油質
蛋白之所要父聯程度。在另一實施例中,本發明提供包含 本發明之油體的組合物,其經調配以供施用於皮膚。 包含本發明之油體的植物及其部分 在另1樣中’本發明提供包含本發明之油體的植物或 其部分。在另—態樣中’本發明提供包含本發明之油體的 植物營養組織。在另-態樣中,本發明提供包含本發明之 油體的植物種子。在另'態樣中,本發明提供包含本發明 之油體的植物花粉。在另-態樣中,本發明提供包含本發 明之油體的植物果實或子實體。 151910.doc '19· 201127957 包含本發明之油體的動物飼料 在另ϋ樣中’本發明提供包含本發明之油趙的動物飼 料在另態樣中,本發明提供包含本發明之植物或其部 分的動物飼料。 在-實施例中,飼料適合於包括人類之哺乳動物。在另 -實施例中’飼料適合於非人類哺乳動物。較佳動物包括 農畜,諸如(但不限於)牛、綿羊、馬、山羊豬雞及其 類似家畜。 植物 經改質油質蛋白可為經改質之天然存在之油質蛋白。可 衍生出未經改質之油質蛋白序列的植物可來自含有油質蛋 白及編碼油質蛋白之聚核苷酸序列的任何植物物種。 表現經改質油質蛋白之植物細胞可來自任何植物物種。 表現經改質油質蛋白之植物可來自任何植物物種。 在一實施例中’植物細胞或植物源自裸子植物物種。 在另一實施例中,植物細胞或植物源自被子植物物種。 在另一實施例中,植物細胞或植物源自雙子葉植物物 種。 在另一實施例中,植物細胞或植物源自單子葉植物物 種。 其他較佳植物為來自包含但不限於以下各屬之群的草料 植物物種.玉蜀泰屬(Zea)、黑麥草屬、大麥屬 (//orAwm)、芒屬、甘蔗屬(《Sacc/mrMw)、牛毛 草屬(Fesiwca)、雞腳茅屬、雀麥屬、偃 151910.doc -20- 201127957 麥萆屬(Thinopyrum)、三葉萆屬(Trifolium)、售蓿餍 (Me山'cago)、梯牧草屬(尸、金絲雀草屬(户/^/^/5·)、 絨毛草屬(i/o/cwi)、大豆屬(G(yci«e)、蓮屬(1〇加)、車前 草屬(Plantago)及菊隻屬(Cichorium)。 其他較佳植物為豆科植物。豆科植物或其部分可涵蓋在 豆科(Leguminosae或Fabaceae)植物科中之任何植物。舉例 而言’該等植物可選自草料豆科(legUmes),包括苜蓿草、 φ 二葉草;銀合歡;榖物豆科,包括豆、小扁豆、羽扇豆、 婉豆、花生、大豆;開花豆科,包括羽扇豆;藥用或工業 用豆科;及休耕或綠肥豆科物種。 尤其較佳之屬為三葉草屬。較佳之三葉草物種包括白三 葉專{Trifolium repens、·,兔瓦三案萆(Trif〇Uum arvens〇., 親和三葉萆(Trifolium affine);反類白三葉萆(Trif〇Hum 尤其較佳之三葉草物種為白三葉草。 另一較佳屬為苜蓿屬。較佳之苜蓿物種包括紫苜蓿 • (Μβ山·及蒺藜苜蓿(从山⑺別卜㈣⑺〜/幻。尤其 較佳之苜蓿物種為紫苜蓿,常稱為苜蓿草。 另一較佳屬為大豆屬。較佳之大豆物種包括大豆 ⑽所似)及爪哇大豆(G/ycz_we 亦稱為爪哇大 豆(;Ve〇W〇i〇⑴·β W幼出)卜尤其較佳之大豆物種為大豆 (Glycine max),常稱為大豆(s〇y心⑽)。尤其較佳之大豆 物種為爪啥大豆,常稱為野生大豆—⑽)。 另一較佳屬為豇豆屬。尤其較佳之豇豆物種為豇 豆(^似㈣^cw/a⑷,常稱為紅豆(c〇。 151910.doc •21 - 201127957 另一較佳屬為絮豆屬⑽)。較佳之黧豆物種包括刺 毛f豆(mucana pruniens)。尤其較佳之黧豆物種為剌毛愛 豆,常稱為黧豆(velvetbean)。 另一較佳屬為花生屬。尤其較佳之花生物種為 多年生花生(Arachis glabrata),常稱為多年生花生 (perennial peanut) ° 另一較佳屬為婉豆屬謂)。較佳豌豆物種為碗豆 (PbMWiahvww)’ 常稱為婉豆(pea)。 另一較佳屬為蓮屬。較佳之蓮物種包括百脈根(L〇tus · cormculatus)、長柄百脈根(Lotuspedunculatus)、窄葉百脈 根(Lotus glabar)、細葉百脈根(Lotus tenuis)及大百脈根 (Lotus uliginosus)。較佳之蓮物種為百脈根,常稱為角果 百脈根(Birdsfoot Tref0i丨)。另一較佳蓮物種為窄葉百脈 根,常稱為窄葉角果百脈根。另一較佳蓮物種為長柄百脈 根,常稱為濕地百脈根(Big trefoil)。另一較佳蓮物種為細 葉百脈根,常稱為細長百脈根(Slender tref〇il)。 另一較佳屬為芸苔屬〇較佳之芸苔物種為羽籲 衣甘藍(仏^^⑹,常稱為草料甘藍菜(f〇rage kale)及甘藍(cabbage)。 其他較佳物種為含油種子作物,包括(但不限於)以下各 屬.云台屬、紅花屬(Carthumus) '向曰葵屬、玉蜀黍屬及 芝麻屬(Sesamum)。 較佳含油種子屬為芸苔屬。較佳含油種子物種為甘藍型 151910.doc -22· 201127957 較佳含油種子屬為芸苔屬。較佳含油 ^(Brassicaoleraceae)» 子物種為羽衣甘 較佳含油種子屬為玉蜀黍屬。較佳含油種子物種為玉米 (Zea mays)。 八 較佳含油種子屬為紅花屬。較佳合油 · 乂佳3,由種子物種為紅花軒 軍(Carthamus tinctorius)。 /交佳含油種子屬為向曰葵屬。較佳含油種子物種為向曰 葵(Helianthus annuus) ° 較佳含油種子屬為玉蜀黍屬。較 1 3 /由種子物種為玉 米。 車乂佳含油種子屬為芝麻屬。較佳含 /0 3 '由種子物種為芝麻 (Sesamum indicum)。 較佳青貯料屬為玉蜀黍屬。較佳青貯料物種為玉米。 較佳縠物生產屬為大麥屬(Hord時較佳穀物:產物 種為大麥(Hordeum vulgare)。 較佳牧草屬為黑麥草屬。較4 4 . 广早濁較佳牧卓物種為黑麥草 (Lolium perenne)。 較佳牧草屬為黑麥草屬。輕往料 • 广平每权佳牧草物種為黑麥草 (Lolium arundinaceum) ° 較佳牧草屬為三葉草屬。較佳牧草物種為白三葉草。 較佳牧草屬為大麥屬。較佳牧草物種為大麥。 較佳植物亦包括草料,或動物原料植物。該等植物包括 (但不限於)以下各屬:芒屬、甘薦屬、黍屬叫。 較佳生物燃料屬為芒屬。較佳生物燃料物種為巨芒 I51910.doc -23- 201127957 (Miscanthus giganteus) 〇 較佳生物燃料屬為甘落显 土丄 興α甘庶屬。較佳生物燃料物種為甘蔗 (Saccharum officinarum) 〇 較佳生物燃料屬為黍屬。較佳生物燃料物種為柳枝稷 (Panicum virgatum)。 【實施方式】 在本說月書巾般出於提供論述本發明特徵之背景的 目的而參考專利說明書、其他外部文獻或其他資訊來源。 除非另外特別提出,否則對該等外部文獻之參考不應理解 為以任何權限認可該等文獻或該等資訊來源為先前技術或 構成此項技術中的一般常識之一部分。 本說明書中所用術語「包含(c〇mprising)」意謂「至少 部分由…組成」。當解釋本說明書中包括術語「包含」之 各句時,不同於以該術語為前言之彼特徵或彼等特徵的特 徵亦可此存在。諸如「包含(C〇mprise)」及「包含 (comprises)」之相關術語欲以相同方式解釋。 以重量比計’脂質之能量含量大致為蛋白質或碳水化合 物之兩倍。大部分自然界之脂質係由植物產生且脂質之最 稠密形式為三酸甘油酯(TAG) ^雙子葉植物可積聚多達約 60%之其種子重量的TAG,TAG隨後用作發芽之能源。因 而’許多研究工作靶向使用富含油之種子以持續產生用於 動物及生物燃料原料之足夠脂質。 倘若種子僅能產生有限數量之TAG,則將採用替代性方 法以在營養組織中產生額外脂質(較佳為TAG) »大部分此 151910.doc •24- 201127957 等方法已在植物之葉子中上調或過度表現肯尼迪 (Kennedy)路徑中之一或若干種酶以合成tag»然而,大部 分藉由此方法產生之額外脂質通常在植物内藉由脂肪酶及 β-氧化作用之組合再移動’使得脂質含量有限增加(通常為 2-4%之 DM)。 在發育種子中產生之TAG通常容納於稱為油體(〇B)之個 別結構中’ OB高度穩定且保持個別密封細胞器形式,甚 至當細胞脫水或經歷冷凍條件時亦不聚結(SU0t0等人, 2006 ; Shimada等人,2008) » OB由嵌有蛋白質乳化劑之磷 脂單層圍繞TAG核心組成。蛋白質乳化劑構成0.5-3.5%之 OB ’其中80-90%為油質蛋白,其餘主要由約結合(油體約 蛋白)及固醇結合(油體固酵蛋白)蛋白組成(Lin及Tzen, 2004)。油質蛋白之乳化特性來源於其三個功能域,該等 功能域由兩性N端臂、高度保守之中心疏水核心(約72個殘 基)及C端兩性臂組成。類似地,油體鈣蛋白及油體固醇蛋 白皆具有親水性N端及C端臂及其自身保守之疏水核心。 先前已推測在葉中具有TAG合成酶之油質蛋白或聚油質 蛋白(油質蛋白之串聯頭尾相接融合體)之組成性表現將導 致形成穩定性油體,從而使得TAG發生積聚。然而,吾人 後來發現’油質蛋白及聚油質蛋白當在植物葉子中與 DGAT1共表現時無效且促使TAG發生積聚(Roberts事乂, 資料未公開)。 本發明提供經改質油質蛋白,其含有一或多個人工引入 之半胱胺酸殘基。由含有經工程改造之半胱胺酸的油質蛋 151910.doc •25· 201127957 白囊封中性脂質提供在葉中積聚可評估數量之TAG同時無 需等待至衰老且不產生極端表型的替代性機制《另外,經 改質油質蛋白具有許多其他應用,包含對OB穩定性、乳 液特性改質以及產生及純化重组蛋白質。 油體 OB之直徑一般在0.5 — 2.5 μιη之範圍内且由嵌有蛋白質乳 化劑(主要為油質蛋白)之磷脂單層圍繞Tag核心組成(Tzen 等人,1993 ; Tzen等人,1997)。蛋白質僅佔OB之0.5- 3.5°/。;其中80-90。/。為油質蛋白,其餘主要由鈣結合(油體 鈣蛋白)及固醇結合(油體固醇蛋白)蛋白組成(Lin及Tzen, 2004”植物細胞内油質蛋白與TAG之比率影響細胞内油 體之尺寸及數量(Sarmiento等人,1997 ; Siloto等人, 2006) ° 雖然OB主要在許多植物之種子及花粉中天然產生,但 其亦見於一些其他器官(例如,特定塊莖)中。 油質蛋白為比較小(15_24 kDa)之蛋白質,其嵌入〇B表 面。 油體穩定性 油體及人造油趙在尤其上文所討論之應用中的適用性至 少部分受限於其穩定性。-種處理油體穩定性之方法係產 生包含所謂聚油質蛋白之油體。聚油質蛋白為兩個或兩個 以上油質蛋白單元之gg θ α 頭尾相接之融合體(Roberts等人 2008)。改變油質蛋白單元 ’ 之數量自b夠使油體之特性(熱穩 定性及降解速率)經調適。 〆質蛋白在植物申之 151910.doc -26 - 201127957 表現導致聚油質蛋白單元按單一油質蛋白單元併入油體中 (Scott等人,2007)。使用呈串聯頭尾相接排列之多個油質 蛋白單元製造聚油質蛋白。各別構築體(含有丨至6個油質 蛋白重複單元)經特別設計以供在植物及大腸桿菌中表 現。大部分重組聚油質蛋白積聚於轉殖基因植物之油體中 及大腸㈣之包涵體中。使用經純化的原核生物產生之聚 油質蛋白產生人造油體。聚油質蛋白提高蛋白酶劣中油體 及人造油體之熱穩定性及結構完整性。 然而,存在若干限制因素,其決定聚油質蛋白可提供之 保護程度/穩定性;此等因素與可在轉譯過程之前接合在 -起之串聯重複單元之數量有關且油體靶向成為限制 (Scott等人,2007);而另一限制來自藉由產生具有頭尾相 接之融合排列的轉錄物而實現的油質}白融合體之性質。 此轉錄物基本上為多聚油質蛋白重複單元之線性蛋白質, 其在每-㈣油質蛋白重複單S上具有許多共價鍵聯及共 價鍵聯之位置(亦即在各末端之最大值)。另外,此排列僅 提供針對N端降解蛋白質之保護,但其不提供針對其他識 別特定㈣肽序狀蛋白水解酶的任何額外㈣。此外, 在聚油:蛋白分子中油質蛋白單元之間藉由頭尾相接之串 聯重複單兀形成的鍵聯不易當場改變。雖然特定蛋白酶特 異I·生位點可經工程改造至接合區中以使嵌人油體或人造油 體中之融合聚油質蛋白分子分裂開,但該等分子不易再融 合〇 嵌入油體中之油質蛋白先前已藉由添加諸如戊二酸或京 151910.doc -27· 201127957 尼平(gene㈣之交聯劑而共價交聯在一起(peng等人,2謝 & 2006)然而& 機交聯需要將交聯劑添加至油體製 劑中,且不易逆向》 人造油體 原核生物表現之重組油質蛋白可用於產生人造油體 (AOB) ’其特性與植物來源之〇B極其相&(peng等人, 2004,R〇ux 等人,2004 ; Chiang 等人,2005 ; Chiang 等人, 2007) 〇 應用油體及人造油體 油體及其組成性油質蛋白之獨特特性構成許多生物技術 應用之基礎:純化重組蛋白質;形成多聚蛋白質複合物; 乳化作用;傳遞生物活性物;產生多價生物活性物且甚至 用作潛在香味增強劑(關於評論,參見Capuan〇等人,2〇〇7 及 Roberts 等人,2008)。 乳液 當一或多種液體(其與另一液體不混溶)通常因不同極性 及由此不同疏水性而均勻懸浮於另一液體中時,產生乳 液。實例包括均勻分散於水中之油滴或均勻分散於油中之 水滴。產生相對穩定之乳液需要使用乳化劑,其降低液體 之間的界面張力。一般根據在指定條件下保持均勻分散之 持續時間來量測乳液之穩定性。乳化劑常用於食品及化妝 品產業中;故需要具有高乳化穩定性且對於消費及局部施 用而言係安全的。 含有油質蛋白之完整油體天然形成不含界面活性劑之水 151910.doc -28- 201127957 包油乳液。已發現完整油體或其中大部分TAG已經移除之 油體在食品、局部個人護理(護膚霜)及醫藥調配物中具有 廣泛乳化應用(Harada等人,2002 ; Deckers等人,2003 ; Hou等人,2003)。 生物氫化作用 已證明反羁動物飼料之脂質概況又會影響肉及乳製品之 脂質概況(Demeyer及Doreau,1999)。不同植物具有不同脂 質概況;藉由僅以具有所要脂質概況之植物選擇性餵養動 物’有可能積極地影響下游肉及乳製品之脂質概況。在反 岛動物中’肉及乳汁之最終脂質構成不僅受膳食脂質影 響’且亦受生物氫化作用顯著影響(Jenkins及McGuire 2006 ; Firkins等人,2006 ; Lock及 Bauman, 2004)。生物氫 化作用為藉由瘤胃中存在之生物群實現的非還原化合物 (諸如不飽和脂肪)之氫化作用。可藉由將脂質囊封於提供 微生物降解抗性之蛋白質中防止/延遲生物氫化作用 (Jenkins及Bridges 2007) »在植物中藉由將三酸甘油酯囊 封於聚油質蛋白或油質蛋白中來防止生物氫化作用係由
Scott 等人,(2007),Cookson 等人,(2009)及 Roberts 等人, (2008)報導。 油質蛋白
油質蛋白為比較小(15至24 kDa)之蛋白質,其使得〇B成 為密封的個別細胞器,當細胞脫水或經歷冷凍條件時〇B 不聚結(Leprince 等人,1998 ; Siloto 等人,2006 ; Slack 等 人,1980 ; Shimada等人,2008)。 151910.doc •29· 201127957 油質蛋白具有三個功能域,該等功能域由兩性N端臂、 高度保守之中心疏水核心(約72個殘基)及C端兩性臂組 成。可接受之拓撲學模型為如下模型,其中N端及C端兩 性臂位於OB外部且中心疏水核心位於〇B内部(Huang, 1992 ; Loer及 Herman,1993 ; Murphy,1993)。N端及 C端兩 性臂之帶負電荷殘基暴露於水相外部,而帶正電荷殘基暴 露於OB内部且面向帶負電荷脂質。因此,向外面向負電 荷之兩性臂負責使〇B經由活體内及離體標本中之空間位 阻及靜電排斥維持個別實體(Tzen等人,1992)。N端兩性臂 高度變異且因此無特定二級結構可描述所有實例。相比而 言’ C端臂含有30-40個殘基之α_螺旋域(Tzen等人,2003)。 中〜核心尚度保守且認為其係已知存在於自然界中之最長 疏水區;在中心處有保守的12個殘基之脯胺酸結基元,其 包括二個間隔之脯胺酸殘基(關於評論,參見Frandsen等 人’ 2001 ; Tzen等人,2003)。尚不清楚中心域之二級、三 級及四級結構。存在許多不同排列之模型化、傅立葉變 換-紅外線(FT-IR)及圓二色性(CD)證據(關於評論,參見
Roberts等人,2008) » 主要油質蛋白之特性在植物之間相對保守且特徵如下: •對應於約140-230個胺基酸殘基之15_25kDa蛋白質。 蛋白質序列可沿其長度分為幾乎相同之4個部分,該等 部分對應於N端親水區、兩個令心疏水區(由脯胺酸結或 節接合)及C端親水區。 •油質蛋白之拓撲係歸因於其物理特性,包括由親水域側 151910.doc •30· 201127957 接摺疊之疏水核心。此排列向油質蛋白賦予兩性性質, 使得疏水域嵌入構脂單層中梦, 1 Zen4人,1992),而側接 之親水域暴露於細胞質之含水環境中。 •油質蛋白通常不含半胱胺酸。 用於本發明之較佳油質蛋白為如下油質蛋白盆含有約 7〇個非極性胺基酸殘基(包括脯胺酸結)之中心域,該中心 域不由任何帶電殘基中斷’以兩個親水性臂側接。 "
本文令所用術語「油質蛋白」亦包括油體固醇蛋白及油 體鈣蛋白。 油體固醇蛋白 油體固醇蛋白包含N端錨定區段,該區段包含兩個兩性 螺旋(各螺旋上有912個殘基),其由14個殘基之疏水性錨 定區連接。可溶性脫氫酶域含#NADp+結合子域及固醇結 合子域。油體固醇蛋白-A與_B之明顯區別在於其不同的固 醇結合子域(Lin及Tzen,2004卜油體固醇蛋白在其疏水域 中具有脯胺酸節且在其-個親水性臂中含有固醇結合脫氫 酶。 油體鈣蛋白 油體鈣蛋白(Frandsen等人,2001)具有與鹼性油質蛋白梢 微不同之脯胺酸結且在親水性臂中含有鈣結合基元及若干 '曰在磷酸化位點。提出油體辦蛋白類似於油質蛋白具有三 個結構域,其中N端及c端臂為親水性的,而中心域為疏 水性的且用作油體錨定部。N端親水域由28個殘基之螺旋_ 轉角-螺紅鈣結合EF手基元組成,該基元包括不變甘胺酸 1519l0.doc 31 201127957 殘基作為結構轉向點及5個保守含氧殘基作為鈣-結合配位 體(Chen等人,1999 ; Frandsen等人,2001)。C端親水域含 有若干磷酸化位點且靠近C端處為不涉及任何内部或中間 二硫鍵聯的不變半胱胺酸(Peng,2004)。油體鈣蛋白之親 水性N端及C端為油質蛋白之親水性N端及C端的約3倍大 (Lin及Tzen,2004)。認為疏水域由兩性α-螺旋及錨定區(其 包括脯胺酸結)組成。 適於藉由添加至少一個人工引入之半胱胺酸經改質用於 本發明之油質蛋白(油質蛋白、油體固醇蛋白及油體鈣蛋 白)序列之實例展示於下表1中。(聚核苷酸及多肽)序列提 供於序列表中。 表1 油質蛋白 物種 cDNA寄存编號 SEQ ID NO: 蛋白質 寄存編號 SEQ ID NO: 油質蛋白 芝麻 AF302907 34 AAG23840 35 油質蛋白 芝麻 U97700 36 AAB58402 37 油質蛋白 擬南芥 (A. thaliana) X62353 38 CAA44225 39 油質蛋白 擬南芥· BT023738 40 AAZ23930 41 油質蛋白 向日葵 X62352.1 42 CAA44224.1 43 油質蛋白 甘藍型油菜 X82020.1 44 CAA57545.1 45 油質蛋白 玉米 ΝΜ_001153560.1 46 NP_001147032.1 47 油質蛋白 紫苜蓿 AAL40177.1 48 AAL40177.1 49 油質蛋白 羽衣甘藍 AF117126.1 50 AAD24547.1 51 油質蛋白 咖 (C. arabica) AY928084.1 52 AAY14574.1 53 油體固醇 蛋白 芝麻 AAL13315 54 AAL13315 55 油體固醇 蛋白 甘藍型油菜 EU678274 56 ACG69522 57 油體固醇 蛋白 玉米 NM_001159142.1 58 NP_001152614.1 59 151910.doc •32· 201127957
油體固醇 蛋白 甘藍型油菜 EF143915.1 60 ABM30178.1 61 油體鈣蛋 白 芝麻 AF109921 62 AAF13743 63 油體鈣蛋 白 大豆 AF004809 64 AAB71227 65 油體鈣蛋 白 玉米 NM—001158434.1 66 NP_001151906 67 油體鈣蛋 白 甘藍型油菜 AY966447.1 68 AAY40837 69 油體鈣蛋 白 鐵樹 (C. revoluta) FJ455154.1 70 ACJ70083 71 油體鈣蛋 白 番紅花 (C. sativus) EU232173.1 72 ABY56103.1 73 油質蛋白、油體固醇蛋白及油體鈣蛋白為熟習此項技術 者所熟知。其他來自許多不同物種之序列可易於藉由熟習 此項技術者所熟知之方法來鑑別。舉例而言,其他序列可 易於藉由 NCBI Entrez Cross-Database Search(獲自 http://www.ncbi.nlm.nih.gov/sites/gquery),使用術語油 質蛋白、油體固醇蛋白及油體鈣蛋白中之任一者來鑑別。 植物脂質生物合成 所有植物細胞均藉由侷限於質體中之共同路徑由乙醯輔 酶A產生脂肪酸。雖然新近合成之醯基鏈之一部分隨後用 於質體内之脂質生物合成(原核細胞路徑),但大部分排入 細胞溶質中以供在内質網(ER)或其他位點處進行甘油脂質 裝配(真核細胞路徑)。此外,一些質體外甘油脂質回到質 體中,引起質體與ER脂質池之間值得注意的混合 (Ohlrogge及 Jaworski,1997)。 對脂肪酸生物合成之質體路徑的最簡單描述係其由兩個 酶系統:乙醯輔酶A羧化酶(ACCase)及脂肪酸合成酶(FAS) 151910.doc -33- 201127957 組成。ACCase催化由乙醯輔酶A形成丙二醯-CoA,且FAS 將丙二醯基部分轉移至醯基載運蛋白(ACP)上且催化以丙 二醯基-ACP進行增長之醯基鏈之延長。 由3-酮醯基-ACP III(KAS III)催化初始脂肪酸合成反 應,導致乙醯輔酶A與丙二醯基-ACP發生縮合反應。由 KAS I及KAS II催化後續縮合反應。在脂肪酸合成之下一 循環開始之前,3-酮醯基-ACP中間物在保留FAS之反應中 還原為飽和的醢基-ACP,該等反應由3-酮醯基-ACP還原 酶、3羥基醯基-ACP脫水酶及烯醯基- ACP還原酶依次催 化。 FAS之最終產物通常為16:0及18:0-ACP,且植物細胞之 最終脂肪酸組成在很大程度上由在脂肪酸合成之最終階段 使用此等醯基-ACP之若干酶之活性決定。硬脂醯基-ACP 去飽和酶藉由在C18:0-ACP之9位處插入順式雙鍵對FAS之 最終產物改質。藉由自ACP水解或轉移醯基鏈終止脂肪酸 合成反應。水解係藉由醯基-ACP硫酯酶催化,該等硫酯酶 有兩個主要類型:一種硫酯酶對18:1-ACP具有相對特異性 且第二硫酯酶對飽和醯基-ACP具有更高特異性。已藉由硫 酯酶自ACP釋放之脂肪酸離開質體且進入真核細胞脂質路 徑中,在該路徑中脂肪酸最初在ER上經酯化為甘油脂質。 與硫酯酶相反,質體中之醯基轉移酶藉由將來自ACP之醯 基部分轉酯至甘油來終止脂肪酸合成,且其為引起質體甘 油脂質裝配的原核細胞脂質路徑之基本部分。 三酸甘油酯生物合成 151910.doc -34- 201127957 TAG生物合成中之唯一關鍵步驟為最後一步,亦即第三 脂肪酸加成至現存二酸甘油醋,由此產生TAG。在植物 中,此步驟主要(但非專門)由5種(主要侷限於ER)TAG合成 酶之一者執行,該等合成酶包括:醯基輔酶A:二酸甘油酯 醯基轉移酶(DGAT1);不相關醯基輔酶A:二酸甘油酯醯基 轉移酶(DGAT2);與DGAT1或DGAT2具有小於10%—致性 之可溶性DGAT(DGAT3)(Saha等人,2006);磷脂醯膽鹼-固 醇0-醯基轉移酶(PDAT);及蠟合成酶(WSD 1,Li等人, 2008) 〇 DGAT1及DGAT2蛋白質由兩種不同基因家族編 碼,其中DGAT1含有大約500個胺基酸及10個預測跨膜域 且DGAT2僅具有320個胺基酸及兩個跨膜域(Shockey等人, 2006) ° 本文中所用術語「三酸甘油酯合成酶」或「TAG合成 酶」意謂能夠催化第三脂肪酸加成至現存二酸甘油酯上以 由此產生TAG的酶。較佳之TAG合成酶包括(但不限於): 醯基輔酶A:二酸甘油酯醯基轉移酶1 (DGAT1);二酸甘油 酯醯基轉移酶2(DGAT2);磷脂醯膽鹼-固醇0-醯基轉移酶 (PDAT)及細胞溶質可溶形式之DGAT(可溶性DGAT或 DGAT3)。 倘若内源性DGAT1及DGAT2在成熟及衰老之葉中發揮作 用(Kaup等人,2002 ; Shockey等人,2006),則植物有可能 具有許多反饋機制來控制其活性。實際上,Zou等人 (2008)最近在旱金蓮(TVopaeo/Mw mayws)(園藝旱金蓮) DGATl(TmDGATl)序歹ij内鑑別出共同序列(X-Leu-X-Lys- 151910.doc -35- 201127957 X-X-Ser-X-X-X-Val)作為 SNF1相關蛋白激酶-l(SnRKl)之 成員特有的標靶基元,其中Ser為用於磷酸化之殘基。 SnRKl蛋白質為一類Ser/Thr蛋白激酶,其曰益牵涉於植物 中碳代謝之全面調節中,例如藉由磷酸化作用使磷酸蔗糖 合成酶滅活(Halford及Hardie,1998)。Zou等人(2008)接著 證明藉由單點突變(TmDGATl之Serl97Ala)消除DGAT1中 之潛在SnRKl磷酸化位點造成在種子中積聚顯著增加含量 之TAG »此突變使活性提高38-80%,由此使得芥菜屬中之 油含量以每一種子計增加20-50%。 磷脂:DGA醯基轉移酶(PDAT)由一個磷脂分子及一個二 酸甘油酯分子形成TAG。PDAT當表現於酵母中時極具活 性,但當表現於植物種子中時不能明顯提高TAG產量。 PDAT及所提出之DAG:DAG醯基轉移酶為產生TAG之中性 脂質合成酶,但不認為其係肯尼迪路徑之一部分》 蠟酯合成酶與DGAT酶之組合(WS/DGAT)已見於迄今所 研究的所有產中性脂質之原核生物中。WS/DAGAT對多種 不常見脂肪酸、醇及甚至硫醇具有格外寬廣之活性。此酶 具有推定的跨膜區域,但不展示與來自真核生物之DGAT1 及DGAT2家族或來自荷荷芭(荷荷芭為已發現的唯一積聚 蠟酯之真核生物)之WE合成酶的序列同源性。 應注意到,卵磷脂-膽固醇醯基轉移酶(LCAT)及醯基-輔 酶:膽固醇醯基轉移酶(ACAT)為產生非TAG之固醇酯(中 性脂質形式)的酶。 在需要增加中性脂質之應用中,有證據表明與DGAT2相 I51910.doc •36- 201127957 比具有較高活性及較寬特異性之DGAT1為較佳。當特異性 脂肪酸(諸如長鏈PUFA)為較佳時,DGAT1仍適用,只要其 接受精選的脂肪酸。植物一般在sn-2位中併入長鏈PUFA。 不知道此是否歸因於LPAT對此受質之高活性或DGAT1對 此受質之低活性。對於PUFA之改良特異性而言,偏好此 等脂肪酸之DGAT2可為較佳,或可使用定向進化或等效程 序來改變DGAT1之特性。 A 來自若干植物物種之成員的適用於本發明之方法及組合 物中的此等TAG合成酶之實例提供於下表2中。(聚核苷酸 及多肽)序列提供於序列表中。 表2 TAG合成酶 物種 cDNA寄存編號 SEQ ID NO: 蛋白質寄存編號 SEQ ID NO: DGAT1 擬南芥 NM_127503 74 NP—179535 75 DGAT1 旱金蓮 AY084052 76 AAM03340 77 DGAT1 玉米 EU039830 78 ABV91586 79 DGAT2 擬南芥 NM_115011 80 NP_566952 81 DGAT2 甘藍型油菜 FJ858270 82 AC090187 83 DGAT3(可溶性 DGAT) 花生 AY875644 84 AAX62735 85 PDAT 擬南芥 NM_121367 86 NP_196868 87 PDAT 蓖麻以 communis) XM_002521304 88 XP_002521350 89 本發明亦涵蓋使用經改質TAG合成酶,其經改質(舉例 而言在其序列中藉由取代、插入或添加及其類似操作)以 改變其特異性及/或活性。 TAG在葉中之積聚 近來,在美國中北部地區對302個被子植物物種進行的 野外調查發現24%在葉中具有明顯細胞溶質油滴,通常每 151910.doc -37- 201127957 個葉肉細胞具有一個大油滴(Lersten等人,2006 [來自 Slocombe#乂,2009])。認為細胞溶質葉TAG之作用涉及於 碳儲存及/或膜脂質再造中(關於評論,參見Slocombe等人, 2009)。實際上,在衰老之葉中,質體脂肪酸在進一步移 動之前分配至TAG中,且認為DGAT1有助於此過程(Kaup 等人,2002)。 已數次嘗試工程改造植物以在其葉中積聚增加含量之 TAG。此等嘗試之成功將多少受限於所積聚的相對較低含 量之TAG及在一些情況下僅在衰老葉中積聚的大部分 TAG,由此限制收穫之靈活性及在任一時刻積聚TAG的作 物之比例(Bouvier-Nave # 乂,2001 ; Xu 等人,2005 ; Winichayakul 等人,2008 ; Andrianov 等人,201 0 ; Slocombe 等人,2009及其中之參考文獻)。 至今,在葉中積聚TAG之嘗試主要集中於三個特定基因 候選者,包括DGAT(TAG生物合成)之過度表現、TGD1或 CTS之突變(從而防止脂質再移動)、及LEC1、LEC2及 WRI1(涉及於發育種子中之油儲存及蛋白質積聚的轉錄因 子)之過度表現。TAG及其他中性脂質合成酶之過度表現 依賴於在展葉及/或成熟葉中足量受質之存在,認為受質 係由合成膜之脂質的質體(在葉之情況下為葉綠體)提供。 在芥菜屬之光合成葉中,據估計膜脂質之迴轉率為每曰 4%之總脂肪酸(Bao等人,2000)。在衰老之葉中,現存質體 膜提供在進一步移動之前分配至TAG中的大批脂肪酸。 芥菜屬DGAT1基因在菸葉中之過度表現導致TAG積聚增 151910.doc •38· 201127957 加(Bouvier-Nave 等人,2001),之後由 Andrianov 等人, (2010)重複及定量此增加的TAG積聚。其推算出TAG含量 增加20倍且造成在成熟葉中來自約3°/。至約6%之乾物質的 雙倍脂質含量。藉由使用誘導性Ale啟動子在成熟葉中過 度表現LEC2(種子成熟及種子油儲存之主要調節物)使得進 一步增加至6.8%(Andrianov等人,2010)。未對可提取TAG 作出估算,亦未對TAG在展葉中之積聚進行任何推算。 在擬南芥(Arabidopsis thaliana)中的透過酶樣蛋白三半 乳糖基二酸甘油酯(TGD1)中之突變引起TAG、募半乳糖脂 及磷脂酸積聚,此伴隨胚胎敗育之高發生率及較差的總體 植物生長(Xu等人,2005)。
Winichayakul等人,(2008)在黑麥草之葉中過度表現擬南 芥DGAT1且發現此使得可提取的總葉脂質增加50%(約4% 至6%之乾物質)。此外,在藉由間隔2-3週反覆收穫所產生 的新葉中存在增加之脂質含量,此表明新發之葉亦能夠積 聚額外脂質。然而,當葉齡超過2週時,在此等葉中增加 的脂質含量通常開始向野生型含量傾斜,表明脂質正經由 分解代謝再移動(藉由脂肪酶繼之以β-氧化作用而自甘油骨 幹釋放)。
Slocombe等人,(2009)證明在CTS過氧化物酶體ABC轉運 體(cts-2)中之突變導致至多1.4% TAG在葉中,尤其在衰老 開始期間積聚。其亦在衰老期間在cts-2背景下異位表現 LEC2 ;雖然此並不因cts-2突變而增加TAG之總積聚,但 其確實增加在衰老組織中TAG之種子油型物種之積聚。雖 151910.doc •39- 201127957 然cts-2阻斷脂肪酸分解,但其亦造成嚴重表型。si〇combe 等人,(2009)推斷再循環之膜脂肪酸也許能藉由在衰老組 織中表現種子程式或藉由阻斷脂肪酸分解重定向至TAG。
Scott等人,(2007)主張三酸甘油酯合成酶與聚油質蛋白 (兩個或兩個以上油質蛋白單元以串聯頭尾相接之排列形 式融合)之共表現將能貫現在植物細胞中之脂質儲存。類 似地,Cookson等人,(2009)主張在植物之營養部分產生單 獨的油質蛋白及TAG合成酶將使營養組織中油體及TAG之 數量增加。使用任一此等技術均使脂質含量(未必呈TAG 形式)最多增加至多約50〇/〇。此外,此含量隨著葉之成熟開 始下降;通常在葉齡大於2週之葉中(資料未公開)。 因此,TAG在營養組織中積聚之程度似乎在某種程度上 又限於内源性固定厌回收機構分解代謝tag之事實。 葉之衰老-脂質經由TAG中間物再循環 葉之衰老為一系列高度可控之事件,其最終導致細胞、 組織及最終整個器官之死亡。此使得必須調節營養素之募 集以及其自衰老組織向其他仍生長及發育組織之移位。葉 綠體為葉肉細胞中展示衰老症狀之第一細胞器且雖然在葉 之衰老級聯中的早期即引發葉綠層膜之分解,但葉綠體包 膜保持相對完整直至衰老之很晚階段,在芥菜屬之葉衰老 期間DGAT1上調且此上調臨時與常見於葉綠體半乳糖脂中 的含TAG之脂肪酸含量增加相關聯。自衰老之葉(尤其衰 老之葉綠體)募集膜碳至植物之生長部分為葉之衰老的關 鍵特徵,且涉及葉綠層脂質之脫酿作用及所得游離脂肪酸 151910.doc 40· 201127957 向韌皮部移動蔗糖轉化。葉綠層脂質之脫酯作用似乎由一 或多種衰老誘導之半乳糖脂肪酶所介導。TAG之形成似乎 為衰老期間膜脂質碳向韌皮部移動蔗糖移動的中間步驟 (Kaup等人,2002)。 經工程改造以包括人工引入之半胱胺酸的經改質油質蛋白 本發明之經改質油質蛋白或用於本發明方法中的經改質 油質蛋白經改質以含有至少—個人工引人之半胱胺酸殘
基。經工程改造之油質蛋白較佳含有至少兩個半胱胺酸。 由含有經工程改造之半胱胺酸的油質蛋白囊封中性脂質 提供在葉中積聚可評估數量之TAG同時無需等待至衰老且 不產生極端表型的替代性機制。 熟習此項技術者熟知之多種方法可用於產生具有人工引 入之半胱胺酸的經改質油質蛋白。 該等方法包括定點突變誘發⑽6,448 G48),其中編碼 油質蛋白之聚㈣酸經改質以將半胱胺酸引人經編碼之油 質蛋白蛋白質中。 或者’編碼經改質油質蛋白之聚核芽酸可全部經合成。 產生本發明之經改質油質蛋白及用於本發明方法中的經 改質油質蛋白之其他方法在實例部分中提供。 半胱胺^可為額外絲酸(亦即插人)或可替代現 存胺基酸(亦即替換b 3丨 、丨入之半胱胺酸較佳替代現存胺基 ^ 在一較佳實施例中,碰接△ ^ 替代之胺基酸為帶電殘基。預 測帶電殘基較佳在親水 埤中且因此可能位於油體之表面 上0 151910.doc 201127957 使用標準方法(例如:Kyte及Doolitle,(1982)),熟習此 項技術者可容易地鑑別油質蛋白之親水及疏水區/臂。 本發明之經改質油質蛋白之分子量較佳在5至50 kDa, 更佳10至40 kDa,更佳15至25 kDa之範圍内。 本發明之經改質油質蛋白較佳在100至300個胺基酸,更 佳110至260個胺基酸,更佳120至250個胺基酸,更佳ι3〇 至240個胺基酸,更佳140至230個胺基酸之尺寸範圍内。 經改質油質蛋白較佳包含N端親水區、兩個中心疏水區 (由捕胺酸結或節接合)及C端親水區。 經改質油質蛋白較佳可沿其長度分為幾乎相同之四個部 分’該等部分對應於N端親水區(或臂)、兩個中心疏水區 (由脯胺酸結或節接合)及C端親水區(或臂)。 經改質油質蛋白之拓撲較佳歸因於其物理特性,包括由 親水域側接摺疊之疏水核心。 經改質油質蛋白當與三酸甘油酯(TAG)及磷脂組合時較 佳可形成至油體中β 拓撲較佳向經改質油質蛋白賦予兩性性質,從而使得疏 水域嵌入油體之磷脂單層中,而側接之親水域暴露於油體 外部之含水環境下’諸如細胞質中。 在一實施例中,本發明之經改質油質蛋白或用於本發明 方法中的經改質油質蛋白包含與以上表丨中所提及之任一 油質蛋白蛋白質序列之疏水域具有至少7〇% 一致性的序 列0 在一實施例中,本發明之經改質油質蛋白或用於本發明 151910.doc 201127957 方法中的經改質油質蛋白包含與以上表丨中所提及之任一 蛋白質序列具有至少70% —致性的序列。 在另一實施例中,除額外人工引入之一或多個半胱胺酸 以外,經改質油質蛋白基本上與以上表1中所提及之任一 油質蛋白相同。
在另一實施例中,本發明之經改質油質蛋白或用於本發 明方法中的經改質油質蛋白包含與SEQ ID N〇: 16之油質 蛋白序列具有至少70%—致性的序列。 在另一實施例中,除額外人工引入之一或多個半胱胺酸 以外’經改質油質蛋白具有與SEQ m N〇: 16相同之胺基 酸序列。 在另一實施例中,經改質油質蛋白具有SEQ m n〇: 16 至20中之任一者之胺基酸序列。 具有經改質油質蛋白之融合蛋白 本發明亦提供融合蛋白,其包括本發明之經改質油質蛋 白融合至相關蛋白質。 相關蛋白質較佳在融合蛋白U端或c端。 熟習此項技術者熟知重組表現融合蛋白之方法 (papap〇st〇1〇u及Howorka,2_)。製備本發明之融合蛋白 通常可涉及將相關蛋白曾夕故, W之編碼序列融合至經改質油質蛋 白之編碼序列。 明之油體中且用於 如在Roberts等人, 該等融合蛋白可包括於或表現於本發 純化及傳遞相關蛋白質以供多種應用, (2008)中所論述。 151910.doc •43- 201127957 然而,本發明有可能藉由經改質油質 而任選改變油體之辑定性/ ^ +於/由體_ 化及傳遞程序。凡整性’由此實現更嚴格之純 具有未經改質油質蛋白之融合蛋白 2發明亦涉及使用融合蛋白,丨包括未經改質油質蛋白 融&至相關蛋白質。製備本發明之融合蛋白通常可涉及將 相關蛋白質之編碼序列融合至未經改質油質蛋白之編碼 列。 相關蛋白質較佳在融合蛋白之N端或c端。 i等融。蛋白可包括於或表現於本發明之油體中且用於 純化及傳遞相關蛋白質以供多種應用如在R〇b⑽等人, (2008)中所論述。 …、:而纟發明藉由經改質油質蛋白存在於本發明之油體 中而任選改變油體之穩定性/完整性,由此實現更嚴格之 純化及傳遞程序。 營養組織 呂養組織包括芽、葉、根、莖。較佳營養組織為葉。 營養組織特異性啟動子
吕養特異性啟動子之實例見於US 6,229,067、及US 7,629,454、及 US 7,153,953、及US 6,228,643 中。 化粉特異性啟動子 才匕粉特異性啟動子之實例見於US 7,141,424、及US 5,545,546、及 US 5,412,085、及 US 5,086,169、及 US 7,667,〇97 中。 151910.doc 201127957 種子特異性啟動子
種子特異性啟動子之實例見於US 6,342,657、及US
7,081,565、及 US 7,405,345、及 US 7,642,346、及 US 7,371,928 中。 果實特異性啟動子
果實特異性啟動子之實例見於US 5,536,653、及US 6,127,179、及 US 5,608,150、及 US 4,943,674 中。 φ 聚核苷酸及片段 本文中所用術§吾「聚核普酸」意謂任何長度但較佳至少 15個核苷酸之單股或雙股去氧核糖核苷酸或核糖核苷酸聚 合物’且包括以下作為非限制性實例:編碼及非編碼之基 因序列、有義及反義互補序列、外顯子、内含子、染色體 組 DNA、cDNA、前 mRNA、mRNA、rRNA、siRNA、 miRNA、tRNA、核糖核酸酶、重組多肽、經分離及純化 的天然存在之DNA或RNA序列、合成rna及DNA序列、核 φ 酸探針、引子及片段。 本文中提供之聚核苷酸序列之「片段」為鄰接核苷酸中 能夠特異性雜交至相關目標的子序列,例如至少丨5個核苷 酸長之序列。本發明之片段包含所揭示聚核苷酸之鄰接核 苷酸中的15個核苷酸,較佳至少丨6個核苷酸、更佳至少J 7 個核苷酸、更佳至少1 8個核苷酸、更佳至少19個核苷酸、 更佳至少20個核苷酸、更佳至少21個核苷酸、更佳至少22 個核苷酸、更佳至少23個核苷酸、更佳至少24個核苷酸、 更佳至少25個核苷酸、更佳至少26個核苷酸、更佳至少27 151910.doc •45· 201127957 個核苷酸、更佳至少28個核苷酸、更佳至少29個核苷酸、 更佳至少30個核苷酸、更佳至少3 1個核苷酸、更佳至少32 個核苷酸、更佳至少33個核苷酸、更佳至少34個核苷酸、 更佳至少3 5個核苷酸、更佳至少3 6個核苷酸、更佳至少3 7 個核苷酸、更佳至少38個核苷酸、更佳至少39個核苷酸、 更佳至少40個核苷酸、更佳至少41個核苷酸、更佳至少42 個核苷酸、更佳至少43個核苷酸、更佳至少44個核苷酸、 更佳至少45個核苷酸、更佳至少46個核苷酸、更佳至少47 個核苷酸、更佳至少48個核苷酸、更佳至少49個核苷酸、 更佳至少50個核苷酸、更佳至少5 1個核苷酸、更佳至少52 個核苷酸、更佳至少53個核苷酸、更佳至少54個核苷酸、 更佳至少55個核苷酸、更佳至少56個核苷酸、更佳至少57 個核苷酸、更佳至少58個核苷酸、更佳至少59個核苷酸、 更佳至少60個核苷酸、更佳至少61個核苷酸、更佳至少62 個核苷酸、更佳至少63個核苷酸、更佳至少64個核苷酸、 更佳至少65個核苷酸、更佳至少66個核苷酸、更佳至少67 個核苷酸、更佳至少68個核苷酸、更佳至少69個核苷酸、 更佳至少70個核苷酸、更佳至少71個核苷酸、更佳至少72 個核苷酸、更佳至少73個核苷酸、更佳至少74個核苷酸、 更佳至少75個核苷酸、更佳至少76個核苷酸、更佳至少77 個核苷酸、更佳至少78個核苷酸、更佳至少79個核苷酸、 更佳至少80個核苷酸、更佳至少81個核苷酸、更佳至少82 個核苷酸、更佳至少83個核苷酸、更佳至少84個核苷酸、 更佳至少85個核苷酸、更佳至少86個核苷酸、更佳至少87 151910.doc -46· 201127957 個核苷酸、更佳至少88個核苷酸、更佳至少89個核苷酸、 更佳至少90個核苷酸、更佳至少91個核苷酸、更佳至少92 個核苷酸、更佳至少93個核苷酸、更佳至少94個核苷酸、 更佳至少95個核苷酸、更佳至少96個核苷酸、更佳至少97 個核苷酸、更佳至少98個核苷酸、更佳至少99個核苷酸、 更佳至少100個核苷酸、更佳至少15〇個核苷酸、更佳至少 200個核苷酸、更佳至少250個核苷酸、更佳至少300個核 苷酸、更佳至少350個核苷酸、更佳至少400個核苷酸、更 佳至少450個核苷酸且最佳至少5〇〇個核苷酸。聚核苷酸序 列之片段可用於反義、RNA干擾(RNAi)、基因沉默、三重 螺旋或核糖核酸酶技術中,或用作微陣列中所包括之引 子、探針’或用於本發明之基於聚核苷酸的選擇法中。 術語「引子」係指通常具有游離3ΌΗ基團之短聚核苷 酸,其會與模板雜交,且用於引發與目標互補之聚核苷酸 的聚合。 術浯「探針」係指在基於雜交之檢驗中用於偵測與探針 互補之聚核苷酸序列的短聚核苷酸。探針可由如本文所定 義之聚核苷酸之「片段」組成。 多肽及片段 本文中所用術1吾「多肽」涵蓋任何長度但較佳至少5個 胺基酸之胺基酸鍵,包括全長蛋白質,其中胺基酸殘基藉 由共價肽鍵連接。本發明之多肽或用於本發明方法中的多 肽可為經純化之天然產物,或可使用重組或合成技術部分 地或整體產生。該術語可指多肽、多肽之聚集體(諸如二 151910.doc -47· 201127957 多肽片段、多肽變異體 聚體或其他多聚體)、融合多狀、 或其衍生物。 其執行生物活性所需 多狀之「片段」為多肽之子序列 之功能及/或提供多肽之三維結構1術語可減夠執行 上述酶促活性的多1、多狀之聚集體(諸如二聚體或其他 多聚體)、融合多肽、多肽片段、多肽變異體或其衍生 物。 術語「經分離」t用於本文中所揭示之聚核#酸或多狀 序列時用以指自天然細胞環境中移出之序列。經分離分子 可藉由包括以下之任何方法或方法組合獲得:生物化學、 重組及合成技術。 術語「重組」係指自聚核苷酸序列之天然背景所包圍之 序列中移出的聚核苦酸序列,及/或與在其天然背景下不 存在的序列重組》 藉由自「重組」聚核苷酸序列轉譯產生「重組」多肽序 列。 術語「源自」就源自特定屬或種的本發明之聚核苷酸或 多肽而言意謂聚核苷酸或多肽具有與在彼屬或種中天然發 現之聚核苷酸或多肽相同之序列。源自特定屬或種之聚核 苷酸或多肽可因此以合成或重組方式產生。 變異體 本文中所用術語「變異體」係指不同於經特別鑑別之序 列的聚核苷酸或多肽序列,其中一或多個核苷酸或胺基酸 殘基缺失、經取代或添加。變異體可為天然存在之對偶基 1519I0.doc • 48 · 201127957 因變異體,或非天缺左士 天…、存在之變異體。變異體可來自於同一 物種或來自於其他物德 種且可涵蓋同系物、旁系同源物及直 系同源物。在某^音尬/丨& 二貫施例中’本發明多肽之變異體具有與 本發明多狀相同或翻如夕Λ 、 飞類〇之生物活性。術語「變異體」就多 肽而言涵蓋所有形式夕& 士 a 负办式之如本文所定義之多肽。 聚核苷酸變異體 變異聚核苷酸序列較佳展現至少50%、更佳至少51%、 鲁 S佳至少52%、更佳至少53%、更佳至少54%、更佳至少 55% '更佳至少56%、更佳至少训、更佳至少避、更佳 至夕59/。更佳至少60°/。、更佳至少6丨%、更佳至少62%、 更佳至少63。/。、更佳至少64%、更佳至少65%、更佳至少 66/。、更佳至少67%、更佳至少68%、更佳至少69%、更佳 至:>、70/。、更佳至少71%、更佳至少72%、更佳至少η%、 更佳至少74%、更佳至少75%、更佳至少76%、更佳至少 77 /。、更佳至少78%、更佳至少79%、更佳至少go%、更佳 鲁 至少81 %、更佳至少82%、更佳至少83%、更佳至少84%、 更佳至少85%、更佳至少86%、更佳至少87%、更佳至少 88%、更佳至少89%、更佳至少90%、更佳至少91 %、更佳 至少92%、更佳至少93%、更佳至少94%、更佳至少95%、 更佳至少96%、更佳至少97%、更佳至少98%且最佳至少 99°/。與本發明序列的一致性。在本發明之聚核苷酸的至少 2 0個核苷酸位置、較佳至少5 0個核苷酸位置、更佳至少 100個核苷酸位置之比較窗上且最佳在本發明之聚核苦酸 的整個長度上發現一致性。 151910.doc •49· 201127957 可以如下方式測定聚核苷酸序列一致性。在bl2seq (Tatiana A. Tatusova, Thomas L. Madden (1999), 「Blast 2 sequences-a new tool for comparing protein and nucleotide sequences」,FEMS Microbiol Lett. 174:247-250)中使用 81^8丁1^(來自81^81'程式組,版本2.2.5 [2002年11月])將 本發明之聚核苷酸序列與候選聚核苷酸序列進行比較, bl2seq可自 NCBI(ftp://ftp.ncbi.nih.gov/blast/)公開獲得。 除應關閉對低複雜性部分之過濾以外,利用bl2seq之預設 φ 參數。 可使用以下unix命令行參數檢驗聚核苷酸序列之一致 性: bl2seq-i nucleotideseq 1-j nucleotideseq2-F F-p blastn 參數-F F關閉對低複雜性區段之過濾。參數-p為成對序 列選出適當演算法。bl2seq程式在「Identities=」行中以相 同核苷酸之數量及百分比報導序列一致性。 亦可使用總體序列比對程式(例如Needleman,S. B.及 φ Wunsch,C. D. (1970) J. Mol. Biol. 48, 443-453)在候選序 列與本發明之聚核苷酸序列之重疊序列的整個長度上計算 聚核苦酸序列一致性。Needleman-Wunsch總體比對演算法 之一完整實施例見於EMBOSS套件中之needle程式中 (Rice,P. Longden,I.及 Bleasby,A. EMBOSS: The European Molecular Biology Open Software Suite, Trends in Genetics June 2000,第16卷,第6期。第276-277頁),該套件可獲自 http://www.hgmp.mrc.ac.uk/Software/EMBOSS/。European 151910.doc -50- 201127957
Bioinformatics Institute 飼服器亦於 http:/www.ebi.ac.uk/ emboss/align/上在線提供執行兩個序列之間的EMBOSS-needle總體比對之設施。 或者,可使用GAP程式,其計算兩個序列在無處罰末端 空隙之情況下的最佳總體比對。以下論文中描述GAP : Huang, X. (1994) On Global Sequence Alignment. Computer Applications in the Biosciences 10,227-235 ° 計算聚核苷酸序列一致性%之較佳方法係基於使用
Clustal X(Jeanmougin等人,1998, Trends Biochem. Sci. 23, 403-5)比對待比較之序列。 本發明之聚核苷酸變異體亦涵蓋展現與一或多個可能保 留序列之功能等效性的經特別鑑別之序列的相似性且不能 恰當預期隨機發生之聚核苷酸變異體。有關多肽之該序列 相似性可使用由來自 NCBI(ftp://ftp.ncbi.nih.gov/blast/)之 BLAST程式組公開獲得之bl2seq程式進行測定。 可使用以下unix命令行參數檢驗聚核苷酸序列之相似 性: bl2seq-i nucleotideseql-j nucleotideseq2-F F-p tblastx 參數-F F關閉對低複雜性區段之過濾。參數邛為成對序 列選出適當演算法。此程式發現序列之間的相似性區域且 為每一個該區域報導一「E值」,£值為吾人可預期在含有 隨機序列之固定參考尺寸之資料庫中找到該偶然匹配的預 期次數。此資料庫之尺寸係由bl2seq程式中之預設值設 疋。對於遠小於1之小E值而言,e值大致為該隨機匹配之 151910.doc •51 · 201127957 機率。 虽一任一經特別鑑別之序 ,(1 M ,4 a Ta , j相比較時,變異聚核苷酸序 列較佳展現小於1 x i 〇 _6 , lxlft 19 更佳小於“Η) -9,更佳小於 1x10 -12 ’ 更佳小於 lxl〇 _15, 更佳小於1 X 1 〇 _ 1 8,更佳小 於1><10-21,更佳小於1><1〇_3〇, 更佳小於1 X 1 〇 _40,更佳 小於1x10 -50,更佳小於1><1〇 60更佳小於1 X10 -70,更 佳小於1x10 -80,更佳小於丨 y〇且最佳小於lxl0_100 之E值。 或者’本發明之變異聚核#酸或用於本發明方法中的變 異聚核普酸在嚴格條件下雜交至指定聚核㈣序列或其互 補序列。 術語「在嚴格條件下雜交」及其語法等效物係指聚核苦 酸分子在限定之溫度及鹽濃度條件下雜交至目標聚核皆酸 分子(諸如固定於D N A或R N A墨點(諸如南方墨點或北方墨 點)上之目標聚核苷酸分子)之能力。在嚴格雜交條件下雜 交之能力可藉由初始在較低嚴格性條件下雜交,隨後將嚴 格性增加至所要嚴格性來測定。 關於超過約100個鹼基長之聚核苷酸分子,典型嚴格雜 交條件為不超過原生雙鍵體之炫融溫度(Tm)以下25至 30°C (例如 10°C )(— 般參見 Sambrook 等人編,1987,
Molecular Cloning, A Laboratory Manual,第 2 版.Cold Spring Harbor Press ; Ausubel 等人,_ 1987, Current
Protocols in Molecular Biology, Greene Publishing)。超過 約100個鹼基之聚核苷酸分子的Tm可藉由下式來計算: 151910.doc • 52- 201127957
Tm= 81.5+0.41% (G+C-log (Na+)(Sambrook等人編,1987,
Molecular Cloning, A Laboratory Manual,第 2 版.Cold
Spring Harbor Press ; Bolton 及 McCarthy,1962, PNAS 84:1390)。超過100個鹼基長之聚核苷酸的典型嚴格條件將 為以下雜交條件,諸如在6><SSC、0.2% SDS之溶液中預洗 滌;在65°C下,在6xSSC、0.2% SDS中雜交隔夜;繼之以 在lxSSC、0.1% SDS中在65°C下進行兩次各30分鐘之洗滌 及在0.2XSSC、0.1% SDS中在65。(:下進行兩次各30分鐘之 洗條。 關於具有小於100個驗基長度之聚核苷酸分子,例示性 嚴格雜交條件為Tm以下5至10°c。平均而言,長度小於 100 bp之聚核苷酸分子之Tm減少大約(500/寡核苷酸長 度)°C。 關於稱為肽核酸(PNA)之DNA模擬物(Nielsen等人,
Science. 1991 年 12月 6日;254(5037):1497-500),Tm值高於 DNA-DNA或DNA-RNA雜交物之Tm值且可使用Giesen等 人,Nucleic Acids Res. 1998年 11月 1 日;26(21):5004-6 中所 述之公式來計算》具有小於1〇〇個驗基長度之Dna-ΡΝΑ雜 交物之例示性嚴格雜交條件為Tm以下5至10。(:。 本發明之變異聚核苦酸或用於本發明方法中的變異聚核 苷酸亦涵蓋不同於本發明序列但因遺傳密碼之簡併而編碼 具有與由本發明之聚核苷酸所編碼之多肽相似的活性之多 肽的聚核苷酸。不改變多肽之胺基酸序列的序列變化為 「沉默變異」。除ATG(曱硫胺酸)及TGG(色胺酸)之外,同 151910.doc -53· 201127957 一胺基酸之其他密碼子可藉由此項技術認可之技術發生改 變’以例如優化特定宿主有機體中之密碼子表現。 引起經編碼多肽序列中之一或若干個胺基酸之保守性取 代但不顯著改變其生物活性的聚核苷酸序列變化亦包括於 本發明中。熟練技術人員應知曉製造表現型沉默胺基酸取 代之方法(參見’例如Bowie等人,1990,Science 247, 1306) 〇 因經編碼多肽序列中之沉默變異及保守性取代而產生的 變異聚核·# 酸可使用由 NCBI(ftp://ftp.ncbi.nih.gov/blast/) 公開獲得之來自BLAST程式組(版本2.2.5 [2002年11月])的 bl2seq程式,經由先前所述之tbiastx演算法來測定。 多肽變異體 術語「變異體」就多肽而言涵蓋天然存在、以重組方式 及以合成方式產生之多肽。變異多肽序列較佳展現至少 50%、更佳至少51%、更佳至少52°/。、更佳至少53%、更佳 至少54°/。、更佳至少55%、更佳至少56%、更佳至少57%、 更佳至少58°/。、更佳至少59%、更佳至少60%、更佳至少 61%、更佳至少62%、更佳至少63%、更佳至少64%、更佳 至少65%、更佳至少66%、更佳至少67°/。、更佳至少68%、 更佳至少69%、更佳至少70%、更佳至少71%、更佳至少 72%、更佳至少73°/。、更佳至少74%、更佳至少75%、更佳 至少76/ί»、更佳至少77%、更.佳至少78¾、更佳至少79¾、 更佳至少80%、更佳至少81 %、更佳至少82%、更佳至少 83%、更佳至少84%、更佳至少85。/。、更佳至少86%、更佳 I51910.doc -54- 201127957 至少87%、更佳至少88%、更佳至少89%、更佳至少90%、 更佳至少91%、更佳至少92%、更佳至少93%、更佳至少 94%、更佳至少95%、更佳至少96%、更佳至少97%、更佳 至少98%且最佳至少99%與本發明序列的一致性。在本發 明之多肽的至少20個胺基酸位置、較佳至少50個胺基酸位 置、更佳至少100個胺基酸位置之比較窗上且最佳在本發 明之多肽的整個長度上發現一致性。 多肽序列一致性可以如下方式測定。在bl2seq中使用 BLASTP(來自BLAST程式組,版本2.2.5 [2002年11月])將 本發明之多肽序列與候選多肽序列進行比較,bl2seq可自 NCBI(ftp://ftp.ncbi.nih.gov/blast/)公開獲得。除應關閉對 低複雜性區域之過滤以外,利用b 12 s e q之預設參數。 亦可使用總體序列比對程式在候選序列與本發明之聚核 苷酸序列之重疊序列的整個長度上計算多肽序列一致性。 如上文所論述之EMBOSS-needle(可獲自http:/www.ebi. ac.uk/emboss/align/)及 GAP(Huang,X. (1994) On Global
Sequence Alignment. Computer Applications in the Biosciences 10, 227-235.)亦為用於計算多肽序列一致性之 適合的總體序列比對程式。 計算多肽序列一致性%之較佳方法係基於使用clustal X(Jeanm〇Ugin等人,1998, Trends Biochem. Sci_ 23, 403-5) 比對待比較之序列。 本發明之多肽變異體或用於本發明方法中的多肽變異體 亦涵蓋展現與一或多個可能保留序列之功能等效性的經特 151910.doc •55- 201127957 別鑑別之序列的相似性且不能恰當預期隨機發生之多肽變 異體。有關多肽之該序列相似性可使用由NCBI (ftp://ftp.iicbi.nih.gOv/b丨ast/)公開獲得的來自 BLAST程式 組(版本2.2.5 [2002年11月])之bl2seq程式進行測定。可使 用以下unix命令行參數檢驗多肽序列之相似性: bl2seq-i peptideseql-j peptideseq2 -F F-p blastp 當與任一經特別鑑別之序列相比較時,變異多肽序列較 佳展現小於1x10 -6,更佳小於lxio _9,更佳小於1χ1〇 -12 ’更佳小於1 X 1 〇 _ 15,更佳小於1 χ丨〇 _丨8,更佳小於 1x10 -21,更佳小於ΐχίο _30 ’更佳小於1χ1〇 ·4〇,更佳小 於1x10 -50,更佳小於ΐχίο _60,更佳小於1χΙ〇 _7〇,更佳 小於1x10 -80,更佳小於ΐχ10 ·90且最佳小於1χ1(Μ〇〇2Ε 值。 參數-F F關閉對低複雜性區段之過濾。參數邛為成對序 列選出適當演算法《此程式發現序列之間的相似性區域且 為每一個該區域報導一「Ε值」,£值為吾人可預期在含有 隨機序列之固定參考尺寸之資料庫中找到該偶然匹配的預 期次數。對於遠小於1之小Ε值而言,Ε值大致為該隨機匹 配之機率。 所述多肽序列之一或若干個胺基酸之保守性取代(不顯 著改變其生物活性)亦包括於本發明中。熟練技術人員應 知曉製造表現型沉默胺基酸取代之方法(參見,例如B〇wie 等人,1990, Science 247,1306)。 構築體、載體及其組份 151910.doc •56· 201127957 術語「遺傳構築體」係指聚核苷酸分子,通常為雙股 DNA,其中可能已插入另一聚核苷酸分子(插入聚核苷酸 分子),諸如但不限於cDNA分子。遺傳構築體可含有允許 轉錄插入聚核苷酸分子且視情況將轉錄物轉釋為多肽的必 需元件。插入聚核苷酸分子可源自於宿主細胞,或可源自 於不同細胞或有機體及/或可為重組聚核苷酸。一旦在宿 主細胞内’遺傳構築體則可整合至宿主染色體dna中。遺 傳構築體可連接至載體上。 術語「載體」係指聚核苷酸分子,通常為雙股DNA,其 用於將遺傳構築體轉運至宿主細胞中。載體可能能夠在至 少一個額外宿主系統(諸如大腸桿菌)中複製。 術語「表現構築體」係指包括允許轉錄插入聚核苷酸分 子且視情況將轉錄物轉譯為多肽之必需元件的遺傳構築 體。表現構築體通常以5,至3'方向包含: a) 在宿主細胞(構築體將轉型至其中)中具功能性之啟動 子, b) 待表現之聚核苷酸,及 c) 在宿主細胞(構築體將轉型至其中)中具功能性之終止 子。 術語「編碼區」或「開放閱讀框架」(〇RF)係指能夠在 適當調節序列控制下產生轉錄產物及/或多肽的基因組 DNA序列或CDNA序列之有義股。在一些情況下,編碼序 列可藉由存在5,轉譯起始密碼子及3,轉譯終止密碼子來鑑 別。當插入遺傳構築體中時,「編碼序列」當可操作地= 151910.doc •57· 201127957 接於啟動子及終止子序料能夠表現。 可操作地連接」意謂在包括啟動子、組織特異性調節 時調節元件、強化子、抑制子及終止子之調節元 件的控制下置放待表現之序列。
術語「非編碼區」係指在轉譯起始㈣之上游及轉譯故 止位點之下游的未轉澤序列。此等序列亦分別稱為5, UTR 及3· UTR。此等區域包括轉錄起始及終止、抓从穩定性 及調節轉譯效率所需之元件。 •終止子為終止轉錄之序列且見於轉譯序列之下游基因的 3’未轉譯端。終止子為城财穩定性之重要決定因素且在 一些情況下已發現具有空間調節功能。 術浯「啟自子」係n編碼區上游的調節基因轉錄之非轉 錄順式調節元件。啟動子包含指定轉錄起始位點之順式引 發;0:件及保守盒(諸如TATA盒),及藉由轉錄因子結合之基 元。編碼序列内之内含子亦可調節轉錄且影響轉錄後加工 (包括剪接、加帽及聚腺苷酸化)。 啟動子可與待表現之聚核苷酸同源。此意謂發現啟動子 與聚核苷酸實際上可操作地連接。 或者,啟動子可與待表現之聚核苷酸異源。此意謂未發 現啟動子與聚核苷酸實際上可操作地連接。 轉殖基因」為取自一種有機體且藉由轉型引入不同有 機體中之聚核苷酸。轉殖基因可源自於與引入該轉殖基因 之有機體物種相同之物種或不同之物種。 反向重複序列」為存在重複之序列,其中重複序列之 151910.doc • 58 · 201127957 另一半係在互補股中,例如 (5’)GATCTA.......TAGATC(3') (3,)CTAGAT……ATCTAG(5,) 通讀轉錄將產生經歷互補鹼基配對以形成髮夾式結構的 轉錄物’其限制條件為重複區之間具有3_5 bp間隔物。 宿主細胞 宿主細胞可源自於例如細菌、真菌、酵母、昆蟲、哺乳 動物、藻類或植物有機體◊宿主細胞亦可為合成細胞。較 佳宿主細胞為真核細胞。尤佳之宿主細胞為植物細胞,尤 其為植物之營養組織中的植物細胞。 「轉殖基因植物」係指含有經遺傳操縱或轉型而產生的 新遺傳物質之植物。新遺傳物質可源自與所得轉殖基因植 物相同物種或不同物種之植物。 分離或產生聚核苷酸之方法 可使用一般技術者已知之多種技術分離本發明之聚核苷 酸分子。舉例而言,該等多肽可經由使用Mullis等人編, 1994 The Polymerase Chain Reaction,Birkhauser(以引用之 方式併入本文中)中所述之聚合酶鏈反應(PCR)來分離。可 使用源自於本發明之聚核苦酸序列的如本文所定義之引子 擴增本發明之多肽。 分離本發明之聚核苷酸的其他方法包括使用所有或部分 具有本文所陳述之序列的多肽作為雜交探針。將經標記聚 核苷酸探針雜交至固定於固體支撐物(諸如硝化纖維素濾 膜或耐綸膜)上之聚核苷酸的技術可用於篩選基因組或 151910.doc • 59- 201127957 cDNA文庫。例示性雜交及洗滌條件為:在65<»c下,在 5.0><88(1]、0.5%十二院基硫酸納、1)<唐納氏溶液 (Denhardt's solution)中雜交 20小時;在^“%、1%(w/v) 十二烷基硫酸鈉中洗滌(在55°C下進行三次各二十分鐘之 洗務);及視情況在60°C下,在0.5xSSC、l%(w/v)十二烧 基硫酸鈉中洗滌一次(二十分鐘)。可選之進一步洗條(二十 分鐘)可在60C下’在O.lxSSC、1%(\ν/ν)十二烧基硫酸納 之條件下進行。 可藉由此項技術中熟知之技術產生本發明之聚核苷酸片 段’諸如限制性核酸内切酶消化、寡核苷酸合成及PCR擴 增。 可在此項技術熟知之方法中使用部分聚核苷酸序列來鑑 別相應的全長聚核苷酸序列。該等方法包括基於PCR之方 法、5'RACE(Frohman MA,1993, Methods Enzymol. 218: 340-56)及基於雜交之方法、基於電腦/資料庫之方法。此 外,舉例而言’反向PCR允許獲取未知序列,該等序列側 接於本文中所揭示之聚核苷酸序列,以基於已知區域之引 子起始(Triglia 等人,1998, Nucleic Acids Res 16,8186,以 引用之方式併入本文中)。該方法使用若干限制酶以在基 因之已知區域中產生適合片段。隨後藉由分子内連接環化 該片段且將其用作PCR模板《由已知區域設計不同引子。 為了以物理方式裝配全長純系,可利用標準分子生物學方 法(Sambrook 等人,Molecular Cloning: A Laboratory Manual,第 2版,Cold Spring Harbor Press,1987)。 131910.doc •60· 201127957 當由特定物種產生轉殖基因植物時,宜以源自該物種之 或夕個序列轉型該植物。益處可在於減少公眾對於產生 轉殖基因有機體中跨物種轉型的關注。另外,當基因下調 為所要結果時,有必要利用與需要減少的表現之植物中之 序列相同(或至少高度相似)之序列。尤其出於此等原因, 希望此夠在若干不同植物物種中鑑別及分離特定基因之直 系同源物。 變異體(包括直系同源物)可藉由所述方法來鑑別。 鑑別變異體之方法 物理方法 變異多肽可使用基於PCR之方法來鑑別(Mullis等人編, 1994 The Polymerase Chain Reaction,Birkhauser)。通常, 適用於藉由PCR擴增本發明之聚核苷酸分子之變異體的引 子之聚核苷酸序列可.基於編碼相應胺基酸序列之保守區的 序列》 或者,可使用熟習此項技術者熟知之文庫篩選法 (Sambrook^A, Molecular Cloning: A Laboratory Manual, 第 2版,Cold Spring Harbor Press, 1987)。當鑑別探針序列 之變異體時,雜交及/或洗滌嚴格性通常將相對降低直至 找到確切序列匹配。 亦可藉由物理方法鑑別多肽變異體,例如使用針對本發 明多肽產生之抗體篩選表現文庫(Sambrook等人,Molecular Cloning: A Laboratory Manual,第 2版,Cold Spring Harbor Press,1987)或藉助於該等抗體鑑別來自天然來源之多肽。 1519l0.doc 61· 201127957 基於電腦之方法 本發明之變異體序列(包括聚核苷酸及多肽變異體)亦可 藉由熟習此項技術者熟知之基於電腦之方法,使用公共域 序列比對演算法及用於搜尋序列資料庫之序列相似性搜尋 工具(公共域資料庫包括Genbank、EMBL、Swiss-Prot、 PIR及其他)來鑑別。關於在線資源之實例,參見例如 Nucleic Acids Res. 29: 1·10及 11-16,2001。相似性搜尋擷 取及比對目標序列以供與待分析之序列(亦即,查詢序列) 進行比較。序列比較演算法使用計分矩陣來為每一比對指 派總分。 適用於鑑別序列資料庫中之變異體的程式之一例示性家 族為BLAST程式組(版本2.2.5 [2002年11月]),包括 BLASTN、BLASTP、BLASTX、tBLASTN及 tBLASTX,其 可自(ftp://ftp.ncbi.nih.gov/blast/)或國家生物技術資訊申 心(National Center for Biotechnology Information , NCBI) ' National Library of Medicine(Building 38A, Room 8N805, Bethesda, MD 20894 USA)公開獲得。NCBI伺服器 亦提供使用程式來篩選許多可公開獲得之序列資料庫的設 施。BLASTN對照核苷酸序列資料庫比較核苷酸查詢序 列。BLASTP對照蛋白質序列資料庫比較胺基酸查詢序 列。BLASTX對照蛋白質序列資料庫比較在所有閱讀框架 中轉譯的核苷酸查詢序列。tBLASTN對照核苷酸序列資料 庫比較在所有閱讀框架中動態轉譯之蛋白質查詢序列。 tBLASTX對照核苷酸序列資料庫之六-框架轉譯物比較核 151910.doc -62- 201127957 苷酸查詢序列之六-框架轉譯物。BLAST程式可以預設參 數來使用或可視需要改變參數以改進篩選。 演算法之BLAST家族(包括BLASTN、BLASTP及 BLASTX)的使用係描述於 Altschul 等人,Nucleic Acids Res· 25·· 3389-3402, 1997之公開案中。 以藉由 BLASTN、BLASTP、BLASTX、tBLASTN、 tBLASTX或相似演算法產生的查詢序列「命中」一或多個 資料庫序列比對及鑑別序列之相似部分。以相似性程度及 重疊序列之長度之順序排列命中。命中一資料庫序列一般 表示僅在查詢序列之一小部分序列長度上具有重疊。 BLASTN、BLASTP、BLASTX、tBLASTN及 tBLASTX演 算法亦產生比對之「預期」值。預期值(E)表明當搜尋含 有隨機鄰接序列之相同尺寸的資料庫時,吾人可「預期」 偶然見到的命中數目。預期值係用作判定命中資料庫是否 表明真正相似性的有效閾值。舉例而言,指派給聚核苷酸 命中的0.1之E值經解釋為意謂在所篩選資料庫之尺寸的資 料庫中,吾人可能預期在具有相似分數之序列的比對部分 上僅偶然見到0.1匹配。對於在比對及匹配部分上具有〇·〇1 或小於0.01之Ε值的序列而言,使用BLASTN、BLASTP、 BLASTX、tBLASTN或tBLASTX演算法發現資料庫中偶然 匹配之機率為1%或1%以下。 可以 CLUSTALW(Thompson, J.D., Higgins, D.G.及 Gibson, T.J. (1994) CLUSTALW: improving the sensitivity of progressive multiple sequence alignment through 151910.doc •63- 201127957 sequence weighting, positions-specific gap penalties and weight matrix choice. Nucleic Acids Research, 22:4673-4680, http://www-igbmc.u-strasbg.fr/BioInfo/ClustaIW/ Top.html)或 T-COFFEE(Cedric Notredame, Desmond G. Higgins, Jaap Heringa, T-Coffee: A novel method for fast and accurate multiple sequence alignment, J. Mol. Biol. (2000) 302: 205-217))或使用漸進成對比對之PILEUP(Feng 及 Doolittle,1987, J. Mol. Evol. 25, 351)進行一組相關序列 之多重序列比對。 可利用圖樣識別軟體應用來找到基元或標籤序列。舉例 而言,MEME(用於基元引出之多個Em)在一組序列中找到 基元及標籤序列,且MAST(基元比對及搜尋工具)使用此 等基元在查詢序列中鑑別相似或相同基元。提供MAST結 果作為與適當統計資料及所找到基元之目視全覽的一系列 比對。University of California,San Diego開發了 MEME及 MAST。 PROSITE(Bairoch及 Bucher,1994, Nucleic Acids Res. 22, 3583 ; Hofmann等人,1999, Nucleic Acids Res. 27,215)為 鑑別自基因組或cDNA序列轉譯之未表徵蛋白質之功能的 方法。PROSITE 資料庫(www_expasy.org/prosite)含有生物 學顯著圖樣及概況且經設計以便其可與適當計算工具一起 使用以向已知蛋白質家族指派新序列或判定哪個已知域存 在於該序列中(Falquet 等人,2002,Nucleic Acids Res. 30, 235)。Prosearch為可以既定序列圖樣或標籤搜尋SWISS- -64- 151910.doc 201127957 PROT及EMBL資料庫之工具。 分離多肽之方法 本發明之多肽或用於本發明方法中的多肽(包括變異多 肽)可使用此項技術中熟知之肽合成方法來製備,諸如使 用固相技術進行直接肽合成(例如Stewart等人,1969,8〇“(1-Phase Peptide Synthesis, WH Freeman Co, San Francisco
California)或例如使用 Applied Biosystems 431A Peptide φ SyntheSizer(F〇ster City,California)進行自動合成。多肽之 突變形式亦可在該等合成期間產生。 本發明之多肽及變異多肽或用於本發明方法中的多肽及 變異多肽亦可使用此項技術中熟知之多種技術(例如
Deutscher 編,1990,Methods in Enzymology,第 182 卷
Guide to Protein Purification)自天然來源純化。 或者,本發明之多肽及變異多肽或用於本發明方法中的 多肽及變異多肽可在適合之宿主細胞中重組表現且與細胞 φ 分離,如下文所論述。 產生構築體及載體之方法 本發明之遺傳構築體包含一或多個本發明之聚核苷酸序 列及/或編碼本發明之多肽的聚核苷酸,且可適用於轉型 例如細菌、真菌、昆蟲、哺乳動物或植物有機體。本發明 之遺傳構築體意欲包括如本文中所定義之表現構築體。 產生及使用遺傳構築體及載體之方法係此項技術中熟知 的且一般描述於 Sambrook 等人,Molecular Cloning: A Laboratory Manual,第 2 版,Cold Spring Harbor Press, 151910.doc -65- 201127957 1987 ; Ausubel 等人,Current Protocols in Molecular Biology,Greene Publishing, 1987 中。 產生包含聚核苷酸、構築體或載體之宿主細胞的方法 本發明提供包含本發明之遺傳構築體或載體的宿主細 胞。 包含本發明之遺傳構築體(諸如表現構築體)的宿主細胞 適於在此項技術熟知之方法中(例如Sambrook等人,
Molecular Cloning : A Laboratory Manual,第 2版,Cold
Spring Harbor Press, 1987 ; Ausubel 等人,Current Protocols in Molecular Biology,Greene Publishing, 1987)用 以重組產生本發明之多肽。該等方法可涉及在適用於或有 助於表現本發明之多肽的條件下在適當介質中培養宿主細 胞。可視情況分泌至培養物中的經表現重組多肽可隨後藉 由此項技術熟知之方法(例如Deutscher編,1990, Methods in Enzymology,第 182卷,Guide to Protein Purification)與 介質、宿主細胞或培養基分離。 產生包含構築體及載體之植物細胞及植物的方法 本發明進一步提供包含本發明之遺傳構築體的植物細 胞,及經改質以改變本發明之聚核苷酸或多肽或用於本發 明方法中的聚核苷酸或多肽之表現的植物細胞。包含該等 細胞之植物亦形成本發明之一態樣。 以多肽轉型植物細胞、植物及其部分之方法係描述於
Draper等人,1988,Plant Genetic Transformation and Gene Expression. A Laboratory Manual: Blackwell Sci. Pub. 151910.doc •66· 201127957
Oxford,第 365 頁;Potrykus 及 Spangenburg,1995,Gene Transfer to Plants. Springer-Verlag, Berlin.;及 Gelvin 等人, 1993, Plant Molecular Biol. Manual. Kluwer Acad. Pub. Dordrecht中。對轉殖基因植物(包括轉型技術)之評論係於 Galun及Breiman, 1997, Transgenic Plants. Imperial College Press,London 中提供。 遺傳操縱植物之方法 可利用許多植物轉型策略(例如Birch,1997,Ann Rev
Plant Phys Plant Mol Biol,48,297 ; Hellens RP 等人 (2000) Plant Mol Biol 42: 819-32 ; Hellens R等人,Plant
Meth 1: 13)。舉例而言’策略可經設計以增加聚核苷酸/多 狀在通常表現該聚核苦酸/多狀之植物細胞、器官中及/或 在特定發育階段之表現,或在通常不表現該聚核苷酸/多 肽之細胞、組織、器官中及/或在特定發育階段異位表現 該聚核苷酸/多肽。經表現之聚核苷酸/多肽可源自於待轉 型之植物物種或可源自於不同植物物種。 轉型策略可經設計以減少聚核苷酸/多肽在通常表現該 聚核苷酸/多肽之植物細胞、組織、器官中或在特定發育 階段之表現。該等策略稱為基因沉默策略。 用於在轉殖基因植物中表現基因之遺傳構築體通常包括 用於驅動一或多個經選殖聚核苷酸之表現的啟動子、終止 子、及可選標記物序列以偵測遺傳構築體在轉型植物中之 存在。 適用於本發明之構築體中的啟動子在單子葉植物或雙子 151910.doc -67· 201127957 葉植物之細胞、組織或器官中具功能性且包括細胞特異 性、組織特異性及器g特異性啟動子、細胞週期特異性啟 動子、臨時啟動子、誘導性啟動子、在大多數植物組織中 具有活性之組成性啟動子、及重組啟動子。啟動子之選擇 必要時將視經選殖聚核苷酸之臨時及空間表現而定。啟動 子可為通常與相關轉殖基因有關之啟動子,或源自於其他 植物、病毒及植物病原細菌及真菌之基因的啟動子。熟習 此項技術者在無不當實驗之情況下能夠選出適用於使用包 含本發明之聚核苷酸序列的遺傳構築體改質及調節植物特 質的啟動子。組成性植物啟動子之實例包括CaMV 35 s啟 動子、膽脂鹼合成酶啟動子及章魚鹼合成酶啟動子、及來 自玉米之Ubi 1啟動子。在特定組織中具有活性之植物啟 動子對内部發.育信號或外部非生物或生物應激起反應,描 述於科學文獻中。例示性啟動子描述於例如w〇 〇2/〇〇894 中,該文獻以引用之方式併入本文中。 常用於植物轉型遺傳構築體中之例示性終止子包括例如 花椰菜嵌紋病毒(CaMV)35S終止子、根癌土壤桿菌 化似)膽脂鹼合成酶或章魚鹼合成酶 終止子、玉米zein基因終止子、栽培稻^^.νβ)ΑΕ)ρ_ 葡萄糖焦磷酸化酶终止子及馬鈐薯(心Μ仙w ㈨ρι_ 11終止子。 常用於植物轉型中之可選標記物包括賦予卡那黴素抗性 之新黴素磷酸轉移酶II基因(NPT „)、賦予壯觀黴素及鏈 徽素抗性之aadA基因、賦予Ignite(AgrEv〇)及Basta 151910.doc •68· 201127957 (Hoechst)抗性之草胺膦乙醯轉移酶(hr基因)及賦予勻微素 抗性之勻黴素磷酸轉移酶基因(hpt)。 亦涵蓋使用包含可用於植物及植物組織中之啟動子表現 分析的報導體基因(表現宿主外來活性,通常為酶促活性 及/或可見信號之編碼序列(例如螢光素酶、GUS、GFP))之 遣傳構築體。報導體基因文獻論述於Herrera-Estrella等人, 1993,Nature 303,209及 Schrott,1995,Gene Transfer to Plants (Potrykus,T.,Spangenberg 編)Springer Verlag. Berline,第 325-336頁中。 以下為揭示可用於遺傳轉型以下植物物種的遺傳轉型方 案之代表性公開案:稻米(Alam等人,1999, Plant Cell Rep. 18, 572)、蘋果(Yao等人,1995, Plant Cell Reports 14, 407-412)、玉米(美國專利第5, m,010號及第5, 981,840號)、 小麥(Ortiz 等人,1996, Plant Cell Rep. 15,1996,877)、番 茄(美國專利第5, 159,135號)、馬鈴薯(Kumar等人,1996 Plant J. 9,: 821)、木薯(Li等人,1996 Nat. Biotechnology 14,736)、萵苣(Michelmore等人,1987,Plant Cell Rep· 6, 439)、煙草(Horsch等人,1985,Science 227,1229)、棉花 (美國專利第5, 846,797號及第5,004,863號)、草類(美國 專利第5, 187,073號及第6. 020, 539號)、胡椒薄荷(Niu等 人,1998,Plant Cell Rep· 17,165)、橘類植物(Pena 等人, 1995,Plant Sci.104,183)、香菜(Krens 等人,1997,Plant Cell Rep,17, 39)、香蕉(美國專利第5, 792, 935號)、大豆 (美國專利第5,416,011號、第5, 569,834號、第5,824, 151910.doc •69· 201127957 877號、第5, 563, 04455號及第5, 968,830)、鳳梨(美國專 利第5, 952, 543號)、楊樹(美國專利第4,795,855號)、單 子葉統稱(美國專利第5, 591,616號及第6, 037, 522號)、芸 苔屬(美國專利第5,188,958號、第5,463,174號及第5, 750, 871號)、榖類(美國專利第6, 074, 877號)、梨(Matsuda 等人,2005, Plant Cell Rep. 24(1):45-51)、李屬(Ramesh等 人,2006 Plant Cell Rep. 25(8):821-8 ; Song及 Sink 2005 Plant Cell Rep. 2006 ;25(2):117-23 ; Gonzalez Padilla等人, 2003 Plant Cell Rep.22( 1):3 8-45)、草霉(Oosumi 等人,2006 Planta. 223(6):1219-30 ; Folta等人,2006 Planta Apr 14; PMID: 16614818)、玫瑰(Li 等人,2003)、樹莓(Graham 等 人,1995 Methods Mol Biol. 1995;44:129-33)、番莊(Dan等 人,2006, Plant Cell Reports V25:432-441)、蘋果(Yao等人, 1995,CW/ 14,407-412)、芬花(大油菜(Brassica napus L.)(Cardoza 及 Stewart, 2006 Methods Mol Biol. 343:257-66)、紅花(Orlikowska 等人,1995,Plant Cell Tissue and Organ Culture 40:85-91)、黑麥草(Altpeter等人, 2004 Developments in Plant Breeding 11(7):255-250)、稻 米(Christou 等人,1991 Nature Biotech. 9:957-962)、玉米 (Wang 等人,2009 In: Handbook of Maize 第 609-639 頁)及 毛花獼猴桃eria«i/za)(Wang 等人,2006,Plant Cell Rep. 25,5: 425-31)。本發明亦涵蓋其他物種之轉型。 適合之方法及方案可獲自科學文獻中。 植物 151910.doc -70- 201127957 術語「植物」意欲包括整個植物,植物之任何部分,植 物之種子、果實、繁殖體及子代。 術語「繁殖體」意謂植物中可用於繁殖或增殖之任何部 分’其為有性或無性的,包括種子及插枝。 本發明之植物可生長及自培養(self_ed)或與不同植物株 系雜交,且可鑑別具有所要表型特徵之所得雜交物。可生 長兩代及兩代以上以確保本發明表型特徵穩定維持及繼 • 承。由該等標準育種方法產生之植物亦形成本發明之一離 樣。 縮寫 油質蛋白(或Ole)一0-0意謂不含經工程改造之半胱胺酸的油 質蛋白。 油質蛋白(或01e)_l_l意謂在各親水性臂中均具有一個經工 程改造之半胱胺酸的油質蛋白β 油質蛋白(或Ole)一1-3意謂在Ν端親水性臂中具有一個經工 • 程改造之半胱胺酸且在c端親水性臂中具有三個經工程改 造之半胱胺酸的油質蛋白。 油質蛋白(或Ole) 一3-1意謂在N端親水性臂中具有三個經工 程改造之半耽胺酸且在C端親水性臂中具有一個經工程改 造之半胱胺酸的油質蛋白。 油質蛋白(或01e)_3-3意謂在N端親水性臂中具有三個經工 程改造之半胱胺酸且在C端親水性臂中具有三個經工程改 造之半胱胺睃的油質蛋白。 油質蛋白(或01e)_5-6意謂在N端親水性臂中具有五個經工 151910.doc -71· 201127957 程改造之半胱胺狻且在c端親水性臂中具有六個經工程改 造之半胱胺酸的油質蛋白。 油質蛋白(或OU) 一 6-7意謂在N端親水性臂中具有六個經工 程改造之半耽胺酸且在(:端親水性臂中具有七個經工程改 造之半耽胺酸的油質蛋白。 實例 本發明現將參考以下非限制性實例來說明。 實例1:製造兔抗芝麻種子油質蛋白抗體 產生兔抗芝麻種子油質蛋白抗體
含有C端His標籤之全長芝麻種子油質蛋白(核苷酸序列 展示於SEQ ID NO: 1中)表現於大腸桿菌中且藉由標準技 術製備包涵體。將包涵體溶解於結合緩衝液(1〇〇 mM磷酸 鹽緩衝液pH 8.0、500 mM NaC卜8 Μ尿素及1〇 mM咪唑) 中且加載於含有平衡離子金屬親和性層析(IMAC)Ni瓊脂糖 (Invitrogen)之管柱上。藉由以6體積洗滌緩衝液(1〇〇 mM 磷酸鹽緩衝液pH 8.0 ' 500 mM NaCn、6 Μ尿素及50 mM咪 唑)洗滌自管柱中移除非結合蛋白質。於丨體積溶離緩衝液 (100 mM磷酸鹽緩衝液ΡΗ 8.0、500 mM Naa、6 Μ尿素及 250 mM咪唑)之等分試樣中溶離蛋白質。藉由SDS_pAGE/ 庫馬斯染色(Coomassie stain)分析溶離份且使用布萊德福 檢驗(Bradford's Assay)量測蛋白質濃度。將265叫IMAC_ 純化之重組油質蛋白蛋白質與等量福氏完全佐劑(Freunds Complete Adjuvant)混合直至〇·5 mL之最終體積。在收集預 採血之後,將第一注射液投與兔之頸部及肩部區域背面的 151910.doc •72· 201127957 多個部位中。在首次注射之後第三週及第七週傳遞含有77 pg經純化油質蛋白之加強注射,且在第九週移出約3 mL測 5式血以供初步分析。藉由添加〇·25% v/v苯酚及0.01% v/v 硫柳汞來保存血清,且將血清儲存於-2(TC下之200卟等 分試樣中。 藉由免疫點潰評估兔抗芝麻種子油質蛋白抗體之敏感 性’表明可以1/2,〇〇〇稀釋度之抗體定期偵測〇 25 ng芝麻種 子油質蛋白(圖7)。 實例2:設計及在大腸桿菌中表現含有一或多個人工引入 之半耽胺酸殘基的經改質油質蛋白 用於在大腸桿菌中表現之構築體設計 設計許多經改質油質蛋白構築體以供在大腸桿菌中表 現。此等構築體在N端及C端親水性臂上含有一或三個半 胱胺酸殘基。該等構築體係基於來自不含半胱胺酸殘基之 芝麻種子油質蛋白(GenBank純系AF091840)的核普酸序列 及經轉譯多肽序列(SEQ ID NO: 16)。 使用經工程改造之Ndel/Xhol位點將所有純系次選殖至 pET29b中。此外,將ProTrp編碼序列添加至c端親水性臂 之3'端的編碼區上以模擬由先前經peng等人 (2006) Stability enhancement of native and artificial oil bodies by genipin crosslink(臺灣專利I 250466)工程改造之Ncol位點 所編碼之胺基酸殘基。 將本文中描述的經突變以在N端及C端親水區中包括半 胱胺酸殘基之油質蛋白-半胱胺酸蛋白質稱為Oled-i、 151910.doc •73· 201127957 〇le-l-3、〇le-3-l及 01e-3-3(分別為 SEQ ID NO 2、3、4及 5) ’其中第一及第二個數字分別對應於N端及c端中之二硫 鍵數目。不含半胱胺酸殘基之標準油質蛋白係用作對照且 稱為 Ole-〇-〇(SEQ ID NO 1)。 半胱胺酸可取代經預測存在於油體表面上之帶電殘基且 列舉如下。
N端單個半胱胺酸 Giu3CyS N端三個半胱胺酸(〇le-3-x) Glu3Cys Argl2Cys
Gln23 Cy s C端單個半胱胺酸 (GUe.x-i) Glni37Cys C端三個半胱胺酸(〇le-x-3) Glnl 12Cys Lysi23Cys
Glnl37Cys 構築體經設計以便能經由Ncol/Xhol消化及連接相對簡 單地由提供骨幹之GENEART(pCR4鈍端-TOPO)次選殖至 pET29b(N〇Vogen)中。以此方式將油質蛋白編碼序列置於 pET29 N端S*tag融合之下游及c端His標籤之上游(圖15及 SEQ ID Nos 1-1〇)。所用油質蛋白及經改質油質蛋白序列 概述於序列表之概述中。 含有至少一個人工引入之半胱胺酸的經改質油質蛋白在大 腸桿菌中之表現及純化 藉由SDS-PAGE/庫馬斯亮藍染色及SDS_pAGE/免疫墨點 分析,使用針對芝麻種子油質蛋白產生之抗體評估重組芝 麻種子油質蛋白(含有及不含經工程改造之半胱胺酸)在大 腸桿菌表現系統中之表現(描述於實例i中)。 151910.doc 201127957 於新鮮接種之10 mL含有在ρΕΤ29表現載體中之油質蛋 白(含有或不含經工程改造之半胱胺酸殘基)編碼序列的大 腸桿菌培養物(BL2 1 Rosetta-Gami)中誘導重組經改質油質 蛋白之表現。使培養物在37。(:及220 rpm下生長直至中間 對數期(0〇6〇〇0·5-0·7);藉由添加IPTG至1 mM最終濃度來 誘導表現。在37°C及220 rpm下再培育經誘導之培養物2-3 小時。給定經改質油質蛋白之特性,申請者並不試圖以可 溶性形式表現經改質油質蛋白,而寧願選擇自包涵體中提 取經改質油質蛋白。將培養物之等分試樣(丨mL)轉移至1.5 mL微量離心管中且藉由離心(在ye下,2655 xg歷時5分鐘) 使細胞集結成粒。 將集結成粒之細胞以5 ml/g濕細胞集結粒再懸浮於
BugBuster®試劑(Merck)中,添加 DNase直至 40 pg/mL且在 旋轉器上緩和混合30分鐘’繼之在4。(:及8000 g下離心1 〇 分鐘。以上述BugBuster®及DNase再處理所得細胞集結 粒。藉由在4 C及8000 g下離心1 〇分鐘將剩餘可溶性蛋白 質及懸浮細胞碎片與不溶性包涵體分離。 使用由D’AndMa等人(2007)改編之程序,自包涵體進一 步純化重組油質蛋白《簡言之,藉由再懸浮於2〇〇 mM碳 酸鈉緩衝液pH 11(5 mL/g原始細胞集結粒)中來洗滌包涵體 製劑且藉由在4C及800〇xg下離心.1〇分鐘使其再隼结成 粒。使經洗滌之包涵體集結粒再次以5 „^每公克集結粒再 懸浮於200 mM碳酸鈉緩衝液中且添加至9體積新鮮製備之 氯仿··甲醇混合物(5:4 v/v)中’直至最終比率為5:4:1(氣仿: 151910.doc -75- 201127957 曱醇:緩衝液)。將懸浮液緩和混合5分鐘,形成乳狀單相混 合物;在4°C及10,〇〇〇xg下離心10分鐘,且將含有經改質 油質蛋白之上清液小心地與集結粒分離且轉移至新管中。 使上清液之等分試樣在氮氣流下變乾且將蛋白質再溶解於 8 Μ尿素中且藉由QubitTM(invitr0gen)定量。 實例3:使用抗芝麻種子油質蛋白抗體將芝麻種子油質蛋 白與人工引入之半胱胺酸結合 使用點潰墨點法比較實例丨中所述之抗芝麻種子油質蛋 白抗體(Ab)結合至不含半胱胺酸之油質蛋白對比結合至含 有半胱胺酸之油質蛋白(實例2中所述)的能力。將經純化
Ole-0-0、〇ie-i_3及 〇le-3-l 自 12至 0.25 ng的一系列稀釋液 點潰於預平衡之Hybond-P PVDF轉移膜上。以^2000與作 為一次抗體之抗芝麻種子油質蛋白抗體一起培育。隨後將 墨點與適當二次Ab —起培育且藉由化學螢光顯影(圖7)。 結果表明在免疫墨點上,抗芝麻種子油質蛋白抗體對不含 半胱胺酸殘基之油質蛋白的敏感性比含半胱胺酸殘基之油 質蛋白的敏感性高至多一個數量級。由於具有不同敏感 性,所以有必要在供免疫墨點分析之凝膠上加載不同數量 之重組蛋白質。儘管存在不均勻條帶加載,但仍可能就單 體形式與寡聚形式之間的相對分佈來比較條帶之間的不同 油質蛋白》 實例4 .以大勝桿菌表現之含有至少一個人工引入之半耽 胺酸且改變交聯程度的經改質油質蛋白製造人造油體 製備人造油體 15I9l0.doc 201127957 隨後使實例3中所述之上清液之等分試樣(經計算含有 1 50 pg或1 mg之重組油質蛋白)變乾,製備人造油體 (AOB)。
生成AOB之過程涉及組合PL、TAG及重組油質蛋白/經 改質油質蛋白。在強離液劑不存在下,自經純化溶離份解 離個別重組油質蛋白所需之斷裂力涉及音波處理與冷卻之 數個交替循環。此過程係藉由將1 50 pg及1 mg油質蛋白/經 改質油質蛋白樣品溶解於20 pL含有1 50 gg PL(Sigma,目 錄號P3 644)之氯仿中且與60 pL經純化芝麻種子油(Tzen及 Huang 1992)及940 μΐ^ AOB緩衝液(50 mM磷酸鈉緩衝液pH 8.0、 100 mM NaCl)混合來達成。隨後音波處理全部混合 物三次,歷時30秒(Sonics & Materials Vibra~Cell VC600, 600 W, 20 kHz ; "楔形微尖端探針,功率設定#3)。 申請者亦發現純化程序可成功地按比例擴大且當50 g細 胞集結粒用作起始物質時,有必要以旋轉真空蒸發器替代 氮氣流以移除氯仿及大部分曱醇。此時,大部分油質蛋白/ 經改質油質蛋白自共沸溶劑中沈澱析出且藉由在12,000 g 下離心1 0分鐘來分離。
將包涵體懸浮於1 mL AOB緩衝液11(50 mM磷酸鈉pH 8.0、 100 mM NaCl、20 mM β-酼基乙醇、10 mM DTT及 5%[v/v]芝麻油)中且隨後音波處理4次。藉由在12,000 rpm 下離心1 0分鐘濃縮AOB,此使得形成覆蓋含水溶離份之 AOB懸浮液。藉由吸管移除下層含水溶離份,且藉由在1 mL AOB 緩衝液 111(50 mM 磷酸鈉 pH 8.0、100 mM NaCl)中 151910.doc •77- 201127957 緩和攪動來洗滌剩餘AOB(以移除可溶性蛋白質及還原 劑)。洗滌之後,藉由離心再濃縮AOB,且移除下層含水 溶離份’隨後藉由在AOB緩衝液IV(50 mM碳酸納緩衝液 pH 8·0、1〇〇 mM NaCl、1 mM GSSG)中渴旋使其再懸浮且 在4°C下保存AOB以供進一步分析。 成功地在大腸桿菌包涵體中表現及定位重組〇le_〇_〇、及 油質蛋白-半胱胺酸之所有變異體(圖9)。〇16_〇_〇主要以單 體形式存在(在包涵體以及AOB中);其比20 kDa分子量之 標記物更快地分層遷移(在還原及非還原SDS及SDS-UREA PAGE中)。亦存在兩個約35及3ό kDa之較慢遷移免疫活性 帶,其可能對應於兩個二聚油質蛋白形式。雖然未預測到 Ole-0-O含有任何半胱胺酸殘基,但兩個可見二聚體之總強 度及比率受還原劑存在之影響(β_ΜΕ 5%樣品加載緩衝液及 10 mM DTT)〇 在包涵體中,Ole-1-l之主要形式為單體。似乎僅存在一 個一聚形式且此形式不受還原劑或尿素之影響。來自A〇B 之Ole-1-l(在還原劑存在下產生且隨後在氧化劑存在下產. 生)展現二聚體與單體之比率大幅提高以及形成三聚、四 聚及(可能)五聚募聚物(此等寡聚物之電泳聚焦在SDS-UREA凝膠中顯著改善)。GSSG之移除及還原劑再引入 AOB中使得僅單體與二聚體以與包涵體中所見相似之比例 存在。以〇le_1_1產生之AOB(在還原劑及GSSG均不存在 下)展現存在幾乎相等部分之單體及二聚體及少量三聚 體’表明AOB形成之條件具有一定還原電位。GSSG之後 151910.doc •78· 201127957 只添加使募聚部分增加以及出現四聚形式。 雖…丨單體為包涵體中Ole-3-3之主要形式,但亦存在相當
同W分率之多個寡聚形式。寡聚物之比例在添加還原劑之 後以較J# vk I χ」程度減少且在添加還原劑及離液劑之後稍微增 加备自A〇B中提取重組蛋白質時,比三聚體更大的01e_ 3 3募聚开》式不充分地解析。藉由添加GSSG且在還原劑及 離液劑不存在下促進大寡聚形式之生成,一部分此等寡聚 # 形式未此進入堆積凝膠。總之,此等結果表明在AOB上 01e-3-3高度交聯且交聯位置與自包涵體中回收之〇ie_3_3 相比更多變。此表明’儘管預存在相當多之交聯(在包涵 體内),但在AOB上〇16_3_3可利用大量用於交聯之潛在搭 配物。Ole-1-3及〇le-3-l係類似的,當在一或兩個親水區 上存在一個以上半胱胺酸時,交聯物質之數量增加(圖8及 9) 〇 可預期在非還原SDS-PAGE中,含有相同數目油質蛋白 # 但二硫鍵在不同位置的寡聚物將彼此不同地遷移。實際 上,此可見於圖8中,圖’中資料表明油質蛋白臂之位置相 對於彼此在油體上之不同位置處。舉例而言,Ok-K每臂 僅可形成一個二硫鍵且此二硫鍵必須在相同位置處形成, 因為存在三個半胱胺酸能夠使得形成一個以上二硫鍵,但 其亦使得二硫鍵以不同程度之親水性臂重疊以及多個油質 蛋白結合至同一臂上來形成(圖8及9)。 SDS及還原劑(DTT及β-ΜΕ)之添加減少寡聚複合物之數 量(圖9)。添加SDS及尿素導致對單獨之SDS存在類似圖 151910.doc -79- 201127957 樣,而當出現以下情況時除外:先前解析之多個二聚形式 一致地遷移且三聚及四聚形式似乎呈現較高豐度,大概因 為其亦以單帶形式遷移,由此相應地提高強度(圖。相 反,SDS、還原劑及尿素之存在導致形成較少及 〇le-l-3寡聚形式,而非形成〇16_31或〇163-3寡聚形式(圖 9)。在〇le-3_1&01e_3_3之情況下,尿素似乎不會使二硫化 油質蛋白完全變性且可能實際上防止二硫鍵完全還原。實 情可為:在包涵體生成期間形成此等鍵(將需視還原及非 還原包涵體製劑而定)。此外,在經工程改造之半胱胺酸 殘基不存在下形成的二聚油質蛋白之存在(圖8及9)表明一 些低聚合反應歸因於其他類型之吸引,例如強疏水鍵結, 其不會由SDS完全破壞但可由SDS及尿素之組合幾乎完全 破壞(圖8及9)。 在油質蛋白肽中增加潛在交聯位點之數量對Α〇Β完整性 及乳液穩定性的作用可如下評估。 ΑΟΒ完整性之定量測定 使用吸光度(ODeoo)、使用也球計之ΑΟΒ直接計數、或藉 由顯微鏡目測評價聚結對A0B穩定性及完整性進行之評估 經證實具有高度可變性且尤其受以下影響:預抽樣攪動之 程度;移除樣品之數量;在顯微鏡下保持之時間。為了避 免此可變性,申請者設計出一種定量在多種處理期間自 AOB釋放至周圍介質中的TAG之量的簡單方法作為比較完 整性之手段《在250 μί GC玻璃插入管中使用A〇B緩衝液 (適當時在OB或AOB樣品中以1:1之PNK:總蛋白質比率含有 151910.doc •80- 201127957 蛋白酶Κ[ΡΝΚ])將基本上等量(基於TAG之FAMES-GC/MS 估計及蛋白質之布萊德福測定)之AOB製劑補足至200 μί 之總體積且以塑料蓋覆蓋。在處理(高溫或暴露於ΡΝΚ)之 後,將15 μι魚油(Vitamax®,Australia)添加至樣品中且藉 由渦旋混合,繼之在5,200 g下離心1分鐘。添加魚油之後 進行渦旋能夠使自AOB漏出之任何TAG與添加之魚油混合 且藉由短暫離心而漂浮。取出4 pL油相樣品且經受脂肪酸 甲基酯化(FAME)且隨後藉由GC-MS(Shimadzu型號,裝備 有5〇111(5(:2/3?乂70-0.25 0(:毛細管柱(50丑),如由以〇%36等 人(1986)所描述)來分析。在不添加魚油之情況下,自AOB 漏出的TAG之量極少以致甚至在離心之後亦不能形成可取 樣之可見層,在此情況下,最大體積將為6 μί。魚油與芝 麻油的極其不同之脂質概況使吾人能夠容易地區分漏出之 TAG與添加之TAG。 申請者可使用内部C15:0及C17:0標準物來計算在處理後 回收的C18:2(在芝麻種子油中之主要脂質)之絕對數量》 在高溫下AOB完整性及乳液穩定性之測定 水包油乳液在高溫下穩定性較低;因此,研究具有變化 數量之引入半胱胺酸的經改質油質蛋白在高溫下是否影響 AOB完整性係有意義的。為了實現此目的,申請者測定在 95°C下在磷酸鹽緩衝液(5〇 mM磷酸鈉緩衝液pH 8、100 mM NaCl)中的OB及AOB(含有不同油質蛋白)之完整性(使 用上述方法)。加熱AOB並保持2小時。如上所述測定完整 性。 151910.doc -81 - 201127957 較高比率之交聯油質蛋白:TAG對瘤胃液中A〇b之穩定性 的作用可如下評估。 測定在瘤胃液中之AOB完整性 二硫化物之一目的係提供一定程度之保護以免由瘤胃微 生物群生物氫化。可如下評估在瘤胃液中之Aob穩定性。 將AOB添加至等體積(25 μ]1)之瘤胃液中。在39<t下培育樣 品〇、15、30、60、120及240分鐘,在培育結束之時,添 加#體積之加載緩衝液(Invitrogen),混合且在7〇〇C下加熱 1〇分鐘。藉由SDS-PAGE/免疫墨點比較15 μι各樣品/加載 緩衝液混合物。如上所述測定完整性。 在蛋白酶Κ中ΑΟΒ完整性之分析 為了研究經改質油質蛋白在可控及可重複的高度降解環 境中之影響’在37°C下’在含有l:l(g/g蛋白質)蛋白酶 K(Invitrogen)之磷酸鹽緩衝液(5〇 tnM鱗酸納緩衝液pH 8、 100 mM NaCl)中培育4小時之後,(使用上述方法)測定 AOB(含有不同經改質油質蛋白)之完整性。雖然蛋白酶κ 之最大活性在低於65。(:下實現,但使用較低溫度來減少溫 度對AOB不穩定性之影響。如上所述測定完整性。 實例S:含有一或多個人工引入之半胱胺酸的經改質油質 蛋白之設計及在植物中之表現 用於在植物中表現之構築體設計 申請者合成在N端及C端臂中具有不同數量之半胱胺酸 的芝麻種子油質蛋白(基於GenBank純系AF091840)之個別 編碼序列。編碼序列由5,Notl位點及3' Ndel位點側接。合 151910.doc • 82 - 201127957 成含有以下之各別受體卡匣:attLl位點、Notl位點及Ndel 位點,繼之以nos終止序列、前向CaMV35s啟動子、擬南 芥 DGAT1(S205A)(SEQ ID NO 11-20及圖 1-5)加上其自身 UBQ10内含子、attL2位點。經由Notl及Ndel位點將具有不 同數量之半胱胺酸的芝麻種子油質蛋白個別轉移至受體卡 匣中。此等完整卡匣之每一者隨後經由LR重組反應轉移至 植物二元載體pRShl中(圖6(Winichayakul等人,2008))。以 此方式將油質蛋白置於CaMV35s啟動子(已包含於pRShl 内)之下游且將nos終止子(已包含於pRShl内)置於芥菜屬 DGAT1(S205A)之下游(圖1-5)。編碼芝麻種子油質蛋白(含 有半胱胺酸)之核苷酸序列及DGAT1經優化以供在擬南芥 中表現,包括以下優化:密碼子使用頻率、GC含量、移 除隱蔽剪接位點、移除mRNA不穩定性序列、移除潛在聚 腺苷酸化識別位點及添加四核苷酸終止密碼子(Brown等 人,1990 ; Beelman及 Parker, 1995 ; Rose,2004 ; Rose及 Beliakoff,2000 ; Norris 等人,1993)。 應注意到所用油質蛋白序列僅為例示性的。任何油質蛋 白或油體固醇蛋白或油體鈣蛋白序列均可經工程改造以含 有交聯區。對照原始油質蛋白轉譯序列之重複序列查核 (剪接之後)完整ORF之編碼序列且發現在油質蛋白編碼區 上係相同的。 以含有半胱胺酸之芝麻種子油質蛋白轉型擬南芥 如先前所述(Scott等人,2007),(以上述構築體)轉型擬南 芥變異體Columbia,分析T2種子之經改質油質蛋白,對含 151910.doc -83 - 201127957 有具有不同數量半胱胺酸之芝麻種子油質蛋白的擬南芬油 體進行免疫墨點分析。 花序浸潰法(floral-dip)(Clough,1998)及花序滴落(fl〇ral_ drop)法(Martinez-Trujillo,2004)均用於藉由含有二元構築 體之根癌土壤桿菌GV3 101使芥菜屬轉型。自經處理植物 中收集T1種子,使其發芽且藉由在發芽後第14天及第21天 以Basta®喷霧來選擇。移植Basta®抗性T1植物(分別含有單 一芝麻種子油質蛋白及經改質油質蛋白構築體之71、62及 23轉型物)’使其自體孕育(seif_fertiiise),結種子且收集 T2種子。藉由SDS_PAGE/免疫墨點,以抗芝麻種子油質蛋 白抗體分析自Basta®抗性芥菜屬植物中提取之等量種子; 在大部分樣品中觀察到適當尺寸之重組芝麻種子油質蛋白 及經改質油質蛋白(圖10)。對選定T2株執行南方墨點分析 以測定插入位點之數量。 實例6:自擬南芥種子提取及純化具有含有至少一個人工 引入之半胱胺睃的經改質油質蛋白之油體 來自擬南芥種子之粗油體製劑 自如實例5中所述產生之植物種子,藉由以含有刮勺尖 量之沙及750 gL提取緩衝液(1〇 mM磷酸鹽緩衝液pH 7.5, 含有600 mM蔗糖)之研缽及研杵研磨200 mg種子或藉由使 用Wiggenhauser d-13〇均質器在300 μί提取緩衝液中均質 化25 mg種子來製備粗〇Β製劑。再添加75〇 提取緩衝液 且將研蛛中之漿料轉移至.2 mL微量離心管中’而在1 mL提 取緩衝液中沖洗均質器尖端且將此體積添加至均質化之種 151910.doc • 84 - 201127957 子中。隨後在20,000xg下離心樣品5分鐘;由此產生集結 粒及以含有完整及破碎油體以及游離TAG之不混溶油層覆 蓋的含水上清液。將上覆油層輕輕推向管之側邊,且丟棄 水層及集結粒材料。隨後藉由在提取緩衝液中渦旋使油層 自管之側邊再懸浮且置於新的2 mL微量離心管中。以提取 緩衝液使最終體積補足至〇 5 mL。 來自擬南芥種子之經純化油體製劑,及經工程改造油質蛋 φ 白之間的交聯半胱胺酸殘基 使用Wiggenhauser d_130均質器在3〇〇 μ1提取緩衝液(ι〇 mM磷酸鹽緩衝液ΡΗ 7.5,含有600 mM廉糖)中研磨乃 mg(如實例5中所述經轉型植物之)芬菜屬種子。研磨種子 直至碾碎且樣品呈現「乳油狀」且起泡,因為澱粉自種子 中釋放出來。在i ml緩衝液中沖洗均質器尖端且將此體積 添加至碾碎種子中。製備四批樣品直至此時,隨後在 14,000 rpm下離心5分鐘。使用加載薄凝膠之尖端將油層輕 • 輕推向管之側邊,且將水層移至新管令。使用提取緩衝液 自管之側邊再懸浮油層且置於新的2 ml管中。以提取緩衝 液將最終體積補足至0.5 ml(由管之側面讀取),將樣品分 成兩份且將氧化劑(3 mM GSSG)添加至一管中且在室溫下 培月ίο刀鐘。隨後將油體製劑添加至等體積之加載凝膠 之緩衝液中且煮沸5分鐘,之後加載於凝膠上。
使樣品在標準凝膠裝備系統(Bi〇_Rad)中的預製NupAGE
Novex 4 12/。Bis-Tris Midi凝膠(invitr〇gen),或仙卩八仰⑧
Novex 12% Bis_Tris梯度凝膠丄〇麵⑴孔目錄號 151910.doc -85· 201127957 NP0343BOX)(含有NuPAGE® MES SDS電泳緩衝液(僅對 Bis-Tris 凝膠)(2〇χ),目錄號NP0002-02)上,或在手灌 Tris· HC1凝膠上跑膠。藉由SafeStain(Invitrogen)染色凝膠以展 現使用lBlot系統(Invitrogen)加載或點潰於硝化纖維素膜上 之總蛋白質。在各情況下,陰性對照為自野生型c〇lumbia 種子中提取之樣品且陽性對照為對野生型芝麻種子執行相 同^取法(但藉由研蛛及研样研磨)。將10 μΐ每一樣品及陰 性對照加載於凝膠上,且將5 μΐ用於陽性對照。 在點潰之後’在12.5%脫脂奶粉於TBST(50mMTrispH 7·4、1〇〇 mM NaC卜0.2 °/〇 Tween)中之溶液中阻斷膜並保 持至少1.5小時。隨後在TBSt中洗滌膜3x5分鐘,之後在室 溫下以1/1000與一次抗體(抗芝麻)一起於TBST中培育1小 時。再以TBST洗滌3次之後,在室溫下以1/5〇〇〇與二次抗 體(抗兔)一起培育1小時。再洗滌膜三次,之後使用標準化 學發光方案顯影信號。 圖11展現在CaMV35S啟動子之控制下芝麻種子油質蛋白 單70在油體上之積聚。可見,發現重組油質蛋白及聚油質 蛋白在擬南芥之種子中積聚且正確地靶向油體(圖u)。此 外,可見在氧化劑存在下歷時10分鐘,含有半胱胺酸之重 組油質蛋白形成交聯,如在此等樣品中(且非在野生型或 非氧化轉殖基因油體中)寡聚物出現及單體形式相應消失 所證明。 增加油質蛋白肽中的潛在交聯位點之數量對植物中〇B 元整性及乳液穩定性之作用可如下評估。 151910.doc -86 - 201127957 OB完整性之定量測定 使用吸光度(〇D60())、使用血球計之AOB直接計數、或藉 由顯微鏡目測評價聚結對OB穩定性及完整性進行之評估 經證實有高度可變性且尤其受以下影響:預抽樣攪動之程 度;移除樣品之數量;在顯微鏡下保持之時間。為了避免 此可變性,申請者設計出一種定量在多種處理期間自OB 釋放至周圍介質中的TAG之量的簡單方法作為比較完整性 ^ 之手段。在250 kL GC玻璃插入管中使用AOB緩衝液(適當 時在OB樣品中以1:1之PNK:總蛋白質比率含有蛋白酶 K[PNK])將基本上等量(基於TAG之FAMES-GC/MS估計及 蛋白質之布萊德福測定)之OB製劑補足至200 μί之總體積 且以塑料蓋覆蓋。在處理(高溫或暴露於ΡΝΚ)之後,將15 pL魚油(Vitamax®,Australia)添加至樣品中且藉由滿旋混 合,繼之在5,200 g下離心1分鐘。添加魚油之後進行渦旋 能夠使自OB漏出之任何TAG與添加之魚油混合且藉由短暫 φ 離心而漂浮。取出4 pL油相樣品且經受脂肪酸曱基酯化 (FAME)且隨後藉由GC-MS(Shimadzu型號,裝備有 50mQC2/BPX70-0.25 GC毛細管柱(SGE),如由 Browse等人 (1986)所描述)來分析。在不添加魚油之情況下,自OB漏 出的TAG之量極少以致甚至在離心之後亦不能形成可取樣 之可見層,在此情況下,最大體積將為6 μί。魚油與芝麻 油的極其不同之脂質概況使吾人能夠容易地區分漏出之 TAG與添加之TAG。 使用内部C15:0及C17’.0標準物,申請者可計算在處理後 151910.doc -87- 201127957 回收的C18:2(在芝麻種子油中之主要脂f )之絕對數量。 在高溫下OB完整性及乳液穩定性之測定 水包油乳液在高溫下穩定性較低;因此,研究具有變化 數量之引入半胱胺酸的經改質油質蛋白在高溫下是否影響 OB及AOB完整性係有意義的。為了實現此目的申請者 測定在95°C下在磷酸鹽緩衝液(50 mM磷酸鈉緩衝液pH 8、 1〇〇 mM NaC1)中的0B(含有不同油質蛋白)之完整性(使用 上述方法)。加熱AOB並保持2小時。如上所述測定完整 性。 較高比率之交聯油質蛋白:T A G增加瘤胃液中〇 B之穩定 性的作用可如下評估。 測定瘤胃液中之OB完整性 二硫化物之一目的係提供一定程度之保護以免由瘤胃微 生物群生物氫化。可如下評估在瘤胃液中之〇B穩定性。 將OB添加至等體積(25 pL)之瘤胃液中。在39。〇下培育樣 品〇、15、30、60、120及240分鐘,在培育結束之時,添 加等體積之加載緩衝液(Invitr〇gen),混合且在7〇π下加熱 1〇分鐘。藉由SDS-PAGE/免疫墨點比較15吣各樣品/加載 緩衝液混合物。如上所述測定完整性。 在蛋白酶Κ中0Β完整性之分析 為了研究經改質油質蛋白在可控及可重複的高度降解環 圭兄中之影響,在37C下,在含有1:1 (g/g蛋白質)蛋白酶 K(Invitrogen)之磷酸鹽緩衝液(5〇 mM磷酸鈉緩衝液pH 8、 1〇〇 mM NaCl)中培育4小時之後,(使用上述方法)測定 151910.doc -88· 201127957 A〇B(含有不同經改質油質蛋白)之完整性。雖然蛋白酶κ 之最大活性在低於65。(:下實現,但使用較低溫度來減少溫 度對ΟΒ不穩定性之影響。如上所述測定完整性。 實例7:在擬南芥之葉中產生油艘 為了在營養組織中產生油體,有必要在該組織(例如葉) 中產生三酸甘油g旨。 在植物之營養部分中產生三酸甘油醋
在大多數植物(包括黑麥草)中,大部分葉脂質附著於甘 油骨幹上且以二酸甘油酯形式存在。將該等葉脂質併入脂 質雙層中,其中葉脂質充當多個亞細胞細胞器之膜或充當 細胞本身之膜。葉中的大部分脂質雙層為葉綠體葉綠層 膜。較小量葉脂質以葉表皮蠟質形式存在且甚至更小百分 比之葉脂質以三酸甘油酯(TAG)形式存在。 大多數植物在發育胚胎及花粉細胞中合成及儲存TAG, 隨後利用TAG來提供在發芽及花粉管生長期間可分解代謝 之能量。雙子葉植物可積聚高達約6〇%其種子重量的 TAG。通常,在主要能量儲存形式為碳水化合物(例如激 粉)的單子葉植物種子中,此含量顯著較低。在_生物 合成中之唯-關鍵步驟為最後一步,亦即第三脂肪酸加成 至現存二酸甘油自旨上,由此產生而。在植物巾,藉由包 括以下之三種酶中之一者執行此步驟:醯基輔酶A:酸甘 油i旨醢基轉移酶(DGAT1)、不相關醯基輔酶八.二酸甘、“匕 酿基轉移酶(DGAT2)及麟脂:二酸甘油㈣基__= 人,1999 ’· Bouvier-Nav0 等人,2〇〇〇 ; Dahi_t 等人 151910.doc -89· 201127957 2000 ; Lardizabal等人,2001)。此等基因之任一者的轉錄 區在植物之營養部分中之過度表現使得在葉細胞之細胞質 中形成TAG液滴,如以下各者之過度表現所證明:在煙草 中之芥菜屬DGATl(Bouvier-Nav6等人,(2000));在酵母及 煙草中之油桐樹DGAT2(Shockey等人,(20〇6));在芥菜屬 中之芥菜屬PDAT(Stahl等人,(2004))。在一些情況下,芥 菜屬DGAT1之過度表現經證明在例如百脈根(Lotus japonicus)毛根(Bryan等人,2004)及黑麥草葉(Cookson等 人,2009)中增加總脂質含量,而非必須藉由積聚TAG來實 現此增加。 為了證明TAG在此等植物之葉中的積聚,吾人可比較自 此等植物之葉中提取的全部數量之脂質與未轉型植物或以 空二元載體轉型之植物的全部數量脂質。確保植物在相同 環境條件下生長且葉樣品為生理學上等效物。可使用 FAMES GC-MS分析,以適當内標實現全部脂質提取物之 定量(如由 Winichayakul 等人,2008 Delivery of grasses with high levels of unsaturated, protected fatty acids. Proceedings of the New Zealand Grassland Association, 70:211-216所述)。或者,可使用Folsch方法(Folsch等人, 1957 J. Folsch,M. Lees及 G.A. Slone-Stanley,A simple method for the determination of total lipid extraction and purification, Journal of Biological Chemistry 226 (1957), 第497-507頁)提取全部脂質且藉由裝備有Restek(Restek Corp.,Bellefonte,PA)RTX65TG管柱之 GC-MS,使用適當 151910.doc ·90· 201127957 内標來定量。 自過度表現擬南芥DGATl(S2〇5A)及芝麻種子油質蛋白 構築體(〇leo_0-0 或 01eo_l-l 或 01eo_l-3 或 〇ie〇 咬 01eo_3-3,SEQ ID NO 11-20,圖1-5)之植物中取出葉樣〇 且藉由SDS-PAGE/免疫墨點’使用多株抗芝麻種子油質蛋 白抗血清來分析。可見,發現重組油質蛋白在擬南界之葉 中積聚(圖12)。 φ 油質蛋白/經改質油質蛋白蛋白質在同一細胞(例如葉細 胞)中之同時表現及積聚將導致產生由嵌有油質蛋白之碟 脂單層囊封的三酸甘油醋油體;此已在酵母中(Ting等人 1997)及在種子中(Abell等人,2004)由未經改質油質蛋白證 明。 來自轉殖基因擬南芥之葉的油體製劑 可自表現DGAT1(S205A)及芝麻種子油質蛋白構築體 (Oleo_0-0 或 〇leo_i_i 或 oko—u 或 〇le〇 31 或 〇le〇 3 3, φ SEQ ID NO 11-20,圖1-5)之轉殖基因擬南芥之葉中提取油 體。 在油質蛋白肽中増加潛在交聯位點之數量對該等植物之 OB的作用可藉由如實例6中所述量測〇B完整性及乳液穩定 性來評估。 叹什及構建在每一親水性臂中含有三個以上半胱胺酸殘基 之油質蛋白 田與DGAT1(S205A)共表現時,〇le_3 3株具有相當大程 度的月曰質含里(呈TAG形式)增加,而含有〇le 〇 〇之株不具 151910.doc •91 · 201127957 有高於過度表現DGAT1之對照株的脂質含量增加。ole-1,1、ole-l,3及ole-3,l展現在葉中脂質積聚之水準與經工程 改造至各臂中的半胱胺酸數量的增加之間具有相關性(表 3)。 表3.表現載體對照、單獨的DGAT1(S205A)、或DGAT1 (S205A)及不同形式之油質蛋白(在各親水性臂中不含額外 半胱胺酸或含有至多3個額外半胱胺酸)的芥菜屬葉之脂肪 酸組成(以乾重%計)。 脂肪酸 概況 載體對照 DGAT1 ALONE DGAT1SA U2 DGAT1 +OLE 0-0 mi) DGAT1 +OLE Μ DGAT1 +OLE 1-3 (#5) DGAT1 +OLE 3-1 (#18) DGAT1 +OLE 3-3 (#47) C16:0 0.55±0.035 0.55±0.001 0.54±0.014 o.mo.ooi 0.68±0.042* 0.62 士 0.084 0.95±0.049* C16:l 0.085 土 0.007 0.105±0·007 O.lliO.OOl 0.13士0.014 0.1±0.001 0.135±0.021 0.11±0.001 C16:3 0.34±0.021 0.41 土 0.028 0.42 士 0.007 0.48±0.028 0.51±0.035 0.55 士 0.071* 0_62±0.049* C18:l 0.095土 0.007 0.075士 0.007 0.1 士 0.001 0·185±0.007* 0.345土0.007* 0.2 土 0.0 Μ* 0.61±0.014* C18:2 0.55±0.014 0.46±0.035 0.56±0.014 0_77 土0.049* 0.97±0.007^ 0.79±0.113* 1.82 土 0.113* C18:3 1.67±0.056 1.91±0.028 1·78 士 0.014 1.68±0.028 1.74 土 0.014 1·9±0.28 2.29±0.056* C20:0 未偵測到 未偵測到 未偵測到 未偵測到 未偵測到 未偵測到 0.054±0.003 總脂質(經展示為TAG)之增加與經工程改造至親水域中 的半胱胺酸之數量之間的相關性指示半胱胺酸之數量可為 影響所要TAG之含量的手段。因此,設計每一親水性臂含 有超過3個半胱胺酸之新構築體。每一親水性臂不可能放 置無限數量之半胱胺酸;此等限制包括: •臂之長度-若添加額外殘基為半胱胺酸製造空間時,則 最終疏水域相互作用之程度將降低,因為半胱胺酸接觸 之能力將受其移至OB上之自由度的限制。 •維持+、-及兩性殘基之比例-若此等殘基之平衡及此等 殘基之分佈顯著地變化,則親水性臂可能實際上不與 -92- 151910.doc 201127957 表面相互作用且因而不能提供任何保護對抗脂肪 酶之破壞或聚結。 •硫利用性-若限制硫,則每一油質蛋白分子中的半胱胺 酸增加數量可使植物置於營養應激壓力條件下。 藉由置換胺基酸及主要可預測為中性或帶電而非疏水性 之彼等胺基酸’使原始半胱胺酸-油質蛋白經工程改造成 在各臂中攜帶3個相當均勻間隔之非配對半胱胺酸。 油質蛋白據推斷需要具有某程度負電荷且在c端中,此 』似乎可藉由K(Lys)達成,因此繼續執行以额外半胱胺酸 交換帶電或中性殘基之策略可能在防止聚結上之造成較差 穩定!·生此夕卜’在N端親水區中,經工程改造之半耽胺酸 之間留下的殘基似乎太少,以致不能在維持帶正電與帶負 電胺基酸之間的間距及擺動的同時進一步進行殘基取代。 因此,向N端及c端添加額外殘基(半胱胺酸),而非以半胱 胺酸取代現存殘基。或者,可使用具有較長親水性臂之油 質蛋白。 亦設計兩個額外構築體(〇le-5, 6及01e_6,7)。此等構築 體的每一臂中之半胱胺酸殘基並非故意不平衡,而係經編 排,以試圖在各半胱胺酸之間通常得到4_5個殘基。實際 上,為了將N端臂中之半胱胺酸增加至6個,有必要生成額 外殘基(與現存殘基之取代相反);此係藉由自〇le3,3複製 前6個殘基來實現。 與其設計全新核苷酸序列’不如(適當時)添加編碼半脱 胺酸之密碼子三聯組TGT以生成01e_5,6。就額外麵酿胺酸 151910.doc •93· 201127957 殘基而言’使用密碼子三聯組GGA。對在01e_6-7上之額 外N端6個殘基而言,複製〇ie_3,3之N端且在讀碼框中融 合。 次選殖策略經設計以與藉由Notl/Ndel次選殖至油受體中 的初始半胱胺酸油質蛋白相同。隨後藉由LR反應將其重組 至 pRSHl 中(Winichayakul 等人,2008)。芬菜屬 DGAT1(S205A)及油質蛋白基本上置於其自身(^]^^353啟 動子及OCS終止子下。DGA1及油質蛋白純系皆含有 UBQ10内含子。
NetGend係用以預測〇le_5,6及〇le_6 7之剪接圖樣。
Ole—5,6及01e_6,7皆經預測在指導股上僅具有一個供體及 受體位點(皆經預測具有極高識別機率)且在互補股上無位 點。 資料表明含有1,3或3,1半胱胺酸之油質蛋白積聚可偵測 含量之TAG ’但此含量當然小於3,3半胱胺酸油質蛋白(n 積聚痕量,而0, 0不積聚此結果甚至更有力地提示5,6 及6,7油質蛋白可能比3,3構築體積聚甚至更多taG。不久 將獲得來自5,6及6,7構築體之第一資料。 將含有經工程改造半胱胺酸及DGAT1之油質蛋白轉型至野 生型擬南芥中 將5個二硫化物-油質蛋白/DGAT1(S2〇5A)基因構築體及 一對照(含有DGAT1(S205A)而非油質蛋白之構築體)轉移至 植物二元載體pRShl中(Winichayakul等人,2008)且使用土 壌桿菌介導之轉型而轉型至野生型擬南芥中。 151910.doc •94- 201127957 遵照傳統花序浸漬方法之修改版,因為據報導花序浸潰 趨向於損傷發育之長角果’此係由於清潔劑存在於接種物 中(Martinez-Trujillo等人,2004)。因此,使用微量移液器 向每個化一滴一滴地接種。在將接種物引入新近發育之 花中一週之後,重複該接種操作。當長角果已乾枯之時收 集種子’隨後洗淨且種植以供篩選轉型物。 藉由BASTA選擇執行轉型物之篩選且使用分離比率就 φ BASTA抗性來選擇同種接合子轉型物。 將含有經工程改造半胱胺酸&DGati之油質蛋白轉型至野 生型白三葉草t 根據Voisey等人,(1994)之程序執行向白三葉草中之轉 型〇 稱重種子以提供約400-500個子葉(亦即200-250個種子) 以供解剖用(0.06 gm=100個種子)。在離心管中,以7〇%乙 醇沖洗種子1分鐘。藉由在漂白劑(5%有效氣)中在圓筒式 • 混合器上震盪15分鐘,繼之在無菌水中洗滌四次,為表面 殺菌。使種子在4。(:下膨潤隔夜。 在土壤桿菌株系GV3101中維持用於轉型芥菜屬(上述)之 相同構築體且將其接種至含有濃度為1〇〇 mg/L之壯觀黴素 的25 mL MGL肉湯(表4)中《在28。(:下,在旋轉式震盪器 (200 rpm)上使培養物生長隔夜(16小時)^藉由離心 (3000xg ’ 1〇分鐘)收穫細菌培養物。移除上清液且在5 10mMMgS〇4之溶液中再懸浮細胞。 使用解剖顯微鏡自種子剖開子葉。首先移除種皮及胚 151910.doc •95· 201127957 乳。用剖刀,
在72小時共培養期之後, C下,在16小時光週期下培養。 將轉型之子葉轉移至含有補充有 草胺鱗(2.5 mg/L)及特美㈣imentin)(3〇〇叫化)之cr7培養 基的盤中且回到培養室中。 在芽再生之後’將外植體轉移至補充有草胺膦(25 mg/L)及特美汀(3〇〇 mg/L)之(^5培養基中。將再生芽繼代 培養三週至含有選擇物之新鮮CR5培養基中。 當根系形成出現時,將小苗轉移至含有CR〇培養基(含有 草胺膦選擇物)之盆中。在此階段,將大塊再生物分成個 別小苗》隨後將在選擇下生長之整個生根植物罐裝於無菌 泥炭塊(peat plug)中。植物一旦在泥炭塊中生長,則將轉 移至溫室中。 151910.doc 96- 201127957
表4.用於白三葉草轉型之培養基組成 A. CR#0 MS鹽 B5維生素 蔗糖 30 g/L pH 5.8 (KOH) 瓊脂 8.0 g/L CM5 MS鹽 B5維生素 蔗糖 30 g/L BA 0.1 mg/L NAA 0.05 mg/L pH 5.8 (KOH) 瓊脂 8.0 g/L B. CR#7 MS鹽 B5維生素 蔗糖 30 g/L BA 1.0 mg/L NAA 0.05 mg/L pH 5.8 (KOH) 瓊脂 8.0 g/L C. MGL 甘露糖醇 L麩胺酸 1.0 g/L 5.0 g/L KH2P04 250 mg/L MgS04 100 mg/L NaCl 100 mg/L 生物素 100 mg/L 細菌用胰蛋白脒 5.0 g/L 酵母提取物 pH 7.0 2.5 g/L (NaOH) FAMES GC/MS結果展現轉殖基因白三葉草(含有DGAT1 (S205A)及01e_3,3或01e_5,6或Ole 6,7)與野生型相比具有 151910.doc •97- 201127957 升高之總葉脂質概況(圖1 7)。葉脂質之最高含量與經工程 改造至油質蛋白中的半胱胺酸之最高數量之間具有廣義相 關性。 FAMES GC/MS結果展現轉殖基因白三葉草(含有 DGAT1(S205A)及 〇le_3,3 或 01e_5,6 或 Ole 6,7)與野生型相 比具有升高之C18:l及C18:2葉脂質概況(圖18)(亦如在芥菜 屬中所見)。最高含量之葉C18:l及C18:2見於以含有最高 數量之經工程改造之半胱胺酸的油質蛋白轉型之植物中。 測定葉(及種子)中之油體裝配 使用免疫墨點分析(用抗芝麻種子油質蛋白抗體,scott 等人,2007)進行其他篩選以測定過度表現油質蛋白蛋白質 之株。使用此方法,使用蔗糖密度梯度自推定轉型物之丁2 種子中提取油體(OB)或在變性/還原緩衝液中自葉中提取 總蛋白質且在SDS-PAGE中分離蛋白質,轉移至硝化纖維 素膜中且以針對芝麻油質蛋白產生之抗體攻毒(Sc〇u等人, 2007) 〇 在500 μι OB緩衝液(10 mM磷酸鈉pH 7 5 ,含有6〇〇 mM 庶糖)中自25 mg種子中提取粗油體(〇B)。在13 〇〇〇>^下離 心之後’小心地抽出水層且使脂肪墊層再懸浮於2〇〇 # 〇匕緩衝液中,而不干擾底部之集結粒。將20 pL各OB提取 物與4 X加載染料及丨〇χ還原劑一起添加,加熱至7〇(>c並保 持5分鐘且加載於4 ·丨2 %聚丙烯醯胺凝膠上以供免疫墨點分 析。在α-芝麻油質蛋白抗體(l°Ab)中以1:750稀釋度培育墨 點1小時,且在二次抗體令(1:10,000)再培育1小時。 151910.doc 201127957 油質蛋白天然地表現於種子中而非葉中。然而,因為吾 人已在CaMV35s啟動子之控制下共表現DGAT1及油質蛋 白,所以可預期到此將使得能夠在葉中積聚可偵測含量之 油質蛋白。使用針對芝麻油質蛋白產生之抗體,藉由免疫 墨點分析來自在種子中具有高表現之重組油質蛋白(藉由 免疫墨點分析鑑別)的轉型株之葉。 下表5概述在種子及葉中所產生之推定轉型物之數量及 表現重組油質蛋白之植物的數量。 表5 基因構築體ID 推定轉型物 之數量(基於 BASTA抗性) 藉由免疫墨 點分析株種 子之數量(抗 芝麻種子油 質蛋白抗體) 在種子提取液 中,在適當尺 寸下具有陽性 免疫活性帶之 株之數量 在葉提取液 中,在適當尺 寸下具有陽性 免疫活性帶之 株之數量 pRShl- DGAT1(S205A) 對照 8 N/A N/A pRShl- DGAT1(S205A)-Ole 0-0 14 8 7 3 pRShl- DGAT1(S205A)-Ole 1-1 22 2 1 1 pRShl- DGAT1(S205A)-Ole 1-3 20 0 0 1 pRShl- DGAT1(S205A)-Ole 3-1 23 8 4 2 pRShl- DGAT1(S205A)-Ole 3-3 54 22 16 5
應指出,積聚在葉中的重組油質蛋白之含量顯著低於種 子中之含量。然而,在葉中積聚可債測含量的個別株之比 例比當油質蛋白單獨表現時大得多(Roberts Lab,未公開 151910.doc -99- 201127957 資料),表明DGAT1與油質蛋白在葉中之共表現已導致較 高水準之油質蛋白的積聚。 分析來自共表現DGAT1(S205A)及二硫化油質蛋白之轉殖 基因植物的葉 來自在種子中過度表現油質蛋白蛋白質的同種接合子株 之種子發芽以允許生長2、3、4或5週。收穫足量葉材料以 用於FAMES GC-MS以及使用RTX 65-TG Restek管柱之GC-MS,其使得能夠在無衍生作用之情況下分離及鑑別游離 脂肪酸、二酸甘油酯、蠟酯、固醇酯及三酸甘油酯。 製備材料以供FAMES-GC/MS分析 將10 mg經冷洗乾燥之葉粉末置於13x100 mm螺旋帽管 中,向此混合物中添加10 μΐ^非曱基化内標(C15:0 FA,4 mg/mL,溶解於庚烧中),以1 mL經過5% 2,2-二甲氧基丙 烷處理之鹽酸之甲醇溶液試劑(使用無水曱醇將1 mL之3 Μ 溶液稀釋至1 Μ)作為水清除劑。隨後以Ν2氣體沖洗該管, 之後立即以Teflon-襯裏之蓋子密封,且在80°C下加熱1小 時。在管已冷卻至室溫之後,添加10 μί預甲基化之標準 物(4 mg/mL溶解於庚院中之C1 7:0)。向此混合物中添加0.6 mL庚烧及1 ·0 mL 0.9%(w/v)NaCl,且藉由渦旋充分混合。 在室溫下,在500 rpm下離心1分鐘之後,收集100 μί頂層 (含有庚烷)且將其轉移至放入棕色小瓶中的平底玻璃插入 物中以供GC/MS分析。 FAMES GC/MS分析 使用 SGE毛細管柱BPX70(50 mx〇.22 mmx〇.25 μιη)分析 151910.doc -100- 201127957 FAMES GC/MS。GC-MS之條件如下··溫度經程式化以 15°C /分鐘之速率自80°C至150°C,且隨後以8°C /分鐘之速 率至250°C,且保持等溫歷時10分鐘。以分割模式注入樣 品;總流量為28.4 mL/min ;管柱流量為0.82 mL/min ;且 清洗流量為3.0 mL/min。壓力保持在1 50 kPa下;離子源溫 度為200°C且界面溫度保持在260°C下。藉由質譜法,以起 始於50 m/z且終止於3 50m/z之掃描模式獲取目標化合物。 TAG及極性脂質提取 使用Ruiz-L0pez等人,(2003)之修改方法提取TAG。簡言 之,為進行各TAG分析,將34-80 mg經冷凍乾燥之葉粉末 置於配衡的13-mm螺旋帽管中且稱重,添加2.4 mL 0.17 Μ NaC 1之MeOH溶液且藉由渴旋混合。在添加4.8 mL庚烧及 10 pL内標(C14:0,10 pg/pL)之後,輕輕混合懸浮液且在 80°C水浴中,在無震盪之情況下培育2小時。在冷卻至室 溫以後,將上部相(含有脂質)轉移至新的螺旋帽管中且在 氮氣流下蒸發至乾燥。最終,將乾燥粉末再懸浮於100 μ!^ 庚烷中,充分混合,隨後轉移至放入棕色玻璃小瓶中的平 底玻璃插入物中以供TAG分析。 TAG GC-MS分析 在 Hewlett Packard (HP) GC 及 Shimadzu Scientific Instruments Inc. MS (QP2010)上執行 TAG 分析。用 RESTEK 毛細管柱MXT-65TG(65%二苯基-35%二甲基聚矽氧烷, 30.0 mx〇.10 μηι厚度x〇.25 mm直徑),以電子碰撞(EI)電離 模式執行所有分析。氦用作載運氣體。將所有樣品以無分 151910.doc -101 - 201127957 流模式注入1.0 μΐ等分試樣中,且管柱流量為丨2 mL/min。 氣相層析經程式化以15。(: /min之速率自2〇〇至370°C且在 370°C下保持等溫歷時15分鐘。將樣品注射器口之溫度保 持在35〇°C下,管柱爐溫為20(rc,壓力為131」kpa且清洗 流量為3.0 mL/min。質譜分析條件如下:在GC_MS操作期 間離子源溫度保持在260t下,在7〇 eV之電離電壓、6〇 μΑ之發射電流及350°C之界面溫度下獲得質譜。截獲模式 為以5000之速度,每次掃描間隔〇 25秒進行掃描。起始於 9 min且終止於25 min收集具有45爪^至⑺卯m/z之質荷比 的層析峰。 實例8·經工程改造以在、端及c端親水性臂中含有額外半 胱胺酸殘基之其他油質蛋白、油體鈣蛋白及油體固醇蛋白 申明者已對芝麻種子油質蛋白,寄存編號AAD42942(亦 即,預測經取代帶電殘基位於具有半胱胺酸的〇B之表面 上)使用相同策略以將半胱胺酸工程改造至油質蛋白、油 體鈣蛋白及油體固醇蛋白之N端及c端親水性臂中。在一 二隋況下,有可能僅取代相對均勻間隔開之帶負電胺基酸 (麩胺酸及天冬胺酸)。在芝麻油質蛋*AAD42942之情況 下,有時必須兼顧電荷取代。應指出在以下實例中,兩個 油體鈣蛋白(AAB71227及AAF13743)在其c端臂中含有兩 個内源性半胱胺酸。此等物質未經工程改造。 為了判定胺基酸取代之位置,將各蛋白質與呈原始形式 以及每一親水性臂中含有丨或3個半胱胺酸之形式(亦即 〇le_〇,〇 ; 〇le一ι,ι ;心」“ ;〇le—13 ; 〇le_3 3)的芝麻油質 151910.doc 201127957 蛋白(AAD42942)比對。隨後以灰色框突出每一親水性臂 之N端或C端中的潛在麩胺酸及天冬胺酸(藉由疏水性繪圖 判定),相關離胺酸、精胺酸及麩醯胺酸殘基亦如此處理 (其在芝麻油質蛋白(AAD42942)中全部成功地改變)。隨後 考慮此等殘基向半胱胺酸之突變以及其彼此之間的間距。 接著僅以原始肽序列及經工程改造之序列展現最終取代。 在此情況下,僅有3個半胱胺酸經工程改造至各臂中,然 而,該數量可能更大或更少。一替代性方法將可適用於呈 分離形式之各蛋白質且僅藉由以疏水性繪圖鑑別親水區起 始,隨後開始以最適當帶電胺基酸進行取代之過程。 下表6展現已由申請者改質以將半胱胺酸引入親水性部 分中的額外油質蛋白及油體鈣蛋白。 表6.
蛋白質類型 植物來源 寄存編號 SEQ ID NO 油質蛋白 羽衣甘藍(花粉油質蛋白) CAA65272.1 90 油質蛋白 玉米 NP 001147032.1 91 油質蛋白 稻米 AAL40177.1 92 油體鈣蛋白 芝麻 AAF13743 93 油體鈣蛋白 大豆 AAB71227 94 油體鈣蛋白 玉米 NP 001151906 95 油體固醇蛋白 芝麻 AAL13315 96 油體固醇蛋白 甘藍型油菜 ACG69522 97 油體固醇蛋白 玉米 NP 001152614.1 98 151910.doc •103- 201127957 下表7參考經改質油質蛋白中之SEQ ID NO。 蛋白質類型 植物來源 寄存編號 SEQ ID NO 油質蛋白 羽衣甘藍(花粉油質蛋白、 X96409 99 油質蛋白 玉米 … NP 001147032.1 100 油質蛋白 稻米 AAL40177.1 101 油體鈣蛋白 芝麻 AAF13743 102 油體鈣蛋白 大豆 AAB71227 103 油體鈣蛋白 玉米 NP_001151906 104 油體固醇蛋白 芝麻 AAL13315 105 油體固醇蛋白 甘藍型油菜 ACG69522 106 油體固醇蛋白 玉米 NP_001152614.1 107 經改質序列可如以上實例中所述來表現以產生油體、乳 液、轉殖基因宿主細胞、植物等,且測試各自之特性。 本發明之範疇不欲僅限於上述實例。熟習此項技術者應 瞭解,在不偏離本發明之範疇的情況下許多變化係可能 的。 參考文獻
Abell等人,(2004). Plant J.,37: 461-70。
Altschul 等人,(1997) Nucleic Acids Res. 25: 3389-3402。
Andrianov 等人,(2010). Plant Biotechnol J. 8(3):277-87 °
Ausubel 等人,(1987) Current Protocols in Molecular Biology, Greene Publishing Bairoch and Bucher (1994), Nucleic Acids Res. 22,3583。
Bao等人,(2000) Plant J. 22(1):39-50。
Birch (1997) Ann Rev Plant Phys Plant Mol Biol, 48, 297 〇 151910.doc -104- 201127957
Bolton及 McCarthy (1962) PNAS 84:1390。
Bowie等人,(1990)· Science 247, 1306 »
Bouvier-Nave 等人,(2000)五 wr. /. 267,85-96 °
Bryan等人,(2007) Modification of fatty acid biosynthesis. 美國專利20070118927。
Capuano等人,(2007 ). Biotechnol Adv. 25:203-206 〇 Notredame等人,(2000). J. Mol· Biol. 302: 205-217。
Chen等人,(1999)· Plant Cell Physiol·,40:1079-1086. Chiang等人,(2005). J Agric Food Chem 53:4799-804 o Chiang等人,(2007). Protein Expr Purif. 52:14-8。 Cookson等人,(2009). Improvements in and relating to oil production. PCT/NZ2008/000085 WO/2008/130248。
Dahlqvist等人,(2000). Proc Natl Acad Sci U S A. 97, 6487-6492 =
Deckers等人,(2003).美國專利 US 6582710。
Demeyer 及 Doreau,(1999). Proc Nutr Soc. 58(3):593-607。
Deutscher (1990)編,Methods in Enzymology,第 182卷, Guide to Protein Purification 〇
Draper 等人,1988,Plant Genetic Transformation and
Gene Expression. A Laboratory ManuaL Blackwell Sci. Pub. Oxford,第 365 頁。
Falquet等人,2002, Nucleic Acids Res. 30,235 〇 Feng及Doolittle,1987,J. Mol. Evol. 25,351。 151910.doc -105- 201127957
Firkins等人,(2006). J Dairy Sci. 89 增刊 1:E31-51. Review. Greenspan °
Frandsen等人,(2001). Physiologia Plantarum,112:301-307。
Frohman (1993). Methods Enzymol. 218: 340-56。
Galun 及 Breiman (1997). Transgenic Plants. Imperial College Press, London。
Gelvin等人,1993,Plant Molecular Biol. Manual. Kluwer Acad. Pub. Dordrecht。
Giesen等人,Nucleic Acids Res. 1998 Nov 1;26(21):5004- 6 0
Halford 及 Hardie (1998). Plant Mol Biol. 37:735-48.
Review °
Harada等人,(2002). OLEOSIN/PHOSPHOLIPID COMPLEX AND PROCESS FOR PRODUCING THE SAME.世界專利 WO/2002/026788。
Hellens等人,(2000). Plant Mol Biol 42: 819-3。
Hellens等人,(2005). Plant Meth 1: 13。
Herrera-Estrella等人,(1993). Nature 303,209 o Hofmann等人,(1999). Nucleic Acids Res. 27,215 o Hou 事乂,(2003). J Dairy Sci; 86: 424-8。
Huang (1992). Ann. Rev. Plant Physiol. Plant Mol. Biol. 43:177-200 。
Huang, X. (1994) Computer Applications in the 151910.doc •106- 201127957
Biosciences 10,227-235。
Jeanmougin等人,(1998) Trends Biochem. Sci· 23,403-5。 Jenkins 及 Bridges (2007). Eur. J. Lipid Sci. Technol. 109:778-789 〇
Jenkins及 McGuire (2006). J Dairy Sci. 89(4):1302-10. Review。
Kaup等人,(2002) Plant Physiol. 129(4):1616-26 »
Kyte及 Doolitle (1982) J. Mol. Biol. 157:105-132。 Lanfranco L. (2003). Riv Biol. 96(1):31-54 o Lardizabal等人,(2001). J.B.C. 276, 38862-38869。 Leprince等人,(1998). Planta 204 109-119。
Lin及 Tzen. (2004). Plant Physiology and Biochemistry. 42:601-608 °
Lock 及 Bauman (2004). Lipids. 39(12): 1197-206. Review。
Loer及 Herman (1993)· Plant Physiol. 101(3):993-998。 Mayer及 Fowler (1985)· J Cell Biol· 100(3):965-73。 Mekhedov等人,(2000). Plant Physiol. 122(2):389-402)。 Mullis 等人編,1994 The Polymerase Chain Reaction, Birkhauser。
Murphy (1993). Prog. Lipid Res. 32:247-280。
Needleman及 Wunsch,(1970) J. Mol. Biol· 48,443-453。 Nielsen等人,Science. (1991) 254(5037):1497-500。 Ohlrogge 及 Jaworski (1997). Annu Rev Plant Physiol 151910.doc •107- 201127957
Plant Mol Biol· 48:109-136。
Papapostolou及 Howorka (2009). Mol Biosyst. 5(7):723-32. Review 0
Peng (2004). Development and applications of artificial sesame oil body. Ph.D. Dissertation. National ChunHsing University Graduate Institute of Biotechnology. Taichung, Taiwan。
Peng等人,(2006). Stability enhancement of native and artificial oil bodies by genipin crosslink。臺灣專利 1250466 。
Peng等人,(2004). J Biotechnol 2004; 111: 51-7。
Potrykus及 Spangenburg (1995). Gene Transfer to Plants. Springer-Verlag,Berlin o
Roberts等人,(2008). The Open Biotechnology Journal 2:13-21 。
Roux等人,(2004). J Agric Food Chem· 52(16):5245-9 0 Scott等人,(2007). Polyoleosins. WO 2007045019。
Saha等人,(2006). Plant Physiol. 141(4):1533-43 °
Sambrook等人編,1987,Molecular Cloning,A Laboratory Manual,第 2版,Cold Spring Harbor Press。
Sarmiento等人,(1997). Plant J. 11(4):783-96。
Schrott (1995), Gene Transfer to Plants (Potrykus, T., Spangenberg編)Springer Verlag. Berline,第 325-336頁。 Shimada等人,(2008). Plant J. 55(5):798-809。 151910.doc -108 · 201127957
Shockey等人,(2006)· Plant Cell·,18,2294-2313。
Siloto 等人,(2006). Plant Cell· 18(8):1961-74。
Slack等人,(1980). Biochem J. 190(3):551-561。
Slocombe 等人,(2009). Plant Biotechnol J. 7(7):694-703 〇
Stahl 等人,(2004). Plant Physiology,135: 1324-1335。 Stewart等人,(1969), Solid-Phase Peptide Synthesis,WH Freeman Co, San Francisco California °
Thompson等人,(1994) Nucleic Acids Research,22:4673-4680 °
Ting等人,(1997)· J Biol Chem.,272: 3699-3706。 Tadege等人,(2005). Trends Plant Sci· 10(5):229-35 ° Triglia等人,1998,Nucleic Acids Res 16,8186。
Tzen等人,(1992). J. Biol. Chem. 267: 15626-34。 Tzen等人,(2003). Adv Plant Physiol·,6: 93-104。 Tzen等人,(1997). J Biochem. 121(4):762-8。
Voisey等人,(1994). Plant Cell Reports 13: 309 3 14。 Winichayakul等人,(2008). Proc· NZGA,70:211-216。 Xu等人,(2005). Plant Cell. 17(11):3094-110。
Zou等人,(1999). Plant J. 19, 645-653。
Zou等人,(2008). Plant Biotech. J. 6(8):799-818。 151910.doc •109- 201127957 序列表之概述 SEQID NO: 類型 物種 註解 1 聚核苷酸 人造 油質蛋白二硫化物0,0核苷酸序列,使 用Ndel及Xhol限制位點選殖至pET29b 中(添加N端S»tag凝血酶裂解位點及C 端His標籤)。 2 聚核苷酸 人造 油質蛋白二硫化物1,1核苷酸序列,使 用Ndel及Xhol限制位點選殖至pET29b 中(添加N端S*tag凝血酶裂解位點及C 端His標籤)。 3 聚核苷酸 人造 油質蛋白二硫化物1,3核苷酸序列,使 用Ndel及Xhol限制位點選殖至pET29b 中(添加N端S*tag凝血酶裂解位點及C 端His標籤)。 4 聚核苷酸 人造 油質蛋白二硫化物3,1核苷酸序列,使 用Ndel及Xhol限制位點選殖至pET29b 中(添加N端S*tag凝血酶裂解位點及C 端His標籤)。 5 聚核苷酸 人造 油質蛋白二硫化物3,3核苷酸序列,使 用Ndel及Xhol限制位點選殖至pET29b 中(添加N端S*tag凝血酶裂解位點及C 端His標籤)。 6 多肽 人造 油質蛋白二硫化物0,0肽序列,使用 Ndel及Xhol限制位點選殖至pET29b中 (添加N端S*tag凝血酶裂解位點及C端 His標籤)。 7 多肽 人造 油質蛋白二硫化物1,1肽序列,使用 Ndel及Xhol限制位點選殖至pET29b中 (添加N端S*tag凝血酶裂解位點及C端 His標籤)。 8 多肽 人造 油質蛋白二硫化物1,3肽序列,使用 Ndel及Xhol限制位點選殖至pET29b中 (添加N端S*tag凝血酶裂解位點及C端 His標籤)。 9 多肽 人造 油質蛋白二硫化物3,1肽序列,使用 Ndel及Xhol限制位點選殖至pET29b中 (添加N端S*tag凝血酶裂解位點及C端 His標籤)。 10 多肽 人造 油質蛋白二硫化物3,3肽序列,使用 Ndel及Xhol限制位點選殖至pET29b中 (添加N端S*tag凝血酶裂解位點及C端 His標籤)。 151910.doc •110· 201127957
11 聚核苷酸 人造 (包括Kozac序列及UBQ10内含子之油 質蛋白二硫化物0,0之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。) 12 聚核苷酸 人造 包括Kozac序列及UBQ10内含子之油 質蛋白二硫化物1,1之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 13 聚核苷酸 人造 (包括Kozac序列及UBQ10内含子之油 質蛋白二硫化物1,3之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 茶中。) 14 聚核苷酸 人造 包括Kozac序列及UBQ10内含子之油 質蛋白二硫化物3,1之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 茶中。 15 聚核苷酸 人造 包括Kozac序列及UBQ 10内含子之油 質蛋白二硫化物3,3之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 16 多肽 人造 油質蛋白二硫化物0,0之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 17 多肽 人造 油質蛋白二硫化物1,1之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 18 多肽 人造 油質蛋白二硫化物1,3之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 19 多肽 人造 油質蛋白二硫化物3,1之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 20 多肽 人造 油質蛋白二硫化物3,3之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 21 聚核苷酸 人造 包括Kozac序列及UBQ10内含子之油 質蛋白二硫化物5,6之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 22 聚核苷酸 人造 包括Kozac序列及UBQ 10内含子之油 質蛋白二硫化物6,7之核苷酸序列,在 CaMV35s啟動子之控制下轉型至擬南 茶中。 151910.doc -Ill - 201127957 23 多肽 人造 油質蛋白二硫化物5,6之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 24 多肽 人造 油質蛋白二硫化物6,7之肽序列,在 CaMV35s啟動子之控制下轉型至擬南 芥中。 25 聚核苷酸 人造 油受體(含有OCS終止子、CAMV35S 啟動子、來自芥菜屬之 DGAT1(S205A)、及UBQ10内含子) 26 聚核苷酸 人造 油質蛋白_0,0及DGAT1(S205A) 於 pRSHlj 27 聚核苷酸 人造 油質蛋白 _1,1 及DGAT1 (S205A) 於pRSHl t 28 聚核苷酸 人造 油質蛋白 _1,3 及DGAT1 (S205A) 於pRSHl t 29 聚核苷酸 人造 油質蛋白_3,1 及DGAT1(S205A) 於pRSHl t 30 聚核苷酸 人造 油質蛋白 _3,3 及DGAT 1 (S205A) 於pRSHl t 31 聚核苷酸 人造 油質蛋白_5,6及DGAT1(S205A) 於 pRSHl+ 32 聚核苷酸 人造 油質蛋白 _6,7 及 DGAT 1 (S205A) 於pRSHl t 33 多肽 人造 DGAT1(S205A) 34 聚核苷酸 芝麻 油質蛋白-AF302807 35 多肽 芝麻 油質蛋白-AAG23840 36 聚核苷酸 芝麻 油質蛋白-U97700 37 多肽 芝麻 油質蛋白-AAB58402 38 聚核苷酸 擬南芥 油質蛋白-X62353 39 多肽 擬南芥 油質蛋白-CAA44225 40 聚核苷酸 擬南茶 油質蛋白-BT023738 41 多肽 擬南芥 油質蛋白-AAZ23930 42 聚核苷酸 向曰葵 油質蛋白-X62352.1 43 多肽 向曰蔡 油質蛋白-CAA44224.1 44 聚核苷酸 甘藍型油菜 油質蛋白-X82020.1 45 多肽 甘藍型油菜 油質蛋白-CAA57545.1 46 聚核苷酸 玉米 油質蛋白-ΝΜ_001153560.1 47 多肽 玉米 油質蛋白-NP_001147032.1 48 聚核苷酸 栽培稻 油質蛋白-L76464 49 多肽 栽培稻 油質蛋白-AAL40177.1 50 聚核苷酸 羽衣甘藍 油質蛋白-AF117126.1 51 多肽 羽衣甘藍 油質蛋白-AAD24547.1 52 聚核苷酸 咖啡 油質蛋白-AY928084.1 53 多肽 咖啡 油質蛋白-AAY14574.1 151910.doc -112- 201127957
54 聚核苷酸 芝麻 油體固醇蛋白-AF421889 55 多肽 芝麻 油體固醇蛋白-AAL13315 56 聚核苷酸 甘藍型油菜 油體固醇蛋白-EU678274 57 多肽 甘藍型油菜 油體固醇蛋白-ACG69522 58 聚核苷酸 玉米 油體固醇蛋白-ΝΜ_001159142.1 59 多肽 玉米 油體固醇蛋白-NP_001152614.1 60 聚核苷酸 甘藍型油菜 油體固醇蛋白-EF143915.1 61 多肽 甘藍型油菜 油體固醇蛋白-ABM3 0178.1 62 聚核苷酸 芝麻 油體鈣蛋白-AF109921 63 多肽 芝麻 油體鈣蛋白-AAF13743 64 聚核苷酸 大豆 油體鈣蛋白-AF004809 65 多肽 大豆 油體鈣蛋白-AAB71227 66 聚核苷酸 玉米 油體鈣蛋白-ΝΜ_00115 8434.1 67 多肽 玉米 油體鈣蛋白-NP_001151906 68 聚核苷酸 甘藍型油菜 油體鈣蛋白-AY966447.1 69 多肽 甘藍型油菜 油體鈣蛋白-AAY40837.1 70 聚核苷酸 鐵樹 油體鈣蛋白-FJ455154.1 71 多肽 鐵樹 油體鈣蛋白-ACJ70083.1 72 聚核苷酸 番紅花 油體鈣蛋白-EU232173.1 73 多狀 番紅花 油體鈣蛋白-ABY56103.1 74 聚核苷酸 擬南芥 DGAT1-NMJ27503 75 多肽 擬南芬 DGAT1-NP_179535 76 聚核苷酸 旱金蓮 DGAT1-AY084052 77 多肽 旱金蓮 DGAT1-AAM03340 78 聚核苷酸 玉米 DGAT1-EU039830.1 79 多肽 玉米 DGAT1-ABV91586.1 80 聚核苷酸 擬南芥 DGAT2-NM—115011 81 多肽 擬南芥 DGAT2-NP—566952.1 82 聚核苷酸 甘藍型油菜 DGAT2-FJ858270 83 多肽 甘藍型油菜 DGAT2-AC090187.1 84 聚核苷酸 花生 DGAT3(可溶性 DGAT)-AY875644 85 多肽 花生 DGAT3(可溶性 DGAT)-AAX62735.1 86 聚核苷酸 擬南芥 PDAT-NM_121367 87 多肽 擬南芥 PD AT-NP_196868.1 88 聚核苷酸 乾麻 PDAT-XM_002521304 89 多肽 藥麻 PDAT-XP—002521350 90 多肽 羽衣甘藍 油質蛋白-CAA65272.1 91 多肽 玉米 油質蛋白-ΝΡ_001147032.1 92 多肽 栽培稻 油質蛋白-AAL40177.1 93 多肽 芝麻 油體鈣蛋白-AAF13743 94 多肽 大豆 油體鈣蛋白-AAB71227 95 多肽 玉米 油體鈣蛋白-NP_001151906 96 多肽 芝麻 油體固醇蛋白-AAL13315 97 多肽 甘藍型油菜 油體固醇蛋白ACG69522 151910.doc • 113· 201127957 98 多肽 玉米 油體固醇蛋白NP 001152614.1 99 多肽 羽衣甘藍 經改質之花粉油質蛋白-CAA65272.1 100 多狀- 玉米 經改質之油質蛋白·ΝΡ 001147032.1 101 多肽 栽培稻 經改質之油質蛋白-AAL40177.1 102 多肽 芝麻 經改質之油體鈣蛋白· A AF13743 103 多肽 野生大豆 (G soja) 經改質之油體鈣蛋白-AAB71227 104 多肽 玉米 經改質之油體鈣蛋白-NP 001151906 105 多肽 芝麻 經改質之油體固醇蛋白-AAL13315 106 多肽 甘藍型油菜 經改質之油體固醇蛋白-ACG69522 107 多肽 玉米 經改質之油體固醇蛋白-NP 001152614.1 【圖式簡單說明】 圖1展現油質蛋白_〇-〇及DGAT1(S205A)構築體之序列。 CaMV35為花椰菜嵌紋病毒35S啟動子。attBi為 GATEWAYtm重組位點。uBQ 1 0為來自擬南芥UBQ10基因 之内含子。OCS終止子為章魚鹼合成酶終止子。 圖2展現轉型至擬南芥中的油質蛋白_1-丨及DGAT1 (S205A)構築體排列。 圖3展現油質蛋白_1-3及DGAT1(S205A)構築體之序列。 CaMV35為花椰菜嵌紋病毒35S啟動子。attBi為 GATEWAY™重組位點。UBQ10為來自擬南芥UBQ10基因 之内含子。OCS終止子為章魚鹼合成酶終止子。 圖4展現油質蛋白_3-1及DGAT1(S205A)構築體。 CaMV35為花椰菜嵌紋病毒35S啟動子。attBi為 GATEWAY™重組位點。UBQ10為來自擬南芥UBQ10基因 之内含子。OCS終止子為章魚鹼合成酶終止子。 圖5展現油質蛋白_3-3及DGAT1(S205A)構築體。 CaMV35為花椰菜嵌紋病毒35S啟動子。attBi為 151910.doc 114 201127957 GATEWAY™重組位點。UBQ10為來自擬南芥UBQ10基因 之内含子。OCS終止子為章魚鹼合成酶終止子。 圖6展現用於轉型植物的構築體pRShl之定位圖。該定位 圖展現油質蛋白之排列,其中人工引入之半胱胺酸(在此 情況下01eo_3-3)在CaMV35s啟動子之控制下以及擬南芥 DGAT1(S205A)亦在CaMV35s啟動子之控制下。其他油質 蛋白序列及TAG合成酶序列當然可分別取代〇leo_3-3及 DGAT1。 圖7展現結合至含有及不含經工程改造之半胱胺酸殘基 的經純化重組芝麻種子油質蛋白上的抗芝麻種子油質蛋白 抗體之點潰墨點比較。 圖8展現在AOB中偵測大腸桿菌表現之油質蛋白半胱胺 酸蛋白的免疫墨點分析。將等體積之AOB(7.5 μι,包括 2xSDS裝載染料,不含還原劑)加載於每個條帶上。GSSG 之mM濃度在各條帶上方指示。 圖9展現大腸桿菌表現之Ole-0-O、Ole-1-l及Ole-3-3的 SDS及SDS-UREA PAGE/免疫墨點分析。在還原劑(DTT及 β-ΜΕ)或氧化劑(GSSG)存在及不存在下自包涵體(IB)及人 造油體(ΑΟΒ)製備樣品,其中等量之蛋白質加載於相鄰條 帶上。 圖10展現在CaMV35S啟動子之控制下表現DGAT1 (S205A)及芝麻油質蛋白之轉殖基因擬南芥種子中的油質 蛋白(01eo_0-0、01eo_l-3、Oleo—3-l 及 01eo_3-3,SEQ ID NO 11-20)積聚之免疫墨點分析。 151910.doc -115- 201127957 圖11展現在CaMV35S啟動子之控制下表現DGAT1 (S205A)及芝麻油f蛋白之轉殖基因擬南芬之油體中的油 質蛋白(Ole。—〇·〇、0—.3、〇le。—3 ι 及叫。」3,卿 ID NO 積聚之免疫墨點分析。在氧化劑存在下⑴寡 聚油質蛋白條帶(二聚及三聚)之外觀指示二硫鍵能夠在原 生油體之外部形成。 圖12展現在CaMV35S啟動子之控制下表現 DGAT1(S205A)及芝麻油質蛋白之轉殖基因擬南芥之葉中 的油質蛋白(Ole〇_0-0、01Ί_3、〇le〇_3_^〇le〇一3 3, SEQ ID NO 11-20)積聚之免疫墨點分析。 圖13展現在轉殖基因芬菜屬葉中的重組油質蛋白積聚 (黑色箭頭)之免疫墨點。 圖14展現FAMES GC/MS結果,表明在過度表現dgat 1 (S205A)及〇le_3,3之芥菜屬葉中積聚額外脂質(黑色箭 頭)。 圖15展現含有DGAT1 (S205A)及01e_3,3之轉殖基因芥菜 屬的野生型及轉殖株(independent line)之總葉脂質概況之 GC/MS結果《灰色箭頭指示内標。黑色箭頭指示額外中性 脂質(蠟酯、固醇酯及TAG)。空心箭頭展現三個株(41 S、 18A及47C),其與野生型(及株50A)相比在其葉中積聚大量 中性脂質。 圖16展現GC/MS結果,顯示野生型及轉殖基因芥菜屬 (含有DGAT1(S205A)及01e_3,3)在發芽後2、3、4及5週的 總TAG概況。黑色箭頭指示見於轉殖基因葉而非野生型葉 151910.doc _ 116· 201127957 中之額外TAG。 圖17展現FAMES GC/MS結果,顯示野生型及轉殖基因 白三葉草(含有DGAT1(S205A)及01e_3,3)之總葉脂質概 況。 圖18展現FAMES GC/MS結果,顯示野生型及轉殖基因 白三葉草(含有 DGAT1(S205A)及 01e_3,3)之 C18:l 及 C18:2 葉脂質概況。
151910.doc -117- 201127957 序列表 <110>紐西蘭商AG研究有限公司 <120>經改質油包覆之蛋白質及其用途 <130〉 631138 <140> 099139420 <141> 2010-10-29 <150〉 61/256,689 <151〉 2009-10-30 <160> 107
<170〉Patentln version 3. 5 <210> 1 <211〉 579 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400〉 1 atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt accctggtgc cacgcggttc catggctgag cattatggtc aacaacagca gaccagggcg cctcacctgc agctgcagcc gcgcgcccag cgggtagtga aggcggccac cgccgtgaca gccggcggct cgcttctcgt cctctctggc ctcactttag ccggaactgt tattgcgctc accatcgcca ctccgctgct tgtgatcttt agccccgttc tggtgccggc ggtcataacc attttcttgc tgggtgcggg ttttctggca tccggaggct tcggcgtggc ggcgctgagt gtgctgtcgt ggatttacag atatctgaca gggaaacacc cgccgggggc ggatcagctg gaatcggcaa agacgaagct ggcgagcaag gcgcgagaga tgaaggatag ggcagagcag ttctcgcagc agcctgttcc atggctgata tcggatccga attcgagctc cgtcgacaag cttgcggccg cactcgagca ccaccaccac caccactga 151910·序列表.doc 201127957 <210> 2 <211〉 531 <212> DNA <213〉人工序列 <220〉 <223〉人工 <400〉 2 atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60 accctggtgc cacgcggttc catggcttgt cattatggtc aacaacagca gaccagggcg 120 cctcacctgc agctgcagcc gcgcgcccag cgggtagtga aggcggccac cgccgtgaca 180 gccggcggat cccttctcgt cctctctggc ctcactttag ccggaactgt tattgcgctc 240 accatcgcca ctccgctgct tgtgatcttt agccccgttc tggtgccggc ggtcataacc 300 attttcttgc tgggtgcggg ttttctggca tccggaggct tcggcgtggc ggcgctgagt 360 gtgctgtcgt ggatttacag atatctgaca gggaaacacc cgccgggggc ggatcagctg 420 gaatcggcaa agacgaagct ggcgagcaag gcgcgagaga tgaaggatag ggcagagcag 480 ttctcgtgcc agcctgttcc gtggctcgag caccaccacc accaccactg a 531 <210> 3 <211〉 531 〈212〉 DNA <213〉人工序列 <220〉 〈223> 人工 <400〉 3 atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60 accctggtgc cacgcggttc catggcttgt cattatggtc aacaacagca gaccagggcg 120 cctcacctgc agctgcagcc gcgcgcccag cgggtagtga aggcggccac cgccgtgaca 180 -2- 151910·序列表.doc 201127957 gccggcggat cccttctcgt cctctctggc ctcactttag ccggaactgt tattgcgctc 240 accatcgcca ctccgctgct tgtgatcttt agccccgttc tggtgccggc ggtcataacc 300 attttcttgc tgggtgcggg ttttctggca tccggaggct tcggcgtggc ggcgctgagt 360 gtgctgtcgt ggatttacag atatctgaca gggaaacacc cgccgggggc ggattgcctg 420 gaatcggcaa agacgaagct ggcgagctgt gcgcgagaga tgaaggatag ggcagagcag 480 ttctcgtgcc agcctgttcc gtggctcgag caccaccacc accaccactg a 531 <210〉 4 <211〉 531 <212〉 DNA <213〉人工序列<220〉 <223〉人工 <400〉 4 atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60 accctggtgc cacgcggttc catggcttgt cattatggtc aacaacagca gacctgcgcg 120 cctcacctgc agctgcagcc gcgcgcctgt cgggtagtga aggcggccac cgccgtgaca 180 gcgggcggat cccttctcgt cctctctggc ctcactttag ccggtaccgt tattgcgctc 240 accatcgcca ctccgctgct tgtgatcttt agccccgttc tggttccggc ggtcataacc 300 attttcttgc tgggtgcggg ttttctggca tccggaggct tcggcgtggc ggcgctgagt 360 gtgctgtcgt ggatttacag atatctgaca gggaaacacc cgccgggggc ggatcagctg 420 gaatcggcaa agacgaagct ggcgagcaag gcgcgagaga tgaaggatag ggcagagcag 480 ttctcgtgcc agcctgttcc gtggctcgag caccaccacc accaccactg a 531 <210〉 5 〈211〉 531 151910·序列表.doc 201127957 <212> DNA <213〉人工序列 <220〉 <223〉人工 <400〉 5 atgaaagaaa ccgctgctgc taaattcgaa cgccagcaca tggacagccc agatctgggt 60 accctggtgc cacgcggttc catggcttgt cattatggtc aacaacagca gacctgcgcg 120 cctcacctgc agctgcagcc gcgcgcctgt cgggtagtga aggcggccac cgccgtgaca 180 gcgggcggat cccttctcgt cctctctggc ctcactttag ccggtaccgt tattgcgctc 240 accatcgcca ctccgctgct tgtgatcttt agccccgttc tggttccggc ggtcataacc 300 attttcttgc tgggtgcggg ttttctggca tccggaggct tcggcgtggc ggcgctgagt 360 gtgctgtcgt ggatttacag atatctgaca gggaaacacc cgccgggggc ggattgcctg 420 gaatcggcaa agacgaagct ggcgagctgt gcgcgagaga tgaaggatag ggcagagcag 480 ttctcgtgcc agcctgttcc gtggctcgag caccaccacc accaccactg a 531 〈210〉 6 〈211〉 193 <212〉 PRT 〈213>人工序列 <220> <223〉人工 <400〉 6
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gin His Met Asp Ser 15 10 15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Glu His Tyr
20 25 30 • 4· 151910-序列表.doc 201127957
Gly Gin Gin Gin Gin Thr Arg Ala Pro His Leu Gin Leu Gin Pro Arg 35 40 45
Ala Gin Arg Val Val Lys Ala Ala Thr Ala Val Thr Ala Gly Gly Ser 50 55 60
Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly Thr Val lie Ala Leu 65 70 75 80
Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser Pro Val Leu Val Pro 85 90 95
Ala Val lie Thr lie Phe Leu Leu Gly Ala Gly Phe Leu Ala Ser Gly 100 105 110
Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser Trp lie Tyr Arg Tyr 115 120 125
Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gin Leu Glu Ser Ala Lys 130 135 140
Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys Asp Arg Ala Glu Gin 145 150 155 160
Phe Ser Gin Gin Pro Val Pro Trp Leu lie Ser Asp Pro Asn Ser Ser 165 170 175
Ser Val Asp Lys Leu Ala Ala Ala Leu Glu His His His His His His 180 185 190
His 151910-序列表.doc 201127957 <210〉 7 <211> 176 <212> PRT <213〉人工序列 <220〉 <223〉人工 <400〉 7
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gin His Met Asp Ser 15 10 15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Cys His Tyr 20 25 30
Gly Gin Gin Gin Gin Thr Arg Ala Pro His Leu Gin Leu Gin Pro Arg 35 40 45
Ala Gin Arg Val Val Lys Ala Ala Thr Ala Val Thr Ala Gly Gly Ser 50 55 60
Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly Thr Val lie Ala Leu 65 70 75 80
Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser Pro Val Leu Val Pro 85 90 95
Ala Val lie Thr lie Phe Leu Leu Gly Ala Gly Phe Leu Ala Ser Gly 100 105 110
Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser Trp lie Tyr Arg Tyr 115 120 125
Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gin Leu Glu Ser Ala Lys 130 135 140 6-
151910-序列表.doc 201127957
Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys Asp Arg Ala Glu Gin 145 150 155 160
Phe Ser Cys Gin Pro Val Pro Trp Leu Glu His His His His His His 165 170 175 <210〉 8 <211〉 176 〈212〉 PRT <213〉人工序列 <220〉
<223〉人工 <400> 8
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gin His Met Asp Ser 15 10 15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Cys His Tyr 20 25 30
Gly Gin Gin Gin Gin Thr Arg Ala Pro His Leu Gin Leu Gin Pro Arg 35 40 45
Ala Gin Arg Val Val Lys Ala Ala Thr Ala Val Thr Ala Gly Gly Ser 50 55 60
Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly Thr Val lie Ala Leu 65 70 75 80
Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser Pro Val Leu Val Pro 85 90 95 151910·序列表.doc 201127957
Ala Val lie Thr lie Phe Leu Leu Gly Ala Gly Phe Leu Ala Ser Gly 100 105 110
Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser Trp lie Tyr Arg Tyr 115 120 125
Leu Thr Gly Lys His Pro Pro Gly Ala Asp Cys Leu Glu Ser Ala Lys 130 135 140
Thr Lys Leu Ala Ser Cys Ala Arg Glu Met Lys Asp Arg Ala Glu Gin 145 150 155 160
Phe Ser Cys Gin Pro Val Pro Trp Leu Glu His His His His His His 165 170 175 <210〉 9 <211〉 176 <212> PRT <213〉人工序列 <220> <223〉人工 <400〉 9
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gin His Met Asp Ser 1 5 10 15
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Cys His Tyr 20 25 30
Gly Gin Gin Gin Gin Thr Cys Ala Pro His Leu Gin Leu Gin Pro Arg 35 40 45
Ala Cys Arg Val Val Lys Ala Ala Thr Ala Val Thr Ala Gly Gly Ser 50 55 60 151910·序列表.d〇c 201127957
Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly Thr Val lie Ala Leu 65 70 75 80
Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser Pro Val Leu Val Pro 85 90 95
Ala Val lie Thr lie Phe Leu Leu Gly Ala Gly Phe Leu Ala Ser Gly 100 105. 110
Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser Trp lie Tyr Arg Tyr 115 120 125
Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gin Leu Glu Ser Ala Lys 130 135 140
Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys Asp Arg Ala Glu Gin 145 150 155 160
Phe Ser Cys Gin Pro Val Pro Trp Leu Glu His His His His His His 165 170 175 〈210〉 10 <211〉 176 <212> PRT <213〉人工序列 <220〉 <223〉人卫 <400〉 10
Met Lys Glu Thr Ala Ala Ala Lys Phe Glu Arg Gin His Met Asp Ser 1 5 10 15 9 151910-序列表.d〇c 201127957
Pro Asp Leu Gly Thr Leu Val Pro Arg Gly Ser Met Ala Cys His Tyr 20 25 30
Gly Gin Gin Gin Gin Thr Cys Ala Pro His Leu Gin Leu Gin Pro Arg 35 40 45
Ala Cys Arg Val Val Lys Ala Ala Thr Ala Val Thr Ala Gly Gly Ser 50 55 60
Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly Thr Val lie Ala Leu 65 70 75 80
Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser Pro Val Leu Val Pro 85 90 95
Ala Val lie Thr lie Phe Leu Leu Gly Ala Gly Phe Leu Ala Ser Gly 100 105 110
Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser Trp lie Tyr Arg Tyr 115 120 125
Leu Thr Gly Lys His Pro Pro Gly Ala Asp Cys Leu Glu Ser Ala Lys 130 135 140
Thr Lys Leu Ala Ser Cys Ala Arg Glu Met Lys Asp Arg Ala Glu Gin 145 150 155 160
Phe Ser Cys Gin Pro Val Pro Trp Leu Glu His His His His His His 165 170 175 <210〉 11 〈211〉 766 <212〉 DNA 〈213〉人工序列 -10- 151910-序列表.doc 60 60
201127957 <220〉 〈223> 人工 <400〉 11 ttgctccctt aaaaaaaacc atggctgagc attatggtca acaacagcag accagggcgc ctcacctgca gctgcagccg cgcgcccagc gggtagtgaa ggcggccacc gccgtgacag taaatttctg tgttccttat tctctcaaaa tcttcgattt tgttttcgtt cgatcccaat ttcgtatatg ttctttggtt tagattctgt taatcttaga tcgaagacga ttttctgggt ttgatcgtta gatatcatct taattctcga ttagggtttc atagatatca tccgatttgt tcaaataatt tgagttttgt cgaataatta ctcttcgatt tgtgatttct atctagatct ggtgttagtt tctagtttgt gcgatcgaat ttgtcgatta atctgagttt ttctgattaa caggccggcg gctcgcttct cgtcctctct ggcctcactt tagccggaac tgttattgcg ctcaccatcg ccactccgct gcttgtgatc tttagccccg ttctggtgcc ggcggtcata accattttct tgctgggtgc gggttttctg gcatccggag gcttcggcgt ggcggcgctg agtgtgctgt cgtggattta cagatatctg acagggaaac acccgccggg ggcggatcag ctggaatcgg caaagacgaa gctggcgagc aaggcgcgag agatgaagga tagggcagag cagttctcgc agcagcctgt tgcggggtct caaacttctt aatgaa <210〉 12 <211〉 766 <212〉 DNA <213〉人工序列 <220〉 〈223>人工 <400> 12 ttgctccctt aaaaaaaacc atggcttgtc attatggtca acaacagcag accagggcgc ctcacctgca gctgcagccg cgcgcccagc gggtagtgaa ggcggccacc gccgtgacag 151910·序列表.doc 120 180 240 300 360 420 480 540 600 660 720 766 60 -11 - 120 201127957 taaatttctg tgttccttat tctctcaasia tcttcgattt tgttttcgtt cgatcccaat 180 ttcgtatatg ttctttggtt tagattctgt taatcttaga tcgaagacga ttttctgggt 240 ttgatcgtta gatatcatct taattctcga ttagggtttc atagatatca tccgatttgt 300 tcaaataatt tgagttttgt cgaataatta ctcttcgatt tgtgatttct atctagatct 360 ggtgttagtt tctagtttgt gcgatcgaat ttgtcgatta atctgagttt ttctgattaa 420 caggccggcg gctcgcttct cgtcctctct ggcctcactt tagccggaac tgttattgcg 480 ctcaccatcg ccactccgct gcttgtgatc tttagccccg ttctggtgcc ggcggtcata 540 accattttct tgctgggtgc gggttttctg gcatccggag gcttcggcgt ggcggcgctg 600 agtgtgctgt cgtggattta cagatatctg acagggaaac acccgccggg ggcggatcag 660 ctggaatcgg caaagacgaa gctggcgagc aaggcgcgag agatgaagga tagggcagag 720 cagttctcgt gtcagcctgt tgcggggtct caaacttctt aatgaa 766 <210> 13 <211> 766 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400〉 13 ttgctccctt aaaaaaaacc atggcttgtc attatggtca acaacagcag accagggcgc 60 ctcacctgca gctgcagccg cgcgcccagc gggtagtgaa ggcggccacc gccgtgacag 120 taaatttctg tgttccttat tctctcaaaa tcttcgattt tgttttcgtt cgatcccaat 180 ttcgtatatg ttctttggtt tagattctgt taatcttaga tcgaagacga ttttctgggt 240 ttgatcgtta gatatcatct taattctcga ttagggtttc atagatatca tccgatttgt 300 tcaaataatt tgagttttgt cgaataatta ctcttcgatt tgtgatttct atctagatct 360 •12·
151910-序列表.doc 201127957 ggtgttagtt tctagtttgt gcgatcgaat ttgtcgatta atctgagttt ttctgattaa 420 caggccggcg gctcgcttct cgtcctctct ggcctcactt tagccggaac tgttattgcg 480 ctcaccatcg ccactccgct gcttgtgatc tttagccccg ttctggtgcc ggcggtcata 540 accattttct tgctgggtgc gggttttctg gcatccggag gcttcggcgt ggcggcgctg 600 agtgtgctgt cgtggattta cagatatctg acagggaaac acccgccggg ggcggattgt 660 ctggaatcgg caaagacgaa gctggcgagc tgtgcgcgag agatgaagga tagggcagag 720 cagttctcgt gtcagcctgt tgcggggtct caaacttctt aatgaa 766
<211〉 766 <212〉 DNA 〈213〉人工序列 <220〉 <223〉人工 <400> 14 ttgctccctt aaaaaaaacc atggcttgtc attatggtca acaacagcag acctgtgcgc 60 ctcacctgca gctgcagccg cgcgcctgtc gggtagtgaa ggcggccacc gccgtgacag 120 taaatttctg tgttccttat tctctcaaaa tcttcgattt tgttttcgtt cgatcccaat 180
ttcgtatatg ttctttggtt tagattctgt taatcttaga tcgaagacga ttttctgggt 240 ttgatcgtta gatatcatct taattctcga ttagggtttc atagatatca tccgatttgt 300 tcaaatsiatt tgagttttgt cgaataatta ctcttcgatt tgtgatttct atctagatct 360 ggtgttagtt tctagtttgt gcgatcgaat ttgtcgatta atctgagttt ttctgattaa 420 caggccggcg .gctcgcttct cgtcctctct ggcctcactt tagccggaac tgttattgcg 480 ctcaccatcg ccactccgct gcttgtgatc tttagccccg ttctggtgcc ggcggtcata 540 accattttct tgctgggtgc gggttttctg gcatccggag gcttcggcgt ggcggcgctg 600 -13- 151910-序列表.doc 201127957 agtgtgctgt cgtggattta cagatatctg acagggaaac acccgccggg ggcggatcag 660 ctggaatcgg caaagacgaa gctggcgagc aaggcgcgag agatgaagga tagggcagag 720 cagttctcgt gtcagcctgt tgcggggtct caaacttctt aatgaa 766 <210〉 15 〈211〉 766 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400> 15 ttgctccctt aaaaaaaacc atggcttgtc attatggtca acaacagcag acctgtgcgc 60 ctcacctgca gctgcagccg cgcgcctgtc gggtagtgaa ggcggccacc gccgtgacag 120 taaatttctg tgttccttat tctctcaaaa tcttcgattt tgttttcgtt cgatcccaat 180 ttcgtatatg ttctttggtt tagattctgt taatcttaga tcgaagacga ttttctgggt 240 ttgatcgtta gatatcatct taattctcga ttagggtttc atagatatca tccgatttgt 300 tcaaataatt tgagttttgt cgaataatta ctcttcgatt tgtgatttct atctagatct 360 ggtgttagtt tctagtttgt gcgatcgaat ttgtcgatta atctgagttt ttctgattaa 420 caggccggcg gctcgcttct cgtcctctct ggcctcactt tagccggaac tgttattgcg 480 ctcaccatcg ccactccgct gcttgtgatc tttagccccg ttctggtgcc ggcggtcata 540 accattttct tgctgggtgc gggttttctg gcatccggag gcttcggcgt ggcggcgctg 600 agtgtgctgt cgtggattta cagatatctg acagggaaac acccgccggg ggcggattgt 660 ctggaatcgg caaagacgaa gctggcgagc tgtgcgcgag agatgaagga tagggcagag 720 cagttctcgt gtcagcctgt tgcggggtct caaacttctt aatgaa 766 •14-
151910-序列表.doc 201127957 <210> 16 <211> 145 <212> PRT <213〉人工序列 <220〉 <223〉人工 <400〉 16
Met Ala Glu His Tyr Gly Gin Gin Gin Gin Thr Arg Ala Pro His Leu 15 10 15
Gin Leu Gin Pro Arg Ala Gin Arg Val Val Lys Ala Ala Thr Ala Val 20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly 35 40 45
Thr Val lie Ala Leu Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser 50 55 60
Pro Val Leu Val Pro Ala Val He Thr He Phe Leu Leu Gly Ala Gly 65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser 85 90 95
Trp lie Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gin 100 105 110
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys 115 120 125
Asp Arg Ala Glu Gin Phe Ser Gin Gin Pro Val Ala Gly Ser Gin Thr 130 135 140 15· 151910-序列表.doc 201127957
Ser 145 <210> 17 <211〉 145 <212〉 PRT 〈213>人工序列 <220〉 <223〉人工 <400〉 17
Met Ala Cys His Tyr Gly Gin Gin Gin Gin Thr Arg Ala Pro His Leu 15 10 15 9
Gin Leu Gin Pro Arg Ala Gin Arg Val Val Lys Ala Ala Thr Ala Val 20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly 35 40 45
Thr Val lie Ala Leu Thr He Ala Thr Pro Leu Leu Val lie Phe Ser 50 55 60
Pro Val Leu Val Pro Ala Val He Thr lie Phe Leu Leu Gly Ala Gly 65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser 85 90 95
Trp lie Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gin 100 105 110 -16 - 151910·序列表 doc 201127957
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys 115 120 125
Asp Arg Ala Glu Gin Phe Ser Cys Gin Pro Val Ala Gly Ser Gin Thr 130 135 140
Ser 145
<210〉 18 〈211〉 145 <212〉 PRT <213〉人工序列 <220〉 <223〉 人工 <400〉 18
Met Ala Cys His Tyr Gly Gin Gin Gin Gin Thr Arg Ala Pro His Leu 15 10 15
Gin Leu Gin Pro Arg Ala Gin Arg Val Val Lys Ala Ala Thr Ala Val 20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly 35 40 45
Thr Val lie Ala Leu Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser 50 55 60
Pro Val Leu Val Pro Ala Val He Thr He Phe Leu Leu Gly Ala Gly 65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser 85 90 95 -17 151910-序列表.doc 201127957
Trp lie Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Cys 100 105 110
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Cys Ala Arg Glu Met Lys 115 120 125
Asp Arg Ala Glu Gin Phe Ser Cys Gin Pro Val Ala Gly Ser Gin Thr 130 135 140
Ser 145 <210〉 19 <211〉 145 <212> PRT <213〉人工序列 <220〉 〈223> 人工 <400〉 19
Met Ala Cys His Tyr Gly Gin Gin Gin Gin Thr Cys Ala Pro His Leu 15 10 15
Gin Leu Gin Pro Arg Ala Cys Arg Val Val Lys Ala Ala Thr Ala Val 20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly 35 40 45
Thr Val lie Ala Leu Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser 50 55 60 • 18 · 151910-序列表.doc 201127957
Pro Val Leu Val Pro Ala Val He Thr lie Phe Leu Leu Gly Ala Gly 65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser 85 90 95
Trp He Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Gin 100 105 110
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Lys Ala Arg Glu Met Lys 115 120 125
Asp Arg Ala Glu Gin Phe Ser Cys Gin Pro Val Ala Gly Ser Gin Thr 130 135 140
Ser 145 <210> 20 <211〉 145 〈212〉 PRT <213〉人工序列
<220〉 〈223> 人工 <400〉 20
Met Ala Cys His Tyr Gly Gin Gin Gin Gin Thr Cys Ala Pro His Leu 15 10 15
Gin Leu Gin Pro Arg Ala Cys Arg Val Val Lys Ala Ala Thr Ala Val 20 25 30
Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr Leu Ala Gly 35 40 45 -19· 151910-序列表.doc 201127957
Thr Val lie Ala Leu Thr lie Ala Thr Pro Leu Leu Val lie Phe Ser 50 55 60
Pro Val Leu Val Pro Ala Val lie Thr lie Phe Leu Leu Gly Ala Gly 65 70 75 80
Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser Val Leu Ser 85 90 95
Trp lie Tyr Arg Tyr Leu Thr Gly Lys His Pro Pro Gly Ala Asp Cys 100 105 110
Leu Glu Ser Ala Lys Thr Lys Leu Ala Ser Cys Ala Arg Glu Met Lys 115 120 125
Asp Arg Ala Glu Gin Phe Ser Cys Gin Pro Val Ala Gly Ser Gin Thr 130 135 140
Ser 145 <210〉 21 <211> 810 〈212〉 DNA 〈213>人工序列 <220〉 <223〉人工 <400> 21 ggtaccgcgg ccgcttgctc ccttaaaaaa aaccatggca tgtcattacg gatgtggaca acagcaacag acttgtgcac ctcatctttg tcagcttcaa cctagagcat gtagagttgt gaaggctgct actgctgtta ctgtaaattt ctgtgttcct tattctctca aaatcttcga 20· 151910·序列表.doc 201127957
ttttgttttc gttcgatccc aatttcgtat atgttctttg gtttagattc tgttaatctt agatcgaaga cgattttctg ggtttgatcg ttagatatca tcttaattct cgattagggt ttcatagata tcatccgatt tgttcaaata atttgagttt tgtcgaataa ttactcttcg atttgtgatt tctatctaga tctggtgtta gtttctagtt tgtgcgatcg aatttgtcga ttaatctgag tttttctgat taacaggctg gaggatctct tcttgttctc tctggactta ctctcgctgg aactgttatc gctctcacta tcgctacacc tcttctcgtt atcttctctc ctgttctcgt tcctgctgtg atcactatct tccttctcgg agctggattt cttgcttctg gtggatttgg agttgctgct ctctctgttc tctcttggat ctacagatac ctcactggat gtaaacatcc tccaggtgct gattgtcttg agtctgcttg taagactaag ctcgcttctt gtgctagaga gatgaaggat tgtagagcag agcaattctc ttgtcagcct gttgctggat ctcagacttc ttaatgaaca tatggagctc 〈210〉 22 <211> 831 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400> 22 ggtaccgcgg ccgcttgctc ccttaaaaaa aaccatggca tgtcattacg gaatggcatg tcattacgga tgtggacaac agcaacagac ttgtgcacct catctttgtc agcttcaacc tagagcatgt agagttgtga aggctgctac tgctgttact gtaaatttct gtgttcctta ttctctcaaa atcttcgatt ttgttttcgt tcgatcccaa tttcgtatat gttctttggt ttagattctg ttaatcttag atcgaagacg attttctggg tttgatcgtt agatatcatc ttaattctcg attagggttt catagatatc atccgatttg ttcaaataat ttgagttttg -21 · 151910-序列表.doc 201127957 tcgaataatt actcttcgat ttgtgatttc tatctagatc tggtgttagt ttctagtttg 420 tgcgatcgaa tttgtcgatt aatctgagtt tttctgatta acaggctgga ggatctcttc 480 ttgttctctc tggacttact ctcgctggaa ctgttatcgc tctcactatc gctacacctc 540 ttctcgttat cttctctcct gttctcgttc ctgctgtgat cactatcttc cttctcggag 600 ctggatttct tgcttctggt ggatttggag ttgctgctct ctctgttctc tcttggatct 660 acagatacct cactggatgt aaacatcctc caggtgctga ttgtcttgag tctgcttgta 720 agactaagct cgcttcttgt gctagagaga tgaaggattg tagagcagag caattctctt 780 gtcagcctgt tgctggatgt tctcagactt cttaatgaac atatggagct c 831 <210> 23 <211> 151 <212> PRT <213〉人工序列 <220> <223〉人工 <400> 23
Met Ala Cys His Tyr Gly Cys Gly Gin Gin Gin Gin Thr Cys Ala Pro 15 10 15
His Leu Cys Gin Leu Gin Pro Arg Ala Cys Arg Val Val Lys Ala Ala 20 25 30
Thr Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Gly Leu Thr 35 40 45
Leu Ala Gly Thr Val He Ala Leu Thr He Ala Thr Pro Leu Leu Val 50 55 60 • 22-
151910-序列表.doc 201127957 lie Phe Ser Pro Val Leu Val Pro Ala Val lie Thr lie Phe Leu Leu 65 70 75 80
Gly Ala Gly Phe Leu Ala Ser Gly Gly Phe Gly Val Ala Ala Leu Ser 85 90 95
Val Leu Ser Trp He Tyr Arg Tyr Leu Thr Gly Cys Lys His Pro Pro 100 105 110
Gly Ala Asp Cys Leu Glu Ser Ala Cys Lys Thr Lys Leu Ala Ser Cys 115 120 125
Ala Arg Glu Met Lys Asp Cys Arg Ala Glu Gin Phe Ser Cys Gin Pro 130 135 140
Val Ala Gly Ser Gin Thr Ser 145 150 <210〉 24 〈211〉 158 <212〉 PRT <213〉人工序列
<223〉人工 <400〉 24
Met Ala Cys His Tyr Gly Met Ala Cys His Tyr Gly Cys Gly Gin Gin 1 5 10 15
Gin Gin Thr Cys Ala Pro His Leu Cys Gin Leu Gin Pro Arg Ala Cys 20 25 30
Arg Val Val Lys Ala Ala Thr Ala Val Thr Ala Gly Gly Ser Leu Leu 35 40 45 •23· 151910·序列表.doc 201127957
Val Leu Ser Gly Leu Thr Leu Ala Gly Thr Val He Ala Leu Thr He 50 55 60
Ala Thr Pro Leu Leu Val lie Phe Ser Pro Val Leu Val Pro Ala Val 65 70 75 80
He Thr He Phe Leu Leu Gly Ala Gly Phe Leu Ala Ser Gly Gly Phe 85 90 95
Gly Val Ala Ala Leu Ser Val Leu Ser Trp lie Tyr Arg Tyr Leu Thr 100 105 110
Gly Cys Lys His Pro Pro Gly Ala Asp Cys Leu Glu Ser Ala Cys Lys 115 120 125
Thr Lys Leu Ala Ser Cys Ala Arg Glu Met Lys Asp Cys Arg Ala Glu 130 135 140
Gin Phe Ser Cys Gin Pro Val Ala Gly Cys Ser Gin Thr Ser 145 150 155 <210〉 25 <211> 4104 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400> 25 ggtaccacaa gtttgtacaa aaaagcaggc tgcggccgca aaattttcat atggtcctgc tttaatgaga tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc 24- 151910·序列表.doc 240 240
201127957 taatgaatat atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtac cctactactt atatgtacaa tattaaaatg aaaaceiatat attgtgctga ataggtttat agcgacatct atgatagagc gccacaataa caaacaattg cgttttatta ttacaaatcc aattttaaaa aaagcggcag aaccggtcaa acctaaaaga ctgaitacat aaatcttatt caaatttcaa aaggccccag gggctagtat ctacgacaca ccgagcggcg giactaataac gttcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggacctgc aggcatgcaa gctagcttac tagtgatgca tattctatag tgtcacctaa atcttcgacg aattaattcc aatcccacaa aaatctgagc ttaacagcac agttgctcct ctcagagcag aatcgggtat tceiacaccct catatcaact actacgttgt gtataacggt ccacatgccg gtatatacga tgactggggt tgtacaaagg cggcaacaaa cggcgttccc ggagttgcac acaagaaatt tgccactatt acagaggcaa gagcagcagc tgacgcgtac acaacaagtc agcaaacaga caggttgaac ttcatcccca aaggagaagc tcaactcaag cccaagagct ttgcteiaggc cctaacaagc ccaccaaagc aaaaagccca ctggctcacg ctaggaacca aaaggcccag cagtgatcca gccccaaaag agatctcctt tgccccggag attacaatgg acgatttcct ctatctttac gatctaggaa ggaagttcga aggtgaaggt gacgacacta tgttcaccac tgataatgag aaggttagcc tcttcaattt cagaaagaat gctgacccac agatggttag agaggcctac gcagcaggtc tcatcaagac gatctacccg agtsiacaatc tccaggagat caaatacctt cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta attgcatcaa 151910-序列表.doc -25- 300 360 420 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 201127957 gaacacagag aaagacatat ttctcaagat cagaagtact attccagtat ggacgattca 1560 aggcttgctt cataaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc 1620 tactgaatct aaggccatgc atggagtcta agattcaaat cgaggatcta acagaactcg 1680 ccgtgaagac tggcgaacag ttcatacaga gtcttttacg actcaatgac aagaagaaaa 1740 tcttcgtcaa catggtggag cacgacactc tggtctactc caaaaatgtc aaagatacag 1800 tctcagaaga ccaaagggct attgagactt ttcaacaaag gataatttcg ggaaacctcc 1860 tcggattcca ttgcccagct atctgtcact tcatcgaaag gacagtagaa aaggaaggtg 1920 gctcctacaa atgccatcat tgcgataaag gaaaggctat cattcaagat ctctctgccg 1980 acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc 2040 caaccacgtc ttcaaagcaa gtggattgat gtgacatctc cactgacgta agggatgacg 2100 cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg 2160 agaggacacg ggatccttgc tccgttaaaa aaaaccatgg ctatcctcga ttctgctggt 2220 gttactactg tgactgagaa tggtggtgga gagttcgttg atctcgatag actcagaaga 2280 agaaagtcta gatctgtaaa tttctgtgtt ccttattctc tcaaaatctt cgattttgtt 2340 ttcgttcgat cccaatttcg tatatgttct ttggtttaga ttctgttaat cttagatcga 2400 agacgatttt ctgggtttga tcgttagata tcatcttaat tctcgattag ggtttcatag 2460 atatcatccg atttgttcaa ataatttgag ttttgtcgaa teiattactct tcgatttgtg 2520 atttctatct agatctggtg ttagtttcta gtttgtgcga tcgaatttgt cgattaatct 2580 gagtttttct gattaacagg attcttctaa cggacttctc ctctctggat ctgataacaa 2640 ctctccttct gatgatgttg gtgctcctgc tgatgtgaga gatagaatcg attctgtggt 2700 gaacgatgat gctcaaggta ctgctaacct cgctggtgat aataacggtg gaggtgataa 2760 caatggtgga ggaagaggtg gaggtgaagg tagaggaaac gctgatgcta ctttcactta 2820 • 26-
151910·序列表.doc
201127957 cagaccatct gtgcctgctc atagaagagc tagagagtct cctctctctt ctgatgctat cttcaagcag tctcacgctg gacttttcaa cctctgtgtg gtggttctta tcgctgtgaa ctctagactc atcatcgaga acctcatgaa gtacggatgg ctcatcagaa ctgatttctg gttctcttct agatctctca gagattggcc tcttttcatg tgctgcatct cactctcaat cttccctctc gctgctttta ctgttgagaa gctcgtgctc cagaagtata tcgctgaacc tgtggtgatc ttcctccaca tcatcatcac tatgactgag gttctctacc ctgtttacgt gactctcaga tgcgattctg ctttcctctc tggtgttact cttatgctcc tcacttgcat tgtgtggctt aagctcgtgt cttacgctca cacttcttac gatatcagat ctctcgctaa cgctgctgat aaggctaacc ctgaagtgtc ttactacgtg tctctcaagt ctctcgctta cttcatggtt gctcctacac tttgttacca gccatcttac cctagatctg cttgcattag aaagggatgg gtggcaagac aattcgctaa gttggtgatc ttcactggat tcatgggatt catcatcgag cagtacatca accctattgt gagaaactct aagcaccctc tcaagggtga tcttctctac gctatcgaga gagttcttaa gctctctgtg cctaaccttt atgtgtggct ctgcatgttc tactgtttct tccacctctg gcttaacatc cttgctgagt tgctttgctt cggagataga gagttctaca aggattggtg gaacgctaag tctgttggag eittattggag aatgtggaac atgcctgtgc ataagtggat ggtgcgtcac atctacttcc cttgcctcag atctaagatc cctaagactc tcgctatcat tatcgctttc ctcgtgtctg ctgttttcca tgagttgtgt atcgctgttc cttgcagact tttcaagctt tgggctttcc tcggaatcat gttccaggtt ccactcgtgt tcatcactaa ctacctccaa gagagattcg gatctactgt tggaaacatg attttctggt tcattttctg catcttcgga cagcctatgt gcgttctcct ctactaccac gatctcatga acagaaaggg atctatgtct taatgaagga tccacccagc tttcttgtac aaagtggtga gctc 151910-序列表.doc -27- 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4104 201127957 <210> 26 <211〉 18784 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400〉 26 tcgacatcgt caacgttcac ttctaaagaa atagcgccac tcagcttcct cagcggcttt 60 atccagcgat ttcctattat gtcggcatag ttctcaagat cgacagcctg tcacggttaa 120 gcgagaaatg aataagaagg ctgataattc ggatctctgc gaggagatga tatttgatca 180 caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 240 gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcgggtaa catgagcaaa 300 gtctgccgcc ttacaacggc tctcccgctg acgccgtccc ggactgatgg gctgcctgta 360 tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg 420 atatattgtg gtgtaaacaa attgacgctt agacaactta ataacacatt gcggacgttt 480 ttaatgtact gaattcgccg ctcggtgtgt cgtagatact agcccctggg gcacttttga 540 aatttgaata agatttatgt aatcagtctt ttaggtttga ccggttctgc cgcttttttt 600 aaaattggat ttgtaataat aaaacgcaat tgtttgttat tgtggcgctc tatcatagat 660 gtcgctataa acctattcag cacaatatat tgttttcatt ttaatattgt acatataagt 720 agtagggtac aatcagtaaa ttgaacggag aatattattc ataaaaatac gatagtaacg 780 ggtgatatat tcattagaat gaaccgaaac cggcggtaag gatctgagct acacatgctc 840 aggtttttta caacgtgcac aacagaattg aaagcaaata tcatgcgatc ataggcgtct 900 cgcatatctc attaaacaag tgaagatttg attcaaactc cattgagagc cctgactatg 960 cattcggttt gacccttcca ggttgagaga cgatagcccc ctaccttaat taaggggccc 1020 •28-
151910·序列表.doc 1080 1080
201127957 cccctcgagg tcgacggtat cgataagctt gatatcgaat tcctgcagcc agggggatcc cccgggtcat cagatctcgg tgacgggcag gaccggacgg ggcggtaccg gcaggctgaa gtccagctgc cagaaaccca cgtcatgcca gttcccgtgc ttgaagccgg ccgcccgcag catgccgcgg ggggcatatc cgagcgcctc gtgcatgcgc acgctcgggt cgttgggcag cccgatgaca gcgaccacgc tcttgeiagcc ctgtgcctcc agggacttca gcaggtgggt gtagagcgtg gagcccagtc ccgtccgctg gtggcggggg gagacgtaca cggtcgactc ggccgtccag tcgtaggcgt tgcgtgcctt ccaggggccc gcgtaggcga tgccggcgac ctcgccgtcc acctcggcga cgagccaggg atagcgctcc cgcagacgga cgaggtcgtc cgtccactcc tgcggttcct gcggctcggt acggaagttg accgtgcttg tctcgatgta gtggttgacg atggtgcaga ccgccggcat gtccgcctcg gtggcacggc ggatgtcggc cgggcgtcgt tctgggctca tggtagatcc cctcgagaga gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag tggagatatc acatcaatcc acttgctttg aagacgtggt tggaacgtct tctttttcca cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 151910-序列表.doc •29- 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 201127957 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg 2400 atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgctgatagt gaccttaggc 2460 gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa 2520 acccattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 2580 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 2640 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 2700 attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgctc ccggccgcca 2760 tggccgcggg atatcactag tgcggccgct cgacgaatta attccaatcc cacaaaaatc 2820 tgagcttaac agcacagttg ctcctctcag agcagaatcg ggtattcaac accctcatat 2880 caactactac gttgtgtata acggtccaca tgccggtata tacgatgact ggggttgtac 2940 aaaggcggca acaaacggcg ttcccggagt tgcacacaag aaatttgcca ctattacaga 3000 ggcaagagca gcagctgacg cgtacacaac aagtcagcaa acagacaggt tgaacttcat 3060 ccccaaagga gaagctcaac tcaagcccaa gagctttgct aaggcccteia caagcccacc 3120 aaagcaaaaa gcccactggc tcacgctagg aaccaaaagg cccagcagtg atccagcccc 3180 aaaagagatc tcctttgccc cggagattac aatggacgat ttcctctatc tttacgatct 3240 aggaaggaag ttcgaaggtg aaggtgacga cactatgttc accactgata atgagaaggt 3300 tagcctcttc aatttcagaa agaatgctga cccacagatg gttagagagg cctacgcagc 3360 aggtctcatc aagacgatct acccgagtaa caatctccag gagatcaaat accttcccaa 3420 gaaggttaaa gatgcagtca aaagattcag gactaattgc atcaagaaca cagagaaaga 3480 catatttctc aagatcagaa gtactattcc agtatggacg attcaaggct tgcttcataa 3540 accaaggcaa gtaatagaga ttggagtctc taaaaaggta gttcctactg aatctaaggc 3600 catgcatgga gtctaagatt caaatcgagg atctaacaga actcgccgtg aagactggcg 3660 -30- 151910·序列表.doc
201127957 aacagttcat acagagtctt ttacgactca atgacaagaa gaaaatcttc gtcaacatgg tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca gaagaccaaa gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga ttccattgcc cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgac atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca tttggagagg acacgctcga ggaattcggt accccatcac aagtttgtac aaaaaagcag gctgcggccg cttgctccct taaaaaaaac catggcagag cattacggac aacagcaaca gactagagca cctcatcttc agcttcaacc tagagcacag agagttgtga aggctgctac tgctgttact gtaaatttct gtgttcctta ttctctcaaa atcttcgatt ttgttttcgt tcgatcccaa tttcgtatat gttctttggt ttagattctg ttaatcttag atcgaagacg attttctggg tttgatcgtt agatatcatc ttaattctcg attagggttt catagatatc atccgatttg ttcaaataat ttgagttttg tcgaataatt actcttcgat ttgtgatttc tatctagatc tggtgttagt ttctagtttg tgcgatcgaa tttgtcgatt aatctgagtt tttctgatta acaggctgga ggatctcttc ttgttctctc tggacttact ctcgctggaa ctgttatcgc tctcactatc gctacacctc ttctcgttat cttctctcct gttctcgttc ctgctgtgat cactatcttc cttctcggag ctggatttct tgcttctggt ggatttggag ttgctgctct ctctgttctc tcttggatct acagatacct cactggaaaa catcctccag gtgctgatca acttgagtct gctaagacta agctcgcttc taaggctaga gagatgaagg atagagcaga gcaattctct caacagcctg ttgctggatc tcagacttct taatgaacat atggtcctgc tttaatgaga 151910-序列表.doc •31 - 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 201127957 tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 5040 aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 5100 atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtac 5160 cctactactt atatgtacaa tattaaaatg aaaacaatat attgtgctga ataggtttat 5220 agcgacatct atgatagagc gccacaataa caaacaattg cgttttatta ttacaaatcc 5280 aattttaaaa aaagcggcag aaccggtcaa acctaaaaga ctgattacat aaatcttatt 5340 caaatttcaa aaggccccag gggctagtat ctacgacaca ccgagcggcg aactaataac 5400 gttcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc cttgaagttg 5460 agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt ccagcacggc 5520 ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt gtatgtgggc 5580 cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc gggtccaggg 5640 cgaattttgc gacaacatgt cgaggctcag caggacctgc aggcatgcaa gctagcttac 5700 tagtgatgca tattctatag tgtcacctaa atcttcgacg aattaattcc aatcccacaa 5760 aaatctgagc ttaacagcac agttgctcct ctcagagcag aatcgggtat tcaacaccct 5820 catatcaact actacgttgt gtateiacggt ccacatgccg gtatatacga tgactggggt 5880 tgtacaaagg cggcaacaaa cggcgttccc ggagttgcac acaagaaatt tgccactatt 5940 acagaggcaa gagcagcagc tgacgcgtac acaacaagtc agcaaacaga caggttgaac 6000 ttcatcccca aaggagaagc tcaactcaag cccaagagct ttgctaaggc cctaacaagc 6060 ccaccaaagc aaaaagccca ctggctcacg ctaggaacca aaaggcccag cagtgatcca 6120 gccccaaaag agatctcctt tgccccggag attacaatgg acgatttcct ctatctttac 6180 gatctaggaa ggaagttcga aggtgaaggt gacgacacta tgttcaccac tgataatgag 6240 aaggttagcc tcttcaattt cagaaagaat gctgacccac agatggttag agaggcctac 6300 •32-
151910·序列表.doc
201127957 gcagcaggtc tcatcaagac gatctacccg agtaacaatc tccaggagat caaatacctt cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta attgcatcaa gaacacagag aaagacatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt cataaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc tactgaatct aaggccatgc atggagtcta agattcaaat cgaggatcta acagaactcg ccgtgaagac tggcgaacag ttcatacaga gtcttttacg actcaatgac aagaagaaaa tcttcgtcaa catggtggag cacgacactc tggtctactc caaaaatgtc aeiagatacag tctcagaaga ccaaagggct attgagactt ttcaacaaag gataatttcg ggaaacctcc tcggattcca ttgcccagct atctgtcact tcatcgaaag gacagtagaa aaggaaggtg gctcctacaa atgccatcat tgcgataaag gaaaggctat cattcaagat ctctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgacatctc cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg agaggacacg ggatccttgc tccgttaaaa aaaaccatgg ctatcctcga ttctgctggt gttactactg tgactgagaa tggtggtgga gagttcgttg atctcgatag actcagaaga agaaagtcta gatctgtaaa tttctgtgtt ccttattctc tcaaaatctt cgattttgtt ttcgttcgat cccaatttcg tatatgttct ttggtttaga ttctgttaat cttagatcga agacgatttt ctgggtttga tcgttagata tcatcttaat tctcgattag ggtttcatag atatcatccg atttgttcaa ataatttgag ttttgtcgaa taattactct tcgatttgtg atttctatct agatctggtg ttagtttcta gtttgtgcga tcgaatttgt cgattaatct gagtttttct gattaacagg attcttctaa cggacttctc ctctctggat ctgataacaa ctctccttct gatgatgttg gtgctcctgc tgatgtgaga gatagaatcg attctgtggt gaacgatgat 151910·序列表.doc •33- 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 201127957 gctcaaggta ctgctaacct cgctggtgat eiataacggtg gaggtgataa caatggtgga 7680 ggaagaggtg gaggtgaagg tagaggaaac gctgatgcta ctttcactta cagaccatct 7740 gtgcctgctc atagaagagc tagagagtct cctctctctt ctgatgctat cttcaagcag 7800 tctcacgctg gacttttcaa cctctgtgtg gtggttctta tcgctgtgaa ctctagactc 7860 atcatcgaga acctcatgaa gtacggatgg ctcatcagaa ctgatttctg gttctcttct 7920 agatctctca gagattggcc tcttttcatg tgctgcatct cactctcaat cttccctctc 7980 gctgctttta ctgttgaggia gctcgtgctc cagaagtata tcgctgaacc tgtggtgatc 8040 ttcctccaca tcatcatcac tatgactgag gttctctacc ctgtttacgt gactctcaga 8100 tgcgattctg ctttcctctc tggtgttact cttatgctcc tcacttgcat tgtgtggctt 8160 aagctcgtgt cttacgctca cacttcttac gatatcagat ctctcgctaa cgctgctgat 8220 aaggctaacc ctgaagtgtc ttactacgtg tctctcaagt ctctcgctta cttcatggtt 8280 gctcctacac tttgttacca gccatcttac cctagatctg cttgcattag aaagggatgg 8340 gtggcaagac aattcgctaa gttggtgatc ttcactggat tcatgggatt catcatcgag 8400 cagtacatca accctattgt gagaaactct aagcaccctc tcaagggtga tcttctctac 8460 gctatcgaga gagttcttaa gctctctgtg cctaaccttt atgtgtggct ctgcatgttc 8520 tactgtttct tccacctctg gcttaacatc cttgctgagt tgctttgctt cggagataga 8580 gagttctaca aggattggtg gaacgctaag tctgttggag attattggag aatgtggaac 8640 atgcctgtgc ataagtggat ggtgcgtcac atctacttcc cttgcctcag atctaagatc 8700 cctaagactc tcgctatcat tatcgctttc ctcgtgtctg ctgttttcca tgagttgtgt 8760 atcgctgttc cttgcagact tttcaagctt tgggctttcc tcggaatcat gttccaggtt 8820 ccactcgtgt tcatcactaa ctacctccaa gagagattcg gatctactgt tggaaacatg 8880 attttctggt tcattttctg catcttcgga cagcctatgt gcgttctcct ctactaccac 8940 •34·
151910·序列表.doc
201127957 gatctcatga acagaaaggg atctatgtct taatgaagga tccacccagc tttcttgtac aaagtggtga tgggttcgaa atcgataagc ttggatcctc tagagtcctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt tcggttcatt cteiatgaata tatcacccgt tactatcgta tttttatgaa taatattctc cgttcaattt actgattgta ccctacvtact tatatgtaca atattaaaat gaaaacaata tattgtgctg aataggttta tagcgacatc tatgatagag cgccacaata acaaaceiatt gcgttttatt attacaaatc caattttaaa aaaagcggca gaaccggtca aacctaaaag actgattaca taaatcttat tcaaatttca aaaggcccca ggggctagta tctacgacac accgagcggc geiactaataa cgttcactga agggaactcc ggttccccgc cggcgcgcat gggtgagatt ccttgaagtt gagtattggc cgtccgctct accgaaagtt acgggcacca ttcaacccgg tccagcacgg cggccgggta accgacttgc tgccccgaga attatgcagc atttttttgg tgtatgtggg ccccaaatga agtgcaggtc aaaccttgac agtgacgaca aatcgttggg cgggtccagg gcgaattttg cgacaacatg tcgaggctca gcaggacctg caggcatgca agctagctta ctagtgatgc atattctata gtgtcaccta aatctgcggc cgcctgcagg tcgatatggg agagctccca acgcgttgga tgcatagctt gagtattcta tagtgtcacc taaatagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggg ctgagtggct ccttcaacgt tgcggttctg tcagttccaa acgtaaaacg gcttgtcccg cgtcatcggc gggggtcata acgtgactcc cttaattctc cgctcatgat cagattgtcg tttcccgcct 151910·序列表.doc -35- 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 201127957 tcagtttaaa ctatcagtgt ttgacaggat atattggcgg gtaaacctaa gagaaaagag 10320 cgtttattag aataatcgga tatttaaaag ggcgtgaaaa ggtttatccg ttcgtccatt 10380 tgtatgtgca tgccaaccac agggttcccc tcgggagtgc ttggcattcc gtgcgataat 10440 gacttctgtt caaccaccca aacgtcggaa agcctgacga cggagcagca ttccaaaaag 10500 atcccttggc tcgtctgggt cggctagaag gtcgagtggg ctgctgtggc ttgatccctc 10560 aacgcggtcg cggacgtagc gcagcgccga aaaatcctcg atcgcaaatc cgacgctgtc 10620 gaaaatcgtg atctgcttgt cgctctttcg gccgacgtcc tggccagtca tcacgcgcca 10680 aagttccgtc acaggatgat ctggcgcgag ttgctggatc tcgccttcaa tccgggtctg 10740 tggcgggaac tccacgaaaa tatccgaacg cagcaagatg tcgacggatc ttttccgctg 10800 cataaccctg cttcggggtc attatagcga ttttttcggt atatccatcc tttttcgcac 10860 gatatacagg attttgccaa agggttcgtg tagactttcc ttggtgtatc caacggcgtc 10920 agccgggcag gataggtgaa gtaggcccac ccgcgagcgg gtgttccttc ttcactgtcc 10980 cttattcgca cctggcggtg ctcaacggga atcctgctct gcgaggctgg ccggctaccg 11040 ccggcgtaac agatgagggc aagcggatgg ctgatgaaac caagccaacc aggggtgatg 11100 ctgccaactt actgatttag tgtatgatgg tgtttttgag gtgctccagt ggcttctgtt 11160 tctatcagct gtccctcctg ttcagctact gacggggtgg tgcgtaacgg caaaagcacc 11220 gccggacatc agcgctatct ctgctctcac tgccgtaaaa catggcaact gcagttcact 11280 tacaccgctt ctcaacccgg tacgcaccag aaaatcattg atatggccat gaatggcgtt 11340 ggatgccggg caacagcccg cattatgggc gttggcctca acacgatttt acgtcactta 11400 aaaaactcag gccgcagtcg gtaacctcgc gcatacagcc gggcagtgac gtcatcgtct 11460 gcgcggaaat ggacgaacag tggggctatg tcggggctaa atcgcgccag cgctggctgt 11520 tttacgcgta tgacagtctc cggaagacgg ttgttgcgca cgtattcggt gaacgcacta 11580 -36·
151910·序列表.doc
201127957 tggcgacgct ggggcgtctt atgagcctgc tgtcaccctt tgacgtggtg atatggatga cggatggctg gccgctgtat gaatcccgcc tgaagggaaa gcigcacgta atcagcaagc gatatacgca gcgaattgag cggcataacc tgaatctgag gcagcacctg gcacggctgg gacggaagtc gctgtcgttc tcaaaatcgg tggagctgca tgaceiaagtc atcgggcatt atctgaacat aaaacactat caataagttg gagtcattac ccaaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat caagaagagc gacttcgcgg agctggtatt cgtgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg tctacgggac cgacttcatt gccgataagg tggattatct ggacaccaag gcaccaggcg ggtcaaatca ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag ggtgaatgaa tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt tttccgccga ggatgccgaa accatcgcaa gccgcaccgt catgcgtgcg ccccgcgaaa ccttccagtc cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg tgcaactggc tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgtc tcgaacagga ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga cgaccaagaa gcgaaaaacc gccggcgagg acctggcaaa acaggtcagc gaggccaagc aggccgcgtt gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg 151910·序列表.doc -37- 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 201127957 atattgcgcc gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc 12960 tgttcaccac gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc 13020 acgtcaacaa ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg 13080 aactggtgtg gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca 13140 ccttcacgtt ctacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca 13200 cgaaggccga ggaatgcctg tcgcgcctac aggcgacggc gatgggcttc acgtccgacc 13260 gcgttgggca cctggaatcg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca 13320 agaaaacgtc ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg 13380 accactacac gaaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga 13440 tgttcgacta tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc 13500 tcatgtgcgg atcggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct 13560 gcgaagagtt gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc 13620 attgcaaacg ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt 13680 tactggcatt tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct 13740 cgggacgcac ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt 13800 gattaaggct cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg 13860 attgtcggcc ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa 13920 aaagcccatg gaggcgttcg ctgeiacggtt gcgagatgcc gtggcattcg gcgcctacat 13980 cgacggcgag atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca 14040 caaggcgcat ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg 14100 tatgctgctg cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc 14160 aacgggaatc tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg 14220 • 38 ·
151910·序列表.doc
201127957 gagcttgttg tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgatacgatt gatggcggtc ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc gggtttaacc tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc tttctcagcc gggatggcgc taagaagcta ttgccgccga tcttcatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg eiagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 151910·序列表.doc •39- 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120 15180 15240 15300 15360 15420 15480 15540 201127957 gtttgcaagc agcagattac gcgcagaaaa aaaggatatc aagaagatcc tttgatcttt 15600 tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 15660 ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaiagttt taaatcaatc 15720 taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 15780 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 15840 actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 15900 cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 15960 agtggtcctg caactttatc cgcctccatc cagtctatta aacaagtggc agcaacggat 16020 tcgcaaacct gtcacgcctt ttgtgccaaa agccgcgcca ggtttgcgat ccgctgtgcc 16080 aggcgttagg cgtcatatga agatttcggt gatccctgag caggtggcgg aaacattgga 16140 tgctgagaac catttcattg ttcgtgaagt gttcgatgtg cacctatccg accaaggctt 16200 tgaactatct accagaagtg tgagccccta ccggaaggat tacatctcgg atgatgactc 16260 tgatgaagac tctgcttgct atggcgcatt catcgacceia gagcttgtcg ggaagattga 16320 actcaactca acatggaacg atctagcctc tatcgaacac attgttgtgt cgcacacgca 16380 ccgaggcaaa ggagtcgcgc acagtctcat cgaatttgcg aaaaagtggg cactaagcag 16440 acagctcctt ggcatacgat tagagacaca aacgaacaat gtacctgcct gcaatttgta 16500 cgcaaaatgt ggctttactc tcggcggcat tgacctgttc acgtataaaa ctagacctca 16560 agtctcgaac gaaacagcga tgtactggta ctggttctcg ggagcacagg atgacgccta 16620 acaattcatt caagccgaca ccgcttcgcg gcgcggctta attcaggagt taaacatcat 16680 gagggaagcg gtgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga 16740 gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg 16800 cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac 16860 40· 151910·序列表.doc
201127957 aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc ttgcaggtat cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct tggcctcgcg cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca aggtagtcgg caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag cgttagagag ctggggaaga ctatgcgcga tctgttgaag gtggttctaa gcctcgtact tgcgatggca tcggggcagg cacttgctga cctgccaatt gttttagtgg atgaagctcg tcttccctat gactactccc catccaacta cgacatttct ccaagcaact acgacaactc cataagcaat tacgacaata gtccatcaaa ttacgacaac tctgagagca actacgataa tagttcatcc aattacgaca atagtcgcaa cggaaatcgt aggcttatat atagcgcaaa tgggtctcgc actttcgccg gctactacgt cattgccaac aatgggacaa cgaacttctt ttccacatct ggcaaaagga tgttctacac cccaaaaggg gggcgcggcg tctatggcgg caaagatggg agcttctgcg gggcattggt cgtcataaat ggccaatttt cgcttgccct gacagataac ggcctgaaga tcatgtatct aagcaactag cctgctctct aataaaatgt taggagcttg gctgccattt ttggggtgag gccgttcgcg gccgaggggc gcagcccctg gggggatggg aggcccgcgt tagcgggccg ggagggttcg agaagggggg gcacccccct 151910-序列表.doc •41 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 201127957 tcggcgtgcg cggtcacgcg ccagggcgca gccctggtta aaaacaaggt ttataaatat 18240 tggtttaaaa gcaggttaaa agacaggtta gcggtggccg aaaaacgggc ggaaaccctt 18300 gcaaatgctg gattttctgc ctgtggacag cccctcaaat gtcaataggt gcgcccctca 18360 tctgtcagca ctctgcccct caagtgtcaa ggatcgcgcc cctcatctgt cagtagtcgc 18420 gcccctcaag tgtcaatacc gcagggcact tatccccagg cttgtccaca tcatctgtgg 18480 gaaactcgcg taaaatcagg cgttttcgcc gatttgcgag gctggccagc tccacgtcgc 18540 cggccgaaat cgagcctgcc cctcatctgt caacgccgcg ccgggtgagt cggcccctca 18600 agtgtcaacg tccgcccctc atctgtcagt gagggccaag ttttccgcga ggtatccaca 18660 acgccggcgg ccggccgcgg tgtctcgcac acggcttcga cggcgtttct ggcgcgtttg 18720 cagggccata gacggccgcc agcccagcgg cgagggcaac cagcccggtg agcgtcggaa 18780 aggg 18784 <210〉 27 <211〉 18784 〈212〉 DNA <213〉人工序列 <220> <223〉人工 <400> 27 tcgacatcgt caacgttcac ttctaaagaa atagcgccac tcagcttcct cagcggcttt 60 atccagcgat ttcctattat gtcggcatag ttctcaagat cgacagcctg tcacggttaa 120 gcgagaaatg aataagaagg ctgataattc ggatctctgc gaggagatga tatttgatca 180 caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt 240 gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcgggtaa catgagcaaa 300 gtctgccgcc ttacaacggc tctcccgctg acgccgtccc ggactgatgg gctgcctgta 360 • 42- 151910-序列表.doc 420 420
201127957 tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg atatattgtg gtgtaaacaa attgacgctt agacaactta ataacacatt gcggacgttt ttaatgtact gaattcgccg ctcggtgtgt cgtagatact agcccctggg gcacttttga aatttgaata agatttatgt aatcagtctt ttaggtttga ccggttctgc cgcttttttt aaaattggat ttgtaataat aaaacgcaat tgtttgttat tgtggcgctc tatcatagat gtcgctataa acctattcag cacaatatat tgttttcatt ttaatattgt acatataagt agtagggtac aatcagtaaa ttgaacggag aatattattc ataaaaatac gatagtaacg ggtgatatat tcattagaat gaaccgaaac cggcggteiag gatctgagct acacatgctc aggtttttta caacgtgcac aacagaattg aaagcaaata tcatgcgatc ataggcgtct cgcatatctc attaaacaag tgaagatttg attcaaactc cattgagagc cctgactatg cattcggttt gacccttcca ggttgagaga cgatagcccc ctaccttaat taaggggccc cccctcgagg tcgacggtat cgataagctt gatatcgaat tcctgcagcc agggggatcc cccgggtcat cagatctcgg tgacgggcag gaccggacgg ggcggtaccg gcaggctgaa gtccagctgc cagaaaccca cgtcatgcca gttcccgtgc ttgaagccgg ccgcccgcag catgccgcgg ggggcatatc cgagcgcctc gtgcatgcgc acgctcgggt cgttgggcag cccgatgaca gcgaccacgc tcttgaagcc ctgtgcctcc agggacttca gcaggtgggt gtagagcgtg gagcccagtc ccgtccgctg gtggcggggg gagacgtaca cggtcgactc ggccgtccag tcgtaggcgt tgcgtgcctt ccaggggccc gcgtaggcga tgccggcgac ctcgccgtcc acctcggcga cgagccaggg atagcgctcc cgcagacgga cgaggtcgtc cgtccactcc tgcggttcct gcggctcggt acggaagttg accgtgcttg tctcgatgta gtggttgacg atggtgcaga ccgccggcat gtccgcctcg gtggcacggc ggatgtcggc cgggcgtcgt tctgggctca tggtagatcc cctcgagaga gatagatttg tagagagaga 151910-序列表.doc •43· 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 201127957 ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt ccttatatag aggaaggtct 1740 tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag tggagatatc acatcaatcc 1800 acttgctttg aagacgtggt tggaacgtct tctttttcca cgatgctcct cgtgggtggg 1860 ggtccatctt tgggaccact gtcggcagag gcatcttgaa cgatagcctt tcctttatcg 1920 caatgatggc atttgtaggt gccaccttcc ttttctactg tccttttgat gaagtgacag 1980 atagctgggc aatggaatcc gaggaggttt cccgatatta ccctttgttg aaaagtctca 2040 atagcccttt ggtcttctga gactgtatct ttgatattct tggagtagac gagagtgtcg 2100 tgctccacca tgttatcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct 2160 ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca 2220 tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt 2280 tctactgtcc ttttgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 2340 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg 2400 atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgctgatagt gaccttaggc 2460 gacttttgeia cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa 2520 acccattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 2580 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 2640 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 2700 attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgctc ccggccgcca 2760 tggccgcggg atatcactag tgcggccgct cgacgaatta attccaatcc cacaaaaatc 2820 tgagcttaac agcacagttg ctcctctcag agcagaatcg ggtattcaac accctcatat 2880 caactactac gttgtgtata acggtccaca tgccggtata tacgatgact ggggttgtac 2940 aaaggcggca acaaacggcg ttcccggagt tgcacacaag aaatttgcca ctattacaga 3000 -44 -
151910·序列表.doc
201127957 ggcaagagca gcagctgacg cgtacacaac aagtcagcaa acagacaggt tgaacttcat ccccaaagga gaagctcaac tcaagcccaa gagctttgct aaggccctaa caagcccacc aaagcaaaaa gcccactggc tcacgctagg aaccaaaagg cccagcagtg atccagcccc aaaagagatc tcctttgccc cggagattac aatggacgat ttcctctatc tttacgatct aggaaggaag ttcgaaggtg aaggtgacga cactatgttc accactgata atgagaaggt tagcctcttc aatttcagaa agaatgctga cccacagatg gttagagagg cctacgcagc aggtctcatc aagacgatct acccgagtaa caatctccag gagatcaaat accttcccaa gaaggttaaa gatgcagtca aaagattcag gactaattgc atcaagaaca cagagaaaga catatttctc aagatcagaa gtactattcc agtatggacg attceiaggct tgcttcataa accaaggcaa gtaatagaga ttggagtctc taaaaaggta gttcctactg aatctaaggc catgcatgga gtctaagatt caaatcgagg atctaacaga actcgccgtg aagactggcg aacagttcat acagagtctt ttacgactca atgacaagaa gaaaatcttc gtcaacatgg tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca gaagaccaaa gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga ttccattgcc cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgac atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca tttggagagg acacgctcga ggaattcggt accccatcac aagtttgtac aaaaaagcag gctgcggccg cttgctccct taaaaaaaac catggcatgt cattacggac aacagcaaca gactagagca cctcatcttc agcttcaacc tagagcacag agagttgtga aggctgctac tgctgttact gtaaatttct 151910-序列表.doc • 45· 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 201127957 gtgttcctta ttctctcaaia atcttcgatt ttgttttcgt tcgatccceia tttcgtatat 4380 gttctttggt ttagattctg ttaatcttag atcgaagacg attttctggg tttgatcgtt 4440 agatatcatc ttaattctcg attagggttt catagetatc atccgatttg ttcaaatsiat 4500 ttgagttttg tcgaataatt actcttcgat ttgtgatttc tatctagatc tggtgttagt 4560 ttctagtttg tgcgatcgaa tttgtcgatt aatctgagtt tttctgatta acaggctgga 4620 ggatctcttc ttgttctctc tggacttact ctcgctggaa ctgttatcgc tctcactatc 4680 gctacacctc ttctcgttat cttctctcct gttctcgttc ctgctgtgat cactatcttc 4740 cttctcggag ctggatttct tgcttctggt ggatttggag ttgctgctct ctctgttctc 4800 tcttggatct acagatacct cactggaaaa catcctccag gtgctgatca acttgagtct 4860 gctaagacta agctcgcttc taaggctaga gagatgaagg atagagcaga gcaattctct 4920 tgtcagcctg ttgctggatc tcagacttct taatgaacat atggtcctgc tttaatgaga 4980 tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 5040 aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 5100 atcacccgtt actatcgtat ttttatgeiat aatattctcc gttceiattta ctgattgtac 5160 cctactactt atatgtacaa tattaaaatg aaaacaatat attgtgctga ataggtttat 5220 agcgacatct atgatagagc gccacaataa caaacaattg cgttttatta ttacaaatcc 5280 aattttaaaa aaagcggcag aaccggtcaa acctaaaaga ctgattacat aaatcttatt 5340 caaatttcaa aaggccccag gggctagtat ctacgacaca ccgagcggcg aactaataac 5400 gttcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc cttgaagttg 5460 agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt ccagcacggc 5520 ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt gtatgtgggc 5580 cccaaatgaa gtgcaggtce aaccttgece gtgacgacaa atcgttgggc gggtccaggg 5640 -46·
151910-序列表.doc
201127957 cgaattttgc gacaacatgt cgaggctcag caggacctgc aggcatgcaa gctagcttac tagtgatgca tattctatag tgtcacctaa atcttcgacg aattaattcc aatcccacaa aaatctgagc ttaacagcac agttgctcct ctcagagcag aatcgggtat tcaacaccct catatcaact actacgttgt gtataacggt ccacatgccg gtatatacga tgactggggt tgtacaaagg cggcaacaaa cggcgttccc ggagttgcac acaagaaatt tgccactatt acagaggcaa gagcagcagc tgacgcgtac acaacaagtc agcaaacaga caggttgaac ttcatcccca aaggagaagc tcaactcaag cccaagagct ttgctaaggc cctaacaagc ccaccaaagc aaaaagccca ctggctcacg ctaggaacca aaaggcccag cagtgatcca gccccaaaag agatctcctt tgccccggag attacaatgg acgatttcct ctatctttac gatctaggaa ggaagttcga aggtgaaggt gacgacacta tgttcaccac tgataatgag aaggttagcc tcttcaattt cagaaagaat gctgacccac agatggttag agaggcctac gcagcaggtc tcatcaagac gatctacccg agtaacaatc tccaggagat caaatacctt cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta attgcatcaa gaacacagag aaagacatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt cataaaccaa ggcaagtaat agagattgga gtctctaaeia aggtagttcc tactgaatct aaggccatgc atggagtcta agattcaaat cgaggatcta acagaactcg ccgtgaagac tggcgaacag ttcatacaga gtcttttacg actceiatgac aagaagaaaa tcttcgtcaa catggtggag cacgacactc tggtctactc caaaaatgtc aaagatacag tctcagaaga ccaaagggct attgagactt ttcaacaaag gataatttcg ggaaacctcc tcggattcca ttgcccagct atctgtcact tcatcgaaag gacagtagaa aaggaaggtg gctcctacaa atgccatcat tgcgataaag gaaaggctat cattceiagat ctctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaasiaa gaagacgttc caaccacgtc 151910·序列表.doc • 47· 5700 5760 5820 5880 5940 6000 6060 6120 6180 6240 6300 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 201127957 ttcaaagceia gtggattgat gtgacatctc cactgacgta agggatgacg cacaatccca 7020 ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg agaggacacg 7080 ggatccttgc tccgttaaaa aaaaccatgg ctatcctcga ttctgctggt gttactactg 7140 tgactgagaa tggtggtgga gagttcgttg atctcgatag actcagaaga agaaagtcta 7200 gatctgtaaa tttctgtgtt ccttattctc tcaaaatctt cgattttgtt ttcgttcgat 7260 cccaatttcg tatatgttct ttggtttaga ttctgttaat cttagatcga agacgatttt 7320 ctgggtttga tcgttagata tcatcttaat tctcgattag ggtttcatag atatcatccg 7380 atttgttcaa ataatttgag ttttgtcgaa taattactct tcgatttgtg atttctatct 7440 agatctggtg ttagtttcta gtttgtgcga tcgaatttgt cgatteiatct gagtttttct 7500 gattaacagg attcttctaa cggacttctc ctctctggat ctgataacaa ctctccttct 7560 gatgatgttg gtgctcctgc tgatgtgaga gatagaatcg attctgtggt gaacgatgat 7620 gctcaaggta ctgctaacct cgctggtgat aataacggtg gaggtgataa caatggtgga 7680 ggaagaggtg gaggtgaagg tagaggaaac gctgatgcta ctttcactta cagaccatct 7740 gtgcctgctc atagaagagc tagagagtct cctctctctt ctgatgctat cttcaagcag 7800 tctcacgctg gacttttcaa cctctgtgtg gtggttctta tcgctgtgeia ctctagactc 7860 atcatcgaga acctcatgeia gtacggatgg ctcatcagaa ctgatttctg gttctcttct 7920 agatctctca gagattggcc tcttttcatg tgctgcatct cactctcaat cttccctctc 7980 gctgctttta ctgttgagaa gctcgtgctc cagaagtata tcgctgaacc tgtggtgatc 8040 ttcctccaca tcatcatcac tatgactgag gttctctacc ctgtttacgt gactctcaga 8100 tgcgattctg ctttcctctc tggtgttact cttatgctcc tcacttgcat tgtgtggctt 8160 aagctcgtgt cttacgctca cacttcttac gatatcagat ctctcgctaa cgctgctgat 8220 aaggctaacc ctgaagtgtc ttactacgtg tctctcaagt ctctcgctta cttcatggtt 8280 •48· 151910·序列表.doc
201127957 gctcctacac tttgttacca gccatcttac cctagatctg cttgcattag aaagggatgg gtggcaagac aattcgctaa gttggtgatc ttcactggat tcatgggatt catcatcgag cagtacatca accctattgt gagaaactct aagcaccctc tcaagggtga tcttctctac gctatcgaga gagttcttaa gctctctgtg cctaaccttt atgtgtggct ctgcatgttc tactgtttct tccacctctg gcttaacatc cttgctgagt tgctttgctt cggagataga gagttctaca aggattggtg gaacgctaag tctgttggag attattggag aatgtggaac atgcctgtgc ataagtggat ggtgcgtcac atctacttcc cttgcctcag atctaagatc cctaagactc tcgctatcat tatcgctttc ctcgtgtctg ctgttttcca tgagttgtgt atcgctgttc cttgcagact tttcaagctt tgggctttcc tcggaatcat gttccaggtt ccactcgtgt tcatcactaa ctacctccaa gagagattcg gatctactgt tggaaacatg attttctggt tcattttctg catcttcgga cagcctatgt gcgttctcct ctactaccac gatctcatga acagaaaggg atctatgtct taatgaagga tccacccagc tttcttgtac aaagtggtga tgggttcgeia atcgataagc ttggatcctc tagagtcctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc cgttcaattt actgattgta ccctactact tatatgtaca atattaaaat gaaaacaata tattgtgctg aataggttta tagcgacatc tatgatagag cgccacaata acaaacaatt gcgttttatt attacaaatc caattttaaa aaaagcggca gaaccggtca aacctaaaag actgattaca taaatcttat tcaaatttca aaaggcccca ggggctagta tctacgacac accgagcggc gaactaataa cgttcactga agggaactcc ggttccccgc cggcgcgcat gggtgagatt ccttgaagtt gagtattggc cgtccgctct accgaaagtt acgggcacca ttcaacccgg tccagcacgg 151910-序列表.doc • 49- 8340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 201127957 cggccgggta accgacttgc tgccccgaga attatgcagc atttttttgg tgtatgtggg 9660 ccccaaatga agtgcaggtc aaaccttgac agtgacgaca aatcgttggg cgggtccagg 9720 gcgaattttg cgacaacatg tcgaggctca gcaggacctg caggcatgca agctagctta 9780 ctagtgatgc atattctata gtgtcaccta aatctgcggc cgcctgcagg tcgatatggg 9840 agagctccca acgcgttgga tgcatagctt gagtattcta tagtgtcacc taaatagctt 9900 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 9960 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10020 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10080 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggg ctgagtggct 10140 ccttcaacgt tgcggttctg tcagttccaa acgteiaaacg gcttgtcccg cgtcatcggc 10200 gggggtcata acgtgactcc cttaattctc cgctcatgat cagattgtcg tttcccgcct 10260 tcagtttaaa ctatcagtgt ttgacaggat atattggcgg gtaaacctaa gagaaaagag 10320 cgtttattag aataatcgga tatttaaaag ggcgtgaaaa ggtttatccg ttcgtccatt 10380 tgtatgtgca tgccaaccac agggttcccc tcgggagtgc ttggcattcc gtgcgataat 10440 gacttctgtt caaccaccca aacgtcggaa agcctgacga cggagcagca ttccaaaaag 10500 atcccttggc tcgtctgggt cggctagaag gtcgagtggg ctgctgtggc ttgatccctc 10560 aacgcggtcg cggacgtagc gcagcgccga aaaatcctcg atcgceiaatc cgacgctgtc 10620 gaaaatcgtg atctgcttgt cgctctttcg gccgacgtcc tggccagtca tcacgcgcca 10680 aagttccgtc acaggatgat ctggcgcgag ttgctggatc tcgccttcaa tccgggtctg 10740 tggcgggaac tccacgaaaa tatccgaacg cagcaagatg tcgacggatc ttttccgctg 10800 cataaccctg cttcggggtc attatagcga ttttttcggt atatccatcc tttttcgcac 10860 gatatacagg attttgccaa agggttcgtg tagactttcc ttggtgtatc caacggcgtc 10920 •50- 151910·序列表.doc
201127957 agccgggcag gataggtgaa gtaggcccac ccgcgagcgg gtgttccttc ttcactgtcc cttattcgca cctggcggtg ctcaacggga atcctgctct gcgaggctgg ccggctaccg ccggcgtaac agatgagggc aagcggatgg ctgatgaaac caagccaacc aggggtgatg ctgccaactt actgatttag tgtatgatgg tgtttttgag gtgctccagt ggcttctgtt tctatcagct gtccctcctg ttcagctact gacggggtgg tgcgtaacgg caaaagcacc gccggacatc agcgctatct ctgctctcac tgccgtaaaa catggcaact gcagttcact tacaccgctt ctcaacccgg tacgcaccag aaaatcattg atatggccat gaatggcgtt ggatgccggg caacagcccg cattatgggc gttggcctca acacgatttt acgtcactta aaaaactcag gccgcagtcg gtaacctcgc gcatacagcc gggcagtgac gtcatcgtct gcgcggaaat ggacgaacag tggggctatg tcggggctaa atcgcgccag cgctggctgt tttacgcgta tgacagtctc cggaagacgg ttgttgcgca cgtattcggt gaacgcacta tggcgacgct ggggcgtctt atgagcctgc tgtcaccctt tgacgtggtg atatggatga cggatggctg gccgctgtat gaatcccgcc tgaagggaaa gctgcacgta atcagcaagc gatatacgca gcgaattgag cggcataacc tgaatctgag gcagcacctg gcacggctgg gacggaagtc gctgtcgttc tcaaaatcgg tggagctgca tgacaaagtc atcgggcatt atctgaacat aaaacactat caataagttg gagtcattac ccEiaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg attgaggaaa aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt tagccgctaa aacggccggg 151910-序列表.doc -51- 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 201127957 gggtgcgcgt agctggtatt tctacgggac ggtcaaatca ggtgaatgaa tttccgccga ccttccagtc tgcaactggc tcgaacagga cgaccaagaa aggccgcgtt atattgcgcc tgttcaccac acgtcaacaa aactggtgtg ccttcacgtt cgaaggccga gcgttgggca agaaaacgtc accactacac tgttcgacta tcatgtgcgg gattgccaag cacgtcccca cgtgcagggc aagattcgga cgacttcatt gccgataagg ggaataaggg cacattgccc tcggacgttt gaccggaagg ggatgccgaa accatcgcaa cgtcggctcg atggtccagc tccccctgcc ctgcccgcgc ggcggcaggt ttggcgaagt gcgaaaaacc gccggcgagg gctgaaacac acgaagcagc gtggccggac acgatgcgag gcgcaacaag aaaatcccgc ggacgtgaag atcacctaca gcagcaggtg ttggagtacg ctacgagctt tgccaggacc ggaatgcctg tcgcgcctac cctggaatcg gtgtcgctgc ccgttgccag gtcctgatcg gaaattcata tgggagaagt tttcagctcg caccgggagc atcggattcc acccgcgtga tgcgctccat caagaagagc ataccaagta cgagaaggac tggattatct ggacaccaag cggcgtgagt cggggcaatc catacaggca agaactgatc gccgcaccgt catgcgtgcg aagctacggc caagatcgag catcggccgc cgtggagcgt cgatgaccat cgacacgcga acctggcaaa acaggtcagc agatcaagga aatgcagctt cgatgccaaa cgacacggcc gcgaggcgct gcaaaacaag ccggcgtcga gctgcgggcc cgaagcgcac ccctatcggc tgggctggtc gatcaatggc aggcgacggc gatgggcttc tgcaccgctt ccgcgtcctg acgaggaaat cgtcgtgctg accgcaagct gtcgccgacg cgtacccgct caagctggaa agaagtggcg cgagcaggtc gacttcgcgg 12300 ggccagacgg 12360 gcaccaggcg 12420 ccgcaaggag 12480 gacgcggggt 12540 ccccgcgaaa 12600 cgcgacagcg 12660 tcgcgtcgtc 12720 ggaactatga 12780 gaggccaagc 12840 tccttgttcg 12900 cgctctgccc 12960 gtcattttcc 13020 gacgatgacg 13080 gagccgatca 13140 cggtattaca 13200 acgtccgacc 13260 gaccgtggca 13320 tttgctggcg 13380 gcccgacgga 13440 accttccgcc 13500 ggcgaagcct 13560 •52- 151910·序列表.doc
201127957 gcgaagagtt gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc attgcaaacg ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt tactggcatt tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct cgggacgcac ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt gattaaggct cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg attgtcggcc ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa aaagcccatg gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat cgacggcgag atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca caaggcgcat ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg tatgctgctg cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc aacgggaatc tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg gagcttgttg tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgatacgatt gatggcggtc ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc gggtttaacc tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc tttctcagcc gggatggcgc taagaagcta ttgccgccga tcttcatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 151910-序列表.doc •53· 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 201127957 tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 14940 gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 15000 aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 15060 ccgacaggac tataaagata ccaggcgttt ccccctggeia gctccctcgt gcgctctcct 15120 gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 15180 ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg 15240 ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 15300 cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 15360 attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 15420 ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 15480 aaaagagttg gtagctcttg atccggceiaa caaaccaccg ctggtagcgg tggttttttt 15540 gtttgcaagc agcagattac gcgcagaaaa aaaggatatc aagaiagatcc tttgatcttt 15600 tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 15660 ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 15720 taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 15780 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 15840 actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 15900 cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 15960 agtggtcctg caactttatc cgcctccatc cagtctatta aacaagtggc agcaacggat 16020 tcgcaaacct gtcacgcctt ttgtgccaaa agccgcgcca ggtttgcgat ccgctgtgcc 16080 aggcgttagg cgtcatatga agatttcggt gatccctgag caggtggcgg aaacattgga 16140 tgctgagaac catttcattg ttcgtgaagt gttcgatgtg cacctatccg accaaggctt 16200 -54- 151910-序列表.doc 201127957
tgaactatct tgatgaagac actcaactca ccgaggcaaa acagctcctt cgcaaaatgt agtctcgaac acaattcatt gagggaagcg gcgccatctc cctgaagcca aacgcggcga gattctccgc tccagctaag cttcgagcca tagcgttgcc tctatttgag cgatgagcga aatcgcgccg gcccgtcata cgcagatcag caaataatgt accagaagtg tctgcttgct acatggaacg ggagtcgcgc ggcatacgat ggctttactc gaaacagcga caagccgaca gtgatcgccg gaaccgacgt cacagtgata gctttgatca gctgtagaag cgcgaactgc gccacgatcg ttggtaggtc gcgctaaatg aatgtagtgc aaggatgtcg cttgaagcta ttggaagaat ctaacaattc tgagccccta atggcgcatt atctagcctc acagtctcat tagagacaca tcggcggcat tgtactggta ccgcttcgcg aagtatcgac tgctggccgt ttgatttgct acgacctttt tcaccattgt aatttggaga acattgatct cagcggcgga aaaccttaac ttacgttgtc ctgccgactg ggcaggctta ttgttcacta gttcaagccg ccggaaggat catcgaccaa tatcgaacac cgaatttgcg aacgaacaat tgacctgttc ctggttctcg gcgcggctta tcaactatca acatttgtac ggttacggtg ggaaacttcg tgtgcacgac atggcagcgc ggctatcttg ggaactcttt gctatggaac ccgcatttgg ggcaatggag tcttggacaa cgtgaaaggc acgccgcttc tacatctcgg gagcttgtcg attgttgtgt aaaaagtggg gtacctgcct acgtataaaa ggagcacagg attcaggagt gaggtagttg ggctccgcag accgtaaggc gcttcccctg gacatcattc aatgacattc ctgacaaaag gatccggttc tcgccgcccg tacagcgcag cgcctgccgg gaagatcgct gagatcacca gcggcgcggc atgatgactc ggaagattga cgcacacgca cactaagcag gcaatttgta ctagacctca atgacgccta taaacatcat gcgtcatcga tggatggcgg ttgatgaaac gagagagcga cgtggcgtta ttgcaggtat caagagaaca ctgaacagga actgggctgg taaccggcaa cccagtatca tggcctcgcg aggtagtcgg ttaactcaag 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 -55- 151910·序列表.doc 201127957 cgttagagag ctggggaaga ctatgcgcga tctgttgaag gtggttctaa gcctcgtact 17580 tgcgatggca tcggggcagg cacttgctga cctgccaatt gttttagtgg atgaagctcg 17640 tcttccctat gactactccc catccaacta cgacatttct ccaagcaact acgacaactc 17700 cataagcaat tacgacaata gtccatcaaa ttacgacaac tctgagagca actacgataa 17760 tagttcatcc eiattacgaca atagtcgcaa cggaaatcgt aggcttatat atagcgcaaa 17820 tgggtctcgc actttcgccg gctactacgt cattgccaac aatgggacaa cgaacttctt 17880 ttccacatct ggcaaaagga tgttctacac cccaaaaggg gggcgcggcg tctatggcgg 17940 caaagatggg agcttctgcg gggcattggt cgtcataaat ggccaatttt cgcttgccct 18000 gacagataac ggcctgaaga tcatgtatct aagcaactag cctgctctct aataaaatgt 18060 taggagcttg gctgccattt ttggggtgag gccgttcgcg gccgaggggc gcagcccctg 18120 gggggatggg aggcccgcgt tagcgggccg ggagggttcg agaagggggg gcacccccct 18180 tcggcgtgcg cggtcacgcg ccagggcgca gccctggtta aaaacaaggt ttataaatat 18240 tggtttaaaa gcaggttaaa agacaggtta gcggtggccg aaaaacgggc ggaaaccctt 18300 gcaaatgctg gattttctgc ctgtggacag cccctcaaat gtcaataggt gcgcccctca 18360 tctgtcagca ctctgcccct caagtgtcaa ggatcgcgcc cctcatctgt cagtagtcgc 18420 gcccctcaag tgtcaatacc gcagggcact tatccccagg cttgtccaca tcatctgtgg 18480 gaaactcgcg taaaatcagg cgttttcgcc gatttgcgag gctggccagc tccacgtcgc 18540 cggccgaaat cgagcctgcc cctcatctgt caacgccgcg ccgggtgagt cggcccctca 18600 agtgtcaacg tccgcccctc atctgtcagt gagggccaag ttttccgcga ggtatccaca 18660 acgccggcgg ccggccgcgg tgtctcgcac acggcttcga cggcgtttct ggcgcgtttg 18720 cagggccata gacggccgcc agcccagcgg cgagggcaac cagcccggtg agcgtcggaa 18780 aggg 18784 •56· 151910·序列表.doc
201127957 <210〉 28 <211> 18784 <212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400〉 28 tcgacatcgt caacgttcac ttctaaagaa atagcgccac tcagcttcct cagcggcttt atccagcgat ttcctattat gtcggcatag ttctcaagat cgacagcctg tcacggttaa gcgagaaatg aataagaagg ctgataattc ggatctctgc gaggagatga tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcgggtaa catgagcaaa gtctgccgcc ttacaacggc tctcccgctg acgccgtccc ggactgatgg gctgcctgta tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg atatattgtg gtgtaaacaa attgacgctt agacaactta ataacacatt gcggacgttt ttaatgtact gaattcgccg ctcggtgtgt cgtagatact agcccctggg gcacttttga aatttgaata agatttatgt aatcagtctt ttaggtttga ccggttctgc cgcttttttt aaaattggat ttgtaataat aaaacgcaat tgtttgttat tgtggcgctc tatcatagat gtcgctataa acctattcag cacaatatat tgttttcatt ttaatattgt acatateiagt agtagggtac aatcagtaaa ttgaacggag aatattattc ataaaaatac gatagtaacg ggtgatatat tcattagaat gaaccgaaac cggcggtaag gatctgagct acacatgctc aggtttttta caacgtgcac aacagaattg aaagcaaata tcatgcgatc etaggcgtct cgcatatctc attaaacaag tgaagatttg attcaaactc cattgagagc cctgactatg cattcggttt gacccttcca ggttgagaga cgatagcccc ctaccttaat taaggggccc 151910-序列表.doc 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 -57- 1020 201127957 cccctcgagg tcgacggtat cgataagctt gatatcgaat tcctgcagcc agggggatcc 1080 cccgggtcat cagatctcgg tgacgggcag gaccggacgg ggcggtaccg gcaggctgaa 1140 gtccagctgc cagaaaccca cgtcatgcca gttcccgtgc ttgaagccgg ccgcccgcag 1200 catgccgcgg ggggcatatc cgagcgcctc gtgcatgcgc acgctcgggt cgttgggcag 1260 cccgatgaca gcgaccacgc tcttgaagcc ctgtgcctcc agggacttca gcaggtgggt 1320 gtagagcgtg gagcccagtc ccgtccgctg gtggcggggg gagacgtaca cggtcgactc 1380 ggccgtccag tcgtaggcgt tgcgtgcctt ccaggggccc gcgtaggcga tgccggcgac 1440 ctcgccgtcc acctcggcga cgagccaggg atagcgctcc cgcagacgga cgaggtcgtc 1500 cgtccactcc tgcggttcct gcggctcggt acggaagttg accgtgcttg tctcgatgta 1560 gtggttgacg atggtgcaga ccgccggcat gtccgcctcg gtggcacggc ggatgtcggc 1620 cgggcgtcgt tctgggctca tggtagatcc cctcgagaga gatagatttg tagagagaga 1680 ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt ccttatatag aggaaggtct 1740 tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag tggagatatc acatcaatcc 1800 acttgctttg aagacgtggt tggaacgtct tctttttcca cgatgctcct cgtgggtggg 1860 ggtccatctt tgggaccact gtcggcagag gcatcttgaa cgatagcctt tcctttatcg 1920 caatgatggc atttgtaggt gccaccttcc ttttctactg tccttttgat gaagtgacag 1980 atagctgggc aatggaatcc gaggaggttt cccgatatta ccctttgttg aaaagtctca 2040 atagcccttt ggtcttctga gactgtatct ttgatattct tggagtagac gagagtgtcg 2100 tgctccacca tgttatcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct 2160 ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca 2220 tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt 2280 tctactgtcc ttttgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 2340 -58·
151910-序列表.doc
201127957 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgctgatagt gaccttaggc gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa acccattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgctc ccggccgcca tggccgcggg atatcactag tgcggccgct cgacgaatta attccaatcc cacaaaaatc tgagcttaac agcacagttg ctcctctcag agcagaatcg ggtattcaac accctcatat caactactac gttgtgtata acggtccaca tgccggtata tacgatgact ggggttgtac 纸边ggcggca acaaacggcg ttcccggagt tgcacacaag aaatttgcca ctattacaga ggcaagagca gcagctgacg cgtacacaac aagtcagcaa acagacaggt tgaacttcat ccccaaagga gaagctcaac tcaagcccaa gagctttgct aaggccctaa caagcccacc aaagcaaaaa gcccactggc tcacgctagg aaccaaaagg cccagcagtg atccagcccc aaaagagatc tcctttgccc cggagattac aatggacgat ttcctctatc tttacgatct aggaaggaag ttcgaaggtg aaggtgacga cactatgttc accactgata atgagaaggt tagcctcttc aatttcagaa agaatgctga cccacagatg gttagagagg cctacgcagc aggtctcatc aagacgatct acccgagtaa caatctccag gagatcaaat accttcccaa gaaggttaaa gatgcagtca aaagattcag gactaattgc atcaagaaca cagagaaaga catatttctc aagatcagaa gtactattcc agtatggacg attcaaggct tgcttcataa accaaggcaa gtaatagaga ttggagtctc taaaaaggta gttcctactg aatctaaggc catgcatgga gtctaagatt caaatcgagg atctaacaga actcgccgtg aagactggcg 151910-序列表.doc 59· 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 201127957 aacagttcat acagagtctt ttacgactca tggagcacga cactctggtc tactccaaaa gggctattga gacttttcaa caaaggataa cagctatctg tcacttcatc gaaaggacag atcattgcga taaaggaaag gctatcattc atggaccccc acccacgagg agcatcgtgg agcaagtgga ttgatgtgac atctccactg cttcgcaaga cccttcctct atataaggaa ggaattcggt accccatcac aagtttgtac taaaaaaaac catggcatgt cattacggac agcttcaacc tagagcacag agagttgtga gtgttcctta ttctctcaaa atcttcgatt gttctttggt ttagattctg ttaatcttag agatatcatc ttaattctcg attagggttt ttgagttttg tcgaataatt actcttcgat ttctagtttg tgcgatcgaa tttgtcgatt ggatctcttc ttgttctctc tggacttact gctacacctc ttctcgttat cttctctcct cttctcggag ctggatttct tgcttctggt tcttggatct acagatacct cactggaaaa gctaagacta agctcgcttc ttgtgctaga tgtcagcctg ttgctggatc tcagacttct atgacaagaa gaaaatcttc gtcaacatgg 3720 atgtcaaaga tacagtctca gaagaccaaa 3780 tttcgggaaa cctcctcgga ttccattgcc 3840 tagaaaagga aggtggctcc tacaaatgcc 3900 aagatctctc tgccgacagt ggtcccaaag 3960 aaaaagaaga cgttccaacc acgtcttcaa 4020 acgtaaggga tgacgcacaa tcccactatc 4080 gttcatttca tttggagagg acacgctcga 4140 aaaaaagcag gctgcggccg cttgctccct 4200 aacagcaaca gactagagca cctcatcttc 4260 aggctgctac tgctgttact gtaaatttct 4320 ttgttttcgt tcgatcccaa tttcgtatat 4380 atcgaagacg attttctggg tttgatcgtt 4440 catagatatc atccgatttg ttcetaataat 4500 ttgtgatttc tatctagatc tggtgttagt 4560 aatctgagtt tttctgatta acaggctgga 4620 ctcgctggaa ctgttatcgc tctcactatc 4680 gttctcgttc ctgctgtgat cactatcttc 4740 ggatttggag ttgctgctct ctctgttctc 4800 catcctccag gtgctgattg tcttgagtct 4860 gagatgaagg atagagcaga gcaattctct 4920 taatgaacat atggtcctgc tttaatgaga 4980 -60- 151910·序列表.doc
201127957 tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtac cctactactt atatgtacaa tattaaaatg aaaacaatat attgtgctga ataggtttat agcgacatct atgatagagc gccacaataa caaacaattg cgttttatta ttacaaatcc aattttaaaa aaagcggcag aaccggtcaa acctaaaaga ctgattacat eiaatcttatt caaatttcaa aaggccccag gggctagtat ctacgacaca ccgagcggcg aactaataac gttcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc cttgaagttg agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt ccagcacggc ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt gtatgtgggc cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc gggtccaggg cgaattttgc gacaacatgt cgaggctcag caggacctgc aggcatgcaa gctagcttac tagtgatgca tattctatag tgtcacctaa atcttcgacg aattaattcc giatcccacaa aaatctgagc ttaacagcac agttgctcct ctcagagcag aatcgggtat tcaacaccct catatcaact actacgttgt gtataacggt ccacatgccg gtatatacga tgactggggt tgtacaaagg cggcaacaeia cggcgttccc ggagttgcac acaagaaatt tgccactatt acagaggcaa gagcagcagc tgacgcgtac acaacaagtc agcaaacaga caggttgaac ttcatcccca aaggagaagc tcaactcaag cccaagagct ttgctaaggc cctaacaagc ccaccaaagc aaaaagccca ctggctcacg ctaggaacca aaaggcccag cagtgatcca gccccaaaag agatctcctt tgccccggag attacaatgg acgatttcct ctatctttac gatctaggaa ggaagttcga aggtgaaggt gacgacacta tgttcaccac tgataatgag aaggttagcc tcttcaattt cagaaagaat gctgacccac agatggttag agaggcctac 151910·序列表.doc •61- 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 6120 6180 6240 6300 201127957 gcagcaggtc tcatcaagac gatctacccg agtaacaatc tccaggagat caaatacctt 6360 cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta attgcatcaa gaacacagag 6420 aaagacatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt 6480 cataaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc tactgaatct 6540 aaggccatgc atggagtcta agattcaaat cgaggatcta acagaactcg ccgtgaagac 6600 tggcgaacag ttcatacaga gtcttttacg actcaatgac aagaagaaaa tcttcgtcaa 6660 catggtggag cacgacactc tggtctactc caaaaatgtc aaagatacag tctcagaaga 6720 ccaeiagggct attgagactt ttcaacaaag gataatttcg ggaaacctcc tcggattcca 6780 ttgcccagct atctgtcact tcatcgaaag gacagtagaa aaggaaggtg gctcctacaa 6840 atgccatcat tgcgataaag gaiaaggctat cattcaagat ctctctgccg acagtggtcc 6900 caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc ceiaccacgtc 6960 ttcaaagcaa gtggattgat gtgacatctc cactgacgta agggatgacg cacaatccca 7020 ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg agaggacacg 7080 ggatccttgc tccgttaaaa aaaaccatgg ctatcctcga ttctgctggt gttactactg 7140 tgactgagaa tggtggtgga gagttcgttg atctcgatag actcagaaga agaaagtcta 7200 gatctgtaaa tttctgtgtt ccttattctc tcaaaatctt cgattttgtt ttcgttcgat 7260 cccaatttcg tatatgttct ttggtttaga ttctgttaat cttagatcga agacgatttt 7320 ctgggtttga tcgttagata tcatcttaat tctcgattag ggtttcatag atatcatccg 7380 atttgttcaa ataatttgag ttttgtcgaa taattactct tcgatttgtg atttctatct 7440 agatctggtg ttagtttcta gtttgtgcga tcgaatttgt cgattaatct gagtttttct 7500 gattaacagg attcttctaa cggacttctc ctctctggat ctgataacaa ctctccttct 7560 gatgatgttg gtgctcctgc tgatgtgaga gatagaatcg attctgtggt gaacgatgat 7620 •62- 151910.序列表.doc
201127957 gctcaaggta ctgctaacct cgctggtgat aataacggtg gaggtgataa caatggtgga ggaagaggtg gaggtgaagg tagaggaaac gctgatgcta ctttcactta cagaccatct gtgcctgctc atagaagagc tagagagtct cctctctctt ctgatgctat cttcaagcag tctcacgctg gacttttcaa cctctgtgtg gtggttctta tcgctgtgaa ctctagactc atcatcgaga acctcatgaa gtacggatgg ctcatcagaa ctgatttctg gttctcttct agatctctca gagattggcc tcttttcatg tgctgcatct cactctcaat cttccctctc gctgctttta ctgttgagaa gctcgtgctc cagaagtata tcgctgaacc tgtggtgatc ttcctccaca tcatcatcac tatgactgag gttctctacc ctgtttacgt gactctcaga tgcgattctg ctttcctctc tggtgttact cttatgctcc tcacttgcat tgtgtggctt aagctcgtgt cttacgctca cacttcttac gatatcagat ctctcgctaa cgctgctgat aaggctaacc ctgaagtgtc ttactacgtg tctctcaagt ctctcgctta cttcatggtt gctcctacac tttgttacca gccatcttac cctagatctg cttgcattag aaagggatgg gtggcaagac aattcgctaa gttggtgatc ttcactggat tcatgggatt catcatcgag cagtacatca accctattgt gagaaactct aagcaccctc tcaagggtga tcttctctac gctatcgaga gagttcttaa gctctctgtg cctaaccttt atgtgtggct ctgcatgttc tactgtttct tccacctctg gcttaacatc cttgctgagt tgctttgctt cggagataga gagttctaca aggattggtg gaacgctaag tctgttggag attattggag aatgtggaac atgcctgtgc ataagtggat ggtgcgtcac atctacttcc cttgcctcag atctaagatc cctaagactc tcgctatcat tatcgctttc ctcgtgtctg ctgttttcca tgagttgtgt atcgctgttc cttgcagact tttcaagctt tgggctttcc tcggaatcat gttccaggtt ccactcgtgt tcatcactaa ctacctccaa gagagattcg gatctactgt tggaaacatg attttctggt tcattttctg catcttcgga cagcctatgt gcgttctcct ctactaccac 151910-序列表.doc •63· 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 8280 8340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 201127957 gatctcatga acagaaaggg atctatgtct taatgaagga tccacccagc tttcttgtac 9000 aaagtggtga tgggttcgaa atcgataagc ttggatcctc tagagtcctg ctttaatgag 9060 atatgcgaga cgcctatgat cgcatgatat ttgctttCEia ttctgttgtg cacgttgtaa 9120 aaaacctgag catgtgtagc tcagatcctt accgccggtt tcggttcatt ctaatgaata 9180 tatcacccgt tactatcgta tttttatgaa taatattctc cgttceiattt actgattgta 9240 ccctactact tatatgtaca atattaaaat gaaaaceiata tattgtgctg aataggttta 9300 tagcgacatc tatgatagag cgccacaata acaaacaatt gcgttttatt attacaaatc 9360 caattttaaa aaaagcggca gaaccggtca aacctaaaag actgattaca· taaatcttat 9420 tcaaatttca aaaggcccca ggggctagta tctacgacac accgagcggc gaactaataa 9480 cgttcactga agggaactcc ggttccccgc cggcgcgcat gggtgagatt ccttgaagtt 9540 gagtattggc cgtccgctct accgaaagtt acgggcacca ttcaacccgg tccagcacgg 9600 cggccgggta accgacttgc tgccccgaga attatgcagc atttttttgg tgtatgtggg 9660 ccccaaatga agtgcaggtc aaaccttgac agtgacgaca aatcgttggg cgggtccagg 9720 gcgaattttg cgacaacatg tcgaggctca gcaggacctg caggcatgca agctagctta 9780 ctagtgatgc atattctata gtgtcaccta aatctgcggc cgcctgcagg tcgatatggg 9840 agagctccca acgcgttgga tgcatagctt gagtattcta tagtgtcacc taaatagctt 9900 ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca 9960 caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact 10020 cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggaaacctgt cgtgccagct 10080 gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggg ctgagtggct 10140 ccttcaacgt tgcggttctg tcagttccaa acgtaaaacg gcttgtcccg cgtcatcggc 10200 gggggtcata acgtgactcc cttaattctc cgctcatgat cagattgtcg tttcccgcct 10260 •64·
151910-序列表.doc
201127957 tcagtttaaa ctatcagtgt ttgacaggat atattggcgg gtaaacctaa gagaaaagag cgtttattag aataatcgga tatttaaaag ggcgtggiaaa ggtttatccg ttcgtccatt tgtatgtgca tgccaaccac agggttcccc tcgggagtgc ttggcattcc gtgcgataat gacttcigtt caaccaccca aacgtcggaa agcctgacga cggagcagca ttccaaaaag atcccttggc tcgtctgggt cggctagaag gtcgagtggg ctgctgtggc ttgatccctc aacgcggtcg cggacgtagc gcagcgccga aaaatccicg atcgcaaatc cgacgctgtc gaaaatcgtg atctgcttgt cgctctttcg gccgacgtcc tggccagtca tcacgcgcca aagttccgtc acaggatgat ctggcgcgag ttgctggatc tcgccttcaa tccgggtctg tggcgggaac tccacgaaaa tatccgaacg cagcaagatg tcgacggatc ttttccgctg cataaccctg cttcggggtc attatagcga ttttttcggt atatccatcc tttttcgcac gatatacagg attttgccaa agggttcgtg tagactttcc ttggtgtatc caacggcgtc agccgggcag gataggtgaa gtaggcccac ccgcgagcgg gtgttccttc ttcactgtcc cttattcgca cctggcggtg ctcaacggga atcctgctct gcgaggctgg ccggctaccg ccggcgtaac agatgagggc aagcggatgg ctgatgaaac caagccaacc aggggtgatg ctgccaactt actgatttag tgtatgatgg tgtttttgag gtgctccagt ggcttctgtt tctatcagct gtccctcctg ttcagctact gacggggtgg tgcgtaacgg caaaagcacc gccggacatc agcgctatct ctgctctcac tgccgtaaaa catggcaact gcagttcact tacaccgctt ctcaacccgg tacgcaccag aaaatcattg atatggccat gaatggcgtt ggatgccggg caacagcccg cattatgggc gttggcctca acacgatttt acgtcactta aaaaactcag gccgcagtcg gtaacctcgc gcatacagcc gggcagtgac gtcatcgtct gcgcggaaat ggacgaacag tggggctatg tcggggctaa atcgcgccag cgctggctgt tttacgcgta tgacagtctc cggaagacgg ttgttgcgca cgtattcggt gaacgcacta 151910·序列表.doc -65- 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 201127957 tggcgacgct ggggcgtctt atgagcctgc tgtcaccctt tgacgtggtg atatggatga 11640 cggatggctg gccgctgtat gaatcccgcc tgaagggaaa gctgcacgta atcagcaagc 11700 gatatacgca gcgaattgag cggcataacc tgaatctgag gcagcacctg gcacggctgg 11760 gacggaagtc gctgtcgttc tcaaaatcgg tggagctgca tgacaaagtc atcgggcatt 11820 atctgaacat aaaacactat caataagttg gagtcattac ccaaccagga agggcagccc 11880 acctatcaag gtgtactgcc ttccagacga acgaagagcg attgaggaaa aggcggcggc 11940 ggccggcatg agcctgtcgg cctacctgct ggccgtcggc cagggctaca aaatcacggg 12000 cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc tgggccgcct 12060 gggcggcctg ctgeiaactct ggctcaccga cgacccgcgc acggcgcggt tcggtgatgc 12120 cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg gcaaggtcat 12180 gatgggcgtg gtccgcccga gggcagagcc atgacttttt tagccgctaa aacggccggg 12240 gggtgcgcgt gattgccaag cacgtcccca tgcgctccat caagaagagc gacttcgcgg 12300 agctggtatt cgtgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg 12360 tctacgggac cgacttcatt gccgataagg tggattatct ggacaccaag gcaccaggcg 12420 ggtcaaatca ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag 12480 ggtgaatgaa tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt 12540 tttccgccga ggatgccgaa accatcgceia gccgcaccgt catgcgtgcg ccccgcgaaa 12600 ccttccagtc cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg 12660 tgcaactggc tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgtc 12720 tcgaacagga ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga 12780 cgaccaagaa gcgaaaaacc gccggcgagg acctggcaaa acaggtcagc gaggccaagc 12840 aggccgcgtt gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg 12900 •66-
151910·序列表.doc
201127957 atattgcgcc gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc tgttcaccac gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc acgtcaacaa ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg aactggtgtg gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca ccttcacgtt ctacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca cgaaggccga ggaatgcctg tcgcgcctac aggcgacggc gatgggcttc acgtccgacc gcgttgggca cctggaatcg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca agaaaacgtc ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg accactacac gaaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga tgttcgacta tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc tcatgtgcgg atcggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct gcgaagagtt gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc attgcaaacg ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt tactggcatt tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct cgggacgcac ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt gattaaggct cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg attgtcggcc ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa aaagcccatg gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat cgacggcgag atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca caaggcgcat ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg tatgctgctg cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc aacgggaatc tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg 151910-序列表.doc •67- 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 201127957 gagcttgttg tttatttcgg tctaccgcct tgtgcagccg ctgatggtcg tgttcatctc gatggcggtc ctgggggcta tttgcggaac aaacgcagcg ctagatcctg tcggcgtcgc gttcggaacc gtgctgaccc gcaagtggca ctggcaactg gcggccggag gacttctgct aatcccgatg cctacaggaa ccaatgttct gggtttaacc tacttccttt ggttccgggg cttactgggc tttctcagcc gggatggcgc cggtgtgaaa taccgcacag atgcgtaagg tcctcgctca ctgactcgct gcgctcggtc tcaaaggcgg taatacggtt atccacagaa gcaaaaggcc agcaaaaggc caggaaccgt aggctccgcc cccctgacga gcatcacaaa ccgacaggac tataaagata ccaggcgttt gttccgaccc tgccgcttac cggatacctg ctttctcaat gctcacgctg taggtatctc ggctgtgtgc acgaaccccc cgttcagccc cttgagtcca acccggtaag acacgactta attagcagag cgaggtatgt aggcggtgct ggctacacta gaaggacagt atttggtatc aaaagagttg gtagctcttg atccggcaaa gccgggcggg gtcgcggcga cggtaggcgc 14280 tgccgctctg ctaggtagcc cgatacgatt 14340 tgcgggcgtg gcgctgttgg tgttgacacc 14400 agcgggcctg gcgggggcgg tttccatggc 14460 acctcccgtg cctctgctca cctttaccgc 14520 cgttccagta gctttagtgt ttgatccgcc 14580 cggcctggcg tggctcggcc tgatcggagc 14640 gatctcgcga ctcgaaccta cagttgtttc 14700 taagaagcta ttgccgccga tcttcatatg 14760 agaaaatacc gcatcaggcg ctcttccgct 14820 gttcggctgc ggcgagcggt atcagctcac 14880 tcaggggata acgcaggaaa gaacatgtga 14940 aaaaaggccg cgttgctggc gtttttccat 15000 aatcgacgct caagtcagag gtggcgaaac 15060 ccccctggaa gctccctcgt gcgctctcct 15120 tccgcctttc tcccttcggg aagcgtggcg 15180 agttcggtgt aggtcgttcg ctccaagctg 15240 gaccgctgcg ccttatccgg taactatcgt 15300 tcgccactgg cagcagccac tggtaacagg 15360 acagagttct tgaagtggtg gcctaactac 15420 tgcgctctgc tgaagccagt taccttcgga 15480 caaaccaccg ctggtagcgg tggttttttt 15540 -68 - 151910-序列表.doc
201127957 gtttgcaagc agcagattac gcgcagaaaa aaaggatatc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa aactcacgtt giagggatttt ggtcatgaga ttatcaeiaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc cagtctatta aacaagtggc agcaacggat tcgcaaacct gtcacgcctt ttgtgccaaa agccgcgcca ggtttgcgat ccgctgtgcc aggcgttagg cgtcatatga agatttcggt gatccctgag caggtggcgg aaacattgga tgctgagaac catttcattg ttcgtgaagt gttcgatgtg cacctatccg accaaggctt tgaactatct accagaagtg tgagccccta ccggaaggat tacatctcgg atgatgactc tgatgaagac tctgcttgct atggcgcatt catcgaccaa gagcttgtcg ggaagattga actcaactca acatggaacg atctagcctc tatcgaacac attgttgtgt cgcacacgca ccgaggcaaa ggagtcgcgc acagtctcat cgaatttgcg aaaaagtggg cactaagcag acagctcctt ggcatacgat tagagacaca aacgaacaat gtacctgcct gcaatttgta cgcaaaatgt ggctttactc tcggcggcat tgacctgttc acgtataaaa ctagacctca agtctcgaac gaaacagcga tgtactggta ctggttctcg ggagcacagg atgacgccta acaattcatt caagccgaca ccgcttcgcg gcgcggctta attcaggagt taaacatcat gagggaagcg gtgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac 151910·序列表.doc -69- 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 201127957 aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga 16920 gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta 16980 tccagctaag cgcgaactgc aatttggaga atggcagcgc aatgacattc ttgcaggtat 17040 cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca 17100 tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga 17160 tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg 17220 cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa 17280 aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca 17340 gcccgtcata cttgaagcta ggcaggctta tcttggacaa gaagatcgct tggcctcgcg 17400 cgcagatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca aggtagtcgg 17460 caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag 17520 cgttagagag ctggggaaga ctatgcgcga tctgttgaag gtggttctaa gcctcgtact 17580 tgcgatggca tcggggcagg cacttgctga cctgccaatt gttttagtgg atgaagctcg 17640 tcttccctat gactactccc catccaacta cgacatttct ccaagcaact acgacaactc 17700 cataagcaat tacgacaata gtccatceiaa ttacgacaac tctgagagca actacgataa 17760 tagttcatcc aattacgaca atagtcgcaa cggaeiatcgt aggcttatat atagcgcaaa 17820 tgggtctcgc actttcgccg gctactacgt cattgccaac aatgggacaa cgaacttctt 17880 ttccacatct ggcaaaagga tgttctacac cccaaaaggg gggcgcggcg tctatggcgg 17940 caaagatggg agcttctgcg gggcattggt cgtcataaat ggccaatttt cgcttgccct 18000 gacagataac ggcctgaaga tcatgtatct aagcaactag cctgctctct aataiaaatgt 18060 taggagcttg gctgccattt ttggggtgag gccgttcgcg gccgaggggc gcagcccctg 18120 gggggatggg aggcccgcgt tagcgggccg ggagggttcg agaagggggg gcacccccct 18180 -70·
1519丨0·序列表.doc
201127957 tcggcgtgcg cggtcacgcg ccagggcgca gccctggtta aaeiacaaggt ttataaatat tggtttaaaa gcaggttaaa agacaggtta gcggtggccg aaaaacgggc ggaaaccctt gcaaatgctg gattttctgc ctgtggacag cccctcaaat gtcaataggt gcgcccctca tctgtcagca ctctgcccct caagtgtcaa ggatcgcgcc cctcatctgt cagtagtcgc gcccctcaag tgtcaatacc gcagggcact tatccccagg cttgtccaca tcatctgtgg gaaactcgcg taaaatcagg cgttttcgcc gatttgcgag gctggccagc tccacgtcgc cggccgaaat cgagcctgcc cctcatctgt caacgccgcg ccgggtgagt cggcccctca agtgtcaacg tccgcccctc atctgtcagt gagggccaag ttttccgcga ggtatccaca acgccggcgg ccggccgcgg tgtctcgcac acggcttcga cggcgtttct ggcgcgtttg cagggccata gacggccgcc agcccagcgg cgagggcaac cagcccggtg agcgtcggaa aggg <210> 29 <211〉 18784 <212〉 DNA 〈213〉人工序列 <220> <223〉人工 <400> 29 gtcgacatcg tcaacgttca cttctaaaga aatagcgcca ctcagcttcc tcagcggctt tatccagcga tttcctatta tgtcggcata gttctcaaga tcgacagcct gtcacggtta agcgagaaat gaataagaag gctgataatt cggatctctg cgaggagatg atatttgatc acaggcagca acgctctgtc atcgttacaa tcaacatgct accctccgcg agatcatccg tgtttcaaac ccggcagctt agttgccgtt cttccgaata gcatcgggta acatgagcaa agtctgccgc cttacaacgg ctctcccgct gacgccgtcc cggactgatg ggctgcctgt 151910-序列表.doc • 71 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18784 60 120 180 240 300 360 201127957 atcgagtggt gattttgtgc cgagctgccg gtcggggagc tgttggctgg ctggtggcag 420 gatatattgt ggtgtaaaca aattgacgct tagacaactt aataacacat tgcggacgtt 480 tttaatgtac tgaattcgcc gctcggtgtg tcgtagatac tagcccctgg ggcacttttg 540 aaatttgaat aagatttatg taatcagtct tttaggtttg accggttctg ccgctttttt 600 taaaattgga tttgtaataa taaaacgcaa ttgtttgtta ttgtggcgct ctatcataga 660 tgtcgctata aacctattca gcacaatata ttgttttcat tttaatattg tacatataag 720 tagtagggta caatcagtaa attgaacgga gaatattatt cataaaaata cgatagtaac 780 gggtgatata ttcattagaa tgaaccgaaa ccggcggtaa ggatctgagc tacacatgct 840 caggtttttt acaacgtgca caacagaatt gaaagcaaat atcatgcgat cataggcgtc 900 tcgcatatct cattaaacaa gtgaagattt gattcaaact ccattgagag ccctgactat 960 gcattcggtt tgacccttcc aggttgagag acgatagccc cctacctteia ttaaggggcc 1020 ccccctcgag gtcgacggta tcgataagct tgatatcgaa ttcctgcagc cagggggatc 1080 ccccgggtca tcagatctcg gtgacgggca ggaccggacg gggcggtacc ggcaggctga 1140 agtccagctg ccagaaaccc acgtcatgcc agttcccgtg cttgaagccg gccgcccgca 1200 gcatgccgcg gggggcatat ccgagcgcct cgtgcatgcg cacgctcggg tcgttgggca 1260 gcccgatgac agcgaccacg ctcttgaagc cctgtgcctc cagggacttc agcaggtggg 1320 tgtagagcgt ggagcccagt cccgtccgct ggtggcgggg ggagacgtac acggtcgact 1380 cggccgtcca gtcgtaggcg ttgcgtgcct tccaggggcc cgcgtaggcg atgccggcga 1440 cctcgccgtc cacctcggcg acgagccagg gatagcgctc ccgcagacgg acgaggtcgt 1500 ccgtccactc ctgcggttcc tgcggctcgg tacggaagtt gaccgtgctt gtctcgatgt 1560 agtggttgac gatggtgcag accgccggca tgtccgcctc ggtggcacgg cggatgtcgg 1620 ccgggcgtcg ttctgggctc atggtagatc ccctcgagag agatagattt gtagagagag 1680 -72-
151910-序列表.doc
201127957 actggtgatt tcagcgtgtc ctctccaaat gaaatgaact tccttatata gaggaaggtc ttgcgaagga tagtgggatt gtgcgtcatc ccttacgtca gtggagatat cacatcaatc cacttgcttt gaagacgtgg ttggaacgtc ttctttttcc acgatgctcc tcgtgggtgg gggtccatct ttgggaccac tgtcggcaga ggcatcttga acgatagcct ttcctttatc gcaatgatgg catttgtagg tgccaccttc cttttctact gtccttttga tgaagtgaca gatagctggg caatggaatc cgaggaggtt tcccgatatt accctttgtt gaaaagtctc aatagccctt tggtcttctg agactgtatc tttgatattc ttggagtaga cgagagtgtc gtgctccacc atgttatcac atcaatccac ttgctttgaa gacgtggttg gaacgtcttc tttttccacg atgctcctcg tgggtggggg tccatctttg ggaccactgt cggcagaggc atcttgaacg atagcctttc ctttatcgca atgatggcat ttgtaggtgc caccttcctt ttctactgtc cttttgatga agtgacagat agctgggcaa tggaatccga ggaggtttcc cgatattacc ctttgttgaa aagtctcaat agccctttgg tcttctgaga ctgtatcttt gatattcttg gagtagacga gagtgtcgtg ctccaccatg ttgctgatag tgaccttagg cgacttttga acgcgcaata atggtttctg acgtatgtgc ttagctcatt aaactccaga aacccattaa cgcttacaat ttccattcgc cattcaggct gcgcaactgt tgggaagggc gatcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg acggccagtg aattgtaata cgactcacta tagggcgaat tgggcccgac gtcgcatgct cccggccgcc atggccgcgg gatatcacta gtgcggccgc tcgacgaatt aattccaatc ccacaaaaat ctgagcttaa cagcacagtt gctcctctca gagcagaatc gggtattcaa caccctcata tcaactacta cgttgtgtat aacggtccac atgccggtat atacgatgac tggggttgta caaaggcggc aacaaacggc gttcccggag ttgcacacaa gaaatttgcc actattacag 151910-序列表.doc -73- 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 201127957 aggcaagagc agcagctgac gcgtacacaa tccccaaagg agaagctcaa ctcaagccca caaagcaaaa agcccactgg ctcacgctag caaaagagat ctcctttgcc ccggagatta taggaaggaa gttcgaaggt gaaggtgacg ttagcctctt caatttcaga aagaatgctg caggtctcat caagacgatc tacccgagta agaaggttaa agatgcagtc aaaagattca acatatttct caagatcaga agtactattc aaccaaggca agtaatagag attggagtct ccatgcatgg agtctaagat tcaaatcgag gaacagttca tacagagtct tttacgactc gtggagcacg acactctggt ctactccaaa agggctattg agacttttca acaaaggata ccagctatct gtcacttcat cgaaaggaca catcattgcg ataaaggaeia ggctatcatt gatggacccc cacccacgag gagcatcgtg aagcaagtgg attgatgtga catctccact ccttcgcaag acccttcctc tatataagga aggaattcgg taccccatca caagtttgta ttaaaaaaaa ccatggcatg tcattacgga cagcttcaac ctagagcatg tagagttgtg caagtcagca aacagacagg ttgaacttca 3060 agagctttgc taaggcccta acaagcccac 3120 gaaccaaaag gcccagcagt gatccagccc 3180 caatggacga tttcctctat ctttacgatc 3240 acactatgtt caccactgat aatgagaagg 3300 acccacagat ggttagagag gcctacgcag 3360 acaatctcca ggagatcaaa taccttccca 3420 ggactaattg catcaagaac acagagaaag 3480 cagtatggac gattcaaggc ttgcttcata 3540 ctaaaaaggt agttcctact gaatctaagg 3600 gatctaacag aactcgccgt gaagactggc 3660 aatgacaage agaaaatctt cgtcaacatg 3720 aatgtcaaag atacagtctc agaagaccaa 3780 atttcgggaa acctcctcgg attccattgc 3840 gtagaaaagg aaggtggctc ctacaaatgc 3900 caagatctct ctgccgacag tggtcccaaa 3960 gaaaaagaag acgttccaac cacgtcttca 4020 gacgtaaggg atgacgcaca atcccactat 4080 agttcatttc atttggagag gacacgctcg 4140 caaaaaagca ggctgcggcc gcttgctccc 4200 caacagcaac agacttgtgc acctcatctt 4260 aaggctgcta ctgctgttac tgtaaatttc 4320 -74· 151910·序列表.doc
201127957 tgtgttcctt attctctcaa aatcttcgat tttgttttcg ttcgatccca atttcgtata tgttctttgg tttagattct gtteiatctta gatcgaagac gattttctgg gtttgatcgt tagatatcat ctteiattctc gattagggtt tcatagatat catccgattt gttcaaataa tttgagtttt gtcgaataat tactcttcga tttgtgattt ctatctagat ctggtgttag tttctagttt gtgcgatcga atttgtcgat taatctgagt ttttctgatt aacaggctgg aggatctctt cttgttctct ctggacttac tctcgctgga actgttatcg ctctcactat cgctacacct cttctcgtta tcttctctcc tgttctcgtt cctgctgtga tcactatctt ccttctcgga gctggatttc ttgcttctgg tggatttgga gttgctgctc tctctgttct ctcttggatc tacagatacc tcactggaaa acatcctcca ggtgctgatc aacttgagtc tgctaagact aagctcgctt ctaaggctag agagatgaag gatagagcag agcaattctc ttgtcagcct gttgctggat ctcagacttc ttaatgaaca tatggtcctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc cgttcaattt actgattgta ccctactact tatatgtaca atattaaaat gaaaacaata tattgtgctg aataggttta tagcgacatc tatgatagag cgccacaata acaaacaatt gcgttttatt attacaaatc caattttaaa aaaagcggca gaaccggtca aacctaaaag actgattaca taaatcttat tcaaatttca aaaggcccca ggggctagta tctacgacac accgagcggc gaactaataa cgttcactga agggaactcc ggttccccgc cggcgcgcat gggtgagatt ccttgaagtt gagtattggc cgtccgctct accgaaagtt acgggcacca ttcaacccgg tccagcacgg cggccgggta accgacttgc tgccccgaga attatgcagc atttttttgg tgtatgtggg ccccaaatga agtgcaggtc aaaccttgac agtgacgaca aatcgttggg cgggtccagg 151910·序列表.doc -75- 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 201127957 gcgeiattttg cgacaacatg tcgaggctca gcaggacctg caggcatgca agctagctta 5700 ctagtgatgc atattctata gtgtcaccta aatcttcgac gaattaattc caatcccaca 5760 aaaatctgag cttaacagca cagttgctcc tctcagagca gaatcgggta ttcaacaccc 5820 tcatatcaac tactacgttg tgtataacgg tccacatgcc ggtatatacg atgactgggg 5880 ttgtacaaag gcggcaacaa acggcgttcc cggagttgca cacaagaaat ttgccactat 5940 tacagaggca agagcagcag ctgacgcgta cacaacaagt cagcaaacag acaggttgaa 6000 cttcatcccc aaaggagaag ctcaactcaa gcccaagagc tttgctaagg ccctaacaag 6060 cccaccaaag caaaaagccc actggctcac gctaggaacc aaaaggccca gcagtgatcc 6120 agccccaaaa gagatctcct ttgccccgga gattacaatg gacgatttcc tctatcttta 6180 cgatctagga aggaagttcg aaggtgaagg tgacgacact atgttcacca ctgataatga 6240 gaaggttagc ctcttcaatt tcagaaagaa tgctgaccca cagatggtta gagaggccta 6300 cgcagcaggt ctcatcaaga cgatctaccc gagtaacaat ctccaggaga tcaaatacct 6360 tcccaagaag gttaaagatg cagtcaaaag attcaggact aattgcatca agaacacaga 6420 gaaagacata tttctcaaga tcagaagtac tattccagta tggacgattc aaggcttgct 6480 tcataaacca aggcaagtaa tagagattgg agtctctaaa aaggtagttc ctactgaatc 6540 taaggccatg catggagtct aagattcaaa tcgaggatct aacagaactc gccgtgaaga 6600 ctggcgaaca gttcatacag agtcttttac gactcaatga caagaagaaa atcttcgtca 6660 acatggtgga gcacgacact ctggtctact ccaaaaatgt caaagataca gtctcagaag 6720 accaaagggc tattgagact tttcaacaaa ggataatttc gggaaacctc ctcggattcc 6780 attgcccagc tatctgtcac ttcatcgaaa ggacagtaga aaaggaaggt ggctcctaca 6840 aatgccatca ttgcgataeia ggaaaggcta tcattcaaga tctctctgcc gacagtggtc 6900 ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt ccaaccacgt 6960 •76·
151910·序列表.doc
201127957 cttcaaagca agtggattga tgtgacatct ccactgacgt aagggatgac gcacaatccc actatccttc gcaagaccct tcctctatat aaggaagttc atttcatttg gagaggacac gggatccttg ctccgttgLaa aaaaaccatg gctatcctcg attctgctgg tgttactact gtgactgaga atggtggtgg agagttcgtt gatctcgata gactcagaag aagaaagtct agatctgtaa atttctgtgt tccttattct ctcaaaatct tcgattttgt tttcgttcga tcccaatttc gtatatgttc tttggtttag attctgttaa tcttagatcg aagacgattt tctgggtttg atcgttagat atcatcttaa ttctcgatta gggtttcata gatatcatcc gatttgttca aataatttga gttttgtcga ataattactc ttcgatttgt gatttctatc tagatctggt gttagtttct agtttgtgcg atcgaatttg tcgattaatc tgagtttttc tgattaacag gattcttcta acggacttct cctctctgga tctgataaca actctccttc tgatgatgtt ggtgctcctg ctgatgtgag agatagaatc gattctgtgg tgaacgatga tgctcaaggt actgctaacc tcgctggtga taataacggt ggaggtgata acaatggtgg aggaagaggt ggaggtgaag gtagaggaaa cgctgatgct actttcactt acagaccatc tgtgcctgct catagaagag ctagagagtc tcctctctct tctgatgcta tcttcaagca gtctcacgct ggacttttca acctctgtgt ggtggttctt atcgctgtga actctagact catcatcgag aacctcatga agtacggatg gctcatcaga actgatttct ggttctcttc tagatctctc agagattggc ctcttttcat gtgctgcatc tcactctcaa tcttccctct cgctgctttt actgttgaga agctcgtgct ccagaagtat atcgctgaac ctgtggtgat cttcctccac atcatcatca ctatgactga ggttctctac cctgtttacg tgactctcag atgcgattct gctttcctct ctggtgttac tcttatgctc ctcacttgca ttgtgtggct taagctcgtg tcttacgctc acacttctta cgatatcaga tctctcgcta acgctgctga taaggctaac cctgaagtgt cttactacgt gtctctcaag tctctcgctt acttcatggt 151910·序列表.doc -77- 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 8280 201127957 tgctcctaca ctttgttacc agccatctta ccctagatct gcttgcatta gaaagggatg 8340 ggtggcaaga caattcgcta agttggtgat cttcactgga ttcatgggat teatcatcga 8400 gcagtacatc aaccctattg tgagaaactc taagcaccct ctcaagggtg atetteteta 8460 egetategag agagttetta agctctctgt gcctaacctt tatgtgtggc tctgcatgtt 8520 ctactgtttc ttccacctct ggcttaacat ccttgctgag ttgctttgct teggagatag 8580 agagttctac aaggattggt ggaacgctaa gtctgttgga gattattgga gaatgtggaa 8640 catgcctgtg cataagtgga tggtgcgtca catctacttc ccttgcctca gatetaagat 8700 ccctaagact ctcgctatca ttatcgcttt cctcgtgtct gctgttttcc atgagttgtg 8760 tatcgctgtt ccttgcagac ttttcaagct ttgggctttc oteggaatea tgttccaggt 8820 tccactcgtg ttcatcacta actacctcca agagagattc ggatctactg ttggaaacat 8880 gattttctgg ttcattttct gcatcttcgg acagcctatg tgcgttctcc tctactacca 8940 cgatctcatg aacagaaagg gatctatgtc ttaatgaagg atccacccag ctttcttgta 9000 caaagtggtg atgggttcga aategataag cttggatcct ctagagtcct gctttaatga 9060 gatatgegag acgcctatga tcgcatgata tttgctttca attctgttgt gcacgttgta 9120 aaaaacctga gcatgtgtag ctcagatcct taccgccggt ttcggttcat tetaatgaat 9180 atatcacccg ttactatcgt atttttatga ataatattet ccgttcaatt tactgattgt 9240 accctactac ttatatgtac aatattaaaa tgaaaacaat atattgtgct gaataggttt 9300 atagcgacat ctatgataga gcgccacaat aacaaacaat tgcgttttat tattacaaat 9360 ccaattttaa aaaaagcggc agaaccggtc aaacctaaaa gactgattac ataaatetta 9420 ttcaaatttc aaaaggcccc aggggctagt atctacgaca caccgagcgg cgaactaata 9480 acgttcactg aagggaactc cggttccccg ccggcgcgca tgggtgagat teettgaagt 9540 tgagtattgg ccgtccgctc taccgaaagt tacgggcacc attcaacccg gtccagcacg 9600 • 78.
151910·序列表.doc
201127957 gcggccgggt aaccgacttg ctgccccgag aattatgcag catttttttg gtgtatgtgg gccccaaatg aagtgcaggt caaaccttga cagtgacgac aaatcgttgg gcgggtccag ggcgaatttt gcgacaacat gtcgaggctc agcaggacct gcaggcatgc aagctagctt actagtgatg catattctat agtgtcacct aaatctgcgg ccgcctgcag gtcgatatgg gagagctccc aacgcgttgg atgcatagct tgagtattct atagtgtcac ctaaatagct tggcgtaatc atggtcatag ctgtttcctg tgtgaaattg ttatccgctc acaattccac acaacatacg agccggaagc ataaagtgta aagcctgggg tgcctaatga gtgagctaac tcacattaat tgcgttgcgc tcactgcccg ctttccagtc gggaaacctg tcgtgccagc tgcattaatg aatcggccaa cgcgcgggga gaggcggttt gcgtattggg gctgagtggc tccttcaacg ttgcggttct gtcagttcca aacgtaaaac ggcttgtccc gcgtcatcgg cgggggtcat aacgtgactc ccttaattct ccgctcatga tcagattgtc gtttcccgcc ttcagtttaa actatcagtg tttgacagga tatattggcg ggtaaaccta agagaaaaga gcgtttatta gaataatcgg atatttaaaa gggcgtgaeia aggtttatcc gttcgtccat ttgtatgtgc atgccaacca cagggttccc ctcgggagtg cttggcattc cgtgcgataa tgacttctgt tcaaccaccc aaacgtcgga aagcctgacg acggagcagc attccaaaaa gatcccttgg ctcgtctggg tcggctagaa ggtcgagtgg gctgctgtgg cttgatccct caacgcggtc gcggacgtag cgcagcgccg aaaaatcctc gatcgcaaat ccgacgctgt cgaaaatcgt gatctgcttg tcgctctttc ggccgacgtc ctggccagtc atcacgcgcc aaagttccgt cacaggatga tctggcgcga gttgctggat ctcgccttca atccgggtct gtggcgggaa ctccacgaaa atatccgaac gcagcaagat gtcgacggat cttttccgct gcataaccct gcttcggggt cattatagcg attttttcgg tatatccatc ctttttcgca cgatatacag gattttgcca aagggttcgt gtagactttc cttggtgtat ccaacggcgt 151910·序列表.doc •79· 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 201127957 cagccgggca ccttattcgc gccggcgtaa gctgccaact ttctatcagc cgccggacat ttacaccgct tggatgccgg aaaaaactca tgcgcggaaa ttttacgcgt atggcgacgc acggatggct cgatatacgc ggacggaagt tatctgaaca cacctatcaa cggccggcat gcgtcgtgga tgggcggcct ccacgatcct tgatgggcgt ggataggtga agtaggccca acctggcggt gctcaacggg cagatgaggg caagcggatg tactgattta gtgtatgatg tgtccctcct gttcagctac cagcgctatc tctgctctca tctcaacccg gtacgcacca gcaacagccc gcattatggg ggccgcagtc ggtaacctcg tggacgaaca gtggggctat atgacagtct ccggaagacg tggggcgtct tatgagcctg ggccgctgta tgaatcccgc agcgaattga gcggcataac cgctgtcgtt ctcaaaatcg taaaacacta tcaataagtt ggtgtactgc cttccagacg gagcctgtcg gcctacctgc ctatgagcac gtccgcgagc gctgaaactc tggctcaccg cgccctgctg gcgaagatcg ggtccgcccg agggcagagc cccgcgagcg ggtgttcctt aatcctgctc tgcgaggctg gctgatgaaa ccaagccaac gtgtttttga ggtgctccag tgacggggtg gtgcgtaacg ctgccgtaaa acatggcaac gaaaatcatt gatatggcca cgttggcctc aacacgattt cgcatacagc cgggcagtga gtcggggcta aatcgcgcca gttgttgcgc acgtattcgg ctgtcaccct ttgacgtggt ctgaagggaa agctgcacgt ctgaatctga ggcagcacct gtggagctgc atgacaaagt ggagtcatta cccaaccagg aacgaagagc gattgaggaa tggccgtcgg ccagggctac tggcccgcat caatggcgac acgacccgcg cacggcgcgg aagagaagca ggacgagctt catgactttt ttagccgcta cttcactgtc 10980 gccggctacc 11040 caggggtgat 11100 tggcttctgt 11160 gcaaaagcac 11220 tgcagttcac 11280 tgaatggcgt 11340 tacgtcactt 11400 cgtcatcgtc 11460 gcgctggctg 11520 tgaacgcact 11580 gatatggatg 11640 aatcagcaag 11700 ggcacggctg 11760 catcgggcat 11820 aagggcagcc 11880 aaggcggcgg 11940 aaaatcacgg 12000 ctgggccgcc 12060 ttcggtgatg 12120 ggcaaggtca 12180 aaacggccgg 12240 • 80 · 151910-序列表-doc
201127957 gggg^gcgcg tgattgccaa gcacgtcccc atgcgctcca tcaagaagag cgacttcgcg gagctggtat tcgtgcaggg caagattcgg aataccaagt acgagaagga cggccagacg gtctacggga ccgacttcat tgccgataag gtggattatc tggacaccaa ggcaccaggc gggtcaaatc aggaataagg gcacattgcc ccggcgtgag tcggggcaat cccgcaagga gggtgaatga atcggacgtt tgaccggaag gcatacaggc aagaactgat cgacgcgggg ttttccgccg aggatgccga aaccatcgca agccgcaccg tcatgcgtgc gccccgcgaa accttccagt ccgtcggctc gatggtccag caagctacgg ccaagatcga gcgcgacagc gtgcaactgg ctccccctgc cctgcccgcg ccatcggccg ccgtggagcg ttcgcgtcgt ctcgaacagg aggcggcagg tttggcgaag tcgatgacca tcgacacgcg aggaactatg acgaccaaga agcgaaaaac cgccggcgag gacctggcaa aacaggtcag cgaggccaag caggccgcgt tgctgaaaca cacgaagcag cagatcaagg aaatgcagct ttccttgttc gatattgcgc cgtggccgga cacgatgcga gcgatgccaa acgacacggc ccgctctgcc ctgttcacca cgcgcaacaa gaaaatcccg cgcgaggcgc tgcaaaacaa ggtcattttc cacgtcaaca aggacgtgaa gatcacctac accggcgtcg agctgcgggc cgacgatgac gaactggtgt ggcagcaggt gttggagtac gcgaagcgca cccctatcgg cgagccgatc accttcacgt tctacgagct ttgccaggac ctgggctggt cgatcaatgg ccggtattac acgaaggccg aggaatgcct gtcgcgccta caggcgacgg cgatgggctt cacgtccgac cgcgttgggc acctggaatc ggtgtcgctg ctgcaccgct tccgcgtcct ggaccgtggc aagaaaacgt cccgttgcca ggtcctgatc gacgaggaaa tcgtcgtgct gtttgctggc gaccactaca cgaaattcat atgggagaag taccgcaagc tgtcgccgac ggcccgacgg atgttcgact atttcagctc gcaccgggag ccgtacccgc tcaagctgga aaccttccgc ctcatgtgcg gatcggattc cacccgcgtg aagaagtggc gcgagcaggt cggcgaagcc 151910-序列表.doc • 81 - 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 201127957 tgcgaagagt tgcgaggcag cggcctggtg gaacacgcct gggtcaatga tgacctggtg 13620 cattgcaaac gctagggcct tgtggggtca gttccggctg ggggttcagc agccagcgct 13680 ttactggcat ttcaggaaca agcgggcact gctcgacgca cttgcttcgc tcagtatcgc 13740 tcgggacgca cggcgcgctc tacgaactgc cgataaacag aggattaaaa ttgacaattg 13800 tgattaaggc tcagattcga cggcttggag cggccgacgt gcaggatttc cgcgagatcc 13860 gattgtcggc cctgaagaaa gctccagaga tgttcgggtc cgtttacgag cacgaggaga 13920 aaaagcccat ggaggcgttc gctgaacggt tgcgagatgc cgtggcattc ggcgcctaca 13980 tcgacggcga gatcattggg ctgtcggtct tcaaacagga ggacggcccc aaggacgctc 14040 acaaggcgca tctgtccggc gttttcgtgg agcccgaaca gcgaggccga ggggtcgccg 14100 gtatgctgct gcgggcgttg ccggcgggtt tattgctcgt gatgatcgtc cgacagattc 14160 caacgggaat ctggtggatg cgcatcttca tcctcggcgc acttaatatt tcgctattct 14220 ggagcttgtt gtttatttcg gtctaccgcc tgccgggcgg ggtcgcggcg acggtaggcg 14280 ctgtgcagcc gctgatggtc gtgttcatct ctgccgctct gctaggtagc ccgatacgat 14340 tgatggcggt cctgggggct atttgcggaa ctgcgggcgt ggcgctgttg gtgttgacac 14400 caaacgcagc gctagatcct gtcggcgtcg cagcgggcct ggcgggggcg gtttccatgg 14460 cgttcggaac cgtgctgacc cgceiagtggc aacctcccgt gcctctgctc acctttaccg 14520 cctggcaact ggcggccgga ggacttctgc tcgttccagt agctttagtg tttgatccgc 14580 caatcccgat gcctacagga accaatgttc tcggcctggc gtggctcggc ctgatcggag 14640 cgggtttaac ctacttcctt tggttccggg ggatctcgcg actcgaacct acagttgttt 14700 ccttactggg ctttctcagc cgggatggcg ctaagaagct attgccgccg atcttcatat 14760 gcggtgtgaa ataccgcaca gatgcgtaag gagaaaatac cgcatcaggc gctcttccgc 14820 ttcctcgctc actgactcgc tgcgctcggt cgttcggctg cggcgagcgg tatcagctca 14880 • 82 ·
151910-序列表.doc
201127957 ctcaaaggcg gtaatacggt tatccacaga atcaggggat aacgcaggaa agaacatgtg agcaaaaggc cagcaaaagg ccaggaaccg taaaaaggcc gcgttgctgg cgtttttcca taggctccgc ccccctgacg agcatcacaa aaatcgacgc tcaagtcaga ggtggcgaaa cccgacagga ctataaagat accaggcgtt tccccctgga agctccctcg tgcgctctcc tgttccgacc ctgccgctta ccggatacct gtccgccttt ctcccttcgg gaagcgtggc gctttctcaa tgctcacgct gtaggtatct cagttcggtg taggtcgttc gctccaagct gggctgtgtg cacgaacccc ccgttcagcc cgaccgctgc gccttatccg gtaactatcg tcttgagtcc aacccggtaa gacacgactt atcgccactg gcagcagcca ctggtaacag gattagcaga gcgaggtatg taggcggtgc tacagagttc ttgaagtggt ggcctaacta cggctacact agaaggacag tatttggtat ctgcgctctg ctgaagccag ttaccttcgg aaaaagagtt ggtagctctt gatccggcaa acaaaccacc gctggtagcg gtggtttttt tgtttgcaag cagcagatta cgcgcagELaa eiaaaggatat ceiageiagatc ctttgatctt ttctacgggg tctgacgctc agtggaacga aaactcacgt taagggattt tggtcatgag attatcaaaa aggatcttca cctagatcct tttaaattaa aaatgeiagtt ttaaatcaat ctaaagtata tatgagtaaa cttggtctga cagttaccaa tgctt£iatca gtgaggcacc tatctcagcg atctgtctat ttcgttcatc catagttgcc tgactccccg tcgtgtagat aactacgata cgggagggct taccatctgg ccccagtgct gcaatgatac cgcgagaccc acgctcaccg gctccagatt tatcagcaat aaaccagcca gccggaaggg ccgagcgcag aagtggtcct gcaactttat ccgcctccat ccagtctatt aaacaagtgg cagcaacgga ttcgcaaacc tgtcacgcct tttgtgccaa aagccgcgcc aggtttgcga tccgctgtgc caggcgttag gcgtcatatg aagatttcgg tgatccctga gcaggtggcg gaaacattgg atgctgagaa ccatttcatt gttcgtgaag tgttcgatgt gcacctatcc gaccaaggct 151910·序列表.doc -83· 14940 15000 15060 15120 15180 15240 15300 15360 15420 15480 15540 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 201127957 ttgaactatc taccageiagt gtgagcccct ctgatgaaga ctctgcttgc tatggcgcat aactcaactc aacatggeiac gatctagcct accgaggcaa aggagtcgcg cacagtctca gacagctcct tggcatacga ttagagacac acgcaaaatg tggctttact ctcggcggca aagtctcgaa cgaaacagcg atgtactggt aacaattcat tcaagccgac accgcttcgc tgagggaagc ggtgatcgcc gaagtatcga agcgccatct cgaaccgacg ttgctggccg gcctgaagcc acacagtgat attgatttgc caacgcggcg agctttgatc aacgaccttt agattctccg cgctgtagaa gtcaccattg atccagctaa gcgcgaactg caatttggag tcttcgagcc agccacgatc gacattgatc atagcgttgc cttggtaggt ccagcggcgg atctatttga ggcgctaaat gaaaccttaa gcgatgagcg aaatgtagtg cttacgttgt aaatcgcgcc gaaggatgtc gctgccgact agcccgtcat acttgaagct aggcaggctt gcgcagatca gttggaagaa tttgttcact gcaaataatg tctaacaatt cgttcaagcc accggaagga ttacatctcg gatgatgact 16260 tcatcgacca agagcttgtc gggaagattg 16320 ctatcgaaca cattgttgtg tcgcacacgc 16380 tcgaatttgc gaaaaagtgg gcactaagca 16440 aaacgaacaa tgtacctgcc tgcaatttgt 16500 ttgacctgtt cacgtataaa actagacctc 16560 actggttctc gggagcacag gatgacgcct 16620 ggcgcggctt aattcaggag ttaaacatca 16680 ctcaactatc agaggtagtt ggcgtcatcg 16740 tacatttgta cggctccgca gtggatggcg 16800 tggttacggt gaccgtaagg cttgatgaaa 16860 tggaaacttc ggcttcccct ggagagagcg 16920 ttgtgcacga cgacatcatt ccgtggcgtt 16980 aatggcagcg caatgacatt cttgcaggta 17040 tggctatctt gctgacaaaa gcaagagaac 17100 aggaactctt tgatccggtt cctgaacagg 17160 cgctatggaa ctcgccgccc gactgggctg 17220 cccgcatttg gtacagcgca gtaaccggca 17280 gggcaatgga gcgcctgccg gcccagtatc 17340 atcttggaca agaagatcgc ttggcctcgc 17400 acgtgaaagg cgagatcacc aaggtagtcg 17460 gacgccgctt cgcggcgcgg cttaactcaa 17520 -84- 151910•序列表.doc
201127957 gcgttagaga gctggggaag actatgcgcg atctgttgaa ggtggttcta agcctcgtac ttgcgatggc atcggggcag gcacttgctg acctgccaat tgttttagtg gatgaagctc gtcttcccta tgactactcc ccatccaact acgacatttc tccaagcaac tacgacaact ccataagcaa ttacgacaat agtccatcaa attacgacaa ctctgagagc aactacgata atagttcatc caattacgac aatagtcgca acggaaatcg taggcttata tatagcgcaa atgggtctcg cactttcgcc ggctactacg tcattgccaa caatgggaca acgaacttct tttccacatc tggcaaaagg atgttctaca ccccaaaagg ggggcgcggc gtctatggcg gcaaagatgg gagcttctgc ggggcattgg tcgtcataaa tggccaattt tcgcttgccc tgacagataa cggcctgaag atcatgtatc taagcaacta gcctgctctc taataaaatg ttaggagctt ggctgccatt tttggggtga ggccgttcgc ggccgagggg cgcagcccct ggggggatgg gaggcccgcg ttagcgggcc gggagggttc gagaaggggg ggcacccccc ttcggcgtgc gcggtcacgc gccagggcgc agccctggtt aaaaacaagg tttataaata ttggtttaaa agcaggttaa aagacaggtt agcggtggcc gaaaaacggg cggaaaccct tgcaaatgct ggattttctg cctgtggaca gcccctcaaa tgtceiatagg tgcgcccctc atctgtcagc actctgcccc tcaagtgtca aggatcgcgc ccctcatctg tcagtagtcg cgcccctcaa gtgtcaatac cgcagggcac ttatccccag gcttgtccac atcatctgtg ggaaactcgc gtaaaatcag gcgttttcgc cgatttgcga ggctggccag ctccacgtcg ccggccgaaa tcgagcctgc ccctcatctg tcaacgccgc gccgggtgag tcggcccctc aagtgtcaac gtccgcccct catctgtcag tgagggccaia gttttccgcg aggtatccac aacgccggcg gccggccgcg gtgtctcgca cacggcttcg acggcgtttc tggcgcgttt gcagggccat agacggccgc cagcccagcg gcgagggcaa ccagcccggt gagcgtcgga aagg 151910·序列表.doc 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18784 201127957 <210> 30 <211> 18784 〈212〉 DNA <213〉人工序列 <220〉 <223〉人工 <400> 30 tcgacatcgt caacgttcac ttctaaagaa atccagcgat ttcctattat gtcggcatag gcgagaaatg aataagaagg ctgataattc caggcagcaa cgctctgtca tcgttacaat gtttcaaacc cggcagctta gttgccgttc gtctgccgcc ttacaacggc tctcccgctg tcgagtggtg attttgtgcc gagctgccgg atatattgtg gtgtaaacaa attgacgctt ttaatgtact gaattcgccg ctcggtgtgt aatttgaata agatttatgt aatcagtctt aaaattggat ttgtaataat aaaacgcaat gtcgctataa acctattcag cacaatatat agtagggtac aatcagtaaa ttgaacggag ggtgatatat tcattagaat gaaccgaaac aggtttttta caacgtgcac aacagaattg cgcatatctc attaaacaag tgaagatttg cattcggttt gacccttcca ggttgagaga atagcgccac tcagcttcct cagcggcttt 60 ttctcaagat cgacagcctg tcacggtteia 120 ggatctctgc gaggagatga tatttgatca 180 caacatgcta ccctccgcga gatcatccgt 240 ttccgaatag catcgggtaa catgagcaaa 300 acgccgtccc ggactgatgg gctgcctgta 360 tcggggagct gttggctggc tggtggcagg 420 agacaactta ataacacatt gcggacgttt 480 cgtagatact agcccctggg gcacttttga 540 ttaggtttga ccggttctgc cgcttttttt 600 tgtttgttat tgtggcgctc tatcatagat 660 tgttttcatt ttaatattgt acatataagt 720 aatattattc ataaaaatac gatagtaacg 780 cggcggtaag gatctgagct acacatgctc 840 aaagcaaata tcatgcgatc ataggcgtct 900 attcaaactc cattgagagc cctgactatg 960 cgatagcccc ctaccttaat taaggggccc 1020 • 86 - 151910·序列表.doc 1080 1080
201127957 cccctcgagg tcgacggtat cgataagctt gatatcgaat tcctgcagcc agggggatcc cccgggtcat cagatctcgg tgacgggcag gaccggacgg ggcggtaccg gcaggctgaa gtccagctgc cagaaaccca cgtcatgcca gttcccgtgc ttgaagccgg ccgcccgcag catgccgcgg ggggcatatc cgagcgcctc gtgcatgcgc acgctcgggt cgttgggcag cccgatgaca gcgaccacgc tcttgaagcc ctgtgcctcc agggacttca gcaggtgggt gtagagcgtg gagcccagtc ccgtccgctg gtggcggggg gagacgtaca cggtcgactc ggccgtccag tcgtaggcgt tgcgtgcctt ccaggggccc gcgtaggcga tgccggcgac ctcgccgtcc acctcggcga cgagccaggg atagcgctcc cgcagacgga cgaggtcgtc cgtccactcc tgcggttcct gcggctcggt acggaagttg accgtgcttg tctcgatgta gtggttgacg atggtgcaga ccgccggcat gtccgcctcg gtggcacggc ggatgtcggc cgggcgtcgt tctgggctca tggtagatcc cctcgagaga gatagatttg tagagagaga ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt ccttatatag aggaaggtct tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag tggagatatc acatcsiatcc acttgctttg aagacgtggt tggaacgtct tctttttcca cgatgctcct cgtgggtggg ggtccatctt tgggaccact gtcggcagag gcatcttgaa cgatagcctt tcctttatcg caatgatggc atttgtaggt gccaccttcc ttttctactg tccttttgat gaagtgacag atagctgggc aatggaatcc gaggaggttt cccgatatta ccctttgttg aaaagtctca atagcccttt ggtcttctga gactgtatct ttgatattct tggagtagac gagagtgtcg tgctccacca tgttatcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt tctactgtcc ttttgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 151910•序列表.doc •87- 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 5 201127957 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg 2400 atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgctgatagt gaccttaggc 2460 gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa 2520 acccattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 2580 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 2640 attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 2700 attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgctc ccggccgcca 2760 tggccgcggg atatcactag tgcggccgct cgacgaatta attccaatcc cacaaeLaatc 2820 tgagcttaac agcacagttg ctcctctcag agcagaatcg ggtattcaac accctcatat 2880 caactactac gttgtgtata acggtccaca tgccggtata tacgatgact ggggttgtac 2940 aaaggcggca acaaacggcg ttcccggagt tgcacacaag aaatttgcca ctattacaga 3000 ggcaagagca gcagctgacg cgtacacaac aagtcagcaa acagacaggt tgaacttcat 3060 ccccaaagga gaagctcaac tcaagcccaa gagctttgct aaggccctaa caagcccacc 3120 aaagcaaaaa gcccactggc tcacgctagg aaccaaaagg cccagcagtg atccagcccc 3180 aaaagagatc tcctttgccc cggagattac aatggacgat ttcctctatc tttacgatct 3240 aggaaggaag ttcgaaggtg aaggtgacga cactatgttc accactgata atgageiaggt 3300 tagcctcttc aatttcagaa agaatgctga cccacagatg gttagagagg cctacgcagc 3360 aggtctcatc aagacgatct acccgagtaa caatctccag gagatcaaat accttcccaa 3420 gaaggttaaa gatgcagtca aaagattcag gactaattgc atcaagaaca cagagaaaga 3480 catatttctc aagatcagaa gtactattcc agtatggacg attcaaggct tgcttcataa 3540 accaaggcaa gtaatagaga ttggagtctc taaaaaggta gttcctactg eiatctaaggc 3600 catgcatgga gtctaagatt caaatcgagg atctaacaga actcgccgtg aagactggcg 3660 -88 -
151910-序列表.doc
201127957 aacagttcat acagagtctt ttacgactca atgacaagaa gaaaatcttc gtcaacatgg tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca gaagaccaaa gggctattga gacttttcaa caaaggataa tttcgggeiaa cctcctcgga ttccattgcc cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgac atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca tttggagagg acacgctcga ggaattcggt accccatcac aagtttgtac aaaaaagcag gctgcggccg cttgctccct taaaaaaaac catggcatgt cattacggac aacagcaaca gacttgtgca cctcatcttc agcttcaacc tagagcatgt agagttgtga aggctgctac tgctgttact gteiaatttct gtgttcctta ttctctcaaa atcttcgatt ttgttttcgt tcgatcccaa tttcgtatat gttctttggt ttagattctg ttaatcttag atcgaagacg attttctggg tttgatcgtt agatatcatc ttaattctcg attagggttt catagatatc atccgatttg ttc€iaataat ttgagttttg tcgaataatt actcttcgat ttgtgatttc tatctagatc tggtgttagt ttctagtttg tgcgatcgaa tttgtcgatt aatctgagtt tttctgatta acaggctgga ggatctcttc ttgttctctc tggacttact ctcgctggaa ctgttatcgc tctcactatc gctacacctc ttctcgttat cttctctcct gttctcgttc ctgctgtgat cactatcttc cttctcggag ctggatttct tgcttctggt ggatttggag ttgctgctct ctctgttctc tcttggatct acagatacct cactggaaaa catcctccag gtgctgattg tcttgagtct gctaagacta agctcgcttc ttgtgctaga gagatgaagg atagagcaga gcaattctct tgtcagcctg ttgctggatc tcagacttct taatgaacat atggtcctgc tttaatgaga 151910·序列表.doc -89- 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 4380 4440 4500 4560 4620 4680 4740 4800 4860 4920 4980 201127957 tatgcgagac gcctatgatc gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa 5040 aaacctgagc atgtgtagct cagatcctta ccgccggttt cggttcattc taatgaatat 5100 atcacccgtt actatcgtat ttttatgaat aatattctcc gttcaattta ctgattgtac 5160 cctactactt atatgtacaa tattaaaatg aaaacaatat attgtgctga ataggtttat 5220 agcgacatct atgatagagc gccacaataa caaacaattg cgttttatta ttacaaatcc 5280 aattttaaaa aaagcggcag aaccggtcaa acctaaaaga ctgattacat aaatcttatt 5340 caaatttcaa aaggccccag gggctagtat ctacgacaca ccgagcggcg aactaataac 5400 gttcactgaa gggaactccg gttccccgcc ggcgcgcatg ggtgagattc cttgaagttg 5460 agtattggcc gtccgctcta ccgaaagtta cgggcaccat tcaacccggt ccagcacggc 5520 ggccgggtaa ccgacttgct gccccgagaa ttatgcagca tttttttggt gtatgtgggc 5580 cccaaatgaa gtgcaggtca aaccttgaca gtgacgacaa atcgttgggc gggtccaggg 5640 cgaattttgc gacaacatgt cgaggctcag caggacctgc aggcatgcaa gctagcttac 5700 tagtgatgca tattctatag tgtcacctaa atcttcgacg aattaattcc eiatcccacaa 5760 aaatctgagc ttaacagcac agttgctcct ctcagagcag aatcgggtat tcaacaccct 5820 catatcaact actacgttgt gtataacggt ccacatgccg gtatatacga tgactggggt 5880 tgtacaaagg cggcaacaaa cggcgttccc ggagttgcac acaagaaatt tgccactatt 5940 acagaggcaa gagcagcagc tgacgcgtac acaacaagtc agcaaacaga caggttgaac 6000 ttcatcccca aaggagaagc tcaactcaag cccaagagct ttgctaaggc cctaacaagc 6060 ccaccaaagc aaaaagccca ctggctcacg ctaggaacca aaaggcccag cagtgatcca 6120 gccccaaaag agatctcctt tgccccggag attacaatgg acgatttcct ctatctttac 6180 gatctaggaa ggaagttcga aggtgaaggt gacgacacta tgttcaccac tgataatgag 6240 aaggttagcc tcttcaattt cagaaagaat gctgacccac agatggttag agaggcctac 6300 •90·
151910·序列表.doc
201127957 gcagcaggtc tcatcaiagac gatctacccg agtaacaatc tccaggagat caaatacctt cccaagaagg ttaaagatgc agtcaaaaga ttcaggacta attgcatcaa gaacacagag aaagacatat ttctcaagat cagaagtact attccagtat ggacgattca aggcttgctt cataaaccaa ggcaagtaat agagattgga gtctctaaaa aggtagttcc tactgaatct aaggccatgc atggagtcta agattcaaat cgaggatcta acagaactcg ccgtgaagac tggcgaacag ttcatacaga gtcttttacg actcaatgac aagaagaaaa tcttcgtcaa catggtggag cacgacactc tggtctactc caaaaatgtc aaagatacag tctcagaaga ccaaagggct attgagactt ttcaacaaag gataatttcg ggaaacctcc tcggattcca ttgcccagct atctgtcact tcatcgaaag gacagtagaa aaggaaggtg gctcctacaa atgccatcat tgcgataaag gaaaggctat cattcaagat ctctctgccg acagtggtcc caaagatgga cccccaccca cgaggagcat cgtggaaaaa gaagacgttc caaccacgtc ttcaaagcaa gtggattgat gtgacatctc cactgacgta agggatgacg cacaatccca ctatccttcg caagaccctt cctctatata aggaagttca tttcatttgg agaggacacg ggatccttgc tccgttaaaa Eiaaaccatgg ctatcctcga ttctgctggt gttactactg tgactgagaa tggtggtgga gagttcgttg atctcgatag actcagaaga agaaagtcta gatctgtaaa tttctgtgtt ccttattctc tcaaaatctt cgattttgtt ttcgttcgat cccaatttcg tatatgttct ttggtttaga ttctgttaat cttagatcga agacgatttt ctgggtttga tcgttagata tcatcttaat tctcgattag ggtttcatag atatcatccg atttgttcaa ataatttgag ttttgtcgaa taattactct tcgatttgtg atttctatct agatctggtg ttagtttcta gtttgtgcga tcgaatttgt cgattaatct gagtttttct gattaacagg attcttctaa cggacttctc ctctctggat ctgataacaa ctctccttct gatgatgttg gtgctcctgc tgatgtgaga gatagaatcg attctgtggt gaacgatgat 151910-序列表,doc -91- 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 7020 7080 7140 7200 7260 7320 7380 7440 7500 7560 7620 201127957 gctcaaggta ctgctaacct cgctggtgat ggaagaggtg gaggtgaagg tagaggaaac gtgcctgctc atagaagagc tagagagtct tctcacgctg gacttttcaa cctctgtgtg atcatcgaga acctcatgaa gtacggatgg agatctctca gagattggcc tcttttcatg gctgctttta ctgttgagaa gctcgtgctc ttcctccaca tcatcatcac tatgactgag tgcgattctg ctttcctctc tggtgttact aagctcgtgt cttacgctca cacttcttac aaggctaacc ctgaagtgtc ttactacgtg gctcctacac tttgttacca gccatcttac gtggcaagac aattcgctaa gttggtgatc cagtacatca accctattgt gageiaactct gctatcgaga gagttcttaa gctctctgtg tactgtttct tccacctctg gcttaacatc gagttctaca aggattggtg gaacgctaag atgcctgtgc ataagtggat ggtgcgtcac cctaagactc tcgctatcat tatcgctttc atcgctgttc cttgcagact tttcaagctt ccactcgtgt tcatcactaa ctacctccaa attttctggt tcattttctg catcttcgga aataacggtg gaggtgataa caatggtgga 7680 gctgatgcta ctttcactta cagaccatct 7740 cctctctctt ctgatgctat cttcaagcag 7800 gtggttctta tcgctgtgaa ctctagactc 7860 ctcatcagaa ctgatttctg gttctcttct 7920 tgctgcatct cactctcaat cttccctctc 7980 cagaagtata tcgctgaacc tgtggtgatc 8040 gttctctacc ctgtttacgt gactctcaga 8100 cttatgctcc tcacttgcat tgtgtggctt 8160 gatatcagat ctctcgctaa cgctgctgat 8220 tctctcaagt ctctcgctta cttcatggtt 8280 cctagatctg cttgcattag aaagggatgg 8340 ttcactggat tcatgggatt catcatcgag 8400 aagcaccctc tcaagggtga tcttctctac 8460 cctaaccttt atgtgtggct ctgcatgttc 8520 cttgctgagt tgctttgctt cggagataga 8580 tctgttggag attattggag aatgtggaac 8640 atctacttcc cttgcctcag atctaagatc 8700 ctcgtgtctg ctgttttcca tgagttgtgt 8760 tgggctttcc tcggaatcat gttccaggtt 8820 gagagattcg gatctactgt tggaaacatg 8880 cagcctatgt gcgttctcct ctactaccac 8940 •92· 151910-序列表.doc
201127957 gatctcatga acagaaaggg atctatgtct taatgaagga tccacccagc tttcttgtac aaagtggtga tgggttcgaa atcgataagc ttggatcctc tagagtcctg ctttaatgag atatgcgaga cgcctatgat cgcatgatat ttgctttcaa ttctgttgtg cacgttgtaa aaaacctgag catgtgtagc tcagatcctt accgccggtt tcggttcatt ctaatgaata tatcacccgt tactatcgta tttttatgaa taatattctc cgttcaattt actgattgta ccctactact tatatgtaca atattaaaat gaaaacaata tattgtgctg aataggttta tagcgacatc tatgatagag cgccacaata acaaacaatt gcgttttatt attacaaatc caattttaaa aaaagcggca gaaccggtca aacctaaaag actgattaca taaatcttat tcaaatttca aaaggcccca ggggctagta tctacgacac accgagcggc gaactaataa cgttcactga agggaactcc ggttccccgc cggcgcgcat gggtgagatt ccttgaagtt gagtattggc cgtccgctct accgaaagtt acgggcacca ttcaacccgg tccagcacgg cggccgggta accgacttgc tgccccgaga attatgcagc atttttttgg tgtatgtggg ccccaaatga agtgcaggtc aaaccttgac agtgacgaca aatcgttggg cgggtccagg gcgaattttg cgacaacatg tcgaggctca gcaggacctg caggcatgca agctagctta ctagtgatgc atattctata gtgtcaccta aatctgcggc cgcctgcagg tcgatatggg agagctccca acgcgttgga tgcatagctt gagtattcta tagtgtcacc taaatagctt ggcgtaatca tggtcatagc tgtttcctgt gtgaaattgt tatccgctca caattccaca caacatacga gccggaagca taaagtgtaa agcctggggt gcctaatgag tgagctaact cacattaatt gcgttgcgct cactgcccgc tttccagtcg ggeiaacctgt cgtgccagct gcattaatga atcggccaac gcgcggggag aggcggtttg cgtattgggg ctgagtggct ccttcaacgt tgcggttctg tcagttccaa acgtaaaacg gcttgtcccg cgtcatcggc gggggtcata acgtgactcc cttaattctc cgctcatgat cagattgtcg tttcccgcct 151910·序列表.doc -93· 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 9660 9720 9780 9840 9900 9960 10020 10080 10140 10200 10260 201127957 tcagtttaaa cgtttattag tgtatgtgca gacttctgtt atcccttggc aacgcggtcg gaaaatcgtg aagttccgtc tggcgggaac cataaccctg gatatacagg agccgggcag cttattcgca ccggcgtaac ctgccaactt tctatcagct gccggacatc tacaccgctt ggatgccggg aaaaactcag gcgcggaaat tttacgcgta ctatcagtgt ttgacaggat aataatcgga tatttaaaag tgccaaccac agggttcccc caaccaccca aacgtcggaa tcgtctgggt cggctagaag cggacgtagc gcagcgccga atctgcttgt cgctctttcg acaggatgat ctggcgcgag tccacgaaaa tatccgaacg cttcggggtc attatagcga attttgccaa agggttcgtg gataggtgaa gtaggcccac cctggcggtg ctcaacggga agatgagggc aagcggatgg actgatttag tgtatgatgg gtccctcctg ttcagctact agcgctatct ctgctctcac ctcaacccgg tacgcaccag caacagcccg cattatgggc gccgcagtcg gtaacctcgc ggacgaacag tggggctatg tgacagtctc cggaagacgg atattggcgg gtaaacctaa ggcgtgaaaa ggtttatccg tcgggagtgc ttggcattcc agcctgacga cggagcagca gtcgagtggg ctgctgtggc aaaatcctcg atcgcaaatc gccgacgtcc tggccagtca ttgctggatc tcgccttcaa cagcaagatg tcgacggatc ttttttcggt atatccatcc tagactttcc ttggtgtatc ccgcgagcgg gtgttccttc atcctgctct gcgaggctgg ctgatgaaac caagccaacc tgtttttgag gtgctccagt gacggggtgg tgcgtaacgg tgccgtaaaa catggcaact aaaatcattg atatggccat gttggcctca acacgatttt gcatacagcc gggcagtgac tcggggctaa atcgcgccag ttgttgcgca cgtattcggt gagaaaagag 10320 ttcgtccatt 10380 gtgcgataat 10440 ttccaaaaag 10500 ttgatccctc 10560 cgacgctgtc 10620 tcacgcgcca 10680 tccgggtctg 10740 ttttccgctg 10800 tttttcgcac 10860 caacggcgtc 10920 ttcactgtcc 10980 ccggctaccg 11040 aggggtgatg 11100 ggcttctgtt 11160 caaaagcacc 11220 gcagttcact 11280 gaatggcgtt 11340 acgtcactta 11400 gtcatcgtct 11460 cgctggctgt 11520 gaacgcacta 11580 -94· 151910·序列表.doc
201127957 tggcgacgct ggggcgtctt atgagcctgc tgtcaccctt tgacgtggtg atatggatga cggatggctg gccgctgtat gaatcccgcc tgaagggaaa gctgcacgta atcagcaagc gatatacgca gcgaattgag cggcataacc tgaatctgag gcagcacctg gcacggctgg gacggaagtc gctgtcgttc tcaaaatcgg tggagctgca tgacaaagtc atcgggcatt atctgaacat aaaacactat caataagttg gagtcattac cceiaccagga agggcagccc acctatcaag gtgtactgcc ttccagacga acgaagagcg attgaggaeia aggcggcggc ggccggcatg agcctgtcgg cctacctgct ggccgtcggc cagggctaca aaatcacggg cgtcgtggac tatgagcacg tccgcgagct ggcccgcatc aatggcgacc tgggccgcct gggcggcctg ctgaaactct ggctcaccga cgacccgcgc acggcgcggt tcggtgatgc cacgatcctc gccctgctgg cgaagatcga agagaagcag gacgagcttg gcaaggtcat gatgggcgtg gtccgcccga gggcagagcc atgacttttt tagccgctaa aacggccggg gggtgcgcgt gattgccaag cacgtcccca tgcgctccat caagaagagc gacttcgcgg agctggtatt cgtgcagggc aagattcgga ataccaagta cgagaaggac ggccagacgg tctacgggac cgacttcatt gccgataagg tggattatct ggacaccaag gcaccaggcg ggtcaaatca ggaataaggg cacattgccc cggcgtgagt cggggcaatc ccgcaaggag ggtgaatgaa tcggacgttt gaccggaagg catacaggca agaactgatc gacgcggggt tttccgccga ggatgccgaa accatcgcaa gccgcaccgt catgcgtgcg ccccgcgaaa ccttccagtc cgtcggctcg atggtccagc aagctacggc caagatcgag cgcgacagcg tgcaactggc tccccctgcc ctgcccgcgc catcggccgc cgtggagcgt tcgcgtcgtc tcgaacagga ggcggcaggt ttggcgaagt cgatgaccat cgacacgcga ggaactatga cgaccaagaa gcgaaaaacc gccggcgagg acctggcaaa acaggtcagc gaggccaagc aggccgcgtt gctgaaacac acgaagcagc agatcaagga aatgcagctt tccttgttcg 151910-序列表.doc •95· 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 12300 12360 12420 12480 12540 12600 12660 12720 12780 12840 12900 201127957 atattgcgcc gtggccggac acgatgcgag cgatgccaaa cgacacggcc cgctctgccc 12960 tgttcaccac gcgcaacaag aaaatcccgc gcgaggcgct gcaaaacaag gtcattttcc 13020 acgtcaacaa ggacgtgaag atcacctaca ccggcgtcga gctgcgggcc gacgatgacg 13080 aactggtgtg gcagcaggtg ttggagtacg cgaagcgcac ccctatcggc gagccgatca 13140 ccttcacgtt ctacgagctt tgccaggacc tgggctggtc gatcaatggc cggtattaca 13200 cgaaggccga ggaatgcctg tcgcgcctac aggcgacggc gatgggcttc acgtccgacc 13260 gcgttgggca cctggaatcg gtgtcgctgc tgcaccgctt ccgcgtcctg gaccgtggca 13320 agaaaacgtc ccgttgccag gtcctgatcg acgaggaaat cgtcgtgctg tttgctggcg 13380 accactacac geiaattcata tgggagaagt accgcaagct gtcgccgacg gcccgacgga 13440 tgttcgacta tttcagctcg caccgggagc cgtacccgct caagctggaa accttccgcc 13500 tcatgtgcgg atcggattcc acccgcgtga agaagtggcg cgagcaggtc ggcgaagcct 13560 gcgaagagtt gcgaggcagc ggcctggtgg aacacgcctg ggtcaatgat gacctggtgc 13620 attgcaaacg ctagggcctt gtggggtcag ttccggctgg gggttcagca gccagcgctt 13680 tactggcatt tcaggaacaa gcgggcactg ctcgacgcac ttgcttcgct cagtatcgct 13740 cgggacgcac ggcgcgctct acgaactgcc gataaacaga ggattaaaat tgacaattgt 13800 gattaaggct cagattcgac ggcttggagc ggccgacgtg caggatttcc gcgagatccg 13860 attgtcggcc ctgaagaaag ctccagagat gttcgggtcc gtttacgagc acgaggagaa 13920 aaagcccatg gaggcgttcg ctgaacggtt gcgagatgcc gtggcattcg gcgcctacat 13980 cgacggcgag atcattgggc tgtcggtctt caaacaggag gacggcccca aggacgctca 14040 caaggcgcat ctgtccggcg ttttcgtgga gcccgaacag cgaggccgag gggtcgccgg 14100 tatgctgctg cgggcgttgc cggcgggttt attgctcgtg atgatcgtcc gacagattcc 14160 aacgggaatc tggtggatgc gcatcttcat cctcggcgca cttaatattt cgctattctg 14220 • 96·
1519丨0·序列表.doc
201127957 gagcttgttg tttatttcgg tctaccgcct gccgggcggg gtcgcggcga cggtaggcgc tgtgcagccg ctgatggtcg tgttcatctc tgccgctctg ctaggtagcc cgatacgatt gatggcggtc ctgggggcta tttgcggaac tgcgggcgtg gcgctgttgg tgttgacacc aaacgcagcg ctagatcctg tcggcgtcgc agcgggcctg gcgggggcgg tttccatggc gttcggaacc gtgctgaccc gcaagtggca acctcccgtg cctctgctca cctttaccgc ctggcaactg gcggccggag gacttctgct cgttccagta gctttagtgt ttgatccgcc aatcccgatg cctacaggaa ccaatgttct cggcctggcg tggctcggcc tgatcggagc gggtttaacc tacttccttt ggttccgggg gatctcgcga ctcgaaccta cagttgtttc cttactgggc tttctcagcc gggatggcgc taagaagcta ttgccgccga tcttcatatg cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg ctttctcaat gctcacgctg taggtatctc agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcagLa caaaccaccg ctggtagcgg tggttttttt 151910·序列表.doc -97- 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 14940 15000 15060 15120 15180 15240 15300 15360 15420 15480 15540 201127957 gtttgcaagc agcagattac gcgcagaaaa eiaaggatatc aagaagatcc tttgatcttt 15600 tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 15660 ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 15720 taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 15780 atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 15840 actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 15900 cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 15960 agtggtcctg caactttatc cgcctccatc cagtctatta aacaagtggc agcaacggat 16020 tcgcaaacct gtcacgcctt ttgtgccaeia agccgcgcca ggtttgcgat ccgctgtgcc 16080 aggcgttagg cgtcatatga agatttcggt gatccctgag caggtggcgg aaacattgga 16140 tgctgagaac catttcattg ttcgtgaagt gttcgatgtg cacctatccg accaaggctt 16200 tgaactatct accagaagtg tgagccccta ccggaaggat tacatctcgg atgatgactc 16260 tgatgaagac tctgcttgct atggcgcatt catcgaccaa gagcttgtcg ggaagattga 16320 actcaactca acatggaacg atctagcctc tatcgaacac attgttgtgt cgcacacgca 16380 ccgaggcaaa ggagtcgcgc acagtctcat cgaatttgcg aaaaagtggg cactaagcag 16440 acagctcctt ggcatacgat tagagacaca aacgaacaat gtacctgcct gcaatttgta 16500 cgcaaaatgt ggctttactc tcggcggcat tgacctgttc acgtataaaa ctagacctca 16560 agtctcgaac gaaacagcga tgtactggta ctggttctcg ggagcacagg atgacgccta 16620 acaattcatt caagccgaca ccgcttcgcg gcgcggctta attcaggagt taaacatcat 16680 gagggaagcg gtgatcgccg aagtatcgac tcaactatca gaggtagttg gcgtcatcga 16740 gcgccatctc gaaccgacgt tgctggccgt acatttgtac ggctccgcag tggatggcgg 16800 cctgaagcca cacagtgata ttgatttgct ggttacggtg accgtaaggc ttgatgaaac 16860 •98· 151910·序列表.doc
201127957 aacgcggcga gctttgatca acgacctttt ggaaacttcg gcttcccctg gagagagcga gattctccgc gctgtagaag tcaccattgt tgtgcacgac gacatcattc cgtggcgtta tccagctaag cgcgaactgc giatttggaga atggcagcgc aatgacattc ttgcaggtat cttcgagcca gccacgatcg acattgatct ggctatcttg ctgacaaaag caagagaaca tagcgttgcc ttggtaggtc cagcggcgga ggaactcttt gatccggttc ctgaacagga tctatttgag gcgctaaatg aaaccttaac gctatggaac tcgccgcccg actgggctgg cgatgagcga aatgtagtgc ttacgttgtc ccgcatttgg tacagcgcag taaccggcaa aatcgcgccg aaggatgtcg ctgccgactg ggcaatggag cgcctgccgg cccagtatca gcccgtcata cttgaagcta ggcaggctta tcttgg^caa gaagatcgct tggcctcgcg cgcegatcag ttggaagaat ttgttcacta cgtgaaaggc gagatcacca aggtagtcgg caaataatgt ctaacaattc gttcaagccg acgccgcttc gcggcgcggc ttaactcaag cgttagagag ctggggaaga ctatgcgcga tctgttgaag gtggttctaa gcctcgtact tgcgatggca tcggggcagg cacttgctga cctgccaatt gttttagtgg atgaagctcg tcttccctat gactactccc catccaacta cgacatttct ccaagcaact acgacaactc cataagcaat tacgacaata gtccatcaaa ttacgacaac tctgagagca actacgataa tagttcatcc aattacgaca atagtcgcaa cggaaatcgt aggcttatat atagcgcaaa tgggtctcgc actttcgccg gctactacgt cattgccaac aatgggacaa cgaacttctt ttccacatct ggcaaaagga tgttctacac cccaaaaggg gggcgcggcg tctatggcgg caaagatggg agcttctgcg gggcattggt cgtcataaat ggccaatttt cgcttgccct gacagataac ggcctgaaga tcatgtatct aagcaactag cctgctctct aataaaatgt taggagcttg gctgccattt ttggggtgag gccgttcgcg gccgaggggc gcagcccctg gggggatggg aggcccgcgt tagcgggccg ggagggttcg agaagggggg gcacccccct 151910·序列表.doc •99- 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 17580 17640 17700 17760 17820 17880 17940 18000 18060 18120 18180 201127957 tcggcgtgcg cggtcacgcg ccagggcgca tggtttaaaa gcaggttaaa agacaggtta gcaaatgctg gattttctgc ctgtggacag tctgtcagca ctctgcccct caagtgtcaa gcccctcaag tgtcaatacc gcagggcact gaaactcgcg taaaatcagg cgttttcgcc cggccgaaat cgagcctgcc cctcatctgt agtgtcaacg tccgcccctc atctgtcagt acgccggcgg ccggccgcgg tgtctcgcac cagggccata gacggccgcc agcccagcgg aggg 〈210〉 31 <211〉 18802 <212> DNA <213〉人工序列 <220〉 <223〉人工 <400> 31 tcgacatcgt caacgttcac ttctaaagaa atccagcgat ttcctattat gtcggcatag gcgagaaatg aataagaagg ctgataattc caggcagcaa cgctctgtca tcgttacaat gtttcaaacc cggcagctta gttgccgttc gtctgccgcc ttacaacggc tctcccgctg gccctggtta aaaacaaggt ttataaatat 18240 gcggtggccg aaaaacgggc ggaaaccctt 18300 cccctcaaat gtcaataggt gcgcccctca 18360 ggatcgcgcc cctcatctgt cagtagtcgc 18420 tatccccagg cttgtccaca tcatctgtgg 18480 gatttgcgag gctggccagc tccacgtcgc 18540 caacgccgcg ccgggtgagt cggcccctca 18600 gagggccaag ttttccgcga ggtatccaca 18660 acggcttcga cggcgtttct ggcgcgtttg 18720 cgagggcaac cagcccggtg agcgtcggaa 18780 18784 atagcgccac tcagcttcct cagcggcttt 60 ttctcaagat cgacagcctg tcacggttaa 120 ggatctctgc gaggagatga tatttgatca 180 caacatgcta ccctccgcga gatcatccgt 240 ttccgaatag catcgggtaa catgagcaaa 300 acgccgtccc ggactgatgg gctgcctgta 360
-100- 151910·序列表.doc 420 420
201127957 tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg atatattgtg gtgtaaacaa atigacgctt agacaactta ataacacatt gcggacgttt ttsiatgtact gaattcgccg ctcggtgtgt cgtagatact agcccctggg gcacttttga aatttgaata agatttatgt aatcagtctt ttaggtttga ccggttctgc cgcttttttt aaaattggat ttgtgiataat aaaacgcaat tgtttgttat tgtggcgctc tatcatagat gtcgctataa acctattcag cacaatatat tgttttcatt ttaatattgt acatataagt agtagggtac aatcagtaaa ttgaacggag aatattattc ataaaaatac gatagtaacg ggtgatatat tcattagaat gaaccgaaac cggcggtaag gatctgagct acacatgctc aggtttttta caacgtgcac aacagaattg aaagcaaata tcatgcgatc ataggcgtct cgcatatctc attaaacaag tgaagatttg attcaaactc cattgagagc cctgactatg cattcggttt gacccttcca ggttgagaga cgatagcccc ctaccttaat taaggggccc cccctcgagg tcgacggtat cgataagctt gatatcgaat tcctgcagcc agggggatcc cccgggtcat cagatctcgg tgacgggcag gaccggacgg ggcggtaccg gcaggctgaa gtccagctgc cagaaaccca cgtcatgcca gttcccgtgc ttgaagccgg ccgcccgcag catgccgcgg ggggcatatc cgagcgcctc gtgcatgcgc acgctcgggt cgttgggcag cccgatgaca gcgaccacgc tcttgaagcc ctgtgcctcc agggacttca gcaggtgggt gtagagcgtg gagcccagtc ccgtccgctg gtggcggggg gagacgtaca cggtcgactc ggccgtccag tcgtaggcgt tgcgtgcctt ccaggggccc gcgtaggcga tgccggcgac ctcgccgtcc acctcggcga cgagccaggg atagcgctcc cgcagacgga cgaggtcgtc cgtccactcc tgcggttcct gcggctcggt acggaagttg accgtgcttg tctcgatgta gtggttgacg atggtgcaga ccgccggcat gtccgcctcg gtggcacggc ggatgtcggc cgggcgtcgt tctgggctca tggtagatcc cctcgagaga gatagatttg tagagagaga 151910·序列表.doc • 101 - 480 540 600 660 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 201127957 ctggtgattt cagcgtgtcc tctccaaatg aaatgaactt ccttatatag aggaaggtct 1740 tgcgaaggat agtgggattg tgcgtcatcc cttacgtcag tggagatatc acatcaatcc 1800 acttgctttg aagacgtggt tggaacgtct tctttttcca cgatgctcct cgtgggtggg 1860 ggtccatctt tgggaccact gtcggcagag gcatcttgaa cgatagcctt tcctttatcg 1920 caatgatggc atttgtaggt gccaccttcc ttttctactg tccttttgat gaagtgacag 1980 atagctgggc aatggaatcc gaggaggttt cccgatatta ccctttgttg aaaagtctca 2040 atagcccttt ggtcttctga gactgtatct ttgatattct tggagtagac gagagtgtcg 2100 tgctccacca tgttatcaca tcaatccact tgctttgaag acgtggttgg aacgtcttct 2160 ttttccacga tgctcctcgt gggtgggggt ccatctttgg gaccactgtc ggcagaggca 2220 tcttgaacga tagcctttcc tttatcgcaa tgatggcatt tgtaggtgcc accttccttt 2280 tctactgtcc ttttgatgaa gtgacagata gctgggcaat ggaatccgag gaggtttccc 2340 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg 2400 atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgctgatagt gaccttaggc 2460 gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa 2520 acccattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg 2580 atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg 2640 atteiagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga 2700 attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgctc ccggccgcca 2760 tggccgcggg atatcactag tgcggccgct cgacgaatta attccaatcc cacaaaaatc 2820 tgagcttaac agcacagttg ctcctctcag agcagaatcg ggtattcaac accctcatat 2880 caactactac gttgtgtata acggtccaca tgccggtata tacgatgact ggggttgtac 2940 aaaggcggca acaaacggcg ttcccggagt tgcacacaag aaatttgcca ctattacaga 3000 •102·
151910-序列表.doc
201127957 ggcaagagca gcagctgacg cgtacacaac aagtcagcaa acagacaggt tgaacttcat ccccaaagga gaagctcaac tcaagcccaa gagctttgct aaggccctaa caagcccacc aaagcaaaaa gcccactggc tcacgctagg aaccaaaagg cccagcagtg atccagcccc aaaagagatc tcctttgccc cggagattac aatggacgat ttcctctatc tttacgatct aggaaggaag ttcgaaggtg aaggtgacga cactatgttc accactgata atgagaaggt tagcctcttc aatttcagaa agaatgctga cccacagatg gttagagagg cctacgcagc aggtctcatc eiagacgatct acccgagtaa caatctccag gagatcaaat accttcccaa gaaggttaaa gatgcagtca aaagattcag gactaattgc atcaagaaca cagagaaaga catatttctc aagatcagaa gtactattcc agtatggacg attcaaggct tgcttcataa accaaggceia gtaatagaga ttggagtctc taaaaaggta gttcctactg aatctaaggc catgcatgga gtctaagatt caaatcgagg atctaacaga actcgccgtg aagactggcg aacagttcat acagagtctt ttacgactca atgacaagaa gaaaatcttc gtceiacatgg tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca gaagaccaaa gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga ttccattgcc cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt ggtcccaaag atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgac atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct atataaggaa gttcatttca tttggagagg acacgctcga ggaattcggt accccatcac aagtttgtac aaaaaagcag gctgcggccg cttgctccct taaaaaaaac catggcatgt cattacggat gtggacaaca gcaacagact tgtgcacctc atctttgtca gcttcaacct agagcatgta gagttgtgaa ggctgctact gctgttactg 151910-序列表.doc -103- 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 3720 3780 3840 3900 3960 4020 4080 4140 4200 4260 4320 201127957 taaatttctg tgttccttat tctctcaaaa tcttcgattt tgttttcgtt cgatcccaat 4380 ttcgtatatg ttctttggtt tagattctgt taatcttaga tcgaagacga ttttctgggt 4440 ttgatcgtta gatatcatct teiattctcga ttagggtttc atagatatca tccgatttgt 4500 tcaaataatt tgagttttgt cgaataatta ctcttcgatt tgtgatttct atctagatct 4560 ggtgttagtt tctagtttgt gcgatcgaat ttgtcgatta atctgagttt ttctgattaa 4620 caggctggag gatctcttct tgttctctct ggacttactc tcgctggaac tgttatcgct 4680 ctcactatcg ctacacctct tctcgttatc ttctctcctg ttctcgttcc tgctgtgatc 4740 actatcttcc ttctcggagc tggatttctt gcttctggtg gatttggagt tgctgctctc 4800 tctgttctct cttggatcta cagatacctc actggatgta aacatcctcc aggtgctgat 4860 tgtcttgagt ctgcttgtaa gactaagctc gcttcttgtg ctagagagat gaaggattgt 4920 agagcagagc aattctcttg tcagcctgtt gctggatctc agacttctta atgaacatat 4980 ggtcctgctt taatgagata tgcgagacgc ctatgatcgc atgatatttg ctttcaattc 5040 tgttgtgcac gttgtaaaaa acctgagcat gtgtagctca gatccttacc gccggtttcg 5100 gttcattcta atgaatatat cacccgttac tatcgtattt ttatgaataa tattctccgt 5160 tcaatttact gattgtaccc tactacttat atgtacaata ttaaaatgaa aacaatatat 5220 tgtgctgaat aggtttatag cgacatctat gatagagcgc cacaataaca aacaattgcg 5280 ttttattatt acaaatccaa ttttaaaaaa agcggcagaa ccggtcaaac ctaaaagact 5340 gattacataa atcttattca aatttcaaaa ggccccaggg gctagtatct acgacacacc 5400 gagcggcgaa ctaataacgt tcactgaagg gaactccggt tccccgccgg cgcgcatggg 5460 tgagattcct tgaagttgag tattggccgt ccgctctacc gaaagttacg ggcaccattc 5520 aacccggtcc agcacggcgg ccgggtaacc gacttgctgc cccgagaatt atgcagcatt 5580 tttttggtgt atgtgggccc caaatgaagt gcaggtcaaa ccttgacagt gacgacaaat 5640 -104·
151910-序列表.doc
201127957 cgttgggcgg gtccagggcg aattttgcga caacatgtcg aggctcagca ggacctgcag gcatgcaagc tagcttacta gtgatgcata ttctatagtg tcacctaaat cttcgacgaa ttaattccaa tcccacaaaa atctgagctt aacagcacag ttgctcctct cagagcagaa tcgggtattc aacaccctca tatcaactac tacgttgtgt ataacggtcc acatgccggt atatacgatg actggggttg tacaaaggcg gcaacaaacg gcgttcccgg agttgcacac aagaaatttg ccactattac agaggcaaga gcagcagctg acgcgtacac aacaagtcag caaacagaca ggttgaactt catccccaaa ggagaagctc aactcaagcc caagagcttt gctaaggccc taacaagccc accaaagcaa aaagcccact ggctcacgct aggaaccaaa aggcccagca gtgatccagc cccaaaagag atctcctttg ccccggagat tacaatggac gatttcctct atctttacga tctaggaagg aagttcgaag gtgaaggtga cgacactatg ttcaccactg ataatgagaa ggttagcctc ttcaatttca gaaagaatgc tgacccacag atggttagag aggcctacgc agcaggtctc atcaagacga tctacccgag taacaatctc caggagatca aataccttcc caagaaggtt aaagatgcag tcaaaagatt caggactaat tgcatcaaga acacagagaa agacatattt ctcaagatca gaagtactat tccagtatgg acgattcEiag gcttgcttca taaaccaagg caagtaatag agattggagt ctctaaaaag gtagttccta ctgaatctaa ggccatgcat ggagtctaag attcaaatcg aggatctaac agaactcgcc gtgaagactg gcgfiacagtt catacagagt cttttacgac tcaatgacaa gaagaaaatc ttcgtcaaca tggtggagca cgacactctg gtctactcca aaaatgtcaa agatacagtc tcagaagacc aaagggctat tgagactttt caacaaagga taatttcggg aaacctcctc ggattccatt gcccagctat ctgtcacttc atcgaaagga cagtagaaaa ggaaggtggc tcctacaaat gccatcattg cgataaagga aaggctatca ttcaagatct ctctgccgac agtggtccca aagatggacc cccacccacg aggagcatcg tggaaaaaga 151910-序列表.doc •105- 5700 5760 5820 5880 5940 6000 6060 6120 6180 6240 6300 6360 6420 6480 6540 6600 6660 6720 6780 6840 6900 6960 201127957 agacgttcca accacgtctt caaagcaagt ggattgatgt gacatctcca ctgacgtaag 7020 ggatgacgca caatcccact atccttcgca agacccttcc tctatataag gaagttcatt 7080 tcatttggag aggacacggg atccttgctc cgttaaaaaa aaccatggct atcctcgatt 7140 ctgctggtgt tactactgtg actgagaatg gtggtggaga gttcgttgat ctcgatagac 7200 tcagaagaag aaagtctaga tctgtaaatt tctgtgttcc ttattctctc aaaatcttcg 7260 attttgtttt cgttcgatcc caatttcgta tatgttcttt ggtttagatt ctgttaatct 7320 tagatcgaag acgattttct gggtttgatc gttagatatc atcttaattc tcgattaggg 7380 tttcatagat atcatccgat ttgttcaaat aatttgagtt ttgtcgaata attactcttc 7440 gatttgtgat ttctatctag atctggtgtt agtttctagt ttgtgcgatc gaatttgtcg 7500 attaatctga gtttttctga ttaacaggat tcttctaacg gacttctcct ctctggatct 7560 gataacaact ctccttctga tgatgttggt gctcctgctg atgtgagaga tagaatcgat 7620 tctgtggtga acgatgatgc tcaaggtact gctaacctcg ctggtgataa taacggtgga 7680 ggtgataaca atggtggagg aagaggtgga ggtgaaggta gaggaaacgc tgatgctact 7740 ttcacttaca gaccatctgt gcctgctcat agaagagcta gagagtctcc tctctcttct 7800 gatgctatct tcaagcagtc tcacgctgga cttttcaacc tctgtgtggt ggttcttatc 7860 gctgtgaact ctagactcat catcgagaac ctcatgaagt acggatggct catcagaact 7920 gatttctggt tctcttctag atctctcaga gattggcctc ttttcatgtg ctgcatctca 7980 ctctcaatct tccctctcgc tgcttttact gttgagaagc tcgtgctcca gaagtatatc 8040 gctgaacctg tggtgatctt cctccacatc atcatcacta tgactgaggt tctctaccct 8100 gtttacgtga ctctcagatg cgattctgct ttcctctctg gtgttactct tatgctcctc 8160 acttgcattg tgtggcttaa gctcgtgtct tacgctcaca cttcttacga tatcagatct 8220 ctcgctaacg ctgctgataa ggctaaccct gaagtgtctt actacgtgtc tctcaagtct 8280 -106-
151910·序列表.doc
201127957 ctcgcttact tcatggttgc tcctacactt tgttaccagc catcttaccc tagatctgct tgcattagaa agggatgggt ggcaagacaa ttcgctaagt tggtgatctt cactggattc atgggattca tcatcgagca gtacatcaac cctattgtga gaaactctaa gcaccctctc aagggtgatc ttctctacgc tatcgagaga gttcttaagc tctctgtgcc taacctttat gtgtggctct gcatgttcta ctgtttcttc cacctctggc ttaacatcct tgctgagttg ctttgcttcg gagatagaga gttctacgiag gattggtgga acgctaagtc tgttggagat tattggagaa tgtggaacat gcctgtgcat eiagtggatgg tgcgtcacat ctacttccct tgcctcagat ctaagatccc taagactctc gctatcatta tcgctttcct cgtgtctgct gttttccatg agttgtgtat cgctgttcct tgcagacttt tcaagctttg ggctttcctc ggaatcatgt tccaggttcc actcgtgttc atcactaact acctccaaga gagattcgga tctactgttg gaaacatgat tttctggttc attttctgca tcttcggaca gcctatgtgc gttctcctct actaccacga tctcatgaac agaaagggat ctatgtctta atgaaggatc cacccagctt tcttgtacaa agtggtgatg ggttcgeiaat cgataagctt ggatcctcta gagtcctgct ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct aatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata aatcttattc aaatttcaaa aggccccagg ggctagtatc tacgacacac cgagcggcga actaataacg ttcactgaag ggaactccgg ttccccgccg gcgcgcatgg gtgagattcc ttgaagttga gtattggccg tccgctctac cgaaagttac gggcaccatt 151910-序列表.doc -107- 8340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 9000 9060 9120 9180 9240 9300 9360 9420 9480 9540 9600 201127957 caacccggtc cagcacggcg gccgggtaac cgacttgctg ccccgagaat tatgcagcat 9660 ttttttggtg tatgtgggcc ccaaatgaag tgcaggtcaa accttgacag tgacgacaaa 9720 tcgttgggcg ggtccagggc gaattttgcg acaacatgtc gaggctcagc aggacctgca 9780 ggcatgcaag ctagcttact agtgatgcat attctatagt gtcacctaaa tctgcggccg 9840 cctgcaggtc gatatgggag agctcccaac gcgttggatg catagcttga gtattctata 9900 gtgtcaccta aatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 9960 tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 10020 ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 10080 aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 10140 tattggggct gagtggctcc ttcaacgttg cggttctgtc agttccaaac gtaaaacggc 10200 ttgtcccgcg tcatcggcgg gggtcataac gtgactccct taattctccg ctcatgatca 10260 gattgtcgtt tcccgccttc agtttaaact atcagtgttt gacaggatat attggcgggt 10320 aaacctaaga gaaaagagcg tttattagaa taatcggata tttaaaaggg cgtgaaaagg 10380 tttatccgtt cgtccatttg tatgtgcatg ccaaccacag ggttcccctc gggagtgctt 10440 ggcattccgt gcgataatga cttctgttca accacccaaa cgtcggaaag cctgacgacg 10500 gagcagcatt ccaaaaagat cccttggctc gtctgggtcg gctagaaggt cgagtgggct 10560 gctgtggctt gatccctcaa cgcggtcgcg gacgtagcgc agcgccgaaa aatcctcgat 10620 cgcaaatccg acgctgtcga aaatcgtgat ctgcttgtcg ctctttcggc cgacgtcctg 10680 gccagtcatc acgcgccaaa gttccgtcac aggatgatct ggcgcgagtt gctggatctc 10740 gccttcaatc cgggtctgtg gcgggaactc cacgaaaata tccgaacgca gcaagatgtc 10800 gacggatctt ttccgctgca taaccctgct tcggggtcat tatagcgatt ttttcggtat 10860 atccatcctt tttcgcacga tatacaggat tttgccaaag ggttcgtgta gactttcctt 10920 -108·
151910·序列表.doc 201127957
ggtgtatcca gttccttctt gaggctggcc agccaaccag gctccagtgg cgtaacggca tggcaactgc atggccatga acgattttac gcagtgacgt cgcgccagcg tattcggtga acgtggtgat tgcacgtaat agcacctggc acaaagtcat aaccaggaag tgaggaaaag gggctacaaa tggcgacctg ggcgcggttc cgagcttggc acggcgtcag cactgtccct ggctaccgcc gggtgatgct cttctgtttc aaagcaccgc agttcactta atggcgttgg gtcacttaaa catcgtctgc ctggctgttt acgcactatg atggatgacg cagcaagcga acggctggga cgggcattat ggcagcccac gcggcggcgg atcacgggcg ggccgcctgg ggtgatgcca aaggtcatga ccgggcagga tattcgcacc ggcgtaacag gccaacttac tatcagctgt cggacatcag caccgcttct atgccgggca aaactcaggc gcggaaatgg tacgcgtatg gcgacgctgg gatggctggc tatacgcagc cggaagtcgc ctgaacataa ctatcaaggt ccggcatgag tcgtggacta gcggcctgct cgatcctcgc tgggcgtggt taggtgaagt tggcggtgct atgagggcaa tgatttagtg ccctcctgtt cgctatctct caacccggta acagcccgca cgcagtcggt acgaacagtg acagtctccg ggcgtcttat cgctgtatga gaattgagcg tgtcgttctc aacactatca gtactgcctt cctgtcggcc tgagcacgtc gaaactctgg cctgctggcg ccgcccgagg aggcccaccc caacgggaat gcggatggct tatgatggtg cagctactga gctctcactg cgcaccagaa ttatgggcgt aacctcgcgc gggctatgtc gaagacggtt gagcctgctg atcccgcctg gcataacctg aaaatcggtg ataagttgga ccagacgaac tacctgctgg cgcgagctgg ctcaccgacg aagatcgaag gcagagccat gcgagcgggt cctgctctgc gatgaaacca tttttgaggt
Cggggtggtg ccgtaaaaca aatcattgat tggcctcaac atacagccgg ggggctaaat gttgcgcacg tcaccctttg aagggaaagc aatctgaggc gagctgcatg gtcattaccc gaagagcgat ccgtcggcca cccgcatcaa acccgcgcac agaagcagga gactttttta 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 11640 11700 11760 11820 11880 11940 12000 12060 12120 12180 12240 •109· 151910-序列表.doc 201127957 gccgctaaaa cggccggggg gtgcgcgtga agaagagcga cttcgcggag ctggtattcg agaaggacgg ccagacggtc tacgggaccg acaccaaggc accaggcggg tcaaatcagg gggcaatccc gcaaggaggg tgaatgaatc aactgatcga cgcggggttt tccgccgagg tgcgtgcgcc ccgcgaaacc ttccagtccg agatcgagcg cgacagcgtg caactggctc tggagcgttc gcgtcgtctc gaacaggagg acacgcgagg aactatgacg accaagaagc aggtcagcga ggccaagcag gccgcgttgc tgcagctttc cttgttcgat attgcgccgt acacggcccg ctctgccctg ttcaccacgc aaaacaaggt cattttccac gtcaacaagg tgcgggccga cgatgacgaa ctggtgtggc ctatcggcga gccgatcacc ttcacgttct tcaatggccg gtattacacg aaggccgagg tgggcttcac gtccgaccgc gttgggcacc gcgtcctgga ccgtggcaag aaaacgtccc tcgtgctgtt tgctggcgac cactacacga cgccgacggc ccgacggatg ttcgactatt agctggaaac cttccgcctc atgtgcggat ttgccaagca cgtccccatg cgctccatca 12300 tgcagggcaa gattcggaat accaagtacg 12360 acttcattgc cgataaggtg gattatctgg 12420 aataagggca cattgccccg gcgtgagtcg 12480 ggacgtttga ccggaaggca tacaggcaag 12540 atgccgaaac catcgcaagc cgcaccgtca 12600 tcggctcgat ggtccagcaa gctacggcca 12660 cccctgccct gcccgcgcca tcggccgccg 12720 cggcaggttt ggcgaagtcg atgaccatcg 12780 gaaaaaccgc cggcgaggac ctggcaaaac 12840 tgaaacacac gaagcagcag atcaaggaaa 12900 ggccggacac gatgcgagcg atgccaaacg 12960 gcaacaagaa aatcccgcgc gaggcgctgc 13020 acgtgaagat cacctacacc ggcgtcgagc 13080 agcaggtgtt ggagtacgcg aagcgcaccc 13140 acgagctttg ccaggacctg ggctggtcga 13200 aatgcctgtc gcgcctacag gcgacggcga 13260 tggaatcggt gtcgctgctg caccgcttcc 13320 gttgccaggt cctgatcgac gaggaaatcg 13380 aattcatatg ggagaagtac cgcaagctgt 13440 tcagctcgca ccgggagccg tacccgctca 13500 cggattccac ccgcgtgaag aagtggcgcg 13560 -110- 151910·序列表.doc
201127957 agcaggtcgg cgaagcctgc gaagagttgc gaggcagcgg cctggtggaa cacgcctggg tcaatgatga cctggtgcat tgcaaacgct agggccttgt ggggtcagtt ccggctgggg gttcagcagc cagcgcttta ctggcatttc aggaacaagc gggcactgct cgacgcactt gcttcgctca gtatcgctcg ggacgcacgg cgcgctctac gaactgccga taaacagagg atteiaaattg acaattgtga ttaaggctca gattcgacgg cttggagcgg ccgacgtgca ggatttccgc gagatccgat tgtcggccct gaagaaagct ccagagatgt tcgggtccgt ttacgagcac gaggagaaaa agcccatgga ggcgttcgct gaacggttgc gagatgccgt ggcattcggc gcctacatcg acggcgagat cattgggctg tcggtcttca aacaggagga cggccccaag gacgctcaca aggcgcatct gtccggcgtt ttcgtggagc ccgaacagcg aggccgaggg gtcgccggta tgctgctgcg ggcgttgccg gcgggtttat tgctcgtgat gatcgtccga cagattccaa cgggaatctg gtggatgcgc atcttcatcc tcggcgcact taatatttcg ctattctgga gcttgttgtt tatttcggtc taccgcctgc. cgggcggggt cgcggcgacg gtaggcgctg tgcagccgct gatggtcgtg ttcatctctg ccgctctgct aggtagcccg atacgattga tggcggtcct gggggctatt tgcggaactg cgggcgtggc gctgttggtg ttgacaccaa acgcagcgct agatcctgtc ggcgtcgcag cgggcctggc gggggcggtt tccatggcgt tcggaaccgt gctgacccgc aagtggcaac ctcccgtgcc tctgctcacc tttaccgcct ggcaactggc ggccggagga cttctgctcg ttccagtagc tttagtgttt gatccgccaa tcccgatgcc tacaggaacc aatgttctcg gcctggcgtg gctcggcctg atcggagcgg gtttaaccta cttcctttgg ttccggggga tctcgcgact cgaacctaca gttgtttcct tactgggctt tctcagccgg gatggcgcta agaagctatt gccgccgatc ttcatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcaggcgct cttccgcttc ctcgctcact gactcgctgc gctcggtcgt tcggctgcgg 151910-序列表.doc • in· 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 14280 14340 14400 14460 14520 14580 14640 14700 14760 14820 14880 201127957 cgagcggtat cagctcactc aaaggcggta atacggttat ccacagaatc aggggataac 14940 gcaggaaaga acatgtgagc aaaaggccag caaaaggcca ggaaccgtaa aaaggccgcg 15000 ttgctggcgt ttttccatag gctccgcccc cctgacgagc atcacaaaaa tcgacgctca 15060 agtcagaggt ggcgaaaccc gacaggacta taaagatacc aggcgtttcc ccctggaagc 15120 tccctcgtgc gctctcctgt tccgaccctg ccgcttaccg gatacctgtc cgcctttctc 15180 ccttcgggaa gcgtggcgct ttctcaatgc tcacgctgta ggtatctcag ttcggtgtag 15240 gtcgttcgct ccaagctggg ctgtgtgcac gaaccccccg ttcagcccga ccgctgcgcc 15300 ttatccggta actatcgtct tgagtccaac ccggtaagac acgacttatc gccactggca 15360 gcagccactg gtaacaggat tagcagagcg aggtatgtag gcggtgctac agagttcttg 15420 aagtggtggc ctaactacgg ctacactaga aggacagtat ttggtatctg cgctctgctg 15480 aagccagtta ccttcggaaa aagagttggt agctcttgat ccggcaaaca aaccaccgct 15540 ggtagcggtg gtttttttgt ttgcaagcag cagattacgc gcagaaaaaa aggatatcaa 15600 gaagatcctt tgatcttttc tacggggtct gacgctcagt ggaacgaaaa ctcacgttaa 15660 gggattttgg tcatgagatt atcaaaaagg atcttcacct agatcctttt aaattaaaaa 15720 tgaagtttta aatcaatcta aagtatatat gagtaaactt ggtctgacag ttaccaatgc 15780 ttaatcagtg aggcacctat ctcagcgatc tgtctatttc gttcatccat agttgcctga 15840 ctccccgtcg tgtagataac tacgatacgg gagggcttac catctggccc cagtgctgca 15900 atgataccgc gagacccacg ctcaccggct ccagatttat cagcaataaa ccagccagcc 15960 ggaagggccg agcgcagaag tggtcctgca actttatccg cctccatcca gtctattaaa 16020 caagtggcag caacggattc gcaaacctgt cacgcctttt gtgccaaaag ccgcgccagg 16080 tttgcgatcc gctgtgccag gcgttaggcg tcatatgaag atttcggtga tccctgagca 16140 ggtggcggaa acattggatg ctgagaacca tttcattgtt cgtgaagtgt tcgatgtgca 16200 • 112·
151910-序列表.doc
201127957 cctatccgac caaggctttg aactatctac cagaagtgtg agcccctacc ggaaggatta catctcggat gatgactctg atgaagactc tgcttgctat ggcgcattca tcgaccaaga gcttgtcggg aagattgaac tcaactcaac atggaacgat ctagcctcta tcgaacacat tgttgtgtcg cacacgcacc gaggcaaagg agtcgcgcac agtctcatcg aatttgcgaa aaagtgggca ctaagcagac agctccttgg catacgatta gagacacaaa cgaacaatgt acctgcctgc aatttgtacg caaaatgtgg ctttactctc ggcggcattg acctgttcac gtataaaact agacctcaag tctcgaacga aacagcgatg tactggtact ggttctcggg agcacaggat gacgcctaac aattcattca agccgacacc gcttcgcggc gcggcttaat tcaggagtta aacatcatga gggaagcggt gatcgccgaa gtatcgactc aactatcaga ggtagttggc gtcatcgagc gccatctcga accgacgttg ctggccgtac atttgtacgg ctccgcagtg gatggcggcc tgaagccaca cagtgatatt gatttgctgg ttacggtgac cgtaaggctt gatgaaacaa cgcggcgagc tttgatcaac gaccttttgg aaacttcggc ttcccctgga gagagcgaga ttctccgcgc tgtagaagtc accattgttg tgcacgacga catcattccg tggcgttatc cagctaagcg cgaactgcaa tttggagaat ggcagcgcaa tgacattctt gcaggtatct tcgagccagc cacgatcgac attgatctgg ctatcttgct gacaaaagca agagaacata gcgttgcctt ggtaggtcca gcggcggagg aactctttga tccggttcct gaacaggatc tatttgaggc gctaaatgaa accttaacgc tatggaactc gccgcccgac tgggctggcg atgagcgaaa tgtagtgctt acgttgtccc gcatttggta cagcgcagta accggcaaaa tcgcgccgaa ggatgtcgct gccgactggg caatggagcg cctgccggcc cagtatcagc ccgtcatact tgaagctagg caggcttatc ttggacaaga agatcgcttg gcctcgcgcg cagatcagtt ggaagaattt gttcactacg tgaaaggcga gatcacciiag gtagtcggca aataatgtct aacaattcgt tcaagccgac gccgcttcgc 1519丨0-序列表.doc -113- 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 16920 16980 17040 17100 17160 17220 17280 17340 17400 17460 17520 201127957 ggcgcggctt ggttctaagc tttagtggat aagcaactac tgagagcaac gcttatatat tgggacaacg gcgcggcgtc ccaattttcg tgctctctaa cgaggggcgc aagggggggc aacaaggttt aaacgggcgg caataggtgc tcatctgtca tgtccacatc tggccagctc gggtgagtcg ttccgcgagg gcgtttctgg gcccggtgag aactcaagcg ttagagagct ctcgtacttg cgatggcatc gaagctcgtc ttccctatga gacaactcca taagcaatta tacgataata gttcatccaa agcgcaaatg ggtctcgcac aacttctttt ccacatctgg tatggcggca aagatgggag cttgccctga cagataacgg taaaatgtta ggagcttggc agcccctggg gggatgggag accccccttc ggcgtgcgcg ataaatattg gtttaaaagc aaacccttgc aaatgctgga gcccctcatc tgtcagcact gtagtcgcgc ccctcaagtg atctgtggga aactcgcgta cacgtcgccg gccgaaatcg gcccctcaag tgtcaacgtc tatccacaac gccggcggcc cgcgtttgca gggccataga cgtcggaaag gg ggggaagact atgcgcgatc ggggcaggca cttgctgacc ctactcccca tccaactacg cgacaatagt ccatcaaatt ttacgacaat agtcgcaacg tttcgccggc tactacgtca caaaaggatg ttctacaccc cttctgcggg gcattggtcg cctgaagatc atgtatctaa tgccattttt ggggtgaggc gcccgcgtta gcgggccggg gtcacgcgcc agggcgcagc aggttaaaag acaggttagc ttttctgcct gtggacagcc ctgcccctca agtgtcaagg tcaataccgc agggcactta aaatcaggcg ttttcgccga agcctgcccc tcatctgtca cgcccctcat ctgtcagtga ggccgcggtg tctcgcacac cggccgccag cccagcggcg tgttgaaggt 17580 tgccaattgt 17640 acatttctcc 17700 acgacaactc 17760 gaaatcgtag 17820 ttgccaacaa 17880 caaaaggggg 17940 tcataaatgg 18000 gcaactagcc 18060 cgttcgcggc 18120 agggttcgag 18180 cctggttaaa 18240 ggtggccgaa 18300 cctcaaatgt 18360 atcgcgcccc 18420 tccccaggct 18480 tttgcgaggc 18540 acgccgcgcc 18600 gggccaagtt 18660 ggcttcgacg 18720 agggcaacca 18780 18802 -114· 151910-序列表.doc
201127957 <210> 32 <211〉 18823 <212> DNA <213〉人工序列 <220〉 〈223> 人工 <400> 32 tcgacatcgt caacgttcac ttctaaagaa atagcgccac tcagcttcct cagcggcttt atccagcgat ttcctattat gtcggcatag ttctcaagat cgacagcctg tcacggttaa gcgagaaatg aataagaagg ctgataattc ggatctctgc gaggagatga tatttgatca caggcagcaa cgctctgtca tcgttacaat caacatgcta ccctccgcga gatcatccgt gtttcaaacc cggcagctta gttgccgttc ttccgaatag catcgggtaa catgagcaaa gtctgccgcc ttacaacggc tctcccgctg acgccgtccc ggactgatgg gctgcctgta tcgagtggtg attttgtgcc gagctgccgg tcggggagct gttggctggc tggtggcagg atatattgtg gtgtaaacaa attgacgctt agacaactta ataacacatt gcggacgttt ttaatgtact gaattcgccg ctcggtgtgt cgtagatact agcccctggg gcacttttga aatttgaata agatttatgt aatcagtctt ttaggtttga ccggttctgc cgcttttttt aaaattggat ttgtaataat aaaacgcaat tgtttgttat tgtggcgctc tatcatagat gtcgctataa acctattcag cacaatatat tgttttcatt ttaatattgt acatataagt agtagggtac aatcagtaaa ttgaacggag aatattattc ataeiaaatac gatagteiacg ggtgatatat tcattagaat gaaccgaaac cggcggtaag gatctgagct acacatgctc aggtttttta caacgtgcac aacagaiattg aaagcaaata tcatgcgatc ataggcgtct cgcatatctc attaaacaag tgaagatttg attcaaactc cattgagagc cctgactatg cattcggttt gacccttcca ggttgagaga cgatagcccc ctaccttaat taaggggccc 151910·序列表.doc 60 120 180 240 300 360 420 480 540 600 660 720 780 840 900 960 •115· 1020 201127957 cccctcgagg cccgggtcat gtccagctgc catgccgcgg cccgatgaca gtagagcgtg ggccgtccag ctcgccgtcc cgtccactcc gtggttgacg cgggcgtcgt ctggtgattt tgcgaaggat acttgctttg ggtccatctt caatgatggc atagctgggc atagcccttt tgctccacca ttttccacga tcttgaacga tctactgtcc tcgacggtat cgataagctt cagatctcgg tgacgggcag cagaaaccca cgtcatgcca ggggcatatc cgagcgcctc gcgaccacgc tcttgaagcc gagcccagtc ccgtccgctg tcgtaggcgt tgcgtgcctt acctcggcga cgagccaggg tgcggttcct gcggctcggt atggtgcaga ccgccggcat tctgggctca tggtagatcc cagcgtgtcc tctccaaatg agtgggattg tgcgtcatcc aagacgtggt tggaacgtct tgggaccact gtcggcagag atttgtaggt gccaccttcc aatggaatcc gaggaggttt ggtcttctga gactgtatct tgttatcaca tcaatccact tgctcctcgt gggtgggggt tagcctttcc tttatcgcaa ttttgatgaa gtgacagata gatatcgaat tcctgcagcc gaccggacgg ggcggtaccg gttcccgtgc ttgaagccgg gtgcatgcgc acgctcgggt ctgtgcctcc agggacttca gtggcggggg gagacgtaca ccaggggccc gcgtaggcga atagcgctcc cgcagacgga acggaagttg accgtgcttg gtccgcctcg gtggcacggc cctcgagaga gatagatttg aaatgaactt ccttatatag cttacgtcag tggagatatc tctttttcca cgatgctcct gcatcttgaa cgatagcctt ttttctactg tccttttgat cccgatatta ccctttgttg ttgatattct tggagtagac tgctttgaag acgtggttgg ccatctttgg gaccactgtc tgatggcatt tgtaggtgcc gctgggcaat ggaatccgag agggggatcc 1080 gcaggctgaa 1140 ccgcccgce^ 1200 cgttgggcag 1260 gcaggtgggt 1320 cggtcgactc 1380 tgccggcgac 1440 cgaggtcgtc 1500 tctcgatgta 1560 ggatgtcggc 1620 tagagagaga 1680 aggaaggtct 1740 acatcaatcc 1800 cgtgggtggg 1860 tcctttatcg 1920 gaagtgacag 1980 aaaagtctca 2040 gagagtgtcg 2100 aacgtcttct 2160 ggcagaggca 2220 accttccttt 2280 gaggtttccc 2340 •116- 151910·序列表.doc
201127957 gatattaccc tttgttgaaa agtctcaata gccctttggt cttctgagac tgtatctttg atattcttgg agtagacgag agtgtcgtgc tccaccatgt tgctgatagt gaccttaggc gacttttgaa cgcgcaataa tggtttctga cgtatgtgct tagctcatta aactccagaa acccattaac gcttacaatt tccattcgcc attcaggctg cgcaactgtt gggaagggcg atcggtgcgg gcctcttcgc tattacgcca gctggcgaaa gggggatgtg ctgcaaggcg attaagttgg gtaacgccag ggttttccca gtcacgacgt tgtaaaacga cggccagtga attgtaatac gactcactat agggcgaatt gggcccgacg tcgcatgctc ccggccgcca tggccgcggg atatcactag tgcggccgct cgacgaatta attccaatcc cacaaaaatc tgagcttaac agcacagttg ctcctctcag agcagaatcg ggtattcaac accctcatat caactactac gttgtgtata acggtccaca tgccggtata tacgatgact ggggttgtac aaaggcggca acaaacggcg ttcccggagt tgcacacaag aaatttgcca ctattacaga ggcaagagca gcagctgacg cgtacacaac aagtcagcaa acagacaggt tgaacttcat ccccaaagga gaagctcaac tcaagcccaa gagctttgct aaggccctaa caagcccacc aaagceiaaaa gcccactggc tcacgctagg aaccaaaagg cccagcagtg atccagcccc aaaagagatc tcctttgccc cggagattac aatggacgat ttcctctatc tttacgatct aggaaggaag ttcgaaggtg aaggtgacga cactatgttc accactgata atgagaaggt tagcctcttc aatttcagaa agaatgctga cccacagatg gttagagagg cctacgcagc aggtctcatc aagacgatct acccgagtaa caatctccag gagatcaaat accttcccaa gaaggttaaa gatgcagtca aaagattcag gactaattgc atcaagaaca cagagaaaga catatttctc aagatcagaa gtactattcc agtatggacg attcaaggct tgcttcataa accaaggcaa gtaatagaga ttggagtctc taaaaaggta gttcctactg aatctaaggc catgcatgga gtctaagatt caaatcgagg atctaacaga actcgccgtg aagactggcg 151910·序列表.doc -117- 2400 2460 2520 2580 2640 2700 2760 2820 2880 2940 3000 3060 3120 3180 3240 3300 3360 3420 3480 3540 3600 3660 201127957 aacegttcat acagagtctt ttacgactca atgacaagaa gaaaatcttc gtcaacatgg 3720 tggagcacga cactctggtc tactccaaaa atgtcaaaga tacagtctca gaagaccaaa 3780 gggctattga gacttttcaa caaaggataa tttcgggaaa cctcctcgga ttccattgcc 3840 cagctatctg tcacttcatc gaaaggacag tagaaaagga aggtggctcc tacaaatgcc 3900 atcattgcga taaaggaaag gctatcattc aagatctctc tgccgacagt ggtcccaaag 3960 atggaccccc acccacgagg agcatcgtgg aaaaagaaga cgttcceiacc acgtcttcaa 4020 agcaagtgga ttgatgtgac atctccactg acgtaaggga tgacgcaceia tcccactatc 4080 cttcgcaaga cccttcctct atateiaggeia gttcatttca tttggagagg acacgctcga 4140 ggaattcggt accccatcac aagtttgtac aaaaaagcag gctgcggccg cttgctccct 4200 taeiaaaaaac catggcatgt cattacggaa tggcatgtca ttacggatgt ggacaacagc 4260 aacagacttg tgcacctcat ctttgtcagc ttcaacctag agcatgtaga gttgtgaagg 4320 ctgctactgc tgttactgta aatttctgtg ttccttattc tctcaaaatc ttcgattttg 4380 ttttcgttcg atcccaattt cgtatatgtt ctttggttta gattctgtta atcttagatc 4440 gaagacgatt ttctgggttt gatcgttaga tatcatctta attctcgatt agggtttcat 4500 agatatcatc cgatttgttc aaataatttg agttttgtcg aataattact cttcgatttg 4560 tgatttctat ctagatctgg tgttagtttc tagtttgtgc gatcgaattt gtcgattaat 4620 ctgagttttt ctgattaaca ggctggagga tctcttcttg ttctctctgg acttactctc 4680 gctggaactg ttatcgctct cactatcgct acacctcttc tcgttatctt ctctcctgtt 4740 ctcgttcctg ctgtgatcac tatcttcctt ctcggagctg gatttcttgc ttctggtgga 4800 tttggagttg ctgctctctc tgttctctct tggatctaca gatacctcac tggatgtaaa 4860 catcctccag gtgctgattg tcttgagtct gcttgtaaga ctaagctcgc ttcttgtgct 4920 agagagatga aggattgtag agcagagcaa ttctcttgtc agcctgttgc tggatgttct 4980 • 118·
151910·序列表.doc
201127957 cagacttctt aatgaacata tggtcctgct ttaatgagat atgcgagacg cctatgatcg catgatattt gctttcaatt ctgttgtgca cgttgtaaaa aacctgagca tgtgtagctc agatccttac cgccggtttc ggttcattct eiatgaatata tcacccgtta ctatcgtatt tttatgaata atattctccg ttcaatttac tgattgtacc ctactactta tatgtacaat attaaaatga aaacaatata ttgtgctgaa taggtttata gcgacatcta tgatagagcg ccacaataac aaacaattgc gttttattat tacaaatcca attttaaaaa aagcggcaga accggtcaaa cctaaaagac tgattacata aatcttattc aaatttcaaa aggccccagg ggctagtatc tacgacacac cgagcggcga actaataacg ttcactgaag ggaactccgg ttccccgccg gcgcgcatgg gtgagattcc ttgaagttga gtattggccg tccgctctac cgaaagttac gggcaccatt caacccggtc cagcacggcg gccgggtaac cgacttgctg ccccgagaat tatgcagcat ttttttggtg tatgtgggcc ccaaatgaag tgcaggtcaa accttgacag tgacgacaaa tcgttgggcg ggtccagggc gaattttgcg acaacatgtc gaggctcagc aggacctgca ggcatgcaag ctagcttact Eigtgatgcat attctatagt gtcacctaaa tcttcgacga attaattcca atcccacaaa aatctgagct taacagcaca gttgctcctc tcagagcaga atcgggtatt caacaccctc atatcaacta ctacgttgtg tataacggtc cacatgccgg tatatacgat gactggggtt gtacaaaggc ggcaacaaac ggcgttcccg gagttgcaca caagaaattt gccactatta cagaggcaag agcagcagct gacgcgtaca caacaagtca gcaaacagac aggttgaact tcatccccaa aggagaagct caactcaagc ccaagagctt tgctaaggcc ctaacaagcc caccaaagca aaaagcccac tggctcacgc taggaaccaa aaggcccagc agtgatccag ccccaaaaga gatctccttt gccccggaga ttacaatgga cgatttcctc tatctttacg atctaggaag gaagttcgaa ggtgaaggtg acgacactat gttcaccact gataatgaga aggttagcct cttcaatttc 151910·序列表.doc -119- 5040 5100 5160 5220 5280 5340 5400 5460 5520 5580 5640 5700 5760 5820 5880 5940 6000 6060 6120 6180 6240 6300 201127957 agaaagaatg ctgacccaca gatggttaga gaggcctacg cagcaggtct catcaagacg 6360 atctacccga gtaacaatct ccaggagatc aaataccttc ccaagaaggt taaagatgca 6420 gtcaaaagat tcaggactaa ttgcatcaag aacacagaga aagacatatt tctcaagatc 6480 agaagtacta ttccagtatg gacgattcaa ggcttgcttc ataaaccaag gcaagtaata 6540 gagattggag tctctaaaaa ggtagttcct actgaatcta aggccatgca tggagtctaa 6600 gattcaaatc gaggatctaa cagaactcgc cgtgaagact ggcgaacagt tcatacagag 6660 tcttttacga ctcaatgaca agaagaaaat cttcgtcaac atggtggagc acgacactct 6720 ggtctactcc aaaaatgtca aagatacagt ctcagaagac caaagggcta ttgagacttt 6780 tcaacaaagg ataatttcgg gaaacctcct cggattccat tgcccagcta tctgtcactt 6840 catcgaaagg acagtagaaa aggaaggtgg ctcctacaaa tgccatcatt gcgataaagg 6900 aaaggctatc attcaagatc tctctgccga cagtggtccc aaagatggac ccccacccac 6960 gaggagcatc gtggaaaaag aagacgttcc aaccacgtct tcaaagcaag tggattgatg 7020 tgacatctcc actgacgtaa gggatgacgc acaatcccac tatccttcgc aagacccttc 7080 ctctatataa ggaagttcat ttcatttgga gaggacacgg gatccttgct ccgttaaaaa 7140 aaaccatggc tatcctcgat tctgctggtg ttactactgt gactgagaat ggtggtggag 7200 agttcgttga tctcgataga ctcagaagaa gaaagtctag atctgtaaat ttctgtgttc 7260 cttattctct caaaatcttc gattttgttt tcgttcgatc ccaatttcgt atatgttctt 7320 tggtttagat tctgttaatc ttagatcgaa gacgattttc tgggtttgat cgttagatat 7380 catcttaatt ctcgattagg gtttcataga tatcatccga tttgttcaaa taatttgagt 7440 tttgtcgaat aattactctt cgatttgtga tttctatcta gatctggtgt tagtttctag 7500 tttgtgcgat cgaatttgtc gattaatctg agtttttctg attaacagga ttcttctaac 7560 ggacttctcc tctctggatc tgataacaac tctccttctg atgatgttgg tgctcctgct 7620 • 120- 1519丨0-序列表.doc
201127957 gatgtgagag atagaatcga ttctgtggtg aacgatgatg ctcaaggtac tgctaacctc gctggtgata ataacggtgg aggtgataac aatggtggag gaagaggtgg aggtgaaggt agaggaaacg ctgatgctac tttcacttac agaccatctg tgcctgctca tagaagagct agagagtctc ctctctcttc tgatgctatc ttcaagcagt ctcacgctgg acttttcaac ctctgtgtgg tggttcttat cgctgtgaac tctagactca tcatcgagaa cctcatgaag tacggatggc tcatcagaac tgatttctgg ttctcttcta gatctctcag agattggcct cttttcatgt gctgcatctc actctcaatc ttccctctcg ctgcttttac tgttgagaag ctcgtgctcc agaagtatat cgctgaacct gtggtgatct tcctccacat catcatcact atgactgagg ttctctaccc tgtttacgtg actctcagat gcgattctgc tttcctctct ggtgttactc ttatgctcct cacttgcatt gtgtggctta agctcgtgtc ttacgctcac acttcttacg atatcagatc tctcgctaac gctgctgata aggctaaccc tgaagtgtct tactacgtgt ctctcaagtc tctcgcttac ttcatggttg ctcctacact ttgttaccag ccatcttacc ctagatctgc ttgcattaga aagggatggg tggcaagaca attcgctaag ttggtgatct tcactggatt catgggattc atcatcgagc agtacatcaa ccctattgtg agaaactcta agcaccctct caagggtgat cttctctacg ctatcgagag agttcttaag ctctctgtgc ctaaccttta tgtgtggctc tgcatgttct actgtttctt ccacctctgg cttaacatcc ttgctgagtt gctttgcttc ggagatagag agttctacaa ggattggtgg aacgctaagt ctgttggaga ttattggaga atgtggaaca tgcctgtgca teiagtggatg gtgcgtcaca tctacttccc ttgcctcaga tctaagatcc ctaagactct cgctatcatt atcgctttcc tcgtgtctgc tgttttccat gagttgtgta tcgctgttcc ttgcagactt ttcaagcttt gggctttcct cggaatcatg ttccaggttc cactcgtgtt catcactaac tacctccaag agagattcgg atctactgtt ggaaacatga ttttctggtt cattttctgc 151910-序列表.doc -121 - 7680 7740 7800 7860 7920 7980 8040 8100 8160 8220 8280 8340 8400 8460 8520 8580 8640 8700 8760 8820 8880 8940 201127957 atcttcggac agcctatgtg cgttctcctc tactaccacg atctcatgaa cagaaaggga 9000 tctatgtctt aatgaaggat ccacccagct ttcttgtaca aagtggtgat gggttcgaaa 9060 tcgataagct tggatcctct agagtcctgc tttaatgaga tatgcgagac gcctatgatc 9120 gcatgatatt tgctttcaat tctgttgtgc acgttgtaaa aaacctgagc atgtgtagct 9180 cagatcctta ccgccggttt cggttcattc taatgaiatat atcacccgtt actatcgtat 9240 ttttatgaat aatattctcc gttcaattta ctgattgtac cctactactt atatgtacaa 9300 tattaaaatg aaaacaatat attgtgctga ataggtttat agcgacatct atgatagagc 9360 gccacaataa caaacaattg cgttttatta ttacaaatcc aattttaaaa aaagcggcag 9420 aaccggtcaa acctaaaaga ctgattacat aaatcttatt caaatttcaa aaggccccag 9480 gggctagtat ctacgacaca ccgagcggcg aactaataac gttcactgaa gggaactccg 9540 gttccccgcc ggcgcgcatg ggtgagattc cttgaagttg agtattggcc gtccgctcta 9600 ccgaaagtta cgggcaccat tcaacccggt ccagcacggc ggccgggtaa ccgacttgct 9660 gccccgagaa ttatgcagca tttttttggt gtatgtgggc cccaaatgeia gtgcaggtca 9720 aaccttgaca gtgacgacaa atcgttgggc gggtccaggg cgaattttgc gacaacatgt 9780 cgaggctcag caggacctgc aggcatgcaa gctagcttac tagtgatgca tattctatag 9840 tgtcacctaa atctgcggcc gcctgcaggt cgatatggga gagctcccaa cgcgttggat 9900 gcatagcttg agtattctat agtgtcacct aaatagcttg gcgtaatcat ggtcatagct 9960 gtttcctgtg tgaaattgtt atccgctcac eiattccacac aacatacgag ccggaagcat 10020 aaagtgtaaa gcctggggtg cctaatgagt gagctaactc acattaattg cgttgcgctc 10080 actgcccgct ttccagtcgg gaaacctgtc gtgccagctg cattaatgaa tcggccaacg 10140 cgcggggaga ggcggtttgc gtattggggc tgagtggctc cttcaacgtt gcggttctgt 10200 cagttccaaa cgtaaaacgg cttgtcccgc gtcatcggcg ggggtcataa cgtgactccc 10260 -122·
151910·序列表.doc
201127957 ttaattctcc gctcatgatc agattgtcgt ttcccgcctt cagtttaaac tatcagtgtt tgacaggata tattggcggg taaacctaag agaaaagagc gtttattaga ataatcggat atttaaaagg gcgtgaaaag gtttatccgt tcgtccattt gtatgtgcat gccaaccaca gggttcccct cgggagtgct tggcattccg tgcgataatg acttctgttc aaccacccaa acgtcggaaa gcctgacgac ggagcagcat tccaaaaaga tcccttggct cgtctgggtc ggctagaagg tcgagtgggc tgctgtggct tgatccctca acgcggtcgc ggacgtagcg cagcgccgaa aaatcctcga tcgcaaatcc gacgctgtcg aaaatcgtga tctgcttgtc gctctttcgg ccgacgtcct ggccagtcat cacgcgccaa agttccgtca caggatgatc tggcgcgagt tgctggatct cgccttcaat ccgggtctgt ggcgggaact ccacgaaaat atccgaacgc agcaagatgt cgacggatct tttccgctgc ataaccctgc ttcggggtca ttatagcgat tttttcggta tatccatcct ttttcgcacg atatacagga ttttgccaaa gggttcgtgt agactttcct tggtgtatcc aacggcgtca gccgggcagg ataggtgaag taggcccacc cgcgagcggg tgttccttct tcactgtccc ttattcgcac ctggcggtgc tcaacgggaa tcctgctctg cgaggctggc cggctaccgc cggcgtaaca gatgagggca agcggatggc tgatgaaacc aagccaacca ggggtgatgc tgccaactta ctgatttagt gtatgatggt gtttttgagg tgctccagtg gcttctgttt ctatcagctg tccctcctgt tcagctactg acggggtggt gcgtaacggc aaaagcaccg ccggacatca gcgctatctc tgctctcact gccgtaaaac atggcaactg cagttcactt acaccgcttc tcaacccggt acgcaccaga aaatcattga tatggccatg aatggcgttg gatgccgggc aacagcccgc attatgggcg ttggcctcaa cacgatttta cgtcacttaa aaaactcagg ccgcagtcgg taacctcgcg catacagccg ggcagtgacg tcatcgtctg cgcggaaatg gacgaacagt ggggctatgt cggggctaaa tcgcgccagc gctggctgtt ttacgcgtat gacagtctcc 151910·序列表.doc •123· 10320 10380 10440 10500 10560 10620 10680 10740 10800 10860 10920 10980 11040 11100 11160 11220 11280 11340 11400 11460 11520 11580 201127957 ggaagacggt tgttgcgcac gtattcggtg aacgcactat ggcgacgctg gggcgtctta 11640 tgagcctgct gtcacccttt gacgtggtga tatggatgac ggatggctgg ccgctgtatg 11700 aatcccgcct gaagggaaag ctgcacgtaa tcagcaagcg atatacgcag cgaattgagc 11760 ggcataacct gaatctgagg cagcacctgg cacggctggg acggaagtcg ctgtcgttct 11820 caaaatcggt ggagctgcat gacaaagtca tcgggcatta tctgaacata aeiacactatc 11880 aataagttgg agtcattacc caaccaggaa gggcagccca cctatcaagg tgtactgcct 11940 tccagacgaa cgaagagcga ttgaggaaaa ggcggcggcg gccggcatga gcctgtcggc 12000 ctacctgctg gccgtcggcc agggctacaa aatcacgggc gtcgtggact atgagcacgt 12060 ccgcgagctg gcccgcatca atggcgacct gggccgcctg ggcggcctgc tgaaactctg 12120 gctcaccgac gacccgcgca cggcgcggtt cggtgatgcc acgatcctcg ccctgctggc 12180 gaagatcgaa gagaagcagg acgagcttgg caaggtcatg atgggcgtgg tccgcccgag 12240 ggcagagcca tgactttttt agccgctaaa acggccgggg ggtgcgcgtg attgccaagc 12300 acgtccccat gcgctccatc aagaagagcg acttcgcgga gctggtattc gtgcagggca 12360 agattcggaa taccaagtac gagaaggacg gccagacggt ctacgggacc gacttcattg 12420 ccgataaggt ggattatctg gacaccaagg caccaggcgg gtcaaatcag gaataagggc 12480 acattgcccc ggcgtgagtc ggggcaatcc cgcaaggagg gtgaatgaat cggacgtttg 12540 accggaaggc atacaggcaa gaactgatcg acgcggggtt ttccgccgag gatgccgaaa 12600 ccatcgcaag ccgcaccgtc atgcgtgcgc cccgcgaaac cttccagtcc gtcggctcga 12660 tggtccagca agctacggcc aagatcgagc gcgacagcgt gcaactggct ccccctgccc 12720 tgcccgcgcc atcggccgcc gtggagcgtt cgcgtcgtct cgaacaggag gcggcaggtt 12780 tggcgaagtc gatgaccatc gacacgcgag gaactatgac gaccaagaag cgaaaaaccg 12840 ccggcgagga cctggcaaaa caggtcagcg aggccaagca ggccgcgttg ctgaaacaca 12900 -124-
151910-序列表.doc
201127957 cgaagcagca gatcaaggaa atgcagcttt ccttgttcga tattgcgccg tggccggaca cgatgcgagc gatgccaaac gacacggccc gctctgccct gttcaccacg cgcaacaaga aaatcccgcg cgaggcgctg caaaacaagg tcattttcca cgtcaacaag gacgtgEiaga tcacctacac cggcgtcgag ctgcgggccg acgatgacga actggtgtgg cagcaggtgt tggagtacgc gaagcgcacc cctatcggcg agccgatcac cttcacgttc tacgagcttt gccaggacct gggctggtcg atcsiatggcc ggtattacac gaaggccgag gaatgcctgt cgcgcctaca ggcgacggcg atgggcttca cgtccgaccg cgttgggcac ctggaatcgg tgtcgctgct gcaccgcttc cgcgtcctgg accgtggcaa gaaaacgtcc cgttgccagg tcctgatcga cgaggaaatc gtcgtgctgt ttgctggcga ccactacacg aaattcatat gggagaagta ccgceiagctg tcgccgacgg cccgacggat gttcgactat ttcagctcgc accgggagcc gtacccgctc aagctggaaa ccttccgcct catgtgcgga tcggattcca cccgcgtgaa gaagtggcgc gagcaggtcg gcgaagcctg cgaagagttg cgaggcagcg gcctggtgga acacgcctgg gtcaatgatg acctggtgca ttgcaaacgc tagggccttg tggggtcagt tccggctggg ggttcagcag ccagcgcttt actggcattt caggaacaag cgggcactgc tcgacgcact tgcttcgctc agtatcgctc gggacgcacg gcgcgctcta cgaactgccg ataaacagag gattaaaatt gacaattgtg attaaggctc agattcgacg gcttggagcg gccgacgtgc aggatttccg cgagatccga ttgtcggccc tgaagaaagc tccagagatg ttcgggtccg tttacgagca cgaggagaaa aagcccatgg aggcgttcgc tgaacggttg cgagatgccg tggcattcgg cgcctacatc gacggcgaga tcattgggct gtcggtcttc aaacaggagg acggccccaa ggacgctcac aaggcgcatc tgtccggcgt tttcgtggag cccgaacagc gaggccgagg ggtcgccggt atgctgctgc gggcgttgcc ggcgggttta ttgctcgtga tgatcgtccg acagattcca acgggaatct ggtggatgcg 151910-序列表.doc -125- 12960 13020 13080 13140 13200 13260 13320 13380 13440 13500 13560 13620 13680 13740 13800 13860 13920 13980 14040 14100 14160 14220 201127957 catcttcatc ctcggcgcac ttaatatttc gctattctgg agcttgttgt ttatttcggt 14280 ctaccgcctg ccgggcgggg tcgcggcgac ggtaggcgct gtgcagccgc tgatggtcgt 14340 gttcatctct gccgctctgc taggtagccc gatacgattg atggcggtcc tgggggctat 14400 ttgcggaact gcgggcgtgg cgctgttggt gttgacacca aacgcagcgc tagatcctgt 14460 cggcgtcgca gcgggcctgg cgggggcggt ttccatggcg ttcggaaccg tgctgacccg 14520 caagtggcaa cctcccgtgc ctctgctcac ctttaccgcc tggcaactgg cggccggagg 14580 acttctgctc gttccagtag ctttagtgtt tgatccgcca atcccgatgc ctacaggaac 14640 caatgttctc ggcctggcgt ggctcggcct gatcggagcg ggtttaacct acttcctttg 14700 gttccggggg atctcgcgac tcgaacctac agttgtttcc ttactgggct ttctcagccg 14760 ggatggcgct siagaagctat tgccgccgat cttcatatgc ggtgtgaaat accgcacaga 14820 tgcgtaagga gaaaataccg catcaggcgc tcttccgctt cctcgctcac tgactcgctg 14880 cgctcggtcg ttcggctgcg gcgagcggta tcagctcact caaaggcggt aatacggtta 14940 tccacagaat caggggataa cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc 15000 aggaaccgta aaaaggccgc gttgctggcg tttttccata ggctccgccc ccctgacgag 15060 catcacaaaa atcgacgctc aagtcagagg tggcgaaacc cgacaggact ataaagatac 15120 caggcgtttc cccctggaag ctccctcgtg cgctctcctg ttccgaccct gccgcttacc 15180 ggatacctgt ccgcctttct cccttcggga agcgtggcgc tttctcaatg ctcacgctgt 15240 aggtatctca gttcggtgta ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc 15300 gttcagcccg accgctgcgc cttatccggt aactatcgtc ttgagtccaa cccggtaaga 15360 cacgacttat cgccactggc agcagccact ggtaacagga ttagcagagc gaggtatgta 15420 ggcggtgcta cagagttctt gaagtggtgg cctaactacg gctacactag aaggacagta 15480 tttggtatct gcgctctgct gaagccagtt accttcggaa aaagagttgg tagctcttga 15540 -126·
1519丨0·序列表.doc
201127957 tccggcaaac aaaccaccgc tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatatca agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta agggattttg gtcatgagEit tatcaaaaag gatcttcacc tagatccttt taaattaaaa atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa acaagtggca gcaacggatt cgcaaacctg tcacgccttt tgtgccaaaa gccgcgccag gtttgcgatc cgctgtgcca ggcgttaggc gtcatatgaa gatttcggtg atccctgagc aggtggcgga aacattggat gctgagaacc atttcattgt tcgtgaagtg ttcgatgtgc acctatccga ccaaggcttt gaactatcta ccagaagtgt gagcccctac cggaaggatt acatctcgga tgatgactct gatgaagact ctgcttgcta tggcgcattc atcgaccaag agcttgtcgg gaagattgaa ctcaactcaa catggaacga tctagcctct atcgaacaca ttgttgtgtc gcacacgcac cgaggcaaag gagtcgcgca cagtctcatc gaatttgcga aaaagtgggc actaagcaga cagctccttg gcatacgatt agagacaceia acgaacaatg tacctgcctg caatttgtac gcaaaatgtg gctttactct cggcggcatt gacctgttca cgtataaaac tagacctcaa gtctcgeiacg aaacagcgat gtactggtac tggttctcgg gagcacagga tgacgcctaa caattcattc aagccgacac cgcttcgcgg cgcggcttaa ttcaggagtt aaacatcatg agggaagcgg tgatcgccga agtatcgact caactatcag aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt gctggccgta catttgtacg gctccgcagt ggatggcggc ctgaagccac acagtgatat 151910-序列表.doc -127- 15600 15660 15720 15780 15840 15900 15960 16020 16080 16140 16200 16260 16320 16380 16440 16500 16560 16620 16680 16740 16800 16860 201127957 tgatttgctg gttacggtga ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa 16920 cgaccttttg gaaacttcgg cttcccctgg agagagcgag attctccgcg ctgtagaagt 16980 caccattgtt gtgcacgacg acatcattcc gtggcgttat ccagctaagc gcgaactgca 17040 atttggagaa tggcagcgca atgacattct tgcaggtatc ttcgagccag ccacgatcga 17100 cattgatctg gctatcttgc tgacaaaagc aagagaacat agcgttgcct tggtaggtcc 17160 agcggcggag gaactctttg atccggttcc tgaacaggat ctatttgagg cgctaaatga 17220 aaccttaacg ctatggaact cgccgcccga ctgggctggc gatgagcgaa atgtagtgct 17280 tacgttgtcc cgcatttggt acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc 17340 tgccgactgg gcaatggagc gcctgccggc ccagtatcag cccgtcatac ttgaagctag 17400 gcaggcttat cttggaceiag aagatcgctt ggcctcgcgc gcagatcagt tggaagaatt 17460 tgttcactac gtgaaaggcg agatcaccaa ggtagtcggc aaataatgtc taacaattcg 17520 ttcaagccga cgccgcttcg cggcgcggct taactcaagc gttagagagc tggggaagac 17580 tatgcgcgat ctgttgaagg tggttctaag cctcgtactt gcgatggcat cggggcaggc 17640 acttgctgac ctgccaattg ttttagtgga tgaagctcgt cttccctatg actactcccc 17700 atccaactac gacatttctc caagcaacta cgacaactcc ataagcaatt acgacaatag 17760 tccatcaaat tacgacaact ctgagagcaa ctacgataat agttcatcca attacgacaa 17820 tagtcgcaac ggaaatcgta ggcttatata tagcgcaaat gggtctcgca ctttcgccgg 17880 ctactacgtc attgccaaca atgggacaac gaacttcttt tccacatctg gcaaaaggat 17940 gttctacacc ccaaaagggg ggcgcggcgt ctatggcggc aaagatggga gcttctgcgg 18000 ggcattggtc gtcataaatg gccaattttc gcttgccctg acagataacg gcctgaagat 18060 catgtatcta agcaactagc ctgctctcta ataaaatgtt aggagcttgg ctgccatttt 18120 tggggtgagg ccgttcgcgg ccgaggggcg cagcccctgg ggggatggga ggcccgcgtt 18180 •128·
151910-序列表.doc
201127957 agcgggccgg gagggttcga gaaggggggg cacccccctt cggcgtgcgc ggtcacgcgc cagggcgcag ccctggttaa aaacaaggtt tataaatatt ggtttaaaag caggttaaaa gacaggttag cggtggccga aaaacgggcg gaaacccttg caaatgctgg attttctgcc tgtggacagc ccctcaaatg tcaataggtg cgcccctcat ctgtcagcac tctgcccctc aagtgtcaag gatcgcgccc ctcatctgtc agtagtcgcg cccctcaagt gtcaataccg cagggcactt atccccaggc ttgtccacat catctgtggg aaactcgcgt aaaatcaggc gttttcgccg atttgcgagg ctggccagct ccacgtcgcc ggccgaaatc gagcctgccc ctcatctgtc aacgccgcgc cgggtgagtc ggcccctcaa gtgtcaacgt ccgcccctca tctgtcagtg agggccaagt tttccgcgag gtatccacaa cgccggcggc cggccgcggt gtctcgcaca cggcttcgac ggcgtttctg gcgcgtttgc agggccatag acggccgcca gcccagcggc gagggcaacc agcccggtga gcgtcggaaa ggg <210〉 33 <211〉 520 〈212〉 PRT <213〉人工序列 <220〉 <223〉人工 <400> 33
Met Ala lie Leu Asp Ser Ala Gly Val Thr Thr Val Thr Glu Asn Gly 15 10 15
Gly Gly Glu Phe Val Asp Leu Asp Arg Leu Arg Arg Arg Lys Ser Arg 20 25 30
Ser Asp Ser Ser Asn Gly Leu Leu Leu Ser Gly Ser Asp Asn Asn Ser 35 40 45 151910·序列表.doc • 129· 18240 18300 18360 18420 18480 18540 18600 18660 18720 18780 18823 201127957
Pro Ser Asp Asp Val Gly Ala Pro Ala Asp Val Arg Asp Arg lie Asp 50 55 60
Ser Val Val Asn Asp Asp Ala Gin Gly Thr Ala Asn Leu Ala Gly Asp 65 70 75 80
Asn Asn Gly Gly Gly Asp Asn Asn Gly Gly Gly Arg Gly Gly Gly Glu 85 90 95
Gly Arg Gly Asn Ala Asp Ala Thr Phe Thr Tyr Arg Pro Ser Val Pro 100 105 110
Ala His Arg Arg Ala Arg Glu Ser Pro Leu Ser Ser Asp Ala lie Phe 115 120 125
Lys Gin Ser His Ala Gly Leu Phe Asn Leu Cys Val Val Val Leu lie 130 135 140
Ala Val Asn Ser Arg Leu lie He Glu Asn Leu Met Lys Tyr Gly Trp 145 150 155 160
Leu He Arg Thr Asp Phe Trp Phe Ser Ser Arg Ser Leu Arg Asp Trp 165 170 175
Pro Leu Phe Met Cys Cys lie Ser Leu Ser lie Phe Pro Leu Ala Ala 180 185 190
Phe Thr Val Glu Lys Leu Val Leu Gin Lys Tyr He Ala Glu Pro Val 195 200 205
Val lie Phe Leu His lie lie lie Thr Met Thr Glu Val Leu Tyr Pro 210 215 220 130-
151910·序列表.doc 201127957
Val Tyr Val Thr Leu Arg Cys Asp Ser Ala Phe Leu Ser Gly Val Thr 225 230 235 240
Leu Met Leu Leu Thr Cys lie Val Trp Leu Lys Leu Val Ser Tyr Ala 245 250 255
His Thr Ser Tyr Asp He Arg Ser Leu Ala Asn Ala Ala Asp Lys Ala 260 265 270
Asn Pro Glu Val Ser Tyr Tyr Val Ser Leu Lys Ser Leu Ala Tyr Phe 275 280 285
Met Val Ala Pro Thr Leu Cys Tyr Gin Pro Ser Tyr Pro Arg Ser Ala 290 295 300
Cys lie Arg Lys Gly Trp Val Ala Arg Gin Phe Ala Lys Leu Val lie 305 310 315 320
Phe Thr Gly Phe Met Gly Phe lie lie Glu Gin Tyr He Asn Pro lie 325 330 335
Val Arg Asn Ser Lys His Pro Leu Lys Gly Asp Leu Leu Tyr Ala He 340 345 350
Glu Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys 355 360 365
Met Phe Tyr Cys Phe Phe His Leu Trp Leu Asn He Leu Ala Glu Leu 370 375 380
Leu Cys Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys 385 390 395 400 131 · 151910·序列表.doc 201127957
Ser Val Gly Asp Tyr Trp Arg Met Trp Asn Met Pro Val His Lys Trp 405 410 415
Met Val Arg His lie Tyr Phe Pro Cys Leu Arg Ser Lys lie Pro Lys 420 425 430
Thr Leu Ala lie lie lie Ala Phe Leu Val Ser Ala Val Phe His Glu 435 440 445
Leu Cys lie Ala Val Pro Cys Arg Leu Phe Lys Leu Trp Ala Phe Leu 450 455 460
Gly lie Met Phe Gin Val Pro Leu Val Phe lie Thr Asn Tyr Leu Gin 465 470 475 480
Glu Arg Phe Gly Ser Thr Val Gly Asn Met He Phe Trp Phe He Phe 485 490 495
Cys lie Phe Gly Gin Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu 500 505 510
Met Asn Arg Lys Gly Ser Met Ser 515 520 <210> 34 <211〉 501 <212〉 DNA 〈213〉芝麻 <400〉 34 atggcggacc gcgaccgtcc acacccccac caaattcaag tccaccctca acatccgcac cgctatgaag gtggcgtcaa gtctctcctc cctcaaaagg gcccctccac cacccagatt 132- 151910·序列表.doc 180 201127957 ctcgccataa tcaccctcct tcccatcagc ggcacgcttc tttgcctagc tgggatcacg ctcgtcggga ccctcatcgg acttgcagtc gccaccccag tcttcgtgat cttcagccct gttctggttc ccgcagccat actgatagcc ggcgcggtca cggcgttttt gacgtccggg gcttttgggc tgacggggct ttcgtcgctt tcttgggttc tgaattcatt cagacgggcg acggggcagg ggccgttgga gtacgcgaag cgaggcgtgc aggaggggac tttgtatgtg ggagagaaga cgaagcaagc gggcgaagcg attaagagca cagccaagga aggagggcga gaagggactg cacggacttg a 240 300 360 420 480 501
<211〉 166 <212〉 PRT <213〉芝麻 〈400〉 35
Met Ala Asp Arg Asp Arg Pro His Pro His Gin lie Gin Val His Pro 15 10 15
Gin His Pro His Arg Tyr Glu Gly Gly Val Lys Ser Leu Leu Pro Gin 20 25 30
Lys Gly Pro Ser Thr Thr Gin lie Leu Ala lie lie Thr Leu Leu Pro 35 40 45 lie Ser Gly Thr Leu Leu Cys Leu Ala Gly lie Thr Leu Val Gly Thr 50 55 60
Leu lie Gly Leu Ala Val Ala Thr Pro Val Phe Val lie Phe Ser Pro 65 70 75 80
Val Leu Val Pro Ala Ala lie Leu lie Ala Gly Ala Val Thr Ala Phe 85 90 95 •133- 151910-序列表.doc 201127957
Leu Thr Ser Gly Ala Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Trp 100 105 110
Val Leu Asn Ser Phe Arg Arg Ala Thr Gly Gin Gly Pro Leu Glu Tyr 115 120 125
Ala Lys Arg Gly Val Gin Glu Gly Thr Leu Tyr Val Gly Glu Lys Thr 130 135 140
Lys Gin Ala Gly Glu Ala lie Lys Ser Thr Ala Lys Glu Gly Gly Arg 145 150 155 160
Glu Gly Thr Ala Arg Thr 165 <210> 36 <211〉 559 <212〉 DNA <213〉芝麻 <400〉 36 ggcacgagcg ccgtccccat ggcggacgaa ccccacgacc agcgccccac cgacgtcatc 60 aagagctacc tccccgaaaa gggtccctcc acctctcaag tcctcgccgt cgtgaccctc 120 ttccccctcg gcgccgtcct cctctgccta gccggtctca ttcttaccgg gaccatcatc 180 ggcctcgccg tcgccacccc gctcttcgtc atcttcagcc ccatcttggt ccccgccgcc 240 ctaaccatcg ccctagccgt caccggtttc ttgacctccg gagctttcgg catcaccgcc 300 ctgtcctcga tttcgtggtt gctgaactac gttaggcgaa tgcgggggag cttgccagag 360 cagctggatc atgcacggcg gcgcgtgcag gagacggtgg gccagaagac aagggaggcg 420 gggcagagaa gccaagatgt aataagaccg tgaggttttt ggatattaga tgttggttaa 480 -134-
151910·序列表.doc 201127957 tttgtgtgtt taatgtatat atgaggggtt gaataagtta ataaaattgc ggatttggta caaaaaaaaa aaaaaaaaa 〈210〉 37 〈211〉 144 〈212〉 PRT <213〉芝麻 <400〉 37
Met Ala Asp Glu Pro His Asp Gin Arg Pro Thr Asp Val lie Lys Ser 15 10 15
Tyr Leu Pro Glu Lys Gly Pro Ser Thr Ser Gin Val Leu Ala Val Val 20 25 30
Thr Leu Phe Pro Leu Gly Ala Val Leu Leu Cys Leu Ala Gly Leu lie 35 40 45
Leu Thr Gly Thr lie lie Gly Leu Ala Val Ala Thr Pro Leu Phe Val 50 55 60 lie Phe Ser Pro He Leu Val Pro Ala Ala Leu Thr lie Ala Leu Ala
Val Thr Gly Phe Leu Thr Ser Gly Ala Phe Gly lie Thr Ala Leu Ser 85 90 95
Ser lie Ser Trp Leu Leu Asn Tyr Val Arg Arg Met Arg Gly Ser Leu 100 105 110
Pro Glu Gin Leu Asp His Ala Arg Arg Arg Val Gin Glu Thr Val Gly 115 120 125 •135· 151910·序列表.doc 201127957
Gin Lys Thr Arg Glu Ala Gly Gin Arg Ser Gin Asp Val lie Arg Pro 130 135 140 <210〉 38 <211> 1800 <212〉 DNA <213〉擬南芥 <400〉 38 ccatggctat acccaacctc ggtcttggtc acaccaggaa ctctctggta agctagctcc 60 actccccaga aacaaccggc gccaaattgc cggaattgct gacctgaaga cggaacatca 120 tcgtcgggtc cttgggcgat tgcggcggaa gatgggtcag cttgggcttg aggacgagac 180 ccgaatcgag tctgttgaaa ggttgttcat tgggatttgt atacggagat tggtcgtcga 240 gaggtttgag ggaaaggaca aatgggtttg gctctggaga aagagagtgc ggctttagag 300 agagaattga gaggtttaga gagagatgcg gcggcgatga cgggaggaga gacgacgagg 360 acctgcatta tcaaagcagt gacgtggtga aatttggeiac ttttaagagg cagatagatt 420 tattatttgt atccattttc ttcattgttc tagaatgtcg cgggiacaaat tttaaaacta 480 aatcctaaat ttttctaatt ttgttgccaa tagtggatat gtgggccgta tagaaggaat 540 ctattgaagg ccceiaaccca tactgacgag cccaaaggtt cgttttgcgt tttatgtttc 600 ggttcgatgc ceLacgccaca ttctgagcta ggcaaaaaac aaacgtgtct ttgaatagac 660 tcctctcgtt gLacacatgca gcggctgcat ggtgacgcca ttaacacgtg gcctacaatt 720 gcatgatgtc tccattgaca cgtgacttct cgtctccttt cttaatatat ctaacaaaca 780 ctcctacctc ttccaaaata tatacacatc tttttgatca atctctcatt caaaatctca 840 ttctctctag taaacaagaa caaaaaaatg gcggatacag ctagaggaac ccatcacgat 900 atcatcggca gagaccagta cccgatgatg ggccgagacc gagaccagta ccagatgtcc 960 ggacgaggat ctgactactc caagtctagg cagattgcta aagctgcaac tgctgtcaca 1020 •136- 151910-序列表.doc 1080 1080
201127957 gctggtggtt ccctccttgt tctctccagc cttacccttg ttggaactgt catagctttg actgttgcaa cacctctgct cgttatcttc agcccaatcc ttgtcccggc tctcatcaca gttgcactcc tcatcaccgg ttttctttcc tctggagggt ttggcattgc cgctataacc gttttctctt ggatttacaa gtaagcacac atttatcatc ttacttcata attttgtgca atatgtgcat gcatgtgttg agccagtagc tttggatcaa tttttttggt cgaataacaa atgtaacaat aagaaattgc aaattctagg gaacatttgg ttaactaaat acgaaatttg acctagctag cttgaatgtg tctgtgtata tcatctatat aggtaaaatg cttggtatga tacctattga ttgtg£iatag gtacgcaacg ggagagcacc cacagggatc agacaagttg gacagtgcaa ggatgaagtt gggaagcaaa gctcaggatc tgaaagacag agctcagtac tacggacagc aacatactgg tggggaacat gaccgtgacc gtactcgtgg tggccagcac actacttaag ttaccccact gatgtcatcg tcatagtcca ataactccaa tgtcggggag ttagtttatg aggaataaag tgtttagaat ttgatcaggg ggagataata aaagccgagt ttgaatcttt ttgttataag taatgtttat gtgtgtttct atatgttgtc aaatggtacc <210> 39 <211> 173 <212〉 PRT <213〉擬南芥 <400〉 39
Met Ala Asp Thr Ala Arg Gly Thr His His Asp lie lie Gly Arg Asp 1 5 10 15
Gin Tyr Pro Met Met Gly Arg Asp Arg Asp Gin Tyr Gin Met Ser Gly 20 25 30
Arg Gly Ser Asp Tyr Ser Lys Ser Arg Gin lie Ala Lys Ala Ala Thr 35 40 45 151910-序列表.doc •137· 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 201127957
Ala Val Thr Ala Gly Gly Ser Leu Leu Val Leu Ser Ser Leu Thr Leu 50 55 60
Val Gly Thr Val lie Ala Leu Thr Val Ala Thr Pro Leu Leu Val lie 65 70 75 80
Phe Ser Pro lie Leu Val Pro Ala Leu lie Thr Val Ala Leu Leu lie 85 90 95
Thr Gly Phe Leu Ser Ser Gly Gly Phe Gly lie Ala Ala lie Thr Val 100 105 110
Phe Ser Trp lie Tyr Lys Tyr Ala Thr Gly Glu His Pro Gin Gly Ser 115 120 125
Asp Lys Leu Asp Ser Ala Arg Met Lys Leu Gly Ser Lys Ala Gin Asp 130 135 140
Leu Lys Asp Arg Ala Gin Tyr Tyr Gly Gin Gin His Thr Gly Gly Glu 145 150 155 160
His Asp Arg Asp Arg Thr Arg Gly Gly Gin His Thr Thr 165 170 <210〉 40 <211〉 450 〈212〉 DNA <213〉擬南芥 <400〉 40 atggcggatc atcaacaaca tcagcaacaa caacaaccaa taatgaggag tctccatgaa tcatcaccat cgactcggca gatagtgaga ttcgtaacgg cagctacgat cggcctatca 138· 60 120 151910·序列表.doc 201127957 ctcctcgtgc tctcaggact aacactaacc ggaacggtga tcggtttgat cgtagcgacg 180 ccgttgatgg ttctgttcag cccggtgttg gtaccggcag tgataacgat agggcttctg 240 acgatgggat tcctattctc cggtggttgt ggggtggcag cagctacggc gttaacgtgg 300 atttataagt acgttaccgg aaaacacccg atgggagcgg ataaggtgga ttacgcgagg 360 atgaggatag cggagaaagc caaagagttg ggacattata cgcactcgca gccacaacaa 420 acacaccaaa ccacaacaac tactcattag 450
<210> 41 <211〉 149 <212〉 PRT <213〉擬南芥 <400> 41
Met Ala Asp His Gin Gin His Gin Gin Gin Gin Gin Pro lie Met Arg 15 10 15
Ser Leu His Glu Ser Ser Pro Ser Thr Arg Gin He Val Arg Phe Val 20 25 30
Thr Ala Ala Thr lie Gly Leu Ser Leu Leu Val Leu Ser Gly Leu Thr
Leu Thr Gly Thr Val lie Gly Leu lie Val Ala Thr Pro Leu Met Val 50 55 60
Leu Phe Ser Pro Val Leu Val Pro Ala Val lie Thr lie Gly Leu Leu 65 70 75 80
Thr Met Gly Phe Leu Phe Ser Gly Gly Cys Gly Val Ala Ala Ala Thr 85 90 95 -139- 151910-序列表.doc 201127957
Ala Leu Thr Trp lie Tyr Lys Tyr Val Thr Gly Lys His Pro Met Gly 100 105 110
Ala Asp Lys Val Asp Tyr Ala Arg Met Arg lie Ala Glu Lys Ala Lys 115 120 125
Glu Leu Gly His Tyr Thr His Ser Gin Pro Gin Gin Thr His Gin Thr 130 135 140
Thr Thr Thr Thr His 145 <210〉 42 〈211〉 625 <212〉 DNA <213〉向日葵 <400> 42 actaccacca cttacgaccg tcatttcacc accacccaac cccactaccg ccaagacgac 60 aggtcccgct acgaccagca aacccattcc cagtccacca gcaggacact cgccatcatc 120 gccctacttc ctgtcggcgg aatcttactc ggcttagccg ctctcacatt catcgggacg 180 cttatcgggc tcgccctcgc caccccgctt ttcgtcatat tcagcccgat catcgtgccg 240 gccgttctaa caatcgggct tgctgttaca ggctttttgg cgtcggggac gttcgggttg 300 acgggtttga gctcattgtc gtatttgttc aatatggtta ggcagacggc tgggtcggtg 360 cccgagtcct tggattatgt taaggggacg ttgcaggatg ccggtgagta tgccgggcag 420 aagacgaagg atttcgggca gaagattcag agcacggctc atgagatggg tgatcagggg 480 caggttggtg ttcatgctca agttggtggc gggaaagaag ggcgaaaaag cggtgatcgg 540 acttgaggat tcaaggttga tattgtggaa taataatgtt gatgtaagtt tttagtgtta 600 tcaaagcttt gtttgtttgt ttgta 625 •140· 151910·序列表.doc 201127957 <210〉 43 <211> 181 <212〉 PRT <213〉向日葵 <400〉 43
Thr Thr Thr Thr Tyr Asp Arg His Phe Thr Thr Thr Gin Pro His Tyr 15 10 15
Arg Gin Asp Asp Arg Ser Arg Tyr Asp Gin Gin Thr His Ser Gin Ser 20 25 30
Thr Ser Arg Thr Leu Ala lie He Ala Leu Leu Pro Val Gly Gly lie 35 40 45
Leu Leu Gly Leu Ala Ala Leu Thr Phe lie Gly Thr Leu lie Gly Leu 50 55 60
Ala Leu Ala Thr Pro Leu Phe Val He Phe Ser Pro lie lie Val Pro 65 70 75 80
Ala Val Leu Thr lie Gly Leu Ala Val Thr Gly Phe Leu Ala Ser Gly 85 90 95
Thr Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Tyr Leu Phe Asn Met 100 105 110
Val Arg Gin Thr Ala Gly Ser Val Pro Glu Ser Leu Asp Tyr Val Lys 115 120 125
Gly Thr Leu Gin Asp Ala Gly Glu Tyr Ala Gly Gin Lys Thr Lys Asp 130 135 140 •14卜 151910-序列表doc 201127957
Phe Gly Gin Lys He Gin Ser Thr Ala His Glu Met Gly Asp Gin Gly 145 150 155 160
Gin Val Gly Val His Ala Gin Val Gly Gly Gly Lys Glu Gly Arg Lys 165 170 175
Ser Gly Asp Arg Thr 180 <210> 44 〈211〉 737 〈212〉 DNA <213〉甘藍型油菜 <400〉 44 gaattccatt caaactagta aacaatgggg atactcagga agaaaaaaca cgagcgaaag 60 ccgtcgttta agagtgtttt aaccgcaata ttagctacac atgccgcaac attcctcttg 120 ttgatcgccg gtgtatccct cgccggcaca gccgccgcat ttatcgctac catgccacta 180 ttcgtagtat tcagtccgat tctcgtacca gctggtatta ccactggttt actgactacg 240 ggtttagcag ccgccggtgg cgccggcgcg actgctgtca ccatcatcct gtggctctac 300 aagcgagcaa cgggcaaggc gccgccaaaa gtcctagaaa aagtcttgaa aaagateLata 360 ccaggtgctg cagctgcacc agcagccgct ccaggagccg ctccagcagc ggcgccagca 420 gccgcaccag ctgtggcgcc agcagccgca ccagctgctg cgccagcacc taagccagca 480 gccccaccag cacctaagcc agcagccgca ccgagtatat gaaaagaagt ggtgggcatg 540 agtaaaggtt gatatggaaa actggataca tagaaaaaag agtaatccaa cttttaaaaa 600 ataaataaca acttcacgtg gggatagaaa aattttcaaa tattatttta ctaatggatg 660 tcgcggtaca aaataataac aaatgtaagc ctttttattg tatagtattt taagaacgaa 720 gctatgtagc gttgaca 737 •142· 151910·序列表.doc 201127957 <210〉 45 <211> 165 <212〉 PRT 〈213>甘藍型油菜 <400〉 45
Met Gly lie Leu Arg Lys Lys Lys His Glu Arg Lys Pro Ser Phe Lys 15 10 15
Ser Val Leu Thr Ala lie Leu Ala Thr His Ala Ala Thr Phe Leu Leu 20 25 30
Leu He Ala Gly Val Ser Leu Ala Gly Thr Ala Ala Ala Phe He Ala 35 40 45
Thr Met Pro Leu Phe Val Val Phe Ser Pro He Leu Val Pro Ala Gly 50 55 60 lie Thr Thr Gly Leu Leu Thr Thr Gly Leu Ala Ala Ala Gly Gly Ala 65 70 75 80
Gly Ala Thr Ala Val Thr lie lie Leu Trp Leu Tyr Lys Arg Ala Thr 85 90 95
Gly Lys Ala Pro Pro Lys Val Leu Glu Lys Val Leu Lys Lys lie lie 100 105 110
Pro Gly Ala Ala Ala Ala Pro Ala Ala Ala Pro Gly Ala Ala Pro Ala 115 120 125
Ala Ala Pro Ala Ala Ala Pro Ala Val Ala Pro Ala Ala Ala Pro Ala 130 135 140 143· 151910-序列表.doc 201127957
Ala Ala Pro Ala Pro Lys Pro Ala Ala Pro Pro Ala Pro Lys Pro Ala 145 150 155 160
Ala Ala Pro Ser lie 165 <210〉 46 〈211〉 1153 <212〉 DNA <213〉玉米 <400> 46 aactactccg tcactttgtt tgcaaagctc ctcctcgatc catcgatcac tgcaccggcc 60 ggcggcaccg cgctcgcagg ggctagccaa cgagacggca gcaatggcgg accgtgaccg 120 cagcggcatc tacggcggcg cccacgccac ctacgggcag cagcagcagc agggaggagg 180 cgggcgcccg atgggtgagc aggtgaaggg catgctccac gacaaggggc cgacggcgtc 240 gcaggcgctg acggtggcga cgctgttccc gctgggcggg ctgctgctgg tgctgtcggg 300 gctggcgctg acggcctccg tggtggggct ggccgtggcc acgccggtgt tcctgatctt 360 cagccccgtg ctggtccccg ccgcgctgct catcgggacg gccgtcatgg ggttcctcac 420 gtcgggcgcg ctggggctcg ggggcctgtc ctcgctcacg tgcctcgcca acacggcgcg 480 gcaggcgttc cagcgcaccc cggactacgt ggaggaggcg caccgcagga tggcggaggc 540 cgcggcgcac gcgggccaca agaccgcgca ggcaggccag gccatccagg gcagggcgca 600 ggaggccggc gccgggggag gtgcaggtgc cggcgctggc ggcggcggca gggcttcctc 660 gtaagcaagt catccatgca tggattatgg atagatgcgc gcgtgcgtgt ctatcagtat 720 cagcagccag cagggtcgtc gcggaatgct gtgttcctgt acgtgtgggt gaccgtcctt 780 ccgtccttcg tctttctccc cccgagtgtg tgttacgtat gtcctggtgt tcgtcgtgtg 840 tgttcatcgc cgctccagtt gaattccggt gtctgttcat cgccgctcca ggtcgtagat 900 -144· 151910-序列表.doc 201127957 gtgaatatac tttgctaggg gaataagtga taagtctgtc tggaaggtaa tgtttgagct ttgctagtgt ggctgggcac tctggtcact ggttgtgttg tgcatgcatc agctgtatga tcgtcgtctg ttgtggaaaa ttggtcaatg tattctcttg ctgaataatt tgtgacatct aattgttatg tatcgtctct ttgctgaata atcagtttct gatttatctt gcattaaaaa 960 1020 1080 1140 1153 <210〉 47 <211〉 186
<212〉 PRT <213〉玉米 <400> 47
Met Ala Asp Arg Asp Arg Ser Gly lie Tyr Gly Gly Ala His Ala Thr 15 10 15
Tyr Gly Gin Gin Gin Gin Gin Gly Gly Gly Gly Arg Pro Met Gly Glu 20 25 30
Gin Val Lys Gly Met Leu His Asp Lys Gly Pro Thr Ala Ser Gin Ala 35 40 45
Leu Thr Val Ala Thr Leu Phe Pro Leu Gly Gly Leu Leu Leu Val Leu 50 55 60
Ser Gly Leu Ala Leu Thr Ala Ser Val Val Gly Leu Ala Val Ala Thr 65 70 75 80
Pro Val Phe Leu lie Phe Ser Pro Val Leu Val Pro Ala Ala Leu Leu 85 90 95 lie Gly Thr Ala Val Met Gly Phe Leu Thr Ser Gly Ala Leu Gly Leu 100 105 110 •145- 151910·序列表.doc 201127957
Gly Gly Leu Ser Ser Leu Thr Cys Leu Ala Asn Thr Ala Arg Gin Ala 115 120 125
Phe Gin Arg Thr Pro Asp Tyr Val Glu Glu Ala His Arg Arg Met Ala 130 135 140
Glu Ala Ala Ala His Ala Gly His Lys Thr Ala Gin Ala Gly Gin Ala 145 150 155 160
He Gin Gly Arg Ala Gin Glu Ala Gly Ala Gly Gly Gly Ala Gly Ala 165 170 175
Gly Ala Gly Gly Gly Gly Arg Ala Ser Ser 180 185 <210〉 48 <211> 447 <212> DNA <213〉栽培稻 <400〉 48 atgggtgatc agcacagagg agtgatcggc ggtggcggct acggtgaccg tggtggccag 60 gagcagcagg agaagcagcc cttcatgatg acggctctga agacggtgac cgcggcgacg 120 gccgggggct cgattctggt gctgtccggg ctgatcctgg ccgggaccgt catcgcgctc 180 acggtggcca ccccggtgtt ggtcatcttc agccccgtgc tggtaccggc ggccatcgcg 240 ctggcgctca tggcggccgg gttcgtcacc tcggttggtc tcggtgtagc cgcgctctcc 300 gttttctcgt ggatgtacaa gtacctcacc gggaagcacc cgccgggcgc cgaccatctg 360 gaccacacca aggcgagggt cgcgtccaag ctccgcgaca tcaaggaggc ggcgcatcac 420 ctcatcgacc aggcgcaggc gtcttag 447 •146·
151910-序列表.doc 201127957 <210〉 49 <211〉 148 <212〉 PRT 〈213>栽培稻 <400> 49
Met Gly Asp Gin His Arg Gly Val He Gly Gly Gly Gly Tyr Gly Asp 15 10 15
Arg Gly Gly Gin Glu Gin Gin Glu Lys Gin Pro Phe Met Met Thr Ala 20 25 30
Leu Lys Thr Val Thr Ala Ala Thr Ala Gly Gly Ser lie Leu Val Leu 35 40 45
Ser Gly Leu lie Leu Ala Gly Thr Val He Ala Leu Thr Val Ala Thr 50 55 60
Pro Val Leu Val lie Phe Ser Pro Val Leu Val Pro Ala Ala lie Ala 65 70 75 80
Leu Ala Leu Met Ala Ala Gly Phe Val Thr Ser Val Gly Leu Gly Val 85 90 95
Ala Ala Leu Ser Val Phe Ser Trp Met Tyr Lys Tyr Leu Thr Gly Lys 100 105 110
His Pro Pro Gly Ala Asp His Leu Asp His Thr Lys Ala Arg Val Ala 115 120 125
Ser Lys Leu Arg Asp He Lys Glu Ala Ala His His Leu lie Asp Gin 130 135 140 -147· 151910·序列表.doc 201127957
Ala Gin Ala Ser 145 <210〉 50 <211〉 709 〈212〉 DNA <213〉羽衣甘藍 <400〉 50 gccgtttttt cagaatgttc tcttttatct tcccattgct gaacgttata aagcttatta 60 tagcttccgt gacctcctta gtctgcttag cgttttcttg tgtgacactc ggtggttcag 120 ccgtggcatt aatcgtatcc acaccacttt tcatcatatt tagtccaatt ctcgtacctg 180 ccactattgc cactaccctc ctagccagtg ggctcatggc gggtaccacc ctcggactga 240 ccggcatagg tctcatcacg gggctcgtta ggacggcagg aggagttaca ttggccgaat 300 caccgataag aagaattata ataaatagaa ttaaagcaag acttgggggt ggcggcggtt 360 cacgtctggc aatgctcaaa aaaattctgg gactcattaa aaagttgcgt ggtatgtctt 420 caggtggagc agcacctgcg ctgaagcagc accagcagct gcgcccgcgg atggagctgc 480 acccgcggca cctgcaccga cctaacaaag aacgttggtt catgctgttc caatatgtag 540 cacataaaaa ttgtgtaata attaacttaa gaatttatga ttcggaaact aaaaagaaaa 600 tagccctttt actatctttt atacaatata gttttctatg taataatgtt taatttgctt 660 ataactataa aagactcatg catagttgat taggaeiaaaa aaaaaaaaa 709 <210> 51 <211> 216 <212〉 PRT <213〉羽衣甘藍 <400> 51
Arg Phe Phe Arg Met Phe Ser Phe lie Phe Pro Leu Leu Asn Val lie 15 10 15 -148- 151910·序列表.doc 201127957
Lys Leu He He Ala Ser Val Thr Ser Leu Val Cys Leu Ala Phe Ser 20 25 30
Cys Val Thr Leu Gly Gly Ser Ala Val Ala Leu lie Val Ser Thr Pro 35 40 45
Leu Phe lie He Phe Ser Pro He Leu Val Pro Ala Thr lie Ala Thr 50 55 60
Thr Leu Leu Ala Ser Gly Leu Met Ala Gly Thr Thr Leu Gly Leu Thr 65 70 75 80
Gly lie Gly Leu lie Thr Gly Leu Val Arg Thr Ala Gly Gly Val Thr 85 90 95
Leu Ala Glu Ser Pro lie Arg Arg lie He lie Asn Arg lie Lys Ala 100 105 110
Arg Leu Gly Gly Gly Gly Gly Ser Arg Leu Ala Met Leu Lys Lys lie 115 120 125
Leu Gly Leu lie Lys Lys Leu Arg Gly Met Ser Ser Gly Gly Ala Ala 130 135 140
Pro Ala Leu Lys Gin His Gin Gin Leu Arg Pro Arg Met Glu Leu His 145 150 155 160
Pro Arg His Leu His Arg Pro Asn Lys Glu Arg Trp Phe Met Leu Phe 165 170 175
Gin Tyr Val Ala His Lys Asn Cys Val lie lie Asn Leu Arg lie Tyr 180 185 190 •149· 151910·序列表.doc 201127957
Asp Ser Glu Thr Lys Lys Lys He Ala Leu Leu Leu Ser Phe lie Gin 195 200 205
Tyr Ser Phe Leu Cys Asn Asn Val 210 215 <210〉 52 <211〉 447 <212〉 DNA <213〉咖啡 〈400〉 52 atggctgagc actaccagct gcagcaacgc cccacagagg ccgtcaaaag cttccttcct 60 cagaagggtc catcaacttc acatgtgtta gcagttgtca cgctcctccc agttgcggga 120 gtcctgctag gcctttccgg gctgattctc gtcggaacgg tcatcggtct ggcggtgaca 180 accccgcttt tcgttatctt tagccccatt ttggtcccag ctgtatttgc cctagggctg 240 gccctggccg ggttcttgac ctccggtgct ttcgggatca ctgcacttgc ttcattgtcg 300 tggatgctga actacatccg actcatgaag gcgtcttccc aggagcaaat ggacctcgca 360 aagtggcgcg tgcaggacac tgccggccaa gttggtcaga aagcgagaga cgtgggccag 420 agaactcaag atgtagccag agcatga 447 <210〉 53 <211〉 148 <212〉 PRT <213〉咖啡 <400〉 53
Met Ala Glu His Tyr Gin Leu Gin Gin Arg Pro Thr Glu Ala Val Lys 15 10 15 -150- 151910·序列表.doc 201127957
Ser Phe Leu Pro Gin Lys Gly Pro Ser Thr Ser His Val Leu Ala Val 20 25 30
Val Thr Leu Leu Pro Val Ala Gly Val Leu Leu Gly Leu Ser Gly Leu 35 40 45 lie Leu Val Gly Thr Val lie Gly Leu Ala Val Thr Thr Pro Leu Phe 50 55 60
Val lie Phe Ser Pro lie Leu Val Pro Ala Val Phe Ala Leu Gly Leu 65 70 75 80
Ala Leu Ala Gly Phe Leu Thr Ser Gly Ala Phe Gly lie Thr Ala Leu 85 90 95
Ala Ser Leu Ser Trp Met Leu Asn Tyr lie Arg Leu Met Lys Ala Ser 100 105 110
Ser Gin Glu Gin Met Asp Leu Ala Lys Trp Arg Val Gin Asp Thr Ala 115 120 125
Gly Gin Val Gly Gin Lys Ala Arg Asp Val Gly Gin Arg Thr Gin Asp 130 135 140
Val Ala Arg Ala 145 <210〉 54 〈211〉 348 〈212〉 PRT <213〉芝麻 <400〉 54
Met Asp Leu lie His Thr Phe Leu Asn Leu lie Ala Pro Pro Phe Thr -151 - 151910-序列表.doc 201127957 5 10 15
Phe Phe Phe Leu Leu Phe Phe Leu Pro Pro Phe Gin lie Phe Lys Phe 20 25 30
Phe Leu Ser lie Leu Gly Thr Leu Phe Ser Glu Asp Val Ala Gly Lys 35 40 45
Val Val Val lie Thr Gly Ala Ser Ser Gly lie Gly Glu Ser Leu Ala 50 55 60
Tyr Glu Tyr Ala Lys Arg Gly Ala Cys Leu Val Leu Ala Ala Arg Arg 65 70 75 80
Glu Arg Ser Leu Gin Glu Val Ala Glu Arg Ala Arg Asp Leu Gly Ser 85 90 95
Pro Asp Val Val Val Val Arg Ala Asp Val Ser Lys Ala Glu Asp Cys 100 105 110
Arg Lys Val Val Asp Gin Thr Met Asn Arg Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly lie Met Ser Val Ser Met Leu Glu Glu Val 130 135 140
Glu Asp He Thr Gly Tyr Arg Glu Thr Met Asp lie Asn Phe Trp Gly 145 150 155 160
Tyr Val Tyr Met Thr Arg Phe Ala Ala Pro Tyr Leu Arg Asn Ser Arg 165 170 175
Gly Arg He Val Val Leu Ser Ser Ser Ser Ser Trp Met Pro Thr Pro •152· 151910·序列表.doc 201127957 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala He Ser Gin Phe Phe 195 200 205
Glu Thr Leu Arg Val Glu Phe Gly Pro Asp lie Gly He Thr Leu Val 210 215 220
Thr Pro Gly Phe lie Glu Ser Glu Leu Thr Gin Gly Lys Phe Tyr Asn 225 230 235 240
Ala Gly Glu Arg Val lie Asp Gin Asp Met Arg Asp Val Gin Val Ser 245 250 255
Thr Thr Pro lie Leu Arg Val Glu Ser Ala Ala Arg Ser lie Val Arg 260 265 270
Ser Ala lie Arg Gly Glu Arg Tyr Val Thr Glu Pro Ala Trp Phe Arg 275 280 285
Val Thr Tyr Trp Trp Lys Leu Phe Cys Pro Glu Val Met Glu Trp Val 290 295 300
Phe Arg Leu Met Tyr Leu Ala Ser Pro Gly Glu Pro Glu Lys Glu Thr 305 310 315 320
Phe Gly Lys Lys Val Leu Asp Tyr Thr Gly Val Lys Ser Leu Leu Tyr 325 330 335
Pro Glu Thr Val Gin Val Pro Glu Pro Lys Asn Asp 340 345 <210> 55 •153· 151910-序列表.doc 201127957 <211〉 348 <212〉 PRT 〈213〉芝麻 <400> 55
Met Asp Leu He His Thr Phe Leu Asn Leu lie Ala Pro Pro Phe Thr 15 10 15
Phe Phe Phe Leu Leu Phe Phe Leu Pro Pro Phe Gin He Phe Lys Phe 20 25 30
Phe Leu Ser He Leu Gly Thr Leu Phe Ser Glu Asp Val Ala Gly Lys 35 40 45
Val Val Val He Thr Gly Ala Ser Ser Gly lie Gly Glu Ser Leu Ala 50 55 60
Tyr Glu Tyr Ala Lys Arg Gly Ala Cys Leu Val Leu Ala Ala Arg Arg 65 70 75 80
Glu Arg Ser Leu Gin Glu Val Ala Glu Arg Ala Arg Asp Leu Gly Ser 85 90 95
Pro Asp Val Val Val Val Arg Ala Asp Val Ser Lys Ala Glu Asp Cys 100 105 110
Arg Lys Val Val Asp Gin Thr Met Asn Arg Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly lie Met Ser Val Ser Met Leu Glu Glu Val 130 135 140
Glu Asp lie Thr Gly Tyr Arg Glu Thr Met Asp He Asn Phe Trp Gly 145 150 155 160 154- 151910·序列表.doc 201127957
Tyr Val Tyr Met Thr Arg Phe Ala Ala Pro Tyr Leu Arg Asn Ser Arg 165 170 175
Gly Arg lie Val Val Leu Ser Ser Ser Ser Ser Trp Met Pro Thr Pro 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala lie Ser Gin Phe Phe 195 200 205
Glu Thr Leu Arg Val Glu Phe Gly Pro Asp lie Gly lie Thr Leu Val 210 215 220
Thr Pro Gly Phe lie Glu Ser Glu Leu Thr Gin Gly Lys Phe Tyr Asn 225 230 235 240
Ala Gly Glu Arg Val He Asp Gin Asp Met Arg Asp Val Gin Val Ser 245 250 255
Thr Thr Pro lie Leu Arg Val Glu Ser Ala Ala Arg Ser lie Val Arg 260 265 270
Ser Ala lie Arg Gly Glu Arg Tyr Val Thr Glu Pro Ala Trp Phe Arg 275 280 285
Val Thr Tyr Trp Trp Lys Leu Phe Cys Pro Glu Val Met Glu Trp Val 290 295 300
Phe Arg Leu Met Tyr Leu Ala Ser Pro Gly Glu Pro Glu Lys Glu Thr 305 310 315 320
Phe Gly Lys Lys Val Leu Asp Tyr Thr Gly Val Lys Ser Leu Leu Tyr 325 330 335 •155 151910·序列表.doc 201127957
Pro Glu Thr Val Gin Val Pro Glu Pro Lys Asn Asp <210> 56 <211〉 1266 〈212〉 DNA <213〉甘藍型油菜 <400> 56 ggtcgacggc cattacggcc gggatcccgt taatgtgtat tgtgttttga tcgaagatgg 60 aattgataaa cgatttcctc aatctaactg cacctttctt tactttcttt ggtctttgct 120 tcttcttgcc ccctttttat ttcttcaagt tcgtgcagtc tatcttctcg acaattttct 180 ctgaaaacgt atatgggaaa gtggttctca tcactggtgc ttcctccggg atcggcgagc 240 aattggcata tgagtacgca agtaaaggtg catgtttggc tctgactgcc cgaaggaaga 300 accgtctaga ggaagtggca gagattgctc gtgaagttgg atcccctaat gttgtcacag 360 ttcacgctga tgtttccaaa cctgatgatt gtagacgaat cgtcgatgag accatctccc 420 attttggcag attggatcat cttgtaaaca atgctggaat aatgcaaatt tcaatgttcg 480 aaaacattga agaaataact aggacaagag cagttatgga tactaacttt tggggagcgg 540 tttatacaac tcgtgctgcg cttccgtacc ttcgaceiaag caatggtaag attgtggcta 600 tgtcgtcctc tgcggcatgg ctaaccgccc caaggatgag cttttataat gctagcaaag 660 cagctttgtt gaacttcttc gagacgttga ggattgagct tggtagcgat gtacacatta 720 caatcgtcac acctggttat attgaatctg aactcacaca aggcaagtac gtctctggtg 780 aaggcgagct agtagtcaac caagacatta gagatgttca aattggagca tttccggtaa 840 cgtcagtatc aggtcgtgcc aaggggatag tgaaaggtgt gtgtaggaaa gagagatacg 900 tgaccgaacc atcgtggttt aaggtgacgt acctttggaa agtgttttgt ccggaactga 960 • 156· 151910·序列表.doc 1020 201127957 tcgagtgggg ttgcagattg atgttcttgt ccggacatgg tacgccggag gaaaatgcac tcaacaagaa gatcctggac atacctggtg tacgtagtgc ictataccct gaacctatca gaacgccaga aatcaagtcg gagtagagtg aggttgatac ttaataagtg tctcataaag tggagccatg ttttgtaaat ggactttcta ttatgcacat gttactatga tgtatctgtt tgtttatgtg tataagaata agtgaacttt ggagctcaaa aaaaaaaaaa aaaaaaaaaa SLSLSL3-Q.Q.
<210〉 57 <211〉 349 <212> PRT <213〉甘藍型油菜 <400> 57
Met Glu Leu lie Asn Asp Phe Leu Asn Leu Thr Ala Pro Phe Phe Thr 15 10 15
Phe Phe Gly Leu Cys Phe Phe Leu Pro Pro Phe Tyr Phe Phe Lys Phe 20 25 30
Val Gin Ser lie Phe Ser Thr lie Phe Ser Glu Asn Val Tyr Gly Lys 35 40 45
Val Val Leu lie Thr Gly Ala Ser Ser Gly lie Gly Glu Gin Leu Ala 50 55 60
Tyr Glu Tyr Ala Ser Lys Gly Ala Cys Leu Ala Leu Thr Ala Arg Arg 65 70 75 80
Lys Asn Arg Leu Glu Glu Val Ala Glu He Ala Arg Glu Val Gly Ser 85 90 95 •157- 1080 1140 1200 1260 1266 151910-序列表.doc 201127957
Pro Asn Val Val Thr Val His Ala Asp Val Ser Lys Pro Asp Asp Cys 100 105 110
Arg Arg He Val Asp Glu Thr He Ser His Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly lie Met Gin lie Ser Met Phe Glu Asn He 130 135 140
Glu Glu lie Thr Arg Thr Arg Ala Val Met Asp Thr Asn Phe Trp Gly 145 150 155 160
Ala Val Tyr Thr Thr Arg Ala Ala Leu Pro Tyr Leu Arg Gin Ser Asn 165 170 175
Gly Lys lie Val Ala Met Ser Ser Ser Ala Ala Trp Leu Thr Ala Pro 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala Leu Leu Asn Phe Phe 195 200 205
Glu Thr Leu Arg lie Glu Leu Gly Ser Asp Val His lie Thr lie Val 210 215 220
Thr Pro Gly Tyr He Glu Ser Glu Leu Thr Gin Gly Lys Tyr Val Ser 225 230 235 240
Gly Glu Gly Glu Leu Val Val Asn Gin Asp lie Arg Asp Val Gin lie 245 250 255
Gly Ala Phe Pro Val Thr Ser Val Ser Gly Arg Ala Lys Gly He Val 260 265 270 -158- 151910·序列表.doc 201127957
Lys Gly Val Cys Arg Lys Glu Arg Tyr Val Thr Glu Pro Ser Trp Phe 275 280 285
Lys Val Thr Tyr Leu Trp Lys Val Phe Cys Pro Glu Leu He Glu Trp 290 295 300
Gly Cys Arg Leu Met Phe Leu Ser Gly His Gly Thr Pro Glu Glu Asn 305 310 315 320
Ala Leu Asn Lys Lys lie Leu Asp lie Pro Gly Val Arg Ser Ala Leu 325 330 335
Tyr Pro Glu Pro lie Arg Thr Pro Glu lie Lys Ser Glu 340 345 〈210〉 58 <211> 1188 <212〉 DNA <213〉玉米 <400〉 58 attgcgcaca ccttgatgct gggcatgagc aggacggggt tggccggagc ggcgctgcgg 60
gtggcgctga cggcgctgct gccgctggtc ctgccggcgt actacgtgta caagctgacc 120 acgtacctcc tcggcgccgt cttccccgag gacgtcgccg gcaaggtggt actcatcacc 180 ggcgcctcct ccggcatcgg cgagcacctg gcctatgagt acgcgaagcg gggagcctac 240 ctggcgctgg tggcgaggag ggaggcgagc ctccgcgagg tcggcgacgt cgcgctgggg 300 ctgggctcgc cgggcgtcct cgtcctcccg gctgacgtct ccaagcctcg ggactgcgag 360 ggcttcatcg acgacacgat tagctacttc ggtagactgg atcacctggt gaacaacgcg 420 tccatctggc aagtgtgcaa gttcgaagag atccaggacg tcaggcactt gagagccctg 480 atggacatca acttctgggg ccacgtgtac ccaacccggc tcgccatccc tcacctcagg 540 -159- 151910-序列表.doc 201127957 agaagccgtg gccggatcgt gggcgtcacc tccaactcgt cctacatatt catcgggagg 600 aacaccttct acaatgccag caaggcggcg gcgctcagct tctacgacac cctgaggatg 660 gagctgggca gcgacatccg catcaccgag gtggtgccag gcgtggtgga gtctgagatc 720 accaagggga agatgctcac caagggaggc gagatgaagg tggaccagga cgaaagagac 780 gccatcctgg ggccgacgcc ggccgagccc gtgggcgact tcgccaggac cgtggtgcgc 840 gacgtgtgcc ggggcgcgag gtacgtgttc gagcccaggt ggtacatggg cgtctacttg 900 ctgcgggcct gcctcccgga agtcctggcc tggaactccc gcctgctcac tgtcgacacg 960 gtcggcgcgt ccaccacgga cacgctcgga aagtggctgg tcgagctgcc cggcgtgcgc 1020 cgcgtcgtgc agccgccgtc gctccgctcg ccggagatca aggactagtg acggtgatcg 1080 tgtacgttct gtggccatgg atagcactag ctgtatgaga ccgaagttcc tttagacatc 1140 gacacgatta ataaaggact caattatctt aaaaaaaaaa aaaeiaaaa 1188 〈210〉 59 <211〉 350 <212> PRT <213〉玉米 <400> 59
Met Leu Gly Met Ser Arg Thr Gly Leu Ala Gly Ala Ala Leu Arg Val 15 10 15
Ala Leu Thr Ala Leu Leu Pro Leu Val Leu Pro Ala Tyr Tyr Val Tyr 20 25 30
Lys Leu Thr Thr Tyr Leu Leu Gly Ala Val Phe Pro Glu Asp Val Ala 35 40 45
Gly Lys Val Val Leu He Thr Gly Ala Ser Ser Gly lie Gly Glu His 50 55 60 •160- 151910·序列表.doc 201127957
Leu Ala Tyr Glu Tyr Ala Lys Arg Gly Ala Tyr Leu Ala Leu Val Ala 65 70 75 80
Arg Arg Glu Ala Ser Leu Arg Glu Val Gly Asp Val Ala Leu Gly Leu 85 90 95
Gly Ser Pro Gly Val Leu Val Leu Pro Ala Asp Val Ser Lys Pro Arg 100 105 110
Asp Cys Glu Gly Phe lie Asp Asp Thr lie Ser Tyr Phe Gly Arg Leu 115 120 125
Asp His Leu Val Asn Asn Ala Ser lie Trp Gin Val Cys Lys Phe Glu 130 135 140
Glu lie Gin Asp Val Arg His Leu Arg Ala Leu Met Asp lie Asn Phe 145 150 155 160
Trp Gly His Val Tyr Pro Thr Arg Leu Ala lie Pro His Leu Arg Arg 165 170 175
Ser Arg Gly Arg lie Val Gly Val Thr Ser Asn Ser Ser Tyr lie Phe 180 185 190 lie Gly Arg Asn Thr Phe Tyr Asn Ala Ser Lys Ala Ala Ala Leu Ser 195 200 205
Phe Tyr Asp Thr Leu Arg Met Glu Leu Gly Ser Asp lie Arg lie Thr 210 215 220
Glu Val Val Pro Gly Val Val Glu Ser Glu lie Thr Lys Gly Lys Met 225 230 235 240 161· 151910·序列表.doc 201127957
Leu Thr Lys Gly Gly Glu Met Lys Val Asp Gin Asp Glu Arg Asp Ala 245 250 255 lie Leu Gly Pro Thr Pro Ala Glu Pro Val Gly Asp Phe Ala Arg Thr 260 265 270
Val Val Arg Asp Val Cys Arg Gly Ala Arg Tyr Val Phe Glu Pro Arg 275 280 285
Trp Tyr Met Gly Val Tyr Leu Leu Arg Ala Cys Leu Pro Glu Val Leu 290 295 300
Ala Trp Asn Ser Arg Leu Leu Thr Val Asp Thr Val Gly Ala Ser Thr 305 310 315 320
Thr Asp Thr Leu Gly Lys Trp Leu Val Glu Leu Pro Gly Val Arg Arg 325 330 335
Val Val Gin Pro Pro Ser Leu Arg Ser Pro Glu He Lys Asp 340 345 350 〈210〉 60 <211〉 890 <212〉 DNA <213〉甘藍型油菜 〈400> 60 gtttccaaac ctgatgattg tagacgaatc gtcgatgaga ccatctccca ttttggcaga ttggatcatc ttgtaaacaa tgctggaata atgcagattt caatgttcga aaacattgaa gaaataacta ggacaagagc agttatggat actaactttt ggggatcggt ttatacaact cgtgctgcgc ttccgtacct tcgacaaagc aatggtaaga ttgtggccat gtcgtcctct 162- 151910-序列表.doc 300 300
201127957 gcggcatggc taaccgcccc aaggatgagc ttttataatg ctagcaaagc cgcattgttg aacttcttcg agacgttgag gattgagctt ggcagcgatg tacacattac aatcgtcaca cctggttata ttgaatctga actcacacaa ggcaagtact tctctggtga aggcgagcta gtagtcaacc aagacattag agatgttcaa attggagcat ttccggtaac gtcggtatca ggttgtgcca aggggatagt gaaaggtgtg tgtaggaaac agagatacgt gaccgaacca tcgtggttta aggtgacgta cctttggaaa gtgttttgtc cggaactgat cgagtggggt tgcaggttgc tgttcttgtc cggacatggt acgtcggaga aaaatgcact caacaagaag atcttggaca tacctggtgt acgtagtgct ctataccctg aatctatcag aacgccagaa atcaagtcgg agtagagtga ggttgatact taataagtgt ctcatatagt ggagccatgt tttgtaaatg gactttctat tatgcacatg ttactatgat gtatccgttt gtttatgtgt ataagaataa gtgaactttg gagctccaaa aaaaaaaaaa aaaaaaaaaa <210〉 61 <211〉 244 <212> PRT <213〉甘藍型油菜 <400> 61
Val Ser Lys Pro Asp Asp Cys Arg Arg He Val Asp Glu Thr lie Ser 15 10 15
His Phe Gly Arg Leu Asp His Leu Val Asn Asn Ala Gly He Met Gin 20 25 30 lie Ser Met Phe Glu Asn lie Glu Glu He Thr Arg Thr Arg Ala Val 35 40 45
Met Asp Thr Asn Phe Trp Gly Ser Val Tyr Thr Thr Arg Ala Ala Leu 50 55 60 151910·序列表.doc •163- 360 420 480 540 600 660 720 780 840 890 201127957
Pro Tyr Leu Arg Gin Ser Asn Gly Lys He Val Ala Met Ser Ser Ser 65 70 75 80
Ala Ala Trp Leu Thr Ala Pro Arg Met Ser Phe Tyr Asn Ala Ser Lys 85 90 95
Ala Ala Leu Leu Asn Phe Phe Glu Thr Leu Arg He Glu Leu Gly Ser 100 105 110
Asp Val His lie Thr lie Val Thr Pro Gly Tyr He Glu Ser Glu Leu 115 120 125
Thr Gin Gly Lys Tyr Phe Ser Gly Glu Gly Glu Leu Val Val Asn Gin 130 135 140
Asp lie Arg Asp Val Gin lie Gly Ala Phe Pro Val Thr Ser Val Ser 145 150 155 160
Gly Cys Ala Lys Gly lie Val Lys Gly Val Cys Arg Lys Gin Arg Tyr 165 170 175
Val Thr Glu Pro Ser Trp Phe Lys Val Thr Tyr Leu Trp Lys Val Phe 180 185 190
Cys Pro Glu Leu lie Glu Trp Gly Cys Arg Leu Leu Phe Leu Ser Gly 195 200 205
His Gly Thr Ser Glu Lys Asn Ala Leu Asn Lys Lys lie Leu Asp lie 210 215 220
Pro Gly Val Arg Ser Ala Leu Tyr Pro Glu Ser lie Arg Thr Pro Glu 225 230 235 240 164· 151910·序列表.doc 201127957
He Lys Ser Glu <210〉 62 <211〉 1030 <212〉 DNA 〈213〉芝麻 〈400〉 62 ggcacgagag agaaaeiaagg tgattttgtc aagggaaata tggcaactca tgttttggct 60 gctgcggcgg agagaaatgc tgcgttggcg ccggacgccc cgcttgctcc ggtgactatg 120
gagcgcccag tgcgcactga cttggagact tcgatcccga agccctatat ggcaagagga 180 ttggttgcac ctgatatgga tcaccccaac ggaacaccag gccatgtgca tgataatttg 240 agtgtgctgc aacagcattg tgctttcttt gatcaggatg ataacggaat catctatcca 300 tgggagactt actctggact tcgccaaatt ggtttcaatg tgatagcttc ccttataatg 360 gctatcgtca ttaatgtggc gctgagttat cctactctcc cgggttggat tccttctcct 420 tttttcccca tatatttgta caacatacac aaggccaaac atggaagcga ctccggaacc 480 tatgatactg aaggaaggta cctacctatg aattttgaga acctgttcag caagcatgcc 540 cggacaatgc ccgataggct cactctaggg gagctatgga gcatgactga agctaacaga 600 gaagcatttg acattttcgg ctggatcgca agcaaaatgg agtggactct cctctacatt 660 cttgcaagag accaggacgg tttcctgtcg aaagaagcca tcaggcggtg ttacgatggc 720 agtttgttcg agtactgtgc aaagatgcaa aggggagccg aggacaagat gaaatgaagg 780 aaatcggcta tcgcggtagg tgtaagttat gatgtggtgt gtatgatgga ttgaaagtgc 840 cagtgcttaa gttgtgtggc agagtcttgt gtaataacct ttgtgtacag atttaaggtc 900 tcggaattgg tgtaactgtg gagaagatgt tgactcctgt ttttgttcaa taagtccaac 960 151910-序列表.doc •165· S’ 201127957 tcttgacatt tggttggttt gcagggaaag atggggaatt ttgttttccg aaaaaaaaaa aaaaaaaaaa <210〉 63 <211〉 245 <212> PRT 〈213〉芝麻 <400> 63
Met Ala Thr His Val Leu Ala Ala Ala Ala Glu Arg Asn Ala Ala Leu 15 10 15
Ala Pro Asp Ala Pro Leu Ala Pro Val Thr Met Glu Arg Pro Val Arg 20 25 30
Thr Asp Leu Glu Thr Ser lie Pro Lys Pro Tyr Met Ala Arg Gly Leu 35 40 45
Val Ala Pro Asp Met Asp His Pro Asn Gly Thr Pro Gly His Val His 50 55 60
Asp Asn Leu Ser Val Leu Gin Gin His Cys Ala Phe Phe Asp Gin Asp 65 70 75 80
Asp Asn Gly lie lie Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Gin 85 90 95 lie Gly Phe Asn Val He Ala Ser Leu He Met Ala lie Val lie Asn 100 105 110
Val Ala Leu Ser Tyr Pro Thr Leu Pro Gly Trp He Pro Ser Pro Phe 115 120 125 166· 151910·序列表.doc 201127957
Phe Pro He Tyr Leu Tyr Asn lie His Lys Ala Lys His Gly Ser Asp 130 135 140
Ser Gly Thr Tyr Asp Thr Glu Gly Arg Tyr Leu Pro Met Asn Phe Glu 145 150 155 160
Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu 165 170 175
Gly Glu Leu Trp Ser Met Thr Glu Ala Asn Arg Glu Ala Phe Asp lie 180 185 190
Phe Gly Trp lie Ala Ser Lys Met Glu Trp Thr Leu Leu Tyr lie Leu 195 200 205
Ala Arg Asp Gin Asp Gly Phe Leu Ser Lys Glu Ala lie Arg Arg Cys 210 215 220
Tyr Asp Gly Ser Leu Phe Glu Tyr Cys Ala Lys Met Gin Arg Gly Ala 225 230 235 240
Glu Asp Lys Met Lys
〈210〉 64 <211〉 985 <212〉 DNA <213〉大豆 <400〉 64 atacgagaga gtgagtaatc gagaaagaga agaagcatat atatcaaaat ggctgcagag atggagaggg agtcattgat aactgaagct cctaatgcac cagttactgc acagagaagg gtcagaaatg acttagaaaa ttctctacca aaaccatact tgccaagagc attgaaagct 167- 151910-序列表.doc 201127957 cctgatacgg gtcacccaaa tggaacagca ggccacaggc accaceiactt atctgttctt 240 cagcagcatt gtgctttttt tgatcaagat gacaatggaa tcatttaccc ttgggaaact 300 tacatggggc tgcgttctat tggatttaat gttgttgcat ctgttattat ggctattgtt 360 atcaatgttg gattgagtta ccccactcta cctaattggt tcccttctct cctttttcct 420 atctacatac acaacataca caaagcaaag catgggagtg actctggagt ttatgacaca 480 gaaggacgtt atgtgccagc aaatattgag aacatattca gtaagtatgc tcgtacagta 540 cctgacaagc tcacacttgg ggagctctgg gacttgacag agggaaaccg aaatgctttt 600 gacatatttg gctggcttgc agcaaaattt gaatgggggg ttctgtacat tctggcaagg 660 gatgaggaag gtttcctgtc taaagaagct gttagaagat gctttgatgg gagcttattt 720 gaatactgtg ctaaaatgca tactactagt gatgccaaga tgagttgaaa ttggattatg 780 cagtgtgcat agttacgtgt gatgtgtcgt ttctgttaga catgttagtg gtgtaatgtg 840 aaaaaatagt aaaaaaataa acttattagg aactcgtggt ctgggattga tcagcataat 900 aaagagttta ctgtctctag catatgttgt tctcgagatg taatcctttc ctcacgtgtg 960 gaaagaagtt actctggttc ctaca 985 <210〉 65 <211〉 239 <212〉 PRT <213〉大豆 <400〉 65
Met Ala Ala Glu Met Glu Arg Glu Ser Leu lie Thr Glu Ala Pro Asn
Ala Pro Val Thr Ala Gin Arg Arg Val Arg Asn Asp Leu Glu Asn Ser -168- 151910·序列表.doc 201127957
Leu Pro Lys Pro Tyr Leu Pro Arg Ala Leu Lys Ala Pro Asp Thr Gly 35 40 45
His Pro Asn Gly Thr Ala Gly His Arg His His Asn Leu Ser Val Leu 50 55 60
Gin Gin His Cys Ala Phe Phe Asp Gin Asp Asp Asn Gly lie lie Tyr 65 70 75 80
Pro Trp Glu Thr Tyr Met Gly Leu Arg Ser lie Gly Phe Asn Val Val 85 90 95
Ala Ser Val lie Met Ala He Val lie Asn Val Gly Leu Ser Tyr Pro 100 105 110
Thr Leu Pro Asn Trp Phe Pro Ser Leu Leu Phe Pro lie Tyr lie His 115 120 125
Asn lie His Lys Ala Lys His Gly Ser Asp Ser Gly Val Tyr Asp Thr 130 135 140
Glu Gly Arg Tyr Val Pro Ala Asn lie Glu Asn lie Phe Ser Lys Tyr 145 150 155 160
Ala Arg Thr Val Pro Asp Lys Leu Thr Leu Gly Glu Leu Trp Asp Leu 165 170 175
Thr Glu Gly Asn Arg Asn Ala Phe Asp He Phe Gly Trp Leu Ala Ala 180 185 190
Lys Phe Glu Trp Gly Val Leu Tyr He Leu Ala Arg Asp Glu Glu Gly 195 200 205 • 169- 151910-序列表.doc 201127957
Phe Leu Ser Lys Glu Ala Val Arg Arg Cys Phe Asp Gly Ser Leu Phe 210 215 220
Glu Tyr Cys Ala Lys Met His Thr Thr Ser Asp Ala Lys Met Ser 225 230 235 <210〉 66 〈211〉 1326 <212> DNA <213〉玉米 <400〉 66 atcccagcag caggtagcag cagcgcatga ctttgtatct gcaactcgtt tcgactagcc 60 tgcacgccgg gagccctcgt ctcgcccttc tccacctccg aaggtagggt acctgatact 120 tccctgcccc gcgcatcgca tccgcggttt tagtttgctg gcctcggttc cgatcgattc 180 ctatcctccc tccgggcggg cgtccaccga cttcatcatc cactcgccgg ccgaaccgat 240 ttgtttcgtt tgccgttcga tccgcagatc ctgcgagttc aacccgcgag tgagcatgtc 300 gtcctactcc ccgccgccgc cgccgccgcg ggaccagtcc atggacaccg aggcacccaa 360 cgcgcccatc accagggagc ggaggctcaa ccccgatctg caggagcagc tccccaagcc 420 atatctcgcg agagctctcg aggcggtgga cccgagccac ccgcagggga ccaaggggcg 480 cgacccccgc ggcatgagcg tgcttcagca gcacgccgcc ttcttcgacc gcaatggcga 540 cggcgtcatc tacccctggg agacgtttca aggactgcga gcgataggat gtggactcac 600 tgtatcattc gcgttctcca tactgatcaa cctcttcctc agttatccca ctcagccggg 660 atggttacct tctcctttgc tgtccatccg tatagacaac atccacaagg gtaagcacgg 720 gagtgattct gaaacctacg acactgaagg gaggtttgat ccatcaaagt tcgatgctat 780 attcagtaag tacggtcgaa cccatcctaa tgctataaca agagacgagt taagctcaat 840 gcttcaagga aaccgcaata cgtacgattt ccttggctgg ttggccgctg ccggtgaatg 900 • 170- 151910-序列表.doc 960 960
201127957 gctcttactc tacagcttgg cgaaagacaa ggatggcctc ttgcagcgcg aaactgtccg tggtctattt gatgggagcc tatttgagcg actggaagac gacaacaaca agaagaaatc gtcatgaatg ctgagcagcc ttgtacagct cagggaagtg ctgtcagtac aaaactacca gatataccat tggtcgtgtt caaataacaa atgcttcggc tttgttcatc cgtcattaac tatgagtgct gggatttgtt tgtatgtgtg tcgtgctacc agtttcttct cctgtcgtct cacacaggta ctgaattacg catgtgtttt ctagtgttcg tgcggaagct gtattataag ctgaaaaatg tgcgtttgaa atttatgggc aaaactgtct tcttggtctt aaaaaaaaaa 〈210〉 67 <211〉 243 <212〉 PRT <213〉玉米 <400〉 67
Met Ser Ser Tyr Ser Pro Pro Pro Pro Pro Pro Arg Asp Gin Ser Met 15 10 15
Asp Thr Glu Ala Pro Asn Ala Pro lie Thr Arg Glu Arg Arg Leu Asn 1020 1080 1140 1200 1260 1320 1326
Pro Asp Leu Gin Glu Gin Leu Pro Lys Pro Tyr Leu Ala Arg Ala Leu 35 40 45
Glu Ala Val Asp Pro Ser His Pro Gin Gly Thr Lys Gly Arg Asp Pro 50 55 60
Arg Gly Met Ser Val Leu Gin Gin His Ala Ala Phe Phe Asp Arg Asn 65 70 75 80 -171 - 151910-序列表.doc 201127957
Gly Asp Gly Val lie Tyr Pro Trp Glu Thr Phe Gin Gly Leu Arg Ala 85 90 95
He Gly Cys Gly Leu Thr Val Ser Phe Ala Phe Ser He Leu He Asn 100 105 110
Leu Phe Leu Ser Tyr Pro Thr Gin Pro Gly Trp Leu Pro Ser Pro Leu 115 120 125
Leu Ser lie Arg lie Asp Asn He His Lys Gly Lys His Gly Ser Asp 130 135 140
Ser Glu Thr Tyr Asp Thr Glu Gly Arg Phe Asp Pro Ser Lys Phe Asp 145 150 155 160
Ala He Phe Ser Lys Tyr Gly Arg Thr His Pro Asn Ala He Thr Arg 165 170 175
Asp Glu Leu Ser Ser Met Leu Gin Gly Asn Arg Asn Thr Tyr Asp Phe 180 185 190
Leu Gly Trp Leu Ala Ala Ala Gly Glu Trp Leu Leu Leu Tyr Ser Leu 195 200 205
Ala Lys Asp Lys Asp Gly Leu Leu Gin Arg Glu Thr Val Arg Gly Leu 210 215 220
Phe Asp Gly Ser Leu Phe Glu Arg Leu Glu Asp Asp Asn Asn Lys Lys 225 230 235 240
Lys Ser Ser 172-
151910·序列表doc 201127957 <210〉 68 <211〉 1058 <212〉 DNA <213〉甘藍型油菜 <400〉 68 cttcccattc tcctctagag caaaaaagag cgagagatga gtacggcgac tgagataatg 60 gagagagacg caatggctgc ggtggctccc tacgctccgg tcacctttca ccgccgtgct 120 cgtgttgaca tggatgatag acttcctaaa ccttatatgc caagagcact gcaagcaccc 180 gacagagagc atccgtatgg aaccccaggc cataagaatt atggacttag tgttcttcaa 240 cagcacgtcg ccttcttcga tttagatgat aatggaatta tctacccttg ggagacctac 300 tctggactgc gaatgcttgg tttcaatatc attgtatcgc ttatcgcagc cgctgtaatc 360 aatttggccc ttagctatgc tactcttccg ggatggtttc cttcgccgtt cttcccaata 420 tacatacaca atatacacaa gtcaaagcat gggagcgact caagaacata tgacaatgaa 480 gggaggttta tgcctgtgaa tcttgagttg atatttagca aatatgcgaa aacattgcca 540 gacaagttga gtcttggaga attatgggag atgacacaag gacaacgtga cgcatgggac 600 atcttcggat ggttcgcaag caaaatagag tgggggttgt tgtacttgct agcgagggat 660 gaagaagggt ttctgtcaaa agaagcgatt aggaggtgtt ttgacgggag cttgttcgag 720 # tattgtgcca agatatacgc aggtatcaat gaagacaaga cagcctacta ctaaaagtaa 780 atggtagagg agctttaggc tgataatcgt cgatgtgaat gtiiacttgtg tctaaagcag 840 agtccatgtg tttgttatgt tatgtcaaaa tctgtaaggt agaagtatga tcagttgcag 900 ctggtataga aaaacttcta tgttgaataa tagtatgttt tgttgttgtg tttgtgtttg 960 tatcaaccct tttttagtta tttccagttc aaatgtaatt tttcattgtt gttacttggt 1020 attgagaatc atttcttgta taaaaaaaaa aaaaaaaa 1058 <210〉 69 Ί51910·序列表.doc •173- $ 201127957 <211〉 245 <212〉 PRT 〈213>甘藍型油菜 <400〉 69
Met Ser Thr Ala Thr Glu lie Met Glu Arg Asp Ala Met Ala Ala Val 15 10 15
Ala Pro Tyr Ala Pro Val Thr Phe His Arg Arg Ala Arg Val Asp Met 20 25 30
Asp Asp Arg Leu Pro Lys Pro Tyr Met Pro Arg Ala Leu Gin Ala Pro 35 40 45
Asp Arg Glu His Pro Tyr Gly Thr Pro Gly His Lys Asn Tyr Gly Leu 50 55 60
Ser Val Leu Gin Gin His Val Ala Phe Phe Asp Leu Asp Asp Asn Gly 65 70 75 80 lie lie Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Met Leu Gly Phe 85 90 95
Asn He lie Val Ser Leu He Ala Ala Ala Val He Asn Leu Ala Leu 100 105 110
Ser Tyr Ala Thr Leu Pro Gly Trp Phe Pro Ser Pro Phe Phe Pro lie 115 120 125
Tyr lie His Asn lie His Lys Ser Lys His Gly Ser Asp Ser Arg Thr 130 135 140
Tyr Asp Asn Glu Gly Arg Phe Met Pro Val Asn Leu Glu Leu He Phe 145 150 155 160 174-
151910·序列表.doc 201127957
Ser Lys Tyr Ala Lys Thr Leu Pro Asp Lys Leu Ser Leu Gly Glu Leu 165 170 175
Trp Glu Met Thr Gin Gly Gin Arg Asp Ala Trp Asp lie Phe Gly Trp 180 185 190
Phe Ala Ser Lys lie Glu Trp Gly Leu Leu Tyr Leu Leu Ala Arg Asp 195 200 205
Glu Glu Gly Phe Leu Ser Lys Glu Ala lie Arg Arg Cys Phe Asp Gly 210 215 220
Ser Leu Phe Glu Tyr Cys Ala Lys lie Tyr Ala Gly lie Asn Glu Asp 225 230 235 240
Lys Thr Ala Tyr Tyr 245 〈210〉 70 <211〉 1013 <212〉 DNA <213〉鐵樹 <400〉 70 acgcgggggc agttgaggtg atcctcaata tcgtagcgaa gatcgcccca aatggcttcc gtcgagtctc ttcaaactac ggctctaagg gcaccagtta cactggaacg tagagtgaat cccaatttgg atgatgaaat tccaaagcca tttctaccaa gagcgcttgt agctgtagat acagagcatt tagatggatc cccgggacac cagcataaca acatgagtgt tcttcagcag catgttgcat ttttcgatcg aaatcatgac ggaattgtgt atccttggga aacatacgaa ggcttccgtg ccataggatt taacatcgtc atttccttaa tgtctgcact gttcatcaac 151910-序列表.doc 60 120 180 240 300 360 175· 201127957 atagccttga gctatcttac tcttcctgga tggataccgt cactgctctt tccaatacat 420 ataaacagga ttcatcgeigc aaaacetgga agtgattcag aggtgtatga caccgagggg 480 aggtttgttc catcgaaatt cgaggaaatt ttcactaaat atgcacgtgt acgtccagat 540 aggctcacat tctctgaaat actgttggcc ttgacggagg ccaatagaaa cgccaatgac 600 cctttcggat ggttaaccag caaggccaag tggggcctcc tctaccttct tgccaaggat 660 gatcaaggtt ttctgccgaa agaggcagtc agaggagttt atgatggcag tttgtttgag 720 ttattggaaa agcaacgatc atcccgteiag cagaaataaa atggcctttt gaattagacc 780 ctgaaagagc atgagtgaga aataaactgc acataaatgg cccactagcc catctatgct 840 gtgaaaaata tgatgtcatt agtcattgtc agttagcata ttttaacaag catgactttg 900 tacatattgc atgccgtatc atgaattatg ttcttggttg tgtgatctag actccatttc 960 ttaatgaaat gtcttcctta tttcataaaa aaaaaaaaaa aaaaaaaaaa aaa 1013 <210> 71 <211〉 235 <212〉 PRT <213〉鐵樹 <400〉 71
Met Ala Ser Val Glu Ser Leu Gin Thr Thr Ala Leu Arg Ala Pro Val 15 10 15
Thr Leu Glu Arg Arg Val Asn Pro Asn Leu Asp Asp Glu He Pro Lys 20 25 30
Pro Phe Leu Pro Arg Ala Leu Val Ala Val Asp Thr Glu His Leu Asp 35 40 45
Gly Ser Pro Gly His Gin His Asn Asn Met Ser Val Leu Gin Gin His 50 55 60 •176-
151910-序列表.doc 201127957
Val Ala Phe Phe Asp Arg Asn His Asp Gly lie Val Tyr Pro Trp Glu 65 70 75 80
Thr Tyr Glu Gly Phe Arg Ala He Gly Phe Asn He Val lie Ser Leu 85 90 95
Met Ser Ala Leu Phe lie Asn lie Ala Leu Ser Tyr Leu Thr Leu Pro 100 105 110
Gly Trp lie Pro Ser Leu Leu Phe Pro He His lie Asn Arg lie His 115 120 125
Arg Ala Lys His Gly Ser Asp Ser Glu Val Tyr Asp Thr Glu Gly Arg 130 135 140
Phe Val Pro Ser Lys Phe Glu Glu lie Phe Thr Lys Tyr Ala Arg Val 145 150 155 160
Arg Pro Asp Arg Leu Thr Phe Ser Glu lie Leu Leu Ala Leu Thr Glu 165 170 175
Ala Asn Arg Asn Ala Asn Asp Pro Phe Gly Trp Leu Thr Ser Lys Ala 180 185 190
Lys Trp Gly Leu Leu Tyr Leu Leu Ala Lys Asp Asp Gin Gly Phe Leu 195 200 205
Pro Lys Glu Ala Val Arg Gly Val Tyr Asp Gly Ser Leu Phe Glu Leu 210 215 220
Leu Glu Lys Gin Arg Ser Ser Arg Lys Gin Lys 225 230 235 -177- 151910-序列表doc 201127957 <210〉 72 <211> 720 <212〉 DNA <213〉番紅花 <400〉 72 atgtctttga cgatggaaaa cgaagccacc gccaccgagg cccgattcgc gcccgtcact 60 cgggagcgaa gggttcgcaa cgacctcgaa accacgctcc ccaagccata tttggcgagg 120 gctttggtgg cggcggactc caaccacccc acggggacgg tggggcataa acactatgga 180 atgacagtgc ttcaacagca tgttgctttc tttgaccaag atgataatgg tatcgtttac 240 ccttgggaga cttatgttgg gctaagagcg attggattca acatgataat gtccctagtt 300 atggccgtta ttataaattt cgccatgagc tatcgcactc aacaaggatg gattccatca 360 cctttctttc ccatctatat ttacaatatt cacagagaca aacatggcag cgacactgga 420 acctatgaca ctgaaggaag gtatatagcg gcgaatttcg ageiacatgtt cagcaagtac 480 gctagaacac aaccggacaa gttgtcgctt ggcgagatat gggacatgac tgaagccaac 540 cgtctagcgt tcgaccccta cggatggata gcggcgaaac tggaatggtt catattatac 600 gtgctggcta gggacgagga cgggtatctg tcgaaagagg ccgtaagaag atgttatgat 660 ggaagtttgt tcgagtattg tgcaaagatg aatatgagtg ctcaatacaa gatgtattga 720 <210〉 73 <211> 239 <212〉 PRT <213〉番紅花 <400> 73
Met Ser Leu Thr Met Glu Asn Glu Ala Thr Ala Thr Glu Ala Arg Phe 15 10 15 151910-序列表.doc - 178- 201127957
Ala Pro Val Thr Arg Glu Arg Arg Val Arg Asn Asp Leu Glu Thr Thr 20 25 30
Leu Pro Lys Pro Tyr Leu Ala Arg Ala Leu Val Ala Ala Asp Ser Asn 35 40 45
His Pro Thr Gly Thr Val Gly His Lys His Tyr Gly Met Thr Val Leu 50 55 60
Gin Gin His Val Ala Phe Phe Asp Gin Asp Asp Asn Gly He Val Tyr 65 70 75 80
Pro Trp Glu Thr Tyr Val Gly Leu Arg Ala lie Gly Phe Asn Met lie 85 90 95
Met Ser Leu Val Met Ala Val lie lie Asn Phe Ala Met Ser Tyr Arg 100 105 110
Thr Gin Gin Gly Trp lie Pro Ser Pro Phe Phe Pro lie Tyr lie Tyr 115 120 125
Asn lie His Arg Asp Lys His Gly Ser Asp Thr Gly Thr Tyr Asp Thr 130 135 140
Glu Gly Arg Tyr lie Ala Ala Asn Phe Glu Asn Met Phe Ser Lys Tyr 145 150 155 160
Ala Arg Thr Gin Pro Asp Lys Leu Ser Leu Gly Glu lie Trp Asp Met 165 170 175
Thr Glu Ala Asn Arg Leu Ala Phe Asp Pro Tyr Gly Trp He Ala Ala 180 185 190 -179- 151910-序列表.doc 201127957
Lys Leu Glu Trp Phe He Leu Tyr Val Leu Ala Arg Asp Glu Asp Gly 195 200 205
Tyr Leu Ser Lys Glu Ala Val Arg Arg Cys Tyr Asp Gly Ser Leu Phe 210 215 220
Glu Tyr Cys Ala Lys Met Asn Met Ser Ala Gin Tyr Lys Met Tyr 225 230 235 <210〉 74 <211〉 2074 <212〉 DNA 〈213>擬南芥 <400〉 74 tgaatccttt ttcctttctt cttcttcttc tcttcagaga aaactttgct tctctttcta 60 taaggaacca gacacgaatc ccattcccac cgatttctta gcttcttcct tcaatccgct 120 ctttccctct ccattagatt ctgtttcctc tttcaatttc ttctgcatgc ttctcgattc 180 tctctgacgc ctcttttctc ccgacgctgt ttcgtcaaac gcttttcgaa atggcgattt 240 tggattctgc tggcgttact acggtgacgg agaacggtgg cggagagttc gtcgatcttg 300 ataggcttcg tcgacggaaa tcgagatcgg attcttctaa cggacttctt ctctctggtt 360 ccgataataa ttctccttcg gatgatgttg gagctcccgc cgacgttagg gatcggattg 420 attccgttgt taacgatgac gctcagggaa cagccaattt ggccggagat aataacggtg 480 gtggcgataa taacggtggt ggaagaggcg gcggagaagg aagaggaaac gccgatgcta 540 cgtttacgta tcgaccgtcg gttccagctc atcggagggc gagagagagt ccacttagct 600 ccgacgcaat cttcaaacag agccatgccg gattattcaa cctctgtgta gtagttctta 660 ttgctgtaaa cagtagactc atcatcgaaa atcttatgaa gtatggttgg ttgatcagaa 720 cggatttctg gtttagttca agatcgctgc gagattggcc gcttttcatg tgttgtatat 780 -180- 151910·序列表.doc 840 840
201127957 ccctttcgat ctttcctttg gctgccttta cggttgagaa attggtactt cagaaataca tatcagaacc tgttgtcatc tttcttcata ttattatcac catgacagag gttttgtatc cagtttacgt caccctaagg tgtgattctg cttttttatc aggtgtcact ttgatgctcc tcacttgcat tgtgtggcta aagttggttt cttatgctca tactagctat gacataagat ccctagccaa tgcagctgat aaggccaatc ctgaagtctc ctactacgtt agcttgaaga gcttggcata tttcatggtc gctcccacat tgtgttatca gccaagttat ccacgttctg catgtatacg gaagggttgg gtggctcgtc aatttgcaaa actggtcata ttcaccggat tcatgggatt tataatagaa caatatataa atcctattgt caggaactca aagcatcctt tgaaaggcga tcttctatat gctattgaaa gagtgttgaa gctttcagtt ccaaatttat atgtgtggct ctgcatgttc tactgcttct tccacctttg gttaaacata ttggcagagc ttctctgctt cggggatcgt gaattctaca aagattggtg gaatgcaaaa agtgtgggag attactggag aatgtggaat atgcctgttc ataaatggat ggttcgacat atatacttcc cgtgcttgcg cagcaagata ccaaagacac tcgccattat cattgctttc ctagtctctg cagtctttca tgagctatgc atcgcagttc cttgtcgtct cttcaagcta tgggcttttc ttgggattat gtttcaggtg cctttggtct tcatcacaaa ctatctacag gaaaggtttg gctcaacggt ggggaacatg atcttctggt tcatcttctg cattttcgga caaccgatgt gtgtgcttct ttattaccac gacctgatga accgaaaagg atcgatgtca tgaaacaact gttcaaaaaa tgactttctt caaacatcta tggcctcgtt ggatctccgt tgatgttgtg gtggttctga tgctaaaacg acaaatagtg ttataaccat tgaagaagaa aagaaaatta gagttgttgt atctgcaaaa attttggtag agacacgcga acccgtttgg attttgttat ggtgtaaaga aatttcaatc aaaaaactgt tgtaataatt gttaccaaaa agaaatgctt ttctggaaac gaggggaaaa atagtagttt tgtt 151910-序列表.doc -181 - 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2074 201127957 <210〉 75 <211> 520 <212〉 PRT <213〉擬南芥 <400> 75
Met Ala He Leu Asp Ser Ala Gly Val Thr Thr Val Thr Glu Asn Gly 15 10 15
Gly Gly Glu Phe Val Asp Leu Asp Arg Leu Arg Arg Arg Lys Ser Arg 20 25 30
Ser Asp Ser Ser Asn Gly Leu Leu Leu Ser Gly Ser Asp Asn Asn Ser 35 40 45
Pro Ser Asp Asp Val Gly Ala Pro Ala Asp Val Arg Asp Arg He Asp 50 55 60
Ser Val Val Asn Asp Asp Ala Gin Gly Thr Ala Asn Leu Ala Gly Asp 65 70 75 80
Asn Asn Gly Gly Gly Asp Asn Asn Gly Gly Gly Arg Gly Gly Gly Glu 85 90 95
Gly Arg Gly Asn Ala Asp Ala Thr Phe Thr Tyr Arg Pro Ser Val Pro 100 105 110
Ala His Arg Arg Ala Arg Glu Ser Pro Leu Ser Ser Asp Ala lie Phe 115 120 125
Lys Gin Ser His Ala Gly Leu Phe Asn Leu Cys Val Val Val Leu lie 130 135 140 182- 151910·序列表.doc 201127957
Ala Val Asn Ser Arg Leu lie lie Glu Asn Leu Met Lys Tyr Gly Trp 145 150 155 160
Leu lie Arg Thr Asp Phe Trp Phe Ser Ser Arg Ser Leu Arg Asp Trp 165 170 175
Pro Leu Phe Met Cys Cys lie Ser Leu Ser lie Phe Pro Leu Ala Ala 180 185 190
Phe Thr Val Glu Lys Leu Val Leu Gin Lys Tyr lie Ser Glu Pro Val 195 200 205
Val He Phe Leu His lie He lie Thr Met Thr Glu Val Leu Tyr Pro 210 215 220
Val Tyr Val Thr Leu Arg Cys Asp Ser Ala Phe Leu Ser Gly Val Thr 225 230 235 240
Leu Met Leu Leu Thr Cys lie Val Trp Leu Lys Leu Val Ser Tyr Ala 245 250 255
His Thr Ser Tyr Asp lie Arg Ser Leu Ala Asn Ala Ala Asp Lys Ala 260 265 270
Asn Pro Glu Val Ser Tyr Tyr Val Ser Leu Lys Ser Leu Ala Tyr Phe 275 280 285
Met Val Ala Pro Thr Leu Cys Tyr Gin Pro Ser Tyr Pro Arg Ser Ala 290 295 300
Cys lie Arg Lys Gly Trp Val Ala Arg Gin Phe Ala Lys Leu Val lie 305 310 315 320 183· 1519丨0·序列表.doc 201127957
Phe Thr Gly Phe Met Gly Phe He lie Glu Gin Tyr He Asn Pro He 325 330 335
Val Arg Asn Ser Lys His Pro Leu Lys Gly Asp Leu Leu Tyr Ala He 340 345 350
Glu Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys 355 360 365
Met Phe Tyr Cys Phe Phe His Leu Trp Leu Asn lie Leu Ala Glu Leu 370 375 380
Leu Cys Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys 385 390 395 400
Ser Val Gly Asp Tyr Trp Arg Met Trp Asn Met Pro Val His Lys Trp 405 410 415
Met Val Arg His He Tyr Phe Pro Cys Leu Arg Ser Lys He Pro Lys 420 425 430
Thr Leu Ala lie lie lie Ala Phe Leu Val Ser Ala Val Phe His Glu 435 440 445
Leu Cys lie Ala Val Pro Cys Arg Leu Phe Lys Leu Trp Ala Phe Leu 450 455 460
Gly He Met Phe Gin Val Pro Leu Val Phe He Thr Asn Tyr Leu Gin 465 470 475 480
Glu Arg Phe Gly Ser Thr Val Gly Asn Met lie Phe Trp Phe lie Phe 485 490 495 •184· 151910·序列表.doc
201127957
Cys lie Phe Gly Gin Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu 500 505 510
Met Asn Arg Lys Gly Ser Met Ser 515 520 <210> 76 <211〉 2090 <212〉 DNA <213〉旱金蓮 <400〉 76 acgcggggag ttttcaaaat catattatgc tttttcttca ctactgcatg aactttcttt ctacttcttg caactgattt gtaatcctta cacatgtttc tagttttctc catataaaaa aaatattctc tgagcttctc gattctctag agagagaagg ccaaaaaaaa atggcggtgg cagagtcgtc acagaacacg acaaccatga gtggtcacgg cgactcggat ctcaacaatt tccgtagaag gaaaccgagt tcctccgtga ttgaaccttc gtcgtccggt tttacatcca ccaatggcgt accggcgact ggccacgtgg ctgagaatcg tgaccaggat cgggtagggg ctatggagaa cgcaacagga tcggtcaact taattggaaa tggtggaggc gtggttatcg ggaatgaaga gaaacaggta ggggagactg atatacgatt cacttaccgg ccttcgtttc cggctcatcg gagggtgagg gagagtcctc ttagctctga tgcaatcttc aaacagagcc atgcgggttt attcaacttg tgtatagtag tgctcattgc agtaaacagt aggcttatca tcgaaaatct tatgaagtat ggttggttga tcgatactgg tttctggttt agctcaagat cactgggtga ttggtccatc tttatgtgct gtcttacact cccaattttc ccacttgctg cttttattgt tgaaaagctg gtgcagcgaa atcatatatc tgaacttgtt gctgttctcc ttcatgtaat cgtttctacc gctgcagttt tatatccagt tattgtgatc ttaacgtgtg attcggtgta tatgtctggt gtggtattga tgctctttgg ttgcattatg tggttgaagc 151910序列表 _doc 60 120 180 240 300 360 420 480 540 600 660 720 780 840 -185- 900 201127957 tggtgtcata tgcacatact agttctgata ttagaacact ggccaaatct ggctataagg 960 gggatgcgca ccccaattca accattgtga gttgctcata tgatgttagc ttgaagagtt 1020 tggcatactt catggttgct ccgacattat gttaccagcc tagctatcct cgttcgtcgt 1080 gtatccgcaa gggttgggtt gttcgtcaat ttgtcaaact aatagttttc ataggactca 1140 tggggttcat tatagaacaa tatattaatc ctatcgttcg aaattccaaa cacccattga 1200 aaggagattt tttatatgca atagaaagag ttttgaagct ttcagttcca aatctatatg 1260 tttggctttg catgttctac tcttttttcc acctctggtt gaacatactg gctgagcttc 1320 ttcgctttgg tgatcgtgaa ttctacaaag attggtggaa tgcaaaaact gttgcggagt 1380 attggaaaat gtggaatatg cctgttcata gatggatggt tcgtcatcta tattttccct 1440 gtttgaggaa tgggataccc aaggaaggtg ccattattat cgcgttctta gtttctggtg 1500 ctttccatga gctctgcatt gcagttcctt gccacgtatt caagttatgg gcctttatag 1560 gcattatgtt tcaggttccc ttggtattga ttacgaatta tctacaagaa aagttcagta 1620 attctatggt gggcaatatg atcttctggt tcatcttctg catacttggc caacctatgt 1680 gtgtccttct atattaccat gacctgataa atctaaagga aaagtgaaaa aatggaagtt 1740 gcctatgctc agagtattcc tatcccaatg cacacattat atggttctgt acaatctgtg 1800 cccccttcat cctttacacg tacccatgct ggttcctgca cgatgatttg ccttttgttt 1860 gtaagcaata tttggagaga gtccaattta ggaagtgact agtgtggctt atatcttgta 1920 tactaccttt agtcatgggg gggtttttat attactagta ccaaaagtca agttgtatat 1980 gatttacggt ttagtttctt tcatgttttt tgtttttgtg taeiatatacg tttcatatat 2040 cactgttttt tcaaagtaaa atcaataata ccccatagat gttggiaactg 2090
<210〉 77 <211〉 518 〈212〉 PRT -186-
151910·序列表.doc 201127957 <213〉旱金蓮 <400〉 77
Met Ala Val Ala Glu Ser Ser Gin Asn Thr Thr Thr Met Ser Gly His 15 10 15
Gly Asp Ser Asp Leu Asn Asn Phe Arg Arg Arg Lys Pro Ser Ser Ser 20 25 30
Val lie Glu Pro Ser Ser Ser Gly Phe Thr Ser Thr Asn Gly Val Pro 35 40 45
Ala Thr Gly His Val Ala Glu Asn Arg Asp Gin Asp Arg Val Gly Ala 50 55 60
Met Glu Asn Ala Thr Gly Ser Val Asn Leu lie Gly Asn Gly Gly Gly 65 70 75 80
Val Val lie Gly Asn Glu Glu Lys Gin Val Gly Glu Thr Asp lie Arg 85 90 95
Phe Thr Tyr Arg Pro Ser Phe Pro Ala His Arg Arg Val Arg Glu Ser 100 105 110
Pro Leu Ser Ser Asp Ala lie Phe Lys Gin Ser His Ala Gly Leu Phe 115 120 125
Asn Leu Cys lie Val Val Leu lie Ala Val Asn Ser Arg Leu lie lie 130 135 140
Glu Asn Leu Met Lys Tyr Gly Trp Leu He Asp Thr Gly Phe Trp Phe 145 150 155 160 187- 151910·序列表.doc 201127957
Ser Ser Arg Ser Leu Gly Asp Trp Ser He Phe Met Cys Cys Leu Thr 165 170 175
Leu Pro lie Phe Pro Leu Ala Ala Phe He Val Glu Lys Leu Val Gin 180 185 190
Arg Asn His lie Ser Glu Leu Val Ala Val Leu Leu His Val lie Val 195 200 205
Ser Thr Ala Ala Val Leu Tyr Pro Val lie Val He Leu Thr Cys Asp 210 215 220
Ser Val Tyr Met Ser Gly Val Val Leu Met Leu Phe Gly Cys lie Met 225 230 235 240
Trp Leu Lys Leu Val Ser Tyr Ala His Thr Ser Ser Asp lie Arg Thr 245 250 255
Leu Ala Lys Ser Gly Tyr Lys Gly Asp Ala His Pro Asn Ser Thr He 260 265 270
Val Ser Cys Ser Tyr Asp Val Ser Leu Lys Ser Leu Ala Tyr Phe Met 275 280 285
Val Ala Pro Thr Leu Cys Tyr Gin Pro Ser Tyr Pro Arg Ser Ser Cys 290 295 300 lie Arg Lys Gly Trp Val Val Arg Gin Phe Val Lys Leu lie Val Phe 305 310 315 320 lie Gly Leu Met Gly Phe lie lie Glu Gin Tyr lie Asn Pro lie Val 325 330 335 •188
151910-序列表.doc 201127957
Arg Asn Ser Lys His Pro Leu Lys Gly Asp Phe Leu Tyr Ala He Glu 340 345 350
Arg Val Leu Lys Leu Ser Val Pro Asn Leu Tyr Val Trp Leu Cys Met 355 360 365
Phe Tyr Ser Phe Phe His Leu Trp Leu Asn He Leu Ala Glu Leu Leu 370 375 380
Arg Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp Trp Asn Ala Lys Thr 385 390 395 400
Val Ala Glu Tyr Trp Lys Met Trp Asn Met Pro Val His Arg Trp Met 405 410 415
Val Arg His Leu Tyr Phe Pro Cys Leu Arg Asn Gly lie Pro Lys Glu 420 425 430
Gly Ala lie He lie Ala Phe Leu Val Ser Gly Ala Phe His Glu Leu 435 440 445
Cys lie Ala Val Pro Cys His Val Phe Lys Leu Trp Ala Phe lie Gly 450 455 460 lie Met Phe Gin Val Pro Leu Val Leu lie Thr Asn Tyr Leu Gin Glu 465 470 475 480
Lys Phe Ser Asn Ser Met Val Gly Asn Met lie Phe Trp Phe lie Phe 485 490 495
Cys lie Leu Gly Gin Pro Met Cys Val Leu Leu Tyr Tyr His Asp Leu 500 505 510 -189- 151910-序列表.doc 201127957 lie Asn Leu Lys Glu Lys 515 <210〉 78 <211〉 1485 〈212〉 DNA <213〉玉米 <400〉 78 atggccccgc ccccctccat gcctgccgcc tccgatcgcg ccggccctgg ccgcgacgcg 60 ggcgactcgt cctcccttcg cctccgccgc gccccctcag ccgacgccgg cgaccttgcc 120 ggcgattcct cgggaggctt gcgggagaac ggcgagccgc aatcgccgac gaatccgccg 180 ccgcaggagc agcagcagca cgagatgcta tactaccgcg cgtcggcgcc cgcccaccgc 240 cgcgtcaagg agagccccct cagctctgac gccatcttcc ggcagagcca tgctggtctt 300 ctgaatctat gcattgttgt tctgatcgca gtgaacagca gactcattat tgagaattta 360 atgaagtatg gcctgttgat aagagctgga ttttggttta gtgcaagatc gctgggtgac 420 tggccccttc taatgtgctg cctcactcta ccagttttcc cactagttgc actcatggct 480 gagaagctga tcacaagaaa gctcattggt gaacatgtgg ttattctact ccatatcatt 540 attacaacat ctgccattgt ctatccagtt gttgtgactc ttaagtgtga ctcagcagta 600 ctatctggat ttgtgctaat gtttcttgcg agcatcatgt ggatgaagct tgtctcttat 660 gcacatacaa attatgatat aagggtattg tccaaaagta ctgaaaaggg tgctgcatat 720 ggaaattatg tcgatcctga gaatatgaaa gatccaacct ttaaaagtct agtgtacttt 780 atgttggccc caacactttg ttaccagcca acttatcctc aaactacatg tattagaaag 840 ggttgggtga cccagcaact cataaagtgc gtggttttta caggcttgat gggcttcata 900 attgagcaat atataaaccc aattgtgaag aattccaaac atccactgaa agggaatttt 960 ttgaatgcta tagaaagagt cttaaaactc tcagtgccaa cattatatgt atggctttgc 1020 -190-
151910-序列表.doc 1080 201127957 atgttctatt gcttttttca gaccgtgaat tctataagga tggaacatgc ctgttcataa ggcttttcca ggggtgtagc atatgtattg cggtgccttg cagataccct tggtattctt ggcaacatga tattttggtt tactaccatg acgtcatgaa tttatggctg aacattgtag ctggtggaat gccaaaactg gtggatcatc agacacatat tattctaatc tcgtttctgg ccacattttc aaattctggg gacaagatat ctccatgcta cttcttcagt atagtcggac caggcaggcc caggcaagta ctgaactcct ctgtttcggt ttgaagagta ctggaggatg attttccatg tataaggaaa tttcagctgt attteatgag cattttctgg gatcatgttt cgttcaagca tgtaatggtg agccgatgtg tgteetteta gatag 1140 1200 1260 1320 1380 1440 1485 <210> 79 <211〉 494 <212〉 PRT <213〉玉米 <400〉 79
Met Ala Pro Pro Pro Ser Met Pro Ala Ala Ser Asp Arg Ala Gly Pro 15 10 15
Gly Arg Asp Ala Gly Asp Ser Ser Ser Leu Arg Leu Arg Arg Ala Pro
Ser Ala Asp Ala Gly Asp Leu Ala Gly Asp Ser Ser Gly Gly Leu Arg 35 40 45
Glu Asn Gly Glu Pro Gin Ser Pro Thr Asn Pro Pro Pro Gin Glu Gin 50 55 60
Gin Gin His Glu Met Leu Tyr Tyr Arg Ala Ser Ala Pro Ala His Arg 65 70 75 80 -191 - 151910-序列表 doc 201127957
Arg Val Lys Glu Ser Pro Leu Ser Ser Asp Ala He Phe Arg Gin Ser 85 90 95
His Ala Gly Leu Leu Asn Leu Cys He Val Val Leu He Ala Val Asn 100 105 110
Ser Arg Leu lie lie Glu Asn Leu Met Lys Tyr Gly Leu Leu lie Arg 115 120 125
Ala Gly Phe Trp Phe Ser Ala Arg Ser Leu Gly Asp Trp Pro Leu Leu 130 135 140
Met Cys Cys Leu Thr Leu Pro Val Phe Pro Leu Val Ala Leu Met Ala 145 150 155 160
Glu Lys Leu lie Thr Arg Lys Leu He Gly Glu His Val Val He Leu 165 170 175
Leu His He He He Thr Thr Ser Ala lie Val Tyr Pro Val Val Val 180 185 190
Thr Leu Lys Cys Asp Ser Ala Val Leu Ser Gly Phe Val Leu Met Phe 195 200 205
Leu Ala Ser lie Met Trp Met Lys Leu Val Ser Tyr Ala His Thr Asn 210 215 220
Tyr Asp lie Arg Val Leu Ser Lys Ser Thr Glu Lys Gly Ala Ala Tyr 225 230 235 240
Gly Asn Tyr Val Asp Pro Glu Asn Met Lys Asp Pro Thr Phe Lys Ser 245 250 255 •192 151910·序列表.doc 201127957
Leu Val Tyr Phe Met Leu Ala Pro Thr Leu Cys Tyr Gin Pro Thr Tyr 260 265 270
Pro Gin Thr Thr Cys lie Arg Lys Gly Trp Val Thr Gin Gin Leu lie 275 280 285
Lys Cys Val Val Phe Thr Gly Leu Met Gly Phe lie He Glu Gin Tyr 290 295 300 lie Asn Pro lie Val Lys Asn Ser Lys His Pro Leu Lys Gly Asn Phe 305 310 315 320
Leu Asn Ala lie Glu Arg Val Leu Lys Leu Ser Val Pro Thr Leu Tyr 325 330 335
Val Trp Leu Cys Met Phe Tyr Cys Phe Phe His Leu Trp Leu Asn lie 340 345 350
Val Ala Glu Leu Leu Cys Phe Gly Asp Arg Glu Phe Tyr Lys Asp Trp 355 360 365
Trp Asn Ala Lys Thr Val Glu Glu Tyr Trp Arg Met Trp Asn Met Pro 370 375 380
Val His Lys Trp lie He Arg His lie Tyr Phe Pro Cys He Arg Lys 385 390 395 400
Gly Phe Ser Arg Gly Val Ala lie Leu lie Ser Phe Leu Val Ser Ala 405 410 415
Val Phe His Glu lie Cys lie Ala Val Pro Cys His lie Phe Lys Phe 420 425 430 -193· 151910·序列表.doc 201127957
Trp Ala Phe Ser Gly lie Met Phe Gin lie Pro Leu Val Phe Leu Thr 435 440 445
Arg Tyr Leu His Ala Thr Phe Lys His Val Met Val Gly Asn Met lie 450 455 460
Phe Trp Phe Phe Phe Ser lie Val Gly Gin Pro Met Cys Val Leu Leu 465 470 475 480
Tyr Tyr His Asp Val Met Asn Arg Gin Ala Gin Ala Ser Arg 485 490 〈210〉 80 <211〉 1330 <212〉 DNA 〈213〉擬南芥 <400〉 80 agttaaaaga ttggttattt gggctctgca ctcaagtgag agagaagata gatagatctg 60 agtagaatct tcgattcatt attcgttgtc gtcgttcatc tgtgagaagc ggacaaacca 120 aagaatccac cggagctagt gatatgggtg gttccagaga gttccgagct gaggaacatt 180 caaatcaatt ccactctatc atcgccatgg ccatctggct tggcgccatt cacttcaacg 240 tcgctcttgt tctctgttct ctcattttcc ttcctccttc tctatctctc atggtcttgg 300 gcttgctctc tctgtttatc tttatcccaa tcgatcatcg tagcaaatat ggtcgtaagc 360 tcgctaggta catatgcaag cacgcgtgta attatttccc cgtctctctg tacgtcgagg 420 attacgaagc tttccagcct aatcgtgcct atgtctttgg ttatgaacca cattcggtgc 480 taccgattgg agttgttgct ctttgtgatc tcacagggtt tatgcctatt cctaacatta 540 aagttcttgc aagtagtgct atattctaca ctccctttct aaggcatata tggacatggt 600 tagggctcac cgctgcttct aggaagaatt tcacttccct tttggattct ggctacagtt 660 -194- 151910·序列表.doc 720 720
201127957 gtgttcttgt acctggtggt gtgcaggaga cttttcatat gcaacatgat gctgagaatg tcttcctttc aaggagaaga ggatttgtgc gcatagccat ggaacagggg agccctctgg ttccagtatt ctgctttggt caggcacgcg tgtacaaatg gtggaagccg gattgtgatc tctatcttaa actatctaga gcaatcagat tcaccccgat ctgcttctgg ggagtttttg gatcaccatt accgtgtcga cagcctatgc atgtggtcgt tggtaaacca atagaagtca caaaaactct gaagccaact gacgaagaga ttgctaagtt tcatggccag tatgtggaag cgcttaggga tctgtttgag aggcacaagt cccgagtcgg ctatgatctt gagctgaaaa ttctttgaac aaaatctcca atggaaataa ttacttgtgt gtatccttca ttaattgtta ccttggagct ggatttggac ttaatataaa tgactacatc atgtagtcta catgtattgc atgtctttag catcgactgt tgaagtaatg gaatacgttt ataaagcctg taaattacat gtcgtcttgc acaagagtat gtggtaataa taacatttga cccaaaaata atactagtta aatttttcct <210> 81 <211〉 314 <212> PRT <213〉擬南芥 <400> 81
Met Gly Gly Ser Arg Glu Phe Arg Ala Glu Glu His Ser Asn Gin Phe 15 10 15
His Ser lie lie Ala Met Ala lie Trp Leu Gly Ala lie His Phe Asn 20 25 30
Val Ala Leu Val Leu Cys Ser Leu lie Phe Leu Pro Pro Ser Leu Ser 35 40 45 1519丨0-序列表.doc •195· 780 840 900 960 1020 1080 1140 1200 1260 1320 1330 201127957
Leu Met Val Leu Gly Leu Leu Ser Leu Phe lie Phe lie Pro lie Asp 50 55 60
His Arg Ser Lys Tyr Gly Arg Lys Leu Ala Arg Tyr He Cys Lys His 65 70 75 80
Ala Cys Asn Tyr Phe Pro Val Ser Leu Tyr Val Glu Asp Tyr Glu Ala 85 90 95
Phe Gin Pro Asn Arg Ala Tyr Val Phe Gly Tyr Glu Pro His Ser Val 100 105 110
Leu Pro He Gly Val Val Ala Leu Cys Asp Leu Thr Gly Phe Met Pro 115 120 125 lie Pro Asn lie Lys Val Leu Ala Ser Ser Ala He Phe Tyr Thr Pro 130 135 140
Phe Leu Arg His lie Trp Thr Trp Leu Gly Leu Thr Ala Ala Ser Arg 145 150 155 160
Lys Asn Phe Thr Ser Leu Leu Asp Ser Gly Tyr Ser Cys Val Leu Val 165 170 175
Pro Gly Gly Val Gin Glu Thr Phe His Met Gin His Asp Ala Glu Asn 180 185 190
Val Phe Leu Ser Arg Arg Arg Gly Phe Val Arg lie Ala Met Glu Gin 195 200 205
Gly Ser Pro Leu Val Pro Val Phe Cys Phe Gly Gin Ala Arg Val Tyr 210 215 220 196- 151910·序列表.doc 201127957
Lys Trp Trp Lys Pro Asp Cys Asp Leu Tyr Leu Lys Leu Ser Arg Ala 225 230 235 240 lie Arg Phe Thr Pro lie Cys Phe Trp Gly Val Phe Gly Ser Pro Leu 245 250 255
Pro Cys Arg Gin Pro Met His Val Val Val Gly Lys Pro lie Glu Val 260 265 270
Thr Lys Thr Leu Lys Pro Thr Asp Glu Glu lie Ala Lys Phe His Gly 275 280 285
Gin Tyr Val Glu Ala Leu Arg Asp Leu Phe Glu Arg His Lys Ser Arg 290 295 300
Val Gly Tyr Asp Leu Glu Leu Lys lie Leu 305 310 <210> 82 〈211〉 954 〈212〉 DNA <213〉甘藍型油菜
atgggcaaag tcagagactt tggagctgag gatcatatcc catcaaacat attccatgca 60 gtgaccgcca tatccatctg cctcagcgcc atttacttga acctcgctct tgttctcatc 120 tccctcttct tcctcccaac ttctctctcc ctcctggtct tgggcctgct ctctctgttt 180 atcatcatcc ctatagatga tcgtagcsiag tacggtctta agctggctag gtacatatgc 240 aagcacgcgg ctagttactt ccccgttact ctgcatgtcg aagactacga agctttcaag 300 cctgatcgct cctatgtatt tggttatgaa ccacactcgg tgtggcccat tggagctgtt 360 gcacttgttg atctggcagg gtttatgcct cttccteiaca tcaaacttct tgcaagcaat 420 -197- 151910-序列表.doc 201127957 gctatattct acacgccgtt tctaaggcac atgtgggcat ggttagggct cgcctctgct 480 tctaggaaga gtttctcttc tcttctggag tctggctata gttgtatcct tgtacctggt 540 ggtgtgcagg aaacatttca cttgcaacat gatgttgaga acgtcttcct ttcatcgaga 600 agaggatttg tgcgcatcgc catggaacaa ggggcacctc ttgttccagt tttctgcttt 660 ggtcagtccc gtgcgtacaa gtggtggaag ccggattgtg acctttattt taaactagca 720 agagcgatca ggtttactcc tatctgtttc tggggagttt tcggatcccc aataccatat 780 agacacccta ttcatgtggt ggttggtaaa cceiatacaag ttgcaaagtc tctgcagcca 840 actgatgaag agattgatga gttgcatggc cagtttgtgg aagcgcttaa ggatctgttt 900 gagaggcaca aggccggagc aggctactct gatctgcagt tgaacattct ttga 954 <210〉 83 〈211〉 317 <212〉 PRT <213〉甘藍型油菜 <400> 83
Met Gly Lys Val Arg Asp Phe Gly Ala Glu Asp His lie Pro Ser Asn 15 10 15 lie Phe His Ala Val Thr Ala He Ser He Cys Leu Ser Ala lie Tyr 20 25 30
Leu Asn Leu Ala Leu Val Leu lie Ser Leu Phe Phe Leu Pro Thr Ser 35 40 45
Leu Ser Leu Leu Val Leu Gly Leu Leu Ser Leu Phe lie lie lie Pro 50 55 60
He Asp Asp Arg Ser Lys Tyr Gly Leu Lys Leu Ala Arg Tyr lie Cys 65 70 75 80 -198- 151910-序列表.doc 201127957
Lys His Ala Ala Ser Tyr Phe Pro Val Thr Leu His Val Glu Asp Tyr 85 90 95
Glu Ala Phe Lys Pro Asp Arg Ser Tyr Val Phe Gly Tyr Glu Pro His 100 105 110
Ser Val Trp Pro lie Gly Ala Val Ala Leu Val Asp Leu Ala Gly Phe 115 120 125
Met Pro Leu Pro Asn lie Lys Leu Leu Ala Ser Asn Ala lie Phe Tyr 130 135 140
Thr Pro Phe Leu Arg His Met Trp Ala Trp Leu Gly Leu Ala Ser Ala 145 150 155 160
Ser Arg Lys Ser Phe Ser Ser Leu Leu Glu Ser Gly Tyr Ser Cys He 165 170 175
Leu Val Pro Gly Gly Val Gin Glu Thr Phe His Leu Gin His Asp Val 180 185 190
Glu Asn Val Phe Leu Ser Ser Arg Arg Gly Phe Val Arg lie Ala Met 195 200 205
Glu Gin Gly Ala Pro Leu Val Pro Val Phe Cys Phe Gly Gin Ser Arg 210 215 220
Ala Tyr Lys Trp Trp Lys Pro Asp Cys Asp Leu Tyr Phe Lys Leu Ala 225 230 235 240
Arg Ala lie Arg Phe Thr Pro He Cys Phe Trp Gly Val Phe Gly Ser 245 250 255 •199 151910·序列表.doc 201127957
Pro lie Pro Tyr Arg His Pro lie His Val Val Val Gly Lys Pro lie 260 265 270
Gin Val Ala Lys Ser Leu Gin Pro Thr Asp Glu Glu lie Asp Glu Leu 275 280 285
His Gly Gin Phe Val Glu Ala Leu Lys Asp Leu Phe Glu Arg His Lys 290 295 300
Ala Gly Ala Gly Tyr Ser Asp Leu Gin Leu Asn He Leu 305 310 315 <210〉 84 <211〉 1637 <212〉 DNA <213〉花生 <400〉 84 aatgaacttg acataaagtg gttgtttgta acaccccatt tagtgttttg cttagatgtt gagagttcta taaacttttg tactatttgg taccccgtaa ttaatagaaa tagaaatgtg ataatggttc tatgtttcat tccagaaaaa aattgtcatt ttaaaaagtt ttcttaaatt ctgaatggga atgatgatca ttcagatcaa taaggtteiac acttttttat atgatatttt atgtaatctg attaattttt ttttggtgac aaaaaactcg tgccgaattc ggcacgaggt caaaacctca gaagagagaa aaggagaatt tggttcctaa ttaattctca ccatcaacga tggaggtttc aggcgccgtt ctaaggaatg tcacgtgccc ttccttttct gtgcacgtga gttcccgtcg tcgtggtggt gatagttgtg ttacagtgcc ggtgaggatg agaaaaaagg cggtggtgcg ttgttgctgc gggttcagtg attcggggca tgtgcagtat tacggggacg agaagaagaa ggagaatgga accgctatgt tgagcaccaa gaagaagctc aagatgctga -200- 60 120 180 240 300 360 420 480 540 151910-序列表.doc 600 660 660
201127957 agaaacgtgt ccttttcgat gatcttcaag gaaacctgac ttgggatgct gctatggttt tgatgaagca gctagagcaa gtaagggcag aggagaagga attgaagaaa aaaaggaagc aagagaagaa ggaggcaaaa ctcaaagcct ctaagatgaa caccaatcct gattgcgaat cgtcatcgtc atcgtcatca tctgaatctg aatctgaatc aagtgagagt gaatgtgaca atgaggtggt tgacatgaag aagaacatta aggttggtgt tgccgttgct gttgccgatt ccccacgaaa ggcggaaacc atgattctat acacctccct tgttgcccga gatgttagtg ctaatcatca tcatcataat gccgtggaat tattctctag aaacaatgac atatcagttg gaagcattaa tggtggcctt aagaatgaga atactgcggt tattaccact gaagctattc ctcagaagag gattgaggta tgcatgggaa acaagtgcaa gaaatccgga tctattgcat tgttgcaaga atttgagaga gtggttggtg ctgaaggagg tgctgctgct gcagttgttg gatgcaagtg catggggaag tgcaagagtg cacctaatgt gaggattcag aactctactg cagataaaat agctgagggg ttcaatgatt cagttaaggt tccagctaac cctctttgca ttggggttgc atggaggatg ttgaaaccat tgtggcttag attcttgggc gagaatcagg aaagtactaa tgaataattt gctggtatgc tgtttggaaa attgtatata cgtagtgcca gaacctatca gattgttgtt ttattttata tsiaacataga ctgcatattg ttgtgagatt cgatttcctc atttattgga acttccagag cctgatttgt gtccattcga gctcgactca aagatttaca tggcctgctc aatctatgaa ttcaaatttg agggccctgt ttggcattaa tattaatata ttaatat <210〉 85 <211〉 345 〈212〉 PRT <213〉花生 <400〉 85 151910-序列表.doc 720 780 840 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1637 •201 _ 201127957
Met Glu Val Ser Gly Ala Val Leu Arg Asn Val Thr Cys Pro Ser Phe 15 10 15
Ser Val His Val Ser Ser Arg Arg Arg Gly Gly Asp Ser Cys Val Thr 20 25 30
Val Pro Val Arg Met Arg Lys Lys Ala Val Val Arg Cys Cys Cys Gly 35 40 45
Phe Ser Asp Ser Gly His Val Gin Tyr Tyr Gly Asp Glu Lys Lys Lys 50 55 60
Glu Asn Gly Thr Ala Met Leu Ser Thr Lys Lys Lys Leu Lys Met Leu 65 70 75 80
Lys Lys Arg Val Leu Phe Asp Asp Leu Gin Gly Asn Leu Thr Trp Asp 85 90 95
Ala Ala Met Val Leu Met Lys Gin Leu Glu Gin Val Arg Ala Glu Glu 100 105 110
Lys Glu Leu Lys Lys Lys Arg Lys Gin Glu Lys Lys Glu Ala Lys Leu 115 120 125
Lys Ala Ser Lys Met Asn Thr Asn Pro Asp Cys Glu Ser Ser Ser Ser 130 135 140
Ser Ser Ser Ser Glu Ser Glu Ser Glu Ser Ser Glu Ser Glu Cys Asp 145 150 155 160
Asn Glu Val Val Asp Met Lys Lys Asn He Lys Val Gly Val Ala Val 165 170 175 -202 151910-序列表.doc 201127957
Ala Val Ala Asp Ser Pro Arg Lys Ala Glu Thr Met lie Leu Tyr Thr 180 185 190
Ser Leu Val Ala Arg Asp Val Ser Ala Asn His His His His Asn Ala 195 200 205
Val Glu Leu Phe Ser Arg Asn Asn Asp He Ser Val Gly Ser lie Asn 210 215 220
Gly Gly Leu Lys Asn Glu Asn Thr Ala Val He Thr Thr Glu Ala He 225 230 235 240
Pro Gin Lys Arg He Glu Val Cys Met Gly Asn Lys Cys Lys Lys Ser 245 250 255
Gly Ser lie Ala Leu Leu Gin Glu Phe Glu Arg Val Val Gly Ala Glu 260 265 270
Gly Gly Ala Ala Ala Ala Val Val Gly Cys Lys Cys Met Gly Lys Cys 275 280 285
Lys Ser Ala Pro Asn Val Arg He Gin Asn Ser Thr Ala Asp Lys lie 290 295 300
Ala Glu Gly Phe Asn Asp Ser Val Lys Val Pro Ala Asn Pro Leu Cys 305 310 315 320 lie Gly Val Ala Trp Arg Met Leu Lys Pro Leu Trp Leu Arg Phe Leu 325 330 335
Gly Glu Asn Gin Glu Ser Thr Asn Glu 340 345 -203- 151910-序列表.doc 201127957 <210> 86 <211〉 2811 <212〉 DNA <213〉擬南芥 <400〉 86 cccaagtgta atattgttat taatacatgg gctatactaa aagccccacg aaaagtttac 60 tgaactattt gaggcccaac aagagcctat cggattaacg cctactgcag aagaaaatct 120 gtctgcactc cacccaagaa aacgcagact aattaatgaa atcaacgaaa cggataggtc 180 gggtctaagg ttgaccatga accgcaacct gaaccaggag caaagtggtc aagttttgcc 240 atccggtccg agtcccttgg aggaataata ccagaacaga aaaaaacaga aaagtcgaca 300 ataaacaaaa gagacaaatt tgatttgatt ggttccagaa attcgcagag aaacagctct 360 ttgtctctct cgactgatct aacaatccct aatctgtgtt ctaaattcct ggacgagatt 420 tgacaaagtc cgtatagctt aacctggttt aatttcaagt gacagatatg ccccttattc 480 atcggaaaaa gccgacggag aaaccatcga cgccgccatc tgaagaggtg gtgcacgatg 540 aggattcgca aaagaaacca cacgaatctt ccaaatccca ccataagaaa tcgaacggag 600 gagggaagtg gtcgtgcatc gattcttgtt gttggttcat tgggtgtgtg tgtgtaacct 660 ggtggtttct tctcttcctt tacaacgcaa tgcctgcgag cttccctcag tatgtaacgg 720 agcgaatcac gggtcctttg cctgacccgc ccggtgttaa gctcaaaaaa gaaggtctta 780 aggcgaaaca tcctgttgtc ttcattcctg ggattgtcac cggtgggctc gagctttggg 840 aaggcaaaca atgcgctgat ggtttattta gaaaacgttt gtggggtgga acttttggtg 900 aagtctacaa aaggcctcta tgttgggtgg aacacatgtc acttgacaat gaaactgggt 960 tggatccagc tggtattaga gttcgagctg tatcaggact cgtggctgct gactactttg 1020 ctcctggcta ctttgtctgg gcagtgctga ttgctaacct tgcacatatt ggatatgaag 1080 agaaaaatat gtacatggct gcatatgact ggcggctttc gtttcagaac acagaggtac 1140 -204- 151910-序列表.doc 1200 1200
201127957 gtgatcagac tcttagccgt atgaaaagta atatagagtt gatggtttct accaacggtg gaaaaaaagc agttatagtt ccgcattcca tgggggtctt gtattttcta cattttatga agtgggttga ggcaccagct cctctgggtg gcgggggtgg gccagattgg tgtgcaaagt atattaaggc ggtgatgaac attggtggac catttcttgg tgttccaaaa gctgttgcag ggcttttctc tgctgaagca aaggatgttg cagttgccag agcgattgcc ccaggattct tagacaccga tatatttaga cttcagacct tgcagcatgt aatgagaatg acacgcacat gggactcaac aatgtctatg ttaccgaagg gaggtgacac gatatggggc gggcttgatt ggtcaccgga gaaaggccac acctgttgtg ggaaaaagca aaagaacaac gaaacttgtg gtgaagcagg tgaaaacgga gtttccaaga aaagtcctgt taactatgga aggatgatat cttttgggaa agaagtagca gaggctgcgc catctgagat taataatatt gattttcgag gtgctgtcaa aggtcagagt atcccaaatc acacctgtcg tgacgtgtgg acagagtacc atgacatggg aattgctggg atcaaagcta tcgctgagta taaggtctac actgctggtg aagctataga tctactacat tatgttgctc ctaagatgat ggcgcgtggt gccgctcatt tctcttatgg aattgctgat gatttggatg acaccaagta tcaagatccc aaatactggt caaatccgtt agagacaaaa ttaccgaatg ctcctgagat ggaaatctac tcattatacg gagtggggat accaacggaa cgagcatacg tatacaagct taaccagtct cccgacagtt gcatcccctt tcagatattc acttctgctc acgaggagga cgaagatagc tgtctgaaag caggagttta caatgtggat ggggatgaaa cagtacccgt cctaagtgcc gggtacatgt gtgcaaaagc gtggcgtggc aagacaagat tcaacccttc cggaatcaag acttatataa gagaatacaa tcactctccg ccggctaacc tgttggaagg gcgcgggacg cagagtggtg cccatgttga tatcatggga aactttgctt tgatcgaaga tatcatgagg gttgccgccg gaggtaacgg gtctgatata ggacatgacc aggtccactc tggcatattt gaatggtcgg 151910·序列表.doc -205- 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 2160 2220 2280 2340 2400 2460 201127957 agcgtattga cctgaagctg tgaatatcat gatctcttta agctgtcctg tcagcttatg 2520 tgaatccaat actttgaaag agagatcatc atcaattcat catcatcgtc atcatcatga 2580 tgctcaactc acaaagaagc ctgagaatga tactttggtg cgaaattctc aatacctctt 2640 taatattctt attgaatgta aattatacaa tcctatctaa tgtttgaacg ataacacaaa 2700 acttgctgcg ccatgtttgt ttgtcttgtc aaaagcatca atttgtgggt tatacgtagt 2760 gtagaggatg attcaaattt gtgataaatt tggtaatcaa agttaattct g 2811 <210〉 87 <211〉 671 <212> PRT <213〉擬南芥 <400> 87
Met Pro Leu lie His Arg Lys Lys Pro Thr Glu Lys Pro Ser Thr Pro 15 10 15
Pro Ser Glu Glu Val Val His Asp Glu Asp Ser Gin Lys Lys Pro His 20 25 30
Glu Ser Ser Lys Ser His His Lys Lys Ser Asn Gly Gly Gly Lys Trp 35 40 45
Ser Cys lie Asp Ser Cys Cys Trp Phe He Gly Cys Val Cys Val Thr 50 55 60
Trp Trp Phe Leu Leu Phe Leu Tyr Asn Ala Met Pro Ala Ser Phe Pro 65 70 75 80
Gin Tyr Val Thr Glu Arg lie Thr Gly Pro Leu Pro Asp Pro Pro Gly 85 90 95 •206·
1519丨0·序列表.doc 201127957
Val Lys Leu Lys Lys Glu Gly Leu Lys Ala Lys His Pro Val Val Phe 100 105 110 lie Pro Gly lie Val Thr Gly Gly Leu Glu Leu Trp Glu Gly Lys Gin 115 120 125
Cys Ala Asp Gly Leu Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Gly 130 135 140
Glu Val Tyr Lys Arg Pro Leu Cys Trp Val Glu His Met Ser Leu Asp 145 150 155 160
Asn Glu Thr Gly Leu Asp Pro Ala Gly He Arg Val Arg Ala Val Ser 165 170 175
Gly Leu Val Ala Ala Asp Tyr Phe Ala Pro Gly Tyr Phe Val Trp Ala 180 185 190
Val Leu lie Ala Asn Leu Ala His lie Gly Tyr Glu Glu Lys Asn Met 195 200 205
Tyr Met Ala Ala Tyr Asp Trp Arg Leu Ser Phe Gin Asn Thr Glu Val 210 215 220
Arg Asp Gin Thr Leu Ser Arg Met Lys Ser Asn lie Glu Leu Met Val 225 230 235 240
Ser Thr Asn Gly Gly Lys Lys Ala Val lie Val Pro His Ser Met Gly 245 250 255
Val Leu Tyr Phe Leu His Phe Met Lys Trp Val Glu Ala Pro Ala Pro 260 265 270 •207· 151910-序列表,doc 201127957
Leu Gly Gly Gly Gly Gly Pro Asp Trp Cys Ala Lys Tyr lie Lys Ala 275 280 285
Val Met Asn lie Gly Gly Pro Phe Leu Gly Val Pro Lys Ala Val Ala 290 295 300
Gly Leu Phe Ser Ala Glu Ala Lys Asp Val Ala Val Ala Arg Ala He 305 310 315 320
Ala Pro Gly Phe Leu Asp Thr Asp He Phe Arg Leu Gin Thr Leu Gin 325 330 335
His Val Met Arg Met Thr Arg Thr Trp Asp Ser Thr Met Ser Met Leu 340 345 350
Pro Lys Gly Gly Asp Thr He Trp Gly Gly Leu Asp Trp Ser Pro Glu 355 360 365
Lys Gly His Thr Cys Cys Gly Lys Lys Gin Lys Asn Asn Glu Thr Cys 370 375 380
Gly Glu Ala Gly·Glu Asn Gly Val Ser Lys Lys Ser Pro Val Asn Tyr 385 390 395 400
Gly Arg Met He Ser Phe Gly Lys Glu Val Ala Glu Ala Ala Pro Ser 405 410 415
Glu lie Asn Asn He Asp Phe Arg Gly Ala Val Lys Gly Gin Ser lie 420 425 430
Pro Asn His Thr Cys Arg Asp Val Trp Thr Glu Tyr His Asp Met Gly 435 440 445 •208·
151910-序列表.doc 201127957
He Ala Gly He Lys Ala He Ala Glu Tyr Lys Val Tyr Thr Ala Gly 450 455 460
Glu Ala lie Asp Leu Leu His Tyr Val Ala Pro Lys Met Met Ala Arg 465 470 475 480
Gly Ala Ala His Phe Ser Tyr Gly He Ala Asp Asp Leu Asp Asp Thr 485 490 495
Lys Tyr Gin Asp Pro Lys Tyr Trp Ser Asn Pro Leu Glu Thr Lys Leu 500 505 510
Pro Asn Ala Pro Glu Met Glu He Tyr Ser Leu Tyr Gly Val Gly He 515 520 525
Pro Thr Glu Arg Ala Tyr Val Tyr Lys Leu Asn Gin Ser Pro Asp Ser 530 535 540
Cys lie Pro Phe Gin lie Phe Thr Ser Ala His Glu Glu Asp Glu Asp 545 550 555 560
Ser Cys Leu Lys Ala Gly Val Tyr Asn Val Asp Gly Asp Glu Thr Val 565 570 575
Pro Val Leu Ser Ala Gly Tyr Met Cys Ala Lys Ala Trp Arg Gly Lys 580 585 590
Thr Arg Phe Asn Pro Ser Gly lie Lys Thr Tyr He Arg Glu Tyr Asn 595 600 605
His Ser Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gin Ser Gly 610 615 620 209- 151910·序列表.doc 201127957
Ala His Val Asp lie Met Gly Asn Phe Ala Leu lie Glu Asp lie Met 625 630 635 640
Arg Val Ala Ala Gly Gly Asn Gly Ser Asp He Gly His Asp Gin Val 645 650 655
His Ser Gly lie Phe Glu Trp Ser Glu Arg lie Asp Leu Lys Leu 660 665 670 <210〉 88 <211〉 2473 <212> DNA <213〉蓖麻 <400〉 88 cttgaatttt gtttcgatta ctttaaaaaa aattgccttt ttctgaaagc gcttctagtt tgatcttaat ggattattta cttttcagaa attagtagct caaacaaaat taagagagaa aaagagatcg tgggtttttt caaagaaaaa gtttceiaaca gaaagcacaa actttccgat gtggcttgcg aggaagttgg ggatgacata aattcttctg ccagtccgaa gttttggata taaagcagtg gtttttgtat tttccttttt ccttttctgt atcgtttagt aaagtcacat ttggcttatt gggtttgttt tatttcctct gtatttgctt tctgtacaaa gactatcaat aattagttaa taagctteiac aaatttaaaa atcttatttt tctttaaacc cagaaatgcc tgtaattcgg aggaaaaaac ccacttctga acccaacaaa aattcagcat cagactcaaa aacgccaagc gaggaagagg aacatgaaca agaacaggaa caagaagaag ataaaaataa caaaaagaaa tacccaaaga agaagagcag tgaaatcaat gcaaaaaaat ggtcatgcat agacagctgt tgttggtttg ttggttgcat ctgcgtgacg tggtgggttt tactatttct ttacaatgca gtgcctgcgt ctttgcctca atacgtaact gaggcaatca cgggtccttt acccgatcca cctggtgtta agctgaaaaa agagggatta acagcaaagc atccagtggt -210- 151910·序列表.doc 840 840
201127957 ttttgtacct gggattgtta ccgcggggct tgaattgtgg gaaggccatc agtgtgctga tgggctgttt aggaaacggc tctggggtgg aacttttgga gaagtttata agaggcctct ctgctgggta gagcatatgt ctctagacaa tgaaactgga ttggatcctc ctggtataag ggtcaggcca gtctctggac ttgtggctgc tgattacttt gctccaggct attttgtgtg ggctgttctg attgctaatt tggcacgcat tggatatgag gagaaaacaa tgttcatggc ctcatacgat tggagacttt catttcagaa cactgaggtc cgtgaccaaa cattaagccg gatgaagagt aatatagaac ttatggtttc tatcaatggt ggaaataagg cagttattgt tccacattcc atgggtgttt tgtactttct gcattttatg aagtgggttg aggcaccagc tccaatggga ggaggtggtg gaccagattg gtgtgctaag catatcaagg cagtcatgaa cattggtggt ccatttttag gtgttcccaa agctgttgct gggcttttct cggctgaagc aagagatatt gcagttgcca gggccatagc accaggtttc ttagataatg atatgttccg cctacaaaca ttgcaacaca tgatgaggat gtctcgcaca tgggattcga ccatgtcaat gataccaaga ggtggggaca ctatctgggg cgatcttgat tggtcacctg aagaaggtta cattcctaga aagaaaaggc agagaaataa tgcaactgat aatgtaaacg aaggtggggc cgaaagtgag atttctcaaa gaaagattgt tagatatgga agaatgatat catttgggaa aaatatagca gaggcacctt catatgatat tgaaaggatt gactttaggg atgctgttaa aggtcgtagt gtggcaaata atacctgcct tgatgtgtgg actgaatacc atgaaatggg attcggaggt attaaagccg ttgcagagta taaggtctac actgctggat ctactataga gctgcttcag tttgtcgccc caaaaatgat ggagcgtggt agtgctcatt tttcttatgg aattgctgac aatttggagg acccaaaata tgagcactac aaatactggt caaatcccct ggagacaaag ttacctaatg ctccagaaat ggaaatattt tccatgtatg gagttggcat accaacagaa agagcttatg tttatgagtt ttctcctgct gctgagtgct acattccatt 151910·序列表.doc •211· 900 960 1020 1080 1140 1200 1260 1320 1380 1440 1500 1560 1620 1680 1740 1800 1860 1920 1980 2040 2100 201127957 tcagattgat acatcagcta atgatggcga tgaagatggc tgtctgaaag atggagtcta 2160 tactgttgat ggggatgaga ctgttcctgt tttaagtgca ggcttcatgt gtgctaaagc 2220 ttggcgtggg aaaaccagat ttaatccttc aggaagtcga acatacatta gagagtacga 2280 tcattctcct ccagctaatt tgctagaggg ccgaggcacc caaagtggtg cccatgttga 2340 tataatgggt aattttgctt taatcgagga tattatgagg gtggcagccg gggctacagg 2400 agaagatttg ggaggcgatc aagtgtattc agatatcttt aagtggtctc agaagatcaa 2460 attaccactg taa 2473 <210〉 89 <211〉 685 <212〉 PRT <213〉蓖麻 <400〉 89
Met Pro Val lie Arg Arg Lys Lys Pro Thr Ser Glu Pro Asn Lys Asn 15 10 15
Ser Ala Ser Asp Ser Lys Thr Pro Ser Glu Glu Glu Glu His Glu Gin 20 25 30
Glu Gin Glu Gin Glu Glu Asp Lys Asn Asn Lys Lys Lys Tyr Pro Lys 35 40 45
Lys Lys Ser Ser Glu He Asn Ala Lys Lys Trp Ser Cys He Asp Ser 50 55 60
Cys Cys Trp Phe Val Gly Cys lie Cys Val Thr Trp Trp Val Leu Leu 65 70 75 80
Phe Leu Tyr Asn Ala Val Pro Ala Ser Leu Pro Gin Tyr Val Thr Glu 85 90 95 -212- 151910-序列表doc 201127957
Ala lie Thr Gly Pro Leu Pro Asp Pro Pro Gly Val Lys Leu Lys Lys 100 105 110
Glu Gly Leu Thr Ala Lys His Pro Val Val Phe Val Pro Gly lie Val 115 120 125
Thr Ala Gly Leu Glu Leu Trp Glu Gly His Gin Cys Ala Asp Gly Leu 130 135 140
Phe Arg Lys Arg Leu Trp Gly Gly Thr Phe Gly Glu Val Tyr Lys Arg 145 150 155 160
Pro Leu Cys Trp Val Glu His Met Ser Leu Asp Asn Glu Thr Gly Leu 165 170 175
Asp Pro Pro Gly lie Arg Val Arg Pro Val Ser Gly Leu Val Ala Ala 180 185 190
Asp Tyr Phe Ala Pro Gly Tyr Phe Val Trp Ala Val Leu lie Ala Asn 195 200 205
Leu Ala Arg lie Gly Tyr Glu Glu Lys Thr Met Phe Met Ala Ser Tyr 210 215 220
Asp Trp Arg Leu Ser Phe Gin Asn Thr Glu Val Arg Asp Gin Thr Leu 225 230 235 240
Ser Arg Met Lys Ser Asn lie Glu Leu Met Val Ser lie Asn Gly Gly 245 250 255
Asn Lys Ala Val lie Val Pro His Ser Met Gly Val Leu Tyr Phe Leu 260 265 270 •213- 151910-序列表doc 201127957
His Phe Met Lys Trp Val Glu Ala Pro Ala Pro Met Gly Gly Gly Gly 275 280 285
Gly Pro Asp Trp Cys Ala Lys His He Lys Ala Val Met Asn He Gly 290 295 300
Gly Pro Phe Leu Gly Val Pro Lys Ala Val Ala Gly Leu Phe Ser Ala 305 310 315 320
Glu Ala Arg Asp lie Ala Val Ala Arg Ala lie Ala Pro Gly Phe Leu 325 330 335
Asp Asn Asp Met Phe Arg Leu Gin Thr Leu Gin His Met Met Arg Met 340 345 350
Ser Arg Thr Trp Asp Ser Thr Met Ser Met He Pro Arg Gly Gly Asp 355 360 365
Thr He Trp Gly Asp Leu Asp Trp Ser Pro Glu Glu Gly Tyr He Pro 370 375 380
Arg Lys Lys Arg Gin Arg Asn Asn Ala Thr Asp Asn Val Asn Glu Gly 385 390 395 400
Gly Ala Glu Ser Glu He Ser Gin Arg Lys He Val Arg Tyr Gly Arg 405 410 415
Met He Ser Phe Gly Lys Asn He Ala Glu Ala Pro Ser Tyr Asp He 420 425 430
Glu Arg lie Asp Phe Arg Asp Ala Val Lys Gly Arg Ser Val Ala Asn 435 440 445 -214- 151910-序列表.doc 201127957
Asn Thr Cys Leu Asp Val Trp Thr Glu Tyr His Glu Met Gly Phe Gly 450 455 460
Gly lie Lys Ala Val Ala Glu Tyr Lys Val Tyr Thr Ala Gly Ser Thr 465 470 475 480 lie Glu Leu Leu Gin Phe Val Ala Pro Lys Met Met Glu Arg Gly Ser 485 490 495
Ala His Phe Ser Tyr Gly He Ala Asp Asn Leu Glu Asp Pro Lys Tyr 500 505 510
Glu His Tyr Lys Tyr Trp Ser Asn Pro Leu Glu Thr Lys Leu Pro Asn 515 520 525
Ala Pro Glu Met Glu lie Phe Ser Met Tyr Gly Val Gly lie Pro Thr 530 535 540
Glu Arg Ala Tyr Val Tyr Glu Phe Ser Pro Ala Ala Glu Cys Tyr He 545 550 555 560
Pro Phe Gin lie Asp Thr Ser Ala Asn Asp Gly Asp Glu Asp Gly Cys 565 570 575
Leu Lys Asp Gly Val Tyr Thr Val Asp Gly Asp Glu Thr Val Pro Val 580 585 590
Leu Ser Ala Gly Phe Met Cys Ala Lys Ala Trp Arg Gly Lys Thr Arg 595 600 605
Phe Asn Pro Ser Gly Ser Arg Thr Tyr lie Arg Glu Tyr Asp His Ser 610 615 620 • 215- 151910-序列表doc 201127957
Pro Pro Ala Asn Leu Leu Glu Gly Arg Gly Thr Gin Ser Gly Ala His 625 630 635 640
Val Asp He Met Gly Asn Phe Ala Leu lie Glu Asp He Met Arg Val 645 650 655
Ala Ala Gly Ala Thr Gly Glu Asp Leu Gly Gly Asp Gin Val Tyr Ser 660 665 670
Asp He Phe Lys Trp Ser Gin Lys lie Lys Leu Pro Leu 675 680 685 <210〉 90 <211〉 380 <212> PRT <213〉羽衣甘藍 <400〉 90
Met Arg Asn Glu lie Gin Asn Glu Thr Ala Gin Thr Asp Gin Thr Gin 15 10 15
Gly Ser Met Phe Ser Phe Phe Asp Leu Phe Pro Phe Leu Leu Pro Met 20 25 30
Phe Glu Val lie Lys Met Val Val Ala Ser Val Ala Ser Val Val Tyr 35 40 45
Leu Gly Phe Ala Gly Val Thr Leu Ser Gly Ser Ala Val Ala Leu Ala 50 55 60
Val Ser Thr Pro Leu Phe lie lie Phe Ser Pro He Leu Leu Pro Ala 65 70 75 80 216- 151910·序列表.doc 201127957 lie Ala Ala Thr Thr Val Leu Ala Ala Gly Leu Gly Ser Lys Lys Val 85 90 95
Ala Ala Ala Pro Ala Ala Ser Pro Ser Leu Ser Leu Leu Gly lie Pro 100 105 110
Glu Ser lie Lys Pro Ser Asn Val lie Pro Glu Ser lie Lys Pro Ser 115 120 125
Asn lie lie Pro Glu Ser lie Lys Pro Ser Asn He lie Pro Glu Ser 130 135 140
Val Lys Pro Ser Asn lie Lys Asp Lys lie Lys Asp Thr lie Gly Lys 145 150 155 160
Val Lys Asn Lys lie Asn Ala Lys Lys Glu Glu Lys Ser Lys Gly Lys 165 170 175
Ser Glu Asp Ser Ser Lys Gly Lys Gly Lys Ser Lys Gly Glu Asp Thr 180 185 190
Thr Thr Asp Glu Asp Lys Pro Gly Ser Gly Gly Lys His Gly Lys Gly 195 200 205
Glu Ser Lys His Gly Lys Gly Glu Ser Thr His Gly Lys Gly Gly Lys 210 215 220
His Gly Ser Glu Gly Ser Ser Met Asp Glu Gly Lys His Gly Gly Lys 225 230 235 240
His Gly Ser Gly Gly Ser Pro Met Gly Val Gly Lys His Gly Ser Gly 245 250 255 217 151910·序列表.doc 201127957
Gly Lys His Glu Ser Gly Gly Ser Pro Met Gly Gly Gly Lys His Gly 260 265 270
Ser Gly Gly Lys His Glu Ser Gly Gly Ala Ser Met Gly Gly Gly Lys 275 280 285
His Gly Ser Gly Gly Arg His Glu Gly Gly Gly Ser Ala Met Gly Gly 290 295 300
Gly Lys His Gly Ser Gly Gly Lys His Gly Ser Glu Gly Lys His Gly 305 310 315 320
Gly Glu Gly Ser Ser Met Gly Lys Asn Ser Leu Ser Lys Asn Lys Lys 325 330 335
Glu Phe His Tyr Arg Asp Gin Ala Met Asp Ala Ser Ser Thr Ser Glu 340 345 350
Ser Ser Asp Gly Ser Ser Asp Gly Ser Ser Ser Asp Gly Ser Ser Ser 355 360 365
Asp Gly Ser Ser His Gly Ser Gly Gly Lys His He 370 375 380 <210> 91 <211> 186 <212〉 PRT <213〉玉米 <400〉 91
Met Ala Asp Arg Asp Arg Ser Gly lie Tyr Gly Gly Ala His Ala Thr 1 5 10 15 -218·
151910·序列表doc 201127957
Tyr Gly Gin Gin Gin Gin Gin Gly Gly Gly Gly Arg Pro Met Gly Glu 20 25 30
Gin Val Lys Gly Met Leu His Asp Lys Gly Pro Thr Ala Ser Gin Ala 35 40 45
Leu Thr Val Ala Thr Leu Phe Pro Leu Gly Gly Leu Leu Leu Val Leu 50 55 60
Ser Gly Leu Ala Leu Thr Ala Ser Val Val Gly Leu Ala Val Ala Thr 65 70 75 80
Pro Val Phe Leu lie Phe Ser Pro Val Leu Val Pro Ala Ala Leu Leu 85 90 95 lie Gly Thr Ala Val Met Gly Phe Leu Thr Ser Gly Ala Leu Gly Leu 100 105 110
Gly Gly Leu Ser Ser Leu Thr Cys Leu Ala Asn Thr Ala Arg Gin Ala 115 120 125
Phe Gin Arg Thr Pro Asp Tyr Val Glu Glu Ala His Arg Arg Met Ala 130 135 140
Glu Ala Ala Ala His Ala Gly His Lys Thr Ala Gin Ala Gly Gin Ala 145 150 155 160
He Gin Gly Arg Ala Gin Glu Ala Gly Ala Gly Gly Gly Ala Gly Ala 165 170 175
Gly Ala Gly Gly Gly Gly Arg Ala Ser Ser 180 185 219- 151910·序列表.doc 201127957 <210> 92 <211〉 148 <212〉 PRT <213〉栽培稻 <400〉 92
Met Gly Asp Gin His Arg Gly Val lie Gly Gly Gly Gly Tyr Gly Asp 15 10 15
Arg Gly Gly Gin Glu Gin Gin Glu Lys Gin Pro Phe Met Met Thr Ala 20 25 30
Leu Lys Thr Val Thr Ala Ala Thr Ala Gly Gly Ser lie Leu Val Leu 35 40 45
Ser Gly Leu He Leu Ala Gly Thr Val He Ala Leu Thr Val Ala Thr 50 55 60
Pro Val Leu Val lie Phe Ser Pro Val Leu Val Pro Ala Ala lie Ala 65 70 75 80
Leu Ala Leu Met Ala Ala Gly Phe Val Thr Ser Val Gly Leu Gly Val 85 90 95
Ala Ala Leu Ser Val Phe Ser Trp Met Tyr Lys Tyr Leu Thr Gly Lys 100 105 110
His Pro Pro Gly Ala Asp His Leu Asp His Thr Lys Ala Arg Val Ala 115 120 125
Ser Lys Leu Arg Asp He Lys Glu Ala Ala His His Leu He Asp Gin 130 135 140
Ala Gin Ala Ser 220- 151910·序列表.doc 201127957 145 <210〉 93 <211〉 245 <212〉 PRT 〈213>芝麻 <400> 93
Met Ala Thr His Val Leu Ala Ala Ala Ala Glu Arg Asn Ala Ala Leu 15 10 15
Ala Pro Asp Ala Pro Leu Ala Pro Val Thr Met Glu Arg Pro Val Arg 20 25 30
Thr Asp Leu Glu Thr Ser lie Pro Lys Pro Tyr Met Ala Arg Gly Leu 35 40 45
Val Ala Pro Asp Met Asp His Pro Asn Gly Thr Pro Gly His Val His 50 55 60
Asp Asn Leu Ser Val Leu Gin Gin His Cys Ala Phe Phe Asp Gin Asp 65 70 75 80
Asp Asn Gly lie lie Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Gin 85 90 95 lie Gly Phe Asn Val He Ala Ser Leu lie Met Ala He Val He Asn 100 105 110
Val Ala Leu Ser Tyr Pro Thr Leu Pro Gly Trp lie Pro Ser Pro Phe 115 120 125
Phe Pro lie Tyr Leu Tyr Asn lie His Lys Ala Lys His Gly Ser Asp 130 135 140 •221 · 151910·序列表.doc 201127957
Ser Gly Thr Tyr Asp Thr Glu Gly Arg Tyr Leu Pro Met Asn Phe Glu 145 150 155 160
Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu 165 170 175
Gly Glu Leu Trp Ser Met Thr Glu Ala Asn Arg Glu Ala Phe Asp He 180 185 190
Phe Gly Trp He Ala Ser Lys Met Glu Trp Thr Leu Leu Tyr He Leu 195 200 205
Ala Arg Asp Gin Asp Gly Phe Leu Ser Lys Glu Ala lie Arg Arg Cys 210 215 220
Tyr Asp Gly Ser Leu Phe Glu Tyr Cys Ala Lys Met Gin Arg Gly Ala .225 230 235 240
Glu Asp Lys Met Lys 245 〈210〉 94 <211〉 239 <212〉 PRT <213〉大豆 <400〉 94
Met Ala Ala Glu Met Glu Arg Glu Ser Leu He Thr Glu Ala Pro Asn 15 10 15
Ala Pro Val Thr Ala Gin Arg Arg Val Arg Asn Asp Leu Glu Asn Ser 20 25 30 222· 151910-序列表.doc 201127957
Leu Pro Lys Pro Tyr Leu Pro Arg Ala Leu Lys Ala Pro Asp Thr Gly 35 40 45
His Pro Asn Gly Thr Ala Gly His Arg His His Asn Leu Ser Val Leu 50 55 60
Gin Gin His Cys Ala Phe Phe Asp Gin Asp Asp Asn Gly lie lie Tyr 65 70 75 80
Pro Trp Glu Thr Tyr Met Gly Leu Arg Ser He Gly Phe Asn Val Val 85 90 95
Ala Ser Val lie Met Ala lie Val lie Asn Val Gly Leu Ser Tyr Pro 100 105 110
Thr Leu Pro Asn Trp Phe Pro Ser Leu Leu Phe Pro lie Tyr lie His 115 120 125
Asn lie His Lys Ala Lys His Gly Ser Asp Ser Gly Val Tyr Asp Thr 130 135 140
Glu Gly Arg Tyr Val Pro Ala Asn lie Glu Asn lie Phe Ser Lys Tyr 145 150 155 160
Ala Arg Thr Val Pro Asp Lys Leu Thr Leu Gly Glu Leu Trp Asp Leu 165 170 175
Thr Glu Gly Asn Arg Asn Ala Phe Asp He Phe Gly Trp Leu Ala Ala 180 185 190
Lys Phe Glu Trp Gly Val Leu Tyr lie Leu Ala Arg Asp Glu Glu Gly 195 200 205 151910·序列表.doc -223 - 201127957
Phe Leu Ser Lys Glu Ala Val Arg Arg Cys Phe Asp Gly Ser Leu Phe 210 215 220
Glu Tyr Cys Ala Lys Met His Thr Thr Ser Asp Ala Lys Met Ser 225 230 235 <210〉 95 <211〉 243 <212〉 PRT <213〉玉米 〈400〉 95
Met Ser Ser Tyr Ser Pro Pro Pro Pro Pro Pro Arg Asp Gin Ser Met 15 10 15
Asp Thr Glu Ala Pro Asn Ala Pro lie Thr Arg Glu Arg Arg Leu Asn 20 25 30
Pro Asp Leu Gin Glu Gin Leu Pro Lys Pro Tyr Leu Ala Arg Ala Leu 35 40 45
Glu Ala Val Asp Pro Ser His Pro Gin Gly Thr Lys Gly Arg Asp Pro 50 55 60
Arg Gly Met Ser Val Leu Gin Gin His Ala Ala Phe Phe Asp Arg Asn 65 70 75 80
Gly Asp Gly Val He Tyr Pro Trp Glu Thr Phe Gin Gly Leu Arg Ala 85 90 95 lie Gly Cys Gly Leu Thr Val Ser Phe Ala Phe Ser lie Leu lie Asn 100 105 110 • 224- 151910·序列表.doc 201127957
Leu Phe Leu Ser Tyr Pro Thr Gin Pro Gly Trp Leu Pro Ser Pro Leu 115 120 125
Leu Ser lie Arg lie Asp Asn He His Lys Gly Lys His Gly Ser Asp 130 135 140
Ser Glu Thr Tyr Asp Thr Glu Gly Arg Phe Asp Pro Ser Lys Phe Asp 145 150 155 160
Ala He Phe Ser Lys Tyr Gly Arg Thr His Pro Asn Ala lie Thr Arg 165 170 175
Asp Glu Leu Ser Ser Met Leu Gin Gly Asn Arg Asn Thr Tyr Asp Phe 180 185 190
Leu Gly Trp Leu Ala Ala Ala Gly Glu Trp Leu Leu Leu Tyr Ser Leu 195 200 205
Ala Lys Asp Lys Asp Gly Leu Leu Gin Arg Glu Thr Val Arg Gly Leu 210 215 220
Phe Asp Gly Ser Leu Phe Glu Arg Leu Glu Asp Asp Asn Asn Lys Lys 225 230 235 240
Lys Ser Ser <210> 96 <211〉 348 〈212〉 PRT <213〉芝麻 <400〉 96
Met Asp Leu lie His Thr Phe Leu Asn Leu lie Ala Pro Pro Phe Thr -225- 151910-序列表.doc 201127957 15 10
Phe Phe Phe Leu Leu Phe Phe Leu Pro Pro Phe Gin lie Phe Lys Phe 20 25 30
Phe Leu Ser lie Leu Gly Thr Leu Phe Ser Glu Asp Val Ala Gly Lys 35 40 45
Val Val Val lie Thr Gly Ala Ser Ser Gly lie Gly Glu Ser Leu Ala 50 55 60
Tyr Glu Tyr Ala Lys Arg Gly Ala Cys Leu Val Leu Ala Ala Arg Arg 65 70 75 80
Glu Arg Ser Leu Gin Glu Val Ala Glu Arg Ala Arg Asp Leu Gly Ser 85 90 95
Pro Asp Val Val Val Val Arg Ala Asp Val Ser Lys Ala Glu Asp Cys 100 105 110
Arg Lys Val Val Asp Gin Thr Met Asn Arg Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly He Met Ser Val Ser Met Leu Glu Glu Val 130 135 140
Glu Asp lie Thr Gly Tyr Arg Glu Thr Met Asp He Asn Phe Trp Gly 145 150 155 160
Tyr Val Tyr Met Thr Arg Phe Ala Ala Pro Tyr Leu Arg Asn Ser Arg 165 170 175
Gly Arg He Val Val Leu Ser Ser Ser Ser Ser Trp Met Pro Thr Pro • 226· 151910·序列表.doc 201127957 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala lie Ser Gin Phe Phe 195 200 205
Glu Thr Leu Arg Val Glu Phe Gly Pro Asp lie Gly He Thr Leu Val 210 215 220
Thr Pro Gly Phe lie Glu Ser Glu Leu Thr Gin Gly Lys Phe Tyr Asn 225 230 235 240
Ala Gly Glu Arg Val lie Asp Gin Asp Met Arg Asp Val Gin Val Ser 245 250 255
Thr Thr Pro lie Leu Arg Val Glu Ser Ala Ala Arg Ser lie Val Arg 260 265 270
Ser Ala lie Arg Gly Glu Arg Tyr Val Thr Glu Pro Ala Trp Phe Arg 275 280 285
Val Thr Tyr Trp Trp Lys Leu Phe Cys Pro Glu Val Met Glu Trp Val 290 295 300
Phe Arg Leu Met Tyr Leu Ala Ser Pro Gly Glu Pro Glu Lys Glu Thr 305 310 315 320
Phe Gly Lys Lys Val Leu Asp Tyr Thr Gly Val Lys Ser Leu Leu Tyr 325 330 335
Pro Glu Thr Val Gin Val Pro Glu Pro Lys Asn Asp 340 345 <210〉 97 227- 151910·序列表.doc 201127957 <211> 349 <212> PRT <213〉甘藍型油菜 <400> 97
Met Glu Leu He Asn Asp Phe Leu Asn Leu Thr Ala Pro Phe Phe Thr 15 10 15
Phe Phe Gly Leu Cys Phe Phe Leu Pro Pro Phe Tyr Phe Phe Lys Phe 20 25 30
Val Gin Ser He Phe Ser Thr He Phe Ser Glu Asn Val Tyr Gly Lys 35 40 45
Val Val Leu lie Thr Gly Ala Ser Ser Gly lie Gly Glu Gin Leu Ala 50 55 60
Tyr Glu Tyr Ala Ser Lys Gly Ala Cys Leu Ala Leu Thr Ala Arg Arg 65 70 75 80
Lys Asn Arg Leu Glu Glu Val Ala Glu lie Ala Arg Glu Val Gly Ser 85 90 95
Pro Asn Val Val Thr Val His Ala Asp Val Ser Lys Pro Asp Asp Cys 100 105 110
Arg Arg lie Val Asp Glu Thr He Ser His Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly lie Met Gin He Ser Met Phe Glu Asn lie 130 135 140
Glu Glu He Thr Arg Thr Arg Ala Val Met Asp Thr Asn Phe Trp Gly 145 150 155 160 • 228· 151910-序列表.doc 201127957
Ala Val Tyr Thr Thr Arg Ala Ala Leu Pro Tyr Leu Arg Gin Ser Asn 165 170 175
Gly Lys lie Val Ala Met Ser Ser Ser Ala Ala Trp Leu Thr Ala Pro 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala Leu Leu Asn Phe Phe 195 200 205
Glu Thr Leu Arg lie Glu Leu Gly Ser Asp Val His lie Thr lie Val 210 215 220
Thr Pro Gly Tyr lie Glu Ser Glu Leu Thr Gin Gly Lys Tyr Val Ser 225 230 235 240
Gly Glu Gly Glu Leu Val Val Asn Gin Asp lie Arg Asp Val Gin lie 245 250 255
Gly Ala Phe Pro Val Thr Ser Val Ser Gly Arg Ala Lys Gly lie Val 260 265 270
Lys Gly Val Cys Arg Lys Glu Arg Tyr Val Thr Glu Pro Ser Trp Phe 275 280 285
Lys Val Thr Tyr Leu Trp Lys Val Phe Cys Pro Glu Leu lie Glu Trp 290 295 300
Gly Cys Arg Leu Met Phe Leu Ser Gly His Gly Thr Pro Glu Glu Asn 305 310 315 320
Ala Leu Asn Lys Lys lie Leu Asp lie Pro Gly Val Arg Ser Ala Leu 325 330 335 -229 151910·序列表.doc 201127957
Tyr Pro Glu Pro lie Arg Thr Pro Glu He Lys Ser Glu 340 345 <210> 98 <211〉 350 〈212〉 PRT <213〉玉米 <400〉 98
Met Leu Gly Met Ser Arg Thr Gly Leu Ala Gly Ala Ala Leu Arg Val 15 10 15
Ala Leu Thr Ala Leu Leu Pro Leu Val Leu Pro Ala Tyr Tyr Val Tyr 20 25 30
Lys Leu Thr Thr Tyr Leu Leu Gly Ala Val Phe Pro Glu Asp Val Ala 35 40 45
Gly Lys Val Val Leu lie Thr Gly Ala Ser Ser Gly lie Gly Glu His 50 55 60
Leu Ala Tyr Glu Tyr Ala Lys Arg Gly Ala Tyr Leu Ala Leu Val Ala 65 70 75 80
Arg Arg Glu Ala Ser Leu Arg Glu Val Gly Asp Val Ala Leu Gly Leu 85 90 95
Gly Ser Pro Gly Val Leu Val Leu Pro Ala Asp Val Ser Lys Pro Arg 100 105 110
Asp Cys Glu Gly Phe He Asp Asp Thr lie Ser Tyr Phe Gly Arg Leu 115 120 125 • 230· 151910-序列表.doc 201127957
Asp His Leu Val Asn Asn Ala Ser lie Trp Gin Val Cys Lys Phe Glu 130 135 140
Glu He Gin Asp Val Arg His Leu Arg Ala Leu Met Asp He Asn Phe 145 150 155 160
Trp Gly His Val Tyr Pro Thr Arg Leu Ala lie Pro His Leu Arg Arg 165 170 175
Ser Arg Gly Arg lie Val Gly Val Thr Ser Asn Ser Ser Tyr lie Phe 180 185 190
lie Gly Arg Asn Thr Phe Tyr Asn Ala Ser Lys Ala Ala Ala Leu Ser 195 200 205
Phe Tyr Asp Thr Leu Arg Met Glu Leu Gly Ser Asp lie Arg lie Thr 210 215 220
Glu Val Val Pro Gly Val Val Glu Ser Glu lie Thr Lys Gly Lys Met 225 230 235 240
Leu Thr Lys Gly Gly Glu Met Lys Val Asp Gin Asp Glu Arg Asp Ala 245 250 255
He Leu Gly Pro Thr Pro Ala Glu Pro Val Gly Asp Phe Ala Arg Thr 260 265 270
Val Val Arg Asp Val Cys Arg Gly Ala Arg Tyr Val Phe Glu Pro Arg 275 280 285
Trp Tyr Met Gly Val Tyr Leu Leu Arg Ala Cys Leu Pro Glu Val Leu 290 295 300 231- 151910-序列表.doc 201127957
Ala Trp Asn Ser Arg Leu Leu Thr Val Asp Thr Val Gly Ala Ser Thr 305 310 315 320
Thr Asp Thr Leu Gly Lys Trp Leu Val Glu Leu Pro Gly Val Arg Arg 325 330 335
Val Val Gin Pro Pro Ser Leu Arg Ser Pro Glu lie Lys Asp 340 345 350 <210〉 99 <211〉 380 <212〉 PRT <213〉羽衣甘藍 <400〉 99
Met Arg Asn Cys lie Gin Asn Glu Thr Ala Gin Thr Cys Gin Thr Gin 15 10 15
Gly Ser Met Phe Ser Phe Phe Cys Leu Phe Pro Phe Leu Leu Pro Met 20 25 30
Phe Glu Val He Lys Met Val Val Ala Ser Val Ala Ser Val Val Tyr 35 40 45
Leu Gly Phe Ala Gly Val Thr Leu Ser Gly Ser Ala Val Ala Leu Ala 50 55 60
Val Ser Thr Pro Leu Phe lie He Phe Ser Pro lie Leu Leu Pro Ala 65 70 75 80 lie Ala Ala Thr Thr Val Leu Ala Ala Gly Leu Gly Ser Lys Lys Val 85 90 95 • 232· 151910·序列表.doc 201127957
Ala Ala Ala Pro Ala Ala Ser Pro Ser Leu Ser Leu Leu Gly lie Pro 100 105 110
Glu Ser lie Lys Pro Ser Asn Val lie Pro Glu Ser lie Lys Pro Ser 115 120 125
Asn He lie Pro Glu Ser He Lys Pro Ser Asn He He Pro Glu Ser 130 135 140
Val Lys Pro Ser Asn lie Lys Asp Lys lie Lys Asp Thr lie Gly Lys 145 150 155 160
Val Lys Asn Lys lie Asn Ala Lys Lys Glu Glu Lys Ser Lys Gly Lys 165 170 175
Ser Glu Asp Ser Ser Lys Gly Lys Gly Lys Ser Lys Gly Glu Asp Thr 180 185 190
Thr Thr Asp Glu Asp Lys Pro Gly Ser Gly Gly Lys His Gly Lys Gly 195 200 205
Glu Ser Lys His Gly Lys Gly Glu Ser Thr His Gly Lys Gly Gly Lys 210 215 220
His Gly Ser Glu Gly Ser Ser Met Asp Glu Gly Lys His Gly Gly Lys 225 230 235 240
His Gly Ser Gly Gly Ser Pro Met Gly Val Gly Lys His Gly Ser Gly 245 250 255
Gly Lys His Glu Ser Gly Gly Ser Pro Met Gly Gly Gly Lys His Gly 260 265 270 • 233 · 151910-序列表.d〇c 201127957
Ser Gly Gly Lys His Glu Ser Gly Gly Ala Ser Met Gly Gly Gly Lys 275 280 285
His Gly Ser Gly Gly Arg His Glu Gly Gly Gly Ser Ala Met Gly Gly 290 295 300
Gly Lys His Gly Ser Gly Gly Lys His Gly Ser Glu Gly Lys His Gly 305 310 315 320
Gly Glu Gly Ser Ser Met Gly Lys Asn Ser Leu Ser Lys Asn Lys Lys 325 330 335
Glu Phe His Tyr Arg Asp Gin Ala Met Cys Ala Ser Ser Thr Ser Glu 340 345 350
Ser Ser Asp Gly Ser Ser Cys Gly Ser Ser Ser Asp Gly Ser Ser Ser 355 360 365
Cys Gly Ser Ser His Gly Ser Gly Gly Lys His He 370 375 380 <210> 100 <211〉 186 <212〉 PRT <213〉玉米 <400〉 100
Met Ala Asp Arg Cys Arg Ser Gly He Tyr Gly Gly Ala His Ala Thr 15 10 15
Tyr Gly Gin Gin Gin Gin Gin Gly Gly Gly Gly Arg Pro Met Gly Cys 20 25 30
Gin Val Lys Gly Met Leu His Cys Lys Gly Pro Thr Ala Ser Gin Ala -234- 151910-序列表.doc 201127957 45 35 40
Leu Thr Val Ala Thr Leu Phe Pro Leu Gly Gly Leu Leu Leu Val Leu 50 55 60
Ser Gly Leu Ala Leu Thr Ala Ser Val Val Gly Leu Ala Val Ala Thr 65 70 75 80
Pro Val Phe Leu He Phe Ser Pro Val Leu Val Pro Ala Ala Leu Leu 85 90 95
lie Gly Thr Ala Val Met Gly Phe Leu Thr Ser Gly Ala Leu Gly Leu 100 105 110
Gly Gly Leu Ser Ser Leu Thr Cys Leu Ala Asn Thr Ala Arg Gin Ala 115 120 125
Phe Gin Arg Thr Pro Asp Tyr Val Cys Glu Ala His Arg Arg Met Ala 130 135 140
Cys Ala Ala Ala His Ala Gly His Lys Thr Ala Gin Ala Gly Gin Ala 145 150 155 160
He Gin Gly Arg Ala Gin Cys Ala Gly Ala Gly Gly Gly Ala Gly Ala 165 170 175
Gly Ala Gly Gly Gly Gly Arg Ala Ser Ser 180 185 <210〉 101 <211〉 148 <212〉 PRT 〈213〉栽培稻 •235· 151910-序列表.doc 201127957 <400〉 101
Met Gly Asp Gin His Cys Gly Val lie Gly Gly Gly Gly Tyr Gly Cys 15 10 15
Arg Gly Gly Gin Glu Gin Gin Cys Lys Gin Pro Phe Met Met Thr Ala 20 25 30
Leu Lys Thr Val Thr Ala Ala Thr Ala Gly Gly Ser He Leu Val Leu 35 40 45
Ser Gly Leu He Leu Ala Gly Thr Val lie Ala Leu Thr Val Ala Thr 50 55 60
Pro Val Leu Val lie Phe Ser Pro Val Leu Val Pro Ala Ala lie Ala 65 70 75 80
Leu Ala Leu Met Ala Ala Gly Phe Val Thr Ser Val Gly Leu Gly Val 85 90 95
Ala Ala Leu Ser Val Phe Ser Trp Met Tyr Lys Tyr Leu Thr Gly Lys 100 105 130
His Pro Pro Gly Ala Asp His Leu Cys His Thr Lys Ala Arg Val Ala 115 120 125
Ser Lys Leu Arg Cys He Lys Glu Ala Ala His His Leu He Cys Gin 130 135 140
Ala Gin Ala Ser 145 <210〉 102 <211〉 245 236· 151910-序列表.doc 201127957 <212〉 PRT 〈213> 芝麻 <400> 102
Met Ala Thr His Val Leu Ala Ala Ala Ala Cys Arg Asn Ala Ala Leu 15 10 15
Ala Pro Cys Ala Pro Leu Ala Pro Val Thr Met Cys Arg Pro Val Arg 20 25 30
Thr Asp Leu Glu Thr Ser lie Pro Lys Pro Tyr Met Ala Arg Gly Leu 35 40 45
Val Ala Pro Asp Met Asp His Pro Asn Gly Thr Pro Gly His Val His 50 55 60
Asp Asn Leu Ser Val Leu Gin Gin His Cys Ala Phe Phe Asp Gin Asp 65 70 75 80
Asp Asn Gly He lie Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Gin 85 90 95 lie Gly Phe Asn Val lie Ala Ser Leu lie Met Ala lie Val lie Asn 100 105 110
Val Ala Leu Ser Tyr Pro Thr Leu Pro Gly Trp He Pro Ser Pro Phe 115 120 125
Phe Pro lie Tyr Leu Tyr Asn He His Lys Ala Lys His Gly Ser Asp 130 135 140
Ser Gly Thr Tyr Asp Thr Glu Gly Arg Tyr Leu Pro Met Asn Phe Glu 145 150 155 160 237 · 151910-序列表.doc 201127957
Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu 165 170 175
Gly Glu Leu Trp Ser Met Thr Glu Ala Asn Arg Glu Ala Phe Asp He 180 185 190
Phe Gly Trp lie Ala Ser Lys Met Glu Trp Thr Leu Leu Tyr lie Leu 195 200 205
Ala Arg Cys Gin Asp Gly Phe Leu Ser Cys Glu Ala lie Arg Arg Cys 210 215 220
Tyr Asp Gly Ser Leu Phe Glu Tyr Cys Ala Lys Met Gin Arg Gly Ala 225 230 235 240
Glu Asp Lys Met Cys 245 <210〉 103 <211〉 239 <212〉 PRT 〈213〉野生大豆 <400> 103
Met Ala Ala Cys Met Glu Arg Glu Ser Leu lie Thr Cys Ala Pro Asn 15 10 15
Ala Pro Val Thr Ala Gin Arg Cys Val Arg Asn Asp Leu Glu Asn Ser 20 25 30
Leu Pro Lys Pro Tyr Leu Pro Arg Ala Leu Lys Ala Pro Asp Thr Gly 35 40 45 238· 151910·序列表.doc 201127957
His Pro Asn Gly Thr Ala Gly His Arg His His Asn Leu Ser Val Leu 50 55 60
Gin Gin His Cys Ala Phe Phe Asp Gin Asp Asp Asn Gly He He Tyr 65 70 75 80
Pro Trp Glu Thr Tyr Met Gly Leu Arg Ser lie Gly Phe Asn Val Val 85 90 95
Ala Ser Val lie Met Ala He Val lie Asn Val Gly Leu Ser Tyr Pro 100 105 110
Thr Leu Pro Asn Trp Phe Pro Ser Leu Leu Phe Pro lie Tyr lie His 115 120 125
Asn lie His Lys Ala Lys His Gly Ser Asp Ser Gly Val Tyr Asp Thr 130 135 140
Glu Gly Arg Tyr Val Pro Ala Asn lie Glu Asn He Phe Ser Lys Tyr 145 150 155 160
Ala Arg Thr Val Pro Asp Lys Leu Thr Leu Gly Glu Leu Trp Asp Leu 165 170 175
Thr Glu Gly Asn Arg Asn Ala Phe Asp lie Phe Gly Trp Leu Ala Ala 180 185 190
Lys Phe Glu Trp Gly Val Leu Tyr lie Leu Ala Arg Cys Glu Glu Gly 195 200 205
Phe Leu Ser Lys Cys Ala Val Arg Arg Cys Phe Asp Gly Ser Leu Phe 210 215 220 151910-序列表.doc -239 - 201127957
Glu Tyr Cys Ala Lys Met His Thr Thr Ser Asp Ala Cys Met Ser 225 230 235 <210> 104 <211〉 243 <212> PRT <213〉玉米 <400> 104
Met Ser Ser Tyr Ser Pro Pro Pro Pro Pro Pro Arg Asp Gin Ser Met 15 10 15
Asp Thr Cys Ala Pro Asn Ala Pro lie Thr Cys Glu Arg Arg Leu Asn 20 25 30
Pro Asp Leu Gin Cys Gin Leu Pro Lys Pro Tyr Leu Ala Arg Ala Leu 35 40 45
Glu Ala Val Asp Pro Ser His Pro Gin Gly Thr Lys Gly Arg Asp Pro 50 55 60
Arg Gly Met Ser Val Leu Gin Gin His Ala Ala Phe Phe Asp Arg Asn 65 70 75 80
Gly Asp Gly Val He Tyr Pro Trp Glu Thr Phe Gin Gly Leu Arg Ala 85 90 95
He Gly Cys Gly Leu Thr Val Ser Phe Ala Phe Ser lie Leu He Asn 100 105 110
Leu Phe Leu Ser Tyr Pro Thr Gin Pro Gly Trp Leu Pro Ser Pro Leu 115 120 125
Leu Ser lie Arg lie Asp Asn He His Lys Gly Lys His Gly Ser Asp •240- 151910·序列表.doc 201127957 130 135 140
Ser Glu Thr Tyr Asp Thr Glu Gly Arg Phe Asp Pro Ser Lys Phe Asp 145 150 155 160
Ala lie Phe Ser Lys Tyr Gly Arg Thr His Pro Asn Ala lie Thr Arg 165 170 175
Asp Glu Leu Ser Ser Met Leu Gin Gly Asn Arg Asn Thr Tyr Asp Phe 180 185 190
Leu Gly Trp Leu Ala Ala Ala Gly Glu Trp Leu Leu Leu Tyr Ser Leu 195 200 205
Ala Lys Asp Lys Asp Gly Leu Leu Gin Arg Cys Thr Val Arg Gly Leu 210 215 220
Phe Asp Gly Ser Leu Phe Cys Arg Leu Glu Asp Asp Asn Asn Lys Lys 225 230 235 240
Cys Ser Ser
<210> 105 <211〉 348 <212〉 PRT <213〉芝麻 <400> 105
Met Asp Leu lie Cys Thr Phe Leu Asn Leu lie Ala Pro Pro Phe Thr 15 10 15
Phe Phe Phe Leu Leu Phe Phe Leu Pro Pro Phe Cys lie Phe Lys Phe 20 25 30 -241 - 151910-序列表.doc 201127957
Phe Leu Cys He Leu Gly Thr Leu Phe Ser Glu Asp Val Ala Gly Lys 35 40 45
Val Val Val He Thr Gly Ala Ser Ser Gly lie Gly Glu Ser Leu Ala 50 55 60
Tyr Glu Tyr Ala Lys Arg Gly Ala Cys Leu Val Leu Ala Ala Arg Arg 65 70 75 80
Glu Arg Ser Leu Gin Glu Val Ala Glu Arg Ala Arg Asp Leu Gly Ser 85 90 95
Pro Asp Val Val Val Val Arg Ala Asp Val Ser Lys Ala Glu Asp Cys 100 105 110
Arg Lys Val Val Asp Gin Thr Met Asn Arg Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly lie Met Ser Val Ser Met Leu Glu Glu Val 130 135 140
Glu Asp lie Thr Gly Tyr Arg Glu Thr Met Asp He Asn Phe Trp Gly 145 150 155 160
Tyr Val Tyr Met Thr Arg Phe Ala Ala Pro Tyr Leu Arg Asn Ser Arg 165 170 175
Gly Arg lie Val Val Leu Ser Ser Ser Ser Ser Trp Met Pro Thr Pro 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala lie Ser Gin Phe Phe 195 200 205 151910-序列表.doc -242- 201127957
Glu Thr Leu Arg Val Glu Phe Gly Pro Asp lie Gly lie Thr Leu Val 210 215 220
Thr Pro Gly Phe lie Glu Ser Glu Leu Thr Gin Gly Lys Phe Tyr Asn 225 230 235 240
Ala Gly Glu Arg Val lie Asp Gin Asp Met Arg Asp Val Gin Val Ser 245 250 255
Thr Thr Pro He Leu Arg Val Glu Ser Ala Ala Arg Ser He Val Arg 260 265 270
Ser Ala lie Arg Gly Glu Arg Tyr Val Thr Glu Pro Ala Trp Phe Arg 275 280 285
Val Thr Tyr Trp Trp Lys Leu Phe Cys Pro Glu Val Met Glu Trp Val 290 295 300
Phe Arg Leu Met Tyr Leu Ala Ser Pro Gly Cys Pro Glu Lys Cys Thr 305 310 315 320
Phe Gly Lys Lys Val Leu Cys Tyr Thr Gly Val Lys Ser Leu Leu Tyr 325 330 335
Pro Glu Thr Val Gin Val Pro Glu Pro Lys Asn Asp 340 345 <210〉 106 <211〉 349 <212〉 PRT <213〉甘藍型油菜 <400〉 106 243 - 151910-序列表.doc 201127957
Met Glu Leu lie Asn Cys Phe Leu Asn Leu Thr Ala Pro Phe Phe Thr 15 10 15
Phe Phe Gly Leu Cys Phe Phe Leu Pro Pro Phe Tyr Phe Phe Cys Phe 20 25 30
Val Gin Cys lie Phe Ser Thr lie Phe Ser Glu Asn Val Tyr Gly Lys 35 40 45
Val Val Leu lie Thr Gly Ala Ser Ser Gly lie Gly Glu Gin Leu Ala 50 55 60
Tyr Glu Tyr Ala Ser Lys Gly Ala Cys Leu Ala Leu Thr Ala Arg Arg 65 70 75 80
Lys Asn Arg Leu Glu Glu Val Ala Glu lie Ala Arg Glu Val Gly Ser 85 90 95
Pro Asn Val Val Thr Val His Ala Asp Val Ser Lys Pro Asp Asp Cys 1 ⑻ 105 110
Arg Arg lie Val Asp Glu Thr lie Ser His Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly lie Met Gin He Ser Met Phe Glu Asn lie 130 135 140
Glu Glu lie Thr Arg Thr Arg Ala Val Met Asp Thr Asn Phe Trp Gly 145 150 155 160
Ala Val Tyr Thr Thr Arg Ala Ala Leu Pro Tyr Leu Arg Gin Ser Asn 165 170 175 -244 151910·序列表.doc 201127957
Gly Lys lie Val Ala Met Ser Ser Ser Ala Ala Trp Leu Thr Ala Pro 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala Leu Leu Asn Phe Phe 195 200 205
Glu Thr Leu Arg lie Glu Leu Gly Ser Asp Val His lie Thr lie Val 210 215 220
Thr Pro Gly Tyr lie Glu Ser Glu Leu Thr Gin Gly Lys Tyr Val Ser 225 230 235 240
Gly Glu Gly Glu Leu Val Val Asn Gin Asp lie Arg Asp Val Gin He 245 250 255
Gly Ala Phe Pro Val Thr Ser Val Ser Gly Arg Ala Lys Gly He Val 260 265 270
Lys Gly Val Cys Arg Lys Glu Arg Tyr Val Thr Glu Pro Ser Trp Phe 275 280 285
Lys Val Thr Tyr Leu Trp Lys Val Phe Cys Pro Glu Leu lie Glu Trp 290 295 300
Gly Cys Arg Leu Met Phe Leu Ser Gly His Gly Thr Pro Cys Glu Asn 305 310 315 320
Ala Leu Asn Lys Lys lie Leu Asp lie Pro Gly Val Arg Ser Ala Leu 325 330 335
Tyr Pro Cys Pro lie Arg Thr Pro Cys lie Lys Ser Glu 340 345 •245- 151910·序列表.doc 201127957 <210> 107 <211> 349 〈212〉 PRT <213〉玉米 <400〉 107
Met Glu Leu lie Asn Cys Phe Leu Asn Leu Thr Ala Pro Phe Phe Thr 15 10 15
Phe Phe Gly Leu Cys Phe Phe Leu Pro Pro Phe Tyr Phe Phe Cys Phe 20 25 30
Val Gin Cys lie Phe Ser Thr lie Phe Ser Glu Asn Val Tyr Gly Lys 35 40 45
Val Val Leu lie Thr Gly Ala Ser Ser Gly lie Gly Glu Gin Leu Ala 50 55 60
Tyr Glu Tyr Ala Ser Lys Gly Ala Cys Leu Ala Leu Thr Ala Arg Arg 65 70 75 80
Lys Asn Arg Leu Glu Glu Val Ala Glu He Ala Arg Glu Val Gly Ser 85 90 95
Pro Asn Val Val Thr Val His Ala Asp Val Ser Lys Pro Asp Asp Cys 100 105 110
Arg Arg lie Val Asp Glu Thr He Ser His Phe Gly Arg Leu Asp His 115 120 125
Leu Val Asn Asn Ala Gly He Met Gin He Ser Met Phe Glu Asn He 130 135 140 246- 151910·序列表.doc 201127957
Glu Glu lie Thr Arg Thr Arg Ala Val Met Asp Thr Asn Phe Trp Gly 145 150 155 160
Ala Val Tyr Thr Thr Arg Ala Ala Leu Pro Tyr Leu Arg Gin Ser Asn 165 170 175
Gly Lys lie Val Ala Met Ser Ser Ser Ala Ala Trp Leu Thr Ala Pro 180 185 190
Arg Met Ser Phe Tyr Asn Ala Ser Lys Ala Ala Leu Leu Asn Phe Phe 195 200 205
Glu Thr Leu Arg He Glu Leu Gly Ser Asp Val His lie Thr lie Val 210 215 220
Thr Pro Gly Tyr lie Glu Ser Glu Leu Thr Gin Gly Lys Tyr Val Ser 225 230 235 240
Gly Glu Gly Glu Leu Val Val Asn Gin Asp lie Arg Asp Val Gin He 245 250 255
Gly Ala Phe Pro Val Thr Ser Val Ser Gly Arg Ala Lys Gly lie Val 260 265 270
Lys Gly Val Cys Arg Lys Glu Arg Tyr Val Thr Glu Pro Ser Trp Phe 275 280 285
Lys Val Thr Tyr Leu Trp Lys Val Phe Cys Pro Glu Leu lie Glu Trp 290 295 300
Gly Cys Arg Leu Met Phe Leu Ser Gly His Gly Thr Pro Cys Glu Asn 305 310 315 320 247- 151910·序列表.d〇c 201127957
Ala Leu Asn Lys Lys lie Leu Asp lie Pro Gly Val Arg Ser Ala Leu 325 330 335
Tyr Pro Cys Pro lie Arg Thr Pro Cys lie Lys Ser Glu 340 345 248· 151910-序列表.doc
Claims (1)
- 201127957 七、申請專利範圍: 1. 一種聚核苷酸,其編碼包括至少一個人工引入之半胱胺 酸的經改質油質蛋白。 2. 如請求項1之聚核苷酸,其中該經改質油質蛋白包括至 少兩個半胱胺酸,其中至少一者經人工引入。 3·如請求項3之聚核苷酸,其中該等經改質油質蛋白各自 包括: i) 至少兩個人工引入之半胱胺酸, ii) 至少三個人工引入之半胱胺酸, iii) 至少四個人工引入之半胱胺酸, iv) 至少五個人工引入之半胱胺酸, v) 至少六個人工引入之半胱胺酸, vi) 至少七個人工引入之半胱胺酸, vii) 至少八個人工引入之半胱胺酸, viii) 至少九個人工引入之半胱胺酸, ix) 至少十個人工引入之半胱胺酸, X)至少十一個人工引入之半脱胺酸, xi) 至少十二個人工引入之半胱胺酸, xii) 至少十三個人工引入之半胱胺酸,或 xiii) 至少十四個人工引入之半胱胺酸。 4. 如請求項2或3之聚核苷酸,其中該經改質油質蛋白包括 至少一個在N端親水區中之半胱胺酸及至少一個在c端親 水區中之半脱胺酸。 5. 如凊求項4之聚核苷酸,其中該等半胱胺酸實質上均勺 151910.doc 201127957 地分佈於該油質蛋白之N端與C端親水區之間β 6. 如請求項1至5中任一項之聚核苷酸,其中該聚核苷酸編 碼融合蛋白’該融合蛋白包括該經改質油質蛋白融合至 相關蛋白質。 7. —種遺傳構築體或表現構築體’其包含如請求項1至6中 任一項之聚核苷酸。 8. 如請求項7之遺傳構築體或表現構築體,其中該聚核苦 酸構築體可操作地連接於啟動子序列。 9. 如請求項8之遺傳構築體或表現構築體,其中該啟動子 序列能夠驅動該聚核苷酸在植物中之表現。 10. —種宿主細胞’其包含如請求項1至6中任一項之聚核普 酸。 11. 一種宿主細胞,其經遺傳改質以表現如請求項1至6中任 一項之聚核苷酸,或該聚核苷酸之表現產物。 12. —種宿主細胞,其包含如請求項7至9中任一項之構築 體。 13 ·如請求項1 〇至12中任一項之宿主細胞,其亦經遺傳改質 以表現三酸甘油酯(TAG)合成酶。 14. 如請求項π之宿主細胞,其包含包括編碼三酸甘油自旨 (TAG)合成酶之核酸序列的表現構築體。 15. 如請求項14之宿主細胞’其中該核酸可操作地連接於啟 動子序列。 16. 如請求項15之宿主細胞,其中與編碼三酸甘油酯(TAG) 合成酶之該核酸連接的該啟動子序列能夠驅動該核酸序 151910.doc 201127957 列在植物中之表現。 17.如請求項1〇至16中任一項之宿主細胞,其為選自細菌細 胞、酵母細胞、真菌細胞、昆蟲細胞、藻類細胞及植物 細胞之宿主細胞》 1 8.如請求項1 〇至16中任一項之宿主細胞,其為植物細胞。 19· 一種包含如請求項18之植物細胞的植物。 20. 如請求項19之植物,其表現由如請求項1至6中任一項之 聚核苷酸編碼的經改質油質蛋白。 21. 如请求項19之植物,其在該植物之營養組織中表現該經 改質油質蛋白。 22. 如凊求項19之植物’其在該植物之種子中表現該經改質 油質蛋白。 23. 如請求項20之植物’其在該植物之花粉中表現該經改質 油質蛋白。 24. 如請求項20至23中任一項之植物,其亦經遺傳改質以表 現三酸甘油酯(TAG)合成酶。 25. 如請求項24之植物’其中在與該經改質油質蛋白相同之 組織中表現該三酸甘油酯(TAG)合成酶。 26. 如請求項19至25中任一項之植物’其與適合之對照植物 相比,表現約0.5至約4.0倍之總脂質。 27. —種由如請求項1至6中任一項之聚核苷酸編碼的經改質 油質蛋白。 28. —種包括至少一個人工引入之半胱胺酸的經改 胃 >由質蛋 白0 151910.doc 201127957 29. 如請求項28之經改質油質蛋白,豆包括至少 ^ 八匕孩主^兩個半胱胺 酸,其中至少一者經人工引入。 30. 如請求項29之經改質油質蛋白,其包括: i) 至少兩個人工引入之半胱胺酸, ii) 至少三個人工引入之半胱胺酸, iii) 至少四個人工引入之半耽胺酸, iv) 至少五個人工引入之半胱胺酸, v) 至少六個人工引入之半胱胺酸, vi) 至少七個人工引入之半胱胺酸, vii) 至少八個人工引入之半胱胺酸, viii) 至少九個人工引入之半胱胺酸, ix) 至少十個人工引入之半胱胺酸, X)至少十一個人工引入之半胱胺酸, xi)至少十二個人工引入之半胱胺酸, XII)至少十三個人工弓丨入之半胱胺酸,或 xiii)至少十四個人工引入之半胱胺酸。 3 1 ·如請求項29或30之經改質油質蛋白,其包括至少一個在 N端親水區中之半胱胺酸及至少一個在〇端親水區中之半 胱胺酸。 32. 如请求項31之經改質油質蛋白,其中該等半胱胺酸實質 上均勻地分佈於該油質蛋白之N端與c端親水區之間。 33. —種融合蛋白,其包含如請求項27至32中任一項之經改 質油質蛋白及相關蛋白質。 34. —種油體,其包含如請求項27至32中任一項之經改質油 151910.doc 201127957 質蛋白。 種油體,其包含至少兩個如請求項27至32中任一項之 經改質油質蛋白。 =明求項3 5之油體,其中至少兩個該等經改質油質蛋白 經由在該等經改質油質蛋白中的半胱胺酸.殘基之間的至 少一個二硫橋彼此交聯。 37.如請求項35之油體,其中該等經改質油質蛋白不交聯。 _ 38.如請求項34至36中任一項之油體,其另外包含包括油質 蛋白融合至相關蛋白質之融合蛋白。 如咕求項38之油體,其中該融合蛋白中之該油質蛋白不 包括人工引入之半胱胺酸。 4〇·如請求項38之油體,其中該融合蛋白中之該油質蛋白包 括在其/由質蛋白部分中的人工引入之半耽胺酸。 Μ.如請求項4〇之油體,其包含至少兩個融合蛋白,該等融 合蛋白各自包括人工引入之半胱胺酸。 • 42.如請求項41之油體,其中至少兩個該等融合蛋白經由在 該等融合蛋白之經改質油質蛋白部分中的半胱胺酸殘基 之間的二硫橋彼此交聯。 43.種礼液,其包含如請求項27至32中任一項之經改質油 質蛋白。 44. 一種乳液,其 45· —種組合物, 油質蛋白。 46. —種組合物 包含如請求項34至42中任一項之油體。 其包含如請求項27至32中任一項之經改質 其包含如請求項34至42中任一項之油體。 151910.doc 201127957 〆 47·如請求項46之組合物’其包含該油體及適合之載齊卜 程度 如月求項47之組合物’其中該載劑經緩衝以具有適當氧 化還原環境,由此達到該等經改質油質蛋白之所要交聯 調配以供施用 49.如請求項45至48中任—項之組合物,其經 於皮膚。 34至42令任一項之 34至42中任一項之 50. -種植物或其部分,其包含如請求項 油體。 51. -種植物營養組織’其包含如請求項 油體。 52. —種植物種子,苴自合主 八匕3 « δ月求項34至42中任一項之油 體。 油 53. -種動物铜料,其包含如請求項Μ·中任一項之 體。 54. -種動物倒料,其包含如請求項19至26及5〇至52中任 項之植物或其部分或組織。 種產生油體之方法,該方法包含組合以下之步驟: 項之經改質油質蛋 a) 至少兩個如請求項27至32中任一 白、二酸甘油醋及 b) 磷脂。 56. 如請求項55之方法,其再包括藉由控制所產生油體之氧 化還原環境來調節該油體中經改質油質蛋白之交聯程度 的額外步驟。 57. 如月求項55或56之方法’其中至少一些該等經改質油質 151910.doc 201127957 蛋白為融合蛋白之一部分,兮哲 /、干該等融合蛋白包含經改 質油質蛋白及相關蛋白質。 58. 如請求項55至57中任一項之方法 甘Λ + a a 々决,其中在宿主細胞内組 合a)、b)及c)之組份。 59. 如請求項58之方法,其中該等經改質油質蛋白表現於該 宿主細胞中。 60. 如請求項58或59之方法,其中宿主細胞經遺傳改質以表 ^ 現該等經改質油質蛋白。 61·如請求項58至60中任一項之方法,其中該宿主細胞亦經 遺傳改質以表現三酸甘油酯(TAG)合成酶。 62. 如請求項58至61中任一項之方法,其中該宿主細胞形成 有機體之一部分。 63. 如請求項62之方法,其中該有機體為植物。 64. 如請求項62之方法,其中該植物積聚之脂質比適合之對 照植物多約50%至約400%。 • 65.如請求項58至64中任一項之方法,其包括自該細胞或有 機體純化該等油體之額外步驟。 66. 如請求項58至65申任一項之方法,其包含藉由控制經純 化油體之氧化還原環境來調節該等活體内產生之經純化 油體中經改質油質蛋白之交聯程度的額外步驟。 67. 如請求項55至57中任一項之方法,其中於活體外組合 a)、b)及c)之組份。 68. 如請求項67之方法,其包含藉由控制組合a)、…及^之 組份的氧化還原環境來調節交聯程度之額外步驟。 151910.doc 201127957 69_如請求項68之方法,其中在該油體形成之後藉由控制容 納該油體之氧化還原環境來調節交聯程度。 70. —種藉由如請求項65至69中任一項之方法產生的油體。 71. 種產生油之方法,該方法包含在有助於產生油之條件 下培養如請求項10至18中任一項之宿主細胞或如請求項 19至26中任一項之植物。 72. 種產生比適合之對照植物積聚更多油之植物的方法, 該方法包含提供經過如請求項1至6中任一項之聚核普酸 轉型的植物’該聚核苷酸表現由該聚核苷酸編碼之經改 質油質蛋白。 73. 如4求項72之方法,其中該植物亦經過編碼TAG合成酶 之聚核苷酸轉型,以表現該TAG合成酶且由此合成 TAG。 74. 如請求項73之方法,其中藉由經過如請求項中任一 項之聚核苷酸及編碼該TAG合成酶之聚核苷酸轉型單個 植物或植物細胞來產生該植物。 75. 如請求項72之方法,其中該植物係藉由使經過如請求項 1至6中任一項之聚核苷酸轉型的第一植物與經過編碼該 TAG合成酶之聚核苷酸轉型的第二植物雜交而產生,以 產生經過如請求項丨至6中任一項之聚核苷酸及編碼該 TAG合成酶之聚核苷酸轉型之植物。 76. 如請求項72至75中任一項之方法,其中該植物積聚之脂 質比適合之對照植物多約5〇%至約4〇〇%。 77. 如請求項71至76中任一項之方法其中該油為tag。 151910.doc 201127957 78. 如凊求項71至77中任一項之方法 峭 凌,其中在該植物之營養 組織中產生油。 79. 如請求項71至78中任—項之方法,纟中該植物經加工為 動物飼料。 其中該植物經加工為 80·如請求項71至78中任一項之方法 生物燃料原料》 81.一種在宿主細胞_產生油體之方法,該方法包含:. a)將至少一個如請求項丨至6中任一項之聚核苷酸引入 宿主細胞中;及 b)培養該宿主細胞以表現該經改質油質蛋白。 82. —種在宿主細胞中產生油體之方法,該方法包含: a) 將至少一個如請求項1至6中任一項之聚核苷酸及編 碼TAG合成酶之核酸分子引入宿主細胞中;及 b) 培養該宿主細胞以表現該經改質油質蛋白及該tag 合成酶。 83·如請求項71、77、8,1或82之方法,其中該宿主細胞經加 工為油部份。 84.如睛求項83中任一項之方法,其中該油經加工為燃料、 油化學品或營養或化妝油、多不飽和脂肪酸(PUFA)或其 151910.doc
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US25668909P | 2009-10-30 | 2009-10-30 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| TW201127957A true TW201127957A (en) | 2011-08-16 |
Family
ID=43922307
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW099137420A TW201127957A (en) | 2009-10-30 | 2010-10-29 | Modified oil encapsulating proteins and uses thereof |
Country Status (16)
| Country | Link |
|---|---|
| EP (1) | EP2494051B1 (zh) |
| JP (1) | JP5934101B2 (zh) |
| CN (1) | CN102741411B (zh) |
| AR (2) | AR078858A1 (zh) |
| AU (1) | AU2010313865B2 (zh) |
| BR (2) | BR112012011464A2 (zh) |
| CA (1) | CA2778150C (zh) |
| CL (1) | CL2012001068A1 (zh) |
| ES (1) | ES2574082T3 (zh) |
| MX (1) | MX2012004677A (zh) |
| NZ (1) | NZ599429A (zh) |
| PH (1) | PH12012500816A1 (zh) |
| TW (1) | TW201127957A (zh) |
| UY (1) | UY32994A (zh) |
| WO (1) | WO2011053169A1 (zh) |
| ZA (1) | ZA201203085B (zh) |
Families Citing this family (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US8987551B2 (en) | 2009-10-30 | 2015-03-24 | Agresearch Limited | Modified oil encapsulating proteins and uses thereof |
| US9238010B2 (en) | 2011-01-13 | 2016-01-19 | The Trustees Of The University Of Pennsylvania | Vesicles and nanostructures from recombinant proteins |
| EP2714724A1 (en) | 2011-05-26 | 2014-04-09 | E. I. Du Pont de Nemours and Company | Expression of caleosin in recombinant oleaginous microorganisms to increase oil content therein |
| AU2012294956B2 (en) * | 2011-08-05 | 2017-05-18 | Agresearch Limited | Methods for increasing CO2 assimilation and oil production in photosynthetic organisms |
| JP6461604B2 (ja) * | 2011-12-27 | 2019-01-30 | コモンウェルス サイエンティフィック アンド インダストリアル リサーチ オーガナイゼーション | 脂質製造のための工程 |
| US9896694B2 (en) | 2012-10-30 | 2018-02-20 | Agresearch Limited | Acyltransferase polynucleotides, polypeptides and methods of use |
| BR112015009455A2 (pt) | 2012-10-30 | 2017-11-14 | Agresearch Ltd | polinucleotídeo isolado, uso de uma célula, célula de planta, planta, parte de planta, propágulo ou progênie, proteína dgat1 de planta modificada, seu método de produção, matéria-prima animal ou de biocombustível e método para produzir lipídeo |
| EP2914725A4 (en) | 2012-10-30 | 2016-04-20 | Agres Ltd | NOVEL POLYNUCLEOTIDES WITH ACYLTRANSFERASE ACTIVITY, POLYPEPTIDES AND METHODS OF USE |
| CN109576241A (zh) | 2012-12-21 | 2019-04-05 | 新西兰植物和食品研究院有限公司 | 基因表达的调控 |
| WO2014170853A1 (en) | 2013-04-19 | 2014-10-23 | Agresearch Limited | Methods and materials for encapsulating proteins |
| CN104558129A (zh) * | 2013-10-25 | 2015-04-29 | 丰益(上海)生物技术研发中心有限公司 | 油体蛋白、人造油体以及稳定油体结构的方法 |
| MX376551B (es) | 2014-07-07 | 2025-03-07 | Nuseed Global Innovation Ltd | Procesos para producir productos industriales de lípidos vegetales. |
| WO2017103822A1 (en) | 2015-12-16 | 2017-06-22 | The New Zealand Institute For Plant And Food Research Limited | Compositions and methods for manipulating the development of plants |
| MX2019002483A (es) | 2016-09-02 | 2019-09-09 | Commw Scient Ind Res Org | Plantas con rasgos modificados. |
| CN114502718A (zh) * | 2019-10-04 | 2022-05-13 | 科纳根公司 | α-紫罗酮和β-紫罗酮的生物合成 |
| US12275945B2 (en) | 2019-10-25 | 2025-04-15 | Agresearch Limited | Methods for improving photosynthetic organisms |
| CN112760316B (zh) * | 2021-04-07 | 2021-08-24 | 中国科学院天津工业生物技术研究所 | 人工油体固定化多酶生产塔格糖的方法 |
| CA3250554A1 (en) * | 2022-05-06 | 2023-11-09 | ZeaKal, Inc. | METHODS AND COMPOSITIONS FOR MODIFYING A SEED COMPOSITION |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| FR2810888B1 (fr) * | 2000-06-29 | 2004-07-30 | Merial Sas | Vaccin contre la fievre aphteuse |
| US7205278B2 (en) * | 2001-06-14 | 2007-04-17 | The Scripps Research Institute | Stabilized proteins with engineered disulfide bonds |
| FI20030315A0 (fi) * | 2003-02-28 | 2003-02-28 | Joseph Atabekov | Menetelmiä ja konstruktioita valikoitujen aminohappojen pitoisuuksien lisäämiseksi siemenissä |
| NZ567603A (en) * | 2005-10-19 | 2012-03-30 | Agriculture Victoria Serv Pty | Constructs including one or more nucleic acids encoding between three and twenty oleosin repeat units |
| NZ554114A (en) * | 2007-04-23 | 2010-01-29 | Agres Ltd | Plants with an increased ratio of oleosin to TAG synthesising enzymes |
| EP2234474B1 (en) * | 2007-12-21 | 2016-10-26 | National Research Council of Canada | Diacylglycerol acyltransferase 2 genes and proteins encoded thereby from algae |
| JP5299886B2 (ja) * | 2008-03-04 | 2013-09-25 | トヨタ自動車株式会社 | 植物の油脂を増産させる遺伝子及びその利用方法 |
-
2010
- 2010-10-29 CA CA2778150A patent/CA2778150C/en active Active
- 2010-10-29 BR BR112012011464A patent/BR112012011464A2/pt not_active Application Discontinuation
- 2010-10-29 ES ES10827209.7T patent/ES2574082T3/es active Active
- 2010-10-29 TW TW099137420A patent/TW201127957A/zh unknown
- 2010-10-29 EP EP10827209.7A patent/EP2494051B1/en active Active
- 2010-10-29 PH PH1/2012/500816A patent/PH12012500816A1/en unknown
- 2010-10-29 BR BR122019021594-4A patent/BR122019021594B1/pt active IP Right Grant
- 2010-10-29 AU AU2010313865A patent/AU2010313865B2/en active Active
- 2010-10-29 WO PCT/NZ2010/000218 patent/WO2011053169A1/en not_active Ceased
- 2010-10-29 NZ NZ599429A patent/NZ599429A/en unknown
- 2010-10-29 MX MX2012004677A patent/MX2012004677A/es active IP Right Grant
- 2010-10-29 CN CN201080058155.0A patent/CN102741411B/zh active Active
- 2010-10-29 JP JP2012536739A patent/JP5934101B2/ja active Active
- 2010-11-01 AR ARP100104029A patent/AR078858A1/es active IP Right Grant
- 2010-11-01 UY UY0001032994A patent/UY32994A/es not_active Application Discontinuation
-
2012
- 2012-04-26 ZA ZA2012/03085A patent/ZA201203085B/en unknown
- 2012-04-26 CL CL2012001068A patent/CL2012001068A1/es unknown
-
2021
- 2021-02-10 AR ARP210100342A patent/AR121305A2/es unknown
Also Published As
| Publication number | Publication date |
|---|---|
| NZ599429A (en) | 2014-06-27 |
| BR112012011464A2 (pt) | 2015-09-15 |
| PH12012500816A1 (en) | 2017-07-26 |
| JP2013509178A (ja) | 2013-03-14 |
| CA2778150A1 (en) | 2011-05-05 |
| EP2494051B1 (en) | 2016-03-09 |
| AU2010313865B2 (en) | 2016-05-05 |
| CL2012001068A1 (es) | 2014-01-31 |
| ZA201203085B (en) | 2013-09-25 |
| EP2494051A1 (en) | 2012-09-05 |
| MX2012004677A (es) | 2012-07-25 |
| BR122019021594B1 (pt) | 2021-10-05 |
| WO2011053169A1 (en) | 2011-05-05 |
| EP2494051A4 (en) | 2013-04-17 |
| CN102741411A (zh) | 2012-10-17 |
| ES2574082T3 (es) | 2016-06-14 |
| AR078858A1 (es) | 2011-12-07 |
| JP5934101B2 (ja) | 2016-06-15 |
| CN102741411B (zh) | 2015-11-25 |
| AR121305A2 (es) | 2022-05-11 |
| UY32994A (es) | 2011-05-31 |
| CA2778150C (en) | 2022-07-26 |
| AU2010313865A1 (en) | 2012-05-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TW201127957A (en) | Modified oil encapsulating proteins and uses thereof | |
| KR101447300B1 (ko) | 안트라닐레이트 신타제의 엽록체를 표적으로 하는 발현에 의한 고-트립토판 옥수수의 생산 | |
| CN101939434B (zh) | 用于在大豆中提高种子贮藏油脂的生成和改变脂肪酸谱的来自解脂耶氏酵母的dgat基因 | |
| CA2683497C (en) | .delta.8 desaturases and their use in making polyunsaturated fatty acids | |
| CN101365788B (zh) | Δ-9延伸酶及其在制备多不饱和脂肪酸中的用途 | |
| CA2478294C (en) | Gntiii (udp-n-acetylglucosamine:beta-d mannoside beta (1,4)-n-acetylglucosaminyltransferase iii) expression in plants | |
| AU2015344993C9 (en) | Materials and methods for PUFA production, and PUFA-containing compositions | |
| DK2140006T3 (en) | DELTA-5 desaturases AND USE THEREOF FOR THE PRODUCTION OF polyunsaturated fatty acids | |
| KR20220012327A (ko) | 피토칸나비노이드 및 피토칸나비노이드 전구체의 생산을 위한 방법 및 세포 | |
| CN101815432A (zh) | 涉及编码核苷二磷酸激酶(ndk)多肽及其同源物的基因的用于修改植物根构造的方法 | |
| CN101646766B (zh) | △17去饱和酶及其用于制备多不饱和脂肪酸的用途 | |
| CN109563505A (zh) | 用于真核细胞的组装系统 | |
| CN116194140A (zh) | 冠状病毒疾病(covid-19)疫苗 | |
| KR20130132405A (ko) | 형질전환 빈도를 증가시키기 위해 변형된 아그로박테리움 균주 | |
| KR20140092759A (ko) | 숙주 세포 및 아이소부탄올의 제조 방법 | |
| KR20070085649A (ko) | 고농도의 에이코사펜타엔산을 생성하는 야로위아리폴리티카 균주 | |
| CN101883843A (zh) | 破坏过氧化物酶体生物合成因子蛋白(pex)以改变含油真核生物中多不饱和脂肪酸和总脂质含量 | |
| KR20140000711A (ko) | 수크로스 이용에 있어서의 야로위아 리포라이티카에서의 사카로마이세스 세레비지애 suc2 유전자의 용도 | |
| CN101918560B (zh) | 在氮限制条件下具有改变的农学特性的植物以及涉及编码lnt2多肽及其同源物的基因的相关构建体和方法 | |
| CN114959919B (zh) | 一种构建酿酒酵母人工小启动子文库的方法及应用 | |
| CN101868545B (zh) | 具有改变的根构造的植物、涉及编码富含亮氨酸重复序列激酶(llrk)多肽及其同源物的基因的相关构建体和方法 | |
| CN101848931A (zh) | 具有改变的根构造的植物、涉及编码exostosin家族多肽及其同源物的基因的相关的构建体和方法 | |
| CN116547263A (zh) | 用修饰酶产生取代大麻素和前体的方法和细胞 | |
| AU2018250483B2 (en) | Processes for producing lipids | |
| CN116457465A (zh) | 用于基因组修饰的方法和组合物 |