具体实施方案
以下叙述本发明的实施例。应该说明的是,本发明的实施例对于本发明只有说明作用,而没有限制作用。
需特别指出的是,在本发明的实施例中,尽管详细描述了沉默基因的表达及其与不同基因的组合,但是这不意味着本发明的基因、基因组合只限于对Bt菌株进行转化和用于生产对上述害虫有抗性的Bt工程菌。因此,使用本发明所描述的新基因cry1Ie,使用本领域的普通技术人员所掌握的任何一种方法突变(含诱变)所获得的、对任何害虫有抗性的基因,使用cry1Ie与cry1Ab基因组合、cry1Ie与cry1Ba基因组合以提高对害虫的毒力和抗性、扩大杀虫范围,使用本发明构建的广宿主载体pSXY422b,以本领域的普通技术人员所掌握的任何一种方法导入任何微生物、植物或其组织、细胞中,以及由此所获得具有任何抗虫活性的微生物、植物,以及该类植物后代的种子、杂交和转育后代,均包括在本发明所要求的权利范围之内。
实施例1、cry1Ie1基因的鉴定与定位:
利用cry基因的CAPS鉴定体系,本发明鉴定了菌株Btc007的cry基因型。发现含有cry1Db、cry1Gb、cry1Fb、cry2Ab和一种新型cry1I基因。图1为PCR产物及酶切分析电泳图谱。利用Southern杂交,确定了这一新的cry1I基因在菌株Btc007质粒DNA上的位置,图2为Southern杂交结果。发现该基因定位于2.5kb的HindIII和4.8kb的ClaI酶切片段上。
实施例2、cry1Ie1基因的克隆与亚克隆:
用大肠杆菌-荧光假单胞菌穿梭载体pUCP19,本发明克隆了2.5kb HindIII酶切片段,重组质粒命名为pBTC191。图3为pBTC191的酶切分析及PCR鉴定电泳结果,证明克隆了该片段。通过酶切分析选择EcoRI酶切pBTC191,产生三个片段:1.0kb、1.1kb、5.0kb(0.5kb+pUCP19)。其中1.0kb、1.1kb两个片段用pBluescript SK(+)亚克隆命名为pSI-2、pSI-1,0.5kb+pUCP19自连命名为pSI-3。图4为亚克隆流程图。图5为亚克隆酶切鉴定结果。将上述片段分别进行测序,发现缺少编码区5′末端的序列。为了克隆全长的cry1I基因,用载体pBluescript SK(+)克隆了Btc007质粒DNA 4.8kb的ClaI酶切片段,命名为pXYI46,图6为pXYI46的质粒图谱和酶切分析电泳图谱。
实施例3、cry1Ie1基因的序列分析:
本发明测定重组质粒pXYI46所含cry1I基因5’端序列,与pBTC191所含cry1I基因序列用Clone manager软件(免费软件,用普通DNA序列分析软件均可完成此工作),根据重叠序列,进行拼接,得到完整的cry1I基因核苷酸序列,推测出该基因编码蛋白质的氨基酸序列,见SEQ ID NO 1。本发明进一步分析了该cry1I基因与已知四种cry1I基因的同源性,分别为cry1Ia1 93.1%、cry1Ib1 94.3%、cry1Ic1 92.6%和cry1Id1 89.2%。通过分析该基因编码的蛋白质,得知该基因的编码区是308~2476bp,由719个氨基酸组成,氨基酸组成分析见表1和图7,结果表明,丝氨酸(Ser)、苏氨酸(Thr)和亮氨酸(Leu)含量最高。该蛋白质的等电点为pH5.91。由Cry1Ie蛋白的滴定曲线(图8),可知该蛋白质是弱酸性蛋白质,分子量为81.0KDa。通过同源比较,确定了Cry蛋白共有5个保守区(SEQ ID NO 1),其中,保守区1在186-202、保守区2在253-298、保守区3在491-536、保守区4在557-567、保守区5在634-643氨基酸之间。在编码区前未发现RBS序列,这也进一步证明cry1Ie1基因在Btc007菌株中是沉默的。
表1 Cry1Ie1氨基酸组成分析
|
氨基酸 单字母 个数 Mol% |
氨基酸 单字母 个数 Mol% |
|
Ala A 46 6.40Cys C 1 0.14Asp D 35 4.87Glu E 42 5.84Phe F 37 5.15Gly G 42 5.84His H 18 2.50Ile I 44 6.12Lys K 31 4.31Leu L 66 9.18 |
Met M 9 1.25Asn N 46 6.40Pro P 28 3.89Gln Q 27 3.76Arg R 35 4.87Ser S 65 9.04Thr T 58 8.07Val V 46 6.40Trp W 12 1.67Tyr Y 31 4.31 |
通过氨基酸序列同源性分析,可知该蛋白质与其它四种Cry1I蛋白的同源性均低于95%(表2)。
表2 Cry1I蛋白质序列同源性(Identity)比较结果
Cry Cry1Ie1 Cry1Ia1 Cry1Ib1 Cry1Ic1 Cry1Id1
Cry1Ie1 1.000 0.934 0.949 0.916 0.877
Cry1Ia1 --- 1.000 0.927 0.899 0.897
Cry1Ib1 --- --- 1.000 0.949 0.872
Cry1Ic1 --- --- --- 1.000 0.834
Cry1Id1 --- --- --- --- 1.000
本发明比较Cry1I模式蛋白质氨基酸序列,结果见SEQ ID NO 2。用DNASIS等软件分析cry1Ie1基因序列,发现在同一开放阅读框下,有8个不同的起始密码子,共用一个终止密码子,编码8种蛋白,其起始位点、终止位点及编码蛋白质分子量见表3。
表3 cry1Ie1基因同一开放阅读框下编码的蛋白质
|
序 起始 结束 氨基酸 分子量号 点 点 |
序 起始 结束 氨基酸 分子量号 点 点 |
|
1 308 2465 719 81020.682 440 2465 675 75959.253 620 2465 615 69552.244 1097 2465 456 51430.79 |
5 1106 2465 453 51085.356 1376 2465 363 40913.487 1382 2465 361 40668.198 2078 2465 129 15122.03 |
实施例4、PCR扩增cry1Ie1全长基因:
根据cry1Ie1基因的序列,本发明设计了扩增全长cry1Ie1基因的一对引物,并在5’-端引物加进BamHI切点,3’-端引物加进SalI切点,序列如下:
BamHI
S51Ie:5′-CGC
GGATCCGATGAAACTAAAGAATCCAG-3′
SalI
S31Ie:5′-ACGC
GTCGACGGCATGTTACGCTCAATATGG-3′
以pXYI46(含有cry1Ie1全长基因)为模板,用S51Ie/S31Ie PCR扩增得到cry1Ie1全长基因片段(2.1kb)。
实施例5、cry1Ie1基因在大肠杆菌中的表达:
把在实施例4中得到的产物克隆于载体pET-21b中,获得重组质粒命名为pETB-1IE。图9为pETB-1IE的酶切及PCR检测结果,图10为pETB-1IE构建流程图。测序结果表明pETB-1IE中的cry1Ie基因与cry1Ie1完全相同。
将cry1Ie1基因的表达载体pETB-1IE导入E.coli BL21(DE3)中,获得高效表达。图11为cry1Ie1基因表达产物的SDS-PAGE电泳结果。cry1Ie1基因表达产物为多条,分子量分别为83、81、60、57kDa,原因可能是不同的ATG起始(表3)。诱导、收集菌体超声破碎完全后,离心,上清液和沉淀同时电泳,发现cry1Ie1基因表达产物在沉淀中,说明表达产物形成了包涵体。上清液与对照BL21(pET-21b)条带相似。Cry1Ie1的出发菌株Btc007,没有发现表达81kDa的蛋白带。说明cry1Ie1基因在Btc007中是沉默的。
实施例6、cry1Ie基因杀虫活性研究:
通过SDS-PAGE分析,确定cry1Ie1基因表达产物的含量,完成了对小菜蛾2龄幼虫和玉米螟初孵幼虫的杀虫活性测定。小菜蛾采用甘蓝叶片秤重后浸叶法,96小时调查结果;玉米螟采用人工饲料饲喂法,7天调查结果。表4、表5为Cry1Ie1蛋白对亚洲玉米螟的生测结果。Cry1Ie1对亚洲玉米螟具有高毒力,LC50为16.21ppm,接近对玉米螟毒力最高的Cry1Ab蛋白。表6为Cry1Ie1毒蛋白对小菜蛾的杀虫活性测定结果,表明对小菜蛾具有毒力,LC50分别为197.88ng/mL(见表7)。Cry1Ie1活性较高。
表4 Cry1Ie1对亚洲玉米螟(公主岭种群)杀虫活性
处理 代表 幼虫个数 幼虫体重 死亡率 校正死亡率
感染 存活 (mg) % 平均
CK 1 48 46 400.4 4.17 4.86
CK 2 48 48 416.1 0
CK 3 48 43 415.9 10.42
0.5ppma 1 48 44 294.4 8.33 3.65
0.5ppm 2 48 45 327.6 6.25 1.46
0.5ppm 3 48 43 274.9 10.42 10.42 5.175
5pm 1 48 37 80.5 22.92 18.98
5ppm 2 48 34 56.8 29.17 25.55
5ppm 3 48 42 62.2 12.5 8.03 17.52
50ppm 1 48 13 1.0 72.92 71.53
50ppm 2 48 15 1.6 68.75 67.15
50ppm 3 48 13 1.4 72.92 71.53 70.07
100ppm 1 48 3 0.3 93.75 93.43
100ppm 2 48 5 0.5 89.58 89.05
100ppm 3 48 6 0.8 87.5 86.86 89.78
500ppm 1 48 0 100 100
500ppm 2 48 0 100 100
500ppm 3 48 0 100 100 100
a:1ppm:10-6mg蛋白/mg干人工饲料
表5 Cry蛋白对亚洲玉米螟(Ostrinia furnacalis)的毒力测定
毒素 LC50(低-高)ppma LC90(低-高)ppm
Cry1Ab 0.39(0.28-0.54)
Cry1Ie1 16.21(5.35-39.58) 134.39(2.43-998.70)
a:1ppm:10-6mg蛋白/mg人工饲料干重
表6 Cry1Ie1对小菜蛾(Plutella xylostella)杀虫活性(48hr)
样品 浓度(ng/mL) Repeat 总计 死亡 死亡率(%)
1 5.4×103 3 45 44 97.8
2 1.8×103 3 45 42 93.3
3 900 3 45 39 86.7
4 300 3 45 26 57.8
5 100 3 45 15 33.3
CK 无菌水 3 45 45 0
表7 Cry1I蛋白对小菜蛾杀虫活性
毒素 LC50(90%confidence)ng/mL LC90(90%confidence)ng/mL
Cry1Ie1 197.88(128.94-274.60) 1376.72(939.28-2426.94)
实施例7、Bt-E.coli穿梭强启动子及表达序列的扩增:
利用重叠引物PCR法,本发明把pET-21b载体的表达区启动子替换成cry3Aa7基因的启动子。设计了两对引物用于PCR扩增。以含cry3Aa7基因的质粒pBY33为模板,用SPE1/SPE2引物扩增得到cry3Aa7基因启动子片段,大小为560bp(PCR条件同上);以pET-21b载体为模板,用SPE3/SPE4引物扩增得到无启动子的pET-21载体的表达区片段(PCR条件同上),大小为226bp,SPE2、SPE3为一对重叠引物,以上述两个片段为模板,用SPE1/SPE4引物扩增,94℃ 1min,52℃ 1min,72℃ 3min,30个循环,得到带有cry3Aa7基因启动子、含pET-21载体的表达区序列的片段,大小为786bp,命名为3Aa-21b。SPE1、SPE4 5′端均引入SmaI切点,各引物序列见SEQ ID NO 3。图12为PCR扩增产物检测结果。
实施例8、Bt-E.coli穿梭的构建:
把在实施例7中扩增得到的786bp 3Aa-21b片段用SmaI酶切,导入pHT315载体EcoRI/HindIII双酶切补平位点,得到重组质粒命名为pSXY422b。图13为pSXY422b载体的构建流程图,图14为pSXY422b的酶切分析及PCR检测。测定了pSXY422b的表达区序列,SEQ ID NO 4为表达区的序列,标明了cry3Aa7基因的启动子,STAB-SD序列、pET-21b中的T7 Tag、His Tag、转录终止子和酶切位点。
实施例9、cry1Ie1基因的Bt表达载体构建:
把pETB-1IE中的cry11e1全长基因插入pSXY422b中的BamHI/SalI位点,得到重组质粒pSHY-1IE,图15为pSHY-1IE质粒酶切分析及PCR检测电泳图谱。图16为pSHY-1IE质粒的物理图谱。
实施例10、cry1Ie1基因在Bt菌株中的表达:
把pSHY-1IE分别转化无晶体突变株BE20和Bt自然菌株Bt-17(该菌株来自于中国农业科学院植物保护研究所生物技术实验室,可向公众提供),得到工程菌BiotIE01和BiotIE02,图17为它们的PCR鉴定结果,证明表达载体转化成功。获得工程菌BiotIE01和BiotIE02在1/2LB平板上30℃培养30个小时后,在光学显微镜下观察晶体。图18为光学显微镜下观察晶体的结果。BiotlIE01观察不到典型的晶体形状,为不规则形状的包涵体。说明Cry1Ie1蛋白本身不能在无晶体突变株BE20中形成典型的晶体。BiotIE02观察到的晶体也不是典型的双锥体形。比较了BiotIE01、BiotIE02、BE20、Bt-17菌株的生长曲线,发现表达载体pSHY-1IE导入无晶体突变株BE20和野生菌株Bt-17中,对它们的生长速率无影响。图19为它们的生长曲线。
在LB培养基30℃培养BE20、BiotIE01,30小时后,分别收集沉淀与上清,SDS-PAGE电泳检测(图20),发现cry1Ie1基因在BE20中的表达产物在上清液,分子量大约为83kDa。
30℃培养(LB)Bt-17、BiotIE02,分别于6、10、14、18、22、26、30、34小时取样,离心收集沉淀,SDS-PAGE分析(如图21),结果表明,cry1Ie1基因表达了80kDa左右的条带。
用工程菌BiotIE01和BiotIE02培养液检测对小菜蛾的生物活性,结果见表8,说明工程菌株对小菜蛾表现出明显的活性,从而进一步验证了cry1Ie1基因在BE20获得表达。
表8 Bt菌株对小菜蛾幼虫的活性测定
样品 重复 总虫数 死虫数 死亡率% 校正死亡率%
BiotIE01/cry1IE1 3 36 36 100 100
BiotIE02/cry1Ie1 3 36 36 100 100
BE20/cry- 3 36 7 19.4 -
附:本发明所涉及的DNA序列和蛋白质序列
SEQ ID NO 1.1(cry1IE1基因的核苷酸序列):
1 CGATGAAAATATCTCTGCTTTTTCTTTCTTTATTTGGTATATGCTTTACTTGTAATCGAA 60
61 AATAAAGCACTAATAAGAGTATTTATAGGTGTTTGAAGTCATTTCAGTTCATTTTTAAAG 120
121 GAGGTTTAAAAGTGTTAGAAAGTTATTAAGGAATAATACTTACAGTAAATCCTACCTATA 180
181 TTTTACAATTAATTATGATATTTATGCATAAATTAAAAATGCTTTATTTGACATTACAGC 240
241 TAAGTATAATTTTTTATGAATAAAATTTTATTTGAAAATTAAATAATATTATATGTGAGG 300
301 GATTAAT
ATGAAACTAAAGAATCCAGATAAGCATCAAAGCTTGTCTAGCAATGCGAAAGT 360
361 AGATAAAATCGCTACGGATTCACTAAAAAATGAAACAGATATAGAATTGAAAAATATTAA 420
421 TCATGAGGATTTCCTAAGA
ATGTCTGAGCATGAGAGTATTGATCCGTTTGTTAGTGCATC 480
481 AACAATTCAAACGGGTATTGGAATTGCTGGTAAGATTCTTGGTACTCTAGGTGTTCCTTT 540
541 TGCTGGACAAATAGCTAGCCTCTATAGTTTTATCTTAGGCGAGCTTTGGCCTAAAGGGAA 600
601 AAGTCAATGGGAAATCTTT
ATGGAACATGTAGAAGAGCTTATTGACCAAAAAATATCAAC 660
661 TTACGCAAGAAACATAGCACTTGCAGATTTAAAAGGCTTAGGAGATGCTTTGGCTGTCTA 720
721 CCATGAATCGCTTGAAAGTTGGATTAAAAATCGCAACAACGCAAGGGCTACAAGTGTTGT 780
781 CAAGAGCCAATATATTGCTTTAGAACTATTGTTTGTTCAAAAGCTGCCTTCTTTTGCAGT 840
841 ATCAGGTGAGGAAGTACCATTATTGCCAATATATGCACAAGCTGCAAATTTACACTTATT 900
901 ATTACTAAGAGATGCTTCTGTTTTTGGAAAAGAGTGGGGATTATCTAATTCGCAAATTTC 960
961 TACATTTTATAATCGTCAAGTCGAAAGAACGAGTGACTATTCCGACCATTGTGTGAAATG 1020
1021 GTATAGTACAGGTCTAAATAACTTGAGAGGTACAAATGCCGAAAGCTGGGTCCGTTATAA 1080
1081 TCAATTTCGTAAAGAT
ATGACATTA
ATGGTACTAGATTTAATCGCATTATTCCCAAGCTA 1140
1141 TGATACACTTGTATATCCAATTAAAACCACTTCTCAACTTACAAGAGAAGTATATACAGA 1200
1201 CGCAATTGGGACAGTACATCCAAATGCAAGTTTTGCAAGTACGACCTGGTATAATAATAA 1260
1261 TGCACCTTCGTTCTCTGCCATAGAGTCTGCTGTTGTTCGAAACCCGCATCTACTCGATTT 1320
1321 TTTAGAACAAGTTACAATTTACAGCTTATTAAGTAGGTGGAGTAACACTCAGTAT
ATGAA 1380
1381 T
ATGTGGGGAGGACATAGACTGGAATTCCGAACAATAGGTGGAGTGTTAAATACCTCAAC 1440
1441 ACAAGGGTCTACTAATACTTCTATTAATCCTGTAACATTACCGTTCACGTCTCGAGACGT 1500
1501 CTATAGGACTGAATCATTGGCAGGGCTGAATCTATTTTTAACTCAACCTGTTAATGGAGT 1560
1561 ACCTAGGGTTGATTTTCATTGGAAATTCGCCACACTTCCGATTGCATCTGATAATTTTTA 1620
1621 TTATCTAGGGTATGCTGGAGTTGGTACGCAATTACAAGATTCAGAAAATGAATTACCACC 1680
1681 TGAAACAACAGGACAGCCAAATTATGAATCATATAGTCATAGATTATCCCATATAGGACT 1740
1741 CATTTCAGCATCCCACGTGAAAGCATTGGTATATTCTTGGACACATCGTAGTGCAGATCG 1800
1801 TACAAATACAATTGAGCCAAATAGCATTACACAAATACCATTAGTAAAAGCGTTCAATCT 1860
1861 GTCTTCAGGTGCCGCTGTAGTGAGAGGACCAGGATTTACAGGTGGGGATATCCTTCGAAG 1920
1921 AACGAATACTGGTACATTTGGGGATATACGAGTAAATATTAATCCACCATTTGCACAAAG 1980
1981 ATATCGCGTGAGGATTCGCTATGCTTCTACTACAGATTTACAATTCCATACGTCAATTAA 2040
2041 CGGTAAAGCTATTAATCAAGGTAATTTTTCAGCAACT
ATGAATAGAGGAGAGGACTTAGA 2100
2101 CTATAAAACCTTTAGAACTGTAGGCTTTACCACTCCATTTAGCTTTTCAGATGTACAAAG 2160
2161 TACATTCACAATAGGTGCTTGGAACTTCTCTTCAGGTAACGAAGTTTATATAGATCGAAT 2220
2221 TGAATTTGTTCCGGTAGAAGTAACATATGAGGCAGAATATGATTTTGAAAAAGCGCAAGA 2280
2281 GAAGGTTACTGCACTGTTTACATCTACGAATCCAAGAGGATTAAAAACAGATGTAAAGGA 2340
2341 TTATCATATTGACCAGGTATCAAATTTAGTAGAGTCTCTATCAGATGAATTCTATCTTGA 2400
2401 TGAAAAGAGAGAATTATTCGAGATAGTTAAATACGCGAAGCAAATCCATATTGAGCGTAA 2460
2461 CATGTAGAATTAAAATCTACCTAAATCCAGAAAAATAAAAGGGTTAAATATACAATTCTT 2520
2521 GTACCAATATTTTGAGTGATTAGATGTAGGATGAAATTTAATTGTATGCTATTTAACAGT 2580
2581 AGAGATATTAAAAATTAATTTATCTATACATTAATAGTATAGACATACAAACATAAGAGA 2640
2641 GCATTGTCTTTTCGTAGGCTACAATGCTCTCTATTTACTATTTATTTTTCTTTTGTATCT 2700
2701 TCAAATTGACGTTGTTCTAAGCGTTCTATTGCAGCTCGTCGTTTAGTATCATCAATGTTT 2760
2761 GTATAAAGAGATGTTGTTTCCATAGAATTATGTCCCATTTGATTTGCTAATAATACTAAA 2820
2821 TCTTTATTTTCATTATAGTGATTAGTAGCATAAGTATGACGTAATTTATGAGGGCTTTTC 2880
2881 TTTTCATCAAAAGCCCTTGTGTATTTCTCTGTAAGCTT 2918
SEQ ID NO 1.2(cry1Ie1基因编码的蛋白质的氨基酸序列):
1 M K L K N P D K H Q S L S S N A K V 18
19 D K I A T D S L K N E T D I E L K N I N 38
39 H E D F L R M S E H E S I D P F V S A S 58
59 T I Q T G I G I A G K I L G T L G V P F 78
79 A G Q I A S L Y S F I L G E L W P K G K 98
99 S Q W E I F M E H V E E L I D Q K I S T 118
119 Y A R N I A L A D L K G L G D A L A V Y 138
139 H E S L E S W I K N R N N A R A T S V V 159
159 K S Q Y I A L E L L F V Q K L P S F A V 178
179 S G E E V P L
L P I Y A Q A A N L H L L 198
Block 1
199
L L R D A S V F G K E W G L S N S Q I S 218
219 T F Y N R Q V E R T S D Y S D H C V K W 238
239 Y S T G L N N L R G T N A E S
W V R Y N 258
259
Q F R K D M T L M V L D L I A L F P S Y 278
Block 2
279
D T L V Y P I K T T S Q L T R E V Y T D 298
299 A I G T V H P N A S F A S T T W Y N N N 318
319 A P S F S A I E S A V V R N P H L L D F 338
339 L E Q V T I Y S L L S R W S N T Q Y M N 358
359 M W G G H R L E F R T I G G V L N T S T 378
379 Q G S T N T S I N P V T L P F T S R D V 398
399 Y R T E S L A G L N L F L T Q P V N G V 418
419 P R V D F H W K F A T L P I A S D N F Y 438
439 Y L G Y A G V G T Q L Q D S E N E L P P 458
459 E T T G Q P N Y E S Y S H R L S H I G L 478
479 I S A S H V K A L V Y S
W T H R S A D R 498
499
T N T I E P N S I T Q I P L V K A F N L 518
Block 3
519
S S G A A V V R G P G F T G G D I L R R 538
539 T N T G T F G D I R V N I N P P F A
Q R 558
559
Y R V R I R Y A S T T D L Q F H T S I N 578
Block4
579 G K A I N Q G N F S A T M N R G E D L D 598
599 Y K T F R T V G F T T P F S F S D V Q S 618
619 T F T I G A W N F S S G N E V
Y I D R I 638
Block 5
639
E F V P V E V T Y E A E Y D F E K A Q E 658
659 K V T A L F T S T N P R G L K T D V K D 678
679 Y H I D Q V S N L V E S L S D E F Y L D 698
699 E K R E L F E I V K Y A K Q I H I E R N 718
719 M
SEQ ID NO 2 (Cry1I蛋白的氨基酸序列比较);
10 20 30 40 50 60
Cry1Ie1 MKLKNPDKHQ SLSSNAKVDK IATDSLKNET DIELKNINHE DFLRMSEHES IDPFVSASTI
Cry1Ia1 MKLKNQDKHQ SFSSNAKVDK ISTDSLKNET DIELQNINHE DCLKMSEYEN VEPFVSASTI
Cry1Ib1 MKLKNPDKHQ SLSSNAKVDK IATDSLKNET DIELKNMNNE DYLRMSEHES IDPFVSASTI
Cry1Ic1 MKLKNPDKHQ TLSSNAKVDK IATDSLKNET DIELKNMNNE DYLRMSEHES IDPFVSASTI
Cry1Id1 MKSKNQNMYR SFSSNATVDK SFTDPLEHNT NMELQNSNHE DCLKMSEYES VEPFVSVSTI
70 80 90 100 110 120
Cry1Ie1 QTGIGIAGKI LGTLGVPFAG QIASLYSFIL GELWPKGKSQ WEIFMEHVEE LIDQKISTYA
CrY1Ia1 QTGIGIAGKI LGTLGVPFAG QVASLYSFIL GELWPKGKNQ WEIFMEHVEE IINQKISTYA
Cry1Ib1 QTGIGIAGKI LGTLGVPFAG QIASLYSFIL GELWPKGKSQ WEIFMEHVEE IINQKILTYA
Cry1Ic1 QTGIGIAGKI LGTLGVPFPG QIASLYSFIL GELWPKGKSQ WEIFMEHVEA IINRKISTYA
Cry1Id1 QTGIGIAGKI LGNLGVPFAG QVASLYSFIL GELWPKGKSQ WEIFMEHVEE LINQKISTYA
130 140 150 160 170 180
Cry1Ie1 RNIALADLKG LGDALAVYHE SLESWIKNRN NARATSVVKS QYIALELLFV QKLPSFAVSG
Cry1Ia1 RNKALTDLKG LGDALAVYHD SLESWVGNRN NTRARSVVKS QYIALELMFV QKLPSFAVSG
Cry1Ib1 RNKALSDLRG LGDALAVYHE SLESWVENRN NTRARSVVKN QYIALELMFV QKLPSFAVSG
Cry1Ic1 RNKALTDLKG LGDALAVYHE SLESWVGNRN NTRARSVVKN QYIALELMFV QKLPSFAVSG
Cry1Id1 RNKALADLKG LGDALAVYHE SLESWIENRN NTRVRSVVKN QYIALELMFV QKLPSFAVSG
190 200 210 220 230 240
Cry1Ie1 EEVPLLPIYA QAANLHLLLL RDASVFGKEW GLSNSQISTF YNRQVERTSD YSDHCVKWYS
Cry1Ia1 EEVPLLPIYA QAANLHLLLL RDASIFGKEW GLSSSEISTF YNRQVERAGD YSYHCVKWYS
Cry1Ib1 EEVPLLPIYA QAANLHLLLL RDASIFGKEW GLSASEISTF YNRQVERTRD YSDHCIKWYN
Cry1Ic1 EEVPLLPIYA QAANLHLLLL RDASIFEKNG GLSASEISTF YNRQVERTRD YSYHCVKWNN
Cry1Id1 EEVPLLPIYA QAANLHLLLL RDASIFGKEW GLSESEISTF YNRQSSQTQE YSDYCSEWYN
250 260 270 280 290 300
Cry1Ie1 TGLNNLRGTN AESWVRYNQF RKDMTLMVLD LIALFPSYDT LVYPIKTTSQ LTREVYTDAI
Cry1Ia1 TGLNNLRGTN AESWVRYNQF RRDMTLMVLD LVALFPSYDT QMYPIKTTAQ LTREVYTDAI
Cry1Ib1 TGLNNLRGTN AKSWVRYNQF RKDMTLMVLD LVALFPSYDT LVYPIKTTSQ LTREVYTDAI
Cry1Ic1 TGLNNLRATN GQSWVRYNQF RKDIELMVLD LVRVFPSYDT LVYPIKTTSQ LTREVYTDAI
Cry1Id1 TGLNRLRGTN AESWVRYNQF RRDMTLMVLD LVALFPSYDT RMYPIPTSAQ LTREVYTDAI
310 320 330 340 350 360
Cry1Ie1 GTVHPNASFA STTWYNNNAP SFSAIESAVV RNPHLLDFLE QVTIYSLLSR WSNTQYMNMW
Cry1Ia1 GTVHPHPSFT STTWYNNNAP SFSAIEAAVV RNPHLLDFLE QVTIYSLLSR WSNTQYMNMW
Cry1Ib1 GTVHPNQAFA STTWYNNNAP SFSAIEAAVI RSPHLLDFLE KVTIYSLLSR WSNTQYMNMW
Cry1Ic1 GTVDPNQALR STTWYNNNAP SFSAIEAAVI RSPHLLDFLE KVTIYSLLSR WSNTQYMNMW
Cry1Id1 GTVHPNASFA STTWYNNNAP SFSTIEAAVV RNPHLLDFLE QVTIYSLLSR WSNTQYMNMW
370 380 390 400 410 420
Cry1Ie1 GGHRLEFRTI GGVLNTSTQG STNTSINPVT LPFTSRDVYR TESLAGLNLF LTQPVNGVPR
Cry1Ia1 GGHKLEFRTI GGTLNISTQG STNTSINPVT LPFTSRDVYR TESLAGLNLF LTQPVNGVPR
Cry1Ib1 GGHRLESRPI GGALNTSTQG STNTSINPVT LQFTSRDVYR TESLAGLNLF LTQPVNGVPR
Cry1Ic1 GGHRLESRPI GGALNTSTQG STNTSINPVT LQFTSRDFYR TESWAGLNLF LTQPVNGVPR
Cry1Id1 GGHKLEFRTI GGTLNTSTQG STNTSINPVT LPFTSRDVYR TESLAGLNLF LTQPVNGVPR
430 440 450 460 470 480
Cry1Ie1 VDFHWKFATL PIASDNFYYL GYAGVGTQLQ DSENELPPET TGQPNYESYS HRLSHIGLIS
Cry1Ia1 VDFHWKFVTH PIASDNFYYP GYAGIGTQLQ DSENELPPEA TGQPNYESYS HRLSHIGLIS
Cry1Ib1 VDFHWKFPTL PIASDNFYYL GYAGVGTQLQ DSENELPPET TGQPNYESYS HRLSHIGLIS
Cry1Ic1 VDFHWKFPTL PIASDNFYYL GYAGVGTQLQ DSENELPPET TGQPNYESYS HRLSHIGLIS
Cry1Id1 VDFHWKFVTH PIASDNFYYP GYAGIGTQLQ DSENELPPET TGQPNYESYS HRLSHIGLIS
490 500 510 520 530 540
Cry1Ie1 ASHVKALVYS WTHRSADRTN TIEPNSITQI PLVKAFNLSS GAAVVRGPGF TGGDILRRTN
Cry1Ia1 ASHVKALVYS WTHRSADRTN TIEPNSITQI PLVKAFNLSS GAAVVRGPGF TGGDILRRTN
Cry1Ib1 ASHVKALVYS WTHRSADRTN TIEPNSITQI PLVKAFNLSS GAAVVRGPGF TGGDILRRTN
Cry1Ic1 GSHVKALVYS WTHRSADRTN TIEPNSITQI PLVKAFNLSS GAAVVRGPGF TGGHILRRTK
Cry1Id1 ASHVKALVYS WTHRSADRTN TINSDSITQI PLVKAFNLPS GASVVRGPGF TGGDILQRTN
550 560 570 580 590 600
Cry1Ie1 TGTFGDIRVN INPPFAQRYR VRIRYASTTD LQFHTSINGK AINQGNFSAT MNRGEDLDYK
Cry1Ia1 TGTFGDIRVN INPPFAQRYR VRIRYASTTD LQFHTSINGK AINQGNFSAT MNRGEDLDYK
Cry1Ib1 TGTFGDIRVN INPPFAQRYR VRIRYASTTD LQFHTSINGK AINQGNFSAT MNRGEDLDYK
Cry1Ic1 SGTFGHIRVN INPPFAQRYR VRMSYASTTD LQFHTSINGK AINQGNFSAT MNRGEDLDYK
Cry1Id1 TGTFGDIRVN INPPFAQRYR LRIRYASTTN LEFHTSINGK AINQGNFSAT MNRGEDLDYK
610 620 630 640 650 660
Cry1Ie1 TFRTVGFTTP FSFSDVQSTF TIGAWNFSSG NEVYIDRIEF VPVEVTYEAE YDFEKAQEKV
Cry1Ia1 TFRTVGFTTP FSFLDVQSTF TIGAWNFSSG NEVYIDRIEF VPVEVTYEAE YDFEKAQEKV
Cry1Ib1 TFRTIGFTTP FSFSDVQSTF TIGAWNFSSG NEVYIDRIEF VPVEVTYEAE YDFEKAQEKV
Cry1Ic1 TFRTVGFTTP FSFSDVQSTF TIGAWNFSSG NEVYIGRIEF VPVEVTYEAE YDFEKAQEKV
Cry1Id1 AFRTVGFTTP FSFSNAQSTF TIGAWNFSLG NEVYIDRIEF VPVEVTYEAE YDLKKAQDEI
670 680 690 700 710
Cry1Ie1 TALFTSTNPR GLKTDVKDYH IDQVSNLVES LSDEFYLDEK RELFEIVKYA KQIHIERNM
Cry1Ia1 TALFTSTNPR GLKTDVKDYH IDQVSNLVES LSDEFYLDEK RELFEIVKYA KQLHIERNM
Cry1Ib1 TALFTSTNPR GLKTDVKDYH IDQVSNLVES LSDEFYLDEK RELFEIVKYA KQIHIERNM
Cry1Ic1 TALFTSTNPR GLKTDVKDYH IDQVSNLVES LSDELYLDEK RELFEIVKYA KQIHIERNM
Cry1Id1 TAMFTSTNLR RLKTNVTDCH IDQVSNLVES LSDEFYLDEK RELFEIVKYA KQLNIERNM
SEQ ID NO 3
SmaI
SPE1:5`-TCC
CCCGGGAGCTTAATTAAAGATAATATC-3`
SPE2:5`-
TTTTCTTCCTCCCTTTC-3`
Complement sequence
SPE3:5`-
GGAGGAAGAAAAATGGCTAGCATGACTGGTGGAC-3`
SmaI
SPE4: 5`-TCC
CCCGGGCAAAAAACCCCTCAAGACCCG-3`
SEQ ID NO 4 (pSXY422b表达区序列及分析)
1 GGGAGCTTAATTAAAGATAATATCTTTGAATTGTAACGCCCCTCAAAAGTAAGAACTACA 60
cry3Aa7 promoter→
61 AAAAAAGAATACGTTATATAGAAATATGTTTGAACCTTCTTCAGATTACAAATATATTCG 120
121 GACGGACTCTACCTCAAATGCTTATCTAACTATAGAATGACATACAAGCACAACCTTGAA 180
181 AATTTGAAAATATAACTACCAATGAACTTGTTCATGTGAATTATCGCTGTATTTAATTTT 240
241 CTCAATTCAATATATAATATGCCAATACATTGTTACAAGTAGAAATTAAGACACACTTGA 300
301 TAGCCTTACTATACCTAACATGATGTAGTATTAAATGAATATGTAAATATATTTATGATA 360
361 AGAAGCGACTTATTTATAATCATTACATATTTTTCTATTGGAATGATTAAGATTCCAATA 420
STAB-SD
421 GAATAGTGTATAAATTATTTATCTT
GAAAGGAGGGATGCCTAAAAACGAAGAACATTAAA 480
481 AACATATATTTGCACCGTCTAATGGATTTATGAAAAATCATTTTATCAGTTTGAAAATTA 540
T7 Tag
541 TGTATTATGATAAGAAAGGGAGGAAGAAAAATG
GCTAGCATGACTGGTGGACAGCAAATG 600
M A S M T G G Q Q M
BamHI
EcoRI
SacI
SalI
HindIII
NotI
XhoI
601 GGTCGGGATCCGAATTCGAGCTCCGTCGACAAGCTTGCGGCCGCACTCGAG
CACCACCAC 660
G R D P N S S S V D K L A A A L E H H H
661
CACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCC 720
H H H
T7 terminator
721 ACCGCTGAGCAATAACTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTT 780
781 TTGCCC 786