生产二肽的微生物和使用该微生物制造二肽的方法
技术领域
本发明涉及生产二肽的微生物和使用该微生物制造二肽的方法。
背景技术
二肽是食品、医药品、化妆品等中的重要化合物。
作为二肽的制造方法已知有从天然物提取的方法、化学合成法、酶法。从天然物提取的方法除了可生产的二肽的种类有局限外,天然物中含有的目的二肽的含量低,产率差。在通过化学合成法的二肽合成中,需要官能基的保护和脱保护等操作,另外由于也合成消旋体,所以化学合成法不能说是一个经济的、高效的方法。另外,由于化学合成法使用大量的有机溶剂等,在环境卫生上也不是一个理想的方法。
有关利用酶法的二肽合成,已知有利用蛋白质分解酶(蛋白水解酶)的逆反应的方法[J.Biol.Chem.,
119,707-720(1937)]、利用耐热性氨酰t-RNA合成酶的方法(特开昭58-146539号公报、特开昭58-209991号公报、特开昭58-209992号公报、特开昭59-106298号公报)、利用非核糖体肽合成酶(以下称为NRPS)的方法[Chem.Biol.,
7,373-384(2000)、FEBS Lett.,
498,42-45(2001)、美国专利第5795738号、美国专利第5652116号]、利用D-Ala-D-Ala连接酶的方法[Biochemistry,
35,10464-10471(1996)]、利用杆菌溶素合成酶的方法[J.Ind.Microbiol.,
2,201-208(1987)、Enzyme.Microbial.Technol.,
29,400-406(2001)]、利用L-氨基酸酰胺水解酶或脯氨酸亚氨基肽酶的方法(国际公开第WO 03/010307号小册子)。
然而,在利用蛋白水解酶的逆反应的方法中,需要对作为底物的氨基酸的官能基进行保护和脱保护,存在着难于使肽形成反应的效率提高和阻止肽分解反应的问题。在利用耐热性氨酰t-RNA合成酶的方法中存在着酶的表达困难、难于阻止副生物的生成反应的问题。
另一方面,利用NRPS、D-Ala-D-Ala连接酶和杆菌溶素合成酶的方法不存在上述那样的问题,虽然是可以制造特定序列的二肽的方法,但由于是需要ATP等能量供给源的反应,所以并不是一个效率高的方法。
在利用L-氨基酸酰胺水解酶或脯氨酸亚氨基肽酶的方法中,主要记载了生产该酶的微生物的培养物、从该培养物分离的微生物菌体、使用该微生物菌体的处理物制造二肽,但利用该制造方法的二肽的产量并不充分。
活细胞进行着将不需要的蛋白质直至分解到组成氨基酸,将生成的氨基酸用于必要的蛋白质合成的代谢。该功能由于对细胞的存活、增殖是必需的,所以生物中存在着多种蛋白酶和肽酶。
例如,已知大肠杆菌(
Escherichia
coli)中除了至少存在的7种二肽酶之外,也存在着被其它蛋白酶和肽酶分解的二肽[FEMSMicrobial.Rev.,
63,265-276(1989)]。另外,在谷氨酸棒杆菌(
Corynebacterium
glutamicum)、枯草芽孢杆菌(
Bacillus subtilis)、酿酒酵母(
Saccharomyces serevisiae)的染色体DNA上被鉴定为肽酶基因的基因分别存在着25个以上、14个以上、20个以上。
但是,还不清楚通过向生产二肽的微生物导入肽酶的缺失,以使二肽产量上升。
而已经知道在活细胞中备有多个肽转运系统。
例如,有报道称在大肠杆菌中存在着3个转运二肽的系统[Chem.Biol.,
5,489-504(1998)、Microbiol.,
145,2891-2901(1999)]。由基因组DNA情报也可以确认在属于埃希氏菌属、芽孢杆菌属、棒杆菌属和酵母属的微生物中,无论那一种微生物都存在着3种或更多的肽转运系统。
然而,还不清楚细胞内合成的二肽是否排出细胞外,另外也不知道通过在生产二肽的微生物中导入参与肽转运的蛋白质的缺失,二肽产量是否上升。
发明内容
本发明的目的在于提供生产二肽的微生物和使用该微生物的二肽制造方法。
本发明涉及到以下(1)~(21)内容。
(1)微生物,该微生物为1种以上肽酶和1种以上的具有肽转运(peptide-transporting)活性的蛋白质(以下也称为肽转运蛋白质)的活性降低或丧失,且具有生产二肽能力的微生物。
(2)微生物,该微生物为3种以上肽酶的活性降低或丧失,且具有生产二肽能力的微生物。
(3)上述(1)或(2)的微生物,其中肽酶是具有序列编号1~4中任一个所示的氨基酸序列的蛋白质、或具有与序列编号1~4中任一个所示的氨基酸序列有80%以上同源性的氨基酸序列,且具有肽酶活性的蛋白质。
(4)上述(1)或(3)的微生物,其中肽转运蛋白是具有序列编号5~9中任一个所示的氨基酸序列的蛋白质、或与序列编号5~9中任一个所示的氨基酸序列有80%以上同源性,且具有肽转运活性的蛋白质。
(5)上述(1)~(4)中的任一个微生物,其中具有生产二肽能力的微生物是具有生产以下[1]~[4]任一项所述蛋白质能力的微生物:
[1]具有序列编号19~25和68中任一个所示的氨基酸序列的蛋白质
[2]由在序列编号19~25和68中任一个所示的氨基酸序列中缺失、置换或附加了1个以上氨基酸的氨基酸序列构成,且具有二肽合成活性的蛋白质;
[3]由与序列编号19~25和68中任一个序列表示的氨基酸序列有65%以上同源性的氨基酸序列构成,且具有二肽的合成活性的蛋白质;
[4]具有与序列编号33所示的氨基酸序列有80%以上同源性的氨基酸序列,且具有二肽的合成活性的蛋白质。
(6)上述(1)~(4)中的任一个微生物,其中具有生产二肽能力的微生物是具有以下[1]~[4]任一项所述的DNA的微生物:
[1]编码上述(5)的[1]~[4]中任一项所述的蛋白质的DNA;
[2]具有序列编号26~32、64和65中任一个表示的碱基序列的DNA;
[3]与具有序列编号26~32、64和65中任一个表示的碱基序列的DNA在严格的条件下进行杂交,同时编码具有二肽合成活性的蛋白质的DNA;
[4]具有与序列编号34表示的碱基序列有80%以上同源性的碱基序列,同时编码具有二肽合成活性的蛋白质的DNA。
(7)上述(1)~(6)中的任一个微生物,其中具有生产二肽能力的微生物是含有上述(6)的[1]~[4]任一项所述的DNA与载体DNA连接的重组体DNA的微生物。
(8)上述(1)~(7)中的任一个微生物,其中微生物是属于埃希氏菌属、芽孢杆菌属、棒杆菌属或酵母属的微生物。
(9)上述(1)~(4)中的任一个微生物,其中具有生产二肽能力的微生物是具有由L-氨基酸酯和L-氨基酸生成二肽的能力的微生物。
(10)上述(9)的微生物,其中具有由L-氨基酸酯和L-氨基酸生成二肽的能力的微生物是生产脯氨酸亚氨基肽酶的微生物。
(11)上述(9)或(10)的微生物,其中具有由L-氨基酸酯和L-氨基酸生成二肽能力的微生物是含有编码具有脯氨酸亚氨基肽酶活性的蛋白质的DNA与载体DNA连接的重组体DNA的微生物。
(12)上述(9)~(11)中的任一个微生物,其中微生物是属于埃希氏菌属、芽孢杆菌属、棒杆菌属或酵母属的微生物。
(13)上述(1)~(4)中的任一个微生物,其中具有生产二肽能力的微生物是具有由L-氨基酸酰胺和L-氨基酸生成二肽的能力的微生物。
(14)上述(13)的微生物,其中具有由L-氨基酸酰胺和L-氨基酸生成二肽的能力的微生物是生产具有L-氨基酸酰胺水解酶活性的蛋白质的微生物。
(15)上述(13)的微生物,其中具有由L-氨基酸酰胺和L-氨基酸生成二肽的能力的微生物是含有连接了编码具有L-氨基酸酰胺水解酶活性的蛋白质的DNA和载体DNA的重组体DNA的微生物。
(16)上述(13)~(15)中的任一个微生物,其中微生物是属于埃希氏菌属、芽孢杆菌属、棒杆菌属或酵母属的微生物。
(17)二肽的制造方法,该方法使用上述(1)~(8)中的任一个微生物的培养物或该培养物的处理物作为酶源,使该酶源、1种以上氨基酸存在于水性介质中,使二肽在该水性介质中生成、蓄积,从该介质回收该二肽。
(18)上述(17)的制造方法,其中二肽是用下式(I)表示的二肽,
R1-R2 (I)
(式中、R1和R2表示相同的或不同的氨基酸)。
(19)使用上述(9)~(12)中的任一个微生物的培养物或该培养物的处理物作为酶源,使该酶源、L-氨基酸酯和L-氨基酸存在于水性介质中,使二肽在该水性介质中生成、蓄积,从该介质回收该二肽。
(20)二肽的制造方法,该方法使用上述(13)~(16)中的任一个微生物的培养物或该培养物的处理物作为酶源,使该酶源、L-氨基酸酰胺和L-氨基酸存在于水性介质中,使二肽在该水性介质中生成、蓄积,由该介质回收该二肽。
(21)上述(17)~(20)中的任一个制造方法,其特征是:培养物的处理物是培养物的浓缩物、培养物的干燥物、对培养物进行离心分离得到的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物、或该菌体的固定化物。
以下对本发明进行详细说明。
1.本发明的微生物
本发明的微生物是1种以上的肽酶和1种以上具有肽转运活性的蛋白质(以下略称为肽转运蛋白质)的活性降低或丧失,且具有生产二肽能力的微生物、或3种以上的肽酶的活性降低或丧失,且具有生产二肽能力的微生物。
作为1种以上的肽酶和1种以上的肽转运蛋白质的活性降低或丧失的微生物,只要是在该微生物能够正常繁殖范围内,可举任意的1种以上肽酶和任意1种以上的肽转运蛋白质的活性降低或丧失的微生物,优选1种以上9种以下更优选1种以上7种以下进一步优选1种以上4种以下的肽酶的活性降低或丧失,而且优选1种以上5种以下更优选1种以上3种以下进一步优选1种以上2种以下特别优选1种肽转运蛋白质的活性降低或丧失的微生物。
作为该微生物,更具体来讲,可例举在存在于该微生物基因组DNA上的编码肽酶的基因(以下略称为肽酶基因)和编码肽转运蛋白质的基因(以下肽转运蛋白质基因)中的1种以上的肽酶基因碱基序列和1种以上的肽转运蛋白质基因碱基序列中,由于缺失该碱基序列的全部或一部,或由于在该碱基序列中存在置换或添加碱基,该肽酶和该肽转运蛋白质的活性降低或丧失的微生物。
所谓肽酶的活性降低指的是与上述的没有缺失、置换或添加碱基的肽酶相比,肽分解活性降低了。
微生物的肽分解活性通过使作为底物的肽和微生物菌体共存于水性介质中,进行肽分解反应后,对残存的肽量通过使用众所周知的方法、例如使用HPLC等分析法进行定量来测定。
作为上述肽酶,只要是具有肽分解活性的蛋白质就可以,优选二肽分解活性高的蛋白质、更优选二肽酶。
作为更具体的肽酶,例如存在于大肠杆菌的具有序列1所示的氨基酸序列的PepA、具有序列2所示的氨基酸序列的PepB、具有序列3所示的氨基酸序列的PepD、具有序列4所示的氨基酸序列的PepN、PepP[GenBank登录号(以下略称为GenBank)AAC75946]、PepQ(GenBank AAC76850)、PepE(GenBank AAC76991)、PepT(GenBankAAC74211)、Dcp(GenBank AAC74611)和IadA(GenBank AAC77284)等存在于枯草芽孢杆菌的AmpS(GenBank AF012285)、PepT(GenBankX99339)、YbaC(GenBank Z99104)、YcdD(GenBank Z99105)、YjbG(GenBank Z99110)、YkvY(GenBank Z99111)、YqjE(GenBank Z99116)、YwaD(GenBank Z99123)等存在于谷氨酸棒杆菌的具有BAB97732、BAB97858、BAB98080、BAB98880、BAB98892、BAB99013、BAB99598和BAB99819(都来自日本DNA数据库的登录编号)所示的氨基酸序列的蛋白质等,存在于酿酒酵母的OCT1(GenBank NC_001143)、SPC2(GenBank NC_003143)、SPY2[
Saccharomyces基因组数据库(http://www.yeastgenome.org/)登录号L0002875]和YIM1(GenBank NC_001145)等,作为二肽酶,可例举具有序列1~4所示的氨基酸序列的PepA、PepB、PepD和PepN、以及PepQ、PepE、IadA。另外,作为二肽分解活性高的蛋白质,可例举具有与序列1~4中任一个氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性,且具有肽酶活性的蛋白质。
氨基酸序列和碱基序列的同源性可以使用Karlin and Altschul的算法BLAST[Pro.Natl.Acad.Sci.USA,
90,5873(1993)]和FASTA[Methods Enzymol.,
183,63(1990)]来决定。根据该算法BLAST,已开发出称之为BLASTN和BLASTX的程序[J.Mol.Biol.,
215,403(1990)]。根据BLAST,通过BLASTN解析碱基序列时,参数设定为例如Score=100、wordlength=12。还有,根据BLAST,通过BLASTX解析氨基酸序列时,参数设定为例如score=50、wordlength=3。使用BLAST和Gapped BLAST程序时,使用各程序系统设定参数。对这些解析方法的具体手法众所周知(http://www.ncbi.nlm.nih.gov.)。
而所谓肽转运蛋白质的活性降低指的是与上述的没有进行碱基的缺失、置换或插入的DNA编码的肽转运蛋白质相比,肽转运活性变低了。
微生物的肽转运活性可以使作为底物的肽与微生物菌体在水性介质中共存,进行肽转运反应后,通过众所周知的方法、例如使用HPLC等的分析法对残存在水性介质中的肽量进行定量来测定。
作为上述肽转运蛋白质,是染色体DNA上形成操纵子的基因编码的蛋白质、在细胞膜上形成复合物后表达二肽转运活性的蛋白质和作为单独的蛋白质具有肽转运活性的蛋白质等,只要是参与微生物的肽转运的蛋白质都可以,优选肽转运活性高的蛋白质。
作为更具体的转运蛋白质,例如可例举存在于大肠杆菌的具有序列编号5所示的氨基酸序列的DppA、具有序列编号6所示的氨基酸序列的DppB、具有序列编号7所示的氨基酸序列的DppC、具有序列编号8所示的氨基酸序列的DppD、具有序列编号9所示的氨基酸序列的DppF、OppA(GenBank AAC76569)、OppB(GenBank AAC76568)、OppC(GenBank AAC76567)、OppD(GenBank AAC76566)、OppF(GenBankAAC76565)、YddO(GenBank AAC74556)、YddP(GenBank AAC74557)、YddQ(GenBank AAC74558)、YddR(GenBank AAC74559)、YddS(GenBankAAC74560)、YbiK(GenBank AAC73915)、MppA(GenBank AAC74411)、SapA(GenBank AAC74376)、SapB(GenBank AAC74375)、SapC(GenBankAAC74374)、SapD(GenBank AAC74373)、和SapF(GenBank AAC74372)等,存在于枯草芽孢杆菌的DppA(GenBank CAA40002)、DppB(GenBankCAA40003)、DppC(GenBank CAA40004)、DppD(GenBank CAA40005)、DppE(GenBank CAA40006)、OppA(GenBank CAA39787)、OppB(GenBankCAA39788)、OppC(GenBank CAA39789)、OppD(GenBank CAA39790)、OppF(GenBank CAA39791)、AppA(GenBank CAA62358)、AppB(GenBankCAA62359)、AppC(GenBank CAA62360)、AppD(GenBank CAA62356)、AppF(GenBank CAA62357)、YclF(GenBank CAB12175)和YkfD(GenBankCAB13157)等,存在于谷氨酸棒杆菌的BAB99048、BAB99383、BAB99384、BAB99385、BAB99713、BAB99714、BAB99715、BAB99830、BAB99831、BAB99832(都是日本DNA数据库的登录编号)所示的氨基酸序列的蛋白质等,存在于酿酒酵母的OPT1(GenBank NP_012323)、OPT2(GenBankNP_015520)和PTR2(GenBank CAA82172)等,另外,作为肽转运活性高的蛋白质,可例举具有序列编号5~9所示的氨基酸序列的DppA、DppB、DppC、DppD、DppF和与它们中任一个氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的蛋白质。
氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序测定。
作为3种以上的肽酶活性降低或丧失的微生物,只要是该微生物能够正常生长,可例举任意的3种以上肽酶活性降低或丧失的微生物,优选3种以上9种以下更优选3种以上6种以下特别优选3种或4种的肽酶活性降低或丧失的微生物。
作为具体的肽酶,可例举存在于上述的大肠杆菌、枯草芽孢杆菌、谷氨酸棒杆菌和酿酒酵母的肽酶和二肽酶。另外,作为二肽分解活性高的蛋白质,可举由与序列编号1~4中任一个氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列构成、且具有肽酶活性的蛋白质。
氨基酸序列的同源性可以用上述的BLAST或FASTA等程序测定。
作为具有生产二肽能力的微生物,只要是具有生产二肽能力的微生物,没有特别限定,例如可例举生产具有通过将1种以上氨基酸缩合、连接合成二肽的活性的蛋白质的微生物、生产具有由L-氨基酸酯和L-氨基酸合成二肽的活性的蛋白质的微生物、生产具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的微生物等。
作为生产具有通过将1种以上氨基酸缩合、连接合成二肽的活性的蛋白质的微生物,可例举生产选自NRPS、D-Ala-D-Ala连接酶、杆菌溶素合成酶的蛋白质的微生物。
作为生产NRPS的微生物,如以芽孢杆菌属为首的原核生物、以青霉属为首的真核生物、生产BacA、BacB和BacC(GenBank AF007865)的微生物、生产TycA、TycB和TycC(GenBank AF004835)的微生物、生产PcbAB(GenBank M57425)的微生物、和生产具有与BacA、BacB、BacC、TycA、TycB、TycC、PcbAB中任一个蛋白质的氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性,且具有NRPS活性的蛋白质的微生物等。
作为生产D-Ala-D-Ala连接酶的微生物,如形成肽聚糖的原核微生物、生产DdlA(GenBank登录号M58467)的微生物、生产DdlB(GenBank登录号AE000118)的微生物、生产DdlC(GenBank登录号D88151)的微生物和生产由在DdlA、DdlB、DdlC中任一个的氨基酸序列中缺失、置换或附加1以上氨基酸的氨基酸序列构成的,且具有D-Ala-D-Ala连接酶活性的蛋白质的微生物等。
氨基酸序列的同源性可以使用上述的BLAST或FASTA等程序测定。
作为生产杆菌溶素合成酶的微生物,如属于芽孢杆菌属的微生物、优选枯草芽孢杆菌(
Bacillus
subtilis)、淀粉液化芽孢杆菌(
Bacillus
amyloliquefaciens)、凝结芽孢杆菌(
Bacillus coagulans)、地衣芽孢杆菌(
Bacillus
licheniformis)、巨大芽孢杆菌(
Bacillus
megaterium)、短小芽孢杆菌(
Bacillus
pumilus)和生产以下[1]~[4]中蛋白质的微生物:
[1]具有序列编号19~25和68任一个所示的氨基酸序列的蛋白质、
[2]由在序列编号19~25和68任一个所示的氨基酸序列缺失、置换或附加了1个以上氨基酸的氨基酸序列构成,而且具有二肽的合成活性的蛋白质、
[3]由与序列编号19~25和68任一个所示的氨基酸序列有65%以上同源性的氨基酸序列构成,而且具有二肽的合成活性的蛋白质,或
[4]具有与序列编号33所示的氨基酸序列有80%以上同源性的氨基酸序列,而且具有二肽的合成活性的蛋白质。
作为生产具有由L-氨基酸酯和L-氨基酸合成二肽的活性的蛋白质的微生物,如生产脯氨酸亚氨基肽酶的微生物,具体来说,如属于芽孢杆菌属、棒杆菌属或假单胞菌属的微生物等。具体来说,如枯草芽孢杆菌ATCC6633、凝结芽孢杆菌EK01[J.Bacteriol.,174,7919(1992)]、谷氨酸棒杆菌ATCC13286、恶臭假单胞菌AJ-2402(FERM BP-8101)、恶臭假单胞菌ATCC12633、恶臭假单胞菌AJ2048(FERM BP-8123)(以上为WO 03/010307所述的微生物)等。另外、烟草节杆菌[FEMS Microbiol.Lett.,
78,191(1999)]、大肠杆菌(特开平2-113887)、脑膜浓毒性金黄杆菌[Arch.Biochem.Biophys.,336,35(1996)]、哈夫尼肠杆菌[J.Biochem.,
119,468(1996)]、德氏乳细菌[Microbiology,
140,527(1994)]、凝结芽孢杆菌[J.Bacteriol.,
174,7919(1994)]、温和气单胞菌[J.Biochem.,
116,818(1994)]、野油菜杆菌(特开平9-121860)、淋病奈瑟氏菌[Mol.Microbiol.,
9,1203(1993)]、费氏丙酸杆菌[Appl.Environ.Microbiol.,
64,4736(1998)]、粘质塞氏杆菌[J.Biochem.,
122,601(1997)]、变异棒杆菌[J.Appl.Microbiol.,
90,449(2001)]、嗜酸热原体[FEBS Lett.,
398,101(1996)]、绿脓杆菌[Nature,
406,959(2000)]等作为生产脯氨酸亚氨基肽酶的微生物。
另外,作为生产脯氨酸亚氨基肽酶的微生物,如具有生产以下[1]~[3]中蛋白质能力的微生物:
[1]WO 03/010307、FEMS Microbiol.Lett.,
78,191(1999)、特开平2-113887、Arch.Biochem.Biophys.,
336,35(1996)、J.Biochem.,119,468(1996)、Microbiology,
140,527(1994)、J.Bacteriol.,174,7919(1994)、J.Biochem.,
116,818(1994)、特开平9-121860、Mol.Microbiol.,
9,1203(1993)、Appl.Environ.Microbiol.,
64,4736(1998)、J.Biochem.,
122,601(1997)、FEBS Lett.,
398,101(1996)、Nature,
406,959(2000)任一项所述的脯氨酸亚氨基肽酶、
[2]由在上述[1]中任一个脯氨酸亚氨基肽酶的氨基酸序列中,缺失、置换或附加了1个以上氨基酸的氨基酸序列构成、而且具有脯氨酸亚氨基肽酶活性的蛋白质、
[3]由与上述[1]中任一个脯氨酸亚氨基肽酶的氨基酸序列有80%以上同源性的氨基酸序列构成、而且具有脯氨酸亚氨基肽酶活性的蛋白质。
作为生产具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的微生物,如生产L-氨基酸酰胺水解酶的微生物,具体来说,如属于芽孢杆菌属、棒杆菌属、欧文氏菌属、红球菌属、金黄杆菌属、微球菌属、假单胞菌属、隐球菌属、
Trichosporon属、
Rhodosporidium属、
Sporobolomyces属、
Tremella属、
Torulaspora属、Sterigmatomyces属、或
Rhodotolura属的微生物、优选属于芽孢杆菌属、棒杆菌属或假单胞菌属的微生物、更优选巨大芽孢杆菌AJ3284(FERM BP-8090)、谷氨酸棒杆菌ATCC13286、藤黄微球菌ATCC9341、嗜糖假单胞菌ATCCl5946(以上为WO 03/010187所述的微生物)等。
而作为生产具有L-氨基酸酰胺水解酶活性的蛋白质的微生物,如具有生产以下[1]或[2]所述蛋白质能力的微生物:
[1]由在WO 03/010187所述L-氨基酸酰胺水解酶的氨基酸序列中缺失、置换或附加了1个以上氨基酸的氨基酸序列构成,而且具有L-氨基酸酰胺水解酶活性的蛋白质
[2]由与WO 03/010187所述的L-氨基酸酰胺水解酶的氨基酸序列有80%以上同源性的氨基酸序列构成,而且具有L-氨基酸酰胺水解酶活性的蛋白质。
在上述中,由缺失、置换或附加1个以上氨基酸的氨基酸序列组成,具有二肽合成活性的蛋白质可通过使用Molecular Cloning,ALaboratory Manual,Second Edition,Cold Spring HarborLaboratory Press(1989)(以下略称为Molecular Cloning第2版)、Current Protocols in Molecular Biology,John Wiley & Sons(1987-1997)(以下略称为Current Protocols in MolecularBiology)、Nucleic Acids Research,
10,6487(1982)、Proc.Natl.Acad.Sci.USA,
79,6409(1982)、Gene,
34,315(1985)、NucleicAcids Research,
13,4431(1985)、Proc.Natl.Acad.Sci.USA,82,488(1985)等所述的特定部位的突变导入法,例如,在编码由序列19~25和68所示的氨基酸序列构成的蛋白质、具有脯氨酸亚氨基肽酶活性的蛋白质和具有L-氨基酸酰胺水解酶活性的蛋白质中任一个蛋白质的DNA导入特定部位的突变获得。
缺失、置换或附加的氨基酸的数目没有特别限定,可以是通过上述的特定部位的突变法等众所周知的方法能够缺失、置换或附加程度的数,如1个至数十个、优选1~20个、更优选1~10个、进一步优选1~5个。
所谓在序列编号19~25和68所示的氨基酸序列、具有脯氨酸亚氨基肽酶活性的蛋白质和具有L-氨基酸酰胺水解酶活性的蛋白质的氨基酸序列的任一个序列中缺失、置换或附加1个以上氨基酸是指可以在同一序列中任意位置缺失、置换或附加1个或多个氨基酸。
缺失、置换或附加即使同时发生也可以,置换或附加的氨基酸不管天然型,还是非天然型都可以。作为天然型氨基酸,如L-丙氨酸、L-天冬酰胺、L-天冬氨酸、L-精氨酸、L-谷氨酰胺、L-谷氨酸、甘氨酸、L-组氨酸、L-异亮氨酸、L-亮氨酸、L-赖氨酸、L-蛋氨酸、L-苯丙氨酸、L-脯氨酸、L-丝氨酸、L-苏氨酸、L-色氨酸、L-酪氨酸、L-缬氨酸、L-半胱氨酸等。
以下给出了可相互置换的氨基酸的例子。同一组中含有的氨基酸可相互置换。
A组:亮氨酸、异亮氨酸、正亮氨酸、缬氨酸、正缬氨酸、丙氨酸、2-氨基丁酸、蛋氨酸、0-甲基丝氨酸、t-丁基甘氨酸、t-丁基丙氨酸、环己基丙氨酸
B组:天冬氨酸、谷氨酸、异天冬氨酸、异谷氨酸、2-氨基己二酸、2-氨基辛二酸
C组:天冬酰胺、谷氨酰胺
D组:赖氨酸、精氨酸、鸟氨酸、2,4-二氨基丁酸、2,3-二氨基丙酸
E组:脯氨酸、3-羟基脯氨酸、4-羟基脯氨酸
F组:丝氨酸、苏氨酸、同型丝氨酸
G组:苯丙氨酸、酪氨酸
另外,导入缺失、置换或附加上述的1个以上氨基酸的位置只要是具有导入该突变的氨基酸序列的蛋白质具有二肽合成活性的,没有特别限定,例如可例举与序列编号19~25和68所示的氨基酸序列比较时,在该氨基酸序列中的1个以上氨基酸序列中没有保存的氨基酸残基。
而作为由缺失、置换或附加了上述的1个以上氨基酸的氨基酸序列构成的蛋白质,且具有二肽合成活性的蛋白质,如与序列编号19~25和68任一个所示的氨基酸序列的同源性通常具有65%以上、优选80%以上、更优选90%以上、特别优选95%以上同源性的蛋白质、与脯氨酸亚氨基肽酶的氨基酸序列或L-氨基酸酰胺水解酶的氨基酸序列任一个的氨基酸序列的同源性通常具有80%以上、优选90%以上、更优选95%以上同源性的蛋白质。
氨基酸序列和碱基序列的同源性使用上述的BLAST或FASTA等程序测定。
序列编号33所示的氨基酸序列是保存在具有序列19~25所示的氨基酸序列的蛋白质中间的区域,而且是对应于各种微生物的具有Ala-Ala连接酶活性的蛋白质的公有序列的区域。
生产作为与序列编号33所示的氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列的蛋白质,而且具有二肽合成活性的蛋白质的微生物也是生产二肽的微生物。
具有与序列编号33所示的氨基酸序列有80%以上、优选90%以上、更优选95%以上同源性的氨基酸序列的蛋白质为了作为具有二肽合成活性的蛋白质,该蛋白质的氨基酸序列与序列编号19~25表示的任一个氨基酸序列的同源性至少具有80%以上、通常具有90%以上、特别是具有95%以上的同源性更好。
氨基酸序列的同源性使用上述的BLAST和FASTA等程序测定。
另外,含有编码具有通过将一种以上氨基酸缩合、连接合成二肽活性的蛋白质的DNA、编码具有由L-氨基酸酯和L-氨基酸合成二肽活性的蛋白质的DNA、或编码具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的DNA与载体DNA连接后得到的重组体DNA的微生物也都是本发明的微生物。
作为该微生物,如属于埃希氏菌属、芽孢杆菌属、棒杆菌属或酵母属的微生物。
作为编码具有通过将一种以上氨基酸缩合、连接合成二肽活性的蛋白质的DNA,如编码NRPS、D-Ala-D-Ala连接酶或杆菌溶素合成酶的DNA等。
作为编码NRPS的DNA,如编码BacA、BacB、BacC、TycA、TycB、TycC和PcbAB中的任一种蛋白质的DNA。
作为编码D-Ala-D-Ala连接酶的DNA,如编码DdlA、DdlB和DdlC中的任一种蛋白质的DNA。
作为编码杆菌溶素合成酶的DNA,如编码以下[1]~[4]所述的蛋白质的DNA,
[1]具有序列编号19~25和68中任一个所示的氨基酸序列的蛋白质、
[2]由在序列编号19~25和68中任一个所示的氨基酸序列中缺失、置换或附加了1个以上氨基酸的氨基酸序列构成,而且具有二肽的合成活性的蛋白质、
[3]由与序列编号19~25和68中任一个所示的氨基酸序列有65%以上同源性的氨基酸序列构成,且具有二肽合成活性的蛋白质、
[4]具有与序列编号33所示的氨基酸序列有80%以上同源性的氨基酸序列,且具有二肽合成活性的蛋白质、和以下[5]~[7]所述的DNA,
[5]具有序列编号26~32、64和65任一个表示的碱基序列的DNA、
[6]与具有序列编号26~32、64和65任一个表示的碱基序列的DNA在严格的条件下进行杂交,而且编码具有二肽合成活性的蛋白质的DNA、
[7]具有与序列编号34表示的碱基序列有80%以上同源性的碱基序列的DNA,而且编码具有二肽合成活性的蛋白质的DNA。
作为编码具有由L-氨基酸酯和L-氨基酸合成二肽活性的蛋白质的DNA,如编码以下[1]~[3]所述的蛋白质的DNA,[1]WO 03/010307、FEMS Microbiol.Lett.,
78,191(1999)、特开平2-113887、Arch.Biochem.Biophys.,
336,35(1996)、J.Biochem.,
119,468(1996)、Microbiology,
140,527(1994)、J.Bacteriol.,
174,7919(1994)、J.Biochem.,
116,818(1994)、特开平9-121860、Mol.Microbiol.,
9,1203(1993)、Appl.Environ.Microbiol.,
64,4736(1998)、J.Biochem.,
122,601(1997)、FEBSLett.,
398,101(1996)、Nature,
406,959(2000)任一项所述的脯氨酸亚氨基肽酶、
[2]由在上述[1]中任一个脯氨酸亚氨基肽酶的氨基酸序列中,缺失、置换或附加了1个以上氨基酸的氨基酸序列构成,且具有脯氨酸亚氨基肽酶活性的蛋白质、
[3]由与上述[1]任一个脯氨酸亚氨基肽酶的氨基酸序列有80%以上同源性的氨基酸序列构成,且具有脯氨酸亚氨基肽酶活性的蛋白质、和以下[4]或[5]所述的DNA,
[4]具有WO 03/010307、FEMS Microbiol.Lett.,
78,191(1999)、特开平2-113887、Arch.Biochem.Biophys.,
336,35(1996)、J.Biochem.,
119,468(1996)、Microbiology,
140,527(1994)、J.Bacteriol.,
174,7919(1994)、J.Biochem.,
116,818(1994)、特开平9-121860、Mol.Microbiol.,
9,1203(1993)、Appl.Environ.Microbiol.,
64,4736(1998)、J.Biochem.,
122,601(1997)、FEBSLett.,
398,101(1996)、Nature,
406,959(2000)任一项所述的碱基序列的编码脯氨酸亚氨基肽酶的DNA,
[5]与编码上述[4]任一个脯氨酸亚氨基肽酶的DNA在严格的条件下进行杂交,且编码具有脯氨酸亚氨基肽酶活性的蛋白质的DNA。
作为编码具有由L-氨基酸酰胺和L-氨基酸合成二肽的活性的蛋白质的DNA,如编码以下[1]或[2]所述蛋白质的DNA、
[1]由在WO 03/010187所述的L-氨基酸酰胺水解酶的氨基酸序列中缺失、置换或附加了1个以上氨基酸的氨基酸序列构成,且具有L-氨基酸酰胺水解酶活性的蛋白质、
[2]由与WO 03/010187所述的L-氨基酸酰胺水解酶的氨基酸序列有80%以上同源性的氨基酸序列构成,且具有L-氨基酸酰胺水解酶活性的蛋白质、
和以下[3]或[4]所述的DNA,
[3]具有WO 03/010187所述的碱基序列的编码L-氨基酸酰胺水解酶的DNA、
[4]与由WO 03/010187所述的碱基序列构成的编码L-氨基酸酰胺水解酶的DNA在严格的条件下杂交,且编码具有L-氨基酸酰胺水解酶活性的蛋白质的DNA。
上述所谓的在严格的条件下可杂交的DNA指的是以上述任一个DNA的一部分、或全部作为探针,通过使用菌落杂交法、噬斑杂交法或Southern blot杂交法等得到的DNA,具体来说,使用固定了来自菌落或噬斑的DNA的滤膜,在0.7~1.0mol/l、优选在0.9mol/l氯化钠存在下、于65℃进行杂交后、使用0.1~2倍浓度、优选0.1倍浓度的SSC溶液(1倍浓度的SSC溶液组成是由150mmol/l的氯化钠和15mmol/l的柠檬酸钠构成),于65℃条件下将滤膜洗净能够鉴定的DNA。杂交可以根据分子克隆第2版、Current Protocols inMolecular Biology、DNA Cloning 1:Core Techniques,A PracticalApproach,Second Edition,Oxford University(1995)等所述的方法进行。作为可杂交的DNA,具体来说如使用上述的BLAST和FASTA等程序,根据上述参数计算时,与上述的任一个DNA的碱基序列至少具有80%以上、优选90%以上、更优选95%以上同源性的DNA。
在严格的条件下与上述的DNA进行杂交的DNA作为编码具有二肽的合成活性的蛋白质的DNA可以通过制作表达该DNA的重组DNA,用将该重组DNA导入到宿主细胞后得到的微生物作为酶源,1)使该酶源和1种以上氨基酸存在于水性介质中,通过HPLC等分析在该水性介质中是否有二肽生成、蓄积的方法、2)使该酶源、L-氨基酸酯和L-氨基酸存在于水性介质中,通过HPLC等分析在该水性介质中是否有二肽生成、蓄积的方法、3)使该酶源、L-氨基酸酰胺和L-氨基酸存在于水性介质中,通过HPLC等分析在该水性介质中是否有二肽生成、蓄积的方法确认。
碱基序列的同源性可以使用上述的BLAST或FASTA等程序测定。
2.本发明微生物的制造方法
本发明的微生物可以通过1)对1种以上的肽酶和1种以上具有肽转运活性的蛋白质的功能降低或丧失的微生物、或3种以上肽酶的功能降低或丧失的微生物赋予二肽生产能力的方法,或2)使具有生产二肽能力的微生物的a)1种以上肽酶和1种以上肽转运蛋白质、或b)3种以上肽酶的功能降低或丧失的方法中任一种方法获得。
(1)对1种以上肽酶和1种以上肽转运蛋白质的功能降低或丧失的微生物、或3种以上的肽酶的功能降低或丧失的微生物赋予二肽生产能力的方法
(i)制造肽酶、肽转运蛋白质的活性降低或丧失的微生物
肽酶、肽转运蛋白质的活性降低或丧失的微生物只要是可获得该微生物的方法,对其获得方法没有限制,例如,可以通过在以下所示的微生物染色体DNA的肽酶基因或肽转运蛋白质基因导入碱基缺失、置换或附加的方法获得。
作为向微生物的染色体DNA基因导入碱基缺失、置换或附加的方法,如利用同源重组的方法。作为一般的利用同源重组的方法,如使用将导入了碱基缺失、置换或附加的变异基因与含有在希望导入碱基缺失等的宿主细胞内不能自我复制的抗药性基因的质粒DNA连接制作的同源重组用质粒的方法。
将该同源重组用质粒通过常用方法导入宿主细胞后,以抗药性作为指标,选择通过同源重组在染色体DNA上转运了该同源重组用质粒的转化株。将得到的转化株在不含有该药物的培养基中培养数小时~1日培养后,涂布于含有该药物琼脂培养基和不含有该药物的琼脂培养基上,通过选择在前者培养基中不繁殖,而在后者培养基中可以繁殖的菌株,可以获得在染色体DNA上出现第2次同源重组的菌株。通过对染色体DNA上导入了缺失等的基因存在的区域的碱基序列进行决定,能够确认染色体DNA上的目的基因导入碱基的缺失、置换或附加。
作为通过上述方法,可以在染色体DNA上的目的基因中导入碱基缺失、置换或附加的微生物,如属于希氏菌属、芽孢杆菌属、棒杆菌属、或酵母属的微生物。
另外,作为利用对多个基因有效导入了碱基缺失、置换或附加的同源重组的方法,如使用直链DNA的方法。
具体来说,是使含有希望导入的碱基缺失、置换或附加的基因的直链DNA转运到细胞内,在染色体DNA与导入了的直链DNA之间发生同源重组的方法。本方法只要是可有效转运直链DNA的微生物,可运用任一种微生物,作为优选的微生物,如使用埃希氏菌属或芽孢杆菌属的微生物、更优选大肠杆菌、特别优选表达来自λ噬菌体的重组蛋白质组(Red重组系统)的大肠杆菌。
作为表达λRed重组系统的大肠杆菌,如保有作为含有λRed重组系统基因的质粒DNA的pKD46[从大肠杆菌基因贮存中心(美国耶鲁大学)可获得]的大肠杆菌JMl01株等。
作为在同源重组中使用的DNA,如
(a)在抗药性基因的两端具有存在于作为碱基缺失、置换或附加导入对象的染色体DNA上区域的两外侧的DNA或具有与该DNA有同源性的DNA的直链DNA、
(b)直接连接了存在于作为碱基缺失、置换或附加导入对象的染色体DNA上区域两外侧的DNA或与该DNA具有同源性的DNA的直链DNA、
(c)在抗药性基因和阴性筛选中能够使用的基因的两端具有存在于作为碱基缺失、置换或附加导入对象的染色体DNA上区域两外侧的DNA或与该DNA具有同源性的DNA的直链DNA、
(d)在上述(a)的直链DNA,在存在于抗药性基因和染色体DNA上的区域的两外侧的DNA或与该DNA有同源性的DNA之间,以及具有来自酵母的Flp重组酶[Proc.Natl.Acad.Sci.USA.,
82,5875(1985)]识别的碱基序列的DNA。
作为抗药性基因,只要是对于宿主微生物表现出敏感性的药物赋予抗药性的抗药性基因,可以使用任一种抗药性基因。宿主微生物使用大肠杆菌时,作为抗药性基因,例如卡那霉素耐性基因、氯霉素耐性基因、庆大霉素耐性基因、特霉素耐性基因、四环素耐性基因和氨苄青霉素耐性基因等。
所谓阴性筛选中可使用的基因指的是使该基因在宿主微生物表达时,在一定培养条件下,导致该微生物致死的基因,作为该基因,例如来自属于芽孢杆菌属的微生物的
sacB基因[Appl.Environ.Microbiol.,
59,1361-1366(1993)]和来自属于埃希氏菌属的微生物的
rpsL基因[Genomics,
72,99-104(2001)]等。
存在于上述直链DNA的两末端的位于成为染色体DNA上置换或缺失导入对象的区域两端外侧的DNA或与该DNA有同源性的DNA在直链DNA中在与染色体DNA上方向相同方向上配置,其长度优选10bp~100bp左右,更优选20bp~50bp左右,再优选30~40bp左右。
所谓来自酵母的Flp重组酶识别的碱基序列只要是该蛋白质识别、催化同源重组的碱基序列,没有特别限定,优选具有序列编号39表示的碱基序列的DNA和具有在该DNA中缺失、置换或附加1个~数个碱基的碱基序列,而且具有来自酵母的Flp重组酶识别、催化同源重组的碱基序列的DNA。
所谓具有同源性的DNA,上述直链DNA是在染色体DNA上的目的区域中,同源重组发生程度具有同一性的DNA,作为具体的同源性,如具有80%以上、优选90%以上、更优选95%以上、最优选100%同源性的DNA。
上述碱基序列的同源性可以使用上述的BLAST或FASTA等程序测定。
上述直链DNA片段可以通过PCR制作。另外,将含有上述直链DNA的DNA在质粒上构建后,通过限制性内切酶处理可以获得目的直链DNA。
作为向微生物的染色体DNA导入碱基缺失、置换或附加的方法,如以下的方法1~4。
方法1:将上述(a)或(d)的直链DNA导入宿主微生物,通过以抗药性为指标选择该直链DNA通过同源重组插入到染色体DNA上的转化株的方法。
方法2:向通过上述方法1得到的转化株导入直接连接了存在于作为碱基的缺失、置换或附加的导入对象的染色体DNA上区域两外侧的DNA或与该DNA有同源性的DNA的DNA,通过消除利用该方法插入到染色体DNA上的药物基因,使微生物的染色体DNA上的区域置换或缺失的方法。
方法3:
[1]将上述(c)的直链DNA导入宿主微生物,以抗药性为指标选择该直链DNA通过同源重组插入到染色体DNA上的转化株,
[2]合成在与染色体DNA上的方向同一方向上连接了与位于染色体DNA上的置换或缺失对象区域两端外侧的DNA有同源性的DNA的DNA,导入到上述[1]得到的转化株,
[3]在阴性筛选中可以使用的基因表达的条件下,培养进行了上述[2]操作的转化株,作为在抗药性基因和阴性筛选中能够使用的基因从染色体DNA上被削除的菌株,选择在该培养中可繁殖的菌株的方法。
方法4:
[1]将上述(d)的直链DNA导入宿主微生物,以抗药性为指标,选择该直链DNA通过同源重组插入到染色体DNA上的转化株,
[2]将Flp重组酶基因表达质粒导入到上述[1]得到的转化株中,使该基因表达后,获得对上述[1]使用的药物具有敏感性的菌株的方法。
在上述方法中使用的将直链DNA导入宿主微生物的方法,只要是向该微生物导入DNA的方法,可以使用任一个方法,例如使用钙离子的方法[Proc.Natl.Acad.Sci.,USA,
69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res.,
16,6127(1988)]等。
可在方法2或方法3[2]使用的DNA中,通过使用在该DNA的中央部附近转运希望插入到染色体DNA上的任意基因的DNA,在消除抗药性基因等的同时,可以将任意基因插入到染色体DNA上。
上述方法2~4,由于是在最终得到的转化株的染色体DNA上不留下在抗药性基因和阴性筛选中可以使用的基因等外来基因的方法,所以通过使用该方法,使用在同一的抗药性基因和阴性筛选中使用的基因,通过反复进行方法2、方法3[1]~[3]、和方法4[1][2]的操作,能够容易制造在染色体DNA上位置不同的2个以上区域具有碱基缺失、置换或附加的微生物。
(ii)赋予生产二肽能力的方法
作为赋予上述(i)中使用的微生物生产二肽能力的方法,例如可举以下的方法。
(a)编码具有合成二肽活性的蛋白质的DNA的制备
编码上述的具有合成二肽活性的蛋白质的DNA可以利用该DNA的碱基序列情报,通过以下所述方法获得。
例如,作为获得编码杆菌溶素合成酶的DNA的方法,使用根据序列编号26~32、64和65任一个表示的碱基序列设计的探针,对属于芽孢杆菌属的微生物的染色体DNA文库的Southern杂交法、或使用根据序列编号26~32、64和65任一个表示的碱基序列设计的引物DNA,以属于芽孢杆菌属的微生物的染色体DNA作为模板的PCR[PCRProtocols,Academic Press(1990)]等。
另外,对于各种基因序列数据库,对与编码序列编号19~25、33和68任一个所示的氨基酸序列的DNA碱基序列有65%以上、优选80%以上、更优选90%以上、再优选95%以上同源性的序列进行检索,通过该检索得到的碱基序列,利用上述方法由具有该碱基序列的生物的染色体DNA、cDNA文库等也可以获得编码具有合成二肽活性的蛋白质的DNA。
取得的DNA可以直接、或用适当的限制性内切酶等切断后,通过常用方法转运到载体,获得重组体DNA,由将该重组体DNA导入大肠杆菌得到的转化体提取质粒DNA,通过通常使用的碱基序列解析方法、例如双脱氧法[Proc.Natl.Acad.Sci.,USA,
74,5463(1977)]或373A·DNA测序仪(Perkin-Elmer公司制)等碱基序列分析仪器进行分析,可以决定该DNA的碱基序列。
当决定碱基序列的结果获得的DNA是部分长度时,通过使用该部分长度DNA作为探针的对染色体DNA文库的Southern杂交法,可以获得全长DNA。
另外,根据决定的DNA的碱基序列,使用PerSeptive Biosystems公司制8905型DNA合成仪器等,通过化学合成也可以制备目的DNA。
作为像上述那样获得的DNA,例如可举具有序列26~32、64和65表示的碱基序列的DNA。
作为转运了该DNA的载体,如pBluescript II KS(+)(Stratagene公司制)、pDIRECT[Nucleic Acids Res.,
18,6069(1990)]、pCR-ScriptAmp SK(+)(Stratagene公司制)、pT7Blue(Novagen公司制)、pCR II(Invitrogen公司制)和pCR-TRAP(Genhunter公司制)等。
作为大肠杆菌,例如可举大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌MC1000、大肠杆菌KY3276、大肠杆菌W1485、大肠杆菌JM101、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、大肠杆菌ME8415等。
作为重组体DNA的导入方法,只要是向上述宿主细胞导入DNA的方法可以使用任一种方法,例如使用钙离子的方法[Proc.Natl.Acad.Sci.,USA,
69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res.,
16,6127(1988)]等。
作为保有通过上述方法得到的编码具有二肽合成活性的蛋白质的DNA的微生物,如下面叙述的保有含具有序列编号19表示的序列的DNA的重组体DNA的微生物大肠杆菌NM522/pPE43。
(b)具有二肽合成活性的蛋白质的生产
具有二肽合成活性的蛋白质使用分子克隆第2版、CurrentProtocols in Molecular Biology等所述的方法等,可以通过例如以下的方法,使利用上述(a)方法得到的DNA在宿主细胞中表达、生产。
以利用上述(a)方法得到的DNA作为基础,根据需要,制备含有编码具有二肽合成活性的蛋白质部分的适当长度的DNA片段。另外、通过将编码该蛋白质的部分碱基序列按照变成最适合宿主表达的密码子那样进行碱基置换,可以使该蛋白质的产率提高。
通过将该DNA片段插入到适当表达载体的启动子的下游,制作重组体DNA。
通过将该重组体DNA导入到适合该表达载体的宿主细胞,可以得到生产具有二肽合成活性的蛋白质的转化体。
作为宿主细胞,细菌和酵母等,只要是可以表达目的基因的微生物都可以使用。
作为表达载体,可以使用可在上述宿主细胞自我复制或可转运到染色体中,在可转录编码具有二肽合成活性的蛋白质的DNA的位置含有启动子的载体。
使用细菌等原核生物作为宿主细胞时,具有编码具有二肽合成活性的蛋白质的DNA的重组体DNA最好是在原核生物中可自我复制的同时,由启动子、核糖体结合序列、编码具有二肽合成活性的蛋白质的DNA转录终止序列构成的重组体DNA。也可以含有控制启动子的基因。
作为表达载体,例如pBTrp2、pBTac1、pBTac2(都是BoehringerMannheim公司制)、pHelix1(Roche Diagnostics公司制)、pKK233-2(Amersham Pharmacia Biotech公司制)、pSE280(Invitrogen公司制)、pGEMEX-1(Promega公司制)、pQE-8(Qiagen公司制)、pET-3(Novagen公司制)、pKYP10(特开昭58-110600)、pKYP200[Agric.Biol.Chem.,
48,669(1984)]、pLSA1[Agric.Biol.Chem.,
53,277(1989)]、pGEL1[Proc.Natl.Acad.Sci.,USA,
82,4306(1985)]、pBluescript II SK(+)、pBluescript II KS(-)(Stratagene公司制)、pTrS30[由大肠杆菌JM109/pTrS30(FERM BP-5407)制备]、pTrS32[由大肠杆菌JM109/pTrS32(FERM BP-5408)制备]、pPAC31(WO98/12343)、pUC19[Gene,
33,103(1985)]、pSTV28(宝酒造公司制)、pUC118(宝酒造公司制)、pPA1(特开昭63-233798)等。
作为启动子,只要是在大肠杆菌等宿主细胞中可发挥作用的,无论什么样的启动子都可以。例如可例举
trp启动子(P trp )、
lac启动子(P lac )、PL启动子、PR启动子、PSE启动子等来自大肠杆菌和噬菌体等的启动子、SPO1启动子、SPO2启动子、penP启动子等。也可以使用使两个Ptrp串联(直列)的启动子、
tac启动子、lacT7启动子、let I启动子那样人为设计改变的启动子等。
作为启动子,也可以使用用于在芽孢杆菌属细菌中表达的xylA启动子[Appl.Microbiol.Biotechnol.,
35,594-599(1991)]和用于在棒杆菌属细菌中表达的P54-6启动子[Appl.Microbiol.Biotechnol.,
53,674-679(2000)]等。
使用将作为核糖体结合序列的S-D(Shine-Dalgarno)序列与起始密码子的间距调节到适当距离(例如6~18核酸)的质粒最好。
在使编码具有二肽合成活性的蛋白质的DNA结合于表达载体的重组体DNA中,不一定需要转录终止序列,但最好是紧接在结构基因的下面配置终止序列。
作为这样的重组体DNA,例如下面提到的pPE43。
作为宿主细胞使用的原核生物,如使用埃希氏菌属、芽孢杆菌属、或棒杆菌属等的微生物、例如大肠杆菌XL1-Blue、大肠杆菌XL2-Blue、大肠杆菌DH1、大肠杆菌DH5α、大肠杆菌MC1000、大肠杆菌KY3276、大肠杆菌W1485、大肠杆菌JM101、大肠杆菌JM109、大肠杆菌HB101、大肠杆菌No.49、大肠杆菌W3110、大肠杆菌NY49、大肠杆菌MP347、大肠杆菌NM522、枯草芽孢杆菌ATCC33712、巨大芽孢杆菌(
Bacillus
megaterium)、球形芽孢杆菌(
Bacillus sp.)FERM BP-6030、解淀粉芽孢杆菌(
Bacillus
amyloliquefaciens)、凝结芽孢杆菌(
Bacillus
coagulans)、地衣芽孢杆菌(
Bacillus licheniformis)、短小芽孢杆菌(
Bacillus
pumilus)、谷氨酸棒杆菌ATCC13032、谷氨酸棒杆菌ATCC14297等。
作为导入重组体DNA的方法,只要是向上述宿主细胞导入DNA的方法,可以使用任一个方法,例如使用钙离子的方法[Proc.Natl.Acad.Sci.,USA,
69,2110(1972)]、原生质体法(特开昭63-248394)、电穿孔法[Nucleic Acids Res.,
16,6127(1988)]等。
作为宿主细胞使用属于酵母属的菌株时,作为表达载体,例如可以使用YEp13(ATCC37115)、YEp24(ATCC37051)、YCp50(ATCC37419)、pHS19、pHS15等。
作为启动子,只要是在属于酵母属的菌株中发挥作用的,可以使用任一个,例如PHO5启动子、PGK启动子、GAP启动子、ADH启动子、gal 1启动子、gal 10启动子、热休克多肽启动子、MFα1启动子、CUP 1启动子等启动子。
作为宿主细胞,如属于酵母属等的菌株,具体来说,如酿酒酵母等。
作为重组体DNA的导入方法,只要是可向酵母导入DNA的方法都可以使用,例如电穿孔法[Methods Enzymol.,
194,182(1990)]、spheroplast法[Proc.Natl.Acad.Sci.,USA,
81,4889(1984)]、醋酸锂法[J.Bacteriol.,
153,163(1983)]等。
(2)使具有生产二肽能力的微生物的a)1个以上肽酶和1个以上肽转运系蛋白质、或b)3个以上肽酶的功能降低或丧失的方法
由于通过使用任意微生物作为宿主细胞,实施上述(1)中(ii)的方法,可以制造具有生产二肽能力的微生物,通过使用该微生物,实施上述(1)中(i)的方法,可以制造作为1个以上肽酶和1个以上的肽转运系蛋白质、或3个以上的肽酶的功能降低或丧失的微生物,而且具有生产二肽能力的微生物。
另外,作为本来的性质具有生产二肽能力的微生物,通过对该微生物实施上述(1)中(i)的方法,可以制造本发明的微生物。
作为上述微生物,如属于埃希氏菌属、芽孢杆菌属、棒杆菌属或酵母属的微生物等,更优选大肠杆菌、枯草芽孢杆菌、谷氨酸棒杆菌和酿酒酵母等。
3.本发明制造二肽的方法
作为本发明的制造方法,如
(i)使用本发明的微生物的培养物或培养物的处理物作为酶源,使该酶源和1种以上的氨基酸在水性介质中存在,使二肽生成、蓄积在该介质中,由该介质回收该二肽来制造该二肽的方法、
(ii)使用本发明的微生物的培养物或培养物的处理物作为酶源,使该酶源、L-氨基酸酯和L-氨基酸在水性介质中存在,使二肽生成、蓄积在该介质中,由该介质回收该二肽来制造该二肽的方法,和
(iii)使用本发明的微生物的培养物或培养物的处理物作为酶源,使该酶源、L-氨基酸酰胺和L-氨基酸在水性介质中存在,使二肽生成、蓄积在该介质中,由该介质回收该二肽来制造该二肽的方法等。
在上述(i)的制造方法中,作为可用作底物的1种以上的氨基酸、优选1种或2种的氨基酸,如氨基酸、优选是选自L-氨基酸、甘氨酸(Gly)和β-丙氨酸(βAla)中的氨基酸,也可以将选出的任意的氨基酸进行任意组合后使用。作为L-氨基酸,例如L-丙氨酸(L-Ala)、L-谷氨酰胺(L-Gln)、L-谷氨酸(L-Glu)、L-缬氨酸(L-Val)、L-亮氨酸(L-Leu)、L-异亮氨酸(L-Ile)、L-脯氨酸(L-Pro)、L-苯丙氨酸(L-Phe)、L-色氨酸(L-Trp)、L-蛋氨酸(L-Met)、L-丝氨酸(L-Ser)、L-苏氨酸(L-Thr)、L-半胱氨酸(L-Cys)、L-天冬酰胺(L-Asn)、L-酪氨酸(L-Tyr)、L-赖氨酸(L-Lys)、L-精氨酸(L-Ar g)、L-组氨酸(L-His)、L-天冬氨酸(L-Asp)、L-α-氨基丁酸(L-α-AB)、L-偶氮丝氨酸(L-Azaserine)、L-茶氨酸(L-theanine)、L-4-羟基脯氨酸(L-4-HYP)、L-3-羟基脯氨酸(L-3-HYP)、L-鸟氨酸(L-Orn)、L-瓜氨酸(L-Cit)和L-6-重氮-5-氧-正亮氨酸(L-6-diazo-5-oxo-norleucine)等。
作为可在上述(i)的制造方法使用的更优选的氨基酸,如从L-Ala、Gly、L-Met、L-Ser、L-Thr和β-Ala中选出的1种氨基酸与从L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-Azaserine、L-theanine、L-4-HYP、L-3-HYP、L-Orn、L-Cit和L-6-diazo-5-oxo-norleucine中选出的1种氨基酸的组合,L-Gln与L-Phe的组合,和L-α-AB与L-Gln、L-Arg或L-α-AB的组合、最好是L-Ala与从L-Ala、L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-Azaserine、L-Cit和L-theanine选出的1种氨基酸的组合、Gly与从L-Gln、Gly、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg、L-α-AB和L-Cit选出的1种氨基酸的组合、L-Met与从L-Phe、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys和L-His中选出的1种氨基酸的组合、L-Ser与从L-Gln、L-Phe、L-Ser、L-Thr、L-Tyr、L-His和L-α-AB中选出的1种氨基酸的组合、L-Thr与从L-Gln、L-Phe、L-Leu、L-Thr和L-α-AB中选出的1种氨基酸的组合中选出的1种氨基酸的组合、和L-α-AB与L-Gln、L-Arg或L-α-AB的组合。
在上述(i)的制造方法中,作为底物使用的氨基酸按照终浓度为0.1~500g/L、优选为0.2~200g/L浓度那样开始或反应过程中添加到水性介质中。
作为用上述(i)的制造方法制造的二肽,如下式(I)表示的二肽:
R1-R2 (I)
(式中、R1和R2表示相同或不同的氨基酸)
优选上述式(I)中R1和R2相同或不同,是从L-Ala、L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-Azaserine、L-theanine、L-4-HYP、L-3-HYP、L-Orn和L-6-diazo-5-oxo-norleucine选出的氨基酸的二肽,更优选R1为L-Ala、Gly、L-Met、L-Ser、L-Thr或β-Ala时,R2为L-Gln、L-Glu、Gly、L-Val、L-Leu、L-Ile、L-Pro、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-Asp、L-α-AB、β-Ala、L-Azaserine、L-theanine、L-4-HYP、L-3-HYP、L-Orn或L-6-diazo-5-oxo-norleucine的二肽,再优选R1为L-Ala时、R2是L-Gln、Gly、L-Val、L-Leu、L-Ile、L-Phe、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Asn、L-Tyr、L-Lys、L-Arg、L-His、L-α-AB、L-Azaserine或L-theanine的二肽、R1为Gly时,R2是L-Gln、Gly、L-Trp、L-Met、L-Ser、L-Thr、L-Cys、L-Tyr、L-Lys、L-Arg或L-α-AB的二肽、R1为L-Met时、R2是L-Phe、L-Met、L-Cys、L-Tyr、L-Lys或L-His的二肽,R1为L-Ser时、R2是L-Gln、Gly、L-Phe、L-Met、L-Ser、L-Thr、L-Tyr、L-His或L-α-AB的二肽,R1为L-Thr时、R2是L-Gln、L-Gly、L-Phe、L-Met、L-Ser、L-Thr或L-α-AB的二肽,R1为L-Gln时、R2是L-Phe或L-α-AB的二肽,R1为L-Phe时、R2是L-Gln的二肽、R1为L-Trp时,R2是Gly的二肽,R1为L-Cys时、R2是L-Ala、L-Gln、Gly、或L-Met的二肽、R1为L-Lys时,R2是L-Ala、Gly或L-Met的二肽,R1为L-Arg时、R2是L-α-AB的二肽、R1为L-His时、R2是L-Met的二肽、和R1为L-α-AB时、R2是L-Ala、L-Gln、Gly、L-Ser、L-Thr、L-Arg或L-α-AB的二肽。
另外,在上述制造方法中,根据需要,作为ATP的供给源可以将本发明微生物代谢可生产ATP的化合物、例如象葡萄糖那样的糖类、象乙醇那样的醇类、象醋酸那样的有机酸类等加到水性介质中。
在上述(ii)的制造方法中,作为可用作底物的L-氨基酸酯和L-氨基酸,只要是本发明的微生物可用作底物,生成二肽的L-氨基酸酯和L-氨基酸,可以使用任意的L-氨基酸酯与L-氨基酸任意组合,优选L-氨基酸酯为从L-丙氨酸酯、甘氨酸酯、L-缬氨酸酯、L-异亮氨酸酯、L-蛋氨酸酯、L-苯丙氨酸酯、L-丝氨酸酯、L-苏氨酸酯、L-谷氨酰胺酯、L-酪氨酸酯、L-精氨酸酯、L-天冬氨酸-α-酯、L-天冬氨酸-β-酯、L-亮氨酸酯、L-天冬酰胺酯、L-赖氨酸酯、L-天冬氨酸-α,β-二甲基酯和L-谷氨酰胺-γ-酯选出的L-氨基酸酯,而L-氨基酸是从L-Gln、L-Asn、Gly、L-Ala、L-Leu、L-Met、L-Pro、L-Phe、L-Trp、L-Ser、L-Thr、L-Tyr、L-Lys、L-Arg、L-His和L-Glu选出的L-氨基酸。
在上述(ii)的制造方法中,作为底物使用的L-氨基酸酯和L-氨基酸按照终浓度0.1~500g/L、优选0.2~200g/L浓度那样开始或在反应过程中添加到水性介质中。
在上述(iii)的制造方法,作为底物使用的L-氨基酸酰胺和L-氨基酸,只要是本发明的微生物可用作底物,生成二肽的L-氨基酸酰胺和L-氨基酸,可以使用任意的L-氨基酸酰胺与L-氨基酸任意组合,优选L-氨基酸酰胺是从L-丙氨酸酰胺、甘氨酸酰胺和L-天冬氨酸酰胺选出的L-氨基酸酰胺,L-氨基酸是从L-Gln、L-Asn、Gly、L-Ala、L-Val、L-Leu、L-Ile、L-Met、L-Pro、L-Phe、L-Trp、L-Ser、L-Thr、L-Tyr、L-Lys、L-Arg、L-His和L-Glu选出的L-氨基酸。
在上述(iii)的制造方法中,作为底物使用的L-氨基酸酰胺和L-氨基酸按照终浓度0.1~500g/L、优选0.2~200g/L浓度那样开始或在反应过程中添加到水性介质中。
作为在本发明的制造方法中使用的水性介质,只要是不抑制二肽的生成反应,可以是任何成分、组成的水性介质,例如水、磷酸盐、碳酸盐、醋酸盐、硼酸盐、柠檬酸盐、Tris等缓冲液等。另外也可以含有甲醇、乙醇等醇类、乙酸乙酯等酯类、丙酮等酮类、乙酰胺等酰胺类。
二肽的生成反应在水性介质中、于pH5~11、优选pH6~10、20~60℃、更优选25~45℃的条件下进行2~150小时、优选6~120小时。
另外,根据需要,在水性介质中也可以添加表面活性剂或有机溶剂。
作为表面活性剂,聚氧乙烯十八烷基胺(例如Nymeen S-215、日本油脂公司制)等非离子表面活性剂、十六烷基三甲溴化铵和烷基二甲基苄基氯化铵(例如阳离子F2-40E、日本油脂公司制)等阳离子系表面活性剂、月桂酰肌氨酸等阴离子系表面活性剂、烷基二甲基胺(例如叔胺FB、日本油脂公司制)等叔胺类等只要是促进二肽生成的都可以,可以1种或将数种混合后使用。表面活性剂通常使用0.1~50g/l浓度。作为有机溶剂,如二甲苯、甲苯、脂肪族醇、丙酮、乙酸乙酯等,通常使用0.1~50ml/l的浓度。
作为培养物的处理物,如培养物的浓缩物、培养物的干燥物、培养物经离心分离得到的菌体、该菌体的干燥物、该菌体的冷冻干燥物、该菌体的表面活性剂处理物、该菌体的超声波处理物、该菌体的机械磨碎处理物、该菌体的溶剂处理物、该菌体的酶处理物、和该菌体的固定化物等。另外,在本发明的培养物的处理物中也包括从对上述菌体进行表面活性剂处理、超声波处理、机械磨碎处理、溶剂处理或酶处理等得到的处理物除去不溶物等得到的蛋白质的粗提取物。
当使用培养物或该培养物的处理物作为酶源时,该酶源的量由于该酶源的比活性等不同而不同,例如作为底物的氨基酸、每1mgL-氨基酸酯或L-氨基酸酰胺添加5~1000mg、优选10~400mg。
在水性介质中生成、蓄积的二肽的采取可以通过使用活性碳或离子交换树脂等通常的方法或通过利用有机溶剂的萃取、结晶、薄层层析、高效液相层析等进行。
此外,上述(ii)和(iii)的制造方法可以根据WO 03/010189或WO03/010187的记载进行。
以下给出了本发明的实验例。
实验例1 来自枯草芽孢杆菌的
ywfE基因表达质粒的构建象以下所述取得枯草芽孢杆菌的
ywfE基因片段。
使用PerSeptive Biosystems公司制8905型DNA合成仪,合成具有序列编号35和序列编号36表示的碱基序列的DNA(以下分别称为引物A、引物B)。引物A是含有将
ywfE基因的起始密码子(atg)置换为
NcoI识别序列(cc
atgg)的区域的碱基序列。引物B是含有将ywfE的终止密码子置换为
BamHI识别序列(
ggatcc)的区域的碱基序列。
以枯草芽孢杆菌的染色体DNA作为模板,使用上述引物A和引物B作为引物组,进行PCR。制备含有0.1μg染色体DNA、0.5μmol/L各引物、2.5units的
Pfu DNA聚合酶、4μL
Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,通过反复进行30次94℃1分钟、55℃2分钟、72℃3分钟的循环步骤来进行PCR。
就该反应液的1/10量进行琼脂糖凝胶电泳,确认相当于
ywfE基因片段的约1.4kb的片段扩增后,添加与余下的反应液等量的TE饱和苯酚/氯仿溶液,并混合。将该混合液离心分离后、向得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。该溶液经离心分离得到DNA的沉淀。将该DNA沉淀溶解于20μL的TE中。
使用5μL该溶解液,将扩增的DNA用限制性内切酶
NcoI和
BamHI切断,通过琼脂糖凝胶电泳分离DNA片段后,利用GENECLEAN II Kit(BIO 101公司制)回收含有
ywfE基因的1.4kb的DNA片段。
将C末端His-tag标记的附加型重组体表达载体pQE60(Qiagen公司制)0.2μg用限制性内切酶
NcoI和
BamHI切断后,通过琼脂糖凝胶电泳分离DNA片段,通过与上述同样的方法回收3.4kb的DNA片段。
使用连接试剂盒(宝酒造公司制)使上述得到的含有
ywfE基因的1.4kb DNA片段与3.4kb DNA片段,于16℃下反应16小时,进行连接。
使用该连接反应液通过使用钙离子的方法〔Proc.Natl.Acad.Sci.,USA,
69,2110(1972)〕转化大肠杆菌NM522株(Stratagene公司制),将该转化体涂布在含有50μg/mL氨苄青霉素的LB琼脂培养基后,于30℃下培养过夜。
根据众所周知的方法从能够繁殖的转化体的菌落提取质粒,得到C末端His-tag标记的附加型
ywfE基因表达载体pQE60ywfE。通过限制性内切酶消化确认了该载体的结构(图1)。
实验例2
ywfE基因产物的取得
将保有pQE60ywfE的大肠杆菌NM522/pQE60ywfE株接种到加入了含有50μg/ml的氨苄青霉素的8ml LB培养基的粗试管,于28℃下培养17小时。将该培养液接种在加入了含有50μg/ml氨苄青霉素的50ml LB培养基的250ml容量三角烧瓶中,于30℃下3培养小时后,按照终浓度达到1mmol/L那样添加异丙基硫代-β-D-半乳糖苷(IPTG),再于30℃下培养4小时。将该培养液离心分离,取得湿菌体。使用HisTrap(His-tag标记的附加蛋白质纯化试剂盒、AmershamPharmasia Biotech公司制),根据说明书从该湿菌体纯化附加His-tag标记的重组型酶。
实验例3 使用His-tag标记的附加重组型酶生产二肽(1)
(i)制备由实验例2取得的纯化的His-tag标记的附加重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L氯化镁、60mmol/L的ATP、30mmol/L的L-Ala、30mmol/L的L-Gln组成的反应液0.1ml,于37℃反应16小时。反应结束后,将反应生成物用二硝基苯酚化法衍生物化后,通过HPLC法进行分析。利用HPLC法的分析,分离柱使用关东化学公司制的Lichrosorb-RP-18柱,作为洗脱液使用1%(v/v)磷酸、25%(v/v)乙腈,以0.7mL/分钟的流速进行分析。确认反应液中3.7g/L的L-Ala-L-Gln和0.3g/L的L-丙氨酰-L-丙氨酸(L-Ala-L-Ala)生成、蓄积。
(ii)除了酶取0.01mg、取代L-Gln含有L-Phe、L-Met、L-Leu或L-Val以外,制备与上述(i)反应液的组成相同的反应液,在上述(i)的反应条件下反应。
反应结束后,通过与上述(i)同样分方法分析反应生成物,确认反应液中分别有单独7.0g/L的L-丙氨酰-L-苯丙氨酸(L-Ala-L-Phe);7.0g/L的L-丙氨酰-L-蛋氨酸(L-Ala-L-Met)和0.03g/L的L-Ala-L-Ala;5.0g/L的L-丙氨酰-L-亮氨酸(L-Ala-L-Leu)和0.2g/L的L-Ala-L-Ala;或1.6g/L的L-丙氨酰-L-缬氨酸(L-Ala-L-Val)和0.3g/L的L-Ala-L-Ala生成、蓄积。
(iii)除了酶取0.01mg、取代L-Ala含有Gly、取代L-Gln含有L-Phe或L-Met以外,制备与上述(i)反应液的组成相同的反应液,在上述(i)的反应条件下反应。
反应结束后,通过与上述(i)同样的方法分析反应生成物,确认反应液中各有5.2g/L的甘氨酰-L-苯丙氨酸(Gly-L-Phe)或1.1g/L的甘氨酰-L-蛋氨酸(Gly-L-Met)生成、蓄积。
如果从上述反应液组成除去ATP,二肽完全不能生成。
以上结果表明
ywfE基因产物在ATP存在下,具有由L-Ala和L-Gln、L-Phe、L-Met、L-Leu或L-Val,生成L-Ala-L-Gln和L-Ala-L-Ala、L-Ala-L-Phe、L-Ala-L-Met和L-Ala-L-Ala、L-Ala-L-Leu和L-Ala-L-Ala、或L-Ala-L-Val和L-Ala-L-Ala的活性;由Gly和L-Phe或L-Met生成Gly-L-Phe或Gly-L-Met的活性。
实验例4 使用附加His-tag标记的重组型酶的二肽的生产(2)
制备由实验例2中得到的纯化的附加His-tag标记的重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP组成的0.1ml反应液,向反应液中按照终浓度30mmol/L那样添加由表1的第1行与最左列的氨基酸组合构成的各种L-氨基酸、Gly或β-Ala,于37℃下反应16小时。反应结束后、对反应生成物进行HPLC分析,确认生成了表1所示的二肽。
表1-1
表1-2
表1-3
表内给出了当将表1的第1行与最左列的2种(或1种)L-氨基酸、Gly或β-Ala作为底物进行反应时生成的二肽。○表示生成二肽,但序列未确定,×表示不能确认二肽的生成,和空栏表示未实施。
实验例5 使用附加His-tag标记的重组型酶表达株的二肽的生产
将实验例1中得到的大肠杆菌NM522/pQE60ywfE株接种到加入了含有50μg/ml氨苄青霉素的8ml LB培养基的粗型试管中,于28℃下培养17小时。将该培养液接种到加入了含有50μg/ml氨苄青霉素的50ml LB培养基的250ml容量三角烧瓶,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。将该培养液离心分离,取得湿菌体。
将由200g/L的湿菌体、50g/L葡萄糖、5g/L植酸(用33%浓氢氧化钠溶液稀释成中性)、15g/L的磷酸二氢钾、5g/L硫酸镁·七水合物、4g/L Nymeen S-215、10ml/L二甲苯、200mmol/L的L-Ala、200mmol/L的L-Gln组成的20ml反应液(pH7.2)加入到50ml容量的烧杯中,于32℃、900rpm的条件下进行2小时反应。反应中使用2mol/L的氢氧化钾将反应液的pH保持在7.2。
当用与实验例3所述方法同样的方法分析反应生成物时,确认25mg/L的L-Ala-L-Gln蓄积。
实验例6 从属于芽孢杆菌属的各种微生物克隆和解析相当于
ywfE基因的基因
根据序列编号26表示的碱基序列,象以下所述取得存在于枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、淀粉液化芽孢杆菌IFO3022、和短小芽孢杆菌NRRLB-12025的相当于
ywfE基因的基因。
首先,将枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、解淀粉芽孢杆菌IFO3022、和短小芽孢杆菌NRRL B-12025分别接种在LB培养基,于30℃下静置培养过夜。培养后通过使用Current Protocols in Molecular Biology所述的饱和苯酚的方法,分别分离纯化该微生物的染色体DNA。
使用PerSeptive Biosystems公司制8905型DNA合成仪,合成具有序列编号37和编号38表示的碱基序列的DNA(以下分别称为引物C、引物D)。引物C是包括从枯草芽孢杆菌168株的染色体DNA的
ywfE基因的起始密码子开始的上游区域的序列。引物D是与包括从ywfE基因的终止密码子开始的下游序列互补的序列。
以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、或解淀粉芽孢杆菌IFO3022的染色体DNA作为模板,作为引物组使用上述引物C和引物D进行PCR。通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的
Pfu DNA聚合酶、4μL的
Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,反复进行30次94℃1分钟、55℃2分钟、72℃3分钟的循环步骤进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认相当于
ywfE基因片段的约1.4kb的片段扩增后,添加与余下反应液等量的TE饱和苯酚/氯仿溶液,并混合。向将该溶液离心分离得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液经离心分离得到的DNA沉淀溶解于20μL的TE中。
使用连接试剂盒,对上述得到的来自各菌株染色体DNA的1.4kb片段与pCR-blunt(Invitrogen公司制)在16℃反应16小时,进行连接。
使用该反应液通过使用钙离子的方法转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过众所周知的方法从繁殖的转化体的菌落提取质粒,使用限制性内切酶解析各个结构,确认取得了含有相当于
ywfE基因的基因的质粒pYWFE1(来自ATCC15245株,具有序列编号65表示的碱基序列的DNA)、pYWFE2(来自ATCC6633株,具有序列编号27表示的碱基序列的DNA)、pYWFE3(来自IAM1213株,具有序列编号28表示的碱基序列的DNA)、pYWFE4(来自IAM1107株,具有序列编号29表示的碱基序列的DNA)、pYWFE5(来自IAM1214株,具有序列编号30表示的碱基序列的DNA)、pYWFE6(来自ATCC9466株,具有序列编号26表示的碱基序列的DNA)、pYWFE7(来自IAM1033株,具有序列编号65表示的碱基序列的DNA)、pYWFE8(来自ATCC21555株,具有序列编号31表示的碱基序列的DNA)、pYWFE9(来自IFO3022株,具有序列编号32表示的碱基序列的DNA)。
另外,来自短小芽孢杆菌NRRL B-12025相当于
ywfE基因的基因(具有序列编号64表示的碱基序列的DNA)象以下所述取得。
以上述制备的NRRL B-12025株的染色体DNA作为模板,作为引物组使用由序列编号66和67表示的碱基序列组成的DNA,进行PCR。通过制备含有0.1μg的染色体DNA、0.5μmol/L的各引物、2.5units的Z-taq聚合酶(Takara Bio公司制)、5μL的Z-taq聚合酶用×10缓冲液(Takara Bio公司制)、200μmol/L的各dNTP的反应液50μL,反复进行30次98℃5秒钟、55℃30秒钟、72℃1分钟的循环步骤进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约0.8kb的片段扩增后,添加与余下反应液等量的TE饱和苯酚/氯仿溶液,并混合。向将该溶液离心分离得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液经离心分离得到的DNA沉淀溶解于20μL的TE中。
使用连接试剂盒,对上述得到的来自各菌株染色体DNA的0.8kb片段和pGEM T-easy(Promega公司制)在16℃反应16小时,进行连接。
使用该反应液通过使用钙离子的方法转化大肠杆菌DH5α株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
从上述得到的转化体提取质粒,当决定约0.8kb的插入DNA片段的碱基序列时,确认了由序列编号64表示的碱基序列中的358~1160碱基构成的碱基序列。
然后将该质粒用
EcoRI切断后,通过琼脂糖凝胶电泳分离DNA片段。使用GENECLEAN II Kit纯化该DNA片段。将约0.5μg的该纯化DNA片段用DIG-High Prime DNA Labeling & Detection Starter KitI(Roche Diagnostics公司制)进行DIG标记。DIG标记按照该试剂盒附带的说明书进行。
使用上述得到的DIG标记的DNA,进行NRRL B-12025株的染色体DNA的Southern解析。
分别使用
BamHI、
EcoRI、
HindIII、
KpnI、
PstI、
SacI、
SalI和SphI将NRRL B-12025株的染色体DNA完全消化,通过琼脂糖电泳分离DNA片段后,按照常规方法,转移到nylon membrane plus charge(Roche Diagnostics公司制)上。
通过照射UV,将DNA片段固定在该尼龙膜后,使用上述探针DNA和该尼龙膜进行Southern杂交。
使该探针DNA和该尼龙膜在65℃下接触16小时,然后将该尼龙膜用由0.1%SDS和2×SSC组成的溶液在室温下5分钟、洗2次,再使用由0.1%SDS和0.5×SSC组成的溶液,于65℃下15分钟、洗2次来进行杂交,其它的操作、条件和杂交的DNA的检测按照上述的DIG-High Prime DNA Labeling & Detection Starter Kit I附带的说明书进行。
其结果在
HindIII和
PstI的完全消化片段的3.5kbp附近看到发色。
然后,分别使用
HindIII和
PstI将NRRL B-12025株的染色体DNA完全消化,通过琼脂糖凝胶电泳分离DNA片段。使用GENECLEAN IIKit从各个限制性内切酶消化DNA纯化3-4kbp片段,使用连接试剂盒,使其自环化。
根据上述决定的0.8kb DNA片段的碱基序列,设计、合成序列编号71和72表示的碱基序列,使用上述取得的环化DNA作为模板进行PCR。通过制备含有10ng环化DNA、0.5μmol/L的各引物、2.5units的pyrobest聚合酶(Takara Bio公司制)、5μL的pyrobest聚合酶用×10缓冲液(Takara Bio公司制)、200μmol/L的各dNTP的反应液50μL,反复进行30次98℃5秒钟、55℃30秒钟、72℃3分30秒钟的循环步骤进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认约3.0kb的片段扩增确认后,添加与余下的反应液等量的TE饱和苯酚/氯仿溶液,并混合。向将该混合液离心分离得到的上层加2倍容量的冷乙醇,并进行混合,于-80℃下放置30分钟。将该溶液经离心分离得到的DNA沉淀溶解于20μL的TE中。
使用连接试剂盒对上述得到的DNA片段和Zero Blunt PCRCloning Kit(Invitrogen公司制)进行连接。
使用该反应液通过使用钙离子的方法转化大肠杆菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基,于30℃下培养过夜。
通过众所周知的方法从繁殖的转化体的菌落提取质粒,通过使用限制性内切酶解析其结构,确认得到了含有相当于
ywfE基因的基因的质粒pYWFE10(来自NRRL B-12025株,含有序列编号64表示的碱基序列的DNA)。
使用碱基序列分析仪器373A·DNA测序仪决定相当于上述得到的pYWFE1~pYWFE10中含有的
ywfE基因的各基因的碱基序列。
由pYWFE1、pYWFE6和pYWFE7含有的基因编码的蛋白质的氨基酸序列与
ywfE基因编码的蛋白质的氨基酸序列相同,由pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9和pYWFE10含有的基因编码的蛋白质的氨基酸序列与
ywfE基因编码的蛋白质的氨基酸序列不同。
序列编号20~25、68和19分别表示pYWFE2、pYWFE3、pYWFE4、pYWFE5、pYWFE8、pYWFE9、pYWFE10、以及pYWFE1和pYWFE7含有相当于
ywfE基因的基因编码的蛋白质的氨基酸序列,序列27~32、65和26分别表示该基因的碱基序列。
实验例7 C末端附加His-tag标记的重组型二肽合成酶的纯化
以枯草芽孢杆菌ATCC15245、ATCC6633、IAM1213、IAM1107、IAM1214、ATCC9466、IAM1033、ATCC21555、或解淀粉芽孢杆菌IFO3022的染色体DNA作为模板,用实验例1所述的引物A和引物B作为引物组进行PCR。通过制备含有0.1μg染色体DNA、0.5μmol/L的各引物、2.5units的
Pfu DNA聚合酶、4μL的
Pfu DNA聚合酶用×10缓冲液、200μmol/L的各dNTP的反应液40μL,反复进行30次的94℃1分钟、55℃2分钟、72℃3分钟的循环步骤进行PCR。
当以短小芽孢杆菌NRRL B-12025的染色体DNA作为模板时,作为引物组使用具有序列编号69和70表示的碱基序列的DNA,在与上述同样的条件下进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认相当于
ywfE片段的约1.4kb的DNA片段分别扩增后,添加与余下反应液等量的TE饱和苯酚/氯仿溶液,并进行混合。将该混合液离心分离后,在得到的上层上加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离得到的DNA沉淀溶解于20μL的TE中。
将使用该溶解液各5μL扩增的DNA用限制性内切酶
NcoI和
BamHI切断,通过琼脂糖凝胶电泳分离DNA片段后,使用GENECLEAN II Kit,回收含有相当于
ywfE基因的基因的1.4kb的DNA片段。
然后将0.2μg的C末端His-tag标记的附加型重组体表达载体pQE60用限制性内切酶
NcoI和
BamHI切断后,通过琼脂糖凝胶电泳分离DNA片段,通过与上述同样的方法回收3.4kb的DNA片段。
使用连接试剂盒将上述得到的含有相当于枯草芽孢杆菌168株的
ywfE基因的基因的1.4kb的DNA片段和3.4kb的DNA片段,于16℃下进行16小时反应,对各个进行连接。通过使用钙离子的方法用该反应液转化大肠菌NM522株后,涂布于含有50μg/ml的氨苄青霉素的LB琼脂培养基上,于30℃下培养过夜。
按照众所周知的方法从能够繁殖的转化体的菌落提取质粒,通过使用限制性内切酶对它们的结构进行解析,确认取得了作为C末端His-tag标记的附加型基因表达载体的pQE60ywfE1(含有来自ATCC15245的基因的载体)、pQE60ywfE2(含有来自ATCC6633的基因的载体)、pQE60ywfE3(含有来自IAM1213的基因的载体)、pQE60ywfE4(含有来自IAM1107的基因的载体)、pQE60ywfE5(含有来自IAM1214的基因的载体)、pQE60ywfE6(含有来自ATCC9466的基因的载体)、pQE60ywfE7(含有来自IAM1033的基因的载体)、pQE60ywfE8(含有来自ATCC21555的基因的载体)、pQE60ywfE9(含有来自IFO3022的基因的载体)、和pQE60ywfE10(含有来自NRRL B-12025的基因的载体)。
将上述得到的大肠杆菌NM522/pQE60ywfE1~NM522/pQE60ywfE10株分别接种到加入了含有50μg/ml的苄青霉素的8ml LB培养基的试管,于28℃下培养17小时。将该培养液接种到加入了含有50μg/ml的氨苄青霉素的50ml LB培养基的250ml容量的三角烧瓶中,于30℃下培养3小时后,按照终浓度达到1mmol/L那样添加IPTG,再于30℃下培养4小时。从将该培养液离心分离后得到的湿菌体使用HisTrap,按照其使用说明书纯化His-tag标记的附加重组型酶。
实验例8 使用纯化酶生产二肽
制备由实验例7得到的重组型酶0.04mg、100mmol/L的Tris-HCl(pH8.0)、60mmol/L的氯化镁、60mmol/L的ATP、30mmol/L的L-Ala和30mmol/L的L-Gln构成的0.1ml反应液,于37℃下进行16小时反应。
反应结束后,通过实验例3所述方法对反应液进行分析,结果确认分别有3.0~3.5g/L的L-Ala-L-Gln和0.25~0.3g/L的L-Ala-L-Ala生成、蓄积。
另外,如果将ATP从上述反应液组成中除去,完全不能生成L-Ala-L-Gln和L-Ala-L-Ala。
以上结果表明实验例7得到的基因产物无论那一个都具有在ATP存在下由L-Ala和L-Gln生成L-Ala-L-Gln和L-Ala-L-Ala的活性。
实验例9 强化
ywfE基因表达的大肠菌的生成
使用PerSeptive Biosystems公司制8905型DNA合成仪,合成分别具有序列编号60~63表示的序列的DNA(以下分别称为引物E、引物F、引物G、引物H)。序列编号60的序列是在质粒pQE60ywfE的
ywfE的含有核糖体结合序列的Shine-Dalgarno序列区域5′附加了含有
XhoI识别序列的序列。序列编号61的序列是在与含有
ywfE的终止密码子的序列互补序列的5′附加含有
BamHI识别序列的序列。而序列编号62的序列是在含有
trp启动子的表达载体pTrS30的
trp启动子区域序列的5′端附加了含有
EcoRI识别序列的序列。序列编号63的序列是在与含有
trp启动子的表达载体pTrS30的
trp启动子区域序列互补的序列的5′附加了含有
XhoI识别序列的序列。
以质粒pQE60ywfE作为模板,在
ywfE片段的扩增中,作为引物组使用上述的引物E和引物F,在
trp启动子区域片段的扩增中作为引物组使用引物G和引物H进行PCR。通过制备含有10ng的pQE60ywfE、0.5μmol/l的各引物、2.5units的
Pfu DNA聚合酶、4μl的
Pfu DNA聚合酶用×10缓冲液、200μmol/l的各dNTP的40μl的反应液,反复进行30次94℃1分钟、55℃2分钟、72℃3分钟的循环步骤进行PCR。
将该反应液的1/10量进行琼脂糖凝胶电泳,确认在使用引物E和引物F的PCR中,相当于
ywfE基因片段的约1.4kb扩增,在使用引物G和引物H的反应中相当于
trp启动子区域的片段的约0.3kb片段扩增后,添加与余下的反应液等量的TE饱和苯酚/氯仿溶液,并混合。向将该溶液离心分离后得到的上层加2倍容量的冷乙醇,并混合,于-80℃下放置30分钟。将该溶液离心分离后得到的DNA溶解于20μl的TE中。
将使用上述得到的各DNA溶液5μl通过引物E和引物F扩增的DNA用限制性内切酶
XhoI和
BamHI切断,另外就将通过引物G和引物H扩增的DNA用限制性内切酶
EcoRI和
XhoI切断,通过琼脂糖凝胶电泳分离DNA片段后,通过GENECLEAN II Kit分别回收含有
ywfE基因的1.4kb和含有
trp启动子区域的0.3kb DNA片段。
将0.2μg的含有
trp启动子的表达载体pTrS30用限制性内切酶EcoRI和
BamHI切断后,通过琼脂糖凝胶电泳分离DNA片段,同样回收4.5kb的DNA片段。
使用连接试剂盒对上述得到的含有
ywfE基因的1.4kb片段、含有trp启动子区域的0.3kb片段以及4.5kb片段于16℃下进行16小时连接反应。
使用该反应液按照使用钙离子的方法转化大肠菌NM522株,将该转化体涂布于含有氨苄青霉素50μg/ml的LB琼脂培养基后,于30℃下培养过夜。
按照众所周知的方法从繁殖的转化体的菌落提取质粒,得到在trp启动子下游含有
ywfE因的表达载体pPE56。将该载体的结构通过限制性内切酶消化进行了确认(图2)。
附图说明
第1图是表示His-tag标记的附加型
ywfE基因表达载体pQE60ywfE的构建过程的图。
第2图是表示
ywfE基因表达强化型载体pPE56的构建过程的图。
各图中符号的意思如下。
P
T5;T5启动子
P
trp;色氨酸启动子
具体实施方式
以下给出本发明的实施例,但本发明的范围并不受下面实施例限制。
实施例1
pepD基因、
pepN基因、
pepB基因、
pepA因和
dpp操纵子缺失株的制作
大肠杆菌染色体DNA上的特定基因缺失的菌株根据利用λ噬菌体的同源重组系的方法[Proc.Natl.Acad.Sci.USA,
97,6641-6645(2000)]制作。
以下所述的质粒pKD46、pKD3和pCP20使用从大肠杆菌基因贮存中心(美国Yale大学)获得保持该质粒的大肠杆菌株,从该大肠菌提取的质粒。
(1)基因缺失用DNA片段的克隆
为了使存在于大肠杆菌K12株染色体DNA上的具有序列编号10表示的碱基序列的
pepD基因、具有序列编号11表示的碱基序列的pepN基因、具有序列编号12表示的碱基序列的
pepB基因、具有序列编号13表示的碱基序列的
pepA基因和具有序列编号14表示的碱基序列的
dppA基因、具有序列编号15表示的碱基序列的
dppB基因、具有序列编号16表示的碱基序列的
dppC基因、具有序列编号17表示的碱基序列的
dppD基因和具有序列编号18表示的碱基序列的
dppF基因缺失,使用PerSeptive Biosystems公司制8905型DNA合成仪,合成与位于大肠杆菌K12株的染色体DNA上的各个缺失靶基因的上游和下游的36bp构成的碱基序列相同的碱基序列、和具有序列编号39表示的来自酵母的Flp重组酶识别的碱基序列的DNA。但是,
dppA基因、dppB基因、
dppC基因、
dppD基因和
dppF基因由于形成操纵子,所以合成具有与位于该操纵子的上游和下游的碱基序列相同的碱基序列的DNA。
即、分别合成作为缺失
pepD基因用DNA片段扩增用引物组使用由序列编号40和41构成的DNA、作为缺失
pepN基因用DNA片段扩增用引物组使用由序列编号42和43构成的DNA、作为缺失
pepA基因用DNA片段扩增用引物组使用由序列编号44和45构成的DNA、作为缺失
pepB基因用DNA片段扩增用引物组使用由序列编号46和47构成的DNA、作为缺失
dpp操纵子用DNA片段扩增用引物组使用序列编号48和49表示的碱基序列构成的DNA。
然后,使用上述合成DNA作为引物组,以pKD3DNA为模板进行PCR。使用含有10ng质粒DNA、0.5μmol/l各引物、2.5units的
Pfu DNA聚合酶(Stratagene公司制)、4μl
Pfu DNA聚合酶用×10缓冲液(Stratagene公司制)、200μmol/l的各deoxyNTP(dATP、dGTP、dCTP和TTP)的40μl反应液,通过反复进行30次94℃1分钟、55℃2分钟、72℃3分钟的步骤循环进行PCR。
将各个反应液的1/10量进行琼脂糖凝胶电泳,确认目的片段扩增后,添加与余下的反应液等量的TE〔10mmol/l Tris-HCl(pH8.0)、1mmol/l EDTA〕饱和苯酚/氯仿(1vol/1vol),并进行混合。
将该混合液离心分离后,向得到的上层加2倍容量的冷乙醇,进行混合,于-80℃下放置30分钟。对该溶液进行离心分离,获得含有pepD基因、
pepN基因、
pepB基因、
pepA基因和
dpp操纵子缺失用氯霉素耐性基因DNA片段。
(2)
pepD基因缺失大肠杆菌JM101的制作
用pKD46转化大肠菌JM101株,涂布在含有100mg/l氨苄青霉素的LB琼脂培养基,通过于30℃下培养进行选择。
在质粒pKD46上插入λRed重组酶基因,而其表达设计为可通过L-阿拉伯糖诱导。因此使用直链状DNA转化在L-阿拉伯糖存在下繁殖的大肠菌,会以高频率发生同源重组。另外由于pKD46具有温度感受性的复制起点,所以通过在42℃下使其繁殖,容易使质粒脱落。
通过电脉冲法向添加10mmol/l的L-阿拉伯糖和50μg/ml氨苄青霉素后培养得到的大肠菌JM101/pKD46导入上述取得的含有
pepD基因缺失用氯霉素耐性基因的DNA片段,将通过同源重组在大肠菌JM101的染色体DNA上转运了
pepD基因缺失用氯霉素耐性基因含有DNA片段的转化株涂布在含有25mg/l氯霉素的LB琼脂培养基(细菌用胰蛋白胨10g/l、细菌用酵母提取液5g/l、氯化钠5g/l、琼脂15g/l)上,通过于30℃培养进行选择。
经选择的氯霉素耐性株接种在含有25mg/l氯霉素的LB琼脂培养基,于42℃下培养14小时后,分离单菌落。将得到的各菌落复制在含有25mg/l氯霉素的LB琼脂培养基、以及含有100mg/l氨苄青霉素的LB琼脂培养基上,于37℃下培养,通过选择表现出氯霉素耐性且氨苄青霉素感受性的菌落,取得pKD46脱落株。
然后使用pCP20转化上述得到的pKD46脱落株,通过在含有100mg/l氨苄青霉素的LB琼脂培养基上进行选择,取得保持pCP20的pKD46脱落株。
在质粒pCP20中插入来自酵母的Flp重组酶基因,设计成在42℃可诱导该基因的表达。
另外,由于在上述制作的含有
pepD基因、
pepN基因、
pepB基因、pepA基因以及
dpp操纵子缺失用氯霉素耐性基因DNA片段的氯霉素耐性基因的两端存在Flp重组酶识别的碱基序列,通过Flp重组酶催化的同源重组容易使该耐性基因脱落。
另外,pCP20由于含有温度感受性的复制起点,通过使pCP20保持株在42℃下繁殖,可以同时诱导Flp重组酶的表达和pCP20的脱落。
将上述取得的保有pCP20的pKD46脱落株接种在没有添加药物的LB琼脂培养基,于42℃下培养14小时后、分离单菌落。将得到的各菌落复制在没有添加药物的LB琼脂培养基、含有25mg/l氯霉素的LB琼脂培养基和含有100mg/l氨苄青霉素的LB琼脂培养基,于30℃下培养,选择表现出氯霉素感受性且氨苄青霉素敏感性的菌落。
按照常用方法(生物工学实验书、日本生物工学会编97~98页、培风馆、1992年)从上述选择的各株制备各个染色体DNA。使用具有根据缺失的靶基因
pepD基因的内部碱基序列设计的序列编号50和51表示的碱基序列的DNA作为引物组,以染色体DNA为模板进行PCR。使用含有0.1μg染色体DNA、0.5μmol/l的各引物、2.5units的
PfuDNA聚合酶、4μl
Pfu DNA聚合酶用×10缓冲液、200μmol/l的各deoxyNTP的40μl反应液,通过反复进行30次由94℃1分钟、55℃2分钟、72℃3分钟构成的步骤循环进行PCR。
在上述PCR中,把没有检测到扩增DNA片段的菌株作为
pepD基因缺失株,取名为大肠杆菌JPD1株。
(3)大肠杆菌JM101的染色体DNA上的
pepD基因和
pepN基因缺失的菌株的制作
pKD46转化上述(2)得到的大肠杆菌JPD1株,涂布在含有100mg/l氨苄青霉素的LB琼脂培养基,通过在30℃下培养进行选择。通过电脉冲法向得到的转化株(大肠杆菌JPD1/pKD46)导入
pepN基因缺失用氯霉素耐性基因含有DNA片段,取得通过同源重组在大肠杆菌JPD1/pKD46的染色体DNA上转运了
pepN基因缺失用氯霉素耐性基因含有DNA片段的转化株。
然后,通过进行与上述(2)同样的操作,取得从染色体DNA上脱落了氯霉素耐性基因的菌株,将该株命名为大肠杆菌JPDN2。
(4)缺失了大肠杆菌JM101的染色体DNA上的
pepN基因、
pepA基因、pepB基因或
dpp操纵子的菌株和多重基因缺失株的制作
pepN基因、
pepA基因、
pepB基因或
dpp操纵子的缺失株使用上述(1)制作的含有各基因或操纵子缺失用氯霉素耐性基因的DNA片段,通过与上述(2)同样的方法制作。
通过上述方法取得的各个基因缺失株可以通过使用根据各个缺失基因的内部碱基序列设计、合成的具有序列编号52~59表示的碱基序列的DNA作为引物组,通过与上述(2)同样的PCR来得到确认。其中,由序列编号52和53表示的碱基序列构成的DNA是
pepN基因缺失确认用的引物组、由序列编号54和55表示的碱基序列构成的DNA是
pepA基因缺失确认用引物组、由序列编号56和57表示的碱基序列构成的DNA是
pepB基因缺失确认用引物组、由序列编号58和59表示的碱基序列构成的DNA是
dpp操纵子缺失确认用引物组。
将用上述方法取得的
dpp操纵子缺失株命名为大肠杆菌JDPP1株、将
pepN基因缺失株命名为大肠杆菌JPN1株、将
pepA基因缺失株命名为大肠杆菌JPA1株、将
pepB基因缺失株命名为大肠杆菌JPB7株。
另外,根据上述(3)方法,制作由
pepD基因、
pepN基因、
pepA基因、
pepB基因和
dpp操纵子中选择2个以上基因或操纵子的多重缺失株。取得多重缺失株的确认通过与上述(2)同样的PCR进行确认。通过上述方法取得的缺失了
pepD基因和
dpp操纵子的二重基因缺失株命名为大肠杆菌JPDP49株;缺失了
pepB基因、
pepD基因和
pepN基因的三重基因缺失株命名为大肠杆菌JPDNB43株;缺失了
pepD基因、pepN基因和
dpp操纵子的三重基因缺失株命名为大肠杆菌JPNDDP36株;缺失了
pepA基因、
pepD基因、
pepN基因和
dpp操纵子的四重基因缺失株命名为大肠杆菌JPNDAP5株;缺失了
pepB基因、
pepD基因、pepN基因和
dpp操纵子的四重基因缺失株命名为大肠杆菌JPNDBP7株。表2给出了各基因缺失株中的缺失基因名。
表2
|
菌株名 |
缺失基因 |
|
JM101 |
无 |
|
JDPP1 |
dpp操纵子 |
|
JPN1 |
pepN |
|
JPA1 |
pepA |
|
JPB7 |
pepB |
|
JPD1 |
pepD |
|
JPDN2 |
pepD,pepN |
|
JPNDB43 |
pepB,pepD,pepN |
|
JPDP49 |
pepD,dpp操纵子 |
|
JPNDDP36 |
pepD,pepN,dpp操纵子 |
|
JPNDAP5 |
pepA,pepD,pepN,dpp操纵子 |
|
JPNDBP7 |
pepB,pepD,pepN,dpp操纵子 |
实施例2 使用肽酶和肽转运活性丧失的大肠菌株生产L-丙氨酰-L-谷氨酰胺(以下称为AlaGln)和L-丙氨酰-L-丙氨酸(以下称为AlaAla)的生产性的评价
对于编码实施例1中得到的各种肽酶基因和二肽转运蛋白质的操纵子的缺失株用实验例8制作的质粒pPE56进行转化,获得表现出氨苄青霉素耐性的转化株。
将得到的转化株接种到加入了含有50μg/ml氨苄青霉素的8mlLB培养基的试管,于28℃下培养17小时。将该培养液以1%接种到加入了含有100μg/ml氨苄青霉素的8ml生产培养基(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/L、柠檬酸(无水)1g/l、酪蛋白氨基酸(Difco公司制)0.5g/l、L-Pro 1g/l、L-Ala 2.5g/l、L-Gln 2.5g/l、葡萄糖10g/l、维生素B1 10mg/L、硫酸镁·七水合物25mg/l、硫酸铁七水合物50mg/l、使用10mol/l氢氧化钠溶液调整到pH7.2。其中L-Gln,10倍浓缩液经膜过滤灭菌后添加,而葡萄糖、维生素B1、硫酸镁·七水合物、硫酸铁·七水合物分别蒸煮后添加)的试管,于30℃下培养24小时。将该培养液进行离心分离获得培养上清。
将培养上清中的生产物用F-moc化法进行衍生物化后,通过HPLC法进行分析。通过HPLC法的分析对于分离柱使用ODS-HG5(野村化学公司制),作为洗脱液,使用A液(醋酸6ml/l、20%(v/v)乙腈、三乙胺,调整到pH4.8)和B液(醋酸6ml/l、70%(v/v)乙腈、三乙胺,调整到pH4.8),在0~5分钟,A液∶B液=8∶2、在5~20分钟,于20分钟时达到A液∶B液=1∶1那样进行线性梯度洗脱的条件下进行分析。分析结果如表3所示。
表3
|
菌株名 |
缺失基因 |
AlaGln(g/l) |
AlaAla(g/l) |
|
JM101 |
无 |
0 |
0 |
|
JDPP1 |
dpp操纵子 |
0.02 |
0.01 |
|
JPN1 |
pepN |
0.01 |
0.01 |
|
JPA1 |
pepA |
0.01 |
0.01 |
|
JPB7 |
pepB |
0.01 |
0.01 |
|
JPD1 |
pepD |
0.01 |
0.01 |
|
JPDN2 |
pepD,pepN |
0.02 |
0.03 |
|
JPNDB43 |
pepB,pepD,pepN |
0.05 |
0.12 |
|
JPDP49 |
pepD,dpp操纵子 |
0.11 |
0.08 |
|
JPNDDP36 |
pepD,pepN,dpp操纵子 |
0.16 |
0.21 |
|
JPNDAP5 |
pepA,pepD,pepN,dpp操纵子 |
0.28 |
0.26 |
|
JPNDBP7 |
pepB,pepD,pepN,dpp操纵子 |
0.43 |
0.22 |
由表3可知在缺失了2种以下肽酶基因的微生物、只缺失1种肽转运蛋白质基因的微生物中,二肽的生成、蓄积量低,而在缺失了1种以上肽酶基因和1种肽转运蛋白质基因的微生物、或缺失了3种以上肽酶基因的微生物中,二肽的生成、蓄积量大幅度增加。
实施例3 使用肽酶和肽转运蛋白质的活性丧失的大肠菌株生产L-丙氨酰-L-缬氨酸(以下称为AlaVal)的生产性的评价
与实施例2同样,将编码各种肽酶基因和肽转运蛋白质的操纵子缺失大肠菌株用pPE56进行转化。将得到的转化株接种到加入了含有50μg/ml氨苄青霉素的8ml LB培养基的试管中,于28℃下培养17小时。将该培养液以1%接种到加入了含有100μg/ml氨苄青霉素的8ml生产培养基(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/l、柠檬酸(无水)1g/l、酪蛋白氨基酸(Difco公司制)0.5g/l、L-Pro 1g/l、L-Ala 2.5g/l、L-Val 2.5g/l、葡萄糖10g/l、维生素B1 10mg/l、硫酸镁·七水合物25mg/l、硫酸铁·七水合物50mg/l、用10mol/l氢氧化钠溶液调整到pH7.2。葡萄糖、维生素B1、硫酸镁·七水合物、硫酸铁·七水合物分别蒸煮后添加)的试管,于30℃下培养24小时。对该培养液进行离心分离,获得培养上清。
通过实施例2所述的方法对培养上清中的生成物进行分析。结果如表4所示。
表4
|
菌株名 |
缺失基因 |
AlaVal(g/l) |
|
JM101 |
无 |
0 |
|
JDPP1 |
dpp操纵子 |
0 |
|
JPN1 |
pepN |
0 |
|
JPA1 |
pepA |
0 |
|
JPB7 |
pepB |
0 |
|
JPD1 |
pepD |
0 |
|
JPDN2 |
pepD,pepN |
0 |
|
JPNDB43 |
pepB,pepD,pepN |
0.04 |
|
JPDP49 |
pepD,dpp操纵子 |
0.11 |
|
JPNDDP36 |
pepD,pepN,dpp操纵子 |
0.22 |
|
JPNDBP7 |
pepB,pepD,pepN,dpp操纵子 |
0.20 |
由表4可知,2种以下的肽酶基因缺失的微生物、和只有1种肽转运蛋白质基因缺失的微生物不生产二肽,3种以上的肽酶基因缺失的微生物、或1种以上肽酶基因和1种肽转运蛋白质基因缺失的微生物生产二肽。
实施例4 使用肽酶和肽转运蛋白质的活性丧失的大肠菌株生产甘氨酰-L-谷氨酰胺(以下称为GlyGln)的生产性的评价
与实施例2同样,将编码各种肽酶基因和肽转运蛋白质的操纵子的缺失株用pPE56进行转化。将得到的转化株接种到加入了含有50μg/ml氨苄青霉素的8ml LB培养基的试管,于28℃下培养17小时。
将该培养液以1%接种到加入了含有100μg/ml氨苄青霉素的8ml生产培养基(磷酸氢二钾16g/l、磷酸二氢钾14g/l、硫酸铵5g/L、柠檬酸(无水)1g/L、酪蛋白氨基酸(Difco公司制)0.5g/l、L-Pro 1g/l、Gly 2.5g/l、L-Gln 2.5g/l、葡萄糖10g/l、维生素B1 10mg/L、硫酸镁·七水合物25mg/l、硫酸铁七水合物50mg/l、用10mol/l的氢氧化钠溶液调整到pH7.2。L-Gln的10倍浓缩液经膜过滤灭菌后添加;葡萄糖、维生素B1、硫酸镁·七水合物、硫酸铁·七水合物分别经蒸煮后添加)的试管,于30℃下培养24小时。对该培养液进行离心分离,可得到培养上清。
通过实施例2所述的方法对培养上清中的生成物进行分析。结果如表5所示。
表5
|
菌株名 |
缺失基因 |
GlyGln(g/l) |
|
JM101 |
无 |
0 |
|
JDPP1 |
dpp操纵子 |
0 |
|
JPDN2 |
pepD,pepN |
0 |
|
JPNDB43 |
pepB,pepD,pepN |
0.01 |
|
JPNDDP36 |
pepD,pepN,dpp操纵子 |
0.02 |
|
JPNDBP7 |
pepB,pepD,pepN,dpp操纵子 |
0.03 |
由表5可知,2种以下的肽酶基因缺失的微生物、和只有1种肽转运蛋白质基因缺失的微生物不生产二肽,而3种以上肽酶基因缺失的微生物、和2种以上肽酶基因和1种肽转运蛋白质基因缺失的微生物生产二肽。
产业上的利用可能性
根据本发明可以提供生产二肽的微生物和使用该微生物制造二肽的方法。
「序列表FREE TEXT」
序列编号35-人工序列的说明;合成DNA
序列编号36-人工序列的说明;合成DNA
序列编号37-人工序列的说明;合成DNA
序列编号38-人工序列的说明;合成DNA
序列编号39-人工序列的说明;合成DNA
序列编号40-人工序列的说明;合成DNA
序列编号41-人工序列的说明;合成DNA
序列编号42-人工序列的说明;合成DNA
序列编号43-人工序列的说明;合成DNA
序列编号44-人工序列的说明;合成DNA
序列编号45-人工序列的说明;合成DNA
序列编号46-人工序列的说明;合成DNA
序列编号47-人工序列的说明;合成DNA
序列编号48-人工序列的说明;合成DNA
序列编号49-人工序列的说明;合成DNA
序列编号50-人工序列的说明;合成DNA
序列编号51-人工序列的说明;合成DNA
序列编号52-人工序列的说明;合成DNA
序列编号53-人工序列的说明;合成DNA
序列编号54-人工序列的说明;合成DNA
序列编号55-人工序列的说明;合成DNA
序列编号56-人工序列的说明;合成DNA
序列编号57-人工序列的说明;合成DNA
序列编号58-人工序列的说明;合成DNA
序列编号59-人工序列的说明;合成DNA
序列编号60-人工序列的说明;合成DNA
序列编号61-人工序列的说明;合成DNA
序列编号62-人工序列的说明;合成DNA
序列编号63-人工序列的说明;合成DNA
序列编号66-人工序列的说明;合成DNA
序列编号67-人工序列的说明;合成DNA
序列编号69-人工序列的说明;合成DNA
序列编号70-人工序列的说明;合成DNA
序列编号71-人工序列的说明;合成DNA
序列编号72-人工序列的说明;合成DNA
序列表
<110>协和发酵工业公司
<120>生产二肽的微生物和使用该微生物制造二肽的方法
<130>11632
<150>JP2003-375823
<151>2003-11-5
<150>JP2004-189010
<151>2004-06-25
<160>72
<170>PatentIn Ver.2.1
<210>1
<211>503
<212>PRT
<213>大肠杆菌(Escherichia coli)
<400>1
Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala
1 5 10 15
Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala
20 25 30
Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg
35 40 45
Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His
50 55 60
Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys
65 70 75 80
Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr
85 90 95
Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu
100 105 110
Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln
115 120 125
Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys
130 135 140
Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn
145 150 155 160
Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His
165 170 175
Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn
180 185 190
Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg
195 200 205
Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly
210 215 220
Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly
225 230 235 240
Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly
245 250 255
Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu
260 265 270
Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp
275 280 285
Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met
290 295 300
Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu
305 3l0 315 320
Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp
325 330 335
Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp
340 345 350
Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg
355 360 365
Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys
370 375 380
Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn
385 390 395 400
Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg
405 410 415
Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser
420 425 430
Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile
435 440 445
Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala
450 455 460
His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly
465 470 475 480
Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg
485 490 495
Ala Gly Phe Asn Gly Glu Glu
500
<210>2
<211>427
<212>PRT
<213>大肠杆菌
<400>2
Met Thr Gla Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala
1 5 10 15
Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr
20 25 30
Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala
35 40 45
Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu
50 55 60
Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala
65 70 75 80
Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln
85 90 95
Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp
100 105 110
Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln
115 120 125
Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr
130 135 140
Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu
145 150 155 160
His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu
165 170 175
Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu
180 185 190
Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln
195 200 205
Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr
210 215 220
Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg
225 230 235 240
Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala
245 250 255
Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu
260 265 270
Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu
275 280 285
Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr
290 295 300
Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu
305 310 315 320
Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala
325 330 335
Gln Glu Asn Gro Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg
340 345 350
Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Asn lhr Gly Ser Ala
355 360 365
Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe
370 375 380
Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr
385 390 395 400
Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu
405 410 415
Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala
420 425
<210>3
<211>485
<212>PRT
<213>大肠杆菌
<400>3
Met Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe
1 5 10 15
Ala Lys Ile Cys Ser Ile Pro His Pro Ser Tyr His Glu Glu Gln Leu
20 25 30
Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu
35 40 45
Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly
50 55 60
Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val
65 70 75 80
Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile
85 90 95
Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu
100 105 110
Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala
115 120 125
Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr
130 135 140
Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu
145 150 155 160
Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile
165 170 175
Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu
180 185 190
Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu
195 200 205
Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu
210 215 220
Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu
225 230 235 240
Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn
245 250 255
Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys
260 265 270
Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys
275 280 285
Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser
290 295 300
Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe
305 310 315 320
Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp
325 330 335
Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr
340 345 350
Met Thr Asp Asn Asn Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile
355 360 365
Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys
370 375 380
Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln
385 390 395 400
Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln
405 410 415
Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu
420 425 430
Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser
435 440 445
Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His
450 455 460
Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys
465 470 475 480
Glu Ile Pro Ala Lys
485
<210>4
<211>870
<212>PRT
<213>大肠杆菌
<400>4
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg His Asp Tyr Arg Ala Pro
1 5 10 15
Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln
20 25 30
Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser
35 40 45
Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val
50 55 60
His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala
65 70 75 80
Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn
85 90 95
Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser
100 105 110
Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
115 120 125
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys
130 135 140
Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn
145 150 155 160
Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp
165 170 175
Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly
180 185 190
Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu
195 200 205
Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro
210 215 220
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg
225 230 235 240
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
245 250 255
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn
260 265 270
Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr
275 280 285
Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
290 295 300
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305 310 315 320
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
325 330 335
Arg Ala Val Asn Arg Ile Asn Asn Val Arg Thr Met Arg Gly Leu Gln
340 345 350
Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met
355 360 365
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
370 375 380
Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe
385 390 395 400
Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
405 410 415
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp
420 425 430
Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val
435 440 445
Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr
450 455 460
Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro
465 470 475 480
Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val
485 490 495
Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val
500 505 510
Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro
515 520 525
Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr
530 535 540
Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn
545 550 555 560
Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
565 570 575
Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro
580 585 590
Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile
595 600 605
Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu
610 615 620
Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val
625 630 635 640
Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu
645 650 655
Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His
660 665 670
Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu
675 680 685
Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe
690 695 700
His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala
705 710 715 720
Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp
725 730 735
Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu
740 745 750
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu
755 760 765
Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser
770 775 780
Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu
785 790 795 800
Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn
805 810 815
Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg
820 825 830
Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu
835 840 845
Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys
850 855 860
Ile Thr Lys Ala Leu Ala
865 870
<210>5
<211>535
<212>PRT
<213>大肠杆菌
<400>5
Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser
l 5 10 15
Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val
20 25 30
Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr
35 40 45
Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu
50 55 60
Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu
65 70 75 80
Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg
85 90 95
Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu
100 105 110
Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala
115 120 125
Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu
130 135 140
Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp
145 150 155 160
Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala
165 170 175
Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp
180 185 190
Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile
195 200 205
Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile
210 215 220
Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp
225 230 235 240
Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys
245 250 255
Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp
260 265 270
Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro
275 280 285
Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu
290 295 300
Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp
305 310 315 320
Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn
325 330 335
Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr
340 345 350
Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu
355 360 365
Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro
370 375 380
Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp
385 390 395 400
Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu
405 410 415
Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly
420 425 430
Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe
435 440 445
Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr
450 455 460
Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His
465 470 475 480
Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp
485 490 495
Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val
500 505 510
Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His
515 520 525
Phe Glu Asn Val Ser Ile Glu
530 535
<210>6
<211>339
<212>PRT
<213>大肠杆菌
<400>6
Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe
1 5 10 15
Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly
20 25 30
Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg
35 40 45
His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln
50 55 60
Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile
65 70 75 80
Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe
85 90 95
Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala
100 105 110
Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile
115 120 125
Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro
130 135 140
Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp
145 150 155 160
Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp
165 170 175
Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp
180 185 190
Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro
195 200 205
Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr
210 215 220
Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala
225 230 235 240
Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu
245 250 255
Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly
260 265 270
Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro
275 280 285
Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro
290 295 300
Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val
305 310 315 320
Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg
325 330 335
His Lys Lys
<210>7
<211>300
<212>PRT
<213>大肠杆菌
<400>7
Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met
1 5 10 15
Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala
20 25 30
Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe
35 40 45
Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala
50 55 60
Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu
65 70 75 80
Leu Gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr
85 90 95
Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser
100 105 110
Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly
115 120 125
Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu
130 135 140
Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser
145 150 155 160
Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr
165 170 175
Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr
180 185 190
Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe
195 200 205
Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser
210 215 220
Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu
225 230 235 240
Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser
245 250 255
Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro
260 265 270
Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp
275 280 285
Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln
290 295 300
<210>8
<211>327
<212>PRT
<213>大肠杆菌
<400>8
Met Ala Leu Leu Asn Val Asp Lys Leu Ser Val His Phe Gly Asp Glu
1 5 10 15
Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln
20 25 30
Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val
35 40 45
Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met
50 55 60
Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu
65 70 75 80
Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln
85 90 95
Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile
100 105 110
Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg
115 120 125
Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala
130 135 140
Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln
145 150 155 160
Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile
165 170 175
Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile
180 185 190
Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val
195 200 205
Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile
210 215 220
Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala
225 230 235 240
Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala
245 250 255
Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly
260 265 270
Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro
275 280 285
Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu
290 295 300
Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp
305 310 315 320
Asp Ala Gly Arg Pro Thr Leu
325
<210>9
<211>334
<212>PRT
<213>大肠杆菌
<400>9
Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile
1 5 10 15
Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu
20 25 30
Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly
35 40 45
Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu
50 55 60
Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr
65 70 75 80
Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu
85 90 95
Arg Arg Gln Lys Ile Gln lle Val Phe Gln Asn Pro Tyr Gly Ser Leu
100 105 110
Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile
115 120 125
Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met
130 135 140
Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His
145 150 155 160
Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu
165 170 175
Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu
180 185 190
Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln
195 200 205
Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val
210 215 220
Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys
225 230 235 240
Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Asn Asn Pro Arg His Pro
245 250 255
Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp
260 265 270
Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn
275 280 285
Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly
290 295 300
Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu
305 310 315 320
Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg
325 330
<210>10
<211>1509
<212>DNA
<213>大肠杆菌
<400>10
atg gag ttt agt gta aaa agc ggt agc ccg gag aaa cag cgg agt gcc 48
Met Glu Phe Ser Val Lys Ser Gly Ser Pro Glu Lys Gln Arg Ser Ala
1 5 10 15
tgc atc gtc gtg ggc gtc ttc gaa cca cgt cgc ctt tct ccg att gca 96
Cys Ile Val Val Gly Val Phe Glu Pro Arg Arg Leu Ser Pro Ile Ala
20 25 30
gaa cag ctc gat aaa atc agc gat ggg tac atc agc gcc ctg cta cgt 144
Glu Gln Leu Asp Lys Ile Ser Asp Gly Tyr Ile Ser Ala Leu Leu Arg
35 40 45
cgg ggc gaa ctg gaa gga aaa ccg ggg cag aca ttg ttg ctg cac cat 192
Arg Gly Glu Leu Glu Gly Lys Pro Gly Gln Thr Leu Leu Leu His His
50 55 60
gtt ccg aat gta ctt tcc gag cga att ctc ctt att ggt tgc ggc aaa 240
Val Pro Asn Val Leu Ser Glu Arg Ile Leu Leu Ile Gly Cys Gly Lys
65 70 75 80
gaa cgt gag ctg gat gag cgt cag tac aag cag gtt att cag aaa acc 288
Glu Arg Glu Leu Asp Glu Arg Gln Tyr Lys Gln Val Ile Gln Lys Thr
85 90 95
att aat acg ctg aat gat act ggc tca atg gaa gcg gtc tgc ttt ctg 336
Ile Asn Thr Leu Asn Asp Thr Gly Ser Met Glu Ala Val Cys Phe Leu
100 105 110
act gag ctg cac gtt aaa ggc cgt aac aac tac tgg aaa gtg cgt cag 384
Thr Glu Leu His Val Lys Gly Arg Asn Asn Tyr Trp Lys Val Arg Gln
115 120 125
gct gtc gag acg gca aaa gag acg ctc tac agt ttc gat cag ctg aaa 432
Ala Val Glu Thr Ala Lys Glu Thr Leu Tyr Ser Phe Asp Gln Leu Lys
130 135 140
acg aac aag agc gaa ccg cgt cgt ccg ctg cgt aag atg gtg ttc aac 480
Thr Asn Lys Ser Glu Pro Arg Arg Pro Leu Arg Lys Met Val Phe Asn
145 150 155 160
gtg ccg acc cgc cgt gaa ctg acc agc ggt gag cgc gcg atc cag cac 528
Val Pro Thr Arg Arg Glu Leu Thr Ser Gly Glu Arg Ala Ile Gln His
165 170 175
ggt ctg gcg att gcc gcc ggg att aaa gca gca aaa gat ctc ggc aat 576
Gly Leu Ala Ile Ala Ala Gly Ile Lys Ala Ala Lys Asp Leu Gly Asn
180 185 190
atg ccg ccg aat atc tgt aac gcc gct tac ctc gct tca caa gcg cgc 624
Met Pro Pro Asn Ile Cys Asn Ala Ala Tyr Leu Ala Ser Gln Ala Arg
195 200 205
cag ctg gct gac agc tac agc aag aat gtc atc acc cgc gtt atc ggc 672
Gln Leu Ala Asp Ser Tyr Ser Lys Asn Val Ile Thr Arg Val Ile Gly
210 215 220
gaa cag cag atg aaa gag ctg ggg atg cat tcc tat ctg gcg gtc ggt 720
Glu Gln Gln Met Lys Glu Leu Gly Met His Ser Tyr Leu Ala Val Gly
225 230 235 240
cag ggt tcg caa aac gaa tcg ctg atg tcg gtg att gag tac aaa ggc 768
Gln Gly Ser Gln Asn Glu Ser Leu Met Ser Val Ile Glu Tyr Lys Gly
245 250 255
aac gcg tcg gaa gat gca cgc cca atc gtg ctg gtg ggt aaa ggt tta 816
Asn Ala Ser Glu Asp Ala Arg Pro Ile Val Leu Val Gly Lys Gly Leu
260 265 270
acc ttc gac tcc ggc ggt atc tcg atc aag cct tca gaa ggc atg gat 864
Thr Phe Asp Ser Gly Gly Ile Ser Ile Lys Pro Ser Glu Gly Met Asp
275 280 285
gag atg aag tac gat atg tgc ggt gcg gca gcg gtt tac ggc gtg atg 912
Glu Met Lys Tyr Asp Met Cys Gly Ala Ala Ala Val Tyr Gly Val Met
290 295 300
cgg atg gtc gcg gag cta caa ctg ccg att aac gtt atc ggc gtg ttg 960
Arg Met Val Ala Glu Leu Gln Leu Pro Ile Asn Val Ile Gly Val Leu
305 3l0 315 320
gca ggc tgc gaa aac atg cct ggc gga cga gcc tat cgt ccg ggc gat 1008
Ala Gly Cys Glu Asn Met Pro Gly Gly Arg Ala Tyr Arg Pro Gly Asp
325 330 335
gtg tta acc acc atg tcc ggt caa acc gtt gaa gtg ctg aac acc gac 1056
Val Leu Thr Thr Met Ser Gly Gln Thr Val Glu Val Leu Asn Thr Asp
340 345 350
gct gaa ggc cgc ctg gta ctg tgc gac gtg tta act tac gtt gag cgt 1104
Ala Glu Gly Arg Leu Val Leu Cys Asp Val Leu Thr Tyr Val Glu Arg
355 360 365
ttt gag ccg gaa gcg gtg att gac gtg gcg acg ctg acc ggt gcc tgc 1152
Phe Glu Pro Glu Ala Val Ile Asp Val Ala Thr Leu Thr Gly Ala Cys
370 375 380
gtg atc gcg ctg ggt cat cat att act ggt ctg atg gcg aac cat aat 1200
Val Ile Ala Leu Gly His His Ile Thr Gly Leu Met Ala Asn His Asn
385 390 395 400
ccg ctg gcc cat gaa ctg att gcc gcg tct gaa caa tcc ggt gac cgc 1248
Pro Leu Ala His Glu Leu Ile Ala Ala Ser Glu Gln Ser Gly Asp Arg
405 410 415
gca tgg cgc tta ccg ctg ggt gac gag tat cag gaa caa ctg gag tcc 1296
Ala Trp Arg Leu Pro Leu Gly Asp Glu Tyr Gln Glu Gln Leu Glu Ser
420 425 430
aat ttt gcc gat atg gcg aac att ggc ggt cgt cct ggt ggg gcg att 1344
Asn Phe Ala Asp Met Ala Asn Ile Gly Gly Arg Pro Gly Gly Ala Ile
435 440 445
acc gca ggt tgc ttc ctg tca cgc ttt acc cgt aag tac aac tgg gcg 1392
Thr Ala Gly Cys Phe Leu Ser Arg Phe Thr Arg Lys Tyr Asn Trp Ala
450 455 460
cac ctg gat atc gcc ggt acc gcc tgg cgt tct ggt aaa gca aaa ggc 1440
His Leu Asp Ile Ala Gly Thr Ala Trp Arg Ser Gly Lys Ala Lys Gly
465 470 475 480
gcc acc ggt cgt ccg gta gcg ttg ctg gca cag ttc ctg tta aac cgc 1488
Ala Thr Gly Arg Pro Val Ala Leu Leu Ala Gln Phe Leu Leu Asn Arg
485 490 495
gct ggg ttt aac ggc gaa gag 1509
Ala Gly Phe Asn Gly Glu Glu
500
<210>11
<211>1281
<212>DNA
<213>大肠杆菌
<400>11
atg aca gaa gcg atg aag att acc ctc tct acc caa cct gcc gac gcg 48
Met Thr Glu Ala Met Lys Ile Thr Leu Ser Thr Gln Pro Ala Asp Ala
1 5 10 15
cgc tgg gga gaa aaa gca act tac agc att aat aat gac ggc att acc 96
Arg Trp Gly Glu Lys Ala Thr Tyr Ser Ile Asn Asn Asp Gly Ile Thr
20 25 30
ctg cat ttg aac ggg gca gac gat ctg ggg ctg atc cag cgt gcg gcg 144
Leu His Leu Asn Gly Ala Asp Asp Leu Gly Leu Ile Gln Arg Ala Ala
35 40 45
cgc aag att gac ggt ctg ggc atc aag cat gtt cag tta agc ggt gaa 192
Arg Lys Ile Asp Gly Leu Gly Ile Lys His Val Gln Leu Ser Gly Glu
50 55 60
ggc tgg gat gcg gat cgc tgc tgg gca ttc tgg caa ggt tac aaa gcc 240
Gly Trp Asp Ala Asp Arg Cys Trp Ala Phe Trp Gln Gly Tyr Lys Ala
65 70 75 80
ccg aaa ggc acg cgt aaa gtg gtg tgg ccg gat ctg gac gat gcc cag 288
Pro Lys Gly Thr Arg Lys Val Val Trp Pro Asp Leu Asp Asp Ala Gln
85 90 95
cgc cag gaa ctg gat aac cgc ctg atg atc atc gac tgg gtg cgt gac 336
Arg Gln Glu Leu Asp Asn Arg Leu Met Ile Ile Asp Trp Val Arg Asp
100 105 110
acc atc aac gca ccg gca gaa gaa ttg gga cca tcg caa ctg gca cag 384
Thr Ile Asn Ala Pro Ala Glu Glu Leu Gly Pro Ser Gln Leu Ala Gln
115 120 125
cgt gct gtt gat ctg atc agc aac gtc gcg ggc gat cgt gtg act tat 432
Arg Ala Val Asp Leu Ile Ser Asn Val Ala Gly Asp Arg Val Thr Tyr
130 135 140
cgg atc acc aaa ggc gaa gat ctg cgt gag caa ggt tat atg ggg ctg 480
Arg Ile Thr Lys Gly Glu Asp Leu Arg Glu Gln Gly Tyr Met Gly Leu
145 150 155 160
cac aca gtc gga cgc ggt tca gaa cgt tct ccg gta ttg ctg gcg ctg 528
His Thr Val Gly Arg Gly Ser Glu Arg Ser Pro Val Leu Leu Ala Leu
165 170 175
gat tac aac cca act ggc gat aaa gaa gcg cca gtg tac gcg tgc ctg 576
Asp Tyr Asn Pro Thr Gly Asp Lys Glu Ala Pro Val Tyr Ala Cys Leu
180 185 190
gta ggt aaa ggt atc act ttt gac tcc ggc ggc tac agc atc aaa cag 624
Val Gly Lys Gly Ile Thr Phe Asp Ser Gly Gly Tyr Ser Ile Lys Gln
195 200 205
act gcg ttt atg gac tcg atg aag tcg gac atg ggc ggc gcg gca acg 672
Thr Ala Phe Met Asp Ser Met Lys Ser Asp Met Gly Gly Ala Ala Thr
210 215 220
gtt acc ggg gcg ctg gca ttt gcc att acg cgc gga ctg aac aag cgc 720
Val Thr Gly Ala Leu Ala Phe Ala Ile Thr Arg Gly Leu Asn Lys Arg
225 230 235 240
gtg aag ctg ttc ctc tgc tgt gcg gat aac ctg att agc ggc aat gcg 768
Val Lys Leu Phe Leu Cys Cys Ala Asp Asn Leu Ile Ser Gly Asn Ala
245 250 255
ttc aag ctg ggc gat atc atc acc tat cgc aac ggt aaa aaa gtt gaa 816
Phe Lys Leu Gly Asp Ile Ile Thr Tyr Arg Asn Gly Lys Lys Val Glu
260 265 270
gtg atg aac act gat gcc gaa ggg cgt ctg gtg ctt gcc gat ggt ctg 864
Val Met Asn Thr Asp Ala Glu Gly Arg Leu Val Leu Ala Asp Gly Leu
275 280 285
att gat gcc agt gcg cag aaa ccg gaa atg atc att gat gcg gcg acc 912
Ile Asp Ala Ser Ala Gln Lys Pro Glu Met Ile Ile Asp Ala Ala Thr
290 295 300
ctc acc ggg gcg gcg aaa act gcg ctg ggt aat gat tat cac gcg ctg 960
Leu Thr Gly Ala Ala Lys Thr Ala Leu Gly Asn Asp Tyr His Ala Leu
305 310 315 320
ttc agt ttt gac gat gcg ctg gcc ggt cgc ttg ctg gcg agt gcc gcg 1008
Phe Ser Phe Asp Asp Ala Leu Ala Gly Arg Leu Leu Ala Ser Ala Ala
325 330 335
cag gag aac gaa ccg ttc tgg cgt ctg ccg ctg gcg gag ttc cac cgc 1056
Gln Glu Asn Glu Pro Phe Trp Arg Leu Pro Leu Ala Glu Phe His Arg
340 345 350
agc cag ctg ccg tct aac ttt gcc gaa ctg aac aat acc gga agc gcg 1104
Ser Gln Leu Pro Ser Asn Phe Ala Glu Leu Asn Asn Thr Gly Ser Ala
355 360 365
gcg tat ccg gca ggc gcg agc acg gcg gcg ggc ttc ctg tcg cac ttt 1152
Ala Tyr Pro Ala Gly Ala Ser Thr Ala Ala Gly Phe Leu Ser His Phe
370 375 380
gtt gag aac tat cag caa ggc tgg ctg cat atc gac tgc tcg gcg act 1200
Val Glu Asn Tyr Gln Gln Gly Trp Leu His Ile Asp Cys Ser Ala Thr
385 390 395 400
tac cgt aaa gcg ccg gtt gaa cag tgg tct gcg ggc gct acg gga ctt 1248
Tyr Arg Lys Ala Pro Val Glu Gln Trp Ser Ala Gly Ala Thr Gly Leu
405 410 415
ggt gtg cgc acg ata gct aat ctg tta acg gcg 1281
Gly Val Arg Thr Ile Ala Asn Leu Leu Thr Ala
420 425
<210>12
<211>1455
<212>DNA
<213>大肠杆菌
<400>12
gtg tct gaa ctg tct caa tta tct cca cag ccg ctg tgg gat att ttt 48
Val Ser Glu Leu Ser Gln Leu Ser Pro Gln Pro Leu Trp Asp Ile Phe
1 5 10 15
gcc aaa atc tgt tct att cct cac ccg tcc tat cat gaa gag caa ctc 96
Ala Lys Ile Cys Ser Ile Pro His Pro Ser Tyr His Glu Glu Gln Leu
20 25 30
gct gaa tac att gtt ggt tgg gca aaa gag aaa ggt ttc cat gtc gaa 144
Ala Glu Tyr Ile Val Gly Trp Ala Lys Glu Lys Gly Phe His Val Glu
35 40 45
cgc gat cag gta ggt aat atc ctg att cgt aaa cct gct acc gca ggt 192
Arg Asp Gln Val Gly Asn Ile Leu Ile Arg Lys Pro Ala Thr Ala Gly
50 55 60
atg gaa aat cgt aaa ccg gtc gtc tta cag gcc cac ctc gat atg gtg 240
Met Glu Asn Arg Lys Pro Val Val Leu Gln Ala His Leu Asp Met Val
65 70 75 80
ccg cag aaa aat aac gac acc gtg cat gac ttc acg aaa gat cct ate 288
Pro Gln Lys Asn Asn Asp Thr Val His Asp Phe Thr Lys Asp Pro Ile
85 90 95
cag cct tat att gat ggc gaa tgg gtt aaa gcg cgc ggc acc acg ctg 336
Gln Pro Tyr Ile Asp Gly Glu Trp Val Lys Ala Arg Gly Thr Thr Leu
100 105 110
ggt gcg gat aac ggc att ggt atg gcc tct gcg ctg gcg gtt ctg gct 384
Gly Ala Asp Asn Gly Ile Gly Met Ala Ser Ala Leu Ala Val Leu Ala
115 120 125
gac gaa aac gtg gtt cac ggc ccg ctg gaa gtg ctg ctg acc atg acc 432
Asp Glu Asn Val Val His Gly Pro Leu Glu Val Leu Leu Thr Met Thr
130 135 140
gaa gaa gcc ggt atg gac ggt gcg ttc ggc tta cag ggc aac tgg ttg 480
Glu Glu Ala Gly Met Asp Gly Ala Phe Gly Leu Gln Gly Asn Trp Leu
145 150 155 160
cag gct gat att ctg att aac acc gac tcc gaa gaa gaa ggt gaa atc 528
Gln Ala Asp Ile Leu Ile Asn Thr Asp Ser Glu Glu Glu Gly Glu Ile
165 170 175
tac atg ggt tgt gcg ggg ggt atc gac ttc acc tcc aac ctg cat tta 576
Tyr Met Gly Cys Ala Gly Gly Ile Asp Phe Thr Ser Asn Leu His Leu
180 185 190
gat cgt gaa gcg gtt cca gct ggt ttt gaa acc ttc aag tta acc tta 624
Asp Arg Glu Ala Val Pro Ala Gly Phe Glu Thr Phe Lys Leu Thr Leu
195 200 205
aaa ggt ctg aaa ggc ggt cac tcc ggc ggg gaa atc cac gtt ggg ctg 672
Lys Gly Leu Lys Gly Gly His Ser Gly Gly Glu Ile His Val Gly Leu
210 215 220
ggt aat gcc aac aaa ctg ctg gtg cgc ttc ctg gcg ggt cat gcg gaa 720
Gly Asn Ala Asn Lys Leu Leu Val Arg Phe Leu Ala Gly His Ala Glu
225 230 235 240
gaa ctg gat ctg cgc ctt atc gat ttc aac ggc ggc aca ctg cgt aac 768
Glu Leu Asp Leu Arg Leu Ile Asp Phe Asn Gly Gly Thr Leu Arg Asn
245 250 255
gcc atc ccg cgt gaa gcc ttt gcg acc att gct gtc gca gct gat aaa 816
Ala Ile Pro Arg Glu Ala Phe Ala Thr Ile Ala Val Ala Ala Asp Lys
260 265 270
gtc gac gtc ctg aaa tct ctg gtg aat acc tat cag gag atc ctg aaa 864
Val Asp Val Leu Lys Ser Leu Val Asn Thr Tyr Gln Glu Ile Leu Lys
275 280 285
aac gag ctg gca gaa aaa gag aaa aat ctg gcc ttg ttg ctg gac tct 912
Asn Glu Leu Ala Glu Lys Glu Lys Asn Leu Ala Leu Leu Leu Asp Ser
290 295 300
gta gcg aac gat aaa gct gcc ctg att gcg aaa tct cgc gat acc ttt 960
Val Ala Asn Asp Lys Ala Ala Leu Ile Ala Lys Ser Arg Asp Thr Phe
305 310 315 320
att cgt ctg ctg aac gcc acc ccg aac ggt gtg att cgt aac tcc gat 1008
Ile Arg Leu Leu Asn Ala Thr Pro Asn Gly Val Ile Arg Asn Ser Asp
325 330 335
gta gcc aaa ggt gtg gtt gaa acc tcc ctg aac gtc ggt gtg gtg acc 1056
Val Ala Lys Gly Val Val Glu Thr Ser Leu Asn Val Gly Val Val Thr
340 345 350
atg act gac aat aac gta gaa att cac tgc ctg atc cgt tca ctg atc 1104
Met Thr Asp Asn Asn Val Glu Ile His Cys Leu Ile Arg Ser Leu Ile
355 360 365
gac agc ggt aaa gac tac gtg gtg agc atg ctg gat tcg ctg ggt aaa 1152
Asp Ser Gly Lys Asp Tyr Val Val Ser Met Leu Asp Ser Leu Gly Lys
370 375 380
ctg gct ggc gcg aaa acc gaa gcg aaa ggc gca tat cct ggc tgg cag 1200
Leu Ala Gly Ala Lys Thr Glu Ala Lys Gly Ala Tyr Pro Gly Trp Gln
385 390 395 400
ccg gac gct aat tct ccg gtg atg cat ctg gta cgt gaa acc tat cag 1248
Pro Asp Ala Asn Ser Pro Val Met His Leu Val Arg Glu Thr Tyr Gln
405 410 415
cgc ctg ttc aac aag acg ccg aac atc cag att atc cac gcg ggc ctg 1296
Arg Leu Phe Asn Lys Thr Pro Asn Ile Gln Ile Ile His Ala Gly Leu
420 425 430
gaa tgt ggt ctg ttc aaa aaa ccg tat ccg gaa atg gac atg gtt tct 1344
Glu Cys Gly Leu Phe Lys Lys Pro Tyr Pro Glu Met Asp Met Val Ser
435 440 445
atc ggg cca act atc acc ggt cca cac tct ccg gat gag caa gtt cac 1392
Ile Gly Pro Thr Ile Thr Gly Pro His Ser Pro Asp Glu Gln Val His
450 455 460
atc gaa agc gta ggt cat tac tgg aca ctg ctg act gaa ctg ctg aaa 1440
Ile Glu Ser Val Gly His Tyr Trp Thr Leu Leu Thr Glu Leu Leu Lys
465 470 475 480
gaa att ccg gcg aag 1455
Glu Ile Pro Ala Lys
485
<210>13
<211>2610
<212>DNA
<213>大肠杆菌
<400>13
atg act caa cag cca caa gcc aaa tac cgt cac gat tat cgt gcg ccg 48
Met Thr Gln Gln Pro Gln Ala Lys Tyr Arg Hls Asp Tyr Arg Ala Pro
1 5 10 15
gat tac cag att act gat att gac ttg acc ttt gac ctc gac gcg caa 96
Asp Tyr Gln Ile Thr Asp Ile Asp Leu Thr Phe Asp Leu Asp Ala Gln
20 25 30
aag acg gtc gtt acc gcg gtc agc cag gct gtc cgt cat ggt gca tca 144
Lys Thr Val Val Thr Ala Val Ser Gln Ala Val Arg His Gly Ala Ser
35 40 45
gat gct ccc ctt cgt ctc aac ggc gaa gac ctc aaa ctg gtt tct gtt 192
Asp Ala Pro Leu Arg Leu Asn Gly Glu Asp Leu Lys Leu Val Ser Val
50 55 60
cat att aat gat gag ccg tgg acc gcc tgg aaa gaa gaa gag ggc gca 240
His Ile Asn Asp Glu Pro Trp Thr Ala Trp Lys Glu Glu Glu Gly Ala
65 70 75 80
ctg gtt atc agt aat ttg ccg gag cgt ttt acg ctt aag atc att aat 288
Leu Val Ile Ser Asn Leu Pro Glu Arg Phe Thr Leu Lys Ile Ile Asn
85 90 95
gaa ata agc ccg gcg gcg aat acc gcg ctg gaa ggg ctt tat cag tca 336
Glu Ile Ser Pro Ala Ala Asn Thr Ala Leu Glu Gly Leu Tyr Gln Ser
100 105 110
ggc gat gcg ctt tgc acc cag tgt gaa gcc gaa ggt ttc cgc cat att 384
Gly Asp Ala Leu Cys Thr Gln Cys Glu Ala Glu Gly Phe Arg His Ile
115 120 125
acg tat tat ctc gac cgc ccg gac gtg ctg gcg cgt ttt acc acc aaa 432
Thr Tyr Tyr Leu Asp Arg Pro Asp Val Leu Ala Arg Phe Thr Thr Lys
130 135 140
att att gcc gat aaa atc aaa tat ccc ttc ctg ctt tcc aat ggt aac 480
Ile Ile Ala Asp Lys Ile Lys Tyr Pro Phe Leu Leu Ser Asn Gly Asn
145 150 155 160
cgc gtt gcg caa ggc gaa ctg gaa aac gga cgc cat tgg gta cag tgg 528
Arg Val Ala Gln Gly Glu Leu Glu Asn Gly Arg His Trp Val Gln Trp
165 170 175
cag gac ccg ttc ccg aaa ccg tgc tac ctg ttt gcg ctg gtg gca ggc 576
Gln Asp Pro Phe Pro Lys Pro Cys Tyr Leu Phe Ala Leu Val Ala Gly
180 185 190
gac ttt gat gta ctg cgc gat acc ttt acc acg cgt tct ggt cgc gaa 624
Asp Phe Asp Val Leu Arg Asp Thr Phe Thr Thr Arg Ser Gly Arg Glu
195 200 205
gta gca ctg gag ctg tac gtc gat cgc ggc aac ctt gat cgc gcg ccg 672
Val Ala Leu Glu Leu Tyr Val Asp Arg Gly Asn Leu Asp Arg Ala Pro
210 215 220
tgg gcg atg acc tcg ctg aaa aac tcc atg aaa tgg gat gaa gaa cgc 720
Trp Ala Met Thr Ser Leu Lys Asn Ser Met Lys Trp Asp Glu Glu Arg
225 230 235 240
ttt ggc ctg gag tat gac ctc gac atc tat atg atc gtc gcg gtg gat 768
Phe Gly Leu Glu Tyr Asp Leu Asp Ile Tyr Met Ile Val Ala Val Asp
245 250 255
ttc ttc aat atg ggc gca atg gag aat aag ggg ctg aat atc ttt aac 816
Phe Phe Asn Met Gly Ala Met Glu Asn Lys Gly Leu Asn Ile Phe Asn
260 265 270
tcc aaa tat gtg ctg gcc cgc acc gac acc gcc acc gac aaa gat tac 864
Ser Lys Tyr Val Leu Ala Arg Thr Asp Thr Ala Thr Asp Lys Asp Tyr
275 280 285
ctc gat att gaa cgc gtt atc ggc cat gaa tat ttc cat aac tgg acc 912
Leu Asp Ile Glu Arg Val Ile Gly His Glu Tyr Phe His Asn Trp Thr
290 295 300
ggt aac cga gtg acc tgt cgc gac tgg ttc cag ctc agc ctg aaa gaa 960
Gly Asn Arg Val Thr Cys Arg Asp Trp Phe Gln Leu Ser Leu Lys Glu
305 310 315 320
ggt tta acc gtc ttc cgc gat cag gag ttc agc tct gac ctt ggt tcc 1008
Gly Leu Thr Val Phe Arg Asp Gln Glu Phe Ser Ser Asp Leu Gly Ser
325 330 335
cgc gca gtt aac cgc atc aat aat gta cgc acc atg cgc gga ttg cag 1056
Arg Ala Val Asn Arg lle Asn Asn Val Arg Thr Met Arg Gly Leu Gln
340 345 350
ttt gca gaa gac gcc agc ccg atg gcg cac ccg atc cgc ccg gat atg 1104
Phe Ala Glu Asp Ala Ser Pro Met Ala His Pro Ile Arg Pro Asp Met
355 360 365
gtc att gag atg aac aac ttc tac acc ctg acc gtt tac gag aag ggc 1152
Val Ile Glu Met Asn Asn Phe Tyr Thr Leu Thr Val Tyr Glu Lys Gly
370 375 380
gcg gaa gtg att cgc atg atc cac acc ctg ctt ggc gaa gaa aac ttc 1200
Ala Glu Val Ile Arg Met Ile His Thr Leu Leu Gly Glu Glu Asn Phe
385 390 395 400
cag aaa ggg atg cag ctt tat ttc gag cgt cat gat ggt agt gca gcg 1248
Gln Lys Gly Met Gln Leu Tyr Phe Glu Arg His Asp Gly Ser Ala Ala
405 410 415
acc tgt gac gac ttt gtg cag gcg atg gaa gat gcg tcg aat gtc gat 1296
Thr Cys Asp Asp Phe Val Gln Ala Met Glu Asp Ala Ser Asn Val Asp
420 425 430
ctc tcc cat ttc cgc cgt tgg tac agc cag tcc ggt aca ccg att gtg 1344
Leu Ser His Phe Arg Arg Trp Tyr Ser Gln Ser Gly Thr Pro Ile Val
435 440 445
acc gtc aaa gac gac tac aat ccg gaa acc gag cag tac acc ctg acc 1392
Thr Val Lys Asp Asp Tyr Asn Pro Glu Thr Glu Gln Tyr Thr Leu Thr
450 455 460
atc agc cag cgc acg cca gcc acg ccg gat cag gca gaa aaa cag ccg 1440
Ile Ser Gln Arg Thr Pro Ala Thr Pro Asp Gln Ala Glu Lys Gln Pro
465 470 475 480
ctg cat att ccg ttt gcc atc gaa ctg tat gat aac gaa ggc aaa gtg 1488
Leu His Ile Pro Phe Ala Ile Glu Leu Tyr Asp Asn Glu Gly Lys Val
485 490 495
atc ccg ttg cag aaa ggc ggt cat ccg gtg aat tcc gtg ctg aac gtc 1536
Ile Pro Leu Gln Lys Gly Gly His Pro Val Asn Ser Val Leu Asn Val
500 505 510
act cag gcg gaa cag acc ttt gtc ttt gat aat gtc tac ttc cag ccg 1584
Thr Gln Ala Glu Gln Thr Phe Val Phe Asp Asn Val Tyr Phe Gln Pro
515 520 525
gtg cct gcg ctg ctg tgc gaa ttc tct gcg cca gtg aaa ctg gaa tat 1632
Val Pro Ala Leu Leu Cys Glu Phe Ser Ala Pro Val Lys Leu Glu Tyr
530 535 540
aag tgg agc gat cag caa ctg acc ttc ctg atg cgt cat gcg cgt aat 1680
Lys Trp Ser Asp Gln Gln Leu Thr Phe Leu Met Arg His Ala Arg Asn
545 550 555 560
gat ttc tcc cgc tgg gat gcg gcg caa agt ttg ctg gca acc tac atc 1728
Asp Phe Ser Arg Trp Asp Ala Ala Gln Ser Leu Leu Ala Thr Tyr Ile
565 570 575
aag ctg aac gtc gcg cgt cat cag caa ggt cag ccg ctg tct ctg ccg 1776
Lys Leu Asn Val Ala Arg His Gln Gln Gly Gln Pro Leu Ser Leu Pro
580 585 590
gtg cat gtg gct gat gct ttc cgc gcg gta ctg ctt gat gag aag att 1824
Val His Val Ala Asp Ala Phe Arg Ala Val Leu Leu Asp Glu Lys Ile
595 600 605
gat cca gcg ctg gcg gca gaa atc ctg acg ctg cct tct gtc aat gaa 1872
Asp Pro Ala Leu Ala Ala Glu Ile Leu Thr Leu Pro Ser Val Asn Glu
610 615 620
atg gct gaa ttg ttc gat atc ate gac ccg att gct att gcc gaa gta 1920
Met Ala Glu Leu Phe Asp Ile Ile Asp Pro Ile Ala Ile Ala Glu Val
625 630 635 640
cgc gaa gca cte act cgt act ctg gcg act gaa ctg gcg gat gag cta 1968
Arg Glu Ala Leu Thr Arg Thr Leu Ala Thr Glu Leu Ala Asp Glu Leu
645 650 655
ctg gct att tac aac gcg aat tac cag agc gag tac cgt gtt gag cat 2016
Leu Ala Ile Tyr Asn Ala Asn Tyr Gln Ser Glu Tyr Arg Val Glu His
660 665 670
gaa gat att gca aaa cgc act ctg cgt aat gcc tgc ctg cgt ttc ctc 2064
Glu Asp Ile Ala Lys Arg Thr Leu Arg Asn Ala Cys Leu Arg Phe Leu
675 680 685
gct ttt ggt gaa acg cat ctg gct gat gtg ctg gtg agc aag cag ttc 2112
Ala Phe Gly Glu Thr His Leu Ala Asp Val Leu Val Ser Lys Gln Phe
690 695 700
cac gaa gca aac aat atg act gat gcg ctg gcg gcg ctt tct gcg gcg 2160
His Glu Ala Asn Asn Met Thr Asp Ala Leu Ala Ala Leu Ser Ala Ala
705 710 715 720
gtt gcc gca cag ctg cct tgc cgt gac gcg ctg atg cag gag tac gac 2208
Val Ala Ala Gln Leu Pro Cys Arg Asp Ala Leu Met Gln Glu Tyr Asp
725 730 735
gac aag tgg cat cag aac ggt ctg gtg atg gat aaa tgg ttt atc ctg 2256
Asp Lys Trp His Gln Asn Gly Leu Val Met Asp Lys Trp Phe Ile Leu
740 745 750
caa gcc acc agc ccg gcg gcg aat gtg ctg gag acg gtg cgc ggc ctg 2304
Gln Ala Thr Ser Pro Ala Ala Asn Val Leu Glu Thr Val Arg Gly Leu
755 760 765
ttg cag cat cgc tca ttt acc atg agc aac ccg aac cgt att cgt tcg 2352
Leu Gln His Arg Ser Phe Thr Met Ser Asn Pro Asn Arg Ile Arg Ser
770 775 780
ttg att ggc gcg ttt gcg ggc agc aat ccg gca gcg ttc cat gcc gaa 2400
Leu Ile Gly Ala Phe Ala Gly Ser Asn Pro Ala Ala Phe His Ala Glu
785 790 795 800
gat ggc agc ggt tac ctg ttc ctg gtg gaa atg ctt acc gac ctc aac 2448
Asp Gly Ser Gly Tyr Leu Phe Leu Val Glu Met Leu Thr Asp Leu Asn
805 810 815
agc cgt aac ccg cag gtg gct tca cgt ctg att gaa ccg ctg att cgc 2496
Ser Arg Asn Pro Gln Val Ala Ser Arg Leu Ile Glu Pro Leu Ile Arg
820 825 830
ctg aaa cgt tac gat gcc aaa cgt cag gag aaa atg cgc gcg gcg ctg 2544
Leu Lys Arg Tyr Asp Ala Lys Arg Gln Glu Lys Met Arg Ala Ala Leu
835 840 845
gaa cag ttg aaa ggg ctg gaa aat ctc tct ggc gat ctg tac gag aag 2592
Glu Gln Leu Lys Gly Leu Glu Asn Leu Ser Gly Asp Leu Tyr Glu Lys
850 855 860
ata act aaa gca ctg gct 2610
Ile Thr Lys Ala Leu Ala
865 870
<210>14
<211>1605
<212>DNA
<213>大肠杆菌
<400>14
atg cgt att tcc ttg aaa aag tca ggg atg ctg aag ctt ggt ctc agc 48
Met Arg Ile Ser Leu Lys Lys Ser Gly Met Leu Lys Leu Gly Leu Ser
1 5 10 15
ctg gtg gct atg acc gtc gca gca agt gtt cag gct aaa act ctg gtt 96
Leu Val Ala Met Thr Val Ala Ala Ser Val Gln Ala Lys Thr Leu Val
20 25 30
tat tgc tca gaa gga tct ccg gaa ggg ttt aac ccg cag ctg ttt acc 144
Tyr Cys Ser Glu Gly Ser Pro Glu Gly Phe Asn Pro Gln Leu Phe Thr
35 40 45
tcc ggc acc acc tat gac gcc tct tcc gtc ccg ctt tat aac cgt ctg 192
Ser Gly Thr Thr Tyr Asp Ala Ser Ser Val Pro Leu Tyr Asn Arg Leu
50 55 60
gtt gaa ttt aaa atc ggc acc acc gaa gtg atc ccg ggc ctc gct gaa 240
Val Glu Phe Lys Ile Gly Thr Thr Glu Val Ile Pro Gly Leu Ala Glu
65 70 75 80
aag tgg gaa gtc agc gaa gac ggt aaa acc tat acc ttc cat ctg cgt 288
Lys Trp Glu Val Ser Glu Asp Gly Lys Thr Tyr Thr Phe His Leu Arg
85 90 95
aaa ggt gtg aag tgg cac gac aat aaa gaa ttc aaa ccg acg cgt gaa 336
Lys Gly Val Lys Trp His Asp Asn Lys Glu Phe Lys Pro Thr Arg Glu
100 105 110
ctg aac gcc gat gat gtg gtg ttc tcg ttc gat cgt cag aaa aac gcg 384
Leu Asn Ala Asp Asp Val Val Phe Ser Phe Asp Arg Gln Lys Asn Ala
115 120 125
caa aac ccg tac cat aaa gtt tct ggc ggc agc tac gaa tac ttc gaa 432
Gln Asn Pro Tyr His Lys Val Ser Gly Gly Ser Tyr Glu Tyr Phe Glu
130 135 140
ggc atg ggc ttg cca gag ctg atc agt gaa gtg aaa aag gtg gac gac 480
Gly Met Gly Leu Pro Glu Leu Ile Ser Glu Val Lys Lys Val Asp Asp
145 150 155 160
aac acc gtt cag ttt gtg ctg act cgc ccg gaa gcg ccg ttc ctc gct 528
Asn Thr Val Gln Phe Val Leu Thr Arg Pro Glu Ala Pro Phe Leu Ala
165 170 175
gac ctg gca atg gac ttc gcc tct att ctg tca aaa gaa tat gct gat 576
Asp Leu Ala Met Asp Phe Ala Ser Ile Leu Ser Lys Glu Tyr Ala Asp
180 185 190
gcg atg atg aaa gcc ggt aca ccg gaa aaa ctg gac ctc aac cca atc 624
Ala Met Met Lys Ala Gly Thr Pro Glu Lys Leu Asp Leu Asn Pro Ile
195 200 205
gga acc ggt ccg ttc cag tta cag cag tat caa aaa gat tcc cgt atc 672
Gly Thr Gly Pro Phe Gln Leu Gln Gln Tyr Gln Lys Asp Ser Arg Ile
2l0 215 220
cgc tac aaa gcg ttt gat ggc tac tgg ggc acc aaa ccg cag atc gat 720
Arg Tyr Lys Ala Phe Asp Gly Tyr Trp Gly Thr Lys Pro Gln Ile Asp
225 230 235 240
acg ctg gtt ttc tct att acc cct gac gct tcc gtg cgt tac gcg aaa 768
Thr Leu Val Phe Ser Ile Thr Pro Asp Ala Ser Val Arg Tyr Ala Lys
245 250 255
ttg cag aag aat gaa tgc cag gtg atg ccg tac ccg aac ccg gca gat 816
Leu Gln Lys Asn Glu Cys Gln Val Met Pro Tyr Pro Asn Pro Ala Asp
260 265 270
atc gct cgc atg aag cag gat aaa tcc atc aat ctg atg gaa atg ccg 864
Ile Ala Arg Met Lys Gln Asp Lys Ser Ile Asn Leu Met Glu Met Pro
275 280 285
ggg ctg aac gtc ggt tat ctc tcg tat aac gtg cag aaa aaa cca ctc 912
Gly Leu Asn Val Gly Tyr Leu Ser Tyr Asn Val Gln Lys Lys Pro Leu
290 295 300
gat gac gtg aaa gtt cgc cag gct ctg acc tac gcg gtg aac aaa gac 960
Asp Asp Val Lys Val Arg Gln Ala Leu Thr Tyr Ala Val Asn Lys Asp
305 3l0 315 320
gcg atc atc aaa gcg gtt tat cag ggc gcg ggc gta tca gcg aaa aac 1008
Ala Ile Ile Lys Ala Val Tyr Gln Gly Ala Gly Val Ser Ala Lys Asn
325 330 335
ctg atc ccg cca acc atg tgg ggc tat aac gac gac gtt cag gac tac 1056
Leu Ile Pro Pro Thr Met Trp Gly Tyr Asn Asp Asp Val Gln Asp Tyr
340 345 350
acc tac gat cct gaa aaa gcg aaa gcc ttg ctg aaa gaa gcg ggt ctg 1104
Thr Tyr Asp Pro Glu Lys Ala Lys Ala Leu Leu Lys Glu Ala Gly Leu
355 360 365
gaa aaa ggt ttc tcc atc gac ctg tgg gcg atg ccg gta caa cgt ccg 1152
Glu Lys Gly Phe Ser Ile Asp Leu Trp Ala Met Pro Val Gln Arg Pro
370 375 380
tat aac ccg aac gct cgc cgc atg gcg gag atg att cag gca gac tgg 1200
Tyr Asn Pro Asn Ala Arg Arg Met Ala Glu Met Ile Gln Ala Asp Trp
385 390 395 400
gcg aaa gtc ggc gtg cag gcc aaa att gtc acc tac gaa tgg ggt gag 1248
Ala Lys Val Gly Val Gln Ala Lys Ile Val Thr Tyr Glu Trp Gly Glu
405 410 415
tac ctc aag cgt gcg aaa gat ggc gag cac cag acg gta atg atg ggc 1296
Tyr Leu Lys Arg Ala Lys Asp Gly Glu His Gln Thr Val Met Met Gly
420 425 430
tgg act ggc gat aac ggg gat ccg gat aac ttc ttc gcc acc ctg ttc 1344
Trp Thr Gly Asp Asn Gly Asp Pro Asp Asn Phe Phe Ala Thr Leu Phe
435 440 445
agc tgc gcc gcc tct gaa caa ggc tcc aac tac tca aaa tgg tgc tac 1392
Ser Cys Ala Ala Ser Glu Gln Gly Ser Asn Tyr Ser Lys Trp Cys Tyr
450 455 460
aaa ccg ttt gaa gat ctg att caa ccg gcg cgt gct acc gac gac cac 1440
Lys Pro Phe Glu Asp Leu Ile Gln Pro Ala Arg Ala Thr Asp Asp His
465 470 475 480
aat aaa cgc gtt gaa ctg tac aaa caa gcg cag gtg gtg atg cac gat 1488
Asn Lys Arg Val Glu Leu Tyr Lys Gln Ala Gln Val Val Met His Asp
485 490 495
cag gct ccg gca ctg atc atc gct cac tcc acc gtg ttt gaa ccg gta 1536
Gln Ala Pro Ala Leu Ile Ile Ala His Ser Thr Val Phe Glu Pro Val
500 505 510
cgt aaa gaa gtt aaa ggc tat gtg gtt gat cca tta ggc aaa cat cac 1584
Arg Lys Glu Val Lys Gly Tyr Val Val Asp Pro Leu Gly Lys His His
515 520 525
ttc gaa aac gtc tct atc gaa 1605
Phe Glu Ash Val Ser Ile Glu
530 535
<210>15
<211>1017
<212>DNA
<213>大肠杆菌
<400>15
atg ttg cag ttt att ctc cga cgt ttg gga ctc gtc atc ccc acg ttt 48
Met Leu Gln Phe Ile Leu Arg Arg Leu Gly Leu Val Ile Pro Thr Phe
1 5 10 15
atc ggt att acc ctt ctc aca ttt gcc ttt gtc cac atg atc ccg ggc 96
Ile Gly Ile Thr Leu Leu Thr Phe Ala Phe Val His Met Ile Pro Gly
20 25 30
gat ccg gtg atg atc atg gcg ggc gaa cgt ggg atc tcc cca gag cgt 144
Asp Pro Val Met Ile Met Ala Gly Glu Arg Gly Ile Ser Pro Glu Arg
35 40 45
cac gcg cag ctg ctg gct gaa ctc ggc tta gat aaa ccg atg tgg cag 192
His Ala Gln Leu Leu Ala Glu Leu Gly Leu Asp Lys Pro Met Trp Gln
50 55 60
cag tat ctc cat tac att tgg ggc gtt atg cat ggc gat cta ggc att 240
Gln Tyr Leu His Tyr Ile Trp Gly Val Met His Gly Asp Leu Gly Ile
65 70 75 80
tca atg aaa agc cgc atc ccg gtt tgg gaa gag ttc gtg ccg cgc ttc 288
Ser Met Lys Ser Arg Ile Pro Val Trp Glu Glu Phe Val Pro Arg Phe
85 90 95
cag gcc acg ctg gaa ctt ggc gtc tgc gcg atg att ttt gct acg gca 336
Gln Ala Thr Leu Glu Leu Gly Val Cys Ala Met Ile Phe Ala Thr Ala
100 105 110
gtc ggt att ccg gtc ggc gtg ctg gct gcg gtt aaa cgc ggt tcc att 384
Val Gly Ile Pro Val Gly Val Leu Ala Ala Val Lys Arg Gly Ser Ile
115 120 125
ttc gat cac aca gcg gtt ggc ctg gcg ctg aca ggt tat tca atg cct 432
Phe Asp His Thr Ala Val Gly Leu Ala Leu Thr Gly Tyr Ser Met Pro
130 135 140
atc ttc tgg tgg ggc atg atg ctg atc atg ctg gtt tcg gtg cac tgg 480
Ile Phe Trp Trp Gly Met Met Leu Ile Met Leu Val Ser Val His Trp
145 150 155 160
aac ctg acg ccc gtc tcc ggt cgc gtg agc gat atg gtg ttc ctc gat 528
Asn Leu Thr Pro Val Ser Gly Arg Val Ser Asp Met Val Phe Leu Asp
165 170 175
gac tcc aat ccg tta acc ggt ttt atg cta atc gac acc gcc atc tgg 576
Asp Ser Asn Pro Leu Thr Gly Phe Met Leu Ile Asp Thr Ala Ile Trp
180 185 190
ggt gaa gac ggc aac ttt atc gat gcc gtc gcc cat atg atc ttg cct 624
Gly Glu Asp Gly Asn Phe Ile Asp Ala Val Ala His Met Ile Leu Pro
195 200 205
gcc att gtg ctg ggt act att ccg ctg gcg gtc att gtg cgt atg aca 672
Ala Ile Val Leu Gly Thr Ile Pro Leu Ala Val Ile Val Arg Met Thr
210 215 220
cgc tcc tcg atg ctg gaa gtg ctg ggc gag gat tac atc cgc acc gcg 720
Arg Ser Ser Met Leu Glu Val Leu Gly Glu Asp Tyr Ile Arg Thr Ala
225 230 235 240
cgc gcc aaa ggg cta acc cgc atg cgg gtg att atc gtc cat gcg ctg 768
Arg Ala Lys Gly Leu Thr Arg Met Arg Val Ile Ile Val His Ala Leu
245 250 255
cgt aac gcg atg ctg ccg gtg gtg acc gtt atc ggc ctg cag gtg gga 816
Arg Asn Ala Met Leu Pro Val Val Thr Val Ile Gly Leu Gln Val Gly
260 265 270
aca ttg ctg gcg ggg gcg att ctg acc gaa acc atc ttc tcg tgg ccc 864
Thr Leu Leu Ala Gly Ala Ile Leu Thr Glu Thr Ile Phe Ser Trp Pro
275 280 285
ggt ctg gga cgc tgg ttg att gac gca ctg caa cgc cgc gac tat ccg 912
Gly Leu Gly Arg Trp Leu Ile Asp Ala Leu Gln Arg Arg Asp Tyr Pro
290 295 300
gta gtg cag ggc ggc gta ttg ctg gtg gcg acg atg att atc ctc gtc 960
Val Val Gln Gly Gly Val Leu Leu Val Ala Thr Met Ile Ile Leu Val
305 310 315 320
aac ttg ctg gtc gat ctg ctg tac ggc gtg gtg aac ccg cgt att cgt 1008
Asn Leu Leu Val Asp Leu Leu Tyr Gly Val Val Asn Pro Arg Ile Arg
325 330 335
cat aag aag 1017
His Lys Lys
<210>16
<211>900
<212>DNA
<213>大肠杆菌
<400>16
atg tca cag gtt act gaa aat aaa gtg att agc gca ccg gtg ccg atg 48
Met Ser Gln Val Thr Glu Asn Lys Val Ile Ser Ala Pro Val Pro Met
l 5 10 15
acc ccg tta cag gag ttc tgg cac tat ttt aaa cgc aac aaa ggc gcg 96
Thr Pro Leu Gln Glu Phe Trp His Tyr Phe Lys Arg Asn Lys Gly Ala
20 25 30
gtc gtc ggg ctg gtt tac gtc gtc atc gtg ctg ttc atc gcg atc ttt 144
Val Val Gly Leu Val Tyr Val Val Ile Val Leu Phe Ile Ala Ile Phe
35 40 45
gcc aac tgg att gca ccc tat aac ccg gcg gaa cag ttc cgc gat gca 192
Ala Asn Trp Ile Ala Pro Tyr Asn Pro Ala Glu Gln Phe Arg Asp Ala
50 55 60
ctg ctc gcc ccg cca gcc tgg cag gaa ggc ggc agc atg gcg cac ttg 240
Leu Leu Ala Pro Pro Ala Trp Gln Glu Gly Gly Ser Met Ala His Leu
65 70 75 80
ctg ggc acc gat gac gta ggc cgt gat gtg ctg tcg cgc ctg atg tac 288
Leu Gly Thr Asp Asp Val Gly Arg Asp Val Leu Ser Arg Leu Met Tyr
85 90 95
ggt gcg cgc ctg tcg ctg ctg gtt ggc tgt ctg gta gtt gtg tta tcg 336
Gly Ala Arg Leu Ser Leu Leu Val Gly Cys Leu Val Val Val Leu Ser
100 105 110
ctg att atg ggc gtt att ctc ggc ctg atc gcc ggt tac ttt ggc ggc 384
Leu Ile Met Gly Val Ile Leu Gly Leu Ile Ala Gly Tyr Phe Gly Gly
115 120 125
ctg gtc gat aac atc att atg cgc gtg gtc gat atc atg ctg gcg ctg 432
Leu Val Asp Asn Ile Ile Met Arg Val Val Asp Ile Met Leu Ala Leu
130 135 140
cca agt ctg ctg ctg gcg ctg gtg ctg gtg gca att ttc ggc ccg tcg 480
Pro Ser Leu Leu Leu Ala Leu Val Leu Val Ala Ile Phe Gly Pro Ser
145 150 155 160
att ggt aac gcc gcg ctg gca ctg acc ttc gtt gcc ttg ccg cac tat 528
Ile Gly Asn Ala Ala Leu Ala Leu Thr Phe Val Ala Leu Pro His Tyr
165 170 175
gtg cgc tta acc cgc gcc gcc gtg ctg gtg gaa gtt aac cgc gat tac 576
Val Arg Leu Thr Arg Ala Ala Val Leu Val Glu Val Asn Arg Asp Tyr
180 185 190
gtc acc gcg tct cgc gtg gcg ggt gcc ggg gcg atg cgt cag atg ttt 624
Val Thr Ala Ser Arg Val Ala Gly Ala Gly Ala Met Arg Gln Met Phe
195 200 205
att aac atc ttc ccg aac tgc ctt gcg ccg ctg att gtt cag gcg tcg 672
Ile Asn Ile Phe Pro Asn Cys Leu Ala Pro Leu Ile Val Gln Ala Ser
210 215 220
ctc ggt ttc tct aac gcc att ctc gat atg gct gct ctt ggt ttc ctc 720
Leu Gly Phe Ser Asn Ala Ile Leu Asp Met Ala Ala Leu Gly Phe Leu
225 230 235 240
ggc atg ggg gca cag ccg cca acg cct gag tgg ggc acc atg ctc tcc 768
Gly Met Gly Ala Gln Pro Pro Thr Pro Glu Trp Gly Thr Met Leu Ser
245 250 255
gac gtg ttg cag ttc gcg caa agc gcc tgg tgg gtc gtg acc ttc ccg 816
Asp Val Leu Gln Phe Ala Gln Ser Ala Trp Trp Val Val Thr Phe Pro
260 265 270
ggt ctg gcg atc ctg ctg acg gtg ctg gca ttt aac ctg atg ggt gac 864
Gly Leu Ala Ile Leu Leu Thr Val Leu Ala Phe Asn Leu Met Gly Asp
275 280 285
ggt ctg cgt gac gcg ctc gat ccc aaa ctg aag cag 900
Gly Leu Arg Asp Ala Leu Asp Pro Lys Leu Lys Gln
290 295 300
<210>17
<211>981
<212>DNA
<213>大肠杆菌
<400>17
atg gcg tta tta aat gta gat aaa tta tcg gtg cat ttc ggc gac gaa 48
Met Ala Leu Leu Asn Val Asp Lys Leu Ser Val His Phe Gly Asp Glu
1 5 10 15
agc gcg ccg ttc cgc gcc gta gac cgc atc agc tac agc gta aaa cag 96
Ser Ala Pro Phe Arg Ala Val Asp Arg Ile Ser Tyr Ser Val Lys Gln
20 25 30
ggc gaa gtg gtc ggg att gtg ggt gag tcc ggc tcc ggt aag tcg gtc 144
Gly Glu Val Val Gly Ile Val Gly Glu Ser Gly Ser Gly Lys Ser Val
35 40 45
agt tca ctg gcg att atg ggg ctg att gat tat ccg ggc cgc gta atg 192
Ser Ser Leu Ala Ile Met Gly Leu Ile Asp Tyr Pro Gly Arg Val Met
50 55 60
gca gaa aaa ctg gag ttt aac ggc cag gat ttg cag cgt atc tca gaa 240
Ala Glu Lys Leu Glu Phe Asn Gly Gln Asp Leu Gln Arg Ile Ser Glu
65 70 75 80
aaa gag cgc cgc aac ctg gtg ggt gcc gaa gtg gcg atg atc ttc cag 288
Lys Glu Arg Arg Asn Leu Val Gly Ala Glu Val Ala Met Ile Phe Gln
85 90 95
gac ccg atg acc agc ctt aac ccg tgc tac acc gtg ggt ttc cag att 336
Asp Pro Met Thr Ser Leu Asn Pro Cys Tyr Thr Val Gly Phe Gln Ile
100 105 110
atg gaa gcg att aag gtg cat cag ggc ggc aac aaa agt acc cgc cgt 384
Met Glu Ala Ile Lys Val His Gln Gly Gly Asn Lys Ser Thr Arg Arg
115 120 125
cag cga gcg att gac ctg ctg aat cag gtc ggt att ccc gat ccg gca 432
Gln Arg Ala Ile Asp Leu Leu Asn Gln Val Gly Ile Pro Asp Pro Ala
130 135 140
tcg cgt ctg gat gtt tac ccg cat cag ctt tcc ggc ggc atg agc cag 480
Ser Arg Leu Asp Val Tyr Pro His Gln Leu Ser Gly Gly Met Ser Gln
145 150 155 160
cgc gtg atg atc gcc atg gcg att gcc tgt cgg cca aaa ctg ctg att 528
Arg Val Met Ile Ala Met Ala Ile Ala Cys Arg Pro Lys Leu Leu Ile
165 170 175
gcc gat gaa ccg acc acc gcg ctg gac gtg acc att cag gcg caa atc 576
Ala Asp Glu Pro Thr Thr Ala Leu Asp Val Thr Ile Gln Ala Gln Ile
180 185 190
atc gaa cta ctg ctg gag cta cag cag aaa gag aac atg gcg ctg gtg 624
Ile Glu Leu Leu Leu Glu Leu Gln Gln Lys Glu Asn Met Ala Leu Val
195 200 205
tta att acc cat gac ctg gcg ctg gtg gcg gaa gcg gca cat aaa atc 672
Leu Ile Thr His Asp Leu Ala Leu Val Ala Glu Ala Ala His Lys Ile
210 215 220
atc gtg atg tat gca ggc cag gtg gtg gaa acc ggt gat gcg cac gcc 720
Ile Val Met Tyr Ala Gly Gln Val Val Glu Thr Gly Asp Ala His Ala
225 230 235 240
atc ttc cat gcg ccg cgt cac ccg tat act cag gca ttg ctg cgt gcg 768
Ile Phe His Ala Pro Arg His Pro Tyr Thr Gln Ala Leu Leu Arg Ala
245 250 255
ctg cca gaa ttt gct cag gac aaa gaa cgt ctg gcg tcg ttg cca ggt 816
Leu Pro Glu Phe Ala Gln Asp Lys Glu Arg Leu Ala Ser Leu Pro Gly
260 265 270
gtc gtt ccc ggc aag tac gac cgc ccg aac ggc tgc ctg ctt aac ccg 864
Val Val Pro Gly Lys Tyr Asp Arg Pro Asn Gly Cys Leu Leu Asn Pro
275 280 285
cgc tgc ccc tat gcc act gac aga tgt cgc gct gaa gaa ccg gcg ctg 912
Arg Cys Pro Tyr Ala Thr Asp Arg Cys Arg Ala Glu Glu Pro Ala Leu
290 295 300
aat atg ctc gct gac ggg cgt cag tcc aaa tgc cat tac cca ctt gat 960
Asn Met Leu Ala Asp Gly Arg Gln Ser Lys Cys His Tyr Pro Leu Asp
305 310 315 320
gat gcc ggg agg ccg aca cta 981
Asp Ala Gly Arg Pro Thr Leu
325
<210>18
<211>1002
<212>DNA
<213>大肠杆菌
<400>18
atg agt acg caa gag gcc acc ctg caa caa ccg ctg ttg cag gct atc 48
Met Ser Thr Gln Glu Ala Thr Leu Gln Gln Pro Leu Leu Gln Ala Ile
1 5 10 15
gac ctg aaa aaa cat tat ccg gtg aag aaa ggc atg ttc gcg ccg gaa 96
Asp Leu Lys Lys His Tyr Pro Val Lys Lys Gly Met Phe Ala Pro Glu
20 25 30
cgt ctg gtt aaa gcg ctg gat ggc gtt tcg ttt aac ctt gaa cgt ggc 144
Arg Leu Val Lys Ala Leu Asp Gly Val Ser Phe Asn Leu Glu Arg Gly
35 40 45
aaa acg ctg gca gta gtg ggc gaa tct ggc tgc ggt aaa tcg acc ctc 192
Lys Thr Leu Ala Val Val Gly Glu Ser Gly Cys Gly Lys Ser Thr Leu
50 55 60
ggt cgg ttg ctg acg atg att gaa atg ccc acc ggt ggc gag ctg tat 240
Gly Arg Leu Leu Thr Met Ile Glu Met Pro Thr Gly Gly Glu Leu Tyr
65 70 75 80
tac cag ggg cag gat ctg ctt aag cac gat ccg cag gcg cag aag ctg 288
Tyr Gln Gly Gln Asp Leu Leu Lys His Asp Pro Gln Ala Gln Lys Leu
85 90 95
cgt cgg cag aaa atc cag atc gtc ttc cag aac cct tac ggt tcg ctg 336
Arg Arg Gln Lys Ile Gln Ile Val Phe Gln Asn Pro Tyr Gly Ser Leu
100 105 110
aat ccg cgt aaa aaa gtc ggg caa att ctt gaa gag ccg ctg ctg atc 384
Asn Pro Arg Lys Lys Val Gly Gln Ile Leu Glu Glu Pro Leu Leu Ile
115 120 125
aac acc agc tta agc aaa gaa cag cgt cgg gaa aaa gcc ctg tcg atg 432
Asn Thr Ser Leu Ser Lys Glu Gln Arg Arg Glu Lys Ala Leu Ser Met
130 135 140
atg gcg aaa gtc ggc ctg aaa acc gag cac tat gac cgc tat ccg cat 480
Met Ala Lys Val Gly Leu Lys Thr Glu His Tyr Asp Arg Tyr Pro His
145 150 155 160
atg ttc tcc ggc ggt cag cgt cag cgt atc gcc atc gcc cgt ggt ctg 528
Met Phe Ser Gly Gly Gln Arg Gln Arg Ile Ala Ile Ala Arg Gly Leu
165 170 175
atg ctc gac ccg gat gtg gtg att gcc gat gaa ccg gtt tcc gcg ctg 576
Met Leu Asp Pro Asp Val Val Ile Ala Asp Glu Pro Val Ser Ala Leu
180 185 190
gat gtt tca gtg cgc gcg cag gtg ctg aat ctg atg atg gat ttg cag 624
Asp Val Ser Val Arg Ala Gln Val Leu Asn Leu Met Met Asp Leu Gln
195 200 205
cag gag ttg ggg ctg tct tat gtc ttt atc tcc cac gac ctg tcg gtg 672
Gln Glu Leu Gly Leu Ser Tyr Val Phe Ile Ser His Asp Leu Ser Val
210 215 220
gtg gag cac att gct gat gaa gtg atg gtg atg tac ctg ggc cgc tgc 720
Val Glu His Ile Ala Asp Glu Val Met Val Met Tyr Leu Gly Arg Cys
225 230 235 240
gtg gag aag gga acg aaa gac caa atc ttc aat aac ccg cgc cat ccg 768
Val Glu Lys Gly Thr Lys Asp Gln Ile Phe Ash Asn Pro Arg His Pro
245 250 255
tac act cag gcg cta ctt tcc gcg acg ccg cgc ctg aac ccg gac gat 816
Tyr Thr Gln Ala Leu Leu Ser Ala Thr Pro Arg Leu Asn Pro Asp Asp
260 265 270
cgc cgc gag cgc atc aag ctc agc ggt gaa cta cca agc cca ctg aat 864
Arg Arg Glu Arg Ile Lys Leu Ser Gly Glu Leu Pro Ser Pro Leu Asn
275 280 285
cca ccg ccg ggt tgc gcc ttc aac gcc cgc tgt cgt cgg cgc ttc ggc 912
Pro Pro Pro Gly Cys Ala Phe Asn Ala Arg Cys Arg Arg Arg Phe Gly
290 295 300
ccc tgc acc cag ttg cag ccg cag cta aaa gac tac ggc ggt caa ctg 960
Pro Cys Thr Gln Leu Gln Pro Gln Leu Lys Asp Tyr Gly Gly Gln Leu
305 310 315 320
gta gct tgt ttt gct gtt gat cag gat gaa aat ccg cag cgt 1002
Val Ala Cys Phe Ala Val Asp Gln Asp Glu Asn Pro Gln Arg
325 330
<210>19
<211>472
<212>PRT
<213>枯草芽孢杆菌168(Bacillus subtilis 168)
<400>19
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>20
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC6633
<400>20
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>21
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1213
<400>21
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>22
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1107
<400>22
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
405 410 415
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>23
<211>472
<212>PRT
<213>枯草芽孢杆菌IAM1214
<400>23
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>24
<211>472
<212>PRT
<213>枯草芽孢杆菌ATCC21555
<400>24
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385 390 395 400
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
405 410 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Ala Leu Ser Val
465 470
<210>25
<211>472
<212>PRT
<213>解淀粉芽孢杆菌IF03022(Bacillus amyloliquefaciens IF03022)
<400>25
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145 150 155 160
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385 390 395 400
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
Thr Ala Lys Tyr Ala Leu Pro Val
465 470
<210>26
<211>1416
<212>DNA
<213>枯草芽孢杆菌168
<400>26
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gaa cac cct gat tcc att tat tgg gcg cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttt gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc caa att cct gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>27
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC6633
<400>27
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>28
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1213
<400>28
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Set Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctc gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggt ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aat aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta att gaa tcg gca gcc aga ttc gcc ggc tgg aat atg atc ccc 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctt tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg caa cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa act gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat ctg cct gac ggg ctt tta aaa ggg gat act gag atc gtt 1248
Ala Ile Asp Leu Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 4l0 415
tct ttt tcg gcc gca gca cca gga act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>29
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1107
<400>29
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc gta aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Val Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gac tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttc ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ttg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tct atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser IIe Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag gtc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Val Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta att gaa tcg gca gcc aga ttt gcc ggc tgg aat atg atc cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gat gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtc gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc ttt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Phe
405 410 415
tct ttt tcg gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>30
<211>1416
<212>DNA
<213>枯草芽孢杆菌IAM1214
<400>30
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtt agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca ata aca gcc tcc cat gca gca ctg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt cag agc 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Gln Ser
50 55 60
tta gct gat ttt gag cat ccc gat tca att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aag cct gaa gaa gag gtt gtc gag caa atc gtc aag gtt gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
caa atg ttt gag gcg gac gcc atc aca aca aac aat gaa tta ttc att 336
Gln Met Phe Glu Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gcc ccg atg gcg aaa gcc tgt gaa cgc ctt ggc ctg agg ggc gcc gga 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcg gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcg gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gag gat ttt cgt gct gca ctt gaa gag atc ggc aca cct cta atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggc gta acg ctg att acc 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac acg gag acg gca gaa gat gaa ttt aac aga gtc aat gac tac ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tcg att aac gtg ccg aag gcg gtc aca ttt gaa gca ccg ttt att 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gag gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agc ata gaa ggc att atg gca gat ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttt ccg atc gcc att cat gac aaa acg ccg caa att gga ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tca cat att acg cca tcc att ctg gat gaa gag gcg aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gcg gct aaa aag gca aat gaa ggg ctt gga ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gaa atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gct gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aac att aaa aag gtt ttc ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gat gct gat ctg ccg gac ggg tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tac tat gtt gct gac tgc cat ctg tac cct cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag atc cct gaa act gcc gag gat ttg gta atc gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gat ggg ctt ttg aag ggt gat aca gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
act ttt tcg gct gcg gca cca gga aca tca gtt gat ttg aca ctg ttt 1296
Thr Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gcc ttc aac tcc att gct gca ttt gaa ctg aaa ggc agc aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gcg aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>31
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC21555
<400>31
atg gag aga aaa aca gta ttg gtt atc gct gat ctt ggg ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga ccc ttt gca att aca gcc tct cat gcg gcc tta att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg att gcg gtc att aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
ctg gct gat ttt gaa cat ccc gat tcg att tat tgg gct cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aaa cct gag gaa gaa gtc gtc gaa gaa atc gtg aaa gtg gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
gac atg ttt ggg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336
Asp Met Phe Gly Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gca aaa gcg tgt aaa cgt ctc ggc ctg cgg gga gcg ggc 384
Ala Pro Met Ala Lys Ala Cys Lys Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gta cag gcc gct gaa aac gcc aga gat aaa aat aaa atg aga gcc gcc 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
ttc aac cgg gcc ggc gtc aaa tcc atc aaa aac aaa cgg gtg acg acc 480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctt att 528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
ctg aag cct aca tat ctg gca agc tcg atc ggc gtg acg ctt att aaa 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
gag atg gaa acg gcc gaa gct gaa ttc aac aga gtc aat gag tac ttg 624
Glu Met Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
aaa tcg att aat gta ccg aaa gcg gtg acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gcg gaa gaa ttc ttg cag ggc gag tat gat gac tgg tac gaa aca agc 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
ggt tat tcc gac tat atc agc atc gaa ggc atc atg gcc gac gga gaa 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tac ttc ccc gtt gcg atc cat gat aaa aca ccg caa atc gga ttc acg 816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca gcg cat att acg ccg tcc atc ctg gat gat gac gcc aag cgg 864
Glu Thr Ala His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
aaa atc gtc gaa gct gcc aag aag gcg aat gaa gga ctc ggc ctc gaa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
aac tgt gca acg cat aca gaa ata aaa tta atg aaa aac cgg gaa gcc 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
gga ctg att gag tca gcg gcc aga ttc gcg gga tgg aat atg att ccg 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttc ggc gtt gat atg gcg cag cta tta ttg gat 1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt tac gga aaa gaa gct gat ctg ccg aaa gga tta ttg gag 1104
Val Leu Cys Tyr Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
cag gag cca tgc tat gtc gca gac tgc cac ttg tat cct cag cat ttc 1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa gag aac ggc cag ctg cct gag acg gtt gtc gat ttc gtc att gaa 1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Val Val Asp Phe Val Ile Glu
385 390 395 400
agc att gaa att cct gac ggc gtc tta aag gga gac act gaa ctc gtt 1248
Ser Ile Glu Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Leu Val
405 410 415
tct ttc tca gcg gct gag gcg ggt acg tca gtg gat ctg cgg ctg ttc 1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Ser Val Asp Leu Arg Leu Phe
420 425 430
gaa gcg ttc aac agc att gcg gcg ttt gag ctg aaa gga agc aat tcg 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
aac gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg 1392
Asn Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
act gca aag tat gcg tta tcg gta 1416
Thr Ala Lys Tyr Ala Leu Set Val
<210>32
<211>1416
<212>DNA
<213>解淀粉芽孢杆菌IF03022
<400>32
atg gag aga aaa aca gta ttg gtt atc gct gac ctt ggg gga tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cat atg ttt tac aaa agc gca gcc gaa aaa tac aac ctc gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att ccg aga cct ttt gca att aca gcc tct cat gcg gca tta att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
ctg gct gat ttt gag cat ccc gat tcg att tac tgg gct cat gaa gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat gac aaa cct gag gaa gaa gta gtc gaa gaa atc gtc aag gtg gcc 288
His Asp Lys Pro Glu Glu Glu Val Val Glu Glu Ile Val Lys Val Ala
85 90 95
ggc atg ttc gcg gtt gac gcc att acg acc aac aat gaa ctg ttt atc 336
Gly Met Phe Ala Val Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gca aaa gcg tgt gaa cgt ctc ggc ctg cgg gga gcg ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gta cag gcc gct gaa aat gcc aga gat aaa aac aaa atg aga gcc gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Ala Ala
130 135 140
ttc aac cgg gcc ggc gtc aag tct atc aaa aac aga cgg gtg acg acg 480
Phe Asn Arg Ala Gly Val Lys Ser Ile Lys Asn Arg Arg Val Thr Thr
145 150 155 160
ctg gaa gat ttc cgc gcc gcg ctt cag gaa atc gga acg ccg ctc att 528
Leu Glu Asp Phe Arg Ala Ala Leu Gln Glu Ile Gly Thr Pro Leu Ile
165 170 175
ctg aag cct aca tat ctg gcg agc tcc atc ggc gtg acg ctc atc aaa 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Lys
180 185 190
gag agg gaa acg gcc gaa gcc gaa ttt aac aga gtc aat gaa tac ctg 624
Glu Arg Glu Thr Ala Glu Ala Glu Phe Asn Arg Val Asn Glu Tyr Leu
195 200 205
aag tcg atc aac gta ccg aaa gcg gtc acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gcg gaa gaa ttt ttg cag ggc gag tat gac gac tgg tac gaa aca agc 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Asp Asp Trp Tyr Glu Thr Ser
225 230 235 240
ggt tat tcc gac tat atc agc ata gaa ggc atc atg gcc gac gga gaa 768
Gly Tyr Ser Asp Tyr IIe Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tac ttc cct gtc gca att cat gat aaa aca ccg caa atc gga ttc acg 816
Tyr Phe Pro Val Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcg cat att acg ccg tcc atc ctg gat gat gac gcg aag cgg 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Asp Asp Ala Lys Arg
275 280 285
aaa atc gtc gaa gca gcc aaa aag gcg aat gaa gga ctc ggc ctc gaa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Glu
290 295 300
aac tgc gca acc cat aca gag att aaa tta atg aaa aac cgg gaa gcc 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Ala
305 310 315 320
gga ctg att gaa tca gcg gca cga ttt gcg ggc tgg aac atg att ccg 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttc ggc gtc gat atg gcg cag ctg tta ttg gat 1056
Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtt ctc tgt ttc gga aaa gaa gcc gat ctg ccg aaa gga tta ttg gag 1104
Val Leu Cys Phe Gly Lys Glu Ala Asp Leu Pro Lys Gly Leu Leu Glu
355 360 365
cag gag ccg tgc tat gtc gcc gac tgc cac ttg tat cct cag cat ttc 1152
Gln Glu Pro Cys Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa gag aac ggc cag ctg cct gag acg gct gtc gat ttc gtc att gaa 1200
Lys Glu Asn Gly Gln Leu Pro Glu Thr Ala Val Asp Phe Val Ile Glu
385 390 395 400
agc att gac att ccc gac ggc gtc tta aag gga gac acc gaa atc gtt 1248
Ser Ile Asp Ile Pro Asp Gly Val Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tct ttc tcg gcg gcc gag gcg ggt aca tcc gtg gat ctg cgg ctg ttc 1296
Ser Phe Ser Ala Ala Glu Ala Gly Thr Set Val Asp Leu Arg Leu Phe
420 425 430
gaa gcg ttc aac agc att gcg gcg ttc gag ctg aaa gga agc aat tcg 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
ggt gac gtg gcc gaa tca atc aaa caa att cag cag cag gcg aag ctg 1392
Gly Asp Val Ala Glu Ser Ile Lys Gln Ile Gln Gln Gln Ala Lys Leu
450 455 460
act gca aag tat gcg tta ccg gta 1416
Thr Ala Lys Tyr Ala Leu Pro Val
<210>33
<211>93
<212>PRT
<213>枯草芽孢杆菌168
<400>33
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
1 5 10 15
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
20 25 30
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
35 40 45
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
50 55 60
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
65 70 75 80
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
85 90
<210>34
<211>279
<212>DNA
<213>枯草芽孢杆菌168
<400>34
ggt gcc ggc gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg 48
Gly Ala Gly Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met
1 5 10 15
agg gac gct ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga 96
Arg Asp Ala Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg
20 25 30
gtc aca act ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca 144
Val Thr Thr Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr
35 40 45
cct ctt atc tta aag cct aca tac tta gcg agt tct atc ggt gta acg 192
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
50 55 60
ctg att acg gac act gag acg gca gaa gat gaa ttt aac aga gtc aat 240
Leu Ile Thr Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn
65 70 75 80
gac tat ctg aaa tca att aac gtg cca aag gcg gtt acg 279
Asp Tyr Leu Lys Ser Ile Asn Val Pro Lys Ala Val Thr
85 90
<210>35
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>35
ttaaccatgg agagaaaaac agtattg 27
<210>36
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>36
atatggatcc tactggcagc acatactttg 30
<210>37
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>37
caccgcagac ggaggataca c 21
<210>38
<211>22
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>38
cggacgtcac ccaataatcg tg 22
<210>39
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>39
gaagttccta tactttctag agaataggaa cttc 34
<210>40
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>40
ctaaccctgt gacctgcaat actgttttgc gggtgagtgt aggctggagc tgcttc 56
<210>41
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>41
gaaactgccg gaaggcgatt aaacgccatc cggcagcata tgaatatcct ccttag 56
<210>42
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>42
ttacgcaaca ggaatagact gaacaccaga ctctatgtgt aggctggagc tgcttc 56
<210>43
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>43
agaaaacagg ggtaaattcc ccgaatggcg gcgctacata tgaatatcct ccttag 56
<210>44
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>44
atggagttta gtgtaaaaag cggtagcccg gagaaagtgt aggctggagc tgcttc 56
<210>45
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>45
ttactcttcg ccgttaaacc cagcgcggtt taacagcata tgaatatcct ccttag 56
<210>46
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>46
atgacagaag cgatgaagat taccctctct acccaagtgt aggctggagc tgcttc 56
<210>47
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>47
ttacgccgtt aacagattag ctatcgtgcg cacacccata tgaatatcct ccttag 56
<210>48
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>48
gcatccccac ctcataacgt tgacccgacc gggcaagtgt aggctggagc tgcttc 56
<210>49
<211>56
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>49
ctgtacggca ttttgctatg cttgtcgcca ctgttgcata tgaatatcct ccttag 56
<210>50
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>50
gtgtctgaac tgtctcaatt a 21
<210>51
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>51
cggaatttct ttcagcagtt c 21
<210>52
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>52
atgactcaac agccacaagc c 21
<210>53
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>53
tgctttagtt atcttctcgt a 21
<210>54
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>54
agtgcctgca tcgtcgtggg c 21
<210>55
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>55
ggcgcctttt gctttaccag a 21
<210>56
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>56
gacgcgcgct ggggagaaaa a 21
<210>57
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>57
cgtagcgccc gcagaccact g 21
<210>58
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>58
atgcgtattt ccttgaaaaa g 21
<210>59
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>59
ttattcgata gagacgtttt c 21
<210>60
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>60
tacactcgag attaaagagg agaaattaa 29
<210>61
<211>30
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>61
ttaggatcct catactggca gcacatactt 30
<210>62
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>62
caagaattct catgtttgac agct 24
<210>63
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>63
taactcgaga ttcccttttt acgtgaac 28
<210>64
<211>1428
<212>DNA
<213>短小芽孢杆菌NRRL B-12025(Bacillus pumilus NRRL B-12025)
<400>64
gtg ctt tca ttg agt aaa aaa act gta ctt gtc att gct gac tta gga 48
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
1 5 10 15
ggg tgc ccg ccc cat atg ttt tat gaa agc gtg gcg gca tca tac cat 96
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
20 25 30
atc gtt tct tat atc cca aga ccc ttt gcg att aca aag gga cat gcc 144
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
35 40 45
gag cta atc gaa aaa tac tcc att gcc gtc atc aaa gac cgt gat tat 192
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
50 55 60
ttt gag aca cac cct tct ttt gaa cac cct gat tct att tac tgg gca 240
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
65 70 75 80
cat gat gat tat cca aaa tca gaa gaa gaa gtt gtg gaa gac ttc att 288
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
85 90 95
cga gta gct tcc ttt ttc aaa gca gat gca atc acg acc aat aat gaa 336
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
100 105 110
tta ttc att gca ccg atg gca aag gcc gct gaa cgt ctt ggg cta cga 384
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
115 120 125
ggt gcc ggt gtc aag gca gcc gaa atg gcg cgt gat aaa agc caa atg 432
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
130 135 140
agg gct gca ttc aat gcc tct ggc gtc aaa gcg gtg aaa act cag cct 480
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145 150 155 160
gtc acg act tta tct gat ttc caa caa gcc att gag tct atc gga aca 528
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
165 170 175
ccg ctc att tta aag cct aca tat tta gcc agt tct att ggc gtc acc 576
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
180 185 190
ttg ttt cat gac aaa gcc gga agt gat gac ttg ttt tta caa gta caa 624
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
195 200 205
tcg tat ttg gaa acc ata cca gtc cca gac gct gtc acg tat gaa gca 672
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
210 215 220
ccg ttt gtc gct gaa aca tat tta gag ggt gct tac gaa gat tgg tat 720
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225 230 235 240
gaa gac gaa gga tat gct gat tat gtc agt gta gaa ggg ctg gtc gta 768
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
245 250 255
gag ggc gaa tat ctc cct ttt gtc ata cat gat aaa acc cct caa atc 816
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
260 265 270
ggc ttt aca gaa acg gct cat atc act ccg acg atc tta gac aat gaa 864
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
275 280 285
gcc aag caa atc atc att gaa gca gca agg aag gca aat gaa ggg cta 912
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
290 295 300
ggt ctt gaa cat tgt gca acc cat aca gaa atc aaa ctc atg aaa aat 960
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305 310 315 320
cga gaa act gga ctg atc gag gca gcg gct cga ttc gct ggc tgg aat 1008
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
325 330 335
atg atc ccg aat att aaa aaa gtc ttt ggc gtc gat atg gcg aag cta 1056
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
340 345 350
ttg att gat gta tta gtt gat ggt aaa aag gct gta ctg cca aaa cag 1104
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
355 360 365
ctg ctt tct gga cat aca ttt tat gta gcg gac tgc cac ctg tac cct 1152
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
370 375 380
cag cat ttt aaa gag agt ggg ctt atc ccg cct gaa gcc aca cat att 1200
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385 390 395 400
acc att gat cat gtg tct att ccg cag gaa gca ttc gtt gga gat act 1248
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
405 410 415
gcg att gtc agt caa tca ttc cct gcc aaa ggg act att gtg gat ctt 1296
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
420 425 430
gaa tta ttt gaa gct ttt aat gga atc gta tct ctt gaa tta aaa gga 1344
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
435 440 445
tca tcc tca caa gat gtt gcc gcg tcc atc cgc aac att cag aaa cag 1392
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
450 455 460
gca acg att cag tta atg gat gaa tta gtg aag gga 1428
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465 470 475
<210>65
<211>1416
<212>DNA
<213>枯草芽孢杆菌ATCC 15245 and枯草芽孢杆菌IAM 1033
<400>65
atg gag aga aaa aca gta ttg gtc atc gct gat ctt gga ggc tgc ccg 48
Met Glu Arg Lys Thr Val Leu Val Ile Ala Asp Leu Gly Gly Cys Pro
1 5 10 15
ccg cac atg ttt tat aaa agc gct gct gaa aaa tat aac ctg gtc agc 96
Pro His Met Phe Tyr Lys Ser Ala Ala Glu Lys Tyr Asn Leu Val Ser
20 25 30
ttt att cca aga cct ttt gca att aca gcc tcc cat gca gca ttg att 144
Phe Ile Pro Arg Pro Phe Ala Ile Thr Ala Ser His Ala Ala Leu Ile
35 40 45
gaa aaa tac tcg gtc gcg gtc ata aaa gat aaa gac tat ttt aag agt 192
Glu Lys Tyr Ser Val Ala Val Ile Lys Asp Lys Asp Tyr Phe Lys Ser
50 55 60
tta gct gat ttt gag cat cct gat tcc att tat tgg gcg cat gag gat 240
Leu Ala Asp Phe Glu His Pro Asp Ser Ile Tyr Trp Ala His Glu Asp
65 70 75 80
cat aac aag cct gag gaa gag gtc gtc gag caa atc gtc aag gtt gcc 288
His Asn Lys Pro Glu Glu Glu Val Val Glu Gln Ile Val Lys Val Ala
85 90 95
gaa atg ttt ggg gcg gat gcc atc aca aca aac aat gaa tta ttc att 336
Glu Met Phe Gly Ala Asp Ala Ile Thr Thr Asn Asn Glu Leu Phe Ile
100 105 110
gct ccg atg gcg aaa gcc tgt gaa cgt ctg ggc ctg aga ggt gcc ggc 384
Ala Pro Met Ala Lys Ala Cys Glu Arg Leu Gly Leu Arg Gly Ala Gly
115 120 125
gtg cag gca gcc gaa aat gcc aga gat aaa aat aaa atg agg gac gct 432
Val Gln Ala Ala Glu Asn Ala Arg Asp Lys Asn Lys Met Arg Asp Ala
130 135 140
ttt aat aag gcc gga gtc aaa tcg atc aaa aac aaa cga gtc aca act 480
Phe Asn Lys Ala Gly Val Lys Ser Ile Lys Asn Lys Arg Val Thr Thr
145 150 155 160
ctt gaa gat ttc cgt gct gct ctt gaa gag atc ggc aca cct ctt atc 528
Leu Glu Asp Phe Arg Ala Ala Leu Glu Glu Ile Gly Thr Pro Leu Ile
165 170 175
tta aag cct aca tac tta gcg agt tca atc ggt gta acg ctg att acg 576
Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr Leu Ile Thr
180 185 190
gac act gag acg gca gaa gat gaa ttt aac aga gtc aat gac tat ctg 624
Asp Thr Glu Thr Ala Glu Asp Glu Phe Asn Arg Val Asn Asp Tyr Leu
195 200 205
aaa tca att aac gtg cca aag gcg gtt acg ttt gaa gcg ccg ttt atc 672
Lys Ser Ile Asn Val Pro Lys Ala Val Thr Phe Glu Ala Pro Phe Ile
210 215 220
gct gaa gaa ttt tta cag ggt gag tac gga gac tgg tat caa aca gaa 720
Ala Glu Glu Phe Leu Gln Gly Glu Tyr Gly Asp Trp Tyr Gln Thr Glu
225 230 235 240
ggg tac tcc gac tat atc agt ata gaa ggc atc atg gct gac ggt gag 768
Gly Tyr Ser Asp Tyr Ile Ser Ile Glu Gly Ile Met Ala Asp Gly Glu
245 250 255
tat ttc ccg atc gcc att cat gat aaa acg ccg caa atc ggg ttt aca 816
Tyr Phe Pro Ile Ala Ile His Asp Lys Thr Pro Gln Ile Gly Phe Thr
260 265 270
gag aca tcc cac att acg ccg tcc att ctg gat gaa gag gca aaa aag 864
Glu Thr Ser His Ile Thr Pro Ser Ile Leu Asp Glu Glu Ala Lys Lys
275 280 285
aaa att gtc gaa gct gcc aaa aag gca aat gaa ggg ctt ggc ctg caa 912
Lys Ile Val Glu Ala Ala Lys Lys Ala Asn Glu Gly Leu Gly Leu Gln
290 295 300
aat tgc gca aca cat aca gag atc aag cta atg aaa aac aga gaa ccg 960
Asn Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn Arg Glu Pro
305 310 315 320
ggt tta ata gag tcg gca gcc aga ttc gca ggc tgg aat atg att cct 1008
Gly Leu Ile Glu Ser Ala Ala Arg Phe Ala Gly Trp Asn Met Ile Pro
325 330 335
aat att aaa aag gtc ttt ggc ctt gat atg gcg caa tta tta tta gat 1056
Asn Ile Lys Lys Val Phe Gly Leu Asp Met Ala Gln Leu Leu Leu Asp
340 345 350
gtc ctc tgt ttc gga aaa gac gcc gat ctg ccg gac gga tta ttg gat 1104
Val Leu Cys Phe Gly Lys Asp Ala Asp Leu Pro Asp Gly Leu Leu Asp
355 360 365
caa gag cct tat tat gtt gcc gac tgc cat ttg tac ccg cag cat ttc 1152
Gln Glu Pro Tyr Tyr Val Ala Asp Cys His Leu Tyr Pro Gln His Phe
370 375 380
aaa caa aat ggc cag att cca gaa acc gct gag gat ttg gtc att gaa 1200
Lys Gln Asn Gly Gln Ile Pro Glu Thr Ala Glu Asp Leu Val Ile Glu
385 390 395 400
gcg atc gat att ccg gac ggg ctt tta aaa ggg gat act gaa atc gtt 1248
Ala Ile Asp Ile Pro Asp Gly Leu Leu Lys Gly Asp Thr Glu Ile Val
405 410 415
tca ttt tca gcc gca gca cca ggc act tca gtt gat ttg aca ttg ttt 1296
Ser Phe Ser Ala Ala Ala Pro Gly Thr Ser Val Asp Leu Thr Leu Phe
420 425 430
gaa gct ttc aat tcc att gct gca ttt gaa ctg aaa ggc agt aat tca 1344
Glu Ala Phe Asn Ser Ile Ala Ala Phe Glu Leu Lys Gly Ser Asn Ser
435 440 445
cag gat gtg gct gaa tca atc aga caa att cag cag cat gca aag ctg 1392
Gln Asp Val Ala Glu Ser Ile Arg Gln Ile Gln Gln His Ala Lys Leu
450 455 460
acg gca aag tat gtg ctg cca gta 1416
Thr Ala Lys Tyr Val Leu Pro Val
465 470
<210>66
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>66
ccgatggcra aagcstgtra acg 23
<210>67
<211>21
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>67
cggcagatcr gcdtcttttc c 21
<210>68
<211>476
<212>PRT
<213>短小芽孢杆菌NRRL B-12025
<400>68
Val Leu Ser Leu Ser Lys Lys Thr Val Leu Val Ile Ala Asp Leu Gly
1 5 10 15
Gly Cys Pro Pro His Met Phe Tyr Glu Ser Val Ala Ala Ser Tyr His
20 25 30
Ile Val Ser Tyr Ile Pro Arg Pro Phe Ala Ile Thr Lys Gly His Ala
35 40 45
Glu Leu Ile Glu Lys Tyr Ser Ile Ala Val Ile Lys Asp Arg Asp Tyr
50 55 60
Phe Glu Thr His Pro Ser Phe Glu His Pro Asp Ser Ile Tyr Trp Ala
65 70 75 80
His Asp Asp Tyr Pro Lys Ser Glu Glu Glu Val Val Glu Asp Phe Ile
85 90 95
Arg Val Ala Ser Phe Phe Lys Ala Asp Ala Ile Thr Thr Asn Asn Glu
100 105 110
Leu Phe Ile Ala Pro Met Ala Lys Ala Ala Glu Arg Leu Gly Leu Arg
115 120 125
Gly Ala Gly Val Lys Ala Ala Glu Met Ala Arg Asp Lys Ser Gln Met
130 135 140
Arg Ala Ala Phe Asn Ala Ser Gly Val Lys Ala Val Lys Thr Gln Pro
145 150 155 160
Val Thr Thr Leu Ser Asp Phe Gln Gln Ala Ile Glu Ser Ile Gly Thr
165 170 175
Pro Leu Ile Leu Lys Pro Thr Tyr Leu Ala Ser Ser Ile Gly Val Thr
180 185 190
Leu Phe His Asp Lys Ala Gly Ser Asp Asp Leu Phe Leu Gln Val Gln
195 200 205
Ser Tyr Leu Glu Thr Ile Pro Val Pro Asp Ala Val Thr Tyr Glu Ala
210 215 220
Pro Phe Val Ala Glu Thr Tyr Leu Glu Gly Ala Tyr Glu Asp Trp Tyr
225 230 235 240
Glu Asp Glu Gly Tyr Ala Asp Tyr Val Ser Val Glu Gly Leu Val Val
245 250 255
Glu Gly Glu Tyr Leu Pro Phe Val Ile His Asp Lys Thr Pro Gln Ile
260 265 270
Gly Phe Thr Glu Thr Ala His Ile Thr Pro Thr Ile Leu Asp Asn Glu
275 280 285
Ala Lys Gln Ile Ile Ile Glu Ala Ala Arg Lys Ala Asn Glu Gly Leu
290 295 300
Gly Leu Glu His Cys Ala Thr His Thr Glu Ile Lys Leu Met Lys Asn
305 310 315 320
Arg Glu Thr Gly Leu Ile Glu Ala Ala Ala Arg Phe Ala Gly Trp Asn
325 330 335
Met Ile Pro Asn Ile Lys Lys Val Phe Gly Val Asp Met Ala Lys Leu
340 345 350
Leu Ile Asp Val Leu Val Asp Gly Lys Lys Ala Val Leu Pro Lys Gln
355 360 365
Leu Leu Ser Gly His Thr Phe Tyr Val Ala Asp Cys His Leu Tyr Pro
370 375 380
Gln His Phe Lys Glu Ser Gly Leu Ile Pro Pro Glu Ala Thr His Ile
385 390 395 400
Thr Ile Asp His Val Ser Ile Pro Gln Glu Ala Phe Val Gly Asp Thr
405 410 415
Ala Ile Val Ser Gln Ser Phe Pro Ala Lys Gly Thr Ile Val Asp Leu
420 425 430
Glu Leu Phe Glu Ala Phe Asn Gly Ile Val Ser Leu Glu Leu Lys Gly
435 440 445
Ser Ser Ser Gln Asp Val Ala Ala Ser Ile Arg Asn Ile Gln Lys Gln
450 455 460
Ala Thr Ile Gln Leu Met Asp Glu Leu Val Lys Gly
465 470 475
<210>69
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>69
catgccatgg agaaaaaaac tgtacttgtc attgctgact tagg 44
<210>70
<211>38
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>70
cgcggatccc ttcactaatt catccattaa ctgaatcg 38
<210>71
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>71
gctaggtctt gaacattgtg caaccc 26
<210>72
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:合成性DNA
<400>72
ggtgttccga tagactcaat ggc 23