CN114008197A

CN114008197A - 用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程

Info

Publication number: CN114008197A
Application number: CN202080041307.XA
Authority: CN
Inventors: V·M·罗德格戈戈拉科林; A·F·贝拉迪蔡德勒; L·佩德森帕里齐
Original assignee: Braskem SA
Current assignee: Braskem SA
Priority date: 2019-04-04
Filing date: 2020-04-06
Publication date: 2022-02-01
Anticipated expiration: 2040-04-06
Also published as: WO2020198830A1; US11746361B2; JP7715636B2; EP3935154A1; BR112021018925A2; US20200318146A1; CN114008197B; JP2022528894A

Abstract

本公开提供了用于对微生物进行遗传修饰以产生能够同时消耗木糖和葡萄糖以增加所期望的化学产物的生产率输出的微生物的方法。本公开还提供了能够同时消耗木糖和葡萄糖的经修饰的细菌，以及包含所述微生物的组合物。

Description

用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程

相关申请的交叉引用

本申请要求2019年4月4日提交的美国临时申请号62/829,398的优先权，该临时申请的内容以引用的方式整体并入本文。

关于序列表的声明

与本申请相关的序列表以文本形式提供，代替纸质副本，并且据此以引用的方式并入说明书中。含序列表的文本文件名称为BRSK_021_01WO_ST25.txt。文本文件为222kb，创建于2020年4月4日，并且以电子形式提交。

背景技术

从替代原料(如戊糖)产生所期望的化学物质(诸如单乙二醇、乙醇酸、C3化合物(诸如丙酮、异丙醇和丙烯)、氨基酸和多元醇)是从石油基化学物质获得所述化学物质的替代方案。

木糖(戊糖)的利用是区别于大多数可再生化学物质方案的来源。考虑到利用木质纤维素生物质作为原料不要求利用会以其他方式产生食物的植物，木质纤维素生物质是一种有前景的可再生原料。由于木质纤维素生物质的可持续性和全球可用性，它作为可再生原料更有前景。木质纤维素糖的分离和离析是一种在不增加土地利用的情况下增加糖产量的选择。木糖是半纤维素水解产物中的主要碳源，其次是葡萄糖和阿拉伯糖。木糖通常占半纤维素水解产物中存在的糖的70-80％，而葡萄糖则占10-20％。

在大肠杆菌(Escherichia coli)中，即使最少量的葡萄糖也会完全抑制木糖的摄取(即使木糖是主要糖)，从而限制糖至所期望的化学物质的总体转化。在工业过程中，生产率(克产物/升每小时)是确保经济可行性的关键因素，因此微生物菌株必须能够不断以最大速率将主要底物(诸如木糖)转化为产物。考虑到葡萄糖存在于木质纤维素水解产物中，在分批操作中，木糖摄取将被延迟直到葡萄糖完全耗尽，从而降低生产率。如果我们考虑补料分批或连续操作，则含有木糖和葡萄糖的流被不断送入反应器中，增强了葡萄糖的阻遏潜力，因此无法最大限度地提高能够从常见可再生原料产生一种或多种产物的微生物的潜在生产率。

需要最大限度地提高能够从可再生原料产生所期望的产物的微生物的生产率，特别是需要最大限度地利用多种碳源，同时最大限度地减少或消除碳源对微生物的阻遏活性。

如本文所述，本公开提供了用于对微生物进行工程化改造以利用混合糖流来产生所期望的化学物质的方法和组合物，而无需考虑由于混合糖流的存在而引起的典型分解代谢阻遏效应。

发明内容

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，并且其中所述微生物包含以下一项或多项：(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活，以使得所述转运蛋白不表达；(b)一个或多个内源性或外源性核酸序列，其编码至少一个C5糖同向转运蛋白(symporter)并且可操作地连接至一个或多个组成型启动子；其中所述C5糖同向转运蛋白包括：(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白；(c)一个或多个内源性或外源性核酸序列，其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木酮糖激酶的缺失或失活，和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，所述微生物产生的所述发酵产物是一种或多种包含1、2、3、4、5、6、7、8、9或10个碳的分子。在一些方面，同时产生两种或更多种分子。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组大肠杆菌，其中所述重组微生物同时利用木糖和葡萄糖，并且其中所述微生物包含以下一项或多项：(a)所述微生物的基因组中的ATP结合转运蛋白araFGH和xylFGH的缺失或失活，以使得所述转运蛋白不表达；(b)一个或多个内源性或外源性核酸序列，其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子；其中所述C5糖同向转运蛋白包括：(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白；(c)一个或多个内源性或外源性核酸序列，其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木酮糖激酶的缺失或失活，和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生单乙二醇(MEG)和/或丙酮的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，并且包含以下一项或多项：(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，如权利要求5所述的重组微生物，其中所述微生物还包含glcDEF的缺失或失活。在一些方面，所述C5同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面，所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面，所述XylE包括包含SEQ ID NO:49的氨基酸序列。在一些方面，所述XylE由包含SEQ ID NO:48的核酸序列编码。在一些方面，所述木糖同向转运蛋白是所述微生物内源性的。

在一些方面，所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面，所述AraE包括包含SEQ ID NO:47的氨基酸序列。在一些方面，所述AraE由包含SEQ ID NO:46的核酸序列编码。在一些方面，所述阿拉伯糖同向转运蛋白是所述微生物内源性的。

在一些方面，所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面，所述微生物包含功能性磷酸转移酶系统。在一些方面，所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面，所述CRP包括包含SEQ ID NO:10的氨基酸序列。在一些方面，所述CRP由包含SEQ ID NO:9的核酸序列编码。

在一些方面，所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，连续木糖输入独立于其他糖在所述原料中的存在而发生。

在一些方面，所述重组微生物包括MEG产生途径，所述途径具有以下(c)至(e)中的一项或多项；(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。在一些方面，(c)和(d)在由proD启动子控制的操纵子中。在一些方面，所述proD启动子由包含SEQ ID NO:53的核酸序列编码。

在一些方面，所述木糖异构酶是XylA。在一些方面，所述木糖异构酶是所述微生物内源性的。在一些方面，所述XylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面，所述XylA由包含SEQ ID NO:5的核酸序列编码。

在一些方面，所述酮己糖激酶来自智人(Homo Sapiens)。在一些方面，所述酮己糖激酶是所述微生物异源性的。在一些方面，所述酮己糖激酶是khk-C。在一些方面，所述khk-C包括包含SEQ ID NO:12的氨基酸序列。在一些方面，所述khk-C由包含SEQ ID NO:11的核酸序列编码。

在一些方面，所述果糖二磷酸醛缩酶来自智人。在一些方面，所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面，所述果糖二磷酸醛缩酶是aldoB。在一些方面，所述aldoB包括包含SEQ ID NO:51的氨基酸序列。在一些方面，所述aldoB由包含SEQ ID NO:50的核酸序列编码。

在一些方面，所述羟乙醛还原酶是所述微生物内源性的。在一些方面，所述羟乙醛还原酶是fucO。在一些方面，所述fucO包括包含SEQ ID NO:98的氨基酸序列。在一些方面，所述fucO由包含SEQ ID NO:52的核酸序列编码。

在一些方面，所述木酮糖激酶是XylB。在一些方面，所述xylB包括包含SEQ ID NO:14的氨基酸序列。在一些方面，所述xylB由包含SEQ ID NO:13的核酸序列编码。

在一些方面，所述重组微生物包括MEG产生途径，所述途径具有以下(c)至(e)中的一项或多项；(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，所述木糖脱氢酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。在一些方面，所述木糖脱氢酶是xdh。在一些方面，所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。在一些方面，所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。在一些方面，所述木糖脱氢酶是所述微生物异源性的。

在一些方面，所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖酸内酯酶是xylC。在一些方面，所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。在一些方面，所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。

在一些方面，所述木糖酸内酯酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶是所述微生物内源性的。

在一些方面，所述木糖脱水酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖脱水酶是xylD。在一些方面，所述xylD包括包含SEQ ID NO:61、63或65的氨基酸序列。在一些方面，所述xylD由包含SEQ ID NO:60、62或64的核酸序列编码。在一些方面，所述木糖脱水酶是所述微生物异源性的。在一些方面，所述木糖脱水酶是所述微生物内源性的。

在一些方面，所述羟乙醛还原酶是所述微生物异源性的。在一些方面，所述木糖异构酶是XylA。在一些方面，所述xylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面，所述xylA由包含SEQ ID NO:5的核酸序列编码。

在一些方面，所述重组微生物还包含丙酮产生途径，所述途径具有以下(f)至(h)中的一项或多项；(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化。

在一些方面，(f)、(g)和(h)在由OXB11启动子控制的操纵子中。在一些方面，所述OXB11启动子由包含SEQ ID NO:78的核酸序列编码。在一些方面，所述乙酰乙酰基辅酶A硫解酶来自丙酮丁醇梭菌(Clostridium acetobutylicum)。在一些方面，所述乙酰乙酰基辅酶A硫解酶包括包含SEQ ID NO:67或69的氨基酸序列。在一些方面，所述乙酰乙酰基辅酶A硫解酶由包含SEQ ID NO:66或68的核酸序列编码。在一些方面，所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面，所述AtoDA亚基α包括包含SEQ ID NO:72的氨基酸序列。在一些方面，所述AtoDA亚基α由包含SEQ ID NO:70的核酸序列编码。在一些方面，所述AtoDA亚基β包括包含SEQ ID NO:73的氨基酸序列。在一些方面，所述AtoDA亚基β由包含SEQ ID NO:71的核酸序列编码。

如权利要求77所述的重组微生物，其中所述乙酰乙酸脱羧酶来自拜氏梭菌(Clostridium beijerinckii)或丙酮丁醇梭菌。在一些方面，所述乙酰乙酸脱羧酶是Adc。在一些方面，所述Adc包括包含SEQ ID NO:75或77的氨基酸序列。在一些方面，所述Adc由包含SEQ ID NO:74或76的核酸序列编码。

在一些方面，所述重组微生物还包含异丙醇产生途径，所述途径具有以下(f)至(i)中的一项或多项；(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化；(i)至少一个编码醇脱氢酶的外源性核酸分子的表达，所述醇脱氢酶催化丙酮至异丙醇的转化。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，并且包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物还表达一个或多个乙醇酸产生途径。

在一些方面，所述微生物还包含glcDEF的缺失或失活。在一些方面，所述微生物还包含dkgA的缺失或失活。在一些方面，所述微生物还包含yahK的缺失或失活。在一些方面，所述木糖同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。

在一些方面，所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面，所述XylE包括包含SEQ ID NO:49的氨基酸序列。在一些方面，所述XylE由包含SEQ ID NO:48的核酸序列编码。在一些方面，所述木糖同向转运蛋白是所述微生物内源性的。

在一些方面，所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面，所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面，所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面，所述微生物包含功能性磷酸转移酶系统。

在一些方面，所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面，所述CRP包括包含SEQ ID NO:10的氨基酸序列。在一些方面，所述CRP由包含SEQID NO:9的核酸序列编码。在一些方面，所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，连续木糖输入独立于其他糖在所述原料中的存在而发生。

在一些方面，所述重组微生物包括乙醇酸产生途径，所述途径具有以下(c)和(e)中的一项或多项；(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。在一些方面，(c)和(d)在由proD启动子控制的操纵子中。在一些方面，所述proD启动子由包含SEQ ID NO:53的核酸序列编码。

在一些方面，所述木糖异构酶是XylA。在一些方面，所述XylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面，所述XylA由包含SEQ ID NO:5的核酸序列编码。在一些方面，所述木糖异构酶是所述微生物内源性的。

在一些方面，所述酮己糖激酶来自智人。在一些方面，所述酮己糖激酶是所述微生物异源性的。在一些方面，所述酮己糖激酶是khk-C。在一些方面，所述khk-C包括包含SEQID NO:12的氨基酸序列。在一些方面，所述khk-C由包含SEQ ID NO:11的核酸序列编码。

在一些方面，所述果糖二磷酸醛缩酶来自智人。在一些方面，所述果糖二磷酸醛缩酶是aldoB。在一些方面，所述aldoB包括包含SEQ ID NO:51的氨基酸序列。在一些方面，所述aldoB由包含SEQ ID NO:50的核酸序列编码。在一些方面，所述果糖二磷酸醛缩酶是所述微生物异源性的。

在一些方面，所述羟乙醛脱氢酶是aldA。在一些方面，所述aldA包括包含SEQ IDNO:4的氨基酸序列。在一些方面，所述aldA由包含SEQ ID NO:3的核酸序列编码。在一些方面，所述羟乙醛脱氢酶是所述微生物内源性的。

在一些方面，所述重组微生物包括乙醇酸产生途径，所述途径具有以下(c)至(e)中的一项或多项；(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。在一些方面，(c)和(d)由proD启动子控制。在一些方面，所述proD启动子由包含SEQ ID NO:53的核酸序列编码。

在一些方面，所述木糖异构酶是XylA。在一些方面，所述XylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面，所述XylA由包含SEQ ID NO:5的核酸序列编码。

在一些方面，所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖脱氢酶是xdh。在一些方面，所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。在一些方面，所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。在一些方面，所述木糖脱氢酶是所述微生物异源性的。

在一些方面，所述微生物还表达乙醇酸产生途径，所述途径具有以下中的一项或多项：(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达；和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。在一些方面，(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面，所述OXB20启动子由包含SEQ ID NO:96的核酸序列编码。

在一些方面，所述异柠檬酸裂解酶是AceA。在一些方面，所述AceA包括包含SEQ IDNO:90的氨基酸序列。在一些方面，所述AceA由包含SEQ ID NO:89的核酸序列编码。

在一些方面，所述乙醛酸还原酶是YcdW。在一些方面，所述YcdW包括包含SEQ IDNO:92的氨基酸序列。在一些方面，所述YcdW由包含SEQ ID NO:91的核酸序列编码。

在一些方面，所述重组微生物来源于选自由以下项组成的组的亲本微生物：梭菌属(Clostridium sp.)、永达尔梭菌(Clostridium ljungdahlii)、产乙醇梭菌(Clostridium autoethanogenum)、拉氏梭菌(Clostridium ragsdalei)、粘液真杆菌(Eubacterium limosum)、嗜甲基丁酸杆菌(Butyribacterium methylotrophicum)、热醋穆尔氏菌(Moorella thermoacetica)、醋酸梭菌(Clostridium aceticum)、伍氏醋酸杆菌(Acetobacterium woodii)、巴氏嗜喊菌(Alkalibaculum bacchii)、德雷克氏梭菌(Clostridium drakei)、食一氧化碳梭菌(Clostridium carboxidivorans)、甲酸乙酸梭菌(Clostridium formicoaceticum)、粪味梭菌(Clostridium scatologenes)、热自养穆尔氏菌(Moorella thermoautotrophica)、长醋丝菌(Acetonema longum)、延长布劳特氏菌(Blautia producta)、乙二醇梭菌(Clostridium glycolicum)、大梭菌(Clostridiummagnum)、马永贝梭菌(Clostridium mayombei)、食甲氧基苯甲酸梭菌(Clostridiummethoxybenzovorans)、丙酮丁醇梭菌(Clostridium acetobutylicum)、拜氏梭菌(Clostridium beijerinckii)、普氏产醋杆菌(Oxobacter pfennigii)、凯伍嗜热厌氧菌(Thermoanaerobacter kivui)、卵形鼠孢菌(Sporomusa ovata)、棕色嗜热产醋菌(Thermoacetogenium phaeum)、甲醇醋酸杆菌(Acetobacterium carbinolicum)、白蚁鼠孢菌(Sporomusa termitida)、甘油穆尔氏菌(Moorella glycerini)、聚集性真杆菌(Eubacterium aggregans)、固氮密螺旋体(Treponema azotonutricium)、大肠杆菌、酿酒酵母(Saccharomyces cerevisiae)、恶臭假单胞菌(Pseudomonas putida)、芽孢杆菌属(Bacillus sp.)、棒状杆菌属(Corynebacterium sp.)、解脂耶氏酵母(Yarrowialipolytica)、树干毕赤酵母(Scheffersomyces stipitis)和甘油利用泰瑞孢子菌(Terrisporobacter glycolicus)。在一些方面，所述亲本微生物是大肠杆菌。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，并且其中所述微生物包含以下一项或多项：(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活，以使得所述转运蛋白不表达；(b)一个或多个内源性或外源性核酸序列，其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子；其中所述C5糖同向转运蛋白包括：(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白；(c)一个或多个内源性或外源性核酸序列，其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木酮糖激酶的缺失或失活，和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。在一些方面，所述微生物产生的所述发酵产物是一种或多种包含1、2、3、4、5、6、7、8、9或10个碳的分子。在一些方面，同时产生两种或更多种分子。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组大肠杆菌，其中重组微生物同时利用木糖和葡萄糖，并且其中所述微生物包含以下一项或多项：(a)所述微生物的基因组中的ATP结合转运蛋白araFGH和xylFGH的缺失或失活，以使得所述转运蛋白不表达；(b)一个或多个内源性或外源性核酸序列，其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子；其中所述C5糖同向转运蛋白包括：(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白；(c)一个或多个内源性或外源性核酸序列，其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木酮糖激酶的缺失或失活，和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生单乙二醇(MEG)和/或丙酮的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，所述微生物还包含glcDEF的缺失或失活。在一些方面，所述C5同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面，所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面，所述木糖同向转运蛋白是所述微生物内源性的。在一些方面，所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面，所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面，所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面，所述微生物包含功能性磷酸转移酶系统。在一些方面，所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面，所述一个或多个编码所述aldA的核酸分子包含SEQ ID NO:3中列出的核酸序列。在一些方面，所述一个或多个编码所述aldA的氨基酸序列包含SEQ ID NO:4中列出的氨基酸序列。如权利要求5所述的重组微生物，其中所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。如权利要求5所述的重组微生物，其中所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。如权利要求5所述的重组微生物，其中连续木糖输入独立于其他糖在所述原料中的存在而发生。

在一些方面，所述重组微生物包括MEG产生途径，所述途径具有以下(c)至(e)中的一项或多项：(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。

在一些方面，(c)和(d)在由proD启动子控制的操纵子中。在一些方面，所述木糖异构酶是XylA。在一些方面，所述木糖异构酶是所述微生物内源性的。在一些方面，所述酮己糖激酶来自智人。在一些方面，所述酮己糖激酶是所述微生物异源性的。在一些方面，所述果糖二磷酸醛缩酶来自智人。在一些方面，所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面，所述羟乙醛还原酶是所述微生物内源性的。在一些方面，所述羟乙醛还原酶是fucO。在一些方面，所述木酮糖激酶是XylB。

在一些方面，所述重组微生物包括MEG产生途径，所述途径具有以下(c)至(e)中的一项或多项：(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖脱氢酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖酸内酯酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶是所述微生物内源性的。在一些方面，所述木糖脱水酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。

在一些方面，所述木糖脱水酶是所述微生物异源性的。在一些方面，所述木糖脱水酶是所述微生物内源性的。在一些方面，所述羟乙醛还原酶是所述微生物内源性的。在一些方面，所述羟乙醛还原酶是fucO。在一些方面，所述羟乙醛还原酶是所述微生物异源性的。在一些方面，所述木糖异构酶是XylA。在一些方面，所述木酮糖激酶是XylB。

在一些方面，所述重组微生物还包含丙酮产生途径，所述途径具有以下(f)至(h)中的一项或多项：(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化。在一些方面，(f)、(g)和(h)在由OXB11启动子控制的操纵子中。

在一些方面，所述乙酰乙酰基辅酶A硫解酶来自丙酮丁醇梭菌。在一些方面，所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面，所述乙酰乙酸脱羧酶来自拜氏梭菌。

在一些方面，所述重组微生物还包含异丙醇产生途径，所述途径具有以下(f)至(i)中的一项或多项：(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化，(i)至少一个编码醇脱氢酶的外源性核酸分子的表达，所述醇脱氢酶催化丙酮至异丙醇的转化。

在一些方面，本公开一般涉及能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物还表达一个或多个乙醇酸产生途径。在一些方面，所述微生物还包含glcDEF的缺失或失活。在一些方面，所述微生物还包含dkgA的缺失或失活。在一些方面，所述微生物还包含yahK的缺失或失活。在一些方面，所述木糖同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面，所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面，所述木糖同向转运蛋白是所述微生物内源性的。在一些方面，所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面，所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面，所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。

在一些方面，所述微生物包含功能性磷酸转移酶系统。在一些方面，所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面，所述一个或多个编码所述CRP的核酸分子包含SEQ ID NO:9中列出的核酸序列。在一些方面，所述一个或多个编码所述CRP的氨基酸序列包含SEQ ID NO:10中列出的氨基酸序列。在一些方面，所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，连续木糖输入独立于其他糖在所述原料中的存在而发生。

在一些方面，所述重组微生物包括乙醇酸产生途径，所述途径具有以下(c)和(e)中的一项或多项：(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。在一些方面，(c)和(d)在由proD启动子控制的操纵子中。

在一些方面，所述木糖异构酶是XylA。在一些方面，所述木糖异构酶是所述微生物内源性的。在一些方面，所述酮己糖激酶来自智人。在一些方面，所述酮己糖激酶是所述微生物异源性的。在一些方面，所述果糖二磷酸醛缩酶来自智人。在一些方面，所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面，所述羟乙醛脱氢酶是aldA。在一些方面，所述羟乙醛脱氢酶是所述微生物内源性的。在一些方面，所述木酮糖激酶是XylB。

在一些方面，所述重组微生物包括乙醇酸产生途径，所述途径具有以下(c)至(e)中的一项或多项；(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。在一些方面，(c)和(d)由proD启动子控制。

在一些方面，所述木糖异构酶是XylA。在一些方面，所述木酮糖激酶是XylB。在一些方面，所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖脱氢酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面，所述木糖酸内酯酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶是所述微生物内源性的。在一些方面，所述羟乙醛脱氢酶是aldA。在一些方面，所述羟乙醛脱氢酶是所述微生物内源性的。

在一些方面，所述微生物还表达乙醇酸产生途径，所述途径具有以下中的一项或多项：(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达；和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。在一些方面，(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面，所述异柠檬酸裂解酶是AceA。在一些方面，所述乙醛酸还原酶是YcdW。

在一些方面，所述重组微生物来源于选自由以下项组成的组的亲本微生物：梭菌属、永达尔梭菌、产乙醇梭菌、拉氏梭菌、粘液真杆菌、嗜甲基丁酸杆菌、热醋穆尔氏菌、醋酸梭菌、伍氏醋酸杆菌、巴氏嗜喊菌、德雷克氏梭菌、食一氧化碳梭菌、甲酸乙酸梭菌、粪味梭菌、热自养穆尔氏菌、长醋丝菌、延长布劳特氏菌、乙二醇梭菌、大梭菌、马永贝梭菌、食甲氧基苯甲酸梭菌、丙酮丁醇梭菌、拜氏梭菌、普氏产醋杆菌、凯伍嗜热厌氧菌、卵形鼠孢菌、棕色嗜热产醋菌、甲醇醋酸杆菌、白蚁鼠孢菌、甘油穆尔氏菌、聚集性真杆菌、固氮密螺旋体、大肠杆菌、酿酒酵母、恶臭假单胞菌、芽孢杆菌属、棒状杆菌属、解脂耶氏酵母、树干毕赤酵母和甘油利用泰瑞孢子菌。

附图说明

图1描绘了采用木糖和葡萄糖来产生本文考虑的产物的多个途径。

图2是描绘在1:1比例培养物中，在共同消耗菌株中检测的葡萄糖和木糖的同时利用，而在亲本菌株中木糖仅在葡萄糖耗尽后才开始消耗的图。

图3是描绘共同消耗菌株消耗75％的初始糖混合物，而亲本菌株仅消耗62％的图(36小时培养)。对于6:1比例培养物，亲本和共同消耗菌株都完全消耗初始葡萄糖和木糖，木糖消耗和生物质产生的特征曲线相似。

图4是描绘MEG在菌株中的使用的图。MEG的总量增加12％，而丙酮的量增加197％。

图5是描绘在1:1比例培养物中，在共同消耗菌株中检测的葡萄糖和木糖的同时利用，而在亲本菌株中木糖仅在葡萄糖耗尽后18小时后才开始减少的图。

图6是描绘共同消耗菌株消耗61％的初始糖混合物，而亲本菌株消耗52％的糖的图(36小时培养)。对于6:1比例培养物，共同消耗和亲本菌株完全消耗初始葡萄糖和木糖，木糖消耗和生物质产生的特征曲线相似。

图7是描绘MEG的总量增加9％，而丙酮的总量增加119％的图。

具体实施方式

本公开一般涉及微生物工程改造，以最大限度地从可生物再生植物原料产生所期望的产物，由于单一类型的原料中存在的多个碳源的阻遏作用，这些植物原料通常无法实现任何接近最大的收率和生产率。源于一些单糖的共同消耗，本公开阐述了用于减少或消除阻遏作用的方法和组合物，所述阻遏作用导致微生物不能以最大生产率运行。

以下定义和缩写用于解释本公开。

如本文和所附权利要求书中所用，除非上下文另外明确指出，否则单数形式“一”、“一种(个)”和“所述(该)”包括复数指示物。因此，例如，提及“一种酶”包括多种此类酶并且提及“所述微生物”包括提及一种或多种微生物，等等。

如本文所用，术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”、“含有(contains)”、“含有(containing)”或其任何其他变型旨在涵盖非排他性包含。包含一系列要素的组合物、混合物、工艺、方法、制品或设备不一定仅限于那些要素，而是可以包括未明确列出的或此类组合物、混合物、工艺、方法、制品或设备或非固有的其他要素。此外，除非明确陈述相反，否则“或”是指包含性的“或”，而不是排他性的“或”。

术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“”寡核苷酸可互换使用。它们是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任何三维结构，并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区、从连接分析中定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微型RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可以包含一个或多个经修饰的核苷酸，诸如甲基化核苷酸和核苷酸类似物。如果存在，则可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合之后进一步修饰，诸如通过与标记组分缀合。

“互补性”是指核酸通过传统的沃森-克里克(Watson-Crick)或其他非传统类型与另一核酸序列形成氢键的能力。百分比互补性表示核酸分子中可与第二核酸序列形成氢键(例如沃森-克里克碱基配对)的残基的百分比(例如，10个中有5、6、7、8、9、10个分别为50％、60％、70％、80％、90％和100％互补)。“完全互补”意指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基氢键结合。如本文所用，“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸的区域上互补程度为至少60％、65％、70％、75％、80％、85％、90％、95％、97％、98％、99％或100％，或是指在严格条件下杂交的两个核酸。序列同一性，诸如为了评估百分比互补性的目的，可以通过任何合适的比对算法来测量，包括但不限于Needleman-Wunsch算法(参见例如在www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html上可获得的EMBOSSNeedle比对程序，任选地用默认设置)、BLAST算法(参见例如在blast.ncbi.nlm.nih.gov/Blast.cgi上可获得的BLAST比对工具，任选地用默认设置)或Smith-Waterman算法(参见例如在www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html上可获得的Water比对程序，任选地用默认设置)。可以使用所选算法的任何合适的参数，包括默认参数来评估最佳比对。

如本文所用，“表达”是指多核苷酸从DNA模板转录(诸如转录为mRNA或其他RNA转录物)的过程和/或转录的mRNA随后翻译为肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸来源于基因组DNA，则表达可以包括mRNA在真核细胞中的剪接。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用，是指任何长度的氨基酸的聚合物。聚合物可以是直链或支链的，它可以包含经修饰的氨基酸，并且它可以被非氨基酸中断。这些术语还涵盖已被修饰的氨基酸聚合物；例如，二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作(诸如与标记成分缀合)。如本文所用，术语“氨基酸”包括天然和/或非天然或合成氨基酸，包括甘氨酸和D或L旋光异构体，以及氨基酸类似物和肽模拟物。

如本文所用，术语“约”与术语“大约”同义使用。示例性地，关于量的术语“约”的使用表示略微超出所引用值的值，例如正负0.1％至10％。

术语“生物纯的培养物”或“基本上纯的培养物”是指本文所述的细菌种类的培养物，其不含足以干扰培养物的复制或通过正常细菌学技术检测到的量的其他细菌种类。

如本文所用，“控制序列”是指操纵子、启动子、沉默子或终止子。

如本文所用，“引入的”是指通过现代生物技术的引入，而不是天然存在的引入。

如本文所用，“组成型启动子”是在大多数条件下和/或在大多数发育阶段期间有活性的启动子。在生物技术中使用的表达载体中使用组成型启动子有若干优点，诸如：用于选择转基因细胞或生物体的蛋白质的高水平产生；报告蛋白或可评分标志物的高表达水平，允许容易的检测和定量；作为调控转录系统的一部分的转录因子的高水平产生；在生物体中需要普遍存在的活性的化合物的产生；以及所有发育阶段期间所期望的化合物的产生。

如本文所用，“非组成型启动子”是在某些条件下，在某些类型的细胞中，和/或在某些发育阶段期间有活性的启动子。例如，诱导型启动子和处于发育控制下的启动子是非组成型启动子。

如本文所用，“诱导型”或“阻抑型”启动子是处于化学或环境因素控制下的启动子。可影响诱导型启动子的转录的环境条件的实例包括厌氧条件、某些化学物质、光的存在、酸性或碱性条件等。

如本文所用，术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合，使得一个的功能受另一个调控。例如，当启动子能够调控编码序列的表达(即，编码序列处于启动子的转录控制下)时，该启动子与该编码序列可操作地连接。编码序列可以在有义或反义方向上可操作地连接至调控序列。在另一个实例中，本公开的互补RNA区域可以直接或间接可操作地连接至靶mRNA的5'，或靶mRNA的3'，或靶mRNA内，或第一互补区域在靶mRNA的5’而其补体在靶mRNA的3'。

如本文所用，术语“信号序列”是指将肽和多肽靶向细胞位置或细胞外环境的氨基酸序列。信号序列通常处于多肽的N端部分处并且通常酶促去除。具有其信号序列的多肽称为全长和/或未加工的。其信号序列去除的多肽称为成熟和/或经加工的。

如本文关于各种分子，例如多核苷酸、多肽、酶等使用的术语“外源”是指自然界中给定的酵母、细菌、生物体、微生物或细胞中通常或天然未发现的和/或由给定酵母、细菌、生物体、微生物或细胞产生的分子。

另一方面，如本文关于各种分子，例如多核苷酸、多肽、酶等使用的术语“内源”或“天然”是指自然界中给定的酵母、细菌、生物体、微生物或细胞中通常或天然发现的和/或由给定酵母、细菌、生物体、微生物或细胞产生的分子。

如本文在经修饰的宿主细胞的上下文中使用的术语“异源”是指各种分子，例如多核苷酸、多肽、酶等，其中以下中的至少一项是真实的：(a)所述一种或多种分子是宿主细胞外来的(“外源的”)(即，天然未发现的)；(b)所述一种或多种分子是给定的宿主微生物或宿主细胞中天然发现的(例如，是“内源的”)，但是在细胞中在非天然位置或以非天然量产生；和/或(c)所述一种或多种分子在核苷酸或氨基酸序列方面与内源性核苷酸或氨基酸序列不同，使得在核苷酸或氨基酸序列方面与内源发现的内源核苷酸或氨基酸不同的分子在细胞中以非天然的量(例如，大于天然发现的量)产生。

如本文关于第一家族或物种的原始酶或基因使用的术语“同源物”是指第二家族或物种的不同酶或基因，通过功能、结构或基因组分析确定是与第一家族或物种的原始酶或基因相对应的第二家族或物种的酶或基因。同源物最常具有功能、结构或基因组相似性。已知可以使用基因探针和PCR容易地克隆酶或基因的同源物的技术。可以使用功能测定和/或通过基因的基因组作图确认克隆序列作为同源物的同一性。

如果由基因编码的氨基酸序列具有与第二基因的氨基酸序列相似的氨基酸序列，则一种蛋白质与第二蛋白质具有“同源性”或与第二蛋白质“同源”。可替代地，如果两种蛋白质具有“相似的”氨基酸序列，则一种蛋白质与第二蛋白质具有同源性。因此，术语“同源蛋白”旨在意指所述两种蛋白具有相似的氨基酸序列。在某些情况下，两种蛋白质之间的同源性指示其因进化相关的共有家系。认为、据信或已知术语“同源序列”或“同源物”是功能上相关的。功能关系可以多种方式中的任一种指示，包括但不限于：(a)序列同一性程度和/或(b)相同或相似的生物学功能。优选地，指示(a)和(b)两者。序列同一性程度可以变化，但是在一个方面，为至少50％(当使用本领域已知的标准序列比对程序时)、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少98.5％或至少约99％或至少99.5％或至少99.8％或至少99.9％。同源性可以使用本领域中容易获得的软件程序来测定，诸如在Current Protocols in Molecular Biology(F.M.Ausubel等人编辑,1987)增刊30，第7.718节，表7.71中讨论的那些。一些比对程序是MacVector(OxfordMolecular Ltd,Oxford,U.K.)和ALIGN Plus(Scientific and Educational Software,Pennsylvania)。其他非限制性的比对程序包括Sequencher(Gene Codes,Ann Arbor,Michigan)、AlignX和Vector NTI(Invitrogen,Carlsbad,CA)。相似的生物学功能可以包括但不限于：催化相同或相似的酶促反应；对底物或辅因子具有相同或相似的选择性；具有相同或相似的稳定性；对各种发酵条件(温度、pH等)具有相同或相似的耐受性；和/或对各种代谢底物、产物、副产物、中间产物等具有相同或相似的耐受性。根据本领域技术人员已知用于测定给定生物学功能的一种或多种测定法，生物学功能的相似性程度可以变化，但是在一个方面，为至少1％、至少2％、至少3％、至少4％、至少5％、至少6％、至少7％、至少8％、至少9％、至少10％、至少20％、至少30％、至少40％、至少50％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少约91％、至少约92％、至少约93％、至少约94％、至少约95％、至少约96％、至少约97％、至少约98％或至少98.5％或至少约99％或至少99.5％或至少99.8％或至少99.9％。

术语“变体”是指本文所述的任何多肽或酶。变体还涵盖多聚体的一个或多个组分、包含单独组分的多聚体、包含多个单独组分的多聚体(例如，参考分子的多聚体)、化学分解产物和生物分解产物。具体而言，非限制性方面，由于编码参考酶的多肽序列的任何部分中的改变，酶可以是相对于参考酶的“变体”。在用于测量参考酶的制剂的酶活性的标准测定法中，参考酶的变体可以具有至少10％、至少30％、至少50％、至少80％、至少90％、至少100％、至少105％、至少110％、至少120％、至少130％或更高的酶活性。在一些方面，变体也可以指与本公开的全长或未经加工的酶具有至少50％、至少60％、至少70％、至少80％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性的多肽。在一些方面，变体还可以指与本公开的成熟的或经加工的酶具有至少50％、至少60％、至少70％、至少80％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％的序列同一性的多肽。

如本文所用，术语“微生物(microorganism或microbe)”应被广义地理解。这些可互换使用的术语包括但不限于两个原核域、细菌和古细菌。

如本文所用，“分离”、“分离的”、“分离的微生物”等术语旨在意指一种或多种微生物已经与在特定环境(例如培养基、水、反应室等)中与其相关的至少一种材料分离。因此，“分离的微生物”不存在于其天然环境中；相反，正是通过本文所述的各种技术，微生物从其天然环境中移除并且放置于非天然的存在状态中。因此，分离的菌株或分离的微生物可以作为例如生物纯培养物或孢子(或其他形式的菌株)存在。在一些方面，分离的微生物可以与可接受的载剂结合，所述载剂可以是商业上或工业上可接受的载剂。

在本公开的某些方面，分离的微生物以“分离的和生物纯培养物”存在。本领域的技术人员将理解，特定微生物的分离和生物纯培养物表示所述培养物基本上不含其他活生物体并且仅含有所讨论的个体微生物。培养物可以含有不同浓度的所述微生物。本公开指出，分离和生物纯微生物通常“必然不同于纯度较低或不纯的材料”。参见，例如，In reBergstrom,427F.2d 1394,(CCPA 1970)(讨论纯化的前列腺素)，另外参见，In re Bergy,596F.2d 952(CCPA 1979)(讨论纯化的微生物)，另外参见，Parke-Davis&Co.v.H.K.Mulford&Co.,189F.95(S.D.N.Y.1911)(讨论纯化的肾上腺素的学习手册)，aff’d in part,rev’d in part,196F.496(2d Cir.1912)，每个文献均以引用的方式并入本文。此外，在一些方面，本公开提供了必须在分离和生物纯微生物培养物中存在的浓度或纯度限制的某些定量度量。在某些方面，这些纯度值的存在是将本公开的微生物与以天然状态存在的那些微生物区分开来的另外属性。参见，例如，Merck&Co.v.Olin MathiesonChemical Corp.,253F.2d 156(4th Cir.1958)(讨论微生物产生的维生素B12的纯度限制)，该文献以引用的方式并入本文。

本公开的微生物可以包括孢子和/或营养细胞。在一些方面，本公开的微生物包括处于存活但不可培养(VBNC)状态的微生物。如本文所用，“孢子(spore或spores)”是指由细菌和真菌产生的适于生存和传播的结构。孢子通常以休眠结构为特征；然而，孢子能够通过萌发过程进行分化。萌发是孢子分化为能够进行代谢活动、生长和繁殖的营养细胞。单个孢子的萌发产生单个真菌或细菌营养细胞。真菌孢子是无性繁殖的单位，在一些情况下是真菌生命周期中的必要结构。细菌孢子是生存条件的结构，通常可能不利于营养细胞的存活或生长。

如本文所用，“微生物组合物”是指包含本公开的一种或多种微生物的组合物。

如本文所用，“载剂”、“可接受的载剂”、“商业上可接受的载剂”或“工业上可接受的载剂”是指可以施用、储存或转移微生物，不会对微生物产生不利影响的稀释剂、佐剂、赋形剂或媒介物。

如本文所用，术语“收率潜力”是指来自生物合成途径的产物的收率。在一个方面，收率潜力可以表示为按最终产物重量/起始化合物重量计的百分比。

如本文所用的术语“热力学最高收率”是指基于与原料相比的产物的能量值从给定原料诸如葡萄糖的发酵获得的产物的最高收率。在正常发酵中，不使用诸如光、氢气或甲烷或电力等额外能源，例如，产物不能含有比原料更多的能量。热力学最高收率表示来自原料的所有能量和质量都转化为产物时的产物收率。该收率可以计算并且不依赖于具体途径。如果朝向产物的具体途径的收率低于热力学最高收率，则其丧失质量并且最有可能在朝向产物的更有效的途径时得到改善或者被朝向产物的更有效的途径替代。

术语“氧化还原平衡”是指一组反应，它们一起产生与消耗一样多的氧化还原辅因子。设计代谢途径和工程化改造生物体，以使得氧化还原辅因子平衡或接近平衡通常使得所期望的化合物以更高效、更高收率的方式产生。氧化还原反应总是作为同时发生的两个半反应一起进行，一个半反应是氧化反应，另一个半反应是还原反应。在氧化还原过程中，还原剂将电子转移给氧化剂。因此，在反应中，还原剂或还原试剂丢失电子并且被氧化，而氧化剂或氧化试剂获得电子并且被还原。在一个方面，氧化还原反应在生物系统中发生。生物能量常常通过氧化还原反应储存和释放。光合作用涉及二氧化碳还原为糖和水氧化为分子氧。逆反应，呼吸作用氧化糖产生二氧化碳和水。作为中间步骤，还原碳化合物用于还原烟酰胺腺嘌呤二核苷酸(NAD+)，然后烟酰胺腺嘌呤二核苷酸有助于产生质子梯度，质子梯度驱动腺苷三磷酸(ATP)的合成并通过氧的还原得以维持。术语氧化还原状态通常用于描述生物系统(诸如细胞或器官)中GSH/GSSG、NAD+/NADH和NADP+/NADPH的平衡。氧化还原状态反映在几组代谢物(例如乳酸和丙酮酸、β-羟基丁酸和乙酰乙酸)的平衡中，其相互转化取决于这些比率。异常氧化还原状态可以在许多有害情况下发展，诸如缺氧、休克和败血症。

如本文所用，术语“生产率”是指每小时产生的生物产物的总量–产物克数/(升每小时)。

如本文所用，术语“基本上不含微生物”、“基本上不含细菌”或“基本上不含真菌/酵母”不应解释为意味着不存在微生物/细菌/真菌/酵母，虽然在一些方面这可以是优选的。相反，“基本上不含”应解释为意味着，例如，基本上不含细菌的组合物是这样的组合物：其中存在于组合物中的任何细菌都非常少以至于它们低于检出限。在一些方面，微生物选自一种或多种细菌、真菌、酵母、病毒、原生生物和藻类。

如本文所用，术语“不含微生物”是指完全不存在微生物或完全不存在能够进行繁殖营养生长的活微生物。

同时消耗木糖和葡萄糖

在工业或商业过程中，微生物生产率是一个关键因素，在考虑通常利润微薄的大规模反应的经济可行性时必须考虑这个因素。微生物生产率，在这个意义上是每升每小时产生的产物克数。在不存在经修饰的微生物的情况下，不断送入一个或多个反应室中的含有木糖和葡萄糖的流将可能导致至少葡萄糖对一种或多种单糖的摄取阻遏。

两阶段生长的潜在机制是碳分解代谢产物阻遏(CCR)，其中全局转录调控因子CRP(cAMP受体蛋白)在调控次级糖(诸如木糖、阿拉伯糖和半乳糖)的分解代谢操纵子的转录活化中发挥核心作用。磷酸烯醇丙酮酸:糖磷酸转移酶系统(PTS)也涉及葡萄糖诱导的大肠杆菌中木糖利用的阻遏。木糖可以被大肠杆菌用作唯一的碳源和能源，并且通过戊糖磷酸途径代谢。木糖可以通过两种摄取系统输入：高亲和力的ATP依赖性系统和相对低亲和力的D-木糖:H+同向转运蛋白。与主要通过能量效率更高的同向转运蛋白转运的阿拉伯糖转运不同，木糖主要通过能量消耗更高的ATP依赖性转运蛋白转运，即使在高糖浓度下也是如此。所有负责木糖摄取和分解代谢的基因都对CCR敏感。

为了实现将戊糖转化为所期望的化学物质的有效生物过程，有必要对宿主微生物进行工程化改造，以高效、同步和快速地利用混合糖，达到工业过程所需的收率和生产率。本公开阐述了一种代谢工程策略，以便有效促进来自木质纤维素生物质的木糖和葡萄糖的同时消耗，因此获得经工程化的微生物菌株的全部潜力，从而获得来源于D-木糖酸或D-木酮糖-1P或羟乙醛作为中间体的通路的所期望的化学物质。

对大肠杆菌中的糖共利用进行工程化改造的常见策略依赖于PTS组分的失活，这可能与galP(半乳糖:H+同向转运蛋白)活性和CRP突变的改善有关，也可能无关。然而，PTS组分的失活削弱葡萄糖摄取，并且CRP突变体通常具有缓慢的生长表型，这可能是由于其他重要基因表达的不可预测的变化。这两种方法导致生产率下降，特别是对于高糖浓度和低成本培养基的条件。

申请人认为，支持葡萄糖和木糖共同消耗从而产生所期望的化学物质是首次开发的代谢工程策略，其以D-木酮糖-1P或D-木糖酸或羟乙醛作为中间体，独立于PTS失活并且具有ATP结合转运蛋白缺失。

在一些方面，促进木糖和葡萄糖的同时消耗以产生所期望的化学物质基于：(1)不依赖于ATP的D-木糖同向转运蛋白的组成型过表达；(2)将木糖转化为D-木酮糖-1P或D-木糖酸的基因的组成型表达；(3)天然戊糖(主要是木糖和阿拉伯糖)ABC转运蛋白系统的缺失；和/或木糖分解代谢基因的缺失。

本文所述的主题与现有技术的区别在于，ABC转运蛋白的缺失或失活以及利用或包含D-木酮糖、D-木糖酸或羟乙醛作为中间体的同向转运蛋白和途径的表达不仅积极影响糖的共同利用，而且还增加了产生所期望的化学物质的途径的总收率和生产率。这种改善是由于微生物总代谢的调控、ATP可用性曲线的改变以及中间体D-木酮糖-1P、D-木糖酸和/或羟乙醛的产生的促进。参见Kim等人(2015.Metabolic Engineering,30:141-148),Sievert等人(2017.PNAS,114(28):7349-7354),Wang等人(2018.Microbial CellFactories,17(12):1-12)和Bai等人(2016.Metabolic Engineering,38:285-292)。

本公开包括克服葡萄糖对木糖的分解代谢阻遏的策略，允许同时消耗两种糖。与共同消耗糖的其他方法不同，本策略的设计和实施侧重于确保对糖的分解代谢阻遏不敏感的有效木糖摄取，同时保持天然PTS系统对葡萄糖的有效摄取。

在一些方面，本方法包括在所关注的微生物菌株中进行以下修饰：1(a)过表达可操作地连接至组成型启动子的天然木糖同向转运蛋白XylE，和/或1(b)过表达可操作地连接至组成型启动子的天然阿拉伯糖同向转运蛋白AraE；2(a)在组成型启动子下表达天然木糖异构酶XylA和异源性酮己糖激酶khk-C以及天然木酮糖激酶XylB的缺失或失活，或者2(b)表达可操作地连接至组成型启动子的异源性木糖脱氢酶xdh以及天然木糖异构酶XylA的缺失或失活和/或天然木酮糖激酶XylB的缺失；以及3ATP结合转运蛋白AraFGH、XylFGH、RbsABC和AlsABC的缺失。

在一些方面，木糖和阿拉伯糖同向转运蛋白的组成型表达使木糖输入独立于CRP调控，因此独立于培养液中存在的其他糖。在一些方面，木糖异构酶的组成型表达使木糖利用独立于CRP调控，因此也独立于培养液中存在的其他糖。在一些方面，酮己糖激酶khk-C的表达将D-木酮糖有效地转化为用于产生所期望的化学物质的中间体D-木酮糖1-P。在一些方面，木酮糖激酶的缺失防止碳从化学产生途径转向天然戊糖磷酸途径。

在一些方面，木糖脱氢酶的组成型表达使木糖利用独立于CRP调控，因此也独立于培养液中存在的其他糖；并且还将D-木糖有效地转化为用于产生所期望的化学物质的中间体D-木糖酸。在一些方面，木酮糖激酶和/或木糖异构酶的缺失防止碳从化学产生途径转向天然戊糖磷酸途径。在一些方面，ATP结合盒转运蛋白(诸如阿拉伯糖ABC转运蛋白和木糖ABC转运蛋白)的缺失避免了糖输入过程中的ATP丧失。ATP的净含量可以改变大肠杆菌的中心代谢的活性，从而可能增加途径收率。

在组成型启动子下过表达天然木糖同向转运蛋白XylE

D-木糖/质子同向转运蛋白XylE是一种由xylE基因编码的不依赖于ATP的低亲和力转运蛋白，是转运蛋白主要促进子超家族(MFS)的成员。据信xylE的转录受XylR(SEQ IDNO:7或SEQ ID NO:8)调控。XylR是一种由xylR基因编码的转录因子，它响应于木糖(xylE、xylFGH和xylAB基因)而正向调控木糖代谢和转运蛋白基因的转录。

木糖同向转运蛋白的组成型过表达释放碳分解代谢阻遏并且实现连续木糖输入，它独立于培养液中存在的糖，而葡萄糖摄取仍将由PTS系统组分进行。因此，水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时输入。

在组成型启动子下过表达天然阿拉伯糖同向转运蛋白AraE

D-阿拉伯糖/质子同向转运蛋白AraE是一种由araE基因编码的不依赖于ATP的低亲和力转运蛋白，是转运蛋白主要促进子超家族(MFS)的成员。araE的转录受AraC(SEQ IDNO:32或SEQ ID NO:33)和CRP调控。AraC是一种由araC基因编码的转录因子，它响应于阿拉伯糖(xylE、xylFGH和xylAB基因)而负向调控木糖代谢和转运蛋白基因的转录，并且响应于阿拉伯糖(araE、araFGH和araBAD基因)而正向调控阿拉伯糖代谢和转运蛋白基因的转录。在不存在葡萄糖的情况下，araE表达由阿拉伯糖诱导。众所周知，AraE转运蛋白是混杂的，能够转运木糖和其他戊糖。

混杂的阿拉伯糖同向转运蛋白的组成型表达释放CCR并且实现连续木糖输入，它独立于培养液中存在的糖，而葡萄糖摄取仍由PTS系统组分进行。因此，水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时输入。

在组成型启动子下表达天然木糖异构酶XylA和异源性酮己糖激酶khk-C，以及天然木酮糖激酶XylB的缺失

XylA是一种内源性D-木糖异构酶(图1，反应5，途径B)，它催化D-木糖转化为D-木酮糖。D-木糖异构酶(E.C.5.3.1.5)催化D-木糖在大肠杆菌中天然分解代谢的第一个反应。xylA的转录受XylR和CRP调控；在不存在葡萄糖的情况下，它的表达由木糖诱导。酮己糖激酶(图1，反应6，途径B)催化D-木酮糖磷酸化为D-木酮糖-1-P。酮己糖激酶(E.C.2.7.1.3)可以存在于多种生物体中，然而来自人肝脏的khk-C是对木酮糖有活性的有前景的候选物。D-木酮糖1-P是产生多种化学物质的关键中间体。

XylB是一种由xylB编码的木酮糖激酶(2.7.1.17)，它催化D-木酮糖的磷酸化(图1，反应8，途径B)。这是天然木糖降解途径的第二步，所述途径产生戊糖磷酸途径的中间体D-木酮糖-5-磷酸。该反应与通过khk-C进行的D-木酮糖的磷酸化竞争，使通量从D-木酮糖-1-P产生偏离至戊糖磷酸途径。

天然木糖异构酶xylA的组成型表达释放CCR，并且当与酮己糖激酶khk-C的组成型异源表达相关联时，使独立于培养液中存在的糖的连续木糖利用成为可能，并且产生生成化学物质的中间体D-木酮糖1-P。葡萄糖摄取仍将由PTS系统组分进行。因此，水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时利用。木酮糖激酶xylB的缺失将防止碳从化学产生途径转向天然戊糖磷酸途径。

在组成型启动子下表达异源性木糖脱氢酶xdh，以及天然木糖异构酶Xyla的缺失和/或天然木酮糖激酶XylB的缺失

异源性木糖脱氢酶xdh催化D-木糖转化为D-木糖酸内酯(图1，反应1，途径A)。D-木糖脱氢酶(E.C.1.1.1.175)可以存在于多种生物体中；然而，来自新月柄杆菌的xdh是针对D-木糖的活性的候选物。D-木糖酸内酯可以自发地转化为D-木糖酸，因此xdh针对木糖的表达产生D-木糖酸，这是产生多种化学物质的关键中间体。

由xylA编码的D-木糖异构酶(E.C.5.3.1.5)XylA催化D-木糖转化为戊糖磷酸途径的中间体D-木酮糖(图1，反应5，途径A)。由xylB编码的木酮糖激酶(2.7.1.17)XylB催化D-木酮糖的磷酸化(图1，反应8，途径A)，这是木糖降解途径的第二步，产生戊糖磷酸途径的另一个中间体D-木酮糖-5-磷酸。这两个反应都与xdh竞争，使通量从D-木糖酸产生偏离至戊糖磷酸途径。

木糖脱氢酶的组成型异源表达使独立于培养液中存在的糖的连续木糖利用成为可能，并且产生生成所期望的化学物质的中间体D-木糖酸。葡萄糖摄取仍将由PTS系统组分进行。因此，水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时利用。D-木糖异构酶和/或木酮糖激酶的缺失将防止碳从化学产生途径转向天然戊糖磷酸途径。

ATP结合盒转运蛋白AraFGH、XylFGH、RbsABC和AlsABC的缺失

阿拉伯糖ABC转运蛋白AraFGH(E.C.3.6.3.17，TCDB 3.A.1.2.2)是由araFGH基因编码的高亲和力的ATP驱动的系统。AraF是周质结合蛋白，AraH是膜组分，AraG是这种ABC转运蛋白的ATP结合组分。araFGH操纵子的转录受AraC和CRP调控。在不存在葡萄糖的情况下，araFGH表达由阿拉伯糖诱导。众所周知，AraFGH转运蛋白是混杂的，能够转运木糖和其他戊糖。

木糖ABC转运蛋白XylFGH(E.C.3.6.3.17，TCDB 3.A.1.2.4)是由xylFGH基因编码的高亲和力的ATP驱动的系统。XylF是周质结合蛋白，XylH是膜组分，XylG是这种ABC转运蛋白的ATP结合组分。xylFGH操纵子的转录受XylR和CRP调控；在不存在葡萄糖的情况下，它的表达由木糖诱导。

核糖ABC转运蛋白RbsABC(E.C.3.6.3.17；TCDB 3.A.1.2.1)是由rbsABC基因编码的高亲和力的ATP驱动的系统。

在一些方面，所述一个或多个编码RbsABC的RbsB周质结合蛋白亚基的核酸分子包含SEQ ID NO:35中列出的核酸序列。在一些方面，所述一个或多个编码RbsABC的RbsB周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:38中列出的氨基酸序列。在一些方面，所述一个或多个编码RbsABC的RbsA ATP结合亚基的核酸分子包含SEQ ID NO:34中列出的核酸序列。在一些方面，所述一个或多个编码RbsABC的RbsA ATP结合亚基的氨基酸序列包含SEQID NO:37中列出的氨基酸序列。在一些方面，所述一个或多个编码RbsABC的RbsC膜亚基的核酸分子包含SEQ ID NO:36中列出的核酸序列。在一些方面，所述一个或多个编码RbsABC的RbsC膜亚基的氨基酸序列包含SEQ ID NO:39中列出的氨基酸序列。

阿洛糖ABC转运蛋白AlsABC(E.C.3.6.3.17；TCDB 3.A.1.2.6)是由alsABC基因编码的ATP驱动的系统。

在一些方面，所述一个或多个编码AlsABC的alsB周质结合蛋白亚基的核酸分子包含SEQ ID NO:41中列出的核酸序列。在一些方面，所述一个或多个编码AlsABC的alsB周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:44中列出的氨基酸序列。在一些方面，所述一个或多个编码AlsABC的alsA ATP结合亚基的核酸分子包含SEQ ID NO:40中列出的核酸序列。在一些方面，所述一个或多个编码AlsABC的alsA ATP结合亚基的氨基酸序列包含SEQID NO:43中列出的氨基酸序列。在一些方面，所述一个或多个编码AlsABC的alsC膜亚基的核酸分子包含SEQ ID NO:42中列出的核酸序列。在一些方面，所述一个或多个编码AlsABC的alsC膜亚基的氨基酸序列包含SEQ ID NO:45中列出的氨基酸序列。

ATP结合盒转运蛋白(诸如核糖ABC转运蛋白、阿洛糖ABC转运蛋白、阿拉伯糖ABC转运蛋白和木糖ABC转运蛋白，包括大肠杆菌中优先的木糖转运蛋白)的缺失结合xylE组成型表达(参见实施例1和2)，释放CCR并且实现连续木糖输入。此外，缺失将避免糖输入过程中的ATP丧失。净ATP可以改变大肠杆菌的中心代谢的活性。

微生物

如本文所述，在一些方面，重组微生物能够同时利用木糖和葡萄糖。

如本文所述，在一些方面，所述重组微生物是原核微生物。在一些方面，所述原核微生物是细菌。“细菌”或“真细菌”是指原核生物域。细菌包括如下至少十一个不同的类别：(1)革兰氏阳性(革兰氏+)细菌，其中有两个主要分支：(1)高G+C类别(放线菌(Actinomycete)、分枝杆菌(Mycobacteria)、微球菌(Micrococcus)等)(2)低G+C类别(杆菌(Bacillus)、梭菌(Clostridia)、乳酸杆菌(Lactobacillus)、葡萄球菌(Staphylococci)、链球菌(Streptococci)、支原体(Mycoplasmas))；(2)变形菌门，例如紫色光合成+非光合成革兰氏阴性细菌(包括大多数“常见”革兰氏阴性细菌)；(3)蓝细菌(Cyanobacteria)，例如氧光养生物；(4)螺旋体(Spirochetes)和相关物种；(5)浮霉状菌(Planctomyces)；(6)拟杆菌(Bacteroides)、黄杆菌(Flavobacteria)；(7)衣原体(Chlamydia)；(8)绿色硫细菌；(9)绿色非硫细菌(也是厌氧光养生物)；(10)抗放射性微球菌和亲缘菌；(11)栖热袍菌(Thermotoga)和嗜热栖热腔菌(Thermosipho thermophiles)。

“革兰氏阴性细菌”包括球菌、非肠杆菌和肠杆菌。革兰氏阴性细菌的属包括例如奈瑟氏菌属(Neisseria)、螺菌属(Spirillum)、巴斯德菌属(Pasteurella)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、弗朗西斯菌属(Francisella)、嗜血杆菌属(Haemophilus)、博代氏菌属(Bordetella)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、志贺菌属(Shigella)、克雷白杆菌属(Klebsiella)、变形菌属(Proteus)、弧菌属(Vibrio)、假单胞菌属(Pseudomonas)、拟杆菌属(Bacteroides)、醋酸杆菌属(Acetobacter)、气杆菌属(Aerobacter)、土壤杆菌属(Agrobacterium)、固氮菌属(Azotobacter)、螺旋状菌属(Spirilla)、沙雷氏菌属(Serratia)、弧菌属(Vibrio)、根瘤菌属(Rhizobium)、衣原体属(Chlamydia)、立克次体属(Rickettsia)、密螺旋体属(Treponema)和梭杆菌属(Fusobacterium)。

“革兰氏阳性细菌”包括球菌、非孢子化杆菌和孢子化杆菌。革兰氏阳性细菌的属包括例如放线菌属(Actinomyces)、杆菌属(Bacillus)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、丹毒丝菌属(Erysipelothrix)、乳杆菌属(Lactobacillus)、李斯特菌属(Listeria)、分支杆菌属(Mycobacterium)、粘球菌属(Myxococcus)、诺卡菌属(Nocardia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。

在一些方面，本公开的微生物是真菌。

在一些方面，重组微生物是真核微生物。在一些方面，真核微生物是酵母。在示例性方面，酵母是选自由以下组成的组的属的成员：耶氏酵母属(Yarrowia)、念珠菌属(Candida)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)、伊萨酵母属(Issatchenkia)、接合酵母属(Zygosaccharomyces)、德巴利氏酵母属(Debaryomyces)、裂殖酵母属(Schizosaccharomyces)、管囊酵母属(Pachysolen)、隐球酵母属(Cryptococcus)、毛孢子菌属(Trichosporon)、红酵母属(Rhodotorula)和粘液菌属(Myxozyma)。

在一些方面，重组微生物是原核微生物。在示例性方面，原核微生物是选自由以下组成的组的属的成员：埃希氏菌属(Escherichia)、梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱菌属(Alcaligenes)、克雷白杆菌属(Klebsiella)、类芽孢杆菌属(Paenibacillus)、节杆菌属(Arthrobacter)、棒状杆菌属(Corynebacterium)和短杆菌属(Brevibacterium)。

在一些方面，用于本公开的方法中的微生物可以选自由以下组成的组：耶氏酵母属、念珠菌属、酵母属、毕赤酵母属、汉逊酵母属、克鲁维酵母菌属、伊萨酵母属、接合酵母属、德巴利氏酵母属、裂殖酵母属、管囊酵母属、隐球酵母属、毛孢子菌属、红酵母属、粘液菌属、埃希氏菌属、梭菌属、发酵单胞菌属、沙门氏菌属、红球菌属、假单胞菌属、杆菌属、乳杆菌属、肠球菌属、产碱菌属、克雷白杆菌属、类芽孢杆菌属、节杆菌属、棒状杆菌属和短杆菌属。

在一些方面，由本文所述的方法产生的微生物可以是选自以下属中的任一个属的种：奈瑟氏菌属、螺菌属、巴斯德菌属、布鲁氏菌属、耶尔森氏菌属、弗朗西斯菌属、嗜血杆菌属、博代氏菌属、埃希氏菌属、沙门氏菌属、志贺菌属、克雷白杆菌属、变形菌属、弧菌属、假单胞菌属、拟杆菌属、醋酸杆菌属、气杆菌属、土壤杆菌属、固氮菌属、螺旋状菌属、沙雷氏菌属、弧菌属、根瘤菌属、衣原体属、立克次体属、密螺旋体属、梭杆菌属、放线菌属、杆菌属、梭菌属、棒状杆菌属、丹毒丝菌属、乳杆菌属、李斯特菌属、分支杆菌属、粘球菌属、诺卡菌属、葡萄球菌属、链球菌属、链霉菌属、酵母属、毕赤酵母属和曲霉属(Aspergillus)。

在一些方面，用于本公开的方法中的微生物包括：梭菌属、永达尔梭菌、产乙醇梭菌、拉氏梭菌、粘液真杆菌、嗜甲基丁酸杆菌、热醋穆尔氏菌、醋酸梭菌、伍氏醋酸杆菌、巴氏嗜喊菌、德雷克氏梭菌、食一氧化碳梭菌、甲酸乙酸梭菌、粪味梭菌、热自养穆尔氏菌、长醋丝菌、延长布劳特氏菌、乙二醇梭菌、大梭菌、马永贝梭菌、食甲氧基苯甲酸梭菌、丙酮丁醇梭菌、拜氏梭菌、普氏产醋杆菌、凯伍嗜热厌氧菌、卵形鼠孢菌、棕色嗜热产醋菌、甲醇醋酸杆菌、白蚁鼠孢菌、甘油穆尔氏菌、聚集性真杆菌、固氮密螺旋体、大肠杆菌、酿酒酵母、恶臭假单胞菌、芽孢杆菌属、棒状杆菌属、解脂耶氏酵母、树干毕赤酵母和甘油利用泰瑞孢子菌。

术语“重组微生物”和“重组宿主细胞”在本文中可互换使用，并且是指已经过遗传修饰以表达或过表达内源酶、表达异源酶，诸如包括在载体、整合构建体中的那些，或在内源基因的表达方面具有改变的微生物。“改变”意指编码一个或多个多肽或多肽亚基的RNA分子或等同RNA分子的基因表达或水平，或一个或多个多肽或多肽亚基的活性上调或下调，使得表达、水平或活性大于或小于在不存在改变的情况下观察到的表达、水平或活性。例如，术语“改变”可以意指“抑制”，但词语“改变”的使用不限于该定义。应理解，术语“重组微生物”和“重组宿主细胞”不仅指特定重组微生物，而且指此类微生物的后代或潜在后代。因为由于突变或环境影响在下一代中可能出现某些修饰，所以事实上此类后代可能与亲本细胞不同，但仍包括在本文所用术语的范围内。

在本公开的方法中使用的微生物的培养可以使用本领域已知的用于使用本公开的微生物培养和发酵底物的许多方法进行。

发酵可以在任何合适的生物反应器中进行，诸如连续搅拌釜式生物反应器、泡罩塔生物反应器、气升式生物反应器、流化床生物反应器、填充床生物反应器、光生物反应器、固定化细胞反应器、滴流床反应器、移动床生物膜反应器、泡罩塔、气升发酵槽、膜反应器(诸如中空纤维膜生物反应器)等。在一些方面，生物反应器包括在其中培养微生物的第一生长反应器和向其中供给来自生长反应器的发酵肉汤并且大部分发酵产物在其中产生的第二发酵反应器。在一些方面，生物反应器同时实现了微生物的培养和从提供的碳源诸如底物和/或原料产生发酵产物。

产物

在一些方面，本公开的经工程化的微生物从包含木糖和葡萄糖的原料产生发酵产物，其中所述重组微生物同时利用木糖和葡萄糖。在一些方面，微生物产生的发酵产物包括一种或多种包含至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、或至少10个碳的分子。

在一些方面，本公开的经工程化的微生物能够产生所期望的化学物质，诸如单乙二醇、乙醇酸、C3化合物(诸如丙酮、异丙醇和丙烯)、氨基酸和多元醇。参见Koch等人(WO2017156166A1)和Mcbride等人(WO2011022651A1)。

在一些方面，由于单一类型的原料中存在的多个碳源的阻遏作用不存在，因此本公开的经工程化的微生物能够以最大收率产生所期望的化学物质。

遗传修饰

引入本公开的一种或多种微生物中的遗传修饰可以改变或消除靶基因的调控序列。在一些方面，引入本公开的一种或多种微生物中的遗传修饰可以将新性状或新表型引入到所述一种或多种微生物中。也可以插入一个或多个调控序列，包括异源调控序列和在对应于向其中引入遗传变异的微生物的动物、植物、真菌、酵母、细菌或病毒的基因组内发现的调控序列。而且，可以基于微生物培养物中基因的表达水平来选择调控序列。遗传变异可以是特异性引入靶位点的预定遗传变异。在一些方面，遗传变异是引入到一条或多条微生物染色体中的核酸序列。在一些方面，遗传变异是引入到一个或多个染色体外核酸序列中的核酸序列。遗传变异可以是靶位点内的随机突变。遗传变异可以是一个或多个核苷酸的插入或缺失。在一些情况下，将多个不同的遗传变异(例如，2、3、4、5、10个或更多个)引入一种或多种分离的细菌中。所述多个遗传变异可以是上述类型中的任一种、相同或不同类型，以及任何组合。在一些情况下，连续引入多个不同的遗传变异，在第一分离步骤之后引入第一遗传变异，在第二分离步骤之后引入第二遗传变异，以此类推，以便在微生物中积聚多个所期望的修饰。

在一些方面，遗传修饰是靶基因或调控序列的缺失或失活。在一些方面，缺失是靶基因或大部分靶基因的除去。在一些方面，缺失是靶基因或大部分靶基因的替代。在其他方面，缺失导致靶基因的完全功能丧失。在一些方面，缺失导致靶基因的部分功能丧失。在一些方面，功能丧失或部分功能丧失通过将经修饰的靶基因序列的活性与未经修饰的靶基因序列的活性进行比较来确定。在一些方面，靶基因的失活是可操作地连接至靶序列的一个或多个调控或控制序列的缺失或破坏的结果。在一些方面，靶基因的失活是用异源性序列使靶基因破坏的结果。在一些方面，失活导致靶基因的部分功能丧失。在一些方面，失活导致靶基因的完全功能丧失。

在一些方面，所期望的化学物质的产生中阐述的底物中的一种或多种是从碳原料(例如，木糖和葡萄糖)生物合成的。

一般来说，术语“遗传变异”是指相对于参考多核苷酸，诸如参考基因组或其一部分，或参考基因或其一部分引入多核苷酸序列内的任何变化。遗传变异可以称为“突变”，并且包含遗传变异的序列或生物体可以称为“遗传变体”或“突变体”。遗传变异可以具有许多作用，诸如一些生物活性的增加或减少，这些生物活性包括基因表达、代谢和细胞信号传导。遗传变异可以特异性引入靶位点，或随机引入。多种分子工具和方法可用于引入遗传变异。例如，遗传变异可以经由聚合酶链式反应诱变、寡核苷酸定向诱变、饱和诱变、片段改组诱变、同源重组、重组工程、lambda red介导的重组、CRISPR/Cas9系统、化学诱变及其组合来引入。引入遗传变异的化学方法包括将DNA暴露于化学诱变剂，例如，甲磺酸乙酯(EMS)、甲磺酸甲酯(MMS)、N-硝基尿糖(EN U)、N-甲基-N-硝基-N′-硝基胍、4-硝基喹啉N-氧化物、硫酸二乙酯、苯并芘、环磷酰胺、博来霉素(bleomycin)、三乙基三聚氰胺、丙烯酰胺单体、氮芥、长春新碱、二环氧烷烃(例如，二环氧丁烷)、ICR-170、甲醛、盐酸丙卡巴肼、环氧乙烷、二甲基亚硝胺、7,12二甲基苯并(a)蒽、苯丁酸氮芥、六甲基磷酰胺、白消安等等。辐射突变诱导剂包括紫外辐射、γ-辐照、X射线和快中子轰击。还可以使用例如三甲基补骨脂素与紫外线将遗传变异引入核酸中。随机或靶向插入移动DNA元件，例如转座元件，是产生遗传变异的另一种合适的方法。遗传变异可以在无细胞的体外系统中在扩增期间引入核酸中，例如使用聚合酶链式反应(PCR)技术，诸如易错PCR。可以在体外使用DNA改组技术(例如，外显子改组、结构域交换等)将遗传变异引入核酸中。

遗传变异也可以由于细胞中DNA修复酶的缺乏而引入核酸中，例如，预计细胞中存在编码突变型DNA修复酶的突变基因会在该细胞的基因组中产生高频率的突变(即，约1个突变/100个基因-1个突变/10,000个基因)。编码DNA修复酶的基因的实例包括但不限于MutH、Mut S、Mut L和Mut U，以及它们在其他物种中的同源物(例如，MSH 1 6、PMS 1 2、MLH 1、GTBP、ERCC-1等)。用于引入遗传变异的各种方法的示例性描述提供于例如Stemple(2004)Nature 5:1-7；Chiang等人(1993)PCR Methods Appl 2(3):210-217；Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751；以及美国专利号6,033,861和6,773,900中。

引入到微生物中的遗传变异可以分类为转基因的、顺基因的、基因组内的、基因内的、基因间的、合成的、演化的、重排的或SNP。

CRISPR/Cas9(规律间隔成簇短回文重复序列)/CRISPR相关(Cas)系统可用于引入所期望的突变。CRISPR/Cas9通过使用CRISPR RNA(crRNA)引导侵入核酸的沉默，为细菌和古细菌提供针对病毒和质粒的获得性免疫。Cas9蛋白(或其功能等同物和/或其变体，即Cas9样蛋白)天然含有DNA核酸内切酶活性，其取决于蛋白质与称为crRNA和tracrRNA(也称为向导RNA)的两种天然存在的或合成的RNA分子的缔合。在一些情况下，所述两种分子共价连接形成单个分子(也称为单向导RNA(“sgRNA”)。因此，Cas9或Cas9样蛋白与靶向DNA的RNA缔合(该术语涵盖双分子向导RNA构型和单分子向导RNA构型两者)，从而活化Cas9或Cas9样蛋白并将所述蛋白引导到靶核酸序列。如果Cas9或Cas9样蛋白保留其天然酶促功能，则它将会裂解靶DNA以产生双链断裂，这可以导致基因组改变(即，编辑：缺失、插入(当存在供体多核苷酸时)、置换等)，从而改变基因表达。Cas9的一些变体(所述变体被术语Cas9样所涵盖)已经改变，使得它们具有降低的DNA裂解活性(在一些情况下，它们裂解单链而非靶DNA的两条链，而在其他情况下，它们的DNA裂解活性严重降低或没有DNA裂解活性)。用于引入遗传变异的CRISPR系统的进一步示例性描述可在例如US8795965中找到。

寡核苷酸定向诱变，也称为定点诱变，通常利用合成DNA引物。这种合成引物含有所期望的突变并且与突变位点周围的模板DNA互补，使其可与目标基因中的DNA杂交。突变可以是单碱基变化(点突变)、多碱基变化、缺失或插入，或这些的组合。然后，使用拷贝基因的其余部分的DNA聚合酶延伸单链引物。这样拷贝的基因含有突变位点，然后可以作为载体引入宿主细胞中并克隆。最后，可以通过DNA测序以检查它们含有所期望的突变来选择突变体。

可以使用易错PCR引入遗传变异。在这种技术中，在序列复制的保真度不足的条件下，使用DNA聚合酶扩增目标基因。结果是扩增产物在序列中含有至少一个错误。当扩增基因且与模板分子相比时，反应的所得产物在序列中含有一个或多个改变时，所得产物与模板相比是诱变的。引入随机突变的另一种手段是使细胞暴露于化学诱变物，诸如亚硝基胍或甲磺酸乙酯(Nestmann,Mutat Res 1975年6月；28(3):323-30)，然后从宿主中分离含有该基因的载体。

同源重组诱变涉及外源DNA片段与靶向多核苷酸序列之间的重组。在发生双链断裂之后，在称为切除的过程中切掉断裂的5’末端周围的DNA区段。在随后的链侵入步骤中，断裂的DNA分子的突出3'末端然后“侵入”未断裂的相似或相同DNA分子。该方法可用于使基因缺失，去除外显子，添加基因以及引入点突变。同源重组诱变可以是永久性的或条件性的。通常，还提供了重组模板。重组模板可以是另一载体的组分，包含在单独的载体中，或作为单独的多核苷酸提供。在一些方面，将重组模板设计为在同源重组中充当模板，诸如在被位点特异性核酸酶切口或裂解的靶序列内或附近。模板多核苷酸可以具有任何合适的长度，诸如长度为约或超过约10、15、20、25、50、75、100、150、200、500、1000个或更多个核苷酸。在一些方面，模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时，模板多核苷酸可与靶序列的一个或多个核苷酸重叠(例如约或超过约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100个或更多个核苷酸)。在一些方面，当模板序列和包含靶序列的多核苷酸最佳比对时，模板多核苷酸最近的核苷酸在距靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个或更多个核苷酸内。可用于同源重组方法中的定点核酸酶的非限制性实例包括锌指核酸酶、CRISPR核酸酶、TALE核酸酶和大范围核酸酶。关于此类核酸酶的使用的进一步描述，参见例如US8795965和US20140301990。

引入遗传变异可能是不完整的过程，使得经处理的细菌群体中的一些细菌携带所期望的突变，而其他细菌则不携带所期望的突变。在一些情况下，期望施加选择压力，以便富集携带所期望的遗传变异的细菌。传统上，对成功的遗传变体的选择涉及选择或淘汰遗传变异赋予或消除的一些功能性，诸如在插入抗生素抗性基因或消除能够将非致死性化合物转化为致死性代谢物的代谢活性的情况下。还可以基于多核苷酸序列本身施加选择压力，使得仅需引入所期望的遗传变异(例如，也不需要选择标志物)。在这种情况下，选择压力可以包括裂解缺乏引入靶位点的遗传变异的基因组，使得有效地针对设法向其中引入遗传变异的参考序列进行选择。通常，裂解发生在靶位点的100个核苷酸内(例如，在距靶位点75、50、25、10个或更少的核苷酸内，包括在靶位点处或靶位点内裂解)。裂解可以由选自由锌指核酸酶、CRISPR核酸酶、TALE核酸酶(TALEN)或大范围核酸酶组成的组的位点特异性核酸酶定向。此类方法类似于用于增强靶位点处的同源重组的方法，除了不提供用于同源重组的模板之外。因此，缺乏所期望的遗传变异的细菌更有可能经历裂解，裂解未得到修复，导致细胞死亡。然后可以分离选择中存活的细菌，以评估赋予的改善性状。

CRISPR核酸酶可用作位点特异性核酸酶，以将裂解定向于靶位点。通过使用Cas9杀伤非突变细胞，可以获得突变微生物的改善选择。然后可以从组织中重新分离微生物。用于淘汰非变体的CRISPR核酸酶系统可以采用与上文关于引入遗传变异描述的那些相似的元件，除了不提供用于同源重组的模板之外。因此，定向于靶位点的裂解增强了受影响的细胞的死亡。

可用于特异性诱导靶位点处的裂解的其他选项是可用的，诸如锌指核酸酶、TALE核酸酶(TALEN)系统和大范围核酸酶。锌指核酸酶(ZFN)是通过使锌指DNA结合结构域与DNA裂解结构域融合而产生的人工DNA核酸内切酶。ZFN可以经工程化改造以靶向所期望的DNA序列，并且这使得锌指核酸酶能够裂解独特的靶序列。当引入细胞中时，ZFN可用于通过诱导双链断裂来编辑细胞中的靶DNA(例如，细胞基因组)。转录活化因子样效应物核酸酶(TALEN)是通过使TAL(转录活化因子样)效应物DNA结合结构域与DNA裂解结构域融合而产生的人工DNA核酸内切酶。TALEN可以快速工程化改造为结合几乎任何所期望的DNA序列，并且当引入细胞中时，TALEN可用于通过诱导双链断裂来编辑细胞中的靶DNA(例如，细胞基因组)。大范围核酸酶(归巢核酸内切酶)是内源脱氧核糖核酸酶，其特征在于大的识别位点(12至40个碱基对的双链DNA序列)。大范围核酸酶可用于以高度靶向的方式置换、消除或修饰序列。通过蛋白质工程改造修饰其识别序列，可以改变靶向序列。大范围核酸酶可用于修饰所有基因组类型，无论是细菌、植物还是动物的，并且通常分为四个家族：LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性的归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。

在一些方面，微生物是重组微生物。在一些方面，微生物已经被遗传修饰为产生单乙二醇。在一些方面，微生物已经被遗传修饰为产生一种或多种三碳化合物，诸如丙酮、异丙醇和丙烯。在一些方面，微生物已经被遗传修饰为共同产生单乙二醇和一种或多种三碳化合物。在一些方面，微生物已经用微生物生物合成途径进行遗传修饰以产生单乙二醇、丙酮、异丙醇和丙烯中的一种或多种。参见Koch等人(WO2017156166A1)，该文献涉及用于对微生物进行工程化改造以从可再生原料产生单乙二醇、丙酮、异丙醇和丙烯中的一种或多种的现有技术。

在一些方面，微生物已经通过引入木糖酸途径进行遗传修饰。在一些方面，微生物已经通过引入木酮糖磷酸途径进行遗传修饰。在一些方面，微生物已经通过引入核酮糖磷酸途径进行遗传修饰。参见Koch等人。

能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖

在一些方面，所述重组微生物包含以下一项或多项：(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活，以使得所述转运蛋白不表达；(b)一个或多个内源性或外源性核酸序列，其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子；其中所述C5糖同向转运蛋白包括：(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白；(c)一个或多个内源性或外源性核酸序列，其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木酮糖激酶的缺失或失活，和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，C5糖同向转运蛋白是能够转运5碳糖的同向转运蛋白。在一些方面，5碳糖可以是但不限于木糖、阿拉伯糖或核糖。

MEG和/或丙酮的通常产生

在一些方面，所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，所述微生物还包含乙醇酸脱氢酶glcDEF的缺失或失活。在一些方面，所述C5同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面，所述一个或多个编码所述GAPDH启动子的核酸分子包含SEQ ID NO:95中列出的核酸序列。在一些方面，所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面，所述一个或多个编码所述XylE的核酸分子包含SEQ ID NO:48中列出的核酸序列。在一些方面，所述一个或多个编码所述XylE的氨基酸序列包含SEQ ID NO:49中列出的氨基酸序列。在一些方面，所述木糖同向转运蛋白是所述微生物内源性的。在一些方面，所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面，所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面，所述一个或多个编码所述AraE的核酸分子包含SEQ ID NO:46中列出的核酸序列。在一些方面，所述一个或多个编码所述AraE的氨基酸序列包含SEQ ID NO:47中列出的氨基酸序列。在一些方面，所述木糖对其他单糖的分解代谢阻遏不敏感。

MEG和/或丙酮的产生，包括木酮糖途径

在一些方面，所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；和(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物包括MEG产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活；其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，(c)和(d)在由proD启动子控制的操纵子中。在一些方面，所述一个或多个编码所述proD启动子的核酸分子包含SEQ ID NO:53中列出的核酸序列。在一些方面，所述木糖异构酶是XylA。在一些方面，所述一个或多个编码所述XylA的核酸分子包含SEQID NO:5中列出的核酸序列。在一些方面，所述一个或多个编码所述XylA的氨基酸序列包含SEQ ID NO:6中列出的氨基酸序列。在一些方面，所述木糖异构酶是所述微生物内源性的。在一些方面，酮己糖激酶是Khk-C。在一些方面，酮己糖激酶来自智人。在一些方面，所述酮己糖激酶是所述微生物异源性的。在一些方面，所述一个或多个编码所述Khk-C的核酸分子包含SEQ ID NO:11中列出的核酸序列。在一些方面，所述一个或多个编码所述Khk-C的氨基酸序列包含SEQ ID NO:12中列出的氨基酸序列。在一些方面，所述果糖二磷酸醛缩酶是aldoB。在一些方面，所述果糖二磷酸醛缩酶来自智人。在一些方面，所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面，所述一个或多个编码所述aldoB的核酸分子包含SEQID NO:50中列出的核酸序列。在一些方面，所述一个或多个编码所述aldoB的氨基酸序列包含SEQ ID NO:51中列出的氨基酸序列。在一些方面，所述羟乙醛还原酶是所述微生物内源性的。在一些方面，所述羟乙醛还原酶是fucO。在一些方面，所述一个或多个编码所述fucO的核酸分子包含SEQ ID NO:52中列出的核酸序列。在一些方面，所述一个或多个编码所述fucO的氨基酸序列包含SEQ ID NO:98中列出的氨基酸序列。在一些方面，所述木酮糖激酶是XylB。在一些方面，所述一个或多个编码所述XylB的核酸分子包含SEQ ID NO:13中列出的核酸序列。在一些方面，所述一个或多个编码所述XylB的氨基酸序列包含SEQ ID NO:14中列出的氨基酸序列。

MEG和/或丙酮的产生，包括木糖酸途径

在一些方面，所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；和(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物包括MEG产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活；并且其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面，所述木糖脱氢酶是所述微生物异源性的。在一些方面，所述一个或多个编码所述新月柄杆菌木糖脱氢酶的核酸分子包含SEQ ID NO:15中列出的核酸序列。在一些方面，所述一个或多个编码所述新月柄杆菌木糖脱氢酶的氨基酸序列包含SEQ ID NO:16中列出的氨基酸序列。在一些方面，所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱氢酶的核酸分子包含SEQ ID NO:97中列出的核酸序列。在一些方面，所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱氢酶的氨基酸序列包含SEQ ID NO:17中列出的氨基酸序列。在一些方面，所述一个或多个编码所述沃氏富盐菌木糖脱氢酶的核酸分子包含SEQ ID NO:18中列出的核酸序列。在一些方面，所述一个或多个编码所述沃氏富盐菌木糖脱氢酶的氨基酸序列包含SEQ ID NO:19中列出的氨基酸序列。

在一些方面，所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面，所述木糖酸内酯酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶是所述微生物内源性的。在一些方面，所述一个或多个编码所述新月柄杆菌木糖酸内酯酶的核酸分子包含SEQ ID NO:54中列出的核酸序列。在一些方面，所述一个或多个编码所述新月柄杆菌木糖酸内酯酶的氨基酸序列包含SEQ ID NO:55中列出的氨基酸序列。在一些方面，所述一个或多个编码所述异种伯克霍尔德氏菌木糖酸内酯酶的核酸分子包含SEQID NO:56中列出的核酸序列。在一些方面，所述一个或多个编码所述异种伯克霍尔德氏菌木糖酸内酯酶的氨基酸序列包含SEQ ID NO:57中列出的氨基酸序列。在一些方面，所述一个或多个编码所述沃氏富盐菌木糖酸内酯酶的核酸分子包含SEQ ID NO:58中列出的核酸序列。在一些方面，所述一个或多个编码所述沃氏富盐菌木糖酸内酯酶的氨基酸序列包含SEQ ID NO:59中列出的氨基酸序列。

在一些方面，所述木糖脱水酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面，所述木糖脱水酶是所述微生物异源性的。在一些方面，所述木糖脱水酶是所述微生物内源性的。在一些方面，所述一个或多个编码所述新月柄杆菌木糖脱水酶的核酸分子包含SEQ ID NO:60中列出的核酸序列。在一些方面，所述一个或多个编码所述新月柄杆菌木糖脱水酶的氨基酸序列包含SEQ ID NO:61中列出的氨基酸序列。在一些方面，所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱水酶的核酸分子包含SEQ ID NO:62中列出的核酸序列。在一些方面，所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱水酶的氨基酸序列包含SEQ ID NO:63中列出的氨基酸序列。在一些方面，所述一个或多个编码所述沃氏富盐菌木糖脱水酶的核酸分子包含SEQ ID NO:64中列出的核酸序列。在一些方面，所述一个或多个编码所述沃氏富盐菌木糖脱水酶的氨基酸序列包含SEQ ID NO:65中列出的氨基酸序列。在一些方面，所述羟乙醛还原酶是所述微生物内源性的。在一些方面，所述羟乙醛还原酶是fucO。在一些方面，所述羟乙醛还原酶是所述微生物异源性的。在一些方面，所述木糖异构酶是XylA。在一些方面，所述木酮糖激酶是XylB。

MEG和/或丙酮的产生，包括木酮糖途径

在一些方面，所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；和(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物包括MEG产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活；其中所述重组微生物包括丙酮产生途径，所述途径具有以下中的一项或多项：(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化，其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，(f)、(g)和(h)在由OXB11启动子控制的操纵子中。在一些方面，所述一个或多个编码所述OXB11的核酸分子包含SEQ ID NO:78中列出的核酸序列。在一些方面，所述乙酰乙酰基辅酶A硫解酶是Thl。在一些方面，所述硫解酶来自丙酮丁醇梭菌或拜氏梭菌。在一些方面，所述一个或多个编码所述丙酮丁醇梭菌thl硫解酶的核酸分子包含SEQ IDNO:68中列出的核酸序列。在一些方面，所述一个或多个编码所述丙酮丁醇梭菌thl硫解酶的氨基酸序列包含SEQ ID NO:69中列出的氨基酸序列。在一些方面，所述一个或多个编码所述拜氏梭菌thl硫解酶的核酸分子包含SEQ ID NO:66中列出的核酸序列。在一些方面，所述一个或多个编码所述拜氏梭菌thl硫解酶的氨基酸序列包含SEQ ID NO:67中列出的氨基酸序列。在一些方面，所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面，所述乙酰乙酸脱羧酶是Adc。在一些方面，所述脱羧酶来自丙酮丁醇梭菌或拜氏梭菌。在一些方面，所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:74中列出的核酸序列。在一些方面，所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ ID NO:75中列出的氨基酸序列。在一些方面，所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:76中列出的核酸序列。在一些方面，所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ IDNO:77中列出的氨基酸序列。

对木糖酸途径具有特异性的MEG和/或丙酮的产生

在一些方面，所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；和(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物包括MEG产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活；其中所述重组微生物包括丙酮产生途径，所述途径具有以下中的一项或多项：(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化，其中所述重组微生物表达MEG和/或丙酮产生途径。

在一些方面，(f)、(g)和(h)在由OXB11启动子控制的操纵子中。在一些方面，所述乙酰乙酰基辅酶A硫解酶是Thl。在一些方面，所述硫解酶来自丙酮丁醇梭菌。在一些方面，所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面，所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基α的核酸分子包含SEQ ID NO:70中列出的核酸序列。在一些方面，所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基α的氨基酸序列包含SEQ ID NO:72中列出的氨基酸序列。在一些方面，所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基β的核酸分子包含SEQ ID NO:71中列出的核酸序列。在一些方面，所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基β的氨基酸序列包含SEQ ID NO:73中列出的氨基酸序列。在一些方面，所述乙酰乙酸脱羧酶是Adc。在一些方面，所述脱羧酶来自丙酮丁醇梭菌或拜氏梭菌。在一些方面，所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:74中列出的核酸序列。在一些方面，所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ ID NO:75中列出的氨基酸序列。在一些方面，所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:76中列出的核酸序列。在一些方面，所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ ID NO:77中列出的氨基酸序列。

异丙醇的产生

在一些方面，重组微生物能够从能够产生丙酮的任何一种或多种原料产生异丙醇。在一些方面，已经被工程化改造为产生丙酮的重组微生物被进一步工程化改造为表达至少一种编码醇脱氢酶的外源性核酸分子，所述醇脱氢酶催化丙酮至异丙醇的转化。在一些方面，前述丙酮产生公开的(f)、(g)和(h)被进一步修改为(i)–至少一种编码醇脱氢酶的外源性核酸分子的表达，所述醇脱氢酶催化丙酮至异丙醇的转化。在一些方面，所述一个或多个编码所述醇脱氢酶的核酸分子包含SEQ ID NO:93中列出的核酸序列。在一些方面，所述一个或多个编码所述醇脱氢酶的氨基酸序列包含SEQ ID NO:94中列出的氨基酸序列。

乙醇酸的产生

在一些方面，一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD(SEQ ID NO:1或SEQ ID NO:2)、araFGH和xylFGH的缺失或失活；并且(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中所述重组微生物还表达一个或多个乙醇酸产生途径。

在一些方面，所述一个或多个编码AraFGH的AraF周质结合蛋白亚基的核酸分子包含SEQ ID NO:20中列出的核酸序列。在一些方面，所述一个或多个编码AraFGH的AraF周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:23中列出的氨基酸序列。在一些方面，所述一个或多个编码AraFGH的AraG ATP结合亚基的核酸分子包含SEQ ID NO:21中列出的核酸序列。在一些方面，所述一个或多个编码AraFGH的AraG ATP结合亚基的氨基酸序列包含SEQID NO:24中列出的氨基酸序列。在一些方面，所述一个或多个编码AraFGH的AraH膜亚基的核酸分子包含SEQ ID NO:22中列出的核酸序列。在一些方面，所述一个或多个编码AraFGH的AraH膜亚基的氨基酸序列包含SEQ ID NO:25中列出的氨基酸序列。

在一些方面，所述一个或多个编码xylFGH的xylF周质结合蛋白亚基的核酸分子包含SEQ ID NO:26中列出的核酸序列。在一些方面，所述一个或多个编码xylFGH的xylF周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:29中列出的氨基酸序列。在一些方面，所述一个或多个编码xylFGH的xylG ATP结合亚基的核酸分子包含SEQ ID NO:27中列出的核酸序列。在一些方面，所述一个或多个编码xylFGH的xylG ATP结合亚基的氨基酸序列包含SEQID NO:30中列出的氨基酸序列。在一些方面，所述一个或多个编码xylFGH的xylH膜亚基的核酸分子包含SEQ ID NO:28中列出的核酸序列。在一些方面，所述一个或多个编码xylFGH的xylH膜亚基的氨基酸序列包含SEQ ID NO:31中列出的氨基酸序列。

在一些方面，所述微生物还包含glcDEF的缺失或失活。在一些方面，所述一个或多个编码所述推定的FAD连接亚基GlcD的核酸分子包含SEQ ID NO:79中列出的核酸序列。在一些方面，所述一个或多个编码所述推定的FAD连接亚基GlcD的氨基酸序列包含SEQ IDNO:82中列出的氨基酸序列。在一些方面，所述一个或多个编码所述推定的FAD结合亚基GlcE的核酸分子包含SEQ ID NO:80中列出的核酸序列。在一些方面，所述一个或多个编码所述推定的FAD结合亚基GlcE的氨基酸序列包含SEQ ID NO:83中列出的氨基酸序列。在一些方面，所述一个或多个编码所述推定的铁-硫亚基GlcF的核酸分子包含SEQ ID NO:81中列出的核酸序列。在一些方面，所述一个或多个编码所述推定的铁-硫亚基GlcF的氨基酸序列包含SEQ ID NO:84中列出的氨基酸序列。在一些方面，所述微生物还包含醛还原酶dkgA的缺失或失活。在一些方面，所述一个或多个编码所述dkgA的核酸分子包含SEQ ID NO:85中列出的核酸序列。在一些方面，所述一个或多个编码所述dkgA的氨基酸序列包含SEQ IDNO:86中列出的氨基酸序列。在一些方面，所述微生物还包含醛还原酶yahK的缺失或失活。在一些方面，所述一个或多个编码所述yahK的核酸分子包含SEQ ID NO:87中列出的核酸序列。在一些方面，所述一个或多个编码所述yahK的氨基酸序列包含SEQ ID NO:88中列出的氨基酸序列。在一些方面，所述木糖同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面，所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面，所述一个或多个编码所述xylE的核酸分子包含SEQ ID NO:48中列出的核酸序列。在一些方面，所述一个或多个编码所述xylE的氨基酸序列包含SEQ ID NO:49中列出的氨基酸序列。在一些方面，所述木糖同向转运蛋白是所述微生物内源性的。在一些方面，所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面，所述一个或多个编码所述araE的核酸分子包含SEQ ID NO:46中列出的核酸序列。在一些方面，所述一个或多个编码所述araE的氨基酸序列包含SEQ ID NO:47中列出的氨基酸序列。在一些方面，所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面，所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面，所述微生物包含功能性磷酸转移酶系统。在一些方面，所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面，所述一个或多个编码所述CRP的核酸分子包含SEQ ID NO:9中列出的核酸序列。在一些方面，所述一个或多个编码所述CRP的氨基酸序列包含SEQ ID NO:10中列出的氨基酸序列。在一些方面，所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面，连续木糖输入独立于其他糖在所述原料中的存在而发生。

乙醇酸的产生，包括木酮糖途径

在一些方面，一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中重组微生物还表达一个或多个乙醇酸产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，所述核酸序列编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。

在一些方面，(c)和(d)在由proD启动子控制的操纵子中。在一些方面，所述一个或多个编码所述proD启动子的核酸分子包含SEQ ID NO:53中列出的核酸序列。在一些方面，所述木糖异构酶是XylA。在一些方面，所述一个或多个编码所述xylA的核酸分子包含SEQID NO:5中列出的核酸序列。在一些方面，所述一个或多个编码所述xylA的氨基酸序列包含SEQ ID NO:6中列出的氨基酸序列。在一些方面，所述木糖异构酶是所述微生物内源性的。在一些方面，所述木糖异构酶是所述微生物异源性的。在一些方面，所述酮己糖激酶是Khk-C。在一些方面，所述一个或多个编码所述khk-C的核酸分子包含SEQ ID NO:11中列出的核酸序列。在一些方面，所述一个或多个编码所述khk-C的氨基酸序列包含SEQ ID NO:12中列出的氨基酸序列。在一些方面，所述酮己糖激酶来自智人。在一些方面，所述果糖二磷酸醛缩酶是aldoB。在一些方面，所述一个或多个编码所述alsoB的核酸分子包含SEQ ID NO:50中列出的核酸序列。在一些方面，所述一个或多个编码所述aldoB的氨基酸序列包含SEQ IDNO:51中列出的氨基酸序列。在一些方面，所述果糖二磷酸醛缩酶来自智人。在一些方面，所述羟乙醛脱氢酶是所述微生物内源性的。在一些方面，所述羟乙醛脱氢酶是所述微生物异源性的。在一些方面，所述羟乙醛脱氢酶是aldA。在一些方面，所述一个或多个编码所述aldA的核酸分子包含SEQ ID NO:3中列出的核酸序列。在一些方面，所述一个或多个编码所述aldA的氨基酸序列包含SEQ ID NO:4中列出的氨基酸序列。在一些方面，所述木酮糖激酶是XylB。在一些方面，所述一个或多个编码所述xylB的核酸分子包含SEQ ID NO:13中列出的核酸序列。在一些方面，所述一个或多个编码所述xylB的氨基酸序列包含SEQ ID NO:14中列出的氨基酸序列。

乙醇酸的产生，包括木糖酸途径

在一些方面，一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中重组微生物还表达一个或多个乙醇酸产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

在一些方面，(c)和(d)由proD启动子控制。在一些方面，所述木糖异构酶是XylA。在一些方面，所述木酮糖激酶是XylB。在一些方面，所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面，所述木糖脱氢酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面，所述木糖酸内酯酶是所述微生物异源性的。在一些方面，所述木糖酸内酯酶是所述微生物内源性的。在一些方面，所述羟乙醛脱氢酶是aldA。在一些方面，所述羟乙醛脱氢酶是所述微生物内源性的。

乙醇酸的产生(替代途径)，包括木酮糖途径-

在一些方面，一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；其中重组微生物还表达一个或多个乙醇酸产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活；并且其中所述微生物还表达乙醇酸产生途径，所述途径具有以下中的一项或多项：(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达；和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。在一些方面，(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面，所述一个或多个编码所述OXB20启动子的核酸分子包含SEQ ID NO:96中列出的核酸序列。在一些方面，所述异柠檬酸裂解酶是AceA。在一些方面，所述乙醛酸还原酶是YcdW。在一些方面，所述一个或多个编码所述ycdW的核酸分子包含SEQ ID NO:91中列出的核酸序列。在一些方面，所述一个或多个编码所述ycdW的氨基酸序列包含SEQ ID NO:92中列出的氨基酸序列。

乙醇酸的产生(替代途径)，包括木糖酸途径

在一些方面，一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活；以及(b)至少一个内源性或外源性核酸分子的表达，其可操作地连接至一个或多个组成型启动子并且编码C5糖同向转运蛋白；其中重组微生物还表达一个或多个乙醇酸产生途径，所述途径具有以下中的一项或多项：(c)一个或多个内源性或外源性核酸序列的表达，其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子；(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活；并且其中所述微生物还表达乙醇酸产生途径，所述途径具有以下中的一项或多项：(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达；和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。

在一些方面，(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面，所述异柠檬酸裂解酶是AceA。在一些方面，所述乙醛酸还原酶是YcdW。

包含本文所述的序列和修饰的重组微生物

在一些方面，本公开广泛涉及前述方面中任一项的所述重组微生物，其中所述重组微生物来源于选自由以下项组成的组的亲本微生物：梭菌属、永达尔梭菌、产乙醇梭菌、拉氏梭菌、粘液真杆菌、嗜甲基丁酸杆菌、热醋穆尔氏菌、醋酸梭菌、伍氏醋酸杆菌、巴氏嗜喊菌、德雷克氏梭菌、食一氧化碳梭菌、甲酸乙酸梭菌、粪味梭菌、热自养穆尔氏菌、长醋丝菌、延长布劳特氏菌、乙二醇梭菌、大梭菌、马永贝梭菌、食甲氧基苯甲酸梭菌、丙酮丁醇梭菌、拜氏梭菌、普氏产醋杆菌、凯伍嗜热厌氧菌、卵形鼠孢菌、棕色嗜热产醋菌、甲醇醋酸杆菌、白蚁鼠孢菌、甘油穆尔氏菌、聚集性真杆菌、固氮密螺旋体、大肠杆菌、酿酒酵母、恶臭假单胞菌、芽孢杆菌属、棒状杆菌属、解脂耶氏酵母、树干毕赤酵母和甘油利用泰瑞孢子菌。在一些方面，所述亲本微生物是大肠杆菌。

在一些方面，本公开的酶、蛋白质、启动子和核酸概述于表1中。

表1：本公开的蛋白质和核酸

检测遗传修饰的方法

本公开教导了可用于检测本文教导的微生物的引物、探针和测定法。在一些方面，本公开提供了检测WT亲本菌株的方法。在其他方面，本公开提供了检测来源于亲本菌株或WT菌株的经工程化的或经修饰的微生物的方法。在一些方面，本公开提供了鉴定微生物中的遗传改变的方法。

在一些方面，本公开的基因组工程方法导致在经修饰的微生物中产生非天然核苷酸“连接”序列。这些非天然存在的核苷酸连接可以用作一种诊断类型，该诊断指示特定遗传改变存在于本文教导的微生物中。

本公开的技术能够通过使用专门的定量PCR方法(包括独特设计的引物和探针)来检测这些非天然存在的核苷酸连接。在一些方面，本公开的探针结合至非天然存在的核苷酸连接序列。在一些方面，采用传统的PCR。在其他方面，采用实时PCR。在一些方面，采用定量PCR(qPCR)。在一些方面，PCR方法用于鉴定已经插入微生物的基因组DNA或基因组外DNA中的异源序列。

因此，本公开可以涵盖采用两种常用方法来实时检测PCR产物：(1)插入任何双链DNA的非特异性荧光染料，以及(2)由寡核苷酸组成的序列特异性DNA探针，所述寡核苷酸用荧光报告基因标记，只有在探针与其互补序列杂交后才能检测到荧光报告基因。在一些方面，只有非天然存在的核苷酸连接才通过教导的引物扩增，因此可以通过非特异性染料或通过采用特异性杂交探针来进行检测。在其他方面，选择本公开的引物以使得引物侧接于连接序列的任一侧，从而如果发生扩增反应，则存在所述连接序列。

本公开的方面涉及非天然存在的核苷酸连接序列分子本身，以及能够在温和至严格的杂交条件下结合至所述非天然存在的核苷酸连接序列的其他核苷酸分子。在一些方面，能够在温和至严格杂交条件下结合至所述非天然存在的核苷酸连接序列的核苷酸分子被称为“核苷酸探针”。

在一些方面，基因组DNA可以从样品中提取并且用于通过使用qPCR来定量本公开的微生物的存在。qPCR反应中采用的引物可以是由Primer Blast(https://www.ncbi.nlm.nih.gov/tools/primer-blast/)设计的引物，用于扩增野生型基因组的独特区域或经工程化的非属间突变菌株的独特区域。qPCR反应可以使用SYBR GreenER qPCRSuperMix Universal(Thermo Fisher P/N 11762100)试剂盒，仅使用正向和反向扩增引物来进行；或者，Kapa Probe Force试剂盒(Kapa Biosystems P/N KK4301)可以与扩增引物和TaqMan探针一起使用，该探针含有5'末端的FAM染料标记、内部ZEN淬灭剂以及小沟结合物和3'末端的荧光淬灭剂(Integrated DNA Technologies)。

定量聚合酶链式反应(qPCR)是一种实时定量一个或多个核酸序列的扩增的方法。PCR测定法的实时定量允许通过比较所关注的扩增核酸和适当的对照核酸序列(它可以作为校准标准)来确定由PCR扩增步骤产生的核酸的数量。

TaqMan探针通常用于qPCR测定法，这些qPCR测定法需要更高的特异性来定量靶核酸序列。TaqMan探针包括荧光团连接至5'末端并且淬灭剂连接至探针的3'末端的寡核苷酸探针。当TaqMan探针保持探针的5’和3’末端彼此紧密接触时，淬灭剂防止来自荧光团的荧光信号传播。TaqMan探针被设计为在由一组特定引物扩增的核酸区域内退火。当Taq聚合酶延伸引物并且合成新生链时，Taq聚合酶的5'至3'核酸外切酶活性降解退火至模板的探针。该探针降解释放荧光团，从而破坏与淬灭剂的紧密接近并且允许荧光团发出荧光。qPCR测定法中检测到的荧光与释放的荧光团和反应中存在的DNA模板量成正比。

qPCR的特征允许从业者消除凝胶电泳制备的劳动密集型扩增后步骤，这通常是观察传统PCR测定法的扩增产物所必需的。qPCR相对于常规PCR的优势是相当大的，包括提高速度、易用性、重现性和定量能力。

微生物组合物

在一些方面，将本公开的微生物组合成微生物组合物。

在一些方面，本公开的微生物组合物是固体。当使用固体组合物时，可能需要包括一种或多种载剂材料，包括但不限于：矿物土，诸如二氧化硅、滑石粉、高岭土、石灰石、白垩、粘土、白云石、硅藻土；硫酸钙；硫酸镁；氧化镁；沸石，碳酸钙；碳酸镁；海藻糖；壳聚糖；虫胶；白蛋白；淀粉；脱脂奶粉；甜乳清粉；麦芽糊精；乳糖；菊粉；右旋糖；和植物来源的产物，诸如谷物粉、树皮粉、木粉和果壳粉。

在一些方面，本公开的微生物组合物是液体。在其他方面，液体包含溶剂，所述溶剂可包括水或醇或盐水或碳水化合物溶液。在一些方面，本公开的微生物组合物包括粘合剂，诸如聚合物、羧甲基纤维素、淀粉、聚乙烯醇等。

在一些方面，本公开的微生物组合物包含糖(例如，单糖、二糖、三糖、多糖、寡糖等)、聚合糖、脂质、聚合脂质、脂多糖、蛋白质、聚合蛋白、脂蛋白、核酸、核酸聚合物、二氧化硅、无机盐及其组合。在另一方面，微生物组合物包含琼脂、琼脂糖、脱乙酰吉兰糖胶(gelrite)、吉兰糖胶(gellan gum)等的聚合物。在一些方面，微生物组合物包含塑料胶囊、乳液(例如水和油)、膜和人工膜。在一些方面，乳液或连接的聚合物溶液可以包含本公开的微生物组合物。参见Harel和Bennett(美国专利8,460,726B2)。

在一些方面，本公开的微生物组合物以固体形式(例如，分散的冻干孢子)或液体形式(散布在储存培养基中的微生物)存在。在一些方面，在使用前将干燥形式的本公开的微生物组合物添加到液体中，以形成悬浮液。在一些方面，微生物组合物包含陶瓷化的微生物。

在一些方面，本公开的微生物组合物具有的水活性(aw)小于0.750、0.700、0.650、0.600、0.550、0.500、0.475、0.450、0.425、0.400、0.375、0.350、0.325、0.300、0.275、0.250、0.225、0.200、0.190、0.180、0.170、0.160、0.150、0.140、0.130、0.120、0.110、0.100、0.095、0.090、0.085、0.080、0.075、0.070、0.065、0.060、0.055、0.050、0.045、0.040、0.035、0.030、0.025、0.020、0.015、0.010、或0.005。

在一些方面，本公开的微生物组合物具有的水活性(aw)小于约0.750、约0.700、约0.650、约0.600、约0.550、约0.500、约0.475、约0.450、约0.425、约0.400、约0.375、约0.350、约0.325、约0.300、约0.275、约0.250、约0.225、约0.200、约0.190、约0.180、约0.170、约0.160、约0.150、约0.140、约0.130、约0.120、约0.110、约0.100、约0.095、约0.090、约0.085、约0.080、约0.075、约0.070、约0.065、约0.060、约0.055、约0.050、约0.045、约0.040、约0.035、约0.030、约0.025、约0.020、约0.015、约0.010、或约0.005。

水活性值通过饱和水溶液的方法来测定(Multon,“Techniques d’Analyse E DeControle Dans Les Industries Agroalimentaires”APRIA(1981))或通过使用强大的Robotronic BT湿度计或其他湿度计或验湿计来进行直接测量。

原料

在一些方面，本公开涉及一种产生和回收/分离一种或多种所期望的化学物质的方法。回收/收集/分离可以通过本领域已知的方法，诸如蒸馏、基于膜的分离气提、溶剂萃取和扩张床吸附。

在一些方面，原料包括碳源。在一些方面，所述碳源可以选自糖、甘油、醇、有机酸、烷烃、脂肪酸、木质纤维素、蛋白质、二氧化碳和一氧化碳。在一个方面，所述碳源是糖。在一个方面，所述糖是葡萄糖或其葡萄糖寡聚物。在一个方面，葡萄糖的寡聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。在一个方面，所述糖是五碳糖。在一个方面，所述糖是六碳糖。在一些方面，原料包含一种或多种五碳糖和/或一种或多种六碳糖。在一些方面，原料包含木糖、葡萄糖、阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。在一些方面，原料包含木糖和/或葡萄糖中的一种或多种。在一些方面，原料包含阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。在一些方面，原料包含木糖和葡萄糖。

在一些方面，微生物利用一种或多种五碳糖(戊糖)和/或一种或多种六碳糖(己糖)。在一些方面，微生物利用木糖和/或葡萄糖中的一种或多种。在一些方面，微生物利用阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。在一些方面，微生物利用木糖、葡萄糖、阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。

在一些方面，己糖可选自D-阿洛糖、D-阿卓糖、D-葡萄糖、D-甘露糖、D-古洛糖、D-艾杜糖、D-半乳糖、D-塔罗糖、D-塔格糖、D-山梨糖、D-果糖、D-阿洛酮糖和本领域已知的其他己糖。在一些方面，戊糖可选自D-木糖、D-核糖、D-阿拉伯糖、D-来苏糖、D-木酮糖、D-核酮糖和本领域已知的其他戊糖。在一些方面，己糖和戊糖可选自本文公开的任何己糖和戊糖的左旋对映体或右旋对映体。

在一些方面，在生长期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量为至少5kg碳水化合物/m3、至少10kg碳水化合物/m3、至少20kg碳水化合物/m3、至少30kg碳水化合物/m3、至少40kg碳水化合物/m3、至少50kg碳水化合物/m3、至少60kg碳水化合物/m3、至少70kg碳水化合物/m3、至少80kg碳水化合物/m3、至少90kg碳水化合物/m3、至少100kg碳水化合物/m3、至少150kg碳水化合物/m3、至少200kg碳水化合物/m3、至少250kg碳水化合物/m3、至少300kg碳水化合物/m3、至少400kg碳水化合物/m3、至少500kg碳水化合物/m3、至少600kg碳水化合物/m3、至少700kg碳水化合物/m3、至多800kg碳水化合物/m3。在一些方面，在生长期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量在约10kg碳水化合物/m3至至多500kg碳水化合物/m3的范围内。

在一些方面，生长期所需的时间在1至200小时之间变化。在其他方面，生长期的时间在5至50小时之间。时间取决于碳水化合物进料和/或原料。

在一些方面，在产生期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量为至少50kg碳水化合物/m3、至少60kg碳水化合物/m3、至少70kg碳水化合物/m3、至少80kg碳水化合物/m3、至少90kg碳水化合物/m3、至少100kg碳水化合物/m3、至少150kg碳水化合物/m3、至少200kg碳水化合物/m3、至少250kg碳水化合物/m3、至少300kg碳水化合物/m3、至少400kg碳水化合物/m3、至少500kg碳水化合物/m3、至少600kg碳水化合物/m3、至少700kg碳水化合物/m3、至少800kg碳水化合物/m3、至少900kg碳水化合物/m3、至多1000kg碳水化合物/m3。在一些方面，在产生期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量在约100kg碳水化合物/m3至至多800kg碳水化合物/m3的范围内。

在一些方面，产生期所需的时间在5至500小时之间变化。在其他方面，对于分批和补料分批操作，产生期的时间在10至300小时之间变化。在其他方面，产生期的时间长达300小时，连续发酵。

在一些方面，对于单期过程，送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量为至少50kg碳水化合物/m3、至少60kg碳水化合物/m3、至少70kg碳水化合物/m3、至少80kg碳水化合物/m3、至少90kg碳水化合物/m3、至少100kg碳水化合物/m3、至少150kg碳水化合物/m3、至少200kg碳水化合物/m3、至少250kg碳水化合物/m3、至少300kg碳水化合物/m3、至少400kg碳水化合物/m3、至少500kg碳水化合物/m3、至少600kg碳水化合物/m3、至少700kg碳水化合物/m3、至少800kg碳水化合物/m3、至少900kg碳水化合物/m3、至多1000kg碳水化合物/m3。在一些方面，在产生期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量在约100kg碳水化合物/m3至至多800kg碳水化合物/m3的范围内。

在一些方面，在单期过程中，产生期所需的时间在5至500小时之间变化。在其他方面，在单期过程中，产生期所需的时间在5至300小时之间变化。

在一些方面，单期或多期产生过程需要约5、约10、约25、约50、约75、约100、约125、约150、约175、约200、约225、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、或约500小时。

在一些方面，单期或多期产生过程需要5、10、25、50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475或500小时。

性状的改善

可以采用本公开的方法来引入或改善多个所期望的性状中的一个或多个。可以引入或改善的性状的实例包括：MEG、乙醇酸、多元醇、丙酮、丙烯、异丙醇的速率和/或速度的增加；木糖和葡萄糖的同时消耗增加；以及一种或多种糖类对糖的消耗和/或摄取的抑制作用降低。

在一些方面，本文所述的方法产生的微生物表现出的性状差异比对照条件下的参考值大至少约1％，例如大至少约1％、至少约2％、至少约3％、至少约4％、至少约5％、至少约6％、至少约7％、至少约9％、至少约9％、至少约10％、至少约11％、至少约12％、至少约13％、至少约14％、至少约15％、至少约20％、至少约25％、至少约30％、至少约40％、至少约50％、至少约60％、至少约70％、至少约75％、至少约80％、至少约90％、或至少100％、至少约200％、至少约300％、至少约400％或更大。在另外的实例中，本文所述的方法产生的微生物表现出的性状差异比在类似条件下生长的参考对照大至少约5％，例如大至少约5％、至少约8％、至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约40％、至少约50％、至少约60％、至少约75％、至少约80％、至少约80％、至少约90％、或至少100％、至少约200％、至少约300％、至少约400％或更大。

在一些方面，相对于未经修饰的微生物，本公开的任何一个或多个性状的增加或减少是增加约0.1％、约0.2％、约0.3％、约0.4％、约0.5％、约0.6％、约0.7％、约0.8％、约0.9％、约1％、约2％、约3％、约4％、约5％、约6％、约7％、约8％、约9％、约10％、约11％、约12％、约13％、约14％、约15％、约16％、约17％、约18％、约19％、约20％、约21％、约22％、约23％、约24％、约25％、约26％、约27％、约28％、约29％、约30％、约31％、约32％、约33％、约34％、约35％、约36％、约37％、约38％、约39％、约40％、约41％、约42％、约43％、约44％、约45％、约46％、约47％、约48％、约49％、约50％、约51％、约52％、约53％、约54％、约55％、约56％、约57％、约58％、约59％、约60％、约61％、约62％、约63％、约64％、约65％、约66％、约67％、约68％、约69％、约70％、约71％、约72％、约73％、约74％、约75％、约76％、约77％、约78％、约79％、约80％、约81％、约82％、约83％、约84％、约85％、约86％、约87％、约88％、约89％、约90％、约91％、约92％、约93％、约94％、约95％、约96％、约97％、约98％、约99％、或约100％。

在一些方面，相对于未经修饰的微生物，本公开的任何一个或多个性状的增加或减少是增加至少0.1％、至少0.2％、至少0.3％、至少0.4％、至少0.5％、至少0.6％、至少0.7％、至少0.8％、至少0.9％、至少1％、至少2％、至少3％、至少4％、至少5％、至少6％、至少7％、至少8％、至少9％、至少10％、至少11％、至少12％、至少13％、至少14％、至少15％、至少16％、至少17％、至少18％、至少19％、至少20％、至少21％、至少22％、至少23％、至少24％、至少25％、至少26％、至少27％、至少28％、至少29％、至少30％、至少31％、至少32％、至少33％、至少34％、至少35％、至少36％、至少37％、至少38％、至少39％、至少40％、至少41％、至少42％、至少43％、至少44％、至少45％、至少46％、至少47％、至少48％、至少49％、至少50％、至少51％、至少52％、至少53％、至少54％、至少55％、至少56％、至少57％、至少58％、至少59％、至少60％、至少61％、至少62％、至少63％、至少64％、至少65％、至少66％、至少67％、至少68％、至少69％、至少70％、至少71％、至少72％、至少73％、至少74％、至少75％、至少76％、至少77％、至少78％、至少79％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或至少100％。

实施例

实施例1：在能够同时消耗木糖和葡萄糖的菌株中通过D-木糖酸途径共同产生单乙二醇(MEG)和丙酮–图1的途径A。

将大肠杆菌K12菌株MG1655用作缺失以下三个基因的宿主：aldA、xylA和glcDEF，所述基因可以使碳通量从MEG+丙酮途径偏离。基因成功缺失，并且通过PCR和测序确认该缺失。下一步是MEG途径的整合。在proD启动子控制下表达的操纵子含有xdh基因(木糖脱氢酶)和fucO基因(羟乙醛还原酶)，分别编码木糖酸途径的第一个和最后一个酶，将该操纵子整合到大肠杆菌基因组中，并且将xdh基因的一个另外的拷贝也放置于proD启动子的控制下，并且整合到不同的基因座中。xdh基因的整合允许木糖转化为中间体D-木糖酸和羟乙醛。fucO基因的整合将羟乙醛还原为MEG，并且对MEG产生具有特异性。第二步是丙酮途径的整合。在OXB11启动子控制下表达的操纵子含有thlA基因(乙酰乙酰基辅酶A硫解酶)；AtoDA基因(乙酸:乙酰乙酰基辅酶A转移酶)和adc基因(乙酰乙酸脱羧酶)，将该操纵子整合到大肠杆菌基因组中，产生基础菌株。该基础菌株被用作进行修饰的宿主，以促进葡萄糖和木糖的共同消耗。第一修饰是在araFGH基因座上GAPDH启动子控制下的另一个xylE拷贝的整合，从而缺失araFGH。第二修饰是xylFGH操纵子的缺失。所有整合和缺失均通过PCR和测序确认。

将来自转化的菌落接种于5mL含有12.85g/L木糖和2.15g/L葡萄糖(6:1比例)或7.5g/L木糖和7.5g/L葡萄糖(1:1比例)的矿物培养基中进行预培养。在16小时培养后，将5％的预培养物转移至100mL新鲜培养基中。将烧瓶在37℃、250rpm下温育。培养物的初始OD为0.1。

对于1:1比例培养物，在8小时培养后，葡萄糖和木糖的同时利用可以在共同消耗菌株中检测到，而在亲本菌株中，木糖仅在18小时后葡萄糖耗尽后才开始消耗(图2)。在36小时培养中，共同消耗菌株能够消耗75％的初始糖混合物，而亲本菌株仅消耗62％。

对于6:1比例培养物，亲本和共同消耗菌株都能够完全消耗初始葡萄糖和木糖，木糖消耗和生物质产生特征曲线相似(图3)。在共同消耗菌株中，MEG的总量增加12％，而丙酮的量增加197％(图4)。木糖摄取的修饰提供了与其亲本菌株相关的共同产生速度的改善。

实施例2：在能够同时消耗木糖和葡萄糖的菌株中通过D-木酮糖途径共同产生单乙二醇(MEG)和丙酮–图1的途径B。

将大肠杆菌K12菌株MG1655用作缺失以下三个基因的宿主：aldA、xylB和glcDEF，所述基因可以使碳通量从MEG+丙酮途径偏离。基因成功缺失，并且通过PCR和测序确认该缺失。下一步是MEG途径的整合。在proD启动子控制下表达的操纵子含有khk-C基因(酮己糖激酶)、aldoB基因(果糖-1,6-二磷酸醛缩酶)和fucO基因(羟乙醛还原酶)，将该操纵子整合到大肠杆菌基因组中，并且将也在proD启动子控制下的khk-C和aldoB基因的一个另外的拷贝整合到不同的基因座中。khk-C和aldoB基因的整合允许木糖转化为中间体羟乙醛。fucO基因的整合将羟乙醛还原为MEG，并且对MEG产生具有特异性。第二步是丙酮途径的整合。在OXB11启动子控制下表达的操纵子含有thlA基因(乙酰乙酰基辅酶A硫解酶)；AtoDA基因(乙酸:乙酰乙酰基辅酶A转移酶)和adc基因(乙酰乙酸脱羧酶)，将该操纵子整合到大肠杆菌基因组中，产生基础菌株。该基础菌株被用作进行修饰的宿主，以促进葡萄糖和木糖的共同消耗。第一修饰是在araFGH基因座上GAPDH启动子控制下的另一个xylE拷贝的整合，从而缺失araFGH。第二修饰是xylFGH操纵子的缺失以及用OXB15启动子替代xylA启动子。在组成型启动子下表达xylA允许木糖转化为中间体D-木糖酸和羟乙醛。所有整合和缺失均通过PCR和测序确认。

对于1:1比例培养物，在12小时培养后，葡萄糖和木糖的同时利用可以在共同消耗菌株中检测到，而在亲本菌株中，木糖仅在18小时后葡萄糖耗尽后才开始减少(图5)。在36小时培养中，共同消耗菌株能够消耗61％的初始糖混合物，而亲本菌株消耗52％。

对于6:1比例培养物，亲本和共同消耗菌株都能够完全消耗初始葡萄糖和木糖，木糖消耗和生物质产生特征曲线相似(图6)。在共同消耗菌株中，MEG的总量增加9％，而丙酮的总量增加119％(图7)。木糖摄取的修饰提供了与其亲本菌株相关的共同产生速度的改善。

以引用方式并入本文

本文引用的所有参考文献、文章、出版物、专利、专利公开和专利申请均以引用的方式整体并入用于所有目的。然而，提及本文引用的任何参考文献、文章、出版物、专利、专利公开和专利申请不是也不应被视为承认或任何形式的暗示它们构成有效的现有技术或形成世界上任何国家或地区的共同常识的一部分。此外，以下参考文献据此以引用的方式并入：

Yang et al.(2018).One step fermentative production of aromaticpolyesters from glucose by metabolically engineered Escherichia colistrains.Nature Communications.9(1):79.

Fritzsche et al.(1990).An unusual bacterial polyester with a phenylpendant group.Die Makromolekulare Chemie:Macromolecular Chemistry andPhysics.191(8):1957-1965.

Garcia et al.(1999).Novel biodegradable aromatic plastics from abacterial source genetic and biochemical studies on a route of thephenylacetyl-CoA catabolon.Journal of Biological Chemistry.274(41):29228-29241.

Olivera et al.(2001).Genetically engineered Pseudomonas:a factory ofnew bioplastics with broad applications.Environmental Microbiology.3(10):612-618.

序列表

<110> 布拉斯科公司

<120> 用于同时消耗木糖和

葡萄糖以从第二代糖产生化学物质的代谢工程

<130> BRSK-021/01WO (331051-2072)

<150> 62/829,398

<151> 2019-04-04

<160> 98

<170> PatentIn 版本3.5

<210> 1

<211> 1164

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 1

atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60

ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120

gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180

gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240

gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300

accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360

caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420

gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480

caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540

tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600

gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660

ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720

cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780

ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840

cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900

cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960

gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020

acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080

gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140

cgtatatacg aagccgcccg ctaa 1164

<210> 2

<211> 387

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 2

Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys

1 5 10 15

Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val

20 25 30

Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp

35 40 45

Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly

50 55 60

Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu

65 70 75 80

Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser

85 90 95

Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu

100 105 110

Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys

115 120 125

Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser

130 135 140

Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys

145 150 155 160

Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp

165 170 175

Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val

180 185 190

Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val

195 200 205

Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu

210 215 220

Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val

225 230 235 240

Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile

245 250 255

Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu

260 265 270

Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val

275 280 285

Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu

290 295 300

Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp

305 310 315 320

Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln

325 330 335

Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser

340 345 350

Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu

355 360 365

Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu

370 375 380

Ala Ala Arg

385

<210> 3

<211> 1440

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 3

atgtcagtac ccgttcaaca tcctatgtat atcgatggac agtttgttac ctggcgtgga 60

gacgcatgga ttgatgtggt aaaccctgct acagaggctg tcatttcccg catacccgat 120

ggtcaggccg aggatgcccg taaggcaatc gatgcagcag aacgtgcaca accagaatgg 180

gaagcgttgc ctgctattga acgcgccagt tggttgcgca aaatctccgc cgggatccgc 240

gaacgcgcca gtgaaatcag tgcgctgatt gttgaagaag ggggcaagat ccagcagctg 300

gctgaagtcg aagtggcttt tactgccgac tatatcgatt acatggcgga gtgggcacgg 360

cgttacgagg gcgagattat tcaaagcgat cgtccaggag aaaatattct tttgtttaaa 420

cgtgcgcttg gtgtgactac cggcattctg ccgtggaact tcccgttctt cctcattgcc 480

cgcaaaatgg ctcccgctct tttgaccggt aataccatcg tcattaaacc tagtgaattt 540

acgccaaaca atgcgattgc attcgccaaa atcgtcgatg aaataggcct tccgcgcggc 600

gtgtttaacc ttgtactggg gcgtggtgaa accgttgggc aagaactggc gggtaaccca 660

aaggtcgcaa tggtcagtat gacaggcagc gtctctgcag gtgagaagat catggcgact 720

gcggcgaaaa acatcaccaa agtgtgtctg gaattggggg gtaaagcacc agctatcgta 780

atggacgatg ccgatcttga actggcagtc aaagccatcg ttgattcacg cgtcattaat 840

agtgggcaag tgtgtaactg tgcagaacgt gtttatgtac agaaaggcat ttatgatcag 900

ttcgtcaatc ggctgggtga agcgatgcag gcggttcaat ttggtaaccc cgctgaacgc 960

aacgacattg cgatggggcc gttgattaac gccgcggcgc tggaaagggt cgagcaaaaa 1020

gtggcgcgcg cagtagaaga aggggcgaga gtggcgttcg gtggcaaagc ggtagagggg 1080

aaaggatatt attatccgcc gacattgctg ctggatgttc gccaggaaat gtcgattatg 1140

catgaggaaa cctttggccc ggtgctgcca gttgtcgcat ttgacacgct ggaagatgct 1200

atctcaatgg ctaatgacag tgattacggc ctgacctcat caatctatac ccaaaatctg 1260

aacgtcgcga tgaaagccat taaagggctg aagtttggtg aaacttacat caaccgtgaa 1320

aacttcgaag ctatgcaagg cttccacgcc ggatggcgta aatccggtat tggcggcgca 1380

gatggtaaac atggcttgca tgaatatctg cagacccagg tggtttattt acagtcttaa 1440

<210> 4

<211> 479

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 4

Met Ser Val Pro Val Gln His Pro Met Tyr Ile Asp Gly Gln Phe Val

1 5 10 15

Thr Trp Arg Gly Asp Ala Trp Ile Asp Val Val Asn Pro Ala Thr Glu

20 25 30

Ala Val Ile Ser Arg Ile Pro Asp Gly Gln Ala Glu Asp Ala Arg Lys

35 40 45

Ala Ile Asp Ala Ala Glu Arg Ala Gln Pro Glu Trp Glu Ala Leu Pro

50 55 60

Ala Ile Glu Arg Ala Ser Trp Leu Arg Lys Ile Ser Ala Gly Ile Arg

65 70 75 80

Glu Arg Ala Ser Glu Ile Ser Ala Leu Ile Val Glu Glu Gly Gly Lys

85 90 95

Ile Gln Gln Leu Ala Glu Val Glu Val Ala Phe Thr Ala Asp Tyr Ile

100 105 110

Asp Tyr Met Ala Glu Trp Ala Arg Arg Tyr Glu Gly Glu Ile Ile Gln

115 120 125

Ser Asp Arg Pro Gly Glu Asn Ile Leu Leu Phe Lys Arg Ala Leu Gly

130 135 140

Val Thr Thr Gly Ile Leu Pro Trp Asn Phe Pro Phe Phe Leu Ile Ala

145 150 155 160

Arg Lys Met Ala Pro Ala Leu Leu Thr Gly Asn Thr Ile Val Ile Lys

165 170 175

Pro Ser Glu Phe Thr Pro Asn Asn Ala Ile Ala Phe Ala Lys Ile Val

180 185 190

Asp Glu Ile Gly Leu Pro Arg Gly Val Phe Asn Leu Val Leu Gly Arg

195 200 205

Gly Glu Thr Val Gly Gln Glu Leu Ala Gly Asn Pro Lys Val Ala Met

210 215 220

Val Ser Met Thr Gly Ser Val Ser Ala Gly Glu Lys Ile Met Ala Thr

225 230 235 240

Ala Ala Lys Asn Ile Thr Lys Val Cys Leu Glu Leu Gly Gly Lys Ala

245 250 255

Pro Ala Ile Val Met Asp Asp Ala Asp Leu Glu Leu Ala Val Lys Ala

260 265 270

Ile Val Asp Ser Arg Val Ile Asn Ser Gly Gln Val Cys Asn Cys Ala

275 280 285

Glu Arg Val Tyr Val Gln Lys Gly Ile Tyr Asp Gln Phe Val Asn Arg

290 295 300

Leu Gly Glu Ala Met Gln Ala Val Gln Phe Gly Asn Pro Ala Glu Arg

305 310 315 320

Asn Asp Ile Ala Met Gly Pro Leu Ile Asn Ala Ala Ala Leu Glu Arg

325 330 335

Val Glu Gln Lys Val Ala Arg Ala Val Glu Glu Gly Ala Arg Val Ala

340 345 350

Phe Gly Gly Lys Ala Val Glu Gly Lys Gly Tyr Tyr Tyr Pro Pro Thr

355 360 365

Leu Leu Leu Asp Val Arg Gln Glu Met Ser Ile Met His Glu Glu Thr

370 375 380

Phe Gly Pro Val Leu Pro Val Val Ala Phe Asp Thr Leu Glu Asp Ala

385 390 395 400

Ile Ser Met Ala Asn Asp Ser Asp Tyr Gly Leu Thr Ser Ser Ile Tyr

405 410 415

Thr Gln Asn Leu Asn Val Ala Met Lys Ala Ile Lys Gly Leu Lys Phe

420 425 430

Gly Glu Thr Tyr Ile Asn Arg Glu Asn Phe Glu Ala Met Gln Gly Phe

435 440 445

His Ala Gly Trp Arg Lys Ser Gly Ile Gly Gly Ala Asp Gly Lys His

450 455 460

Gly Leu His Glu Tyr Leu Gln Thr Gln Val Val Tyr Leu Gln Ser

465 470 475

<210> 5

<211> 1323

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 5

atgcaagcct attttgacca gctcgatcgc gttcgttatg aaggctcaaa atcctcaaac 60

ccgttagcat tccgtcacta caatcccgac gaactggtgt tgggtaagcg tatggaagag 120

cacttgcgtt ttgccgcctg ctactggcac accttctgct ggaacggggc ggatatgttt 180

ggtgtggggg cgtttaatcg tccgtggcag cagcctggtg aggcactggc gttggcgaag 240

cgtaaagcag atgtcgcatt tgagtttttc cacaagttac atgtgccatt ttattgcttc 300

cacgatgtgg atgtttcccc tgagggcgcg tcgttaaaag agtacatcaa taattttgcg 360

caaatggttg atgtcctggc aggcaagcaa gaagagagcg gcgtgaagct gctgtgggga 420

acggccaact gctttacaaa ccctcgctac ggcgcgggtg cggcgacgaa cccagatcct 480

gaagtcttca gctgggcggc aacgcaagtt gttacagcga tggaagcaac ccataaattg 540

ggcggtgaaa actatgtcct gtggggcggt cgtgaaggtt acgaaacgct gttaaatacc 600

gacttgcgtc aggagcgtga acaactgggc cgctttatgc agatggtggt tgagcataaa 660

cataaaatcg gtttccaggg cacgttgctt atcgaaccga aaccgcaaga accgaccaaa 720

catcaatatg attacgatgc cgcgacggtc tatggcttcc tgaaacagtt tggtctggaa 780

aaagagatta aactgaacat tgaagctaac cacgcgacgc tggcaggtca ctctttccat 840

catgaaatag ccaccgccat tgcgcttggc ctgttcggtt ctgtcgacgc caaccgtggc 900

gatgcgcaac tgggctggga caccgaccag ttcccgaaca gtgtggaaga gaatgcgctg 960

gtgatgtatg aaattctcaa agcaggcggt ttcaccaccg gtggtctgaa cttcgatgcc 1020

aaagtacgtc gtcaaagtac tgataaatat gatctgtttt acggtcatat cggcgcgatg 1080

gatacgatgg cactggcgct gaaaattgca gcgcgcatga ttgaagatgg cgagctggat 1140

aaacgcatcg cgcagcgtta ttccggctgg aatagcgaat tgggccagca aatcctgaaa 1200

ggccaaatgt cactggcaga tttagccaaa tatgctcagg aacatcattt gtctccggtg 1260

catcagagtg gtcgccagga acaactggaa aatctggtaa accattatct gttcgacaaa 1320

taa 1323

<210> 6

<211> 440

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 6

Met Gln Ala Tyr Phe Asp Gln Leu Asp Arg Val Arg Tyr Glu Gly Ser

1 5 10 15

Lys Ser Ser Asn Pro Leu Ala Phe Arg His Tyr Asn Pro Asp Glu Leu

20 25 30

Val Leu Gly Lys Arg Met Glu Glu His Leu Arg Phe Ala Ala Cys Tyr

35 40 45

Trp His Thr Phe Cys Trp Asn Gly Ala Asp Met Phe Gly Val Gly Ala

50 55 60

Phe Asn Arg Pro Trp Gln Gln Pro Gly Glu Ala Leu Ala Leu Ala Lys

65 70 75 80

Arg Lys Ala Asp Val Ala Phe Glu Phe Phe His Lys Leu His Val Pro

85 90 95

Phe Tyr Cys Phe His Asp Val Asp Val Ser Pro Glu Gly Ala Ser Leu

100 105 110

Lys Glu Tyr Ile Asn Asn Phe Ala Gln Met Val Asp Val Leu Ala Gly

115 120 125

Lys Gln Glu Glu Ser Gly Val Lys Leu Leu Trp Gly Thr Ala Asn Cys

130 135 140

Phe Thr Asn Pro Arg Tyr Gly Ala Gly Ala Ala Thr Asn Pro Asp Pro

145 150 155 160

Glu Val Phe Ser Trp Ala Ala Thr Gln Val Val Thr Ala Met Glu Ala

165 170 175

Thr His Lys Leu Gly Gly Glu Asn Tyr Val Leu Trp Gly Gly Arg Glu

180 185 190

Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Arg Gln Glu Arg Glu Gln

195 200 205

Leu Gly Arg Phe Met Gln Met Val Val Glu His Lys His Lys Ile Gly

210 215 220

Phe Gln Gly Thr Leu Leu Ile Glu Pro Lys Pro Gln Glu Pro Thr Lys

225 230 235 240

His Gln Tyr Asp Tyr Asp Ala Ala Thr Val Tyr Gly Phe Leu Lys Gln

245 250 255

Phe Gly Leu Glu Lys Glu Ile Lys Leu Asn Ile Glu Ala Asn His Ala

260 265 270

Thr Leu Ala Gly His Ser Phe His His Glu Ile Ala Thr Ala Ile Ala

275 280 285

Leu Gly Leu Phe Gly Ser Val Asp Ala Asn Arg Gly Asp Ala Gln Leu

290 295 300

Gly Trp Asp Thr Asp Gln Phe Pro Asn Ser Val Glu Glu Asn Ala Leu

305 310 315 320

Val Met Tyr Glu Ile Leu Lys Ala Gly Gly Phe Thr Thr Gly Gly Leu

325 330 335

Asn Phe Asp Ala Lys Val Arg Arg Gln Ser Thr Asp Lys Tyr Asp Leu

340 345 350

Phe Tyr Gly His Ile Gly Ala Met Asp Thr Met Ala Leu Ala Leu Lys

355 360 365

Ile Ala Ala Arg Met Ile Glu Asp Gly Glu Leu Asp Lys Arg Ile Ala

370 375 380

Gln Arg Tyr Ser Gly Trp Asn Ser Glu Leu Gly Gln Gln Ile Leu Lys

385 390 395 400

Gly Gln Met Ser Leu Ala Asp Leu Ala Lys Tyr Ala Gln Glu His His

405 410 415

Leu Ser Pro Val His Gln Ser Gly Arg Gln Glu Gln Leu Glu Asn Leu

420 425 430

Val Asn His Tyr Leu Phe Asp Lys

435 440

<210> 7

<211> 1179

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 7

atgtttacta aacgtcaccg catcacatta ctgttcaatg ccaataaagc ctatgaccgg 60

caggtagtag aaggcgtagg ggaatattta caggcgtcac aatcggaatg ggatattttc 120

attgaagaag atttccgcgc ccgcattgat aaaatcaagg actggttagg agatggcgtc 180

attgccgact tcgacgacaa acagatcgag caagcgctgg ctgatgtcga cgtccccatt 240

gttggggttg gcggctcgta tcaccttgca gaaagttacc cacccgttca ttacattgcc 300

accgataact atgcgctggt tgaaagcgca tttttgcatt taaaagagaa aggcgttaac 360

cgctttgctt tttatggtct tccggaatca agcggcaaac gttgggccac tgagcgcgaa 420

tatgcatttc gtcagcttgt cgccgaagaa aagtatcgcg gagtggttta tcaggggtta 480

gaaaccgcgc cagagaactg gcaacacgcg caaaatcggc tggcagactg gctacaaacg 540

ctaccaccgc aaaccgggat tattgccgtt actgacgccc gagcgcggca tattctgcaa 600

gtatgtgaac atctacatat tcccgtaccg gaaaaattat gcgtgattgg catcgataac 660

gaagaactga cccgctatct gtcgcgtgtc gccctttctt cggtcgctca gggcgcgcgg 720

caaatgggct atcaggcggc aaaactgttg catcgattat tagataaaga agaaatgccg 780

ctacagcgaa ttttggtccc accagttcgc gtcattgaac ggcgctcaac agattatcgc 840

tcgctgaccg atcccgccgt tattcaggcc atgcattaca ttcgtaatca cgcctgtaaa 900

gggattaaag tggatcaggt actggatgcg gtcgggatct cgcgctccaa tcttgagaag 960

cgttttaaag aagaggtggg tgaaaccatc catgccatga ttcatgccga gaagctggag 1020

aaagcgcgca gtctgctgat ttcaaccacc ttgtcgatca atgagatatc gcaaatgtgc 1080

ggttatccat cgctgcaata tttctactct gtttttaaaa aagcatatga cacgacgcca 1140

aaagagtatc gcgatgtaaa tagcgaggtc atgttgtag 1179

<210> 8

<211> 392

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 8

Met Phe Thr Lys Arg His Arg Ile Thr Leu Leu Phe Asn Ala Asn Lys

1 5 10 15

Ala Tyr Asp Arg Gln Val Val Glu Gly Val Gly Glu Tyr Leu Gln Ala

20 25 30

Ser Gln Ser Glu Trp Asp Ile Phe Ile Glu Glu Asp Phe Arg Ala Arg

35 40 45

Ile Asp Lys Ile Lys Asp Trp Leu Gly Asp Gly Val Ile Ala Asp Phe

50 55 60

Asp Asp Lys Gln Ile Glu Gln Ala Leu Ala Asp Val Asp Val Pro Ile

65 70 75 80

Val Gly Val Gly Gly Ser Tyr His Leu Ala Glu Ser Tyr Pro Pro Val

85 90 95

His Tyr Ile Ala Thr Asp Asn Tyr Ala Leu Val Glu Ser Ala Phe Leu

100 105 110

His Leu Lys Glu Lys Gly Val Asn Arg Phe Ala Phe Tyr Gly Leu Pro

115 120 125

Glu Ser Ser Gly Lys Arg Trp Ala Thr Glu Arg Glu Tyr Ala Phe Arg

130 135 140

Gln Leu Val Ala Glu Glu Lys Tyr Arg Gly Val Val Tyr Gln Gly Leu

145 150 155 160

Glu Thr Ala Pro Glu Asn Trp Gln His Ala Gln Asn Arg Leu Ala Asp

165 170 175

Trp Leu Gln Thr Leu Pro Pro Gln Thr Gly Ile Ile Ala Val Thr Asp

180 185 190

Ala Arg Ala Arg His Ile Leu Gln Val Cys Glu His Leu His Ile Pro

195 200 205

Val Pro Glu Lys Leu Cys Val Ile Gly Ile Asp Asn Glu Glu Leu Thr

210 215 220

Arg Tyr Leu Ser Arg Val Ala Leu Ser Ser Val Ala Gln Gly Ala Arg

225 230 235 240

Gln Met Gly Tyr Gln Ala Ala Lys Leu Leu His Arg Leu Leu Asp Lys

245 250 255

Glu Glu Met Pro Leu Gln Arg Ile Leu Val Pro Pro Val Arg Val Ile

260 265 270

Glu Arg Arg Ser Thr Asp Tyr Arg Ser Leu Thr Asp Pro Ala Val Ile

275 280 285

Gln Ala Met His Tyr Ile Arg Asn His Ala Cys Lys Gly Ile Lys Val

290 295 300

Asp Gln Val Leu Asp Ala Val Gly Ile Ser Arg Ser Asn Leu Glu Lys

305 310 315 320

Arg Phe Lys Glu Glu Val Gly Glu Thr Ile His Ala Met Ile His Ala

325 330 335

Glu Lys Leu Glu Lys Ala Arg Ser Leu Leu Ile Ser Thr Thr Leu Ser

340 345 350

Ile Asn Glu Ile Ser Gln Met Cys Gly Tyr Pro Ser Leu Gln Tyr Phe

355 360 365

Tyr Ser Val Phe Lys Lys Ala Tyr Asp Thr Thr Pro Lys Glu Tyr Arg

370 375 380

Asp Val Asn Ser Glu Val Met Leu

385 390

<210> 9

<211> 633

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 9

atggtgcttg gcaaaccgca aacagacccg actctcgaat ggttcttgtc tcattgccac 60

attcataagt acccatccaa gagcacgctt attcaccagg gtgaaaaagc ggaaacgctg 120

tactacatcg ttaaaggctc tgtggcagtg ctgatcaaag acgaagaggg taaagaaatg 180

atcctctcct atctgaatca gggtgatttt attggcgaac tgggcctgtt tgaagagggc 240

caggaacgta gcgcatgggt acgtgcgaaa accgcctgtg aagtggctga aatttcgtac 300

aaaaaatttc gccaattgat tcaggtaaac ccggacattc tgatgcgttt gtctgcacag 360

atggcgcgtc gtctgcaagt cacttcagag aaagtgggca acctggcgtt cctcgacgtg 420

acgggccgca ttgcacagac tctgctgaat ctggcaaaac aaccagacgc tatgactcac 480

ccggacggta tgcaaatcaa aattacccgt caggaaattg gtcagattgt cggctgttct 540

cgtgaaaccg tgggacgcat tctgaagatg ctggaagatc agaacctgat ctccgcacac 600

ggtaaaacca tcgtcgttta cggcactcgt taa 633

<210> 10

<211> 210

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 10

Met Val Leu Gly Lys Pro Gln Thr Asp Pro Thr Leu Glu Trp Phe Leu

1 5 10 15

Ser His Cys His Ile His Lys Tyr Pro Ser Lys Ser Thr Leu Ile His

20 25 30

Gln Gly Glu Lys Ala Glu Thr Leu Tyr Tyr Ile Val Lys Gly Ser Val

35 40 45

Ala Val Leu Ile Lys Asp Glu Glu Gly Lys Glu Met Ile Leu Ser Tyr

50 55 60

Leu Asn Gln Gly Asp Phe Ile Gly Glu Leu Gly Leu Phe Glu Glu Gly

65 70 75 80

Gln Glu Arg Ser Ala Trp Val Arg Ala Lys Thr Ala Cys Glu Val Ala

85 90 95

Glu Ile Ser Tyr Lys Lys Phe Arg Gln Leu Ile Gln Val Asn Pro Asp

100 105 110

Ile Leu Met Arg Leu Ser Ala Gln Met Ala Arg Arg Leu Gln Val Thr

115 120 125

Ser Glu Lys Val Gly Asn Leu Ala Phe Leu Asp Val Thr Gly Arg Ile

130 135 140

Ala Gln Thr Leu Leu Asn Leu Ala Lys Gln Pro Asp Ala Met Thr His

145 150 155 160

Pro Asp Gly Met Gln Ile Lys Ile Thr Arg Gln Glu Ile Gly Gln Ile

165 170 175

Val Gly Cys Ser Arg Glu Thr Val Gly Arg Ile Leu Lys Met Leu Glu

180 185 190

Asp Gln Asn Leu Ile Ser Ala His Gly Lys Thr Ile Val Val Tyr Gly

195 200 205

Thr Arg

210

<210> 11

<211> 897

<212> DNA

<213> 智人（Homo sapiens）

<400> 11

atggaggaaa agcaaattct gtgcgttggt ctggtggttc tggacgtgat tagcctggtt 60

gataagtacc cgaaagagga tagcgaaatc cgttgcctga gccagcgttg gcaacgtggt 120

ggcaacgcga gcaatagctg caccgttctg agcctgctgg gtgcgccgtg cgcgttcatg 180

ggtagcatgg cgccgggtca tgttgcggac ttcctggtgg cggattttcg tcgtcgtggt 240

gtggacgtta gccaggttgc gtggcaaagc aagggcgata ccccgagctc ctgctgcatc 300

attaacaaca gcaacggtaa ccgtaccatt gtgctgcacg acaccagcct gccggatgtt 360

agcgcgaccg acttcgagaa ggtggatctg acccagttta aatggattca cattgagggc 420

cgtaacgcga gcgaacaggt taaaatgctg caacgtattg atgcgcacaa cacccgtcag 480

ccgccggaac aaaagattcg tgtgagcgtt gaggtggaaa aaccgcgtga ggaactgttc 540

caactgtttg gttacggcga cgtggttttc gttagcaagg atgtggcgaa acacctgggt 600

tttcaaagcg cggaggaagc gctgcgtggt ctgtatggcc gtgtgcgtaa aggcgcggtt 660

ctggtgtgcg cgtgggcgga ggaaggcgcg gatgcgctgg gtccggatgg caaactgctg 720

cacagcgatg cgttcccgcc gccgcgtgtg gttgacaccc tgggtgcggg cgataccttc 780

aacgcgagcg ttatctttag cctgagccag ggccgtagcg tgcaagaggc gctgcgtttc 840

ggctgccaag ttgcgggtaa aaaatgcggt ctgcaaggct ttgacggtat cgtgtaa 897

<210> 12

<211> 298

<212> PRT

<213> 智人（Homo sapiens）

<400> 12

Met Glu Glu Lys Gln Ile Leu Cys Val Gly Leu Val Val Leu Asp Val

1 5 10 15

Ile Ser Leu Val Asp Lys Tyr Pro Lys Glu Asp Ser Glu Ile Arg Cys

20 25 30

Leu Ser Gln Arg Trp Gln Arg Gly Gly Asn Ala Ser Asn Ser Cys Thr

35 40 45

Val Leu Ser Leu Leu Gly Ala Pro Cys Ala Phe Met Gly Ser Met Ala

50 55 60

Pro Gly His Val Ala Asp Phe Leu Val Ala Asp Phe Arg Arg Arg Gly

65 70 75 80

Val Asp Val Ser Gln Val Ala Trp Gln Ser Lys Gly Asp Thr Pro Ser

85 90 95

Ser Cys Cys Ile Ile Asn Asn Ser Asn Gly Asn Arg Thr Ile Val Leu

100 105 110

His Asp Thr Ser Leu Pro Asp Val Ser Ala Thr Asp Phe Glu Lys Val

115 120 125

Asp Leu Thr Gln Phe Lys Trp Ile His Ile Glu Gly Arg Asn Ala Ser

130 135 140

Glu Gln Val Lys Met Leu Gln Arg Ile Asp Ala His Asn Thr Arg Gln

145 150 155 160

Pro Pro Glu Gln Lys Ile Arg Val Ser Val Glu Val Glu Lys Pro Arg

165 170 175

Glu Glu Leu Phe Gln Leu Phe Gly Tyr Gly Asp Val Val Phe Val Ser

180 185 190

Lys Asp Val Ala Lys His Leu Gly Phe Gln Ser Ala Glu Glu Ala Leu

195 200 205

Arg Gly Leu Tyr Gly Arg Val Arg Lys Gly Ala Val Leu Val Cys Ala

210 215 220

Trp Ala Glu Glu Gly Ala Asp Ala Leu Gly Pro Asp Gly Lys Leu Leu

225 230 235 240

His Ser Asp Ala Phe Pro Pro Pro Arg Val Val Asp Thr Leu Gly Ala

245 250 255

Gly Asp Thr Phe Asn Ala Ser Val Ile Phe Ser Leu Ser Gln Gly Arg

260 265 270

Ser Val Gln Glu Ala Leu Arg Phe Gly Cys Gln Val Ala Gly Lys Lys

275 280 285

Cys Gly Leu Gln Gly Phe Asp Gly Ile Val

290 295

<210> 13

<211> 1455

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 13

atgtatatcg ggatagatct tggcacctcg ggcgtaaaag ttattttgct caacgagcag 60

ggtgaggtgg ttgctgcgca aacggaaaag ctgaccgttt cgcgcccgca tccactctgg 120

tcggaacaag acccggaaca gtggtggcag gcaactgatc gcgcaatgaa agctctgggc 180

gatcagcatt ctctgcagga cgttaaagca ttgggtattg ccggccagat gcacggagca 240

accttgctgg atgctcagca acgggtgtta cgccctgcca ttttgtggaa cgacgggcgc 300

tgtgcgcaag agtgcacttt gctggaagcg cgagttccgc aatcgcgggt gattaccggc 360

aacctgatga tgcccggatt tactgcgcct aaattgctat gggttcagcg gcatgagccg 420

gagatattcc gtcaaatcga caaagtatta ttaccgaaag attacttgcg tctgcgtatg 480

acgggggagt ttgccagcga tatgtctgac gcagctggca ccatgtggct ggatgtcgca 540

aagcgtgact ggagtgacgt catgctgcag gcttgcgact tatctcgtga ccagatgccc 600

gcattatacg aaggcagcga aattactggt gctttgttac ctgaagttgc gaaagcgtgg 660

ggtatggcga cggtgccagt tgtcgcaggc ggtggcgaca atgcagctgg tgcagttggt 720

gtgggaatgg ttgatgctaa tcaggcaatg ttatcgctgg ggacgtcggg ggtctatttt 780

gctgtcagcg aagggttctt aagcaagcca gaaagcgccg tacatagctt ttgccatgcg 840

ctaccgcaac gttggcattt aatgtctgtg atgctgagtg cagcgtcgtg tctggattgg 900

gccgcgaaat taaccggcct gagcaatgtc ccagctttaa tcgctgcagc tcaacaggct 960

gatgaaagtg ccgagccagt ttggtttctg ccttatcttt ccggcgagcg tacgccacac 1020

aataatcccc aggcgaaggg ggttttcttt ggtttgactc atcaacatgg ccccaatgaa 1080

ctggcgcgag cagtgctgga aggcgtgggt tatgcgctgg cagatggcat ggatgtcgtg 1140

catgcctgcg gtattaaacc gcaaagtgtt acgttgattg ggggcggggc gcgtagtgag 1200

tactggcgtc agatgctggc ggatatcagc ggtcagcagc tcgattaccg tacggggggg 1260

gatgtggggc cagcactggg cgcagcaagg ctggcgcaga tcgcggcgaa tccagagaaa 1320

tcgctcattg aattgttgcc gcaactaccg ttagaacagt cgcatctacc agatgcgcag 1380

cgttatgccg cttatcagcc acgacgagaa acgttccgtc gcctctatca gcaacttctg 1440

ccattaatgg cgtaa 1455

<210> 14

<211> 484

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 14

Met Tyr Ile Gly Ile Asp Leu Gly Thr Ser Gly Val Lys Val Ile Leu

1 5 10 15

Leu Asn Glu Gln Gly Glu Val Val Ala Ala Gln Thr Glu Lys Leu Thr

20 25 30

Val Ser Arg Pro His Pro Leu Trp Ser Glu Gln Asp Pro Glu Gln Trp

35 40 45

Trp Gln Ala Thr Asp Arg Ala Met Lys Ala Leu Gly Asp Gln His Ser

50 55 60

Leu Gln Asp Val Lys Ala Leu Gly Ile Ala Gly Gln Met His Gly Ala

65 70 75 80

Thr Leu Leu Asp Ala Gln Gln Arg Val Leu Arg Pro Ala Ile Leu Trp

85 90 95

Asn Asp Gly Arg Cys Ala Gln Glu Cys Thr Leu Leu Glu Ala Arg Val

100 105 110

Pro Gln Ser Arg Val Ile Thr Gly Asn Leu Met Met Pro Gly Phe Thr

115 120 125

Ala Pro Lys Leu Leu Trp Val Gln Arg His Glu Pro Glu Ile Phe Arg

130 135 140

Gln Ile Asp Lys Val Leu Leu Pro Lys Asp Tyr Leu Arg Leu Arg Met

145 150 155 160

Thr Gly Glu Phe Ala Ser Asp Met Ser Asp Ala Ala Gly Thr Met Trp

165 170 175

Leu Asp Val Ala Lys Arg Asp Trp Ser Asp Val Met Leu Gln Ala Cys

180 185 190

Asp Leu Ser Arg Asp Gln Met Pro Ala Leu Tyr Glu Gly Ser Glu Ile

195 200 205

Thr Gly Ala Leu Leu Pro Glu Val Ala Lys Ala Trp Gly Met Ala Thr

210 215 220

Val Pro Val Val Ala Gly Gly Gly Asp Asn Ala Ala Gly Ala Val Gly

225 230 235 240

Val Gly Met Val Asp Ala Asn Gln Ala Met Leu Ser Leu Gly Thr Ser

245 250 255

Gly Val Tyr Phe Ala Val Ser Glu Gly Phe Leu Ser Lys Pro Glu Ser

260 265 270

Ala Val His Ser Phe Cys His Ala Leu Pro Gln Arg Trp His Leu Met

275 280 285

Ser Val Met Leu Ser Ala Ala Ser Cys Leu Asp Trp Ala Ala Lys Leu

290 295 300

Thr Gly Leu Ser Asn Val Pro Ala Leu Ile Ala Ala Ala Gln Gln Ala

305 310 315 320

Asp Glu Ser Ala Glu Pro Val Trp Phe Leu Pro Tyr Leu Ser Gly Glu

325 330 335

Arg Thr Pro His Asn Asn Pro Gln Ala Lys Gly Val Phe Phe Gly Leu

340 345 350

Thr His Gln His Gly Pro Asn Glu Leu Ala Arg Ala Val Leu Glu Gly

355 360 365

Val Gly Tyr Ala Leu Ala Asp Gly Met Asp Val Val His Ala Cys Gly

370 375 380

Ile Lys Pro Gln Ser Val Thr Leu Ile Gly Gly Gly Ala Arg Ser Glu

385 390 395 400

Tyr Trp Arg Gln Met Leu Ala Asp Ile Ser Gly Gln Gln Leu Asp Tyr

405 410 415

Arg Thr Gly Gly Asp Val Gly Pro Ala Leu Gly Ala Ala Arg Leu Ala

420 425 430

Gln Ile Ala Ala Asn Pro Glu Lys Ser Leu Ile Glu Leu Leu Pro Gln

435 440 445

Leu Pro Leu Glu Gln Ser His Leu Pro Asp Ala Gln Arg Tyr Ala Ala

450 455 460

Tyr Gln Pro Arg Arg Glu Thr Phe Arg Arg Leu Tyr Gln Gln Leu Leu

465 470 475 480

Pro Leu Met Ala

<210> 15

<211> 747

<212> DNA

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 15

atgagcagcg cgatctaccc gagcctgaaa ggtaaacgtg tggtgattac cggcggcggc 60

agcggcattg gtgcgggcct gaccgcgggc ttcgcgcgtc agggtgcgga agtgatcttt 120

ctggacattg cggacgaaga tagccgtgcg ctggaggcgg aactggcggg cagcccgatc 180

ccgccggtgt acaagcgttg cgatctgatg aacctggagg cgatcaaagc ggttttcgcg 240

gaaattggcg acgtggatgt tctggtgaac aacgcgggta acgacgaccg tcacaagctg 300

gcggatgtga ccggtgcgta ttgggatgag cgtattaacg ttaacctgcg tcacatgctg 360

ttctgcaccc aggcggtggc gccgggtatg aagaaacgtg gtggcggtgc ggttatcaac 420

tttggcagca ttagctggca cctgggtctg gaggacctgg tgctgtacga aaccgcgaaa 480

gcgggcatcg agggtatgac ccgtgcgctg gcgcgtgaac tgggtccgga cgatattcgt 540

gtgacctgcg tggttccggg taacgttaag accaaacgtc aagagaagtg gtataccccg 600

gagggtgaag cgcagattgt tgcggcgcaa tgcctgaaag gtcgtattgt tccggaaaac 660

gtggcggcgc tggttctgtt tctggcgagc gatgatgcga gcctgtgcac cggccatgag 720

tattggattg atgcgggctg gcgttaa 747

<210> 16

<211> 248

<212> PRT

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 16

Met Ser Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile

1 5 10 15

Thr Gly Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala

20 25 30

Arg Gln Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser

35 40 45

Arg Ala Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr

50 55 60

Lys Arg Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala

65 70 75 80

Glu Ile Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp

85 90 95

Arg His Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile

100 105 110

Asn Val Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro

115 120 125

Gly Met Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile

130 135 140

Ser Trp His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys

145 150 155 160

Ala Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro

165 170 175

Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr Lys

180 185 190

Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile Val Ala

195 200 205

Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val Ala Ala Leu

210 215 220

Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys Thr Gly His Glu

225 230 235 240

Tyr Trp Ile Asp Ala Gly Trp Arg

245

<210> 17

<211> 255

<212> PRT

<213> 异种伯克霍尔德氏菌（Burkholderia xenovorans）

<400> 17

Met Ser Tyr Ala Ile Tyr Pro Ser Leu Ser Gly Lys Thr Val Val Ile

1 5 10 15

Thr Gly Gly Gly Ser Gly Ile Gly Ala Ala Met Val Glu Ala Phe Ala

20 25 30

Arg Gln Gly Ala Arg Val Phe Phe Leu Asp Val Ala Glu Asp Asp Ser

35 40 45

Leu Ala Leu Gln Gln Ser Leu Ser Asp Ala Pro His Pro Pro Leu Phe

50 55 60

Arg Arg Cys Asp Leu Arg Ser Val Asp Ala Ile His Ser Ala Phe Ala

65 70 75 80

Gly Ile Val Glu Ile Ala Gly Pro Ile Glu Val Leu Val Asn Asn Ala

85 90 95

Gly Asn Asp Asp Arg His Glu Val Asp Ala Ile Thr Pro Ala Tyr Trp

100 105 110

Asp Glu Arg Met Ala Val Asn Leu Arg His Gln Phe Phe Cys Ala Gln

115 120 125

Ala Ala Ala Ala Gly Met Arg Lys Ile Gly Arg Gly Val Ile Leu Asn

130 135 140

Leu Gly Ser Val Ser Trp His Leu Ala Leu Pro Asn Leu Ala Ile Tyr

145 150 155 160

Met Ser Ala Lys Ala Gly Ile Glu Gly Leu Thr Arg Gly Leu Ala Arg

165 170 175

Asp Leu Gly Ala Ala Gly Ile Arg Val Asn Cys Ile Ile Pro Gly Ala

180 185 190

Val Arg Thr Pro Arg Gln Met Gln Leu Trp Gln Ser Pro Glu Ser Glu

195 200 205

Ala Lys Leu Val Ala Ser Gln Cys Leu Arg Leu Arg Ile Glu Pro Glu

210 215 220

His Val Ala Arg Met Ala Leu Phe Leu Ala Ser Asp Asp Ala Ser Arg

225 230 235 240

Cys Ser Gly Arg Asp Tyr Phe Val Asp Ala Gly Trp Tyr Gly Glu

245 250 255

<210> 18

<211> 1173

<212> DNA

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 18

atgagccccg cccccaccga catcgtcgag gagttcacgc gccgcgactg gcagggagac 60

gacgtgacgg gcaccgtgcg ggtcgccatg atcggcctcg gctggtggac ccgcgacgag 120

gcgattcccg cggtcgaggc gtccgagttc tgcgagacga cggtcgtcgt cagcagttcg 180

aaggagaaag ccgagggcgc gacggcgttg accgagtcga taacccacgg cctcacctac 240

gacgagttcc acgagggggt cgccgccgac gcctacgacg cggtgtacgt cgtcacgccg 300

aacggtctgc atctcccgta cgtcgagacc gccgccgagt tggggaaggc ggtcctctgc 360

gagaaaccgc tggaagcgtc ggtcgagcgg gccgaaaagc tcgtcgccgc ctgcgaccgc 420

gccgacgtgc ccctgatggt cgcctatcgg atgcagaccg agccggccgt ccggcgcgcc 480

cgcgaactcg tcgaggccgg cgtcatcggc gagccggtgt tcgtccacgg ccacatgtcc 540

cagcgcctgc tcgacgaggt cgtccccgac cccgaccagt ggcggctcga ccccgaactc 600

tccggcggcg cgaccgtcat ggacatcggg ctctacccgc tgaacaccgc ccggttcgtc 660

ctcgacgccg accccgtccg cgtcagggcg accgcccgcg tcgacgacga ggcgttcgag 720

gccgtcggcg acgagcacgt cagtttcggc gtcgacttcg acgacggcac gctcgcggtc 780

tgcaccgcca gccagtcggc ttaccagttg agccacctcc gggtgaccgg caccgagggc 840

gaactcgaaa tcgagcccgc gttctacaac cgccaaaagc ggggattccg actgtcgtgg 900

ggggaccagt ccgccgacta cgacttcgag caggtaaacc agatgacgga ggagttcgac 960

tacttcgcgt cccggctcct gtcggattcc gaccccgcgc ccgacggcga ccacgcgctc 1020

gtggacatgc gcgcgatgga cgcgatttac gccgcggcgg agcgcgggac cgatgtcgcc 1080

gtcgacgccg ccgactccga ttccgccgac tccgattccg ccgacgctgc cgccgccaac 1140

cacgacgccg accccgattc cgacgggacg tag 1173

<210> 19

<211> 390

<212> PRT

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 19

Met Ser Pro Ala Pro Thr Asp Ile Val Glu Glu Phe Thr Arg Arg Asp

1 5 10 15

Trp Gln Gly Asp Asp Val Thr Gly Thr Val Arg Val Ala Met Ile Gly

20 25 30

Leu Gly Trp Trp Thr Arg Asp Glu Ala Ile Pro Ala Val Glu Ala Ser

35 40 45

Glu Phe Cys Glu Thr Thr Val Val Val Ser Ser Ser Lys Glu Lys Ala

50 55 60

Glu Gly Ala Thr Ala Leu Thr Glu Ser Ile Thr His Gly Leu Thr Tyr

65 70 75 80

Asp Glu Phe His Glu Gly Val Ala Ala Asp Ala Tyr Asp Ala Val Tyr

85 90 95

Val Val Thr Pro Asn Gly Leu His Leu Pro Tyr Val Glu Thr Ala Ala

100 105 110

Glu Leu Gly Lys Ala Val Leu Cys Glu Lys Pro Leu Glu Ala Ser Val

115 120 125

Glu Arg Ala Glu Lys Leu Val Ala Ala Cys Asp Arg Ala Asp Val Pro

130 135 140

Leu Met Val Ala Tyr Arg Met Gln Thr Glu Pro Ala Val Arg Arg Ala

145 150 155 160

Arg Glu Leu Val Glu Ala Gly Val Ile Gly Glu Pro Val Phe Val His

165 170 175

Gly His Met Ser Gln Arg Leu Leu Asp Glu Val Val Pro Asp Pro Asp

180 185 190

Gln Trp Arg Leu Asp Pro Glu Leu Ser Gly Gly Ala Thr Val Met Asp

195 200 205

Ile Gly Leu Tyr Pro Leu Asn Thr Ala Arg Phe Val Leu Asp Ala Asp

210 215 220

Pro Val Arg Val Arg Ala Thr Ala Arg Val Asp Asp Glu Ala Phe Glu

225 230 235 240

Ala Val Gly Asp Glu His Val Ser Phe Gly Val Asp Phe Asp Asp Gly

245 250 255

Thr Leu Ala Val Cys Thr Ala Ser Gln Ser Ala Tyr Gln Leu Ser His

260 265 270

Leu Arg Val Thr Gly Thr Glu Gly Glu Leu Glu Ile Glu Pro Ala Phe

275 280 285

Tyr Asn Arg Gln Lys Arg Gly Phe Arg Leu Ser Trp Gly Asp Gln Ser

290 295 300

Ala Asp Tyr Asp Phe Glu Gln Val Asn Gln Met Thr Glu Glu Phe Asp

305 310 315 320

Tyr Phe Ala Ser Arg Leu Leu Ser Asp Ser Asp Pro Ala Pro Asp Gly

325 330 335

Asp His Ala Leu Val Asp Met Arg Ala Met Asp Ala Ile Tyr Ala Ala

340 345 350

Ala Glu Arg Gly Thr Asp Val Ala Val Asp Ala Ala Asp Ser Asp Ser

355 360 365

Ala Asp Ser Asp Ser Ala Asp Ala Ala Ala Ala Asn His Asp Ala Asp

370 375 380

Pro Asp Ser Asp Gly Thr

385 390

<210> 20

<211> 990

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 20

atgcacaaat ttactaaagc cctggcagcc attggtctgg cagccgttat gtcacaatcc 60

gctatggcgg agaacctgaa gctcggtttt ctggtgaagc aaccggaaga gccgtggttc 120

cagaccgaat ggaagtttgc cgataaagcc gggaaggatt tagggtttga ggttattaag 180

attgccgtgc cggatggcga aaaaacattg aacgcgatcg acagcctggc tgccagtggc 240

gcaaaaggtt tcgttatttg tactccggac cccaaactcg gctctgccat cgtcgcgaaa 300

gcgcgtggct acgatatgaa agtcattgcc gtggatgacc agtttgttaa cgccaaaggt 360

aagccaatgg ataccgttcc gctggtgatg atggcggcga ctaaaattgg cgaacgtcag 420

ggccaggaac tgtataaaga gatgcagaaa cgtggctggg atgtcaaaga aagcgcggtg 480

atggcgatta ccgccaacga actggatacc gcccgccgcc gtactacggg atctatggat 540

gcgctgaaag cggccggatt cccggaaaaa caaatttatc aggtacctac caaatctaac 600

gacatcccgg gggcatttga cgctgccaac tcaatgctgg ttcaacatcc ggaagttaaa 660

cattggctga tcgtcggtat gaacgacagc accgtgctgg gcggcgtacg cgcgacggaa 720

ggtcagggct ttaaagcggc cgatatcatc ggcattggca ttaacggtgt ggatgcggtg 780

agcgaactgt ctaaagcaca ggcaaccggc ttctacggtt ccctgctgcc aagcccggac 840

gtacatggct ataaatccag cgaaatgctt tacaactggg tagcaaaaga cgttgaaccg 900

ccaaaattta ccgaagttac cgacgtggta ctgatcacgc gtgacaactt taaagaagaa 960

ctggagaaaa aaggtttagg cggtaagtaa 990

<210> 21

<211> 1515

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 21

atgcaacagt ctaccccgta tctctcattt cgcggcatcg gtaaaacgtt tcccggcgtt 60

aaggcgctga cggatattag ttttgactgc tatgccggtc aggttcatgc gttgatgggt 120

gaaaatggcg caggaaaatc aactctctta aaaatcctca gcggcaacta tgcgccaacc 180

acgggttctg tagtgattaa tgggcaggaa atgtcctttt ccgacacgac cgcagcactt 240

aacgcgggcg tggcgattat ttaccaggaa ctgcatctcg tgccggaaat gaccgtcgcg 300

gaaaacatct atctcggcca gctgccgcat aaaggcggca ttgtgaatcg ctcattgctg 360

aattatgagg cgggtttaca acttaaacat cttggtatgg atattgaccc ggacacgccg 420

ctgaaatatc tctccattgg tcagtggcag atggttgaaa tcgccaaagc gctggcgcgt 480

aacgccaaaa ttatcgcctt tgatgagcca accagctccc tctctgcccg tgaaatcgac 540

aatcttttcc gcgttattcg tgaactgcga aaagaggggc gggtaatctt atacgtttct 600

caccgtatgg aagaaatatt tgccctcagc gatgccatta ctgtctttaa agatggacgt 660

tatgtcaaaa cctttaccga tatgcagcag gttgaccacg acgcgctggt gcaggcgatg 720

gtcgggcgcg acattggcga tatctacggc tggcaaccgc gtagttatgg cgaggagcgc 780

ctacgtcttg atgctgtgaa agcaccaggc gtgcgtacgc caataagtct ggcggttcgc 840

agtggtgaaa ttgttgggct gtttggtctg gtaggggcgg ggcgtagcga attaatgaaa 900

ggcatgtttg gcgggacgca aatcaccgcc ggtcaggttt atatcgacca acagccgatc 960

gatattcgta aaccgagcca cgccattgcc gcaggcatga tgctctgccc ggaagatcgc 1020

aaagcggaag gcattattcc cgtgcactcc gttcgcgaca atatcaacat cagtgccaga 1080

cgtaaacatg tgctcggcgg ttgtgtaatc aacaacggtt gggaagaaaa caatgccgat 1140

caccacattc gttcgctcaa catcaaaacg ccgggcgcgg agcaactgat catgaatctc 1200

tcaggcggaa atcagcaaaa agccattctg ggccgctggt tatcggaaga gatgaaggtc 1260

attttgctgg atgaacctac gcgcggcatt gatgttggcg ctaagcacga aatatataac 1320

gtaatttatg cgctggcggc gcagggcgtg gcggtgctgt ttgcctccag cgacttacct 1380

gaagtcctcg gcgttgccga ccggattgtg gtgatgcggg aaggtgaaat cgccggtgaa 1440

ttgttacacg agcaggcaga tgagcgtcag gcactgagcc ttgcgatgcc taaagtcagc 1500

caggctgttg cctga 1515

<210> 22

<211> 987

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 22

atgtcttctg tttctacatc ggggtctggc gcacctaagt cgtcattcag cttcgggcgt 60

atctgggatc agtacggcat gctggtggtg tttgcggtgc tctttatcgc ctgtgccatt 120

tttgtcccaa attttgccac cttcattaat atgaaagggt tgggcctggc aatttccatg 180

tcggggatgg tggcttgtgg catgttgttc tgcctcgctt ccggtgactt tgacctttct 240

gtcgcctccg taattgcctg tgcgggtgtc accacggcgg tggttattaa cctgactgaa 300

agcctgtgga ttggcgtggc agcggggttg ttgctgggcg ttctctgtgg cctggtcaat 360

ggctttgtta tcgccaaact gaaaataaat gctctgatca cgacattggc aacgatgcag 420

attgttcgag gtctggcgta catcatttca gacggtaaag cggtcggtat cgaagatgaa 480

agcttctttg cccttggtta cgccaactgg ttcggtctgc ctgcgccaat ctggctcacc 540

gtcgcgtgtc tgattatctt tggtttgctg ctgaataaaa ccacctttgg tcgtaacacc 600

ctggcgattg gcgggaacga agaggccgcg cgtctggcgg gtgtaccggt tgttcgcacc 660

aaaattatta tctttgttct ctcaggcctg gtatcagcga tagccggaat tattctggct 720

tcacgtatga ccagtgggca gccaatgacg tcgattggtt atgagctgat tgttatctcc 780

gcctgcgttt taggtggcgt ttctctgaaa ggtggcatcg gaaaaatctc atatgtggtg 840

gcgggtatct taattttagg caccgtggaa aacgccatga acctgcttaa tatttctcct 900

ttcgcgcagt acgtggttcg cggcttaatc ctgctggcag cggtgatctt cgaccgttac 960

aagcaaaaag cgaaacgcac tgtctga 987

<210> 23

<211> 329

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 23

Met His Lys Phe Thr Lys Ala Leu Ala Ala Ile Gly Leu Ala Ala Val

1 5 10 15

Met Ser Gln Ser Ala Met Ala Glu Asn Leu Lys Leu Gly Phe Leu Val

20 25 30

Lys Gln Pro Glu Glu Pro Trp Phe Gln Thr Glu Trp Lys Phe Ala Asp

35 40 45

Lys Ala Gly Lys Asp Leu Gly Phe Glu Val Ile Lys Ile Ala Val Pro

50 55 60

Asp Gly Glu Lys Thr Leu Asn Ala Ile Asp Ser Leu Ala Ala Ser Gly

65 70 75 80

Ala Lys Gly Phe Val Ile Cys Thr Pro Asp Pro Lys Leu Gly Ser Ala

85 90 95

Ile Val Ala Lys Ala Arg Gly Tyr Asp Met Lys Val Ile Ala Val Asp

100 105 110

Asp Gln Phe Val Asn Ala Lys Gly Lys Pro Met Asp Thr Val Pro Leu

115 120 125

Val Met Met Ala Ala Thr Lys Ile Gly Glu Arg Gln Gly Gln Glu Leu

130 135 140

Tyr Lys Glu Met Gln Lys Arg Gly Trp Asp Val Lys Glu Ser Ala Val

145 150 155 160

Met Ala Ile Thr Ala Asn Glu Leu Asp Thr Ala Arg Arg Arg Thr Thr

165 170 175

Gly Ser Met Asp Ala Leu Lys Ala Ala Gly Phe Pro Glu Lys Gln Ile

180 185 190

Tyr Gln Val Pro Thr Lys Ser Asn Asp Ile Pro Gly Ala Phe Asp Ala

195 200 205

Ala Asn Ser Met Leu Val Gln His Pro Glu Val Lys His Trp Leu Ile

210 215 220

Val Gly Met Asn Asp Ser Thr Val Leu Gly Gly Val Arg Ala Thr Glu

225 230 235 240

Gly Gln Gly Phe Lys Ala Ala Asp Ile Ile Gly Ile Gly Ile Asn Gly

245 250 255

Val Asp Ala Val Ser Glu Leu Ser Lys Ala Gln Ala Thr Gly Phe Tyr

260 265 270

Gly Ser Leu Leu Pro Ser Pro Asp Val His Gly Tyr Lys Ser Ser Glu

275 280 285

Met Leu Tyr Asn Trp Val Ala Lys Asp Val Glu Pro Pro Lys Phe Thr

290 295 300

Glu Val Thr Asp Val Val Leu Ile Thr Arg Asp Asn Phe Lys Glu Glu

305 310 315 320

Leu Glu Lys Lys Gly Leu Gly Gly Lys

325

<210> 24

<211> 504

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 24

Met Gln Gln Ser Thr Pro Tyr Leu Ser Phe Arg Gly Ile Gly Lys Thr

1 5 10 15

Phe Pro Gly Val Lys Ala Leu Thr Asp Ile Ser Phe Asp Cys Tyr Ala

20 25 30

Gly Gln Val His Ala Leu Met Gly Glu Asn Gly Ala Gly Lys Ser Thr

35 40 45

Leu Leu Lys Ile Leu Ser Gly Asn Tyr Ala Pro Thr Thr Gly Ser Val

50 55 60

Val Ile Asn Gly Gln Glu Met Ser Phe Ser Asp Thr Thr Ala Ala Leu

65 70 75 80

Asn Ala Gly Val Ala Ile Ile Tyr Gln Glu Leu His Leu Val Pro Glu

85 90 95

Met Thr Val Ala Glu Asn Ile Tyr Leu Gly Gln Leu Pro His Lys Gly

100 105 110

Gly Ile Val Asn Arg Ser Leu Leu Asn Tyr Glu Ala Gly Leu Gln Leu

115 120 125

Lys His Leu Gly Met Asp Ile Asp Pro Asp Thr Pro Leu Lys Tyr Leu

130 135 140

Ser Ile Gly Gln Trp Gln Met Val Glu Ile Ala Lys Ala Leu Ala Arg

145 150 155 160

Asn Ala Lys Ile Ile Ala Phe Asp Glu Pro Thr Ser Ser Leu Ser Ala

165 170 175

Arg Glu Ile Asp Asn Leu Phe Arg Val Ile Arg Glu Leu Arg Lys Glu

180 185 190

Gly Arg Val Ile Leu Tyr Val Ser His Arg Met Glu Glu Ile Phe Ala

195 200 205

Leu Ser Asp Ala Ile Thr Val Phe Lys Asp Gly Arg Tyr Val Lys Thr

210 215 220

Phe Thr Asp Met Gln Gln Val Asp His Asp Ala Leu Val Gln Ala Met

225 230 235 240

Val Gly Arg Asp Ile Gly Asp Ile Tyr Gly Trp Gln Pro Arg Ser Tyr

245 250 255

Gly Glu Glu Arg Leu Arg Leu Asp Ala Val Lys Ala Pro Gly Val Arg

260 265 270

Thr Pro Ile Ser Leu Ala Val Arg Ser Gly Glu Ile Val Gly Leu Phe

275 280 285

Gly Leu Val Gly Ala Gly Arg Ser Glu Leu Met Lys Gly Met Phe Gly

290 295 300

Gly Thr Gln Ile Thr Ala Gly Gln Val Tyr Ile Asp Gln Gln Pro Ile

305 310 315 320

Asp Ile Arg Lys Pro Ser His Ala Ile Ala Ala Gly Met Met Leu Cys

325 330 335

Pro Glu Asp Arg Lys Ala Glu Gly Ile Ile Pro Val His Ser Val Arg

340 345 350

Asp Asn Ile Asn Ile Ser Ala Arg Arg Lys His Val Leu Gly Gly Cys

355 360 365

Val Ile Asn Asn Gly Trp Glu Glu Asn Asn Ala Asp His His Ile Arg

370 375 380

Ser Leu Asn Ile Lys Thr Pro Gly Ala Glu Gln Leu Ile Met Asn Leu

385 390 395 400

Ser Gly Gly Asn Gln Gln Lys Ala Ile Leu Gly Arg Trp Leu Ser Glu

405 410 415

Glu Met Lys Val Ile Leu Leu Asp Glu Pro Thr Arg Gly Ile Asp Val

420 425 430

Gly Ala Lys His Glu Ile Tyr Asn Val Ile Tyr Ala Leu Ala Ala Gln

435 440 445

Gly Val Ala Val Leu Phe Ala Ser Ser Asp Leu Pro Glu Val Leu Gly

450 455 460

Val Ala Asp Arg Ile Val Val Met Arg Glu Gly Glu Ile Ala Gly Glu

465 470 475 480

Leu Leu His Glu Gln Ala Asp Glu Arg Gln Ala Leu Ser Leu Ala Met

485 490 495

Pro Lys Val Ser Gln Ala Val Ala

500

<210> 25

<211> 328

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 25

Met Ser Ser Val Ser Thr Ser Gly Ser Gly Ala Pro Lys Ser Ser Phe

1 5 10 15

Ser Phe Gly Arg Ile Trp Asp Gln Tyr Gly Met Leu Val Val Phe Ala

20 25 30

Val Leu Phe Ile Ala Cys Ala Ile Phe Val Pro Asn Phe Ala Thr Phe

35 40 45

Ile Asn Met Lys Gly Leu Gly Leu Ala Ile Ser Met Ser Gly Met Val

50 55 60

Ala Cys Gly Met Leu Phe Cys Leu Ala Ser Gly Asp Phe Asp Leu Ser

65 70 75 80

Val Ala Ser Val Ile Ala Cys Ala Gly Val Thr Thr Ala Val Val Ile

85 90 95

Asn Leu Thr Glu Ser Leu Trp Ile Gly Val Ala Ala Gly Leu Leu Leu

100 105 110

Gly Val Leu Cys Gly Leu Val Asn Gly Phe Val Ile Ala Lys Leu Lys

115 120 125

Ile Asn Ala Leu Ile Thr Thr Leu Ala Thr Met Gln Ile Val Arg Gly

130 135 140

Leu Ala Tyr Ile Ile Ser Asp Gly Lys Ala Val Gly Ile Glu Asp Glu

145 150 155 160

Ser Phe Phe Ala Leu Gly Tyr Ala Asn Trp Phe Gly Leu Pro Ala Pro

165 170 175

Ile Trp Leu Thr Val Ala Cys Leu Ile Ile Phe Gly Leu Leu Leu Asn

180 185 190

Lys Thr Thr Phe Gly Arg Asn Thr Leu Ala Ile Gly Gly Asn Glu Glu

195 200 205

Ala Ala Arg Leu Ala Gly Val Pro Val Val Arg Thr Lys Ile Ile Ile

210 215 220

Phe Val Leu Ser Gly Leu Val Ser Ala Ile Ala Gly Ile Ile Leu Ala

225 230 235 240

Ser Arg Met Thr Ser Gly Gln Pro Met Thr Ser Ile Gly Tyr Glu Leu

245 250 255

Ile Val Ile Ser Ala Cys Val Leu Gly Gly Val Ser Leu Lys Gly Gly

260 265 270

Ile Gly Lys Ile Ser Tyr Val Val Ala Gly Ile Leu Ile Leu Gly Thr

275 280 285

Val Glu Asn Ala Met Asn Leu Leu Asn Ile Ser Pro Phe Ala Gln Tyr

290 295 300

Val Val Arg Gly Leu Ile Leu Leu Ala Ala Val Ile Phe Asp Arg Tyr

305 310 315 320

Lys Gln Lys Ala Lys Arg Thr Val

325

<210> 26

<211> 993

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 26

atgaaaataa agaacattct actcaccctt tgcacctcac tcctgcttac caacgttgct 60

gcacacgcca aagaagtcaa aataggtatg gcgattgatg atctccgtct tgaacgctgg 120

caaaaagatc gagatatctt tgtgaaaaag gcagaatctc tcggcgcgaa agtatttgta 180

cagtctgcaa atggcaatga agaaacacaa atgtcgcaga ttgaaaacat gataaaccgg 240

ggtgtcgatg ttcttgtcat tattccgtat aacggtcagg tattaagtaa cgttgtaaaa 300

gaagccaaac aagaaggcat taaagtatta gcttacgacc gtatgattaa cgatgcggat 360

atcgattttt atatttcttt cgataacgaa aaagtcggtg aactgcaggc aaaagccctg 420

gtcgatattg ttccgcaagg taattacttc ctgatgggcg gctcgccggt agataacaac 480

gccaagctgt tccgcgccgg acaaatgaaa gtgttaaaac cttacgttga ttccggaaaa 540

attaaagtcg ttggtgacca atgggttgat ggctggttac cggaaaacgc attgaaaatt 600

atggaaaacg cgctaaccgc caataataac aaaattgatg ctgtagttgc ctcaaacgat 660

gccaccgcag gtggggcaat tcaggcatta agcgcgcaag gtttatcagg gaaagtagca 720

atctccggcc aggatgcgga tctcgcaggt attaaacgta ttgctgccgg tacgcaaact 780

atgacggtgt ataaacctat tacgttgttg gcaaatactg ccgcagaaat tgccgttgag 840

ttgggcaatg gtcaggaacc aaaagcagat accacactga ataatggcct gaaagatgtc 900

ccctcccgcc tcctgacacc gatcgatgtg aataaaaaca acatcaaaga tacggtaatt 960

aaagacggat tccacaaaga gagcgagctg taa 993

<210> 27

<211> 1542

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 27

atgccttatc tacttgaaat gaagaacatt accaaaacct tcggcagtgt gaaggcgatt 60

gataacgtct gcttgcggtt gaatgctggc gaaatcgtct cactttgtgg ggaaaatggg 120

tctggtaaat caacgctgat gaaagtgctg tgtggtattt atccccatgg ctcctacgaa 180

ggcgaaatta tttttgcggg agaagagatt caggcgagtc acatccgcga taccgaacgc 240

aaaggtatcg ccatcattca tcaggaattg gccctggtga aagaattgac cgtgctggaa 300

aatatcttcc tgggtaacga aataacccac aatggcatta tggattatga cctgatgacg 360

ctacgctgtc agaagctgct cgcacaggtc agtttatcca tttcacctga tacccgcgtt 420

ggcgatttag ggcttgggca acaacaactg gttgaaattg ccaaggcact taataaacag 480

gtgcgcttgt taattctcga tgaaccgaca gcctcattaa ctgagcagga aacgtcgatt 540

ttactggata ttattcgcga tctacaacag cacggtatcg cctgtattta tatttcgcac 600

aaactcaacg aagtcaaagc gatttccgat acgatttgcg ttattcgcga cggacagcac 660

attggtacgc gtgatgctgc cggaatgagt gaagacgata ttatcaccat gatggtcggg 720

cgagagttaa ccgcgcttta ccctaatgaa ccacatacca ccggagatga aatattacgt 780

attgaacatc tgacggcatg gcatccggtt aatcgtcata ttaaacgagt taatgatgtc 840

tcgttttccc tgaaacgtgg cgaaatattg ggtattgccg gactcgttgg tgccggacgt 900

accgagacca ttcagtgcct gtttggtgtg tggcccggac aatgggaagg aaaaatttat 960

attgatggca aacaggtaga tattcgtaac tgtcagcaag ccatcgccca ggggattgcg 1020

atggtccccg aagacagaaa gcgcgacggc atcgttccgg taatggcggt tggtaaaaat 1080

attaccctcg ccgcactcaa taaatttacc ggtggcatta gccagcttga tgacgcggca 1140

gagcaaaaat gtattctgga atcaatccag caactcaaag ttaaaacgtc gtcccccgac 1200

cttgctattg gacgtttgag cggcggcaat cagcaaaaag cgatcctcgc tcgctgtctg 1260

ttacttaacc cgcgcattct cattcttgat gaacccacca ggggtatcga tattggcgcg 1320

aaatacgaga tctacaaatt aattaaccaa ctcgtccagc agggtattgc cgttattgtc 1380

atctcttccg aattacctga agtgctcggc cttagcgatc gtgtactggt gatgcatgaa 1440

gggaaactaa aagccaacct gataaatcat aacctgactc aggagcaggt gatggaagcc 1500

gcattgagga gcgaacatca tgtcgaaaag caatccgtct ga 1542

<210> 28

<211> 1182

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 28

atgtcgaaaa gcaatccgtc tgaagtgaaa ttggccgtac cgacatccgg tggcttctcc 60

gggctgaaat cactgaattt gcaggtcttc gtgatgattg cagctatcat cgcaatcatg 120

ctgttcttta cctggaccac cgatggtgcc tacttaagcg cccgtaacgt ctccaacctg 180

ttacgccaga ccgcgattac cggcatcctc gcggtaggaa tggtgttcgt cataatttct 240

gctgaaatcg acctttccgt cggctcaatg atggggctgt taggtggcgt cgcggcgatt 300

tgtgacgtct ggttaggctg gcctttgcca cttaccatca ttgtgacgct ggttctggga 360

ctgcttctcg gtgcctggaa cggatggtgg gtcgcgtacc gtaaagtccc ttcatttatt 420

gtcaccctcg cgggcatgtt ggcatttcgc ggcatactca ttggcatcac caacggcacg 480

actgtatccc ccaccagcgc cgcgatgtca caaattgggc aaagctatct ccccgccagt 540

accggcttca tcattggcgc gcttggctta atggcttttg ttggttggca atggcgcgga 600

agaatgcgcc gtcaggcttt gggtttacag tctccggcct ctaccgcagt agtcggtcgc 660

caggctttaa ccgctatcat cgtattaggc gcaatctggc tgttgaatga ttaccgtggc 720

gttcccactc ctgttctgct gctgacgttg ctgttactcg gcggaatgtt tatggcaacg 780

cggacggcat ttggacgacg catttatgcc atcggcggca atctggaagc agcacgtctc 840

tccgggatta acgttgaacg caccaaactt gccgtgttcg cgattaacgg attaatggta 900

gccatcgccg gattaatcct tagttctcga cttggcgctg gttcaccttc tgcgggaaat 960

atcgccgaac tggacgcaat tgcagcatgc gtgattggcg gcaccagcct ggctggcggt 1020

gtgggaagcg ttgccggagc agtaatgggg gcatttatca tggcttcact ggataacggc 1080

atgagtatga tggatgtacc gaccttctgg cagtatatcg ttaaaggtgc gattctgttg 1140

ctggcagtat ggatggactc cgcaaccaaa cgccgttctt ga 1182

<210> 29

<211> 330

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 29

Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu

1 5 10 15

Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile

20 25 30

Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val

35 40 45

Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn

50 55 60

Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg

65 70 75 80

Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser

85 90 95

Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr

100 105 110

Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp

115 120 125

Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val

130 135 140

Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn

145 150 155 160

Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val

165 170 175

Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp

180 185 190

Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn

195 200 205

Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly

210 215 220

Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala

225 230 235 240

Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala

245 250 255

Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn

260 265 270

Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys

275 280 285

Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu

290 295 300

Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile

305 310 315 320

Lys Asp Gly Phe His Lys Glu Ser Glu Leu

325 330

<210> 30

<211> 513

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 30

Met Pro Tyr Leu Leu Glu Met Lys Asn Ile Thr Lys Thr Phe Gly Ser

1 5 10 15

Val Lys Ala Ile Asp Asn Val Cys Leu Arg Leu Asn Ala Gly Glu Ile

20 25 30

Val Ser Leu Cys Gly Glu Asn Gly Ser Gly Lys Ser Thr Leu Met Lys

35 40 45

Val Leu Cys Gly Ile Tyr Pro His Gly Ser Tyr Glu Gly Glu Ile Ile

50 55 60

Phe Ala Gly Glu Glu Ile Gln Ala Ser His Ile Arg Asp Thr Glu Arg

65 70 75 80

Lys Gly Ile Ala Ile Ile His Gln Glu Leu Ala Leu Val Lys Glu Leu

85 90 95

Thr Val Leu Glu Asn Ile Phe Leu Gly Asn Glu Ile Thr His Asn Gly

100 105 110

Ile Met Asp Tyr Asp Leu Met Thr Leu Arg Cys Gln Lys Leu Leu Ala

115 120 125

Gln Val Ser Leu Ser Ile Ser Pro Asp Thr Arg Val Gly Asp Leu Gly

130 135 140

Leu Gly Gln Gln Gln Leu Val Glu Ile Ala Lys Ala Leu Asn Lys Gln

145 150 155 160

Val Arg Leu Leu Ile Leu Asp Glu Pro Thr Ala Ser Leu Thr Glu Gln

165 170 175

Glu Thr Ser Ile Leu Leu Asp Ile Ile Arg Asp Leu Gln Gln His Gly

180 185 190

Ile Ala Cys Ile Tyr Ile Ser His Lys Leu Asn Glu Val Lys Ala Ile

195 200 205

Ser Asp Thr Ile Cys Val Ile Arg Asp Gly Gln His Ile Gly Thr Arg

210 215 220

Asp Ala Ala Gly Met Ser Glu Asp Asp Ile Ile Thr Met Met Val Gly

225 230 235 240

Arg Glu Leu Thr Ala Leu Tyr Pro Asn Glu Pro His Thr Thr Gly Asp

245 250 255

Glu Ile Leu Arg Ile Glu His Leu Thr Ala Trp His Pro Val Asn Arg

260 265 270

His Ile Lys Arg Val Asn Asp Val Ser Phe Ser Leu Lys Arg Gly Glu

275 280 285

Ile Leu Gly Ile Ala Gly Leu Val Gly Ala Gly Arg Thr Glu Thr Ile

290 295 300

Gln Cys Leu Phe Gly Val Trp Pro Gly Gln Trp Glu Gly Lys Ile Tyr

305 310 315 320

Ile Asp Gly Lys Gln Val Asp Ile Arg Asn Cys Gln Gln Ala Ile Ala

325 330 335

Gln Gly Ile Ala Met Val Pro Glu Asp Arg Lys Arg Asp Gly Ile Val

340 345 350

Pro Val Met Ala Val Gly Lys Asn Ile Thr Leu Ala Ala Leu Asn Lys

355 360 365

Phe Thr Gly Gly Ile Ser Gln Leu Asp Asp Ala Ala Glu Gln Lys Cys

370 375 380

Ile Leu Glu Ser Ile Gln Gln Leu Lys Val Lys Thr Ser Ser Pro Asp

385 390 395 400

Leu Ala Ile Gly Arg Leu Ser Gly Gly Asn Gln Gln Lys Ala Ile Leu

405 410 415

Ala Arg Cys Leu Leu Leu Asn Pro Arg Ile Leu Ile Leu Asp Glu Pro

420 425 430

Thr Arg Gly Ile Asp Ile Gly Ala Lys Tyr Glu Ile Tyr Lys Leu Ile

435 440 445

Asn Gln Leu Val Gln Gln Gly Ile Ala Val Ile Val Ile Ser Ser Glu

450 455 460

Leu Pro Glu Val Leu Gly Leu Ser Asp Arg Val Leu Val Met His Glu

465 470 475 480

Gly Lys Leu Lys Ala Asn Leu Ile Asn His Asn Leu Thr Gln Glu Gln

485 490 495

Val Met Glu Ala Ala Leu Arg Ser Glu His His Val Glu Lys Gln Ser

500 505 510

Val

<210> 31

<211> 330

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 31

Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu

1 5 10 15

Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile

20 25 30

Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val

35 40 45

Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn

50 55 60

Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg

65 70 75 80

Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser

85 90 95

Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr

100 105 110

Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp

115 120 125

Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val

130 135 140

Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn

145 150 155 160

Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val

165 170 175

Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp

180 185 190

Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn

195 200 205

Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly

210 215 220

Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala

225 230 235 240

Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala

245 250 255

Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn

260 265 270

Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys

275 280 285

Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu

290 295 300

Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile

305 310 315 320

Lys Asp Gly Phe His Lys Glu Ser Glu Leu

325 330

<210> 32

<211> 879

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 32

atggctgaag cgcaaaatga tcccctgctg ccgggatact cgtttaacgc ccatctggtg 60

gcgggtttaa cgccgattga ggccaacggt tatctcgatt tttttatcga ccgaccgctg 120

ggaatgaaag gttatattct caatctcacc attcgcggtc agggggtggt gaaaaatcag 180

ggacgagaat ttgtctgccg accgggtgat attttgctgt tcccgccagg agagattcat 240

cactacggtc gtcatccgga ggctcgcgaa tggtatcacc agtgggttta ctttcgtccg 300

cgcgcctact ggcatgaatg gcttaactgg ccgtcaatat ttgccaatac gggtttcttt 360

cgcccggatg aagcgcacca gccgcatttc agcgacctgt ttgggcaaat cattaacgcc 420

gggcaagggg aagggcgcta ttcggagctg ctggcgataa atctgcttga gcaattgtta 480

ctgcggcgca tggaagcgat taacgagtcg ctccatccac cgatggataa tcgggtacgc 540

gaggcttgtc agtacatcag cgatcacctg gcagacagca attttgatat cgccagcgtc 600

gcacagcatg tttgcttgtc gccgtcgcgt ctgtcacatc ttttccgcca gcagttaggg 660

attagcgtct taagctggcg cgaggaccaa cgcattagtc aggcgaagct gcttttgagc 720

actacccgga tgcctatcgc caccgtcggt cgcaatgttg gttttgacga tcaactctat 780

ttctcgcgag tatttaaaaa atgcaccggg gccagcccga gcgagtttcg tgccggttgt 840

gaagaaaaag tgaatgatgt agccgtcaag ttgtcataa 879

<210> 33

<211> 292

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 33

Met Ala Glu Ala Gln Asn Asp Pro Leu Leu Pro Gly Tyr Ser Phe Asn

1 5 10 15

Ala His Leu Val Ala Gly Leu Thr Pro Ile Glu Ala Asn Gly Tyr Leu

20 25 30

Asp Phe Phe Ile Asp Arg Pro Leu Gly Met Lys Gly Tyr Ile Leu Asn

35 40 45

Leu Thr Ile Arg Gly Gln Gly Val Val Lys Asn Gln Gly Arg Glu Phe

50 55 60

Val Cys Arg Pro Gly Asp Ile Leu Leu Phe Pro Pro Gly Glu Ile His

65 70 75 80

His Tyr Gly Arg His Pro Glu Ala Arg Glu Trp Tyr His Gln Trp Val

85 90 95

Tyr Phe Arg Pro Arg Ala Tyr Trp His Glu Trp Leu Asn Trp Pro Ser

100 105 110

Ile Phe Ala Asn Thr Gly Phe Phe Arg Pro Asp Glu Ala His Gln Pro

115 120 125

His Phe Ser Asp Leu Phe Gly Gln Ile Ile Asn Ala Gly Gln Gly Glu

130 135 140

Gly Arg Tyr Ser Glu Leu Leu Ala Ile Asn Leu Leu Glu Gln Leu Leu

145 150 155 160

Leu Arg Arg Met Glu Ala Ile Asn Glu Ser Leu His Pro Pro Met Asp

165 170 175

Asn Arg Val Arg Glu Ala Cys Gln Tyr Ile Ser Asp His Leu Ala Asp

180 185 190

Ser Asn Phe Asp Ile Ala Ser Val Ala Gln His Val Cys Leu Ser Pro

195 200 205

Ser Arg Leu Ser His Leu Phe Arg Gln Gln Leu Gly Ile Ser Val Leu

210 215 220

Ser Trp Arg Glu Asp Gln Arg Ile Ser Gln Ala Lys Leu Leu Leu Ser

225 230 235 240

Thr Thr Arg Met Pro Ile Ala Thr Val Gly Arg Asn Val Gly Phe Asp

245 250 255

Asp Gln Leu Tyr Phe Ser Arg Val Phe Lys Lys Cys Thr Gly Ala Ser

260 265 270

Pro Ser Glu Phe Arg Ala Gly Cys Glu Glu Lys Val Asn Asp Val Ala

275 280 285

Val Lys Leu Ser

290

<210> 34

<211> 1506

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 34

atggaagcat tacttcagct taaaggcatc gataaagcct tcccgggcgt aaaagccctc 60

tcgggcgcag cgttaaatgt ctatccgggc cgcgtgatgg cgctggtggg cgaaaacggc 120

gcgggtaaat ccaccatgat gaaagtgctt actggcatct atactcgcga tgccggtacg 180

cttttatggc tggggaaaga aacgacattt accgggccaa aatcttccca ggaagccggg 240

attgggatta tccatcagga actgaacctg atcccgcagt tgaccattgc cgaaaacatt 300

ttcctcggtc gtgagtttgt taatcgcttt ggcaaaattg actggaaaac catgtatgcc 360

gaagcggata aattgctggc taaacttaac ctgcgcttta aaagcgacaa gctggtgggc 420

gatctttcca tcggtgacca gcaaatggtt gaaatcgcca aagtgctgag ctttgagtcg 480

aaagtcatca ttatggatga accgaccgat gcgctgaccg ataccgaaac cgaatccctg 540

ttccgcgtca tccgcgagct gaaatcgcaa ggccgcggta ttgtctatat ctcccaccgc 600

atgaaagaaa tcttcgagat ttgcgatgac gttaccgttt ttcgtgatgg gcaatttatt 660

gctgagcgcg aagtggcatc actgaccgaa gattcgctga ttgagatgat ggtgggtcgc 720

aagctggaag atcaatatcc gcacctggac aaagcgccgg gagatatccg cctgaaagtc 780

gataatctct gcggacctgg cgttaacgat gtctctttta ctttacgcaa aggcgaaatt 840

cttggcgtct ctggtttgat gggcgcaggt cgtaccgaac tgatgaaagt gctctacggc 900

gcactaccgc gcaccagcgg ttacgtcacc ctggatgggc atgaagtcgt tacccgttca 960

ccgcaggatg gcctggcaaa cggcattgtg tatatctccg aagaccgtaa acgtgacggt 1020

ttagtgttgg gcatgtcagt aaaagagaac atgtcgctga cagcgctgcg ctacttcagc 1080

cgcgctggcg gcagtttgaa gcatgccgat gaacagcagg ctgtgagtga tttcattcgt 1140

ctgtttaatg tgaaaactcc gtcgatggaa caggcaattg gtctgctttc cggtggcaat 1200

cagcaaaaag tggcgattgc ccgcggtctg atgacacgcc ccaaagtgtt gatccttgat 1260

gaacctaccc gtggcgtaga tgtcggcgcg aaaaaagaga tctatcaact gattaaccag 1320

ttcaaagccg atggcttgag catcattctg gtgtcatcgg agatgccaga agtattaggc 1380

atgagcgatc gcatcatcgt catgcatgaa gggcatctca gcggggaatt tactcgtgag 1440

caggccaccc aggaagtgtt aatggctgcc gctgtgggca agcttaatcg cgtgaatcag 1500

gagtaa 1506

<210> 35

<211> 891

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 35

atgaacatga aaaaactggc taccctggtt tccgctgttg cgctaagcgc caccgtcagt 60

gcgaatgcga tggcaaaaga caccatcgcg ctggtggtct ccacgcttaa caacccgttc 120

tttgtatcgc tgaaagatgg cgcgcagaaa gaggcggata aacttggcta taacctggtg 180

gtgctggact cccagaacaa cccggcgaaa gagctggcga acgtgcagga cttaaccgtt 240

cgcggcacaa aaattctgct gattaacccg accgactccg acgcagtggg taatgctgtg 300

aagatggcta accaggcgaa catcccggtt atcactcttg accgccaggc aacgaaaggt 360

gaagtggtga gccacattgc ttctgataac gtactgggcg gcaaaatcgc tggtgattac 420

atcgcgaaga aagcgggtga aggtgccaaa gttatcgagc tgcaaggcat tgctggtaca 480

tccgcagccc gtgaacgtgg cgaaggcttc cagcaggccg ttgctgctca caagtttaat 540

gttcttgcca gccagccagc agattttgat cgcattaaag gtttgaacgt aatgcagaac 600

ctgttgaccg ctcatccgga tgttcaggct gtattcgcgc agaatgatga aatggcgctg 660

ggcgcgctgc gcgcactgca aactgccggt aaatcggatg tgatggtcgt cggatttgac 720

ggtacaccgg atggcgaaaa agcggtgaat gatggcaaac tagcagcgac tatcgctcag 780

ctacccgatc agattggcgc gaaaggcgtc gaaaccgcag ataaagtgct gaaaggcgag 840

aaagttcagg ctaagtatcc ggttgatctg aaactggttg ttaagcagta g 891

<210> 36

<211> 966

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 36

atgacaaccc agactgtctc tggtcgccgt tatttcacga aagcgtggct gatggagcag 60

aaatcgctta tcgctctgct ggtgctgatc gcgattgtct cgacgttaag cccgaacttt 120

ttcaccatca ataacttatt caatattctc cagcaaacct cagtgaacgc cattatggcg 180

gtcgggatga cgctggtgat cctgacgtcg ggcatcgact tatcggtagg ttctctgttg 240

gcgctgaccg gcgcagttgc tgcatctatc gtcggcattg aagtcaatgc gctggtggct 300

gtcgctgctg ctctcgcgtt aggtgccgca attggtgcgg taaccggggt gattgtagcg 360

aaaggtcgcg tccaggcgtt tatcgctacg ctggttatga tgcttttact gcgcggcgtg 420

accatggttt ataccaacgg tagcccagtg aataccggct ttactgagaa cgccgatctg 480

tttggctggt ttggtattgg tcgtccgctg ggcgtaccga cgccagtctg gatcatgggg 540

attgtcttcc tcgcggcctg gtacatgctg catcacacgc gtctggggcg ttacatctac 600

gcgctgggcg gcaacgaagc ggcaacgcgt ctttctggta tcaacgtcaa taaaatcaaa 660

atcatcgtct attctctttg tggtctgctg gcatcgctgg ccgggatcat tgaagtggcg 720

cgtctctcct ccgcacaacc cacggcgggg actggctatg agctggatgc tattgctgcg 780

gtggttctgg gcggtacgag tctggcgggc ggaaaaggtc gcattgttgg gacgttgatc 840

ggcgcattaa ttcttggctt ccttaataat ggattgaatt tgttaggtgt ttcctcctat 900

taccagatga tcgtcaaagc ggtggtgatt ttgctggcgg tgctggtaga caacaaaaag 960

cagtaa 966

<210> 37

<211> 501

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 37

Met Glu Ala Leu Leu Gln Leu Lys Gly Ile Asp Lys Ala Phe Pro Gly

1 5 10 15

Val Lys Ala Leu Ser Gly Ala Ala Leu Asn Val Tyr Pro Gly Arg Val

20 25 30

Met Ala Leu Val Gly Glu Asn Gly Ala Gly Lys Ser Thr Met Met Lys

35 40 45

Val Leu Thr Gly Ile Tyr Thr Arg Asp Ala Gly Thr Leu Leu Trp Leu

50 55 60

Gly Lys Glu Thr Thr Phe Thr Gly Pro Lys Ser Ser Gln Glu Ala Gly

65 70 75 80

Ile Gly Ile Ile His Gln Glu Leu Asn Leu Ile Pro Gln Leu Thr Ile

85 90 95

Ala Glu Asn Ile Phe Leu Gly Arg Glu Phe Val Asn Arg Phe Gly Lys

100 105 110

Ile Asp Trp Lys Thr Met Tyr Ala Glu Ala Asp Lys Leu Leu Ala Lys

115 120 125

Leu Asn Leu Arg Phe Lys Ser Asp Lys Leu Val Gly Asp Leu Ser Ile

130 135 140

Gly Asp Gln Gln Met Val Glu Ile Ala Lys Val Leu Ser Phe Glu Ser

145 150 155 160

Lys Val Ile Ile Met Asp Glu Pro Thr Asp Ala Leu Thr Asp Thr Glu

165 170 175

Thr Glu Ser Leu Phe Arg Val Ile Arg Glu Leu Lys Ser Gln Gly Arg

180 185 190

Gly Ile Val Tyr Ile Ser His Arg Met Lys Glu Ile Phe Glu Ile Cys

195 200 205

Asp Asp Val Thr Val Phe Arg Asp Gly Gln Phe Ile Ala Glu Arg Glu

210 215 220

Val Ala Ser Leu Thr Glu Asp Ser Leu Ile Glu Met Met Val Gly Arg

225 230 235 240

Lys Leu Glu Asp Gln Tyr Pro His Leu Asp Lys Ala Pro Gly Asp Ile

245 250 255

Arg Leu Lys Val Asp Asn Leu Cys Gly Pro Gly Val Asn Asp Val Ser

260 265 270

Phe Thr Leu Arg Lys Gly Glu Ile Leu Gly Val Ser Gly Leu Met Gly

275 280 285

Ala Gly Arg Thr Glu Leu Met Lys Val Leu Tyr Gly Ala Leu Pro Arg

290 295 300

Thr Ser Gly Tyr Val Thr Leu Asp Gly His Glu Val Val Thr Arg Ser

305 310 315 320

Pro Gln Asp Gly Leu Ala Asn Gly Ile Val Tyr Ile Ser Glu Asp Arg

325 330 335

Lys Arg Asp Gly Leu Val Leu Gly Met Ser Val Lys Glu Asn Met Ser

340 345 350

Leu Thr Ala Leu Arg Tyr Phe Ser Arg Ala Gly Gly Ser Leu Lys His

355 360 365

Ala Asp Glu Gln Gln Ala Val Ser Asp Phe Ile Arg Leu Phe Asn Val

370 375 380

Lys Thr Pro Ser Met Glu Gln Ala Ile Gly Leu Leu Ser Gly Gly Asn

385 390 395 400

Gln Gln Lys Val Ala Ile Ala Arg Gly Leu Met Thr Arg Pro Lys Val

405 410 415

Leu Ile Leu Asp Glu Pro Thr Arg Gly Val Asp Val Gly Ala Lys Lys

420 425 430

Glu Ile Tyr Gln Leu Ile Asn Gln Phe Lys Ala Asp Gly Leu Ser Ile

435 440 445

Ile Leu Val Ser Ser Glu Met Pro Glu Val Leu Gly Met Ser Asp Arg

450 455 460

Ile Ile Val Met His Glu Gly His Leu Ser Gly Glu Phe Thr Arg Glu

465 470 475 480

Gln Ala Thr Gln Glu Val Leu Met Ala Ala Ala Val Gly Lys Leu Asn

485 490 495

Arg Val Asn Gln Glu

500

<210> 38

<211> 296

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 38

Met Asn Met Lys Lys Leu Ala Thr Leu Val Ser Ala Val Ala Leu Ser

1 5 10 15

Ala Thr Val Ser Ala Asn Ala Met Ala Lys Asp Thr Ile Ala Leu Val

20 25 30

Val Ser Thr Leu Asn Asn Pro Phe Phe Val Ser Leu Lys Asp Gly Ala

35 40 45

Gln Lys Glu Ala Asp Lys Leu Gly Tyr Asn Leu Val Val Leu Asp Ser

50 55 60

Gln Asn Asn Pro Ala Lys Glu Leu Ala Asn Val Gln Asp Leu Thr Val

65 70 75 80

Arg Gly Thr Lys Ile Leu Leu Ile Asn Pro Thr Asp Ser Asp Ala Val

85 90 95

Gly Asn Ala Val Lys Met Ala Asn Gln Ala Asn Ile Pro Val Ile Thr

100 105 110

Leu Asp Arg Gln Ala Thr Lys Gly Glu Val Val Ser His Ile Ala Ser

115 120 125

Asp Asn Val Leu Gly Gly Lys Ile Ala Gly Asp Tyr Ile Ala Lys Lys

130 135 140

Ala Gly Glu Gly Ala Lys Val Ile Glu Leu Gln Gly Ile Ala Gly Thr

145 150 155 160

Ser Ala Ala Arg Glu Arg Gly Glu Gly Phe Gln Gln Ala Val Ala Ala

165 170 175

His Lys Phe Asn Val Leu Ala Ser Gln Pro Ala Asp Phe Asp Arg Ile

180 185 190

Lys Gly Leu Asn Val Met Gln Asn Leu Leu Thr Ala His Pro Asp Val

195 200 205

Gln Ala Val Phe Ala Gln Asn Asp Glu Met Ala Leu Gly Ala Leu Arg

210 215 220

Ala Leu Gln Thr Ala Gly Lys Ser Asp Val Met Val Val Gly Phe Asp

225 230 235 240

Gly Thr Pro Asp Gly Glu Lys Ala Val Asn Asp Gly Lys Leu Ala Ala

245 250 255

Thr Ile Ala Gln Leu Pro Asp Gln Ile Gly Ala Lys Gly Val Glu Thr

260 265 270

Ala Asp Lys Val Leu Lys Gly Glu Lys Val Gln Ala Lys Tyr Pro Val

275 280 285

Asp Leu Lys Leu Val Val Lys Gln

290 295

<210> 39

<211> 321

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 39

Met Thr Thr Gln Thr Val Ser Gly Arg Arg Tyr Phe Thr Lys Ala Trp

1 5 10 15

Leu Met Glu Gln Lys Ser Leu Ile Ala Leu Leu Val Leu Ile Ala Ile

20 25 30

Val Ser Thr Leu Ser Pro Asn Phe Phe Thr Ile Asn Asn Leu Phe Asn

35 40 45

Ile Leu Gln Gln Thr Ser Val Asn Ala Ile Met Ala Val Gly Met Thr

50 55 60

Leu Val Ile Leu Thr Ser Gly Ile Asp Leu Ser Val Gly Ser Leu Leu

65 70 75 80

Ala Leu Thr Gly Ala Val Ala Ala Ser Ile Val Gly Ile Glu Val Asn

85 90 95

Ala Leu Val Ala Val Ala Ala Ala Leu Ala Leu Gly Ala Ala Ile Gly

100 105 110

Ala Val Thr Gly Val Ile Val Ala Lys Gly Arg Val Gln Ala Phe Ile

115 120 125

Ala Thr Leu Val Met Met Leu Leu Leu Arg Gly Val Thr Met Val Tyr

130 135 140

Thr Asn Gly Ser Pro Val Asn Thr Gly Phe Thr Glu Asn Ala Asp Leu

145 150 155 160

Phe Gly Trp Phe Gly Ile Gly Arg Pro Leu Gly Val Pro Thr Pro Val

165 170 175

Trp Ile Met Gly Ile Val Phe Leu Ala Ala Trp Tyr Met Leu His His

180 185 190

Thr Arg Leu Gly Arg Tyr Ile Tyr Ala Leu Gly Gly Asn Glu Ala Ala

195 200 205

Thr Arg Leu Ser Gly Ile Asn Val Asn Lys Ile Lys Ile Ile Val Tyr

210 215 220

Ser Leu Cys Gly Leu Leu Ala Ser Leu Ala Gly Ile Ile Glu Val Ala

225 230 235 240

Arg Leu Ser Ser Ala Gln Pro Thr Ala Gly Thr Gly Tyr Glu Leu Asp

245 250 255

Ala Ile Ala Ala Val Val Leu Gly Gly Thr Ser Leu Ala Gly Gly Lys

260 265 270

Gly Arg Ile Val Gly Thr Leu Ile Gly Ala Leu Ile Leu Gly Phe Leu

275 280 285

Asn Asn Gly Leu Asn Leu Leu Gly Val Ser Ser Tyr Tyr Gln Met Ile

290 295 300

Val Lys Ala Val Val Ile Leu Leu Ala Val Leu Val Asp Asn Lys Lys

305 310 315 320

Gln

<210> 40

<211> 1533

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 40

atggccacgc catatatatc gatggcgggg atcggcaagt cctttggtcc ggttcacgca 60

ttaaagtcgg ttaatttaac ggtttatcct ggtgaaatac atgcattact aggagaaaat 120

ggcgcgggta aatccacgct aatgaaagtt ttatccggaa tacatgagcc gaccaaaggc 180

accattacca ttaataacat tagctataac aagctggatc ataaattagc ggcacaactc 240

ggtatcggga ttatttatca ggaactcagc gttattgatg aattaaccgt actggaaaat 300

ttatatattg gtcgtcatct gacgaaaaaa atctgtggcg tcaatattat cgactggcga 360

gaaatgcgtg tccgcgccgc catgatgtta ttacgcgtgg gcttgaaagt tgatctagat 420

gagaaagtgg cgaatttatc tatcagccac aagcagatgc tagaaattgc caaaacgctg 480

atgctcgatg ccaaagtcat catcatggat gaacccacct cctcactcac caataaagag 540

gtggactatc tgtttctgat catgaatcag ttgcgtaaag agggtacggc catcgtctat 600

atctcgcata agttggcgga aattcgccgt atttgcgacc gctatacggt gatgaaagac 660

ggcagcagcg tttgcagcgg catagtaagc gatgtgtcaa atgacgatat cgtccgtctg 720

atggtaggcc gcgaactgca aaaccgtttt aacgcgatga aggagaatgt cagcaacctt 780

gcgcacgaaa cggtttttga ggtgcggaac gtcaccagtc gtgacagaaa aaaggtccgg 840

gatatctcat ttagcgtctg ccggggagaa atattaggct ttgccggact ggtcggttcc 900

ggacgtactg aactgatgaa ttgtctgttt ggcgtggata aacgcgctgg cggagaaatc 960

cgtcttaatg gcaaagatat ctctccacgt tcacccctgg atgccgtgaa aaaagggatg 1020

gcttacatca ctgaaagccg ccgggataac ggttttttcc ccaacttttc catcgctcag 1080

aacatggcga tcagccgcag tctgaaagac ggcggctata aaggcgcgat gggcttgttt 1140

catgaagttg acgagcaacg taccgctgaa aatcaacgcg aactgctggc gctgaaatgt 1200

cattcggtaa accagaatat caccgaactc tccgggggaa atcagcagaa agtcctgatc 1260

tccaaatggc tgtgctgttg cccggaagtg attattttcg atgaacctac ccgcggcatc 1320

gacgttggcg cgaaagccga aatttacaaa gtgatgcgcc aactggcgga cgacggaaaa 1380

gtcatcctga tggtgtcatc tgaactacct gaaattatca ccgtctgcga ccgcatcgcc 1440

gtgttctgcg aaggacgact gacgcaaatc ctgacgaatc gcgatgacat gagcgaagag 1500

gagattatgg catgggcttt accacaagag taa 1533

<210> 41

<211> 936

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 41

atgaataaat atctgaaata tttcagcggc acactcgtgg gcttaatgtt gtcaaccagc 60

gcttttgctg ccgccgaata tgctgtcgta ttgaaaaccc tctccaaccc attttgggta 120

gatatgaaaa aaggcattga agatgaagca aaaacactgg gcgtcagcgt tgatattttt 180

gcctctcctt cagaaggcga ttttcaatct caattgcagt tatttgaaga tctcagtaat 240

aaaaattaca aaggtatcgc cttcgctcca ttatcctcag tgaatctggt catgcctgtc 300

gcccgcgcat ggaaaaaagg catttatctg gttaatctcg atgaaaaaat cgacatggat 360

aatctgaaaa aagctggcgg caatgtggaa gcttttgtca ccaccgataa cgttgctgtc 420

ggggcgaaag gcgcgtcgtt cattattgac aaattgggcg ctgaaggtgg tgaagtcgca 480

atcattgagg gtaaagccgg taacgcctcc ggtgaagcgc gtcgtaatgg tgccaccgaa 540

gccttcaaaa aagcaagcca gatcaagctt gtcgccagcc agcctgccga ctgggaccgc 600

attaaagcac tggatgtcgc cactaacgtg ttgcaacgta atccgaatat taaagcgatc 660

tattgcgcga atgacacgat ggcaatgggt gttgctcagg cagtcgcaaa cgccggaaaa 720

acgggaaaag tgctggtcgt cggtacagat ggcattccgg aagcccgcaa aatggtggaa 780

gccggacaaa tgaccgcgac ggttgcccag aacccggcgg atatcggcgc aacgggtctg 840

aagctgatgg ttgacgctga gaaatccggc aaggttatcc cgctggataa agcaccggaa 900

tttaaactgg tcgattcaat cctggtcact caataa 936

<210> 42

<211> 981

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 42

atgggcttta ccacaagagt aaaaagcgaa gcgagcgaga agaaaccgtt caactttgcg 60

ctgttctggg ataaatacgg cacctttttt atcctggcga tcatcgtcgc catctttggt 120

tcgctgtcac cagaatattt tctgaccacc aataatatta cccagatttt tgttcaaagc 180

tccgtgacgg tattgatcgg catgggcgag tttttcgcta tcctggtcgc tggtatcgac 240

ctctcggttg gcgcgattct ggcgctttcc ggtatggtga ccgccaaact gatgttggca 300

ggtgttgacc cgtttctcgc agcgatgatt ggcggtgtac tggttggcgg cgcactgggg 360

gcgatcaacg gctgcctggt caactggacg gggctacacc cgttcatcat cacccttggc 420

accaacgcga ttttccgtgg gatcacgctg gtgatctccg atgccaactc ggtatacggc 480

ttctcatttg acttcgtgaa cttctttgcc gccagcgtaa ttgggatacc tgtccccgtt 540

atcttctcac taattgtcgc gctcatcctt tggtttctga caacgcgtat gcggctcggg 600

cgcaacatct acgcactggg cggcaacaaa aattcggcgt tctattccgg gattgacgtg 660

aaattccaca tcctggtggt gtttatcatc tccggtgttt gtgcaggtct ggcaggcgtc 720

gtctcaactg cacgactcgg tgccgcagaa ccgcttgccg gtatgggttt tgaaacctat 780

gccattgcca gcgccatcat tggcggcacc agtttcttcg gcggcaaggg gcgcattttc 840

tctgtggtga ttggcgggtt gatcatcggc accatcaaca acggtctgaa tattttgcag 900

gtacaaacct attaccaact ggtggtgatg ggcggattaa ttatcgcggc tgtcgccctt 960

gaccgtctta tcagtaagta a 981

<210> 43

<211> 510

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 43

Met Ala Thr Pro Tyr Ile Ser Met Ala Gly Ile Gly Lys Ser Phe Gly

1 5 10 15

Pro Val His Ala Leu Lys Ser Val Asn Leu Thr Val Tyr Pro Gly Glu

20 25 30

Ile His Ala Leu Leu Gly Glu Asn Gly Ala Gly Lys Ser Thr Leu Met

35 40 45

Lys Val Leu Ser Gly Ile His Glu Pro Thr Lys Gly Thr Ile Thr Ile

50 55 60

Asn Asn Ile Ser Tyr Asn Lys Leu Asp His Lys Leu Ala Ala Gln Leu

65 70 75 80

Gly Ile Gly Ile Ile Tyr Gln Glu Leu Ser Val Ile Asp Glu Leu Thr

85 90 95

Val Leu Glu Asn Leu Tyr Ile Gly Arg His Leu Thr Lys Lys Ile Cys

100 105 110

Gly Val Asn Ile Ile Asp Trp Arg Glu Met Arg Val Arg Ala Ala Met

115 120 125

Met Leu Leu Arg Val Gly Leu Lys Val Asp Leu Asp Glu Lys Val Ala

130 135 140

Asn Leu Ser Ile Ser His Lys Gln Met Leu Glu Ile Ala Lys Thr Leu

145 150 155 160

Met Leu Asp Ala Lys Val Ile Ile Met Asp Glu Pro Thr Ser Ser Leu

165 170 175

Thr Asn Lys Glu Val Asp Tyr Leu Phe Leu Ile Met Asn Gln Leu Arg

180 185 190

Lys Glu Gly Thr Ala Ile Val Tyr Ile Ser His Lys Leu Ala Glu Ile

195 200 205

Arg Arg Ile Cys Asp Arg Tyr Thr Val Met Lys Asp Gly Ser Ser Val

210 215 220

Cys Ser Gly Ile Val Ser Asp Val Ser Asn Asp Asp Ile Val Arg Leu

225 230 235 240

Met Val Gly Arg Glu Leu Gln Asn Arg Phe Asn Ala Met Lys Glu Asn

245 250 255

Val Ser Asn Leu Ala His Glu Thr Val Phe Glu Val Arg Asn Val Thr

260 265 270

Ser Arg Asp Arg Lys Lys Val Arg Asp Ile Ser Phe Ser Val Cys Arg

275 280 285

Gly Glu Ile Leu Gly Phe Ala Gly Leu Val Gly Ser Gly Arg Thr Glu

290 295 300

Leu Met Asn Cys Leu Phe Gly Val Asp Lys Arg Ala Gly Gly Glu Ile

305 310 315 320

Arg Leu Asn Gly Lys Asp Ile Ser Pro Arg Ser Pro Leu Asp Ala Val

325 330 335

Lys Lys Gly Met Ala Tyr Ile Thr Glu Ser Arg Arg Asp Asn Gly Phe

340 345 350

Phe Pro Asn Phe Ser Ile Ala Gln Asn Met Ala Ile Ser Arg Ser Leu

355 360 365

Lys Asp Gly Gly Tyr Lys Gly Ala Met Gly Leu Phe His Glu Val Asp

370 375 380

Glu Gln Arg Thr Ala Glu Asn Gln Arg Glu Leu Leu Ala Leu Lys Cys

385 390 395 400

His Ser Val Asn Gln Asn Ile Thr Glu Leu Ser Gly Gly Asn Gln Gln

405 410 415

Lys Val Leu Ile Ser Lys Trp Leu Cys Cys Cys Pro Glu Val Ile Ile

420 425 430

Phe Asp Glu Pro Thr Arg Gly Ile Asp Val Gly Ala Lys Ala Glu Ile

435 440 445

Tyr Lys Val Met Arg Gln Leu Ala Asp Asp Gly Lys Val Ile Leu Met

450 455 460

Val Ser Ser Glu Leu Pro Glu Ile Ile Thr Val Cys Asp Arg Ile Ala

465 470 475 480

Val Phe Cys Glu Gly Arg Leu Thr Gln Ile Leu Thr Asn Arg Asp Asp

485 490 495

Met Ser Glu Glu Glu Ile Met Ala Trp Ala Leu Pro Gln Glu

500 505 510

<210> 44

<211> 311

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 44

Met Asn Lys Tyr Leu Lys Tyr Phe Ser Gly Thr Leu Val Gly Leu Met

1 5 10 15

Leu Ser Thr Ser Ala Phe Ala Ala Ala Glu Tyr Ala Val Val Leu Lys

20 25 30

Thr Leu Ser Asn Pro Phe Trp Val Asp Met Lys Lys Gly Ile Glu Asp

35 40 45

Glu Ala Lys Thr Leu Gly Val Ser Val Asp Ile Phe Ala Ser Pro Ser

50 55 60

Glu Gly Asp Phe Gln Ser Gln Leu Gln Leu Phe Glu Asp Leu Ser Asn

65 70 75 80

Lys Asn Tyr Lys Gly Ile Ala Phe Ala Pro Leu Ser Ser Val Asn Leu

85 90 95

Val Met Pro Val Ala Arg Ala Trp Lys Lys Gly Ile Tyr Leu Val Asn

100 105 110

Leu Asp Glu Lys Ile Asp Met Asp Asn Leu Lys Lys Ala Gly Gly Asn

115 120 125

Val Glu Ala Phe Val Thr Thr Asp Asn Val Ala Val Gly Ala Lys Gly

130 135 140

Ala Ser Phe Ile Ile Asp Lys Leu Gly Ala Glu Gly Gly Glu Val Ala

145 150 155 160

Ile Ile Glu Gly Lys Ala Gly Asn Ala Ser Gly Glu Ala Arg Arg Asn

165 170 175

Gly Ala Thr Glu Ala Phe Lys Lys Ala Ser Gln Ile Lys Leu Val Ala

180 185 190

Ser Gln Pro Ala Asp Trp Asp Arg Ile Lys Ala Leu Asp Val Ala Thr

195 200 205

Asn Val Leu Gln Arg Asn Pro Asn Ile Lys Ala Ile Tyr Cys Ala Asn

210 215 220

Asp Thr Met Ala Met Gly Val Ala Gln Ala Val Ala Asn Ala Gly Lys

225 230 235 240

Thr Gly Lys Val Leu Val Val Gly Thr Asp Gly Ile Pro Glu Ala Arg

245 250 255

Lys Met Val Glu Ala Gly Gln Met Thr Ala Thr Val Ala Gln Asn Pro

260 265 270

Ala Asp Ile Gly Ala Thr Gly Leu Lys Leu Met Val Asp Ala Glu Lys

275 280 285

Ser Gly Lys Val Ile Pro Leu Asp Lys Ala Pro Glu Phe Lys Leu Val

290 295 300

Asp Ser Ile Leu Val Thr Gln

305 310

<210> 45

<211> 326

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 45

Met Gly Phe Thr Thr Arg Val Lys Ser Glu Ala Ser Glu Lys Lys Pro

1 5 10 15

Phe Asn Phe Ala Leu Phe Trp Asp Lys Tyr Gly Thr Phe Phe Ile Leu

20 25 30

Ala Ile Ile Val Ala Ile Phe Gly Ser Leu Ser Pro Glu Tyr Phe Leu

35 40 45

Thr Thr Asn Asn Ile Thr Gln Ile Phe Val Gln Ser Ser Val Thr Val

50 55 60

Leu Ile Gly Met Gly Glu Phe Phe Ala Ile Leu Val Ala Gly Ile Asp

65 70 75 80

Leu Ser Val Gly Ala Ile Leu Ala Leu Ser Gly Met Val Thr Ala Lys

85 90 95

Leu Met Leu Ala Gly Val Asp Pro Phe Leu Ala Ala Met Ile Gly Gly

100 105 110

Val Leu Val Gly Gly Ala Leu Gly Ala Ile Asn Gly Cys Leu Val Asn

115 120 125

Trp Thr Gly Leu His Pro Phe Ile Ile Thr Leu Gly Thr Asn Ala Ile

130 135 140

Phe Arg Gly Ile Thr Leu Val Ile Ser Asp Ala Asn Ser Val Tyr Gly

145 150 155 160

Phe Ser Phe Asp Phe Val Asn Phe Phe Ala Ala Ser Val Ile Gly Ile

165 170 175

Pro Val Pro Val Ile Phe Ser Leu Ile Val Ala Leu Ile Leu Trp Phe

180 185 190

Leu Thr Thr Arg Met Arg Leu Gly Arg Asn Ile Tyr Ala Leu Gly Gly

195 200 205

Asn Lys Asn Ser Ala Phe Tyr Ser Gly Ile Asp Val Lys Phe His Ile

210 215 220

Leu Val Val Phe Ile Ile Ser Gly Val Cys Ala Gly Leu Ala Gly Val

225 230 235 240

Val Ser Thr Ala Arg Leu Gly Ala Ala Glu Pro Leu Ala Gly Met Gly

245 250 255

Phe Glu Thr Tyr Ala Ile Ala Ser Ala Ile Ile Gly Gly Thr Ser Phe

260 265 270

Phe Gly Gly Lys Gly Arg Ile Phe Ser Val Val Ile Gly Gly Leu Ile

275 280 285

Ile Gly Thr Ile Asn Asn Gly Leu Asn Ile Leu Gln Val Gln Thr Tyr

290 295 300

Tyr Gln Leu Val Val Met Gly Gly Leu Ile Ile Ala Ala Val Ala Leu

305 310 315 320

Asp Arg Leu Ile Ser Lys

325

<210> 46

<211> 1419

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 46

atggttacta tcaatacgga atctgcttta acgccacgtt ctttgcggga tacgcggcgt 60

atgaatatgt ttgtttcggt agctgctgcg gtcgcaggat tgttatttgg tcttgatatc 120

ggcgtaatcg ccggagcgtt gccgttcatt accgatcact ttgtgctgac cagtcgtttg 180

caggaatggg tggttagtag catgatgctc ggtgcagcaa ttggtgcgct gtttaatggt 240

tggctgtcgt tccgcctggg gcgtaaatac agcctgatgg cgggggccat cctgtttgta 300

ctcggttcta tagggtccgc ttttgcgacc agcgtagaga tgttaatcgc cgctcgtgtg 360

gtgctgggca ttgctgtcgg gatcgcgtct tacaccgctc ctctgtatct ttctgaaatg 420

gcaagtgaaa acgttcgcgg taagatgatc agtatgtacc agttgatggt cacactcggc 480

atcgtgctgg cgtttttatc cgatacagcg ttcagttata gcggtaactg gcgcgcaatg 540

ttgggggttc ttgctttacc agcagttctg ctgattattc tggtagtctt cctgccaaat 600

agcccgcgct ggctggcgga aaaggggcgt catattgagg cggaagaagt attgcgtatg 660

ctgcgcgata cgtcggaaaa agcgcgagaa gaactcaacg aaattcgtga aagcctgaag 720

ttaaaacagg gcggttgggc actgtttaag atcaaccgta acgtccgtcg tgctgtgttt 780

ctcggtatgt tgttgcaggc gatgcagcag tttaccggta tgaacatcat catgtactac 840

gcgccgcgta tcttcaaaat ggcgggcttt acgaccacag aacaacagat gattgcgact 900

ctggtcgtag ggctgacctt tatgttcgcc acctttattg cggtgtttac ggtagataaa 960

gcagggcgta aaccggctct gaaaattggt ttcagcgtga tggcgttagg cactctggtg 1020

ctgggctatt gcctgatgca gtttgataac ggtacggctt ccagtggctt gtcctggctc 1080

tctgttggca tgacgatgat gtgtattgcc ggttatgcga tgagcgccgc gccagtggtg 1140

tggatcctgt gctctgaaat tcagccgctg aaatgccgcg atttcggtat tacctgttcg 1200

accaccacga actgggtgtc gaatatgatt atcggcgcga ccttcctgac actgcttgat 1260

agcattggcg ctgccggtac gttctggctc tacactgcgc tgaacattgc gtttgtgggc 1320

attactttct ggctcattcc ggaaaccaaa aatgtcacgc tggaacatat cgaacgcaaa 1380

ctgatggcag gcgagaagtt gagaaatatc ggcgtctga 1419

<210> 47

<211> 472

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 47

Met Val Thr Ile Asn Thr Glu Ser Ala Leu Thr Pro Arg Ser Leu Arg

1 5 10 15

Asp Thr Arg Arg Met Asn Met Phe Val Ser Val Ala Ala Ala Val Ala

20 25 30

Gly Leu Leu Phe Gly Leu Asp Ile Gly Val Ile Ala Gly Ala Leu Pro

35 40 45

Phe Ile Thr Asp His Phe Val Leu Thr Ser Arg Leu Gln Glu Trp Val

50 55 60

Val Ser Ser Met Met Leu Gly Ala Ala Ile Gly Ala Leu Phe Asn Gly

65 70 75 80

Trp Leu Ser Phe Arg Leu Gly Arg Lys Tyr Ser Leu Met Ala Gly Ala

85 90 95

Ile Leu Phe Val Leu Gly Ser Ile Gly Ser Ala Phe Ala Thr Ser Val

100 105 110

Glu Met Leu Ile Ala Ala Arg Val Val Leu Gly Ile Ala Val Gly Ile

115 120 125

Ala Ser Tyr Thr Ala Pro Leu Tyr Leu Ser Glu Met Ala Ser Glu Asn

130 135 140

Val Arg Gly Lys Met Ile Ser Met Tyr Gln Leu Met Val Thr Leu Gly

145 150 155 160

Ile Val Leu Ala Phe Leu Ser Asp Thr Ala Phe Ser Tyr Ser Gly Asn

165 170 175

Trp Arg Ala Met Leu Gly Val Leu Ala Leu Pro Ala Val Leu Leu Ile

180 185 190

Ile Leu Val Val Phe Leu Pro Asn Ser Pro Arg Trp Leu Ala Glu Lys

195 200 205

Gly Arg His Ile Glu Ala Glu Glu Val Leu Arg Met Leu Arg Asp Thr

210 215 220

Ser Glu Lys Ala Arg Glu Glu Leu Asn Glu Ile Arg Glu Ser Leu Lys

225 230 235 240

Leu Lys Gln Gly Gly Trp Ala Leu Phe Lys Ile Asn Arg Asn Val Arg

245 250 255

Arg Ala Val Phe Leu Gly Met Leu Leu Gln Ala Met Gln Gln Phe Thr

260 265 270

Gly Met Asn Ile Ile Met Tyr Tyr Ala Pro Arg Ile Phe Lys Met Ala

275 280 285

Gly Phe Thr Thr Thr Glu Gln Gln Met Ile Ala Thr Leu Val Val Gly

290 295 300

Leu Thr Phe Met Phe Ala Thr Phe Ile Ala Val Phe Thr Val Asp Lys

305 310 315 320

Ala Gly Arg Lys Pro Ala Leu Lys Ile Gly Phe Ser Val Met Ala Leu

325 330 335

Gly Thr Leu Val Leu Gly Tyr Cys Leu Met Gln Phe Asp Asn Gly Thr

340 345 350

Ala Ser Ser Gly Leu Ser Trp Leu Ser Val Gly Met Thr Met Met Cys

355 360 365

Ile Ala Gly Tyr Ala Met Ser Ala Ala Pro Val Val Trp Ile Leu Cys

370 375 380

Ser Glu Ile Gln Pro Leu Lys Cys Arg Asp Phe Gly Ile Thr Cys Ser

385 390 395 400

Thr Thr Thr Asn Trp Val Ser Asn Met Ile Ile Gly Ala Thr Phe Leu

405 410 415

Thr Leu Leu Asp Ser Ile Gly Ala Ala Gly Thr Phe Trp Leu Tyr Thr

420 425 430

Ala Leu Asn Ile Ala Phe Val Gly Ile Thr Phe Trp Leu Ile Pro Glu

435 440 445

Thr Lys Asn Val Thr Leu Glu His Ile Glu Arg Lys Leu Met Ala Gly

450 455 460

Glu Lys Leu Arg Asn Ile Gly Val

465 470

<210> 48

<211> 1476

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 48

atgaataccc agtataattc cagttatata ttttcgatta ccttagtcgc tacattaggt 60

ggtttattat ttggctacga caccgccgtt atttccggta ctgttgagtc actcaatacc 120

gtctttgttg ctccacaaaa cttaagtgaa tccgctgcca actccctgtt agggttttgc 180

gtggccagcg ctctgattgg ttgcatcatc ggcggtgccc tcggtggtta ttgcagtaac 240

cgcttcggtc gtcgtgattc acttaagatt gctgctgtcc tgttttttat ttctggtgta 300

ggttctgcct ggccagaact tggttttacc tctataaacc cggacaacac tgtgcctgtt 360

tatctggcag gttatgtccc ggaatttgtt atttatcgca ttattggcgg tattggcgtt 420

ggtttagcct caatgctctc gccaatgtat attgcggaac tggctccagc tcatattcgc 480

gggaaactgg tctcttttaa ccagtttgcg attattttcg ggcaactttt agtttactgc 540

gtaaactatt ttattgcccg ttccggtgat gccagctggc tgaatactga cggctggcgt 600

tatatgtttg cctcggaatg tatccctgca ctgctgttct taatgctgct gtataccgtg 660

ccagaaagtc ctcgctggct gatgtcgcgc ggcaagcaag aacaggcgga aggtatcctg 720

cgcaaaatta tgggcaacac gcttgcaact caggcagtac aggaaattaa acactccctg 780

gatcatggcc gcaaaaccgg tggtcgtctg ctgatgtttg gcgtgggcgt gattgtaatc 840

ggcgtaatgc tctccatctt ccagcaattt gtcggcatca atgtggtgct gtactacgcg 900

ccggaagtgt tcaaaacgct gggggccagc acggatatcg cgctgttgca gaccattatt 960

gtcggagtta tcaacctcac cttcaccgtt ctggcaatta tgacggtgga taaatttggt 1020

cgtaagccac tgcaaattat cggcgcactc ggaatggcaa tcggtatgtt tagcctcggt 1080

accgcgtttt acactcaggc accgggtatt gtggcgctac tgtcgatgct gttctatgtt 1140

gccgcctttg ccatgtcctg gggtccggta tgctgggtac tgctgtcgga aatcttcccg 1200

aatgctattc gtggtaaagc gctggcaatc gcggtggcgg cccagtggct ggcgaactac 1260

ttcgtctcct ggaccttccc gatgatggac aaaaactcct ggctggtggc ccatttccac 1320

aacggtttct cctactggat ttacggttgt atgggcgttc tggcagcact gtttatgtgg 1380

aaatttgtcc cggaaaccaa aggtaaaacc cttgaggagc tggaagcgct ctgggaaccg 1440

gaaacgaaga aaacacaaca aactgctacg ctgtaa 1476

<210> 49

<211> 491

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 49

Met Asn Thr Gln Tyr Asn Ser Ser Tyr Ile Phe Ser Ile Thr Leu Val

1 5 10 15

Ala Thr Leu Gly Gly Leu Leu Phe Gly Tyr Asp Thr Ala Val Ile Ser

20 25 30

Gly Thr Val Glu Ser Leu Asn Thr Val Phe Val Ala Pro Gln Asn Leu

35 40 45

Ser Glu Ser Ala Ala Asn Ser Leu Leu Gly Phe Cys Val Ala Ser Ala

50 55 60

Leu Ile Gly Cys Ile Ile Gly Gly Ala Leu Gly Gly Tyr Cys Ser Asn

65 70 75 80

Arg Phe Gly Arg Arg Asp Ser Leu Lys Ile Ala Ala Val Leu Phe Phe

85 90 95

Ile Ser Gly Val Gly Ser Ala Trp Pro Glu Leu Gly Phe Thr Ser Ile

100 105 110

Asn Pro Asp Asn Thr Val Pro Val Tyr Leu Ala Gly Tyr Val Pro Glu

115 120 125

Phe Val Ile Tyr Arg Ile Ile Gly Gly Ile Gly Val Gly Leu Ala Ser

130 135 140

Met Leu Ser Pro Met Tyr Ile Ala Glu Leu Ala Pro Ala His Ile Arg

145 150 155 160

Gly Lys Leu Val Ser Phe Asn Gln Phe Ala Ile Ile Phe Gly Gln Leu

165 170 175

Leu Val Tyr Cys Val Asn Tyr Phe Ile Ala Arg Ser Gly Asp Ala Ser

180 185 190

Trp Leu Asn Thr Asp Gly Trp Arg Tyr Met Phe Ala Ser Glu Cys Ile

195 200 205

Pro Ala Leu Leu Phe Leu Met Leu Leu Tyr Thr Val Pro Glu Ser Pro

210 215 220

Arg Trp Leu Met Ser Arg Gly Lys Gln Glu Gln Ala Glu Gly Ile Leu

225 230 235 240

Arg Lys Ile Met Gly Asn Thr Leu Ala Thr Gln Ala Val Gln Glu Ile

245 250 255

Lys His Ser Leu Asp His Gly Arg Lys Thr Gly Gly Arg Leu Leu Met

260 265 270

Phe Gly Val Gly Val Ile Val Ile Gly Val Met Leu Ser Ile Phe Gln

275 280 285

Gln Phe Val Gly Ile Asn Val Val Leu Tyr Tyr Ala Pro Glu Val Phe

290 295 300

Lys Thr Leu Gly Ala Ser Thr Asp Ile Ala Leu Leu Gln Thr Ile Ile

305 310 315 320

Val Gly Val Ile Asn Leu Thr Phe Thr Val Leu Ala Ile Met Thr Val

325 330 335

Asp Lys Phe Gly Arg Lys Pro Leu Gln Ile Ile Gly Ala Leu Gly Met

340 345 350

Ala Ile Gly Met Phe Ser Leu Gly Thr Ala Phe Tyr Thr Gln Ala Pro

355 360 365

Gly Ile Val Ala Leu Leu Ser Met Leu Phe Tyr Val Ala Ala Phe Ala

370 375 380

Met Ser Trp Gly Pro Val Cys Trp Val Leu Leu Ser Glu Ile Phe Pro

385 390 395 400

Asn Ala Ile Arg Gly Lys Ala Leu Ala Ile Ala Val Ala Ala Gln Trp

405 410 415

Leu Ala Asn Tyr Phe Val Ser Trp Thr Phe Pro Met Met Asp Lys Asn

420 425 430

Ser Trp Leu Val Ala His Phe His Asn Gly Phe Ser Tyr Trp Ile Tyr

435 440 445

Gly Cys Met Gly Val Leu Ala Ala Leu Phe Met Trp Lys Phe Val Pro

450 455 460

Glu Thr Lys Gly Lys Thr Leu Glu Glu Leu Glu Ala Leu Trp Glu Pro

465 470 475 480

Glu Thr Lys Lys Thr Gln Gln Thr Ala Thr Leu

485 490

<210> 50

<211> 1095

<212> DNA

<213> 智人（Homo sapiens）

<400> 50

atggcgcacc gttttccggc gctgacccaa gagcagaaga aggagctgag cgagattgcg 60

cagagcatcg tggcgaatgg taaaggtatt ctggcggcgg atgagagcgt tggtaccatg 120

ggcaaccgtc tgcagcgtat taaggtggag aacaccgagg aaaaccgtcg tcaattccgt 180

gaaatcctgt ttagcgttga tagcagcatc aaccagagca ttggtggcgt gatcctgttc 240

cacgaaaccc tgtaccagaa ggacagccaa ggtaaactgt ttcgtaacat tctgaaggaa 300

aaaggtattg tggttggcat caagctggat caaggtggcg cgccgctggc gggcaccaac 360

aaggaaacca ccatccaggg tctggacggc ctgagcgaac gttgcgcgca atataagaaa 420

gatggtgttg acttcggcaa gtggcgtgcg gtgctgcgta ttgcggacca gtgcccgagc 480

agcctggcga tccaagaaaa cgcgaacgcg ctggcgcgtt acgcgagcat ctgccagcaa 540

aacggtctgg tgccgattgt tgagccggaa gttatcccgg acggcgatca cgacctggag 600

cactgccagt atgtgaccga aaaggttctg gcggcggtgt acaaagcgct gaacgatcac 660

cacgtttatc tggagggtac cctgctgaaa ccgaacatgg tgaccgcggg ccatgcgtgc 720

accaagaaat acaccccgga acaggtggcg atggcgaccg tgaccgcgct gcaccgtacc 780

gttccggcgg cggtgccggg tatttgcttt ctgagcggtg gcatgagcga agaggacgcg 840

accctgaacc tgaacgcgat caacctgtgc ccgctgccga agccgtggaa actgagcttc 900

agctacggcc gtgcgctgca ggcgagcgcg ctggcggcgt ggggtggcaa ggcggcgaac 960

aaagaggcga cccaagaagc gtttatgaag cgtgcgatgg cgaactgcca ggcggcgaaa 1020

ggtcaatatg tgcataccgg cagcagcggt gcggcgagca cccagagcct gtttaccgcg 1080

tgctatacct attaa 1095

<210> 51

<211> 364

<212> PRT

<213> 智人（Homo sapiens）

<400> 51

Met Ala His Arg Phe Pro Ala Leu Thr Gln Glu Gln Lys Lys Glu Leu

1 5 10 15

Ser Glu Ile Ala Gln Ser Ile Val Ala Asn Gly Lys Gly Ile Leu Ala

20 25 30

Ala Asp Glu Ser Val Gly Thr Met Gly Asn Arg Leu Gln Arg Ile Lys

35 40 45

Val Glu Asn Thr Glu Glu Asn Arg Arg Gln Phe Arg Glu Ile Leu Phe

50 55 60

Ser Val Asp Ser Ser Ile Asn Gln Ser Ile Gly Gly Val Ile Leu Phe

65 70 75 80

His Glu Thr Leu Tyr Gln Lys Asp Ser Gln Gly Lys Leu Phe Arg Asn

85 90 95

Ile Leu Lys Glu Lys Gly Ile Val Val Gly Ile Lys Leu Asp Gln Gly

100 105 110

Gly Ala Pro Leu Ala Gly Thr Asn Lys Glu Thr Thr Ile Gln Gly Leu

115 120 125

Asp Gly Leu Ser Glu Arg Cys Ala Gln Tyr Lys Lys Asp Gly Val Asp

130 135 140

Phe Gly Lys Trp Arg Ala Val Leu Arg Ile Ala Asp Gln Cys Pro Ser

145 150 155 160

Ser Leu Ala Ile Gln Glu Asn Ala Asn Ala Leu Ala Arg Tyr Ala Ser

165 170 175

Ile Cys Gln Gln Asn Gly Leu Val Pro Ile Val Glu Pro Glu Val Ile

180 185 190

Pro Asp Gly Asp His Asp Leu Glu His Cys Gln Tyr Val Thr Glu Lys

195 200 205

Val Leu Ala Ala Val Tyr Lys Ala Leu Asn Asp His His Val Tyr Leu

210 215 220

Glu Gly Thr Leu Leu Lys Pro Asn Met Val Thr Ala Gly His Ala Cys

225 230 235 240

Thr Lys Lys Tyr Thr Pro Glu Gln Val Ala Met Ala Thr Val Thr Ala

245 250 255

Leu His Arg Thr Val Pro Ala Ala Val Pro Gly Ile Cys Phe Leu Ser

260 265 270

Gly Gly Met Ser Glu Glu Asp Ala Thr Leu Asn Leu Asn Ala Ile Asn

275 280 285

Leu Cys Pro Leu Pro Lys Pro Trp Lys Leu Ser Phe Ser Tyr Gly Arg

290 295 300

Ala Leu Gln Ala Ser Ala Leu Ala Ala Trp Gly Gly Lys Ala Ala Asn

305 310 315 320

Lys Glu Ala Thr Gln Glu Ala Phe Met Lys Arg Ala Met Ala Asn Cys

325 330 335

Gln Ala Ala Lys Gly Gln Tyr Val His Thr Gly Ser Ser Gly Ala Ala

340 345 350

Ser Thr Gln Ser Leu Phe Thr Ala Cys Tyr Thr Tyr

355 360

<210> 52

<211> 1149

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 52

atggctaaca gaatgattct gaacgaaacg gcatggtttg gtcggggtgc tgttggggct 60

ttaaccgatg aggtgaaacg ccgtggttat cagaaggcgc tgatcgtcac cgataaaacg 120

ctggtgcaat gcggcgtggt ggcgaaagtg accgataaga tggatgctgc agggctggca 180

tgggcgattt acgacggcgt agtgcccaac ccaacaatta ctgtcgtcaa agaagggctc 240

ggtgtattcc agaatagcgg cgcggattac ctgatcgcta ttggtggtgg ttctccacag 300

gatacttgta aagcgattgg cattatcagc aacaacccgg agtttgccga tgtgcgtagc 360

ctggaagggc tttccccgac caataaaccc agtgtaccga ttctggcaat tcctaccaca 420

gcaggtactg cggcagaagt gaccattaac tacgtgatca ctgacgaaga gaaacggcgc 480

aagtttgttt gcgttgatcc gcatgatatc ccgcaggtgg cgtttattga cgctgacatg 540

atggatggta tgcctccagc gctgaaagct gcgacgggtg tcgatgcgct cactcatgct 600

attgaggggt atattacccg tggcgcgtgg gcgctaaccg atgcactgca cattaaagcg 660

attgaaatca ttgctggggc gctgcgagga tcggttgctg gtgataagga tgccggagaa 720

gaaatggcgc tcgggcagta tgttgcgggt atgggcttct cgaatgttgg gttagggttg 780

gtgcatggta tggcgcatcc actgggcgcg ttttataaca ctccacacgg tgttgcgaac 840

gccatcctgt taccgcatgt catgcgttat aacgctgact ttaccggtga gaagtaccgc 900

gatatcgcgc gcgttatggg cgtgaaagtg gaaggtatga gcctggaaga ggcgcgtaat 960

gccgctgttg aagcggtgtt tgctctcaac cgtgatgtcg gtattccgcc acatttgcgt 1020

gatgttggtg tacgcaagga agacattccg gcactggcgc aggcggcact ggatgatgtt 1080

tgtaccggtg gcaacccgcg tgaagcaacg cttgaggata ttgtagagct ttaccatacc 1140

gcctggtaa 1149

<210> 53

<211> 144

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> proD启动子

<400> 53

cacagctaac accacgtcgt ccctatctgc tgccctaggt ctatgagtgg ttgctggata 60

actttacggg catgcataag gctcgtataa tatattcagg gagtccacaa cggtttccct 120

ctacaaataa ttttgtttaa cttt 144

<210> 54

<211> 870

<212> DNA

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 54

atgacggcgc aagttacttg tgtgtgggac ctgaaagcca cattaggaga aggcccgatc 60

tggcatggtg atacattatg gtttgtcgat attaaacagc gtaaaatcca taactaccat 120

ccggccactg gggagcgctt cagcttcgac gcaccggacc aggtgacgtt ccttgcgccc 180

atcgtcggtg cgactggatt tgtcgtagga ttaaagacgg gcatccaccg tttccatcca 240

gcaacaggtt tttccctgtt gcttgaggta gaggacgccg ctttgaataa tcgtccgaac 300

gatgcgaccg tggatgcaca aggacgtttg tggtttggta cgatgcacga tggtgaagag 360

aataacagcg gctctttgta tcgtatggat ttgacgggag ttgcacgcat ggatcgtgat 420

atttgcatca caaacggacc gtgcgtttcc cctgacggta aaaccttcta tcatacggac 480

acgctggaaa agaccattta cgcgttcgat cttgcggaag acggtcttct gagcaataaa 540

cgcgtgtttg ttcaattcgc tctgggtgac gatgtctacc ctgacggctc tgtggtagat 600

agcgaaggtt atctgtggac cgcactgtgg ggagggtttg gcgcggtgcg tttcagcccg 660

cagggtgacg ctgtaacccg cattgaatta ccggctccga acgtgacgaa gccgtgcttt 720

gggggtccgg atctgaaaac gttgtatttc accaccgcgc gtaaaggatt atcagatgag 780

acccttgccc aatatccatt ggctggcggg gttttcgccg taccggtaga tgtcgctggt 840

caacctcaac acgaagtgcg tttagtttaa 870

<210> 55

<211> 289

<212> PRT

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 55

Met Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly

1 5 10 15

Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile Lys

20 25 30

Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg Phe Ser

35 40 45

Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile Val Gly Ala

50 55 60

Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His Arg Phe His Pro

65 70 75 80

Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu Asp Ala Ala Leu Asn

85 90 95

Asn Arg Pro Asn Asp Ala Thr Val Asp Ala Gln Gly Arg Leu Trp Phe

100 105 110

Gly Thr Met His Asp Gly Glu Glu Asn Asn Ser Gly Ser Leu Tyr Arg

115 120 125

Met Asp Leu Thr Gly Val Ala Arg Met Asp Arg Asp Ile Cys Ile Thr

130 135 140

Asn Gly Pro Cys Val Ser Pro Asp Gly Lys Thr Phe Tyr His Thr Asp

145 150 155 160

Thr Leu Glu Lys Thr Ile Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu

165 170 175

Leu Ser Asn Lys Arg Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val

180 185 190

Tyr Pro Asp Gly Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala

195 200 205

Leu Trp Gly Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala

210 215 220

Val Thr Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe

225 230 235 240

Gly Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly

245 250 255

Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val Phe

260 265 270

Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val Arg Leu

275 280 285

Val

<210> 56

<211> 885

<212> DNA

<213> 异种伯克霍尔德氏菌（Burkholderia xenovorans）

<400> 56

atgaaaatcc accctccggt ctgtgtctgg ccagttcacg cggagttggg ggaaggccct 60

ttgtggcagg cgggggaaaa cgcggtttat ttcgtggata ttaagggtcg tcaaattcac 120

cgtttaactg tgaccactgg ccaaacgcaa acctggaaag cgcctggaca gccagggttt 180

attgccccat tggccggtca tgggtttgtt tgtggtctgc cgggaggtct ttaccgcttt 240

gacgccgggt caggccaatt cagcaagctg aaagatgtag aagtacatct tccggggaat 300

cgcttaaacg acggcttcgt cgatgccagc gggcatttat ggtttggatc tatggatgat 360

ggagaagaac agcctagtgg aaccctgtac cgtgtcaatc atgcgggaga ggctgttgcc 420

caggatgacg gatatgtcat cacgaatggt cctgcaagtt caccggatgc ccgcacttta 480

tatcacggcg acactatgcg tcgcgttgtc tacgctttcg acctgggcga agatgggaca 540

cttagccgca agcgcatctt tgccgcgatc tcgggagatg gctatccaga tggcatggcc 600

gtggacgcgg acggattcct gtgggttgcg ctgttcggtg gatggcgtat tgaacgtttc 660

tccccggacg gaaaacgtgt cgagcaagtt ccgtttcctt gcgctaacgt gacgaaattg 720

gcattcggcg gcgacgattt acaaacggtc tatgcgtcaa ccgcctggaa gggtttgtct 780

cccgttgcgc gtcagcaaca gcccgacgca ggggggttat tcagctttcg ctccccggta 840

ccaggccagc cccaggcccg ttgcaaatgg ggcttcgctc agtaa 885

<210> 57

<211> 294

<212> PRT

<213> 异种伯克霍尔德氏菌（Burkholderia xenovorans）

<400> 57

Met Lys Ile His Pro Pro Val Cys Val Trp Pro Val His Ala Glu Leu

1 5 10 15

Gly Glu Gly Pro Leu Trp Gln Ala Gly Glu Asn Ala Val Tyr Phe Val

20 25 30

Asp Ile Lys Gly Arg Gln Ile His Arg Leu Thr Val Thr Thr Gly Gln

35 40 45

Thr Gln Thr Trp Lys Ala Pro Gly Gln Pro Gly Phe Ile Ala Pro Leu

50 55 60

Ala Gly His Gly Phe Val Cys Gly Leu Pro Gly Gly Leu Tyr Arg Phe

65 70 75 80

Asp Ala Gly Ser Gly Gln Phe Ser Lys Leu Lys Asp Val Glu Val His

85 90 95

Leu Pro Gly Asn Arg Leu Asn Asp Gly Phe Val Asp Ala Ser Gly His

100 105 110

Leu Trp Phe Gly Ser Met Asp Asp Gly Glu Glu Gln Pro Ser Gly Thr

115 120 125

Leu Tyr Arg Val Asn His Ala Gly Glu Ala Val Ala Gln Asp Asp Gly

130 135 140

Tyr Val Ile Thr Asn Gly Pro Ala Ser Ser Pro Asp Ala Arg Thr Leu

145 150 155 160

Tyr His Gly Asp Thr Met Arg Arg Val Val Tyr Ala Phe Asp Leu Gly

165 170 175

Glu Asp Gly Thr Leu Ser Arg Lys Arg Ile Phe Ala Ala Ile Ser Gly

180 185 190

Asp Gly Tyr Pro Asp Gly Met Ala Val Asp Ala Asp Gly Phe Leu Trp

195 200 205

Val Ala Leu Phe Gly Gly Trp Arg Ile Glu Arg Phe Ser Pro Asp Gly

210 215 220

Lys Arg Val Glu Gln Val Pro Phe Pro Cys Ala Asn Val Thr Lys Leu

225 230 235 240

Ala Phe Gly Gly Asp Asp Leu Gln Thr Val Tyr Ala Ser Thr Ala Trp

245 250 255

Lys Gly Leu Ser Pro Val Ala Arg Gln Gln Gln Pro Asp Ala Gly Gly

260 265 270

Leu Phe Ser Phe Arg Ser Pro Val Pro Gly Gln Pro Gln Ala Arg Cys

275 280 285

Lys Trp Gly Phe Ala Gln

290

<210> 58

<211> 876

<212> DNA

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 58

atgaccgtca cgagagtggt cgacacgtcg tgccgactcg gcgagggacc ggtctggcac 60

cccgacgaga agcggctgta ctgggtagac atcgaatccg ggcgactcca ccgctacgac 120

cccgagaccg gagcgcacga ctgtccggtc gaaacgtcgg tcatcgccgg cgtgacgata 180

cagcgcgacg ggtcgctcct agcgttcatg gaccgcggtc gcgtcgggcg cgtcgtcgac 240

ggcgaccgcc gggaaagcgc gcgaatcgtc gactcaccga cccggttcaa cgacgtcatc 300

gccgaccccg ccgggcgggt gttctgcggg acgatgccgt cagatacggc gggcgggcgg 360

ctgttccgcc tcgacaccga cggaacggtg acgacggtcg aaaccggcgt cggaatcccc 420

aacgggatgg gattcacccg cgaccgcgag cgattctact tcacggaaac cgaggcgcgc 480

accgtctatc ggtacgccta cgacgaagag acgggagccg tctcggcccg cgagcggttc 540

gtcgaatcgc cggagacgcc ggggctaccg gacgggatga cggtcgattc ggcggggcac 600

atctggtcgg cccgctggga gggcggctgt gtggtcgagt acgacgccga cggcaccgaa 660

ctcggccggt tcgacgtgcc gacggagaag gtgacgagcg tcgccttcgg cgggccggac 720

ctcgattcgc tctacgtgac gaccgccggc ggcgacgggg acgggagcgc tggcgagggc 780

gacgagagca ccggcgacgc tgcgggcgcg ctgttccgcc tcgacgtggc ggcgaccggg 840

cggcccgagt tccgctccga cgttcggttg gggtga 876

<210> 59

<211> 291

<212> PRT

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 59

Met Thr Val Thr Arg Val Val Asp Thr Ser Cys Arg Leu Gly Glu Gly

1 5 10 15

Pro Val Trp His Pro Asp Glu Lys Arg Leu Tyr Trp Val Asp Ile Glu

20 25 30

Ser Gly Arg Leu His Arg Tyr Asp Pro Glu Thr Gly Ala His Asp Cys

35 40 45

Pro Val Glu Thr Ser Val Ile Ala Gly Val Thr Ile Gln Arg Asp Gly

50 55 60

Ser Leu Leu Ala Phe Met Asp Arg Gly Arg Val Gly Arg Val Val Asp

65 70 75 80

Gly Asp Arg Arg Glu Ser Ala Arg Ile Val Asp Ser Pro Thr Arg Phe

85 90 95

Asn Asp Val Ile Ala Asp Pro Ala Gly Arg Val Phe Cys Gly Thr Met

100 105 110

Pro Ser Asp Thr Ala Gly Gly Arg Leu Phe Arg Leu Asp Thr Asp Gly

115 120 125

Thr Val Thr Thr Val Glu Thr Gly Val Gly Ile Pro Asn Gly Met Gly

130 135 140

Phe Thr Arg Asp Arg Glu Arg Phe Tyr Phe Thr Glu Thr Glu Ala Arg

145 150 155 160

Thr Val Tyr Arg Tyr Ala Tyr Asp Glu Glu Thr Gly Ala Val Ser Ala

165 170 175

Arg Glu Arg Phe Val Glu Ser Pro Glu Thr Pro Gly Leu Pro Asp Gly

180 185 190

Met Thr Val Asp Ser Ala Gly His Ile Trp Ser Ala Arg Trp Glu Gly

195 200 205

Gly Cys Val Val Glu Tyr Asp Ala Asp Gly Thr Glu Leu Gly Arg Phe

210 215 220

Asp Val Pro Thr Glu Lys Val Thr Ser Val Ala Phe Gly Gly Pro Asp

225 230 235 240

Leu Asp Ser Leu Tyr Val Thr Thr Ala Gly Gly Asp Gly Asp Gly Ser

245 250 255

Ala Gly Glu Gly Asp Glu Ser Thr Gly Asp Ala Ala Gly Ala Leu Phe

260 265 270

Arg Leu Asp Val Ala Ala Thr Gly Arg Pro Glu Phe Arg Ser Asp Val

275 280 285

Arg Leu Gly

290

<210> 60

<211> 1776

<212> DNA

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 60

atgtcgaatc gcactccacg tcgttttcgc tcacgtgact ggttcgataa tccagaccat 60

atcgacatga cggccttgta tcttgaacgt tttatgaatt atgggattac ccccgaggag 120

ttacgctcgg ggaagccgat tattgggatc gcacagactg gctctgatat ttcaccctgt 180

aaccgtatcc acctggacct ggtgcagcgt gtgcgtgacg ggatccgtga cgcaggaggc 240

attcctatgg aattcccagt tcacccaatc ttcgagaatt gccgtcgccc tactgctgcg 300

cttgatcgta acctttctta cttgggtctt gtcgagactc ttcatgggta ccctatcgat 360

gcggtcgttt taacaacggg gtgcgataaa acgaccccag caggcattat ggctgccacc 420

acagtcaaca tcccggctat tgtgttgtcc gggggcccaa tgcttgatgg gtggcatgaa 480

aatgaattgg tgggttcagg cacagtcatt tggcgtagcc gtcgcaaatt agccgccggc 540

gaaatcacag aagaagaatt tattgaccgt gccgctagta gcgcgccaag cgcgggacac 600

tgtaacacga tgggaacagc gtccacgatg aatgccgtgg cggaggcttt gggtctttcc 660

ctgacaggtt gtgcagccat tcccgcaccc tatcgcgagc gtggtcagat ggcgtacaaa 720

acgggacaac gcattgtgga cttggcgtat gacgacgtta agccacttga catccttacc 780

aagcaggcgt ttgaaaacgc cattgctttg gtcgccgcag ccggaggttc gaccaatgca 840

cagccacaca ttgtagcaat ggcccgccat gccggagtgg aaatcaccgc cgatgattgg 900

cgtgctgcat atgacattcc gcttatcgtg aatatgcaac ctgctggtaa atacttggga 960

gaacgtttcc atcgcgctgg tggcgcacca gcggtactgt gggagttact tcagcaaggt 1020

cgcctgcacg gcgacgtact tactgtcacg ggaaagacaa tgtcagagaa cttacagggg 1080

cgcgaaacct cagatcgtga agtaatcttt ccttatcatg aaccgcttgc cgagaaagcc 1140

ggcttcttgg ttcttaaggg caatttgttt gatttcgcga tcatgaaaag ctcggtgatt 1200

ggtgaggaat ttcgtaagcg ctacttatca cagccagggc aagagggtgt tttcgaagca 1260

cgtgctattg tttttgacgg ctcggacgac taccataaac gcattaacga tcctgcatta 1320

gaaatcgatg aacgttgtat cttagtgatc cgtggtgcag gaccaatcgg gtggccgggc 1380

tcagcggagg tcgtcaacat gcaaccacca gaccacttac tgaaaaaagg gatcatgtcg 1440

ttaccaacac tgggggacgg tcgtcaaagt ggtactgccg attccccctc tattttgaat 1500

gcgtccccag agtccgctat tggaggcgga cttagctggc ttcgtacagg tgacacaatc 1560

cgtatcgatc tgaacacggg acgttgcgac gcgttagtgg acgaggccac aattgcggct 1620

cgtaagcagg acggaattcc cgccgtcccg gcaaccatga caccgtggca agaaatttat 1680

cgcgcgcatg cgtcacagct tgacaccggt ggggtattgg agtttgctgt gaaatatcag 1740

gatctggcgg cgaagctgcc acgccataat cactaa 1776

<210> 61

<211> 591

<212> PRT

<213> 新月柄杆菌（Caulobacter crescentus）

<400> 61

Met Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg Asp Trp Phe Asp

1 5 10 15

Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg Phe Met

20 25 30

Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro Ile Ile

35 40 45

Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys Asn Arg Ile His

50 55 60

Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg Asp Ala Gly Gly

65 70 75 80

Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu Asn Cys Arg Arg

85 90 95

Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu Gly Leu Val Glu

100 105 110

Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr Gly Cys

115 120 125

Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr Thr Val Asn Ile

130 135 140

Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp His Glu

145 150 155 160

Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg Ser Arg Arg Lys

165 170 175

Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile Asp Arg Ala Ala

180 185 190

Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met Gly Thr Ala Ser

195 200 205

Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser Leu Thr Gly Cys

210 215 220

Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala Tyr Lys

225 230 235 240

Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp Val Lys Pro Leu

245 250 255

Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile Ala Leu Val Ala

260 265 270

Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile Val Ala Met Ala

275 280 285

Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp Arg Ala Ala Tyr

290 295 300

Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly Lys Tyr Leu Gly

305 310 315 320

Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val Leu Trp Glu Leu

325 330 335

Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr Val Thr Gly Lys

340 345 350

Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser Asp Arg Glu Val

355 360 365

Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala Gly Phe Leu Val

370 375 380

Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Ser Ser Val Ile

385 390 395 400

Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro Gly Gln Glu Gly

405 410 415

Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser Asp Asp Tyr His

420 425 430

Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu Arg Cys Ile Leu

435 440 445

Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly Ser Ala Glu Val

450 455 460

Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys Gly Ile Met Ser

465 470 475 480

Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ala Asp Ser Pro

485 490 495

Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly Gly Gly Leu Ser

500 505 510

Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu Asn Thr Gly Arg

515 520 525

Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala Arg Lys Gln Asp

530 535 540

Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp Gln Glu Ile Tyr

545 550 555 560

Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val Leu Glu Phe Ala

565 570 575

Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg His Asn His

580 585 590

<210> 62

<211> 1785

<212> DNA

<213> 异种伯克霍尔德氏菌（Burkholderia xenovorans）

<400> 62

atgtcagcca gtacccctcg tcgtcttcgc tctcaggagt ggttcgacga tccgagtcac 60

gctgatatga ccgcattata tgtcgagcgt tttatgaact atggattaac tcgcgaggaa 120

ttacaatctg gtcgtccgat tatcggcatt gcacagaccg gaagcgacct ggcgccctgt 180

aatcgccacc atatcgagtt agccgcgcgt acaaaggccg gaattcgcga cgcgggtgga 240

attccaatgg agttccccgt ccatccgctt gccgaacaat cccgccgccc gacggccgcg 300

cttgaccgta atctggctta cttgggtctg gtggaaatct tacacggttt ccccttagat 360

ggcgtagttt taaccactgg ttgcgataaa accacgccag cgtgtctgat ggcagctgcg 420

acagtggata tgccagcgat cgtgttaagt ggcggcccca tgcttgatgg atggcacgag 480

ggtaaacgcg tgggctctgg tacagtcatt tggcatgcgc gcaacctgtt ggcgacaggg 540

gagattgatt acgaagggtt catgcagttg actacggcgt cgagtccatc tatcggccac 600

tgtaatacta tggggacagc gttatccatg aactcattgg cagaggcgct gggtatgagc 660

ttacccggtt gtgcttcaat tcccgctgca tatcgtgaac gtggccagat ggcgtacgcg 720

acaggcaagc gtattgtgga cttggtccgc gaagatgtcc gtccaagcca tatcatgact 780

aaggcggcat ttgaaaatgc catcgtcgtt gcaagcgccc ttggcgcgag cacaaattgt 840

ccaccacatt taattgctat tgcgcgccat atgggggtgg aattgacttt agatgattgg 900

caacgcgtgg gtgagcaggt gccccttatt gtaaactgca tgcccgctgg cgaatatttg 960

ggtgaatcgt ttcatcgtgc tgggggtgtt ccagctgtct tgcgcgagtt ggtccacgct 1020

caactggttc atcgcgagtg tctgactgtc agtggccgca ctattggaga gatcgcggcg 1080

gatgccccat cgccagatcg tgacgtgatt cgcactactg aagacccgct taaacatggg 1140

gcgggattta tcgtattgtc aggcaacttt ttcgatagtg caattatgaa gatgagtgtg 1200

gtaggcgaag cctttcgtca aacgtacctg tccgagcctg gcaacgagaa cacatttgaa 1260

gctcgtgcca tcgtttttga cggcccagaa gattaccacg cgcgtatcaa tgaccctagc 1320

cttgatattg accaacattg tattttagtc attcgtggag ccggtaccgt aggatatccg 1380

ggcagtgctg aggtagtgaa catggccccg ccggcggaat tagtgcgtca gggtatcacc 1440

tcattgccaa cacttggaga tggccgtcaa agcggcacat cagcttcgcc gtctattttg 1500

aacatgagcc ctgaggccgc cgttggcgga ggattaagtc ttttgcgcac caatgaccgc 1560

attcgtgttg atctgaactc acgctcagta aatgtactgg ttgatgacga agaattagca 1620

cgccgtcgtg aaaccgcaac gttcgctatt cctcctaccc agacgccgtg gcaagaatta 1680

taccgccaga cggtggggca gctgagtact ggcgggtgtc tggaacctgc taccttatat 1740

ttgaaagtta tcgcagaacg tggcaatccg cgtcacagcc actaa 1785

<210> 63

<211> 594

<212> PRT

<213> 异种伯克霍尔德氏菌（Burkholderia xenovorans）

<400> 63

Met Ser Ala Ser Thr Pro Arg Arg Leu Arg Ser Gln Glu Trp Phe Asp

1 5 10 15

Asp Pro Ser His Ala Asp Met Thr Ala Leu Tyr Val Glu Arg Phe Met

20 25 30

Asn Tyr Gly Leu Thr Arg Glu Glu Leu Gln Ser Gly Arg Pro Ile Ile

35 40 45

Gly Ile Ala Gln Thr Gly Ser Asp Leu Ala Pro Cys Asn Arg His His

50 55 60

Ile Glu Leu Ala Ala Arg Thr Lys Ala Gly Ile Arg Asp Ala Gly Gly

65 70 75 80

Ile Pro Met Glu Phe Pro Val His Pro Leu Ala Glu Gln Ser Arg Arg

85 90 95

Pro Thr Ala Ala Leu Asp Arg Asn Leu Ala Tyr Leu Gly Leu Val Glu

100 105 110

Ile Leu His Gly Phe Pro Leu Asp Gly Val Val Leu Thr Thr Gly Cys

115 120 125

Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala Ala Thr Val Asp Met

130 135 140

Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp His Glu

145 150 155 160

Gly Lys Arg Val Gly Ser Gly Thr Val Ile Trp His Ala Arg Asn Leu

165 170 175

Leu Ala Thr Gly Glu Ile Asp Tyr Glu Gly Phe Met Gln Leu Thr Thr

180 185 190

Ala Ser Ser Pro Ser Ile Gly His Cys Asn Thr Met Gly Thr Ala Leu

195 200 205

Ser Met Asn Ser Leu Ala Glu Ala Leu Gly Met Ser Leu Pro Gly Cys

210 215 220

Ala Ser Ile Pro Ala Ala Tyr Arg Glu Arg Gly Gln Met Ala Tyr Ala

225 230 235 240

Thr Gly Lys Arg Ile Val Asp Leu Val Arg Glu Asp Val Arg Pro Ser

245 250 255

His Ile Met Thr Lys Ala Ala Phe Glu Asn Ala Ile Val Val Ala Ser

260 265 270

Ala Leu Gly Ala Ser Thr Asn Cys Pro Pro His Leu Ile Ala Ile Ala

275 280 285

Arg His Met Gly Val Glu Leu Thr Leu Asp Asp Trp Gln Arg Val Gly

290 295 300

Glu Gln Val Pro Leu Ile Val Asn Cys Met Pro Ala Gly Glu Tyr Leu

305 310 315 320

Gly Glu Ser Phe His Arg Ala Gly Gly Val Pro Ala Val Leu Arg Glu

325 330 335

Leu Val His Ala Gln Leu Val His Arg Glu Cys Leu Thr Val Ser Gly

340 345 350

Arg Thr Ile Gly Glu Ile Ala Ala Asp Ala Pro Ser Pro Asp Arg Asp

355 360 365

Val Ile Arg Thr Thr Glu Asp Pro Leu Lys His Gly Ala Gly Phe Ile

370 375 380

Val Leu Ser Gly Asn Phe Phe Asp Ser Ala Ile Met Lys Met Ser Val

385 390 395 400

Val Gly Glu Ala Phe Arg Gln Thr Tyr Leu Ser Glu Pro Gly Asn Glu

405 410 415

Asn Thr Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Pro Glu Asp Tyr

420 425 430

His Ala Arg Ile Asn Asp Pro Ser Leu Asp Ile Asp Gln His Cys Ile

435 440 445

Leu Val Ile Arg Gly Ala Gly Thr Val Gly Tyr Pro Gly Ser Ala Glu

450 455 460

Val Val Asn Met Ala Pro Pro Ala Glu Leu Val Arg Gln Gly Ile Thr

465 470 475 480

Ser Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ser Ala Ser

485 490 495

Pro Ser Ile Leu Asn Met Ser Pro Glu Ala Ala Val Gly Gly Gly Leu

500 505 510

Ser Leu Leu Arg Thr Asn Asp Arg Ile Arg Val Asp Leu Asn Ser Arg

515 520 525

Ser Val Asn Val Leu Val Asp Asp Glu Glu Leu Ala Arg Arg Arg Glu

530 535 540

Thr Ala Thr Phe Ala Ile Pro Pro Thr Gln Thr Pro Trp Gln Glu Leu

545 550 555 560

Tyr Arg Gln Thr Val Gly Gln Leu Ser Thr Gly Gly Cys Leu Glu Pro

565 570 575

Ala Thr Leu Tyr Leu Lys Val Ile Ala Glu Arg Gly Asn Pro Arg His

580 585 590

Ser His

<210> 64

<211> 1239

<212> DNA

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 64

atggttgagc aagcgaagct tagcgacccg aacgcggagt acacgatgcg cgacctgtcc 60

gcggagacga tagacatcac gaatccgcga ggtggcgtcc gcgacgccga aatcacggac 120

gtacagacga cgatggtcga cgggaactac ccgtggattc tcgtccgcgt ctacaccgac 180

gcgggcgtcg tcggcaccgg cgaggcctac tggggcggcg gcgacaccgc catcatcgag 240

cggatgaagc cgttcctcgt cggcgagaac cccctcgaca tcgaccgcct gtacgagcat 300

ctcgtccaga agatgtccgg cgagggctcc gtctcgggca aggtcatctc cgccatctcg 360

ggcatcgaaa tcgcgctcca cgacgtcgcc ggaaagctcc tcgacgtgcc cgcctatcaa 420

ctcgtcggcg ggaagtaccg cgacgaggtg cgcgtctact gcgacctcca caccgaagac 480

gaggccaacc cgcaggcctg cgccgaggag ggcgtccgcg tggtcgagga actcggctac 540

gacgccatca agttcgacct cgacgtgccc tcgggccacg agaaggaccg cgcgaaccgc 600

cacctccgaa accccgaaat cgaccacaag gtcgaaatcg tcgaggccgt caccgaggcc 660

gtcggcgacc gcgcggacgt ggcgttcgac tgccactggt cctttaccgg cgggagcgcc 720

aagcgcctcg cgtccgagct ggaagactac gacgtgtggt ggctcgaaga ccccgtgccg 780

ccggagaacc acgacgtgca gaagctcgtg acgcagtcca cgacgacgcc catcgcggtc 840

ggtgagaacg tctaccggaa gttcggccag cggacgctgc tcgaaccgca ggcggtggat 900

atcatcgcgc ccgacctgcc ccgcgtcggc ggcatgcgcg agacgcggaa gattgccgac 960

ctcgcggaca tgtactacat ccccgtggcg atgcacaacg tctcgtcgcc catcgggacg 1020

atggcctccg cgcaggtcgc cgcggccatc ccgaactcgc tggccctcga ataccactcc 1080

taccagctcg gctggtggga ggacctcgtc gaagaggacg acctgattca gaacggtcac 1140

atggagattc ccgaaaagcc cggcctcggg ctgacgctcg acctcgacgc cgtcgaagca 1200

cacatggtcg aaggggagac gctcttcgac gaggagtaa 1239

<210> 65

<211> 412

<212> PRT

<213> 沃氏富盐菌（Haloferax volcanii）

<400> 65

Met Val Glu Gln Ala Lys Leu Ser Asp Pro Asn Ala Glu Tyr Thr Met

1 5 10 15

Arg Asp Leu Ser Ala Glu Thr Ile Asp Ile Thr Asn Pro Arg Gly Gly

20 25 30

Val Arg Asp Ala Glu Ile Thr Asp Val Gln Thr Thr Met Val Asp Gly

35 40 45

Asn Tyr Pro Trp Ile Leu Val Arg Val Tyr Thr Asp Ala Gly Val Val

50 55 60

Gly Thr Gly Glu Ala Tyr Trp Gly Gly Gly Asp Thr Ala Ile Ile Glu

65 70 75 80

Arg Met Lys Pro Phe Leu Val Gly Glu Asn Pro Leu Asp Ile Asp Arg

85 90 95

Leu Tyr Glu His Leu Val Gln Lys Met Ser Gly Glu Gly Ser Val Ser

100 105 110

Gly Lys Val Ile Ser Ala Ile Ser Gly Ile Glu Ile Ala Leu His Asp

115 120 125

Val Ala Gly Lys Leu Leu Asp Val Pro Ala Tyr Gln Leu Val Gly Gly

130 135 140

Lys Tyr Arg Asp Glu Val Arg Val Tyr Cys Asp Leu His Thr Glu Asp

145 150 155 160

Glu Ala Asn Pro Gln Ala Cys Ala Glu Glu Gly Val Arg Val Val Glu

165 170 175

Glu Leu Gly Tyr Asp Ala Ile Lys Phe Asp Leu Asp Val Pro Ser Gly

180 185 190

His Glu Lys Asp Arg Ala Asn Arg His Leu Arg Asn Pro Glu Ile Asp

195 200 205

His Lys Val Glu Ile Val Glu Ala Val Thr Glu Ala Val Gly Asp Arg

210 215 220

Ala Asp Val Ala Phe Asp Cys His Trp Ser Phe Thr Gly Gly Ser Ala

225 230 235 240

Lys Arg Leu Ala Ser Glu Leu Glu Asp Tyr Asp Val Trp Trp Leu Glu

245 250 255

Asp Pro Val Pro Pro Glu Asn His Asp Val Gln Lys Leu Val Thr Gln

260 265 270

Ser Thr Thr Thr Pro Ile Ala Val Gly Glu Asn Val Tyr Arg Lys Phe

275 280 285

Gly Gln Arg Thr Leu Leu Glu Pro Gln Ala Val Asp Ile Ile Ala Pro

290 295 300

Asp Leu Pro Arg Val Gly Gly Met Arg Glu Thr Arg Lys Ile Ala Asp

305 310 315 320

Leu Ala Asp Met Tyr Tyr Ile Pro Val Ala Met His Asn Val Ser Ser

325 330 335

Pro Ile Gly Thr Met Ala Ser Ala Gln Val Ala Ala Ala Ile Pro Asn

340 345 350

Ser Leu Ala Leu Glu Tyr His Ser Tyr Gln Leu Gly Trp Trp Glu Asp

355 360 365

Leu Val Glu Glu Asp Asp Leu Ile Gln Asn Gly His Met Glu Ile Pro

370 375 380

Glu Lys Pro Gly Leu Gly Leu Thr Leu Asp Leu Asp Ala Val Glu Ala

385 390 395 400

His Met Val Glu Gly Glu Thr Leu Phe Asp Glu Glu

405 410

<210> 66

<211> 1179

<212> DNA

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 66

atgaaagaag ttgttattgc gagcgcggtt cgtaccgcga ttggcagcta tggcaagagc 60

ctgaaggatg ttccggcggt ggacctgggt gcgaccgcga tcaaagaggc ggttaagaaa 120

gcgggcatta aaccggagga tgtgaacgaa gttatcctgg gtaacgtgct gcaagcgggt 180

ctgggccaaa acccggcgcg tcaggcgagc ttcaaggcgg gcctgccggt tgaaatcccg 240

gcgatgacca ttaacaaagt ttgcggtagc ggcctgcgta ccgtgagcct ggcggcgcaa 300

atcattaagg cgggtgacgc ggatgttatc attgcgggtg gcatggagaa catgagccgt 360

gcgccgtacc tggcgaacaa cgcgcgttgg ggttatcgta tgggcaacgc gaaattcgtg 420

gacgaaatga ttaccgacgg tctgtgggat gcgtttaacg actaccacat gggcatcacc 480

gcggagaaca ttgcggaacg ttggaacatt agccgtgagg aacaagatga gttcgcgctg 540

gcgagccaga agaaagcgga ggaagcgatc aagagcggcc agtttaaaga cgaaatcgtt 600

ccggtggtta ttaagggtcg taagggtgaa accgtggtgg acaccgatga acacccgcgt 660

ttcggtagca ccattgaggg cctggcgaag ctgaaaccgg cgtttaagaa agatggcacc 720

gtgaccgcgg gtaacgcgag cggcctgaac gactgcgcgg cggtgctggt tatcatgagc 780

gcggagaagg cgaaagaact gggtgtgaag ccgctggcga aaattgttag ctacggtagc 840

gcgggtgtgg acccggcgat catgggttac ggcccgtttt atgcgaccaa ggcggcgatt 900

gagaaagcgg gttggaccgt ggacgaactg gatctgatcg agagcaacga agcgttcgcg 960

gcgcaaagcc tggcggtggc gaaggatctg aaatttgaca tgaacaaggt gaacgtgaac 1020

ggtggtgcga ttgcgctggg tcacccgatt ggtgcgagcg gcgcgcgtat cctggtgacc 1080

ctggttcacg cgatgcagaa acgtgacgcg aagaaaggtc tggcgaccct gtgcattggt 1140

ggtggtcaag gcaccgcgat tctgctggaa aagtgctaa 1179

<210> 67

<211> 393

<212> PRT

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 67

Met Arg Asp Val Val Ile Val Ser Ala Val Arg Thr Ala Leu Gly Ser

1 5 10 15

Phe Gly Gly Ala Leu Lys Asp Val Ser Ala Val Asp Leu Gly Ala Leu

20 25 30

Val Ile Lys Glu Ala Val Asn Arg Ala Gly Val Lys Pro Glu Leu Ile

35 40 45

Glu Glu Val Ile Met Gly Asn Val Ile Gln Ala Gly Leu Gly Gln Asn

50 55 60

Thr Ala Arg Gln Ser Thr Ile Lys Ala Gly Leu Pro Gln Glu Val Ser

65 70 75 80

Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Ala Val Ser

85 90 95

Leu Ala Ala Gln Met Ile Lys Ala Gly Asp Ala Asp Val Val Val Ala

100 105 110

Gly Gly Met Glu Asn Met Ser Ala Ala Pro Tyr Ala Leu Asp Lys Ala

115 120 125

Arg Trp Gly Gln Arg Met Gly Asp Gly Lys Leu Val Asp Thr Met Ile

130 135 140

Lys Asp Ala Leu Trp Asp Ala Phe Asn Asn Tyr His Met Gly Val Thr

145 150 155 160

Ala Glu Asn Ile Ala Lys Gln Trp Gly Leu Thr Arg Glu Glu Gln Asp

165 170 175

Ala Phe Ser Ala Ser Ser Gln Gln Lys Ala Glu Ala Ala Ile Lys Ser

180 185 190

Gly Arg Phe Lys Asp Glu Ile Val Pro Val Val Ile Pro Gln Arg Lys

195 200 205

Gly Glu Pro Lys Val Phe Asp Thr Asp Glu Phe Pro Arg Phe Gly Thr

210 215 220

Thr Ala Glu Thr Leu Ala Lys Leu Lys Pro Ala Phe Ile Lys Asp Gly

225 230 235 240

Thr Val Thr Ala Gly Asn Ala Ser Gly Ile Asn Asp Gly Ala Ala Ala

245 250 255

Phe Val Val Met Ser Ala Glu Lys Ala Glu Glu Leu Gly Leu Lys Pro

260 265 270

Met Ala Lys Ile Leu Ser Tyr Gly Ser Lys Gly Leu Asp Pro Ala Ile

275 280 285

Met Gly Tyr Gly Pro Phe His Ala Thr Lys Lys Ala Leu Glu Lys Ala

290 295 300

Asn Leu Thr Val Glu Asp Leu Asp Leu Ile Glu Ala Asn Glu Ala Phe

305 310 315 320

Ala Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Ser

325 330 335

Lys Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Val Gly

340 345 350

Ala Ser Gly Ala Arg Ile Leu Val Thr Leu Leu His Glu Met Glu Lys

355 360 365

Arg Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Met

370 375 380

Gly Thr Ala Leu Ile Val Glu Arg Val

385 390

<210> 68

<211> 1179

<212> DNA

<213> 丙酮丁醇梭菌（Clostridium acetobutylicum）

<400> 68

atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60

cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120

gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180

ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240

gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300

attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360

gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420

gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480

gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540

gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600

cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660

tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720

gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780

gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840

gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900

gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960

gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020

ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080

cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140

ggcggacaag gaacagcaat attgctagaa aagtgctag 1179

<210> 69

<211> 392

<212> PRT

<213> 丙酮丁醇梭菌（Clostridium acetobutylicum）

<400> 69

Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser

1 5 10 15

Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr

20 25 30

Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val

35 40 45

Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn

50 55 60

Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro

65 70 75 80

Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser

85 90 95

Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala

100 105 110

Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala

115 120 125

Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile

130 135 140

Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr

145 150 155 160

Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp

165 170 175

Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser

180 185 190

Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys

195 200 205

Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr

210 215 220

Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr

225 230 235 240

Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu

245 250 255

Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu

260 265 270

Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met

275 280 285

Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly

290 295 300

Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala

305 310 315 320

Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys

325 330 335

Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala

340 345 350

Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg

355 360 365

Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly

370 375 380

Thr Ala Ile Leu Leu Glu Lys Cys

385 390

<210> 70

<211> 663

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 70

atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60

atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120

gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180

atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240

aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300

ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360

acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420

tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480

acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540

gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600

gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660

taa 663

<210> 71

<211> 651

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 71

atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60

gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120

atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180

gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240

agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300

ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360

ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420

cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480

caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540

atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600

gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651

<210> 72

<211> 220

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 72

Met Lys Thr Lys Leu Met Thr Leu Gln Asp Ala Thr Gly Phe Phe Arg

1 5 10 15

Asp Gly Met Thr Ile Met Val Gly Gly Phe Met Gly Ile Gly Thr Pro

20 25 30

Ser Arg Leu Val Glu Ala Leu Leu Glu Ser Gly Val Arg Asp Leu Thr

35 40 45

Leu Ile Ala Asn Asp Thr Ala Phe Val Asp Thr Gly Ile Gly Pro Leu

50 55 60

Ile Val Asn Gly Arg Val Arg Lys Val Ile Ala Ser His Ile Gly Thr

65 70 75 80

Asn Pro Glu Thr Gly Arg Arg Met Ile Ser Gly Glu Met Asp Val Val

85 90 95

Leu Val Pro Gln Gly Thr Leu Ile Glu Gln Ile Arg Cys Gly Gly Ala

100 105 110

Gly Leu Gly Gly Phe Leu Thr Pro Thr Gly Val Gly Thr Val Val Glu

115 120 125

Glu Gly Lys Gln Thr Leu Thr Leu Asp Gly Lys Thr Trp Leu Leu Glu

130 135 140

Arg Pro Leu Arg Ala Asp Leu Ala Leu Ile Arg Ala His Arg Cys Asp

145 150 155 160

Thr Leu Gly Asn Leu Thr Tyr Gln Leu Ser Ala Arg Asn Phe Asn Pro

165 170 175

Leu Ile Ala Leu Ala Ala Asp Ile Thr Leu Val Glu Pro Asp Glu Leu

180 185 190

Val Glu Thr Gly Glu Leu Gln Pro Asp His Ile Val Thr Pro Gly Ala

195 200 205

Val Ile Asp His Ile Ile Val Ser Gln Glu Ser Lys

210 215 220

<210> 73

<211> 216

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 73

Met Asp Ala Lys Gln Arg Ile Ala Arg Arg Val Ala Gln Glu Leu Arg

1 5 10 15

Asp Gly Asp Ile Val Asn Leu Gly Ile Gly Leu Pro Thr Met Val Ala

20 25 30

Asn Tyr Leu Pro Glu Gly Ile His Ile Thr Leu Gln Ser Glu Asn Gly

35 40 45

Phe Leu Gly Leu Gly Pro Val Thr Thr Ala His Pro Asp Leu Val Asn

50 55 60

Ala Gly Gly Gln Pro Cys Gly Val Leu Pro Gly Ala Ala Met Phe Asp

65 70 75 80

Ser Ala Met Ser Phe Ala Leu Ile Arg Gly Gly His Ile Asp Ala Cys

85 90 95

Val Leu Gly Gly Leu Gln Val Asp Glu Glu Ala Asn Leu Ala Asn Trp

100 105 110

Val Val Pro Gly Lys Met Val Pro Gly Met Gly Gly Ala Met Asp Leu

115 120 125

Val Thr Gly Ser Arg Lys Val Ile Ile Ala Met Glu His Cys Ala Lys

130 135 140

Asp Gly Ser Ala Lys Ile Leu Arg Arg Cys Thr Met Pro Leu Thr Ala

145 150 155 160

Gln His Ala Val His Met Leu Val Thr Glu Leu Ala Val Phe Arg Phe

165 170 175

Ile Asp Gly Lys Met Trp Leu Thr Glu Ile Ala Asp Gly Cys Asp Leu

180 185 190

Ala Thr Val Arg Ala Lys Thr Glu Ala Arg Phe Glu Val Ala Ala Asp

195 200 205

Leu Asn Thr Gln Arg Gly Asp Leu

210 215

<210> 74

<211> 735

<212> DNA

<213> 丙酮丁醇梭菌（Clostridium acetobutylicum）

<400> 74

atgctgaagg acgaggttat taagcagatt agcaccccgc tgaccagccc ggcgttcccg 60

cgtggtccgt acaagttcca taatcgcgaa tacttcaaca ttgtgtatcg taccgacatg 120

gatgcgctgc gtaaggtggt tccggagccg ctggaaattg acgagccgct ggttcgtttc 180

gaaatcatgg cgatgcacga taccagcggt ctgggctgct acaccgagag cggtcaggcg 240

attccggtga gctttaacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300

gaaccggcga ttgcggtggg tcgtgagctg agcgcgtacc cgaagaaact gggctatccg 360

aagctgttcg tggacagcga taccctggtg ggcaccctgg actacggcaa actgcgtgtt 420

gcgaccgcga ccatgggcta taagcacaaa gcgctggacg cgaacgaagc gaaggatcag 480

atttgccgtc cgaactacat gctgaaaatc attccgaact atgacggtag cccgcgtatc 540

tgcgaactga ttaacgcgaa gatcaccgat gttaccgttc atgaggcgtg gaccggcccg 600

acccgtctgc aactgtttga ccacgcgatg gcgccgctga acgatctgcc ggtgaaagag 660

atcgttagca gcagccacat cctggcggac atcatcctgc cgcgtgcgga agttatctac 720

gattacctga agtaa 735

<210> 75

<211> 244

<212> PRT

<213> 丙酮丁醇梭菌（Clostridium acetobutylicum）

<400> 75

Met Leu Lys Asp Glu Val Ile Lys Gln Ile Ser Thr Pro Leu Thr Ser

1 5 10 15

Pro Ala Phe Pro Arg Gly Pro Tyr Lys Phe His Asn Arg Glu Tyr Phe

20 25 30

Asn Ile Val Tyr Arg Thr Asp Met Asp Ala Leu Arg Lys Val Val Pro

35 40 45

Glu Pro Leu Glu Ile Asp Glu Pro Leu Val Arg Phe Glu Ile Met Ala

50 55 60

Met His Asp Thr Ser Gly Leu Gly Cys Tyr Thr Glu Ser Gly Gln Ala

65 70 75 80

Ile Pro Val Ser Phe Asn Gly Val Lys Gly Asp Tyr Leu His Met Met

85 90 95

Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Leu Ser Ala

100 105 110

Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr

115 120 125

Leu Val Gly Thr Leu Asp Tyr Gly Lys Leu Arg Val Ala Thr Ala Thr

130 135 140

Met Gly Tyr Lys His Lys Ala Leu Asp Ala Asn Glu Ala Lys Asp Gln

145 150 155 160

Ile Cys Arg Pro Asn Tyr Met Leu Lys Ile Ile Pro Asn Tyr Asp Gly

165 170 175

Ser Pro Arg Ile Cys Glu Leu Ile Asn Ala Lys Ile Thr Asp Val Thr

180 185 190

Val His Glu Ala Trp Thr Gly Pro Thr Arg Leu Gln Leu Phe Asp His

195 200 205

Ala Met Ala Pro Leu Asn Asp Leu Pro Val Lys Glu Ile Val Ser Ser

210 215 220

Ser His Ile Leu Ala Asp Ile Ile Leu Pro Arg Ala Glu Val Ile Tyr

225 230 235 240

Asp Tyr Leu Lys

<210> 76

<211> 741

<212> DNA

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 76

atgctggaga gcgaagttag caaacaaatc accaccccgc tggcggcgcc ggcgttcccg 60

cgtggcccgt accgttttca taaccgtgag tacctgaaca tcatttatcg taccgacctg 120

gatgcgctgc gtaagattgt gccggagccg ctggaactgg accgtgcgta cgttcgtttc 180

gagatgatgg cgatgccgga taccaccggt ctgggcagct acaccgaatg cggtcaggcg 240

atcccggtga agtataacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300

gagccggcga ttgcggtggg tcgtgaaagc agcgcgtacc cgaagaaact gggctatccg 360

aagctgtttg tggacagcga taccctggtg ggcaccctga aatatggcac cctgccggtt 420

gcgaccgcga ccatgggcta caagcacgag ccgctggacc tgaaagaagc gtatgcgcag 480

attgcgcgtc cgaacttcat gctgaagatc attcaaggtt atgacggcaa accgcgtatc 540

tgcgagctga tttgcgcgga aaacaccgat atcaccatcc atggtgcgtg gaccggcagc 600

gcgcgtctgc aactgtttag ccatgcgctg gcgccgctgg cggatctgcc ggtgctggaa 660

atcgttagcg cgagccacat tctgaccgat ctgaccctgg gcaccccgaa ggttgtgcat 720

gactatctga gcgtgaagta a 741

<210> 77

<211> 246

<212> PRT

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 77

Met Leu Glu Ser Glu Val Ser Lys Gln Ile Thr Thr Pro Leu Ala Ala

1 5 10 15

Pro Ala Phe Pro Arg Gly Pro Tyr Arg Phe His Asn Arg Glu Tyr Leu

20 25 30

Asn Ile Ile Tyr Arg Thr Asp Leu Asp Ala Leu Arg Lys Ile Val Pro

35 40 45

Glu Pro Leu Glu Leu Asp Arg Ala Tyr Val Arg Phe Glu Met Met Ala

50 55 60

Met Pro Asp Thr Thr Gly Leu Gly Ser Tyr Thr Glu Cys Gly Gln Ala

65 70 75 80

Ile Pro Val Lys Tyr Asn Gly Val Lys Gly Asp Tyr Leu His Met Met

85 90 95

Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Ser Ser Ala

100 105 110

Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr

115 120 125

Leu Val Gly Thr Leu Lys Tyr Gly Thr Leu Pro Val Ala Thr Ala Thr

130 135 140

Met Gly Tyr Lys His Glu Pro Leu Asp Leu Lys Glu Ala Tyr Ala Gln

145 150 155 160

Ile Ala Arg Pro Asn Phe Met Leu Lys Ile Ile Gln Gly Tyr Asp Gly

165 170 175

Lys Pro Arg Ile Cys Glu Leu Ile Cys Ala Glu Asn Thr Asp Ile Thr

180 185 190

Ile His Gly Ala Trp Thr Gly Ser Ala Arg Leu Gln Leu Phe Ser His

195 200 205

Ala Leu Ala Pro Leu Ala Asp Leu Pro Val Leu Glu Ile Val Ser Ala

210 215 220

Ser His Ile Leu Thr Asp Leu Thr Leu Gly Thr Pro Lys Val Val His

225 230 235 240

Asp Tyr Leu Ser Val Lys

245

<210> 78

<211> 191

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> OXB11启动子

<400> 78

aagctgttgt gaccgcttgc tctagccagc tatcgagttg tgaaccgatc catctagcaa 60

ttggactcga tctagcgata ggcttcgatc tagctatgta gaaacgccgt gtgctcgatc 120

gcctgataag gtccacagta gctgctataa ttgcttcaac agaacatatt gactatccgg 180

tattacccgg c 191

<210> 79

<211> 1500

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 79

atgagcatct tgtacgaaga gcgtcttgat ggcgctttac ccgatgtcga ccgcacatcg 60

gtactgatgg cactgcgtga gcatgtccct ggacttgaga tcctgcatac cgatgaggag 120

atcattcctt acgagtgtga cgggttgagc gcgtatcgca cgcgtccatt actggttgtt 180

ctgcctaagc aaatggaaca ggtgacagcg attctggctg tctgccatcg cctgcgtgta 240

ccggtggtga cccgtggtgc aggcaccggg ctttctggtg gcgcgctgcc gctggaaaaa 300

ggtgtgttgt tggtgatggc gcgctttaaa gagatcctcg acattaaccc cgttggtcgc 360

cgcgcgcgcg tgcagccagg cgtgcgtaac ctggcgatct cccaggccgt tgcaccgcat 420

aatctctact acgcaccgga cccttcctca caaatcgcct gttccattgg cggcaatgtg 480

gctgaaaatg ccggcggcgt ccactgcctg aaatatggtc tgaccgtaca taacctgctg 540

aaaattgaag tgcaaacgct ggacggcgag gcactgacgc ttggatcgga cgcgctggat 600

tcacctggtt ttgacctgct ggcgctgttc accggatcgg aaggtatgct cggcgtgacc 660

accgaagtga cggtaaaact gctgccgaag ccgcccgtgg cgcgggttct gttagccagc 720

tttgactcgg tagaaaaagc cggacttgcg gttggtgaca tcatcgccaa tggcattatc 780

cccggcgggc tggagatgat ggataacctg tcgatccgcg cggcggaaga ttttattcat 840

gccggttatc ccgtcgacgc cgaagcgatt ttgttatgcg agctggacgg cgtggagtct 900

gacgtacagg aagactgcga gcgggttaac gacatcttgt tgaaagcggg cgcgactgac 960

gtccgtctgg cacaggacga agcagagcgc gtacgtttct gggccggtcg caaaaatgcg 1020

ttcccggcgg taggacgtat ctccccggat tactactgca tggatggcac catcccgcgt 1080

cgcgccctgc ctggcgtact ggaaggcatt gcccgtttat cgcagcaata tgatttacgt 1140

gttgccaacg tctttcatgc cggagatggc aacatgcacc cgttaatcct tttcgatgcc 1200

aacgaacccg gtgaatttgc ccgcgcggaa gagctgggcg ggaagatcct cgaactctgc 1260

gttgaagttg gcggcagcat cagtggcgaa catggcatcg ggcgagaaaa aatcaatcaa 1320

atgtgcgccc agttcaacag cgatgaaatc acgaccttcc atgcggtcaa ggcggcgttt 1380

gaccccgatg gtttgctgaa ccctgggaaa aacattccca cgctacaccg ctgtgctgaa 1440

tttggtgcca tgcatgtgca tcacggtcat ttacctttcc ctgaactgga gcgtttctga 1500

<210> 80

<211> 1053

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 80

atgctacgcg agtgtgatta cagccaggcg ctgctggagc aggtgaatca ggcgattagc 60

gataaaacgc cgctggtgat tcagggcagc aatagcaaag cctttttagg tcgccctgtc 120

accgggcaaa cgctggatgt tcgttgtcat cgcggcattg ttaattacga cccgaccgag 180

ctggtgataa ccgcgcgtgt cggaacgccg ctggtgacaa ttgaagcggc gctggaaagc 240

gcggggcaaa tgctcccctg tgagccgccg cattatggtg aagaagccac ctggggcggg 300

atggtcgcct gcgggctggc ggggccgcgt cgcccgtgga gcggttcggt ccgcgatttt 360

gtcctcggca cgcgcatcat taccggcgct ggaaaacatc tgcgttttgg tggcgaagtg 420

atgaaaaacg ttgccggata cgatctctca cggttaatgg tcggaagcta cggttgtctt 480

ggcgtgctca ctgaaatctc aatgaaagtg ttaccgcgac cgcgcgcctc cctgagcctg 540

cgtcgggaaa tcagcctgca agaagccatg agtgaaatcg ccgagtggca actccagcca 600

ttacccatta gtggcttatg ttacttcgac aatgcgttgt ggatccgcct tgagggcggc 660

gaaggatcgg taaaagcagc gcgtgaactg ctgggtggcg aagaggttgc cggtcagttc 720

tggcagcaat tgcgtgaaca acaactgccg ttcttctcgt taccaggtac cttatggcgc 780

atttcattac ccagtgatgc gccgatgatg gatttacccg gcgagcaact gatcgactgg 840

ggcggggcgt tacgctggct gaaatcgaca gccgaggaca atcaaatcca tcgcatcgcc 900

cgcaacgctg gcggtcatgc gacccgcttt agtgccggag atggtggctt tgccccgcta 960

tcggctcctt tattccgcta tcaccagcag cttaaacagc agctcgaccc ttgcggcgtg 1020

tttaaccccg gtcgcatgta cgcggaactt tga 1053

<210> 81

<211> 1224

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 81

atgcaaaccc aattaactga agagatgcgg cagaacgcgc gcgcgctgga agccgacagc 60

atcctgcgcg cctgtgttca ctgcggattt tgtaccgcaa cctgcccaac ctatcagctt 120

ctgggcgatg aactggacgg gccgcgcggg cgcatctatc tgattaaaca ggtgctggaa 180

ggcaacgaag tcacgcttaa aacacaggag catctcgatc gctgcctcac ttgccgtaat 240

tgtgaaacca cctgtccttc tggtgtgcgc tatcacaatt tgctggatat cgggcgtgat 300

attgtcgagc agaaagtgaa acgcccactg ccggagcgaa tactgcgcga aggattgcgc 360

caggtagtgc cgcgtccggc ggtcttccgt gcgctgacgc aggtagggct ggtgctgcga 420

ccgtttttac cggaacaggt cagagcaaaa ctgcctgctg aaacggtgaa agctaaaccg 480

cgtccgccgc tgcgccataa gcgtcgggtt ttaatgttgg aaggctgcgc ccagcctacg 540

ctttcgccca acaccaacgc ggcaactgcg cgagtgctgg atcgtctggg gatcagcgtc 600

atgccagcta acgaagcagg ctgttgtggc gcggtggact atcatcttaa tgcgcaggag 660

aaagggctgg cacgggcgcg caataatatt gatgcctggt ggcccgcgat tgaagcaggt 720

gccgaggcaa ttttgcaaac cgccagcggc tgcggcgcgt ttgtcaaaga gtatgggcag 780

atgctgaaaa acgatgcgtt atatgccgat aaagcacgtc aggtcagtga actggcggtc 840

gatttagtcg aacttctgcg cgaggaaccg ctggaaaaac tggcaattcg cggcgataaa 900

aagctggcct tccactgtcc gtgtacccta caacatgcgc aaaagctgaa cggcgaagtg 960

gaaaaagtgt tgcttcgtct tggatttacc ttaacggacg ttcccgacag ccatctgtgc 1020

tgcggttcag cgggaacata tgcgttaacg catcccgatc tggcacgcca gctgcgggat 1080

aacaaaatga atgcgctgga aagcggcaaa ccggaaatga tcgtcaccgc caacattggt 1140

tgccagacgc atctggcgag cgccggtcgt acctctgtgc gtcactggat tgaaattgta 1200

gaacaagccc ttgaaaagga ataa 1224

<210> 82

<211> 499

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 82

Met Ser Ile Leu Tyr Glu Glu Arg Leu Asp Gly Ala Leu Pro Asp Val

1 5 10 15

Asp Arg Thr Ser Val Leu Met Ala Leu Arg Glu His Val Pro Gly Leu

20 25 30

Glu Ile Leu His Thr Asp Glu Glu Ile Ile Pro Tyr Glu Cys Asp Gly

35 40 45

Leu Ser Ala Tyr Arg Thr Arg Pro Leu Leu Val Val Leu Pro Lys Gln

50 55 60

Met Glu Gln Val Thr Ala Ile Leu Ala Val Cys His Arg Leu Arg Val

65 70 75 80

Pro Val Val Thr Arg Gly Ala Gly Thr Gly Leu Ser Gly Gly Ala Leu

85 90 95

Pro Leu Glu Lys Gly Val Leu Leu Val Met Ala Arg Phe Lys Glu Ile

100 105 110

Leu Asp Ile Asn Pro Val Gly Arg Arg Ala Arg Val Gln Pro Gly Val

115 120 125

Arg Asn Leu Ala Ile Ser Gln Ala Val Ala Pro His Asn Leu Tyr Tyr

130 135 140

Ala Pro Asp Pro Ser Ser Gln Ile Ala Cys Ser Ile Gly Gly Asn Val

145 150 155 160

Ala Glu Asn Ala Gly Gly Val His Cys Leu Lys Tyr Gly Leu Thr Val

165 170 175

His Asn Leu Leu Lys Ile Glu Val Gln Thr Leu Asp Gly Glu Ala Leu

180 185 190

Thr Leu Gly Ser Asp Ala Leu Asp Ser Pro Gly Phe Asp Leu Leu Ala

195 200 205

Leu Phe Thr Gly Ser Glu Gly Met Leu Gly Val Thr Thr Glu Val Thr

210 215 220

Val Lys Leu Leu Pro Lys Pro Pro Val Ala Arg Val Leu Leu Ala Ser

225 230 235 240

Phe Asp Ser Val Glu Lys Ala Gly Leu Ala Val Gly Asp Ile Ile Ala

245 250 255

Asn Gly Ile Ile Pro Gly Gly Leu Glu Met Met Asp Asn Leu Ser Ile

260 265 270

Arg Ala Ala Glu Asp Phe Ile His Ala Gly Tyr Pro Val Asp Ala Glu

275 280 285

Ala Ile Leu Leu Cys Glu Leu Asp Gly Val Glu Ser Asp Val Gln Glu

290 295 300

Asp Cys Glu Arg Val Asn Asp Ile Leu Leu Lys Ala Gly Ala Thr Asp

305 310 315 320

Val Arg Leu Ala Gln Asp Glu Ala Glu Arg Val Arg Phe Trp Ala Gly

325 330 335

Arg Lys Asn Ala Phe Pro Ala Val Gly Arg Ile Ser Pro Asp Tyr Tyr

340 345 350

Cys Met Asp Gly Thr Ile Pro Arg Arg Ala Leu Pro Gly Val Leu Glu

355 360 365

Gly Ile Ala Arg Leu Ser Gln Gln Tyr Asp Leu Arg Val Ala Asn Val

370 375 380

Phe His Ala Gly Asp Gly Asn Met His Pro Leu Ile Leu Phe Asp Ala

385 390 395 400

Asn Glu Pro Gly Glu Phe Ala Arg Ala Glu Glu Leu Gly Gly Lys Ile

405 410 415

Leu Glu Leu Cys Val Glu Val Gly Gly Ser Ile Ser Gly Glu His Gly

420 425 430

Ile Gly Arg Glu Lys Ile Asn Gln Met Cys Ala Gln Phe Asn Ser Asp

435 440 445

Glu Ile Thr Thr Phe His Ala Val Lys Ala Ala Phe Asp Pro Asp Gly

450 455 460

Leu Leu Asn Pro Gly Lys Asn Ile Pro Thr Leu His Arg Cys Ala Glu

465 470 475 480

Phe Gly Ala Met His Val His His Gly His Leu Pro Phe Pro Glu Leu

485 490 495

Glu Arg Phe

<210> 83

<211> 350

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 83

Met Leu Arg Glu Cys Asp Tyr Ser Gln Ala Leu Leu Glu Gln Val Asn

1 5 10 15

Gln Ala Ile Ser Asp Lys Thr Pro Leu Val Ile Gln Gly Ser Asn Ser

20 25 30

Lys Ala Phe Leu Gly Arg Pro Val Thr Gly Gln Thr Leu Asp Val Arg

35 40 45

Cys His Arg Gly Ile Val Asn Tyr Asp Pro Thr Glu Leu Val Ile Thr

50 55 60

Ala Arg Val Gly Thr Pro Leu Val Thr Ile Glu Ala Ala Leu Glu Ser

65 70 75 80

Ala Gly Gln Met Leu Pro Cys Glu Pro Pro His Tyr Gly Glu Glu Ala

85 90 95

Thr Trp Gly Gly Met Val Ala Cys Gly Leu Ala Gly Pro Arg Arg Pro

100 105 110

Trp Ser Gly Ser Val Arg Asp Phe Val Leu Gly Thr Arg Ile Ile Thr

115 120 125

Gly Ala Gly Lys His Leu Arg Phe Gly Gly Glu Val Met Lys Asn Val

130 135 140

Ala Gly Tyr Asp Leu Ser Arg Leu Met Val Gly Ser Tyr Gly Cys Leu

145 150 155 160

Gly Val Leu Thr Glu Ile Ser Met Lys Val Leu Pro Arg Pro Arg Ala

165 170 175

Ser Leu Ser Leu Arg Arg Glu Ile Ser Leu Gln Glu Ala Met Ser Glu

180 185 190

Ile Ala Glu Trp Gln Leu Gln Pro Leu Pro Ile Ser Gly Leu Cys Tyr

195 200 205

Phe Asp Asn Ala Leu Trp Ile Arg Leu Glu Gly Gly Glu Gly Ser Val

210 215 220

Lys Ala Ala Arg Glu Leu Leu Gly Gly Glu Glu Val Ala Gly Gln Phe

225 230 235 240

Trp Gln Gln Leu Arg Glu Gln Gln Leu Pro Phe Phe Ser Leu Pro Gly

245 250 255

Thr Leu Trp Arg Ile Ser Leu Pro Ser Asp Ala Pro Met Met Asp Leu

260 265 270

Pro Gly Glu Gln Leu Ile Asp Trp Gly Gly Ala Leu Arg Trp Leu Lys

275 280 285

Ser Thr Ala Glu Asp Asn Gln Ile His Arg Ile Ala Arg Asn Ala Gly

290 295 300

Gly His Ala Thr Arg Phe Ser Ala Gly Asp Gly Gly Phe Ala Pro Leu

305 310 315 320

Ser Ala Pro Leu Phe Arg Tyr His Gln Gln Leu Lys Gln Gln Leu Asp

325 330 335

Pro Cys Gly Val Phe Asn Pro Gly Arg Met Tyr Ala Glu Leu

340 345 350

<210> 84

<211> 407

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 84

Met Gln Thr Gln Leu Thr Glu Glu Met Arg Gln Asn Ala Arg Ala Leu

1 5 10 15

Glu Ala Asp Ser Ile Leu Arg Ala Cys Val His Cys Gly Phe Cys Thr

20 25 30

Ala Thr Cys Pro Thr Tyr Gln Leu Leu Gly Asp Glu Leu Asp Gly Pro

35 40 45

Arg Gly Arg Ile Tyr Leu Ile Lys Gln Val Leu Glu Gly Asn Glu Val

50 55 60

Thr Leu Lys Thr Gln Glu His Leu Asp Arg Cys Leu Thr Cys Arg Asn

65 70 75 80

Cys Glu Thr Thr Cys Pro Ser Gly Val Arg Tyr His Asn Leu Leu Asp

85 90 95

Ile Gly Arg Asp Ile Val Glu Gln Lys Val Lys Arg Pro Leu Pro Glu

100 105 110

Arg Ile Leu Arg Glu Gly Leu Arg Gln Val Val Pro Arg Pro Ala Val

115 120 125

Phe Arg Ala Leu Thr Gln Val Gly Leu Val Leu Arg Pro Phe Leu Pro

130 135 140

Glu Gln Val Arg Ala Lys Leu Pro Ala Glu Thr Val Lys Ala Lys Pro

145 150 155 160

Arg Pro Pro Leu Arg His Lys Arg Arg Val Leu Met Leu Glu Gly Cys

165 170 175

Ala Gln Pro Thr Leu Ser Pro Asn Thr Asn Ala Ala Thr Ala Arg Val

180 185 190

Leu Asp Arg Leu Gly Ile Ser Val Met Pro Ala Asn Glu Ala Gly Cys

195 200 205

Cys Gly Ala Val Asp Tyr His Leu Asn Ala Gln Glu Lys Gly Leu Ala

210 215 220

Arg Ala Arg Asn Asn Ile Asp Ala Trp Trp Pro Ala Ile Glu Ala Gly

225 230 235 240

Ala Glu Ala Ile Leu Gln Thr Ala Ser Gly Cys Gly Ala Phe Val Lys

245 250 255

Glu Tyr Gly Gln Met Leu Lys Asn Asp Ala Leu Tyr Ala Asp Lys Ala

260 265 270

Arg Gln Val Ser Glu Leu Ala Val Asp Leu Val Glu Leu Leu Arg Glu

275 280 285

Glu Pro Leu Glu Lys Leu Ala Ile Arg Gly Asp Lys Lys Leu Ala Phe

290 295 300

His Cys Pro Cys Thr Leu Gln His Ala Gln Lys Leu Asn Gly Glu Val

305 310 315 320

Glu Lys Val Leu Leu Arg Leu Gly Phe Thr Leu Thr Asp Val Pro Asp

325 330 335

Ser His Leu Cys Cys Gly Ser Ala Gly Thr Tyr Ala Leu Thr His Pro

340 345 350

Asp Leu Ala Arg Gln Leu Arg Asp Asn Lys Met Asn Ala Leu Glu Ser

355 360 365

Gly Lys Pro Glu Met Ile Val Thr Ala Asn Ile Gly Cys Gln Thr His

370 375 380

Leu Ala Ser Ala Gly Arg Thr Ser Val Arg His Trp Ile Glu Ile Val

385 390 395 400

Glu Gln Ala Leu Glu Lys Glu

405

<210> 85

<211> 828

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 85

atggctaatc caaccgttat taagctacag gatggcaatg tcatgcccca gctgggactg 60

ggcgtctggc aagcaagtaa tgaggaagta atcaccgcca ttcaaaaagc gttagaagtg 120

ggttatcgct cgattgatac cgccgcggcc tacaagaacg aagaaggtgt cggcaaagcc 180

ctgaaaaatg cctcagtcaa cagagaagaa ctgttcatca ccactaagct gtggaacgac 240

gaccacaagc gcccccgcga agccctgctc gacagcctga aaaaactcca gcttgattat 300

atcgacctct acttaatgca ctggcccgtt cccgctatcg accattatgt cgaagcatgg 360

aaaggcatga tcgaattgca aaaagaggga ttaatcaaaa gcatcggcgt gtgcaacttc 420

cagatccatc acctgcaacg cctgattgat gaaactggcg tgacgcctgt gataaaccag 480

atcgaacttc atccgctgat gcaacaacgc cagctacacg cctggaacgc gacacacaaa 540

atccagaccg aatcctggag cccattagcg caaggaggga aaggcgtttt cgatcagaaa 600

gtcattcgcg atctggcaga taaatacggc aaaaccccgg cgcagattgt tatccgctgg 660

catctggata gcggcctggt ggtgatcccg aaatcggtca caccttcacg tattgccgaa 720

aactttgatg tctgggattt ccgtctcgac aaagacgaac tcggcgaaat tgcaaaactc 780

gatcagggca agcgtctcgg tcccgatcct gaccagttcg gcggctaa 828

<210> 86

<211> 275

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 86

Met Ala Asn Pro Thr Val Ile Lys Leu Gln Asp Gly Asn Val Met Pro

1 5 10 15

Gln Leu Gly Leu Gly Val Trp Gln Ala Ser Asn Glu Glu Val Ile Thr

20 25 30

Ala Ile Gln Lys Ala Leu Glu Val Gly Tyr Arg Ser Ile Asp Thr Ala

35 40 45

Ala Ala Tyr Lys Asn Glu Glu Gly Val Gly Lys Ala Leu Lys Asn Ala

50 55 60

Ser Val Asn Arg Glu Glu Leu Phe Ile Thr Thr Lys Leu Trp Asn Asp

65 70 75 80

Asp His Lys Arg Pro Arg Glu Ala Leu Leu Asp Ser Leu Lys Lys Leu

85 90 95

Gln Leu Asp Tyr Ile Asp Leu Tyr Leu Met His Trp Pro Val Pro Ala

100 105 110

Ile Asp His Tyr Val Glu Ala Trp Lys Gly Met Ile Glu Leu Gln Lys

115 120 125

Glu Gly Leu Ile Lys Ser Ile Gly Val Cys Asn Phe Gln Ile His His

130 135 140

Leu Gln Arg Leu Ile Asp Glu Thr Gly Val Thr Pro Val Ile Asn Gln

145 150 155 160

Ile Glu Leu His Pro Leu Met Gln Gln Arg Gln Leu His Ala Trp Asn

165 170 175

Ala Thr His Lys Ile Gln Thr Glu Ser Trp Ser Pro Leu Ala Gln Gly

180 185 190

Gly Lys Gly Val Phe Asp Gln Lys Val Ile Arg Asp Leu Ala Asp Lys

195 200 205

Tyr Gly Lys Thr Pro Ala Gln Ile Val Ile Arg Trp His Leu Asp Ser

210 215 220

Gly Leu Val Val Ile Pro Lys Ser Val Thr Pro Ser Arg Ile Ala Glu

225 230 235 240

Asn Phe Asp Val Trp Asp Phe Arg Leu Asp Lys Asp Glu Leu Gly Glu

245 250 255

Ile Ala Lys Leu Asp Gln Gly Lys Arg Leu Gly Pro Asp Pro Asp Gln

260 265 270

Phe Gly Gly

275

<210> 87

<211> 1050

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 87

atgaagatca aagctgttgg tgcatattcc gctaaacaac cacttgaacc gatggatatc 60

acccggcgtg aaccgggacc gaatgatgtc aaaatcgaaa tcgcttactg tggcgtttgc 120

cattccgatc tccaccaggt ccgttccgag tgggcgggga cggtttaccc ctgcgtgccg 180

ggtcatgaaa ttgtggggcg tgtggtagcc gttggtgatc aggtagaaaa atatgcgccg 240

ggcgatctgg tcggtgtcgg ctgcattgtc gacagttgta aacattgcga agagtgtgaa 300

gacgggttgg aaaactactg tgatcacatg accggcacct ataactcgcc gacgccggac 360

gaaccgggcc atactctggg cggctactca caacagatcg tcgttcatga gcgatatgtt 420

ctgcgtattc gtcacccgca agagcagctg gcggcggtgg ctcctttgtt gtgtgcaggg 480

atcaccacgt attcgccgct acgtcactgg caggccgggc cgggtaaaaa agtgggcgtg 540

gtcggcatcg gcggtctggg acatatgggg attaagctgg cccacgcgat gggggcacat 600

gtggtggcat ttaccacttc tgaggcaaaa cgcgaagcgg caaaagccct gggggccgat 660

gaagttgtta actcacgcaa tgccgatgag atggcggctc atctgaagag tttcgatttc 720

attttgaata cagtagctgc gccacataat ctcgacgatt ttaccacctt gctgaagcgt 780

gatggcacca tgacgctggt tggtgcgcct gcgacaccgc ataaatcgcc ggaagttttc 840

aacctgatca tgaaacgccg tgcgatagcc ggttctatga ttggcggcat tccagaaact 900

caggagatgc tcgatttttg cgccgaacat ggcatcgtgg ctgatataga gatgattcgg 960

gccgatcaaa ttaatgaagc ctatgagcga atgctgcgcg gtgatgtgaa atatcgtttt 1020

gttatcgata atcgcacact aacagactga 1050

<210> 88

<211> 349

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 88

Met Lys Ile Lys Ala Val Gly Ala Tyr Ser Ala Lys Gln Pro Leu Glu

1 5 10 15

Pro Met Asp Ile Thr Arg Arg Glu Pro Gly Pro Asn Asp Val Lys Ile

20 25 30

Glu Ile Ala Tyr Cys Gly Val Cys His Ser Asp Leu His Gln Val Arg

35 40 45

Ser Glu Trp Ala Gly Thr Val Tyr Pro Cys Val Pro Gly His Glu Ile

50 55 60

Val Gly Arg Val Val Ala Val Gly Asp Gln Val Glu Lys Tyr Ala Pro

65 70 75 80

Gly Asp Leu Val Gly Val Gly Cys Ile Val Asp Ser Cys Lys His Cys

85 90 95

Glu Glu Cys Glu Asp Gly Leu Glu Asn Tyr Cys Asp His Met Thr Gly

100 105 110

Thr Tyr Asn Ser Pro Thr Pro Asp Glu Pro Gly His Thr Leu Gly Gly

115 120 125

Tyr Ser Gln Gln Ile Val Val His Glu Arg Tyr Val Leu Arg Ile Arg

130 135 140

His Pro Gln Glu Gln Leu Ala Ala Val Ala Pro Leu Leu Cys Ala Gly

145 150 155 160

Ile Thr Thr Tyr Ser Pro Leu Arg His Trp Gln Ala Gly Pro Gly Lys

165 170 175

Lys Val Gly Val Val Gly Ile Gly Gly Leu Gly His Met Gly Ile Lys

180 185 190

Leu Ala His Ala Met Gly Ala His Val Val Ala Phe Thr Thr Ser Glu

195 200 205

Ala Lys Arg Glu Ala Ala Lys Ala Leu Gly Ala Asp Glu Val Val Asn

210 215 220

Ser Arg Asn Ala Asp Glu Met Ala Ala His Leu Lys Ser Phe Asp Phe

225 230 235 240

Ile Leu Asn Thr Val Ala Ala Pro His Asn Leu Asp Asp Phe Thr Thr

245 250 255

Leu Leu Lys Arg Asp Gly Thr Met Thr Leu Val Gly Ala Pro Ala Thr

260 265 270

Pro His Lys Ser Pro Glu Val Phe Asn Leu Ile Met Lys Arg Arg Ala

275 280 285

Ile Ala Gly Ser Met Ile Gly Gly Ile Pro Glu Thr Gln Glu Met Leu

290 295 300

Asp Phe Cys Ala Glu His Gly Ile Val Ala Asp Ile Glu Met Ile Arg

305 310 315 320

Ala Asp Gln Ile Asn Glu Ala Tyr Glu Arg Met Leu Arg Gly Asp Val

325 330 335

Lys Tyr Arg Phe Val Ile Asp Asn Arg Thr Leu Thr Asp

340 345

<210> 89

<211> 1305

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 89

atgaaaaccc gtacacaaca aattgaagaa ttacagaaag agtggactca accgcgttgg 60

gaaggcatta ctcgcccata cagtgcggaa gatgtggtga aattacgcgg ttcagtcaat 120

cctgaatgca cgctggcgca actgggcgca gcgaaaatgt ggcgtctgct gcacggtgag 180

tcgaaaaaag gctacatcaa cagcctcggc gcactgactg gcggtcaggc gctgcaacag 240

gcgaaagcgg gtattgaagc agtctatctg tcgggatggc aggtagcggc ggacgctaac 300

ctggcggcca gcatgtatcc ggatcagtcg ctctatccgg caaactcggt gccagctgtg 360

gtggagcgga tcaacaacac cttccgtcgt gccgatcaga tccaatggtc cgcgggcatt 420

gagccgggcg atccgcgcta tgtcgattac ttcctgccga tcgttgccga tgcggaagcc 480

ggttttggcg gtgtcctgaa tgcctttgaa ctgatgaaag cgatgattga agccggtgca 540

gcggcagttc acttcgaaga tcagctggcg tcagtgaaga aatgcggtca catgggcggc 600

aaagttttag tgccaactca ggaagctatt cagaaactgg tcgcggcgcg tctggcagct 660

gacgtgacgg gcgttccaac cctgctggtt gcccgtaccg atgctgatgc ggcggatctg 720

atcacctccg attgcgaccc gtatgacagc gaatttatta ccggcgagcg taccagtgaa 780

ggcttcttcc gtactcatgc gggcattgag caagcgatca gccgtggcct ggcgtatgcg 840

ccatatgctg acctggtctg gtgtgaaacc tccacgccgg atctggaact ggcgcgtcgc 900

tttgcacaag ctatccacgc gaaatatccg ggcaaactgc tggcttataa ctgctcgccg 960

tcgttcaact ggcagaaaaa cctcgacgac aaaactattg ccagcttcca gcagcagctg 1020

tcggatatgg gctacaagtt ccagttcatc accctggcag gtatccacag catgtggttc 1080

aacatgtttg acctggcaaa cgcctatgcc cagggcgagg gtatgaagca ctacgttgag 1140

aaagtgcagc agccggaatt tgccgccgcg aaagatggct ataccttcgt atctcaccag 1200

caggaagtgg gtacaggtta cttcgataaa gtgacgacta ttattcaggg cggcacgtct 1260

tcagtcaccg cgctgaccgg ctccactgaa gaatcgcagt tctaa 1305

<210> 90

<211> 434

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 90

Met Lys Thr Arg Thr Gln Gln Ile Glu Glu Leu Gln Lys Glu Trp Thr

1 5 10 15

Gln Pro Arg Trp Glu Gly Ile Thr Arg Pro Tyr Ser Ala Glu Asp Val

20 25 30

Val Lys Leu Arg Gly Ser Val Asn Pro Glu Cys Thr Leu Ala Gln Leu

35 40 45

Gly Ala Ala Lys Met Trp Arg Leu Leu His Gly Glu Ser Lys Lys Gly

50 55 60

Tyr Ile Asn Ser Leu Gly Ala Leu Thr Gly Gly Gln Ala Leu Gln Gln

65 70 75 80

Ala Lys Ala Gly Ile Glu Ala Val Tyr Leu Ser Gly Trp Gln Val Ala

85 90 95

Ala Asp Ala Asn Leu Ala Ala Ser Met Tyr Pro Asp Gln Ser Leu Tyr

100 105 110

Pro Ala Asn Ser Val Pro Ala Val Val Glu Arg Ile Asn Asn Thr Phe

115 120 125

Arg Arg Ala Asp Gln Ile Gln Trp Ser Ala Gly Ile Glu Pro Gly Asp

130 135 140

Pro Arg Tyr Val Asp Tyr Phe Leu Pro Ile Val Ala Asp Ala Glu Ala

145 150 155 160

Gly Phe Gly Gly Val Leu Asn Ala Phe Glu Leu Met Lys Ala Met Ile

165 170 175

Glu Ala Gly Ala Ala Ala Val His Phe Glu Asp Gln Leu Ala Ser Val

180 185 190

Lys Lys Cys Gly His Met Gly Gly Lys Val Leu Val Pro Thr Gln Glu

195 200 205

Ala Ile Gln Lys Leu Val Ala Ala Arg Leu Ala Ala Asp Val Thr Gly

210 215 220

Val Pro Thr Leu Leu Val Ala Arg Thr Asp Ala Asp Ala Ala Asp Leu

225 230 235 240

Ile Thr Ser Asp Cys Asp Pro Tyr Asp Ser Glu Phe Ile Thr Gly Glu

245 250 255

Arg Thr Ser Glu Gly Phe Phe Arg Thr His Ala Gly Ile Glu Gln Ala

260 265 270

Ile Ser Arg Gly Leu Ala Tyr Ala Pro Tyr Ala Asp Leu Val Trp Cys

275 280 285

Glu Thr Ser Thr Pro Asp Leu Glu Leu Ala Arg Arg Phe Ala Gln Ala

290 295 300

Ile His Ala Lys Tyr Pro Gly Lys Leu Leu Ala Tyr Asn Cys Ser Pro

305 310 315 320

Ser Phe Asn Trp Gln Lys Asn Leu Asp Asp Lys Thr Ile Ala Ser Phe

325 330 335

Gln Gln Gln Leu Ser Asp Met Gly Tyr Lys Phe Gln Phe Ile Thr Leu

340 345 350

Ala Gly Ile His Ser Met Trp Phe Asn Met Phe Asp Leu Ala Asn Ala

355 360 365

Tyr Ala Gln Gly Glu Gly Met Lys His Tyr Val Glu Lys Val Gln Gln

370 375 380

Pro Glu Phe Ala Ala Ala Lys Asp Gly Tyr Thr Phe Val Ser His Gln

385 390 395 400

Gln Glu Val Gly Thr Gly Tyr Phe Asp Lys Val Thr Thr Ile Ile Gln

405 410 415

Gly Gly Thr Ser Ser Val Thr Ala Leu Thr Gly Ser Thr Glu Glu Ser

420 425 430

Gln Phe

<210> 91

<211> 939

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 91

atggatatca tcttttatca cccaacgttc gatacccaat ggtggattga ggcactgcgc 60

aaagctattc ctcaggcaag agtcagagca tggaaaagcg gagataatga ctctgctgat 120

tatgctttag tctggcatcc tcctgttgaa atgctggcag ggcgcgatct taaagcggtg 180

ttcgcactcg gggccggtgt tgattctatt ttgagcaagc tacaggcaca ccctgaaatg 240

ctgaaccctt ctgttccact ttttcgcctg gaagataccg gtatgggcga gcaaatgcag 300

gaatatgctg tcagtcaggt gctgcattgg tttcgacgtt ttgacgatta tcgcatccag 360

caaaatagtt cgcattggca accgctgcct gaatatcatc gggaagattt taccatcggc 420

attttgggcg caggcgtact gggcagtaaa gttgctcaga gtctgcaaac ctggcgcttt 480

ccgctgcgtt gctggagtcg aacccgtaaa tcgtggcctg gcgtgcaaag ctttgccgga 540

cgggaagaac tgtctgcatt tctgagccaa tgtcgggtat tgattaattt gttaccgaat 600

acccctgaaa ccgtcggcat tattaatcaa caattactcg aaaaattacc ggatggcgcg 660

tatctcctca acctggcgcg tggtgttcat gttgtggaag atgacctgct cgcggcgctg 720

gatagcggca aagttaaagg cgcaatgttg gatgttttta atcgtgaacc cttaccgcct 780

gaaagtccgc tctggcaaca tccacgcgtg acgataacac cacatgtcgc cgcgattacc 840

cgtcccgctg aagctgtgga gtacatttct cgcaccattg cccagctcga aaaaggggag 900

agggtctgcg ggcaagtcga ccgcgcacgc ggctactaa 939

<210> 92

<211> 312

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 92

Met Asp Ile Ile Phe Tyr His Pro Thr Phe Asp Thr Gln Trp Trp Ile

1 5 10 15

Glu Ala Leu Arg Lys Ala Ile Pro Gln Ala Arg Val Arg Ala Trp Lys

20 25 30

Ser Gly Asp Asn Asp Ser Ala Asp Tyr Ala Leu Val Trp His Pro Pro

35 40 45

Val Glu Met Leu Ala Gly Arg Asp Leu Lys Ala Val Phe Ala Leu Gly

50 55 60

Ala Gly Val Asp Ser Ile Leu Ser Lys Leu Gln Ala His Pro Glu Met

65 70 75 80

Leu Asn Pro Ser Val Pro Leu Phe Arg Leu Glu Asp Thr Gly Met Gly

85 90 95

Glu Gln Met Gln Glu Tyr Ala Val Ser Gln Val Leu His Trp Phe Arg

100 105 110

Arg Phe Asp Asp Tyr Arg Ile Gln Gln Asn Ser Ser His Trp Gln Pro

115 120 125

Leu Pro Glu Tyr His Arg Glu Asp Phe Thr Ile Gly Ile Leu Gly Ala

130 135 140

Gly Val Leu Gly Ser Lys Val Ala Gln Ser Leu Gln Thr Trp Arg Phe

145 150 155 160

Pro Leu Arg Cys Trp Ser Arg Thr Arg Lys Ser Trp Pro Gly Val Gln

165 170 175

Ser Phe Ala Gly Arg Glu Glu Leu Ser Ala Phe Leu Ser Gln Cys Arg

180 185 190

Val Leu Ile Asn Leu Leu Pro Asn Thr Pro Glu Thr Val Gly Ile Ile

195 200 205

Asn Gln Gln Leu Leu Glu Lys Leu Pro Asp Gly Ala Tyr Leu Leu Asn

210 215 220

Leu Ala Arg Gly Val His Val Val Glu Asp Asp Leu Leu Ala Ala Leu

225 230 235 240

Asp Ser Gly Lys Val Lys Gly Ala Met Leu Asp Val Phe Asn Arg Glu

245 250 255

Pro Leu Pro Pro Glu Ser Pro Leu Trp Gln His Pro Arg Val Thr Ile

260 265 270

Thr Pro His Val Ala Ala Ile Thr Arg Pro Ala Glu Ala Val Glu Tyr

275 280 285

Ile Ser Arg Thr Ile Ala Gln Leu Glu Lys Gly Glu Arg Val Cys Gly

290 295 300

Gln Val Asp Arg Ala Arg Gly Tyr

305 310

<210> 93

<211> 1056

<212> DNA

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 93

atgaaagggt ttgccatgtt aggtatcaat aaactgggct ggattgaaaa agagcgcccg 60

gtggcgggtt catacgatgc aattgttcgt ccgctggccg tcagtccgtg caccagcgac 120

atccatacag tctttgaagg tgccctgggt gatcggaaaa acatgattct gggccatgaa 180

gccgtaggcg aagtagtgga agtgggcagc gaggtaaagg atttcaaacc gggtgatcgc 240

gtaattgttc cttgcacgac cccagattgg cgctcactgg aagttcaggc tggttttcag 300

cagcatagta acggtatgtt agcaggctgg aagtttagca attttaaaga cggggtgttc 360

ggggagtatt ttcatgtcaa cgatgcggac atgaatctgg ctattttacc taaagatatg 420

ccgctggaga acgcagtgat gattaccgac atgatgacga caggctttca cggtgcagaa 480

ctggctgaca tccaaatggg ctccagtgtg gtggttatcg gtattggtgc ggtcgggctg 540

atgggtatcg cgggcgcgaa attacggggc gctggtcgca tcatcggtgt cggcagccgt 600

ccaatttgcg ttgaagcagc taaattctat ggtgccacgg acattctgaa ctataaaaat 660

ggtcacatcg tcgatcaggt gatgaaactg accaatggca aaggtgtgga ccgcgtgatc 720

atggcgggcg gcggctcaga gactttatct caagcggtgt ctatggttaa acctgggggc 780

atcatttcta atattaacta tcatggctcc ggcgacgcat tactgatccc gcgtgttgaa 840

tggggctgtg ggatggccca caaaaccatt aaaggggggt tatgtccggg tggtcgcctg 900

cgtgccgaaa tgctgcgtga catggtggtt tacaaccgtg tggatctgtc caaactggta 960

actcacgtat accacggttt cgatcacatt gaagaggcgc tgctgctgat gaaggataag 1020

ccaaaggatc tgattaaggc ggttgttatc ctgtaa 1056

<210> 94

<211> 351

<212> PRT

<213> 拜氏梭菌（Clostridium beijerinckii）

<400> 94

Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu

1 5 10 15

Lys Glu Arg Pro Val Ala Gly Ser Tyr Asp Ala Ile Val Arg Pro Leu

20 25 30

Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala

35 40 45

Leu Gly Asp Arg Lys Asn Met Ile Leu Gly His Glu Ala Val Gly Glu

50 55 60

Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg

65 70 75 80

Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln

85 90 95

Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe

100 105 110

Ser Asn Phe Lys Asp Gly Val Phe Gly Glu Tyr Phe His Val Asn Asp

115 120 125

Ala Asp Met Asn Leu Ala Ile Leu Pro Lys Asp Met Pro Leu Glu Asn

130 135 140

Ala Val Met Ile Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu

145 150 155 160

Leu Ala Asp Ile Gln Met Gly Ser Ser Val Val Val Ile Gly Ile Gly

165 170 175

Ala Val Gly Leu Met Gly Ile Ala Gly Ala Lys Leu Arg Gly Ala Gly

180 185 190

Arg Ile Ile Gly Val Gly Ser Arg Pro Ile Cys Val Glu Ala Ala Lys

195 200 205

Phe Tyr Gly Ala Thr Asp Ile Leu Asn Tyr Lys Asn Gly His Ile Val

210 215 220

Asp Gln Val Met Lys Leu Thr Asn Gly Lys Gly Val Asp Arg Val Ile

225 230 235 240

Met Ala Gly Gly Gly Ser Glu Thr Leu Ser Gln Ala Val Ser Met Val

245 250 255

Lys Pro Gly Gly Ile Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp

260 265 270

Ala Leu Leu Ile Pro Arg Val Glu Trp Gly Cys Gly Met Ala His Lys

275 280 285

Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Ala Glu Met

290 295 300

Leu Arg Asp Met Val Val Tyr Asn Arg Val Asp Leu Ser Lys Leu Val

305 310 315 320

Thr His Val Tyr His Gly Phe Asp His Ile Glu Glu Ala Leu Leu Leu

325 330 335

Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Ala Val Val Ile Leu

340 345 350

<210> 95

<211> 95

<212> DNA

<213> 大肠杆菌（Escherichia coli）

<400> 95

gattgatttg tcgcaatgat tgacacgatt ccgcttgacg ctgcgtaagg tttttgtaat 60

tttacaggca accttttatt cactaacaaa tagct 95

<210> 96

<211> 190

<212> DNA

<213> 人工序列（Artificial Sequence）

<220>

<223> OXB20启动子

<400> 96

aagctgttgt gaccgcttgc tctagccagc tatcgagttg tgaaccgatc catctagcaa 60

ttggtctcga tctagcgata ggcttcgatc tagctatgta gaaacgccgt gtgctcgatc 120

gcttgataag gtccacgtag ctgctataat tgcttcaaca gaacatattg actatccggt 180

attacccggc 190

<210> 97

<211> 768

<212> DNA

<213> 异种伯克霍尔德氏菌（Burkholderia xenovorans）

<400> 97

atgtcatacg caatttaccc ttcgttaagt ggtaagacag tggtgattac tgggggggga 60

tcaggaatcg gagctgcgat ggttgaagca ttcgcccgcc agggagcgcg tgtatttttt 120

ttggatgtag ccgaagatga ctcgcttgcg cttcaacaga gcctgtccga cgcgccacac 180

ccacccctgt tccgtcgctg tgacttacgc tcagtagacg caatccattc cgcctttgca 240

ggtatcgttg aaatcgcagg gccgattgag gttttggtta acaatgcagg caatgacgat 300

cgtcatgagg tcgacgctat tacaccggcg tattgggacg agcgcatggc cgtgaatctg 360

cgccatcaat tcttctgtgc ccaagctgcg gctgctggaa tgcgtaaaat tggacgcggg 420

gtcatcctga atttgggtag tgtttcctgg catcttgcgt tgccgaactt ggcgatctac 480

atgagtgcga aggcgggtat tgagggcctg actcgtggac ttgcacgcga tttgggcgca 540

gccggcatcc gcgtaaattg tattattcct ggagctgtac gtacgccccg tcagatgcag 600

ctttggcagt ccccggagtc ggaagcgaag ctggtggcgt cacagtgtct tcgtcttcgc 660

atcgaacccg agcacgtagc tcgcatggca ttatttttgg catctgacga cgcaagccgc 720

tgttcaggcc gcgattattt cgttgatgct ggctggtatg gagagtaa 768

<210> 98

<211> 382

<212> PRT

<213> 大肠杆菌（Escherichia coli）

<400> 98

Met Ala Asn Arg Met Ile Leu Asn Glu Thr Ala Trp Phe Gly Arg Gly

1 5 10 15

Ala Val Gly Ala Leu Thr Asp Glu Val Lys Arg Arg Gly Tyr Gln Lys

20 25 30

Ala Leu Ile Val Thr Asp Lys Thr Leu Val Gln Cys Gly Val Val Ala

35 40 45

Lys Val Thr Asp Lys Met Asp Ala Ala Gly Leu Ala Trp Ala Ile Tyr

50 55 60

Asp Gly Val Val Pro Asn Pro Thr Ile Thr Val Val Lys Glu Gly Leu

65 70 75 80

Gly Val Phe Gln Asn Ser Gly Ala Asp Tyr Leu Ile Ala Ile Gly Gly

85 90 95

Gly Ser Pro Gln Asp Thr Cys Lys Ala Ile Gly Ile Ile Ser Asn Asn

100 105 110

Pro Glu Phe Ala Asp Val Arg Ser Leu Glu Gly Leu Ser Pro Thr Asn

115 120 125

Lys Pro Ser Val Pro Ile Leu Ala Ile Pro Thr Thr Ala Gly Thr Ala

130 135 140

Ala Glu Val Thr Ile Asn Tyr Val Ile Thr Asp Glu Glu Lys Arg Arg

145 150 155 160

Lys Phe Val Cys Val Asp Pro His Asp Ile Pro Gln Val Ala Phe Ile

165 170 175

Asp Ala Asp Met Met Asp Gly Met Pro Pro Ala Leu Lys Ala Ala Thr

180 185 190

Gly Val Asp Ala Leu Thr His Ala Ile Glu Gly Tyr Ile Thr Arg Gly

195 200 205

Ala Trp Ala Leu Thr Asp Ala Leu His Ile Lys Ala Ile Glu Ile Ile

210 215 220

Ala Gly Ala Leu Arg Gly Ser Val Ala Gly Asp Lys Asp Ala Gly Glu

225 230 235 240

Glu Met Ala Leu Gly Gln Tyr Val Ala Gly Met Gly Phe Ser Asn Val

245 250 255

Gly Leu Gly Leu Val His Gly Met Ala His Pro Leu Gly Ala Phe Tyr

260 265 270

Asn Thr Pro His Gly Val Ala Asn Ala Ile Leu Leu Pro His Val Met

275 280 285

Arg Tyr Asn Ala Asp Phe Thr Gly Glu Lys Tyr Arg Asp Ile Ala Arg

290 295 300

Val Met Gly Val Lys Val Glu Gly Met Ser Leu Glu Glu Ala Arg Asn

305 310 315 320

Ala Ala Val Glu Ala Val Phe Ala Leu Asn Arg Asp Val Gly Ile Pro

325 330 335

Pro His Leu Arg Asp Val Gly Val Arg Lys Glu Asp Ile Pro Ala Leu

340 345 350

Ala Gln Ala Ala Leu Asp Asp Val Cys Thr Gly Gly Asn Pro Arg Glu

355 360 365

Ala Thr Leu Glu Asp Ile Val Glu Leu Tyr His Thr Ala Trp

370 375 380

Claims

1.一种能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，并且其中所述微生物包含以下一项或多项：

(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活，以使得所述转运蛋白不表达；

(b)一个或多个内源性或外源性核酸序列，其编码至少一种C5糖同向转运蛋白且可操作地连接至一个或多个组成型启动子；其中所述C5糖同向转运蛋白包括：(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白；

(c)一个或多个内源性或外源性核酸序列，其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木酮糖激酶的缺失或失活和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子，以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

2.如权利要求1所述的重组微生物，其中所述微生物产生的所述发酵产物是一种或多种包含1、2、3、4、5、6、7、8、9或10个碳的分子。

3.如权利要求2所述的重组微生物，其中同时产生两种或更多种分子。

4.一种能够从包含木糖和葡萄糖的原料产生发酵产物的重组大肠杆菌，其中重组微生物同时利用木糖和葡萄糖，并且其中所述微生物包含以下一项或多项：

(a)所述微生物的基因组中的ATP结合转运蛋白araFGH和xylFGH的缺失或失活，以使得所述转运蛋白不表达；

5.一种能够从包含木糖和葡萄糖的原料产生单乙二醇(MEG)和/或丙酮的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：

(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活；以及

(b)至少一个内源性或外源性核酸分子的表达，所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白；

其中所述重组微生物表达MEG和/或丙酮产生途径。

6.如权利要求5所述的重组微生物，其中所述微生物还包含glcDEF的缺失或失活。

7.如权利要求5所述的重组微生物，其中所述C5同向转运蛋白由araFGH基因座处的GAPDH启动子控制。

8.如权利要求5所述的重组微生物，其中所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。

9.如权利要求5所述的重组微生物，其中所述XylE包括包含SEQ ID NO:49的氨基酸序列。

10.如权利要求5所述的重组微生物，其中所述XylE由包含SEQ ID NO:48的核酸序列编码。

11.如权利要求5所述的重组微生物，其中所述木糖同向转运蛋白是所述微生物内源性的。

12.如权利要求5所述的重组微生物，其中所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。

13.如权利要求12所述的重组微生物，其中所述AraE包括包含SEQ ID NO:47的氨基酸序列。

14.如权利要求12所述的重组微生物，其中所述AraE由包含SEQ ID NO:46的核酸序列编码。

15.如权利要求5所述的重组微生物，其中所述阿拉伯糖同向转运蛋白是所述微生物内源性的。

16.如权利要求5所述的重组微生物，其中所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。

17.如权利要求5所述的重组微生物，其中所述微生物包含功能性磷酸转移酶系统。

18.如权利要求5所述的重组微生物，其中所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。

19.如权利要求18所述的重组微生物，其中所述CRP包括包含SEQ ID NO:10的氨基酸序列。

20.如权利要求18所述的重组微生物，其中所述CRP由包含SEQ ID NO:9的核酸序列编码。

21.如权利要求5所述的重组微生物，其中所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。

22.如权利要求5所述的重组微生物，其中所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。

23.如权利要求5所述的重组微生物，其中连续木糖输入独立于其他糖在所述原料中的存在而发生。

24.如权利要求5所述的重组微生物，其中所述重组微生物包括MEG产生途径，所述途径具有以下(c)至(e)中的一项或多项；

(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；

(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达，所述羟乙醛还原酶催化羟乙醛至MEG的转化；以及

(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。

25.如权利要求24所述的重组微生物，其中(c)和(d)在由proD启动子控制的操纵子中。

26.如权利要求25所述的重组微生物，其中所述proD启动子由包含SEQ ID NO:53的核酸序列编码。

27.如权利要求24所述的重组微生物，其中所述木糖异构酶是XylA。

28.如前述权利要求中任一项所述的重组微生物，其中所述木糖异构酶是所述微生物内源性的。

29.如权利要求27所述的重组微生物，其中所述XylA包括包含SEQ ID NO:6的氨基酸序列。

30.如权利要求27所述的重组微生物，其中所述XylA由包含SEQ ID NO:5的核酸序列编码。

31.如权利要求24所述的重组微生物，其中所述酮己糖激酶来自智人。

32.如权利要求24所述的重组微生物，其中所述酮己糖激酶是所述微生物异源性的。

33.如权利要求32所述的重组微生物，其中所述酮己糖激酶是khk-C。

34.如权利要求33所述的重组微生物，其中所述khk-C包括包含SEQ ID NO:12的氨基酸序列。

35.如权利要求33所述的重组微生物，其中所述khk-C由包含SEQ ID NO:11的核酸序列编码。

36.如权利要求24所述的重组微生物，其中所述果糖二磷酸醛缩酶来自智人。

37.如权利要求24所述的重组微生物，其中所述果糖二磷酸醛缩酶是所述微生物异源性的。

38.如权利要求37所述的重组微生物，其中所述果糖二磷酸醛缩酶是aldoB。

39.如权利要求38所述的重组微生物，其中所述aldoB包括包含SEQ ID NO:51的氨基酸序列。

40.如权利要求38所述的重组微生物，其中所述aldoB由包含SEQ ID NO:50的核酸序列编码。

41.如权利要求24所述的重组微生物，其中所述羟乙醛还原酶是所述微生物内源性的。

42.如权利要求24所述的重组微生物，其中所述羟乙醛还原酶是fucO。

43.如权利要求42所述的重组微生物，其中所述fucO包括包含SEQ ID NO:98的氨基酸序列。

44.如权利要求42所述的重组微生物，其中所述fucO由包含SEQ ID NO:52的核酸序列编码。

45.如权利要求24所述的重组微生物，其中所述木酮糖激酶是XylB。

46.如权利要求45所述的重组微生物，其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。

47.如权利要求45所述的重组微生物，其中所述xylB由包含SEQ ID NO:13的核酸序列编码。

48.如权利要求5所述的重组微生物，其中所述重组微生物包括MEG产生途径，所述途径具有以下(c)至(e)中的一项或多项；

(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达，所述核酸序列可操作地连接至一个或多个组成型启动子；

(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。

49.如权利要求48所述的重组微生物，其中所述木糖脱氢酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。

50.如权利要求49所述的重组微生物，其中所述木糖脱氢酶是xdh。

51.如权利要求50所述的重组微生物，其中所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。

52.如权利要求50所述的重组微生物，其中所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。

53.如权利要求48所述的重组微生物，其中所述木糖脱氢酶是所述微生物异源性的。

54.如权利要求48所述的重组微生物，其中所述木糖酸内酯酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。

55.如权利要求54所述的重组微生物，其中所述木糖酸内酯酶是xylC。

56.如权利要求55所述的重组微生物，其中所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。

57.如权利要求55所述的重组微生物，其中所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。

58.如权利要求48所述的重组微生物，其中所述木糖酸内酯酶是所述微生物异源性的。

59.如权利要求48所述的重组微生物，其中所述木糖酸内酯酶是所述微生物内源性的。

60.如权利要求48所述的重组微生物，其中所述木糖脱水酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。

61.如权利要求60所述的重组微生物，其中所述木糖脱水酶是xylD。

62.如权利要求61所述的重组微生物，其中所述xylD包括包含SEQ ID NO:61、63或65的氨基酸序列。

63.如权利要求61所述的重组微生物，其中所述xylD由包含SEQ ID NO:60、62或64的核酸序列编码。

64.如权利要求48所述的重组微生物，其中所述木糖脱水酶是所述微生物异源性的。

65.如权利要求48所述的重组微生物，其中所述木糖脱水酶是所述微生物内源性的。

66.如权利要求48所述的重组微生物，其中所述羟乙醛还原酶是所述微生物内源性的。

67.如权利要求48所述的重组微生物，其中所述羟乙醛还原酶是fucO。

68.如权利要求49所述的重组微生物，其中所述fucO包括包含SEQ ID NO:98的氨基酸序列。

69.如权利要求49所述的重组微生物，其中所述fucO由包含SEQ ID NO:52的核酸序列编码。

70.如权利要求48所述的重组微生物，其中所述羟乙醛还原酶是所述微生物异源性的。

71.如权利要求48所述的重组微生物，其中所述木糖异构酶是XylA。

72.如权利要求71所述的重组微生物，其中所述xylA包括包含SEQ ID NO:6的氨基酸序列。

73.如权利要求71所述的重组微生物，其中所述xylA由包含SEQ ID NO:5的核酸序列编码。

74.如权利要求48所述的重组微生物，其中所述木酮糖激酶是XylB。

75.如权利要求74所述的重组微生物，其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。

76.如权利要求74所述的重组微生物，其中所述xylB由包含SEQ ID NO:13的核酸序列编码。

77.如权利要求24或48所述的重组微生物，其中所述重组微生物还包含丙酮产生途径，所述途径具有以下(f)至(h)中的一项或多项；

(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达；

(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达；以及

(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化。

78.如权利要求77所述的重组微生物，其中(f)、(g)和(h)在由OXB11启动子控制的操纵子中。

79.如权利要求76所述的重组微生物，其中所述OXB11启动子由包含SEQ ID NO:78的核酸序列编码。

80.如权利要求77所述的重组微生物，其中所述乙酰乙酰基辅酶A硫解酶来自丙酮丁醇梭菌(Clostridium acetobutylicum)。

81.如权利要求78所述的重组微生物，其中所述乙酰乙酰基辅酶A硫解酶包括包含SEQID NO:67或69的氨基酸序列。

82.如权利要求78所述的重组微生物，其中所述乙酰乙酰基辅酶A硫解酶由包含SEQ IDNO:66或68的核酸序列编码。

83.如权利要求77所述的重组微生物，其中所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。

84.如权利要求81所述的重组微生物，其中AtoDA亚基α包括包含SEQ ID NO:72的氨基酸序列。

85.如权利要求81所述的重组微生物，其中AtoDA亚基α由包含SEQ ID NO:70的核酸序列编码。

86.如权利要求83所述的重组微生物，其中AtoDA亚基β包括包含SEQ ID NO:73的氨基酸序列。

87.如权利要求83所述的重组微生物，其中所述AtoDA亚基β由包含SEQ ID NO:71的核酸序列编码。

88.如权利要求77所述的重组微生物，其中所述乙酰乙酸脱羧酶来自拜氏梭菌(Clostridium beijerinckii)或丙酮丁醇梭菌(Clostridium acetobutylicum)。

89.如权利要求86所述的重组微生物，其中所述乙酰乙酸脱羧酶是Adc。

90.如权利要求86所述的重组微生物，其中所述Adc包括包含SEQ ID NO:75或77的氨基酸序列。

91.如权利要求88所述的重组微生物，其中所述Adc由包含SEQ ID NO:74或76的核酸序列编码。

92.如权利要求24或48所述的重组微生物，其中所述重组微生物还包含异丙醇产生途径，所述途径具有以下(f)至(i)中的一项或多项；

(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达，所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化；

(i)至少一个编码醇脱氢酶的外源性核酸分子的表达，所述醇脱氢酶催化丙酮至异丙醇的转化。

93.一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物，其中所述重组微生物同时利用木糖和葡萄糖，包含以下一项或多项：

(a)亲本微生物的基因组中的fucO、yqhD、araFGH和xylFGH的缺失或失活；以及

其中所述重组微生物还表达一个或多个乙醇酸产生途径。

94.如权利要求91所述的重组微生物，其中所述微生物还包含glcDEF的缺失或失活。

95.如权利要求91所述的重组微生物，其中所述微生物还包含dkgA的缺失或失活。

96.如权利要求91所述的重组微生物，其中所述微生物还包含yahK的缺失或失活。

97.如权利要求91所述的重组微生物，其中所述木糖同向转运蛋白由araFGH基因座处的GAPDH启动子控制。

98.如权利要求91所述的重组微生物，其中所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。

99.如权利要求96所述的重组微生物，其中所述XylE包括包含SEQ ID NO:49的氨基酸序列。

100.如权利要求96所述的重组微生物，其中所述XylE由包含SEQ ID NO:48的核酸序列编码。

101.如权利要求91所述的重组微生物，其中所述木糖同向转运蛋白是所述微生物内源性的。

102.如权利要求91所述的重组微生物，其中所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。

103.如权利要求91所述的重组微生物，其中所述阿拉伯糖同向转运蛋白是所述微生物内源性的。

104.如权利要求91所述的重组微生物，其中所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。

105.如权利要求91所述的重组微生物，其中所述微生物包含功能性磷酸转移酶系统。

106.如权利要求91所述的重组微生物，其中所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。

107.如权利要求104所述的重组微生物，其中所述CRP包括包含SEQ ID NO:10的氨基酸序列。

108.如权利要求104所述的重组微生物，其中所述CRP由包含SEQ ID NO:9的核酸序列编码。

109.如权利要求91所述的重组微生物，其中所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。

110.如权利要求91所述的重组微生物，其中所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。

111.如权利要求91所述的重组微生物，其中连续木糖输入独立于其他糖在所述原料中的存在而发生。

112.如权利要求91所述的重组微生物，其中所述重组微生物包括乙醇酸产生途径，所述途径具有以下(c)和(e)中的一项或多项；

(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达，所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化；以及

113.如权利要求110所述的重组微生物，其中(c)和(d)在由proD启动子控制的操纵子中。

114.如权利要求111所述的重组微生物，其中所述proD启动子由包含SEQ ID NO:53的核酸序列编码。

115.如权利要求110所述的重组微生物，其中所述木糖异构酶是XylA。

116.如权利要求113所述的重组微生物，其中所述XylA包括包含SEQ ID NO:6的氨基酸序列。

117.如权利要求113所述的重组微生物，其中所述XylA由包含SEQ ID NO:5的核酸序列编码。

118.如权利要求110所述的重组微生物，其中所述木糖异构酶是所述微生物内源性的。

119.如权利要求110所述的重组微生物，其中所述酮己糖激酶来自智人。

120.如权利要求110所述的重组微生物，其中所述酮己糖激酶是所述微生物异源性的。

121.如权利要求118所述的重组微生物，其中所述酮己糖激酶是khk-C。

122.如权利要求119所述的重组微生物，其中所述khk-C包括包含SEQ ID NO:12的氨基酸序列。

123.如权利要求119所述的重组微生物，其中所述khk-C由包含SEQ ID NO:11的核酸序列编码。

124.如权利要求110所述的重组微生物，其中所述果糖二磷酸醛缩酶来自智人。

125.如权利要求122所述的重组微生物，其中所述果糖二磷酸醛缩酶是aldoB。

126.如权利要求123所述的重组微生物，其中所述aldoB包括包含SEQ ID NO:51的氨基酸序列。

127.如权利要求123所述的重组微生物，其中所述aldoB由包含SEQ ID NO:50的核酸序列编码。

128.如权利要求110所述的重组微生物，其中所述果糖二磷酸醛缩酶是所述微生物异源性的。

129.如权利要求110所述的重组微生物，其中所述羟乙醛脱氢酶是aldA。

130.如权利要求127所述的重组微生物，其中所述aldA包括包含SEQ ID NO:4的氨基酸序列。

131.如权利要求127所述的重组微生物，其中所述aldA由包含SEQ ID NO:3的核酸序列编码。

132.如权利要求110所述的重组微生物，其中所述羟乙醛脱氢酶是所述微生物内源性的。

133.如权利要求110所述的重组微生物，其中所述木酮糖激酶是XylB。

134.如权利要求131所述的重组微生物，其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。

135.如权利要求131所述的重组微生物，其中所述xylB由包含SEQ ID NO:13的核酸序列编码。

136.如权利要求91所述的重组微生物，其中所述重组微生物包括乙醇酸产生途径，所述途径具有以下(c)至(e)中的一项或多项；

137.如权利要求134所述的重组微生物，其中(c)和(d)由所述proD启动子控制。

138.如权利要求135所述的重组微生物，其中所述proD启动子由包含SEQ ID NO:53的核酸序列编码。

139.如权利要求134所述的重组微生物，其中所述木糖异构酶是XylA。

140.如权利要求137所述的重组微生物，其中所述XylA包括包含SEQ ID NO:6的氨基酸序列。

141.如权利要求138所述的重组微生物，其中所述XylA由包含SEQ ID NO:5的核酸序列编码。

142.如权利要求134所述的重组微生物，其中所述木酮糖激酶是XylB。

143.如权利要求140所述的重组微生物，其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。

144.如权利要求140所述的重组微生物，其中所述xylB由包含SEQ ID NO:13的核酸序列编码。

145.如权利要求134所述的重组微生物，其中所述木糖脱氢酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。

146.如权利要求143所述的重组微生物，其中所述木糖脱氢酶是xdh。

147.如权利要求144所述的重组微生物，其中所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。

148.如权利要求144所述的重组微生物，其中所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。

149.如权利要求134所述的重组微生物，其中所述木糖脱氢酶是所述微生物异源性的。

150.如权利要求134所述的重组微生物，其中所述木糖酸内酯酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。

151.如权利要求148所述的重组微生物，其中所述木糖酸内酯酶是xylC。

152.如权利要求149所述的重组微生物，其中所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。

153.如权利要求149所述的重组微生物，其中所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。

154.如权利要求134所述的重组微生物，其中所述木糖酸内酯酶是所述微生物异源性的。

155.如权利要求134所述的重组微生物，其中所述木糖酸内酯酶是所述微生物内源性的。

156.如权利要求134所述的重组微生物，其中所述羟乙醛脱氢酶是aldA。

157.如权利要求154所述的重组微生物，其中所述aldA包括包含SEQ ID NO:4的氨基酸序列。

158.如权利要求154所述的重组微生物，其中所述aldA由包含SEQ ID NO:3的核酸序列编码。

159.如权利要求134所述的重组微生物，其中所述羟乙醛脱氢酶是所述微生物内源性的。

160.如权利要求110或134所述的重组微生物，其中所述微生物还表达乙醇酸产生途径，所述途径具有以下中的一项或多项：

(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达；和/或

(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。

161.如权利要求158所述的重组微生物，其中(f)和(g)在由OXB20启动子控制的操纵子中。

162.如权利要求159所述的重组微生物，其中所述OXB20启动子由包含SEQ ID NO:96的核酸序列编码。

163.如权利要求158所述的重组微生物，其中所述异柠檬酸裂解酶是AceA。

164.如权利要求161所述的重组微生物，其中所述AceA包括包含SEQ ID NO:90的氨基酸序列。

165.如权利要求161所述的重组微生物，其中所述AceA由包含SEQ ID NO:89的核酸序列编码。

166.如权利要求158所述的重组微生物，其中所述乙醛酸还原酶是YcdW。

167.如权利要求164所述的重组微生物，其中所述YcdW包括包含SEQ ID NO:92的氨基酸序列。

168.如权利要求164所述的重组微生物，其中所述YcdW由包含SEQ ID NO:91的核酸序列编码。

169.如前述权利要求中任一项所述的重组微生物，其中所述重组微生物来源于选自由以下项组成的组的亲本微生物：梭菌属(Clostridium sp.)、永达尔梭菌(Clostridiumljungdahlii)、产乙醇梭菌(Clostridium autoethanogenum)、拉氏梭菌(Clostridiumragsdalei)、粘液真杆菌(Eubacterium limosum)、嗜甲基丁酸杆菌(Butyribacteriummethylotrophicum)、热醋穆尔氏菌(Moorella thermoacetica)、醋酸梭菌(Clostridiumaceticum)、伍氏醋酸杆菌(Acetobacterium woodii)、巴氏嗜喊菌(Alkalibaculumbacchii)、德雷克氏梭菌(Clostridium drakei)、食一氧化碳梭菌(Clostridiumcarboxidivorans)、甲酸乙酸梭菌(Clostridium formicoaceticum)、粪味梭菌(Clostridium scatologenes)、热自养穆尔氏菌(Moorella thermoautotrophica)、长醋丝菌(Acetonema longum)、延长布劳特氏菌(Blautia producta)、乙二醇梭菌(Clostridiumglycolicum)、大梭菌(Clostridium magnum)、马永贝梭菌(Clostridium mayombei)、食甲氧基苯甲酸梭菌(Clostridium methoxybenzovorans)、丙酮丁醇梭菌(Clostridiumacetobutylicum)、拜氏梭菌(Clostridium beijerinckii)、普氏产醋杆菌(Oxobacterpfennigii)、凯伍嗜热厌氧菌(Thermoanaerobacter kivui)、卵形鼠孢菌(Sporomusaovata)、棕色嗜热产醋菌(Thermoacetogenium phaeum)、甲醇醋酸杆菌(Acetobacteriumcarbinolicum)、白蚁鼠孢菌(Sporomusa termitida)、甘油穆尔氏菌(Moorellaglycerini)、聚集性真杆菌(Eubacterium aggregans)、固氮密螺旋体(Treponemaazotonutricium)、大肠杆菌(Escherichia coli)、酿酒酵母(Saccharomycescerevisiae)、恶臭假单胞菌(Pseudomonas putida)、芽孢杆菌属(Bacillus sp.)、棒状杆菌属(Corynebacterium sp.)、解脂耶氏酵母(Yarrowia lipolytica)、树干毕赤酵母(Scheffersomyces stipitis)和甘油利用泰瑞孢子菌(Terrisporobacter glycolicus)。

170.如权利要求167所述的重组微生物，其中所述亲本微生物是大肠杆菌。