[go: up one dir, main page]

CN114008197A - 用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程 - Google Patents

用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程 Download PDF

Info

Publication number
CN114008197A
CN114008197A CN202080041307.XA CN202080041307A CN114008197A CN 114008197 A CN114008197 A CN 114008197A CN 202080041307 A CN202080041307 A CN 202080041307A CN 114008197 A CN114008197 A CN 114008197A
Authority
CN
China
Prior art keywords
recombinant microorganism
microorganism
clostridium
seq
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202080041307.XA
Other languages
English (en)
Other versions
CN114008197B (zh
Inventor
V·M·罗德格戈戈拉科林
A·F·贝拉迪蔡德勒
L·佩德森帕里齐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Braskem SA
Original Assignee
Braskem SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Braskem SA filed Critical Braskem SA
Publication of CN114008197A publication Critical patent/CN114008197A/zh
Application granted granted Critical
Publication of CN114008197B publication Critical patent/CN114008197B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1025Acyltransferases (2.3)
    • C12N9/1029Acyltransferases (2.3) transferring groups other than amino-acyl groups (2.3.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/12Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • C12N9/1205Phosphotransferases with an alcohol group as acceptor (2.7.1), e.g. protein kinases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/13Transferases (2.) transferring sulfur containing groups (2.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • C12N9/92Glucose isomerase (5.3.1.5; 5.3.1.9; 5.3.1.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • C12P5/026Unsaturated compounds, i.e. alkenes, alkynes or allenes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • C12P7/28Acetone-containing products
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2203/00Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/01Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
    • C12Y503/01005Xylose isomerase (5.3.1.5)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本公开提供了用于对微生物进行遗传修饰以产生能够同时消耗木糖和葡萄糖以增加所期望的化学产物的生产率输出的微生物的方法。本公开还提供了能够同时消耗木糖和葡萄糖的经修饰的细菌,以及包含所述微生物的组合物。

Description

用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代 谢工程
相关申请的交叉引用
本申请要求2019年4月4日提交的美国临时申请号62/829,398的优先权,该临时申请的内容以引用的方式整体并入本文。
关于序列表的声明
与本申请相关的序列表以文本形式提供,代替纸质副本,并且据此以引用的方式并入说明书中。含序列表的文本文件名称为BRSK_021_01WO_ST25.txt。文本文件为222kb,创建于2020年4月4日,并且以电子形式提交。
背景技术
从替代原料(如戊糖)产生所期望的化学物质(诸如单乙二醇、乙醇酸、C3化合物(诸如丙酮、异丙醇和丙烯)、氨基酸和多元醇)是从石油基化学物质获得所述化学物质的替代方案。
木糖(戊糖)的利用是区别于大多数可再生化学物质方案的来源。考虑到利用木质纤维素生物质作为原料不要求利用会以其他方式产生食物的植物,木质纤维素生物质是一种有前景的可再生原料。由于木质纤维素生物质的可持续性和全球可用性,它作为可再生原料更有前景。木质纤维素糖的分离和离析是一种在不增加土地利用的情况下增加糖产量的选择。木糖是半纤维素水解产物中的主要碳源,其次是葡萄糖和阿拉伯糖。木糖通常占半纤维素水解产物中存在的糖的70-80%,而葡萄糖则占10-20%。
在大肠杆菌(Escherichia coli)中,即使最少量的葡萄糖也会完全抑制木糖的摄取(即使木糖是主要糖),从而限制糖至所期望的化学物质的总体转化。在工业过程中,生产率(克产物/升每小时)是确保经济可行性的关键因素,因此微生物菌株必须能够不断以最大速率将主要底物(诸如木糖)转化为产物。考虑到葡萄糖存在于木质纤维素水解产物中,在分批操作中,木糖摄取将被延迟直到葡萄糖完全耗尽,从而降低生产率。如果我们考虑补料分批或连续操作,则含有木糖和葡萄糖的流被不断送入反应器中,增强了葡萄糖的阻遏潜力,因此无法最大限度地提高能够从常见可再生原料产生一种或多种产物的微生物的潜在生产率。
需要最大限度地提高能够从可再生原料产生所期望的产物的微生物的生产率,特别是需要最大限度地利用多种碳源,同时最大限度地减少或消除碳源对微生物的阻遏活性。
如本文所述,本公开提供了用于对微生物进行工程化改造以利用混合糖流来产生所期望的化学物质的方法和组合物,而无需考虑由于混合糖流的存在而引起的典型分解代谢阻遏效应。
发明内容
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,并且其中所述微生物包含以下一项或多项:(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活,以使得所述转运蛋白不表达;(b)一个或多个内源性或外源性核酸序列,其编码至少一个C5糖同向转运蛋白(symporter)并且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活,和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,所述微生物产生的所述发酵产物是一种或多种包含1、2、3、4、5、6、7、8、9或10个碳的分子。在一些方面,同时产生两种或更多种分子。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组大肠杆菌,其中所述重组微生物同时利用木糖和葡萄糖,并且其中所述微生物包含以下一项或多项:(a)所述微生物的基因组中的ATP结合转运蛋白araFGH和xylFGH的缺失或失活,以使得所述转运蛋白不表达;(b)一个或多个内源性或外源性核酸序列,其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活,和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生单乙二醇(MEG)和/或丙酮的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,并且包含以下一项或多项:(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,如权利要求5所述的重组微生物,其中所述微生物还包含glcDEF的缺失或失活。在一些方面,所述C5同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面,所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面,所述XylE包括包含SEQ ID NO:49的氨基酸序列。在一些方面,所述XylE由包含SEQ ID NO:48的核酸序列编码。在一些方面,所述木糖同向转运蛋白是所述微生物内源性的。
在一些方面,所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面,所述AraE包括包含SEQ ID NO:47的氨基酸序列。在一些方面,所述AraE由包含SEQ ID NO:46的核酸序列编码。在一些方面,所述阿拉伯糖同向转运蛋白是所述微生物内源性的。
在一些方面,所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面,所述微生物包含功能性磷酸转移酶系统。在一些方面,所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面,所述CRP包括包含SEQ ID NO:10的氨基酸序列。在一些方面,所述CRP由包含SEQ ID NO:9的核酸序列编码。
在一些方面,所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,连续木糖输入独立于其他糖在所述原料中的存在而发生。
在一些方面,所述重组微生物包括MEG产生途径,所述途径具有以下(c)至(e)中的一项或多项;(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。在一些方面,(c)和(d)在由proD启动子控制的操纵子中。在一些方面,所述proD启动子由包含SEQ ID NO:53的核酸序列编码。
在一些方面,所述木糖异构酶是XylA。在一些方面,所述木糖异构酶是所述微生物内源性的。在一些方面,所述XylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面,所述XylA由包含SEQ ID NO:5的核酸序列编码。
在一些方面,所述酮己糖激酶来自智人(Homo Sapiens)。在一些方面,所述酮己糖激酶是所述微生物异源性的。在一些方面,所述酮己糖激酶是khk-C。在一些方面,所述khk-C包括包含SEQ ID NO:12的氨基酸序列。在一些方面,所述khk-C由包含SEQ ID NO:11的核酸序列编码。
在一些方面,所述果糖二磷酸醛缩酶来自智人。在一些方面,所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面,所述果糖二磷酸醛缩酶是aldoB。在一些方面,所述aldoB包括包含SEQ ID NO:51的氨基酸序列。在一些方面,所述aldoB由包含SEQ ID NO:50的核酸序列编码。
在一些方面,所述羟乙醛还原酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是fucO。在一些方面,所述fucO包括包含SEQ ID NO:98的氨基酸序列。在一些方面,所述fucO由包含SEQ ID NO:52的核酸序列编码。
在一些方面,所述木酮糖激酶是XylB。在一些方面,所述xylB包括包含SEQ ID NO:14的氨基酸序列。在一些方面,所述xylB由包含SEQ ID NO:13的核酸序列编码。
在一些方面,所述重组微生物包括MEG产生途径,所述途径具有以下(c)至(e)中的一项或多项;(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,所述木糖脱氢酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。在一些方面,所述木糖脱氢酶是xdh。在一些方面,所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。在一些方面,所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。在一些方面,所述木糖脱氢酶是所述微生物异源性的。
在一些方面,所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖酸内酯酶是xylC。在一些方面,所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。在一些方面,所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。
在一些方面,所述木糖酸内酯酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶是所述微生物内源性的。
在一些方面,所述木糖脱水酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖脱水酶是xylD。在一些方面,所述xylD包括包含SEQ ID NO:61、63或65的氨基酸序列。在一些方面,所述xylD由包含SEQ ID NO:60、62或64的核酸序列编码。在一些方面,所述木糖脱水酶是所述微生物异源性的。在一些方面,所述木糖脱水酶是所述微生物内源性的。
在一些方面,所述羟乙醛还原酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是fucO。在一些方面,所述fucO包括包含SEQ ID NO:98的氨基酸序列。在一些方面,所述fucO由包含SEQ ID NO:52的核酸序列编码。
在一些方面,所述羟乙醛还原酶是所述微生物异源性的。在一些方面,所述木糖异构酶是XylA。在一些方面,所述xylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面,所述xylA由包含SEQ ID NO:5的核酸序列编码。
在一些方面,所述木酮糖激酶是XylB。在一些方面,所述xylB包括包含SEQ ID NO:14的氨基酸序列。在一些方面,所述xylB由包含SEQ ID NO:13的核酸序列编码。
在一些方面,所述重组微生物还包含丙酮产生途径,所述途径具有以下(f)至(h)中的一项或多项;(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化。
在一些方面,(f)、(g)和(h)在由OXB11启动子控制的操纵子中。在一些方面,所述OXB11启动子由包含SEQ ID NO:78的核酸序列编码。在一些方面,所述乙酰乙酰基辅酶A硫解酶来自丙酮丁醇梭菌(Clostridium acetobutylicum)。在一些方面,所述乙酰乙酰基辅酶A硫解酶包括包含SEQ ID NO:67或69的氨基酸序列。在一些方面,所述乙酰乙酰基辅酶A硫解酶由包含SEQ ID NO:66或68的核酸序列编码。在一些方面,所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面,所述AtoDA亚基α包括包含SEQ ID NO:72的氨基酸序列。在一些方面,所述AtoDA亚基α由包含SEQ ID NO:70的核酸序列编码。在一些方面,所述AtoDA亚基β包括包含SEQ ID NO:73的氨基酸序列。在一些方面,所述AtoDA亚基β由包含SEQ ID NO:71的核酸序列编码。
如权利要求77所述的重组微生物,其中所述乙酰乙酸脱羧酶来自拜氏梭菌(Clostridium beijerinckii)或丙酮丁醇梭菌。在一些方面,所述乙酰乙酸脱羧酶是Adc。在一些方面,所述Adc包括包含SEQ ID NO:75或77的氨基酸序列。在一些方面,所述Adc由包含SEQ ID NO:74或76的核酸序列编码。
在一些方面,所述重组微生物还包含异丙醇产生途径,所述途径具有以下(f)至(i)中的一项或多项;(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化;(i)至少一个编码醇脱氢酶的外源性核酸分子的表达,所述醇脱氢酶催化丙酮至异丙醇的转化。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,并且包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物还表达一个或多个乙醇酸产生途径。
在一些方面,所述微生物还包含glcDEF的缺失或失活。在一些方面,所述微生物还包含dkgA的缺失或失活。在一些方面,所述微生物还包含yahK的缺失或失活。在一些方面,所述木糖同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。
在一些方面,所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面,所述XylE包括包含SEQ ID NO:49的氨基酸序列。在一些方面,所述XylE由包含SEQ ID NO:48的核酸序列编码。在一些方面,所述木糖同向转运蛋白是所述微生物内源性的。
在一些方面,所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面,所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面,所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面,所述微生物包含功能性磷酸转移酶系统。
在一些方面,所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面,所述CRP包括包含SEQ ID NO:10的氨基酸序列。在一些方面,所述CRP由包含SEQID NO:9的核酸序列编码。在一些方面,所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,连续木糖输入独立于其他糖在所述原料中的存在而发生。
在一些方面,所述重组微生物包括乙醇酸产生途径,所述途径具有以下(c)和(e)中的一项或多项;(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。在一些方面,(c)和(d)在由proD启动子控制的操纵子中。在一些方面,所述proD启动子由包含SEQ ID NO:53的核酸序列编码。
在一些方面,所述木糖异构酶是XylA。在一些方面,所述XylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面,所述XylA由包含SEQ ID NO:5的核酸序列编码。在一些方面,所述木糖异构酶是所述微生物内源性的。
在一些方面,所述酮己糖激酶来自智人。在一些方面,所述酮己糖激酶是所述微生物异源性的。在一些方面,所述酮己糖激酶是khk-C。在一些方面,所述khk-C包括包含SEQID NO:12的氨基酸序列。在一些方面,所述khk-C由包含SEQ ID NO:11的核酸序列编码。
在一些方面,所述果糖二磷酸醛缩酶来自智人。在一些方面,所述果糖二磷酸醛缩酶是aldoB。在一些方面,所述aldoB包括包含SEQ ID NO:51的氨基酸序列。在一些方面,所述aldoB由包含SEQ ID NO:50的核酸序列编码。在一些方面,所述果糖二磷酸醛缩酶是所述微生物异源性的。
在一些方面,所述羟乙醛脱氢酶是aldA。在一些方面,所述aldA包括包含SEQ IDNO:4的氨基酸序列。在一些方面,所述aldA由包含SEQ ID NO:3的核酸序列编码。在一些方面,所述羟乙醛脱氢酶是所述微生物内源性的。
在一些方面,所述木酮糖激酶是XylB。在一些方面,所述xylB包括包含SEQ ID NO:14的氨基酸序列。在一些方面,所述xylB由包含SEQ ID NO:13的核酸序列编码。
在一些方面,所述重组微生物包括乙醇酸产生途径,所述途径具有以下(c)至(e)中的一项或多项;(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。在一些方面,(c)和(d)由proD启动子控制。在一些方面,所述proD启动子由包含SEQ ID NO:53的核酸序列编码。
在一些方面,所述木糖异构酶是XylA。在一些方面,所述XylA包括包含SEQ ID NO:6的氨基酸序列。在一些方面,所述XylA由包含SEQ ID NO:5的核酸序列编码。
在一些方面,所述木酮糖激酶是XylB。在一些方面,所述xylB包括包含SEQ ID NO:14的氨基酸序列。在一些方面,所述xylB由包含SEQ ID NO:13的核酸序列编码。
在一些方面,所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖脱氢酶是xdh。在一些方面,所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。在一些方面,所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。在一些方面,所述木糖脱氢酶是所述微生物异源性的。
在一些方面,所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖酸内酯酶是xylC。在一些方面,所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。在一些方面,所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。
在一些方面,所述木糖酸内酯酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶是所述微生物内源性的。
在一些方面,所述羟乙醛脱氢酶是aldA。在一些方面,所述aldA包括包含SEQ IDNO:4的氨基酸序列。在一些方面,所述aldA由包含SEQ ID NO:3的核酸序列编码。在一些方面,所述羟乙醛脱氢酶是所述微生物内源性的。
在一些方面,所述微生物还表达乙醇酸产生途径,所述途径具有以下中的一项或多项:(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达;和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。在一些方面,(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面,所述OXB20启动子由包含SEQ ID NO:96的核酸序列编码。
在一些方面,所述异柠檬酸裂解酶是AceA。在一些方面,所述AceA包括包含SEQ IDNO:90的氨基酸序列。在一些方面,所述AceA由包含SEQ ID NO:89的核酸序列编码。
在一些方面,所述乙醛酸还原酶是YcdW。在一些方面,所述YcdW包括包含SEQ IDNO:92的氨基酸序列。在一些方面,所述YcdW由包含SEQ ID NO:91的核酸序列编码。
在一些方面,所述重组微生物来源于选自由以下项组成的组的亲本微生物:梭菌属(Clostridium sp.)、永达尔梭菌(Clostridium ljungdahlii)、产乙醇梭菌(Clostridium autoethanogenum)、拉氏梭菌(Clostridium ragsdalei)、粘液真杆菌(Eubacterium limosum)、嗜甲基丁酸杆菌(Butyribacterium methylotrophicum)、热醋穆尔氏菌(Moorella thermoacetica)、醋酸梭菌(Clostridium aceticum)、伍氏醋酸杆菌(Acetobacterium woodii)、巴氏嗜喊菌(Alkalibaculum bacchii)、德雷克氏梭菌(Clostridium drakei)、食一氧化碳梭菌(Clostridium carboxidivorans)、甲酸乙酸梭菌(Clostridium formicoaceticum)、粪味梭菌(Clostridium scatologenes)、热自养穆尔氏菌(Moorella thermoautotrophica)、长醋丝菌(Acetonema longum)、延长布劳特氏菌(Blautia producta)、乙二醇梭菌(Clostridium glycolicum)、大梭菌(Clostridiummagnum)、马永贝梭菌(Clostridium mayombei)、食甲氧基苯甲酸梭菌(Clostridiummethoxybenzovorans)、丙酮丁醇梭菌(Clostridium acetobutylicum)、拜氏梭菌(Clostridium beijerinckii)、普氏产醋杆菌(Oxobacter pfennigii)、凯伍嗜热厌氧菌(Thermoanaerobacter kivui)、卵形鼠孢菌(Sporomusa ovata)、棕色嗜热产醋菌(Thermoacetogenium phaeum)、甲醇醋酸杆菌(Acetobacterium carbinolicum)、白蚁鼠孢菌(Sporomusa termitida)、甘油穆尔氏菌(Moorella glycerini)、聚集性真杆菌(Eubacterium aggregans)、固氮密螺旋体(Treponema azotonutricium)、大肠杆菌、酿酒酵母(Saccharomyces cerevisiae)、恶臭假单胞菌(Pseudomonas putida)、芽孢杆菌属(Bacillus sp.)、棒状杆菌属(Corynebacterium sp.)、解脂耶氏酵母(Yarrowialipolytica)、树干毕赤酵母(Scheffersomyces stipitis)和甘油利用泰瑞孢子菌(Terrisporobacter glycolicus)。在一些方面,所述亲本微生物是大肠杆菌。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,并且其中所述微生物包含以下一项或多项:(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活,以使得所述转运蛋白不表达;(b)一个或多个内源性或外源性核酸序列,其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活,和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。在一些方面,所述微生物产生的所述发酵产物是一种或多种包含1、2、3、4、5、6、7、8、9或10个碳的分子。在一些方面,同时产生两种或更多种分子。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生发酵产物的重组大肠杆菌,其中重组微生物同时利用木糖和葡萄糖,并且其中所述微生物包含以下一项或多项:(a)所述微生物的基因组中的ATP结合转运蛋白araFGH和xylFGH的缺失或失活,以使得所述转运蛋白不表达;(b)一个或多个内源性或外源性核酸序列,其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活,和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生单乙二醇(MEG)和/或丙酮的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,所述微生物还包含glcDEF的缺失或失活。在一些方面,所述C5同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面,所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面,所述木糖同向转运蛋白是所述微生物内源性的。在一些方面,所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面,所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面,所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面,所述微生物包含功能性磷酸转移酶系统。在一些方面,所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面,所述一个或多个编码所述aldA的核酸分子包含SEQ ID NO:3中列出的核酸序列。在一些方面,所述一个或多个编码所述aldA的氨基酸序列包含SEQ ID NO:4中列出的氨基酸序列。如权利要求5所述的重组微生物,其中所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。如权利要求5所述的重组微生物,其中所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。如权利要求5所述的重组微生物,其中连续木糖输入独立于其他糖在所述原料中的存在而发生。
在一些方面,所述重组微生物包括MEG产生途径,所述途径具有以下(c)至(e)中的一项或多项:(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。
在一些方面,(c)和(d)在由proD启动子控制的操纵子中。在一些方面,所述木糖异构酶是XylA。在一些方面,所述木糖异构酶是所述微生物内源性的。在一些方面,所述酮己糖激酶来自智人。在一些方面,所述酮己糖激酶是所述微生物异源性的。在一些方面,所述果糖二磷酸醛缩酶来自智人。在一些方面,所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面,所述羟乙醛还原酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是fucO。在一些方面,所述木酮糖激酶是XylB。
在一些方面,所述重组微生物包括MEG产生途径,所述途径具有以下(c)至(e)中的一项或多项:(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖脱氢酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖酸内酯酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶是所述微生物内源性的。在一些方面,所述木糖脱水酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。
在一些方面,所述木糖脱水酶是所述微生物异源性的。在一些方面,所述木糖脱水酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是fucO。在一些方面,所述羟乙醛还原酶是所述微生物异源性的。在一些方面,所述木糖异构酶是XylA。在一些方面,所述木酮糖激酶是XylB。
在一些方面,所述重组微生物还包含丙酮产生途径,所述途径具有以下(f)至(h)中的一项或多项:(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化。在一些方面,(f)、(g)和(h)在由OXB11启动子控制的操纵子中。
在一些方面,所述乙酰乙酰基辅酶A硫解酶来自丙酮丁醇梭菌。在一些方面,所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面,所述乙酰乙酸脱羧酶来自拜氏梭菌。
在一些方面,所述重组微生物还包含异丙醇产生途径,所述途径具有以下(f)至(i)中的一项或多项:(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化,(i)至少一个编码醇脱氢酶的外源性核酸分子的表达,所述醇脱氢酶催化丙酮至异丙醇的转化。
在一些方面,本公开一般涉及能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物还表达一个或多个乙醇酸产生途径。在一些方面,所述微生物还包含glcDEF的缺失或失活。在一些方面,所述微生物还包含dkgA的缺失或失活。在一些方面,所述微生物还包含yahK的缺失或失活。在一些方面,所述木糖同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面,所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面,所述木糖同向转运蛋白是所述微生物内源性的。在一些方面,所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面,所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面,所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。
在一些方面,所述微生物包含功能性磷酸转移酶系统。在一些方面,所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面,所述一个或多个编码所述CRP的核酸分子包含SEQ ID NO:9中列出的核酸序列。在一些方面,所述一个或多个编码所述CRP的氨基酸序列包含SEQ ID NO:10中列出的氨基酸序列。在一些方面,所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,连续木糖输入独立于其他糖在所述原料中的存在而发生。
在一些方面,所述重组微生物包括乙醇酸产生途径,所述途径具有以下(c)和(e)中的一项或多项:(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。在一些方面,(c)和(d)在由proD启动子控制的操纵子中。
在一些方面,所述木糖异构酶是XylA。在一些方面,所述木糖异构酶是所述微生物内源性的。在一些方面,所述酮己糖激酶来自智人。在一些方面,所述酮己糖激酶是所述微生物异源性的。在一些方面,所述果糖二磷酸醛缩酶来自智人。在一些方面,所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面,所述羟乙醛脱氢酶是aldA。在一些方面,所述羟乙醛脱氢酶是所述微生物内源性的。在一些方面,所述木酮糖激酶是XylB。
在一些方面,所述重组微生物包括乙醇酸产生途径,所述途径具有以下(c)至(e)中的一项或多项;(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。在一些方面,(c)和(d)由proD启动子控制。
在一些方面,所述木糖异构酶是XylA。在一些方面,所述木酮糖激酶是XylB。在一些方面,所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖脱氢酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、沃氏富盐菌。在一些方面,所述木糖酸内酯酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶是所述微生物内源性的。在一些方面,所述羟乙醛脱氢酶是aldA。在一些方面,所述羟乙醛脱氢酶是所述微生物内源性的。
在一些方面,所述微生物还表达乙醇酸产生途径,所述途径具有以下中的一项或多项:(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达;和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。在一些方面,(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面,所述异柠檬酸裂解酶是AceA。在一些方面,所述乙醛酸还原酶是YcdW。
在一些方面,所述重组微生物来源于选自由以下项组成的组的亲本微生物:梭菌属、永达尔梭菌、产乙醇梭菌、拉氏梭菌、粘液真杆菌、嗜甲基丁酸杆菌、热醋穆尔氏菌、醋酸梭菌、伍氏醋酸杆菌、巴氏嗜喊菌、德雷克氏梭菌、食一氧化碳梭菌、甲酸乙酸梭菌、粪味梭菌、热自养穆尔氏菌、长醋丝菌、延长布劳特氏菌、乙二醇梭菌、大梭菌、马永贝梭菌、食甲氧基苯甲酸梭菌、丙酮丁醇梭菌、拜氏梭菌、普氏产醋杆菌、凯伍嗜热厌氧菌、卵形鼠孢菌、棕色嗜热产醋菌、甲醇醋酸杆菌、白蚁鼠孢菌、甘油穆尔氏菌、聚集性真杆菌、固氮密螺旋体、大肠杆菌、酿酒酵母、恶臭假单胞菌、芽孢杆菌属、棒状杆菌属、解脂耶氏酵母、树干毕赤酵母和甘油利用泰瑞孢子菌。
附图说明
图1描绘了采用木糖和葡萄糖来产生本文考虑的产物的多个途径。
图2是描绘在1:1比例培养物中,在共同消耗菌株中检测的葡萄糖和木糖的同时利用,而在亲本菌株中木糖仅在葡萄糖耗尽后才开始消耗的图。
图3是描绘共同消耗菌株消耗75%的初始糖混合物,而亲本菌株仅消耗62%的图(36小时培养)。对于6:1比例培养物,亲本和共同消耗菌株都完全消耗初始葡萄糖和木糖,木糖消耗和生物质产生的特征曲线相似。
图4是描绘MEG在菌株中的使用的图。MEG的总量增加12%,而丙酮的量增加197%。
图5是描绘在1:1比例培养物中,在共同消耗菌株中检测的葡萄糖和木糖的同时利用,而在亲本菌株中木糖仅在葡萄糖耗尽后18小时后才开始减少的图。
图6是描绘共同消耗菌株消耗61%的初始糖混合物,而亲本菌株消耗52%的糖的图(36小时培养)。对于6:1比例培养物,共同消耗和亲本菌株完全消耗初始葡萄糖和木糖,木糖消耗和生物质产生的特征曲线相似。
图7是描绘MEG的总量增加9%,而丙酮的总量增加119%的图。
具体实施方式
本公开一般涉及微生物工程改造,以最大限度地从可生物再生植物原料产生所期望的产物,由于单一类型的原料中存在的多个碳源的阻遏作用,这些植物原料通常无法实现任何接近最大的收率和生产率。源于一些单糖的共同消耗,本公开阐述了用于减少或消除阻遏作用的方法和组合物,所述阻遏作用导致微生物不能以最大生产率运行。
以下定义和缩写用于解释本公开。
如本文和所附权利要求书中所用,除非上下文另外明确指出,否则单数形式“一”、“一种(个)”和“所述(该)”包括复数指示物。因此,例如,提及“一种酶”包括多种此类酶并且提及“所述微生物”包括提及一种或多种微生物,等等。
如本文所用,术语“包含(comprises)”、“包含(comprising)”、“包括(includes)”、“包括(including)”、“具有(has)”、“具有(having)”、“含有(contains)”、“含有(containing)”或其任何其他变型旨在涵盖非排他性包含。包含一系列要素的组合物、混合物、工艺、方法、制品或设备不一定仅限于那些要素,而是可以包括未明确列出的或此类组合物、混合物、工艺、方法、制品或设备或非固有的其他要素。此外,除非明确陈述相反,否则“或”是指包含性的“或”,而不是排他性的“或”。
术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“”寡核苷酸可互换使用。它们是指任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)或其类似物的聚合形式。多核苷酸可以具有任何三维结构,并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例:基因或基因片段的编码区或非编码区、从连接分析中定义的多个基因座(一个基因座)、外显子、内含子、信使RNA(mRNA)、转运RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微型RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。多核苷酸可以包含一个或多个经修饰的核苷酸,诸如甲基化核苷酸和核苷酸类似物。如果存在,则可以在聚合物组装之前或之后赋予对核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合之后进一步修饰,诸如通过与标记组分缀合。
“互补性”是指核酸通过传统的沃森-克里克(Watson-Crick)或其他非传统类型与另一核酸序列形成氢键的能力。百分比互补性表示核酸分子中可与第二核酸序列形成氢键(例如沃森-克里克碱基配对)的残基的百分比(例如,10个中有5、6、7、8、9、10个分别为50%、60%、70%、80%、90%和100%互补)。“完全互补”意指核酸序列的所有连续残基将与第二核酸序列中相同数量的连续残基氢键结合。如本文所用,“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50或更多个核苷酸的区域上互补程度为至少60%、65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%,或是指在严格条件下杂交的两个核酸。序列同一性,诸如为了评估百分比互补性的目的,可以通过任何合适的比对算法来测量,包括但不限于Needleman-Wunsch算法(参见例如在www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html上可获得的EMBOSSNeedle比对程序,任选地用默认设置)、BLAST算法(参见例如在blast.ncbi.nlm.nih.gov/Blast.cgi上可获得的BLAST比对工具,任选地用默认设置)或Smith-Waterman算法(参见例如在www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html上可获得的Water比对程序,任选地用默认设置)。可以使用所选算法的任何合适的参数,包括默认参数来评估最佳比对。
如本文所用,“表达”是指多核苷酸从DNA模板转录(诸如转录为mRNA或其他RNA转录物)的过程和/或转录的mRNA随后翻译为肽、多肽或蛋白质的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸来源于基因组DNA,则表达可以包括mRNA在真核细胞中的剪接。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指任何长度的氨基酸的聚合物。聚合物可以是直链或支链的,它可以包含经修饰的氨基酸,并且它可以被非氨基酸中断。这些术语还涵盖已被修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操作(诸如与标记成分缀合)。如本文所用,术语“氨基酸”包括天然和/或非天然或合成氨基酸,包括甘氨酸和D或L旋光异构体,以及氨基酸类似物和肽模拟物。
如本文所用,术语“约”与术语“大约”同义使用。示例性地,关于量的术语“约”的使用表示略微超出所引用值的值,例如正负0.1%至10%。
术语“生物纯的培养物”或“基本上纯的培养物”是指本文所述的细菌种类的培养物,其不含足以干扰培养物的复制或通过正常细菌学技术检测到的量的其他细菌种类。
如本文所用,“控制序列”是指操纵子、启动子、沉默子或终止子。
如本文所用,“引入的”是指通过现代生物技术的引入,而不是天然存在的引入。
如本文所用,“组成型启动子”是在大多数条件下和/或在大多数发育阶段期间有活性的启动子。在生物技术中使用的表达载体中使用组成型启动子有若干优点,诸如:用于选择转基因细胞或生物体的蛋白质的高水平产生;报告蛋白或可评分标志物的高表达水平,允许容易的检测和定量;作为调控转录系统的一部分的转录因子的高水平产生;在生物体中需要普遍存在的活性的化合物的产生;以及所有发育阶段期间所期望的化合物的产生。
如本文所用,“非组成型启动子”是在某些条件下,在某些类型的细胞中,和/或在某些发育阶段期间有活性的启动子。例如,诱导型启动子和处于发育控制下的启动子是非组成型启动子。
如本文所用,“诱导型”或“阻抑型”启动子是处于化学或环境因素控制下的启动子。可影响诱导型启动子的转录的环境条件的实例包括厌氧条件、某些化学物质、光的存在、酸性或碱性条件等。
如本文所用,术语“可操作地连接”是指核酸序列在单个核酸片段上的缔合,使得一个的功能受另一个调控。例如,当启动子能够调控编码序列的表达(即,编码序列处于启动子的转录控制下)时,该启动子与该编码序列可操作地连接。编码序列可以在有义或反义方向上可操作地连接至调控序列。在另一个实例中,本公开的互补RNA区域可以直接或间接可操作地连接至靶mRNA的5',或靶mRNA的3',或靶mRNA内,或第一互补区域在靶mRNA的5’而其补体在靶mRNA的3'。
如本文所用,术语“信号序列”是指将肽和多肽靶向细胞位置或细胞外环境的氨基酸序列。信号序列通常处于多肽的N端部分处并且通常酶促去除。具有其信号序列的多肽称为全长和/或未加工的。其信号序列去除的多肽称为成熟和/或经加工的。
如本文关于各种分子,例如多核苷酸、多肽、酶等使用的术语“外源”是指自然界中给定的酵母、细菌、生物体、微生物或细胞中通常或天然未发现的和/或由给定酵母、细菌、生物体、微生物或细胞产生的分子。
另一方面,如本文关于各种分子,例如多核苷酸、多肽、酶等使用的术语“内源”或“天然”是指自然界中给定的酵母、细菌、生物体、微生物或细胞中通常或天然发现的和/或由给定酵母、细菌、生物体、微生物或细胞产生的分子。
如本文在经修饰的宿主细胞的上下文中使用的术语“异源”是指各种分子,例如多核苷酸、多肽、酶等,其中以下中的至少一项是真实的:(a)所述一种或多种分子是宿主细胞外来的(“外源的”)(即,天然未发现的);(b)所述一种或多种分子是给定的宿主微生物或宿主细胞中天然发现的(例如,是“内源的”),但是在细胞中在非天然位置或以非天然量产生;和/或(c)所述一种或多种分子在核苷酸或氨基酸序列方面与内源性核苷酸或氨基酸序列不同,使得在核苷酸或氨基酸序列方面与内源发现的内源核苷酸或氨基酸不同的分子在细胞中以非天然的量(例如,大于天然发现的量)产生。
如本文关于第一家族或物种的原始酶或基因使用的术语“同源物”是指第二家族或物种的不同酶或基因,通过功能、结构或基因组分析确定是与第一家族或物种的原始酶或基因相对应的第二家族或物种的酶或基因。同源物最常具有功能、结构或基因组相似性。已知可以使用基因探针和PCR容易地克隆酶或基因的同源物的技术。可以使用功能测定和/或通过基因的基因组作图确认克隆序列作为同源物的同一性。
如果由基因编码的氨基酸序列具有与第二基因的氨基酸序列相似的氨基酸序列,则一种蛋白质与第二蛋白质具有“同源性”或与第二蛋白质“同源”。可替代地,如果两种蛋白质具有“相似的”氨基酸序列,则一种蛋白质与第二蛋白质具有同源性。因此,术语“同源蛋白”旨在意指所述两种蛋白具有相似的氨基酸序列。在某些情况下,两种蛋白质之间的同源性指示其因进化相关的共有家系。认为、据信或已知术语“同源序列”或“同源物”是功能上相关的。功能关系可以多种方式中的任一种指示,包括但不限于:(a)序列同一性程度和/或(b)相同或相似的生物学功能。优选地,指示(a)和(b)两者。序列同一性程度可以变化,但是在一个方面,为至少50%(当使用本领域已知的标准序列比对程序时)、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少98.5%或至少约99%或至少99.5%或至少99.8%或至少99.9%。同源性可以使用本领域中容易获得的软件程序来测定,诸如在Current Protocols in Molecular Biology(F.M.Ausubel等人编辑,1987)增刊30,第7.718节,表7.71中讨论的那些。一些比对程序是MacVector(OxfordMolecular Ltd,Oxford,U.K.)和ALIGN Plus(Scientific and Educational Software,Pennsylvania)。其他非限制性的比对程序包括Sequencher(Gene Codes,Ann Arbor,Michigan)、AlignX和Vector NTI(Invitrogen,Carlsbad,CA)。相似的生物学功能可以包括但不限于:催化相同或相似的酶促反应;对底物或辅因子具有相同或相似的选择性;具有相同或相似的稳定性;对各种发酵条件(温度、pH等)具有相同或相似的耐受性;和/或对各种代谢底物、产物、副产物、中间产物等具有相同或相似的耐受性。根据本领域技术人员已知用于测定给定生物学功能的一种或多种测定法,生物学功能的相似性程度可以变化,但是在一个方面,为至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少98.5%或至少约99%或至少99.5%或至少99.8%或至少99.9%。
术语“变体”是指本文所述的任何多肽或酶。变体还涵盖多聚体的一个或多个组分、包含单独组分的多聚体、包含多个单独组分的多聚体(例如,参考分子的多聚体)、化学分解产物和生物分解产物。具体而言,非限制性方面,由于编码参考酶的多肽序列的任何部分中的改变,酶可以是相对于参考酶的“变体”。在用于测量参考酶的制剂的酶活性的标准测定法中,参考酶的变体可以具有至少10%、至少30%、至少50%、至少80%、至少90%、至少100%、至少105%、至少110%、至少120%、至少130%或更高的酶活性。在一些方面,变体也可以指与本公开的全长或未经加工的酶具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多肽。在一些方面,变体还可以指与本公开的成熟的或经加工的酶具有至少50%、至少60%、至少70%、至少80%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多肽。
如本文所用,术语“微生物(microorganism或microbe)”应被广义地理解。这些可互换使用的术语包括但不限于两个原核域、细菌和古细菌。
如本文所用,“分离”、“分离的”、“分离的微生物”等术语旨在意指一种或多种微生物已经与在特定环境(例如培养基、水、反应室等)中与其相关的至少一种材料分离。因此,“分离的微生物”不存在于其天然环境中;相反,正是通过本文所述的各种技术,微生物从其天然环境中移除并且放置于非天然的存在状态中。因此,分离的菌株或分离的微生物可以作为例如生物纯培养物或孢子(或其他形式的菌株)存在。在一些方面,分离的微生物可以与可接受的载剂结合,所述载剂可以是商业上或工业上可接受的载剂。
在本公开的某些方面,分离的微生物以“分离的和生物纯培养物”存在。本领域的技术人员将理解,特定微生物的分离和生物纯培养物表示所述培养物基本上不含其他活生物体并且仅含有所讨论的个体微生物。培养物可以含有不同浓度的所述微生物。本公开指出,分离和生物纯微生物通常“必然不同于纯度较低或不纯的材料”。参见,例如,In reBergstrom,427F.2d 1394,(CCPA 1970)(讨论纯化的前列腺素),另外参见,In re Bergy,596F.2d 952(CCPA 1979)(讨论纯化的微生物),另外参见,Parke-Davis&Co.v.H.K.Mulford&Co.,189F.95(S.D.N.Y.1911)(讨论纯化的肾上腺素的学习手册),aff’d in part,rev’d in part,196F.496(2d Cir.1912),每个文献均以引用的方式并入本文。此外,在一些方面,本公开提供了必须在分离和生物纯微生物培养物中存在的浓度或纯度限制的某些定量度量。在某些方面,这些纯度值的存在是将本公开的微生物与以天然状态存在的那些微生物区分开来的另外属性。参见,例如,Merck&Co.v.Olin MathiesonChemical Corp.,253F.2d 156(4th Cir.1958)(讨论微生物产生的维生素B12的纯度限制),该文献以引用的方式并入本文。
本公开的微生物可以包括孢子和/或营养细胞。在一些方面,本公开的微生物包括处于存活但不可培养(VBNC)状态的微生物。如本文所用,“孢子(spore或spores)”是指由细菌和真菌产生的适于生存和传播的结构。孢子通常以休眠结构为特征;然而,孢子能够通过萌发过程进行分化。萌发是孢子分化为能够进行代谢活动、生长和繁殖的营养细胞。单个孢子的萌发产生单个真菌或细菌营养细胞。真菌孢子是无性繁殖的单位,在一些情况下是真菌生命周期中的必要结构。细菌孢子是生存条件的结构,通常可能不利于营养细胞的存活或生长。
如本文所用,“微生物组合物”是指包含本公开的一种或多种微生物的组合物。
如本文所用,“载剂”、“可接受的载剂”、“商业上可接受的载剂”或“工业上可接受的载剂”是指可以施用、储存或转移微生物,不会对微生物产生不利影响的稀释剂、佐剂、赋形剂或媒介物。
如本文所用,术语“收率潜力”是指来自生物合成途径的产物的收率。在一个方面,收率潜力可以表示为按最终产物重量/起始化合物重量计的百分比。
如本文所用的术语“热力学最高收率”是指基于与原料相比的产物的能量值从给定原料诸如葡萄糖的发酵获得的产物的最高收率。在正常发酵中,不使用诸如光、氢气或甲烷或电力等额外能源,例如,产物不能含有比原料更多的能量。热力学最高收率表示来自原料的所有能量和质量都转化为产物时的产物收率。该收率可以计算并且不依赖于具体途径。如果朝向产物的具体途径的收率低于热力学最高收率,则其丧失质量并且最有可能在朝向产物的更有效的途径时得到改善或者被朝向产物的更有效的途径替代。
术语“氧化还原平衡”是指一组反应,它们一起产生与消耗一样多的氧化还原辅因子。设计代谢途径和工程化改造生物体,以使得氧化还原辅因子平衡或接近平衡通常使得所期望的化合物以更高效、更高收率的方式产生。氧化还原反应总是作为同时发生的两个半反应一起进行,一个半反应是氧化反应,另一个半反应是还原反应。在氧化还原过程中,还原剂将电子转移给氧化剂。因此,在反应中,还原剂或还原试剂丢失电子并且被氧化,而氧化剂或氧化试剂获得电子并且被还原。在一个方面,氧化还原反应在生物系统中发生。生物能量常常通过氧化还原反应储存和释放。光合作用涉及二氧化碳还原为糖和水氧化为分子氧。逆反应,呼吸作用氧化糖产生二氧化碳和水。作为中间步骤,还原碳化合物用于还原烟酰胺腺嘌呤二核苷酸(NAD+),然后烟酰胺腺嘌呤二核苷酸有助于产生质子梯度,质子梯度驱动腺苷三磷酸(ATP)的合成并通过氧的还原得以维持。术语氧化还原状态通常用于描述生物系统(诸如细胞或器官)中GSH/GSSG、NAD+/NADH和NADP+/NADPH的平衡。氧化还原状态反映在几组代谢物(例如乳酸和丙酮酸、β-羟基丁酸和乙酰乙酸)的平衡中,其相互转化取决于这些比率。异常氧化还原状态可以在许多有害情况下发展,诸如缺氧、休克和败血症。
如本文所用,术语“生产率”是指每小时产生的生物产物的总量–产物克数/(升每小时)。
如本文所用,术语“基本上不含微生物”、“基本上不含细菌”或“基本上不含真菌/酵母”不应解释为意味着不存在微生物/细菌/真菌/酵母,虽然在一些方面这可以是优选的。相反,“基本上不含”应解释为意味着,例如,基本上不含细菌的组合物是这样的组合物:其中存在于组合物中的任何细菌都非常少以至于它们低于检出限。在一些方面,微生物选自一种或多种细菌、真菌、酵母、病毒、原生生物和藻类。
如本文所用,术语“不含微生物”是指完全不存在微生物或完全不存在能够进行繁殖营养生长的活微生物。
同时消耗木糖和葡萄糖
在工业或商业过程中,微生物生产率是一个关键因素,在考虑通常利润微薄的大规模反应的经济可行性时必须考虑这个因素。微生物生产率,在这个意义上是每升每小时产生的产物克数。在不存在经修饰的微生物的情况下,不断送入一个或多个反应室中的含有木糖和葡萄糖的流将可能导致至少葡萄糖对一种或多种单糖的摄取阻遏。
两阶段生长的潜在机制是碳分解代谢产物阻遏(CCR),其中全局转录调控因子CRP(cAMP受体蛋白)在调控次级糖(诸如木糖、阿拉伯糖和半乳糖)的分解代谢操纵子的转录活化中发挥核心作用。磷酸烯醇丙酮酸:糖磷酸转移酶系统(PTS)也涉及葡萄糖诱导的大肠杆菌中木糖利用的阻遏。木糖可以被大肠杆菌用作唯一的碳源和能源,并且通过戊糖磷酸途径代谢。木糖可以通过两种摄取系统输入:高亲和力的ATP依赖性系统和相对低亲和力的D-木糖:H+同向转运蛋白。与主要通过能量效率更高的同向转运蛋白转运的阿拉伯糖转运不同,木糖主要通过能量消耗更高的ATP依赖性转运蛋白转运,即使在高糖浓度下也是如此。所有负责木糖摄取和分解代谢的基因都对CCR敏感。
为了实现将戊糖转化为所期望的化学物质的有效生物过程,有必要对宿主微生物进行工程化改造,以高效、同步和快速地利用混合糖,达到工业过程所需的收率和生产率。本公开阐述了一种代谢工程策略,以便有效促进来自木质纤维素生物质的木糖和葡萄糖的同时消耗,因此获得经工程化的微生物菌株的全部潜力,从而获得来源于D-木糖酸或D-木酮糖-1P或羟乙醛作为中间体的通路的所期望的化学物质。
对大肠杆菌中的糖共利用进行工程化改造的常见策略依赖于PTS组分的失活,这可能与galP(半乳糖:H+同向转运蛋白)活性和CRP突变的改善有关,也可能无关。然而,PTS组分的失活削弱葡萄糖摄取,并且CRP突变体通常具有缓慢的生长表型,这可能是由于其他重要基因表达的不可预测的变化。这两种方法导致生产率下降,特别是对于高糖浓度和低成本培养基的条件。
申请人认为,支持葡萄糖和木糖共同消耗从而产生所期望的化学物质是首次开发的代谢工程策略,其以D-木酮糖-1P或D-木糖酸或羟乙醛作为中间体,独立于PTS失活并且具有ATP结合转运蛋白缺失。
在一些方面,促进木糖和葡萄糖的同时消耗以产生所期望的化学物质基于:(1)不依赖于ATP的D-木糖同向转运蛋白的组成型过表达;(2)将木糖转化为D-木酮糖-1P或D-木糖酸的基因的组成型表达;(3)天然戊糖(主要是木糖和阿拉伯糖)ABC转运蛋白系统的缺失;和/或木糖分解代谢基因的缺失。
本文所述的主题与现有技术的区别在于,ABC转运蛋白的缺失或失活以及利用或包含D-木酮糖、D-木糖酸或羟乙醛作为中间体的同向转运蛋白和途径的表达不仅积极影响糖的共同利用,而且还增加了产生所期望的化学物质的途径的总收率和生产率。这种改善是由于微生物总代谢的调控、ATP可用性曲线的改变以及中间体D-木酮糖-1P、D-木糖酸和/或羟乙醛的产生的促进。参见Kim等人(2015.Metabolic Engineering,30:141-148),Sievert等人(2017.PNAS,114(28):7349-7354),Wang等人(2018.Microbial CellFactories,17(12):1-12)和Bai等人(2016.Metabolic Engineering,38:285-292)。
本公开包括克服葡萄糖对木糖的分解代谢阻遏的策略,允许同时消耗两种糖。与共同消耗糖的其他方法不同,本策略的设计和实施侧重于确保对糖的分解代谢阻遏不敏感的有效木糖摄取,同时保持天然PTS系统对葡萄糖的有效摄取。
在一些方面,本方法包括在所关注的微生物菌株中进行以下修饰:1(a)过表达可操作地连接至组成型启动子的天然木糖同向转运蛋白XylE,和/或1(b)过表达可操作地连接至组成型启动子的天然阿拉伯糖同向转运蛋白AraE;2(a)在组成型启动子下表达天然木糖异构酶XylA和异源性酮己糖激酶khk-C以及天然木酮糖激酶XylB的缺失或失活,或者2(b)表达可操作地连接至组成型启动子的异源性木糖脱氢酶xdh以及天然木糖异构酶XylA的缺失或失活和/或天然木酮糖激酶XylB的缺失;以及3ATP结合转运蛋白AraFGH、XylFGH、RbsABC和AlsABC的缺失。
在一些方面,木糖和阿拉伯糖同向转运蛋白的组成型表达使木糖输入独立于CRP调控,因此独立于培养液中存在的其他糖。在一些方面,木糖异构酶的组成型表达使木糖利用独立于CRP调控,因此也独立于培养液中存在的其他糖。在一些方面,酮己糖激酶khk-C的表达将D-木酮糖有效地转化为用于产生所期望的化学物质的中间体D-木酮糖1-P。在一些方面,木酮糖激酶的缺失防止碳从化学产生途径转向天然戊糖磷酸途径。
在一些方面,木糖脱氢酶的组成型表达使木糖利用独立于CRP调控,因此也独立于培养液中存在的其他糖;并且还将D-木糖有效地转化为用于产生所期望的化学物质的中间体D-木糖酸。在一些方面,木酮糖激酶和/或木糖异构酶的缺失防止碳从化学产生途径转向天然戊糖磷酸途径。在一些方面,ATP结合盒转运蛋白(诸如阿拉伯糖ABC转运蛋白和木糖ABC转运蛋白)的缺失避免了糖输入过程中的ATP丧失。ATP的净含量可以改变大肠杆菌的中心代谢的活性,从而可能增加途径收率。
在组成型启动子下过表达天然木糖同向转运蛋白XylE
D-木糖/质子同向转运蛋白XylE是一种由xylE基因编码的不依赖于ATP的低亲和力转运蛋白,是转运蛋白主要促进子超家族(MFS)的成员。据信xylE的转录受XylR(SEQ IDNO:7或SEQ ID NO:8)调控。XylR是一种由xylR基因编码的转录因子,它响应于木糖(xylE、xylFGH和xylAB基因)而正向调控木糖代谢和转运蛋白基因的转录。
木糖同向转运蛋白的组成型过表达释放碳分解代谢阻遏并且实现连续木糖输入,它独立于培养液中存在的糖,而葡萄糖摄取仍将由PTS系统组分进行。因此,水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时输入。
在组成型启动子下过表达天然阿拉伯糖同向转运蛋白AraE
D-阿拉伯糖/质子同向转运蛋白AraE是一种由araE基因编码的不依赖于ATP的低亲和力转运蛋白,是转运蛋白主要促进子超家族(MFS)的成员。araE的转录受AraC(SEQ IDNO:32或SEQ ID NO:33)和CRP调控。AraC是一种由araC基因编码的转录因子,它响应于阿拉伯糖(xylE、xylFGH和xylAB基因)而负向调控木糖代谢和转运蛋白基因的转录,并且响应于阿拉伯糖(araE、araFGH和araBAD基因)而正向调控阿拉伯糖代谢和转运蛋白基因的转录。在不存在葡萄糖的情况下,araE表达由阿拉伯糖诱导。众所周知,AraE转运蛋白是混杂的,能够转运木糖和其他戊糖。
混杂的阿拉伯糖同向转运蛋白的组成型表达释放CCR并且实现连续木糖输入,它独立于培养液中存在的糖,而葡萄糖摄取仍由PTS系统组分进行。因此,水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时输入。
在组成型启动子下表达天然木糖异构酶XylA和异源性酮己糖激酶khk-C,以及天然木酮糖激酶XylB的缺失
XylA是一种内源性D-木糖异构酶(图1,反应5,途径B),它催化D-木糖转化为D-木酮糖。D-木糖异构酶(E.C.5.3.1.5)催化D-木糖在大肠杆菌中天然分解代谢的第一个反应。xylA的转录受XylR和CRP调控;在不存在葡萄糖的情况下,它的表达由木糖诱导。酮己糖激酶(图1,反应6,途径B)催化D-木酮糖磷酸化为D-木酮糖-1-P。酮己糖激酶(E.C.2.7.1.3)可以存在于多种生物体中,然而来自人肝脏的khk-C是对木酮糖有活性的有前景的候选物。D-木酮糖1-P是产生多种化学物质的关键中间体。
XylB是一种由xylB编码的木酮糖激酶(2.7.1.17),它催化D-木酮糖的磷酸化(图1,反应8,途径B)。这是天然木糖降解途径的第二步,所述途径产生戊糖磷酸途径的中间体D-木酮糖-5-磷酸。该反应与通过khk-C进行的D-木酮糖的磷酸化竞争,使通量从D-木酮糖-1-P产生偏离至戊糖磷酸途径。
天然木糖异构酶xylA的组成型表达释放CCR,并且当与酮己糖激酶khk-C的组成型异源表达相关联时,使独立于培养液中存在的糖的连续木糖利用成为可能,并且产生生成化学物质的中间体D-木酮糖1-P。葡萄糖摄取仍将由PTS系统组分进行。因此,水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时利用。木酮糖激酶xylB的缺失将防止碳从化学产生途径转向天然戊糖磷酸途径。
在组成型启动子下表达异源性木糖脱氢酶xdh,以及天然木糖异构酶Xyla的缺失和/或天然木酮糖激酶XylB的缺失
异源性木糖脱氢酶xdh催化D-木糖转化为D-木糖酸内酯(图1,反应1,途径A)。D-木糖脱氢酶(E.C.1.1.1.175)可以存在于多种生物体中;然而,来自新月柄杆菌的xdh是针对D-木糖的活性的候选物。D-木糖酸内酯可以自发地转化为D-木糖酸,因此xdh针对木糖的表达产生D-木糖酸,这是产生多种化学物质的关键中间体。
由xylA编码的D-木糖异构酶(E.C.5.3.1.5)XylA催化D-木糖转化为戊糖磷酸途径的中间体D-木酮糖(图1,反应5,途径A)。由xylB编码的木酮糖激酶(2.7.1.17)XylB催化D-木酮糖的磷酸化(图1,反应8,途径A),这是木糖降解途径的第二步,产生戊糖磷酸途径的另一个中间体D-木酮糖-5-磷酸。这两个反应都与xdh竞争,使通量从D-木糖酸产生偏离至戊糖磷酸途径。
木糖脱氢酶的组成型异源表达使独立于培养液中存在的糖的连续木糖利用成为可能,并且产生生成所期望的化学物质的中间体D-木糖酸。葡萄糖摄取仍将由PTS系统组分进行。因此,水解产物中存在的葡萄糖和木糖都可以被大肠杆菌同时利用。D-木糖异构酶和/或木酮糖激酶的缺失将防止碳从化学产生途径转向天然戊糖磷酸途径。
ATP结合盒转运蛋白AraFGH、XylFGH、RbsABC和AlsABC的缺失
阿拉伯糖ABC转运蛋白AraFGH(E.C.3.6.3.17,TCDB 3.A.1.2.2)是由araFGH基因编码的高亲和力的ATP驱动的系统。AraF是周质结合蛋白,AraH是膜组分,AraG是这种ABC转运蛋白的ATP结合组分。araFGH操纵子的转录受AraC和CRP调控。在不存在葡萄糖的情况下,araFGH表达由阿拉伯糖诱导。众所周知,AraFGH转运蛋白是混杂的,能够转运木糖和其他戊糖。
木糖ABC转运蛋白XylFGH(E.C.3.6.3.17,TCDB 3.A.1.2.4)是由xylFGH基因编码的高亲和力的ATP驱动的系统。XylF是周质结合蛋白,XylH是膜组分,XylG是这种ABC转运蛋白的ATP结合组分。xylFGH操纵子的转录受XylR和CRP调控;在不存在葡萄糖的情况下,它的表达由木糖诱导。
核糖ABC转运蛋白RbsABC(E.C.3.6.3.17;TCDB 3.A.1.2.1)是由rbsABC基因编码的高亲和力的ATP驱动的系统。
在一些方面,所述一个或多个编码RbsABC的RbsB周质结合蛋白亚基的核酸分子包含SEQ ID NO:35中列出的核酸序列。在一些方面,所述一个或多个编码RbsABC的RbsB周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:38中列出的氨基酸序列。在一些方面,所述一个或多个编码RbsABC的RbsA ATP结合亚基的核酸分子包含SEQ ID NO:34中列出的核酸序列。在一些方面,所述一个或多个编码RbsABC的RbsA ATP结合亚基的氨基酸序列包含SEQID NO:37中列出的氨基酸序列。在一些方面,所述一个或多个编码RbsABC的RbsC膜亚基的核酸分子包含SEQ ID NO:36中列出的核酸序列。在一些方面,所述一个或多个编码RbsABC的RbsC膜亚基的氨基酸序列包含SEQ ID NO:39中列出的氨基酸序列。
阿洛糖ABC转运蛋白AlsABC(E.C.3.6.3.17;TCDB 3.A.1.2.6)是由alsABC基因编码的ATP驱动的系统。
在一些方面,所述一个或多个编码AlsABC的alsB周质结合蛋白亚基的核酸分子包含SEQ ID NO:41中列出的核酸序列。在一些方面,所述一个或多个编码AlsABC的alsB周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:44中列出的氨基酸序列。在一些方面,所述一个或多个编码AlsABC的alsA ATP结合亚基的核酸分子包含SEQ ID NO:40中列出的核酸序列。在一些方面,所述一个或多个编码AlsABC的alsA ATP结合亚基的氨基酸序列包含SEQID NO:43中列出的氨基酸序列。在一些方面,所述一个或多个编码AlsABC的alsC膜亚基的核酸分子包含SEQ ID NO:42中列出的核酸序列。在一些方面,所述一个或多个编码AlsABC的alsC膜亚基的氨基酸序列包含SEQ ID NO:45中列出的氨基酸序列。
ATP结合盒转运蛋白(诸如核糖ABC转运蛋白、阿洛糖ABC转运蛋白、阿拉伯糖ABC转运蛋白和木糖ABC转运蛋白,包括大肠杆菌中优先的木糖转运蛋白)的缺失结合xylE组成型表达(参见实施例1和2),释放CCR并且实现连续木糖输入。此外,缺失将避免糖输入过程中的ATP丧失。净ATP可以改变大肠杆菌的中心代谢的活性。
微生物
如本文所述,在一些方面,重组微生物能够同时利用木糖和葡萄糖。
如本文所述,在一些方面,所述重组微生物是原核微生物。在一些方面,所述原核微生物是细菌。“细菌”或“真细菌”是指原核生物域。细菌包括如下至少十一个不同的类别:(1)革兰氏阳性(革兰氏+)细菌,其中有两个主要分支:(1)高G+C类别(放线菌(Actinomycete)、分枝杆菌(Mycobacteria)、微球菌(Micrococcus)等)(2)低G+C类别(杆菌(Bacillus)、梭菌(Clostridia)、乳酸杆菌(Lactobacillus)、葡萄球菌(Staphylococci)、链球菌(Streptococci)、支原体(Mycoplasmas));(2)变形菌门,例如紫色光合成+非光合成革兰氏阴性细菌(包括大多数“常见”革兰氏阴性细菌);(3)蓝细菌(Cyanobacteria),例如氧光养生物;(4)螺旋体(Spirochetes)和相关物种;(5)浮霉状菌(Planctomyces);(6)拟杆菌(Bacteroides)、黄杆菌(Flavobacteria);(7)衣原体(Chlamydia);(8)绿色硫细菌;(9)绿色非硫细菌(也是厌氧光养生物);(10)抗放射性微球菌和亲缘菌;(11)栖热袍菌(Thermotoga)和嗜热栖热腔菌(Thermosipho thermophiles)。
“革兰氏阴性细菌”包括球菌、非肠杆菌和肠杆菌。革兰氏阴性细菌的属包括例如奈瑟氏菌属(Neisseria)、螺菌属(Spirillum)、巴斯德菌属(Pasteurella)、布鲁氏菌属(Brucella)、耶尔森氏菌属(Yersinia)、弗朗西斯菌属(Francisella)、嗜血杆菌属(Haemophilus)、博代氏菌属(Bordetella)、埃希氏菌属(Escherichia)、沙门氏菌属(Salmonella)、志贺菌属(Shigella)、克雷白杆菌属(Klebsiella)、变形菌属(Proteus)、弧菌属(Vibrio)、假单胞菌属(Pseudomonas)、拟杆菌属(Bacteroides)、醋酸杆菌属(Acetobacter)、气杆菌属(Aerobacter)、土壤杆菌属(Agrobacterium)、固氮菌属(Azotobacter)、螺旋状菌属(Spirilla)、沙雷氏菌属(Serratia)、弧菌属(Vibrio)、根瘤菌属(Rhizobium)、衣原体属(Chlamydia)、立克次体属(Rickettsia)、密螺旋体属(Treponema)和梭杆菌属(Fusobacterium)。
“革兰氏阳性细菌”包括球菌、非孢子化杆菌和孢子化杆菌。革兰氏阳性细菌的属包括例如放线菌属(Actinomyces)、杆菌属(Bacillus)、梭菌属(Clostridium)、棒状杆菌属(Corynebacterium)、丹毒丝菌属(Erysipelothrix)、乳杆菌属(Lactobacillus)、李斯特菌属(Listeria)、分支杆菌属(Mycobacterium)、粘球菌属(Myxococcus)、诺卡菌属(Nocardia)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)和链霉菌属(Streptomyces)。
在一些方面,本公开的微生物是真菌。
在一些方面,重组微生物是真核微生物。在一些方面,真核微生物是酵母。在示例性方面,酵母是选自由以下组成的组的属的成员:耶氏酵母属(Yarrowia)、念珠菌属(Candida)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、克鲁维酵母菌属(Kluyveromyces)、伊萨酵母属(Issatchenkia)、接合酵母属(Zygosaccharomyces)、德巴利氏酵母属(Debaryomyces)、裂殖酵母属(Schizosaccharomyces)、管囊酵母属(Pachysolen)、隐球酵母属(Cryptococcus)、毛孢子菌属(Trichosporon)、红酵母属(Rhodotorula)和粘液菌属(Myxozyma)。
在一些方面,重组微生物是原核微生物。在示例性方面,原核微生物是选自由以下组成的组的属的成员:埃希氏菌属(Escherichia)、梭菌属(Clostridium)、发酵单胞菌属(Zymomonas)、沙门氏菌属(Salmonella)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、杆菌属(Bacillus)、乳杆菌属(Lactobacillus)、肠球菌属(Enterococcus)、产碱菌属(Alcaligenes)、克雷白杆菌属(Klebsiella)、类芽孢杆菌属(Paenibacillus)、节杆菌属(Arthrobacter)、棒状杆菌属(Corynebacterium)和短杆菌属(Brevibacterium)。
在一些方面,用于本公开的方法中的微生物可以选自由以下组成的组:耶氏酵母属、念珠菌属、酵母属、毕赤酵母属、汉逊酵母属、克鲁维酵母菌属、伊萨酵母属、接合酵母属、德巴利氏酵母属、裂殖酵母属、管囊酵母属、隐球酵母属、毛孢子菌属、红酵母属、粘液菌属、埃希氏菌属、梭菌属、发酵单胞菌属、沙门氏菌属、红球菌属、假单胞菌属、杆菌属、乳杆菌属、肠球菌属、产碱菌属、克雷白杆菌属、类芽孢杆菌属、节杆菌属、棒状杆菌属和短杆菌属。
在一些方面,由本文所述的方法产生的微生物可以是选自以下属中的任一个属的种:奈瑟氏菌属、螺菌属、巴斯德菌属、布鲁氏菌属、耶尔森氏菌属、弗朗西斯菌属、嗜血杆菌属、博代氏菌属、埃希氏菌属、沙门氏菌属、志贺菌属、克雷白杆菌属、变形菌属、弧菌属、假单胞菌属、拟杆菌属、醋酸杆菌属、气杆菌属、土壤杆菌属、固氮菌属、螺旋状菌属、沙雷氏菌属、弧菌属、根瘤菌属、衣原体属、立克次体属、密螺旋体属、梭杆菌属、放线菌属、杆菌属、梭菌属、棒状杆菌属、丹毒丝菌属、乳杆菌属、李斯特菌属、分支杆菌属、粘球菌属、诺卡菌属、葡萄球菌属、链球菌属、链霉菌属、酵母属、毕赤酵母属和曲霉属(Aspergillus)。
在一些方面,用于本公开的方法中的微生物包括:梭菌属、永达尔梭菌、产乙醇梭菌、拉氏梭菌、粘液真杆菌、嗜甲基丁酸杆菌、热醋穆尔氏菌、醋酸梭菌、伍氏醋酸杆菌、巴氏嗜喊菌、德雷克氏梭菌、食一氧化碳梭菌、甲酸乙酸梭菌、粪味梭菌、热自养穆尔氏菌、长醋丝菌、延长布劳特氏菌、乙二醇梭菌、大梭菌、马永贝梭菌、食甲氧基苯甲酸梭菌、丙酮丁醇梭菌、拜氏梭菌、普氏产醋杆菌、凯伍嗜热厌氧菌、卵形鼠孢菌、棕色嗜热产醋菌、甲醇醋酸杆菌、白蚁鼠孢菌、甘油穆尔氏菌、聚集性真杆菌、固氮密螺旋体、大肠杆菌、酿酒酵母、恶臭假单胞菌、芽孢杆菌属、棒状杆菌属、解脂耶氏酵母、树干毕赤酵母和甘油利用泰瑞孢子菌。
术语“重组微生物”和“重组宿主细胞”在本文中可互换使用,并且是指已经过遗传修饰以表达或过表达内源酶、表达异源酶,诸如包括在载体、整合构建体中的那些,或在内源基因的表达方面具有改变的微生物。“改变”意指编码一个或多个多肽或多肽亚基的RNA分子或等同RNA分子的基因表达或水平,或一个或多个多肽或多肽亚基的活性上调或下调,使得表达、水平或活性大于或小于在不存在改变的情况下观察到的表达、水平或活性。例如,术语“改变”可以意指“抑制”,但词语“改变”的使用不限于该定义。应理解,术语“重组微生物”和“重组宿主细胞”不仅指特定重组微生物,而且指此类微生物的后代或潜在后代。因为由于突变或环境影响在下一代中可能出现某些修饰,所以事实上此类后代可能与亲本细胞不同,但仍包括在本文所用术语的范围内。
在本公开的方法中使用的微生物的培养可以使用本领域已知的用于使用本公开的微生物培养和发酵底物的许多方法进行。
发酵可以在任何合适的生物反应器中进行,诸如连续搅拌釜式生物反应器、泡罩塔生物反应器、气升式生物反应器、流化床生物反应器、填充床生物反应器、光生物反应器、固定化细胞反应器、滴流床反应器、移动床生物膜反应器、泡罩塔、气升发酵槽、膜反应器(诸如中空纤维膜生物反应器)等。在一些方面,生物反应器包括在其中培养微生物的第一生长反应器和向其中供给来自生长反应器的发酵肉汤并且大部分发酵产物在其中产生的第二发酵反应器。在一些方面,生物反应器同时实现了微生物的培养和从提供的碳源诸如底物和/或原料产生发酵产物。
产物
在一些方面,本公开的经工程化的微生物从包含木糖和葡萄糖的原料产生发酵产物,其中所述重组微生物同时利用木糖和葡萄糖。在一些方面,微生物产生的发酵产物包括一种或多种包含至少1、至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、或至少10个碳的分子。
在一些方面,本公开的经工程化的微生物能够产生所期望的化学物质,诸如单乙二醇、乙醇酸、C3化合物(诸如丙酮、异丙醇和丙烯)、氨基酸和多元醇。参见Koch等人(WO2017156166A1)和Mcbride等人(WO2011022651A1)。
在一些方面,由于单一类型的原料中存在的多个碳源的阻遏作用不存在,因此本公开的经工程化的微生物能够以最大收率产生所期望的化学物质。
遗传修饰
引入本公开的一种或多种微生物中的遗传修饰可以改变或消除靶基因的调控序列。在一些方面,引入本公开的一种或多种微生物中的遗传修饰可以将新性状或新表型引入到所述一种或多种微生物中。也可以插入一个或多个调控序列,包括异源调控序列和在对应于向其中引入遗传变异的微生物的动物、植物、真菌、酵母、细菌或病毒的基因组内发现的调控序列。而且,可以基于微生物培养物中基因的表达水平来选择调控序列。遗传变异可以是特异性引入靶位点的预定遗传变异。在一些方面,遗传变异是引入到一条或多条微生物染色体中的核酸序列。在一些方面,遗传变异是引入到一个或多个染色体外核酸序列中的核酸序列。遗传变异可以是靶位点内的随机突变。遗传变异可以是一个或多个核苷酸的插入或缺失。在一些情况下,将多个不同的遗传变异(例如,2、3、4、5、10个或更多个)引入一种或多种分离的细菌中。所述多个遗传变异可以是上述类型中的任一种、相同或不同类型,以及任何组合。在一些情况下,连续引入多个不同的遗传变异,在第一分离步骤之后引入第一遗传变异,在第二分离步骤之后引入第二遗传变异,以此类推,以便在微生物中积聚多个所期望的修饰。
在一些方面,遗传修饰是靶基因或调控序列的缺失或失活。在一些方面,缺失是靶基因或大部分靶基因的除去。在一些方面,缺失是靶基因或大部分靶基因的替代。在其他方面,缺失导致靶基因的完全功能丧失。在一些方面,缺失导致靶基因的部分功能丧失。在一些方面,功能丧失或部分功能丧失通过将经修饰的靶基因序列的活性与未经修饰的靶基因序列的活性进行比较来确定。在一些方面,靶基因的失活是可操作地连接至靶序列的一个或多个调控或控制序列的缺失或破坏的结果。在一些方面,靶基因的失活是用异源性序列使靶基因破坏的结果。在一些方面,失活导致靶基因的部分功能丧失。在一些方面,失活导致靶基因的完全功能丧失。
在一些方面,所期望的化学物质的产生中阐述的底物中的一种或多种是从碳原料(例如,木糖和葡萄糖)生物合成的。
一般来说,术语“遗传变异”是指相对于参考多核苷酸,诸如参考基因组或其一部分,或参考基因或其一部分引入多核苷酸序列内的任何变化。遗传变异可以称为“突变”,并且包含遗传变异的序列或生物体可以称为“遗传变体”或“突变体”。遗传变异可以具有许多作用,诸如一些生物活性的增加或减少,这些生物活性包括基因表达、代谢和细胞信号传导。遗传变异可以特异性引入靶位点,或随机引入。多种分子工具和方法可用于引入遗传变异。例如,遗传变异可以经由聚合酶链式反应诱变、寡核苷酸定向诱变、饱和诱变、片段改组诱变、同源重组、重组工程、lambda red介导的重组、CRISPR/Cas9系统、化学诱变及其组合来引入。引入遗传变异的化学方法包括将DNA暴露于化学诱变剂,例如,甲磺酸乙酯(EMS)、甲磺酸甲酯(MMS)、N-硝基尿糖(EN U)、N-甲基-N-硝基-N′-硝基胍、4-硝基喹啉N-氧化物、硫酸二乙酯、苯并芘、环磷酰胺、博来霉素(bleomycin)、三乙基三聚氰胺、丙烯酰胺单体、氮芥、长春新碱、二环氧烷烃(例如,二环氧丁烷)、ICR-170、甲醛、盐酸丙卡巴肼、环氧乙烷、二甲基亚硝胺、7,12二甲基苯并(a)蒽、苯丁酸氮芥、六甲基磷酰胺、白消安等等。辐射突变诱导剂包括紫外辐射、γ-辐照、X射线和快中子轰击。还可以使用例如三甲基补骨脂素与紫外线将遗传变异引入核酸中。随机或靶向插入移动DNA元件,例如转座元件,是产生遗传变异的另一种合适的方法。遗传变异可以在无细胞的体外系统中在扩增期间引入核酸中,例如使用聚合酶链式反应(PCR)技术,诸如易错PCR。可以在体外使用DNA改组技术(例如,外显子改组、结构域交换等)将遗传变异引入核酸中。
遗传变异也可以由于细胞中DNA修复酶的缺乏而引入核酸中,例如,预计细胞中存在编码突变型DNA修复酶的突变基因会在该细胞的基因组中产生高频率的突变(即,约1个突变/100个基因-1个突变/10,000个基因)。编码DNA修复酶的基因的实例包括但不限于MutH、Mut S、Mut L和Mut U,以及它们在其他物种中的同源物(例如,MSH 1 6、PMS 1 2、MLH 1、GTBP、ERCC-1等)。用于引入遗传变异的各种方法的示例性描述提供于例如Stemple(2004)Nature 5:1-7;Chiang等人(1993)PCR Methods Appl 2(3):210-217;Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;以及美国专利号6,033,861和6,773,900中。
引入到微生物中的遗传变异可以分类为转基因的、顺基因的、基因组内的、基因内的、基因间的、合成的、演化的、重排的或SNP。
CRISPR/Cas9(规律间隔成簇短回文重复序列)/CRISPR相关(Cas)系统可用于引入所期望的突变。CRISPR/Cas9通过使用CRISPR RNA(crRNA)引导侵入核酸的沉默,为细菌和古细菌提供针对病毒和质粒的获得性免疫。Cas9蛋白(或其功能等同物和/或其变体,即Cas9样蛋白)天然含有DNA核酸内切酶活性,其取决于蛋白质与称为crRNA和tracrRNA(也称为向导RNA)的两种天然存在的或合成的RNA分子的缔合。在一些情况下,所述两种分子共价连接形成单个分子(也称为单向导RNA(“sgRNA”)。因此,Cas9或Cas9样蛋白与靶向DNA的RNA缔合(该术语涵盖双分子向导RNA构型和单分子向导RNA构型两者),从而活化Cas9或Cas9样蛋白并将所述蛋白引导到靶核酸序列。如果Cas9或Cas9样蛋白保留其天然酶促功能,则它将会裂解靶DNA以产生双链断裂,这可以导致基因组改变(即,编辑:缺失、插入(当存在供体多核苷酸时)、置换等),从而改变基因表达。Cas9的一些变体(所述变体被术语Cas9样所涵盖)已经改变,使得它们具有降低的DNA裂解活性(在一些情况下,它们裂解单链而非靶DNA的两条链,而在其他情况下,它们的DNA裂解活性严重降低或没有DNA裂解活性)。用于引入遗传变异的CRISPR系统的进一步示例性描述可在例如US8795965中找到。
寡核苷酸定向诱变,也称为定点诱变,通常利用合成DNA引物。这种合成引物含有所期望的突变并且与突变位点周围的模板DNA互补,使其可与目标基因中的DNA杂交。突变可以是单碱基变化(点突变)、多碱基变化、缺失或插入,或这些的组合。然后,使用拷贝基因的其余部分的DNA聚合酶延伸单链引物。这样拷贝的基因含有突变位点,然后可以作为载体引入宿主细胞中并克隆。最后,可以通过DNA测序以检查它们含有所期望的突变来选择突变体。
可以使用易错PCR引入遗传变异。在这种技术中,在序列复制的保真度不足的条件下,使用DNA聚合酶扩增目标基因。结果是扩增产物在序列中含有至少一个错误。当扩增基因且与模板分子相比时,反应的所得产物在序列中含有一个或多个改变时,所得产物与模板相比是诱变的。引入随机突变的另一种手段是使细胞暴露于化学诱变物,诸如亚硝基胍或甲磺酸乙酯(Nestmann,Mutat Res 1975年6月;28(3):323-30),然后从宿主中分离含有该基因的载体。
同源重组诱变涉及外源DNA片段与靶向多核苷酸序列之间的重组。在发生双链断裂之后,在称为切除的过程中切掉断裂的5’末端周围的DNA区段。在随后的链侵入步骤中,断裂的DNA分子的突出3'末端然后“侵入”未断裂的相似或相同DNA分子。该方法可用于使基因缺失,去除外显子,添加基因以及引入点突变。同源重组诱变可以是永久性的或条件性的。通常,还提供了重组模板。重组模板可以是另一载体的组分,包含在单独的载体中,或作为单独的多核苷酸提供。在一些方面,将重组模板设计为在同源重组中充当模板,诸如在被位点特异性核酸酶切口或裂解的靶序列内或附近。模板多核苷酸可以具有任何合适的长度,诸如长度为约或超过约10、15、20、25、50、75、100、150、200、500、1000个或更多个核苷酸。在一些方面,模板多核苷酸与包含靶序列的多核苷酸的一部分互补。当最佳比对时,模板多核苷酸可与靶序列的一个或多个核苷酸重叠(例如约或超过约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100个或更多个核苷酸)。在一些方面,当模板序列和包含靶序列的多核苷酸最佳比对时,模板多核苷酸最近的核苷酸在距靶序列约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个或更多个核苷酸内。可用于同源重组方法中的定点核酸酶的非限制性实例包括锌指核酸酶、CRISPR核酸酶、TALE核酸酶和大范围核酸酶。关于此类核酸酶的使用的进一步描述,参见例如US8795965和US20140301990。
引入遗传变异可能是不完整的过程,使得经处理的细菌群体中的一些细菌携带所期望的突变,而其他细菌则不携带所期望的突变。在一些情况下,期望施加选择压力,以便富集携带所期望的遗传变异的细菌。传统上,对成功的遗传变体的选择涉及选择或淘汰遗传变异赋予或消除的一些功能性,诸如在插入抗生素抗性基因或消除能够将非致死性化合物转化为致死性代谢物的代谢活性的情况下。还可以基于多核苷酸序列本身施加选择压力,使得仅需引入所期望的遗传变异(例如,也不需要选择标志物)。在这种情况下,选择压力可以包括裂解缺乏引入靶位点的遗传变异的基因组,使得有效地针对设法向其中引入遗传变异的参考序列进行选择。通常,裂解发生在靶位点的100个核苷酸内(例如,在距靶位点75、50、25、10个或更少的核苷酸内,包括在靶位点处或靶位点内裂解)。裂解可以由选自由锌指核酸酶、CRISPR核酸酶、TALE核酸酶(TALEN)或大范围核酸酶组成的组的位点特异性核酸酶定向。此类方法类似于用于增强靶位点处的同源重组的方法,除了不提供用于同源重组的模板之外。因此,缺乏所期望的遗传变异的细菌更有可能经历裂解,裂解未得到修复,导致细胞死亡。然后可以分离选择中存活的细菌,以评估赋予的改善性状。
CRISPR核酸酶可用作位点特异性核酸酶,以将裂解定向于靶位点。通过使用Cas9杀伤非突变细胞,可以获得突变微生物的改善选择。然后可以从组织中重新分离微生物。用于淘汰非变体的CRISPR核酸酶系统可以采用与上文关于引入遗传变异描述的那些相似的元件,除了不提供用于同源重组的模板之外。因此,定向于靶位点的裂解增强了受影响的细胞的死亡。
可用于特异性诱导靶位点处的裂解的其他选项是可用的,诸如锌指核酸酶、TALE核酸酶(TALEN)系统和大范围核酸酶。锌指核酸酶(ZFN)是通过使锌指DNA结合结构域与DNA裂解结构域融合而产生的人工DNA核酸内切酶。ZFN可以经工程化改造以靶向所期望的DNA序列,并且这使得锌指核酸酶能够裂解独特的靶序列。当引入细胞中时,ZFN可用于通过诱导双链断裂来编辑细胞中的靶DNA(例如,细胞基因组)。转录活化因子样效应物核酸酶(TALEN)是通过使TAL(转录活化因子样)效应物DNA结合结构域与DNA裂解结构域融合而产生的人工DNA核酸内切酶。TALEN可以快速工程化改造为结合几乎任何所期望的DNA序列,并且当引入细胞中时,TALEN可用于通过诱导双链断裂来编辑细胞中的靶DNA(例如,细胞基因组)。大范围核酸酶(归巢核酸内切酶)是内源脱氧核糖核酸酶,其特征在于大的识别位点(12至40个碱基对的双链DNA序列)。大范围核酸酶可用于以高度靶向的方式置换、消除或修饰序列。通过蛋白质工程改造修饰其识别序列,可以改变靶向序列。大范围核酸酶可用于修饰所有基因组类型,无论是细菌、植物还是动物的,并且通常分为四个家族:LAGLIDADG家族、GIY-YIG家族、His-Cyst盒家族和HNH家族。示例性的归巢核酸内切酶包括I-SceI、I-CeuI、PI-PspI、PI-Sce、I-SceIV、I-CsmI、I-PanI、I-SceII、I-PpoI、I-SceIII、I-CreI、I-TevI、I-TevII和I-TevIII。
在一些方面,微生物是重组微生物。在一些方面,微生物已经被遗传修饰为产生单乙二醇。在一些方面,微生物已经被遗传修饰为产生一种或多种三碳化合物,诸如丙酮、异丙醇和丙烯。在一些方面,微生物已经被遗传修饰为共同产生单乙二醇和一种或多种三碳化合物。在一些方面,微生物已经用微生物生物合成途径进行遗传修饰以产生单乙二醇、丙酮、异丙醇和丙烯中的一种或多种。参见Koch等人(WO2017156166A1),该文献涉及用于对微生物进行工程化改造以从可再生原料产生单乙二醇、丙酮、异丙醇和丙烯中的一种或多种的现有技术。
在一些方面,微生物已经通过引入木糖酸途径进行遗传修饰。在一些方面,微生物已经通过引入木酮糖磷酸途径进行遗传修饰。在一些方面,微生物已经通过引入核酮糖磷酸途径进行遗传修饰。参见Koch等人。
能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖
在一些方面,所述重组微生物包含以下一项或多项:(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活,以使得所述转运蛋白不表达;(b)一个或多个内源性或外源性核酸序列,其编码至少一个C5糖同向转运蛋白并且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活,和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,C5糖同向转运蛋白是能够转运5碳糖的同向转运蛋白。在一些方面,5碳糖可以是但不限于木糖、阿拉伯糖或核糖。
MEG和/或丙酮的通常产生
在一些方面,所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,所述微生物还包含乙醇酸脱氢酶glcDEF的缺失或失活。在一些方面,所述C5同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面,所述一个或多个编码所述GAPDH启动子的核酸分子包含SEQ ID NO:95中列出的核酸序列。在一些方面,所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面,所述一个或多个编码所述XylE的核酸分子包含SEQ ID NO:48中列出的核酸序列。在一些方面,所述一个或多个编码所述XylE的氨基酸序列包含SEQ ID NO:49中列出的氨基酸序列。在一些方面,所述木糖同向转运蛋白是所述微生物内源性的。在一些方面,所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面,所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面,所述一个或多个编码所述AraE的核酸分子包含SEQ ID NO:46中列出的核酸序列。在一些方面,所述一个或多个编码所述AraE的氨基酸序列包含SEQ ID NO:47中列出的氨基酸序列。在一些方面,所述木糖对其他单糖的分解代谢阻遏不敏感。
在一些方面,所述微生物包含功能性磷酸转移酶系统。在一些方面,所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面,所述一个或多个编码所述CRP的核酸分子包含SEQ ID NO:9中列出的核酸序列。在一些方面,所述一个或多个编码所述CRP的氨基酸序列包含SEQ ID NO:10中列出的氨基酸序列。在一些方面,所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,连续木糖输入独立于其他糖在所述原料中的存在而发生。
MEG和/或丙酮的产生,包括木酮糖途径
在一些方面,所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;和(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物包括MEG产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活;其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,(c)和(d)在由proD启动子控制的操纵子中。在一些方面,所述一个或多个编码所述proD启动子的核酸分子包含SEQ ID NO:53中列出的核酸序列。在一些方面,所述木糖异构酶是XylA。在一些方面,所述一个或多个编码所述XylA的核酸分子包含SEQID NO:5中列出的核酸序列。在一些方面,所述一个或多个编码所述XylA的氨基酸序列包含SEQ ID NO:6中列出的氨基酸序列。在一些方面,所述木糖异构酶是所述微生物内源性的。在一些方面,酮己糖激酶是Khk-C。在一些方面,酮己糖激酶来自智人。在一些方面,所述酮己糖激酶是所述微生物异源性的。在一些方面,所述一个或多个编码所述Khk-C的核酸分子包含SEQ ID NO:11中列出的核酸序列。在一些方面,所述一个或多个编码所述Khk-C的氨基酸序列包含SEQ ID NO:12中列出的氨基酸序列。在一些方面,所述果糖二磷酸醛缩酶是aldoB。在一些方面,所述果糖二磷酸醛缩酶来自智人。在一些方面,所述果糖二磷酸醛缩酶是所述微生物异源性的。在一些方面,所述一个或多个编码所述aldoB的核酸分子包含SEQID NO:50中列出的核酸序列。在一些方面,所述一个或多个编码所述aldoB的氨基酸序列包含SEQ ID NO:51中列出的氨基酸序列。在一些方面,所述羟乙醛还原酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是fucO。在一些方面,所述一个或多个编码所述fucO的核酸分子包含SEQ ID NO:52中列出的核酸序列。在一些方面,所述一个或多个编码所述fucO的氨基酸序列包含SEQ ID NO:98中列出的氨基酸序列。在一些方面,所述木酮糖激酶是XylB。在一些方面,所述一个或多个编码所述XylB的核酸分子包含SEQ ID NO:13中列出的核酸序列。在一些方面,所述一个或多个编码所述XylB的氨基酸序列包含SEQ ID NO:14中列出的氨基酸序列。
MEG和/或丙酮的产生,包括木糖酸途径
在一些方面,所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;和(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物包括MEG产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活;并且其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面,所述木糖脱氢酶是所述微生物异源性的。在一些方面,所述一个或多个编码所述新月柄杆菌木糖脱氢酶的核酸分子包含SEQ ID NO:15中列出的核酸序列。在一些方面,所述一个或多个编码所述新月柄杆菌木糖脱氢酶的氨基酸序列包含SEQ ID NO:16中列出的氨基酸序列。在一些方面,所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱氢酶的核酸分子包含SEQ ID NO:97中列出的核酸序列。在一些方面,所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱氢酶的氨基酸序列包含SEQ ID NO:17中列出的氨基酸序列。在一些方面,所述一个或多个编码所述沃氏富盐菌木糖脱氢酶的核酸分子包含SEQ ID NO:18中列出的核酸序列。在一些方面,所述一个或多个编码所述沃氏富盐菌木糖脱氢酶的氨基酸序列包含SEQ ID NO:19中列出的氨基酸序列。
在一些方面,所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面,所述木糖酸内酯酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶是所述微生物内源性的。在一些方面,所述一个或多个编码所述新月柄杆菌木糖酸内酯酶的核酸分子包含SEQ ID NO:54中列出的核酸序列。在一些方面,所述一个或多个编码所述新月柄杆菌木糖酸内酯酶的氨基酸序列包含SEQ ID NO:55中列出的氨基酸序列。在一些方面,所述一个或多个编码所述异种伯克霍尔德氏菌木糖酸内酯酶的核酸分子包含SEQID NO:56中列出的核酸序列。在一些方面,所述一个或多个编码所述异种伯克霍尔德氏菌木糖酸内酯酶的氨基酸序列包含SEQ ID NO:57中列出的氨基酸序列。在一些方面,所述一个或多个编码所述沃氏富盐菌木糖酸内酯酶的核酸分子包含SEQ ID NO:58中列出的核酸序列。在一些方面,所述一个或多个编码所述沃氏富盐菌木糖酸内酯酶的氨基酸序列包含SEQ ID NO:59中列出的氨基酸序列。
在一些方面,所述木糖脱水酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面,所述木糖脱水酶是所述微生物异源性的。在一些方面,所述木糖脱水酶是所述微生物内源性的。在一些方面,所述一个或多个编码所述新月柄杆菌木糖脱水酶的核酸分子包含SEQ ID NO:60中列出的核酸序列。在一些方面,所述一个或多个编码所述新月柄杆菌木糖脱水酶的氨基酸序列包含SEQ ID NO:61中列出的氨基酸序列。在一些方面,所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱水酶的核酸分子包含SEQ ID NO:62中列出的核酸序列。在一些方面,所述一个或多个编码所述异种伯克霍尔德氏菌木糖脱水酶的氨基酸序列包含SEQ ID NO:63中列出的氨基酸序列。在一些方面,所述一个或多个编码所述沃氏富盐菌木糖脱水酶的核酸分子包含SEQ ID NO:64中列出的核酸序列。在一些方面,所述一个或多个编码所述沃氏富盐菌木糖脱水酶的氨基酸序列包含SEQ ID NO:65中列出的氨基酸序列。在一些方面,所述羟乙醛还原酶是所述微生物内源性的。在一些方面,所述羟乙醛还原酶是fucO。在一些方面,所述羟乙醛还原酶是所述微生物异源性的。在一些方面,所述木糖异构酶是XylA。在一些方面,所述木酮糖激酶是XylB。
MEG和/或丙酮的产生,包括木酮糖途径
在一些方面,所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;和(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物包括MEG产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活;其中所述重组微生物包括丙酮产生途径,所述途径具有以下中的一项或多项:(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化,其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,(f)、(g)和(h)在由OXB11启动子控制的操纵子中。在一些方面,所述一个或多个编码所述OXB11的核酸分子包含SEQ ID NO:78中列出的核酸序列。在一些方面,所述乙酰乙酰基辅酶A硫解酶是Thl。在一些方面,所述硫解酶来自丙酮丁醇梭菌或拜氏梭菌。在一些方面,所述一个或多个编码所述丙酮丁醇梭菌thl硫解酶的核酸分子包含SEQ IDNO:68中列出的核酸序列。在一些方面,所述一个或多个编码所述丙酮丁醇梭菌thl硫解酶的氨基酸序列包含SEQ ID NO:69中列出的氨基酸序列。在一些方面,所述一个或多个编码所述拜氏梭菌thl硫解酶的核酸分子包含SEQ ID NO:66中列出的核酸序列。在一些方面,所述一个或多个编码所述拜氏梭菌thl硫解酶的氨基酸序列包含SEQ ID NO:67中列出的氨基酸序列。在一些方面,所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面,所述乙酰乙酸脱羧酶是Adc。在一些方面,所述脱羧酶来自丙酮丁醇梭菌或拜氏梭菌。在一些方面,所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:74中列出的核酸序列。在一些方面,所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ ID NO:75中列出的氨基酸序列。在一些方面,所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:76中列出的核酸序列。在一些方面,所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ IDNO:77中列出的氨基酸序列。
对木糖酸途径具有特异性的MEG和/或丙酮的产生
在一些方面,所述重组微生物包括(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;和(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物包括MEG产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活;其中所述重组微生物包括丙酮产生途径,所述途径具有以下中的一项或多项:(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化,其中所述重组微生物表达MEG和/或丙酮产生途径。
在一些方面,(f)、(g)和(h)在由OXB11启动子控制的操纵子中。在一些方面,所述乙酰乙酰基辅酶A硫解酶是Thl。在一些方面,所述硫解酶来自丙酮丁醇梭菌。在一些方面,所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。在一些方面,所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基α的核酸分子包含SEQ ID NO:70中列出的核酸序列。在一些方面,所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基α的氨基酸序列包含SEQ ID NO:72中列出的氨基酸序列。在一些方面,所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基β的核酸分子包含SEQ ID NO:71中列出的核酸序列。在一些方面,所述一个或多个编码所述乙酸:乙酰乙酰基辅酶A转移酶AtoD亚基β的氨基酸序列包含SEQ ID NO:73中列出的氨基酸序列。在一些方面,所述乙酰乙酸脱羧酶是Adc。在一些方面,所述脱羧酶来自丙酮丁醇梭菌或拜氏梭菌。在一些方面,所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:74中列出的核酸序列。在一些方面,所述一个或多个编码所述丙酮丁醇梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ ID NO:75中列出的氨基酸序列。在一些方面,所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的核酸分子包含SEQ ID NO:76中列出的核酸序列。在一些方面,所述一个或多个编码所述拜氏梭菌Adc乙酰乙酸脱羧酶的氨基酸序列包含SEQ ID NO:77中列出的氨基酸序列。
异丙醇的产生
在一些方面,重组微生物能够从能够产生丙酮的任何一种或多种原料产生异丙醇。在一些方面,已经被工程化改造为产生丙酮的重组微生物被进一步工程化改造为表达至少一种编码醇脱氢酶的外源性核酸分子,所述醇脱氢酶催化丙酮至异丙醇的转化。在一些方面,前述丙酮产生公开的(f)、(g)和(h)被进一步修改为(i)–至少一种编码醇脱氢酶的外源性核酸分子的表达,所述醇脱氢酶催化丙酮至异丙醇的转化。在一些方面,所述一个或多个编码所述醇脱氢酶的核酸分子包含SEQ ID NO:93中列出的核酸序列。在一些方面,所述一个或多个编码所述醇脱氢酶的氨基酸序列包含SEQ ID NO:94中列出的氨基酸序列。
乙醇酸的产生
在一些方面,一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD(SEQ ID NO:1或SEQ ID NO:2)、araFGH和xylFGH的缺失或失活;并且(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中所述重组微生物还表达一个或多个乙醇酸产生途径。
在一些方面,所述一个或多个编码AraFGH的AraF周质结合蛋白亚基的核酸分子包含SEQ ID NO:20中列出的核酸序列。在一些方面,所述一个或多个编码AraFGH的AraF周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:23中列出的氨基酸序列。在一些方面,所述一个或多个编码AraFGH的AraG ATP结合亚基的核酸分子包含SEQ ID NO:21中列出的核酸序列。在一些方面,所述一个或多个编码AraFGH的AraG ATP结合亚基的氨基酸序列包含SEQID NO:24中列出的氨基酸序列。在一些方面,所述一个或多个编码AraFGH的AraH膜亚基的核酸分子包含SEQ ID NO:22中列出的核酸序列。在一些方面,所述一个或多个编码AraFGH的AraH膜亚基的氨基酸序列包含SEQ ID NO:25中列出的氨基酸序列。
在一些方面,所述一个或多个编码xylFGH的xylF周质结合蛋白亚基的核酸分子包含SEQ ID NO:26中列出的核酸序列。在一些方面,所述一个或多个编码xylFGH的xylF周质结合蛋白亚基的氨基酸序列包含SEQ ID NO:29中列出的氨基酸序列。在一些方面,所述一个或多个编码xylFGH的xylG ATP结合亚基的核酸分子包含SEQ ID NO:27中列出的核酸序列。在一些方面,所述一个或多个编码xylFGH的xylG ATP结合亚基的氨基酸序列包含SEQID NO:30中列出的氨基酸序列。在一些方面,所述一个或多个编码xylFGH的xylH膜亚基的核酸分子包含SEQ ID NO:28中列出的核酸序列。在一些方面,所述一个或多个编码xylFGH的xylH膜亚基的氨基酸序列包含SEQ ID NO:31中列出的氨基酸序列。
在一些方面,所述微生物还包含glcDEF的缺失或失活。在一些方面,所述一个或多个编码所述推定的FAD连接亚基GlcD的核酸分子包含SEQ ID NO:79中列出的核酸序列。在一些方面,所述一个或多个编码所述推定的FAD连接亚基GlcD的氨基酸序列包含SEQ IDNO:82中列出的氨基酸序列。在一些方面,所述一个或多个编码所述推定的FAD结合亚基GlcE的核酸分子包含SEQ ID NO:80中列出的核酸序列。在一些方面,所述一个或多个编码所述推定的FAD结合亚基GlcE的氨基酸序列包含SEQ ID NO:83中列出的氨基酸序列。在一些方面,所述一个或多个编码所述推定的铁-硫亚基GlcF的核酸分子包含SEQ ID NO:81中列出的核酸序列。在一些方面,所述一个或多个编码所述推定的铁-硫亚基GlcF的氨基酸序列包含SEQ ID NO:84中列出的氨基酸序列。在一些方面,所述微生物还包含醛还原酶dkgA的缺失或失活。在一些方面,所述一个或多个编码所述dkgA的核酸分子包含SEQ ID NO:85中列出的核酸序列。在一些方面,所述一个或多个编码所述dkgA的氨基酸序列包含SEQ IDNO:86中列出的氨基酸序列。在一些方面,所述微生物还包含醛还原酶yahK的缺失或失活。在一些方面,所述一个或多个编码所述yahK的核酸分子包含SEQ ID NO:87中列出的核酸序列。在一些方面,所述一个或多个编码所述yahK的氨基酸序列包含SEQ ID NO:88中列出的氨基酸序列。在一些方面,所述木糖同向转运蛋白由所述araFGH基因座处的GAPDH启动子控制。在一些方面,所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。在一些方面,所述一个或多个编码所述xylE的核酸分子包含SEQ ID NO:48中列出的核酸序列。在一些方面,所述一个或多个编码所述xylE的氨基酸序列包含SEQ ID NO:49中列出的氨基酸序列。在一些方面,所述木糖同向转运蛋白是所述微生物内源性的。在一些方面,所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。在一些方面,所述一个或多个编码所述araE的核酸分子包含SEQ ID NO:46中列出的核酸序列。在一些方面,所述一个或多个编码所述araE的氨基酸序列包含SEQ ID NO:47中列出的氨基酸序列。在一些方面,所述阿拉伯糖同向转运蛋白是所述微生物内源性的。在一些方面,所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。在一些方面,所述微生物包含功能性磷酸转移酶系统。在一些方面,所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。在一些方面,所述一个或多个编码所述CRP的核酸分子包含SEQ ID NO:9中列出的核酸序列。在一些方面,所述一个或多个编码所述CRP的氨基酸序列包含SEQ ID NO:10中列出的氨基酸序列。在一些方面,所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。在一些方面,连续木糖输入独立于其他糖在所述原料中的存在而发生。
乙醇酸的产生,包括木酮糖途径
在一些方面,一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中重组微生物还表达一个或多个乙醇酸产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,所述核酸序列编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。
在一些方面,(c)和(d)在由proD启动子控制的操纵子中。在一些方面,所述一个或多个编码所述proD启动子的核酸分子包含SEQ ID NO:53中列出的核酸序列。在一些方面,所述木糖异构酶是XylA。在一些方面,所述一个或多个编码所述xylA的核酸分子包含SEQID NO:5中列出的核酸序列。在一些方面,所述一个或多个编码所述xylA的氨基酸序列包含SEQ ID NO:6中列出的氨基酸序列。在一些方面,所述木糖异构酶是所述微生物内源性的。在一些方面,所述木糖异构酶是所述微生物异源性的。在一些方面,所述酮己糖激酶是Khk-C。在一些方面,所述一个或多个编码所述khk-C的核酸分子包含SEQ ID NO:11中列出的核酸序列。在一些方面,所述一个或多个编码所述khk-C的氨基酸序列包含SEQ ID NO:12中列出的氨基酸序列。在一些方面,所述酮己糖激酶来自智人。在一些方面,所述果糖二磷酸醛缩酶是aldoB。在一些方面,所述一个或多个编码所述alsoB的核酸分子包含SEQ ID NO:50中列出的核酸序列。在一些方面,所述一个或多个编码所述aldoB的氨基酸序列包含SEQ IDNO:51中列出的氨基酸序列。在一些方面,所述果糖二磷酸醛缩酶来自智人。在一些方面,所述羟乙醛脱氢酶是所述微生物内源性的。在一些方面,所述羟乙醛脱氢酶是所述微生物异源性的。在一些方面,所述羟乙醛脱氢酶是aldA。在一些方面,所述一个或多个编码所述aldA的核酸分子包含SEQ ID NO:3中列出的核酸序列。在一些方面,所述一个或多个编码所述aldA的氨基酸序列包含SEQ ID NO:4中列出的氨基酸序列。在一些方面,所述木酮糖激酶是XylB。在一些方面,所述一个或多个编码所述xylB的核酸分子包含SEQ ID NO:13中列出的核酸序列。在一些方面,所述一个或多个编码所述xylB的氨基酸序列包含SEQ ID NO:14中列出的氨基酸序列。
乙醇酸的产生,包括木糖酸途径
在一些方面,一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中重组微生物还表达一个或多个乙醇酸产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
在一些方面,(c)和(d)由proD启动子控制。在一些方面,所述木糖异构酶是XylA。在一些方面,所述木酮糖激酶是XylB。在一些方面,所述木糖脱氢酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面,所述木糖脱氢酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶来自新月柄杆菌、异种伯克霍尔德氏菌、或沃氏富盐菌。在一些方面,所述木糖酸内酯酶是所述微生物异源性的。在一些方面,所述木糖酸内酯酶是所述微生物内源性的。在一些方面,所述羟乙醛脱氢酶是aldA。在一些方面,所述羟乙醛脱氢酶是所述微生物内源性的。
乙醇酸的产生(替代途径),包括木酮糖途径-
在一些方面,一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;其中重组微生物还表达一个或多个乙醇酸产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活;并且其中所述微生物还表达乙醇酸产生途径,所述途径具有以下中的一项或多项:(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达;和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。在一些方面,(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面,所述一个或多个编码所述OXB20启动子的核酸分子包含SEQ ID NO:96中列出的核酸序列。在一些方面,所述异柠檬酸裂解酶是AceA。在一些方面,所述乙醛酸还原酶是YcdW。在一些方面,所述一个或多个编码所述ycdW的核酸分子包含SEQ ID NO:91中列出的核酸序列。在一些方面,所述一个或多个编码所述ycdW的氨基酸序列包含SEQ ID NO:92中列出的氨基酸序列。
乙醇酸的产生(替代途径),包括木糖酸途径
在一些方面,一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:(a)亲本微生物的基因组中的fucO、yqhD、yahK、dkgA、araFGH和xylFGH的缺失或失活;以及(b)至少一个内源性或外源性核酸分子的表达,其可操作地连接至一个或多个组成型启动子并且编码C5糖同向转运蛋白;其中重组微生物还表达一个或多个乙醇酸产生途径,所述途径具有以下中的一项或多项:(c)一个或多个内源性或外源性核酸序列的表达,其编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶且可操作地连接至一个或多个组成型启动子;(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活;并且其中所述微生物还表达乙醇酸产生途径,所述途径具有以下中的一项或多项:(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达;和/或(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。
在一些方面,(f)和(g)在由OXB20启动子控制的操纵子中。在一些方面,所述异柠檬酸裂解酶是AceA。在一些方面,所述乙醛酸还原酶是YcdW。
包含本文所述的序列和修饰的重组微生物
在一些方面,本公开广泛涉及前述方面中任一项的所述重组微生物,其中所述重组微生物来源于选自由以下项组成的组的亲本微生物:梭菌属、永达尔梭菌、产乙醇梭菌、拉氏梭菌、粘液真杆菌、嗜甲基丁酸杆菌、热醋穆尔氏菌、醋酸梭菌、伍氏醋酸杆菌、巴氏嗜喊菌、德雷克氏梭菌、食一氧化碳梭菌、甲酸乙酸梭菌、粪味梭菌、热自养穆尔氏菌、长醋丝菌、延长布劳特氏菌、乙二醇梭菌、大梭菌、马永贝梭菌、食甲氧基苯甲酸梭菌、丙酮丁醇梭菌、拜氏梭菌、普氏产醋杆菌、凯伍嗜热厌氧菌、卵形鼠孢菌、棕色嗜热产醋菌、甲醇醋酸杆菌、白蚁鼠孢菌、甘油穆尔氏菌、聚集性真杆菌、固氮密螺旋体、大肠杆菌、酿酒酵母、恶臭假单胞菌、芽孢杆菌属、棒状杆菌属、解脂耶氏酵母、树干毕赤酵母和甘油利用泰瑞孢子菌。在一些方面,所述亲本微生物是大肠杆菌。
在一些方面,本公开的酶、蛋白质、启动子和核酸概述于表1中。
表1:本公开的蛋白质和核酸
Figure BDA0003391242050000401
Figure BDA0003391242050000411
Figure BDA0003391242050000421
Figure BDA0003391242050000431
Figure BDA0003391242050000441
检测遗传修饰的方法
本公开教导了可用于检测本文教导的微生物的引物、探针和测定法。在一些方面,本公开提供了检测WT亲本菌株的方法。在其他方面,本公开提供了检测来源于亲本菌株或WT菌株的经工程化的或经修饰的微生物的方法。在一些方面,本公开提供了鉴定微生物中的遗传改变的方法。
在一些方面,本公开的基因组工程方法导致在经修饰的微生物中产生非天然核苷酸“连接”序列。这些非天然存在的核苷酸连接可以用作一种诊断类型,该诊断指示特定遗传改变存在于本文教导的微生物中。
本公开的技术能够通过使用专门的定量PCR方法(包括独特设计的引物和探针)来检测这些非天然存在的核苷酸连接。在一些方面,本公开的探针结合至非天然存在的核苷酸连接序列。在一些方面,采用传统的PCR。在其他方面,采用实时PCR。在一些方面,采用定量PCR(qPCR)。在一些方面,PCR方法用于鉴定已经插入微生物的基因组DNA或基因组外DNA中的异源序列。
因此,本公开可以涵盖采用两种常用方法来实时检测PCR产物:(1)插入任何双链DNA的非特异性荧光染料,以及(2)由寡核苷酸组成的序列特异性DNA探针,所述寡核苷酸用荧光报告基因标记,只有在探针与其互补序列杂交后才能检测到荧光报告基因。在一些方面,只有非天然存在的核苷酸连接才通过教导的引物扩增,因此可以通过非特异性染料或通过采用特异性杂交探针来进行检测。在其他方面,选择本公开的引物以使得引物侧接于连接序列的任一侧,从而如果发生扩增反应,则存在所述连接序列。
本公开的方面涉及非天然存在的核苷酸连接序列分子本身,以及能够在温和至严格的杂交条件下结合至所述非天然存在的核苷酸连接序列的其他核苷酸分子。在一些方面,能够在温和至严格杂交条件下结合至所述非天然存在的核苷酸连接序列的核苷酸分子被称为“核苷酸探针”。
在一些方面,基因组DNA可以从样品中提取并且用于通过使用qPCR来定量本公开的微生物的存在。qPCR反应中采用的引物可以是由Primer Blast(https://www.ncbi.nlm.nih.gov/tools/primer-blast/)设计的引物,用于扩增野生型基因组的独特区域或经工程化的非属间突变菌株的独特区域。qPCR反应可以使用SYBR GreenER qPCRSuperMix Universal(Thermo Fisher P/N 11762100)试剂盒,仅使用正向和反向扩增引物来进行;或者,Kapa Probe Force试剂盒(Kapa Biosystems P/N KK4301)可以与扩增引物和TaqMan探针一起使用,该探针含有5'末端的FAM染料标记、内部ZEN淬灭剂以及小沟结合物和3'末端的荧光淬灭剂(Integrated DNA Technologies)。
定量聚合酶链式反应(qPCR)是一种实时定量一个或多个核酸序列的扩增的方法。PCR测定法的实时定量允许通过比较所关注的扩增核酸和适当的对照核酸序列(它可以作为校准标准)来确定由PCR扩增步骤产生的核酸的数量。
TaqMan探针通常用于qPCR测定法,这些qPCR测定法需要更高的特异性来定量靶核酸序列。TaqMan探针包括荧光团连接至5'末端并且淬灭剂连接至探针的3'末端的寡核苷酸探针。当TaqMan探针保持探针的5’和3’末端彼此紧密接触时,淬灭剂防止来自荧光团的荧光信号传播。TaqMan探针被设计为在由一组特定引物扩增的核酸区域内退火。当Taq聚合酶延伸引物并且合成新生链时,Taq聚合酶的5'至3'核酸外切酶活性降解退火至模板的探针。该探针降解释放荧光团,从而破坏与淬灭剂的紧密接近并且允许荧光团发出荧光。qPCR测定法中检测到的荧光与释放的荧光团和反应中存在的DNA模板量成正比。
qPCR的特征允许从业者消除凝胶电泳制备的劳动密集型扩增后步骤,这通常是观察传统PCR测定法的扩增产物所必需的。qPCR相对于常规PCR的优势是相当大的,包括提高速度、易用性、重现性和定量能力。
微生物组合物
在一些方面,将本公开的微生物组合成微生物组合物。
在一些方面,本公开的微生物组合物是固体。当使用固体组合物时,可能需要包括一种或多种载剂材料,包括但不限于:矿物土,诸如二氧化硅、滑石粉、高岭土、石灰石、白垩、粘土、白云石、硅藻土;硫酸钙;硫酸镁;氧化镁;沸石,碳酸钙;碳酸镁;海藻糖;壳聚糖;虫胶;白蛋白;淀粉;脱脂奶粉;甜乳清粉;麦芽糊精;乳糖;菊粉;右旋糖;和植物来源的产物,诸如谷物粉、树皮粉、木粉和果壳粉。
在一些方面,本公开的微生物组合物是液体。在其他方面,液体包含溶剂,所述溶剂可包括水或醇或盐水或碳水化合物溶液。在一些方面,本公开的微生物组合物包括粘合剂,诸如聚合物、羧甲基纤维素、淀粉、聚乙烯醇等。
在一些方面,本公开的微生物组合物包含糖(例如,单糖、二糖、三糖、多糖、寡糖等)、聚合糖、脂质、聚合脂质、脂多糖、蛋白质、聚合蛋白、脂蛋白、核酸、核酸聚合物、二氧化硅、无机盐及其组合。在另一方面,微生物组合物包含琼脂、琼脂糖、脱乙酰吉兰糖胶(gelrite)、吉兰糖胶(gellan gum)等的聚合物。在一些方面,微生物组合物包含塑料胶囊、乳液(例如水和油)、膜和人工膜。在一些方面,乳液或连接的聚合物溶液可以包含本公开的微生物组合物。参见Harel和Bennett(美国专利8,460,726B2)。
在一些方面,本公开的微生物组合物以固体形式(例如,分散的冻干孢子)或液体形式(散布在储存培养基中的微生物)存在。在一些方面,在使用前将干燥形式的本公开的微生物组合物添加到液体中,以形成悬浮液。在一些方面,微生物组合物包含陶瓷化的微生物。
在一些方面,本公开的微生物组合物具有的水活性(aw)小于0.750、0.700、0.650、0.600、0.550、0.500、0.475、0.450、0.425、0.400、0.375、0.350、0.325、0.300、0.275、0.250、0.225、0.200、0.190、0.180、0.170、0.160、0.150、0.140、0.130、0.120、0.110、0.100、0.095、0.090、0.085、0.080、0.075、0.070、0.065、0.060、0.055、0.050、0.045、0.040、0.035、0.030、0.025、0.020、0.015、0.010、或0.005。
在一些方面,本公开的微生物组合物具有的水活性(aw)小于约0.750、约0.700、约0.650、约0.600、约0.550、约0.500、约0.475、约0.450、约0.425、约0.400、约0.375、约0.350、约0.325、约0.300、约0.275、约0.250、约0.225、约0.200、约0.190、约0.180、约0.170、约0.160、约0.150、约0.140、约0.130、约0.120、约0.110、约0.100、约0.095、约0.090、约0.085、约0.080、约0.075、约0.070、约0.065、约0.060、约0.055、约0.050、约0.045、约0.040、约0.035、约0.030、约0.025、约0.020、约0.015、约0.010、或约0.005。
水活性值通过饱和水溶液的方法来测定(Multon,“Techniques d’Analyse E DeControle Dans Les Industries Agroalimentaires”APRIA(1981))或通过使用强大的Robotronic BT湿度计或其他湿度计或验湿计来进行直接测量。
原料
在一些方面,本公开涉及一种产生和回收/分离一种或多种所期望的化学物质的方法。回收/收集/分离可以通过本领域已知的方法,诸如蒸馏、基于膜的分离气提、溶剂萃取和扩张床吸附。
在一些方面,原料包括碳源。在一些方面,所述碳源可以选自糖、甘油、醇、有机酸、烷烃、脂肪酸、木质纤维素、蛋白质、二氧化碳和一氧化碳。在一个方面,所述碳源是糖。在一个方面,所述糖是葡萄糖或其葡萄糖寡聚物。在一个方面,葡萄糖的寡聚物选自果糖、蔗糖、淀粉、纤维二糖、麦芽糖、乳糖和纤维素。在一个方面,所述糖是五碳糖。在一个方面,所述糖是六碳糖。在一些方面,原料包含一种或多种五碳糖和/或一种或多种六碳糖。在一些方面,原料包含木糖、葡萄糖、阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。在一些方面,原料包含木糖和/或葡萄糖中的一种或多种。在一些方面,原料包含阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。在一些方面,原料包含木糖和葡萄糖。
在一些方面,微生物利用一种或多种五碳糖(戊糖)和/或一种或多种六碳糖(己糖)。在一些方面,微生物利用木糖和/或葡萄糖中的一种或多种。在一些方面,微生物利用阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。在一些方面,微生物利用木糖、葡萄糖、阿拉伯糖、半乳糖、麦芽糖、果糖、甘露糖、蔗糖中的一种或多种、和/或其组合。
在一些方面,己糖可选自D-阿洛糖、D-阿卓糖、D-葡萄糖、D-甘露糖、D-古洛糖、D-艾杜糖、D-半乳糖、D-塔罗糖、D-塔格糖、D-山梨糖、D-果糖、D-阿洛酮糖和本领域已知的其他己糖。在一些方面,戊糖可选自D-木糖、D-核糖、D-阿拉伯糖、D-来苏糖、D-木酮糖、D-核酮糖和本领域已知的其他戊糖。在一些方面,己糖和戊糖可选自本文公开的任何己糖和戊糖的左旋对映体或右旋对映体。
在一些方面,在生长期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量为至少5kg碳水化合物/m3、至少10kg碳水化合物/m3、至少20kg碳水化合物/m3、至少30kg碳水化合物/m3、至少40kg碳水化合物/m3、至少50kg碳水化合物/m3、至少60kg碳水化合物/m3、至少70kg碳水化合物/m3、至少80kg碳水化合物/m3、至少90kg碳水化合物/m3、至少100kg碳水化合物/m3、至少150kg碳水化合物/m3、至少200kg碳水化合物/m3、至少250kg碳水化合物/m3、至少300kg碳水化合物/m3、至少400kg碳水化合物/m3、至少500kg碳水化合物/m3、至少600kg碳水化合物/m3、至少700kg碳水化合物/m3、至多800kg碳水化合物/m3。在一些方面,在生长期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量在约10kg碳水化合物/m3至至多500kg碳水化合物/m3的范围内。
在一些方面,生长期所需的时间在1至200小时之间变化。在其他方面,生长期的时间在5至50小时之间。时间取决于碳水化合物进料和/或原料。
在一些方面,在产生期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量为至少50kg碳水化合物/m3、至少60kg碳水化合物/m3、至少70kg碳水化合物/m3、至少80kg碳水化合物/m3、至少90kg碳水化合物/m3、至少100kg碳水化合物/m3、至少150kg碳水化合物/m3、至少200kg碳水化合物/m3、至少250kg碳水化合物/m3、至少300kg碳水化合物/m3、至少400kg碳水化合物/m3、至少500kg碳水化合物/m3、至少600kg碳水化合物/m3、至少700kg碳水化合物/m3、至少800kg碳水化合物/m3、至少900kg碳水化合物/m3、至多1000kg碳水化合物/m3。在一些方面,在产生期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量在约100kg碳水化合物/m3至至多800kg碳水化合物/m3的范围内。
在一些方面,产生期所需的时间在5至500小时之间变化。在其他方面,对于分批和补料分批操作,产生期的时间在10至300小时之间变化。在其他方面,产生期的时间长达300小时,连续发酵。
在一些方面,对于单期过程,送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量为至少50kg碳水化合物/m3、至少60kg碳水化合物/m3、至少70kg碳水化合物/m3、至少80kg碳水化合物/m3、至少90kg碳水化合物/m3、至少100kg碳水化合物/m3、至少150kg碳水化合物/m3、至少200kg碳水化合物/m3、至少250kg碳水化合物/m3、至少300kg碳水化合物/m3、至少400kg碳水化合物/m3、至少500kg碳水化合物/m3、至少600kg碳水化合物/m3、至少700kg碳水化合物/m3、至少800kg碳水化合物/m3、至少900kg碳水化合物/m3、至多1000kg碳水化合物/m3。在一些方面,在产生期期间送入生物反应器/生长培养基的C5和/或C6碳水化合物的总量在约100kg碳水化合物/m3至至多800kg碳水化合物/m3的范围内。
在一些方面,在单期过程中,产生期所需的时间在5至500小时之间变化。在其他方面,在单期过程中,产生期所需的时间在5至300小时之间变化。
在一些方面,单期或多期产生过程需要约5、约10、约25、约50、约75、约100、约125、约150、约175、约200、约225、约250、约275、约300、约325、约350、约375、约400、约425、约450、约475、或约500小时。
在一些方面,单期或多期产生过程需要5、10、25、50、75、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475或500小时。
性状的改善
可以采用本公开的方法来引入或改善多个所期望的性状中的一个或多个。可以引入或改善的性状的实例包括:MEG、乙醇酸、多元醇、丙酮、丙烯、异丙醇的速率和/或速度的增加;木糖和葡萄糖的同时消耗增加;以及一种或多种糖类对糖的消耗和/或摄取的抑制作用降低。
在一些方面,本文所述的方法产生的微生物表现出的性状差异比对照条件下的参考值大至少约1%,例如大至少约1%、至少约2%、至少约3%、至少约4%、至少约5%、至少约6%、至少约7%、至少约9%、至少约9%、至少约10%、至少约11%、至少约12%、至少约13%、至少约14%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约75%、至少约80%、至少约90%、或至少100%、至少约200%、至少约300%、至少约400%或更大。在另外的实例中,本文所述的方法产生的微生物表现出的性状差异比在类似条件下生长的参考对照大至少约5%,例如大至少约5%、至少约8%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约75%、至少约80%、至少约80%、至少约90%、或至少100%、至少约200%、至少约300%、至少约400%或更大。
在一些方面,相对于未经修饰的微生物,本公开的任何一个或多个性状的增加或减少是增加约0.1%、约0.2%、约0.3%、约0.4%、约0.5%、约0.6%、约0.7%、约0.8%、约0.9%、约1%、约2%、约3%、约4%、约5%、约6%、约7%、约8%、约9%、约10%、约11%、约12%、约13%、约14%、约15%、约16%、约17%、约18%、约19%、约20%、约21%、约22%、约23%、约24%、约25%、约26%、约27%、约28%、约29%、约30%、约31%、约32%、约33%、约34%、约35%、约36%、约37%、约38%、约39%、约40%、约41%、约42%、约43%、约44%、约45%、约46%、约47%、约48%、约49%、约50%、约51%、约52%、约53%、约54%、约55%、约56%、约57%、约58%、约59%、约60%、约61%、约62%、约63%、约64%、约65%、约66%、约67%、约68%、约69%、约70%、约71%、约72%、约73%、约74%、约75%、约76%、约77%、约78%、约79%、约80%、约81%、约82%、约83%、约84%、约85%、约86%、约87%、约88%、约89%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、约99%、或约100%。
在一些方面,相对于未经修饰的微生物,本公开的任何一个或多个性状的增加或减少是增加至少0.1%、至少0.2%、至少0.3%、至少0.4%、至少0.5%、至少0.6%、至少0.7%、至少0.8%、至少0.9%、至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少11%、至少12%、至少13%、至少14%、至少15%、至少16%、至少17%、至少18%、至少19%、至少20%、至少21%、至少22%、至少23%、至少24%、至少25%、至少26%、至少27%、至少28%、至少29%、至少30%、至少31%、至少32%、至少33%、至少34%、至少35%、至少36%、至少37%、至少38%、至少39%、至少40%、至少41%、至少42%、至少43%、至少44%、至少45%、至少46%、至少47%、至少48%、至少49%、至少50%、至少51%、至少52%、至少53%、至少54%、至少55%、至少56%、至少57%、至少58%、至少59%、至少60%、至少61%、至少62%、至少63%、至少64%、至少65%、至少66%、至少67%、至少68%、至少69%、至少70%、至少71%、至少72%、至少73%、至少74%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或至少100%。
实施例
实施例1:在能够同时消耗木糖和葡萄糖的菌株中通过D-木糖酸途径共同产生单乙二醇(MEG)和丙酮–图1的途径A。
将大肠杆菌K12菌株MG1655用作缺失以下三个基因的宿主:aldA、xylA和glcDEF,所述基因可以使碳通量从MEG+丙酮途径偏离。基因成功缺失,并且通过PCR和测序确认该缺失。下一步是MEG途径的整合。在proD启动子控制下表达的操纵子含有xdh基因(木糖脱氢酶)和fucO基因(羟乙醛还原酶),分别编码木糖酸途径的第一个和最后一个酶,将该操纵子整合到大肠杆菌基因组中,并且将xdh基因的一个另外的拷贝也放置于proD启动子的控制下,并且整合到不同的基因座中。xdh基因的整合允许木糖转化为中间体D-木糖酸和羟乙醛。fucO基因的整合将羟乙醛还原为MEG,并且对MEG产生具有特异性。第二步是丙酮途径的整合。在OXB11启动子控制下表达的操纵子含有thlA基因(乙酰乙酰基辅酶A硫解酶);AtoDA基因(乙酸:乙酰乙酰基辅酶A转移酶)和adc基因(乙酰乙酸脱羧酶),将该操纵子整合到大肠杆菌基因组中,产生基础菌株。该基础菌株被用作进行修饰的宿主,以促进葡萄糖和木糖的共同消耗。第一修饰是在araFGH基因座上GAPDH启动子控制下的另一个xylE拷贝的整合,从而缺失araFGH。第二修饰是xylFGH操纵子的缺失。所有整合和缺失均通过PCR和测序确认。
将来自转化的菌落接种于5mL含有12.85g/L木糖和2.15g/L葡萄糖(6:1比例)或7.5g/L木糖和7.5g/L葡萄糖(1:1比例)的矿物培养基中进行预培养。在16小时培养后,将5%的预培养物转移至100mL新鲜培养基中。将烧瓶在37℃、250rpm下温育。培养物的初始OD为0.1。
对于1:1比例培养物,在8小时培养后,葡萄糖和木糖的同时利用可以在共同消耗菌株中检测到,而在亲本菌株中,木糖仅在18小时后葡萄糖耗尽后才开始消耗(图2)。在36小时培养中,共同消耗菌株能够消耗75%的初始糖混合物,而亲本菌株仅消耗62%。
对于6:1比例培养物,亲本和共同消耗菌株都能够完全消耗初始葡萄糖和木糖,木糖消耗和生物质产生特征曲线相似(图3)。在共同消耗菌株中,MEG的总量增加12%,而丙酮的量增加197%(图4)。木糖摄取的修饰提供了与其亲本菌株相关的共同产生速度的改善。
实施例2:在能够同时消耗木糖和葡萄糖的菌株中通过D-木酮糖途径共同产生单乙二醇(MEG)和丙酮–图1的途径B。
将大肠杆菌K12菌株MG1655用作缺失以下三个基因的宿主:aldA、xylB和glcDEF,所述基因可以使碳通量从MEG+丙酮途径偏离。基因成功缺失,并且通过PCR和测序确认该缺失。下一步是MEG途径的整合。在proD启动子控制下表达的操纵子含有khk-C基因(酮己糖激酶)、aldoB基因(果糖-1,6-二磷酸醛缩酶)和fucO基因(羟乙醛还原酶),将该操纵子整合到大肠杆菌基因组中,并且将也在proD启动子控制下的khk-C和aldoB基因的一个另外的拷贝整合到不同的基因座中。khk-C和aldoB基因的整合允许木糖转化为中间体羟乙醛。fucO基因的整合将羟乙醛还原为MEG,并且对MEG产生具有特异性。第二步是丙酮途径的整合。在OXB11启动子控制下表达的操纵子含有thlA基因(乙酰乙酰基辅酶A硫解酶);AtoDA基因(乙酸:乙酰乙酰基辅酶A转移酶)和adc基因(乙酰乙酸脱羧酶),将该操纵子整合到大肠杆菌基因组中,产生基础菌株。该基础菌株被用作进行修饰的宿主,以促进葡萄糖和木糖的共同消耗。第一修饰是在araFGH基因座上GAPDH启动子控制下的另一个xylE拷贝的整合,从而缺失araFGH。第二修饰是xylFGH操纵子的缺失以及用OXB15启动子替代xylA启动子。在组成型启动子下表达xylA允许木糖转化为中间体D-木糖酸和羟乙醛。所有整合和缺失均通过PCR和测序确认。
将来自转化的菌落接种于5mL含有12.85g/L木糖和2.15g/L葡萄糖(6:1比例)或7.5g/L木糖和7.5g/L葡萄糖(1:1比例)的矿物培养基中进行预培养。在16小时培养后,将5%的预培养物转移至100mL新鲜培养基中。将烧瓶在37℃、250rpm下温育。培养物的初始OD为0.1。
对于1:1比例培养物,在12小时培养后,葡萄糖和木糖的同时利用可以在共同消耗菌株中检测到,而在亲本菌株中,木糖仅在18小时后葡萄糖耗尽后才开始减少(图5)。在36小时培养中,共同消耗菌株能够消耗61%的初始糖混合物,而亲本菌株消耗52%。
对于6:1比例培养物,亲本和共同消耗菌株都能够完全消耗初始葡萄糖和木糖,木糖消耗和生物质产生特征曲线相似(图6)。在共同消耗菌株中,MEG的总量增加9%,而丙酮的总量增加119%(图7)。木糖摄取的修饰提供了与其亲本菌株相关的共同产生速度的改善。
以引用方式并入本文
本文引用的所有参考文献、文章、出版物、专利、专利公开和专利申请均以引用的方式整体并入用于所有目的。然而,提及本文引用的任何参考文献、文章、出版物、专利、专利公开和专利申请不是也不应被视为承认或任何形式的暗示它们构成有效的现有技术或形成世界上任何国家或地区的共同常识的一部分。此外,以下参考文献据此以引用的方式并入:
Yang et al.(2018).One step fermentative production of aromaticpolyesters from glucose by metabolically engineered Escherichia colistrains.Nature Communications.9(1):79.
Fritzsche et al.(1990).An unusual bacterial polyester with a phenylpendant group.Die Makromolekulare Chemie:Macromolecular Chemistry andPhysics.191(8):1957-1965.
Garcia et al.(1999).Novel biodegradable aromatic plastics from abacterial source genetic and biochemical studies on a route of thephenylacetyl-CoA catabolon.Journal of Biological Chemistry.274(41):29228-29241.
Olivera et al.(2001).Genetically engineered Pseudomonas:a factory ofnew bioplastics with broad applications.Environmental Microbiology.3(10):612-618.
序列表
<110> 布拉斯科公司
<120> 用于同时消耗木糖和
葡萄糖以从第二代糖产生化学物质的代谢工程
<130> BRSK-021/01WO (331051-2072)
<150> 62/829,398
<151> 2019-04-04
<160> 98
<170> PatentIn 版本3.5
<210> 1
<211> 1164
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 1
atgaacaact ttaatctgca caccccaacc cgcattctgt ttggtaaagg cgcaatcgct 60
ggtttacgcg aacaaattcc tcacgatgct cgcgtattga ttacctacgg cggcggcagc 120
gtgaaaaaaa ccggcgttct cgatcaagtt ctggatgccc tgaaaggcat ggacgtgctg 180
gaatttggcg gtattgagcc aaacccggct tatgaaacgc tgatgaacgc cgtgaaactg 240
gttcgcgaac agaaagtgac tttcctgctg gcggttggcg gcggttctgt actggacggc 300
accaaattta tcgccgcagc ggctaactat ccggaaaata tcgatccgtg gcacattctg 360
caaacgggcg gtaaagagat taaaagcgcc atcccgatgg gctgtgtgct gacgctgcca 420
gcaaccggtt cagaatccaa cgcaggcgcg gtgatctccc gtaaaaccac aggcgacaag 480
caggcgttcc attctgccca tgttcagccg gtatttgccg tgctcgatcc ggtttatacc 540
tacaccctgc cgccgcgtca ggtggctaac ggcgtagtgg acgcctttgt acacaccgtg 600
gaacagtatg ttaccaaacc ggttgatgcc aaaattcagg accgtttcgc agaaggcatt 660
ttgctgacgc taatcgaaga tggtccgaaa gccctgaaag agccagaaaa ctacgatgtg 720
cgcgccaacg tcatgtgggc ggcgactcag gcgctgaacg gtttgattgg cgctggcgta 780
ccgcaggact gggcaacgca tatgctgggc cacgaactga ctgcgatgca cggtctggat 840
cacgcgcaaa cactggctat cgtcctgcct gcactgtgga atgaaaaacg cgataccaag 900
cgcgctaagc tgctgcaata tgctgaacgc gtctggaaca tcactgaagg ttccgatgat 960
gagcgtattg acgccgcgat tgccgcaacc cgcaatttct ttgagcaatt aggcgtgccg 1020
acccacctct ccgactacgg tctggacggc agctccatcc cggctttgct gaaaaaactg 1080
gaagagcacg gcatgaccca actgggcgaa aatcatgaca ttacgttgga tgtcagccgc 1140
cgtatatacg aagccgcccg ctaa 1164
<210> 2
<211> 387
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 2
Met Asn Asn Phe Asn Leu His Thr Pro Thr Arg Ile Leu Phe Gly Lys
1 5 10 15
Gly Ala Ile Ala Gly Leu Arg Glu Gln Ile Pro His Asp Ala Arg Val
20 25 30
Leu Ile Thr Tyr Gly Gly Gly Ser Val Lys Lys Thr Gly Val Leu Asp
35 40 45
Gln Val Leu Asp Ala Leu Lys Gly Met Asp Val Leu Glu Phe Gly Gly
50 55 60
Ile Glu Pro Asn Pro Ala Tyr Glu Thr Leu Met Asn Ala Val Lys Leu
65 70 75 80
Val Arg Glu Gln Lys Val Thr Phe Leu Leu Ala Val Gly Gly Gly Ser
85 90 95
Val Leu Asp Gly Thr Lys Phe Ile Ala Ala Ala Ala Asn Tyr Pro Glu
100 105 110
Asn Ile Asp Pro Trp His Ile Leu Gln Thr Gly Gly Lys Glu Ile Lys
115 120 125
Ser Ala Ile Pro Met Gly Cys Val Leu Thr Leu Pro Ala Thr Gly Ser
130 135 140
Glu Ser Asn Ala Gly Ala Val Ile Ser Arg Lys Thr Thr Gly Asp Lys
145 150 155 160
Gln Ala Phe His Ser Ala His Val Gln Pro Val Phe Ala Val Leu Asp
165 170 175
Pro Val Tyr Thr Tyr Thr Leu Pro Pro Arg Gln Val Ala Asn Gly Val
180 185 190
Val Asp Ala Phe Val His Thr Val Glu Gln Tyr Val Thr Lys Pro Val
195 200 205
Asp Ala Lys Ile Gln Asp Arg Phe Ala Glu Gly Ile Leu Leu Thr Leu
210 215 220
Ile Glu Asp Gly Pro Lys Ala Leu Lys Glu Pro Glu Asn Tyr Asp Val
225 230 235 240
Arg Ala Asn Val Met Trp Ala Ala Thr Gln Ala Leu Asn Gly Leu Ile
245 250 255
Gly Ala Gly Val Pro Gln Asp Trp Ala Thr His Met Leu Gly His Glu
260 265 270
Leu Thr Ala Met His Gly Leu Asp His Ala Gln Thr Leu Ala Ile Val
275 280 285
Leu Pro Ala Leu Trp Asn Glu Lys Arg Asp Thr Lys Arg Ala Lys Leu
290 295 300
Leu Gln Tyr Ala Glu Arg Val Trp Asn Ile Thr Glu Gly Ser Asp Asp
305 310 315 320
Glu Arg Ile Asp Ala Ala Ile Ala Ala Thr Arg Asn Phe Phe Glu Gln
325 330 335
Leu Gly Val Pro Thr His Leu Ser Asp Tyr Gly Leu Asp Gly Ser Ser
340 345 350
Ile Pro Ala Leu Leu Lys Lys Leu Glu Glu His Gly Met Thr Gln Leu
355 360 365
Gly Glu Asn His Asp Ile Thr Leu Asp Val Ser Arg Arg Ile Tyr Glu
370 375 380
Ala Ala Arg
385
<210> 3
<211> 1440
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 3
atgtcagtac ccgttcaaca tcctatgtat atcgatggac agtttgttac ctggcgtgga 60
gacgcatgga ttgatgtggt aaaccctgct acagaggctg tcatttcccg catacccgat 120
ggtcaggccg aggatgcccg taaggcaatc gatgcagcag aacgtgcaca accagaatgg 180
gaagcgttgc ctgctattga acgcgccagt tggttgcgca aaatctccgc cgggatccgc 240
gaacgcgcca gtgaaatcag tgcgctgatt gttgaagaag ggggcaagat ccagcagctg 300
gctgaagtcg aagtggcttt tactgccgac tatatcgatt acatggcgga gtgggcacgg 360
cgttacgagg gcgagattat tcaaagcgat cgtccaggag aaaatattct tttgtttaaa 420
cgtgcgcttg gtgtgactac cggcattctg ccgtggaact tcccgttctt cctcattgcc 480
cgcaaaatgg ctcccgctct tttgaccggt aataccatcg tcattaaacc tagtgaattt 540
acgccaaaca atgcgattgc attcgccaaa atcgtcgatg aaataggcct tccgcgcggc 600
gtgtttaacc ttgtactggg gcgtggtgaa accgttgggc aagaactggc gggtaaccca 660
aaggtcgcaa tggtcagtat gacaggcagc gtctctgcag gtgagaagat catggcgact 720
gcggcgaaaa acatcaccaa agtgtgtctg gaattggggg gtaaagcacc agctatcgta 780
atggacgatg ccgatcttga actggcagtc aaagccatcg ttgattcacg cgtcattaat 840
agtgggcaag tgtgtaactg tgcagaacgt gtttatgtac agaaaggcat ttatgatcag 900
ttcgtcaatc ggctgggtga agcgatgcag gcggttcaat ttggtaaccc cgctgaacgc 960
aacgacattg cgatggggcc gttgattaac gccgcggcgc tggaaagggt cgagcaaaaa 1020
gtggcgcgcg cagtagaaga aggggcgaga gtggcgttcg gtggcaaagc ggtagagggg 1080
aaaggatatt attatccgcc gacattgctg ctggatgttc gccaggaaat gtcgattatg 1140
catgaggaaa cctttggccc ggtgctgcca gttgtcgcat ttgacacgct ggaagatgct 1200
atctcaatgg ctaatgacag tgattacggc ctgacctcat caatctatac ccaaaatctg 1260
aacgtcgcga tgaaagccat taaagggctg aagtttggtg aaacttacat caaccgtgaa 1320
aacttcgaag ctatgcaagg cttccacgcc ggatggcgta aatccggtat tggcggcgca 1380
gatggtaaac atggcttgca tgaatatctg cagacccagg tggtttattt acagtcttaa 1440
<210> 4
<211> 479
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 4
Met Ser Val Pro Val Gln His Pro Met Tyr Ile Asp Gly Gln Phe Val
1 5 10 15
Thr Trp Arg Gly Asp Ala Trp Ile Asp Val Val Asn Pro Ala Thr Glu
20 25 30
Ala Val Ile Ser Arg Ile Pro Asp Gly Gln Ala Glu Asp Ala Arg Lys
35 40 45
Ala Ile Asp Ala Ala Glu Arg Ala Gln Pro Glu Trp Glu Ala Leu Pro
50 55 60
Ala Ile Glu Arg Ala Ser Trp Leu Arg Lys Ile Ser Ala Gly Ile Arg
65 70 75 80
Glu Arg Ala Ser Glu Ile Ser Ala Leu Ile Val Glu Glu Gly Gly Lys
85 90 95
Ile Gln Gln Leu Ala Glu Val Glu Val Ala Phe Thr Ala Asp Tyr Ile
100 105 110
Asp Tyr Met Ala Glu Trp Ala Arg Arg Tyr Glu Gly Glu Ile Ile Gln
115 120 125
Ser Asp Arg Pro Gly Glu Asn Ile Leu Leu Phe Lys Arg Ala Leu Gly
130 135 140
Val Thr Thr Gly Ile Leu Pro Trp Asn Phe Pro Phe Phe Leu Ile Ala
145 150 155 160
Arg Lys Met Ala Pro Ala Leu Leu Thr Gly Asn Thr Ile Val Ile Lys
165 170 175
Pro Ser Glu Phe Thr Pro Asn Asn Ala Ile Ala Phe Ala Lys Ile Val
180 185 190
Asp Glu Ile Gly Leu Pro Arg Gly Val Phe Asn Leu Val Leu Gly Arg
195 200 205
Gly Glu Thr Val Gly Gln Glu Leu Ala Gly Asn Pro Lys Val Ala Met
210 215 220
Val Ser Met Thr Gly Ser Val Ser Ala Gly Glu Lys Ile Met Ala Thr
225 230 235 240
Ala Ala Lys Asn Ile Thr Lys Val Cys Leu Glu Leu Gly Gly Lys Ala
245 250 255
Pro Ala Ile Val Met Asp Asp Ala Asp Leu Glu Leu Ala Val Lys Ala
260 265 270
Ile Val Asp Ser Arg Val Ile Asn Ser Gly Gln Val Cys Asn Cys Ala
275 280 285
Glu Arg Val Tyr Val Gln Lys Gly Ile Tyr Asp Gln Phe Val Asn Arg
290 295 300
Leu Gly Glu Ala Met Gln Ala Val Gln Phe Gly Asn Pro Ala Glu Arg
305 310 315 320
Asn Asp Ile Ala Met Gly Pro Leu Ile Asn Ala Ala Ala Leu Glu Arg
325 330 335
Val Glu Gln Lys Val Ala Arg Ala Val Glu Glu Gly Ala Arg Val Ala
340 345 350
Phe Gly Gly Lys Ala Val Glu Gly Lys Gly Tyr Tyr Tyr Pro Pro Thr
355 360 365
Leu Leu Leu Asp Val Arg Gln Glu Met Ser Ile Met His Glu Glu Thr
370 375 380
Phe Gly Pro Val Leu Pro Val Val Ala Phe Asp Thr Leu Glu Asp Ala
385 390 395 400
Ile Ser Met Ala Asn Asp Ser Asp Tyr Gly Leu Thr Ser Ser Ile Tyr
405 410 415
Thr Gln Asn Leu Asn Val Ala Met Lys Ala Ile Lys Gly Leu Lys Phe
420 425 430
Gly Glu Thr Tyr Ile Asn Arg Glu Asn Phe Glu Ala Met Gln Gly Phe
435 440 445
His Ala Gly Trp Arg Lys Ser Gly Ile Gly Gly Ala Asp Gly Lys His
450 455 460
Gly Leu His Glu Tyr Leu Gln Thr Gln Val Val Tyr Leu Gln Ser
465 470 475
<210> 5
<211> 1323
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 5
atgcaagcct attttgacca gctcgatcgc gttcgttatg aaggctcaaa atcctcaaac 60
ccgttagcat tccgtcacta caatcccgac gaactggtgt tgggtaagcg tatggaagag 120
cacttgcgtt ttgccgcctg ctactggcac accttctgct ggaacggggc ggatatgttt 180
ggtgtggggg cgtttaatcg tccgtggcag cagcctggtg aggcactggc gttggcgaag 240
cgtaaagcag atgtcgcatt tgagtttttc cacaagttac atgtgccatt ttattgcttc 300
cacgatgtgg atgtttcccc tgagggcgcg tcgttaaaag agtacatcaa taattttgcg 360
caaatggttg atgtcctggc aggcaagcaa gaagagagcg gcgtgaagct gctgtgggga 420
acggccaact gctttacaaa ccctcgctac ggcgcgggtg cggcgacgaa cccagatcct 480
gaagtcttca gctgggcggc aacgcaagtt gttacagcga tggaagcaac ccataaattg 540
ggcggtgaaa actatgtcct gtggggcggt cgtgaaggtt acgaaacgct gttaaatacc 600
gacttgcgtc aggagcgtga acaactgggc cgctttatgc agatggtggt tgagcataaa 660
cataaaatcg gtttccaggg cacgttgctt atcgaaccga aaccgcaaga accgaccaaa 720
catcaatatg attacgatgc cgcgacggtc tatggcttcc tgaaacagtt tggtctggaa 780
aaagagatta aactgaacat tgaagctaac cacgcgacgc tggcaggtca ctctttccat 840
catgaaatag ccaccgccat tgcgcttggc ctgttcggtt ctgtcgacgc caaccgtggc 900
gatgcgcaac tgggctggga caccgaccag ttcccgaaca gtgtggaaga gaatgcgctg 960
gtgatgtatg aaattctcaa agcaggcggt ttcaccaccg gtggtctgaa cttcgatgcc 1020
aaagtacgtc gtcaaagtac tgataaatat gatctgtttt acggtcatat cggcgcgatg 1080
gatacgatgg cactggcgct gaaaattgca gcgcgcatga ttgaagatgg cgagctggat 1140
aaacgcatcg cgcagcgtta ttccggctgg aatagcgaat tgggccagca aatcctgaaa 1200
ggccaaatgt cactggcaga tttagccaaa tatgctcagg aacatcattt gtctccggtg 1260
catcagagtg gtcgccagga acaactggaa aatctggtaa accattatct gttcgacaaa 1320
taa 1323
<210> 6
<211> 440
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 6
Met Gln Ala Tyr Phe Asp Gln Leu Asp Arg Val Arg Tyr Glu Gly Ser
1 5 10 15
Lys Ser Ser Asn Pro Leu Ala Phe Arg His Tyr Asn Pro Asp Glu Leu
20 25 30
Val Leu Gly Lys Arg Met Glu Glu His Leu Arg Phe Ala Ala Cys Tyr
35 40 45
Trp His Thr Phe Cys Trp Asn Gly Ala Asp Met Phe Gly Val Gly Ala
50 55 60
Phe Asn Arg Pro Trp Gln Gln Pro Gly Glu Ala Leu Ala Leu Ala Lys
65 70 75 80
Arg Lys Ala Asp Val Ala Phe Glu Phe Phe His Lys Leu His Val Pro
85 90 95
Phe Tyr Cys Phe His Asp Val Asp Val Ser Pro Glu Gly Ala Ser Leu
100 105 110
Lys Glu Tyr Ile Asn Asn Phe Ala Gln Met Val Asp Val Leu Ala Gly
115 120 125
Lys Gln Glu Glu Ser Gly Val Lys Leu Leu Trp Gly Thr Ala Asn Cys
130 135 140
Phe Thr Asn Pro Arg Tyr Gly Ala Gly Ala Ala Thr Asn Pro Asp Pro
145 150 155 160
Glu Val Phe Ser Trp Ala Ala Thr Gln Val Val Thr Ala Met Glu Ala
165 170 175
Thr His Lys Leu Gly Gly Glu Asn Tyr Val Leu Trp Gly Gly Arg Glu
180 185 190
Gly Tyr Glu Thr Leu Leu Asn Thr Asp Leu Arg Gln Glu Arg Glu Gln
195 200 205
Leu Gly Arg Phe Met Gln Met Val Val Glu His Lys His Lys Ile Gly
210 215 220
Phe Gln Gly Thr Leu Leu Ile Glu Pro Lys Pro Gln Glu Pro Thr Lys
225 230 235 240
His Gln Tyr Asp Tyr Asp Ala Ala Thr Val Tyr Gly Phe Leu Lys Gln
245 250 255
Phe Gly Leu Glu Lys Glu Ile Lys Leu Asn Ile Glu Ala Asn His Ala
260 265 270
Thr Leu Ala Gly His Ser Phe His His Glu Ile Ala Thr Ala Ile Ala
275 280 285
Leu Gly Leu Phe Gly Ser Val Asp Ala Asn Arg Gly Asp Ala Gln Leu
290 295 300
Gly Trp Asp Thr Asp Gln Phe Pro Asn Ser Val Glu Glu Asn Ala Leu
305 310 315 320
Val Met Tyr Glu Ile Leu Lys Ala Gly Gly Phe Thr Thr Gly Gly Leu
325 330 335
Asn Phe Asp Ala Lys Val Arg Arg Gln Ser Thr Asp Lys Tyr Asp Leu
340 345 350
Phe Tyr Gly His Ile Gly Ala Met Asp Thr Met Ala Leu Ala Leu Lys
355 360 365
Ile Ala Ala Arg Met Ile Glu Asp Gly Glu Leu Asp Lys Arg Ile Ala
370 375 380
Gln Arg Tyr Ser Gly Trp Asn Ser Glu Leu Gly Gln Gln Ile Leu Lys
385 390 395 400
Gly Gln Met Ser Leu Ala Asp Leu Ala Lys Tyr Ala Gln Glu His His
405 410 415
Leu Ser Pro Val His Gln Ser Gly Arg Gln Glu Gln Leu Glu Asn Leu
420 425 430
Val Asn His Tyr Leu Phe Asp Lys
435 440
<210> 7
<211> 1179
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 7
atgtttacta aacgtcaccg catcacatta ctgttcaatg ccaataaagc ctatgaccgg 60
caggtagtag aaggcgtagg ggaatattta caggcgtcac aatcggaatg ggatattttc 120
attgaagaag atttccgcgc ccgcattgat aaaatcaagg actggttagg agatggcgtc 180
attgccgact tcgacgacaa acagatcgag caagcgctgg ctgatgtcga cgtccccatt 240
gttggggttg gcggctcgta tcaccttgca gaaagttacc cacccgttca ttacattgcc 300
accgataact atgcgctggt tgaaagcgca tttttgcatt taaaagagaa aggcgttaac 360
cgctttgctt tttatggtct tccggaatca agcggcaaac gttgggccac tgagcgcgaa 420
tatgcatttc gtcagcttgt cgccgaagaa aagtatcgcg gagtggttta tcaggggtta 480
gaaaccgcgc cagagaactg gcaacacgcg caaaatcggc tggcagactg gctacaaacg 540
ctaccaccgc aaaccgggat tattgccgtt actgacgccc gagcgcggca tattctgcaa 600
gtatgtgaac atctacatat tcccgtaccg gaaaaattat gcgtgattgg catcgataac 660
gaagaactga cccgctatct gtcgcgtgtc gccctttctt cggtcgctca gggcgcgcgg 720
caaatgggct atcaggcggc aaaactgttg catcgattat tagataaaga agaaatgccg 780
ctacagcgaa ttttggtccc accagttcgc gtcattgaac ggcgctcaac agattatcgc 840
tcgctgaccg atcccgccgt tattcaggcc atgcattaca ttcgtaatca cgcctgtaaa 900
gggattaaag tggatcaggt actggatgcg gtcgggatct cgcgctccaa tcttgagaag 960
cgttttaaag aagaggtggg tgaaaccatc catgccatga ttcatgccga gaagctggag 1020
aaagcgcgca gtctgctgat ttcaaccacc ttgtcgatca atgagatatc gcaaatgtgc 1080
ggttatccat cgctgcaata tttctactct gtttttaaaa aagcatatga cacgacgcca 1140
aaagagtatc gcgatgtaaa tagcgaggtc atgttgtag 1179
<210> 8
<211> 392
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 8
Met Phe Thr Lys Arg His Arg Ile Thr Leu Leu Phe Asn Ala Asn Lys
1 5 10 15
Ala Tyr Asp Arg Gln Val Val Glu Gly Val Gly Glu Tyr Leu Gln Ala
20 25 30
Ser Gln Ser Glu Trp Asp Ile Phe Ile Glu Glu Asp Phe Arg Ala Arg
35 40 45
Ile Asp Lys Ile Lys Asp Trp Leu Gly Asp Gly Val Ile Ala Asp Phe
50 55 60
Asp Asp Lys Gln Ile Glu Gln Ala Leu Ala Asp Val Asp Val Pro Ile
65 70 75 80
Val Gly Val Gly Gly Ser Tyr His Leu Ala Glu Ser Tyr Pro Pro Val
85 90 95
His Tyr Ile Ala Thr Asp Asn Tyr Ala Leu Val Glu Ser Ala Phe Leu
100 105 110
His Leu Lys Glu Lys Gly Val Asn Arg Phe Ala Phe Tyr Gly Leu Pro
115 120 125
Glu Ser Ser Gly Lys Arg Trp Ala Thr Glu Arg Glu Tyr Ala Phe Arg
130 135 140
Gln Leu Val Ala Glu Glu Lys Tyr Arg Gly Val Val Tyr Gln Gly Leu
145 150 155 160
Glu Thr Ala Pro Glu Asn Trp Gln His Ala Gln Asn Arg Leu Ala Asp
165 170 175
Trp Leu Gln Thr Leu Pro Pro Gln Thr Gly Ile Ile Ala Val Thr Asp
180 185 190
Ala Arg Ala Arg His Ile Leu Gln Val Cys Glu His Leu His Ile Pro
195 200 205
Val Pro Glu Lys Leu Cys Val Ile Gly Ile Asp Asn Glu Glu Leu Thr
210 215 220
Arg Tyr Leu Ser Arg Val Ala Leu Ser Ser Val Ala Gln Gly Ala Arg
225 230 235 240
Gln Met Gly Tyr Gln Ala Ala Lys Leu Leu His Arg Leu Leu Asp Lys
245 250 255
Glu Glu Met Pro Leu Gln Arg Ile Leu Val Pro Pro Val Arg Val Ile
260 265 270
Glu Arg Arg Ser Thr Asp Tyr Arg Ser Leu Thr Asp Pro Ala Val Ile
275 280 285
Gln Ala Met His Tyr Ile Arg Asn His Ala Cys Lys Gly Ile Lys Val
290 295 300
Asp Gln Val Leu Asp Ala Val Gly Ile Ser Arg Ser Asn Leu Glu Lys
305 310 315 320
Arg Phe Lys Glu Glu Val Gly Glu Thr Ile His Ala Met Ile His Ala
325 330 335
Glu Lys Leu Glu Lys Ala Arg Ser Leu Leu Ile Ser Thr Thr Leu Ser
340 345 350
Ile Asn Glu Ile Ser Gln Met Cys Gly Tyr Pro Ser Leu Gln Tyr Phe
355 360 365
Tyr Ser Val Phe Lys Lys Ala Tyr Asp Thr Thr Pro Lys Glu Tyr Arg
370 375 380
Asp Val Asn Ser Glu Val Met Leu
385 390
<210> 9
<211> 633
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 9
atggtgcttg gcaaaccgca aacagacccg actctcgaat ggttcttgtc tcattgccac 60
attcataagt acccatccaa gagcacgctt attcaccagg gtgaaaaagc ggaaacgctg 120
tactacatcg ttaaaggctc tgtggcagtg ctgatcaaag acgaagaggg taaagaaatg 180
atcctctcct atctgaatca gggtgatttt attggcgaac tgggcctgtt tgaagagggc 240
caggaacgta gcgcatgggt acgtgcgaaa accgcctgtg aagtggctga aatttcgtac 300
aaaaaatttc gccaattgat tcaggtaaac ccggacattc tgatgcgttt gtctgcacag 360
atggcgcgtc gtctgcaagt cacttcagag aaagtgggca acctggcgtt cctcgacgtg 420
acgggccgca ttgcacagac tctgctgaat ctggcaaaac aaccagacgc tatgactcac 480
ccggacggta tgcaaatcaa aattacccgt caggaaattg gtcagattgt cggctgttct 540
cgtgaaaccg tgggacgcat tctgaagatg ctggaagatc agaacctgat ctccgcacac 600
ggtaaaacca tcgtcgttta cggcactcgt taa 633
<210> 10
<211> 210
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 10
Met Val Leu Gly Lys Pro Gln Thr Asp Pro Thr Leu Glu Trp Phe Leu
1 5 10 15
Ser His Cys His Ile His Lys Tyr Pro Ser Lys Ser Thr Leu Ile His
20 25 30
Gln Gly Glu Lys Ala Glu Thr Leu Tyr Tyr Ile Val Lys Gly Ser Val
35 40 45
Ala Val Leu Ile Lys Asp Glu Glu Gly Lys Glu Met Ile Leu Ser Tyr
50 55 60
Leu Asn Gln Gly Asp Phe Ile Gly Glu Leu Gly Leu Phe Glu Glu Gly
65 70 75 80
Gln Glu Arg Ser Ala Trp Val Arg Ala Lys Thr Ala Cys Glu Val Ala
85 90 95
Glu Ile Ser Tyr Lys Lys Phe Arg Gln Leu Ile Gln Val Asn Pro Asp
100 105 110
Ile Leu Met Arg Leu Ser Ala Gln Met Ala Arg Arg Leu Gln Val Thr
115 120 125
Ser Glu Lys Val Gly Asn Leu Ala Phe Leu Asp Val Thr Gly Arg Ile
130 135 140
Ala Gln Thr Leu Leu Asn Leu Ala Lys Gln Pro Asp Ala Met Thr His
145 150 155 160
Pro Asp Gly Met Gln Ile Lys Ile Thr Arg Gln Glu Ile Gly Gln Ile
165 170 175
Val Gly Cys Ser Arg Glu Thr Val Gly Arg Ile Leu Lys Met Leu Glu
180 185 190
Asp Gln Asn Leu Ile Ser Ala His Gly Lys Thr Ile Val Val Tyr Gly
195 200 205
Thr Arg
210
<210> 11
<211> 897
<212> DNA
<213> 智人(Homo sapiens)
<400> 11
atggaggaaa agcaaattct gtgcgttggt ctggtggttc tggacgtgat tagcctggtt 60
gataagtacc cgaaagagga tagcgaaatc cgttgcctga gccagcgttg gcaacgtggt 120
ggcaacgcga gcaatagctg caccgttctg agcctgctgg gtgcgccgtg cgcgttcatg 180
ggtagcatgg cgccgggtca tgttgcggac ttcctggtgg cggattttcg tcgtcgtggt 240
gtggacgtta gccaggttgc gtggcaaagc aagggcgata ccccgagctc ctgctgcatc 300
attaacaaca gcaacggtaa ccgtaccatt gtgctgcacg acaccagcct gccggatgtt 360
agcgcgaccg acttcgagaa ggtggatctg acccagttta aatggattca cattgagggc 420
cgtaacgcga gcgaacaggt taaaatgctg caacgtattg atgcgcacaa cacccgtcag 480
ccgccggaac aaaagattcg tgtgagcgtt gaggtggaaa aaccgcgtga ggaactgttc 540
caactgtttg gttacggcga cgtggttttc gttagcaagg atgtggcgaa acacctgggt 600
tttcaaagcg cggaggaagc gctgcgtggt ctgtatggcc gtgtgcgtaa aggcgcggtt 660
ctggtgtgcg cgtgggcgga ggaaggcgcg gatgcgctgg gtccggatgg caaactgctg 720
cacagcgatg cgttcccgcc gccgcgtgtg gttgacaccc tgggtgcggg cgataccttc 780
aacgcgagcg ttatctttag cctgagccag ggccgtagcg tgcaagaggc gctgcgtttc 840
ggctgccaag ttgcgggtaa aaaatgcggt ctgcaaggct ttgacggtat cgtgtaa 897
<210> 12
<211> 298
<212> PRT
<213> 智人(Homo sapiens)
<400> 12
Met Glu Glu Lys Gln Ile Leu Cys Val Gly Leu Val Val Leu Asp Val
1 5 10 15
Ile Ser Leu Val Asp Lys Tyr Pro Lys Glu Asp Ser Glu Ile Arg Cys
20 25 30
Leu Ser Gln Arg Trp Gln Arg Gly Gly Asn Ala Ser Asn Ser Cys Thr
35 40 45
Val Leu Ser Leu Leu Gly Ala Pro Cys Ala Phe Met Gly Ser Met Ala
50 55 60
Pro Gly His Val Ala Asp Phe Leu Val Ala Asp Phe Arg Arg Arg Gly
65 70 75 80
Val Asp Val Ser Gln Val Ala Trp Gln Ser Lys Gly Asp Thr Pro Ser
85 90 95
Ser Cys Cys Ile Ile Asn Asn Ser Asn Gly Asn Arg Thr Ile Val Leu
100 105 110
His Asp Thr Ser Leu Pro Asp Val Ser Ala Thr Asp Phe Glu Lys Val
115 120 125
Asp Leu Thr Gln Phe Lys Trp Ile His Ile Glu Gly Arg Asn Ala Ser
130 135 140
Glu Gln Val Lys Met Leu Gln Arg Ile Asp Ala His Asn Thr Arg Gln
145 150 155 160
Pro Pro Glu Gln Lys Ile Arg Val Ser Val Glu Val Glu Lys Pro Arg
165 170 175
Glu Glu Leu Phe Gln Leu Phe Gly Tyr Gly Asp Val Val Phe Val Ser
180 185 190
Lys Asp Val Ala Lys His Leu Gly Phe Gln Ser Ala Glu Glu Ala Leu
195 200 205
Arg Gly Leu Tyr Gly Arg Val Arg Lys Gly Ala Val Leu Val Cys Ala
210 215 220
Trp Ala Glu Glu Gly Ala Asp Ala Leu Gly Pro Asp Gly Lys Leu Leu
225 230 235 240
His Ser Asp Ala Phe Pro Pro Pro Arg Val Val Asp Thr Leu Gly Ala
245 250 255
Gly Asp Thr Phe Asn Ala Ser Val Ile Phe Ser Leu Ser Gln Gly Arg
260 265 270
Ser Val Gln Glu Ala Leu Arg Phe Gly Cys Gln Val Ala Gly Lys Lys
275 280 285
Cys Gly Leu Gln Gly Phe Asp Gly Ile Val
290 295
<210> 13
<211> 1455
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 13
atgtatatcg ggatagatct tggcacctcg ggcgtaaaag ttattttgct caacgagcag 60
ggtgaggtgg ttgctgcgca aacggaaaag ctgaccgttt cgcgcccgca tccactctgg 120
tcggaacaag acccggaaca gtggtggcag gcaactgatc gcgcaatgaa agctctgggc 180
gatcagcatt ctctgcagga cgttaaagca ttgggtattg ccggccagat gcacggagca 240
accttgctgg atgctcagca acgggtgtta cgccctgcca ttttgtggaa cgacgggcgc 300
tgtgcgcaag agtgcacttt gctggaagcg cgagttccgc aatcgcgggt gattaccggc 360
aacctgatga tgcccggatt tactgcgcct aaattgctat gggttcagcg gcatgagccg 420
gagatattcc gtcaaatcga caaagtatta ttaccgaaag attacttgcg tctgcgtatg 480
acgggggagt ttgccagcga tatgtctgac gcagctggca ccatgtggct ggatgtcgca 540
aagcgtgact ggagtgacgt catgctgcag gcttgcgact tatctcgtga ccagatgccc 600
gcattatacg aaggcagcga aattactggt gctttgttac ctgaagttgc gaaagcgtgg 660
ggtatggcga cggtgccagt tgtcgcaggc ggtggcgaca atgcagctgg tgcagttggt 720
gtgggaatgg ttgatgctaa tcaggcaatg ttatcgctgg ggacgtcggg ggtctatttt 780
gctgtcagcg aagggttctt aagcaagcca gaaagcgccg tacatagctt ttgccatgcg 840
ctaccgcaac gttggcattt aatgtctgtg atgctgagtg cagcgtcgtg tctggattgg 900
gccgcgaaat taaccggcct gagcaatgtc ccagctttaa tcgctgcagc tcaacaggct 960
gatgaaagtg ccgagccagt ttggtttctg ccttatcttt ccggcgagcg tacgccacac 1020
aataatcccc aggcgaaggg ggttttcttt ggtttgactc atcaacatgg ccccaatgaa 1080
ctggcgcgag cagtgctgga aggcgtgggt tatgcgctgg cagatggcat ggatgtcgtg 1140
catgcctgcg gtattaaacc gcaaagtgtt acgttgattg ggggcggggc gcgtagtgag 1200
tactggcgtc agatgctggc ggatatcagc ggtcagcagc tcgattaccg tacggggggg 1260
gatgtggggc cagcactggg cgcagcaagg ctggcgcaga tcgcggcgaa tccagagaaa 1320
tcgctcattg aattgttgcc gcaactaccg ttagaacagt cgcatctacc agatgcgcag 1380
cgttatgccg cttatcagcc acgacgagaa acgttccgtc gcctctatca gcaacttctg 1440
ccattaatgg cgtaa 1455
<210> 14
<211> 484
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 14
Met Tyr Ile Gly Ile Asp Leu Gly Thr Ser Gly Val Lys Val Ile Leu
1 5 10 15
Leu Asn Glu Gln Gly Glu Val Val Ala Ala Gln Thr Glu Lys Leu Thr
20 25 30
Val Ser Arg Pro His Pro Leu Trp Ser Glu Gln Asp Pro Glu Gln Trp
35 40 45
Trp Gln Ala Thr Asp Arg Ala Met Lys Ala Leu Gly Asp Gln His Ser
50 55 60
Leu Gln Asp Val Lys Ala Leu Gly Ile Ala Gly Gln Met His Gly Ala
65 70 75 80
Thr Leu Leu Asp Ala Gln Gln Arg Val Leu Arg Pro Ala Ile Leu Trp
85 90 95
Asn Asp Gly Arg Cys Ala Gln Glu Cys Thr Leu Leu Glu Ala Arg Val
100 105 110
Pro Gln Ser Arg Val Ile Thr Gly Asn Leu Met Met Pro Gly Phe Thr
115 120 125
Ala Pro Lys Leu Leu Trp Val Gln Arg His Glu Pro Glu Ile Phe Arg
130 135 140
Gln Ile Asp Lys Val Leu Leu Pro Lys Asp Tyr Leu Arg Leu Arg Met
145 150 155 160
Thr Gly Glu Phe Ala Ser Asp Met Ser Asp Ala Ala Gly Thr Met Trp
165 170 175
Leu Asp Val Ala Lys Arg Asp Trp Ser Asp Val Met Leu Gln Ala Cys
180 185 190
Asp Leu Ser Arg Asp Gln Met Pro Ala Leu Tyr Glu Gly Ser Glu Ile
195 200 205
Thr Gly Ala Leu Leu Pro Glu Val Ala Lys Ala Trp Gly Met Ala Thr
210 215 220
Val Pro Val Val Ala Gly Gly Gly Asp Asn Ala Ala Gly Ala Val Gly
225 230 235 240
Val Gly Met Val Asp Ala Asn Gln Ala Met Leu Ser Leu Gly Thr Ser
245 250 255
Gly Val Tyr Phe Ala Val Ser Glu Gly Phe Leu Ser Lys Pro Glu Ser
260 265 270
Ala Val His Ser Phe Cys His Ala Leu Pro Gln Arg Trp His Leu Met
275 280 285
Ser Val Met Leu Ser Ala Ala Ser Cys Leu Asp Trp Ala Ala Lys Leu
290 295 300
Thr Gly Leu Ser Asn Val Pro Ala Leu Ile Ala Ala Ala Gln Gln Ala
305 310 315 320
Asp Glu Ser Ala Glu Pro Val Trp Phe Leu Pro Tyr Leu Ser Gly Glu
325 330 335
Arg Thr Pro His Asn Asn Pro Gln Ala Lys Gly Val Phe Phe Gly Leu
340 345 350
Thr His Gln His Gly Pro Asn Glu Leu Ala Arg Ala Val Leu Glu Gly
355 360 365
Val Gly Tyr Ala Leu Ala Asp Gly Met Asp Val Val His Ala Cys Gly
370 375 380
Ile Lys Pro Gln Ser Val Thr Leu Ile Gly Gly Gly Ala Arg Ser Glu
385 390 395 400
Tyr Trp Arg Gln Met Leu Ala Asp Ile Ser Gly Gln Gln Leu Asp Tyr
405 410 415
Arg Thr Gly Gly Asp Val Gly Pro Ala Leu Gly Ala Ala Arg Leu Ala
420 425 430
Gln Ile Ala Ala Asn Pro Glu Lys Ser Leu Ile Glu Leu Leu Pro Gln
435 440 445
Leu Pro Leu Glu Gln Ser His Leu Pro Asp Ala Gln Arg Tyr Ala Ala
450 455 460
Tyr Gln Pro Arg Arg Glu Thr Phe Arg Arg Leu Tyr Gln Gln Leu Leu
465 470 475 480
Pro Leu Met Ala
<210> 15
<211> 747
<212> DNA
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 15
atgagcagcg cgatctaccc gagcctgaaa ggtaaacgtg tggtgattac cggcggcggc 60
agcggcattg gtgcgggcct gaccgcgggc ttcgcgcgtc agggtgcgga agtgatcttt 120
ctggacattg cggacgaaga tagccgtgcg ctggaggcgg aactggcggg cagcccgatc 180
ccgccggtgt acaagcgttg cgatctgatg aacctggagg cgatcaaagc ggttttcgcg 240
gaaattggcg acgtggatgt tctggtgaac aacgcgggta acgacgaccg tcacaagctg 300
gcggatgtga ccggtgcgta ttgggatgag cgtattaacg ttaacctgcg tcacatgctg 360
ttctgcaccc aggcggtggc gccgggtatg aagaaacgtg gtggcggtgc ggttatcaac 420
tttggcagca ttagctggca cctgggtctg gaggacctgg tgctgtacga aaccgcgaaa 480
gcgggcatcg agggtatgac ccgtgcgctg gcgcgtgaac tgggtccgga cgatattcgt 540
gtgacctgcg tggttccggg taacgttaag accaaacgtc aagagaagtg gtataccccg 600
gagggtgaag cgcagattgt tgcggcgcaa tgcctgaaag gtcgtattgt tccggaaaac 660
gtggcggcgc tggttctgtt tctggcgagc gatgatgcga gcctgtgcac cggccatgag 720
tattggattg atgcgggctg gcgttaa 747
<210> 16
<211> 248
<212> PRT
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 16
Met Ser Ser Ala Ile Tyr Pro Ser Leu Lys Gly Lys Arg Val Val Ile
1 5 10 15
Thr Gly Gly Gly Ser Gly Ile Gly Ala Gly Leu Thr Ala Gly Phe Ala
20 25 30
Arg Gln Gly Ala Glu Val Ile Phe Leu Asp Ile Ala Asp Glu Asp Ser
35 40 45
Arg Ala Leu Glu Ala Glu Leu Ala Gly Ser Pro Ile Pro Pro Val Tyr
50 55 60
Lys Arg Cys Asp Leu Met Asn Leu Glu Ala Ile Lys Ala Val Phe Ala
65 70 75 80
Glu Ile Gly Asp Val Asp Val Leu Val Asn Asn Ala Gly Asn Asp Asp
85 90 95
Arg His Lys Leu Ala Asp Val Thr Gly Ala Tyr Trp Asp Glu Arg Ile
100 105 110
Asn Val Asn Leu Arg His Met Leu Phe Cys Thr Gln Ala Val Ala Pro
115 120 125
Gly Met Lys Lys Arg Gly Gly Gly Ala Val Ile Asn Phe Gly Ser Ile
130 135 140
Ser Trp His Leu Gly Leu Glu Asp Leu Val Leu Tyr Glu Thr Ala Lys
145 150 155 160
Ala Gly Ile Glu Gly Met Thr Arg Ala Leu Ala Arg Glu Leu Gly Pro
165 170 175
Asp Asp Ile Arg Val Thr Cys Val Val Pro Gly Asn Val Lys Thr Lys
180 185 190
Arg Gln Glu Lys Trp Tyr Thr Pro Glu Gly Glu Ala Gln Ile Val Ala
195 200 205
Ala Gln Cys Leu Lys Gly Arg Ile Val Pro Glu Asn Val Ala Ala Leu
210 215 220
Val Leu Phe Leu Ala Ser Asp Asp Ala Ser Leu Cys Thr Gly His Glu
225 230 235 240
Tyr Trp Ile Asp Ala Gly Trp Arg
245
<210> 17
<211> 255
<212> PRT
<213> 异种伯克霍尔德氏菌(Burkholderia xenovorans)
<400> 17
Met Ser Tyr Ala Ile Tyr Pro Ser Leu Ser Gly Lys Thr Val Val Ile
1 5 10 15
Thr Gly Gly Gly Ser Gly Ile Gly Ala Ala Met Val Glu Ala Phe Ala
20 25 30
Arg Gln Gly Ala Arg Val Phe Phe Leu Asp Val Ala Glu Asp Asp Ser
35 40 45
Leu Ala Leu Gln Gln Ser Leu Ser Asp Ala Pro His Pro Pro Leu Phe
50 55 60
Arg Arg Cys Asp Leu Arg Ser Val Asp Ala Ile His Ser Ala Phe Ala
65 70 75 80
Gly Ile Val Glu Ile Ala Gly Pro Ile Glu Val Leu Val Asn Asn Ala
85 90 95
Gly Asn Asp Asp Arg His Glu Val Asp Ala Ile Thr Pro Ala Tyr Trp
100 105 110
Asp Glu Arg Met Ala Val Asn Leu Arg His Gln Phe Phe Cys Ala Gln
115 120 125
Ala Ala Ala Ala Gly Met Arg Lys Ile Gly Arg Gly Val Ile Leu Asn
130 135 140
Leu Gly Ser Val Ser Trp His Leu Ala Leu Pro Asn Leu Ala Ile Tyr
145 150 155 160
Met Ser Ala Lys Ala Gly Ile Glu Gly Leu Thr Arg Gly Leu Ala Arg
165 170 175
Asp Leu Gly Ala Ala Gly Ile Arg Val Asn Cys Ile Ile Pro Gly Ala
180 185 190
Val Arg Thr Pro Arg Gln Met Gln Leu Trp Gln Ser Pro Glu Ser Glu
195 200 205
Ala Lys Leu Val Ala Ser Gln Cys Leu Arg Leu Arg Ile Glu Pro Glu
210 215 220
His Val Ala Arg Met Ala Leu Phe Leu Ala Ser Asp Asp Ala Ser Arg
225 230 235 240
Cys Ser Gly Arg Asp Tyr Phe Val Asp Ala Gly Trp Tyr Gly Glu
245 250 255
<210> 18
<211> 1173
<212> DNA
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 18
atgagccccg cccccaccga catcgtcgag gagttcacgc gccgcgactg gcagggagac 60
gacgtgacgg gcaccgtgcg ggtcgccatg atcggcctcg gctggtggac ccgcgacgag 120
gcgattcccg cggtcgaggc gtccgagttc tgcgagacga cggtcgtcgt cagcagttcg 180
aaggagaaag ccgagggcgc gacggcgttg accgagtcga taacccacgg cctcacctac 240
gacgagttcc acgagggggt cgccgccgac gcctacgacg cggtgtacgt cgtcacgccg 300
aacggtctgc atctcccgta cgtcgagacc gccgccgagt tggggaaggc ggtcctctgc 360
gagaaaccgc tggaagcgtc ggtcgagcgg gccgaaaagc tcgtcgccgc ctgcgaccgc 420
gccgacgtgc ccctgatggt cgcctatcgg atgcagaccg agccggccgt ccggcgcgcc 480
cgcgaactcg tcgaggccgg cgtcatcggc gagccggtgt tcgtccacgg ccacatgtcc 540
cagcgcctgc tcgacgaggt cgtccccgac cccgaccagt ggcggctcga ccccgaactc 600
tccggcggcg cgaccgtcat ggacatcggg ctctacccgc tgaacaccgc ccggttcgtc 660
ctcgacgccg accccgtccg cgtcagggcg accgcccgcg tcgacgacga ggcgttcgag 720
gccgtcggcg acgagcacgt cagtttcggc gtcgacttcg acgacggcac gctcgcggtc 780
tgcaccgcca gccagtcggc ttaccagttg agccacctcc gggtgaccgg caccgagggc 840
gaactcgaaa tcgagcccgc gttctacaac cgccaaaagc ggggattccg actgtcgtgg 900
ggggaccagt ccgccgacta cgacttcgag caggtaaacc agatgacgga ggagttcgac 960
tacttcgcgt cccggctcct gtcggattcc gaccccgcgc ccgacggcga ccacgcgctc 1020
gtggacatgc gcgcgatgga cgcgatttac gccgcggcgg agcgcgggac cgatgtcgcc 1080
gtcgacgccg ccgactccga ttccgccgac tccgattccg ccgacgctgc cgccgccaac 1140
cacgacgccg accccgattc cgacgggacg tag 1173
<210> 19
<211> 390
<212> PRT
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 19
Met Ser Pro Ala Pro Thr Asp Ile Val Glu Glu Phe Thr Arg Arg Asp
1 5 10 15
Trp Gln Gly Asp Asp Val Thr Gly Thr Val Arg Val Ala Met Ile Gly
20 25 30
Leu Gly Trp Trp Thr Arg Asp Glu Ala Ile Pro Ala Val Glu Ala Ser
35 40 45
Glu Phe Cys Glu Thr Thr Val Val Val Ser Ser Ser Lys Glu Lys Ala
50 55 60
Glu Gly Ala Thr Ala Leu Thr Glu Ser Ile Thr His Gly Leu Thr Tyr
65 70 75 80
Asp Glu Phe His Glu Gly Val Ala Ala Asp Ala Tyr Asp Ala Val Tyr
85 90 95
Val Val Thr Pro Asn Gly Leu His Leu Pro Tyr Val Glu Thr Ala Ala
100 105 110
Glu Leu Gly Lys Ala Val Leu Cys Glu Lys Pro Leu Glu Ala Ser Val
115 120 125
Glu Arg Ala Glu Lys Leu Val Ala Ala Cys Asp Arg Ala Asp Val Pro
130 135 140
Leu Met Val Ala Tyr Arg Met Gln Thr Glu Pro Ala Val Arg Arg Ala
145 150 155 160
Arg Glu Leu Val Glu Ala Gly Val Ile Gly Glu Pro Val Phe Val His
165 170 175
Gly His Met Ser Gln Arg Leu Leu Asp Glu Val Val Pro Asp Pro Asp
180 185 190
Gln Trp Arg Leu Asp Pro Glu Leu Ser Gly Gly Ala Thr Val Met Asp
195 200 205
Ile Gly Leu Tyr Pro Leu Asn Thr Ala Arg Phe Val Leu Asp Ala Asp
210 215 220
Pro Val Arg Val Arg Ala Thr Ala Arg Val Asp Asp Glu Ala Phe Glu
225 230 235 240
Ala Val Gly Asp Glu His Val Ser Phe Gly Val Asp Phe Asp Asp Gly
245 250 255
Thr Leu Ala Val Cys Thr Ala Ser Gln Ser Ala Tyr Gln Leu Ser His
260 265 270
Leu Arg Val Thr Gly Thr Glu Gly Glu Leu Glu Ile Glu Pro Ala Phe
275 280 285
Tyr Asn Arg Gln Lys Arg Gly Phe Arg Leu Ser Trp Gly Asp Gln Ser
290 295 300
Ala Asp Tyr Asp Phe Glu Gln Val Asn Gln Met Thr Glu Glu Phe Asp
305 310 315 320
Tyr Phe Ala Ser Arg Leu Leu Ser Asp Ser Asp Pro Ala Pro Asp Gly
325 330 335
Asp His Ala Leu Val Asp Met Arg Ala Met Asp Ala Ile Tyr Ala Ala
340 345 350
Ala Glu Arg Gly Thr Asp Val Ala Val Asp Ala Ala Asp Ser Asp Ser
355 360 365
Ala Asp Ser Asp Ser Ala Asp Ala Ala Ala Ala Asn His Asp Ala Asp
370 375 380
Pro Asp Ser Asp Gly Thr
385 390
<210> 20
<211> 990
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 20
atgcacaaat ttactaaagc cctggcagcc attggtctgg cagccgttat gtcacaatcc 60
gctatggcgg agaacctgaa gctcggtttt ctggtgaagc aaccggaaga gccgtggttc 120
cagaccgaat ggaagtttgc cgataaagcc gggaaggatt tagggtttga ggttattaag 180
attgccgtgc cggatggcga aaaaacattg aacgcgatcg acagcctggc tgccagtggc 240
gcaaaaggtt tcgttatttg tactccggac cccaaactcg gctctgccat cgtcgcgaaa 300
gcgcgtggct acgatatgaa agtcattgcc gtggatgacc agtttgttaa cgccaaaggt 360
aagccaatgg ataccgttcc gctggtgatg atggcggcga ctaaaattgg cgaacgtcag 420
ggccaggaac tgtataaaga gatgcagaaa cgtggctggg atgtcaaaga aagcgcggtg 480
atggcgatta ccgccaacga actggatacc gcccgccgcc gtactacggg atctatggat 540
gcgctgaaag cggccggatt cccggaaaaa caaatttatc aggtacctac caaatctaac 600
gacatcccgg gggcatttga cgctgccaac tcaatgctgg ttcaacatcc ggaagttaaa 660
cattggctga tcgtcggtat gaacgacagc accgtgctgg gcggcgtacg cgcgacggaa 720
ggtcagggct ttaaagcggc cgatatcatc ggcattggca ttaacggtgt ggatgcggtg 780
agcgaactgt ctaaagcaca ggcaaccggc ttctacggtt ccctgctgcc aagcccggac 840
gtacatggct ataaatccag cgaaatgctt tacaactggg tagcaaaaga cgttgaaccg 900
ccaaaattta ccgaagttac cgacgtggta ctgatcacgc gtgacaactt taaagaagaa 960
ctggagaaaa aaggtttagg cggtaagtaa 990
<210> 21
<211> 1515
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 21
atgcaacagt ctaccccgta tctctcattt cgcggcatcg gtaaaacgtt tcccggcgtt 60
aaggcgctga cggatattag ttttgactgc tatgccggtc aggttcatgc gttgatgggt 120
gaaaatggcg caggaaaatc aactctctta aaaatcctca gcggcaacta tgcgccaacc 180
acgggttctg tagtgattaa tgggcaggaa atgtcctttt ccgacacgac cgcagcactt 240
aacgcgggcg tggcgattat ttaccaggaa ctgcatctcg tgccggaaat gaccgtcgcg 300
gaaaacatct atctcggcca gctgccgcat aaaggcggca ttgtgaatcg ctcattgctg 360
aattatgagg cgggtttaca acttaaacat cttggtatgg atattgaccc ggacacgccg 420
ctgaaatatc tctccattgg tcagtggcag atggttgaaa tcgccaaagc gctggcgcgt 480
aacgccaaaa ttatcgcctt tgatgagcca accagctccc tctctgcccg tgaaatcgac 540
aatcttttcc gcgttattcg tgaactgcga aaagaggggc gggtaatctt atacgtttct 600
caccgtatgg aagaaatatt tgccctcagc gatgccatta ctgtctttaa agatggacgt 660
tatgtcaaaa cctttaccga tatgcagcag gttgaccacg acgcgctggt gcaggcgatg 720
gtcgggcgcg acattggcga tatctacggc tggcaaccgc gtagttatgg cgaggagcgc 780
ctacgtcttg atgctgtgaa agcaccaggc gtgcgtacgc caataagtct ggcggttcgc 840
agtggtgaaa ttgttgggct gtttggtctg gtaggggcgg ggcgtagcga attaatgaaa 900
ggcatgtttg gcgggacgca aatcaccgcc ggtcaggttt atatcgacca acagccgatc 960
gatattcgta aaccgagcca cgccattgcc gcaggcatga tgctctgccc ggaagatcgc 1020
aaagcggaag gcattattcc cgtgcactcc gttcgcgaca atatcaacat cagtgccaga 1080
cgtaaacatg tgctcggcgg ttgtgtaatc aacaacggtt gggaagaaaa caatgccgat 1140
caccacattc gttcgctcaa catcaaaacg ccgggcgcgg agcaactgat catgaatctc 1200
tcaggcggaa atcagcaaaa agccattctg ggccgctggt tatcggaaga gatgaaggtc 1260
attttgctgg atgaacctac gcgcggcatt gatgttggcg ctaagcacga aatatataac 1320
gtaatttatg cgctggcggc gcagggcgtg gcggtgctgt ttgcctccag cgacttacct 1380
gaagtcctcg gcgttgccga ccggattgtg gtgatgcggg aaggtgaaat cgccggtgaa 1440
ttgttacacg agcaggcaga tgagcgtcag gcactgagcc ttgcgatgcc taaagtcagc 1500
caggctgttg cctga 1515
<210> 22
<211> 987
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 22
atgtcttctg tttctacatc ggggtctggc gcacctaagt cgtcattcag cttcgggcgt 60
atctgggatc agtacggcat gctggtggtg tttgcggtgc tctttatcgc ctgtgccatt 120
tttgtcccaa attttgccac cttcattaat atgaaagggt tgggcctggc aatttccatg 180
tcggggatgg tggcttgtgg catgttgttc tgcctcgctt ccggtgactt tgacctttct 240
gtcgcctccg taattgcctg tgcgggtgtc accacggcgg tggttattaa cctgactgaa 300
agcctgtgga ttggcgtggc agcggggttg ttgctgggcg ttctctgtgg cctggtcaat 360
ggctttgtta tcgccaaact gaaaataaat gctctgatca cgacattggc aacgatgcag 420
attgttcgag gtctggcgta catcatttca gacggtaaag cggtcggtat cgaagatgaa 480
agcttctttg cccttggtta cgccaactgg ttcggtctgc ctgcgccaat ctggctcacc 540
gtcgcgtgtc tgattatctt tggtttgctg ctgaataaaa ccacctttgg tcgtaacacc 600
ctggcgattg gcgggaacga agaggccgcg cgtctggcgg gtgtaccggt tgttcgcacc 660
aaaattatta tctttgttct ctcaggcctg gtatcagcga tagccggaat tattctggct 720
tcacgtatga ccagtgggca gccaatgacg tcgattggtt atgagctgat tgttatctcc 780
gcctgcgttt taggtggcgt ttctctgaaa ggtggcatcg gaaaaatctc atatgtggtg 840
gcgggtatct taattttagg caccgtggaa aacgccatga acctgcttaa tatttctcct 900
ttcgcgcagt acgtggttcg cggcttaatc ctgctggcag cggtgatctt cgaccgttac 960
aagcaaaaag cgaaacgcac tgtctga 987
<210> 23
<211> 329
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 23
Met His Lys Phe Thr Lys Ala Leu Ala Ala Ile Gly Leu Ala Ala Val
1 5 10 15
Met Ser Gln Ser Ala Met Ala Glu Asn Leu Lys Leu Gly Phe Leu Val
20 25 30
Lys Gln Pro Glu Glu Pro Trp Phe Gln Thr Glu Trp Lys Phe Ala Asp
35 40 45
Lys Ala Gly Lys Asp Leu Gly Phe Glu Val Ile Lys Ile Ala Val Pro
50 55 60
Asp Gly Glu Lys Thr Leu Asn Ala Ile Asp Ser Leu Ala Ala Ser Gly
65 70 75 80
Ala Lys Gly Phe Val Ile Cys Thr Pro Asp Pro Lys Leu Gly Ser Ala
85 90 95
Ile Val Ala Lys Ala Arg Gly Tyr Asp Met Lys Val Ile Ala Val Asp
100 105 110
Asp Gln Phe Val Asn Ala Lys Gly Lys Pro Met Asp Thr Val Pro Leu
115 120 125
Val Met Met Ala Ala Thr Lys Ile Gly Glu Arg Gln Gly Gln Glu Leu
130 135 140
Tyr Lys Glu Met Gln Lys Arg Gly Trp Asp Val Lys Glu Ser Ala Val
145 150 155 160
Met Ala Ile Thr Ala Asn Glu Leu Asp Thr Ala Arg Arg Arg Thr Thr
165 170 175
Gly Ser Met Asp Ala Leu Lys Ala Ala Gly Phe Pro Glu Lys Gln Ile
180 185 190
Tyr Gln Val Pro Thr Lys Ser Asn Asp Ile Pro Gly Ala Phe Asp Ala
195 200 205
Ala Asn Ser Met Leu Val Gln His Pro Glu Val Lys His Trp Leu Ile
210 215 220
Val Gly Met Asn Asp Ser Thr Val Leu Gly Gly Val Arg Ala Thr Glu
225 230 235 240
Gly Gln Gly Phe Lys Ala Ala Asp Ile Ile Gly Ile Gly Ile Asn Gly
245 250 255
Val Asp Ala Val Ser Glu Leu Ser Lys Ala Gln Ala Thr Gly Phe Tyr
260 265 270
Gly Ser Leu Leu Pro Ser Pro Asp Val His Gly Tyr Lys Ser Ser Glu
275 280 285
Met Leu Tyr Asn Trp Val Ala Lys Asp Val Glu Pro Pro Lys Phe Thr
290 295 300
Glu Val Thr Asp Val Val Leu Ile Thr Arg Asp Asn Phe Lys Glu Glu
305 310 315 320
Leu Glu Lys Lys Gly Leu Gly Gly Lys
325
<210> 24
<211> 504
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 24
Met Gln Gln Ser Thr Pro Tyr Leu Ser Phe Arg Gly Ile Gly Lys Thr
1 5 10 15
Phe Pro Gly Val Lys Ala Leu Thr Asp Ile Ser Phe Asp Cys Tyr Ala
20 25 30
Gly Gln Val His Ala Leu Met Gly Glu Asn Gly Ala Gly Lys Ser Thr
35 40 45
Leu Leu Lys Ile Leu Ser Gly Asn Tyr Ala Pro Thr Thr Gly Ser Val
50 55 60
Val Ile Asn Gly Gln Glu Met Ser Phe Ser Asp Thr Thr Ala Ala Leu
65 70 75 80
Asn Ala Gly Val Ala Ile Ile Tyr Gln Glu Leu His Leu Val Pro Glu
85 90 95
Met Thr Val Ala Glu Asn Ile Tyr Leu Gly Gln Leu Pro His Lys Gly
100 105 110
Gly Ile Val Asn Arg Ser Leu Leu Asn Tyr Glu Ala Gly Leu Gln Leu
115 120 125
Lys His Leu Gly Met Asp Ile Asp Pro Asp Thr Pro Leu Lys Tyr Leu
130 135 140
Ser Ile Gly Gln Trp Gln Met Val Glu Ile Ala Lys Ala Leu Ala Arg
145 150 155 160
Asn Ala Lys Ile Ile Ala Phe Asp Glu Pro Thr Ser Ser Leu Ser Ala
165 170 175
Arg Glu Ile Asp Asn Leu Phe Arg Val Ile Arg Glu Leu Arg Lys Glu
180 185 190
Gly Arg Val Ile Leu Tyr Val Ser His Arg Met Glu Glu Ile Phe Ala
195 200 205
Leu Ser Asp Ala Ile Thr Val Phe Lys Asp Gly Arg Tyr Val Lys Thr
210 215 220
Phe Thr Asp Met Gln Gln Val Asp His Asp Ala Leu Val Gln Ala Met
225 230 235 240
Val Gly Arg Asp Ile Gly Asp Ile Tyr Gly Trp Gln Pro Arg Ser Tyr
245 250 255
Gly Glu Glu Arg Leu Arg Leu Asp Ala Val Lys Ala Pro Gly Val Arg
260 265 270
Thr Pro Ile Ser Leu Ala Val Arg Ser Gly Glu Ile Val Gly Leu Phe
275 280 285
Gly Leu Val Gly Ala Gly Arg Ser Glu Leu Met Lys Gly Met Phe Gly
290 295 300
Gly Thr Gln Ile Thr Ala Gly Gln Val Tyr Ile Asp Gln Gln Pro Ile
305 310 315 320
Asp Ile Arg Lys Pro Ser His Ala Ile Ala Ala Gly Met Met Leu Cys
325 330 335
Pro Glu Asp Arg Lys Ala Glu Gly Ile Ile Pro Val His Ser Val Arg
340 345 350
Asp Asn Ile Asn Ile Ser Ala Arg Arg Lys His Val Leu Gly Gly Cys
355 360 365
Val Ile Asn Asn Gly Trp Glu Glu Asn Asn Ala Asp His His Ile Arg
370 375 380
Ser Leu Asn Ile Lys Thr Pro Gly Ala Glu Gln Leu Ile Met Asn Leu
385 390 395 400
Ser Gly Gly Asn Gln Gln Lys Ala Ile Leu Gly Arg Trp Leu Ser Glu
405 410 415
Glu Met Lys Val Ile Leu Leu Asp Glu Pro Thr Arg Gly Ile Asp Val
420 425 430
Gly Ala Lys His Glu Ile Tyr Asn Val Ile Tyr Ala Leu Ala Ala Gln
435 440 445
Gly Val Ala Val Leu Phe Ala Ser Ser Asp Leu Pro Glu Val Leu Gly
450 455 460
Val Ala Asp Arg Ile Val Val Met Arg Glu Gly Glu Ile Ala Gly Glu
465 470 475 480
Leu Leu His Glu Gln Ala Asp Glu Arg Gln Ala Leu Ser Leu Ala Met
485 490 495
Pro Lys Val Ser Gln Ala Val Ala
500
<210> 25
<211> 328
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 25
Met Ser Ser Val Ser Thr Ser Gly Ser Gly Ala Pro Lys Ser Ser Phe
1 5 10 15
Ser Phe Gly Arg Ile Trp Asp Gln Tyr Gly Met Leu Val Val Phe Ala
20 25 30
Val Leu Phe Ile Ala Cys Ala Ile Phe Val Pro Asn Phe Ala Thr Phe
35 40 45
Ile Asn Met Lys Gly Leu Gly Leu Ala Ile Ser Met Ser Gly Met Val
50 55 60
Ala Cys Gly Met Leu Phe Cys Leu Ala Ser Gly Asp Phe Asp Leu Ser
65 70 75 80
Val Ala Ser Val Ile Ala Cys Ala Gly Val Thr Thr Ala Val Val Ile
85 90 95
Asn Leu Thr Glu Ser Leu Trp Ile Gly Val Ala Ala Gly Leu Leu Leu
100 105 110
Gly Val Leu Cys Gly Leu Val Asn Gly Phe Val Ile Ala Lys Leu Lys
115 120 125
Ile Asn Ala Leu Ile Thr Thr Leu Ala Thr Met Gln Ile Val Arg Gly
130 135 140
Leu Ala Tyr Ile Ile Ser Asp Gly Lys Ala Val Gly Ile Glu Asp Glu
145 150 155 160
Ser Phe Phe Ala Leu Gly Tyr Ala Asn Trp Phe Gly Leu Pro Ala Pro
165 170 175
Ile Trp Leu Thr Val Ala Cys Leu Ile Ile Phe Gly Leu Leu Leu Asn
180 185 190
Lys Thr Thr Phe Gly Arg Asn Thr Leu Ala Ile Gly Gly Asn Glu Glu
195 200 205
Ala Ala Arg Leu Ala Gly Val Pro Val Val Arg Thr Lys Ile Ile Ile
210 215 220
Phe Val Leu Ser Gly Leu Val Ser Ala Ile Ala Gly Ile Ile Leu Ala
225 230 235 240
Ser Arg Met Thr Ser Gly Gln Pro Met Thr Ser Ile Gly Tyr Glu Leu
245 250 255
Ile Val Ile Ser Ala Cys Val Leu Gly Gly Val Ser Leu Lys Gly Gly
260 265 270
Ile Gly Lys Ile Ser Tyr Val Val Ala Gly Ile Leu Ile Leu Gly Thr
275 280 285
Val Glu Asn Ala Met Asn Leu Leu Asn Ile Ser Pro Phe Ala Gln Tyr
290 295 300
Val Val Arg Gly Leu Ile Leu Leu Ala Ala Val Ile Phe Asp Arg Tyr
305 310 315 320
Lys Gln Lys Ala Lys Arg Thr Val
325
<210> 26
<211> 993
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 26
atgaaaataa agaacattct actcaccctt tgcacctcac tcctgcttac caacgttgct 60
gcacacgcca aagaagtcaa aataggtatg gcgattgatg atctccgtct tgaacgctgg 120
caaaaagatc gagatatctt tgtgaaaaag gcagaatctc tcggcgcgaa agtatttgta 180
cagtctgcaa atggcaatga agaaacacaa atgtcgcaga ttgaaaacat gataaaccgg 240
ggtgtcgatg ttcttgtcat tattccgtat aacggtcagg tattaagtaa cgttgtaaaa 300
gaagccaaac aagaaggcat taaagtatta gcttacgacc gtatgattaa cgatgcggat 360
atcgattttt atatttcttt cgataacgaa aaagtcggtg aactgcaggc aaaagccctg 420
gtcgatattg ttccgcaagg taattacttc ctgatgggcg gctcgccggt agataacaac 480
gccaagctgt tccgcgccgg acaaatgaaa gtgttaaaac cttacgttga ttccggaaaa 540
attaaagtcg ttggtgacca atgggttgat ggctggttac cggaaaacgc attgaaaatt 600
atggaaaacg cgctaaccgc caataataac aaaattgatg ctgtagttgc ctcaaacgat 660
gccaccgcag gtggggcaat tcaggcatta agcgcgcaag gtttatcagg gaaagtagca 720
atctccggcc aggatgcgga tctcgcaggt attaaacgta ttgctgccgg tacgcaaact 780
atgacggtgt ataaacctat tacgttgttg gcaaatactg ccgcagaaat tgccgttgag 840
ttgggcaatg gtcaggaacc aaaagcagat accacactga ataatggcct gaaagatgtc 900
ccctcccgcc tcctgacacc gatcgatgtg aataaaaaca acatcaaaga tacggtaatt 960
aaagacggat tccacaaaga gagcgagctg taa 993
<210> 27
<211> 1542
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 27
atgccttatc tacttgaaat gaagaacatt accaaaacct tcggcagtgt gaaggcgatt 60
gataacgtct gcttgcggtt gaatgctggc gaaatcgtct cactttgtgg ggaaaatggg 120
tctggtaaat caacgctgat gaaagtgctg tgtggtattt atccccatgg ctcctacgaa 180
ggcgaaatta tttttgcggg agaagagatt caggcgagtc acatccgcga taccgaacgc 240
aaaggtatcg ccatcattca tcaggaattg gccctggtga aagaattgac cgtgctggaa 300
aatatcttcc tgggtaacga aataacccac aatggcatta tggattatga cctgatgacg 360
ctacgctgtc agaagctgct cgcacaggtc agtttatcca tttcacctga tacccgcgtt 420
ggcgatttag ggcttgggca acaacaactg gttgaaattg ccaaggcact taataaacag 480
gtgcgcttgt taattctcga tgaaccgaca gcctcattaa ctgagcagga aacgtcgatt 540
ttactggata ttattcgcga tctacaacag cacggtatcg cctgtattta tatttcgcac 600
aaactcaacg aagtcaaagc gatttccgat acgatttgcg ttattcgcga cggacagcac 660
attggtacgc gtgatgctgc cggaatgagt gaagacgata ttatcaccat gatggtcggg 720
cgagagttaa ccgcgcttta ccctaatgaa ccacatacca ccggagatga aatattacgt 780
attgaacatc tgacggcatg gcatccggtt aatcgtcata ttaaacgagt taatgatgtc 840
tcgttttccc tgaaacgtgg cgaaatattg ggtattgccg gactcgttgg tgccggacgt 900
accgagacca ttcagtgcct gtttggtgtg tggcccggac aatgggaagg aaaaatttat 960
attgatggca aacaggtaga tattcgtaac tgtcagcaag ccatcgccca ggggattgcg 1020
atggtccccg aagacagaaa gcgcgacggc atcgttccgg taatggcggt tggtaaaaat 1080
attaccctcg ccgcactcaa taaatttacc ggtggcatta gccagcttga tgacgcggca 1140
gagcaaaaat gtattctgga atcaatccag caactcaaag ttaaaacgtc gtcccccgac 1200
cttgctattg gacgtttgag cggcggcaat cagcaaaaag cgatcctcgc tcgctgtctg 1260
ttacttaacc cgcgcattct cattcttgat gaacccacca ggggtatcga tattggcgcg 1320
aaatacgaga tctacaaatt aattaaccaa ctcgtccagc agggtattgc cgttattgtc 1380
atctcttccg aattacctga agtgctcggc cttagcgatc gtgtactggt gatgcatgaa 1440
gggaaactaa aagccaacct gataaatcat aacctgactc aggagcaggt gatggaagcc 1500
gcattgagga gcgaacatca tgtcgaaaag caatccgtct ga 1542
<210> 28
<211> 1182
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 28
atgtcgaaaa gcaatccgtc tgaagtgaaa ttggccgtac cgacatccgg tggcttctcc 60
gggctgaaat cactgaattt gcaggtcttc gtgatgattg cagctatcat cgcaatcatg 120
ctgttcttta cctggaccac cgatggtgcc tacttaagcg cccgtaacgt ctccaacctg 180
ttacgccaga ccgcgattac cggcatcctc gcggtaggaa tggtgttcgt cataatttct 240
gctgaaatcg acctttccgt cggctcaatg atggggctgt taggtggcgt cgcggcgatt 300
tgtgacgtct ggttaggctg gcctttgcca cttaccatca ttgtgacgct ggttctggga 360
ctgcttctcg gtgcctggaa cggatggtgg gtcgcgtacc gtaaagtccc ttcatttatt 420
gtcaccctcg cgggcatgtt ggcatttcgc ggcatactca ttggcatcac caacggcacg 480
actgtatccc ccaccagcgc cgcgatgtca caaattgggc aaagctatct ccccgccagt 540
accggcttca tcattggcgc gcttggctta atggcttttg ttggttggca atggcgcgga 600
agaatgcgcc gtcaggcttt gggtttacag tctccggcct ctaccgcagt agtcggtcgc 660
caggctttaa ccgctatcat cgtattaggc gcaatctggc tgttgaatga ttaccgtggc 720
gttcccactc ctgttctgct gctgacgttg ctgttactcg gcggaatgtt tatggcaacg 780
cggacggcat ttggacgacg catttatgcc atcggcggca atctggaagc agcacgtctc 840
tccgggatta acgttgaacg caccaaactt gccgtgttcg cgattaacgg attaatggta 900
gccatcgccg gattaatcct tagttctcga cttggcgctg gttcaccttc tgcgggaaat 960
atcgccgaac tggacgcaat tgcagcatgc gtgattggcg gcaccagcct ggctggcggt 1020
gtgggaagcg ttgccggagc agtaatgggg gcatttatca tggcttcact ggataacggc 1080
atgagtatga tggatgtacc gaccttctgg cagtatatcg ttaaaggtgc gattctgttg 1140
ctggcagtat ggatggactc cgcaaccaaa cgccgttctt ga 1182
<210> 29
<211> 330
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 29
Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu
1 5 10 15
Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile
20 25 30
Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val
35 40 45
Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn
50 55 60
Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg
65 70 75 80
Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser
85 90 95
Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr
100 105 110
Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp
115 120 125
Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val
130 135 140
Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn
145 150 155 160
Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val
165 170 175
Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp
180 185 190
Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn
195 200 205
Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly
210 215 220
Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala
225 230 235 240
Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala
245 250 255
Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn
260 265 270
Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys
275 280 285
Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu
290 295 300
Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile
305 310 315 320
Lys Asp Gly Phe His Lys Glu Ser Glu Leu
325 330
<210> 30
<211> 513
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 30
Met Pro Tyr Leu Leu Glu Met Lys Asn Ile Thr Lys Thr Phe Gly Ser
1 5 10 15
Val Lys Ala Ile Asp Asn Val Cys Leu Arg Leu Asn Ala Gly Glu Ile
20 25 30
Val Ser Leu Cys Gly Glu Asn Gly Ser Gly Lys Ser Thr Leu Met Lys
35 40 45
Val Leu Cys Gly Ile Tyr Pro His Gly Ser Tyr Glu Gly Glu Ile Ile
50 55 60
Phe Ala Gly Glu Glu Ile Gln Ala Ser His Ile Arg Asp Thr Glu Arg
65 70 75 80
Lys Gly Ile Ala Ile Ile His Gln Glu Leu Ala Leu Val Lys Glu Leu
85 90 95
Thr Val Leu Glu Asn Ile Phe Leu Gly Asn Glu Ile Thr His Asn Gly
100 105 110
Ile Met Asp Tyr Asp Leu Met Thr Leu Arg Cys Gln Lys Leu Leu Ala
115 120 125
Gln Val Ser Leu Ser Ile Ser Pro Asp Thr Arg Val Gly Asp Leu Gly
130 135 140
Leu Gly Gln Gln Gln Leu Val Glu Ile Ala Lys Ala Leu Asn Lys Gln
145 150 155 160
Val Arg Leu Leu Ile Leu Asp Glu Pro Thr Ala Ser Leu Thr Glu Gln
165 170 175
Glu Thr Ser Ile Leu Leu Asp Ile Ile Arg Asp Leu Gln Gln His Gly
180 185 190
Ile Ala Cys Ile Tyr Ile Ser His Lys Leu Asn Glu Val Lys Ala Ile
195 200 205
Ser Asp Thr Ile Cys Val Ile Arg Asp Gly Gln His Ile Gly Thr Arg
210 215 220
Asp Ala Ala Gly Met Ser Glu Asp Asp Ile Ile Thr Met Met Val Gly
225 230 235 240
Arg Glu Leu Thr Ala Leu Tyr Pro Asn Glu Pro His Thr Thr Gly Asp
245 250 255
Glu Ile Leu Arg Ile Glu His Leu Thr Ala Trp His Pro Val Asn Arg
260 265 270
His Ile Lys Arg Val Asn Asp Val Ser Phe Ser Leu Lys Arg Gly Glu
275 280 285
Ile Leu Gly Ile Ala Gly Leu Val Gly Ala Gly Arg Thr Glu Thr Ile
290 295 300
Gln Cys Leu Phe Gly Val Trp Pro Gly Gln Trp Glu Gly Lys Ile Tyr
305 310 315 320
Ile Asp Gly Lys Gln Val Asp Ile Arg Asn Cys Gln Gln Ala Ile Ala
325 330 335
Gln Gly Ile Ala Met Val Pro Glu Asp Arg Lys Arg Asp Gly Ile Val
340 345 350
Pro Val Met Ala Val Gly Lys Asn Ile Thr Leu Ala Ala Leu Asn Lys
355 360 365
Phe Thr Gly Gly Ile Ser Gln Leu Asp Asp Ala Ala Glu Gln Lys Cys
370 375 380
Ile Leu Glu Ser Ile Gln Gln Leu Lys Val Lys Thr Ser Ser Pro Asp
385 390 395 400
Leu Ala Ile Gly Arg Leu Ser Gly Gly Asn Gln Gln Lys Ala Ile Leu
405 410 415
Ala Arg Cys Leu Leu Leu Asn Pro Arg Ile Leu Ile Leu Asp Glu Pro
420 425 430
Thr Arg Gly Ile Asp Ile Gly Ala Lys Tyr Glu Ile Tyr Lys Leu Ile
435 440 445
Asn Gln Leu Val Gln Gln Gly Ile Ala Val Ile Val Ile Ser Ser Glu
450 455 460
Leu Pro Glu Val Leu Gly Leu Ser Asp Arg Val Leu Val Met His Glu
465 470 475 480
Gly Lys Leu Lys Ala Asn Leu Ile Asn His Asn Leu Thr Gln Glu Gln
485 490 495
Val Met Glu Ala Ala Leu Arg Ser Glu His His Val Glu Lys Gln Ser
500 505 510
Val
<210> 31
<211> 330
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 31
Met Lys Ile Lys Asn Ile Leu Leu Thr Leu Cys Thr Ser Leu Leu Leu
1 5 10 15
Thr Asn Val Ala Ala His Ala Lys Glu Val Lys Ile Gly Met Ala Ile
20 25 30
Asp Asp Leu Arg Leu Glu Arg Trp Gln Lys Asp Arg Asp Ile Phe Val
35 40 45
Lys Lys Ala Glu Ser Leu Gly Ala Lys Val Phe Val Gln Ser Ala Asn
50 55 60
Gly Asn Glu Glu Thr Gln Met Ser Gln Ile Glu Asn Met Ile Asn Arg
65 70 75 80
Gly Val Asp Val Leu Val Ile Ile Pro Tyr Asn Gly Gln Val Leu Ser
85 90 95
Asn Val Val Lys Glu Ala Lys Gln Glu Gly Ile Lys Val Leu Ala Tyr
100 105 110
Asp Arg Met Ile Asn Asp Ala Asp Ile Asp Phe Tyr Ile Ser Phe Asp
115 120 125
Asn Glu Lys Val Gly Glu Leu Gln Ala Lys Ala Leu Val Asp Ile Val
130 135 140
Pro Gln Gly Asn Tyr Phe Leu Met Gly Gly Ser Pro Val Asp Asn Asn
145 150 155 160
Ala Lys Leu Phe Arg Ala Gly Gln Met Lys Val Leu Lys Pro Tyr Val
165 170 175
Asp Ser Gly Lys Ile Lys Val Val Gly Asp Gln Trp Val Asp Gly Trp
180 185 190
Leu Pro Glu Asn Ala Leu Lys Ile Met Glu Asn Ala Leu Thr Ala Asn
195 200 205
Asn Asn Lys Ile Asp Ala Val Val Ala Ser Asn Asp Ala Thr Ala Gly
210 215 220
Gly Ala Ile Gln Ala Leu Ser Ala Gln Gly Leu Ser Gly Lys Val Ala
225 230 235 240
Ile Ser Gly Gln Asp Ala Asp Leu Ala Gly Ile Lys Arg Ile Ala Ala
245 250 255
Gly Thr Gln Thr Met Thr Val Tyr Lys Pro Ile Thr Leu Leu Ala Asn
260 265 270
Thr Ala Ala Glu Ile Ala Val Glu Leu Gly Asn Gly Gln Glu Pro Lys
275 280 285
Ala Asp Thr Thr Leu Asn Asn Gly Leu Lys Asp Val Pro Ser Arg Leu
290 295 300
Leu Thr Pro Ile Asp Val Asn Lys Asn Asn Ile Lys Asp Thr Val Ile
305 310 315 320
Lys Asp Gly Phe His Lys Glu Ser Glu Leu
325 330
<210> 32
<211> 879
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 32
atggctgaag cgcaaaatga tcccctgctg ccgggatact cgtttaacgc ccatctggtg 60
gcgggtttaa cgccgattga ggccaacggt tatctcgatt tttttatcga ccgaccgctg 120
ggaatgaaag gttatattct caatctcacc attcgcggtc agggggtggt gaaaaatcag 180
ggacgagaat ttgtctgccg accgggtgat attttgctgt tcccgccagg agagattcat 240
cactacggtc gtcatccgga ggctcgcgaa tggtatcacc agtgggttta ctttcgtccg 300
cgcgcctact ggcatgaatg gcttaactgg ccgtcaatat ttgccaatac gggtttcttt 360
cgcccggatg aagcgcacca gccgcatttc agcgacctgt ttgggcaaat cattaacgcc 420
gggcaagggg aagggcgcta ttcggagctg ctggcgataa atctgcttga gcaattgtta 480
ctgcggcgca tggaagcgat taacgagtcg ctccatccac cgatggataa tcgggtacgc 540
gaggcttgtc agtacatcag cgatcacctg gcagacagca attttgatat cgccagcgtc 600
gcacagcatg tttgcttgtc gccgtcgcgt ctgtcacatc ttttccgcca gcagttaggg 660
attagcgtct taagctggcg cgaggaccaa cgcattagtc aggcgaagct gcttttgagc 720
actacccgga tgcctatcgc caccgtcggt cgcaatgttg gttttgacga tcaactctat 780
ttctcgcgag tatttaaaaa atgcaccggg gccagcccga gcgagtttcg tgccggttgt 840
gaagaaaaag tgaatgatgt agccgtcaag ttgtcataa 879
<210> 33
<211> 292
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 33
Met Ala Glu Ala Gln Asn Asp Pro Leu Leu Pro Gly Tyr Ser Phe Asn
1 5 10 15
Ala His Leu Val Ala Gly Leu Thr Pro Ile Glu Ala Asn Gly Tyr Leu
20 25 30
Asp Phe Phe Ile Asp Arg Pro Leu Gly Met Lys Gly Tyr Ile Leu Asn
35 40 45
Leu Thr Ile Arg Gly Gln Gly Val Val Lys Asn Gln Gly Arg Glu Phe
50 55 60
Val Cys Arg Pro Gly Asp Ile Leu Leu Phe Pro Pro Gly Glu Ile His
65 70 75 80
His Tyr Gly Arg His Pro Glu Ala Arg Glu Trp Tyr His Gln Trp Val
85 90 95
Tyr Phe Arg Pro Arg Ala Tyr Trp His Glu Trp Leu Asn Trp Pro Ser
100 105 110
Ile Phe Ala Asn Thr Gly Phe Phe Arg Pro Asp Glu Ala His Gln Pro
115 120 125
His Phe Ser Asp Leu Phe Gly Gln Ile Ile Asn Ala Gly Gln Gly Glu
130 135 140
Gly Arg Tyr Ser Glu Leu Leu Ala Ile Asn Leu Leu Glu Gln Leu Leu
145 150 155 160
Leu Arg Arg Met Glu Ala Ile Asn Glu Ser Leu His Pro Pro Met Asp
165 170 175
Asn Arg Val Arg Glu Ala Cys Gln Tyr Ile Ser Asp His Leu Ala Asp
180 185 190
Ser Asn Phe Asp Ile Ala Ser Val Ala Gln His Val Cys Leu Ser Pro
195 200 205
Ser Arg Leu Ser His Leu Phe Arg Gln Gln Leu Gly Ile Ser Val Leu
210 215 220
Ser Trp Arg Glu Asp Gln Arg Ile Ser Gln Ala Lys Leu Leu Leu Ser
225 230 235 240
Thr Thr Arg Met Pro Ile Ala Thr Val Gly Arg Asn Val Gly Phe Asp
245 250 255
Asp Gln Leu Tyr Phe Ser Arg Val Phe Lys Lys Cys Thr Gly Ala Ser
260 265 270
Pro Ser Glu Phe Arg Ala Gly Cys Glu Glu Lys Val Asn Asp Val Ala
275 280 285
Val Lys Leu Ser
290
<210> 34
<211> 1506
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 34
atggaagcat tacttcagct taaaggcatc gataaagcct tcccgggcgt aaaagccctc 60
tcgggcgcag cgttaaatgt ctatccgggc cgcgtgatgg cgctggtggg cgaaaacggc 120
gcgggtaaat ccaccatgat gaaagtgctt actggcatct atactcgcga tgccggtacg 180
cttttatggc tggggaaaga aacgacattt accgggccaa aatcttccca ggaagccggg 240
attgggatta tccatcagga actgaacctg atcccgcagt tgaccattgc cgaaaacatt 300
ttcctcggtc gtgagtttgt taatcgcttt ggcaaaattg actggaaaac catgtatgcc 360
gaagcggata aattgctggc taaacttaac ctgcgcttta aaagcgacaa gctggtgggc 420
gatctttcca tcggtgacca gcaaatggtt gaaatcgcca aagtgctgag ctttgagtcg 480
aaagtcatca ttatggatga accgaccgat gcgctgaccg ataccgaaac cgaatccctg 540
ttccgcgtca tccgcgagct gaaatcgcaa ggccgcggta ttgtctatat ctcccaccgc 600
atgaaagaaa tcttcgagat ttgcgatgac gttaccgttt ttcgtgatgg gcaatttatt 660
gctgagcgcg aagtggcatc actgaccgaa gattcgctga ttgagatgat ggtgggtcgc 720
aagctggaag atcaatatcc gcacctggac aaagcgccgg gagatatccg cctgaaagtc 780
gataatctct gcggacctgg cgttaacgat gtctctttta ctttacgcaa aggcgaaatt 840
cttggcgtct ctggtttgat gggcgcaggt cgtaccgaac tgatgaaagt gctctacggc 900
gcactaccgc gcaccagcgg ttacgtcacc ctggatgggc atgaagtcgt tacccgttca 960
ccgcaggatg gcctggcaaa cggcattgtg tatatctccg aagaccgtaa acgtgacggt 1020
ttagtgttgg gcatgtcagt aaaagagaac atgtcgctga cagcgctgcg ctacttcagc 1080
cgcgctggcg gcagtttgaa gcatgccgat gaacagcagg ctgtgagtga tttcattcgt 1140
ctgtttaatg tgaaaactcc gtcgatggaa caggcaattg gtctgctttc cggtggcaat 1200
cagcaaaaag tggcgattgc ccgcggtctg atgacacgcc ccaaagtgtt gatccttgat 1260
gaacctaccc gtggcgtaga tgtcggcgcg aaaaaagaga tctatcaact gattaaccag 1320
ttcaaagccg atggcttgag catcattctg gtgtcatcgg agatgccaga agtattaggc 1380
atgagcgatc gcatcatcgt catgcatgaa gggcatctca gcggggaatt tactcgtgag 1440
caggccaccc aggaagtgtt aatggctgcc gctgtgggca agcttaatcg cgtgaatcag 1500
gagtaa 1506
<210> 35
<211> 891
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 35
atgaacatga aaaaactggc taccctggtt tccgctgttg cgctaagcgc caccgtcagt 60
gcgaatgcga tggcaaaaga caccatcgcg ctggtggtct ccacgcttaa caacccgttc 120
tttgtatcgc tgaaagatgg cgcgcagaaa gaggcggata aacttggcta taacctggtg 180
gtgctggact cccagaacaa cccggcgaaa gagctggcga acgtgcagga cttaaccgtt 240
cgcggcacaa aaattctgct gattaacccg accgactccg acgcagtggg taatgctgtg 300
aagatggcta accaggcgaa catcccggtt atcactcttg accgccaggc aacgaaaggt 360
gaagtggtga gccacattgc ttctgataac gtactgggcg gcaaaatcgc tggtgattac 420
atcgcgaaga aagcgggtga aggtgccaaa gttatcgagc tgcaaggcat tgctggtaca 480
tccgcagccc gtgaacgtgg cgaaggcttc cagcaggccg ttgctgctca caagtttaat 540
gttcttgcca gccagccagc agattttgat cgcattaaag gtttgaacgt aatgcagaac 600
ctgttgaccg ctcatccgga tgttcaggct gtattcgcgc agaatgatga aatggcgctg 660
ggcgcgctgc gcgcactgca aactgccggt aaatcggatg tgatggtcgt cggatttgac 720
ggtacaccgg atggcgaaaa agcggtgaat gatggcaaac tagcagcgac tatcgctcag 780
ctacccgatc agattggcgc gaaaggcgtc gaaaccgcag ataaagtgct gaaaggcgag 840
aaagttcagg ctaagtatcc ggttgatctg aaactggttg ttaagcagta g 891
<210> 36
<211> 966
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 36
atgacaaccc agactgtctc tggtcgccgt tatttcacga aagcgtggct gatggagcag 60
aaatcgctta tcgctctgct ggtgctgatc gcgattgtct cgacgttaag cccgaacttt 120
ttcaccatca ataacttatt caatattctc cagcaaacct cagtgaacgc cattatggcg 180
gtcgggatga cgctggtgat cctgacgtcg ggcatcgact tatcggtagg ttctctgttg 240
gcgctgaccg gcgcagttgc tgcatctatc gtcggcattg aagtcaatgc gctggtggct 300
gtcgctgctg ctctcgcgtt aggtgccgca attggtgcgg taaccggggt gattgtagcg 360
aaaggtcgcg tccaggcgtt tatcgctacg ctggttatga tgcttttact gcgcggcgtg 420
accatggttt ataccaacgg tagcccagtg aataccggct ttactgagaa cgccgatctg 480
tttggctggt ttggtattgg tcgtccgctg ggcgtaccga cgccagtctg gatcatgggg 540
attgtcttcc tcgcggcctg gtacatgctg catcacacgc gtctggggcg ttacatctac 600
gcgctgggcg gcaacgaagc ggcaacgcgt ctttctggta tcaacgtcaa taaaatcaaa 660
atcatcgtct attctctttg tggtctgctg gcatcgctgg ccgggatcat tgaagtggcg 720
cgtctctcct ccgcacaacc cacggcgggg actggctatg agctggatgc tattgctgcg 780
gtggttctgg gcggtacgag tctggcgggc ggaaaaggtc gcattgttgg gacgttgatc 840
ggcgcattaa ttcttggctt ccttaataat ggattgaatt tgttaggtgt ttcctcctat 900
taccagatga tcgtcaaagc ggtggtgatt ttgctggcgg tgctggtaga caacaaaaag 960
cagtaa 966
<210> 37
<211> 501
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 37
Met Glu Ala Leu Leu Gln Leu Lys Gly Ile Asp Lys Ala Phe Pro Gly
1 5 10 15
Val Lys Ala Leu Ser Gly Ala Ala Leu Asn Val Tyr Pro Gly Arg Val
20 25 30
Met Ala Leu Val Gly Glu Asn Gly Ala Gly Lys Ser Thr Met Met Lys
35 40 45
Val Leu Thr Gly Ile Tyr Thr Arg Asp Ala Gly Thr Leu Leu Trp Leu
50 55 60
Gly Lys Glu Thr Thr Phe Thr Gly Pro Lys Ser Ser Gln Glu Ala Gly
65 70 75 80
Ile Gly Ile Ile His Gln Glu Leu Asn Leu Ile Pro Gln Leu Thr Ile
85 90 95
Ala Glu Asn Ile Phe Leu Gly Arg Glu Phe Val Asn Arg Phe Gly Lys
100 105 110
Ile Asp Trp Lys Thr Met Tyr Ala Glu Ala Asp Lys Leu Leu Ala Lys
115 120 125
Leu Asn Leu Arg Phe Lys Ser Asp Lys Leu Val Gly Asp Leu Ser Ile
130 135 140
Gly Asp Gln Gln Met Val Glu Ile Ala Lys Val Leu Ser Phe Glu Ser
145 150 155 160
Lys Val Ile Ile Met Asp Glu Pro Thr Asp Ala Leu Thr Asp Thr Glu
165 170 175
Thr Glu Ser Leu Phe Arg Val Ile Arg Glu Leu Lys Ser Gln Gly Arg
180 185 190
Gly Ile Val Tyr Ile Ser His Arg Met Lys Glu Ile Phe Glu Ile Cys
195 200 205
Asp Asp Val Thr Val Phe Arg Asp Gly Gln Phe Ile Ala Glu Arg Glu
210 215 220
Val Ala Ser Leu Thr Glu Asp Ser Leu Ile Glu Met Met Val Gly Arg
225 230 235 240
Lys Leu Glu Asp Gln Tyr Pro His Leu Asp Lys Ala Pro Gly Asp Ile
245 250 255
Arg Leu Lys Val Asp Asn Leu Cys Gly Pro Gly Val Asn Asp Val Ser
260 265 270
Phe Thr Leu Arg Lys Gly Glu Ile Leu Gly Val Ser Gly Leu Met Gly
275 280 285
Ala Gly Arg Thr Glu Leu Met Lys Val Leu Tyr Gly Ala Leu Pro Arg
290 295 300
Thr Ser Gly Tyr Val Thr Leu Asp Gly His Glu Val Val Thr Arg Ser
305 310 315 320
Pro Gln Asp Gly Leu Ala Asn Gly Ile Val Tyr Ile Ser Glu Asp Arg
325 330 335
Lys Arg Asp Gly Leu Val Leu Gly Met Ser Val Lys Glu Asn Met Ser
340 345 350
Leu Thr Ala Leu Arg Tyr Phe Ser Arg Ala Gly Gly Ser Leu Lys His
355 360 365
Ala Asp Glu Gln Gln Ala Val Ser Asp Phe Ile Arg Leu Phe Asn Val
370 375 380
Lys Thr Pro Ser Met Glu Gln Ala Ile Gly Leu Leu Ser Gly Gly Asn
385 390 395 400
Gln Gln Lys Val Ala Ile Ala Arg Gly Leu Met Thr Arg Pro Lys Val
405 410 415
Leu Ile Leu Asp Glu Pro Thr Arg Gly Val Asp Val Gly Ala Lys Lys
420 425 430
Glu Ile Tyr Gln Leu Ile Asn Gln Phe Lys Ala Asp Gly Leu Ser Ile
435 440 445
Ile Leu Val Ser Ser Glu Met Pro Glu Val Leu Gly Met Ser Asp Arg
450 455 460
Ile Ile Val Met His Glu Gly His Leu Ser Gly Glu Phe Thr Arg Glu
465 470 475 480
Gln Ala Thr Gln Glu Val Leu Met Ala Ala Ala Val Gly Lys Leu Asn
485 490 495
Arg Val Asn Gln Glu
500
<210> 38
<211> 296
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 38
Met Asn Met Lys Lys Leu Ala Thr Leu Val Ser Ala Val Ala Leu Ser
1 5 10 15
Ala Thr Val Ser Ala Asn Ala Met Ala Lys Asp Thr Ile Ala Leu Val
20 25 30
Val Ser Thr Leu Asn Asn Pro Phe Phe Val Ser Leu Lys Asp Gly Ala
35 40 45
Gln Lys Glu Ala Asp Lys Leu Gly Tyr Asn Leu Val Val Leu Asp Ser
50 55 60
Gln Asn Asn Pro Ala Lys Glu Leu Ala Asn Val Gln Asp Leu Thr Val
65 70 75 80
Arg Gly Thr Lys Ile Leu Leu Ile Asn Pro Thr Asp Ser Asp Ala Val
85 90 95
Gly Asn Ala Val Lys Met Ala Asn Gln Ala Asn Ile Pro Val Ile Thr
100 105 110
Leu Asp Arg Gln Ala Thr Lys Gly Glu Val Val Ser His Ile Ala Ser
115 120 125
Asp Asn Val Leu Gly Gly Lys Ile Ala Gly Asp Tyr Ile Ala Lys Lys
130 135 140
Ala Gly Glu Gly Ala Lys Val Ile Glu Leu Gln Gly Ile Ala Gly Thr
145 150 155 160
Ser Ala Ala Arg Glu Arg Gly Glu Gly Phe Gln Gln Ala Val Ala Ala
165 170 175
His Lys Phe Asn Val Leu Ala Ser Gln Pro Ala Asp Phe Asp Arg Ile
180 185 190
Lys Gly Leu Asn Val Met Gln Asn Leu Leu Thr Ala His Pro Asp Val
195 200 205
Gln Ala Val Phe Ala Gln Asn Asp Glu Met Ala Leu Gly Ala Leu Arg
210 215 220
Ala Leu Gln Thr Ala Gly Lys Ser Asp Val Met Val Val Gly Phe Asp
225 230 235 240
Gly Thr Pro Asp Gly Glu Lys Ala Val Asn Asp Gly Lys Leu Ala Ala
245 250 255
Thr Ile Ala Gln Leu Pro Asp Gln Ile Gly Ala Lys Gly Val Glu Thr
260 265 270
Ala Asp Lys Val Leu Lys Gly Glu Lys Val Gln Ala Lys Tyr Pro Val
275 280 285
Asp Leu Lys Leu Val Val Lys Gln
290 295
<210> 39
<211> 321
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 39
Met Thr Thr Gln Thr Val Ser Gly Arg Arg Tyr Phe Thr Lys Ala Trp
1 5 10 15
Leu Met Glu Gln Lys Ser Leu Ile Ala Leu Leu Val Leu Ile Ala Ile
20 25 30
Val Ser Thr Leu Ser Pro Asn Phe Phe Thr Ile Asn Asn Leu Phe Asn
35 40 45
Ile Leu Gln Gln Thr Ser Val Asn Ala Ile Met Ala Val Gly Met Thr
50 55 60
Leu Val Ile Leu Thr Ser Gly Ile Asp Leu Ser Val Gly Ser Leu Leu
65 70 75 80
Ala Leu Thr Gly Ala Val Ala Ala Ser Ile Val Gly Ile Glu Val Asn
85 90 95
Ala Leu Val Ala Val Ala Ala Ala Leu Ala Leu Gly Ala Ala Ile Gly
100 105 110
Ala Val Thr Gly Val Ile Val Ala Lys Gly Arg Val Gln Ala Phe Ile
115 120 125
Ala Thr Leu Val Met Met Leu Leu Leu Arg Gly Val Thr Met Val Tyr
130 135 140
Thr Asn Gly Ser Pro Val Asn Thr Gly Phe Thr Glu Asn Ala Asp Leu
145 150 155 160
Phe Gly Trp Phe Gly Ile Gly Arg Pro Leu Gly Val Pro Thr Pro Val
165 170 175
Trp Ile Met Gly Ile Val Phe Leu Ala Ala Trp Tyr Met Leu His His
180 185 190
Thr Arg Leu Gly Arg Tyr Ile Tyr Ala Leu Gly Gly Asn Glu Ala Ala
195 200 205
Thr Arg Leu Ser Gly Ile Asn Val Asn Lys Ile Lys Ile Ile Val Tyr
210 215 220
Ser Leu Cys Gly Leu Leu Ala Ser Leu Ala Gly Ile Ile Glu Val Ala
225 230 235 240
Arg Leu Ser Ser Ala Gln Pro Thr Ala Gly Thr Gly Tyr Glu Leu Asp
245 250 255
Ala Ile Ala Ala Val Val Leu Gly Gly Thr Ser Leu Ala Gly Gly Lys
260 265 270
Gly Arg Ile Val Gly Thr Leu Ile Gly Ala Leu Ile Leu Gly Phe Leu
275 280 285
Asn Asn Gly Leu Asn Leu Leu Gly Val Ser Ser Tyr Tyr Gln Met Ile
290 295 300
Val Lys Ala Val Val Ile Leu Leu Ala Val Leu Val Asp Asn Lys Lys
305 310 315 320
Gln
<210> 40
<211> 1533
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 40
atggccacgc catatatatc gatggcgggg atcggcaagt cctttggtcc ggttcacgca 60
ttaaagtcgg ttaatttaac ggtttatcct ggtgaaatac atgcattact aggagaaaat 120
ggcgcgggta aatccacgct aatgaaagtt ttatccggaa tacatgagcc gaccaaaggc 180
accattacca ttaataacat tagctataac aagctggatc ataaattagc ggcacaactc 240
ggtatcggga ttatttatca ggaactcagc gttattgatg aattaaccgt actggaaaat 300
ttatatattg gtcgtcatct gacgaaaaaa atctgtggcg tcaatattat cgactggcga 360
gaaatgcgtg tccgcgccgc catgatgtta ttacgcgtgg gcttgaaagt tgatctagat 420
gagaaagtgg cgaatttatc tatcagccac aagcagatgc tagaaattgc caaaacgctg 480
atgctcgatg ccaaagtcat catcatggat gaacccacct cctcactcac caataaagag 540
gtggactatc tgtttctgat catgaatcag ttgcgtaaag agggtacggc catcgtctat 600
atctcgcata agttggcgga aattcgccgt atttgcgacc gctatacggt gatgaaagac 660
ggcagcagcg tttgcagcgg catagtaagc gatgtgtcaa atgacgatat cgtccgtctg 720
atggtaggcc gcgaactgca aaaccgtttt aacgcgatga aggagaatgt cagcaacctt 780
gcgcacgaaa cggtttttga ggtgcggaac gtcaccagtc gtgacagaaa aaaggtccgg 840
gatatctcat ttagcgtctg ccggggagaa atattaggct ttgccggact ggtcggttcc 900
ggacgtactg aactgatgaa ttgtctgttt ggcgtggata aacgcgctgg cggagaaatc 960
cgtcttaatg gcaaagatat ctctccacgt tcacccctgg atgccgtgaa aaaagggatg 1020
gcttacatca ctgaaagccg ccgggataac ggttttttcc ccaacttttc catcgctcag 1080
aacatggcga tcagccgcag tctgaaagac ggcggctata aaggcgcgat gggcttgttt 1140
catgaagttg acgagcaacg taccgctgaa aatcaacgcg aactgctggc gctgaaatgt 1200
cattcggtaa accagaatat caccgaactc tccgggggaa atcagcagaa agtcctgatc 1260
tccaaatggc tgtgctgttg cccggaagtg attattttcg atgaacctac ccgcggcatc 1320
gacgttggcg cgaaagccga aatttacaaa gtgatgcgcc aactggcgga cgacggaaaa 1380
gtcatcctga tggtgtcatc tgaactacct gaaattatca ccgtctgcga ccgcatcgcc 1440
gtgttctgcg aaggacgact gacgcaaatc ctgacgaatc gcgatgacat gagcgaagag 1500
gagattatgg catgggcttt accacaagag taa 1533
<210> 41
<211> 936
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 41
atgaataaat atctgaaata tttcagcggc acactcgtgg gcttaatgtt gtcaaccagc 60
gcttttgctg ccgccgaata tgctgtcgta ttgaaaaccc tctccaaccc attttgggta 120
gatatgaaaa aaggcattga agatgaagca aaaacactgg gcgtcagcgt tgatattttt 180
gcctctcctt cagaaggcga ttttcaatct caattgcagt tatttgaaga tctcagtaat 240
aaaaattaca aaggtatcgc cttcgctcca ttatcctcag tgaatctggt catgcctgtc 300
gcccgcgcat ggaaaaaagg catttatctg gttaatctcg atgaaaaaat cgacatggat 360
aatctgaaaa aagctggcgg caatgtggaa gcttttgtca ccaccgataa cgttgctgtc 420
ggggcgaaag gcgcgtcgtt cattattgac aaattgggcg ctgaaggtgg tgaagtcgca 480
atcattgagg gtaaagccgg taacgcctcc ggtgaagcgc gtcgtaatgg tgccaccgaa 540
gccttcaaaa aagcaagcca gatcaagctt gtcgccagcc agcctgccga ctgggaccgc 600
attaaagcac tggatgtcgc cactaacgtg ttgcaacgta atccgaatat taaagcgatc 660
tattgcgcga atgacacgat ggcaatgggt gttgctcagg cagtcgcaaa cgccggaaaa 720
acgggaaaag tgctggtcgt cggtacagat ggcattccgg aagcccgcaa aatggtggaa 780
gccggacaaa tgaccgcgac ggttgcccag aacccggcgg atatcggcgc aacgggtctg 840
aagctgatgg ttgacgctga gaaatccggc aaggttatcc cgctggataa agcaccggaa 900
tttaaactgg tcgattcaat cctggtcact caataa 936
<210> 42
<211> 981
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 42
atgggcttta ccacaagagt aaaaagcgaa gcgagcgaga agaaaccgtt caactttgcg 60
ctgttctggg ataaatacgg cacctttttt atcctggcga tcatcgtcgc catctttggt 120
tcgctgtcac cagaatattt tctgaccacc aataatatta cccagatttt tgttcaaagc 180
tccgtgacgg tattgatcgg catgggcgag tttttcgcta tcctggtcgc tggtatcgac 240
ctctcggttg gcgcgattct ggcgctttcc ggtatggtga ccgccaaact gatgttggca 300
ggtgttgacc cgtttctcgc agcgatgatt ggcggtgtac tggttggcgg cgcactgggg 360
gcgatcaacg gctgcctggt caactggacg gggctacacc cgttcatcat cacccttggc 420
accaacgcga ttttccgtgg gatcacgctg gtgatctccg atgccaactc ggtatacggc 480
ttctcatttg acttcgtgaa cttctttgcc gccagcgtaa ttgggatacc tgtccccgtt 540
atcttctcac taattgtcgc gctcatcctt tggtttctga caacgcgtat gcggctcggg 600
cgcaacatct acgcactggg cggcaacaaa aattcggcgt tctattccgg gattgacgtg 660
aaattccaca tcctggtggt gtttatcatc tccggtgttt gtgcaggtct ggcaggcgtc 720
gtctcaactg cacgactcgg tgccgcagaa ccgcttgccg gtatgggttt tgaaacctat 780
gccattgcca gcgccatcat tggcggcacc agtttcttcg gcggcaaggg gcgcattttc 840
tctgtggtga ttggcgggtt gatcatcggc accatcaaca acggtctgaa tattttgcag 900
gtacaaacct attaccaact ggtggtgatg ggcggattaa ttatcgcggc tgtcgccctt 960
gaccgtctta tcagtaagta a 981
<210> 43
<211> 510
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 43
Met Ala Thr Pro Tyr Ile Ser Met Ala Gly Ile Gly Lys Ser Phe Gly
1 5 10 15
Pro Val His Ala Leu Lys Ser Val Asn Leu Thr Val Tyr Pro Gly Glu
20 25 30
Ile His Ala Leu Leu Gly Glu Asn Gly Ala Gly Lys Ser Thr Leu Met
35 40 45
Lys Val Leu Ser Gly Ile His Glu Pro Thr Lys Gly Thr Ile Thr Ile
50 55 60
Asn Asn Ile Ser Tyr Asn Lys Leu Asp His Lys Leu Ala Ala Gln Leu
65 70 75 80
Gly Ile Gly Ile Ile Tyr Gln Glu Leu Ser Val Ile Asp Glu Leu Thr
85 90 95
Val Leu Glu Asn Leu Tyr Ile Gly Arg His Leu Thr Lys Lys Ile Cys
100 105 110
Gly Val Asn Ile Ile Asp Trp Arg Glu Met Arg Val Arg Ala Ala Met
115 120 125
Met Leu Leu Arg Val Gly Leu Lys Val Asp Leu Asp Glu Lys Val Ala
130 135 140
Asn Leu Ser Ile Ser His Lys Gln Met Leu Glu Ile Ala Lys Thr Leu
145 150 155 160
Met Leu Asp Ala Lys Val Ile Ile Met Asp Glu Pro Thr Ser Ser Leu
165 170 175
Thr Asn Lys Glu Val Asp Tyr Leu Phe Leu Ile Met Asn Gln Leu Arg
180 185 190
Lys Glu Gly Thr Ala Ile Val Tyr Ile Ser His Lys Leu Ala Glu Ile
195 200 205
Arg Arg Ile Cys Asp Arg Tyr Thr Val Met Lys Asp Gly Ser Ser Val
210 215 220
Cys Ser Gly Ile Val Ser Asp Val Ser Asn Asp Asp Ile Val Arg Leu
225 230 235 240
Met Val Gly Arg Glu Leu Gln Asn Arg Phe Asn Ala Met Lys Glu Asn
245 250 255
Val Ser Asn Leu Ala His Glu Thr Val Phe Glu Val Arg Asn Val Thr
260 265 270
Ser Arg Asp Arg Lys Lys Val Arg Asp Ile Ser Phe Ser Val Cys Arg
275 280 285
Gly Glu Ile Leu Gly Phe Ala Gly Leu Val Gly Ser Gly Arg Thr Glu
290 295 300
Leu Met Asn Cys Leu Phe Gly Val Asp Lys Arg Ala Gly Gly Glu Ile
305 310 315 320
Arg Leu Asn Gly Lys Asp Ile Ser Pro Arg Ser Pro Leu Asp Ala Val
325 330 335
Lys Lys Gly Met Ala Tyr Ile Thr Glu Ser Arg Arg Asp Asn Gly Phe
340 345 350
Phe Pro Asn Phe Ser Ile Ala Gln Asn Met Ala Ile Ser Arg Ser Leu
355 360 365
Lys Asp Gly Gly Tyr Lys Gly Ala Met Gly Leu Phe His Glu Val Asp
370 375 380
Glu Gln Arg Thr Ala Glu Asn Gln Arg Glu Leu Leu Ala Leu Lys Cys
385 390 395 400
His Ser Val Asn Gln Asn Ile Thr Glu Leu Ser Gly Gly Asn Gln Gln
405 410 415
Lys Val Leu Ile Ser Lys Trp Leu Cys Cys Cys Pro Glu Val Ile Ile
420 425 430
Phe Asp Glu Pro Thr Arg Gly Ile Asp Val Gly Ala Lys Ala Glu Ile
435 440 445
Tyr Lys Val Met Arg Gln Leu Ala Asp Asp Gly Lys Val Ile Leu Met
450 455 460
Val Ser Ser Glu Leu Pro Glu Ile Ile Thr Val Cys Asp Arg Ile Ala
465 470 475 480
Val Phe Cys Glu Gly Arg Leu Thr Gln Ile Leu Thr Asn Arg Asp Asp
485 490 495
Met Ser Glu Glu Glu Ile Met Ala Trp Ala Leu Pro Gln Glu
500 505 510
<210> 44
<211> 311
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 44
Met Asn Lys Tyr Leu Lys Tyr Phe Ser Gly Thr Leu Val Gly Leu Met
1 5 10 15
Leu Ser Thr Ser Ala Phe Ala Ala Ala Glu Tyr Ala Val Val Leu Lys
20 25 30
Thr Leu Ser Asn Pro Phe Trp Val Asp Met Lys Lys Gly Ile Glu Asp
35 40 45
Glu Ala Lys Thr Leu Gly Val Ser Val Asp Ile Phe Ala Ser Pro Ser
50 55 60
Glu Gly Asp Phe Gln Ser Gln Leu Gln Leu Phe Glu Asp Leu Ser Asn
65 70 75 80
Lys Asn Tyr Lys Gly Ile Ala Phe Ala Pro Leu Ser Ser Val Asn Leu
85 90 95
Val Met Pro Val Ala Arg Ala Trp Lys Lys Gly Ile Tyr Leu Val Asn
100 105 110
Leu Asp Glu Lys Ile Asp Met Asp Asn Leu Lys Lys Ala Gly Gly Asn
115 120 125
Val Glu Ala Phe Val Thr Thr Asp Asn Val Ala Val Gly Ala Lys Gly
130 135 140
Ala Ser Phe Ile Ile Asp Lys Leu Gly Ala Glu Gly Gly Glu Val Ala
145 150 155 160
Ile Ile Glu Gly Lys Ala Gly Asn Ala Ser Gly Glu Ala Arg Arg Asn
165 170 175
Gly Ala Thr Glu Ala Phe Lys Lys Ala Ser Gln Ile Lys Leu Val Ala
180 185 190
Ser Gln Pro Ala Asp Trp Asp Arg Ile Lys Ala Leu Asp Val Ala Thr
195 200 205
Asn Val Leu Gln Arg Asn Pro Asn Ile Lys Ala Ile Tyr Cys Ala Asn
210 215 220
Asp Thr Met Ala Met Gly Val Ala Gln Ala Val Ala Asn Ala Gly Lys
225 230 235 240
Thr Gly Lys Val Leu Val Val Gly Thr Asp Gly Ile Pro Glu Ala Arg
245 250 255
Lys Met Val Glu Ala Gly Gln Met Thr Ala Thr Val Ala Gln Asn Pro
260 265 270
Ala Asp Ile Gly Ala Thr Gly Leu Lys Leu Met Val Asp Ala Glu Lys
275 280 285
Ser Gly Lys Val Ile Pro Leu Asp Lys Ala Pro Glu Phe Lys Leu Val
290 295 300
Asp Ser Ile Leu Val Thr Gln
305 310
<210> 45
<211> 326
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 45
Met Gly Phe Thr Thr Arg Val Lys Ser Glu Ala Ser Glu Lys Lys Pro
1 5 10 15
Phe Asn Phe Ala Leu Phe Trp Asp Lys Tyr Gly Thr Phe Phe Ile Leu
20 25 30
Ala Ile Ile Val Ala Ile Phe Gly Ser Leu Ser Pro Glu Tyr Phe Leu
35 40 45
Thr Thr Asn Asn Ile Thr Gln Ile Phe Val Gln Ser Ser Val Thr Val
50 55 60
Leu Ile Gly Met Gly Glu Phe Phe Ala Ile Leu Val Ala Gly Ile Asp
65 70 75 80
Leu Ser Val Gly Ala Ile Leu Ala Leu Ser Gly Met Val Thr Ala Lys
85 90 95
Leu Met Leu Ala Gly Val Asp Pro Phe Leu Ala Ala Met Ile Gly Gly
100 105 110
Val Leu Val Gly Gly Ala Leu Gly Ala Ile Asn Gly Cys Leu Val Asn
115 120 125
Trp Thr Gly Leu His Pro Phe Ile Ile Thr Leu Gly Thr Asn Ala Ile
130 135 140
Phe Arg Gly Ile Thr Leu Val Ile Ser Asp Ala Asn Ser Val Tyr Gly
145 150 155 160
Phe Ser Phe Asp Phe Val Asn Phe Phe Ala Ala Ser Val Ile Gly Ile
165 170 175
Pro Val Pro Val Ile Phe Ser Leu Ile Val Ala Leu Ile Leu Trp Phe
180 185 190
Leu Thr Thr Arg Met Arg Leu Gly Arg Asn Ile Tyr Ala Leu Gly Gly
195 200 205
Asn Lys Asn Ser Ala Phe Tyr Ser Gly Ile Asp Val Lys Phe His Ile
210 215 220
Leu Val Val Phe Ile Ile Ser Gly Val Cys Ala Gly Leu Ala Gly Val
225 230 235 240
Val Ser Thr Ala Arg Leu Gly Ala Ala Glu Pro Leu Ala Gly Met Gly
245 250 255
Phe Glu Thr Tyr Ala Ile Ala Ser Ala Ile Ile Gly Gly Thr Ser Phe
260 265 270
Phe Gly Gly Lys Gly Arg Ile Phe Ser Val Val Ile Gly Gly Leu Ile
275 280 285
Ile Gly Thr Ile Asn Asn Gly Leu Asn Ile Leu Gln Val Gln Thr Tyr
290 295 300
Tyr Gln Leu Val Val Met Gly Gly Leu Ile Ile Ala Ala Val Ala Leu
305 310 315 320
Asp Arg Leu Ile Ser Lys
325
<210> 46
<211> 1419
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 46
atggttacta tcaatacgga atctgcttta acgccacgtt ctttgcggga tacgcggcgt 60
atgaatatgt ttgtttcggt agctgctgcg gtcgcaggat tgttatttgg tcttgatatc 120
ggcgtaatcg ccggagcgtt gccgttcatt accgatcact ttgtgctgac cagtcgtttg 180
caggaatggg tggttagtag catgatgctc ggtgcagcaa ttggtgcgct gtttaatggt 240
tggctgtcgt tccgcctggg gcgtaaatac agcctgatgg cgggggccat cctgtttgta 300
ctcggttcta tagggtccgc ttttgcgacc agcgtagaga tgttaatcgc cgctcgtgtg 360
gtgctgggca ttgctgtcgg gatcgcgtct tacaccgctc ctctgtatct ttctgaaatg 420
gcaagtgaaa acgttcgcgg taagatgatc agtatgtacc agttgatggt cacactcggc 480
atcgtgctgg cgtttttatc cgatacagcg ttcagttata gcggtaactg gcgcgcaatg 540
ttgggggttc ttgctttacc agcagttctg ctgattattc tggtagtctt cctgccaaat 600
agcccgcgct ggctggcgga aaaggggcgt catattgagg cggaagaagt attgcgtatg 660
ctgcgcgata cgtcggaaaa agcgcgagaa gaactcaacg aaattcgtga aagcctgaag 720
ttaaaacagg gcggttgggc actgtttaag atcaaccgta acgtccgtcg tgctgtgttt 780
ctcggtatgt tgttgcaggc gatgcagcag tttaccggta tgaacatcat catgtactac 840
gcgccgcgta tcttcaaaat ggcgggcttt acgaccacag aacaacagat gattgcgact 900
ctggtcgtag ggctgacctt tatgttcgcc acctttattg cggtgtttac ggtagataaa 960
gcagggcgta aaccggctct gaaaattggt ttcagcgtga tggcgttagg cactctggtg 1020
ctgggctatt gcctgatgca gtttgataac ggtacggctt ccagtggctt gtcctggctc 1080
tctgttggca tgacgatgat gtgtattgcc ggttatgcga tgagcgccgc gccagtggtg 1140
tggatcctgt gctctgaaat tcagccgctg aaatgccgcg atttcggtat tacctgttcg 1200
accaccacga actgggtgtc gaatatgatt atcggcgcga ccttcctgac actgcttgat 1260
agcattggcg ctgccggtac gttctggctc tacactgcgc tgaacattgc gtttgtgggc 1320
attactttct ggctcattcc ggaaaccaaa aatgtcacgc tggaacatat cgaacgcaaa 1380
ctgatggcag gcgagaagtt gagaaatatc ggcgtctga 1419
<210> 47
<211> 472
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 47
Met Val Thr Ile Asn Thr Glu Ser Ala Leu Thr Pro Arg Ser Leu Arg
1 5 10 15
Asp Thr Arg Arg Met Asn Met Phe Val Ser Val Ala Ala Ala Val Ala
20 25 30
Gly Leu Leu Phe Gly Leu Asp Ile Gly Val Ile Ala Gly Ala Leu Pro
35 40 45
Phe Ile Thr Asp His Phe Val Leu Thr Ser Arg Leu Gln Glu Trp Val
50 55 60
Val Ser Ser Met Met Leu Gly Ala Ala Ile Gly Ala Leu Phe Asn Gly
65 70 75 80
Trp Leu Ser Phe Arg Leu Gly Arg Lys Tyr Ser Leu Met Ala Gly Ala
85 90 95
Ile Leu Phe Val Leu Gly Ser Ile Gly Ser Ala Phe Ala Thr Ser Val
100 105 110
Glu Met Leu Ile Ala Ala Arg Val Val Leu Gly Ile Ala Val Gly Ile
115 120 125
Ala Ser Tyr Thr Ala Pro Leu Tyr Leu Ser Glu Met Ala Ser Glu Asn
130 135 140
Val Arg Gly Lys Met Ile Ser Met Tyr Gln Leu Met Val Thr Leu Gly
145 150 155 160
Ile Val Leu Ala Phe Leu Ser Asp Thr Ala Phe Ser Tyr Ser Gly Asn
165 170 175
Trp Arg Ala Met Leu Gly Val Leu Ala Leu Pro Ala Val Leu Leu Ile
180 185 190
Ile Leu Val Val Phe Leu Pro Asn Ser Pro Arg Trp Leu Ala Glu Lys
195 200 205
Gly Arg His Ile Glu Ala Glu Glu Val Leu Arg Met Leu Arg Asp Thr
210 215 220
Ser Glu Lys Ala Arg Glu Glu Leu Asn Glu Ile Arg Glu Ser Leu Lys
225 230 235 240
Leu Lys Gln Gly Gly Trp Ala Leu Phe Lys Ile Asn Arg Asn Val Arg
245 250 255
Arg Ala Val Phe Leu Gly Met Leu Leu Gln Ala Met Gln Gln Phe Thr
260 265 270
Gly Met Asn Ile Ile Met Tyr Tyr Ala Pro Arg Ile Phe Lys Met Ala
275 280 285
Gly Phe Thr Thr Thr Glu Gln Gln Met Ile Ala Thr Leu Val Val Gly
290 295 300
Leu Thr Phe Met Phe Ala Thr Phe Ile Ala Val Phe Thr Val Asp Lys
305 310 315 320
Ala Gly Arg Lys Pro Ala Leu Lys Ile Gly Phe Ser Val Met Ala Leu
325 330 335
Gly Thr Leu Val Leu Gly Tyr Cys Leu Met Gln Phe Asp Asn Gly Thr
340 345 350
Ala Ser Ser Gly Leu Ser Trp Leu Ser Val Gly Met Thr Met Met Cys
355 360 365
Ile Ala Gly Tyr Ala Met Ser Ala Ala Pro Val Val Trp Ile Leu Cys
370 375 380
Ser Glu Ile Gln Pro Leu Lys Cys Arg Asp Phe Gly Ile Thr Cys Ser
385 390 395 400
Thr Thr Thr Asn Trp Val Ser Asn Met Ile Ile Gly Ala Thr Phe Leu
405 410 415
Thr Leu Leu Asp Ser Ile Gly Ala Ala Gly Thr Phe Trp Leu Tyr Thr
420 425 430
Ala Leu Asn Ile Ala Phe Val Gly Ile Thr Phe Trp Leu Ile Pro Glu
435 440 445
Thr Lys Asn Val Thr Leu Glu His Ile Glu Arg Lys Leu Met Ala Gly
450 455 460
Glu Lys Leu Arg Asn Ile Gly Val
465 470
<210> 48
<211> 1476
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 48
atgaataccc agtataattc cagttatata ttttcgatta ccttagtcgc tacattaggt 60
ggtttattat ttggctacga caccgccgtt atttccggta ctgttgagtc actcaatacc 120
gtctttgttg ctccacaaaa cttaagtgaa tccgctgcca actccctgtt agggttttgc 180
gtggccagcg ctctgattgg ttgcatcatc ggcggtgccc tcggtggtta ttgcagtaac 240
cgcttcggtc gtcgtgattc acttaagatt gctgctgtcc tgttttttat ttctggtgta 300
ggttctgcct ggccagaact tggttttacc tctataaacc cggacaacac tgtgcctgtt 360
tatctggcag gttatgtccc ggaatttgtt atttatcgca ttattggcgg tattggcgtt 420
ggtttagcct caatgctctc gccaatgtat attgcggaac tggctccagc tcatattcgc 480
gggaaactgg tctcttttaa ccagtttgcg attattttcg ggcaactttt agtttactgc 540
gtaaactatt ttattgcccg ttccggtgat gccagctggc tgaatactga cggctggcgt 600
tatatgtttg cctcggaatg tatccctgca ctgctgttct taatgctgct gtataccgtg 660
ccagaaagtc ctcgctggct gatgtcgcgc ggcaagcaag aacaggcgga aggtatcctg 720
cgcaaaatta tgggcaacac gcttgcaact caggcagtac aggaaattaa acactccctg 780
gatcatggcc gcaaaaccgg tggtcgtctg ctgatgtttg gcgtgggcgt gattgtaatc 840
ggcgtaatgc tctccatctt ccagcaattt gtcggcatca atgtggtgct gtactacgcg 900
ccggaagtgt tcaaaacgct gggggccagc acggatatcg cgctgttgca gaccattatt 960
gtcggagtta tcaacctcac cttcaccgtt ctggcaatta tgacggtgga taaatttggt 1020
cgtaagccac tgcaaattat cggcgcactc ggaatggcaa tcggtatgtt tagcctcggt 1080
accgcgtttt acactcaggc accgggtatt gtggcgctac tgtcgatgct gttctatgtt 1140
gccgcctttg ccatgtcctg gggtccggta tgctgggtac tgctgtcgga aatcttcccg 1200
aatgctattc gtggtaaagc gctggcaatc gcggtggcgg cccagtggct ggcgaactac 1260
ttcgtctcct ggaccttccc gatgatggac aaaaactcct ggctggtggc ccatttccac 1320
aacggtttct cctactggat ttacggttgt atgggcgttc tggcagcact gtttatgtgg 1380
aaatttgtcc cggaaaccaa aggtaaaacc cttgaggagc tggaagcgct ctgggaaccg 1440
gaaacgaaga aaacacaaca aactgctacg ctgtaa 1476
<210> 49
<211> 491
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 49
Met Asn Thr Gln Tyr Asn Ser Ser Tyr Ile Phe Ser Ile Thr Leu Val
1 5 10 15
Ala Thr Leu Gly Gly Leu Leu Phe Gly Tyr Asp Thr Ala Val Ile Ser
20 25 30
Gly Thr Val Glu Ser Leu Asn Thr Val Phe Val Ala Pro Gln Asn Leu
35 40 45
Ser Glu Ser Ala Ala Asn Ser Leu Leu Gly Phe Cys Val Ala Ser Ala
50 55 60
Leu Ile Gly Cys Ile Ile Gly Gly Ala Leu Gly Gly Tyr Cys Ser Asn
65 70 75 80
Arg Phe Gly Arg Arg Asp Ser Leu Lys Ile Ala Ala Val Leu Phe Phe
85 90 95
Ile Ser Gly Val Gly Ser Ala Trp Pro Glu Leu Gly Phe Thr Ser Ile
100 105 110
Asn Pro Asp Asn Thr Val Pro Val Tyr Leu Ala Gly Tyr Val Pro Glu
115 120 125
Phe Val Ile Tyr Arg Ile Ile Gly Gly Ile Gly Val Gly Leu Ala Ser
130 135 140
Met Leu Ser Pro Met Tyr Ile Ala Glu Leu Ala Pro Ala His Ile Arg
145 150 155 160
Gly Lys Leu Val Ser Phe Asn Gln Phe Ala Ile Ile Phe Gly Gln Leu
165 170 175
Leu Val Tyr Cys Val Asn Tyr Phe Ile Ala Arg Ser Gly Asp Ala Ser
180 185 190
Trp Leu Asn Thr Asp Gly Trp Arg Tyr Met Phe Ala Ser Glu Cys Ile
195 200 205
Pro Ala Leu Leu Phe Leu Met Leu Leu Tyr Thr Val Pro Glu Ser Pro
210 215 220
Arg Trp Leu Met Ser Arg Gly Lys Gln Glu Gln Ala Glu Gly Ile Leu
225 230 235 240
Arg Lys Ile Met Gly Asn Thr Leu Ala Thr Gln Ala Val Gln Glu Ile
245 250 255
Lys His Ser Leu Asp His Gly Arg Lys Thr Gly Gly Arg Leu Leu Met
260 265 270
Phe Gly Val Gly Val Ile Val Ile Gly Val Met Leu Ser Ile Phe Gln
275 280 285
Gln Phe Val Gly Ile Asn Val Val Leu Tyr Tyr Ala Pro Glu Val Phe
290 295 300
Lys Thr Leu Gly Ala Ser Thr Asp Ile Ala Leu Leu Gln Thr Ile Ile
305 310 315 320
Val Gly Val Ile Asn Leu Thr Phe Thr Val Leu Ala Ile Met Thr Val
325 330 335
Asp Lys Phe Gly Arg Lys Pro Leu Gln Ile Ile Gly Ala Leu Gly Met
340 345 350
Ala Ile Gly Met Phe Ser Leu Gly Thr Ala Phe Tyr Thr Gln Ala Pro
355 360 365
Gly Ile Val Ala Leu Leu Ser Met Leu Phe Tyr Val Ala Ala Phe Ala
370 375 380
Met Ser Trp Gly Pro Val Cys Trp Val Leu Leu Ser Glu Ile Phe Pro
385 390 395 400
Asn Ala Ile Arg Gly Lys Ala Leu Ala Ile Ala Val Ala Ala Gln Trp
405 410 415
Leu Ala Asn Tyr Phe Val Ser Trp Thr Phe Pro Met Met Asp Lys Asn
420 425 430
Ser Trp Leu Val Ala His Phe His Asn Gly Phe Ser Tyr Trp Ile Tyr
435 440 445
Gly Cys Met Gly Val Leu Ala Ala Leu Phe Met Trp Lys Phe Val Pro
450 455 460
Glu Thr Lys Gly Lys Thr Leu Glu Glu Leu Glu Ala Leu Trp Glu Pro
465 470 475 480
Glu Thr Lys Lys Thr Gln Gln Thr Ala Thr Leu
485 490
<210> 50
<211> 1095
<212> DNA
<213> 智人(Homo sapiens)
<400> 50
atggcgcacc gttttccggc gctgacccaa gagcagaaga aggagctgag cgagattgcg 60
cagagcatcg tggcgaatgg taaaggtatt ctggcggcgg atgagagcgt tggtaccatg 120
ggcaaccgtc tgcagcgtat taaggtggag aacaccgagg aaaaccgtcg tcaattccgt 180
gaaatcctgt ttagcgttga tagcagcatc aaccagagca ttggtggcgt gatcctgttc 240
cacgaaaccc tgtaccagaa ggacagccaa ggtaaactgt ttcgtaacat tctgaaggaa 300
aaaggtattg tggttggcat caagctggat caaggtggcg cgccgctggc gggcaccaac 360
aaggaaacca ccatccaggg tctggacggc ctgagcgaac gttgcgcgca atataagaaa 420
gatggtgttg acttcggcaa gtggcgtgcg gtgctgcgta ttgcggacca gtgcccgagc 480
agcctggcga tccaagaaaa cgcgaacgcg ctggcgcgtt acgcgagcat ctgccagcaa 540
aacggtctgg tgccgattgt tgagccggaa gttatcccgg acggcgatca cgacctggag 600
cactgccagt atgtgaccga aaaggttctg gcggcggtgt acaaagcgct gaacgatcac 660
cacgtttatc tggagggtac cctgctgaaa ccgaacatgg tgaccgcggg ccatgcgtgc 720
accaagaaat acaccccgga acaggtggcg atggcgaccg tgaccgcgct gcaccgtacc 780
gttccggcgg cggtgccggg tatttgcttt ctgagcggtg gcatgagcga agaggacgcg 840
accctgaacc tgaacgcgat caacctgtgc ccgctgccga agccgtggaa actgagcttc 900
agctacggcc gtgcgctgca ggcgagcgcg ctggcggcgt ggggtggcaa ggcggcgaac 960
aaagaggcga cccaagaagc gtttatgaag cgtgcgatgg cgaactgcca ggcggcgaaa 1020
ggtcaatatg tgcataccgg cagcagcggt gcggcgagca cccagagcct gtttaccgcg 1080
tgctatacct attaa 1095
<210> 51
<211> 364
<212> PRT
<213> 智人(Homo sapiens)
<400> 51
Met Ala His Arg Phe Pro Ala Leu Thr Gln Glu Gln Lys Lys Glu Leu
1 5 10 15
Ser Glu Ile Ala Gln Ser Ile Val Ala Asn Gly Lys Gly Ile Leu Ala
20 25 30
Ala Asp Glu Ser Val Gly Thr Met Gly Asn Arg Leu Gln Arg Ile Lys
35 40 45
Val Glu Asn Thr Glu Glu Asn Arg Arg Gln Phe Arg Glu Ile Leu Phe
50 55 60
Ser Val Asp Ser Ser Ile Asn Gln Ser Ile Gly Gly Val Ile Leu Phe
65 70 75 80
His Glu Thr Leu Tyr Gln Lys Asp Ser Gln Gly Lys Leu Phe Arg Asn
85 90 95
Ile Leu Lys Glu Lys Gly Ile Val Val Gly Ile Lys Leu Asp Gln Gly
100 105 110
Gly Ala Pro Leu Ala Gly Thr Asn Lys Glu Thr Thr Ile Gln Gly Leu
115 120 125
Asp Gly Leu Ser Glu Arg Cys Ala Gln Tyr Lys Lys Asp Gly Val Asp
130 135 140
Phe Gly Lys Trp Arg Ala Val Leu Arg Ile Ala Asp Gln Cys Pro Ser
145 150 155 160
Ser Leu Ala Ile Gln Glu Asn Ala Asn Ala Leu Ala Arg Tyr Ala Ser
165 170 175
Ile Cys Gln Gln Asn Gly Leu Val Pro Ile Val Glu Pro Glu Val Ile
180 185 190
Pro Asp Gly Asp His Asp Leu Glu His Cys Gln Tyr Val Thr Glu Lys
195 200 205
Val Leu Ala Ala Val Tyr Lys Ala Leu Asn Asp His His Val Tyr Leu
210 215 220
Glu Gly Thr Leu Leu Lys Pro Asn Met Val Thr Ala Gly His Ala Cys
225 230 235 240
Thr Lys Lys Tyr Thr Pro Glu Gln Val Ala Met Ala Thr Val Thr Ala
245 250 255
Leu His Arg Thr Val Pro Ala Ala Val Pro Gly Ile Cys Phe Leu Ser
260 265 270
Gly Gly Met Ser Glu Glu Asp Ala Thr Leu Asn Leu Asn Ala Ile Asn
275 280 285
Leu Cys Pro Leu Pro Lys Pro Trp Lys Leu Ser Phe Ser Tyr Gly Arg
290 295 300
Ala Leu Gln Ala Ser Ala Leu Ala Ala Trp Gly Gly Lys Ala Ala Asn
305 310 315 320
Lys Glu Ala Thr Gln Glu Ala Phe Met Lys Arg Ala Met Ala Asn Cys
325 330 335
Gln Ala Ala Lys Gly Gln Tyr Val His Thr Gly Ser Ser Gly Ala Ala
340 345 350
Ser Thr Gln Ser Leu Phe Thr Ala Cys Tyr Thr Tyr
355 360
<210> 52
<211> 1149
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 52
atggctaaca gaatgattct gaacgaaacg gcatggtttg gtcggggtgc tgttggggct 60
ttaaccgatg aggtgaaacg ccgtggttat cagaaggcgc tgatcgtcac cgataaaacg 120
ctggtgcaat gcggcgtggt ggcgaaagtg accgataaga tggatgctgc agggctggca 180
tgggcgattt acgacggcgt agtgcccaac ccaacaatta ctgtcgtcaa agaagggctc 240
ggtgtattcc agaatagcgg cgcggattac ctgatcgcta ttggtggtgg ttctccacag 300
gatacttgta aagcgattgg cattatcagc aacaacccgg agtttgccga tgtgcgtagc 360
ctggaagggc tttccccgac caataaaccc agtgtaccga ttctggcaat tcctaccaca 420
gcaggtactg cggcagaagt gaccattaac tacgtgatca ctgacgaaga gaaacggcgc 480
aagtttgttt gcgttgatcc gcatgatatc ccgcaggtgg cgtttattga cgctgacatg 540
atggatggta tgcctccagc gctgaaagct gcgacgggtg tcgatgcgct cactcatgct 600
attgaggggt atattacccg tggcgcgtgg gcgctaaccg atgcactgca cattaaagcg 660
attgaaatca ttgctggggc gctgcgagga tcggttgctg gtgataagga tgccggagaa 720
gaaatggcgc tcgggcagta tgttgcgggt atgggcttct cgaatgttgg gttagggttg 780
gtgcatggta tggcgcatcc actgggcgcg ttttataaca ctccacacgg tgttgcgaac 840
gccatcctgt taccgcatgt catgcgttat aacgctgact ttaccggtga gaagtaccgc 900
gatatcgcgc gcgttatggg cgtgaaagtg gaaggtatga gcctggaaga ggcgcgtaat 960
gccgctgttg aagcggtgtt tgctctcaac cgtgatgtcg gtattccgcc acatttgcgt 1020
gatgttggtg tacgcaagga agacattccg gcactggcgc aggcggcact ggatgatgtt 1080
tgtaccggtg gcaacccgcg tgaagcaacg cttgaggata ttgtagagct ttaccatacc 1140
gcctggtaa 1149
<210> 53
<211> 144
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> proD启动子
<400> 53
cacagctaac accacgtcgt ccctatctgc tgccctaggt ctatgagtgg ttgctggata 60
actttacggg catgcataag gctcgtataa tatattcagg gagtccacaa cggtttccct 120
ctacaaataa ttttgtttaa cttt 144
<210> 54
<211> 870
<212> DNA
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 54
atgacggcgc aagttacttg tgtgtgggac ctgaaagcca cattaggaga aggcccgatc 60
tggcatggtg atacattatg gtttgtcgat attaaacagc gtaaaatcca taactaccat 120
ccggccactg gggagcgctt cagcttcgac gcaccggacc aggtgacgtt ccttgcgccc 180
atcgtcggtg cgactggatt tgtcgtagga ttaaagacgg gcatccaccg tttccatcca 240
gcaacaggtt tttccctgtt gcttgaggta gaggacgccg ctttgaataa tcgtccgaac 300
gatgcgaccg tggatgcaca aggacgtttg tggtttggta cgatgcacga tggtgaagag 360
aataacagcg gctctttgta tcgtatggat ttgacgggag ttgcacgcat ggatcgtgat 420
atttgcatca caaacggacc gtgcgtttcc cctgacggta aaaccttcta tcatacggac 480
acgctggaaa agaccattta cgcgttcgat cttgcggaag acggtcttct gagcaataaa 540
cgcgtgtttg ttcaattcgc tctgggtgac gatgtctacc ctgacggctc tgtggtagat 600
agcgaaggtt atctgtggac cgcactgtgg ggagggtttg gcgcggtgcg tttcagcccg 660
cagggtgacg ctgtaacccg cattgaatta ccggctccga acgtgacgaa gccgtgcttt 720
gggggtccgg atctgaaaac gttgtatttc accaccgcgc gtaaaggatt atcagatgag 780
acccttgccc aatatccatt ggctggcggg gttttcgccg taccggtaga tgtcgctggt 840
caacctcaac acgaagtgcg tttagtttaa 870
<210> 55
<211> 289
<212> PRT
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 55
Met Thr Ala Gln Val Thr Cys Val Trp Asp Leu Lys Ala Thr Leu Gly
1 5 10 15
Glu Gly Pro Ile Trp His Gly Asp Thr Leu Trp Phe Val Asp Ile Lys
20 25 30
Gln Arg Lys Ile His Asn Tyr His Pro Ala Thr Gly Glu Arg Phe Ser
35 40 45
Phe Asp Ala Pro Asp Gln Val Thr Phe Leu Ala Pro Ile Val Gly Ala
50 55 60
Thr Gly Phe Val Val Gly Leu Lys Thr Gly Ile His Arg Phe His Pro
65 70 75 80
Ala Thr Gly Phe Ser Leu Leu Leu Glu Val Glu Asp Ala Ala Leu Asn
85 90 95
Asn Arg Pro Asn Asp Ala Thr Val Asp Ala Gln Gly Arg Leu Trp Phe
100 105 110
Gly Thr Met His Asp Gly Glu Glu Asn Asn Ser Gly Ser Leu Tyr Arg
115 120 125
Met Asp Leu Thr Gly Val Ala Arg Met Asp Arg Asp Ile Cys Ile Thr
130 135 140
Asn Gly Pro Cys Val Ser Pro Asp Gly Lys Thr Phe Tyr His Thr Asp
145 150 155 160
Thr Leu Glu Lys Thr Ile Tyr Ala Phe Asp Leu Ala Glu Asp Gly Leu
165 170 175
Leu Ser Asn Lys Arg Val Phe Val Gln Phe Ala Leu Gly Asp Asp Val
180 185 190
Tyr Pro Asp Gly Ser Val Val Asp Ser Glu Gly Tyr Leu Trp Thr Ala
195 200 205
Leu Trp Gly Gly Phe Gly Ala Val Arg Phe Ser Pro Gln Gly Asp Ala
210 215 220
Val Thr Arg Ile Glu Leu Pro Ala Pro Asn Val Thr Lys Pro Cys Phe
225 230 235 240
Gly Gly Pro Asp Leu Lys Thr Leu Tyr Phe Thr Thr Ala Arg Lys Gly
245 250 255
Leu Ser Asp Glu Thr Leu Ala Gln Tyr Pro Leu Ala Gly Gly Val Phe
260 265 270
Ala Val Pro Val Asp Val Ala Gly Gln Pro Gln His Glu Val Arg Leu
275 280 285
Val
<210> 56
<211> 885
<212> DNA
<213> 异种伯克霍尔德氏菌(Burkholderia xenovorans)
<400> 56
atgaaaatcc accctccggt ctgtgtctgg ccagttcacg cggagttggg ggaaggccct 60
ttgtggcagg cgggggaaaa cgcggtttat ttcgtggata ttaagggtcg tcaaattcac 120
cgtttaactg tgaccactgg ccaaacgcaa acctggaaag cgcctggaca gccagggttt 180
attgccccat tggccggtca tgggtttgtt tgtggtctgc cgggaggtct ttaccgcttt 240
gacgccgggt caggccaatt cagcaagctg aaagatgtag aagtacatct tccggggaat 300
cgcttaaacg acggcttcgt cgatgccagc gggcatttat ggtttggatc tatggatgat 360
ggagaagaac agcctagtgg aaccctgtac cgtgtcaatc atgcgggaga ggctgttgcc 420
caggatgacg gatatgtcat cacgaatggt cctgcaagtt caccggatgc ccgcacttta 480
tatcacggcg acactatgcg tcgcgttgtc tacgctttcg acctgggcga agatgggaca 540
cttagccgca agcgcatctt tgccgcgatc tcgggagatg gctatccaga tggcatggcc 600
gtggacgcgg acggattcct gtgggttgcg ctgttcggtg gatggcgtat tgaacgtttc 660
tccccggacg gaaaacgtgt cgagcaagtt ccgtttcctt gcgctaacgt gacgaaattg 720
gcattcggcg gcgacgattt acaaacggtc tatgcgtcaa ccgcctggaa gggtttgtct 780
cccgttgcgc gtcagcaaca gcccgacgca ggggggttat tcagctttcg ctccccggta 840
ccaggccagc cccaggcccg ttgcaaatgg ggcttcgctc agtaa 885
<210> 57
<211> 294
<212> PRT
<213> 异种伯克霍尔德氏菌(Burkholderia xenovorans)
<400> 57
Met Lys Ile His Pro Pro Val Cys Val Trp Pro Val His Ala Glu Leu
1 5 10 15
Gly Glu Gly Pro Leu Trp Gln Ala Gly Glu Asn Ala Val Tyr Phe Val
20 25 30
Asp Ile Lys Gly Arg Gln Ile His Arg Leu Thr Val Thr Thr Gly Gln
35 40 45
Thr Gln Thr Trp Lys Ala Pro Gly Gln Pro Gly Phe Ile Ala Pro Leu
50 55 60
Ala Gly His Gly Phe Val Cys Gly Leu Pro Gly Gly Leu Tyr Arg Phe
65 70 75 80
Asp Ala Gly Ser Gly Gln Phe Ser Lys Leu Lys Asp Val Glu Val His
85 90 95
Leu Pro Gly Asn Arg Leu Asn Asp Gly Phe Val Asp Ala Ser Gly His
100 105 110
Leu Trp Phe Gly Ser Met Asp Asp Gly Glu Glu Gln Pro Ser Gly Thr
115 120 125
Leu Tyr Arg Val Asn His Ala Gly Glu Ala Val Ala Gln Asp Asp Gly
130 135 140
Tyr Val Ile Thr Asn Gly Pro Ala Ser Ser Pro Asp Ala Arg Thr Leu
145 150 155 160
Tyr His Gly Asp Thr Met Arg Arg Val Val Tyr Ala Phe Asp Leu Gly
165 170 175
Glu Asp Gly Thr Leu Ser Arg Lys Arg Ile Phe Ala Ala Ile Ser Gly
180 185 190
Asp Gly Tyr Pro Asp Gly Met Ala Val Asp Ala Asp Gly Phe Leu Trp
195 200 205
Val Ala Leu Phe Gly Gly Trp Arg Ile Glu Arg Phe Ser Pro Asp Gly
210 215 220
Lys Arg Val Glu Gln Val Pro Phe Pro Cys Ala Asn Val Thr Lys Leu
225 230 235 240
Ala Phe Gly Gly Asp Asp Leu Gln Thr Val Tyr Ala Ser Thr Ala Trp
245 250 255
Lys Gly Leu Ser Pro Val Ala Arg Gln Gln Gln Pro Asp Ala Gly Gly
260 265 270
Leu Phe Ser Phe Arg Ser Pro Val Pro Gly Gln Pro Gln Ala Arg Cys
275 280 285
Lys Trp Gly Phe Ala Gln
290
<210> 58
<211> 876
<212> DNA
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 58
atgaccgtca cgagagtggt cgacacgtcg tgccgactcg gcgagggacc ggtctggcac 60
cccgacgaga agcggctgta ctgggtagac atcgaatccg ggcgactcca ccgctacgac 120
cccgagaccg gagcgcacga ctgtccggtc gaaacgtcgg tcatcgccgg cgtgacgata 180
cagcgcgacg ggtcgctcct agcgttcatg gaccgcggtc gcgtcgggcg cgtcgtcgac 240
ggcgaccgcc gggaaagcgc gcgaatcgtc gactcaccga cccggttcaa cgacgtcatc 300
gccgaccccg ccgggcgggt gttctgcggg acgatgccgt cagatacggc gggcgggcgg 360
ctgttccgcc tcgacaccga cggaacggtg acgacggtcg aaaccggcgt cggaatcccc 420
aacgggatgg gattcacccg cgaccgcgag cgattctact tcacggaaac cgaggcgcgc 480
accgtctatc ggtacgccta cgacgaagag acgggagccg tctcggcccg cgagcggttc 540
gtcgaatcgc cggagacgcc ggggctaccg gacgggatga cggtcgattc ggcggggcac 600
atctggtcgg cccgctggga gggcggctgt gtggtcgagt acgacgccga cggcaccgaa 660
ctcggccggt tcgacgtgcc gacggagaag gtgacgagcg tcgccttcgg cgggccggac 720
ctcgattcgc tctacgtgac gaccgccggc ggcgacgggg acgggagcgc tggcgagggc 780
gacgagagca ccggcgacgc tgcgggcgcg ctgttccgcc tcgacgtggc ggcgaccggg 840
cggcccgagt tccgctccga cgttcggttg gggtga 876
<210> 59
<211> 291
<212> PRT
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 59
Met Thr Val Thr Arg Val Val Asp Thr Ser Cys Arg Leu Gly Glu Gly
1 5 10 15
Pro Val Trp His Pro Asp Glu Lys Arg Leu Tyr Trp Val Asp Ile Glu
20 25 30
Ser Gly Arg Leu His Arg Tyr Asp Pro Glu Thr Gly Ala His Asp Cys
35 40 45
Pro Val Glu Thr Ser Val Ile Ala Gly Val Thr Ile Gln Arg Asp Gly
50 55 60
Ser Leu Leu Ala Phe Met Asp Arg Gly Arg Val Gly Arg Val Val Asp
65 70 75 80
Gly Asp Arg Arg Glu Ser Ala Arg Ile Val Asp Ser Pro Thr Arg Phe
85 90 95
Asn Asp Val Ile Ala Asp Pro Ala Gly Arg Val Phe Cys Gly Thr Met
100 105 110
Pro Ser Asp Thr Ala Gly Gly Arg Leu Phe Arg Leu Asp Thr Asp Gly
115 120 125
Thr Val Thr Thr Val Glu Thr Gly Val Gly Ile Pro Asn Gly Met Gly
130 135 140
Phe Thr Arg Asp Arg Glu Arg Phe Tyr Phe Thr Glu Thr Glu Ala Arg
145 150 155 160
Thr Val Tyr Arg Tyr Ala Tyr Asp Glu Glu Thr Gly Ala Val Ser Ala
165 170 175
Arg Glu Arg Phe Val Glu Ser Pro Glu Thr Pro Gly Leu Pro Asp Gly
180 185 190
Met Thr Val Asp Ser Ala Gly His Ile Trp Ser Ala Arg Trp Glu Gly
195 200 205
Gly Cys Val Val Glu Tyr Asp Ala Asp Gly Thr Glu Leu Gly Arg Phe
210 215 220
Asp Val Pro Thr Glu Lys Val Thr Ser Val Ala Phe Gly Gly Pro Asp
225 230 235 240
Leu Asp Ser Leu Tyr Val Thr Thr Ala Gly Gly Asp Gly Asp Gly Ser
245 250 255
Ala Gly Glu Gly Asp Glu Ser Thr Gly Asp Ala Ala Gly Ala Leu Phe
260 265 270
Arg Leu Asp Val Ala Ala Thr Gly Arg Pro Glu Phe Arg Ser Asp Val
275 280 285
Arg Leu Gly
290
<210> 60
<211> 1776
<212> DNA
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 60
atgtcgaatc gcactccacg tcgttttcgc tcacgtgact ggttcgataa tccagaccat 60
atcgacatga cggccttgta tcttgaacgt tttatgaatt atgggattac ccccgaggag 120
ttacgctcgg ggaagccgat tattgggatc gcacagactg gctctgatat ttcaccctgt 180
aaccgtatcc acctggacct ggtgcagcgt gtgcgtgacg ggatccgtga cgcaggaggc 240
attcctatgg aattcccagt tcacccaatc ttcgagaatt gccgtcgccc tactgctgcg 300
cttgatcgta acctttctta cttgggtctt gtcgagactc ttcatgggta ccctatcgat 360
gcggtcgttt taacaacggg gtgcgataaa acgaccccag caggcattat ggctgccacc 420
acagtcaaca tcccggctat tgtgttgtcc gggggcccaa tgcttgatgg gtggcatgaa 480
aatgaattgg tgggttcagg cacagtcatt tggcgtagcc gtcgcaaatt agccgccggc 540
gaaatcacag aagaagaatt tattgaccgt gccgctagta gcgcgccaag cgcgggacac 600
tgtaacacga tgggaacagc gtccacgatg aatgccgtgg cggaggcttt gggtctttcc 660
ctgacaggtt gtgcagccat tcccgcaccc tatcgcgagc gtggtcagat ggcgtacaaa 720
acgggacaac gcattgtgga cttggcgtat gacgacgtta agccacttga catccttacc 780
aagcaggcgt ttgaaaacgc cattgctttg gtcgccgcag ccggaggttc gaccaatgca 840
cagccacaca ttgtagcaat ggcccgccat gccggagtgg aaatcaccgc cgatgattgg 900
cgtgctgcat atgacattcc gcttatcgtg aatatgcaac ctgctggtaa atacttggga 960
gaacgtttcc atcgcgctgg tggcgcacca gcggtactgt gggagttact tcagcaaggt 1020
cgcctgcacg gcgacgtact tactgtcacg ggaaagacaa tgtcagagaa cttacagggg 1080
cgcgaaacct cagatcgtga agtaatcttt ccttatcatg aaccgcttgc cgagaaagcc 1140
ggcttcttgg ttcttaaggg caatttgttt gatttcgcga tcatgaaaag ctcggtgatt 1200
ggtgaggaat ttcgtaagcg ctacttatca cagccagggc aagagggtgt tttcgaagca 1260
cgtgctattg tttttgacgg ctcggacgac taccataaac gcattaacga tcctgcatta 1320
gaaatcgatg aacgttgtat cttagtgatc cgtggtgcag gaccaatcgg gtggccgggc 1380
tcagcggagg tcgtcaacat gcaaccacca gaccacttac tgaaaaaagg gatcatgtcg 1440
ttaccaacac tgggggacgg tcgtcaaagt ggtactgccg attccccctc tattttgaat 1500
gcgtccccag agtccgctat tggaggcgga cttagctggc ttcgtacagg tgacacaatc 1560
cgtatcgatc tgaacacggg acgttgcgac gcgttagtgg acgaggccac aattgcggct 1620
cgtaagcagg acggaattcc cgccgtcccg gcaaccatga caccgtggca agaaatttat 1680
cgcgcgcatg cgtcacagct tgacaccggt ggggtattgg agtttgctgt gaaatatcag 1740
gatctggcgg cgaagctgcc acgccataat cactaa 1776
<210> 61
<211> 591
<212> PRT
<213> 新月柄杆菌(Caulobacter crescentus)
<400> 61
Met Ser Asn Arg Thr Pro Arg Arg Phe Arg Ser Arg Asp Trp Phe Asp
1 5 10 15
Asn Pro Asp His Ile Asp Met Thr Ala Leu Tyr Leu Glu Arg Phe Met
20 25 30
Asn Tyr Gly Ile Thr Pro Glu Glu Leu Arg Ser Gly Lys Pro Ile Ile
35 40 45
Gly Ile Ala Gln Thr Gly Ser Asp Ile Ser Pro Cys Asn Arg Ile His
50 55 60
Leu Asp Leu Val Gln Arg Val Arg Asp Gly Ile Arg Asp Ala Gly Gly
65 70 75 80
Ile Pro Met Glu Phe Pro Val His Pro Ile Phe Glu Asn Cys Arg Arg
85 90 95
Pro Thr Ala Ala Leu Asp Arg Asn Leu Ser Tyr Leu Gly Leu Val Glu
100 105 110
Thr Leu His Gly Tyr Pro Ile Asp Ala Val Val Leu Thr Thr Gly Cys
115 120 125
Asp Lys Thr Thr Pro Ala Gly Ile Met Ala Ala Thr Thr Val Asn Ile
130 135 140
Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp His Glu
145 150 155 160
Asn Glu Leu Val Gly Ser Gly Thr Val Ile Trp Arg Ser Arg Arg Lys
165 170 175
Leu Ala Ala Gly Glu Ile Thr Glu Glu Glu Phe Ile Asp Arg Ala Ala
180 185 190
Ser Ser Ala Pro Ser Ala Gly His Cys Asn Thr Met Gly Thr Ala Ser
195 200 205
Thr Met Asn Ala Val Ala Glu Ala Leu Gly Leu Ser Leu Thr Gly Cys
210 215 220
Ala Ala Ile Pro Ala Pro Tyr Arg Glu Arg Gly Gln Met Ala Tyr Lys
225 230 235 240
Thr Gly Gln Arg Ile Val Asp Leu Ala Tyr Asp Asp Val Lys Pro Leu
245 250 255
Asp Ile Leu Thr Lys Gln Ala Phe Glu Asn Ala Ile Ala Leu Val Ala
260 265 270
Ala Ala Gly Gly Ser Thr Asn Ala Gln Pro His Ile Val Ala Met Ala
275 280 285
Arg His Ala Gly Val Glu Ile Thr Ala Asp Asp Trp Arg Ala Ala Tyr
290 295 300
Asp Ile Pro Leu Ile Val Asn Met Gln Pro Ala Gly Lys Tyr Leu Gly
305 310 315 320
Glu Arg Phe His Arg Ala Gly Gly Ala Pro Ala Val Leu Trp Glu Leu
325 330 335
Leu Gln Gln Gly Arg Leu His Gly Asp Val Leu Thr Val Thr Gly Lys
340 345 350
Thr Met Ser Glu Asn Leu Gln Gly Arg Glu Thr Ser Asp Arg Glu Val
355 360 365
Ile Phe Pro Tyr His Glu Pro Leu Ala Glu Lys Ala Gly Phe Leu Val
370 375 380
Leu Lys Gly Asn Leu Phe Asp Phe Ala Ile Met Lys Ser Ser Val Ile
385 390 395 400
Gly Glu Glu Phe Arg Lys Arg Tyr Leu Ser Gln Pro Gly Gln Glu Gly
405 410 415
Val Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Ser Asp Asp Tyr His
420 425 430
Lys Arg Ile Asn Asp Pro Ala Leu Glu Ile Asp Glu Arg Cys Ile Leu
435 440 445
Val Ile Arg Gly Ala Gly Pro Ile Gly Trp Pro Gly Ser Ala Glu Val
450 455 460
Val Asn Met Gln Pro Pro Asp His Leu Leu Lys Lys Gly Ile Met Ser
465 470 475 480
Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ala Asp Ser Pro
485 490 495
Ser Ile Leu Asn Ala Ser Pro Glu Ser Ala Ile Gly Gly Gly Leu Ser
500 505 510
Trp Leu Arg Thr Gly Asp Thr Ile Arg Ile Asp Leu Asn Thr Gly Arg
515 520 525
Cys Asp Ala Leu Val Asp Glu Ala Thr Ile Ala Ala Arg Lys Gln Asp
530 535 540
Gly Ile Pro Ala Val Pro Ala Thr Met Thr Pro Trp Gln Glu Ile Tyr
545 550 555 560
Arg Ala His Ala Ser Gln Leu Asp Thr Gly Gly Val Leu Glu Phe Ala
565 570 575
Val Lys Tyr Gln Asp Leu Ala Ala Lys Leu Pro Arg His Asn His
580 585 590
<210> 62
<211> 1785
<212> DNA
<213> 异种伯克霍尔德氏菌(Burkholderia xenovorans)
<400> 62
atgtcagcca gtacccctcg tcgtcttcgc tctcaggagt ggttcgacga tccgagtcac 60
gctgatatga ccgcattata tgtcgagcgt tttatgaact atggattaac tcgcgaggaa 120
ttacaatctg gtcgtccgat tatcggcatt gcacagaccg gaagcgacct ggcgccctgt 180
aatcgccacc atatcgagtt agccgcgcgt acaaaggccg gaattcgcga cgcgggtgga 240
attccaatgg agttccccgt ccatccgctt gccgaacaat cccgccgccc gacggccgcg 300
cttgaccgta atctggctta cttgggtctg gtggaaatct tacacggttt ccccttagat 360
ggcgtagttt taaccactgg ttgcgataaa accacgccag cgtgtctgat ggcagctgcg 420
acagtggata tgccagcgat cgtgttaagt ggcggcccca tgcttgatgg atggcacgag 480
ggtaaacgcg tgggctctgg tacagtcatt tggcatgcgc gcaacctgtt ggcgacaggg 540
gagattgatt acgaagggtt catgcagttg actacggcgt cgagtccatc tatcggccac 600
tgtaatacta tggggacagc gttatccatg aactcattgg cagaggcgct gggtatgagc 660
ttacccggtt gtgcttcaat tcccgctgca tatcgtgaac gtggccagat ggcgtacgcg 720
acaggcaagc gtattgtgga cttggtccgc gaagatgtcc gtccaagcca tatcatgact 780
aaggcggcat ttgaaaatgc catcgtcgtt gcaagcgccc ttggcgcgag cacaaattgt 840
ccaccacatt taattgctat tgcgcgccat atgggggtgg aattgacttt agatgattgg 900
caacgcgtgg gtgagcaggt gccccttatt gtaaactgca tgcccgctgg cgaatatttg 960
ggtgaatcgt ttcatcgtgc tgggggtgtt ccagctgtct tgcgcgagtt ggtccacgct 1020
caactggttc atcgcgagtg tctgactgtc agtggccgca ctattggaga gatcgcggcg 1080
gatgccccat cgccagatcg tgacgtgatt cgcactactg aagacccgct taaacatggg 1140
gcgggattta tcgtattgtc aggcaacttt ttcgatagtg caattatgaa gatgagtgtg 1200
gtaggcgaag cctttcgtca aacgtacctg tccgagcctg gcaacgagaa cacatttgaa 1260
gctcgtgcca tcgtttttga cggcccagaa gattaccacg cgcgtatcaa tgaccctagc 1320
cttgatattg accaacattg tattttagtc attcgtggag ccggtaccgt aggatatccg 1380
ggcagtgctg aggtagtgaa catggccccg ccggcggaat tagtgcgtca gggtatcacc 1440
tcattgccaa cacttggaga tggccgtcaa agcggcacat cagcttcgcc gtctattttg 1500
aacatgagcc ctgaggccgc cgttggcgga ggattaagtc ttttgcgcac caatgaccgc 1560
attcgtgttg atctgaactc acgctcagta aatgtactgg ttgatgacga agaattagca 1620
cgccgtcgtg aaaccgcaac gttcgctatt cctcctaccc agacgccgtg gcaagaatta 1680
taccgccaga cggtggggca gctgagtact ggcgggtgtc tggaacctgc taccttatat 1740
ttgaaagtta tcgcagaacg tggcaatccg cgtcacagcc actaa 1785
<210> 63
<211> 594
<212> PRT
<213> 异种伯克霍尔德氏菌(Burkholderia xenovorans)
<400> 63
Met Ser Ala Ser Thr Pro Arg Arg Leu Arg Ser Gln Glu Trp Phe Asp
1 5 10 15
Asp Pro Ser His Ala Asp Met Thr Ala Leu Tyr Val Glu Arg Phe Met
20 25 30
Asn Tyr Gly Leu Thr Arg Glu Glu Leu Gln Ser Gly Arg Pro Ile Ile
35 40 45
Gly Ile Ala Gln Thr Gly Ser Asp Leu Ala Pro Cys Asn Arg His His
50 55 60
Ile Glu Leu Ala Ala Arg Thr Lys Ala Gly Ile Arg Asp Ala Gly Gly
65 70 75 80
Ile Pro Met Glu Phe Pro Val His Pro Leu Ala Glu Gln Ser Arg Arg
85 90 95
Pro Thr Ala Ala Leu Asp Arg Asn Leu Ala Tyr Leu Gly Leu Val Glu
100 105 110
Ile Leu His Gly Phe Pro Leu Asp Gly Val Val Leu Thr Thr Gly Cys
115 120 125
Asp Lys Thr Thr Pro Ala Cys Leu Met Ala Ala Ala Thr Val Asp Met
130 135 140
Pro Ala Ile Val Leu Ser Gly Gly Pro Met Leu Asp Gly Trp His Glu
145 150 155 160
Gly Lys Arg Val Gly Ser Gly Thr Val Ile Trp His Ala Arg Asn Leu
165 170 175
Leu Ala Thr Gly Glu Ile Asp Tyr Glu Gly Phe Met Gln Leu Thr Thr
180 185 190
Ala Ser Ser Pro Ser Ile Gly His Cys Asn Thr Met Gly Thr Ala Leu
195 200 205
Ser Met Asn Ser Leu Ala Glu Ala Leu Gly Met Ser Leu Pro Gly Cys
210 215 220
Ala Ser Ile Pro Ala Ala Tyr Arg Glu Arg Gly Gln Met Ala Tyr Ala
225 230 235 240
Thr Gly Lys Arg Ile Val Asp Leu Val Arg Glu Asp Val Arg Pro Ser
245 250 255
His Ile Met Thr Lys Ala Ala Phe Glu Asn Ala Ile Val Val Ala Ser
260 265 270
Ala Leu Gly Ala Ser Thr Asn Cys Pro Pro His Leu Ile Ala Ile Ala
275 280 285
Arg His Met Gly Val Glu Leu Thr Leu Asp Asp Trp Gln Arg Val Gly
290 295 300
Glu Gln Val Pro Leu Ile Val Asn Cys Met Pro Ala Gly Glu Tyr Leu
305 310 315 320
Gly Glu Ser Phe His Arg Ala Gly Gly Val Pro Ala Val Leu Arg Glu
325 330 335
Leu Val His Ala Gln Leu Val His Arg Glu Cys Leu Thr Val Ser Gly
340 345 350
Arg Thr Ile Gly Glu Ile Ala Ala Asp Ala Pro Ser Pro Asp Arg Asp
355 360 365
Val Ile Arg Thr Thr Glu Asp Pro Leu Lys His Gly Ala Gly Phe Ile
370 375 380
Val Leu Ser Gly Asn Phe Phe Asp Ser Ala Ile Met Lys Met Ser Val
385 390 395 400
Val Gly Glu Ala Phe Arg Gln Thr Tyr Leu Ser Glu Pro Gly Asn Glu
405 410 415
Asn Thr Phe Glu Ala Arg Ala Ile Val Phe Asp Gly Pro Glu Asp Tyr
420 425 430
His Ala Arg Ile Asn Asp Pro Ser Leu Asp Ile Asp Gln His Cys Ile
435 440 445
Leu Val Ile Arg Gly Ala Gly Thr Val Gly Tyr Pro Gly Ser Ala Glu
450 455 460
Val Val Asn Met Ala Pro Pro Ala Glu Leu Val Arg Gln Gly Ile Thr
465 470 475 480
Ser Leu Pro Thr Leu Gly Asp Gly Arg Gln Ser Gly Thr Ser Ala Ser
485 490 495
Pro Ser Ile Leu Asn Met Ser Pro Glu Ala Ala Val Gly Gly Gly Leu
500 505 510
Ser Leu Leu Arg Thr Asn Asp Arg Ile Arg Val Asp Leu Asn Ser Arg
515 520 525
Ser Val Asn Val Leu Val Asp Asp Glu Glu Leu Ala Arg Arg Arg Glu
530 535 540
Thr Ala Thr Phe Ala Ile Pro Pro Thr Gln Thr Pro Trp Gln Glu Leu
545 550 555 560
Tyr Arg Gln Thr Val Gly Gln Leu Ser Thr Gly Gly Cys Leu Glu Pro
565 570 575
Ala Thr Leu Tyr Leu Lys Val Ile Ala Glu Arg Gly Asn Pro Arg His
580 585 590
Ser His
<210> 64
<211> 1239
<212> DNA
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 64
atggttgagc aagcgaagct tagcgacccg aacgcggagt acacgatgcg cgacctgtcc 60
gcggagacga tagacatcac gaatccgcga ggtggcgtcc gcgacgccga aatcacggac 120
gtacagacga cgatggtcga cgggaactac ccgtggattc tcgtccgcgt ctacaccgac 180
gcgggcgtcg tcggcaccgg cgaggcctac tggggcggcg gcgacaccgc catcatcgag 240
cggatgaagc cgttcctcgt cggcgagaac cccctcgaca tcgaccgcct gtacgagcat 300
ctcgtccaga agatgtccgg cgagggctcc gtctcgggca aggtcatctc cgccatctcg 360
ggcatcgaaa tcgcgctcca cgacgtcgcc ggaaagctcc tcgacgtgcc cgcctatcaa 420
ctcgtcggcg ggaagtaccg cgacgaggtg cgcgtctact gcgacctcca caccgaagac 480
gaggccaacc cgcaggcctg cgccgaggag ggcgtccgcg tggtcgagga actcggctac 540
gacgccatca agttcgacct cgacgtgccc tcgggccacg agaaggaccg cgcgaaccgc 600
cacctccgaa accccgaaat cgaccacaag gtcgaaatcg tcgaggccgt caccgaggcc 660
gtcggcgacc gcgcggacgt ggcgttcgac tgccactggt cctttaccgg cgggagcgcc 720
aagcgcctcg cgtccgagct ggaagactac gacgtgtggt ggctcgaaga ccccgtgccg 780
ccggagaacc acgacgtgca gaagctcgtg acgcagtcca cgacgacgcc catcgcggtc 840
ggtgagaacg tctaccggaa gttcggccag cggacgctgc tcgaaccgca ggcggtggat 900
atcatcgcgc ccgacctgcc ccgcgtcggc ggcatgcgcg agacgcggaa gattgccgac 960
ctcgcggaca tgtactacat ccccgtggcg atgcacaacg tctcgtcgcc catcgggacg 1020
atggcctccg cgcaggtcgc cgcggccatc ccgaactcgc tggccctcga ataccactcc 1080
taccagctcg gctggtggga ggacctcgtc gaagaggacg acctgattca gaacggtcac 1140
atggagattc ccgaaaagcc cggcctcggg ctgacgctcg acctcgacgc cgtcgaagca 1200
cacatggtcg aaggggagac gctcttcgac gaggagtaa 1239
<210> 65
<211> 412
<212> PRT
<213> 沃氏富盐菌(Haloferax volcanii)
<400> 65
Met Val Glu Gln Ala Lys Leu Ser Asp Pro Asn Ala Glu Tyr Thr Met
1 5 10 15
Arg Asp Leu Ser Ala Glu Thr Ile Asp Ile Thr Asn Pro Arg Gly Gly
20 25 30
Val Arg Asp Ala Glu Ile Thr Asp Val Gln Thr Thr Met Val Asp Gly
35 40 45
Asn Tyr Pro Trp Ile Leu Val Arg Val Tyr Thr Asp Ala Gly Val Val
50 55 60
Gly Thr Gly Glu Ala Tyr Trp Gly Gly Gly Asp Thr Ala Ile Ile Glu
65 70 75 80
Arg Met Lys Pro Phe Leu Val Gly Glu Asn Pro Leu Asp Ile Asp Arg
85 90 95
Leu Tyr Glu His Leu Val Gln Lys Met Ser Gly Glu Gly Ser Val Ser
100 105 110
Gly Lys Val Ile Ser Ala Ile Ser Gly Ile Glu Ile Ala Leu His Asp
115 120 125
Val Ala Gly Lys Leu Leu Asp Val Pro Ala Tyr Gln Leu Val Gly Gly
130 135 140
Lys Tyr Arg Asp Glu Val Arg Val Tyr Cys Asp Leu His Thr Glu Asp
145 150 155 160
Glu Ala Asn Pro Gln Ala Cys Ala Glu Glu Gly Val Arg Val Val Glu
165 170 175
Glu Leu Gly Tyr Asp Ala Ile Lys Phe Asp Leu Asp Val Pro Ser Gly
180 185 190
His Glu Lys Asp Arg Ala Asn Arg His Leu Arg Asn Pro Glu Ile Asp
195 200 205
His Lys Val Glu Ile Val Glu Ala Val Thr Glu Ala Val Gly Asp Arg
210 215 220
Ala Asp Val Ala Phe Asp Cys His Trp Ser Phe Thr Gly Gly Ser Ala
225 230 235 240
Lys Arg Leu Ala Ser Glu Leu Glu Asp Tyr Asp Val Trp Trp Leu Glu
245 250 255
Asp Pro Val Pro Pro Glu Asn His Asp Val Gln Lys Leu Val Thr Gln
260 265 270
Ser Thr Thr Thr Pro Ile Ala Val Gly Glu Asn Val Tyr Arg Lys Phe
275 280 285
Gly Gln Arg Thr Leu Leu Glu Pro Gln Ala Val Asp Ile Ile Ala Pro
290 295 300
Asp Leu Pro Arg Val Gly Gly Met Arg Glu Thr Arg Lys Ile Ala Asp
305 310 315 320
Leu Ala Asp Met Tyr Tyr Ile Pro Val Ala Met His Asn Val Ser Ser
325 330 335
Pro Ile Gly Thr Met Ala Ser Ala Gln Val Ala Ala Ala Ile Pro Asn
340 345 350
Ser Leu Ala Leu Glu Tyr His Ser Tyr Gln Leu Gly Trp Trp Glu Asp
355 360 365
Leu Val Glu Glu Asp Asp Leu Ile Gln Asn Gly His Met Glu Ile Pro
370 375 380
Glu Lys Pro Gly Leu Gly Leu Thr Leu Asp Leu Asp Ala Val Glu Ala
385 390 395 400
His Met Val Glu Gly Glu Thr Leu Phe Asp Glu Glu
405 410
<210> 66
<211> 1179
<212> DNA
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 66
atgaaagaag ttgttattgc gagcgcggtt cgtaccgcga ttggcagcta tggcaagagc 60
ctgaaggatg ttccggcggt ggacctgggt gcgaccgcga tcaaagaggc ggttaagaaa 120
gcgggcatta aaccggagga tgtgaacgaa gttatcctgg gtaacgtgct gcaagcgggt 180
ctgggccaaa acccggcgcg tcaggcgagc ttcaaggcgg gcctgccggt tgaaatcccg 240
gcgatgacca ttaacaaagt ttgcggtagc ggcctgcgta ccgtgagcct ggcggcgcaa 300
atcattaagg cgggtgacgc ggatgttatc attgcgggtg gcatggagaa catgagccgt 360
gcgccgtacc tggcgaacaa cgcgcgttgg ggttatcgta tgggcaacgc gaaattcgtg 420
gacgaaatga ttaccgacgg tctgtgggat gcgtttaacg actaccacat gggcatcacc 480
gcggagaaca ttgcggaacg ttggaacatt agccgtgagg aacaagatga gttcgcgctg 540
gcgagccaga agaaagcgga ggaagcgatc aagagcggcc agtttaaaga cgaaatcgtt 600
ccggtggtta ttaagggtcg taagggtgaa accgtggtgg acaccgatga acacccgcgt 660
ttcggtagca ccattgaggg cctggcgaag ctgaaaccgg cgtttaagaa agatggcacc 720
gtgaccgcgg gtaacgcgag cggcctgaac gactgcgcgg cggtgctggt tatcatgagc 780
gcggagaagg cgaaagaact gggtgtgaag ccgctggcga aaattgttag ctacggtagc 840
gcgggtgtgg acccggcgat catgggttac ggcccgtttt atgcgaccaa ggcggcgatt 900
gagaaagcgg gttggaccgt ggacgaactg gatctgatcg agagcaacga agcgttcgcg 960
gcgcaaagcc tggcggtggc gaaggatctg aaatttgaca tgaacaaggt gaacgtgaac 1020
ggtggtgcga ttgcgctggg tcacccgatt ggtgcgagcg gcgcgcgtat cctggtgacc 1080
ctggttcacg cgatgcagaa acgtgacgcg aagaaaggtc tggcgaccct gtgcattggt 1140
ggtggtcaag gcaccgcgat tctgctggaa aagtgctaa 1179
<210> 67
<211> 393
<212> PRT
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 67
Met Arg Asp Val Val Ile Val Ser Ala Val Arg Thr Ala Leu Gly Ser
1 5 10 15
Phe Gly Gly Ala Leu Lys Asp Val Ser Ala Val Asp Leu Gly Ala Leu
20 25 30
Val Ile Lys Glu Ala Val Asn Arg Ala Gly Val Lys Pro Glu Leu Ile
35 40 45
Glu Glu Val Ile Met Gly Asn Val Ile Gln Ala Gly Leu Gly Gln Asn
50 55 60
Thr Ala Arg Gln Ser Thr Ile Lys Ala Gly Leu Pro Gln Glu Val Ser
65 70 75 80
Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Ala Val Ser
85 90 95
Leu Ala Ala Gln Met Ile Lys Ala Gly Asp Ala Asp Val Val Val Ala
100 105 110
Gly Gly Met Glu Asn Met Ser Ala Ala Pro Tyr Ala Leu Asp Lys Ala
115 120 125
Arg Trp Gly Gln Arg Met Gly Asp Gly Lys Leu Val Asp Thr Met Ile
130 135 140
Lys Asp Ala Leu Trp Asp Ala Phe Asn Asn Tyr His Met Gly Val Thr
145 150 155 160
Ala Glu Asn Ile Ala Lys Gln Trp Gly Leu Thr Arg Glu Glu Gln Asp
165 170 175
Ala Phe Ser Ala Ser Ser Gln Gln Lys Ala Glu Ala Ala Ile Lys Ser
180 185 190
Gly Arg Phe Lys Asp Glu Ile Val Pro Val Val Ile Pro Gln Arg Lys
195 200 205
Gly Glu Pro Lys Val Phe Asp Thr Asp Glu Phe Pro Arg Phe Gly Thr
210 215 220
Thr Ala Glu Thr Leu Ala Lys Leu Lys Pro Ala Phe Ile Lys Asp Gly
225 230 235 240
Thr Val Thr Ala Gly Asn Ala Ser Gly Ile Asn Asp Gly Ala Ala Ala
245 250 255
Phe Val Val Met Ser Ala Glu Lys Ala Glu Glu Leu Gly Leu Lys Pro
260 265 270
Met Ala Lys Ile Leu Ser Tyr Gly Ser Lys Gly Leu Asp Pro Ala Ile
275 280 285
Met Gly Tyr Gly Pro Phe His Ala Thr Lys Lys Ala Leu Glu Lys Ala
290 295 300
Asn Leu Thr Val Glu Asp Leu Asp Leu Ile Glu Ala Asn Glu Ala Phe
305 310 315 320
Ala Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Ser
325 330 335
Lys Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Val Gly
340 345 350
Ala Ser Gly Ala Arg Ile Leu Val Thr Leu Leu His Glu Met Glu Lys
355 360 365
Arg Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Met
370 375 380
Gly Thr Ala Leu Ile Val Glu Arg Val
385 390
<210> 68
<211> 1179
<212> DNA
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 68
atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60
cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120
gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180
ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240
gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300
attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360
gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420
gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480
gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540
gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600
cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660
tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720
gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780
gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840
gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900
gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960
gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020
ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080
cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140
ggcggacaag gaacagcaat attgctagaa aagtgctag 1179
<210> 69
<211> 392
<212> PRT
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 69
Met Lys Glu Val Val Ile Ala Ser Ala Val Arg Thr Ala Ile Gly Ser
1 5 10 15
Tyr Gly Lys Ser Leu Lys Asp Val Pro Ala Val Asp Leu Gly Ala Thr
20 25 30
Ala Ile Lys Glu Ala Val Lys Lys Ala Gly Ile Lys Pro Glu Asp Val
35 40 45
Asn Glu Val Ile Leu Gly Asn Val Leu Gln Ala Gly Leu Gly Gln Asn
50 55 60
Pro Ala Arg Gln Ala Ser Phe Lys Ala Gly Leu Pro Val Glu Ile Pro
65 70 75 80
Ala Met Thr Ile Asn Lys Val Cys Gly Ser Gly Leu Arg Thr Val Ser
85 90 95
Leu Ala Ala Gln Ile Ile Lys Ala Gly Asp Ala Asp Val Ile Ile Ala
100 105 110
Gly Gly Met Glu Asn Met Ser Arg Ala Pro Tyr Leu Ala Asn Asn Ala
115 120 125
Arg Trp Gly Tyr Arg Met Gly Asn Ala Lys Phe Val Asp Glu Met Ile
130 135 140
Thr Asp Gly Leu Trp Asp Ala Phe Asn Asp Tyr His Met Gly Ile Thr
145 150 155 160
Ala Glu Asn Ile Ala Glu Arg Trp Asn Ile Ser Arg Glu Glu Gln Asp
165 170 175
Glu Phe Ala Leu Ala Ser Gln Lys Lys Ala Glu Glu Ala Ile Lys Ser
180 185 190
Gly Gln Phe Lys Asp Glu Ile Val Pro Val Val Ile Lys Gly Arg Lys
195 200 205
Gly Glu Thr Val Val Asp Thr Asp Glu His Pro Arg Phe Gly Ser Thr
210 215 220
Ile Glu Gly Leu Ala Lys Leu Lys Pro Ala Phe Lys Lys Asp Gly Thr
225 230 235 240
Val Thr Ala Gly Asn Ala Ser Gly Leu Asn Asp Cys Ala Ala Val Leu
245 250 255
Val Ile Met Ser Ala Glu Lys Ala Lys Glu Leu Gly Val Lys Pro Leu
260 265 270
Ala Lys Ile Val Ser Tyr Gly Ser Ala Gly Val Asp Pro Ala Ile Met
275 280 285
Gly Tyr Gly Pro Phe Tyr Ala Thr Lys Ala Ala Ile Glu Lys Ala Gly
290 295 300
Trp Thr Val Asp Glu Leu Asp Leu Ile Glu Ser Asn Glu Ala Phe Ala
305 310 315 320
Ala Gln Ser Leu Ala Val Ala Lys Asp Leu Lys Phe Asp Met Asn Lys
325 330 335
Val Asn Val Asn Gly Gly Ala Ile Ala Leu Gly His Pro Ile Gly Ala
340 345 350
Ser Gly Ala Arg Ile Leu Val Thr Leu Val His Ala Met Gln Lys Arg
355 360 365
Asp Ala Lys Lys Gly Leu Ala Thr Leu Cys Ile Gly Gly Gly Gln Gly
370 375 380
Thr Ala Ile Leu Leu Glu Lys Cys
385 390
<210> 70
<211> 663
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 70
atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60
atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120
gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180
atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240
aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300
ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360
acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420
tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480
acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540
gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600
gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660
taa 663
<210> 71
<211> 651
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 71
atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60
gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120
atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180
gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240
agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300
ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360
ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420
cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480
caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540
atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600
gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651
<210> 72
<211> 220
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 72
Met Lys Thr Lys Leu Met Thr Leu Gln Asp Ala Thr Gly Phe Phe Arg
1 5 10 15
Asp Gly Met Thr Ile Met Val Gly Gly Phe Met Gly Ile Gly Thr Pro
20 25 30
Ser Arg Leu Val Glu Ala Leu Leu Glu Ser Gly Val Arg Asp Leu Thr
35 40 45
Leu Ile Ala Asn Asp Thr Ala Phe Val Asp Thr Gly Ile Gly Pro Leu
50 55 60
Ile Val Asn Gly Arg Val Arg Lys Val Ile Ala Ser His Ile Gly Thr
65 70 75 80
Asn Pro Glu Thr Gly Arg Arg Met Ile Ser Gly Glu Met Asp Val Val
85 90 95
Leu Val Pro Gln Gly Thr Leu Ile Glu Gln Ile Arg Cys Gly Gly Ala
100 105 110
Gly Leu Gly Gly Phe Leu Thr Pro Thr Gly Val Gly Thr Val Val Glu
115 120 125
Glu Gly Lys Gln Thr Leu Thr Leu Asp Gly Lys Thr Trp Leu Leu Glu
130 135 140
Arg Pro Leu Arg Ala Asp Leu Ala Leu Ile Arg Ala His Arg Cys Asp
145 150 155 160
Thr Leu Gly Asn Leu Thr Tyr Gln Leu Ser Ala Arg Asn Phe Asn Pro
165 170 175
Leu Ile Ala Leu Ala Ala Asp Ile Thr Leu Val Glu Pro Asp Glu Leu
180 185 190
Val Glu Thr Gly Glu Leu Gln Pro Asp His Ile Val Thr Pro Gly Ala
195 200 205
Val Ile Asp His Ile Ile Val Ser Gln Glu Ser Lys
210 215 220
<210> 73
<211> 216
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 73
Met Asp Ala Lys Gln Arg Ile Ala Arg Arg Val Ala Gln Glu Leu Arg
1 5 10 15
Asp Gly Asp Ile Val Asn Leu Gly Ile Gly Leu Pro Thr Met Val Ala
20 25 30
Asn Tyr Leu Pro Glu Gly Ile His Ile Thr Leu Gln Ser Glu Asn Gly
35 40 45
Phe Leu Gly Leu Gly Pro Val Thr Thr Ala His Pro Asp Leu Val Asn
50 55 60
Ala Gly Gly Gln Pro Cys Gly Val Leu Pro Gly Ala Ala Met Phe Asp
65 70 75 80
Ser Ala Met Ser Phe Ala Leu Ile Arg Gly Gly His Ile Asp Ala Cys
85 90 95
Val Leu Gly Gly Leu Gln Val Asp Glu Glu Ala Asn Leu Ala Asn Trp
100 105 110
Val Val Pro Gly Lys Met Val Pro Gly Met Gly Gly Ala Met Asp Leu
115 120 125
Val Thr Gly Ser Arg Lys Val Ile Ile Ala Met Glu His Cys Ala Lys
130 135 140
Asp Gly Ser Ala Lys Ile Leu Arg Arg Cys Thr Met Pro Leu Thr Ala
145 150 155 160
Gln His Ala Val His Met Leu Val Thr Glu Leu Ala Val Phe Arg Phe
165 170 175
Ile Asp Gly Lys Met Trp Leu Thr Glu Ile Ala Asp Gly Cys Asp Leu
180 185 190
Ala Thr Val Arg Ala Lys Thr Glu Ala Arg Phe Glu Val Ala Ala Asp
195 200 205
Leu Asn Thr Gln Arg Gly Asp Leu
210 215
<210> 74
<211> 735
<212> DNA
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 74
atgctgaagg acgaggttat taagcagatt agcaccccgc tgaccagccc ggcgttcccg 60
cgtggtccgt acaagttcca taatcgcgaa tacttcaaca ttgtgtatcg taccgacatg 120
gatgcgctgc gtaaggtggt tccggagccg ctggaaattg acgagccgct ggttcgtttc 180
gaaatcatgg cgatgcacga taccagcggt ctgggctgct acaccgagag cggtcaggcg 240
attccggtga gctttaacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300
gaaccggcga ttgcggtggg tcgtgagctg agcgcgtacc cgaagaaact gggctatccg 360
aagctgttcg tggacagcga taccctggtg ggcaccctgg actacggcaa actgcgtgtt 420
gcgaccgcga ccatgggcta taagcacaaa gcgctggacg cgaacgaagc gaaggatcag 480
atttgccgtc cgaactacat gctgaaaatc attccgaact atgacggtag cccgcgtatc 540
tgcgaactga ttaacgcgaa gatcaccgat gttaccgttc atgaggcgtg gaccggcccg 600
acccgtctgc aactgtttga ccacgcgatg gcgccgctga acgatctgcc ggtgaaagag 660
atcgttagca gcagccacat cctggcggac atcatcctgc cgcgtgcgga agttatctac 720
gattacctga agtaa 735
<210> 75
<211> 244
<212> PRT
<213> 丙酮丁醇梭菌(Clostridium acetobutylicum)
<400> 75
Met Leu Lys Asp Glu Val Ile Lys Gln Ile Ser Thr Pro Leu Thr Ser
1 5 10 15
Pro Ala Phe Pro Arg Gly Pro Tyr Lys Phe His Asn Arg Glu Tyr Phe
20 25 30
Asn Ile Val Tyr Arg Thr Asp Met Asp Ala Leu Arg Lys Val Val Pro
35 40 45
Glu Pro Leu Glu Ile Asp Glu Pro Leu Val Arg Phe Glu Ile Met Ala
50 55 60
Met His Asp Thr Ser Gly Leu Gly Cys Tyr Thr Glu Ser Gly Gln Ala
65 70 75 80
Ile Pro Val Ser Phe Asn Gly Val Lys Gly Asp Tyr Leu His Met Met
85 90 95
Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Leu Ser Ala
100 105 110
Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr
115 120 125
Leu Val Gly Thr Leu Asp Tyr Gly Lys Leu Arg Val Ala Thr Ala Thr
130 135 140
Met Gly Tyr Lys His Lys Ala Leu Asp Ala Asn Glu Ala Lys Asp Gln
145 150 155 160
Ile Cys Arg Pro Asn Tyr Met Leu Lys Ile Ile Pro Asn Tyr Asp Gly
165 170 175
Ser Pro Arg Ile Cys Glu Leu Ile Asn Ala Lys Ile Thr Asp Val Thr
180 185 190
Val His Glu Ala Trp Thr Gly Pro Thr Arg Leu Gln Leu Phe Asp His
195 200 205
Ala Met Ala Pro Leu Asn Asp Leu Pro Val Lys Glu Ile Val Ser Ser
210 215 220
Ser His Ile Leu Ala Asp Ile Ile Leu Pro Arg Ala Glu Val Ile Tyr
225 230 235 240
Asp Tyr Leu Lys
<210> 76
<211> 741
<212> DNA
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 76
atgctggaga gcgaagttag caaacaaatc accaccccgc tggcggcgcc ggcgttcccg 60
cgtggcccgt accgttttca taaccgtgag tacctgaaca tcatttatcg taccgacctg 120
gatgcgctgc gtaagattgt gccggagccg ctggaactgg accgtgcgta cgttcgtttc 180
gagatgatgg cgatgccgga taccaccggt ctgggcagct acaccgaatg cggtcaggcg 240
atcccggtga agtataacgg tgttaaaggc gactacctgc acatgatgta tctggataac 300
gagccggcga ttgcggtggg tcgtgaaagc agcgcgtacc cgaagaaact gggctatccg 360
aagctgtttg tggacagcga taccctggtg ggcaccctga aatatggcac cctgccggtt 420
gcgaccgcga ccatgggcta caagcacgag ccgctggacc tgaaagaagc gtatgcgcag 480
attgcgcgtc cgaacttcat gctgaagatc attcaaggtt atgacggcaa accgcgtatc 540
tgcgagctga tttgcgcgga aaacaccgat atcaccatcc atggtgcgtg gaccggcagc 600
gcgcgtctgc aactgtttag ccatgcgctg gcgccgctgg cggatctgcc ggtgctggaa 660
atcgttagcg cgagccacat tctgaccgat ctgaccctgg gcaccccgaa ggttgtgcat 720
gactatctga gcgtgaagta a 741
<210> 77
<211> 246
<212> PRT
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 77
Met Leu Glu Ser Glu Val Ser Lys Gln Ile Thr Thr Pro Leu Ala Ala
1 5 10 15
Pro Ala Phe Pro Arg Gly Pro Tyr Arg Phe His Asn Arg Glu Tyr Leu
20 25 30
Asn Ile Ile Tyr Arg Thr Asp Leu Asp Ala Leu Arg Lys Ile Val Pro
35 40 45
Glu Pro Leu Glu Leu Asp Arg Ala Tyr Val Arg Phe Glu Met Met Ala
50 55 60
Met Pro Asp Thr Thr Gly Leu Gly Ser Tyr Thr Glu Cys Gly Gln Ala
65 70 75 80
Ile Pro Val Lys Tyr Asn Gly Val Lys Gly Asp Tyr Leu His Met Met
85 90 95
Tyr Leu Asp Asn Glu Pro Ala Ile Ala Val Gly Arg Glu Ser Ser Ala
100 105 110
Tyr Pro Lys Lys Leu Gly Tyr Pro Lys Leu Phe Val Asp Ser Asp Thr
115 120 125
Leu Val Gly Thr Leu Lys Tyr Gly Thr Leu Pro Val Ala Thr Ala Thr
130 135 140
Met Gly Tyr Lys His Glu Pro Leu Asp Leu Lys Glu Ala Tyr Ala Gln
145 150 155 160
Ile Ala Arg Pro Asn Phe Met Leu Lys Ile Ile Gln Gly Tyr Asp Gly
165 170 175
Lys Pro Arg Ile Cys Glu Leu Ile Cys Ala Glu Asn Thr Asp Ile Thr
180 185 190
Ile His Gly Ala Trp Thr Gly Ser Ala Arg Leu Gln Leu Phe Ser His
195 200 205
Ala Leu Ala Pro Leu Ala Asp Leu Pro Val Leu Glu Ile Val Ser Ala
210 215 220
Ser His Ile Leu Thr Asp Leu Thr Leu Gly Thr Pro Lys Val Val His
225 230 235 240
Asp Tyr Leu Ser Val Lys
245
<210> 78
<211> 191
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> OXB11启动子
<400> 78
aagctgttgt gaccgcttgc tctagccagc tatcgagttg tgaaccgatc catctagcaa 60
ttggactcga tctagcgata ggcttcgatc tagctatgta gaaacgccgt gtgctcgatc 120
gcctgataag gtccacagta gctgctataa ttgcttcaac agaacatatt gactatccgg 180
tattacccgg c 191
<210> 79
<211> 1500
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 79
atgagcatct tgtacgaaga gcgtcttgat ggcgctttac ccgatgtcga ccgcacatcg 60
gtactgatgg cactgcgtga gcatgtccct ggacttgaga tcctgcatac cgatgaggag 120
atcattcctt acgagtgtga cgggttgagc gcgtatcgca cgcgtccatt actggttgtt 180
ctgcctaagc aaatggaaca ggtgacagcg attctggctg tctgccatcg cctgcgtgta 240
ccggtggtga cccgtggtgc aggcaccggg ctttctggtg gcgcgctgcc gctggaaaaa 300
ggtgtgttgt tggtgatggc gcgctttaaa gagatcctcg acattaaccc cgttggtcgc 360
cgcgcgcgcg tgcagccagg cgtgcgtaac ctggcgatct cccaggccgt tgcaccgcat 420
aatctctact acgcaccgga cccttcctca caaatcgcct gttccattgg cggcaatgtg 480
gctgaaaatg ccggcggcgt ccactgcctg aaatatggtc tgaccgtaca taacctgctg 540
aaaattgaag tgcaaacgct ggacggcgag gcactgacgc ttggatcgga cgcgctggat 600
tcacctggtt ttgacctgct ggcgctgttc accggatcgg aaggtatgct cggcgtgacc 660
accgaagtga cggtaaaact gctgccgaag ccgcccgtgg cgcgggttct gttagccagc 720
tttgactcgg tagaaaaagc cggacttgcg gttggtgaca tcatcgccaa tggcattatc 780
cccggcgggc tggagatgat ggataacctg tcgatccgcg cggcggaaga ttttattcat 840
gccggttatc ccgtcgacgc cgaagcgatt ttgttatgcg agctggacgg cgtggagtct 900
gacgtacagg aagactgcga gcgggttaac gacatcttgt tgaaagcggg cgcgactgac 960
gtccgtctgg cacaggacga agcagagcgc gtacgtttct gggccggtcg caaaaatgcg 1020
ttcccggcgg taggacgtat ctccccggat tactactgca tggatggcac catcccgcgt 1080
cgcgccctgc ctggcgtact ggaaggcatt gcccgtttat cgcagcaata tgatttacgt 1140
gttgccaacg tctttcatgc cggagatggc aacatgcacc cgttaatcct tttcgatgcc 1200
aacgaacccg gtgaatttgc ccgcgcggaa gagctgggcg ggaagatcct cgaactctgc 1260
gttgaagttg gcggcagcat cagtggcgaa catggcatcg ggcgagaaaa aatcaatcaa 1320
atgtgcgccc agttcaacag cgatgaaatc acgaccttcc atgcggtcaa ggcggcgttt 1380
gaccccgatg gtttgctgaa ccctgggaaa aacattccca cgctacaccg ctgtgctgaa 1440
tttggtgcca tgcatgtgca tcacggtcat ttacctttcc ctgaactgga gcgtttctga 1500
<210> 80
<211> 1053
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 80
atgctacgcg agtgtgatta cagccaggcg ctgctggagc aggtgaatca ggcgattagc 60
gataaaacgc cgctggtgat tcagggcagc aatagcaaag cctttttagg tcgccctgtc 120
accgggcaaa cgctggatgt tcgttgtcat cgcggcattg ttaattacga cccgaccgag 180
ctggtgataa ccgcgcgtgt cggaacgccg ctggtgacaa ttgaagcggc gctggaaagc 240
gcggggcaaa tgctcccctg tgagccgccg cattatggtg aagaagccac ctggggcggg 300
atggtcgcct gcgggctggc ggggccgcgt cgcccgtgga gcggttcggt ccgcgatttt 360
gtcctcggca cgcgcatcat taccggcgct ggaaaacatc tgcgttttgg tggcgaagtg 420
atgaaaaacg ttgccggata cgatctctca cggttaatgg tcggaagcta cggttgtctt 480
ggcgtgctca ctgaaatctc aatgaaagtg ttaccgcgac cgcgcgcctc cctgagcctg 540
cgtcgggaaa tcagcctgca agaagccatg agtgaaatcg ccgagtggca actccagcca 600
ttacccatta gtggcttatg ttacttcgac aatgcgttgt ggatccgcct tgagggcggc 660
gaaggatcgg taaaagcagc gcgtgaactg ctgggtggcg aagaggttgc cggtcagttc 720
tggcagcaat tgcgtgaaca acaactgccg ttcttctcgt taccaggtac cttatggcgc 780
atttcattac ccagtgatgc gccgatgatg gatttacccg gcgagcaact gatcgactgg 840
ggcggggcgt tacgctggct gaaatcgaca gccgaggaca atcaaatcca tcgcatcgcc 900
cgcaacgctg gcggtcatgc gacccgcttt agtgccggag atggtggctt tgccccgcta 960
tcggctcctt tattccgcta tcaccagcag cttaaacagc agctcgaccc ttgcggcgtg 1020
tttaaccccg gtcgcatgta cgcggaactt tga 1053
<210> 81
<211> 1224
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 81
atgcaaaccc aattaactga agagatgcgg cagaacgcgc gcgcgctgga agccgacagc 60
atcctgcgcg cctgtgttca ctgcggattt tgtaccgcaa cctgcccaac ctatcagctt 120
ctgggcgatg aactggacgg gccgcgcggg cgcatctatc tgattaaaca ggtgctggaa 180
ggcaacgaag tcacgcttaa aacacaggag catctcgatc gctgcctcac ttgccgtaat 240
tgtgaaacca cctgtccttc tggtgtgcgc tatcacaatt tgctggatat cgggcgtgat 300
attgtcgagc agaaagtgaa acgcccactg ccggagcgaa tactgcgcga aggattgcgc 360
caggtagtgc cgcgtccggc ggtcttccgt gcgctgacgc aggtagggct ggtgctgcga 420
ccgtttttac cggaacaggt cagagcaaaa ctgcctgctg aaacggtgaa agctaaaccg 480
cgtccgccgc tgcgccataa gcgtcgggtt ttaatgttgg aaggctgcgc ccagcctacg 540
ctttcgccca acaccaacgc ggcaactgcg cgagtgctgg atcgtctggg gatcagcgtc 600
atgccagcta acgaagcagg ctgttgtggc gcggtggact atcatcttaa tgcgcaggag 660
aaagggctgg cacgggcgcg caataatatt gatgcctggt ggcccgcgat tgaagcaggt 720
gccgaggcaa ttttgcaaac cgccagcggc tgcggcgcgt ttgtcaaaga gtatgggcag 780
atgctgaaaa acgatgcgtt atatgccgat aaagcacgtc aggtcagtga actggcggtc 840
gatttagtcg aacttctgcg cgaggaaccg ctggaaaaac tggcaattcg cggcgataaa 900
aagctggcct tccactgtcc gtgtacccta caacatgcgc aaaagctgaa cggcgaagtg 960
gaaaaagtgt tgcttcgtct tggatttacc ttaacggacg ttcccgacag ccatctgtgc 1020
tgcggttcag cgggaacata tgcgttaacg catcccgatc tggcacgcca gctgcgggat 1080
aacaaaatga atgcgctgga aagcggcaaa ccggaaatga tcgtcaccgc caacattggt 1140
tgccagacgc atctggcgag cgccggtcgt acctctgtgc gtcactggat tgaaattgta 1200
gaacaagccc ttgaaaagga ataa 1224
<210> 82
<211> 499
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 82
Met Ser Ile Leu Tyr Glu Glu Arg Leu Asp Gly Ala Leu Pro Asp Val
1 5 10 15
Asp Arg Thr Ser Val Leu Met Ala Leu Arg Glu His Val Pro Gly Leu
20 25 30
Glu Ile Leu His Thr Asp Glu Glu Ile Ile Pro Tyr Glu Cys Asp Gly
35 40 45
Leu Ser Ala Tyr Arg Thr Arg Pro Leu Leu Val Val Leu Pro Lys Gln
50 55 60
Met Glu Gln Val Thr Ala Ile Leu Ala Val Cys His Arg Leu Arg Val
65 70 75 80
Pro Val Val Thr Arg Gly Ala Gly Thr Gly Leu Ser Gly Gly Ala Leu
85 90 95
Pro Leu Glu Lys Gly Val Leu Leu Val Met Ala Arg Phe Lys Glu Ile
100 105 110
Leu Asp Ile Asn Pro Val Gly Arg Arg Ala Arg Val Gln Pro Gly Val
115 120 125
Arg Asn Leu Ala Ile Ser Gln Ala Val Ala Pro His Asn Leu Tyr Tyr
130 135 140
Ala Pro Asp Pro Ser Ser Gln Ile Ala Cys Ser Ile Gly Gly Asn Val
145 150 155 160
Ala Glu Asn Ala Gly Gly Val His Cys Leu Lys Tyr Gly Leu Thr Val
165 170 175
His Asn Leu Leu Lys Ile Glu Val Gln Thr Leu Asp Gly Glu Ala Leu
180 185 190
Thr Leu Gly Ser Asp Ala Leu Asp Ser Pro Gly Phe Asp Leu Leu Ala
195 200 205
Leu Phe Thr Gly Ser Glu Gly Met Leu Gly Val Thr Thr Glu Val Thr
210 215 220
Val Lys Leu Leu Pro Lys Pro Pro Val Ala Arg Val Leu Leu Ala Ser
225 230 235 240
Phe Asp Ser Val Glu Lys Ala Gly Leu Ala Val Gly Asp Ile Ile Ala
245 250 255
Asn Gly Ile Ile Pro Gly Gly Leu Glu Met Met Asp Asn Leu Ser Ile
260 265 270
Arg Ala Ala Glu Asp Phe Ile His Ala Gly Tyr Pro Val Asp Ala Glu
275 280 285
Ala Ile Leu Leu Cys Glu Leu Asp Gly Val Glu Ser Asp Val Gln Glu
290 295 300
Asp Cys Glu Arg Val Asn Asp Ile Leu Leu Lys Ala Gly Ala Thr Asp
305 310 315 320
Val Arg Leu Ala Gln Asp Glu Ala Glu Arg Val Arg Phe Trp Ala Gly
325 330 335
Arg Lys Asn Ala Phe Pro Ala Val Gly Arg Ile Ser Pro Asp Tyr Tyr
340 345 350
Cys Met Asp Gly Thr Ile Pro Arg Arg Ala Leu Pro Gly Val Leu Glu
355 360 365
Gly Ile Ala Arg Leu Ser Gln Gln Tyr Asp Leu Arg Val Ala Asn Val
370 375 380
Phe His Ala Gly Asp Gly Asn Met His Pro Leu Ile Leu Phe Asp Ala
385 390 395 400
Asn Glu Pro Gly Glu Phe Ala Arg Ala Glu Glu Leu Gly Gly Lys Ile
405 410 415
Leu Glu Leu Cys Val Glu Val Gly Gly Ser Ile Ser Gly Glu His Gly
420 425 430
Ile Gly Arg Glu Lys Ile Asn Gln Met Cys Ala Gln Phe Asn Ser Asp
435 440 445
Glu Ile Thr Thr Phe His Ala Val Lys Ala Ala Phe Asp Pro Asp Gly
450 455 460
Leu Leu Asn Pro Gly Lys Asn Ile Pro Thr Leu His Arg Cys Ala Glu
465 470 475 480
Phe Gly Ala Met His Val His His Gly His Leu Pro Phe Pro Glu Leu
485 490 495
Glu Arg Phe
<210> 83
<211> 350
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 83
Met Leu Arg Glu Cys Asp Tyr Ser Gln Ala Leu Leu Glu Gln Val Asn
1 5 10 15
Gln Ala Ile Ser Asp Lys Thr Pro Leu Val Ile Gln Gly Ser Asn Ser
20 25 30
Lys Ala Phe Leu Gly Arg Pro Val Thr Gly Gln Thr Leu Asp Val Arg
35 40 45
Cys His Arg Gly Ile Val Asn Tyr Asp Pro Thr Glu Leu Val Ile Thr
50 55 60
Ala Arg Val Gly Thr Pro Leu Val Thr Ile Glu Ala Ala Leu Glu Ser
65 70 75 80
Ala Gly Gln Met Leu Pro Cys Glu Pro Pro His Tyr Gly Glu Glu Ala
85 90 95
Thr Trp Gly Gly Met Val Ala Cys Gly Leu Ala Gly Pro Arg Arg Pro
100 105 110
Trp Ser Gly Ser Val Arg Asp Phe Val Leu Gly Thr Arg Ile Ile Thr
115 120 125
Gly Ala Gly Lys His Leu Arg Phe Gly Gly Glu Val Met Lys Asn Val
130 135 140
Ala Gly Tyr Asp Leu Ser Arg Leu Met Val Gly Ser Tyr Gly Cys Leu
145 150 155 160
Gly Val Leu Thr Glu Ile Ser Met Lys Val Leu Pro Arg Pro Arg Ala
165 170 175
Ser Leu Ser Leu Arg Arg Glu Ile Ser Leu Gln Glu Ala Met Ser Glu
180 185 190
Ile Ala Glu Trp Gln Leu Gln Pro Leu Pro Ile Ser Gly Leu Cys Tyr
195 200 205
Phe Asp Asn Ala Leu Trp Ile Arg Leu Glu Gly Gly Glu Gly Ser Val
210 215 220
Lys Ala Ala Arg Glu Leu Leu Gly Gly Glu Glu Val Ala Gly Gln Phe
225 230 235 240
Trp Gln Gln Leu Arg Glu Gln Gln Leu Pro Phe Phe Ser Leu Pro Gly
245 250 255
Thr Leu Trp Arg Ile Ser Leu Pro Ser Asp Ala Pro Met Met Asp Leu
260 265 270
Pro Gly Glu Gln Leu Ile Asp Trp Gly Gly Ala Leu Arg Trp Leu Lys
275 280 285
Ser Thr Ala Glu Asp Asn Gln Ile His Arg Ile Ala Arg Asn Ala Gly
290 295 300
Gly His Ala Thr Arg Phe Ser Ala Gly Asp Gly Gly Phe Ala Pro Leu
305 310 315 320
Ser Ala Pro Leu Phe Arg Tyr His Gln Gln Leu Lys Gln Gln Leu Asp
325 330 335
Pro Cys Gly Val Phe Asn Pro Gly Arg Met Tyr Ala Glu Leu
340 345 350
<210> 84
<211> 407
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 84
Met Gln Thr Gln Leu Thr Glu Glu Met Arg Gln Asn Ala Arg Ala Leu
1 5 10 15
Glu Ala Asp Ser Ile Leu Arg Ala Cys Val His Cys Gly Phe Cys Thr
20 25 30
Ala Thr Cys Pro Thr Tyr Gln Leu Leu Gly Asp Glu Leu Asp Gly Pro
35 40 45
Arg Gly Arg Ile Tyr Leu Ile Lys Gln Val Leu Glu Gly Asn Glu Val
50 55 60
Thr Leu Lys Thr Gln Glu His Leu Asp Arg Cys Leu Thr Cys Arg Asn
65 70 75 80
Cys Glu Thr Thr Cys Pro Ser Gly Val Arg Tyr His Asn Leu Leu Asp
85 90 95
Ile Gly Arg Asp Ile Val Glu Gln Lys Val Lys Arg Pro Leu Pro Glu
100 105 110
Arg Ile Leu Arg Glu Gly Leu Arg Gln Val Val Pro Arg Pro Ala Val
115 120 125
Phe Arg Ala Leu Thr Gln Val Gly Leu Val Leu Arg Pro Phe Leu Pro
130 135 140
Glu Gln Val Arg Ala Lys Leu Pro Ala Glu Thr Val Lys Ala Lys Pro
145 150 155 160
Arg Pro Pro Leu Arg His Lys Arg Arg Val Leu Met Leu Glu Gly Cys
165 170 175
Ala Gln Pro Thr Leu Ser Pro Asn Thr Asn Ala Ala Thr Ala Arg Val
180 185 190
Leu Asp Arg Leu Gly Ile Ser Val Met Pro Ala Asn Glu Ala Gly Cys
195 200 205
Cys Gly Ala Val Asp Tyr His Leu Asn Ala Gln Glu Lys Gly Leu Ala
210 215 220
Arg Ala Arg Asn Asn Ile Asp Ala Trp Trp Pro Ala Ile Glu Ala Gly
225 230 235 240
Ala Glu Ala Ile Leu Gln Thr Ala Ser Gly Cys Gly Ala Phe Val Lys
245 250 255
Glu Tyr Gly Gln Met Leu Lys Asn Asp Ala Leu Tyr Ala Asp Lys Ala
260 265 270
Arg Gln Val Ser Glu Leu Ala Val Asp Leu Val Glu Leu Leu Arg Glu
275 280 285
Glu Pro Leu Glu Lys Leu Ala Ile Arg Gly Asp Lys Lys Leu Ala Phe
290 295 300
His Cys Pro Cys Thr Leu Gln His Ala Gln Lys Leu Asn Gly Glu Val
305 310 315 320
Glu Lys Val Leu Leu Arg Leu Gly Phe Thr Leu Thr Asp Val Pro Asp
325 330 335
Ser His Leu Cys Cys Gly Ser Ala Gly Thr Tyr Ala Leu Thr His Pro
340 345 350
Asp Leu Ala Arg Gln Leu Arg Asp Asn Lys Met Asn Ala Leu Glu Ser
355 360 365
Gly Lys Pro Glu Met Ile Val Thr Ala Asn Ile Gly Cys Gln Thr His
370 375 380
Leu Ala Ser Ala Gly Arg Thr Ser Val Arg His Trp Ile Glu Ile Val
385 390 395 400
Glu Gln Ala Leu Glu Lys Glu
405
<210> 85
<211> 828
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 85
atggctaatc caaccgttat taagctacag gatggcaatg tcatgcccca gctgggactg 60
ggcgtctggc aagcaagtaa tgaggaagta atcaccgcca ttcaaaaagc gttagaagtg 120
ggttatcgct cgattgatac cgccgcggcc tacaagaacg aagaaggtgt cggcaaagcc 180
ctgaaaaatg cctcagtcaa cagagaagaa ctgttcatca ccactaagct gtggaacgac 240
gaccacaagc gcccccgcga agccctgctc gacagcctga aaaaactcca gcttgattat 300
atcgacctct acttaatgca ctggcccgtt cccgctatcg accattatgt cgaagcatgg 360
aaaggcatga tcgaattgca aaaagaggga ttaatcaaaa gcatcggcgt gtgcaacttc 420
cagatccatc acctgcaacg cctgattgat gaaactggcg tgacgcctgt gataaaccag 480
atcgaacttc atccgctgat gcaacaacgc cagctacacg cctggaacgc gacacacaaa 540
atccagaccg aatcctggag cccattagcg caaggaggga aaggcgtttt cgatcagaaa 600
gtcattcgcg atctggcaga taaatacggc aaaaccccgg cgcagattgt tatccgctgg 660
catctggata gcggcctggt ggtgatcccg aaatcggtca caccttcacg tattgccgaa 720
aactttgatg tctgggattt ccgtctcgac aaagacgaac tcggcgaaat tgcaaaactc 780
gatcagggca agcgtctcgg tcccgatcct gaccagttcg gcggctaa 828
<210> 86
<211> 275
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 86
Met Ala Asn Pro Thr Val Ile Lys Leu Gln Asp Gly Asn Val Met Pro
1 5 10 15
Gln Leu Gly Leu Gly Val Trp Gln Ala Ser Asn Glu Glu Val Ile Thr
20 25 30
Ala Ile Gln Lys Ala Leu Glu Val Gly Tyr Arg Ser Ile Asp Thr Ala
35 40 45
Ala Ala Tyr Lys Asn Glu Glu Gly Val Gly Lys Ala Leu Lys Asn Ala
50 55 60
Ser Val Asn Arg Glu Glu Leu Phe Ile Thr Thr Lys Leu Trp Asn Asp
65 70 75 80
Asp His Lys Arg Pro Arg Glu Ala Leu Leu Asp Ser Leu Lys Lys Leu
85 90 95
Gln Leu Asp Tyr Ile Asp Leu Tyr Leu Met His Trp Pro Val Pro Ala
100 105 110
Ile Asp His Tyr Val Glu Ala Trp Lys Gly Met Ile Glu Leu Gln Lys
115 120 125
Glu Gly Leu Ile Lys Ser Ile Gly Val Cys Asn Phe Gln Ile His His
130 135 140
Leu Gln Arg Leu Ile Asp Glu Thr Gly Val Thr Pro Val Ile Asn Gln
145 150 155 160
Ile Glu Leu His Pro Leu Met Gln Gln Arg Gln Leu His Ala Trp Asn
165 170 175
Ala Thr His Lys Ile Gln Thr Glu Ser Trp Ser Pro Leu Ala Gln Gly
180 185 190
Gly Lys Gly Val Phe Asp Gln Lys Val Ile Arg Asp Leu Ala Asp Lys
195 200 205
Tyr Gly Lys Thr Pro Ala Gln Ile Val Ile Arg Trp His Leu Asp Ser
210 215 220
Gly Leu Val Val Ile Pro Lys Ser Val Thr Pro Ser Arg Ile Ala Glu
225 230 235 240
Asn Phe Asp Val Trp Asp Phe Arg Leu Asp Lys Asp Glu Leu Gly Glu
245 250 255
Ile Ala Lys Leu Asp Gln Gly Lys Arg Leu Gly Pro Asp Pro Asp Gln
260 265 270
Phe Gly Gly
275
<210> 87
<211> 1050
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 87
atgaagatca aagctgttgg tgcatattcc gctaaacaac cacttgaacc gatggatatc 60
acccggcgtg aaccgggacc gaatgatgtc aaaatcgaaa tcgcttactg tggcgtttgc 120
cattccgatc tccaccaggt ccgttccgag tgggcgggga cggtttaccc ctgcgtgccg 180
ggtcatgaaa ttgtggggcg tgtggtagcc gttggtgatc aggtagaaaa atatgcgccg 240
ggcgatctgg tcggtgtcgg ctgcattgtc gacagttgta aacattgcga agagtgtgaa 300
gacgggttgg aaaactactg tgatcacatg accggcacct ataactcgcc gacgccggac 360
gaaccgggcc atactctggg cggctactca caacagatcg tcgttcatga gcgatatgtt 420
ctgcgtattc gtcacccgca agagcagctg gcggcggtgg ctcctttgtt gtgtgcaggg 480
atcaccacgt attcgccgct acgtcactgg caggccgggc cgggtaaaaa agtgggcgtg 540
gtcggcatcg gcggtctggg acatatgggg attaagctgg cccacgcgat gggggcacat 600
gtggtggcat ttaccacttc tgaggcaaaa cgcgaagcgg caaaagccct gggggccgat 660
gaagttgtta actcacgcaa tgccgatgag atggcggctc atctgaagag tttcgatttc 720
attttgaata cagtagctgc gccacataat ctcgacgatt ttaccacctt gctgaagcgt 780
gatggcacca tgacgctggt tggtgcgcct gcgacaccgc ataaatcgcc ggaagttttc 840
aacctgatca tgaaacgccg tgcgatagcc ggttctatga ttggcggcat tccagaaact 900
caggagatgc tcgatttttg cgccgaacat ggcatcgtgg ctgatataga gatgattcgg 960
gccgatcaaa ttaatgaagc ctatgagcga atgctgcgcg gtgatgtgaa atatcgtttt 1020
gttatcgata atcgcacact aacagactga 1050
<210> 88
<211> 349
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 88
Met Lys Ile Lys Ala Val Gly Ala Tyr Ser Ala Lys Gln Pro Leu Glu
1 5 10 15
Pro Met Asp Ile Thr Arg Arg Glu Pro Gly Pro Asn Asp Val Lys Ile
20 25 30
Glu Ile Ala Tyr Cys Gly Val Cys His Ser Asp Leu His Gln Val Arg
35 40 45
Ser Glu Trp Ala Gly Thr Val Tyr Pro Cys Val Pro Gly His Glu Ile
50 55 60
Val Gly Arg Val Val Ala Val Gly Asp Gln Val Glu Lys Tyr Ala Pro
65 70 75 80
Gly Asp Leu Val Gly Val Gly Cys Ile Val Asp Ser Cys Lys His Cys
85 90 95
Glu Glu Cys Glu Asp Gly Leu Glu Asn Tyr Cys Asp His Met Thr Gly
100 105 110
Thr Tyr Asn Ser Pro Thr Pro Asp Glu Pro Gly His Thr Leu Gly Gly
115 120 125
Tyr Ser Gln Gln Ile Val Val His Glu Arg Tyr Val Leu Arg Ile Arg
130 135 140
His Pro Gln Glu Gln Leu Ala Ala Val Ala Pro Leu Leu Cys Ala Gly
145 150 155 160
Ile Thr Thr Tyr Ser Pro Leu Arg His Trp Gln Ala Gly Pro Gly Lys
165 170 175
Lys Val Gly Val Val Gly Ile Gly Gly Leu Gly His Met Gly Ile Lys
180 185 190
Leu Ala His Ala Met Gly Ala His Val Val Ala Phe Thr Thr Ser Glu
195 200 205
Ala Lys Arg Glu Ala Ala Lys Ala Leu Gly Ala Asp Glu Val Val Asn
210 215 220
Ser Arg Asn Ala Asp Glu Met Ala Ala His Leu Lys Ser Phe Asp Phe
225 230 235 240
Ile Leu Asn Thr Val Ala Ala Pro His Asn Leu Asp Asp Phe Thr Thr
245 250 255
Leu Leu Lys Arg Asp Gly Thr Met Thr Leu Val Gly Ala Pro Ala Thr
260 265 270
Pro His Lys Ser Pro Glu Val Phe Asn Leu Ile Met Lys Arg Arg Ala
275 280 285
Ile Ala Gly Ser Met Ile Gly Gly Ile Pro Glu Thr Gln Glu Met Leu
290 295 300
Asp Phe Cys Ala Glu His Gly Ile Val Ala Asp Ile Glu Met Ile Arg
305 310 315 320
Ala Asp Gln Ile Asn Glu Ala Tyr Glu Arg Met Leu Arg Gly Asp Val
325 330 335
Lys Tyr Arg Phe Val Ile Asp Asn Arg Thr Leu Thr Asp
340 345
<210> 89
<211> 1305
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 89
atgaaaaccc gtacacaaca aattgaagaa ttacagaaag agtggactca accgcgttgg 60
gaaggcatta ctcgcccata cagtgcggaa gatgtggtga aattacgcgg ttcagtcaat 120
cctgaatgca cgctggcgca actgggcgca gcgaaaatgt ggcgtctgct gcacggtgag 180
tcgaaaaaag gctacatcaa cagcctcggc gcactgactg gcggtcaggc gctgcaacag 240
gcgaaagcgg gtattgaagc agtctatctg tcgggatggc aggtagcggc ggacgctaac 300
ctggcggcca gcatgtatcc ggatcagtcg ctctatccgg caaactcggt gccagctgtg 360
gtggagcgga tcaacaacac cttccgtcgt gccgatcaga tccaatggtc cgcgggcatt 420
gagccgggcg atccgcgcta tgtcgattac ttcctgccga tcgttgccga tgcggaagcc 480
ggttttggcg gtgtcctgaa tgcctttgaa ctgatgaaag cgatgattga agccggtgca 540
gcggcagttc acttcgaaga tcagctggcg tcagtgaaga aatgcggtca catgggcggc 600
aaagttttag tgccaactca ggaagctatt cagaaactgg tcgcggcgcg tctggcagct 660
gacgtgacgg gcgttccaac cctgctggtt gcccgtaccg atgctgatgc ggcggatctg 720
atcacctccg attgcgaccc gtatgacagc gaatttatta ccggcgagcg taccagtgaa 780
ggcttcttcc gtactcatgc gggcattgag caagcgatca gccgtggcct ggcgtatgcg 840
ccatatgctg acctggtctg gtgtgaaacc tccacgccgg atctggaact ggcgcgtcgc 900
tttgcacaag ctatccacgc gaaatatccg ggcaaactgc tggcttataa ctgctcgccg 960
tcgttcaact ggcagaaaaa cctcgacgac aaaactattg ccagcttcca gcagcagctg 1020
tcggatatgg gctacaagtt ccagttcatc accctggcag gtatccacag catgtggttc 1080
aacatgtttg acctggcaaa cgcctatgcc cagggcgagg gtatgaagca ctacgttgag 1140
aaagtgcagc agccggaatt tgccgccgcg aaagatggct ataccttcgt atctcaccag 1200
caggaagtgg gtacaggtta cttcgataaa gtgacgacta ttattcaggg cggcacgtct 1260
tcagtcaccg cgctgaccgg ctccactgaa gaatcgcagt tctaa 1305
<210> 90
<211> 434
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 90
Met Lys Thr Arg Thr Gln Gln Ile Glu Glu Leu Gln Lys Glu Trp Thr
1 5 10 15
Gln Pro Arg Trp Glu Gly Ile Thr Arg Pro Tyr Ser Ala Glu Asp Val
20 25 30
Val Lys Leu Arg Gly Ser Val Asn Pro Glu Cys Thr Leu Ala Gln Leu
35 40 45
Gly Ala Ala Lys Met Trp Arg Leu Leu His Gly Glu Ser Lys Lys Gly
50 55 60
Tyr Ile Asn Ser Leu Gly Ala Leu Thr Gly Gly Gln Ala Leu Gln Gln
65 70 75 80
Ala Lys Ala Gly Ile Glu Ala Val Tyr Leu Ser Gly Trp Gln Val Ala
85 90 95
Ala Asp Ala Asn Leu Ala Ala Ser Met Tyr Pro Asp Gln Ser Leu Tyr
100 105 110
Pro Ala Asn Ser Val Pro Ala Val Val Glu Arg Ile Asn Asn Thr Phe
115 120 125
Arg Arg Ala Asp Gln Ile Gln Trp Ser Ala Gly Ile Glu Pro Gly Asp
130 135 140
Pro Arg Tyr Val Asp Tyr Phe Leu Pro Ile Val Ala Asp Ala Glu Ala
145 150 155 160
Gly Phe Gly Gly Val Leu Asn Ala Phe Glu Leu Met Lys Ala Met Ile
165 170 175
Glu Ala Gly Ala Ala Ala Val His Phe Glu Asp Gln Leu Ala Ser Val
180 185 190
Lys Lys Cys Gly His Met Gly Gly Lys Val Leu Val Pro Thr Gln Glu
195 200 205
Ala Ile Gln Lys Leu Val Ala Ala Arg Leu Ala Ala Asp Val Thr Gly
210 215 220
Val Pro Thr Leu Leu Val Ala Arg Thr Asp Ala Asp Ala Ala Asp Leu
225 230 235 240
Ile Thr Ser Asp Cys Asp Pro Tyr Asp Ser Glu Phe Ile Thr Gly Glu
245 250 255
Arg Thr Ser Glu Gly Phe Phe Arg Thr His Ala Gly Ile Glu Gln Ala
260 265 270
Ile Ser Arg Gly Leu Ala Tyr Ala Pro Tyr Ala Asp Leu Val Trp Cys
275 280 285
Glu Thr Ser Thr Pro Asp Leu Glu Leu Ala Arg Arg Phe Ala Gln Ala
290 295 300
Ile His Ala Lys Tyr Pro Gly Lys Leu Leu Ala Tyr Asn Cys Ser Pro
305 310 315 320
Ser Phe Asn Trp Gln Lys Asn Leu Asp Asp Lys Thr Ile Ala Ser Phe
325 330 335
Gln Gln Gln Leu Ser Asp Met Gly Tyr Lys Phe Gln Phe Ile Thr Leu
340 345 350
Ala Gly Ile His Ser Met Trp Phe Asn Met Phe Asp Leu Ala Asn Ala
355 360 365
Tyr Ala Gln Gly Glu Gly Met Lys His Tyr Val Glu Lys Val Gln Gln
370 375 380
Pro Glu Phe Ala Ala Ala Lys Asp Gly Tyr Thr Phe Val Ser His Gln
385 390 395 400
Gln Glu Val Gly Thr Gly Tyr Phe Asp Lys Val Thr Thr Ile Ile Gln
405 410 415
Gly Gly Thr Ser Ser Val Thr Ala Leu Thr Gly Ser Thr Glu Glu Ser
420 425 430
Gln Phe
<210> 91
<211> 939
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 91
atggatatca tcttttatca cccaacgttc gatacccaat ggtggattga ggcactgcgc 60
aaagctattc ctcaggcaag agtcagagca tggaaaagcg gagataatga ctctgctgat 120
tatgctttag tctggcatcc tcctgttgaa atgctggcag ggcgcgatct taaagcggtg 180
ttcgcactcg gggccggtgt tgattctatt ttgagcaagc tacaggcaca ccctgaaatg 240
ctgaaccctt ctgttccact ttttcgcctg gaagataccg gtatgggcga gcaaatgcag 300
gaatatgctg tcagtcaggt gctgcattgg tttcgacgtt ttgacgatta tcgcatccag 360
caaaatagtt cgcattggca accgctgcct gaatatcatc gggaagattt taccatcggc 420
attttgggcg caggcgtact gggcagtaaa gttgctcaga gtctgcaaac ctggcgcttt 480
ccgctgcgtt gctggagtcg aacccgtaaa tcgtggcctg gcgtgcaaag ctttgccgga 540
cgggaagaac tgtctgcatt tctgagccaa tgtcgggtat tgattaattt gttaccgaat 600
acccctgaaa ccgtcggcat tattaatcaa caattactcg aaaaattacc ggatggcgcg 660
tatctcctca acctggcgcg tggtgttcat gttgtggaag atgacctgct cgcggcgctg 720
gatagcggca aagttaaagg cgcaatgttg gatgttttta atcgtgaacc cttaccgcct 780
gaaagtccgc tctggcaaca tccacgcgtg acgataacac cacatgtcgc cgcgattacc 840
cgtcccgctg aagctgtgga gtacatttct cgcaccattg cccagctcga aaaaggggag 900
agggtctgcg ggcaagtcga ccgcgcacgc ggctactaa 939
<210> 92
<211> 312
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 92
Met Asp Ile Ile Phe Tyr His Pro Thr Phe Asp Thr Gln Trp Trp Ile
1 5 10 15
Glu Ala Leu Arg Lys Ala Ile Pro Gln Ala Arg Val Arg Ala Trp Lys
20 25 30
Ser Gly Asp Asn Asp Ser Ala Asp Tyr Ala Leu Val Trp His Pro Pro
35 40 45
Val Glu Met Leu Ala Gly Arg Asp Leu Lys Ala Val Phe Ala Leu Gly
50 55 60
Ala Gly Val Asp Ser Ile Leu Ser Lys Leu Gln Ala His Pro Glu Met
65 70 75 80
Leu Asn Pro Ser Val Pro Leu Phe Arg Leu Glu Asp Thr Gly Met Gly
85 90 95
Glu Gln Met Gln Glu Tyr Ala Val Ser Gln Val Leu His Trp Phe Arg
100 105 110
Arg Phe Asp Asp Tyr Arg Ile Gln Gln Asn Ser Ser His Trp Gln Pro
115 120 125
Leu Pro Glu Tyr His Arg Glu Asp Phe Thr Ile Gly Ile Leu Gly Ala
130 135 140
Gly Val Leu Gly Ser Lys Val Ala Gln Ser Leu Gln Thr Trp Arg Phe
145 150 155 160
Pro Leu Arg Cys Trp Ser Arg Thr Arg Lys Ser Trp Pro Gly Val Gln
165 170 175
Ser Phe Ala Gly Arg Glu Glu Leu Ser Ala Phe Leu Ser Gln Cys Arg
180 185 190
Val Leu Ile Asn Leu Leu Pro Asn Thr Pro Glu Thr Val Gly Ile Ile
195 200 205
Asn Gln Gln Leu Leu Glu Lys Leu Pro Asp Gly Ala Tyr Leu Leu Asn
210 215 220
Leu Ala Arg Gly Val His Val Val Glu Asp Asp Leu Leu Ala Ala Leu
225 230 235 240
Asp Ser Gly Lys Val Lys Gly Ala Met Leu Asp Val Phe Asn Arg Glu
245 250 255
Pro Leu Pro Pro Glu Ser Pro Leu Trp Gln His Pro Arg Val Thr Ile
260 265 270
Thr Pro His Val Ala Ala Ile Thr Arg Pro Ala Glu Ala Val Glu Tyr
275 280 285
Ile Ser Arg Thr Ile Ala Gln Leu Glu Lys Gly Glu Arg Val Cys Gly
290 295 300
Gln Val Asp Arg Ala Arg Gly Tyr
305 310
<210> 93
<211> 1056
<212> DNA
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 93
atgaaagggt ttgccatgtt aggtatcaat aaactgggct ggattgaaaa agagcgcccg 60
gtggcgggtt catacgatgc aattgttcgt ccgctggccg tcagtccgtg caccagcgac 120
atccatacag tctttgaagg tgccctgggt gatcggaaaa acatgattct gggccatgaa 180
gccgtaggcg aagtagtgga agtgggcagc gaggtaaagg atttcaaacc gggtgatcgc 240
gtaattgttc cttgcacgac cccagattgg cgctcactgg aagttcaggc tggttttcag 300
cagcatagta acggtatgtt agcaggctgg aagtttagca attttaaaga cggggtgttc 360
ggggagtatt ttcatgtcaa cgatgcggac atgaatctgg ctattttacc taaagatatg 420
ccgctggaga acgcagtgat gattaccgac atgatgacga caggctttca cggtgcagaa 480
ctggctgaca tccaaatggg ctccagtgtg gtggttatcg gtattggtgc ggtcgggctg 540
atgggtatcg cgggcgcgaa attacggggc gctggtcgca tcatcggtgt cggcagccgt 600
ccaatttgcg ttgaagcagc taaattctat ggtgccacgg acattctgaa ctataaaaat 660
ggtcacatcg tcgatcaggt gatgaaactg accaatggca aaggtgtgga ccgcgtgatc 720
atggcgggcg gcggctcaga gactttatct caagcggtgt ctatggttaa acctgggggc 780
atcatttcta atattaacta tcatggctcc ggcgacgcat tactgatccc gcgtgttgaa 840
tggggctgtg ggatggccca caaaaccatt aaaggggggt tatgtccggg tggtcgcctg 900
cgtgccgaaa tgctgcgtga catggtggtt tacaaccgtg tggatctgtc caaactggta 960
actcacgtat accacggttt cgatcacatt gaagaggcgc tgctgctgat gaaggataag 1020
ccaaaggatc tgattaaggc ggttgttatc ctgtaa 1056
<210> 94
<211> 351
<212> PRT
<213> 拜氏梭菌(Clostridium beijerinckii)
<400> 94
Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu
1 5 10 15
Lys Glu Arg Pro Val Ala Gly Ser Tyr Asp Ala Ile Val Arg Pro Leu
20 25 30
Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala
35 40 45
Leu Gly Asp Arg Lys Asn Met Ile Leu Gly His Glu Ala Val Gly Glu
50 55 60
Val Val Glu Val Gly Ser Glu Val Lys Asp Phe Lys Pro Gly Asp Arg
65 70 75 80
Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln
85 90 95
Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe
100 105 110
Ser Asn Phe Lys Asp Gly Val Phe Gly Glu Tyr Phe His Val Asn Asp
115 120 125
Ala Asp Met Asn Leu Ala Ile Leu Pro Lys Asp Met Pro Leu Glu Asn
130 135 140
Ala Val Met Ile Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu
145 150 155 160
Leu Ala Asp Ile Gln Met Gly Ser Ser Val Val Val Ile Gly Ile Gly
165 170 175
Ala Val Gly Leu Met Gly Ile Ala Gly Ala Lys Leu Arg Gly Ala Gly
180 185 190
Arg Ile Ile Gly Val Gly Ser Arg Pro Ile Cys Val Glu Ala Ala Lys
195 200 205
Phe Tyr Gly Ala Thr Asp Ile Leu Asn Tyr Lys Asn Gly His Ile Val
210 215 220
Asp Gln Val Met Lys Leu Thr Asn Gly Lys Gly Val Asp Arg Val Ile
225 230 235 240
Met Ala Gly Gly Gly Ser Glu Thr Leu Ser Gln Ala Val Ser Met Val
245 250 255
Lys Pro Gly Gly Ile Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp
260 265 270
Ala Leu Leu Ile Pro Arg Val Glu Trp Gly Cys Gly Met Ala His Lys
275 280 285
Thr Ile Lys Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Ala Glu Met
290 295 300
Leu Arg Asp Met Val Val Tyr Asn Arg Val Asp Leu Ser Lys Leu Val
305 310 315 320
Thr His Val Tyr His Gly Phe Asp His Ile Glu Glu Ala Leu Leu Leu
325 330 335
Met Lys Asp Lys Pro Lys Asp Leu Ile Lys Ala Val Val Ile Leu
340 345 350
<210> 95
<211> 95
<212> DNA
<213> 大肠杆菌(Escherichia coli)
<400> 95
gattgatttg tcgcaatgat tgacacgatt ccgcttgacg ctgcgtaagg tttttgtaat 60
tttacaggca accttttatt cactaacaaa tagct 95
<210> 96
<211> 190
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> OXB20启动子
<400> 96
aagctgttgt gaccgcttgc tctagccagc tatcgagttg tgaaccgatc catctagcaa 60
ttggtctcga tctagcgata ggcttcgatc tagctatgta gaaacgccgt gtgctcgatc 120
gcttgataag gtccacgtag ctgctataat tgcttcaaca gaacatattg actatccggt 180
attacccggc 190
<210> 97
<211> 768
<212> DNA
<213> 异种伯克霍尔德氏菌(Burkholderia xenovorans)
<400> 97
atgtcatacg caatttaccc ttcgttaagt ggtaagacag tggtgattac tgggggggga 60
tcaggaatcg gagctgcgat ggttgaagca ttcgcccgcc agggagcgcg tgtatttttt 120
ttggatgtag ccgaagatga ctcgcttgcg cttcaacaga gcctgtccga cgcgccacac 180
ccacccctgt tccgtcgctg tgacttacgc tcagtagacg caatccattc cgcctttgca 240
ggtatcgttg aaatcgcagg gccgattgag gttttggtta acaatgcagg caatgacgat 300
cgtcatgagg tcgacgctat tacaccggcg tattgggacg agcgcatggc cgtgaatctg 360
cgccatcaat tcttctgtgc ccaagctgcg gctgctggaa tgcgtaaaat tggacgcggg 420
gtcatcctga atttgggtag tgtttcctgg catcttgcgt tgccgaactt ggcgatctac 480
atgagtgcga aggcgggtat tgagggcctg actcgtggac ttgcacgcga tttgggcgca 540
gccggcatcc gcgtaaattg tattattcct ggagctgtac gtacgccccg tcagatgcag 600
ctttggcagt ccccggagtc ggaagcgaag ctggtggcgt cacagtgtct tcgtcttcgc 660
atcgaacccg agcacgtagc tcgcatggca ttatttttgg catctgacga cgcaagccgc 720
tgttcaggcc gcgattattt cgttgatgct ggctggtatg gagagtaa 768
<210> 98
<211> 382
<212> PRT
<213> 大肠杆菌(Escherichia coli)
<400> 98
Met Ala Asn Arg Met Ile Leu Asn Glu Thr Ala Trp Phe Gly Arg Gly
1 5 10 15
Ala Val Gly Ala Leu Thr Asp Glu Val Lys Arg Arg Gly Tyr Gln Lys
20 25 30
Ala Leu Ile Val Thr Asp Lys Thr Leu Val Gln Cys Gly Val Val Ala
35 40 45
Lys Val Thr Asp Lys Met Asp Ala Ala Gly Leu Ala Trp Ala Ile Tyr
50 55 60
Asp Gly Val Val Pro Asn Pro Thr Ile Thr Val Val Lys Glu Gly Leu
65 70 75 80
Gly Val Phe Gln Asn Ser Gly Ala Asp Tyr Leu Ile Ala Ile Gly Gly
85 90 95
Gly Ser Pro Gln Asp Thr Cys Lys Ala Ile Gly Ile Ile Ser Asn Asn
100 105 110
Pro Glu Phe Ala Asp Val Arg Ser Leu Glu Gly Leu Ser Pro Thr Asn
115 120 125
Lys Pro Ser Val Pro Ile Leu Ala Ile Pro Thr Thr Ala Gly Thr Ala
130 135 140
Ala Glu Val Thr Ile Asn Tyr Val Ile Thr Asp Glu Glu Lys Arg Arg
145 150 155 160
Lys Phe Val Cys Val Asp Pro His Asp Ile Pro Gln Val Ala Phe Ile
165 170 175
Asp Ala Asp Met Met Asp Gly Met Pro Pro Ala Leu Lys Ala Ala Thr
180 185 190
Gly Val Asp Ala Leu Thr His Ala Ile Glu Gly Tyr Ile Thr Arg Gly
195 200 205
Ala Trp Ala Leu Thr Asp Ala Leu His Ile Lys Ala Ile Glu Ile Ile
210 215 220
Ala Gly Ala Leu Arg Gly Ser Val Ala Gly Asp Lys Asp Ala Gly Glu
225 230 235 240
Glu Met Ala Leu Gly Gln Tyr Val Ala Gly Met Gly Phe Ser Asn Val
245 250 255
Gly Leu Gly Leu Val His Gly Met Ala His Pro Leu Gly Ala Phe Tyr
260 265 270
Asn Thr Pro His Gly Val Ala Asn Ala Ile Leu Leu Pro His Val Met
275 280 285
Arg Tyr Asn Ala Asp Phe Thr Gly Glu Lys Tyr Arg Asp Ile Ala Arg
290 295 300
Val Met Gly Val Lys Val Glu Gly Met Ser Leu Glu Glu Ala Arg Asn
305 310 315 320
Ala Ala Val Glu Ala Val Phe Ala Leu Asn Arg Asp Val Gly Ile Pro
325 330 335
Pro His Leu Arg Asp Val Gly Val Arg Lys Glu Asp Ile Pro Ala Leu
340 345 350
Ala Gln Ala Ala Leu Asp Asp Val Cys Thr Gly Gly Asn Pro Arg Glu
355 360 365
Ala Thr Leu Glu Asp Ile Val Glu Leu Tyr His Thr Ala Trp
370 375 380

Claims (170)

1.一种能够从包含木糖和葡萄糖的原料产生发酵产物的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,并且其中所述微生物包含以下一项或多项:
(a)所述微生物的基因组中的戊糖ATP结合转运蛋白的缺失或失活,以使得所述转运蛋白不表达;
(b)一个或多个内源性或外源性核酸序列,其编码至少一种C5糖同向转运蛋白且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;
(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
2.如权利要求1所述的重组微生物,其中所述微生物产生的所述发酵产物是一种或多种包含1、2、3、4、5、6、7、8、9或10个碳的分子。
3.如权利要求2所述的重组微生物,其中同时产生两种或更多种分子。
4.一种能够从包含木糖和葡萄糖的原料产生发酵产物的重组大肠杆菌,其中重组微生物同时利用木糖和葡萄糖,并且其中所述微生物包含以下一项或多项:
(a)所述微生物的基因组中的ATP结合转运蛋白araFGH和xylFGH的缺失或失活,以使得所述转运蛋白不表达;
(b)一个或多个内源性或外源性核酸序列,其编码至少一种C5糖同向转运蛋白且可操作地连接至一个或多个组成型启动子;其中所述C5糖同向转运蛋白包括:(1)木糖同向转运蛋白和/或(2)阿拉伯糖同向转运蛋白;
(c)一个或多个内源性或外源性核酸序列,其(1)编码木糖异构酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木酮糖激酶的缺失或失活和/或(2)编码木糖脱氢酶且可操作地连接至一个或多个组成型启动子,以及一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
5.一种能够从包含木糖和葡萄糖的原料产生单乙二醇(MEG)和/或丙酮的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:
(a)亲本微生物的基因组中的aldA、araFGH和xylFGH的缺失或失活;以及
(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;
其中所述重组微生物表达MEG和/或丙酮产生途径。
6.如权利要求5所述的重组微生物,其中所述微生物还包含glcDEF的缺失或失活。
7.如权利要求5所述的重组微生物,其中所述C5同向转运蛋白由araFGH基因座处的GAPDH启动子控制。
8.如权利要求5所述的重组微生物,其中所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。
9.如权利要求5所述的重组微生物,其中所述XylE包括包含SEQ ID NO:49的氨基酸序列。
10.如权利要求5所述的重组微生物,其中所述XylE由包含SEQ ID NO:48的核酸序列编码。
11.如权利要求5所述的重组微生物,其中所述木糖同向转运蛋白是所述微生物内源性的。
12.如权利要求5所述的重组微生物,其中所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。
13.如权利要求12所述的重组微生物,其中所述AraE包括包含SEQ ID NO:47的氨基酸序列。
14.如权利要求12所述的重组微生物,其中所述AraE由包含SEQ ID NO:46的核酸序列编码。
15.如权利要求5所述的重组微生物,其中所述阿拉伯糖同向转运蛋白是所述微生物内源性的。
16.如权利要求5所述的重组微生物,其中所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。
17.如权利要求5所述的重组微生物,其中所述微生物包含功能性磷酸转移酶系统。
18.如权利要求5所述的重组微生物,其中所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。
19.如权利要求18所述的重组微生物,其中所述CRP包括包含SEQ ID NO:10的氨基酸序列。
20.如权利要求18所述的重组微生物,其中所述CRP由包含SEQ ID NO:9的核酸序列编码。
21.如权利要求5所述的重组微生物,其中所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。
22.如权利要求5所述的重组微生物,其中所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。
23.如权利要求5所述的重组微生物,其中连续木糖输入独立于其他糖在所述原料中的存在而发生。
24.如权利要求5所述的重组微生物,其中所述重组微生物包括MEG产生途径,所述途径具有以下(c)至(e)中的一项或多项;
(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;
(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及
(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。
25.如权利要求24所述的重组微生物,其中(c)和(d)在由proD启动子控制的操纵子中。
26.如权利要求25所述的重组微生物,其中所述proD启动子由包含SEQ ID NO:53的核酸序列编码。
27.如权利要求24所述的重组微生物,其中所述木糖异构酶是XylA。
28.如前述权利要求中任一项所述的重组微生物,其中所述木糖异构酶是所述微生物内源性的。
29.如权利要求27所述的重组微生物,其中所述XylA包括包含SEQ ID NO:6的氨基酸序列。
30.如权利要求27所述的重组微生物,其中所述XylA由包含SEQ ID NO:5的核酸序列编码。
31.如权利要求24所述的重组微生物,其中所述酮己糖激酶来自智人。
32.如权利要求24所述的重组微生物,其中所述酮己糖激酶是所述微生物异源性的。
33.如权利要求32所述的重组微生物,其中所述酮己糖激酶是khk-C。
34.如权利要求33所述的重组微生物,其中所述khk-C包括包含SEQ ID NO:12的氨基酸序列。
35.如权利要求33所述的重组微生物,其中所述khk-C由包含SEQ ID NO:11的核酸序列编码。
36.如权利要求24所述的重组微生物,其中所述果糖二磷酸醛缩酶来自智人。
37.如权利要求24所述的重组微生物,其中所述果糖二磷酸醛缩酶是所述微生物异源性的。
38.如权利要求37所述的重组微生物,其中所述果糖二磷酸醛缩酶是aldoB。
39.如权利要求38所述的重组微生物,其中所述aldoB包括包含SEQ ID NO:51的氨基酸序列。
40.如权利要求38所述的重组微生物,其中所述aldoB由包含SEQ ID NO:50的核酸序列编码。
41.如权利要求24所述的重组微生物,其中所述羟乙醛还原酶是所述微生物内源性的。
42.如权利要求24所述的重组微生物,其中所述羟乙醛还原酶是fucO。
43.如权利要求42所述的重组微生物,其中所述fucO包括包含SEQ ID NO:98的氨基酸序列。
44.如权利要求42所述的重组微生物,其中所述fucO由包含SEQ ID NO:52的核酸序列编码。
45.如权利要求24所述的重组微生物,其中所述木酮糖激酶是XylB。
46.如权利要求45所述的重组微生物,其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。
47.如权利要求45所述的重组微生物,其中所述xylB由包含SEQ ID NO:13的核酸序列编码。
48.如权利要求5所述的重组微生物,其中所述重组微生物包括MEG产生途径,所述途径具有以下(c)至(e)中的一项或多项;
(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;
(d)至少一个编码羟乙醛还原酶的内源性或外源性核酸分子的表达,所述羟乙醛还原酶催化羟乙醛至MEG的转化;以及
(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
49.如权利要求48所述的重组微生物,其中所述木糖脱氢酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。
50.如权利要求49所述的重组微生物,其中所述木糖脱氢酶是xdh。
51.如权利要求50所述的重组微生物,其中所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。
52.如权利要求50所述的重组微生物,其中所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。
53.如权利要求48所述的重组微生物,其中所述木糖脱氢酶是所述微生物异源性的。
54.如权利要求48所述的重组微生物,其中所述木糖酸内酯酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。
55.如权利要求54所述的重组微生物,其中所述木糖酸内酯酶是xylC。
56.如权利要求55所述的重组微生物,其中所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。
57.如权利要求55所述的重组微生物,其中所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。
58.如权利要求48所述的重组微生物,其中所述木糖酸内酯酶是所述微生物异源性的。
59.如权利要求48所述的重组微生物,其中所述木糖酸内酯酶是所述微生物内源性的。
60.如权利要求48所述的重组微生物,其中所述木糖脱水酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。
61.如权利要求60所述的重组微生物,其中所述木糖脱水酶是xylD。
62.如权利要求61所述的重组微生物,其中所述xylD包括包含SEQ ID NO:61、63或65的氨基酸序列。
63.如权利要求61所述的重组微生物,其中所述xylD由包含SEQ ID NO:60、62或64的核酸序列编码。
64.如权利要求48所述的重组微生物,其中所述木糖脱水酶是所述微生物异源性的。
65.如权利要求48所述的重组微生物,其中所述木糖脱水酶是所述微生物内源性的。
66.如权利要求48所述的重组微生物,其中所述羟乙醛还原酶是所述微生物内源性的。
67.如权利要求48所述的重组微生物,其中所述羟乙醛还原酶是fucO。
68.如权利要求49所述的重组微生物,其中所述fucO包括包含SEQ ID NO:98的氨基酸序列。
69.如权利要求49所述的重组微生物,其中所述fucO由包含SEQ ID NO:52的核酸序列编码。
70.如权利要求48所述的重组微生物,其中所述羟乙醛还原酶是所述微生物异源性的。
71.如权利要求48所述的重组微生物,其中所述木糖异构酶是XylA。
72.如权利要求71所述的重组微生物,其中所述xylA包括包含SEQ ID NO:6的氨基酸序列。
73.如权利要求71所述的重组微生物,其中所述xylA由包含SEQ ID NO:5的核酸序列编码。
74.如权利要求48所述的重组微生物,其中所述木酮糖激酶是XylB。
75.如权利要求74所述的重组微生物,其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。
76.如权利要求74所述的重组微生物,其中所述xylB由包含SEQ ID NO:13的核酸序列编码。
77.如权利要求24或48所述的重组微生物,其中所述重组微生物还包含丙酮产生途径,所述途径具有以下(f)至(h)中的一项或多项;
(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;
(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及
(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化。
78.如权利要求77所述的重组微生物,其中(f)、(g)和(h)在由OXB11启动子控制的操纵子中。
79.如权利要求76所述的重组微生物,其中所述OXB11启动子由包含SEQ ID NO:78的核酸序列编码。
80.如权利要求77所述的重组微生物,其中所述乙酰乙酰基辅酶A硫解酶来自丙酮丁醇梭菌(Clostridium acetobutylicum)。
81.如权利要求78所述的重组微生物,其中所述乙酰乙酰基辅酶A硫解酶包括包含SEQID NO:67或69的氨基酸序列。
82.如权利要求78所述的重组微生物,其中所述乙酰乙酰基辅酶A硫解酶由包含SEQ IDNO:66或68的核酸序列编码。
83.如权利要求77所述的重组微生物,其中所述乙酸:乙酰乙酰基辅酶A转移酶是AtoDA。
84.如权利要求81所述的重组微生物,其中AtoDA亚基α包括包含SEQ ID NO:72的氨基酸序列。
85.如权利要求81所述的重组微生物,其中AtoDA亚基α由包含SEQ ID NO:70的核酸序列编码。
86.如权利要求83所述的重组微生物,其中AtoDA亚基β包括包含SEQ ID NO:73的氨基酸序列。
87.如权利要求83所述的重组微生物,其中所述AtoDA亚基β由包含SEQ ID NO:71的核酸序列编码。
88.如权利要求77所述的重组微生物,其中所述乙酰乙酸脱羧酶来自拜氏梭菌(Clostridium beijerinckii)或丙酮丁醇梭菌(Clostridium acetobutylicum)。
89.如权利要求86所述的重组微生物,其中所述乙酰乙酸脱羧酶是Adc。
90.如权利要求86所述的重组微生物,其中所述Adc包括包含SEQ ID NO:75或77的氨基酸序列。
91.如权利要求88所述的重组微生物,其中所述Adc由包含SEQ ID NO:74或76的核酸序列编码。
92.如权利要求24或48所述的重组微生物,其中所述重组微生物还包含异丙醇产生途径,所述途径具有以下(f)至(i)中的一项或多项;
(f)至少一个编码乙酰乙酰基辅酶A硫解酶的外源性核酸分子的表达;
(g)至少一个编码乙酸:乙酰乙酰基辅酶A转移酶的外源性核酸分子的表达;以及
(h)至少一个编码乙酰乙酸脱羧酶的外源性核酸分子的表达,所述乙酰乙酸脱羧酶催化乙酰乙酸至丙酮的转化;
(i)至少一个编码醇脱氢酶的外源性核酸分子的表达,所述醇脱氢酶催化丙酮至异丙醇的转化。
93.一种能够从包含木糖和葡萄糖的原料产生乙醇酸的重组微生物,其中所述重组微生物同时利用木糖和葡萄糖,包含以下一项或多项:
(a)亲本微生物的基因组中的fucO、yqhD、araFGH和xylFGH的缺失或失活;以及
(b)至少一个内源性或外源性核酸分子的表达,所述核酸分子可操作地连接至一个或多个组成型启动子且编码C5糖同向转运蛋白;
其中所述重组微生物还表达一个或多个乙醇酸产生途径。
94.如权利要求91所述的重组微生物,其中所述微生物还包含glcDEF的缺失或失活。
95.如权利要求91所述的重组微生物,其中所述微生物还包含dkgA的缺失或失活。
96.如权利要求91所述的重组微生物,其中所述微生物还包含yahK的缺失或失活。
97.如权利要求91所述的重组微生物,其中所述木糖同向转运蛋白由araFGH基因座处的GAPDH启动子控制。
98.如权利要求91所述的重组微生物,其中所述C5糖同向转运蛋白是木糖同向转运蛋白XylE。
99.如权利要求96所述的重组微生物,其中所述XylE包括包含SEQ ID NO:49的氨基酸序列。
100.如权利要求96所述的重组微生物,其中所述XylE由包含SEQ ID NO:48的核酸序列编码。
101.如权利要求91所述的重组微生物,其中所述木糖同向转运蛋白是所述微生物内源性的。
102.如权利要求91所述的重组微生物,其中所述C5糖同向转运蛋白是阿拉伯糖同向转运蛋白AraE。
103.如权利要求91所述的重组微生物,其中所述阿拉伯糖同向转运蛋白是所述微生物内源性的。
104.如权利要求91所述的重组微生物,其中所述木糖的摄取对其他单糖的分解代谢阻遏不敏感。
105.如权利要求91所述的重组微生物,其中所述微生物包含功能性磷酸转移酶系统。
106.如权利要求91所述的重组微生物,其中所述微生物包含编码cAMP受体蛋白(CRP)的天然野生型核酸序列。
107.如权利要求104所述的重组微生物,其中所述CRP包括包含SEQ ID NO:10的氨基酸序列。
108.如权利要求104所述的重组微生物,其中所述CRP由包含SEQ ID NO:9的核酸序列编码。
109.如权利要求91所述的重组微生物,其中所述木糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。
110.如权利要求91所述的重组微生物,其中所述阿拉伯糖同向转运蛋白的组成型过表达使得能够将木糖从所述原料连续输入到所述微生物中。
111.如权利要求91所述的重组微生物,其中连续木糖输入独立于其他糖在所述原料中的存在而发生。
112.如权利要求91所述的重组微生物,其中所述重组微生物包括乙醇酸产生途径,所述途径具有以下(c)和(e)中的一项或多项;
(c)一个或多个编码木糖异构酶和/或酮己糖激酶和/或果糖二磷酸醛缩酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;
(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及
(e)亲本微生物的基因组中的一种或多种木酮糖激酶的缺失或失活。
113.如权利要求110所述的重组微生物,其中(c)和(d)在由proD启动子控制的操纵子中。
114.如权利要求111所述的重组微生物,其中所述proD启动子由包含SEQ ID NO:53的核酸序列编码。
115.如权利要求110所述的重组微生物,其中所述木糖异构酶是XylA。
116.如权利要求113所述的重组微生物,其中所述XylA包括包含SEQ ID NO:6的氨基酸序列。
117.如权利要求113所述的重组微生物,其中所述XylA由包含SEQ ID NO:5的核酸序列编码。
118.如权利要求110所述的重组微生物,其中所述木糖异构酶是所述微生物内源性的。
119.如权利要求110所述的重组微生物,其中所述酮己糖激酶来自智人。
120.如权利要求110所述的重组微生物,其中所述酮己糖激酶是所述微生物异源性的。
121.如权利要求118所述的重组微生物,其中所述酮己糖激酶是khk-C。
122.如权利要求119所述的重组微生物,其中所述khk-C包括包含SEQ ID NO:12的氨基酸序列。
123.如权利要求119所述的重组微生物,其中所述khk-C由包含SEQ ID NO:11的核酸序列编码。
124.如权利要求110所述的重组微生物,其中所述果糖二磷酸醛缩酶来自智人。
125.如权利要求122所述的重组微生物,其中所述果糖二磷酸醛缩酶是aldoB。
126.如权利要求123所述的重组微生物,其中所述aldoB包括包含SEQ ID NO:51的氨基酸序列。
127.如权利要求123所述的重组微生物,其中所述aldoB由包含SEQ ID NO:50的核酸序列编码。
128.如权利要求110所述的重组微生物,其中所述果糖二磷酸醛缩酶是所述微生物异源性的。
129.如权利要求110所述的重组微生物,其中所述羟乙醛脱氢酶是aldA。
130.如权利要求127所述的重组微生物,其中所述aldA包括包含SEQ ID NO:4的氨基酸序列。
131.如权利要求127所述的重组微生物,其中所述aldA由包含SEQ ID NO:3的核酸序列编码。
132.如权利要求110所述的重组微生物,其中所述羟乙醛脱氢酶是所述微生物内源性的。
133.如权利要求110所述的重组微生物,其中所述木酮糖激酶是XylB。
134.如权利要求131所述的重组微生物,其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。
135.如权利要求131所述的重组微生物,其中所述xylB由包含SEQ ID NO:13的核酸序列编码。
136.如权利要求91所述的重组微生物,其中所述重组微生物包括乙醇酸产生途径,所述途径具有以下(c)至(e)中的一项或多项;
(c)一个或多个编码木糖脱氢酶和/或木糖酸内酯酶和/或木糖脱水酶的内源性或外源性核酸序列的表达,所述核酸序列可操作地连接至一个或多个组成型启动子;
(d)至少一个编码羟乙醛脱氢酶的内源性或外源性核酸分子的表达,所述羟乙醛脱氢酶催化羟乙醛至乙醇酸的转化;以及
(e)亲本微生物的基因组中的一种或多种木糖异构酶和/或一种或多种木酮糖激酶的缺失或失活。
137.如权利要求134所述的重组微生物,其中(c)和(d)由所述proD启动子控制。
138.如权利要求135所述的重组微生物,其中所述proD启动子由包含SEQ ID NO:53的核酸序列编码。
139.如权利要求134所述的重组微生物,其中所述木糖异构酶是XylA。
140.如权利要求137所述的重组微生物,其中所述XylA包括包含SEQ ID NO:6的氨基酸序列。
141.如权利要求138所述的重组微生物,其中所述XylA由包含SEQ ID NO:5的核酸序列编码。
142.如权利要求134所述的重组微生物,其中所述木酮糖激酶是XylB。
143.如权利要求140所述的重组微生物,其中所述xylB包括包含SEQ ID NO:14的氨基酸序列。
144.如权利要求140所述的重组微生物,其中所述xylB由包含SEQ ID NO:13的核酸序列编码。
145.如权利要求134所述的重组微生物,其中所述木糖脱氢酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。
146.如权利要求143所述的重组微生物,其中所述木糖脱氢酶是xdh。
147.如权利要求144所述的重组微生物,其中所述xdh包括包含SEQ ID NO:16、17或19的氨基酸序列。
148.如权利要求144所述的重组微生物,其中所述xdh由包含SEQ ID NO:15、18或97的核酸序列编码。
149.如权利要求134所述的重组微生物,其中所述木糖脱氢酶是所述微生物异源性的。
150.如权利要求134所述的重组微生物,其中所述木糖酸内酯酶来自新月柄杆菌(Caulobacter crescentus)、异种伯克霍尔德氏菌(Burkholderia xenovorans)、沃氏富盐菌(Haloferax volcanii)。
151.如权利要求148所述的重组微生物,其中所述木糖酸内酯酶是xylC。
152.如权利要求149所述的重组微生物,其中所述xylC包括包含SEQ ID NO:55、57或59的氨基酸序列。
153.如权利要求149所述的重组微生物,其中所述xylC由包含SEQ ID NO:54、56或58的核酸序列编码。
154.如权利要求134所述的重组微生物,其中所述木糖酸内酯酶是所述微生物异源性的。
155.如权利要求134所述的重组微生物,其中所述木糖酸内酯酶是所述微生物内源性的。
156.如权利要求134所述的重组微生物,其中所述羟乙醛脱氢酶是aldA。
157.如权利要求154所述的重组微生物,其中所述aldA包括包含SEQ ID NO:4的氨基酸序列。
158.如权利要求154所述的重组微生物,其中所述aldA由包含SEQ ID NO:3的核酸序列编码。
159.如权利要求134所述的重组微生物,其中所述羟乙醛脱氢酶是所述微生物内源性的。
160.如权利要求110或134所述的重组微生物,其中所述微生物还表达乙醇酸产生途径,所述途径具有以下中的一项或多项:
(f)至少一个编码异柠檬酸裂解酶的内源性或外源性核酸分子的表达;和/或
(g)至少一个编码乙醛酸还原酶的内源性或外源性核酸分子的表达。
161.如权利要求158所述的重组微生物,其中(f)和(g)在由OXB20启动子控制的操纵子中。
162.如权利要求159所述的重组微生物,其中所述OXB20启动子由包含SEQ ID NO:96的核酸序列编码。
163.如权利要求158所述的重组微生物,其中所述异柠檬酸裂解酶是AceA。
164.如权利要求161所述的重组微生物,其中所述AceA包括包含SEQ ID NO:90的氨基酸序列。
165.如权利要求161所述的重组微生物,其中所述AceA由包含SEQ ID NO:89的核酸序列编码。
166.如权利要求158所述的重组微生物,其中所述乙醛酸还原酶是YcdW。
167.如权利要求164所述的重组微生物,其中所述YcdW包括包含SEQ ID NO:92的氨基酸序列。
168.如权利要求164所述的重组微生物,其中所述YcdW由包含SEQ ID NO:91的核酸序列编码。
169.如前述权利要求中任一项所述的重组微生物,其中所述重组微生物来源于选自由以下项组成的组的亲本微生物:梭菌属(Clostridium sp.)、永达尔梭菌(Clostridiumljungdahlii)、产乙醇梭菌(Clostridium autoethanogenum)、拉氏梭菌(Clostridiumragsdalei)、粘液真杆菌(Eubacterium limosum)、嗜甲基丁酸杆菌(Butyribacteriummethylotrophicum)、热醋穆尔氏菌(Moorella thermoacetica)、醋酸梭菌(Clostridiumaceticum)、伍氏醋酸杆菌(Acetobacterium woodii)、巴氏嗜喊菌(Alkalibaculumbacchii)、德雷克氏梭菌(Clostridium drakei)、食一氧化碳梭菌(Clostridiumcarboxidivorans)、甲酸乙酸梭菌(Clostridium formicoaceticum)、粪味梭菌(Clostridium scatologenes)、热自养穆尔氏菌(Moorella thermoautotrophica)、长醋丝菌(Acetonema longum)、延长布劳特氏菌(Blautia producta)、乙二醇梭菌(Clostridiumglycolicum)、大梭菌(Clostridium magnum)、马永贝梭菌(Clostridium mayombei)、食甲氧基苯甲酸梭菌(Clostridium methoxybenzovorans)、丙酮丁醇梭菌(Clostridiumacetobutylicum)、拜氏梭菌(Clostridium beijerinckii)、普氏产醋杆菌(Oxobacterpfennigii)、凯伍嗜热厌氧菌(Thermoanaerobacter kivui)、卵形鼠孢菌(Sporomusaovata)、棕色嗜热产醋菌(Thermoacetogenium phaeum)、甲醇醋酸杆菌(Acetobacteriumcarbinolicum)、白蚁鼠孢菌(Sporomusa termitida)、甘油穆尔氏菌(Moorellaglycerini)、聚集性真杆菌(Eubacterium aggregans)、固氮密螺旋体(Treponemaazotonutricium)、大肠杆菌(Escherichia coli)、酿酒酵母(Saccharomycescerevisiae)、恶臭假单胞菌(Pseudomonas putida)、芽孢杆菌属(Bacillus sp.)、棒状杆菌属(Corynebacterium sp.)、解脂耶氏酵母(Yarrowia lipolytica)、树干毕赤酵母(Scheffersomyces stipitis)和甘油利用泰瑞孢子菌(Terrisporobacter glycolicus)。
170.如权利要求167所述的重组微生物,其中所述亲本微生物是大肠杆菌。
CN202080041307.XA 2019-04-04 2020-04-06 用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程 Active CN114008197B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962829398P 2019-04-04 2019-04-04
US62/829,398 2019-04-04
PCT/BR2020/050115 WO2020198830A1 (en) 2019-04-04 2020-04-06 Metabolic engineering for simultaneous consumption of xylose and glucose for production of chemicals from second generation sugars

Publications (2)

Publication Number Publication Date
CN114008197A true CN114008197A (zh) 2022-02-01
CN114008197B CN114008197B (zh) 2025-05-27

Family

ID=70616878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080041307.XA Active CN114008197B (zh) 2019-04-04 2020-04-06 用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程

Country Status (6)

Country Link
US (1) US11746361B2 (zh)
EP (1) EP3935154A1 (zh)
JP (1) JP7715636B2 (zh)
CN (1) CN114008197B (zh)
BR (1) BR112021018925A2 (zh)
WO (1) WO2020198830A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115927149A (zh) * 2022-11-09 2023-04-07 浙江大学杭州国际科创中心 一种恶臭假单胞菌工程菌及其制备方法和应用

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11541105B2 (en) 2018-06-01 2023-01-03 The Research Foundation For The State University Of New York Compositions and methods for disrupting biofilm formation and maintenance
US20250179422A1 (en) * 2021-08-30 2025-06-05 Amano Enzyme Inc. Microorganism with improved protein productivity and use thereof
KR102749582B1 (ko) * 2022-05-23 2025-01-07 울산과학기술원 포도당 및 자일로스를 동시에 탄소원으로 이용할 수 있는 슈도모나스 균주 변이체
DE102022119514A1 (de) * 2022-08-03 2024-02-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein Genetisch veränderte Zellen von Methylorubrum zur fermentativen Produktion von Glycolsäure und Milchsäure aus Cx-Verbindungen
CN116240232B (zh) * 2022-12-20 2024-11-29 天津科技大学 木葡糖酸醋杆菌中Weimberg木糖代谢途径的构建方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005113759A2 (en) * 2004-05-19 2005-12-01 Biotechnology Research And Development Corporation Microbial production of xylitol via a hexose phosphate and a pentose phosphate intermediate
JP2009112289A (ja) * 2007-09-14 2009-05-28 National Institute Of Advanced Industrial & Technology キシロース発酵酵母およびそれを用いたエタノールの生産方法
EP2407531A1 (en) * 2010-07-16 2012-01-18 Neste Oil Oyj Microorganisms with extended substrate utilization range
WO2014025747A1 (en) * 2012-08-07 2014-02-13 Codexis, Inc. Glucose and xylose co-utilization in e. coli
US20150050691A1 (en) * 2013-08-14 2015-02-19 Unist Academy-Industry Research Corporation Method for preparing mutant escherichia coli capable of simultaneously utilizing glucose and xylose
CN104603274A (zh) * 2012-08-05 2015-05-06 Absci有限责任公司 可诱导共表达系统
US20160083753A1 (en) * 2009-11-18 2016-03-24 Myriant Corporation Metabolic evolution of escherichia coli strains that produce organic acids
WO2016162712A1 (en) * 2015-04-07 2016-10-13 Metabolic Explorer Modified microorganism for the optimized production of 2,4-dihydroxyburyrate
US20170015988A1 (en) * 2015-07-13 2017-01-19 MARA Renewables Corporation Enhancing microbial metabolism of c5 organic carbon
WO2017156166A1 (en) * 2016-03-09 2017-09-14 Braskem S.A. Microorganisms and methods for the co-production of ethylene glycol and three carbon compounds

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6740506B2 (en) 1995-12-07 2004-05-25 Diversa Corporation End selection in directed evolution
US6033861A (en) 1997-11-19 2000-03-07 Incyte Genetics, Inc. Methods for obtaining nucleic acid containing a mutation
US20050214913A1 (en) 2004-03-16 2005-09-29 Marchenko Aleksey N Method for producing L-amino acids by fermentation using bacteria having enhanced expression of xylose utilization genes
WO2008076975A1 (en) 2006-12-18 2008-06-26 Advanced Bionutrition Corporation A dry food product containing live probiotic
WO2011022651A1 (en) 2009-08-21 2011-02-24 John Mcbride Production of propanols, alcohols, and polyols in consolidated bioprocessing organisms
EP4234696A3 (en) 2012-12-12 2023-09-06 The Broad Institute Inc. Crispr-cas component systems, methods and compositions for sequence manipulation
AU2014235968B2 (en) 2013-03-21 2018-05-24 Ospedale San Raffaele Srl Targeted disruption of T cell receptor genes using engineered zinc finger protein nucleases
FR3028529B1 (fr) * 2014-11-19 2016-12-30 Inst Nat De La Rech Agronomique Inra Procede de production d'au moins un metabolite d'interet par transformation d'un pentose dans un microorganisme
KR101774431B1 (ko) 2016-01-28 2017-09-05 한국과학기술원 자일로즈로부터 폴리(락테이트-co-글라이콜레이트) 또는 그 공중합체 생산능을 가지는 재조합 미생물 및 이를 이용한 폴리(락테이트-co-글라이콜레이트) 또는 그 공중합체의 제조방법

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005113759A2 (en) * 2004-05-19 2005-12-01 Biotechnology Research And Development Corporation Microbial production of xylitol via a hexose phosphate and a pentose phosphate intermediate
JP2009112289A (ja) * 2007-09-14 2009-05-28 National Institute Of Advanced Industrial & Technology キシロース発酵酵母およびそれを用いたエタノールの生産方法
US20160083753A1 (en) * 2009-11-18 2016-03-24 Myriant Corporation Metabolic evolution of escherichia coli strains that produce organic acids
EP2407531A1 (en) * 2010-07-16 2012-01-18 Neste Oil Oyj Microorganisms with extended substrate utilization range
CN104603274A (zh) * 2012-08-05 2015-05-06 Absci有限责任公司 可诱导共表达系统
WO2014025747A1 (en) * 2012-08-07 2014-02-13 Codexis, Inc. Glucose and xylose co-utilization in e. coli
US20150225745A1 (en) * 2012-08-07 2015-08-13 Codexis, Inc. Glucose and xylose co-utilization in e. coli
CN104371963A (zh) * 2013-08-14 2015-02-25 国立大学法人蔚山科学技术大学校产学协力团 用于制备能够同时利用葡萄糖和木糖的突变大肠杆菌的方法
US20150050691A1 (en) * 2013-08-14 2015-02-19 Unist Academy-Industry Research Corporation Method for preparing mutant escherichia coli capable of simultaneously utilizing glucose and xylose
WO2016162712A1 (en) * 2015-04-07 2016-10-13 Metabolic Explorer Modified microorganism for the optimized production of 2,4-dihydroxyburyrate
US20170015988A1 (en) * 2015-07-13 2017-01-19 MARA Renewables Corporation Enhancing microbial metabolism of c5 organic carbon
CN107849514A (zh) * 2015-07-13 2018-03-27 玛拉可再生能源公司 增强木糖的微藻代谢
WO2017156166A1 (en) * 2016-03-09 2017-09-14 Braskem S.A. Microorganisms and methods for the co-production of ethylene glycol and three carbon compounds
CN109312373A (zh) * 2016-03-09 2019-02-05 布拉斯肯有限公司 用于共生产乙二醇和三碳化合物的微生物和方法

Non-Patent Citations (7)

* Cited by examiner, † Cited by third party
Title
CEREN ALKIM等: ""Optimization of ethylene glycol production from (d)-xylose via a synthetic pathway implemented in Escherichia coli"", MICROBIAL CELL FACTORIES, vol. 14, 4 September 2015 (2015-09-04), pages 1 - 12 *
JOJIMA, T 等: ""Sugar transporters in efficient utilization of mixed sugar substrates: current knowledge and outlook"", APPLIED MICROBIOLOGY AND BIOTECHNOLOGY, vol. 85, no. 3, 31 January 2010 (2010-01-31), pages 471 - 480, XP019778598 *
PANAHI HKS 等: ""Engineered bacteria for valorizing lignocellulosic biomass into bioethanol"", BIORESOURCE TECHNOLOGY, vol. 344, 31 January 2022 (2022-01-31), pages 126212 *
SALUSJÄRVI L 等: ""Biotechnological production of glycolic acid and ethylene glycol: current state and perspectives"", APPLIED MICROBIOLOGY AND BIOTECHNOLOGY, vol. 103, no. 6, 1 February 2019 (2019-02-01), pages 2525 - 2535, XP036746619, DOI: 10.1007/s00253-019-09640-2 *
UTRILLA J 等: ""Production of D-lactate from sugarcane bagasse and corn stover hydrolysates using metabolic engineered Escherichia coli strains"", BIORESOURCE TECHNOLOGY, vol. 220, 20 August 2016 (2016-08-20), pages 208 - 214 *
李燕军: ""微生物同步利用葡萄糖和木糖代谢工程概述"", 发酵科技通讯, vol. 46, no. 1, 25 February 2017 (2017-02-25), pages 54 - 59 *
袁润: ""地衣芽胞杆菌木糖利用代谢工程"", 中国优秀硕士学位论文全文数据库 基础科学辑, no. 9, 15 September 2014 (2014-09-15), pages 006 - 115 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115927149A (zh) * 2022-11-09 2023-04-07 浙江大学杭州国际科创中心 一种恶臭假单胞菌工程菌及其制备方法和应用
CN115927149B (zh) * 2022-11-09 2025-07-01 浙江大学杭州国际科创中心 一种恶臭假单胞菌工程菌及其制备方法和应用

Also Published As

Publication number Publication date
WO2020198830A1 (en) 2020-10-08
US11746361B2 (en) 2023-09-05
JP7715636B2 (ja) 2025-07-30
EP3935154A1 (en) 2022-01-12
BR112021018925A2 (pt) 2022-01-18
US20200318146A1 (en) 2020-10-08
CN114008197B (zh) 2025-05-27
JP2022528894A (ja) 2022-06-16

Similar Documents

Publication Publication Date Title
CN114008197B (zh) 用于同时消耗木糖和葡萄糖以从第二代糖产生化学物质的代谢工程
US12006523B2 (en) Method for the in vivo synthesis of 4-hydroxymethylfurfural and derivatives thereof
US10633684B2 (en) Production of riboflavin
CN113166798B (zh) 通过核酸内切酶保护的靶向富集
AU5016500A (en) Directed evolution of microorganisms
CN106795483A (zh) 用于生产脂肪酸和脂肪酸衍生产物的微生物及方法
EA031093B1 (ru) Рекомбинантный карбоксидотрофный ацетогенный микроорганизм, способ его получения и способ получения продуктов с его использованием
JP2010207094A (ja) プロトカテク酸の製造法
JP2022515078A (ja) マロン酸セミアルデヒドからの3-HPおよびアセチル-CoA誘導体の共産生経路
KR20210015881A (ko) 메타크릴레이트 제조 방법
KR20190097250A (ko) 신규한 효소를 사용한 메틸글리옥살의 히드록시아세톤으로의 전환 및 그의 적용
US11814663B2 (en) Microorganisms with improved 1,3-propanediol and butyric acid production
KR102683624B1 (ko) 기능적 dna 서열의 안정화된 카피 수를 갖는 미생물 및 관련 방법
KR101541034B1 (ko) D―갈락토네이트 고생산 대장균 균주 및 이의 용도
KR101863239B1 (ko) 아세트산을 유일 탄소원으로 이용할 수 있는 미생물
EP2970869A2 (en) Low-phosphate repressible promoter
KR20190029964A (ko) 신규한 재조합 대장균 균주 및 이를 이용한 3-하이드록시프로피온산 생산 방법
KR101533290B1 (ko) D―갈락토네이트 고생산 대장균 균주 및 이의 용도
RU2790445C2 (ru) Улучшенный способ получения фукозилированных олигосахаридов
WO2021105212A1 (en) Means and methods to modulate acetic acid tolerance in industrial fermentations
EA013412B1 (ru) Новый ген sms 27

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant