CN101809030A - 硫肽前体蛋白质、编码该蛋白质的基因及其用途 - Google Patents
硫肽前体蛋白质、编码该蛋白质的基因及其用途 Download PDFInfo
- Publication number
- CN101809030A CN101809030A CN200880102696A CN200880102696A CN101809030A CN 101809030 A CN101809030 A CN 101809030A CN 200880102696 A CN200880102696 A CN 200880102696A CN 200880102696 A CN200880102696 A CN 200880102696A CN 101809030 A CN101809030 A CN 101809030A
- Authority
- CN
- China
- Prior art keywords
- ala
- leu
- arg
- gly
- val
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/36—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07D—HETEROCYCLIC COMPOUNDS
- C07D513/00—Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00
- C07D513/22—Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00 in which the condensed system contains four or more hetero rings
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K5/00—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
- C07K5/04—Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
- C07K5/06—Dipeptides
- C07K5/06139—Dipeptides with the first amino acid being heterocyclic
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K7/00—Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
- C07K7/04—Linear peptides containing only normal peptide links
- C07K7/08—Linear peptides containing only normal peptide links having 12 to 20 amino acids
Landscapes
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Peptides Or Proteins (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明涉及用于硫肽生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理该前体蛋白质的方法,或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物产生中的用途。
Description
本发明涉及用于硫肽(thiopeptide)生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理硫肽前体蛋白质的方法,或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物制备中的用途。
硫肽是天然的、富含硫的、高度修饰的大环肽,许多所述硫肽具有有效的抗生素活性。这些复杂的天然产物根据抗生素的Berdy化学分类分为噻唑肽(Berdy J.‘Recent developments of antibiotic research andclassification of antibiotics according to chemical structure.’Adv ApplMicrobiol.1974;18(0):309-406.)并包括硫链丝菌肽、诺雪七肽、微球菌素、nocathiacin、amythiamicin、GE2270A等。硫肽共有许多共同结构特征:聚集在中心多吡咯结构域中的三元或四元取代的氮杂环,其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架(framework)的一部分。硫肽的该大环标志使得它们与其他噻唑化合物,如博来霉素、杆菌肽、或小菌素B17区分开来。Hensens首先建议根据中心杂环结构域的结构和氧化状态对硫肽抗生素进行分类(O.D.Hensens和G.Albers-Schoenberg.‘Total structure of the peptide antibioticcomponents of thiopeptin by 1H and 13C NMR spectroscopy.’TetrahedronLett.1978,3649)。来自Cardiff University的Mark Bagley和同事的近期综述已经扩展了Hensens的分类系统,以描述5个不同的中心杂环结构域:四元取代脱氢哌啶或饱和哌啶、二氢咪唑哌啶、三元取代吡啶和四元取代羟基吡啶(Bagley等‘Thiopeptide antibiotics.’Chem Rev.2005年2月;105(2):685-714)。
尽管具有大量结构同源性,硫肽抗生素的作用(对蛋白质合成的抑制)位点和方式可分为两个功能类:结合称为L11结合结构域的23S核糖体RNA区域的那些和结合参与延伸循环的Ef-Tu蛋白质复合体的那些。经常认为在1954年首次分离为远青链霉菌(Streptomyces azureus)次生代谢物的硫链丝菌肽是硫肽家族的原型化合物(Donovick等‘Thiostrepton,a newantibiotic.’Antibiot Annu.1955-1956;3:554-9和Bagley等‘硫肽antibiotics.’Chem Rev.2005年2月;105(2):685-714)。
假定硫肽通过利用称为非核糖体肽合成酶(NRPS)的大的多酶复合体的非核糖体方法合成(Mocek等‘Biosynthesis of the modified peptideantibiotic thiostrepton in Streptomyces azureus and Streptomyceslaurentii’.J.Am.Chem.Soc.1993,115,7992-8001)。NRPS装配大环的实例是由真菌多孢木霉菌(Tolypocladium inflatum)产生的免疫抑制肽环胞菌素。NRPS装配肽不限于通常见于蛋白质的常见的20种L氨基酸。相反,这些酶具有掺入数百种不常见氨基酸及衍生残基的更广泛的所有成分的生物合成能力。
Washington大学的Heinz Floss等人指导的预实验揭示了硫肽的确由非核糖体途径产生。该研究组用抑制核糖体蛋白质合成水平的氯霉素处理培养物。然而,硫肽的从头产生仍然继续。当用于探测来自各生产生物的基因组DNA的Southern印迹时,来自代表硫链丝菌肽或相关诺雪七肽的氨基酸序列的寡核苷酸不能与任何同源序列杂交(T.M.Smith,Y.-F.Jiang,H.G.Floss.′Thiopeptide Antibiotics″in″Biotechnology of Antibiotics″W.R.Strohl,编著,第2版,Marcel-Dekker,New York,1997,第393-413页)。
此外,在生成菌株中已经鉴定了假定编码微球菌素合成酶复合体组件的NRPS基因片段(Carnio等‘Pyridinyl polythiazole class peptideantibiotic micrococcin P1,secreted by foodborne Staphylococcus equorumWS2733,is biosynthesized nonribosomally.’Eur J Biochem.2001年12月;268(24):6390-401.)。
然而,至今仍未有硫肽生物合成途径的出版说明书。
因此,需要鉴定参与硫肽生物合成的基因,其将为有效的硫肽制备提供工具并为产生可选的硫肽结构提供可能性。本发明满足了该需要并第一次公开了用于硫肽生物合成的染色体编码骨架(backbone)以及参与硫肽生物合成的核心生物合成酶。
1.作为硫肽生物合成起始材料的染色体编码骨架
本发明人确实已经发现了这样的确凿证据,例如在放线菌物种中染色体编码骨架是用于硫肽生物合成的起始材料。
第一方面,本发明涉及包含选自以下的氨基酸序列的硫肽前体蛋白质
(i)SEQ ID NO:1;
(ii)SEQ ID NO:5;
(iii)SEQ ID NO:11;和
(iv)任何所述氨基酸序列的变体。
如本文所用,术语“硫肽”指根据抗生素的Berdy’s化学分类的噻唑肽,与其他噻唑化合物,如博来霉素、杆菌肽、或小菌素B17相反,其特征在于聚集在中心多吡咯结构域中的三元或四元取代氮杂环,其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架的一部分。
术语“硫肽前体蛋白质”指可用作体外或体内硫肽合成起始材料的基因编码多肽骨架。优选地,所述硫肽前体是细菌延伸因子Ef-tu的抑制剂的前体。Ef-tu抑制剂描述于例如Hogg T,Mesters JR和Hilgenfeld R.(‘Inhibitory mechanisms of antibiotics targeting elongation factor Tu.’Curr Protein Pept Sci.2002年2月;3(1):121-31)的综述中。众所周知的Ef-tu抑制剂的实例是GE2270A(如Selva等‘Antibiotic GE2270A:a novelinhibitor of bacterial protein synthesis.I.Isolation and characterization.’J Antibiot(Tokyo).1991年7月;44(7):693-701中定义)、GE37648A(如Stella等‘Antibiotic GE37468A:a new inhibitor of bacterial protein synthesis.I.Isolation and characterization.’J Antibiot(Tokyo).1995年8月;48(8):780-6、Erratum:J Antibiot(Tokyo)1995年12月;48(12):C-3中定义)和Amythiamicin(如(‘Novel antibiotics,amythiamicins.’J Antibiot(Tokyo).1994年6月;47(6):668-74,1145-52和1153-9中定义)。新的Ef-tu抑制剂也描述于2007年12月19日提交的国际专利申请号PCT/US07/025955中。此类新Ef-tu抑制剂更特异地包括如下表示的通式I到XI的化合物(包括其可药用盐,以及其对映异构体、立体异构体、旋转异构体、互变异构体、非对映体或外消旋物):
这种前体蛋白的氨基酸序列对硫肽的最终结构至关重要。如将在下文中详细描述的,本发明的硫肽前体蛋白质可用于再生新鉴定的硫肽的骨架或产生已知硫肽的新衍生物,其例如具有改良性质。
本发明因此不仅涉及SEQ ID NO:1、SEQ ID NO:5或SEQ ID NO:11的前体蛋白,也涉及可用于硫肽衍生物生物合成的任何变体。本领域技术人员将知道怎样根据待合成硫肽的氨基酸骨架设计所述变体。在SEQ IDNO:1中,在14氨基酸骨架中发现的六个半胱氨酸是修饰这些分子的噻唑杂环的前体。此外,两个丝氨酸残基参与吡啶环系在大环和侧链交界处的形成。在GE2270A分子的硫肽侧链中发现了额外的噁唑啉,并在通式(I)到(XI)的新Ef-tu抑制剂中发现了分别通过丝氨酸的杂环化和脱水形成的脱氢丙氨酸残基。
在特定实施方案中,当与原始序列相比时,SEQ ID NO:1、SEQ ID NO5或SEQ ID NO 11的变体具有不超过1、2、3、4、5、6或10个缺失、插入或取代的氨基酸。取代的氨基酸可以是具有等同功能团或不同功能团的天然氨基酸或非天然氨基酸。
下表1给出了可用于相应特定硫肽生物合成的硫肽前体蛋白质序列(SEQ ID NO:1-14)的指示。
表1.硫肽氨基酸骨架的一级序列比对。所述比对集中在形成标记多取代氮杂环的两个不变丝氨酸分子结合的大环周围。硫链丝菌肽具有4个氨基酸的额外氨基延伸。
在本申请中使用以下标准密码字母用于描述任何氨基酸、肽和蛋白质序列:A,丙氨酸;R,精氨酸;N,天冬酰胺;D,天冬氨酸;C,半胱氨酸;Q,谷氨酰胺;E,谷氨酸;G,甘氨酸;H,组氨酸;I,异亮氨酸;L,亮氨酸;K,赖氨酸;M,甲硫氨酸;F,苯丙氨酸;P,脯氨酸;S,丝氨酸;T,苏氨酸;W,色氨酸;Y,酪氨酸;V,缬氨酸。
更普遍地,在一个特定实施方案中,氨基酸序列SEQ ID NO:1的所述变体具有以下通式:SXNCXCXXCCSCSX,其中X可以是任何氨基酸。更优选地,SEQ ID NO:1的所述变体包含以下通式:SX1NC X2CX3X4CCSCSX5,其中X1是C或S,X2是V或F,X3是G或Y,X4是a F,P、I或V并且X5是P或S。此类变体的实例是SEQ ID NO:2-4的前体蛋白。
在另一特定实施方案中,氨基酸序列SEQ ID NO:5的所述变体包含以下通式:SC X1 X2 X3C X4C X5 X6X7X8,其中X1是T或V,优选T,X2是T或G,优选T,X3是C或S,优选C,X4是任何氨基酸,优选V、I、E或A,X5是任何氨基酸,优选T、C、V或A,X6和X7独立地是C或S,优选C,X8是C或S,并且X9是任何非氨基酸残基,或T或S。此类变体的实例是SEQ ID NO:6-10的前体蛋白。
在另一特定实施方案中,氨基酸序列SEQ ID NO:11的所述变体包含以下通式:SC X1 X2S X3 X4 X5 X6SSSSSS,其中X1是T或V,优选T,X2是T或G,优选T,X3是S、G或A,X4是V、C或A,X5是S、T或A,X6是C或S。此类变体的实例是SEQ ID NO:12-14的前体蛋白。
2.编码硫肽前体蛋白质的基因的核酸
本发明还提供编码硫肽前体蛋白质的基因和/或可读框的核酸。更具体是,本发明提供包含编码如上所定义的硫肽前体蛋白质的核苷酸序列的核酸。
“核酸”指核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯多聚体形式,或其任何磷酸酯类似物,如单链形式或双链螺旋的硫代磷酸酯类和硫代酸酯类。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋(helices)是可能的。术语核酸,具体而言DNA或RNA分子仅指分子的一级和二级结构,并不限于任何特定三级形式。因此,该术语包括尤其是见于线性(例如限制性片段)或环形DNA分子、质粒和染色体中的双链DNA。
“重组DNA分子”是已经进行分子生物学操作的DNA分子。
“多核苷酸”或“核苷酸序列”是核酸,如DNA和RNA中的一系列核苷酸碱基(也称作“核苷酸”),并表示两个或更多个核苷酸的任何链。核苷酸序列通常携带遗传信息,包括用于产生蛋白质和酶的细胞装置的信息。这些术语包括双链或单链基因组和cDNA、RNA、任何合成的和遗传处理的多核苷酸,以及正义和反义多核苷酸(尽管此处仅表示了正义链)。这包括单链和双链分子,即DNA-DNA、DNA-RNA和RNA-RNA杂合体。这也包括含有修饰碱基,例如硫代尿嘧啶、硫代鸟嘌呤和氟代尿嘧啶的核酸。
本文中核酸的侧翼可以是天然调节(表达控制)序列,或可以与包括启动子、其他核糖体结合位点序列、调节响应元件、信号序列等的异源序列连接。也可通过本领域已知的任何手段修饰所述核酸。此类修饰的非限制性实例包括甲基化、“帽子”、类似物对一个或多个天然核苷酸的取代和核苷酸间修饰,如具有不带电连接(例如甲基化磷酸酯类、磷酸三酯类、氨基磷酸盐类、氨基甲酸酯类等)和带电连接(例如硫代磷酸酯类、二硫代磷酸酯类等)的那些。
术语“基因”,也称为“结构基因”表示编码或对应于包含一个或多个蛋白质所有或部分的氨基酸特定序列的DNA序列,并可以包括或可以不包括调节DNA序列,如启动子序列,其决定例如基因表达的条件。非结构基因的一些基因可以从DNA转录成RNA,但不翻译成氨基酸序列。其他基因可以作为结构基因的调节物或DNA转录的调节物起作用。
“编码序列”或“编码”表达产物如RNA、多肽、蛋白质或酶的序列,是当表达时产生所述RNA、多肽、蛋白质或酶的核苷酸序列,即所述核苷酸序列编码所述多肽、蛋白质或酶的氨基酸序列。蛋白质的编码序列可包括起始密码子(一般是ATG或GTG)和终止密码子。
当RNA聚合酶转录所述编码序列成为RNA,尤其是mRNA,并翻译成所述编码序列编码的蛋白质时,编码序列在细胞中处于表达控制序列的“控制下”或“有效连接”表达控制序列。
术语“异源的”指非天然元件的组合。例如,异源DNA指非天然定位于细胞,或所述细胞的染色体位点中的DNA。优选地,所述异源DNA包括对细胞外源的基因。例如,本发明包括包含DNA序列和非DNA序列部分的异源DNA序列的嵌合DNA分子。在该上下文中,所述异源DNA序列指非天然定位于硫肽生物合成基因簇序列中的DNA序列。或者,所述异源DNA序列可以天然定位于其非天然位置处的生物合成基因簇中。异源表达调节元件是与不同基因而非自然界中有效连接的基因有效连接的元件。在本发明的上下文中,编码目的蛋白质的基因对所述基因插入其中用于克隆或表达的载体DNA是异源的,并且其对含有所述基因在其中表达的该载体的宿主细胞是异源的。
术语“表达控制序列”指组合以调节编码序列转录的启动子、任何增强子元件或抑制元件(例如复制起始区)。术语“表达”表示允许或引起基因或DNA序列中的信息表现出来,例如通过激活参与相应基因或DNA序列转录和翻译的细胞功能来产生蛋白质。在细胞中或由细胞表达DNA序列以形成“表达产物”如蛋白质。表达产物本身,例如所得蛋白质也可称作由细胞“表达”。表达产物的特征可以是细胞内的、细胞外的或分泌的。术语“细胞内的”表示在细胞内的某些东西。术语“细胞外的”表示细胞外的某些东西。如果物质从细胞上或细胞内到细胞外以显著量出现,那么其由细胞“分泌”。
术语“转化”表示“外源”(即外部的或细胞外的)基因、DNA或RNA序列引入细胞中,使得宿主细胞表达所述引入基因或序列,以产生期望物质,通常是所述引入基因或序列编码的蛋白质或酶。所述引入基因或序列也可称作“克隆”或“外源”基因或序列,可包括调节或控制序列,如起始序列、终止序列、启动子序列、信号序列、分泌序列或细胞遗传装置使用的其他序列。所述基因或序列可包括非功能序列或功能未知的序列。接受并表达引入DNA或RNA的宿主细胞已经被“转化”并且是“转化体”或“克隆”。引入宿主细胞的DNA或RNA可以来自任何来源,包括与宿主细胞相同的属或种的细胞,或不同属或种的细胞。
本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了小的结构基因,其编码SEQ ID NO:1和SEQ ID NO:3的整个肽骨架。前体前蛋白原的预测大小分别是57和49个氨基酸,并分别描述于SEQID NO:19和SEQ ID NO:20中。然而,存在表明可选翻译起始位点的许多起始密码子。所述14氨基酸硫肽前体序列位于C末端。
已经从如实施例4中所示的远青链霉菌ETH28555物种中鉴定了不相关的硫肽硫链丝菌肽的相似结构基因,并且其编码SEQ ID NO:6的整个肽骨架。硫链丝菌肽的前体前蛋白原的预测大小是60个氨基酸并描述于SEQID NO:65中。
在一个实施方案中,本发明的所述核酸包含编码SEQ ID NO:1的14氨基酸硫肽前体的SEQ ID NO:15的核苷酸序列。在另一实施方案中,本发明的所述核酸包含编码SEQ ID NO:3的14氨基酸硫肽前体的SEQ IDNO:16的核苷酸序列。本发明还包括编码SEQ ID NO:1、SEQ ID NO:5和SEQ ID NO:11的硫肽前体及其任何变体(如表1描述的那些前体变体)的任何核苷酸序列。此类核苷酸序列的实例描述于SEQ ID NO:17和18或SEQ ID NO:65中,分别编码SEQ ID NO:1和SEQ ID NO:3和SEQ IDNO:6的硫肽前体蛋白质。
以来自SEQ ID NO:15-18的探针或引物开始从已知硫肽产生菌中分离并鉴定本发明此类核苷酸序列的方法为本领域所熟知,并且该方法的一个实例示于实施例4中。例如,可使用编码14氨基酸前体蛋白质的区域侧翼的引物扩增硫肽产生菌株的基因组DNA,并从本文公开的SEQ ID NO:17或SEQ ID NO:18进行测定。
在另一实施方案中,本发明的所述核酸包含分别编码57个氨基酸或49个氨基酸的前蛋白原的SEQ ID NO:17或SEQ ID NO:18的核苷酸序列,或包含至少SEQ ID NO:15或SEQ ID NO:16的其任何片段。
还包括的是所述核酸的修饰。此类修饰包括,例如本领域已知的标记、甲基化和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加所选表达系统中的表达、产量和/或提高纯化,或用于另一期望目的。
在另一实施方案中,本发明的核酸有效连接异源转录和翻译控制序列。更优选,其为表达载体。
如本文使用,术语“表达载体”指载体,通过所述载体可以将核酸引入宿主细胞,导致引入序列的表达。在一个实施方案中,载体包含启动子和一个或多个控制元件(例如增强子元件),其对引入的核酸是异源的,但被宿主细胞识别和使用。在另一实施方案中,引入载体的序列保留由宿主细胞识别并表达的其天然启动子。在一个实施方案中,与本发明相容的载体是穿梭载体pSET152、pOJ436、pOJ446(Bierman等‘Plasmid cloningvectors for the conjugal transfer of DNA from Escherichia coli toStreptomyces spp.’Gene.1992年7月1日;116(1):43-9)、pHM11a(Motamedi等‘Integrative vectors for heterologous gene expression inStreptomyces spp.’Gene.1995年7月4日;160(1):25-31)和pIJ8600(Sun等‘Green fluorescent protein as a reporter for spatial and temporal geneexpression in Streptomyces coelicolor A3(2).’Microbiology.1999年9月;145(Pt 9):2221-7)及其衍生物。在另一实施方案中,所述载体是粘粒。
“启动子”或“启动子序列”是在细胞中能够结合RNA聚合酶并起始下游(3′方向)编码序列转录的DNA调节区域。为定义本发明的目的,所述启动子序列在其3′末端结合转录起始位点,并向上游(5′方向)延伸以包括起始高于背景的可检测水平的转录必需的最小数量的碱基或元件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1作图方便地进行定义),以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。所述启动子可有效连接其他表达控制序列,包括增强子和阻抑物序列。
载体的常见类型是“质粒”,其一般是双链DNA(其可以是环形)的自携分子,通常是细菌来源,其可容易地接受额外的(外源的)DNA并且可容易地被引入合适的宿主细胞中。质粒载体经常含有编码DNA和启动子DNA,并具有适合于插入外源DNA的一个或多个限制性位点。重组克隆载体将经常包括用于克隆或表达的一个或多个复制系统、用于在宿主中选择的一个或多个标记,例如抗生素抗性,以及一个或多个表达盒。
可使用本领域内的常规分子生物学和重组DNA技术产生载体构建体。在文献中详细解释了此类技术。参阅例如Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,第二版(1989)Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.(本文为″Sambrook等,1989″);DNA Cloning:A Practical Approach,第I和II卷(D.N.Glover编著1985);F.M.Ausubel等(编著),Current Protocols in Molecular Biology,John Wiley&Sons,Inc.(1994)。或者,可使用建构生物学公司如CodonDevices(Cambridge,MA,USA;http://www.codondevices.com/)或Blue Heron Biotechnology(Bothwell,WA,USA;http://www.blueheronbio.com/)的DNA合成技术部分地或完全地合成载体构建体。
3.用于从硫肽前体产生核心大环的核心生物合成酶
来自两种不同硫肽产生菌株的两个硫肽生物合成基因簇的表征允许本发明人鉴定两种菌株中的高度保守基因,因此提示这些基因编码核心硫肽分子从硫肽前体进行合成需要的酶。图2和图3显示了从两种不同硫肽产生菌株表征的生物合成基因簇的可读框(ORF)的位置。
另一方面,本发明涉及用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID NO:23-34的任一个;和
(ii)(i)中列出的氨基酸序列的变体,当与(i)中列出的相应的野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸。
这些多肽可在体外或体内用于进行一个或多个反应步骤,所述反应步骤使用硫肽前体蛋白质作为硫肽分子合成的起始材料。变体多肽可保留与野生型相应序列基本上相同的催化活性,或具有提高的或改善的催化活性。仅为便于阅读,在下文中将这些多肽称作“核心生物合成酶”。
下表2描述了可用于硫肽生物合成的核心生物合成酶(SEQ IDNO:23-34)的实例及其在生物合成途径中的可能功能。所述可能功能进一步描述于下文实施例5.1和5.2中。
表2:用于从硫肽前体蛋白质开始生物合成硫肽的核心酶的实例
4.编码核心生物合成酶的基因
本发明进一步提供编码核心生物合成酶的基因和/或可读框的核酸。更特别地,本发明提供包含编码如上定义的任何一种核心生物合成酶的核苷酸序列的核酸。
本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了结构基因,其可能编码相应的Ef-tu抑制剂进行生物合成的必需酶。
在一个实施方案中,编码用于Ef-tu抑制剂生物合成的酶的所述核酸包含选自如表2中所述SEQ ID NO:62的基因组片段的ORF9、ORF10、ORF11、ORF12、ORF13和ORF15的核酸。在另一实施方案中,所述本发明核酸包含选自如表2中所述SEQ ID NO:63的基因组片段的ORF6、ORF7、ORF8、ORF9、ORF10和ORF11。在表2中也报道了相应的基因组片段(从5’到3’)中各基因的ORF(可读框)的核苷酸位置(坐标)。
从已知的硫肽产生菌株并使用来自SEQ ID NO:35-46的探针或引物分离并鉴定本发明这类核苷酸序列的方法为本领域所熟知。例如,可使用编码各基因保守区的区域侧翼的引物扩增硫肽产生菌株的基因组DNA,并从公开的核苷酸序列进行测定。
也包括的是所述核酸的修饰。此类修饰包括,例如,本领域已知的标记、甲基化,和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加在所选表达系统中的表达、产量,和/或提高纯化,或用于另一期望目的。
在一个实施方案中,本发明的核酸有效连接异源转录和翻译控制序列。更优选地,其为适合于在宿主细胞中表达全部或部分核心生物合成酶的表达载体。
5.硫肽前体蛋白质及相应硫肽的产生
染色体编码骨架的测定以及因此本发明人进行硫肽生物合成的核糖体途径允许本领域的一名普通技术人员在一个实施方案中克隆并表达硫肽生物合成途径,即生物合成基因簇,并因此在修饰的宿主细胞或异源生物中产生硫肽化合物。本发明还允许产生待在异源宿主细胞,即另一菌株而非天然产生菌株中表达的硫肽前体。尽管如本文所述,实施例说明了细菌菌株的用途,可使用任何生物或表达系统。生物的选择取决于技术人员的需要。例如,可使用易于遗传操作的菌株,以利于硫肽化合物的修饰和产生。
因此,另一方面,本发明涉及包含如上所述编码硫肽前体蛋白质和/或核心生物合成酶的一个或多个核酸的宿主细胞,其中所述核酸并非天然发现于所述宿主细胞的基因组中和/或所述宿主细胞并不天然产生相应的硫肽。
或者,可能通过提供包含适当量的如上所述硫肽前体蛋白质的培养基,并在所述培养基中培养微生物来完成硫肽或硫肽衍生物的制备,其中所述微生物还包含硫肽生物合成需要的其他基因,例如编码核心生物合成酶的基因。
如本文使用,术语“宿主细胞”或“微生物”表示以任何方式选择、修饰、转化、培养或使用或操作用于通过细胞产生硫肽前体或硫肽及其衍生物的任何生物的任何细胞。例如,宿主细胞可以是进行处理以表达特定基因、DNA或RNA序列、蛋白质或酶的一个细胞。宿主细胞可进一步用于筛选或下文所述的其他测定。可在体外或非人动物(例如转基因动物或瞬时转染动物)中一个或多个细胞中培养宿主细胞。
宿主细胞或微生物本身可选自任何生物体,包括原核(例如细菌)细胞、植物细胞,和真核细胞,所述真核细胞包括昆虫细胞、酵母细胞和哺乳动物细胞。适当宿主细胞的代表性实例包括细菌细胞,如大肠杆菌(E.coli)、链霉菌(Streptomyces)和枯草芽孢杆菌(Bacillus subtilis)细胞;真菌细胞,如酵母细胞,如毕赤酵母(Pichia)或酿酒酵母(Saccharomyces)细胞,丝状真菌如木霉(Trichoderma)或曲霉细胞(Aspergillus);和昆虫细胞如果蝇(Drosophila)S2和Spodoptera Sf9细胞。优选地,所述宿主细胞选自已知合成硫肽衍生物或被描述对所述硫肽具有抗性的宿主细胞,如Streptomyces ramocissimus和天蓝色链霉菌(Streptomyces coelicolor)(Olsthoorn-Tieleman等‘Elongation factor Tu3(EF-Tu3)from thekirromycin producer Streptomyces ramocissimus is resistant to threeclasses of EF-Tu-specific inhibitors.’J Bacteriol.2007年5月;189(9):3581-90.)。在一些实施方案中,所述宿主细胞选自针对硫肽提供抗性的菌株。为菌株提供抗性的方法为本领域所熟知[Kieser T,Bibb MJ,Buttner MJ,Chater KF,Hopwood D.Practical Streptomyces Genetics.John Innes Foundation,Norwich(2000)]并且在下文实施例中给出了该方法的实例。
在制备方法的一些实施方案中,所述宿主细胞还包含硫肽生物合成需要的其他基因。生物合成需要的其他基因可包括例如编码如上述核心生物合成酶的一个或多个基因。所述宿主细胞例如选自野野村氏菌属物种(Nonomuraea ap.)、游动双孢菌属物种(Planobispora sp.)、拟无枝酸菌属物种(Amycolatopsi sp.)和链霉素属物种(Streptomyces sp.)。本文包括的特定宿主细胞包括,但不限于链孢囊菌亚目(Streptosporangineae)链孢子囊菌(actinomycete)的生物,包括诺卡(氏)土壤菌科(Nocardiopsaceae)、链孢囊菌科(Streptosporangiaceae)和高温单孢菌科(Thermomonosporaceae),其优选种包括Acrocarpospora、马杜拉放线菌属(Actinomadura)、Herbidospora、小双孢菌属(Microbispora)、小四孢菌属(Microtetraspora)、诺卡(氏)土壤菌属(Nocardiopsis)、野野村氏菌((Nonomuria sic,由Chiba等(1999)校正为野野村氏菌)Zhenshui Zhang,Yue Wang和Jisheng Ruan在the International Journal of SystematicBacteriology(1998),48,411-422)中报道的重新分类属)、游动双孢菌属(Planobispora)、游动单孢菌属(Planomonospora)、Planopolyspora、Planotetraspora或链孢囊菌属(Streptosporangium)。更普遍的是,所述术语旨在包括含有产生硫肽化合物必需的遗传信息的所有生物。该宿主细胞的实例包括在2006年11月30日保藏的野野村氏菌微生物菌株Bp3714-39,保藏号为第德意志微生物保藏中心DSM 18831号。
用于蛋白质如本发明硫肽前体蛋白质的合适产生技术为本领域技术人员所熟知。参阅例如Sambrook等,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Press(Cold Spring Harbor,N.Y.)。可使用多种技术容易地产生本文提供的任何氨基酸序列的序列。这些和其他合适的产生方法为本领域技术人员所知。
一方面,通过在所选宿主细胞中表达一个或多个ORF或基因产生本发明的氨基酸序列。本发明因此涉及用于产生硫肽前体蛋白质的方法,所述方法包括步骤:在适合于产生所述硫肽前体蛋白质的条件下培养能够表达编码如上述硫肽前体蛋白质的核酸,和任选地,编码核心生物合成酶的一个或多个核酸的宿主细胞。在该方法中,所述宿主细胞并非所述硫肽前体蛋白质的天然产生菌株,或当所述宿主细胞是所述硫肽前体蛋白质的天然产生菌株时,编码硫肽前体蛋白质的所述核酸是重组核酸或异源核酸。根据所用的宿主细胞,可通过所述宿主细胞从硫肽前体完成硫肽化合物生物合成。为此目的,本领域的技术人员可以使用天然合成硫肽前体蛋白质进行翻译后修饰需要的酶的宿主细胞,或在产生菌株中引入硫肽生物合成进行翻译后修饰需要的所述基因。在一个特定实施方案中,上文定义的方法还包括分离基本上纯形式的所述硫肽前体或硫肽化合物。
在一个特定实施方案中,本发明涉及本发明宿主细胞用于产生硫肽化合物的用途,所述硫肽化合物选自:GE2270A、GE37648A、Amythiamicin和如上述通式I到XI中表示的新Ef-tu抑制剂、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins、nocathiacins、伯尔尼霉素、A10255B和radamycin。
一方面,本发明提供产生硫肽衍生物的方法,其包括
i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体序列,在宿主细胞中合成改变的硫肽前体,
ii)从所述改变的硫肽前体合成所述硫肽衍生物;和/或
iii)通过一种或更多种核心生物合成酶修饰所述改变的硫肽前体。
如本文使用,“改变的硫肽前体”是非天然发现于产生所述硫肽前体的菌株,即产生菌中的硫肽前体。
用于合成改变的硫肽前体的方法进一步描述于下文中。优选地,所述改变的硫肽衍生物前体是如上所述的SEQ ID NO:1、SEQ ID NO:5或SEQID NO:11的变体。步骤ii)在体外,即宿主细胞外;或在与步骤i)相同的宿主细胞中体内进行。在与步骤i)相同的宿主细胞中,通过所述宿主细胞天然地或从重组DNA合成一种或更多种核心生物合成酶。
在产生硫肽衍生物的方法中,使用例如旋转振荡器或搅拌釜发酵罐在有氧条件下温育接种本发明宿主细胞的培养基。在温育过程中通过向接种的培养基注射空气、氧气或适当的气体混合物完成通气。一旦已经积累足够量的硫肽衍生物,就以常规且平常的方式,例如通过萃取和层析方法、沉淀或结晶、和/或本文公开的方式从培养物中浓缩并分离它们。作为萃取的实例,培养物可与合适的有机溶剂如正丁醇、乙酸乙酯、环己烷、正己烷、甲苯、乙酸正丁酯或4-甲基-2-亚硝酸异戊酯混和并搅拌,可在减压情况下通过去除溶剂回收有机层中的硫肽衍生物。可任选地用例如水、乙醇、甲醇或其混合物重新溶解所得残余,并用合适的有机溶剂如己烷、四氯化碳、氯乙烯、二氯甲烷或其混合物重新萃取。去除溶剂后,例如通过层析方法进一步纯化化合物。作为层析的实例,可应用固定相如硅胶或氧化铝,并具有有机洗脱溶剂或其混合物,包括醚、酮、酯、卤代烃或卤代醇;或应用反相层析,其基于具有多种功能基团的修饰的硅胶,并用有机溶剂或其水性混合物,像乙睛、甲醇或不同pH的四氢呋喃洗脱。另一实例是例如固体-液体或液体-液体模式的分配层析。也可应用例如使用SephadexLH-20(Sigma-Aldrich)并用不同溶剂,优选用醇洗脱的分子排阻层析。
因为在本领域比较常见,可通过多种分析方法,包括生物测定、TLC、HPLC或其组合并应用不同检测方法(对TLC通常用UV灯、碘吸入剂或喷雾显色试剂,对HPLC通常用UV灯、质量灵敏的或光散射方法)监测产生以及回收和纯化过程。例如,通过使用具有功能化硅胶的反相柱并应用特定pH下极性水可混和溶剂和水的线性梯度混合物的洗脱剂,和利用不同波长UV灯和质量灵敏监测器的检测方法表示HPLC技术。
所得纯化的化合物不含细胞和细胞物质、副产物、试剂和其他外来物质,必要时允许处理并配制化合物用于实验室和/或临床目的。优选用于本发明的化合物的纯度具有以重量计高于80%的纯度;更优选地以重量计至少90%,甚至更优选以重量计高于95%;甚至更优选以重量计至少99%。在一个实施方案中,本发明提供含有本发明化合物的组合物,不管产生多少化合物。
宿主细胞生物合成的化合物可任选地进行随机和/或定向化学修饰,以形成是衍生物或结构类似物的化合物。可使用本领域已知的方法和本文描述的方法任选地修饰所述化合物。
6.能够产生硫肽前体蛋白质用于硫肽衍生物产生的突变体微生物
根据本发明的教导,现在可以遗传处理能够产生硫肽前体蛋白质的微生物,例如目的在于提高硫肽产生或调整硫肽结构。因此,在其他方面,本发明提供突变体微生物,其中所述突变体微生物在编码硫肽前体蛋白质的基因中和/或在编码核心生物合成酶的一个或多个基因中具有突变。所述突变可以是单个或多个核苷酸缺失、插入或取代。其也可以是编码所述硫肽前体蛋白质的基因片段或完整基因的缺失。优选地,所述突变体微生物与相应的野生型微生物相比时,不再表达编码本发明硫肽前体蛋白质的基因。优选地,为了避免极化影响,所述突变是编码所述硫肽前体蛋白质的基因内的框内缺失。
所述突变体生物是例如链孢囊菌亚目链孢子囊菌的生物,包括诺卡(氏)土壤菌科、链孢囊菌科和高温单孢菌科,其优选种包括Acrocarpospora、马杜拉放线菌属、Herbidospora、小双孢菌属、小四孢菌属、诺卡(氏)土壤菌属、野野村氏菌((Nonomuria sic,由Chiba等(1999)校正为野野村氏菌)Zhenshui Zhang,Yue Wang和Jisheng Ruan在the International Journal ofSystematic Bacteriology(1998),48,411-422)中报道的重新分类属)、游动双孢菌属、游动单孢菌属、Planopolyspora、Planotetraspora或链孢囊菌属。
在特定实施方案中,所述突变体微生物是野野村氏菌属物种,例如野野村氏菌微生物菌株Bp3714-39,其于2006年11月30日保藏,保藏号为DSM 18831,并且所述突变是包含SEQ ID NO:15或SEQ ID NO:16的基因的破坏,例如包含SEQ ID NO:17或SEQ ID NO:18的基因的突变。
在另一特定实施方案中,可以用编码如上述任何硫肽前体蛋白质的核酸进一步转化本发明的突变体微生物。该方法允许提供能够从任何硫肽前体蛋白质,包括如上述SEQ ID NO:1、SEQ ID NO5或SEQ ID NO:11的变体生物合成硫肽的微生物。在另一实施方案中,所述突变体微生物还天然或重组表达至少一个或多个编码核心生物合成酶的基因,例如编码选自SEQ ID NO:23-34的多肽的一个或多个基因。在一个实施方案中,所述突变体微生物天然或重组表达至少编码SEQ ID NO:23-28的多肽的基因。在另一实施方案中,所述突变体微生物天然或重组表达至少编码SEQ IDNO:35-46的多肽的基因。
7.筛选产生新硫肽化合物的新菌株
本发明人鉴定的基因可进一步用作鉴定能够产生硫肽衍生物的其他微生物的工具。例如,本发明涉及允许鉴定具有与(i)SEQ ID NO:17或SEQID NO:18的基因并更优选SEQ ID NO:15或SEQ ID NO:16的片段,或(ii)SEQ ID NO:35-46任一个中定义的核心基因基本类似的基因的细胞的任意方法。
在特定实施方案中,如通过序列比较算法,如BLAST、FASTA、DNAStrider等测定,当至少约80%,并最优选至少约90%或95%的核苷酸在DNA序列的确定长度内匹配时,则两条DNA序列“基本同源”或“基本类似”。该序列的实例是本发明特定基因的等位基因或物种变体。通过使用可从序列数据库中获得的标准软件比较,或在例如为特定系统规定的严格条件下的Southern杂交实验中鉴定基本同源的序列。
在核酸序列的上下文中,术语“序列同一性”“序列同一性百分比”或“相同性百分比”指当比对最大相似性时两条序列中的相同残基。序列同一性比较的长度可以在基因组全长范围内,期望在基因编码序列的全长或至少约500到5000个核苷酸的片段范围内。然而,也期望例如至少约9个核苷酸,一般至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36或更多个核苷酸的更小片段的同一性。类似地,可容易地测定蛋白质全长或其片段范围内的氨基酸序列的“百分之序列同一性”。适当时,片段长度为至少约8个氨基酸,更优选至少约14个氨基酸,并可高达约700个氨基酸。合适片段的实例如下文所述。
在一个实施方案中,鉴定能够产生硫肽衍生物的方法包括以下步骤:
(i)将来自分离细胞的基因组DNA或RNA与SEQ ID NO:15或SEQ IDNO:16或其特异片段的核酸探针温育,用于探针与同源DNA区域的特异杂交;并
(ii)鉴定包含与步骤(i)的所述探针特异性杂交的基因组DNA区域或RNA的细胞。
当单链形式的核酸分子可以与其他核酸分子在温度和溶液离子强度的适当条件下退火时,核酸分子与另一核酸分子如cDNA、基因组DNA或RNA“特异性杂交”(参阅Sambrook等,Molecular Cloning:A LaboratoryManual,第二版(1989)Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.(本文为″Sambrook等,1989″)。温度和离子强度的状况决定杂交的“严格性”。为了对同源核酸进行初筛,可使用对应Tm(解链温度)55℃的低严格杂交条件,例如5×SSC、0.1%SDS、0.25%奶,并且没有甲酰胺;或30%甲酰胺、5×SSC、0.5%SDS)。中等严格的杂交条件对应于更高的Tm,例如40%甲酰胺、5×或6×SCC。高严格杂交条件对应于最高的Tm,例如50%甲酰胺、5×或6×SCC。SCC是0.15M NaCl、0.015M柠檬酸钠。杂交需要两条核酸包含互补序列,尽管根据杂交的严格性,两个碱基之间的错配是可能的。用于杂交核酸的适当严格性取决于本领域熟知的变量:核酸的长度和互补的程度。两条核苷酸序列之间的相似性或同源性的程度越高,具有这些序列的核酸的杂交的Tm值越大。核酸杂交的相对稳定性(对应于更高的Tm)以以下顺序降低:RNA:RNA、DNA:RNA、DNA:DNA。对于长度大于100个核苷酸的杂合体,衍生了用于计算Tm的方程式(参阅Sambrook等,上文,9.50-9.51)。对于更短核酸,即寡核苷酸的杂交,错配的位置变得更重要,并且寡核苷酸的长度决定了它的特异性(参阅Sambrook等,上文,11.7-11.8)。杂交核酸的最小长度是至少约10个核苷酸;优选至少约15个核苷酸;并更优选所述长度是至少约20个核苷酸。
在特定实施方案中,使用标准的杂交条件。术语“标准杂交条件”指55℃的Tm,并利用如上文阐明的条件。在优选实施方案中,所述Tm是60℃;在更优选的实施方案中,所述Tm是65℃。在特定实施方案中,使用“高严格条件”。
用于寡核苷酸(例如寡核苷酸探针或引物)的合适的杂交条件通常与全长核酸(例如全长cDNA)多少有些不同,因为寡核苷酸具有更低的解链温度。因为寡核苷酸的解链温度将取决于所涉及的寡核苷酸序列的长度,所以合适的杂交温度将根据所用的寡核苷酸分子不同而不同。示例性温度可以是37℃(对于14碱基的寡核苷酸)、48℃(对于17碱基寡核苷酸)、55℃(对于20碱基的寡核苷酸)和60℃(对于23碱基的寡核苷酸)。用于寡核苷酸的示例性合适的杂交条件包括在6×SSC/0.05%磷酸钠中洗涤,或提供等同程度杂交的其他条件。
在本方法的一个优选实施方案中,设计对编码硫肽前体的基因特异的寡核苷酸并用于鉴定能够产生硫肽化合物的新细胞。此类寡核苷酸可用于编码硫肽前体蛋白质的基因片段的PCR扩增。优选地,筛选更低等的真核细胞,并更优选来自放线菌类的细胞。
8.编码硫肽前体蛋白质的基因的遗传操作和用于筛选新硫肽衍生物的用途
在另一实施方案中,本发明提供修饰编码硫肽前体蛋白质的基因和/或可读框的一个或多个核苷酸序列的方法。例如,此类修饰或改变可用于在所选表达系统中提高表达或产生新硫肽衍生物的目的。可进行其他改变以消减、修饰或增强硫肽化合物的功能,包括提高抗生素功能或减少非期望的性质。
一方面,从修饰编码硫肽前体蛋白质的核酸序列完成改变的硫肽前体的合成。在一个实施方案中,改变的核酸序列在所选宿主细胞中可通过合适的载体向如上述异源宿主细胞提供,并用于表达相应产物。或者,可直接在产生硫肽的菌株携带的天然基因中例如通过所述菌株的遗传操作进行所述改变。
本发明包括改变编码本发明前体蛋白的任何核酸序列的任何方法。更具体地是,本发明包括在本发明蛋白质中插入氨基酸、缺失氨基酸或取代氨基酸的任何方法。可在核酸水平上进行修饰。通过标准技术进行这些修饰并为本领域所熟知。
因此,本发明提供方法,以产生编码硫肽衍生物的前体的核酸,所述方法包括步骤:对各核酸,通过在所述序列(其编码SEQ ID NO:1-14中任意序列)的至少一个密码子中进行核苷酸取代,产生具有改变核苷酸序列的多个核酸。此类核酸文库可有利地用于筛选新的硫肽衍生物,例如具有改善性质的Ef-tu抑制剂。
改变的核酸或核酸文库然后可用于转化宿主细胞用于如上所述的硫肽产生。
优选,核酸文库的各核酸具有单个核苷酸取代,使得与野生型相应序列相比时,编码SEQ ID NO:1-14任意序列的仅一个密码子突变。产生位点定向诱变或核酸文库的方法为本领域所熟知并例如描述于Biotechniques出版的Hogrefe等的文章中(‘Creating randomized aminoacid libraries with the QuikChange Multi Site-Directed Mutagenesis Kit.’2002年11月;33(5):1158-60,1162,1164-5)。
在一个特定实施方案中,所述核苷酸取代在编码SEQ ID NO:1-4任意序列的位置2、5、7、8、14的氨基酸残基的一个或多个密码子中进行。
优选地,宿主细胞能够合成硫肽化合物,即还包含硫肽生物合成所需的其他基因。例如,硫肽生物合成所需的其他基因可包含编码选自SEQ IDNO:23-34的多肽的一个或多个基因。更优选地,改变的核酸与表达载体一起进行转化,因此转化后从所述表达载体合成相应的硫肽前体蛋白质。所得表达文库可用作筛选新硫肽衍生物,例如新Ef-tu抑制剂的工具。
9.特定生物合成基因的克隆
当对来自产生不同硫肽化合物的两菌株的生物合成基因簇进行表征时,本发明人鉴定了很可能参与硫肽生物合成但却是菌株特异性的ORF。因此提出这些基因很可能编码特定多肽,主要是参与核心硫肽结构的基因调节和酶促修饰的酶和转录调节物,以产生最终的菌株特异性硫肽化合物。
表3和表4描述了本发明这些特定多肽的核酸和相应的多肽序列。
表3:用于从菌I生物合成硫肽的特定多肽的实例
表4:用于从菌株II生物合成硫肽的特定多肽的实例
在一个实施方案中,在表3或4中列出的一个或多个多肽用于如上定义通式(I)到(XI)的化合物的体外或体内合成。
本发明也涉及表3或4中报道的此类酶的任何功能变体,其保留基本上相同的酶促活性。本发明也涉及表3或4中报道的任何转录调节物的任何功能变体,其保留基本上相同的转录活性。在一个实施方案中,此类多肽与上表列出的原始多肽相比时含有不少于1、2、3、4或5个缺失、插入或取代的氨基酸。在另一实施方案中,此类功能变体与上文列出的一个多肽具有至少80或90%的同一性。
这些序列可用于使得能够产生缺少特定步骤的突变体菌株,例如以避免产生非期望副产物。在一个实施方案中,本发明涉及能够产生在上表中列出一个或多个特定基因的表达中有缺陷的硫肽的突变体菌株。在一个特定实施方案中,所述突变体菌株在ORF2-II或ORF3-II(分别是SEQ IDNO:58和SEQ ID NO:59)或ORF4-I(SEQ ID NO:50)编码基因的表达中有缺陷。
如本文所用,“缺陷表达”表示与野生型菌株相比时,突变体菌株不再表达对应的多肽,或如在用于定量mRNA表达的常规方法中测定,与野生型菌株稳定状态mRNA相比时,所述相应多肽具有超过50%或超过90%减少的稳定状态mRNA量。例如,基因被阻断,或部分或完全缺失,使得不再合成功能性蛋白质。
这些序列可进一步用于与编码前体蛋白的基因和编码核心酶的基因组合,以改造能够产生特异硫肽衍生物的宿主细胞。在一个实施方案中,本发明涉及含有如表2、3和4中所述重组可读框ORF1-II到ORF12-II,或具有相应野生型序列的至少80%或至少90%同一性的其功能变体,并能够产生EF-Tu抑制剂的宿主细胞。在另一实施方案中,本发明涉及含有表2、3和4中所述重组ORF1-I到ORF18-I,或与相应野生型序列具有至少80%或至少90%同一性的其功能变体,并能够产生EF-Tu抑制剂的宿主细胞。
在另一实施方案中,分离的特定酶可单独使用或在例如使用硫肽前体蛋白质作为起始材料的体外方法,例如用于产生硫肽的方法,例如用于产生E-FTu抑制剂的方法的化学反应步骤中组合作为催化剂使用。
附图简述
图1.硫肽结构基因。可能的起始位点为粗体。14个氨基酸的骨架下面为下划线。
图2.来自硫肽产生菌株I的生物合成基因簇。箭头代表假设的启动子。空心箭头代表可读框:黑色实心箭头表示系列I结构基因,灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。HindIII和EcoRI是基因簇侧翼的唯一限制性位点。
图3.来自硫肽产生菌株II(菌株Bp3714-39)的生物合成基因簇。箭头代表假设的分散的启动子。空心箭头代表可读框:黑色实心箭头表示系列II结构基因,灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。基因簇的侧翼是PstI限制性位点。
实施例
还通过特定实施例来描述本发明。然而,此类实施例的使用仅在于说明而绝不在于限制本发明或任何示例性术语的范围和意义。
1.在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因
使用PCR方法来分离编码硫肽骨架的染色体序列。从来自中国湖北省的产生硫肽的野野村氏菌菌株中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuick DNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过将摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接到片段化的DNA上来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫肽大环设计的简并引物(CFGCVCNC:5’-CARAAICCRCAIACRCARTTRCA)来扩增硫肽结构基因。在寡核苷酸中包括肌苷以降低简并性。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物,循环条件如下:95℃15分钟;94℃30秒,55℃30秒,及72℃1分钟,30个循环;以及72℃10分钟。衔接头上的3’氨基修饰阻断延伸并防止由衔接头引物进行的衔接头与衔接头的扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。
在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因(图1)的实验成功进行。该前体蛋白质的预测大小为57个氨基酸。然而,存在许多可能表示可选翻译起始位点的起始密码子。14个氨基酸的硫肽序列位于C末端并确定了合成方向。硫肽骨架的一级氨基酸序列以整合到吡啶环的丝氨酸开始并环绕大环以逆时针方向继续并以侧链末端的最后一个氨基酸结束。公共数据库中的同源性搜索揭示没有亲缘关系近的同系物。
2.编码硫肽前体蛋白质的基因的遗传破坏
自杀载体pSET152-Hind可在大肠杆菌中复制,赋予阿泊拉霉素抗性并携带允许从大肠杆菌向放线菌种进行属间(intergeneric)结合的转移起点(oriT)。pSET152-Hind为广谱宿主性载体pSET152的衍生载体。通过去除HindIII片段从pSET152上删除允许位点特异性整合(int)的基因。可用插入失活或缺失两种方法中的一种来破坏编码硫肽前体蛋白质的基因。第一种方法需要将不具有起始密码子或终止密码子的基因内部片段克隆至pSET152-Hind中。随后可通过细胞接合作用将该质粒导入硫肽产生菌株中。利用阿泊拉霉素选择将鉴定具有插入硫肽结构基因中的载体骨架的突变体。此类事件将抑制转录和翻译并阻止产生硫肽。第二种方法需要将突变体等位基因构建到pSET152-HindIII中并随后转移至产生菌株内。突变体等位基因将包含结构基因的上游和下游序列,但具有优选在框内缺失的可读框。可由赋予对如潮霉素或硫链丝菌肽的抗生素抗性的基因标记/取代该缺失。在结合到产生菌株中,质粒抗生素标记的选择将选择在染色体中具有野生型和突变体等位基因的菌株。在上游或下游序列中质粒和染色体之间的同源重组会导致部分二倍体。载体抗生素标记丢失的选择及后续的PCR筛选缺失或对标记突变体等位基因的抗生素选择将鉴定期望的第二次重组事件,该事件将去除野生型等位基因并保留结构基因的缺失等位基因。
或者,现今DNA合成技术的进展允许DNA大片段的合成组装,并且此类服务是可通过商业途径获得的。通过从头化学合成可重新改造硫肽基因簇,用于在替代宿主中进行异源表达和硫肽产生。此类宿主如天蓝色链霉菌(Streptomyces coelicolor)或变铅青链霉菌(Streptomyces lividans)将具有良好建立的遗传工具并肯定对硫肽具有抗性或针对硫肽提供抗性。通过在含高于硫肽最小抑制浓度的硫肽浓度的琼脂平板上按1010至1011细胞/孢子量铺板来分离抗性菌株。可通过在选择性平板上的菌落生长来鉴定在赋予抗性的群体中预先存在的稀有自发突变体。可通过将细胞暴露于化学诱变剂来提高突变率的频率。硫肽基因簇的化学合成允许引入更优调控元件、基因缺失、去除或引入限制性位点及改变密码子选择。克隆到整合穿梭载体pOJ436或游离穿梭载体pOJ446上的基因簇的功能性合成拷贝将具有引入到结构基因的限制性位点以允许产生框内缺失。
此外,通过在表达噬菌体衍生蛋白质对、或来自Rac原噬菌体的RecE/RecT或来自λ噬菌体的Redα/Redβ的大肠杆菌菌株中进行同源重组来精确地处理硫肽基因簇的克隆拷贝或合成版本。该技术称为Red/ETRecombineering或λ介导的重组(Muyrers,J.P.P.,Zhang,Y.,Stewart,A.F.ET cloning:Think recombination first.Genetic Engineering,Principlesand Methods(J.K.Setlow编著),22,77-98 Kluwer Academic/PlenumPublishers,NY.(2000))。
3.异源表达结构基因以产生可选硫肽结构
天然产生菌株或表达硫肽核心和特定生物合成基因但在前体结构基因中具有框内缺失的异源宿主是有用的工具菌株。这些工具菌株可用于产生具有可选结构的硫肽。
结构基因的位点定向诱变可用于向硫肽中取代或引入新氨基酸。通过结合或转化将在pHM11a或pSET152中克隆的结构基因的突变版本重新引入表达硫肽生物合成酶的工具菌株中。
或者,可产生编码硫肽骨架每一位置上可选氨基酸的文库。可通过基因合成或简并PCR来化学产生该变体文库。PCR方法需要硫肽结构基因的扩增以在硫肽编码骨架中掺入变异并在如pHM11a或pSET152的质粒中掺入用于克隆及表达的限制性酶切位点。PCR引物中的一条引物将是简并的,用于掺入所有氨基酸取代。可改变简并度以允许在骨架的所选位置上进行取代,即不在编码认为是不变量氨基酸上进行取代,如不在形成硫肽大环的噻唑的半胱氨酸的位置上进行取代。两条引物都将标记限制性酶切位点以允许将PCR产物直接克隆至表达载体中。将所有大肠杆菌转化体混合并分离DNA来产生变体文库。文库将转化到工具菌株中并且生物测定可用于鉴定携带支持产生具有可选结构的活性硫肽的结构基因的克隆。
4.编码硫链丝菌肽骨架多肽的基因的分离
使用PCR方法来分离编码硫链丝菌肽骨架的染色体序列。从硫链丝菌肽产生菌远青链霉菌ETH28555中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuick DNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接片段化DNA来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫链丝菌肽大环设计的简并引物(CTTCICTC:5’-CAC GTG CAGATR CAN GTN GTR CA-3’)来从该文库中扩增硫链丝菌肽结构基因。根据CODEHOP原则设计具有5’非简并性夹板结构(consensus clamp)和3’简并核心的简并引物(Rose等CODEHOP(COnsensus-DEgenerate Hybrid Oligonucleotide Primer)PCR primer design.Nucleic Acids Res.2003年7月1日;31(13):3763-6)。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物,循环条件如下:95℃ 15分钟;94℃ 30秒,55℃ 30秒,及72℃ 1分钟,40个循环;以及72℃ 10分钟。衔接头上的3’氨基修饰阻断了延伸并防止由衔接头引物进行的衔接头与衔接头扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。该策略在鉴定编码硫链丝菌肽大环的基因组片段中证明是成功的。随后使用基因特异引物向上游和下游步移来鉴定全长硫链丝菌肽结构基因。
5.来自硫肽产生菌株I和II的生物合成基因簇
5.1菌株I
图2描述了来自包含用于硫肽合成的生物合成基因簇的菌株I基因组DNA的一个分离的BAC(SEQ ID NO:62)中可读框的位置。
在不受任何优选模型约束的情况下,以下途径定义了各个多肽的推测功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。
系列I的合成方案:
(A)ORF9、ORF10、ORF11、ORF12、ORF13和ORF14编码很可能形成复合体的核心生物合成酶,所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。
(B)ORF2和ORF3编码很可能参与将修饰掺入尾部的酶。丝氨酸残基的环化脱水作用产生噁唑啉环。由于尾部脯氨酸的存在,尾部额外丝氨酸脱水成脱氢丙氨酸可能需要单独步骤,该步骤很可能在肽中引起出现构象纽接。ORF18可能参与了去除末端序列而留下酰胺基。
(C)ORF4、ORF6、ORF7、ORF16和ORF17编码很可能参与特定修饰的酶。ORF4:苯丙氨酸的羟化。ORF5:天冬酰胺的甲基化。ORF7:噻唑的甲基化。ORF16和ORF17:向噻唑添加甲氧乙基。
5.2菌株II
图3描述了来自包含用于硫肽合成的生物合成基因簇的菌株II基因组DNA的一个分离的BAC(SEQ ID NO:63)中ORF的位置。
在不受任何优选模型约束的情况下,以下途径定义了各个多肽的推测功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。
系列II的合成方案:
(A)ORF6、ORF7、ORF8、ORF9、ORF10和ORF11编码很可能形成复合体的核心生物合成酶,所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。
(B)ORF12编码切割末端丙氨酸的肽酶。
(C)ORF1、ORF2和ORF3编码了可能参与特定修饰的酶。噻唑的ORF1甲基化及ORF2和ORF3参与苯丙氨酸和异亮氨酸的羟基化。异亮氨酸羟基化两次并分解产生环氧化物。
6.硫肽衍生物的产生
培养基组分
(a)种子培养基
(b)生产培养基A
(c)痕量溶液
将如实施例3所述宿主细胞的冰冻悬液(1.5mL)接种至含有500mL种子培养基的两升无挡板摇瓶。该摇瓶30℃下在摇床中以200转/分钟和50mm振幅温育3天。通过按每瓶40mL将第一阶段的种子接种至每个含有500mL种子培养基的8个两升无挡板摇瓶中进行第二个种子阶段。该摇瓶在30℃的摇床中以200转/分钟和50mm振幅温育2天。通过按每瓶4升将第二阶段的种子接种至每个含有100升种子培养基的2个150升规模的搅拌釜发酵罐中进行第三个种子阶段。按以下参数操作150升规模的发酵罐3天:温度=30℃、搅拌=80转/分钟、空气流动=25slpm及压力=0.5bar。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制pH值。
用200升来自第三个种子阶段的种子接种含有3500升生产培养基A的5500升规模的搅拌釜发酵罐。5500升规模的发酵罐操作参数如下:温度=30℃、空气流动=1050slpm及压力=0.5bar。搅拌控制在60转/分钟并在44小时之后增加到80转/分钟。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制pH值。温育5天后收集含3500升发酵液的发酵罐。
7.硫肽衍生物的分离
通过在搅拌槽中加入乙酸乙酯过夜收集并提取发酵液。在提取过程中将混合物流经连续反应器(Jahnke&Kunkel,德国)用于最大剪力(sheer force)及最佳混和。在连续Westfalia分离器SA20(WestfaliaSeparator AG,Oelde,德国)上分离两相后,通过减压下的蒸发来浓缩乙酸乙酯相。蒸发过程中形成经过滤分离的沉淀。
将根据如上描述的方法从培养液的提取物中获得的沉淀溶解于比例为95∶5的二噁烷/水中并过滤去除不可溶成分。在减压及硅藻(diatome)8(International Sorbent Technology Ltd.,Hengoed Mid Glam,UK)存在的情况下浓缩滤液。将所获的粉末应用到在比例为90∶10∶0.5的二氯甲烷/甲醇/乙酸溶液中制备的硅胶层析柱(例如0.040-0.063mm,柱子大小为5x25cm)上。用比例为90∶10∶0.5的二氯甲烷/甲醇/乙酸溶液以35mL/分钟的流速洗脱柱子。收集30mL经HPLC分析的级分。向含化合物I的混和级分中加入20mL异丙醇并在减压条件下浓缩直至化合物从残留的异丙醇中沉淀出来。通过离心从沉淀中分离出溶剂后,在减压条件下干燥残留物,产生半纯化的硫肽衍生物。
序列表
<110>诺瓦提斯公司
<120>硫肽前体蛋白质、编码该蛋白质的基因及其用途
<130>I315
<160>65
<170>PatentIn版本3.2
<210>1
<211>14
<212>PRT
<213>野野村氏菌属物种(Nonomuraea Sp.)
<400>1
Ser Cys Asn Cys Val Cys Gly Phe Cys Cys Ser Cys Ser Pro
1 5 10
<210>2
<211>14
<212>PRT
<213>野野村氏菌属物种
<400>2
Ser Ser Asn Cys Phe Cys Tyr Pro Cys Cys Ser Cys Ser Ser
1 5 10
<210>3
<211>14
<212>PRT
<213>野野村氏菌属物种
<400>3
Ser Cys Asn Cys Phe Cys Tyr Ile Cys Cys Ser Cys Ser Ser
1 5 10
<210>4
<211>14
<212>PRT
<213>野野村氏菌属物种
<400>4
Ser Cys Asn Cys Val Cys Gly Val Cys Cys Ser Cys Ser Pro
1 5 10
<210>5
<211>13
<212>PRT
<213>野野村氏菌属物种
<400>5
Ser Cys Thr Thr Cys Val Cys Thr Cys Ser Cys Cys Thr
1 5 10
<210>6
<211>17
<212>PRT
<213>野野村氏菌属物种
<400>6
Ile Ala Ser Ala Ser Cys Thr Thr Cys Ile Cys Thr Cys Ser Cys Ser
1 5 10 15
Ser
<210>7
<211>12
<212>PRT
<213>野野村氏菌属物种
<400>7
Ser Cys Thr Thr Cys Glu Cys Cys Cys Ser Cys Ser
1 5 10
<210>8
<211>13
<212>PRT
<213>野野村氏菌属物种
<400>8
Ser Cys Thr Thr Cys Val Cys Val Cys Ser Cys Cys Thr
1 5 10
<210>9
<211>13
<212>PRT
<213>野野村氏菌属物种
<400>9
Ser Cys Val Gly Ser Ala Cys Ala Ser Ser Ser Ser Ser
1 5 10
<210>10
<211>12
<212>PRT
<213>野野村氏菌属物种
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任意天然氨基酸
<220>
<221>misc_feature
<222>(8)..(8)
<223>Xaa可以是任意天然氨基酸
<400>10
Ser Cys Thr Thr Cys Xaa Cys Xaa Cys Ser Cys Ser
1 5 10
<210>11
<211>15
<212>PRT
<213>野野村氏菌属物种
<400>11
Ser Cys Thr Thr Ser Ser Val Ser Ser Ser Ser Ser Ser Ser Ser
1 5 10 15
<210>12
<211>16
<212>PRT
<213>野野村氏菌属物种
<400>12
Ser Cys Thr Thr Ser Gly Cys Thr Ser Ser Ser Ser Ser Ser Ser Ser
1 5 10 15
<210>13
<211>17
<212>PRT
<213>野野村氏菌属物种
<400>13
Ser Cys Thr Thr Ser Gly Ser Ala Cys Ser Ser Ser Ser Ser Ser Ser
1 5 10 15
Ser
<210>14
<211>15
<212>PRT
<213>野野村氏菌属物种
<400>14
Ser Cys Val Gly Ser Ala Cys Ala Cys Ser Ser Ser Ser Ser Ser
1 5 10 15
<210>15
<211>42
<212>DNA
<213>野野村氏菌属物种
<400>15
tcctgcaact gcgtgtgcgg cttctgctgc tcctgcagcc cg 42
<210>16
<211>42
<212>DNA
<213>野野村氏菌属物种
<400>16
tcgtgtaact gcttctgcta catctgctgc tcctgctcga gc 42
<210>17
<211>174
<212>DNA
<213>野野村氏菌属物种
<400>17
atgagcgagc tggaatccaa gctgaacctt agcgacctgc ccatggacgt cttcgagatg 60
gccgacagcg gcatggaggt cgaatccctc accgcaggcc acgggatgcc cgaggtaggc 120
gcttcctgca actgcgtgtg cggcttctgc tgctcctgca gcccgtccgc gtag 174
<210>18
<211>150
<212>DNA
<213>野野村氏菌属物种
<400>18
atggacctca gcgatctgcc catggacgtc ttcgaactcg ccgatgacgg tgttgcggtc 60
gagtccctta ctgctggtca cggcatgacc gaagtgggag cttcgtgtaa ctgcttctgc 120
tacatctgct gctcctgctc gagcgcctga 150
<210>19
<211>57
<212>PRT
<213>野野村氏菌属物种
<400>19
Met Ser Glu Leu Glu Ser Lys Leu Asn Leu Ser Asp Leu Pro Met Asp
1 5 10 15
Val Phe Glu Met Ala Asp Ser Gly Met Glu Val Glu Ser Leu Thr Ala
20 25 30
Gly His Gly Met Pro Glu Val Gly Ala Ser Cys Asn Cys Val Cys Gly
35 40 45
Phe Cys Cys Ser Cys Ser Pro Ser Ala
50 55
<210>20
<211>49
<212>PRT
<213>野野村氏菌属物种
<400>20
Met Asp Leu Ser Asp Leu Pro Met Asp Val Phe Glu Leu Ala Asp Asp
1 5 10 15
Gly Val Ala Val Glu Ser Leu Thr Ala Gly His Gly Met Thr Glu Val
20 25 30
Gly Ala Ser Cys Asn Cys Phe Cys Tyr Ile Cys Cys Ser Cys Ser Ser
35 40 45
Ala
<210>21
<211>414
<212>PRT
<213>野野村氏菌属物种
<400>21
Met Pro Thr Thr Leu Pro Lys Thr Leu Arg Gly Ser Asp Gly Ala Leu
1 5 10 15
Ala Glu Gln Pro Leu Leu Ile Tyr Val Asn Val Pro Phe Cys Asn Ser
20 25 30
Lys Cys His Phe Cys Asp Trp Val Thr Glu Val Pro Leu Ala Asp Leu
35 40 45
Arg Leu Thr Pro Asp Ser Ser Pro Arg Arg Arg Tyr Val Ala Ala Leu
50 55 60
Val Lys Gln Ile Glu Thr His Ala Pro Thr Leu Gly Gly Leu Gly Tyr
65 70 75 80
Arg Pro Glu Val Met Tyr Trp Gly Gly Gly Thr Ala Ser Ile Leu Thr
85 90 95
Ile Glu Glu Ile Glu Ala Val Ala Gly Ala Leu Ala Ala Arg Phe Asp
100 105 110
Leu Gly Gly Leu Val Glu Ala Thr Ile Glu Gly Ser Pro Glu Ser Met
115 120 125
Asp Pro Gly Lys Leu Lys Leu Phe Arg Ala Ile Gly Phe Asn Arg Ile
130 135 140
Ser Ile Gly Val Gln Ala Phe Asp Asp Ala Arg Leu Arg Arg Ile Gly
145 150 155 160
Arg Val His Ser Ala Glu Gln Ala Glu Arg Ala Val Arg Met Ala Ala
165 170 175
Asp Ala Gly Phe Asp Asn Ile Asn Ile Asp Leu Ile Val Gly Phe Pro
180 185 190
Gly Gln Gly Ala Asp Glu Val Ser Arg Thr Ile Gln His Ala Val Thr
195 200 205
Leu Pro Val Asn His Phe Ser Val Tyr Pro Tyr Arg Pro Thr Gly Gly
210 215 220
Thr Val Met Arg Arg Gln Val Gly Arg Gly Met Gly Arg Ile Asp Val
225 230 235 240
Glu Glu Gln Leu Arg Ser Tyr Asp His Ala Arg Asp Leu Leu Ala Arg
245 250 255
His Gly Phe Glu Glu Tyr Ala Thr Ala Tyr Phe Gly Ala Pro Arg Cys
260 265 270
Glu Ser Asp Glu Val Tyr Tyr Lys Leu Thr Met Asp Trp Ile Gly Phe
275 280 285
Gly Ser Gly Ala Asn Ser Leu Ile Gly Thr Arg Phe Leu Leu Asn Asp
290 295 300
Arg Gly Gly Leu His Arg Phe Ser Thr Ala Pro His Arg Phe Asp Ser
305 310 315 320
Asp Thr Pro Ala Ser Ala Pro His Leu Thr Arg His Phe Leu Ala Gln
325 330 335
Ala Leu Thr Thr Val Asp Gly Met Asp Ala Arg Thr Phe Gln Leu Arg
340 345 350
Thr Gly Arg Ser Leu Arg Ala Ala Cys Glu Glu Pro Ala Val Arg Arg
355 360 365
Met Leu Glu Gln Ile Asn Arg Arg Gly Arg Leu Ile Val Asp Ser Arg
370 375 380
Gly Ile Arg Leu His Arg Asp Asp Met Ala Ser Ala Tyr Ile Thr Met
385 390 395 400
Asn Ser Val Asp Leu Tyr Ala Ala Thr Glu Gln Pro Gly Gly
405 410
<210>22
<211>1242
<212>DNA
<213>野野村氏菌属物种
<400>22
atgccgacca cactcccgaa gaccctgcgc gggtcggacg gcgcgctcgc cgagcagccg 60
ctgctcatct acgtgaatgt gccgttctgc aactcaaaat gtcacttctg cgactgggtg 120
accgaggttc cgctggcgga tctgcggctc acgccggact cgtcgccacg ccgccgctac 180
gtcgccgcgc tggtcaagca gatcgagacg cacgcgccga cgctgggcgg actcggctac 240
cggcccgagg tcatgtactg gggcggcggc acggccagca tcctcaccat cgaggagatc 300
gaggcggtgg ctggggcgct ggcggcgcgg ttcgacctcg gcggcctggt cgaggccacc 360
atcgagggca gcccggagtc catggacccc ggcaagctga agctgttccg tgcgatcggg 420
ttcaaccgga tcagcatcgg ggtgcaggcg ttcgacgacg cgcgcctgcg ccgcatcggc 480
cgggtgcaca gcgccgagca ggcggagcgc gcggtccgga tggccgccga cgccggcttc 540
gacaacatca acatcgacct catcgtcggg ttccccgggc agggcgccga cgaggtgtcg 600
cgcacgatcc agcacgcggt gacgctgccg gtcaaccact tctcggtcta cccctaccgg 660
ccgaccggcg gcaccgtgat gcgccggcag gtgggccgcg gcatgggccg gatcgacgtg 720
gaggagcagc tccggtcgta cgaccacgcc cgcgacctgc tcgcccggca cgggttcgag 780
gagtacgcca ccgcctactt cggcgctccc cgctgcgagt ccgacgaggt ctactacaag 840
ctcacgatgg actggatcgg gttcggctcc ggggccaact ccctcatcgg gacccgcttc 900
ctgctgaacg accggggcgg gctgcaccgc ttcagcacgg ccccgcaccg cttcgactcc 960
gacaccccgg cctcggcccc ccacctgaca cgccacttcc tggcccaggc gctgaccacg 1020
gtcgacggca tggacgcgcg caccttccag ctgcgcaccg gccgttcgct gcgggcggcg 1080
tgcgaggagc ccgcggtgcg ccggatgctc gaacagatca accgccgcgg caggctgatc 1140
gtcgactcac gcggcatccg gctgcaccgc gacgacatgg cctcggccta catcaccatg 1200
aacagcgtcg atctgtacgc cgcgaccgag cagcccggcg ga 1242
<210>23
<211>827
<212>PRT
<213>野野村氏菌属物种
<400>23
Val Pro Pro Ala Gln Ala Gly Gly Thr Pro Pro Gly Val Arg Arg Gln
1 5 10 15
Ile Met Glu Val Gly Arg Glu Ile Val Val Arg Val Ala Gly Leu Pro
20 25 30
Ala Ala Val Leu Ala Asp Leu Arg Leu Pro His Thr Ala Glu Leu Val
35 40 45
Thr His Leu Ser Ala Glu Arg Arg Arg Leu Ala Ala Glu Ala Ala Ala
50 55 60
Leu Ser Gly Glu Leu Phe Asp Leu Ile Gly Ala Ala Gly Ser Ala Arg
65 70 75 80
Ala Ala Leu Val Gly Leu Arg Arg Ala Leu Ala Pro Gly His Arg Pro
85 90 95
Pro Ser Pro Arg Leu Ile Gly Leu Cys Pro Leu Pro Ala Pro Leu Ala
100 105 110
Glu Arg Val Thr Ala Trp Val Arg Ala Arg Tyr Asp Trp Glu Asp Arg
115 120 125
Arg Arg Asp Leu Ala Gly Thr Leu Asp Lys Glu Arg Ala Asp Ala Leu
130 135 140
Asp Arg Val Arg Ala Ala Cys Val Ala Pro Ala Phe Arg Arg Gly Leu
145 150 155 160
Ala Leu Ser Gly Gly Glu Leu Thr Ser Thr Leu Glu Arg Trp Leu Ala
165 170 175
Asp Pro Gly Arg Ala Pro Arg Gln Gly Lys Val Leu Arg Leu Val Lys
180 185 190
Tyr Leu Thr Arg Ala Ala Ala Lys Thr Ser Pro Tyr Gly Ser Phe Met
195 200 205
Val Ser Ala Leu Ala Gly Arg Pro Gly Asp Asp Pro Pro Ile Pro Glu
210 215 220
Leu Leu Thr Val Ala Glu Pro Pro Gly Ala Phe Leu Asp Ala Val Gly
225 230 235 240
Asp Ala Leu Leu Ala Asp Pro Ala Leu Ala Gly Gln Val Pro Leu Arg
245 250 255
Pro Asn Pro Ser Leu Thr Trp Thr Ala Gln Gly Leu Leu Phe Val Arg
260 265 270
Thr Val Arg Ala Ala Ala Gly Glu Gln Ala Gly Pro Lys Glu Glu Ile
275 280 285
Ala Thr Ala Gly Arg Ala Ala Ala Leu Glu Leu Cys Leu Arg His Ala
290 295 300
Glu Ser Arg Pro Thr Ala Pro Gln Leu Ala Glu Leu Leu Ala Glu Ala
305 310 315 320
Gly Ala Asp Pro Gly Glu Ala Ala Ala Phe Val Asp Arg Leu Val Ala
325 330 335
Ala Gln Leu Leu Leu Pro Cys Pro Pro Val His Asp Asp Asp Pro Asp
340 345 350
Pro Phe Gly Ala Trp Ala Arg Gln Val Cys Ala Pro Glu Leu Arg Glu
355 360 365
Leu Ala Ala Ala Ser Arg Pro Val Ala Ala Ala Val Asp Ser Pro Gly
370 375 380
Gln Arg Arg Ala Arg Ile Ala Glu Ala Ala Ala Ala Val Ala Asp Arg
385 390 395 400
Leu Gly Ile Asp Pro Pro Ala Asp Pro Ala His Glu His Asp Val Ser
405 410 415
Thr Gly Arg Pro Ala Pro Pro Pro Leu Pro Ala Gly Val Leu Ala Asp
420 425 430
Leu Asp Ala Val Arg Arg Trp Leu Ala Val Phe Asp Trp Lys Val Pro
435 440 445
Val Arg Val Gly Val Gly Ala Phe Cys Arg Glu Arg Phe Gly Ser Gly
450 455 460
Ser Arg Thr Pro Phe Leu Glu Ala Cys Arg Ala Ala Thr Ala Ala Leu
465 470 475 480
Pro His Leu Phe Gly Pro Ala Ala Met Pro Trp Phe Leu Asp Leu Thr
485 490 495
Gly Asp Gly Arg Leu Arg Glu Leu Asp Arg Leu Arg Thr Arg Ala Arg
500 505 510
Asp Leu Ala Arg Ser Gly Val Leu Asp Arg Arg Arg Val Leu Ala Asp
515 520 525
Thr Ala Asp Trp Pro Ala Trp Leu Thr Trp Pro Ala Ser Thr Gly Phe
530 535 540
Tyr Leu Gln Thr Leu Pro Gly Gly Val Val Leu Asn Ala Val His Ala
545 550 555 560
Gly His Gly Arg Ala Ala Gly Arg Val His His Leu Leu Ala Arg Ala
565 570 575
Gly Ala Ala Pro Pro Arg Pro Pro Arg Ser Gly Leu Pro Arg Ala Glu
580 585 590
Phe Gly Gly Arg Phe Gly Ser Ala Leu Asn Thr Arg Thr Pro Ser Thr
595 600 605
Arg Tyr Glu Ile Asp His Pro Gly Ala Thr Ser Gly Arg Asp Pro Arg
610 615 620
His Arg Val Pro Leu Gly Thr Leu Met Val Val His Asp Pro Asp Thr
625 630 635 640
Asp Leu Val His Leu His Ser Asp Arg Leu Gly Arg Val Glu Pro Val
645 650 655
His Leu Gly Met Met Gly Glu Leu Gly Leu Pro Ala Val Ala Gly Phe
660 665 670
Leu Glu Arg Ala Phe Ala Pro Thr Tyr Leu Phe His Pro Ser Val Pro
675 680 685
Pro Phe Ile Ser Leu Arg Asp Leu Ala Gly Ala Ser Ser Ala Arg Arg
690 695 700
Phe Pro Arg Val Ser Val Gly Asp Val Val Val Gln Arg Ala Arg Trp
705 710 715 720
Thr Val Pro Ala Gly Leu Val Pro Ala Arg Thr Gly Ala Asp Gly Asp
725 730 735
His Leu Leu Ala Leu Ala Glu Trp Arg Arg Glu His Gly Ile Pro Glu
740 745 750
Arg Cys Phe Val Arg Gly Trp Lys Pro Gly Ala Ala Leu Gly Lys Ala
755 760 765
Arg Lys Pro Leu Tyr Val Asp Phe Ala Ser Trp His Leu Val Ala Leu
770 775 780
Phe Glu Arg Glu Ala Arg Thr Asn Ala Ala Leu Val Ile Asp Glu Ala
785 790 795 800
Leu Pro Asp Pro Leu Ala Asp Gly Ala Pro Ala His Val Thr Glu Tyr
805 810 815
His Val Glu Ile Gly Asp Arg Glu Arg Glu Gln
820 825
<210>24
<211>299
<212>PRT
<213>野野村氏菌属物种
<400>24
Met Thr Glu Arg Pro Gly Trp Phe Ala Ala His Val His Tyr Arg Gly
1 5 10 15
Asp Leu Asp Ala Leu Leu Arg Glu Ala Val Ala Pro Leu Val Arg Ala
20 25 30
Leu Ala Ala Asp Phe Phe Phe Leu Arg Tyr Trp Asp Gly Gly Ser His
35 40 45
Leu Arg Leu Arg Leu Arg Gly Gly Asp Gln Val Ala Val Ala Arg His
50 55 60
Leu Asp Ala Tyr Leu Ala Ala His Pro Ala Pro Glu Thr Thr Ser Gln
65 70 75 80
Glu Glu Tyr Ala Arg Val Ala Pro Val Leu Ala Ala Arg Glu Gly Met
85 90 95
Thr Gly His Leu Thr Thr Leu Arg Pro Asn Asn Thr Val Glu Phe Ala
100 105 110
Ala Tyr Arg Pro Glu Thr Ala Lys Tyr Gly Thr Gly Asp Ala Leu Arg
115 120 125
Ala Val Glu Arg His Phe Val Glu Ser Ser Arg Tyr Ala Leu Asp Val
130 135 140
Leu Asp Arg Arg Pro Thr Gly Asn Gln Arg Glu Leu Ala Val Leu Gly
145 150 155 160
Val Leu Leu Leu Ala Trp Tyr Ala Ala Arg Pro Leu Asp Glu Pro Pro
165 170 175
Gly Glu Pro Val Asp Asp Glu Leu Ile Gly Ala Val Glu Ala Leu Cys
180 185 190
Arg Gly Trp Arg Gly Gly Arg Asp Leu Pro Glu Glu Leu Val Ala Glu
195 200 205
Glu Tyr Gly Arg Val Arg Glu Arg Val Ala Gly Leu Ala Gly Ala Leu
210 215 220
Arg Asp Leu Val Pro Asp Pro Asp Ala Pro Gly Ser Ser Met Arg Ala
225 230 235 240
Trp Ala Ala Thr Phe Asp Arg Leu Ala Ala Ala Leu Pro Pro Pro Asp
245 250 255
Arg Leu Arg Val Leu Asp Thr Cys Ala His Leu Ala Ala Asn Arg Leu
260 265 270
Gly Val Ser Met Ala Ala Glu Val Arg Leu Arg Leu Leu Ala Ala Arg
275 280 285
Ala Leu Arg Glu Val Ala Pro Val Gly Arg Arg
290 295
<210>25
<211>333
<212>PRT
<213>野野村氏菌属物种
<400>25
Met Ser Trp Arg Arg Val Asp Val Ala Tyr His Asp Pro Asp Leu Asp
1 5 10 15
Gly Leu Ile Leu Ala Thr Arg Pro Leu Leu Ala Gly Thr Pro Gly Arg
20 25 30
Gly Trp Phe Gln Arg His Trp Val Arg Gly Pro His Leu Glu Leu Trp
35 40 45
Phe Asp Ala Ala Gln Pro Ser Trp Glu Arg Ile Arg Asp Val Leu Glu
50 55 60
Pro Trp Leu Arg Val Asn Pro Ser Arg Ala Arg Ile Asp Arg Asp Arg
65 70 75 80
Leu Leu Ala Gln His Arg His Leu Ala Ala Ala Glu Arg Ile Asp Glu
85 90 95
Pro Leu Leu Pro Phe Tyr Ala Asp Asn Thr Leu His Arg Ala Ala Pro
100 105 110
Arg Ser Arg Ala His Val Leu Gly Gly Pro Ala Ala Glu Glu Leu Phe
115 120 125
His Asp Phe His Thr Thr Ala Ser Ala Val Ala Tyr Asp Glu Leu Asp
130 135 140
Ala Val Arg Ala Gly Glu Ser Arg Leu Val Met Ala Leu Asp Leu Met
145 150 155 160
Val Ala Ala Ala His Ala His Ala Glu Gly Gly Val Arg Gly Gly Phe
165 170 175
Val Ser Phe Arg Ser His Ala Glu Ala Phe Leu Ala Ser Ala Pro Gly
180 185 190
Leu Arg Glu Arg Trp Asp Ala Glu Tyr Ala Ala Arg Ala Gly Ala Leu
195 200 205
Arg Ala Arg Ile Thr Ala Val Val Ala Gly Ile Pro Arg Gly Arg Ala
210 215 220
Trp Ala Gly Leu Leu Asp Arg Phe Ala Asp Arg Gly Asp Glu Leu Ile
225 230 235 240
Ala Ser Gly Ala Leu Leu Val Glu Pro Ala Gly Pro Asp Ala Val Ala
245 250 255
Arg Pro Asp Thr Ala Phe His Arg Ala Leu Arg Gly Asn Arg Thr Trp
260 265 270
His Glu Glu Val Leu Arg Ser Ala Pro Phe Arg Arg Tyr Arg Leu Leu
275 280 285
Leu Asn Leu Thr Tyr Leu Gln Leu Ser Arg Leu Gly Val Asn Ala Val
290 295 300
Gln Arg Ala Leu Leu Cys His Phe Ala Ala Ser Ala Val Glu Gln Glu
305 310 315 320
Tyr Gly Val Ser Ala Ile Glu Ile Ala Met Gly Gly Ala
325 330
<210>26
<211>455
<212>PRT
<213>野野村氏菌属物种
<400>26
Val Met Ser Val Gln Val Glu Pro Ala Val Thr His Arg Trp Ala Leu
1 5 10 15
Arg Pro Gly Val Tyr Arg Ala Thr Ala Pro Gly Gly Asp Leu Met Leu
20 25 30
Ala Ala Trp Pro His Ala Thr Pro Leu Gly Arg Ala Thr Pro Glu Leu
35 40 45
Leu Ala Leu Leu Asp Gly Leu Ala Ala Gly Ser Leu Pro Leu Asp Glu
50 55 60
Pro Gly Asp Leu Ala Pro Ala Val Glu Leu Leu Arg Ala Gly Gly Trp
65 70 75 80
Leu Arg Lys Thr Val Ala Tyr Ala Gly Arg Asp Leu Tyr Thr Ile Thr
85 90 95
Pro Val Ala Ala Pro Thr Asp Ala Pro Pro Pro Pro Arg Asp Glu Pro
100 105 110
Ala Leu Ser Arg Phe Ala Leu Leu Arg Asn Thr Ala Asp Gly Leu Val
115 120 125
Leu Glu Met Pro Gly Ser Trp Cys Asp Val His Val His Asp Pro Ala
130 135 140
Val Ala Ala Leu Leu Ala Asp Pro Ser Gly Asp Gly Gly Leu Pro Ala
145 150 155 160
Glu Ala Ala Ala Ala Leu Arg Ala Asp Leu Ala Ala Ala Gly Met Leu
165 170 175
Met Glu Arg Glu Glu Pro Phe Glu Arg Arg Gln Trp Ser Thr His Glu
180 185 190
Leu Trp Phe His Glu Arg Ser Arg Leu Gly Asn Arg Gly Trp Phe Gly
195 200 205
Ala His Phe Gly Gly Thr Phe Trp Ala Arg Gly Arg His Asp Pro Pro
210 215 220
Pro Ala Arg Pro Ser Pro Tyr Pro Gly Pro Ala Val Glu Leu Ala Arg
225 230 235 240
Pro Asp Leu Ala Ala Leu Arg Arg Thr Asp Pro Thr Leu Thr Ala Val
245 250 255
Leu Glu Asp Arg Glu Ser Val Arg Asp His Asp Asp Asp Asp Pro Ile
260 265 270
Ser Ala Glu Gln Leu Gly Glu Leu Leu Tyr Arg Cys Ala Arg Val Arg
275 280 285
Leu Leu Arg His Leu Glu Gly Phe Glu Tyr Ala Gly Lys Pro Tyr Pro
290 295 300
Ala Gly Gly Ser Ala Tyr Glu Leu Glu Val Tyr Pro Val Val Arg Leu
305 310 315 320
Ala Arg Gly Leu Asp Pro Gly Met Tyr His Tyr Asp Ala His Asp His
325 330 335
Arg Leu Arg Gln Val Arg Pro Ala Gly His Pro Ala Val Arg Arg Met
340 345 350
Leu Lys Val Ala Thr Glu Ser Ser Val Ala Lys Ala Pro Pro Gln Val
355 360 365
Leu Leu Val Ile Ser Ala Arg Val Gly Arg Ile Leu Trp Lys Tyr Glu
370 375 380
Ala Met Gly Tyr Ala Leu Met Leu Lys His Val Gly Val Leu Gln Gln
385 390 395 400
Thr Leu Tyr Ala Val Ala Thr Ala Met Asp Leu Ala Pro Cys Ala Leu
405 410 415
Gly Ser Gly Asp Asp Leu Ala Phe Thr Ala Ala Thr Gly Arg Asp Arg
420 425 430
Leu Val Glu Cys Ala Val Gly Glu Phe Met Val Gly Ser Arg Arg Lys
435 440 445
Glu Pro Ala Ala Trp Glu Leu
450 455
<210>27
<211>608
<212>PRT
<213>野野村氏菌属物种
<400>27
Met Gly Ala Leu Asn Leu Leu Leu Arg Pro Asp Ala His Tyr Ala Glu
1 5 10 15
Val Asp Gly Gly Val Tyr Val Leu Ser His Gln Gly Glu Thr Phe Ile
20 25 30
Ser Gly Thr Ser Val His Arg Trp Leu Asp Arg Leu Ala Pro Leu Leu
35 40 45
Asp Gly Thr Arg Thr Leu Asp Gln Leu Thr Ala Gly Leu Pro Ala Asp
50 55 60
Arg Ala Gly Phe Val Ala Arg Leu Val Gly Thr Leu Thr Glu Arg Gly
65 70 75 80
Leu Val Arg Glu Val Gly Pro Ala Val Ser Asp Thr Leu Thr Asp Ala
85 90 95
Glu Arg Gly Glu His Arg Ala Leu Leu Ala Tyr Leu Gly Tyr Phe His
100 105 110
Asp Ser Pro Gly Arg Val Leu Glu Asp Val Arg Asp Thr Pro Thr Ala
115 120 125
Ile Val Gly Ser Gly Pro Leu Ala Ala Ala Val Val Arg Ala Cys Ala
130 135 140
Ala Ala Gly Leu Arg Arg Val Glu Ile Gly Glu Glu Ala Gly Ala Ala
145 150 155 160
Arg Val Val Val His Val Ala Glu Arg Ala Glu Pro Glu Arg Ala Ala
165 170 175
Arg Leu Glu Arg Arg Cys Ala Ala Glu Gly Val Leu Leu Ala Gln Val
180 185 190
Met Pro Gly Pro Asp Gly Ile Trp Trp Gln Pro Ala Ala Arg Gly Gly
195 200 205
Cys Trp Ala Ser Ala Trp Arg Arg His Arg Ala Leu Ala Gly Val Asp
210 215 220
Arg Thr Gly Thr Pro Leu Asp Pro Val Ala Val Ala Val Val Ala Gly
225 230 235 240
Gln Val Ala His Asp Val Phe Arg Val Leu Ala Gly Leu Arg Glu Glu
245 250 255
Ala Pro Pro Arg Leu Val Val Leu Asp Pro Arg Thr Leu Ala Ser Thr
260 265 270
Ala His Pro Val Val Ala His Pro Phe Glu Leu Pro Ala Ala Pro Leu
275 280 285
Asp Glu Ala Ala Phe Leu Asp Arg Val Ala Ala Leu Arg Ala Ala Pro
290 295 300
Ala Leu Ser Glu Ala Glu Phe Ser Arg Arg Ala Lys Gly Leu Met Asp
305 310 315 320
Ser Thr Val Gly Leu Phe Ala Glu Ile Asp Glu Gly Asp Leu Ala Gln
325 330 335
Leu Pro Leu His Val Thr Ala Thr Thr Val Ala Asp Pro Cys Gly Leu
340 345 350
Ile Gly Ser Ala Pro Arg Pro Val Val Thr Gly Ala Gly Leu Thr Phe
355 360 365
Glu Glu Ala Arg Tyr Arg Ala Ala Arg Ala Ala Leu Ala Leu Ala Gly
370 375 380
Thr Leu Ala Leu Asp Arg Arg Arg Leu Val Asp Gly Arg Val Trp Ala
385 390 395 400
Tyr Asp Leu Ala Asp Gly Ala Ala Arg Leu Val Pro Ala Asp Glu Val
405 410 415
Phe Ala Ser Thr Ala Gly Gly Ser Thr Ala Gly Val Pro Leu Gly Ala
420 425 430
Ala Ala Ala Tyr Ser Trp Ala Glu Ala Val Ala Glu Gly Leu Val Ala
435 440 445
Gln Ala Ala Ala Leu Thr Leu Ala Gly Ala Gly His Ala Gly Glu Pro
450 455 460
Tyr Gly Arg Ala Asp Leu Ala Gly Ala Pro Ala Tyr Leu Leu Ala Met
465 470 475 480
Val Arg Ala Leu Gly Glu Glu Leu Thr Val His Asp Val Thr Gly Pro
485 490 495
Leu Gly Val Pro Val Val Val Gly Thr Leu Ser Gly Gly Ala Thr Ala
500 505 510
Cys Gly Ala Gly Met Thr Thr Asp Ala Ala Val Thr Ala Cys Leu Arg
515 520 525
Asp Leu Leu Leu Leu Arg Gln Ala Glu Ile Asn Asp Gln Pro Val Tyr
530 535 540
Ala Pro Pro Ser Gly Arg Pro Leu Pro Gly His Leu Arg Gly Asn His
545 550 555 560
Pro Ala Pro Ala Val Pro Gly Thr Asp Ala Asp Arg Leu Ala Ala Arg
565 570 575
Leu Ala Glu Arg Gly His Arg Pro Leu Ala Val Pro Leu Asp His Asp
580 585 590
Gln Ala Val His Ala Val Leu Pro Phe Ala Val Arg Val Val Cys Arg
595 600 605
<210>28
<211>578
<212>PRT
<213>野野村氏菌属物种
<400>28
Met Ile Arg Leu Pro Asp His Gly Glu Leu Ala Val Pro Ile Gly Asp
1 5 10 15
Gly Pro Met Leu Pro Leu Arg Thr Glu Leu Gly Arg Val Val Ile Gly
20 25 30
Pro Leu Glu Arg Pro Gly Val Pro Gly Cys Arg Ala Cys Val Arg Ile
35 40 45
Arg Ala Ala Arg Val Gln Pro Asp Ala Arg Lys Ala Glu Ala Val Arg
50 55 60
Ala Arg His Ala Pro Ala Pro Ser Gln Trp Leu Thr Pro Leu Ala Thr
65 70 75 80
Asp Leu Val Arg Val Leu Val Ala Ser Glu Ser Ala Ala Leu Ala Ala
85 90 95
Asp Thr Asp Pro Arg Thr Ala Gly Ala Val Leu Glu Ile Asp Leu Ala
100 105 110
Thr Leu Glu Ile Thr Arg His Arg Phe Leu Pro Asp Pro Leu Cys Pro
115 120 125
His Cys Gly Gly Leu Pro Pro Asp Gly Pro Ala Glu Leu Thr Leu Arg
130 135 140
Pro Arg Arg Lys Leu Gly Gly Ser Pro Arg Thr Arg Pro Val Glu Leu
145 150 155 160
Asn Ala Leu Leu Glu Thr Tyr Val Asp Gly Arg Val Gly Met Ile Arg
165 170 175
Pro Leu Lys Ser Gly Val Gln Gly Gly Leu Thr Val Ala Ser Ala Met
180 185 190
Leu Pro Ile Arg Ala Gly His Gly Leu Glu Pro Gly Val Gly Arg Thr
195 200 205
Arg Ser Tyr Thr Ala Ser Arg Leu Val Ala Val Leu Glu Ala Leu Glu
210 215 220
Arg Tyr Gly Gly Val Ser Pro Gly Gly Arg Arg Thr Ser Val Thr Ala
225 230 235 240
Ala Tyr Arg Asp Ile Ser Gly His Ala Val His Pro Asp Thr Phe Gly
245 250 255
Thr His Pro Glu Glu Asn Tyr Asp Arg Pro Gly Phe Ala Phe Arg Arg
260 265 270
Phe Thr Glu Asp Thr Val Cys Arg Trp Val Trp Gly Tyr Ser Phe Ala
275 280 285
Lys Ala Gln Pro Val Leu Val Pro Glu Asn Gln Val Tyr Tyr Tyr Ala
290 295 300
Arg Asn Leu Pro Asp Gly Glu Gln Pro Phe Val Phe Glu Val Ser Asn
305 310 315 320
Gly Cys Ala Leu Gly Ser Cys Leu Glu Glu Ala Ile Leu His Gly Leu
325 330 335
Leu Glu Val Val Glu Arg Asp Ala Phe Leu Leu Thr Trp His Ala Arg
340 345 350
Arg Glu Val Pro Val Leu Asn Pro Ala Leu Ala Ser Asp Pro Val Leu
355 360 365
Pro Met Gln Ala Ala Ala Ile Thr Ala Glu Thr Gly His Arg Val Leu
370 375 380
Cys Phe Asp Thr Thr Ala Glu His Gly Ile Pro Ser Val Trp Ala Met
385 390 395 400
Ala Val Asp Val Glu His Arg Ser Asp Arg Pro Ala Thr Ala His Ala
405 410 415
Ala Gly Ala Ala Leu Thr Leu Glu Gln Ala Ala Met Asn Ala Leu Ser
420 425 430
Glu Leu Gly Pro Leu Leu Ala Asp Val Ile Arg Arg Tyr Pro Glu Glu
435 440 445
Arg Glu Arg Ala Glu Ala Met Val Arg Asp Pro Glu Gln Val Ala Thr
450 455 460
Met His Asp His Ser Leu Leu Tyr Ala Val Pro Ala Ala Ala Glu Arg
465 470 475 480
Leu Ser Phe Leu Thr Gly Arg Ala Asp Gly Pro Arg Thr Gly Phe Gly
485 490 495
Ser Ala Arg Phe Thr Gly Asp Asp Leu Thr Ala Asp Leu Arg Ala Met
500 505 510
Ile Asp Ala Val Ile Asp Ala Gly Met Asp Val Val Val Val Asp Gln
515 520 525
Thr Thr Pro Glu His Leu Ala Gly Gly Phe Arg Cys Val Lys Val Leu
530 535 540
Val Pro Gly Ala Leu Pro Met Thr Phe Gly His Gln Tyr Arg Arg Leu
545 550 555 560
Asp Asn Leu Pro Arg Leu Ala Ala Ala Arg Thr Thr Asp Pro His Pro
565 570 575
Phe Pro
<210>29
<211>857
<212>PRT
<213>野野村氏菌属物种
<400>29
Met Ala Val Ile Glu Arg Glu Glu Ser Asp Gly Pro Pro Val Ala Val
1 5 10 15
Arg Thr Cys Gly Val Ala Ala Ala Glu Leu Glu Ser Leu Arg Trp Asp
20 25 30
Glu Ser Tyr Ala Leu Val Thr Arg Leu Leu Ala Glu Thr Ala Arg Val
35 40 45
Ala Ala Asp Gly Arg Arg Leu Ala Val Ala Leu Gly Asp Val Ile Gly
50 55 60
Gly Leu Gly Pro Ser Gly Ser Arg Pro Val Leu Val Gly Leu Arg Arg
65 70 75 80
Ala Leu His Thr Gly Arg Leu Pro Ser Gly Arg Glu Trp Gly Pro Glu
85 90 95
Ala Gly Ala Ala Leu Pro Tyr Gly Leu Arg Gly Glu Val Glu Glu Trp
100 105 110
Val Arg Arg Ala Arg Glu Cys Ala Gly Leu Arg Ala Arg Leu Pro Glu
115 120 125
Val Val Ala Arg Glu Ser Leu Glu Lys Glu Glu Arg Leu Arg Ala Ala
130 135 140
Ala Ala Asp Pro Ala Phe Arg Arg Gly Leu Ala Leu Ala Gly Gly Glu
145 150 155 160
Leu Ala Val Asp Leu Glu Thr Trp Leu Ala Asp Pro Ala Arg Arg Pro
165 170 175
Lys Pro Gln Lys Leu Leu Arg Leu Ala Lys Tyr Leu Val Arg Ala Ala
180 185 190
Val Lys Thr Ser Pro Tyr Ser Thr Phe Thr Ser Thr Gly Arg Ala Val
195 200 205
Trp Gly Gly Gly Glu Arg His Val Glu Arg Val Val Pro Val Leu Glu
210 215 220
Leu Asp Gly Val Gln Thr Phe Ser Asp Asp Arg Val Arg Val Asn Pro
225 230 235 240
Ser Val Thr Val Ala Gly Gly Thr Ala Glu Phe Ile Gly Pro Pro Pro
245 250 255
Gly Glu Ala Leu Val Ser Ile Gly Val Thr Glu Ala Val Ala Ala Cys
260 265 270
Leu Arg Val Ala Glu Gly Gly Glu Trp Val Pro Arg Gly Arg Phe Ala
275 280 285
Glu Ala Leu Gly Ala Glu Pro Ala Ala Val Thr Lys Phe Leu Asp Lys
290 295 300
Leu Leu Ala Val Gly Leu Leu Glu Ala Arg Pro Asp Gly Asp Pro Pro
305 310 315 320
Pro His Leu Leu Asp Gly Ile Arg Arg Thr Glu Arg Ala Thr Asp Pro
325 330 335
Ser Thr Phe Arg His Glu Leu Gly Arg LeuIle Ala Ala Ala Arg Ala
340 345 350
Ala Ala Arg Ala Thr Ala Pro Gly Ala Asp Thr Ala Lys Asn Ala Ala
355 360 365
Pro Ala Gly Arg Ala Thr Arg Gly Asp Gly Gly Ala Asp Ala Glu Arg
370 375 380
Ala Thr Arg Gly Asp Ser Asp Ala Asp Asp Gly Arg Ala Thr Arg Gly
385 390 395 400
Asp Gly Gly Ala Asp Asp Arg Gly Ala Ala Arg Gly Asp Gly Gly Val
405 410 415
Gly Arg Ala Val Val His Glu Val Ala Val Cys Val Glu Pro Val Ala
420 425 430
Arg Leu Asp Pro Ala Arg Trp Arg Gly Gly Leu Ala Asp Leu Asp Val
435 440 445
Val Arg Arg Trp Leu Ala Val Phe Asp Ala Lys His Pro Met Arg Leu
450 455 460
Ala Val Ala Ala Tyr Leu Thr Thr Arg Tyr Gly Pro Asp Pro Ala Val
465 470 475 480
Pro Phe Leu Thr Leu His Arg His Ile Gln Arg Glu Leu Ala Gly Thr
485 490 495
Gly Ala Ala Gly Arg Glu Leu Arg Ala Phe Leu Gly Ser Ser Ala Ala
500 505 510
Trp Thr Gln Pro Leu Gly Thr Ser Ala Leu Pro Arg Ile Arg Glu Leu
515 520 525
Glu Arg Leu Arg Ala Glu Ala Arg Ser Leu Ala Leu Asp Ala Glu Asp
530 535 540
Pro Asp Gly Thr Cys Arg Val Thr Pro Gly Gln Leu Ala Ala Gln Leu
545 550 555 560
Glu Ser Trp Pro Ser Trp Ile Ala Ile Pro Ala Ser Ser Ala Cys Tyr
565 570 575
Val Gln Ala Val Ala Gly Thr Leu Val Leu Asn Val Val His Gly Gly
580 585 590
His Gly Arg Ala Leu Arg Arg Leu Asp His Leu Leu Glu Arg Ala Gly
595 600 605
Gly His Pro Glu Pro Pro Arg Ile Glu Asp Pro Asp Gly Ala Val Tyr
610 615 620
Ala Glu Phe Ser Gly Asp Leu Gly Ser Thr Leu Asn Ala Arg Pro Pro
625 630 635 640
Ser Thr Arg Tyr Glu Ile Asp Tyr Pro His Ser Pro Gly Thr Arg Pro
645 650 655
Pro Asp Leu Arg Leu Pro Leu Thr Asp Leu His Val Thr Leu Cys Pro
660 665 670
Asp Ser Gly Leu Pro Glu Leu Arg Ser Lys Arg Leu Gly Arg Arg Val
675 680 685
Val Pro Leu His Leu Gly Leu Ala Ala Glu Phe Arg Leu Pro Pro Ala
690 695 700
Ala Arg Phe Ile Glu Arg Val Phe Gly Pro Gly Tyr Leu Leu His Pro
705 710 715 720
Ser Ser Pro Pro Leu Val Arg Met Gly Arg Val Pro Ser Glu Val Thr
725 730 735
Arg Tyr Pro Arg Val Glu Ala Gly Arg Val Val Val Gln Arg Arg Arg
740 745 750
Trp Leu Ala Pro Ala Ala Thr Leu Pro Val Arg Ala Lys Gly Glu Gly
755 760 765
Asp Ala Ala Tyr Leu Thr Arg Leu Ile Ala Trp Ala Asp Glu Tyr Gly
770 775 780
Val Pro His Arg Ser Phe Val Arg Ala Trp Pro Glu Gln Thr Gly Asp
785 790 795 800
Lys Gly Gln Asp Lys Ala Arg Lys Pro Leu Phe Leu Asp Leu Ala Asn
805 810 815
Leu Phe Leu Val Lys Asn Phe Glu Arg Gln Ile Arg Gly Cys Ala Phe
820 825 830
Ala Leu Phe Glu Glu Ala Leu Pro Asp Pro Gly Pro Glu Arg Val Thr
835 840 845
Glu Tyr Leu Ile Glu Val Gly Gly Arg
850 855
<210>30
<211>271
<212>PRT
<213>野野村氏菌属物种
<400>30
Met Ser Trp Val Ser Val His Val Phe Ser Gln Gly Pro Leu Asp Asp
1 5 10 15
Met Ile Thr Gly Leu Ala Gly Pro Leu Leu Gly Asp Asp Gly Phe Phe
20 25 30
Leu Arg Tyr Trp Glu Gly Gly Pro Hi s Leu Arg Ile Arg Val Arg Ser
35 40 45
His Pro Ala Glu Gln Val Val Glu Arg Ala Glu Ala Tyr Leu Arg Glu
50 55 60
His Pro Ser Glu Ala Val Ile Asp Pro Glu Glu Tyr Ala Arg Leu Ala
65 70 75 80
Ala Thr Leu Ala Ala Arg Glu Gly Val Pro Gly Tyr Thr Arg Arg Leu
85 90 95
Tyr Pro Asn Asp Ser Ala His Leu Ile Pro Tyr Gln Pro Glu His Asp
100 105 110
Arg Tyr Gly Thr Gly Arg Ser Leu Asp Ala Val Glu Arg His Phe His
115 120 125
Asp Ser Ser Val Ile Ala Leu Gln Leu Ile Gly Ala Gly Leu Gly His
130 135 140
Glu Arg Arg Ser Met Ala Trp Leu Thr Met Leu Leu Val Ala Trp Gln
145 150 155 160
Val Ala Gly Glu Gly Arg Ala Phe Gly Pro Pro Ala Asp Ala Gly Val
165 170 175
Gln Val Pro His Glu Arg Met Ala Ala Leu Val Glu His Ala Arg Ala
180 185 190
Val Thr Gln Glu Pro Ala Pro Ser Glu Pro Arg Gly Val Val Ala Ala
195 200 205
Trp Tyr Ala Ser Ile Ala Arg Leu Val Glu Glu Leu Ala Ala Ala Gly
210 215 220
Phe Asp Ala Ala Arg Thr Gly Ala Thr Val Asp Leu Ala Ala His Leu
225 230 235 240
Leu Ala Asn Arg Leu Gly Ile Arg Val Gln Glu Glu Ala Arg Leu Arg
245 250 255
His Leu Ala Ser Gly Ala Thr Arg Glu Ser Glu Val Gly Val Gly
260 265 270
<210>31
<211>319
<212>PRT
<213>野野村氏菌属物种
<400>31
Met Thr Trp Thr Arg Leu Arg Val Asp Tyr His Asp Gly Pro Met Asp
1 5 10 15
Asp Leu Ile Leu Asp Ala Leu Arg Pro Ala Trp His Glu Ile Arg Gly
20 25 30
Tyr Phe Leu Arg His Trp Val Cys Gly Pro His Leu Arg Ile Phe Val
35 40 45
Asp Gly Asp Ala Thr Pro Ile Val Arg Ala Val Glu Arg His Leu Ala
50 55 60
Ala Cys Pro Ser Ala Gly Thr Thr Asp Pro Gln Ala Leu Leu Pro Leu
65 70 75 80
His Glu Arg Leu Ala Glu Leu Glu Gly Glu Arg Gly Pro Leu Leu Pro
85 90 95
Trp Ala Pro Asp Asn Thr Val Thr Ala Glu Pro Pro Gly Leu Asp Thr
100 105 110
Glu Leu Asp Arg Phe Leu Ala Asp Phe Tyr Ala Asp Thr Thr Glu Ala
115 120 125
Ala Phe Asp Ala Leu Gly Arg Val Arg Ala Gly Thr Pro Leu Pro Gly
130 135 140
Ile Ala Phe Asp Leu Val Val Ala Thr Ala His Asp Leu Ser Glu Gly
145 150 155 160
Gly Leu Pro Thr Ala Arg Thr Ser Leu Arg Ser His Ala Glu Ala Tyr
165 170 175
Leu Ser Arg Leu Pro Gly Gly Val Arg Ala Lys Trp Gln Ala His Tyr
180 185 190
Glu Arg Asn Gln Glu Pro Leu Thr Ala Arg Ile Lys Ala Leu Thr Gly
195 200 205
Ala Gly Glu Pro Gly Ala Trp Leu Arg Thr Ile Arg Ala Thr Arg Asp
210 215 220
Arg Gly Arg Thr Leu Ile Asp Glu Gly Arg Leu Ser Leu Gly Tyr Ala
225 230 235 240
Thr Asp Gly Pro Ser Thr Arg Pro Pro Leu Ala Ala Val Ser Pro Phe
245 250 255
His Arg Asn Leu Glu Thr Asp Glu Arg Trp Leu Ala Leu Lys Asp Thr
260 265 270
Pro Ala Phe Ala Ala Tyr Arg Leu Ala Leu Asn Cys Ala Tyr Leu His
275 280 285
Leu Thr Arg Leu Gly Leu Thr Pro Asp Gln Arg Phe Leu Ile Cys His
290 295 300
Leu Ala Ala Ser Ala Ala Asp Asp Val Tyr Arg Ala Val Ala Ser
305 310 315
<210>32
<211>428
<212>PRT
<213>野野村氏菌属物种
<400>32
Met Thr Gly Glu Arg Tyr Glu Leu Arg Ala Gly Val His Leu Ala Arg
1 5 10 15
Leu Asp Ala Gly Val Arg Leu Phe Ala Trp Pro His Ala Glu Thr Leu
20 25 30
Gly Glu Leu Thr Arg Asp Glu Leu Asp Leu Leu Arg Asp Leu Ala Ala
35 40 45
Gly Pro Arg Thr Ala Gly Gly Pro Leu Val Glu Arg Leu Arg Ala Gly
50 55 60
Gly Trp Leu Lys Ile Thr Ile Thr Arg Asp Gly Val Pro Leu Tyr Thr
65 70 75 80
Leu Ala Pro Leu Arg Pro Pro Pro Pro Arg Pro Ala Val Pro Glu Arg
85 90 95
Pro Val Leu Ser Arg Phe Ala Thr Leu Arg Arg Glu Gly Asp Ala Leu
100 105 110
Val Ala Gly Ser Pro Leu Ala Trp Cys Asp Leu Tyr Val His Asp Pro
115 120 125
Gly Leu Val Gly Asp Val Val Arg Pro Gly Gly Glu Val Leu Ala Asp
130 135 140
Leu Val Trp Ala Gly Leu Ala Val Pro Glu Glu Ala Glu Asp Arg Glu
145 150 155 160
Leu Arg Phe Arg Gln Trp Ala Pro His Glu Leu Glu Phe His Asp Arg
165 170 175
Ser Arg Val Gly His Arg Gly Tyr Leu Gly Asp Gly Phe Gly Gly Thr
180 185 190
Phe Trp Ala Arg Gly Arg Phe Asp Pro Leu Pro Ala Arg Pro Arg Pro
195 200 205
Tyr Pro Gly Arg Ala Ile Glu Leu Pro Thr Pro Asp Leu Asp Glu Leu
210 215 220
Arg Leu Lys Asp Pro Ser Leu Thr Asp Val Leu Glu Gly Arg Arg Ser
225 230 235 240
Val Arg Glu His Asp Asp Glu Arg Pro Ile Thr Leu Asp Leu Leu Gly
245 250 255
Glu Leu Leu Tyr Arg Thr Ala Arg Val Arg Glu Cys Trp Thr Ala Asp
260 265 270
Gly Val Glu Tyr Thr Arg Lys Pro Tyr Pro Ser Gly Gly Ser Val Tyr
275 280 285
Glu Leu Glu Ile Tyr Pro Val Val Arg Asn Val Ala Gly Leu Glu Pro
290 295 300
Gly Met Tyr His Tyr Asp Gly His Asp His Val Leu Arg Pro Val Arg
305 310 315 320
Glu Ala Gly His Pro Ala Val Arg Arg Leu Leu Thr Val Ala Gly His
325 330 335
Gly Ala Ala Thr Gly Arg Arg Pro Gln Val Leu Leu Ala Val Ser Ser
340 345 350
Arg Ala Gly Arg Leu Leu Trp Lys Tyr Glu Gly Met Gly Tyr Ala Leu
355 360 365
Thr Leu Lys His Val Gly Val Leu Tyr Gln Thr Leu Tyr Cys Val Ala
370 375 380
Thr Ala Met Gly Leu Ala Ala Cys Gly Leu Gly Ser Gly Asp Ser Ala
385 390 395 400
Ala Phe Ala Glu Ala Thr Gly Arg Asp Pro Leu Glu Glu Cys Ala Val
405 410 415
Gly Glu Phe Met Ile Gly Thr Ala Glu Ala Pro Arg
420 425
<210>33
<211>630
<212>PRT
<213>野野村氏菌属物种
<400>33
Leu Asn Asp Phe Lys Pro Arg Leu Pro Ala Asp Ile Arg Phe Ala Pro
1 5 10 15
Thr Ser Gly Gly Val Ala Phe Leu Thr Arg Glu Gly Val Val Arg Met
20 25 30
Asn Gly Ala Ser Val His Leu Trp Val Glu Arg Leu Ala Val His Leu
35 40 45
Asp Gly Ser Arg Thr Val Ala Glu Leu Thr Ala Glu Leu Pro Asp Glu
50 55 60
Arg Arg Ala Phe Val Thr Ser Leu Leu Thr Thr Leu Arg Glu Arg Gly
65 70 75 80
Leu Val Glu Asp Ala Gly Glu Arg Gly Val Leu Pro Val Ala Ala Gly
85 90 95
Thr Ala Cys Ser Leu Leu Ala Asp Ala Asp Arg Phe Gly Glu Leu Ala
100 105 110
Pro Ala Leu Ala Asp Ala Leu Arg Arg Leu Gly Leu Glu Val Leu Thr
115 120 125
Glu Pro Ser Gly Gly Ala Leu Val His Val Ala Ala Ala Asp Ala Asp
130 135 140
Gly Leu Ala Ala Ala Gly Arg Leu Asp Arg Leu Ser Ala Glu Arg Gly
145 150 155 160
Leu ProIle Ala His Val Leu Leu Arg Glu Gly Glu Ala Trp Trp Ser
165 170 175
Glu Thr Gly Val Val Gly Arg Asp Val Pro Pro Trp Ala Ala Gly Trp
180 185 190
Arg Arg Leu Ala Ala Met Glu Ala Val Pro Arg Thr Ala Gly His Val
195 200 205
Ser Val Ser Pro Val Ala Ala Ala Val Val Ala Gly Gln Val Val Ala
210 215 220
Asp Leu Gly Arg Cys Leu Ser Gly Thr Pro Arg Val Ser Gly Gly Pro
225 230 235 240
Arg Leu His Val Val Asp Leu Asp Gly Phe Gly Met Arg Thr His Ser
245 250 255
Phe Leu Pro His Leu Ser Ala Leu Pro Pro Gly Thr Gly Val Ser Ala
260 265 270
Gly Pro Leu Gly Glu Glu Glu Phe Ser Arg Arg Ala Ala Arg Leu Met
275 280 285
Asp Ser Arg Thr Gly Val Phe Ala Glu Ile Glu Glu Gly Glu Tyr Gly
290 295 300
Gln Leu Pro Leu His Val Ser Val Thr Thr Val Ala Asp Pro Met Gly
305 310 315 320
Ala Leu Gly Gly Ala Leu Ala Arg Val Ile Gly Val Gly Ala Asp Phe
325 330 335
Ala Thr Ala Arg Tyr Arg Ala Ala Leu Lys Ala Leu Thr Val His Gly
340 345 350
Leu Leu Ala Leu Asp Pro Arg Arg Leu Val Thr Ala Glu Gly Thr Pro
355 360 365
Leu Thr Gly Ala Gly Glu Pro Ala Ser Gly Phe Pro Ala Asp Pro Gly
370 375 380
Ala Arg Glu Arg Pro Ile Gly Gly Phe Ser Ala Asp Pro Gly Ala Gly
385 390 395 400
Glu Arg Pro Asp Asp Gly Leu Leu Asp Asp Pro Leu Val Gly Asp Val
405 410 415
Ala Ala Gly Arg Val Glu Ala Phe Val Arg Gly Arg Asp Leu Val Glu
420 425 430
Gly Gly Glu Val Leu Leu Pro Ala Arg Ala Val Phe Leu Asp Pro His
435 440 445
Ala Thr Gly Ala Ala Ala Gly Tyr Ser Ala Glu Glu Ala Leu Val Ala
450 455 460
Gly Leu Leu Asp His Cys Ala Ala Leu Ala Gly Leu Asp Gly Thr Leu
465 470 475 480
Pro Pro Val Asp Val Gly Gly Ala Arg Ala Ala Asp Asp Glu Thr Ala
485 490 495
Arg Ser Ala Ala Leu Leu Asp Ala Ile Gly Leu Pro Tyr Gln Val Leu
500 505 510
Asp Ala Thr Gly Pro Ser Gly Val Pro Val His Ala Gly Thr Leu Gly
515 520 525
Gly Arg Leu Val Ala Arg Ala Ala Gly Val Thr Pro Leu Ala Ala Leu
530 535 540
Arg Ala Thr Leu Glu Gly Ile Leu Ala Ala Tyr Gln Gly Ile Pro Gly
545 550 555 560
Pro Ala Pro Leu Pro Asp Leu Cys Pro Ala Val Ala Gln Glu Pro Pro
565 570 575
Val Val Leu Asp Thr Gly Ala Ala Val Leu Gly Ala Gly Glu Leu Ala
580 585 590
Ala Ala Leu Ala Gly Ala Gly Leu Arg Val Ser Ala Val Pro Leu Asp
595 600 605
His Asp Arg Glu Val His Ala Leu Met Pro His Val Val Arg Val Val
610 615 620
Thr Glu Pro Leu His Gly
625 630
<210>34
<211>610
<212>PRT
<213>野野村氏菌属物种
<400>34
Val Gly Thr Gly Leu Leu Ala Glu Glu Ile Thr Ile Ala Leu Lys Asp
1 5 10 15
Arg Asp Gly Arg Ala Glu Val Thr Ile Thr Ala Cys Asp Gly Trp Ala
20 25 30
Arg Gly Pro Arg Arg Asp Gly Ala Ala Trp Leu Pro Val Arg Val Glu
35 40 45
Tyr Gly Val Ala Val Ile Gly Pro Leu Glu Arg Pro Gly Glu Pro Gly
50 55 60
Cys Val Thr Cys Phe Glu Thr Arg Arg Asp Arg Val Arg Thr Asp Ser
65 70 75 80
Ala Asp Arg Ala Ala Val Leu Ala Val His Gly Pro Glu Leu Ala Gly
85 90 95
Arg Ala Ser Pro Tyr Leu Gly Arg Leu Ala Ala Arg Thr Ile Ala Ala
100 105 110
Leu Ala Ala His Ala Ala Glu Gly Pro Gly Cys Ala Val Trp Tyr Val
115 120 125
Asp Leu Arg Thr Leu Thr Ala Glu Arg His Thr Phe Leu Pro Glu Pro
130 135 140
His Cys Pro Asp Cys Gly Asp Leu Pro Asp Asp Asp Arg Ala Ser Ala
145 150 155 160
Ala Phe Glu Pro Gly Ala Ala Pro Arg Pro Pro Gly Tyr Arg Val Arg
165 170 175
Asn Val Pro Ala Glu His Gly Ala Leu Leu Asp Thr Tyr Val Asp Gly
180 185 190
Glu Cys Gly Leu Ile Arg Pro Leu Val Arg Asp Thr Leu Gly Gly Leu
195 200 205
Val Ile Ala Gly Ala Met Leu Pro Leu Arg Phe Glu Gly Gly Ser Glu
210 215 220
Pro Gly Val Gly Arg Thr Arg Gly Tyr Arg Ala Ser Glu Val Thr Ala
225 230 235 240
Val Leu Glu Ala Leu Glu Arg Trp Gly Gly Val Glu Pro Gly Gly Lys
245 250 255
Arg Thr Arg Val Arg Ala Ser Tyr Ala Glu Val Ala Ala Asp Ala Leu
260 265 270
Asp Pro Arg Thr Leu Gly Glu His Asp Thr Ser Ser Tyr Glu Met Glu
275 280 285
Gly Phe Ala Phe Arg Pro Phe Ala Glu Asp Ala Val Cys Asp Trp Val
290 295 300
Trp Gly Tyr Ser Phe Ala Arg Arg Ser Pro Ile Leu Val Pro Glu Ser
305 310 315 320
Leu Ala Tyr Tyr Tyr Val Arg Gly Arg Glu Arg Pro Phe Leu Phe Glu
325 330 335
Ile Ser Asn Gly Cys Ala Leu Gly Gly Ser Met Ala Glu Ala Leu Leu
340 345 350
Tyr Gly Leu Leu Glu Thr Val Glu Arg Asp Ala Phe Leu Met Thr Trp
355 360 365
Tyr Gly Arg Leu Pro Val Pro Arg Ile Asp Pro Gly Thr Ala Arg Asp
370 375 380
Arg Thr Ile Pro Leu Gln Ala Ala Ala Ile Ile Ala Glu Thr Gly Tyr
385 390 395 400
Arg Val Glu Leu Tyr Asp Thr Thr Met Glu His Gly Ile Pro Ser Val
405 410 415
Trp Ala Met Gly Val Arg Gin Asp Gly Asp Pro Gly Arg Pro Arg Leu
420 425 430
Val Cys Ala Ala Gly Ala His Leu Val Pro Glu Lys Ala Val Leu Ser
435 440 445
Ala Leu Ser Glu Leu Gly Pro Leu Leu Ala Asp Leu Ile Arg Arg Tyr
450 455 460
Pro Asp Glu Val His Arg Ala Gln Glu Met Val Thr Asn Pro Asp Leu
465 470 475 480
Val Ala Thr Met His Asp His Ser Thr Leu Tyr Gly Ala Asp Ala Ala
485 490 495
Phe Asp Arg Leu Ser Phe Leu Thr Gly Gly Thr Gly Val Arg Gly Leu
500 505 510
Pro Asp Met Glu Ala Phe Thr Val Pro Gly Asp Leu Asp Val Met Arg
515 520 525
Val Val Asp Arg Phe Leu Ala Glu Gly Met Asp Val Val Val Ile Asp
530 535 540
Gln Thr Thr Pro Glu His Arg Ala Arg Gly Phe Ser Cys Val Lys Val
545 550 555 560
Leu Val Pro Gly Thr Leu Pro Met Thr Phe Gly His Arg Asn Arg Arg
565 570 575
Val Arg Gly Leu Thr Arg Pro Leu Glu Leu Pro Tyr Arg Leu Gly His
580 585 590
Arg Asp Thr Pro Leu Thr Pro Ala Asp Leu Asn Pro Asp Pro His Pro
595 600 605
Phe Pro
610
<210>35
<211>2484
<212>DNA
<213>野野村氏菌属物种
<400>35
gtgccgccgg cccaggccgg cggcactccg cccggggtga ggagacagat catggaggtg 60
ggccgcgaaa tcgtggtccg cgtggcgggg ctgcccgccg ccgtgctcgc cgacctgcgc 120
ctgccgcaca ccgccgagct cgtcacgcac ctgtccgctg agcggcggcg gctcgccgcc 180
gaggcggctg cgctgtccgg cgagctgttc gacctgatcg gcgccgccgg ctccgcccgc 240
gccgccctgg tgggcctgcg gcgcgcgctc gcccccgggc accgcccccc gtcgccgcga 300
ctgatcgggc tgtgtcccct gcccgccccg ctggccgagc gggtcaccgc ctgggtgcgg 360
gcccggtacg actgggagga ccggcgccgc gaccttgccg gcacgctgga caaggagcgc 420
gccgacgcgc tcgaccgcgt acgcgccgcc tgcgtcgccc cggcgttccg gcggggtctg 480
gcgctgtccg gtggggagct gaccagcacg ctggagcgct ggctcgccga ccccggccgt 540
gcgccccggc aggggaaggt gctccgcctg gtcaagtacc tgacccgagc tgcggccaag 600
accagcccgt acggctcctt catggtcagc gcgctggcgg ggcggcccgg cgacgaccct 660
cccatcccgg agctgctcac cgtggccgag ccgccggggg cgttcctcga cgccgtcggc 720
gacgcgctgc tcgccgaccc ggcactggcc ggccaggtgc cgctgcgccc caaccccagc 780
ctgacgtgga ccgcccaagg actgcttttc gtccggaccg tccgcgcggc ggcgggagag 840
caggccgggc cgaaggaaga gatcgccacc gccgggcgcg ccgccgcgct ggagctgtgc 900
ctgcggcacg ccgagtcccg gcccaccgcg ccgcagctgg cggagctgct ggccgaggcg 960
ggggcggatc cgggcgaggc ggccgcgttc gtcgaccggc tggtggcggc gcagctcctg 1020
ctgccgtgtc cgccggtgca cgacgacgat cccgacccgt tcggtgcctg ggcccgccag 1080
gtgtgcgccc cggagctgcg cgagctggcg gccgcgtcgc ggcccgtggc cgccgccgtg 1140
gactcgcccg gccagcgccg cgccaggatc gccgaagccg ccgccgccgt ggcggaccgg 1200
ctcggcatcg acccgcccgc cgatccggcg cacgagcacg acgtcagcac cggccgtccg 1260
gcgccgccac cgctgcccgc gggcgtgctc gccgacctgg acgcggtccg gcgctggctc 1320
gccgtgttcg actggaaggt gcccgtccgg gtgggggtcg gcgcgttctg ccgcgaacgt 1380
ttcggctcag ggtcccgcac gcccttcctg gaggcgtgcc gggcggcgac ggcggcgctg 1440
ccgcacctgt tcggccccgc cgcgatgccg tggttcctcg acctgaccgg tgacggtcgc 1500
ctgcgtgagc tggaccgtct ccggacgcgc gcccgcgatc tcgcccgctc cggcgtcctc 1560
gaccggcggc gggtgctggc tgacacggcc gactggcccg cctggctgac ctggcccgcc 1620
tccactggtt tctacctgca gaccctgccc ggtggggtgg tgctgaacgc ggtgcatgcc 1680
gggcacggcc gcgcggcggg tcgcgtccac cacctcctcg cccgggcggg cgccgcgccg 1740
ccgcgcccgc cccgctccgg cctgccgcgt gccgagttcg gcggcaggtt cggctccgcg 1800
ctcaacaccc gcacgccgag cacgcggtac gagatcgacc accccggcgc gacgtccggc 1860
cgcgaccccc ggcaccgtgt cccgctcggc acgctcatgg tggtgcacga cccggacacc 1920
gacctggtcc acctgcacag cgaccggctc ggccgcgtcg aaccggtgca cctcggcatg 1980
atgggcgagc tggggctgcc cgccgtggcc ggtttcctcg aacgcgcctt cgcgcccacc 2040
tacctgttcc acccgagcgt gccgccgttc atctcgctgc gtgacctggc cggcgcctcc 2100
tcggcgcggc gcttccccag ggtgagtgtc ggcgacgtgg tcgtgcagcg cgcccgctgg 2160
acggtgcccg ccggcctggt gcccgcgcgt accggggcgg acggtgacca cctgctcgcg 2220
ctggccgagt ggcggcgcga gcacggcatc cccgagcggt gtttcgtgcg cggctggaag 2280
ccgggcgcag cgctgggcaa ggcgcgcaag ccgctctacg tcgacttcgc ctcctggcat 2340
ctggtcgccc tgttcgaacg ggaggcgcga accaacgccg ccctggtcat cgacgaggcc 2400
ctgccggacc cgctggccga cggcgccccc gcgcacgtca ccgagtacca cgtcgagatc 2460
ggcgaccggg agagagagca atga 2484
<210>36
<211>900
<212>DNA
<213>野野村氏菌属物种
<400>36
atgaccgaac ggcccggctg gttcgcggcg catgtgcact accgcggcga cctcgacgcg 60
ctgctgcgcg aagcggtcgc gccgctggtg cgcgcgcttg ccgccgactt cttcttcctg 120
cgctactggg acgggggcag ccacctgcgg ctgcggctgc gcggcgggga ccaggtcgcg 180
gtcgcccggc acctggacgc ctaccttgcc gcccaccccg cgccggagac cacctcccag 240
gaggagtacg cccgcgtcgc cccggtgctg gccgcccgcg agggcatgac gggccacctg 300
acgacgctgc ggccgaacaa caccgtggag ttcgcggcgt accggccgga gaccgcgaag 360
tacggcaccg gcgacgcgct acgcgccgtc gagcggcatt tcgtcgagtc cagccggtac 420
gcgcttgacg tccttgaccg ccgcccgacc ggcaaccaac gcgagctcgc agtgctcggc 480
gtcctgctgc tcgcctggta cgccgcccgc ccactcgatg agccgcctgg tgagccggtc 540
gatgacgagc tgatcggcgc ggtcgaggcg ctgtgccggg gctggcgcgg cggccgggac 600
ctgcccgagg agctcgtggc ggaggagtac ggccgggtgc gggagcgtgt ggccgggctg 660
gccggcgcgc tgcgtgacct cgttccggac ccggacgcgc ccggcagcag catgcgcgcg 720
tgggcggcga cgttcgaccg gctcgccgcc gcgctgcccc cgcccgaccg gctgcgggtg 780
ctcgacacgt gcgcgcatct ggcggccaac cggctgggcg tgtccatggc ggccgaggtg 840
cggctgcggc tgctcgccgc gcgggccctg cgcgaggtcg cgcccgtggg gaggcgatga 900
<210>37
<211>1002
<212>DNA
<213>野野村氏菌属物种
<400>37
atgagctggc gacgcgtcgacgtggcctac cacgatcccg accttgacgg gctgatcctg 60
gccacccggc cgctgctggc cgggacgccc ggccgcggct ggttccagcg gcactgggtc 120
cgcggtccgc acctggagct gtggttcgac gccgcgcagc cgtcgtggga gcggatccgc 180
gacgtgctgg agccctggct gcgcgtcaac ccgtcgcgcg cccggatcga ccgagaccgg 240
ctgctggcgc agcaccggca cctcgccgcc gccgaacgga tcgacgagcc gctgctgccg 300
ttctacgccg acaacacgct gcaccgggcc gctccgcgct cccgcgcaca cgtgctcggt 360
ggtccggcgg ccgaggagct gttccacgac ttccacacca ccgccagcgc cgtggcttac 420
gacgagctcg acgccgtgcg ggcgggagag tcgcggctgg tgatggcact ggacctgatg 480
gtcgccgccg cgcacgcgca cgccgagggc ggcgtccgcg gcgggttcgt gtcgttccgc 540
tcgcacgcgg aggcgttcct ggcgagcgcg cccggcctgc gcgagcgctg ggacgccgag 600
tacgccgccc gggcgggggc gctgcgagcg cggatcaccg cggtggtcgc cggaatcccg 660
cgcggccggg cgtgggccgg gctgctcgac cggttcgcgg accgcggcga cgagctgatc 720
gcctccggcg cgctgctggt cgagcccgcc gggccggacg cggtcgcccg gcccgacacc 780
gccttccacc gggcgctgcg cggcaaccgg acctggcacg aggaggtgct gcgctcagca 840
ccgttccgcc gctaccggct gctgctgaac ctgacctacc tgcagctttc ccggctcggg 900
gtgaacgccg tgcagcgggc gctgctgtgc cacttcgccg cgtcggcggt cgagcaggag 960
tacggggtgt ccgccatcga gatcgccatg ggaggcgcgt ga 1002
<210>38
<211>1368
<212>DNA
<213>野野村氏菌属物种
<400>38
gtgatgtcag tacaggtcga gcccgcagtg acgcaccggt gggcactgcg gcccggcgtc 60
taccgggcca ccgcgccagg cggcgatctc atgctcgccg cctggccgca cgccacgccg 120
ctcggccggg ccacccccga gctgctggcc ctgctggacg gcctggccgc cggatcgctg 180
ccgctcgacg agcccggcga cctcgcgccc gccgtcgagc tgctgcgcgc gggtggctgg 240
ctgcgcaaga cggtggcgta cgcgggacgc gacctctaca ccatcacccc cgtcgccgcc 300
cccaccgacg cgccgccacc gccgcgggac gaaccggcgc tgtcgcggtt cgcgctgctg 360
cgcaacaccg cggacgggct ggtgctggag atgcccggct cctggtgcga cgtccacgtg 420
cacgacccgg cggtggccgc gctgctcgcc gacccgtccg gcgacggcgg cctgcccgcc 480
gaggccgcgg ccgcgctgcg cgccgacctg gccgccgccg gcatgctgat ggagcgggag 540
gagccgttcg agcggcggca gtggagcacc cacgagctgt ggttccatga acgcagccgg 600
ctcggcaacc ggggctggtt cggcgcgcac ttcggcggca cgttctgggc ccgcggccgg 660
cacgacccgc cgcccgcgcg gccgtccccc taccccggcc cggccgtcga gctggcccgg 720
ccggacctcg cggcgctgcg gcgcaccgac cccacgctca ccgccgtgct ggaggaccgc 780
gaaagcgtcc gcgaccacga cgacgacgat ccgatcagcg ctgagcagct cggcgagctg 840
ctctaccggt gcgcgcgggt gcggctgctg cgtcacctgg aaggcttcga gtacgccggc 900
aagccgtacc ccgccggtgg ctcggcgtac gagctagagg tgtacccggt cgtgcggctg 960
gcccgcggcc tcgaccccgg catgtaccac tacgacgcgc acgaccatcg gctgcgccag 1020
gtccggcccg ccggccaccc ggcggtgcgc aggatgctga aggtcgccac ggagtcgtcc 1080
gtcgccaagg cgccgcccca ggtgctgctg gtgatcagcg cgagagtcgg ccggatcctg 1140
tggaagtacg aggcgatggg gtacgcgctc atgctgaagc acgtcggcgt gctgcaacag 1200
acgctgtacg cggtcgccac cgccatggac ctggccccgt gcgcgctcgg cagcggggac 1260
gatctcgcct tcaccgccgc caccggccgg gaccggctgg tggagtgcgc ggtcggcgag 1320
ttcatggtcg gcagcaggcg gaaggagccc gcggcatggg agctctga 1368
<210>39
<211>1827
<212>DNA
<213>野野村氏菌属物种
<400>39
atgggagctc tgaacctcct cctgcgcccc gacgcgcact acgccgaggt cgacggcggc 60
gtctacgtgc tgagccacca gggcgagacc ttcatctcgg gcacctcggt gcaccggtgg 120
ctcgaccgcc tcgcgccgct gctcgacggc acccgcacgc tcgaccagct caccgccggc 180
ctgcccgccg accgggccgg cttcgtggcc agacttgtcg gcacgctcac cgaacgcggc 240
ctggtgcgcg aggtcggccc ggcggtgtcg gacacgctca ccgacgccga acgcggcgag 300
caccgtgccc tgctggccta cctgggctac ttccacgact cgcccggccg cgtcctcgag 360
gacgtgcgcg acaccccgac cgcgatcgtg gggtccggtc cgctggccgc cgcggtggtc 420
cgcgcctgcg ccgccgccgg gctgcgccgg gtggagatcg gcgaggaggc gggcgcggcc 480
cgggtggtcg tccacgtggc cgagcgcgcc gagcccgaac gggcggcgcg gctggaacgg 540
cggtgcgccg ccgagggggt gctgctcgca caggtcatgc cggggccgga cggcatctgg 600
tggcagcccg cggcccgcgg cggctgctgg gcgagcgcgt ggcgccgcca ccgggcgctc 660
gcgggcgtgg atcggacggg cacgccgctc gatccggtgg cggtcgcggt ggtggccggc 720
caggtggcac acgacgtctt ccgcgtcctc gccggactgc gcgaggaggc gccgccccgg 780
ttggtggtgc tcgatccgcg gacgctggcg agcaccgcgc acccggtggt ggcgcacccg 840
ttcgagctgc ccgccgcgcc gctggacgag gcggcgttcc tcgaccgggt cgccgcgctg 900
cgggcagcgc ccgcgctgag cgaggcggag ttctcccggc gggccaaggg gctcatggac 960
tcgacagtgg ggctgttcgc cgagatcgac gagggcgacc tcgcgcagtt gccgctgcac 1020
gtcacggcga ccacggtggc cgacccgtgc gggctgatcg gctccgcgcc gcggcccgtg 1080
gtcaccggcg cggggctcac gttcgaggag gcccgctacc gcgcggcgcg cgccgcgctc 1140
gccctggccg gcactctcgc gctcgaccgg cggaggctgg tcgacggccg ggtgtgggcg 1200
tacgaccttg cggacggggc cgcccggctg gttccggccg acgaggtctt cgcaagcacg 1260
gcgggcggga gcacggcggg cgtgccgctc ggcgcggcgg cagcctactc gtgggccgag 1320
gcggtcgcgg agggcctggt cgcgcaggcc gccgcgctca ctctcgccgg cgccgggcac 1380
gcgggcgagc cgtatggacg ggcggacctc gccggggcgc ctgcgtatct cctcgccatg 1440
gtgcgggcgc tcggcgagga gctgaccgtg cacgacgtca ccgggccgct gggcgtgccg 1500
gtcgtggtgg ggacgctgtc cggcggggcg accgcctgcg gcgcgggcat gaccacggac 1560
gccgccgtca ccgcgtgcct gcgcgacctg ctgctgctgc gccaggccga gatcaacgac 1620
cagcccgtct acgccccacc atccggcagg cccttgcccg ggcatctacg cgggaaccac 1680
ccggcgcccg ccgtgcccgg cacggacgcc gaccggctgg cggcccgcct ggccgagcgg 1740
gggcaccgcc ctctggcggt gccgctggat catgaccagg ccgtgcacgc ggtcctgccc 1800
ttcgccgtcc gggtggtgtg ccgatga 1827
<210>40
<211>1737
<212>DNA
<213>野野村氏菌属物种
<400>40
atgatccgcc tgcccgacca cggcgagctt gccgtgccga tcggcgacgg gccgatgctg 60
ccgctgcgca ccgaactcgg ccgggtggtc atcggcccgc tggagcggcc cggcgtgccc 120
ggatgccggg cctgcgtgcg catccgcgcg gcgcgggtcc agcccgacgc ccgcaaggcc 180
gaggccgtac gcgcccggca cgcccccgcg cccagccagt ggctcacccc gctcgccacc 240
gacctggtgc gcgtcctggt cgcgagcgag agcgctgccc tggcagccga caccgacccc 300
cgcaccgcgg gtgccgtgct ggagatcgac ctcgccacgc tggaaatcac caggcaccgg 360
ttcctgcccg acccgctctg cccgcactgc ggcggtctgc cgccggacgg cccggccgag 420
ctgaccctgc ggccccgccg caagctcggc ggcagtcccc ggaccaggcc ggtcgagctg 480
aacgcgctgc tggagacgta cgtggacggc cgggtcggga tgatccggcc gctgaagtcg 540
ggcgtgcagg gcggactgac ggtggccagc gccatgctgc cgatccgcgc gggccacggc 600
ctggaaccgg gggtcggccg tacccgcagc tacaccgcga gcaggctggt cgccgtgctg 660
gaggcgctgg agcgctatgg cggcgtcagc cccggcggcc gccgcaccag cgttaccgcc 720
gcctaccgcg acatctccgg ccacgccgtc catcccgaca ccttcggcac acaccccgag 780
gagaactacg acaggcccgg cttcgccttc cggcgcttca ccgaggacac cgtgtgccgg 840
tgggtgtggg gctactcctt cgccaaggcc cagcccgtgc tggtgccgga gaaccaggtc 900
tactactacg ccagaaacct gccggacggc gagcagccgt tcgtcttcga ggtctccaac 960
ggctgcgcgc tcggctcgtg cctggaggag gcgatcctgc acggcctgct cgaggtggtc 1020
gagcgggacg cgttcctgct cacctggcac gcccggcggg aggttccggt gctgaacccc 1080
gcgctggcga gcgacccggt cctgcccatg caggccgccg cgatcaccgc cgagaccggg 1140
caccgggtgc tgtgcttcga caccaccgcc gagcacggca tccccagcgt gtgggcgatg 1200
gccgtggacg tcgaacaccg gtcggaccgg cccgccaccg cccacgccgc cggcgcggcg 1260
ctcacgctgg agcaggccgc catgaacgcg ctgagcgagc tcggcccgct gctggccgac 1320
gtgatccgcc gctaccccga ggagcgggaa cgggccgagg ccatggtccg cgaccccgag 1380
caggtcgcca ccatgcacga ccactccctg ctctacgcgg ttcccgccgc ggccgaacgg 1440
ctgtcgttcc tcaccggccg cgccgacggc ccgcggaccg gcttcggctc ggcccggttc 1500
accggcgacg acctcaccgc cgatctgcgg gccatgatcg acgcggtgat cgacgccggg 1560
atggacgtgg tggtcgtcga ccagaccacg ccggagcacc tggcgggcgg gttccgctgc 1620
gtgaaggtgc tggtgcccgg cgcgctgccg atgacgttcg gccaccagta ccggcggctg 1680
gacaacctgc cgcggctggc ggccgcgcgt accaccgacc cgcacccgtt cccatga 1737
<210>41
<211>2574
<212>DNA
<213>野野村氏菌属物种
<400>41
atggcggtta ttgagcggga agaaagcgac ggcccgccgg tcgctgtccg cacgtgcggg 60
gtcgcggccg cggagctgga atccctgcga tgggacgagt cctatgcgct ggtgacccgg 120
ctgctcgcgg agaccgcccg ggtggcggcg gacgggcggc ggctggccgt ggcgctcggt 180
gacgtcatcg gagggctcgg cccgtccggg tcccggcccg tcctcgtggg gctgcggcgg 240
gcgctgcaca ccgggcgtct cccctccggg cgggagtggg ggcccgaggc cggggcggcg 300
ctgccgtacg ggctgagggg cgaggtggag gagtgggtac ggcgtgcgcg cgagtgcgcc 360
gggctgcgcg cccgcctgcc cgaggtcgtc gcccgggagt ccctggagaa ggaggaacgg 420
ctgcgcgccg ccgcggccga ccccgccttc cgcagggggc tggcgctggc cggcggcgag 480
ctggcggtcg acctggagac gtggctcgcg gaccccgcgc ggcgccccaa gccgcagaag 540
ctgctcaggc tggccaaata cctggtcagg gccgccgtga agaccagccc gtacagcacg 600
ttcacgagca ccgggcgggc ggtgtggggc ggtggcgagc ggcacgtgga gcgcgtggtg 660
ccggtgctgg aactcgacgg cgtccagacg ttctcggacg atcgggtcag ggtgaatccg 720
tcggtcaccg tcgcgggcgg gacggcggag ttcatcgggc cgcctcccgg ggaggcgctg 780
gtgtccatcg gggtgacgga ggcggtggcc gcgtgcctgc gcgtcgcgga gggcggggag 840
tgggtgccgc ggggccggtt cgcggaggct ctgggggctg agcctgccgc agtcacgaaa 900
tttctggaca agttgcttgc ggttgggctc ctggaggccc ggccggacgg cgacccgccc 960
ccgcacctgc tggacgggat ccggcgcacg gaacgcgcca ccgacccgtc caccttccgc 1020
cacgaactcg gccgcctgat cgccgccgcc cgcgccgccg cccgcgccac cgcccccggc 1080
gctgacacgg ccaagaacgc cgcccctgcc gggcgcgcca cccgcggcga tggcggtgct 1140
gatgccgagc gcgccacccg cggcgatagc gatgctgatg acgggcgcgc cacccggggc 1200
gacggcggtg ctgatgacag gggcgccgcg cggggcgacg gcggtgtggg gcgggcggtt 1260
gtgcacgagg tcgcggtctg cgtcgagccc gtggcgaggc tggatccggc gcgatggcgt 1320
ggcgggcttg ccgatctcga cgtcgtacgc cgctggctgg ccgttttcga cgccaagcac 1380
cccatgcgcc tcgcggtcgc cgcctacctc accacccggt acggccccga cccggccgtc 1440
cccttcctca cgctccaccg ccacatccag cgcgagctgg ccggcaccgg cgcggcaggc 1500
cgggagttgc gcgcgttcct cggctcgtcg gccgcctgga cccagccgct aggcacctcc 1560
gccctgccca ggatcaggga gctggagcgc ctcagagccg aggcgagaag cctggcgctg 1620
gacgcggagg accccgacgg cacctgccgc gtcacccccg gacagctggc cgcgcagctg 1680
gagtcgtggc cgtcttggat cgcgatcccc gcctcctcgg cctgctacgt acaggcggtg 1740
gccggcaccc tggtgctcaa cgtcgtccac ggcgggcacg gccgagccct gcgcaggctc 1800
gaccacctcc tcgaacgcgc cggcggccac cccgagccgc cccggatcga ggacccggac 1860
ggcgcggtct acgccgagtt ctccggcgac ctgggctcca cgctcaacgc gcgcccgccg 1920
agcacccgat acgagatcga ctacccccac tcgcccggca cgcgcccgcc cgacctgcgg 1980
ctgccgctca cggacctgca cgtgacgctc tgcccggaca gcggcctgcc cgagctgcgt 2040
tccaagcggc tcggccgccg ggtcgtgccg ttgcatctcg ggctggccgc cgagttccgg 2100
cttccgccgg ccgcgcggtt catcgaacgc gtcttcggcc ccggctacct gctccatccc 2160
agctcgccgc cgctggtgcg gatgggccgg gtcccctcgg aggtcacccg gtatccacgc 2220
gtcgaggccg ggcgcgtggt ggtgcagcgg cgtcgctggc tggcgcctgc ggccacgctg 2280
ccggtgcgcg cgaagggcga gggcgacgcg gcgtacctca cgcggctgat cgcctgggcg 2340
gacgagtacg gcgtaccgca ccgatcgttc gtccgcgcct ggccggagca gaccggcgac 2400
aaagggcagg acaaggcgcg caaaccgctc ttcctggacc tggcgaacct gttcctggtc 2460
aagaacttcg agcggcagat acgtggctgc gcgttcgcgc tcttcgagga ggcgctgccc 2520
gacccgggac cggagcgggt gaccgaatac ctgatcgagg tgggaggccg atga 2574
<210>42
<211>816
<212>DNA
<213>野野村氏菌属物种
<400>42
atgagctggg tgagcgtgca cgtcttctcg caggggccgc tcgacgacat gatcacgggc 60
ctggccgggc cgctcctcgg cgacgacggc ttcttcctgc gctactggga gggcggcccg 120
catctgcgga tcagggtcag gtcccacccg gcggagcagg tcgtcgagcg ggccgaggcg 180
tatctgcgcg agcacccgtc agaggcggtg atcgacccgg aggagtacgc caggctcgcc 240
gcgaccctcg ccgcccgcga aggcgtcccc ggctatacgc ggcgcctcta tccgaacgac 300
tccgcccacc tcatcccgta ccagccggaa cacgaccgct acggcacggg ccgctcgctc 360
gacgccgtgg agcggcactt ccacgactcc agcgtgatcg cactccagct gatcggggcg 420
gggctcggac acgagcggcg gagcatggcg tggctgacca tgctgctggt cgcctggcag 480
gtcgcggggg agggcagggc gttcggcccg cccgctgacg ccggggttca ggtgccccac 540
gagcggatgg cggcgctggt cgagcacgcc agggcggtga cacaggagcc tgcgccgagc 600
gagccccgtg gcgtggtggc cgcctggtac gcctcgatcg cgcggctggt ggaggaactg 660
gcggcggcgg ggttcgacgc ggcgcggacg ggggcgaccg tcgatctggc cgcgcatctg 720
ctggccaaca ggctggggat ccgggtgcag gaggaggccc ggctgcgtca cctggcgtcc 780
ggggccacga gggagtcgga ggtgggggtc ggatga 816
<210>43
<211>960
<212>DNA
<213>野野村氏菌属物种
<400>43
atgacctgga cgcggctgcg ggtggactat cacgacggcc cgatggacga cctcatcctg 60
gacgcgctcc gcccggcctg gcatgaaata cggggatatt tcctgcgcca ctgggtgtgc 120
ggcccgcacc tgcggatctt cgtggacggc gacgcgacgc cgatcgtccg ggcggtcgag 180
cgccacctgg ccgcctgccc gtccgccggc accaccgacc cgcaggcgct gctccccctg 240
cacgagcgcc tggccgagct ggaaggcgaa cgaggcccgc tgctgccatg ggcccccgac 300
aacaccgtca ccgccgaacc cccggggctc gacaccgagc tcgaccggtt cctcgcggac 360
ttctacgccg acaccaccga ggccgcgttc gacgccctcg gccgggtcag agccggcacg 420
ccgctgccgg gcatcgcctt cgacctggtg gtcgccaccg cgcacgacct gtcggagggc 480
ggcctgccca ctgccaggac ctcgctgcgc tcgcacgccg aggcttacct gtcgcgcctg 540
ccgggaggcg tccgcgccaa gtggcaggcg cactacgaac gcaaccagga gccgctgacc 600
gccaggatca aggccctgac cggcgccgga gagcccggcg cgtggctgcg tacgatccgg 660
gccacccgcg accggggccg taccctcatc gacgagggac ggctgagcct cggctacgcc 720
accgacggcc cttccacgcg gcccccgctc gccgcggtct cccccttcca ccggaacctg 780
gagaccgacg aacgctggct cgccctcaag gacacccccg ccttcgccgc ctaccgcctg 840
gccctgaact gcgcgtacct ccacctcacc cggctcggcc tcacgcccga ccagcgcttc 900
ctgatctgcc acctcgccgc gagcgccgcc gacgacgtct accgggccgt ggcctcatga 960
<210>44
<211>1287
<212>DNA
<213>野野村氏菌属物种
<400>44
atgaccgggg aacggtacga gctgcgcgcc ggcgtgcacc tcgcccggct ggacgcgggg 60
gtccgcctgt tcgcctggcc gcacgccgag accctcggcg agctcacgcg ggatgagctc 120
gacctgctcc gcgacctggc cgccggaccc cgcaccgccg ggggaccgct cgtcgaacgc 180
ctgcgcgccg gaggctggct caagatcacg attacccggg acggcgtgcc cctctacacg 240
ctcgccccgc tgcgcccgcc gccgccacgg ccggcggtgc cggagcggcc ggttctgtcc 300
aggttcgcca cgctgcggcg cgagggggac gcgctggtcg ccggctcccc gctggcctgg 360
tgcgacctgt acgtccacga ccccggcctg gtcggcgacg tggtccggcc cggcggcgag 420
gtcctggccg acctggtgtg ggccgggctg gccgtgcccg aggaggccga ggaccgggag 480
ctgcggttcc ggcagtgggc gccgcacgag ctggagttcc atgaccggag ccgggtgggg 540
caccgcggct acctgggcga tgggttcggc gggacgttct gggcccgcgg ccggttcgac 600
ccgctgcccg cccggccccg gccctacccc ggccgggcga tcgagctgcc cacgcccgac 660
ctggacgaac tgcggctcaa ggacccctcg ctcacggacg tgctggaggg ccgcaggtcc 720
gtacgcgagc acgacgacga gcgcccgatc accctcgacc tgctcggcga gctgctgtac 780
cgcacggcca gggtgcggga gtgctggacg gccgacggcg tcgaatacac ccgcaagccg 840
tacccctccg gagggtccgt ctacgagctg gagatctacc ccgtcgtcag gaacgtggcc 900
gggctcgaac ccggcatgta ccactacgac gggcacgacc acgtgctcag gccggtacgt 960
gaggccggcc atcccgccgt acgccggctg ctgaccgtcg ccgggcacgg cgccgccacc 1020
ggccgccgcc cccaggtcct gctcgcggtc tccagccgcg ccggccggct gctgtggaag 1080
tacgaaggca tggggtacgc gctgacgctc aagcacgtgg gtgtgctcta ccagacgctc 1140
tactgcgtgg ccacggcgat gggcctggcg gcctgcgggc tcggcagcgg cgactcggcc 1200
gcgttcgccg aggcgaccgg gcgggacccg ttggaggagt gcgcggtcgg cgaattcatg 1260
atcggaaccg cggaggcacc acgttga 1287
<210>45
<211>1893
<212>DNA
<213>野野村氏菌属物种
<400>45
ttgaacgact tcaaacccag actccccgcg gacatacgct tcgcgcccac ctccggcggt 60
gtcgccttcc tcacccgcga aggcgtcgtg cggatgaacg gggcctccgt ccacctgtgg 120
gtggagcggc tggccgtgca cctcgacggg agcaggaccg tggccgagct gaccgcggag 180
ctgcccgacg agcggcgggc gttcgtgacg agcctgctga ccacgctgcg cgagcgcggg 240
ctcgtggagg acgcgggaga gcgcggcgtg ctgcccgtgg cggccggcac cgcgtgctcg 300
ctgctggccg acgcggaccg gttcggcgag ctggcgcccg ccctggccga cgccctgcgc 360
aggctggggc tggaggtgct gacagagccg tcgggcgggg cgctcgtgca cgtcgcggcg 420
gccgacgcgg acgggctggc cgccgccggg cgcctcgacc ggctgagcgc cgagcgcggg 480
ctgcccatcg cgcacgtgct gctgcgcgag ggcgaggcgt ggtggagcga gaccggcgtc 540
gtcgggcgcg acgtcccgcc gtgggcggcc gggtggcggc ggctggcggc catggaggcc 600
gtcccgcgta ccgccgggca cgtctccgtg tcgcccgtcg ccgcggccgt ggtcgccggg 660
caggtggtgg cggacctggg gcgctgcctg tccggaacgc cccgcgtgtc cggcggtccg 720
cggctgcacg tggtggacct ggacgggttc gggatgcgga cgcactcctt cctgccgcac 780
ctgtcggcgc tgccgcccgg cacgggggtg agcgcggggc cgctcggcga ggaggagttc 840
tcgcggcggg cggccaggtt gatggactcg cggacggggg tgttcgccga gatcgaggag 900
ggggagtacg ggcagctccc gctgcacgtg tcggtgacca cggtggccga tccgatgggg 960
gccctcgggg gtgcgctggc gcgggtgatc ggcgtggggg cggacttcgc caccgcgcga 1020
taccgggcgg cgcttaaggc actgaccgtg cacgggctgc tcgccctcga cccccgccgc 1080
ctggtcacgg ccgaggggac gcccctgacc ggcgcggggg aacccgccag cggcttcccg 1140
gctgatccgg gcgcgaggga acggccgatc ggtggctttt cggctgatcc gggtgcgggt 1200
gagcggccgg acgacggtct cctggacgac ccgctggtgg gcgacgtcgc ggcgggacgg 1260
gtcgaggcgt tcgtgcgcgg ccgtgacctc gtcgagggcg gtgaggtgct gctgcccgcc 1320
cgcgcggtgt tcctggatcc gcacgccacc ggggccgccg cggggtactc ggccgaggag 1380
gcgctggtcg cggggttact ggaccactgt gcggcactgg ccgggctcga cgggacgctg 1440
ccgcccgtgg acgtgggcgg cgcgcgggcg gccgacgacg agaccgcgcg gtcggcggcg 1500
ctgctggacg cgatcgggct gccgtaccag gtgctggacg ccaccggccc gtcgggcgtg 1560
cccgtgcacg cggggacgct cggcgggcgg ctggtggcgc gggcggcggg cgtcacgccc 1620
ctggccgcgc tgcgggccac gctcgaaggg atcctggccg cgtaccaggg cattccgggc 1680
cccgcacccc tgcccgacct gtgcccggcc gtcgcgcagg agccgccggt cgtcctcgac 1740
acgggggcgg ccgtgctcgg cgccggtgag ctcgccgccg ccctggccgg cgccgggctg 1800
cgggtcagcg ccgttccgct ggatcacgac cgggaggtac acgcgctcat gccgcacgtc 1860
gtccgcgtcg tcacggagcc gctccatggc tga 1893
<210>46
<211>1833
<212>DNA
<213>野野村氏菌属物种
<400>46
gtggggacgg gcctgctggc cgaggagatc acgatcgcgc tgaaggaccg cgacgggcgg 60
gcagaggtga cgatcaccgc ctgcgacggc tgggcgcgcg gcccccggcg cgacggggcg 120
gcgtggttgc ccgtgcgggt cgagtacggg gtcgccgtca tcgggccgct ggaacgcccc 180
ggcgaacccg gctgcgtgac ctgcttcgag acccgccggg accgggtcag gaccgacagc 240
gccgatcggg ccgccgtcct ggccgtccac ggccccgaac tcgccgggcg ggcctccccg 300
tacctcggcc gcctggccgc ccgcacgatc gcggccctgg ccgcgcacgc cgccgagggc 360
cccggatgcg ccgtctggta cgtcgacctg cgcacgctca ccgccgaacg ccacacgttc 420
ctgccggaac cccactgccc cgactgcggc gacctgccgg acgacgaccg cgcgtccgcc 480
gccttcgagc ccggcgccgc cccgcgacct cccggctacc gggtcaggaa cgtgccggcc 540
gagcacggcg cgctgctcga cacgtacgtg gacggcgaat gcgggctgat caggcccctc 600
gtccgggaca cgctcggcgg cctggtgatc gccggggcga tgctgccgct gcggttcgag 660
ggcggttcgg agcccggcgt gggccgcacc cgcggctacc gggccagcga ggtcaccgcc 720
gtgctcgaag cgctcgaacg gtggggcggc gtcgagcccg gcggcaagcg cacccgcgtg 780
cgggcctcgt acgcggaggt ggccgcggac gcgctcgacc ctcgaacgct gggcgagcac 840
gacacctcct cctacgagat ggaggggttc gcgttccggc cgttcgccga ggacgccgtc 900
tgcgactggg tgtgggggta ctccttcgcc cggcgctcgc cgatcctcgt gccggagagc 960
ctggcctatt actacgtacg ggggcgggag cggccgttcc tcttcgagat ctcgaacggg 1020
tgcgcgctcg gcggcagcat ggcggaggcc ctgctctacg ggctgctgga gacggtcgag 1080
cgggacgcct ttctcatgac ctggtacggg cggctcccgg tgccgcggat cgaccccggc 1140
acggcacggg accgcaccat cccgctccag gccgccgcga tcatcgcgga gaccggttat 1200
cgggtggagc tgtacgacac gacgatggag cacggcatcc ccagcgtgtg ggcgatgggc 1260
gtgcggcagg acggcgatcc gggcaggccg cgcctggtgt gcgccgccgg ggcccacctg 1320
gtgccggaga aggccgtgct cagcgcgctg agcgagctgg ggccgctgct ggccgacctg 1380
atccggcggt atccggacga ggtgcaccga gcccaggaga tggtgacaaa tcctgatctg 1440
gtggcgacga tgcacgacca ctccaccctg tacggcgccg acgcggcctt cgaccggctc 1500
tcgttcctga ccggcggcac gggcgtgcgg gggctgcccg acatggaggc gttcaccgtg 1560
cccggtgatc tcgacgtcat gagggtggtg gaccgcttcc tcgccgaggg gatggacgtc 1620
gtcgtcatcg accagaccac gccggagcat cgggcccgcg gtttctcctg cgtcaaggtg 1680
ctggtgcccg gcacgctccc gatgaccttc ggccaccgca accgcagggt gcggggcctg 1740
acccgcccgc tggagctgcc gtaccggctc ggccaccgcg acacgcccct gacccccgcc 1800
gacctgaacc ccgacccaca ccccttccca tga 1833
<210>47
<211>237
<212>PRT
<213>野野村氏菌属物种
<400>47
Val Thr Ala Arg Arg Arg Asp Val Glu Arg Val Asp Arg Ile Val Asp
1 5 10 15
Ala Ala Ala Glu Leu Leu Pro Glu Arg Gly Tyr Arg Arg Leu Thr Val
20 25 30
Glu Glu Val Ala Ser Arg Ala Gly Val Ser Lys Ser Ser Val Tyr Leu
35 40 45
His Trp Asn Thr Lys Asp Glu Ile Phe Tyr Ala Val Leu Asp Arg Glu
50 55 60
Phe Thr Val Leu Ala Gln Ala Ala Val Asp Arg Val Arg Arg Asp Pro
65 70 75 80
Ala Glu Val Leu Ala His Arg Thr Ala Ala Asn Leu Phe Gln Ile Val
85 90 95
Ala Cys Arg Pro Leu Leu Gln Ala Leu Leu Val Asp Asp Arg Thr Thr
100 105 110
Leu Gly Ser Leu Gln Pro Ala Lys Ser Ala Val Phe Arg Ala Ser Leu
115 120 125
Ala Asn Leu Asn Glu Leu Met Tyr Arg Tyr Leu His Ala Leu Arg Ile
130 135 140
Asn Gly Leu Leu Cys Pro Glu Val Asp Pro Arg Ile Met Arg Lys Ala
145 150 155 160
Ile Ser Glu Met Leu Arg Gly Met Thr Phe Ser Ala Gly Ala Lys Pro
165 170 175
Leu Ala Glu Thr Arg Leu Ala Lys Leu Ser Gln Val Val Ala Val Thr
180 185 190
Val Gln Arg Ala Phe Glu Pro Gly Asp Val Pro Glu Leu Asp Arg Ile
195 200 205
Asn Ala Ala Ala Ala Glu Val Phe Lys Ala Phe Asp Glu Leu Met Pro
210 215 220
Ala Glu Glu Thr Met Arg Ala Glu Arg Pro Val Ala Leu
225 230 235
<210>48
<211>633
<212>PRT
<213>野野村氏菌属物种
<400>48
Val Thr Val Val Arg Ala His Val Arg Gln Glu Pro Ala Ala Leu Val
1 5 10 15
Val Gly Arg Gly Leu Leu Ala Asp Arg Leu Ala Ala Val Thr Gly Arg
20 25 30
Leu Asp Pro Gly Val Val Leu Ala Val Ser Asp Ala Pro Asp Pro Ala
35 40 45
Val Leu Ala Glu Ala Arg Ala Thr Gly Arg Pro Val Leu Pro Val Leu
50 55 60
Ala Glu Pro Gly Arg Val Arg Val Gly Pro Leu Glu Arg Pro Gly Glu
65 70 75 80
Pro Gly Cys Ser Asp Cys Leu Ser Leu Arg Arg His Arg Ala Ala Ser
85 90 95
Arg Ser Ala Glu Arg Ala Ala Ala Trp Leu Arg His Gly Pro Asp Leu
100 105 110
Ala Ala Thr Pro Ser Pro Leu Leu Ala Pro Val Ala Leu Asp Leu Val
115 120 125
Ala Glu Leu Val Thr Ala Leu Val Thr Ala Pro Ala Pro Ala His Arg
130 135 140
Gly Ile Leu Leu Ala Asp Leu Ser Asp Leu Ser Val Thr Pro His Ala
145 150 155 160
Phe Leu Pro Asp Pro Phe Cys Pro Arg Cys Gly Thr Leu Pro Asp Asp
165 170 175
Asp Pro Ala Arg Ala Arg Ile Thr Leu Val Pro Arg Pro Lys Pro Ser
180 185 190
Pro Asp Arg His Arg Val Trp Asp Ala Glu Gly Arg Leu Asp Arg Leu
195 200 205
Arg Gln Ile Tyr Val Asp Asp His Cys Gly Leu Val His Ser Leu Asn
210 215 220
Pro Ala Ala Leu Gly Ser Leu Ala Val Ala Gly Ala Pro Ile Arg Leu
225 230 235 240
Arg Gly Thr Thr Ala Phe Glu Pro Gly Phe Gly Arg Ser Arg Ser Tyr
245 250 255
Arg Arg Ser Ser Val Ile Ala Leu Leu Glu Ala Leu Glu Arg Tyr Gly
260 265 270
Ala Ile Gly Pro Gly Gly Arg Arg Gly Thr Val Arg Ala Ser Tyr Ala
275 280 285
Ser Leu Gly Asn Leu Ala Val Asp Pro Arg Ser Leu Gly Leu His Pro
290 295 300
Pro Glu His Tyr Ala Leu Pro Gly Phe Pro Tyr Arg Pro Phe Thr Pro
305 310 315 320
Glu Ala Val Cys Arg Trp Leu Trp Gly His Ser Phe Ala Thr Gly Gly
325 330 335
Pro Val Leu Val Pro Glu Arg Asn Val His Tyr Gly Pro Ser Asp Asp
340 345 350
Asp Arg Pro Phe Cys Tyr Glu Leu Ala Asn Gly Cys Ala Leu Gly Ser
355 360 365
Cys Leu Glu Glu Ala ValPhe His Gly Ile Leu Glu Val Leu Glu Arg
370 375 380
Asp Ala Phe Leu Leu Thr Trp Tyr Thr Arg Ala Arg Ala Pro Arg Leu
385 390 395 400
Asp Leu Gly Thr Ala Arg Asp Pro Thr Ile Pro Leu Val Ala Ala Ala
405 410 415
Ile Thr Ala Glu Thr Gly Tyr Leu Val Glu Cys Tyr Asp Ile Thr Pro
420 425 430
Asp His Gly Val Pro Cys Val Trp Ala Leu Ala Arg His Pro Ser Asp
435 440 445
Gly Glu Pro Ala Thr Ile Ser Ala Ala Ala Ala Gly Pro Gly Leu Glu
450 455 460
Pro Ala Ala Ala Gly Ala Leu Ala Glu Leu Gly Pro Met Val Pro Thr
465 470 475 480
Val Arg Asp His Phe Pro Gln His Ala Gly Arg Ala Arg Glu Leu Ala
485 490 495
Ala Asp Gly Arg Arg Val Arg Ser Met Ile Asp His Tyr Leu Val Tyr
500 505 510
Gly Val Arg Ser Ala Ala Arg Arg Leu Ser Phe Leu Thr Asp Gly Thr
515 520 525
Glu Glu Val Pro Phe Ala Pro Ala Pro Asp Gly Phe Arg His Asp Asp
530 535 540
Leu Thr Ala Asp Leu Arg Phe Leu Leu Asp Arg Leu Ala Asp Ser Gly
545 550 555 560
Leu Asp Val Val Val Val Asp Leu Thr Thr Pro Glu His Arg Ala Gly
565 570 575
Gly Leu Arg Cys Val Lys Val Leu Val Pro Gly Thr Val Pro Met Thr
580 585 590
Phe Gly Glu Gln Asn Arg Arg Thr Trp Gly Leu Pro Arg Leu Leu Asp
595 600 605
Pro Ala Val Val Arg Gly Arg Gly Met Pro Val Arg Gly His Ala Asp
610 615 620
Leu Asn Pro Asp Pro His Pro Phe Pro
625 630
<210>49
<211>829
<212>PRT
<213>野野村氏菌属物种
<400>49
Val Ser Arg His Ala Pro Pro Ala Val Ala Arg Val Gly Gly Leu Pro
1 5 10 15
Ala Ala Ala Leu His Gly Val Ala Cys Pro Glu Ala Thr Arg Leu Ala
20 25 30
Gly Arg Val Val His Leu Thr Glu Glu Leu Thr Arg Arg Ala Ala Val
35 40 45
Leu Ser Asp Ala Leu Tyr Glu Val Ile Gly Ala Ala Gly Ala His Lys
50 55 60
Pro Ile Leu Val Ala Ile Arg Arg Asp Leu His Gly Leu Arg Arg Pro
65 70 75 80
Lys Arg Val Glu Val Leu Pro Ala Pro Leu Ala Glu Pro Val Arg Thr
85 90 95
Trp Ile Ser Leu Trp Glu Glu Arg Ala Arg Val His Ala Val Leu Pro
100 105 110
Asp Val Leu Ala Arg Glu Glu Arg Leu Ala Trp Glu Ala Leu Arg Glu
115 120 125
Leu Ala Ala Thr Pro Ala Val Arg His Gly Leu Ala His Ala Ser Pro
130 135 140
Asp Leu Ser Ala Asp Leu Glu Lys Trp Leu Ala Asp Thr Gly Trp Arg
145 150 155 160
Pro Arg Pro Ser Thr Leu Ala Ser Leu Leu Arg Tyr Val Lys Arg Val
165 170 175
Ala Ala Lys Thr Ser Pro Phe Ser Thr Phe Thr Thr Val His Glu Val
180 185 190
Arg Trp Val Asp Gly Gly Ala Ala Trp Gln Val Pro Asp Thr Ala Pro
195 200 205
Thr Val Val Val Glu Ala Asp Val Gly Leu Arg Leu Leu Val Glu Ser
210 215 220
Val Leu Pro Arg Met Pro Glu Val Ala Ala Ala Arg Val Val Arg Leu
225 230 235 240
Ser Pro Ala Ala Tyr Ala Ser Gly Asp Arg Leu Ala Phe Pro Glu Pro
245 250 255
Gly Gly Arg Met Arg Ala Val Asp Arg Thr Ser Ala Leu Asp Thr Leu
260 265 270
Val Glu Leu Leu Arg Ala Glu Gln Arg Trp Asp Ala Ala Ile Ala Lys
275 280 285
Leu Thr Gly Ala Gly Leu Ala Gly His Gly Ala Glu Asp Gly Thr Arg
290 295 300
Asp Ser Ala Ser Asp Gly Thr Ala Ala Ala Glu Gln Val Leu Ser Gly
305 310 315 320
Leu Val Arg Gly Gly Leu Val Glu Ala Val Val Pro Val Pro Gly Gln
325 330 335
Ala Ala Arg Pro Phe Ala Arg Leu Ala Asp Trp Ala Ala Pro Ala Ala
340 345 350
Pro Ala Gly Pro Leu His Arg Ile Gln Val Ala Leu Asp Gln Ala Gly
355 360 365
Pro Leu Gly Asp Gly Asp Pro Leu Ala Ser Ala Cys Ala His Val Ala
370 375 380
Arg Arg Leu Thr Ala Glu Leu Pro Ala Leu Gly Leu Pro Val Met Pro
385 390 395 400
Val Pro Asp Leu Arg Arg Arg Val Leu Arg Glu Ser Ala Leu Gly Ala
405 410 415
Pro Val Ala Cys Ala Leu Arg Glu Trp Arg Pro Val Leu Ala Asp Leu
420 425 430
Gln Arg Val Arg Arg Trp Leu Ala Val His Asp Pro Met Leu Pro Leu
435 440 445
Arg Leu Thr Leu Ala Asp Arg Val Arg Asp Trp Phe Gly Pro Gly Ser
450 455 460
Ala Ala Pro Leu Leu Asp Val Tyr Ala Arg Val Arg Thr Ala Glu Pro
465 470 475 480
Gly Thr Pro Leu Asp Pro Asp Phe Leu Glu His Pro Asp Pro Leu Ala
485 490 495
Gly Val Thr Asp Pro Arg Leu Thr Arg Leu Arg Glu Leu Arg Ala Ala
500 505 510
Ser Val Ala Ala Leu Thr Gly Gly Arg Ala Glu Glu Ala Leu Ser Glu
515 520 525
Pro Pro Ala Trp Val Arg Asp Pro Gly Pro Val Thr Cys Tyr Val Gln
530 535 540
Pro Phe Gln Gly Glu Asp Gly Leu Arg Leu Val Leu Asn Ala Ala His
545 550 555 560
Gly Gly His Gly Arg Gly Ile Thr Arg Trp Thr Arg Leu Leu Gly Ala
565 570 575
Glu Pro Pro Pro Gly Glu Pro Pro Ala Ala Glu Ser Pro Pro Gly Glu
580 585 590
Ser Pro Pro Gly Glu Leu Pro Pro Gly Ala Cys Leu Val Ala Glu Leu
595 600 605
Pro Gly Thr Phe Gly His Ser Leu Asn Leu His Ala Pro Ala Thr Gly
610 615 620
Trp Glu Leu Thr Tyr Pro Gly Ala Val Asn Gln Ala Pro Pro Glu Arg
625 630 635 640
Arg Val Pro Leu Ala Glu Leu Gln Val Arg His Asp Ala Gly Arg Gly
645 650 655
Val Val Glu Leu Trp Trp Pro Arg Ala Gly Arg Arg Val Val Pro Val
660 665 670
His Ala Gly Met Met Ser Glu Thr Leu Leu Pro Pro Leu Ala Arg Leu
675 680 685
Leu Val Glu Ala Phe Gly Thr Thr His Leu Thr His Pro Thr Leu Pro
690 695 700
Pro Val Val Arg Ala Ala Gly Pro Arg Ile Asp Leu Gly Arg Val Thr
705 710 715 720
Leu Ala Arg Ala Gln Trp Thr Ala Arg Arg Glu Glu Ile Pro Arg Arg
725 730 735
Gly Gly Asp Asp Ala Ala His Leu Val Ala Val His Ala Trp Leu Arg
740 745 750
Ala Ala Gly Ile Pro Arg Arg Cys Phe Val Arg Val Arg Glu Pro Gln
755 760 765
Val Arg Arg Asp Arg Leu Ala Phe Asp Lys Arg His Lys Pro Val Phe
770 775 780
Val Asp Phe Gly Ser Trp Pro Ser Val Leu Glu Phe Asp Arg lle Val
785 790 795 800
Thr Arg Ala Thr Gly Asp Leu Glu Leu Thr Glu Ala Leu Pro Asp Gly
805 810 815
Glu Arg Ala Val Glu Leu Ala Ile Glu Ile Gly Ala Arg
820 825
<210>50
<211>344
<212>PRT
<213>野野村氏菌属物种
<400>50
Val Thr Arg Tyr Pro Leu Pro Arg Pro His Pro Leu Gly Ile His Pro
1 5 10 15
Gly Tyr Ala Arg Leu Arg Glu Gly Cys Pro Val Ala Arg Val Asp Ser
20 25 30
Pro Tyr Gly Pro Ala Trp Leu Ile Thr Arg Tyr Ala Asp Val Ala Ala
35 40 45
Val Leu Thr Asp Ala Arg Tyr Ser Arg Ala Ala Ala Thr Glu Asp Asp
50 55 60
Gly Gly Ile Leu Leu Asn Thr Asp Pro Pro Glu His Asp Arg Leu Arg
65 70 75 80
Arg Leu Val Val Ala His Thr Gly Ala Ala Ala Val Glu Arg Leu Arg
85 90 95
Pro Arg Ala Glu Glu Ile Ala Thr Thr Leu Ala Lys Arg Ile Pro Ala
100 105 110
Glu Ala Glu Phe Val Ser Ala Phe Ala Glu Pro Tyr Ser His Arg Val
115 120 125
Leu Ala Leu Phe Val Gly His Leu Val Gly Leu Pro Ala Gly Glu Leu
130 135 140
Ser Pro Met Ala Thr Val Leu Thr Leu Ala Arg Val Pro Asp Arg Glu
145 150 155 160
Arg Ala Ala Ala Phe Ala Glu Leu Arg Arg Arg Leu Arg Ser Gln Val
165 170 175
Asp Asp Glu Thr Leu Ala Val Val Leu Asn Ile Val Phe Gly Gly His
180 185 190
Ala Ala Val Val Ala Ala Leu Gly Tyr Cys Leu Leu Ala Ala Leu Ala
195 200 205
Glu Pro Leu Pro Ser Leu Thr Gly Asp Val Arg Arg Ile Ala Glu Leu
210 215 220
Val Glu Glu Thr Leu Arg Leu Ala Pro Pro Gly Asp Arg Thr Leu Leu
225 230 235 240
Arg Arg Thr Leu Glu Pro Val Glu Leu Gly Gly Arg Glu Leu Pro Ala
245 250 255
Gly Ala Leu Val Ile Pro Ser Ile Ala Ala Ala Gly Arg Asp Pro Asp
260 265 270
Arg Pro Thr Gly Gly Pro Ala Gly Arg His Leu Ala Phe Gly Arg Gly
275 280 285
Pro His Ala Cys Leu Gly Met Ala Leu Ala Arg Met Glu Leu Arg Val
290 295 300
Ala Leu Gln Ala Leu Ala Glu His Val Pro Gly Leu Arg Pro Ala Val
305 310 315 320
Ser Pro Ala Thr Leu Arg Arg Thr Cys Glu Glu Leu Ala Val Ser Pro
325 330 335
Leu Ala Gly Ile Pro Ile Arg Val
340
<210>51
<211>228
<212>PRT
<213>野野村氏菌属物种
<400>51
Met Val His Ala Phe Gly Val Arg Asn Arg Gly Arg Ile Val Ser Ala
1 5 10 15
Glu His His Tyr Arg Asp Arg Leu Arg Ala Leu Ser Ala Tyr Leu Arg
20 25 30
Lys Val Asp Asn Glu Pro Glu Ala Ala Ala Glu Leu Arg Ala Asp Pro
35 40 45
Glu Lys Ala Leu Arg Glu Ala Gly Val Asp Gln Ala Phe Asp Arg Pro
50 55 60
Glu Ala Phe Arg Ala Phe Val Gly Lys Leu Ala Val Leu Ser Gly Glu
65 70 75 80
Ala Trp Leu Ala Thr Val His Ser Met Ile Glu Leu Cys Glu Ile Gly
85 90 95
Ala Asp Pro Gln Pro Pro Ala Gly Pro Asn Ile Ser Phe Arg Ile Ser
100 105 110
Ser Asp Gly Gly Val Thr Ala lle Ala Asn Arg Gly Glu Ile Ala Lys
115 120 125
Lys Val Gln Pro Asn Pro Phe His Ala Gly Ser Ala Ala Ala Ser Pro
130 135 140
Gly Gly Arg Leu Arg Ile Tyr Pro Gly Tyr Ala Thr Ser Glu Leu Ser
145 150 155 160
Ala Arg Leu Gly Glu Arg Tyr Leu Ser Thr Phe Tyr Gln Arg Thr Leu
165 170 175
Leu Lys Arg Val Val Leu Asp Pro Gly Thr Val Val Glu Asp Ala Asp
180 185 190
Ala Gly Glu Gly Ile Thr Val Asn Arg Ser Gln Tyr Arg Gly Val Gly
195 200 205
Phe Glu Leu His Thr Arg Ala Asp Gly Ala Asp Arg Glu Ile Val Ala
210 215 220
Ala Leu Val Arg
225
<210>52
<211>372
<212>PRT
<213>野野村氏菌属物种
<400>52
Met Leu Ser Ser Ala Leu Glu Val Asp Ile Asp Glu Ala Ala Val Ala
1 5 10 15
Ala Asp Leu Arg Glu Leu Ala Ala Ala Leu Asp Arg Ser Gly Tyr Gly
20 25 30
Glu Ile Leu Thr Cys Phe Leu Pro His Lys Ala Gln Ala His Ile Trp
35 40 45
Ala Gln Thr Ala Ala Lys Ile Asp Gly Pro Leu Arg Thr Leu Met Glu
50 55 60
Leu Phe Leu Leu Gly Arg Ala Val Pro Gln Asp Asp Leu Pro Ala Arg
65 70 75 80
Val Gly Asp Leu Ile Pro Gly Leu Ala Ala Thr Gly Leu Val Gln Thr
85 90 95
Gly Gln Gly Ala Val Trp Leu Pro Asn Leu Ile Leu Leu Arg Pro Met
100 105 110
Gly Gln Trp Leu Trp Cys Gln Arg Pro His Pro Ser Pro Thr Met Tyr
115 120 125
Phe Gly Asp Asp Ser Leu Ala Leu Val His Arg Met Val Thr His Arg
130 135 140
Gly Gly His Thr Leu Asp Leu Cys Ala Gly Pro Gly Val Gln Ala Leu
145 150 155 160
Thr Ala Ser Leu Arg Ser Asp Arg Val Thr Ala Val Glu Ile Asn Pro
165 170 175
Val Ala Ala Ala Leu Cys Arg Thr Asn Ile Ala Met Asn Gly Leu Gly
180 185 190
Asp Arg Met Glu Val Arg Leu Gly Asp Leu Tyr Gly Ala Val Pro Gly
195 200 205
Glu Val Phe Asp Asp Ile Val Ser Asn Pro Pro Leu Leu Pro Val Pro
210 215 220
Glu Asp Val Gln Phe Ala Phe Val Gly Asp Gly Gly Arg Asp Gly Phe
225 230 235 240
Asp Ile Ser Trp Thr Ile Leu Asp Gly Leu Pro Glu His Leu Ser Asp
245 250 255
Arg Gly Ala Cys Arg Ile Val Gly Cys Val Leu Ser Asp Gly Tyr Val
260 265 270
Pro Val Val Met Asp Gly Leu Gly Lys Trp Ala Val Glu His Asp Phe
275 280 285
Asp Val Leu Leu Thr Val Thr Ala His Val Glu Ala His Arg Asp Ser
290 295 300
Ser Phe Leu Arg Ser Met Ser Leu Met Ser Ser Ala Ile Ser Gly Glu
305 310 315 320
Pro Ala Asp Val Leu Gln Glu Arg Tyr Ala Ala Asp Tyr Ala Glu Leu
325 330 335
Gly Gly Ser His Val Ala Phe Tyr Glu Leu Cys Ala Arg Arg Gly Gly
340 345 350
Gly Thr Ala Arg Leu Ala Asp Val Ser Ala Thr Lys Arg Ser Ala Glu
355 360 365
Val Trp Phe Val
370
<210>53
<211>122
<212>PRT
<213>野野村氏菌属物种
<400>53
Val Tyr Val Val Ile Val Ala Phe Asp Leu Lys Glu Ser Ser Val Asp
1 5 10 15
Phe Ala Glu Leu Arg Ala Trp Val Arg Asp Arg Ala Ala Asp Asp Tyr
20 25 30
Ser Arg Leu Pro Gly Met Arg Phe Lys Thr Trp Phe Ser Asp Glu Arg
35 40 45
Lys Arg Leu Trp Gly Ala Val Tyr Leu Val Glu Ser Met Leu Ser Phe
50 55 60
Asp Arg Asp Asn Leu Pro Leu Leu Pro Asp Gly Arg Thr Gly Pro Val
65 70 75 80
Gly Thr Arg Pro Thr Ser Val Met Val Leu Glu Leu Glu Ala Phe Val
85 90 95
Thr Gly Pro Asp Gly Leu Asp Gly Ile Glu Ala Leu Ala Arg Gln Gly
100 105 110
Leu Ser Met Thr Gly Gly Gly His Asp His
115 120
<210>54
<211>416
<212>PRT
<213>野野村氏菌属物种
<400>54
Met Thr Thr Glu Ala Thr Thr Ala Val Thr Thr Arg Ala Asn Ala Gly
1 5 10 15
Ala Leu Ser Leu Pro Ala Arg Gly Thr Asp Arg Pro Leu Leu Leu Tyr
20 25 30
Val Asn Ile Pro Phe Cys Asn Ser Lys Cys His Phe Cys Asp Trp Val
35 40 45
Val Asp Val Pro Val Ser Asp Leu Arg Leu Ala Pro Ala Ala Pro Arg
50 55 60
Arg Val Asp Tyr Leu Ala Ala Leu Cys Thr Gln Ile Arg Thr His Ala
65 70 75 80
Pro Ala Leu Arg Ala Ala Gly Tyr Arg Gly Glu Val Met Tyr Trp Gly
85 90 95
Gly Gly Thr Ala Thr Val Leu Thr Ala Ala Glu Ile Glu Gln Val His
100 105 110
Ala Cys Leu Ala Ala Glu Phe Asp Leu Thr Ala Leu Ala Glu Ala Thr
115 120 125
Ile Glu Gly Ser Pro Glu Ser Val Asp Pro Ala Lys Leu Arg Leu Leu
130 135 140
Arg Asp Leu Gly Phe Asp Arg Val Ser Leu Gly Val Gln Ser Phe Asp
145 150 155 160
Glu Thr Arg Leu Arg Arg Ile Gly Arg Ala His Ser Ala Gly Gln Ala
165 170 175
Val Arg Ser Val Glu Asp Ala His Ala Ala Gly Phe Asp Asn Ile Asn
180 185 190
Ile Asp Leu Ile Val Gly Phe Pro Asp Gln Ser Leu Ala Glu Val Glu
195 200 205
Gln Thr Val Arg Arg Ala Leu Asp Leu Pro Val Asn His Phe Ser Val
210 215 220
Tyr Ser Tyr Arg Ala Thr Glu Gly Thr Val Met Arg Arg Gln Ile Glu
225 230 235 240
Arg Ser Gly Thr Ala Ile Glu Leu Glu His Gln Leu Gln Ser Tyr Arg
245 250 255
Leu Ala Gly Glu Met Leu Ala Ala Ala Gly His Pro Glu Tyr Ala Val
260 265 270
Ser Tyr Phe Gly Ala Pro Arg Cys Leu Ala Asp Glu Ala Tyr Tyr Arg
275 280 285
Leu Ser Met Asp Trp Ile Gly Phe Gly Thr Gly Ala Asn Ser Leu Ile
290 295 300
Asn Gln Arg Tyr Leu Leu Asn Gly Arg Gly Arg Met Arg Asp Phe Thr
305 310 315 320
Ser Arg Pro Gly Glu Phe Glu Val Asp Leu Pro Ala Gly Val Pro Ser
325 330 335
Leu Thr Val Gln Trp Leu Pro Arg Ala Leu Gly Thr Ala Glu Gly Ile
340 345 350
Asp Ala Ala Thr Phe Gln Arg Arg Thr Gly Thr Ser Leu Arg Ala Ala
355 360 365
Cys Glu Glu Pro Glu Leu Asn Ala Phe Leu Thr Arg Val Asn Glu Phe
370 375 380
Gly Arg Leu Val Val Asp Arg Asp Gly Ile Arg Leu Ala Asp Glu Asn
385 390 395 400
Arg Ser Asp Val Leu Ser Arg Thr Phe Ala Ala Met Gly Trp Val Ser
405 410 415
<210>55
<211>339
<212>PRT
<213>野野村氏菌属物种
<400>55
Val Glu Ala Met Arg Thr Leu Leu Ala Ala Ala Asp Leu Val Thr Pro
1 5 10 15
Met Ala Leu Arg Val Ser Ala Thr Leu Arg Leu Ala Asp His Leu Ala
20 25 30
Ala Gly Thr Thr Gly Ala Ala Glu Leu Ala Ala Ala Ala Gly Val Asp
35 40 45
Glu Ala Ala Leu Thr Arg Leu Leu Arg Tyr Leu Val Ala Arg Gly Val
50 55 60
Phe Thr Glu Pro Ala Pro Gly Glu Phe Gly Leu Asn Pro Ala Ala Glu
65 70 75 80
Leu Leu Arg Asp Gly Arg Pro Asp Arg Leu Arg Asp Trp Leu Asp Leu
85 90 95
Thr Gly Pro Ile Gly Arg Ala Asp Leu Ala Phe Gly Ser Leu Leu Asp
100 105 110
Val Val Arg Thr Gly Lys Pro Gly Tyr Pro Met Ile Hi s Gly Arg Gly
115 120 125
Phe Trp Asp Asp Leu Ala Ala Glu Pro Ala Leu Ala Thr Ala Tyr Asp
130 135 140
Thr Leu Met Gly Gly Lys Arg Gln Trp Ala Ala Thr Thr Leu Ala Ala
145 150 155 160
Leu Asp Trp Ser Arg Ser Arg His Val Val Asp Val Gly Gly Gly Asn
165 170 175
Gly Thr Leu Leu Ser Cys Leu Leu Ala Ala His Pro His Leu Arg Gly
180 185 190
Thr Val Val Asp Arg Pro Thr Ser Ala Lys Ala Ala Gly Ala Val Leu
195 200 205
Ala Ser Ala Gly Val Ala Asp Arg Gly Glu Phe Arg Ala Gly Asp Phe
210 215 220
Phe Glu Pro Leu Pro Val His Gly Ala Asp Thr Tyr Leu Leu Ser Ser
225 230 235 240
Ile Leu His Asp Trp Asp Asp Ala Ala Ala Thr Ala Ile Leu Arg Arg
245 250 255
Cys Ala Glu Ala Ala Ala Pro Gly Gly Arg Val Leu Leu Cys Glu Leu
260 265 270
Val Ala Met Ala Gly Pro Asp Arg Arg Thr Val Thr His Met Asp Leu
275 280 285
Cys Met Leu Val Tyr Phe Gly Gly Arg Glu Arg Thr Ala Ala Asp Phe
290 295 300
Ala Ala Leu Ala Gly Ala Ala Gly Leu Glu Pro Arg Ser Val Thr Pro
305 310 315 320
Leu Pro Pro His Asp Trp Gly Asn Ala Leu Val Glu Tyr Ala Val Pro
325 330 335
Ala Ala Arg
<210>56
<211>204
<212>PRT
<213>野野村氏菌属物种
<400>56
Met Ala Lys Val Ile Ser Thr Leu Phe Ile Ser Ala Asp Gly Val Ala
1 5 10 15
Glu Ile Asp Pro Asp Trp His Phe Pro Tyr Phe Asp Glu Asn Met Gly
20 25 30
Arg Ala Val Gly Glu Asp Tyr Asp Thr Ala Asp Val Leu Leu Ile Gly
35 40 45
Arg Glu Thr Phe Asp Ser Phe Ala Gly Ala Trp Pro Asp Arg Glu Ala
50 55 60
Ala Gly Gly Asp Asp Ala Pro Phe Ala Lys Gln Leu Gly Asp Met Arg
65 70 75 80
Lys Val Val Val Ser Arg Gln Pro Leu Glu Phe Ser Trp Arg Asn Cys
85 90 95
Glu Leu Ile Thr Gly Asp Leu Leu Asp Ala Val Thr Ser Leu Lys Ala
100 105 110
Asp Ala Gly Ile Arg Gly Ile Leu Ile Pro Gly Ser Ile Ser Val Val
115 120 125
Gln Gln Leu Leu Ala Ala Gly Leu Val Asp Glu Leu Arg Leu Leu Val
130 135 140
His Pro Val Ala Ala Arg Lys Gly Arg Arg Leu Phe Asp Asp Gly Asp
145 150 155 160
Ala Pro Tyr His Leu Ser Val Thr Ala Thr Glu Thr Phe Pro Thr Gly
165 170 175
Val Ile Arg Val Ile Tyr Ser Pro Thr Glu Ala Pro Thr Lys Val Gly
180 185 190
Tyr Asp Glu Val Glu Ala Gln Val Ser Thr Gly Glu
195 200
<210>57
<211>403
<212>PRT
<213>野野村氏菌属物种
<400>57
Met Thr Lys Pro Leu Leu Ile Tyr Ala Asn Val Pro Phe Cys Asn Ser
1 5 10 15
Lys Cys His Phe Cys Asp Trp Val Val Gln Val Pro Val Arg Asp Leu
20 25 30
Arg Leu Gly Glu Gln Ser Pro Gly Arg Val Ala Tyr Leu Glu Ala Ile
35 40 45
Arg Thr Gln Ile Arg Val Gln Ala Pro Ala Leu Arg Glu His Tyr His
50 55 60
Pro Asp Ile Val Tyr Trp Gly Gly Gly Thr Ala Ser Ile Leu Gly Pro
65 70 75 80
His Glu Ile Glu Ser Leu Tyr Gly Thr Leu Ser Ala Glu Phe Asp Leu
85 90 95
Ser Thr Val Arg Glu Ala Thr Ile Glu Gly Ser Pro Glu Ser Leu Asp
100 105 110
Arg Asp Lys Leu Arg Leu Leu Arg Glu Leu Gly Phe Asn Arg Ile Ser
115 120 125
Ile Gly Val Gln Ser Phe Asp Asp Ala Arg Leu Arg Arg Leu Gly Arg
130 135 140
Ala His Ala Ala Asp Gln Ala Leu Thr Ala Val Gln Asp Ala His Glu
145 150 155 160
Ala Gly Phe Thr Asn Ile Asn Ile Asp Leu Ile Val Gly Phe Pro Gly
165 170 175
Gln Thr Gly Gln Glu Val Ala Asp Ser Val Arg Thr Ala Leu Thr Leu
180 185 190
Pro Ile Asn His Phe Ser Ile Tyr Pro Tyr Arg Ala Ser Pro Gly Thr
195 200 205
Val Leu Arg Lys Gln Val His Arg Gly Ala Gln Leu Asp Leu Asn Leu
210 215 220
Gln Leu Gln Ala Tyr Gly Ile Ala Arg Glu Leu Leu Glu Ala Ala Gly
225 230 235 240
Phe Pro Glu Tyr Ala Met Ser Tyr Phe Gly His Pro Arg Cys Gln Ser
245 250 255
Asp Glu Ala Tyr Tyr Gln Leu Arg Met Asp Trp Ile Gly Phe Gly Ser
260 265 270
Gly Ala Asn Ser Leu Ile Gly Arg Arg Tyr Leu Ser Tyr Glu Lys Gly
275 280 285
Lys Leu Ala His Tyr Asn Thr Asn Pro Leu Ala Phe Asp Ile Asn Ala
290 295 300
Pro Ala His Ser Pro Gln Leu Thr Leu His Phe Leu Ser Gln Ala Leu
305 310 315 320
Thr Thr Ala Glu Gly Leu Asp Ala Arg Leu Tyr Gln Gln Arg Thr Gly
325 330 335
Val Pro Leu Arg Thr Ala Cys Ser His Pro Glu Val Met Thr Tyr Leu
340 345 350
Glu Arg Met Asn Asn His Gly Arg Leu Ile Ala Asp His Asn Gly Ile
355 360 365
Arg Leu His Arg Asp Asp Ile Ala Gln Thr Phe Ile Ala Leu Asn Trp
370 375 380
Ile Pro Thr Pro Asp Thr Thr Pro Asn Glu Val Ile Pro Leu Thr Pro
385 390 395 400
Ser Pro Thr
<210>58
<211>387
<212>PRT
<213>野野村氏菌属物种
<400>58
Met Thr Ala Pro Val Arg Pro Pro Ser Val Thr Asp Gly Gly Thr Ser
1 5 10 15
Leu Phe Ala Trp Leu Arg Glu Met Arg Asp Thr His Pro Val Trp Arg
20 25 30
Asp Ser Tyr Gly Met Tyr His Val Phe Arg Tyr Asp Asp Val Arg Ala
35 40 45
Val Leu Ala Asp His Glu Arg Phe Ser Ser Asp Arg Thr Arg Leu Met
50 55 60
Gly Arg Gln Pro Phe Gly Gln Gly Gly Ile Thr Met Ile Asp Pro Pro
65 70 75 80
Glu His Arg His Gln Arg Arg Leu Ile Thr Ala Ala Phe Thr Pro Ser
85 90 95
Ser Val Ala Ala Leu Glu Pro Arg Ile Ala Ala Ile Ala Asp Glu Leu
100 105 110
Leu Asp Ala Leu Pro Gly Pro Asp Phe Asp Leu Val Glu Ser Leu Ala
115 120 125
Tyr Pro Leu Pro Val Thr Val Val Ala Glu Leu Leu Gly Val Pro Pro
130 135 140
Ser Asp Arg Asp Leu Phe Arg Thr Trp Ser Asp Arg Leu Met Ser Leu
145 150 155 160
Gln Val Pro Asp Phe Ala Asp Pro Ser Leu Ala Gly Arg Val Ala Ala
165 170 175
Ala Met Ala Glu Met Asn Asp Tyr Leu Arg Glu His Cys Ala Asp Arg
180 185 190
Arg Thr Arg Pro Arg Asp Asp Leu Leu Thr Arg Leu Val His Ala Glu
195 200 205
Ile Asp Gly Glu Arg Leu Asp Ala Glu Gln Val Val Asn Thr Ala Ser
210 215 220
Leu Leu Leu Leu Ala Gly His Val Thr Thr Thr Val Leu Ile Gly Asn
225 230 235 240
Thr Val Leu Cys Leu Ala Asp Ala Pro Glu Ala Ala His Arg Thr Arg
245 250 255
Ala Asp Met Ser Leu Ile Pro Gln Ala Leu Glu Glu Ser Met Arg Leu
260 265 270
Arg Ser Pro Phe Met Gln Ala Gly Arg Val Thr Thr Gln Asp Val Gln
275 280 285
Val Ala Gly Glu Thr Ile Pro Ala Asn Arg Phe Val Met Ala Trp Leu
290 295 300
Leu Ser Ala Asn His Asp Glu Arg His Phe Ala Asp Pro Glu Arg Phe
305 310 315 320
Asp Leu Asp Arg Gln Leu Thr Gly Gln Leu Ala Phe Gly His Gly Val
325 330 335
His Phe Cys Leu Gly Ala Gln Leu Gly Arg Leu Glu Gly Arg Ile Ala
340 345 350
Leu Glu Arg Leu Leu Ser Arg Phe Thr Glu Leu Arg Pro Glu Lys Arg
355 360 365
Ser Phe Tyr Glu Ser Gln Ile Phe Gly Val Arg Glu Met His Val Arg
370 375 380
Gly Ser Ser
385
<210>59
<211>406
<212>PRT
<213>野野村氏菌属物种
<400>59
Val Asn Glu Thr His Val Pro Pro Asp Pro Thr Met Thr Met Pro Ile
1 5 10 15
Asp Ser Arg Pro Arg Ile Lys Asp Gly Gly Gln Thr Leu Leu Lys Trp
20 25 30
Leu Gly Thr Met Arg Asp Glu Gln Pro Val Trp Arg Asp Ala Phe Gly
35 40 45
Ile Phe His Val Phe Arg His Ala Ala Val Gln Arg Val Met Ser Asp
50 55 60
Tyr Ala Ala Phe Ser Ser Asp Ile Asn Arg Leu Arg Pro Gly Gly Asp
65 70 75 80
Pro Phe Ser Ala Gly Ser Leu Met Leu Thr Asp Pro Pro Glu His Arg
85 90 95
Lys Leu Arg Lys Leu Ile Ser Gln Ala Phe Thr Pro Lys Met Ser Ser
100 105 110
Asp Met Val Pro Arg Ile Ala Glu Leu Thr Thr Ala Leu Leu Asp Glu
115 120 125
Ile Asp Glu Asp Glu Phe Asp Leu Val Glu Lys Ile Ala His Pro Leu
130 135 140
Pro Val Met Val Ile Ala Glu Leu Leu Gly Ile Pro Ile His Asp Arg
145 150 155 160
Glu Leu Phe Arg Thr Trp Ala Asp Arg Leu Val Ala Leu His Val Glu
165 170 175
Asp Pro Arg Asp Ile Glu Ile Gly Arg Met Val Gly Gln Ala Met Arg
180 185 190
Glu Met Gly Glu Tyr Val Leu Thr His Val Arg Glu Arg Arg Thr Arg
195 200 205
Pro Gln Asp Asp Leu Val Ser Arg Leu Val Ala Ala Glu Val Asp Gly
210 215 220
Asp Arg Leu Thr Asp Ala Glu Ile Val Asn Ser Ala Cys Leu Leu Leu
225 230 235 240
Leu Ala Gly Gln Ile Thr Ser Thr Met Ala Leu Gly Asn Ala Phe Leu
245 250 255
Cys Phe Arg Asp Ala Pro Gly Val Glu Ser Ala Val Arg Ala Asp Arg
260 265 270
Glu Leu Ile Ala Pro Ala Phe Glu Glu Val Leu Arg Leu Arg Pro Pro
275 280 285
Leu Thr Gln Ala Ala Arg Leu Pro Thr Ala Asp Val Glu Ile Asp Gly
290 295 300
Thr Pro Ile Pro Ala Gly Ser Met Val Ile Asn Trp Leu Leu Ser Ala
305 310 315 320
Asn Tyr Asp Glu Arg Gln Phe Pro Asp Pro Tyr Arg Leu Asp Pro Gly
325 330 335
Arg Gln Pro Asn Arg Gln Tyr Ala Phe Gly His Gly Ile His Phe Cys
340 345 350
Leu Gly Ala Pro Leu Ala Arg Val Glu Gly Lys Val Ala Leu Glu Leu
355 360 365
Val Phe Asp Arg Phe Glu Gln Val Glu Ile Asp Pro Asp Ala Glu Leu
370 375 380
Ser Tyr Tyr Glu Asp Pro Met Phe Gly Val Lys Ser Leu Pro Val Arg
385 390 395 400
Val Lys Arg Ala Pro Arg
405
<210>60
<211>243
<212>PRT
<213>野野村氏菌属物种
<400>60
Met Ser Thr Val Ser Thr Arg Ser Thr Gly Ala Arg Thr Ser Asp Asp
1 5 10 15
Arg Val Arg Arg Thr Leu Asp Val Thr Arg Ser Leu Leu Leu Arg Ser
20 25 30
Gly Tyr Lys Arg Thr Thr Met Asp Glu Ile Ala Arg Arg Ala Asp Ile
35 40 45
Gly Lys Gly Thr Ile Tyr Leu Ser Trp Asp Thr Lys Asp Asp Leu Ile
50 55 60
Arg Thr Leu Val Ile Gln Glu Ile Val Gly Val Cys Gln Asp Ile Ser
65 70 75 80
Arg Ile Ala Val Leu Arg Pro Ala Val Ala Arg Leu Ser Glu Phe Ser
85 90 95
Arg Glu Leu Phe Thr Leu Val Phe Lys Tyr Pro Leu Phe Arg Ala Leu
100 105 110
Tyr Thr Tyr Asp Lys Glu Thr Leu Gly Arg Ala Cys Asp Asp Pro Gln
115 120 125
Leu Gly Phe Gln Cys Tyr Arg Phe Thr Thr Phe Thr Pro Phe Arg Asp
130 135 140
Tyr Leu Arg Met Leu His Glu Ser Gly Met Trp Asp Pro Ser His Gly
145 150 155 160
Phe Ala Leu Asp Ala Leu Leu Ser Gly Phe Ile Lys Leu His Leu His
165 170 175
Ala Glu Ile Ala Gly Ala Lys Pro Asp Leu Ala Ala His Ala Asp Ser
180 185 190
Leu Ala Gly Leu Ile Arg Ser Ser Phe Glu Pro Ala Asp Gln Val Pro
195 200 205
Ala Glu Glu Leu Thr Asp Pro Ala Arg Arg Thr Val Glu Ile Phe Asp
210 215 220
Gly Ala Ala Ala Lys Tyr Arg Ala Lys Leu Ile Pro Gln Pro Leu Ala
225 230 235 240
Ala Ser Val
<210>61
<211>444
<212>PRT
<213>野野村氏菌属物种
<400>61
Met Thr Thr Glu Pro Phe Pro Ala Pro Thr Gly Pro Pro Ala Ala Pro
1 5 10 15
Thr Gly Pro Ser Pro Ala Leu Ala Glu Pro Ser Ala Ala Ser Pro Gly
20 25 30
Pro Leu Ser Val Arg Gln Gly Pro Ser Pro Val Thr Ala Glu Leu Arg
35 40 45
Asp Leu Ala Ile Phe Arg Ala Asp Leu His Ala His Pro Glu Leu Ser
50 55 60
Trp Gln Glu Ala Arg Thr Ala Asp Arg Leu Ala Gly Arg Leu Ala Ala
65 70 75 80
Ala Gly Tyr Glu Val Thr Thr Gly Met Gly Gly His Gly Val Val Gly
85 90 95
Arg Leu Cys Arg Gly Asp Gly Val Thr Val Met Leu Arg Ala Glu Leu
100 105 110
Asp Ala Leu Pro Val Lys Glu Glu Thr Gly Leu Ser Tyr Ala Ser Thr
115 120 125
Ala Thr Ala Thr Thr Leu Asp Gly Arg Thr Val Pro Val Ser His Ala
130 135 140
Cys Gly His Asp Leu His Leu Ala Cys Leu Val Gly Ala Ala Arg Arg
145 150 155 160
Leu Ala Ala Cys Asp Asp Trp Arg Gly Thr Val Leu Val Ile Gly Gln
165 170 175
Pro Ala Glu Glu Thr Leu Glu Gly Ala Ala Ala Met Leu Ala Asp Gly
180 185 190
Leu Tyr Glu Arg Phe Gly Val Pro Asp Val Ala Leu Ala Gln His Val
195 200 205
Ser Pro Phe Pro Ala Gly Leu Ile Ala Tyr Pro Glu Pro Pro Thr Ala
210 215 220
Ala Gly Ala Glu Leu Arg Val Val Val Thr Gly Asp Gly Gly His Val
225 230 235 240
Gly AspIle Gly Arg Ala Gly His Val Asp Arg Ala Val Gly Arg Asn
245 250 255
Pro Val Ala Ala Val Ala Ala Leu Val His Arg Leu Asp Gln Thr Ala
260 265 270
Phe Asp Gln Ala Ile Val Thr Val Gly Thr Leu His Ala Gly Glu Arg
275 280 285
Ala Asn Val Ile Pro Thr Leu Ala Glu Ala Gly Ile Thr Val Arg Ala
290 295 300
Ala Thr Glu Glu Ala Val Thr Arg Ala Val Ala Arg Val Ala Arg Leu
305 310 315 320
Ala Glu Glu Thr Ala Gly Ala Gly Val Ile Val Val Ser Arg Val Pro
325 330 335
Pro Gly Val Asn Asp Pro Ala Ala Thr Ala Leu Val Arg Arg Ala His
340 345 350
Glu Ala Ala Leu Gly Ala Val Val Thr Ala Pro Gly Gly Ser Ala Cys
355 360 365
Glu Asp Phe Pro Leu Tyr Gly Val Pro Ser Val Tyr Trp Tyr Val Gly
370 375 380
Ala Ala Pro Pro Ala Gly Leu Val Gly Arg Pro His Thr Gly Thr Phe
385 390 395 400
Arg Pro Asp Pro Val Pro Thr Leu Arg Ala Gly Val Thr Ala Met Gln
405 410 415
Thr Ala Ala Leu Ala Val Leu Ala Asn Ala Ser Gln Phe Ala Pro Pro
420 425 430
Ser Arg Tyr His Gly Pro Gly Ala Val Ala Glu His
435 440
<210>62
<211>22848
<212>DNA
<213>野野村氏菌属物种
<400>62
gtgacggcgc ggcgacgcga cgtcgaacgg gtggatcgga tcgttgacgc ggcagcggaa 60
ctgctgcctg agcggggata tcggcgactg acggtcgagg aggtcgcaag ccgggcgggc 120
gtctccaaaa gcagcgtcta cctgcactgg aacaccaagg acgaaatctt ctacgccgtg 180
ctggaccgcg agttcaccgt gctggcgcag gcggccgtgg accgggtcag gcgcgatcca 240
gccgaggtgc tggcgcaccg gacggcggcc aacctcttcc agatcgtcgc ctgccggcca 300
ctgctacagg cgttactcgt cgacgaccgg acaacgctcg gatcgctgca acccgcgaaa 360
tctgctgttt tccgggccag cctcgcgaat ctcaacgaac tgatgtatcg ctatcttcac 420
gcgctacgca taaacggact tctctgcccc gaggtcgacc cgcgtattat gcggaaagcg 480
atttctgaaa tgctgcgcgg aatgacgttc tccgcgggcg cgaaaccgtt ggccgagaca 540
cggctggcca agttgtccca ggtcgtcgcg gtgaccgtgc agcgcgcctt cgaaccgggc 600
gacgtgcccg aactcgaccg gatcaacgcc gccgcggcgg aggtgttcaa ggcgttcgac 660
gagctcatgc cggccgagga gacgatgcgc gccgaacgcc cggtggcgct gtgaccgtgg 720
tgcgcgcgca cgtccgccag gagccggccg cgctcgtcgt cggtcgcggc ctgctcgccg 780
accggctcgc ggcggtgacc ggccggctag accccggagt ggtgctcgcg gtgtcggacg 840
cgccggaccc cgccgtgctc gcggaggcca gggcgacggg ccggcccgtg ctgcccgtgc 900
tcgccgagcc gggccgggta cgggtcgggc cgctggaacg gccgggcgag ccgggctgct 960
ccgactgcct gagcctgcgc aggcaccgcg ccgccagccg gtcggccgaa cgggccgccg 1020
cctggctccg gcacggcccg gacctggccg ccacgccctc gccgctgctc gcgccggtgg 1080
cgctcgacct ggtggccgag ctggtcaccg cgctggtcac cgcccccgcg ccggcccacc 1140
gtggcatcct gctggccgac ctgtccgacc tgagcgtgac accgcacgcc ttcctgcccg 1200
atccgttctg cccgcgctgc ggcaccctgc ccgacgacga cccggcgcgg gcgcggatca 1260
cgctcgtgcc gcgcccgaaa ccgtcgccgg accggcaccg ggtgtgggac gccgaaggcc 1320
ggctcgaccg gctcaggcag atctacgtcg acgaccactg cggcctggtc cactcgctca 1380
acccggccgc gctgggctcg ctcgccgtcg ccggtgcgcc gatccggctg cgcggcacca 1440
ccgccttcga acccggattc ggccgctccc gcagctaccg ccggagctcc gtcatcgcgc 1500
tgctcgaagc cctggaacgg tacggcgcga tcggtcccgg tggcaggcgc ggcaccgtgc 1560
gcgccagcta cgcctccctc gggaacctgg cggtggatcc caggtcgctg gggttgcacc 1620
cgcccgagca ctacgcgctg ccgggcttcc cctaccggcc gttcaccccg gaagcggtgt 1680
gccgctggct gtgggggcac tcgttcgcca ccggcggccc ggtgctggtg cccgagcgca 1740
acgtccacta cggcccgtcc gacgacgatc ggccgttctg ctacgagctc gccaatggct 1800
gcgctctcgg ctcgtgcctg gaggaggccg tcttccacgg cattctggag gtgctggaac 1860
gcgacgcgtt cctgctgacc tggtacaccc gcgcccgcgc gccgcggctc gacctcggca 1920
ccgcccgcga ccccacgatc ccgctggtcg ccgccgcgat cacggcggag accggctatc 1980
tcgtcgagtg ctacgacatc acgcccgacc acggggtgcc ctgcgtgtgg gcgctggccc 2040
gccatccttc cgacggcgag ccggccacga tcagcgccgc ggcggccggc cccggcctgg 2100
aacccgccgc cgccggcgcg ctggccgagc tcggaccgat ggtgccgacc gtgcgcgacc 2160
acttcccaca gcacgccggc cgggcgcggg agctggccgc ggacggccgg cgggtgcgat 2220
ccatgatcga ccactatctc gtgtacggcg tgcggtcggc ggcacgccgc ttgtcgttcc 2280
tcaccgacgg cacggaggag gtgcccttcg cgcccgcacc ggacggcttc cggcacgacg 2340
acctcaccgc cgacctgagg ttcctcctcg accggctggc ggacagcggg ctcgacgtgg 2400
tcgtggtgga cctgaccacg ccggagcacc gcgcgggcgg gcttcgctgc gtgaaggtgc 2460
tggtgcccgg tacggtgccg atgacgttcg gcgagcagaa ccgccgcacg tggggcctgc 2520
cgaggctgct cgacccggcc gtggtgcggg ggcgcggcat gccggtacgc ggccacgctg 2580
atctgaaccc cgacccccac cccttcccgt gagccgccac gcgccgcccg ccgtcgcccg 2640
ggtgggcggg ctgccggccg ccgcgctgca cggggtggcc tgccccgagg cgacccggct 2700
cgccggccgc gtggtccacc tcaccgagga gctgacccga cgcgccgcgg tgctgtccga 2760
cgctctctac gaggtgatcg gcgccgccgg cgcgcacaag ccgatcctgg tggcgatccg 2820
ccgcgacctg cacgggctgc gccggcccaa acgcgtcgag gtgctgcccg cgccgttggc 2880
cgagccggtc cggacgtgga tctcgctgtg ggaagagcgc gcccgcgtcc acgccgtgct 2940
gccggacgtg ctcgcccgcg aggagcgctt ggcctgggag gcgctgcggg agctcgccgc 3000
gaccccggcg gtgcggcacg ggctcgcgca cgccagcccg gacctctccg ccgacctgga 3060
gaaatggctc gccgatacgg ggtggcggcc gcgaccgagc acgctggcga gcctgctgcg 3120
gtacgtgaag cgcgtggcgg ccaagacgag ccccttcagc acgttcacca ccgtccacga 3180
ggtccgctgg gtggacggcg gcgcggcctg gcaggtgccg gacacggcgc cgaccgtggt 3240
ggtggaggcc gacgtggggc tccggctgct ggtcgagtcc gtgctgccgc gcatgcccga 3300
ggtggccgcc gcgcgggtgg tgcggctgtc gccggccgcg tacgcgtcgg gggaccggct 3360
ggcgttcccg gaaccgggcg ggcggatgcg cgcggtggac cggacctccg cactggacac 3420
cctggtcgag ctgctgcgcg ccgagcagcg gtgggacgcg gcgatcgcca agctcaccgg 3480
tgccggcctg gcaggccacg gagcagagga cggtacgcgt gacagcgcga gcgacggaac 3540
ggcggcggcc gagcaggtgc tgagcgggct ggtgcgcggc gggctggtgg aggccgtcgt 3600
gccggtgccc ggccaggcgg cccgtccgtt cgcgcgcctc gccgactggg cggcgcccgc 3660
tgcgcccgcc ggcccgctgc accgtatcca ggtggccttg gaccaggccg ggccgctcgg 3720
cgacggcgac ccgttggcgt cggcctgcgc ccacgtggcc cgccgcctca ccgccgaact 3780
ccccgccctg ggcctgcccg tcatgccggt gcccgacctg cgccgtcgtg tgctgcgcga 3840
gtcggcgctc ggcgcgccgg tcgcctgcgc gctgcgggag tggcgacccg tgctggccga 3900
cctccaacgg gtccgccgct ggctcgccgt gcacgacccg atgctgccgc ttcgcctcac 3960
cctggccgac cgggtacgcg actggttcgg ccccggctcg gccgcgcccc tgctggacgt 4020
gtacgccagg gtccggaccg ccgaaccggg cacgcccctg gatcccgact tcctcgaaca 4080
ccccgacccg ctcgccggcg tcaccgaccc gcgcctgacc cgcctgcgcg agctgcgcgc 4140
cgcgtcggtc gccgcgctca ccggggggcg ggcggaggag gcgctgagtg agccgccggc 4200
ctgggtacgc gatccggggc cggtcacctg ctatgtccag ccgttccagg gggaggacgg 4260
cctgcggctg gtcctcaacg ccgcccacgg cggtcacggc cggggcatca cccgctggac 4320
caggctgctg ggcgccgagc cgccgcccgg cgagcccccg gctgccgagt ccccgcccgg 4380
tgagtccccg cccggtgagc tcccgcccgg tgcgtgcctg gtcgccgagc tgccgggcac 4440
gttcggccac agcctcaacc tgcacgcgcc cgccaccggc tgggagctga cctacccggg 4500
cgcggtgaac caggccccgc cggagcgccg cgtcccgctg gccgagctcc aggtccggca 4560
cgacgccggg cgaggcgtcg tcgagctgtg gtggccgcgc gccggccggc gcgtcgtgcc 4620
ggtgcacgcc ggcatgatgt cggagacgct gctgccgccc ctggcccgcc tgctcgtcga 4680
ggcgttcggc accacccacc tcacccatcc gaccctgccg cccgtggtgc gggccgccgg 4740
tccgcgcatc gacctgggcc gcgtcacgct cgccagggcc cagtggacgg cccgccgcga 4800
ggagattccg cggcggggcg gcgacgacgc cgcccacctc gtcgccgtcc acgcctggct 4860
gcgcgccgcc gggatcccgc gccgctgctt cgtccgcgtc cgcgaaccgc aggtgcggag 4920
ggaccggctc gccttcgaca agcggcacaa gccggtgttc gtcgacttcg ggagctggcc 4980
gtcggtgctg gagttcgacc ggatcgtcac ccgggccacc ggggacctgg aactgaccga 5040
ggcactgccc gacggcgagc gggcggtgga gctggcgatc gagataggag cccggtgacg 5100
cggtacccgc tgccccgccc ccaccccctc ggcatccacc ccggctacgc ccggctgcgc 5160
gagggctgcc ccgtcgcgcg ggtcgactcg ccgtacggtc cggcctggct gatcacccgg 5220
tacgccgatg tggcggcggt actcaccgac gcccggtaca gccgcgcggc ggcgacggag 5280
gacgacggcg gcatcctgct caacaccgac ccgcccgagc acgaccggct gcgcaggctc 5340
gtggtggcgc acaccggcgc cgccgccgtc gagcggctcc ggccgcgggc cgaggagatc 5400
gccaccaccc tggcgaaacg catcccggcg gaggccgagt tcgtaagcgc gttcgccgag 5460
ccgtactcac atcgggtgct cgcgctgttc gtcgggcacc tggtcggcct gccggccggc 5520
gagctgagcc cgatggccac cgtgctcacg ctggcgcggg tgcccgaccg ggagcgggcg 5580
gcggcgttcg ccgaactgcg ccggcggctg cggagccagg tggacgacga gacgctcgcc 5640
gtggtgctca acatcgtctt cggcggccac gcggcggtgg tggccgcgct gggctactgc 5700
ctgctcgcgg cgctggccga gccgctgccg agcctgaccg gcgatgtccg gcggatcgcc 5760
gagctggtcg aggagacgct gcgcctggct ccgcccggcg accggaccct gctgcgccgc 5820
accctcgagc ccgtcgagct gggcgggcgg gagctgcccg cgggagcgct ggtgatcccg 5880
tcgatcgcgg cggccggccg ggatccggac cggcccaccg gcgggccggc gggccggcac 5940
ctggcgttcg gccgcggccc gcacgcgtgc ctcggcatgg cgctggcccg gatggagctc 6000
cgggtcgcgc tccaggcgct ggccgagcac gtccccggac tgcggccggc ggtcagcccg 6060
gccacgctca ggcgtacgtg cgaggaattg gcggtcagcc cgcttgcggg aatcccgatt 6120
cgggtgtagt gggcagaaaa ccgaataaac gaatttggtc agcgggtgcc cattccttgc 6180
cgcggatcac gcccgggtca tactctcggt tccagaaatg gtgcacgcat tcggtgtgag 6240
aaaccgaggg agaatcgtgt ccgcagaaca ccattatcgt gacaggctac gcgccctgtc 6300
cgcatatcta cgcaaggtcg acaatgagcc ggaggccgcc gccgagctgc gcgctgaccc 6360
ggaaaaggcc ctccgggagg ccggcgtcga ccaggcgttc gaccgccctg aagcgttccg 6420
cgcatttgtc ggaaaactgg cggtattaag cggagaagca tggctcgcga ccgttcactc 6480
gatgattgaa ctgtgtgaga tcggtgcgga tccgcagcct cctgctgggc ccaacatctc 6540
attccgcata tcttccgacg gcggggtgac ggccatcgcc aatcgcggtg agatcgccaa 6600
gaaggtgcag cccaacccct ttcacgccgg ctccgccgcc gcgtcgccgg gcggccggct 6660
gcgcatctat cccggctacg ccaccagcga actgtcggcc cgcctcggtg agcgctacct 6720
gtccacgttc taccagcgca ccctgctcaa gcgcgtcgtg ctcgacccgg gcaccgtggt 6780
cgaggacgcc gacgccggtg agggcatcac cgtcaaccgg tcacagtacc gaggcgtcgg 6840
gttcgaactg cacaccaggg ccgacggcgc ggaccgcgag atcgtcgccg cgctcgtgcg 6900
ctgacccccg gcacgagatc acgacatcac accccacgga ggcgggatgc tgagcagcgc 6960
gctcgaagta gacatcgacg aggcggccgt cgccgccgac ctcagggaac tggccgcggc 7020
gctcgaccgc agcggctacg gcgagatcct gacgtgcttc ctgccgcaca aggcgcaggc 7080
gcacatctgg gcgcagaccg ccgcgaagat cgacggtccg ctacggacac tgatggagct 7140
cttcctgctc ggccgggcag tgccgcagga cgacctgccg gcccgggtcg gcgacctcat 7200
ccccgggctc gccgccacgg gcctggtgca gaccgggcag ggcgcggtgt ggctgcccaa 7260
ccttatcctg ctgcggccga tgggccagtg gctgtggtgt cagcgcccgc acccgtcgcc 7320
cacgatgtac ttcggcgacg actcgctcgc gctggtgcac cgcatggtga cccatcgcgg 7380
cggccacacc ctcgacctgt gcgcggggcc gggcgtgcag gcgctgaccg cctcgctgcg 7440
cagcgaccgc gtcaccgccg tcgagatcaa ccccgtcgcc gccgcgctgt gccgcaccaa 7500
catcgccatg aacggcctgg gcgaccggat ggaggtccgc ctcggcgacc tctacggcgc 7560
ggtgccgggc gaggtcttcg acgacatcgt gtccaacccg ccgctgctgc cggtgcccga 7620
ggacgtccag ttcgccttcg tcggcgacgg tggccgcgac ggcttcgaca tctcctggac 7680
catcctcgac ggcctgcccg aacacctgtc cgatcgcggt gcgtgccgga tcgtcggctg 7740
cgtgctcagc gacggctacg tgcccgtcgt gatggacggg ctcggcaagt gggccgtcga 7800
acacgacttc gacgtgctgc tcaccgtcac ggcgcacgta gaggcgcacc gcgactcgtc 7860
gttcctgcgc agcatgtcgc tgatgtccag cgcgatctcg ggcgagccgg ccgacgtcct 7920
gcaggagcgc tacgccgccg actacgccga gctgggcggc tcccacgtgg ccttctacga 7980
gctgtgcgcg cggcgcggcg gcggcacggc acggctcgcc gacgtctcgg cgaccaagcg 8040
ctccgccgag gtctggttcg tctgacgcca cccaccgacc ggacgggacc gcgatgccga 8100
ccacactccc gaagaccctg cgcgggtcgg acggcgcgct cgccgagcag ccgctgctca 8160
tctacgtgaa tgtgccgttc tgcaactcaa aatgtcactt ctgcgactgg gtgaccgagg 8220
ttccgctggc ggatctgcgg ctcacgccgg actcgtcgcc acgccgccgc tacgtcgccg 8280
cgctggtcaa gcagatcgag acgcacgcgc cgacgctggg cggactcggc taccggcccg 8340
aggtcatgta ctggggcggc ggcacggcca gcatcctcac catcgaggag atcgaggcgg 8400
tggctggggc gctggcggcg cggttcgacc tcggcggcct ggtcgaggcc accatcgagg 8460
gcagcccgga gtccatggac cccggcaagc tgaagctgtt ccgtgcgatc gggttcaacc 8520
ggatcagcat cggggtgcag gcgttcgacg acgcgcgcct gcgccgcatc ggccgggtgc 8580
acagcgccga gcaggcggag cgcgcggtcc ggatggccgc cgacgccggc ttcgacaaca 8640
tcaacatcga cctcatcgtc gggttccccg ggcagggcgc cgacgaggtg tcgcgcacga 8700
tccagcacgc ggtgacgctg ccggtcaacc acttctcggt ctacccctac cggccgaccg 8760
gcggcaccgt gatgcgccgg caggtgggcc gcggcatggg ccggatcgac gtggaggagc 8820
agctccggtc gtacgaccac gcccgcgacc tgctcgcccg gcacgggttc gaggagtacg 8880
ccaccgccta cttcggcgct ccccgctgcg agtccgacga ggtctactac aagctcacga 8940
tggactggat cgggttcggc tccggggcca actccctcat cgggacccgc ttcctgctga 9000
acgaccgggg cgggctgcac cgcttcagca cggccccgca ccgcttcgac tccgacaccc 9060
cggcctcggc cccccacctg acacgccact tcctggccca ggcgctgacc acggtcgacg 9120
gcatggacgc gcgcaccttc cagctgcgca ccggccgttc gctgcgggcg gcgtgcgagg 9180
agcccgcggt gcgccggatg ctcgaacaga tcaaccgccg cggcaggctg atcgtcgact 9240
cacgcggcat ccggctgcac cgcgacgaca tggcctcggc ctacatcacc atgaacagcg 9300
tcgatctgta cgccgcgacc gagcagcccg gcggatgacc gcggtcctgc gcgcctgctc 9360
acacagtctt cgtgaacccg tgtgcccttc ccacgtgggg acgggcgtgc cggtcgaccg 9420
ccgcgggctc gcgaaggaat gagggtcaca acggaaagga gatgagcgag ttggaatcca 9480
agctgaacct tagcgacctg cccatggacg tcttcgagat ggccgacagc ggcatggagg 9540
tcgaatccct caccgcaggc cacgggatgc ccgaggtagg cgcttcctgc aactgcgtgt 9600
gcggcttctg ctgctcctgc agcccgtccg cgtagcagtc aaggagtgcc gccggcccag 9660
gccggcggca ctccgcccgg ggtgaggaga cagatcatgg aggtgggccg cgaaatcgtg 9720
gtccgcgtgg cggggctgcc cgccgccgtg ctcgccgacc tgcgcctgcc gcacaccgcc 9780
gagctcgtca cgcacctgtc cgctgagcgg cggcggctcg ccgccgaggc ggctgcgctg 9840
tccggcgagc tgttcgacct gatcggcgcc gccggctccg cccgcgccgc cctggtgggc 9900
ctgcggcgcg cgctcgcccc cgggcaccgc cccccgtcgc cgcgactgat cgggctgtgt 9960
cccctgcccg ccccgctggc cgagcgggtc accgcctggg tgcgggcccg gtacgactgg 10020
gaggaccggc gccgcgacct tgccggcacg ctggacaagg agcgcgccga cgcgctcgac 10080
cgcgtacgcg ccgcctgcgt cgccccggcg ttccggcggg gtctggcgct gtccggtggg 10140
gagctgacca gcacgctgga gcgctggctc gccgaccccg gccgtgcgcc ccggcagggg 10200
aaggtgctcc gcctggtcaa gtacctgacc cgagctgcgg ccaagaccag cccgtacggc 10260
tccttcatgg tcagcgcgct ggcggggcgg cccggcgacg accctcccat cccggagctg 10320
ctcaccgtgg ccgagccgcc gggggcgttc ctcgacgccg tcggcgacgc gctgctcgcc 10380
gacccggcac tggccggcca ggtgccgctg cgccccaacc ccagcctgac gtggaccgcc 10440
caaggactgc ttttcgtccg gaccgtccgc gcggcggcgg gagagcaggc cgggccgaag 10500
gaagagatcg ccaccgccgg gcgcgccgcc gcgctggagc tgtgcctgcg gcacgccgag 10560
tcccggccca ccgcgccgca gctggcggag ctgctggccg aggcgggggc ggatccgggc 10620
gaggcggccg cgttcgtcga ccggctggtg gcggcgcagc tcctgctgcc gtgtccgccg 10680
gtgcacgacg acgatcccga cccgttcggt gcctgggccc gccaggtgtg cgccccggag 10740
ctgcgcgagc tggcggccgc gtcgcggccc gtggccgccg ccgtggactc gcccggccag 10800
cgccgcgcca ggatcgccga agccgccgcc gccgtggcgg accggctcgg catcgacccg 10860
cccgccgatc cggcgcacga gcacgacgtc agcaccggcc gtccggcgcc gccaccgctg 10920
cccgcgggcg tgctcgccga cctggacgcg gtccggcgct ggctcgccgt gttcgactgg 10980
aaggtgcccg tccgggtggg ggtcggcgcg ttctgccgcg aacgtttcgg ctcagggtcc 11040
cgcacgccct tcctggaggc gtgccgggcg gcgacggcgg cgctgccgca cctgttcggc 11100
cccgccgcga tgccgtggtt cctcgacctg accggtgacg gtcgcctgcg tgagctggac 11160
cgtctccgga cgcgcgcccg cgatctcgcc cgctccggcg tcctcgaccg gcggcgggtg 11220
ctggctgaca cggccgactg gcccgcctgg ctgacctggc ccgcctccac tggtttctac 11280
ctgcagaccc tgcccggtgg ggtggtgctg aacgcggtgc atgccgggca cggccgcgcg 11340
gcgggtcgcg tccaccacct cctcgcccgg gcgggcgccg cgccgccgcg cccgccccgc 11400
tccggcctgc cgcgtgccga gttcggcggc aggttcggct ccgcgctcaa cacccgcacg 11460
ccgagcacgc ggtacgagat cgaccacccc ggcgcgacgt ccggccgcga cccccggcac 11520
cgtgtcccgc tcggcacgct catggtggtg cacgacccgg acaccgacct ggtccacctg 11580
cacagcgacc ggctcggccg cgtcgaaccg gtgcacctcg gcatgatggg cgagctgggg 11640
ctgcccgccg tggccggttt cctcgaacgc gccttcgcgc ccacctacct gttccacccg 11700
agcgtgccgc cgttcatctc gctgcgtgac ctggccggcg cctcctcggc gcggcgcttc 11760
cccagggtga gtgtcggcga cgtggtcgtg cagcgcgccc gctggacggt gcccgccggc 11820
ctggtgcccg cgcgtaccgg ggcggacggt gaccacctgc tcgcgctggc cgagtggcgg 11880
cgcgagcacg gcatccccga gcggtgtttc gtgcgcggct ggaagccggg cgcagcgctg 11940
ggcaaggcgc gcaagccgct ctacgtcgac ttcgcctcct ggcatctggt cgccctgttc 12000
gaacgggagg cgcgaaccaa cgccgccctg gtcatcgacg aggccctgcc ggacccgctg 12060
gccgacggcg cccccgcgca cgtcaccgag taccacgtcg agatcggcga ccgggagaga 12120
gagcaatgac cgaacggccc ggctggttcg cggcgcatgt gcactaccgc ggcgacctcg 12180
acgcgctgct gcgcgaagcg gtcgcgccgc tggtgcgcgc gcttgccgcc gacttcttct 12240
tcctgcgcta ctgggacggg ggcagccacc tgcggctgcg gctgcgcggc ggggaccagg 12300
tcgcggtcgc ccggcacctg gacgcctacc ttgccgccca ccccgcgccg gagaccacct 12360
cccaggagga gtacgcccgc gtcgccccgg tgctggccgc ccgcgagggc atgacgggcc 12420
acctgacgac gctgcggccg aacaacaccg tggagttcgc ggcgtaccgg ccggagaccg 12480
cgaagtacgg caccggcgac gcgctacgcg ccgtcgagcg gcatttcgtc gagtccagcc 12540
ggtacgcgct tgacgtcctt gaccgccgcc cgaccggcaa ccaacgcgag ctcgcagtgc 12600
tcggcgtcct gctgctcgcc tggtacgccg cccgcccact cgatgagccg cctggtgagc 12660
cggtcgatga cgagctgatc ggcgcggtcg aggcgctgtg ccggggctgg cgcggcggcc 12720
gggacctgcc cgaggagctc gtggcggagg agtacggccg ggtgcgggag cgtgtggccg 12780
ggctggccgg cgcgctgcgt gacctcgttc cggacccgga cgcgcccggc agcagcatgc 12840
gcgcgtgggc ggcgacgttc gaccggctcg ccgccgcgct gcccccgccc gaccggctgc 12900
gggtgctcga cacgtgcgcg catctggcgg ccaaccggct gggcgtgtcc atggcggccg 12960
aggtgcggct gcggctgctc gccgcgcggg ccctgcgcga ggtcgcgccc gtggggaggc 13020
gatgatgagc tggcgacgcg tcgacgtggc ctaccacgat cccgaccttg acgggctgat 13080
cctggccacc cggccgctgc tggccgggac gcccggccgc ggctggttcc agcggcactg 13140
ggtccgcggt ccgcacctgg agctgtggtt cgacgccgcg cagccgtcgt gggagcggat 13200
ccgcgacgtg ctggagccct ggctgcgcgt caacccgtcg cgcgcccgga tcgaccgaga 13260
ccggctgctg gcgcagcacc ggcacctcgc cgccgccgaa cggatcgacg agccgctgct 13320
gccgttctac gccgacaaca cgctgcaccg ggccgctccg cgctcccgcg cacacgtgct 13380
cggtggtccg gcggccgagg agctgttcca cgacttccac accaccgcca gcgccgtggc 13440
ttacgacgag ctcgacgccg tgcgggcggg agagtcgcgg ctggtgatgg cactggacct 13500
gatggtcgcc gccgcgcacg cgcacgccga gggcggcgtc cgcggcgggt tcgtgtcgtt 13560
ccgctcgcac gcggaggcgt tcctggcgag cgcgcccggc ctgcgcgagc gctgggacgc 13620
cgagtacgcc gcccgggcgg gggcgctgcg agcgcggatc accgcggtgg tcgccggaat 13680
cccgcgcggc cgggcgtggg ccgggctgct cgaccggttc gcggaccgcg gcgacgagct 13740
gatcgcctcc ggcgcgctgc tggtcgagcc cgccgggccg gacgcggtcg cccggcccga 13800
caccgccttc caccgggcgc tgcgcggcaa ccggacctgg cacgaggagg tgctgcgctc 13860
agcaccgttc cgccgctacc ggctgctgct gaacctgacc tacctgcagc tttcccggct 13920
cggggtgaac gccgtgcagc gggcgctgct gtgccacttc gccgcgtcgg cggtcgagca 13980
ggagtacggg gtgtccgcca tcgagatcgc catgggaggc gcgtgatgtc agtacaggtc 14040
gagcccgcag tgacgcaccg gtgggcactg cggcccggcg tctaccgggc caccgcgcca 14100
ggcggcgatc tcatgctcgc cgcctggccg cacgccacgc cgctcggccg ggccaccccc 14160
gagctgctgg ccctgctgga cggcctggcc gccggatcgc tgccgctcga cgagcccggc 14220
gacctcgcgc ccgccgtcga gctgctgcgc gcgggtggct ggctgcgcaa gacggtggcg 14280
tacgcgggac gcgacctcta caccatcacc cccgtcgccg cccccaccga cgcgccgcca 14340
ccgccgcggg acgaaccggc gctgtcgcgg ttcgcgctgc tgcgcaacac cgcggacggg 14400
ctggtgctgg agatgcccgg ctcctggtgc gacgtccacg tgcacgaccc ggcggtggcc 14460
gcgctgctcg ccgacccgtc cggcgacggc ggcctgcccg ccgaggccgc ggccgcgctg 14520
cgcgccgacc tggccgccgc cggcatgctg atggagcggg aggagccgtt cgagcggcgg 14580
cagtggagca cccacgagct gtggttccat gaacgcagcc ggctcggcaa ccggggctgg 14640
ttcggcgcgc acttcggcgg cacgttctgg gcccgcggcc ggcacgaccc gccgcccgcg 14700
cggccgtccc cctaccccgg cccggccgtc gagctggccc ggccggacct cgcggcgctg 14760
cggcgcaccg accccacgct caccgccgtg ctggaggacc gcgaaagcgt ccgcgaccac 14820
gacgacgacg atccgatcag cgctgagcag ctcggcgagc tgctctaccg gtgcgcgcgg 14880
gtgcggctgc tgcgtcacct ggaaggcttc gagtacgccg gcaagccgta ccccgccggt 14940
ggctcggcgt acgagctaga ggtgtacccg gtcgtgcggc tggcccgcgg cctcgacccc 15000
ggcatgtacc actacgacgc gcacgaccat cggctgcgcc aggtccggcc cgccggccac 15060
ccggcggtgc gcaggatgct gaaggtcgcc acggagtcgt ccgtcgccaa ggcgccgccc 15120
caggtgctgc tggtgatcag cgcgagagtc ggccggatcc tgtggaagta cgaggcgatg 15180
gggtacgcgc tcatgctgaa gcacgtcggc gtgctgcaac agacgctgta cgcggtcgcc 15240
accgccatgg acctggcccc gtgcgcgctc ggcagcgggg acgatctcgc cttcaccgcc 15300
gccaccggcc gggaccggct ggtggagtgc gcggtcggcg agttcatggt cggcagcagg 15360
cggaaggagc ccgcggcatg ggagctctga acctcctcct gcgccccgac gcgcactacg 15420
ccgaggtcga cggcggcgtc tacgtgctga gccaccaggg cgagaccttc atctcgggca 15480
cctcggtgca ccggtggctc gaccgcctcg cgccgctgct cgacggcacc cgcacgctcg 15540
accagctcac cgccggcctg cccgccgacc gggccggctt cgtggccaga cttgtcggca 15600
cgctcaccga acgcggcctg gtgcgcgagg tcggcccggc ggtgtcggac acgctcaccg 15660
acgccgaacg cggcgagcac cgtgccctgc tggcctacct gggctacttc cacgactcgc 15720
ccggccgcgt cctcgaggac gtgcgcgaca ccccgaccgc gatcgtgggg tccggtccgc 15780
tggccgccgc ggtggtccgc gcctgcgccg ccgccgggct gcgccgggtg gagatcggcg 15840
aggaggcggg cgcggcccgg gtggtcgtcc acgtggccga gcgcgccgag cccgaacggg 15900
cggcgcggct ggaacggcgg tgcgccgccg agggggtgct gctcgcacag gtcatgccgg 15960
ggccggacgg catctggtgg cagcccgcgg cccgcggcgg ctgctgggcg agcgcgtggc 16020
gccgccaccg ggcgctcgcg ggcgtggatc ggacgggcac gccgctcgat ccggtggcgg 16080
tcgcggtggt ggccggccag gtggcacacg acgtcttccg cgtcctcgcc ggactgcgcg 16140
aggaggcgcc gccccggttg gtggtgctcg atccgcggac gctggcgagc accgcgcacc 16200
cggtggtggc gcacccgttc gagctgcccg ccgcgccgct ggacgaggcg gcgttcctcg 16260
accgggtcgc cgcgctgcgg gcagcgcccg cgctgagcga ggcggagttc tcccggcggg 16320
ccaaggggct catggactcg acagtggggc tgttcgccga gatcgacgag ggcgacctcg 16380
cgcagttgcc gctgcacgtc acggcgacca cggtggccga cccgtgcggg ctgatcggct 16440
ccgcgccgcg gcccgtggtc accggcgcgg ggctcacgtt cgaggaggcc cgctaccgcg 16500
cggcgcgcgc cgcgctcgcc ctggccggca ctctcgcgct cgaccggcgg aggctggtcg 16560
acggccgggt gtgggcgtac gaccttgcgg acggggccgc ccggctggtt ccggccgacg 16620
aggtcttcgc aagcacggcg ggcgggagca cggcgggcgt gccgctcggc gcggcggcag 16680
cctactcgtg ggccgaggcg gtcgcggagg gcctggtcgc gcaggccgcc gcgctcactc 16740
tcgccggcgc cgggcacgcg ggcgagccgt atggacgggc ggacctcgcc ggggcgcctg 16800
cgtatctcct cgccatggtg cgggcgctcg gcgaggagct gaccgtgcac gacgtcaccg 16860
ggccgctggg cgtgccggtc gtggtgggga cgctgtccgg cggggcgacc gcctgcggcg 16920
cgggcatgac cacggacgcc gccgtcaccg cgtgcctgcg cgacctgctg ctgctgcgcc 16980
aggccgagat caacgaccag cccgtctacg ccccaccatc cggcaggccc ttgcccgggc 17040
atctacgcgg gaaccacccg gcgcccgccg tgcccggcac ggacgccgac cggctggcgg 17100
cccgcctggc cgagcggggg caccgccctc tggcggtgcc gctggatcat gaccaggccg 17160
tgcacgcggt cctgcccttc gccgtccggg tggtgtgccg atgatccgcc tgcccgacca 17220
cggcgagctt gccgtgccga tcggcgacgg gccgatgctg ccgctgcgca ccgaactcgg 17280
ccgggtggtc atcggcccgc tggagcggcc cggcgtgccc ggatgccggg cctgcgtgcg 17340
catccgcgcg gcgcgggtcc agcccgacgc ccgcaaggcc gaggccgtac gcgcccggca 17400
cgcccccgcg cccagccagt ggctcacccc gctcgccacc gacctggtgc gcgtcctggt 17460
cgcgagcgag agcgctgccc tggcagccga caccgacccc cgcaccgcgg gtgccgtgct 17520
ggagatcgac ctcgccacgc tggaaatcac caggcaccgg ttcctgcccg acccgctctg 17580
cccgcactgc ggcggtctgc cgccggacgg cccggccgag ctgaccctgc ggccccgccg 17640
caagctcggc ggcagtcccc ggaccaggcc ggtcgagctg aacgcgctgc tggagacgta 17700
cgtggacggc cgggtcggga tgatccggcc gctgaagtcg ggcgtgcagg gcggactgac 17760
ggtggccagc gccatgctgc cgatccgcgc gggccacggc ctggaaccgg gggtcggccg 17820
tacccgcagc tacaccgcga gcaggctggt cgccgtgctg gaggcgctgg agcgctatgg 17880
cggcgtcagc cccggcggcc gccgcaccag cgttaccgcc gcctaccgcg acatctccgg 17940
ccacgccgtc catcccgaca ccttcggcac acaccccgag gagaactacg acaggcccgg 18000
cttcgccttc cggcgcttca ccgaggacac cgtgtgccgg tgggtgtggg gctactcctt 18060
cgccaaggcc cagcccgtgc tggtgccgga gaaccaggtc tactactacg ccagaaacct 18120
gccggacggc gagcagccgt tcgtcttcga ggtctccaac ggctgcgcgc tcggctcgtg 18180
cctggaggag gcgatcctgc acggcctgct cgaggtggtc gagcgggacg cgttcctgct 18240
cacctggcac gcccggcggg aggttccggt gctgaacccc gcgctggcga gcgacccggt 18300
cctgcccatg caggccgccg cgatcaccgc cgagaccggg caccgggtgc tgtgcttcga 18360
caccaccgcc gagcacggca tccccagcgt gtgggcgatg gccgtggacg tcgaacaccg 18420
gtcggaccgg cccgccaccg cccacgccgc cggcgcggcg ctcacgctgg agcaggccgc 18480
catgaacgcg ctgagcgagc tcggcccgct gctggccgac gtgatccgcc gctaccccga 18540
ggagcgggaa cgggccgagg ccatggtccg cgaccccgag caggtcgcca ccatgcacga 18600
ccactccctg ctctacgcgg ttcccgccgc ggccgaacgg ctgtcgttcc tcaccggccg 18660
cgccgacggc ccgcggaccg gcttcggctc ggcccggttc accggcgacg acctcaccgc 18720
cgatctgcgg gccatgatcg acgcggtgat cgacgccggg atggacgtgg tggtcgtcga 18780
ccagaccacg ccggagcacc tggcgggcgg gttccgctgc gtgaaggtgc tggtgcccgg 18840
cgcgctgccg atgacgttcg gccaccagta ccggcggctg gacaacctgc cgcggctggc 18900
ggccgcgcgt accaccgacc cgcacccgtt cccatgagcg ggcgcccgga cagcggaaag 18960
gagccgtcgt gtacgtggtg atcgtcgcgt tcgacctgaa ggagtcctcc gtcgacttcg 19020
ccgaactgcg cgcctgggtg cgggaccggg cggcggacga ctactcccgg ctgccgggga 19080
tgcgcttcaa gacgtggttc tccgacgagc gaaaacggct ctggggcgcg gtgtacctgg 19140
tggagtcgat gttgtcgttc gaccgggaca acctcccgct gctgcccgac ggcaggaccg 19200
ggccggtcgg cacccggccg acgtcggtca tggtgctgga gttggaggcg ttcgtcaccg 19260
ggccggacgg cctggacggg atcgaggcgc tcgcccggca agggctgagc atgacgggag 19320
gcggccatga ccactgaggc gacgactgcg gtgaccactc gtgcgaacgc cggagcgctg 19380
tccctgccgg cgcgtggcac ggaccggccg ctgctgctct acgtcaacat cccgttctgc 19440
aactccaaat gccacttctg cgactgggtg gtggacgtgc ccgtctccga cctgcggctc 19500
gcccccgcgg cgccgcgccg ggtcgactac ctggccgcgc tgtgcaccca gatccgcacg 19560
cacgcccccg ccttgcgggc cgccggttac cgcggtgagg tcatgtactg gggcggcggc 19620
accgccaccg tcctcaccgc ggcggagatc gagcaggtcc acgcctgcct cgcggccgag 19680
ttcgacctga cggcgctggc cgaggcgacg atcgagggca gccccgagtc ggtggacccg 19740
gccaagctga ggctgctgcg ggacctcggc ttcgaccggg tgagtctcgg cgtgcagtcg 19800
ttcgacgaga ccaggctgcg ccgcatcggc cgcgcccact ccgcgggcca ggccgtgcgc 19860
agcgtcgagg acgcgcacgc ggcgggcttc gacaacatca acatcgacct gatcgtgggc 19920
ttccccgacc agtcgctcgc cgaggtggag cagaccgtgc ggcgcgccct cgacctgccg 19980
gtcaaccact tctcggttta ctcctaccga gcgaccgagg gcacggtgat gcgcaggcag 20040
atcgaacgca gcggcacggc catcgagctg gagcatcagc tccagtcgta ccggctggcg 20100
ggcgagatgc tcgcggcggc gggacatccc gagtacgccg tctcctactt cggtgcgccg 20160
cgctgcctcg ccgacgaggc gtactaccgg ctcagcatgg actggatcgg cttcggcacg 20220
ggcgccaact cgctgatcaa ccagcgctac ctgctcaacg gccgcggccg gatgcgtgac 20280
ttcaccagca ggccgggcga gttcgaggtg gacctgccgg ccggagtgcc gtcactcacc 20340
gtgcagtggc tgcccagggc gctgggcacc gccgagggca tcgacgcggc gaccttccag 20400
cgtcgcaccg gcacgtccct gcgtgcggcc tgcgaggaac ccgagctgaa cgcgttcctc 20460
acccgggtga acgagttcgg ccggctcgtc gtggaccgcg acggcatccg cctggccgac 20520
gagaaccgct cggacgtgct gtcgcgcacg ttcgccgcga tgggctgggt gtcctgacgt 20580
ggaggcgatg cgcacgctgc tcgcggccgc cgacctggtc acgccgatgg cgctgcgggt 20640
gtcggcgacg ctgcggctcg ccgaccacct ggccgccggc acgaccggcg ccgccgagct 20700
cgccgcggcc gccggggtcg acgaggcggc gttgacacgg ctgctgcgct acctggtcgc 20760
gcgcggcgtc ttcaccgagc ccgcgcccgg tgagttcggc ctcaaccccg ccgccgaact 20820
gctgcgcgac ggccgccccg accggctgcg cgactggctc gacctcaccg ggccgatcgg 20880
ccgcgccgac ctggcgttcg ggtcgctgct ggacgtcgta cgcaccggca agcccggtta 20940
cccgatgatc cacggccggg gcttctggga cgacctcgcc gccgagccgg cgctcgccac 21000
cgcgtacgac accctgatgg gcggcaagcg ccagtgggcc gcgaccacgc tcgccgccct 21060
ggactggagc cgctcccggc acgtcgtgga tgtcggcgga ggcaacggca cgctgctgtc 21120
gtgcctgctg gccgcgcacc cgcacctgcg cggcaccgtc gtggaccggc ccacctccgc 21180
gaaggccgcc ggagcagtac tggcctcggc cggggtggcg gaccgtggcg agtttcgcgc 21240
gggcgacttc ttcgagccgc tgccggtgca cggcgccgac acatacctgc tcagctcgat 21300
cctgcacgac tgggacgacg ccgcggctac ggcgatcctg cgccgctgcg cggaggccgc 21360
cgcgccgggc gggcgggtgc tgctctgcga gctggtggcc atggccgggc cggaccggcg 21420
gacggtgacg cacatggatc tgtgcatgct cgtgtacttc ggcggccggg agcgcaccgc 21480
cgccgacttc gccgcgctgg ccggggcggc cgggctggag ccgcgctcgg tgacgccgct 21540
cccgccccac gactggggca acgccctcgt ggagtacgcg gtccccgccg cccgctgacc 21600
ggaaaagacc cctgccgacg gcgacggtca gcgcggcgcg gctccgttga tcgcgcccgc 21660
ctgggccgca cgatgagctg gagcgctggt cccactcgac cgcaatcgcc gtggaggtgt 21720
gggcacttcc cggcgagccc tgtccggcga cgtcgcggag ctcgtccatg ccacgatccc 21780
cgacgtactc gacggctcgg gacgggacgg atcggtgcgg tgcgcgggca tcgcgctcac 21840
cgcgggcgcc cgcgggctgc gcctgaccac cagccacgac ggctccggct cgccgcgctg 21900
gggttcaaac tcactaccca gggccggtac gggatgagtt tcgtccgctt ctgtgaggaa 21960
cgcggcgctg accgggtggc ggcgcgccgg ttcggcctac atcaaggagc tgatgcccga 22020
catctggatg gcaccatcga gccggggcaa atgttcgacg ccacgaccga tgcgatgtcc 22080
cgcgaccggc cgtcgcggtg aggcgtgccg atgcatcacg acgagctcgg aataccgagt 22140
ctgcgtcggg gtggatttgt ggctggtcga tgagtttggg atgctgcgca ggtctgcctg 22200
ccgataccac ctgactggaa ggggatcacc gcgatggcga aggtcatctc tacgttgttc 22260
atctctgctg acggtgtggc cgagatcgac cccgattggc acttcccgta cttcgacgag 22320
aacatgggcc gcgccgtcgg cgaggactat gacaccgctg acgtgctgtt gatcggtcgc 22380
gagaccttcg acagcttcgc cggagcgtgg cccgaccgcg aggcggcggg tggggacgac 22440
gcaccgttcg ccaagcaact cggggacatg cgcaaggtgg tcgtctcccg ccagccgctg 22500
gagttctcct ggcgcaactg cgaactgatc acgggcgatc tcctcgatgc cgtcacctcg 22560
ctcaaggccg atgccggcat caggggcatc ctcatccccg gttcgatctc cgtggtgcag 22620
cagttgctcg ccgcagggct ggtcgacgag ttgcgcctgc tggtgcaccc ggtggcggcg 22680
cgtaagggcc gcaggctgtt cgacgacggc gacgcgccgt accacctgag cgtgacggcg 22740
acggagacgt ttccgacggg cgtgatccgc gtgatctact cgccgaccga ggcacccacc 22800
aaagtcggct acgacgaggt cgaggcccag gtgtccaccg gggaatag 22848
<210>63
<211>15586
<212>DNA
<213>野野村氏菌属物种
<400>63
ctaggtgggt gagggggtta gggggattac ctcgttgggg gtggtgtcgg gggtggggat 60
ccagttgagg gcgatgaagg tctgggcgat gtcgtcgcgg tggaggcgga tgccgttgtg 120
gtcggcgatg agccggccgt ggttgttcat gcgttccagg tacgtcatga cctccgggtg 180
agagcaggcc gtgcggaggg ggacgccggt gcgttgctgg tagaggcggg cgtccaggcc 240
ctcggcggtt gtcagtgcct gggacaggaa gtggagggtg agctgtgggg agtgggccgg 300
ggcgttgatg tcgaaggcca gcgggttggt gttgtagtgg gccagcttgc ccttctcgta 360
gctcaggtag cggcggccga tcagggagtt ggcgcccgag ccgaagccga tccagtccat 420
gcggagctgg tagtacgcct cgtccgactg gcagcggggg tggccgaagt aggacatggc 480
gtattcgggg aagccggctg cttccagcag ttccctggcg atgccgtacg cctggagctg 540
gaggttgagg tcgagctggg cgccccggtg gacctgcttg cgcagcaccg tgccggggct 600
ggcgcggtag gggtagatcg agaagtggtt gatgggcagg gtcagggccg tgcggaccga 660
gtcggcgacc tcctggccgg tctgcccggg gaagccgacg atcaggtcga tgttgatgtt 720
ggtgaagccg gcctcgtggg cgtcctggac ggcggtgagg gcctggtcgg cggcatgggc 780
gcggccgagg cggcgcaggc gcgcgtcgtc gaaggactgg acgccgatgc tgatccggtt 840
gaagcccagc tcgcgcagga ggcgtagttt gtcccggtcg agggattccg ggctgccctc 900
gatcgtggcc tccctgaccg tgctcaggtc gaactcggcg gacagcgtgc cgtacaggga 960
ctcgatctcg tgggggccga ggatgctggc cgtgccgccg ccccagtaga cgatgtcggg 1020
gtggtagtgc tcgcgcaggg cgggggcctg gacgcggatc tgggtcctga tggcctccag 1080
gtacgcgacg cggcccgggc tctgctcgcc cagccgcagg tcgcgtacgg ggacctggac 1140
cacccagtcg cagaagtggc acttggagtt gcagaagggg acgttcgcgt agatcagcag 1200
gggcttggtc atgaggaacc tctcacgtgc atctccctga cgccgaagat ctggctctcg 1260
tagaaggagc gcttttcggg acggagctcg gtgaagcggc tcagcaggcg ctccagcgcg 1320
atgcggccct ccaggcgccc gagctgggcg cccaggcaga agtgcacgcc gtggccgaac 1380
gcgagctggc cggtgagctg ccggtccagg tcgaagcgtt cggggtcggc gaagtggcgt 1440
tcgtcgtggt tggcggacag gagccaggcc atgacgaacc tgttggccgg gatggtctcg 1500
ccggccacct gtacgtcctg cgtggtcacc ctgcccgcct gcatgaacgg cgagcgcagg 1560
cgcatgctct cctccagcgc ctgggggatg agcgacatgt cggctcttgt ccggtgggcg 1620
gcctcggggg cgtccgccag gcagagcacg gtgttgccga tcagcacggt ggtggtgacg 1680
tgcccggcca gcaggagcag gctcgcggtg ttgacgacct gctccgcgtc gagccgctcg 1740
ccgtcgatct cggcatggac gaggcgggtg agcaggtcgt ccctgggacg ggtacggcgg 1800
tccgcgcagt gctcgcgcag gtagtcgttc atctccgcca tggccgccgc cacccgcccg 1860
gccagcgacg ggtcggcgaa gtcgggcacc tggagcgaca tgagccggtc cgaccaggtg 1920
cggaacaggt cgcggtcgga cggcggcacg ccgagcagct cggcgacgac ggtgacgggc 1980
aggggatagg ccaggctctc gaccaggtcg aagtcagggc cgggcagggc gtcgaggagc 2040
tcgtcggcga tcgcggcgat gcgtggttcg agggccgcga cggagctcgg ggtgaaggcc 2100
gcggtgatga gcctgcgctg gtggcggtgt tcgggcgggt cgatcatcgt gatgccgccc 2160
tggccgaacg gctgccgtcc catcagcctg gtgcggtcgg aggagaaccg ctcgtggtcc 2220
gccagaacgg cgcgtacgtc gtcgtagcgg aagacgtggt acatcccata ggaatcccgc 2280
cagaccgggt gcgtgtcgcg catctcgcgc agccaggcga acagggacgt cccgccgtcc 2340
gtgaccgaag gtggccttac gggggccgtc atcggggcgc ccgcttgacg cgtaccggca 2400
ggctcttgac gccgaacatg gggtcctcgt agtacgacag ctccgcgtcc gggtcgatct 2460
cgacctgctc gaaccggtcg aacaccagct ccagcgccac cttcccctcc accctcgcca 2520
gcggcgcgcc caggcagaag tggatgccgt ggccgaaggc gtactggcgg ttgggctggc 2580
ggccggggtc gagccggtac gggtcgggga actggcgctc gtcgtagttc gcggacagca 2640
gccagttgat gaccatggaa ccggccggga tcggcgtgcc gtcgatctcg acgtcggccg 2700
tggggagccg ggcggcctgg gtgagcggcg ggcgcagcct gagcacctcc tcgaaggcgg 2760
gtgcgatcag ctcccggtcg gcccgtacgg cgctctccac gccgggcgcg tcgcggaagc 2820
acaggaacgc gttccccagg gccatcgtgc tggtgatctg cccggcgagc agcagcaggc 2880
aggcggagtt gacgatctcg gcgtcggtga gccggtcgcc gtccacctcg gccgcgacca 2940
gccggctgac gaggtcgtcc tgcggacggg tgcggcgctc gcgcacgtgg gtgaggacgt 3000
attcccccat ttcgcgcatg gcctgaccga ccatccgccc gatctcgatg tcccgcgggt 3060
cctcgacgtg cagtgcgacc agccggtcgg cccaggtgcg gaacagctcg cggtcgtgga 3120
tcggaatgcc gagcagctcg gcgatcacca tcacgggcag cgggtgggcg atcttctcga 3180
ccaggtcgaa ctcgtcctcg tcgatctcgt ccagcagcgc cgtggtgagc tcggcgatcc 3240
gcggcaccat gtccgacgac attttcgggg tgaacgcctg gctgatgagt ttgcggagct 3300
ttcggtgctc cggcgggtcg gtgagcatga ggctgcccgc gctgaacgga tcgccgccgg 3360
gccggagccg gttgatgtca gaggagaacg ccgcatagtc cgacatcacc cgctgtacgg 3420
ccgcatgccg gaaaacgtgg aagatgccga atgcgtcgcg ccagaccggt tgttcgtccc 3480
gcatcgtgcc gagccacttg aggagggtct ggccgccgtc cttgatgcgc ggccgggagt 3540
cgatcggcat cgtcatcgtc gggtccggcg ggacgtgtgt ctcgttcaca attgactcct 3600
cagacggagg cggccagggg ctgggggatg agtttcgccc ggtatttcgc cgcggcgccg 3660
tcgaagatct cgacggtacg gcgggcgggg tcggtcagtt cttcggccgg gacctggtca 3720
gcaggttcga aagagctcct gatgaggccg gccaggctgt cggcgtgcgc cgccagatcg 3780
ggtttcgccc cggcgatctc ggcgtgcagg tgaagtttga tgaacccgga aagcagggca 3840
tcgagcgcga aaccgtggga cgggtcccac attccgctct cgtggagcat ccggagataa 3900
tcgcgaaatg gcgtgaacgt ggtgaagcgg taacactgga agccgagctg tggatcgtcg 3960
caggcccttc cgagcgtttc cttgtcatag gtgtagagtg ctcggaagag tggatacttg 4020
aacacgagtg tgaacagctc gcgtgagaac tcggagagcc gcgcgacggc aggacgaagc 4080
accgctattc gcgaaatatc ctggcagact ccgacaattt cctgaatgac gagcgttctt 4140
atgagatcgt ctttcgtgtc ccagctgaga taaatggtgc cctttccgat gtccgcccgc 4200
cgggcgatct cgtccatcgt ggtccgcttg tagccggatc gcaggagcag gctcctggtg 4260
acgtccagag tccggcgtac gcgatcgtcg ctggtcctgg cacccgtgct gcgtgtcgag 4320
acggtgctca tggctgggtg gctccttccc cgtaagagct ggtgcgcatg aaccggtatt 4380
ccctaccggc tagggggatt ttggtgggag atgtgctctg ggcccgtcag agctggagat 4440
ttcgaagata ttcgaaatgc tcagatttca acagtcaggt gccccctccc tgactggctg 4500
accgattttc gattttagtc agccagttcg cattcttgac cgcgttccat atgtacacct 4560
agcgtcggcg atgtcgcaag ggtgttccta taccaggcga tgacctccgt gcgatgcaca 4620
tcagtgcgtt tgcctggaat gtcgatgggg cgtttacccc cggaaggaga gtccgcatgg 4680
acctcagcga tctgcccatg gacgtcttcg aactcgccga tgacggtgtt gcggtcgagt 4740
cccttactgc tggtcacggc atgaccgaag tgggagcttc gtgtaactgc ttctgctaca 4800
tctgctgctc ctgctcgagc gcctgacgcg gtacgcgggc gtcgccacgg cggcgcccgc 4860
gcctgttgcc ttttggcgcc aataaagcga atggggctca tgtaatggcg gttattgagc 4920
gggaagaaag cgacggcccg ccggtcgctg tccgcacgtg cggggtcgcg gccgcggagc 4980
tggaatccct gcgatgggac gagtcctatg cgctggtgac ccggctgctc gcggagaccg 5040
cccgggtggc ggcggacggg cggcggctgg ccgtggcgct cggtgacgtc atcggagggc 5100
tcggcccgtc cgggtcccgg cccgtcctcg tggggctgcg gcgggcgctg cacaccgggc 5160
gtctcccctc cgggcgggag tgggggcccg aggccggggc ggcgctgccg tacgggctga 5220
ggggcgaggt ggaggagtgg gtacggcgtg cgcgcgagtg cgccgggctg cgcgcccgcc 5280
tgcccgaggt cgtcgcccgg gagtccctgg agaaggagga acggctgcgc gccgccgcgg 5340
ccgaccccgc cttccgcagg gggctggcgc tggccggcgg cgagctggcg gtcgacctgg 5400
agacgtggct cgcggacccc gcgcggcgcc ccaagccgca gaagctgctc aggctggcca 5460
aatacctggt cagggccgcc gtgaagacca gcccgtacag cacgttcacg agcaccgggc 5520
gggcggtgtg gggcggtggc gagcggcacg tggagcgcgt ggtgccggtg ctggaactcg 5580
acggcgtcca gacgttctcg gacgatcggg tcagggtgaa tccgtcggtc accgtcgcgg 5640
gcgggacggc ggagttcatc gggccgcctc ccggggaggc gctggtgtcc atcggggtga 5700
cggaggcggt ggccgcgtgc ctgcgcgtcg cggagggcgg ggagtgggtg ccgcggggcc 5760
ggttcgcgga ggctctgggg gctgagcctg ccgcagtcac gaaatttctg gacaagttgc 5820
ttgcggttgg gctcctggag gcccggccgg acggcgaccc gcccccgcac ctgctggacg 5880
ggatccggcg cacggaacgc gccaccgacc cgtccacctt ccgccacgaa ctcggccgcc 5940
tgatcgccgc cgcccgcgcc gccgcccgcg ccaccgcccc cggcgctgac acggccaaga 6000
acgccgcccc tgccgggcgc gccacccgcg gcgatggcgg tgctgatgcc gagcgcgcca 6060
cccgcggcga tagcgatgct gatgacgggc gcgccacccg gggcgacggc ggtgctgatg 6120
acaggggcgc cgcgcggggc gacggcggtg tggggcgggc ggttgtgcac gaggtcgcgg 6180
tctgcgtcga gcccgtggcg aggctggatc cggcgcgatg gcgtggcggg cttgccgatc 6240
tcgacgtcgt acgccgctgg ctggccgttt tcgacgccaa gcaccccatg cgcctcgcgg 6300
tcgccgccta cctcaccacc cggtacggcc ccgacccggc cgtccccttc ctcacgctcc 6360
accgccacat ccagcgcgag ctggccggca ccggcgcggc aggccgggag ttgcgcgcgt 6420
tcctcggctc gtcggccgcc tggacccagc cgctaggcac ctccgccctg cccaggatca 6480
gggagctgga gcgcctcaga gccgaggcga gaagcctggc gctggacgcg gaggaccccg 6540
acggcacctg ccgcgtcacc cccggacagc tggccgcgca gctggagtcg tggccgtctt 6600
ggatcgcgat ccccgcctcc tcggcctgct acgtacaggc ggtggccggc accctggtgc 6660
tcaacgtcgt ccacggcggg cacggccgag ccctgcgcag gctcgaccac ctcctcgaac 6720
gcgccggcgg ccaccccgag ccgccccgga tcgaggaccc ggacggcgcg gtctacgccg 6780
agttctccgg cgacctgggc tccacgctca acgcgcgccc gccgagcacc cgatacgaga 6840
tcgactaccc ccactcgccc ggcacgcgcc cgcccgacct gcggctgccg ctcacggacc 6900
tgcacgtgac gctctgcccg gacagcggcc tgcccgagct gcgttccaag cggctcggcc 6960
gccgggtcgt gccgttgcat ctcgggctgg ccgccgagtt ccggcttccg ccggccgcgc 7020
ggttcatcga acgcgtcttc ggccccggct acctgctcca tcccagctcg ccgccgctgg 7080
tgcggatggg ccgggtcccc tcggaggtca cccggtatcc acgcgtcgag gccgggcgcg 7140
tggtggtgca gcggcgtcgc tggctggcgc ctgcggccac gctgccggtg cgcgcgaagg 7200
gcgagggcga cgcggcgtac ctcacgcggc tgatcgcctg ggcggacgag tacggcgtac 7260
cgcaccgatc gttcgtccgc gcctggccgg agcagaccgg cgacaaaggg caggacaagg 7320
cgcgcaaacc gctcttcctg gacctggcga acctgttcct ggtcaagaac ttcgagcggc 7380
agatacgtgg ctgcgcgttc gcgctcttcg aggaggcgct gcccgacccg ggaccggagc 7440
gggtgaccga atacctgatc gaggtgggag gccgatgagc tgggtgagcg tgcacgtctt 7500
ctcgcagggg ccgctcgacg acatgatcac gggcctggcc gggccgctcc tcggcgacga 7560
cggcttcttc ctgcgctact gggagggcgg cccgcatctg cggatcaggg tcaggtccca 7620
cccggcggag caggtcgtcg agcgggccga ggcgtatctg cgcgagcacc cgtcagaggc 7680
ggtgatcgac ccggaggagt acgccaggct cgccgcgacc ctcgccgccc gcgaaggcgt 7740
ccccggctat acgcggcgcc tctatccgaa cgactccgcc cacctcatcc cgtaccagcc 7800
ggaacacgac cgctacggca cgggccgctc gctcgacgcc gtggagcggc acttccacga 7860
ctccagcgtg atcgcactcc agctgatcgg ggcggggctc ggacacgagc ggcggagcat 7920
ggcgtggctg accatgctgc tggtcgcctg gcaggtcgcg ggggagggca gggcgttcgg 7980
cccgcccgct gacgccgggg ttcaggtgcc ccacgagcgg atggcggcgc tggtcgagca 8040
cgccagggcg gtgacacagg agcctgcgcc gagcgagccc cgtggcgtgg tggccgcctg 8100
gtacgcctcg atcgcgcggc tggtggagga actggcggcg gcggggttcg acgcggcgcg 8160
gacgggggcg accgtcgatc tggccgcgca tctgctggcc aacaggctgg ggatccgggt 8220
gcaggaggag gcccggctgc gtcacctggc gtccggggcc acgagggagt cggaggtggg 8280
ggtcggatga cctggacgcg gctgcgggtg gactatcacg acggcccgat ggacgacctc 8340
atcctggacg cgctccgccc ggcctggcat gaaatacggg gatatttcct gcgccactgg 8400
gtgtgcggcc cgcacctgcg gatcttcgtg gacggcgacg cgacgccgat cgtccgggcg 8460
gtcgagcgcc acctggccgc ctgcccgtcc gccggcacca ccgacccgca ggcgctgctc 8520
cccctgcacg agcgcctggc cgagctggaa ggcgaacgag gcccgctgct gccatgggcc 8580
cccgacaaca ccgtcaccgc cgaacccccg gggctcgaca ccgagctcga ccggttcctc 8640
gcggacttct acgccgacac caccgaggcc gcgttcgacg ccctcggccg ggtcagagcc 8700
ggcacgccgc tgccgggcat cgccttcgac ctggtggtcg ccaccgcgca cgacctgtcg 8760
gagggcggcc tgcccactgc caggacctcg ctgcgctcgc acgccgaggc ttacctgtcg 8820
cgcctgccgg gaggcgtccg cgccaagtgg caggcgcact acgaacgcaa ccaggagccg 8880
ctgaccgcca ggatcaaggc cctgaccggc gccggagagc ccggcgcgtg gctgcgtacg 8940
atccgggcca cccgcgaccg gggccgtacc ctcatcgacg agggacggct gagcctcggc 9000
tacgccaccg acggcccttc cacgcggccc ccgctcgccg cggtctcccc cttccaccgg 9060
aacctggaga ccgacgaacg ctggctcgcc ctcaaggaca cccccgcctt cgccgcctac 9120
cgcctggccc tgaactgcgc gtacctccac ctcacccggc tcggcctcac gcccgaccag 9180
cgcttcctga tctgccacct cgccgcgagc gccgccgacg acgtctaccg ggccgtggcc 9240
tcatgaccgg ggaacggtac gagctgcgcg ccggcgtgca cctcgcccgg ctggacgcgg 9300
gggtccgcct gttcgcctgg ccgcacgccg agaccctcgg cgagctcacg cgggatgagc 9360
tcgacctgct ccgcgacctg gccgccggac cccgcaccgc cgggggaccg ctcgtcgaac 9420
gcctgcgcgc cggaggctgg ctcaagatca cgattacccg ggacggcgtg cccctctaca 9480
cgctcgcccc gctgcgcccg ccgccgccac ggccggcggt gccggagcgg ccggttctgt 9540
ccaggttcgc cacgctgcgg cgcgaggggg acgcgctggt cgccggctcc ccgctggcct 9600
ggtgcgacct gtacgtccac gaccccggcc tggtcggcga cgtggtccgg cccggcggcg 9660
aggtcctggc cgacctggtg tgggccgggc tggccgtgcc cgaggaggcc gaggaccggg 9720
agctgcggtt ccggcagtgg gcgccgcacg agctggagtt ccatgaccgg agccgggtgg 9780
ggcaccgcgg ctacctgggc gatgggttcg gcgggacgtt ctgggcccgc ggccggttcg 9840
acccgctgcc cgcccggccc cggccctacc ccggccgggc gatcgagctg cccacgcccg 9900
acctggacga actgcggctc aaggacccct cgctcacgga cgtgctggag ggccgcaggt 9960
ccgtacgcga gcacgacgac gagcgcccga tcaccctcga cctgctcggc gagctgctgt 10020
accgcacggc cagggtgcgg gagtgctgga cggccgacgg cgtcgaatac acccgcaagc 10080
cgtacccctc cggagggtcc gtctacgagc tggagatcta ccccgtcgtc aggaacgtgg 10140
ccgggctcga acccggcatg taccactacg acgggcacga ccacgtgctc aggccggtac 10200
gtgaggccgg ccatcccgcc gtacgccggc tgctgaccgt cgccgggcac ggcgccgcca 10260
ccggccgccg cccccaggtc ctgctcgcgg tctccagccg cgccggccgg ctgctgtgga 10320
agtacgaagg catggggtac gcgctgacgc tcaagcacgt gggtgtgctc taccagacgc 10380
tctactgcgt ggccacggcg atgggcctgg cggcctgcgg gctcggcagc ggcgactcgg 10440
ccgcgttcgc cgaggcgacc gggcgggacc cgttggagga gtgcgcggtc ggcgaattca 10500
tgatcggaac cgcggaggca ccacgttgaa cgacttcaaa cccagactcc ccgcggacat 10560
acgcttcgcg cccacctccg gcggtgtcgc cttcctcacc cgcgaaggcg tcgtgcggat 10620
gaacggggcc tccgtccacc tgtgggtgga gcggctggcc gtgcacctcg acgggagcag 10680
gaccgtggcc gagctgaccg cggagctgcc cgacgagcgg cgggcgttcg tgacgagcct 10740
gctgaccacg ctgcgcgagc gcgggctcgt ggaggacgcg ggagagcgcg gcgtgctgcc 10800
cgtggcggcc ggcaccgcgt gctcgctgct ggccgacgcg gaccggttcg gcgagctggc 10860
gcccgccctg gccgacgccc tgcgcaggct ggggctggag gtgctgacag agccgtcggg 10920
cggggcgctc gtgcacgtcg cggcggccga cgcggacggg ctggccgccg ccgggcgcct 10980
cgaccggctg agcgccgagc gcgggctgcc catcgcgcac gtgctgctgc gcgagggcga 11040
ggcgtggtgg agcgagaccg gcgtcgtcgg gcgcgacgtc ccgccgtggg cggccgggtg 11100
gcggcggctg gcggccatgg aggccgtccc gcgtaccgcc gggcacgtct ccgtgtcgcc 11160
cgtcgccgcg gccgtggtcg ccgggcaggt ggtggcggac ctggggcgct gcctgtccgg 11220
aacgccccgc gtgtccggcg gtccgcggct gcacgtggtg gacctggacg ggttcgggat 11280
gcggacgcac tccttcctgc cgcacctgtc ggcgctgccg cccggcacgg gggtgagcgc 11340
ggggccgctc ggcgaggagg agttctcgcg gcgggcggcc aggttgatgg actcgcggac 11400
gggggtgttc gccgagatcg aggaggggga gtacgggcag ctcccgctgc acgtgtcggt 11460
gaccacggtg gccgatccga tgggggccct cgggggtgcg ctggcgcggg tgatcggcgt 11520
gggggcggac ttcgccaccg cgcgataccg ggcggcgctt aaggcactga ccgtgcacgg 11580
gctgctcgcc ctcgaccccc gccgcctggt cacggccgag gggacgcccc tgaccggcgc 11640
gggggaaccc gccagcggct tcccggctga tccgggcgcg agggaacggc cgatcggtgg 11700
cttttcggct gatccgggtg cgggtgagcg gccggacgac ggtctcctgg acgacccgct 11760
ggtgggcgac gtcgcggcgg gacgggtcga ggcgttcgtg cgcggccgtg acctcgtcga 11820
gggcggtgag gtgctgctgc ccgcccgcgc ggtgttcctg gatccgcacg ccaccggggc 11880
cgccgcgggg tactcggccg aggaggcgct ggtcgcgggg ttactggacc actgtgcggc 11940
actggccggg ctcgacggga cgctgccgcc cgtggacgtg ggcggcgcgc gggcggccga 12000
cgacgagacc gcgcggtcgg cggcgctgct ggacgcgatc gggctgccgt accaggtgct 12060
ggacgccacc ggcccgtcgg gcgtgcccgt gcacgcgggg acgctcggcg ggcggctggt 12120
ggcgcgggcg gcgggcgtca cgcccctggc cgcgctgcgg gccacgctcg aagggatcct 12180
ggccgcgtac cagggcattc cgggccccgc acccctgccc gacctgtgcc cggccgtcgc 12240
gcaggagccg ccggtcgtcc tcgacacggg ggcggccgtg ctcggcgccg gtgagctcgc 12300
cgccgccctg gccggcgccg ggctgcgggt cagcgccgtt ccgctggatc acgaccggga 12360
ggtacacgcg ctcatgccgc acgtcgtccg cgtcgtcacg gagccgctcc atggctgagg 12420
tcgtggggac gggcctgctg gccgaggaga tcacgatcgc gctgaaggac cgcgacgggc 12480
gggcagaggt gacgatcacc gcctgcgacg gctgggcgcg cggcccccgg cgcgacgggg 12540
cggcgtggtt gcccgtgcgg gtcgagtacg gggtcgccgt catcgggccg ctggaacgcc 12600
ccggcgaacc cggctgcgtg acctgcttcg agacccgccg ggaccgggtc aggaccgaca 12660
gcgccgatcg ggccgccgtc ctggccgtcc acggccccga actcgccggg cgggcctccc 12720
cgtacctcgg ccgcctggcc gcccgcacga tcgcggccct ggccgcgcac gccgccgagg 12780
gccccggatg cgccgtctgg tacgtcgacc tgcgcacgct caccgccgaa cgccacacgt 12840
tcctgccgga accccactgc cccgactgcg gcgacctgcc ggacgacgac cgcgcgtccg 12900
ccgccttcga gcccggcgcc gccccgcgac ctcccggcta ccgggtcagg aacgtgccgg 12960
ccgagcacgg cgcgctgctc gacacgtacg tggacggcga atgcgggctg atcaggcccc 13020
tcgtccggga cacgctcggc ggcctggtga tcgccggggc gatgctgccg ctgcggttcg 13080
agggcggttc ggagcccggc gtgggccgca cccgcggcta ccgggccagc gaggtcaccg 13140
ccgtgctcga agcgctcgaa cggtggggcg gcgtcgagcc cggcggcaag cgcacccgcg 13200
tgcgggcctc gtacgcggag gtggccgcgg acgcgctcga ccctcgaacg ctgggcgagc 13260
acgacacctc ctcctacgag atggaggggt tcgcgttccg gccgttcgcc gaggacgccg 13320
tctgcgactg ggtgtggggg tactccttcg cccggcgctc gccgatcctc gtgccggaga 13380
gcctggccta ttactacgta cgggggcggg agcggccgtt cctcttcgag atctcgaacg 13440
ggtgcgcgct cggcggcagc atggcggagg ccctgctcta cgggctgctg gagacggtcg 13500
agcgggacgc ctttctcatg acctggtacg ggcggctccc ggtgccgcgg atcgaccccg 13560
gcacggcacg ggaccgcacc atcccgctcc aggccgccgc gatcatcgcg gagaccggtt 13620
atcgggtgga gctgtacgac acgacgatgg agcacggcat ccccagcgtg tgggcgatgg 13680
gcgtgcggca ggacggcgat ccgggcaggc cgcgcctggt gtgcgccgcc ggggcccacc 13740
tggtgccgga gaaggccgtg ctcagcgcgc tgagcgagct ggggccgctg ctggccgacc 13800
tgatccggcg gtatccggac gaggtgcacc gagcccagga gatggtgaca aatcctgatc 13860
tggtggcgac gatgcacgac cactccaccc tgtacggcgc cgacgcggcc ttcgaccggc 13920
tctcgttcct gaccggcggc acgggcgtgc gggggctgcc cgacatggag gcgttcaccg 13980
tgcccggtga tctcgacgtc atgagggtgg tggaccgctt cctcgccgag gggatggacg 14040
tcgtcgtcat cgaccagacc acgccggagc atcgggcccg cggtttctcc tgcgtcaagg 14100
tgctggtgcc cggcacgctc ccgatgacct tcggccaccg caaccgcagg gtgcggggcc 14160
tgacccgccc gctggagctg ccgtaccggc tcggccaccg cgacacgccc ctgacccccg 14220
ccgacctgaa ccccgaccca caccccttcc catgaccacc gagccgtttc ccgcgccgac 14280
ggggccgccc gcagcgccga cggggccgtc tcccgcgctg gcggagccgt ctgctgcatc 14340
gcccggcccg ttgtccgttc ggcaggggcc gtctcctgtg accgccgagc tgcgtgacct 14400
ggcgatcttc cgtgccgatc tgcatgccca ccccgagctg tcctggcagg aggccaggac 14460
ggccgatcgc ctggcggggc ggctggcggc ggccgggtac gaggtcacga ccgggatggg 14520
cggtcatggg gtggtcggga ggctgtgccg tggcgacggg gtcacggtca tgctcagagc 14580
cgagctggac gccctccccg tcaaggagga gaccggcctg tcatacgcca gcaccgccac 14640
cgccacgacc ctcgacggca ggacggtgcc ggtctcccac gcctgcggcc acgacctcca 14700
tctcgcctgc ctggtcggcg ccgcccggcg gctggccgcc tgcgacgact ggcggggcac 14760
ggtgctcgtg atcggccagc ccgccgagga gacgctggag ggcgccgccg cgatgctcgc 14820
cgacggcctg tacgagcggt tcggcgtccc ggacgtggcg ctggcccagc acgtctcgcc 14880
gttccccgcg ggcctgatcg cctacccgga gccgcccacc gcggccggcg ccgaactccg 14940
cgtcgtcgtc acgggggacg gcggccacgt cggagacatc ggccgggctg gtcacgtcga 15000
tcgagccgtg gggcgcaatc cggtcgcggc cgtcgccgcg ctcgttcacc ggctcgatca 15060
gacggcgttc gaccaggcga tcgtcaccgt ggggacgttg cacgcgggcg agcgcgccaa 15120
cgtgatcccc accctcgccg aggccgggat cacggtcagg gccgcgacgg aggaggcggt 15180
gacccgggcc gtcgcccgcg tcgcccggct ggcggaggag acggcgggag ccggcgtcat 15240
cgtggtctcc agggtgccgc ccggcgtgaa cgaccccgcc gccaccgccc tggtacgccg 15300
ggcccacgag gccgcgctcg gcgcggtcgt caccgccccc ggcggctcgg cctgcgagga 15360
cttccccctc tacggggtgc cctccgtcta ctggtacgtg ggcgcggccc cacccgccgg 15420
cctggtcgga cgcccgcata ccgggacttt ccgccccgat cccgtgccca cgttgagggc 15480
aggggtcacc gccatgcaaa cggctgccct ggcagtcctt gcgaacgcgt cacagttcgc 15540
ccctccatcc cgatatcatg gacccggagc agtagccgag cactga 15586
<210>64
<211>60
<212>PRT
<213>野野村氏菌属物种
<400>64
Met Ser Asn Ala Ser Ile Gly Gln Glu Ile Gly Val Glu Gly Leu Thr
1 5 10 15
Gly Leu Asp Val Asp Ala Leu Glu Ile Ser Asp Tyr Val Asp Glu Thr
20 25 30
Leu Leu Asp Gly Glu Asp Leu Thr Val Thr Met Ile Ala Ser Ala Ser
35 40 45
Cys Thr Thr Cys Ile Cys Thr Cys Ser Cys Ser Ser
50 55 60
<210>65
<211>180
<212>DNA
<213>野野村氏菌属物种
<400>65
atgagtaatg cctccatcgg tcaggagatc ggcgtcgagg gcctgacggg cctggacgtc 60
gacgctctgg agatcagcga ctacgtggac gagacgctgc tcgacggcga ggacctcacg 120
gtgacgatga tcgcctccgc ctcgtgcacc acctgcatct gcacgtgcag ctgcagctcc 180
Claims (38)
1.包含选自以下的氨基酸序列的硫肽前体蛋白质:
(i)SEQ ID NO:1;
(ii)SEQ ID NO:5;
(iii)SEQ ID NO:11;
(iv)或当与SEQ ID NO:1、SEQ ID NO:5或SEQ ID NO:11相比时,具有不超过1、2、3、4、5、6或10个缺失、插入和/或取代氨基酸的所述氨基酸序列的变体。
2.权利要求1的硫肽前体蛋白质,其中所述前体是Ef-tu硫肽抑制剂的生物合成前体。
4.核酸,其包含编码权利要求1-3中任一项的硫肽前体蛋白质的核苷酸序列。
5.权利要求4的核酸,其包含SEQ ID NO:5的核苷酸序列。
6.权利要求5的核酸,其包含SEQ ID NO:6的核苷酸序列或包含至少SEQ ID NO:5的其任何片段。
7.权利要求4-6中任一项的核酸,其中所述核酸序列有效连接异源转录和翻译控制序列。
8.权利要求7的核酸,其中所述核酸是表达载体。
9.用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID NO:23-34中的任一个,
(ii)(i)中列出的氨基酸序列的变体,当与(i)中列出的相应野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6、或10个缺失、插入或取代氨基酸,并保留基本上相同的酶功能。
10.核酸,其包含编码权利要求9的多肽的核苷酸序列。
11.权利要求10的核酸,其中所述核酸序列有效连接异源转录和翻译序列。
12.包含权利要求1-86中任一项的核酸的宿主细胞,其中在所述宿主细胞的基因组中未天然发现所述核酸。
13.权利要求12的宿主细胞,其还包含硫肽生物合成所需的其他基因。
14.权利要求13的宿主细胞,其中硫肽生物合成所需的所述其他基因包含权利要求10或11定义的核酸。
15.权利要求13或14的宿主细胞,其选自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种、大肠杆菌(Escherichia coli)、棒杆菌属物种(Corynebacterium sp.)、芽孢杆菌属物种(Bacillus sp.)和链霉菌属物种,如变铅青链霉菌、天蓝色链霉菌、白色链霉菌(Streptomyces albus)、Streptomyces ramocissimus、丘链霉菌(Streptomyces collinus)、弗氏链霉菌(Streptomyces fradiae)、远青链霉菌或灰色链霉菌(Streptomycesgriseus),并且其中所述宿主细胞针对所述硫肽提供抗性。
16.突变体微生物,其中与相应野生型微生物相比时,所述突变体微生物不再表达编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因。
17.权利要求16的突变体微生物,其中所述突变在相应野生型微生物中是编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因的破坏。
18.权利要求17的突变体微生物,其中所述微生物是野野村氏菌属物种并且所述突变是包含SEQ ID NO:15或SEQ ID NO:16的基因的破坏。
19.权利要求16-18中任一项的突变体微生物,其中用权利要求1-8中任一项的核酸进一步转化所述突变体。
20.突变体微生物,其中所述突变体微生物不再表达编码如权利要求9定义的一个或多个多肽的一个或多个基因。
21.用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID NO:47-60的中任一个,
(ii)(i)中列出的氨基酸序列的变体,与(i)中列出的相应野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸,并保留基本上相同的酶促功能或调节功能,
(iii)(i)中列出的氨基酸序列的变体,其与(i)中列出的一个多肽具有至少80%或至少90%的同一性,并保留基本上相同的酶促功能或调节功能。
22.包含编码权利要求21的多肽的核苷酸序列的核酸。
23.权利要求22的核酸,其中所述核酸序列有效连接异源转录和翻译序列。
24.包含权利要求22或23的核酸的宿主细胞,其中在所述宿主细胞的基因组中未天然发现所述核酸。
25.权利要求24的宿主细胞,其还包含硫肽生物合成需要的其他基因。
26.权利要求25的宿主细胞,其中硫肽生物合成需要的所述其他基因选自编码权利要求4-8中任一项的硫肽前体蛋白质的核酸和权利要求10-11的核酸。
27.突变体微生物,其能够产生一个或多个特定基因的表达有缺陷的硫肽,所述特定基因编码如权利要求21中所定义的一个或多个多肽。
28.用于产生硫肽前体蛋白质的方法,所述方法包括在适合于产生所述硫肽前体蛋白质的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。
29.产生硫肽化合物的方法,所述方法包括在适合于产生所述硫肽前体化合物的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。
30.权利要求28或29的方法,其还包括分离基本纯形式的所述硫肽前体或硫肽化合物。
31.权利要求29或30的方法,其中所述硫肽化合物选自:GE2270A、GE37648A、如权利要求5中任意通式I-X中任意通式所示的化合物、amythiamicin、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins、nocathiacins、伯尔尼霉素、A10255B和radamycin。
32.产生硫肽衍生物的方法,其包括:
(i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体的序列,在宿主细胞中合成改变的硫肽前体,
(ii)从所述改变的硫肽前体合成所述硫肽衍生物。
33.权利要求32的方法,其中所述改变的硫肽衍生物前体是如权利要求1-11中任一项定义的SEQ ID NO:1、SEQ ID NO:5或SEQ ID NO:11的变体。
34.权利要求32或33的方法,其中步骤ii)在体外进行。
35.权利要求32或33的方法,其中步骤ii)在与步骤i)相同的宿主细胞中体内进行。
36.产生硫肽或硫肽衍生物的方法,其包括:
(i)提供包含如1-11中任一项中定义的硫肽前体蛋白质的培养基,
(ii)在所述培养基中培养微生物,其中所述微生物还包含硫肽生物合成所需的其他基因。
37.权利要求36的方法,其中硫肽生物合成所需的所述其他基因选自编码下述多肽的那些基因,所述多肽选自SEQ ID NO:23-34和SEQ IDNO:47-60。
38.权利要求36或37的方法,其中所述微生物选自自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种和链霉素物种,如变铅青链霉菌、天蓝色链霉菌、白色链霉菌、Streptomyces ramocissimus、丘链霉菌、弗氏链霉菌、远青链霉菌或灰色链霉菌,其中所述微生物是选择为对所述硫肽或硫肽衍生物有抗性的菌株。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP07114121 | 2007-08-09 | ||
| EP07114121.2 | 2007-08-09 | ||
| PCT/EP2008/060339 WO2009019289A1 (en) | 2007-08-09 | 2008-08-06 | Thiopeptide precursor protein, gene encoding it and uses thereof |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201310347021.6A Division CN103483424A (zh) | 2007-08-09 | 2008-08-06 | 硫肽前体蛋白质、编码该蛋白质的基因及其用途 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN101809030A true CN101809030A (zh) | 2010-08-18 |
Family
ID=38543755
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201310347021.6A Pending CN103483424A (zh) | 2007-08-09 | 2008-08-06 | 硫肽前体蛋白质、编码该蛋白质的基因及其用途 |
| CN200880102696A Pending CN101809030A (zh) | 2007-08-09 | 2008-08-06 | 硫肽前体蛋白质、编码该蛋白质的基因及其用途 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201310347021.6A Pending CN103483424A (zh) | 2007-08-09 | 2008-08-06 | 硫肽前体蛋白质、编码该蛋白质的基因及其用途 |
Country Status (11)
| Country | Link |
|---|---|
| US (1) | US20110183374A1 (zh) |
| EP (2) | EP2647647A3 (zh) |
| JP (1) | JP2010535481A (zh) |
| KR (1) | KR20100049580A (zh) |
| CN (2) | CN103483424A (zh) |
| AU (1) | AU2008285655B2 (zh) |
| BR (1) | BRPI0815371A2 (zh) |
| CA (1) | CA2695813A1 (zh) |
| EA (1) | EA201000273A1 (zh) |
| MX (1) | MX2010001491A (zh) |
| WO (1) | WO2009019289A1 (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110791482A (zh) * | 2013-09-13 | 2020-02-14 | Reg生命科学有限责任公司 | 改进的乙酰-coa羧化酶变体 |
| CN114561406A (zh) * | 2022-04-26 | 2022-05-31 | 北京工商大学 | 一种参与阳离子肽化合物合成的基因及其用途 |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101586112B (zh) * | 2009-06-19 | 2011-06-22 | 中国科学院上海有机化学研究所 | 诺丝七肽的生物合成基因簇 |
| CN101684471A (zh) * | 2009-07-24 | 2010-03-31 | 中国科学院上海有机化学研究所 | 诺卡噻唑菌素的生物合成基因簇 |
| WO2014167371A1 (en) | 2013-04-12 | 2014-10-16 | Naicons S.C.A.R.L. | Analogs of the antibiotic aminothiazole ge2270 |
| EP3111949A1 (en) * | 2015-07-01 | 2017-01-04 | Deinobiotics | New bicyclic lipopeptide, preparation and use as antimicrobial agent |
| CN106319004B (zh) * | 2015-07-09 | 2020-10-27 | 牡丹江佰佳信生物科技有限公司 | 一种可提高那西肽产量的发酵培养基及培养方法 |
| CN107641146B (zh) * | 2016-07-21 | 2022-10-04 | 中国科学院上海有机化学研究所 | 高产盐屋霉素及其类似物的产生菌、盐屋霉素及其类似物的制法及其用途 |
| CN106366168B (zh) * | 2016-08-26 | 2020-09-15 | 上海交通大学 | 羊毛硫肽类抗菌肽及其脱氢衍生物的制备方法 |
Family Cites Families (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5639949A (en) * | 1990-08-20 | 1997-06-17 | Ciba-Geigy Corporation | Genes for the synthesis of antipathogenic substances |
| US6485972B1 (en) * | 1998-10-15 | 2002-11-26 | President And Fellows Of Harvard College | WNT signalling in reproductive organs |
| WO2001064835A2 (en) * | 2000-02-28 | 2001-09-07 | Hyseq, Inc. | Novel nucleic acids and polypeptides |
| WO2001057251A2 (en) * | 2000-02-04 | 2001-08-09 | Aeomica, Inc. | Methods and apparatus for predicting, confirming, and displaying functional information derived from genomic sequence |
| US6436703B1 (en) * | 2000-03-31 | 2002-08-20 | Hyseq, Inc. | Nucleic acids and polypeptides |
-
2008
- 2008-08-06 CN CN201310347021.6A patent/CN103483424A/zh active Pending
- 2008-08-06 EP EP12190104.5A patent/EP2647647A3/en not_active Withdrawn
- 2008-08-06 JP JP2010519461A patent/JP2010535481A/ja active Pending
- 2008-08-06 AU AU2008285655A patent/AU2008285655B2/en not_active Ceased
- 2008-08-06 US US12/672,379 patent/US20110183374A1/en not_active Abandoned
- 2008-08-06 WO PCT/EP2008/060339 patent/WO2009019289A1/en not_active Ceased
- 2008-08-06 BR BRPI0815371-0A2A patent/BRPI0815371A2/pt not_active IP Right Cessation
- 2008-08-06 CA CA2695813A patent/CA2695813A1/en not_active Abandoned
- 2008-08-06 KR KR1020107002790A patent/KR20100049580A/ko not_active Ceased
- 2008-08-06 MX MX2010001491A patent/MX2010001491A/es active IP Right Grant
- 2008-08-06 EP EP08802965A patent/EP2178907A1/en not_active Withdrawn
- 2008-08-06 EA EA201000273A patent/EA201000273A1/ru unknown
- 2008-08-06 CN CN200880102696A patent/CN101809030A/zh active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110791482A (zh) * | 2013-09-13 | 2020-02-14 | Reg生命科学有限责任公司 | 改进的乙酰-coa羧化酶变体 |
| CN114561406A (zh) * | 2022-04-26 | 2022-05-31 | 北京工商大学 | 一种参与阳离子肽化合物合成的基因及其用途 |
Also Published As
| Publication number | Publication date |
|---|---|
| EA201000273A1 (ru) | 2010-10-29 |
| US20110183374A1 (en) | 2011-07-28 |
| EP2647647A2 (en) | 2013-10-09 |
| AU2008285655A1 (en) | 2009-02-12 |
| CN103483424A (zh) | 2014-01-01 |
| KR20100049580A (ko) | 2010-05-12 |
| EP2647647A3 (en) | 2014-10-01 |
| MX2010001491A (es) | 2010-03-01 |
| WO2009019289A1 (en) | 2009-02-12 |
| AU2008285655B2 (en) | 2012-03-08 |
| JP2010535481A (ja) | 2010-11-25 |
| CA2695813A1 (en) | 2009-02-12 |
| EP2178907A1 (en) | 2010-04-28 |
| BRPI0815371A2 (pt) | 2015-02-10 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR101573536B1 (ko) | 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터 | |
| DK2271666T3 (da) | Nrps-pks-gengruppe og dens manipulation og anvendelighed | |
| CN101809030A (zh) | 硫肽前体蛋白质、编码该蛋白质的基因及其用途 | |
| EP2342335B1 (en) | Novel gene cluster | |
| KR20100039443A (ko) | 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법 | |
| NZ508326A (en) | A polyketide synthase and non ribosomal peptide synthase genes, isolated from a myxobacterium, necessary for synthesis of epothiones A and B | |
| KR20070033979A (ko) | 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna | |
| CN111378008B (zh) | 脂肽类化合物Totopotensamides及其制备方法和应用 | |
| CN107794286B (zh) | 一种环脂肽类化合物生物合成基因簇及其激活方法与应用 | |
| CN101691575B (zh) | 一种萨菲菌素的生物合成基因簇 | |
| US20020164747A1 (en) | Gene cluster for ramoplanin biosynthesis | |
| CA2501393A1 (en) | Genes and proteins for the biosynthesis of the glycopeptide antibiotic a40926 | |
| WO2002059322A9 (en) | Compositions and methods relating to the daptomycin biosynthetic gene cluster | |
| CN101586112B (zh) | 诺丝七肽的生物合成基因簇 | |
| CN101184838B (zh) | 基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法 | |
| JP7086984B2 (ja) | Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法 | |
| US7364877B2 (en) | Polynucleotides encoding disorazole polyketide synthase polypeptides | |
| CA2450691C (en) | Genes and proteins involved in the biosynthesis of lipopeptides | |
| US20030211567A1 (en) | Compositions, methods and systems for discovery of lipopeptides | |
| CN101027395A (zh) | 用于制备复合聚酮化合物的生物合成基因簇 | |
| CA2522622A1 (en) | New process for improving the manufacture of clavams e.g. clavulanic acid | |
| US20040132055A1 (en) | Recombinant chalcomycin polyketide synthase and modifying genes | |
| WO2003040372A2 (en) | Polynucleotides and polypeptides involved in clavulinic acid biosynthesis and use thereof | |
| FR2786200A1 (fr) | Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation | |
| KR20080032641A (ko) | 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C53 | Correction of patent of invention or patent application | ||
| CB02 | Change of applicant information |
Address after: Basel Applicant after: Novartis Ag Address before: Basel Applicant before: Novartis AG |
|
| COR | Change of bibliographic data |
Free format text: CORRECT: APPLICANT; FROM: NOVARTIS AG TO: NOVARTIS CO., LTD. |
|
| C12 | Rejection of a patent application after its publication | ||
| RJ01 | Rejection of invention patent application after publication |
Application publication date: 20100818 |