CN101809030A

CN101809030A - 硫肽前体蛋白质、编码该蛋白质的基因及其用途

Info

Publication number: CN101809030A
Application number: CN200880102696A
Authority: CN
Inventors: R·莫里斯
Original assignee: Novartis AG
Current assignee: Novartis AG
Priority date: 2007-08-09
Filing date: 2008-08-06
Publication date: 2010-08-18
Also published as: EA201000273A1; US20110183374A1; EP2647647A2; AU2008285655A1; CN103483424A; KR20100049580A; EP2647647A3; MX2010001491A; WO2009019289A1; AU2008285655B2; JP2010535481A; CA2695813A1; EP2178907A1; BRPI0815371A2

Abstract

本发明涉及用于硫肽生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理该前体蛋白质的方法，或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物产生中的用途。

Description

硫肽前体蛋白质、编码该蛋白质的基因及其用途

本发明涉及用于硫肽(thiopeptide)生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理硫肽前体蛋白质的方法，或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物制备中的用途。

硫肽是天然的、富含硫的、高度修饰的大环肽，许多所述硫肽具有有效的抗生素活性。这些复杂的天然产物根据抗生素的Berdy化学分类分为噻唑肽(Berdy J.‘Recent developments of antibiotic research andclassification of antibiotics according to chemical structure.’Adv ApplMicrobiol.1974；18(0)：309-406.)并包括硫链丝菌肽、诺雪七肽、微球菌素、nocathiacin、amythiamicin、GE2270A等。硫肽共有许多共同结构特征：聚集在中心多吡咯结构域中的三元或四元取代的氮杂环，其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架(framework)的一部分。硫肽的该大环标志使得它们与其他噻唑化合物，如博来霉素、杆菌肽、或小菌素B17区分开来。Hensens首先建议根据中心杂环结构域的结构和氧化状态对硫肽抗生素进行分类(O.D.Hensens和G.Albers-Schoenberg.‘Total structure of the peptide antibioticcomponents of thiopeptin by ¹H and ¹³C NMR spectroscopy.’TetrahedronLett.1978，3649)。来自Cardiff University的Mark Bagley和同事的近期综述已经扩展了Hensens的分类系统，以描述5个不同的中心杂环结构域：四元取代脱氢哌啶或饱和哌啶、二氢咪唑哌啶、三元取代吡啶和四元取代羟基吡啶(Bagley等‘Thiopeptide antibiotics.’Chem Rev.2005年2月；105(2)：685-714)。

尽管具有大量结构同源性，硫肽抗生素的作用(对蛋白质合成的抑制)位点和方式可分为两个功能类：结合称为L11结合结构域的23S核糖体RNA区域的那些和结合参与延伸循环的Ef-Tu蛋白质复合体的那些。经常认为在1954年首次分离为远青链霉菌(Streptomyces azureus)次生代谢物的硫链丝菌肽是硫肽家族的原型化合物(Donovick等‘Thiostrepton，a newantibiotic.’Antibiot Annu.1955-1956；3：554-9和Bagley等‘硫肽antibiotics.’Chem Rev.2005年2月；105(2)：685-714)。

假定硫肽通过利用称为非核糖体肽合成酶(NRPS)的大的多酶复合体的非核糖体方法合成(Mocek等‘Biosynthesis of the modified peptideantibiotic thiostrepton in Streptomyces azureus and Streptomyceslaurentii’.J.Am.Chem.Soc.1993，115，7992-8001)。NRPS装配大环的实例是由真菌多孢木霉菌(Tolypocladium inflatum)产生的免疫抑制肽环胞菌素。NRPS装配肽不限于通常见于蛋白质的常见的20种L氨基酸。相反，这些酶具有掺入数百种不常见氨基酸及衍生残基的更广泛的所有成分的生物合成能力。

Washington大学的Heinz Floss等人指导的预实验揭示了硫肽的确由非核糖体途径产生。该研究组用抑制核糖体蛋白质合成水平的氯霉素处理培养物。然而，硫肽的从头产生仍然继续。当用于探测来自各生产生物的基因组DNA的Southern印迹时，来自代表硫链丝菌肽或相关诺雪七肽的氨基酸序列的寡核苷酸不能与任何同源序列杂交(T.M.Smith，Y.-F.Jiang，H.G.Floss.′Thiopeptide Antibiotics″in″Biotechnology of Antibiotics″W.R.Strohl，编著，第2版，Marcel-Dekker，New York，1997，第393-413页)。

此外，在生成菌株中已经鉴定了假定编码微球菌素合成酶复合体组件的NRPS基因片段(Carnio等‘Pyridinyl polythiazole class peptideantibiotic micrococcin P1，secreted by foodborne Staphylococcus equorumWS2733，is biosynthesized nonribosomally.’Eur J Biochem.2001年12月；268(24)：6390-401.)。

然而，至今仍未有硫肽生物合成途径的出版说明书。

因此，需要鉴定参与硫肽生物合成的基因，其将为有效的硫肽制备提供工具并为产生可选的硫肽结构提供可能性。本发明满足了该需要并第一次公开了用于硫肽生物合成的染色体编码骨架(backbone)以及参与硫肽生物合成的核心生物合成酶。

1.作为硫肽生物合成起始材料的染色体编码骨架

本发明人确实已经发现了这样的确凿证据，例如在放线菌物种中染色体编码骨架是用于硫肽生物合成的起始材料。

第一方面，本发明涉及包含选自以下的氨基酸序列的硫肽前体蛋白质

(i)SEQ ID NO：1；

(ii)SEQ ID NO：5；

(iii)SEQ ID NO：11；和

(iv)任何所述氨基酸序列的变体。

如本文所用，术语“硫肽”指根据抗生素的Berdy’s化学分类的噻唑肽，与其他噻唑化合物，如博来霉素、杆菌肽、或小菌素B17相反，其特征在于聚集在中心多吡咯结构域中的三元或四元取代氮杂环，其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架的一部分。

术语“硫肽前体蛋白质”指可用作体外或体内硫肽合成起始材料的基因编码多肽骨架。优选地，所述硫肽前体是细菌延伸因子Ef-tu的抑制剂的前体。Ef-tu抑制剂描述于例如Hogg T，Mesters JR和Hilgenfeld R.(‘Inhibitory mechanisms of antibiotics targeting elongation factor Tu.’Curr Protein Pept Sci.2002年2月；3(1)：121-31)的综述中。众所周知的Ef-tu抑制剂的实例是GE2270A(如Selva等‘Antibiotic GE2270A：a novelinhibitor of bacterial protein synthesis.I.Isolation and characterization.’J Antibiot(Tokyo).1991年7月；44(7)：693-701中定义)、GE37648A(如Stella等‘Antibiotic GE37468A：a new inhibitor of bacterial protein synthesis.I.Isolation and characterization.’J Antibiot(Tokyo).1995年8月；48(8)：780-6、Erratum：J Antibiot(Tokyo)1995年12月；48(12)：C-3中定义)和Amythiamicin(如(‘Novel antibiotics，amythiamicins.’J Antibiot(Tokyo).1994年6月；47(6)：668-74，1145-52和1153-9中定义)。新的Ef-tu抑制剂也描述于2007年12月19日提交的国际专利申请号PCT/US07/025955中。此类新Ef-tu抑制剂更特异地包括如下表示的通式I到XI的化合物(包括其可药用盐，以及其对映异构体、立体异构体、旋转异构体、互变异构体、非对映体或外消旋物)：

这种前体蛋白的氨基酸序列对硫肽的最终结构至关重要。如将在下文中详细描述的，本发明的硫肽前体蛋白质可用于再生新鉴定的硫肽的骨架或产生已知硫肽的新衍生物，其例如具有改良性质。

本发明因此不仅涉及SEQ ID NO：1、SEQ ID NO：5或SEQ ID NO：11的前体蛋白，也涉及可用于硫肽衍生物生物合成的任何变体。本领域技术人员将知道怎样根据待合成硫肽的氨基酸骨架设计所述变体。在SEQ IDNO：1中，在14氨基酸骨架中发现的六个半胱氨酸是修饰这些分子的噻唑杂环的前体。此外，两个丝氨酸残基参与吡啶环系在大环和侧链交界处的形成。在GE2270A分子的硫肽侧链中发现了额外的噁唑啉，并在通式(I)到(XI)的新Ef-tu抑制剂中发现了分别通过丝氨酸的杂环化和脱水形成的脱氢丙氨酸残基。

在特定实施方案中，当与原始序列相比时，SEQ ID NO：1、SEQ ID NO5或SEQ ID NO 11的变体具有不超过1、2、3、4、5、6或10个缺失、插入或取代的氨基酸。取代的氨基酸可以是具有等同功能团或不同功能团的天然氨基酸或非天然氨基酸。

下表1给出了可用于相应特定硫肽生物合成的硫肽前体蛋白质序列(SEQ ID NO：1-14)的指示。

表1.硫肽氨基酸骨架的一级序列比对。所述比对集中在形成标记多取代氮杂环的两个不变丝氨酸分子结合的大环周围。硫链丝菌肽具有4个氨基酸的额外氨基延伸。

在本申请中使用以下标准密码字母用于描述任何氨基酸、肽和蛋白质序列：A，丙氨酸；R，精氨酸；N，天冬酰胺；D，天冬氨酸；C，半胱氨酸；Q，谷氨酰胺；E，谷氨酸；G，甘氨酸；H，组氨酸；I，异亮氨酸；L，亮氨酸；K，赖氨酸；M，甲硫氨酸；F，苯丙氨酸；P，脯氨酸；S，丝氨酸；T，苏氨酸；W，色氨酸；Y，酪氨酸；V，缬氨酸。

更普遍地，在一个特定实施方案中，氨基酸序列SEQ ID NO：1的所述变体具有以下通式：SXNCXCXXCCSCSX，其中X可以是任何氨基酸。更优选地，SEQ ID NO：1的所述变体包含以下通式：SX₁NC X₂CX₃X₄CCSCSX₅，其中X₁是C或S，X₂是V或F，X₃是G或Y，X₄是a F，P、I或V并且X₅是P或S。此类变体的实例是SEQ ID NO：2-4的前体蛋白。

在另一特定实施方案中，氨基酸序列SEQ ID NO：5的所述变体包含以下通式：SC X₁ X₂ X₃C X₄C X₅ X₆X₇X₈，其中X₁是T或V，优选T，X₂是T或G，优选T，X₃是C或S，优选C，X₄是任何氨基酸，优选V、I、E或A，X₅是任何氨基酸，优选T、C、V或A，X₆和X₇独立地是C或S，优选C，X₈是C或S，并且X₉是任何非氨基酸残基，或T或S。此类变体的实例是SEQ ID NO：6-10的前体蛋白。

在另一特定实施方案中，氨基酸序列SEQ ID NO：11的所述变体包含以下通式：SC X₁ X₂S X₃ X₄ X₅ X₆SSSSSS，其中X₁是T或V，优选T，X₂是T或G，优选T，X₃是S、G或A，X₄是V、C或A，X₅是S、T或A，X₆是C或S。此类变体的实例是SEQ ID NO：12-14的前体蛋白。

2.编码硫肽前体蛋白质的基因的核酸

本发明还提供编码硫肽前体蛋白质的基因和/或可读框的核酸。更具体是，本发明提供包含编码如上所定义的硫肽前体蛋白质的核苷酸序列的核酸。

“核酸”指核糖核苷(腺苷、鸟苷、尿苷或胞苷；“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷；“DNA分子”)的磷酸酯多聚体形式，或其任何磷酸酯类似物，如单链形式或双链螺旋的硫代磷酸酯类和硫代酸酯类。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋(helices)是可能的。术语核酸，具体而言DNA或RNA分子仅指分子的一级和二级结构，并不限于任何特定三级形式。因此，该术语包括尤其是见于线性(例如限制性片段)或环形DNA分子、质粒和染色体中的双链DNA。

“重组DNA分子”是已经进行分子生物学操作的DNA分子。

“多核苷酸”或“核苷酸序列”是核酸，如DNA和RNA中的一系列核苷酸碱基(也称作“核苷酸”)，并表示两个或更多个核苷酸的任何链。核苷酸序列通常携带遗传信息，包括用于产生蛋白质和酶的细胞装置的信息。这些术语包括双链或单链基因组和cDNA、RNA、任何合成的和遗传处理的多核苷酸，以及正义和反义多核苷酸(尽管此处仅表示了正义链)。这包括单链和双链分子，即DNA-DNA、DNA-RNA和RNA-RNA杂合体。这也包括含有修饰碱基，例如硫代尿嘧啶、硫代鸟嘌呤和氟代尿嘧啶的核酸。

本文中核酸的侧翼可以是天然调节(表达控制)序列，或可以与包括启动子、其他核糖体结合位点序列、调节响应元件、信号序列等的异源序列连接。也可通过本领域已知的任何手段修饰所述核酸。此类修饰的非限制性实例包括甲基化、“帽子”、类似物对一个或多个天然核苷酸的取代和核苷酸间修饰，如具有不带电连接(例如甲基化磷酸酯类、磷酸三酯类、氨基磷酸盐类、氨基甲酸酯类等)和带电连接(例如硫代磷酸酯类、二硫代磷酸酯类等)的那些。

术语“基因”，也称为“结构基因”表示编码或对应于包含一个或多个蛋白质所有或部分的氨基酸特定序列的DNA序列，并可以包括或可以不包括调节DNA序列，如启动子序列，其决定例如基因表达的条件。非结构基因的一些基因可以从DNA转录成RNA，但不翻译成氨基酸序列。其他基因可以作为结构基因的调节物或DNA转录的调节物起作用。

“编码序列”或“编码”表达产物如RNA、多肽、蛋白质或酶的序列，是当表达时产生所述RNA、多肽、蛋白质或酶的核苷酸序列，即所述核苷酸序列编码所述多肽、蛋白质或酶的氨基酸序列。蛋白质的编码序列可包括起始密码子(一般是ATG或GTG)和终止密码子。

当RNA聚合酶转录所述编码序列成为RNA，尤其是mRNA，并翻译成所述编码序列编码的蛋白质时，编码序列在细胞中处于表达控制序列的“控制下”或“有效连接”表达控制序列。

术语“异源的”指非天然元件的组合。例如，异源DNA指非天然定位于细胞，或所述细胞的染色体位点中的DNA。优选地，所述异源DNA包括对细胞外源的基因。例如，本发明包括包含DNA序列和非DNA序列部分的异源DNA序列的嵌合DNA分子。在该上下文中，所述异源DNA序列指非天然定位于硫肽生物合成基因簇序列中的DNA序列。或者，所述异源DNA序列可以天然定位于其非天然位置处的生物合成基因簇中。异源表达调节元件是与不同基因而非自然界中有效连接的基因有效连接的元件。在本发明的上下文中，编码目的蛋白质的基因对所述基因插入其中用于克隆或表达的载体DNA是异源的，并且其对含有所述基因在其中表达的该载体的宿主细胞是异源的。

术语“表达控制序列”指组合以调节编码序列转录的启动子、任何增强子元件或抑制元件(例如复制起始区)。术语“表达”表示允许或引起基因或DNA序列中的信息表现出来，例如通过激活参与相应基因或DNA序列转录和翻译的细胞功能来产生蛋白质。在细胞中或由细胞表达DNA序列以形成“表达产物”如蛋白质。表达产物本身，例如所得蛋白质也可称作由细胞“表达”。表达产物的特征可以是细胞内的、细胞外的或分泌的。术语“细胞内的”表示在细胞内的某些东西。术语“细胞外的”表示细胞外的某些东西。如果物质从细胞上或细胞内到细胞外以显著量出现，那么其由细胞“分泌”。

术语“转化”表示“外源”(即外部的或细胞外的)基因、DNA或RNA序列引入细胞中，使得宿主细胞表达所述引入基因或序列，以产生期望物质，通常是所述引入基因或序列编码的蛋白质或酶。所述引入基因或序列也可称作“克隆”或“外源”基因或序列，可包括调节或控制序列，如起始序列、终止序列、启动子序列、信号序列、分泌序列或细胞遗传装置使用的其他序列。所述基因或序列可包括非功能序列或功能未知的序列。接受并表达引入DNA或RNA的宿主细胞已经被“转化”并且是“转化体”或“克隆”。引入宿主细胞的DNA或RNA可以来自任何来源，包括与宿主细胞相同的属或种的细胞，或不同属或种的细胞。

本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了小的结构基因，其编码SEQ ID NO：1和SEQ ID NO：3的整个肽骨架。前体前蛋白原的预测大小分别是57和49个氨基酸，并分别描述于SEQID NO：19和SEQ ID NO：20中。然而，存在表明可选翻译起始位点的许多起始密码子。所述14氨基酸硫肽前体序列位于C末端。

已经从如实施例4中所示的远青链霉菌ETH28555物种中鉴定了不相关的硫肽硫链丝菌肽的相似结构基因，并且其编码SEQ ID NO：6的整个肽骨架。硫链丝菌肽的前体前蛋白原的预测大小是60个氨基酸并描述于SEQID NO：65中。

在一个实施方案中，本发明的所述核酸包含编码SEQ ID NO：1的14氨基酸硫肽前体的SEQ ID NO：15的核苷酸序列。在另一实施方案中，本发明的所述核酸包含编码SEQ ID NO：3的14氨基酸硫肽前体的SEQ IDNO：16的核苷酸序列。本发明还包括编码SEQ ID NO：1、SEQ ID NO：5和SEQ ID NO：11的硫肽前体及其任何变体(如表1描述的那些前体变体)的任何核苷酸序列。此类核苷酸序列的实例描述于SEQ ID NO：17和18或SEQ ID NO：65中，分别编码SEQ ID NO：1和SEQ ID NO：3和SEQ IDNO：6的硫肽前体蛋白质。

以来自SEQ ID NO：15-18的探针或引物开始从已知硫肽产生菌中分离并鉴定本发明此类核苷酸序列的方法为本领域所熟知，并且该方法的一个实例示于实施例4中。例如，可使用编码14氨基酸前体蛋白质的区域侧翼的引物扩增硫肽产生菌株的基因组DNA，并从本文公开的SEQ ID NO：17或SEQ ID NO：18进行测定。

在另一实施方案中，本发明的所述核酸包含分别编码57个氨基酸或49个氨基酸的前蛋白原的SEQ ID NO：17或SEQ ID NO：18的核苷酸序列，或包含至少SEQ ID NO：15或SEQ ID NO：16的其任何片段。

还包括的是所述核酸的修饰。此类修饰包括，例如本领域已知的标记、甲基化和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加所选表达系统中的表达、产量和/或提高纯化，或用于另一期望目的。

在另一实施方案中，本发明的核酸有效连接异源转录和翻译控制序列。更优选，其为表达载体。

如本文使用，术语“表达载体”指载体，通过所述载体可以将核酸引入宿主细胞，导致引入序列的表达。在一个实施方案中，载体包含启动子和一个或多个控制元件(例如增强子元件)，其对引入的核酸是异源的，但被宿主细胞识别和使用。在另一实施方案中，引入载体的序列保留由宿主细胞识别并表达的其天然启动子。在一个实施方案中，与本发明相容的载体是穿梭载体pSET152、pOJ436、pOJ446(Bierman等‘Plasmid cloningvectors for the conjugal transfer of DNA from Escherichia coli toStreptomyces spp.’Gene.1992年7月1日；116(1)：43-9)、pHM11a(Motamedi等‘Integrative vectors for heterologous gene expression inStreptomyces spp.’Gene.1995年7月4日；160(1)：25-31)和pIJ8600(Sun等‘Green fluorescent protein as a reporter for spatial and temporal geneexpression in Streptomyces coelicolor A3(2).’Microbiology.1999年9月；145(Pt 9)：2221-7)及其衍生物。在另一实施方案中，所述载体是粘粒。

“启动子”或“启动子序列”是在细胞中能够结合RNA聚合酶并起始下游(3′方向)编码序列转录的DNA调节区域。为定义本发明的目的，所述启动子序列在其3′末端结合转录起始位点，并向上游(5′方向)延伸以包括起始高于背景的可检测水平的转录必需的最小数量的碱基或元件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1作图方便地进行定义)，以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。所述启动子可有效连接其他表达控制序列，包括增强子和阻抑物序列。

载体的常见类型是“质粒”，其一般是双链DNA(其可以是环形)的自携分子，通常是细菌来源，其可容易地接受额外的(外源的)DNA并且可容易地被引入合适的宿主细胞中。质粒载体经常含有编码DNA和启动子DNA，并具有适合于插入外源DNA的一个或多个限制性位点。重组克隆载体将经常包括用于克隆或表达的一个或多个复制系统、用于在宿主中选择的一个或多个标记，例如抗生素抗性，以及一个或多个表达盒。

可使用本领域内的常规分子生物学和重组DNA技术产生载体构建体。在文献中详细解释了此类技术。参阅例如Sambrook，Fritsch&Maniatis，Molecular Cloning：A Laboratory Manual，第二版(1989)Cold SpringHarbor Laboratory Press，Cold Spring Harbor，N.Y.(本文为″Sambrook等，1989″)；DNA Cloning：A Practical Approach，第I和II卷(D.N.Glover编著1985)；F.M.Ausubel等(编著)，Current Protocols in Molecular Biology，John Wiley&Sons，Inc.(1994)。或者，可使用建构生物学公司如CodonDevices(Cambridge，MA，USA；http://www.codondevices.com/)或Blue Heron Biotechnology(Bothwell，WA，USA；http://www.blueheronbio.com/)的DNA合成技术部分地或完全地合成载体构建体。

3.用于从硫肽前体产生核心大环的核心生物合成酶

来自两种不同硫肽产生菌株的两个硫肽生物合成基因簇的表征允许本发明人鉴定两种菌株中的高度保守基因，因此提示这些基因编码核心硫肽分子从硫肽前体进行合成需要的酶。图2和图3显示了从两种不同硫肽产生菌株表征的生物合成基因簇的可读框(ORF)的位置。

另一方面，本发明涉及用于硫肽生物合成的多肽，其包含选自以下的氨基酸序列：

(i)SEQ ID NO：23-34的任一个；和

(ii)(i)中列出的氨基酸序列的变体，当与(i)中列出的相应的野生型氨基酸序列相比时，其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸。

这些多肽可在体外或体内用于进行一个或多个反应步骤，所述反应步骤使用硫肽前体蛋白质作为硫肽分子合成的起始材料。变体多肽可保留与野生型相应序列基本上相同的催化活性，或具有提高的或改善的催化活性。仅为便于阅读，在下文中将这些多肽称作“核心生物合成酶”。

下表2描述了可用于硫肽生物合成的核心生物合成酶(SEQ IDNO：23-34)的实例及其在生物合成途径中的可能功能。所述可能功能进一步描述于下文实施例5.1和5.2中。

表2：用于从硫肽前体蛋白质开始生物合成硫肽的核心酶的实例

4.编码核心生物合成酶的基因

本发明进一步提供编码核心生物合成酶的基因和/或可读框的核酸。更特别地，本发明提供包含编码如上定义的任何一种核心生物合成酶的核苷酸序列的核酸。

本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了结构基因，其可能编码相应的Ef-tu抑制剂进行生物合成的必需酶。

在一个实施方案中，编码用于Ef-tu抑制剂生物合成的酶的所述核酸包含选自如表2中所述SEQ ID NO：62的基因组片段的ORF9、ORF10、ORF11、ORF12、ORF13和ORF15的核酸。在另一实施方案中，所述本发明核酸包含选自如表2中所述SEQ ID NO：63的基因组片段的ORF6、ORF7、ORF8、ORF9、ORF10和ORF11。在表2中也报道了相应的基因组片段(从5’到3’)中各基因的ORF(可读框)的核苷酸位置(坐标)。

从已知的硫肽产生菌株并使用来自SEQ ID NO：35-46的探针或引物分离并鉴定本发明这类核苷酸序列的方法为本领域所熟知。例如，可使用编码各基因保守区的区域侧翼的引物扩增硫肽产生菌株的基因组DNA，并从公开的核苷酸序列进行测定。

也包括的是所述核酸的修饰。此类修饰包括，例如，本领域已知的标记、甲基化，和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加在所选表达系统中的表达、产量，和/或提高纯化，或用于另一期望目的。

在一个实施方案中，本发明的核酸有效连接异源转录和翻译控制序列。更优选地，其为适合于在宿主细胞中表达全部或部分核心生物合成酶的表达载体。

5.硫肽前体蛋白质及相应硫肽的产生

染色体编码骨架的测定以及因此本发明人进行硫肽生物合成的核糖体途径允许本领域的一名普通技术人员在一个实施方案中克隆并表达硫肽生物合成途径，即生物合成基因簇，并因此在修饰的宿主细胞或异源生物中产生硫肽化合物。本发明还允许产生待在异源宿主细胞，即另一菌株而非天然产生菌株中表达的硫肽前体。尽管如本文所述，实施例说明了细菌菌株的用途，可使用任何生物或表达系统。生物的选择取决于技术人员的需要。例如，可使用易于遗传操作的菌株，以利于硫肽化合物的修饰和产生。

因此，另一方面，本发明涉及包含如上所述编码硫肽前体蛋白质和/或核心生物合成酶的一个或多个核酸的宿主细胞，其中所述核酸并非天然发现于所述宿主细胞的基因组中和/或所述宿主细胞并不天然产生相应的硫肽。

或者，可能通过提供包含适当量的如上所述硫肽前体蛋白质的培养基，并在所述培养基中培养微生物来完成硫肽或硫肽衍生物的制备，其中所述微生物还包含硫肽生物合成需要的其他基因，例如编码核心生物合成酶的基因。

如本文使用，术语“宿主细胞”或“微生物”表示以任何方式选择、修饰、转化、培养或使用或操作用于通过细胞产生硫肽前体或硫肽及其衍生物的任何生物的任何细胞。例如，宿主细胞可以是进行处理以表达特定基因、DNA或RNA序列、蛋白质或酶的一个细胞。宿主细胞可进一步用于筛选或下文所述的其他测定。可在体外或非人动物(例如转基因动物或瞬时转染动物)中一个或多个细胞中培养宿主细胞。

宿主细胞或微生物本身可选自任何生物体，包括原核(例如细菌)细胞、植物细胞，和真核细胞，所述真核细胞包括昆虫细胞、酵母细胞和哺乳动物细胞。适当宿主细胞的代表性实例包括细菌细胞，如大肠杆菌(E.coli)、链霉菌(Streptomyces)和枯草芽孢杆菌(Bacillus subtilis)细胞；真菌细胞，如酵母细胞，如毕赤酵母(Pichia)或酿酒酵母(Saccharomyces)细胞，丝状真菌如木霉(Trichoderma)或曲霉细胞(Aspergillus)；和昆虫细胞如果蝇(Drosophila)S2和Spodoptera Sf9细胞。优选地，所述宿主细胞选自已知合成硫肽衍生物或被描述对所述硫肽具有抗性的宿主细胞，如Streptomyces ramocissimus和天蓝色链霉菌(Streptomyces coelicolor)(Olsthoorn-Tieleman等‘Elongation factor Tu3(EF-Tu3)from thekirromycin producer Streptomyces ramocissimus is resistant to threeclasses of EF-Tu-specific inhibitors.’J Bacteriol.2007年5月；189(9)：3581-90.)。在一些实施方案中，所述宿主细胞选自针对硫肽提供抗性的菌株。为菌株提供抗性的方法为本领域所熟知[Kieser T，Bibb MJ，Buttner MJ，Chater KF，Hopwood D.Practical Streptomyces Genetics.John Innes Foundation，Norwich(2000)]并且在下文实施例中给出了该方法的实例。

在制备方法的一些实施方案中，所述宿主细胞还包含硫肽生物合成需要的其他基因。生物合成需要的其他基因可包括例如编码如上述核心生物合成酶的一个或多个基因。所述宿主细胞例如选自野野村氏菌属物种(Nonomuraea ap.)、游动双孢菌属物种(Planobispora sp.)、拟无枝酸菌属物种(Amycolatopsi sp.)和链霉素属物种(Streptomyces sp.)。本文包括的特定宿主细胞包括，但不限于链孢囊菌亚目(Streptosporangineae)链孢子囊菌(actinomycete)的生物，包括诺卡(氏)土壤菌科(Nocardiopsaceae)、链孢囊菌科(Streptosporangiaceae)和高温单孢菌科(Thermomonosporaceae)，其优选种包括Acrocarpospora、马杜拉放线菌属(Actinomadura)、Herbidospora、小双孢菌属(Microbispora)、小四孢菌属(Microtetraspora)、诺卡(氏)土壤菌属(Nocardiopsis)、野野村氏菌((Nonomuria sic，由Chiba等(1999)校正为野野村氏菌)Zhenshui Zhang，Yue Wang和Jisheng Ruan在the International Journal of SystematicBacteriology(1998)，48，411-422)中报道的重新分类属)、游动双孢菌属(Planobispora)、游动单孢菌属(Planomonospora)、Planopolyspora、Planotetraspora或链孢囊菌属(Streptosporangium)。更普遍的是，所述术语旨在包括含有产生硫肽化合物必需的遗传信息的所有生物。该宿主细胞的实例包括在2006年11月30日保藏的野野村氏菌微生物菌株Bp3714-39，保藏号为第德意志微生物保藏中心DSM 18831号。

用于蛋白质如本发明硫肽前体蛋白质的合适产生技术为本领域技术人员所熟知。参阅例如Sambrook等，Molecular Cloning：A LaboratoryManual，Cold Spring Harbor Press(Cold Spring Harbor，N.Y.)。可使用多种技术容易地产生本文提供的任何氨基酸序列的序列。这些和其他合适的产生方法为本领域技术人员所知。

一方面，通过在所选宿主细胞中表达一个或多个ORF或基因产生本发明的氨基酸序列。本发明因此涉及用于产生硫肽前体蛋白质的方法，所述方法包括步骤：在适合于产生所述硫肽前体蛋白质的条件下培养能够表达编码如上述硫肽前体蛋白质的核酸，和任选地，编码核心生物合成酶的一个或多个核酸的宿主细胞。在该方法中，所述宿主细胞并非所述硫肽前体蛋白质的天然产生菌株，或当所述宿主细胞是所述硫肽前体蛋白质的天然产生菌株时，编码硫肽前体蛋白质的所述核酸是重组核酸或异源核酸。根据所用的宿主细胞，可通过所述宿主细胞从硫肽前体完成硫肽化合物生物合成。为此目的，本领域的技术人员可以使用天然合成硫肽前体蛋白质进行翻译后修饰需要的酶的宿主细胞，或在产生菌株中引入硫肽生物合成进行翻译后修饰需要的所述基因。在一个特定实施方案中，上文定义的方法还包括分离基本上纯形式的所述硫肽前体或硫肽化合物。

在一个特定实施方案中，本发明涉及本发明宿主细胞用于产生硫肽化合物的用途，所述硫肽化合物选自：GE2270A、GE37648A、Amythiamicin和如上述通式I到XI中表示的新Ef-tu抑制剂、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins、nocathiacins、伯尔尼霉素、A10255B和radamycin。

一方面，本发明提供产生硫肽衍生物的方法，其包括

i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体序列，在宿主细胞中合成改变的硫肽前体，

ii)从所述改变的硫肽前体合成所述硫肽衍生物；和/或

iii)通过一种或更多种核心生物合成酶修饰所述改变的硫肽前体。

如本文使用，“改变的硫肽前体”是非天然发现于产生所述硫肽前体的菌株，即产生菌中的硫肽前体。

用于合成改变的硫肽前体的方法进一步描述于下文中。优选地，所述改变的硫肽衍生物前体是如上所述的SEQ ID NO：1、SEQ ID NO：5或SEQID NO：11的变体。步骤ii)在体外，即宿主细胞外；或在与步骤i)相同的宿主细胞中体内进行。在与步骤i)相同的宿主细胞中，通过所述宿主细胞天然地或从重组DNA合成一种或更多种核心生物合成酶。

在产生硫肽衍生物的方法中，使用例如旋转振荡器或搅拌釜发酵罐在有氧条件下温育接种本发明宿主细胞的培养基。在温育过程中通过向接种的培养基注射空气、氧气或适当的气体混合物完成通气。一旦已经积累足够量的硫肽衍生物，就以常规且平常的方式，例如通过萃取和层析方法、沉淀或结晶、和/或本文公开的方式从培养物中浓缩并分离它们。作为萃取的实例，培养物可与合适的有机溶剂如正丁醇、乙酸乙酯、环己烷、正己烷、甲苯、乙酸正丁酯或4-甲基-2-亚硝酸异戊酯混和并搅拌，可在减压情况下通过去除溶剂回收有机层中的硫肽衍生物。可任选地用例如水、乙醇、甲醇或其混合物重新溶解所得残余，并用合适的有机溶剂如己烷、四氯化碳、氯乙烯、二氯甲烷或其混合物重新萃取。去除溶剂后，例如通过层析方法进一步纯化化合物。作为层析的实例，可应用固定相如硅胶或氧化铝，并具有有机洗脱溶剂或其混合物，包括醚、酮、酯、卤代烃或卤代醇；或应用反相层析，其基于具有多种功能基团的修饰的硅胶，并用有机溶剂或其水性混合物，像乙睛、甲醇或不同pH的四氢呋喃洗脱。另一实例是例如固体-液体或液体-液体模式的分配层析。也可应用例如使用SephadexLH-20(Sigma-Aldrich)并用不同溶剂，优选用醇洗脱的分子排阻层析。

因为在本领域比较常见，可通过多种分析方法，包括生物测定、TLC、HPLC或其组合并应用不同检测方法(对TLC通常用UV灯、碘吸入剂或喷雾显色试剂，对HPLC通常用UV灯、质量灵敏的或光散射方法)监测产生以及回收和纯化过程。例如，通过使用具有功能化硅胶的反相柱并应用特定pH下极性水可混和溶剂和水的线性梯度混合物的洗脱剂，和利用不同波长UV灯和质量灵敏监测器的检测方法表示HPLC技术。

所得纯化的化合物不含细胞和细胞物质、副产物、试剂和其他外来物质，必要时允许处理并配制化合物用于实验室和/或临床目的。优选用于本发明的化合物的纯度具有以重量计高于80％的纯度；更优选地以重量计至少90％，甚至更优选以重量计高于95％；甚至更优选以重量计至少99％。在一个实施方案中，本发明提供含有本发明化合物的组合物，不管产生多少化合物。

宿主细胞生物合成的化合物可任选地进行随机和/或定向化学修饰，以形成是衍生物或结构类似物的化合物。可使用本领域已知的方法和本文描述的方法任选地修饰所述化合物。

6.能够产生硫肽前体蛋白质用于硫肽衍生物产生的突变体微生物

根据本发明的教导，现在可以遗传处理能够产生硫肽前体蛋白质的微生物，例如目的在于提高硫肽产生或调整硫肽结构。因此，在其他方面，本发明提供突变体微生物，其中所述突变体微生物在编码硫肽前体蛋白质的基因中和/或在编码核心生物合成酶的一个或多个基因中具有突变。所述突变可以是单个或多个核苷酸缺失、插入或取代。其也可以是编码所述硫肽前体蛋白质的基因片段或完整基因的缺失。优选地，所述突变体微生物与相应的野生型微生物相比时，不再表达编码本发明硫肽前体蛋白质的基因。优选地，为了避免极化影响，所述突变是编码所述硫肽前体蛋白质的基因内的框内缺失。

所述突变体生物是例如链孢囊菌亚目链孢子囊菌的生物，包括诺卡(氏)土壤菌科、链孢囊菌科和高温单孢菌科，其优选种包括Acrocarpospora、马杜拉放线菌属、Herbidospora、小双孢菌属、小四孢菌属、诺卡(氏)土壤菌属、野野村氏菌((Nonomuria sic，由Chiba等(1999)校正为野野村氏菌)Zhenshui Zhang，Yue Wang和Jisheng Ruan在the International Journal ofSystematic Bacteriology(1998)，48，411-422)中报道的重新分类属)、游动双孢菌属、游动单孢菌属、Planopolyspora、Planotetraspora或链孢囊菌属。

在特定实施方案中，所述突变体微生物是野野村氏菌属物种，例如野野村氏菌微生物菌株Bp3714-39，其于2006年11月30日保藏，保藏号为DSM 18831，并且所述突变是包含SEQ ID NO：15或SEQ ID NO：16的基因的破坏，例如包含SEQ ID NO：17或SEQ ID NO：18的基因的突变。

在另一特定实施方案中，可以用编码如上述任何硫肽前体蛋白质的核酸进一步转化本发明的突变体微生物。该方法允许提供能够从任何硫肽前体蛋白质，包括如上述SEQ ID NO：1、SEQ ID NO5或SEQ ID NO：11的变体生物合成硫肽的微生物。在另一实施方案中，所述突变体微生物还天然或重组表达至少一个或多个编码核心生物合成酶的基因，例如编码选自SEQ ID NO：23-34的多肽的一个或多个基因。在一个实施方案中，所述突变体微生物天然或重组表达至少编码SEQ ID NO：23-28的多肽的基因。在另一实施方案中，所述突变体微生物天然或重组表达至少编码SEQ IDNO：35-46的多肽的基因。

7.筛选产生新硫肽化合物的新菌株

本发明人鉴定的基因可进一步用作鉴定能够产生硫肽衍生物的其他微生物的工具。例如，本发明涉及允许鉴定具有与(i)SEQ ID NO：17或SEQID NO：18的基因并更优选SEQ ID NO：15或SEQ ID NO：16的片段，或(ii)SEQ ID NO：35-46任一个中定义的核心基因基本类似的基因的细胞的任意方法。

在特定实施方案中，如通过序列比较算法，如BLAST、FASTA、DNAStrider等测定，当至少约80％，并最优选至少约90％或95％的核苷酸在DNA序列的确定长度内匹配时，则两条DNA序列“基本同源”或“基本类似”。该序列的实例是本发明特定基因的等位基因或物种变体。通过使用可从序列数据库中获得的标准软件比较，或在例如为特定系统规定的严格条件下的Southern杂交实验中鉴定基本同源的序列。

在核酸序列的上下文中，术语“序列同一性”“序列同一性百分比”或“相同性百分比”指当比对最大相似性时两条序列中的相同残基。序列同一性比较的长度可以在基因组全长范围内，期望在基因编码序列的全长或至少约500到5000个核苷酸的片段范围内。然而，也期望例如至少约9个核苷酸，一般至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36或更多个核苷酸的更小片段的同一性。类似地，可容易地测定蛋白质全长或其片段范围内的氨基酸序列的“百分之序列同一性”。适当时，片段长度为至少约8个氨基酸，更优选至少约14个氨基酸，并可高达约700个氨基酸。合适片段的实例如下文所述。

在一个实施方案中，鉴定能够产生硫肽衍生物的方法包括以下步骤：

(i)将来自分离细胞的基因组DNA或RNA与SEQ ID NO：15或SEQ IDNO：16或其特异片段的核酸探针温育，用于探针与同源DNA区域的特异杂交；并

(ii)鉴定包含与步骤(i)的所述探针特异性杂交的基因组DNA区域或RNA的细胞。

当单链形式的核酸分子可以与其他核酸分子在温度和溶液离子强度的适当条件下退火时，核酸分子与另一核酸分子如cDNA、基因组DNA或RNA“特异性杂交”(参阅Sambrook等，Molecular Cloning：A LaboratoryManual，第二版(1989)Cold Spring Harbor Laboratory Press，Cold SpringHarbor，N.Y.(本文为″Sambrook等，1989″)。温度和离子强度的状况决定杂交的“严格性”。为了对同源核酸进行初筛，可使用对应Tm(解链温度)55℃的低严格杂交条件，例如5×SSC、0.1％SDS、0.25％奶，并且没有甲酰胺；或30％甲酰胺、5×SSC、0.5％SDS)。中等严格的杂交条件对应于更高的Tm，例如40％甲酰胺、5×或6×SCC。高严格杂交条件对应于最高的Tm，例如50％甲酰胺、5×或6×SCC。SCC是0.15M NaCl、0.015M柠檬酸钠。杂交需要两条核酸包含互补序列，尽管根据杂交的严格性，两个碱基之间的错配是可能的。用于杂交核酸的适当严格性取决于本领域熟知的变量：核酸的长度和互补的程度。两条核苷酸序列之间的相似性或同源性的程度越高，具有这些序列的核酸的杂交的Tm值越大。核酸杂交的相对稳定性(对应于更高的Tm)以以下顺序降低：RNA:RNA、DNA:RNA、DNA:DNA。对于长度大于100个核苷酸的杂合体，衍生了用于计算Tm的方程式(参阅Sambrook等，上文，9.50-9.51)。对于更短核酸，即寡核苷酸的杂交，错配的位置变得更重要，并且寡核苷酸的长度决定了它的特异性(参阅Sambrook等，上文，11.7-11.8)。杂交核酸的最小长度是至少约10个核苷酸；优选至少约15个核苷酸；并更优选所述长度是至少约20个核苷酸。

在特定实施方案中，使用标准的杂交条件。术语“标准杂交条件”指55℃的Tm，并利用如上文阐明的条件。在优选实施方案中，所述Tm是60℃；在更优选的实施方案中，所述Tm是65℃。在特定实施方案中，使用“高严格条件”。

用于寡核苷酸(例如寡核苷酸探针或引物)的合适的杂交条件通常与全长核酸(例如全长cDNA)多少有些不同，因为寡核苷酸具有更低的解链温度。因为寡核苷酸的解链温度将取决于所涉及的寡核苷酸序列的长度，所以合适的杂交温度将根据所用的寡核苷酸分子不同而不同。示例性温度可以是37℃(对于14碱基的寡核苷酸)、48℃(对于17碱基寡核苷酸)、55℃(对于20碱基的寡核苷酸)和60℃(对于23碱基的寡核苷酸)。用于寡核苷酸的示例性合适的杂交条件包括在6×SSC/0.05％磷酸钠中洗涤，或提供等同程度杂交的其他条件。

在本方法的一个优选实施方案中，设计对编码硫肽前体的基因特异的寡核苷酸并用于鉴定能够产生硫肽化合物的新细胞。此类寡核苷酸可用于编码硫肽前体蛋白质的基因片段的PCR扩增。优选地，筛选更低等的真核细胞，并更优选来自放线菌类的细胞。

8.编码硫肽前体蛋白质的基因的遗传操作和用于筛选新硫肽衍生物的用途

在另一实施方案中，本发明提供修饰编码硫肽前体蛋白质的基因和/或可读框的一个或多个核苷酸序列的方法。例如，此类修饰或改变可用于在所选表达系统中提高表达或产生新硫肽衍生物的目的。可进行其他改变以消减、修饰或增强硫肽化合物的功能，包括提高抗生素功能或减少非期望的性质。

一方面，从修饰编码硫肽前体蛋白质的核酸序列完成改变的硫肽前体的合成。在一个实施方案中，改变的核酸序列在所选宿主细胞中可通过合适的载体向如上述异源宿主细胞提供，并用于表达相应产物。或者，可直接在产生硫肽的菌株携带的天然基因中例如通过所述菌株的遗传操作进行所述改变。

本发明包括改变编码本发明前体蛋白的任何核酸序列的任何方法。更具体地是，本发明包括在本发明蛋白质中插入氨基酸、缺失氨基酸或取代氨基酸的任何方法。可在核酸水平上进行修饰。通过标准技术进行这些修饰并为本领域所熟知。

因此，本发明提供方法，以产生编码硫肽衍生物的前体的核酸，所述方法包括步骤：对各核酸，通过在所述序列(其编码SEQ ID NO：1-14中任意序列)的至少一个密码子中进行核苷酸取代，产生具有改变核苷酸序列的多个核酸。此类核酸文库可有利地用于筛选新的硫肽衍生物，例如具有改善性质的Ef-tu抑制剂。

改变的核酸或核酸文库然后可用于转化宿主细胞用于如上所述的硫肽产生。

优选，核酸文库的各核酸具有单个核苷酸取代，使得与野生型相应序列相比时，编码SEQ ID NO：1-14任意序列的仅一个密码子突变。产生位点定向诱变或核酸文库的方法为本领域所熟知并例如描述于Biotechniques出版的Hogrefe等的文章中(‘Creating randomized aminoacid libraries with the QuikChange Multi Site-Directed Mutagenesis Kit.’2002年11月；33(5)：1158-60，1162，1164-5)。

在一个特定实施方案中，所述核苷酸取代在编码SEQ ID NO：1-4任意序列的位置2、5、7、8、14的氨基酸残基的一个或多个密码子中进行。

优选地，宿主细胞能够合成硫肽化合物，即还包含硫肽生物合成所需的其他基因。例如，硫肽生物合成所需的其他基因可包含编码选自SEQ IDNO：23-34的多肽的一个或多个基因。更优选地，改变的核酸与表达载体一起进行转化，因此转化后从所述表达载体合成相应的硫肽前体蛋白质。所得表达文库可用作筛选新硫肽衍生物，例如新Ef-tu抑制剂的工具。

9.特定生物合成基因的克隆

当对来自产生不同硫肽化合物的两菌株的生物合成基因簇进行表征时，本发明人鉴定了很可能参与硫肽生物合成但却是菌株特异性的ORF。因此提出这些基因很可能编码特定多肽，主要是参与核心硫肽结构的基因调节和酶促修饰的酶和转录调节物，以产生最终的菌株特异性硫肽化合物。

表3和表4描述了本发明这些特定多肽的核酸和相应的多肽序列。

表3：用于从菌I生物合成硫肽的特定多肽的实例

表4：用于从菌株II生物合成硫肽的特定多肽的实例

在一个实施方案中，在表3或4中列出的一个或多个多肽用于如上定义通式(I)到(XI)的化合物的体外或体内合成。

本发明也涉及表3或4中报道的此类酶的任何功能变体，其保留基本上相同的酶促活性。本发明也涉及表3或4中报道的任何转录调节物的任何功能变体，其保留基本上相同的转录活性。在一个实施方案中，此类多肽与上表列出的原始多肽相比时含有不少于1、2、3、4或5个缺失、插入或取代的氨基酸。在另一实施方案中，此类功能变体与上文列出的一个多肽具有至少80或90％的同一性。

这些序列可用于使得能够产生缺少特定步骤的突变体菌株，例如以避免产生非期望副产物。在一个实施方案中，本发明涉及能够产生在上表中列出一个或多个特定基因的表达中有缺陷的硫肽的突变体菌株。在一个特定实施方案中，所述突变体菌株在ORF2-II或ORF3-II(分别是SEQ IDNO：58和SEQ ID NO：59)或ORF4-I(SEQ ID NO：50)编码基因的表达中有缺陷。

如本文所用，“缺陷表达”表示与野生型菌株相比时，突变体菌株不再表达对应的多肽，或如在用于定量mRNA表达的常规方法中测定，与野生型菌株稳定状态mRNA相比时，所述相应多肽具有超过50％或超过90％减少的稳定状态mRNA量。例如，基因被阻断，或部分或完全缺失，使得不再合成功能性蛋白质。

这些序列可进一步用于与编码前体蛋白的基因和编码核心酶的基因组合，以改造能够产生特异硫肽衍生物的宿主细胞。在一个实施方案中，本发明涉及含有如表2、3和4中所述重组可读框ORF1-II到ORF12-II，或具有相应野生型序列的至少80％或至少90％同一性的其功能变体，并能够产生EF-Tu抑制剂的宿主细胞。在另一实施方案中，本发明涉及含有表2、3和4中所述重组ORF1-I到ORF18-I，或与相应野生型序列具有至少80％或至少90％同一性的其功能变体，并能够产生EF-Tu抑制剂的宿主细胞。

在另一实施方案中，分离的特定酶可单独使用或在例如使用硫肽前体蛋白质作为起始材料的体外方法，例如用于产生硫肽的方法，例如用于产生E-FTu抑制剂的方法的化学反应步骤中组合作为催化剂使用。

附图简述

图1.硫肽结构基因。可能的起始位点为粗体。14个氨基酸的骨架下面为下划线。

图2.来自硫肽产生菌株I的生物合成基因簇。箭头代表假设的启动子。空心箭头代表可读框：黑色实心箭头表示系列I结构基因，灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。HindIII和EcoRI是基因簇侧翼的唯一限制性位点。

图3.来自硫肽产生菌株II(菌株Bp3714-39)的生物合成基因簇。箭头代表假设的分散的启动子。空心箭头代表可读框：黑色实心箭头表示系列II结构基因，灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。基因簇的侧翼是PstI限制性位点。

实施例

还通过特定实施例来描述本发明。然而，此类实施例的使用仅在于说明而绝不在于限制本发明或任何示例性术语的范围和意义。

1.在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因

使用PCR方法来分离编码硫肽骨架的染色体序列。从来自中国湖北省的产生硫肽的野野村氏菌菌株中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuick DNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过将摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接到片段化的DNA上来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫肽大环设计的简并引物(CFGCVCNC：5’-CARAAICCRCAIACRCARTTRCA)来扩增硫肽结构基因。在寡核苷酸中包括肌苷以降低简并性。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物，循环条件如下：95℃15分钟；94℃30秒，55℃30秒，及72℃1分钟，30个循环；以及72℃10分钟。衔接头上的3’氨基修饰阻断延伸并防止由衔接头引物进行的衔接头与衔接头的扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。

在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因(图1)的实验成功进行。该前体蛋白质的预测大小为57个氨基酸。然而，存在许多可能表示可选翻译起始位点的起始密码子。14个氨基酸的硫肽序列位于C末端并确定了合成方向。硫肽骨架的一级氨基酸序列以整合到吡啶环的丝氨酸开始并环绕大环以逆时针方向继续并以侧链末端的最后一个氨基酸结束。公共数据库中的同源性搜索揭示没有亲缘关系近的同系物。

2.编码硫肽前体蛋白质的基因的遗传破坏

自杀载体pSET152-Hind可在大肠杆菌中复制，赋予阿泊拉霉素抗性并携带允许从大肠杆菌向放线菌种进行属间(intergeneric)结合的转移起点(oriT)。pSET152-Hind为广谱宿主性载体pSET152的衍生载体。通过去除HindIII片段从pSET152上删除允许位点特异性整合(int)的基因。可用插入失活或缺失两种方法中的一种来破坏编码硫肽前体蛋白质的基因。第一种方法需要将不具有起始密码子或终止密码子的基因内部片段克隆至pSET152-Hind中。随后可通过细胞接合作用将该质粒导入硫肽产生菌株中。利用阿泊拉霉素选择将鉴定具有插入硫肽结构基因中的载体骨架的突变体。此类事件将抑制转录和翻译并阻止产生硫肽。第二种方法需要将突变体等位基因构建到pSET152-HindIII中并随后转移至产生菌株内。突变体等位基因将包含结构基因的上游和下游序列，但具有优选在框内缺失的可读框。可由赋予对如潮霉素或硫链丝菌肽的抗生素抗性的基因标记/取代该缺失。在结合到产生菌株中，质粒抗生素标记的选择将选择在染色体中具有野生型和突变体等位基因的菌株。在上游或下游序列中质粒和染色体之间的同源重组会导致部分二倍体。载体抗生素标记丢失的选择及后续的PCR筛选缺失或对标记突变体等位基因的抗生素选择将鉴定期望的第二次重组事件，该事件将去除野生型等位基因并保留结构基因的缺失等位基因。

或者，现今DNA合成技术的进展允许DNA大片段的合成组装，并且此类服务是可通过商业途径获得的。通过从头化学合成可重新改造硫肽基因簇，用于在替代宿主中进行异源表达和硫肽产生。此类宿主如天蓝色链霉菌(Streptomyces coelicolor)或变铅青链霉菌(Streptomyces lividans)将具有良好建立的遗传工具并肯定对硫肽具有抗性或针对硫肽提供抗性。通过在含高于硫肽最小抑制浓度的硫肽浓度的琼脂平板上按10¹⁰至10¹¹细胞/孢子量铺板来分离抗性菌株。可通过在选择性平板上的菌落生长来鉴定在赋予抗性的群体中预先存在的稀有自发突变体。可通过将细胞暴露于化学诱变剂来提高突变率的频率。硫肽基因簇的化学合成允许引入更优调控元件、基因缺失、去除或引入限制性位点及改变密码子选择。克隆到整合穿梭载体pOJ436或游离穿梭载体pOJ446上的基因簇的功能性合成拷贝将具有引入到结构基因的限制性位点以允许产生框内缺失。

此外，通过在表达噬菌体衍生蛋白质对、或来自Rac原噬菌体的RecE/RecT或来自λ噬菌体的Redα/Redβ的大肠杆菌菌株中进行同源重组来精确地处理硫肽基因簇的克隆拷贝或合成版本。该技术称为Red/ETRecombineering或λ介导的重组(Muyrers，J.P.P.，Zhang，Y.，Stewart，A.F.ET cloning：Think recombination first.Genetic Engineering，Principlesand Methods(J.K.Setlow编著)，22，77-98 Kluwer Academic/PlenumPublishers，NY.(2000))。

3.异源表达结构基因以产生可选硫肽结构

天然产生菌株或表达硫肽核心和特定生物合成基因但在前体结构基因中具有框内缺失的异源宿主是有用的工具菌株。这些工具菌株可用于产生具有可选结构的硫肽。

结构基因的位点定向诱变可用于向硫肽中取代或引入新氨基酸。通过结合或转化将在pHM11a或pSET152中克隆的结构基因的突变版本重新引入表达硫肽生物合成酶的工具菌株中。

或者，可产生编码硫肽骨架每一位置上可选氨基酸的文库。可通过基因合成或简并PCR来化学产生该变体文库。PCR方法需要硫肽结构基因的扩增以在硫肽编码骨架中掺入变异并在如pHM11a或pSET152的质粒中掺入用于克隆及表达的限制性酶切位点。PCR引物中的一条引物将是简并的，用于掺入所有氨基酸取代。可改变简并度以允许在骨架的所选位置上进行取代，即不在编码认为是不变量氨基酸上进行取代，如不在形成硫肽大环的噻唑的半胱氨酸的位置上进行取代。两条引物都将标记限制性酶切位点以允许将PCR产物直接克隆至表达载体中。将所有大肠杆菌转化体混合并分离DNA来产生变体文库。文库将转化到工具菌株中并且生物测定可用于鉴定携带支持产生具有可选结构的活性硫肽的结构基因的克隆。

4.编码硫链丝菌肽骨架多肽的基因的分离

使用PCR方法来分离编码硫链丝菌肽骨架的染色体序列。从硫链丝菌肽产生菌远青链霉菌ETH28555中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuick DNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接片段化DNA来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫链丝菌肽大环设计的简并引物(CTTCICTC：5’-CAC GTG CAGATR CAN GTN GTR CA-3’)来从该文库中扩增硫链丝菌肽结构基因。根据CODEHOP原则设计具有5’非简并性夹板结构(consensus clamp)和3’简并核心的简并引物(Rose等CODEHOP(COnsensus-DEgenerate Hybrid Oligonucleotide Primer)PCR primer design.Nucleic Acids Res.2003年7月1日；31(13)：3763-6)。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物，循环条件如下：95℃ 15分钟；94℃ 30秒，55℃ 30秒，及72℃ 1分钟，40个循环；以及72℃ 10分钟。衔接头上的3’氨基修饰阻断了延伸并防止由衔接头引物进行的衔接头与衔接头扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。该策略在鉴定编码硫链丝菌肽大环的基因组片段中证明是成功的。随后使用基因特异引物向上游和下游步移来鉴定全长硫链丝菌肽结构基因。

5.来自硫肽产生菌株I和II的生物合成基因簇

5.1菌株I

图2描述了来自包含用于硫肽合成的生物合成基因簇的菌株I基因组DNA的一个分离的BAC(SEQ ID NO：62)中可读框的位置。

在不受任何优选模型约束的情况下，以下途径定义了各个多肽的推测功能，所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。

系列I的合成方案：

(A)ORF9、ORF10、ORF11、ORF12、ORF13和ORF14编码很可能形成复合体的核心生物合成酶，所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。

(B)ORF2和ORF3编码很可能参与将修饰掺入尾部的酶。丝氨酸残基的环化脱水作用产生噁唑啉环。由于尾部脯氨酸的存在，尾部额外丝氨酸脱水成脱氢丙氨酸可能需要单独步骤，该步骤很可能在肽中引起出现构象纽接。ORF18可能参与了去除末端序列而留下酰胺基。

(C)ORF4、ORF6、ORF7、ORF16和ORF17编码很可能参与特定修饰的酶。ORF4：苯丙氨酸的羟化。ORF5：天冬酰胺的甲基化。ORF7：噻唑的甲基化。ORF16和ORF17：向噻唑添加甲氧乙基。

5.2菌株II

图3描述了来自包含用于硫肽合成的生物合成基因簇的菌株II基因组DNA的一个分离的BAC(SEQ ID NO：63)中ORF的位置。

系列II的合成方案：

(A)ORF6、ORF7、ORF8、ORF9、ORF10和ORF11编码很可能形成复合体的核心生物合成酶，所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。

(B)ORF12编码切割末端丙氨酸的肽酶。

(C)ORF1、ORF2和ORF3编码了可能参与特定修饰的酶。噻唑的ORF1甲基化及ORF2和ORF3参与苯丙氨酸和异亮氨酸的羟基化。异亮氨酸羟基化两次并分解产生环氧化物。

6.硫肽衍生物的产生

培养基组分

(a)种子培养基

(b)生产培养基A

(c)痕量溶液

将如实施例3所述宿主细胞的冰冻悬液(1.5mL)接种至含有500mL种子培养基的两升无挡板摇瓶。该摇瓶30℃下在摇床中以200转/分钟和50mm振幅温育3天。通过按每瓶40mL将第一阶段的种子接种至每个含有500mL种子培养基的8个两升无挡板摇瓶中进行第二个种子阶段。该摇瓶在30℃的摇床中以200转/分钟和50mm振幅温育2天。通过按每瓶4升将第二阶段的种子接种至每个含有100升种子培养基的2个150升规模的搅拌釜发酵罐中进行第三个种子阶段。按以下参数操作150升规模的发酵罐3天：温度＝30℃、搅拌＝80转/分钟、空气流动＝25slpm及压力＝0.5bar。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制pH值。

用200升来自第三个种子阶段的种子接种含有3500升生产培养基A的5500升规模的搅拌釜发酵罐。5500升规模的发酵罐操作参数如下：温度＝30℃、空气流动＝1050slpm及压力＝0.5bar。搅拌控制在60转/分钟并在44小时之后增加到80转/分钟。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制pH值。温育5天后收集含3500升发酵液的发酵罐。

7.硫肽衍生物的分离

通过在搅拌槽中加入乙酸乙酯过夜收集并提取发酵液。在提取过程中将混合物流经连续

反应器(Jahnke&Kunkel，德国)用于最大剪力(sheer force)及最佳混和。在连续Westfalia分离器SA20(WestfaliaSeparator AG，Oelde，德国)上分离两相后，通过减压下的蒸发来浓缩乙酸乙酯相。蒸发过程中形成经过滤分离的沉淀。

将根据如上描述的方法从培养液的提取物中获得的沉淀溶解于比例为95∶5的二噁烷/水中并过滤去除不可溶成分。在减压及硅藻(diatome)8(

International Sorbent Technology Ltd.，Hengoed Mid Glam，UK)存在的情况下浓缩滤液。将所获的粉末应用到在比例为90∶10∶0.5的二氯甲烷/甲醇/乙酸溶液中制备的硅胶层析柱(例如0.040-0.063mm，柱子大小为5x25cm)上。用比例为90∶10∶0.5的二氯甲烷/甲醇/乙酸溶液以35mL/分钟的流速洗脱柱子。收集30mL经HPLC分析的级分。向含化合物I的混和级分中加入20mL异丙醇并在减压条件下浓缩直至化合物从残留的异丙醇中沉淀出来。通过离心从沉淀中分离出溶剂后，在减压条件下干燥残留物，产生半纯化的硫肽衍生物。

序列表

<110>诺瓦提斯公司

<120>硫肽前体蛋白质、编码该蛋白质的基因及其用途

<130>I315

<160>65

<170>PatentIn版本3.2

<210>1

<211>14

<212>PRT

<213>野野村氏菌属物种(Nonomuraea Sp.)

<400>1

Ser Cys Asn Cys Val Cys Gly Phe Cys Cys Ser Cys Ser Pro

1 5 10

<210>2

<211>14

<212>PRT

<213>野野村氏菌属物种

<400>2

Ser Ser Asn Cys Phe Cys Tyr Pro Cys Cys Ser Cys Ser Ser

1 5 10

<210>3

<211>14

<212>PRT

<213>野野村氏菌属物种

<400>3

Ser Cys Asn Cys Phe Cys Tyr Ile Cys Cys Ser Cys Ser Ser

1 5 10

<210>4

<211>14

<212>PRT

<213>野野村氏菌属物种

<400>4

Ser Cys Asn Cys Val Cys Gly Val Cys Cys Ser Cys Ser Pro

1 5 10

<210>5

<211>13

<212>PRT

<213>野野村氏菌属物种

<400>5

Ser Cys Thr Thr Cys Val Cys Thr Cys Ser Cys Cys Thr

1 5 10

<210>6

<211>17

<212>PRT

<213>野野村氏菌属物种

<400>6

Ile Ala Ser Ala Ser Cys Thr Thr Cys Ile Cys Thr Cys Ser Cys Ser

1 5 10 15

Ser

<210>7

<211>12

<212>PRT

<213>野野村氏菌属物种

<400>7

Ser Cys Thr Thr Cys Glu Cys Cys Cys Ser Cys Ser

1 5 10

<210>8

<211>13

<212>PRT

<213>野野村氏菌属物种

<400>8

Ser Cys Thr Thr Cys Val Cys Val Cys Ser Cys Cys Thr

1 5 10

<210>9

<211>13

<212>PRT

<213>野野村氏菌属物种

<400>9

Ser Cys Val Gly Ser Ala Cys Ala Ser Ser Ser Ser Ser

1 5 10

<210>10

<211>12

<212>PRT

<213>野野村氏菌属物种

<220>

<221>misc_feature

<222>(6)..(6)

<223>Xaa可以是任意天然氨基酸

<220>

<221>misc_feature

<222>(8)..(8)

<223>Xaa可以是任意天然氨基酸

<400>10

Ser Cys Thr Thr Cys Xaa Cys Xaa Cys Ser Cys Ser

1 5 10

<210>11

<211>15

<212>PRT

<213>野野村氏菌属物种

<400>11

Ser Cys Thr Thr Ser Ser Val Ser Ser Ser Ser Ser Ser Ser Ser

1 5 10 15

<210>12

<211>16

<212>PRT

<213>野野村氏菌属物种

<400>12

Ser Cys Thr Thr Ser Gly Cys Thr Ser Ser Ser Ser Ser Ser Ser Ser

1 5 10 15

<210>13

<211>17

<212>PRT

<213>野野村氏菌属物种

<400>13

Ser Cys Thr Thr Ser Gly Ser Ala Cys Ser Ser Ser Ser Ser Ser Ser

1 5 10 15

Ser

<210>14

<211>15

<212>PRT

<213>野野村氏菌属物种

<400>14

Ser Cys Val Gly Ser Ala Cys Ala Cys Ser Ser Ser Ser Ser Ser

1 5 10 15

<210>15

<211>42

<212>DNA

<213>野野村氏菌属物种

<400>15

tcctgcaact gcgtgtgcgg cttctgctgc tcctgcagcc cg 42

<210>16

<211>42

<212>DNA

<213>野野村氏菌属物种

<400>16

tcgtgtaact gcttctgcta catctgctgc tcctgctcga gc 42

<210>17

<211>174

<212>DNA

<213>野野村氏菌属物种

<400>17

atgagcgagc tggaatccaa gctgaacctt agcgacctgc ccatggacgt cttcgagatg 60

gccgacagcg gcatggaggt cgaatccctc accgcaggcc acgggatgcc cgaggtaggc 120

gcttcctgca actgcgtgtg cggcttctgc tgctcctgca gcccgtccgc gtag 174

<210>18

<211>150

<212>DNA

<213>野野村氏菌属物种

<400>18

atggacctca gcgatctgcc catggacgtc ttcgaactcg ccgatgacgg tgttgcggtc 60

gagtccctta ctgctggtca cggcatgacc gaagtgggag cttcgtgtaa ctgcttctgc 120

tacatctgct gctcctgctc gagcgcctga 150

<210>19

<211>57

<212>PRT

<213>野野村氏菌属物种

<400>19

Met Ser Glu Leu Glu Ser Lys Leu Asn Leu Ser Asp Leu Pro Met Asp

1 5 10 15

Val Phe Glu Met Ala Asp Ser Gly Met Glu Val Glu Ser Leu Thr Ala

20 25 30

Gly His Gly Met Pro Glu Val Gly Ala Ser Cys Asn Cys Val Cys Gly

35 40 45

Phe Cys Cys Ser Cys Ser Pro Ser Ala

50 55

<210>20

<211>49

<212>PRT

<213>野野村氏菌属物种

<400>20

Met Asp Leu Ser Asp Leu Pro Met Asp Val Phe Glu Leu Ala Asp Asp

1 5 10 15

Gly Val Ala Val Glu Ser Leu Thr Ala Gly His Gly Met Thr Glu Val

20 25 30

Gly Ala Ser Cys Asn Cys Phe Cys Tyr Ile Cys Cys Ser Cys Ser Ser

35 40 45

Ala

<210>21

<211>414

<212>PRT

<213>野野村氏菌属物种

<400>21

Met Pro Thr Thr Leu Pro Lys Thr Leu Arg Gly Ser Asp Gly Ala Leu

1 5 10 15

Ala Glu Gln Pro Leu Leu Ile Tyr Val Asn Val Pro Phe Cys Asn Ser

20 25 30

Lys Cys His Phe Cys Asp Trp Val Thr Glu Val Pro Leu Ala Asp Leu

35 40 45

Arg Leu Thr Pro Asp Ser Ser Pro Arg Arg Arg Tyr Val Ala Ala Leu

50 55 60

Val Lys Gln Ile Glu Thr His Ala Pro Thr Leu Gly Gly Leu Gly Tyr

65 70 75 80

Arg Pro Glu Val Met Tyr Trp Gly Gly Gly Thr Ala Ser Ile Leu Thr

85 90 95

Ile Glu Glu Ile Glu Ala Val Ala Gly Ala Leu Ala Ala Arg Phe Asp

100 105 110

Leu Gly Gly Leu Val Glu Ala Thr Ile Glu Gly Ser Pro Glu Ser Met

115 120 125

Asp Pro Gly Lys Leu Lys Leu Phe Arg Ala Ile Gly Phe Asn Arg Ile

130 135 140

Ser Ile Gly Val Gln Ala Phe Asp Asp Ala Arg Leu Arg Arg Ile Gly

145 150 155 160

Arg Val His Ser Ala Glu Gln Ala Glu Arg Ala Val Arg Met Ala Ala

165 170 175

Asp Ala Gly Phe Asp Asn Ile Asn Ile Asp Leu Ile Val Gly Phe Pro

180 185 190

Gly Gln Gly Ala Asp Glu Val Ser Arg Thr Ile Gln His Ala Val Thr

195 200 205

Leu Pro Val Asn His Phe Ser Val Tyr Pro Tyr Arg Pro Thr Gly Gly

210 215 220

Thr Val Met Arg Arg Gln Val Gly Arg Gly Met Gly Arg Ile Asp Val

225 230 235 240

Glu Glu Gln Leu Arg Ser Tyr Asp His Ala Arg Asp Leu Leu Ala Arg

245 250 255

His Gly Phe Glu Glu Tyr Ala Thr Ala Tyr Phe Gly Ala Pro Arg Cys

260 265 270

Glu Ser Asp Glu Val Tyr Tyr Lys Leu Thr Met Asp Trp Ile Gly Phe

275 280 285

Gly Ser Gly Ala Asn Ser Leu Ile Gly Thr Arg Phe Leu Leu Asn Asp

290 295 300

Arg Gly Gly Leu His Arg Phe Ser Thr Ala Pro His Arg Phe Asp Ser

305 310 315 320

Asp Thr Pro Ala Ser Ala Pro His Leu Thr Arg His Phe Leu Ala Gln

325 330 335

Ala Leu Thr Thr Val Asp Gly Met Asp Ala Arg Thr Phe Gln Leu Arg

340 345 350

Thr Gly Arg Ser Leu Arg Ala Ala Cys Glu Glu Pro Ala Val Arg Arg

355 360 365

Met Leu Glu Gln Ile Asn Arg Arg Gly Arg Leu Ile Val Asp Ser Arg

370 375 380

Gly Ile Arg Leu His Arg Asp Asp Met Ala Ser Ala Tyr Ile Thr Met

385 390 395 400

Asn Ser Val Asp Leu Tyr Ala Ala Thr Glu Gln Pro Gly Gly

405 410

<210>22

<211>1242

<212>DNA

<213>野野村氏菌属物种

<400>22

atgccgacca cactcccgaa gaccctgcgc gggtcggacg gcgcgctcgc cgagcagccg 60

ctgctcatct acgtgaatgt gccgttctgc aactcaaaat gtcacttctg cgactgggtg 120

accgaggttc cgctggcgga tctgcggctc acgccggact cgtcgccacg ccgccgctac 180

gtcgccgcgc tggtcaagca gatcgagacg cacgcgccga cgctgggcgg actcggctac 240

cggcccgagg tcatgtactg gggcggcggc acggccagca tcctcaccat cgaggagatc 300

gaggcggtgg ctggggcgct ggcggcgcgg ttcgacctcg gcggcctggt cgaggccacc 360

atcgagggca gcccggagtc catggacccc ggcaagctga agctgttccg tgcgatcggg 420

ttcaaccgga tcagcatcgg ggtgcaggcg ttcgacgacg cgcgcctgcg ccgcatcggc 480

cgggtgcaca gcgccgagca ggcggagcgc gcggtccgga tggccgccga cgccggcttc 540

gacaacatca acatcgacct catcgtcggg ttccccgggc agggcgccga cgaggtgtcg 600

cgcacgatcc agcacgcggt gacgctgccg gtcaaccact tctcggtcta cccctaccgg 660

ccgaccggcg gcaccgtgat gcgccggcag gtgggccgcg gcatgggccg gatcgacgtg 720

gaggagcagc tccggtcgta cgaccacgcc cgcgacctgc tcgcccggca cgggttcgag 780

gagtacgcca ccgcctactt cggcgctccc cgctgcgagt ccgacgaggt ctactacaag 840

ctcacgatgg actggatcgg gttcggctcc ggggccaact ccctcatcgg gacccgcttc 900

ctgctgaacg accggggcgg gctgcaccgc ttcagcacgg ccccgcaccg cttcgactcc 960

gacaccccgg cctcggcccc ccacctgaca cgccacttcc tggcccaggc gctgaccacg 1020

gtcgacggca tggacgcgcg caccttccag ctgcgcaccg gccgttcgct gcgggcggcg 1080

tgcgaggagc ccgcggtgcg ccggatgctc gaacagatca accgccgcgg caggctgatc 1140

gtcgactcac gcggcatccg gctgcaccgc gacgacatgg cctcggccta catcaccatg 1200

aacagcgtcg atctgtacgc cgcgaccgag cagcccggcg ga 1242

<210>23

<211>827

<212>PRT

<213>野野村氏菌属物种

<400>23

Val Pro Pro Ala Gln Ala Gly Gly Thr Pro Pro Gly Val Arg Arg Gln

1 5 10 15

Ile Met Glu Val Gly Arg Glu Ile Val Val Arg Val Ala Gly Leu Pro

20 25 30

Ala Ala Val Leu Ala Asp Leu Arg Leu Pro His Thr Ala Glu Leu Val

35 40 45

Thr His Leu Ser Ala Glu Arg Arg Arg Leu Ala Ala Glu Ala Ala Ala

50 55 60

Leu Ser Gly Glu Leu Phe Asp Leu Ile Gly Ala Ala Gly Ser Ala Arg

65 70 75 80

Ala Ala Leu Val Gly Leu Arg Arg Ala Leu Ala Pro Gly His Arg Pro

85 90 95

Pro Ser Pro Arg Leu Ile Gly Leu Cys Pro Leu Pro Ala Pro Leu Ala

100 105 110

Glu Arg Val Thr Ala Trp Val Arg Ala Arg Tyr Asp Trp Glu Asp Arg

115 120 125

Arg Arg Asp Leu Ala Gly Thr Leu Asp Lys Glu Arg Ala Asp Ala Leu

130 135 140

Asp Arg Val Arg Ala Ala Cys Val Ala Pro Ala Phe Arg Arg Gly Leu

145 150 155 160

Ala Leu Ser Gly Gly Glu Leu Thr Ser Thr Leu Glu Arg Trp Leu Ala

165 170 175

Asp Pro Gly Arg Ala Pro Arg Gln Gly Lys Val Leu Arg Leu Val Lys

180 185 190

Tyr Leu Thr Arg Ala Ala Ala Lys Thr Ser Pro Tyr Gly Ser Phe Met

195 200 205

Val Ser Ala Leu Ala Gly Arg Pro Gly Asp Asp Pro Pro Ile Pro Glu

210 215 220

Leu Leu Thr Val Ala Glu Pro Pro Gly Ala Phe Leu Asp Ala Val Gly

225 230 235 240

Asp Ala Leu Leu Ala Asp Pro Ala Leu Ala Gly Gln Val Pro Leu Arg

245 250 255

Pro Asn Pro Ser Leu Thr Trp Thr Ala Gln Gly Leu Leu Phe Val Arg

260 265 270

Thr Val Arg Ala Ala Ala Gly Glu Gln Ala Gly Pro Lys Glu Glu Ile

275 280 285

Ala Thr Ala Gly Arg Ala Ala Ala Leu Glu Leu Cys Leu Arg His Ala

290 295 300

Glu Ser Arg Pro Thr Ala Pro Gln Leu Ala Glu Leu Leu Ala Glu Ala

305 310 315 320

Gly Ala Asp Pro Gly Glu Ala Ala Ala Phe Val Asp Arg Leu Val Ala

325 330 335

Ala Gln Leu Leu Leu Pro Cys Pro Pro Val His Asp Asp Asp Pro Asp

340 345 350

Pro Phe Gly Ala Trp Ala Arg Gln Val Cys Ala Pro Glu Leu Arg Glu

355 360 365

Leu Ala Ala Ala Ser Arg Pro Val Ala Ala Ala Val Asp Ser Pro Gly

370 375 380

Gln Arg Arg Ala Arg Ile Ala Glu Ala Ala Ala Ala Val Ala Asp Arg

385 390 395 400

Leu Gly Ile Asp Pro Pro Ala Asp Pro Ala His Glu His Asp Val Ser

405 410 415

Thr Gly Arg Pro Ala Pro Pro Pro Leu Pro Ala Gly Val Leu Ala Asp

420 425 430

Leu Asp Ala Val Arg Arg Trp Leu Ala Val Phe Asp Trp Lys Val Pro

435 440 445

Val Arg Val Gly Val Gly Ala Phe Cys Arg Glu Arg Phe Gly Ser Gly

450 455 460

Ser Arg Thr Pro Phe Leu Glu Ala Cys Arg Ala Ala Thr Ala Ala Leu

465 470 475 480

Pro His Leu Phe Gly Pro Ala Ala Met Pro Trp Phe Leu Asp Leu Thr

485 490 495

Gly Asp Gly Arg Leu Arg Glu Leu Asp Arg Leu Arg Thr Arg Ala Arg

500 505 510

Asp Leu Ala Arg Ser Gly Val Leu Asp Arg Arg Arg Val Leu Ala Asp

515 520 525

Thr Ala Asp Trp Pro Ala Trp Leu Thr Trp Pro Ala Ser Thr Gly Phe

530 535 540

Tyr Leu Gln Thr Leu Pro Gly Gly Val Val Leu Asn Ala Val His Ala

545 550 555 560

Gly His Gly Arg Ala Ala Gly Arg Val His His Leu Leu Ala Arg Ala

565 570 575

Gly Ala Ala Pro Pro Arg Pro Pro Arg Ser Gly Leu Pro Arg Ala Glu

580 585 590

Phe Gly Gly Arg Phe Gly Ser Ala Leu Asn Thr Arg Thr Pro Ser Thr

595 600 605

Arg Tyr Glu Ile Asp His Pro Gly Ala Thr Ser Gly Arg Asp Pro Arg

610 615 620

His Arg Val Pro Leu Gly Thr Leu Met Val Val His Asp Pro Asp Thr

625 630 635 640

Asp Leu Val His Leu His Ser Asp Arg Leu Gly Arg Val Glu Pro Val

645 650 655

His Leu Gly Met Met Gly Glu Leu Gly Leu Pro Ala Val Ala Gly Phe

660 665 670

Leu Glu Arg Ala Phe Ala Pro Thr Tyr Leu Phe His Pro Ser Val Pro

675 680 685

Pro Phe Ile Ser Leu Arg Asp Leu Ala Gly Ala Ser Ser Ala Arg Arg

690 695 700

Phe Pro Arg Val Ser Val Gly Asp Val Val Val Gln Arg Ala Arg Trp

705 710 715 720

Thr Val Pro Ala Gly Leu Val Pro Ala Arg Thr Gly Ala Asp Gly Asp

725 730 735

His Leu Leu Ala Leu Ala Glu Trp Arg Arg Glu His Gly Ile Pro Glu

740 745 750

Arg Cys Phe Val Arg Gly Trp Lys Pro Gly Ala Ala Leu Gly Lys Ala

755 760 765

Arg Lys Pro Leu Tyr Val Asp Phe Ala Ser Trp His Leu Val Ala Leu

770 775 780

Phe Glu Arg Glu Ala Arg Thr Asn Ala Ala Leu Val Ile Asp Glu Ala

785 790 795 800

Leu Pro Asp Pro Leu Ala Asp Gly Ala Pro Ala His Val Thr Glu Tyr

805 810 815

His Val Glu Ile Gly Asp Arg Glu Arg Glu Gln

820 825

<210>24

<211>299

<212>PRT

<213>野野村氏菌属物种

<400>24

Met Thr Glu Arg Pro Gly Trp Phe Ala Ala His Val His Tyr Arg Gly

1 5 10 15

Asp Leu Asp Ala Leu Leu Arg Glu Ala Val Ala Pro Leu Val Arg Ala

20 25 30

Leu Ala Ala Asp Phe Phe Phe Leu Arg Tyr Trp Asp Gly Gly Ser His

35 40 45

Leu Arg Leu Arg Leu Arg Gly Gly Asp Gln Val Ala Val Ala Arg His

50 55 60

Leu Asp Ala Tyr Leu Ala Ala His Pro Ala Pro Glu Thr Thr Ser Gln

65 70 75 80

Glu Glu Tyr Ala Arg Val Ala Pro Val Leu Ala Ala Arg Glu Gly Met

85 90 95

Thr Gly His Leu Thr Thr Leu Arg Pro Asn Asn Thr Val Glu Phe Ala

100 105 110

Ala Tyr Arg Pro Glu Thr Ala Lys Tyr Gly Thr Gly Asp Ala Leu Arg

115 120 125

Ala Val Glu Arg His Phe Val Glu Ser Ser Arg Tyr Ala Leu Asp Val

130 135 140

Leu Asp Arg Arg Pro Thr Gly Asn Gln Arg Glu Leu Ala Val Leu Gly

145 150 155 160

Val Leu Leu Leu Ala Trp Tyr Ala Ala Arg Pro Leu Asp Glu Pro Pro

165 170 175

Gly Glu Pro Val Asp Asp Glu Leu Ile Gly Ala Val Glu Ala Leu Cys

180 185 190

Arg Gly Trp Arg Gly Gly Arg Asp Leu Pro Glu Glu Leu Val Ala Glu

195 200 205

Glu Tyr Gly Arg Val Arg Glu Arg Val Ala Gly Leu Ala Gly Ala Leu

210 215 220

Arg Asp Leu Val Pro Asp Pro Asp Ala Pro Gly Ser Ser Met Arg Ala

225 230 235 240

Trp Ala Ala Thr Phe Asp Arg Leu Ala Ala Ala Leu Pro Pro Pro Asp

245 250 255

Arg Leu Arg Val Leu Asp Thr Cys Ala His Leu Ala Ala Asn Arg Leu

260 265 270

Gly Val Ser Met Ala Ala Glu Val Arg Leu Arg Leu Leu Ala Ala Arg

275 280 285

Ala Leu Arg Glu Val Ala Pro Val Gly Arg Arg

290 295

<210>25

<211>333

<212>PRT

<213>野野村氏菌属物种

<400>25

Met Ser Trp Arg Arg Val Asp Val Ala Tyr His Asp Pro Asp Leu Asp

1 5 10 15

Gly Leu Ile Leu Ala Thr Arg Pro Leu Leu Ala Gly Thr Pro Gly Arg

20 25 30

Gly Trp Phe Gln Arg His Trp Val Arg Gly Pro His Leu Glu Leu Trp

35 40 45

Phe Asp Ala Ala Gln Pro Ser Trp Glu Arg Ile Arg Asp Val Leu Glu

50 55 60

Pro Trp Leu Arg Val Asn Pro Ser Arg Ala Arg Ile Asp Arg Asp Arg

65 70 75 80

Leu Leu Ala Gln His Arg His Leu Ala Ala Ala Glu Arg Ile Asp Glu

85 90 95

Pro Leu Leu Pro Phe Tyr Ala Asp Asn Thr Leu His Arg Ala Ala Pro

100 105 110

Arg Ser Arg Ala His Val Leu Gly Gly Pro Ala Ala Glu Glu Leu Phe

115 120 125

His Asp Phe His Thr Thr Ala Ser Ala Val Ala Tyr Asp Glu Leu Asp

130 135 140

Ala Val Arg Ala Gly Glu Ser Arg Leu Val Met Ala Leu Asp Leu Met

145 150 155 160

Val Ala Ala Ala His Ala His Ala Glu Gly Gly Val Arg Gly Gly Phe

165 170 175

Val Ser Phe Arg Ser His Ala Glu Ala Phe Leu Ala Ser Ala Pro Gly

180 185 190

Leu Arg Glu Arg Trp Asp Ala Glu Tyr Ala Ala Arg Ala Gly Ala Leu

195 200 205

Arg Ala Arg Ile Thr Ala Val Val Ala Gly Ile Pro Arg Gly Arg Ala

210 215 220

Trp Ala Gly Leu Leu Asp Arg Phe Ala Asp Arg Gly Asp Glu Leu Ile

225 230 235 240

Ala Ser Gly Ala Leu Leu Val Glu Pro Ala Gly Pro Asp Ala Val Ala

245 250 255

Arg Pro Asp Thr Ala Phe His Arg Ala Leu Arg Gly Asn Arg Thr Trp

260 265 270

His Glu Glu Val Leu Arg Ser Ala Pro Phe Arg Arg Tyr Arg Leu Leu

275 280 285

Leu Asn Leu Thr Tyr Leu Gln Leu Ser Arg Leu Gly Val Asn Ala Val

290 295 300

Gln Arg Ala Leu Leu Cys His Phe Ala Ala Ser Ala Val Glu Gln Glu

305 310 315 320

Tyr Gly Val Ser Ala Ile Glu Ile Ala Met Gly Gly Ala

325 330

<210>26

<211>455

<212>PRT

<213>野野村氏菌属物种

<400>26

Val Met Ser Val Gln Val Glu Pro Ala Val Thr His Arg Trp Ala Leu

1 5 10 15

Arg Pro Gly Val Tyr Arg Ala Thr Ala Pro Gly Gly Asp Leu Met Leu

20 25 30

Ala Ala Trp Pro His Ala Thr Pro Leu Gly Arg Ala Thr Pro Glu Leu

35 40 45

Leu Ala Leu Leu Asp Gly Leu Ala Ala Gly Ser Leu Pro Leu Asp Glu

50 55 60

Pro Gly Asp Leu Ala Pro Ala Val Glu Leu Leu Arg Ala Gly Gly Trp

65 70 75 80

Leu Arg Lys Thr Val Ala Tyr Ala Gly Arg Asp Leu Tyr Thr Ile Thr

85 90 95

Pro Val Ala Ala Pro Thr Asp Ala Pro Pro Pro Pro Arg Asp Glu Pro

100 105 110

Ala Leu Ser Arg Phe Ala Leu Leu Arg Asn Thr Ala Asp Gly Leu Val

115 120 125

Leu Glu Met Pro Gly Ser Trp Cys Asp Val His Val His Asp Pro Ala

130 135 140

Val Ala Ala Leu Leu Ala Asp Pro Ser Gly Asp Gly Gly Leu Pro Ala

145 150 155 160

Glu Ala Ala Ala Ala Leu Arg Ala Asp Leu Ala Ala Ala Gly Met Leu

165 170 175

Met Glu Arg Glu Glu Pro Phe Glu Arg Arg Gln Trp Ser Thr His Glu

180 185 190

Leu Trp Phe His Glu Arg Ser Arg Leu Gly Asn Arg Gly Trp Phe Gly

195 200 205

Ala His Phe Gly Gly Thr Phe Trp Ala Arg Gly Arg His Asp Pro Pro

210 215 220

Pro Ala Arg Pro Ser Pro Tyr Pro Gly Pro Ala Val Glu Leu Ala Arg

225 230 235 240

Pro Asp Leu Ala Ala Leu Arg Arg Thr Asp Pro Thr Leu Thr Ala Val

245 250 255

Leu Glu Asp Arg Glu Ser Val Arg Asp His Asp Asp Asp Asp Pro Ile

260 265 270

Ser Ala Glu Gln Leu Gly Glu Leu Leu Tyr Arg Cys Ala Arg Val Arg

275 280 285

Leu Leu Arg His Leu Glu Gly Phe Glu Tyr Ala Gly Lys Pro Tyr Pro

290 295 300

Ala Gly Gly Ser Ala Tyr Glu Leu Glu Val Tyr Pro Val Val Arg Leu

305 310 315 320

Ala Arg Gly Leu Asp Pro Gly Met Tyr His Tyr Asp Ala His Asp His

325 330 335

Arg Leu Arg Gln Val Arg Pro Ala Gly His Pro Ala Val Arg Arg Met

340 345 350

Leu Lys Val Ala Thr Glu Ser Ser Val Ala Lys Ala Pro Pro Gln Val

355 360 365

Leu Leu Val Ile Ser Ala Arg Val Gly Arg Ile Leu Trp Lys Tyr Glu

370 375 380

Ala Met Gly Tyr Ala Leu Met Leu Lys His Val Gly Val Leu Gln Gln

385 390 395 400

Thr Leu Tyr Ala Val Ala Thr Ala Met Asp Leu Ala Pro Cys Ala Leu

405 410 415

Gly Ser Gly Asp Asp Leu Ala Phe Thr Ala Ala Thr Gly Arg Asp Arg

420 425 430

Leu Val Glu Cys Ala Val Gly Glu Phe Met Val Gly Ser Arg Arg Lys

435 440 445

Glu Pro Ala Ala Trp Glu Leu

450 455

<210>27

<211>608

<212>PRT

<213>野野村氏菌属物种

<400>27

Met Gly Ala Leu Asn Leu Leu Leu Arg Pro Asp Ala His Tyr Ala Glu

1 5 10 15

Val Asp Gly Gly Val Tyr Val Leu Ser His Gln Gly Glu Thr Phe Ile

20 25 30

Ser Gly Thr Ser Val His Arg Trp Leu Asp Arg Leu Ala Pro Leu Leu

35 40 45

Asp Gly Thr Arg Thr Leu Asp Gln Leu Thr Ala Gly Leu Pro Ala Asp

50 55 60

Arg Ala Gly Phe Val Ala Arg Leu Val Gly Thr Leu Thr Glu Arg Gly

65 70 75 80

Leu Val Arg Glu Val Gly Pro Ala Val Ser Asp Thr Leu Thr Asp Ala

85 90 95

Glu Arg Gly Glu His Arg Ala Leu Leu Ala Tyr Leu Gly Tyr Phe His

100 105 110

Asp Ser Pro Gly Arg Val Leu Glu Asp Val Arg Asp Thr Pro Thr Ala

115 120 125

Ile Val Gly Ser Gly Pro Leu Ala Ala Ala Val Val Arg Ala Cys Ala

130 135 140

Ala Ala Gly Leu Arg Arg Val Glu Ile Gly Glu Glu Ala Gly Ala Ala

145 150 155 160

Arg Val Val Val His Val Ala Glu Arg Ala Glu Pro Glu Arg Ala Ala

165 170 175

Arg Leu Glu Arg Arg Cys Ala Ala Glu Gly Val Leu Leu Ala Gln Val

180 185 190

Met Pro Gly Pro Asp Gly Ile Trp Trp Gln Pro Ala Ala Arg Gly Gly

195 200 205

Cys Trp Ala Ser Ala Trp Arg Arg His Arg Ala Leu Ala Gly Val Asp

210 215 220

Arg Thr Gly Thr Pro Leu Asp Pro Val Ala Val Ala Val Val Ala Gly

225 230 235 240

Gln Val Ala His Asp Val Phe Arg Val Leu Ala Gly Leu Arg Glu Glu

245 250 255

Ala Pro Pro Arg Leu Val Val Leu Asp Pro Arg Thr Leu Ala Ser Thr

260 265 270

Ala His Pro Val Val Ala His Pro Phe Glu Leu Pro Ala Ala Pro Leu

275 280 285

Asp Glu Ala Ala Phe Leu Asp Arg Val Ala Ala Leu Arg Ala Ala Pro

290 295 300

Ala Leu Ser Glu Ala Glu Phe Ser Arg Arg Ala Lys Gly Leu Met Asp

305 310 315 320

Ser Thr Val Gly Leu Phe Ala Glu Ile Asp Glu Gly Asp Leu Ala Gln

325 330 335

Leu Pro Leu His Val Thr Ala Thr Thr Val Ala Asp Pro Cys Gly Leu

340 345 350

Ile Gly Ser Ala Pro Arg Pro Val Val Thr Gly Ala Gly Leu Thr Phe

355 360 365

Glu Glu Ala Arg Tyr Arg Ala Ala Arg Ala Ala Leu Ala Leu Ala Gly

370 375 380

Thr Leu Ala Leu Asp Arg Arg Arg Leu Val Asp Gly Arg Val Trp Ala

385 390 395 400

Tyr Asp Leu Ala Asp Gly Ala Ala Arg Leu Val Pro Ala Asp Glu Val

405 410 415

Phe Ala Ser Thr Ala Gly Gly Ser Thr Ala Gly Val Pro Leu Gly Ala

420 425 430

Ala Ala Ala Tyr Ser Trp Ala Glu Ala Val Ala Glu Gly Leu Val Ala

435 440 445

Gln Ala Ala Ala Leu Thr Leu Ala Gly Ala Gly His Ala Gly Glu Pro

450 455 460

Tyr Gly Arg Ala Asp Leu Ala Gly Ala Pro Ala Tyr Leu Leu Ala Met

465 470 475 480

Val Arg Ala Leu Gly Glu Glu Leu Thr Val His Asp Val Thr Gly Pro

485 490 495

Leu Gly Val Pro Val Val Val Gly Thr Leu Ser Gly Gly Ala Thr Ala

500 505 510

Cys Gly Ala Gly Met Thr Thr Asp Ala Ala Val Thr Ala Cys Leu Arg

515 520 525

Asp Leu Leu Leu Leu Arg Gln Ala Glu Ile Asn Asp Gln Pro Val Tyr

530 535 540

Ala Pro Pro Ser Gly Arg Pro Leu Pro Gly His Leu Arg Gly Asn His

545 550 555 560

Pro Ala Pro Ala Val Pro Gly Thr Asp Ala Asp Arg Leu Ala Ala Arg

565 570 575

Leu Ala Glu Arg Gly His Arg Pro Leu Ala Val Pro Leu Asp His Asp

580 585 590

Gln Ala Val His Ala Val Leu Pro Phe Ala Val Arg Val Val Cys Arg

595 600 605

<210>28

<211>578

<212>PRT

<213>野野村氏菌属物种

<400>28

Met Ile Arg Leu Pro Asp His Gly Glu Leu Ala Val Pro Ile Gly Asp

1 5 10 15

Gly Pro Met Leu Pro Leu Arg Thr Glu Leu Gly Arg Val Val Ile Gly

20 25 30

Pro Leu Glu Arg Pro Gly Val Pro Gly Cys Arg Ala Cys Val Arg Ile

35 40 45

Arg Ala Ala Arg Val Gln Pro Asp Ala Arg Lys Ala Glu Ala Val Arg

50 55 60

Ala Arg His Ala Pro Ala Pro Ser Gln Trp Leu Thr Pro Leu Ala Thr

65 70 75 80

Asp Leu Val Arg Val Leu Val Ala Ser Glu Ser Ala Ala Leu Ala Ala

85 90 95

Asp Thr Asp Pro Arg Thr Ala Gly Ala Val Leu Glu Ile Asp Leu Ala

100 105 110

Thr Leu Glu Ile Thr Arg His Arg Phe Leu Pro Asp Pro Leu Cys Pro

115 120 125

His Cys Gly Gly Leu Pro Pro Asp Gly Pro Ala Glu Leu Thr Leu Arg

130 135 140

Pro Arg Arg Lys Leu Gly Gly Ser Pro Arg Thr Arg Pro Val Glu Leu

145 150 155 160

Asn Ala Leu Leu Glu Thr Tyr Val Asp Gly Arg Val Gly Met Ile Arg

165 170 175

Pro Leu Lys Ser Gly Val Gln Gly Gly Leu Thr Val Ala Ser Ala Met

180 185 190

Leu Pro Ile Arg Ala Gly His Gly Leu Glu Pro Gly Val Gly Arg Thr

195 200 205

Arg Ser Tyr Thr Ala Ser Arg Leu Val Ala Val Leu Glu Ala Leu Glu

210 215 220

Arg Tyr Gly Gly Val Ser Pro Gly Gly Arg Arg Thr Ser Val Thr Ala

225 230 235 240

Ala Tyr Arg Asp Ile Ser Gly His Ala Val His Pro Asp Thr Phe Gly

245 250 255

Thr His Pro Glu Glu Asn Tyr Asp Arg Pro Gly Phe Ala Phe Arg Arg

260 265 270

Phe Thr Glu Asp Thr Val Cys Arg Trp Val Trp Gly Tyr Ser Phe Ala

275 280 285

Lys Ala Gln Pro Val Leu Val Pro Glu Asn Gln Val Tyr Tyr Tyr Ala

290 295 300

Arg Asn Leu Pro Asp Gly Glu Gln Pro Phe Val Phe Glu Val Ser Asn

305 310 315 320

Gly Cys Ala Leu Gly Ser Cys Leu Glu Glu Ala Ile Leu His Gly Leu

325 330 335

Leu Glu Val Val Glu Arg Asp Ala Phe Leu Leu Thr Trp His Ala Arg

340 345 350

Arg Glu Val Pro Val Leu Asn Pro Ala Leu Ala Ser Asp Pro Val Leu

355 360 365

Pro Met Gln Ala Ala Ala Ile Thr Ala Glu Thr Gly His Arg Val Leu

370 375 380

Cys Phe Asp Thr Thr Ala Glu His Gly Ile Pro Ser Val Trp Ala Met

385 390 395 400

Ala Val Asp Val Glu His Arg Ser Asp Arg Pro Ala Thr Ala His Ala

405 410 415

Ala Gly Ala Ala Leu Thr Leu Glu Gln Ala Ala Met Asn Ala Leu Ser

420 425 430

Glu Leu Gly Pro Leu Leu Ala Asp Val Ile Arg Arg Tyr Pro Glu Glu

435 440 445

Arg Glu Arg Ala Glu Ala Met Val Arg Asp Pro Glu Gln Val Ala Thr

450 455 460

Met His Asp His Ser Leu Leu Tyr Ala Val Pro Ala Ala Ala Glu Arg

465 470 475 480

Leu Ser Phe Leu Thr Gly Arg Ala Asp Gly Pro Arg Thr Gly Phe Gly

485 490 495

Ser Ala Arg Phe Thr Gly Asp Asp Leu Thr Ala Asp Leu Arg Ala Met

500 505 510

Ile Asp Ala Val Ile Asp Ala Gly Met Asp Val Val Val Val Asp Gln

515 520 525

Thr Thr Pro Glu His Leu Ala Gly Gly Phe Arg Cys Val Lys Val Leu

530 535 540

Val Pro Gly Ala Leu Pro Met Thr Phe Gly His Gln Tyr Arg Arg Leu

545 550 555 560

Asp Asn Leu Pro Arg Leu Ala Ala Ala Arg Thr Thr Asp Pro His Pro

565 570 575

Phe Pro

<210>29

<211>857

<212>PRT

<213>野野村氏菌属物种

<400>29

Met Ala Val Ile Glu Arg Glu Glu Ser Asp Gly Pro Pro Val Ala Val

1 5 10 15

Arg Thr Cys Gly Val Ala Ala Ala Glu Leu Glu Ser Leu Arg Trp Asp

20 25 30

Glu Ser Tyr Ala Leu Val Thr Arg Leu Leu Ala Glu Thr Ala Arg Val

35 40 45

Ala Ala Asp Gly Arg Arg Leu Ala Val Ala Leu Gly Asp Val Ile Gly

50 55 60

Gly Leu Gly Pro Ser Gly Ser Arg Pro Val Leu Val Gly Leu Arg Arg

65 70 75 80

Ala Leu His Thr Gly Arg Leu Pro Ser Gly Arg Glu Trp Gly Pro Glu

85 90 95

Ala Gly Ala Ala Leu Pro Tyr Gly Leu Arg Gly Glu Val Glu Glu Trp

100 105 110

Val Arg Arg Ala Arg Glu Cys Ala Gly Leu Arg Ala Arg Leu Pro Glu

115 120 125

Val Val Ala Arg Glu Ser Leu Glu Lys Glu Glu Arg Leu Arg Ala Ala

130 135 140

Ala Ala Asp Pro Ala Phe Arg Arg Gly Leu Ala Leu Ala Gly Gly Glu

145 150 155 160

Leu Ala Val Asp Leu Glu Thr Trp Leu Ala Asp Pro Ala Arg Arg Pro

165 170 175

Lys Pro Gln Lys Leu Leu Arg Leu Ala Lys Tyr Leu Val Arg Ala Ala

180 185 190

Val Lys Thr Ser Pro Tyr Ser Thr Phe Thr Ser Thr Gly Arg Ala Val

195 200 205

Trp Gly Gly Gly Glu Arg His Val Glu Arg Val Val Pro Val Leu Glu

210 215 220

Leu Asp Gly Val Gln Thr Phe Ser Asp Asp Arg Val Arg Val Asn Pro

225 230 235 240

Ser Val Thr Val Ala Gly Gly Thr Ala Glu Phe Ile Gly Pro Pro Pro

245 250 255

Gly Glu Ala Leu Val Ser Ile Gly Val Thr Glu Ala Val Ala Ala Cys

260 265 270

Leu Arg Val Ala Glu Gly Gly Glu Trp Val Pro Arg Gly Arg Phe Ala

275 280 285

Glu Ala Leu Gly Ala Glu Pro Ala Ala Val Thr Lys Phe Leu Asp Lys

290 295 300

Leu Leu Ala Val Gly Leu Leu Glu Ala Arg Pro Asp Gly Asp Pro Pro

305 310 315 320

Pro His Leu Leu Asp Gly Ile Arg Arg Thr Glu Arg Ala Thr Asp Pro

325 330 335

Ser Thr Phe Arg His Glu Leu Gly Arg LeuIle Ala Ala Ala Arg Ala

340 345 350

Ala Ala Arg Ala Thr Ala Pro Gly Ala Asp Thr Ala Lys Asn Ala Ala

355 360 365

Pro Ala Gly Arg Ala Thr Arg Gly Asp Gly Gly Ala Asp Ala Glu Arg

370 375 380

Ala Thr Arg Gly Asp Ser Asp Ala Asp Asp Gly Arg Ala Thr Arg Gly

385 390 395 400

Asp Gly Gly Ala Asp Asp Arg Gly Ala Ala Arg Gly Asp Gly Gly Val

405 410 415

Gly Arg Ala Val Val His Glu Val Ala Val Cys Val Glu Pro Val Ala

420 425 430

Arg Leu Asp Pro Ala Arg Trp Arg Gly Gly Leu Ala Asp Leu Asp Val

435 440 445

Val Arg Arg Trp Leu Ala Val Phe Asp Ala Lys His Pro Met Arg Leu

450 455 460

Ala Val Ala Ala Tyr Leu Thr Thr Arg Tyr Gly Pro Asp Pro Ala Val

465 470 475 480

Pro Phe Leu Thr Leu His Arg His Ile Gln Arg Glu Leu Ala Gly Thr

485 490 495

Gly Ala Ala Gly Arg Glu Leu Arg Ala Phe Leu Gly Ser Ser Ala Ala

500 505 510

Trp Thr Gln Pro Leu Gly Thr Ser Ala Leu Pro Arg Ile Arg Glu Leu

515 520 525

Glu Arg Leu Arg Ala Glu Ala Arg Ser Leu Ala Leu Asp Ala Glu Asp

530 535 540

Pro Asp Gly Thr Cys Arg Val Thr Pro Gly Gln Leu Ala Ala Gln Leu

545 550 555 560

Glu Ser Trp Pro Ser Trp Ile Ala Ile Pro Ala Ser Ser Ala Cys Tyr

565 570 575

Val Gln Ala Val Ala Gly Thr Leu Val Leu Asn Val Val His Gly Gly

580 585 590

His Gly Arg Ala Leu Arg Arg Leu Asp His Leu Leu Glu Arg Ala Gly

595 600 605

Gly His Pro Glu Pro Pro Arg Ile Glu Asp Pro Asp Gly Ala Val Tyr

610 615 620

Ala Glu Phe Ser Gly Asp Leu Gly Ser Thr Leu Asn Ala Arg Pro Pro

625 630 635 640

Ser Thr Arg Tyr Glu Ile Asp Tyr Pro His Ser Pro Gly Thr Arg Pro

645 650 655

Pro Asp Leu Arg Leu Pro Leu Thr Asp Leu His Val Thr Leu Cys Pro

660 665 670

Asp Ser Gly Leu Pro Glu Leu Arg Ser Lys Arg Leu Gly Arg Arg Val

675 680 685

Val Pro Leu His Leu Gly Leu Ala Ala Glu Phe Arg Leu Pro Pro Ala

690 695 700

Ala Arg Phe Ile Glu Arg Val Phe Gly Pro Gly Tyr Leu Leu His Pro

705 710 715 720

Ser Ser Pro Pro Leu Val Arg Met Gly Arg Val Pro Ser Glu Val Thr

725 730 735

Arg Tyr Pro Arg Val Glu Ala Gly Arg Val Val Val Gln Arg Arg Arg

740 745 750

Trp Leu Ala Pro Ala Ala Thr Leu Pro Val Arg Ala Lys Gly Glu Gly

755 760 765

Asp Ala Ala Tyr Leu Thr Arg Leu Ile Ala Trp Ala Asp Glu Tyr Gly

770 775 780

Val Pro His Arg Ser Phe Val Arg Ala Trp Pro Glu Gln Thr Gly Asp

785 790 795 800

Lys Gly Gln Asp Lys Ala Arg Lys Pro Leu Phe Leu Asp Leu Ala Asn

805 810 815

Leu Phe Leu Val Lys Asn Phe Glu Arg Gln Ile Arg Gly Cys Ala Phe

820 825 830

Ala Leu Phe Glu Glu Ala Leu Pro Asp Pro Gly Pro Glu Arg Val Thr

835 840 845

Glu Tyr Leu Ile Glu Val Gly Gly Arg

850 855

<210>30

<211>271

<212>PRT

<213>野野村氏菌属物种

<400>30

Met Ser Trp Val Ser Val His Val Phe Ser Gln Gly Pro Leu Asp Asp

1 5 10 15

Met Ile Thr Gly Leu Ala Gly Pro Leu Leu Gly Asp Asp Gly Phe Phe

20 25 30

Leu Arg Tyr Trp Glu Gly Gly Pro Hi s Leu Arg Ile Arg Val Arg Ser

35 40 45

His Pro Ala Glu Gln Val Val Glu Arg Ala Glu Ala Tyr Leu Arg Glu

50 55 60

His Pro Ser Glu Ala Val Ile Asp Pro Glu Glu Tyr Ala Arg Leu Ala

65 70 75 80

Ala Thr Leu Ala Ala Arg Glu Gly Val Pro Gly Tyr Thr Arg Arg Leu

85 90 95

Tyr Pro Asn Asp Ser Ala His Leu Ile Pro Tyr Gln Pro Glu His Asp

100 105 110

Arg Tyr Gly Thr Gly Arg Ser Leu Asp Ala Val Glu Arg His Phe His

115 120 125

Asp Ser Ser Val Ile Ala Leu Gln Leu Ile Gly Ala Gly Leu Gly His

130 135 140

Glu Arg Arg Ser Met Ala Trp Leu Thr Met Leu Leu Val Ala Trp Gln

145 150 155 160

Val Ala Gly Glu Gly Arg Ala Phe Gly Pro Pro Ala Asp Ala Gly Val

165 170 175

Gln Val Pro His Glu Arg Met Ala Ala Leu Val Glu His Ala Arg Ala

180 185 190

Val Thr Gln Glu Pro Ala Pro Ser Glu Pro Arg Gly Val Val Ala Ala

195 200 205

Trp Tyr Ala Ser Ile Ala Arg Leu Val Glu Glu Leu Ala Ala Ala Gly

210 215 220

Phe Asp Ala Ala Arg Thr Gly Ala Thr Val Asp Leu Ala Ala His Leu

225 230 235 240

Leu Ala Asn Arg Leu Gly Ile Arg Val Gln Glu Glu Ala Arg Leu Arg

245 250 255

His Leu Ala Ser Gly Ala Thr Arg Glu Ser Glu Val Gly Val Gly

260 265 270

<210>31

<211>319

<212>PRT

<213>野野村氏菌属物种

<400>31

Met Thr Trp Thr Arg Leu Arg Val Asp Tyr His Asp Gly Pro Met Asp

1 5 10 15

Asp Leu Ile Leu Asp Ala Leu Arg Pro Ala Trp His Glu Ile Arg Gly

20 25 30

Tyr Phe Leu Arg His Trp Val Cys Gly Pro His Leu Arg Ile Phe Val

35 40 45

Asp Gly Asp Ala Thr Pro Ile Val Arg Ala Val Glu Arg His Leu Ala

50 55 60

Ala Cys Pro Ser Ala Gly Thr Thr Asp Pro Gln Ala Leu Leu Pro Leu

65 70 75 80

His Glu Arg Leu Ala Glu Leu Glu Gly Glu Arg Gly Pro Leu Leu Pro

85 90 95

Trp Ala Pro Asp Asn Thr Val Thr Ala Glu Pro Pro Gly Leu Asp Thr

100 105 110

Glu Leu Asp Arg Phe Leu Ala Asp Phe Tyr Ala Asp Thr Thr Glu Ala

115 120 125

Ala Phe Asp Ala Leu Gly Arg Val Arg Ala Gly Thr Pro Leu Pro Gly

130 135 140

Ile Ala Phe Asp Leu Val Val Ala Thr Ala His Asp Leu Ser Glu Gly

145 150 155 160

Gly Leu Pro Thr Ala Arg Thr Ser Leu Arg Ser His Ala Glu Ala Tyr

165 170 175

Leu Ser Arg Leu Pro Gly Gly Val Arg Ala Lys Trp Gln Ala His Tyr

180 185 190

Glu Arg Asn Gln Glu Pro Leu Thr Ala Arg Ile Lys Ala Leu Thr Gly

195 200 205

Ala Gly Glu Pro Gly Ala Trp Leu Arg Thr Ile Arg Ala Thr Arg Asp

210 215 220

Arg Gly Arg Thr Leu Ile Asp Glu Gly Arg Leu Ser Leu Gly Tyr Ala

225 230 235 240

Thr Asp Gly Pro Ser Thr Arg Pro Pro Leu Ala Ala Val Ser Pro Phe

245 250 255

His Arg Asn Leu Glu Thr Asp Glu Arg Trp Leu Ala Leu Lys Asp Thr

260 265 270

Pro Ala Phe Ala Ala Tyr Arg Leu Ala Leu Asn Cys Ala Tyr Leu His

275 280 285

Leu Thr Arg Leu Gly Leu Thr Pro Asp Gln Arg Phe Leu Ile Cys His

290 295 300

Leu Ala Ala Ser Ala Ala Asp Asp Val Tyr Arg Ala Val Ala Ser

305 310 315

<210>32

<211>428

<212>PRT

<213>野野村氏菌属物种

<400>32

Met Thr Gly Glu Arg Tyr Glu Leu Arg Ala Gly Val His Leu Ala Arg

1 5 10 15

Leu Asp Ala Gly Val Arg Leu Phe Ala Trp Pro His Ala Glu Thr Leu

20 25 30

Gly Glu Leu Thr Arg Asp Glu Leu Asp Leu Leu Arg Asp Leu Ala Ala

35 40 45

Gly Pro Arg Thr Ala Gly Gly Pro Leu Val Glu Arg Leu Arg Ala Gly

50 55 60

Gly Trp Leu Lys Ile Thr Ile Thr Arg Asp Gly Val Pro Leu Tyr Thr

65 70 75 80

Leu Ala Pro Leu Arg Pro Pro Pro Pro Arg Pro Ala Val Pro Glu Arg

85 90 95

Pro Val Leu Ser Arg Phe Ala Thr Leu Arg Arg Glu Gly Asp Ala Leu

100 105 110

Val Ala Gly Ser Pro Leu Ala Trp Cys Asp Leu Tyr Val His Asp Pro

115 120 125

Gly Leu Val Gly Asp Val Val Arg Pro Gly Gly Glu Val Leu Ala Asp

130 135 140

Leu Val Trp Ala Gly Leu Ala Val Pro Glu Glu Ala Glu Asp Arg Glu

145 150 155 160

Leu Arg Phe Arg Gln Trp Ala Pro His Glu Leu Glu Phe His Asp Arg

165 170 175

Ser Arg Val Gly His Arg Gly Tyr Leu Gly Asp Gly Phe Gly Gly Thr

180 185 190

Phe Trp Ala Arg Gly Arg Phe Asp Pro Leu Pro Ala Arg Pro Arg Pro

195 200 205

Tyr Pro Gly Arg Ala Ile Glu Leu Pro Thr Pro Asp Leu Asp Glu Leu

210 215 220

Arg Leu Lys Asp Pro Ser Leu Thr Asp Val Leu Glu Gly Arg Arg Ser

225 230 235 240

Val Arg Glu His Asp Asp Glu Arg Pro Ile Thr Leu Asp Leu Leu Gly

245 250 255

Glu Leu Leu Tyr Arg Thr Ala Arg Val Arg Glu Cys Trp Thr Ala Asp

260 265 270

Gly Val Glu Tyr Thr Arg Lys Pro Tyr Pro Ser Gly Gly Ser Val Tyr

275 280 285

Glu Leu Glu Ile Tyr Pro Val Val Arg Asn Val Ala Gly Leu Glu Pro

290 295 300

Gly Met Tyr His Tyr Asp Gly His Asp His Val Leu Arg Pro Val Arg

305 310 315 320

Glu Ala Gly His Pro Ala Val Arg Arg Leu Leu Thr Val Ala Gly His

325 330 335

Gly Ala Ala Thr Gly Arg Arg Pro Gln Val Leu Leu Ala Val Ser Ser

340 345 350

Arg Ala Gly Arg Leu Leu Trp Lys Tyr Glu Gly Met Gly Tyr Ala Leu

355 360 365

Thr Leu Lys His Val Gly Val Leu Tyr Gln Thr Leu Tyr Cys Val Ala

370 375 380

Thr Ala Met Gly Leu Ala Ala Cys Gly Leu Gly Ser Gly Asp Ser Ala

385 390 395 400

Ala Phe Ala Glu Ala Thr Gly Arg Asp Pro Leu Glu Glu Cys Ala Val

405 410 415

Gly Glu Phe Met Ile Gly Thr Ala Glu Ala Pro Arg

420 425

<210>33

<211>630

<212>PRT

<213>野野村氏菌属物种

<400>33

Leu Asn Asp Phe Lys Pro Arg Leu Pro Ala Asp Ile Arg Phe Ala Pro

1 5 10 15

Thr Ser Gly Gly Val Ala Phe Leu Thr Arg Glu Gly Val Val Arg Met

20 25 30

Asn Gly Ala Ser Val His Leu Trp Val Glu Arg Leu Ala Val His Leu

35 40 45

Asp Gly Ser Arg Thr Val Ala Glu Leu Thr Ala Glu Leu Pro Asp Glu

50 55 60

Arg Arg Ala Phe Val Thr Ser Leu Leu Thr Thr Leu Arg Glu Arg Gly

65 70 75 80

Leu Val Glu Asp Ala Gly Glu Arg Gly Val Leu Pro Val Ala Ala Gly

85 90 95

Thr Ala Cys Ser Leu Leu Ala Asp Ala Asp Arg Phe Gly Glu Leu Ala

100 105 110

Pro Ala Leu Ala Asp Ala Leu Arg Arg Leu Gly Leu Glu Val Leu Thr

115 120 125

Glu Pro Ser Gly Gly Ala Leu Val His Val Ala Ala Ala Asp Ala Asp

130 135 140

Gly Leu Ala Ala Ala Gly Arg Leu Asp Arg Leu Ser Ala Glu Arg Gly

145 150 155 160

Leu ProIle Ala His Val Leu Leu Arg Glu Gly Glu Ala Trp Trp Ser

165 170 175

Glu Thr Gly Val Val Gly Arg Asp Val Pro Pro Trp Ala Ala Gly Trp

180 185 190

Arg Arg Leu Ala Ala Met Glu Ala Val Pro Arg Thr Ala Gly His Val

195 200 205

Ser Val Ser Pro Val Ala Ala Ala Val Val Ala Gly Gln Val Val Ala

210 215 220

Asp Leu Gly Arg Cys Leu Ser Gly Thr Pro Arg Val Ser Gly Gly Pro

225 230 235 240

Arg Leu His Val Val Asp Leu Asp Gly Phe Gly Met Arg Thr His Ser

245 250 255

Phe Leu Pro His Leu Ser Ala Leu Pro Pro Gly Thr Gly Val Ser Ala

260 265 270

Gly Pro Leu Gly Glu Glu Glu Phe Ser Arg Arg Ala Ala Arg Leu Met

275 280 285

Asp Ser Arg Thr Gly Val Phe Ala Glu Ile Glu Glu Gly Glu Tyr Gly

290 295 300

Gln Leu Pro Leu His Val Ser Val Thr Thr Val Ala Asp Pro Met Gly

305 310 315 320

Ala Leu Gly Gly Ala Leu Ala Arg Val Ile Gly Val Gly Ala Asp Phe

325 330 335

Ala Thr Ala Arg Tyr Arg Ala Ala Leu Lys Ala Leu Thr Val His Gly

340 345 350

Leu Leu Ala Leu Asp Pro Arg Arg Leu Val Thr Ala Glu Gly Thr Pro

355 360 365

Leu Thr Gly Ala Gly Glu Pro Ala Ser Gly Phe Pro Ala Asp Pro Gly

370 375 380

Ala Arg Glu Arg Pro Ile Gly Gly Phe Ser Ala Asp Pro Gly Ala Gly

385 390 395 400

Glu Arg Pro Asp Asp Gly Leu Leu Asp Asp Pro Leu Val Gly Asp Val

405 410 415

Ala Ala Gly Arg Val Glu Ala Phe Val Arg Gly Arg Asp Leu Val Glu

420 425 430

Gly Gly Glu Val Leu Leu Pro Ala Arg Ala Val Phe Leu Asp Pro His

435 440 445

Ala Thr Gly Ala Ala Ala Gly Tyr Ser Ala Glu Glu Ala Leu Val Ala

450 455 460

Gly Leu Leu Asp His Cys Ala Ala Leu Ala Gly Leu Asp Gly Thr Leu

465 470 475 480

Pro Pro Val Asp Val Gly Gly Ala Arg Ala Ala Asp Asp Glu Thr Ala

485 490 495

Arg Ser Ala Ala Leu Leu Asp Ala Ile Gly Leu Pro Tyr Gln Val Leu

500 505 510

Asp Ala Thr Gly Pro Ser Gly Val Pro Val His Ala Gly Thr Leu Gly

515 520 525

Gly Arg Leu Val Ala Arg Ala Ala Gly Val Thr Pro Leu Ala Ala Leu

530 535 540

Arg Ala Thr Leu Glu Gly Ile Leu Ala Ala Tyr Gln Gly Ile Pro Gly

545 550 555 560

Pro Ala Pro Leu Pro Asp Leu Cys Pro Ala Val Ala Gln Glu Pro Pro

565 570 575

Val Val Leu Asp Thr Gly Ala Ala Val Leu Gly Ala Gly Glu Leu Ala

580 585 590

Ala Ala Leu Ala Gly Ala Gly Leu Arg Val Ser Ala Val Pro Leu Asp

595 600 605

His Asp Arg Glu Val His Ala Leu Met Pro His Val Val Arg Val Val

610 615 620

Thr Glu Pro Leu His Gly

625 630

<210>34

<211>610

<212>PRT

<213>野野村氏菌属物种

<400>34

Val Gly Thr Gly Leu Leu Ala Glu Glu Ile Thr Ile Ala Leu Lys Asp

1 5 10 15

Arg Asp Gly Arg Ala Glu Val Thr Ile Thr Ala Cys Asp Gly Trp Ala

20 25 30

Arg Gly Pro Arg Arg Asp Gly Ala Ala Trp Leu Pro Val Arg Val Glu

35 40 45

Tyr Gly Val Ala Val Ile Gly Pro Leu Glu Arg Pro Gly Glu Pro Gly

50 55 60

Cys Val Thr Cys Phe Glu Thr Arg Arg Asp Arg Val Arg Thr Asp Ser

65 70 75 80

Ala Asp Arg Ala Ala Val Leu Ala Val His Gly Pro Glu Leu Ala Gly

85 90 95

Arg Ala Ser Pro Tyr Leu Gly Arg Leu Ala Ala Arg Thr Ile Ala Ala

100 105 110

Leu Ala Ala His Ala Ala Glu Gly Pro Gly Cys Ala Val Trp Tyr Val

115 120 125

Asp Leu Arg Thr Leu Thr Ala Glu Arg His Thr Phe Leu Pro Glu Pro

130 135 140

His Cys Pro Asp Cys Gly Asp Leu Pro Asp Asp Asp Arg Ala Ser Ala

145 150 155 160

Ala Phe Glu Pro Gly Ala Ala Pro Arg Pro Pro Gly Tyr Arg Val Arg

165 170 175

Asn Val Pro Ala Glu His Gly Ala Leu Leu Asp Thr Tyr Val Asp Gly

180 185 190

Glu Cys Gly Leu Ile Arg Pro Leu Val Arg Asp Thr Leu Gly Gly Leu

195 200 205

Val Ile Ala Gly Ala Met Leu Pro Leu Arg Phe Glu Gly Gly Ser Glu

210 215 220

Pro Gly Val Gly Arg Thr Arg Gly Tyr Arg Ala Ser Glu Val Thr Ala

225 230 235 240

Val Leu Glu Ala Leu Glu Arg Trp Gly Gly Val Glu Pro Gly Gly Lys

245 250 255

Arg Thr Arg Val Arg Ala Ser Tyr Ala Glu Val Ala Ala Asp Ala Leu

260 265 270

Asp Pro Arg Thr Leu Gly Glu His Asp Thr Ser Ser Tyr Glu Met Glu

275 280 285

Gly Phe Ala Phe Arg Pro Phe Ala Glu Asp Ala Val Cys Asp Trp Val

290 295 300

Trp Gly Tyr Ser Phe Ala Arg Arg Ser Pro Ile Leu Val Pro Glu Ser

305 310 315 320

Leu Ala Tyr Tyr Tyr Val Arg Gly Arg Glu Arg Pro Phe Leu Phe Glu

325 330 335

Ile Ser Asn Gly Cys Ala Leu Gly Gly Ser Met Ala Glu Ala Leu Leu

340 345 350

Tyr Gly Leu Leu Glu Thr Val Glu Arg Asp Ala Phe Leu Met Thr Trp

355 360 365

Tyr Gly Arg Leu Pro Val Pro Arg Ile Asp Pro Gly Thr Ala Arg Asp

370 375 380

Arg Thr Ile Pro Leu Gln Ala Ala Ala Ile Ile Ala Glu Thr Gly Tyr

385 390 395 400

Arg Val Glu Leu Tyr Asp Thr Thr Met Glu His Gly Ile Pro Ser Val

405 410 415

Trp Ala Met Gly Val Arg Gin Asp Gly Asp Pro Gly Arg Pro Arg Leu

420 425 430

Val Cys Ala Ala Gly Ala His Leu Val Pro Glu Lys Ala Val Leu Ser

435 440 445

Ala Leu Ser Glu Leu Gly Pro Leu Leu Ala Asp Leu Ile Arg Arg Tyr

450 455 460

Pro Asp Glu Val His Arg Ala Gln Glu Met Val Thr Asn Pro Asp Leu

465 470 475 480

Val Ala Thr Met His Asp His Ser Thr Leu Tyr Gly Ala Asp Ala Ala

485 490 495

Phe Asp Arg Leu Ser Phe Leu Thr Gly Gly Thr Gly Val Arg Gly Leu

500 505 510

Pro Asp Met Glu Ala Phe Thr Val Pro Gly Asp Leu Asp Val Met Arg

515 520 525

Val Val Asp Arg Phe Leu Ala Glu Gly Met Asp Val Val Val Ile Asp

530 535 540

Gln Thr Thr Pro Glu His Arg Ala Arg Gly Phe Ser Cys Val Lys Val

545 550 555 560

Leu Val Pro Gly Thr Leu Pro Met Thr Phe Gly His Arg Asn Arg Arg

565 570 575

Val Arg Gly Leu Thr Arg Pro Leu Glu Leu Pro Tyr Arg Leu Gly His

580 585 590

Arg Asp Thr Pro Leu Thr Pro Ala Asp Leu Asn Pro Asp Pro His Pro

595 600 605

Phe Pro

610

<210>35

<211>2484

<212>DNA

<213>野野村氏菌属物种

<400>35

gtgccgccgg cccaggccgg cggcactccg cccggggtga ggagacagat catggaggtg 60

ggccgcgaaa tcgtggtccg cgtggcgggg ctgcccgccg ccgtgctcgc cgacctgcgc 120

ctgccgcaca ccgccgagct cgtcacgcac ctgtccgctg agcggcggcg gctcgccgcc 180

gaggcggctg cgctgtccgg cgagctgttc gacctgatcg gcgccgccgg ctccgcccgc 240

gccgccctgg tgggcctgcg gcgcgcgctc gcccccgggc accgcccccc gtcgccgcga 300

ctgatcgggc tgtgtcccct gcccgccccg ctggccgagc gggtcaccgc ctgggtgcgg 360

gcccggtacg actgggagga ccggcgccgc gaccttgccg gcacgctgga caaggagcgc 420

gccgacgcgc tcgaccgcgt acgcgccgcc tgcgtcgccc cggcgttccg gcggggtctg 480

gcgctgtccg gtggggagct gaccagcacg ctggagcgct ggctcgccga ccccggccgt 540

gcgccccggc aggggaaggt gctccgcctg gtcaagtacc tgacccgagc tgcggccaag 600

accagcccgt acggctcctt catggtcagc gcgctggcgg ggcggcccgg cgacgaccct 660

cccatcccgg agctgctcac cgtggccgag ccgccggggg cgttcctcga cgccgtcggc 720

gacgcgctgc tcgccgaccc ggcactggcc ggccaggtgc cgctgcgccc caaccccagc 780

ctgacgtgga ccgcccaagg actgcttttc gtccggaccg tccgcgcggc ggcgggagag 840

caggccgggc cgaaggaaga gatcgccacc gccgggcgcg ccgccgcgct ggagctgtgc 900

ctgcggcacg ccgagtcccg gcccaccgcg ccgcagctgg cggagctgct ggccgaggcg 960

ggggcggatc cgggcgaggc ggccgcgttc gtcgaccggc tggtggcggc gcagctcctg 1020

ctgccgtgtc cgccggtgca cgacgacgat cccgacccgt tcggtgcctg ggcccgccag 1080

gtgtgcgccc cggagctgcg cgagctggcg gccgcgtcgc ggcccgtggc cgccgccgtg 1140

gactcgcccg gccagcgccg cgccaggatc gccgaagccg ccgccgccgt ggcggaccgg 1200

ctcggcatcg acccgcccgc cgatccggcg cacgagcacg acgtcagcac cggccgtccg 1260

gcgccgccac cgctgcccgc gggcgtgctc gccgacctgg acgcggtccg gcgctggctc 1320

gccgtgttcg actggaaggt gcccgtccgg gtgggggtcg gcgcgttctg ccgcgaacgt 1380

ttcggctcag ggtcccgcac gcccttcctg gaggcgtgcc gggcggcgac ggcggcgctg 1440

ccgcacctgt tcggccccgc cgcgatgccg tggttcctcg acctgaccgg tgacggtcgc 1500

ctgcgtgagc tggaccgtct ccggacgcgc gcccgcgatc tcgcccgctc cggcgtcctc 1560

gaccggcggc gggtgctggc tgacacggcc gactggcccg cctggctgac ctggcccgcc 1620

tccactggtt tctacctgca gaccctgccc ggtggggtgg tgctgaacgc ggtgcatgcc 1680

gggcacggcc gcgcggcggg tcgcgtccac cacctcctcg cccgggcggg cgccgcgccg 1740

ccgcgcccgc cccgctccgg cctgccgcgt gccgagttcg gcggcaggtt cggctccgcg 1800

ctcaacaccc gcacgccgag cacgcggtac gagatcgacc accccggcgc gacgtccggc 1860

cgcgaccccc ggcaccgtgt cccgctcggc acgctcatgg tggtgcacga cccggacacc 1920

gacctggtcc acctgcacag cgaccggctc ggccgcgtcg aaccggtgca cctcggcatg 1980

atgggcgagc tggggctgcc cgccgtggcc ggtttcctcg aacgcgcctt cgcgcccacc 2040

tacctgttcc acccgagcgt gccgccgttc atctcgctgc gtgacctggc cggcgcctcc 2100

tcggcgcggc gcttccccag ggtgagtgtc ggcgacgtgg tcgtgcagcg cgcccgctgg 2160

acggtgcccg ccggcctggt gcccgcgcgt accggggcgg acggtgacca cctgctcgcg 2220

ctggccgagt ggcggcgcga gcacggcatc cccgagcggt gtttcgtgcg cggctggaag 2280

ccgggcgcag cgctgggcaa ggcgcgcaag ccgctctacg tcgacttcgc ctcctggcat 2340

ctggtcgccc tgttcgaacg ggaggcgcga accaacgccg ccctggtcat cgacgaggcc 2400

ctgccggacc cgctggccga cggcgccccc gcgcacgtca ccgagtacca cgtcgagatc 2460

ggcgaccggg agagagagca atga 2484

<210>36

<211>900

<212>DNA

<213>野野村氏菌属物种

<400>36

atgaccgaac ggcccggctg gttcgcggcg catgtgcact accgcggcga cctcgacgcg 60

ctgctgcgcg aagcggtcgc gccgctggtg cgcgcgcttg ccgccgactt cttcttcctg 120

cgctactggg acgggggcag ccacctgcgg ctgcggctgc gcggcgggga ccaggtcgcg 180

gtcgcccggc acctggacgc ctaccttgcc gcccaccccg cgccggagac cacctcccag 240

gaggagtacg cccgcgtcgc cccggtgctg gccgcccgcg agggcatgac gggccacctg 300

acgacgctgc ggccgaacaa caccgtggag ttcgcggcgt accggccgga gaccgcgaag 360

tacggcaccg gcgacgcgct acgcgccgtc gagcggcatt tcgtcgagtc cagccggtac 420

gcgcttgacg tccttgaccg ccgcccgacc ggcaaccaac gcgagctcgc agtgctcggc 480

gtcctgctgc tcgcctggta cgccgcccgc ccactcgatg agccgcctgg tgagccggtc 540

gatgacgagc tgatcggcgc ggtcgaggcg ctgtgccggg gctggcgcgg cggccgggac 600

ctgcccgagg agctcgtggc ggaggagtac ggccgggtgc gggagcgtgt ggccgggctg 660

gccggcgcgc tgcgtgacct cgttccggac ccggacgcgc ccggcagcag catgcgcgcg 720

tgggcggcga cgttcgaccg gctcgccgcc gcgctgcccc cgcccgaccg gctgcgggtg 780

ctcgacacgt gcgcgcatct ggcggccaac cggctgggcg tgtccatggc ggccgaggtg 840

cggctgcggc tgctcgccgc gcgggccctg cgcgaggtcg cgcccgtggg gaggcgatga 900

<210>37

<211>1002

<212>DNA

<213>野野村氏菌属物种

<400>37

atgagctggc gacgcgtcgacgtggcctac cacgatcccg accttgacgg gctgatcctg 60

gccacccggc cgctgctggc cgggacgccc ggccgcggct ggttccagcg gcactgggtc 120

cgcggtccgc acctggagct gtggttcgac gccgcgcagc cgtcgtggga gcggatccgc 180

gacgtgctgg agccctggct gcgcgtcaac ccgtcgcgcg cccggatcga ccgagaccgg 240

ctgctggcgc agcaccggca cctcgccgcc gccgaacgga tcgacgagcc gctgctgccg 300

ttctacgccg acaacacgct gcaccgggcc gctccgcgct cccgcgcaca cgtgctcggt 360

ggtccggcgg ccgaggagct gttccacgac ttccacacca ccgccagcgc cgtggcttac 420

gacgagctcg acgccgtgcg ggcgggagag tcgcggctgg tgatggcact ggacctgatg 480

gtcgccgccg cgcacgcgca cgccgagggc ggcgtccgcg gcgggttcgt gtcgttccgc 540

tcgcacgcgg aggcgttcct ggcgagcgcg cccggcctgc gcgagcgctg ggacgccgag 600

tacgccgccc gggcgggggc gctgcgagcg cggatcaccg cggtggtcgc cggaatcccg 660

cgcggccggg cgtgggccgg gctgctcgac cggttcgcgg accgcggcga cgagctgatc 720

gcctccggcg cgctgctggt cgagcccgcc gggccggacg cggtcgcccg gcccgacacc 780

gccttccacc gggcgctgcg cggcaaccgg acctggcacg aggaggtgct gcgctcagca 840

ccgttccgcc gctaccggct gctgctgaac ctgacctacc tgcagctttc ccggctcggg 900

gtgaacgccg tgcagcgggc gctgctgtgc cacttcgccg cgtcggcggt cgagcaggag 960

tacggggtgt ccgccatcga gatcgccatg ggaggcgcgt ga 1002

<210>38

<211>1368

<212>DNA

<213>野野村氏菌属物种

<400>38

gtgatgtcag tacaggtcga gcccgcagtg acgcaccggt gggcactgcg gcccggcgtc 60

taccgggcca ccgcgccagg cggcgatctc atgctcgccg cctggccgca cgccacgccg 120

ctcggccggg ccacccccga gctgctggcc ctgctggacg gcctggccgc cggatcgctg 180

ccgctcgacg agcccggcga cctcgcgccc gccgtcgagc tgctgcgcgc gggtggctgg 240

ctgcgcaaga cggtggcgta cgcgggacgc gacctctaca ccatcacccc cgtcgccgcc 300

cccaccgacg cgccgccacc gccgcgggac gaaccggcgc tgtcgcggtt cgcgctgctg 360

cgcaacaccg cggacgggct ggtgctggag atgcccggct cctggtgcga cgtccacgtg 420

cacgacccgg cggtggccgc gctgctcgcc gacccgtccg gcgacggcgg cctgcccgcc 480

gaggccgcgg ccgcgctgcg cgccgacctg gccgccgccg gcatgctgat ggagcgggag 540

gagccgttcg agcggcggca gtggagcacc cacgagctgt ggttccatga acgcagccgg 600

ctcggcaacc ggggctggtt cggcgcgcac ttcggcggca cgttctgggc ccgcggccgg 660

cacgacccgc cgcccgcgcg gccgtccccc taccccggcc cggccgtcga gctggcccgg 720

ccggacctcg cggcgctgcg gcgcaccgac cccacgctca ccgccgtgct ggaggaccgc 780

gaaagcgtcc gcgaccacga cgacgacgat ccgatcagcg ctgagcagct cggcgagctg 840

ctctaccggt gcgcgcgggt gcggctgctg cgtcacctgg aaggcttcga gtacgccggc 900

aagccgtacc ccgccggtgg ctcggcgtac gagctagagg tgtacccggt cgtgcggctg 960

gcccgcggcc tcgaccccgg catgtaccac tacgacgcgc acgaccatcg gctgcgccag 1020

gtccggcccg ccggccaccc ggcggtgcgc aggatgctga aggtcgccac ggagtcgtcc 1080

gtcgccaagg cgccgcccca ggtgctgctg gtgatcagcg cgagagtcgg ccggatcctg 1140

tggaagtacg aggcgatggg gtacgcgctc atgctgaagc acgtcggcgt gctgcaacag 1200

acgctgtacg cggtcgccac cgccatggac ctggccccgt gcgcgctcgg cagcggggac 1260

gatctcgcct tcaccgccgc caccggccgg gaccggctgg tggagtgcgc ggtcggcgag 1320

ttcatggtcg gcagcaggcg gaaggagccc gcggcatggg agctctga 1368

<210>39

<211>1827

<212>DNA

<213>野野村氏菌属物种

<400>39

atgggagctc tgaacctcct cctgcgcccc gacgcgcact acgccgaggt cgacggcggc 60

gtctacgtgc tgagccacca gggcgagacc ttcatctcgg gcacctcggt gcaccggtgg 120

ctcgaccgcc tcgcgccgct gctcgacggc acccgcacgc tcgaccagct caccgccggc 180

ctgcccgccg accgggccgg cttcgtggcc agacttgtcg gcacgctcac cgaacgcggc 240

ctggtgcgcg aggtcggccc ggcggtgtcg gacacgctca ccgacgccga acgcggcgag 300

caccgtgccc tgctggccta cctgggctac ttccacgact cgcccggccg cgtcctcgag 360

gacgtgcgcg acaccccgac cgcgatcgtg gggtccggtc cgctggccgc cgcggtggtc 420

cgcgcctgcg ccgccgccgg gctgcgccgg gtggagatcg gcgaggaggc gggcgcggcc 480

cgggtggtcg tccacgtggc cgagcgcgcc gagcccgaac gggcggcgcg gctggaacgg 540

cggtgcgccg ccgagggggt gctgctcgca caggtcatgc cggggccgga cggcatctgg 600

tggcagcccg cggcccgcgg cggctgctgg gcgagcgcgt ggcgccgcca ccgggcgctc 660

gcgggcgtgg atcggacggg cacgccgctc gatccggtgg cggtcgcggt ggtggccggc 720

caggtggcac acgacgtctt ccgcgtcctc gccggactgc gcgaggaggc gccgccccgg 780

ttggtggtgc tcgatccgcg gacgctggcg agcaccgcgc acccggtggt ggcgcacccg 840

ttcgagctgc ccgccgcgcc gctggacgag gcggcgttcc tcgaccgggt cgccgcgctg 900

cgggcagcgc ccgcgctgag cgaggcggag ttctcccggc gggccaaggg gctcatggac 960

tcgacagtgg ggctgttcgc cgagatcgac gagggcgacc tcgcgcagtt gccgctgcac 1020

gtcacggcga ccacggtggc cgacccgtgc gggctgatcg gctccgcgcc gcggcccgtg 1080

gtcaccggcg cggggctcac gttcgaggag gcccgctacc gcgcggcgcg cgccgcgctc 1140

gccctggccg gcactctcgc gctcgaccgg cggaggctgg tcgacggccg ggtgtgggcg 1200

tacgaccttg cggacggggc cgcccggctg gttccggccg acgaggtctt cgcaagcacg 1260

gcgggcggga gcacggcggg cgtgccgctc ggcgcggcgg cagcctactc gtgggccgag 1320

gcggtcgcgg agggcctggt cgcgcaggcc gccgcgctca ctctcgccgg cgccgggcac 1380

gcgggcgagc cgtatggacg ggcggacctc gccggggcgc ctgcgtatct cctcgccatg 1440

gtgcgggcgc tcggcgagga gctgaccgtg cacgacgtca ccgggccgct gggcgtgccg 1500

gtcgtggtgg ggacgctgtc cggcggggcg accgcctgcg gcgcgggcat gaccacggac 1560

gccgccgtca ccgcgtgcct gcgcgacctg ctgctgctgc gccaggccga gatcaacgac 1620

cagcccgtct acgccccacc atccggcagg cccttgcccg ggcatctacg cgggaaccac 1680

ccggcgcccg ccgtgcccgg cacggacgcc gaccggctgg cggcccgcct ggccgagcgg 1740

gggcaccgcc ctctggcggt gccgctggat catgaccagg ccgtgcacgc ggtcctgccc 1800

ttcgccgtcc gggtggtgtg ccgatga 1827

<210>40

<211>1737

<212>DNA

<213>野野村氏菌属物种

<400>40

atgatccgcc tgcccgacca cggcgagctt gccgtgccga tcggcgacgg gccgatgctg 60

ccgctgcgca ccgaactcgg ccgggtggtc atcggcccgc tggagcggcc cggcgtgccc 120

ggatgccggg cctgcgtgcg catccgcgcg gcgcgggtcc agcccgacgc ccgcaaggcc 180

gaggccgtac gcgcccggca cgcccccgcg cccagccagt ggctcacccc gctcgccacc 240

gacctggtgc gcgtcctggt cgcgagcgag agcgctgccc tggcagccga caccgacccc 300

cgcaccgcgg gtgccgtgct ggagatcgac ctcgccacgc tggaaatcac caggcaccgg 360

ttcctgcccg acccgctctg cccgcactgc ggcggtctgc cgccggacgg cccggccgag 420

ctgaccctgc ggccccgccg caagctcggc ggcagtcccc ggaccaggcc ggtcgagctg 480

aacgcgctgc tggagacgta cgtggacggc cgggtcggga tgatccggcc gctgaagtcg 540

ggcgtgcagg gcggactgac ggtggccagc gccatgctgc cgatccgcgc gggccacggc 600

ctggaaccgg gggtcggccg tacccgcagc tacaccgcga gcaggctggt cgccgtgctg 660

gaggcgctgg agcgctatgg cggcgtcagc cccggcggcc gccgcaccag cgttaccgcc 720

gcctaccgcg acatctccgg ccacgccgtc catcccgaca ccttcggcac acaccccgag 780

gagaactacg acaggcccgg cttcgccttc cggcgcttca ccgaggacac cgtgtgccgg 840

tgggtgtggg gctactcctt cgccaaggcc cagcccgtgc tggtgccgga gaaccaggtc 900

tactactacg ccagaaacct gccggacggc gagcagccgt tcgtcttcga ggtctccaac 960

ggctgcgcgc tcggctcgtg cctggaggag gcgatcctgc acggcctgct cgaggtggtc 1020

gagcgggacg cgttcctgct cacctggcac gcccggcggg aggttccggt gctgaacccc 1080

gcgctggcga gcgacccggt cctgcccatg caggccgccg cgatcaccgc cgagaccggg 1140

caccgggtgc tgtgcttcga caccaccgcc gagcacggca tccccagcgt gtgggcgatg 1200

gccgtggacg tcgaacaccg gtcggaccgg cccgccaccg cccacgccgc cggcgcggcg 1260

ctcacgctgg agcaggccgc catgaacgcg ctgagcgagc tcggcccgct gctggccgac 1320

gtgatccgcc gctaccccga ggagcgggaa cgggccgagg ccatggtccg cgaccccgag 1380

caggtcgcca ccatgcacga ccactccctg ctctacgcgg ttcccgccgc ggccgaacgg 1440

ctgtcgttcc tcaccggccg cgccgacggc ccgcggaccg gcttcggctc ggcccggttc 1500

accggcgacg acctcaccgc cgatctgcgg gccatgatcg acgcggtgat cgacgccggg 1560

atggacgtgg tggtcgtcga ccagaccacg ccggagcacc tggcgggcgg gttccgctgc 1620

gtgaaggtgc tggtgcccgg cgcgctgccg atgacgttcg gccaccagta ccggcggctg 1680

gacaacctgc cgcggctggc ggccgcgcgt accaccgacc cgcacccgtt cccatga 1737

<210>41

<211>2574

<212>DNA

<213>野野村氏菌属物种

<400>41

atggcggtta ttgagcggga agaaagcgac ggcccgccgg tcgctgtccg cacgtgcggg 60

gtcgcggccg cggagctgga atccctgcga tgggacgagt cctatgcgct ggtgacccgg 120

ctgctcgcgg agaccgcccg ggtggcggcg gacgggcggc ggctggccgt ggcgctcggt 180

gacgtcatcg gagggctcgg cccgtccggg tcccggcccg tcctcgtggg gctgcggcgg 240

gcgctgcaca ccgggcgtct cccctccggg cgggagtggg ggcccgaggc cggggcggcg 300

ctgccgtacg ggctgagggg cgaggtggag gagtgggtac ggcgtgcgcg cgagtgcgcc 360

gggctgcgcg cccgcctgcc cgaggtcgtc gcccgggagt ccctggagaa ggaggaacgg 420

ctgcgcgccg ccgcggccga ccccgccttc cgcagggggc tggcgctggc cggcggcgag 480

ctggcggtcg acctggagac gtggctcgcg gaccccgcgc ggcgccccaa gccgcagaag 540

ctgctcaggc tggccaaata cctggtcagg gccgccgtga agaccagccc gtacagcacg 600

ttcacgagca ccgggcgggc ggtgtggggc ggtggcgagc ggcacgtgga gcgcgtggtg 660

ccggtgctgg aactcgacgg cgtccagacg ttctcggacg atcgggtcag ggtgaatccg 720

tcggtcaccg tcgcgggcgg gacggcggag ttcatcgggc cgcctcccgg ggaggcgctg 780

gtgtccatcg gggtgacgga ggcggtggcc gcgtgcctgc gcgtcgcgga gggcggggag 840

tgggtgccgc ggggccggtt cgcggaggct ctgggggctg agcctgccgc agtcacgaaa 900

tttctggaca agttgcttgc ggttgggctc ctggaggccc ggccggacgg cgacccgccc 960

ccgcacctgc tggacgggat ccggcgcacg gaacgcgcca ccgacccgtc caccttccgc 1020

cacgaactcg gccgcctgat cgccgccgcc cgcgccgccg cccgcgccac cgcccccggc 1080

gctgacacgg ccaagaacgc cgcccctgcc gggcgcgcca cccgcggcga tggcggtgct 1140

gatgccgagc gcgccacccg cggcgatagc gatgctgatg acgggcgcgc cacccggggc 1200

gacggcggtg ctgatgacag gggcgccgcg cggggcgacg gcggtgtggg gcgggcggtt 1260

gtgcacgagg tcgcggtctg cgtcgagccc gtggcgaggc tggatccggc gcgatggcgt 1320

ggcgggcttg ccgatctcga cgtcgtacgc cgctggctgg ccgttttcga cgccaagcac 1380

cccatgcgcc tcgcggtcgc cgcctacctc accacccggt acggccccga cccggccgtc 1440

cccttcctca cgctccaccg ccacatccag cgcgagctgg ccggcaccgg cgcggcaggc 1500

cgggagttgc gcgcgttcct cggctcgtcg gccgcctgga cccagccgct aggcacctcc 1560

gccctgccca ggatcaggga gctggagcgc ctcagagccg aggcgagaag cctggcgctg 1620

gacgcggagg accccgacgg cacctgccgc gtcacccccg gacagctggc cgcgcagctg 1680

gagtcgtggc cgtcttggat cgcgatcccc gcctcctcgg cctgctacgt acaggcggtg 1740

gccggcaccc tggtgctcaa cgtcgtccac ggcgggcacg gccgagccct gcgcaggctc 1800

gaccacctcc tcgaacgcgc cggcggccac cccgagccgc cccggatcga ggacccggac 1860

ggcgcggtct acgccgagtt ctccggcgac ctgggctcca cgctcaacgc gcgcccgccg 1920

agcacccgat acgagatcga ctacccccac tcgcccggca cgcgcccgcc cgacctgcgg 1980

ctgccgctca cggacctgca cgtgacgctc tgcccggaca gcggcctgcc cgagctgcgt 2040

tccaagcggc tcggccgccg ggtcgtgccg ttgcatctcg ggctggccgc cgagttccgg 2100

cttccgccgg ccgcgcggtt catcgaacgc gtcttcggcc ccggctacct gctccatccc 2160

agctcgccgc cgctggtgcg gatgggccgg gtcccctcgg aggtcacccg gtatccacgc 2220

gtcgaggccg ggcgcgtggt ggtgcagcgg cgtcgctggc tggcgcctgc ggccacgctg 2280

ccggtgcgcg cgaagggcga gggcgacgcg gcgtacctca cgcggctgat cgcctgggcg 2340

gacgagtacg gcgtaccgca ccgatcgttc gtccgcgcct ggccggagca gaccggcgac 2400

aaagggcagg acaaggcgcg caaaccgctc ttcctggacc tggcgaacct gttcctggtc 2460

aagaacttcg agcggcagat acgtggctgc gcgttcgcgc tcttcgagga ggcgctgccc 2520

gacccgggac cggagcgggt gaccgaatac ctgatcgagg tgggaggccg atga 2574

<210>42

<211>816

<212>DNA

<213>野野村氏菌属物种

<400>42

atgagctggg tgagcgtgca cgtcttctcg caggggccgc tcgacgacat gatcacgggc 60

ctggccgggc cgctcctcgg cgacgacggc ttcttcctgc gctactggga gggcggcccg 120

catctgcgga tcagggtcag gtcccacccg gcggagcagg tcgtcgagcg ggccgaggcg 180

tatctgcgcg agcacccgtc agaggcggtg atcgacccgg aggagtacgc caggctcgcc 240

gcgaccctcg ccgcccgcga aggcgtcccc ggctatacgc ggcgcctcta tccgaacgac 300

tccgcccacc tcatcccgta ccagccggaa cacgaccgct acggcacggg ccgctcgctc 360

gacgccgtgg agcggcactt ccacgactcc agcgtgatcg cactccagct gatcggggcg 420

gggctcggac acgagcggcg gagcatggcg tggctgacca tgctgctggt cgcctggcag 480

gtcgcggggg agggcagggc gttcggcccg cccgctgacg ccggggttca ggtgccccac 540

gagcggatgg cggcgctggt cgagcacgcc agggcggtga cacaggagcc tgcgccgagc 600

gagccccgtg gcgtggtggc cgcctggtac gcctcgatcg cgcggctggt ggaggaactg 660

gcggcggcgg ggttcgacgc ggcgcggacg ggggcgaccg tcgatctggc cgcgcatctg 720

ctggccaaca ggctggggat ccgggtgcag gaggaggccc ggctgcgtca cctggcgtcc 780

ggggccacga gggagtcgga ggtgggggtc ggatga 816

<210>43

<211>960

<212>DNA

<213>野野村氏菌属物种

<400>43

atgacctgga cgcggctgcg ggtggactat cacgacggcc cgatggacga cctcatcctg 60

gacgcgctcc gcccggcctg gcatgaaata cggggatatt tcctgcgcca ctgggtgtgc 120

ggcccgcacc tgcggatctt cgtggacggc gacgcgacgc cgatcgtccg ggcggtcgag 180

cgccacctgg ccgcctgccc gtccgccggc accaccgacc cgcaggcgct gctccccctg 240

cacgagcgcc tggccgagct ggaaggcgaa cgaggcccgc tgctgccatg ggcccccgac 300

aacaccgtca ccgccgaacc cccggggctc gacaccgagc tcgaccggtt cctcgcggac 360

ttctacgccg acaccaccga ggccgcgttc gacgccctcg gccgggtcag agccggcacg 420

ccgctgccgg gcatcgcctt cgacctggtg gtcgccaccg cgcacgacct gtcggagggc 480

ggcctgccca ctgccaggac ctcgctgcgc tcgcacgccg aggcttacct gtcgcgcctg 540

ccgggaggcg tccgcgccaa gtggcaggcg cactacgaac gcaaccagga gccgctgacc 600

gccaggatca aggccctgac cggcgccgga gagcccggcg cgtggctgcg tacgatccgg 660

gccacccgcg accggggccg taccctcatc gacgagggac ggctgagcct cggctacgcc 720

accgacggcc cttccacgcg gcccccgctc gccgcggtct cccccttcca ccggaacctg 780

gagaccgacg aacgctggct cgccctcaag gacacccccg ccttcgccgc ctaccgcctg 840

gccctgaact gcgcgtacct ccacctcacc cggctcggcc tcacgcccga ccagcgcttc 900

ctgatctgcc acctcgccgc gagcgccgcc gacgacgtct accgggccgt ggcctcatga 960

<210>44

<211>1287

<212>DNA

<213>野野村氏菌属物种

<400>44

atgaccgggg aacggtacga gctgcgcgcc ggcgtgcacc tcgcccggct ggacgcgggg 60

gtccgcctgt tcgcctggcc gcacgccgag accctcggcg agctcacgcg ggatgagctc 120

gacctgctcc gcgacctggc cgccggaccc cgcaccgccg ggggaccgct cgtcgaacgc 180

ctgcgcgccg gaggctggct caagatcacg attacccggg acggcgtgcc cctctacacg 240

ctcgccccgc tgcgcccgcc gccgccacgg ccggcggtgc cggagcggcc ggttctgtcc 300

aggttcgcca cgctgcggcg cgagggggac gcgctggtcg ccggctcccc gctggcctgg 360

tgcgacctgt acgtccacga ccccggcctg gtcggcgacg tggtccggcc cggcggcgag 420

gtcctggccg acctggtgtg ggccgggctg gccgtgcccg aggaggccga ggaccgggag 480

ctgcggttcc ggcagtgggc gccgcacgag ctggagttcc atgaccggag ccgggtgggg 540

caccgcggct acctgggcga tgggttcggc gggacgttct gggcccgcgg ccggttcgac 600

ccgctgcccg cccggccccg gccctacccc ggccgggcga tcgagctgcc cacgcccgac 660

ctggacgaac tgcggctcaa ggacccctcg ctcacggacg tgctggaggg ccgcaggtcc 720

gtacgcgagc acgacgacga gcgcccgatc accctcgacc tgctcggcga gctgctgtac 780

cgcacggcca gggtgcggga gtgctggacg gccgacggcg tcgaatacac ccgcaagccg 840

tacccctccg gagggtccgt ctacgagctg gagatctacc ccgtcgtcag gaacgtggcc 900

gggctcgaac ccggcatgta ccactacgac gggcacgacc acgtgctcag gccggtacgt 960

gaggccggcc atcccgccgt acgccggctg ctgaccgtcg ccgggcacgg cgccgccacc 1020

ggccgccgcc cccaggtcct gctcgcggtc tccagccgcg ccggccggct gctgtggaag 1080

tacgaaggca tggggtacgc gctgacgctc aagcacgtgg gtgtgctcta ccagacgctc 1140

tactgcgtgg ccacggcgat gggcctggcg gcctgcgggc tcggcagcgg cgactcggcc 1200

gcgttcgccg aggcgaccgg gcgggacccg ttggaggagt gcgcggtcgg cgaattcatg 1260

atcggaaccg cggaggcacc acgttga 1287

<210>45

<211>1893

<212>DNA

<213>野野村氏菌属物种

<400>45

ttgaacgact tcaaacccag actccccgcg gacatacgct tcgcgcccac ctccggcggt 60

gtcgccttcc tcacccgcga aggcgtcgtg cggatgaacg gggcctccgt ccacctgtgg 120

gtggagcggc tggccgtgca cctcgacggg agcaggaccg tggccgagct gaccgcggag 180

ctgcccgacg agcggcgggc gttcgtgacg agcctgctga ccacgctgcg cgagcgcggg 240

ctcgtggagg acgcgggaga gcgcggcgtg ctgcccgtgg cggccggcac cgcgtgctcg 300

ctgctggccg acgcggaccg gttcggcgag ctggcgcccg ccctggccga cgccctgcgc 360

aggctggggc tggaggtgct gacagagccg tcgggcgggg cgctcgtgca cgtcgcggcg 420

gccgacgcgg acgggctggc cgccgccggg cgcctcgacc ggctgagcgc cgagcgcggg 480

ctgcccatcg cgcacgtgct gctgcgcgag ggcgaggcgt ggtggagcga gaccggcgtc 540

gtcgggcgcg acgtcccgcc gtgggcggcc gggtggcggc ggctggcggc catggaggcc 600

gtcccgcgta ccgccgggca cgtctccgtg tcgcccgtcg ccgcggccgt ggtcgccggg 660

caggtggtgg cggacctggg gcgctgcctg tccggaacgc cccgcgtgtc cggcggtccg 720

cggctgcacg tggtggacct ggacgggttc gggatgcgga cgcactcctt cctgccgcac 780

ctgtcggcgc tgccgcccgg cacgggggtg agcgcggggc cgctcggcga ggaggagttc 840

tcgcggcggg cggccaggtt gatggactcg cggacggggg tgttcgccga gatcgaggag 900

ggggagtacg ggcagctccc gctgcacgtg tcggtgacca cggtggccga tccgatgggg 960

gccctcgggg gtgcgctggc gcgggtgatc ggcgtggggg cggacttcgc caccgcgcga 1020

taccgggcgg cgcttaaggc actgaccgtg cacgggctgc tcgccctcga cccccgccgc 1080

ctggtcacgg ccgaggggac gcccctgacc ggcgcggggg aacccgccag cggcttcccg 1140

gctgatccgg gcgcgaggga acggccgatc ggtggctttt cggctgatcc gggtgcgggt 1200

gagcggccgg acgacggtct cctggacgac ccgctggtgg gcgacgtcgc ggcgggacgg 1260

gtcgaggcgt tcgtgcgcgg ccgtgacctc gtcgagggcg gtgaggtgct gctgcccgcc 1320

cgcgcggtgt tcctggatcc gcacgccacc ggggccgccg cggggtactc ggccgaggag 1380

gcgctggtcg cggggttact ggaccactgt gcggcactgg ccgggctcga cgggacgctg 1440

ccgcccgtgg acgtgggcgg cgcgcgggcg gccgacgacg agaccgcgcg gtcggcggcg 1500

ctgctggacg cgatcgggct gccgtaccag gtgctggacg ccaccggccc gtcgggcgtg 1560

cccgtgcacg cggggacgct cggcgggcgg ctggtggcgc gggcggcggg cgtcacgccc 1620

ctggccgcgc tgcgggccac gctcgaaggg atcctggccg cgtaccaggg cattccgggc 1680

cccgcacccc tgcccgacct gtgcccggcc gtcgcgcagg agccgccggt cgtcctcgac 1740

acgggggcgg ccgtgctcgg cgccggtgag ctcgccgccg ccctggccgg cgccgggctg 1800

cgggtcagcg ccgttccgct ggatcacgac cgggaggtac acgcgctcat gccgcacgtc 1860

gtccgcgtcg tcacggagcc gctccatggc tga 1893

<210>46

<211>1833

<212>DNA

<213>野野村氏菌属物种

<400>46

gtggggacgg gcctgctggc cgaggagatc acgatcgcgc tgaaggaccg cgacgggcgg 60

gcagaggtga cgatcaccgc ctgcgacggc tgggcgcgcg gcccccggcg cgacggggcg 120

gcgtggttgc ccgtgcgggt cgagtacggg gtcgccgtca tcgggccgct ggaacgcccc 180

ggcgaacccg gctgcgtgac ctgcttcgag acccgccggg accgggtcag gaccgacagc 240

gccgatcggg ccgccgtcct ggccgtccac ggccccgaac tcgccgggcg ggcctccccg 300

tacctcggcc gcctggccgc ccgcacgatc gcggccctgg ccgcgcacgc cgccgagggc 360

cccggatgcg ccgtctggta cgtcgacctg cgcacgctca ccgccgaacg ccacacgttc 420

ctgccggaac cccactgccc cgactgcggc gacctgccgg acgacgaccg cgcgtccgcc 480

gccttcgagc ccggcgccgc cccgcgacct cccggctacc gggtcaggaa cgtgccggcc 540

gagcacggcg cgctgctcga cacgtacgtg gacggcgaat gcgggctgat caggcccctc 600

gtccgggaca cgctcggcgg cctggtgatc gccggggcga tgctgccgct gcggttcgag 660

ggcggttcgg agcccggcgt gggccgcacc cgcggctacc gggccagcga ggtcaccgcc 720

gtgctcgaag cgctcgaacg gtggggcggc gtcgagcccg gcggcaagcg cacccgcgtg 780

cgggcctcgt acgcggaggt ggccgcggac gcgctcgacc ctcgaacgct gggcgagcac 840

gacacctcct cctacgagat ggaggggttc gcgttccggc cgttcgccga ggacgccgtc 900

tgcgactggg tgtgggggta ctccttcgcc cggcgctcgc cgatcctcgt gccggagagc 960

ctggcctatt actacgtacg ggggcgggag cggccgttcc tcttcgagat ctcgaacggg 1020

tgcgcgctcg gcggcagcat ggcggaggcc ctgctctacg ggctgctgga gacggtcgag 1080

cgggacgcct ttctcatgac ctggtacggg cggctcccgg tgccgcggat cgaccccggc 1140

acggcacggg accgcaccat cccgctccag gccgccgcga tcatcgcgga gaccggttat 1200

cgggtggagc tgtacgacac gacgatggag cacggcatcc ccagcgtgtg ggcgatgggc 1260

gtgcggcagg acggcgatcc gggcaggccg cgcctggtgt gcgccgccgg ggcccacctg 1320

gtgccggaga aggccgtgct cagcgcgctg agcgagctgg ggccgctgct ggccgacctg 1380

atccggcggt atccggacga ggtgcaccga gcccaggaga tggtgacaaa tcctgatctg 1440

gtggcgacga tgcacgacca ctccaccctg tacggcgccg acgcggcctt cgaccggctc 1500

tcgttcctga ccggcggcac gggcgtgcgg gggctgcccg acatggaggc gttcaccgtg 1560

cccggtgatc tcgacgtcat gagggtggtg gaccgcttcc tcgccgaggg gatggacgtc 1620

gtcgtcatcg accagaccac gccggagcat cgggcccgcg gtttctcctg cgtcaaggtg 1680

ctggtgcccg gcacgctccc gatgaccttc ggccaccgca accgcagggt gcggggcctg 1740

acccgcccgc tggagctgcc gtaccggctc ggccaccgcg acacgcccct gacccccgcc 1800

gacctgaacc ccgacccaca ccccttccca tga 1833

<210>47

<211>237

<212>PRT

<213>野野村氏菌属物种

<400>47

Val Thr Ala Arg Arg Arg Asp Val Glu Arg Val Asp Arg Ile Val Asp

1 5 10 15

Ala Ala Ala Glu Leu Leu Pro Glu Arg Gly Tyr Arg Arg Leu Thr Val

20 25 30

Glu Glu Val Ala Ser Arg Ala Gly Val Ser Lys Ser Ser Val Tyr Leu

35 40 45

His Trp Asn Thr Lys Asp Glu Ile Phe Tyr Ala Val Leu Asp Arg Glu

50 55 60

Phe Thr Val Leu Ala Gln Ala Ala Val Asp Arg Val Arg Arg Asp Pro

65 70 75 80

Ala Glu Val Leu Ala His Arg Thr Ala Ala Asn Leu Phe Gln Ile Val

85 90 95

Ala Cys Arg Pro Leu Leu Gln Ala Leu Leu Val Asp Asp Arg Thr Thr

100 105 110

Leu Gly Ser Leu Gln Pro Ala Lys Ser Ala Val Phe Arg Ala Ser Leu

115 120 125

Ala Asn Leu Asn Glu Leu Met Tyr Arg Tyr Leu His Ala Leu Arg Ile

130 135 140

Asn Gly Leu Leu Cys Pro Glu Val Asp Pro Arg Ile Met Arg Lys Ala

145 150 155 160

Ile Ser Glu Met Leu Arg Gly Met Thr Phe Ser Ala Gly Ala Lys Pro

165 170 175

Leu Ala Glu Thr Arg Leu Ala Lys Leu Ser Gln Val Val Ala Val Thr

180 185 190

Val Gln Arg Ala Phe Glu Pro Gly Asp Val Pro Glu Leu Asp Arg Ile

195 200 205

Asn Ala Ala Ala Ala Glu Val Phe Lys Ala Phe Asp Glu Leu Met Pro

210 215 220

Ala Glu Glu Thr Met Arg Ala Glu Arg Pro Val Ala Leu

225 230 235

<210>48

<211>633

<212>PRT

<213>野野村氏菌属物种

<400>48

Val Thr Val Val Arg Ala His Val Arg Gln Glu Pro Ala Ala Leu Val

1 5 10 15

Val Gly Arg Gly Leu Leu Ala Asp Arg Leu Ala Ala Val Thr Gly Arg

20 25 30

Leu Asp Pro Gly Val Val Leu Ala Val Ser Asp Ala Pro Asp Pro Ala

35 40 45

Val Leu Ala Glu Ala Arg Ala Thr Gly Arg Pro Val Leu Pro Val Leu

50 55 60

Ala Glu Pro Gly Arg Val Arg Val Gly Pro Leu Glu Arg Pro Gly Glu

65 70 75 80

Pro Gly Cys Ser Asp Cys Leu Ser Leu Arg Arg His Arg Ala Ala Ser

85 90 95

Arg Ser Ala Glu Arg Ala Ala Ala Trp Leu Arg His Gly Pro Asp Leu

100 105 110

Ala Ala Thr Pro Ser Pro Leu Leu Ala Pro Val Ala Leu Asp Leu Val

115 120 125

Ala Glu Leu Val Thr Ala Leu Val Thr Ala Pro Ala Pro Ala His Arg

130 135 140

Gly Ile Leu Leu Ala Asp Leu Ser Asp Leu Ser Val Thr Pro His Ala

145 150 155 160

Phe Leu Pro Asp Pro Phe Cys Pro Arg Cys Gly Thr Leu Pro Asp Asp

165 170 175

Asp Pro Ala Arg Ala Arg Ile Thr Leu Val Pro Arg Pro Lys Pro Ser

180 185 190

Pro Asp Arg His Arg Val Trp Asp Ala Glu Gly Arg Leu Asp Arg Leu

195 200 205

Arg Gln Ile Tyr Val Asp Asp His Cys Gly Leu Val His Ser Leu Asn

210 215 220

Pro Ala Ala Leu Gly Ser Leu Ala Val Ala Gly Ala Pro Ile Arg Leu

225 230 235 240

Arg Gly Thr Thr Ala Phe Glu Pro Gly Phe Gly Arg Ser Arg Ser Tyr

245 250 255

Arg Arg Ser Ser Val Ile Ala Leu Leu Glu Ala Leu Glu Arg Tyr Gly

260 265 270

Ala Ile Gly Pro Gly Gly Arg Arg Gly Thr Val Arg Ala Ser Tyr Ala

275 280 285

Ser Leu Gly Asn Leu Ala Val Asp Pro Arg Ser Leu Gly Leu His Pro

290 295 300

Pro Glu His Tyr Ala Leu Pro Gly Phe Pro Tyr Arg Pro Phe Thr Pro

305 310 315 320

Glu Ala Val Cys Arg Trp Leu Trp Gly His Ser Phe Ala Thr Gly Gly

325 330 335

Pro Val Leu Val Pro Glu Arg Asn Val His Tyr Gly Pro Ser Asp Asp

340 345 350

Asp Arg Pro Phe Cys Tyr Glu Leu Ala Asn Gly Cys Ala Leu Gly Ser

355 360 365

Cys Leu Glu Glu Ala ValPhe His Gly Ile Leu Glu Val Leu Glu Arg

370 375 380

Asp Ala Phe Leu Leu Thr Trp Tyr Thr Arg Ala Arg Ala Pro Arg Leu

385 390 395 400

Asp Leu Gly Thr Ala Arg Asp Pro Thr Ile Pro Leu Val Ala Ala Ala

405 410 415

Ile Thr Ala Glu Thr Gly Tyr Leu Val Glu Cys Tyr Asp Ile Thr Pro

420 425 430

Asp His Gly Val Pro Cys Val Trp Ala Leu Ala Arg His Pro Ser Asp

435 440 445

Gly Glu Pro Ala Thr Ile Ser Ala Ala Ala Ala Gly Pro Gly Leu Glu

450 455 460

Pro Ala Ala Ala Gly Ala Leu Ala Glu Leu Gly Pro Met Val Pro Thr

465 470 475 480

Val Arg Asp His Phe Pro Gln His Ala Gly Arg Ala Arg Glu Leu Ala

485 490 495

Ala Asp Gly Arg Arg Val Arg Ser Met Ile Asp His Tyr Leu Val Tyr

500 505 510

Gly Val Arg Ser Ala Ala Arg Arg Leu Ser Phe Leu Thr Asp Gly Thr

515 520 525

Glu Glu Val Pro Phe Ala Pro Ala Pro Asp Gly Phe Arg His Asp Asp

530 535 540

Leu Thr Ala Asp Leu Arg Phe Leu Leu Asp Arg Leu Ala Asp Ser Gly

545 550 555 560

Leu Asp Val Val Val Val Asp Leu Thr Thr Pro Glu His Arg Ala Gly

565 570 575

Gly Leu Arg Cys Val Lys Val Leu Val Pro Gly Thr Val Pro Met Thr

580 585 590

Phe Gly Glu Gln Asn Arg Arg Thr Trp Gly Leu Pro Arg Leu Leu Asp

595 600 605

Pro Ala Val Val Arg Gly Arg Gly Met Pro Val Arg Gly His Ala Asp

610 615 620

Leu Asn Pro Asp Pro His Pro Phe Pro

625 630

<210>49

<211>829

<212>PRT

<213>野野村氏菌属物种

<400>49

Val Ser Arg His Ala Pro Pro Ala Val Ala Arg Val Gly Gly Leu Pro

1 5 10 15

Ala Ala Ala Leu His Gly Val Ala Cys Pro Glu Ala Thr Arg Leu Ala

20 25 30

Gly Arg Val Val His Leu Thr Glu Glu Leu Thr Arg Arg Ala Ala Val

35 40 45

Leu Ser Asp Ala Leu Tyr Glu Val Ile Gly Ala Ala Gly Ala His Lys

50 55 60

Pro Ile Leu Val Ala Ile Arg Arg Asp Leu His Gly Leu Arg Arg Pro

65 70 75 80

Lys Arg Val Glu Val Leu Pro Ala Pro Leu Ala Glu Pro Val Arg Thr

85 90 95

Trp Ile Ser Leu Trp Glu Glu Arg Ala Arg Val His Ala Val Leu Pro

100 105 110

Asp Val Leu Ala Arg Glu Glu Arg Leu Ala Trp Glu Ala Leu Arg Glu

115 120 125

Leu Ala Ala Thr Pro Ala Val Arg His Gly Leu Ala His Ala Ser Pro

130 135 140

Asp Leu Ser Ala Asp Leu Glu Lys Trp Leu Ala Asp Thr Gly Trp Arg

145 150 155 160

Pro Arg Pro Ser Thr Leu Ala Ser Leu Leu Arg Tyr Val Lys Arg Val

165 170 175

Ala Ala Lys Thr Ser Pro Phe Ser Thr Phe Thr Thr Val His Glu Val

180 185 190

Arg Trp Val Asp Gly Gly Ala Ala Trp Gln Val Pro Asp Thr Ala Pro

195 200 205

Thr Val Val Val Glu Ala Asp Val Gly Leu Arg Leu Leu Val Glu Ser

210 215 220

Val Leu Pro Arg Met Pro Glu Val Ala Ala Ala Arg Val Val Arg Leu

225 230 235 240

Ser Pro Ala Ala Tyr Ala Ser Gly Asp Arg Leu Ala Phe Pro Glu Pro

245 250 255

Gly Gly Arg Met Arg Ala Val Asp Arg Thr Ser Ala Leu Asp Thr Leu

260 265 270

Val Glu Leu Leu Arg Ala Glu Gln Arg Trp Asp Ala Ala Ile Ala Lys

275 280 285

Leu Thr Gly Ala Gly Leu Ala Gly His Gly Ala Glu Asp Gly Thr Arg

290 295 300

Asp Ser Ala Ser Asp Gly Thr Ala Ala Ala Glu Gln Val Leu Ser Gly

305 310 315 320

Leu Val Arg Gly Gly Leu Val Glu Ala Val Val Pro Val Pro Gly Gln

325 330 335

Ala Ala Arg Pro Phe Ala Arg Leu Ala Asp Trp Ala Ala Pro Ala Ala

340 345 350

Pro Ala Gly Pro Leu His Arg Ile Gln Val Ala Leu Asp Gln Ala Gly

355 360 365

Pro Leu Gly Asp Gly Asp Pro Leu Ala Ser Ala Cys Ala His Val Ala

370 375 380

Arg Arg Leu Thr Ala Glu Leu Pro Ala Leu Gly Leu Pro Val Met Pro

385 390 395 400

Val Pro Asp Leu Arg Arg Arg Val Leu Arg Glu Ser Ala Leu Gly Ala

405 410 415

Pro Val Ala Cys Ala Leu Arg Glu Trp Arg Pro Val Leu Ala Asp Leu

420 425 430

Gln Arg Val Arg Arg Trp Leu Ala Val His Asp Pro Met Leu Pro Leu

435 440 445

Arg Leu Thr Leu Ala Asp Arg Val Arg Asp Trp Phe Gly Pro Gly Ser

450 455 460

Ala Ala Pro Leu Leu Asp Val Tyr Ala Arg Val Arg Thr Ala Glu Pro

465 470 475 480

Gly Thr Pro Leu Asp Pro Asp Phe Leu Glu His Pro Asp Pro Leu Ala

485 490 495

Gly Val Thr Asp Pro Arg Leu Thr Arg Leu Arg Glu Leu Arg Ala Ala

500 505 510

Ser Val Ala Ala Leu Thr Gly Gly Arg Ala Glu Glu Ala Leu Ser Glu

515 520 525

Pro Pro Ala Trp Val Arg Asp Pro Gly Pro Val Thr Cys Tyr Val Gln

530 535 540

Pro Phe Gln Gly Glu Asp Gly Leu Arg Leu Val Leu Asn Ala Ala His

545 550 555 560

Gly Gly His Gly Arg Gly Ile Thr Arg Trp Thr Arg Leu Leu Gly Ala

565 570 575

Glu Pro Pro Pro Gly Glu Pro Pro Ala Ala Glu Ser Pro Pro Gly Glu

580 585 590

Ser Pro Pro Gly Glu Leu Pro Pro Gly Ala Cys Leu Val Ala Glu Leu

595 600 605

Pro Gly Thr Phe Gly His Ser Leu Asn Leu His Ala Pro Ala Thr Gly

610 615 620

Trp Glu Leu Thr Tyr Pro Gly Ala Val Asn Gln Ala Pro Pro Glu Arg

625 630 635 640

Arg Val Pro Leu Ala Glu Leu Gln Val Arg His Asp Ala Gly Arg Gly

645 650 655

Val Val Glu Leu Trp Trp Pro Arg Ala Gly Arg Arg Val Val Pro Val

660 665 670

His Ala Gly Met Met Ser Glu Thr Leu Leu Pro Pro Leu Ala Arg Leu

675 680 685

Leu Val Glu Ala Phe Gly Thr Thr His Leu Thr His Pro Thr Leu Pro

690 695 700

Pro Val Val Arg Ala Ala Gly Pro Arg Ile Asp Leu Gly Arg Val Thr

705 710 715 720

Leu Ala Arg Ala Gln Trp Thr Ala Arg Arg Glu Glu Ile Pro Arg Arg

725 730 735

Gly Gly Asp Asp Ala Ala His Leu Val Ala Val His Ala Trp Leu Arg

740 745 750

Ala Ala Gly Ile Pro Arg Arg Cys Phe Val Arg Val Arg Glu Pro Gln

755 760 765

Val Arg Arg Asp Arg Leu Ala Phe Asp Lys Arg His Lys Pro Val Phe

770 775 780

Val Asp Phe Gly Ser Trp Pro Ser Val Leu Glu Phe Asp Arg lle Val

785 790 795 800

Thr Arg Ala Thr Gly Asp Leu Glu Leu Thr Glu Ala Leu Pro Asp Gly

805 810 815

Glu Arg Ala Val Glu Leu Ala Ile Glu Ile Gly Ala Arg

820 825

<210>50

<211>344

<212>PRT

<213>野野村氏菌属物种

<400>50

Val Thr Arg Tyr Pro Leu Pro Arg Pro His Pro Leu Gly Ile His Pro

1 5 10 15

Gly Tyr Ala Arg Leu Arg Glu Gly Cys Pro Val Ala Arg Val Asp Ser

20 25 30

Pro Tyr Gly Pro Ala Trp Leu Ile Thr Arg Tyr Ala Asp Val Ala Ala

35 40 45

Val Leu Thr Asp Ala Arg Tyr Ser Arg Ala Ala Ala Thr Glu Asp Asp

50 55 60

Gly Gly Ile Leu Leu Asn Thr Asp Pro Pro Glu His Asp Arg Leu Arg

65 70 75 80

Arg Leu Val Val Ala His Thr Gly Ala Ala Ala Val Glu Arg Leu Arg

85 90 95

Pro Arg Ala Glu Glu Ile Ala Thr Thr Leu Ala Lys Arg Ile Pro Ala

100 105 110

Glu Ala Glu Phe Val Ser Ala Phe Ala Glu Pro Tyr Ser His Arg Val

115 120 125

Leu Ala Leu Phe Val Gly His Leu Val Gly Leu Pro Ala Gly Glu Leu

130 135 140

Ser Pro Met Ala Thr Val Leu Thr Leu Ala Arg Val Pro Asp Arg Glu

145 150 155 160

Arg Ala Ala Ala Phe Ala Glu Leu Arg Arg Arg Leu Arg Ser Gln Val

165 170 175

Asp Asp Glu Thr Leu Ala Val Val Leu Asn Ile Val Phe Gly Gly His

180 185 190

Ala Ala Val Val Ala Ala Leu Gly Tyr Cys Leu Leu Ala Ala Leu Ala

195 200 205

Glu Pro Leu Pro Ser Leu Thr Gly Asp Val Arg Arg Ile Ala Glu Leu

210 215 220

Val Glu Glu Thr Leu Arg Leu Ala Pro Pro Gly Asp Arg Thr Leu Leu

225 230 235 240

Arg Arg Thr Leu Glu Pro Val Glu Leu Gly Gly Arg Glu Leu Pro Ala

245 250 255

Gly Ala Leu Val Ile Pro Ser Ile Ala Ala Ala Gly Arg Asp Pro Asp

260 265 270

Arg Pro Thr Gly Gly Pro Ala Gly Arg His Leu Ala Phe Gly Arg Gly

275 280 285

Pro His Ala Cys Leu Gly Met Ala Leu Ala Arg Met Glu Leu Arg Val

290 295 300

Ala Leu Gln Ala Leu Ala Glu His Val Pro Gly Leu Arg Pro Ala Val

305 310 315 320

Ser Pro Ala Thr Leu Arg Arg Thr Cys Glu Glu Leu Ala Val Ser Pro

325 330 335

Leu Ala Gly Ile Pro Ile Arg Val

340

<210>51

<211>228

<212>PRT

<213>野野村氏菌属物种

<400>51

Met Val His Ala Phe Gly Val Arg Asn Arg Gly Arg Ile Val Ser Ala

1 5 10 15

Glu His His Tyr Arg Asp Arg Leu Arg Ala Leu Ser Ala Tyr Leu Arg

20 25 30

Lys Val Asp Asn Glu Pro Glu Ala Ala Ala Glu Leu Arg Ala Asp Pro

35 40 45

Glu Lys Ala Leu Arg Glu Ala Gly Val Asp Gln Ala Phe Asp Arg Pro

50 55 60

Glu Ala Phe Arg Ala Phe Val Gly Lys Leu Ala Val Leu Ser Gly Glu

65 70 75 80

Ala Trp Leu Ala Thr Val His Ser Met Ile Glu Leu Cys Glu Ile Gly

85 90 95

Ala Asp Pro Gln Pro Pro Ala Gly Pro Asn Ile Ser Phe Arg Ile Ser

100 105 110

Ser Asp Gly Gly Val Thr Ala lle Ala Asn Arg Gly Glu Ile Ala Lys

115 120 125

Lys Val Gln Pro Asn Pro Phe His Ala Gly Ser Ala Ala Ala Ser Pro

130 135 140

Gly Gly Arg Leu Arg Ile Tyr Pro Gly Tyr Ala Thr Ser Glu Leu Ser

145 150 155 160

Ala Arg Leu Gly Glu Arg Tyr Leu Ser Thr Phe Tyr Gln Arg Thr Leu

165 170 175

Leu Lys Arg Val Val Leu Asp Pro Gly Thr Val Val Glu Asp Ala Asp

180 185 190

Ala Gly Glu Gly Ile Thr Val Asn Arg Ser Gln Tyr Arg Gly Val Gly

195 200 205

Phe Glu Leu His Thr Arg Ala Asp Gly Ala Asp Arg Glu Ile Val Ala

210 215 220

Ala Leu Val Arg

225

<210>52

<211>372

<212>PRT

<213>野野村氏菌属物种

<400>52

Met Leu Ser Ser Ala Leu Glu Val Asp Ile Asp Glu Ala Ala Val Ala

1 5 10 15

Ala Asp Leu Arg Glu Leu Ala Ala Ala Leu Asp Arg Ser Gly Tyr Gly

20 25 30

Glu Ile Leu Thr Cys Phe Leu Pro His Lys Ala Gln Ala His Ile Trp

35 40 45

Ala Gln Thr Ala Ala Lys Ile Asp Gly Pro Leu Arg Thr Leu Met Glu

50 55 60

Leu Phe Leu Leu Gly Arg Ala Val Pro Gln Asp Asp Leu Pro Ala Arg

65 70 75 80

Val Gly Asp Leu Ile Pro Gly Leu Ala Ala Thr Gly Leu Val Gln Thr

85 90 95

Gly Gln Gly Ala Val Trp Leu Pro Asn Leu Ile Leu Leu Arg Pro Met

100 105 110

Gly Gln Trp Leu Trp Cys Gln Arg Pro His Pro Ser Pro Thr Met Tyr

115 120 125

Phe Gly Asp Asp Ser Leu Ala Leu Val His Arg Met Val Thr His Arg

130 135 140

Gly Gly His Thr Leu Asp Leu Cys Ala Gly Pro Gly Val Gln Ala Leu

145 150 155 160

Thr Ala Ser Leu Arg Ser Asp Arg Val Thr Ala Val Glu Ile Asn Pro

165 170 175

Val Ala Ala Ala Leu Cys Arg Thr Asn Ile Ala Met Asn Gly Leu Gly

180 185 190

Asp Arg Met Glu Val Arg Leu Gly Asp Leu Tyr Gly Ala Val Pro Gly

195 200 205

Glu Val Phe Asp Asp Ile Val Ser Asn Pro Pro Leu Leu Pro Val Pro

210 215 220

Glu Asp Val Gln Phe Ala Phe Val Gly Asp Gly Gly Arg Asp Gly Phe

225 230 235 240

Asp Ile Ser Trp Thr Ile Leu Asp Gly Leu Pro Glu His Leu Ser Asp

245 250 255

Arg Gly Ala Cys Arg Ile Val Gly Cys Val Leu Ser Asp Gly Tyr Val

260 265 270

Pro Val Val Met Asp Gly Leu Gly Lys Trp Ala Val Glu His Asp Phe

275 280 285

Asp Val Leu Leu Thr Val Thr Ala His Val Glu Ala His Arg Asp Ser

290 295 300

Ser Phe Leu Arg Ser Met Ser Leu Met Ser Ser Ala Ile Ser Gly Glu

305 310 315 320

Pro Ala Asp Val Leu Gln Glu Arg Tyr Ala Ala Asp Tyr Ala Glu Leu

325 330 335

Gly Gly Ser His Val Ala Phe Tyr Glu Leu Cys Ala Arg Arg Gly Gly

340 345 350

Gly Thr Ala Arg Leu Ala Asp Val Ser Ala Thr Lys Arg Ser Ala Glu

355 360 365

Val Trp Phe Val

370

<210>53

<211>122

<212>PRT

<213>野野村氏菌属物种

<400>53

Val Tyr Val Val Ile Val Ala Phe Asp Leu Lys Glu Ser Ser Val Asp

1 5 10 15

Phe Ala Glu Leu Arg Ala Trp Val Arg Asp Arg Ala Ala Asp Asp Tyr

20 25 30

Ser Arg Leu Pro Gly Met Arg Phe Lys Thr Trp Phe Ser Asp Glu Arg

35 40 45

Lys Arg Leu Trp Gly Ala Val Tyr Leu Val Glu Ser Met Leu Ser Phe

50 55 60

Asp Arg Asp Asn Leu Pro Leu Leu Pro Asp Gly Arg Thr Gly Pro Val

65 70 75 80

Gly Thr Arg Pro Thr Ser Val Met Val Leu Glu Leu Glu Ala Phe Val

85 90 95

Thr Gly Pro Asp Gly Leu Asp Gly Ile Glu Ala Leu Ala Arg Gln Gly

100 105 110

Leu Ser Met Thr Gly Gly Gly His Asp His

115 120

<210>54

<211>416

<212>PRT

<213>野野村氏菌属物种

<400>54

Met Thr Thr Glu Ala Thr Thr Ala Val Thr Thr Arg Ala Asn Ala Gly

1 5 10 15

Ala Leu Ser Leu Pro Ala Arg Gly Thr Asp Arg Pro Leu Leu Leu Tyr

20 25 30

Val Asn Ile Pro Phe Cys Asn Ser Lys Cys His Phe Cys Asp Trp Val

35 40 45

Val Asp Val Pro Val Ser Asp Leu Arg Leu Ala Pro Ala Ala Pro Arg

50 55 60

Arg Val Asp Tyr Leu Ala Ala Leu Cys Thr Gln Ile Arg Thr His Ala

65 70 75 80

Pro Ala Leu Arg Ala Ala Gly Tyr Arg Gly Glu Val Met Tyr Trp Gly

85 90 95

Gly Gly Thr Ala Thr Val Leu Thr Ala Ala Glu Ile Glu Gln Val His

100 105 110

Ala Cys Leu Ala Ala Glu Phe Asp Leu Thr Ala Leu Ala Glu Ala Thr

115 120 125

Ile Glu Gly Ser Pro Glu Ser Val Asp Pro Ala Lys Leu Arg Leu Leu

130 135 140

Arg Asp Leu Gly Phe Asp Arg Val Ser Leu Gly Val Gln Ser Phe Asp

145 150 155 160

Glu Thr Arg Leu Arg Arg Ile Gly Arg Ala His Ser Ala Gly Gln Ala

165 170 175

Val Arg Ser Val Glu Asp Ala His Ala Ala Gly Phe Asp Asn Ile Asn

180 185 190

Ile Asp Leu Ile Val Gly Phe Pro Asp Gln Ser Leu Ala Glu Val Glu

195 200 205

Gln Thr Val Arg Arg Ala Leu Asp Leu Pro Val Asn His Phe Ser Val

210 215 220

Tyr Ser Tyr Arg Ala Thr Glu Gly Thr Val Met Arg Arg Gln Ile Glu

225 230 235 240

Arg Ser Gly Thr Ala Ile Glu Leu Glu His Gln Leu Gln Ser Tyr Arg

245 250 255

Leu Ala Gly Glu Met Leu Ala Ala Ala Gly His Pro Glu Tyr Ala Val

260 265 270

Ser Tyr Phe Gly Ala Pro Arg Cys Leu Ala Asp Glu Ala Tyr Tyr Arg

275 280 285

Leu Ser Met Asp Trp Ile Gly Phe Gly Thr Gly Ala Asn Ser Leu Ile

290 295 300

Asn Gln Arg Tyr Leu Leu Asn Gly Arg Gly Arg Met Arg Asp Phe Thr

305 310 315 320

Ser Arg Pro Gly Glu Phe Glu Val Asp Leu Pro Ala Gly Val Pro Ser

325 330 335

Leu Thr Val Gln Trp Leu Pro Arg Ala Leu Gly Thr Ala Glu Gly Ile

340 345 350

Asp Ala Ala Thr Phe Gln Arg Arg Thr Gly Thr Ser Leu Arg Ala Ala

355 360 365

Cys Glu Glu Pro Glu Leu Asn Ala Phe Leu Thr Arg Val Asn Glu Phe

370 375 380

Gly Arg Leu Val Val Asp Arg Asp Gly Ile Arg Leu Ala Asp Glu Asn

385 390 395 400

Arg Ser Asp Val Leu Ser Arg Thr Phe Ala Ala Met Gly Trp Val Ser

405 410 415

<210>55

<211>339

<212>PRT

<213>野野村氏菌属物种

<400>55

Val Glu Ala Met Arg Thr Leu Leu Ala Ala Ala Asp Leu Val Thr Pro

1 5 10 15

Met Ala Leu Arg Val Ser Ala Thr Leu Arg Leu Ala Asp His Leu Ala

20 25 30

Ala Gly Thr Thr Gly Ala Ala Glu Leu Ala Ala Ala Ala Gly Val Asp

35 40 45

Glu Ala Ala Leu Thr Arg Leu Leu Arg Tyr Leu Val Ala Arg Gly Val

50 55 60

Phe Thr Glu Pro Ala Pro Gly Glu Phe Gly Leu Asn Pro Ala Ala Glu

65 70 75 80

Leu Leu Arg Asp Gly Arg Pro Asp Arg Leu Arg Asp Trp Leu Asp Leu

85 90 95

Thr Gly Pro Ile Gly Arg Ala Asp Leu Ala Phe Gly Ser Leu Leu Asp

100 105 110

Val Val Arg Thr Gly Lys Pro Gly Tyr Pro Met Ile Hi s Gly Arg Gly

115 120 125

Phe Trp Asp Asp Leu Ala Ala Glu Pro Ala Leu Ala Thr Ala Tyr Asp

130 135 140

Thr Leu Met Gly Gly Lys Arg Gln Trp Ala Ala Thr Thr Leu Ala Ala

145 150 155 160

Leu Asp Trp Ser Arg Ser Arg His Val Val Asp Val Gly Gly Gly Asn

165 170 175

Gly Thr Leu Leu Ser Cys Leu Leu Ala Ala His Pro His Leu Arg Gly

180 185 190

Thr Val Val Asp Arg Pro Thr Ser Ala Lys Ala Ala Gly Ala Val Leu

195 200 205

Ala Ser Ala Gly Val Ala Asp Arg Gly Glu Phe Arg Ala Gly Asp Phe

210 215 220

Phe Glu Pro Leu Pro Val His Gly Ala Asp Thr Tyr Leu Leu Ser Ser

225 230 235 240

Ile Leu His Asp Trp Asp Asp Ala Ala Ala Thr Ala Ile Leu Arg Arg

245 250 255

Cys Ala Glu Ala Ala Ala Pro Gly Gly Arg Val Leu Leu Cys Glu Leu

260 265 270

Val Ala Met Ala Gly Pro Asp Arg Arg Thr Val Thr His Met Asp Leu

275 280 285

Cys Met Leu Val Tyr Phe Gly Gly Arg Glu Arg Thr Ala Ala Asp Phe

290 295 300

Ala Ala Leu Ala Gly Ala Ala Gly Leu Glu Pro Arg Ser Val Thr Pro

305 310 315 320

Leu Pro Pro His Asp Trp Gly Asn Ala Leu Val Glu Tyr Ala Val Pro

325 330 335

Ala Ala Arg

<210>56

<211>204

<212>PRT

<213>野野村氏菌属物种

<400>56

Met Ala Lys Val Ile Ser Thr Leu Phe Ile Ser Ala Asp Gly Val Ala

1 5 10 15

Glu Ile Asp Pro Asp Trp His Phe Pro Tyr Phe Asp Glu Asn Met Gly

20 25 30

Arg Ala Val Gly Glu Asp Tyr Asp Thr Ala Asp Val Leu Leu Ile Gly

35 40 45

Arg Glu Thr Phe Asp Ser Phe Ala Gly Ala Trp Pro Asp Arg Glu Ala

50 55 60

Ala Gly Gly Asp Asp Ala Pro Phe Ala Lys Gln Leu Gly Asp Met Arg

65 70 75 80

Lys Val Val Val Ser Arg Gln Pro Leu Glu Phe Ser Trp Arg Asn Cys

85 90 95

Glu Leu Ile Thr Gly Asp Leu Leu Asp Ala Val Thr Ser Leu Lys Ala

100 105 110

Asp Ala Gly Ile Arg Gly Ile Leu Ile Pro Gly Ser Ile Ser Val Val

115 120 125

Gln Gln Leu Leu Ala Ala Gly Leu Val Asp Glu Leu Arg Leu Leu Val

130 135 140

His Pro Val Ala Ala Arg Lys Gly Arg Arg Leu Phe Asp Asp Gly Asp

145 150 155 160

Ala Pro Tyr His Leu Ser Val Thr Ala Thr Glu Thr Phe Pro Thr Gly

165 170 175

Val Ile Arg Val Ile Tyr Ser Pro Thr Glu Ala Pro Thr Lys Val Gly

180 185 190

Tyr Asp Glu Val Glu Ala Gln Val Ser Thr Gly Glu

195 200

<210>57

<211>403

<212>PRT

<213>野野村氏菌属物种

<400>57

Met Thr Lys Pro Leu Leu Ile Tyr Ala Asn Val Pro Phe Cys Asn Ser

1 5 10 15

Lys Cys His Phe Cys Asp Trp Val Val Gln Val Pro Val Arg Asp Leu

20 25 30

Arg Leu Gly Glu Gln Ser Pro Gly Arg Val Ala Tyr Leu Glu Ala Ile

35 40 45

Arg Thr Gln Ile Arg Val Gln Ala Pro Ala Leu Arg Glu His Tyr His

50 55 60

Pro Asp Ile Val Tyr Trp Gly Gly Gly Thr Ala Ser Ile Leu Gly Pro

65 70 75 80

His Glu Ile Glu Ser Leu Tyr Gly Thr Leu Ser Ala Glu Phe Asp Leu

85 90 95

Ser Thr Val Arg Glu Ala Thr Ile Glu Gly Ser Pro Glu Ser Leu Asp

100 105 110

Arg Asp Lys Leu Arg Leu Leu Arg Glu Leu Gly Phe Asn Arg Ile Ser

115 120 125

Ile Gly Val Gln Ser Phe Asp Asp Ala Arg Leu Arg Arg Leu Gly Arg

130 135 140

Ala His Ala Ala Asp Gln Ala Leu Thr Ala Val Gln Asp Ala His Glu

145 150 155 160

Ala Gly Phe Thr Asn Ile Asn Ile Asp Leu Ile Val Gly Phe Pro Gly

165 170 175

Gln Thr Gly Gln Glu Val Ala Asp Ser Val Arg Thr Ala Leu Thr Leu

180 185 190

Pro Ile Asn His Phe Ser Ile Tyr Pro Tyr Arg Ala Ser Pro Gly Thr

195 200 205

Val Leu Arg Lys Gln Val His Arg Gly Ala Gln Leu Asp Leu Asn Leu

210 215 220

Gln Leu Gln Ala Tyr Gly Ile Ala Arg Glu Leu Leu Glu Ala Ala Gly

225 230 235 240

Phe Pro Glu Tyr Ala Met Ser Tyr Phe Gly His Pro Arg Cys Gln Ser

245 250 255

Asp Glu Ala Tyr Tyr Gln Leu Arg Met Asp Trp Ile Gly Phe Gly Ser

260 265 270

Gly Ala Asn Ser Leu Ile Gly Arg Arg Tyr Leu Ser Tyr Glu Lys Gly

275 280 285

Lys Leu Ala His Tyr Asn Thr Asn Pro Leu Ala Phe Asp Ile Asn Ala

290 295 300

Pro Ala His Ser Pro Gln Leu Thr Leu His Phe Leu Ser Gln Ala Leu

305 310 315 320

Thr Thr Ala Glu Gly Leu Asp Ala Arg Leu Tyr Gln Gln Arg Thr Gly

325 330 335

Val Pro Leu Arg Thr Ala Cys Ser His Pro Glu Val Met Thr Tyr Leu

340 345 350

Glu Arg Met Asn Asn His Gly Arg Leu Ile Ala Asp His Asn Gly Ile

355 360 365

Arg Leu His Arg Asp Asp Ile Ala Gln Thr Phe Ile Ala Leu Asn Trp

370 375 380

Ile Pro Thr Pro Asp Thr Thr Pro Asn Glu Val Ile Pro Leu Thr Pro

385 390 395 400

Ser Pro Thr

<210>58

<211>387

<212>PRT

<213>野野村氏菌属物种

<400>58

Met Thr Ala Pro Val Arg Pro Pro Ser Val Thr Asp Gly Gly Thr Ser

1 5 10 15

Leu Phe Ala Trp Leu Arg Glu Met Arg Asp Thr His Pro Val Trp Arg

20 25 30

Asp Ser Tyr Gly Met Tyr His Val Phe Arg Tyr Asp Asp Val Arg Ala

35 40 45

Val Leu Ala Asp His Glu Arg Phe Ser Ser Asp Arg Thr Arg Leu Met

50 55 60

Gly Arg Gln Pro Phe Gly Gln Gly Gly Ile Thr Met Ile Asp Pro Pro

65 70 75 80

Glu His Arg His Gln Arg Arg Leu Ile Thr Ala Ala Phe Thr Pro Ser

85 90 95

Ser Val Ala Ala Leu Glu Pro Arg Ile Ala Ala Ile Ala Asp Glu Leu

100 105 110

Leu Asp Ala Leu Pro Gly Pro Asp Phe Asp Leu Val Glu Ser Leu Ala

115 120 125

Tyr Pro Leu Pro Val Thr Val Val Ala Glu Leu Leu Gly Val Pro Pro

130 135 140

Ser Asp Arg Asp Leu Phe Arg Thr Trp Ser Asp Arg Leu Met Ser Leu

145 150 155 160

Gln Val Pro Asp Phe Ala Asp Pro Ser Leu Ala Gly Arg Val Ala Ala

165 170 175

Ala Met Ala Glu Met Asn Asp Tyr Leu Arg Glu His Cys Ala Asp Arg

180 185 190

Arg Thr Arg Pro Arg Asp Asp Leu Leu Thr Arg Leu Val His Ala Glu

195 200 205

Ile Asp Gly Glu Arg Leu Asp Ala Glu Gln Val Val Asn Thr Ala Ser

210 215 220

Leu Leu Leu Leu Ala Gly His Val Thr Thr Thr Val Leu Ile Gly Asn

225 230 235 240

Thr Val Leu Cys Leu Ala Asp Ala Pro Glu Ala Ala His Arg Thr Arg

245 250 255

Ala Asp Met Ser Leu Ile Pro Gln Ala Leu Glu Glu Ser Met Arg Leu

260 265 270

Arg Ser Pro Phe Met Gln Ala Gly Arg Val Thr Thr Gln Asp Val Gln

275 280 285

Val Ala Gly Glu Thr Ile Pro Ala Asn Arg Phe Val Met Ala Trp Leu

290 295 300

Leu Ser Ala Asn His Asp Glu Arg His Phe Ala Asp Pro Glu Arg Phe

305 310 315 320

Asp Leu Asp Arg Gln Leu Thr Gly Gln Leu Ala Phe Gly His Gly Val

325 330 335

His Phe Cys Leu Gly Ala Gln Leu Gly Arg Leu Glu Gly Arg Ile Ala

340 345 350

Leu Glu Arg Leu Leu Ser Arg Phe Thr Glu Leu Arg Pro Glu Lys Arg

355 360 365

Ser Phe Tyr Glu Ser Gln Ile Phe Gly Val Arg Glu Met His Val Arg

370 375 380

Gly Ser Ser

385

<210>59

<211>406

<212>PRT

<213>野野村氏菌属物种

<400>59

Val Asn Glu Thr His Val Pro Pro Asp Pro Thr Met Thr Met Pro Ile

1 5 10 15

Asp Ser Arg Pro Arg Ile Lys Asp Gly Gly Gln Thr Leu Leu Lys Trp

20 25 30

Leu Gly Thr Met Arg Asp Glu Gln Pro Val Trp Arg Asp Ala Phe Gly

35 40 45

Ile Phe His Val Phe Arg His Ala Ala Val Gln Arg Val Met Ser Asp

50 55 60

Tyr Ala Ala Phe Ser Ser Asp Ile Asn Arg Leu Arg Pro Gly Gly Asp

65 70 75 80

Pro Phe Ser Ala Gly Ser Leu Met Leu Thr Asp Pro Pro Glu His Arg

85 90 95

Lys Leu Arg Lys Leu Ile Ser Gln Ala Phe Thr Pro Lys Met Ser Ser

100 105 110

Asp Met Val Pro Arg Ile Ala Glu Leu Thr Thr Ala Leu Leu Asp Glu

115 120 125

Ile Asp Glu Asp Glu Phe Asp Leu Val Glu Lys Ile Ala His Pro Leu

130 135 140

Pro Val Met Val Ile Ala Glu Leu Leu Gly Ile Pro Ile His Asp Arg

145 150 155 160

Glu Leu Phe Arg Thr Trp Ala Asp Arg Leu Val Ala Leu His Val Glu

165 170 175

Asp Pro Arg Asp Ile Glu Ile Gly Arg Met Val Gly Gln Ala Met Arg

180 185 190

Glu Met Gly Glu Tyr Val Leu Thr His Val Arg Glu Arg Arg Thr Arg

195 200 205

Pro Gln Asp Asp Leu Val Ser Arg Leu Val Ala Ala Glu Val Asp Gly

210 215 220

Asp Arg Leu Thr Asp Ala Glu Ile Val Asn Ser Ala Cys Leu Leu Leu

225 230 235 240

Leu Ala Gly Gln Ile Thr Ser Thr Met Ala Leu Gly Asn Ala Phe Leu

245 250 255

Cys Phe Arg Asp Ala Pro Gly Val Glu Ser Ala Val Arg Ala Asp Arg

260 265 270

Glu Leu Ile Ala Pro Ala Phe Glu Glu Val Leu Arg Leu Arg Pro Pro

275 280 285

Leu Thr Gln Ala Ala Arg Leu Pro Thr Ala Asp Val Glu Ile Asp Gly

290 295 300

Thr Pro Ile Pro Ala Gly Ser Met Val Ile Asn Trp Leu Leu Ser Ala

305 310 315 320

Asn Tyr Asp Glu Arg Gln Phe Pro Asp Pro Tyr Arg Leu Asp Pro Gly

325 330 335

Arg Gln Pro Asn Arg Gln Tyr Ala Phe Gly His Gly Ile His Phe Cys

340 345 350

Leu Gly Ala Pro Leu Ala Arg Val Glu Gly Lys Val Ala Leu Glu Leu

355 360 365

Val Phe Asp Arg Phe Glu Gln Val Glu Ile Asp Pro Asp Ala Glu Leu

370 375 380

Ser Tyr Tyr Glu Asp Pro Met Phe Gly Val Lys Ser Leu Pro Val Arg

385 390 395 400

Val Lys Arg Ala Pro Arg

405

<210>60

<211>243

<212>PRT

<213>野野村氏菌属物种

<400>60

Met Ser Thr Val Ser Thr Arg Ser Thr Gly Ala Arg Thr Ser Asp Asp

1 5 10 15

Arg Val Arg Arg Thr Leu Asp Val Thr Arg Ser Leu Leu Leu Arg Ser

20 25 30

Gly Tyr Lys Arg Thr Thr Met Asp Glu Ile Ala Arg Arg Ala Asp Ile

35 40 45

Gly Lys Gly Thr Ile Tyr Leu Ser Trp Asp Thr Lys Asp Asp Leu Ile

50 55 60

Arg Thr Leu Val Ile Gln Glu Ile Val Gly Val Cys Gln Asp Ile Ser

65 70 75 80

Arg Ile Ala Val Leu Arg Pro Ala Val Ala Arg Leu Ser Glu Phe Ser

85 90 95

Arg Glu Leu Phe Thr Leu Val Phe Lys Tyr Pro Leu Phe Arg Ala Leu

100 105 110

Tyr Thr Tyr Asp Lys Glu Thr Leu Gly Arg Ala Cys Asp Asp Pro Gln

115 120 125

Leu Gly Phe Gln Cys Tyr Arg Phe Thr Thr Phe Thr Pro Phe Arg Asp

130 135 140

Tyr Leu Arg Met Leu His Glu Ser Gly Met Trp Asp Pro Ser His Gly

145 150 155 160

Phe Ala Leu Asp Ala Leu Leu Ser Gly Phe Ile Lys Leu His Leu His

165 170 175

Ala Glu Ile Ala Gly Ala Lys Pro Asp Leu Ala Ala His Ala Asp Ser

180 185 190

Leu Ala Gly Leu Ile Arg Ser Ser Phe Glu Pro Ala Asp Gln Val Pro

195 200 205

Ala Glu Glu Leu Thr Asp Pro Ala Arg Arg Thr Val Glu Ile Phe Asp

210 215 220

Gly Ala Ala Ala Lys Tyr Arg Ala Lys Leu Ile Pro Gln Pro Leu Ala

225 230 235 240

Ala Ser Val

<210>61

<211>444

<212>PRT

<213>野野村氏菌属物种

<400>61

Met Thr Thr Glu Pro Phe Pro Ala Pro Thr Gly Pro Pro Ala Ala Pro

1 5 10 15

Thr Gly Pro Ser Pro Ala Leu Ala Glu Pro Ser Ala Ala Ser Pro Gly

20 25 30

Pro Leu Ser Val Arg Gln Gly Pro Ser Pro Val Thr Ala Glu Leu Arg

35 40 45

Asp Leu Ala Ile Phe Arg Ala Asp Leu His Ala His Pro Glu Leu Ser

50 55 60

Trp Gln Glu Ala Arg Thr Ala Asp Arg Leu Ala Gly Arg Leu Ala Ala

65 70 75 80

Ala Gly Tyr Glu Val Thr Thr Gly Met Gly Gly His Gly Val Val Gly

85 90 95

Arg Leu Cys Arg Gly Asp Gly Val Thr Val Met Leu Arg Ala Glu Leu

100 105 110

Asp Ala Leu Pro Val Lys Glu Glu Thr Gly Leu Ser Tyr Ala Ser Thr

115 120 125

Ala Thr Ala Thr Thr Leu Asp Gly Arg Thr Val Pro Val Ser His Ala

130 135 140

Cys Gly His Asp Leu His Leu Ala Cys Leu Val Gly Ala Ala Arg Arg

145 150 155 160

Leu Ala Ala Cys Asp Asp Trp Arg Gly Thr Val Leu Val Ile Gly Gln

165 170 175

Pro Ala Glu Glu Thr Leu Glu Gly Ala Ala Ala Met Leu Ala Asp Gly

180 185 190

Leu Tyr Glu Arg Phe Gly Val Pro Asp Val Ala Leu Ala Gln His Val

195 200 205

Ser Pro Phe Pro Ala Gly Leu Ile Ala Tyr Pro Glu Pro Pro Thr Ala

210 215 220

Ala Gly Ala Glu Leu Arg Val Val Val Thr Gly Asp Gly Gly His Val

225 230 235 240

Gly AspIle Gly Arg Ala Gly His Val Asp Arg Ala Val Gly Arg Asn

245 250 255

Pro Val Ala Ala Val Ala Ala Leu Val His Arg Leu Asp Gln Thr Ala

260 265 270

Phe Asp Gln Ala Ile Val Thr Val Gly Thr Leu His Ala Gly Glu Arg

275 280 285

Ala Asn Val Ile Pro Thr Leu Ala Glu Ala Gly Ile Thr Val Arg Ala

290 295 300

Ala Thr Glu Glu Ala Val Thr Arg Ala Val Ala Arg Val Ala Arg Leu

305 310 315 320

Ala Glu Glu Thr Ala Gly Ala Gly Val Ile Val Val Ser Arg Val Pro

325 330 335

Pro Gly Val Asn Asp Pro Ala Ala Thr Ala Leu Val Arg Arg Ala His

340 345 350

Glu Ala Ala Leu Gly Ala Val Val Thr Ala Pro Gly Gly Ser Ala Cys

355 360 365

Glu Asp Phe Pro Leu Tyr Gly Val Pro Ser Val Tyr Trp Tyr Val Gly

370 375 380

Ala Ala Pro Pro Ala Gly Leu Val Gly Arg Pro His Thr Gly Thr Phe

385 390 395 400

Arg Pro Asp Pro Val Pro Thr Leu Arg Ala Gly Val Thr Ala Met Gln

405 410 415

Thr Ala Ala Leu Ala Val Leu Ala Asn Ala Ser Gln Phe Ala Pro Pro

420 425 430

Ser Arg Tyr His Gly Pro Gly Ala Val Ala Glu His

435 440

<210>62

<211>22848

<212>DNA

<213>野野村氏菌属物种

<400>62

gtgacggcgc ggcgacgcga cgtcgaacgg gtggatcgga tcgttgacgc ggcagcggaa 60

ctgctgcctg agcggggata tcggcgactg acggtcgagg aggtcgcaag ccgggcgggc 120

gtctccaaaa gcagcgtcta cctgcactgg aacaccaagg acgaaatctt ctacgccgtg 180

ctggaccgcg agttcaccgt gctggcgcag gcggccgtgg accgggtcag gcgcgatcca 240

gccgaggtgc tggcgcaccg gacggcggcc aacctcttcc agatcgtcgc ctgccggcca 300

ctgctacagg cgttactcgt cgacgaccgg acaacgctcg gatcgctgca acccgcgaaa 360

tctgctgttt tccgggccag cctcgcgaat ctcaacgaac tgatgtatcg ctatcttcac 420

gcgctacgca taaacggact tctctgcccc gaggtcgacc cgcgtattat gcggaaagcg 480

atttctgaaa tgctgcgcgg aatgacgttc tccgcgggcg cgaaaccgtt ggccgagaca 540

cggctggcca agttgtccca ggtcgtcgcg gtgaccgtgc agcgcgcctt cgaaccgggc 600

gacgtgcccg aactcgaccg gatcaacgcc gccgcggcgg aggtgttcaa ggcgttcgac 660

gagctcatgc cggccgagga gacgatgcgc gccgaacgcc cggtggcgct gtgaccgtgg 720

tgcgcgcgca cgtccgccag gagccggccg cgctcgtcgt cggtcgcggc ctgctcgccg 780

accggctcgc ggcggtgacc ggccggctag accccggagt ggtgctcgcg gtgtcggacg 840

cgccggaccc cgccgtgctc gcggaggcca gggcgacggg ccggcccgtg ctgcccgtgc 900

tcgccgagcc gggccgggta cgggtcgggc cgctggaacg gccgggcgag ccgggctgct 960

ccgactgcct gagcctgcgc aggcaccgcg ccgccagccg gtcggccgaa cgggccgccg 1020

cctggctccg gcacggcccg gacctggccg ccacgccctc gccgctgctc gcgccggtgg 1080

cgctcgacct ggtggccgag ctggtcaccg cgctggtcac cgcccccgcg ccggcccacc 1140

gtggcatcct gctggccgac ctgtccgacc tgagcgtgac accgcacgcc ttcctgcccg 1200

atccgttctg cccgcgctgc ggcaccctgc ccgacgacga cccggcgcgg gcgcggatca 1260

cgctcgtgcc gcgcccgaaa ccgtcgccgg accggcaccg ggtgtgggac gccgaaggcc 1320

ggctcgaccg gctcaggcag atctacgtcg acgaccactg cggcctggtc cactcgctca 1380

acccggccgc gctgggctcg ctcgccgtcg ccggtgcgcc gatccggctg cgcggcacca 1440

ccgccttcga acccggattc ggccgctccc gcagctaccg ccggagctcc gtcatcgcgc 1500

tgctcgaagc cctggaacgg tacggcgcga tcggtcccgg tggcaggcgc ggcaccgtgc 1560

gcgccagcta cgcctccctc gggaacctgg cggtggatcc caggtcgctg gggttgcacc 1620

cgcccgagca ctacgcgctg ccgggcttcc cctaccggcc gttcaccccg gaagcggtgt 1680

gccgctggct gtgggggcac tcgttcgcca ccggcggccc ggtgctggtg cccgagcgca 1740

acgtccacta cggcccgtcc gacgacgatc ggccgttctg ctacgagctc gccaatggct 1800

gcgctctcgg ctcgtgcctg gaggaggccg tcttccacgg cattctggag gtgctggaac 1860

gcgacgcgtt cctgctgacc tggtacaccc gcgcccgcgc gccgcggctc gacctcggca 1920

ccgcccgcga ccccacgatc ccgctggtcg ccgccgcgat cacggcggag accggctatc 1980

tcgtcgagtg ctacgacatc acgcccgacc acggggtgcc ctgcgtgtgg gcgctggccc 2040

gccatccttc cgacggcgag ccggccacga tcagcgccgc ggcggccggc cccggcctgg 2100

aacccgccgc cgccggcgcg ctggccgagc tcggaccgat ggtgccgacc gtgcgcgacc 2160

acttcccaca gcacgccggc cgggcgcggg agctggccgc ggacggccgg cgggtgcgat 2220

ccatgatcga ccactatctc gtgtacggcg tgcggtcggc ggcacgccgc ttgtcgttcc 2280

tcaccgacgg cacggaggag gtgcccttcg cgcccgcacc ggacggcttc cggcacgacg 2340

acctcaccgc cgacctgagg ttcctcctcg accggctggc ggacagcggg ctcgacgtgg 2400

tcgtggtgga cctgaccacg ccggagcacc gcgcgggcgg gcttcgctgc gtgaaggtgc 2460

tggtgcccgg tacggtgccg atgacgttcg gcgagcagaa ccgccgcacg tggggcctgc 2520

cgaggctgct cgacccggcc gtggtgcggg ggcgcggcat gccggtacgc ggccacgctg 2580

atctgaaccc cgacccccac cccttcccgt gagccgccac gcgccgcccg ccgtcgcccg 2640

ggtgggcggg ctgccggccg ccgcgctgca cggggtggcc tgccccgagg cgacccggct 2700

cgccggccgc gtggtccacc tcaccgagga gctgacccga cgcgccgcgg tgctgtccga 2760

cgctctctac gaggtgatcg gcgccgccgg cgcgcacaag ccgatcctgg tggcgatccg 2820

ccgcgacctg cacgggctgc gccggcccaa acgcgtcgag gtgctgcccg cgccgttggc 2880

cgagccggtc cggacgtgga tctcgctgtg ggaagagcgc gcccgcgtcc acgccgtgct 2940

gccggacgtg ctcgcccgcg aggagcgctt ggcctgggag gcgctgcggg agctcgccgc 3000

gaccccggcg gtgcggcacg ggctcgcgca cgccagcccg gacctctccg ccgacctgga 3060

gaaatggctc gccgatacgg ggtggcggcc gcgaccgagc acgctggcga gcctgctgcg 3120

gtacgtgaag cgcgtggcgg ccaagacgag ccccttcagc acgttcacca ccgtccacga 3180

ggtccgctgg gtggacggcg gcgcggcctg gcaggtgccg gacacggcgc cgaccgtggt 3240

ggtggaggcc gacgtggggc tccggctgct ggtcgagtcc gtgctgccgc gcatgcccga 3300

ggtggccgcc gcgcgggtgg tgcggctgtc gccggccgcg tacgcgtcgg gggaccggct 3360

ggcgttcccg gaaccgggcg ggcggatgcg cgcggtggac cggacctccg cactggacac 3420

cctggtcgag ctgctgcgcg ccgagcagcg gtgggacgcg gcgatcgcca agctcaccgg 3480

tgccggcctg gcaggccacg gagcagagga cggtacgcgt gacagcgcga gcgacggaac 3540

ggcggcggcc gagcaggtgc tgagcgggct ggtgcgcggc gggctggtgg aggccgtcgt 3600

gccggtgccc ggccaggcgg cccgtccgtt cgcgcgcctc gccgactggg cggcgcccgc 3660

tgcgcccgcc ggcccgctgc accgtatcca ggtggccttg gaccaggccg ggccgctcgg 3720

cgacggcgac ccgttggcgt cggcctgcgc ccacgtggcc cgccgcctca ccgccgaact 3780

ccccgccctg ggcctgcccg tcatgccggt gcccgacctg cgccgtcgtg tgctgcgcga 3840

gtcggcgctc ggcgcgccgg tcgcctgcgc gctgcgggag tggcgacccg tgctggccga 3900

cctccaacgg gtccgccgct ggctcgccgt gcacgacccg atgctgccgc ttcgcctcac 3960

cctggccgac cgggtacgcg actggttcgg ccccggctcg gccgcgcccc tgctggacgt 4020

gtacgccagg gtccggaccg ccgaaccggg cacgcccctg gatcccgact tcctcgaaca 4080

ccccgacccg ctcgccggcg tcaccgaccc gcgcctgacc cgcctgcgcg agctgcgcgc 4140

cgcgtcggtc gccgcgctca ccggggggcg ggcggaggag gcgctgagtg agccgccggc 4200

ctgggtacgc gatccggggc cggtcacctg ctatgtccag ccgttccagg gggaggacgg 4260

cctgcggctg gtcctcaacg ccgcccacgg cggtcacggc cggggcatca cccgctggac 4320

caggctgctg ggcgccgagc cgccgcccgg cgagcccccg gctgccgagt ccccgcccgg 4380

tgagtccccg cccggtgagc tcccgcccgg tgcgtgcctg gtcgccgagc tgccgggcac 4440

gttcggccac agcctcaacc tgcacgcgcc cgccaccggc tgggagctga cctacccggg 4500

cgcggtgaac caggccccgc cggagcgccg cgtcccgctg gccgagctcc aggtccggca 4560

cgacgccggg cgaggcgtcg tcgagctgtg gtggccgcgc gccggccggc gcgtcgtgcc 4620

ggtgcacgcc ggcatgatgt cggagacgct gctgccgccc ctggcccgcc tgctcgtcga 4680

ggcgttcggc accacccacc tcacccatcc gaccctgccg cccgtggtgc gggccgccgg 4740

tccgcgcatc gacctgggcc gcgtcacgct cgccagggcc cagtggacgg cccgccgcga 4800

ggagattccg cggcggggcg gcgacgacgc cgcccacctc gtcgccgtcc acgcctggct 4860

gcgcgccgcc gggatcccgc gccgctgctt cgtccgcgtc cgcgaaccgc aggtgcggag 4920

ggaccggctc gccttcgaca agcggcacaa gccggtgttc gtcgacttcg ggagctggcc 4980

gtcggtgctg gagttcgacc ggatcgtcac ccgggccacc ggggacctgg aactgaccga 5040

ggcactgccc gacggcgagc gggcggtgga gctggcgatc gagataggag cccggtgacg 5100

cggtacccgc tgccccgccc ccaccccctc ggcatccacc ccggctacgc ccggctgcgc 5160

gagggctgcc ccgtcgcgcg ggtcgactcg ccgtacggtc cggcctggct gatcacccgg 5220

tacgccgatg tggcggcggt actcaccgac gcccggtaca gccgcgcggc ggcgacggag 5280

gacgacggcg gcatcctgct caacaccgac ccgcccgagc acgaccggct gcgcaggctc 5340

gtggtggcgc acaccggcgc cgccgccgtc gagcggctcc ggccgcgggc cgaggagatc 5400

gccaccaccc tggcgaaacg catcccggcg gaggccgagt tcgtaagcgc gttcgccgag 5460

ccgtactcac atcgggtgct cgcgctgttc gtcgggcacc tggtcggcct gccggccggc 5520

gagctgagcc cgatggccac cgtgctcacg ctggcgcggg tgcccgaccg ggagcgggcg 5580

gcggcgttcg ccgaactgcg ccggcggctg cggagccagg tggacgacga gacgctcgcc 5640

gtggtgctca acatcgtctt cggcggccac gcggcggtgg tggccgcgct gggctactgc 5700

ctgctcgcgg cgctggccga gccgctgccg agcctgaccg gcgatgtccg gcggatcgcc 5760

gagctggtcg aggagacgct gcgcctggct ccgcccggcg accggaccct gctgcgccgc 5820

accctcgagc ccgtcgagct gggcgggcgg gagctgcccg cgggagcgct ggtgatcccg 5880

tcgatcgcgg cggccggccg ggatccggac cggcccaccg gcgggccggc gggccggcac 5940

ctggcgttcg gccgcggccc gcacgcgtgc ctcggcatgg cgctggcccg gatggagctc 6000

cgggtcgcgc tccaggcgct ggccgagcac gtccccggac tgcggccggc ggtcagcccg 6060

gccacgctca ggcgtacgtg cgaggaattg gcggtcagcc cgcttgcggg aatcccgatt 6120

cgggtgtagt gggcagaaaa ccgaataaac gaatttggtc agcgggtgcc cattccttgc 6180

cgcggatcac gcccgggtca tactctcggt tccagaaatg gtgcacgcat tcggtgtgag 6240

aaaccgaggg agaatcgtgt ccgcagaaca ccattatcgt gacaggctac gcgccctgtc 6300

cgcatatcta cgcaaggtcg acaatgagcc ggaggccgcc gccgagctgc gcgctgaccc 6360

ggaaaaggcc ctccgggagg ccggcgtcga ccaggcgttc gaccgccctg aagcgttccg 6420

cgcatttgtc ggaaaactgg cggtattaag cggagaagca tggctcgcga ccgttcactc 6480

gatgattgaa ctgtgtgaga tcggtgcgga tccgcagcct cctgctgggc ccaacatctc 6540

attccgcata tcttccgacg gcggggtgac ggccatcgcc aatcgcggtg agatcgccaa 6600

gaaggtgcag cccaacccct ttcacgccgg ctccgccgcc gcgtcgccgg gcggccggct 6660

gcgcatctat cccggctacg ccaccagcga actgtcggcc cgcctcggtg agcgctacct 6720

gtccacgttc taccagcgca ccctgctcaa gcgcgtcgtg ctcgacccgg gcaccgtggt 6780

cgaggacgcc gacgccggtg agggcatcac cgtcaaccgg tcacagtacc gaggcgtcgg 6840

gttcgaactg cacaccaggg ccgacggcgc ggaccgcgag atcgtcgccg cgctcgtgcg 6900

ctgacccccg gcacgagatc acgacatcac accccacgga ggcgggatgc tgagcagcgc 6960

gctcgaagta gacatcgacg aggcggccgt cgccgccgac ctcagggaac tggccgcggc 7020

gctcgaccgc agcggctacg gcgagatcct gacgtgcttc ctgccgcaca aggcgcaggc 7080

gcacatctgg gcgcagaccg ccgcgaagat cgacggtccg ctacggacac tgatggagct 7140

cttcctgctc ggccgggcag tgccgcagga cgacctgccg gcccgggtcg gcgacctcat 7200

ccccgggctc gccgccacgg gcctggtgca gaccgggcag ggcgcggtgt ggctgcccaa 7260

ccttatcctg ctgcggccga tgggccagtg gctgtggtgt cagcgcccgc acccgtcgcc 7320

cacgatgtac ttcggcgacg actcgctcgc gctggtgcac cgcatggtga cccatcgcgg 7380

cggccacacc ctcgacctgt gcgcggggcc gggcgtgcag gcgctgaccg cctcgctgcg 7440

cagcgaccgc gtcaccgccg tcgagatcaa ccccgtcgcc gccgcgctgt gccgcaccaa 7500

catcgccatg aacggcctgg gcgaccggat ggaggtccgc ctcggcgacc tctacggcgc 7560

ggtgccgggc gaggtcttcg acgacatcgt gtccaacccg ccgctgctgc cggtgcccga 7620

ggacgtccag ttcgccttcg tcggcgacgg tggccgcgac ggcttcgaca tctcctggac 7680

catcctcgac ggcctgcccg aacacctgtc cgatcgcggt gcgtgccgga tcgtcggctg 7740

cgtgctcagc gacggctacg tgcccgtcgt gatggacggg ctcggcaagt gggccgtcga 7800

acacgacttc gacgtgctgc tcaccgtcac ggcgcacgta gaggcgcacc gcgactcgtc 7860

gttcctgcgc agcatgtcgc tgatgtccag cgcgatctcg ggcgagccgg ccgacgtcct 7920

gcaggagcgc tacgccgccg actacgccga gctgggcggc tcccacgtgg ccttctacga 7980

gctgtgcgcg cggcgcggcg gcggcacggc acggctcgcc gacgtctcgg cgaccaagcg 8040

ctccgccgag gtctggttcg tctgacgcca cccaccgacc ggacgggacc gcgatgccga 8100

ccacactccc gaagaccctg cgcgggtcgg acggcgcgct cgccgagcag ccgctgctca 8160

tctacgtgaa tgtgccgttc tgcaactcaa aatgtcactt ctgcgactgg gtgaccgagg 8220

ttccgctggc ggatctgcgg ctcacgccgg actcgtcgcc acgccgccgc tacgtcgccg 8280

cgctggtcaa gcagatcgag acgcacgcgc cgacgctggg cggactcggc taccggcccg 8340

aggtcatgta ctggggcggc ggcacggcca gcatcctcac catcgaggag atcgaggcgg 8400

tggctggggc gctggcggcg cggttcgacc tcggcggcct ggtcgaggcc accatcgagg 8460

gcagcccgga gtccatggac cccggcaagc tgaagctgtt ccgtgcgatc gggttcaacc 8520

ggatcagcat cggggtgcag gcgttcgacg acgcgcgcct gcgccgcatc ggccgggtgc 8580

acagcgccga gcaggcggag cgcgcggtcc ggatggccgc cgacgccggc ttcgacaaca 8640

tcaacatcga cctcatcgtc gggttccccg ggcagggcgc cgacgaggtg tcgcgcacga 8700

tccagcacgc ggtgacgctg ccggtcaacc acttctcggt ctacccctac cggccgaccg 8760

gcggcaccgt gatgcgccgg caggtgggcc gcggcatggg ccggatcgac gtggaggagc 8820

agctccggtc gtacgaccac gcccgcgacc tgctcgcccg gcacgggttc gaggagtacg 8880

ccaccgccta cttcggcgct ccccgctgcg agtccgacga ggtctactac aagctcacga 8940

tggactggat cgggttcggc tccggggcca actccctcat cgggacccgc ttcctgctga 9000

acgaccgggg cgggctgcac cgcttcagca cggccccgca ccgcttcgac tccgacaccc 9060

cggcctcggc cccccacctg acacgccact tcctggccca ggcgctgacc acggtcgacg 9120

gcatggacgc gcgcaccttc cagctgcgca ccggccgttc gctgcgggcg gcgtgcgagg 9180

agcccgcggt gcgccggatg ctcgaacaga tcaaccgccg cggcaggctg atcgtcgact 9240

cacgcggcat ccggctgcac cgcgacgaca tggcctcggc ctacatcacc atgaacagcg 9300

tcgatctgta cgccgcgacc gagcagcccg gcggatgacc gcggtcctgc gcgcctgctc 9360

acacagtctt cgtgaacccg tgtgcccttc ccacgtgggg acgggcgtgc cggtcgaccg 9420

ccgcgggctc gcgaaggaat gagggtcaca acggaaagga gatgagcgag ttggaatcca 9480

agctgaacct tagcgacctg cccatggacg tcttcgagat ggccgacagc ggcatggagg 9540

tcgaatccct caccgcaggc cacgggatgc ccgaggtagg cgcttcctgc aactgcgtgt 9600

gcggcttctg ctgctcctgc agcccgtccg cgtagcagtc aaggagtgcc gccggcccag 9660

gccggcggca ctccgcccgg ggtgaggaga cagatcatgg aggtgggccg cgaaatcgtg 9720

gtccgcgtgg cggggctgcc cgccgccgtg ctcgccgacc tgcgcctgcc gcacaccgcc 9780

gagctcgtca cgcacctgtc cgctgagcgg cggcggctcg ccgccgaggc ggctgcgctg 9840

tccggcgagc tgttcgacct gatcggcgcc gccggctccg cccgcgccgc cctggtgggc 9900

ctgcggcgcg cgctcgcccc cgggcaccgc cccccgtcgc cgcgactgat cgggctgtgt 9960

cccctgcccg ccccgctggc cgagcgggtc accgcctggg tgcgggcccg gtacgactgg 10020

gaggaccggc gccgcgacct tgccggcacg ctggacaagg agcgcgccga cgcgctcgac 10080

cgcgtacgcg ccgcctgcgt cgccccggcg ttccggcggg gtctggcgct gtccggtggg 10140

gagctgacca gcacgctgga gcgctggctc gccgaccccg gccgtgcgcc ccggcagggg 10200

aaggtgctcc gcctggtcaa gtacctgacc cgagctgcgg ccaagaccag cccgtacggc 10260

tccttcatgg tcagcgcgct ggcggggcgg cccggcgacg accctcccat cccggagctg 10320

ctcaccgtgg ccgagccgcc gggggcgttc ctcgacgccg tcggcgacgc gctgctcgcc 10380

gacccggcac tggccggcca ggtgccgctg cgccccaacc ccagcctgac gtggaccgcc 10440

caaggactgc ttttcgtccg gaccgtccgc gcggcggcgg gagagcaggc cgggccgaag 10500

gaagagatcg ccaccgccgg gcgcgccgcc gcgctggagc tgtgcctgcg gcacgccgag 10560

tcccggccca ccgcgccgca gctggcggag ctgctggccg aggcgggggc ggatccgggc 10620

gaggcggccg cgttcgtcga ccggctggtg gcggcgcagc tcctgctgcc gtgtccgccg 10680

gtgcacgacg acgatcccga cccgttcggt gcctgggccc gccaggtgtg cgccccggag 10740

ctgcgcgagc tggcggccgc gtcgcggccc gtggccgccg ccgtggactc gcccggccag 10800

cgccgcgcca ggatcgccga agccgccgcc gccgtggcgg accggctcgg catcgacccg 10860

cccgccgatc cggcgcacga gcacgacgtc agcaccggcc gtccggcgcc gccaccgctg 10920

cccgcgggcg tgctcgccga cctggacgcg gtccggcgct ggctcgccgt gttcgactgg 10980

aaggtgcccg tccgggtggg ggtcggcgcg ttctgccgcg aacgtttcgg ctcagggtcc 11040

cgcacgccct tcctggaggc gtgccgggcg gcgacggcgg cgctgccgca cctgttcggc 11100

cccgccgcga tgccgtggtt cctcgacctg accggtgacg gtcgcctgcg tgagctggac 11160

cgtctccgga cgcgcgcccg cgatctcgcc cgctccggcg tcctcgaccg gcggcgggtg 11220

ctggctgaca cggccgactg gcccgcctgg ctgacctggc ccgcctccac tggtttctac 11280

ctgcagaccc tgcccggtgg ggtggtgctg aacgcggtgc atgccgggca cggccgcgcg 11340

gcgggtcgcg tccaccacct cctcgcccgg gcgggcgccg cgccgccgcg cccgccccgc 11400

tccggcctgc cgcgtgccga gttcggcggc aggttcggct ccgcgctcaa cacccgcacg 11460

ccgagcacgc ggtacgagat cgaccacccc ggcgcgacgt ccggccgcga cccccggcac 11520

cgtgtcccgc tcggcacgct catggtggtg cacgacccgg acaccgacct ggtccacctg 11580

cacagcgacc ggctcggccg cgtcgaaccg gtgcacctcg gcatgatggg cgagctgggg 11640

ctgcccgccg tggccggttt cctcgaacgc gccttcgcgc ccacctacct gttccacccg 11700

agcgtgccgc cgttcatctc gctgcgtgac ctggccggcg cctcctcggc gcggcgcttc 11760

cccagggtga gtgtcggcga cgtggtcgtg cagcgcgccc gctggacggt gcccgccggc 11820

ctggtgcccg cgcgtaccgg ggcggacggt gaccacctgc tcgcgctggc cgagtggcgg 11880

cgcgagcacg gcatccccga gcggtgtttc gtgcgcggct ggaagccggg cgcagcgctg 11940

ggcaaggcgc gcaagccgct ctacgtcgac ttcgcctcct ggcatctggt cgccctgttc 12000

gaacgggagg cgcgaaccaa cgccgccctg gtcatcgacg aggccctgcc ggacccgctg 12060

gccgacggcg cccccgcgca cgtcaccgag taccacgtcg agatcggcga ccgggagaga 12120

gagcaatgac cgaacggccc ggctggttcg cggcgcatgt gcactaccgc ggcgacctcg 12180

acgcgctgct gcgcgaagcg gtcgcgccgc tggtgcgcgc gcttgccgcc gacttcttct 12240

tcctgcgcta ctgggacggg ggcagccacc tgcggctgcg gctgcgcggc ggggaccagg 12300

tcgcggtcgc ccggcacctg gacgcctacc ttgccgccca ccccgcgccg gagaccacct 12360

cccaggagga gtacgcccgc gtcgccccgg tgctggccgc ccgcgagggc atgacgggcc 12420

acctgacgac gctgcggccg aacaacaccg tggagttcgc ggcgtaccgg ccggagaccg 12480

cgaagtacgg caccggcgac gcgctacgcg ccgtcgagcg gcatttcgtc gagtccagcc 12540

ggtacgcgct tgacgtcctt gaccgccgcc cgaccggcaa ccaacgcgag ctcgcagtgc 12600

tcggcgtcct gctgctcgcc tggtacgccg cccgcccact cgatgagccg cctggtgagc 12660

cggtcgatga cgagctgatc ggcgcggtcg aggcgctgtg ccggggctgg cgcggcggcc 12720

gggacctgcc cgaggagctc gtggcggagg agtacggccg ggtgcgggag cgtgtggccg 12780

ggctggccgg cgcgctgcgt gacctcgttc cggacccgga cgcgcccggc agcagcatgc 12840

gcgcgtgggc ggcgacgttc gaccggctcg ccgccgcgct gcccccgccc gaccggctgc 12900

gggtgctcga cacgtgcgcg catctggcgg ccaaccggct gggcgtgtcc atggcggccg 12960

aggtgcggct gcggctgctc gccgcgcggg ccctgcgcga ggtcgcgccc gtggggaggc 13020

gatgatgagc tggcgacgcg tcgacgtggc ctaccacgat cccgaccttg acgggctgat 13080

cctggccacc cggccgctgc tggccgggac gcccggccgc ggctggttcc agcggcactg 13140

ggtccgcggt ccgcacctgg agctgtggtt cgacgccgcg cagccgtcgt gggagcggat 13200

ccgcgacgtg ctggagccct ggctgcgcgt caacccgtcg cgcgcccgga tcgaccgaga 13260

ccggctgctg gcgcagcacc ggcacctcgc cgccgccgaa cggatcgacg agccgctgct 13320

gccgttctac gccgacaaca cgctgcaccg ggccgctccg cgctcccgcg cacacgtgct 13380

cggtggtccg gcggccgagg agctgttcca cgacttccac accaccgcca gcgccgtggc 13440

ttacgacgag ctcgacgccg tgcgggcggg agagtcgcgg ctggtgatgg cactggacct 13500

gatggtcgcc gccgcgcacg cgcacgccga gggcggcgtc cgcggcgggt tcgtgtcgtt 13560

ccgctcgcac gcggaggcgt tcctggcgag cgcgcccggc ctgcgcgagc gctgggacgc 13620

cgagtacgcc gcccgggcgg gggcgctgcg agcgcggatc accgcggtgg tcgccggaat 13680

cccgcgcggc cgggcgtggg ccgggctgct cgaccggttc gcggaccgcg gcgacgagct 13740

gatcgcctcc ggcgcgctgc tggtcgagcc cgccgggccg gacgcggtcg cccggcccga 13800

caccgccttc caccgggcgc tgcgcggcaa ccggacctgg cacgaggagg tgctgcgctc 13860

agcaccgttc cgccgctacc ggctgctgct gaacctgacc tacctgcagc tttcccggct 13920

cggggtgaac gccgtgcagc gggcgctgct gtgccacttc gccgcgtcgg cggtcgagca 13980

ggagtacggg gtgtccgcca tcgagatcgc catgggaggc gcgtgatgtc agtacaggtc 14040

gagcccgcag tgacgcaccg gtgggcactg cggcccggcg tctaccgggc caccgcgcca 14100

ggcggcgatc tcatgctcgc cgcctggccg cacgccacgc cgctcggccg ggccaccccc 14160

gagctgctgg ccctgctgga cggcctggcc gccggatcgc tgccgctcga cgagcccggc 14220

gacctcgcgc ccgccgtcga gctgctgcgc gcgggtggct ggctgcgcaa gacggtggcg 14280

tacgcgggac gcgacctcta caccatcacc cccgtcgccg cccccaccga cgcgccgcca 14340

ccgccgcggg acgaaccggc gctgtcgcgg ttcgcgctgc tgcgcaacac cgcggacggg 14400

ctggtgctgg agatgcccgg ctcctggtgc gacgtccacg tgcacgaccc ggcggtggcc 14460

gcgctgctcg ccgacccgtc cggcgacggc ggcctgcccg ccgaggccgc ggccgcgctg 14520

cgcgccgacc tggccgccgc cggcatgctg atggagcggg aggagccgtt cgagcggcgg 14580

cagtggagca cccacgagct gtggttccat gaacgcagcc ggctcggcaa ccggggctgg 14640

ttcggcgcgc acttcggcgg cacgttctgg gcccgcggcc ggcacgaccc gccgcccgcg 14700

cggccgtccc cctaccccgg cccggccgtc gagctggccc ggccggacct cgcggcgctg 14760

cggcgcaccg accccacgct caccgccgtg ctggaggacc gcgaaagcgt ccgcgaccac 14820

gacgacgacg atccgatcag cgctgagcag ctcggcgagc tgctctaccg gtgcgcgcgg 14880

gtgcggctgc tgcgtcacct ggaaggcttc gagtacgccg gcaagccgta ccccgccggt 14940

ggctcggcgt acgagctaga ggtgtacccg gtcgtgcggc tggcccgcgg cctcgacccc 15000

ggcatgtacc actacgacgc gcacgaccat cggctgcgcc aggtccggcc cgccggccac 15060

ccggcggtgc gcaggatgct gaaggtcgcc acggagtcgt ccgtcgccaa ggcgccgccc 15120

caggtgctgc tggtgatcag cgcgagagtc ggccggatcc tgtggaagta cgaggcgatg 15180

gggtacgcgc tcatgctgaa gcacgtcggc gtgctgcaac agacgctgta cgcggtcgcc 15240

accgccatgg acctggcccc gtgcgcgctc ggcagcgggg acgatctcgc cttcaccgcc 15300

gccaccggcc gggaccggct ggtggagtgc gcggtcggcg agttcatggt cggcagcagg 15360

cggaaggagc ccgcggcatg ggagctctga acctcctcct gcgccccgac gcgcactacg 15420

ccgaggtcga cggcggcgtc tacgtgctga gccaccaggg cgagaccttc atctcgggca 15480

cctcggtgca ccggtggctc gaccgcctcg cgccgctgct cgacggcacc cgcacgctcg 15540

accagctcac cgccggcctg cccgccgacc gggccggctt cgtggccaga cttgtcggca 15600

cgctcaccga acgcggcctg gtgcgcgagg tcggcccggc ggtgtcggac acgctcaccg 15660

acgccgaacg cggcgagcac cgtgccctgc tggcctacct gggctacttc cacgactcgc 15720

ccggccgcgt cctcgaggac gtgcgcgaca ccccgaccgc gatcgtgggg tccggtccgc 15780

tggccgccgc ggtggtccgc gcctgcgccg ccgccgggct gcgccgggtg gagatcggcg 15840

aggaggcggg cgcggcccgg gtggtcgtcc acgtggccga gcgcgccgag cccgaacggg 15900

cggcgcggct ggaacggcgg tgcgccgccg agggggtgct gctcgcacag gtcatgccgg 15960

ggccggacgg catctggtgg cagcccgcgg cccgcggcgg ctgctgggcg agcgcgtggc 16020

gccgccaccg ggcgctcgcg ggcgtggatc ggacgggcac gccgctcgat ccggtggcgg 16080

tcgcggtggt ggccggccag gtggcacacg acgtcttccg cgtcctcgcc ggactgcgcg 16140

aggaggcgcc gccccggttg gtggtgctcg atccgcggac gctggcgagc accgcgcacc 16200

cggtggtggc gcacccgttc gagctgcccg ccgcgccgct ggacgaggcg gcgttcctcg 16260

accgggtcgc cgcgctgcgg gcagcgcccg cgctgagcga ggcggagttc tcccggcggg 16320

ccaaggggct catggactcg acagtggggc tgttcgccga gatcgacgag ggcgacctcg 16380

cgcagttgcc gctgcacgtc acggcgacca cggtggccga cccgtgcggg ctgatcggct 16440

ccgcgccgcg gcccgtggtc accggcgcgg ggctcacgtt cgaggaggcc cgctaccgcg 16500

cggcgcgcgc cgcgctcgcc ctggccggca ctctcgcgct cgaccggcgg aggctggtcg 16560

acggccgggt gtgggcgtac gaccttgcgg acggggccgc ccggctggtt ccggccgacg 16620

aggtcttcgc aagcacggcg ggcgggagca cggcgggcgt gccgctcggc gcggcggcag 16680

cctactcgtg ggccgaggcg gtcgcggagg gcctggtcgc gcaggccgcc gcgctcactc 16740

tcgccggcgc cgggcacgcg ggcgagccgt atggacgggc ggacctcgcc ggggcgcctg 16800

cgtatctcct cgccatggtg cgggcgctcg gcgaggagct gaccgtgcac gacgtcaccg 16860

ggccgctggg cgtgccggtc gtggtgggga cgctgtccgg cggggcgacc gcctgcggcg 16920

cgggcatgac cacggacgcc gccgtcaccg cgtgcctgcg cgacctgctg ctgctgcgcc 16980

aggccgagat caacgaccag cccgtctacg ccccaccatc cggcaggccc ttgcccgggc 17040

atctacgcgg gaaccacccg gcgcccgccg tgcccggcac ggacgccgac cggctggcgg 17100

cccgcctggc cgagcggggg caccgccctc tggcggtgcc gctggatcat gaccaggccg 17160

tgcacgcggt cctgcccttc gccgtccggg tggtgtgccg atgatccgcc tgcccgacca 17220

cggcgagctt gccgtgccga tcggcgacgg gccgatgctg ccgctgcgca ccgaactcgg 17280

ccgggtggtc atcggcccgc tggagcggcc cggcgtgccc ggatgccggg cctgcgtgcg 17340

catccgcgcg gcgcgggtcc agcccgacgc ccgcaaggcc gaggccgtac gcgcccggca 17400

cgcccccgcg cccagccagt ggctcacccc gctcgccacc gacctggtgc gcgtcctggt 17460

cgcgagcgag agcgctgccc tggcagccga caccgacccc cgcaccgcgg gtgccgtgct 17520

ggagatcgac ctcgccacgc tggaaatcac caggcaccgg ttcctgcccg acccgctctg 17580

cccgcactgc ggcggtctgc cgccggacgg cccggccgag ctgaccctgc ggccccgccg 17640

caagctcggc ggcagtcccc ggaccaggcc ggtcgagctg aacgcgctgc tggagacgta 17700

cgtggacggc cgggtcggga tgatccggcc gctgaagtcg ggcgtgcagg gcggactgac 17760

ggtggccagc gccatgctgc cgatccgcgc gggccacggc ctggaaccgg gggtcggccg 17820

tacccgcagc tacaccgcga gcaggctggt cgccgtgctg gaggcgctgg agcgctatgg 17880

cggcgtcagc cccggcggcc gccgcaccag cgttaccgcc gcctaccgcg acatctccgg 17940

ccacgccgtc catcccgaca ccttcggcac acaccccgag gagaactacg acaggcccgg 18000

cttcgccttc cggcgcttca ccgaggacac cgtgtgccgg tgggtgtggg gctactcctt 18060

cgccaaggcc cagcccgtgc tggtgccgga gaaccaggtc tactactacg ccagaaacct 18120

gccggacggc gagcagccgt tcgtcttcga ggtctccaac ggctgcgcgc tcggctcgtg 18180

cctggaggag gcgatcctgc acggcctgct cgaggtggtc gagcgggacg cgttcctgct 18240

cacctggcac gcccggcggg aggttccggt gctgaacccc gcgctggcga gcgacccggt 18300

cctgcccatg caggccgccg cgatcaccgc cgagaccggg caccgggtgc tgtgcttcga 18360

caccaccgcc gagcacggca tccccagcgt gtgggcgatg gccgtggacg tcgaacaccg 18420

gtcggaccgg cccgccaccg cccacgccgc cggcgcggcg ctcacgctgg agcaggccgc 18480

catgaacgcg ctgagcgagc tcggcccgct gctggccgac gtgatccgcc gctaccccga 18540

ggagcgggaa cgggccgagg ccatggtccg cgaccccgag caggtcgcca ccatgcacga 18600

ccactccctg ctctacgcgg ttcccgccgc ggccgaacgg ctgtcgttcc tcaccggccg 18660

cgccgacggc ccgcggaccg gcttcggctc ggcccggttc accggcgacg acctcaccgc 18720

cgatctgcgg gccatgatcg acgcggtgat cgacgccggg atggacgtgg tggtcgtcga 18780

ccagaccacg ccggagcacc tggcgggcgg gttccgctgc gtgaaggtgc tggtgcccgg 18840

cgcgctgccg atgacgttcg gccaccagta ccggcggctg gacaacctgc cgcggctggc 18900

ggccgcgcgt accaccgacc cgcacccgtt cccatgagcg ggcgcccgga cagcggaaag 18960

gagccgtcgt gtacgtggtg atcgtcgcgt tcgacctgaa ggagtcctcc gtcgacttcg 19020

ccgaactgcg cgcctgggtg cgggaccggg cggcggacga ctactcccgg ctgccgggga 19080

tgcgcttcaa gacgtggttc tccgacgagc gaaaacggct ctggggcgcg gtgtacctgg 19140

tggagtcgat gttgtcgttc gaccgggaca acctcccgct gctgcccgac ggcaggaccg 19200

ggccggtcgg cacccggccg acgtcggtca tggtgctgga gttggaggcg ttcgtcaccg 19260

ggccggacgg cctggacggg atcgaggcgc tcgcccggca agggctgagc atgacgggag 19320

gcggccatga ccactgaggc gacgactgcg gtgaccactc gtgcgaacgc cggagcgctg 19380

tccctgccgg cgcgtggcac ggaccggccg ctgctgctct acgtcaacat cccgttctgc 19440

aactccaaat gccacttctg cgactgggtg gtggacgtgc ccgtctccga cctgcggctc 19500

gcccccgcgg cgccgcgccg ggtcgactac ctggccgcgc tgtgcaccca gatccgcacg 19560

cacgcccccg ccttgcgggc cgccggttac cgcggtgagg tcatgtactg gggcggcggc 19620

accgccaccg tcctcaccgc ggcggagatc gagcaggtcc acgcctgcct cgcggccgag 19680

ttcgacctga cggcgctggc cgaggcgacg atcgagggca gccccgagtc ggtggacccg 19740

gccaagctga ggctgctgcg ggacctcggc ttcgaccggg tgagtctcgg cgtgcagtcg 19800

ttcgacgaga ccaggctgcg ccgcatcggc cgcgcccact ccgcgggcca ggccgtgcgc 19860

agcgtcgagg acgcgcacgc ggcgggcttc gacaacatca acatcgacct gatcgtgggc 19920

ttccccgacc agtcgctcgc cgaggtggag cagaccgtgc ggcgcgccct cgacctgccg 19980

gtcaaccact tctcggttta ctcctaccga gcgaccgagg gcacggtgat gcgcaggcag 20040

atcgaacgca gcggcacggc catcgagctg gagcatcagc tccagtcgta ccggctggcg 20100

ggcgagatgc tcgcggcggc gggacatccc gagtacgccg tctcctactt cggtgcgccg 20160

cgctgcctcg ccgacgaggc gtactaccgg ctcagcatgg actggatcgg cttcggcacg 20220

ggcgccaact cgctgatcaa ccagcgctac ctgctcaacg gccgcggccg gatgcgtgac 20280

ttcaccagca ggccgggcga gttcgaggtg gacctgccgg ccggagtgcc gtcactcacc 20340

gtgcagtggc tgcccagggc gctgggcacc gccgagggca tcgacgcggc gaccttccag 20400

cgtcgcaccg gcacgtccct gcgtgcggcc tgcgaggaac ccgagctgaa cgcgttcctc 20460

acccgggtga acgagttcgg ccggctcgtc gtggaccgcg acggcatccg cctggccgac 20520

gagaaccgct cggacgtgct gtcgcgcacg ttcgccgcga tgggctgggt gtcctgacgt 20580

ggaggcgatg cgcacgctgc tcgcggccgc cgacctggtc acgccgatgg cgctgcgggt 20640

gtcggcgacg ctgcggctcg ccgaccacct ggccgccggc acgaccggcg ccgccgagct 20700

cgccgcggcc gccggggtcg acgaggcggc gttgacacgg ctgctgcgct acctggtcgc 20760

gcgcggcgtc ttcaccgagc ccgcgcccgg tgagttcggc ctcaaccccg ccgccgaact 20820

gctgcgcgac ggccgccccg accggctgcg cgactggctc gacctcaccg ggccgatcgg 20880

ccgcgccgac ctggcgttcg ggtcgctgct ggacgtcgta cgcaccggca agcccggtta 20940

cccgatgatc cacggccggg gcttctggga cgacctcgcc gccgagccgg cgctcgccac 21000

cgcgtacgac accctgatgg gcggcaagcg ccagtgggcc gcgaccacgc tcgccgccct 21060

ggactggagc cgctcccggc acgtcgtgga tgtcggcgga ggcaacggca cgctgctgtc 21120

gtgcctgctg gccgcgcacc cgcacctgcg cggcaccgtc gtggaccggc ccacctccgc 21180

gaaggccgcc ggagcagtac tggcctcggc cggggtggcg gaccgtggcg agtttcgcgc 21240

gggcgacttc ttcgagccgc tgccggtgca cggcgccgac acatacctgc tcagctcgat 21300

cctgcacgac tgggacgacg ccgcggctac ggcgatcctg cgccgctgcg cggaggccgc 21360

cgcgccgggc gggcgggtgc tgctctgcga gctggtggcc atggccgggc cggaccggcg 21420

gacggtgacg cacatggatc tgtgcatgct cgtgtacttc ggcggccggg agcgcaccgc 21480

cgccgacttc gccgcgctgg ccggggcggc cgggctggag ccgcgctcgg tgacgccgct 21540

cccgccccac gactggggca acgccctcgt ggagtacgcg gtccccgccg cccgctgacc 21600

ggaaaagacc cctgccgacg gcgacggtca gcgcggcgcg gctccgttga tcgcgcccgc 21660

ctgggccgca cgatgagctg gagcgctggt cccactcgac cgcaatcgcc gtggaggtgt 21720

gggcacttcc cggcgagccc tgtccggcga cgtcgcggag ctcgtccatg ccacgatccc 21780

cgacgtactc gacggctcgg gacgggacgg atcggtgcgg tgcgcgggca tcgcgctcac 21840

cgcgggcgcc cgcgggctgc gcctgaccac cagccacgac ggctccggct cgccgcgctg 21900

gggttcaaac tcactaccca gggccggtac gggatgagtt tcgtccgctt ctgtgaggaa 21960

cgcggcgctg accgggtggc ggcgcgccgg ttcggcctac atcaaggagc tgatgcccga 22020

catctggatg gcaccatcga gccggggcaa atgttcgacg ccacgaccga tgcgatgtcc 22080

cgcgaccggc cgtcgcggtg aggcgtgccg atgcatcacg acgagctcgg aataccgagt 22140

ctgcgtcggg gtggatttgt ggctggtcga tgagtttggg atgctgcgca ggtctgcctg 22200

ccgataccac ctgactggaa ggggatcacc gcgatggcga aggtcatctc tacgttgttc 22260

atctctgctg acggtgtggc cgagatcgac cccgattggc acttcccgta cttcgacgag 22320

aacatgggcc gcgccgtcgg cgaggactat gacaccgctg acgtgctgtt gatcggtcgc 22380

gagaccttcg acagcttcgc cggagcgtgg cccgaccgcg aggcggcggg tggggacgac 22440

gcaccgttcg ccaagcaact cggggacatg cgcaaggtgg tcgtctcccg ccagccgctg 22500

gagttctcct ggcgcaactg cgaactgatc acgggcgatc tcctcgatgc cgtcacctcg 22560

ctcaaggccg atgccggcat caggggcatc ctcatccccg gttcgatctc cgtggtgcag 22620

cagttgctcg ccgcagggct ggtcgacgag ttgcgcctgc tggtgcaccc ggtggcggcg 22680

cgtaagggcc gcaggctgtt cgacgacggc gacgcgccgt accacctgag cgtgacggcg 22740

acggagacgt ttccgacggg cgtgatccgc gtgatctact cgccgaccga ggcacccacc 22800

aaagtcggct acgacgaggt cgaggcccag gtgtccaccg gggaatag 22848

<210>63

<211>15586

<212>DNA

<213>野野村氏菌属物种

<400>63

ctaggtgggt gagggggtta gggggattac ctcgttgggg gtggtgtcgg gggtggggat 60

ccagttgagg gcgatgaagg tctgggcgat gtcgtcgcgg tggaggcgga tgccgttgtg 120

gtcggcgatg agccggccgt ggttgttcat gcgttccagg tacgtcatga cctccgggtg 180

agagcaggcc gtgcggaggg ggacgccggt gcgttgctgg tagaggcggg cgtccaggcc 240

ctcggcggtt gtcagtgcct gggacaggaa gtggagggtg agctgtgggg agtgggccgg 300

ggcgttgatg tcgaaggcca gcgggttggt gttgtagtgg gccagcttgc ccttctcgta 360

gctcaggtag cggcggccga tcagggagtt ggcgcccgag ccgaagccga tccagtccat 420

gcggagctgg tagtacgcct cgtccgactg gcagcggggg tggccgaagt aggacatggc 480

gtattcgggg aagccggctg cttccagcag ttccctggcg atgccgtacg cctggagctg 540

gaggttgagg tcgagctggg cgccccggtg gacctgcttg cgcagcaccg tgccggggct 600

ggcgcggtag gggtagatcg agaagtggtt gatgggcagg gtcagggccg tgcggaccga 660

gtcggcgacc tcctggccgg tctgcccggg gaagccgacg atcaggtcga tgttgatgtt 720

ggtgaagccg gcctcgtggg cgtcctggac ggcggtgagg gcctggtcgg cggcatgggc 780

gcggccgagg cggcgcaggc gcgcgtcgtc gaaggactgg acgccgatgc tgatccggtt 840

gaagcccagc tcgcgcagga ggcgtagttt gtcccggtcg agggattccg ggctgccctc 900

gatcgtggcc tccctgaccg tgctcaggtc gaactcggcg gacagcgtgc cgtacaggga 960

ctcgatctcg tgggggccga ggatgctggc cgtgccgccg ccccagtaga cgatgtcggg 1020

gtggtagtgc tcgcgcaggg cgggggcctg gacgcggatc tgggtcctga tggcctccag 1080

gtacgcgacg cggcccgggc tctgctcgcc cagccgcagg tcgcgtacgg ggacctggac 1140

cacccagtcg cagaagtggc acttggagtt gcagaagggg acgttcgcgt agatcagcag 1200

gggcttggtc atgaggaacc tctcacgtgc atctccctga cgccgaagat ctggctctcg 1260

tagaaggagc gcttttcggg acggagctcg gtgaagcggc tcagcaggcg ctccagcgcg 1320

atgcggccct ccaggcgccc gagctgggcg cccaggcaga agtgcacgcc gtggccgaac 1380

gcgagctggc cggtgagctg ccggtccagg tcgaagcgtt cggggtcggc gaagtggcgt 1440

tcgtcgtggt tggcggacag gagccaggcc atgacgaacc tgttggccgg gatggtctcg 1500

ccggccacct gtacgtcctg cgtggtcacc ctgcccgcct gcatgaacgg cgagcgcagg 1560

cgcatgctct cctccagcgc ctgggggatg agcgacatgt cggctcttgt ccggtgggcg 1620

gcctcggggg cgtccgccag gcagagcacg gtgttgccga tcagcacggt ggtggtgacg 1680

tgcccggcca gcaggagcag gctcgcggtg ttgacgacct gctccgcgtc gagccgctcg 1740

ccgtcgatct cggcatggac gaggcgggtg agcaggtcgt ccctgggacg ggtacggcgg 1800

tccgcgcagt gctcgcgcag gtagtcgttc atctccgcca tggccgccgc cacccgcccg 1860

gccagcgacg ggtcggcgaa gtcgggcacc tggagcgaca tgagccggtc cgaccaggtg 1920

cggaacaggt cgcggtcgga cggcggcacg ccgagcagct cggcgacgac ggtgacgggc 1980

aggggatagg ccaggctctc gaccaggtcg aagtcagggc cgggcagggc gtcgaggagc 2040

tcgtcggcga tcgcggcgat gcgtggttcg agggccgcga cggagctcgg ggtgaaggcc 2100

gcggtgatga gcctgcgctg gtggcggtgt tcgggcgggt cgatcatcgt gatgccgccc 2160

tggccgaacg gctgccgtcc catcagcctg gtgcggtcgg aggagaaccg ctcgtggtcc 2220

gccagaacgg cgcgtacgtc gtcgtagcgg aagacgtggt acatcccata ggaatcccgc 2280

cagaccgggt gcgtgtcgcg catctcgcgc agccaggcga acagggacgt cccgccgtcc 2340

gtgaccgaag gtggccttac gggggccgtc atcggggcgc ccgcttgacg cgtaccggca 2400

ggctcttgac gccgaacatg gggtcctcgt agtacgacag ctccgcgtcc gggtcgatct 2460

cgacctgctc gaaccggtcg aacaccagct ccagcgccac cttcccctcc accctcgcca 2520

gcggcgcgcc caggcagaag tggatgccgt ggccgaaggc gtactggcgg ttgggctggc 2580

ggccggggtc gagccggtac gggtcgggga actggcgctc gtcgtagttc gcggacagca 2640

gccagttgat gaccatggaa ccggccggga tcggcgtgcc gtcgatctcg acgtcggccg 2700

tggggagccg ggcggcctgg gtgagcggcg ggcgcagcct gagcacctcc tcgaaggcgg 2760

gtgcgatcag ctcccggtcg gcccgtacgg cgctctccac gccgggcgcg tcgcggaagc 2820

acaggaacgc gttccccagg gccatcgtgc tggtgatctg cccggcgagc agcagcaggc 2880

aggcggagtt gacgatctcg gcgtcggtga gccggtcgcc gtccacctcg gccgcgacca 2940

gccggctgac gaggtcgtcc tgcggacggg tgcggcgctc gcgcacgtgg gtgaggacgt 3000

attcccccat ttcgcgcatg gcctgaccga ccatccgccc gatctcgatg tcccgcgggt 3060

cctcgacgtg cagtgcgacc agccggtcgg cccaggtgcg gaacagctcg cggtcgtgga 3120

tcggaatgcc gagcagctcg gcgatcacca tcacgggcag cgggtgggcg atcttctcga 3180

ccaggtcgaa ctcgtcctcg tcgatctcgt ccagcagcgc cgtggtgagc tcggcgatcc 3240

gcggcaccat gtccgacgac attttcgggg tgaacgcctg gctgatgagt ttgcggagct 3300

ttcggtgctc cggcgggtcg gtgagcatga ggctgcccgc gctgaacgga tcgccgccgg 3360

gccggagccg gttgatgtca gaggagaacg ccgcatagtc cgacatcacc cgctgtacgg 3420

ccgcatgccg gaaaacgtgg aagatgccga atgcgtcgcg ccagaccggt tgttcgtccc 3480

gcatcgtgcc gagccacttg aggagggtct ggccgccgtc cttgatgcgc ggccgggagt 3540

cgatcggcat cgtcatcgtc gggtccggcg ggacgtgtgt ctcgttcaca attgactcct 3600

cagacggagg cggccagggg ctgggggatg agtttcgccc ggtatttcgc cgcggcgccg 3660

tcgaagatct cgacggtacg gcgggcgggg tcggtcagtt cttcggccgg gacctggtca 3720

gcaggttcga aagagctcct gatgaggccg gccaggctgt cggcgtgcgc cgccagatcg 3780

ggtttcgccc cggcgatctc ggcgtgcagg tgaagtttga tgaacccgga aagcagggca 3840

tcgagcgcga aaccgtggga cgggtcccac attccgctct cgtggagcat ccggagataa 3900

tcgcgaaatg gcgtgaacgt ggtgaagcgg taacactgga agccgagctg tggatcgtcg 3960

caggcccttc cgagcgtttc cttgtcatag gtgtagagtg ctcggaagag tggatacttg 4020

aacacgagtg tgaacagctc gcgtgagaac tcggagagcc gcgcgacggc aggacgaagc 4080

accgctattc gcgaaatatc ctggcagact ccgacaattt cctgaatgac gagcgttctt 4140

atgagatcgt ctttcgtgtc ccagctgaga taaatggtgc cctttccgat gtccgcccgc 4200

cgggcgatct cgtccatcgt ggtccgcttg tagccggatc gcaggagcag gctcctggtg 4260

acgtccagag tccggcgtac gcgatcgtcg ctggtcctgg cacccgtgct gcgtgtcgag 4320

acggtgctca tggctgggtg gctccttccc cgtaagagct ggtgcgcatg aaccggtatt 4380

ccctaccggc tagggggatt ttggtgggag atgtgctctg ggcccgtcag agctggagat 4440

ttcgaagata ttcgaaatgc tcagatttca acagtcaggt gccccctccc tgactggctg 4500

accgattttc gattttagtc agccagttcg cattcttgac cgcgttccat atgtacacct 4560

agcgtcggcg atgtcgcaag ggtgttccta taccaggcga tgacctccgt gcgatgcaca 4620

tcagtgcgtt tgcctggaat gtcgatgggg cgtttacccc cggaaggaga gtccgcatgg 4680

acctcagcga tctgcccatg gacgtcttcg aactcgccga tgacggtgtt gcggtcgagt 4740

cccttactgc tggtcacggc atgaccgaag tgggagcttc gtgtaactgc ttctgctaca 4800

tctgctgctc ctgctcgagc gcctgacgcg gtacgcgggc gtcgccacgg cggcgcccgc 4860

gcctgttgcc ttttggcgcc aataaagcga atggggctca tgtaatggcg gttattgagc 4920

gggaagaaag cgacggcccg ccggtcgctg tccgcacgtg cggggtcgcg gccgcggagc 4980

tggaatccct gcgatgggac gagtcctatg cgctggtgac ccggctgctc gcggagaccg 5040

cccgggtggc ggcggacggg cggcggctgg ccgtggcgct cggtgacgtc atcggagggc 5100

tcggcccgtc cgggtcccgg cccgtcctcg tggggctgcg gcgggcgctg cacaccgggc 5160

gtctcccctc cgggcgggag tgggggcccg aggccggggc ggcgctgccg tacgggctga 5220

ggggcgaggt ggaggagtgg gtacggcgtg cgcgcgagtg cgccgggctg cgcgcccgcc 5280

tgcccgaggt cgtcgcccgg gagtccctgg agaaggagga acggctgcgc gccgccgcgg 5340

ccgaccccgc cttccgcagg gggctggcgc tggccggcgg cgagctggcg gtcgacctgg 5400

agacgtggct cgcggacccc gcgcggcgcc ccaagccgca gaagctgctc aggctggcca 5460

aatacctggt cagggccgcc gtgaagacca gcccgtacag cacgttcacg agcaccgggc 5520

gggcggtgtg gggcggtggc gagcggcacg tggagcgcgt ggtgccggtg ctggaactcg 5580

acggcgtcca gacgttctcg gacgatcggg tcagggtgaa tccgtcggtc accgtcgcgg 5640

gcgggacggc ggagttcatc gggccgcctc ccggggaggc gctggtgtcc atcggggtga 5700

cggaggcggt ggccgcgtgc ctgcgcgtcg cggagggcgg ggagtgggtg ccgcggggcc 5760

ggttcgcgga ggctctgggg gctgagcctg ccgcagtcac gaaatttctg gacaagttgc 5820

ttgcggttgg gctcctggag gcccggccgg acggcgaccc gcccccgcac ctgctggacg 5880

ggatccggcg cacggaacgc gccaccgacc cgtccacctt ccgccacgaa ctcggccgcc 5940

tgatcgccgc cgcccgcgcc gccgcccgcg ccaccgcccc cggcgctgac acggccaaga 6000

acgccgcccc tgccgggcgc gccacccgcg gcgatggcgg tgctgatgcc gagcgcgcca 6060

cccgcggcga tagcgatgct gatgacgggc gcgccacccg gggcgacggc ggtgctgatg 6120

acaggggcgc cgcgcggggc gacggcggtg tggggcgggc ggttgtgcac gaggtcgcgg 6180

tctgcgtcga gcccgtggcg aggctggatc cggcgcgatg gcgtggcggg cttgccgatc 6240

tcgacgtcgt acgccgctgg ctggccgttt tcgacgccaa gcaccccatg cgcctcgcgg 6300

tcgccgccta cctcaccacc cggtacggcc ccgacccggc cgtccccttc ctcacgctcc 6360

accgccacat ccagcgcgag ctggccggca ccggcgcggc aggccgggag ttgcgcgcgt 6420

tcctcggctc gtcggccgcc tggacccagc cgctaggcac ctccgccctg cccaggatca 6480

gggagctgga gcgcctcaga gccgaggcga gaagcctggc gctggacgcg gaggaccccg 6540

acggcacctg ccgcgtcacc cccggacagc tggccgcgca gctggagtcg tggccgtctt 6600

ggatcgcgat ccccgcctcc tcggcctgct acgtacaggc ggtggccggc accctggtgc 6660

tcaacgtcgt ccacggcggg cacggccgag ccctgcgcag gctcgaccac ctcctcgaac 6720

gcgccggcgg ccaccccgag ccgccccgga tcgaggaccc ggacggcgcg gtctacgccg 6780

agttctccgg cgacctgggc tccacgctca acgcgcgccc gccgagcacc cgatacgaga 6840

tcgactaccc ccactcgccc ggcacgcgcc cgcccgacct gcggctgccg ctcacggacc 6900

tgcacgtgac gctctgcccg gacagcggcc tgcccgagct gcgttccaag cggctcggcc 6960

gccgggtcgt gccgttgcat ctcgggctgg ccgccgagtt ccggcttccg ccggccgcgc 7020

ggttcatcga acgcgtcttc ggccccggct acctgctcca tcccagctcg ccgccgctgg 7080

tgcggatggg ccgggtcccc tcggaggtca cccggtatcc acgcgtcgag gccgggcgcg 7140

tggtggtgca gcggcgtcgc tggctggcgc ctgcggccac gctgccggtg cgcgcgaagg 7200

gcgagggcga cgcggcgtac ctcacgcggc tgatcgcctg ggcggacgag tacggcgtac 7260

cgcaccgatc gttcgtccgc gcctggccgg agcagaccgg cgacaaaggg caggacaagg 7320

cgcgcaaacc gctcttcctg gacctggcga acctgttcct ggtcaagaac ttcgagcggc 7380

agatacgtgg ctgcgcgttc gcgctcttcg aggaggcgct gcccgacccg ggaccggagc 7440

gggtgaccga atacctgatc gaggtgggag gccgatgagc tgggtgagcg tgcacgtctt 7500

ctcgcagggg ccgctcgacg acatgatcac gggcctggcc gggccgctcc tcggcgacga 7560

cggcttcttc ctgcgctact gggagggcgg cccgcatctg cggatcaggg tcaggtccca 7620

cccggcggag caggtcgtcg agcgggccga ggcgtatctg cgcgagcacc cgtcagaggc 7680

ggtgatcgac ccggaggagt acgccaggct cgccgcgacc ctcgccgccc gcgaaggcgt 7740

ccccggctat acgcggcgcc tctatccgaa cgactccgcc cacctcatcc cgtaccagcc 7800

ggaacacgac cgctacggca cgggccgctc gctcgacgcc gtggagcggc acttccacga 7860

ctccagcgtg atcgcactcc agctgatcgg ggcggggctc ggacacgagc ggcggagcat 7920

ggcgtggctg accatgctgc tggtcgcctg gcaggtcgcg ggggagggca gggcgttcgg 7980

cccgcccgct gacgccgggg ttcaggtgcc ccacgagcgg atggcggcgc tggtcgagca 8040

cgccagggcg gtgacacagg agcctgcgcc gagcgagccc cgtggcgtgg tggccgcctg 8100

gtacgcctcg atcgcgcggc tggtggagga actggcggcg gcggggttcg acgcggcgcg 8160

gacgggggcg accgtcgatc tggccgcgca tctgctggcc aacaggctgg ggatccgggt 8220

gcaggaggag gcccggctgc gtcacctggc gtccggggcc acgagggagt cggaggtggg 8280

ggtcggatga cctggacgcg gctgcgggtg gactatcacg acggcccgat ggacgacctc 8340

atcctggacg cgctccgccc ggcctggcat gaaatacggg gatatttcct gcgccactgg 8400

gtgtgcggcc cgcacctgcg gatcttcgtg gacggcgacg cgacgccgat cgtccgggcg 8460

gtcgagcgcc acctggccgc ctgcccgtcc gccggcacca ccgacccgca ggcgctgctc 8520

cccctgcacg agcgcctggc cgagctggaa ggcgaacgag gcccgctgct gccatgggcc 8580

cccgacaaca ccgtcaccgc cgaacccccg gggctcgaca ccgagctcga ccggttcctc 8640

gcggacttct acgccgacac caccgaggcc gcgttcgacg ccctcggccg ggtcagagcc 8700

ggcacgccgc tgccgggcat cgccttcgac ctggtggtcg ccaccgcgca cgacctgtcg 8760

gagggcggcc tgcccactgc caggacctcg ctgcgctcgc acgccgaggc ttacctgtcg 8820

cgcctgccgg gaggcgtccg cgccaagtgg caggcgcact acgaacgcaa ccaggagccg 8880

ctgaccgcca ggatcaaggc cctgaccggc gccggagagc ccggcgcgtg gctgcgtacg 8940

atccgggcca cccgcgaccg gggccgtacc ctcatcgacg agggacggct gagcctcggc 9000

tacgccaccg acggcccttc cacgcggccc ccgctcgccg cggtctcccc cttccaccgg 9060

aacctggaga ccgacgaacg ctggctcgcc ctcaaggaca cccccgcctt cgccgcctac 9120

cgcctggccc tgaactgcgc gtacctccac ctcacccggc tcggcctcac gcccgaccag 9180

cgcttcctga tctgccacct cgccgcgagc gccgccgacg acgtctaccg ggccgtggcc 9240

tcatgaccgg ggaacggtac gagctgcgcg ccggcgtgca cctcgcccgg ctggacgcgg 9300

gggtccgcct gttcgcctgg ccgcacgccg agaccctcgg cgagctcacg cgggatgagc 9360

tcgacctgct ccgcgacctg gccgccggac cccgcaccgc cgggggaccg ctcgtcgaac 9420

gcctgcgcgc cggaggctgg ctcaagatca cgattacccg ggacggcgtg cccctctaca 9480

cgctcgcccc gctgcgcccg ccgccgccac ggccggcggt gccggagcgg ccggttctgt 9540

ccaggttcgc cacgctgcgg cgcgaggggg acgcgctggt cgccggctcc ccgctggcct 9600

ggtgcgacct gtacgtccac gaccccggcc tggtcggcga cgtggtccgg cccggcggcg 9660

aggtcctggc cgacctggtg tgggccgggc tggccgtgcc cgaggaggcc gaggaccggg 9720

agctgcggtt ccggcagtgg gcgccgcacg agctggagtt ccatgaccgg agccgggtgg 9780

ggcaccgcgg ctacctgggc gatgggttcg gcgggacgtt ctgggcccgc ggccggttcg 9840

acccgctgcc cgcccggccc cggccctacc ccggccgggc gatcgagctg cccacgcccg 9900

acctggacga actgcggctc aaggacccct cgctcacgga cgtgctggag ggccgcaggt 9960

ccgtacgcga gcacgacgac gagcgcccga tcaccctcga cctgctcggc gagctgctgt 10020

accgcacggc cagggtgcgg gagtgctgga cggccgacgg cgtcgaatac acccgcaagc 10080

cgtacccctc cggagggtcc gtctacgagc tggagatcta ccccgtcgtc aggaacgtgg 10140

ccgggctcga acccggcatg taccactacg acgggcacga ccacgtgctc aggccggtac 10200

gtgaggccgg ccatcccgcc gtacgccggc tgctgaccgt cgccgggcac ggcgccgcca 10260

ccggccgccg cccccaggtc ctgctcgcgg tctccagccg cgccggccgg ctgctgtgga 10320

agtacgaagg catggggtac gcgctgacgc tcaagcacgt gggtgtgctc taccagacgc 10380

tctactgcgt ggccacggcg atgggcctgg cggcctgcgg gctcggcagc ggcgactcgg 10440

ccgcgttcgc cgaggcgacc gggcgggacc cgttggagga gtgcgcggtc ggcgaattca 10500

tgatcggaac cgcggaggca ccacgttgaa cgacttcaaa cccagactcc ccgcggacat 10560

acgcttcgcg cccacctccg gcggtgtcgc cttcctcacc cgcgaaggcg tcgtgcggat 10620

gaacggggcc tccgtccacc tgtgggtgga gcggctggcc gtgcacctcg acgggagcag 10680

gaccgtggcc gagctgaccg cggagctgcc cgacgagcgg cgggcgttcg tgacgagcct 10740

gctgaccacg ctgcgcgagc gcgggctcgt ggaggacgcg ggagagcgcg gcgtgctgcc 10800

cgtggcggcc ggcaccgcgt gctcgctgct ggccgacgcg gaccggttcg gcgagctggc 10860

gcccgccctg gccgacgccc tgcgcaggct ggggctggag gtgctgacag agccgtcggg 10920

cggggcgctc gtgcacgtcg cggcggccga cgcggacggg ctggccgccg ccgggcgcct 10980

cgaccggctg agcgccgagc gcgggctgcc catcgcgcac gtgctgctgc gcgagggcga 11040

ggcgtggtgg agcgagaccg gcgtcgtcgg gcgcgacgtc ccgccgtggg cggccgggtg 11100

gcggcggctg gcggccatgg aggccgtccc gcgtaccgcc gggcacgtct ccgtgtcgcc 11160

cgtcgccgcg gccgtggtcg ccgggcaggt ggtggcggac ctggggcgct gcctgtccgg 11220

aacgccccgc gtgtccggcg gtccgcggct gcacgtggtg gacctggacg ggttcgggat 11280

gcggacgcac tccttcctgc cgcacctgtc ggcgctgccg cccggcacgg gggtgagcgc 11340

ggggccgctc ggcgaggagg agttctcgcg gcgggcggcc aggttgatgg actcgcggac 11400

gggggtgttc gccgagatcg aggaggggga gtacgggcag ctcccgctgc acgtgtcggt 11460

gaccacggtg gccgatccga tgggggccct cgggggtgcg ctggcgcggg tgatcggcgt 11520

gggggcggac ttcgccaccg cgcgataccg ggcggcgctt aaggcactga ccgtgcacgg 11580

gctgctcgcc ctcgaccccc gccgcctggt cacggccgag gggacgcccc tgaccggcgc 11640

gggggaaccc gccagcggct tcccggctga tccgggcgcg agggaacggc cgatcggtgg 11700

cttttcggct gatccgggtg cgggtgagcg gccggacgac ggtctcctgg acgacccgct 11760

ggtgggcgac gtcgcggcgg gacgggtcga ggcgttcgtg cgcggccgtg acctcgtcga 11820

gggcggtgag gtgctgctgc ccgcccgcgc ggtgttcctg gatccgcacg ccaccggggc 11880

cgccgcgggg tactcggccg aggaggcgct ggtcgcgggg ttactggacc actgtgcggc 11940

actggccggg ctcgacggga cgctgccgcc cgtggacgtg ggcggcgcgc gggcggccga 12000

cgacgagacc gcgcggtcgg cggcgctgct ggacgcgatc gggctgccgt accaggtgct 12060

ggacgccacc ggcccgtcgg gcgtgcccgt gcacgcgggg acgctcggcg ggcggctggt 12120

ggcgcgggcg gcgggcgtca cgcccctggc cgcgctgcgg gccacgctcg aagggatcct 12180

ggccgcgtac cagggcattc cgggccccgc acccctgccc gacctgtgcc cggccgtcgc 12240

gcaggagccg ccggtcgtcc tcgacacggg ggcggccgtg ctcggcgccg gtgagctcgc 12300

cgccgccctg gccggcgccg ggctgcgggt cagcgccgtt ccgctggatc acgaccggga 12360

ggtacacgcg ctcatgccgc acgtcgtccg cgtcgtcacg gagccgctcc atggctgagg 12420

tcgtggggac gggcctgctg gccgaggaga tcacgatcgc gctgaaggac cgcgacgggc 12480

gggcagaggt gacgatcacc gcctgcgacg gctgggcgcg cggcccccgg cgcgacgggg 12540

cggcgtggtt gcccgtgcgg gtcgagtacg gggtcgccgt catcgggccg ctggaacgcc 12600

ccggcgaacc cggctgcgtg acctgcttcg agacccgccg ggaccgggtc aggaccgaca 12660

gcgccgatcg ggccgccgtc ctggccgtcc acggccccga actcgccggg cgggcctccc 12720

cgtacctcgg ccgcctggcc gcccgcacga tcgcggccct ggccgcgcac gccgccgagg 12780

gccccggatg cgccgtctgg tacgtcgacc tgcgcacgct caccgccgaa cgccacacgt 12840

tcctgccgga accccactgc cccgactgcg gcgacctgcc ggacgacgac cgcgcgtccg 12900

ccgccttcga gcccggcgcc gccccgcgac ctcccggcta ccgggtcagg aacgtgccgg 12960

ccgagcacgg cgcgctgctc gacacgtacg tggacggcga atgcgggctg atcaggcccc 13020

tcgtccggga cacgctcggc ggcctggtga tcgccggggc gatgctgccg ctgcggttcg 13080

agggcggttc ggagcccggc gtgggccgca cccgcggcta ccgggccagc gaggtcaccg 13140

ccgtgctcga agcgctcgaa cggtggggcg gcgtcgagcc cggcggcaag cgcacccgcg 13200

tgcgggcctc gtacgcggag gtggccgcgg acgcgctcga ccctcgaacg ctgggcgagc 13260

acgacacctc ctcctacgag atggaggggt tcgcgttccg gccgttcgcc gaggacgccg 13320

tctgcgactg ggtgtggggg tactccttcg cccggcgctc gccgatcctc gtgccggaga 13380

gcctggccta ttactacgta cgggggcggg agcggccgtt cctcttcgag atctcgaacg 13440

ggtgcgcgct cggcggcagc atggcggagg ccctgctcta cgggctgctg gagacggtcg 13500

agcgggacgc ctttctcatg acctggtacg ggcggctccc ggtgccgcgg atcgaccccg 13560

gcacggcacg ggaccgcacc atcccgctcc aggccgccgc gatcatcgcg gagaccggtt 13620

atcgggtgga gctgtacgac acgacgatgg agcacggcat ccccagcgtg tgggcgatgg 13680

gcgtgcggca ggacggcgat ccgggcaggc cgcgcctggt gtgcgccgcc ggggcccacc 13740

tggtgccgga gaaggccgtg ctcagcgcgc tgagcgagct ggggccgctg ctggccgacc 13800

tgatccggcg gtatccggac gaggtgcacc gagcccagga gatggtgaca aatcctgatc 13860

tggtggcgac gatgcacgac cactccaccc tgtacggcgc cgacgcggcc ttcgaccggc 13920

tctcgttcct gaccggcggc acgggcgtgc gggggctgcc cgacatggag gcgttcaccg 13980

tgcccggtga tctcgacgtc atgagggtgg tggaccgctt cctcgccgag gggatggacg 14040

tcgtcgtcat cgaccagacc acgccggagc atcgggcccg cggtttctcc tgcgtcaagg 14100

tgctggtgcc cggcacgctc ccgatgacct tcggccaccg caaccgcagg gtgcggggcc 14160

tgacccgccc gctggagctg ccgtaccggc tcggccaccg cgacacgccc ctgacccccg 14220

ccgacctgaa ccccgaccca caccccttcc catgaccacc gagccgtttc ccgcgccgac 14280

ggggccgccc gcagcgccga cggggccgtc tcccgcgctg gcggagccgt ctgctgcatc 14340

gcccggcccg ttgtccgttc ggcaggggcc gtctcctgtg accgccgagc tgcgtgacct 14400

ggcgatcttc cgtgccgatc tgcatgccca ccccgagctg tcctggcagg aggccaggac 14460

ggccgatcgc ctggcggggc ggctggcggc ggccgggtac gaggtcacga ccgggatggg 14520

cggtcatggg gtggtcggga ggctgtgccg tggcgacggg gtcacggtca tgctcagagc 14580

cgagctggac gccctccccg tcaaggagga gaccggcctg tcatacgcca gcaccgccac 14640

cgccacgacc ctcgacggca ggacggtgcc ggtctcccac gcctgcggcc acgacctcca 14700

tctcgcctgc ctggtcggcg ccgcccggcg gctggccgcc tgcgacgact ggcggggcac 14760

ggtgctcgtg atcggccagc ccgccgagga gacgctggag ggcgccgccg cgatgctcgc 14820

cgacggcctg tacgagcggt tcggcgtccc ggacgtggcg ctggcccagc acgtctcgcc 14880

gttccccgcg ggcctgatcg cctacccgga gccgcccacc gcggccggcg ccgaactccg 14940

cgtcgtcgtc acgggggacg gcggccacgt cggagacatc ggccgggctg gtcacgtcga 15000

tcgagccgtg gggcgcaatc cggtcgcggc cgtcgccgcg ctcgttcacc ggctcgatca 15060

gacggcgttc gaccaggcga tcgtcaccgt ggggacgttg cacgcgggcg agcgcgccaa 15120

cgtgatcccc accctcgccg aggccgggat cacggtcagg gccgcgacgg aggaggcggt 15180

gacccgggcc gtcgcccgcg tcgcccggct ggcggaggag acggcgggag ccggcgtcat 15240

cgtggtctcc agggtgccgc ccggcgtgaa cgaccccgcc gccaccgccc tggtacgccg 15300

ggcccacgag gccgcgctcg gcgcggtcgt caccgccccc ggcggctcgg cctgcgagga 15360

cttccccctc tacggggtgc cctccgtcta ctggtacgtg ggcgcggccc cacccgccgg 15420

cctggtcgga cgcccgcata ccgggacttt ccgccccgat cccgtgccca cgttgagggc 15480

aggggtcacc gccatgcaaa cggctgccct ggcagtcctt gcgaacgcgt cacagttcgc 15540

ccctccatcc cgatatcatg gacccggagc agtagccgag cactga 15586

<210>64

<211>60

<212>PRT

<213>野野村氏菌属物种

<400>64

Met Ser Asn Ala Ser Ile Gly Gln Glu Ile Gly Val Glu Gly Leu Thr

1 5 10 15

Gly Leu Asp Val Asp Ala Leu Glu Ile Ser Asp Tyr Val Asp Glu Thr

20 25 30

Leu Leu Asp Gly Glu Asp Leu Thr Val Thr Met Ile Ala Ser Ala Ser

35 40 45

Cys Thr Thr Cys Ile Cys Thr Cys Ser Cys Ser Ser

50 55 60

<210>65

<211>180

<212>DNA

<213>野野村氏菌属物种

<400>65

atgagtaatg cctccatcgg tcaggagatc ggcgtcgagg gcctgacggg cctggacgtc 60

gacgctctgg agatcagcga ctacgtggac gagacgctgc tcgacggcga ggacctcacg 120

gtgacgatga tcgcctccgc ctcgtgcacc acctgcatct gcacgtgcag ctgcagctcc 180

Claims

1.包含选自以下的氨基酸序列的硫肽前体蛋白质：

(i)SEQ ID NO：1；

(ii)SEQ ID NO：5；

(iii)SEQ ID NO：11；

(iv)或当与SEQ ID NO：1、SEQ ID NO：5或SEQ ID NO：11相比时，具有不超过1、2、3、4、5、6或10个缺失、插入和/或取代氨基酸的所述氨基酸序列的变体。

2.权利要求1的硫肽前体蛋白质，其中所述前体是Ef-tu硫肽抑制剂的生物合成前体。

3.权利要求2的硫肽前体蛋白质，其中所述Ef-tu抑制剂选自GE2270A、GE37648A、Amythiamicin或如以下任意通式I-XI中的任意通式所示的化合物：

4.核酸，其包含编码权利要求1-3中任一项的硫肽前体蛋白质的核苷酸序列。

5.权利要求4的核酸，其包含SEQ ID NO：5的核苷酸序列。

6.权利要求5的核酸，其包含SEQ ID NO：6的核苷酸序列或包含至少SEQ ID NO：5的其任何片段。

7.权利要求4-6中任一项的核酸，其中所述核酸序列有效连接异源转录和翻译控制序列。

8.权利要求7的核酸，其中所述核酸是表达载体。

9.用于硫肽生物合成的多肽，其包含选自以下的氨基酸序列：

(i)SEQ ID NO：23-34中的任一个，

(ii)(i)中列出的氨基酸序列的变体，当与(i)中列出的相应野生型氨基酸序列相比时，其具有不超过1、2、3、4、5、6、或10个缺失、插入或取代氨基酸，并保留基本上相同的酶功能。

10.核酸，其包含编码权利要求9的多肽的核苷酸序列。

11.权利要求10的核酸，其中所述核酸序列有效连接异源转录和翻译序列。

12.包含权利要求1-86中任一项的核酸的宿主细胞，其中在所述宿主细胞的基因组中未天然发现所述核酸。

13.权利要求12的宿主细胞，其还包含硫肽生物合成所需的其他基因。

14.权利要求13的宿主细胞，其中硫肽生物合成所需的所述其他基因包含权利要求10或11定义的核酸。

15.权利要求13或14的宿主细胞，其选自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种、大肠杆菌(Escherichia coli)、棒杆菌属物种(Corynebacterium sp.)、芽孢杆菌属物种(Bacillus sp.)和链霉菌属物种，如变铅青链霉菌、天蓝色链霉菌、白色链霉菌(Streptomyces albus)、Streptomyces ramocissimus、丘链霉菌(Streptomyces collinus)、弗氏链霉菌(Streptomyces fradiae)、远青链霉菌或灰色链霉菌(Streptomycesgriseus)，并且其中所述宿主细胞针对所述硫肽提供抗性。

16.突变体微生物，其中与相应野生型微生物相比时，所述突变体微生物不再表达编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因。

17.权利要求16的突变体微生物，其中所述突变在相应野生型微生物中是编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因的破坏。

18.权利要求17的突变体微生物，其中所述微生物是野野村氏菌属物种并且所述突变是包含SEQ ID NO：15或SEQ ID NO：16的基因的破坏。

19.权利要求16-18中任一项的突变体微生物，其中用权利要求1-8中任一项的核酸进一步转化所述突变体。

20.突变体微生物，其中所述突变体微生物不再表达编码如权利要求9定义的一个或多个多肽的一个或多个基因。

21.用于硫肽生物合成的多肽，其包含选自以下的氨基酸序列：

(i)SEQ ID NO：47-60的中任一个，

(ii)(i)中列出的氨基酸序列的变体，与(i)中列出的相应野生型氨基酸序列相比时，其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸，并保留基本上相同的酶促功能或调节功能，

(iii)(i)中列出的氨基酸序列的变体，其与(i)中列出的一个多肽具有至少80％或至少90％的同一性，并保留基本上相同的酶促功能或调节功能。

22.包含编码权利要求21的多肽的核苷酸序列的核酸。

23.权利要求22的核酸，其中所述核酸序列有效连接异源转录和翻译序列。

24.包含权利要求22或23的核酸的宿主细胞，其中在所述宿主细胞的基因组中未天然发现所述核酸。

25.权利要求24的宿主细胞，其还包含硫肽生物合成需要的其他基因。

26.权利要求25的宿主细胞，其中硫肽生物合成需要的所述其他基因选自编码权利要求4-8中任一项的硫肽前体蛋白质的核酸和权利要求10-11的核酸。

27.突变体微生物，其能够产生一个或多个特定基因的表达有缺陷的硫肽，所述特定基因编码如权利要求21中所定义的一个或多个多肽。

28.用于产生硫肽前体蛋白质的方法，所述方法包括在适合于产生所述硫肽前体蛋白质的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。

29.产生硫肽化合物的方法，所述方法包括在适合于产生所述硫肽前体化合物的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。

30.权利要求28或29的方法，其还包括分离基本纯形式的所述硫肽前体或硫肽化合物。

31.权利要求29或30的方法，其中所述硫肽化合物选自：GE2270A、GE37648A、如权利要求5中任意通式I-X中任意通式所示的化合物、amythiamicin、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins、nocathiacins、伯尔尼霉素、A10255B和radamycin。

32.产生硫肽衍生物的方法，其包括：

(i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体的序列，在宿主细胞中合成改变的硫肽前体，

(ii)从所述改变的硫肽前体合成所述硫肽衍生物。

33.权利要求32的方法，其中所述改变的硫肽衍生物前体是如权利要求1-11中任一项定义的SEQ ID NO：1、SEQ ID NO：5或SEQ ID NO：11的变体。

34.权利要求32或33的方法，其中步骤ii)在体外进行。

35.权利要求32或33的方法，其中步骤ii)在与步骤i)相同的宿主细胞中体内进行。

36.产生硫肽或硫肽衍生物的方法，其包括：

(i)提供包含如1-11中任一项中定义的硫肽前体蛋白质的培养基，

(ii)在所述培养基中培养微生物，其中所述微生物还包含硫肽生物合成所需的其他基因。

37.权利要求36的方法，其中硫肽生物合成所需的所述其他基因选自编码下述多肽的那些基因，所述多肽选自SEQ ID NO：23-34和SEQ IDNO：47-60。

38.权利要求36或37的方法，其中所述微生物选自自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种和链霉素物种，如变铅青链霉菌、天蓝色链霉菌、白色链霉菌、Streptomyces ramocissimus、丘链霉菌、弗氏链霉菌、远青链霉菌或灰色链霉菌，其中所述微生物是选择为对所述硫肽或硫肽衍生物有抗性的菌株。