[go: up one dir, main page]

CN101809030A - 硫肽前体蛋白质、编码该蛋白质的基因及其用途 - Google Patents

硫肽前体蛋白质、编码该蛋白质的基因及其用途 Download PDF

Info

Publication number
CN101809030A
CN101809030A CN200880102696A CN200880102696A CN101809030A CN 101809030 A CN101809030 A CN 101809030A CN 200880102696 A CN200880102696 A CN 200880102696A CN 200880102696 A CN200880102696 A CN 200880102696A CN 101809030 A CN101809030 A CN 101809030A
Authority
CN
China
Prior art keywords
ala
leu
arg
gly
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880102696A
Other languages
English (en)
Inventor
R·莫里斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novartis AG
Original Assignee
Novartis AG
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novartis AG filed Critical Novartis AG
Publication of CN101809030A publication Critical patent/CN101809030A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/36Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Actinomyces; from Streptomyces (G)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07DHETEROCYCLIC COMPOUNDS
    • C07D513/00Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00
    • C07D513/22Heterocyclic compounds containing in the condensed system at least one hetero ring having nitrogen and sulfur atoms as the only ring hetero atoms, not provided for in groups C07D463/00, C07D477/00 or C07D499/00 - C07D507/00 in which the condensed system contains four or more hetero rings
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K5/00Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof
    • C07K5/04Peptides containing up to four amino acids in a fully defined sequence; Derivatives thereof containing only normal peptide links
    • C07K5/06Dipeptides
    • C07K5/06139Dipeptides with the first amino acid being heterocyclic
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及用于硫肽生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理该前体蛋白质的方法,或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物产生中的用途。

Description

硫肽前体蛋白质、编码该蛋白质的基因及其用途
本发明涉及用于硫肽(thiopeptide)生物合成的前体蛋白质、相应的结构基因及其用途。本发明还涉及用于遗传处理硫肽前体蛋白质的方法,或表达编码该硫肽前体蛋白质的基因以产生硫肽化合物或其衍生物的宿主细胞。本发明进一步涉及参与硫肽生物合成的基因的克隆和表征及其在硫肽化合物制备中的用途。
硫肽是天然的、富含硫的、高度修饰的大环肽,许多所述硫肽具有有效的抗生素活性。这些复杂的天然产物根据抗生素的Berdy化学分类分为噻唑肽(Berdy J.‘Recent developments of antibiotic research andclassification of antibiotics according to chemical structure.’Adv ApplMicrobiol.1974;18(0):309-406.)并包括硫链丝菌肽、诺雪七肽、微球菌素、nocathiacin、amythiamicin、GE2270A等。硫肽共有许多共同结构特征:聚集在中心多吡咯结构域中的三元或四元取代的氮杂环,其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架(framework)的一部分。硫肽的该大环标志使得它们与其他噻唑化合物,如博来霉素、杆菌肽、或小菌素B17区分开来。Hensens首先建议根据中心杂环结构域的结构和氧化状态对硫肽抗生素进行分类(O.D.Hensens和G.Albers-Schoenberg.‘Total structure of the peptide antibioticcomponents of thiopeptin by 1H and 13C NMR spectroscopy.’TetrahedronLett.1978,3649)。来自Cardiff University的Mark Bagley和同事的近期综述已经扩展了Hensens的分类系统,以描述5个不同的中心杂环结构域:四元取代脱氢哌啶或饱和哌啶、二氢咪唑哌啶、三元取代吡啶和四元取代羟基吡啶(Bagley等‘Thiopeptide antibiotics.’Chem Rev.2005年2月;105(2):685-714)。
尽管具有大量结构同源性,硫肽抗生素的作用(对蛋白质合成的抑制)位点和方式可分为两个功能类:结合称为L11结合结构域的23S核糖体RNA区域的那些和结合参与延伸循环的Ef-Tu蛋白质复合体的那些。经常认为在1954年首次分离为远青链霉菌(Streptomyces azureus)次生代谢物的硫链丝菌肽是硫肽家族的原型化合物(Donovick等‘Thiostrepton,a newantibiotic.’Antibiot Annu.1955-1956;3:554-9和Bagley等‘硫肽antibiotics.’Chem Rev.2005年2月;105(2):685-714)。
假定硫肽通过利用称为非核糖体肽合成酶(NRPS)的大的多酶复合体的非核糖体方法合成(Mocek等‘Biosynthesis of the modified peptideantibiotic thiostrepton in Streptomyces azureus and Streptomyceslaurentii’.J.Am.Chem.Soc.1993,115,7992-8001)。NRPS装配大环的实例是由真菌多孢木霉菌(Tolypocladium inflatum)产生的免疫抑制肽环胞菌素。NRPS装配肽不限于通常见于蛋白质的常见的20种L氨基酸。相反,这些酶具有掺入数百种不常见氨基酸及衍生残基的更广泛的所有成分的生物合成能力。
Washington大学的Heinz Floss等人指导的预实验揭示了硫肽的确由非核糖体途径产生。该研究组用抑制核糖体蛋白质合成水平的氯霉素处理培养物。然而,硫肽的从头产生仍然继续。当用于探测来自各生产生物的基因组DNA的Southern印迹时,来自代表硫链丝菌肽或相关诺雪七肽的氨基酸序列的寡核苷酸不能与任何同源序列杂交(T.M.Smith,Y.-F.Jiang,H.G.Floss.′Thiopeptide Antibiotics″in″Biotechnology of Antibiotics″W.R.Strohl,编著,第2版,Marcel-Dekker,New York,1997,第393-413页)。
此外,在生成菌株中已经鉴定了假定编码微球菌素合成酶复合体组件的NRPS基因片段(Carnio等‘Pyridinyl polythiazole class peptideantibiotic micrococcin P1,secreted by foodborne Staphylococcus equorumWS2733,is biosynthesized nonribosomally.’Eur J Biochem.2001年12月;268(24):6390-401.)。
然而,至今仍未有硫肽生物合成途径的出版说明书。
因此,需要鉴定参与硫肽生物合成的基因,其将为有效的硫肽制备提供工具并为产生可选的硫肽结构提供可能性。本发明满足了该需要并第一次公开了用于硫肽生物合成的染色体编码骨架(backbone)以及参与硫肽生物合成的核心生物合成酶。
1.作为硫肽生物合成起始材料的染色体编码骨架
本发明人确实已经发现了这样的确凿证据,例如在放线菌物种中染色体编码骨架是用于硫肽生物合成的起始材料。
第一方面,本发明涉及包含选自以下的氨基酸序列的硫肽前体蛋白质
(i)SEQ ID NO:1;
(ii)SEQ ID NO:5;
(iii)SEQ ID NO:11;和
(iv)任何所述氨基酸序列的变体。
如本文所用,术语“硫肽”指根据抗生素的Berdy’s化学分类的噻唑肽,与其他噻唑化合物,如博来霉素、杆菌肽、或小菌素B17相反,其特征在于聚集在中心多吡咯结构域中的三元或四元取代氮杂环,其为由修饰的杂环残基(包括噻唑类、唑类和吲哚类)和脱氢氨基酸组成的大环框架的一部分。
术语“硫肽前体蛋白质”指可用作体外或体内硫肽合成起始材料的基因编码多肽骨架。优选地,所述硫肽前体是细菌延伸因子Ef-tu的抑制剂的前体。Ef-tu抑制剂描述于例如Hogg T,Mesters JR和Hilgenfeld R.(‘Inhibitory mechanisms of antibiotics targeting elongation factor Tu.’Curr Protein Pept Sci.2002年2月;3(1):121-31)的综述中。众所周知的Ef-tu抑制剂的实例是GE2270A(如Selva等‘Antibiotic GE2270A:a novelinhibitor of bacterial protein synthesis.I.Isolation and characterization.’J Antibiot(Tokyo).1991年7月;44(7):693-701中定义)、GE37648A(如Stella等‘Antibiotic GE37468A:a new inhibitor of bacterial protein synthesis.I.Isolation and characterization.’J Antibiot(Tokyo).1995年8月;48(8):780-6、Erratum:J Antibiot(Tokyo)1995年12月;48(12):C-3中定义)和Amythiamicin(如(‘Novel antibiotics,amythiamicins.’J Antibiot(Tokyo).1994年6月;47(6):668-74,1145-52和1153-9中定义)。新的Ef-tu抑制剂也描述于2007年12月19日提交的国际专利申请号PCT/US07/025955中。此类新Ef-tu抑制剂更特异地包括如下表示的通式I到XI的化合物(包括其可药用盐,以及其对映异构体、立体异构体、旋转异构体、互变异构体、非对映体或外消旋物):
Figure GPA00001021253400051
这种前体蛋白的氨基酸序列对硫肽的最终结构至关重要。如将在下文中详细描述的,本发明的硫肽前体蛋白质可用于再生新鉴定的硫肽的骨架或产生已知硫肽的新衍生物,其例如具有改良性质。
本发明因此不仅涉及SEQ ID NO:1、SEQ ID NO:5或SEQ ID NO:11的前体蛋白,也涉及可用于硫肽衍生物生物合成的任何变体。本领域技术人员将知道怎样根据待合成硫肽的氨基酸骨架设计所述变体。在SEQ IDNO:1中,在14氨基酸骨架中发现的六个半胱氨酸是修饰这些分子的噻唑杂环的前体。此外,两个丝氨酸残基参与吡啶环系在大环和侧链交界处的形成。在GE2270A分子的硫肽侧链中发现了额外的噁唑啉,并在通式(I)到(XI)的新Ef-tu抑制剂中发现了分别通过丝氨酸的杂环化和脱水形成的脱氢丙氨酸残基。
在特定实施方案中,当与原始序列相比时,SEQ ID NO:1、SEQ ID NO5或SEQ ID NO 11的变体具有不超过1、2、3、4、5、6或10个缺失、插入或取代的氨基酸。取代的氨基酸可以是具有等同功能团或不同功能团的天然氨基酸或非天然氨基酸。
下表1给出了可用于相应特定硫肽生物合成的硫肽前体蛋白质序列(SEQ ID NO:1-14)的指示。
表1.硫肽氨基酸骨架的一级序列比对。所述比对集中在形成标记多取代氮杂环的两个不变丝氨酸分子结合的大环周围。硫链丝菌肽具有4个氨基酸的额外氨基延伸。
Figure GPA00001021253400071
Figure GPA00001021253400081
在本申请中使用以下标准密码字母用于描述任何氨基酸、肽和蛋白质序列:A,丙氨酸;R,精氨酸;N,天冬酰胺;D,天冬氨酸;C,半胱氨酸;Q,谷氨酰胺;E,谷氨酸;G,甘氨酸;H,组氨酸;I,异亮氨酸;L,亮氨酸;K,赖氨酸;M,甲硫氨酸;F,苯丙氨酸;P,脯氨酸;S,丝氨酸;T,苏氨酸;W,色氨酸;Y,酪氨酸;V,缬氨酸。
更普遍地,在一个特定实施方案中,氨基酸序列SEQ ID NO:1的所述变体具有以下通式:SXNCXCXXCCSCSX,其中X可以是任何氨基酸。更优选地,SEQ ID NO:1的所述变体包含以下通式:SX1NC X2CX3X4CCSCSX5,其中X1是C或S,X2是V或F,X3是G或Y,X4是a F,P、I或V并且X5是P或S。此类变体的实例是SEQ ID NO:2-4的前体蛋白。
在另一特定实施方案中,氨基酸序列SEQ ID NO:5的所述变体包含以下通式:SC X1 X2 X3C X4C X5 X6X7X8,其中X1是T或V,优选T,X2是T或G,优选T,X3是C或S,优选C,X4是任何氨基酸,优选V、I、E或A,X5是任何氨基酸,优选T、C、V或A,X6和X7独立地是C或S,优选C,X8是C或S,并且X9是任何非氨基酸残基,或T或S。此类变体的实例是SEQ ID NO:6-10的前体蛋白。
在另一特定实施方案中,氨基酸序列SEQ ID NO:11的所述变体包含以下通式:SC X1 X2S X3 X4 X5 X6SSSSSS,其中X1是T或V,优选T,X2是T或G,优选T,X3是S、G或A,X4是V、C或A,X5是S、T或A,X6是C或S。此类变体的实例是SEQ ID NO:12-14的前体蛋白。
2.编码硫肽前体蛋白质的基因的核酸
本发明还提供编码硫肽前体蛋白质的基因和/或可读框的核酸。更具体是,本发明提供包含编码如上所定义的硫肽前体蛋白质的核苷酸序列的核酸。
“核酸”指核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯多聚体形式,或其任何磷酸酯类似物,如单链形式或双链螺旋的硫代磷酸酯类和硫代酸酯类。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋(helices)是可能的。术语核酸,具体而言DNA或RNA分子仅指分子的一级和二级结构,并不限于任何特定三级形式。因此,该术语包括尤其是见于线性(例如限制性片段)或环形DNA分子、质粒和染色体中的双链DNA。
“重组DNA分子”是已经进行分子生物学操作的DNA分子。
“多核苷酸”或“核苷酸序列”是核酸,如DNA和RNA中的一系列核苷酸碱基(也称作“核苷酸”),并表示两个或更多个核苷酸的任何链。核苷酸序列通常携带遗传信息,包括用于产生蛋白质和酶的细胞装置的信息。这些术语包括双链或单链基因组和cDNA、RNA、任何合成的和遗传处理的多核苷酸,以及正义和反义多核苷酸(尽管此处仅表示了正义链)。这包括单链和双链分子,即DNA-DNA、DNA-RNA和RNA-RNA杂合体。这也包括含有修饰碱基,例如硫代尿嘧啶、硫代鸟嘌呤和氟代尿嘧啶的核酸。
本文中核酸的侧翼可以是天然调节(表达控制)序列,或可以与包括启动子、其他核糖体结合位点序列、调节响应元件、信号序列等的异源序列连接。也可通过本领域已知的任何手段修饰所述核酸。此类修饰的非限制性实例包括甲基化、“帽子”、类似物对一个或多个天然核苷酸的取代和核苷酸间修饰,如具有不带电连接(例如甲基化磷酸酯类、磷酸三酯类、氨基磷酸盐类、氨基甲酸酯类等)和带电连接(例如硫代磷酸酯类、二硫代磷酸酯类等)的那些。
术语“基因”,也称为“结构基因”表示编码或对应于包含一个或多个蛋白质所有或部分的氨基酸特定序列的DNA序列,并可以包括或可以不包括调节DNA序列,如启动子序列,其决定例如基因表达的条件。非结构基因的一些基因可以从DNA转录成RNA,但不翻译成氨基酸序列。其他基因可以作为结构基因的调节物或DNA转录的调节物起作用。
“编码序列”或“编码”表达产物如RNA、多肽、蛋白质或酶的序列,是当表达时产生所述RNA、多肽、蛋白质或酶的核苷酸序列,即所述核苷酸序列编码所述多肽、蛋白质或酶的氨基酸序列。蛋白质的编码序列可包括起始密码子(一般是ATG或GTG)和终止密码子。
当RNA聚合酶转录所述编码序列成为RNA,尤其是mRNA,并翻译成所述编码序列编码的蛋白质时,编码序列在细胞中处于表达控制序列的“控制下”或“有效连接”表达控制序列。
术语“异源的”指非天然元件的组合。例如,异源DNA指非天然定位于细胞,或所述细胞的染色体位点中的DNA。优选地,所述异源DNA包括对细胞外源的基因。例如,本发明包括包含DNA序列和非DNA序列部分的异源DNA序列的嵌合DNA分子。在该上下文中,所述异源DNA序列指非天然定位于硫肽生物合成基因簇序列中的DNA序列。或者,所述异源DNA序列可以天然定位于其非天然位置处的生物合成基因簇中。异源表达调节元件是与不同基因而非自然界中有效连接的基因有效连接的元件。在本发明的上下文中,编码目的蛋白质的基因对所述基因插入其中用于克隆或表达的载体DNA是异源的,并且其对含有所述基因在其中表达的该载体的宿主细胞是异源的。
术语“表达控制序列”指组合以调节编码序列转录的启动子、任何增强子元件或抑制元件(例如复制起始区)。术语“表达”表示允许或引起基因或DNA序列中的信息表现出来,例如通过激活参与相应基因或DNA序列转录和翻译的细胞功能来产生蛋白质。在细胞中或由细胞表达DNA序列以形成“表达产物”如蛋白质。表达产物本身,例如所得蛋白质也可称作由细胞“表达”。表达产物的特征可以是细胞内的、细胞外的或分泌的。术语“细胞内的”表示在细胞内的某些东西。术语“细胞外的”表示细胞外的某些东西。如果物质从细胞上或细胞内到细胞外以显著量出现,那么其由细胞“分泌”。
术语“转化”表示“外源”(即外部的或细胞外的)基因、DNA或RNA序列引入细胞中,使得宿主细胞表达所述引入基因或序列,以产生期望物质,通常是所述引入基因或序列编码的蛋白质或酶。所述引入基因或序列也可称作“克隆”或“外源”基因或序列,可包括调节或控制序列,如起始序列、终止序列、启动子序列、信号序列、分泌序列或细胞遗传装置使用的其他序列。所述基因或序列可包括非功能序列或功能未知的序列。接受并表达引入DNA或RNA的宿主细胞已经被“转化”并且是“转化体”或“克隆”。引入宿主细胞的DNA或RNA可以来自任何来源,包括与宿主细胞相同的属或种的细胞,或不同属或种的细胞。
本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了小的结构基因,其编码SEQ ID NO:1和SEQ ID NO:3的整个肽骨架。前体前蛋白原的预测大小分别是57和49个氨基酸,并分别描述于SEQID NO:19和SEQ ID NO:20中。然而,存在表明可选翻译起始位点的许多起始密码子。所述14氨基酸硫肽前体序列位于C末端。
已经从如实施例4中所示的远青链霉菌ETH28555物种中鉴定了不相关的硫肽硫链丝菌肽的相似结构基因,并且其编码SEQ ID NO:6的整个肽骨架。硫链丝菌肽的前体前蛋白原的预测大小是60个氨基酸并描述于SEQID NO:65中。
在一个实施方案中,本发明的所述核酸包含编码SEQ ID NO:1的14氨基酸硫肽前体的SEQ ID NO:15的核苷酸序列。在另一实施方案中,本发明的所述核酸包含编码SEQ ID NO:3的14氨基酸硫肽前体的SEQ IDNO:16的核苷酸序列。本发明还包括编码SEQ ID NO:1、SEQ ID NO:5和SEQ ID NO:11的硫肽前体及其任何变体(如表1描述的那些前体变体)的任何核苷酸序列。此类核苷酸序列的实例描述于SEQ ID NO:17和18或SEQ ID NO:65中,分别编码SEQ ID NO:1和SEQ ID NO:3和SEQ IDNO:6的硫肽前体蛋白质。
以来自SEQ ID NO:15-18的探针或引物开始从已知硫肽产生菌中分离并鉴定本发明此类核苷酸序列的方法为本领域所熟知,并且该方法的一个实例示于实施例4中。例如,可使用编码14氨基酸前体蛋白质的区域侧翼的引物扩增硫肽产生菌株的基因组DNA,并从本文公开的SEQ ID NO:17或SEQ ID NO:18进行测定。
在另一实施方案中,本发明的所述核酸包含分别编码57个氨基酸或49个氨基酸的前蛋白原的SEQ ID NO:17或SEQ ID NO:18的核苷酸序列,或包含至少SEQ ID NO:15或SEQ ID NO:16的其任何片段。
还包括的是所述核酸的修饰。此类修饰包括,例如本领域已知的标记、甲基化和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加所选表达系统中的表达、产量和/或提高纯化,或用于另一期望目的。
在另一实施方案中,本发明的核酸有效连接异源转录和翻译控制序列。更优选,其为表达载体。
如本文使用,术语“表达载体”指载体,通过所述载体可以将核酸引入宿主细胞,导致引入序列的表达。在一个实施方案中,载体包含启动子和一个或多个控制元件(例如增强子元件),其对引入的核酸是异源的,但被宿主细胞识别和使用。在另一实施方案中,引入载体的序列保留由宿主细胞识别并表达的其天然启动子。在一个实施方案中,与本发明相容的载体是穿梭载体pSET152、pOJ436、pOJ446(Bierman等‘Plasmid cloningvectors for the conjugal transfer of DNA from Escherichia coli toStreptomyces spp.’Gene.1992年7月1日;116(1):43-9)、pHM11a(Motamedi等‘Integrative vectors for heterologous gene expression inStreptomyces spp.’Gene.1995年7月4日;160(1):25-31)和pIJ8600(Sun等‘Green fluorescent protein as a reporter for spatial and temporal geneexpression in Streptomyces coelicolor A3(2).’Microbiology.1999年9月;145(Pt 9):2221-7)及其衍生物。在另一实施方案中,所述载体是粘粒。
“启动子”或“启动子序列”是在细胞中能够结合RNA聚合酶并起始下游(3′方向)编码序列转录的DNA调节区域。为定义本发明的目的,所述启动子序列在其3′末端结合转录起始位点,并向上游(5′方向)延伸以包括起始高于背景的可检测水平的转录必需的最小数量的碱基或元件。在启动子序列内将发现转录起始位点(例如通过用核酸酶S1作图方便地进行定义),以及负责结合RNA聚合酶的蛋白质结合结构域(共有序列)。所述启动子可有效连接其他表达控制序列,包括增强子和阻抑物序列。
载体的常见类型是“质粒”,其一般是双链DNA(其可以是环形)的自携分子,通常是细菌来源,其可容易地接受额外的(外源的)DNA并且可容易地被引入合适的宿主细胞中。质粒载体经常含有编码DNA和启动子DNA,并具有适合于插入外源DNA的一个或多个限制性位点。重组克隆载体将经常包括用于克隆或表达的一个或多个复制系统、用于在宿主中选择的一个或多个标记,例如抗生素抗性,以及一个或多个表达盒。
可使用本领域内的常规分子生物学和重组DNA技术产生载体构建体。在文献中详细解释了此类技术。参阅例如Sambrook,Fritsch&Maniatis,Molecular Cloning:A Laboratory Manual,第二版(1989)Cold SpringHarbor Laboratory Press,Cold Spring Harbor,N.Y.(本文为″Sambrook等,1989″);DNA Cloning:A Practical Approach,第I和II卷(D.N.Glover编著1985);F.M.Ausubel等(编著),Current Protocols in Molecular Biology,John Wiley&Sons,Inc.(1994)。或者,可使用建构生物学公司如CodonDevices(Cambridge,MA,USA;http://www.codondevices.com/)或Blue Heron Biotechnology(Bothwell,WA,USA;http://www.blueheronbio.com/)的DNA合成技术部分地或完全地合成载体构建体。
3.用于从硫肽前体产生核心大环的核心生物合成酶
来自两种不同硫肽产生菌株的两个硫肽生物合成基因簇的表征允许本发明人鉴定两种菌株中的高度保守基因,因此提示这些基因编码核心硫肽分子从硫肽前体进行合成需要的酶。图2和图3显示了从两种不同硫肽产生菌株表征的生物合成基因簇的可读框(ORF)的位置。
另一方面,本发明涉及用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID NO:23-34的任一个;和
(ii)(i)中列出的氨基酸序列的变体,当与(i)中列出的相应的野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸。
这些多肽可在体外或体内用于进行一个或多个反应步骤,所述反应步骤使用硫肽前体蛋白质作为硫肽分子合成的起始材料。变体多肽可保留与野生型相应序列基本上相同的催化活性,或具有提高的或改善的催化活性。仅为便于阅读,在下文中将这些多肽称作“核心生物合成酶”。
下表2描述了可用于硫肽生物合成的核心生物合成酶(SEQ IDNO:23-34)的实例及其在生物合成途径中的可能功能。所述可能功能进一步描述于下文实施例5.1和5.2中。
表2:用于从硫肽前体蛋白质开始生物合成硫肽的核心酶的实例
Figure GPA00001021253400151
4.编码核心生物合成酶的基因
本发明进一步提供编码核心生物合成酶的基因和/或可读框的核酸。更特别地,本发明提供包含编码如上定义的任何一种核心生物合成酶的核苷酸序列的核酸。
本发明人在Ef-tu抑制剂硫肽产生野野村氏菌属物种的基因组中成功鉴定了结构基因,其可能编码相应的Ef-tu抑制剂进行生物合成的必需酶。
在一个实施方案中,编码用于Ef-tu抑制剂生物合成的酶的所述核酸包含选自如表2中所述SEQ ID NO:62的基因组片段的ORF9、ORF10、ORF11、ORF12、ORF13和ORF15的核酸。在另一实施方案中,所述本发明核酸包含选自如表2中所述SEQ ID NO:63的基因组片段的ORF6、ORF7、ORF8、ORF9、ORF10和ORF11。在表2中也报道了相应的基因组片段(从5’到3’)中各基因的ORF(可读框)的核苷酸位置(坐标)。
从已知的硫肽产生菌株并使用来自SEQ ID NO:35-46的探针或引物分离并鉴定本发明这类核苷酸序列的方法为本领域所熟知。例如,可使用编码各基因保守区的区域侧翼的引物扩增硫肽产生菌株的基因组DNA,并从公开的核苷酸序列进行测定。
也包括的是所述核酸的修饰。此类修饰包括,例如,本领域已知的标记、甲基化,和简并核苷酸对一个或多个天然核苷酸的取代。这些修饰可用于增加在所选表达系统中的表达、产量,和/或提高纯化,或用于另一期望目的。
在一个实施方案中,本发明的核酸有效连接异源转录和翻译控制序列。更优选地,其为适合于在宿主细胞中表达全部或部分核心生物合成酶的表达载体。
5.硫肽前体蛋白质及相应硫肽的产生
染色体编码骨架的测定以及因此本发明人进行硫肽生物合成的核糖体途径允许本领域的一名普通技术人员在一个实施方案中克隆并表达硫肽生物合成途径,即生物合成基因簇,并因此在修饰的宿主细胞或异源生物中产生硫肽化合物。本发明还允许产生待在异源宿主细胞,即另一菌株而非天然产生菌株中表达的硫肽前体。尽管如本文所述,实施例说明了细菌菌株的用途,可使用任何生物或表达系统。生物的选择取决于技术人员的需要。例如,可使用易于遗传操作的菌株,以利于硫肽化合物的修饰和产生。
因此,另一方面,本发明涉及包含如上所述编码硫肽前体蛋白质和/或核心生物合成酶的一个或多个核酸的宿主细胞,其中所述核酸并非天然发现于所述宿主细胞的基因组中和/或所述宿主细胞并不天然产生相应的硫肽。
或者,可能通过提供包含适当量的如上所述硫肽前体蛋白质的培养基,并在所述培养基中培养微生物来完成硫肽或硫肽衍生物的制备,其中所述微生物还包含硫肽生物合成需要的其他基因,例如编码核心生物合成酶的基因。
如本文使用,术语“宿主细胞”或“微生物”表示以任何方式选择、修饰、转化、培养或使用或操作用于通过细胞产生硫肽前体或硫肽及其衍生物的任何生物的任何细胞。例如,宿主细胞可以是进行处理以表达特定基因、DNA或RNA序列、蛋白质或酶的一个细胞。宿主细胞可进一步用于筛选或下文所述的其他测定。可在体外或非人动物(例如转基因动物或瞬时转染动物)中一个或多个细胞中培养宿主细胞。
宿主细胞或微生物本身可选自任何生物体,包括原核(例如细菌)细胞、植物细胞,和真核细胞,所述真核细胞包括昆虫细胞、酵母细胞和哺乳动物细胞。适当宿主细胞的代表性实例包括细菌细胞,如大肠杆菌(E.coli)、链霉菌(Streptomyces)和枯草芽孢杆菌(Bacillus subtilis)细胞;真菌细胞,如酵母细胞,如毕赤酵母(Pichia)或酿酒酵母(Saccharomyces)细胞,丝状真菌如木霉(Trichoderma)或曲霉细胞(Aspergillus);和昆虫细胞如果蝇(Drosophila)S2和Spodoptera Sf9细胞。优选地,所述宿主细胞选自已知合成硫肽衍生物或被描述对所述硫肽具有抗性的宿主细胞,如Streptomyces ramocissimus和天蓝色链霉菌(Streptomyces coelicolor)(Olsthoorn-Tieleman等‘Elongation factor Tu3(EF-Tu3)from thekirromycin producer Streptomyces ramocissimus is resistant to threeclasses of EF-Tu-specific inhibitors.’J Bacteriol.2007年5月;189(9):3581-90.)。在一些实施方案中,所述宿主细胞选自针对硫肽提供抗性的菌株。为菌株提供抗性的方法为本领域所熟知[Kieser T,Bibb MJ,Buttner MJ,Chater KF,Hopwood D.Practical Streptomyces Genetics.John Innes Foundation,Norwich(2000)]并且在下文实施例中给出了该方法的实例。
在制备方法的一些实施方案中,所述宿主细胞还包含硫肽生物合成需要的其他基因。生物合成需要的其他基因可包括例如编码如上述核心生物合成酶的一个或多个基因。所述宿主细胞例如选自野野村氏菌属物种(Nonomuraea ap.)、游动双孢菌属物种(Planobispora sp.)、拟无枝酸菌属物种(Amycolatopsi sp.)和链霉素属物种(Streptomyces sp.)。本文包括的特定宿主细胞包括,但不限于链孢囊菌亚目(Streptosporangineae)链孢子囊菌(actinomycete)的生物,包括诺卡(氏)土壤菌科(Nocardiopsaceae)、链孢囊菌科(Streptosporangiaceae)和高温单孢菌科(Thermomonosporaceae),其优选种包括Acrocarpospora、马杜拉放线菌属(Actinomadura)、Herbidospora、小双孢菌属(Microbispora)、小四孢菌属(Microtetraspora)、诺卡(氏)土壤菌属(Nocardiopsis)、野野村氏菌((Nonomuria sic,由Chiba等(1999)校正为野野村氏菌)Zhenshui Zhang,Yue Wang和Jisheng Ruan在the International Journal of SystematicBacteriology(1998),48,411-422)中报道的重新分类属)、游动双孢菌属(Planobispora)、游动单孢菌属(Planomonospora)、Planopolyspora、Planotetraspora或链孢囊菌属(Streptosporangium)。更普遍的是,所述术语旨在包括含有产生硫肽化合物必需的遗传信息的所有生物。该宿主细胞的实例包括在2006年11月30日保藏的野野村氏菌微生物菌株Bp3714-39,保藏号为第德意志微生物保藏中心DSM 18831号。
用于蛋白质如本发明硫肽前体蛋白质的合适产生技术为本领域技术人员所熟知。参阅例如Sambrook等,Molecular Cloning:A LaboratoryManual,Cold Spring Harbor Press(Cold Spring Harbor,N.Y.)。可使用多种技术容易地产生本文提供的任何氨基酸序列的序列。这些和其他合适的产生方法为本领域技术人员所知。
一方面,通过在所选宿主细胞中表达一个或多个ORF或基因产生本发明的氨基酸序列。本发明因此涉及用于产生硫肽前体蛋白质的方法,所述方法包括步骤:在适合于产生所述硫肽前体蛋白质的条件下培养能够表达编码如上述硫肽前体蛋白质的核酸,和任选地,编码核心生物合成酶的一个或多个核酸的宿主细胞。在该方法中,所述宿主细胞并非所述硫肽前体蛋白质的天然产生菌株,或当所述宿主细胞是所述硫肽前体蛋白质的天然产生菌株时,编码硫肽前体蛋白质的所述核酸是重组核酸或异源核酸。根据所用的宿主细胞,可通过所述宿主细胞从硫肽前体完成硫肽化合物生物合成。为此目的,本领域的技术人员可以使用天然合成硫肽前体蛋白质进行翻译后修饰需要的酶的宿主细胞,或在产生菌株中引入硫肽生物合成进行翻译后修饰需要的所述基因。在一个特定实施方案中,上文定义的方法还包括分离基本上纯形式的所述硫肽前体或硫肽化合物。
在一个特定实施方案中,本发明涉及本发明宿主细胞用于产生硫肽化合物的用途,所述硫肽化合物选自:GE2270A、GE37648A、Amythiamicin和如上述通式I到XI中表示的新Ef-tu抑制剂、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins、nocathiacins、伯尔尼霉素、A10255B和radamycin。
一方面,本发明提供产生硫肽衍生物的方法,其包括
i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体序列,在宿主细胞中合成改变的硫肽前体,
ii)从所述改变的硫肽前体合成所述硫肽衍生物;和/或
iii)通过一种或更多种核心生物合成酶修饰所述改变的硫肽前体。
如本文使用,“改变的硫肽前体”是非天然发现于产生所述硫肽前体的菌株,即产生菌中的硫肽前体。
用于合成改变的硫肽前体的方法进一步描述于下文中。优选地,所述改变的硫肽衍生物前体是如上所述的SEQ ID NO:1、SEQ ID NO:5或SEQID NO:11的变体。步骤ii)在体外,即宿主细胞外;或在与步骤i)相同的宿主细胞中体内进行。在与步骤i)相同的宿主细胞中,通过所述宿主细胞天然地或从重组DNA合成一种或更多种核心生物合成酶。
在产生硫肽衍生物的方法中,使用例如旋转振荡器或搅拌釜发酵罐在有氧条件下温育接种本发明宿主细胞的培养基。在温育过程中通过向接种的培养基注射空气、氧气或适当的气体混合物完成通气。一旦已经积累足够量的硫肽衍生物,就以常规且平常的方式,例如通过萃取和层析方法、沉淀或结晶、和/或本文公开的方式从培养物中浓缩并分离它们。作为萃取的实例,培养物可与合适的有机溶剂如正丁醇、乙酸乙酯、环己烷、正己烷、甲苯、乙酸正丁酯或4-甲基-2-亚硝酸异戊酯混和并搅拌,可在减压情况下通过去除溶剂回收有机层中的硫肽衍生物。可任选地用例如水、乙醇、甲醇或其混合物重新溶解所得残余,并用合适的有机溶剂如己烷、四氯化碳、氯乙烯、二氯甲烷或其混合物重新萃取。去除溶剂后,例如通过层析方法进一步纯化化合物。作为层析的实例,可应用固定相如硅胶或氧化铝,并具有有机洗脱溶剂或其混合物,包括醚、酮、酯、卤代烃或卤代醇;或应用反相层析,其基于具有多种功能基团的修饰的硅胶,并用有机溶剂或其水性混合物,像乙睛、甲醇或不同pH的四氢呋喃洗脱。另一实例是例如固体-液体或液体-液体模式的分配层析。也可应用例如使用SephadexLH-20(Sigma-Aldrich)并用不同溶剂,优选用醇洗脱的分子排阻层析。
因为在本领域比较常见,可通过多种分析方法,包括生物测定、TLC、HPLC或其组合并应用不同检测方法(对TLC通常用UV灯、碘吸入剂或喷雾显色试剂,对HPLC通常用UV灯、质量灵敏的或光散射方法)监测产生以及回收和纯化过程。例如,通过使用具有功能化硅胶的反相柱并应用特定pH下极性水可混和溶剂和水的线性梯度混合物的洗脱剂,和利用不同波长UV灯和质量灵敏监测器的检测方法表示HPLC技术。
所得纯化的化合物不含细胞和细胞物质、副产物、试剂和其他外来物质,必要时允许处理并配制化合物用于实验室和/或临床目的。优选用于本发明的化合物的纯度具有以重量计高于80%的纯度;更优选地以重量计至少90%,甚至更优选以重量计高于95%;甚至更优选以重量计至少99%。在一个实施方案中,本发明提供含有本发明化合物的组合物,不管产生多少化合物。
宿主细胞生物合成的化合物可任选地进行随机和/或定向化学修饰,以形成是衍生物或结构类似物的化合物。可使用本领域已知的方法和本文描述的方法任选地修饰所述化合物。
6.能够产生硫肽前体蛋白质用于硫肽衍生物产生的突变体微生物
根据本发明的教导,现在可以遗传处理能够产生硫肽前体蛋白质的微生物,例如目的在于提高硫肽产生或调整硫肽结构。因此,在其他方面,本发明提供突变体微生物,其中所述突变体微生物在编码硫肽前体蛋白质的基因中和/或在编码核心生物合成酶的一个或多个基因中具有突变。所述突变可以是单个或多个核苷酸缺失、插入或取代。其也可以是编码所述硫肽前体蛋白质的基因片段或完整基因的缺失。优选地,所述突变体微生物与相应的野生型微生物相比时,不再表达编码本发明硫肽前体蛋白质的基因。优选地,为了避免极化影响,所述突变是编码所述硫肽前体蛋白质的基因内的框内缺失。
所述突变体生物是例如链孢囊菌亚目链孢子囊菌的生物,包括诺卡(氏)土壤菌科、链孢囊菌科和高温单孢菌科,其优选种包括Acrocarpospora、马杜拉放线菌属、Herbidospora、小双孢菌属、小四孢菌属、诺卡(氏)土壤菌属、野野村氏菌((Nonomuria sic,由Chiba等(1999)校正为野野村氏菌)Zhenshui Zhang,Yue Wang和Jisheng Ruan在the International Journal ofSystematic Bacteriology(1998),48,411-422)中报道的重新分类属)、游动双孢菌属、游动单孢菌属、Planopolyspora、Planotetraspora或链孢囊菌属。
在特定实施方案中,所述突变体微生物是野野村氏菌属物种,例如野野村氏菌微生物菌株Bp3714-39,其于2006年11月30日保藏,保藏号为DSM 18831,并且所述突变是包含SEQ ID NO:15或SEQ ID NO:16的基因的破坏,例如包含SEQ ID NO:17或SEQ ID NO:18的基因的突变。
在另一特定实施方案中,可以用编码如上述任何硫肽前体蛋白质的核酸进一步转化本发明的突变体微生物。该方法允许提供能够从任何硫肽前体蛋白质,包括如上述SEQ ID NO:1、SEQ ID NO5或SEQ ID NO:11的变体生物合成硫肽的微生物。在另一实施方案中,所述突变体微生物还天然或重组表达至少一个或多个编码核心生物合成酶的基因,例如编码选自SEQ ID NO:23-34的多肽的一个或多个基因。在一个实施方案中,所述突变体微生物天然或重组表达至少编码SEQ ID NO:23-28的多肽的基因。在另一实施方案中,所述突变体微生物天然或重组表达至少编码SEQ IDNO:35-46的多肽的基因。
7.筛选产生新硫肽化合物的新菌株
本发明人鉴定的基因可进一步用作鉴定能够产生硫肽衍生物的其他微生物的工具。例如,本发明涉及允许鉴定具有与(i)SEQ ID NO:17或SEQID NO:18的基因并更优选SEQ ID NO:15或SEQ ID NO:16的片段,或(ii)SEQ ID NO:35-46任一个中定义的核心基因基本类似的基因的细胞的任意方法。
在特定实施方案中,如通过序列比较算法,如BLAST、FASTA、DNAStrider等测定,当至少约80%,并最优选至少约90%或95%的核苷酸在DNA序列的确定长度内匹配时,则两条DNA序列“基本同源”或“基本类似”。该序列的实例是本发明特定基因的等位基因或物种变体。通过使用可从序列数据库中获得的标准软件比较,或在例如为特定系统规定的严格条件下的Southern杂交实验中鉴定基本同源的序列。
在核酸序列的上下文中,术语“序列同一性”“序列同一性百分比”或“相同性百分比”指当比对最大相似性时两条序列中的相同残基。序列同一性比较的长度可以在基因组全长范围内,期望在基因编码序列的全长或至少约500到5000个核苷酸的片段范围内。然而,也期望例如至少约9个核苷酸,一般至少约20到24个核苷酸、至少约28到32个核苷酸、至少约36或更多个核苷酸的更小片段的同一性。类似地,可容易地测定蛋白质全长或其片段范围内的氨基酸序列的“百分之序列同一性”。适当时,片段长度为至少约8个氨基酸,更优选至少约14个氨基酸,并可高达约700个氨基酸。合适片段的实例如下文所述。
在一个实施方案中,鉴定能够产生硫肽衍生物的方法包括以下步骤:
(i)将来自分离细胞的基因组DNA或RNA与SEQ ID NO:15或SEQ IDNO:16或其特异片段的核酸探针温育,用于探针与同源DNA区域的特异杂交;并
(ii)鉴定包含与步骤(i)的所述探针特异性杂交的基因组DNA区域或RNA的细胞。
当单链形式的核酸分子可以与其他核酸分子在温度和溶液离子强度的适当条件下退火时,核酸分子与另一核酸分子如cDNA、基因组DNA或RNA“特异性杂交”(参阅Sambrook等,Molecular Cloning:A LaboratoryManual,第二版(1989)Cold Spring Harbor Laboratory Press,Cold SpringHarbor,N.Y.(本文为″Sambrook等,1989″)。温度和离子强度的状况决定杂交的“严格性”。为了对同源核酸进行初筛,可使用对应Tm(解链温度)55℃的低严格杂交条件,例如5×SSC、0.1%SDS、0.25%奶,并且没有甲酰胺;或30%甲酰胺、5×SSC、0.5%SDS)。中等严格的杂交条件对应于更高的Tm,例如40%甲酰胺、5×或6×SCC。高严格杂交条件对应于最高的Tm,例如50%甲酰胺、5×或6×SCC。SCC是0.15M NaCl、0.015M柠檬酸钠。杂交需要两条核酸包含互补序列,尽管根据杂交的严格性,两个碱基之间的错配是可能的。用于杂交核酸的适当严格性取决于本领域熟知的变量:核酸的长度和互补的程度。两条核苷酸序列之间的相似性或同源性的程度越高,具有这些序列的核酸的杂交的Tm值越大。核酸杂交的相对稳定性(对应于更高的Tm)以以下顺序降低:RNA:RNA、DNA:RNA、DNA:DNA。对于长度大于100个核苷酸的杂合体,衍生了用于计算Tm的方程式(参阅Sambrook等,上文,9.50-9.51)。对于更短核酸,即寡核苷酸的杂交,错配的位置变得更重要,并且寡核苷酸的长度决定了它的特异性(参阅Sambrook等,上文,11.7-11.8)。杂交核酸的最小长度是至少约10个核苷酸;优选至少约15个核苷酸;并更优选所述长度是至少约20个核苷酸。
在特定实施方案中,使用标准的杂交条件。术语“标准杂交条件”指55℃的Tm,并利用如上文阐明的条件。在优选实施方案中,所述Tm是60℃;在更优选的实施方案中,所述Tm是65℃。在特定实施方案中,使用“高严格条件”。
用于寡核苷酸(例如寡核苷酸探针或引物)的合适的杂交条件通常与全长核酸(例如全长cDNA)多少有些不同,因为寡核苷酸具有更低的解链温度。因为寡核苷酸的解链温度将取决于所涉及的寡核苷酸序列的长度,所以合适的杂交温度将根据所用的寡核苷酸分子不同而不同。示例性温度可以是37℃(对于14碱基的寡核苷酸)、48℃(对于17碱基寡核苷酸)、55℃(对于20碱基的寡核苷酸)和60℃(对于23碱基的寡核苷酸)。用于寡核苷酸的示例性合适的杂交条件包括在6×SSC/0.05%磷酸钠中洗涤,或提供等同程度杂交的其他条件。
在本方法的一个优选实施方案中,设计对编码硫肽前体的基因特异的寡核苷酸并用于鉴定能够产生硫肽化合物的新细胞。此类寡核苷酸可用于编码硫肽前体蛋白质的基因片段的PCR扩增。优选地,筛选更低等的真核细胞,并更优选来自放线菌类的细胞。
8.编码硫肽前体蛋白质的基因的遗传操作和用于筛选新硫肽衍生物的用途
在另一实施方案中,本发明提供修饰编码硫肽前体蛋白质的基因和/或可读框的一个或多个核苷酸序列的方法。例如,此类修饰或改变可用于在所选表达系统中提高表达或产生新硫肽衍生物的目的。可进行其他改变以消减、修饰或增强硫肽化合物的功能,包括提高抗生素功能或减少非期望的性质。
一方面,从修饰编码硫肽前体蛋白质的核酸序列完成改变的硫肽前体的合成。在一个实施方案中,改变的核酸序列在所选宿主细胞中可通过合适的载体向如上述异源宿主细胞提供,并用于表达相应产物。或者,可直接在产生硫肽的菌株携带的天然基因中例如通过所述菌株的遗传操作进行所述改变。
本发明包括改变编码本发明前体蛋白的任何核酸序列的任何方法。更具体地是,本发明包括在本发明蛋白质中插入氨基酸、缺失氨基酸或取代氨基酸的任何方法。可在核酸水平上进行修饰。通过标准技术进行这些修饰并为本领域所熟知。
因此,本发明提供方法,以产生编码硫肽衍生物的前体的核酸,所述方法包括步骤:对各核酸,通过在所述序列(其编码SEQ ID NO:1-14中任意序列)的至少一个密码子中进行核苷酸取代,产生具有改变核苷酸序列的多个核酸。此类核酸文库可有利地用于筛选新的硫肽衍生物,例如具有改善性质的Ef-tu抑制剂。
改变的核酸或核酸文库然后可用于转化宿主细胞用于如上所述的硫肽产生。
优选,核酸文库的各核酸具有单个核苷酸取代,使得与野生型相应序列相比时,编码SEQ ID NO:1-14任意序列的仅一个密码子突变。产生位点定向诱变或核酸文库的方法为本领域所熟知并例如描述于Biotechniques出版的Hogrefe等的文章中(‘Creating randomized aminoacid libraries with the QuikChange Multi Site-Directed Mutagenesis Kit.’2002年11月;33(5):1158-60,1162,1164-5)。
在一个特定实施方案中,所述核苷酸取代在编码SEQ ID NO:1-4任意序列的位置2、5、7、8、14的氨基酸残基的一个或多个密码子中进行。
优选地,宿主细胞能够合成硫肽化合物,即还包含硫肽生物合成所需的其他基因。例如,硫肽生物合成所需的其他基因可包含编码选自SEQ IDNO:23-34的多肽的一个或多个基因。更优选地,改变的核酸与表达载体一起进行转化,因此转化后从所述表达载体合成相应的硫肽前体蛋白质。所得表达文库可用作筛选新硫肽衍生物,例如新Ef-tu抑制剂的工具。
9.特定生物合成基因的克隆
当对来自产生不同硫肽化合物的两菌株的生物合成基因簇进行表征时,本发明人鉴定了很可能参与硫肽生物合成但却是菌株特异性的ORF。因此提出这些基因很可能编码特定多肽,主要是参与核心硫肽结构的基因调节和酶促修饰的酶和转录调节物,以产生最终的菌株特异性硫肽化合物。
表3和表4描述了本发明这些特定多肽的核酸和相应的多肽序列。
表3:用于从菌I生物合成硫肽的特定多肽的实例
Figure GPA00001021253400251
Figure GPA00001021253400261
表4:用于从菌株II生物合成硫肽的特定多肽的实例
Figure GPA00001021253400262
在一个实施方案中,在表3或4中列出的一个或多个多肽用于如上定义通式(I)到(XI)的化合物的体外或体内合成。
本发明也涉及表3或4中报道的此类酶的任何功能变体,其保留基本上相同的酶促活性。本发明也涉及表3或4中报道的任何转录调节物的任何功能变体,其保留基本上相同的转录活性。在一个实施方案中,此类多肽与上表列出的原始多肽相比时含有不少于1、2、3、4或5个缺失、插入或取代的氨基酸。在另一实施方案中,此类功能变体与上文列出的一个多肽具有至少80或90%的同一性。
这些序列可用于使得能够产生缺少特定步骤的突变体菌株,例如以避免产生非期望副产物。在一个实施方案中,本发明涉及能够产生在上表中列出一个或多个特定基因的表达中有缺陷的硫肽的突变体菌株。在一个特定实施方案中,所述突变体菌株在ORF2-II或ORF3-II(分别是SEQ IDNO:58和SEQ ID NO:59)或ORF4-I(SEQ ID NO:50)编码基因的表达中有缺陷。
如本文所用,“缺陷表达”表示与野生型菌株相比时,突变体菌株不再表达对应的多肽,或如在用于定量mRNA表达的常规方法中测定,与野生型菌株稳定状态mRNA相比时,所述相应多肽具有超过50%或超过90%减少的稳定状态mRNA量。例如,基因被阻断,或部分或完全缺失,使得不再合成功能性蛋白质。
这些序列可进一步用于与编码前体蛋白的基因和编码核心酶的基因组合,以改造能够产生特异硫肽衍生物的宿主细胞。在一个实施方案中,本发明涉及含有如表2、3和4中所述重组可读框ORF1-II到ORF12-II,或具有相应野生型序列的至少80%或至少90%同一性的其功能变体,并能够产生EF-Tu抑制剂的宿主细胞。在另一实施方案中,本发明涉及含有表2、3和4中所述重组ORF1-I到ORF18-I,或与相应野生型序列具有至少80%或至少90%同一性的其功能变体,并能够产生EF-Tu抑制剂的宿主细胞。
在另一实施方案中,分离的特定酶可单独使用或在例如使用硫肽前体蛋白质作为起始材料的体外方法,例如用于产生硫肽的方法,例如用于产生E-FTu抑制剂的方法的化学反应步骤中组合作为催化剂使用。
附图简述
图1.硫肽结构基因。可能的起始位点为粗体。14个氨基酸的骨架下面为下划线。
图2.来自硫肽产生菌株I的生物合成基因簇。箭头代表假设的启动子。空心箭头代表可读框:黑色实心箭头表示系列I结构基因,灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。HindIII和EcoRI是基因簇侧翼的唯一限制性位点。
图3.来自硫肽产生菌株II(菌株Bp3714-39)的生物合成基因簇。箭头代表假设的分散的启动子。空心箭头代表可读框:黑色实心箭头表示系列II结构基因,灰色阴影箭头是系列I和系列II硫肽基因簇共有的syntenous基因。基因簇的侧翼是PstI限制性位点。
实施例
还通过特定实施例来描述本发明。然而,此类实施例的使用仅在于说明而绝不在于限制本发明或任何示例性术语的范围和意义。
1.在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因
使用PCR方法来分离编码硫肽骨架的染色体序列。从来自中国湖北省的产生硫肽的野野村氏菌菌株中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuick DNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过将摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接到片段化的DNA上来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫肽大环设计的简并引物(CFGCVCNC:5’-CARAAICCRCAIACRCARTTRCA)来扩增硫肽结构基因。在寡核苷酸中包括肌苷以降低简并性。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物,循环条件如下:95℃15分钟;94℃30秒,55℃30秒,及72℃1分钟,30个循环;以及72℃10分钟。衔接头上的3’氨基修饰阻断延伸并防止由衔接头引物进行的衔接头与衔接头的扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。
在产生硫肽的野野村氏菌属物种基因组中鉴定编码完整肽骨架的小结构基因(图1)的实验成功进行。该前体蛋白质的预测大小为57个氨基酸。然而,存在许多可能表示可选翻译起始位点的起始密码子。14个氨基酸的硫肽序列位于C末端并确定了合成方向。硫肽骨架的一级氨基酸序列以整合到吡啶环的丝氨酸开始并环绕大环以逆时针方向继续并以侧链末端的最后一个氨基酸结束。公共数据库中的同源性搜索揭示没有亲缘关系近的同系物。
2.编码硫肽前体蛋白质的基因的遗传破坏
自杀载体pSET152-Hind可在大肠杆菌中复制,赋予阿泊拉霉素抗性并携带允许从大肠杆菌向放线菌种进行属间(intergeneric)结合的转移起点(oriT)。pSET152-Hind为广谱宿主性载体pSET152的衍生载体。通过去除HindIII片段从pSET152上删除允许位点特异性整合(int)的基因。可用插入失活或缺失两种方法中的一种来破坏编码硫肽前体蛋白质的基因。第一种方法需要将不具有起始密码子或终止密码子的基因内部片段克隆至pSET152-Hind中。随后可通过细胞接合作用将该质粒导入硫肽产生菌株中。利用阿泊拉霉素选择将鉴定具有插入硫肽结构基因中的载体骨架的突变体。此类事件将抑制转录和翻译并阻止产生硫肽。第二种方法需要将突变体等位基因构建到pSET152-HindIII中并随后转移至产生菌株内。突变体等位基因将包含结构基因的上游和下游序列,但具有优选在框内缺失的可读框。可由赋予对如潮霉素或硫链丝菌肽的抗生素抗性的基因标记/取代该缺失。在结合到产生菌株中,质粒抗生素标记的选择将选择在染色体中具有野生型和突变体等位基因的菌株。在上游或下游序列中质粒和染色体之间的同源重组会导致部分二倍体。载体抗生素标记丢失的选择及后续的PCR筛选缺失或对标记突变体等位基因的抗生素选择将鉴定期望的第二次重组事件,该事件将去除野生型等位基因并保留结构基因的缺失等位基因。
或者,现今DNA合成技术的进展允许DNA大片段的合成组装,并且此类服务是可通过商业途径获得的。通过从头化学合成可重新改造硫肽基因簇,用于在替代宿主中进行异源表达和硫肽产生。此类宿主如天蓝色链霉菌(Streptomyces coelicolor)或变铅青链霉菌(Streptomyces lividans)将具有良好建立的遗传工具并肯定对硫肽具有抗性或针对硫肽提供抗性。通过在含高于硫肽最小抑制浓度的硫肽浓度的琼脂平板上按1010至1011细胞/孢子量铺板来分离抗性菌株。可通过在选择性平板上的菌落生长来鉴定在赋予抗性的群体中预先存在的稀有自发突变体。可通过将细胞暴露于化学诱变剂来提高突变率的频率。硫肽基因簇的化学合成允许引入更优调控元件、基因缺失、去除或引入限制性位点及改变密码子选择。克隆到整合穿梭载体pOJ436或游离穿梭载体pOJ446上的基因簇的功能性合成拷贝将具有引入到结构基因的限制性位点以允许产生框内缺失。
此外,通过在表达噬菌体衍生蛋白质对、或来自Rac原噬菌体的RecE/RecT或来自λ噬菌体的Redα/Redβ的大肠杆菌菌株中进行同源重组来精确地处理硫肽基因簇的克隆拷贝或合成版本。该技术称为Red/ETRecombineering或λ介导的重组(Muyrers,J.P.P.,Zhang,Y.,Stewart,A.F.ET cloning:Think recombination first.Genetic Engineering,Principlesand Methods(J.K.Setlow编著),22,77-98 Kluwer Academic/PlenumPublishers,NY.(2000))。
3.异源表达结构基因以产生可选硫肽结构
天然产生菌株或表达硫肽核心和特定生物合成基因但在前体结构基因中具有框内缺失的异源宿主是有用的工具菌株。这些工具菌株可用于产生具有可选结构的硫肽。
结构基因的位点定向诱变可用于向硫肽中取代或引入新氨基酸。通过结合或转化将在pHM11a或pSET152中克隆的结构基因的突变版本重新引入表达硫肽生物合成酶的工具菌株中。
或者,可产生编码硫肽骨架每一位置上可选氨基酸的文库。可通过基因合成或简并PCR来化学产生该变体文库。PCR方法需要硫肽结构基因的扩增以在硫肽编码骨架中掺入变异并在如pHM11a或pSET152的质粒中掺入用于克隆及表达的限制性酶切位点。PCR引物中的一条引物将是简并的,用于掺入所有氨基酸取代。可改变简并度以允许在骨架的所选位置上进行取代,即不在编码认为是不变量氨基酸上进行取代,如不在形成硫肽大环的噻唑的半胱氨酸的位置上进行取代。两条引物都将标记限制性酶切位点以允许将PCR产物直接克隆至表达载体中。将所有大肠杆菌转化体混合并分离DNA来产生变体文库。文库将转化到工具菌株中并且生物测定可用于鉴定携带支持产生具有可选结构的活性硫肽的结构基因的克隆。
4.编码硫链丝菌肽骨架多肽的基因的分离
使用PCR方法来分离编码硫链丝菌肽骨架的染色体序列。从硫链丝菌肽产生菌远青链霉菌ETH28555中纯化基因组DNA并用限制性内切酶NarI消化。通过流经QiaQuick DNA纯化柱(Qiagen)来纯化消化后的染色体DNA。通过摩尔数500倍过量的以下衔接头5’-CGACCACGACCA(5’末端上磷酸化并包括3’C6-TFA氨基修饰)和5’-AGTCTCGCAGATGATAAGGTGGTCGTGGT连接片段化DNA来产生连接衔接头的文库。通过使用衔接头引物(5’-GTCCAGTCTCGCAGATGATAAGG)和基于硫链丝菌肽大环设计的简并引物(CTTCICTC:5’-CAC GTG CAGATR CAN GTN GTR CA-3’)来从该文库中扩增硫链丝菌肽结构基因。根据CODEHOP原则设计具有5’非简并性夹板结构(consensus clamp)和3’简并核心的简并引物(Rose等CODEHOP(COnsensus-DEgenerate Hybrid Oligonucleotide Primer)PCR primer design.Nucleic Acids Res.2003年7月1日;31(13):3763-6)。使用HotStar聚合酶混合物(Qiagen)来获得特异的PCR产物,循环条件如下:95℃ 15分钟;94℃ 30秒,55℃ 30秒,及72℃ 1分钟,40个循环;以及72℃ 10分钟。衔接头上的3’氨基修饰阻断了延伸并防止由衔接头引物进行的衔接头与衔接头扩增。仅当简并寡核苷酸退火并引导产生衔接头引物互补序列的聚合酶延伸时才发生扩增。该策略在鉴定编码硫链丝菌肽大环的基因组片段中证明是成功的。随后使用基因特异引物向上游和下游步移来鉴定全长硫链丝菌肽结构基因。
5.来自硫肽产生菌株I和II的生物合成基因簇
5.1菌株I
图2描述了来自包含用于硫肽合成的生物合成基因簇的菌株I基因组DNA的一个分离的BAC(SEQ ID NO:62)中可读框的位置。
在不受任何优选模型约束的情况下,以下途径定义了各个多肽的推测功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。
系列I的合成方案:
(A)ORF9、ORF10、ORF11、ORF12、ORF13和ORF14编码很可能形成复合体的核心生物合成酶,所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。
Figure GPA00001021253400321
(B)ORF2和ORF3编码很可能参与将修饰掺入尾部的酶。丝氨酸残基的环化脱水作用产生噁唑啉环。由于尾部脯氨酸的存在,尾部额外丝氨酸脱水成脱氢丙氨酸可能需要单独步骤,该步骤很可能在肽中引起出现构象纽接。ORF18可能参与了去除末端序列而留下酰胺基。
Figure GPA00001021253400331
(C)ORF4、ORF6、ORF7、ORF16和ORF17编码很可能参与特定修饰的酶。ORF4:苯丙氨酸的羟化。ORF5:天冬酰胺的甲基化。ORF7:噻唑的甲基化。ORF16和ORF17:向噻唑添加甲氧乙基。
Figure GPA00001021253400332
5.2菌株II
图3描述了来自包含用于硫肽合成的生物合成基因簇的菌株II基因组DNA的一个分离的BAC(SEQ ID NO:63)中ORF的位置。
在不受任何优选模型约束的情况下,以下途径定义了各个多肽的推测功能,所述多肽的特征在于硫肽衍生物合成中的克隆的生物合成基因簇。
系列II的合成方案:
(A)ORF6、ORF7、ORF8、ORF9、ORF10和ORF11编码很可能形成复合体的核心生物合成酶,所述复合体通过结合前体肽进一步行使功能。当复合体沿肽移动时引入相应的修饰。通过半胱氨酸巯基与前面的羰基的环化脱水和随后噻唑啉环的氧化来引入噻唑。两个丝氨酸残基的脱水作用形成了作为产生中心吡啶杂环的aza-Diels-Alder环化加成反应的底物的脱氢丙氨酸残基。
(B)ORF12编码切割末端丙氨酸的肽酶。
Figure GPA00001021253400351
(C)ORF1、ORF2和ORF3编码了可能参与特定修饰的酶。噻唑的ORF1甲基化及ORF2和ORF3参与苯丙氨酸和异亮氨酸的羟基化。异亮氨酸羟基化两次并分解产生环氧化物。
Figure GPA00001021253400352
6.硫肽衍生物的产生
培养基组分
(a)种子培养基
Figure GPA00001021253400361
(b)生产培养基A
Figure GPA00001021253400362
Figure GPA00001021253400371
(c)痕量溶液
Figure GPA00001021253400372
将如实施例3所述宿主细胞的冰冻悬液(1.5mL)接种至含有500mL种子培养基的两升无挡板摇瓶。该摇瓶30℃下在摇床中以200转/分钟和50mm振幅温育3天。通过按每瓶40mL将第一阶段的种子接种至每个含有500mL种子培养基的8个两升无挡板摇瓶中进行第二个种子阶段。该摇瓶在30℃的摇床中以200转/分钟和50mm振幅温育2天。通过按每瓶4升将第二阶段的种子接种至每个含有100升种子培养基的2个150升规模的搅拌釜发酵罐中进行第三个种子阶段。按以下参数操作150升规模的发酵罐3天:温度=30℃、搅拌=80转/分钟、空气流动=25slpm及压力=0.5bar。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制pH值。
用200升来自第三个种子阶段的种子接种含有3500升生产培养基A的5500升规模的搅拌釜发酵罐。5500升规模的发酵罐操作参数如下:温度=30℃、空气流动=1050slpm及压力=0.5bar。搅拌控制在60转/分钟并在44小时之后增加到80转/分钟。通过控制添加基于硅油的消泡剂来阻止过量泡沫的形成。监测但不控制pH值。温育5天后收集含3500升发酵液的发酵罐。
7.硫肽衍生物的分离
通过在搅拌槽中加入乙酸乙酯过夜收集并提取发酵液。在提取过程中将混合物流经连续
Figure GPA00001021253400381
反应器(Jahnke&Kunkel,德国)用于最大剪力(sheer force)及最佳混和。在连续Westfalia分离器SA20(WestfaliaSeparator AG,Oelde,德国)上分离两相后,通过减压下的蒸发来浓缩乙酸乙酯相。蒸发过程中形成经过滤分离的沉淀。
将根据如上描述的方法从培养液的提取物中获得的沉淀溶解于比例为95∶5的二噁烷/水中并过滤去除不可溶成分。在减压及硅藻(diatome)8(
Figure GPA00001021253400382
International Sorbent Technology Ltd.,Hengoed Mid Glam,UK)存在的情况下浓缩滤液。将所获的粉末应用到在比例为90∶10∶0.5的二氯甲烷/甲醇/乙酸溶液中制备的硅胶层析柱(例如0.040-0.063mm,柱子大小为5x25cm)上。用比例为90∶10∶0.5的二氯甲烷/甲醇/乙酸溶液以35mL/分钟的流速洗脱柱子。收集30mL经HPLC分析的级分。向含化合物I的混和级分中加入20mL异丙醇并在减压条件下浓缩直至化合物从残留的异丙醇中沉淀出来。通过离心从沉淀中分离出溶剂后,在减压条件下干燥残留物,产生半纯化的硫肽衍生物。
序列表
<110>诺瓦提斯公司
 
<120>硫肽前体蛋白质、编码该蛋白质的基因及其用途
 
<130>I315
 
<160>65
 
<170>PatentIn版本3.2
 
<210>1
<211>14
<212>PRT
<213>野野村氏菌属物种(Nonomuraea Sp.)
 
<400>1
 
Ser Cys Asn Cys Val Cys Gly Phe Cys Cys Ser Cys Ser Pro
1               5                   10
<210>2
<211>14
<212>PRT
<213>野野村氏菌属物种
 
<400>2
 
Ser Ser Asn Cys Phe Cys Tyr Pro Cys Cys Ser Cys Ser Ser
1               5                   10
 
<210>3
<211>14
<212>PRT
<213>野野村氏菌属物种
 
<400>3
 
Ser Cys Asn Cys Phe Cys Tyr Ile Cys Cys Ser Cys Ser Ser
1               5                   10
 
<210>4
<211>14
<212>PRT
<213>野野村氏菌属物种
 
<400>4
 
Ser Cys Asn Cys Val Cys Gly Val Cys Cys Ser Cys Ser Pro
1               5                   10
<210>5
<211>13
<212>PRT
<213>野野村氏菌属物种
 
<400>5
 
Ser Cys Thr Thr Cys Val Cys Thr Cys Ser Cys Cys Thr
1               5                   10
 
<210>6
<211>17
<212>PRT
<213>野野村氏菌属物种
 
<400>6
 
Ile Ala Ser Ala Ser Cys Thr Thr Cys Ile Cys Thr Cys Ser Cys Ser
1               5                   10                  15
Ser
 
<210>7
<211>12
<212>PRT
<213>野野村氏菌属物种
 
<400>7
 
Ser Cys Thr Thr Cys Glu Cys Cys Cys Ser Cys Ser
1               5                   10
 
<210>8
<211>13
<212>PRT
<213>野野村氏菌属物种
 
<400>8
 
Ser Cys Thr Thr Cys Val Cys Val Cys Ser Cys Cys Thr
1               5                   10
 
<210>9
<211>13
<212>PRT
<213>野野村氏菌属物种
 
<400>9
Ser Cys Val Gly Ser Ala Cys Ala Ser Ser Ser Ser Ser
1               5                   10
<210>10
<211>12
<212>PRT
<213>野野村氏菌属物种
 
<220>
<221>misc_feature
<222>(6)..(6)
<223>Xaa可以是任意天然氨基酸
 
<220>
<221>misc_feature
<222>(8)..(8)
<223>Xaa可以是任意天然氨基酸
 
<400>10
 
Ser Cys Thr Thr Cys Xaa Cys Xaa Cys Ser Cys Ser
1               5                   10
 
<210>11
<211>15
<212>PRT
<213>野野村氏菌属物种
 
<400>11
 
Ser Cys Thr Thr Ser Ser Val Ser Ser Ser Ser Ser Ser Ser Ser
1               5                   10                  15
 
<210>12
<211>16
<212>PRT
<213>野野村氏菌属物种
 
<400>12
 
Ser Cys Thr Thr Ser Gly Cys Thr Ser Ser Ser Ser Ser Ser Ser Ser
1               5                   10                  15
 
<210>13
<211>17
<212>PRT
<213>野野村氏菌属物种
 
<400>13
 
Ser Cys Thr Thr Ser Gly Ser Ala Cys Ser Ser Ser Ser Ser Ser Ser
1               5                   10                  15
Ser
<210>14
<211>15
<212>PRT
<213>野野村氏菌属物种
 
<400>14
 
Ser Cys Val Gly Ser Ala Cys Ala Cys Ser Ser Ser Ser Ser Ser
1               5                   10                  15
 
<210>15
<211>42
<212>DNA
<213>野野村氏菌属物种
 
<400>15
tcctgcaact gcgtgtgcgg cttctgctgc tcctgcagcc cg                     42
 
<210>16
<211>42
<212>DNA
<213>野野村氏菌属物种
 
<400>16
tcgtgtaact gcttctgcta catctgctgc tcctgctcga gc                      42
 
<210>17
<211>174
<212>DNA
<213>野野村氏菌属物种
 
<400>17
atgagcgagc tggaatccaa gctgaacctt agcgacctgc ccatggacgt cttcgagatg   60
gccgacagcg gcatggaggt cgaatccctc accgcaggcc acgggatgcc cgaggtaggc   120
gcttcctgca actgcgtgtg cggcttctgc tgctcctgca gcccgtccgc gtag         174
 
<210>18
<211>150
<212>DNA
<213>野野村氏菌属物种
 
<400>18
atggacctca gcgatctgcc catggacgtc ttcgaactcg ccgatgacgg tgttgcggtc   60
gagtccctta ctgctggtca cggcatgacc gaagtgggag cttcgtgtaa ctgcttctgc   120
tacatctgct gctcctgctc gagcgcctga                                    150
<210>19
<211>57
<212>PRT
<213>野野村氏菌属物种
 
<400>19
 
Met Ser Glu Leu Glu Ser Lys Leu Asn Leu Ser Asp Leu Pro Met Asp
1               5                   10                  15
Val Phe Glu Met Ala Asp Ser Gly Met Glu Val Glu Ser Leu Thr Ala
            20                  25                  30
Gly His Gly Met Pro Glu Val Gly Ala Ser Cys Asn Cys Val Cys Gly
        35                  40                  45
Phe Cys Cys Ser Cys Ser Pro Ser Ala
    50                  55
 
<210>20
<211>49
<212>PRT
<213>野野村氏菌属物种
 
<400>20
 
Met Asp Leu Ser Asp Leu Pro Met Asp Val Phe Glu Leu Ala Asp Asp
1               5                   10                  15
Gly Val Ala Val Glu Ser Leu Thr Ala Gly His Gly Met Thr Glu Val
            20                  25                  30
Gly Ala Ser Cys Asn Cys Phe Cys Tyr Ile Cys Cys Ser Cys Ser Ser
        35                  40                  45
Ala
 
<210>21
<211>414
<212>PRT
<213>野野村氏菌属物种
 
<400>21
 
Met Pro Thr Thr Leu Pro Lys Thr Leu Arg Gly Ser Asp Gly Ala Leu
1               5                   10                  15
Ala Glu Gln Pro Leu Leu Ile Tyr Val Asn Val Pro Phe Cys Asn Ser
            20                  25                  30
Lys Cys His Phe Cys Asp Trp Val Thr Glu Val Pro Leu Ala Asp Leu
        35                  40                  45
Arg Leu Thr Pro Asp Ser Ser Pro Arg Arg Arg Tyr Val Ala Ala Leu
    50                  55                  60
Val Lys Gln Ile Glu Thr His Ala Pro Thr Leu Gly Gly Leu Gly Tyr
65                  70                  75                  80
Arg Pro Glu Val Met Tyr Trp Gly Gly Gly Thr Ala Ser Ile Leu Thr
                85                  90                  95
Ile Glu Glu Ile Glu Ala Val Ala Gly Ala Leu Ala Ala Arg Phe Asp
            100                 105                 110
Leu Gly Gly Leu Val Glu Ala Thr Ile Glu Gly Ser Pro Glu Ser Met
        115                 120                 125
Asp Pro Gly Lys Leu Lys Leu Phe Arg Ala Ile Gly Phe Asn Arg Ile
    130                 135                 140
Ser Ile Gly Val Gln Ala Phe Asp Asp Ala Arg Leu Arg Arg Ile Gly
145                 150                 155                 160
Arg Val His Ser Ala Glu Gln Ala Glu Arg Ala Val Arg Met Ala Ala
                165                 170                 175
Asp Ala Gly Phe Asp Asn Ile Asn Ile Asp Leu Ile Val Gly Phe Pro
            180                 185                 190
Gly Gln Gly Ala Asp Glu Val Ser Arg Thr Ile Gln His Ala Val Thr
        195                 200                 205
Leu Pro Val Asn His Phe Ser Val Tyr Pro Tyr Arg Pro Thr Gly Gly
    210                 215                 220
Thr Val Met Arg Arg Gln Val Gly Arg Gly Met Gly Arg Ile Asp Val
225                 230                 235                 240
Glu Glu Gln Leu Arg Ser Tyr Asp His Ala Arg Asp Leu Leu Ala Arg
                245                 250                 255
His Gly Phe Glu Glu Tyr Ala Thr Ala Tyr Phe Gly Ala Pro Arg Cys
            260                 265                 270
Glu Ser Asp Glu Val Tyr Tyr Lys Leu Thr Met Asp Trp Ile Gly Phe
        275                 280                 285
Gly Ser Gly Ala Asn Ser Leu Ile Gly Thr Arg Phe Leu Leu Asn Asp
    290                 295                 300
Arg Gly Gly Leu His Arg Phe Ser Thr Ala Pro His Arg Phe Asp Ser
305                 310                 315                 320
Asp Thr Pro Ala Ser Ala Pro His Leu Thr Arg His Phe Leu Ala Gln
                325                 330                 335
Ala Leu Thr Thr Val Asp Gly Met Asp Ala Arg Thr Phe Gln Leu Arg
            340                 345                 350
Thr Gly Arg Ser Leu Arg Ala Ala Cys Glu Glu Pro Ala Val Arg Arg
        355                 360                 365
Met Leu Glu Gln Ile Asn Arg Arg Gly Arg Leu Ile Val Asp Ser Arg
    370                 375                 380
Gly Ile Arg Leu His Arg Asp Asp Met Ala Ser Ala Tyr Ile Thr Met
385                 390                 395                 400
Asn Ser Val Asp Leu Tyr Ala Ala Thr Glu Gln Pro Gly Gly
                405                 410
 
<210>22
<211>1242
<212>DNA
<213>野野村氏菌属物种
 
<400>22
atgccgacca cactcccgaa gaccctgcgc gggtcggacg gcgcgctcgc cgagcagccg  60
ctgctcatct acgtgaatgt gccgttctgc aactcaaaat gtcacttctg cgactgggtg  120
accgaggttc cgctggcgga tctgcggctc acgccggact cgtcgccacg ccgccgctac  180
gtcgccgcgc tggtcaagca gatcgagacg cacgcgccga cgctgggcgg actcggctac  240
cggcccgagg tcatgtactg gggcggcggc acggccagca tcctcaccat cgaggagatc  300
gaggcggtgg ctggggcgct ggcggcgcgg ttcgacctcg gcggcctggt cgaggccacc  360
atcgagggca gcccggagtc catggacccc ggcaagctga agctgttccg tgcgatcggg  420
ttcaaccgga tcagcatcgg ggtgcaggcg ttcgacgacg cgcgcctgcg ccgcatcggc  480
cgggtgcaca gcgccgagca ggcggagcgc gcggtccgga tggccgccga cgccggcttc  540
gacaacatca acatcgacct catcgtcggg ttccccgggc agggcgccga cgaggtgtcg  600
cgcacgatcc agcacgcggt gacgctgccg gtcaaccact tctcggtcta cccctaccgg  660
ccgaccggcg gcaccgtgat gcgccggcag gtgggccgcg gcatgggccg gatcgacgtg  720
gaggagcagc tccggtcgta cgaccacgcc cgcgacctgc tcgcccggca cgggttcgag  780
gagtacgcca ccgcctactt cggcgctccc cgctgcgagt ccgacgaggt ctactacaag  840
ctcacgatgg actggatcgg gttcggctcc ggggccaact ccctcatcgg gacccgcttc  900
ctgctgaacg accggggcgg gctgcaccgc ttcagcacgg ccccgcaccg cttcgactcc  960
gacaccccgg cctcggcccc ccacctgaca cgccacttcc tggcccaggc gctgaccacg  1020
gtcgacggca tggacgcgcg caccttccag ctgcgcaccg gccgttcgct gcgggcggcg  1080
tgcgaggagc ccgcggtgcg ccggatgctc gaacagatca accgccgcgg caggctgatc  1140
gtcgactcac gcggcatccg gctgcaccgc gacgacatgg cctcggccta catcaccatg  1200
aacagcgtcg atctgtacgc cgcgaccgag cagcccggcg ga                     1242
 
<210>23
<211>827
<212>PRT
<213>野野村氏菌属物种
 
<400>23
Val Pro Pro Ala Gln Ala Gly Gly Thr Pro Pro Gly Val Arg Arg Gln
1               5                   10                  15
Ile Met Glu Val Gly Arg Glu Ile Val Val Arg Val Ala Gly Leu Pro
            20                  25                  30
Ala Ala Val Leu Ala Asp Leu Arg Leu Pro His Thr Ala Glu Leu Val
        35                  40                  45
Thr His Leu Ser Ala Glu Arg Arg Arg Leu Ala Ala Glu Ala Ala Ala
    50                  55                  60
Leu Ser Gly Glu Leu Phe Asp Leu Ile Gly Ala Ala Gly Ser Ala Arg
65                  70                  75                  80
Ala Ala Leu Val Gly Leu Arg Arg Ala Leu Ala Pro Gly His Arg Pro
                85                  90                  95
Pro Ser Pro Arg Leu Ile Gly Leu Cys Pro Leu Pro Ala Pro Leu Ala
            100                 105                 110
Glu Arg Val Thr Ala Trp Val Arg Ala Arg Tyr Asp Trp Glu Asp Arg
        115                 120                 125
Arg Arg Asp Leu Ala Gly Thr Leu Asp Lys Glu Arg Ala Asp Ala Leu
    130                 135                 140
Asp Arg Val Arg Ala Ala Cys Val Ala Pro Ala Phe Arg Arg Gly Leu
145                 150                 155                 160
Ala Leu Ser Gly Gly Glu Leu Thr Ser Thr Leu Glu Arg Trp Leu Ala
                165                 170                 175
Asp Pro Gly Arg Ala Pro Arg Gln Gly Lys Val Leu Arg Leu Val Lys
            180                 185                 190
Tyr Leu Thr Arg Ala Ala Ala Lys Thr Ser Pro Tyr Gly Ser Phe Met
        195                 200                 205
Val Ser Ala Leu Ala Gly Arg Pro Gly Asp Asp Pro Pro Ile Pro Glu
    210                 215                 220
Leu Leu Thr Val Ala Glu Pro Pro Gly Ala Phe Leu Asp Ala Val Gly
225                 230                 235                 240
Asp Ala Leu Leu Ala Asp Pro Ala Leu Ala Gly Gln Val Pro Leu Arg
                245                 250                 255
Pro Asn Pro Ser Leu Thr Trp Thr Ala Gln Gly Leu Leu Phe Val Arg
            260                 265                 270
Thr Val Arg Ala Ala Ala Gly Glu Gln Ala Gly Pro Lys Glu Glu Ile
        275                 280                 285
Ala Thr Ala Gly Arg Ala Ala Ala Leu Glu Leu Cys Leu Arg His Ala
    290                 295                 300
Glu Ser Arg Pro Thr Ala Pro Gln Leu Ala Glu Leu Leu Ala Glu Ala
305                 310                 315                 320
Gly Ala Asp Pro Gly Glu Ala Ala Ala Phe Val Asp Arg Leu Val Ala
                325                 330                 335
Ala Gln Leu Leu Leu Pro Cys Pro Pro Val His Asp Asp Asp Pro Asp
            340                 345                 350
Pro Phe Gly Ala Trp Ala Arg Gln Val Cys Ala Pro Glu Leu Arg Glu
        355                 360                 365
Leu Ala Ala Ala Ser Arg Pro Val Ala Ala Ala Val Asp Ser Pro Gly
    370                 375                 380
Gln Arg Arg Ala Arg Ile Ala Glu Ala Ala Ala Ala Val Ala Asp Arg
385                 390                 395                 400
Leu Gly Ile Asp Pro Pro Ala Asp Pro Ala His Glu His Asp Val Ser
                405                 410                 415
Thr Gly Arg Pro Ala Pro Pro Pro Leu Pro Ala Gly Val Leu Ala Asp
            420                 425                 430
Leu Asp Ala Val Arg Arg Trp Leu Ala Val Phe Asp Trp Lys Val Pro
        435                 440                 445
Val Arg Val Gly Val Gly Ala Phe Cys Arg Glu Arg Phe Gly Ser Gly
    450                 455                 460
Ser Arg Thr Pro Phe Leu Glu Ala Cys Arg Ala Ala Thr Ala Ala Leu
465                 470                 475                 480
Pro His Leu Phe Gly Pro Ala Ala Met Pro Trp Phe Leu Asp Leu Thr
                485                 490                 495
Gly Asp Gly Arg Leu Arg Glu Leu Asp Arg Leu Arg Thr Arg Ala Arg
            500                 505                 510
Asp Leu Ala Arg Ser Gly Val Leu Asp Arg Arg Arg Val Leu Ala Asp
        515                 520                 525
Thr Ala Asp Trp Pro Ala Trp Leu Thr Trp Pro Ala Ser Thr Gly Phe
    530                 535                 540
Tyr Leu Gln Thr Leu Pro Gly Gly Val Val Leu Asn Ala Val His Ala
545                 550                 555                 560
Gly His Gly Arg Ala Ala Gly Arg Val His His Leu Leu Ala Arg Ala
                565                 570                 575
Gly Ala Ala Pro Pro Arg Pro Pro Arg Ser Gly Leu Pro Arg Ala Glu
            580                 585                 590
Phe Gly Gly Arg Phe Gly Ser Ala Leu Asn Thr Arg Thr Pro Ser Thr
        595                 600                 605
Arg Tyr Glu Ile Asp His Pro Gly Ala Thr Ser Gly Arg Asp Pro Arg
    610                 615                 620
His Arg Val Pro Leu Gly Thr Leu Met Val Val His Asp Pro Asp Thr
625                 630                 635                 640
Asp Leu Val His Leu His Ser Asp Arg Leu Gly Arg Val Glu Pro Val
                645                 650                 655
His Leu Gly Met Met Gly Glu Leu Gly Leu Pro Ala Val Ala Gly Phe
            660                 665                 670
Leu Glu Arg Ala Phe Ala Pro Thr Tyr Leu Phe His Pro Ser Val Pro
        675                 680                 685
Pro Phe Ile Ser Leu Arg Asp Leu Ala Gly Ala Ser Ser Ala Arg Arg
    690                 695                 700
Phe Pro Arg Val Ser Val Gly Asp Val Val Val Gln Arg Ala Arg Trp
705                 710                 715                 720
Thr Val Pro Ala Gly Leu Val Pro Ala Arg Thr Gly Ala Asp Gly Asp
                725                 730                 735
His Leu Leu Ala Leu Ala Glu Trp Arg Arg Glu His Gly Ile Pro Glu
            740                 745                 750
Arg Cys Phe Val Arg Gly Trp Lys Pro Gly Ala Ala Leu Gly Lys Ala
        755                 760                 765
Arg Lys Pro Leu Tyr Val Asp Phe Ala Ser Trp His Leu Val Ala Leu
    770                 775                 780
Phe Glu Arg Glu Ala Arg Thr Asn Ala Ala Leu Val Ile Asp Glu Ala
785                 790                 795                 800
Leu Pro Asp Pro Leu Ala Asp Gly Ala Pro Ala His Val Thr Glu Tyr
                805                 810                 815
His Val Glu Ile Gly Asp Arg Glu Arg Glu Gln
            820                 825
 
<210>24
<211>299
<212>PRT
<213>野野村氏菌属物种
 
<400>24
 
Met Thr Glu Arg Pro Gly Trp Phe Ala Ala His Val His Tyr Arg Gly
1               5                   10                  15
Asp Leu Asp Ala Leu Leu Arg Glu Ala Val Ala Pro Leu Val Arg Ala
            20                  25                  30
Leu Ala Ala Asp Phe Phe Phe Leu Arg Tyr Trp Asp Gly Gly Ser His
        35                  40                  45
Leu Arg Leu Arg Leu Arg Gly Gly Asp Gln Val Ala Val Ala Arg His
    50                  55                  60
Leu Asp Ala Tyr Leu Ala Ala His Pro Ala Pro Glu Thr Thr Ser Gln
65                  70                  75                  80
Glu Glu Tyr Ala Arg Val Ala Pro Val Leu Ala Ala Arg Glu Gly Met
                85                  90                  95
Thr Gly His Leu Thr Thr Leu Arg Pro Asn Asn Thr Val Glu Phe Ala
            100                 105                 110
Ala Tyr Arg Pro Glu Thr Ala Lys Tyr Gly Thr Gly Asp Ala Leu Arg
        115                 120                 125
Ala Val Glu Arg His Phe Val Glu Ser Ser Arg Tyr Ala Leu Asp Val
    130                 135                 140
Leu Asp Arg Arg Pro Thr Gly Asn Gln Arg Glu Leu Ala Val Leu Gly
145                 150                 155                 160
Val Leu Leu Leu Ala Trp Tyr Ala Ala Arg Pro Leu Asp Glu Pro Pro
                165                 170                 175
Gly Glu Pro Val Asp Asp Glu Leu Ile Gly Ala Val Glu Ala Leu Cys
            180                 185                 190
Arg Gly Trp Arg Gly Gly Arg Asp Leu Pro Glu Glu Leu Val Ala Glu
        195                 200                 205
Glu Tyr Gly Arg Val Arg Glu Arg Val Ala Gly Leu Ala Gly Ala Leu
    210                 215                 220
Arg Asp Leu Val Pro Asp Pro Asp Ala Pro Gly Ser Ser Met Arg Ala
225                 230                 235                 240
Trp Ala Ala Thr Phe Asp Arg Leu Ala Ala Ala Leu Pro Pro Pro Asp
                245                 250                 255
Arg Leu Arg Val Leu Asp Thr Cys Ala His Leu Ala Ala Asn Arg Leu
            260                 265                 270
Gly Val Ser Met Ala Ala Glu Val Arg Leu Arg Leu Leu Ala Ala Arg
        275                 280                 285
Ala Leu Arg Glu Val Ala Pro Val Gly Arg Arg
    290                 295
 
<210>25
<211>333
<212>PRT
<213>野野村氏菌属物种
 
<400>25
 
Met Ser Trp Arg Arg Val Asp Val Ala Tyr His Asp Pro Asp Leu Asp
1               5                   10                  15
Gly Leu Ile Leu Ala Thr Arg Pro Leu Leu Ala Gly Thr Pro Gly Arg
            20                  25                  30
Gly Trp Phe Gln Arg His Trp Val Arg Gly Pro His Leu Glu Leu Trp
        35                  40                  45
Phe Asp Ala Ala Gln Pro Ser Trp Glu Arg Ile Arg Asp Val Leu Glu
    50                  55                  60
Pro Trp Leu Arg Val Asn Pro Ser Arg Ala Arg Ile Asp Arg Asp Arg
65                  70                  75                  80
Leu Leu Ala Gln His Arg His Leu Ala Ala Ala Glu Arg Ile Asp Glu
                85                  90                  95
Pro Leu Leu Pro Phe Tyr Ala Asp Asn Thr Leu His Arg Ala Ala Pro
            100                 105                 110
Arg Ser Arg Ala His Val Leu Gly Gly Pro Ala Ala Glu Glu Leu Phe
        115                 120                 125
His Asp Phe His Thr Thr Ala Ser Ala Val Ala Tyr Asp Glu Leu Asp
    130                 135                 140
Ala Val Arg Ala Gly Glu Ser Arg Leu Val Met Ala Leu Asp Leu Met
145                 150                 155                 160
Val Ala Ala Ala His Ala His Ala Glu Gly Gly Val Arg Gly Gly Phe
                165                 170                 175
Val Ser Phe Arg Ser His Ala Glu Ala Phe Leu Ala Ser Ala Pro Gly
            180                 185                 190
Leu Arg Glu Arg Trp Asp Ala Glu Tyr Ala Ala Arg Ala Gly Ala Leu
        195                 200                 205
Arg Ala Arg Ile Thr Ala Val Val Ala Gly Ile Pro Arg Gly Arg Ala
    210                 215                 220
Trp Ala Gly Leu Leu Asp Arg Phe Ala Asp Arg Gly Asp Glu Leu Ile
225                 230                 235                 240
Ala Ser Gly Ala Leu Leu Val Glu Pro Ala Gly Pro Asp Ala Val Ala
                245                 250                 255
Arg Pro Asp Thr Ala Phe His Arg Ala Leu Arg Gly Asn Arg Thr Trp
            260                 265                 270
His Glu Glu Val Leu Arg Ser Ala Pro Phe Arg Arg Tyr Arg Leu Leu
        275                 280                 285
Leu Asn Leu Thr Tyr Leu Gln Leu Ser Arg Leu Gly Val Asn Ala Val
    290                 295                 300
Gln Arg Ala Leu Leu Cys His Phe Ala Ala Ser Ala Val Glu Gln Glu
305                 310                 315                 320
Tyr Gly Val Ser Ala Ile Glu Ile Ala Met Gly Gly Ala
                325                 330
 
<210>26
<211>455
<212>PRT
<213>野野村氏菌属物种
 
<400>26
 
Val Met Ser Val Gln Val Glu Pro Ala Val Thr His Arg Trp Ala Leu
1               5                   10                  15
Arg Pro Gly Val Tyr Arg Ala Thr Ala Pro Gly Gly Asp Leu Met Leu
            20                  25                  30
Ala Ala Trp Pro His Ala Thr Pro Leu Gly Arg Ala Thr Pro Glu Leu
        35                  40                  45
Leu Ala Leu Leu Asp Gly Leu Ala Ala Gly Ser Leu Pro Leu Asp Glu
    50                  55                  60
Pro Gly Asp Leu Ala Pro Ala Val Glu Leu Leu Arg Ala Gly Gly Trp
65                  70                  75                  80
Leu Arg Lys Thr Val Ala Tyr Ala Gly Arg Asp Leu Tyr Thr Ile Thr
                85                  90                  95
Pro Val Ala Ala Pro Thr Asp Ala Pro Pro Pro Pro Arg Asp Glu Pro
            100                 105                 110
Ala Leu Ser Arg Phe Ala Leu Leu Arg Asn Thr Ala Asp Gly Leu Val
        115                 120                 125
Leu Glu Met Pro Gly Ser Trp Cys Asp Val His Val His Asp Pro Ala
    130                 135                 140
Val Ala Ala Leu Leu Ala Asp Pro Ser Gly Asp Gly Gly Leu Pro Ala
145                 150                 155                 160
Glu Ala Ala Ala Ala Leu Arg Ala Asp Leu Ala Ala Ala Gly Met Leu
                165                 170                 175
Met Glu Arg Glu Glu Pro Phe Glu Arg Arg Gln Trp Ser Thr His Glu
            180                 185                 190
Leu Trp Phe His Glu Arg Ser Arg Leu Gly Asn Arg Gly Trp Phe Gly
        195                 200                 205
Ala His Phe Gly Gly Thr Phe Trp Ala Arg Gly Arg His Asp Pro Pro
    210                 215                 220
Pro Ala Arg Pro Ser Pro Tyr Pro Gly Pro Ala Val Glu Leu Ala Arg
225                 230                 235                 240
Pro Asp Leu Ala Ala Leu Arg Arg Thr Asp Pro Thr Leu Thr Ala Val
                245                 250                 255
Leu Glu Asp Arg Glu Ser Val Arg Asp His Asp Asp Asp Asp Pro Ile
            260                 265                 270
Ser Ala Glu Gln Leu Gly Glu Leu Leu Tyr Arg Cys Ala Arg Val Arg
        275                 280                 285
Leu Leu Arg His Leu Glu Gly Phe Glu Tyr Ala Gly Lys Pro Tyr Pro
    290                 295                 300
Ala Gly Gly Ser Ala Tyr Glu Leu Glu Val Tyr Pro Val Val Arg Leu
305                 310                 315                 320
Ala Arg Gly Leu Asp Pro Gly Met Tyr His Tyr Asp Ala His Asp His
                325                 330                 335
Arg Leu Arg Gln Val Arg Pro Ala Gly His Pro Ala Val Arg Arg Met
            340                 345                 350
Leu Lys Val Ala Thr Glu Ser Ser Val Ala Lys Ala Pro Pro Gln Val
        355                 360                 365
Leu Leu Val Ile Ser Ala Arg Val Gly Arg Ile Leu Trp Lys Tyr Glu
    370                 375                 380
Ala Met Gly Tyr Ala Leu Met Leu Lys His Val Gly Val Leu Gln Gln
385                 390                 395                 400
Thr Leu Tyr Ala Val Ala Thr Ala Met Asp Leu Ala Pro Cys Ala Leu
                405                 410                 415
Gly Ser Gly Asp Asp Leu Ala Phe Thr Ala Ala Thr Gly Arg Asp Arg
            420                 425                 430
Leu Val Glu Cys Ala Val Gly Glu Phe Met Val Gly Ser Arg Arg Lys
        435                 440                 445
Glu Pro Ala Ala Trp Glu Leu
    450                 455
 
<210>27
<211>608
<212>PRT
<213>野野村氏菌属物种
 
<400>27
Met Gly Ala Leu Asn Leu Leu Leu Arg Pro Asp Ala His Tyr Ala Glu
1               5                   10                  15
Val Asp Gly Gly Val Tyr Val Leu Ser His Gln Gly Glu Thr Phe Ile
            20                  25                  30
Ser Gly Thr Ser Val His Arg Trp Leu Asp Arg Leu Ala Pro Leu Leu
        35                  40                  45
Asp Gly Thr Arg Thr Leu Asp Gln Leu Thr Ala Gly Leu Pro Ala Asp
    50                  55                  60
Arg Ala Gly Phe Val Ala Arg Leu Val Gly Thr Leu Thr Glu Arg Gly
65                  70                  75                  80
Leu Val Arg Glu Val Gly Pro Ala Val Ser Asp Thr Leu Thr Asp Ala
                85                  90                  95
Glu Arg Gly Glu His Arg Ala Leu Leu Ala Tyr Leu Gly Tyr Phe His
            100                 105                 110
Asp Ser Pro Gly Arg Val Leu Glu Asp Val Arg Asp Thr Pro Thr Ala
        115                 120                 125
Ile Val Gly Ser Gly Pro Leu Ala Ala Ala Val Val Arg Ala Cys Ala
    130                 135                 140
Ala Ala Gly Leu Arg Arg Val Glu Ile Gly Glu Glu Ala Gly Ala Ala
145                 150                 155                 160
Arg Val Val Val His Val Ala Glu Arg Ala Glu Pro Glu Arg Ala Ala
                165                 170                 175
Arg Leu Glu Arg Arg Cys Ala Ala Glu Gly Val Leu Leu Ala Gln Val
            180                 185                 190
Met Pro Gly Pro Asp Gly Ile Trp Trp Gln Pro Ala Ala Arg Gly Gly
        195                 200                 205
Cys Trp Ala Ser Ala Trp Arg Arg His Arg Ala Leu Ala Gly Val Asp
    210                 215                 220
Arg Thr Gly Thr Pro Leu Asp Pro Val Ala Val Ala Val Val Ala Gly
225                 230                 235                 240
Gln Val Ala His Asp Val Phe Arg Val Leu Ala Gly Leu Arg Glu Glu
                245                 250                 255
Ala Pro Pro Arg Leu Val Val Leu Asp Pro Arg Thr Leu Ala Ser Thr
            260                 265                 270
Ala His Pro Val Val Ala His Pro Phe Glu Leu Pro Ala Ala Pro Leu
        275                 280                 285
Asp Glu Ala Ala Phe Leu Asp Arg Val Ala Ala Leu Arg Ala Ala Pro
    290                 295                 300
Ala Leu Ser Glu Ala Glu Phe Ser Arg Arg Ala Lys Gly Leu Met Asp
305                 310                 315                 320
Ser Thr Val Gly Leu Phe Ala Glu Ile Asp Glu Gly Asp Leu Ala Gln
                325                 330                 335
Leu Pro Leu His Val Thr Ala Thr Thr Val Ala Asp Pro Cys Gly Leu
            340                 345                 350
Ile Gly Ser Ala Pro Arg Pro Val Val Thr Gly Ala Gly Leu Thr Phe
        355                 360                 365
Glu Glu Ala Arg Tyr Arg Ala Ala Arg Ala Ala Leu Ala Leu Ala Gly
    370                 375                 380
Thr Leu Ala Leu Asp Arg Arg Arg Leu Val Asp Gly Arg Val Trp Ala
385                 390                 395                 400
Tyr Asp Leu Ala Asp Gly Ala Ala Arg Leu Val Pro Ala Asp Glu Val
                405                 410                 415
Phe Ala Ser Thr Ala Gly Gly Ser Thr Ala Gly Val Pro Leu Gly Ala
            420                 425                 430
Ala Ala Ala Tyr Ser Trp Ala Glu Ala Val Ala Glu Gly Leu Val Ala
        435                 440                 445
Gln Ala Ala Ala Leu Thr Leu Ala Gly Ala Gly His Ala Gly Glu Pro
    450                 455                 460
Tyr Gly Arg Ala Asp Leu Ala Gly Ala Pro Ala Tyr Leu Leu Ala Met
465                 470                 475                 480
Val Arg Ala Leu Gly Glu Glu Leu Thr Val His Asp Val Thr Gly Pro
                485                 490                 495
Leu Gly Val Pro Val Val Val Gly Thr Leu Ser Gly Gly Ala Thr Ala
            500                 505                 510
Cys Gly Ala Gly Met Thr Thr Asp Ala Ala Val Thr Ala Cys Leu Arg
        515                 520                 525
Asp Leu Leu Leu Leu Arg Gln Ala Glu Ile Asn Asp Gln Pro Val Tyr
    530                 535                 540
Ala Pro Pro Ser Gly Arg Pro Leu Pro Gly His Leu Arg Gly Asn His
545                 550                 555                 560
Pro Ala Pro Ala Val Pro Gly Thr Asp Ala Asp Arg Leu Ala Ala Arg
                565                 570                 575
Leu Ala Glu Arg Gly His Arg Pro Leu Ala Val Pro Leu Asp His Asp
            580                 585                 590
Gln Ala Val His Ala Val Leu Pro Phe Ala Val Arg Val Val Cys Arg
        595                 600                 605
 
<210>28
<211>578
<212>PRT
<213>野野村氏菌属物种
 
<400>28
 
Met Ile Arg Leu Pro Asp His Gly Glu Leu Ala Val Pro Ile Gly Asp
1               5                   10                  15
Gly Pro Met Leu Pro Leu Arg Thr Glu Leu Gly Arg Val Val Ile Gly
            20                  25                  30
Pro Leu Glu Arg Pro Gly Val Pro Gly Cys Arg Ala Cys Val Arg Ile
        35                  40                  45
Arg Ala Ala Arg Val Gln Pro Asp Ala Arg Lys Ala Glu Ala Val Arg
    50                  55                  60
Ala Arg His Ala Pro Ala Pro Ser Gln Trp Leu Thr Pro Leu Ala Thr
65                  70                  75                  80
Asp Leu Val Arg Val Leu Val Ala Ser Glu Ser Ala Ala Leu Ala Ala
                85                  90                  95
Asp Thr Asp Pro Arg Thr Ala Gly Ala Val Leu Glu Ile Asp Leu Ala
            100                 105                 110
Thr Leu Glu Ile Thr Arg His Arg Phe Leu Pro Asp Pro Leu Cys Pro
        115                 120                 125
His Cys Gly Gly Leu Pro Pro Asp Gly Pro Ala Glu Leu Thr Leu Arg
    130                 135                 140
Pro Arg Arg Lys Leu Gly Gly Ser Pro Arg Thr Arg Pro Val Glu Leu
145                 150                 155                 160
Asn Ala Leu Leu Glu Thr Tyr Val Asp Gly Arg Val Gly Met Ile Arg
                165                 170                 175
Pro Leu Lys Ser Gly Val Gln Gly Gly Leu Thr Val Ala Ser Ala Met
            180                 185                 190
Leu Pro Ile Arg Ala Gly His Gly Leu Glu Pro Gly Val Gly Arg Thr
        195                 200                 205
Arg Ser Tyr Thr Ala Ser Arg Leu Val Ala Val Leu Glu Ala Leu Glu
    210                 215                 220
Arg Tyr Gly Gly Val Ser Pro Gly Gly Arg Arg Thr Ser Val Thr Ala
225                 230                 235                 240
Ala Tyr Arg Asp Ile Ser Gly His Ala Val His Pro Asp Thr Phe Gly
                245                 250                 255
Thr His Pro Glu Glu Asn Tyr Asp Arg Pro Gly Phe Ala Phe Arg Arg
            260                 265                 270
Phe Thr Glu Asp Thr Val Cys Arg Trp Val Trp Gly Tyr Ser Phe Ala
        275                 280                 285
Lys Ala Gln Pro Val Leu Val Pro Glu Asn Gln Val Tyr Tyr Tyr Ala
    290                 295                 300
Arg Asn Leu Pro Asp Gly Glu Gln Pro Phe Val Phe Glu Val Ser Asn
305                 310                 315                 320
Gly Cys Ala Leu Gly Ser Cys Leu Glu Glu Ala Ile Leu His Gly Leu
                325                 330                 335
Leu Glu Val Val Glu Arg Asp Ala Phe Leu Leu Thr Trp His Ala Arg
            340                 345                 350
Arg Glu Val Pro Val Leu Asn Pro Ala Leu Ala Ser Asp Pro Val Leu
        355                 360                 365
Pro Met Gln Ala Ala Ala Ile Thr Ala Glu Thr Gly His Arg Val Leu
    370                 375                 380
Cys Phe Asp Thr Thr Ala Glu His Gly Ile Pro Ser Val Trp Ala Met
385                 390                 395                 400
Ala Val Asp Val Glu His Arg Ser Asp Arg Pro Ala Thr Ala His Ala
                405                 410                 415
Ala Gly Ala Ala Leu Thr Leu Glu Gln Ala Ala Met Asn Ala Leu Ser
            420                 425                 430
Glu Leu Gly Pro Leu Leu Ala Asp Val Ile Arg Arg Tyr Pro Glu Glu
        435                 440                 445
Arg Glu Arg Ala Glu Ala Met Val Arg Asp Pro Glu Gln Val Ala Thr
    450                 455                 460
Met His Asp His Ser Leu Leu Tyr Ala Val Pro Ala Ala Ala Glu Arg
465                 470                 475                 480
Leu Ser Phe Leu Thr Gly Arg Ala Asp Gly Pro Arg Thr Gly Phe Gly
                485                 490                 495
Ser Ala Arg Phe Thr Gly Asp Asp Leu Thr Ala Asp Leu Arg Ala Met
            500                 505                 510
Ile Asp Ala Val Ile Asp Ala Gly Met Asp Val Val Val Val Asp Gln
        515                 520                 525
Thr Thr Pro Glu His Leu Ala Gly Gly Phe Arg Cys Val Lys Val Leu
    530                 535                 540
Val Pro Gly Ala Leu Pro Met Thr Phe Gly His Gln Tyr Arg Arg Leu
545                 550                 555                 560
Asp Asn Leu Pro Arg Leu Ala Ala Ala Arg Thr Thr Asp Pro His Pro
               565                 570                 575
Phe Pro
 
<210>29
<211>857
<212>PRT
<213>野野村氏菌属物种
 
<400>29
 
Met Ala Val Ile Glu Arg Glu Glu Ser Asp Gly Pro Pro Val Ala Val
1               5                   10                  15
Arg Thr Cys Gly Val Ala Ala Ala Glu Leu Glu Ser Leu Arg Trp Asp
            20                  25                  30
Glu Ser Tyr Ala Leu Val Thr Arg Leu Leu Ala Glu Thr Ala Arg Val
        35                  40                  45
Ala Ala Asp Gly Arg Arg Leu Ala Val Ala Leu Gly Asp Val Ile Gly
    50                  55                  60
Gly Leu Gly Pro Ser Gly Ser Arg Pro Val Leu Val Gly Leu Arg Arg
65                  70                  75                  80
Ala Leu His Thr Gly Arg Leu Pro Ser Gly Arg Glu Trp Gly Pro Glu
                85                  90                  95
Ala Gly Ala Ala Leu Pro Tyr Gly Leu Arg Gly Glu Val Glu Glu Trp
            100                 105                 110
Val Arg Arg Ala Arg Glu Cys Ala Gly Leu Arg Ala Arg Leu Pro Glu
        115                 120                 125
Val Val Ala Arg Glu Ser Leu Glu Lys Glu Glu Arg Leu Arg Ala Ala
    130                 135                 140
Ala Ala Asp Pro Ala Phe Arg Arg Gly Leu Ala Leu Ala Gly Gly Glu
145                 150                 155                 160
Leu Ala Val Asp Leu Glu Thr Trp Leu Ala Asp Pro Ala Arg Arg Pro
                165                 170                 175
Lys Pro Gln Lys Leu Leu Arg Leu Ala Lys Tyr Leu Val Arg Ala Ala  
            180                 185                 190
Val Lys Thr Ser Pro Tyr Ser Thr Phe Thr Ser Thr Gly Arg Ala Val
        195                 200                 205
Trp Gly Gly Gly Glu Arg His Val Glu Arg Val Val Pro Val Leu Glu
    210                 215                 220
Leu Asp Gly Val Gln Thr Phe Ser Asp Asp Arg Val  Arg Val Asn Pro
225                 230                 235                 240
Ser Val Thr Val Ala Gly Gly Thr Ala Glu Phe Ile Gly Pro Pro Pro
                245                 250                 255
Gly Glu Ala Leu Val Ser Ile Gly Val Thr Glu Ala Val Ala Ala Cys
            260                 265                 270
Leu Arg Val Ala Glu Gly Gly Glu Trp Val Pro Arg Gly Arg Phe Ala
        275                 280                 285
Glu Ala Leu Gly Ala Glu Pro Ala Ala Val Thr Lys Phe Leu Asp Lys
    290                 295                 300
Leu Leu Ala Val Gly Leu Leu Glu Ala Arg Pro Asp Gly Asp Pro Pro
305                 310                 315                 320
Pro His Leu Leu Asp Gly Ile Arg Arg Thr Glu Arg Ala Thr Asp Pro
               325                 330                 335
Ser Thr Phe Arg His Glu Leu Gly Arg LeuIle Ala Ala Ala Arg Ala
            340                 345                 350
Ala Ala Arg Ala Thr Ala Pro Gly Ala Asp Thr Ala Lys Asn Ala Ala
        355                 360                 365
Pro Ala Gly Arg Ala Thr Arg Gly Asp Gly Gly Ala Asp Ala Glu Arg
    370                 375                 380
Ala Thr Arg Gly Asp Ser Asp Ala Asp Asp Gly Arg Ala Thr Arg Gly
385                 390                 395                 400
Asp Gly Gly Ala Asp Asp Arg Gly Ala Ala Arg Gly Asp Gly Gly Val
               405                 410                 415
Gly Arg Ala Val Val His Glu Val Ala Val Cys Val Glu Pro Val Ala
            420                 425                 430
Arg Leu Asp Pro Ala Arg Trp Arg Gly Gly Leu Ala Asp Leu Asp Val
        435                 440                 445
Val Arg Arg Trp Leu Ala Val Phe Asp Ala Lys His Pro Met Arg Leu
    450                 455                 460
Ala Val Ala Ala Tyr Leu Thr Thr Arg Tyr Gly Pro Asp Pro Ala Val
465                 470                 475                 480
Pro Phe Leu Thr Leu His Arg His Ile Gln Arg Glu Leu Ala Gly Thr
                485                 490                 495
Gly Ala Ala Gly Arg Glu Leu Arg Ala Phe Leu Gly Ser Ser Ala Ala
            500                 505                 510
Trp Thr Gln Pro Leu Gly Thr Ser Ala Leu Pro Arg Ile Arg Glu Leu
        515                 520                 525
Glu Arg Leu Arg Ala Glu Ala Arg Ser Leu Ala Leu Asp Ala Glu Asp
    530                 535                 540
Pro Asp Gly Thr Cys Arg Val Thr Pro Gly Gln Leu Ala Ala Gln Leu
545                 550                 555                 560
Glu Ser Trp Pro Ser Trp Ile Ala Ile Pro Ala Ser Ser Ala Cys Tyr
                565                 570                 575
Val Gln Ala Val Ala Gly Thr Leu Val Leu Asn Val Val His Gly Gly
            580                 585                 590
His Gly Arg Ala Leu Arg Arg Leu Asp His Leu Leu Glu Arg Ala Gly
        595                 600                 605
Gly His Pro Glu Pro Pro Arg Ile Glu Asp Pro Asp Gly Ala Val Tyr
    610                 615                 620
Ala Glu Phe Ser Gly Asp Leu Gly Ser Thr Leu Asn Ala Arg Pro Pro
625                 630                 635                 640
Ser Thr Arg Tyr Glu Ile Asp Tyr Pro His Ser Pro Gly Thr Arg Pro
                645                 650                 655
Pro Asp Leu Arg Leu Pro Leu Thr Asp Leu His Val Thr Leu Cys Pro
            660                 665                 670
Asp Ser Gly Leu Pro Glu Leu Arg Ser Lys Arg Leu Gly Arg Arg Val
        675                 680                 685
Val Pro Leu His Leu Gly Leu Ala Ala Glu Phe Arg Leu Pro Pro Ala
    690                 695                 700
Ala Arg Phe Ile Glu Arg Val Phe Gly Pro Gly Tyr Leu Leu His Pro
705                 710                 715                 720
Ser Ser Pro Pro Leu Val Arg Met Gly Arg Val Pro Ser Glu Val Thr
               725                 730                 735
Arg Tyr Pro Arg Val Glu Ala Gly Arg Val Val Val Gln Arg Arg Arg
            740                 745                 750
Trp Leu Ala Pro Ala Ala Thr Leu Pro Val Arg Ala Lys Gly Glu Gly
        755                 760                 765
Asp Ala Ala Tyr Leu Thr Arg Leu Ile Ala Trp Ala Asp Glu Tyr Gly
    770                 775                 780
Val Pro His Arg Ser Phe Val Arg Ala Trp Pro Glu Gln Thr Gly Asp
785                 790                 795                 800
Lys Gly Gln Asp Lys Ala Arg Lys Pro Leu Phe Leu Asp Leu Ala Asn
                805                 810                 815
Leu Phe Leu Val Lys Asn Phe Glu Arg Gln Ile Arg Gly Cys Ala Phe
            820                 825                 830
Ala Leu Phe Glu Glu Ala Leu Pro Asp Pro Gly Pro Glu Arg Val Thr
        835                 840                 845
Glu Tyr Leu Ile Glu Val Gly Gly Arg
    850                 855
 
<210>30
<211>271
<212>PRT
<213>野野村氏菌属物种
 
<400>30
 
Met Ser Trp Val Ser Val His Val Phe Ser Gln Gly Pro Leu Asp Asp
1               5                   10                  15
Met Ile Thr Gly Leu Ala Gly Pro Leu Leu Gly Asp Asp Gly Phe Phe
            20                  25                  30
Leu Arg Tyr Trp Glu Gly Gly Pro Hi s Leu Arg Ile Arg Val Arg Ser
        35                  40                  45
His Pro Ala Glu Gln Val Val Glu Arg Ala Glu Ala Tyr Leu Arg Glu
    50                  55                  60
His Pro Ser Glu Ala Val Ile Asp Pro Glu Glu Tyr Ala Arg Leu Ala
65                  70                  75                  80
Ala Thr Leu Ala Ala Arg Glu Gly Val Pro Gly Tyr Thr Arg Arg Leu
                85                  90                  95
Tyr Pro Asn Asp Ser Ala His Leu Ile Pro Tyr Gln Pro Glu His Asp
            100                 105                 110
Arg Tyr Gly Thr Gly Arg Ser Leu Asp Ala Val Glu Arg His Phe His
        115                 120                 125
Asp Ser Ser Val Ile Ala Leu Gln Leu Ile Gly Ala Gly Leu Gly His
    130                 135                 140
Glu Arg Arg Ser Met Ala Trp Leu Thr Met Leu Leu Val Ala Trp Gln
145                 150                 155                 160
Val Ala Gly Glu Gly Arg Ala Phe Gly Pro Pro Ala Asp Ala Gly Val
                165                 170                 175
Gln Val Pro His Glu Arg Met Ala Ala Leu Val Glu His Ala Arg Ala
            180                 185                 190
Val Thr Gln Glu Pro Ala Pro Ser Glu Pro Arg Gly Val Val Ala Ala
        195                 200                 205
Trp Tyr Ala Ser Ile Ala Arg Leu Val Glu Glu Leu Ala Ala Ala Gly
    210                 215                 220
Phe Asp Ala Ala Arg Thr Gly Ala Thr Val Asp Leu Ala Ala His Leu
225                 230                 235                 240
Leu Ala Asn Arg Leu Gly Ile Arg Val Gln Glu Glu Ala Arg Leu Arg
                245                 250                 255
His Leu Ala Ser Gly Ala Thr Arg Glu Ser Glu Val Gly Val Gly
            260                 265                 270
 
<210>31
<211>319
<212>PRT
<213>野野村氏菌属物种
<400>31
 
Met Thr Trp Thr Arg Leu Arg Val Asp Tyr His Asp Gly Pro Met Asp
1               5                   10                  15
Asp Leu Ile Leu Asp Ala Leu Arg Pro Ala Trp His Glu Ile Arg Gly
            20                  25                  30
Tyr Phe Leu Arg His Trp Val Cys Gly Pro His Leu Arg Ile Phe Val
        35                  40                  45
Asp Gly Asp Ala Thr Pro Ile Val Arg Ala Val Glu Arg His Leu Ala
    50                  55                  60
Ala Cys Pro Ser Ala Gly Thr Thr Asp Pro Gln Ala Leu Leu Pro Leu
65                  70                  75                  80
His Glu Arg Leu Ala Glu Leu Glu Gly Glu Arg Gly Pro Leu Leu Pro
                85                  90                  95
Trp Ala Pro Asp Asn Thr Val Thr Ala Glu Pro Pro Gly Leu Asp Thr
            100                 105                 110
Glu Leu Asp Arg Phe Leu Ala Asp Phe Tyr Ala Asp Thr Thr Glu Ala
        115                 120                 125
Ala Phe Asp Ala Leu Gly Arg Val Arg Ala Gly Thr Pro Leu Pro Gly
    130                 135                 140
Ile Ala Phe Asp Leu Val Val Ala Thr Ala His Asp Leu Ser Glu Gly
145                 150                 155                 160
Gly Leu Pro Thr Ala Arg Thr Ser Leu Arg Ser His Ala Glu Ala Tyr
                165                 170                 175
Leu Ser Arg Leu Pro Gly Gly Val Arg Ala Lys Trp Gln Ala His Tyr
            180                 185                 190
Glu Arg Asn Gln Glu Pro Leu Thr Ala Arg Ile Lys Ala Leu Thr Gly
        195                 200                 205
Ala Gly Glu Pro Gly Ala Trp Leu Arg Thr Ile Arg Ala Thr Arg Asp
    210                 215                 220
Arg Gly Arg Thr Leu Ile Asp Glu Gly Arg Leu Ser Leu Gly Tyr Ala
225                 230                 235                 240
Thr Asp Gly Pro Ser Thr Arg Pro Pro Leu Ala Ala Val Ser Pro Phe
                245                 250                 255
His Arg Asn Leu Glu Thr Asp Glu Arg Trp Leu Ala Leu Lys Asp Thr
            260                 265                 270
Pro Ala Phe Ala Ala Tyr Arg Leu Ala Leu Asn Cys Ala Tyr Leu His
        275                 280                 285
Leu Thr Arg Leu Gly Leu Thr Pro Asp Gln Arg Phe Leu Ile Cys His
    290                 295                 300
Leu Ala Ala Ser Ala Ala Asp Asp Val Tyr Arg Ala Val Ala Ser
305                 310                 315
 
<210>32
<211>428
<212>PRT
<213>野野村氏菌属物种
 
<400>32
 
Met Thr Gly Glu Arg Tyr Glu Leu Arg Ala Gly Val His Leu Ala Arg
1               5                   10                  15
Leu Asp Ala Gly Val Arg Leu Phe Ala Trp Pro His Ala Glu Thr Leu
            20                  25                  30
Gly Glu Leu Thr Arg Asp Glu Leu Asp Leu Leu Arg Asp Leu Ala Ala
        35                  40                  45
Gly Pro Arg Thr Ala Gly Gly Pro Leu Val Glu Arg Leu Arg Ala Gly
    50                  55                  60
Gly Trp Leu Lys Ile Thr Ile Thr Arg Asp Gly Val Pro Leu Tyr Thr
65                  70                  75                  80
Leu Ala Pro Leu Arg Pro Pro Pro Pro Arg Pro Ala Val Pro Glu Arg
                85                  90                  95
Pro Val Leu Ser Arg Phe Ala Thr Leu Arg Arg Glu Gly Asp Ala Leu
            100                 105                 110
Val Ala Gly Ser Pro Leu Ala Trp Cys Asp Leu Tyr Val His Asp Pro
        115                 120                 125
Gly Leu Val Gly Asp Val Val Arg Pro Gly Gly Glu Val Leu Ala Asp
    130                 135                 140
Leu Val Trp Ala Gly Leu Ala Val Pro Glu Glu Ala Glu Asp Arg Glu
145                 150                 155                 160
Leu Arg Phe Arg Gln Trp Ala Pro His Glu Leu Glu Phe His Asp Arg
                165                 170                 175
Ser Arg Val Gly His Arg Gly Tyr Leu Gly Asp Gly Phe Gly Gly Thr
            180                 185                 190
Phe Trp Ala Arg Gly Arg Phe Asp Pro Leu Pro Ala Arg Pro Arg Pro
        195                 200                 205
Tyr Pro Gly Arg Ala Ile Glu Leu Pro Thr Pro Asp Leu Asp Glu Leu
    210                 215                 220
Arg Leu Lys Asp Pro Ser Leu Thr Asp Val Leu Glu Gly Arg Arg Ser
225                 230                 235                 240
Val Arg Glu His Asp Asp Glu Arg Pro Ile Thr Leu Asp Leu Leu Gly
                245                 250                 255
Glu Leu Leu Tyr Arg Thr Ala Arg Val Arg Glu Cys Trp Thr Ala Asp  
            260                 265                 270
Gly Val Glu Tyr Thr Arg Lys Pro Tyr Pro Ser Gly Gly Ser Val Tyr
        275                 280                 285
Glu Leu Glu Ile Tyr Pro Val Val Arg Asn Val Ala Gly Leu Glu Pro
    290                 295                 300
Gly Met Tyr His Tyr Asp Gly His Asp His Val Leu Arg Pro Val Arg
305                 310                 315                 320
Glu Ala Gly His Pro Ala Val Arg Arg Leu Leu Thr Val Ala Gly His
                325                 330                 335
Gly Ala Ala Thr Gly Arg Arg Pro Gln Val Leu Leu Ala Val Ser Ser
            340                 345                 350
Arg Ala Gly Arg Leu Leu Trp Lys Tyr Glu Gly Met Gly Tyr Ala Leu
        355                 360                 365
Thr Leu Lys His Val Gly Val Leu Tyr Gln Thr Leu Tyr Cys Val Ala
    370                 375                 380
Thr Ala Met Gly Leu Ala Ala Cys Gly Leu Gly Ser Gly Asp Ser Ala
385                 390                 395                 400
Ala Phe Ala Glu Ala Thr Gly Arg Asp Pro Leu Glu Glu Cys Ala Val
               405                 410                 415
Gly Glu Phe Met Ile Gly Thr Ala Glu Ala Pro Arg
            420                 425
 
<210>33
<211>630
<212>PRT
<213>野野村氏菌属物种
<400>33
Leu Asn Asp Phe Lys Pro Arg Leu Pro Ala Asp Ile Arg Phe Ala Pro
1               5                   10                  15
Thr Ser Gly Gly Val Ala Phe Leu Thr Arg Glu Gly Val Val Arg Met
            20                  25                  30
Asn Gly Ala Ser Val His Leu Trp Val Glu Arg Leu Ala Val His Leu
        35                  40                  45
Asp Gly Ser Arg Thr Val Ala Glu Leu Thr Ala Glu Leu Pro Asp Glu
    50                  55                  60
Arg Arg Ala Phe Val Thr Ser Leu Leu Thr Thr Leu Arg Glu Arg Gly
65                  70                  75                  80
Leu Val Glu Asp Ala Gly Glu Arg Gly Val Leu Pro Val Ala Ala Gly
                85                  90                  95
Thr Ala Cys Ser Leu Leu Ala Asp Ala Asp Arg Phe Gly Glu Leu Ala
            100                 105                 110
Pro Ala Leu Ala Asp Ala Leu Arg Arg Leu Gly Leu Glu Val Leu Thr
        115                 120                 125
Glu Pro Ser Gly Gly Ala Leu Val His Val Ala Ala Ala Asp Ala Asp
    130                 135                 140
Gly Leu Ala Ala Ala Gly Arg Leu Asp Arg Leu Ser Ala Glu Arg Gly
145                 150                 155                 160
Leu ProIle Ala His Val Leu Leu Arg Glu Gly Glu Ala Trp Trp Ser
               165                 170                 175
Glu Thr Gly Val Val Gly Arg Asp Val Pro Pro Trp Ala Ala Gly Trp
            180                 185                 190
Arg Arg Leu Ala Ala Met Glu Ala Val Pro Arg Thr Ala Gly His Val
        195                 200                 205
Ser Val Ser Pro Val Ala Ala Ala Val Val Ala Gly Gln Val Val Ala
    210                 215                 220
Asp Leu Gly Arg Cys Leu Ser Gly Thr Pro Arg Val Ser Gly Gly Pro
225                 230                 235                 240
Arg Leu His Val Val Asp Leu Asp Gly Phe Gly Met Arg Thr His Ser
                245                 250                 255
Phe Leu Pro His Leu Ser Ala Leu Pro Pro Gly Thr Gly Val Ser Ala
            260                 265                 270
Gly Pro Leu Gly Glu Glu Glu Phe Ser Arg Arg Ala Ala Arg Leu Met
        275                 280                 285
Asp Ser Arg Thr Gly Val Phe Ala Glu Ile Glu Glu Gly Glu Tyr Gly
    290                 295                 300
Gln Leu Pro Leu His Val Ser Val Thr Thr Val Ala Asp Pro Met Gly
305                 310                 315                 320
Ala Leu Gly Gly Ala Leu Ala Arg Val Ile Gly Val Gly Ala Asp Phe
                325                 330                 335
Ala Thr Ala Arg Tyr Arg Ala Ala Leu Lys Ala Leu Thr Val His Gly
            340                 345                 350
Leu Leu Ala Leu Asp Pro Arg Arg Leu Val Thr Ala Glu Gly Thr Pro
        355                 360                 365
Leu Thr Gly Ala Gly Glu Pro Ala Ser Gly Phe Pro Ala Asp Pro Gly
    370                 375                 380
Ala Arg Glu Arg Pro Ile Gly Gly Phe Ser Ala Asp Pro Gly Ala Gly
385                 390                 395                 400
Glu Arg Pro Asp Asp Gly Leu Leu Asp Asp Pro Leu Val Gly Asp Val
                405                 410                 415
Ala Ala Gly Arg Val Glu Ala Phe Val Arg Gly Arg Asp Leu Val Glu
            420                 425                 430
Gly Gly Glu Val Leu Leu Pro Ala Arg Ala Val Phe Leu Asp Pro His
        435                 440                 445
Ala Thr Gly Ala Ala Ala Gly Tyr Ser Ala Glu Glu Ala Leu Val Ala
    450                 455                 460
Gly Leu Leu Asp His Cys Ala Ala Leu Ala Gly Leu Asp Gly Thr Leu
465                 470                 475                 480
Pro Pro Val Asp Val Gly Gly Ala Arg Ala Ala Asp Asp Glu Thr Ala
                485                 490                 495
Arg Ser Ala Ala Leu Leu Asp Ala Ile Gly Leu Pro Tyr Gln Val Leu
            500                 505                 510
Asp Ala Thr Gly Pro Ser Gly Val Pro Val His Ala Gly Thr Leu Gly
        515                 520                 525
Gly Arg Leu Val Ala Arg Ala Ala Gly Val Thr Pro Leu Ala Ala Leu
    530                 535                 540
Arg Ala Thr Leu Glu Gly Ile Leu Ala Ala Tyr Gln Gly Ile Pro Gly
545                 550                 555                 560
Pro Ala Pro Leu Pro Asp Leu Cys Pro Ala Val Ala Gln Glu Pro Pro
                565                 570                 575
Val Val Leu Asp Thr Gly Ala Ala Val Leu Gly Ala Gly Glu Leu Ala
            580                 585                 590
Ala Ala Leu Ala Gly Ala Gly Leu Arg Val Ser Ala Val Pro Leu Asp
        595                 600                 605
His Asp Arg Glu Val His Ala Leu Met Pro His Val Val Arg Val Val
    610                 615                 620
Thr Glu Pro Leu His Gly
625                 630
 
<210>34
<211>610
<212>PRT
<213>野野村氏菌属物种
 
<400>34
 
Val Gly Thr Gly Leu Leu Ala Glu Glu Ile Thr Ile Ala Leu Lys Asp
1               5                   10                  15
Arg Asp Gly Arg Ala Glu Val Thr Ile Thr Ala Cys Asp Gly Trp Ala
            20                  25                  30
Arg Gly Pro Arg Arg Asp Gly Ala Ala Trp Leu Pro Val Arg Val Glu
        35                  40                  45
Tyr Gly Val Ala Val Ile Gly Pro Leu Glu Arg Pro Gly Glu Pro Gly
    50                  55                  60
Cys Val Thr Cys Phe Glu Thr Arg Arg Asp Arg Val Arg Thr Asp Ser
65                  70                  75                  80
Ala Asp Arg Ala Ala Val Leu Ala Val His Gly Pro Glu Leu Ala Gly
                85                  90                  95
Arg Ala Ser Pro Tyr Leu Gly Arg Leu Ala Ala Arg Thr Ile Ala Ala
            100                 105                 110
Leu Ala Ala His Ala Ala Glu Gly Pro Gly Cys Ala Val Trp Tyr Val
        115                 120                 125
Asp Leu Arg Thr Leu Thr Ala Glu Arg His Thr Phe Leu Pro Glu Pro
    130                 135                 140
His Cys Pro Asp Cys Gly Asp Leu Pro Asp Asp Asp Arg Ala Ser Ala
145                 150                 155                 160
Ala Phe Glu Pro Gly Ala Ala Pro Arg Pro Pro Gly Tyr Arg Val Arg
                165                 170                 175
Asn Val Pro Ala Glu His Gly Ala Leu Leu Asp Thr Tyr Val Asp Gly
            180                 185                 190
Glu Cys Gly Leu Ile Arg Pro Leu Val Arg Asp Thr Leu Gly Gly Leu
        195                 200                 205
Val Ile Ala Gly Ala Met Leu Pro Leu Arg Phe Glu Gly Gly Ser Glu
    210                 215                 220
Pro Gly Val Gly Arg Thr Arg Gly Tyr Arg Ala Ser Glu Val Thr Ala
225                 230                 235                 240
Val Leu Glu Ala Leu Glu Arg Trp Gly Gly Val Glu Pro Gly Gly Lys
                245                 250                 255
Arg Thr Arg Val Arg Ala Ser Tyr Ala Glu Val Ala Ala Asp Ala Leu
            260                 265                 270
Asp Pro Arg Thr Leu Gly Glu His Asp Thr Ser Ser Tyr Glu Met Glu
        275                 280                 285
Gly Phe Ala Phe Arg Pro Phe Ala Glu Asp Ala Val Cys Asp Trp Val
    290                 295                 300
Trp Gly Tyr Ser Phe Ala Arg Arg Ser Pro Ile Leu Val Pro Glu Ser
305                 310                 315                 320
Leu Ala Tyr Tyr Tyr Val Arg Gly Arg Glu Arg Pro Phe Leu Phe Glu
                325                 330                 335
Ile Ser Asn Gly Cys Ala Leu Gly Gly Ser Met Ala Glu Ala Leu Leu
            340                 345                 350
Tyr Gly Leu Leu Glu Thr Val Glu Arg Asp Ala Phe Leu Met Thr Trp
        355                 360                 365
Tyr Gly Arg Leu Pro Val Pro Arg Ile Asp Pro Gly Thr Ala Arg Asp
    370                 375                 380
Arg Thr Ile Pro Leu Gln Ala Ala Ala Ile Ile Ala Glu Thr Gly Tyr
385                 390                 395                 400
Arg Val Glu Leu Tyr Asp Thr Thr Met Glu His Gly Ile Pro Ser Val
                405                 410                 415
Trp Ala Met Gly Val Arg Gin Asp Gly Asp Pro Gly Arg Pro Arg Leu
            420                 425                 430
Val Cys Ala Ala Gly Ala His Leu Val Pro Glu Lys Ala Val Leu Ser
        435                 440                 445
Ala Leu Ser Glu Leu Gly Pro Leu Leu Ala Asp Leu Ile Arg Arg Tyr
    450                 455                 460
Pro Asp Glu Val His Arg Ala Gln Glu Met Val Thr Asn Pro Asp Leu
465                 470                 475                 480
Val Ala Thr Met His Asp His Ser Thr Leu Tyr Gly Ala Asp Ala Ala
                485                 490                 495
Phe Asp Arg Leu Ser Phe Leu Thr Gly Gly Thr Gly Val Arg Gly Leu
            500                 505                 510
Pro Asp Met Glu Ala Phe Thr Val Pro Gly Asp Leu Asp Val Met Arg
        515                 520                 525
Val Val Asp Arg Phe Leu Ala Glu Gly Met Asp Val Val Val Ile Asp
    530                 535                 540
Gln Thr Thr Pro Glu His Arg Ala Arg Gly Phe Ser Cys Val Lys Val
545                 550                 555                 560
Leu Val Pro Gly Thr Leu Pro Met Thr Phe Gly His Arg Asn Arg Arg
                565                 570                 575
Val Arg Gly Leu Thr Arg Pro Leu Glu Leu Pro Tyr Arg Leu Gly His
            580                 585                 590
Arg Asp Thr Pro Leu Thr Pro Ala Asp Leu Asn Pro Asp Pro His Pro
        595                 600                 605
Phe Pro
    610
 
<210>35
<211>2484
<212>DNA
<213>野野村氏菌属物种
 
<400>35
gtgccgccgg cccaggccgg cggcactccg cccggggtga ggagacagat catggaggtg    60
ggccgcgaaa tcgtggtccg cgtggcgggg ctgcccgccg ccgtgctcgc cgacctgcgc    120
ctgccgcaca ccgccgagct cgtcacgcac ctgtccgctg agcggcggcg gctcgccgcc    180
gaggcggctg cgctgtccgg cgagctgttc gacctgatcg gcgccgccgg ctccgcccgc    240
gccgccctgg tgggcctgcg gcgcgcgctc gcccccgggc accgcccccc gtcgccgcga    300
ctgatcgggc tgtgtcccct gcccgccccg ctggccgagc gggtcaccgc ctgggtgcgg    360
gcccggtacg actgggagga ccggcgccgc gaccttgccg gcacgctgga caaggagcgc    420
gccgacgcgc tcgaccgcgt acgcgccgcc tgcgtcgccc cggcgttccg gcggggtctg    480
gcgctgtccg gtggggagct gaccagcacg ctggagcgct ggctcgccga ccccggccgt    540
gcgccccggc aggggaaggt gctccgcctg gtcaagtacc tgacccgagc tgcggccaag    600
accagcccgt acggctcctt catggtcagc gcgctggcgg ggcggcccgg cgacgaccct    660
cccatcccgg agctgctcac cgtggccgag ccgccggggg cgttcctcga cgccgtcggc    720
gacgcgctgc tcgccgaccc ggcactggcc ggccaggtgc cgctgcgccc caaccccagc    780
ctgacgtgga ccgcccaagg actgcttttc gtccggaccg tccgcgcggc ggcgggagag    840
caggccgggc cgaaggaaga gatcgccacc gccgggcgcg ccgccgcgct ggagctgtgc    900
ctgcggcacg ccgagtcccg gcccaccgcg ccgcagctgg cggagctgct ggccgaggcg    960
ggggcggatc cgggcgaggc ggccgcgttc gtcgaccggc tggtggcggc gcagctcctg    1020
ctgccgtgtc cgccggtgca cgacgacgat cccgacccgt tcggtgcctg ggcccgccag    1080
gtgtgcgccc cggagctgcg cgagctggcg gccgcgtcgc ggcccgtggc cgccgccgtg    1140
gactcgcccg gccagcgccg cgccaggatc gccgaagccg ccgccgccgt ggcggaccgg    1200
ctcggcatcg acccgcccgc cgatccggcg cacgagcacg acgtcagcac cggccgtccg    1260
gcgccgccac cgctgcccgc gggcgtgctc gccgacctgg acgcggtccg gcgctggctc    1320
gccgtgttcg actggaaggt gcccgtccgg gtgggggtcg gcgcgttctg ccgcgaacgt    1380
ttcggctcag ggtcccgcac gcccttcctg gaggcgtgcc gggcggcgac ggcggcgctg    1440
ccgcacctgt tcggccccgc cgcgatgccg tggttcctcg acctgaccgg tgacggtcgc    1500
ctgcgtgagc tggaccgtct ccggacgcgc gcccgcgatc tcgcccgctc cggcgtcctc    1560
gaccggcggc gggtgctggc tgacacggcc gactggcccg cctggctgac ctggcccgcc    1620
tccactggtt tctacctgca gaccctgccc ggtggggtgg tgctgaacgc ggtgcatgcc    1680
gggcacggcc gcgcggcggg tcgcgtccac cacctcctcg cccgggcggg cgccgcgccg    1740
ccgcgcccgc cccgctccgg cctgccgcgt gccgagttcg gcggcaggtt cggctccgcg    1800
ctcaacaccc gcacgccgag cacgcggtac gagatcgacc accccggcgc gacgtccggc  1860
cgcgaccccc ggcaccgtgt cccgctcggc acgctcatgg tggtgcacga cccggacacc  1920
gacctggtcc acctgcacag cgaccggctc ggccgcgtcg aaccggtgca cctcggcatg  1980
atgggcgagc tggggctgcc cgccgtggcc ggtttcctcg aacgcgcctt cgcgcccacc  2040
tacctgttcc acccgagcgt gccgccgttc atctcgctgc gtgacctggc cggcgcctcc  2100
tcggcgcggc gcttccccag ggtgagtgtc ggcgacgtgg tcgtgcagcg cgcccgctgg  2160
acggtgcccg ccggcctggt gcccgcgcgt accggggcgg acggtgacca cctgctcgcg  2220
ctggccgagt ggcggcgcga gcacggcatc cccgagcggt gtttcgtgcg cggctggaag  2280
ccgggcgcag cgctgggcaa ggcgcgcaag ccgctctacg tcgacttcgc ctcctggcat  2340
ctggtcgccc tgttcgaacg ggaggcgcga accaacgccg ccctggtcat cgacgaggcc  2400
ctgccggacc cgctggccga cggcgccccc gcgcacgtca ccgagtacca cgtcgagatc  2460
ggcgaccggg agagagagca atga                                         2484
 
<210>36
<211>900
<212>DNA
<213>野野村氏菌属物种
 
<400>36
atgaccgaac ggcccggctg gttcgcggcg catgtgcact accgcggcga cctcgacgcg  60
ctgctgcgcg aagcggtcgc gccgctggtg cgcgcgcttg ccgccgactt cttcttcctg  120
cgctactggg acgggggcag ccacctgcgg ctgcggctgc gcggcgggga ccaggtcgcg  180
gtcgcccggc acctggacgc ctaccttgcc gcccaccccg cgccggagac cacctcccag  240
gaggagtacg cccgcgtcgc cccggtgctg gccgcccgcg agggcatgac gggccacctg  300
acgacgctgc ggccgaacaa caccgtggag ttcgcggcgt accggccgga gaccgcgaag  360
tacggcaccg gcgacgcgct acgcgccgtc gagcggcatt tcgtcgagtc cagccggtac  420
gcgcttgacg tccttgaccg ccgcccgacc ggcaaccaac gcgagctcgc agtgctcggc  480
gtcctgctgc tcgcctggta cgccgcccgc ccactcgatg agccgcctgg tgagccggtc  540
gatgacgagc tgatcggcgc ggtcgaggcg ctgtgccggg gctggcgcgg cggccgggac  600
ctgcccgagg agctcgtggc ggaggagtac ggccgggtgc gggagcgtgt ggccgggctg  660
gccggcgcgc tgcgtgacct cgttccggac ccggacgcgc ccggcagcag catgcgcgcg  720
tgggcggcga cgttcgaccg gctcgccgcc gcgctgcccc cgcccgaccg gctgcgggtg  780
ctcgacacgt gcgcgcatct ggcggccaac cggctgggcg tgtccatggc ggccgaggtg  840
cggctgcggc tgctcgccgc gcgggccctg cgcgaggtcg cgcccgtggg gaggcgatga  900
 
<210>37
<211>1002
<212>DNA
<213>野野村氏菌属物种
 
<400>37
atgagctggc gacgcgtcgacgtggcctac cacgatcccg accttgacgg gctgatcctg    60
gccacccggc cgctgctggc cgggacgccc ggccgcggct ggttccagcg gcactgggtc  120
cgcggtccgc acctggagct gtggttcgac gccgcgcagc cgtcgtggga gcggatccgc  180
gacgtgctgg agccctggct gcgcgtcaac ccgtcgcgcg cccggatcga ccgagaccgg  240
ctgctggcgc agcaccggca cctcgccgcc gccgaacgga tcgacgagcc gctgctgccg  300
ttctacgccg acaacacgct gcaccgggcc gctccgcgct cccgcgcaca cgtgctcggt  360
ggtccggcgg ccgaggagct gttccacgac ttccacacca ccgccagcgc cgtggcttac  420
gacgagctcg acgccgtgcg ggcgggagag tcgcggctgg tgatggcact ggacctgatg  480
gtcgccgccg cgcacgcgca cgccgagggc ggcgtccgcg gcgggttcgt gtcgttccgc  540
tcgcacgcgg aggcgttcct ggcgagcgcg cccggcctgc gcgagcgctg ggacgccgag  600
tacgccgccc gggcgggggc gctgcgagcg cggatcaccg cggtggtcgc cggaatcccg  660
cgcggccggg cgtgggccgg gctgctcgac cggttcgcgg accgcggcga cgagctgatc  720
gcctccggcg cgctgctggt cgagcccgcc gggccggacg cggtcgcccg gcccgacacc  780
gccttccacc gggcgctgcg cggcaaccgg acctggcacg aggaggtgct gcgctcagca  840
ccgttccgcc gctaccggct gctgctgaac ctgacctacc tgcagctttc ccggctcggg  900
gtgaacgccg tgcagcgggc gctgctgtgc cacttcgccg cgtcggcggt cgagcaggag  960
tacggggtgt ccgccatcga gatcgccatg ggaggcgcgt ga                    1002
 
<210>38
<211>1368
<212>DNA
<213>野野村氏菌属物种
 
<400>38
gtgatgtcag tacaggtcga gcccgcagtg acgcaccggt gggcactgcg gcccggcgtc  60
taccgggcca ccgcgccagg cggcgatctc atgctcgccg cctggccgca cgccacgccg  120
ctcggccggg ccacccccga gctgctggcc ctgctggacg gcctggccgc cggatcgctg  180
ccgctcgacg agcccggcga cctcgcgccc gccgtcgagc tgctgcgcgc gggtggctgg  240
ctgcgcaaga cggtggcgta cgcgggacgc gacctctaca ccatcacccc cgtcgccgcc  300
cccaccgacg cgccgccacc gccgcgggac gaaccggcgc tgtcgcggtt cgcgctgctg  360
cgcaacaccg cggacgggct ggtgctggag atgcccggct cctggtgcga cgtccacgtg  420
cacgacccgg cggtggccgc gctgctcgcc gacccgtccg gcgacggcgg cctgcccgcc  480
gaggccgcgg ccgcgctgcg cgccgacctg gccgccgccg gcatgctgat ggagcgggag  540
gagccgttcg agcggcggca gtggagcacc cacgagctgt ggttccatga acgcagccgg  600
ctcggcaacc ggggctggtt cggcgcgcac ttcggcggca cgttctgggc ccgcggccgg  660
cacgacccgc cgcccgcgcg gccgtccccc taccccggcc cggccgtcga gctggcccgg  720
ccggacctcg cggcgctgcg gcgcaccgac cccacgctca ccgccgtgct ggaggaccgc  780
gaaagcgtcc gcgaccacga cgacgacgat ccgatcagcg ctgagcagct cggcgagctg  840
ctctaccggt gcgcgcgggt gcggctgctg cgtcacctgg aaggcttcga gtacgccggc  900
aagccgtacc ccgccggtgg ctcggcgtac gagctagagg tgtacccggt cgtgcggctg  960
gcccgcggcc tcgaccccgg catgtaccac tacgacgcgc acgaccatcg gctgcgccag  1020
gtccggcccg ccggccaccc ggcggtgcgc aggatgctga aggtcgccac ggagtcgtcc  1080
gtcgccaagg cgccgcccca ggtgctgctg gtgatcagcg cgagagtcgg ccggatcctg  1140
tggaagtacg aggcgatggg gtacgcgctc atgctgaagc acgtcggcgt gctgcaacag  1200
acgctgtacg cggtcgccac cgccatggac ctggccccgt gcgcgctcgg cagcggggac  1260
gatctcgcct tcaccgccgc caccggccgg gaccggctgg tggagtgcgc ggtcggcgag  1320
ttcatggtcg gcagcaggcg gaaggagccc gcggcatggg agctctga               1368
 
<210>39
<211>1827
<212>DNA
<213>野野村氏菌属物种
 
<400>39
atgggagctc tgaacctcct cctgcgcccc gacgcgcact acgccgaggt cgacggcggc  60
gtctacgtgc tgagccacca gggcgagacc ttcatctcgg gcacctcggt gcaccggtgg  120
ctcgaccgcc tcgcgccgct gctcgacggc acccgcacgc tcgaccagct caccgccggc  180
ctgcccgccg accgggccgg cttcgtggcc agacttgtcg gcacgctcac cgaacgcggc  240
ctggtgcgcg aggtcggccc ggcggtgtcg gacacgctca ccgacgccga acgcggcgag  300
caccgtgccc tgctggccta cctgggctac ttccacgact cgcccggccg cgtcctcgag  360
gacgtgcgcg acaccccgac cgcgatcgtg gggtccggtc cgctggccgc cgcggtggtc  420
cgcgcctgcg ccgccgccgg gctgcgccgg gtggagatcg gcgaggaggc gggcgcggcc  480
cgggtggtcg tccacgtggc cgagcgcgcc gagcccgaac gggcggcgcg gctggaacgg  540
cggtgcgccg ccgagggggt gctgctcgca caggtcatgc cggggccgga cggcatctgg  600
tggcagcccg cggcccgcgg cggctgctgg gcgagcgcgt ggcgccgcca ccgggcgctc  660
gcgggcgtgg atcggacggg cacgccgctc gatccggtgg cggtcgcggt ggtggccggc  720
caggtggcac acgacgtctt ccgcgtcctc gccggactgc gcgaggaggc gccgccccgg  780
ttggtggtgc tcgatccgcg gacgctggcg agcaccgcgc acccggtggt ggcgcacccg  840
ttcgagctgc ccgccgcgcc gctggacgag gcggcgttcc tcgaccgggt cgccgcgctg  900
cgggcagcgc ccgcgctgag cgaggcggag ttctcccggc gggccaaggg gctcatggac  960
tcgacagtgg ggctgttcgc cgagatcgac gagggcgacc tcgcgcagtt gccgctgcac  1020
gtcacggcga ccacggtggc cgacccgtgc gggctgatcg gctccgcgcc gcggcccgtg  1080
gtcaccggcg cggggctcac gttcgaggag gcccgctacc gcgcggcgcg cgccgcgctc  1140
gccctggccg gcactctcgc gctcgaccgg cggaggctgg tcgacggccg ggtgtgggcg  1200
tacgaccttg cggacggggc cgcccggctg gttccggccg acgaggtctt cgcaagcacg  1260
gcgggcggga gcacggcggg cgtgccgctc ggcgcggcgg cagcctactc gtgggccgag  1320
gcggtcgcgg agggcctggt cgcgcaggcc gccgcgctca ctctcgccgg cgccgggcac  1380
gcgggcgagc cgtatggacg ggcggacctc gccggggcgc ctgcgtatct cctcgccatg  1440
gtgcgggcgc tcggcgagga gctgaccgtg cacgacgtca ccgggccgct gggcgtgccg  1500
gtcgtggtgg ggacgctgtc cggcggggcg accgcctgcg gcgcgggcat gaccacggac  1560
gccgccgtca ccgcgtgcct gcgcgacctg ctgctgctgc gccaggccga gatcaacgac  1620
cagcccgtct acgccccacc atccggcagg cccttgcccg ggcatctacg cgggaaccac  1680
ccggcgcccg ccgtgcccgg cacggacgcc gaccggctgg cggcccgcct ggccgagcgg  1740
gggcaccgcc ctctggcggt gccgctggat catgaccagg ccgtgcacgc ggtcctgccc  1800
ttcgccgtcc gggtggtgtg ccgatga                                      1827
 
<210>40
<211>1737
<212>DNA
<213>野野村氏菌属物种
 
<400>40
atgatccgcc tgcccgacca cggcgagctt gccgtgccga tcggcgacgg gccgatgctg  60
ccgctgcgca ccgaactcgg ccgggtggtc atcggcccgc tggagcggcc cggcgtgccc  120
ggatgccggg cctgcgtgcg catccgcgcg gcgcgggtcc agcccgacgc ccgcaaggcc  180
gaggccgtac gcgcccggca cgcccccgcg cccagccagt ggctcacccc gctcgccacc  240
gacctggtgc gcgtcctggt cgcgagcgag agcgctgccc tggcagccga caccgacccc  300
cgcaccgcgg gtgccgtgct ggagatcgac ctcgccacgc tggaaatcac caggcaccgg  360
ttcctgcccg acccgctctg cccgcactgc ggcggtctgc cgccggacgg cccggccgag  420
ctgaccctgc ggccccgccg caagctcggc ggcagtcccc ggaccaggcc ggtcgagctg  480
aacgcgctgc tggagacgta cgtggacggc cgggtcggga tgatccggcc gctgaagtcg  540
ggcgtgcagg gcggactgac ggtggccagc gccatgctgc cgatccgcgc gggccacggc  600
ctggaaccgg gggtcggccg tacccgcagc tacaccgcga gcaggctggt cgccgtgctg  660
gaggcgctgg agcgctatgg cggcgtcagc cccggcggcc gccgcaccag cgttaccgcc  720
gcctaccgcg acatctccgg ccacgccgtc catcccgaca ccttcggcac acaccccgag  780
gagaactacg acaggcccgg cttcgccttc cggcgcttca ccgaggacac cgtgtgccgg  840
tgggtgtggg gctactcctt cgccaaggcc cagcccgtgc tggtgccgga gaaccaggtc  900
tactactacg ccagaaacct gccggacggc gagcagccgt tcgtcttcga ggtctccaac  960
ggctgcgcgc tcggctcgtg cctggaggag gcgatcctgc acggcctgct cgaggtggtc  1020
gagcgggacg cgttcctgct cacctggcac gcccggcggg aggttccggt gctgaacccc  1080
gcgctggcga gcgacccggt cctgcccatg caggccgccg cgatcaccgc cgagaccggg  1140
caccgggtgc tgtgcttcga caccaccgcc gagcacggca tccccagcgt gtgggcgatg  1200
gccgtggacg tcgaacaccg gtcggaccgg cccgccaccg cccacgccgc cggcgcggcg  1260
ctcacgctgg agcaggccgc catgaacgcg ctgagcgagc tcggcccgct gctggccgac  1320
gtgatccgcc gctaccccga ggagcgggaa cgggccgagg ccatggtccg cgaccccgag  1380
caggtcgcca ccatgcacga ccactccctg ctctacgcgg ttcccgccgc ggccgaacgg  1440
ctgtcgttcc tcaccggccg cgccgacggc ccgcggaccg gcttcggctc ggcccggttc  1500
accggcgacg acctcaccgc cgatctgcgg gccatgatcg acgcggtgat cgacgccggg  1560
atggacgtgg tggtcgtcga ccagaccacg ccggagcacc tggcgggcgg gttccgctgc  1620
gtgaaggtgc tggtgcccgg cgcgctgccg atgacgttcg gccaccagta ccggcggctg  1680
gacaacctgc cgcggctggc ggccgcgcgt accaccgacc cgcacccgtt cccatga     1737
 
<210>41
<211>2574
<212>DNA
<213>野野村氏菌属物种
 
<400>41
atggcggtta ttgagcggga agaaagcgac ggcccgccgg tcgctgtccg cacgtgcggg  60
gtcgcggccg cggagctgga atccctgcga tgggacgagt cctatgcgct ggtgacccgg  120
ctgctcgcgg agaccgcccg ggtggcggcg gacgggcggc ggctggccgt ggcgctcggt  180
gacgtcatcg gagggctcgg cccgtccggg tcccggcccg tcctcgtggg gctgcggcgg  240
gcgctgcaca ccgggcgtct cccctccggg cgggagtggg ggcccgaggc cggggcggcg  300
ctgccgtacg ggctgagggg cgaggtggag gagtgggtac ggcgtgcgcg cgagtgcgcc  360
gggctgcgcg cccgcctgcc cgaggtcgtc gcccgggagt ccctggagaa ggaggaacgg  420
ctgcgcgccg ccgcggccga ccccgccttc cgcagggggc tggcgctggc cggcggcgag  480
ctggcggtcg acctggagac gtggctcgcg gaccccgcgc ggcgccccaa gccgcagaag  540
ctgctcaggc tggccaaata cctggtcagg gccgccgtga agaccagccc gtacagcacg  600
ttcacgagca ccgggcgggc ggtgtggggc ggtggcgagc ggcacgtgga gcgcgtggtg  660
ccggtgctgg aactcgacgg cgtccagacg ttctcggacg atcgggtcag ggtgaatccg    720
tcggtcaccg tcgcgggcgg gacggcggag ttcatcgggc cgcctcccgg ggaggcgctg    780
gtgtccatcg gggtgacgga ggcggtggcc gcgtgcctgc gcgtcgcgga gggcggggag    840
tgggtgccgc ggggccggtt cgcggaggct ctgggggctg agcctgccgc agtcacgaaa    900
tttctggaca agttgcttgc ggttgggctc ctggaggccc ggccggacgg cgacccgccc    960
ccgcacctgc tggacgggat ccggcgcacg gaacgcgcca ccgacccgtc caccttccgc    1020
cacgaactcg gccgcctgat cgccgccgcc cgcgccgccg cccgcgccac cgcccccggc    1080
gctgacacgg ccaagaacgc cgcccctgcc gggcgcgcca cccgcggcga tggcggtgct    1140
gatgccgagc gcgccacccg cggcgatagc gatgctgatg acgggcgcgc cacccggggc    1200
gacggcggtg ctgatgacag gggcgccgcg cggggcgacg gcggtgtggg gcgggcggtt    1260
gtgcacgagg tcgcggtctg cgtcgagccc gtggcgaggc tggatccggc gcgatggcgt    1320
ggcgggcttg ccgatctcga cgtcgtacgc cgctggctgg ccgttttcga cgccaagcac    1380
cccatgcgcc tcgcggtcgc cgcctacctc accacccggt acggccccga cccggccgtc    1440
cccttcctca cgctccaccg ccacatccag cgcgagctgg ccggcaccgg cgcggcaggc    1500
cgggagttgc gcgcgttcct cggctcgtcg gccgcctgga cccagccgct aggcacctcc    1560
gccctgccca ggatcaggga gctggagcgc ctcagagccg aggcgagaag cctggcgctg    1620
gacgcggagg accccgacgg cacctgccgc gtcacccccg gacagctggc cgcgcagctg    1680
gagtcgtggc cgtcttggat cgcgatcccc gcctcctcgg cctgctacgt acaggcggtg    1740
gccggcaccc tggtgctcaa cgtcgtccac ggcgggcacg gccgagccct gcgcaggctc    1800
gaccacctcc tcgaacgcgc cggcggccac cccgagccgc cccggatcga ggacccggac    1860
ggcgcggtct acgccgagtt ctccggcgac ctgggctcca cgctcaacgc gcgcccgccg    1920
agcacccgat acgagatcga ctacccccac tcgcccggca cgcgcccgcc cgacctgcgg    1980
ctgccgctca cggacctgca cgtgacgctc tgcccggaca gcggcctgcc cgagctgcgt    2040
tccaagcggc tcggccgccg ggtcgtgccg ttgcatctcg ggctggccgc cgagttccgg    2100
cttccgccgg ccgcgcggtt catcgaacgc gtcttcggcc ccggctacct gctccatccc    2160
agctcgccgc cgctggtgcg gatgggccgg gtcccctcgg aggtcacccg gtatccacgc    2220
gtcgaggccg ggcgcgtggt ggtgcagcgg cgtcgctggc tggcgcctgc ggccacgctg  2280
ccggtgcgcg cgaagggcga gggcgacgcg gcgtacctca cgcggctgat cgcctgggcg  2340
gacgagtacg gcgtaccgca ccgatcgttc gtccgcgcct ggccggagca gaccggcgac  2400
aaagggcagg acaaggcgcg caaaccgctc ttcctggacc tggcgaacct gttcctggtc  2460
aagaacttcg agcggcagat acgtggctgc gcgttcgcgc tcttcgagga ggcgctgccc  2520
gacccgggac cggagcgggt gaccgaatac ctgatcgagg tgggaggccg atga        2574
 
<210>42
<211>816
<212>DNA    
<213>野野村氏菌属物种
 
<400>42
atgagctggg tgagcgtgca cgtcttctcg caggggccgc tcgacgacat gatcacgggc  60
ctggccgggc cgctcctcgg cgacgacggc ttcttcctgc gctactggga gggcggcccg  120
catctgcgga tcagggtcag gtcccacccg gcggagcagg tcgtcgagcg ggccgaggcg  180
tatctgcgcg agcacccgtc agaggcggtg atcgacccgg aggagtacgc caggctcgcc  240
gcgaccctcg ccgcccgcga aggcgtcccc ggctatacgc ggcgcctcta tccgaacgac  300
tccgcccacc tcatcccgta ccagccggaa cacgaccgct acggcacggg ccgctcgctc  360
gacgccgtgg agcggcactt ccacgactcc agcgtgatcg cactccagct gatcggggcg  420
gggctcggac acgagcggcg gagcatggcg tggctgacca tgctgctggt cgcctggcag  480
gtcgcggggg agggcagggc gttcggcccg cccgctgacg ccggggttca ggtgccccac  540
gagcggatgg cggcgctggt cgagcacgcc agggcggtga cacaggagcc tgcgccgagc  600
gagccccgtg gcgtggtggc cgcctggtac gcctcgatcg cgcggctggt ggaggaactg  660
gcggcggcgg ggttcgacgc ggcgcggacg ggggcgaccg tcgatctggc cgcgcatctg  720
ctggccaaca ggctggggat ccgggtgcag gaggaggccc ggctgcgtca cctggcgtcc  780
ggggccacga gggagtcgga ggtgggggtc ggatga                            816
 
<210>43
<211>960
<212>DNA
<213>野野村氏菌属物种
<400>43
atgacctgga cgcggctgcg ggtggactat cacgacggcc cgatggacga cctcatcctg  60
gacgcgctcc gcccggcctg gcatgaaata cggggatatt tcctgcgcca ctgggtgtgc  120
ggcccgcacc tgcggatctt cgtggacggc gacgcgacgc cgatcgtccg ggcggtcgag  180
cgccacctgg ccgcctgccc gtccgccggc accaccgacc cgcaggcgct gctccccctg  240
cacgagcgcc tggccgagct ggaaggcgaa cgaggcccgc tgctgccatg ggcccccgac  300
aacaccgtca ccgccgaacc cccggggctc gacaccgagc tcgaccggtt cctcgcggac  360
ttctacgccg acaccaccga ggccgcgttc gacgccctcg gccgggtcag agccggcacg  420
ccgctgccgg gcatcgcctt cgacctggtg gtcgccaccg cgcacgacct gtcggagggc  480
ggcctgccca ctgccaggac ctcgctgcgc tcgcacgccg aggcttacct gtcgcgcctg  540
ccgggaggcg tccgcgccaa gtggcaggcg cactacgaac gcaaccagga gccgctgacc  600
gccaggatca aggccctgac cggcgccgga gagcccggcg cgtggctgcg tacgatccgg  660
gccacccgcg accggggccg taccctcatc gacgagggac ggctgagcct cggctacgcc  720
accgacggcc cttccacgcg gcccccgctc gccgcggtct cccccttcca ccggaacctg  780
gagaccgacg aacgctggct cgccctcaag gacacccccg ccttcgccgc ctaccgcctg  840
gccctgaact gcgcgtacct ccacctcacc cggctcggcc tcacgcccga ccagcgcttc  900
ctgatctgcc acctcgccgc gagcgccgcc gacgacgtct accgggccgt ggcctcatga  960
 
<210>44
<211>1287
<212>DNA
<213>野野村氏菌属物种
 
<400>44
atgaccgggg aacggtacga gctgcgcgcc ggcgtgcacc tcgcccggct ggacgcgggg  60
gtccgcctgt tcgcctggcc gcacgccgag accctcggcg agctcacgcg ggatgagctc  120
gacctgctcc gcgacctggc cgccggaccc cgcaccgccg ggggaccgct cgtcgaacgc  180
ctgcgcgccg gaggctggct caagatcacg attacccggg acggcgtgcc cctctacacg  240
ctcgccccgc tgcgcccgcc gccgccacgg ccggcggtgc cggagcggcc ggttctgtcc  300
aggttcgcca cgctgcggcg cgagggggac gcgctggtcg ccggctcccc gctggcctgg  360
tgcgacctgt acgtccacga ccccggcctg gtcggcgacg tggtccggcc cggcggcgag  420
gtcctggccg acctggtgtg ggccgggctg gccgtgcccg aggaggccga ggaccgggag  480
ctgcggttcc ggcagtgggc gccgcacgag ctggagttcc atgaccggag ccgggtgggg  540
caccgcggct acctgggcga tgggttcggc gggacgttct gggcccgcgg ccggttcgac  600
ccgctgcccg cccggccccg gccctacccc ggccgggcga tcgagctgcc cacgcccgac  660
ctggacgaac tgcggctcaa ggacccctcg ctcacggacg tgctggaggg ccgcaggtcc  720
gtacgcgagc acgacgacga gcgcccgatc accctcgacc tgctcggcga gctgctgtac  780
cgcacggcca gggtgcggga gtgctggacg gccgacggcg tcgaatacac ccgcaagccg  840
tacccctccg gagggtccgt ctacgagctg gagatctacc ccgtcgtcag gaacgtggcc  900
gggctcgaac ccggcatgta ccactacgac gggcacgacc acgtgctcag gccggtacgt  960
gaggccggcc atcccgccgt acgccggctg ctgaccgtcg ccgggcacgg cgccgccacc  1020
ggccgccgcc cccaggtcct gctcgcggtc tccagccgcg ccggccggct gctgtggaag  1080
tacgaaggca tggggtacgc gctgacgctc aagcacgtgg gtgtgctcta ccagacgctc  1140
tactgcgtgg ccacggcgat gggcctggcg gcctgcgggc tcggcagcgg cgactcggcc  1200
gcgttcgccg aggcgaccgg gcgggacccg ttggaggagt gcgcggtcgg cgaattcatg  1260
atcggaaccg cggaggcacc acgttga                                      1287
 
<210>45
<211>1893
<212>DNA
<213>野野村氏菌属物种
 
<400>45
ttgaacgact tcaaacccag actccccgcg gacatacgct tcgcgcccac ctccggcggt  60
gtcgccttcc tcacccgcga aggcgtcgtg cggatgaacg gggcctccgt ccacctgtgg  120
gtggagcggc tggccgtgca cctcgacggg agcaggaccg tggccgagct gaccgcggag  180
ctgcccgacg agcggcgggc gttcgtgacg agcctgctga ccacgctgcg cgagcgcggg  240
ctcgtggagg acgcgggaga gcgcggcgtg ctgcccgtgg cggccggcac cgcgtgctcg  300
ctgctggccg acgcggaccg gttcggcgag ctggcgcccg ccctggccga cgccctgcgc  360
aggctggggc tggaggtgct gacagagccg tcgggcgggg cgctcgtgca cgtcgcggcg  420
gccgacgcgg acgggctggc cgccgccggg cgcctcgacc ggctgagcgc cgagcgcggg  480
ctgcccatcg cgcacgtgct gctgcgcgag ggcgaggcgt ggtggagcga gaccggcgtc    540
gtcgggcgcg acgtcccgcc gtgggcggcc gggtggcggc ggctggcggc catggaggcc    600
gtcccgcgta ccgccgggca cgtctccgtg tcgcccgtcg ccgcggccgt ggtcgccggg    660
caggtggtgg cggacctggg gcgctgcctg tccggaacgc cccgcgtgtc cggcggtccg    720
cggctgcacg tggtggacct ggacgggttc gggatgcgga cgcactcctt cctgccgcac    780
ctgtcggcgc tgccgcccgg cacgggggtg agcgcggggc cgctcggcga ggaggagttc    840
tcgcggcggg cggccaggtt gatggactcg cggacggggg tgttcgccga gatcgaggag    900
ggggagtacg ggcagctccc gctgcacgtg tcggtgacca cggtggccga tccgatgggg    960
gccctcgggg gtgcgctggc gcgggtgatc ggcgtggggg cggacttcgc caccgcgcga    1020
taccgggcgg cgcttaaggc actgaccgtg cacgggctgc tcgccctcga cccccgccgc    1080
ctggtcacgg ccgaggggac gcccctgacc ggcgcggggg aacccgccag cggcttcccg    1140
gctgatccgg gcgcgaggga acggccgatc ggtggctttt cggctgatcc gggtgcgggt    1200
gagcggccgg acgacggtct cctggacgac ccgctggtgg gcgacgtcgc ggcgggacgg    1260
gtcgaggcgt tcgtgcgcgg ccgtgacctc gtcgagggcg gtgaggtgct gctgcccgcc    1320
cgcgcggtgt tcctggatcc gcacgccacc ggggccgccg cggggtactc ggccgaggag    1380
gcgctggtcg cggggttact ggaccactgt gcggcactgg ccgggctcga cgggacgctg    1440
ccgcccgtgg acgtgggcgg cgcgcgggcg gccgacgacg agaccgcgcg gtcggcggcg    1500
ctgctggacg cgatcgggct gccgtaccag gtgctggacg ccaccggccc gtcgggcgtg    1560
cccgtgcacg cggggacgct cggcgggcgg ctggtggcgc gggcggcggg cgtcacgccc    1620
ctggccgcgc tgcgggccac gctcgaaggg atcctggccg cgtaccaggg cattccgggc    1680
cccgcacccc tgcccgacct gtgcccggcc gtcgcgcagg agccgccggt cgtcctcgac    1740
acgggggcgg ccgtgctcgg cgccggtgag ctcgccgccg ccctggccgg cgccgggctg    1800
cgggtcagcg ccgttccgct ggatcacgac cgggaggtac acgcgctcat gccgcacgtc    1860
gtccgcgtcg tcacggagcc gctccatggc tga                                 1893
 
<210>46
<211>1833
<212>DNA
<213>野野村氏菌属物种
 
<400>46
gtggggacgg gcctgctggc cgaggagatc acgatcgcgc tgaaggaccg cgacgggcgg    60
gcagaggtga cgatcaccgc ctgcgacggc tgggcgcgcg gcccccggcg cgacggggcg    120
gcgtggttgc ccgtgcgggt cgagtacggg gtcgccgtca tcgggccgct ggaacgcccc    180
ggcgaacccg gctgcgtgac ctgcttcgag acccgccggg accgggtcag gaccgacagc    240
gccgatcggg ccgccgtcct ggccgtccac ggccccgaac tcgccgggcg ggcctccccg    300
tacctcggcc gcctggccgc ccgcacgatc gcggccctgg ccgcgcacgc cgccgagggc    360
cccggatgcg ccgtctggta cgtcgacctg cgcacgctca ccgccgaacg ccacacgttc    420
ctgccggaac cccactgccc cgactgcggc gacctgccgg acgacgaccg cgcgtccgcc    480
gccttcgagc ccggcgccgc cccgcgacct cccggctacc gggtcaggaa cgtgccggcc    540
gagcacggcg cgctgctcga cacgtacgtg gacggcgaat gcgggctgat caggcccctc    600
gtccgggaca cgctcggcgg cctggtgatc gccggggcga tgctgccgct gcggttcgag    660
ggcggttcgg agcccggcgt gggccgcacc cgcggctacc gggccagcga ggtcaccgcc    720
gtgctcgaag cgctcgaacg gtggggcggc gtcgagcccg gcggcaagcg cacccgcgtg    780
cgggcctcgt acgcggaggt ggccgcggac gcgctcgacc ctcgaacgct gggcgagcac    840
gacacctcct cctacgagat ggaggggttc gcgttccggc cgttcgccga ggacgccgtc    900
tgcgactggg tgtgggggta ctccttcgcc cggcgctcgc cgatcctcgt gccggagagc    960
ctggcctatt actacgtacg ggggcgggag cggccgttcc tcttcgagat ctcgaacggg    1020
tgcgcgctcg gcggcagcat ggcggaggcc ctgctctacg ggctgctgga gacggtcgag    1080
cgggacgcct ttctcatgac ctggtacggg cggctcccgg tgccgcggat cgaccccggc    1140
acggcacggg accgcaccat cccgctccag gccgccgcga tcatcgcgga gaccggttat    1200
cgggtggagc tgtacgacac gacgatggag cacggcatcc ccagcgtgtg ggcgatgggc    1260
gtgcggcagg acggcgatcc gggcaggccg cgcctggtgt gcgccgccgg ggcccacctg    1320
gtgccggaga aggccgtgct cagcgcgctg agcgagctgg ggccgctgct ggccgacctg    1380
atccggcggt atccggacga ggtgcaccga gcccaggaga tggtgacaaa tcctgatctg    1440
gtggcgacga tgcacgacca ctccaccctg tacggcgccg acgcggcctt cgaccggctc    1500
tcgttcctga ccggcggcac gggcgtgcgg gggctgcccg acatggaggc gttcaccgtg  1560
cccggtgatc tcgacgtcat gagggtggtg gaccgcttcc tcgccgaggg gatggacgtc  1620
gtcgtcatcg accagaccac gccggagcat cgggcccgcg gtttctcctg cgtcaaggtg  1680
ctggtgcccg gcacgctccc gatgaccttc ggccaccgca accgcagggt gcggggcctg  1740
acccgcccgc tggagctgcc gtaccggctc ggccaccgcg acacgcccct gacccccgcc  1800
gacctgaacc ccgacccaca ccccttccca tga                               1833
 
<210>47
<211>237
<212>PRT    
<213>野野村氏菌属物种
 
<400>47
 
Val Thr Ala Arg Arg Arg Asp Val Glu Arg Val Asp Arg Ile Val Asp
1               5                   10                  15
Ala Ala Ala Glu Leu Leu Pro Glu Arg Gly Tyr Arg Arg Leu Thr Val
            20                  25                  30
Glu Glu Val Ala Ser Arg Ala Gly Val Ser Lys Ser Ser Val Tyr Leu
        35                  40                  45
His Trp Asn Thr Lys Asp Glu Ile Phe Tyr Ala Val Leu Asp Arg Glu
    50                  55                  60
Phe Thr Val Leu Ala Gln Ala Ala Val Asp Arg Val Arg Arg Asp Pro
65                  70                  75                  80
Ala Glu Val Leu Ala His Arg Thr Ala Ala Asn Leu Phe Gln Ile Val
                85                  90                  95
Ala Cys Arg Pro Leu Leu Gln Ala Leu Leu Val Asp Asp Arg Thr Thr
            100                 105                 110
Leu Gly Ser Leu Gln Pro Ala Lys Ser Ala Val Phe Arg Ala Ser Leu
        115                 120                 125
Ala Asn Leu Asn Glu Leu Met Tyr Arg Tyr Leu His Ala Leu Arg Ile
    130                 135                 140
Asn Gly Leu Leu Cys Pro Glu Val Asp Pro Arg Ile Met Arg Lys Ala
145                 150                 155                 160
Ile Ser Glu Met Leu Arg Gly Met Thr Phe Ser Ala Gly Ala Lys Pro
                165                 170                 175
Leu Ala Glu Thr Arg Leu Ala Lys Leu Ser Gln Val Val Ala Val Thr
            180                 185                 190
Val Gln Arg Ala Phe Glu Pro Gly Asp Val Pro Glu Leu Asp Arg Ile
        195                 200                 205
Asn Ala Ala Ala Ala Glu Val Phe Lys Ala Phe Asp Glu Leu Met Pro
    210                 215                 220
Ala Glu Glu Thr Met Arg Ala Glu Arg Pro Val Ala Leu
225                 230                 235
 
<210>48
<211>633
<212>PRT    
<213>野野村氏菌属物种
 
<400>48
 
Val Thr Val Val Arg Ala His Val Arg Gln Glu Pro Ala Ala Leu Val
1               5                   10                  15
Val Gly Arg Gly Leu Leu Ala Asp Arg Leu Ala Ala Val Thr Gly Arg
            20                  25                  30
Leu Asp Pro Gly Val Val Leu Ala Val Ser Asp Ala Pro Asp Pro Ala
        35                  40                  45
Val Leu Ala Glu Ala Arg Ala Thr Gly Arg Pro Val Leu Pro Val Leu
    50                  55                  60
Ala Glu Pro Gly Arg Val Arg Val Gly Pro Leu Glu Arg Pro Gly Glu
65                  70                  75                  80
Pro Gly Cys Ser Asp Cys Leu Ser Leu Arg Arg His Arg Ala Ala Ser
                85                  90                  95
Arg Ser Ala Glu Arg Ala Ala Ala Trp Leu Arg His Gly Pro Asp Leu
            100                 105                 110
Ala Ala Thr Pro Ser Pro Leu Leu Ala Pro Val Ala Leu Asp Leu Val
        115                 120                 125
Ala Glu Leu Val Thr Ala Leu Val Thr Ala Pro Ala Pro Ala His Arg
    130                 135                 140
Gly Ile Leu Leu Ala Asp Leu Ser Asp Leu Ser Val Thr Pro His Ala
145                 150                 155                 160
Phe Leu Pro Asp Pro Phe Cys Pro Arg Cys Gly Thr Leu Pro Asp Asp
               165                 170                 175
Asp Pro Ala Arg Ala Arg Ile Thr Leu Val Pro Arg Pro Lys Pro Ser
            180                 185                 190
Pro Asp Arg His Arg Val Trp Asp Ala Glu Gly Arg Leu Asp Arg Leu
        195                 200                 205
Arg Gln Ile Tyr Val Asp Asp His Cys Gly Leu Val His Ser Leu Asn
    210                 215                 220
Pro Ala Ala Leu Gly Ser Leu Ala Val Ala Gly Ala Pro Ile Arg Leu
225                 230                 235                 240
Arg Gly Thr Thr Ala Phe Glu Pro Gly Phe Gly Arg Ser Arg Ser Tyr
               245                 250                 255
Arg Arg Ser Ser Val Ile Ala Leu Leu Glu Ala Leu Glu Arg Tyr Gly
            260                 265                 270
Ala Ile Gly Pro Gly Gly Arg Arg Gly Thr Val Arg Ala Ser Tyr Ala
        275                 280                 285
Ser Leu Gly Asn Leu Ala Val Asp Pro Arg Ser Leu Gly Leu His Pro
    290                 295                 300
Pro Glu His Tyr Ala Leu Pro Gly Phe Pro Tyr Arg Pro Phe Thr Pro
305                 310                 315                 320
Glu Ala Val Cys Arg Trp Leu Trp Gly His Ser Phe Ala Thr Gly Gly
                325                 330                 335
Pro Val Leu Val Pro Glu Arg Asn Val His Tyr Gly Pro Ser Asp Asp
            340                 345                 350
Asp Arg Pro Phe Cys Tyr Glu Leu Ala Asn Gly Cys Ala Leu Gly Ser
        355                 360                 365
Cys Leu Glu Glu Ala ValPhe His Gly Ile Leu Glu Val Leu Glu Arg
    370                 375                 380
Asp Ala Phe Leu Leu Thr Trp Tyr Thr Arg Ala Arg Ala Pro Arg Leu
385                 390                 395                 400
Asp Leu Gly Thr Ala Arg Asp Pro Thr Ile Pro Leu Val Ala Ala Ala
                405                 410                 415
Ile Thr Ala Glu Thr Gly Tyr Leu Val Glu Cys Tyr Asp Ile Thr Pro
            420                 425                 430
Asp His Gly Val Pro Cys Val Trp Ala Leu Ala Arg His Pro Ser Asp
        435                 440                 445
Gly Glu Pro Ala Thr Ile Ser Ala Ala Ala Ala Gly Pro Gly Leu Glu
    450                 455                 460
Pro Ala Ala Ala Gly Ala Leu Ala Glu Leu Gly Pro Met Val Pro Thr
465                 470                 475                 480
Val Arg Asp His Phe Pro Gln His Ala Gly Arg Ala Arg Glu Leu Ala
                485                 490                 495
Ala Asp Gly Arg Arg Val Arg Ser Met Ile Asp His Tyr Leu Val Tyr
            500                 505                 510
Gly Val Arg Ser Ala Ala Arg Arg Leu Ser Phe Leu Thr Asp Gly Thr
        515                 520                 525
Glu Glu Val Pro Phe Ala Pro Ala Pro Asp Gly Phe Arg His Asp Asp
    530                 535                 540
Leu Thr Ala Asp Leu Arg Phe Leu Leu Asp Arg Leu Ala Asp Ser Gly
545                 550                 555                 560
Leu Asp Val Val Val Val Asp Leu Thr Thr Pro Glu His Arg Ala Gly
                565                 570                 575
Gly Leu Arg Cys Val Lys Val Leu Val Pro Gly Thr Val Pro Met Thr
            580                 585                 590
Phe Gly Glu Gln Asn Arg Arg Thr Trp Gly Leu Pro Arg Leu Leu Asp
        595                 600                 605
Pro Ala Val Val Arg Gly Arg Gly Met Pro Val Arg Gly His Ala Asp
    610                 615                 620
Leu Asn Pro Asp Pro His Pro Phe Pro
625                 630
<210>49
<211>829
<212>PRT
<213>野野村氏菌属物种
<400>49
Val Ser Arg His Ala Pro Pro Ala Val Ala Arg Val Gly Gly Leu Pro
1               5                   10                  15
Ala Ala Ala Leu His Gly Val Ala Cys Pro Glu Ala Thr Arg Leu Ala
            20                  25                  30
Gly Arg Val Val His Leu Thr Glu Glu Leu Thr Arg Arg Ala Ala Val
        35                  40                  45
Leu Ser Asp Ala Leu Tyr Glu Val Ile Gly Ala Ala Gly Ala His Lys
    50                  55                  60
Pro Ile Leu Val Ala Ile Arg Arg Asp Leu His Gly Leu Arg Arg Pro
65                  70                  75                  80
Lys Arg Val Glu Val Leu Pro Ala Pro Leu Ala Glu Pro Val Arg Thr
                85                  90                  95
Trp Ile Ser Leu Trp Glu Glu Arg Ala Arg Val His Ala Val Leu Pro
            100                 105                 110
Asp Val Leu Ala Arg Glu Glu Arg Leu Ala Trp Glu Ala Leu Arg Glu
        115                 120                 125
Leu Ala Ala Thr Pro Ala Val Arg His Gly Leu Ala His Ala Ser Pro
    130                 135                 140
Asp Leu Ser Ala Asp Leu Glu Lys Trp Leu Ala Asp Thr Gly Trp Arg
145                 150                 155                 160
Pro Arg Pro Ser Thr Leu Ala Ser Leu Leu Arg Tyr Val Lys Arg Val
                165                 170                 175
Ala Ala Lys Thr Ser Pro Phe Ser Thr Phe Thr Thr Val His Glu Val
            180                 185                 190
Arg Trp Val Asp Gly Gly Ala Ala Trp Gln Val Pro Asp Thr Ala Pro
        195                 200                 205
Thr Val Val Val Glu Ala Asp Val Gly Leu Arg Leu Leu Val Glu Ser
    210                 215                 220
Val Leu Pro Arg Met Pro Glu Val Ala Ala Ala Arg Val Val Arg Leu
225                 230                 235                 240
Ser Pro Ala Ala Tyr Ala Ser Gly Asp Arg Leu Ala Phe Pro Glu Pro
                245                 250                 255
Gly Gly Arg Met Arg Ala Val Asp Arg Thr Ser Ala Leu Asp Thr Leu
            260                 265                 270
Val Glu Leu Leu Arg Ala Glu Gln Arg Trp Asp Ala Ala Ile Ala Lys
        275                 280                 285
Leu Thr Gly Ala Gly Leu Ala Gly His Gly Ala Glu Asp Gly Thr Arg
    290                 295                 300
Asp Ser Ala Ser Asp Gly Thr Ala Ala Ala Glu Gln Val Leu Ser Gly
305                 310                 315                 320
Leu Val Arg Gly Gly Leu Val Glu Ala Val Val Pro Val Pro Gly Gln
                325                 330                 335
Ala Ala Arg Pro Phe Ala Arg Leu Ala Asp Trp Ala Ala Pro Ala Ala
            340                 345                 350
Pro Ala Gly Pro Leu His Arg Ile Gln Val Ala Leu Asp Gln Ala Gly
        355                 360                 365
Pro Leu Gly Asp Gly Asp Pro Leu Ala Ser Ala Cys Ala His Val Ala
    370                 375                 380
Arg Arg Leu Thr Ala Glu Leu Pro Ala Leu Gly Leu Pro Val Met Pro
385                 390                 395                 400
Val Pro Asp Leu Arg Arg Arg Val Leu Arg Glu Ser Ala Leu Gly Ala
                405                 410                 415
Pro Val Ala Cys Ala Leu Arg Glu Trp Arg Pro Val Leu Ala Asp Leu
            420                 425                 430
Gln Arg Val Arg Arg Trp Leu Ala Val His Asp Pro Met Leu Pro Leu
        435                 440                 445
Arg Leu Thr Leu Ala Asp Arg Val Arg Asp Trp Phe Gly Pro Gly Ser
    450                 455                 460
Ala Ala Pro Leu Leu Asp Val Tyr Ala Arg Val Arg Thr Ala Glu Pro
465                 470                 475                 480
Gly Thr Pro Leu Asp Pro Asp Phe Leu Glu His Pro Asp Pro Leu Ala
                485                 490                 495
Gly Val Thr Asp Pro Arg Leu Thr Arg Leu Arg Glu Leu Arg Ala Ala
            500                 505                 510
Ser Val Ala Ala Leu Thr Gly Gly Arg Ala Glu Glu Ala Leu Ser Glu
        515                 520                 525
Pro Pro Ala Trp Val Arg Asp Pro Gly Pro Val Thr Cys Tyr Val Gln
    530                 535                 540
Pro Phe Gln Gly Glu Asp Gly Leu Arg Leu Val Leu Asn Ala Ala His
545                 550                 555                 560
Gly Gly His Gly Arg Gly Ile Thr Arg Trp Thr Arg Leu Leu Gly Ala
                565                 570                 575
Glu Pro Pro Pro Gly Glu Pro Pro Ala Ala Glu Ser Pro Pro Gly Glu
            580                 585                 590
Ser Pro Pro Gly Glu Leu Pro Pro Gly Ala Cys Leu Val Ala Glu Leu
        595                 600                 605
Pro Gly Thr Phe Gly His Ser Leu Asn Leu His Ala Pro Ala Thr Gly
    610                 615                 620
Trp Glu Leu Thr Tyr Pro Gly Ala Val Asn Gln Ala Pro Pro Glu Arg
625                 630                 635                 640
Arg Val Pro Leu Ala Glu Leu Gln Val Arg His Asp Ala Gly Arg Gly
                645                 650                 655
Val Val Glu Leu Trp Trp Pro Arg Ala Gly Arg Arg Val Val Pro Val
            660                 665                 670
His Ala Gly Met Met Ser Glu Thr Leu Leu Pro Pro Leu Ala Arg Leu
        675                 680                 685
Leu Val Glu Ala Phe Gly Thr Thr His Leu Thr His Pro Thr Leu Pro
    690                 695                 700
Pro Val Val Arg Ala Ala Gly Pro Arg Ile Asp Leu Gly Arg Val Thr
705                 710                 715                 720
Leu Ala Arg Ala Gln Trp Thr Ala Arg Arg Glu Glu Ile Pro Arg Arg
                725                 730                 735
Gly Gly Asp Asp Ala Ala His Leu Val Ala Val His Ala Trp Leu Arg
            740                 745                 750
Ala Ala Gly Ile Pro Arg Arg Cys Phe Val Arg Val Arg Glu Pro Gln
        755                 760                 765
Val Arg Arg Asp Arg Leu Ala Phe Asp Lys Arg His Lys Pro Val Phe
    770                 775                 780
Val Asp Phe Gly Ser Trp Pro Ser Val Leu Glu Phe Asp Arg lle Val
785                 790                 795                 800
Thr Arg Ala Thr Gly Asp Leu Glu Leu Thr Glu Ala Leu Pro Asp Gly
                805                 810                 815
Glu Arg Ala Val Glu Leu Ala Ile Glu Ile Gly Ala Arg
            820                 825
 
<210>50
<211>344
<212>PRT
<213>野野村氏菌属物种
 
<400>50
Val Thr Arg Tyr Pro Leu Pro Arg Pro His Pro Leu Gly Ile His Pro
1               5                   10                  15
Gly Tyr Ala Arg Leu Arg Glu Gly Cys Pro Val Ala Arg Val Asp Ser
            20                  25                  30
Pro Tyr Gly Pro Ala Trp Leu Ile Thr Arg Tyr Ala Asp Val Ala Ala
        35                  40                  45
Val Leu Thr Asp Ala Arg Tyr Ser Arg Ala Ala Ala Thr Glu Asp Asp
    50                  55                  60
Gly Gly Ile Leu Leu Asn Thr Asp Pro Pro Glu His Asp Arg Leu Arg
65                  70                  75                  80
Arg Leu Val Val Ala His Thr Gly Ala Ala Ala Val Glu Arg Leu Arg
                85                  90                  95
Pro Arg Ala Glu Glu Ile Ala Thr Thr Leu Ala Lys Arg Ile Pro Ala
            100                 105                 110
Glu Ala Glu Phe Val Ser Ala Phe Ala Glu Pro Tyr Ser His Arg Val
        115                 120                 125
Leu Ala Leu Phe Val Gly His Leu Val Gly Leu Pro Ala Gly Glu Leu
    130                 135                 140
Ser Pro Met Ala Thr Val Leu Thr Leu Ala Arg Val Pro Asp Arg Glu
145                 150                 155                 160
Arg Ala Ala Ala Phe Ala Glu Leu Arg Arg Arg Leu Arg Ser Gln Val
                165                 170                 175
Asp Asp Glu Thr Leu Ala Val Val Leu Asn Ile Val Phe Gly Gly His
            180                 185                 190
Ala Ala Val Val Ala Ala Leu Gly Tyr Cys Leu Leu Ala Ala Leu Ala
        195                 200                 205
Glu Pro Leu Pro Ser Leu Thr Gly Asp Val Arg Arg Ile Ala Glu Leu
    210                 215                 220
Val Glu Glu Thr Leu Arg Leu Ala Pro Pro Gly Asp Arg Thr Leu Leu
225                 230                 235                 240
Arg Arg Thr Leu Glu Pro Val Glu Leu Gly Gly Arg Glu Leu Pro Ala
                245                 250                 255
Gly Ala Leu Val Ile Pro Ser Ile Ala Ala Ala Gly Arg Asp Pro Asp
            260                 265                 270
Arg Pro Thr Gly Gly Pro Ala Gly Arg His Leu Ala Phe Gly Arg Gly
        275                 280                 285
Pro His Ala Cys Leu Gly Met Ala Leu Ala Arg Met Glu Leu Arg Val
    290                 295                 300
Ala Leu Gln Ala Leu Ala Glu His Val Pro Gly Leu Arg Pro Ala Val
305                 310                 315                 320
Ser Pro Ala Thr Leu Arg Arg Thr Cys Glu Glu Leu Ala Val Ser Pro
                325                 330                 335
Leu Ala Gly Ile Pro Ile Arg Val
            340
 
<210>51
<211>228
<212>PRT
<213>野野村氏菌属物种
 
<400>51
 
Met Val His Ala Phe Gly Val Arg Asn Arg Gly Arg Ile Val Ser Ala
1               5                   10                  15
Glu His His Tyr Arg Asp Arg Leu Arg Ala Leu Ser Ala Tyr Leu Arg
            20                  25                  30
Lys Val Asp Asn Glu Pro Glu Ala Ala Ala Glu Leu Arg Ala Asp Pro
        35                  40                  45
Glu Lys Ala Leu Arg Glu Ala Gly Val Asp Gln Ala Phe Asp Arg Pro
    50                  55                  60
Glu Ala Phe Arg Ala Phe Val Gly Lys Leu Ala Val Leu Ser Gly Glu
65                  70                  75                  80
Ala Trp Leu Ala Thr Val His Ser Met Ile Glu Leu Cys Glu Ile Gly
                85                  90                  95
Ala Asp Pro Gln Pro Pro Ala Gly Pro Asn Ile Ser Phe Arg Ile Ser
            100                 105                 110
Ser Asp Gly Gly Val Thr Ala lle Ala Asn Arg Gly Glu Ile Ala Lys
        115                 120                 125
Lys Val Gln Pro Asn Pro Phe His Ala Gly Ser Ala Ala Ala Ser Pro
    130                 135                 140
Gly Gly Arg Leu Arg Ile Tyr Pro Gly Tyr Ala Thr Ser Glu Leu Ser
145                 150                 155                 160
Ala Arg Leu Gly Glu Arg Tyr Leu Ser Thr Phe Tyr Gln Arg Thr Leu
                165                 170                 175
Leu Lys Arg Val Val Leu Asp Pro Gly Thr Val Val Glu Asp Ala Asp
            180                 185                 190
Ala Gly Glu Gly Ile Thr Val Asn Arg Ser Gln Tyr Arg Gly Val Gly
        195                 200                 205
Phe Glu Leu His Thr Arg Ala Asp Gly Ala Asp Arg Glu Ile Val Ala
    210                 215                 220
Ala Leu Val Arg
225
 
<210>52
<211>372
<212>PRT
<213>野野村氏菌属物种
 
<400>52
Met Leu Ser Ser Ala Leu Glu Val Asp Ile Asp Glu Ala Ala Val Ala
1               5                   10                  15
Ala Asp Leu Arg Glu Leu Ala Ala Ala Leu Asp Arg Ser Gly Tyr Gly
            20                  25                  30
Glu Ile Leu Thr Cys Phe Leu Pro His Lys Ala Gln Ala His Ile Trp
        35                  40                  45
Ala Gln Thr Ala Ala Lys Ile Asp Gly Pro Leu Arg Thr Leu Met Glu
    50                  55                  60
Leu Phe Leu Leu Gly Arg Ala Val Pro Gln Asp Asp Leu Pro Ala Arg
65                  70                  75                  80
Val Gly Asp Leu Ile Pro Gly Leu Ala Ala Thr Gly Leu Val Gln Thr
                85                  90                  95
Gly Gln Gly Ala Val Trp Leu Pro Asn Leu Ile Leu Leu Arg Pro Met
            100                 105                 110
Gly Gln Trp Leu Trp Cys Gln Arg Pro His Pro Ser Pro Thr Met Tyr
        115                 120                 125
Phe Gly Asp Asp Ser Leu Ala Leu Val His Arg Met Val Thr His Arg
    130                 135                 140
Gly Gly His Thr Leu Asp Leu Cys Ala Gly Pro Gly Val Gln Ala Leu
145                 150                 155                 160
Thr Ala Ser Leu Arg Ser Asp Arg Val Thr Ala Val Glu Ile Asn Pro
                165                 170                 175
Val Ala Ala Ala Leu Cys Arg Thr Asn Ile Ala Met Asn Gly Leu Gly
            180                 185                 190
Asp Arg Met Glu Val Arg Leu Gly Asp Leu Tyr Gly Ala Val Pro Gly
        195                 200                 205
Glu Val Phe Asp Asp Ile Val Ser Asn Pro Pro Leu Leu Pro Val Pro
    210                 215                 220
Glu Asp Val Gln Phe Ala Phe Val Gly Asp Gly Gly Arg Asp Gly Phe
225                 230                 235                 240
Asp Ile Ser Trp Thr Ile Leu Asp Gly Leu Pro Glu His Leu Ser Asp
                245                 250                 255
Arg Gly Ala Cys Arg Ile Val Gly Cys Val Leu Ser Asp Gly Tyr Val
            260                 265                 270
Pro Val Val Met Asp Gly Leu Gly Lys Trp Ala Val Glu His Asp Phe
        275                 280                 285
Asp Val Leu Leu Thr Val Thr Ala His Val Glu Ala His Arg Asp Ser
    290                 295                 300
Ser Phe Leu Arg Ser Met Ser Leu Met Ser Ser Ala Ile Ser Gly Glu
305                 310                 315                 320
Pro Ala Asp Val Leu Gln Glu Arg Tyr Ala Ala Asp Tyr Ala Glu Leu
                325                 330                 335
Gly Gly Ser His Val Ala Phe Tyr Glu Leu Cys Ala Arg Arg Gly Gly
            340                 345                 350
Gly Thr Ala Arg Leu Ala Asp Val Ser Ala Thr Lys Arg Ser Ala Glu
        355                 360                 365
Val Trp Phe Val
    370
 
<210>53
<211>122
<212>PRT
<213>野野村氏菌属物种
 
<400>53
 
Val Tyr Val Val Ile Val Ala Phe Asp Leu Lys Glu Ser Ser Val Asp
1               5                   10                  15
Phe Ala Glu Leu Arg Ala Trp Val Arg Asp Arg Ala Ala Asp Asp Tyr
            20                  25                  30
Ser Arg Leu Pro Gly Met Arg Phe Lys Thr Trp Phe Ser Asp Glu Arg
        35                  40                  45
Lys Arg Leu Trp Gly Ala Val Tyr Leu Val Glu Ser Met Leu Ser Phe
    50                  55                  60
Asp Arg Asp Asn Leu Pro Leu Leu Pro Asp Gly Arg Thr Gly Pro Val
65                  70                  75                  80
Gly Thr Arg Pro Thr Ser Val Met Val Leu Glu Leu Glu Ala Phe Val
                85                  90                  95
Thr Gly Pro Asp Gly Leu Asp Gly Ile Glu Ala Leu Ala Arg Gln Gly
            100                 105                 110
Leu Ser Met Thr Gly Gly Gly His Asp His
        115                 120
 
<210>54
<211>416
<212>PRT
<213>野野村氏菌属物种
 
<400>54
 
Met Thr Thr Glu Ala Thr Thr Ala Val Thr Thr Arg Ala Asn Ala Gly
1               5                   10                  15
Ala Leu Ser Leu Pro Ala Arg Gly Thr Asp Arg Pro Leu Leu Leu Tyr
            20                  25                  30
Val Asn Ile Pro Phe Cys Asn Ser Lys Cys His Phe Cys Asp Trp Val
        35                  40                  45
Val Asp Val Pro Val Ser Asp Leu Arg Leu Ala Pro Ala Ala Pro Arg
    50                  55                  60
Arg Val Asp Tyr Leu Ala Ala Leu Cys Thr Gln Ile Arg Thr His Ala
65                  70                  75                  80
Pro Ala Leu Arg Ala Ala Gly Tyr Arg Gly Glu Val Met Tyr Trp Gly
                85                  90                  95
Gly Gly Thr Ala Thr Val Leu Thr Ala Ala Glu Ile Glu Gln Val His
            100                 105                 110
Ala Cys Leu Ala Ala Glu Phe Asp Leu Thr Ala Leu Ala Glu Ala Thr
        115                 120                 125
Ile Glu Gly Ser Pro Glu Ser Val Asp Pro Ala Lys Leu Arg Leu Leu
    130                 135                 140
Arg Asp Leu Gly Phe Asp Arg Val Ser Leu Gly Val Gln Ser Phe Asp
145                 150                 155                 160
Glu Thr Arg Leu Arg Arg Ile Gly Arg Ala His Ser Ala Gly Gln Ala
                165                 170                 175
Val Arg Ser Val Glu Asp Ala His Ala Ala Gly Phe Asp Asn Ile Asn
            180                 185                 190
Ile Asp Leu Ile Val Gly Phe Pro Asp Gln Ser Leu Ala Glu Val Glu
        195                 200                 205
Gln Thr Val Arg Arg Ala Leu Asp Leu Pro Val Asn His Phe Ser Val
    210                 215                 220
Tyr Ser Tyr Arg Ala Thr Glu Gly Thr Val Met Arg Arg Gln Ile Glu
225                 230                 235                 240
Arg Ser Gly Thr Ala Ile Glu Leu Glu His Gln Leu Gln Ser Tyr Arg
                245                 250                 255
Leu Ala Gly Glu Met Leu Ala Ala Ala Gly His Pro Glu Tyr Ala Val
            260                 265                 270
Ser Tyr Phe Gly Ala Pro Arg Cys Leu Ala Asp Glu Ala Tyr Tyr Arg
        275                 280                 285
Leu Ser Met Asp Trp Ile Gly Phe Gly Thr Gly Ala Asn Ser Leu Ile
    290                 295                 300
Asn Gln Arg Tyr Leu Leu Asn Gly Arg Gly Arg Met Arg Asp Phe Thr
305                 310                 315                 320
Ser Arg Pro Gly Glu Phe Glu Val Asp Leu Pro Ala Gly Val Pro Ser
                325                 330                 335
Leu Thr Val Gln Trp Leu Pro Arg Ala Leu Gly Thr Ala Glu Gly Ile
            340                 345                 350
Asp Ala Ala Thr Phe Gln Arg Arg Thr Gly Thr Ser Leu Arg Ala Ala
        355                 360                 365
Cys Glu Glu Pro Glu Leu Asn Ala Phe Leu Thr Arg Val Asn Glu Phe
    370                 375                 380
Gly Arg Leu Val Val Asp Arg Asp Gly Ile Arg Leu Ala Asp Glu Asn
385                 390                 395                 400
Arg Ser Asp Val Leu Ser Arg Thr Phe Ala Ala Met Gly Trp Val Ser
                405                 410                 415
 
<210>55
<211>339
<212>PRT
<213>野野村氏菌属物种
 
<400>55
 
Val Glu Ala Met Arg Thr Leu Leu Ala Ala Ala Asp Leu Val Thr Pro
1               5                   10                  15
Met Ala Leu Arg Val Ser Ala Thr Leu Arg Leu Ala Asp His Leu Ala
            20                  25                  30
Ala Gly Thr Thr Gly Ala Ala Glu Leu Ala Ala Ala Ala Gly Val Asp
        35                  40                  45
Glu Ala Ala Leu Thr Arg Leu Leu Arg Tyr Leu Val Ala Arg Gly Val
    50                  55                  60
Phe Thr Glu Pro Ala Pro Gly Glu Phe Gly Leu Asn Pro Ala Ala Glu
65                  70                  75                  80
Leu Leu Arg Asp Gly Arg Pro Asp Arg Leu Arg Asp Trp Leu Asp Leu
                85                  90                  95
Thr Gly Pro Ile Gly Arg Ala Asp Leu Ala Phe Gly Ser Leu Leu Asp
            100                 105                 110
Val Val Arg Thr Gly Lys Pro Gly Tyr Pro Met Ile Hi s Gly Arg Gly
        115                 120                 125
Phe Trp Asp Asp Leu Ala Ala Glu Pro Ala Leu Ala Thr Ala Tyr Asp
    130                 135                 140
Thr Leu Met Gly Gly Lys Arg Gln Trp Ala Ala Thr Thr Leu Ala Ala
145                 150                 155                 160
Leu Asp Trp Ser Arg Ser Arg His Val Val Asp Val Gly Gly Gly Asn
                165                 170                 175
Gly Thr Leu Leu Ser Cys Leu Leu Ala Ala His Pro His Leu Arg Gly
            180                 185                 190
Thr Val Val Asp Arg Pro Thr Ser Ala Lys Ala Ala Gly Ala Val Leu
        195                 200                 205
Ala Ser Ala Gly Val Ala Asp Arg Gly Glu Phe Arg Ala Gly Asp Phe
    210                 215                 220
Phe Glu Pro Leu Pro Val His Gly Ala Asp Thr Tyr Leu Leu Ser Ser
225                 230                 235                 240
Ile Leu His Asp Trp Asp Asp Ala Ala Ala Thr Ala Ile Leu Arg Arg
                245                 250                 255
Cys Ala Glu Ala Ala Ala Pro Gly Gly Arg Val Leu Leu Cys Glu Leu
            260                 265                 270
Val Ala Met Ala Gly Pro Asp Arg Arg Thr Val Thr His Met Asp Leu
        275                 280                 285
Cys Met Leu Val Tyr Phe Gly Gly Arg Glu Arg Thr Ala Ala Asp Phe
    290                 295                 300
Ala Ala Leu Ala Gly Ala Ala Gly Leu Glu Pro Arg Ser Val Thr Pro
305                 310                 315                 320
Leu Pro Pro His Asp Trp Gly Asn Ala Leu Val Glu Tyr Ala Val Pro
                325                 330                 335
Ala Ala Arg
 
<210>56
<211>204
<212>PRT
<213>野野村氏菌属物种
 
<400>56
 
Met Ala Lys Val Ile Ser Thr Leu Phe Ile Ser Ala Asp Gly Val Ala
1               5                   10                  15
Glu Ile Asp Pro Asp Trp His Phe Pro Tyr Phe Asp Glu Asn Met Gly
            20                  25                  30
Arg Ala Val Gly Glu Asp Tyr Asp Thr Ala Asp Val Leu Leu Ile Gly
        35                  40                  45
Arg Glu Thr Phe Asp Ser Phe Ala Gly Ala Trp Pro Asp Arg Glu Ala
    50                  55                  60
Ala Gly Gly Asp Asp Ala Pro Phe Ala Lys Gln Leu Gly Asp Met Arg
65                  70                  75                  80
Lys Val Val Val Ser Arg Gln Pro Leu Glu Phe Ser Trp Arg Asn Cys
                85                  90                  95
Glu Leu Ile Thr Gly Asp Leu Leu Asp Ala Val Thr Ser Leu Lys Ala
            100                 105                 110
Asp Ala Gly Ile Arg Gly Ile Leu Ile Pro Gly Ser Ile Ser Val Val
        115                 120                 125
Gln Gln Leu Leu Ala Ala Gly Leu Val Asp Glu Leu Arg Leu Leu Val
    130                 135                 140
His Pro Val Ala Ala Arg Lys Gly Arg Arg Leu Phe Asp Asp Gly Asp
145                 150                 155                 160
Ala Pro Tyr His Leu Ser Val Thr Ala Thr Glu Thr Phe Pro Thr Gly
                165                 170                 175
Val Ile Arg Val Ile Tyr Ser Pro Thr Glu Ala Pro Thr Lys Val Gly
            180                 185                 190
Tyr Asp Glu Val Glu Ala Gln Val Ser Thr Gly Glu
        195                 200
 
<210>57
<211>403
<212>PRT
<213>野野村氏菌属物种
 
<400>57
 
Met Thr Lys Pro Leu Leu Ile Tyr Ala Asn Val Pro Phe Cys Asn Ser
1               5                   10                  15
Lys Cys His Phe Cys Asp Trp Val Val Gln Val Pro Val Arg Asp Leu
            20                  25                  30
Arg Leu Gly Glu Gln Ser Pro Gly Arg Val Ala Tyr Leu Glu Ala Ile
        35                  40                  45
Arg Thr Gln Ile Arg Val Gln Ala Pro Ala Leu Arg Glu His Tyr His
    50                  55                  60
Pro Asp Ile Val Tyr Trp Gly Gly Gly Thr Ala Ser Ile Leu Gly Pro
65                  70                  75                  80
His Glu Ile Glu Ser Leu Tyr Gly Thr Leu Ser Ala Glu Phe Asp Leu
                85                  90                  95
Ser Thr Val Arg Glu Ala Thr Ile Glu Gly Ser Pro Glu Ser Leu Asp
            100                 105                 110
Arg Asp Lys Leu Arg Leu Leu Arg Glu Leu Gly Phe Asn Arg Ile Ser
        115                 120                 125
Ile Gly Val Gln Ser Phe Asp Asp Ala Arg Leu Arg Arg Leu Gly Arg
    130                 135                 140
Ala His Ala Ala Asp Gln Ala Leu Thr Ala Val Gln Asp Ala His Glu
145                 150                 155                 160
Ala Gly Phe Thr Asn Ile Asn Ile Asp Leu Ile Val Gly Phe Pro Gly
                165                 170                 175
Gln Thr Gly Gln Glu Val Ala Asp Ser Val Arg Thr Ala Leu Thr Leu
            180                 185                 190
Pro Ile Asn His Phe Ser Ile Tyr Pro Tyr Arg Ala Ser Pro Gly Thr
        195                 200                 205
Val Leu Arg Lys Gln Val His Arg Gly Ala Gln Leu Asp Leu Asn Leu
    210                 215                 220
Gln Leu Gln Ala Tyr Gly Ile Ala Arg Glu Leu Leu Glu Ala Ala Gly
225                 230                 235                 240
Phe Pro Glu Tyr Ala Met Ser Tyr Phe Gly His Pro Arg Cys Gln Ser
                245                 250                 255
Asp Glu Ala Tyr Tyr Gln Leu Arg Met Asp Trp Ile Gly Phe Gly Ser
            260                 265                 270
Gly Ala Asn Ser Leu Ile Gly Arg Arg Tyr Leu Ser Tyr Glu Lys Gly
        275                 280                 285
Lys Leu Ala His Tyr Asn Thr Asn Pro Leu Ala Phe Asp Ile Asn Ala
    290                 295                 300
Pro Ala His Ser Pro Gln Leu Thr Leu His Phe Leu Ser Gln Ala Leu
305                 310                 315                 320
Thr Thr Ala Glu Gly Leu Asp Ala Arg Leu Tyr Gln Gln Arg Thr Gly
                325                 330                 335
Val Pro Leu Arg Thr Ala Cys Ser His Pro Glu Val Met Thr Tyr Leu
            340                 345                 350
Glu Arg Met Asn Asn His Gly Arg Leu Ile Ala Asp His Asn Gly Ile
        355                 360                 365
Arg Leu His Arg Asp Asp Ile Ala Gln Thr Phe Ile Ala Leu Asn Trp
    370                 375                 380
Ile Pro Thr Pro Asp Thr Thr Pro Asn Glu Val Ile Pro Leu Thr Pro
385                 390                 395                 400
Ser Pro Thr
<210>58
<211>387
<212>PRT
<213>野野村氏菌属物种
 
<400>58
 
Met Thr Ala Pro Val Arg Pro Pro Ser Val Thr Asp Gly Gly Thr Ser
1               5                   10                  15
Leu Phe Ala Trp Leu Arg Glu Met Arg Asp Thr His Pro Val Trp Arg
            20                  25                  30
Asp Ser Tyr Gly Met Tyr His Val Phe Arg Tyr Asp Asp Val Arg Ala
        35                  40                  45
Val Leu Ala Asp His Glu Arg Phe Ser Ser Asp Arg Thr Arg Leu Met
    50                  55                  60
Gly Arg Gln Pro Phe Gly Gln Gly Gly Ile Thr Met Ile Asp Pro Pro
65                  70                  75                  80
Glu His Arg His Gln Arg Arg Leu Ile Thr Ala Ala Phe Thr Pro Ser
                85                  90                  95
Ser Val Ala Ala Leu Glu Pro Arg Ile Ala Ala Ile Ala Asp Glu Leu
            100                 105                 110
Leu Asp Ala Leu Pro Gly Pro Asp Phe Asp Leu Val Glu Ser Leu Ala
        115                 120                 125
Tyr Pro Leu Pro Val Thr Val Val Ala Glu Leu Leu Gly Val Pro Pro
    130                 135                 140
Ser Asp Arg Asp Leu Phe Arg Thr Trp Ser Asp Arg Leu Met Ser Leu
145                 150                 155                 160
Gln Val Pro Asp Phe Ala Asp Pro Ser Leu Ala Gly Arg Val Ala Ala
                165                 170                 175
Ala Met Ala Glu Met Asn Asp Tyr Leu Arg Glu His Cys Ala Asp Arg
            180                 185                 190
Arg Thr Arg Pro Arg Asp Asp Leu Leu Thr Arg Leu Val His Ala Glu
        195                 200                 205
Ile Asp Gly Glu Arg Leu Asp Ala Glu Gln Val Val Asn Thr Ala Ser
    210                 215                 220
Leu Leu Leu Leu Ala Gly His Val Thr Thr Thr Val Leu Ile Gly Asn
225                 230                 235                 240
Thr Val Leu Cys Leu Ala Asp Ala Pro Glu Ala Ala His Arg Thr Arg
                245                 250                 255
Ala Asp Met Ser Leu Ile Pro Gln Ala Leu Glu Glu Ser Met Arg Leu
            260                 265                 270
Arg Ser Pro Phe Met Gln Ala Gly Arg Val Thr Thr Gln Asp Val Gln
        275                 280                 285
Val Ala Gly Glu Thr Ile Pro Ala Asn Arg Phe Val Met Ala Trp Leu
    290                 295                 300
Leu Ser Ala Asn His Asp Glu Arg His Phe Ala Asp Pro Glu Arg Phe
305                 310                 315                 320
Asp Leu Asp Arg Gln Leu Thr Gly Gln Leu Ala Phe Gly His Gly Val
                325                 330                 335
His Phe Cys Leu Gly Ala Gln Leu Gly Arg Leu Glu Gly Arg Ile Ala
            340                 345                 350
Leu Glu Arg Leu Leu Ser Arg Phe Thr Glu Leu Arg Pro Glu Lys Arg
        355                 360                 365
Ser Phe Tyr Glu Ser Gln Ile Phe Gly Val Arg Glu Met His Val Arg
    370                 375                 380
Gly Ser Ser
385
 
<210>59
<211>406
<212>PRT
<213>野野村氏菌属物种
 
<400>59
 
Val Asn Glu Thr His Val Pro Pro Asp Pro Thr Met Thr Met Pro Ile
1               5                   10                  15
Asp Ser Arg Pro Arg Ile Lys Asp Gly Gly Gln Thr Leu Leu Lys Trp
            20                  25                  30
Leu Gly Thr Met Arg Asp Glu Gln Pro Val Trp Arg Asp Ala Phe Gly
        35                  40                  45
Ile Phe His Val Phe Arg His Ala Ala Val Gln Arg Val Met Ser Asp
    50                  55                  60
Tyr Ala Ala Phe Ser Ser Asp Ile Asn Arg Leu Arg Pro Gly Gly Asp
65                  70                  75                  80
Pro Phe Ser Ala Gly Ser Leu Met Leu Thr Asp Pro Pro Glu His Arg
                85                  90                  95
Lys Leu Arg Lys Leu Ile Ser Gln Ala Phe Thr Pro Lys Met Ser Ser
            100                 105                 110
Asp Met Val Pro Arg Ile Ala Glu Leu Thr Thr Ala Leu Leu Asp Glu
        115                 120                 125
Ile Asp Glu Asp Glu Phe Asp Leu Val Glu Lys Ile Ala His Pro Leu
    130                 135                 140
Pro Val Met Val Ile Ala Glu Leu Leu Gly Ile Pro Ile His Asp Arg
145                 150                 155                 160
Glu Leu Phe Arg Thr Trp Ala Asp Arg Leu Val Ala Leu His Val Glu
                165                 170                 175
Asp Pro Arg Asp Ile Glu Ile Gly Arg Met Val Gly Gln Ala Met Arg
            180                 185                 190
Glu Met Gly Glu Tyr Val Leu Thr His Val Arg Glu Arg Arg Thr Arg
        195                 200                 205
Pro Gln Asp Asp Leu Val Ser Arg Leu Val Ala Ala Glu Val Asp Gly
    210                 215                 220
Asp Arg Leu Thr Asp Ala Glu Ile Val Asn Ser Ala Cys Leu Leu Leu
225                 230                 235                 240
Leu Ala Gly Gln Ile Thr Ser Thr Met Ala Leu Gly Asn Ala Phe Leu
                245                 250                 255
Cys Phe Arg Asp Ala Pro Gly Val Glu Ser Ala Val Arg Ala Asp Arg
            260                 265                 270
Glu Leu Ile Ala Pro Ala Phe Glu Glu Val Leu Arg Leu Arg Pro Pro
        275                 280                 285
Leu Thr Gln Ala Ala Arg Leu Pro Thr Ala Asp Val Glu Ile Asp Gly
    290                 295                 300
Thr Pro Ile Pro Ala Gly Ser Met Val Ile Asn Trp Leu Leu Ser Ala
305                 310                 315                 320
Asn Tyr Asp Glu Arg Gln Phe Pro Asp Pro Tyr Arg Leu Asp Pro Gly
                325                 330                 335
Arg Gln Pro Asn Arg Gln Tyr Ala Phe Gly His Gly Ile His Phe Cys
            340                 345                 350
Leu Gly Ala Pro Leu Ala Arg Val Glu Gly Lys Val Ala Leu Glu Leu
        355                 360                 365
Val Phe Asp Arg Phe Glu Gln Val Glu Ile Asp Pro Asp Ala Glu Leu
    370                 375                 380
Ser Tyr Tyr Glu Asp Pro Met Phe Gly Val Lys Ser Leu Pro Val Arg
385                 390                 395                 400
Val Lys Arg Ala Pro Arg
                405
 
<210>60
<211>243
<212>PRT
<213>野野村氏菌属物种
 
<400>60
 
Met Ser Thr Val Ser Thr Arg Ser Thr Gly Ala Arg Thr Ser Asp Asp
1               5                   10                  15
Arg Val Arg Arg Thr Leu Asp Val Thr Arg Ser Leu Leu Leu Arg Ser
            20                  25                  30
Gly Tyr Lys Arg Thr Thr Met Asp Glu Ile Ala Arg Arg Ala Asp Ile
        35                  40                  45
Gly Lys Gly Thr Ile Tyr Leu Ser Trp Asp Thr Lys Asp Asp Leu Ile
    50                  55                  60
Arg Thr Leu Val Ile Gln Glu Ile Val Gly Val Cys Gln Asp Ile Ser
65                  70                  75                  80
Arg Ile Ala Val Leu Arg Pro Ala Val Ala Arg Leu Ser Glu Phe Ser
                85                  90                  95
Arg Glu Leu Phe Thr Leu Val Phe Lys Tyr Pro Leu Phe Arg Ala Leu
            100                 105                 110
Tyr Thr Tyr Asp Lys Glu Thr Leu Gly Arg Ala Cys Asp Asp Pro Gln
        115                 120                 125
Leu Gly Phe Gln Cys Tyr Arg Phe Thr Thr Phe Thr Pro Phe Arg Asp
    130                 135                 140
Tyr Leu Arg Met Leu His Glu Ser Gly Met Trp Asp Pro Ser His Gly
145                 150                 155                 160
Phe Ala Leu Asp Ala Leu Leu Ser Gly Phe Ile Lys Leu His Leu His
                165                 170                 175
Ala Glu Ile Ala Gly Ala Lys Pro Asp Leu Ala Ala His Ala Asp Ser
            180                 185                 190
Leu Ala Gly Leu Ile Arg Ser Ser Phe Glu Pro Ala Asp Gln Val Pro
        195                 200                 205
Ala Glu Glu Leu Thr Asp Pro Ala Arg Arg Thr Val Glu Ile Phe Asp
    210                 215                 220
Gly Ala Ala Ala Lys Tyr Arg Ala Lys Leu Ile Pro Gln Pro Leu Ala
225                 230                 235                 240
Ala Ser Val
 
<210>61
<211>444
<212>PRT
<213>野野村氏菌属物种
 
<400>61
 
Met Thr Thr Glu Pro Phe Pro Ala Pro Thr Gly Pro Pro Ala Ala Pro
1               5                   10                  15
Thr Gly Pro Ser Pro Ala Leu Ala Glu Pro Ser Ala Ala Ser Pro Gly
            20                  25                  30
Pro Leu Ser Val Arg Gln Gly Pro Ser Pro Val Thr Ala Glu Leu Arg
        35                  40                  45
Asp Leu Ala Ile Phe Arg Ala Asp Leu His Ala His Pro Glu Leu Ser
    50                  55                  60
Trp Gln Glu Ala Arg Thr Ala Asp Arg Leu Ala Gly Arg Leu Ala Ala
65                  70                  75                  80
Ala Gly Tyr Glu Val Thr Thr Gly Met Gly Gly His Gly Val Val Gly
                85                  90                  95
Arg Leu Cys Arg Gly Asp Gly Val Thr Val Met Leu Arg Ala Glu Leu
            100                 105                 110
Asp Ala Leu Pro Val Lys Glu Glu Thr Gly Leu Ser Tyr Ala Ser Thr
        115                 120                 125
Ala Thr Ala Thr Thr Leu Asp Gly Arg Thr Val Pro Val Ser His Ala
    130                 135                 140
Cys Gly His Asp Leu His Leu Ala Cys Leu Val Gly Ala Ala Arg Arg
145                 150                 155                 160
Leu Ala Ala Cys Asp Asp Trp Arg Gly Thr Val Leu Val Ile Gly Gln
                165                 170                 175
Pro Ala Glu Glu Thr Leu Glu Gly Ala Ala Ala Met Leu Ala Asp Gly
            180                 185                 190
Leu Tyr Glu Arg Phe Gly Val Pro Asp Val Ala Leu Ala Gln His Val
        195                 200                 205
Ser Pro Phe Pro Ala Gly Leu Ile Ala Tyr Pro Glu Pro Pro Thr Ala
    210                 215                 220
Ala Gly Ala Glu Leu Arg Val Val Val Thr Gly Asp Gly Gly His Val
225                 230                 235                 240
Gly AspIle Gly Arg Ala Gly His Val Asp Arg Ala Val Gly Arg Asn
               245                 250                 255
Pro Val Ala Ala Val Ala Ala Leu Val His Arg Leu Asp Gln Thr Ala
            260                 265                 270
Phe Asp Gln Ala Ile Val Thr Val Gly Thr Leu His Ala Gly Glu Arg
        275                 280                 285
Ala Asn Val Ile Pro Thr Leu Ala Glu Ala Gly Ile Thr Val Arg Ala
    290                 295                 300
Ala Thr Glu Glu Ala Val Thr Arg Ala Val Ala Arg Val Ala Arg Leu
305                 310                 315                 320
Ala Glu Glu Thr Ala Gly Ala Gly Val Ile Val Val Ser Arg Val Pro
                325                 330                 335
Pro Gly Val Asn Asp Pro Ala Ala Thr Ala Leu Val Arg Arg Ala His
            340                 345                 350
Glu Ala Ala Leu Gly Ala Val Val Thr Ala Pro Gly Gly Ser Ala Cys
        355                 360                 365
Glu Asp Phe Pro Leu Tyr Gly Val Pro Ser Val Tyr Trp Tyr Val Gly
    370                 375                 380
Ala Ala Pro Pro Ala Gly Leu Val Gly Arg Pro His Thr Gly Thr Phe
385                 390                 395                 400
Arg Pro Asp Pro Val Pro Thr Leu Arg Ala Gly Val Thr Ala Met Gln
                405                 410                 415
Thr Ala Ala Leu Ala Val Leu Ala Asn Ala Ser Gln Phe Ala Pro Pro
            420                 425                 430
Ser Arg Tyr His Gly Pro Gly Ala Val Ala Glu His
        435                 440
 
<210>62
<211>22848
<212>DNA
<213>野野村氏菌属物种
 
<400>62
gtgacggcgc ggcgacgcga cgtcgaacgg gtggatcgga tcgttgacgc ggcagcggaa  60
ctgctgcctg agcggggata tcggcgactg acggtcgagg aggtcgcaag ccgggcgggc  120
gtctccaaaa gcagcgtcta cctgcactgg aacaccaagg acgaaatctt ctacgccgtg  180
ctggaccgcg agttcaccgt gctggcgcag gcggccgtgg accgggtcag gcgcgatcca  240
gccgaggtgc tggcgcaccg gacggcggcc aacctcttcc agatcgtcgc ctgccggcca  300
ctgctacagg cgttactcgt cgacgaccgg acaacgctcg gatcgctgca acccgcgaaa  360
tctgctgttt tccgggccag cctcgcgaat ctcaacgaac tgatgtatcg ctatcttcac  420
gcgctacgca taaacggact tctctgcccc gaggtcgacc cgcgtattat gcggaaagcg  480
atttctgaaa tgctgcgcgg aatgacgttc tccgcgggcg cgaaaccgtt ggccgagaca  540
cggctggcca agttgtccca ggtcgtcgcg gtgaccgtgc agcgcgcctt cgaaccgggc  600
gacgtgcccg aactcgaccg gatcaacgcc gccgcggcgg aggtgttcaa ggcgttcgac  660
gagctcatgc cggccgagga gacgatgcgc gccgaacgcc cggtggcgct gtgaccgtgg  720
tgcgcgcgca cgtccgccag gagccggccg cgctcgtcgt cggtcgcggc ctgctcgccg  780
accggctcgc ggcggtgacc ggccggctag accccggagt ggtgctcgcg gtgtcggacg  840
cgccggaccc cgccgtgctc gcggaggcca gggcgacggg ccggcccgtg ctgcccgtgc  900
tcgccgagcc gggccgggta cgggtcgggc cgctggaacg gccgggcgag ccgggctgct  960
ccgactgcct gagcctgcgc aggcaccgcg ccgccagccg gtcggccgaa cgggccgccg  1020
cctggctccg gcacggcccg gacctggccg ccacgccctc gccgctgctc gcgccggtgg  1080
cgctcgacct ggtggccgag ctggtcaccg cgctggtcac cgcccccgcg ccggcccacc  1140
gtggcatcct gctggccgac ctgtccgacc tgagcgtgac accgcacgcc ttcctgcccg  1200
atccgttctg cccgcgctgc ggcaccctgc ccgacgacga cccggcgcgg gcgcggatca  1260
cgctcgtgcc gcgcccgaaa ccgtcgccgg accggcaccg ggtgtgggac gccgaaggcc  1320
ggctcgaccg gctcaggcag atctacgtcg acgaccactg cggcctggtc cactcgctca    1380
acccggccgc gctgggctcg ctcgccgtcg ccggtgcgcc gatccggctg cgcggcacca    1440
ccgccttcga acccggattc ggccgctccc gcagctaccg ccggagctcc gtcatcgcgc    1500
tgctcgaagc cctggaacgg tacggcgcga tcggtcccgg tggcaggcgc ggcaccgtgc    1560
gcgccagcta cgcctccctc gggaacctgg cggtggatcc caggtcgctg gggttgcacc    1620
cgcccgagca ctacgcgctg ccgggcttcc cctaccggcc gttcaccccg gaagcggtgt    1680
gccgctggct gtgggggcac tcgttcgcca ccggcggccc ggtgctggtg cccgagcgca    1740
acgtccacta cggcccgtcc gacgacgatc ggccgttctg ctacgagctc gccaatggct    1800
gcgctctcgg ctcgtgcctg gaggaggccg tcttccacgg cattctggag gtgctggaac    1860
gcgacgcgtt cctgctgacc tggtacaccc gcgcccgcgc gccgcggctc gacctcggca    1920
ccgcccgcga ccccacgatc ccgctggtcg ccgccgcgat cacggcggag accggctatc    1980
tcgtcgagtg ctacgacatc acgcccgacc acggggtgcc ctgcgtgtgg gcgctggccc    2040
gccatccttc cgacggcgag ccggccacga tcagcgccgc ggcggccggc cccggcctgg    2100
aacccgccgc cgccggcgcg ctggccgagc tcggaccgat ggtgccgacc gtgcgcgacc    2160
acttcccaca gcacgccggc cgggcgcggg agctggccgc ggacggccgg cgggtgcgat    2220
ccatgatcga ccactatctc gtgtacggcg tgcggtcggc ggcacgccgc ttgtcgttcc    2280
tcaccgacgg cacggaggag gtgcccttcg cgcccgcacc ggacggcttc cggcacgacg    2340
acctcaccgc cgacctgagg ttcctcctcg accggctggc ggacagcggg ctcgacgtgg    2400
tcgtggtgga cctgaccacg ccggagcacc gcgcgggcgg gcttcgctgc gtgaaggtgc    2460
tggtgcccgg tacggtgccg atgacgttcg gcgagcagaa ccgccgcacg tggggcctgc    2520
cgaggctgct cgacccggcc gtggtgcggg ggcgcggcat gccggtacgc ggccacgctg    2580
atctgaaccc cgacccccac cccttcccgt gagccgccac gcgccgcccg ccgtcgcccg    2640
ggtgggcggg ctgccggccg ccgcgctgca cggggtggcc tgccccgagg cgacccggct    2700
cgccggccgc gtggtccacc tcaccgagga gctgacccga cgcgccgcgg tgctgtccga    2760
cgctctctac gaggtgatcg gcgccgccgg cgcgcacaag ccgatcctgg tggcgatccg    2820
ccgcgacctg cacgggctgc gccggcccaa acgcgtcgag gtgctgcccg cgccgttggc    2880
cgagccggtc cggacgtgga tctcgctgtg ggaagagcgc gcccgcgtcc acgccgtgct    2940
gccggacgtg ctcgcccgcg aggagcgctt ggcctgggag gcgctgcggg agctcgccgc    3000
gaccccggcg gtgcggcacg ggctcgcgca cgccagcccg gacctctccg ccgacctgga    3060
gaaatggctc gccgatacgg ggtggcggcc gcgaccgagc acgctggcga gcctgctgcg    3120
gtacgtgaag cgcgtggcgg ccaagacgag ccccttcagc acgttcacca ccgtccacga    3180
ggtccgctgg gtggacggcg gcgcggcctg gcaggtgccg gacacggcgc cgaccgtggt    3240
ggtggaggcc gacgtggggc tccggctgct ggtcgagtcc gtgctgccgc gcatgcccga    3300
ggtggccgcc gcgcgggtgg tgcggctgtc gccggccgcg tacgcgtcgg gggaccggct    3360
ggcgttcccg gaaccgggcg ggcggatgcg cgcggtggac cggacctccg cactggacac    3420
cctggtcgag ctgctgcgcg ccgagcagcg gtgggacgcg gcgatcgcca agctcaccgg    3480
tgccggcctg gcaggccacg gagcagagga cggtacgcgt gacagcgcga gcgacggaac    3540
ggcggcggcc gagcaggtgc tgagcgggct ggtgcgcggc gggctggtgg aggccgtcgt    3600
gccggtgccc ggccaggcgg cccgtccgtt cgcgcgcctc gccgactggg cggcgcccgc    3660
tgcgcccgcc ggcccgctgc accgtatcca ggtggccttg gaccaggccg ggccgctcgg    3720
cgacggcgac ccgttggcgt cggcctgcgc ccacgtggcc cgccgcctca ccgccgaact    3780
ccccgccctg ggcctgcccg tcatgccggt gcccgacctg cgccgtcgtg tgctgcgcga    3840
gtcggcgctc ggcgcgccgg tcgcctgcgc gctgcgggag tggcgacccg tgctggccga    3900
cctccaacgg gtccgccgct ggctcgccgt gcacgacccg atgctgccgc ttcgcctcac    3960
cctggccgac cgggtacgcg actggttcgg ccccggctcg gccgcgcccc tgctggacgt    4020
gtacgccagg gtccggaccg ccgaaccggg cacgcccctg gatcccgact tcctcgaaca    4080
ccccgacccg ctcgccggcg tcaccgaccc gcgcctgacc cgcctgcgcg agctgcgcgc    4140
cgcgtcggtc gccgcgctca ccggggggcg ggcggaggag gcgctgagtg agccgccggc    4200
ctgggtacgc gatccggggc cggtcacctg ctatgtccag ccgttccagg gggaggacgg    4260
cctgcggctg gtcctcaacg ccgcccacgg cggtcacggc cggggcatca cccgctggac    4320
caggctgctg ggcgccgagc cgccgcccgg cgagcccccg gctgccgagt ccccgcccgg    4380
tgagtccccg cccggtgagc tcccgcccgg tgcgtgcctg gtcgccgagc tgccgggcac    4440
gttcggccac agcctcaacc tgcacgcgcc cgccaccggc tgggagctga cctacccggg    4500
cgcggtgaac caggccccgc cggagcgccg cgtcccgctg gccgagctcc aggtccggca    4560
cgacgccggg cgaggcgtcg tcgagctgtg gtggccgcgc gccggccggc gcgtcgtgcc    4620
ggtgcacgcc ggcatgatgt cggagacgct gctgccgccc ctggcccgcc tgctcgtcga    4680
ggcgttcggc accacccacc tcacccatcc gaccctgccg cccgtggtgc gggccgccgg    4740
tccgcgcatc gacctgggcc gcgtcacgct cgccagggcc cagtggacgg cccgccgcga    4800
ggagattccg cggcggggcg gcgacgacgc cgcccacctc gtcgccgtcc acgcctggct    4860
gcgcgccgcc gggatcccgc gccgctgctt cgtccgcgtc cgcgaaccgc aggtgcggag    4920
ggaccggctc gccttcgaca agcggcacaa gccggtgttc gtcgacttcg ggagctggcc    4980
gtcggtgctg gagttcgacc ggatcgtcac ccgggccacc ggggacctgg aactgaccga    5040
ggcactgccc gacggcgagc gggcggtgga gctggcgatc gagataggag cccggtgacg    5100
cggtacccgc tgccccgccc ccaccccctc ggcatccacc ccggctacgc ccggctgcgc    5160
gagggctgcc ccgtcgcgcg ggtcgactcg ccgtacggtc cggcctggct gatcacccgg    5220
tacgccgatg tggcggcggt actcaccgac gcccggtaca gccgcgcggc ggcgacggag    5280
gacgacggcg gcatcctgct caacaccgac ccgcccgagc acgaccggct gcgcaggctc    5340
gtggtggcgc acaccggcgc cgccgccgtc gagcggctcc ggccgcgggc cgaggagatc    5400
gccaccaccc tggcgaaacg catcccggcg gaggccgagt tcgtaagcgc gttcgccgag    5460
ccgtactcac atcgggtgct cgcgctgttc gtcgggcacc tggtcggcct gccggccggc    5520
gagctgagcc cgatggccac cgtgctcacg ctggcgcggg tgcccgaccg ggagcgggcg    5580
gcggcgttcg ccgaactgcg ccggcggctg cggagccagg tggacgacga gacgctcgcc    5640
gtggtgctca acatcgtctt cggcggccac gcggcggtgg tggccgcgct gggctactgc    5700
ctgctcgcgg cgctggccga gccgctgccg agcctgaccg gcgatgtccg gcggatcgcc    5760
gagctggtcg aggagacgct gcgcctggct ccgcccggcg accggaccct gctgcgccgc    5820
accctcgagc ccgtcgagct gggcgggcgg gagctgcccg cgggagcgct ggtgatcccg    5880
tcgatcgcgg cggccggccg ggatccggac cggcccaccg gcgggccggc gggccggcac    5940
ctggcgttcg gccgcggccc gcacgcgtgc ctcggcatgg cgctggcccg gatggagctc    6000
cgggtcgcgc tccaggcgct ggccgagcac gtccccggac tgcggccggc ggtcagcccg    6060
gccacgctca ggcgtacgtg cgaggaattg gcggtcagcc cgcttgcggg aatcccgatt    6120
cgggtgtagt gggcagaaaa ccgaataaac gaatttggtc agcgggtgcc cattccttgc    6180
cgcggatcac gcccgggtca tactctcggt tccagaaatg gtgcacgcat tcggtgtgag    6240
aaaccgaggg agaatcgtgt ccgcagaaca ccattatcgt gacaggctac gcgccctgtc    6300
cgcatatcta cgcaaggtcg acaatgagcc ggaggccgcc gccgagctgc gcgctgaccc    6360
ggaaaaggcc ctccgggagg ccggcgtcga ccaggcgttc gaccgccctg aagcgttccg    6420
cgcatttgtc ggaaaactgg cggtattaag cggagaagca tggctcgcga ccgttcactc    6480
gatgattgaa ctgtgtgaga tcggtgcgga tccgcagcct cctgctgggc ccaacatctc    6540
attccgcata tcttccgacg gcggggtgac ggccatcgcc aatcgcggtg agatcgccaa    6600
gaaggtgcag cccaacccct ttcacgccgg ctccgccgcc gcgtcgccgg gcggccggct    6660
gcgcatctat cccggctacg ccaccagcga actgtcggcc cgcctcggtg agcgctacct    6720
gtccacgttc taccagcgca ccctgctcaa gcgcgtcgtg ctcgacccgg gcaccgtggt    6780
cgaggacgcc gacgccggtg agggcatcac cgtcaaccgg tcacagtacc gaggcgtcgg    6840
gttcgaactg cacaccaggg ccgacggcgc ggaccgcgag atcgtcgccg cgctcgtgcg    6900
ctgacccccg gcacgagatc acgacatcac accccacgga ggcgggatgc tgagcagcgc    6960
gctcgaagta gacatcgacg aggcggccgt cgccgccgac ctcagggaac tggccgcggc    7020
gctcgaccgc agcggctacg gcgagatcct gacgtgcttc ctgccgcaca aggcgcaggc    7080
gcacatctgg gcgcagaccg ccgcgaagat cgacggtccg ctacggacac tgatggagct    7140
cttcctgctc ggccgggcag tgccgcagga cgacctgccg gcccgggtcg gcgacctcat    7200
ccccgggctc gccgccacgg gcctggtgca gaccgggcag ggcgcggtgt ggctgcccaa    7260
ccttatcctg ctgcggccga tgggccagtg gctgtggtgt cagcgcccgc acccgtcgcc    7320
cacgatgtac ttcggcgacg actcgctcgc gctggtgcac cgcatggtga cccatcgcgg    7380
cggccacacc ctcgacctgt gcgcggggcc gggcgtgcag gcgctgaccg cctcgctgcg    7440
cagcgaccgc gtcaccgccg tcgagatcaa ccccgtcgcc gccgcgctgt gccgcaccaa    7500
catcgccatg aacggcctgg gcgaccggat ggaggtccgc ctcggcgacc tctacggcgc    7560
ggtgccgggc gaggtcttcg acgacatcgt gtccaacccg ccgctgctgc cggtgcccga    7620
ggacgtccag ttcgccttcg tcggcgacgg tggccgcgac ggcttcgaca tctcctggac    7680
catcctcgac ggcctgcccg aacacctgtc cgatcgcggt gcgtgccgga tcgtcggctg    7740
cgtgctcagc gacggctacg tgcccgtcgt gatggacggg ctcggcaagt gggccgtcga    7800
acacgacttc gacgtgctgc tcaccgtcac ggcgcacgta gaggcgcacc gcgactcgtc    7860
gttcctgcgc agcatgtcgc tgatgtccag cgcgatctcg ggcgagccgg ccgacgtcct    7920
gcaggagcgc tacgccgccg actacgccga gctgggcggc tcccacgtgg ccttctacga    7980
gctgtgcgcg cggcgcggcg gcggcacggc acggctcgcc gacgtctcgg cgaccaagcg    8040
ctccgccgag gtctggttcg tctgacgcca cccaccgacc ggacgggacc gcgatgccga    8100
ccacactccc gaagaccctg cgcgggtcgg acggcgcgct cgccgagcag ccgctgctca    8160
tctacgtgaa tgtgccgttc tgcaactcaa aatgtcactt ctgcgactgg gtgaccgagg    8220
ttccgctggc ggatctgcgg ctcacgccgg actcgtcgcc acgccgccgc tacgtcgccg    8280
cgctggtcaa gcagatcgag acgcacgcgc cgacgctggg cggactcggc taccggcccg    8340
aggtcatgta ctggggcggc ggcacggcca gcatcctcac catcgaggag atcgaggcgg    8400
tggctggggc gctggcggcg cggttcgacc tcggcggcct ggtcgaggcc accatcgagg    8460
gcagcccgga gtccatggac cccggcaagc tgaagctgtt ccgtgcgatc gggttcaacc    8520
ggatcagcat cggggtgcag gcgttcgacg acgcgcgcct gcgccgcatc ggccgggtgc    8580
acagcgccga gcaggcggag cgcgcggtcc ggatggccgc cgacgccggc ttcgacaaca    8640
tcaacatcga cctcatcgtc gggttccccg ggcagggcgc cgacgaggtg tcgcgcacga    8700
tccagcacgc ggtgacgctg ccggtcaacc acttctcggt ctacccctac cggccgaccg    8760
gcggcaccgt gatgcgccgg caggtgggcc gcggcatggg ccggatcgac gtggaggagc    8820
agctccggtc gtacgaccac gcccgcgacc tgctcgcccg gcacgggttc gaggagtacg    8880
ccaccgccta cttcggcgct ccccgctgcg agtccgacga ggtctactac aagctcacga    8940
tggactggat cgggttcggc tccggggcca actccctcat cgggacccgc ttcctgctga    9000
acgaccgggg cgggctgcac cgcttcagca cggccccgca ccgcttcgac tccgacaccc    9060
cggcctcggc cccccacctg acacgccact tcctggccca ggcgctgacc acggtcgacg    9120
gcatggacgc gcgcaccttc cagctgcgca ccggccgttc gctgcgggcg gcgtgcgagg    9180
agcccgcggt gcgccggatg ctcgaacaga tcaaccgccg cggcaggctg atcgtcgact    9240
cacgcggcat ccggctgcac cgcgacgaca tggcctcggc ctacatcacc atgaacagcg    9300
tcgatctgta cgccgcgacc gagcagcccg gcggatgacc gcggtcctgc gcgcctgctc    9360
acacagtctt cgtgaacccg tgtgcccttc ccacgtgggg acgggcgtgc cggtcgaccg    9420
ccgcgggctc gcgaaggaat gagggtcaca acggaaagga gatgagcgag ttggaatcca    9480
agctgaacct tagcgacctg cccatggacg tcttcgagat ggccgacagc ggcatggagg    9540
tcgaatccct caccgcaggc cacgggatgc ccgaggtagg cgcttcctgc aactgcgtgt    9600
gcggcttctg ctgctcctgc agcccgtccg cgtagcagtc aaggagtgcc gccggcccag    9660
gccggcggca ctccgcccgg ggtgaggaga cagatcatgg aggtgggccg cgaaatcgtg    9720
gtccgcgtgg cggggctgcc cgccgccgtg ctcgccgacc tgcgcctgcc gcacaccgcc    9780
gagctcgtca cgcacctgtc cgctgagcgg cggcggctcg ccgccgaggc ggctgcgctg    9840
tccggcgagc tgttcgacct gatcggcgcc gccggctccg cccgcgccgc cctggtgggc    9900
ctgcggcgcg cgctcgcccc cgggcaccgc cccccgtcgc cgcgactgat cgggctgtgt    9960
cccctgcccg ccccgctggc cgagcgggtc accgcctggg tgcgggcccg gtacgactgg    10020
gaggaccggc gccgcgacct tgccggcacg ctggacaagg agcgcgccga cgcgctcgac    10080
cgcgtacgcg ccgcctgcgt cgccccggcg ttccggcggg gtctggcgct gtccggtggg    10140
gagctgacca gcacgctgga gcgctggctc gccgaccccg gccgtgcgcc ccggcagggg    10200
aaggtgctcc gcctggtcaa gtacctgacc cgagctgcgg ccaagaccag cccgtacggc    10260
tccttcatgg tcagcgcgct ggcggggcgg cccggcgacg accctcccat cccggagctg    10320
ctcaccgtgg ccgagccgcc gggggcgttc ctcgacgccg tcggcgacgc gctgctcgcc    10380
gacccggcac tggccggcca ggtgccgctg cgccccaacc ccagcctgac gtggaccgcc    10440
caaggactgc ttttcgtccg gaccgtccgc gcggcggcgg gagagcaggc cgggccgaag    10500
gaagagatcg ccaccgccgg gcgcgccgcc gcgctggagc tgtgcctgcg gcacgccgag    10560
tcccggccca ccgcgccgca gctggcggag ctgctggccg aggcgggggc ggatccgggc    10620
gaggcggccg cgttcgtcga ccggctggtg gcggcgcagc tcctgctgcc gtgtccgccg    10680
gtgcacgacg acgatcccga cccgttcggt gcctgggccc gccaggtgtg cgccccggag  10740
ctgcgcgagc tggcggccgc gtcgcggccc gtggccgccg ccgtggactc gcccggccag  10800
cgccgcgcca ggatcgccga agccgccgcc gccgtggcgg accggctcgg catcgacccg  10860
cccgccgatc cggcgcacga gcacgacgtc agcaccggcc gtccggcgcc gccaccgctg  10920
cccgcgggcg tgctcgccga cctggacgcg gtccggcgct ggctcgccgt gttcgactgg  10980
aaggtgcccg tccgggtggg ggtcggcgcg ttctgccgcg aacgtttcgg ctcagggtcc  11040
cgcacgccct tcctggaggc gtgccgggcg gcgacggcgg cgctgccgca cctgttcggc  11100
cccgccgcga tgccgtggtt cctcgacctg accggtgacg gtcgcctgcg tgagctggac  11160
cgtctccgga cgcgcgcccg cgatctcgcc cgctccggcg tcctcgaccg gcggcgggtg  11220
ctggctgaca cggccgactg gcccgcctgg ctgacctggc ccgcctccac tggtttctac  11280
ctgcagaccc tgcccggtgg ggtggtgctg aacgcggtgc atgccgggca cggccgcgcg  11340
gcgggtcgcg tccaccacct cctcgcccgg gcgggcgccg cgccgccgcg cccgccccgc  11400
tccggcctgc cgcgtgccga gttcggcggc aggttcggct ccgcgctcaa cacccgcacg  11460
ccgagcacgc ggtacgagat cgaccacccc ggcgcgacgt ccggccgcga cccccggcac  11520
cgtgtcccgc tcggcacgct catggtggtg cacgacccgg acaccgacct ggtccacctg  11580
cacagcgacc ggctcggccg cgtcgaaccg gtgcacctcg gcatgatggg cgagctgggg  11640
ctgcccgccg tggccggttt cctcgaacgc gccttcgcgc ccacctacct gttccacccg  11700
agcgtgccgc cgttcatctc gctgcgtgac ctggccggcg cctcctcggc gcggcgcttc  11760
cccagggtga gtgtcggcga cgtggtcgtg cagcgcgccc gctggacggt gcccgccggc  11820
ctggtgcccg cgcgtaccgg ggcggacggt gaccacctgc tcgcgctggc cgagtggcgg  11880
cgcgagcacg gcatccccga gcggtgtttc gtgcgcggct ggaagccggg cgcagcgctg  11940
ggcaaggcgc gcaagccgct ctacgtcgac ttcgcctcct ggcatctggt cgccctgttc  12000
gaacgggagg cgcgaaccaa cgccgccctg gtcatcgacg aggccctgcc ggacccgctg  12060
gccgacggcg cccccgcgca cgtcaccgag taccacgtcg agatcggcga ccgggagaga  12120
gagcaatgac cgaacggccc ggctggttcg cggcgcatgt gcactaccgc ggcgacctcg  12180
acgcgctgct gcgcgaagcg gtcgcgccgc tggtgcgcgc gcttgccgcc gacttcttct  12240
tcctgcgcta ctgggacggg ggcagccacc tgcggctgcg gctgcgcggc ggggaccagg  12300
tcgcggtcgc ccggcacctg gacgcctacc ttgccgccca ccccgcgccg gagaccacct  12360
cccaggagga gtacgcccgc gtcgccccgg tgctggccgc ccgcgagggc atgacgggcc  12420
acctgacgac gctgcggccg aacaacaccg tggagttcgc ggcgtaccgg ccggagaccg  12480
cgaagtacgg caccggcgac gcgctacgcg ccgtcgagcg gcatttcgtc gagtccagcc  12540
ggtacgcgct tgacgtcctt gaccgccgcc cgaccggcaa ccaacgcgag ctcgcagtgc  12600
tcggcgtcct gctgctcgcc tggtacgccg cccgcccact cgatgagccg cctggtgagc  12660
cggtcgatga cgagctgatc ggcgcggtcg aggcgctgtg ccggggctgg cgcggcggcc  12720
gggacctgcc cgaggagctc gtggcggagg agtacggccg ggtgcgggag cgtgtggccg  12780
ggctggccgg cgcgctgcgt gacctcgttc cggacccgga cgcgcccggc agcagcatgc  12840
gcgcgtgggc ggcgacgttc gaccggctcg ccgccgcgct gcccccgccc gaccggctgc  12900
gggtgctcga cacgtgcgcg catctggcgg ccaaccggct gggcgtgtcc atggcggccg  12960
aggtgcggct gcggctgctc gccgcgcggg ccctgcgcga ggtcgcgccc gtggggaggc  13020
gatgatgagc tggcgacgcg tcgacgtggc ctaccacgat cccgaccttg acgggctgat  13080
cctggccacc cggccgctgc tggccgggac gcccggccgc ggctggttcc agcggcactg  13140
ggtccgcggt ccgcacctgg agctgtggtt cgacgccgcg cagccgtcgt gggagcggat  13200
ccgcgacgtg ctggagccct ggctgcgcgt caacccgtcg cgcgcccgga tcgaccgaga  13260
ccggctgctg gcgcagcacc ggcacctcgc cgccgccgaa cggatcgacg agccgctgct  13320
gccgttctac gccgacaaca cgctgcaccg ggccgctccg cgctcccgcg cacacgtgct  13380
cggtggtccg gcggccgagg agctgttcca cgacttccac accaccgcca gcgccgtggc  13440
ttacgacgag ctcgacgccg tgcgggcggg agagtcgcgg ctggtgatgg cactggacct  13500
gatggtcgcc gccgcgcacg cgcacgccga gggcggcgtc cgcggcgggt tcgtgtcgtt  13560
ccgctcgcac gcggaggcgt tcctggcgag cgcgcccggc ctgcgcgagc gctgggacgc  13620
cgagtacgcc gcccgggcgg gggcgctgcg agcgcggatc accgcggtgg tcgccggaat  13680
cccgcgcggc cgggcgtggg ccgggctgct cgaccggttc gcggaccgcg gcgacgagct  13740
gatcgcctcc ggcgcgctgc tggtcgagcc cgccgggccg gacgcggtcg cccggcccga  13800
caccgccttc caccgggcgc tgcgcggcaa ccggacctgg cacgaggagg tgctgcgctc  13860
agcaccgttc cgccgctacc ggctgctgct gaacctgacc tacctgcagc tttcccggct  13920
cggggtgaac gccgtgcagc gggcgctgct gtgccacttc gccgcgtcgg cggtcgagca  13980
ggagtacggg gtgtccgcca tcgagatcgc catgggaggc gcgtgatgtc agtacaggtc  14040
gagcccgcag tgacgcaccg gtgggcactg cggcccggcg tctaccgggc caccgcgcca  14100
ggcggcgatc tcatgctcgc cgcctggccg cacgccacgc cgctcggccg ggccaccccc  14160
gagctgctgg ccctgctgga cggcctggcc gccggatcgc tgccgctcga cgagcccggc  14220
gacctcgcgc ccgccgtcga gctgctgcgc gcgggtggct ggctgcgcaa gacggtggcg  14280
tacgcgggac gcgacctcta caccatcacc cccgtcgccg cccccaccga cgcgccgcca  14340
ccgccgcggg acgaaccggc gctgtcgcgg ttcgcgctgc tgcgcaacac cgcggacggg  14400
ctggtgctgg agatgcccgg ctcctggtgc gacgtccacg tgcacgaccc ggcggtggcc  14460
gcgctgctcg ccgacccgtc cggcgacggc ggcctgcccg ccgaggccgc ggccgcgctg  14520
cgcgccgacc tggccgccgc cggcatgctg atggagcggg aggagccgtt cgagcggcgg  14580
cagtggagca cccacgagct gtggttccat gaacgcagcc ggctcggcaa ccggggctgg  14640
ttcggcgcgc acttcggcgg cacgttctgg gcccgcggcc ggcacgaccc gccgcccgcg  14700
cggccgtccc cctaccccgg cccggccgtc gagctggccc ggccggacct cgcggcgctg  14760
cggcgcaccg accccacgct caccgccgtg ctggaggacc gcgaaagcgt ccgcgaccac  14820
gacgacgacg atccgatcag cgctgagcag ctcggcgagc tgctctaccg gtgcgcgcgg  14880
gtgcggctgc tgcgtcacct ggaaggcttc gagtacgccg gcaagccgta ccccgccggt  14940
ggctcggcgt acgagctaga ggtgtacccg gtcgtgcggc tggcccgcgg cctcgacccc  15000
ggcatgtacc actacgacgc gcacgaccat cggctgcgcc aggtccggcc cgccggccac  15060
ccggcggtgc gcaggatgct gaaggtcgcc acggagtcgt ccgtcgccaa ggcgccgccc  15120
caggtgctgc tggtgatcag cgcgagagtc ggccggatcc tgtggaagta cgaggcgatg  15180
gggtacgcgc tcatgctgaa gcacgtcggc gtgctgcaac agacgctgta cgcggtcgcc  15240
accgccatgg acctggcccc gtgcgcgctc ggcagcgggg acgatctcgc cttcaccgcc  15300
gccaccggcc gggaccggct ggtggagtgc gcggtcggcg agttcatggt cggcagcagg  15360
cggaaggagc ccgcggcatg ggagctctga acctcctcct gcgccccgac gcgcactacg  15420
ccgaggtcga cggcggcgtc tacgtgctga gccaccaggg cgagaccttc atctcgggca  15480
cctcggtgca ccggtggctc gaccgcctcg cgccgctgct cgacggcacc cgcacgctcg  15540
accagctcac cgccggcctg cccgccgacc gggccggctt cgtggccaga cttgtcggca  15600
cgctcaccga acgcggcctg gtgcgcgagg tcggcccggc ggtgtcggac acgctcaccg  15660
acgccgaacg cggcgagcac cgtgccctgc tggcctacct gggctacttc cacgactcgc  15720
ccggccgcgt cctcgaggac gtgcgcgaca ccccgaccgc gatcgtgggg tccggtccgc  15780
tggccgccgc ggtggtccgc gcctgcgccg ccgccgggct gcgccgggtg gagatcggcg  15840
aggaggcggg cgcggcccgg gtggtcgtcc acgtggccga gcgcgccgag cccgaacggg  15900
cggcgcggct ggaacggcgg tgcgccgccg agggggtgct gctcgcacag gtcatgccgg  15960
ggccggacgg catctggtgg cagcccgcgg cccgcggcgg ctgctgggcg agcgcgtggc  16020
gccgccaccg ggcgctcgcg ggcgtggatc ggacgggcac gccgctcgat ccggtggcgg  16080
tcgcggtggt ggccggccag gtggcacacg acgtcttccg cgtcctcgcc ggactgcgcg  16140
aggaggcgcc gccccggttg gtggtgctcg atccgcggac gctggcgagc accgcgcacc  16200
cggtggtggc gcacccgttc gagctgcccg ccgcgccgct ggacgaggcg gcgttcctcg  16260
accgggtcgc cgcgctgcgg gcagcgcccg cgctgagcga ggcggagttc tcccggcggg  16320
ccaaggggct catggactcg acagtggggc tgttcgccga gatcgacgag ggcgacctcg  16380
cgcagttgcc gctgcacgtc acggcgacca cggtggccga cccgtgcggg ctgatcggct  16440
ccgcgccgcg gcccgtggtc accggcgcgg ggctcacgtt cgaggaggcc cgctaccgcg  16500
cggcgcgcgc cgcgctcgcc ctggccggca ctctcgcgct cgaccggcgg aggctggtcg  16560
acggccgggt gtgggcgtac gaccttgcgg acggggccgc ccggctggtt ccggccgacg  16620
aggtcttcgc aagcacggcg ggcgggagca cggcgggcgt gccgctcggc gcggcggcag  16680
cctactcgtg ggccgaggcg gtcgcggagg gcctggtcgc gcaggccgcc gcgctcactc  16740
tcgccggcgc cgggcacgcg ggcgagccgt atggacgggc ggacctcgcc ggggcgcctg  16800
cgtatctcct cgccatggtg cgggcgctcg gcgaggagct gaccgtgcac gacgtcaccg  16860
ggccgctggg cgtgccggtc gtggtgggga cgctgtccgg cggggcgacc gcctgcggcg  16920
cgggcatgac cacggacgcc gccgtcaccg cgtgcctgcg cgacctgctg ctgctgcgcc  16980
aggccgagat caacgaccag cccgtctacg ccccaccatc cggcaggccc ttgcccgggc  17040
atctacgcgg gaaccacccg gcgcccgccg tgcccggcac ggacgccgac cggctggcgg  17100
cccgcctggc cgagcggggg caccgccctc tggcggtgcc gctggatcat gaccaggccg  17160
tgcacgcggt cctgcccttc gccgtccggg tggtgtgccg atgatccgcc tgcccgacca  17220
cggcgagctt gccgtgccga tcggcgacgg gccgatgctg ccgctgcgca ccgaactcgg  17280
ccgggtggtc atcggcccgc tggagcggcc cggcgtgccc ggatgccggg cctgcgtgcg  17340
catccgcgcg gcgcgggtcc agcccgacgc ccgcaaggcc gaggccgtac gcgcccggca  17400
cgcccccgcg cccagccagt ggctcacccc gctcgccacc gacctggtgc gcgtcctggt  17460
cgcgagcgag agcgctgccc tggcagccga caccgacccc cgcaccgcgg gtgccgtgct  17520
ggagatcgac ctcgccacgc tggaaatcac caggcaccgg ttcctgcccg acccgctctg  17580
cccgcactgc ggcggtctgc cgccggacgg cccggccgag ctgaccctgc ggccccgccg  17640
caagctcggc ggcagtcccc ggaccaggcc ggtcgagctg aacgcgctgc tggagacgta  17700
cgtggacggc cgggtcggga tgatccggcc gctgaagtcg ggcgtgcagg gcggactgac  17760
ggtggccagc gccatgctgc cgatccgcgc gggccacggc ctggaaccgg gggtcggccg  17820
tacccgcagc tacaccgcga gcaggctggt cgccgtgctg gaggcgctgg agcgctatgg  17880
cggcgtcagc cccggcggcc gccgcaccag cgttaccgcc gcctaccgcg acatctccgg  17940
ccacgccgtc catcccgaca ccttcggcac acaccccgag gagaactacg acaggcccgg  18000
cttcgccttc cggcgcttca ccgaggacac cgtgtgccgg tgggtgtggg gctactcctt  18060
cgccaaggcc cagcccgtgc tggtgccgga gaaccaggtc tactactacg ccagaaacct  18120
gccggacggc gagcagccgt tcgtcttcga ggtctccaac ggctgcgcgc tcggctcgtg  18180
cctggaggag gcgatcctgc acggcctgct cgaggtggtc gagcgggacg cgttcctgct  18240
cacctggcac gcccggcggg aggttccggt gctgaacccc gcgctggcga gcgacccggt  18300
cctgcccatg caggccgccg cgatcaccgc cgagaccggg caccgggtgc tgtgcttcga  18360
caccaccgcc gagcacggca tccccagcgt gtgggcgatg gccgtggacg tcgaacaccg  18420
gtcggaccgg cccgccaccg cccacgccgc cggcgcggcg ctcacgctgg agcaggccgc  18480
catgaacgcg ctgagcgagc tcggcccgct gctggccgac gtgatccgcc gctaccccga  18540
ggagcgggaa cgggccgagg ccatggtccg cgaccccgag caggtcgcca ccatgcacga  18600
ccactccctg ctctacgcgg ttcccgccgc ggccgaacgg ctgtcgttcc tcaccggccg  18660
cgccgacggc ccgcggaccg gcttcggctc ggcccggttc accggcgacg acctcaccgc  18720
cgatctgcgg gccatgatcg acgcggtgat cgacgccggg atggacgtgg tggtcgtcga  18780
ccagaccacg ccggagcacc tggcgggcgg gttccgctgc gtgaaggtgc tggtgcccgg  18840
cgcgctgccg atgacgttcg gccaccagta ccggcggctg gacaacctgc cgcggctggc  18900
ggccgcgcgt accaccgacc cgcacccgtt cccatgagcg ggcgcccgga cagcggaaag  18960
gagccgtcgt gtacgtggtg atcgtcgcgt tcgacctgaa ggagtcctcc gtcgacttcg  19020
ccgaactgcg cgcctgggtg cgggaccggg cggcggacga ctactcccgg ctgccgggga  19080
tgcgcttcaa gacgtggttc tccgacgagc gaaaacggct ctggggcgcg gtgtacctgg  19140
tggagtcgat gttgtcgttc gaccgggaca acctcccgct gctgcccgac ggcaggaccg  19200
ggccggtcgg cacccggccg acgtcggtca tggtgctgga gttggaggcg ttcgtcaccg  19260
ggccggacgg cctggacggg atcgaggcgc tcgcccggca agggctgagc atgacgggag  19320
gcggccatga ccactgaggc gacgactgcg gtgaccactc gtgcgaacgc cggagcgctg  19380
tccctgccgg cgcgtggcac ggaccggccg ctgctgctct acgtcaacat cccgttctgc  19440
aactccaaat gccacttctg cgactgggtg gtggacgtgc ccgtctccga cctgcggctc  19500
gcccccgcgg cgccgcgccg ggtcgactac ctggccgcgc tgtgcaccca gatccgcacg  19560
cacgcccccg ccttgcgggc cgccggttac cgcggtgagg tcatgtactg gggcggcggc  19620
accgccaccg tcctcaccgc ggcggagatc gagcaggtcc acgcctgcct cgcggccgag  19680
ttcgacctga cggcgctggc cgaggcgacg atcgagggca gccccgagtc ggtggacccg  19740
gccaagctga ggctgctgcg ggacctcggc ttcgaccggg tgagtctcgg cgtgcagtcg  19800
ttcgacgaga ccaggctgcg ccgcatcggc cgcgcccact ccgcgggcca ggccgtgcgc  19860
agcgtcgagg acgcgcacgc ggcgggcttc gacaacatca acatcgacct gatcgtgggc  19920
ttccccgacc agtcgctcgc cgaggtggag cagaccgtgc ggcgcgccct cgacctgccg  19980
gtcaaccact tctcggttta ctcctaccga gcgaccgagg gcacggtgat gcgcaggcag  20040
atcgaacgca gcggcacggc catcgagctg gagcatcagc tccagtcgta ccggctggcg  20100
ggcgagatgc tcgcggcggc gggacatccc gagtacgccg tctcctactt cggtgcgccg  20160
cgctgcctcg ccgacgaggc gtactaccgg ctcagcatgg actggatcgg cttcggcacg  20220
ggcgccaact cgctgatcaa ccagcgctac ctgctcaacg gccgcggccg gatgcgtgac  20280
ttcaccagca ggccgggcga gttcgaggtg gacctgccgg ccggagtgcc gtcactcacc  20340
gtgcagtggc tgcccagggc gctgggcacc gccgagggca tcgacgcggc gaccttccag  20400
cgtcgcaccg gcacgtccct gcgtgcggcc tgcgaggaac ccgagctgaa cgcgttcctc  20460
acccgggtga acgagttcgg ccggctcgtc gtggaccgcg acggcatccg cctggccgac  20520
gagaaccgct cggacgtgct gtcgcgcacg ttcgccgcga tgggctgggt gtcctgacgt  20580
ggaggcgatg cgcacgctgc tcgcggccgc cgacctggtc acgccgatgg cgctgcgggt  20640
gtcggcgacg ctgcggctcg ccgaccacct ggccgccggc acgaccggcg ccgccgagct  20700
cgccgcggcc gccggggtcg acgaggcggc gttgacacgg ctgctgcgct acctggtcgc  20760
gcgcggcgtc ttcaccgagc ccgcgcccgg tgagttcggc ctcaaccccg ccgccgaact  20820
gctgcgcgac ggccgccccg accggctgcg cgactggctc gacctcaccg ggccgatcgg  20880
ccgcgccgac ctggcgttcg ggtcgctgct ggacgtcgta cgcaccggca agcccggtta  20940
cccgatgatc cacggccggg gcttctggga cgacctcgcc gccgagccgg cgctcgccac  21000
cgcgtacgac accctgatgg gcggcaagcg ccagtgggcc gcgaccacgc tcgccgccct  21060
ggactggagc cgctcccggc acgtcgtgga tgtcggcgga ggcaacggca cgctgctgtc  21120
gtgcctgctg gccgcgcacc cgcacctgcg cggcaccgtc gtggaccggc ccacctccgc  21180
gaaggccgcc ggagcagtac tggcctcggc cggggtggcg gaccgtggcg agtttcgcgc  21240
gggcgacttc ttcgagccgc tgccggtgca cggcgccgac acatacctgc tcagctcgat  21300
cctgcacgac tgggacgacg ccgcggctac ggcgatcctg cgccgctgcg cggaggccgc  21360
cgcgccgggc gggcgggtgc tgctctgcga gctggtggcc atggccgggc cggaccggcg  21420
gacggtgacg cacatggatc tgtgcatgct cgtgtacttc ggcggccggg agcgcaccgc  21480
cgccgacttc gccgcgctgg ccggggcggc cgggctggag ccgcgctcgg tgacgccgct  21540
cccgccccac gactggggca acgccctcgt ggagtacgcg gtccccgccg cccgctgacc  21600
ggaaaagacc cctgccgacg gcgacggtca gcgcggcgcg gctccgttga tcgcgcccgc 21660
ctgggccgca cgatgagctg gagcgctggt cccactcgac cgcaatcgcc gtggaggtgt 21720
gggcacttcc cggcgagccc tgtccggcga cgtcgcggag ctcgtccatg ccacgatccc 21780
cgacgtactc gacggctcgg gacgggacgg atcggtgcgg tgcgcgggca tcgcgctcac 21840
cgcgggcgcc cgcgggctgc gcctgaccac cagccacgac ggctccggct cgccgcgctg 21900
gggttcaaac tcactaccca gggccggtac gggatgagtt tcgtccgctt ctgtgaggaa 21960
cgcggcgctg accgggtggc ggcgcgccgg ttcggcctac atcaaggagc tgatgcccga 22020
catctggatg gcaccatcga gccggggcaa atgttcgacg ccacgaccga tgcgatgtcc 22080
cgcgaccggc cgtcgcggtg aggcgtgccg atgcatcacg acgagctcgg aataccgagt 22140
ctgcgtcggg gtggatttgt ggctggtcga tgagtttggg atgctgcgca ggtctgcctg 22200
ccgataccac ctgactggaa ggggatcacc gcgatggcga aggtcatctc tacgttgttc 22260
atctctgctg acggtgtggc cgagatcgac cccgattggc acttcccgta cttcgacgag 22320
aacatgggcc gcgccgtcgg cgaggactat gacaccgctg acgtgctgtt gatcggtcgc 22380
gagaccttcg acagcttcgc cggagcgtgg cccgaccgcg aggcggcggg tggggacgac 22440
gcaccgttcg ccaagcaact cggggacatg cgcaaggtgg tcgtctcccg ccagccgctg 22500
gagttctcct ggcgcaactg cgaactgatc acgggcgatc tcctcgatgc cgtcacctcg 22560
ctcaaggccg atgccggcat caggggcatc ctcatccccg gttcgatctc cgtggtgcag 22620
cagttgctcg ccgcagggct ggtcgacgag ttgcgcctgc tggtgcaccc ggtggcggcg 22680
cgtaagggcc gcaggctgtt cgacgacggc gacgcgccgt accacctgag cgtgacggcg 22740
acggagacgt ttccgacggg cgtgatccgc gtgatctact cgccgaccga ggcacccacc 22800
aaagtcggct acgacgaggt cgaggcccag gtgtccaccg gggaatag              22848
 
<210>63
<211>15586
<212>DNA
<213>野野村氏菌属物种
 
<400>63
ctaggtgggt gagggggtta gggggattac ctcgttgggg gtggtgtcgg gggtggggat 60
ccagttgagg gcgatgaagg tctgggcgat gtcgtcgcgg tggaggcgga tgccgttgtg 120
gtcggcgatg agccggccgt ggttgttcat gcgttccagg tacgtcatga cctccgggtg    180
agagcaggcc gtgcggaggg ggacgccggt gcgttgctgg tagaggcggg cgtccaggcc    240
ctcggcggtt gtcagtgcct gggacaggaa gtggagggtg agctgtgggg agtgggccgg    300
ggcgttgatg tcgaaggcca gcgggttggt gttgtagtgg gccagcttgc ccttctcgta    360
gctcaggtag cggcggccga tcagggagtt ggcgcccgag ccgaagccga tccagtccat    420
gcggagctgg tagtacgcct cgtccgactg gcagcggggg tggccgaagt aggacatggc    480
gtattcgggg aagccggctg cttccagcag ttccctggcg atgccgtacg cctggagctg    540
gaggttgagg tcgagctggg cgccccggtg gacctgcttg cgcagcaccg tgccggggct    600
ggcgcggtag gggtagatcg agaagtggtt gatgggcagg gtcagggccg tgcggaccga    660
gtcggcgacc tcctggccgg tctgcccggg gaagccgacg atcaggtcga tgttgatgtt    720
ggtgaagccg gcctcgtggg cgtcctggac ggcggtgagg gcctggtcgg cggcatgggc    780
gcggccgagg cggcgcaggc gcgcgtcgtc gaaggactgg acgccgatgc tgatccggtt    840
gaagcccagc tcgcgcagga ggcgtagttt gtcccggtcg agggattccg ggctgccctc    900
gatcgtggcc tccctgaccg tgctcaggtc gaactcggcg gacagcgtgc cgtacaggga    960
ctcgatctcg tgggggccga ggatgctggc cgtgccgccg ccccagtaga cgatgtcggg    1020
gtggtagtgc tcgcgcaggg cgggggcctg gacgcggatc tgggtcctga tggcctccag    1080
gtacgcgacg cggcccgggc tctgctcgcc cagccgcagg tcgcgtacgg ggacctggac    1140
cacccagtcg cagaagtggc acttggagtt gcagaagggg acgttcgcgt agatcagcag    1200
gggcttggtc atgaggaacc tctcacgtgc atctccctga cgccgaagat ctggctctcg    1260
tagaaggagc gcttttcggg acggagctcg gtgaagcggc tcagcaggcg ctccagcgcg    1320
atgcggccct ccaggcgccc gagctgggcg cccaggcaga agtgcacgcc gtggccgaac    1380
gcgagctggc cggtgagctg ccggtccagg tcgaagcgtt cggggtcggc gaagtggcgt    1440
tcgtcgtggt tggcggacag gagccaggcc atgacgaacc tgttggccgg gatggtctcg    1500
ccggccacct gtacgtcctg cgtggtcacc ctgcccgcct gcatgaacgg cgagcgcagg    1560
cgcatgctct cctccagcgc ctgggggatg agcgacatgt cggctcttgt ccggtgggcg    1620
gcctcggggg cgtccgccag gcagagcacg gtgttgccga tcagcacggt ggtggtgacg    1680
tgcccggcca gcaggagcag gctcgcggtg ttgacgacct gctccgcgtc gagccgctcg    1740
ccgtcgatct cggcatggac gaggcgggtg agcaggtcgt ccctgggacg ggtacggcgg    1800
tccgcgcagt gctcgcgcag gtagtcgttc atctccgcca tggccgccgc cacccgcccg    1860
gccagcgacg ggtcggcgaa gtcgggcacc tggagcgaca tgagccggtc cgaccaggtg    1920
cggaacaggt cgcggtcgga cggcggcacg ccgagcagct cggcgacgac ggtgacgggc    1980
aggggatagg ccaggctctc gaccaggtcg aagtcagggc cgggcagggc gtcgaggagc    2040
tcgtcggcga tcgcggcgat gcgtggttcg agggccgcga cggagctcgg ggtgaaggcc    2100
gcggtgatga gcctgcgctg gtggcggtgt tcgggcgggt cgatcatcgt gatgccgccc    2160
tggccgaacg gctgccgtcc catcagcctg gtgcggtcgg aggagaaccg ctcgtggtcc    2220
gccagaacgg cgcgtacgtc gtcgtagcgg aagacgtggt acatcccata ggaatcccgc    2280
cagaccgggt gcgtgtcgcg catctcgcgc agccaggcga acagggacgt cccgccgtcc    2340
gtgaccgaag gtggccttac gggggccgtc atcggggcgc ccgcttgacg cgtaccggca    2400
ggctcttgac gccgaacatg gggtcctcgt agtacgacag ctccgcgtcc gggtcgatct    2460
cgacctgctc gaaccggtcg aacaccagct ccagcgccac cttcccctcc accctcgcca    2520
gcggcgcgcc caggcagaag tggatgccgt ggccgaaggc gtactggcgg ttgggctggc    2580
ggccggggtc gagccggtac gggtcgggga actggcgctc gtcgtagttc gcggacagca    2640
gccagttgat gaccatggaa ccggccggga tcggcgtgcc gtcgatctcg acgtcggccg    2700
tggggagccg ggcggcctgg gtgagcggcg ggcgcagcct gagcacctcc tcgaaggcgg    2760
gtgcgatcag ctcccggtcg gcccgtacgg cgctctccac gccgggcgcg tcgcggaagc    2820
acaggaacgc gttccccagg gccatcgtgc tggtgatctg cccggcgagc agcagcaggc    2880
aggcggagtt gacgatctcg gcgtcggtga gccggtcgcc gtccacctcg gccgcgacca    2940
gccggctgac gaggtcgtcc tgcggacggg tgcggcgctc gcgcacgtgg gtgaggacgt    3000
attcccccat ttcgcgcatg gcctgaccga ccatccgccc gatctcgatg tcccgcgggt    3060
cctcgacgtg cagtgcgacc agccggtcgg cccaggtgcg gaacagctcg cggtcgtgga    3120
tcggaatgcc gagcagctcg gcgatcacca tcacgggcag cgggtgggcg atcttctcga    3180
ccaggtcgaa ctcgtcctcg tcgatctcgt ccagcagcgc cgtggtgagc tcggcgatcc    3240
gcggcaccat gtccgacgac attttcgggg tgaacgcctg gctgatgagt ttgcggagct    3300
ttcggtgctc cggcgggtcg gtgagcatga ggctgcccgc gctgaacgga tcgccgccgg    3360
gccggagccg gttgatgtca gaggagaacg ccgcatagtc cgacatcacc cgctgtacgg    3420
ccgcatgccg gaaaacgtgg aagatgccga atgcgtcgcg ccagaccggt tgttcgtccc    3480
gcatcgtgcc gagccacttg aggagggtct ggccgccgtc cttgatgcgc ggccgggagt    3540
cgatcggcat cgtcatcgtc gggtccggcg ggacgtgtgt ctcgttcaca attgactcct    3600
cagacggagg cggccagggg ctgggggatg agtttcgccc ggtatttcgc cgcggcgccg    3660
tcgaagatct cgacggtacg gcgggcgggg tcggtcagtt cttcggccgg gacctggtca    3720
gcaggttcga aagagctcct gatgaggccg gccaggctgt cggcgtgcgc cgccagatcg    3780
ggtttcgccc cggcgatctc ggcgtgcagg tgaagtttga tgaacccgga aagcagggca    3840
tcgagcgcga aaccgtggga cgggtcccac attccgctct cgtggagcat ccggagataa    3900
tcgcgaaatg gcgtgaacgt ggtgaagcgg taacactgga agccgagctg tggatcgtcg    3960
caggcccttc cgagcgtttc cttgtcatag gtgtagagtg ctcggaagag tggatacttg    4020
aacacgagtg tgaacagctc gcgtgagaac tcggagagcc gcgcgacggc aggacgaagc    4080
accgctattc gcgaaatatc ctggcagact ccgacaattt cctgaatgac gagcgttctt    4140
atgagatcgt ctttcgtgtc ccagctgaga taaatggtgc cctttccgat gtccgcccgc    4200
cgggcgatct cgtccatcgt ggtccgcttg tagccggatc gcaggagcag gctcctggtg    4260
acgtccagag tccggcgtac gcgatcgtcg ctggtcctgg cacccgtgct gcgtgtcgag    4320
acggtgctca tggctgggtg gctccttccc cgtaagagct ggtgcgcatg aaccggtatt    4380
ccctaccggc tagggggatt ttggtgggag atgtgctctg ggcccgtcag agctggagat    4440
ttcgaagata ttcgaaatgc tcagatttca acagtcaggt gccccctccc tgactggctg    4500
accgattttc gattttagtc agccagttcg cattcttgac cgcgttccat atgtacacct    4560
agcgtcggcg atgtcgcaag ggtgttccta taccaggcga tgacctccgt gcgatgcaca    4620
tcagtgcgtt tgcctggaat gtcgatgggg cgtttacccc cggaaggaga gtccgcatgg    4680
acctcagcga tctgcccatg gacgtcttcg aactcgccga tgacggtgtt gcggtcgagt    4740
cccttactgc tggtcacggc atgaccgaag tgggagcttc gtgtaactgc ttctgctaca    4800
tctgctgctc ctgctcgagc gcctgacgcg gtacgcgggc gtcgccacgg cggcgcccgc    4860
gcctgttgcc ttttggcgcc aataaagcga atggggctca tgtaatggcg gttattgagc    4920
gggaagaaag cgacggcccg ccggtcgctg tccgcacgtg cggggtcgcg gccgcggagc    4980
tggaatccct gcgatgggac gagtcctatg cgctggtgac ccggctgctc gcggagaccg    5040
cccgggtggc ggcggacggg cggcggctgg ccgtggcgct cggtgacgtc atcggagggc    5100
tcggcccgtc cgggtcccgg cccgtcctcg tggggctgcg gcgggcgctg cacaccgggc    5160
gtctcccctc cgggcgggag tgggggcccg aggccggggc ggcgctgccg tacgggctga    5220
ggggcgaggt ggaggagtgg gtacggcgtg cgcgcgagtg cgccgggctg cgcgcccgcc    5280
tgcccgaggt cgtcgcccgg gagtccctgg agaaggagga acggctgcgc gccgccgcgg    5340
ccgaccccgc cttccgcagg gggctggcgc tggccggcgg cgagctggcg gtcgacctgg    5400
agacgtggct cgcggacccc gcgcggcgcc ccaagccgca gaagctgctc aggctggcca    5460
aatacctggt cagggccgcc gtgaagacca gcccgtacag cacgttcacg agcaccgggc    5520
gggcggtgtg gggcggtggc gagcggcacg tggagcgcgt ggtgccggtg ctggaactcg    5580
acggcgtcca gacgttctcg gacgatcggg tcagggtgaa tccgtcggtc accgtcgcgg    5640
gcgggacggc ggagttcatc gggccgcctc ccggggaggc gctggtgtcc atcggggtga    5700
cggaggcggt ggccgcgtgc ctgcgcgtcg cggagggcgg ggagtgggtg ccgcggggcc    5760
ggttcgcgga ggctctgggg gctgagcctg ccgcagtcac gaaatttctg gacaagttgc    5820
ttgcggttgg gctcctggag gcccggccgg acggcgaccc gcccccgcac ctgctggacg    5880
ggatccggcg cacggaacgc gccaccgacc cgtccacctt ccgccacgaa ctcggccgcc    5940
tgatcgccgc cgcccgcgcc gccgcccgcg ccaccgcccc cggcgctgac acggccaaga    6000
acgccgcccc tgccgggcgc gccacccgcg gcgatggcgg tgctgatgcc gagcgcgcca    6060
cccgcggcga tagcgatgct gatgacgggc gcgccacccg gggcgacggc ggtgctgatg    6120
acaggggcgc cgcgcggggc gacggcggtg tggggcgggc ggttgtgcac gaggtcgcgg    6180
tctgcgtcga gcccgtggcg aggctggatc cggcgcgatg gcgtggcggg cttgccgatc    6240
tcgacgtcgt acgccgctgg ctggccgttt tcgacgccaa gcaccccatg cgcctcgcgg    6300
tcgccgccta cctcaccacc cggtacggcc ccgacccggc cgtccccttc ctcacgctcc    6360
accgccacat ccagcgcgag ctggccggca ccggcgcggc aggccgggag ttgcgcgcgt    6420
tcctcggctc gtcggccgcc tggacccagc cgctaggcac ctccgccctg cccaggatca    6480
gggagctgga gcgcctcaga gccgaggcga gaagcctggc gctggacgcg gaggaccccg    6540
acggcacctg ccgcgtcacc cccggacagc tggccgcgca gctggagtcg tggccgtctt    6600
ggatcgcgat ccccgcctcc tcggcctgct acgtacaggc ggtggccggc accctggtgc    6660
tcaacgtcgt ccacggcggg cacggccgag ccctgcgcag gctcgaccac ctcctcgaac    6720
gcgccggcgg ccaccccgag ccgccccgga tcgaggaccc ggacggcgcg gtctacgccg    6780
agttctccgg cgacctgggc tccacgctca acgcgcgccc gccgagcacc cgatacgaga    6840
tcgactaccc ccactcgccc ggcacgcgcc cgcccgacct gcggctgccg ctcacggacc    6900
tgcacgtgac gctctgcccg gacagcggcc tgcccgagct gcgttccaag cggctcggcc    6960
gccgggtcgt gccgttgcat ctcgggctgg ccgccgagtt ccggcttccg ccggccgcgc    7020
ggttcatcga acgcgtcttc ggccccggct acctgctcca tcccagctcg ccgccgctgg    7080
tgcggatggg ccgggtcccc tcggaggtca cccggtatcc acgcgtcgag gccgggcgcg    7140
tggtggtgca gcggcgtcgc tggctggcgc ctgcggccac gctgccggtg cgcgcgaagg    7200
gcgagggcga cgcggcgtac ctcacgcggc tgatcgcctg ggcggacgag tacggcgtac    7260
cgcaccgatc gttcgtccgc gcctggccgg agcagaccgg cgacaaaggg caggacaagg    7320
cgcgcaaacc gctcttcctg gacctggcga acctgttcct ggtcaagaac ttcgagcggc    7380
agatacgtgg ctgcgcgttc gcgctcttcg aggaggcgct gcccgacccg ggaccggagc    7440
gggtgaccga atacctgatc gaggtgggag gccgatgagc tgggtgagcg tgcacgtctt    7500
ctcgcagggg ccgctcgacg acatgatcac gggcctggcc gggccgctcc tcggcgacga    7560
cggcttcttc ctgcgctact gggagggcgg cccgcatctg cggatcaggg tcaggtccca    7620
cccggcggag caggtcgtcg agcgggccga ggcgtatctg cgcgagcacc cgtcagaggc    7680
ggtgatcgac ccggaggagt acgccaggct cgccgcgacc ctcgccgccc gcgaaggcgt    7740
ccccggctat acgcggcgcc tctatccgaa cgactccgcc cacctcatcc cgtaccagcc    7800
ggaacacgac cgctacggca cgggccgctc gctcgacgcc gtggagcggc acttccacga    7860
ctccagcgtg atcgcactcc agctgatcgg ggcggggctc ggacacgagc ggcggagcat    7920
ggcgtggctg accatgctgc tggtcgcctg gcaggtcgcg ggggagggca gggcgttcgg    7980
cccgcccgct gacgccgggg ttcaggtgcc ccacgagcgg atggcggcgc tggtcgagca    8040
cgccagggcg gtgacacagg agcctgcgcc gagcgagccc cgtggcgtgg tggccgcctg    8100
gtacgcctcg atcgcgcggc tggtggagga actggcggcg gcggggttcg acgcggcgcg    8160
gacgggggcg accgtcgatc tggccgcgca tctgctggcc aacaggctgg ggatccgggt    8220
gcaggaggag gcccggctgc gtcacctggc gtccggggcc acgagggagt cggaggtggg    8280
ggtcggatga cctggacgcg gctgcgggtg gactatcacg acggcccgat ggacgacctc    8340
atcctggacg cgctccgccc ggcctggcat gaaatacggg gatatttcct gcgccactgg    8400
gtgtgcggcc cgcacctgcg gatcttcgtg gacggcgacg cgacgccgat cgtccgggcg    8460
gtcgagcgcc acctggccgc ctgcccgtcc gccggcacca ccgacccgca ggcgctgctc    8520
cccctgcacg agcgcctggc cgagctggaa ggcgaacgag gcccgctgct gccatgggcc    8580
cccgacaaca ccgtcaccgc cgaacccccg gggctcgaca ccgagctcga ccggttcctc    8640
gcggacttct acgccgacac caccgaggcc gcgttcgacg ccctcggccg ggtcagagcc    8700
ggcacgccgc tgccgggcat cgccttcgac ctggtggtcg ccaccgcgca cgacctgtcg    8760
gagggcggcc tgcccactgc caggacctcg ctgcgctcgc acgccgaggc ttacctgtcg    8820
cgcctgccgg gaggcgtccg cgccaagtgg caggcgcact acgaacgcaa ccaggagccg    8880
ctgaccgcca ggatcaaggc cctgaccggc gccggagagc ccggcgcgtg gctgcgtacg    8940
atccgggcca cccgcgaccg gggccgtacc ctcatcgacg agggacggct gagcctcggc    9000
tacgccaccg acggcccttc cacgcggccc ccgctcgccg cggtctcccc cttccaccgg    9060
aacctggaga ccgacgaacg ctggctcgcc ctcaaggaca cccccgcctt cgccgcctac    9120
cgcctggccc tgaactgcgc gtacctccac ctcacccggc tcggcctcac gcccgaccag    9180
cgcttcctga tctgccacct cgccgcgagc gccgccgacg acgtctaccg ggccgtggcc    9240
tcatgaccgg ggaacggtac gagctgcgcg ccggcgtgca cctcgcccgg ctggacgcgg    9300
gggtccgcct gttcgcctgg ccgcacgccg agaccctcgg cgagctcacg cgggatgagc    9360
tcgacctgct ccgcgacctg gccgccggac cccgcaccgc cgggggaccg ctcgtcgaac    9420
gcctgcgcgc cggaggctgg ctcaagatca cgattacccg ggacggcgtg cccctctaca    9480
cgctcgcccc gctgcgcccg ccgccgccac ggccggcggt gccggagcgg ccggttctgt  9540
ccaggttcgc cacgctgcgg cgcgaggggg acgcgctggt cgccggctcc ccgctggcct  9600
ggtgcgacct gtacgtccac gaccccggcc tggtcggcga cgtggtccgg cccggcggcg  9660
aggtcctggc cgacctggtg tgggccgggc tggccgtgcc cgaggaggcc gaggaccggg  9720
agctgcggtt ccggcagtgg gcgccgcacg agctggagtt ccatgaccgg agccgggtgg  9780
ggcaccgcgg ctacctgggc gatgggttcg gcgggacgtt ctgggcccgc ggccggttcg  9840
acccgctgcc cgcccggccc cggccctacc ccggccgggc gatcgagctg cccacgcccg  9900
acctggacga actgcggctc aaggacccct cgctcacgga cgtgctggag ggccgcaggt  9960
ccgtacgcga gcacgacgac gagcgcccga tcaccctcga cctgctcggc gagctgctgt  10020
accgcacggc cagggtgcgg gagtgctgga cggccgacgg cgtcgaatac acccgcaagc  10080
cgtacccctc cggagggtcc gtctacgagc tggagatcta ccccgtcgtc aggaacgtgg  10140
ccgggctcga acccggcatg taccactacg acgggcacga ccacgtgctc aggccggtac  10200
gtgaggccgg ccatcccgcc gtacgccggc tgctgaccgt cgccgggcac ggcgccgcca  10260
ccggccgccg cccccaggtc ctgctcgcgg tctccagccg cgccggccgg ctgctgtgga  10320
agtacgaagg catggggtac gcgctgacgc tcaagcacgt gggtgtgctc taccagacgc  10380
tctactgcgt ggccacggcg atgggcctgg cggcctgcgg gctcggcagc ggcgactcgg  10440
ccgcgttcgc cgaggcgacc gggcgggacc cgttggagga gtgcgcggtc ggcgaattca  10500
tgatcggaac cgcggaggca ccacgttgaa cgacttcaaa cccagactcc ccgcggacat  10560
acgcttcgcg cccacctccg gcggtgtcgc cttcctcacc cgcgaaggcg tcgtgcggat  10620
gaacggggcc tccgtccacc tgtgggtgga gcggctggcc gtgcacctcg acgggagcag  10680
gaccgtggcc gagctgaccg cggagctgcc cgacgagcgg cgggcgttcg tgacgagcct  10740
gctgaccacg ctgcgcgagc gcgggctcgt ggaggacgcg ggagagcgcg gcgtgctgcc  10800
cgtggcggcc ggcaccgcgt gctcgctgct ggccgacgcg gaccggttcg gcgagctggc  10860
gcccgccctg gccgacgccc tgcgcaggct ggggctggag gtgctgacag agccgtcggg  10920
cggggcgctc gtgcacgtcg cggcggccga cgcggacggg ctggccgccg ccgggcgcct  10980
cgaccggctg agcgccgagc gcgggctgcc catcgcgcac gtgctgctgc gcgagggcga  11040
ggcgtggtgg agcgagaccg gcgtcgtcgg gcgcgacgtc ccgccgtggg cggccgggtg  11100
gcggcggctg gcggccatgg aggccgtccc gcgtaccgcc gggcacgtct ccgtgtcgcc  11160
cgtcgccgcg gccgtggtcg ccgggcaggt ggtggcggac ctggggcgct gcctgtccgg  11220
aacgccccgc gtgtccggcg gtccgcggct gcacgtggtg gacctggacg ggttcgggat  11280
gcggacgcac tccttcctgc cgcacctgtc ggcgctgccg cccggcacgg gggtgagcgc  11340
ggggccgctc ggcgaggagg agttctcgcg gcgggcggcc aggttgatgg actcgcggac  11400
gggggtgttc gccgagatcg aggaggggga gtacgggcag ctcccgctgc acgtgtcggt  11460
gaccacggtg gccgatccga tgggggccct cgggggtgcg ctggcgcggg tgatcggcgt  11520
gggggcggac ttcgccaccg cgcgataccg ggcggcgctt aaggcactga ccgtgcacgg  11580
gctgctcgcc ctcgaccccc gccgcctggt cacggccgag gggacgcccc tgaccggcgc  11640
gggggaaccc gccagcggct tcccggctga tccgggcgcg agggaacggc cgatcggtgg  11700
cttttcggct gatccgggtg cgggtgagcg gccggacgac ggtctcctgg acgacccgct  11760
ggtgggcgac gtcgcggcgg gacgggtcga ggcgttcgtg cgcggccgtg acctcgtcga  11820
gggcggtgag gtgctgctgc ccgcccgcgc ggtgttcctg gatccgcacg ccaccggggc  11880
cgccgcgggg tactcggccg aggaggcgct ggtcgcgggg ttactggacc actgtgcggc  11940
actggccggg ctcgacggga cgctgccgcc cgtggacgtg ggcggcgcgc gggcggccga  12000
cgacgagacc gcgcggtcgg cggcgctgct ggacgcgatc gggctgccgt accaggtgct  12060
ggacgccacc ggcccgtcgg gcgtgcccgt gcacgcgggg acgctcggcg ggcggctggt  12120
ggcgcgggcg gcgggcgtca cgcccctggc cgcgctgcgg gccacgctcg aagggatcct  12180
ggccgcgtac cagggcattc cgggccccgc acccctgccc gacctgtgcc cggccgtcgc  12240
gcaggagccg ccggtcgtcc tcgacacggg ggcggccgtg ctcggcgccg gtgagctcgc  12300
cgccgccctg gccggcgccg ggctgcgggt cagcgccgtt ccgctggatc acgaccggga  12360
ggtacacgcg ctcatgccgc acgtcgtccg cgtcgtcacg gagccgctcc atggctgagg  12420
tcgtggggac gggcctgctg gccgaggaga tcacgatcgc gctgaaggac cgcgacgggc  12480
gggcagaggt gacgatcacc gcctgcgacg gctgggcgcg cggcccccgg cgcgacgggg  12540
cggcgtggtt gcccgtgcgg gtcgagtacg gggtcgccgt catcgggccg ctggaacgcc  12600
ccggcgaacc cggctgcgtg acctgcttcg agacccgccg ggaccgggtc aggaccgaca  12660
gcgccgatcg ggccgccgtc ctggccgtcc acggccccga actcgccggg cgggcctccc  12720
cgtacctcgg ccgcctggcc gcccgcacga tcgcggccct ggccgcgcac gccgccgagg  12780
gccccggatg cgccgtctgg tacgtcgacc tgcgcacgct caccgccgaa cgccacacgt  12840
tcctgccgga accccactgc cccgactgcg gcgacctgcc ggacgacgac cgcgcgtccg  12900
ccgccttcga gcccggcgcc gccccgcgac ctcccggcta ccgggtcagg aacgtgccgg  12960
ccgagcacgg cgcgctgctc gacacgtacg tggacggcga atgcgggctg atcaggcccc  13020
tcgtccggga cacgctcggc ggcctggtga tcgccggggc gatgctgccg ctgcggttcg  13080
agggcggttc ggagcccggc gtgggccgca cccgcggcta ccgggccagc gaggtcaccg  13140
ccgtgctcga agcgctcgaa cggtggggcg gcgtcgagcc cggcggcaag cgcacccgcg  13200
tgcgggcctc gtacgcggag gtggccgcgg acgcgctcga ccctcgaacg ctgggcgagc  13260
acgacacctc ctcctacgag atggaggggt tcgcgttccg gccgttcgcc gaggacgccg  13320
tctgcgactg ggtgtggggg tactccttcg cccggcgctc gccgatcctc gtgccggaga  13380
gcctggccta ttactacgta cgggggcggg agcggccgtt cctcttcgag atctcgaacg  13440
ggtgcgcgct cggcggcagc atggcggagg ccctgctcta cgggctgctg gagacggtcg  13500
agcgggacgc ctttctcatg acctggtacg ggcggctccc ggtgccgcgg atcgaccccg  13560
gcacggcacg ggaccgcacc atcccgctcc aggccgccgc gatcatcgcg gagaccggtt  13620
atcgggtgga gctgtacgac acgacgatgg agcacggcat ccccagcgtg tgggcgatgg  13680
gcgtgcggca ggacggcgat ccgggcaggc cgcgcctggt gtgcgccgcc ggggcccacc  13740
tggtgccgga gaaggccgtg ctcagcgcgc tgagcgagct ggggccgctg ctggccgacc  13800
tgatccggcg gtatccggac gaggtgcacc gagcccagga gatggtgaca aatcctgatc  13860
tggtggcgac gatgcacgac cactccaccc tgtacggcgc cgacgcggcc ttcgaccggc  13920
tctcgttcct gaccggcggc acgggcgtgc gggggctgcc cgacatggag gcgttcaccg  13980
tgcccggtga tctcgacgtc atgagggtgg tggaccgctt cctcgccgag gggatggacg  14040
tcgtcgtcat cgaccagacc acgccggagc atcgggcccg cggtttctcc tgcgtcaagg  14100
tgctggtgcc cggcacgctc ccgatgacct tcggccaccg caaccgcagg gtgcggggcc  14160
tgacccgccc gctggagctg ccgtaccggc tcggccaccg cgacacgccc ctgacccccg  14220
ccgacctgaa ccccgaccca caccccttcc catgaccacc gagccgtttc ccgcgccgac  14280
ggggccgccc gcagcgccga cggggccgtc tcccgcgctg gcggagccgt ctgctgcatc  14340
gcccggcccg ttgtccgttc ggcaggggcc gtctcctgtg accgccgagc tgcgtgacct  14400
ggcgatcttc cgtgccgatc tgcatgccca ccccgagctg tcctggcagg aggccaggac  14460
ggccgatcgc ctggcggggc ggctggcggc ggccgggtac gaggtcacga ccgggatggg  14520
cggtcatggg gtggtcggga ggctgtgccg tggcgacggg gtcacggtca tgctcagagc  14580
cgagctggac gccctccccg tcaaggagga gaccggcctg tcatacgcca gcaccgccac  14640
cgccacgacc ctcgacggca ggacggtgcc ggtctcccac gcctgcggcc acgacctcca  14700
tctcgcctgc ctggtcggcg ccgcccggcg gctggccgcc tgcgacgact ggcggggcac  14760
ggtgctcgtg atcggccagc ccgccgagga gacgctggag ggcgccgccg cgatgctcgc  14820
cgacggcctg tacgagcggt tcggcgtccc ggacgtggcg ctggcccagc acgtctcgcc  14880
gttccccgcg ggcctgatcg cctacccgga gccgcccacc gcggccggcg ccgaactccg  14940
cgtcgtcgtc acgggggacg gcggccacgt cggagacatc ggccgggctg gtcacgtcga  15000
tcgagccgtg gggcgcaatc cggtcgcggc cgtcgccgcg ctcgttcacc ggctcgatca  15060
gacggcgttc gaccaggcga tcgtcaccgt ggggacgttg cacgcgggcg agcgcgccaa  15120
cgtgatcccc accctcgccg aggccgggat cacggtcagg gccgcgacgg aggaggcggt  15180
gacccgggcc gtcgcccgcg tcgcccggct ggcggaggag acggcgggag ccggcgtcat  15240
cgtggtctcc agggtgccgc ccggcgtgaa cgaccccgcc gccaccgccc tggtacgccg  15300
ggcccacgag gccgcgctcg gcgcggtcgt caccgccccc ggcggctcgg cctgcgagga  15360
cttccccctc tacggggtgc cctccgtcta ctggtacgtg ggcgcggccc cacccgccgg  15420
cctggtcgga cgcccgcata ccgggacttt ccgccccgat cccgtgccca cgttgagggc  15480
aggggtcacc gccatgcaaa cggctgccct ggcagtcctt gcgaacgcgt cacagttcgc  15540
ccctccatcc cgatatcatg gacccggagc agtagccgag cactga                 15586
 
<210>64
<211>60
<212>PRT
<213>野野村氏菌属物种
 
<400>64
 
Met Ser Asn Ala Ser Ile Gly Gln Glu Ile Gly Val Glu Gly Leu Thr
1               5                   10                  15
Gly Leu Asp Val Asp Ala Leu Glu Ile Ser Asp Tyr Val Asp Glu Thr
            20                  25                  30
Leu Leu Asp Gly Glu Asp Leu Thr Val Thr Met Ile Ala Ser Ala Ser
        35                  40                  45
Cys Thr Thr Cys Ile Cys Thr Cys Ser Cys Ser Ser
    50                  55                  60
 
<210>65
<211>180
<212>DNA
<213>野野村氏菌属物种
 
<400>65
atgagtaatg cctccatcgg tcaggagatc ggcgtcgagg gcctgacggg cctggacgtc    60
gacgctctgg agatcagcga ctacgtggac gagacgctgc tcgacggcga ggacctcacg    120
gtgacgatga tcgcctccgc ctcgtgcacc acctgcatct gcacgtgcag ctgcagctcc    180

Claims (38)

1.包含选自以下的氨基酸序列的硫肽前体蛋白质:
(i)SEQ ID NO:1;
(ii)SEQ ID NO:5;
(iii)SEQ ID NO:11;
(iv)或当与SEQ ID NO:1、SEQ ID NO:5或SEQ ID NO:11相比时,具有不超过1、2、3、4、5、6或10个缺失、插入和/或取代氨基酸的所述氨基酸序列的变体。
2.权利要求1的硫肽前体蛋白质,其中所述前体是Ef-tu硫肽抑制剂的生物合成前体。
3.权利要求2的硫肽前体蛋白质,其中所述Ef-tu抑制剂选自GE2270A、GE37648A、Amythiamicin或如以下任意通式I-XI中的任意通式所示的化合物:
Figure FPA00001021253300011
Figure FPA00001021253300031
Figure FPA00001021253300041
4.核酸,其包含编码权利要求1-3中任一项的硫肽前体蛋白质的核苷酸序列。
5.权利要求4的核酸,其包含SEQ ID NO:5的核苷酸序列。
6.权利要求5的核酸,其包含SEQ ID NO:6的核苷酸序列或包含至少SEQ ID NO:5的其任何片段。
7.权利要求4-6中任一项的核酸,其中所述核酸序列有效连接异源转录和翻译控制序列。
8.权利要求7的核酸,其中所述核酸是表达载体。
9.用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID NO:23-34中的任一个,
(ii)(i)中列出的氨基酸序列的变体,当与(i)中列出的相应野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6、或10个缺失、插入或取代氨基酸,并保留基本上相同的酶功能。
10.核酸,其包含编码权利要求9的多肽的核苷酸序列。
11.权利要求10的核酸,其中所述核酸序列有效连接异源转录和翻译序列。
12.包含权利要求1-86中任一项的核酸的宿主细胞,其中在所述宿主细胞的基因组中未天然发现所述核酸。
13.权利要求12的宿主细胞,其还包含硫肽生物合成所需的其他基因。
14.权利要求13的宿主细胞,其中硫肽生物合成所需的所述其他基因包含权利要求10或11定义的核酸。
15.权利要求13或14的宿主细胞,其选自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种、大肠杆菌(Escherichia coli)、棒杆菌属物种(Corynebacterium sp.)、芽孢杆菌属物种(Bacillus sp.)和链霉菌属物种,如变铅青链霉菌、天蓝色链霉菌、白色链霉菌(Streptomyces albus)、Streptomyces ramocissimus、丘链霉菌(Streptomyces collinus)、弗氏链霉菌(Streptomyces fradiae)、远青链霉菌或灰色链霉菌(Streptomycesgriseus),并且其中所述宿主细胞针对所述硫肽提供抗性。
16.突变体微生物,其中与相应野生型微生物相比时,所述突变体微生物不再表达编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因。
17.权利要求16的突变体微生物,其中所述突变在相应野生型微生物中是编码如权利要求1-8中任一项定义的硫肽前体蛋白质的基因的破坏。
18.权利要求17的突变体微生物,其中所述微生物是野野村氏菌属物种并且所述突变是包含SEQ ID NO:15或SEQ ID NO:16的基因的破坏。
19.权利要求16-18中任一项的突变体微生物,其中用权利要求1-8中任一项的核酸进一步转化所述突变体。
20.突变体微生物,其中所述突变体微生物不再表达编码如权利要求9定义的一个或多个多肽的一个或多个基因。
21.用于硫肽生物合成的多肽,其包含选自以下的氨基酸序列:
(i)SEQ ID NO:47-60的中任一个,
(ii)(i)中列出的氨基酸序列的变体,与(i)中列出的相应野生型氨基酸序列相比时,其具有不超过1、2、3、4、5、6或10个缺失、插入或取代氨基酸,并保留基本上相同的酶促功能或调节功能,
(iii)(i)中列出的氨基酸序列的变体,其与(i)中列出的一个多肽具有至少80%或至少90%的同一性,并保留基本上相同的酶促功能或调节功能。
22.包含编码权利要求21的多肽的核苷酸序列的核酸。
23.权利要求22的核酸,其中所述核酸序列有效连接异源转录和翻译序列。
24.包含权利要求22或23的核酸的宿主细胞,其中在所述宿主细胞的基因组中未天然发现所述核酸。
25.权利要求24的宿主细胞,其还包含硫肽生物合成需要的其他基因。
26.权利要求25的宿主细胞,其中硫肽生物合成需要的所述其他基因选自编码权利要求4-8中任一项的硫肽前体蛋白质的核酸和权利要求10-11的核酸。
27.突变体微生物,其能够产生一个或多个特定基因的表达有缺陷的硫肽,所述特定基因编码如权利要求21中所定义的一个或多个多肽。
28.用于产生硫肽前体蛋白质的方法,所述方法包括在适合于产生所述硫肽前体蛋白质的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。
29.产生硫肽化合物的方法,所述方法包括在适合于产生所述硫肽前体化合物的条件下培养权利要求12、13、15或24-26的宿主细胞的步骤。
30.权利要求28或29的方法,其还包括分离基本纯形式的所述硫肽前体或硫肽化合物。
31.权利要求29或30的方法,其中所述硫肽化合物选自:GE2270A、GE37648A、如权利要求5中任意通式I-X中任意通式所示的化合物、amythiamicin、微球菌素、硫链丝菌肽、诺雪七肽、高硫青霉素、thiocins、nocathiacins、伯尔尼霉素、A10255B和radamycin。
32.产生硫肽衍生物的方法,其包括:
(i)通过在所述宿主细胞中基因表达编码所述改变的硫肽前体的序列,在宿主细胞中合成改变的硫肽前体,
(ii)从所述改变的硫肽前体合成所述硫肽衍生物。
33.权利要求32的方法,其中所述改变的硫肽衍生物前体是如权利要求1-11中任一项定义的SEQ ID NO:1、SEQ ID NO:5或SEQ ID NO:11的变体。
34.权利要求32或33的方法,其中步骤ii)在体外进行。
35.权利要求32或33的方法,其中步骤ii)在与步骤i)相同的宿主细胞中体内进行。
36.产生硫肽或硫肽衍生物的方法,其包括:
(i)提供包含如1-11中任一项中定义的硫肽前体蛋白质的培养基,
(ii)在所述培养基中培养微生物,其中所述微生物还包含硫肽生物合成所需的其他基因。
37.权利要求36的方法,其中硫肽生物合成所需的所述其他基因选自编码下述多肽的那些基因,所述多肽选自SEQ ID NO:23-34和SEQ IDNO:47-60。
38.权利要求36或37的方法,其中所述微生物选自自野野村氏菌属物种、游动双孢菌属物种、拟无枝酸菌属物种和链霉素物种,如变铅青链霉菌、天蓝色链霉菌、白色链霉菌、Streptomyces ramocissimus、丘链霉菌、弗氏链霉菌、远青链霉菌或灰色链霉菌,其中所述微生物是选择为对所述硫肽或硫肽衍生物有抗性的菌株。
CN200880102696A 2007-08-09 2008-08-06 硫肽前体蛋白质、编码该蛋白质的基因及其用途 Pending CN101809030A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP07114121 2007-08-09
EP07114121.2 2007-08-09
PCT/EP2008/060339 WO2009019289A1 (en) 2007-08-09 2008-08-06 Thiopeptide precursor protein, gene encoding it and uses thereof

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310347021.6A Division CN103483424A (zh) 2007-08-09 2008-08-06 硫肽前体蛋白质、编码该蛋白质的基因及其用途

Publications (1)

Publication Number Publication Date
CN101809030A true CN101809030A (zh) 2010-08-18

Family

ID=38543755

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201310347021.6A Pending CN103483424A (zh) 2007-08-09 2008-08-06 硫肽前体蛋白质、编码该蛋白质的基因及其用途
CN200880102696A Pending CN101809030A (zh) 2007-08-09 2008-08-06 硫肽前体蛋白质、编码该蛋白质的基因及其用途

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201310347021.6A Pending CN103483424A (zh) 2007-08-09 2008-08-06 硫肽前体蛋白质、编码该蛋白质的基因及其用途

Country Status (11)

Country Link
US (1) US20110183374A1 (zh)
EP (2) EP2647647A3 (zh)
JP (1) JP2010535481A (zh)
KR (1) KR20100049580A (zh)
CN (2) CN103483424A (zh)
AU (1) AU2008285655B2 (zh)
BR (1) BRPI0815371A2 (zh)
CA (1) CA2695813A1 (zh)
EA (1) EA201000273A1 (zh)
MX (1) MX2010001491A (zh)
WO (1) WO2009019289A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110791482A (zh) * 2013-09-13 2020-02-14 Reg生命科学有限责任公司 改进的乙酰-coa羧化酶变体
CN114561406A (zh) * 2022-04-26 2022-05-31 北京工商大学 一种参与阳离子肽化合物合成的基因及其用途

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101586112B (zh) * 2009-06-19 2011-06-22 中国科学院上海有机化学研究所 诺丝七肽的生物合成基因簇
CN101684471A (zh) * 2009-07-24 2010-03-31 中国科学院上海有机化学研究所 诺卡噻唑菌素的生物合成基因簇
WO2014167371A1 (en) 2013-04-12 2014-10-16 Naicons S.C.A.R.L. Analogs of the antibiotic aminothiazole ge2270
EP3111949A1 (en) * 2015-07-01 2017-01-04 Deinobiotics New bicyclic lipopeptide, preparation and use as antimicrobial agent
CN106319004B (zh) * 2015-07-09 2020-10-27 牡丹江佰佳信生物科技有限公司 一种可提高那西肽产量的发酵培养基及培养方法
CN107641146B (zh) * 2016-07-21 2022-10-04 中国科学院上海有机化学研究所 高产盐屋霉素及其类似物的产生菌、盐屋霉素及其类似物的制法及其用途
CN106366168B (zh) * 2016-08-26 2020-09-15 上海交通大学 羊毛硫肽类抗菌肽及其脱氢衍生物的制备方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5639949A (en) * 1990-08-20 1997-06-17 Ciba-Geigy Corporation Genes for the synthesis of antipathogenic substances
US6485972B1 (en) * 1998-10-15 2002-11-26 President And Fellows Of Harvard College WNT signalling in reproductive organs
WO2001064835A2 (en) * 2000-02-28 2001-09-07 Hyseq, Inc. Novel nucleic acids and polypeptides
WO2001057251A2 (en) * 2000-02-04 2001-08-09 Aeomica, Inc. Methods and apparatus for predicting, confirming, and displaying functional information derived from genomic sequence
US6436703B1 (en) * 2000-03-31 2002-08-20 Hyseq, Inc. Nucleic acids and polypeptides

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110791482A (zh) * 2013-09-13 2020-02-14 Reg生命科学有限责任公司 改进的乙酰-coa羧化酶变体
CN114561406A (zh) * 2022-04-26 2022-05-31 北京工商大学 一种参与阳离子肽化合物合成的基因及其用途

Also Published As

Publication number Publication date
EA201000273A1 (ru) 2010-10-29
US20110183374A1 (en) 2011-07-28
EP2647647A2 (en) 2013-10-09
AU2008285655A1 (en) 2009-02-12
CN103483424A (zh) 2014-01-01
KR20100049580A (ko) 2010-05-12
EP2647647A3 (en) 2014-10-01
MX2010001491A (es) 2010-03-01
WO2009019289A1 (en) 2009-02-12
AU2008285655B2 (en) 2012-03-08
JP2010535481A (ja) 2010-11-25
CA2695813A1 (en) 2009-02-12
EP2178907A1 (en) 2010-04-28
BRPI0815371A2 (pt) 2015-02-10

Similar Documents

Publication Publication Date Title
KR101573536B1 (ko) 악티노플레인스 가르바디넨시스 및 악티노플레인스리구리애로부터의 란티바이오틱 생합성 유전자 클러스터
DK2271666T3 (da) Nrps-pks-gengruppe og dens manipulation og anvendelighed
CN101809030A (zh) 硫肽前体蛋白质、编码该蛋白质的基因及其用途
EP2342335B1 (en) Novel gene cluster
KR20100039443A (ko) 답토마이신 생합성 유전자 클러스터에 관련된 조성물 및 방법
NZ508326A (en) A polyketide synthase and non ribosomal peptide synthase genes, isolated from a myxobacterium, necessary for synthesis of epothiones A and B
KR20070033979A (ko) 플라디에놀라이드의 생합성에 관여하는 폴리펩티드를코딩하는 dna
CN111378008B (zh) 脂肽类化合物Totopotensamides及其制备方法和应用
CN107794286B (zh) 一种环脂肽类化合物生物合成基因簇及其激活方法与应用
CN101691575B (zh) 一种萨菲菌素的生物合成基因簇
US20020164747A1 (en) Gene cluster for ramoplanin biosynthesis
CA2501393A1 (en) Genes and proteins for the biosynthesis of the glycopeptide antibiotic a40926
WO2002059322A9 (en) Compositions and methods relating to the daptomycin biosynthetic gene cluster
CN101586112B (zh) 诺丝七肽的生物合成基因簇
CN101184838B (zh) 基因重组微生物及使用这些微生物的大环内酯类化合物的制备方法
JP7086984B2 (ja) Streptomyces fungicidicusの遺伝子組換え株におけるエンデュラシジンの産生を増強するための組成物及び方法
US7364877B2 (en) Polynucleotides encoding disorazole polyketide synthase polypeptides
CA2450691C (en) Genes and proteins involved in the biosynthesis of lipopeptides
US20030211567A1 (en) Compositions, methods and systems for discovery of lipopeptides
CN101027395A (zh) 用于制备复合聚酮化合物的生物合成基因簇
CA2522622A1 (en) New process for improving the manufacture of clavams e.g. clavulanic acid
US20040132055A1 (en) Recombinant chalcomycin polyketide synthase and modifying genes
WO2003040372A2 (en) Polynucleotides and polypeptides involved in clavulinic acid biosynthesis and use thereof
FR2786200A1 (fr) Genes de biosynthese et de transfert des 6-desoxy-hexoses chez saccharopolyspora erythraea et chez streptomyces antibioticus et leur utilisation
KR20080032641A (ko) 티오코랄린의 생합성에 수반되는 유전자 및 그의 이종적생산

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: Basel

Applicant after: Novartis Ag

Address before: Basel

Applicant before: Novartis AG

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: NOVARTIS AG TO: NOVARTIS CO., LTD.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20100818