[go: up one dir, main page]

CN1659276A - 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法 - Google Patents

磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法 Download PDF

Info

Publication number
CN1659276A
CN1659276A CN038135949A CN03813594A CN1659276A CN 1659276 A CN1659276 A CN 1659276A CN 038135949 A CN038135949 A CN 038135949A CN 03813594 A CN03813594 A CN 03813594A CN 1659276 A CN1659276 A CN 1659276A
Authority
CN
China
Prior art keywords
seq
polypeptide
nucleic acid
phospholipase
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN038135949A
Other languages
English (en)
Inventor
S·格拉马蒂科瓦
G·黑尔伍德
D·拉姆
N·巴顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BASF Enzymes LLC
Original Assignee
Diversa Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Diversa Corp filed Critical Diversa Corp
Publication of CN1659276A publication Critical patent/CN1659276A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01KANIMAL HUSBANDRY; AVICULTURE; APICULTURE; PISCICULTURE; FISHING; REARING OR BREEDING ANIMALS, NOT OTHERWISE PROVIDED FOR; NEW BREEDS OF ANIMALS
    • A01K2217/00Genetically modified animals
    • A01K2217/05Animals comprising random inserted nucleic acids (transgenic)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Immobilizing And Processing Of Enzymes And Microorganisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供具有磷脂酶活性,包括,例如,磷脂酶A、B、C和D活性,马铃薯块茎储藏蛋白活性,脂酰水解酶(LAH)活性的新型多肽,编码它们的核酸和结合它们的抗体。也提供包括应用这些磷脂酶的工业方法,如,油脱胶,以及包括应用这些磷脂酶的产品。

Description

磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
发明领域
本发明总体上与磷脂酶,编码磷脂酶的多核苷酸,制备以及应用这些多核苷酸和多肽的方法。特别地,本发明提供具有磷脂酶活性的新颖多肽,编码它们的核酸以及与它们结合的抗体。也提供工业方法和包括应用这些磷脂酶的产品。
背景技术
磷脂酶是水解磷脂的酯键的酶。与它们在磷脂代谢的重要性相对应,这些酶广泛存在于真核和原核生物中。磷脂酶影响代谢,生物膜的形成和重组,并且磷脂酶也涉及信号的级联。按照磷脂分子攻击的键的位置,已知有几种类型的特异性不同的磷脂酶。磷脂酶A1(PLA1)去除1-位的脂肪酸而产生游离的脂肪酸和1-溶血-2-酰基磷脂。磷脂酶A2(PLA2)去除2-位的脂肪酸而产生游离的脂肪酸和1-酰基-2-溶血磷脂。PLA1和PLA2酶可能是在细胞内也可以在细胞外,是膜结合的或者可溶的。发现胞内的PLA2存在于几乎所有的哺乳动物细胞中。磷脂酶C(PLC)去除磷酸组分,产生1,2二酰基甘油和磷基。磷脂酶D(PLD)产生1,2-二酰基甘油磷酸和碱性基团。PLC和PLD在细胞功能和信号传导中是重要的。PLD曾经是在生物催化中主要的磷脂酶(参见,如,Godfrey,T.and West S.(1996)工业酶学,299-300,Stockton Press,New York)。马铃薯块茎储藏蛋白(Patatins)是另一类磷脂酶,认为其作用如同PLA(参见例如,Hirschberg HJ,et al.,(2001),EurJ Biochem 268(19):5037-44)。
普通的含油种子,如大豆,油菜籽,向日葵籽,芝麻和花生用于油的来源和原料。在榨油的过程中,种子用机械和热处理。油分离,并且用溶剂从粗粉中分离。应用蒸馏法,从油中分离出溶剂并且回收。油经过“脱胶(degummed)”并且进行精练。粗粉中的溶剂组分可以通过“脱溶剂烤炉”的热处理来蒸发,随后,粗粉干燥和冷却。当溶剂通过蒸馏分离以后,产生的粗油经过特殊的脱胶程序和物理精练的方法加工成为食用油。也可以作为原料产生脂肪酸和甲基酯。粗粉可以用做动物饲料(animal rations)。
脱胶(degumming)是精练植物油的第一步,脱胶设计为去除与油一起抽提、但影响以后的工艺过程的污染磷脂。这些磷脂仅仅以无水形式溶于植物油中,如果通过简单的水合作用,磷脂可以沉淀并去除。水合作用一般通过少量的水与充分干燥的油连续混合进行。典型地,水的量是磷脂含量的75%,磷脂的量典型地是1到1.5%。虽然假如在50℃到80℃的范围内,油的粘度会降低,水合胶的分离更好,但是温度条件并不高度严格。
很多油脱胶(oil degumming)的方法目前都在使用。油脱胶的过程可以通过使用磷脂酶进行酶协助。磷脂酶A1和A2已经应用于不同商业过程中的油脱胶过程,如“ENZYMAXTM脱胶”(Lurgi Life Science Technologies GmbH,Germany)。也已经考虑磷脂酶C(PLC)应用于油的脱胶,因为磷脂酶C在磷脂上作用产生的磷酸组分是水溶性的,并且容易去除,而且甘油二酯与油在一起,降低了损失;参见,如Godfrey,T.and West S.(1996)工业酶学pp.299-300,Stockton Press,NewYork,Dahlke(1998)“An enzymatic process for the physical refining of seed oils,”Chem.Eng.Technol.21:278-281,Clausen(2001)“Enzymatic oil degumming by anovel microbial phospholipase,”Eur.J.Lipid Sci.Technol.103:333-340。
高磷脂油(high phosphatide oils),例如黄豆,芸苔和向日葵的处理方法不同于别的油如棕榈的处理方法。不像低磷脂油的蒸汽或“物理精练”处理过程,这些高磷油需要特定的化学和机械处理去除含磷的磷脂。这些油一般通过化学精练的过程,化学精练过程必需中和形成皂的游离脂肪酸和一种不溶性的胶组成。中和过程对于去除游离脂肪酸和磷脂非常有效,但是该过程也导致了显著的产率损失和质量的下降。在一些情况下,高磷脂的粗制油在苛性中和前进行脱胶。利用卵磷脂的大豆油就是这种情况,其中的油首先用水或者酸来脱胶。
植物固醇(phytosterols)(植物甾醇(plant sterols))是天然产物的三萜家族的成员,其包括超过100种不同的植物固醇和超过4000种其它种类的三萜。总体上,认为植物固醇是由于增加类固醇/磷脂的比例而导致膜的硬化从而稳定植物的细胞膜。在化学上,植物固醇在结构上非常类似于胆固醇。主要的植物固醇是β-谷甾醇,芸苔固醇和豆固醇。其它的包括豆甾烯醇(二氢β-谷甾醇),二氢谷甾醇,24-脱氢胆固醇,海绵甾醇,海绵甾醇,γ-谷甾醇和菜子甾醇。
植物甾醇是健康和营养工业中的重要的农产品。它们用于制造化妆品的乳化剂并且为激素药物的生产提供大多数甾体中间体和前体。植物甾醇的饱和类似物以及它们的酯已经被认为是益于心血管健康的有效的降低胆固醇的试剂。植物甾醇通过在肠腔中抑制胆固醇的吸收来降低血清中的胆固醇水平,并且植物甾醇在很低的水平具有免疫调节特征,包括T淋巴细胞增强的细胞应答和抗癌症细胞系的天然杀伤细胞的细胞毒性。此外,它们在治疗肺结核,风湿性关节炎,控制HIV-感染的病人和马拉松选手的免疫压力抑制的临床研究中的治疗效应已经得到证明。
植物固醇的酯类,也指植物甾醇酯,由美国食品药品管理局(FDA)批准为GRAS(一般认为安全,Generally Recognized As Safe),用于人造黄油,并在1999年推广。2000年9月,FDA也提出一个过渡性的规定,其准许了含有植物甾醇酯类的食品的健康申明标记(health-claiming labeling)。因此,用植物甾醇酯类进行营养强化的食品是高度预期被消费者接受的。
发明概述
本发明提供包括与本发明的典型序列,例如SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO.31,SEQ ID NO:33,SEQID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEOID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550,1600,1650,1700,1750,1800,1850,1900,1950,2000,2050,2100,2200,2250,2300,2350,2400,2450,2500,或者更多的残基范围内具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多的或者完全的(100%)的序列同一性的核酸序列的分离的或者重组的核酸,编码具有磷脂酶,例如磷脂酶A,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO:1在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续的残基范围内具有至少81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中该核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO:3在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续的残基范围内具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO:5在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续残基范围内具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
发明提供包括与SEQ ID NO:7在至少大约10,15,20,25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850更多连续残基范围内具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的核酸序列的分离的或者重组的核酸,其中核酸编码具有磷脂酶,例如磷脂酶A,B,C或者D活性的至少一个多肽,同时序列同一性用序列比较算法分析或者目测检查来确定。
在可选择的方面,分离的或者重组的核酸编码包括在序列SEQ ID NO:2,SEQID NO:4,SEQ ID NO:6,或者SEQ ID NO:8中阐明的序列的多肽。一方面,这些多肽具有磷脂酶,例如,磷脂酶A,B,C或者D活性。
一方面,序列比较算法是BLAST算法,如BLAST 2.2.2版算法。一方面,筛选设置(filtering setting)设为blastall-p,blastp-d“nr pataa”-F F,所有其它可选项(options)设为默认值。
一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切断甘油磷酸酯键)。磷脂酶活性可以包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性包括磷脂酶C(PLC)活性,磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2活性,磷脂酶D(PLD)活性,如磷脂酶D1或者磷脂酶D2活性或者patatin活性。磷脂酶活性可以包括糖蛋白的水解,如,在马铃薯块茎中发现的糖蛋白的水解。磷脂酶活性可以包括马铃薯块茎储藏蛋白(patatin)的酶活性,磷脂酶活性可以包括脂酰水解酶(LAH)活性。
一方面,分离的或者重组的核酸编码具有热稳定性的磷脂酶活性的多肽。多肽可以在包括大约37℃到95℃;大约55℃到85℃,70℃到95℃,或者大约90℃到95℃之间的温度范围的条件下保持磷脂酶活性。另一方面,分离或者重组的核酸编码具有耐热的磷脂酶活性的多肽。多肽可以在暴露于37℃到95℃的温度范围内或者高于55℃到85℃的范围内后仍保持磷脂酶活性。一方面,多肽在pH 4.5下,暴露于高于90℃到95℃的范围后仍保持磷脂酶活性。
多肽在包括大约pH 7,pH 6.5,pH 6.0,pH 5.5,pH 5,或者pH 4.5的条件下可以保持磷脂酶的活性。多肽可以在包括温度范围为大约40℃到大约70℃的条件下保持磷脂酶活性。
一方面,分离的或者重组的核酸包括在严谨条件下与在SEQ ID NO:1,SEQ IDNO:3,SEQ ID NO:5,或SEQ ID NO:7中阐明的序列杂交的核酸,其中该核酸编码具有磷脂酶活性的多肽。正如在此所述的,核酸可以是基因或者转录本的至少大约10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850残基或者全长残基,具有或者不具有信号序列。正如在此所述的,严谨条件可以是高度严谨,中度严谨或者低严谨性。严谨条件可以包括洗涤步骤,如,包括在0.2×SSC,大约65℃条件下洗涤大约15分钟的洗涤步骤。
发明提供用于鉴定编码具有磷脂酶,例如磷脂酶活性的多肽的核酸的核酸探针,其中该探针包括发明的序列,例如在SEQ ID NO:1,SEQ ID NO:3,SEQ IDNO:5,或者SEQ ID NO:7中阐明的序列的至少10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850个或者更多的连续碱基,该探针通过结合或者杂交确定核酸。探针可以包括含有在SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,和/或SEQ ID NO:7中阐明的序列的至少大约10到50,大约20到60,大约30到70,大约40到80,或者大约60到100的连续碱基的寡聚核苷酸。
发明提供用于鉴定编码具有磷脂酶,如,磷脂酶活性的多肽的核酸的核酸探针其中探针包括发明的核酸,例如在至少大约10,20,30,40,50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850或者更多连续残基的范围内,与SEQ ID NO:1,SEQ ID NO:3,SEQ IDNO:5,和/或SEQ ID NO:7或者它们的亚序列具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)的序列同一性的核酸,其中序列同一性通过序列比较算法分析或者目测检查确定。
发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括发明的核酸序列或者片段或者亚序列的核酸序列。扩增引物序列的每一个成员可能包括含有至少大约10到50个连续碱基元列,或者大约12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个连续碱基元列的寡聚核苷酸。
发明提供扩增引物对,其中引物对包括具有如发明的核酸的大约第一个(5′端)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基所阐明的序列的第一成员,和具有与第一成员的互补链的第一个(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基所阐明的序列的第二成员。
应用发明的扩增引物对,发明提供通过扩增,例如,聚合酶链式反应(PCR)产生的磷脂酶。应用发明的扩增引物对,发明提供通过扩增,例如,聚合酶链式反应(PCR)制备磷脂酶的方法。一方面,扩增引物扩增来自文库的核酸,如,基因文库(gene library),如环境文库(environmental library)。
发明提供扩增编码具有磷脂酶活性的多肽的核酸的方法,包括用可以扩增发明的核酸序列或者其片段或者其亚序列的扩增引物序列来扩增模板核酸序列。扩增引物可以是发明的扩增引物对。
发明提供包括发明的核酸或者它的亚序列的表达盒(expression cassettes)。一方面,表达盒可以包括连接启动子的核酸。启动子可以是病毒的,细菌的,哺乳动物或者植物启动子。一方面,植物启动子可以是马铃薯,水稻,玉米,小麦,烟草或者大麦启动子。启动子可以是组成型启动子。组成型启动子可以包括CaMV35S。另一方面,启动子可以是可诱导的启动子。一方面,启动子可以是组织-特异性启动子或者环境调控或者发育调控启动子。因此,启动子可以是,如,种子-特异性,叶子-特异性,根-特异性,茎-特异性或者脱落-诱导的启动子。一方面,表达盒可以进一步包括植物的或者植物病毒的表达载体。
发明提供包括发明的表达盒(如载体)或者发明的核酸的克隆载体。克隆载体可以是病毒载体,质粒,噬菌体,噬菌质粒,粘粒,fosmid,细菌噬菌体或者人工染色体。病毒载体可以包括腺病毒载体,逆转录病毒载体或者腺相关病毒载体。克隆载体可以包括细菌人造染色体(BAC),质粒,细菌噬菌体P1衍生载体(PAC),酵母人造染色体(YAC),或者哺乳动物人造染色体(MAC)。
发明提供含有发明核酸或者发明表达盒(如,载体)或者发明克隆载体的转化的细胞。一方面,转化细胞可以是细菌细胞,哺乳动物细胞,真菌细胞,酵母细胞,昆虫细胞或者植物细胞。一方面,植物细胞可以是马铃薯,小麦,水稻,玉米,烟草或者大麦细胞。
发明提供包括发明的核酸或者发明的表达盒(如,载体)的转基因非-人类动物。一方面,动物是小鼠。
发明提供包括发明的核酸或者发明的表达盒(如,载体)的转基因植物。转基因植物可以是玉米植物,马铃薯植物,番茄植物,小麦植物,油籽植物,油菜籽植物,大豆植物,水稻植物,大麦植物,或烟草植物。发明提供包括发明的核酸或发明的表达盒(例如,载体)的转基因种子。转基因种子可以是玉米种子,小麦种子,油籽,油菜籽(芸苔植物),大豆种子,棕榈种子,向日葵种子,芝麻种子,花生或烟草植物种子。
发明提供含有在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。发明提供抑制细胞内磷脂酶信使翻译的方法,包括往细胞中施用或者在细胞中表达包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。
发明提供包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡聚核苷酸。发明提供抑制细胞内磷脂酶信使翻译的方法,包括往细胞中施用或者在细胞中表达包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。反义寡聚核苷酸可以是在10到50,大约20到60,大约30到70,大约40到80,大约60到100,大约70到110,或者大约80到120个碱基的长度。
发明提供抑制细胞内磷脂酶如,磷脂酶信使翻译的方法,包括往细胞中施用或者在细胞中表达包括在严谨条件下可以与发明的核酸互补或杂交的核酸序列的反义寡核苷酸。发明提供包括发明序列的亚序列的双链抑制RNA(RNAi)分子。一方面,RNAi长度是大约15,16,17,18,19,20,21,22,23,24,25或者更多的双链核苷酸。发明提供在细胞内抑制磷脂酶,如磷脂酶表达的方法,包括往细胞中施用或者在细胞中表达双链抑制RNA(RNAi),其中RNA包括发明序列的亚序列。
发明提供包括与发明的典型多肽或肽在至少大约25,50,75,100,125,150,175,200,225,250,275,300,325,350或者更多残基,或者全长的多肽范围内具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)同一性的氨基酸序列的分离的或者重组的多肽,序列同一性通过序列比较算法分析或者通过目测观察来确定。发明的典型多肽或者肽序列包括SEQ ID NO:2,SEQ ID NO:4,SEQID NO:6或者SEQ ID NO:8。一方面,发明提供包括与SEQ ID NO:2具有至少81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。一方面,发明提供包括与SEQID NO:4具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。一方面,发明提供包括与SEQ ID NO:6具有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。一方面,发明提供包括与SEQID NO:8具有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或者更多,或者完全的(100%)序列同一性的氨基酸序列的分离的或者重组的多肽。发明提供由发明的核酸编码的分离的或者重组的多肽。在可选择方面,多肽可以具有如SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,或者SEQ ID NO:8中阐明的序列。多肽可以具有磷脂酶活性,如,磷脂酶A,B,C或者D活性。
发明提供含有缺乏信号序列的发明的多肽的分离的或者重组的多肽,一方面,缺乏信号肽的多肽与SEQ ID NO:2的残基30到287具有至少81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或者更多序列同一性,缺乏信号肽的多肽具有与SEQ IDNO:4的残基25到283有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多序列同一性的氨基酸序列,与SEQ ID NO:6的残基26到280有至少78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多序列同一性的氨基酸序列,与SEQ ID NO:8的残基40到330有至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多的序列同一性的氨基酸序列。序列同一性通过序列比较算法分析或者通过目测观察确定。
发明的另一方面提供分离的或者重组的多肽或者肽,分离的或者重组的多肽或者肽包括发明的多肽或肽序列,与之实质上的一致序列,与之互补序列的至少10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,95或者100或者更多的连续碱基。肽可以是,例如,产生免疫性的片段,基元(如,结合位点)或者活性位点。
一方面,发明分离的或者重组的多肽(有或没有信号序列)具有磷脂酶活性。一方面,磷脂酶活性包括催化甘油磷酸酯键的水解(即,切割甘油磷酸酯键)。磷脂酶活性包括催化植物油中磷脂的酯键的水解。植物油磷脂可以包括油籽的磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性,磷脂酶A(PLA)活性,如磷脂酶A1或者磷脂酶A2的活性,磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性。磷脂酶活性可以包括水解糖蛋白,如,马铃薯储存块茎中的糖蛋白。磷脂酶活性可以包括脂酰水解酶(LAH)活性。
一方面,磷脂酶活性是热稳定性的。多肽可以在包括温度范围在大约37℃到大约95℃之间,大约55℃到大约85℃之间,大约70℃到大约95℃之间,或者大约90℃到大约95℃之间的条件下保持磷脂酶活性。另一方面,磷脂酶活性可以是耐热的。多肽可以在暴露于温度范围高于37℃到大约95℃,或者在高于55℃到大约85℃下后仍保持磷脂酶活性。一方面,多肽可以在暴露于温度范围在90℃到大约95℃,在pH4.5下后仍保持磷脂酶活性。
一方面,多肽可以在包括大约pH 6.5,pH 6,pH 5.5,pH 5,pH 4.5或者pH4的条件下保持磷脂酶活性。另一方面,多肽可以在包括大约pH 7,pH 7.5,pH 8,pH 8.5,pH 9,pH9.5,pH 10,pH 10.5,或pH 11的条件下保持磷脂酶活性。
一方面,分离的或者重组的多肽可以包括发明的多肽,其缺乏信号序列。一方面,分离的或者重组的多肽可以包括含有异源信号序列,如异源的磷脂酶或者非-磷脂酶的信号序列的本发明多肽。
发明提供含有与SEQ ID NO:2的1到29残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,含有与SEQ ID NO:4的1到24残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,含有与SEQ ID NO:6的1到25残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,含有与SEQ ID NO:8的1到39残基有至少95%,96%,97%,98%,99%,或者更多序列同一性的分离的或者重组的肽,和别的在其它的SEQ ID列表中阐明的信号序列,其中序列同一性通过序列比较算法分析或者通过目测观察来确定。这些肽可以作为内源性磷脂酶或者其它磷脂酶,或者外源蛋白(非磷脂酶或者其它蛋白)的信号肽序列。一方面,发明提供包括第一结构域和至少第二结构域的嵌合蛋白,第一结构域包括发明的信号序列。蛋白可以是融合蛋白。第二结构域可以包括酶,酶可以是磷脂酶。
发明提供包括至少第一结构域和至少第二结构域的嵌合多肽,第一结构域包括发明的信号肽(SP)或催化结构域(CD),或发明的磷脂酶的活性位点,第二结构域包括异源多肽或肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间并没有天然的联系。一方面,异源多肽或者肽不是磷脂酶。异源多肽或者肽可以是信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者羧基和氨基末端。
发明提供分离的或者重组的编码嵌合多肽的核酸,其中嵌合多肽包括至少第一结构域和至少第二结构域,第一结构域含有发明多肽的信号肽(SP)或者催化结构域(CD)或者活性位点,第二结构域包括异源多肽或者肽,其中异源多肽或者肽与信号肽(SP)或者催化结构域(CD)之间并不是天然联合。
一方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约100到大约1000单位的特异活性。另一方面,磷脂酶活性包括每毫克蛋白大约500到大约700单位的特异活性。可选择的,磷脂酶活性包括在大约37℃下,每毫克蛋白大约500到大约1200单位的特异活性。一方面,磷脂酶活性包括在大约37℃下,每毫克蛋白大约750到大约1000单位的特异活性。另一方面,耐热性包含在加热至升高的温度以后,在37℃下保持至少一半磷脂酶的特异活性。可选择的,耐热性包含在加热至升高的温度以后,在37℃下每毫克蛋白保持大约500到大约1200单位的特异活性。
发明提供发明分离的或者重组的多肽,其中多肽包括至少一个糖基化位点,一方面,糖基化可以是N-连接糖基化。一方面,多肽可以是在毕赤酵母(P.pastoris)或者裂变酵母(S pombe.)表达后进行糖基化。
发明提供包括发明多肽的蛋白制备,其中蛋白制备包括液相,固相或者凝胶。
发明提供包括发明多肽和第二个蛋白或者结构域的异源二聚物。异源二聚物的第二成员可以是不同的磷脂酶,不同的酶或者另一个蛋白。一方面,第二结构域可以是多肽,异源二聚物可以是融合蛋白。一方面,第二结构域可以是抗原决定簇或者标记。一方面,发明提供包括发明多肽的同源二聚物。
发明提供具有磷脂酶活性的固定化多肽,其中多肽包含发明的多肽,发明核酸编码的多肽,或者包括发明多肽和第二结构域的多肽。一方面,多肽可以固定于细胞,金属,树脂,多聚物,陶瓷,玻璃,微电极,石墨颗粒,珠子,凝胶,金属板,阵列或者毛细管。
发明提供包含固定多肽的阵列,其中多肽是发明的磷脂酶或者发明核酸编码的多肽。发明提供含有发明的固定化核酸的阵列。发明提供含有发明的固定化抗体的阵列。
发明提供特异结合于发明多肽或者发明的核酸编码的多肽的分离的或者重组的抗体。抗体可以是单克隆抗体或者多克隆抗体。发明提供含有发明抗体的杂交瘤。
发明提供分离和鉴定具有磷脂酶活性的多肽的方法,包括以下步骤:(a)提供发明的抗体;(b)提供含有多肽的样品;以及(c)在抗体特异结合于多肽的条件下,步骤(a)的抗体与步骤(b)的样品接触,然后分离和鉴定磷脂酶。发明提供制备抗-磷脂酶抗体的方法,包括向非-人类动物以足够的量施用发明的核酸或者发明的多肽,产生体液免疫应答,从而制备抗-磷脂酶抗体。
发明提供产生重组的多肽的方法,包含以下的步骤:(a)提供可操作地连接于启动子的发明的核酸,以及(b)在多肽表达的条件下表达步骤(a)的核酸,然后产生重组多肽。核酸可以包括与SEQ ID NO:1序列在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO:3的序列在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO:5序列在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO:7序列在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者目视检测观察来确定。核酸可以包括在严谨的条件下与SEQ ID NO:1所列核酸或者亚序列,与SEQ ID NO:3所列核酸或者亚序列,与SEQ ID NO:5所列核酸或者亚序列,与SEQ ID NO:7所列核酸或者亚序列杂交的核酸。方法进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,然后在转化的细胞中产生重组的多肽。方法进一步包括把步骤(a)的核酸插入到宿主非人类动物中,随后表达步骤(a)的核酸,然后在宿主非人动物中产生重组多肽。
发明提供鉴定具有磷脂酶活性的多肽的方法,包括以下的步骤:(a)提供发明的多肽或者编码发明多肽的核酸,或者片段或者变异体,(b)提供磷脂酶底物;(c)步骤(a)的多肽或者片段或者变异体与步骤(b)的底物接触,检测底物的量的增加或者反应产物的量的减少,其中底物的量的减少或者反应产物的量的增加检测了具有磷脂酶活性的多肽。在可选择的方面,核酸可以包括与SEQ ID NO:1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO:3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO:5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ IDNO:7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者目视检测观察来确定。核酸可以包括在严谨的条件下与SEQ ID NO:1所列核酸或者亚序列,与SEQ ID NO:3所列核酸或者亚序列,与SEQ ID NO:5所列核酸或者亚序列,与SEQ ID NO:7所列核酸或者亚序列杂交的核酸。
发明提供确定磷脂酶底物的方法,包括以下步骤:(a)提供发明的多肽或者编码发明多肽的核酸;(b)提供检测底物;以及(c)步骤(a)的多肽与步骤(b)的检测底物接触,检测底物的量的增加或者反应产物的量的减少,其中底物的量的减少或者反应产物的量的增加确定底物为磷脂酶底物。在可选择的方面,核酸可以包括与SEQ ID NO:1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO:3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO:5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO:7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者可视的检测观察来确定。在可选择的方面,核酸可以包括在严谨的条件下与SEQ ID NO:1所列核酸或者亚序列,与SEQ ID NO:3所列核酸或者亚序列,与SEQ ID NO:5所列核酸或者亚序列,与SEQ ID NO:7所列核酸或者亚序列杂交的核酸。
发明提供确定是否化合物特异结合于磷脂酶的方法,包括以下步骤:(a)在允许核酸翻译成多肽的条件下,表达核酸或者包括该核酸的载体,其中核酸和载体包括发明的核酸或者载体;或者,提供发明的多肽,(b)使多肽与检测化合物接触;并且,(c)确定是否检测化合物特异结合于多肽,从而确定该化合物特异地结合于磷脂酶。在可选择的方面,核酸可以包括与SEQ ID NO:1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO:3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO:5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO:7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者可视的检测观察来确定。在可选择的方面,核酸可以包括在严谨的条件下与SEQ ID NO:1所列核酸或者亚序列,与SEQ ID NO:3所列核酸或者亚序列,与SEQ ID NO:5所列核酸或者亚序列,与SEQ ID NO:7所列核酸或者亚序列杂交的核酸。
发明提供确定磷脂酶活性的调节物的方法,包括以下步骤:(a)提供发明的多肽或者编码发明多肽的核酸;(b)提供检测化合物;以及(c)步骤(a)的多肽与步骤(b)的检测化合物接触,测定磷脂酶的活性,其中在检测化合物存在的条件下检测的磷脂酶活性与在无检测化合物存在的条件下检测的磷脂酶活性相比得到的变化证明检测化合物调节磷脂酶的活性。在可选择的方面,核酸可以包括与SEQ ID NO:1在至少大约100个残基的范围内,具有至少85%的同一性的序列,与SEQ ID NO:3在至少大约100个残基的范围内,具有至少80%的同一性的序列,与SEQ ID NO:5在至少大约100个残基的范围内,具有至少80%的同一性的序列,或者与SEQ ID NO:7在至少大约100个残基的范围内,具有至少70%的同一性的序列,其中序列同一性通过序列比较算法分析或者可视的检测观察来确定。在可选择的方面,核酸可以包括在严谨的条件下与SEQ ID NO:1所列核酸或者亚序列,与SEQ ID NO:3所列核酸或者亚序列,与SEQ ID NO:5所列核酸或者亚序列,与SEQ ID NO:7所列核酸或者亚序列杂交的核酸。
一方面,磷脂酶活性通过提供磷脂酶底物并且检测底物的量的增加或者反应产物的量的减少测定。与不存在检测化合物的条件下底物或者反应产物的量相比较,在存在检测化合物的条件下,底物的量的减少或者反应产物的量的增加证明检测化合物是磷脂酶活性的激活剂。与不存在检测化合物的条件下底物或者反应产物的量相比较,在存在检测化合物的条件下,底物的量的增加或者反应产物的量的减少证明检测化合物是磷脂酶活性的抑制剂。
发明提供包含处理器和数据存储设备的计算机系统,其中所述的数据存储设备已经存储了发明的多肽序列或者发明的核酸序列。
一方面,计算机系统可以进一步包括序列比较算法,和已经存储了至少一个参照序列的数据存储设备。序列比较算法可以包括表明多态性的计算机程序。计算机系统可以进一步包括鉴定所述序列的一个或者多个特征的鉴定器。
发明提供已经存储了包括发明的多肽序列或发明的核酸序列的序列的计算机可读存储介质。
发明提供鉴定序列的特征的方法,包括以下步骤:(a)应用鉴定序列的一个或者多个特征的计算机程序来读取序列,其中该序列包括发明的多肽序列或者发明的核酸序列;和(b)用计算机程序鉴定序列中的一个或者多个特征。
发明提供比较第一序列和第二序列的方法,包括以下步骤:(a)应用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括发明的多肽序列或者发明的核酸序列;并且,(b)用计算机程序确定第一序列和第二序列的差别。一方面,确定第一序列和第二序列的差异的步骤进一步包括确定多态性的步骤。一方面,方法进一步包括鉴定序列中一个或者多个特征的鉴定器(以及鉴定器的应用)。一方面,方法包括用计算机程序读取第一序列,鉴定序列中的一个或者多个特征。
发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤:(a)提供扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增发明的核酸(如,SEQ ID NO:1或者亚序列,SEQ IDNO:3或者亚序列,SEQ ID NO:5核酸或者亚序列,SEQ ID NO:7核酸或者亚序列。等等);(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与扩增引物对杂交;和(c)步骤(b)的核酸和步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,随后从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。一方面,扩增引物序列对的每一个成员包括含有发明的核酸序列的至少大约10到50连续碱基的寡核苷酸。一方面,扩增引物序列对是发明的扩增对。
发明提供从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括以下步骤:(a)提供包含发明的核酸序列,或者亚序列的多核苷酸探针;(b)从环境样品中分离核酸或者处理环境样品以便样品中的核酸可以与步骤(a)的多核苷酸探针杂交;(c)步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合;和(d)与步骤(a)的多核苷酸探针特异杂交的核酸分离,因此从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。在可选择的方面,环境样品包括水样品,液体样品,土壤样品,气体样品或者生物样品。在可选择的方面,生物样品来源于细菌细胞,原生动物细胞,昆虫细胞,酵母细胞,植物细胞,真菌细胞或者哺乳动物细胞。
发明提供产生编码磷脂酶的核酸的变异体的方法,包括以下步骤(a)提供包括发明核酸的模板核酸;(b)模板序列中修饰,缺失或者添加一个或者多个核苷酸,或者它们的组合,产生模板核酸的变异体。
一方面,该方法进一步包括表达变异核酸,产生变异磷脂酶多肽。可选择的方面,修饰,添加或者缺失由错误倾向PCR,重排,寡聚核苷酸定向诱变,组装PCR,有性PCR诱变,体内诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,基因位点饱和诱变(GSSM),合成连接重装配(SLR)和/或其组合的方法来引入。在可选择的方面,修饰,添加或者缺失由以下方法引入,包括重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板诱变,缺口双螺旋诱变,点错配修复诱变,修复-缺陷宿主株诱变,化学诱变,放射诱变,缺失诱变,限制选择诱变,限制纯化诱变,人工基因诱变,整体诱变,嵌合核酸多聚体的产生和/或它们的组合。
一方面,该方法被反复重复,直到产生与模板核酸编码的磷脂酶相比,具有改变的或者不同的活性或者改变的或者不同的稳定性的磷脂酶。一方面,改变的或者不同的活性是在酸性条件下的磷脂酶活性,其中模板核酸编码的磷脂酶在酸性条件下没有活性。一方面,改变的或者不同的活性是在较高的温度下的磷脂酶活性。其中模板核酸编码的磷脂酶在较高温度的条件下没有活性。一方面,该方法反复重复,直到产生与模板核酸的密码子选择相比具有改变的密码子选择的序列编码的磷脂酶。该方法反复重复,直到产生与模板核酸产生的信使相比具有更高或更低水平的信使表达或者信使稳定性的磷脂酶基因。
发明提供改变编码磷脂酶的核酸中密码子,增强其在宿主细胞中表达的方法,该方法包括(a)提供发明的编码磷脂酶的核酸;(b)鉴定步骤(a)的核酸中的非优选的或者较不优选的密码子,并且用编码相同氨基酸的优选的或者中性应用的密码子替换,其中优选的密码子是在宿主细胞的基因编码区中超常出现的密码子,非-优选的或者较不优选的密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰改变核酸,增强其在宿主细胞的表达。
发明提供在编码磷脂酶的核酸中修饰密码子的方法,该方法包括(a)提供发明的编码磷脂酶的核酸;并且,(b)确定步骤(a)的核酸中的密码子,作为被取代的密码子,把它用编码同一个氨基酸的不同的密码子替换,从而修饰编码磷脂酶的核酸中的密码子。
发明提供修饰编码磷脂酶的核酸中的密码子的方法,增强其在宿主细胞中的表达,该方法包括(a)提供发明的编码磷脂酶的核酸,并且(b)鉴定步骤(a)的核酸中的非优选的或者较不优选的密码子,用编码相同氨基酸的优选的或者中性应用的密码子来替换,其中优选的密码子是在宿主细胞的基因编码区中超常出现的密码子,不优选的或者较不优选的密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,增强其在宿主细胞的表达。
发明提供修饰编码磷脂酶的核酸的密码子的方法,降低其在宿主细胞的表达,该方法包括,(a)提供发明的编码磷脂酶的核酸;和,(b)鉴定步骤(a)的核酸中的至少一个优选的密码子并且用编码相同氨基酸的不优选的或者较不优选的密码子替换,其中优选的密码子是在宿主细胞的基因编码区中超常出现的密码子,不优选的或者较不优选的密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,降低其在宿主细胞的表达。可选择的方面,宿主细胞是细菌细胞,真菌细胞,昆虫细胞,酵母细胞,植物细胞或者哺乳动物细胞。
发明提供产生编码很多经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于包括编码第一活性位点或者第一底物结合位点的序列的第一核酸,该方法包括(a)编码第一个活性位点或者第一个底物结合位点的第一核酸序列,其中第一核酸序列包括发明的核酸,(b)提供一套在第一个核酸的多个靶密码子编码天然产生的氨基酸的突变体的诱变寡聚核苷酸;和,(c)应用这套诱变的寡聚核苷酸,产生一套编码活性位点或者编码底物结合位点的突变核酸,在每一个被诱变的氨基酸密码子处,突变核酸编码氨基酸突变体,从而产生编码修饰的磷脂酶活性位点或者底物结合位点的核酸文库。在可选择的方面,该方法包括通过包括优化的定点进化系统,基因定点饱和诱变(GSSM),和合成连接重装配(SLR)的方法,诱变步骤(a)的第一核酸。方法进一步包括通过包括错误倾向PCR,重排,寡核苷酸定向突变,装配PCR,有性PCR诱变,体内诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,基因位点饱和诱变(GSSM),合成连接重装配(SLR)和其组合的方法诱变步骤(a)的第一核酸或者突变体。方法进一步包括通过包括重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板的诱变,缺口双螺旋诱变,点错配修复诱变,修复-缺陷宿主株诱变,化学诱变,放射诱变,缺失诱变,限制选择诱变,限制纯化诱变,人工基因诱变,整体诱变,嵌合核酸多聚体的产生和它们的组合的方法诱变步骤(a)的第一核酸或者变异体。
发明提供制备小分子的方法,包括以下步骤(a)提供可以合成或者修饰小分子的多个生物合成酶,其中一个酶包括由发明核酸编码的磷脂酶;(b)对步骤(a)的至少一个酶提供底物,(c)在利于生物催化反应进行的条件下,步骤(b)的底物和酶反应,通过一系列生物催化反应产生小分子。
发明提供修饰小分子的方法,包括以下步骤(a)提供由发明核酸编码的磷脂酶;(b)提供小分子;(c)在利于磷脂酶催化的酶反应进行的条件下,步骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶反应修饰小分子。一方面,方法包括为步骤(a)的酶提供很多的小分子底物,从而产生了经修饰的小分子文库,该小分子文库通过至少一个由磷脂酶催化的酶促反应产生。一方面,方法进一步包括很多的额外酶,在利于很多酶催化的生物催化反应的条件下,通过很多酶促反应产生由很多酶促反应产生的经修饰的小分子文库。一方面,方法进一步包括检测文库的步骤,确定在文库中是否存在表现出所需活性的特定的经修饰的小分子。该检测文库的步骤可以进一步包括通过检测经过修饰的小分子的部分存在或者不存在具有所需活性的特定经修饰的小分子部分,系统性地去除干扰,在库中选择一个用于产生经修饰的小分子部分的生物催化反应,并且确定至少一种特定的生物催化反应,该反应产生了特定的具有所需活性的经修饰的小分子。
发明提供用于确定磷脂酶的功能性片段方法,其包括以下的步骤:(a)提供包括发明氨基酸序列的磷脂酶;(b)缺失步骤(a)序列中的多个氨基酸残基,并且测定余下的序列的磷脂酶活性,从而确定磷脂酶的功能性片段。一方面,磷脂酶活性通过提供磷脂酶底物,测定底物的量的增加或者反应产物的量的减少来测定。一方面,与不存在检测化合物条件下确定的底物或者反应产物的量相比较,在检测化合物存在的条件下,底物的量的减少或者反应产物的量的增加鉴定检测化合物是磷脂酶活性的激活剂。
发明提供切割磷酸甘油酯键的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中多肽包括发明的氨基酸序列,或者多肽由发明的核酸序列编码;(b)提供包括磷酸甘油酯键的组合物;(c)在多肽切割磷酸甘油酯键的条件下,把步骤(a)的多肽与步骤(b)的组合物接触。一方面,条件包括大约pH5到大约5.5之间,或者大约pH4.5到大约5.0之间。一方面,条件包括大约40℃到大约70℃温度之间。一方面,该组合物包括植物油。一方面,该组合物包括油籽磷脂。一方面,切割反应可以产生水可抽提的磷酸化的碱和甘油二酯。
发明提供油脱胶(oil degumming)的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中多肽包括发明的氨基酸序列,或者多肽由发明的核酸序列编码;(b)提供包括植物油的组合物;(c)在多肽切割植物油的酯键的条件下,把步骤(a)的多肽与步骤(b)的植物油接触,从而进行油的脱胶。一方面,植物油包括油籽。植物油可以包括棕榈油,油菜籽,玉米油,大豆油,芸苔油,芝麻油,花生油,或者葵花子油。一方面,方法进一步包括加入发明的磷脂酶,另外的磷脂酶或者它们的组合。
发明提供转化非水合的磷脂成水合形式的方法,包括以下步骤:(a)提供具有磷脂酶活性的多肽,其中多肽包括发明的氨基酸序列,或者多肽由发明的核酸编码;(b)提供包括非水合磷脂的组合物;(c)在多肽切割非水合磷脂的酯键的条件下,把步骤(a)的多肽与步骤(b)的非水合磷脂接触,从而非水合磷脂转化为水合形式。
发明提供使油脱胶的方法,包括以下步骤:(a)提供组成包括发明的具有磷脂酶活性的多肽,或者由发明核酸编码的多肽;(b)提供包括脂肪或者油的组合物,脂肪或者油含有磷脂;(c)在多肽可以对含有磷脂的组合物进行脱胶的条件下,把步骤(a)的多肽与步骤(b)的组合物进行接触(在发明的多肽可以催化磷脂水解的条件下)。一方面,含油的组合物包括植物,动物,藻或者鱼的油。植物油可以包括大豆油,油菜籽油,玉米油,棕榈仁的油,芸苔油,葵花油,芝麻油或者花生油。多肽可以水解含油组合物中水合的和/或非水合的磷脂中的磷酸。多肽可以水解甘油磷脂键处的磷酸,产生甘油二酯和水溶性的磷酸化合物。多肽可以有磷脂酶C,B,A或者D的活性。一方面,加入了磷脂酶D活性和磷酸酶活性。接触可以包括水解油中水合的磷脂。水解条件可以包括在碱性pH下,温度为大约20℃到40℃之间。碱性条件可以包括大约pH 8到pH 10的pH。水解条件可以包括反应时间为3到10分钟。水解条件可以包括水解油中水合的或者非水合的磷脂,温度为大约50℃到60℃,pH大约为pH 5到pH 6.5,应用的反应时间为大约30到60分钟。多肽可以结合于滤膜,含有磷脂的脂肪或者油通过滤膜。多肽可以加入到含有磷脂的脂肪或者油的溶液中,然后溶液通过滤膜过滤。
发明提供转化非-水合的磷脂为水合形式的方法,包括以下的步骤:(a)提供包括具有发明磷脂酶活性的多肽的组成,或者由发明的核酸序列编码的多肽;(b)提供包括非-水合的磷脂的组合物;并且(c)在多肽转化非-水合的磷脂为水合的磷脂形式的条件下,把步骤(a)的多肽与步骤(b)组合物接触。多肽可以具有磷脂酶C的活性。多肽可以具有磷脂酶D的活性并且也加入磷酸酶。
发明提供碱法净化含有磷脂的组合物的方法,包括以下步骤:(a)提供包含发明的具有磷脂酶活性的多肽或者由发明核酸编码的多肽的组合物;(b)提供包含磷脂的组合物,并且(c)在碱法净化前,碱法净化中或者后,把步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶C的活性。多肽可以在碱法净化前加入,并且含有磷脂的组成可以包括植物,并且多肽可以以转基因方式在植物中表达,具有磷脂酶活性的多肽可以在压榨种籽或者其它植物部分的过程中加入,或者具有磷脂酶活性的多肽在压榨后或者在净化前加入。多肽可以在碱法净化中加入,并且依据磷的水平和游离脂肪酸的水平加入不同水平的酸和碱。多肽可以在碱法净化后加入:在分离前的剧烈搅拌器或者保持混合器中,随后在离心机中,皂脚中,清洗水中进行,或者在漂白或者除臭步骤中进行加热步骤。
发明提供纯化植物甾醇或者三萜的方法,包括以下的步骤:(a)提供包括发明的具有磷脂酶活性的多肽的组合物,或者多肽由发明核酸编码;(b)提供含有植物甾醇或者三萜的组合物;并且(c)在多肽可以催化组合物中的磷脂的水解的条件下,把步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶C的活性。植物甾醇或者三萜可以包括植物甾醇。植物甾醇可以来源于植物油。植物油可以包括椰子油,芸苔油,可可黄油,玉米油,棉籽油,亚麻油,橄榄油,棕榈油,花生油,来自稻麸子的油,红花油,芝麻油,大豆油,或者葵花油。该方法可以包括应用非极性溶剂来定量地提取游离的植物甾醇和甾醇类脂肪酸酯。植物甾醇或者三萜可以包括β-谷甾醇,菜油甾醇,豆甾醇,豆甾烷醇,β-谷甾烷醇,谷甾烷醇,链甾醇,海绵甾醇,  多孔甾醇,γ-谷甾醇或者菜籽甾醇。
发明提供精练粗油的方法,包括以下步骤:(a)提供包括发明的具有磷脂酶活性的多肽的组合物,或者多肽由发明的核酸编码;(b)提供包括含有磷脂的油的组合物;并且(c)在多肽催化组合物中的磷脂水解的条件下,把步骤(a)的多肽与步骤(b)的组合物接触。多肽可以具有磷脂酶C的活性。多肽可以在加入到组分水溶液的情况下具有磷脂酶活性。水的水平可以是在0.5到5%之间。处理时间可以少于2小时,少于大约60分钟,少于大约30分钟,少于大约15分钟,或者少于5分钟。水解条件可以包括温度范围在大约25到70℃之间,水解条件可以包括应用苛性碱,水解条件可以包括pH范围为大约pH 3到pH10之间,pH 4到pH9之间,或者pH 5到pH 8之间。水解条件可以包括在接触步骤(c)后加入乳化剂和/或进行混合。该方法可以包括加入去乳化剂和/或加热来促进水相的分离。该方法可以包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后再加入PLC,PLC和/或PLA,去除非水合的磷脂。对于食用油,该方法可以包括粗油的水脱胶到少于10ppm,对于生物柴油,然后通过物理精练至少到大约50ppm。该方法可以包括加入酸来增强非水合磷脂的水合。
发明的一个或者多个具体例子的细节在附加图表和以下说明中进行阐明。发明的其它特征,目标,以及优势将通过描述和图表以及权利要求得到阐明。
用于各种目的的所有出版物,专利,专利申请,GenBank序列以及美国模式菌种收集中心(ATCC)保藏物,在此一并引用和参考。
附图简述
以下的图是本发明的实施方案的例示性说明,并不意味着限制权利要求所包含的发明范围。
图1是计算机系统的框图,具体的细节说明参见下文。
图2是过程200的一个方面的流程图,为了确定新序列和数据库中的序列之间的同源性水平,把新的核苷酸或蛋白质序列与数据库中的序列相比较,具体的细节说明参见下文。
图3是说明在计算机中确定是否两个序列是否是同源的过程的实施方案的流程图,具体细节说明参见下文。
图4是说明鉴定器过程的一个方面的流程图,检测序列中特征的存在,具体的细节说明参见下文。
图5A,5B和5C用图表说明用于同时PLC-介导脱胶的典型两相系统,具体的细节说明参见下文。
图6用图表说明应用发明的磷脂酶的典型的植物油精练过程。
图7用图表说明用于物理精练油的发明的典型脱胶过程,具体的细节说明参见下文。
图8用图表说明用发明的磷脂酶C进行磷脂的水解,具体的细节说明参见下文。
图9用图表说明用发明的磷脂酶C作为“碱法净化辅助”(长混合碱法净化),具体的细节说明参见下文。
图10用图表说明用发明的磷脂酶C作为脱胶辅助,具体的细节说明参见下文。
不同图中的类似参考符号说明类似元素
发明祥述
发明提供磷脂酶(如,磷脂酶A,B,C和D,马铃薯块茎储藏蛋白酶),编码它们的核酸。以及制备和应用它们的方法。发明提供可以有效地切割油,如植物油,例如油籽磷脂中的甘油磷酸酯键的酶,产生水可提取的磷酸化的碱和甘油二酯。一方面,发明的磷脂酶具有脂酰水解酶(LAH)的活性。可选择的方面,发明的磷脂酶可以切割卵磷脂,磷脂酰乙醇胺,磷脂酰丝氨酸,和鞘磷脂中的甘油磷酸酯键。
发明的磷脂酶(如,磷脂酶A,B,C和D,马铃薯块茎储藏蛋白酶)可以用于植物油的酶法脱胶,因为磷酸组分在水中可溶,并且容易去除。甘油二酯产物将仍存留在油中,从而降低损失。发明的PLCs可以用于商业上的油脱胶中,加入到或者替换PLA1s和PLA2s,诸如ENZYMAX_工艺,其中磷脂是由PLA1和PLA2水解的。
一方面,发明的磷脂酶在较高的和/或较低的温度下,或者在较宽的温度范围内,具有活性,例如,它们可以在温度范围在20到90℃,30到80℃,或者在40到70℃下具有活性。发明也提供发明的磷脂酶,其在碱性pH或者酸性pH下具有活性,例如低的水酸度。可选择的方面,发明的磷脂酶可以在酸性pH低至pH6.5,pH6.0,pH5.5,pH5.0,pH4.5,pH4.0,和pH3.5仍具有活性。可选择的方面,发明的磷脂酶可以在碱性pH高至pH7.5,pH8.0,pH8.5,pH9.0,和pH9.5仍具有活性。一方面,发明的磷脂酶在低水活性(低的水含量)条件下,在温度范围40到70℃之间具有活性。
发明也提供进一步修饰本发明的典型磷脂酶的方法,以便产生具有理想特性的酶。例如,由发明方法产生的磷脂酶可以具有改变了的底物特异性,底物结合特异性,底物切割形式,热稳定性,pH/活性曲线,pH/稳定性曲线(如在较低pH值,例如pH小于6或者pH小于5或者较高的pH值,如pH大于9的情况下热稳定性提高),对于氧化作用的稳定性,Ca2+的依赖性,特异性活性,类似特性。发明提供对于任何感兴趣特性的改变。例如,这些改变可以导致与原磷脂酶相比的变异体,具有改变的pH和温度活性曲线。
一方面,发明的磷脂酶在不同的植物油处理步骤,如植物油提取中,特别地,在称为“油脱胶”的过程中去除“磷脂胶”中的使用,如在此所述。植物油产生于不同的植物来源,如大豆,油菜,花生,芝麻,葵花和玉米。发明的磷脂酶可以在任何植物油处理过程中用于替代PLA,例如磷脂酶A2。
定义
术语“磷脂酶”包括具有磷脂酶活性的酶,例如,切割油中,如植物油中的甘油磷酸酯键(催化水解甘油磷酸酯键)。发明的磷脂酶活性可以产生水可提取的磷酸化的碱以及甘油二酯。发明的磷脂酶活性也包括在高温,低温,碱性pH和酸性pH下水解甘油磷酸酯键。术语“磷脂酶活性”也包括切割甘油磷酸酯,产生水可提取的磷酸化的碱以及甘油二酯。术语“磷脂酶活性”也包括切割磷脂中甘油和磷酸的酯键。术语“磷脂酶活性”也包括其它的活性,如结合底物的能力,如油,例如植物油,底物也包括植物和动物的卵磷脂,磷脂酰乙醇胺,磷脂酰丝氨酸,和鞘磷脂。磷脂酶活性可以包括磷脂酶C(PLC)的活性,磷脂酶A(PLA)的活性,如磷脂酶A1或者磷脂酶A2的活性,磷脂酶B(PLB)活性,如磷脂酶B1或者磷脂酶B2的活性,磷脂酶D(PLD)的活性,如磷脂酶D1或者磷脂酶D2的活性。磷脂酶活性可以包括水解糖蛋白,如马铃薯块茎中或者任何茄属植物(Solanum),如,马铃薯(Solanum tuberosum.)中的糖蛋白。磷脂酶活性可以包括patatin酶活性,如patatin酯酶活性(见,例如,Jimenez(2002)Biotechnol.Prog.18:635-640)。磷脂酶活性可以包括脂酰水解酶(LAH)活性。
术语“抗体”包括源自模式的或者实质上由免疫球蛋白基因或者免疫球蛋白基因的片段编码的肽或者多肽,可以特异地结合于抗原或者抗原决定簇,见,例如Fundamental lmmunology,Third Edition,W.B.Paul,ed.,Raven Press,N.Y.(1993):Wilson(1994)J.Immunol.Methods 175:267-273;Yarmush(1992)J.Biochem.Biophys.Methods 25:85-97。术语抗体包括抗原结合部分,即,“抗原结合位点”(例如,保持了结合抗原能力的片段,亚序列,互补决定区(CDRs),包括(i)Fab片段,包括由VL,VH,CL和CH1结构域组成的单价片段;(ii)F(ab’)2片段,包括在铰链区通过二硫键连接两个Fab片段的二价片段;(iii)包括VH和CH1结构域的Fd片段;(iv)包括抗体单臂的VL和VH结构域的Fv片段,(v)含有VH结构域的dAb片段(Ward et al.,(1989)Nature 341:544-546);以及(vi)分离的互补决定区(CDR)。作为参考,单链抗体也包括于术语“抗体”中。
在此应用的术语“阵列”或者“微阵列”或者“生物芯片”或者“芯片”是许多靶元素,每一个靶元素包括确定量的一个或者多个多肽(包括抗体)或者固定于底物表面积的确定区域的核酸,参见以下进一步的具体讨论。
正如在此所用的术语“计算机”,“计算机程序”和“处理器”在上下文广泛应用,并且用于所有的这样的设备,如以下所述的。
“编码序列”或者“序列编码”特定的多肽或者蛋白,是指当置于合适的调控序列的控制下可以转录和翻译成多肽或者蛋白的核酸序列。
在此使用的术语“表达盒”是指在与这样的序列相容的宿主细胞中可以影响结构基因表达(即,编码蛋白质,如本发明的磷脂酶的序列)的核苷酸序列。表达盒包括至少一个可以可操作地连接至编码多肽的序列上的启动子;并且,可选择地,还有其它的序列例如,转录终止信号。另外的必要的或者有助于影响表达的因子也可以应用,例如,增强子。正如在此所应用的“可操作地连接”是指在上游连接启动子与DNA序列,这样该启动子介导了该DNA序列的转录。这样,表达盒也包括质粒,表达载体,重组病毒,任何形式的重组的“裸露DNA”载体,和类似物。“载体”包括可以感染,转染,瞬间或者永久转导细胞的核酸。可以认为载体可以是裸露的核酸,或者与蛋白或者脂类复合的核酸。载体可选择地包括病毒或者细胞的核酸和/或蛋白,和/或膜(如,细胞膜,病毒的脂类包膜,等等)。载体包括,但不限于复制子(如,RNA复制子,细菌噬菌体),其中DNA片段可以结合到其上,变成复制状态。这样的载体包括,但不限于是RNA,自主复制的环状或者线性的DNA或者RNA(如,质粒,病毒,以及类似物,见,如,美国专利No.5,217,879),并且也包括表达的和非表达的质粒。其中描述重组微生物或者细胞培养物是作为宿主培养“表达载体”,其包括染色体外的环状和线性DNA,并且已经整合进入宿主染色体的DNA。其中载体保存在宿主细胞中,该载体可以在细胞有丝分裂中作为自主结构稳定地在细胞中复制,或者整合入宿主基因组中。
“质粒”的命名为在名称前加上小写字母“p”和/或接下来是大写字母和/或数字。在此使用的起始质粒可以买到,在非限制的基础上可以公开获得,或者按照出版的程序从已有的质粒构建。此外,与那些在此描述的质粒等价的质粒是在本领域是已知的,并且对普通技术人员而言是显而易见的。
术语“基因”是指DNA片段,涉及在产生多肽链,包括,除此之外,在编码区的前面和后面的区域,如头部和尾部,启动子和增强子,当适合时,还有单个编码片段(外显子)之间的插入序列(内含子)。
正如在此应用的短语“核酸”或者“核酸序列”是指寡核苷酸,核苷酸,多聚核苷酸,或者是指它们的任何之一的片段,是指基因组或者合成来源的DNA或者RNA(如,mRNA,rRNA,tRNA,iRNA),其可以是单链的或者双链的,并且可以代表有义链或者无义链,是指肽核酸(PNA),或者是指天然的或者起始于合成的任何DNA样或者RNA样的物质,包括如,iRNA,核糖核蛋白(如双链iRNA,如iRNPs)。术语包括核酸,即,寡核苷酸,包括天然核苷酸的已知类似物。术语也包括具有合成骨架的核酸样结构,见,如,Mata(1997)Toxicol.Appl.Pharmacol.144:189-197;Straus.-Soukup(1997)Biochemistry 36:8692-8698;Samstag(1996)Antisense NucleicAcid Drug Dev 6:153-156。
在此应用的“氨基酸”或者“氨基酸序列”是指寡肽,肽,多肽,或者蛋白序列,或者是指以上任何这些的任何一个的片段、部分或亚基,并且是指天然产生或者合成的分子。
在此应用的术语“多肽”和“蛋白”是指通过肽键或者修饰的肽键连接在一起的氨基酸,即,肽等排体,可以含有不是20个基因编码的氨基酸的修饰氨基酸。术语“多肽”也指肽或者多肽片段,基元(motif),类似物。术语也包括糖基化的多肽。发明的肽或者多肽也包括所有“模拟”和“肽模拟”形式,以下进一步描述。
正如在此所应用的,术语“分离的”是指从起始的环境中分离的物质(如,如果是天然发生的,那么就是天然环境)。例如,存在于活动物中的天然发生的多聚核苷酸或者多肽不是分离的,但是,如果该同样的多核苷酸或者多肽,与天然系统中的一些或者所有的共存物分离,那么就是分离的。这样的多核苷酸可以是载体的一部分和/或这样的多核苷酸或者多肽可以是一个组合物的一部分,并且仍然是分离,因为这样的载体或者组合物不是天然环境的一部分。正如在此使用的,分离的物质或者组合物可以是“纯化”的组合物,即,它并不需要绝对的纯度;更正确地,认为其是相对性的定义。从文库中得到的单个核酸可以经过常规纯化为电泳均一性。可选择的方面,发明提供从基因组DNA或者从文库中的其它序列中或者其它的环境中纯化至少一个,两个,三个,四个,五个或者更多数量级的核酸。
正如在此应用的,术语“重组”是指核酸邻近于“骨架”核酸,而在天然环境下它们并不邻近。一方面,核酸代表了核酸“骨架分子”群体中5%或者更多数目的插入物的核酸。按照发明,“骨架分子”包括核酸,如表达载体,自主复制核酸,病毒,整合的核酸,和其他的载体或者用于保持或者操作感兴趣的核酸插入物的核酸。一方面,富集的核酸代表了重组骨架分子群体中的15%,20%,30%,40%,50%,60%,70%,80%,90%或者更多数目的核酸插入物。“重组”多肽或者蛋白是指由重组DNA技术产生的多肽或者蛋白,如,从编码所需多肽或者蛋白的外源DNA构建物转化的细胞产生。“合成的”多肽或者蛋白是那些通过化学合成制备的多肽或者蛋白,如以下进一步的描述。
正如以下进一步讨论的,当启动启动子处转录的RNA聚合酶转录编码序列成为mRNA时,启动子序列是“可操作地连接于”编码序列。
“寡聚核苷酸”是指单链多聚脱氧核苷酸或者化学合成的两个互补的多聚脱氧核苷酸链。这样合成的寡聚核苷酸在5’没有磷酸,并且在不用激酶和ATP加入磷酸的情况下,不能连接于另一个寡聚核苷酸。合成的寡聚核苷酸将连接于没有脱磷酸化的片段。
上下文中的两个核酸或者多肽“实质上相同”的短语,是指当使用任何已知的序列比较算法,如以下详细讨论的,或者通过目测的方法检测,比较和对齐为最大同一性时,两个或者多个序列至少具有50%,60%,70%,75%,80%,85%,90%,95%,98%或者99%的核苷酸或者氨基酸残基(序列)的同一性。在可选择的方面,发明提供与发明的典型序列,如,SEQ ID NO:1,SEQ ID NO:2,SEQ IDNO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,等等,在核酸或者多肽的至少大约100个残基,150个残基,200个残基,300个残基,400个残基,或者从大约50个残基到全长的区域范围内实质上具有同一性的核酸和多肽序列。发明的核酸可以是在整个长度的多肽编码区域实质上一致。
另外的,“实质上一致”的氨基酸序列是与参考序列不同的序列,其中具有一个或者多个保守性或者非保守性的氨基酸取代,缺失,或者插入,特别地,当这样的取代发生在分子的非活性位点的一个位置,并且假设,多肽实质上保持了它的功能特性。保守氨基酸的取代,例如,用一个氨基酸取代另一个同类的氨基酸(如,用一个疏水氨基酸,如异亮氨酸,缬氨酸,亮氨酸,或者甲硫氨酸,取代另一个,或者用极性氨基酸取代另一个极性氨基酸,如,用赖氨酸取代精氨酸,用谷氨酸取代天冬氨酸或者,谷酰胺取代天冬酰胺)。可以缺失一个或者多个氨基酸,例如,从磷脂酶多肽中缺失,得到多肽结构的修饰,而并不显著改变其生物活性。例如,对于磷脂酶的生物活性,并不需要氨基或者羧基端氨基酸,可以去除。发明的修饰的多肽序列可以通过很多的方法分析其磷脂酶活性,包括让改变的多肽序列与磷脂酶底物接触,并且确定是否修饰的多肽减少了分析中的特异底物的量或者增加了功能性磷脂酶与底物的酶促反应的生物产物的量,如以下详细说明的。
“杂交”是指通过碱基配对,核酸链与互补链结合的过程。杂交反应可能是敏感的并且具有选择性,这样在样品量很低的浓度下可以鉴定感兴趣的特定的序列。合适的严谨条件可以通过例如,预杂交和杂交溶液中的盐和甲酰胺浓度,或者杂交温度来确定,并且本领域是熟知的。例如,严谨性的增加可以通过降低盐浓度,增加甲酰胺的浓度,或者提高杂交温度,改变杂交时间予以实现,如以下所详细描述。可选择的方面,发明的核酸通过它们可以与在此所阐明的不同的严谨条件下杂交的能力(如,高,中,和低)来确定。
术语“变异体”是指在一个或者多个碱基对,密码子,内含子,外显子,或者氨基酸残基(分别)改变的发明的多聚核苷酸或者多肽,但仍保持发明的磷脂酶的生物活性。变异体可以通过很多种方法产生,例如,错误倾向PCR,重排,寡聚核苷酸定向诱变,装配PCR,有性PCR诱变,体外诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,GSSM和它们的组合。在此包括了产生在pH或温度下具有活性的磷脂酶突变体,例如,不同与野生型磷脂酶的技术。
术语“饱和诱变”或者“GSSM”包括应用变性的寡聚核苷酸引物在多聚核苷酸中引入点突变的方法,如下的详细解释。
术语“优化的定向进化系统”或者“优化的定向进化”包括重组装相关核酸序列片段的方法,例如,相关基因,以下详细解释。
术语“合成连接重组装”或者“SLR”包括以非随机的方式连接寡聚核苷酸片段的方法,以下详细解释。
核酸的产生和操作
发明提供核酸(如,典型的SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ IDNO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ IDNO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ IDNO:37,SEQ ID NO:39,SBQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ IDNO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ IDNO:57,SEQ ID NO:59,SBQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ IDNO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ IDNO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SBQ IDNO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ IDNO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105),包括编码发明的多肽和磷脂酶的表达盒,如表达载体。发明也包括应用发明的核酸发现新的磷脂酶序列的方法。也提供用于修饰的本发明核酸的方法,例如,合成连接重装配,优化的定向进化系统和/或饱和诱变。
发明的核酸可以是制备的,合成和/或通过,如,克隆和表达cDNA文库,通过PCR扩增信使或者基因组DNA,和类似方法进行操作。在实践本发明的方法中,通过操作模板核酸,可以修饰同源基因,正如在此所述的。本发明可以和本领域已知的其它任何方法或者方案或者装置结合进行实践,这些在科学和专利的文献中有很好的描述。
一般技术
用于实践本发明的核酸,不管是RNA,iRNA,反义核酸,cDNA,基因组DNA,载体,病毒或者它们的杂合体,都可以自不同的来源分离,遗传工程,扩增,和/或表达/重组产生。从这些核酸产生的重组多肽可以单独分离或者克隆,并且检测所需的活性。可以应用任何重组表达系统,包括细菌,哺乳动物,酵母,昆虫或者植物细胞表达系统。
可选择地,这些核酸可以通过已知的化学合成技术在体外合成,正如在如Adams(1983)J.Am.Chem,Soc.105:661;Belousov(1997)Nucleic Acids Res.25:3440-3444:Frenkel(1995)Free Radic.Biol.Med.19:373-380;Blommers(1994)Biochemistry 33:7886-7896;Narang(1979)Meth.Enzymol.68:90,Brown(1979)Meth.Enzymol.68:109;Beaucage(1981)Tetra.Lett.22:1859;美国专利4,458,066中描述的。
用于核酸操作的技术,如,亚克隆,探针标记(如,使用Klenow聚合酶的随机引物标记,切口平移,扩增),测序,杂交等等,这些方法在科学和专利文献中有说明,见,如,Sambrook,ed.,MOLECULAR CLONING:A LABORATORYMANUAL(2ND ED.),Vols.1-3,Cold Spring Harbor Laboratory,(1989):CURRENT PROTOCOLS IN MOLECULAR BIOLOGY,Ausubel,ed.JohnWiley&Sons,Inc.,New York(1997);LABORATORY TECHNIQUES INBIOCHEMSTRY AND MOLECULAR BIOLOGY:HYBRlDlZATION WITHNUCLEIC ACID PROBES,Part I.Theory and Nucleic Acid Preparation,Tijssen,ed.Elsevier,N.Y.(1993)。
另一个用于实践发明的方法,即获得和操作核酸的有用方法是从基因组样品中克隆,并且如果需要,筛选和再克隆从例如,基因组克隆或者cDNA克隆中分离或者扩增的插入物。在发明方法中使用的核酸的来源包括包含于如,哺乳动物人工染色体(MACs)中的基因组或者cDNA文库,见如,美国专利5,721,118,6,025,155;人的人工染色体,见,如,Rosenfeld(1997)Nat.Genet.15:333-335,酵母人工染色体(YAC);细菌人工染色体(BAC);P1人工染色体,见,如,Woon(1998)Genomics 50:306-3 16;P1-来源的载体(PACs),见,如,Kern(1997)Biotechniques 23:120-124,粘粒,重组病毒,噬菌体或者质粒。
一方面,编码发明多肽的核酸在适当的阶段与可以引起翻译的多肽或者片段分泌的先导序列装配在一起。
发明提供融合蛋白和编码融合蛋白的核酸。发明的多肽可以与异种的肽或者多肽融合,如N-末端鉴定肽,其赋予了所需的特征,如增加的稳定性或者纯化方法的简化。发明的肽和多肽也可以合成并且以与一个或者多个另外的结构域连接的融合蛋白形式进行表达,从而,如,产生更具免疫原性的肽,更容易分离的重组合成肽,鉴定和分离抗体和表达抗体的B细胞,等等。测定和纯化促进结构域包括,如,可以在固定的金属上纯化的金属鏊合肽,如,聚组氨酸序列片(polyhistidine tracks)和组氨酸-色氨酸模块(histidine-tryptophan),可以在固定的免疫球蛋白上纯化的蛋白A结构域,以及在FLAGS伸展/亲和纯化系统(FLAGSextension/affinity purification system,Immunex Corp,Seattle WA)中使用的结构域。在纯化的结构域和含有基元的肽或者多肽之间包含可以切割的如因子Xa或者肠激酶(lnvitrogen,San Diego CA)的接头序列,以便于纯化。例如,表达载体可能包括连接于六个组氨酸残基的编码抗原决定簇的核酸序列,然后是硫氧还蛋白和肠激酶切割位点(见,如,Williams(1995)Biochemistry 34:1787-1797,Dobeli(1998)Protein Expr.Purif.12:404-414)。肠激酶切割位点提供从融合蛋白的残留物中纯化抗原决定簇的方法,同时组氨酸残基有利于检测和纯化。关于编码融合蛋白的载体以及应用融合蛋白的技术在科学和专利文献中有很好的说明,见,例如,Kroll(1993)DNA Cell.Biol.,12:441-53。
转录和翻译控制序列
发明提供可操作地与表达控制序列(如,转录和翻译)如,启动子或者增强子连接的发明的核酸(如,DNA)序列,指导或者调控RNA的合成/表达。表达控制序列可以在表达载体中。典型的细菌启动子包括lacI,lacZ,T3,T7,gpt,λPR,PL和trp启动子。典型的真核启动子包括CMV即刻早期,HSV胸腺嘧啶激酶激酶,早期和晚期SV40,来自逆转录病毒的LTRs(长末端重复序列)和鼠金属硫蛋白I。
适于在细菌中表达多肽的启动子包括大肠杆菌lac或者trp启动子,lacI启动子,lacZ启动子,T3启动子,T7启动子,gpt启动子,λPR启动子,λPL启动子,来自编码糖酵解的酶的操纵子的启动子如,3-磷酸甘油激酶(PGK),和酸性磷酸酶启动子。真核启动子包括CMV即刻早期启动子,HSV胸腺嘧啶激酶启动子,热休克启动子,早期和晚期SV40启动子,来自逆转录病毒的LTRs,和鼠金属硫蛋白-I启动子。也可以应用已知的在原核或者真核细胞或者其病毒中控制基因表达的其它启动子。
表达载体(expression vectors)和克隆(运)载体(cloning vehicles)
发明提供包括发明的核酸,如,编码发明额磷脂酶的序列的表达载体和克隆载体,发明的表达载体和克隆载体可以包括病毒颗粒,杆状病毒,噬菌体,质粒,噬菌粒,粘粒,fosmids,细菌人工染色体,病毒DNA(如,牛痘,腺病毒,禽类痘病毒,伪狂犬病病毒和SV40衍生物),以P1为基础的人工染色体,酵母质粒,酵母人工染色体,以及对感兴趣的特定宿主(如杆状菌,曲霉属(Aspergillus)和酵母)特异的任何其它载体。发明的载体可以包括染色体的,非染色体的和合成的DNA序列。很多合适的载体为本领域技术熟练人员所了解,并且可以买到。典型的载体包括:细菌的:pQE载体(Qiagen),pBluescript质粒,pNH载体,(λ-ZAP载体(Stratagene);ptrc99a,pKK223-3,pDR540,pRIT2T(Pharmacia);真核的:PXTI,pSG5(Stratagene),pSVK3,pBPV,pMSG,pSVLSV40(Pharmacia)。然而,也可以应用任何其它的质粒或载体,只要可以在宿主中复制并且可繁殖。低拷贝数或者高拷贝数的载体可以应用于本发明。
表达载体可以包括启动子,用于翻译起始的核糖体结合位点和转录终止子。载体也包括扩增表达的合适序列。哺乳动物表达载体可以包括复制起始位点,任何必要的核糖体结合位点,多聚腺苷酸化位点,剪接供体和接纳位点,转录终止序列,和5′侧非转录序列。一些方面,源于SV40的剪接和多聚腺苷酸化位点的DNA序列可以用于提供所需的非-转录遗传元件。
一方面,表达载体含有一个或者多个选择性标记基因,使得可以选择含有这些载体的宿主细胞。这些选择标记包括编码二氢叶酸还原酶的基因或对真核细胞培养有新霉素抗性的基因,大肠杆菌中赋予抗四环素或者抗氨苄青霉素的基因,以及酿酒酵母(S.cerevisiae)的TRP1基因。启动子区域可以使用氯霉素转移酶(CAT)载体或者具有选择标记的其它载体,从任何所需基因中选择。
在真核细胞中表达多肽或者其片段的载体也包括用于增加表达水平的增强子。增强子是DNA的顺式作用元件,一般长度从大约10到大约300bp,其作用于启动子,增强启动子的转录。例子包括在复制起点的晚期侧100到270bp的SV40增强子,巨细胞病毒的早期启动子增强子,在复制起点的晚期侧的多瘤增强子,和腺病毒增强子。
DNA序列可以以不同的程序插入到载体中。总体上,DNA序列连接于载体上所需的位置,是在用适合的限制性内切酶消化切下插入片段和消化切割载体之后进行的。可选择地,插入片段和载体两者可以以平端的形式连接。在专业上已知不同的克隆技术,例如,如在Ausubel和Sambrook中所描述的技术。这样的程序和其它程序被认为是属于本领域的技术人员的范围之内。
载体可以是质粒,病毒颗粒或者噬菌体的形式。其它的载体包括染色体的,非染色体的和合成的DNA序列,SV40的衍生物;细菌质粒,噬菌体DNA,杆状病毒,酵母质粒,源于质粒和噬菌体DNA组合的载体,病毒DNA如牛痘,腺病毒,禽类痘病毒,和伪狂犬病病毒。在原核和真核宿主中使用的多种克隆和表达载体,在如Sambrook中所说明的。
可以应用的特定细菌载体包括可以买到的含有以下克隆载体遗传学元件的质粒,pBR322(ATCC 37017),pKK223-3(Pharmacia Fine Chemicals,Uppsala,Sweden),GEM1(Promega Biotec,Madison,WI,USA)pQE70,pQE60,pQE-9(Qiagen),pD10,psiX174,pBlueScript II KS,pNH8A,pNH16a,pNH18A,pNH46A(Stratagene),ptrc99a,pKK223-3,pKK223-3,pDR540,pRIT5(Pharmacia),pKK232-8和pCM7。特定的真核载体包括pSV2CAT,pOG44,pXTI,pSG(Stratagene)pSVK3,pBPV,pMSG,和pSVL(Pharmacia)。然而,任何其它的载体也可以应用,只要它在宿主细胞可以复制和繁殖。
宿主细胞和转化细胞
发明也提供包括发明核酸序列,如,编码发明磷脂酶的序列,发明的载体的转化的细胞。宿主细胞可以是技术熟练人员所熟悉的任何宿主细胞,包括原核细胞,真核细胞,如,细菌细胞,真菌细胞,酵母细胞,哺乳动物细胞,昆虫细胞,或者植物细胞。典型的细菌细胞包括大肠杆菌E.coli,链霉菌Streptomyces,枯草杆菌Bacillus subtilis,沙门氏菌Salmonella typhimurium和假单胞菌Pseudomonas,链霉菌Streptomyces,和葡萄球菌Staphylococcus属中的各种种类。典型的昆虫细胞包括果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9)。典型的动物细胞包括CHO,COS或者Bowes melanoma或者任何小鼠或者人类细胞系。适当的宿主的选择是在专业知识的范围内。
载体可以应用任何不同的技术引入到宿主细胞,包括转化,转染,转导,病毒感染,基因枪,或者Ti-介导的基因转移。特定的方法包括磷酸钙转染,DEAE-Dextran介导的转染,脂质体转染,或者电穿孔(Davis,L.,Dibner,M.,Battey,I.,Basic Methods in Molecular Biology,(1986))。
适当地,工程化的宿主细胞可以在传统营养培养基中培养,可以修改以便适于活化启动子,选择转化子或者扩增发明的基因。随后转化适当的宿主株,并且该宿主株生长至适当的细胞密度,通过适当的方法诱导所选择的启动子(如,温度变换或者化学诱导),细胞被额外培养一段时间,使得它们产生所需的多肽或者其片段。
细胞通过离心收集,通过物理或者化学的方法破碎,得到的粗提取物保留用于进一步的纯化。用于表达蛋白的微生物细胞可以通过方便的方法破碎,包括反复冷冻-融化循环,机械破碎,或者应用细胞裂解试剂。这样的方法为技术熟练人员所熟悉。表达的多肽或者片段可以通过下述方法从重组细胞培养物中回收纯化,包括硫酸铵或者乙醇沉淀,酸抽提,阳离子或者阴离子交换层析,磷酸纤维素层析,疏水相互作用层析,亲和层析,羟基磷灰石层析和植物凝集素层析。如果必要的话,可以在实现多肽的构象中应用蛋白重新折叠步骤。如果需要,可以应用高效液相色谱(HPLC)进行最终的纯化步骤。
各种哺乳动物培养系统可以用来表达重组蛋白。哺乳动物表达系统的例子包括可以从相容性载体中表达蛋白的猴肾成纤维细胞COS-7细胞系和其它的细胞系,如C127,3T3,CHO,Hela和BHK细胞系。
宿主细胞中的构建物可以应用传统的方式来产生重组序列编码的基因产物。依赖于在重组产生程序中采用的宿主,含有载体的宿主细胞产生的多肽可以是糖基化或者是非糖基化的。发明的多肽可以包括,也可以不包括起始的甲硫氨酸氨基酸残基。
无细胞的翻译系统可能也用于产生发明的多肽。无细胞翻译系统可以应用从在带有启动子的编码多肽或者其片段的核酸的DNA构建物转录的mRNA。一些方面,DNA构建物可以,在体外转录反应前,先线性化。然后转录的mRNA与合适的无细胞翻译提取物如,兔网织红细胞提取物一起温育来产生所需的多肽或者片段。
表达载体可以含有一个或者多个选择性标记基因,提供用于选择转化的宿主细胞的表型特征,如,二氢叶酸还原酶和真核细胞培养的新霉素抗性,或者如大肠杆菌中的四环素或者氨苄青霉素抗性。
核酸的扩增
在实践发明时,编码发明多肽的核酸,或者修饰的核酸可以再生,如通过扩增。发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对。一方面,引物对可以扩增发明的核酸序列,如,包括典型的SEQ ID NO:1,或者其一个亚序列;如SEQ ID NO:3所阐明的一个序列,或者其一个亚序列;如SEQ ID NO:5所阐明的一个序列,或者其一个亚序列;如SEQ ID NO:7所阐明的一个序列,或者其一个亚序列,等等。技术熟练人员可以设计这些序列的任何部分或全长的扩增引物序列对。
发明提供用于扩增编码具有磷脂酶活性的多肽的核酸的扩增引物序列对,其中引物对可以扩增包括发明序列的核酸,或者其片段或亚序列。用于扩增的引物序列对的一个或每一个成员可以包括含有该序列的至少大约10到50个连续碱基的寡聚核苷酸,或者包括含有该序列的大约12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个连续碱基的寡聚核苷酸。
发明提供扩增引物对,其中引物对包括具有在发明核酸的大约第一个(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基中阐明的序列的第一成员,和具有在第一成员的互补链的大约第一个(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,或者25个残基中阐明的序列的第二成员。发明提供通过扩增产生的磷脂酶,如应用本发明的扩增引物对的多聚酶链式反应(PCR)。发明提供使用发明的扩增引物对,通过扩增,例如,多聚酶链式反应(PCR)制备发明磷脂酶的方法。一方面,扩增引物扩增从文库,例如,基因文库,如环境文库中得到的核酸。
扩增反应也可以用于定量样品中(如在细胞样品中的信使的量)的核酸,标记的核酸(如,用于分析或者印迹)的量,确定核酸,或者定量样品中特异核酸的量。发明的一方面,对分离自细胞或者DNA文库的信使进行扩增。技术熟练人员可以选择和设计合适的寡聚核苷酸扩增引物。扩增的方法为技术熟练人员所熟悉,并且包括,如,多聚酶链式反应,PCR(见,如,PCRPROTOCOLS,AGUIDETO METHODS AND APPLICATIONS,ed.Innis,Academic Press,N.Y.(1990)和PCR STRATEGIES(1995),ed.Innis,Academic Press,Inc.,N.Y.,连接酶链式反应(LCR)(见,如,Wu(1989)Genomics 4:560,Landegren(1988)Science 241:1077,Barringer(1990)Gene 89:117);转录扩增(见,如,Kwoh(1989)Proc.Natl.Acad.Sci.USA 86:1173),和自支持序列复制(见如,Guatelli(1990)Proc.Natl,Asad.Sci.USA 87:1874),Q-β复制酶扩增(见,如,Simth(1997)J.Clin.Microbiol.35:1477-1491),自动的Q-β复制酶扩增分析(见,如,Burg(1996)Mol.Cell.Probes 10:257-271)  和其它RNA聚合酶介导的技术(如,NASBA,Cangene,Mississauga,Ontario),也见,例如,Berger(1987)Methods Enzymol.152:307-316;Sambrook;Ausubel;美国专利4,683,195和4,683,202;Sooknanan(1995)Biotechnology 13:563-564。
确定序列同一性的水平
发明提供包括与发明的典型核酸(例如,SEQ ID NO:1,SEQ ID NO:3,SBQID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ IDNO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ IDNO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ IDNO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ IDNO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ IDNO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ IDNO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQID NO:105,和编码SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SBQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SBQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106的核酸)在至少大约50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150,1200,1250,1300,1350,1400,1450,1500,1550或者更多的残基范围内具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全的(100%)序列同一性的序列的核酸。发明提供含有与发明的典型多肽具有至少大约50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全(100%)的序列同一性的序列的多肽。序列同一性(同源性)的范围可以应用任何计算机程序和相关参数来确定,包括那些在此所说明的,如用默认参数的BLAST 2.2.2.或者FASTA 3.0t78版。
在可选择的实施方案中,序列同一性可以在核酸或者多肽的至少大约5,10,20,30,40,50,100,150,200,250,300,350,400个连续的残基,或者全长的范围内。序列同一性(同源性)的程度可以应用任何计算机程序和相关联的参数来确定,包括那些在此所说明的,如使用默认参数的BLAST 2.2.2.或者FASTA3.0t78版。
同源性序列也包括RNA序列,其中在核酸序列中尿嘧啶替代了胸腺嘧啶。同源序列可以应用在此说明的任何程序得到或者可以由校正序列错误得到。应该理解到的是,在此所列的核酸序列可以以传统的单一字母的形式来代表(见,如,Stryer,Lubert.Biochemistry 3rd Ed.,W.H.Freeman & Co.,New York)或者以记录序列中的核苷酸的同一性的任何其他形式来代表。
在发明的这一方面,在此指明的各种序列比较程序得以使用。蛋白和/或核酸序列同一性(同源性)可以应用技术上已知的任何序列比较算法和程序评估。这样的算法和程序包括,但不限于,TBLASTN,BLASTP,FASTA,TFASTA,和CLUSTALW(Pearson和Lipman,Proc.Natl.Acad.Sci.USA 85(8):2444-2448,1988:Altschul et al.,J.Mol.Biol.215(3):403-410,1990;Thompson et al.,NucleicAcids Res.22(2):4673-4680,1994;Higgins et al.,Methods Enzymol.266:383-402,1996;Altschul et al.,J.Mol.Biol.215(3):403-410,1990;Altschul et al.,NatureGenetics 3:266-272,1993)。
同源性或者同一性可以应用序列分析软件来测定(如,遗传学计算机组的序列分析软件包,Uinversity of Wisconsin Biotechnology Center,1710 UniversityAvenue,Madison,WI 53705)。这样的软件通过对各种缺失,替换,或者其它的修饰进行同源性水平赋值比较相似的序列。在两个或者多个核酸或者多肽序列的语境下,术语“同源性”和“同一性”是指两个或者多个序列或者亚序列,当在比较窗口或者指定区域中应用任何数量的序列比较算法或者手动排列和目测来测定,通过比较和排列以便获得最大的一致性时,它们是相同的或者具有氨基酸残基或者核苷酸的特异百分比。对于序列比较,一个序列可以作为参照序列(典型序列SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,.SEQ ID NO:5,SEQID NO:6,SEQ ID NO:7,SEQ ID NO:8,等等)与待测序列进行比较。当应用序列比较算法,待测序列和参照序列被输入到计算机中,如果必要指定亚序列坐标,指定序列算法程序参数。可以应用默认程序参数,或者指定选择性参数。序列比较算法依据程序参数,计算待测序列和参照序列同一性的百分比。
在此应用的“比较窗口”,包括涉及连续残基的数目的任何一个片段。例如,在发明可选择的方面,连续残基的范围从20到全长的发明的典型序列,例如,SEQID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,等等,当两个序列优化地排列后,与参照序列的相同数目的连续位置进行比较。如果参照序列与发明的典型序列,例如SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ IDNO:7,SEQ ID NO:8等具有必要的序列同一性,如,50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多的序列同一性,该序列是属于发明的范围。在可选择的实施方案中,当两个序列优化地排列后,从大约20到600,大约50到200,和大约100到150范围的序列与参照序列的同样的连续位置比较。用于比较的序列比对方法为技术熟练人员所熟悉。用于比较的优化序列比对可以用,例如,Smith & Waterman,Adv.Appl.Math.2:482,1981的局部同源性算法,Needleman & Wunsch,J.Mol.Biol.48:443,1970的同源排列算法,Person & Lipman,Proc,Nat′1.Acad.Sci.USA 85:2444,1988的搜索相似性法,通过计算机化这些算法(Wisconsin的遗传学软件包,遗传学计算机组,575 Science Dr,Madison,WI的GAP,BESTFIT,FASTA,和TFASTA)或者通过手动排列和目测完成。其它的用于确定同源性或者同一性的算法包括,例如,除了(在生物信息国家中心的基本局部排列搜索工具)BLAST程序外,ALIGN,AMAS(多排列的序列分析),AMPS(蛋白多序列比对),ASSET(比对片段的统计评估工具),BANDS,BESTSCOR,BIOSCAN(生物序列比较分析节点),BLIMPS(BLocks IMProved Searcher),FASTA,Intervals & Points,BMB,CLUSTAL V,CLUSTAL W,CONSENSUS,LCONSENSUS,WCONSENSUS,Smith-Waterman算法,DARWIN,Las Vegas算法,FNAT(强迫核苷酸比对工具),Framealign,Framesearch,DYNAMIC,FILTER,FSAP(Fristensky序列分析包),GAP(通用比对程序),GENAL,GIBBS,GenQuest,ISSC(灵敏的序列比较),LALIGN(局部序列比对),LCP(局部含量程序),MACAW(多比对构建&分析工作台),MAP(多比对程序),MBLKP,MBLKN,PIMA(模式诱导的多序列比对),SAGA(遗传算法的序列比对)和WHAT-IF。这样的比对程序也可以用于筛查基因组数据库,鉴定具有实质上同一性序列的多核苷酸序列。目前已经有很多基因组数据库,例如,人类基因组的实质上部分可以作为人类基因组测序计划(Gibbs,1995)的一部分。几个基因组已经测序完成,如,生殖道支原体Mgenitalium(Fraseret al.,1995),甲烷球菌M.jannaschii(Bult et al.,1996),流感嗜血菌H influenzae(Fleischmann et al.,1995),大肠杆菌E coli(Blattner et al.,1997),和酵母(S.cerevisiae)(Mewes et al.,1997),和果蝇D.melanogaster(Adams et al.,2000)。模式生物的基因组测序中已经取得了显著的进展,如小鼠,线虫,和拟南芥Arabadopsis sp.。含有具功能性信息注解的基因组信息的数据库由不同的组织保持,并且可以通过因特网进行访问。
BLAST,BLAST 2.0和BLAST 2.2:2算法也用于实践发明。这些算法在,如,Altschul(1977)Nuc.Acids Res.25:3389-3402,Altschul(1990)J.Mol.Biol.215:403-410中有描述。进行BLAST分析的软件可以通过生物技术信息国家中心(the National Center for Biotechnology Information)公开得到。此算法包括首先通过确定询问序列中长度为W的短词,当与数据库中相同长度的词对齐时,其或者匹配或者满足正值阈得分T,从而确定高分值序列对(HSPs)。T值是指作为邻近词的分数阈值(Altschul(1990),见上文)。这些起始的邻近词命中作为起始搜索的起始,从而发现更长的含有邻近词的HSPs。只要积累的比对值可以增加,词命中就沿着每个序列向两个方向延伸。对于核苷酸序列,积累值的计算应用参数M(匹配残基对的奖励得分值;一般情况下大于0)。对于氨基酸序列,应用记分矩阵来计算累积值。当:累积的比对得分值从其最大所得值跌落到数量X;由于一个或者多个负值残基的比对的积累,累积值趋向零或者零以下;或者任何一个序列的到达了末端,单词命中的延伸在每一个方向终止。BLAST算法参数W,T,和X决定了比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字母长度(W)为11,期望值(E)为10,M=5,N=-4的默认值并且比较两条链。对于氨基酸序列,BLASTP程序使用字母长度为3,期望值(E)为10的默认值,BLOSUM62记分矩阵(见Henikoff & Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)比对值(B)为50,期望值(E)为10,M=5,N=-4,并且比较两条链。BLAST算法也对两个序列之间的相似性进行统计分析(见,如,Karlin&Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873)。由BLAST算法提供的一个相似性测定是最小总概率(P(N)),其通过两个核苷酸之间或者氨基酸序列之间随机配对,提供概率的指标。例如,在检测核酸和参照序列比较时,如果最小的总概率小于大约0.2,更优选的是小于大约0.01,最优选的小于大约0.001,那么认为核酸与参考序列相似。一方面,蛋白质和核酸序列的同源性应用基本局部比对搜索工具(“BLAST”)评估。例如,五个特异性的BLAST程序可以用于以下任务:(1)BLASTP和BLAST3把氨基酸询问序列与蛋白序列数据库进行比较。(2)BLASTN把核酸询问序列与核酸序列数据库进行比较。(3)BLASTX把询问的核苷酸序列的六个框架的翻译产物(两个链)与蛋白序列数据库进行比较。(4)TBLASTN把询问的蛋白序列与六个阅读框架(双链)中翻译的核酸序列数据库进行比较,并且(5)TBLASTX把询问核酸的六个阅读框架的翻译与数据库中核苷酸序列的六个阅读框架的翻译进行比较。BLAST程序通过鉴定相似片段来鉴定同源序列,相似片段在此是指询问氨基酸或者核酸序列之间的“高分值片段对”,检测序列优选的从蛋白质或者核酸序列数据库中获得。高分值片段配对优选地通过记分矩阵鉴定(比对),它们中的很多为技术熟练人员所熟悉。优选地,应用的记分矩阵是BLOSUM62矩阵(Gonnet et al.,Science 256:1443-1445,1992,Henikoff和Henikoff,Proteins 17:49-61,1993)。较不优选地,PAM或者PAM250矩阵也可以应用(见,例如,Schwartz和Dayhoff,eds.,1978,检测距离关系的矩阵:蛋白质序列和结构集,华盛顿:  国家生物医学研究基金会)。
发明的一方面,为了确定是否核酸具有发明范围内的必需序列同一性,应用NCBI BLAST 2.2.2程序,默认值的选择是blastp。在BLAST 2.2.2程序中,有大约38个设定的选择。在发明的典型方面,除了默认的过滤设置外,所有都应用默认值(即除了过滤设定为关闭,所有的参数设定为默认值),在该位置上应用不进行过滤“-F F”设置。一般由于序列的长度,默认过滤的使用经常导致Karlin-Altschul违背。
发明的典型方面的使用的默认值包括:
“低复杂性过滤:on
>字长:3
>矩阵:Blosum62
>缺口成本:存在值:11
>延伸:1”
其它的默认值设置为:低复杂性过滤关闭(off),蛋白质字母长度为3,BLOSUM62矩阵,缺口存在补偿-11,并且缺口延伸补偿-1。
典型的NCBI BLAST 2.2.2程序设置在以下的实施例1中阐明。注意,“-W”选择默认值为0。这是指,如果没有设置,对于蛋白,字母长度默认值为3,对于核苷酸字母长度默认值为11。
计算机系统和计算机程序产品
为了确定和鉴定序列同一性,结构同源性,基元等等,发明的序列可以在任何计算机可以读取的介质上储存,记录和操作。相应地,发明提供计算机,计算机系统,计算机可读介质,计算机程序产品和等等可以记录和储存发明的核酸和多肽序列,例如,发明的典型序列,如,SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ ID NO:7,SEQ ID NO:8,等等的产品。正如在此使用的,单词“记录的”和“存储的”是指在计算机介质上储存信息的过程。熟练的技术人员可以很容易地采用任何已知的方法在计算机的可读介质上记录信息,产生含有一个或者多个发明的核酸和/或多肽序列的产品。
发明的另一方面是具有记录发明的至少一个核酸和/或多肽序列的计算机可读介质。计算机可读介质包括磁性可读介质,光学可读介质,电子可读介质和磁性/光学介质。例如,计算机可读介质可以是硬盘,软盘,磁带,CD-ROM,DVD,随机存取存储器(RAM),只读存储器(ROM)以及其它类型的技术人员熟知的其它媒介。
发明的方面包括系统(如,以因特网为基础的系统),特别的计算机系统,其存储和操作在此说明的序列和序列信息。计算机系统100的一个实施例在图1的方块图中有说明。正如在此所使用的,“计算机系统”是指用于分析发明的核苷酸和多肽序列的硬件组件,软件组件,以及数据存储组件。计算机系统100可以包括用于序列数据处理,访问和操作的处理器。处理器105可以是任何已知类型的中央处理器如,例如,Intel公司的奔腾III处理器或者Sun,Motorola,Compaq,AMD或者IBM公司相似的处理器。计算机系统100是一般目的的系统,其包括处理器105和用于存储数据的一个或者多个内部数据存储组件110,和一个或者多个用于检索存储于数据存储装置的数据的数据检索装置。熟练的技术人员可以很容易地应用任何一个目前可得到的合适的计算机系统。
一方面,计算机系统100包括连接于总线的处理器105,该总线连接于主存储器115,(优选地,作为RAW执行)和一个或者更多的内部数据存储装置110,如硬盘驱动器和/或其它的具有数据存储的计算机可读介质。计算机系统100可以进一步包括一个或者多个用于读取存储于内部数据存储装置110的数据的数据检索装置118。
数据检索装置118可以为,例如,软盘驱动器,光盘驱动器,磁带驱动器或者可以连接于远端数据存储系统的调制解调器(如通过因特网)等等。在一些具体情况下,内部的数据存储装置110是可移动的计算机可读介质如,软盘,光盘,磁带,等等。含有控制逻辑和/或其中记录的数据。当数据存储组件插入到数据检索装置中时,计算机系统100可以优势地包括或者通过适当的软件执行来读取控制逻辑和/或数据。
计算机系统100包括用于给计算机应用者显示输出的结果的显示器120。应当注意到计算机系统100可以在网络中或者宽带网中连接于其它的计算机系统125a-c,提供集中地接到计算机系统100。连接和处理发明的核酸或者氨基酸序列的软件可以在执行过程中驻留在主存储器115中。
一些方面,计算机系统100可以进一步包括比较发明的核酸序列的序列比较算法。算法和序列可以储存在计算机可读的介质中。“序列比较算法”是指一个或者多个程序,可以安装在(局域地或者远程地)计算机系统100上,把核酸序列与别的核酸序列和/或在数据存储方式中存储的化合物相比较。例如,序列比较算法可以把典型的序列的核苷酸序列,如,存储在计算机可读介质中的SEQ ID NO:1,SEQ ID NO:2,SEQ ID NO:3,SEQ ID.NO:4,SEQ ID NO:5,SEQ ID NO:6,SEQ IDNO:7,SBQ ID NO:8等等与存储在计算机可读介质中的参照序列进行比较,确定同源性或者结构基元。
以上算法应用的参数可以依据所研究的序列长度和同源性水平而加以变化。一些方面,算法使用的参数可以在使用者没有给出指令的情况下,应用默认参数。图2是说明过程200的流程图,把新的核苷酸或者蛋白序列和数据库的序列加以比较,确定新序列和数据库序列之间的同源性水平。序列数据库可以是在储存于计算机系统100的私人数据库,或者公开数据库,如通过因特网可以查到的GENBANK。过程200在起始状态201开始,并且移动到状态202,其中待比较的新序列储存于计算机系统100的存储器中。正如以上所讨论的,存储器可以是任何类型的存储器,包括RAM或者内部存储装置。
过程200随后移至状态204,其中的序列数据库开放用于分析和比较。进程200然后移至状态206,其中读取存储在数据库的第一序列至计算机的存储器中。在状态210下进行比较,确定是否第一序列与第二序列一样。值得注意的是,本步骤并不限于进行新序列和数据库中的第一序列进行精确的比较。技术熟练人员熟悉比较两个核苷酸或者蛋白序列的方法,尽管它们并不相同。例如,为了提高两个待检测序列的同源性水平,可以在一个序列中引入缺口。在比较过程中控制是否引入缺口或者其它的特征到序列中的参数一般由计算机系统的使用者输入。
一旦在状态210的情况下,进行了两个序列的比较,那么在决定状态210就作出是否两个序列一样的确定。当然,术语“同样”并不限于完全绝对一样的序列。在使用者输入的同源性参数内的序列将在过程200中被标记为“相同的”。如果确定了两个序列是一样的,过程200移至状态214,其中来自数据库的序列的名称给使用者显示出来。该状态告诉使用者显示了名称的序列具有输入所限制的同一性。一旦储存序列的名称给使用者显示出来,过程200移至决定状态218,作出是否在数据库中有更多的序列的结论。如果在数据库中没有更多的序列,那么过程200终止于结束状态220。然而,如果在数据库中存在更多的序列,那么过程200移至状态224,其中指示器移到数据库中下一个序列,以便可以与新序列进行比较。以这种方式,比对新序列并且与数据库中的每一个序列进行比较。
应当注意,如果在决定状态212作出了决定,序列没有同源性,那么过程200将立即移至决定状态218,确定在数据库中是否有其它的序列用于比较。同样地,发明的一方面是包括处理器,储存有发明的核酸序列的数据存储装置以及用于进行比较的序列比较软件的计算机系统。序列比较器可以指示待比较序列之间的同源性水平或者鉴定结构基元,或者可以确定与核酸密码子和多肽密码相比较的序列中的结构基元。
图3是说明计算机中过程250的一个具体例子,确定是否两个序列具有同源性的流程图。过程250开始于起始状态252,并且随后移至状态254,其中待比较的第一序列存储于存储器中。待比较的第二序列随后在状态256存储于存储器中。过程250然后移至状态260,其中读取第一序列的第一个字母,然后移至状态262,其中读取第二序列的第一个字母。应当理解如果序列是核苷酸序列,那么字母是A,T,C,G,或者U。如果序列是蛋白序列,那么字母为单个的氨基酸序列密码,以便第一序列与第二序列可以很容易地进行比较。在决定状态264作出是否两个字母是一样的决定。如果它们一样,过程250移至状态268,来读取第一和第二序列的下一个字母,然后确定是否下一个字母是相同的。如果相同,过程250继续该循环一直到两个字母不同。如果确定下一个两个字母不同,过程250移至决定态274,确定是否在序列中有任何更多的字母来读取。如果没有更多的字母来读取,那么过程250移至状态276,其中第一和第二序列的同源性水平给使用者显示出来。同源性水平通过计算序列间的相同字母的数目占第一序列总的字母数的比例来确定。这样,如果在第一个100个核苷酸序列中比对的每一个字母与第二序列的每一个字母一样,同源性水平将是100%。
可选择地,计算机程序可以比较参照序列与发明的序列,确定是否序列在一个或者多个位置上不同。程序可以记录发明序列和参照序列中插入,缺失或者替换核苷酸或者氨基酸残基的长度和同一性,计算机程序可以是确定是否参照序列与发明的序列相比含有单一核苷酸多态性(SNP),或者是否发明的序列含有已知序列的SNP的程序。这样,在一些方面,计算机程序是鉴定SNPs的程序。该方法可以通过以上说明的计算机系统来完成并且该方法在图3中有说明。该方法可以通过应用计算机程序读取发明序列和参照序列来进行,并且用计算机程序来鉴定差异。
另一方面,以计算机为基础的系统包括鉴定发明的核酸或者多肽特征的鉴定器。“鉴定器”是指一个或者多个鉴定核酸序列的一些特征的程序。例如,鉴定器可以包括鉴定核酸序列中开放阅读框架(ORF)的程序。图4是说明用于检测序列中存在特征的鉴定器程序300的一个方面的流程图。过程300起始于起始状态302然后移至状态304,其中待检测特征的第一序列存储于计算机系统100的存储器115。过程300然后移至状态306,在该状态下,开放具有序列特征的数据库。这样数据库将包括每一个特征属性和特征名称的菜单。例如,特征名称可以是“起始密码子”,特征属性为“ATG”。另一个例子是特征名称为“TAATAA盒”,特征属性为“TAATAA”。这样的数据库是由威斯康辛大学遗传学计算机组制作。可选择地,特征可以是结构多肽基元如α螺旋,β折叠,或者功能性多肽基元如,酶的活性位点,螺旋-转角-螺旋基元或者其它的技术熟练人员所熟知的基元。一旦在状态306特征数据库开放,过程300移至状态308,其中第一特征从数据库中读取。然后在状态310中进行第一特征的属性与第一序列的比较。然后在状态316下作出决定是否在第一序列发现有特征的属性。如果发现属性,过程300移至状态318,其中发现特征的名称显示给使用者。过程300然后移至决定状态320,在其中作出是否在数据库中存在更多的特征的决定。如果不存在更多的特征,过程300终止于结束状态324。然而,如果数据库中有更多的特征,过程300在状态326读取下一个序列特征,并且循环至状态310,其中下一个特征的属性与第一序列进行比较。如果在状态316并没有在第一序列中发现特征属性,过程300直接移至决定状态320,作出是否有更多的特征存在于数据库中的确定。这样,一方面,发明提供鉴定开放阅读框架(ORFs)的计算机程序。
发明的多肽和核酸序列可以以不同的形式用不同的数据处理程序存储并且处理。例如,序列可以以如文本的字处理文件储存,如,Miorosoft WORD或者WORDPERFECT或者那些技术熟练人员熟悉的不同的数据程序的ASCll文件,如,DB2,SYBASE,或者ORACLE。此外,很多的计算机程序和数据库可以作为序列比较算法,鉴定器,或者,参照核苷酸序列或者多肽序列的来源,与发明的核酸序列比较。用于实践发明的程序和数据库包括,但不限于:MacPattern(EMBL),DiscoveryBase(Molecular Applications Group),GeneMine(Molecular ApplicationsGroup),Look(Molecular Applications Group),MacLook(Molecular ApplicationsGroup),BLAST和BLAST2(NCBI),BLASTN和BLASTX(Altschul et al,J.Mol.Biol.215:403,1990),FASTA(Pearson和Lipman,Proc.Natl.Acad.Sci.USA,85:2444,1988),FASTDB(Brutlag et al.Comp.App.Biosci.6:237-245,1990),Catalyst(Molecular Simulations Inc.),Catalyst/SHAPE(Molecular Simulations Inc.),Cerius2.DBAccess(Molecular Simulations Inc.),HypoGen(Molecular Simulations Inc.),Insight II,(Molecular Simulations Inc.),Discover(Molecular Simulations Inc.),CHARMm(Molecular Simulations Inc.),Felix(Molecular Simulations Inc.),DelPhi,(Molecular Simulations Inc.),QuanteMM,(Molecular Simulations Inc.),Homology(Molecular Simulations Inc.),Modeler(Molecular Simulations Inc.),ISIS(Molecular Simulations Inc.),Quanta/Protein Design(Molecular Simulations Inc.),WebLab(Molecular Simulations Inc.),WebLab Diversity Explorer(MolecularSimulations Inc.),Gene Explorer(Molecular Simulations Inc.),SeqFold(MolecularSimulations Inc.),MDL可用的化学品目录数据库,MDL的药物数据报告数据库,综合药物化学数据库(the Comprehensive Medicinal Chemistry database),Derwent′s世界药物索引数据库,BioByteMasterFile数据库,Genbank数据库,和Genseqn数据库。很多其它的程序和数据库对于技术熟练人员是显然的。
可以应用以上程序检测的基元包括序列编码的亮氨酸拉链,螺旋-转角-螺旋基元,糖基化位点,泛素化位点,α螺旋,和β折叠,编码信号肽的信号序列,信号肽引导编码蛋白的分泌,转录调控涉及的序列,如,同源盒,酸性分枝,酶活性位点,底物结合位点,和酶切割位点。
核酸的杂交
发明提供可以在严谨的条件下,与发明的典型序列,例如,在SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SBQID NO:13,SEQ ID NO:15,SBQ ID NO:17,SEQ ID NO:19,SBQ ID NO:21,SEQID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105中阐明的序列,或者编码包括在SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106中阐明序列的多肽的核酸杂交的分离的或者重组的核酸。严谨条件可以是高度严谨条件,中度严谨条件,低度严谨条件,包括在此说明的高度和降低严谨性的条件。在可选择的具体情况下,通过在严谨条件下杂交能力所定义的发明的核酸可以是大约5个残基到全长分子之间,例如,发明的典型核酸。例如,它们的长度可以是至少5,10,15,20,25,30,35,40,50,55,60,65,70,75,80,90,100,150,200,250,300,350,400个残基。比全长核酸较短的核酸也包括在内。这些核酸可以用于如杂交探针,标记探针,PCR寡聚核苷酸探针,iRNA(单链或者双链),反义或者编码抗体结合肽(抗原决定簇)的序列,基元,活性位点和类似物。
一方面,发明的核酸通过其可以在高的严谨性条件下杂交的能力定义,高严谨性包括条件为大约37℃到42℃,大约50%的甲酰胺。一方面,发明的核酸通过其可以在降低的严谨性条件下杂交的能力定义,降低的严谨性包括条件为大约30℃到35℃,大约35%到25%的甲酰胺。可选择地,发明的核酸通过其可以在高严谨性条件下杂交的能力定义,高严谨性包括条件为42℃,50%的甲酰胺中,5×SSPE,0.3%的SDS,以及作为封闭核酸的重复序列,如cot-1或者鲑鱼精DNA(例如,200n/ml剪切的和变性的鲑鱼精DNA)。一方面,发明的核酸通过其可以在降低的严谨条件下杂交的能力定义,降低的严谨性包括条件为降低的温度35℃,含有35%的甲酰胺。
杂交以后,滤膜可以在50℃,用6×SSC,0.5%的SDS洗膜。认为超过25%的甲酰胺的这些条件是“中度”条件,而小于25%的甲酰胺的条件是“低度”条件。“中度”杂交条件的一个特定例子是当以上的杂交在30%的甲酰胺下进行。“低严谨性”的特定例子是当上述杂交在10%的甲酰胺下进行。
与特定水平的严谨性相对应的温度范围可以进一步通过计算该核酸中嘌呤与嘧啶的比例来细化,并且相应地调节温度。发明的核酸也通过其可以在Ausubel和Sambrook中所述的高度,中度,低度严谨性条件下杂交的能力来定义。以上范围和条件的变化为技术熟练人员所熟悉,杂交条件在以下有进一步的讨论。
寡聚核苷酸探针和应用方法
发明也提供用于鉴定编码具有磷脂酶活性的多肽的核酸的核酸探针。一方面,探针包括在SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ IDNO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ IDNO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ IDNO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ IDNO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ IDNO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ IDNO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ IDNO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ IDNO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105中阐明的序列的至少10个连续碱基。可选择地,发明的探针可以是发明的序列中所阐明的序列的至少大约5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,30,35,40,50,55,60,65,70,75,80,90,100,150,大约10到50,大约20到60,大约30到70个连续碱基。探针通过结合或者杂交来鉴定核酸。探针可以用于本发明的阵列中,见以下讨论,包括,例如,毛细管阵列。发明的探针也可以用于分离其它的核酸或者多肽。
发明的探针可以用于确定是否生物样品,如土壤样品,含有具有发明的核酸序列的生物或者含有核酸来源的生物。在这一程序中,获得潜在地隐藏了从其中分离核酸的生物体的生物样品,并且从样品中获得核酸。核酸在允许探针与样品中存在的任何互补序列特异杂交的条件下与探针接触。如果必要,探针与互补序列特异杂交的条件可以通过将探针与已知含有互补序列核酸的样品中的互补序列接触来确定,同时对照序列为不含有互补序列。可以改变杂交条件,如杂交缓冲液中的盐浓度,杂交缓冲液中的甲酰胺浓度,或者杂交温度,来使得探针特异性地与互补的核酸序列杂交(见,特异杂交条件的讨论)。
如果样品中含有核酸自其中分离的生物,检测探针特异的杂交。杂交可以通过用检检测剂,如放射性同位素,荧光染料或者可以催化形成可检测产物的酶,标记探针进行检测。应用标记的探针来检测在样品中存在互补的核酸的很多方法为技术熟练人员所熟悉。这些方法包括Southern印迹,Northern印迹,菌落杂交程序,以及斑点印迹杂交。每一个程序的具体方法参见Ansubel和Sambrook。
可选择地,多于一个探针(至少一种可以与存在于核酸样品中的任何互补序列杂交的探针)可以在扩增反应中使用,确定是否样品中含有具有发明的核酸序列的生物(如,核酸自其中分离的生物)。一方面,探针包括寡核苷酸。一方面,扩增反应可以包括PCR反应。PCR的具体方法在Ansubel和Sambrook的书中有说明(参见扩增反应的讨论)。在这样的程序中,样品中的核酸与探针接触,进行扩增反应,检测得到的任何扩增产物。扩增产物可以通过反应产物进行凝胶电泳来检测,并且用如溴乙啶的插入试剂来染胶。可选择的,一个或者多个探针可以用放射性同位素标记,并且在凝胶电泳后,通过放射自显影检测是否存在放射性标记的扩增产物。
来源于发明的核酸序列的近3’或者5’端的探针也可以用染色体步行程序来确定含有另外的,如基因组序列的克隆。这样的方法允许从宿主生物体中分离编码另外感兴趣蛋白的基因。
一方面,发明的核酸作为探针鉴定和分离相关的核酸。在一些方面,这样确定的相关核酸可以是来自于非发明核酸首次自其中分离的生物体的cDNA或者基因组DNA,通过这样的程序,核酸样品与探针在允许探针特异地与相关序列杂交的条件下接触。探针与来源于相关生物体的核酸杂交后,应用以上说明的任何方法来检测。
在核酸杂交反应中,用于达到特定严谨性水平的条件可以根据待杂交核酸的性质来进行改变。例如,在选择杂交条件中要考虑长度,互补水平,核酸杂交区域的核苷酸序列组成(如,GC对AT含量的比率),以及核酸类型(如,RNA对DNA)。另外考虑是否核酸中的一个是固定于,如滤膜上。杂交可以在低严谨性,中度严谨性或者高严谨性的条件下进行。作为核酸杂交的一个例子,含有固定的变性的核酸的多聚膜首先在45℃下,在含有0.9M NaCl,50mM NaH2PO4,PH 7.0,5.0mM Na2EDTA,0.5%SDS,10×Denhardt′s和0.5mg/ml多核腺苷酸的溶液中预杂交30分钟。大约2×107cpm(特异活性4-9×108cpm/ug)的32P末端标记的寡聚核苷酸探针加入到溶液中。在12-16小时的温育以后,膜在室温(RT)下于含有0.5%SDS的1×SET(150mM NaCl,20mM Tris盐酸,PH 7.8,1mM Na2EDTA)中洗涤30分钟,然后在新鲜配制的1×SET,寡聚核苷酸探针的Tm-10℃下,再洗涤30分钟。然后将膜暴露于自显影胶片上来检测杂交信号。
通过改变鉴定核酸,如可以与探针杂交的cDNA或者基因组DNA,时所用的杂交条件的严谨性,可以鉴定和分离与探针具有不同同源性水平的核酸。严谨性变化可以通过在低于探针熔链温度的改变温度下进行杂交来进行。熔链温度Tm,是(在确定的离子强度和pH值的条件下)50%的靶序列与完全互补探针杂交的温度。对于特定的探针,非常严谨性的条件是选择等于或者低于特定探针Tm值5℃。探针的熔链温度可以通过以下的经验公式计算。对于长度为14到70个核苷酸长度的探针,熔链温度(Tm)的计算应用以下公式:Tm=81.5+16.6(log[Na+])+0.41(G+C部分)-(600/N),其中N是探针的长度。如果杂交是在含有甲酰胺的溶液中进行,熔链温度的计算用以下的公式:Tm=81.5+16.6(log[Na+])+0.41(G+C部分)-(0.63%甲酰胺)-(600/N)其中N是探针的长度。预杂交可以在6×SSC,5×Denhardt′s试剂,0.5%SDS,100μg变性的鲑鱼精DNA片段或者6×SSC,5×Denhardr′s试剂,0.5%SDS,100μg变性的鲑鱼精DNA片段,50%甲酰胺中进行。SSC和Denhardt′s以及其它溶液的配方见,例如,Sambrook。
杂交是通过加入可检测到的探针于以上所列的预杂交溶液中进行,其中的探针包括双链DNA。探针在加入到杂交溶液之前先要进行变性。滤膜首先与杂交溶液充分接触一段时间,使得探针与含有互补序列或者同源序列的cDNA或者基因组DNA杂交。对于长度超过200个核苷酸的探针,杂交在比Tm低15到25℃进行。对于较短的探针如寡聚核苷酸探针,杂交在比Tm低5到10℃进行。一方面,在6×SSC中,大约是68℃进行杂交。一方面,在含有50%甲酰胺的溶液,温度大约为42℃进行杂交。认为前述的所有杂交认为是在高严谨性条件下进行。
杂交以后,滤膜洗涤去除任何非特异结合的可以检测到的探针。洗膜所用的严谨性也可以根据杂交的核酸的性质,杂交核酸的长度,互补的程度,核苷酸序列的组成(如,GC对AT的含量),以及核酸类型(如,RNA对DNA)来进行变化。逐渐增高严谨性条件的洗膜例子如下:2×SSC,室温下0.1%SDS 15分钟,(低严谨性);0.1×SSC,室温下0.5%SDS30分钟到1小时(中度严谨性);0.1×SSC,0.5%SDS,杂交温度和68℃之间15到30分钟(高严谨性);0.15M NaCl,在72℃下15分钟(很高严谨性),最后低严谨性洗涤可以在0.1×SSC室温下进行。以上的例子仅仅是用于洗膜的一系列条件。技术熟练人员应该了解对于不同严谨性的洗涤有很多不同的方法(recipes)。
可以与探针杂交的核酸可以通过放射自显影或者其它传统的技术来确定。可以改变以上的程序来鉴定具有与探针序列具有降低的同源性水平的核酸。例如为了获得与探针序列具有降低的同源性水平的核酸,可以应用不太严谨的条件。例如,在含有Na+浓度为大约1M的杂交缓冲液中,杂交温度可以从68℃到42℃以5℃的幅度降低。杂交后,滤膜用2×SSC,0.5%SDS在杂交温度下洗膜。认为高于50℃的条件为“中度”条件,低于50℃的条件为“低度”条件。“中度”杂交条件的一个例子是当以上的杂交在55℃的条件下进行。“低严谨性”杂交条件的一个例子是当以上的杂交在45℃的条件下进行。
可选择地,杂交在缓冲液,如含有甲酰胺的6×SSC中,在42℃下进行。在这种情况下,杂交缓冲液中甲酰胺的浓度可以以5%的幅度从50%降低到0%来确定对探针具有降低的同源性水平的克隆。杂交后,滤膜可以用6×SSC,0.5%SDS在50℃下洗涤,认为当甲酰胺浓度大于25%为“中度”条件,而低于25%为“低度”条件。“中度”杂交条件的一个例子是当以上的杂交在30%的甲酰胺中进行。“低严谨性”杂交条件的一个例子是当以上的杂交在10%的甲酰胺中进行。
发明的这些探针和方法可以用于分离具有与发明的核酸序列有至少大约99%,98%,97%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%,或者至少50%的序列同源性的序列的核酸,该核酸包括至少大约10,15,20,25,30,35,40,50,75,100,150,200,250,300,350,400,或者500个连续的碱基和与之互补的序列。同源性可以应用在此所述的比对算法测定。例如,同源的多聚核苷酸可以具有在此说明的一个编码序列的天然发生等位基因突变体的编码序列。这样的等位基因突变体与发明的核酸比较,可以具有取代,缺失或者插入一个或者多个核苷酸。
此外,发明的探针和方法可以用于分离编码与发明多肽具有至少大约99%,至少95%,至少90%,至少85%,至少80%,至少75%,至少70%,至少65%,至少60%,至少55%,,或者至少50%的序列同一性(同源性)的多肽的核酸,应用序列比对算法(如,使用默认参数的FASTA版本3.0t78的算法,或者具有在此阐明的典型设置的BLAST2.2.2程序)确定的,该多肽具有其至少5,10,15,20,25,30,35,40,50,75,100,或者150个连续的氨基酸。
抑制磷脂酶的表达
发明进一步提供与发明的核酸序列如磷脂酶编码核酸互补的核酸(如,反义序列)。反义序列可以抑制磷脂酶编码基因的转运,剪接或者转录。抑制可以通过靶向基因组DNA或者信使RNA起作用。靶核酸的转录或者功能可以被抑制,例如,通过杂交和/或切割。发明提供的特别有效的一套抑制物包括可以结合磷脂酶基因或者信使PNA的寡聚核苷酸,在每一种情况下,阻止或者抑制磷脂酶的产生或者功能。结合是通过序列特异性的杂交实现的。另一类有用的抑制物包括引起磷脂酶信使RNA失活或者切割的寡聚核苷酸。寡聚核苷酸可以具有引起切割的酶活性,如核酶。寡聚核苷酸可以通过化学修饰或者接合到可以切割互补核酸的酶或成分上。操作人员可以从很多不同的此类寡聚核苷酸所构成的文库中筛选出具有所需活性的这样寡聚核苷酸。
磷脂酶表达的抑制可以具有多种不同的工业用途。例如,抑制磷脂酶的表达可以减慢或者阻止酸败。当脂类或多肽,如,结构脂类或者多肽,被酶降解时,可能发生酸败。这可以导致水果和蔬菜的变质或者腐败。一方面,应用可以抑制磷脂酶的表达和/或活性的本发明的组分,例如,抗体,反义寡聚核苷酸,核酶和RNAi可以用于减缓或者阻止酸败。这样,一方面,发明提供包括应用于植物或者植物产品(如,水果,种籽,根,叶,等等)的方法和组分的本发明的抗体,反义寡聚核苷酸,核酶和RNAi,用于阻止或者延缓酸败。这些组分也可以由植物表达(如,转基因植物)或者其它生物(如,用本发明的磷脂酶基因转化的细菌或者其它微生物)。
用于抑制磷脂酶表达的本发明的组分(如反义,iRNA,核酶,抗体)可以作为药物的组分。
反义寡聚核苷酸
发明提供可以结合磷脂酶信使的反义寡聚核苷酸,反义寡聚核苷酸可以通过靶向mRNA来抑制磷脂酶活性。设计反义寡聚核苷酸的策略在科学和专利文献中有说明,并且技术熟练人员可以应用发明的新试剂设计这样的磷脂酶寡聚核苷酸。例如,基因步行/RNA作图方法来筛查有效的反义寡聚核苷酸为技术熟练人员所了解,见,如,Ho(2000)Methods Enzymol.314:168-183,描述了RNA图谱分析,RNA图谱分析以标准的分子技术为基础,给有效的反义序列的筛选提供了简易的和可靠的方法。也见Smith(2000)Eur.J.Pharm.Sci.11:191-198。
也可以应用天然产生的核酸作为反义寡聚核苷酸。反义寡聚核苷酸可以是任何长度;例如,在可选择的方面,反义寡聚核苷酸在大约5到100,大约10到80,大约15到60,大约18到40之间。优化的长度可以通过常规的筛查来确定。反义寡聚核苷酸可以以任何浓度存在。优化的浓度可以通过常规的筛查来确定。已知有许多合成的,非天然产生的核苷和核酸类似物可以解决潜在的问题。例如,可以应用含有非离子性骨架,如N-(2-氨基乙基)甘氨酸单位的肽核酸(PNAs)。也可以应用具有磷硫连接的反义寡聚核苷酸,如,WO 97/03211;WO 96/39154所述;Mata(1997)Toxicol Appl Pharmacol 144:189-197;反义治疗学,ed.Agrawal(Humana Press,Totowa,N.J.,1996)。发明提供的具有合成的DNA骨架类似物的反义寡聚核苷酸也可以包括磷-二硫,甲基磷酸,磷阿米酮,烷基磷三酯,氨基磺酸盐,3’-硫代乙缩醛,甲叉(甲基亚胺),3′-N-氨基甲酸酯剂,和吗啉代氨基甲酸酯核酸,如以上所述。
可以应用组合化学的方法产生大量的寡核苷酸,这些寡核苷酸是可以快速筛选对任何靶具有适当结合亲和性和特异性的寡聚核苷酸,如发明的有义和反义的磷脂酶序列(见,如,Gold(1995)J.of Biol.Chem.270:13581-13584)。
抑制性核酶
发明提供可以结合磷脂酶信使的核酶,其可以通过靶向mRNA来抑制磷脂酶的酶活性。设计核酶和选择用于靶向的磷脂酶特异的反义序列在科学和专利文献中有说明,并且技术熟练人员可以应用发明的新试剂设计这样的核酶。核酶通过核酶的靶RNA结合部分结合靶RNA起作用,核酶的靶RNA结合部分靠近RNA的酶活部分,酶活部分切割靶RNA。这样,核酶通过互补的碱基配对识别并且结合靶RNA,并且一旦结合于正确的位点,将以酶的方式来切割并且使靶RNA失活。如果切割发生在编码序列,以这种方式的靶RNA的切割将破坏其引发编码蛋白合成的能力。当核酶结合并且切割其靶RNA后,一般情况下,将从RNA上释放,然后对新的靶重复结合和切割过程。
在一些情况下,核酶的酶本质决定了其比其它技术如反义技术(其中核酸分子简单地结合于核酸靶来阻止其转录,翻译或者与其它分子的结合)更优越,因为作为治疗处理有效的必要的核酶的活性浓度低于反义寡聚核苷酸的浓度。这一潜在的优点反映了核酶可以以酶的方式起作用的能力。这样,单一的核酶分子可以切割靶RNA的很多分子。此外,核酶是典型的高度特异性的抑制剂,其抑制的特异性不仅仅依赖于结合的碱基配对机制,也依赖于分子抑制其结合的RNA表达的机制。即,抑制是通过切割RNA靶来引起的,并且特异性是通过切割的靶RNA的切割率占切割的非靶RNA中的切割率的比率来确定。这一切割机制依赖于涉及碱基配对的另外的因子。这样,核酶的特异性作用高于结合于同一个RNA位点的反义寡聚核苷酸。
具有酶活的核酶RNA分子可以形成锤头基元,但是也可以形成发夹,肝炎δ病毒,I类内含子或者RnaseP样的RNA(与RNA的引导序列有关)基元。这样的锤头基元的例子在Rossi(1992)Aids Research and Human Retroviruses 8:183中有说明;发夹基元在Hampel(1989)Biochemistry 28:4929,和Hampel(1990)Nuc.Acids Res.18:299中有说明;肝炎δ病毒基元在Perrotta(1992)Biochemistry31:16中有说明;RNaseP基元在Guerrier-Takada(1983)Cell 35:849中有说明;并且I类内含子在Cech U.S.Pat.No.4,987,071中有说明。列举这些特异基元的目的不是在于对此进行限制;技术熟练人员可以认识到本发明的酶RNA分子具有与一个或者多个靶基因RNA区域互补的特异性底物结合位点,并且在底物结合位点中或者周围具有赋予该分子的RNA切割活性的核苷酸序列。
RNA干涉(RNAi)
一方面,发明提供包括发明的磷脂酶序列的RNA抑制分子,叫做“RNAi”分子。RNAi分子包括双链RNA(dsRNA)分子。RNAi可以抑制磷脂酶基因的表达。一方面,RNAi是长度为大约15,16,17,18,19,20,21,22,23,24,25或者更长的双螺旋核苷酸。虽然发明并不受限于任何特别的作用机理,但是RNAi可以进入细胞,并且造成相似或相同序列的单链RNA(ssRNA),包括内源性mRNA的降解。当细胞暴露于双链RNA(dsANA)时,来自同源基因的mRNA被选择性地被降解,该过程叫做RNA干涉(RNAi)。RNAi背后的可能的基本机理是与特异的基因序列配对的双链RNA(dsANA)断裂形成短片段,叫做短干扰RNA,这些短片段可以触发与其序列配对的mRNA的降解。一方面,发明的RNAi在基因沉默治疗中使用,见,例如Shuey(2002)Drug Discov.Today 7:1040-1046。一方面,发明提供使用发明的RNAi选择性降解RNA的方法。该方法可以在体外,离体或在体内进行。一方面,发明的RNAi分子可以用于在细胞,器官或动物内产生功能缺失的突变。产生和使用RNAi分子选择性降解RNA的方法在本领域众所周知,见,例如美国专利号6,506,559;6,511,824;6,515,109;6,489,127。
核酸修饰
本发明提供产生发明的核酸的变异体的方法,例如,那些编码磷脂酶的核酸。这些方法可以重复或者在不同的组合中使用,产生与模板核酸编码的磷脂酶相比具有改变的或不同活性或者改变的或不同稳定性的磷脂酶。这些方法也可以重复或者在不同的组合中使用,例如,产生基因/信息表达,信息翻译或者信息稳定性的变异。另一方面,细胞的遗传组分可以通过,例如离体的同源基因修饰,然后再插入细胞中而加以改变。
本发明的核酸可以通过任何方法改变。例如,无规则或随机方法,或者,非随机方法,或者“定向进化”方法。
基因的随机突变的方法在技术上众所周知,见,例如,美国专利号5,830,696。例如,诱变剂可以用于随机突变基因。诱变剂包括,例如,紫外线或者γ-辐射,或者化学诱变剂,例如,丝裂霉素,亚硝酸,光致活性补骨脂素,它们单独使用或组合使用,诱导可以通过重组修复的可修复DNA断裂。别的化学诱变剂包括,例如,重亚硫酸钠,亚硝酸,羟胺,肼或者甲酸。别的诱变剂是核苷酸前体的类似物,例如,亚硝基胍,5-溴尿嘧啶,2-氨基嘌呤,或者吖啶氮蒽。这些试剂可以在PCR反应时代替核苷酸前体加入,从而把序列变异。嵌入试剂例如原黄素,吖啶黄,阿的平等等也可以使用。
任何分子生物学技术都可以使用,例如,随机PCR诱变,见,例如,Rice(1992)Proc.Natl.Acad.Sci.USA 89:5467-5471;或者组合多重盒式诱变,见,例如Crameri(1995)Biotechniques 18:194-196。做为选择,核酸,例如,基因,可以在随机分裂后重新装配,见,例如,美国专利号6,291,242;6,287,862;6,287,861;5,955,358;5,830,721;5,824,514;5,811,238;5,605,793。可选择的方面,可以通过错误倾向PCR,重排,寡核苷酸-定向的诱变,装配PCR,有性PCR诱变,体外诱变,盒式诱变,回归整体诱变,指数整体诱变,位点专一诱变,基因重装配,基因位点饱和诱变(GSSW),合成的连接重装配(SLR),重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板诱变,缺口双螺旋诱变,点错配修复诱变,修复缺失宿主株变异,化学诱变,放射产生的诱变,缺失诱变,限制选择诱变,限制纯化诱变,人造基因合成,整体诱变,嵌合核酸多聚体产生,和/或这些方法和别的方法的组合导入修饰,添加或缺失。
以下出版物描述了多种可以与发明的方法结合的回归重组程序和/或方法:Stemmer(1999)“Molecular breeding of viruses for targeting and other clinicalproperties”Tumor Targeting 4:1-4,Ness(1999)Nature Biotechnology 17:893-896,Chang(1999)“Evolution of a cytokine using DNA family shuffling”NatureBiotechnology 17:793-797,65 Minshull(1999)“Protein evolution by molecularbreeding”Current Opinion in Chemical Biology 3:284-290,Christians(1999)“Directed evolution of thymidine kinase for AZT phosphorylation using DNA familyshuffling”Nature Biotechnology 17:259-264,Crameri(1998)“DNA shuffling of afamily of genes from diverse species accelerates directed evolution”Nature391:288-291,Crameri(1997)“Molecular evolution of an arsenate detoxificationpathway by DNA shuffling,”Nature Biotechnology 15:436-438,Zhang(1997)“Directed evolution of an effective fucosidase from a.galactosidase by DNA shufflingand screening”Proc.Natl.Acad.Sci.USA 94:4504-4509,Patten et al.(1997)“Applications of DNA Shuffling to Pharmaceuticals and Vaccines”Current Opinion inBiotechnology 8:724-733,Crameri et al.(1996)“Construction and evolution ofantibody-phage libraries by DNA shuffling”Nature Medicine 2:100-103,Crameri et ai.(1996)“Improved green fluorescent protein by molecular evolution using DNAshuffling”Nature Biotechnology 14:315-319,Gates et al.(1996)“Affinity selectiveisolation of ligands from peptide libraries through display on a lac repressor ′headpiecedimer″,Journal of Molecular Biology 255:373-3 86,Stemmer(1996)“Sexual PCRand Assembly PCR”In:The Encyclopedia of Molecular Biology.VCH Publishers,NewYork.pp.447-457,Crameri and Stemmer(1995)“Combinatorial multiple cassettemutagenesis creates all the permutations of mutant and wildtype cassettes”Bio Techniques 18:194-195,Stemmer et al.(1995)“Single-step assembly of a geneand entire plasmid form large numbers of oligodeoxyobonucleotides”Gene,164:49-53,Stemmor(1995)“The Evolution of Molecular Computation”Science 270:1510,Stemmer(1995)“Searching Sequence Space”Bio/Technology 13:549-553;Stemmer(1994)“Rapid evolution of a protein in vitro by DNA shuffling”Nature 370:389-391,and Stemmer(1994)“DNA shuffling by random fragmentation and reassembly:Invitro recombination for molecular evolution.”Proc.Natl.Acad.Sci.USA91:10747-10751.
产生多样性的诱变方法包括,例如定向诱变(Ling et al.(1997)“Approashesto DNA mutagenesis:an overview”Anal Biochem.254(2):157-178;Dale et al.(1996)“Oligonucleotide-directed random mutagenesis using the phosphorothioatemethod”Methods Mol.Biol.57:369-374,Smith(1985)“In vitro mutagenesis”Ann.Rev.Genet.19:423-462,Botstein & Shortle(1985)“Strategies and applications of invitro mutagenesis″Science 229:1193-1201,Carter(1986)“Site-directed mutagenesis″Biochem.J.237:1-7;and Kunkel(1987)“The efficiency of oligonucleotide directedmutagenesis”in Nucleic Acids & Molecular Biology(Eckstein,F.and Lilley,D.M.J.eds.,Springer Verlag,Berlin));使用含尿嘧啶的模板进行诱变(kunkel(1985)“Rapid and efficient site-specific mutagenesis without phenotypic selection”,Proc.Natl.Acad.Sci.USA 82:488-492.Kunkel et al.(1987)“Rapid and efficient site-specificmutagenesis without phenotypic selection”Methods in Enzymol.154,367-382,andBass et al.(1988)“Mutant Trp repressors with new DNA-binding specificities”Science 242:240-245),寡核苷酸定点诱变(Methods in Enzymol.100:468-500(1983),Methods in Enzymol.154:329-350(1987),Zoller & Smith(1982)“Oligonucleotide-directed mutagenesis using M13-derived vectors:an efficient andgeneral procedure for the production of point mutations in any DNA fragment”NucleicAcids Res.10:6487-6500,Zoller & Smith(1983)“Oligonucleotide-directedmutagenesis of DNA fragments cloned into M13 vectors”Methods in Enzymol.100:468-500,and Zoller & Smith(1987)“Oligonucleotide-directed mutagenesis:asimple method using two oligonucleotide primers and a single-stranded DNA template”Methods in Enzymol.154:329-350);磷硫修饰的DNA诱变(Taylor et al.(1985)“The use of phosphorothioate-modified DNA in restriction enzyme reactions to preparenicked DNA”Nucl.Acids Res.13:8749-8764,Taylor et al.(1985)“The rapidgeneration of oligonucleotide-directed mutations at high frequency usingphosphorothioate-modified DNA”Nucl.Acids Res.13:8765-8787(1985);Nakamaye(1986)“Inhibition of restriction endonuclease Nci I cleavage by phosphorothioategroups and its application to oligonucleotide-directed mutagenesis”Nucl.Acids Res.14:9679-9698,Sayers et al.(1988)“Y-T Exonucleases in phosphorothioate-basedoligonucleotide-directed mutagenesis”Nucl.Acids Res.16:791-802,and Sayers et al.(1988)“Strand specific cleavage of phosphorothioate-containing DNA by reactionwith restriction endonucleases in the presence of ethidium bromide”Nucl.Acids Res.16:803-814);使用有缺口的双螺旋DNA进行诱变(Kramer et al.(1984)“Thegapped duplex DNA approach to oligonucleotide-directed mutation construction”Nucl.Asids Res.12:9441-9456;Kramer & Fritz(1987)Methods in Enzymol.“Oligonucleotide-directed construction of mutations via gapped duplex  DNA”154:350-367;Kramer et al.(1988)“improved enzymatic in vitro reactions in thegapped duplex DNA approach to oligonucleotide-directed construction of mutations”Nucl.Acids Res.16:7207;and Fritz et al.(1988)“Oligonucleotide-directedconstruction of mutations:a gapped duplex DNA procedure without enzymaticreactions in vitro”Nucl.Acids Res.16:6987-6999).
发明的方法中使用的另外方案包括点错配修复(Kramer(1984)“PointMismatch Repair”Cell 38:879-887),使用修复缺陷宿主菌株进行诱变(Carter et al.(1985)“Improved oligonucleotide site-directed mutagenesis using M13 vectors”Nucl.Acids Res.13:4431-4443,和Carter(1987)“Improved oligonucleotide-directedmutagenesis using M13 veotors”Methods in Enzymol.154:382-403),缺失诱变(Eghtedarzadeh(1986)“Use of oligonucleotides to generate large deletions”Nucl.Asids Res.14:5115),选择限制和选择限制和纯化限制(Wells et al.(1986)“Importance of hydrogen-bond formation in stabilizing the transition state of subtilisin”Phil.Trans.K Soc.Lond.A 317:415-423),通过全基因合成进行诱变(Nambiar et al.(1984)“Total synthesis and cloning of a gene coding for the ribonuclease S protein”Science 223:1299-1301;Sakamar and Khorana(1988)“Total synthesis andexpression of a gene for the α-subunit of bovine rod outer segment guaninenucleotide-binding protein(transducin)”Nucl.Asids Res.14:6361-6372,Wells et al.(1985)“Cassette mutagenesis:an efficient method for generation of multiplemutations at defined sites”Gene 34:315-323,和Gnmdstrom et al.(1985)“Oligonucleotide-directed mutagenesis by microscale‘shot-gun’gene synthesis”Nucl.Asids Res.13:3305-3316),双链断裂修复(Mandecki(1986),Amold(1993)“Protein engineering for unusual environments”Current Opinion in Biotechnology.4:450455.“Oligonucleotides directed double-strand break repair in plasmids ofEscherichia coli:a method for site-specific mutagenesis”Proc.Natl.Acad.Sci.USA,83:7177-7181)。以上许多方法的另外细节可以在Methods in Enzymology Volume154中找到,此书也描述了针对不同诱变方法的故障检测问题的有用控制。
也参见Stemmer的美国专利5,605,793(Feb.25,1997),“Methods for In VitroRecombination;”Stemmer等人的美国专利5,811,238(Sep.22,1998)“Methods forGenerating Polynucleotides having Desired Characteristics by Iterative Selection andRecombination;”Stemmer等人的美国专利5,830,721(Nov.3,1998),“DNAMutagenesis by Random Fragmentation and Reassembly;”Stemmer等人的美国专利5,834,252(Nov.10,1998)“End-Complementary Polymerase Reaction;”Minshull等人的美国专利5,837,458(Nov.17,1998),“Methods and Compositions for Cellularand Metabolic Engineering;”WO 95/22625,Stemmer和Cramen,“Mutagenesis byRandom Fragmentation and Reassembly;”Stemmer和Lipschutz的WO 96/33207“End Complementary Polymerase Chain Reaction;”Stemmer和Crameri的WO97/20078“Methods for Generating Polynucleotides having Desired Characteristics byIterative Selection and Recombination;”Mmshull和Stemmor的WO 97/35966,“Methods and Compositions for Cellular and Metabolic Engineering;”Punnonen等人的WO 99/41402“Targeting of Genetic Vaccine Vectors;”Punnonen等人的WO 99/41383“Antigen Library Immunization;”Punnonen等人的WO 99/41369“GeneticVaccine Vector Engineering;”Punnonen等人的WO 99/41368“Optimization ofImmunomodulatorv Properties of Genetic Vaccines;”Stemmer和Crameri的EP 752008“DNA Mutagenesis by Random Fragmentation and Reassembly;”Stemmer的EP0932670“Evolving Cellular DNA Uptake by Recursive Sequence Recombination;”Stemmer等人的WO 99/23107,“Modification of Virus Tropism and Host Range byViral Genome Shuffling;”Apt等人的WO 99/21979,“Human Papillomavirus Vectors;”del Cardayre等人的WO 98/31837“Evolution of Whole Cells and Organisms byRecursive Sequence Recombination;”Patten和Stemmer的WO 98/27230“Methodsand Compositions for Polypeptide Engineering,”Stemmer等人的WO 98/27230,“Methods for Optimization of Gene Therapy by Recursive Sequence Shuffling andSelection,”WO 00/00632,“Methods for Generating Highly Diverse Libraries,”WO00/09679,“Methods for Obtaining in Vitro Recombined Polynucleotide SequenceBanks and Resulting Sequences,”Arnold等人的WO 98/42832,“Recombination ofpolynucleotide Sequences Using Random or Defined Primers,”Arnold等人的WO99/29902,“Method for Creating Polynucleotide and Polypeptide Sequences,”Vind的WO 98/41653,“An in Vitro Method for Construction of a DNA Library,”Borchert等人的WO 98/41622,“Method for constructing a Library Using DNA Shuffling,”和Pati和Zarling的WO 98/42727,“Sequence Alterations using HomologousRecombination.”
某些美国申请提供了关于多种不同产生方法的另外细节,包括Patten等人的“SHUFFLING OF CODON ALTEAED GENES”,归档于1999年9月28日,(U.S.Ser.No.09/407,800),del Cardayre等人的“EVOLUTION OF WHOLE CELLS ANDORGANISMS BY RECURSIVE SEQUENCE RECOMBINATION”,归档于1998年7月15日(U.S.Ser.No.09/166,188)和1999年7月15日(U.S.Ser.No 09/354,922);Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACIDRECOMBINATION”,归档于1999年9月28日(U.S.Ser.No.09/408,392)和Crameri等人的“OLIGONUCLEOTIDE MEDIATED NUCLEIC ACID RECOMBINATION”,归档于2000年1月18日(PCT/US00/01203);Welch等人的“USE OFCODON-VARIED OLIGONUCLEOTIDE SYNTHESIS FOR SYNTHETICSHUFFLING”,归档于1999年9月28日(U.S.Ser.No.09/408,393);Selifonov等人的“METHODS FOR MAKING CHARACTER STRINGS,POLYNUCLEOTIDS& POLYPEPTIDES HAVING DESIRED CHARACTERISTICS”,归档于2000年1月18日(PCT/US00/01202)和,例如,Selifonov等人的“METHODS FOR MAKINGCHARACTER STRINGS,POLYNUCLEOTIDS & POLYPEPTIDES HAVINGDESIRED CHARACTERISTICS”,归档于2000年7月18日(U.S.Ser.No.09/618,579),Selifonov和Stemmer的“METHODS OF POPULATING DATASTRUCTURES FOR USE IN EVOLUTIONARY SIMULATIONS”,归档于2000年1月18日(PCT/US00/01138);Affholter的“SINGLE-STRANDED NUCLEIC ACIDTEMPLATE-MEDIATED RECOMBINATION AND NUCLEIC ACID FRAGMENTISOLATION”,归档于2000年9月6日(U.S.Ser.NO.09/656,549)。
非随机的,或者“定向进化”的方法包括,例如,饱和诱变(GSSM),合成的连接重组装(SLR),或者这些方法的组合用于修饰发明的核酸,产生具有新的或者性质改变(例如,在高的酸性或碱性,高温,等等条件下具有活性)的磷脂酶。修饰的核酸编码的多肽可以在检测磷脂酶前筛查其活性或者别的活性。可以使用任何检测的形式或者方案。例如,使用毛细管阵列平台,见,例如,美国专利6,280,926;5,939,250。
饱和诱变,或者GSSM
发明的一个方面,非随机的基因修饰,“定向进化过程”用于产生具有新的或者改变的特性的磷脂酶。本方法的各种变化已经被称为“基因位点-饱和诱变”,“位点饱和诱变”,“饱和诱变”或者简单地为“GSSM”。饱和诱变可以与别的诱变过程相结合。见,例如,美国专利6,171,820;6,238,884。一方面,GSSM包括提供模板多核苷酸和多数的寡核苷酸,其中每种寡核苷酸包括一个与模板多核苷酸同源的序列,因此靶向模板多核苷酸的特异序列,每种寡核苷酸包括一个同源基因的变异体的序列;通过使用寡核苷酸复制模板多核苷酸产生包括非随机序列变异体的子代多核苷酸,因此产生包括同源基因序列变异体的多核苷酸。
一方面,为了产生一套子代多肽,其中在每个氨基酸位置都是全范围的单氨基酸取代,例如酶活性位点或者配基结合位点中的氨基酸残基被靶向修饰,将含有简并N,N,G/T序列的密码子引物用于往多核苷酸中引入点突变。这些寡核苷酸可以包括连续的第一同源序列,简并N,N,G/T序列,和任选地,第二同源序列。从使用这些寡核苷酸得到的下游的子代翻译产物包括沿着多肽的每个氨基酸位点的所有可能的氨基酸变异,因为N,N,G/T序列的简并性包括所有20种氨基酸的密码子。一方面,一个这样的简并寡核苷酸(包括,例如,一个简并N,N,G/T盒)用于使母本多核苷酸模板中的每个最初密码子形成全范围的密码子取代。另一方面,为了使母本多核苷酸模板中的至少两个最初密码子形成全范围的密码子取代,使用至少两个简并盒—或者在相同的寡核苷酸中,或者在不相同的寡核苷酸中。例如,一个寡核苷酸中可以含有多于一个N,N,G/T序列,可以在多于一个位点引入氨基酸突变。此N,N,G/T序列的大多数可以直接相邻,或者被一个或多于一个的另外核苷酸序列分隔开。另一方面,适用于引入添加或者缺失的寡核苷酸可以单独使用或者与含有N,N,G/T序列的密码子合并使用,引入氨基酸添加,缺失,和/或取代的任何组合或者排列组合。
一方面,使用含有相邻的N,N,G/T三联体,即简并的(N,N,G/T)n序列的寡核苷酸,可以同时诱变两个或者更多相邻的氨基酸位点。另一方面,使用具有比N,N,G/T序列简并性小的简并盒。例如,理想的是在一些例子中(例如,在寡核苷酸中)使用包括仅仅一个N的简并的三联体序列,其中所述N可以在三联体的第一,第二或者第三位置上。包含任何别的碱基的任何组合和排列组合可以在三联体的剩下两个位置上使用。可选择地,理想的是在一些例子中(例如,在寡核苷酸中)使用简并的N,N,N三联体序列。
一方面,简并的三联体(例如,N,N,G/T三联体)的使用可以使得系统的和容易的在多肽中的每个氨基酸位置上产生全范围的可能的天然氨基酸(全部20种氨基酸)(在可选择的方面,该方法也包括在每个氨基酸残基,或者密码子,位置上产生少于所有可能的取代)。例如,对于100个氨基酸的多肽,可以产生2000个不同的种类(即,每个位置20种可能的氨基酸×100个氨基酸位置)。通过使用含有简并的N,N,G/T三联体的寡核苷酸或一套寡核苷酸,32个单独的序列可以编码所有20种可能的天然氨基酸。因此,在其中,母本多核苷酸序列被使用至少一个这样的寡核苷酸饱和诱变的反应容器中,可以产生编码20种不同多肽的32种不同的子代多核苷酸。相反,在定点诱变中使用非简并的寡核苷酸可以导致每个反应容器中仅仅有一种多肽产物。非简并寡核苷酸可以任选地与公开的简并引物组合使用;例如,非简并寡核苷酸可以用于在一个处理中的多核苷酸中产生特异的点突变。这就提供了一种产生特异的沉默点突变,可以导致相应的氨基酸改变的点突变,和导致终止密码子产生和相应的多肽片段表达的点突变的方法。
一方面,每个饱和诱变反应容器中都含有编码至少20种子代多肽(例如,磷脂酶)分子的多核苷酸,这样所有20种天然氨基酸相应地在母本多肽的经诱变密码子位置上的特异氨基酸位置上呈现出来(别的方面使用少于所有20种天然氨基酸的组合)。每个饱和诱变反应容器所产生的32重简并子代多肽可以进行克隆扩增(例如,使用,例如表达载体克隆到合适的宿主,例如大肠杆菌(E.coli)宿主中)和表达筛选。当单独的子代多肽通过筛选鉴定具有有利的特性改变时(当与母本多肽比较,例如在碱性或酸性条件下具有增加的磷脂酶活性时),可以相应测序鉴定其中含有的有利的氨基酸取代。
一方面,如在此公开的,使用饱和诱变诱变母本多肽中的每个氨基酸位置,有利的氨基酸改变可以在多于一个氨基酸位置上得到鉴定。可以产生含有全部或部分这些有利的氨基酸取代的组合的一个或多个新的子代分子。例如,假如一个多肽中的每3个氨基酸位置中都可以鉴定到2个特异的有利氨基酸改变,在每个位置,排列包括3个可能(最初的氨基酸没有改变,和两个有利改变中的每一个),并且有三个位置。因此,总的可能性就有3×3×3或者27种,包括以前检测到的7种可能性-6种是点突变(即,三个位置中的每一个都有两种可能性)和在任何位置都没有改变。
另一方面,为了改变序列,定点饱和诱变可以与任何随机的或非随机方法一起使用,例如,合成的连接重组装(见下文),重排,嵌合化,重组和别的诱变过程和诱变剂。本发明提供以重复方式使用任何诱变过程,包括饱和诱变。
合成的连接重组装(SLR)
发明提供叫做“合成的连接重组装”,或者简单地为“SLR”,的非随机基因修饰系统产生具有新的或者改变的特性的磷脂酶,这是一种“定向的进化过程”。SLR是非随机的把寡核苷酸片段连接在一起的方法。此方法与随机的寡核苷酸重排不同,因为核酸构件不是改组的,串联的或者随机地嵌合的,而是非随机的组装,见,例如,美国专利申请系列号(USSN)09/332,835,题目是”Synthetic LigationReassembty in Directed Evolution”,于1999年6月14日归档(“USSN 09/332,835”)。一方面,SLR包括以下步骤:(a)提供模板多核苷酸,其中模板多核苷酸包括编码同源基因的序列;(b)提供多个构件多核苷酸,其中设计的构件多核苷酸用于与模板多核苷酸以一个预定序列进行交叉重组装,并且构件多核苷酸包括一个是同源基因的变异体的序列,和一个与模板多核苷酸两侧的变异序列同源的序列;(c)构件多核苷酸与模板多核苷酸合并,这样构件多核苷酸与模板多核苷酸交叉重组装,产生包括同源基因序列变异体的多核苷酸。
SLR并不依赖于将要重排的多核苷酸之间的高水平同源性的存在。因此,此方法可以用于非随机产生包括多于10100种不同的嵌合体的子代分子库(或套)。SLR可以用于产生包括多于101000种不同子代嵌合体的库。因此,本发明的方面包括产生一套最终嵌合核酸分子的非随机方法,其掠过设计所选择的全面组装顺序。此方法包括步骤:设计产生众多具有可用的相互兼容连接末端的特异核酸构件,把这些核酸构件组装,这样得到设计的全面组装顺序。
假如构件可以以预确定的顺序偶联起来,那么核酸构件的相互兼容连接末端进行组装被认为对于这种类型的顺序组装是“可用的”。因此,核酸构件偶联的全面组装顺序是由连接末端的设计决定的。假如使用步骤多于一步的话,那么核酸构件偶联的全面组装顺序也由组装步骤的相继顺序所确定。一方面,退火的构件部分用酶处理,例如连接酶(例如,T4 DNA连接酶),得到构件部分的共价连接。
一方面,寡核苷酸构件是通过分析的序列模板进行设计的,序列模板作为产生最终嵌合多核苷酸核酸子代的基础。这些母本寡核苷酸模板作为设计待诱变的例如,嵌合的或改组的核酸构件的序列信息来源。
本方法的一方面,为了选择一个或多个分界点,把大多数母本核酸模板的序列进行比对。分界点可以位于同源区域,并且包括一个或多个核苷酸。这些分界点优选的由至少两个祖代模板所共同所有。因此,为了母本多核苷酸重排,分界点可以用于描绘产生的寡核苷酸构件的界限。在祖代分子中确定和选择的分界点作为最终嵌合子代分子组装的潜在的的嵌合点。分界点可以是由至少两个母本多核苷酸序列具有的同源区域(包括至少一个同源核苷酸碱基)。做为选择,分界点可以是由至少一半的母本多核苷酸序列具有的同源区域,或者分界点可以是由至少三份之二的母本多核苷酸序列具有的同源区域。甚至更优选的适用的分界点是由至少四分之三的母本多核苷酸序列具有的同源区域,或者分界点可以是由几乎全部母本多核苷酸序列具有的同源区域。一方面,分界点是由全部母本多核苷酸序列具有的同源区域。
一方面,为了产生子代嵌合多核苷酸的完备文库,连接重组装过程要深入的进行。换句话说,所有可能的核苷酸构件的顺序组合都在最终的嵌合核酸分子组中表现出来。同时,在另一个具体例子中,每个组合中的组装顺序(即,每个最终嵌合核酸的5’到3’序列中每个构件的组装顺序)都如以上描述的(或者非随机的)设计。因为本发明的非随机特性,所有不需要的副产物的可能性大大降低。
另一方面,连接重组装方法是系统地进行的。例如,为了产生子代分子的系统性划分的文库,划分的区域可以系统地,例如逐个地筛选出来,可以实施此方法。换句话说,通过选择性的和明智的使用特异核酸构件,同时选择性的和明智的使用后继步骤的组装反应,本发明提供可以在几个反应容器的每一个中都得到子代产物的特异组的设计。这就使得可以进行系统的检测和筛选程序。因此,这些方法可以使在更小的组中对一个待检测的潜在的非常大数目的子代分子进行系统检测。因为可以以高度灵活,却是完备和系统的方式,特别是当祖先分子中具有低水平的同源性时进行嵌合,所以这些方法提供了包括大数目的子代分子的文库(或者组)的产生。因为本连接重组装发明的非随机特性,所以产生的子代分子,优选包括具有由设计所选择的全面组装顺序的最终嵌合核酸分子文库。饱和诱变和完善的定点进化方法也可以用于产生不同的子代分子种类。关于分界点的选择,核酸构件的大小和数目,偶联的大小和设计,本发明提供了选择和控制的自由,这一点是应该予以理解的。而且,应该理解的是,对于本发明的可操作性来说,分子内同源性的要求并不高。实际上,分界点甚至可以选择在很少或没有分子内同源性的区域。例如,因为密码子的摆动,即,密码子的简并性,核苷酸取代可以引入核酸构件中而不会改变在相应的祖代模板中编码的氨基酸。作为选择,可以改变密码子,这样最初的氨基酸被改变。为了增加分子内同源分界点的发生率,从而增加构件中可以得到的偶联的数目,本发明提供这样的可以引入核酸构件中的取代,这反过来会产生更大数目的子代嵌合分子。
另一方面,构件产生的步骤的合成特性允许核苷酸(例如,一个或者多个核苷酸,可以是,例如密码子或内含子或者调控序列)的设计和引入,其以后可以被任选在体外过程(例如,通过诱变)或者体内过程(例如,通过利用宿主微生物的基因剪切能力)中除去。在许多情况中,应该理解的是,除了产生适用的分界点的潜在好处之外,由于许多别的原因,这些核苷酸的引入也是理想的。
一方面,核酸构件用于引入内含子。因此,根据在此描述的方法,功能性的内含子被引入进生产的人造基因中。人工引入的内含子在宿主细胞中可以功能性的用于基因剪切中,以天然产生的内含子作用功能性的方式进行基因剪切。
优化的定向进化系统
发明提供非随机的基因修饰系统,叫做“优化的定向进化系统”,产生具有新的或者改变的特性的磷脂酶。优化的定向进化针对的是使用重复轮次的还原性重配、重组和选择这个重复循环,从而通过重组进行核酸的定向分子进化。优化的定向进化可以产生大量的进化的嵌合序列,其中产生的群体大大富含具有预确定数目的交换事件的序列。
交换事件是嵌合序列中的一个点,其中序列中的交换发生于从一个母本变异体到另一个母本变异体。这样的点一般在两个母本连接在一起形成一个单一序列的寡核苷酸的接头处都具有。此方法可以计算寡核苷酸序列的正确浓度,这样最终序列的嵌合总体由于选择数目的交换事件而得到富集。这提供了针对选择具有预确定数目的交换事件的嵌合变异体的更大控制。
另外,与别的系统相比,此方法提供了开发巨大数目的可能蛋白变异体空间的合宜方法。以前,假如嵌合分子产生,例如,在反应过程中产生了1013个嵌合分子,检测这样高数目的特异活性的嵌合变异体是十分困难的。而且,子代群体中的一大部分将具有非常高数目的交换事件,这导致蛋白质具有增加水平的特异活性的可能性降低。通过使用这些方法,嵌合分子群体可以富集具有特定数目交换事件的变异体。因此,虽然在反应过程中可以产生1013嵌合分子,但是选择用于进一步分析的每个分子最可能,例如,仅仅有三个交换事件。因为得到的子代群体可以倾向于具有预定数目的交换事件,所以嵌合分子之间的函数变量的范围减小。当计算从最初母本多核苷酸得到的可能影响特定性状的寡核苷酸时,这提供了更易控制的变量数目。
产生嵌合子代多核苷酸的一个方法是产生每个母本序列的片段或部分的对应寡核苷酸。每个寡核苷酸优选的包括独特的重叠区域,这样当寡核苷酸混合在一起,得到每个寡核苷酸片段以正确顺序组装的新的变异体。在USSN 09/332,835中可以发现另外的信息。每个母本变异体产生的寡核苷酸的数目与最终产生的嵌合分子中得到的交换总数目之间具有相关性。例如,为了发现具有,例如在高温下具有更大活性的嵌合变异体,三个母本核苷酸序列变异体可能经过连接反应。作为一个例子,对应于每个母本变异体的每部分产生一组50个寡核苷酸序列。相应地,在连接重组装过程中,在每个嵌合序列中可以有高达50个交换事件。每个产生的嵌合多核苷酸以改变的顺序含有从每个母本变异体得到的寡核苷酸的概率是很低的。假如每个寡核苷酸片段在连接反应中以相同摩尔数存在,那么可能在相同母本多核苷酸得到的多个位点寡核苷酸中将彼此紧靠的相邻,从而不会导致交换事件。假如在本例子中,从每个母本得到的每个寡核苷酸的浓度在连接步骤中保持恒定,那么有1/3的机会(假设为3个母本)从相同母本变异体得到的寡核苷酸将在嵌合序列中连接,而且并不产生交换。
相应地,在给定母本变异体的组数目,对应于每个变异体的寡核苷酸的数目,和连接反应的每一步骤中每个变异体的浓度的情况下,确定概率浓度函数(PDF),可以用于预测连接反应的每一步骤中可能发生的交换事件的群体。以下描述确定PDF的统计学和数学。通过利用这些方法,人们可以计算这样的概率浓度函数,从而富集在特定连接反应中得到的预确定交换事件数目的嵌合子代群体。而且,交换事件的靶数目可以预确定,然后对系统进行编程,计算连接反应的每一步骤中每个母本寡核苷酸的起始数量,得到关于预确定数目的交换事件的概率浓度函数。这些方法针对的是使用还原性重配,重组和选择这个重复循环,使得可以通过重组进行编码多肽的核酸的定向分子进化。此系统可以产生大数量的进化的嵌合序列,其中产生的群体大大富集了具有预确定数目的交换事件的序列。交换事件是嵌合序列中的点,其中序列的变换发生于从一个母本变异体到另一个母本样板田。这样的点一般在两个母本连接形成一个单一序列的寡核苷酸连接处。该方法可以计算寡核苷酸序列的正确浓度,这样附件所选定数目的交换事件的序列的最终嵌合群体。这提供了对选择具有预确定数目的交换事件的嵌合变异体的更多控制。
另外,与别的系统相比,此方法提供了开发巨大数目的可能蛋白变异体空间的合宜方法。通过使用在此描述的方法,嵌合分子群体可以富集那些具有特定数目的交换事件的变异体。因此,虽然人们仍然可以在反应过程中产生1013嵌合分子,选择的进行进一步分析的每个分子最可以具有,例如,只有三个交换事件。因为得到的子代群体倾向于具有预确定交换事件,所有嵌合分子之间的函数变量的范围减小。当计算从最初母本多核苷酸得到的可能影响特定性状的寡核苷酸时,这提供了更易控制的变量数目。
一方面,方法通过产生对应于每个母本片段或部分的寡核苷酸,产生了嵌合子代核苷酸序列。每个寡核苷酸优选的包括独特的重叠区域,这样当寡核苷酸混合在一起,得到每个寡核苷酸片段以正确顺序组装的新的变异体。也见USSN09/332,835。
每个母本变异体产生的寡核苷酸的数目与最终产生的嵌合分子中得到的交换总数目之间具有相关性。例如,为了发现具有,例如在高温下具有更大活性的嵌合变异体,三个母本核苷酸序列变异体可能经过连接反应。一个例子,对应于每个母本变异体的每部分产生一组50个寡核苷酸序列。相应的,在连接重组装过程中,在每个嵌合序列中可以有高达50个交换事件。每个产生的嵌合多核苷酸以改变的顺序含有从每个母本变异体得到的寡核苷酸的概率是很低的。假如每个寡核苷酸片段在连接反应中以相同摩尔数存在,那么可能在相同母本多核苷酸得到的多个位点寡核苷酸中将彼此紧靠的相邻,从而不会导致交换事件。假如在本例子中,从每个母本得到的每个寡核苷酸的浓度在连接步骤中保持恒定,那么有1/3的机会(假设为3个母本)从相同母本变异体得到的寡核苷酸将在嵌合序列中连接,而且并不产生交换。
相应地,确定概率浓度函数(PDF),预测连接反应的每一步骤中可能发生的交换事件群体,是在给定母本变异体的组数、对应于每个变异体的寡核苷酸数目、和连接反应的每一步骤中每个变异体的浓度的条件下。以下描述确定PDF的统计学和数学。通过利用这些方法,人们可以计算这样的概率浓度函数,从而富集在特定连接反应中得到的预确定交换事件数目的嵌合子代群体。而且,交换事件的靶数目可以预确定,然后对系统进行编程,计算连接反应的每一步骤中每个母本寡核苷酸的起始数量,得到关于预确定数目的交换事件的概率浓度函数。
确定交换事件
发明的具体例子包括系统和软件,可以接受所需交换概率浓度函数(PDF),要重组装的母本基因的数目和重组装中片段的数目,作为输入。此程序的输出是“片段PDF”,可以用于确定产生重装配基因的配方和那些基因的预计交换PDF。优选地,在此描述的处理用MATLAB_(Mathworks,Natick,masschusetts),一种程序语言和技术计算发展环境进行。
重复过程
在本发明的实践过程中,这些过程可以反复重复。例如,对改变的磷脂酶表型的核酸(或者,核酸)进行鉴定,再分离,再修饰,活性再检测。此过程可以反复重复,直到得到所需的表型。例如,整个生物化学的合成代谢或者分解代谢途径可以工程进细胞中,包括磷脂酶活性。
相似地,假如确定特定的寡核苷酸对于所需性状没有影响(例如,新的磷脂酶表型),那么可以通过合成包括待除去序列的更大母本寡核苷酸,把它作为变量除去。因为序列与更大序列合并阻止了交换事件,所以在子代多核苷酸中此序列没有任何变化。此确定哪种寡核苷酸与所需性状最为相关,哪种寡核苷酸与所需性状无关的反复过程,可以允许对所有可能蛋白质变异体的有效开发,这些变异体可能个年个特定性状或活性。
体内改组
在提供发明的多肽变异体,例如,抗体,磷脂酶,和类似物的本发明方法中使用分子的体内改组。体内改组可以利用正常性状的细胞,得到重组的多聚体。虽然体内重组提供了获得分子多样性的主要天然途径,但是遗传重组仍然是相对复杂的过程,涉及1)同源性的识别;2)导致产生重组交叉的链切割,链侵入,和代谢步骤,和最后3)交叉转变成为分离的重组分子。交叉的形成要求同源序列的识别。
一方面,发明提供由至少第一个多核苷酸和第二个多核苷酸产生杂交多核苷酸的方法。发明可以用于通过引入具有至少部分序列同源性的一个区域的至少第一多核苷酸和第二多核苷酸于合适的宿主细胞中而产生杂交多核苷酸。部分序列同源性区域促进导致产生杂交多核苷酸的序列识别的过程。正如在此使用的,术语“杂交多核苷酸”是任何由本发明的方法产生的核苷酸序列,含有从至少两个最初多核苷酸序列得到的序列。这样的杂交多核苷酸可以由促进DNA分子间的序列整合的分子间重组事件产生。另外,这样的杂交多核苷酸可以由利用重复序列,改变DNA分子中的核苷酸序列的分子内还原性重配过程产生。
产生序列变异体
发明也提供使用发明的核酸和多肽产生发明的核酸和磷脂酶序列变异体,或者分离的磷脂酶,例如,磷脂酶的序列变异体的方法。一方面,发明提供发明的磷脂酶基因的变异体,变异体可以使用任何方法改变,包括,例如随机方法,或者非随机方法或者“定向进化”方法,如以上描述。
分离的变异体可以是天然发生的。变异体也可以体外产生。变异体可以使用基因工程技术,例如定点诱变,随机化学诱变,核酸外切酶III缺失程序和标准克隆技术产生。做为选择,这样的变异体,片段,类似物或衍生物可以使用化学合成或者修饰程序产生。产生变异体的别的方法也被那些技术熟练人员所熟悉。这些方法包括修饰天然分离得到的核酸序列,产生编码具有特性的多肽的核酸的程序,多肽的特性增加它们在工业或实验室应用中的价值。在这些程序中,产生并且定性许多与天然分离得到的序列相比具有一个或多个核苷酸差异的变异体序列。这些核苷酸差异可以产生与天然分离物得到的核酸编码的多肽相比的氨基酸变化。
例如,变异体可以使用错误倾向PCR产生。在错误倾向PCR中,PCR在DNA聚合酶复制忠实度度低的情况下进行,这样在PCR产物的全长中获得高比率的点突变。错误倾向PCR在,例如Leung,D.W.,等,技术,1:11-15,1989)和Caldwell,R.C.& Joyce G.F.,PCR方法应用,2:28-33,1992中有描述。简要而言,在这些程序中,为了在全长的PCR产物中得到高比率的变突变,待诱变的核酸与PCR引物,反应缓冲液,MgCl2,MnCl2,Taq聚合酶和合适浓度的dNTP混合。例如,反应使用20毫微微摩尔(fmoles)待诱变的核酸,每种PCR引物30皮摩尔,反应缓冲液包括50mM KCl,10mM Tris HCl(PH8.3)和0.01%明胶,7mM MgCl2,0.5mMMnCl2,5单位的Taq聚合酶,0.2mM dGTP,0.2mM dATP,1mM dCTP和1mM dTTP。PCR进行30个循环,每个循环为94℃1分钟,45℃1分钟,72℃1分钟。然而,这些参数可以适当的改变。诱变发核酸克隆进入合适的载体中,评估诱变的核酸编码的多肽的活性。
变异体也可以使用寡核苷酸定向诱变产生,在感兴趣的任何和克隆DNA中得到位点专一的变异。寡核苷酸诱变在,例如,Reidhaar-Olson(1988)Science241:53-57中有描述。简要地,在这些程序中,合成待引入的克隆DNA中多数具有一个或多个突变的双链寡核苷酸,并且插入待诱变的克隆DNA中。回收含有经诱变的DNA的克隆,评定经诱变的DNA编码的多肽的活性。
产生变异体的另一个方法是组装PCR。组装PCR涉及从小DNA片段中得到的PCR产物的组装。在相同管中平行发生了许多不同的PCR反应,一个反应的产物是另一个反应产物的引物。组装PCR在,例如美国专利5,965,408中描述。
另一种产生变异体的方法是有性PCR诱变。在有性PCR诱变中,在体外,强迫同源重组在不同的,但是高度相关的DNA序列之间发生,是基于序列同源性的DNA分子随机断裂的结果,然后通过PCR反应中引物延伸从而固定交换。有性PCR诱变在,例如,Stenlnier(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751中描述。简要地,在此程序中,待重组的多数核酸都用DNA酶消化,产生平均大小为50-200个核苷酸的片段。纯化所需平均大小的片段,再悬浮于PCR混合物中。在促进核酸片段之间重组的条件下进行PCR。例如,通过把纯化的片段以10-30ng/μl的浓度再悬浮于每种dNTP 0.2mM,2.2mM MgCl2,50mM KCl,10mMTris HCl,PH 9.0和0.1%Triton X-100的溶液中进行PCR。以反应混合物的100∶1加入2.5单位Taq聚合酶,使用以下方案进行PCR:94℃60秒,94℃30秒,50-55℃30秒,72℃30秒(30-45次),72℃5分钟。然而,这些参数可以适当的改变。一些方面,寡核苷酸可以包括在PCR反应中。另一方面,DNA聚合酶Klenow片段可以在第一组PCR反应中使用,Taq聚合酶可以在随后组的PCR反应中使用。分离重组序列,评估重组序列编码的多肽的活性。
变异体也可以通过体内诱变产生。在一些具体例子中,序列中感兴趣的随机突变通过在细菌株,例如一个或多个DNA修复途径中具有突变的大肠杆菌中增殖感兴趣序列而产生。这样的“突变”菌株具有比野生型母本高的随机突变率。DNA在这些菌株中的一种中增殖将最终产生DNA中的随机突变。适合于体内诱变的突变菌株在,例如PCT公开号WO 91/16427中有描述。
变异体也可以使用盒式诱变产生。在盒式诱变中,双链DNA分子的一个小区域用不同于天然序列的合成的寡核苷酸“盒”替换。寡核苷酸经常含有完全的和/或部分的随机天然序列。
回归整体诱变也可以用于产生变异体。回归整体诱变是蛋白质工程(蛋白质诱变)的一种算法,发展蛋白质工程,产生氨基酸序列不同的表型相关突变体的不同群体。此方法使用控制连续进行重组盒式诱变的反馈机制。回归整体诱变在,例如,Arkin(1992)Proc.Nail.Acad.Sci.USA 89:7811-7815中描述。
在一些具体例子中,变异体使用指数整体诱变产生。指数整体诱变是产生具有高百分率的独特的和功能性突变的组合文库的过程,其中一小组残基在每个改变的位置平行随机鉴定导致功能性蛋白质的氨基酸。指数整体诱变在,例如Delegrave(1993)Biotechnology Res.11:1548-1552中描述。随机和定点诱变在,例如Arnold(1993)Current Opinion in Biotechnology 4:450-455中描述。
在一些具体例子中,变异体使用改组程序产生,其中编码不同多肽的大多数核酸中的部分融合在一起,产生例如美国专利5,965,408;5,939,250中描述的编码嵌合多肽的嵌合核酸序列。
发明也提供发明的多肽变异体,包括其中一个或多个氨基酸残基(例如,发明的典型多肽)被保守的或不保守的氨基酸残基(例如,保守的氨基酸残基)取代,并且这样的取代氨基酸残基可能或不可能由遗传密码编码的序列。保守取代是多肽中某个氨基酸被另一个具有相似特征的氨基酸取代,因此,发明的多肽包括发明的序列的保守取代,包括但不局限于以下取代:脂肪族氨基酸,例如丙氨酸,缬氨酸,亮氨酸和异亮氨酸被另一个脂肪族氨基酸取代;丝氨酸被苏氨酸取代,或者相反;氨基酸残基例如天冬氨酸和谷氨酸被另一酸性残基取代;具有酰胺基团的残基,例如天冬酰胺和谷氨酰胺被另一具有酰胺基团的残基取代;碱性残基例如赖氨酸和精氨酸与另一碱性残基互换;芳香族残基例如苯丙氨酸,酪氨酸被另一芳香族残基取代。别的变异体是发明的多肽的一个或多个氨基酸残基包括取代基团的那些变异体。
包括在发明范围中的别的变异体是多肽与另一化合物,例如可以增加多肽半寿期的化合物,例如聚乙二醇相关的那些变异体。
包括在发明范围中的另外的变异体是与多肽,例如导肽,分泌序列,前蛋白序列或者促进多肽纯化,富集或稳定的序列融合另外的氨基酸。
在一些方面,发明的多肽变异体,片段,衍生物和类似物保持与典型多肽,例如在此描述的磷脂酶活性相同的生物功能或活性。另一些方面,变异体,片段,衍生物或类似物包括前蛋白,这样变异体,片段,衍生物或类似物可以提供前蛋白部分被切割而活化,产生活性的多肽。
密码子优化,在宿主相比中得到高水平的蛋白质表达
发明提供修饰编码磷脂酶的核酸的方法,以便改变密码子选择。一方面,发明提供修饰编码磷脂酶的核酸中密码子的方法,增加或降低其在宿主细胞中的表达。发明也提供编码经修饰的磷脂酶的核酸,增加核酸在宿主细胞中的表达,和经修饰的磷脂酶,以及产生修饰的磷脂酶的方法。方法包括确定编码磷脂酶的核酸中的“非偏爱的”或“较不偏爱的”密码子,并且正如核酸中的被取代密码子和至少一个非偏爱的或较不偏爱的密码子被编码相同氨基酸的偏爱密码子取代一样,这些“非偏爱的”或“较不偏爱的”密码子被编码相同氨基酸的“偏爱”密码子取代。偏爱密码子是在宿主细胞的基因编码序列中过度出现的密码子,非偏爱的或较不偏爱的密码子是在宿主细胞的基因编码序列中低度出现的密码子。
用于表达本发明的核酸、表达盒和载体的宿主细胞包括细菌,酵母,真菌,植物细胞,昆虫细胞和哺乳动物细胞。因此,发明提供在所有这些细胞中优化密码子使用的方法,密码子改变的核酸和用密码子改变的核酸产生的多肽。典型的宿主细胞包括革兰氏阴性细菌,例如大肠杆菌Escherichia coli和荧光假单胞菌Pseudomonas fluorescens,革兰氏阳性细菌,例如Streptomyces diversa,加氏乳酸杆菌Lactobacillus gasseri,乳酸乳球菌Lactococcus lactis,乳酸乳球菌乳脂亚种Lactococcus cremoris,枯草杆菌Bacillus subtilis。典型的宿主细胞也包括真核生物,例如,多种酵母,例如酵母菌Saccharomyces sp.,包括酿酒酵母Saccharomycescerevisiae,粟酒裂殖酵母Schizosaccharomyces pombe,巴氏毕赤酵母Pichta pastoris,和乳酸克鲁维酵母Kluyveromyces lactis,汉逊酵母Hansenula polymorpha,黑曲霉Aspergillus niger,哺乳动物和细胞系和昆虫细胞和细胞系。因此,发明也包括在这些生物和种类中优化表达的核酸和多肽。
例如,编码从细菌细胞中分离的磷脂酶的核酸密码子被修饰,这样核酸在与得到磷脂酶的细菌不相同的细菌细胞,酵母,真菌,植物细胞和昆虫细胞或哺乳动物细胞中优化表达。优化密码子的方法被技术熟悉人员所熟知,见,例如,美国专利5,795,737;Baca(2000)Int.J.Parasitol.30:113-118;Hale(1998)ProteinExpr.Purif 12:185-188;Narum(2001)Infect.Immun.69:7250-7253。也见Narum(2001)Infect.Immun.69:7250-7253,描述在鼠系统中优化密码子;Outchkourov(2002)Protein Expr. Purif24:1824,描述在酵母中的优化密码子;Feng(2000)Biochemistry 39:15399-15409,描述在大肠杆菌(E.coli)中优化密码子;Humphreys(2000)Protein Expr.Purif 20:252-264,描述影响大肠杆菌(E.coli)中分泌的优化密码子选择。
转基因非人动物
发明提供包括发明的核酸,多肽,表达盒或载体或转染的或转化细胞的转基因非人动物。转基因非人动物可以是,例如,包括发明的核酸的山羊,兔,绵羊,猪,母牛,大鼠和小鼠。这些动物可以作为,例如研究磷脂酶活性的体内模型使用,或者筛选体内磷脂酶活性的调节物的体内模型使用。在转基因非人动物中表达的磷脂酶的编码序列可以涉及为组成型的,或者组织特异,发育特异或者诱导转录调控因子的控制之下。转基因非人动物可以设计和使用任何技术已知方法产生,见,例如,描述产生和使用转化细胞,卵和转基因小鼠,大鼠,兔,绵羊,猪和母牛的美国专利6,211,428;6,l87,992;6,156,952;6,118,044;6,111,166;6,107,541;5,959,171;5,922,854;5,892,070;5,880,327;5,891,698;5,639,940;5,573,933;5,387,742;5,087,571。也见,例如描述在转基因产奶动物的奶中产生重组蛋白的Pollock(1999)J.Imamunol.Methods 231:147-157;描述产生转基因山羊的Baguisi(1999)Nat.Biotechnol.17:456-461。描述产生和使用在转基因非人动物的脑中表达包括DNA序列的核酸构件的转基因非人动物的美国专利6,211,428。描述注射克隆的重组或合成的DNA序列到受精的小鼠卵中,把经注射的卵移植到假孕雌鼠中,生长成为细胞表达与Alzheimer′s疾病病理学相关的蛋白质的转基因小鼠的美国专利5,387,742。描述产生和使用其基因组包括编码淀粉样蛋白的前体蛋白(APP)的断裂基因的转基因小鼠的美国专利6,187,992。
“敲除动物”可以用于实践本发明的方法。例如,一方面,本发明的转基因或修饰动物包括设计不表达或不能表达磷脂酶的“敲除动物”,例如“敲除小鼠”。
转基因植物和种子
发明提供包括发明的核酸,多肽(例如,磷脂酶),表达盒或载体或转染或转化细胞的转基因植物和种子。发明也提供包括发明的核酸和/或多肽(例如,磷脂酶)的植物产物,例如,油,种子,叶,提取物和类似物。转基因植物可以是双子叶植物(双子叶)或单子叶植物(单子叶)。发明也提供产生和使用这些转基因植物和种子的方法。表达发明的多肽的转基因植物或植物细胞可以根据技术上任何已知的方法构建。见,例如,美国专利6,309,872。
发明的核酸和表达构建物可以用任何方法引入植物细胞中。例如,核酸或表达构建物可以引入所需植物宿主的基因组中,或者核酸或表达构建物可以是附加体。引入到所需植物基因组中,这样宿主磷脂酶的产生被内源转录或翻译控制元件所调控。发明也提供“敲除植物”,其中基因序列通过,例如,同源重组而产生的插入打断了内源基因的表达。产生“敲除”植物的方法在技术上所熟知,见,例如,Strepp(1998)Proc Natl.Acad.Sci.USA 95:4368-4373;Miao(1995)PlantJ 7:359-365。见,例如,以下对转基因植物的讨论。
发明的核酸可以用于给几乎任何植物,例如,含油籽的植物,如大豆,油菜籽,向日葵子,芝麻和花生以所需性状。为了优化或改变磷脂酶的宿主表达,发明的核酸可以用于控制植物代谢途径。这可以改变植物中磷脂酶的活性。作为选择,发明的磷脂酶可以在转基因植物的产生中使用,通过此植物非天然的产生化合物。这可以降低产物成本或产生新的产物。
一方面,产生转基因植物的第一步骤涉及产生在植物细胞中表达的表达构建物。这些技术在技术上所熟知。这些技术可以包括促进核糖体有效结合到mRNA上的启动子,编码序列的选择和克隆,选择合适的基因终止子序列。一个典型的组成型启动子是从花椰菜花叶病病毒中获得的CaMV35S,此启动子一般会导致植物中高度表达。别的启动子更为特殊,对植物的内在或外在环境中的信号进行应答。典型的光诱导启动子是从编码主要叶绿素a/b结合蛋白的cab基因中获得的启动子。
一方面,核酸被修饰,以便获得在植物细胞中的更高表达。例如,发明的序列可能比植物中所见的该序列具有更高百分率的A-T核苷酸对,其中一些优选G-C核苷酸对。因此,编码序列中的A-T核苷酸可以被G-C核苷酸取代而不会大大改变氨基酸序列,从而增加植物细胞中基因产物的产生。
为了识别成功地整合转基因的植物细胞或组织,可选择标记基因可以被加到基因构建物中。这是必须的,因为植物细胞中基因结合和表达的获得是稀有事件,只在小百分率的目标组织或细胞中发生。可选择标记基因编码提供对植物一般有毒性的试剂,如抗生素或除草剂有抗性的蛋白质。当植物细胞在含有合适的抗生素或除草剂的培养基中生长时,只有已经结合了可选择标记基因的植物细胞可以存活。至于别的插入基因,为了获得合适的功能,标记基因也要求启动子和终止序列。
一方面,转基因植物或种子的产生包括发明的序列的结合,并且任选地,标记基因结合到目标表达构建物(例如,质粒)中,并且启动子和终止子序列被合适定位。这可以包括修饰的基因通过合适方法转入植物中。例如,构建物可以使用技术,例如植物细胞原生质体电穿孔和微注射,直接引入植物细胞的基因组DNA中,或者构建物可以使用冲击方法,例如DNA粒子轰击直接引入植物组织中。例如,见,讨论使用粒子轰击,引入转基因到小麦中的Christou(1997)Plant Mol.Biol.35:197-203,Pawlowski(1996)Mol.Biotechnol.6:17-30;Klein(1987)Nature327:70-73;Takumi(1997)Genes Genet.Syst.72:63-69;使用粒子轰击引入酵母人工染色体(YACs)到植物细胞中的Adam(1997),见上文。例如,使用粒子轰击产生转基因棉花植物的Rinehart(1997),见上文。加速粒子的设备在美国专利5,015,580中描述;可买到的BioRad(Biolistics)PDS-2000粒子加速仪器;也见,描述裸子的植物粒子介导转化的Jobn,美国专利5,608,148和Ellis,美国专利5.681,730。
一方面,原生质体可以固定,并且可以用核酸进行注射,例如,表达构建物。虽然在谷物类植物中由原生质体实现植物再生是不容易获得的,,但是使用得自愈伤组织的原生质体进行体细胞胚胎发生在豆科植物中进行植物再生是可能的。具有机体构造的组织可以使用基因枪技术,用裸露的DNA转化,其中DNA包被在钨显微发射体上,射击1/100th大小的细胞,其携带的DNA进入细胞和细胞器中。然后诱导转化组织进行再生,一般是通过体细胞胚胎发生进行。此技术已经在多种谷类,包括玉米和水稻中获得成功。
核酸,例如,表达构建物,也可以使用重组病毒引入到植物细胞中。植物细胞可以使用病毒载体,例如,烟草花叶病毒衍生载体转化(Reouwendal(1997)Plant Mol.Biol.33:989-999),见Porta(1996)“Use ofviral replicons for theexpression of genes in plants,”Mol.Biotechnol.5:209-221。
作为选择,核酸,例如表达构建物,可以与合适的T-DNA侧翼区结合,引入到常规的农杆根瘤菌或根癌农杆菌Agrobacterium tumefaciens宿主载体中。当细胞被细菌感染时,农杆根瘤菌Agrobacterium tumefaciens宿主的毒性功能将指导构建物和临近标记插入到植物细胞DNA中。农杆根瘤菌Agrobacterium tumefaciens-介导的转化技术包括双载体的消除和使用,这些在科学文献中有很好的描述,见,例如,Horsch(1984)Science 233:496-498,Fraley(1983)Proc.NatL Acad Sci.USA 80:4803(1983);Gene Transfer to Plants,Potrykus,ed.(Springer-Verlag,Berlin1995)。除了另一种已知为Ti(肿瘤-诱导)质粒的结构外,农杆根瘤菌A.Tumefaciens细胞中的DNA包含在细菌染色体中。Ti质粒含有一段DNA,叫做T-DNA(~20kb长),在感染过程中,T-DNA转移到植物细胞中,并且一系列vir(毒性)基因指导感染过程。农杆根瘤菌A.Tumefaciens只能通过伤口感染植物:当植物的根部或茎受伤时,植物释放出某种化学信号,对此进行应答,农杆根瘤菌A.Tumefaciens的vir基因活化,指导对于T-DNA从Ti质粒转移到植物染色体所必须的一系列事件。然后T-DNA通过伤口进入植物细胞。一种推测是T-DNA直到植物DNA进行复制或转录时才进入细胞,然后T-DNA插入到暴露的植物DNA中。为了把农杆根瘤菌A.Tumefaciens作为转基因载体,T-DNA的肿瘤诱导部分必须除去,但是保留T-DNA的边界区域和vir基因。然后转基因插入到T-DNA边界区域之间,在此它被转移到植物细胞,并且开始结合进入植物染色体中。
发明提供使用发明的核酸对单子叶植物进行转化,包括重要的谷类,见Hiei(1997)Plant Mol.Biol.35:205-218。也见,例如,讨论T-DNA整合到基因组DNA中的Horsch,Science(1984)233:496;Fraley(1983)Proc.Natl.Acad.Sci USA80:4803;Thykjaer(1997),见上文;Park(1996)Plant Mol.Biol.32:1135-1148。也见,描述包括在谷类细胞或别的单子叶植物中有功能的基因的DNA稳定整合的方法的D′Halluin,美国专利5,712,135。
一方面,第三步骤可以包括能传递整合的目标基因到下一代的整个植物的选择和再生。这样的再生技术依赖于控制组织培养生长培养基中的某种植物激素,典型地,依赖于与所需核苷酸序列一起引入的杀虫剂和/或除草剂标记。由培养的原生质体进行植物再生在Evans等的,Protop!asts Isolation and Culture,Handbookofplant Cell Culture,pp.124-176,MacMillilan Publishing Company,New York,1983;和Binding,Regeneration of plants,Plant Protoplasts,pp.21-73,CRC Press,BocaRaton,1985中描述。再生也可以由植物愈伤组织,外植体,器官或其部分获得。这样的再生技术在Klee(1987)Ann.Rev.of Plant Phys.38:467-486有一般性描述。为了从转基因组织,例如未完全发展的胚中获得整个植物,整个植物可以在一系列含有营养成分和激素的培养基中的受控制环境条件下生长,这个过程已知为组织培养。一旦产生了整个植物,并且产生了种子,就开始评估子代。
在表达盒稳定地整合到转基因植物中后,表达盒可以通过有性杂交引入到别的植物中。多种标准培育技术中的任一种都可以使用,这取决于杂交的物种。因为转基因表达发明的核酸导致表型改变,所以包括发明的重组核酸的植物可以与第二个植物进行有性杂交,获得最终产物。因此,发明的种子可以来源于发明的两种转基因植物之间的杂交,或者发明的植物和别的植物之间的杂交。当两种母本植物表达发明的多肽(例如,磷脂酶)时,预期效应(例如,发明的多肽表达产生开花行为被改变的植物)可以增强。预期效应可以通过标准增殖方法传递到以后的植物世代。
发明的核酸和多肽在任何植物或种子中表达或者插入到任何植物或种子中。发明的转基因植物可以是双子叶植物或单子叶植物。发明的单子叶转基因植物例子是草,例如,草甸草(蓝草,早熟禾(Poa)),饲料草,例如羊茅属,黑麦草属,温带草,例如剪股颖属Agrostis和谷类,例如,小麦,燕麦,黑麦,大麦,水稻,蜀黍,玉米(玉米)。发明的双子叶转基因植物的例子是烟草,豆科植物,例如白羽扇豆,马铃薯,甜菜,豌豆,蚕豆和大豆,和十字花科植物(十字花科,Brassicaceae),例如花椰菜,油菜种子,和密切相关的模型生物拟南芥Arabidopsisthaliana。因此,发明的转基因植物和种子包括大范围的植物,包括,但不局限于,腰果属,落花生属,天冬属,茄属,燕麦属,芸苔属,柑桔属,西瓜属,辣椒属,红花属,椰子属,咖啡属,香瓜属,南瓜属,胡萝卜属,油棕属Elaeis,草莓属,大豆属棉属向日葵属,Heterocallis,大麦属,天仙子属,莴苣属,亚麻属,黑麦草属羽扇豆属,番茄属,苹果属,木薯属,Majorana,苜蓿属,烟草属,齐墩果属,稻属,稷Panieum,Pannisetum,鳄梨属,菜豆属,马尾香属,豌豆pisum,犁属,李属,萝卡属,萝卡属,黑麦属,千里光属,芥子属,茄属,高粱属,可可属,葫芦属,小麦属,蚕豆属,葡萄属,豇豆属和玉蜀黍属。
在作为选择的例子中,发明的核酸在植物(例如,转基因植物),如含油籽植物,例如大豆,油菜籽,向日葵子,芝麻和花生中表达。发明的核酸可以在含纤维细胞的植物,包括例如,棉花,丝光木棉树(Keapok,Ceiba pentandra),荒漠柳树,石炭酸灌木,winterfat,白塞树,苎麻,洋麻,大麻,洛神葵,黄麻,剑麻马尼拉麻和亚麻中表达。在作为选择的例子中,发明的转基因植物可以是棉属中的成员,包括任何棉属种类的成员,如亚洲棉G arboreum;非洲棉G.herbaceum,G海岛棉barbadense,和陆地棉G hirsutum。
发明也提供用于产生发明的大量多肽(例如,磷脂酶或抗体)的转基因植物。例如,见Palmgren(1997)Trends Genet.13:348;Chong(1997)TransgeincRes.6:289-296(使用植物生长激素诱导的双向甘露氨酸合酶(mas1’,2’)启动子,和Agrobacterium tumefaciens介导的叶盘转化方法,在转基因马铃薯植物中产生人乳蛋白β-酪蛋白)。
使用已知的程序,熟悉人员可以提供检测转基因植物中转基因mRNA或蛋白质的增加或减少来筛选发明的植物。检测和定量mRNA或蛋白质的方法在技术上所熟知。
多肽和肽
发明提供与发明的典型序列,例如SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ IDNO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SBQ IDNO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SBQ ID NO:34,SEQ IDNO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ IDNO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ IDNO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ IDNO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ IDNO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ IDNO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SBQ ID NO:94,SEQ IDNO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQID NO:106具有序列同一性(例如,至少50%,51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或者更多,或者完全(100%)序列同一性)的分离的或重组的多肽。如以上讨论的,同一性可以在多肽的全长范围内,或者,同一性可以在其序列的范围内,例如,至少大约50,60,70,80,90,100,150,200,250,300,350,400,450,500,550,600,650,700或更长残基的范围内。发明的多肽也可以比典型多肽的全长要短(例如,SEQ IDNO:2,SEQ ID NO:4,SBQ ID NO:6,SEQ ID NO:8,等等)。在作为选择的例子中,发明提供大小在大约5到全长多肽范围的多肽(肽,片段),例如酶,如磷脂酶,例如,磷脂酶;典型大小为大约5,10,15,20,25,30,35,40,45,50,55,60,65,70,75,80,85,90,100,125,150,175,200,250,300,350,400或更长残基,例如,SEQ IDNO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,等等的典型磷脂酶的相邻残基。发明的肽可以作为,例如,标记探针,抗原,耐受原,基元,磷脂酶活性位点。
一方面,多肽具有磷脂酶活性,例如,甘油磷酸酯键的断裂,水解磷酸酯键的能力,包括马铃薯块茎蛋白(patatin),脂酰水解酶(LAH),磷脂酶A,B,C和/或磷脂酶D活性。一方面,发明的典型多肽具有如以下表1中阐明的磷脂酶活性。
表1
SEO ID NO:                        酶类型
Figure A0381359400951
Figure A0381359400961
发明的多肽和肽可以从天然来源分离,可以合成,或者是重组产生的多肽。肽和蛋白质可以体外或体内重组表达。发明的肽和多肽可以使用任何技术上已知的方法产生和分离。发明的多肽和肽也可以使用技术上熟知的化学方法,全部的或部分的合成,见,例如Caruthers(1980)Nucleic Acids Res.Symp.Ser.215-223;Horn(1980)Nucleic Acids Res.Symp.Ser.225-232;Banga,A.K.,TherapeuticPeptides and Proteins,Formulation,Processing and Delivery Systems(1995)Technomic Publishing Co.,Lancaster,PA。例如,肽合成可以使用不同的固相技术进行(见,例如,Roberge(1995)Science 269:202,Metrifield(1997)MethodsEnzymol.289:3□13),并且可以使用,例如ABI 43 IA肽合成仪(Perkin Elmer),根据生产商提供的指导自动合成。
发明的肽和多肽也可以糖基化。糖基化可以化学地或者利用细胞生物合成机制翻译后加上,其中后一种方式结合了已知糖基化基元的使用,糖基化基元可以是序列原来的或者可以作为肽加上,或者加在编码序列的核酸中。糖基化可以是O-连接的或N-连接的。
发明的肽和多肽,如以上描述的,包括所有的“模拟的”和“肽模拟的”形式。“模拟的”和“肽模拟的”指的是本质上具有与发明的多肽相同结构和/或功能特征的合成化学化合物。模拟物可以是完全由合成的,非天然的氨基酸类似物组成,或者是部分天然肽氨基酸和部分氨基酸的非天然类似物组成的嵌合分子。模拟物也可以结合任何量的天然氨基酸保守取代,只要这样的取代不能本质上改变模拟物的结构和/或活性。因为发明的多肽是保守的变异体,所以常规实验可以确定是否模拟物在发明的范围内,即,其结构和/或功能没有被本质地改变。因此,一方面,假如模拟物具有磷脂酶活性,那么模拟物组分在本发明的范围内。
发明的多肽模拟物组合物可以含有任何非天然结构组分的组合。在可选择的方面,发明的模拟物组合物包括以下三种结构基团的一个或所有:a)残基连接基团不是天然的酰胺键(“肽键”)连接,b)非天然残基取代天然发生的氨基酸残基,或者c)诱导二级结构模拟,即诱导或稳定二级结构,例如,β-转角,γ-转角,β-折叠,α-螺旋构象,和类似物的残基。例如,当所有残基或一些残基通过化学方式,而不是天然肽键的方式连接时,发明的多肽可以作为模拟物定性。单个的多肽残基可以通过肽键,别的化学键或者偶联方式,例如,戊二醛,N-羟基琥珀酰亚胺酯,双功能马来酰亚胺,N,N′-二环己基碳二亚胺(DCC)或者N,N′-二异丙基碳二亚胺(DIC)连接,可以是常规的酰胺键(“肽键”)连接的取代的连接基团包括,例如,南五味子酮(例如,-C(=O)-CH2-for-C(=O)NH),氨基亚甲基(CH2-NH),乙烯,烯烃(CH=CH),醚(CH2-O),硫醚(CH2-S),四唑(CN4-),噻唑,逆酰胺(retroamide),硫代酰胺或酯(见,例如,Spatola(1983)in Chemistry and Biochemistry of Amino Acids,Peptides and Proteins,VOl.7,pp267-357,“Peptide Backbone Modifications,”Marcell Dekker,NY)。
发明的多肽也可以由于含有所有或一些取代天然发生的氨基酸残基的非天然残基,定性为模拟物。非天然残基在科学文献和专利文献中有很好的描述;一些作为天然氨基酸残基模拟学使用的典型的非天然组分和指导方针在以下描述。芳香族氨基酸模拟学可以通过被例如,D-或L-naphylalanine(萘丙氨酸);D-或L-苯基甘氨酸,D-或L-2 thieneylalanine(噻吩丙氨酸);D-或L-1,-2,3-,或4-芘基丙氨酸;D-或L-3 thieneylalanine(噻吩丙氨酸);D-或L(2-吡啶基)-丙氨酸;D-或L-(3-吡啶基)-丙氨酸;D-或L-(2-吡嗪基)-丙氨酸;D-或L-(4-异丙基)-苯基甘氨酸;D-(三氟甲基)苯基甘氨酸;D-(三氟甲基)苯基丙氨酸;D-p-氟-苯基丙氨酸;D-或L-p-二苯基苯基丙氨酸;K-或L-p-甲氧基二苯基苯基丙氨酸;D-或L-2-吲哚(烷基)丙氨酸;和D-或L-alkylainines取代产生,其中烷基是取代的或不取代的甲基,乙基,丙基,己基,丁基,戊基,异丙基,异丁基,sec-isotyl,异戊基,或非酸性氨基酸。非天然氨基酸的芳香环包括,例如,噻唑基,苯硫基,吡唑基,苯并咪唑基,萘基,呋喃基,吡咯,和吡啶基芳香环。
氨基酸模拟可以通过被,例如,同时保持负电荷的非羧化氨基酸;(二氧磷基)丙氨酸,硫酸化的苏氨酸取代产生。羧基侧基团(例如,天冬氨酰或谷氨酰胺)也可以通过与碳二亚胺(R’-N-C-N-R’),例如,反应而选择性修饰1-环己基-3(2-吗啉基-(4-乙基)碳二亚胺或1-乙基-3(4-氮鎓-4,4-二甲基(dimethol)戊基)碳二亚胺。天冬氨酰或谷氨酰胺也可以通过与铵离子反应转化为天冬酰基和谷酰胺基残基。用,例如,(除了赖氨酸和精氨酸外),氨基酸鸟氨酸,瓜氨酸,或(胍基)-乙酸或者(胍基)烷基-乙酸取代可以产生碱性氨基酸模拟,其中烷基如以上定义。含有取代COOH的CN部分的腈衍生物可以取代天冬酰胺或谷氨酰胺。天冬酰和谷酰胺基残基可以脱氨,产生相应的天冬氨酰基或谷氨酰基残基。精氨酸残基模拟可以通过精氨酰基与,例如,一种或多种常规试剂,包括,例如苯乙二醛,2,3-丁二酮,1,2-环己二酮,或者茚三酮,优选的在碱性条件下反应产生。酪氨酸残基模拟物可以通过酪氨酰基与,例如,芳香的重盐化合物,或者四硝基甲烷反应产生。N-乙酰咪唑和四硝基甲烷可以分别用于形成O-乙酰酪氨酰基和3-硝基衍生物。半胱氨酸残基模拟可以通过半胱酰基与,例如α-卤代乙酸,如,2-氯代乙酸或氯乙酰胺和相应的胺反应产生:得到羧甲基或羧酰胺甲基衍生物。半胱氨酸残基模拟也可以通过半胱酰基残基与,例如,溴-三氟丙酮,α-溴-β(5-咪唑基)丙酸;氯乙酰磷酸,N-烷基马来酰亚胺,3-硝基-2-吡啶基二硫;甲基2--吡啶基二硫,p-氯汞苯甲酸脂;2-氯汞-4硝基苯酚,或氯-7-硝基苯并-氧代-1,3-重氮盐。赖氨酸模拟可以通过赖胺酰基与,例如,琥珀酐或别的羧酸酐反应产生(氨基末端残基可以改变)。赖氨酸和别的含有α-氨基的残基模拟也可以通过与亚氨酯,例如甲基吡啶咪唑酯(picolinimidate),磷酸吡哆醛,吡哆醛,硼氢化氯,三硝基苯磺酸,O-甲基异脲,2,4-戊二酮,并且转酰胺基酶催化乙醛酸盐的反应产生。甲硫氨酸模拟可以通过与,例如,蛋氨酸亚砜反应产生。脯氨酸模拟包括,例如,六氢吡啶羧酸,噻唑烷羧酸,3-或4-羟脯氨酸,脱氢脯氨酸,3-或4-甲基脯氨酸,或者3,3,-二甲基脯氨酸。组氨酸残基模拟可以通过组氨酰与例如,二乙基前碳酸盐或者对-苯酰甲基溴反应产生。别的模拟包括,例如,那些通过脯氨酸和赖氨酸羟基化作用;丝氨酰或苏氨酰残基的羟基磷酸化作用;赖氨酸,精氨酸和组氨酸的α-氨基甲基化作用;N端胺乙酰化作用;主链酰胺残基的甲基化作用或者用N-甲基氨基酸取代;或者C-端羧基酰胺化作用产生。
残基,例如,发明的多肽的氨基酸也可以用具有相反手性的氨基酸(或者肽模拟残基)取代。因此,任何以L-构象(也可以用R或S表示,取决于化学实体的结构)中天然发生的氨基酸都可以用相同化学结构类型,但是相反手性,表示为D-氨基酸,但是也可以表示为R-或S形式的氨基酸或肽模拟物取代。
发明也提供通过天然过程,如翻译后加工(例如,磷酸化作用,酰化作用等等),或者化学修饰技术修饰发明的多肽,得到修饰的多肽的方法。修饰可以发生在多肽的任何位置,包括肽骨架,氨基酸侧链和氨基或羧基末端。应该可以理解在某个多肽中,相同类型的修饰以相同或不同程度,在多个位点存在。某个多肽也可以具有多种类型的修饰。修饰包括乙酰化作用,酰化作用,ADP-核糖基化作用,氨基化作用,核黄素共价连接,血红素部分共价连接,核苷酸或核苷酸衍生物共价连接,脂或脂衍生物的共价连接,磷脂酰肌醇共价连接,交联环化作用,二硫键形成,去甲基作用,共价交联的形成,半胱氨酸形成,焦谷氨酸形成,甲酰基化作用,γ-羧化作用,糖基化作用,糖基磷脂酰肌醇(GPI)锚形成,羟基化作用,碘化作用,甲基化作用,豆蔻酰化作用(myristolyation),氧化作用,聚乙二醇化作用(PEG化作用,pegylation),蛋白分解加工,磷酸化作用,异戊烯作用,消旋作用,硒化作用,硫酸盐化作用和转运RNA介导的氨基酸添加到蛋白质中,例如,精氨酰化作用。键,例如,Creighton,T.E.,Proteins-Structure and MolecularProperties 2nd Ed.,W.H.Freeman and Company,New York(1993),PosttanslationalCovalent Modification of proteins,B.C.Johnson,Ed.,Academic Press,New York,pp.1-12(1983)。
固相化学肽合成方法也可以用于合成本发明的多肽和片段。这些方法从二十世纪六十年代早期以来已经在技术上已知(Metrifield,R.B.,J.Am.Chem.Soc.,85:2149-2154,1963)(也见Stewart,J.M.and Young,J.D.,Solid Phase PeptideSynthesis,2nd Ed.,Pierce Chemical Co.,Rockford,111.,pp.11-12),并且目前已经在可买到的实验肽设计和合成试剂盒(Cambridge Research Biochemicals)中采用。这些可买到的实验试剂盒一般使用H.M.Geysen等人的Proc.Natl,Acad.Sci.,USA,81:3998(1984)的技术,并且提供了在多数与单一板相连的“杆”或“针”的尖端上合成肽。当使用这样的系统时,有杆或针的板倒转,插入第二个板的相应孔或池中,孔或池中含有附着或锚定合适氨基酸到针或杆的尖端上的溶液。通过重复这样的处理过程,即,倒转和插入杆和针的尖端到合适溶液中,氨基酸形成所需的肽。另外,可以买到许多可以使用的芴甲氧羰基(FMOC)肽合成系统。例如,多肽或片段的组装可以使用Applied Biosystems,Inc.Model 431TM自动肽合成仪,在固体支持物上进行。或者通过直接合成,或者通过合成一系列可以使用别的技术偶联的片段,这样的设备为发明的肽提供了便利。
磷脂酶
发明提供新的磷脂酶,编码磷脂酶的核酸,结合磷脂酶的抗体,代表酶的抗原位点(抗原决定簇)和活性位点的肽,和产生和使用磷脂酶的方法。一方面,发明的多肽具有磷脂酶活性,如以上描述的(例如,磷酸甘油酯键的断裂)。在可选择的方面,发明的磷脂酶具有已经不同于在此描述的典型磷脂酶的活性的活性。发明包括具有和不具有信号序列的磷脂酶和信号序列本身。发明包括固定的磷脂酶,抗磷脂酶抗体和它们的片段。发明包括杂合物(heterocomplexes),例如,包括发明的磷脂酶的融合的蛋白质,异二聚体,等等。
代表酶的抗原位点(表位),活性位点,结合位点,信号序列和类似物的肽可以用常规的筛选方案确定。
发明的酶是高度选择性的催化剂。与别的酶一样,它们催化常规的合成化学所不能比拟的精巧的立体选择性,区域选择性,化学选择性的反应。而且,发明的酶是非常易变(通用的)的。它们可以经改变在有机溶剂中具有功能,在极端pH(例如,高pH和低pH),极端温度(例如,高温和低温),极端盐度水平(例如,高盐度和低盐度)下有作用,并且催化结构上与它们的天然的、生理学上的底物无关的化合物的反应。发明的酶可以设计为与大范围的天然和非天然底物反应,因此,使得事实上任何有机的先导化合物被修饰。发明的酶也可以设计为高度对映选择性和区域选择性。这些酶的功能基团高度特异性使得人们可以记录下合成顺序中的每一个反应,从而得到新的活性化合物。发明的酶也可以设计为催化许多与它们的天然生理功能无关的不同的反应。
本发明利用了酶的独特催化特性。然而,在化学变化中,生物催化剂(即,纯化的或粗酶,非生活或生活细胞)的使用一般要求确定与特异起始化合物反应的特殊的生物催化剂。本发明使用经选择的生物催化剂,即,发明的酶,和对在许多起始化合物中都存在的功能基团特殊的反应条件。每种生物催化剂对一种功能基团,或几种相关功能基团特异,可以与含有这种功能基团的多种起始化合物反应。生物催化反应由单一的起始化合物产生一个衍生物群体。这些衍生物可以经过另一轮生物催化途径,产生衍生化合物的第二个群体。生物催化衍生化作用的每次重复都可以产生数千种最初化合物的变异体。
酶在起始化合物的特异位点反应,不影响该分子的其余部分,这个过程使用常规的化学方法是难以达到的。此生物催化高度特异性提供了确定文库中单一活性酶的方法。文库是以通过一系列用于产生文库的生物催化反应为特征的,是一个所谓的“生物合成史”。筛选文库,确定生物活性,追踪生物合成史确定产生该活性化合物的特异反应顺序。重复反应顺序,确定合成的化合物的结构。这种鉴定方式,与别的合成和筛选方法不同,不要求固定化技术,化合物可以在溶液中合成,并且实际上使用任何类型的筛选分析进行任意检测。注意,酶反应对功能基团的高度特异性使得可以“追踪”形成生物催化产生的文库的特异性酶反应。
发明也提供使用发明的核酸,多肽和抗体,发现新的磷脂酶的方法。一方面,λ-噬菌体文库的筛选是基于表达而发现磷脂酶。在筛选中使用λ-噬菌体文库可以允许如下事项:检测到毒性克隆;改进接触底物;降低对工程宿主的要求,绕开任何由文库的大量排除所致的潜在偏差;和,在低克隆密度下的快速生长。λ-噬菌体文库的筛选可以在液相或在固相中进行。在液相筛选得到分析条件的更大灵活度,额外的底物灵活度,对弱克隆更为灵敏;较固相筛选易于自动化。
许多程序步骤使用机器自动化进行,每天可以完成几千种生物催化反应和筛选分析,同时确保高度准确和再现性(见以下的阵列讨论)。结果,衍生化合物的文库可以在大概数周内获得。分子,包括小分子修饰的进一步讲授,见PCT/US94/09174。
磷脂酶信号序列和催化结构域
发明提供磷脂酶的信号序列(例如,信号肽(SPs))和催化区域(CDs)。发明提供编码这些催化区域(CDs)和信号序列(SPs,例如,肽,包括本发明多肽的氨基末端残基的序列或者由本发明多肽的氨基末端残基组成的序列)的核酸。一方面,本发明提供了信号序列,其包括一个肽,该肽包括一个序列或者由一个序列组成,该序列是如同在本发明的多肽的残基1到20,到21,1到22,1到23,1到24,1到25,1到26,1到27,1到28,1到28,1到30,1到31,1到32或1到33中所阐述的序列,本发明的多肽,例如是SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66.SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106。
典型的信号序列列于SEQ ID列表中,如,SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6的残基1到24,SEQ ID NO:8的残基1到29;SEQ ID NO:10的残基1到20;SEQ ID NO:20的残基1到19;SEQ ID NO:22的残基1到28;SEQ IDNO:32的残基1到20;SEQ ID NO:38的残基1到23;对于本发明的其它典型信号序列,参见SEQ ID列表。
本发明的磷脂酶的信号序列可以是分离的肽,或者连接于磷脂酶或者非磷脂酶多肽的序列,如,作为一种融合蛋白。一方面,本发明提供了包含有本发明磷脂酶的信号序列。一方面,包含本发明磷脂酶信号序列的多肽,该多肽包含对于本发明磷脂酶异源的序列(如包含本发明磷脂酶信号序列和源于另一个磷脂酶或者非磷脂酶蛋白序列的融合蛋白)。一方面,本发明提供了本发明的磷脂酶以及异源的信号序列,例如,酵母信号序列的序列。本发明的磷脂酶可以包括异源的信号肽序列,如,在载体中,例如在pPIC系列载体(Invitrogen,Carlsbad,CA)中。
一方面,本发明的信号序列在通过鉴定新型的磷脂酶多肽之后来确定。进行分选蛋白质并且转运蛋白质至它们的细胞内合适位置的途径,一般被称为蛋白质定向转运途径(protein targeting pathways)。在所有这些定向转运系统中的最重要成员之一是在新合成多肽的氨基端的短氨基酸序列,叫做信号序列。信号序列引导蛋白质至细胞的合适位置定位,并且在转运过程或者当蛋白到达其最终的目的地之后去除。大多数溶酶体的,膜的,或者外泌蛋白具有一个氨基末端的信号序列,该序列标记这些蛋白用于转移到内质网的腔中。已经确定了对应于这类蛋白超过100种的信号序列。信号序列的长度可以在从13到36个氨基酸残基之内进行变化。专业人员了解不同的识别信号序列的方法。例如,一方面,通过称为SignalP的方法来鉴定新型的磷脂酶信号肽。SignalP应用识别信号肽和它们的切割位点的组合的神经网络。(Nielsen,et al.,“Identification of prokaryotic and eukaryotic signalpeptides and prediction of their cleavage sites.”Protein Engineering,vol.10,no.1,p.1~6(1997)。
应当认识到在一些方面,本发明的磷脂酶可能不具有信号序列。一方面,本发明提供了缺少所有或者部分信号序列的本发明的磷脂酶。一方面,本发明提供了编码来自一种磷脂酶的信号序列的核酸序列,其可操作连接于一种不同的磷脂酶的核酸序列上,或者可选择地,来自非磷脂酶蛋白的信号序列可能是需要的。
本发明也提供了分离的或者重组的多肽,含有本发明的信号序列(SPs)和催化结构域(CDs),以及异源序列。异源序列是与SP和/或CD非天然相关(如,对于磷脂酶)的序列。与SP和/或CD非天然相关的序列可以在SP的和/或CD的氨基末端,羧基末端,和/或在SP和/或CD的两个末端。一方面,本发明提供了分离的或者重组的多肽,包括(或者由...组成)一个多肽,该多肽包括本发明的信号序列(SPs)和/或催化结构域(CDs),条件是其并不与和与其有天然联系的任何序列有联系(如磷脂酶序列)。相似地,一方面,本发明提供了分离的或者重组的编码这些多肽的核酸。所以,在一个方面,本发明的分离或者重组核酸包含有本发明的信号序列(SP)和/或催化结构域(CD)的编码序列,以及一段异源序列(即是,与本发明的信号序列(SP)和/或催化结构域(CD)的编码序列并不天然关联的序列)。异源序列可以在3’末端,5’末端,和/或在SP和/或CD编码序列的两个末端。
磷脂酶活性的分析
本发明提供了具有磷脂酶活性的分离的或者重组的多肽,以及编码它们的核酸。专业人士了解很多已知的磷脂酶分析方法来用于确定是否多肽具有磷脂酶活性,并且是否是属于本发明的范围。专业人士了解用于确定磷脂酶A,B,D,和C,patatin和脂酰水解酶活性的常规方案。
典型的活性分析包括混浊度分析,羟甲香豆素磷酸胆碱(荧光)分析,Amplexred(荧光)磷脂酶分析,薄层色谱分析(TLC),细胞裂解分析和p-硝基苯基磷脂酰胆碱分析。应用这些对多肽进行分析,可以很快地筛查出磷脂酶活性。
磷脂酶活性可以包括脂酰水解酶(LAH)活性,参见如,Jimenez(2001)Lipids36:1169-1174,说明了以十八烷基乙烯乙二醇单十二烷基醚为基础的混合的微胶粒分析,来确定patatin的脂酰水解酶活性。Pinsirodom(2000)J.Agric.Food Chem.48:155-160,,说明了一种典型的脂酰水解酶(LAH)patatin活性。
在以下文献中说明了用于确定磷脂酶活性的混浊度分析,如,在Kauffmann(2001)“Convorsion of Bacillus thermocatenulatus lipase into an efficientphospholipase with increased activity towards long-chain fatty acyl substrates bydirected evolution and rational design”Protein Engineering 14:919-928,Ibrahim(1995)“Evidence implicating phospholipase as a virulence factor of Candidaalbicans,”Infect.Immun.63:1993-1998。
利用羟甲香豆素磷酸胆碱(荧光)分析确定磷脂酶活性的方法如下说明,如,在Goode(1997)“Evidence for cell surface and internal phospholipase activity inascidian eggs,”Develop.Growth Differ.39:655-660;Diaz(1999)“`Directfluorescence-based lipase activity assay,”BioTechniques 27:696-700。
Amplex Red(荧光)的磷脂酶分析用于确定磷脂酶活性可以通过购买到的试剂盒进行,如,应用来自Molecular Probes Inc(Eugene,OR)的Amplex Red(荧光)的磷脂酰胆碱特异的磷脂酶分析试剂盒,按照制造商的说明检测磷脂酰胆碱特异性的磷脂酶活性。荧光的测定是应用荧光微板读数测定器,所用的激发光为在560±10nm,并且在590±10nm检测荧光。该分析对于较低的酶浓度仍敏感。
应用薄层色谱分析(TLC)来确定磷脂酶活性在以下有说明,如,Reynolds(1991)Methods in Enzymol.197:3-13;Taguchi(1975)“Phospholipase fromClostridium novyi type A.I,”Biochim.Biophys.Acta 409:75-85。薄层色谱分析(TLC)是广泛应用的技术用于检测磷脂酶活性。已经应用了该方法的不同的经改良的方法从液相分析混合物中来提取磷脂酶。在一些PLC的分析中,通过加入氯仿/甲醇(2∶1)至反应混合物中终止水解。当首基(head group)产物仍存在水相中,而未反应的起始物以及二酰基甘油通过抽提进入有机相,并且可以通过TLC分离。对于磷脂消化的更精确测定,可以使用放射性标记的底物(参见,如,Reynolds(1991)Methods in Enzymol.197:3-13)。产物和反应物的比率可以用于计算单位时间内的底物水解的实际摩尔数。如果所有的成分进行平均提取,提取中的任何损失将平均影响所有的成分。磷脂消化产物的分离可以通过硅胶TCL来完成,用氯仿/甲醇/水(65∶25∶4)作为溶剂系统(参见,如,Taguchi(1975)Biochim.Biophys.Acta 409:75-85)。
用P-硝基苯磷脂酰胆碱分析来确定磷脂酶活性的方法如下所述,如,在Korbsrisate(1999)“Cloinng and characterization of a nonhemolytic phospholipasegene from Burkholderia pseudomallei,”J.Clin.Microbiol.37:3742-3745;Berka(1981)“Studies of phospholipase(heat labile hemolysin)in Pseudomonasaeroginosa,”Infect.Immun.34:1071-1074。这一分析是基于酶水解底物类似物P-硝基苯磷脂酰胆碱,而释放一种黄色的生色化合物p-硝基苯,在405nm可以检测到。该底物方便于高通量筛选。
基于红细胞裂解,用细胞裂解分析来检测具有细胞裂解活性的磷脂酶。有毒的磷脂酶可以与真核细胞膜作用,并水解磷脂酰胆碱和鞘磷脂,引起细胞裂解,参见,如,Titall(1993)Microbiol.Rev.57:347-366。
杂种(嵌合)磷脂酶和肽文库
一方面,本发明提供了杂种磷脂酶和融合蛋白,包括肽库,含有本发明序列。本发明的肽库可以用于分离靶物质的肽调节剂(如激活剂或者抑制剂),如磷脂酶底物,受体,酶。本发明的肽库可以用于鉴定与靶子正常结合的结合物,如配基,例如,细胞因子,激素和类似物。一方面,本发明提供了包括本发明的信号序列(SP)和/或催化结构域(CD),以及一段异源序列(参见以上)的嵌合蛋白。
本发明也提供了方法应用本发明核酸和多肽,来产生“改进的”和杂种的磷脂酶。例如,本发明提供了方法用于产生具有活性的酶,如,磷脂酶活性(如,磷脂酶A,B,C,或者D的活性,patatin酯酶活性,甘油磷酸酯键的切割,植物油中磷脂的酯连接的切割)在极端碱性pH值和/或酸性pHs下,高和低的温度,渗透压和类似条件下的活性。本发明提供了用于产生杂种酶(如,杂种磷脂酶)的方法。
一方面,本发明的方法提供新的杂种多核苷酸,通过应用细胞内过程,整合第一多核苷酸的序列,以便得到杂种多核苷酸,它编码表现源于第一生物活性多肽的活性的多肽。例如,第一多核苷酸可以是编码本发明典型的磷脂酶(如SEQ IDNO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,等等)的典型核酸序列(如SEQ ID NO:1,SEQ ID NO:3,SBQ ID NO:5,SEQ ID NO:7,等等)。第一核酸可以编码来自一种生物体的酶,其在特定的环境条件下,如高盐的条件下有效地发挥作用。它可以与由源于不同生物体的第二多核苷酸所编码的酶“整合”,该酶可以在不同的环境条件下如极端的高温条件下,有效地发挥作用。例如,当两个核酸可以产生杂种分子,如通过重组和/或还原性重配。含有来自第一和第二原始多核苷酸的序列的杂种多核苷酸可以编码酶,其表现出由该原始多核苷酸编码的两种酶的特性。这样,由杂种多核苷酸编码的酶可以有效地在环境条件下如高盐和极端温度,具有在由第一和第二多核苷酸编码的每一个酶所分享的条件下发挥作用。
可选择地,由本发明得到的杂种核苷酸可以表现出原始酶所不能显示出的特异化酶活性。例如,在编码磷脂酶活性的多核苷酸重组和/或还原性重配以后,由杂种多核苷酸得到的杂种多肽可以通过筛查来自每一个起始酶特异的活性,即是对于磷脂酶作用的键的类型以及磷脂酶发挥作用的温度。这样,例如,可以筛查磷脂酶,来查明那些化学功能,这些化学功能可以将杂种磷脂酶从起初的磷脂酶分辨出来,如:(a)酰胺(肽键),即是,磷脂酶;(b)酯键,即是淀粉酶和脂肪酶;(c)乙醛缩二乙醇,即是寡糖酶,和,例如,杂种多肽作用的温度,pH或者盐浓度。
待与本发明的核酸“整合”的多核苷酸来源可以从下述情形中分离,个体的生物体(“分离物”),生长于确定培养基的生物体的集合(“富集培养物”),或者,未经培养的生物体(“环境样品”)。由于其使人们可以接近未开发的具生物多样性的资源,应用培养基依赖的方法来得到编码来自环境样品的新型生物活性的多核苷酸是最优选的。“环境文库”是从环境样品中产生,并且代表了天然发生生物体的全体的基因组,环境文库保存在克隆载体中,载体可以在适合的原核宿主中繁殖扩增。因为克隆DNA起初是从环境样品中直接提取,文库并不限于可以生长于纯培养基中的一小部分原核生物。此外,存在于这些样品中的环境DNA的标准化,可以允许其更加平等地代表在起始样品中所有物种的DNA。这就可以显著增加从样品中的较少组分中发现感兴趣基因的效率,该样品中的较少组分与优势种相比,可能少了几个数量级的代表性。
例如,从一个或者更多的野生微生物中产生的基因文库中,筛查感兴趣的活性。编码感兴趣的生物活性分子的潜在途径,首先在原核生物细胞中以基因表达文库的方式被捕获。编码感兴趣活性的多核苷酸分离自这样的文库,并且引入到宿主细胞中。宿主细胞生长于促进重组和/或还原性重配的环境中,来产生潜在的具有新型的或者增强活性的生物活性分子。
制备杂种多核苷酸的微生物包括原核微生物,如,真细菌Eubacteria和古细菌Archaebactorta,以及低等的真核微生物如,真菌,一些藻类和原生动物。多聚核苷酸可以分离自环境样品。核酸可以不通过培养生物体来回收或者从一种或者更多种培养的生物体中回收。一方面,这样的微生物可以是极端微生物,如,耐热微生物,嗜冷微生物,冷育微生物psychrotrophs,嗜盐微生物,嗜压微生物和嗜酸微生物。一方面,编码分离自极端微生物的磷脂酶的多核苷酸用于制备杂种酶。这样的酶可以在高于100℃的温度下作用,如在陆地热温泉和深海的热排放口,在低于0℃的条件下作用,如两极的水中,在饱和的盐环境中,如,死海,在pH值在0附近,如,煤沉积物和地热富含硫的泉,或者在pH值高于11的条件下,如,污水淤泥。例如,从极端生物中克隆和表达的磷脂酶可以在很宽的温度和pH值的范围内表现出高活性。
正如在此说明的,选择和分离的多聚核苷酸,包括至少本发明的一种核酸,是被引入到适当的宿主细胞中。适当的宿主细胞是任何可以促进重组和/或还原性重配的细胞。选择的多聚核苷酸可以在包括合适控制序列的载体中。宿主细胞可以是更高等的真核生物细胞,如哺乳动物细胞,或者较低等的真核生物细胞,如,酵母细胞,或者优选地,宿主细胞可以是原核细胞,如细菌细胞。将构建物引入这种宿主细胞可能是通过磷酸钙转染,二乙氨乙基葡聚糖(DEAE-Dextran)介导的转染,或者电穿孔(Deavis et al.,1986)。
适合宿主的代表性例子,可以提及的是:细菌细胞,如,大肠杆菌E coli,链霉菌Streptomyces,鼠伤寒沙门氏菌Salmonella typhimurium,真菌细胞,如,酵母;昆虫细胞,如,果蝇S2(Drosophila S2)和草地夜蛾Sf9(Spodoptera Sf9);动物细胞如CHO,COS或者黑色素瘤Bowes melanoma;腺病毒;和植物细胞。用于重组和/或还原性重配的合适宿主细胞的选择或者仅仅用于重组蛋白的表达认为是在此所教授的专业人员的技术的范围内。可以用于重组和/或还原性重配或者仅仅用于表达重组蛋白的哺乳动物培养系统包括,如,猴肾脏成纤维细胞COS-7细胞系,在此说明为在“SV40-转化的猿细胞支持早期SV40突变体的复制”(Gluznian,1981),C127,3T3,CHO,HeLa和BHK细胞系。哺乳动物细胞的表达载体可能包括复制起始,适合的启动子和增强子,必要的核糖体结合位点,聚腺苷酸位点,剪接供体和受体位点。转录终止序列,以及5’侧的非转录序列。源于SV40剪接体的DNA序列,和多聚腺苷酸位点可以用于提供所需的非—转录遗传学元件。
含有感兴趣多聚核苷酸的宿主细胞(用于重组和/或还原性重配或者仅仅用于表达重组蛋白)可以在传统的营养培养基中培养,对该培养基进行改变以适于激活启动子,选择转化子或者扩增基因。培养的条件,如温度,pH和类似因素是那些以前选择的用于表达条件,并且对于一般的技术人员是了解的。确定的具有特异酶活性的克隆可以随后进行序列测定来确定编码具有增强活性的酶的多聚核苷酸序列。
另一方面,本发明的核酸和方法可以用于产生用于生物化学途径的新型多核苷酸,如,来自一个或者多个操纵子或者基因簇或者其中部分的途径。例如,细菌和很多的真核生物具有调控基因的协调机制,其产物涉及相关的过程。基因是成簇存在于一个染色体上的,在结构上称为“基因簇”,并且转录是在一个单一的调控序列的控制下一同进行,包括一个单一的启动子,其起始整个基因簇的转录。这样,一个基因簇是一组邻近的基因,它们是相同或者相关的,通常是在它们的功能上。
基因簇DNA可以是分离自不同的生物体,并连接到载体中,特别地,载体含有表达调控序列,其可以控制并且调控可检测蛋白或者来自连接基因簇的蛋白-相关阵列活性的产生。应用含有特定大容量外源DNA引入的载体,是特别适于应用这样的基因簇并且在此以例子的方式说明,包括大肠杆菌的F因子(或者致育因子)。大肠杆菌的F因子是一种质粒,其在接合过程中作用于自身的高效率转移并且对于得到和稳定地增殖大的DNA片段是理想的,如来自混合的微生物样品中的基因簇。可以应用“Fosmids”,粘粒或者细菌人工染色体(BAC)载体作为克隆载体。这些是源于大肠杆菌f因子,其可以稳定地整合到基因组DNA的大片段中。当与野生环境样品中的DNA整合时,这使得可能以稳定的“环境DNA文库”的形式形成大的基因组片段,粘粒载体起初设计为克隆和扩增基因组DNA的大片段。在粘粒载体中的克隆参见Sambrook et al.分子克隆:A Laboratory Manual,2ndEd.,Cold Spnng Harbor Laboratory Press(1989)的详细说明。一旦连接至合适的载体,含有不同的聚酮化合物合酶基因簇的两个或者更多载体可以引入到一个合适的宿主细胞。基因簇所具有的部分序列同源性的区域将促进引起序列重组织而得到杂种基因簇的过程。然后,可以筛查在起始的基因簇中不能发现的具有增强活性的新型杂种基因簇。
这样,一方面,本发明涉及应用本发明核酸产生生物活性杂种多肽的方法和筛查具有活性的多肽(如增强的活性),通过以下步骤:
(1)以可操作的连接引入至少第一多核苷酸(如本发明的核酸),和以可操作的连接引入第二多核苷酸,所述的至少第一多核苷酸和第二多核苷酸共同具有部分序列同源性的至少一个区域,引入到合适的宿主细胞中;
(2)在促进序列再组织从而可以得到可操作连接的杂种多核苷酸的条件下,生长宿主细胞;
(3)表达由杂种多核苷酸所编码的杂种多肽;
(4)在促进鉴定所需的生物活性(如,增强的磷脂酶活性)的条件下,筛查杂种多肽;和
(5)分离编码杂种多肽的多核苷酸。
用于筛查各种酶活性的方法对于专业人员是熟悉的,并且在本说明书中进行全面的讨论。当分离本发明多肽和多核苷酸时,可以应用这样的方法。
体内重配可以集中在“分子间”的过程上,统称为“重组”。在细菌中,它一般被认为是“RecA-依赖”的现象。本发明可以依赖于宿主细胞的重组过程来重组和重配序列,或者依赖细胞介导的还原过程的能力,通过缺失在细胞中减少准-重复序列的复杂性。“还原性重配”是一个通过分子内的、RecA-依赖过程而发生的过程。这样,本发明的一方面,应用本发明的核酸,通过还原性重配过程,产生新型的多核苷酸。该方法包括产生含有连续的序列(起始的编码序列)的构建物的产生,它们插入到合适的载体,并且将它们引入到合适的宿主细胞。单个分子同一性的重配(reassortment)通过在构建物中具有同源性区域的连续序列间的组合过程,或者准-重复单位间的组合过程发生。重配过程重组和/或降低重复序列的复杂性和程度,并且导致产生新型的分子种类。
可以进行各种处理来提高重配效率。这些可能包括用紫外线,或者损坏DNA的化学试剂处理,和/或应用表现了增高水平的“遗传不稳定性”的宿主细胞系。这样的重配过程可以包括同源重组或者准-重复序列的天然特征来定向它们自身的进化。
重复的或者“准-重复”序列在遗传不稳定性上有重要作用。“准-重复”指那些并不限于它们原始单位结构的重复。准-重复单位可以在一种结构物中以序列的排列;相似序列的连续单位来体现。一旦连接,连续序列之间的结合部变得实质上看不见,并且所得到的结构物中的准-重复性质此时在分子水平上是连续的。为了降低所得到结构物的复杂性,细胞进行的缺失过程在准-重复序列之间进行。准-重复单位提供了模板的实际上无限的所有组成部分,在其中可以发生滑脱事件。含有准-重复的构建物因此有效地提供了足够的分子弹性,分子弹性是指缺失(和潜在的插入)事件可以实际上在准-重复单位的任何地方发生。当准-重复序列全部以同一个方向连接于一起,例如头到尾,或者反向,细胞并不能分辩单个的单位。所以,在整个序列上可以发生还原过程。与之相反,例如,当单位是以头到头的方式,而不是头到尾,通过倒位产生了邻近单位的终末点,以致缺失的形成有利于不连续单位的丢失。这样,本发明的一方面,待重配的序列以同一个方向排列。准-重复序列的随机定向将引起重配效率的损失,而序列一致的定向将提供最高的效率。然而,当在相同的定向上具有较少的邻近序列时,效率降低,其仍可以提供足够的弹性用于新型分子有效的复原。构建物可以通过准-重复序列以相同的定向而制备,以便产生更高的效率。
序列可以应用任何不同的方法以头到尾方向进行装配,包括以下:a)可以利用引物,包括多聚A的头和多聚T的尾,当制备成单链时,其提供了定向。这通过具有来自RNA制备的几个起初碱基的引物完成,随后用RNaseH去除。B)可以利用包括单一的限制酶切割位点的引物。需要多个位点,单一序列的一连串和重复的合成和连接步骤。C)引物中内部的几个碱基可以被硫化,并且应用外切核酸酶产生合适的尾部分子。
重配序列的回收依赖于具有降低的重复指数(RI)的克隆载体的鉴定。重配的编码序列可以随后通过扩增回收。该产物再重新克隆并且表达。具有降低的RI的克隆载体的回收可以受以下所述的影响:1)当构建物降低了复杂性时,所应用载体仅仅稳定保持。2)通过物理方法,物理回收变短的载体。在这种情况下,克隆载体可以应用标准的质粒分离程序回收,在琼脂糖凝胶上根据大小分离,或者应用标准程序用低分子量截留的柱子分离。3)回收含有间断基因的载体,当插入物大小降低时,其可以被选择出。4)应用表达载体和合适选择的直接选择技术。
来自相关生物体的编码序列(如,基因)可以表现出高水平的同源性,并且编码非常不同的蛋白质产物。序列的这些类型在本发明中作为准-重复尤其有用。然而,该过程并不限于这样一些基本上一样的重复。
以下是本发明典型的方法。编码的核酸序列(准-重复)来自三个(3)物种,包括本发明的核酸。每一个编码具有一套不同特征的蛋白质,包括本发明的酶。每一个序列在序列的唯一位置只有一个或者几个碱基对的不同。准-重复序列分别地或者共同扩增并且连接到随机的组合中,以便所有可能的排列交换和组合可以在连接分子的群体中出现。准-重复单位的数目可以通过组合条件来控制。在构建物中,准-重复单位的平均数目通过重复指数(RI)来定义。一旦形成,构建物可以,也可以不是按照出版的方法通过琼脂糖凝胶来按大小分离,插入到克隆载体,并且转染到合适的宿主细胞。然后细胞进行繁殖,并且进行有效的“还原性重配”。如果需要,还原性重配过程的速率可以通过引入DNA损伤来刺激。不管RI值的降低是通过“分子内”机制的重复序列间的缺失形成来介导,还是通过“分子间”机制的重组类似事件介导是不重要的。最终的结果是重配该分子至所有可能的组合。一方面,该方法包括另外的筛查改组库的文库成员的步骤,来鉴定单个的改组文库成员具有结合或者其它相互作用的能力,或者催化与预先决定的大分子的特定反应(如,例如酶的催化结构域),例如,预先决定的大分子,如,蛋白质的受体,一个寡糖,病毒颗粒,或者其它的预先决定的化合物或者结构。多肽,如,磷脂酶,其从这样的文库所鉴定,可以用于各种目的,如,在此说明的工业过程和/或,可以遭受改组和/或选择的一个或者多个另外的循环。
另一方面,一般认为,在重组或者重配之前或者之中,通过本发明的方法产生的多核苷酸可以是遭受试剂或者工艺过程的处理,它们促进突变引入到起始多核苷酸。引入这样的突变将增加所得到的杂种多核苷酸以及它们编码多肽的多样性。促进突变的试剂或者过程可能包括,但不限于:(+)-CC-1065,,或者合成的类似物如,(+)-CC-1065-(N3-Adenine(参见Sun和Hurley,(1992),可以抑制DNA合成的N-乙酰化的或者去乙酰化的4′-氟-4-氨基联苯加合物(也参见,例如,van de Poll等(1992));或者可以抑制DNA合成的N-乙酰化的或者脱乙酰化的4-氨基二苯基加合物(参见,如,van de Poll et al.(1992),pp.751-758)。三价铬,三价铬盐,可以抑制DNA复制的多环芳香烃(PAH)的DNA加合物,如7-溴甲基-苯基-[a]蒽(“BMA”),tris(2,3-二溴丙基)磷酸(“Tris-BP”)1,2-二溴-3-氯丙烷(“DBCP”),2-溴丙烯醛(2BA),苯并[a]嵌二萘-7,8~二氢二酚-9-10-环氧化物(“BPDE”),铂(II)卤素盐,N-羟基-2-氨基-3-甲基咪唑并[4,5-f]-喹啉(“N-羟基-IQ”),和N-羟基-2-氨基-1-甲基-6-苯基咪唑并[4,5-f]-喹啉“N-羟基-PhlP”)。用于减缓或者终止PCR扩增的特定的优选的方法包括UV光(+)-CC-1065和(+)-CC-1065-(N3-腺嘌呤)。特别包含的方法是DNA加合物或者含有从多聚核苷酸或者多聚核苷酸收集物中得到DNA加合物的多核苷酸,其可以通过包括在进一步处理前加热含有多核苷酸溶液的过程释放或者去除。
筛查方法学和“在线”监视设备
在实践本发明的方法中,可以应用各种设备和方法学,结合使用本发明的多肽和核酸,进行,如,筛查多肽的磷脂酶活性,筛查作为潜在调节物的活性化合物(如,酶活性的增强或者抑制),对于结合于本发明多肽的抗体,对于与本发明核酸等杂交的核酸,和类似物。
固定于固体支持物的酶
磷脂酶,其片段以及编码该酶和片段的核酸可以附于固体支持物上。这对于在工业过程上应用磷脂酶中是经济和有效的。例如,磷脂酶的聚生体或者混合物(或者活性片段),其用于特定的化学反应,并且可以附于固体支持物,并且浸于处理容器中。发生酶解反应。随后,固体支持物从容器中取出,同时具有附着的酶,用于重复使用。在本发明的一个具体例子中,待分离的本发明核酸附着于固体支持物。在本发明的另一个具体例子中,固体支持物是选自凝胶,树脂,聚合物,陶瓷制品,玻璃,微电极以及它们的任意组合。
例如,用于本发明的固体支持物包括凝胶。凝胶的一些例子包括琼脂糖(Sepharose),明胶,戊二醛,铝戊二醛,仁聚糖-黄原胶,toyopearl胶(聚合胶),藻酸盐,藻酸盐-聚赖氨酸,角叉菜胶,琼脂糖,glyoxyl琼脂糖,磁性的琼脂糖,右旋糖苷-琼脂糖,聚(氨基甲酰磺酸盐)水凝胶,BSA-PEG水凝胶,磷酸化的聚乙烯醇(PVC),单氨基乙基N-氨基乙基(MANA)氨基,或者它们的任意组合。
另一个用于本发明的固体支持物是树脂或者聚合物。树脂或者聚合物的一些例子包括纤维素,丙烯酰胺,尼龙,人造纤维,聚酯,阴离子交换树脂,AMBERLITETMXAD-7,AMBERLITETMXAD-8,AMBERLITETMIRA-94,AMBERLITETMIRC-50,聚乙烯,聚丙烯酸,聚甲基丙烯酸酯凝胶或者它们的任何组合。
另一类型的本发明应用的固体支持物是陶瓷。一些例子包括非多孔陶瓷,多孔陶瓷,SiO2,Al2O3。另一类用于本发明的固体支持物是玻璃,一些例子包括,非多孔玻璃,多孔玻璃,氨基丙基玻璃或者它们的任何组合。另一类型可以应用的固体支持物是微电极。一个例子是聚乙烯亚胺涂层磁铁。石墨颗粒可以用于固体支持物。
另一个固体支持物的例子是细胞,如血红细胞。
固定的方法
专业人士已知很多的方法用于固定酶或者其片段,或者核酸于固体支持物。这样的方法一些例子包括:如,产生静电液滴,电化学方法,经由吸收,经由共价结合,经由交联,经由化学反应或者化学工艺,经由包囊,经由捕集,经由藻酸钙,或者经由聚(2-羟乙基甲基丙烯酸)。类似的方法在酶学方法(Methods inEnzymology)中有说明,固定化酶和细胞(Immobilized Enzymes and Cells),C部分1987,Academic Press.由S.P. Colowtck和N.O.Kaplan.编辑,Volume 136;和Immobilization of Enzymes and Cells(酶和细胞的固定化).1997.Humana Press.G.由F.Bickerstaff编辑。丛书:生物技术方法学(Methods in Biotechnology),由J.M.Walker编辑。
毛细管阵列
毛细管阵列,如GIGAMATgnar,Diversa Corporation,San Diego,CA,可以用于本发明的方法,本发明的核酸或者多肽可以固定于或者用于阵列,包括毛细管阵列。阵列可以用于筛查或者模拟含有组成的文库(如,小分子,抗体,核酸等)结合或者调节本发明核酸或者多肽活性的能力。毛细管阵列提供了另一个系统用于盛装和筛查样品。例如,样品筛查仪器可以包括很多毛细管相互排列在一起形成的阵列,其中每一个毛细管包括至少一个确定的保持样品腔的壁。仪器也可以进一步包括在阵列中邻近毛细管之间形成空隙的物质,以及在形成空隙的物质中形成一个或者多个参照的标记物。用于筛查样品的毛细管,其中的毛细管适合束缚于毛细管的阵列中。其可以包括由保留样品的腔确定的壁,以及由过滤材料形成的第二壁,用于过滤激发能,被供给腔中来刺激样品。
多肽或者核酸,如,配基,可以引入第一成分到毛细管阵列中的至少一部分毛细管。毛细管阵列中的每一个毛细管可以包括至少一个确定保留第一组分的腔的壁。在第一组分后,引入气泡至毛细管中。可以引入毛细管中第二组分,其中的第二组分是通过气泡与第一组分分开。令人感兴趣的样品可以作为用可探测到的颗粒标记的第一液相引入到毛细管阵列中的毛细管,其中毛细管阵列中的每一个毛细管包括至少一个确定保留第一液相和可探测颗粒的腔的壁,并且其中至少一个壁是用可以结合可探测颗粒到至少一层壁的结合物质包被。方法可以进一步包括从毛细管的管中去除第一液相,其中结合的可检测的颗粒仍保留在毛细管中,然后引入第二液相至毛细管中。
毛细管可以包括很多的单个的毛细管,包括由至少一个外壁确定的腔。毛细管的外壁可以是一个或者多个融合在一起的壁。相似地,壁限定的腔是圆柱形,方形,六角形或者其它任何几何性状,只要可以形成保留液体或者样品的腔。毛细管阵列中的毛细管可以聚集在一起相互靠近来形成二维平面结构。毛细管可以通过融合(如,当毛细管由玻璃制造),胶粘,粘合,或者通过夹具并列式结合在一起。毛细管阵列可以由任何数量的毛细管构成,例如,范围从100到4,000,000个毛细管。毛细管阵列可以形成具有大约100,000或者更多单个毛细管结合在一起的微滴定板。
阵列,或者“生物芯片”
本发明的核酸或者多肽可以固定于或者应用于阵列。阵列可以根据它们结合于或者调节本发明核酸或者多肽的活性的能力来用于筛查或者监控组合物的文库(如,小分子,抗体,核酸等等)。例如,本发明的一个方面,监控参数是磷脂酶基因的转录表达。细胞的一个或者多个,或者所有的转录物可以通过含有细胞转录物的样品,或者,与细胞转录本互补或者代表细胞转录本的核酸进行杂交来测定,通过与在阵列,或者“生物芯片(biochip)”中固定的核酸杂交。通过应用在微芯片上的核酸的“阵列”,对细胞中一些或者所有的转录物可以同时进行定量。可选择地,含有基因组核酸的阵列也可以用于确定由本发明的方法制备的新的工程菌株的基因型。“多肽阵列”也可以用于同时定量多种蛋白质。
本发明可以用任何已知的“阵列”实践,“阵列”也称为“微阵列”或者“核酸阵列”或者“多肽阵列”或者“抗体阵列”或者“生物芯片”或者其变称。阵列一般是很多的“点”或者“靶成分”,每一个靶成分包括确定量的一个或者多个生物分子,如寡聚核苷酸,固定到底物表面的确定区域,用于特定结合样品分子如mRNA转录本。
在实践本发明的方法,任何已知的阵列和/或制备和使用阵列方法可以部分或者全部引入,或者其变通,如其所述,例如,在美国专利编号,6,277,628;6,277,489;6,261,776;6,258,606;6,054,270;6,048,695;6,045,996;6,022,963;6,013,440;5,965,452;5,959,098;5,856,174;5,830,645;5,770,456;5,632,957;5,556,752;5,143,854;5,807,522;5,800,992;5,744,305;5,700,637;5,556,752;5,434,049;也参见,如,WO 99/51773,WO 99/09217;WO 97/46313,WO 96/17958;也参见,如,Johnston(1998)Curr.Biol.8:R171-IRl74;Schummer(1997)Biotechniques23:1087-1092;Kern(1997)Biotechniques 23:120-124;Solinas-Toldo(1997)Genes,Chromosomes & Cancer 20:399~407;Bowtell(1999)Nature Genetics Supp21:25-32,也参见出版的美国专利申请编号20010018642;20010019827;20010016322;200100 14449;20010014448;20010012537;20010008765。
抗体和以抗体为基础的筛查方法
本发明提供了分离的或者重组可以特异结合本发明磷脂酶的抗体。这些抗体可以用于分离,确定或者定量本发明的磷脂酶或者相关的多肽。这些抗体可以用于抑制本发明酶的活性。这些抗体可以用于分离与那些方面相关的多肽,如,相关的磷脂酶。抗体可以用于免疫沉淀,染色(如,荧光激活细胞分类术(FACS)),免疫亲和柱,等等。如果需要,编码特异抗原的核酸序列可以通过免疫后分离多肽或者核酸而产生,扩增或者克隆,并且固定该多肽于本发明的阵列上。可选择的,本发明的方法可以用于待修饰细胞产生修饰的抗体的结构,如,抗体的亲和性可以增强或者降低。此外,制备或者修饰抗体的能力可以是一种表型通过本发明的方法引入到细胞中。
免疫,产生和分离抗体(多克隆和单克隆)的方法对于专业人士是已知的并且在科技和专利文献中有说明,参见,如,Coligan,CURRENT PROTOCOLS INIMMUNOLOGY,Wiley/Greene,NY(1991);Stites(eds.)BASIC AND CLINICALIMMUNOLOGY(7th ed.)Lange Medical Publications,Los Altos,CA(“Stites”),Goding,MONOCLONAL ANTIBODIES:PRINCIPLES AND PRACTICE(2d ed.)Academic Press,New York,NY(1986);Kohler(1975)Nature 256:495,Harlow(1988)ANTIBODIES,A LABORATORY MANUAL,Cold Spring HarborPublications,New York。抗体也可以在体外产生,如,应用重组抗体结合位点表达的噬菌体展示文库,除了在体内应用动物的传统方法。参见,如,Hoogenboom(1997)Trends Biotechnol.15:62-70,Katz(1997)Annu.Rev.Biophys.Biomol.Struct.26:27-45。
多肽可以用于产生可以特异结合本发明多肽的抗体。得到的抗体可以用于免疫亲和层析的方法来分离或者纯化多肽或者确定是否多肽存在于生物样品中。在这样的程序中,蛋白制备物,如一种提取物,或者生物样品与可以特异结合于本发明的其中一个多肽的抗体接触。
在免疫亲和程序中,抗体附着于固体支持物,如玻璃珠或者其它的柱子的基质。蛋白制备物置于本发明多肽中的一个与抗体特异结合的条件下与抗体接触。当洗涤去除非特异结合的蛋白,然后洗脱特异结合的多肽。
在生物样品中蛋白结合抗体的能力可以通过应用任何专业人士所熟知的不同程序来确定。例如,结合可以通过用可检测到的标记如荧光试剂,酶标,或者放射性同位素标记来确定结合。可选择地,抗体与样品的结合可以应用具有这样标记的第二抗体来检测。特定的分析包括酶联免疫吸附试验(ELISA)分析,夹心法分析,放射性免疫分析,以及Western印迹。
产生的针对本发明多肽的多克隆抗体可以通过直接注射该多肽至动物中而得到,或者将该多肽施用动物例如,非人类动物而得到。这样得到的抗体随后结合于该多肽。以这样的方式,可以应用编码多肽的仅仅一个片段的一个序列来产生可以结合整个天然多肽的抗体。这样的抗体随后可以用于从表达该多肽的细胞中分离多肽。
对于制备单克隆抗体,可以应用通过连续的细胞系的培养产生抗体的任何技术。例子包括杂交瘤技术,三系杂交瘤技术,人B-细胞杂交瘤技术,和非洲淋巴瘤病毒(EBV)杂交瘤技术(参见,如,Cole(1985)in Monoclonal Antibodiesand Cancer Therapy,Alan R.Liss,hic.,pp.77-96)。
可以采用生产单链抗体(参见,如,美国专利编号4,946,778)的技术用于产生对本发明多肽的单链抗体。可选择地,可以用转基因鼠来表达人源化的抗体到这些多肽或者其片段。
产生的针对本发明多肽的抗体可以从其它的生物体和样品中用于筛查类似的多肽。在这样的技术中,来自该生物体的多肽与该抗体接触,检测可以特异结合抗体的那些多肽。以上所述的任何程序可以用于检测抗体的结合。
试剂盒
本发明提供了包括以下成分的试剂盒,如,核酸,表达盒,载体,细胞,多肽(如磷脂酶)和/或本发明的抗体。该试剂盒也可以含有指导性材料来教授本发明的方法学和工业应用,正如在此所述。
本发明酶的工业和医学应用
本发明提供了很多本发明酶的工业应用和医学应用,如磷脂酶A,B,C,和D,包括转换非-水合的磷脂至水合形式,油脱胶,处理来自植物、鱼、藻类和类似物的油,仅仅指出了几种应用。在工业应用中应用磷脂酶的方法对于专业人员所熟知。例如,本发明的磷脂酶和方法可以用于处理如下所述的脂肪和油,如,在JP专利申请出版物H6-306386中,说明了转化存在于油和脂肪的磷脂至含有磷酸基团的水溶性物质。
本发明的磷脂酶可以用于处理植物油和磷脂,如那些来源于或者分离自,大豆,芸苔,棕榈,棉籽,玉米,棕榈仁,椰子,花生,芝麻,向日葵。本发明的磷脂酶可以用于处理精炼油,如,那些来自果籽的油,如,葡萄籽,杏核,琉璃苣等等。本发明的磷脂酶可以用于处理以不同形式存在的油和磷脂,包括粗制品形式,脱胶的,带有胶的,洗涤水,黏土,硅石,皂脚和类似物。本发明的磷脂酶可以用于处理高磷含量的油,鱼油,动物油,植物油,藻类油和类似物。本发明的任何方面,任何时候可以应用磷脂酶C,一种选择是包括应用本发明的磷脂酶D和磷酸酶(如,应用PLD/磷酸酶的组合来提高高磷含量油的产量,如大豆豆油)。
本发明的磷脂酶可以用于处理和制备食用油,生物柴油,用于药物学和化妆品的脂质体,结构磷脂和结构脂类。本发明的磷脂酶可以用于油的提取。
本发明的磷脂酶可以用于处理和制备各种肥皂。
苛性碱精炼
在本发明的典型过程中,应用磷脂酶作为苛性碱精练的辅助剂。更特定地,PLC或者PLD和磷酸酶用于滴加的过程,既可以在苛性碱中和的精练过程前,中,或者以后应用(既可以连续精炼也可以批量精练)。加入酶的量可以按照工艺来变化。用于本工艺的水的水平应当是低的,如大约0.5到5%。可选择地,通过多次加入苛性碱至工艺中。此外,该过程可以在不同的温度下(25℃到70℃),不同的酸或碱性条件下,并且在变化的pH值(4到12)下进行。可以用于苛性碱精炼过程的酸,但是并不限于,磷酸,柠檬酸,抗坏血酸,磺酸,反丁烯二酸,顺丁烯二酸,盐酸和/或乙酸。酸用于水合非水合的磷脂。可以应用的苛性碱包括,但不限于,KOH-和NaOH。苛性碱用于中和游离脂肪酸。可选择地,磷脂酶,或者更特定的PLC或者PLD和磷酸酶,用于从胶/皂脚中纯化植物固醇。
在苛性碱精练前加入磷脂酶的一个可选择的本发明的具体例子是在植物中表达磷脂酶。在另一个具体例子中,在压碎植物,种籽或者其它的植物部分期间加入磷脂酶。可选择地,在压碎后,但是在精练前(即是在容器中)加入磷脂酶。此外,在有酸和无酸的条件下,在精练前处理阶段加入磷脂酶。
本发明的另一个具体例子,已经进行了说明,是在苛性碱精练的过程加入磷脂酶。在这一过程,酸和苛性碱的水平依赖于磷的水平和游离脂肪酸的水平而变化。此外,广泛的温度和pH范围用于该过程,依赖于所应用酶的种类。
本发明的另一个具体例子中,磷脂酶在苛性碱精练后加入(图9)。在一种例子下,在分离前,磷脂酶加入到强力混合器或者滞留混合器。可选择地,磷脂酶在加热步骤后加入。在另一个具体例子下,磷脂酶在离心步骤中加入。在另一个具体例子中,磷脂酶加入到皂脚中。可选择地,磷脂酶加入到洗涤水中。在另一个例子中,磷脂酶在漂白和/或除臭步骤中加入。
油脱胶和植物油的处理过程
本发明的磷脂酶可以用于各种植物油处理步骤,如在植物油的提取,特别地,在去除“磷脂胶”的过程中,如以上所述称为“油脱胶”。本发明提供了方法用于处理不同来源的植物油,如大豆,油菜,花生和其它的果实,芝麻,向日葵,棕榈和玉米。该方法可以与用如己烷提取为基础的工艺联合,用于随后精练粗制油至可食用的油,包括使用本发明酶和方法。在精练过程中,第一步骤是所谓的“脱胶”过程,其作为通过加入水来分离磷脂。通过脱胶沉的物质被分离,并且进一步处理至卵磷脂混合物。商业上应用的卵磷脂,如大豆卵磷脂和向日葵卵磷脂,是半固体,或者是非常粘稠的物质。它们是由极性脂类,主要是磷脂,和油,主要是三甘油三酯,组成的混合物。
本发明的磷脂酶可以用于任何“脱胶”过程,包括水脱胶,ALCON油脱胶(如,大豆),safinco脱胶,“超脱胶”,UF脱胶,TOP脱胶,单脱胶,干法脱胶和ENZYMAXTM脱胶。参见,美国专利编号6,355,693;6,162,623;6,103,505;6,001,640;5,558,781;5,264,367。本发明应用的各种脱胶过程如在以下的文献上说明Bockisch,M.(1998)In Fats and Oils Handbook,The extraction of VegetableOils(Chapter 5),345~445,AOCS Press,Champaign,lllinois。本发明的磷脂酶可以用于甘油三酸酯油脱胶的酶法脱胶的工业应用,参见如,在EP 513 709所述。
本发明的磷脂酶可以用于酶法脱胶的工业应用,如下所述,如,在CA1102795,其说明了从谷物类脂类中通过加入至少50%的重量百分比的水分离极性脂类的方法。以其应用的原则是加入水到粗制油混合物的角度来看,该方法是经过改良的脱胶过程。
一方面,本发明提供了酶解过程,包括应用本发明磷脂酶如,PLC),包括水解在油中的水合磷脂,在温度20℃到40℃的条件下,在碱性pH,如pH大约为pH8到pH10,使用反应时间为大约3到10分钟。这可能导致在最终油中的磷水平少于10ppm。本发明也提供了酶解过程,包括应用本发明磷脂酶(如,PLC),包括在大约50℃到60℃的条件下,在pH值略低于中性,如大约pH5到pH6.5,应用的反应时间为大约30到60分钟的条件下,水解油中水合的和非水合的磷脂。这可以导致最终油中的磷水平少于10ppm。
一方面,本发明提供了酶解过程,利用磷脂酶C的酶水解甘油磷酸酯键,并且随后使得磷脂中的二酰甘油部分回收到油中的过程,如植物、鱼或者藻类的油(“磷脂酶C(PLC)苛性碱精练辅助剂”);并且,在脱胶过程中减少磷脂含量低至足够可以物理精练高磷的油(磷脂酶C(PLC)脱胶辅助剂”)。这两种方法能够产生不同价值并且具有不同目标的应用。
在本发明不同的典型过程中,很多不同的步骤组成了先于核心的漂白和除臭精练过程的脱胶过程。这些步骤包括,加热,混合,盛装,分离和干燥。在加热步骤以后,加入水,常常是酸,并且混合,以便使得不溶性的磷脂“胶”成团凝聚成可以被分离的颗粒。当在脱胶过程中,虽然用水分离很多磷脂,但是磷脂部分是以钙盐或者镁盐的形式存在的非-水合磷脂(NHPs)。脱胶过程通过加入酸处理这些NHPs。在磷脂水合以后,油被混合,盛装并且通过离心分离。最后,油干燥并且贮存,运输或者精练,如例示性说明,例如图6所述。得到的胶既可以进一步处理来提取卵磷脂产物,也可以加入到食物中。
在本发明不同的典型工艺中,磷的水平降到低至可以物理精练。与苛性碱精炼相比,分离步骤可以导致潜在的较高的产量损失。此外,脱胶过程可以产生不能以商业上的卵磷脂出售的废物,参见,如,图7是物理精炼油的典型脱胶过程。因此,这些过程并没有在市场达到显著的份额,并且苛性碱精炼过程继续在大豆、芸苔和向日葵的工业应用中占支配地位。注意,然而,用于特异脱胶过程的磷脂酶C的酶将降低胶的形成,并且回收磷脂中的甘油二酯部分到油中。
一方面,本发明的磷脂酶C的酶在甘油磷酸酯键上水解磷脂产生甘油二酯和水溶性的磷酸化合物。水解的磷脂进入到水相,而甘油二酯停留在油相,如在图8所说明的。PLC“苛性碱精炼辅助剂”的一个目的是在中和过程中转化形成的磷脂胶至二酰甘油,其又重新回到油相。相反地,“PLC脱胶助剂”的一个目的是在粗制油中降低磷脂至磷的当量少于百万分之十(10ppm)。
一方面,本发明的磷脂酶C的酶将在漂白和除臭前,水解存在于经过中和的粗制和脱胶的油中的水合和非水合磷脂中的磷脂。靶酶可以在现有的苛性碱中和过程中以点滴形式的产品应用,如在图9所示。在这一方面,如果酶是在加入苛性碱试剂之后加入,则并不需要该酶能够经得起极端的pH水平。
一方面,本发明的磷脂酶使得磷除至低到在物理精炼过程中可接受的水平。一方面,本发明的PLC将在漂白和除臭前,水解来自粗制油中水合的和非水合磷脂的磷脂。在目前的脱胶操作中,靶酶可以作为点滴形式的产品应用,参见,如图10。假如在商业设备中为亚最佳状态的混合,很可能需要酸来引起非水合的磷脂与酶在油/水的界面上与酶接触。因此,一方面,应用本发明的酸稳定的PLC。
一方面,本发明的PLC脱胶辅助剂的工艺可以减少一个或者所有三个的损失,范围参见表2。由于去除磷脂,与PLC过程相关的损失,以质量为基础,据估计为大约0.8%到5.2%。
表2:由PLC产品所致的损失
苛性碱精练辅助剂 脱胶辅助剂
胶形成和分离中的油损失2.1% X X
在加入苛性碱中皂化的油3.1% X
在漂白中存在于黏土中的油*<1.0% X X
总产量损失 ~5.2% ~2.1% ~5.2%
本发明该过程的另外的潜在的好处包括如下:
.减少的吸附剂—对较低水平(<5ppm)的磷,需要较少的吸附剂
.较低的化学剂的使用—与非水合磷脂的水合相关的较低的化学剂和工艺成本
.较低的废物产生—需要较少的水来从油中去除磷
通过本发明的方法处理(如“脱胶”)的油包括植物油种籽,如,大豆油,油菜籽油和向日葵油。一方面,本发明的“PLC苛性碱精炼辅助剂”可以比目前的苛性碱精炼过程节约1.2%。精炼辅助剂应用针对豆油,豆油已经脱胶卵磷脂,并且这些也从价值/负荷计算中去除。
本发明工艺的执行目标可以按照应用进行改变,并且对于酶加入的点更特异,参见表3。
表3应用的执行目标
苛性碱精炼辅助剂 脱胶辅助剂
输入油的磷水平 <200ppm* 600-1,400ppm
最终油的磷水平 <10ppm_ <10ppm_
水合和非水合的胶
滞留时间 3-10分钟 30分钟
液体配方
靶pH 8-10___ 5.0-5.5__
靶温度 20-40℃ ~50-60℃
水含量 <5% 1-1.25%
酶配方纯度 无脂酶/蛋白酶 无脂酶/蛋白酶
其它的主要的需要 去除Fe 去除Fe
*水脱胶油_在苛性碱中和步骤的上游达到的目标水平,但是必须保持_1-2小时,现有__酸脱胶需要在更酸性的条件下稳定的酶:对于5%的柠檬酸,pH是2.3(~RoehmUSPN 6,001,640)。___中和油的pH并不是中性的。在POS的测定中表明,pH将是在碱性范围6.5-10(2002年12月9日)。典型的pH范围需要确定。
其它工艺可以应用本发明磷脂酶,如,磷脂酶A1可以转化非水合的天然磷脂至水合的形式。一方面,该酶对热敏感。因为加热油可以破坏酶,这可能是所需要的。然而,脱胶反应必须调节pH值到4-5以及60℃来适应该酶。在300个单位/kg的油饱和剂量下,这一典型工艺的成功之处在于将以前的水-脱胶油的磷含量降至≤10ppm P。优点可以是减少的H2O含量,而且在应用、处理和废物中所导致的节约。表4列出了本发明酶的工业典型应用:
表4:典型应用
苛性碱精炼辅助剂 脱胶辅助剂
豆油/卵磷脂产生 X
化学精炼的豆油,向日葵油,芸苔油 X X
低磷脂油(如,棕榈) X
除了这些不同的“脱胶“工艺,本发明的磷脂酶可以用于任何植物油的处理步骤。例如,本发明的磷脂酶可以用于替代PLA,如,在任何植物油的处理步骤中的磷脂酶A2。用本发明的方法“处理”或者“脱胶”的油包括大豆油,油菜籽油,玉米油,来自棕榈仁的油,芸苔油,向日葵油,芝麻油,花生油,等等。该工艺的主要产物包括甘油三酯。
在一种典型的工艺中,当酶加入到粗制油,并且与粗制油反应,大约每1kg的粗制油所应用的磷脂酶的量是10到10,000个单位,或者,可选择地,大约100到2,000个单位。酶处理进行了5分钟到10个小时,在温度从30℃到90℃下,或者可选择地,在大约40℃到70℃下。条件可以依赖于酶的最适温度而变化。加入用于溶解酶的水的量,是每100重量份数的粗制油使用5-1,000重量份数,或者可选择地,大约每100重量份数的粗制油使用大约10到200重量份数。
在这样的酶处理过程完成后,酶的液体以合适的方式分离,如离心分离器,并且得到经处理的油。以这样的工艺通过酶分解胶状物所产生的含磷化合物实际上全部转移到水相,并且从油相中去除。酶处理完成后,如果需要,处理的油可以另外用水或者有机或者无机酸洗涤,如,乙酸,磷酸,琥珀酸,等等或者应用盐溶液。
对于超滤脱胶的一个典型过程,该酶结合于滤膜或者在过滤前向油中加入该酶或者周期地用酶来清洁滤膜。
在磷脂酶介导的物理精炼辅助剂的典型工艺中,加入水和酶到粗制油中。一方面,PLC或者PLD以及磷酸酶用于该工艺中。在磷脂酶介导的物理精炼中,水的水平可能低,即0.5-5%,并且处理时间应当短(少于2小时,或者少于60分钟,或者少于30分钟,或者少于15分钟,或者少于5分钟)。该工艺可以在不同的温度下进行(25℃到70℃),应用不同的酸和/或碱,在不同的pH下(如,3-10)。
在可选择的方面,水脱胶是首先通过离心收集卵磷脂,然后加入PLC或者PLC和PLA来去除非-水合的磷脂(该工艺应当在低的水浓度下进行)。另一方面,粗制油的水脱胶少至10ppm(可食用的油),并且随后进行物理精炼(对于生物柴油少于50ppm)。一方面,加入乳化剂和/或加入粗制油到强力混合器中来促进混合。可选择地,加入破乳剂和/或粗制油加热来促进水相的分离。另一方面,加入酸来促进非-水合磷脂的水合。另外地,磷脂酶可以用于调节从胶/皂脚中纯化植物固醇。
本发明的酶可以用于任何油处理的方法,如,脱胶或者与其等价的工艺。例如,本发明的酶可以用于以下专利所说明的工艺中,美国专利编号5,558,781;5,264,367;6,001,640。在USPN 5,558,781所说明的工艺中,应用磷脂酶A1,A2或者B,实际上使油中的卵磷脂分解,它作为乳化剂发挥作用。
本发明的酶和方法可以用在旨在减少在包括高含量非水合磷的食用油中的含磷组分的过程中,是通过应用本发明的磷脂酶,如,具有磷脂酶A和/或B的活性的多肽,如所述,例如,在EP专利编号:EP 0869167中。一方面,食用油是粗制油,是一种所谓的“非-脱胶油”。一方面,处理非-脱胶油的方法,包括压型油或者提取油,或者其混合物,来自,如,油菜籽,大豆,芝麻,花生,玉米,或者向日葵。在粗制油中,磷脂含量可以从0.5到3%w/w进行变化,对应于磷含量的范围为200到1200ppm之间,或者在250到1200ppm之间的范围变化。除了磷脂,粗制油也可以含有小浓度的糖类,糖化合物,和Ca,Mg和Fe的金属/磷脂酸复合物。一方面,工艺包括用本发明的磷脂酶处理磷脂或者溶血磷脂,以便水解脂肪酰基基团。一方面,磷脂或者溶血磷脂包括卵磷脂或者溶血卵磷脂。本工艺的一方面,食用油具有的磷含量为在大约50到250ppm之间,而且该工艺含有用本发明的酶处理油,以便水解磷脂的主要部分,并且分离含有从油中水解的磷脂的水相。一方面,先于酶法脱胶过程,油是水脱胶的。一方面,该方法提供了用于生产动物饲料,该生产包括混合本发明磷脂酶和饲料物质以及至少一种磷脂。
本发明的酶和方法可以用于油脱胶过程,正如在WO 98/18912所说明的。本发明的磷脂酶可以降低食用油中的磷脂含量。该工艺可以包括用本发明的磷脂酶处理油,来水解磷脂的主要部分,并且分离含有从油中水解的磷脂的水相。该工艺可以用于纯化任何含有磷脂的食用油,如,植物油,例如,大豆油,油菜籽油和向日葵油,鱼油,藻类油和动物油和类似物。在用酶处理以前,植物油优选地进行预处理,来去除残渣(胶状物),如,通过湿法精炼。该油可以含有50-250ppm的磷,磷以在磷脂酶处理起始之时的磷脂形式存在,并且本发明的工艺可以降低该值到低于5-10ppm。
本发明的酶可以用于如JP申请编号H5-132283,于1993年4月25日归档所述的工艺,其含有纯化油和脂肪的工艺,包括转化在油和脂肪中的磷脂至水溶性的含有磷酸基团的物质的步骤,并且作为水溶性物质去除它们的步骤。酶的作用用于转化至水溶性物质。具有磷脂酶C活性的酶优选地以酶形式使用。
本发明的酶可以用于如“Organic Refining Process,”(ORP)(IPH,Omaha,NE)所述的工艺,其是精炼种籽油的一种方法。ORP可能具有优于传统化学精炼的优点,包括提高精炼油的产量,增值的副产品,降低的资本成本和较低的环境成本。
本发明的酶可以用于如下工艺,处理油或者脂肪,动物或者植物,未加工的、半加工的或者精炼的,包括将本发明的至少一种酶加入到这样的油或者脂肪中,该酶允许水解和/或解聚在油中含有的非-甘油酯化合物,正如所述,例如,EP申请编号:82870032.8所述。本发明用于水解和/或解聚在油中含有的非-甘油酯化合物的典型方法为:
1)在油和脂肪中,加入和混合本发明的酶或者以前溶解于少量合适溶剂(例如,水)中的酶复合物。一定数目的溶剂是可能的,但是选择非毒性和适合该酶的溶剂。这一加入过程可以在逐次加入的方法中实现,也可以在连续方法中实现。按照该工艺,加入油和脂肪中的必要的酶量的范围依赖于酶以及待处理的产物,范围从20到400ppm,即对于1000kg的油或者脂肪从0.02kg到0.4kg的酶,并且优选的从20到100ppm,即是对于1000kg的油或者脂肪从0.02kg到0.1kg的酶,认为这些值是对于浓缩酶而言,即是没有稀释剂或者溶剂的。
2)油或者脂肪通过固定于固体或者半固体支持物上的本发明酶的固定化或者不溶性过滤床,支持物优选的是表现多孔的或者纤维性结构。在这一技术中,酶置于多孔或者纤维结构支持物的微孔中。这些由例如,树脂或者合成的多聚物,羧酸纤维素,凝胶如琼脂糖,具有多孔结构的多聚物或者共聚物的丝构成,在它们的微孔中收集有处于溶液中的这些酶的小液滴。关于酶的浓度,有可能达到支持物的饱和水平。
3)以细小的液滴形式,在酶的稀释溶液中,分散油和脂肪,优选的含有0.2到4%体积百分比的本发明的酶。这一技术在以下有说明,比如比利时专利编号595,219。几米高的圆柱形柱子,具有圆锥形的盖子,其中填充了稀释的酶溶液。对于这一用途,在待处理的油或者脂肪中所用的溶剂应该予以选择,是非毒性和不可溶混的,优选地选择水。柱子的底部装配了分配系统,其中的油或者脂肪以极端分割的形式(每m2大约10,000通量)连续注入。这样形成无限数目的油或者脂肪的液滴,该液滴在酶溶液中缓慢地上并且与表面接触,并且在反应器的圆锥形盖子的顶部被连续排出。
棕榈油可以在用本发明酶处理前进行预处理。例如,将大约30kg的生的棕榈油加热到+50℃。在蒸馏水中制备具有1%纤维素酶和果胶酶的溶液。将这些溶液中的每一个以600g加入到经过强烈搅拌几分钟的油的水相溶液中。然后,在中度搅拌的条件下,油保持在+50℃,总的反应时间是两个小时。然后,温度升高到+90℃,来使酶失活,制备用于过滤和进一步处理的混合物。油在真空中干燥,并且使用过滤辅助剂进行过滤。
本发明的酶可以用在如EP专利EP 0 513 709 B2所述的工艺中。例如,本发明提供了用于减少该内含物作用的工艺,用于通过应用本发明的磷脂酶的酶法分解作用来减少在动物和植物油中含磷组分的含量。将具有含磷量50到250ppm的预先除去粘液的动物和植物油与有机羧酸混合搅拌,并且将所得到的混合物的pH值设定为pH 4到pH 6,含有本发明的磷脂酶A1,A2或者B的酶溶液被加入到该混合物中,在混合容器中,通过强力搅拌,形成细小的液滴,在其中形成相对于油的重量百分比为0.5到5%的乳状液,所述的乳化作用的进行通过至少一个后续的反应容器,在涡旋运动下,在反应时间为从0.1到10个小时下,在温度的范围为20℃到80℃下进行,当处理的油从水合溶液中分离后,油中具有的磷含量在5ppm以下。
有机精炼工艺可以用于粗制油和脱胶油。该过程在控制的工艺条件下,应用线上方式加入有机酸,并与传统的离心分离相结合。自然分离自植物油磷脂(“VOP”)的水再循环,并再次使用。有机精炼工艺的结果为总的水用量实际上降低了。
本发明的磷脂酶和方法也可以用于酶处理食用油,正如在以下的专利中所述,如,美国专利编号6,162,623.。在这一典型的方法中,本发明提供了两亲性的酶。该酶可以固定化,如,通过制备含有连续疏水相以及含有酶以及酶载剂的分散水相的乳状液,并且从分散相中去除水,直到该相变成固体酶包被的颗粒。该酶可以是一种脂酶,固定的脂酶可以用于由脂酶催化的反应,如单酸-,二酸-或者三酸甘油酯的分子内酯化作用,或者当脂酶是磷脂酶时,从甘油三酯油去除磷脂。水相可以含有发酵液,可食用的甘油三酯油可以是疏水相,并且载剂包括糖类,淀粉,葡聚糖,水溶性纤维素衍生物和发酵残余物。这一典型的方法可以用于处理甘油三酯,甘油二酯,单酸甘油酯,甘油,磷脂或脂肪酸,其可以存在于疏水相中。一方面,用于去除甘油三酯油中的磷脂的工艺包括,混合含有磷脂的甘油三酯油与含有本发明磷脂酶的制备物;水解磷脂至溶血磷脂;从油中分离水解的磷脂,其中的磷脂酶是固定化磷脂酶。
本发明的磷脂酶和方法也可以应用于用酶法处理食用油,如在以下专利所说明的,如在美国专利编号6,127,137所述。这一典型方法水解完整磷脂的两个脂酰基团。用于该方法的本发明的磷脂酶没有脂酶活性,并且其在很低的pH下具有活性。这些特征很适于油脱胶,由于油的酶法和碱法水解(皂化作用)可能均受到抑制。一方面,本发明提供水解磷脂或者溶血磷脂中的脂酰基团的工艺,包括用水解磷脂中的两个脂酰基团的磷脂酶处理磷脂或者溶血磷脂,并且本质上是没有脂酶活性的。一方面,本发明的磷脂酶具有的最佳作用温度为大约50℃,测定的条件是在pH 3到pH 4下处理10分钟,并且最佳pH温度为大约pH 3,测定的条件是在40℃下进行10分钟。一方面,磷脂或者溶血磷脂包括卵磷脂,或者溶血卵磷脂。一方面,在磷脂的大部分水解后,含有经水解的磷脂的水相被从油中分离。一方面,本发明提供了工艺,用于从食用油中去除磷脂,包括在pH 1.5到pH 3下处理油,处理是用本发明磷脂酶的水溶液的分散体,并且从油中分离含有水解的磷脂的水相。一方面,在用磷脂酶处理前,处理油来去除粘胶。一方面,在用磷脂酶处理前,该油含有磷脂,其量对应于50到250ppm的磷。一方面,在存在0.5到5%的水中,在30℃到45℃下,用磷脂酶处理1到12个小时,磷脂酶的剂量为0.1到10mg/l。
本发明的磷脂酶和方法也可以用于用酶解处理食用油,如在以下专利所述,如,美国专利编号6,025,171。在这一典型的方法中,本发明的酶是固定化的,通过制备含有连续疏水相的乳状液,如甘油三酯,和含有两亲性酶的分散水相,如本发明的脂酶或者磷脂酶,和在水相中部分溶解和部分不溶解的载剂物质,并且从水相中去除水,一直到该相变为固体酶包被的载剂颗粒。因为水相已经用水溶性物质饱和了,载剂物质的非溶解部分可以是在水中和油中不溶的物质,或者一种以不溶解形式存在的水溶性物质。水相可以与含有发酵残留物和生物物质的粗制脂酶发酵液形成,它们可以作为载剂物质。固定的脂酶可以用于油中的酯重排和脱酸化。反应后,固定的酶可以通过加入水再生,用于以后的反应,并且得到载剂的部分溶解,且所形成的含有酶和载剂的水相分散到疏水相中,通过该疏水相蒸发除水,又一次形成包被载剂颗粒的酶。
本发明的磷脂酶和方法也可以用酶解处理食用油,如在以下专利所述,如,美国专利编号6,143,545。该典型方法应用本发明的磷脂酶降低在食用油中所含有组分的磷含量,该食用油中包括高含量的非-水合磷。一方面,该方法用于降低食用油中的含磷组分的含量,油中含有非-水合磷的含量为至少50ppm,在食用油处理前,在60℃下测定,通过加入含有柠檬酸单水合物的水溶液(加入水对油为4.8%w/w;在水相中的(柠檬酸)=106mM,在水/油乳剂=4.6mM)维持30分钟;转移10ml的、在油乳状液中的预处理水至试管中;在沸水浴中加热乳状液30分钟;在5000rpm离心10分钟,转移大约8ml的上层(油)相至新的试管中,并且放置24小时;从上清相中取2克,用于测定在食用油中的非-水合磷的含量(ppm)。该方法也可以包括在一个pH之下,从大约pH 5到8的条件下,让油接触本发明的磷脂酶A或者B的水溶液(如,PLA1,PLA2,或者PLB),该溶液在油中进行乳化,直到含磷量下降到小于11ppm。然后从处理的油中分离含水相。
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在美国专利编号5,532,163所述。本发明提供精炼油和脂肪的过程,其中油和脂肪中的待处理磷脂可以被有效地分解和去除。一方面,本发明提供精炼油和脂肪的过程,包括,在乳状液中,使油和脂肪与本发明的酶反应,例如,具有分解甘油磷脂中甘油-脂肪酸酯键的活性的酶反应(如,本发明的PLA2);并且另一个工艺,其中用酶处理的油和脂肪被用水或者酸性水溶液洗涤。一方面,用于洗涤步骤的酸性水溶液是至少一种酸的溶液,如,柠檬酸,乙酸,磷酸以及它们的盐。一方面,乳化情形是在每100重量份数的油和脂肪应用30重量份数或者更多的水的情况下形成的。因为油和脂肪可以不用传统的碱法精炼步骤来纯化,所以所产生的洗涤废水和工业废物则可以降低。此外,由于归因于它们被包括在这些废物中所致的天然油和脂肪的损失并不在本发明的工艺中发生,所以油的回收产量增加。一方面,本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的过程,包括:以乳化的状态,将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸的酯键活性的本发明的酶进行反应。一方面,本发明提供了用于精炼含有大约100到10,000ppm的磷脂的油和脂肪的过程,包括:以乳化的状态,将所述的油和脂肪与具有分解甘油磷脂中的甘油-脂肪酸的酯键活性的本发明的酶反应;并且随后用洗涤水清洗处理的油和脂肪。
本发明的磷脂酶和方法也可以用于酶法处理食用油,如在以下所述,例如,在美国专利编号5,264,367。含磷成分的含量以及可食用植物油或者动物油的铁含量,如油,例如大豆油,其已经通过湿法精炼去除了胶状物,通过让该油接触本发明的酶,如,磷脂酶A1,A2,或者B的水溶液,可以被酶法分解来降低,然后从处理的油中分离水相。一方面,本发明提供了一种酶解方法,用于降低油中的含磷组分的含量以及降低油含铁组分的含量,该油已经进行了精炼,去除了胶状物。已经进行精炼去除了胶状物的油,可以用本发明的酶处理,如磷脂酶C,A1,A2或者B。可以达到的磷含量低于5ppm,铁含量低于1ppm。低的铁含量可以有助于油的稳定性。
本发明的磷脂酶和方法也可以用于制备酯交换的油,如在美国专利编号5,288,619所说明的。本发明提供了酶法酯交换的方法,用于制备具有低的反式酸和低的中间物链脂肪酸含量的人造黄油。该方法包括以下步骤,提供含有硬脂酸来源的材料的和可食用的液体植物油的酯交换反应混合物,应用1-,3-位置特异性的脂酶的酯交换硬脂酸来源的物质和植物油,然后,最后氢化脂肪酸混合物,来提供再循环的硬脂酸来源的物质,用于与植物油的再循环反应。本发明也提供了制备酯交换油的逆流方法。该方法包括下述步骤,提供含有1-,3-位置特异性的脂酶的酯交换反应区域,引入植物油至酯交换区域,引入硬脂酸来源物质,操作超临界气体或者亚临界液化气体逆流流体,在反应区域中进行甘油三酯流与硬脂酸或者硬脂酸单酯流的酯交换反应,撤掉酯交换的甘油三酯人造黄油流,撤掉逆流流体相,氢化酯交换的硬脂酸或者硬脂酸单酯来提供氢化的再循环硬脂酸来源物质,并且引入氢化的再循环硬脂酸源物质进入到反应区域。
一方面,高度非饱和的磷脂化合物可以通过适当地应用本发明的磷脂酶C转变为甘油三酯,从而去除sn-3(顺序号-3)位置的磷酸基团,随后进行1,3脂酶酰基酯的合成。2-取代的磷脂可以直接用于功能性食物成分,或者可以随后选择性地进行水解,是应用本发明的固定化磷脂酶C在反应器160中进行水解,以便产生1-甘油二酯,随后通过如在此说明的酶促酯化反应来产生具有2-取代的多聚非饱和脂肪酸组分的甘油三酯产物。
本发明的磷脂酶和方法也可以用于植物油的酶法脱胶过程,如在以下的专利中所说明,如,美国专利编号6,001,640。本发明的该方法包括,一个在食用油的生产中的脱胶步骤。来自植物油的可水合磷脂通过先前的水相脱胶过程已经被去除,用本发明的磷脂酶进行酶法处理使植物油不含有非-水合磷脂。该工艺可以是温和的,经济的并且对环境无不良影响。仅仅水解溶血卵磷脂而不水解卵磷脂的磷脂酶用于该脱胶过程。
一方面,为了允许本发明的酶作用在两个相中,含有酶的油相和水相,必须进行密切地混合。仅仅搅拌它们是不够的。如果其溶解于少量的水中,如0.5-5%重量百分比(相对于油),酶在油中的良好分散是有助的,并且以这一形式在油中进行乳化,从而形成少于10微米直径的液滴(平均重量)。液滴可以小于1微米。以径向速率超过100cm/秒进行强烈搅拌。应用外部旋转泵,该油也可以在反应器中循环。含有酶的水相也可以通过超声作用来进行精细分散。可以应用分散仪器。
酶反应很可能发生在油相和水相之间的边界表面上,所有这些混合措施的目标在于,使含有酶的水相产生最大可能的表面积。加入表面活性剂增加了水相的微分散。在一些情况下,所以,HLB值高于9的表面活性剂,如,十二烷基硫酸钠加入到酶溶液中,如在EP-A 0 513 709中所说明的。增加乳化作用的类似有效的方法是加入溶血卵磷脂。加入量的范围相对于油在0.001%到1%之间。酶进行作用的温度并不重要。可以应用的温度条件在20℃到80℃之间,但是后者只能作用很短的时间。一方面,应用具有好的温度和/或低pH值耐受性的本发明的磷脂酶。最佳的应用温度在30℃到50℃之间。处理的时期依赖于酶,并且在增高温度时,时间变短。时间从0.1到10小时,或者从1到5小时一般就足够了。反应发生在脱胶反应器中,其可以划分为几个阶段,如在DE-A 43 39 556中所说明的。从而连续操作是可能的,间歇操作也是可能的。反应可以在不同的温度阶段下进行。例如,温育可以在40℃下进行3小时,然后在60℃下进行1小时。如果反应按照阶段进行,这也同时产生了在各个阶段调节不同的pH值的可能性。例如,通过加入柠檬酸溶液,在第一阶段的溶液pH值可以调节到7,例如,在第二阶段将pH值调节到2.5。然而,在至少一个阶段,酶溶液的pH值必须低于4或者低于3。如果pH值随后调节到低于这一水平,可能会引发效果的衰退。从而,柠檬酸可以被加入至酶溶液中,可以在后者被混合到油中之前。
在酶处理完成以后,酶溶液,与在其中含有NHP的分解产物一起,可以从油相中间歇或者连续地分离,如,通过离心的方式。由于酶具有高水平的稳定性的特征,并且包含在溶液中的分解产物的量较少(它们可能沉淀为污泥),同样存在于水相中的酶可以重复应用几次。也有可能从污泥中释放出酶,参见,如,DE-A43 39 556,因此基本上没有污泥的的酶溶液可以被再次使用。在这一脱胶工艺的一个方面中,得到的油含有少于15ppm的磷。一个目标是磷含量少于10ppm;或者少于5ppm。在磷含量低于10ppm的情况下,按照蒸馏脱酸工艺进一步处理油是十分可能的。很多其它的离子,如镁,钙,锌以及铁,可以从油中去除,如低于0.1ppm。这样,该产品具有理想的先决条件,用于在进一步的处理和储存中具有好的氧化耐受性。
本发明的磷脂酶和方法也可以用于在植物油和动物油中降低含磷组分的量,如在EP专利的EP 05 13709中所述。在这一方法中,含磷组分的含量,尤其是磷脂,如卵磷脂,以及植物和动物油中铁的含量,其以前经过了脱泥处理,如大豆油,通过应用本发明的磷脂酶A1,A2或者B的酶降解作用而被降低。
本发明的磷脂酶和方法也可以用于精炼脂肪或者油,如在JP 06306386所说明的。本发明提供了工艺用于精炼脂肪或者油,包括转化在脂肪或者油中的磷脂至水溶性的含磷基团物质的步骤,并且除去该物质的步骤。本发明酶的作用(如,PLC)用于转化磷脂至这种物质。这样,有可能精炼脂肪或者油而不进行碱精炼步骤,该步骤产生含有碱性废水和大量油的工业废物。由于中性脂肪或者油逃逸到废物中的损失可以降低到零,所以可以实现产量的增加。一方面,胶状物质转化成水溶性物质,并且通过在粗制油的脱胶过程中加入本发明的具有磷脂酶C活性的酶,然后进行酶处理过程,而以水溶性物质被去除。一方面,本发明的磷脂酶C具有切割存在于磷脂中的甘油和磷酸的酯键的活性。如果需要,该方法可以包括用水或者酸性水溶液洗涤经过酶处理的油。一方面,本发明的酶被加入,并且与粗制油反应。每公斤粗制油,所用磷脂酶C的量可以是10到10,000单位,或者大约100到2,000单位。
本发明的磷脂酶和方法也可以用于水脱胶过程,如,在Dijkstra,Albert J.,et al.,,Oleagineux,Corps Gras,Lipides(1998),5(5),367-370中。在这一典型的方法中,水脱胶过程是用于产生卵磷脂,并且用于使用脱胶酸和漂白土的干脱胶过程。这一方法可能仅仅对于低磷脂含量的油是经济可行的,如,棕榈油,月桂油,等等。对于具有高NHP含量的种籽油,应用酸精炼过程,其中该过程在榨油机中进行,以便使得胶清除经由油饼粉进行。一方面,该酸精炼油可以是在先于物理精炼之前所进行的一个可能的“润饰”操作。
本发明的磷脂酶和方法也可以用于脱胶过程,如在Dijkstra,et al.,Res.Dev.Dep.,N.V.Vandemoortele Coord.Cent.,Izegem,Belg.JAOCS,J.Am.Oil Chem.Soc.(1989),66:1002-1009中。在这一典型的方法中,总的脱胶过程包括分散酸至大豆油中,如磷酸或者柠檬酸,允许一定的接触时间,并且随后混合一种碱至油中酸乳状液中,碱如苛性钠或者硅酸钠。这可以保持中和水平低至足够避免形成肥皂,因为这将导致油损失的增加。随后,油进入到离心分离器,在此,大多数胶状物从油流中去除,产生具有最少油含量的胶状物相。油流随后进入到第二离心分离器中,去除所有的残留胶,得到稀释的胶相,其进行再循环。洗涤和干燥或者线上碱法精炼完成这一过程。在采用全部的脱胶工艺以后,与传统的碱法精炼工艺比较,实现了总产量增加大约0.5%。完全脱胶的油可以随后被碱精炼,漂白和除臭,或者被漂白和物理精炼。
本发明的磷脂酶和方法也可以用于去除来自植物油中的非水合磷脂,如大豆油,如在Hvolby,et al.,Sojakagefabr.,Copeuliagen,Den.,J.Amer.Oil Chem.Soc.(1971)48:503-509中所说明的。在这一典型的方法中,水脱胶的油,在不同的固定pH值下,与含有和不含有Ca++,Mg/Ca结合试剂的缓冲液,以及表面活性剂混合。非水合的磷脂可以以未转化状态作为微胶粒或者混合乳化剂的一个组分而去除。更进一步,非水合磷脂可以通过转化为分离形式而去除,例如通过从磷脂中去除Mg和Ca,该一过程可以通过酸化或者通过用Mg/Ca络合或者Mg/Ca沉淀试剂的处理来完成。非水合磷脂的去除或者化学转化可能导致乳状液形成的降低和来自乳状液层和皂脚中的脱酸化油的分离增加。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Buchold,et al.,Frankfurt/Main,Germany.Fett Wissenschaft Technologie(1993),95(8),300-304中所述。在本发明的这一典型用于食用植物油脱胶的工艺中,用本发明酶的水悬浮液,如,磷脂酶A2,来水解在磷脂sn2位(顺序编号2位)上结合的脂肪酸,得到不溶于油中的1-酰基-溶血磷脂,并且因此更易于物理分离。甚至加入少量的相当于大约700 lecitase(一种新型卵磷脂酶)单位/公斤油,得到的残留磷浓度少于10ppm,这样化学精炼是可以用物理精炼替代的,省略了中和、皂脚破裂、和废水处理的必要性。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如EnzyMax.Dahlke,Klaus.Dept.G-PDO,Lurgi O1-Gas,Chemie,GmbH,Frankfurt,Germany.Oleagineux,CorpsGras,Lipides(1997),4(1),55-57。该典型过程是一个用于物理精炼几乎任何种类油的脱胶过程。通过酶-催化的水解,磷脂转化为水溶性的溶血磷脂,其可以通过离心从油中分离。在酶法脱胶的油中,残留的磷含量可以低至2ppm P。
本发明的磷脂酶和方法也可以用于植物油的脱胶,如在Cleenewerck,et al.,N.V.Vamo Mills,Izegem,Belg.Fett Wissenschaft Technologie(1992),94:317-22,和Clausen,Kim;Nielsen,Munk.Novozymes A/S,Den.Dansk Kemi(2002)83(2):24-27。本发明的磷脂酶和方法可以合并已经描述的用酸对植物油进行前精炼过程,如,在Nilsson-Johansson,et al.,Fats Oils Div.,Alfa-Laval Food Eng.AB,Tumba,Swed.Fett Wissenschaft Technologie(1988),90(11),447-51,以及,Munch,Ernst W.Cereol Deutschland GmbH,Mannheim,Germany.Editor(s):Wilson,Richard F.Proceedings of the World Conference on Oilseed Processing Utilization,Cancun,Mexico,Nov.12-17,2000(2001),Meeting Date2000,17-20。
本发明的磷脂酶和方法也可以用于植物油中的脱胶,如在Jerzewska,et al.,Inst.Przemyslu Miesnego i Tluszczowego,Warsaw,Pol.,Tluszcze Jadalne(2001),36(3/4),97-110中。在本发明的这一工艺中,水合的低-芥酸油菜籽油的酶法脱胶是通过应用本发明的磷脂酶A2。该酶可以催化磷脂中甘油部分的中心碳原子连接脂肪酸酯键的水解。它也可以水解非-水合的磷脂至它们相对应的水合的溶血化合物。使用非纯化的酶制备物,加入2%的制备物作用4小时,可以得到更好的结果(87%P去除率)。
从植物油中纯化植物固醇
本发明提供了方法,用于从植物油中纯化植物固醇和三萜,或者植物甾醇。应用本发明的磷脂酶和方法可以纯化的植物固醇,包括β-谷固醇,菜子甾醇,豆甾醇,豆甾烷醇,β-谷甾烷醇,谷甾烷醇,24-脱氢胆固醇,海绵甾醇,海棉动物甾醇,γ-谷甾醇和芜青甾醇。植物固醇是重要的用于健康和营养工业的农产品。这样,本发明的磷脂酶和方法可用于制备用于化妆品制造商的乳化剂以及用于生产激素药物的甾体中间物和前体。本发明的磷脂酶和方法用于制备(如,纯化)植物固醇和它们的酯的类似物,用于作为具有心血管健康价值的降低胆固醇试剂。本发明的磷脂酶和方法用于纯化植物甾醇,植物甾醇通过抑制在消化道中的胆固醇吸收,来降低血清中的胆固醇水平。本发明的磷脂酶和方法用于纯化具有在极低的浓度下、有免疫调节特征的植物甾醇,包括增强的T淋巴细胞的细胞应答和天然杀伤细胞对癌细胞系的细胞毒性活性。本发明的磷脂酶和方法用于纯化植物甾醇用于治疗肺结核,类风湿性关节炎,HIV-感染病人的处理和免疫应力的抑制,例如,在马拉松选手中。
本发明的磷脂酶和方法用于纯化存在于商品植物油的甾醇部分中的甾醇组分(如,椰子,芸苔,可可豆脂油,玉米,棉籽,亚麻,橄榄,棕榈,花生,稻糠,红花,芝麻,大豆,向日葵油),如,谷固醇(40.2-92.3%),菜油甾醇(2.6-38.6%),豆甾醇(0-31%)和5-燕麦固醇(1.5-29%)。
本发明的方法可以合并植物来源固醇的分离,是通过用氯仿-甲醇,己烷,二氯甲烷,或者丙酮,从油料种籽中进行溶剂抽提,抽提后,进行皂化作用和层析法纯化,以便得到富集的总甾醇。可选择地,植物样品可以通过应用超临界二氧化碳的超临界流体提取过程,提取得到总的脂类提取物,从中可以富集和分离甾醇。对于甾醇化合物的随后定性和定量,粗制油的分离物可以通过很多不同的色谱技术纯化和分离,包括柱层析(CC),气相色谱,薄层色谱(TLC),正相高效液相色谱(HPLC),反相高效液相色谱和毛细管电色谱。在所有的色谱分离和分选技术中,对于样品清理,纯化,定性分析和测试样品中固醇的初步估计而言,CC和TCL程序的应用是最容易进行的,是可以负担的和适当的。
在可食用油的精炼过程中,植物油中的植物固醇被丢失,是以副产物的形式丢失的。本发明的磷脂酶和方法应用从这样的副产物中分离的植物固醇,来制备从这样的副产物中分离富集植物固醇的产物。本发明的植物固醇的分离和纯化方法可以与油的处理工艺中的工业副产物合并,并且可以包括如分子蒸馏,液-液提取和结晶的操作。
本发明的方法可以与抽提液体来提取植物固醇的工艺合并。例如,本发明的方法可以应用非极性溶剂如己烷(一般用于植物油的大部分种类的提取中),定量地提取游离的植物固醇和植物固醇酰基脂肪酸酯。固醇糖苷和脂肪酰化固醇糖苷仅仅是用己烷提取的部分产物,并且溶剂增强的极性产生了更高百分比的抽提。可以应用的一个程序是Bligh和Dyer的氯仿-甲醇方法,用于提取所有的固醇脂类,包括磷脂。一个定性分离和定量分析的植物固醇脂类的典型方法包括注射脂类提取物至HPLC系统。
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如在美国专利编号6,303,803所说明。这是降低含有固醇的脂肪和油中的固醇含量的方法。其是基于胆固醇和其它甾醇对于形成疏水流体双层,如磷脂双分子层的两性分子的亲和性,所以是一个高效和成本效率的过程。磷脂的聚集体与,例如含有甾醇的脂肪或者油在水相环境下接触,随后进行混合。聚集的磷脂混合物的分子结构具有对胆固醇和其它甾醇的高亲和性,可以从脂肪和油中选择性地去除这样的分子。水相分离混合物混合足够长的时间,以便通过分配甾醇到磷脂聚集体部分中,从而选择性地降低脂肪/油产物中的甾醇含量。甾醇降低的脂肪或者油被从水相分离混合物中分离。可选择地,相应的富集甾醇的部分也可以被从水相分离混合物中分离。这些步骤可以在室温下进行,涉及加热的成本被减少,同样地,产物可能因为热而降解也被减少。另外,需要最少量的设备,并且所有需要的物质是食品级的,该方法不需要在操作、废物处理、或者最终产物的污染方面有特别预防措施。
本发明的磷脂酶和方法可以用于从脂肪和油中去除甾醇,如,在美国专利编号5,880,300所说明的。磷脂聚集物与,如含有甾醇的脂肪或者油在水相环境中接触,然后进行混合。在充分混合后,降甾醇得以降低的脂肪或者油从水相分离混合物中分离。可选择地,相应的甾醇富集的磷脂也可以从水相分离混合物中分离。植物(如蔬菜)油含有植物甾醇(植物固醇),它们也可以应用本发明的方法去除。该方法可以用于商业处理循环的任何阶段的脂肪/油产品。例如,本发明的工艺可以用于精炼,漂白和除臭油(“RBD油”),或者在达到RBD状态之前的加工过程的任何阶段。与前RBD油相比,尽管RBD油可以具有改变的密度,本过程易于改变而适合于RBD也适合前RBD油,或者适应于各种非脂肪/油产品,是通过改变磷脂含量,磷脂组成,磷脂:水的比例,温度,压力,混合条件,和以下所述的分离条件而适应的。
可选择地,本发明的酶和方法可以用于分离处于油加工中的中间步骤中的植物甾醇或者其它甾醇。例如,已知在植物油的除臭中丢失植物甾醇。含有甾醇的蒸馏部分,例如,来自处理的中间体阶段,可以进行以上说明的甾醇抽提程序。这提供了富含甾醇的卵磷脂或者其它的磷脂物质,其可以进一步处理以便回收抽提的甾醇。
去污剂的组合物
本发明提供了去污剂组合物,包括一种或者多种本发明的磷脂酶,并且提供了制备和使用这些组合物的方法。本发明整合了所有制备和使用去污剂组合物的方法,参见,如,美国专利编号6,413,928;6,399,561;6,365,561;6,380,147。去污剂组合物可以是一个和两个部分的水相组合物,非水相液体组合物,铸塑固体,粒形形式,微粒形式,压缩片剂,凝胶和/或糊状物以及浆状形式。本发明也提供应用这些去污剂组合物的方法,可以快速去除粗大的食物脏物,食物残留物的薄膜和其它次要的食物组合物。本发明的磷脂酶可以提供磷脂的催化水解,利于去除污点。本发明的磷脂酶可以用在洗碗盘的去污剂和纺织品洗涤去污剂中。
实际的活性酶含量依赖于去污剂组合物的制造方法,并且并不是决定性的,假定去污剂溶液具有所需的酶促活性。一方面,存在于最终溶液的磷脂酶的量的范围为,在每克去污剂组合物中,从大约0.001mg到0.5mg。选择用于该过程的本发明的特定酶以及产品,依赖于最终的实用条件,包括物理产品形式,应用pH,应用温度,和待降解或者改变的污物类型。对于任何已知的一套应用条件,可以选择该酶,以便提供最佳的活性和稳定性。一方面,本发明的多肽在pH范围从大约4到大约12之间,温度范围为大约20℃到大约95℃有活性。本发明的去污剂可以包括阳离子,半极性非离子的或者兼性离子表面活性剂;或者其混合物。
本发明的磷脂酶可以将配方制成粉末的和具有pH值在4.0到12.0之间的液体去污剂,以重量百分比计算,含量水平为大约0.01到大约5%(优选地0.1%到0.5%)。这些去污剂组合物也可以包括其它的酶如已知的蛋白酶,纤维素酶,脂酶或者内切糖苷酶,以及助洗剂和稳定剂。本发明磷脂酶的加入到传统的清洗组合物中,并不产生任何特定的应用限制。换句话说,只要pH在以上的范围内,温度低于所述酶的变性温度,适于去污剂的任何温度和pH也适于本组合物。此外,本发明的多肽可以用于不含去污剂的洗涤组合物中,此外,或者可以单独应用,或者可以与助洗剂和稳定剂组合应用。
本发明提供了包括去污剂组合物的洗涤组合物,用于洗涤硬的表面,适用于洗涤织品的去污剂组合物,洗涤碗盘的组合物,口腔清洗组合物,变性清洗组合物,以及接触镜片清洗溶液。
一方面,本发明提供方法用于洗涤一个对象,包括在足以洗涤的条件下,使该对象与本发明的磷脂酶接触。本发明的磷脂酶可以被包括进去,如作为去污剂添加剂。本发明的去污剂组合物可以,例如,配制成包括本发明磷脂酶的手洗或者机器洗的去污剂组合物。适用于前处理染色织物的洗涤添加剂可以包括本发明的磷脂酶。织物柔软剂组合物可以包括本发明的磷脂酶。可选择地,本发明的磷脂酶可以被配制,作为去污剂组合物,用于在一般家用硬表面的洗涤操作。在可选择的方面,本发明的去污剂添加剂和去污剂组合物可以包括一种或者多种其它的酶,如蛋白酶,脂酶,角质酶,另一种磷脂酶,糖酶,纤维素酶,果胶酶,甘露聚糖酶,阿拉伯醣酶,半乳聚糖酶,木聚糖酶,氧化酶,如,乳糖酶,和/或过氧化物酶。选择与选定的去污剂相容的本发明酶的特征(即,与其它酶和非酶成分等的相容性,最适pH),和该酶以有效量存在。一方面,本发明的磷脂酶用于从织物中去除恶臭物质。各种去污剂组合物和用于制备它们的方法可以用在实践本发明中,描述在,例如美国专利编号6,333,301;6,329,333;6,326,341;6,297,038;6,309,871;6,204,232;6,197,070;5,856,164所说明的。
废物处理
本发明的磷脂酶可以用在废物处理。一方面,本发明提供了应用本发明磷脂酶的固体废物消化过程。该方法可以包括降低实际上未经处理的固体废物的质量和体积。固体废物可以用酶消化过程处理,是在酶解溶液(包括本发明的磷脂酶)存在的条件下,在控制的温度下进行的。固体废物可以转化为液化废物和任何残留固体废物。得到的液化废物可以与所述的任何残留固体废物分离。参见如美国专利编号5,709,796。
本发明磷脂酶的其它应用
本发明的磷脂酶也可以用于研究磷酸肌醇(PI)信号系统;在双极性紊乱治疗的诊断、预后和发展中(参见如,Pandey(2002)Neuropsychopharmacology 26:216-228);作为抗氧化剂;作为修饰的磷脂;作为发泡和凝胶化试剂;产生血管生成素脂类用于血管形成组织;鉴定磷脂酶,如,PLA,PLB,PLC,PLD和/或patatin调节剂(促效剂或者拮抗剂),如作为抑制剂,用作抗-瘤剂,消炎剂以及作为止痛剂。它们可以用于产生产酸性磷脂,用于控制食品和药物中的苦味。它们可以用于脂肪纯化。它们可以用于鉴定治疗病毒性、发炎的、过敏的和心血管疾病的肽抑制剂。它们可以用于制备疫苗。它们可以用于制备多不饱和脂肪酸甘油酯和磷脂酰甘油。
本发明的磷脂酶,例如,PLA和PLC酶,用于产生免疫毒素和各种治疗剂,用于抗-肿瘤治疗。
本发明磷脂酶可以与其它用于脱色(即叶绿素去除)的酶联合使用,并且在去污剂中(参见以上),如,与其它的酶联合(如,脂酶,蛋白酶,酯酶,磷酸酶)使用。例如,在PLC应用的任何场合中,可以组合应用PLD和一种磷酸酶,以便产生如同PLC单独应用的同样结果。
本发明参照以下的实施例来进一步说明;然而,应当认为该发明并不限于这样的实施例。
实施例
实施例1:用于序列同一性勘探的BLAST程序
本实施例说明了一个典型的序列同一性程序,用以确定是否一个核酸是属于本发明的范围。应用NCBI BLAST 2.2.2程序,默认选择为to blastp。除了默认的过滤设置,应用所有默认值(即,除了过滤设置为OFF(关),所有参数设置为默认);在该位置应用“FF”设置,其禁用过滤。由于序列的短长度,应用默认过滤常常导致Karlin-Altschul违犯。用于本实施例的默认值:
“Filter for low complexity:ON  “低复杂度过滤:开
>Word Size:3                    >字长:3
>Matrix:Blosum62                >矩阵:Blosum 62
>Gap Costs:Existence:ll        >空位成本:存在:ll
>Extension:1”                  >拓展:1”
其它的默认设置为:低复杂度过滤关闭,对于蛋白字长为3,BLOSUM62矩阵,空位存在罚分-11和空位拓展罚分-1。“-W”选项设定为默认值0。这意味着,如果没有设定,字长默认值对于蛋白为3,对于核苷酸为11。设置读入:
<<README.bls.txt>>

>--------------------------------

>blastall arguments:

>

>-p Program Name[String]

>-d Database[String]

>default=nr

>-i Query File[File In]

>default=stdin
				
				<dp n="d101"/>
>-e Expectation value(E)[Real]

>default=10.0

>-m alignment view options:

>0=pairwise,

>1=query-anchored showing identities,

>2=query-anchored no identities,

>3=flat query-anchored,show identities,

>4=flat query-anchored,no identities,

>5=query-anchored no identities and blunt ends,

>6=flat queryanchored,no identilies and blunt ends,

>7=XML Blast output,

>8=tabular,

>9 tabular with comment lines[lnteger]

>default=0

>-o BLAST report Outout File[File Out]Optional

>default=stdout 

>-F Filter query sequence(DUST with blastu,SEG with others)[String]

>default=T

>-G Cost to open a gap(zero invokes default behavior)[Integer]

>default=0

>-E Cost to extend a gap(zero invokes default behavior)[Integer]

>default=0

>-X X dropoff value for gapped alignment(in bits)(zero invokes default

>behavior)[lnteger]

>default=0

>-I Show GI′s in deflines[T/F]

>default=F

>-q Penalty for a nucleotide mismatch(blastn only)[Integer]

>default=-3

>-r Reward for a nucleotide match(blastu only)[Integer]

>default=1

>-v Number of database sequences to show one-line descriptions for(V)

>[Integer]

>default=500

>b Nurnbcr of database sequence to show alignments for(B)[Irteger]

>default=250

>-f Threshold for extending hits,default if zero[Integer]

>default=0

>-g Perform gapped alignment(not available with tblastx)[T/F]
				
				<dp n="d102"/>
>default=T

>-Q Query Genetic code to use[lnteger]

>default=1

>-D DB Genetic code(for thlast[nx]only)[Integer]

>default=1

>-a Number of processors to use[Integer]

>default=1

>-O SeqAlign file[File Outl Optional

>-J Believe the query defline[T/F]

>default=F

>-M Matrix[String]

>default=BLOSUM62

>-W Word size,default if zero[Integer]

>default=0

>-z Effective length of the database(use zero for the real size)

>[String]

>default=0

>-K Number of best hits from a region to keep(off by default,if used a

>value of 100 is recommended)[Integer]

>default=0

>-P 0 for multiple hits 1-pass,I for single hit l-pass,2 for 2-pass

>[Integer]

>default=0

>-Y Effective length of the search space(use zero for the real size)

>[Real]

>default=0

>-S Query strands to search against database(for blast[nx],and

>tblastx).3 is both,1 is top,2 is bottom[Integer]

>default=3

>-T Produce HTML output[T/F]

>default=F

>-1 Restrict search of database to llst of GI′s[String]Optional

>-U Use lower case filtering of FASTA sequence[T/F]Optional

>default=F

>-y Dropoff(X)for blast extensions in bits(0.0 invokes default

>behavior)[Real]

>default=0.0

>-Z X dropoff value for final gapped aligmnent(in bits)[Integer]

>default=0

>-R PSI-TBLASTN checkpoint file[File In]Optional
				<dp n="d103"/>
>n MegaBlast search[T/F]

>default=F

>-L Location on query sequence[String]Optional

>-A Multiple Hits window size(zero for single hit algorithm)[Integer]

>default=40
实施例2:PLC介导脱胶的模拟
该实施例说明了磷脂酶C(PLC)介导脱胶的模拟。
由于在水中磷脂酰胆碱(PC)的溶解性不好,起初溶解于乙醇中(100mg/ml)。对于起始测定,制备PC的储存溶液,是溶解在50mM的吗啉基丙烷磺酸或60mM柠檬酸/NaOH中,在pH 6下。在Eppendorf管中,将PC储液(10μl,1μg/μl)加入到500μl精炼的大豆油(含2%的水)中。为了得到乳状液,将管中的内容物通过旋涡混合器混合3分钟(参见图5A)。油和水相通过在13,000rpm离心1分钟来分离(图5B)。反应管在所需的温度下(37℃,50℃,或者60℃)进行预温育,并且加入3μl的来自蜡状芽孢杆菌Bacillus cereus的PLC(0.9U/μl)至水相(图5C)。PC的消失通过应用氯仿/甲醇/水(65∶25∶4)作为溶剂系统的TLC进行分析(参见,如,Taguchi(1975),见上文),并且在暴露于碘蒸汽的情况下可以观察到。
图5用示意性说明了模式化的两相系统,用于模拟PLC-介导的脱胶。图5A:通过混合带有2%的水的粗制油来水合污染的磷脂(P),产生乳状液。图5B:水相和油相在离心后分离,并且在水相中加入PLC,其中含有沉淀的磷脂(“胶质”)。PLC的水解发生在水相。图5C:反应的时间过程通过从水相中取样来模拟,并且用TLC对它们进行分析。
                                  序列表
<110>S·格拉马蒂科瓦  G·黑尔伍德  D·拉姆  N·巴顿
<120>磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
<130>09010-094001
<140>
<150>2003-04-21
<160>106
<170>FastSEQ for Windows Version 4.0
<210>1
<211>849
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>1
atgaaaaaga aagtattagc actagcagct atggttgctt tagctgcgcc agttcaaagt      60
gtagtatttg cacaaacaaa taatagtgaa agtcctgcac cgattttaag atggtcagct     120
gaggataagc ataatgaggg gattaactct catttgtgga ttgtaaatcg tgcaattgac     180
atcatgtctc gtaatacaac gattgtgaat ccgaatgaaa ctgcattatt aaatgagtgg     240
cgtgctgatt tagaaaatgg tatttattct gctgattacg agaatcctta ttatgataat     300
agtacatatg cttctcactt ttatgatccg gatactggaa caacatatat tccttttgcg     360
aaacatgcaa aagaaacagg cgcaaaatat tttaaccttg ctggtcaagc ataccaaaat     420
caagatatgc agcaagcatt cttctactta ggattatcgc ttcattattt aggagatgtg     480
aatcagccaa tgcatgcagc aaactttacg aatctttctt atccaatggg tttccattct     540
aaatacgaaa attttgttga tacaataaaa aataactata ttgtttcaga tagcaatgga     600
tattggaatt ggaaaggagc aaacccagaa gattggattg aaggagcagc ggtagcagct     660
aaacaagatt atcctggcgt tgtgaacgat acgacaaaag attggtttgt aaaagcagcc     720
gtatctcaag aatatgcaga taaatggcgt gcggaagtaa caccggtgac aggaaagcgt     780
ttaatggaag cgcagcgcgt tacagctggt tatattcatt tgtggtttga tacgtatgta     840
aatcgctaa                                                             849
<210>2
<211>282
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(24)
<400>2
Met Lys Lys Lys Val Leu Ala Leu Ala Ala Met Val Ala Leu Ala Ala
 1               5                  10                  15
Pro Val Gln Ser Val Val Phe Ala Gln Thr Asn Asn Ser Glu Ser Pro
            20                  25                  30
Ala Pro Ile Leu Arg Trp Ser Ala Glu Asp Lys His Asn Glu Gly Ile
        35                  40                  45
Asn Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Arg
    50                  55                  60
Asn Thr Thr Ile Val Asn Pro Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Ala Asp Leu Glu Asn Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Tyr Ala Ser His Phe Tyr Asp Pro Asp Thr
            100                 105                 110
Gly Thr Thr Tyr Ile Pro Phe Ala Lys His Ala Lys Glu Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Asn Leu Ala Gly Gln Ala Tyr Gln Asn Gln Asp Met Gln
    130                 135                 140
Gln Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Leu Ser Tyr Pro Met
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Ile Lys Asn Asn
            180                 185                 190
Tyr Ile Val Ser Asp Ser Asn Gly Tyr Trp Asn Trp Lys Gly Ala Asn
        195                 200                 205
Pro Glu Asp Trp Ile Glu Gly Ala Ala Val Ala Ala Lys Gln Asp Tyr
    210                 215                 220
Pro Gly Val Val Asn Asp Thr Thr Lys Asp Trp Phe Val Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Glu Tyr Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Arg
        275                     280
<210>3
<211>852
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>3
atgaaaagaa aaattttagc tatagcttcc gtaattgctt taacagctcc tatccaaagt      60
gtggcgtttg cgcatgaaaa tggtcaccaa gatccaccaa ttgctctaaa gtggtcagca     120
gaatctatac ataatgaagg agtaagttct catttatgga ttgtaaacag agccattgat     180
attatgtccc aaaatacgac tgttgtgaag caaaatgaga cagctctatt aaatgaatgg     240
cgtacggatc tagagaaagg catttactct gcggattatg aaaacccata ctatgataat     300
tccacattcg cttcacactt ctatgatcct gattcaggaa aaacgtatat tccatttgct     360
aaacaagcaa agcaaacagg agcgaaatat tttaaattag ctggtgaagc ttatcaaaat     420
aaagatctga aaaacgcatt cttttattta ggattatcac ttcactattt aggggatgtc     480
aaccaaccaa tgcatgcagc aaactttact aatatttcgc atccatttgg cttccactca     540
aaatatgaaa atttcgttga tacagtgaaa gacaattata gagtaacgga tggaaatggc     600
tattggaatt ggcaaagtgc aaatccagaa gagtgggttc atgcatcagc atcagcagca     660
aaagctgatt ttccatcaat tgttaatgat aagacgaaaa attggttcct aaaagcagct     720
gtatcacaag actctgctga taaatggcgt gcagaagtaa caccgataac aggaaaacgt     780
ttaatggaag cgcagcgtgt tacagctgga tatatccatt tatggtttga tacgtacgtg     840
aataacaaat aa                                                         852
<210>4
<211>283
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(24)
<400>4
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
 1               5                  10                  15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Asn Gly His Gln Asp Pro
            20                  25                  30
Pro Ile Ala Leu Lys Trp Ser Ala Glu Ser Ile His Asn Glu Gly Val
        35                  40                  45
Ser Ser His Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln
    50                  55                  60
Asn Thr Thr Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp
65                  70                  75                  80
Arg Thr Asp Leu Glu Lys Gly Ile Tyr Ser Ala Asp Tyr Glu Asn Pro
                85                  90                  95
Tyr Tyr Asp Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser
            100                 105                 110
Gly Lys Thr Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala
        115                 120                 125
Lys Tyr Phe Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys
    130                 135                 140
Asn Ala Phe Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val
145                 150                 155                 160
Asn Gln Pro Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe
                165                 170                 175
Gly Phe His Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn
            180                 185                 190
Tyr Arg Val Thr Asp Gly Asn Gly Tyr Trp Asn Trp Gln Ser Ala Asn
        195                 200                 205
Pro Glu Glu Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe
    210                 215                 220
Pro Ser Ile Val Asn Asp Lys Thr Lys Asn Trp Phe Leu Lys Ala Ala
225                 230                 235                 240
Val Ser Gln Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Ile
                245                 250                 255
Thr Gly Lys Arg Leu Met Glu Ala Gln Arg Val Thr Ala Gly Tyr Ile
            260                 265                 270
His Leu Trp Phe Asp Thr Tyr Val Asn Asn Lys
        275                 280
<210>5
<211>843
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>5
atgaaaagaa aaattttagc tatagcttct gtaattgctt taacagctcc tattcaaagt     60
gtggcgtttg cgcatgaatc tgatgggcct attgctttaa gatggtcagc ggaatctgta    120
cataatgaag gagtaagttc tcatttatgg attgtaaaca gagcaattga tattatgtcc     180
caaaatacga ctgtggtgaa gcaaaatgag acagctctat taaatgaatg gcgtacgaat     240
ttggaggaag gtatttattc tgcagattat aaaaacccat actatgataa ttccacattc     300
gcttcacact tctatgatcc tgattcagaa aaaacgtata ttccatttgc taaacaagca     360
aagcaaacgg gagcaaagta ttttaaatta gctggtgaag cttatcaaaa taaagatctg     420
aaaaatgcat tcttttattt aggattatca cttcattatt taggggatgt caatcaacca     480
atgcatgcag caaactttac taacatttcg catccatttg gcttccactc aaaatatgaa     540
aacttcgttg atacagtgaa agacaattat agagtaacag atggagatgg ctattggaat     600
tggaaaagtg caaatccaga agagtgggtt catgcatcag catcagcagc aaaagctgat     660
ttcccatcaa ttgttaatga taatacgaaa agttggttcc taaaagcagc ggtatcacaa     720
gactctgctg acaaatggcg tgctgaagta acaccggtaa caggaaaacg tttaatggaa     780
gcacagcgta ttacagctgg atatattcat ttatggtttg atacgtacgt gaataacaaa     840
taa                                                                   843
<210>6
<211>280
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(24)
<400>6
Met Lys Arg Lys Ile Leu Ala Ile Ala Ser Val Ile Ala Leu Thr Ala
 1               5                  10                  15
Pro Ile Gln Ser Val Ala Phe Ala His Glu Ser Asp Gly Pro Ile Ala
            20                  25                  30
Leu Arg Trp Ser Ala Glu Ser Val His Asn Glu Gly Val Ser Ser His
        35                  40                  45
Leu Trp Ile Val Asn Arg Ala Ile Asp Ile Met Ser Gln Asn Thr Thr
    50                  55                  60
Val Val Lys Gln Asn Glu Thr Ala Leu Leu Asn Glu Trp Arg Thr Asn
65                  70                  75                  80
Leu Glu Glu Gly Ile Tyr Ser Ala Asp Tyr Lys Asn Pro Tyr Tyr Asp
                85                  90                  95
Asn Ser Thr Phe Ala Ser His Phe Tyr Asp Pro Asp Ser Glu Lys Thr
            100                 105                 110
Tyr Ile Pro Phe Ala Lys Gln Ala Lys Gln Thr Gly Ala Lys Tyr Phe
        115                 120                 125
Lys Leu Ala Gly Glu Ala Tyr Gln Asn Lys Asp Leu Lys Asn Ala Phe
    130                 135                 140
Phe Tyr Leu Gly Leu Ser Leu His Tyr Leu Gly Asp Val Asn Gln Pro
145                 150                 155                 160
Met His Ala Ala Asn Phe Thr Asn Ile Ser His Pro Phe Gly Phe His
                165                 170                 175
Ser Lys Tyr Glu Asn Phe Val Asp Thr Val Lys Asp Asn Tyr Arg Val
            180                 185                 190
Thr Asp Gly Asp Gly Tyr Trp Asn Trp Lys Ser Ala Asn Pro Glu Glu
        195                 200                 205
Trp Val His Ala Ser Ala Ser Ala Ala Lys Ala Asp Phe Pro Ser Ile
    210                 215                 220
Val Asn Asp Asn Thr Lys Ser Trp Phe Leu Lys Ala Ala Val Ser Gln
225                 230                 235                 240
Asp Ser Ala Asp Lys Trp Arg Ala Glu Val Thr Pro Val Thr Gly Lys
                245                 250                 255
Arg Leu Met Glu Ala Gln Arg Ile Thr Ala Gly Tyr Ile His Leu Trp
            260                 265                 270
Phe Asp Thr Tyr Val Asn Asn Lys
        275                 280
<210>7
<211>963
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>7
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt gttaggggtt      60
ttcgtaccgc tgcagccatc acatgctact gaaaattatc caaatgattt taaactgttg     120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca     180
gattatatga gtaatgcaga ttacttcaag ggacatgatg ctctgctctt aaatgagctt     240
tttgacaatg gaaattcgaa catgctgcta atgaacttat ccacggaata tccatatcaa     300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat     360
tttgtacccg aagatggcgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata     420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat     480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa     540
gatactgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc     600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac     660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc     720
aatgcgccta ccgaatattt agggcatagc tctacttggg acccagaaac gaacagcatt     780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa     840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg     900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa     960
taa                                                          963
<210>8
<211>320
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(29)
<400>8
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
 1               5                  10                  15
Leu Leu Gly Val Phe Val Pro Leu Gln Pro Ser His Ala Thr Glu Asn
            20                  25                  30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
        35                  40                  45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
    50                  55                  60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65                  70                  75                  80
Phe Asp Asn Gly Asn Ser Asn Met Leu Leu Met Asn Leu Ser Thr Glu
                85                  90                  95
Tyr Pro Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
            100                 105                 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
        115                 120                 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
    130                 135                 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145                 150                 155                 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
                165                 170                 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
            180                 185                 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
        195                 200                 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
    210                 215                 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225                 230                 235                 240
Asn Ala Pro Thr Glu Tyr Leu Gly His Ser Ser Thr Trp Asp Pro Glu
                245                 250                 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
            260                 265                 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
        275                 280                 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
    290                 295                 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305                 310                 315                 320
<210>9
<211>999
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>9
atgaaattac tgcgtgtctt tgtgtgcgtt tttgctttac tcagcgcaca cagcaaagcc      60
gatacactta aagtaatggc ttataatatt atgcaactaa acgtacaaga ttgggatcaa     120
gcaaatcgtg cacagcgctt gccaaacgtc atatctcaat taagtgacag tcctgatgtc     180
attcttatca gcgaagcgtt tagcagccaa tcagaatctg cgttagcgca acttgctcaa     240
ctttaccctt atcaaactcc caatgttggc gaagactgta gtggcgctgg ctggcaaagc     300
ttaacgggta actgctcgaa tagccccttt gtgatccgcg gtggagtggt gattttatct     360
aagtacccca tcattacgca aaaagcccat gtgtttaata acagcctgac tgatagttgg     420
gattatttag caaacaaagg tttcgcttat gttgaaatag aaaaacatgg caaacgttac     480
caccttattg gcacgcattt acaagcaacg catgatggcg acacagaagc tgagcatatt     540
gtgagaatgg gtcaattaca agagatacaa gatttcattc aaagcgagca aattcacact     600
tctgagccgg tcattatcgg cggtgatatg aacgtagagt ggagcaagca atctgaaatt     660
acagatatgc tcgaagtggt tcgcagccgt ctaattttca acacacctga agttggctct     720
ttctctgcaa aacacaactg gtttaccaaa gctaacgcct actatttcga ctacagctta     780
gagtataacg acacgctcga ttatgtactt tggcatgcag accataagca acccaccaat     840
acccoagaaa tgttagtacg ttacccaaaa gcagagcgtg acttttactg gcgttactta     900
cgcggaaatt ggaacttacc ttctggccgt tattatcatg atggatacta taacgaactg     960
tctgatcact acccagtgca agttaacttt gaattttaa                            999
<210>10
<211>332
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(20)
<400>10
Met Lys Leu Leu Arg Val Phe Val Cys Val Phe Ala Leu Leu Ser Ala
 1               5                  10                  15
His Ser Lys Ala Asp Thr Leu Lys Val Met Ala Tyr Asn Ile Met Gln
            20                  25                  30
Leu Asn Val Gln Asp Trp Asp Gln Ala Asn Arg Ala Gln Arg Leu Pro
        35                  40                  45
Asn Val Ile Ser Gln Leu Ser Asp Ser Pro Asp Val Ile Leu Ile Ser
    50                  55                  60
Glu Ala Phe Ser Ser Gln Ser Glu Ser Ala Leu Ala Gln Leu Ala Gln
65                  70                  75                  80
Leu Tyr Pro Tyr Gln Thr Pro Asn Val Gly Glu Asp Cys Ser Gly Ala
                85                  90                  95
Gly Trp Gln Ser Leu Thr Gly Asn Cys Ser Asn Ser Pro Phe Val Ile
            100                 105                 110
Arg Gly Gly Val Val Ile Leu Ser Lys Tyr Pro Ile Ile Thr Gln Lys
        115                 120                 125
Ala His Val Phe Asn Asn Ser Leu Thr Asp Ser Trp Asp Tyr Leu Ala
    130                 135                 140
Asn Lys Gly Phe Ala Tyr Val Glu Ile Glu Lys His Gly Lys Arg Tyr
145                 150                 155                 160
His Leu Ile Gly Thr His Leu Gln Ala Thr His Asp Gly Asp Thr Glu
                165                 170                 175
Ala Glu His Ile Val Arg Met Gly Gln Leu Gln Glu Ile Gln Asp Phe
            180                 185                 190
Ile Gln Ser Glu Gln Ile His Thr Ser Glu Pro Val Ile Ile Gly Gly
        195                 200                 205
Asp Met Asn Val Glu Trp Ser Lys Gln Ser Glu Ile Thr Asp Met Leu
    210                 215                 220
Glu Val Val Arg Ser Arg Leu Ile Phe Asn Thr Pro Glu Val Gly Ser
225                 230                 235                 240
Phe Ser Ala Lys His Asn Trp Phe Thr Lys Ala Asn Ala Tyr Tyr Phe
                245                 250                 255
Asp Tyr Ser Leu Glu Tyr Asn Asp Thr Leu Asp Tyr Val Leu Trp His
            260                 265                 270
Ala Asp His Lys Gln Pro Thr Asn Thr Pro Glu Met Leu Val Arg Tyr
        275                 280                 285
Pro Lys Ala Glu Arg Asp Phe Tyr Trp Arg Tyr Leu Arg Gly Asn Trp
    290                 295                 300
Asn Leu Pro Ser Gly Arg Tyr Tyr His Asp Gly Tyr Tyr Asn Glu Leu
305                 310                 315                 320
Ser Asp His Tyr Pro Val Gln Val Asn Phe Glu Phe
                325                 330
<210>11
<211>1041
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>11
atggcttcac aattcaggaa tctggttttt gaaggaggcg gtgtaaaggg aatcgcctat      60
atcggcgcca tgcaggtgct ggagcagcgc ggacatttgg agcacgttgt gagggtggga     120
ggaacaagtg caggggctat taacgctctc attttttcgc tgggctttac cattaaagag     180
cagcaggata ttctcaattc caccaacttc agggagttta tggacagctc tttcggattt     240
gtgcgaaact tcagaaggct ctggagtgaa ttcgggtgga accgcggtga tgtgttttcg     300
gagtgggcag gagagctggt gaaagagaaa ctcggcaaga agaacgccac cttcggcgat     360
ctgaaaaaag cgaagcgccc cgatctctac gttatcggaa ccaacctctc caccgggttt     420
tccgagactt tttcgcatga acgccacgcc aacatgccgc tggtggatgc ggtgcggatc     480
agcatgtcga tcccgctctt ttttgcggca cgcagacttg gcaaacgaag cgatgtgtat     540
gtggatggag gtgttatgct caactacccg gtaaagctgt tcgacaggga gaaatacatc     600
gatttggaga aggagaaaga ggcagcccgc tacgtggagt actacaatca agagaatgcc     660
cggtttctgc ttgagcggcc cggccgaagc ccgtacgttt acaaccggca gaccctaggc     720
ctgcggctcg actcgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc     780
aaacagatca accgcttccc cgaatatgcc aaagccctga tcggtgcact gatgcaggtg     840
caggagaaca tccacctgaa aagcgacgac tggcagcgaa cgctctacat caacacgctg     900
gatgtgggta ccacagattt cgacattaat gacgagaaga aaaaagtgct ggtgaatgag     960
ggaatcaagg gagcggaaac ctacttccgc tggtttgagg atcccgaagc taaaccggtg    1020
aacaaggtgg atttggtctg a                                              1041
<210>12
<211>346
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>12
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly His
            20                  25                  30
Leu Glu His Val Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
    50                  55                  60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65                  70                  75                  80
Val Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
                85                  90                  95
Asp Val Phe Ser Glu Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
            100                 105                 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
    130                 135                 140
Ser His Glu Arg His Ala Asn Met Pro Leu Val Asp Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
                165                 170                 175
Ser Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Lys Glu Ala
        195                 200                 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Lys Ala
            260                 265                 270
Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asp Ile Asn Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305                 310                 315                 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
                325                 330                 335
Ala Lys Pro Val Asn Lys Val Asp Leu Val
            340                 345
<210>13
<211>1038
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>13
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac      60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca cagagtcgga     120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac ggtccgtgag     180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt     240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat     300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat     360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggtat     420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc     480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgaacgaca agatgtgtat     540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt     600
gatctggtca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct     660
cgctttcagc ttgagcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt     720
ttgcgactgg atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc     780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca     840
caggaaaaca ttcatctaca tggcgatgat tgggcgcgca cggtctatat cgatacattg     900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgagcaa     960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg    1020
aatagagtgg agtcatag                                                  1038
<210>14
<211>345
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>14
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
                85                  90                  95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Mer Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Glu Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Val Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Ala Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>15
<211>1344
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>15
atgctggtca tcattcatgg ctggagcgat gaggcgggct cgttcaagac cctggccaga      60
cgtttggcca aggcgccacc cgagggcctc gggacgcagg tcacggaaat ccatctgggt     120
gattatgtgt ccctggatga ccaggtgacg ttcaatgatc tggtcgatgc catggccaga     180
gcctggagcg atcgtggtct gcccacggcc ccgcgcagcg tcgatgccgt cgtgcacagc     240
accggcggcc tggtgatccg cgactggctc acgcagctgt acacgccgga aacagccccc     300
attcgtcgcc tgctgatgct cgctccggcc aatttcggct cgccgctggc acacaccgga     360
cgcagcatga tcggccgggt caccaagggc tggaagggca cgcggctctt tgaaacgggc     420
aagcacattc tcaaagggct cgaactggcc agcccctacg cctgggcgct ggccgaacgc     480
gatctgttca gcgatcagaa ctattatggc gccgggcgca tcctgtgcac tgtcctggtg     540
ggcaacgccg gttatcgcgg catcagcgcc gtcgccaacc ggcccggcac ggacggcacc     600
gtgcgcgtca gcagcgccaa tctccaagcg gccaggatgc tgctcgattt cagcgccagt     660
ccacaggctg agccggaatt caccctgcac gacagcaccg cggaaattgc cttcggcatc     720
gccgacgagg aagaccacag caccatcgcc gccaaggatc gcggcccgcg caaggcagtc     780
acctgggaac tgattctcaa agccctgcag atcgaggatg caagctttgc tcaatggtgc     840
cggcagatgc aggagcattc cgcggccgtg acggaaacgg cggaaaagcg ccgcaatgtt     900
cactacaaca gcttccagaa taccgtcgtg cgcgtggtgg acaaccacgg tgccgccgtg     960
caggattatc tcatcgagtt ttacatgaat gatgatcgca aactccgcga tcagcgcctc    1020
acccagcgcc tgcaggagca ggtgattacc aacgtgcacg gctacggtga cgacaagtcc    1080
tatcgcagca tgctgatcaa ctgcacggag ctctatgcgc tgatgtccag accgcaggat    1140
cgcctgaaca tcagcatcac cgcctatccg gatctctcca agggactggt ggggtatcgc    1200
acctacacgg acgaggatat cggttccctc tctctggatg cagcgcagat ccgaaagctc    1260
tttaagccgc accgtaccct gttgatgaca ctgtgcctgc aacgctatca gaaagatgat    1320
gtgttccgat tcagggatgt ttga                                           1344
<210>16
<211>447
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>16
Met Leu Val Ile Ile His Gly Trp Ser Asp Glu Ala Gly Ser Phe Lys
 1               5                  10                  15
Thr Leu Ala Arg Arg Leu Ala Lys Ala Pro Pro Glu Gly Leu Gly Thr
            20                  25                  30
Gln Val Thr Glu Ile His Leu Gly Asp Tyr Val Ser Leu Asp Asp Gln
        35                  40                  45
Val Thr Phe Asn Asp Leu Val Asp Ala Met Ala Arg Ala Trp Ser Asp
    50                  55                  60
Arg Gly Leu Pro Thr Ala Pro Arg Ser Val Asp Ala Val Val His Ser
65                  70                  75                  80
Thr Gly Gly Leu Val Ile Arg Asp Trp Leu Thr Gln Leu Tyr Thr Pro
                85                  90                  95
Glu Thr Ala Pro Ile Arg Arg Leu Leu Met Leu Ala Pro Ala Asn Phe
            100                 105                 110
Gly Ser Pro Leu Ala His Thr Gly Arg Ser Met Ile Gly Arg Val Thr
        115                 120                 125
Lys Gly Trp Lys Gly Thr Arg Leu Phe Glu Thr Gly Lys His Ile Leu
    130                 135                 140
Lys Gly Leu Glu Leu Ala Ser Pro Tyr Ala Trp Ala Leu Ala Glu Arg
145                 150                 155                 160
Asp Leu Phe Ser Asp Gln Asn Tyr Tyr Gly Ala Gly Arg Ile Leu Cys
                165                 170                 175
Thr Val Leu Val Gly Asn Ala Gly Tyr Arg Gly Ile Ser Ala Val Ala
            180                 185                 190
Asn Arg Pro Gly Thr Asp Gly Thr Val Arg Val Ser Ser Ala Asn Leu
        195                 200                 205
Gln Ala Ala Arg Met Leu Leu Asp Phe Ser Ala Ser Pro Gln Ala Glu
    210                 215                 220
Pro Glu Phe Thr Leu His Asp Ser Thr Ala Glu Ile Ala Phe Gly Ile
225                 230                 235                 240
Ala Asp Glu Glu Asp His Ser Thr Ile Ala Ala Lys Asp Arg Gly Pro
                245                 250                 255
Arg Lys Ala Val Thr Trp Glu Leu Ile Leu Lys Ala Leu Gln Ile Glu
            260                 265                 270
Asp Ala Ser Phe Ala Gln Trp Cys Arg Gln Met Gln Glu His Ser Ala
        275                 280                 285
Ala Val Thr Glu Thr Ala Glu Lys Arg Arg Asn Val His Tyr Asn Ser
    290                 295                 300
Phe Gln Asn Thr Val Val Arg Val Val Asp Asn His Gly Ala Ala Val
305                 310                 315                 320
Gln Asp Tyr Leu Ile Glu Phe Tyr Met Asn Asp Asp Arg Lys Leu Arg
                325                 330                 335
Asp Gln Arg Leu Thr Gln Arg Leu Gln Glu Gln Val Ile Thr Asn Val
            340                 345                 350
His Gly Tyr Gly Asp Asp Lys Ser Tyr Arg Ser Met Leu Ile Asn Cys
        355                 360                 365
Thr Glu Leu Tyr Ala Leu Met Ser Arg Pro Gln Asp Arg Leu Asn Ile
    370                 375                 380
Ser Ile Thr Ala Tyr Pro Asp Leu Ser Lys Gly Leu Val Gly Tyr Arg
385                 390                 395                 400
Thr Tyr Thr Asp Glu Asp Ile Gly Ser Leu Ser Leu Asp Ala Ala Gln
                405                 410                 415
Ile Arg Lys Leu Phe Lys Pro His Arg Thr Leu Leu Met Thr Leu Cys
            420                 425                 430
Leu Gln Arg Tyr Gln Lys Asp Asp Val Phe Arg Phe Arg Asp Val
        435                 440                 445
<210>17
<211>1137
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>17
atgaaaaaaa gccttcaaca acatcttgcc gctgacggca gcccaaagaa tattctttct      60
ctcgacgggg gaggaatcag aggggctttg acccttggtt ttctcaaaaa aatagaaagc     120
atcctgcagg aaaaacatgg gaaggactat ctcctttgcg atcactttga tttgatcggt     180
ggaacttcca caggctccat cattgcagca gcattggcta taggcatgac agtggaggaa     240
atcactaaaa tgtatatgga tctgggcgga aaaattttcg gcaagaaaag gagtttctgg     300
agaccctggg aaactgcgaa atacttgaaa gcaggatatg accacaaagc tcttgaaaag     360
agtctgaaag atgctttcca ggattttctt ttaggaagtg accaaattag aacaggtctt     420
tgtatagtag ccaaaagagc agataccaat agtatatggc cattgattaa ccaccccaaa     480
ggaaaattct atgattcaga acaaggcaaa aacaaaaata tccccttatg gcaggcagta     540
agggcgagta ccgctgctcc aacctatttc gctccacaat taatagatgt gggtgatggt     600
caaaaggctg cttttgtgga cggaggggta agcatggcca ataaccccgc attaaccctg     660
ttaaaagtgg ctacacttaa aggttttcct tttcattggc caatgggaga agacaaactg     720
accatagttt cagtaggcac cggatatagt gttttccaaa gacaaaaggg tgaaatcacc     780
aaagcttcct tattaacttg ggccaaaaac gtcccggaaa tgttgatgca ggatgcttct     840
tggcagaatc agaccatact tcagtggatt tctaaatccc ccactgcaca ttccatagat     900
atggaaatgg aagaccttag agatgacttt ctaggcggaa gaccactcat caaatacctc     960
aggtacaact tccccttgac agtaaatgat ctcaatggat tgaagcttgg gaaaagcttt    1020
acccaaaaag aggtcgaaga tttggtggaa atgagcaatg cacataaccg agaggagttg    1080
tataggattg gggagaaggc ggctgaaggg tcggtaaaaa aagaacattt tgaataa       1137
<210>18
<211>378
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>18
Met Lys Lys Ser Leu Gln Gln His Leu Ala Ala Asp Gly Ser Pro Lys
 1               5                  10                  15
Asn Ile Leu Ser Leu Asp Gly Gly Gly Ile Arg Gly Ala Leu Thr Leu
            20                  25                  30
Gly Phe Leu Lys Lys Ile Glu Ser Ile Leu Gln Glu Lys His Gly Lys
        35                  40                  45
Asp Tyr Leu Leu Cys Asp His Phe Asp Leu Ile Gly Gly Thr Ser Thr
    50                  55                  60
Gly Ser Ile Ile Ala Ala Ala Leu Ala Ile Gly Met Thr Val Glu Glu
65                  70                  75                  80
Ile Thr Lys Met Tyr Met Asp Leu Gly Gly Lys Ile Phe Gly Lys Lys
                85                  90                  95
Arg Ser Phe Trp Arg Pro Trp Glu Thr Ala Lys Tyr Leu Lys Ala Gly
            100                 105                 110
Tyr Asp His Lys Ala Leu Glu Lys Ser Leu Lys Asp Ala Phe Gln Asp
        115                 120                 125
Phe Leu Leu Gly Ser Asp Gln Ile Arg Thr Gly Leu Cys Ile Val Ala
    130                 135                 140
Lys Arg Ala Asp Thr Asn Ser Ile Trp Pro Leu Ile Asn His Pro Lys
145                 150                 155                 160
Gly Lys Phe Tyr Asp Ser Glu Gln Gly Lys Asn Lys Asn Ile Pro Leu
                165                 170                 175
Trp Gln Ala Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Ala Pro
            180                 185                 190
Gln Leu Ile Asp Val Gly Asp Gly Gln Lys Ala Ala Phe Val Asp Gly
        195                 200                 205
Gly Val Ser Met Ala Asn Asn Pro Ala Leu Thr Leu Leu Lys Val Ala
    210                 215                 220
Thr Leu Lys Gly Phe Pro Phe His Trp Pro Met Gly Glu Asp Lys Leu
225                 230                 235                 240
Thr Ile Val Ser Val Gly Thr Gly Tyr Ser Val Phe Gln Arg Gln Lys
                245                 250                 255
Gly Glu Ile Thr Lys Ala Ser Leu Leu Thr Trp Ala Lys Asn Val Pro
            260                 265                 270
Glu Met Leu Met Gln Asp Ala Ser Trp Gln Asn Gln Thr Ile Leu Gln
        275                 280                 285
Trp Ile Ser Lys Ser Pro Thr Ala His Ser Ile Asp Met Glu Met Glu
    290                 295                 300
Asp Leu Arg Asp Asp Phe Leu Gly Gly Arg Pro Leu Ile Lys Tyr Leu
305                 310                 315                 320
Arg Tyr Asn Phe Pro Leu Thr Val Asn Asp Leu Asn Gly Leu Lys Leu
                325                 330                 335
Gly Lys Ser Phe Thr Gln Lys Glu Val Glu Asp Leu Val Glu Met Ser
            340                 345                 350
Asn Ala His Asn Arg Glu Glu Leu Tyr Arg Ile Gly Glu Lys Ala Ala
        355                 360                 365
Glu Gly Ser Val Lys Lys Glu His Phe Glu
    370                 375
<210>19
<211>1248
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>19
atgaaaaaga caacgttagt tttggctcta ttgatgccat ttggtgccgc ctccgcacaa      60
gacaatagta tgactccaga agcaatcaca tcagctcaag tcgcacaaac acaatcagcc     120
tccacctata cctacgttag gtgttggtat cgaacagacg caagccatga ttcaccagca     180
accgactggg agtgggctag aaaggaaaac ggagactatt acaccattga cggttactgg     240
tggtcatcga tctcctttaa aaatatgttc tatagcgaga ctcctcaaca agagatcaag     300
cagcgttgtg tagacacctt ggatgttcag cacgacaaag ccgacatcac ctactttgcc     360
gctgacaacc gcttctctta caaccattct atctggacta acgatcacgg ctttcaagcg     420
aaccaaatca accgaatagt cgcttttggc gatagtcttt cagacacggg caacctattt     480
aatgggtcac aatggatttt ccctaaccct aattcttggt tcttgggtca cttctctaac     540
ggcttcgttt ggactgaata cttggctaac gctaagggcg ttccactcta taactgggct     600
gtgggtggcg cagcaggaac caaccaatat gtcgctctaa ctggtgtcta tgatcaggtc     660
acttcgtacc tgacttacat gaagatggcg aaaaattatc gcccagagaa cacactattc     720
acattagagt ttggattgaa tgactttatg aattacggac gtgaagtagc tgatgtaaaa     780
gctgacttta gtagcgcact gattcgcctc accgacgctg gcgcaaaaaa cattctgttg     840
ttcaccctac cagatgcgac caaagcccct cagtttaagt actcaacggc ccaagaaatc     900
gagacagttc gtggcaagat tctggcgttc aaccagttca tcaaagaaca agcagagtac     960
tatcaaagca aaggtgacaa cgtgatccta tttgatgcgc acgctctatt ctctagcatc    1020
accagcgacc cacaaaaaca cgggttcaga aacgcaaaag atgcctgcct agatattaat    1080
cgtagtgcat ctcaagacta cctatacagc catagtctga ccaacgactg tgcaacctat    1140
ggttctgata gctatgtatt ttggggcgta acacacccaa ccacagcaac tcataaatac    1200
atcgcaacgc atatactgat gaattcaatg tcgaccttcg acttttaa                 1248
<210>20
<211>415
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(19)
<400>20
Met Lys Lys Thr Thr Leu Val Leu Ala Leu Leu Met Pro Phe Gly Ala
 1               5                  10                  15
Ala Ser Ala Gln Asp Asn Ser Met Thr Pro Glu Ala Ile Thr Ser Ala
            20                  25                  30
Gln Val Ala Gln Thr Gln Ser Ala Ser Thr Tyr Thr Tyr Val Arg Cys
        35                  40                  45
Trp Tyr Arg Thr Asp Ala Ser His Asp Ser Pro Ala Thr Asp Trp Glu
     50                 55                  60
Trp Ala Arg Lys Glu Asn Gly Asp Tyr Tyr Thr Ile Asp Gly Tyr Trp
65                  70                  75                  80
Trp Ser Ser Ile Ser Phe Lys Asn Met Phe Tyr Ser Glu Thr Pro Gln
                85                  90                  95
Gln Glu Ile Lys Gln Arg Cys Val Asp Thr Leu Asp Val Gln His Asp
            100                 105                 110
Lys Ala Asp Ile Thr Tyr Phe Ala Ala Asp Asn Arg Phe Ser Tyr Asn
        115                 120                 125
His Ser Ile Trp Thr Asn Asp His Gly Phe Gln Ala Asn Gln Ile Asn
    130                 135                 140
Arg Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Phe
145                 150                 155                 160
Asn Gly Ser Gln Trp Ile Phe Pro Asn Pro Asn Ser Trp Phe Leu Gly
                165                 170                 175
His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala Asn Ala Lys
            180                 185                 190
Gly Val Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn
        195                 200                 205
Gln Tyr Val Ala Leu Thr Gly Val Tyr Asp Gln Val Thr Ser Tyr Leu
    210                 215                 220
Thr Tyr Met Lys Met Ala Lys Asn Tyr Arg Pro Glu Asn Thr Leu Phe
225                 230                 235                 240
Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val
                245                 250                 255
Ala Asp Val Lys Ala Asp Phe Ser Ser Ala Leu Ile Arg Leu Thr Asp
            260                 265                 270
Ala Gly Ala Lys Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys
        275                 280                 285
Ala Pro Gln Phe Lys Tyr Ser Thr Ala Gln Glu Ile Glu Thr Val Arg
    290                 295                 300
Gly Lys Ile Leu Ala Phe Asn Gln Phe Ile Lys Glu Gln Ala Glu Tyr
305                 310                 315                 320
Tyr Gln Ser Lys Gly Asp Asn Val Ile Leu Phe Asp Ala His Ala Leu
                325                 330                 335
Phe Ser Ser Ile Thr Ser Asp Pro Gln Lys His Gly Phe Arg Asn Ala
            340                 345                 350
Lys Asp Ala Cys Leu Asp Ile Asn Arg Ser Ala Ser Gln Asp Tyr Leu
        355                 360                 365
Tyr Ser His Ser Leu Thr Asn Asp Cys Ala Thr Tyr Gly Ser Asp Ser
    370                 375                 380
Tyr Val Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr
385                 390                 395                 400
Ile Ala Thr His Ile Leu Met Asn Ser Met Ser Thr Phe Asp Phe
                405                 410                 415
<210>21
<211>1716
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>21
atgcagcagc ataaattgag gaatttcaac aagggattga ccggcgtcgt attgagcgta      60
ttgacctcta ccagcgccat ggcttttaca caaatcggtg gcggcggcgc gattccgatg     120
ggccatgaat ggctcacgcg cagatccgca ctggaattat taaatgcaga ccatatcgtc     180
tccaacgacc cgctcgaccc acgcttgggc tggagccagg gcttggccaa aaatttggat     240
ctctccaatg cattgaacga agtgcagcgc atccagagcg ttaccaagac caacgcactt     300
tatgaaccac gctatgatga cgtgttttct gcgattgtcg gcgaacgctg ggtggacacg     360
gccggtttca acgttgcgaa ggctaccgtc ggtaaaatcg attgtttcag cgcggtcgcg     420
caagaacctg ccgatgttca gcaagaccat ttcatgcgtc gttacgatga cgtgggcgga     480
caaggtggcg ttaacgccgc acgccgcggg caacaacgtt tcatcaccca tttcatcaac     540
gccgcgatgg ccgaagaaaa aagcataaaa gcgtgggacg gcggtggata ctccacgctg     600
gaaaaagtca gccacaatta tttcttgttt ggtcgcgctg tgcatttgtt ccaggattct     660
ttcagcccgg aacacaccgt gcgtctgccg caagacaact acgaaaaagt acgtcaggta     720
aaagcctatc tgtgttccga aggcgcagag caacatacgc ataacgcgca ggatgcgatc     780
agcttcacca gcggcgacgt tatctggaag aaaaacaccc gtctggatgc cggctggagc     840
acctacaaac ccagcaatat gaaacccgtt gccttggtgg cgatggaagc ctcgaaggac     900
ttgtgggccg ccttcattcg caccatggcc gcaccgcgca gcgagcgtcg cgccattgct     960
cagcaagagg cacaaacgct ggtaaacaac tggttgtcgt tcgacgaaca ggaaatgctg    1020
agctggtacg acgaagaaac tcatcgcgat cacacttacg tgctcgaacc cggccagaac    1080
ggccccggta tttccatgtt cgattgcatg gtgggtctgg gcgtgacgtc tggcagccag    1140
gctgcgcgtg tggccgaact ggatcaacaa cgtcgccagt gcttgttcaa cgtcaaggcc    1200
accaccggtt acagcgatct gaacgatccg cacatggata tcccgtataa ctggcaatgg    1260
acgtcgacca cgcagtggaa agtgccaagc gcgagctgga cgattccgca gttgccggcc    1320
gacgcaggca agaaagtgac gatcaaaaac gccatcaacg gcaatccgct ggtagcgccg    1380
gctggcgtca aacacaacag cgatatttat tccgcgccgg gtgaagccat cgaattcatt    1440
ttcgtcggtg actacaacaa tgagtcttat ctgcgctcga aaaaagatgc ggatttgttc    1500
ttgagctaca gtgcggtatc cggcaagggc ttgctgtaca acacaccgaa tcaggcaggt    1560
tatcgcgtga aaccggcggg cgtgctgtgg acgatcgaga acacctactg gaatgatttc    1620
ctgtggttca acagttcgaa caaccgcatc tacgtaagcg gcacgggcga tgccaacaag    1680
ttacattcac agtggatcat tgacggtctg aaataa                              1716
<210>22
<211>571
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(28)
<400>22
Met Gln Gln His Lys Leu Arg Asn Phe Asn Lys Gly Leu Thr Gly Val
 1               5                  10                  15
Val Leu Ser Val Leu Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile
            20                  25                  30
Gly Gly Gly Gly Ala Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg
        35                  40                  45
Ser Ala Leu Glu Leu Leu Asn Ala Asp His Ile Val Ser Asn Asp Pro
    50                  55                  60
Leu Asp Pro Arg Leu Gly Trp Ser Gln Gly Leu Ala Lys Asn Leu Asp
65                  70                  75                  80
Leu Ser Asn Ala Leu Asn Glu Val Gln Arg Ile Gln Ser Val Thr Lys
                85                  90                  95
Thr Asn Ala Leu Tyr Glu Pro Arg Tyr Asp Asp Val Phe Ser Ala Ile
            100                 105                 110
Val Gly Glu Arg Trp Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala
        115                 120                 125
Thr Val Gly Lys Ile Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala
    130                 135                 140
Asp Val Gln Gln Asp His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly
145                 150                 155                 160
Gln Gly Gly Val Asn Ala Ala Arg Arg Gly Gln Gln Arg Phe Ile Thr
                165                 170                 175
His Phe Ile Asn Ala Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp
            180                 185                 190
Asp Gly Gly Gly Tyr Ser Thr Leu Glu Lys Val Ser His Asn Tyr Phe
        195                 200                 205
Leu Phe Gly Arg Ala Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu
    210                 215                 220
His Thr Val Arg Leu Pro Gln Asp Asn Tyr Glu Lys Val Arg Gln Val
225                 230                 235                 240
Lys Ala Tyr Leu Cys Ser Glu Gly Ala Glu Gln His Thr His Asn Ala
                245                 250                 255
Gln Asp Ala Ile Ser Phe Thr Ser Gly Asp Val Ile Trp Lys Lys Asn
            260                 265                 270
Thr Arg Leu Asp Ala Gly Trp Ser Thr Tyr Lys Pro Ser Asn Met Lys
        275                 280                 285
Pro Val Ala Leu Val Ala Met Glu Ala Ser Lys Asp Leu Trp Ala Ala
    290                 295                 300
Phe Ile Arg Thr Met Ala Ala Pro Arg Ser Glu Arg Arg Ala Ile Ala
305                 310                 315                 320
Gln Gln Glu Ala Gln Thr Leu Val Asn Asn Trp Leu Ser Phe Asp Glu
                325                 330                 335
Gln Glu Met Leu Ser Trp Tyr Asp Glu Glu Thr His Arg Asp His Thr
            340                 345                 350
Tyr Val Leu Glu Pro Gly Gln Asn Gly Pro Gly Ile Ser Met Phe Asp
        355                 360                 365
Cys Met Val Gly Leu Gly Val Thr Ser Gly Ser Gln Ala Ala Arg Val
    370                 375                 380
Ala Glu Leu Asp Gln Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala
385                 390                 395                 400
Thr Thr Gly Tyr Ser Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr
                405                 410                 415
Asn Trp Gln Trp Thr Ser Thr Thr Gln Trp Lys Val Pro Ser Ala Ser
            420                 425                 430
Trp Thr Ile Pro Gln Leu Pro Ala Asp Ala Gly Lys Lys Val Thr Ile
        435                 440                 445
Lys Asn Ala Ile Asn Gly Asn Pro Leu Val Ala Pro Ala Gly Val Lys
    450                 455                 460
His Asn Ser Asp Ile Tyr Ser Ala Pro Gly Glu Ala Ile Glu Phe Ile
465                 470                 475                 480
Phe Val Gly Asp Tyr Asn Asn Glu Ser Tyr Leu Arg Ser Lys Lys Asp
                485                 490                 495
Ala Asp Leu Phe Leu Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu
            500                 505                 510
Tyr Asn Thr Pro Asn Gln Ala Gly Tyr Arg Val Lys Pro Ala Gly Val
        515                 520                 525
Leu Trp Thr Ile Glu Asn Thr Tyr Trp Asn Asp Phe Leu Trp Phe Asn
    530                 535                 540
Ser Ser Asn Asn Arg Ile Tyr Val Ser Gly Thr Gly Asp Ala Asn Lys
545                 550                 555                 560
Leu His Ser Gln Trp Ile Ile Asp Gly Leu Lys
                565                 570
<210>23
<211>1473
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>23
atgacgatcc gctcgaccga ctacgcgctg ctcgcgcagg agagctacca cgacagccag      60
gtcgatgctg acgtcaagct cgatggcatc tcctacaagg tattcgccac cacggacgac     120
cccctcaccg gcttccaggc caccgcttac cagcgccagg atacgggcga ggtggtcatc     180
gcctaccgcg gcacggaatt cgaccgcgaa cccgtgcgcg atggcggcgt cgacgcaggc     240
atggtgttgc ttggcgtcaa cgcccagtca cctgcatccg aggtattcac ccgcgaagtg     300
atcgaaaagg cgaagcacga agccgagctc aacgatcgcg agccgaagat caccgtcacc     360
gggcattccc tcggcggcac cctcgccgaa atcaatgccg cgaaatacgg cctccacggc     420
gaaaccttca atgcctacgg tgcggccagc ctcaagggca tccccgaggg cggcgacacg     480
gtgatcgacc atgtccgcgc cggcgatctc gtcagcgccg ccagcccgca ctacgggcag     540
gtgcgtgtgt acgcagctca gcaggatatc gataccctgc aacatgccgg ctaccgcgac     600
gacagtggca tcttcagcct gcgcaacccc atcaaggcca cggatttcga cgcccacgcg     660
atcgataact tcgtgcccaa cagcaagctg cttggccaat cgatcatcgc tcctgagaac     720
gaagcccgtt acgaagccca caagggcatg atcgatcgct atcgcgatga cgtggccgat     780
atccggaaag gcatctccgc tccctgggaa atccccaagg ccgtcggcga gctgaaggac     840
aagctcgaac acgaagcctt cgagctggcc ggcaagggca tcctcgccgt cgagcacggt     900
gtagccgagg tcgttcacga ggcgaaggaa gggttcgatc atctcaagga aggcttgcac     960
cacgtcaggg aagagatcag cgagggcatc cacgccgtgg aagagaaggc ttccagcgca    1020
tggcacaccc tcacccaccc gaaggaatgg ttcgagcacg acaaacctca agtgaatctc    1080
gaccatcccc agcatccaga caacgccttg ttcaagcagg cgcagggcgc ggtacacgcc    1140
ctcgatgcca cgcaaggccg cacgccagat aggacgagcg accagatcgc aggttctctg    1200
gtggtcgcgg cgcgacgcga tggtctcgag cgggtggacc gcgccgtgct cagcgatgac    1260
actagccggc tctacggcgt gcagggtgcg acggattcgc ccttgaagca gttcaccgag    1320
gtgaacacga cagtggcggc gcaaacgtca ctgcagcaaa gcagccaggc atggcagcag    1380
caagcagaga tcgcgcgaca gaaccaggca accagccagg ctcagcgcat ggaaccgcag    1440
gtgcccccgc aggcaccggc acatggcatg taa                                 1473
<210>24
<211>490
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>24
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ser Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Val Phe
                85                  90                  95
Thr Arg Glu Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Lys Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Phe Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Ile Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
            260                 265                 270
Lys Ala Val Gly Glu Leu Lys Asp Lys Leu Glu His Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Val Ala Glu Val
    290                 295                 300
Val His Glu Ala Lys Glu Gly Phe Asp His Leu Lys Glu Gly Leu His
305                 310                 315                 320
His Val Arg Glu Glu Ile Ser Glu Gly Ile His Ala Val Glu Glu Lys
                325                 330                 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
            340                 345                 350
His Asp Lys Pro Gln Val Asn Leu Asp His Pro Gln His Pro Asp Asn
        355                 360                 365
Ala Leu Phe Lys Gln Ala Gln Gly Ala Val His Ala Leu Asp Ala Thr
    370                 375                 380
Gln Gly Arg Thr Pro Asp Arg Thr Ser Asp Gln Ile Ala Gly Ser Leu
385                 390                 395                 400
Val Val Ala Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val
               405                  410                 415
Leu Ser Asp Asp Thr Ser Arg Leu Tyr Gly Val Gln Gly Ala Thr Asp
            420                 425                 430
Ser Pro Leu Lys Gln Phe Thr Glu Val Asn Thr Thr Val Ala Ala Gln
        435                 440                 445
Thr Ser Leu Gln Gln Ser Ser Gln Ala Trp Gln Gln Gln Ala Glu Ile
    450                 455                 460
Ala Arg Gln Asn Gln Ala Thr Ser Gln Ala Gln Arg Met Glu Pro Gln
465                 470                 475                 480
Val Pro Pro Gln Ala Pro Ala His Gly Met
                485                 490
<210>25
<211>1098
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>25
atgtgcgcca aagttaaagt agtcaaaata aagacaaaca caggcagccc aaacaaatac      60
cacttcaaga acctcgtctt cgaaggcggc ggcgtgaaag gcattgccta tgtgggagcc     120
cttaccaagc tcgacgagga aggcatcctt caaaacatta agcgcgtggc cggcacctca     180
gcaggagcaa tggtggccgt cctcgtcgga ttgggcttca ccgctaagga gataagcgac     240
atcctgtggg acatcaaatt ccagaacttt ttagacaact catggggcgt gatacgcaac     300
accaatcgtc tgctgacgga atacggctgg tataagggcg agtttttccg cgacctcatg     360
gctgattaca tcaaaagaaa gacagacgat ggcgagatta ctttcgggga gttggaggcc     420
atgagaaaag agggcaagcc cttcttggaa atccatctgg ttggctccga cctcacgaca     480
gggtattcca gagtgttcaa ctccaaaaac accccaaatg tgaaagtcgc cgatgccgcc     540
cgcatctcca tgtcgatacc gctgtttttc tccgctgtga gaggcgtgca aggcgacgac     600
cacctctatg tggacggtgg gcttttggac aactacgcca tcaagatttt cgaccagtcg     660
aaactcgttt cagacaaaaa caacaaaagg aagaccgagt attacaacag gctcaaccag     720
caagtgaacg cgaaagcaac gaaaagcaag acggaatctg tagagtatgt ctacaacaag     780
gagactttgg gcttccgctt ggatgccaaa gaggacatca acctcttcct caaccacgat     840
gatgcccctc aaaaagaaat caagagtttc ttctcttaca ccaaagcttt ggtttccacg     900
ctcatcgatt tccagaacaa tgtacacctg cacagcgacg actggcagcg tacggtctac     960
atcgacacac tcggtgtcag ctccattgac ttcggtctgt caaacacaac gaaacaagct    1020
cttgtcgatt cgggctacaa ctacaccaca gcctacctcg actggtacaa caacgacgag    1080
gataaagcca acaagtaa                                                  1098
<210>26
<211>365
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>26
Met Cys Ala Lys Val Lys Val Val Lys Ile Lys Thr Asn Thr Gly Ser
 1               5                  10                  15
Pro Asn Lys Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val
            20                  25                  30
Lys Gly Ile Ala Tyr Val Gly Ala Leu Thr Lys Leu Asp Glu Glu Gly
        35                  40                  45
Ile Leu Gln Asn Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Met
    50                  55                  60
Val Ala Val Leu Val Gly Leu Gly Phe Thr Ala Lys Glu Ile Ser Asp
65                  70                  75                  80
Ile Leu Trp Asp Ile Lys Phe Gln Asn Phe Leu Asp Asn Ser Trp Gly
                85                  90                  95
Val Ile Arg Asn Thr Asn Arg Leu Leu Thr Glu Tyr Gly Trp Tyr Lys
            100                 105                 110
Gly Glu Phe Phe Arg Asp Leu Met Ala Asp Tyr Ile Lys Arg Lys Thr
        115                 120                 125
Asp Asp Gly Glu Ile Thr Phe Gly Glu Leu Glu Ala Met Arg Lys Glu
    130                 135                 140
Gly Lys Pro Phe Leu Glu Ile His Leu Val Gly Ser Asp Leu Thr Thr
145                 150                 155                 160
Gly Tyr Ser Arg Val Phe Asn Ser Lys Asn Thr Pro Asn Val Lys Val
                165                 170                 175
Ala Asp Ala Ala Arg Ile Ser Met Ser Ile Pro Leu Phe Phe Ser Ala
            180                 185                 190
Val Arg Gly Val Gln Gly Asp Asp His Leu Tyr Val Asp Gly Gly Leu
        195                 200                 205
Leu Asp Asn Tyr Ala Ile Lys Ile Phe Asp Gln Ser Lys Leu Val Ser
    210                 215                 220
Asp Lys Asn Asn Lys Arg Lys Thr Glu Tyr Tyr Asn Arg Leu Asn Gln
225                 230                 235                 240
Gln Val Asn Ala Lys Ala Thr Lys Ser Lys Thr Glu Ser Val Glu Tyr
                245                 250                 255
Val Tyr Asn Lys Glu Thr Leu Gly Phe Arg Leu Asp Ala Lys Glu Asp
            260                 265                 270
Ile Asn Leu Phe Leu Asn His Asp Asp Ala Pro Gln Lys Glu Ile Lys
        275                 280                 285
Ser Phe Phe Ser Tyr Thr Lys Ala Leu Val Ser Thr Leu Ile Asp Phe
    290                 295                 300
Gln Asn Asn Val His Leu His Ser Asp Asp Trp Gln Arg Thr Val Tyr
305                 310                 315                 320
Ile Asp Thr Leu Gly Val Ser Ser Ile Asp Phe Gly Leu Ser Asn Thr
                325                 330                 335
Thr Lys Gln Ala Leu Val Asp Ser Gly Tyr Asn TyrThr Thr Ala Tyr
            340                 345                350
Leu Asp Trp Tyr Asn Asn Asp Glu Asp Lys Ala Asn Lys
        355                 360                 365
<210>27
<211>1287
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>27
gtgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg      60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg     120
gtcgaggttc tcggcgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca     180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg     240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc     300
tccgggatta caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac     360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc     420
tggatcagag acctgattgc acagcgagtc gaggcggggc gctccgaggt cctgagccga     480
gccgacgccg atggacggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca     540
tttgccgagc ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc     600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg     660
gacatgccga tcgacgtcgc ggtacgcatc tccgcatcgt tgccatggtt tttcaaatcc     720
gtgaaatgga acggctccga atacatagat ggcggctgcc tgtcgaactt cccaatgccg     780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga aaatccggct cggcatcttc     840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatt     900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg     960
aaagcttctg cagaacactg ggtcgtcggc atcgacgtcg aaggcgccac ccgcgcgtcg    1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat    1080
agcacgttca agttcgatct ttcggacgct gacaaggagc gcatggccga ggccggcgca    1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt    1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat    1260
tcgtttcgag ccttgatcgc ggcctag                                        1287
<210>28
<211>428
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>28
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
 1               5                  10                  15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
            20                  25                  30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
        35                  40                  45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
    50                  55                  60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65                  70                  75                  80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
                85                  90                  95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
            100                 105                 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg
        115                 120                 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
    130                 135                 140
Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg
145                 150                 155                 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
                165                 170                 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
            180                 185                 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
        195                 200                 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
    210                 215                 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225                 230                 235                 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
                245                 250                 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser
            260                 265                 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
        275                 280                 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
    290                 295                 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305                 310                 315                 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
                325                 330                 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
            340                 345                 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
        355                 360                 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
    370                 375                 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385                 390                 395                 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
                405                 410                 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
            420                 425
<210>29
<211>753
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>29
atgggaaacg gtgcagcagt tggttcgaat gataatggta gagaagaaag tgtttacgta     60
ctttctgtga tcgcctgtaa tgtttattat ttacaaaagt gtgaaggtgg ggcatcgcgt    120
gatagcgtga ttagagaaat caatagccaa actcaacctt taggatatga gattgtagca    180
gattctattc gtgatggtca tattggctct tttgcctgta agatggctgt ctttagaaat    240
aatggaaacg gcaattgtgt tttagcaatc aaagggactg atatgaataa tatcaatgac    300
ttggtgaatg acctaaccat gatattagga ggtattggtt ctgttgctgc aatccaacca     360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tacaggtcac     420
tcccttggag gctacatgac tgagatcatc gccaccaatc gtggacttcc aggtattgca     480
ttttgcgcac caggttcaaa tggtcccatt gtaaaattag gtggacaaga gacacctggc     540
tttcacaatg tgaactttga acatgatcca gcaggtaacg ttatgacggg ggtttatact     600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg     660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa     720
agtcataata cgggttatta ttacccaaaa taa                                  753
<210>30
<211>250
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>30
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
 1               5                  10                  15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
            20                  25                  30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
        35                  40                  45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
    50                  55                  60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65                  70                  75                  80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
                85                  90                  95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
            100                 105                 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
        115                 120                 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
    130                 135                 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145                 150                 155                 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
                165                 170                 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
            180                 185                 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
        195                 200                 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
    210                 215                 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225                 230                 235                 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
                245                 250
<210>31
<211>1422
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>31
atgaaaaaga aattatgtac atgggctctc gtaacagcga tatcttctgg agttgttgcg      60
attccaaccg tagcatctgc ttgcggaatg ggtgaagtaa tgaaacagga ggatcaagag     120
cacaaacgtg tgaagagatg gtctgcggag catccgcacc atgctaatga aagcacgcac     180
ttatggattg ctcgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa     240
gaaaatgaat tacaattctt aaaaatacct gaatataagg agttatttga aagagggctt     300
tatgatgccg attatcttga tgagtttaac gatggaggta caggtacaat cggtattgat     360
gggctaatta aaggaggctg gaaatctcat ttctatgatc ctgatacgaa aaagaactat     420
aaaggagaag aagaaccaac agccctttcg caaggggata aatattttaa attagcagga     480
gattatttta agaaagaaga ttggaaacaa gctttctatt atttaggtgt tgcgacgcat     540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacatgagt     600
gcaataaagt ttcatagcgc ttttgaaaat tatgtaacga cagttcagac accgtttgaa     660
gtgaaggatg ataagggaac atataatttg gtcaattctg atgatccgaa gcagtggata     720
catgaaacag cgaaactcgc aaaagcagaa attatgaata ttactagtga taatattaaa     780
tctcaatata ataaaggaaa caaagatctt tggcaacaag aagttatgcc agctgtccag     840
aggagtttag agaaagcgca aagaaacacg gcgggattta ttcatttatg gtttaaaaca     900
tatgttggca aaactgcagc tgaagatatt gaaactacac aggtaaaaga ttctaatgga     960
gaagcaatac aagaacaaaa aaaatactac gttgtgccta gtgagttttt aaatagaggt    1020
ttgacctttg aggtatatgc ttcgaatgac tacgcactat tatctaatca cgtagatgat    1080
aataaagttc atggtacacc tgttcagttt gtttttgata aagagaataa cggaattgtt    1140
catcggggag aaagtgtact gctgaaaatg acgcaatcta actatgatga ttatgtattt    1200
cttaattact ctaatatgac aaattggtta catcttgcga aacgaaaaac aaatactgca    1260
cagtttaaag tgtatccaaa tccggataac tcatctgaat atttcctata tacagatgga    1320
tacccggtaa attatcaaga aaatggtaat gggaagagct ggattgagtt aggaaagaaa    1380
acggataaac cgaaagcgtg gaaatttcaa caggcagaat aa                       1422
<210>32
<211>473
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(20)
<400>32
Met Lys Lys Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Gly Val Val Ala Ile Pro Thr Val Ala Ser Ala Cys Gly Met Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asp Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ala Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Lys Ile Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Lys Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Met Ser Ala Ile Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Val Gln Thr Pro Phe Glu Val Lys Asp Asp
    210                 215                 220
Lys Gly Thr Tyr Asn Leu Val Asn Ser Asp Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Lys Leu Ala Lys Ala Glu Ile Met Asn Ile Thr Ser
                245                 250                 255
Asp Asn Ile Lys Ser Gln Tyr Asn Lys Gly Asn Lys Asp Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Lys Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
    290                 295                 300
Thr Ala Ala Glu Asp Ile Glu Thr Thr Gln Val Lys Asp Ser Asn Gly
305                 310                 315                 320
Glu Ala Ile Gln Glu Gln Lys Lys Tyr Tyr Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ser Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn His Val Asp Asp Asn Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Glu Asn Asn Gly Ile Val His Arg Gly Glu
    370                 375                 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asp Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Met Thr Asn Trp Leu His Leu Ala Lys Arg Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asp Asn Ser Ser
            420                 425                 430
Glu Tyr Phe Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Glu Leu Gly Lys Lys Thr Asp Lys Pro
    450                 455                 460
Lys Ala Trp Lys Phe Gln Gln Ala Glu
465                 470
<210>33
<211>792
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>33
atgagagcac tcgtgctggc aggcggtgga gccaagggct cgtttcaagt gggcgtgctg      60
cagcggttca cccccgcaga cttcggtctc gtggtgggat gctcggtcgg agctttaaac     120
gccgcggggt ttgcccacct gggtagccat ggcatcaaag acctctggca agggatcagg     180
agtcgagatg acatcctgtc ccgtgtctgg tggccgtttg gctcagacgg gatcttctcg     240
cagaagcctc ttgaaaagct cgtctccaaa gcatgcacgg gtcctgctcg ggtgccggtc     300
cacgtggcga cggtctgcct tgaacgcggc cttgtccact acgggatctc cggggactct     360
gactttgaga agaaagtgct ggcatcggct gcgatcccag gcgtggtgaa gccagttaag     420
atccatggcg accactacgt cgacggtggt gtcagagaga tctgtccgct gcgtcgagcc     480
atcgacctgg gcgccacgga gatcacagtc atcatgtgcg ctccggaata catcccgacc     540
tggtcgcgta gttcctcgct gttcccgttt gtgaacgtga tgatccggtc tctcgacatc     600
ctgaccgatg agatcctggt caacgacatc gccgagtgcg tggcaaagaa caagatgcca     660
ggtaaacgtc acgtaaagct caccatctac cggccgaaga aagagctcat gggcacgctc     720
gactttgacc ccaaagccat cgccgcaggg atcaaggcag gcaccgaagc ccagccaagg     780
ttctgggagt aa                                                         792
<210>34
<211>263
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>34
Met Arg Ala Leu Val Leu Ala Gly Gly Gly Ala Lys Gly Ser Phe Gln
 1               5                  10                  15
Val Gly Val Leu Gln Arg Phe Thr Pro Ala Asp Phe Gly Leu Val Val
            20                  25                  30
Gly Cys Ser Val Gly Ala Leu Asn Ala Ala Gly Phe Ala His Leu Gly
        35                  40                  45
Ser His Gly Ile Lys Asp Leu Trp Gln Gly Ile Arg Ser Arg Asp Asp
    50                  55                  60
Ile Leu Ser Arg Val Trp Trp Pro Phe Gly Ser Asp Gly Ile Phe Ser
65                  70                  75                  80
Gln Lys Pro Leu Glu Lys Leu Val Ser Lys Ala Cys Thr Gly Pro Ala
                85                  90                  95
Arg Val Pro Val His Val Ala Thr Val Cys Leu Glu Arg Gly Leu Val
            100                 105                 110
His Tyr Gly Ile Ser Gly Asp Ser Asp Phe Glu Lys Lys Val Leu Ala
        115                 120                 125
Ser Ala Ala Ile Pro Gly Val Val Lys Pro Val Lys Ile His Gly Asp
    130                 135                 140
His Tyr Val Asp Gly Gly Val Arg Glu Ile Cys Pro Leu Arg Arg Ala
145                 150                 155                 160
Ile Asp Leu Gly Ala Thr Glu Ile Thr Val Ile Met Cys Ala Pro Glu
                165                 170                 175
Tyr Ile Pro Thr Trp Ser Arg Ser Ser Ser Leu Phe Pro Phe Val Asn
            180                 185                 190
Val Met Ile Arg Ser Leu Asp Ile Leu Thr Asp Glu Ile Leu Val Asn
        195                 200                 205
Asp Ile Ala Glu Cys Val Ala Lys Asn Lys Met Pro Gly Lys Arg His
    210                 215                 220
Val Lys Leu Thr Ile Tyr Arg Pro Lys Lys Glu Leu Met Gly Thr Leu
225                 230                 235                 240
Asp Phe Asp Pro Lys Ala Ile Ala Ala Gly Ile Lys Ala Gly Thr Glu
                245                 250                 255
Ala Gln Pro Arg Phe Trp Glu
            260
<210>35
<211>1389
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>35
atgcccgagc cgcccgccgc atgccgttgc gattgcgcct gcgagcgcga ccagcacctt      60
ttttgcaagg gacccaagcg tatcctcgcg ctcgacggcg gcggcgtgcg cggcgccgtc     120
agcgtcgcat tcctcgaacg gatcgaggcg gtgctcgagg cccggctcgg acgcaaggtg     180
ctgctcggcc actggttcga cctgatcggc ggcacctcga cgggcgccat catcggcggc     240
gcgctggcga tgggattcgc ggccgaggac gtccaaagat tctatcacga gctcgcgccg     300
cgggtgttca ggcatccgct cctgcgcatc ggtctcctgc gcccgttccg cgcgaaattc     360
gacgcccgcc tgctgcgcga ggagatccac cgcatcatcg gcgacagcac gctcggcgac     420
aaagcgctga tgaccgggtt cgcgctcgtc gccaagcgga tggacaccgg cagcacctgg     480
atcctcgcca acaacaagcg cagcaaatac tgggaagggc gggacggcgt cgtcggcaac     540
aaggattatc tcctcggcag cctcattcgc gcgagcacgg cggcgccgct gtatttcgac     600
cccgaggagg tcgtgatcgc ggaggcccgc aaggacatcg agggcatcag gggcctgttc     660
gtcgacggcg gcgtcacgcc gcacaacaat ccttcgctcg cgatgctgct gctggcgctg     720
ctcgacgcct accggctgcg ctgggaaacg ggaccggaca agctcacggt cgtctcgatc     780
ggcactggaa cgcatcgcga ccgcgtcgtt cccgacacgc tcggcatggg caagaacgcg     840
aagatcgcgc tgcgcgccat gagctcgctg atgaacgacg tgcacgagct cgcgctcacg     900
cagatgcagt acctcggtga gacgctcacc ccgtggcgca tcaacgacga gctcggcgac     960
atgcggaccg agcggccgcc gcaaggcaag ctcttccgct tcctccgcta cgacgtccgg    1020
ctggagctcg attggatcaa cgaggacgag gagcgccggc gcaagatcaa gaacaaattc    1080
aagcgcgagc tgaccgagac cgacatgatc cgcctgcgca gcctcgacga tccgacgacc    1140
atcccggacc tctacatgct tgcccaggtc gcggccgagg agcaggtcaa ggcggagcac    1200
tggctcggcg acgtgccgga gtggagcgaa ggcgcgcgcc cgtgtgcgcc gcgccggcac    1260
ctgccgccga cgccgccggg ccgctccgag gattcggcgc gcttccgggc cgagaaggcc    1320
gtcggcgagt ggctcagttt tgcgcgcgcg aacatcacgc gcctcatgtc gcggaagccg    1380
ccgggttga                                                            1389
<210>36
<211>462
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>36
Met Pro Glu Pro Pro Ala Ala Cys Arg Cys Asp Cys Ala Cys Glu Arg
 1               5                  10                  15
Asp Gln His Leu Phe Cys Lys Gly Pro Lys Arg Ile Leu Ala Leu Asp
            20                  25                  30
Gly Gly Gly Val Arg Gly Ala Val Ser Val Ala Phe Leu Glu Arg Ile
        35                  40                  45
Glu Ala Val Leu Glu Ala Arg Leu Gly Arg Lys Val Leu Leu Gly His
    50                  55                  60
Trp Phe Asp Leu Ile Gly Gly Thr Ser Thr Gly Ala Ile Ile Gly Gly
65                  70                  75                  80
Ala Leu Ala Met Gly Phe Ala Ala Glu Asp Val Gln Arg Phe Tyr His
                85                  90                  95
Glu Leu Ala Pro Arg Val Phe Arg His Pro Leu Leu Arg Ile Gly Leu
            100                 105                 110
Leu Arg Pro Phe Arg Ala Lys Phe Asp Ala Arg Leu Leu Arg Glu Glu
        115                 120                 125
Ile His Arg Ile Ile Gly Asp Ser Thr Leu Gly Asp Lys Ala Leu Met
    130                 135                 140
Thr Gly Phe Ala Leu Val Ala Lys Arg Met Asp Thr Gly Ser Thr Trp
145                 150                 155                 160
Ile Leu Ala Asn Asn Lys Arg Ser Lys Tyr Trp Glu Gly Arg Asp Gly
                165                 170                 175
Val Val Gly Asn Lys Asp Tyr Leu Leu Gly Ser Leu Ile Arg Ala Ser
            180                 185                 190
Thr Ala Ala Pro Leu Tyr Phe Asp Pro Glu Glu Val Val Ile Ala Glu
        195                 200                 205
Ala Arg Lys Asp Ile Glu Gly Ile Arg Gly Leu Phe Val Asp Gly Gly
    210                 215                 220
Val Thr Pro His Asn Asn Pro Ser Leu Ala Met Leu Leu Leu Ala Leu
225                 230                 235                 240
Leu Asp Ala Tyr Arg Leu Arg Trp Glu Thr Gly Pro Asp Lys Leu Thr
                245                 250                 255
Val Val Ser Ile Gly Thr Gly Thr His Arg Asp Arg Val Val Pro Asp
            260                 265                 270
Thr Leu Gly Met Gly Lys Asn Ala Lys Ile Ala Leu Arg Ala Met Ser
        275                 280                 285
Ser Leu Met Asn Asp Val His Glu Leu Ala Leu Thr Gln Met Gln Tyr
    290                 295                 300
Leu Gly Glu Thr Leu Thr Pro Trp Arg Ile Asn Asp Glu Leu Gly Asp
305                 310                 315                 320
Met Arg Thr Glu Arg Pro Pro Gln Gly Lys Leu Phe Arg Phe Leu Arg
                325                 330                 335
Tyr Asp Val Arg Leu Glu Leu Asp Trp Ile Asn Glu Asp Glu Glu Arg
            340                 345                 350
Arg Arg Lys Ile Lys Asn Lys Phe Lys Arg Glu Leu Thr Glu Thr Asp
        355                 360                 365
Met Ile Arg Leu Arg Ser Leu Asp Asp Pro Thr Thr Ile Pro Asp Leu
    370                 375                 380
Tyr Met Leu Ala Gln Val Ala Ala Glu Glu Gln Val Lys Ala Glu His
385                 390                 395                 400
Trp Leu Gly Asp Val Pro Glu Trp Ser Glu Gly Ala Arg Pro Cys Ala
                405                 410                 415
Pro Arg Arg His Leu Pro Pro Thr Pro Pro Gly Arg Ser Glu Asp Ser
            420                 425                 430
Ala Arg Phe Arg Ala Glu Lys Ala Val Gly Glu Trp Leu Ser Phe Ala
        435                 440                 445
Arg Ala Asn Ile Thr Arg Leu Met Ser Arg Lys Pro Pro Gly
    450                 455                 460
<210>37
<211>1329
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>37
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt      60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta     120
acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc     180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag     240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac     300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg     360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat     420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac     480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa     540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac     600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac     660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc     720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc     780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc     840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt     900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag     960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa    1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg    1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg    1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc    1200
gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa    1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca    1320
gtcgtcatc                                                            1329
<210>38
<211>443
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(23)
<400>38
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
 1               5                  10                  15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
            20                  25                  30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
        35                  40                  45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
    50                  55                  60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65                  70                  75                  80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
                85                  90                  95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
            100                 105                 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
        115                 120                 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
    130                 135                 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145                 150                 155                 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
                165                 170                 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
            180                 185                 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
        195                 200                 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu
    210                 215                 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225                 230                 235                 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
                245                 250                 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
            260                 265                 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
        275                 280                 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
    290                 295                 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305                 310                 315                 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
                325                 330                 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
            340                 345                 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
        355                 360                 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
    370                 375                 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385                 390                 395                 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
                405                 410                 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp TrpLys Ile Pro Gln
            420                 425                430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile
        435                 440
<210>39
<211>1335
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>39
atggccaacc ccatcgtcat catccacggc tggagcgacg acttcggctc gttccgcaag      60
ctgcgcgact tcctctccac caacctcggc gttccggcga agatcctcaa gctcggcgac     120
tggatctcgc tcgacgacga cgtcggctac gccgacatcg cgatggcgct ggaacgcgcg     180
tggaaggcgg agaaactgcc gaccgcgccg cgttcggtcg acgtcgtcgt gcacagcacc     240
ggcgcgctgg tggtgcgcga atggatgacg cgctaccacg cgcccgaaac cgtgccgatc     300
cagcgcttcc tgcacctggc gccggccaac ttcggctcgc acctcgcgca caagggccgc     360
tcgttcatcg gccgcgcggt gaagggctgg aagaccggct tcgaaaccgg cacccgcatc     420
ctgcgcgggc tggaactcgc ctcgccctac tcgcgcgcgc tggccgagcg cgacctgttc     480
gtggcgccgt cgaagcgctg gtacggcgcc ggccgcatcc tcgccaccgt gctggtcggc     540
aacagcggct actccggcat ccaggccatc gccaacgagg acggctccga cggcaccgtg     600
cgcatcggca ccgccaacct gcaggcggcg cttgcgaagg tggtgttccc gcccggcccg     660
gtcgcgccgg tggtgcagtt ccgcaacatc gcgggcgcca ccgcgttcgc catcgtcgac     720
ggcgacaacc attccgacat caccatgaag gacaagccgt cgaagaccgg catccgcgag     780
gaactgatcc tcggcgcgct gaaggtgcgc gacgccgact tccccgagaa cgccgacggc     840
gcgttcccgt ggcaggcgaa gctcgacgcg aaggccggtg cggccaaggt gtcttcgccc     900
gggcgccaga acaccgtggt gcacctcacc gacagcttcg gcgacgacgt cgtcgatttc     960
ttcttcgagt tctggcgcag cgaacgcagc gacaaggtgt tcgagcagcg cttctacaag    1020
gacgtcatcg acgacgtgca cgtgtacgac ggcaacggcg cgtggcgctc gctcaacctc    1080
gacctcgaca agttcgaggc gctgcgcaag gacccgaagc tcggcttcga gaaactgctg    1140
gtcagcgtgt tcgcctcgcc cgcgaagaag ggcgacgcca aggtcggcta cagcaccgcc    1200
accggccgcg acatcggcgc ctggcacgtc gaaggccgtg acttcgccaa ggccttcacg    1260
ccgcaccgca ccctgttcgt cgacatcgag atcccacgca tcgtcgacga cgcggtgttc    1320
cggttccggg aatag                                                     1335
<210>40
<211>444
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>40
Met Ala Asn Pro Ile Val Ile Ile His Gly Trp Ser Asp Asp Phe Gly
 1               5                  10                  15
Ser Phe Arg Lys Leu Arg Asp Phe Leu Ser Thr Asn Leu Gly Val Pro
            20                  25                  30
Ala Lys Ile Leu Lys Leu Gly Asp Trp Ile Ser Leu Asp Asp Asp Val
        35                  40                  45
Gly Tyr Ala Asp Ile Ala Met Ala Leu Glu Arg Ala Trp Lys Ala Glu
    50                  55                  60
Lys Leu Pro Thr Ala Pro Arg Ser Val Asp Val Val Val His Ser Thr
65                  70                  75                  80
Gly Ala Leu Val Val Arg Glu Trp Met Thr Arg Tyr His Ala Pro Glu
                85                  90                  95
Thr Val Pro Ile Gln Arg Phe Leu His Leu Ala Pro Ala Asn Phe Gly
            100                 105                 110
Ser His Leu Ala His Lys Gly Arg Ser Phe Ile Gly Arg Ala Val Lys
        115                 120                 125
Gly Trp Lys Thr Gly Phe Glu Thr Gly Thr Arg Ile Leu Arg Gly Leu
    130                 135                 140
Glu Leu Ala Ser Pro Tyr Ser Arg Ala Leu Ala Glu Arg Asp Leu Phe
145                 150                 155                 160
Val Ala Pro Ser Lys Arg Trp Tyr Gly Ala Gly Arg Ile Leu Ala Thr
                165                 170                 175
Val Leu Val Gly Asn Ser Gly Tyr Ser Gly Ile Gln Ala Ile Ala Asn
            180                 185                 190
Glu Asp Gly Ser Asp Gly Thr Val Arg Ile Gly Thr Ala Asn Leu Gln
        195                 200                 205
Ala Ala Leu Ala Lys Val Val Phe Pro Pro Gly Pro Val Ala Pro Val
    210                 215                 220
Val Gln Phe Arg Asn Ile Ala Gly Ala Thr Ala Phe Ala Ile Val Asp
225                 230                 235                 240
Gly Asp Asn His Ser Asp Ile Thr Met Lys Asp Lys Pro Ser Lys Thr
                245                 250                 255
Gly Ile Arg Glu Glu Leu Ile Leu Gly Ala Leu Lys Val Arg Asp Ala
            260                 265                 270
Asp Phe Pro Glu Asn Ala Asp Gly Ala Phe Pro Trp Gln Ala Lys Leu
        275                 280                 285
Asp Ala Lys Ala Gly Ala Ala Lys Val Ser Ser Pro Gly Arg Gln Asn
    290                 295                 300
Thr Val Val His Leu Thr Asp Ser Phe Gly Asp Asp Val Val Asp Phe
305                 310                 315                 320
Phe Phe Glu Phe Trp Arg Ser Glu Arg Ser Asp Lys Val Phe Glu Gln
                325                 330                 335
Arg Phe Tyr Lys Asp Val Ile Asp Asp Val His Val Tyr Asp Gly Asn
            340                 345                 350
Gly Ala Trp Arg Ser Leu Asn Leu Asp Leu Asp Lys Phe Glu Ala Leu
        355                 360                 365
Arg Lys Asp Pro Lys Leu Gly Phe Glu Lys Leu Leu Val Ser Val Phe
    370                 375                 380
Ala Ser Pro Ala Lys Lys Gly Asp Ala Lys Val Gly Tyr Ser Thr Ala
385                 390                 395                 400
Thr Gly Arg Asp Ile Gly Ala Trp His Val Glu Gly Arg Asp Phe Ala
                405                 410                 415
Lys Ala Phe Thr Pro His Arg Thr Leu Phe Val Asp Ile Glu Ile Pro
            420                 425                 430
Arg Ile Val Asp Asp Ala Val Phe Arg Phe Arg Glu
        435                 440
<210>41
<211>1419
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>41
atgacgctcc gatcaacgga ctatgcgctg ctggcgcagg agagctacca cgacagccag      60
gtggacgccg acgtcaagct ggatggcgtg gcgtataaag tcttcgccac caccagcgac     120
gggctcaccg gattccaggc cacggcctac cagcgccagg acaccggcga ggtagtgatt     180
gcgtaccgcg gcacggagtt tgatcgcgag cccgtccgcg acggcggcgt cgatgcgggc     240
atggtgctgc tcggtgtcaa cgcacaggca ccagcgtcgg aagtgttcac ccggcaagtg     300
atcgagaagg cgaaacacga agccgagctc aacgaccgcg aaccgcagat caccgtcacc     360
ggccattccc tcggcggcac cctcgccgag atcaacgccg cgaagtacgg cctccatggc     420
gaaaccttca acgcctacgg cgcagccagc ctcaagggta ttccggaggg cggcgatacc     480
gtcatcgacc acgtccgtgc cggcgatctc gtcagcgcgg ccagccccca ctacgggcag     540
gtacgcgtct acgcggcgca gcaggacatc gatacgctgc aacacgccgg ttaccgcgat     600
gacagcggca tcctcagctt gcgcaacccg atcaaggcca cggatttcga tgcccatgcc     660
atcgataact tcgtgcccaa cagcaagctg ctcggtcagt cgatcatcgc gccggaaaac     720
gtggcgcgtt acgatgccca caaaggcatg gtcgaccgtt accgcgatga cgtggccgat     780
atccgcaagg gcatctcggc gccctgggaa atccccaagg ccatcggcga gctgaaggac     840
accctggagc acgaagcctt cgaactcgcc ggcaagggca ttctcgcggt ggagcacggc     900
ttcgaacatc tcaaggagga gatcggcgaa ggcatccacg ccgtggagga gaaagcttcc     960
agcgcgtggc ataccctcac ccatcccaag gaatggttcg agcacgataa acccaaggtg    1020
accctggacc acccggacca ccccgaccat gccctgttca agcaggcgca gggcgcggtg    1080
cacacagtcg atgcctcgca cggccgcacc cctgacaaga ccagcgacca gatcgccggc    1140
tcgctggtgg tatcggcacg ccgtgacggc cttgagcggg tagaccgcgc tgtactcagc    1200
gatgacgcca accgcctgta cggtgtgcag ggtgcggtgg actcgccgct gaagcaggtc    1260
accgaagtga acaccgccac cgccgcgcag acatcgctcc agcagagcag cgtggcctgg    1320
cagcaacagg cagaaatcgc gcgtcagaac caggcggcaa gccaggctca gcgcatggac    1380
cagcaggtgc cgccgcaggc acccgcgcac ggcatgtaa                           1419
<210>42
<211>472
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>42
Met Thr Leu Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Val Ala Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Ser Asp Gly Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ala Pro Ala Ser Glu Val Phe
                85                  90                  95
Thr Arg Gln Val Ile Glu Lys Ala Lys His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Gln Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asp Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Val Ala Arg Tyr Asp Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Lys Gly Ile Ser Ala Pro Trp Glu Ile Pro
            260                 265                 270
Lys Ala Ile Gly Glu Leu Lys Asp Thr Leu Glu His Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Phe Glu His Leu
    290                 295                 300
Lys Glu Glu Ile Gly Glu Gly Ile His Ala Val Glu Glu Lys Ala Ser
305                 310                 315                 320
Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu His Asp
                325                 330                 335
Lys Pro Lys Val Thr Leu Asp His Pro Asp His Pro Asp His Ala Leu
            340                 345                 350
Phe Lys Gln Ala Gln Gly Ala Val His Thr Val Asp Ala Ser His Gly
        355                 360                 365
Arg Thr Pro Asp Lys Thr Ser Asp Gln Ile Ala Gly Ser Leu Val Val
    370                 375                 380
Ser Ala Arg Arg Asp Gly Leu Glu Arg Val Asp Arg Ala Val Leu Ser
385                 390                 395                 400
Asp Asp Ala Asn Arg Leu Tyr Gly Val Gln Gly Ala Val Asp Ser Pro
                405                 410                 415
Leu Lys Gln Val Thr Glu Val Asn Thr Ala Thr Ala Ala Gln Thr Ser
            420                 425                 430
Leu Gln Gln Ser Ser Val Ala Trp Gln Gln Gln Ala Glu Ile Ala Arg
        435                 440                 445
Gln Asn Gln Ala Ala Ser Gln Ala Gln Arg Met Asp Gln Gln Val Pro
    450                 455                 460
Pro Gln Ala Pro Ala His Gly Met
465                 470
<210>43
<211>1287
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>43
atgtcgatta ccgtttaccg gaagccctcc ggcgggtttg gagcgatagt tcctcaagcg      60
aaaattgaga accttgtttt cgagggcggc ggaccaaagg gcctggtcta tgtcggcgcg     120
gtcgaggttc tcggtgaaag gggactgctg gaagggatcg caaatgtcgg cggcgcttca     180
gcaggcgcca tgaccgctct agccgtcggt ctgggactga gccccaggga aattcgcgcg     240
gtcgtcttta accagaacat tgcggacctc accgatatcg agaagaccgt cgagccgtcc     300
tccgggatca caggcatgtt caagagcgtg ttcaagaagg gttggcaggc ggtgcgcaac     360
gtaaccggca cctctgacga gcgcgggcgc gggctctatc gcggcgagaa gttgcgagcc     420
tggatcagag acctgattgc acagcgagtc gaggcagggc gctcagaggt gctgagccga     480
gccgacgccg acgggcggaa cttctatgag aaagccgccg caaagaaggg cgccctgaca     540
tttgccgaac ttgatcgggt ggcgcaaatg gcgccgggcc tgcggcttcg ccgcctggcc     600
ttcaccggaa ccaacttcac gtcgaagaag ctcgaagtgt tcagtctgca cgagaccccg     660
gacatgccga tcgacgtcgc ggtacgcatc tcggcatcgt tgccatggtt tttcaaatcc     720
gtgaaatgga acggctccga atacatagat ggcggatgcc tgtcgaactt cccaatgccg     780
atattcgacg tcgatcccta tcgtggcgac gcatcgtcga agatccggct cggcatcttc     840
ggccagaacc tcgcgacgct cggcttcaag gtcgacagcg aggaggagat ccgcgacatc     900
ctctggcgta gccccgagag cacgagcgac ggctttttcc aaggcatcct gtcaagcgtg     960
aaagcctcgg cagaacactg ggtcgtcggc atcgatgtcg agggcgccac ccgcgcgtcg    1020
aacgtggccg ttcacggcaa gtatgctcag cgaacgatcc agataccgga cctcggatat    1080
agcacgttca agttcgatct ctcagacgcg gacaaggagc gcatggccga ggccggcgca    1140
aaggccacgc gggaatggct ggcgctgtac ttcgacgacg ccggaataga ggtcgaattt    1200
tctgatccga acgaattgcg cggccagttg tccgacgccg cattcgcaga cctcgaggat    1260
tcgtttcgag ccttgatcgc ggcctag                                        1287
<210>44
<211>428
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>44
Met Ser Ile Thr Val Tyr Arg Lys Pro Ser Gly Gly Phe Gly Ala Ile
 1               5                  10                  15
Val Pro Gln Ala Lys Ile Glu Asn Leu Val Phe Glu Gly Gly Gly Pro
            20                  25                  30
Lys Gly Leu Val Tyr Val Gly Ala Val Glu Val Leu Gly Glu Arg Gly
        35                  40                  45
Leu Leu Glu Gly Ile Ala Asn Val Gly Gly Ala Ser Ala Gly Ala Met
    50                  55                  60
Thr Ala Leu Ala Val Gly Leu Gly Leu Ser Pro Arg Glu Ile Arg Ala
65                  70                  75                  80
Val Val Phe Asn Gln Asn Ile Ala Asp Leu Thr Asp Ile Glu Lys Thr
                85                  90                  95
Val Glu Pro Ser Ser Gly Ile Thr Gly Met Phe Lys Ser Val Phe Lys
            100                 105                 110
Lys Gly Trp Gln Ala Val Arg Asn Val Thr Gly Thr Ser Asp Glu Arg
        115                 120                 125
Gly Arg Gly Leu Tyr Arg Gly Glu Lys Leu Arg Ala Trp Ile Arg Asp
    130                 135                 140
Leu Ile Ala Gln Arg Val Glu Ala Gly Arg Ser Glu Val Leu Ser Arg
145                 150                 155                 160
Ala Asp Ala Asp Gly Arg Asn Phe Tyr Glu Lys Ala Ala Ala Lys Lys
                165                 170                 175
Gly Ala Leu Thr Phe Ala Glu Leu Asp Arg Val Ala Gln Met Ala Pro
            180                 185                 190
Gly Leu Arg Leu Arg Arg Leu Ala Phe Thr Gly Thr Asn Phe Thr Ser
        195                 200                 205
Lys Lys Leu Glu Val Phe Ser Leu His Glu Thr Pro Asp Met Pro Ile
    210                 215                 220
Asp Val Ala Val Arg Ile Ser Ala Ser Leu Pro Trp Phe Phe Lys Ser
225                 230                 235                 240
Val Lys Trp Asn Gly Ser Glu Tyr Ile Asp Gly Gly Cys Leu Ser Asn
                245                 250                 255
Phe Pro Met Pro Ile Phe Asp Val Asp Pro Tyr Arg Gly Asp Ala Ser
            260                 265                 270
Ser Lys Ile Arg Leu Gly Ile Phe Gly Gln Asn Leu Ala Thr Leu Gly
        275                 280                 285
Phe Lys Val Asp Ser Glu Glu Glu Ile Arg Asp Ile Leu Trp Arg Ser
    290                 295                 300
Pro Glu Ser Thr Ser Asp Gly Phe Phe Gln Gly Ile Leu Ser Ser Val
305                 310                 315                 320
Lys Ala Ser Ala Glu His Trp Val Val Gly Ile Asp Val Glu Gly Ala
                325                 330                 335
Thr Arg Ala Ser Asn Val Ala Val His Gly Lys Tyr Ala Gln Arg Thr
            340                 345                 350
Ile Gln Ile Pro Asp Leu Gly Tyr Ser Thr Phe Lys Phe Asp Leu Ser
        355                 360                 365
Asp Ala Asp Lys Glu Arg Met Ala Glu Ala Gly Ala Lys Ala Thr Arg
    370                 375                 380
Glu Trp Leu Ala Leu Tyr Phe Asp Asp Ala Gly Ile Glu Val Glu Phe
385                 390                 395                 400
Ser Asp Pro Asn Glu Leu Arg Gly Gln Leu Ser Asp Ala Ala Phe Ala
                405                 410                 415
Asp Leu Glu Asp Ser Phe Arg Ala Leu Ile Ala Ala
            420                 425
<210>45
<211>1038
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>45
atgacaaccc aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac      60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattca ccgagtcgga     120
gggtgcagtg cgggtgcgat taatgcgctg atttttgcgc tgggttacac ggttcgtgag     180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggtgtt     240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt     300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat     360
ctgcaaaatg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt     420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc     480
tccatgtcga taccgctgtt ctttgcagcc gtgcgtcacg gtgatcgaca agatgtgtat     540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt     600
gatctggcca aagatcccgg tgctgttcgg cgaacgggtt attacaacaa agaaaacgct     660
cgctttcagc ttgagcggcc cggtcatagc ccctatgttt acaatcgcca gaccttgggt     720
ttgcgtcttg atagtcgcga gcagataggg ctctttcgtt atgacgaacc cctcaagggc     780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca     840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacattg     900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa     960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcccgtg    1020
aatagagtgg agtcatag                                                  1038
<210>46
<211>345
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>46
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Asn Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Gln Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>47
<211>1476
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>47
atgtcaacaa aagtagtatt tgtacatgga tggagcgtta ccaacctaaa tacatatggc      60
gaacttccgt tgagattaaa ggccgaagca ataagcagga acctgaacat cgaagtaaat     120
gaaattttcc tgggccgtta tatcagcttt aatgataaca ttacattaga tgacgtttcg     180
cgggctttta atacggccat tagcgaacag ttagacaata cagacaggtt tatatgtatt     240
acacattcta ccggagggcc ggttattcgc gaatggttaa ataaatacta ttataatgaa     300
cgtccaccac taagtcattt aataatgctt gcaccggcca attttggttc ggcattggct     360
cgtttaggga aaagtaaatt aagccgtatt aaaagttggt ttgaaggtgt agaaccaggg     420
cagaaaattt tagactggct ggagtgtgga agcaaccaat cgtggttact aaataaagac     480
tggatcgaca atggcaattt tcagattggc gctgataagt atttcccgtt tgttatcatt     540
ggccagtcga ttgatcgtaa actttacgat catcttaact catataccgg cgagcttggg     600
tccgatggtg tagttcgcac ctcaggagct aatcttaatt cgcggtatat taagcttgtt     660
caggacagaa atacaatagc taatggaaat atttccagta cattacgaat tgccgaatat     720
agagaagctt gtgcaacgcc catacgggta gttagaggta aatcgcattc gggcgatgaa     780
atgggtatca tgaaaagtgt taaaaaagaa attactgatg ccggaagcaa ggaaacaata     840
aatgccatat tcgagtgtat tgaagttaca aacaacgaac aatatcaatc cttaattact     900
aaatttgata acgaaacagc acaggtacaa aaggatgagc tgattgaaac ggaaacagaa     960
ttatttttaa tgcaccgtca tttcattcac gaccgctttt cgcaattcat ttttaaagta    1020
actgactcag aagggcaacc tgttacagat tatgatttaa tttttacagc cgggccacaa    1080
aacgatgcga accacttacc ggaaggattt gccattgaca ggcaacaaaa ttcaaataat    1140
aacgaaacca ttacgtatta ttttaattac gatgtattga aaggggctcc cgcaaatgtt    1200
taccgggacg cattaccagg tatttctatg ctggggctaa ccataaaccc aaggccggac    1260
gaaggttttg taagatatat cccatgcagc attaaagcca attccgagtt gatggaaaaa    1320
gcctttaaac caaattctac taccttggtc gatattgtta ttcaacgtgt agttagcaaa    1380
gaagtttttc ggttggaaaa gttaactggt agctcaatgc caacagacaa agatgggaat    1440
tttaaaaata ctgaacctgg taacgaaata atatga                              1476
<210>48
<211>491
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>48
Met Ser Thr Lys Val Val Phe Val His Gly Trp Ser Val Thr Asn Leu
 1               5                  10                  15
Asn Thr Tyr Gly Glu Leu Pro Leu Arg Leu Lys Ala Glu Ala Ile Ser
            20                  25                  30
Arg Asn Leu Asn Ile Glu Val Asn Glu Ile Phe Leu Gly Arg Tyr Ile
        35                  40                  45
Ser Phe Asn Asp Asn Ile Thr Leu Asp Asp Val Ser Arg Ala Phe Asn
    50                  55                  60
Thr Ala Ile Ser Glu Gln Leu Asp Asn Thr Asp Arg Phe Ile Cys Ile
65                  70                  75                  80
Thr His Ser Thr Gly Gly Pro Val Ile Arg Glu Trp Leu Asn Lys Tyr
                85                  90                  95
Tyr Tyr Asn Glu Arg Pro Pro Leu Ser His Leu Ile Met Leu Ala Pro
            100                 105                 110
Ala Asn Phe Gly Ser Ala Leu Ala Arg Leu Gly Lys Ser Lys Leu Ser
        115                 120                 125
Arg Ile Lys Ser Trp Phe Glu Gly Val Glu Pro Gly Gln Lys Ile Leu
    130                 135                 140
Asp Trp Leu Glu Cys Gly Ser Asn Gln Ser Trp Leu Leu Asn Lys Asp
145                 150                 155                 160
Trp Ile Asp Asn Gly Asn Phe Gln Ile Gly Ala Asp Lys Tyr Phe Pro
                165                 170                 175
Phe Val Ile Ile Gly Gln Ser Ile Asp Arg Lys Leu Tyr Asp His Leu
            180                 185                 190
Asn Ser Tyr Thr Gly Glu Leu Gly Ser Asp Gly Val Val Arg Thr Ser
        195                 200                 205
Gly Ala Asn Leu Asn Ser Arg Tyr Ile Lys Leu Val Gln Asp Arg Asn
    210                 215                 220
Thr Ile Ala Asn Gly Asn Ile Ser Ser Thr Leu Arg Ile Ala Glu Tyr
225                 230                 235                 240
Arg Glu Ala Cys Ala Thr Pro Ile Arg Val Val Arg Gly Lys Ser His
                245                 250                 255
Ser Gly Asp Glu Met Gly Ile Met Lys Ser Val Lys Lys Glu Ile Thr
            260                 265                 270
Asp Ala Gly Ser Lys Glu Thr Ile Asn Ala Ile Phe Glu Cys Ile Glu
        275                 280                 285
Val Thr Asn Asn Glu Gln Tyr Gln Ser Leu Ile Thr Lys Phe Asp Asn
    290                 295                 300
Glu Thr Ala Gln Val Gln Lys Asp Glu Leu Ile Glu Thr Glu Thr Glu
305                 310                 315                 320
Leu Phe Leu Met His Arg His Phe Ile His Asp Arg Phe Ser Gln Phe
                325                 330                 335
Ile Phe Lys Val Thr Asp Ser Glu Gly Gln Pro Val Thr Asp Tyr Asp
            340                 345                 350
Leu Ile Phe Thr Ala Gly Pro Gln Asn Asp Ala Asn His Leu Pro Glu
        355                 360                 365
Gly Phe Ala Ile Asp Arg Gln Gln Asn Ser Asn Asn Asn Glu Thr Ile
    370                 375                 380
Thr Tyr Tyr Phe Asn Tyr Asp Val Leu Lys Gly Ala Pro Ala Asn Val
385                 390                 395                 400
Tyr Arg Asp Ala Leu Pro Gly Ile Ser Met Leu Gly Leu Thr Ile Asn
                405                 410                 415
Pro Arg Pro Asp Glu Gly Phe Val Arg Tyr Ile Pro Cys Ser Ile Lys
            420                 425                 430
Ala Asn Ser Glu Leu Met Glu Lys Ala Phe Lys Pro Asn Ser Thr Thr
        435                 440                 445
Leu Val Asp Ile Val Ile Gln Arg Val Val Ser Lys Glu Val Phe Arg
    450                 455                 460
Leu Glu Lys Leu Thr Gly Ser Ser Met Pro Thr Asp Lys Asp Gly Asn
465                 470                 475                 480
Phe Lys Asn Thr Glu Pro Gly Asn Glu Ile Ile
                485                 490
<210>49
<211>1257
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>49
atgaattttt ggtcctttct tcttagtata accttaccta tgggggtagg cgttgctcat      60
gcacagcccg atacggattt tcaatcggct gagccttatg tctcttctgc gccaatgggg     120
cgacaaactt atacttacgt gcgttgttgg tatcgcacca gccacagtac ggatgatcca     180
gcgacagatt ggcagtgggc gagaaactcc gatggtagct attttacttt gcaaggatac     240
tggtggagct cggtaagact aaaaaatatg ttttacactc aaacctcgca aaatgttatt     300
cgtcagcgct gcgaacacac tttaagcatt aatcatgata atgcggatat tactttttat     360
gcggcggata atcgtttctc attaaaccat acgatttggt cgaatgatcc tgtcatgcag     420
gctaatcaaa tcaacaagat tgtcgcgttt ggtgacagct tgtccgatac cggtaatatt     480
tttaatgccg cgcagtggcg ttttcctaat cccaatagtt ggtttttggg gcatttttct     540
aacggtttgg tatggactga gtacttagct aaacagaaaa acttaccgat atataactgg     600
gcggttggtg gcgctgctgg ggcgaatcaa tatgtggcgt taaccggtgt tacaggccaa     660
gtgaactctt atttacagta catgggtaaa gcgcaaaact atcgtccaca gaataccttg     720
tacactttgg tcttcggttt gaatgatttt atgaattata accgtgaggt tgctgaggtg     780
gcggctgatt ttgaaacggc attacagcgt ttaacgcaag ctggcgcgca aaatatttta     840
atgatgacgc taccggatgt gactaaagca ccacagttta cctactcaac tcaagcggaa     900
atcgacttga ttcaaggtaa aatcaatgcg ttgaacatca agttaaaaca gttgactgcg     960
caatatattt tacaaggcta tgccattcat ctatttgata cttatgagtt atttgattca    1020
atggtcgctg aaccggaaaa gcatggcttt gctaatgcca gtgaaccttg tttgaatctc    1080
acccgttctt cagcggcgga ttatttgtac cgtcatccca ttaccaatac ttgtgctcgt    1140
tatggtgcag acaaatttgt attttgggat gtcacccatc caaccacggc aactcatcgc    1200
tatatttcac aaacgctgtt agcgccgggt aatggattac aatattttaa tttttaa       1257
<210>50
<211>418
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)…(23)
<400>50
Met Asn Phe Trp Ser Phe Leu Leu Ser Ile Thr Leu Pro Met Gly Val
 1               5                  10                  15
Gly Val Ala His Ala Gln Pro Asp Thr Asp Phe Gln Ser Ala Glu Pro
            20                  25                  30
Tyr Val Ser Ser Ala Pro Met Gly Arg Gln Thr Tyr Thr Tyr Val Arg
        35                  40                  45
Cys Trp Tyr Arg Thr Ser His Ser Thr Asp Asp Pro Ala Thr Asp Trp
    50                  55                  60
Gln Trp Ala Arg Asn Ser Asp Gly Ser Tyr Phe Thr Leu Gln Gly Tyr
65                  70                  75                  80
Trp Trp Ser Ser Val Arg Leu Lys Asn Met Phe Tyr Thr Gln Thr Ser
                85                  90                  95
Gln Asn Val Ile Arg Gln Arg Cys Glu His Thr Leu Ser Ile Asn His
            100                 105                 110
Asp Asn Ala Asp Ile Thr Phe Tyr Ala Ala Asp Asn Arg Phe Ser Leu
        115                 120                 125
Asn His Thr Ile Trp Ser Asn Asp Pro Val Met Gln Ala Asn Gln Ile
    130                 135                 140
Asn Lys Ile Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Ile
145                 150                 155                 160
Phe Asn Ala Ala Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp Phe Leu
                165                 170                 175
Gly His Phe Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Lys Gln
            180                 185                 190
Lys Asn Leu Pro Ile Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Ala
        195                 200                 205
Asn Gln Tyr Val Ala Leu Thr Gly Val Thr Gly Gln Val Asn Ser Tyr
    210                 215                 220
Leu Gln Tyr Met Gly Lys Ala Gln Asn Tyr Arg Pro Gln Asn Thr Leu
225                 230                 235                 240
Tyr Thr Leu Val Phe Gly Leu Asn Asp Phe Met Asn Tyr Asn Arg Glu
                245                 250                 255
Val Ala Glu Val Ala Ala Asp Phe Glu Thr Ala Leu Gln Arg Leu Thr
            260                 265                 270
Gln Ala Gly Ala Gln Asn Ile Leu Met Met Thr Leu Pro Asp Val Thr
        275                 280                 285
Lys Ala Pro Gln Phe Thr Tyr Ser Thr Gln Ala Glu Ile Asp Leu Ile
    290                 295                 300
Gln Gly Lys Ile Asn Ala Leu Asn Ile Lys Leu Lys Gln Leu Thr Ala
305                 310                 315                 320
Gln Tyr Ile Leu Gln Gly Tyr Ala Ile His Leu Phe Asp Thr Tyr Glu
                325                 330                 335
Leu Phe Asp Ser Met Val Ala Glu Pro Glu Lys His Gly Phe Ala Asn
            340                 345                 350
Ala Ser Glu Pro Cys Leu Asn Leu Thr Arg Ser Ser Ala Ala Asp Tyr
        355                 360                 365
Leu Tyr Arg His Pro Ile Thr Asn Thr Cys Ala Arg Tyr Gly Ala Asp
    370                 375                 380
Lys Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr His Arg
385                 390                 395                 400
Tyr Ile Ser Gln Thr Leu Leu Ala Pro Gly Asn Gly Leu Gln Tyr Phe
          405            410             415
Asn Phe
<210>51
<211>1482
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>51
atgacaatcc gctcaacgga ctatgcgctg ctcgcgcagg agagctacca cgacagccag      60
gtcgatgccg acgtcaaact cgatggcatc gcctacaagg tcttcgccac caccgatgac     120
ccgctcacgg ggttccaggc caccgcgtac cagcgccagg acaccggcga agtcgtcatc     180
gcctatcgtg gtacggaatt cgaccgcgag cccgttcgcg acggcggcgt cgatgccggc     240
atggtgctgc tgggggtgaa tgcccagtcg cctgcctccg agctatttac ccgcgaagtg     300
atcgagaagg cgacgcacga agccgaactc aatgaccgcg agccccggat caccgtgact     360
ggccactccc tcggcggcac cctcgccgaa atcaacgcgg ccaagtacgg cctgcacggc     420
gaaaccttca acgcatacgg tgcggccagc ctcaagggca tcccggaagg cggcaatacc     480
gtgatcgacc acgtgcgcgc tggcgacctc gtcagcgccg ccagcccgca ttacgggcag     540
gtgcgcgtct acgcggccca gcaggatatc gacaccttgc agcatgccgg ctaccgcgac     600
gacagcggca tccttagcct gcgcaacccg atcaaggcca cggatttcga cgcgcacgcc     660
atcgacaact tcgtgccgaa cagcaaactg cttggccagt cgatcatcgc gccggaaaac     720
gaagcccgtt acgaagccca caagggcatg gtcgaccgct accgcgatga cgtggctgac     780
atccgcatgc tcgtctccgc tcccctgaac atcccgcgca ccatcggcga tatcaaggat     840
gccgtggaac gcgaggcatt tgagctggct ggcaagggca tcctcgccgt tgaacacggc     900
atcgaagagg tcgtgcacga ggcaaaggaa ggcttcgagc acctcaagga aggctttgag     960
cacctgaagg aagaagtcag cgagggcttc catgccttcg aggaaaaggc ctccagcgcg    1020
tggcatacgc tgacccatcc caaggaatgg ttcgagcacg acaagccgca ggtcgccctg    1080
aaccacccac agcacccgga caacgaactg ttcaagaagg tgctcgaagg cgtgcaccag    1140
gttgatgcga agcagggtcg ttcacccgac cagctcagtg agaacctggc cgcatcgctt    1200
accgttgccg cacgcaagga aggcctggac aaggtcaacc acgtgctgct cgacgacccc    1260
ggcattcgca cctacgccgt gcagggtgag ctcaactcgc cgttgaagca ggtctccagt    1320
gtcgataacg cccaggcggt cgccacaccg gtggcccaga gcagcgcgca atggcagcag    1380
gctgccgagg cgcggcaggc acagcacaat gaggcgcttg cgcagcagca ggcgcaacag    1440
cagcagaaca accggcccaa ccatggggtt gccggcccgt ga                       1482
<210>52
<211>493
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>52
Met Thr Ile Arg Ser Thr Asp Tyr Ala Leu Leu Ala Gln Glu Ser Tyr
 1               5                  10                  15
His Asp Ser Gln Val Asp Ala Asp Val Lys Leu Asp Gly Ile Ala Tyr
            20                  25                  30
Lys Val Phe Ala Thr Thr Asp Asp Pro Leu Thr Gly Phe Gln Ala Thr
        35                  40                  45
Ala Tyr Gln Arg Gln Asp Thr Gly Glu Val Val Ile Ala Tyr Arg Gly
    50                  55                  60
Thr Glu Phe Asp Arg Glu Pro Val Arg Asp Gly Gly Val Asp Ala Gly
65                  70                  75                  80
Met Val Leu Leu Gly Val Asn Ala Gln Ser Pro Ala Ser Glu Leu Phe
                85                  90                  95
Thr Arg Glu Val Ile Glu Lys Ala Thr His Glu Ala Glu Leu Asn Asp
            100                 105                 110
Arg Glu Pro Arg Ile Thr Val Thr Gly His Ser Leu Gly Gly Thr Leu
        115                 120                 125
Ala Glu Ile Asn Ala Ala Lys Tyr Gly Leu His Gly Glu Thr Phe Asn
    130                 135                 140
Ala Tyr Gly Ala Ala Ser Leu Lys Gly Ile Pro Glu Gly Gly Asn Thr
145                 150                 155                 160
Val Ile Asp His Val Arg Ala Gly Asp Leu Val Ser Ala Ala Ser Pro
                165                 170                 175
His Tyr Gly Gln Val Arg Val Tyr Ala Ala Gln Gln Asp Ile Asp Thr
            180                 185                 190
Leu Gln His Ala Gly Tyr Arg Asp Asp Ser Gly Ile Leu Ser Leu Arg
        195                 200                 205
Asn Pro Ile Lys Ala Thr Asp Phe Asp Ala His Ala Ile Asp Asn Phe
    210                 215                 220
Val Pro Asn Ser Lys Leu Leu Gly Gln Ser Ile Ile Ala Pro Glu Asn
225                 230                 235                 240
Glu Ala Arg Tyr Glu Ala His Lys Gly Met Val Asp Arg Tyr Arg Asp
                245                 250                 255
Asp Val Ala Asp Ile Arg Met Leu Val Ser Ala Pro Leu Asn Ile Pro
            260                 265                 270
Arg Thr Ile Gly Asp Ile Lys Asp Ala Val Glu Arg Glu Ala Phe Glu
        275                 280                 285
Leu Ala Gly Lys Gly Ile Leu Ala Val Glu His Gly Ile Glu Glu Val
    290                 295                 300
Val His Glu Ala Lys Glu Gly Phe Glu His Leu Lys Glu Gly Phe Glu
305                 310                 315                 320
His Leu Lys Glu Glu Val Ser Glu Gly Phe His Ala Phe Glu Glu Lys
                325                 330                 335
Ala Ser Ser Ala Trp His Thr Leu Thr His Pro Lys Glu Trp Phe Glu
            340                 345                 350
His Asp Lys Pro Gln Val Ala Leu Asn His Pro Gln His Pro Asp Asn
        355                 360                 365
Glu Leu Phe Lys Lys Val Leu Glu Gly Val His Gln Val Asp Ala Lys
    370                 375                 380
Gln Gly Arg Ser Pro Asp Gln Leu Ser Glu Asn Leu Ala Ala Ser Leu
385                 390                 395                 400
Thr Val Ala Ala Arg Lys Glu Gly Leu Asp Lys Val Asn His Val Leu
                405                 410                  415
Leu Asp Asp Pro Gly Ile Arg Thr Tyr Ala Val Gln Gly Glu Leu Asn
            420                 425                 430
Ser Pro Leu Lys Gln Val Ser Ser Val Asp Asn Ala Gln Ala Val Ala
        435                 440                 445
Thr Pro Val Ala Gln Ser Ser Ala Gln Trp Gln Gln Ala Ala Glu Ala
    450                 455                 460
Arg Gln Ala Gln His Asn Glu Ala Leu Ala Gln Gln Gln Ala Gln Gln
465                 470                 475                 480
Gln Gln Asn Asn Arg Pro Asn His Gly Val Ala Gly Pro
                485                 490
<210>53
<211>1491
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>53
atgcgtcagg ttacattagt atttgttcat ggctacagcg ttacaaacat cgacacttat      60
ggtgaaatgc cactcaggct ccgcaacgaa ggagccacac gtgatataga aataaaaatt     120
gagaacattt tcctggggcg ctacatcagc tttaatgatg atgtgagatt aaatgatgtt     180
tccagagcat tggaaacagc cgtacaacaa cagattgcac cgggaaataa aaacaattcc     240
cgttacgtat tcatcaccca ctctaccggc ggaccggtag tgagaaactg gtgggatctg     300
tactataaaa acagcacgaa acaatgccct atgagccacc tcattatgct ggctcctgcc     360
aattttggct cggcactggc acaactggga aaaagcaaac taagccgcat taaatcctgg     420
ttcgatggtg tggaacccgg acagaatgta ttgaattggc tggaactggg aagcgcggaa     480
gcatggaagc taaacaccga ctggattaag agtgatggaa gtcagatctc ggcacagggt     540
atttttcctt ttgtgatcat aggtcaggac attgaccgca aattatacga tcatttaaac     600
tcctacaccg gtgagctggg ttccgacggc gtggtgcgtt cggccgcagc caatttaaat     660
gctacttatg taaaactcac acaacctaaa cccaccttgg taaatggaaa actggtaaca     720
ggtaatctgg aaataggaga agtaaaacaa gcgccttata cacccatgcg catcgtctca     780
aaaaaatcgc attccaacaa ggatatggga attatgagaa gtgtactgaa atcaacaaat     840
gatgccaaca gcgccgaaac ggtaaacgcc atttttgact gcattaatgt gaaaacctta     900
accgattacc agagcattgc cacacagttt gattcgcaaa caaaagacgt gcaggaaaat     960
tcaattattg aaagggaaaa aacgcccttt ggaactaaaa actatattca cgaccgtttc    1020
tcccaggtca ttttcagagt aacagacagt gaaggttacc cggttaccag ttttgatctg    1080
atcctcaccg gcggcgaaaa aaatgatccc aacgccttgc ctcagggctt ttttgtggac    1140
agacaatgca acagtgtcaa taaatcgacc attacttatt ttttaaatta cgatattatg    1200
aacggcacac cagctatagc aggtataaga ccggcatcca aaggcatgga aaaactgggt    1260
ctgatcatta acccaaggcc tgaagaaggc tttgtgcgtt acattccctg caaaataaac    1320
acatcgcccg atttgtttga cgccgctctg aaacccaacg ccacaacgct tattgatatt    1380
gtattgcaac gcgtggtaag taccgaagta ttccgctttg aaggaacaga cggggtaacg    1440
ccgcctaaaa aagatttctc gaaagtgaaa cccggaacgg atattatttg a             1491
<210>54
<211>496
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>54
Met Arg Gln Val Thr Leu Val Phe Val His Gly Tyr Ser Val Thr Asn
 1               5                  10                  15
Ile Asp Thr Tyr Gly Glu Met Pro Leu Arg Leu Arg Asn Glu Gly Ala
            20                  25                  30
Thr Arg Asp Ile Glu Ile Lys Ile Glu Asn Ile Phe Leu Gly Arg Tyr
        35                  40                  45
Ile Ser Phe Asn Asp Asp Val Arg Leu Asn Asp Val Ser Arg Ala Leu
    50                  55                  60
Glu Thr Ala Val Gln Gln Gln Ile Ala Pro Gly Asn Lys Asn Asn Ser
65                  70                  75                  80
Arg Tyr Val Phe Ile Thr His Ser Thr Gly Gly Pro Val Val Arg Asn
                85                  90                  95
Trp Trp Asp Leu Tyr Tyr Lys Asn Ser Thr Lys Gln Cys Pro Met Ser
            100                 105                 110
His Leu Ile Met Leu Ala Pro Ala Asn Phe Gly Ser Ala Leu Ala Gln
        115                 120                 125
Leu Gly Lys Ser Lys Leu Ser Arg Ile Lys Ser Trp Phe Asp Gly Val
    130                 135                 140
Glu Pro Gly Gln Asn Val Leu Asn Trp Leu Glu Leu Gly Ser Ala Glu
145                 150                 155                 160
Ala Trp Lys Leu Asn Thr Asp Trp Ile Lys Ser Asp Gly Ser Gln Ile
                165                 170                 175
Ser Ala Gln Gly Ile Phe Pro Phe Val Ile Ile Gly Gln Asp Ile Asp
            180                 185                 190
Arg Lys Leu Tyr Asp His Leu Asn Ser Tyr Thr Gly Glu Leu Gly Ser
        195                 200                 205
Asp Gly Val Val Arg Ser Ala Ala Ala Asn Leu Asn Ala Thr Tyr Val
    210                 215                 220
Lys Leu Thr Gln Pro Lys Pro Thr Leu Val Asn Gly Lys Leu Val Thr
225                 230                 235                 240
Gly Asn Leu Glu Ile Gly Glu Val Lys Gln Ala Pro Tyr Thr Pro Met
                245                 250                 255
Arg Ile Val Ser Lys Lys Ser His Ser Asn Lys Asp Met Gly Ile Met
            260                 265                 270
Arg Ser Val Leu Lys Ser Thr Asn Asp Ala Asn Ser Ala Glu Thr Val
        275                 280                 285
Asn Ala Ile Phe Asp Cys Ile Asn Val Lys Thr Leu Thr Asp Tyr Gln
    290                 295                 300
Ser Ile Ala Thr Gln Phe Asp Ser Gln Thr Lys Asp Val Gln Glu Asn
305                 310                 315                 320
Ser Ile Ile Glu Arg Glu Lys Thr Pro Phe Gly Thr Lys Asn Tyr Ile
                325                 330                 335
His Asp Arg Phe Ser Gln Val Ile Phe Arg Val Thr Asp Ser Glu Gly
            340                 345                 350
Tyr Pro Val Thr Ser Phe Asp Leu Ile Leu Thr Gly Gly Glu Lys Asn
        355                 360                 365
Asp Pro Asn Ala Leu Pro Gln Gly Phe Phe Val Asp Arg Gln Cys Asn
    370                 375                 380
Ser Val Asn Lys Ser Thr Ile Thr Tyr Phe Leu Asn Tyr Asp Ile Met
385                 390                 395                 400
Asn Gly Thr Pro Ala Ile Ala Gly Ile Arg Pro Ala Ser Lys Gly Met
                405                 410                 415
Glu Lys Leu Gly Leu Ile Ile Asn Pro Arg Pro Glu Glu Gly Phe Val
            420                 425                 430
Arg Tyr Ile Pro Cys Lys Ile Asn Thr Ser Pro Asp Leu Phe Asp Ala
        435                 440                 445
Ala Leu Lys Pro Asn Ala Thr Thr Leu Ile Asp Ile Val Leu Gln Arg
    450                 455                 460
Val Val Ser Thr Glu Val Phe Arg Phe Glu Gly Thr Asp Gly Val Thr
465                 470                 475                 480
Pro Pro Lys Lys Asp Phe Ser Lys Val Lys Pro Gly Thr Asp Ile Ile
                485                 490                 495
<210>55
<211>1041
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>55
atggcttcac aattcagaaa tctggttttt gaaggaggcg gtgtgaaggg catcgcctat      60
atcggcgcca tgcaggtgct ggagcagcgg ggactgctca aggatattgt ccgggtggga     120
ggtaccagtg caggcgccat caacgcgctg atcttttcgc tgggctttac catcaaagag     180
cagcaggata ttctcaactc caccaacttc agggagttta tggacagctc gttcgggttc     240
atccgaaact tccggaggtt atggagcgaa ttcggttgga accgcggcga tgtattttcg     300
gactgggccg gggagctggt gaaagagaag ctcggcaaaa agaacgccac gttcggcgat     360
ctgaaaaagg cgaaacgtcc cgatctgtac gtgatcggca ccaatctctc tacggggttt     420
tccgagacct tttcgcacga acgccacgcc gacatgcctc tggtagatgc ggtgcggata     480
agcatgtcga tcccgctctt ttttgctgca cggaggctgg gaaaacgtaa ggatgtgtat     540
gtggatggcg gggtgatgct caactatccc gtgaagctgt tcgacaggga gaagtatatc     600
gatttggaga aagagaatga ggcggcccgc tatgtggagt actacaatca agagaatgcc     660
cggtttctgc tcgagcggcc cggccgaagc ccttatgtgt ataaccggca gactctcggt     720
ctgcggctcg acacgcagga agagatcggc ctgttccgtt acgatgagcc gctgaagggc     780
aagcagatca accgtttccc cgaatacgcc agagccctga tcggctcgct gatgcaggta     840
caggagaaca tccacctgaa aagtgacgac tggcagcgaa cgctctacat caacacgctg     900
gatgtgggca ccaccgattt cgacattacc gacgagaaga aaaaagtgct ggtgaatgag     960
gggatcaagg gagcggagac ctatttccgc tggtttgagg atcccgaaga aaaaccggtg    1020
aataaggtga atcttgtctg a                                              1041
<210>56
<211>346
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>56
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Glu Gln Arg Gly Leu
            20                  25                  30
Leu Lys Asp Ile Val Arg Val Gly Gly Thr Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ser Leu Gly Phe Thr Ile Lys Glu Gln Gln Asp Ile
    50                  55                  60
Leu Asn Ser Thr Asn Phe Arg Glu Phe Met Asp Ser Ser Phe Gly Phe
65                  70                  75                  80
Ile Arg Asn Phe Arg Arg Leu Trp Ser Glu Phe Gly Trp Asn Arg Gly
                85                  90                  95
Asp Val Phe Ser Asp Trp Ala Gly Glu Leu Val Lys Glu Lys Leu Gly
            100                 105                 110
Lys Lys Asn Ala Thr Phe Gly Asp Leu Lys Lys Ala Lys Arg Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr Phe
    130                 135                 140
Ser His Glu Arg His Ala Asp Met Pro Leu Val Asp Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Arg Arg Leu Gly Lys Arg
                165                 170                 175
Lys Asp Val Tyr Val Asp Gly Gly Val Met Leu Asn Tyr Pro Val Lys
            180                 185                 190
Leu Phe Asp Arg Glu Lys Tyr Ile Asp Leu Glu Lys Glu Asn Glu Ala
        195                 200                 205
Ala Arg Tyr Val Glu Tyr Tyr Asn Gln Glu Asn Ala Arg Phe Leu Leu
    210                 215                 220
Glu Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Thr Gln Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Gln Ile Asn Arg Phe Pro Glu Tyr Ala Arg Ala
            260                 265                 270
Leu Ile Gly Ser Leu Met Gln Val Gln Glu Asn Ile His Leu Lys Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asp Ile Thr Asp Glu Lys Lys Lys Val Leu Val Asn Glu
305                 310                 315                 320
Gly Ile Lys Gly Ala Glu Thr Tyr Phe Arg Trp Phe Glu Asp Pro Glu
                325                 330                 335
Glu Lys Pro Val Asn Lys Val Asn Leu Val
            340                 345
<210>57
<211>1413
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>57
atgcaattag tgttcgtaca cgggtggagt gttacccata ccaataccta tggtgaatta      60
cccgaaagtt tggcggcagg cgccgcgaca cacggcctgc agatcgatat caggcacgtt     120
tttctcggca agtacatcag ctttcacgat gaggtgactc tggatgatat agcacgtgcc     180
ttcgacaagg cgctgagaga catgtcgggt gatggtgaca cggtctcgcc tttctcctgt     240
atcacgcatt cgaccggcgg ccctgtcgtt cggcactgga ttaacaaatt ctacggcgcg     300
cgagggctat cgaaactgcc gctggagcat ttggttatgc tggcgcctgc caaccacggc     360
tccagcctgg cggtactcgg caagcaacgt cttggtcgca tcaagtcctg gttcgatggc     420
gtggagcccg gacaaaaagt gctcgactgg ctatcgctgg gcagcaatgg gcaatgggcg     480
ctcaacaggg attttttgag ctaccgcccg gccaaacatg gcttcttccc ttttgttctg     540
acgggccagg gtatagacac aaaattctac gattttttga acagctacct tgtggagccc     600
ggcagtgacg gtgtggttcg cgtggcgggt gccaatatgc attttcgcta cctctccctg     660
gtacaatctg agaccgtatt acacaccccg ggcaaggtgc tacagctgga atataacgag     720
cggcgccccg tgaagtcccc acaagcggta ccgatgggcg tcttctccca atttagccac     780
tctggcgaca agatggggat tatggcagtc aagcgcaaga aagacgcgca tcaaatgatc     840
gtaacggaag tgctgaagtg tctctgcgta tcggacagcg atgaatatca gcaaagaggc     900
cttgaacttg cagaactgac cgccagcgaa cagcgcaagc ccatcgaaga ccaggacaag     960
attatcagcc gctatagcat gctggtattt agagtgcgcg accaggcggg caatacgatc    1020
ggagtgcacg atttcgatat cctcttactg gccggagata cctatagccc cgacaaactg    1080
ccagaggggt tcttcatgga taaacaggcc aatagagatg ccggctcact gatctactat    1140
gtggatgccg acaaaatgtc cgagatgaaa gatggctgct acggactgcg ggtggtcgtg    1200
cggccggaga aagggttttc ctattacaca acaggtgagt tcaggtcaga gggtatcccc    1260
gtggaccgtg tatttgcagc aaacgaaacc acctatattg atatcaccat gaaccgaagt    1320
gtcgatcaaa atgtattccg gttttcgcct gcaacagagc cacctgaaag cttcaaaaga    1380
accacgccct caggtaccga tatcccttca tag                                 1413
<210>58
<211>470
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>58
Met Gln Leu Val Phe Val His Gly Trp Ser Val Thr His Thr Asn Thr
 1               5                  10                  15
Tyr Gly Glu Leu Pro Glu Ser Leu Ala Ala Gly Ala Ala Thr His Gly
            20                  25                  30
Leu Gln Ile Asp Ile Arg His Val Phe Leu Gly Lys Tyr Ile Ser Phe
        35                  40                  45
His Asp Glu Val Thr Leu Asp Asp Ile Ala Arg Ala Phe Asp Lys Ala
    50                  55                  60
Leu Arg Asp Met Ser Gly Asp Gly Asp Thr Val Ser Pro Phe Ser Cys
65                  70                  75                  80
Ile Thr His Ser Thr Gly Gly Pro Val Val Arg His Trp Ile Asn Lys
                85                  90                  95
Phe Tyr Gly Ala Arg Gly Leu Ser Lys Leu Pro Leu Glu His Leu Val
            100                 105                 110
Met Leu Ala Pro Ala Asn His Gly Ser Ser Leu Ala Val Leu Gly Lys
        115                 120                 125
Gln Arg Leu Gly Arg Ile Lys Ser Trp Phe Asp Gly Val Glu Pro Gly
    130                 135                 140
Gln Lys Val Leu Asp Trp Leu Ser Leu Gly Ser Asn Gly Gln Trp Ala
145                 150                 155                 160
Leu Asn Arg Asp Phe Leu Ser Tyr Arg Pro Ala Lys His Gly Phe Phe
                165                 170                 175
Pro Phe Val Leu Thr Gly Gln Gly Ile Asp Thr Lys Phe Tyr Asp Phe
            180                 185                 190
Leu Asn Ser Tyr Leu Val Glu Pro Gly Ser Asp Gly Val Val Arg Val
        195                 200                 205
Ala Gly Ala Asn Met His Phe Arg Tyr Leu Ser Leu Val Gln Ser Glu
    210                 215                 220
Thr Val Leu His Thr Pro Gly Lys Val Leu Gln Leu Glu Tyr Asn Glu
225                 230                 235                 240
Arg Arg Pro Val Lys Ser Pro Gln Ala Val Pro Met Gly Val Phe Ser
                245                 250                 255
Gln Phe Ser His Ser Gly Asp Lys Met Gly Ile Met Ala Val Lys Arg
            260                 265                 270
Lys Lys Asp Ala His Gln Met Ile Val Thr Glu Val Leu Lys Cys Leu
        275                 280                 285
Cys Val Ser Asp Ser Asp Glu Tyr Gln Gln Arg Gly Leu Glu Leu Ala
    290                 295                 300
Glu Leu Thr Ala Ser Glu Gln Arg Lys Pro Ile Glu Asp Gln Asp Lys
305                 310                 315                 320
Ile Ile Ser Arg Tyr Ser Met Leu Val Phe Arg Val Arg Asp Gln Ala
                325                 330                 335
Gly Asn Thr Ile Gly Val His Asp Phe Asp Ile Leu Leu Leu Ala Gly
            340                 345                 350
Asp Thr Tyr Ser Pro Asp Lys Leu Pro Glu Gly Phe Phe Met Asp Lys
        355                 360                 365
Gln Ala Asn Arg Asp Ala Gly Ser Leu Ile Tyr Tyr Val Asp Ala Asp
    370                 375                 380
Lys Met Ser Glu Met Lys Asp Gly Cys Tyr Gly Leu Arg Val Val Val
385                 390                 395                 400
Arg Pro Glu Lys Gly Phe Ser Tyr Tyr Thr Thr Gly Glu Phe Arg Ser
                405                 410                 415
Glu Gly Ile Pro Val Asp Arg Val Phe Ala Ala Asn Glu Thr Thr Tyr
            420                 425                 430
Ile Asp Ile Thr Met Asn Arg Ser Val Asp Gln Asn Val Phe Arg Phe
        435                 440                 445
Ser Pro Ala Thr Glu Pro Pro Glu Ser Phe Lys Arg Thr Thr Pro Ser
    450                 455                 460
Gly Thr Asp Ile Pro Ser
465                 470
<210>59
<211>1038
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>59
atgacaacac aatttagaaa cttgatcttt gaaggcggcg gtgtaaaagg cgttgcttac      60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga     120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac ggtccgtgag     180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt     240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt     300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat     360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt     420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc     480
tccatgtcga taccgctgtt ctttgcggca gtgcgtcatg gtgatcgaca agatgtgtat     540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttatatt     600
gatctggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct     660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt     720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc     780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgct gatgaatgca     840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cggtctatat cgatacactc     900
gatgtgggta cgacggactt caatctttct gatgcaacca agcaagcact gattgagcaa     960
ggaattaacg gcaccgaaaa ttatttcgac tggtttgata atccgttaga gaagcctgtg    1020
aatagagtgg agtcatag                                                  1038
<210>60
<211>345
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>60
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Asp Trp Phe Asp Asn Pro Leu
                325                 330                  335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>6l
<211>1257
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>61
atgacattaa aactctccct gctgatcgcg agcctgagcg ccgtgtctcc agcagtcttg      60
gcaaacgacg tcaatccagc gccactcatg gcgccgtccg aagcggattc cgcgcagacg     120
ctgggcagtc tgacgtacac ctatgttcgc tgctggtatc gtccggctgc gacgcataat     180
gatccttaca ccacctggga gtgggcgaag aacgcggacg gcagtgattt caccattgat     240
ggctattggt ggtcatcggt gagttacaaa aacatgttct ataccgatac tcagcccgat     300
accatcatgc agcgctgtgc agagacgttg gggttaaccc acgataccgc tgacatcacc     360
tatgccgcgg ccgatacccg tttctcctac aaccacacca tctggagcaa cgatgtcgcc     420
aacgcgccga gcaaaatcaa taaggtgatc gcctttggtg acagcctgtc agacacgggc     480
aacattttta acgcctcgca atggcgcttc ccgaacccga actcctggtt tgtcggccac     540
ttctcaaacg ggtttgtctg gaccgagtat ctggcgcaag gtttggggct gcccctctac     600
aactgggccg tgggcggcgc ggcggggcgc aatcaatact gggcgctgac tggcgtgaat     660
gaacaggtca gttcgtacct gacctacatg gagatggcgc cgaattaccg tgcggagaac     720
acgctgttta cactcgaatt cggtctgaat gattttatga actacgaccg ttcactggca     780
gacgtcaaag cagattacag ctcggcgctg attcgtctgg tggaagccgg agcgaaaaat     840
atggtgctgt tgaccctacc ggatgccacg cgcgcgccgc agttccaata ttcaacgcaa     900
gaacacatcg acgaggtgcg cgccaaagtg attggcatga acgcgttcat tcgtgagcag     960
gcacgctact tccagatgca gggcatcaac atttcgctgt ttgacgccta cacgctgttt    1020
gatcagatga tcgccgaccc agccgcgcac ggctttgata atgccagcgc gccatgtctt    1080
gatattcagc gcagctctgc ggcggactat ctctacacgc atgctctggc agccgagtgt    1140
gcctcatccg gttcagaccg ctttgtgttc tgggatgtga ctcacccaac cacggcaacg    1200
catcgctaca tcgccgacca cattctggct accggtgttg cgcagttccc gcgttaa       1257
<210>62
<211>418
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)…(21)
<400>62
Met Thr Leu Lys Leu Ser Leu Leu Ile Ala Ser Leu Ser Ala Val Ser
 1               5                  10                  15
Pro Ala Val Leu Ala Asn Asp Val Asn Pro Ala Pro Leu Met Ala Pro
            20                  25                  30
Ser Glu Ala Asp Ser Ala Gln Thr Leu Gly Ser Leu Thr Tyr Thr Tyr
        35                  40                  45
Val Arg Cys Trp Tyr Arg Pro Ala Ala Thr His Asn Asp Pro Tyr Thr
    50                  55                  60
Thr Trp Glu Trp Ala Lys Asn Ala Asp Gly Ser Asp Phe Thr Ile Asp
65                  70                  75                  80
Gly Tyr Trp Trp Ser Ser Val Ser Tyr Lys Asn Met Phe Tyr Thr Asp
                85                  90                  95
Thr Gln Pro Asp Thr Ile Met Gln Arg Cys Ala Glu Thr Leu Gly Leu
            100                 105                 110
Thr His Asp Thr Ala Asp Ile Thr Tyr Ala Ala Ala Asp Thr Arg Phe
        115                 120                 125
Ser Tyr Asn His Thr Ile Trp Ser Asn Asp Val Ala Asn Ala Pro Ser
    130                 135                 140
Lys Ile Asn Lys Val Ile Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly
145                 150                 155                 160
Asn Ile Phe Asn Ala Ser Gln Trp Arg Phe Pro Asn Pro Asn Ser Trp
                165                 170                 175
Phe Val Gly His Phe Ser Asn Gly Phe Val Trp Thr Glu Tyr Leu Ala
            180                 185                 190
Gln Gly Leu Gly Leu Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala
        195                 200                 205
Gly Arg Asn Gln Tyr Trp Ala Leu Thr Gly Val Asn Glu Gln Val Ser
    210                 215                 220
Ser Tyr Leu Thr Tyr Met Glu Met Ala Pro Asn Tyr Arg Ala Glu Asn
225                 230                 235                 240
Thr Leu Phe Thr Leu Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Asp
                245                 250                 255
Arg Ser Leu Ala Asp Val Lys Ala Asp Tyr Ser Ser Ala Leu Ile Arg
            260                 265                 270
Leu Val Glu Ala Gly Ala Lys Asn Met Val Leu Leu Thr Leu Pro Asp
        275                 280                 285
Ala Thr Arg Ala Pro Gln Phe Gln Tyr Ser Thr Gln Glu His Ile Asp
    290                 295                 300
Glu Val Arg Ala Lys Val Ile Gly Met Asn Ala Phe Ile Arg Glu Gln
305                 310                 315                 320
Ala Arg Tyr Phe Gln Met Gln Gly Ile Asn Ile Ser Leu Phe Asp Ala
                325                 330                 335
Tyr Thr Leu Phe Asp Gln Met Ile Ala Asp Pro Ala Ala His Gly Phe
            340                 345                 350
Asp Asn Ala Ser Ala Pro Cys Leu Asp Ile Gln Arg Ser Ser Ala Ala
        355                 360                 365
Asp Tyr Leu Tyr Thr His Ala Leu Ala Ala Glu Cys Ala Ser Ser Gly
    370                 375                 380
Ser Asp Arg Phe Val Phe Trp Asp Val Thr His Pro Thr Thr Ala Thr
385                 390                 395                 400
His Arg Tyr Ile Ala Asp His Ile Leu Ala Thr Gly Val Ala Gln Phe
                405                 410                 415
Pro Arg
<210>63
<211>1242
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>63
atgaaaaata cgttaatttt ggctggctgt atattggcag ctccagccgt cgcagatgac      60
ctaacaatca cccctgaaac tataagtgtg cgctacgcgt ctgaggtgca gaacaaacaa     120
acatacactt atgttcgctg ctggtatcgt ccagcgcaga accatgacga cccttccact     180
gagtgggaat gggctcgtga cgacaatggc gattacttca ctatcgatgg gtactggtgg     240
tcgtctgtct ccttcaaaaa catgttctat accaataccc cgcaaacaga aattgaaaac     300
cgctgtaaag aaacactagg ggttaatcat gatagtgccg atcttcttta ctatgcatca     360
gacaatcgtt tctcctacaa ccatagtatt tggacaaacg acaacgcagt aaacaacaaa     420
atcaatcgta ttgtcgcatt cggtgatagc ctgtctgaca ccggtaatct gtacaatgga     480
tcccaatggg tattccccaa ccgtaattct tggtttctcg gtcacttttc aaacggtttg     540
gtgtggactg aatacttagc gcaaaacaaa aacgtaccac tgtacaactg ggcggtcggt     600
ggcgccgccg gcaccaacca atacgtcgca ttgacaggca tttatgacca agtgacgtct     660
tatcttacgt acatgaagat ggcaaagaac tacaacccaa acaacagttt gatgacgctg     720
gaatttggcc taaatgattt catgaattac ggccgagaag tggcggacgt gaaagctgac     780
ttaagtagcg cattgattcg cttgaccgaa tcaggcgcaa gcaacattct actcttcacg     840
ttaccggacg caacaaaggc accgcagttt aaatattcga ctcaggagga aattgagacc     900
gttcgagcta agattcttga gttcaacact tttattgaag aacaagcgtt actctatcaa     960
gctaaaggac tgaatgtggc cctctacgat gctcatagca tctttgatca gctgacatcc    1020
aatcctaaac aacacggttt tgagaactca acagatgcct gtctgaacat caaccgcagt    1080
tcctctgtcg actaccttta cagtcatgag ctaactaacg attgtgcgta tcatagctct    1140
gataaatatg tgttctgggg agtcactcac ccaaccacag caacacataa atacattgcc    1200
gaccaaatca ttcagaccaa gctagaccag ttcaatttct aa                       1242
<210>64
<211>413
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(18)
<400>64
Met Lys Asn Thr Leu Ile Leu Ala Gly Cys Ile Leu Ala Ala Pro Ala
 1               5                  10                  15
Val Ala Asp Asp Leu Thr Ile Thr Pro Glu Thr Ile Ser Val Arg Tyr
            20                  25                  30
Ala Ser Glu Val Gln Asn Lys Gln Thr Tyr Thr Tyr Val Arg Cys Trp
        35                  40                  45
Tyr Arg Pro Ala Gln Asn His Asp Asp Pro Ser Thr Glu Trp Glu Trp
    50                  55                  60
Ala Arg Asp Asp Asn Gly Asp Tyr Phe Thr Ile Asp Gly Tyr Trp Trp
65                  70                  75                  80
Ser Ser Val Ser Phe Lys Asn Met Phe Tyr Thr Asn Thr Pro Gln Thr
                85                  90                  95
Glu Ile Glu Asn Arg Cys Lys Glu Thr Leu Gly Val Asn His Asp Ser
            100                 105                 110
Ala Asp Leu Leu Tyr Tyr Ala Ser Asp Asn Arg Phe Ser Tyr Asn His
        115                 120                 125
Ser Ile Trp Thr Asn Asp Asn Ala Val Asn Asn Lys Ile Asn Arg Ile
    130                 135                 140
Val Ala Phe Gly Asp Ser Leu Ser Asp Thr Gly Asn Leu Tyr Asn Gly
145                 150                 155                 160
Ser Gln Trp Val Phe Pro Asn Arg Asn Ser Trp Phe Leu Gly His Phe
                165                 170                 175
Ser Asn Gly Leu Val Trp Thr Glu Tyr Leu Ala Gln Asn Lys Asn Val
            180                 185                 190
Pro Leu Tyr Asn Trp Ala Val Gly Gly Ala Ala Gly Thr Asn Gln Tyr
        195                 200                 205
Val Ala Leu Thr Gly Ile Tyr Asp Gln Val Thr Ser Tyr Leu Thr Tyr
    210                 215                 220
Met Lys Met Ala Lys Asn Tyr Asn Pro Asn Asn Ser Leu Met Thr Leu
225                 230                 235                 240
Glu Phe Gly Leu Asn Asp Phe Met Asn Tyr Gly Arg Glu Val Ala Asp
                245                 250                 255
Val Lys Ala Asp Leu Ser Ser Ala Leu Ile Arg Leu Thr Glu Ser Gly
            260                 265                 270
Ala Ser Asn Ile Leu Leu Phe Thr Leu Pro Asp Ala Thr Lys Ala Pro
        275                 280                 285
Gln Phe Lys Tyr Ser Thr Gln Glu Glu Ile Glu Thr Val Arg Ala Lys
    290                 295                 300
Ile Leu Glu Phe Asn Thr Phe Ile Glu Glu Gln Ala Leu Leu Tyr Gln
305                 310                 315                 320
Ala Lys Gly Leu Asn Val Ala Leu Tyr Asp Ala His Ser Ile Phe Asp
                325                 330                 335
Gln Leu Thr Ser Asn Pro Lys Gln His Gly Phe Glu Asn Ser Thr Asp
            340                 345                 350
Ala Cys Leu Asn Ile Asn Arg Ser Ser Ser Val Asp Tyr Leu Tyr Ser
        355                 360                 365
His Glu Leu Thr Asn Asp Cys Ala Tyr His Ser Ser Asp Lys Tyr Val
    370                 375                 380
Phe Trp Gly Val Thr His Pro Thr Thr Ala Thr His Lys Tyr Ile Ala
385                 390                 395                 400
Asp Gln Ile Ile Gln Thr Lys Leu Asp Gln Phe Asn Phe
                405                 410
<210>65
<211>1164
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>65
atgaaccctt ttcttgaaga taaaattaaa tcctccggtc ccaagaaaat cctcgcctgc      60
gatggcggag gtattttggg tttgatgagc gttgaaatcc tagcaaaaat tgaagcggat     120
ttacgcacta agttaggtaa agaccagaac ttcgtgctcg cggattattt cgattttgtc     180
tgcggcacca gcaccggcgc gattatcgct gcctgtattt ctagtggcat gtcgatggct     240
aaaatacgcc aattctatct cgacagtggg aagcaaatgt tcgataaggc ctccttgctt     300
aagcgcttgc aatacagtta tgacgatgag ccattggcga ggcagttgcg tgcagccttt     360
gatgagcaac tgaaggaaac cgatgccaag ctgggtagtg cgcacctaaa aacgctgttg     420
atgatggtga tgcgtaacca cagcaccgac tcaccttggc cggtttccaa taacccttac     480
gcaaaataca ataatatcgc ccgaaaggat tgcaacctca acctgccttt atggcaattg     540
gtccgtgcca gcaccgccgc tccgacgtat ttcccaccgg aagtcatcac tttcgcagat     600
ggcacacccg aagaatacaa cttcatcttc gtcgacggtg gcgtgaccac ctacaacaac     660
ccagcatatc ttgctttcct aatggccact gccaagcctt atgccctcaa ctggccgaca     720
ggcagcaacc agttattgat cgtttccgta ggcaccggaa gtgccgccaa tgtccgacct     780
aatctggacg tggatgatat gaacctgatc cattttgcca aaaacatccc ttcagccctg     840
atgaatgccg catctgccgg ttgggatatg acctgccggg tattgggtga atgccgccat     900
ggtggcatgt tagatcggga gtttggtgac atggtgatgc ccgcgtcaag agatcttaat     960
tttaccggcc ctaagctttt tacttatatg cgttatgatc ccgatgtttc ctttgagggc    1020
ttgaagacta tcggtatatc agatatcgat ccagccaaaa tgcagcaaat ggattccgtc    1080
aataatattc cagatataca acgggtaggt atcgaatatg ccaaacgcca tgttgataca    1140
gctcattttg aggggtttaa ataa                                           1164
<210>66
<211>387
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>66
Met Asn Pro Phe Leu Glu Asp Lys Ile Lys Ser Ser Gly Pro Lys Lys
 1               5                  10                  15
Ile Leu Ala Cys Asp Gly Gly Gly Ile Leu Gly Leu Met Ser Val Glu
            20                  25                  30
Ile Leu Ala Lys Ile Glu Ala Asp Leu Arg Thr Lys Leu Gly Lys Asp
        35                  40                  45
Gln Asn Phe Val Leu Ala Asp Tyr Phe Asp Phe Val Cys Gly Thr Ser
    50                  55                  60
Thr Gly Ala Ile Ile Ala Ala Cys Ile Ser Ser Gly Met Ser Met Ala
65                  70                  75                  80
Lys Ile Arg Gln Phe Tyr Leu Asp Ser Gly Lys Gln Met Phe Asp Lys
                85                  90                  95
Ala Ser Leu Leu Lys Arg Leu Gln Tyr Ser Tyr Asp Asp Glu Pro Leu
            100                 105                 110
Ala Arg Gln Leu Arg Ala Ala Phe Asp Glu Gln Leu Lys Glu Thr Asp
        115                 120                 125
Ala Lys Leu Gly Ser Ala His Leu Lys Thr Leu Leu Met Met Val Met
    130                 135                 140
Arg Asn His Ser Thr Asp Ser Pro Trp Pro Val Ser Asn Asn Pro Tyr
145                 150                 155                 160
Ala Lys Tyr Asn Asn Ile Ala Arg Lys Asp Cys Asn Leu Asn Leu Pro
                165                 170                 175
Leu Trp Gln Leu Val Arg Ala Ser Thr Ala Ala Pro Thr Tyr Phe Pro
            180                 185                 190
Pro Glu Val Ile Thr Phe Ala Asp Gly Thr Pro Glu Glu Tyr Asn Phe
        195                 200                 205
Ile Phe Val Asp Gly Gly Val Thr Thr Tyr Asn Asn Pro Ala Tyr Leu
    210                 215                 220
Ala Phe Leu Met Ala Thr Ala Lys Pro Tyr Ala Leu Asn Trp Pro Thr
225                 230                 235                 240
Gly Ser Asn Gln Leu Leu Ile Val Ser Val Gly Thr Gly Ser Ala Ala
                245                 250                 255
Asn Val Arg Pro Asn Leu Asp Val Asp Asp Met Asn Leu Ile His Phe
            260                 265                 270
Ala Lys Asn Ile Pro Ser Ala Leu Met Asn Ala Ala Ser Ala Gly Trp
        275                 280                 285
Asp Met Thr Cys Arg Val Leu Gly Glu Cys Arg His Gly Gly Met Leu
    290                 295                 300
Asp Arg Glu Phe Gly Asp Met Val Met Pro Ala Ser Arg Asp Leu Asn
305                 310                 315                 320
Phe Thr Gly Pro Lys Leu Phe Thr Tyr Met Arg Tyr Asp Pro Asp Val
                325                 330                 335
Ser Phe Glu Gly Leu Lys Thr Ile Gly Ile Ser Asp Ile Asp Pro Ala
            340                 345                 350
Lys Met Gln Gln Met Asp Ser Val Asn Asn Ile Pro Asp Ile Gln Arg
        355                 360                 365
Val Gly Ile Glu Tyr Ala Lys Arg His Val Asp Thr Ala His Phe Glu
    370                 375                 380
Gly Phe Lys
385
<210>67
<211>1419
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>67
atggtcattg tcttcgtcca cggatggagc gtgcgcaaca ccaacacgta cgggcagctg      60
cccttgcgtc tcaagaagag cttcaaagcc gccgggaaac agattcaggt cgagaacatc     120
tacctgggcg agtacgtgag ctttgacgac caggtaacag tcgacgacat cgcccgcgca     180
ttcgattgcg cactgcggga aaaactatac gatccggcga cgaagcagtg gacgaagttc     240
gcctgcatca ctcattccac cggcggcccg gtcgcgcgct tgtggatgga tctctactac     300
ggcgccgcca gactggccga gtgcccgatg tcccacctcg tgatgctcgc cccggccaat     360
catggctcgg cccttgccca gctcggcaag agccgcctca gccgcatcaa gagcttcttc     420
gagggtgtcg aaccgggcca gcgcgtcctc gactggctcg aactcggcag tgagctgagt     480
tgggccctca acacgagatg gctcgactac gactgccgcg ccgccgcctg ctgggtcttc     540
accctcaccg gccagcgcat cgaccggagt ttgtacgacc atctcaacag ctataccggt     600
gagcagggat cggatggcgt cgtgcgcgtc gccgcggcca acatgaacac caagctgctg     660
acctttgaac agaaggggcg caagctcgtg ttcacaggcc agaagaagac cgccgacacc     720
ggccttggcg tcgtgccggg ccggtcgcac tccggccgcg acatgggcat catcgccagc     780
gtgcgcggca ccggcgacca tcccaccctg gaatgggtga ctcgttgcct ggccgtcacc     840
gacgtcaaca cgtacgatgc cgtctgtaag gatctggacg ctctcaccgc ccagacccag     900
aaggatgaaa aggtggaaga ggtcaaaggc ctgctgcgga cggtcagata ccagacggac     960
cgctacgtca tgctcgtctt ccgcctgaag aacgaccgcg gcgactacct ctccgattac    1020
gatctcctgc tcaccgccgg acccaactac tcgcccgacg acctgcccga aggcttcttc    1080
gtcgaccgcc aacggaacca gcggaacccg ggcaagctca cttactacct gaactacgac    1140
gccatggcca aattgaaagg taagaccgcc gagggccgtc tgggcttcaa gatcctggcg    1200
cgcccggtga aaggcggcct cgtctactat gaggttgcgg agttccagtc cgacgtgggc    1260
ggcgtcagca gcatgctgca gcccaacgca acagtgatga tcgacatcac cctcaatcgc    1320
aacgtcgacg cgcgcgtctt ccggttcacc gagaatctgc ccacgggtga ccagggcgag    1380
gaaatcagcg gcgtcccgct ggggcagaac gtcccgtag                           1419
<210>68
<211>472
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>68
Met Val Ile Val Phe Val His Gly Trp Ser Val Arg Asn Thr Asn Thr
 1               5                  10                  15
Tyr Gly Gln Leu Pro Leu Arg Leu Lys Lys Ser Phe Lys Ala Ala Gly
            20                  25                  30
Lys Gln Ile Gln Val Glu Asn Ile Tyr Leu Gly Glu Tyr Val Ser Phe
        35                  40                  45
Asp Asp Gln Val Thr Val Asp Asp Ile Ala Arg Ala Phe Asp Cys Ala
    50                  55                  60
Leu Arg Glu Lys Leu Tyr Asp Pro Ala Thr Lys Gln Trp Thr Lys Phe
65                  70                  75                  80
Ala Cys Ile Thr His Ser Thr Gly Gly Pro Val Ala Arg Leu Trp Met
                85                  90                  95
Asp Leu Tyr Tyr Gly Ala Ala Arg Leu Ala Glu Cys Pro Met Ser His
            100                 105                 110
Leu Val Met Leu Ala Pro Ala Asn His Gly Ser Ala Leu Ala Gln Leu
        115                 120                 125
Gly Lys Ser Arg Leu Ser Arg Ile Lys Ser Phe Phe Glu Gly Val Glu
    130                 135                 140
Pro Gly Gln Arg Val Leu Asp Trp Leu Glu Leu Gly Ser Glu Leu Ser
145                 150                 155                 160
Trp Ala Leu Asn Thr Arg Trp Leu Asp Tyr Asp Cys Arg Ala Ala Ala
                165                 170                 175
Cys Trp Val Phe Thr Leu Thr Gly Gln Arg Ile Asp Arg Ser Leu Tyr
            180                 185                 190
Asp His Leu Asn Ser Tyr Thr Gly Glu Gln Gly Ser Asp Gly Val Val
        195                 200                 205
Arg Val Ala Ala Ala Asn Met Asn Thr Lys Leu Leu Thr Phe Glu Gln
    210                 215                 220
Lys Gly Arg Lys Leu Val Phe Thr Gly Gln Lys Lys Thr Ala Asp Thr
225                 230                 235                 240
Gly Leu Gly Val Val Pro Gly Arg Ser His Ser Gly Arg Asp Met Gly
                245                 250                 255
Ile Ile Ala Ser Val Arg Gly Thr Gly Asp His Pro Thr Leu Glu Trp
            260                 265                 270
Val Thr Arg Cys Leu Ala Val Thr Asp Val Asn Thr Tyr Asp Ala Val
        275                 280                 285
Cys Lys Asp Leu Asp Ala Leu Thr Ala Gln Thr Gln Lys Asp Glu Lys
    290                 295                 300
Val Glu Glu Val Lys Gly Leu Leu Arg Thr Val Arg Tyr Gln Thr Asp
305                 310                 315                 320
Arg Tyr Val Met Leu Val Phe Arg Leu Lys Asn Asp Arg Gly Asp Tyr
                325                 330                 335
Leu Ser Asp Tyr Asp Leu Leu Leu Thr Ala Gly Pro Asn Tyr Ser Pro
            340                 345                 350
Asp Asp Leu Pro Glu Gly Phe Phe Val Asp Arg Gln Arg Asn Gln Arg
        355                 360                 365
Asn Pro Gly Lys Leu Thr Tyr Tyr Leu Asn Tyr Asp Ala Met Ala Lys
    370                 375                 380
Leu Lys Gly Lys Thr Ala Glu Gly Arg Leu Gly Phe Lys Ile Leu Ala
385                 390                 395                 400
Arg Pro Val Lys Gly Gly Leu Val Tyr Tyr Glu Val Ala Glu Phe Gln
                405                 410                 415
Ser Asp Val Gly Gly Val Ser Ser Met Leu Gln Pro Asn Ala Thr Val
            420                 425                 430
Met Ile Asp Ile Thr Leu Asn Arg Asn Val Asp Ala Arg Val Phe Arg
        435                 440                 445
Phe Thr Glu Asn Leu Pro Thr Gly Asp Gln Gly Glu Glu Ile Ser Gly
    450                 455                 460
Val Pro Leu Gly Gln Asn Val Pro
465                 470
<210>69
<211>1038
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>69
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac      60
attggcgcca tgcagattct cgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga     120
gggtgcagtg cgggtgcgat caacgcgctg atttttgcgc tgggttacac tgtccgtgag     180
caaaaagaga tcttacaagc cacggatttt aaccagttta tggataactc ttggggtgtt     240
attcgtgata ttcgcaggct tgctcgagac tttggctggc acaagggtga cttctttaat     300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat     360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacggggtat     420
gcagaggttt tttcagccga aagacacccc gatatggagc tagcgacagc ggtgcgtatc     480
tccatgtcga taccgctgtt ctttgcggcc gtgcgccacg gtgaccgaca agatgtgtat     540
gtcgatgggg gtgttcaact taactatccg attaaacttt ttgatcggga gcgttacatt     600
gatctggcca aagatcccgg tgccgttcgg cgaacgggct attacaacaa agaaaacgct     660
cgctttcagc ttgagcggcc gggctatagc ccctatgttt acaatcgcca gaccttgggt     720
ttgcgactag atagtcgaga ggagataggg ctctttcgtt atgacgaacc cctcaagggc     780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca     840
caggaaaaga ttcatctaca tggcgatgat tggcagcgca cggtctatat cgatacattg     900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgaacag     960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttgga gaagcctgtt    1020
aatagagtgg agtcatag                                                  1038
<210>70
<211>345
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>70
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp His Lys Gly
                85                  90                  95
Asp Phe Phe Asn Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Tyr Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly Tyr Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>71
<211>3264
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>71
atgtcgctat catcaccgcc cgaaaccccc gaaccccccg aacccccgtc acccggcgcg      60
cgatcgctcc ggggaggatg gagccgccgg gtggccggcc tgctggccct ggtgctgctc     120
accgggctcc tccagatcgt cgtgccgctc gcacggcccg ccgcggcggc cgtacagcag     180
cccgcgatga cgtggaacct gcatggggcc aagaagaccg cggaactggt tcccgatctg     240
atgcgtaacc ataacgtcac cgtcgcggcc ctccaggaag tggccaacgg caacttcctg     300
ggcctcactc ccacagagca cgacgtgccc tacctcaagc cggacggcac gacctcgact     360
ccgccggatc cgcagaaatg gcgggtcgag aagtacaacc tcgccaagga cgatgcaacc     420
gctttcgtga tccggaccgg ctccaacaac cgcgggctcg cgatcgtcac cacccaggac     480
gtcggcgatg tctcgcagaa tgtacacgtc gtcaatgtga ccgaggattg ggaaggcaag     540
atgttccccg ccctgggggt gaagatcgac ggcgcctggt actactccat ccacgcctcc     600
accacgccga agcgcgcgaa caacaacgcc ggcactctgg tcgaggacct ctccaagctg     660
cacgagacgg ccgctttcga aggcgactgg gccgcgatgg gcgactggaa ccggtacccc     720
tccgaggact cgaacgccta cgagaaccaa cggaagcatc tcaaaggcgc catgcggaca     780
aactttccgg ataatcaggc ggcgttgcgc gaagtcctgg agttcgagtc cgacgaacgc     840
gtcatctggc agggtgcgag gacccacgac cacggcgccg agctcgacta catggtggcc     900
aagggagccg gtaacgacta caaggccagc cgatcgacgt cgaagcacgg ctccgatcac     960
tacccggtgt tcttcggtat tggggacgat tcggacacct gcatgggcgg cacggcgccg    1020
gtggcggcga acgcgccgcg tgcggccgcc accgagtcct gtcccctgga cgacgatctg    1080
ccggccgtca tcgtctcgat gggggacagc tatatctccg gcgagggagg gcgctggcag    1140
ggcaacgcca acacctcctc cgggggcgac tcctggggca ccgaccgggc cgccgacggc    1200
acggaggtct acgagaagaa ctccgaaggc agcgatgcct gtcaccgctc cgacgtcgcg    1260
gagatcaagc gcgccgacat cgccgacatc ccggcggaac gcaggatcaa catcgcctgc    1320
tcgggcgccg agaccaagca cctgctcacc gagaccttca agggtgaaaa gccccagatc    1380
gagcagctcg ccgacgtcgc cgaaacccac cgggtggaca cgatcgtggt ctccatcggc    1440
ggcaacgacc tcgagttcgc cgacatcgtg agccagtgcg ccacggcctt catgctcggg    1500
gaaggcgcgt gtcacacgga cgtcgacgat acccttgata gccggttggg cgatgtgagc    1560
agatccgtct ccgaggttct ggccgccatc cgcgacacca tgatcgaggc cgggcaggac    1620
gataccagct acaagctcgt tctccagtcc taccctgccc cgttgcccgc gtcggatgag    1680
atgcggtaca cgggcgatca ctacgaccgg tacaccgagg gcggctgccc cttctatgac    1740
gtcgacctgg actggacgcg cgacgtcctc atcaaaaaga tcgaagccac gctgcgcggg    1800
gtggccaaga gtgcggatgc ggccttcctc aacctgacgg acacgttcac ggggcacgag    1860
ctgtgctcga agcacacccg acaggcggag tccggcgaat cgctggcgaa tccaatactg    1920
gaacacgagg ccgagtgggt gcgcttcgta ccaggtctca ccacgccggg tgacacggcc    1980
gaagccatcc atccgaatgc gttcggccag cacgccctca gtagctgcct cagccaggcc    2040
gtccggacga tggacgattc ggaccagagg tacttcgagt gcgacgggcg ggacaccgga    2100
aatccccgcc tcgtgtggcc acgcagttcg cccatcgacg ccgtcgtgga gaccgcggac    2160
ggttggcagg gcgacgactt ccggctcgcc gaccactaca tgttccagcg cggcgtctac    2220
gcccgcttca acccggacgc ggaccggagc ggcgcgatcg atccgggccg aatcaccttc    2280
ggccaaaccg acggatggct cggtgaggtg aaggacactt cgaactggcc gagcctgagt    2340
ggaaccgact tcgtcgacgg catcgacgcc gccgccgagg cacgcaccag caccggtcac    2400
cagctgctgc tgttccacag cggcgttgag gacaaccagt acgtgcgggt cgagatggcg    2460
ccgggcacca ctgacgacca gctcgtcagg ggccccgtgc ccatcacgag gtactggccc    2520
ctcttccagg acaccccttt cgaatggggc gtggatgccg ccgcggggga ccagctgaac    2580
cgggcgatgg tcttcaggca cggctatgtg gggctggtgc aggtctccct cgacgctctc    2640
agcgacgaat ggctcgtgga accgacgttg atcggctcgg cgattccggc gctggagggc    2700
accccgttcg agacaggggt ggacgcggcg atcgtgcggc accagcaacc gacggccatg    2760
tgggtcgacc tgatcagcgg tacgcaggtg gtgacgctgc tggtggactt ggacgatctg    2820
tcgaagagca cgtacatgac gagcatcgtg gagatcacga cgatgtggcc gagcctgcgc    2880
ggcagcatct tcgactggac cggcggagag gcgtggaagc cggagaagat gcagatcaag    2940
accggcgcgg gcgatcccta cgacatggac gccgacgacc ggcaggccaa gcctgcggtg    3000
tcgggctcgc acgagcagtg ccgtccggag ggactagcgc agacccccgg cgtgaacacg    3060
ccgtactgcg aggtgtacga caccgacggc cgcgaatggc tgggcgggaa cgggcacgac    3120
aggcgggtca tcggctactt caccggctgg cgcaccggtg agaacgacca gccgcgctac    3180
ctggtgccga acatcccgtg gtcgaaggtg acccacatca actacgcgtt cgcgaaagtc    3240
gacgacgaca acaagatcca aaga                                           3264
<210>72
<211>1088
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>72
Met Ser Leu Ser Ser Pro Pro Glu Thr Pro Glu Pro Pro Glu Pro Pro
 1              5                   10                  15
Ser Pro Gly Ala Arg Ser Leu Arg Gly Gly Trp Ser Arg Arg Val Ala
            20                  25                  30
Gly Leu Leu Ala Leu Val Leu Leu Thr Gly Leu Leu Gln Ile Val Val
        35                  40                  45
Pro Leu Ala Arg Pro Ala Ala Ala Ala Val Gln Gln Pro Ala Met Thr
    50                  55                  60
Trp Asn Leu His Gly Ala Lys Lys Thr Ala Glu Leu Val Pro Asp Leu
65                  70                  75                  80
Met Arg Asn His Asn Val Thr Val Ala Ala Leu Gln Glu Val Ala Asn
                85                  90                  95
Gly Asn Phe Leu Gly Leu Thr Pro Thr Glu His Asp Val Pro Tyr Leu
            100                 105                 110
Lys Pro Asp Gly Thr Thr Ser Thr Pro Pro Asp Pro Gln Lys Trp Arg
        115                 120                 125
Val Glu Lys Tyr Asn Leu Ala Lys Asp Asp Ala Thr Ala Phe Val Ile
    130                 135                 140
Arg Thr Gly Ser Asn Asn Arg Gly Leu Ala Ile Val Thr Thr Gln Asp
145                 150                 155                 160
Val Gly Asp Val Ser Gln Asn Val His Val Val Asn Val Thr Glu Asp
                165                 170                 175
Trp Glu Gly Lys Met Phe Pro Ala Leu Gly Val Lys Ile Asp Gly Ala
            180                 185                 190
Trp Tyr Tyr Ser Ile His Ala Ser Thr Thr Pro Lys Arg Ala Asn Asn
        195                 200                 205
Asn Ala Gly Thr Leu Val Glu Asp Leu Ser Lys Leu His Glu Thr Ala
    210                 215                 220
Ala Phe Glu Gly Asp Trp Ala Ala Met Gly Asp Trp Asn Arg Tyr Pro
225                 230                 235                 240
Ser Glu Asp Ser Asn Ala Tyr Glu Asn Gln Arg Lys His Leu Lys Gly
                245                 250                 255
Ala Met Arg Thr Asn Phe Pro Asp Asn Gln Ala Ala Leu Arg Glu Val
            260                 265                 270
Leu Glu Phe Glu Ser Asp Glu Arg Val Ile Trp Gln Gly Ala Arg Thr
        275                 280                 285
His Asp His Gly Ala Glu Leu Asp Tyr Met Val Ala Lys Gly Ala Gly
    290                 295                 300
Asn Asp Tyr Lys Ala Ser Arg Ser Thr Ser Lys His Gly Ser Asp His
305                 310                 315                 320
Tyr Pro Val Phe Phe Gly Ile Gly Asp Asp Ser Asp Thr Cys Met Gly
                325                 330                 335
Gly Thr Ala Pro Val Ala Ala Asn Ala Pro Arg Ala Ala Ala Thr Glu
            340                 345                 350
Ser Cys Pro Leu Asp Asp Asp Leu Pro Ala Val Ile Val Ser Met Gly
        355                 360                 365
Asp Ser Tyr Ile Ser Gly Glu Gly Gly Arg Trp Gln Gly Asn Ala Asn
    370                 375                 380
Thr Ser Ser Gly Gly Asp Ser Trp Gly Thr Asp Arg Ala Ala Asp Gly
385                 390                 395                 400
Thr Glu Val Tyr Glu Lys Asn Ser Glu Gly Ser Asp Ala Cys His Arg
                405                 410                 415
Ser Asp Val Ala Glu Ile Lys Arg Ala Asp Ile Ala Asp Ile Pro Ala
            420                 425                 430
Glu Arg Arg Ile Asn Ile Ala Cys Ser Gly Ala Glu Thr Lys His Leu
        435                 440                 445
Leu Thr Glu Thr Phe Lys Gly Glu Lys Pro Gln Ile Glu Gln Leu Ala
    450                 455                 460
Asp Val Ala Glu Thr His Arg Val Asp Thr Ile Val Val Ser Ile Gly
465                 470                 475                 480
Gly Asn Asp Leu Glu Phe Ala Asp Ile Val Ser Gln Cys Ala Thr Ala
                485                 490                 495
Phe Met Leu Gly Glu Gly Ala Cys His Thr Asp Val Asp Asp Thr Leu
            500                 505                 510
Asp Ser Arg Leu Gly Asp Val Ser Arg Ser Val Ser Glu Val Leu Ala
        515                 520                 525
Ala Ile Arg Asp Thr Met Ile Glu Ala Gly Gln Asp Asp Thr Ser Tyr
    530                 535                 540
Lys Leu Val Leu Gln Ser Tyr Pro Ala Pro Leu Pro Ala Ser Asp Glu
545                 550                 555                 560
Met Arg Tyr Thr Gly Asp His Tyr Asp Arg Tyr Thr Glu Gly Gly Cys
                565                 570                 575
Pro Phe Tyr Asp Val Asp Leu Asp Trp Thr Arg Asp Val Leu Ile Lys
            580                 585                 590
Lys Ile Glu Ala Thr Leu Arg Gly Val Ala Lys Ser Ala Asp Ala Ala
        595                 600                 605
Phe Leu Asn Leu Thr Asp Thr Phe Thr Gly His Glu Leu Cys Ser Lys
    610                 615                 620
His Thr Arg Gln Ala Glu Ser Gly Glu Ser Leu Ala Asn Pro Ile Leu
625                 630                 635                  640
Glu His Glu Ala Glu Trp Val Arg Phe Val Pro Gly Leu Thr Thr Pro
                645                 650                 655
Gly Asp Thr Ala Glu Ala Ile His Pro Asn Ala Phe Gly Gln His Ala
            660                 665                 670
Leu Ser Ser Cys Leu Ser Gln Ala Val Arg Thr Met Asp Asp Ser Asp
        675                 680                 685
Gln Arg Tyr Phe Glu Cys Asp Gly Arg Asp Thr Gly Asn Pro Arg Leu
    690                 695                 700
Val Trp Pro Arg Ser Ser Pro Ile Asp Ala Val Val Glu Thr Ala Asp
705                 710                 715                 720
Gly Trp Gln Gly Asp Asp Phe Arg Leu Ala Asp His Tyr Met Phe Gln
                725                 730                 735
Arg Gly Val Tyr Ala Arg Phe Asn Pro Asp Ala Asp Arg Ser Gly Ala
            740                 745                 750
Ile Asp Pro Gly Arg Ile Thr Phe Gly Gln Thr Asp Gly Trp Leu Gly
        755                 760                 765
Glu Val Lys Asp Thr Ser Asn Trp Pro Ser Leu Ser Gly Thr Asp Phe
    770                 775                 780
Val Asp Gly Ile Asp Ala Ala Ala Glu Ala Arg Thr Ser Thr Gly His
785                 790                 795                 800
Gln Leu Leu Leu Phe His Ser Gly Val Glu Asp Asn Gln Tyr Val Arg
                805                 810                 815
Val Glu Met Ala Pro Gly Thr Thr Asp Asp Gln Leu Val Arg Gly Pro
            820                 825                 830
Val Pro Ile Thr Arg Tyr Trp Pro Leu Phe Gln Asp Thr Pro Phe Glu
        835                 840                 845
Trp Gly Val Asp Ala Ala Ala Gly Asp Gln Leu Asn Arg Ala Met Val
    850                 855                 860
Phe Arg His Gly Tyr Val Gly Leu Val Gln Val Ser Leu Asp Ala Leu
865                 870                 875                 880
Ser Asp Glu Trp Leu Val Glu Pro Thr Leu Ile Gly Ser Ala Ile Pro
                885                 890                 895
Ala Leu Glu Gly Thr Pro Phe Glu Thr Gly Val Asp Ala Ala Ile Val
            900                 905                 910
Arg His Gln Gln Pro Thr Ala Met Trp Val Asp Leu Ile Ser Gly Thr
        915                 920                 925
Gln Val Val Thr Leu Leu Val Asp Leu Asp Asp Leu Ser Lys Ser Thr
    930                 935                 940
Tyr Met Thr Ser Ile Val Glu Ile Thr Thr Met Trp Pro Ser Leu Arg
945                 950                 955                 960
Gly Ser Ile Phe Asp Trp Thr Gly Gly Glu Ala Trp Lys Pro Glu Lys
                965                 970                 975
Met Gln Ile Lys Thr Gly Ala Gly Asp Pro Tyr Asp Met Asp Ala Asp
            980                 985                 990
Asp Arg Gln Ala Lys Pro Ala Val Ser Gly Ser His Glu Gln Cys Arg
        995                 1000                1005
Pro Glu Gly Leu Ala Gln Thr Pro Gly Val Asn Thr Pro Tyr Cys Glu
    1010                1015                1020
Val Tyr Asp Thr Asp Gly Arg Glu Trp Leu Gly Gly Asn Gly His Asp
1025                1030                1035                1040
Arg Arg Val Ile Gly Tyr Phe Thr Gly Trp Arg Thr Gly Glu Asn Asp
                1045                1050                1055
Gln Pro Arg Tyr Leu Val Pro Asn Ile Pro Trp Ser Lys Val Thr His
            1060                1065                1070
Ile Asn Tyr Ala Phe Ala Lys Val Asp Asp Asp Asn Lys Ile Gln Arg
        1075                1080                1085
<210>73
<211>753
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>73
atgggaaacg gtgcagcagt tggttccaat gataatggta gagaagaaag tgtttacgta      60
ctttctgtga tcgcctgtaa tgtttattat ttacagaagt gtgaaggtgg ggcatcgcgt     120
gatagcgtga ttagagaaat taatagccaa actcaacctt taggatatga gattgtagca     180
gattctattc gtgatggtca tattggttct tttgcctgta agatggcagt ctttagaaat     240
aatggtaatg gcaattgtgt tttagcgatc aaagggacag atatgaataa tatcaatgac     300
ttggtgaatg atctaaccat gatattagga ggcattggtt ctgttgctgc aatccaacca     360
acgattaaca tggcacaaga actcatcgac caatatggag tgaatttgat tactggtcac     420
tcccttggag gctacatgac tgaaatcatc gctaccaatc gtggactacc aggtattgca     480
ttttgcgcac caggttcaaa tggtccaatt gtaaaattag gtggacaaga gacacctggc     540
tttcacaatg ttaactttga acatgatcca gcaggtaacg ttatgactgg ggtttatact     600
catgtccaat ggagtattta tgtaggatgt gatggtatga ctcatggtat tgaaaatatg     660
gtgaattatt ttaaagataa aagagattta accaatcgca atattcaagg aagaagtgaa     720
agtcataata cgggttatta ttacccaaaa taa                                  753
<210>74
<211>250
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>74
Met Gly Asn Gly Ala Ala Val Gly Ser Asn Asp Asn Gly Arg Glu Glu
 1               5                  10                  15
Ser Val Tyr Val Leu Ser Val Ile Ala Cys Asn Val Tyr Tyr Leu Gln
            20                  25                  30
Lys Cys Glu Gly Gly Ala Ser Arg Asp Ser Val Ile Arg Glu Ile Asn
        35                  40                  45
Ser Gln Thr Gln Pro Leu Gly Tyr Glu Ile Val Ala Asp Ser Ile Arg
    50                  55                  60
Asp Gly His Ile Gly Ser Phe Ala Cys Lys Met Ala Val Phe Arg Asn
65                  70                  75                  80
Asn Gly Asn Gly Asn Cys Val Leu Ala Ile Lys Gly Thr Asp Met Asn
                85                  90                  95
Asn Ile Asn Asp Leu Val Asn Asp Leu Thr Met Ile Leu Gly Gly Ile
            100                 105                 110
Gly Ser Val Ala Ala Ile Gln Pro Thr Ile Asn Met Ala Gln Glu Leu
        115                 120                 125
Ile Asp Gln Tyr Gly Val Asn Leu Ile Thr Gly His Ser Leu Gly Gly
    130                 135                 140
Tyr Met Thr Glu Ile Ile Ala Thr Asn Arg Gly Leu Pro Gly Ile Ala
145                 150                 155                 160
Phe Cys Ala Pro Gly Ser Asn Gly Pro Ile Val Lys Leu Gly Gly Gln
                165                 170                 175
Glu Thr Pro Gly Phe His Asn Val Asn Phe Glu His Asp Pro Ala Gly
            180                 185                 190
Asn Val Met Thr Gly Val Tyr Thr His Val Gln Trp Ser Ile Tyr Val
        195                 200                 205
Gly Cys Asp Gly Met Thr His Gly Ile Glu Asn Met Val Asn Tyr Phe
    210                 215                 220
Lys Asp Lys Arg Asp Leu Thr Asn Arg Asn Ile Gln Gly Arg Ser Glu
225                 230                 235                 240
Ser His Asn Thr Gly Tyr Tyr Tyr Pro Lys
                245                 250
<210>75
<211>1335
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>75
atgactacta aaatcttttt aattcacgga tggtctgtca agacaacaca aacatatcag      60
gcgctgcacc ttaagttggc agagcaggga tatcagctgg aagatattta cctcgggcgg     120
tatctgtccc ttgaaaatca tatcgaaata cgggatattg caaaagcaat gcaccgtgca     180
ttgctggaga ggattaccga ctggagtcag cctttccatt ttattactca cagtacggga     240
ggtatggtcg ccaaatattg gatattgaat cattataaag gaagtattgc aaaacaaaaa     300
ccactcaaaa atgtagtgtt tctggctgca cctaattttg gttcaaggct ggcacaccat     360
ggacgtacca tgctgggaga aataatggaa ctgggagaaa cagggaagaa gattcttgaa     420
tctctggagt taggaagtgc tttttcgtgg gatgtgaatg agcagttttt taatgcgtcc     480
aattggaaag ataaagaaat aaagttctat aacctgatag gagacagggt caaaacggat     540
ttttttaaat ccaaaatttt tccagctgcg tttgaaagcg ggtcagatat ggtgattcgg     600
gttgcggcag gaaatcagaa ctttgtccgg tacaggtacg atagtcagaa agatagcttt     660
actgttgtca atgagttgaa aggaattgct tttggtgctc tctaccaata tacacattcc     720
aatgatgatt atggaatcct gaacagcatc aaaaaaagtt caacccttga aaaccatcag     780
gcactcagac taattgtaga atgtctgaag gtttcgggag ataaagaata tgaaaatgtt     840
gttgcacagt tggctgcagc gacaaaagaa accagagaaa aacgccaggg atatgcacag     900
ctggatttcc gttttcggga tgatgaaggc tttccaatag atgattatgt tgtagagctg     960
ggagtaatgg taaatggaaa acctaaacca tctaaaacag tagatgacgt gcataagaat    1020
aaaattacac caaaccatct tactgtattc attaacctga aagaactgga acctaatctg    1080
aagtacttta tcaatattaa atcgatatcg gaatcctcca tgtatagtta cgatcctgct    1140
gtcaggacta tagagcttgc ttctaacgag attacaaaaa ttatccgtga ggaccataca    1200
acacagattg atgtgatact ttcccggact cctgctaaaa accttttcat gtttcatcgc    1260
ggagatgatg aagacctaca tgtgacatgg tcgcggtacg gagaaacaaa aagtacaaag    1320
cagggaataa aataa                                                     1335
<210>76
<211>444
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>76
Met Thr Thr Lys Ile Phe Leu Ile His Gly Trp Ser Val Lys Thr Thr
 1               5                  10                  15
Gln Thr Tyr Gln Ala Leu His Leu Lys Leu Ala Glu Gln Gly Tyr Gln
            20                  25                  30
Leu Glu Asp Ile Tyr Leu Gly Arg Tyr Leu Ser Leu Glu Asn His Ile
        35                  40                  45
Glu Ile Arg Asp Ile Ala Lys Ala Met His Arg Ala Leu Leu Glu Arg
    50                  55                  60
Ile Thr Asp Trp Ser Gln Pro Phe His Phe Ile Thr His Ser Thr Gly
65                  70                  75                  80
Gly Met Val Ala Lys Tyr Trp Ile Leu Asn His Tyr Lys Gly Ser Ile
                85                  90                  95
Ala Lys Gln Lys Pro Leu Lys Asn Val Val Phe Leu Ala Ala Pro Asn
            100                 105                 110
Phe Gly Ser Arg Leu Ala His His Gly Arg Thr Met Leu Gly Glu Ile
        115                 120                 125
Met Glu Leu Gly Glu Thr Gly Lys Lys Ile Leu Glu Ser Leu Glu Leu
    130                 135                 140
Gly Ser Ala Phe Ser Trp Asp Val Asn Glu Gln Phe Phe Asn Ala Ser
145                 150                 155                 160
Asn Trp Lys Asp Lys Glu Ile Lys Phe Tyr Asn Leu Ile Gly Asp Arg
                165                 170                 175
Val Lys Thr Asp Phe Phe Lys Ser Lys Ile Phe Pro Ala Ala Phe Glu
            180                 185                 190
Ser Gly Ser Asp Met Val Ile Arg Val Ala Ala Gly Asn Gln Asn Phe
        195                 200                 205
Val Arg Tyr Arg Tyr Asp Ser Gln Lys Asp Ser Phe Thr Val Val Asn
    210                 215                 220
Glu Leu Lys Gly Ile Ala Phe Gly Ala Leu Tyr Gln Tyr Thr His Ser
225                 230                 235                 240
Asn Asp Asp Tyr Gly Ile Leu Asn Ser Ile Lys Lys Ser Ser Thr Leu
                245                 250                 255
Glu Asn His Gln Ala Leu Arg Leu Ile Val Glu Cys Leu Lys Val Ser
            260                 265                 270
Gly Asp Lys Glu Tyr Glu Asn Val Val Ala Gln Leu Ala Ala Ala Thr
        275                 280                 285
Lys Glu Thr Arg Glu Lys Arg Gln Gly Tyr Ala Gln Leu Asp Phe Arg
    290                 295                 300
Phe Arg Asp Asp Glu Gly Phe Pro Ile Asp Asp Tyr Val Val Glu Leu
305                 310                 315                 320
Gly Val Met Val Asn Gly Lys Pro Lys Pro Ser Lys Thr Val Asp Asp
                325                 330                 335
Val His Lys Asn Lys Ile Thr Pro Asn His Leu Thr Val Phe Ile Asn
            340                 345                 350
Leu Lys Glu Leu Glu Pro Asn Leu Lys Tyr Phe Ile Asn Ile Lys Ser
        355                 360                 365
Ile Ser Glu Ser Ser Met Tyr Ser Tyr Asp Pro Ala Val Arg Thr Ile
    370                 375                 380
Glu Leu Ala Ser Asn Glu Ile Thr Lys Ile Ile Arg Glu Asp His Thr
385                 390                 395                 400
Thr Gln Ile Asp Val Ile Leu Ser Arg Thr Pro Ala Lys Asn Leu Phe
                405                 410                 415
Met Phe His Arg Gly Asp Asp Glu Asp Leu His Val Thr Trp Ser Arg
            420                 425                 430
Tyr Gly Glu Thr Lys Ser Thr Lys Gln Gly Ile Lys
        435                 440
<210>77
<211>1026
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>77
atggcttatc actttaaaaa cttggtcttc gaaggcggtg gcgtgaaagg catcgcctac      60
gtgggtgctc ttgaagtact tgagagagaa ggcattctga aagacatcaa acgcgtggct     120
ggtacttcgg ctggagcgct ggttgccgtc ttaatcagtt tgggctatac cgcccaagaa     180
ttgaaggaca tcctatggaa aatcaatttc caaaactttt tggacagctc gtggggcttg     240
gtgcgcaaca cggcacgttt cattgaggat tacggttggt acaaaggtga gtttttccgc     300
gaattggttg ccggctacat caaggaaaaa acgggcaata gtgaaagcac tttcaaggat     360
ctggccaaat caaaagattt ccgtggcctc agccttattg gtagcgatct gtccacagga     420
tactcaaagg tgttcagcaa cgaattcacc ccaaacgtca aagtagctga tgcagcccgc     480
atctccatgt cgatacccct gtttttcaaa gccgttcgcg gtgtaaacgg tgatggacac     540
atttacgtcg atggtggact gttagacaac tatgccatca aggtgttcga ccgcgtcaat     600
tacgtaaaga ataagaacaa cgtacggtac accgagtatt atgaaaagac caacaagtcg     660
ctgaaaagca aaaacaagct gaccaacgaa tacgtctaca ataaagaaac tttgggcttc     720
cgattggatg ccaaagaaca gattgagatg tttctcgacc atagtataga accaaaggca     780
aaggacattg actcactatt ctcttacacg aaggctttgg tcaccaccct catcgacttt     840
caaaacaatg tacatttgca tagtgacgac tggcaacgca cagtctatat cgactcttta     900
ggtatcagtt ccactgactt cggcatctct gactctaaaa aacagaaact cgtcgattca     960
ggcattttgc atacgcaaaa atacctggat tggtataaca acgacgaaga gaaagccaac    1020
aaatag                                                               1026
<210>78
<211>341
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>78
Met Ala Tyr His Phe Lys Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Leu Glu Val Leu Glu Arg Glu Gly Ile
            20                  25                  30
Leu Lys Asp Ile Lys Arg Val Ala Gly Thr Ser Ala Gly Ala Leu Val
        35                  40                  45
Ala Val Leu Ile Ser Leu Gly Tyr Thr Ala Gln Glu Leu Lys Asp Ile
    50                  55                  60
Leu Trp Lys Ile Asn Phe Gln Asn Phe Leu Asp Ser Ser Trp Gly Leu
65                  70                  75                  80
Val Arg Asn Thr Ala Arg Phe Ile Glu Asp Tyr Gly Trp Tyr Lys Gly
                85                  90                  95
Glu Phe Phe Arg Glu Leu Val Ala Gly Tyr Ile Lys Glu Lys Thr Gly
            100                 105                 110
Asn Ser Glu Ser Thr Phe Lys Asp Leu Ala Lys Ser Lys Asp Phe Arg
        115                 120                 125
Gly Leu Ser Leu Ile Gly Ser Asp Leu Ser Thr Gly Tyr Ser Lys Val
    130                 135                 140
Phe Ser Asn Glu Phe Thr Pro Asn Val Lys Val Ala Asp Ala Ala Arg
145                 150                 155                 160
Ile Ser Met Ser Ile Pro Leu Phe Phe Lys Ala Val Arg Gly Val Asn
                165                 170                 175
Gly Asp Gly His Ile Tyr Val Asp Gly Gly Leu Leu Asp Asn Tyr Ala
            180                 185                 190
Ile Lys Val Phe Asp Arg Val Asn Tyr Val Lys Asn Lys Asn Asn Val
        195                 200                 205
Arg Tyr Thr Glu Tyr Tyr Glu Lys Thr Asn Lys Ser Leu Lys Ser Lys
    210                 215                 220
Asn Lys Leu Thr Asn Glu Tyr Val Tyr Asn Lys Glu Thr Leu Gly Phe
225                 230                 235                 240
Arg Leu Asp Ala Lys Glu Gln Ile Glu Met Phe Leu Asp His Ser Ile
                245                 250                 255
Glu Pro Lys Ala Lys Asp Ile Asp Ser Leu Phe Ser Tyr Thr Lys Ala
            260                 265                 270
Leu Val Thr Thr Leu Ile Asp Phe Gln Asn Asn Val His Leu His Ser
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Ser Leu Gly Ile Ser Ser
    290                 295                 300
Thr Asp Phe Gly Ile Ser Asp Ser Lys Lys Gln Lys Leu Val Asp Ser
305                 310                 315                 320
Gly Ile Leu His Thr Gln Lys Tyr Leu Asp Trp Tyr Asn Asn Asp Glu
                325                 330                 335
Glu Lys Ala Asn Lys
            340
<210>79
<211>1701
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>79
atgagaaatt tcagcaaggg attgaccagt attttgctta gcatagcgac atccaccagt      60
gcgatggcct ttacccagat cggggccggc ggagcgattc cgatgggcca tgagtggcta     120
acccgccgct cggcgctgga actgctgaat gccgacaatc tggtcggcaa tgacccggcc     180
gacccacgct tgggctggag cgaaggtctc gccaacaatc tcgatctctc gaatgcccag     240
aacgaagtgc agcgcatcaa gagcattacc aagagccacg ccctgtatga gccgcgttac     300
gatgacgttt tcgccgccat cgtcggcgag cgctgggttg ataccgccgg tttcaacgtg     360
gccaaggcca ccgtcggcaa gatcgattgc ttcagcgccg tcgcgcaaga gcccgccgat     420
gtgcaacaag accatttcat gcgccgttat gacgacgtgg gtggacaagg gggcgtgaac     480
gctgcccgcc gcgcgcagca gcgctttatc aatcacttcg tcaacgcagc catggccgaa     540
gagaagagca tcaaggcatg ggatggcggc ggttattctt cgctggaaaa agtcagccac     600
aactacttct tgtttggccg cgccgttcat ttgttccagg attctttcag ccccgaacac     660
accgtgcgcc tgcctgaaga caattacgtc aaagtccgtc aggtcaaggc gtatctctgc     720
tctgaaggtg ccgaacagca tacgcacaac acgcaagatg ccatcaactt caccagcggc     780
gatgtcatct ggaaacagaa cacccgtctg gatgcaggct ggagcaccta caaggccagc     840
aacatgaagc cggtggcatt ggttgccctc gaagccagca aagatttgtg ggccgccttt     900
attcgcacca tggccgtttc ccgcgaggag cgtcgcgccg tcgccgaaca ggaagcgcag     960
gctctcgtca atcactggtt gtcgttcgac gaacaggaaa tgctgaactg gtacgaagaa    1020
gaagagcacc gcgatcatac gtacgtcaag gaacccggcc agagcggccc aggttcgtcg    1080
ttattcgatt gcatggttgg tctgggtgtg gcctcgggca gtcaggcgca acgggtggcg    1140
gaactcgatc agcaacgccg ccaatgtttg ttcaacgtca aggccgctac tggctatggc    1200
gatctgaatg atccacacat ggatattccg tacaactggc aatgggtgtc gtcgacgcaa    1260
tggaaaatcc ctgcggccga ctggaaaatc ccgcagctgc ccgccgattc agggaaatca    1320
gtcgtcatca agaattcgat caatggcgat ccgctggtgg cacctgccgg gctcaagcac    1380
aacaccgatg tttacggtgc accgggtgag gcgattgaat tcattttcgt cggtgatttc    1440
aaccatgagg cgtatttccg caccaaggac aacgcggatc tgttcctgag ttacagcgcg    1500
gtatcgggca agggcttgct gtacaacacg cccaaccagg ccggttatcg tgttcagcct    1560
tatggtgtgc tgtggacgat tgagaatacc tactggaatg atttcctctg gtacaacagc    1620
tcgaacgacc gcatctatgt cagcggcacc ggcgctgcca acaagtcaca ctcccagtgg    1680
attattgacg gcttgcagtg a                                              1701
<210>80
<211>566
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)…(23)
<400>80
Met Arg Asn Phe Ser Lys Gly Leu Thr Ser Ile Leu Leu Ser Ile Ala
 1               5                  10                  15
Thr Ser Thr Ser Ala Met Ala Phe Thr Gln Ile Gly Ala Gly Gly Ala
            20                  25                  30
Ile Pro Met Gly His Glu Trp Leu Thr Arg Arg Ser Ala Leu Glu Leu
        35                  40                  45
Leu Asn Ala Asp Asn Leu Val Gly Asn Asp Pro Ala Asp Pro Arg Leu
    50                  55                  60
Gly Trp Ser Glu Gly Leu Ala Asn Asn Leu Asp Leu Ser Asn Ala Gln
65                  70                  75                  80
Asn Glu Val Gln Arg Ile Lys Ser Ile Thr Lys Ser His Ala Leu Tyr
                85                  90                  95
Glu Pro Arg Tyr Asp Asp Val Phe Ala Ala Ile Val Gly Glu Arg Trp
            100                 105                 110
Val Asp Thr Ala Gly Phe Asn Val Ala Lys Ala Thr Val Gly Lys Ile
        115                 120                 125
Asp Cys Phe Ser Ala Val Ala Gln Glu Pro Ala Asp Val Gln Gln Asp
    130                 135                 140
His Phe Met Arg Arg Tyr Asp Asp Val Gly Gly Gln Gly Gly Val Asn
145                 150                 155                 160
Ala Ala Arg Arg Ala Gln Gln Arg Phe Ile Asn His Phe Val Asn Ala
                165                 170                 175
Ala Met Ala Glu Glu Lys Ser Ile Lys Ala Trp Asp Gly Gly Gly Tyr
            180                 185                 190
Ser Ser Leu Glu Lys Val Ser His Asn Tyr Phe Leu Phe Gly Arg Ala
        195                 200                 205
Val His Leu Phe Gln Asp Ser Phe Ser Pro Glu His Thr Val Arg Leu
    210                 215                 220
Pro Glu Asp Asn Tyr Val Lys Val Arg Gln Val Lys Ala Tyr Leu Cys
225                 230                 235                 240
Ser Glu Gly Ala Glu Gln His Thr His Asn Thr Gln Asp Ala Ile Asn
                245                 250                 255
Phe Thr Ser Gly Asp Val Ile Trp Lys Gln Asn Thr Arg Leu Asp Ala
            260                 265                 270
Gly Trp Ser Thr Tyr Lys Ala Ser Asn Met Lys Pro Val Ala Leu Val
        275                 280                 285
Ala Leu Glu Ala Ser Lys Asp Leu Trp Ala Ala Phe Ile Arg Thr Met
    290                 295                 300
Ala Val Ser Arg Glu Glu Arg Arg Ala Val Ala Glu Gln Glu Ala Gln
305                 310                 315                 320
Ala Leu Val Asn His Trp Leu Ser Phe Asp Glu Gln Glu Met Leu Asn
                325                 330                 335
Trp Tyr Glu Glu Glu Glu His Arg Asp His Thr Tyr Val Lys Glu Pro
            340                 345                 350
Gly Gln Ser Gly Pro Gly Ser Ser Leu Phe Asp Cys Met Val Gly Leu
        355                 360                 365
Gly Val Ala Ser Gly Ser Gln Ala Gln Arg Val Ala Glu Leu Asp Gln
    370                 375                 380
Gln Arg Arg Gln Cys Leu Phe Asn Val Lys Ala Ala Thr Gly Tyr Gly
385                 390                 395                 400
Asp Leu Asn Asp Pro His Met Asp Ile Pro Tyr Asn Trp Gln Trp Val
                405                 410                 415
Ser Ser Thr Gln Trp Lys Ile Pro Ala Ala Asp Trp Lys Ile Pro Gln
            420                 425                 430
Leu Pro Ala Asp Ser Gly Lys Ser Val Val Ile Lys Asn Ser Ile Asn
        435                 440                 445
Gly Asp Pro Leu Val Ala Pro Ala Gly Leu Lys His Asn Thr Asp Val
    450                 455                 460
Tyr Gly Ala Pro Gly Glu Ala Ile Glu Phe Ile Phe Val Gly Asp Phe
465                 470                 475                 480
Asn His Glu Ala Tyr Phe Arg Thr Lys Asp Asn Ala Asp Leu Phe Leu
                485                 490                 495
Ser Tyr Ser Ala Val Ser Gly Lys Gly Leu Leu Tyr Asn Thr Pro Asn
            500                 505                 510
Gln Ala Gly Tyr Arg Val Gln Pro Tyr Gly Val Leu Trp Thr Ile Glu
        515                 520                 525
Asn Thr Tyr Trp Asn Asp Phe Leu Trp Tyr Asn Ser Ser Asn Asp Arg
    530                 535                 540
Ile Tyr Val Ser Gly Thr Gly Ala Ala Asn Lys Ser His Ser Gln Trp
545                 550                 555                 560
Ile Ile Asp Gly Leu Gln
                565
<210>81
<211>1422
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>81
atgaaaaaga aattatgtac aatggctctt gtaacagcaa tatcttctgg tgttgttacg      60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag     120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcaaatga aagtacacat     180
ttatggattg cacgaaatgc gattcaaatt atgagtcgta atcaagataa gacggttcaa     240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt     300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat     360
gggctaatta gaggagggtg gaaatctcat ttttacgatc ccgatacaag aaagaactat     420
aaaggggaag aagaaccaac agctctttca caaggagata aatattttaa attagcaggt     480
gaatacttta agaagggcga ccaaaaacaa gctttttatt atttaggtgt tgcaacgcat     540
tactttacag atgctactca accaatgcat gctgctaatt ttacagccgt cgacacgagt     600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa     660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc     720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa     780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag     840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca     900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga     960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt    1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat    1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt    1140
catcgaggag aaagtgtact gctgaaaatg acgcaatcta actatgataa ttacgtattt    1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca    1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga    1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa    1380
acagatacac caaaagcttg gaaatttata caggctgaat ag                       1422
<210>82
<211>473
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)…(25)
<400>82
Met Lys Lys Lys Leu Cys Thr Met Ala Leu Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Gly Val Val Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ser Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Glu Tyr Phe Lys Lys Gly Asp Gln Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
    210                 215                 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
    290                 295                 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305                 310                 315                 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
    370                 375                 380
Ser Val Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
            420                 425                 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
<210>83
<211>1290
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>83
atgaaaaaga tagtgattta ttcatttgta gcaggggtta tgacatcagg cggcgtattt      60
gccgccagtg acaatattgt ggagacgtcg accccaccac agcatcaggc cccaagcaga     120
caggacaggg cattattcgc gggtgataca acaacctata taaaatgtgt ctacaaagtg     180
gatggccagg atgacagcaa tccatcctca tcttggttat gggcgaaagt gggtagcaac     240
tatgcgaagc tgaaggggta ttggtataat tcaatgccgc tggcaaacat gttttacact     300
gaagtaccct atgcagaggt gatggacttg tgtaatagca ccctgaaggc ggtaggtgcc     360
aactccactc ttgttattcc atatgcatcg gattacaccc tgtcctatta ctatgtgatt     420
tggaatcaag gggctaacca gccggttatc aacgttggcg gcagagagct tgaccgtatg     480
gtggtctttg gtgacagctt gagcgatacc gtcaatgtct ataacggctc gtacggtacc     540
gtgccgaata gtacctcctg gttattgggc catttctcta acggaaagct ttggcatgaa     600
tacctttcca cggtattgaa tctgcctagc tatgtgtggg cgactggcaa tgcggagagt     660
ggagagaaac ccttctttaa cggattcagt aagcaggtgg attctttcag ggattatcac     720
gctcgcacta aaggctacga tattagcaag acgttgttta ccgttctgtt tggtggaaat     780
gattttataa cggggggaaa aagcgccgat gaggtcattg agcaatatac ggtgtcattg     840
aactacttgg ctcaactagg ggcgaagcag gttgcaattt tccgcttgcc agatttttca     900
gtgataccca gcgtttcaac gtggacagag gctgataagg acaaactgag agagaatagt     960
gttcagttta atgaccaagc cgagaagctg atcgctaaac taaacgcggc acatccccaa    1020
acgacgtttt atacgctgag gttggatgac gcttttaagc aggtgttgga aaacagcgac    1080
caatacggct ttgttaataa gactgatacc tgcctggata tttcccaagg cggatacaac    1140
tatgccattg gggcccgcgc gaaaacggca tgtaagagca gcaatgcggc gtttgtattc    1200
tgggacaata tgcatccgac caccaaaaca cacggattgt tggccgatct tttaaaagat    1260
gatgtggtac gcggcctcgc tgcgccatga                                     1290
<210>84
<211>429
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)…(22)
<400>84
Met Lys Lys Ile Val Ile Tyr Ser Phe Val Ala Gly Val Met Thr Ser
 1               5                  10                  15
Gly Gly Val Phe Ala Ala Ser Asp Asn Ile Val Glu Thr Ser Thr Pro
            20                  25                  30
Pro Gln His Gln Ala Pro Ser Arg Gln Asp Arg Ala Leu Phe Ala Gly
        35                  40                  45
Asp Thr Thr Thr Tyr Ile Lys Cys Val Tyr Lys Val Asp Gly Gln Asp
    50                  55                  60
Asp Ser Asn Pro Ser Ser Ser Trp Leu Trp Ala Lys Val Gly Ser Asn
65                  70                  75                  80
Tyr Ala Lys Leu Lys Gly Tyr Trp Tyr Asn Ser Met Pro Leu Ala Asn
                85                  90                  95
Met Phe Tyr Thr Glu Val Pro Tyr Ala Glu Val Met Asp Leu Cys Asn
            100                 105                 110
Ser Thr Leu Lys Ala Val Gly Ala Asn Ser Thr Leu Val Ile Pro Tyr
        115                 120                 125
Ala Ser Asp Tyr Thr Leu Ser Tyr Tyr Tyr Val Ile Trp Asn Gln Gly
    130                 135                 140
Ala Asn Gln Pro Val Ile Asn Val Gly Gly Arg Glu Leu Asp Arg Met
145                 150                 155                 160
Val Val Phe Gly Asp Ser Leu Ser Asp Thr Val Asn Val Tyr Asn Gly
                165                 170                 175
Ser Tyr Gly Thr Val Pro Asn Ser Thr Ser Trp Leu Leu Gly His Phe
            180                 185                 190
Ser Asn Gly Lys Leu Trp His Glu Tyr Leu Ser Thr Val Leu Asn Leu
        195                 200                 205
Pro Ser Tyr Val Trp Ala Thr Gly Asn Ala Glu Ser Gly Glu Lys Pro
    210                 215                 220
Phe Phe Asn Gly Phe Ser Lys Gln Val Asp Ser Phe Arg Asp Tyr His
225                 230                 235                 240
Ala Arg Thr Lys Gly Tyr Asp Ile Ser Lys Thr Leu Phe Thr Val Leu
                245                 250                 255
Phe Gly Gly Asn Asp Phe Ile Thr Gly Gly Lys Ser Ala Asp Glu Val
            260                 265                 270
Ile Glu Gln Tyr Thr Val Ser Leu Asn Tyr Leu Ala Gln Leu Gly Ala
        275                 280                 285
Lys Gln Val Ala Ile Phe Arg Leu Pro Asp Phe Ser Val Ile Pro Ser
    290                 295                 300
Val Ser Thr Trp Thr Glu Ala Asp Lys Asp Lys Leu Arg Glu Asn Ser
305                 310                 315                 320
Val Gln Phe Asn Asp Gln Ala Glu Lys Leu Ile Ala Lys Leu Asn Ala
                325                 330                 335
Ala His Pro Gln Thr Thr Phe Tyr Thr Leu Arg Leu Asp Asp Ala Phe
            340                 345                 350
Lys Gln Val Leu Glu Asn Ser Asp Gln Tyr Gly Phe Val Asn Lys Thr
        355                 360                 365
Asp Thr Cys Leu Asp Ile Ser Gln Gly Gly Tyr Asn Tyr Ala Ile Gly
    370                 375                 380
Ala Arg Ala Lys Thr Ala Cys Lys Ser Ser Asn Ala Ala Phe Val Phe
385                 390                 395                 400
Trp Asp Asn Met His Pro Thr Thr Lys Thr His Gly Leu Leu Ala Asp
                405                 410                 415
Leu Leu Lys Asp Asp Val Val Arg Gly Leu Ala Ala Pro
            420                 425
<210>85
<211>1038
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>85
atgacaacac aatttagaaa cttgatattt gaaggcggcg gtgtaaaagg tgttgcttac      60
attggcgcca tgcagattct tgaaaatcgt ggcgtgttgc aagatattcg ccgagtcgga     120
gggtgcagtg cgggtgcgat taacgcgctg atttttgcgc taggttacac ggtccgtgaa     180
caaaaagaga tcttacaagc caccgatttt aaccagttta tggataactc ttggggggtt     240
attcgtgata ttcgcaggct tgctcgagac tttggctgga ataagggtga tttctttagt     300
agctggatag gtgatttgat tcatcgtcgt ttggggaatc gccgagcgac gttcaaagat     360
ctgcaaaagg ccaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt     420
gcagaggtgt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc     480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat     540
gtcgatgggg gtgttcaact taactatccg attaaactgt ttgatcggga gcgttacatt     600
gatttggcca aagatcccgg tgccgttcgg cgaacgggtt attacaacaa agaaaacgct     660
cgctttcagc ttgatcggcc gggccatagc ccctatgttt acaatcgcca gaccttgggt     720
ttgcgactgg atagtcgcga ggagataggg ctctttcgtt atgacgaacc cctcaagggc     780
aaacccatta agtccttcac tgactacgct cgacaacttt tcggtgcgtt gatgaatgca     840
caggaaaaga ttcatctaca tggcgatgat tggcaacgca cgatctatat cgatacattg     900
gatgtgggta cgacggactt caatctttct gatgcaacta agcaagcact gattgagcaa     960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgttaga gaagcctgtg    1020
aatagagtgg agtcatag                                                  1038
<210>86
<211>345
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>86
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Val Ala Tyr Ile Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                   30
Leu Gln Asp Ile Arg Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ala Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Asp Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asp Phe Phe Ser Ser Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Glu Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Val Arg Arg Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Asp Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Gly Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Lys Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Met Asn Ala Gln Glu Lys Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Ile Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Leu
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu Ser
            340                 345
<210>87
<211>870
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>87
atgtcaaaga aactcgtaat atcggtagcg ggcggcggag cactcggaat cggaccactc      60
gcattcctgt gcaagattga acagatgctg ggaaagaaga taccccaggt tgcgcaggca     120
tacgccggca cttcaaccgg agcaataatt gcggcaggac tggccgaagg ctactccgcg     180
catgaactgt tcgacctata caaatcaaat ctcagcaaga tattcaccaa atacagctgg     240
tacaaacgcc tgcagccaac gtgtcctaca tatgacaaca gtaacctaaa gaaattactg     300
aaggacaaat tcaagggcaa ggtcggcgac tggaaaactc ccgtatacat cccggcaaca     360
cacatgaacg gccaatccgt agaaaaggtg tgggacttgg gtgacaagaa tgttgacaag     420
tggtttgcca ttctgacaag taccgcggca ccaacctatt tcgactgcat atacgacgac     480
gagaagaact gctacatcga tggtggcatg tggtgcaacg caccaatcga tgtgcttaat     540
gcaggcctga tcaagtccgg ctggtccaac tacaaggtcc tggacctgga gaccggcatg     600
gacacaccga atacggaaag cggaaacaag acacttctcg gatgggggga atacatcata     660
agcaactggg tagcccgttc cagcaagtcc ggcgaatacg aggtaaaggc cataatcggg     720
gaagacaatg tatgtgttgc ccgtccatac gtaagcaaga aaccgaagat ggatgacgtg     780
gacagcaaga cgctggatga agtcgtggat atctgggaaa actacttcta cgccaagcag     840
aaagacatcg catcgtggct gaaaatctag                                      870
<210>88
<211>289
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>88
Met Ser Lys Lys Leu Val Ile Ser Val Ala Gly Gly Gly Ala Leu Gly
 1               5                  10                  15
Ile Gly Pro Leu Ala Phe Leu Cys Lys Ile Glu Gln Met Leu Gly Lys
            20                  25                  30
Lys Ile Pro Gln Val Ala Gln Ala Tyr Ala Gly Thr Ser Thr Gly Ala
        35                  40                  45
Ile Ile Ala Ala Gly Leu Ala Glu Gly Tyr Ser Ala His Glu Leu Phe
    50                  55                  60
Asp Leu Tyr Lys Ser Asn Leu Ser Lys Ile Phe Thr Lys Tyr Ser Trp
65                  70                  75                  80
Tyr Lys Arg Leu Gln Pro Thr Cys Pro Thr Tyr Asp Asn Ser Asn Leu
                85                  90                 95
Lys Lys Leu Leu Lys Asp Lys Phe Lys Gly Lys Val Gly Asp Trp Lys
            100                 105                 110
Thr Pro Val Tyr Ile Pro Ala Thr His Met Asn Gly Gln Ser Val Glu
        115                 120                 125
Lys Val Trp Asp Leu Gly Asp Lys Asn Val Asp Lys Trp Phe Ala Ile
    130                 135                 140
Leu Thr Ser Thr Ala Ala Pro Thr Tyr Phe Asp Cys Ile Tyr Asp Asp
145                 150                 155                 160
Glu Lys Asn Cys Tyr Ile Asp Gly Gly Met Trp Cys Asn Ala Pro Ile
                165                 170                 175
Asp Val Leu Asn Ala Gly Leu Ile Lys Ser Gly Trp Ser Asn Tyr Lys
            180                 185                 190
Val Leu Asp Leu Glu Thr Gly Met Asp Thr Pro Asn Thr Glu Ser Gly
        195                 200                 205
Asn Lys Thr Leu Leu Gly Trp Gly Glu Tyr Ile Ile Ser Asn Trp Val
    210                 215                 220
Ala Arg Ser Ser Lys Ser Gly Glu Tyr Glu Val Lys Ala Ile Ile Gly
225                 230                 235                 240
Glu Asp Asn Val Cys Val Ala Arg Pro Tyr Val Ser Lys Lys Pro Lys
                245                 250                 255
Met Asp Asp Val Asp Ser Lys Thr Leu Asp Glu Val Val Asp Ile Trp
            260                 265                 270
Glu Asn Tyr Phe Tyr Ala Lys Gln Lys Asp Ile Ala Ser Trp Leu Lys
        275                 280                 285
Ile
<210>89
<211>1422
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>89
atgaaaaaga aattatgtac actggctttt gtaacagcaa tatcttctat cgctatcaca      60
attccaacag aagcacaagc ttgtggaata ggcgaagtaa tgaaacagga gaaccaagag     120
cacaaacgtg tgaagagatg gtctgcggaa catccacatc atcctaatga aagtacgcac     180
ttatggattg cgcgaaatgc aattcaaata atggcccgta atcaagataa gacggttcaa     240
gaaaatgaat tacaattttt aaatactcct gaatataagg agttatttga aagaggtctt     300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtacaat cggcattgat     360
gggctaatta aaggagggtg gaaatctcat ttttacgatc ccgatacgag aaagaactat     420
aaaggggaag aagaaccaac agctctctct caaggagata aatattttaa attagcaggc     480
gattacttta agaaagagga ttggaaacaa gctttctatt atttaggtgt tgcgacgcac     540
tacttcacag atgctactca gccaatgcat gctgctaatt ttacagccgt cgacacgagt     600
gctttaaagt ttcatagcgc ttttgaaaat tatgtgacga caattcagac acagtatgaa     660
gtatctgatg gtgagggcgt atataattta gtgaattcta atgatccaaa acagtggatc     720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga cgagattaaa     780
tctcactata ataaaggaaa caatgctctt tggcaacaag aagttatgcc agctgtccag     840
aggagtttag agaacgcaca aagaaacacg gcgggattta ttcatttatg gtttaaaaca     900
tttgttggca atactgccgc tgaagaaatt gaaaatactg tagtgaaaga ttctaaagga     960
gaagcaatac aagataataa aaaatacttc gtagtgccaa gtgagtttct aaatagaggt    1020
ttgacctttg aagtatatgc aaggaatgac tatgcactat tatctaatta cgtagatgat    1080
agtaaagttc atggtacgcc agttcagttt gtatttgata aagataataa cggtatcctt    1140
catcgaggag aaagtatact gctgaaaatg acgcaatcta actatgataa ttacgtattt    1200
ctaaactact ctaacttgac aaactgggta catcttgcgc aacaaaaaac aaatactgca    1260
cagtttaaag tgtatccaaa tccgaataac ccatctgaat attacctata tacagatgga    1320
tacccagtaa attatcaaga aaatggtaac ggaaagagct ggattgtgtt aggaaagaaa    1380
acagatacac caaaagcttg gaaatttata caggctgaat ag                       1422
<210>90
<211>473
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(25)
<400>90
Met Lys Lys Lys Leu Cys Thr Leu Ala Phe Val Thr Ala Ile Ser Ser
 1               5                  10                  15
Ile Ala Ile Thr Ile Pro Thr Glu Ala Gln Ala Cys Gly Ile Gly Glu
            20                  25                  30
Val Met Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Pro Asn Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Arg Asn Ala Ile Gln Ile Met Ala Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Thr Ile Gly Ile Asp Gly Leu Ile Lys Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Asp Tyr Phe Lys Lys Glu Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Thr Ser Ala Leu Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asn Tyr Val Thr Thr Ile Gln Thr Gln Tyr Glu Val Ser Asp Gly
    210                 215                 220
Glu Gly Val Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Glu Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Asn Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Phe Val Gly Asn
    290                 295                 300
Thr Ala Ala Glu Glu Ile Glu Asn Thr Val Val Lys Asp Ser Lys Gly
305                 310                 315                 320
Glu Ala Ile Gln Asp Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Arg Asn Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn Tyr Val Asp Asp Ser Lys Val His Gly Thr Pro Val
        355                 360                 365
Gln Phe Val Phe Asp Lys Asp Asn Asn Gly Ile Leu His Arg Gly Glu
    370                 375                 380
Ser Ile Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Asn Leu Thr Asn Trp Val His Leu Ala Gln Gln Lys
                405                 410                 415
Thr Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Ser
            420                 425                 430
Glu Tyr Tyr Leu Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Asn
        435                 440                 445
Gly Asn Gly Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Thr Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
<210>91
<211>1035
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>91
atgacaaccc aatttagaaa cctgatcttt gagggcggcg gtgtaaaggg cattgcttac      60
gtcggagcaa tgcagattct tgaaaatcgt ggtgtattac aagatattca ccgagtcgga     120
ggttgtagtg cgggtgcgat taacgcgctg atttttgcgc tgggttacac agtccgtgag     180
caaaaagaga tcttacaaat taccgatttt aaccagttta tggataactc gtggggtgtt     240
attcgggata ttcgcaggct tgcgagagaa tttggctgga ataagggtaa cttctttaat     300
acctggatag gtgatttgat tcatcgtcgt ttgggtaatc gccgagccac gttcaaagat     360
ctgcaaaagg caaagcttcc tgatctttat gtcatcggta ctaatctgtc tacagggttt     420
gcagaggttt tttctgccga aagacacccc gatatggagc tggcgacagc ggtgcgtatc     480
tccatgtcga taccgctgtt ctttgcggcc gtgcgtcacg gtgatcgaca agatgtgtat     540
gtcgatgggg gtgtgcagct taactacccg atcaagctgt ttgatcgaac tcgttatatt     600
gacctcgcca aagatccggg tgctgctcgc cacacgggtt attacaataa agagaatgct     660
cgttttcagc ttgagcgacc gggccacagt ccttatgtgt acaatcgcca aacattaggc     720
ttgcgtcttg acagtcgtga agagatagcg ctgtttcgtt acgacgaacc tcttcagggt     780
aaacccatta agtccttcac tgactacgct cgacaacttt ttggtgcgct gaagaatgca     840
caggaaaaca ttcacctaca tggcgatgat tggcagcgca cggtctatat cgatacattg     900
gatgtgggta cgacggattt caatctttct gatgcaacca agcaagcact gattgaacag     960
ggaattaacg gcaccgaaaa ttatttcgag tggtttgata atccgtttga gaagcctgtg    1020
aatagagtgg agtaa                                                     1035
<210>92
<211>344
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>92
Met Thr Thr Gln Phe Arg Asn Leu Ile Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Val Gly Ala Met Gln Ile Leu Glu Asn Arg Gly Val
            20                  25                  30
Leu Gln Asp Ile His Arg Val Gly Gly Cys Ser Ala Gly Ala Ile Asn
        35                  40                  45
Ala Leu Ile Phe Ala Leu Gly Tyr Thr Val Arg Glu Gln Lys Glu Ile
    50                  55                  60
Leu Gln Ile Thr Asp Phe Asn Gln Phe Met Asp Asn Ser Trp Gly Val
65                  70                  75                  80
Ile Arg Asp Ile Arg Arg Leu Ala Arg Glu Phe Gly Trp Asn Lys Gly
                85                  90                  95
Asn Phe Phe Asn Thr Trp Ile Gly Asp Leu Ile His Arg Arg Leu Gly
            100                 105                 110
Asn Arg Arg Ala Thr Phe Lys Asp Leu Gln Lys Ala Lys Leu Pro Asp
        115                 120                 125
Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ala Glu Val Phe
    130                 135                 140
Ser Ala Glu Arg His Pro Asp Met Glu Leu Ala Thr Ala Val Arg Ile
145                 150                 155                 160
Ser Met Ser Ile Pro Leu Phe Phe Ala Ala Val Arg His Gly Asp Arg
                165                 170                 175
Gln Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Ile Lys
            180                 185                 190
Leu Phe Asp Arg Thr Arg Tyr Ile Asp Leu Ala Lys Asp Pro Gly Ala
        195                 200                 205
Ala Arg His Thr Gly Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Gln Leu
    210                 215                 220
Glu Arg Pro Gly His Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu Gly
225                 230                 235                 240
Leu Arg Leu Asp Ser Arg Glu Glu Ile Ala Leu Phe Arg Tyr Asp Glu
                245                 250                 255
Pro Leu Gln Gly Lys Pro Ile Lys Ser Phe Thr Asp Tyr Ala Arg Gln
            260                 265                 270
Leu Phe Gly Ala Leu Lys Asn Ala Gln Glu Asn Ile His Leu His Gly
        275                 280                 285
Asp Asp Trp Gln Arg Thr Val Tyr Ile Asp Thr Leu Asp Val Gly Thr
    290                 295                 300
Thr Asp Phe Asn Leu Ser Asp Ala Thr Lys Gln Ala Leu Ile Glu Gln
305                 310                 315                 320
Gly Ile Asn Gly Thr Glu Asn Tyr Phe Glu Trp Phe Asp Asn Pro Phe
                325                 330                 335
Glu Lys Pro Val Asn Arg Val Glu
            340
<210>93
<211>963
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>93
gtgattactt tgataaaaaa atgtttatta gtattgacga tgactctatt atcaggggtt      60
ttcgtaccgc tgcagccatc atatgctact gaaaattatc caaatgattt taaactgttg     120
caacataatg tatttttatt gcctgaatca gtttcttatt ggggtcagga cgaacgtgca     180
gattatatga gtaatgcaga ttactttaag ggacatgatg ctctgctctt aaatgagctt     240
tttgacaatg gaaattcgaa cgtgctgcta atgaacttat ccaaggaata tacatatcaa     300
acgccagtgc ttggccgttc gatgagtgga tgggatgaaa ctagaggaag ctattctaat     360
tttgtacccg aagatggtgg tgtagcaatt atcagtaaat ggccaatcgt ggagaaaata     420
cagcatgttt acgcgaatgg ttgcggtgca gactattatg caaataaagg atttgtttat     480
gcaaaagtac aaaaagggga taaattctat catcttatca gcactcatgc tcaagccgaa     540
gataccgggt gtgatcaggg tgaaggagca gaaattcgtc attcacagtt tcaagaaatc     600
aacgacttta ttaaaaataa aaacattccg aaagatgaag tggtatttat tggtggtgac     660
tttaatgtga tgaagagtga cacaacagag tacaatagca tgttatcaac attaaatgtc     720
aatgcgccta ccgaatattt agggcataac tctacttggg acccagaaac gaacagcatt     780
acaggttaca attaccctga ttatgcgcca cagcatttag attatatttt tgtggaaaaa     840
gatcataaac aaccaagttc atgggtaaat gaaacgatta ctccgaagtc tccaacttgg     900
aaggcaatct atgagtataa tgattattcc gatcactatc ctgttaaagc atacgtaaaa     960
taa                                                                   963
<210>94
<211>320
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)…(29)
<400>94
Met Ile Thr Leu Ile Lys Lys Cys Leu Leu Val Leu Thr Met Thr Leu
 1               5                  10                  15
Leu Ser Gly Val Phe Val Pro Leu Gln Pro Ser Tyr Ala Thr Glu Asn
            20                  25                  30
Tyr Pro Asn Asp Phe Lys Leu Leu Gln His Asn Val Phe Leu Leu Pro
        35                  40                  45
Glu Ser Val Ser Tyr Trp Gly Gln Asp Glu Arg Ala Asp Tyr Met Ser
    50                  55                  60
Asn Ala Asp Tyr Phe Lys Gly His Asp Ala Leu Leu Leu Asn Glu Leu
65                  70                  75                  80
Phe Asp Asn Gly Asn Ser Asn Val Leu Leu Met Asn Leu Ser Lys Glu
                85                  90                  95
Tyr Thr Tyr Gln Thr Pro Val Leu Gly Arg Ser Met Ser Gly Trp Asp
            100                 105                 110
Glu Thr Arg Gly Ser Tyr Ser Asn Phe Val Pro Glu Asp Gly Gly Val
        115                 120                 125
Ala Ile Ile Ser Lys Trp Pro Ile Val Glu Lys Ile Gln His Val Tyr
    130                 135                 140
Ala Asn Gly Cys Gly Ala Asp Tyr Tyr Ala Asn Lys Gly Phe Val Tyr
145                 150                 155                 160
Ala Lys Val Gln Lys Gly Asp Lys Phe Tyr His Leu Ile Ser Thr His
                165                 170                 175
Ala Gln Ala Glu Asp Thr Gly Cys Asp Gln Gly Glu Gly Ala Glu Ile
            180                 185                 190
Arg His Ser Gln Phe Gln Glu Ile Asn Asp Phe Ile Lys Asn Lys Asn
        195                 200                 205
Ile Pro Lys Asp Glu Val Val Phe Ile Gly Gly Asp Phe Asn Val Met
    210                 215                 220
Lys Ser Asp Thr Thr Glu Tyr Asn Ser Met Leu Ser Thr Leu Asn Val
225                 230                 235                 240
Asn Ala Pro Thr Glu Tyr Leu Gly His Asn Ser Thr Trp Asp Pro Glu
                245                 250                 255
Thr Asn Ser Ile Thr Gly Tyr Asn Tyr Pro Asp Tyr Ala Pro Gln His
            260                 265                 270
Leu Asp Tyr Ile Phe Val Glu Lys Asp His Lys Gln Pro Ser Ser Trp
        275                 280                 285
Val Asn Glu Thr Ile Thr Pro Lys Ser Pro Thr Trp Lys Ala Ile Tyr
    290                 295                 300
Glu Tyr Asn Asp Tyr Ser Asp His Tyr Pro Val Lys Ala Tyr Val Lys
305                 310                 315                 320
<210>95
<211>1038
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>95
atggcttcac aattcaggaa tctggtattt gaaggaggtg gtgtaaaagg gattgcgtac      60
ataggtgcga tgcaggtgct ggatcagcgc ggttatttgg gtgataacat caaacgcgtt     120
ggtggaacca gtgcaggtgc cataaatgcg ctgatttatt cgttaggata tgacatccac     180
gaacaacaag agatactgaa ctctacagat tttaaaaagt ttatggataa ctcttttgga     240
tttgtgaggg atttcagaag gctatggaat gaatttggat ggaatagagg agactttttt     300
cttaaatggt caggtgagct gatcaaaaat aaattgggca cctcaaaagc cacctttcag     360
gatttgaagg atgccggtca gccagatttg tatgtaattg gaacaaattt atcgacgggg     420
ttttccgaga ctttttcata tgaacgtcac cccgatatga ctcttgcaga agccgtaaga     480
atcagtatgt cgcttccgct gtttttcagg gctgtgcggt tgggcgacag gaatgatgta     540
tatgtggatg gtggggttca gctcaattac ccggtaaaac tatttgatcg tgaaaaatat     600
attgatatgg ataatgaggc ggctgcagca cgatttactg attattacaa caaagaaaat     660
gccagatttt cgctccagcg gcctggacga agcccctatg tatataatcg tcaaaccctt     720
ggtttgagac tggatacagc cgaagaaatt gcgcttttca ggtacgatga acccattcag     780
gggaaagaga tcaaacggtt tccggaatat gcaaaggctc tgatcggcgc actaatgcag     840
gtgcaggaaa acatacatct ccacagtgac gactggcagc gtacgctgta tatcaatacc     900
ctggatgtaa aaaccacaga ttttgaatta accgatgaga aaaaaaagga actggtagaa     960
cagggaatcc ttggcgcgga aacctatttc aaatggtttg aagacaggga tgaagtagtt    1020
gtaaaccgcc ttgcttag                                                  1038
<210>96
<211>345
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>96
Met Ala Ser Gln Phe Arg Asn Leu Val Phe Glu Gly Gly Gly Val Lys
 1               5                  10                  15
Gly Ile Ala Tyr Ile Gly Ala Met Gln Val Leu Asp Gln Arg Gly Tyr
            20                  25                  30
Leu Gly Asp Asn Ile Lys Arg Val Gly Gly Thr Ser Ala Gly Ala Ile
        35                  40                  45
Asn Ala Leu Ile Tyr Ser Leu Gly Tyr Asp Ile His Glu Gln Gln Glu
    50                  55                  60
Ile Leu Asn Ser Thr Asp Phe Lys Lys Phe Met Asp Asn Ser Phe Gly
65                  70                  75                  80
Phe Val Arg Asp Phe Arg Arg Leu Trp Asn Glu Phe Gly Trp Asn Arg
                85                  90                  95
Gly Asp Phe Phe Leu Lys Trp Ser Gly Glu Leu Ile Lys Asn Lys Leu
            100                 105                 110
Gly Thr Ser Lys Ala Thr Phe Gln Asp Leu Lys Asp Ala Gly Gln Pro
        115                 120                 125
Asp Leu Tyr Val Ile Gly Thr Asn Leu Ser Thr Gly Phe Ser Glu Thr
    130                 135                 140
Phe Ser Tyr Glu Arg His Pro Asp Met Thr Leu Ala Glu Ala Val Arg
145                 150                 155                 160
Ile Ser Met Ser Leu Pro Leu Phe Phe Arg Ala Val Arg Leu Gly Asp
                165                 170                 175
Arg Asn Asp Val Tyr Val Asp Gly Gly Val Gln Leu Asn Tyr Pro Val
            180                 185                 190
Lys Leu Phe Asp Arg Glu Lys Tyr Ile Asp Met Asp Asn Glu Ala Ala
        195                 200                 205
Ala Ala Arg Phe Thr Asp Tyr Tyr Asn Lys Glu Asn Ala Arg Phe Ser
    210                 215                 220
Leu Gln Arg Pro Gly Arg Ser Pro Tyr Val Tyr Asn Arg Gln Thr Leu
225                 230                 235                 240
Gly Leu Arg Leu Asp Thr Ala Glu Glu Ile Ala Leu Phe Arg Tyr Asp
                245                 250                 255
Glu Pro Ile Gln Gly Lys Glu Ile Lys Arg Phe Pro Glu Tyr Ala Lys
            260                 265                 270
Ala Leu Ile Gly Ala Leu Met Gln Val Gln Glu Asn Ile His Leu His
        275                 280                 285
Ser Asp Asp Trp Gln Arg Thr Leu Tyr Ile Asn Thr Leu Asp Val Lys
    290                 295                 300
Thr Thr Asp Phe Glu Leu Thr Asp Glu Lys Lys Lys Glu Leu Val Glu
305                 310                 315                 320
Gln Gly Ile Leu Gly Ala Glu Thr Tyr Phe Lys Trp Phe Glu Asp Arg
                325                 330                 335
Asp Glu Val Val Val Asn Arg Leu Ala
            340                 345
<210>97
<211>1422
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>97
atgaaaagga aactatgtac atgggctctc gtaacagcaa tagcttctag tactgcggta      60
attccaacag cagcagaagc ttgtggatta ggagaagtaa tcaaacaaga gaatcaagag     120
cacaaacgtg tgaaaagatg gtctgcggag catccgcatc attcacatga aagtacccat     180
ttatggattg cacaaaatgc gattcaaatt atgagccgta atcaagataa gacggttcaa     240
gaaaatgaat tacaattttt aaatacccct gaatataagg agttatttga aagaggtctt     300
tatgatgctg attaccttga tgaatttaac gatggaggta caggtataat cggcattgat     360
gggctaattc gaggagggtg gaaatctcat ttctacgatc ccgatacaag aaagaactat     420
aaaggggagg aagaaccaac agctctttct caaggagata aatattttaa attagcaggt     480
gaatacttta agaagaatga ttggaaacag gctttctatt atttaggtgt tgcgacgcac     540
tactttacag atgctactca gccaatgcat gctgctaatt ttacagctgt cgacaggagt     600
gctataaagt ttcatagtgc ttttgaagat tatgtgacga caattcagga acagtttaaa     660
gtatcagatg gagagggaaa atataattta gtaaattcta atgatccgaa acagtggatc     720
catgaaacag cgagactcgc aaaagtggaa atcgggaaca ttaccaatga tgtgattaaa     780
tctcactata ataaaggaaa caatgctctt tggcagcaag aagttatgcc agctgttcag     840
agaagtttag aacaagccca aagaaatacg gcgggattta ttcatttatg gtttaaaaca     900
tatgttggaa aaacagctgc tgaagatatt gaaaatacta tagtgaaaga ttctagggga     960
gaagcaatac aagagaataa aaaatacttt gtagtaccaa gtgagttttt aaatagaggc    1020
ttaacatttg aagtgtatgc tgcttatgac tatgcgttat tatctaacca tgtggatgat    1080
aataatattc atggtacacc ggttcaaatt gtatttgata aagaaaataa tgggatcctt    1140
catcaaggag aaagtgcatt gttaaagatg acacaatcca actacgataa ttatgtattt    1200
ctaaattatt ctatcataac aaattgggta catcttgcaa aaagagaaaa caatactgca    1260
cagtttaaag tgtatccaaa tccaaataat ccaactgaat atttcatata tacagatggc    1320
tatccagtta attatcaaga aaaaggtaaa gagaaaagct ggattgtttt aggaaagaaa    1380
acggataaac caaaagcatg gaaatttata caggcggaat aa                       1422
<210>98
<211>473
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(25)
<400>98
Met Lys Arg Lys Leu Cys Thr Trp Ala Leu Val Thr Ala Ile Ala Ser
 1               5                  10                  15
Ser Thr Ala Val Ile Pro Thr Ala Ala Glu Ala Cys Gly Leu Gly Glu
            20                  25                  30
Val Ile Lys Gln Glu Asn Gln Glu His Lys Arg Val Lys Arg Trp Ser
        35                  40                  45
Ala Glu His Pro His His Ser His Glu Ser Thr His Leu Trp Ile Ala
    50                  55                  60
Gln Asn Ala Ile Gln Ile Met Ser Arg Asn Gln Asp Lys Thr Val Gln
65                  70                  75                  80
Glu Asn Glu Leu Gln Phe Leu Asn Thr Pro Glu Tyr Lys Glu Leu Phe
                85                  90                  95
Glu Arg Gly Leu Tyr Asp Ala Asp Tyr Leu Asp Glu Phe Asn Asp Gly
            100                 105                 110
Gly Thr Gly Ile Ile Gly Ile Asp Gly Leu Ile Arg Gly Gly Trp Lys
        115                 120                 125
Ser His Phe Tyr Asp Pro Asp Thr Arg Lys Asn Tyr Lys Gly Glu Glu
    130                 135                 140
Glu Pro Thr Ala Leu Ser Gln Gly Asp Lys Tyr Phe Lys Leu Ala Gly
145                 150                 155                 160
Glu Tyr Phe Lys Lys Asn Asp Trp Lys Gln Ala Phe Tyr Tyr Leu Gly
                165                 170                 175
Val Ala Thr His Tyr Phe Thr Asp Ala Thr Gln Pro Met His Ala Ala
            180                 185                 190
Asn Phe Thr Ala Val Asp Arg Ser Ala Ile Lys Phe His Ser Ala Phe
        195                 200                 205
Glu Asp Tyr Val Thr Thr Ile Gln Glu Gln Phe Lys Val Ser Asp Gly
    210                 215                 220
Glu Gly Lys Tyr Asn Leu Val Asn Ser Asn Asp Pro Lys Gln Trp Ile
225                 230                 235                 240
His Glu Thr Ala Arg Leu Ala Lys Val Glu Ile Gly Asn Ile Thr Asn
                245                 250                 255
Asp Val Ile Lys Ser His Tyr Asn Lys Gly Asn Asn Ala Leu Trp Gln
            260                 265                 270
Gln Glu Val Met Pro Ala Val Gln Arg Ser Leu Glu Gln Ala Gln Arg
        275                 280                 285
Asn Thr Ala Gly Phe Ile His Leu Trp Phe Lys Thr Tyr Val Gly Lys
    290                 295                 300
Thr Ala Ala Glu Asp Ile Glu Asn Thr Ile Val Lys Asp Ser Arg Gly
305                 310                 315                 320
Glu Ala Ile Gln Glu Asn Lys Lys Tyr Phe Val Val Pro Ser Glu Phe
                325                 330                 335
Leu Asn Arg Gly Leu Thr Phe Glu Val Tyr Ala Ala Tyr Asp Tyr Ala
            340                 345                 350
Leu Leu Ser Asn His Val Asp Asp Asn Asn Ile His Gly Thr Pro Val
        355                 360                 365
Gln Ile Val Phe Asp Lys Glu Asn Asn Gly Ile Leu His Gln Gly Glu
    370                 375                 380
Ser Ala Leu Leu Lys Met Thr Gln Ser Asn Tyr Asp Asn Tyr Val Phe
385                 390                 395                 400
Leu Asn Tyr Ser Ile Ile Thr Asn Trp Val His Leu Ala Lys Arg Glu
                405                 410                 415
Asn Asn Thr Ala Gln Phe Lys Val Tyr Pro Asn Pro Asn Asn Pro Thr
            420                 425                 430
Glu Tyr Phe Ile Tyr Thr Asp Gly Tyr Pro Val Asn Tyr Gln Glu Lys
        435                 440                 445
Gly Lys Glu Lys Ser Trp Ile Val Leu Gly Lys Lys Thr Asp Lys Pro
    450                 455                 460
Lys Ala Trp Lys Phe Ile Gln Ala Glu
465                 470
<210>99
<211>1053
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>99
atggcaaagc gttttattct ttcgatcgat ggtggtggca ttcgcgggat catcccggcg      60
gccatcctgg tggagctggc caagcggttg gaggggctgc cgcttcacaa ggcattcgac     120
atgatcgccg ggacatccac cggcggcatc attgcggcgg ggctgacatg cccgcatcct     180
gacgatgagg agacggcggc gtgcacgccg accgatcttc tcaagcttta tgtcgatcac     240
ggcggcaaga tcttcgagaa aaacccgatc ctcggcctca tcaacccatt cggcctcaac     300
gatccgcgct accagccaga tgagctggaa aacaggctga aggcgcagct cggcttgacg     360
gcgacgctcg ataaagggct caccaaggtg ctgatcacgg cctatgatat ccagcagcgg     420
caggcgctgt tcatggcaaa caccgacaac gagaacagca atttccgcta ctgggaggca     480
gcgcgggcga catcggccgc acccacctat tttccgccgg cgctgatcga aagggttggc     540
gagaagaaca aggacaagcg cttcgtgcca ttgatcgacg gcggcgtctt cgccaacgat     600
cctatccttg ccgcctatgt ggaggcgcga aagcagaaat ggggcaatga cgagctcgtt     660
ttcctgtcgc ttggtaccgg ccagcaaaac cgcccgatcg cctatcagga ggccaagggc     720
tggggcattt taggctggat gcagccgtct catgacacgc cgctgatctc gatcctgatg     780
cagggacagg cgagcaccgc ctcctatcag gccaatgcgc tgctcaatcc gcccggcacc     840
aagatcgact attcgaccgt ggtgacgaag gacaacgcgg cttcgctcag ctatttccgt     900
ctcgaccggc agctgagctc gaaggagaac gacgcgctgg acgacgcatc gcccgaaaac     960
atcagggcgc tgaaggcaat cgccgcgcaa atcatcaagg ataacgcgcc ggcgctcgac    1020
gaaatcgcca aacgcatcct ggccaaccaa taa                                 1053
<210>100
<211>350
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>100
Met Ala Lys Arg Phe Ile Leu Ser Ile Asp Gly Gly Gly Ile Arg Gly
 1               5                  10                  15
Ile Ile Pro Ala Ala Ile Leu Val Glu Leu Ala Lys Arg Leu Glu Gly
            20                  25                  30
Leu Pro Leu His Lys Ala Phe Asp Met Ile Ala Gly Thr Ser Thr Gly
        35                  40                  45
Gly Ile Ile Ala Ala Gly Leu Thr Cys Pro His Pro Asp Asp Glu Glu
    50                  55                  60
Thr Ala Ala Cys Thr Pro Thr Asp Leu Leu Lys Leu Tyr Val Asp His
65                  70                  75                  80
Gly Gly Lys Ile Phe Glu Lys Asn Pro Ile Leu Gly Leu Ile Asn Pro
                85                  90                  95
Phe Gly Leu Asn Asp Pro Arg Tyr Gln Pro Asp GluLeu Glu Asn Arg
            100                 105                110
Leu Lys Ala Gln Leu Gly Leu Thr Ala Thr Leu Asp Lys Gly Leu Thr
        115                 120                 125
Lys Val Leu Ile Thr Ala Tyr Asp Ile Gln Gln Arg Gln Ala Leu Phe
    130                 135                 140
Met Ala Asn Thr Asp Asn Glu Asn Ser Asn Phe Arg Tyr Trp Glu Ala
145                 150                 155                 160
Ala Arg Ala Thr Ser Ala Ala Pro Thr Tyr Phe Pro Pro Ala Leu Ile
                165                 170                175
Glu Arg Val Gly Glu Lys Asn Lys Asp Lys Arg Phe Val Pro Leu Ile
            180                 185                 190
Asp Gly Gly Val Phe Ala Asn Asp Pro Ile Leu Ala Ala Tyr Val Glu
        195                 200                 205
Ala Arg Lys Gln Lys Trp Gly Asn Asp Glu Leu Val Phe Leu Ser Leu
    210                 215                 220
Gly Thr Gly Gln Gln Asn Arg Pro Ile Ala Tyr Gln Glu Ala Lys Gly
225                 230                 235                 240
Trp Gly Ile Leu Gly Trp Met Gln Pro Ser His Asp Thr Pro Leu Ile
                245                 250                 255
Ser Ile Leu Met Gln Gly Gln Ala Ser Thr Ala Ser Tyr Gln Ala Asn
            260                 265                 270
Ala Leu Leu Asn Pro Pro Gly Thr Lys Ile Asp Tyr Ser Thr Val Val
        275                 280                 285
Thr Lys Asp Asn Ala Ala Ser Leu Ser Tyr Phe Arg Leu Asp Arg Gln
    290                 295                 300
Leu Ser Ser Lys Glu Asn Asp Ala Leu Asp Asp Ala Ser Pro Glu Asn
305                 310                 315                 320
Ile Arg Ala Leu Lys Ala Ile Ala Ala Gln Ile Ile Lys Asp Asn Ala
                325                 330                 335
Pro Ala Leu Asp Glu Ile Ala Lys Arg Ile Leu Ala Asn Gln
            340                 345                 350
<210>101
<211>996
<212>DNA
<213>Bacteria
<400>101
ttgtcgctcg tcgcgtcgct ccgccgcgcc cccggcgccg ccctggccct cgcgcttgcc      60
gccgccaccc tggccgtgac cgcgcagggc gcgaccgccg cccccgccgc ggccgccgcc     120
gaggccccgc ggctcaaggt gctcacgtac aacacgttcc tgttctcgaa gacgctctac     180
ccgaactggg gccaggacca ccgggccaag gcgatcccca ccgccccctt ctaccagggc     240
caggacgtcg tggtcctcca ggaggccttc gacaactccg cgtcggacgc cctcaaggcg     300
aactccgccg gccagtaccc ctaccagacc cccgtcgtgg gccgcggcac cggcggctgg     360
gacgccaccg gcgggtccta ctcctcgacc acccccgagg acggcggcgt gacgatcctc     420
agcaagtggc cgatcgtccg caaggagcag tacgtctaca aggacgcgtg cggcgccgac     480
tggtggtcca acaagggctt cgcctacgtc gtgctcaacg tgaacggcag caaggtgcac     540
gtcctcggca cccacgccca gtccaccgac ccgggctgct cggcgggcga ggcggtgcag     600
atgcggagcc gccagttcaa ggcgatcgac gccttcctcg acgccaagaa catcccggcg     660
ggcgagcagg tgatcgtcgc cggcgacatg aacgtcgact cgcgcacgcc cgagtacggc     720
accatgctcg ccgacgccgg tctggcggcg gccgacgcgc gcaccggcca cccgtactcc     780
ttcgacaccg agctgaactc gatcgcctcc gagcgctacc cggacgaccc gcgcgaggac     840
ctcgattacg tcctctaccg cgccgggaac gcccgccccg ccaactggac caacaacgtg     900
gtcctggaga agagcgcccc gtggaccgtc tccagctggg gcaagagcta cacctacacc     960
aacctctccg accactaccc ggtcaccggc ttctga                               996
<210>102
<211>331
<212>PRT
<213>Bacteria
<220>
<221>SIGNAL
<222>(1)…(39)
<400>102
Leu Ser Leu Val Ala Ser Leu Arg Arg Ala Pro Gly Ala Ala Leu Ala
 1               5                  10                  15
Leu Ala Leu Ala Ala Ala Thr Leu Ala Val Thr Ala Gln Gly Ala Thr
            20                  25                  30
Ala Ala Pro Ala Ala Ala Ala Ala Glu Ala Pro Arg Leu Lys Val Leu
        35                  40                  45
Thr Tyr Asn Thr Phe Leu Phe Ser Lys Thr Leu Tyr Pro Asn Trp Gly
    50                  55                  60
Gln Asp His Arg Ala Lys Ala Ile Pro Thr Ala Pro Phe Tyr Gln Gly
65                  70                  75                  80
Gln Asp Val Val Val Leu Gln Glu Ala Phe Asp Asn Ser Ala Ser Asp
                85                  90                  95
Ala Leu Lys Ala Asn Ser Ala Gly Gln Tyr Pro Tyr Gln Thr Pro Val
            100                 105                 110
Val Gly Arg Gly Thr Gly Gly Trp Asp Ala Thr Gly Gly Ser Tyr Ser
        115                 120                 125
Ser Thr Thr Pro Glu Asp Gly Gly Val Thr Ile Leu Ser Lys Trp Pro
    130                 135                 140
Ile Val Arg Lys Glu Gln Tyr Val Tyr Lys Asp Ala Cys Gly Ala Asp
145                 150                 155                 160
Trp Trp Ser Asn Lys Gly Phe Ala Tyr Val Val Leu Asn Val Asn Gly
                165                 170                 175
Ser Lys Val His Val Leu Gly Thr His Ala Gln Ser Thr Asp Pro Gly
            180                 185                 190
Cys Ser Ala Gly Glu Ala Val Gln Met Arg Ser Arg Gln Phe Lys Ala
        195                 200                 205
Ile Asp Ala Phe Leu Asp Ala Lys Asn Ile Pro Ala Gly Glu Gln Val
    210                 215                 220
Ile Val Ala Gly Asp Met Asn Val Asp Ser Arg Thr Pro Glu Tyr Gly
225                 230                 235                 240
Thr Met Leu Ala Asp Ala Gly Leu Ala Ala Ala Asp Ala Arg Thr Gly
                245                 250                 255
His Pro Tyr Ser Phe Asp Thr Glu Leu Asn Ser Ile Ala Ser Glu Arg
            260                 265                 270
Tyr Pro Asp Asp Pro Arg Glu Asp Leu Asp Tyr Val Leu Tyr Arg Ala
        275                 280                 285
Gly Asn Ala Arg Pro Ala Asn Trp Thr Asn Asn Val Val Leu Glu Lys
    290                 295                 300
Ser Ala Pro Trp Thr Val Ser Ser Trp Gly Lys Ser Tyr Thr Tyr Thr
305                 310                 315                 320
Asn Leu Ser Asp His Tyr Pro Val Thr Gly Phe
                325                 330
<210>103
<211>2205
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>103
atgagcgaga agaaggagat tcgcgttgcg ttgatcatgg ggggtggcgt cagcctcggc      60
agtttttcgg gtggtgcgct tctcaagacc atcgagctgc tgcagcacac tgcccgcggt     120
ccggcgaaga tcgatgtcgt gaccggtgcc tcggcgggaa gcatgacgct gggcgtagtc     180
atctaccacc tcatgcgggg atcgtcgacc gatgagattc tccgcgatct gaggcggtcg     240
tgggtggaaa tgatctcgtt cgacggcctc tgtccgccga acctgtcccg tcacgacaag     300
ccgagcctgt tttccgatga gatcgtccgg aagatcgcgg ccaccgtcat cgatatgggg     360
cgcaagctcg aggcggctcc tcatccgctt ttcgccgacg aactcgtagc ctcgttcgca     420
ctgacgaacc tgaacggcat ccccgcccgt acggagggcc agctcatccg gcaggcaaag     480
ggaggcggag ggtccgagaa gggctcgaaa tccgttttcg ccgacgccgt gcagactacc     540
tttcaccacg acgtgatgcg attcgtggtg cggcgcgatc acaacgggca aggcagcctg     600
ttcgacagcc gttaccgggc acgcatactc cctccatgga atgttgggaa gggcggcgat     660
gcatgggaag cctttcgcac ggcggctgtt gcctcggggg cgtttccggc cgcatttcct     720
cccgtcgaga tcagccgcaa ccgcgacgaa ttcaacatct ggcccgatcg catcgaggac     780
cagaaggcat ttacgttcga ttacgtggac ggcggggtac ttcgcaacga acccctccgg     840
gaggcgattc acctggccgc gctgcgcgat gagggagcga cggacatcga gcgtgtgttc     900
atcctcatcg acccgaacat cagcggcacc ggcgaggtct tcccgctctc ctataaccag     960
cagatgcgga tcaagccgaa ctacgattcc aacggcgacg tccgacagta cgatctcgat    1020
gtgccggact acaccggcaa tctgatcggg gcgatcggtc ggctgggttc ggtgatcgtc    1080
gggcaggcga cgttccgcga ctggctcaag gctgccaaag tgaacagcca gatcgagtgg    1140
cgacgggaat tgctgcccat tctccgcgac ctgaacccga accccgggga ggaggcgcgc    1200
aggggcgtga acgggatgat cgacaagatc taccggcaaa agtatcagcg cgccctcgag    1260
tcaaagagcg ttccggtcga ggaggtggaa cggcgcgttg ccgaagacat cgaacgggac    1320
ctggcgcggc gccgttcgga ggccggcgac aacgacttca ttgcccggct cctcctgctc    1380
gtcgacctga tcggcaacct gcgtgagaag cagaagctga acatggtggc gatcaccccc    1440
gcttccgcgc cgcacaacga cgggcgcccc ttgccgctgg ccggcaattt tatgttcagc    1500
ttcggggggt tcttcaggga ggagtacagg caatacgact tctcggtcgg cgaattcgca    1560
gcatggaacg tcctgagcac gccggcctcc gagacgccct ttcttgccga gaccgccccg    1620
aaaccgcccg cccgacctcc ccagccgccg gcaatcaatc ctacctaccg ctcactcggc    1680
ccgcccatcc agcagcggtt cgaggagttc gttcgtgggc acgttcgcgc ctttatcgct    1740
tcggtcgctc cgctgggaac gagagggatc gtcacgggca agattggcgg aaagcttcga    1800
acgatgctga tggcctcgcg caacgggaaa tcagagtact tccggcttcg cctctccggc    1860
gttgacgggc tctacctccg aggctccaag ggccgcaacc tgagggcggt taacggatcg    1920
atcgacacgg tcgtcggcgt ctatatcgac gaggaagatc agcaccgcga tgagtttttc    1980
ggtccccatg tcttcggcgc gaacggctca ggctttacga tggaactatg ggagtcccgc    2040
ggttttttcg ggcgtgatcg tcgcgtcgct gtgatcgagt tggagaacaa ccccggcggg    2100
ttcgcaatcg ccgccggatg caggcggcgg cccggcgtgg tgctggatat ggccaggcgt    2160
aacgggcagc cactgcggac ggtggatgtg atggaatttg cgtga                    2205
<210>104
<211>734
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<400>104
Met Ser Glu Lys Lys Glu Ile Arg Val Ala Leu Ile Met Gly Gly Gly
 1               5                  10                  15
Val Ser Leu Gly Ser Phe Ser Gly Gly Ala Leu Leu Lys Thr Ile Glu
            20                  25                  30
Leu Leu Gln His Thr Ala Arg Gly Pro Ala Lys Ile Asp Val Val Thr
        35                  40                  45
Gly Ala Ser Ala Gly Ser Met Thr Leu Gly Val Val Ile Tyr His Leu
    50                  55                  60
Met Arg Gly Ser Ser Thr Asp Glu Ile Leu Arg Asp Leu Arg Arg Ser
65                  70                  75                  80
Trp Val Glu Met Ile Ser Phe Asp Gly Leu Cys Pro Pro Asn Leu Ser
                85                  90                  95
Arg His Asp Lys Pro Ser Leu Phe Ser Asp Glu Ile Val Arg Lys Ile
            100                 105                 110
Ala Ala Thr Val Ile Asp Met Gly Arg Lys Leu Glu Ala Ala Pro His
        115                 120                 125
Pro Leu Phe Ala Asp Glu Leu Val Ala Ser Phe Ala Leu Thr Asn Leu
    130                 135                 140
Asn Gly Ile Pro Ala Arg Thr Glu Gly Gln Leu Ile Arg Gln Ala Lys
145                 150                 155                 160
Gly Gly Gly Gly Ser Glu Lys Gly Ser Lys Ser Val Phe Ala Asp Ala
                165                 170                 175
Val Gln Thr Thr Phe His His Asp Val Met Arg Phe Val Val Arg Arg
            180                 185                 190
Asp His Asn Gly Gln Gly Ser Leu Phe Asp Ser Arg Tyr Arg Ala Arg
        195                 200                 205
Ile Leu Pro Pro Trp Asn Val Gly Lys Gly Gly Asp Ala Trp G1u Ala
    210                 215                 220
Phe Arg Thr Ala Ala Val Ala Ser Gly Ala Phe Pro Ala Ala Phe Pro
225                 230                 235                 240
Pro Val Glu Ile Ser Arg Asn Arg Asp Glu Phe Asn Ile Trp Pro Asp
                245                 250                 255
Arg Ile Glu Asp Gln Lys Ala Phe Thr Phe Asp Tyr Val Asp Gly Gly
            260                 265                 270
Val Leu Arg Asn Glu Pro Leu Arg Glu Ala Ile His Leu Ala Ala Leu
        275                 280                 285
Arg Asp Glu Gly Ala Thr Asp Ile Glu Arg Val Phe Ile Leu Ile Asp
    290                 295                 300
Pro Asn Ile Ser Gly Thr Gly Glu Val Phe Pro Leu Ser Tyr Asn Gln
305                 310                 315                 320
Gln Met Arg Ile Lys Pro Asn Tyr Asp Ser Asn Gly Asp Val Arg Gln
                325                 330                 335
Tyr Asp Leu Asp Val Pro Asp Tyr Thr Gly Asn Leu Ile Gly Ala Ile
            340                 345                 350
Gly Arg Leu Gly Ser Val Ile Val Gly Gln Ala Thr Phe Arg Asp Trp
        355                 360                 365
Leu Lys Ala Ala Lys Val Asn Ser Gln Ile Glu Trp Arg Arg Glu Leu
    370                 375                 380
Leu Pro Ile Leu Arg Asp Leu Asn Pro Asn Pro Gly Glu Glu Ala Arg
385                 390                 395                 400
Arg Gly Val Asn Gly Met Ile Asp Lys Ile Tyr Arg Gln Lys Tyr Gln
                405                 410                 415
Arg Ala Leu Glu Ser Lys Ser Val Pro Val Glu Glu Val Glu Arg Arg
            420                 425                 430
Val Ala Glu Asp Ile Glu Arg Asp Leu Ala Arg Arg Arg Ser Glu Ala
        435                 440                 445
Gly Asp Asn Asp Phe Ile Ala Arg Leu Leu Leu Leu Val Asp Leu Ile
    450                 455                 460
Gly Asn Leu Arg Glu Lys Gln Lys Leu Asn Met Val Ala Ile Thr Pro
465                 470                 475                 480
Ala Ser Ala Pro His Asn Asp Gly Arg Pro Leu Pro Leu Ala Gly Asn
                485                 490                 495
Phe Met Phe Ser Phe Gly Gly Phe Phe Arg Glu Glu Tyr Arg Gln Tyr
            500                 505                 510
Asp Phe Ser Val Gly Glu Phe Ala Ala Trp Asn Val Leu Ser Thr Pro
        515                 520                 525
Ala Ser Glu Thr Pro Phe Leu Ala Glu Thr Ala Pro Lys Pro Pro Ala
    530                 535                 540
Arg Pro Pro Gln Pro Pro Ala Ile Asn Pro Thr Tyr Arg Ser Leu Gly
545                 550                 555                 560
Pro Pro Ile Gln Gln Arg Phe Glu Glu Phe Val Arg Gly His Val Arg
                565                 570                 575
Ala Phe Ile Ala Ser Val Ala Pro Leu Gly Thr Arg Gly Ile Val Thr
            580                 585                 590
Gly Lys Ile Gly Gly Lys Leu Arg Thr Met Leu Met Ala Ser Arg Asn
        595                 600                 605
Gly Lys Ser Glu Tyr Phe Arg Leu Arg Leu Ser Gly Val Asp Gly Leu
    610                 615                 620
Tyr Leu Arg Gly Ser Lys Gly Arg Asn Leu Arg Ala Val Asn G1y Ser
625                 630                 635                 640
Ile Asp Thr Val Val Gly Val Tyr Ile Asp Glu Glu Asp Gln His Arg
                645                 650                 655
Asp Glu Phe Phe Gly Pro His Val Phe Gly Ala Asn Gly Ser Gly Phe
            660                 665                 670
Thr Met Glu Leu Trp Glu Ser Arg Gly Phe Phe Gly Arg Asp Arg Arg
        675                 680                 685
Val Ala Val Ile Glu Leu Glu Asn Asn Pro Gly Gly Phe Ala Ile Ala
    690                 695                 700
Ala Gly Cys Arg Arg Arg Pro Gly Val Val Leu Asp Met Ala Arg Arg
705                 710                 715                 720
Asn Gly Gln Pro Leu Arg Thr Val Asp Val Met Glu Phe Ala
                725                 730
<210>105
<211>756
<212>DNA
<213>未知的
<220>
<223>得自环境样品
<400>105
atgaaccgtt gtcggaactc actcaacctc caacttcgcg cggtgaccgt ggcggcgttg      60
gtagtcgtcg catcctcggc cgcgctggcg tgggacagcg cctcgcgcaa tccgacccat     120
cccacccaca gctacctcac cgaatacgcc atcgatcagc ttggggtggc gcggccggag     180
ctccggcaat accgcaagca gatcatcgag ggcgccaaca ccgagctgca cgaactgcca     240
gtcaagggga cggcctatgg cctcgacctc gacgccaagc ggcgggaaca ccgcggcacc     300
aatgccggga cagacgacat cgccggctgg tgggcggaaa gcctccaagc ctatcgcgcc     360
ggtgccaagg aacgcgccta cttcgtgctg ggggtggtgc tgcacatggt cgaggacatg     420
ggcgtgccgg cgcacgcgaa cggcgtctac caccagggca acctgactga attcgacaat     480
ttcgagttca tgggactgtc gaactggaag ccctctttcg ccgacatcaa ccggaccgat     540
ccgggctacg ccgacccgtc gcgctactac gagttcagcc gagattggac ggcggcagac     600
gcacccggct atcgcgaccg cgacagcttc tcgaagacct gggttctcgc cagcccggcc     660
gaacgtcagc tgcttcagaa ccgccagggc cggaccgcca cggtcgccat gtgggcgtta     720
cggagcgcga cgaaggcgtt cgccgggaaa ccctag                               756
<210>106
<211>251
<212>PRT
<213>未知的
<220>
<223>得自环境样品
<221>SIGNAL
<222>(1)...(30)
<400>106
Met Asn Arg Cys Arg Asn Ser Leu Asn Leu Gln Leu Arg Ala Val Thr
 1               5                  10                  15
Val Ala Ala Leu Val Val Val Ala Ser Ser Ala Ala Leu Ala Trp Asp
            20                  25                  30
Ser Ala Ser Arg Asn Pro Thr His Pro Thr His Ser Tyr Leu Thr Glu
        35                  40                  45
Tyr Ala Ile Asp Gln Leu Gly Val Ala Arg Pro Glu Leu Arg Gln Tyr
    50                  55                  60
Arg Lys Gln Ile Ile Glu Gly Ala Asn Thr Glu Leu His Glu Leu Pro
65                  70                  75                  80
Val Lys Gly Thr Ala Tyr Gly Leu Asp Leu Asp Ala Lys Arg Arg Glu
                85                  90                  95
His Arg Gly Thr Asn Ala Gly Thr Asp Asp Ile Ala Gly Trp Trp Ala
            100                 105                 110
Glu Ser Leu Gln Ala Tyr Arg Ala Gly Ala Lys Glu Arg Ala Tyr Phe
        115                 120                 125
Val Leu Gly Val Val Leu His Met Val Glu Asp Met Gly Val Pro Ala
    130                 135                 140
His Ala Asn Gly Val Tyr His Gln Gly Asn Leu Thr Glu Phe Asp Asn
145                 150                 155                 160
Phe Glu Phe Met Gly Leu Ser Asn Trp Lys Pro Ser Phe Ala Asp Ile
                165                 170                 175
Asn Arg Thr Asp Pro Gly Tyr Ala Asp Pro Ser Arg Tyr Tyr Glu Phe
            180                 185                 190
Ser Arg Asp Trp Thr Ala Ala Asp Ala Pro Gly Tyr Arg Asp Arg Asp
        195                 200                 205
Ser Phe Ser Lys Thr Trp Val Leu Ala Ser Pro Ala Glu Arg Gln Leu
    210                 215                 220
Leu Gln Asn Arg Gln Gly Arg Thr Ala Thr Val Ala Met Trp Ala Leu
225                 230                 235                 240
Arg Ser Ala Thr Lys Ala Phe Ala Gly Lys Pro
                245                 250

Claims (228)

1、分离的或重组的核酸,包括与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105具有至少50%的序列同一性的序列,在至少大约100个残基范围内,其中所述核酸编码具有磷脂酶活性的至少一种多肽,序列同一性通过序列比较算法分析或者通过目测确定。
2.权利要求1所述的分离的或重组的核酸,其中序列同一性是至少大约51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%或64%。
3、权利要求1所述的分离的或重组的核酸,其中序列同一性是与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105具有至少大约65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或更多,或100%的序列同一性。
4、权利要求1所述的分离的或重组的核酸,其中序列同一性在基因或转录本的至少大约50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050,1100,1150个,或者更多个残基,或者全长的区域上。
5、权利要求1所述的分离的或重组的核酸,其中核酸序列包括如在SEQ IDNO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105中所阐明的序列。
6、权利要求1所述的分离的或重组的核酸,其中核酸序列编码具有如在SEQID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ IDNO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ IDNO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ IDNO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ IDNO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ IDNO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ IDNO:62,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ IDNO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ IDNO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ IDNO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ IDNO:102,SEQ ID NO:104,SEQ ID NO:106中所阐明的序列的多肽。
7、权利要求1所述的分离的或重组的核酸,其中序列比较算法是BLAST 2.2.2版算法,其中过滤设置被设置为blastall p blastp-d“nr pataa”-F F,且所有其它选项被设置为默认值。
8、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括催化甘油磷酸酯键的水解。
9、权利要求8所述的分离的或重组的核酸,其中磷脂酶活性包括催化植物油中磷脂的酯键水解。
10、权利要求8所述的分离的或重组的核酸,其中植物油磷脂包括油籽磷脂。
11、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括磷脂酶C(PLC)活性。
12、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括磷脂酶A(PLA)活性。
13.权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括磷脂酶B(PLB)活性。
14、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括磷脂酶D(PLD)活性。
15、权利要求1所述的分离的或重组的核酸,其中磷脂酶D活性包括磷脂酶D1或者磷脂酶D2活性。
16、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括水解糖蛋白。
17、权利要求16所述的分离的或重组的核酸,其中糖蛋白包括马铃薯块茎。
18、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性包括马铃薯块茎蛋白酶活性。
19、权利要求18所述的分离的或重组的核酸,其中磷脂酶活性包括脂酰水解酶(LAH)活性。
20、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性是热稳定的。
21、权利要求20所述的分离的或重组的核酸,其中多肽保持磷脂酶活性,在包括温度范围在大约37℃到大约95℃之间,或者在大约55℃到大约85℃之间,或者在大约70℃到大约75℃之间,或者在大约70℃到大约95℃之间,或者在大约90℃到大约95℃之间的条件下。
22、权利要求1所述的分离的或重组的核酸,其中磷脂酶活性是耐热的。
23、权利要求22所述的分离的或重组的核酸,其中多肽保持磷脂酶活性,在暴露于一个温度之后,温度范围从大于37℃到大约95℃,从大于55℃到大约85℃,或者在大约70℃到大约75℃之间,或者从大于90℃到大约95℃。
24、分离的或重组的核酸,其中核酸包括一个序列,该序列在严谨条件下一个核酸杂交,该核酸包括SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105,其中该核酸编码具有磷脂酶活性的多肽。
25、权利要求24所述的分离的或重组的核酸,其中核酸在长度上是基因或转录本的至少大约50,75,100,150,200,300,400,500,600,700,800,900,1000个或者更多残基,或者全长。
26、权利要求24所述的分离的或重组的核酸,其中严谨条件包含漂洗步骤,漂洗步骤包括一个在大约65℃的温度下、在0.2×SSC中、大约15分钟的漂洗。
27、核酸探针,用于确定编码具有磷脂酶活性的多肽的核酸,其中所述探针包括序列的至少10个连续碱基,所述序列包括SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ IDNO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ IDNO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ IDNO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ IDNO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ IDNO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ IDNO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ IDNO:105,其中所述探针通过结合或杂交确定核酸。
28、权利要求27所述的核酸探针,其中探针包括寡核苷酸,该寡核苷酸包括至少大约10到50,大约20到60,大约30到70,大约40到80,大约60到100,或者大约50到150个连续碱基。
29、核酸探针,用于确定编码具有磷脂酶活性的多肽的核酸,其中探针包括含有SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105中的至少大约10个连续碱基的核酸,其中序列同一性是通过序列比较算法分析或者通过目测确定。
30、权利要求29所述的核酸探针,其中探针包括寡核苷酸,该寡核苷酸包括至少大约10到50,大约20到60,大约30到70,大约40到80,大约60到100,或者大约50到150个连续碱基。
31、扩增引物序列对,用于扩增编码具有磷脂酶活性的多肽的核酸,其中引物对能够扩增包括权利要求1或权利要求24所阐明的序列,或者它的亚序列的核酸。
32、权利要求31所述的扩增引物对,其中扩增引物序列对的一个成员包括寡核苷酸,该寡核苷酸包括所述序列的至少大约10到50个连接碱基,或者大约12,13,14,15,16,17,18,19,20,21,22,23,24,或25个连接碱基。
33、扩增引物对,其中引物对包括第一成员,该第一成员具有由SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105的大约最初(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30个或者更多个残基所阐明的序列,和第二成员,该第二成员具有由第一成员的互补链的大约最初(5′)12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29或者30个或者更多个残基所阐明的序列。
34、编码磷脂酶的核酸,是通过使用在权利要求33中所阐明的扩增引物对扩增多核苷酸而产生。
35、权利要求34所述的编码磷脂酶的核酸,其中扩增通过聚合酶链反应(PCR)进行。
36、权利要求34所述的编码磷脂酶的核酸,其中核酸通过扩增基因文库产生。
37、权利要求34所述的编码磷脂酶的核酸,其中基因文库是环境文库。
38、分离的或重组的磷脂酶,由如权利要求34中所阐明的编码磷脂酶的核酸所编码。
39、扩增编码具有磷脂酶活性的多肽的核酸的方法,包括用能够扩增在权利要求1或权利要求24中所阐明的核酸序列的扩增引物序列对扩增模板核酸,或它的亚序列。
40、制备磷脂酶的方法,包括用如权利要求33中阐明的扩增引物对扩增核酸,并且表达该扩增的核酸。
41、表达盒,包括含有在权利要求1或权利要求24中所阐明序列的核酸。
42、载体,包括含有在权利要求1和权利要求24中所阐明序列的核酸。
43、克隆载体,包括含有在权利要求1和权利要求24中所阐明序列的核酸,其中克隆载体包括病毒载体,质粒,噬菌体,噬菌质粒,粘粒,fosmid,细菌噬菌体或者人工染色体。
44、权利要求43所述的克隆载体,其中病毒载体包括腺病毒载体,逆转录病毒载体或者腺伴随病毒载体。
45、权利要求43所述的克隆载体,包括细菌人造染色体(BAC),质粒,细菌噬菌体P1衍生载体(PAC),酵母人工染色体(YAC),或者哺乳动物人工染色体(MAC)。
46、转化细胞,包括含有在权利要求1或权利要求24中所阐明序列的核酸。
47、转化细胞,包括在权利要求41中所阐明的表达盒。
48、权利要求47所述的转化细胞,其中细胞是细菌细胞,哺乳动物细胞,真菌细胞,酵母细胞,昆虫细胞或者植物细胞。
49、转基因非人动物,包括在权利要求1或权利要求24中所阐明的序列。
50、权利要求49所述的转基因非人动物,其中动物是鼠。
51、转基因植物,包括在权利要求1或权利要求24中所阐明的序列。
52、权利要求51所述的转基因植物,其中植物是玉米植物,高粱植物,马铃薯植物,番茄植物,小麦植物,油籽植物,油菜籽植物,大豆植物,水稻植物,大麦植物,草,棉籽,棕榈,芝麻植物,花生植物,向日葵植物或烟草植物。
53、转基因种子,包括在权利要求1或权利要求24中所阐明的序列。
54、权利要求53所述的转基因种子,其中种子是玉米种子,小麦粒,油籽,油菜籽,大豆种子,棕榈种子,向日葵种子,芝麻种子,水稻,大麦,花生,棉籽,棕仁,花生,芝麻种子,向日葵种子或烟草植物种子。
55、反义寡聚核苷酸,包括互补于在权利要求1或权利要求24中所阐明的序列或者能够在严谨条件下与在权利要求1或权利要求24中所阐明的序列杂交的核酸序列,或它的亚序列。
56、权利要求55所述的反义寡聚核苷酸,其中反义寡聚核苷酸在长度上是在大约10到50,大约20到60,大约30到70,大约40到80,或者大约60到100碱基之间。
57、抑制磷脂酶信使在细胞中翻译的方法,包括往细胞中施用或者在细胞中表达反义寡核苷酸,该反义寡核苷酸包括互补于或在严谨条件下能够杂交到权利要求1或权利要求24中所阐明的序列上的核酸序列。
58、双链抑制RNA(RNAi)分子,包括在权利要求1或权利要求24中所阐明的序列的亚序列。
59、权利要求58所述的双链抑制RNA(RNAi)分子,其中RNAi在长度上大约为15,16,17,18,19,20,21,22,23,24,25个或更多个的双螺旋核苷酸。
60、抑制磷脂酶在细胞中表达的方法,包括往细胞中施用或者在细胞中表达双链抑制RNA(iRNA),其中RNA包括与权利要求1或权利要求24中所阐明的序列的亚序列。
61、分离的或重组的多肽,(i)与SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106具有至少50%的序列同一性,在至少大约100个残基的区域内,其中序列同一性是由序列比较算法分析或目测法确定,或,(ii)由与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQID NO:105中所阐明的序列在至少100个残基的区域内具有至少50%序列同一性的核酸编码的,该序列同一性用序列比较算法分析或目测法确定,或者由能在严谨条件下与SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ IDNO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ IDNO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ IDNO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ IDNO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ IDNO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ IDNO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ IDNO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ IDNO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ IDNO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105中所阐明的序列杂交的核酸编码的。
62、权利要求61所述的分离的或重组的多肽,其中序列同一性,在一个区域上,是至少大约51%,52%,53%,54%,55%,56%,57%,58%,59%,60%,61%,62%,63%,64%,65%,66%,67%,68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81%,82%,83%,84%,85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%,或更多,或是100%序列同一性。
63、权利要求61所述的分离的或重组的多肽,其中序列同一性在一个区域上,该区域至少大约10,15,20,  25,30,35,40,45,50,75,100,150,200,250,300,350,400,450,500,550,600,650,700,750,800,850,900,950,1000,1050个或者更多个残基,或者酶的全长。
64、权利要求61所述的分离的或重组的多肽,其中多肽具有在SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106中所阐明的序列。
65、权利要求61所述的分离的或重组的多肽,其中多肽具有磷脂酶活性。
66、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括催化甘油磷酸酯键的水解。
67、权利要求66所述的分离的或重组的多肽,其中磷脂酶活性包括催化植物油中的磷脂的酯键水解。
68、权利要求67所述的分离的或重组的多肽,其中植物油磷脂包括油籽磷脂。
69、权利要求67所述的分离的或重组的多肽,其中植物油磷脂来源于植物油,高磷油,大豆油,芸苔油,棕榈油,棉籽油,玉米油,来源于棕仁的磷脂,椰子油,花生油,芝麻油,鱼油,藻磷脂,向日葵油,精油,果籽油,葡萄籽磷脂,杏磷脂或琉璃苣磷脂。
70、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括磷脂酶C(PLC)活性。
71、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括磷脂酶A(PLA)活性。
72、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括磷脂酶A1或磷脂酶A2活性。
73、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括磷脂酶D(PLD)活性。
74、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括磷脂酶D1或磷脂酶D2活性。
75、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括糖蛋白的水解。
76、权利要求68所述的分离的或重组的多肽,其中糖蛋白包括马铃薯块茎。
77、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括马铃薯块茎蛋白酶活性。
78、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括脂酰水解酶(LAH)活性。
79、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性是热稳定的。
80、权利要求79所述的分离的或重组的多肽,其中多肽在包括温度范围在大约37℃到大约95℃之间,在大约55℃到大约85℃之间,在大约70℃到大约95℃之间,在大约70℃到大约75℃之间,或者在大约90℃到大约95℃之间的条件下保持磷脂酶活性。
81、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性是耐热的。
82、权利要求65所述的分离的或重组的多肽,其中多肽,在暴露于范围从大于37℃到大约95℃,从大于55℃到大约85℃,从大于70℃到大约75℃,或者从大于90℃到大约95℃的一个温度之后,仍保持磷脂酶活性。
83、分离的或重组的多肽,包括在权利要求61中所阐明的多肽,且缺少信号序列。
84、分离的或重组的多肽,包括在权利要求61中所阐明的多肽,且具有异源信号序列。
85、权利要求65所述的分离的或重组的多肽,其中磷脂酶活性包括在大约37℃下的特异活性,该特异活性在下述范围中,每毫克蛋白从大约100到大约1000单位,每毫克蛋白从大约500到大约750单位,每毫克蛋白从大约500到大约1200单位,或者每毫克蛋白从大约750到大约1000单位。
86、权利要求81所述的分离的或重组的多肽,其中耐热性包括在加热至高温以后,在37℃下保持该磷脂酶的至少一半的特异活性。
87、权利要求81所述的分离的或重组的多肽,其中耐热性包含在加热至高温以后,在37℃下每毫克蛋白保持特异活性在从大约500到大约1200单位的范围内。
88、权利要求61所述的分离的或重组的多肽,其中多肽包括至少一个糖基化位点。
89、权利要求88所述的分离的或重组的多肽,其中糖基化是N-连接糖基化。
90、权利要求89所述的分离的或重组的多肽,其中多肽是在甲醇型酵母(P.pastoris)或者裂变酵母(Spombe.)中表达之后进行糖基化。
91、权利要求65所述的分离的或重组的多肽,其中多肽在包括大约pH6.5,pH6.0,pH5.5,5.0,pH4.5,或pH4.0的条件下保持磷脂酶活性。
92、权利要求65所述的分离的或重组的多肽,其中多肽在包括pH7.5,pH8.0,pH8.5,pH9.0,和pH9.5,pH10或pH10.5的条件下保持磷脂酶活性。
93、蛋白制剂,包括在权利要求61中所阐明的多肽,其中蛋白制剂包括液体,固体或凝胶。
94、异二聚体,包括在权利要求61中所阐明的多肽,和第二结构域。
95、权利要求94所述的异二聚体,其中第二结构域是多肽,异二聚体是融合蛋白。
96、权利要求94所述的异二聚体,其中第二结构域是表位或标记物。
97、同二聚体,包括在权利要求61中所阐明的多肽。
98、固定化多肽,其中多肽包括权利要求61中所阐明的序列,或它的亚序列。
99、权利要求98所述的固定化多肽,其中多肽固定于细胞,金属,树脂,聚合物,陶瓷,玻璃,微电极,石墨颗粒,珠子,凝胶,板,阵列或者毛细管。
100、阵列,包括固定化的在权利要求61中所阐明的多肽。
101、阵列,包括固定化的在权利要求1或权利要求24中所阐明的核酸。
102、分离的或重组的抗体,其特异地结合权利要求61中所阐明的多肽。
103、权利要求102所述的分离的或重组的抗体,其中抗体是单克隆抗体或多克隆抗体。
104、杂交瘤,包括特异结合权利要求61中所阐明的多肽的抗体。
105、分离和确定具有磷脂酶活性的多肽的方法,包括步骤:
(a)提供权利要求102中所阐明的抗体;
(b)提供包括多肽的样品;和
(c)将步骤(b)的样品与步骤(a)的抗体在抗体可以特异结合多肽的条件下接触,从而分离或确定具有磷脂酶活性的多肽。
106、制备抗-磷脂酶抗体的方法,包括向非人类动物以足够的量施用在权利要求1或权利要求24中所阐明的核酸或它的亚序列,以便产生体液免疫应答,从而制备抗-磷脂酶抗体。
107、制备抗-磷脂酶抗体的方法,包括向非人类动物以足够的量施用在权利要求61中所阐明的多肽或它的亚序列,以便产生体液免疫应答,从而制备抗-磷脂酶抗体。
108、产生重组多肽的方法,包括步骤:(a)提供可操作地连接于启动子的核酸,其中该核酸包括在权利要求1或权利要求24中所阐明的序列;(b)在允许多肽表达的条件下表达步骤(a)的核酸,从而产生重组多肽。
109、权利要求108所述的方法,进一步包括用步骤(a)的核酸转化宿主细胞,随后表达步骤(a)的核酸,从而在转化的细胞中产生重组的多肽。
110、识别具有磷脂酶活性的多肽的方法,包括以下的步骤:
(a)提供在权利要求65中所阐明的多肽;
(b)提供磷脂酶底物;和
(c)将多肽与步骤(b)的底物接触,检测在底物的量上的减少或者在反应产物的量上的增加,其中在底物的量上的减少或者在反应产物的量上的增加检出多肽具有磷脂酶活性。
111、识别磷脂酶底物的方法,包括以下步骤:
(a)提供在权利要求65中所阐明的多肽;
(b)提供试验底物;和
(c)将步骤(a)的多肽与步骤(b)的检测底物接触,检测在底物的量上的减少或者在反应产物的量上的增加,其中在底物的量上的减少或者在反应产物的量上的增加识别作为磷脂酶底物的试验底物。
112、确定试验化合物是否特异结合多肽的方法,包括以下步骤:
(a)在允许核酸翻译成多肽的条件下,表达核酸或者包括该核酸的载体,其中该核酸具有在权利要求1或权利要求24中所阐明的序列;
(b)提供试验化合物;
(d)多肽与试验化合物接触;和
(c)确定步骤(b)的试验化合物是否特异结合于多肽。
113、确定试验化合物是否特异结合多肽的方法,包括以下步骤:
(a)提供在权利要求61中所阐明的多肽;
(b)提供试验化合物;
(d)多肽与试验化合物接触;并且
(c)确定步骤(b)的试验化合物是否特异结合于多肽。
114、识别磷脂酶活性的调节物的方法,包括以下步骤:
(a)提供在权利要求65中所阐明的多肽;
(b)提供试验化合物;
(c)步骤(a)的多肽与步骤(b)的试验化合物接触,测定磷脂酶的活性,其中在试验化合物存在的条件下检测的磷脂酶活性与在无试验化合物存在的条件下检测的活性相比的变化提供判定试验化合物调节磷脂酶活性。
115、权利要求114所述的方法,其中通过提供磷脂酶底物,检测在底物的量上的减少或者在反应产物的量上的增加,或,在底物的量上的增加或者在反应产物的量上的减少,测定磷脂酶活性。
116、权利要求115所述的方法,其中,与不存在试验化合物的条件下的底物或者反应产物的量相比较,在存在试验化合物的条件下,在底物的量上的减少或者在反应产物的量上的增加识别试验化合物是磷脂酶活性的激活剂。
117、权利要求115所述的方法,其中,与不存在试验化合物的条件下的底物或者反应产物的量相比较,在存在试验化合物的条件下,在底物的量上的增加或者在反应产物的量上的减少识别试验化合物是磷脂酶活性的抑制剂。
118、计算机系统,包含处理器和数据存储设备,其中所述的数据存储设备已经在其上存储了多肽序列或者核酸序列,其中多肽序列包括在权利要求61中所阐明的序列,由在权利要求1或者权利要求24中所阐明的核酸编码的多肽。
119、权利要求118所述的计算机系统,进一步包括序列比较算法和已经在其上存储了至少一个参照序列的数据存储设备。
120、权利要求119所述的计算机系统,其中序列比较算法包括指示多态性的计算机程序。
121、权利要求119所述的计算机系统,进一步包括识别所述序列的一个或者多个特征的识别器。
122、已经在其上存储了多肽序列或核酸序列的计算机可读介质,其中多肽序列包括在权利要求61中所阐明的多肽;由在权利要求1或权利要求24中所阐明的核酸编码的多肽。
123、识别序列的特征的方法,包括步骤(a)应用在序列中识别一个或者多个特征的计算机程序读取该序列,其中该序列包括多肽序列或者核酸序列,其中该多肽序列包括在权利要求61中所阐明的多肽;在权利要求1或权利要求24中所阐明的核酸编码的多肽;和(b)借助计算机程序识别序列中的一个或者多个特征。
124、用于比较第一序列和第二序列的方法,包括步骤(a)通过使用比较序列的计算机程序读取第一序列和第二序列,其中第一序列包括多肽序列或者核酸序列,其中多肽序列包括在权利要求61中所阐明的多肽或由在权利要求1或者权利要求24中所阐明的核酸编码的多肽;和(b)借助计算机程序确定第一序列和第二序列之间的差异。
125、权利要求124所述的方法,其中确定第一序列和第二序列之间的差异的步骤进一步包括识别多态性的步骤。
126、权利要求124所述的方法,进一步包括识别器,其识别序列中的一个或者多个特征。
127、权利要求126所述的方法,包括应用计算机程序读取第一序列,和识别该序列中的一个或者多个特征。
128、从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括步骤:
(a)提供在权利要求33中所阐明的扩增引物序列对;
(b)从环境样品中分离核酸或者处理环境样品,以致样品中的核酸是可以接近的,用于杂交到扩增引物对;和
(c)将步骤(b)的核酸与步骤(a)的扩增引物对结合,并且从环境样品中扩增核酸,从而从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。
129、权利要求128所述的方法,其中扩增引物序列对的每个成员包括寡核苷酸,该寡核苷酸含有在SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ ID NO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ ID NO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ ID NO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ ID NO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ ID NO:105中所阐明的序列,或者它的亚序列的至少大约10到50个连续碱基。
130、从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸的方法,包括步骤:
(a)提供多核苷酸探针,该多核苷酸包括在权利要求1或权利要求24中所阐明的序列,或者它的亚序列;
(b)从环境样品中分离核酸或者处理环境样品,以便样品中的核酸是可以用于与步骤(a)的多核苷酸探针进行杂交;
(c)将步骤(b)的分离的核酸或者经处理的环境样品与步骤(a)的多核苷酸探针结合;和
(d)分离与步骤(a)的多核苷酸探针特异杂交的核酸,从而从环境样品中分离或者回收编码具有磷脂酶活性的多肽的核酸。
131、权利要求128或权利要求130所述的方法,其中环境样品包括水样品,液体样品,土壤样品,空气样品或者生物样品。
132、权利要求131所述的方法,其中生物样品来源于细菌细胞,原生动物细胞,昆虫细胞,酵母细胞,植物细胞,真菌细胞或者哺乳动物细胞。
133、产生编码具有磷脂酶活性的多肽的核酸的突变体的方法,包括步骤:
(a)提供模板核酸,该模板核酸包括在权利要求1或权利要求24中所阐明的序列;
(b)在模板序列中修饰、缺失或者添加一个或者多个核苷酸,或者它们的组合,以便产生所述模板核酸的突变体。
134、权利要求133所述的方法,进一步包括表达突变体核酸,产生突变体磷脂酶多肽。
135、权利要求133所述的方法,其中修饰、添加或者缺失是一种方法引入,该方法包括错误倾向PCR,改组,寡聚核苷酸定向诱变,组装PCR,有性PCR诱变,体内诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,基因位点饱和诱变(GSSM),合成的连接重装配(SLR)和其组合。
136、权利要求133所述的方法,其中修饰、添加或者缺失是由一种方法引入,该方法包括重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板诱变,缺口双螺旋诱变,点错配修复诱变,修复-缺陷宿主株诱变,化学诱变,放射诱变,缺失诱变,限制选择诱变,限制纯化诱变,人工基因诱变,整体诱变,嵌合核酸多聚体产生和它们的组合。
137、权利要求133所述的方法,其中所述方法被反复重复,直到产生,与模板核酸编码的磷脂酶相比,具有改变的或者不同的活性或者改变的或者不同的稳定性的磷脂酶。
138、权利要求137所述的方法,其中变异体磷脂酶多肽是耐热的,在暴露于提高的温度之后仍保持一些活性。
139、权利要求137所述的方法,其中变异体磷脂酶多肽与模板核酸编码的磷脂酶相比具有增加的糖基化作用。
140、权利要求137所述的方法,其中变异体磷脂酶多肽在高温下具有磷脂酶活性,其中由模板核酸编码的磷脂酶在高温下没有活性。
141、权利要求133所述的方法,其中所述方法被反复重复,直到产生,与模板核酸的密码子使用相比,具有改变的密码子使用的磷脂酶编码序列。
142、权利要求133所述的方法,其中所述方法被反复重复,直到产生,与模板核酸产生的信使相比,具有更高或更低水平的信使表达或者信使稳定性的磷脂酶基因。
143、通过修改编码具有磷脂酶活性的多肽的核酸中密码子从而增强其在宿主细胞中表达的方法,该方法包括以下步骤:
(a)提供编码具有磷脂酶活性的多肽的核酸,该核酸包括在权利要求1或权利要求24中所阐明的序列;和,
(b)鉴定步骤(a)的核酸中的非偏爱或者较不偏爱密码子,并且用编码相同氨基酸的偏爱或者中性应用的密码子替换它,成为被替换的密码子,其中偏爱密码子是在宿主细胞的基因编码区中超常出现的密码子,非偏爱或者较不偏爱密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,增强其在宿主细胞中的表达。
144、用于在编码磷脂酶多肽的核酸中修饰密码子的方法,该方法包括以下步骤:
(a)提供编码具有磷脂酶活性的多肽的核酸,该核酸包括权利要求1或权利要求24中阐明的序列;和,
(b)识别步骤(a)的核酸中的密码子,作为被取代的密码子,将它用编码同一个氨基酸的不同密码子替换,从而修饰编码磷脂酶的核酸中的密码子。
145、修饰编码磷脂酶多肽的核酸中的密码子以便增强其在宿主细胞中的表达的方法,该方法包括以下步骤:
(a)提供编码磷脂酶多肽的核酸,该核酸包括权利要求1或权利要求24中阐明的序列;
(b)识别步骤(a)的核酸中的非偏爱或者较不偏爱密码子,用编码相同氨基酸的偏爱或者中性使用的密码子替换它,作为经替换的密码子,其中偏爱密码子是在宿主细胞的基因编码区中超常出现的密码子,不偏爱或者较不偏爱密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,增强其在宿主细胞的表达。
146、修饰编码具有磷脂酶活性的多肽的核酸的密码子从而降低其在宿主细胞的表达的方法,该方法包括以下步骤:
(a)提供编码磷脂酶多肽的核酸,该核酸包括权利要求1或权利要求24中阐明的序列;和
(b)识别步骤(a)的核酸中的至少一个偏爱密码子,并且用编码相同氨基酸的不偏爱或者较不偏爱密码子替换它,作为经替换密码子,其中偏爱密码子是在宿主细胞的基因编码区中超常出现的密码子,不偏爱或者较不偏爱密码子是在宿主细胞的基因编码区中不常出现的密码子,从而修饰核酸,降低其在宿主细胞的表达。
147、权利要求146所述的方法,其中宿主细胞是细菌细胞,真菌细胞,昆虫细胞,酵母细胞,植物细胞或者哺乳动物细胞。
148、产生编码多个经修饰的磷脂酶活性位点或底物结合位点的核酸文库的方法,其中经修饰的活性位点或者底物结合位点来源于最初核酸,最初核酸包括编码最初活性位点或者最初底物结合位点的序列,该方法包括以下步骤:
(a)提供编码最初活性位点或者最初底物结合位点的最初核酸,其中最初核酸序列包括一个序列,该序列在严谨条件下与SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ IDNO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ IDNO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ IDNO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ IDNO:45,SEQ ID NO:47,SEQ ID NO:49,SEQ ID NO:51,SEQ ID NO:53,SEQ IDNO:55,SEQ ID NO:57,SEQ ID NO:59,SEQ ID NO:61,SEQ ID NO:63,SEQ IDNO:65,SEQ ID NO:67,SEQ ID NO:69,SEQ ID NO:71,SEQ ID NO:73,SEQ IDNO:75,SEQ ID NO:77,SEQ ID NO:79,SEQ ID NO:81,SEQ ID NO:83,SEQ IDNO:85,SEQ ID NO:87,SEQ ID NO:89,SEQ ID NO:91,SEQ ID NO:93,SEQ IDNO:95,SEQ ID NO:97,SEQ ID NO:99,SEQ ID NO:101,SEQ ID NO:103,SEQ IDNO:105中所阐明的序列或它的亚序列杂交,并且该核酸编码磷脂酶活性位点或磷脂酶底物结合位点;
(b)提供一套诱变寡聚核苷酸,该诱变寡聚核苷酸编码在最初核酸中的多个靶密码子位置上的天然产生氨基酸突变体;和,
(c)应用这套诱变寡聚核苷酸,产生一套编码活性位点或者编码底物结合位点的突变体核酸,在每一个被诱变的氨基酸密码子处,突变体核酸编码氨基酸变异的范围,从而产生编码多个修饰的磷脂酶活性位点或者底物结合位点的核酸文库。
149、权利要求148所述的方法,包括诱变步骤(a)的最初核酸或者突变体,所采用的方法包括优化定向进化系统,基因位点饱和诱变(GSSM),或,合成连接重装配(SLR)。
150、权利要求148所述的方法,诱变步骤(a)的最初核酸或者突变体,所采用的方法包括错误倾向PCR,改组,寡核苷酸定向突变,装配PCR,有性PCR诱变,体内诱变,盒式诱变,回归整体诱变,指数整体诱变,定点诱变,基因重装配,基因位点饱和诱变(GSSM),合成连接重装配(SLR)和它们的组合。
151、权利要求148所述的方法,诱变步骤(a)的最初核酸或者突变体,所采用的方法包括重组,回归序列重组,磷硫修饰的DNA诱变,含有尿嘧啶的模板的诱变,缺口双螺旋诱变,点错配修复诱变,修复-缺陷宿主株诱变,化学诱变,放射诱变,缺失诱变,限制选择诱变,限制纯化诱变,人工基因诱变,整体诱变,嵌合核酸多聚体产生和它们的组合。
152、制备小分子的方法,包括以下步骤:
(a)提供可以合成或者修饰小分子的多个生物合成酶,其中所述酶中之一包括由权利要求1或权利要求24中所阐明的序列编码的磷脂酶;
(b)对步骤(a)的至少一个酶提供底物,
(c)在利于多个生物催化反应进行的条件下,使步骤(b)的底物和所述酶反应,通过一系列生物催化反应产生小分子。
153、修饰小分子的方法,包括以下步骤:
(a)提供磷脂酶,其中酶包括在权利要求65中阐明的多肽,或者包括核酸编码的多肽,该核酸包括权利要求1或权利要求24中所阐明的核酸序列;
(b)提供小分子;和
(c)在利于磷脂酶所催化的酶反应进行的条件下,使步骤(a)的酶与步骤(b)的小分子反应,从而通过磷脂酶反应修饰小分子。
154、权利要求153所述的方法,包括为步骤(a)的酶提供很多的小分子底物,从而产生了经修饰的小分子文库,该小分子文库通过至少一个由磷脂酶所催化的酶促反应产生。
155、权利要求153所述的方法,进一步包括很多的额外酶,在利于所述酶的生物催化反应的条件下,通过很多酶促反应产生经修饰的小分子文库。
156、权利要求155所述的方法,进一步包括检验文库的步骤,以便确定在文库中是否存在表现出所需活性的特定的经修饰的小分子。
157、权利要求156所述的方法,其中检验文库的步骤进一步包括系统性地排除几乎所有所述生物催化反应,而所述生物催化反应之一被用于产生该文库中的多个经修饰小分子的一部分,是通过对该部分的修饰小分子存在或者不存在具有所需活性的特定经修饰小分子进行测验,识别形成具有所需活性的特定经修饰小分子的至少一个特异性生物催化反应。
158、确定磷脂酶的功能性片段的方法,包括步骤:
(a)提供磷脂酶,其中酶包括权利要求65中所阐明的多肽,或者由权利要求1或权利要求24中所阐明的核酸编码的多肽;
(b)从步骤(a)中的序列中删除多个氨基酸残基,并且检验余下的亚序列的磷脂酶活性,从而确定磷脂酶的功能性片段。
159、权利要求158所述的方法,其中磷脂酶活性是通过提供磷脂酶底物并测定在底物的量上的减少或者在反应产物的量上的增加来测定。
160、通过使用实时代谢流式分析进行具有新的或修饰的表型的整体细胞人工改造的方法,该方法包括以下步骤:
(a)通过修饰细胞的遗传组成,制备修饰的细胞,其中遗传组成是通过往细胞中加入包括权利要求1或权利要求24中所阐明的序列的核酸而予以修饰;
(b)培养经修饰的细胞,产生多个被修饰的细胞;
(c)通过实时监测步骤(b)的细胞培养物,测量细胞的至少一个代谢参数;和,
(d)分析步骤(c)的数据,确定是否被测量的参数不同于在相似条件下的未修饰细胞中的可比较测量值,从而使用实时代谢流式分析识别细胞中的人工改造表型。
161、权利要求160所述的方法,其中细胞的遗传组成是通过一个方法修饰的,该方法包括缺失一个序列或修饰细胞中的一个序列,或者,敲除一个基因的表达。
162、权利要求160所述的方法,进一步包括选择细胞,该细胞包括新的人工改造表型。
163、权利要求160所述的方法,进一步包括培养所选择的细胞,从而产生包括新的人工改造表型的新细胞株。
164、分离的或重组的信号序列,由SEQ ID NO:2,SEQ ID NO:4,SEQ IDNO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50,SEQ ID NO:52,SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,SEQ ID NO:62,SEQ ID NO:64,SEQ ID NO:66,SEQ ID NO:68,SEQ ID NO:70,SEQ ID NO:72,SEQ ID NO:74,SEQ ID NO:76,SEQ ID NO:78,SEQ ID NO:80,SEQ ID NO:82,SEQ ID NO:84,SEQ ID NO:86,SEQ ID NO:88,SEQ ID NO:90,SEQ ID NO:92,SEQ ID NO:94,SEQ ID NO:96,SEQ ID NO:98,SEQ ID NO:100,SEQ ID NO:102,SEQ ID NO:104,SEQ ID NO:106的残基1到16,1到17,1到18,1到19,1到20,1到21,1到22,1到23,1到24,1到25,1到26,1到27,1到28,1到28,1到30或1到31,1到32或1到33中所阐明的序列组成。
165、嵌合多肽,包括至少第一结构域和至少第二结构域,第一结构域包括具有权利要求164中所阐明序列的信号肽(SP),第二结构域包括异源多肽或肽,其中异源多肽或者肽是不与信号肽(SP)天然联合的。
166、权利要求165所述的嵌合多肽,其中异源多肽或者肽不是磷脂酶。
167、权利要求165所述的嵌合多肽,其中异源多肽或者肽是到达信号肽(SP)或者催化结构域(CD)的氨基末端,羧基末端或者在两个末端上。
168、编码嵌合多肽的分离的或者重组的核酸,其中嵌合多肽包括至少第一结构域和至少第二结构域,第一结构域包括具有权利要求164中所阐明的序列的信号肽(SP),第二结构域包括异源多肽或者肽,其中异源多肽或者肽与信号肽(SP)不是天然联合的。
169、增加磷脂酶多肽的耐热性或热稳定性的方法,该方法包括糖基化磷脂酶,其中该多肽包括权利要求61中所阐明的多肽的至少30个连续氨基酸,或者由权利要求1或权利要求24中阐明的核酸编码的多肽,从而增加磷脂酶的耐热性或热稳定性。
170、用于在细胞中过表达重组磷脂酶的方法,包括表达包括权利要求1或权利要求24中所阐明的核酸序列的载体,其中过表达受使用高活性的启动子,双顺反子(dicistronic)载体,或者受载体的基因扩增的影响。
171、制备转基因植物的方法,包括以下步骤:
(a)向细胞中导入异种核酸序列,其中异种核酸序列包括权利要求1或权利要求24中阐明的序列,从而产生转化的植物细胞;
(b)从转化的细胞产生转基因的植物。
172、权利要求171所述的方法,其中步骤(a)进一步包括通过植物细胞原生质体的电穿孔或微注射,引入异种核酸序列。
173、权利要求171所述的方法,其中步骤(a)进一步包括通过DNA粒子轰击,或者,通过使用根癌农杆菌(Agrobacterium tumefaciens)宿主,直接向植物组织中引入异种核酸序列。
174、在植物细胞中表达异种核酸序列的方法,包括以下步骤:
(a)用与启动子可操作连接的异种核酸序列转化植物细胞,其中异种核酸序列包括权利要求1或权利要求24中所阐明的序列;
(b)培养植物,在异种核酸序列在植物细胞中表达的条件下。
175、水解、降解或破坏含有磷脂的成分的方法,包括以下步骤:
(a)提供具有权利要求65中所阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中所阐明的核酸编码的多肽;
(b)提供包括磷脂的成分;和
(c)将步骤(a)的多肽与步骤(b)的成分接触,在磷脂酶水解、降解或破坏含有磷脂的成分的条件下。
176、如权利要求175所述的方法,其中所述成分包括含有磷脂的脂双层或膜。
177、如权利要求175所述的方法,其中所述成分包括植物细胞,细菌细胞,酵母细胞,昆虫细胞或动物细胞。
178、液化或除去含有磷脂的成分的方法,包括以下步骤:
(a)提供权利要求65中阐明的具有磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽;
(b)提供包括磷脂的成分;和
(c)将步骤(a)的多肽与步骤(b)的成分接触,在磷脂酶除去或液化含有磷脂的成分的条件下。
179、去污剂组合物,包括权利要求65中阐明的多肽,或者权利要求1或权利要求24中阐明的核酸编码的多肽,其中多肽具有磷脂酶活性。
180、权利要求179所述的去污剂组合物,其中磷脂酶是非表面活性磷脂酶,或者表面活性磷脂酶。
181、权利要求179所述的去污剂组合物,其中磷脂酶配制于非水相液体成分,铸造固体,粒状形式,微粒形式,压缩片剂,凝胶形式和/或糊剂以及浆状形式中。
182、洗涤物体的方法,包括以下步骤:
(a)提供组合物,包括具有权利要求65所阐明的磷脂酶活性的多肽,或者权利要求1或权利要求24中阐明的核酸编码的多肽;
(b)提供物体;和
(c)将步骤(a)的多肽与步骤(b)的物体接触,在该组合物可以洗涤该物体的条件下。
183、油脱胶的方法,包括以下步骤:
(a)提供组合物,包括具有权利要求65所阐明的磷脂酶活性的多肽,或者权利要求1或权利要求24中阐明的核酸编码的多肽;
(b)提供组合物,包括含有磷脂的脂肪或油;和
(c)将步骤(a)的多肽与步骤(b)的组合物接触,在该多肽可以催化该组合物中的磷脂水解的条件下。
184、权利要求183所述的方法,其中含油组合物包括植物油,动物油,藻油或鱼油或者脂肪。
185、权利要求183所述的方法,其中植物油包括大豆油,菜子油,玉米油,来自棕仁的油,芸苔油,葵花子油,芝麻油,或花生油。
186、权利要求183所述的方法,其中多肽水解来自含油组合物中的能水合的和/或不能水合的磷脂(phospholipid)中的磷脂(phosphatide)。
187、权利要求183所述的方法,其中多肽在甘油磷酸酯键处水解磷脂,产生甘油二酯和水溶性磷酸化合物。
188、权利要求183所述的方法,其中多肽具有磷脂酶C活性。
189、权利要求183所述的方法,其中多肽具有磷脂酶D活性,并且也加入了磷酸酶。
190、权利要求183所述的方法,其中接触包括油中水合磷脂的水解。
191、权利要求183所述的方法,其中步骤(c)的水解条件包括在碱性pH下,在一个大约20℃到40℃的温度下。
192、权利要求190所述的方法,其中碱性条件包括pH大约为pH8到pH10。
193、权利要求183所述的方法,其中步骤(c)的水解条件包括反应时间大约3到10分钟。
194、权利要求183所述的方法,其中步骤(c)的水解条件包括水解油中能水合的或不能水合的磷脂,在大约50-60℃的温度下,pH为pH5-pH6.5,使用反应时间大约30到60分钟。
195、权利要求183所述的方法,其中多肽结合到过滤器上,含有磷脂的脂肪或油通过过滤器。
196、权利要求183所述的方法,其中多肽加入到包括含有磷脂的脂肪或油的溶液中,然后溶液通过过滤器。
197、转化非水合磷脂为水合形式的方法,包括以下步骤:
(a)提供组合物,包括具有如权利要求65中阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽;
(c)提供组合物,包括非水合磷脂;和
(d)将步骤(a)的多肽和步骤(b)的组合物接触,在多肽把非水合磷脂转化为水合磷脂形式的条件下。
198、权利要求197所述的方法,其中多肽具有磷脂酶C活性。
199、权利要求197所述的方法,其中多肽具有磷脂酶D活性,并且加入了磷酸酶。
200、含有磷脂的成分的苛性碱精炼的方法,包括以下步骤:
(a)提供成分,包括具有如权利要求65中阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽;
(b)提供包括磷脂的成分;和
(c)将步骤(a)的多肽和步骤(b)的成分接触,在苛性碱精炼之前,之中,或之后。
201、权利要求200所述的方法,其中多肽具有磷脂酶C活性。
202、权利要求200所述的方法,其中具有磷脂酶活性的多肽在苛性碱精炼之前被加入,包括磷脂的成分包括植物,多肽在植物中转基因表达,在压碎种子或别的植物部分的过程中加入具有磷脂酶活性的多肽,或者在压碎后或精炼前加入具有磷脂酶活性的多肽。
203、权利要求200所述的方法,其中具有磷脂酶活性的多肽是在苛性碱精炼过程中被加入的,依据磷的水平和游离脂肪酸的水平改变加入的酸和碱的水平。
204、权利要求200所述的方法,其中具有磷脂酶活性的多肽是在苛性碱精炼后被加入的:在分离前,往剧烈混合器或保持混合器中;加热步骤后;在离心中;在皂脚中;在洗涤用水中,或者在脱色或除臭步骤中。
205、纯化植物甾醇或三萜的方法,包括以下步骤:
(a)提供成分,包括具有如权利要求65中阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽;
(b)提供包括植物甾醇或三萜的成分;和
(c)将步骤(a)的多肽和步骤(b)的成分接触,在所述多肽可以催化所述成分中的磷脂水解的条件下。
206、权利要求205所述的方法,其中多肽具有磷脂酶C活性。
207、权利要求205所述的方法,其中植物甾醇或三萜包括植物甾醇。
208、权利要求207所述的方法,其中植物甾醇衍生于植物油。
209、权利要求208所述的方法,其中植物油包括椰子油,芸苔油,可可豆脂油,玉米油,棉子油,亚麻子油,橄榄油,棕榈油,花生油,来源于米糠的油,红花油,芝麻油,大豆油或向日葵油。
210、权利要求205所述的方法,进一步包括使用非极性溶剂定量提取游离的植物甾醇和植物甾醇脂肪酸酯。
211、权利要求205所述的方法,其中植物甾醇或三萜包括β-谷甾醇,菜子甾醇,豆甾醇,豆甾烷醇,β-谷甾烷醇,谷甾烷醇,链甾醇,海绵甾醇,多孔甾醇,γ-谷甾醇或芜青甾醇。
212、精炼粗制油的方法,包括以下步骤:
(a)提供成分,包括具有如权利要求65中阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽;
(b)提供含有油的成分,该油包括磷脂;和
(c)将步骤(a)的多肽和步骤(b)的成分接触,在所述多肽可以催化所述成分中的磷脂水解的条件下。
213、权利要求212所述的方法,其中多肽具有磷脂酶C活性。
214、权利要求212所述的方法,其中具有磷脂酶活性的多肽是在水溶液中,该水溶液被添加到所述成分中。
215、权利要求214所述的方法,其中水的水平是在大约0.5到5%之间。
216、权利要求214所述的方法,其中处理时间小于大约2小时。
217、权利要求216所述的方法,其中处理时间小于大约60分钟。
218、权利要求217所述的方法,其中处理时间小于大约30分钟,小于大约15分钟,或小于大约5分钟。
219、权利要求212所述的方法,其中水解条件包括温度在大约25℃-70℃之间。
220、权利要求212所述的方法,其中水解条件包括苛性碱的使用。
221.权利要求212所述的方法,其中水解条件包括pH在大约pH3到PH10之间。
222、权利要求212所述的方法,其中水解条件包括添加乳化剂和/或在步骤(c)的接触之后混合。
223、权利要求212所述的方法,包括添加破乳剂和/或加热,以便促进水相的分离。
224、权利要求212所述的方法,包括在接触步骤前进行脱胶,通过离心收集卵磷脂,然后加入PLC,PLC和/或PLA,以便除去非水合的磷脂。
225、权利要求212所述的方法,包括粗制油的水脱胶,至食用油小于10ppm,随后物理精炼至生物柴油小于50ppm。
226、权利要求212所述方法,包括添加酸促进非水合磷脂的水合。
227、油或脂肪脱胶的方法,包括以下步骤:
(a)提供成分,包括具有如权利要求65中阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽;其中磷脂酶活性包括磷脂酶D活性和磷酸酶活性;
(b)提供成分,包括含有磷脂的脂肪或油;
(c)步骤(a)的多肽和步骤(b)的成分接触,在所述多肽可以催化所述成分中磷脂水解的条件下。
228.具有磷脂酶C活性的等效性的组合物,包括提供组合物,该组合物包括具有如权利要求65中所阐明的磷脂酶活性的多肽,或者由权利要求1或权利要求24中阐明的核酸编码的多肽,其中磷脂酶活性包括磷脂酶D活性和磷酸酶活性。
CN038135949A 2002-04-19 2003-04-21 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法 Pending CN1659276A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US37431302P 2002-04-19 2002-04-19
US60/374,313 2002-04-19

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN2011100549725A Division CN102174546A (zh) 2002-04-19 2003-04-21 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法

Publications (1)

Publication Number Publication Date
CN1659276A true CN1659276A (zh) 2005-08-24

Family

ID=29251173

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2011100549725A Pending CN102174546A (zh) 2002-04-19 2003-04-21 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
CN038135949A Pending CN1659276A (zh) 2002-04-19 2003-04-21 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2011100549725A Pending CN102174546A (zh) 2002-04-19 2003-04-21 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法

Country Status (11)

Country Link
US (1) US20040005604A1 (zh)
EP (2) EP2298871A1 (zh)
JP (1) JP2005523019A (zh)
CN (2) CN102174546A (zh)
AU (1) AU2003243157C1 (zh)
BR (2) BR0309391A (zh)
CA (1) CA2481411C (zh)
EA (1) EA010903B1 (zh)
ES (1) ES2395898T3 (zh)
PT (1) PT1497418E (zh)
WO (1) WO2003089620A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101558154A (zh) * 2006-09-21 2009-10-14 维莱尼姆公司 磷脂酶、编码它们的核酸及其制备和应用方法
CN103540576A (zh) * 2013-09-30 2014-01-29 上海交通大学 patatin-like磷脂酶及其编码基因与用途
CN104630176A (zh) * 2013-11-13 2015-05-20 丰益(上海)生物技术研发中心有限公司 一种提高发酵法生产磷脂酶c产量的方法
CN108220267A (zh) * 2016-12-22 2018-06-29 丰益(上海)生物技术研发中心有限公司 磷脂酶及其应用
CN108369164A (zh) * 2016-02-29 2018-08-03 惠普发展公司,有限责任合伙企业 酶促样品纯化
CN110129299A (zh) * 2016-06-02 2019-08-16 天津科技大学 磷脂酶d及其应用
CN111051505A (zh) * 2018-12-29 2020-04-21 邦泰生物工程(深圳)有限公司 一种磷脂酶d突变体、其应用及其制备磷酯酰丝氨酸的方法
CN114835780A (zh) * 2022-06-29 2022-08-02 中国农业大学 辣椒籽分离的寡肽medei及其在预防或治疗癌症中的应用

Families Citing this family (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6936289B2 (en) 1995-06-07 2005-08-30 Danisco A/S Method of improving the properties of a flour dough, a flour dough improving composition and improved food products
NZ528260A (en) 2001-05-18 2005-09-30 Danisco Method of improving dough and bread quality with the addition of an enzyme that hydrolyses a glycolipid and a phospholipid and incapable of hydrolysing a triglyceride or monoglyceride
US7226771B2 (en) * 2002-04-19 2007-06-05 Diversa Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
US7943360B2 (en) 2002-04-19 2011-05-17 Verenium Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
EP1601332A4 (en) 2003-03-07 2012-05-02 Verenium Corp HYDROLASES, NUCLEIC ACIDS ENCODING THEM, AND METHODS OF MAKING AND USING SAME
DE10355838A1 (de) * 2003-11-26 2005-07-07 Martin-Luther-Universität Halle-Wittenberg Verfahren zur Herstellung von Phospholipase A2
AU2011218662B2 (en) * 2004-03-08 2013-01-17 Verenium Corporation Phospholipases, nucleic acids encoding them and methods for making and using them
GB0405637D0 (en) 2004-03-12 2004-04-21 Danisco Protein
PL2468853T3 (pl) * 2004-06-16 2015-08-31 Dsm Ip Assets Bv Sposób enzymatycznego odbarwiania feofityny
US20080070291A1 (en) 2004-06-16 2008-03-20 David Lam Compositions and Methods for Enzymatic Decolorization of Chlorophyll
EP2267108A1 (en) 2004-07-16 2010-12-29 Danisco A/S Enzymatic oil-degumming method
US8557551B2 (en) 2004-09-10 2013-10-15 Dsm Ip Assets B.V. Compositions and methods for making and modifying oils
EP1910530A2 (en) * 2005-05-31 2008-04-16 Diversa Corporation Hydrolases, nucleic acids encoding them and methods for making and using them
US20070148311A1 (en) * 2005-12-22 2007-06-28 Bunge Oils, Inc. Phytosterol esterification product and method of make same
EP2216403A3 (en) * 2006-02-02 2010-11-24 Verenium Corporation Esterases and related nucleic acids and methods
WO2008076966A1 (en) * 2006-12-17 2008-06-26 Integrated Plant Genetcs, Inc. Use of esterase genes as selectable markers for transforming plant cells
WO2008088489A2 (en) * 2006-12-22 2008-07-24 Danisco Us, Inc., Genencor Division Enzyme-assisted de-emulsification of aqueous lipid extracts
US8956853B2 (en) * 2007-01-30 2015-02-17 Bunge Oils, Inc. Enzymatic degumming utilizing a mixture of PLA and PLC phospholipases
US8460905B2 (en) * 2007-09-11 2013-06-11 Bunge Oils, Inc. Enzymatic degumming utilizing a mixture of PLA and PLC phospholipases with reduced reaction time
ITRM20070129A1 (it) * 2007-03-14 2008-09-15 Plantechno S R L Piante di tabacco mutagenizzate come coltura da seme per la produzioe di olio da usare ai fini energetici industriali e alimentari
JP5302189B2 (ja) * 2007-04-27 2013-10-02 長瀬産業株式会社 スフィンゴミエリナーゼ
JP2010538642A (ja) 2007-09-12 2010-12-16 マーテック バイオサイエンシーズ コーポレーション 生物油ならびにその生産および使用
US8076123B2 (en) * 2007-10-26 2011-12-13 Oilseeds Biorefinery Corporation Emulsification-free degumming of oil
NZ585870A (en) 2007-12-21 2012-04-27 Danisco Process for edible oil refining using a lipid acyltransferase
US8241876B2 (en) 2008-01-07 2012-08-14 Bunge Oils, Inc. Generation of triacylglycerols from gums
UA111708C2 (uk) * 2009-10-16 2016-06-10 Бандж Ойлз, Інк. Спосіб рафінування олії
CN107858297A (zh) 2009-12-28 2018-03-30 Dsm Ip资产公司 在蔗糖上生长的重组破囊壶菌和其组合物、制备方法及用途
WO2011090730A1 (en) * 2009-12-28 2011-07-28 Martek Biosciences Corporation Recombinant thraustochytrids that grow on xylose, and compositions, methods of making, and uses thereof
PL2545150T3 (pl) 2010-03-12 2019-01-31 Dupont Nutrition Biosciences Aps Sposób
MX2012014685A (es) 2010-06-17 2013-02-11 Dupont Nutrition Biosci Aps Proceso.
KR101202135B1 (ko) 2010-06-22 2012-11-15 고려대학교 산학협력단 병저항성 관련 고추 파타틴 유사 포스포라이페이즈 유전자 CaPLP1 및 이를 이용한 식물병 저항성 탐색 및 형질전환 식물체
DE102010025764A1 (de) * 2010-07-01 2012-01-05 Süd-Chemie AG Phospholipase-Träger-Komplex
AR085251A1 (es) 2011-02-23 2013-09-18 Danisco Proceso para tratar aceite vegetal
WO2012114234A1 (en) 2011-02-23 2012-08-30 Dupont Nutrition Biosciences Aps Process
CN102504946B (zh) * 2011-11-04 2013-09-04 福建春辉生物工程有限公司 一种对三高人群有益的油茶籽毛油精炼方法
WO2013104660A1 (en) 2012-01-13 2013-07-18 Dupont Nutrition Biosciences Aps Process for treating a plant oil comprising hydrolysing chlorophyll or a chlorophyll derivative and involving partial caustic neutralisation
WO2013160372A1 (en) 2012-04-27 2013-10-31 Dupont Nutrition Biosciences Aps Process for treating plant oil involving addition of serial doses of chlorophyll or chlorophyll derivative degrading enzyme
RU2500811C1 (ru) * 2012-10-10 2013-12-10 Федеральное государственное унитарное предприятие "Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов" (ФГУП "ГосНИИгенетика") Рекомбинантный штамм бактерий bacillus subtilis - продуцент фосфолипазы с
WO2014160862A1 (en) 2013-03-27 2014-10-02 The Curators Of The University Of Missouri Increasing the content of long chain fatty acids in seed oil
CN104726357B (zh) * 2013-12-20 2019-07-09 丰益(上海)生物技术研发中心有限公司 一株产生磷脂酶的解淀粉芽孢杆菌诱变菌株及磷脂酶c
EP3119862B1 (en) 2014-03-19 2022-09-07 Novozymes A/S Polypeptides having phospholipase c activity and polynucleotides encoding same
US20170058235A1 (en) 2014-05-15 2017-03-02 Novozymes A/S Compositions Comprising Polypeptides Having Phospholipase C Activity and Use Thereof
CN104604704A (zh) * 2015-02-16 2015-05-13 安徽科技学院 一种b5(含碳源)固体培养基质的规模化制作方法
WO2016166149A1 (en) 2015-04-14 2016-10-20 Dsm Ip Assets B.V. Use of phospholipase c
AU2017221289A1 (en) 2016-02-19 2018-08-30 Basf Se Baking lipases
CN105567713B (zh) * 2016-03-09 2019-01-08 河北省农林科学院粮油作物研究所 花生AhPLDα3蛋白及其编码基因与应用
EP3621443A4 (en) 2017-05-12 2021-03-17 Basf Se LIPASE ENZYMS
CA3067218A1 (en) 2017-06-16 2018-12-20 Basf Enzymes Llc Method for increasing oil yield during ethanol production
US11542487B2 (en) 2017-10-25 2023-01-03 Basf Se Beta-amylase enzymes
CN108384768A (zh) * 2018-02-28 2018-08-10 江苏中酶生物科技有限公司 一种磷脂酶c的突变体及其应用
BR112020021692A2 (pt) 2018-04-26 2021-01-26 Basf Se polipeptídeo tendo atividade de lipase, polipeptídeo híbrido, composição, polinucleotídeo variante, método para fabricar a variante de polipeptídeo, e, uso do polipeptídeo
WO2019211143A1 (en) 2018-05-03 2019-11-07 Basf Se Amylase enzymes
CN111378634B (zh) * 2018-12-28 2024-04-02 丰益(上海)生物技术研发中心有限公司 具有磷脂酶c活性的多肽及其用途
CN114127256A (zh) 2019-02-20 2022-03-01 巴斯夫欧洲公司 用确定成分培养基和微量元素补料的芽孢杆菌工业发酵工艺
US20220186177A1 (en) 2019-02-20 2022-06-16 Basf Se Industrial fermentation process for bacillus using defined medium and magnesium feed
WO2020185737A1 (en) 2019-03-11 2020-09-17 Basf Se Amylases and methods for making and using them
US20220170001A1 (en) 2019-03-25 2022-06-02 Basf Se Amylase Enzymes
WO2020193535A2 (en) 2019-03-25 2020-10-01 Basf Se Amylase enzymes
WO2020193532A1 (en) 2019-03-25 2020-10-01 Basf Se Cleaning composition having amylase enzymes
WO2020249546A1 (en) 2019-06-13 2020-12-17 Basf Se Method of recovering a protein from fermentation broth using a divalent cation
ES2955800T3 (es) 2019-07-05 2023-12-07 Basf Se Procedimiento de fermentación industrial de células microbianas mediante precultivo alimentado por lotes
MX2022002182A (es) 2019-08-22 2022-03-11 Basf Se Variantes de amilasa.
EP4525615A2 (en) 2022-05-14 2025-03-26 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections
CN116790552B (zh) * 2022-11-28 2024-11-01 柏定生物工程(北京)有限公司 鞘磷脂酶突变体及其在sdLDL胆固醇检测中的应用
CN120640986A (zh) 2023-02-24 2025-09-12 卡拉万成分股份有限公司 蛋类替代物组合物及其制备和使用方法
WO2024243330A1 (en) 2023-05-22 2024-11-28 Caravan Ingredients Inc. Baked goods enhancer and methods of making and using the same

Family Cites Families (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US87571A (en) 1869-03-09 Improved axle-set
SE318048B (zh) 1959-09-21 1969-12-01 Pellerin Ab Zenith
SE417441B (sv) 1977-08-19 1981-03-16 Kare Larsson Forfarande for att isolera polera lipider ur en blandning av polera och opolera cerealiclipider genom blandning med vatten och derpa foljande tyngdkraftsseparation
US4458066A (en) 1980-02-29 1984-07-03 University Patents, Inc. Process for preparing polynucleotides
US4707364A (en) * 1984-01-27 1987-11-17 Miles Laboratories, Inc. Composition for accelerating cheese aging
US5087571A (en) 1984-06-22 1992-02-11 President And Fellows Of Harvard College Method for providing a cell culture from a transgenic non-human mammal
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
WO1986005803A1 (fr) 1985-03-30 1986-10-09 Marc Ballivet Procede d'obtention d'adn, arn, peptides, polypeptides ou proteines, par une technique de recombinaison d'adn
US4752483A (en) * 1986-05-30 1988-06-21 Campbell Soup Company Method for producing a highly flavored cheese ingredient
US4946778A (en) 1987-09-21 1990-08-07 Genex Corporation Single polypeptide chain binding molecules
US4987071A (en) 1986-12-03 1991-01-22 University Patents, Inc. RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods
US5015580A (en) 1987-07-29 1991-05-14 Agracetus Particle-mediated transformation of soybean plants and lines
US5573933A (en) 1987-04-14 1996-11-12 Luminis Pty, Ltd. Transgenic pigs
US5700637A (en) 1988-05-03 1997-12-23 Isis Innovation Limited Apparatus and method for analyzing polynucleotide sequences and method of generating oligonucleotide arrays
US6054270A (en) 1988-05-03 2000-04-25 Oxford Gene Technology Limited Analying polynucleotide sequences
US5217879A (en) 1989-01-12 1993-06-08 Washington University Infectious Sindbis virus vectors
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
US5527681A (en) 1989-06-07 1996-06-18 Affymax Technologies N.V. Immobilized molecular synthesis of systematically substituted compounds
US5143854A (en) 1989-06-07 1992-09-01 Affymax Technologies N.V. Large scale photolithographic solid phase synthesis of polypeptides and receptor binding screening thereof
US5744101A (en) 1989-06-07 1998-04-28 Affymax Technologies N.V. Photolabile nucleoside protecting groups
US5288619A (en) 1989-12-18 1994-02-22 Kraft General Foods, Inc. Enzymatic method for preparing transesterified oils
AU7791991A (en) 1990-04-24 1991-11-11 Stratagene Methods for phenotype creation from multiple gene populations
US5326477A (en) 1990-05-07 1994-07-05 Bio-Sep, Inc. Process for digesting solid waste
ATE260974T1 (de) 1990-06-15 2004-03-15 Scios Inc Transgenes, nicht-menschliches säugetier das die amyloidbildende pathologie der alzheimerschen krankheit zeigt
DE69133512T2 (de) 1990-11-23 2006-09-28 Bayer Bioscience N.V. Verfahren zur Transformation monokotyler Pflanzen
AU9166691A (en) 1990-12-20 1992-07-22 Ixsys, Inc. Optimization of binding proteins
US6110700A (en) 1991-03-11 2000-08-29 The General Hospital Corporation PRAD1 cyclin and its cDNA
DE4115938A1 (de) 1991-05-16 1992-11-19 Metallgesellschaft Ag Enzymatisches verfahren zur verminderung des gehaltes an phosphorhaltigen bestandteilen in pflanzlichen und tierischen oelen
US5922854A (en) 1991-06-14 1999-07-13 Kumar; Ramesh Purifying Human Hemogloblin from transgenic pig red cells and plasmids containing pig globin nucleic acids
CA2075135A1 (en) 1991-08-02 1993-02-03 David E. Ellis Particle-mediated transformation of gymnosperms
US5632957A (en) 1993-11-01 1997-05-27 Nanogen Molecular biological diagnostic systems including electrodes
JP2626380B2 (ja) 1991-11-12 1997-07-02 株式会社大林組 クレーン用吊治具の旋回防止装置
JPH05236997A (ja) 1992-02-28 1993-09-17 Hitachi Ltd ポリヌクレオチド捕捉用チップ
JPH06306386A (ja) 1993-04-25 1994-11-01 Showa Sangyo Co Ltd 油脂の精製方法
JP2937746B2 (ja) 1993-04-25 1999-08-23 昭和産業株式会社 油脂の精製方法
EP0670670A4 (en) 1993-09-30 1996-04-24 Agracetus HETEROLOGICAL PEROXIDASE PROCESSING TRANSGENIC COTTON PLANTS.
US6045996A (en) 1993-10-26 2000-04-04 Affymetrix, Inc. Hybridization assays on oligonucleotide arrays
US5965452A (en) 1996-07-09 1999-10-12 Nanogen, Inc. Multiplexed active biologic array
US6468742B2 (en) 1993-11-01 2002-10-22 Nanogen, Inc. Methods for determination of single nucleic acid polymorphisms using bioelectronic microchip
DE4339556C1 (de) 1993-11-19 1995-02-02 Metallgesellschaft Ag Verfahren zum Entschleimen von Pflanzenöl mittels Enzymen
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5639940A (en) 1994-03-03 1997-06-17 Pharmaceutical Proteins Ltd. Production of fibrinogen in transgenic animals
EP0750671A1 (en) 1994-03-09 1997-01-02 Abbott Laboratories Transgenic animals producing oligosaccharides and glycoconjugates
WO1995024494A1 (en) 1994-03-09 1995-09-14 Abbott Laboratories Humanized milk
DE69534464T2 (de) 1994-03-29 2006-09-28 Novozymes A/S Alkalische amylase aus bacellus
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5959171A (en) 1994-08-17 1999-09-28 Pharming B.V. Method for the production of biologically active polypeptides in a mammal's
US6211428B1 (en) 1994-09-01 2001-04-03 Merck & Co., Inc. Transgenic mouse expressing a familial form of human amyloid precursor protein
US5795737A (en) 1994-09-19 1998-08-18 The General Hospital Corporation High level expression of proteins
US6111166A (en) 1994-09-19 2000-08-29 Medarex, Incorporated Transgenic mice expressing human Fcα and β receptors
US5880327A (en) 1994-09-21 1999-03-09 American National Red Cross Transgenic mammals expressing human coagulation factor VIII
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US6187992B1 (en) 1994-12-05 2001-02-13 Merck & Co., Inc. Transgenic mouse having a disrupted amyloid precursor protein gene
US5830645A (en) 1994-12-09 1998-11-03 The Regents Of The University Of California Comparative fluorescence hybridization to nucleic acid arrays
US6093562A (en) 1996-02-05 2000-07-25 Novo Nordisk A/S Amylase variants
US5959098A (en) 1996-04-17 1999-09-28 Affymetrix, Inc. Substrate preparation process
JPH10510433A (ja) 1995-06-06 1998-10-13 アイシス・ファーマシューティカルス・インコーポレーテッド 高いキラル純度のホスホロチオエート結合を有するオリゴヌクレオチド
EP0835304A1 (en) 1995-06-27 1998-04-15 Unilever N.V. Immobilized enzyme and its use for the processing of triglyceride oils
US5856174A (en) 1995-06-29 1999-01-05 Affymetrix, Inc. Integrated nucleic acid diagnostic device
US5985662A (en) 1995-07-13 1999-11-16 Isis Pharmaceuticals Inc. Antisense inhibition of hepatitis B virus replication
US5958672A (en) 1995-07-18 1999-09-28 Diversa Corporation Protein activity screening of clones having DNA from uncultivated microorganisms
DE19527274A1 (de) 1995-07-26 1997-01-30 Metallgesellschaft Ag Enzymatisches Verfahren zur Entschleimung von pflanzlichen Ölen mit Aspergillus-Phospholipase
SE504664C2 (sv) 1995-09-22 1997-03-24 Scotia Lipidteknik Ab Sätt att framställa fraktionerad olja, oljan, dess användning samt emulsionskomposition innehållande oljan
WO1997016533A1 (en) 1995-10-31 1997-05-09 The Regents Of The University Of California Mammalian artificial chromosomes and methods of using same
US5939250A (en) 1995-12-07 1999-08-17 Diversa Corporation Production of enzymes having desired activities by mutagenesis
US5830696A (en) 1996-12-05 1998-11-03 Diversa Corporation Directed evolution of thermophilic enzymes
US6238884B1 (en) 1995-12-07 2001-05-29 Diversa Corporation End selection in directed evolution
US5965408A (en) 1996-07-09 1999-10-12 Diversa Corporation Method of DNA reassembly by interrupting synthesis
US6171820B1 (en) 1995-12-07 2001-01-09 Diversa Corporation Saturation mutagenesis in directed evolution
US6022963A (en) 1995-12-15 2000-02-08 Affymetrix, Inc. Synthesis of oligonucleotide arrays using photocleavable protecting groups
US6013440A (en) 1996-03-11 2000-01-11 Affymetrix, Inc. Nucleic acid affinity columns
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US6025155A (en) 1996-04-10 2000-02-15 Chromos Molecular Systems, Inc. Artificial chromosomes, uses thereof and methods for preparing artificial chromosomes
US6197070B1 (en) 1996-05-15 2001-03-06 The Procter & Gamble Company Detergent compositions comprising alpha combination of α-amylases for malodor stripping
US6057100A (en) 1996-06-07 2000-05-02 Eos Biotechnology, Inc. Oligonucleotide arrays
US6326341B1 (en) 1996-09-11 2001-12-04 The Procter & Gamble Company Low foaming automatic dishwashing compositions
US6127137A (en) 1996-10-31 2000-10-03 Novo Nordisk A/S Acidic phospholipase, production and methods using thereof
WO1998018912A1 (en) 1996-10-31 1998-05-07 Novo Nordisk A/S Novel phospholipase, production and use thereof
US6103505A (en) 1996-12-09 2000-08-15 Novo Nordisk A/S Method for reducing phosphorus content of edible oils
DK0869167T4 (da) 1996-12-09 2010-03-08 Novozymes As Reduktion af phosphor-indeholdende bestanddele i spiseolier; som omfatter en stor mængde ikke-hydrerbart phosphor, ved anvendelse af en phospholipase, en phospholipase fra en trådsvamp, der har en phospholipase A og/eller B aktivitet
HUP0000486A3 (en) 1996-12-19 2001-10-29 Unilever Nv Immobilized enzyme and its use for the processing of triglyceride oils
US6069122A (en) 1997-06-16 2000-05-30 The Procter & Gamble Company Dishwashing detergent compositions containing organic diamines for improved grease cleaning, sudsing, low temperature stability and dissolution
EP2261373A3 (en) 1997-01-17 2011-12-14 Codexis Mayflower Holdings, LLC Evolution of whole cells and organisms by recursive sequence recombination
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DE19703364A1 (de) 1997-01-30 1998-08-06 Henkel Ecolab Gmbh & Co Ohg Pastenförmiges Wasch- und Reinigungsmittel
US6303803B1 (en) 1997-01-31 2001-10-16 Cargill, Incorporated Removal of sterols from fats and oils
US5880300A (en) 1997-01-31 1999-03-09 Cargill, Incorporated Phospholipid-based removal of sterols from fats and oils
AU6611498A (en) 1997-03-18 1998-10-12 Novo Nordisk A/S Method for constructing a library using dna shuffling
EP0973940B1 (en) 1997-03-18 2008-07-02 Novozymes A/S An in vitro method for the construction of a dna library
US5948653A (en) 1997-03-21 1999-09-07 Pati; Sushma Sequence alterations using homologous recombination
US6153410A (en) 1997-03-25 2000-11-28 California Institute Of Technology Recombination of polynucleotide sequences using random or defined primers
US6826296B2 (en) 1997-07-25 2004-11-30 Affymetrix, Inc. Method and system for providing a probe array chip design database
AU8908198A (en) 1997-08-15 1999-03-08 Hyseq, Inc. Methods and compositions for detection or quantification of nucleic acid species
DE69833698T2 (de) 1997-09-11 2006-11-16 Bioventures, Inc., Murfreesboro Verfahren zur Herstellung von Arrays hoher Dichte
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6399383B1 (en) 1997-10-28 2002-06-04 Maxygen, Inc. Human papilloma virus vectors
JP4426094B2 (ja) 1997-10-30 2010-03-03 ノボザイムス アクティーゼルスカブ αアミラーゼ変異体
EP1030861A4 (en) 1997-10-31 2001-09-05 Maxygen Inc MODIFICATION OF VIRUSTROPISMIUS AND THE ECONOMIC SPECTRUM BY VIRAL GENOM MIXING
BR9813201A (pt) 1997-11-10 2000-08-29 Procter & Gamble Processo para preparação de um tablete detergente
CA2251263A1 (en) 1997-11-14 1999-05-14 Hajime Karasuyama Transgenic animal allergy models and methods for their use
CA2313380C (en) 1997-12-08 2008-12-30 California Institute Of Technology Method for creating polynucleotide and polypeptide sequences
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
AU2674299A (en) 1998-02-11 1999-08-30 Maxygen, Inc. Targeting of genetic vaccine vectors
WO1999041383A1 (en) 1998-02-11 1999-08-19 Maxygen, Inc. Antigen library immunization
JP2002510505A (ja) 1998-04-03 2002-04-09 フィロス インク. 位置特定可能な蛋白質アレイ
US6156952A (en) 1998-04-09 2000-12-05 Constituent Institution Of The University Of Maryland System HIV transgenic animals and uses therefor
KR20010043194A (ko) 1998-05-01 2001-05-25 피아 스타르 N­히드록시아세트아닐라이드와 같은 증강제
US6048695A (en) 1998-05-04 2000-04-11 Baylor College Of Medicine Chemically modified nucleic acids and methods for coupling nucleic acids to solid support
DE19824705A1 (de) 1998-06-03 1999-12-09 Henkel Kgaa Amylase und Protease enthaltende Wasch- und Reinigungsmittel
JP4700805B2 (ja) 1998-06-29 2011-06-15 ブリストル−マイヤーズ スクウィブ カンパニー 多様性の高いライブラリーを製造する方法
JP4335995B2 (ja) 1998-07-22 2009-09-30 昭 神谷 環境保全型粒状洗浄用組成物
FR2782323B1 (fr) 1998-08-12 2002-01-11 Proteus Procede de production in vitro de sequences polynucleotidiques recombinees, banques de sequences et sequences ainsi obtenues
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6172248B1 (en) * 1998-11-20 2001-01-09 Ip Holdings, L.L.C. Methods for refining vegetable oils and byproducts thereof
US6277489B1 (en) 1998-12-04 2001-08-21 The Regents Of The University Of California Support for high performance affinity chromatography and other uses
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
US6309871B1 (en) 1999-03-31 2001-10-30 Novozymes A/S Polypeptides having alkaline α-amylase activity
US6221653B1 (en) 1999-04-27 2001-04-24 Agilent Technologies, Inc. Method of performing array-based hybridization assays using thermal inkjet deposition of sample fluids
US6653151B2 (en) 1999-07-30 2003-11-25 Large Scale Proteomics Corporation Dry deposition of materials for microarrays using matrix displacement
EP1106603A3 (en) 1999-12-06 2003-11-19 Fuji Photo Film Co., Ltd. DNA chip and reactive solid carrier
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
US6515109B1 (en) 2000-10-12 2003-02-04 Exelixis, Inc. Human ECT2 polypeptide
US6309872B1 (en) 2000-11-01 2001-10-30 Novozymes Biotech, Inc Polypeptides having glucoamylase activity and nucleic acids encoding same
JP6449266B2 (ja) 2013-06-21 2019-01-09 バイオ−ラッド・ラボラトリーズ・インコーポレーテッド 流体ピックアップを備えるマイクロ流体システム

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101558154A (zh) * 2006-09-21 2009-10-14 维莱尼姆公司 磷脂酶、编码它们的核酸及其制备和应用方法
CN103540576A (zh) * 2013-09-30 2014-01-29 上海交通大学 patatin-like磷脂酶及其编码基因与用途
CN103540576B (zh) * 2013-09-30 2015-05-20 上海交通大学 patatin-like磷脂酶及其编码基因与用途
CN104630176A (zh) * 2013-11-13 2015-05-20 丰益(上海)生物技术研发中心有限公司 一种提高发酵法生产磷脂酶c产量的方法
CN104630176B (zh) * 2013-11-13 2020-05-01 丰益(上海)生物技术研发中心有限公司 一种提高发酵法生产磷脂酶c产量的方法
CN108369164A (zh) * 2016-02-29 2018-08-03 惠普发展公司,有限责任合伙企业 酶促样品纯化
CN110129299A (zh) * 2016-06-02 2019-08-16 天津科技大学 磷脂酶d及其应用
CN110129299B (zh) * 2016-06-02 2021-08-03 天津科技大学 磷脂酶d及其应用
CN108220267A (zh) * 2016-12-22 2018-06-29 丰益(上海)生物技术研发中心有限公司 磷脂酶及其应用
CN108220267B (zh) * 2016-12-22 2022-10-04 丰益(上海)生物技术研发中心有限公司 磷脂酶及其应用
CN111051505A (zh) * 2018-12-29 2020-04-21 邦泰生物工程(深圳)有限公司 一种磷脂酶d突变体、其应用及其制备磷酯酰丝氨酸的方法
CN111051505B (zh) * 2018-12-29 2023-11-03 邦泰生物工程(深圳)有限公司 一种磷脂酶d突变体、其应用及其制备磷酯酰丝氨酸的方法
CN114835780A (zh) * 2022-06-29 2022-08-02 中国农业大学 辣椒籽分离的寡肽medei及其在预防或治疗癌症中的应用
CN114835780B (zh) * 2022-06-29 2022-09-27 中国农业大学 辣椒籽分离的寡肽medei及其在预防或治疗癌症中的应用

Also Published As

Publication number Publication date
US20040005604A1 (en) 2004-01-08
BR0309391A (pt) 2005-10-25
EP1497418A4 (en) 2006-02-01
WO2003089620A3 (en) 2004-10-14
EP1497418B1 (en) 2012-10-17
CN102174546A (zh) 2011-09-07
AU2003243157B2 (en) 2008-03-20
AU2003243157A1 (en) 2003-11-03
AU2003243157C1 (en) 2008-09-04
WO2003089620A2 (en) 2003-10-30
EP1497418A2 (en) 2005-01-19
BRPI0309391B1 (pt) 2018-10-30
CA2481411A1 (en) 2003-10-30
ES2395898T3 (es) 2013-02-15
PT1497418E (pt) 2013-01-25
EA200401407A1 (ru) 2006-02-24
CA2481411C (en) 2016-06-14
EP2298871A1 (en) 2011-03-23
EA010903B1 (ru) 2008-12-30
JP2005523019A (ja) 2005-08-04

Similar Documents

Publication Publication Date Title
CN1659276A (zh) 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
CN101426918B (zh) 磷脂酶,编码磷脂酶的核酸以及制备和应用磷脂酶的方法
CN101558154B (zh) 磷脂酶、编码它们的核酸及其制备和应用方法
US9512382B2 (en) Oil degumming methods
US9394529B2 (en) Phospholipases, nucleic acids encoding them and methods for making and using them
US7943360B2 (en) Phospholipases, nucleic acids encoding them and methods for making and using them
AU2011218662B2 (en) Phospholipases, nucleic acids encoding them and methods for making and using them
AU2008201667A1 (en) Phospholipases, nucleic acids encoding them and methods for making and using them

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
ASS Succession or assignment of patent right

Owner name: WIRAINIM CO.,LTD.

Free format text: FORMER OWNER: DIVERSA CORP.

Effective date: 20091113

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20091113

Address after: American California

Applicant after: Diversa Corp.

Address before: American California

Applicant before: Diversa Corp.

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20050824