[go: up one dir, main page]

CN1768141B - 泛酸内酯水解酶 - Google Patents

泛酸内酯水解酶 Download PDF

Info

Publication number
CN1768141B
CN1768141B CN2004800085042A CN200480008504A CN1768141B CN 1768141 B CN1768141 B CN 1768141B CN 2004800085042 A CN2004800085042 A CN 2004800085042A CN 200480008504 A CN200480008504 A CN 200480008504A CN 1768141 B CN1768141 B CN 1768141B
Authority
CN
China
Prior art keywords
leu
gly
ala
asp
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
CN2004800085042A
Other languages
English (en)
Other versions
CN1768141A (zh
Inventor
爱琦巴尔·吉尔
郭达海
马丁·莱玛恩
德莫特·P·莫纳戈
娆·翰奴曼萨·瓦里威提
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN1768141A publication Critical patent/CN1768141A/zh
Application granted granted Critical
Publication of CN1768141B publication Critical patent/CN1768141B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/02Amides, e.g. chloramphenicol or polyamides; Imides or polyimides; Urethanes, i.e. compounds comprising N-C=O structural element or polyurethanes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P41/00Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
    • C12P41/003Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by ester formation, lactone formation or the inverse reactions
    • C12P41/005Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by ester formation, lactone formation or the inverse reactions by esterification of carboxylic acid groups in the enantiomers or the inverse reaction

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及编码泛酸内酯水解酶的基因的核苷酸序列,以及含有上述核苷酸序列的载体和宿主细胞,和由上述核苷酸序列编码的泛酸内酯水解酶。本发明还提供了制造和使用泛酸内酯水解酶的方法。

Description

泛酸内酯水解酶
本发明涉及可用于泛酸内酯(pantolactone)对映异构体的光拆分(optical resolution)的酶,涉及编码所述酶的基因,还涉及所述酶在制备R-泛酸或其盐或R-泛酰醇(R-panthenol)的方法中的用途。
对映异构体在其生理效应,即毒理和药理效应,与酶的反应以及其感知特征(sensorial characteristics)方面是不同的。已知仅有R-泛酸内酯是R-泛酸制备中的中间产物,R-泛酸是维生素,其对人类和动物的生长、繁殖以及正常生理功能来说都是必要的。泛酸作为辅酶A的前体以及作为脂肪酸合成酶的酰基载体,涉及到超过一百种的不同代谢途径,其中包括碳水化合物、蛋白质和脂类的能量代谢,以及脂类、神经递质、甾类激素、卟啉和激素的合成。直到近来,广泛用于R-泛酸内酯制备的方法是对化学合成的R-和S-泛酸内酯进行的光拆分。此种方法非常昂贵,因为其需要使用昂贵的光拆分试剂。此外,对泛酸内酯的R-对映异构体的回收也相当困难。因此,提供可用于泛酸内酯的R-和S-对映异构体的光拆分的泛酸内酯水解酶是人们所需要的。使用这种酶,尤其是水解泛酸内酯的S-或R-形式,是分离泛酸内酯的两种对映异构体的更为经济且更容易操作的方法。R-泛酸的盐的例子包括R-泛酸钙。
在一种实施方式中,本发明提供了编码泛酸内酯水解酶的基因的核苷酸序列,所述泛酸内酯水解酶是从马肝脏、A.niger ATCC 9142、A.nigerawamori ATCC 38854或A.niger MacRae ATCC 46951中获得的。公众可从American Type Culture Collection(ATCC),10801 University Boulvard,Manassas,VA 20110-2209USA获得上述菌株。
在另一种实施方式中,本发明提供了编码泛酸内酯水解酶的核苷酸序列,所述序列包含:当泛酸内酯水解酶来自马肝脏时,如SEQ ID NO:1所示的核苷酸序列;当泛酸内酯水解酶来自A.niger MacRae ATCC 46951时,如SEQ ID NO:5所示的核苷酸序列;当泛酸内酯水解酶来自A.nigerATCC9142时,如SEQ ID NO:7所示的序列;以及当泛酸内酯水解酶来自A.niger awamori ATCC38854时,如SEQ ID NO:9所示的序列。
所述核苷酸序列可以包含上述每种泛酸内酯水解酶的编码序列以及调控序列。
“调控序列”在此被定义为:指导可操作地连接的核酸转录的核酸控制序列的排列。一个此类表达控制序列的例子是启动子。“启动子”包括在转录起始位点附近的必要核酸序列。启动子还可选地包括远端增强子或阻遏元件,其可定位于转录起始位点之后的多达数千个碱基对上。“组成型”启动子是在大多数环境及发育条件下都有活性的启动子。“诱导型”启动子是在环境或发育调控中具有活性的启动子。术语“可操作地连接”指核酸表达控制序列(例如启动子或转录因子结合位点的排列)以及第二种核酸序列之间的功能性连接,其中所述表达控制序列指导对应于第二种序列的核酸的转录。
可以使用核酸序列的片段,例如,在杂交试验中作为探针。
在宿主生物中插入核苷酸序列,令其转录及翻译,以制造功能性多肽的情况下,技术人员将认识到,由于密码简并性,很多种多核苷酸序列都将编码同样的多肽。这些变异体也明确地包括在本发明的范围之内。此外,本发明还明确地包括下述序列,所述序列彼此之间实质上相同(按照下文所述来确定),它们编码是野生型多肽的突变体的多肽或保留有多肽功能的多肽(例如由对多肽氨基酸的保守取代得到的)。此外,变异体可以是编码下述显性失活突变体的。
如果按照下文所述进行最大一致性比对时,两条核酸序列或多肽各自的核苷酸序列或氨基酸残基是同样的,这两条核苷酸序列或多肽会被认为是“相同的”。在关于两条或多条核酸或多肽序列的上下文中,术语“相同的”或百分比“相同性”指:在比较窗(comparison window)上进行最大一致性比较及比对时,用下述序列比较算法中的一种或通过手工比对及眼睛观察来测量的情况下,两条或多条序列或亚序列是同样的,或其中同样的氨基酸残基或核苷酸具有特定的百分比。当序列相同性的百分比针对蛋白质或肽来使用时,应认识到,不相同的残基位置通常是由于保守的氨基酸取代而导致不同的,其中氨基酸残基被取代为其它具有相似化学性质(例如,电荷或疏水性)的氨基酸残基,因此并不改变分子的功能属性。当序列因保守取代而不同时,可因取代的保守本质,将百分比序列相同性上调以进行校正。进行这种调节的方法是本领域技术人员公知的。典型地,这包括将保守取代作为部分而非完全的错配进行评分,因而提高百分比序列相同性。因此,例如,在给相同的氨基酸1分,给非保守取代0分的情况下,给保守取代0和1之间的分数。按照,例如,Meyers&Miller,Computer Applic.Biol.Sci.4:11-17(1988)的算法,例如,在程序PC/GENE(Intelligenetics,Mountain View,Calif.,USA)中实现,来计算对保守取代的给分。
在关于两条核酸或多肽的上下文中,短语“实质上相同”指:在比较窗上进行最大一致性比对时,用下述序列比较算法中的一种或通过手工比对及眼睛观察来测量的情况下,具有至少60%,优选80%,最优选90-95%的核苷酸或氨基酸残基相同性的序列或亚序列。该定义还指能与待测序列杂交的序列的互补序列。
对序列比较而言,典型地,一条序列用作参照序列,将待测序列与其进行比较。使用序列比较算法时,将待测和参照序列都输入到计算机中,如果需要的话,指定亚序列坐标,以及指定序列算法程序参数。可以使用缺省的程序参数,或者指定其它参数。然后序列比较算法会基于程序参数,对待测序列相对于参照序列的百分比序列相同性进行计算。
本文中使用的“比较窗”包括:指一种片断,其连续位置的数量选自由20至600,通常大约50至大约200,更通常为大约100至大约150所构成的组,其中,序列可与具有同样数量的连续位置的参照序列进行比较,这是在两条序列被最优排列之后进行的。对序列进行排列以进行比较的方法是本领域内公知的。
“经保守修饰的变异体”用于氨基酸及核酸序列。就具体的核酸序列而言,经保守修饰的变异体指编码相同或基本相同的氨基酸序列的核酸,或者,当核酸不编码氨基酸序列时,指基本相同的序列。由于遗传密码的简并性,有多种功能上相同的核酸密码子编码任何给定的蛋白质。例如,密码子GCA、GCC、GCG和GCU都编码丙氨酸这种氨基酸。因此,在丙氨酸被密码子确定的每个位置上,密码子可变为上述相应密码子中的任何一个,而不会改变编码出的多肽。此类核酸变异是“沉默变异”,其是经保守修饰的变异中的一种。本文中每条编码多肽的核酸序列也还描述该核酸的每种可能的沉默变异。技术人员将认识到,核酸中的每个密码子(AUG除外,其通常是编码甲硫氨酸的唯一的密码子)都可被修饰,以产生功能上相同的分子。因此,编码多肽的核酸的每种沉默变异都隐含在每条被描述过的序列中。
对氨基酸序列而言,技术人员将认识到,对核酸的个别取代、缺失或增加,或对肽、多肽或蛋白质序列进行的在被编码的序列中改变单个氨基酸或小百分比(即,小于20%,例如15%、10%、5%、4%、3%、2%或1%)的氨基酸的取代,是“经保守修饰的变异体”,其中的改变是氨基酸被化学上相似的氨基酸所取代。提供功能上相似的氨基酸的保守取代表在本领域内是公知的。
下述六组中的每一组都含有可以互相保守取代的氨基酸:
丙氨酸(A)、丝氨酸(S)、苏氨酸(T);
天冬氨酸(D)、谷氨酸(E);
天冬酰胺(N)、谷氨酰胺(Q);
精氨酸(R)、赖氨酸(K);
异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);以及
苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W)。(见,例如,Creighton,Proteins(1984))。
两条核酸序列或多肽实质上相同的标志是:第一条核酸编码的多肽可与因对抗第二条核酸编码的多肽而产生的抗体进行免疫交叉反应。因此,例如,当两条肽仅仅只由于保守取代而有不同时,则典型地,其中一条多肽与第二条多肽实质上相同。两条核酸序列实质上相同的另一种标志是:这两个分子或其互补体在如下文所述的严谨条件下能相互杂交。
短语“与……特异性杂交”指:在严谨杂交条件下,当序列存在于复杂混合物(例如,细胞总DNA或RNA,或文库DNA或RNA)中时,分子仅与特定的核苷酸序列结合、形成双链或杂交。
短语“严谨杂交条件”指探针将与其目标序列而不与其它序列杂交的条件,典型地,其目标序列处于核酸序列的复杂混合物中。严谨条件是取决于序列的,在不同的情况下也有所不同。较长的序列会在较高的温度下特异性杂交。通常,高严谨度条件被选择为:比在给定的离子强度和pH下特异性序列的热融温度(Tm)低大约5-10℃。低严谨度条件通常被选择为比Tm低大约15-30℃。Tm是:(在给定的离子强度、pH和核酸浓度下,)平衡时,互补于目标的探针中的50%与目标序列杂交的温度(目标序列过量存在时,Tm处,平衡时50%的探针被结合)。严谨条件将是下述条件:盐浓度低于大约1.0M的钠离子,典型地,大约0.01至1.0M的钠离子浓度(或其它盐),pH7.0至8.3,对短探针(例如,10至50个核苷酸)而言温度为至少大约30℃,对长探针(例如,多于50个核苷酸)而言,温度为至少大约60℃。严谨条件还可以通过加入去稳定试剂,例如甲酰胺来获得。对选择性或特异性杂交而言,阳性信号是背景的至少两倍,优选10倍于背景杂交。
如果在严谨条件下不能相互杂交的核酸所编码的多肽是实质上相同的,那么这样的核酸也仍然是实质上相同的。这会发生于,例如,用由遗传密码允许的最大密码子简并度产生核酸拷贝的情况下。在此类情况下,典型地,核酸在中度严谨杂交条件下杂交。
在本发明中,用本文中公开的核酸序列,在严谨条件下进行标准的Southern印迹实验,可鉴定出含有本发明核酸的基因组DNA(gDNA)或cDNA。就此种公开的目的而言,适合于此类杂交的严谨条件包括:在37℃下在40%甲酰胺、1M NaCl、1%十二烷基硫酸钠(SDS)缓冲液中杂交,在至少大约50℃的温度下于0.2 X SSC中洗至少一次,20分钟,温度通常是在大约55℃至大约60℃;或是相当的条件。阳性杂交至少是背景的两倍。普通技术人员很容易认识到,其它杂交及洗涤条件可用于提供具有相似严谨度的条件。
关于两条多核苷酸相同的另一种标志是:通过一对寡核苷酸引物扩增出来的参照序列,在严谨杂交条件下可被用作为探针,以从cDNA或基因组文库中分离出待测序列,或在northern或Southern印迹实验中鉴定出待测序列。
本发明还包括本文所定义的表达载体。表达载体包括上文列出的多核苷酸序列中任一种的一个或多个拷贝。本发明的表达载体可以含有本文定义的任何多核苷酸序列。
因此,在另一种实施方式中,本发明提供了一种表达载体,所述载体包含编码泛酸内酯水解酶的基因的核苷酸序列,所述泛酸内酯水解酶来自马肝脏、Bacillus subtilis、A.niger ATCC 9142、A.niger awamori ATCC38854或A.niger MacRae ATCC46951;或者所述载体包含编码泛酸内酯水解酶的基因的核苷酸序列,所述泛酸内酯水解酶来自马肝脏,如SEQID NO:2所示,来自Bacillus subtilis,如SEQ ID NO:4所示,来自A.niger ATCC9142,如SEQ ID NO:8所示,来自A.niger awamori ATCC38854,如SEQ ID NO:10所示,以及来自A.niger MacRae ATCC46951,部分如SEQ ID NO:6所示。
可选地,表达载体中的多核苷酸序列可与上文定义的表达控制序列可操作地连接。
在本文中使用的短语“表达载体”是可复制的(replicatable)载体,其带有编码本文列出的多核苷酸序列的DNA序列,并能调控这些DNA序列的表达。在本文上下文中,术语“可复制的”指,在引入载体的给定类型的宿主细胞中,载体可被复制。在感兴趣的多核苷酸序列上游接近该多核苷酸的地方,可能会提供有编码信号肽的序列,其存在确保了带有载体的宿主细胞所表达的被编码的多肽得以分泌。信号序列可以是与被选出的多核苷酸序列天然相连接的,或者可以来自另一种来源。
载体可以是传统用于重组DNA工艺的任何载体,对载体的选择将通常取决于其将被引入的宿主细胞。因此,载体可以是自主复制载体,即,作为染色体外物质存在的载体,其复制独立于染色体复制;此种载体的例子是质粒、噬菌体、粘粒或迷你染色体。另外,载体可以是下述载体,当其被引入到宿主细胞中时,会整合到宿主细胞基因组中,并与其被整合到的宿主细胞基因组一起复制。本发明的表达载体可以带有本发明的任何DNA序列,可被用于表达本发明的任何多肽。
本发明还包括经培养的细胞或宿主细胞,其中含有一条或多条本文公开的多核苷酸序列和/或一个或多个本文公开的表达载体。在本文中使用的“经培养的细胞”包括,任何能够在给定条件下生长,并能表达本发明的多核苷酸编码的一种或多种多肽的细胞。优选地,经培养的细胞是酵母、真菌、细菌或藻类。更优选地,经培养的细胞是Escherichia coli、Saccharomyces cerevisiae、Pichia pastoris、Aspergillus niger或Bacillussubtilis。
在另一种实施方式中,本发明提供了从马肝脏、A.niger ATCC 9142、A.niger awamori ATCC 38854或A.niger MacRae ATCC 46951中获得的泛酸内酯水解酶。
在又一种实施方式中,本发明提供了一种泛酸内酯水解酶,其氨基酸序列包含:当来自马肝脏时,SEQ ID NO:2所示的氨基酸序列;当来自A.niger MacRae ATCC 46951时,SEQ ID NO:6所示的氨基酸序列;当来自A.niger ATCC 9142时,SEQ ID NO:8所示的氨基酸序列;当来自A.niger awamori ATCC 38854时,SEQ ID NO:10所示的氨基酸序列。
SEQ ID NO:2所示的来自马肝脏的和SEQ ID NO:4所示的来自Bacillus subtilis的泛酸内酯水解酶显示S-泛酸内酯水解酶活性。SEQ IDNO:8所示的来自A.niger ATCC 9142的、SEQ ID NO:10所示的来自A.niger awamori ATCC 38854的和部分如SEQ ID NO:6所示的来自A.nigerMacRae ATCC 46951的泛酸内酯水解酶显示R-泛酸内酯水解酶活性。
在另一种实施方式中,本发明包含上述氨基酸序列的片段,所述片段具有完整蛋白质的酶活性。
根据本发明的“氨基酸序列的片段”可被定义为缺少一段氨基酸的序列,该段氨基酸对蛋白质正确折叠来说可能是必要的。然而,一旦蛋白质被折叠,该段氨基酸就可被删除,而不会破坏单个蛋白质的功能。这些段可以存在于被折叠的蛋白质中,例如环,或者可以是与被折叠的蛋白质的活性不直接相关的N-或C-末端序列。
此外,本发明包括包含所述R-和S-泛酸内酯水解酶活性的蛋白质的衍生物。所述衍生物包括被固定的酶,例如通过内含(inclusion)被固定,其中所述的酶被保留于膜装置上,例如中空纤维、聚合网状结构或微囊体。还可能通过交联或通过产生酶晶体来对酶进行固定。另一种对酶进行固定的可能方法是将其结合到正在生长的多聚物上,例如二氧化硅溶胶凝胶或二氧化硅石墨溶胶凝胶,或者通过将酶结合到预制载体上,例如EupergitC、Eupergit 250L、PEG、Celite和Amberlite XAD-7。对本发明的R-和S-泛酸内酯水解酶适用的另一种固定酶的技术是将其分散在与水无法混溶的有机溶剂中。通常,通过本领域内已知的几乎所有固定技术,可对具有酶活性的蛋白质,例如本发明的酶进行固定。
在又一种实施方式中,本发明涉及用经分离的泛酸内酯水解酶选择性水解R-或S-泛酸内酯水解酶的用途,这可用于对泛酸内酯的R-对映异构体的工业生产,泛酸内酯的R-对映异构体是生产R-泛酸和R-泛酰醇的前体。
因此,本发明的一个目的是提供用本文所述的经分离的泛酸内酯水解酶来对R-或S-泛酸内酯进行选择性水解的方法或途径。
在另一种实施方式中,本发明提供了生产R-泛酸或其盐或R-泛酰醇的方法,其中包括在本发明的泛酸内酯水解酶存在下对R-或S-泛酸内酯进行选择性水解的步骤。
在另一种实施方式中,本发明提供了克隆与已知序列直接相邻的核苷酸序列的方法,例如编码新颖的泛酸内酯水解酶或其部分的核苷酸序列。
具体而言,本发明包括能扩增未知序列的新的PCR策略。所述新的PCR策略包括在第一条和第二条DNA链的合成中使用同一种引物。该引物能与将被扩增的gDNA的已经已知的区域杂交。该引物显示与已知序列100%的同源性。在该引物的帮助下,进行第一次PCR,提供基因组DNA的第一条单链拷贝,到达未知序列。用一部分第一次PCR反应产物作为模板来进行第二次PCR,其中使用的(嵌套)引物能与定位于第一次PCR中所用的引物的3’方向上的DNA片段杂交,但逻辑上仍处于序列的已知部分。该嵌套引物与第一次聚合酶反应产生的单链DNA进行随机杂交之后,产生该单链DNA的反义链,其自身作为用于第二次PCR、产生第二条链的同样的引物的模板。在最后,起始于已知序列内部,延伸于邻近的基因组DNA或延伸于缺失部分序列的任何其它DNA的DNA片段通过与新片段两端都能杂交的一种引物被制造出来。
因此,在另一种实施方式中,本发明提供了克隆与已知序列直接相邻的核苷酸序列的方法,所述方法包括PCR扩增,所述扩增包括:
a)用第一次PCR的单链DNA作为模板进行第二次PCR,在所述第二次PCR中用能与第一次PCR产生的单链DNA随机杂交的引物;以及
b)由此,仍用步骤a)中的随机杂交引物,产生自身作为第二条链模板的反义链。
下述实施例对编码泛酸内酯水解酶基因的鉴定、表征和表达进行了详细的描述。这些实施例仅是示例性的,而非欲以任何方式对本发明的范围加以限制。
实施例1从可商购的马肝脏酯酶丙酮粉末来纯化(S)-泛酸内酯水解活性
将1g马肝脏酯酶丙酮粉末(Fluka Holding AG,Industriestrasse 25,P.O.Box 260,CH-9471 Buchs,瑞士)溶于40ml 50mM的Tris/HCl中,pH7.5,其中含有2M硫酸铵、1mM CaCl2、1mM MgCl2和10μM EDTA(缓冲液A)。通过离心分离出未溶解的物质,之后,用0.45μM过滤器进行过滤灭菌。将蛋白质溶液上样到用缓冲液A平衡过的丁基琼脂糖柱HR26/10(Amersham Pharmacia Biotech Europe GmbH,Dübendorf,瑞士)中。用100ml缓冲液A洗该柱。之后应用400ml从0至100%线性梯度的缓冲液B(没有硫酸铵的缓冲液A)。内酯酶在梯度中间被洗脱出来。收集显示泛酸内酯水解活性的片断,将缓冲液换为pH8.0的20mMTris/HCl、1mM CaCl2、1mM MgCl2以及10μM EDTA。收集的片断上样到MonoQ-预填(pre-packed)柱HR 26/10(Amersham Pharmacia BiotechEurope GmbH,Dübendorf,瑞士)中,应用0至350mM NaCl的线性梯度。蛋白质在该梯度的开始即被洗脱出来。再次收集活性片断,浓缩到1ml,上样至Superdex 200柱(Amersham Pharmacia Biotech Europe GmbH,Dübendorf,瑞士)上。用pH8.0的50mM Tris/HCl、1mM CaCl2、1mMMgCl2以及10μM EDTA作为洗脱缓冲液,内酯酶作为最后一个峰被洗脱出来,其显示大约31kDa的分子大小,与SDS-PAGE所示的尺寸相符。
通过在37℃将酶于pH9.0的200mM Tris/乙酸缓冲液、5mM MgCl2中培养60分钟进行测定,发现最高比活性为13.3U/(mg蛋白质)。通过HPLC来测定(S)-和(R)-泛酸内酯的浓度。
实施例2对来自马肝脏的(S)-泛酸内酯水解酶进行初步的表征
(a)分子大小、结构以及等电点:
根据SDA-PAGE,变性蛋白具有大约35kDa的分子量。用经校正的凝胶过滤柱的洗脱时间,天然蛋白质的分子量被计算为大约31kDa。这意味着来自马肝脏的内酯酶是30至35kDa的单体。用2D凝胶,等电点被测定为pH5.5的范围内。
(b)N-末端和内部氨基酸测序:
用胰蛋白酶对2D凝胶电泳之后富集的蛋白质进行消化。通过质谱对产生的肽进行分析。SEQ NO:11中示出了肽No.66的N-末端序列。
该序列与MS-谱一起显示,该蛋白质属于已知为衰老标记蛋白-30或钙调蛋白(regucalcins)的蛋白质家族,其主要被发现于脊椎动物中。来自大鼠、小鼠、人、鸡、兔、牛、Xenopus laevis的钙调蛋白序列,以及来自Drosophila melanogaster的两条较少同源性的序列已被测定。然而,来自马的该基因还未被分离及测序。
(c)金属依赖性:
为测定不同二价金属对马肝脏酶的泛酸内酯酶活性的影响,将1.3、2.6、5.2或10.4mM的Ca2+、Mg2+或Mn2+加入到由pH9.0的200mM Tris/乙酸盐和50mM(R,S)-泛酸内酯组成的反应混合物中。在37℃对反应混合物进行60分钟的培养,用等体积的含有2mM EDTA的甲醇来终止反应。通过HPLC测定(S)-泛酸内酯的减少。钙令酶活性降低,而镁和锰则使酶活性增高。
(d)热稳定性:
在30至80℃的温度下,将经纯化的酶在5.2mM MgCl2和pH9.0的200mM Tris/乙酸盐中培养15分钟。冰上30分钟之后,用标准试验方法来测定活性(60分钟,37℃)。直到60℃酶依然是稳定的。其在65℃开始失活,在70℃丢失超过50%的活性。
实施例3克隆来自马肝脏的(S)-泛酸内酯酶
用来自所有已知哺乳动物基因(见下文)的序列信息来设计引物,用于针对从来自Bavaria的一年龄“Hafflinger”的马肝脏制得的cDNA进行的PCR,所述cDNA由Roche Molecular Biochemicals,Penzberg,德国友情提供。用QIAGEN RNeasy Maxi Kit(Qiagen,Hilden,德国)来制备来自肝脏组织的总RNA。
马肝脏内酯酶与钙调蛋白家族其它成员之间的同源性显示于表1中。测定是通过GCG程序包中的GAP程序,使用标准参数来测定的。相似性的数字显示于表中对角线的右边,而相同性的数字显示于对角线左边。
表1:钙调蛋白家族中的氨基酸序列相似性和相同性
  马   牛   兔   人   大鼠   小鼠   鸡   X.laev   D.mela
  马   -   92.6   92.0   90.6   88.3   88.3   84.3   77.9   48.8
  牛   91.0   -   90.3   93.0   90.3   90.0   83.6   76.6   48.9
  兔   90.6   89.3   -   91.0   87.6   87.6   82.6   77.6   47.7
  人   89.6   91.3   89.3   -   90.0   90.6   82.3   76.9   48.4
  大鼠   86.0   87.3   85.0   88.3   -   95.7   80.9   77.9   49.3
  小鼠   86.3   87.3   85.3   88.6   94.0   -   81.6   77.3   50.0
  鸡   77.9   77.9   76.6   77.9   75.9   75.9   -   81.9   48.9
  X.laev   70.9   69.9   71.2   70.2   71.6   70.2   73.9   -   47.5
  D.mela   36.8   37.0   37.2   37.5   37.0   38.4   36.3   37.0   -
鸡:鸡;X.laev:Xenopus laevis;D.mela:Drosophila melanogaster
用Titan One Tube RT-PCT Kit(Roche Molecular Biochemicals,Penzberg,德国)和覆盖了起始密码子及终止密码子上游50bp序列的同源引物,利用RT-PCT扩增出885bp的片段(SEQ ID NO:1的1-885位核苷酸)。反应按照厂商推荐的方法进行。
用于第一次PCR的N-末端5’引物(SEQ ID NO:12)和C-末端3’-引物(3’-CAGTTTCCTTAAGGGGGGATA-5’)(SEQ ID NO:13)的构建基于来自牛(SEQ ID NO:14)、兔(SEQ ID NO:15)、人(SEQ IDNO:16)、大鼠(SEQ ID NO:17)、小鼠(SEQ ID NO:18)、鸡(SEQ ID NO:19)和Xenopus(SEQ ID NO:20)的N-末端序列以及来自牛(SEQ ID NO:21)、兔(SEQ ID NO:22)、人(SEQ ID NO:23)、大鼠(SEQ ID NO:24)、小鼠(SEQ ID NO:25)、鸡(SEQ IDNO:26)和Xenopus(SEQ ID NO:27)的C-末端序列。
将该片段克隆到TA克隆载体(Invitrogen,Carlsberg,CA,USA)中。测序证明其来自马肝脏钙调蛋白。通过被称为5’/3’RACE的方法,用Roche Molecular Biochemicals,Penzberg,德国提供的单独的试剂盒,分离出缺失的5’-末端:用完美匹配的引物(SEQ ID NO:28)从经分离的马肝脏cDNA生产单链DNA。纯化该单链DNA,加上polyC尾巴,用第一条引物5’端的嵌套引物、polyG引物来进行另一次PCR。代表着基因的缺失的5’-末端的DNA片段被扩增出来。用根据已经已知的序列设计的正向引物(SEQ ID NO:29)和主要根据牛和兔基因设计的起始于基因最后一个氨基酸的引物(SEQ ID NO:30)来克隆出3’-末端。在最后一次PCR中,用获得的序列信息来设计覆盖基因起始和终止密码子的5’-和3’-引物,按照上文所述从总RNA中分离出内酯酶的全长cDNA。该cDNA和氨基酸序列展示于SEQ ID NO:1和SEQ ID NO:2中。该基因由900bp/299个氨基酸构成。
用一种商业途径可获得的表达载体,例如来自Qiagen的pQE60,在E.coli中表达完整的基因,其C-末端与His标签融合。按照标准程序对加上His标签的蛋白质进行表达和纯化,产生出显示(S)-泛酸内酯酶活性的33kDa的蛋白质。
实施例4由可商购的A.niger脂肪酶A粗制剂来纯化(R)-泛酸内酯水解活
在可从商业途径获得的不同种的由A.niger发酵获得的酶产品中,鉴定出了特异性水解(R)-泛酸内酯的活性。为纯化具体的酶,使用了来自Amano Pharmaceuticals Co.Ltd.,Nagoya,Japan的被称为Lipase A“Amano”的商业制剂。根据从与内酯酶共同纯化的两个酶获得的序列数据,该制剂来自经冻干和破碎的过量表达来自A.tubigensis的脂肪酶的A.awamori细胞。将该材料溶于pH7.5的20mM Tris/HCl、2.5mM的MgCl2(标准缓冲液)中。加入5%的乙醇,以增加材料的溶解度。通过离心(30分钟,15000rpm,4℃)以及接着的过滤(用0.45μm的过滤器),分离出无法进入到溶液中的材料。先在Amicon cell超滤器(50kDa分离点)中通过超滤对已溶解的部分进行第一次纯化,以去除任何盐类和小分子化合物,它们会扰乱后续的阴离子交换色谱步骤。然后将蛋白质上样至HR26/10预填Q-琼脂糖凝胶柱(Amersham Pharmacia Biotech EuropeGmbH,Dübendorf,瑞士)。用200ml标准缓冲液洗柱,然后通过0至350mM NaCl的线性梯度(400ml)洗脱出蛋白质。含有活性的片断被收集起来。加入硫酸铵,至终浓度为1.5M,将经过处理的蛋白质溶液上样至HR 26/10丁基琼脂糖凝胶预填柱(Amersham Pharmacia Biotech EuropeGmbH,Dübendorf,瑞士)中。用200ml含有1.5M硫酸铵的标准缓冲液洗涤,通过1.5至0M递减的硫酸铵梯度(400ml)分离出蛋白质。此时活性在两个峰被洗脱出,并被分别收集。两次收集物的体积被减少到小于2ml。用标准缓冲液,通过在Superdex 200柱上进行凝胶过滤分离出两种浓缩物。每种分离物的活性片段被收集和浓缩。收集物II的活性趋向于稍早于收集物I被洗脱出来,这表明,相应蛋白质的分子量可能稍高。
80U/ml(40℃)是针对收集物I和收集物II分别已测出的最高活性。如2D凝胶所示,蛋白质制剂不完全是同源的,这表示真正的比活性甚至会更高。然而,因为内酯酶活性对应于凝胶过滤洗脱曲线中38kDa的蛋白质条带,也是最终制剂中占优势的蛋白质,该条带最有可能是内酯酶。根据凝胶过滤的结果,天然内酯酶具有75kDa的分子量。这暗示着该酶的同型二聚体结构。
实施例5对(R)-泛酸内酯水解酶进行初步的表征
(a)天然形式的结构和分子量:
用如实施例4所述的条件,在72ml处,用Superdex 200(AmershamPharmacia Biotech Europe GmbH,Dübendorf,瑞士)洗脱出酶。从标准曲线推断,这反映了75kDa的分子量。SDS-PAGE表明分子量为38kDa。上述数据的组合暗示来自A.niger的(R)-泛酸内酯酶是由两个相同的38kDa亚基组成的同型二聚体。
(b)热稳定性:
在pH 7.5的20mM Tris/HCl中于0、30、40、50、55、60、70℃对50μl经稀释的酶(0.1U)进行一小时的培养。冰上15分钟之后,用标准试验方法测定残余活性。直到50℃酶都是稳定的。在更高的温度下,其开始失活。
(c)最佳温度:
采用下述条件,于20、30、40、50、55和60℃,对来自商业来源(见实施例5)的强烈富集的(R)-泛酸内酯酶进行30分钟的培养:
100mM(R,S)-泛酸内酯
100mM MgCl2
200mM Tris/HCl,pH 8.0
0.05U(R)-泛酸内酯酶,最终体积为10μl。
在所用的条件下,来自商业化A.niger制剂的(R)-泛酸内酯酶的最佳温度为大约50℃。
(d)辅助因子依赖性和抑制:
来自A.niger的(R)-泛酸内酯酶的活性需要Mg2+或Mn2+。加入1mMEDTA会完全抑制其活性。
(e)最佳pH:
当pH在7.0至11.0之间变化时,该酶并未显示出“正常的”pH-活性曲线。在40℃,对200mM TEA-乙酸盐缓冲液(pH7.0至11.0)中的10mg Amano Lipase A进行20分钟的培养,所述缓冲液含有0.1%Span 80,20mM乙酸镁。加入等体积的500mM MES缓冲液来终止样品的反应,所述缓冲液pH为5.5,含有50mM EDTA;对样品进行离心(10,000g,10分钟),然后通过HPLC进行分析,其中,用0.46×15cm CHIRADEX柱,用70:30的水-甲醇来洗脱,1ml/分钟,20℃。最高活性在pH为大约10时达到。从这个位置到pH11.0之间,活性并无可观的改变。最高选择性在pH大约9.0时达到。
实施例6培养A.niger ATCC9142、9029、26875、62863和10864,并对 其(R)-泛酸内酯酶活性进行评测
为获知内酯酶活性是否在Aspergillus属中广泛存在,在下述条件下培养五个A.niger菌株:
培养基(相对于每升的量):1.2g NaNO3、0.5g KH2PO4、0.2gMgSO4 x 7H2O、0.5g酵母提取物、5%葡萄糖和0.04ml的痕量金属溶液,所述溶液如Vishniac和Santer,Bacteriol.Rev.21:195-213(1957)所述。
用每ml 5×106个孢子于30℃去接种11瓶中的300ml预培养物。8小时后,将预培养物加入到21发酵罐中的1.71培养基中,发酵罐带有pH和溶解氧控制。通过自动加入5M NaOH将pH保持在5.5。在低通气条件(5-10%的空气饱和度)下对细胞进行14小时的培养。之后将溶解氧水平增加至30-50%空气饱和度。5小时后,收获菌丝体,对其进行过滤,用去矿物质水洗两次,冷冻于液氮中。用French Press对其中的一部分直接进行裂解。用标准试验方法对培养基和细胞裂解液进行针对泛酸内酯酶活性的研究。
(R)-泛酸内酯酶活性主要被发现于所有被测试的A.niger菌株的裂解液中。在培养基中仅发现了非常小的活性。
实施例7对来自脂肪酶制剂的经富集的(R)-泛酸内酯酶进行胰蛋白酶消化 产生的小肽的氨基酸序列进行测定
在2D凝胶上对实施例5的经过富集的制剂进行分析。用胰蛋白酶对两个主要的点进行消化,其分别是33和40kDa,4.7和5.6的pI。通过HPLC来分离产生的肽(设备:Hewlett Packard 1090,柱:Vydac C18(0.21×25cm),210nm处吸收,流速:0.20ml/分钟,缓冲液A:0.075%TFA,缓冲液B:80%乙腈中的0.065%TFA,梯度:2%B(0-10分钟),2-75%B(10-120分钟))。通过Edman降解法来对选出的肽进行测序,点C[pI 5.6,39kDa(Poll C)]:Fxn 42(肽1)(SEQ ID NO:81)、Fxn 57(肽3)(SEQ IDNO:82)、Fx 73(肽2)(SEQ ID NO:83)、Fx 74(SEQ ID NO:84)和Fx 81(SEQ ID NO:85),点C[pI 4.7,33kDa(Poll A/B)]:N末端(SEQ ID NO:86)、Fx 58(SEQ ID NO:87)、Fx 64(SEQ ID NO:88)、Fx 65(SEQ IDNO:89)、Fx 73(SEQ ID NO:90)和Fx 68(SEQ ID NO:91)。X代表未确定的氨基酸,圆括号中的氨基酸是无法被明确确定的。
用所有短肽序列作为目标进行数据库搜索,没有得到可靠的信息能帮助确定两个主要的点中的哪一个代表着内酯酶。因此,我们利用一套阴离子交换色谱对实施例5的内酯酶制剂进行进一步的富集。在预填MonoQ柱HR 16/10(Amersham Pharmacia Biotech Europe GmbH,Dübendorf,瑞士)上,0至350mM NaCl梯度下,对蛋白质溶液(在pH 7.5的20mMTris/HCl、2.5mM MgCl2中)进行分离。对所有片断的活性进行测定。按照厂商(Invitrogen,Carlsbad,CA,USA)所述进行等电聚焦以及SDS-PAGE,对活性片断进行分析。比较SDS-PAGE凝胶和IEF得出的片断活性数据,暗示内酯酶是38至40kDa的蛋白质,pI在pH 5.6左右。该数据与点PollC吻合得非常好。因此,该点的氨基酸序列就被用于设计PCR引物和用于Southern印迹试验的寡核苷酸。收集最具有活性的片断,再在2D凝胶上进行分析,分析显示,较之之前的2D凝胶,PollC相对于PollA/B更加清楚地富集。
实施例8设计用于Southern印迹试验的简并寡核苷酸以及用于从A.niger 克隆(R)-泛酸内酯酶的PCR引物
使用来自不同Aspergillus种的12条不同的植酸酶序列,通过GCG程序包版本10.2的CODONFREQUENCY程序,得到Aspergillus的密码子使用情况,将其用于减少由于遗传密码简并性所造成的可能的不同DNA序列组合的数目。用Aspergillus密码子使用情况作为决定性因素,引物3’-末端都考虑到了每种可能的组合,但引物5’-末端就忽略了一些稀有的密码子。在用寡核苷酸进行杂交实验的情况下,用同样的方式对3’-和5’-末端进行处理。名称中含有“S(sense)”或“AS(anti-sense)”的寡核苷酸是用于PCR的。名称中不含S或AS的寡核苷酸是用于杂交实验的。
用于从A.niger中克隆(R)-泛酸内酯酶的寡核苷酸是Fxn42(SEQ IDNO:31)、Fxn42S(SEQ ID NO:32)、Fxn42AS(SEQ ID NO:33)、Fx57(SEQ ID NO:34)、Fxn57S(SEQ ID NO:35)、Fxn57AS(SEQ ID NO:36)、Fx73(SEQ ID NO:37)、Fx73S(SEQ ID NO:38)、Fx73AS(SEQ IDNO:39)、Fx74(SEQ ID NO:40)、Fx74S(SEQ ID NO:41)和Fx74AS(SEQ ID NO:42)。
实施例9从A.niger ATCC9142、A.niger NRRL3135、A.niger ssp. awamori(ATCC38854)或A.niger MacRae(ATCC46951)中分离基因 组DNA
用1×106孢子/ml去接种300ml的YPD培养基[Sherman et al.,Laboratory course manual for methods in yeast genetics,Cold Spring HarborLaoratory,Cold Spring Harbor,New York(1986)]。在猛烈振荡下(200rpm),于30℃对培养物进行过夜培养。用Whatman滤纸通过过滤收集菌丝体,用PBS(等渗磷酸缓冲液)洗,在液氮中冷冻。在冰冷的研钵中,将菌丝体磨成细粉末。将该粉末重新悬浮于1/3体积的pH8.0的50mM Tris/HCl、1.0%SDS、50mM EDTA中,于65℃频繁颠倒条件下培养15分钟。将溶液冷却至50℃。加入蛋白酶K(终浓度为100μg/ml)。将溶液在50℃培养1小时。另外加入100mg/ml的蛋白酶K,继续培养3小时。加入1/3体积的苯酚/氯仿/异戊醇(50/49/1)。彻底且轻柔的混合之后,对乳化液进行离心(12000g,20分钟,4℃)。移出水相,再次萃取。另一个离心步骤(12000g,10分钟,4℃)之后,用氯仿对水相进行萃取。向水相中加入0.7倍体积的异丙醇,轻柔混合溶液15分钟。通过离心(10000g,30分钟,4℃)收集沉淀DNA。向残留的上清液中加入1/10体积的pH5.2的3M KCl,在轻柔振荡下培养15分钟。再一次离心步骤之后,用70%的乙醇对两份沉淀洗两次,空气中干燥,溶于0.5ml水中。最后,用RNase处理DNA以去除残留的RNA。
实施例10克隆来自A.niger ATCC9142的(R)-泛酸内酯酶
按照实施例6所述来制备A.niger ATCC9142的基因组DNA(gDNA)。用来自Stratagene(Stratagene,La Jolla,CA,USA)的Robocycler Infinity作为PCR仪,用来自Roche Molecular Biochemicals(Penzberg,德国)的TAQ聚合酶试剂盒来进行PCR:
1μl gDNA(1/10稀释)        步骤1:5分钟-95℃
1μl核苷酸混合物           步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液  步骤3:30秒-50℃
1μl引物S(100pM/μl)       步骤4:1分钟-72℃
1μl引物AS(100pM/μl)
1μl来自Roche Molecular Biochemicals的TAQ聚合酶
40μl H2O
步骤2至4重复35次。
引物组合:
  编号   上游引物   下游引物   PCR产物[bp]
  1   Fxn42S   Fxn57AS   300,310
  2   Fxn42S   Fx73AS   -
  3   Fxn42S   Fx74AS   -
  4   Fxn57S   Fxn42AS   80
  5   Fxn57S   Fx73AS   580
  6   Fxn57S   Fx74AS   510
  7   Fx73S   Fxn42AS   -
  8   Fx73S   Fxn57AS   300,315,320
  9   Fx73S   Fx74AS
  10   Fx74S   Fxn42AS   180
  11   Fx74S   Fxn57AS   340
  12   Fx74S   Fx73AS   840
  13   Fxn42S   Fx57AS,Fx73AS,Fx74AS   -
  14   Fxn57S   Fxn42AS,Fx73AS,Fx74AS-   580
  15   Fx73S   Fxn42AS,Fxn57AS,Fx74AS   -
  16   Fx74S   Fxn42AS,Fxn57AS,Fx73AS   350
对所有引物都会进行关于自身锚定(self-priming)的检查。Fxn57AS是唯一会产生相当数量自身结合产物的引物,自身锚定产物为大约300至320bp。用55℃的杂交温度,PCR 5、6、8、10和11仍会产生一条或多条产物。60℃下采用30秒扩增和30个循环,PCR 5、6、8、10和11仍会产生一条或多条与较低杂交温度下产生的条带相对应的PCR产物。
用来自Qiagen(Qiagen,Hilden,德国)的QIAEX II凝胶抽提试剂盒从琼脂糖凝胶中分离出PCR反应12的840bp的产物,将其溶于40μl H2O中。
1μl 840bp的片段(1/10稀释)        步骤1:5分钟-95℃
1μl核苷酸混合物                  步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液         步骤3:30秒-55℃
1μl引物S(10pMol/μl)             步骤4:30秒-72℃
1μl引物AS(10pMol/μl)
1μl来自Roche Molecular Biochemicals的TAQ聚合酶
40μl H2O
步骤2至4重复30次。
使用了反应2、5、10、11和12的引物组合。除反应2之外,其它所有反应都有PCR产物产生。这意味着引物42S/AS、57S/AS、73S/AS和74S/AS的序列是840bp片段的部分。这四对引物的高度接近性强烈预示,840bp的片段是感兴趣的内酯酶基因的一部分。这种假设得到了测序的支持。肽Fx57(SEQ ID NO:90)的氨基酸序列在840bp的片段中得到了证实,而肽Fxn42(SEQ ID NO:45)的序列仅得到了部分证实。
还可以分离出A.niger MacRae的相应DNA片段。关于A.awamori的情况,通过该方法仅能分离出引物Fxn57S和Fx73AS的产物。上述Aspergillus的序列在DNA水平上与A.niger ATCC9142的序列具有大约90%的相同性。
为分离内酯酶基因的5’-和3’-末端,使用下述方法:
(a)分离3’-末端:
1μl A.niger ATCC9142的gDNA        步骤1:5分钟-95℃
1μl核苷酸混合物                   步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液          步骤3:30秒-55℃
1μl引物Oal2AS或Oal3S(10pMol/μl)  步骤4:30秒-72℃
1μl来自Roche Molecular Biochemicals的TAQ聚合酶
41μl H2O
步骤2至4重复30次。
用等体积的苯酚/氯仿对PCR混合进行两次萃取,再用氯仿单独进行一次。然后通过加入1/10体积的pH5.2的3M乙酸钾和2倍体积的乙醇沉淀出DNA。15分钟的离心(Eppendorf板式离心管中,14000rpm)之后,用70%的乙醇洗沉淀,空气干燥,最终溶于20μl灭菌水中。
第二次PCR:
4μl来自第一次PCR的DNA                步骤1:5分钟-95℃
1μl核苷酸混合物                      步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液             步骤3:30秒-58℃
1μl引物Oal4S或Oal1AS(10pMol/μl)     步骤4:1分钟-72℃
1μl来自Roche Molecular Biochemicals的High Fidelity Mix
38μl H2O
步骤2至4重复35次。
用Oal4S引物,产生了一段900bp的DNA分子。测序显示其编码基因的3’-末端。
(b)分离5’-末端:
用DIG标记过的寡核苷酸Fxn42、Fxn57、Fx73和Fx74作为探针,使用带有X-光胶片化学荧光探测的DIG系统(Roche MolecularBiochemicals),对A.niger ATCC9142的基因组DNA进行杂交实验。杂交和探测按照厂商的推荐来进行。
用BamHI、EcoRI、HindIII、PstI、SacI和XhoI来对10μg的基因组DNA进行消化。用Roche Molecular Biochemicals杂交溶液在42℃进行过夜杂交。室温用2x SSC、0.1%SDS进行两次洗涤步骤之后,接着在50℃用0.5x SSC、0.1%SDS再进行两次洗涤步骤。用CSPD(Disodium 2-chloro-5-(4-methoxyspiro{1,2-dioxetane-3,2’-(5’-chloro)tricyclo[3.3.1.13,7]decan}-4-yl)-1-phenyl phospate)作为底物,对碱性磷酸酶进行探测,之后将X-光胶片曝光于滤光器(filter)1小时。胶片上没有合用的信号。
因此,使用反应5和11的随机锚定的DIG标记过的PCR产物(见实施例11)作为探针。按照同样的方法来进行杂交,只是洗涤条件稍微改变为室温下2×5分钟,55℃下2×15分钟。胶片上显示了下述条带:
  限制性酶   340bp的探针[kb]   580bp的探针[kb]
  BamHI   10   10/2.8
  EcoRI   4.5   4.5/5.2
  HindIII   4.2/6.5   3.0/4.2/6.5
  PstI   4.4   2.8/4.4
  SacI   23   23/3.9
  XhoI   6   6/20
为克隆整个基因或至少是其缺失的5’-末端,根据杂交实验,用HindIII对A.niger ATCC9142的染色体DNA进行消化,产生出大约4kb的含有内酯酶基因的片段,实验方法如下:
20μl染色体DNA
20μl10x缓冲液
5μl HindIII(10U/μl)
175μl H2O
在37℃培养16小时。
用来自Qiagen(Qiagen,Hilden,德国)的PCR纯化试剂盒对经过消化的DNA进行纯化,并洗脱为100μl。下述连接反应在16℃过夜进行。将经过纯化的DNA用水稀释到2ml。按照厂商(Roche MolecularBiochemicals)推荐加入连接酶和连接酶缓冲液。连接完成的溶液被用作模板,进行不同的PCR,其中使用经部分分离的内酯酶基因的内部引物:
5μl连接反应溶液                步骤1:5分钟-95℃
1μl核苷酸混合物                步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液       步骤3:30秒-55℃
1μl sense引物(10pMol/μl)      步骤4:3分钟-72℃
1μl anti-sense引物(10pMol/μl)
1μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液
40μl H2O
步骤2至4重复32次。
四种引物组合,Oal3S/Fxn57AS、Oal4S/Fxn57AS、Oal3S/Oal8AS和Oal4S/Oal8AS,都能产生单条4kb的DNA片段。所有引物对都定向于基因的外部。因此,内酯酶基因应该位于作为自连接HindIII片段的环状DNA分子上。
用来自Qiagen的QIAEX II凝胶抽提试剂盒从凝胶中分离出片段,按照厂商(Applied Biosystems,Foster City,CA,USA)推荐的二去氧方法,用ABI 310Genetic Analyzer来进行测序。获得的序列证实,分离出的片段含有来自A.niger ATCC9142的(R)-泛酸内酯酶基因的两个末端。
用引物Oall0S和Oal12AS,也可能分离出A.niger ssp.awamori的同源基因,其中含有与所有被测出的肽完全一样的氨基酸序列。唯一的区别仅在于肽Fxn42的序列。此时Fxn42来自对两个肽的测序。最可能的情况是,当进行HPLC来分离经过消化的酶片段时,同时洗脱出了两个不同的肽。测序首先仅揭示了主要的肽的序列,但其却带有很强的背景。对第一个肽的测序完成后,剩下的就是第二个肽的序列,其具有另外四个氨基酸:
a)K-P-F-A-H-Q-V-K(SEQ ID NO:43)和
b)R-H-H-N-A-P-A-P-T-P-E-D-P-E-R-R(SEQ ID NO:44)给出
K-P-F-A-H-Q-V-K-T-x-E-D(SEQ ID NO:45),其为Fxn 42。
这还解释了为何基于肽Fxn42的寡核苷酸Fxn42S和Fxn42AS无法给出合用的结果。根据氨基酸序列,来自菌株ATCC9142的蛋白质具有36573Da的分子量,280nm处估计的吸光率为1.83(1mg/ml蛋白质溶液),而来自A.niger ssp.awamori的氨基酸序列的分子量被计算为36547Da,对1mg/ml蛋白质溶液而言,估计的E280nm为1.831(Pace et al.,1995)。
实施例11对来自A.niger ATCC 9142的(R)-泛酸内酯酶基因进行克隆和 表达
对按照实施例10中所述的全部三种方法获得的序列进行比较,将其进行装配,产生一条连续的覆盖整个内酯酶基因的2443bp的序列。为测定该基因的起始密码子、终止密码子和可能的内含子,将从来自商业制剂的纯化基因得到的肽的可获得的氨基酸序列,与GCG程序包版本10.2的两个程序TESTCODE和CODONPREFERENCE获得的结果联合使用。虽然按照同样的方式两个程序都测定出了终止密码子和一个内含子,而起始密码子却并不明显,具体而言,因为没有肽Fx74(SEQ ID NO:84)的其它可获得的N-末端已被测序的肽。对数据库搜索期间发现的向同源氨基酸序列的所有可能的翻译进行的比较也没有帮助,因为蛋白质的N-末端部分是完全异源的。因此,在肽Fx74的位置上游但仍在同一个阅读框内发现的两个甲硫氨酸残基被选出,将其用于构建不同的表达盒。在SEQ IDNO:7的666-742号碱基对之间发现了富含CT的区域。然而,该富含CT的区域的位置并非像起始密码子那样真正地偏好Met而不是其它氨基酸,因为在真菌中该区域与起始密码子之间的距离通常有相当大的变化。此外,在基因的下游鉴定出了可能的聚腺苷化位点。
对来自A.niger ATCC9142的基因的72bp长的内含子而言,从第976至981位核苷酸的DNA段最可能代表5’-剪切位点,从第1029至1035位或从1016至1022位核苷酸的段最可能代表推测出的内部保守序列(consensus sequence),从第1045至1047位核苷酸的DNA段最可能代表3’-剪切位点(SEQ ID NO:7)。A.niger MacRae基因的相应序列在51bp长的内含子(SEQ ID NO:79)中定位于bp 32至37、66至72、以及80至82。对A.niger ssp.awamori的oal基因的50bp长的内含子而言,5’-剪切位点始自第203位核苷酸(GTGCCC),内部保守区域在第236位核苷酸处(AACTAAC),3’-剪切位点在第250位核苷酸处(CAG)(SEQID NO:9)。
  oal的内含子   长度   5’-位点   内部位点   3’-位点
  A.niger ATCC 9142   72   GTACCC   ACCTAAC   TAG
  A.niger MacRae   51   GTAATC   AACTAAC   CAG
  A.niger ssp awamori   50   GTGCCC   AACTAAC   CAG
5’-剪切位点的保守序列是GTPuNGPy。列出的位点中没有一个在第5位有G。用于套索(lariat)形成的内部位点的酵母的保守序列是TACTAAC。3’-剪切位点具有PyAG的保守序列[Unkles,Gene organizationin industrial filamentous fungi.In Applied molecular genetics of filamentousfungi(Kinghoun,ed.),pp.28-53.Blackie Academic&Professional,WesterCleddens Road,Bishopbriggs,Glasgow G64 2NZ,UK,Glasgow(1992)]。
产生了下述cDNA:
-用于在E.coli中表达的oal(SEQ ID NO:98)
-用于在Saccharomyces cerevisiae中表达的oalEco(SEQ ID NO:94)
-用于在S.cerevisiae中表达的oalEShort(用SEQ ID NO:95的第32位处的第二个可能的Met的31个氨基酸的较短的版本)
-用于在E.coli中表达的oalS(oalS被制成是因为Fxn42肽的令人误解的序列,其最终被鉴定为人工产物)
-用于在S.cerevisiae中表达的oalSEco
-用于在E.coli中表达的含有C-末端his-标签的oalhis
-用于在S.cerevisiae中表达的oalEhis
-用于在E.coli中表达的含有N-末端his-标签的oalNhis(SEQ IDNO:92)
-用于在S.cerevisiae中表达的oalENhis(SEQ ID NO:96)(构建体oalsec,其含有A.terreus cbs的植酸酶的信号肽,该信号肽用于在S.cerevisiae中的表达和分泌)
通常的工序:
首先,在两次PCR中分离出oal基因的假设编码序列(cDNA)。通过第三次PCR将两种PCR产物装配起来。使用下述引物:
Oal1AS(SEQ ID NO:46)、Oal2AS(SEQ ID NO:47)、Oal3S(SEQ ID NO:48)、Oal4S(SEQ ID NO:49)、Oal5S(SEQ ID NO:50)、Oal6AS(SEQ ID NO:51)、Oal7AS(SEQ ID NO:52)、Oal8AS(SEQ ID NO:53)、Oal9AS(SEQ ID NO:54)、Oall 0S(SEQID NO:55)、Oal10SEco(SEQ ID NO:56)、OalENhis(SEQ ID NO:57)、Oal10SShis(SEQ ID NO:58)、Oal11S(SEQ ID NO:59)、Oal12AS(SEQ ID NO:60)、Oal12ASEco(SEQ ID NO:61)、Oal12AShis(SEQ ID NO:62)、Oal12ASHisEco(SEQ ID NO:63)、Oal13S(SEQ ID NO:64)、Oal13AS(SEQ ID NO:65)、Oal14S(SEQID NO:66)、Oal14AS(SEQ ID NO:67)、Oal15S(SEQ ID NO:68)、Oal15AS(SEQ ID NO:69)、Oal16S(SEQ ID NO:70)(第二个Met)、OalsecS(SEQ ID NO:71)、OalsecAS(SEQ ID NO:72)、pQE80EcoS(SEQ ID NO:73)、pQE80EcoNhisS(SEQ ID NO:74)、pQE80BamAS(SEQ ID NO:75)、pQE80BamhisAS(SEQ ID NO:76)、pQE80EcoSshort(SEQ ID NO:77)和CP-a(SEQ ID NO:78)。
Oal11S直接始自起始密码子的更为上游的位点前面,而Oal9AS始自假设的终止密码子下游若干核苷酸处。为能在第三次PCR中不用内含子将得到的两种PCR产物装配起来,Oal14S和Oal14AS是互补的,其含有从外显子I的终点到外显子II的起点之间的序列。
1μl gDNA(1/10稀释)            步骤1:5分钟-95℃
1μl核苷酸混合物               步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液      步骤3:30秒-55℃
1μl Oal11S(10pMol/μl)        步骤4:1分钟-72℃
1μl Oal14AS(10pMol/μl)
1μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液40μl H2O
步骤2至4重复35次。
1μl gDNA(1/10稀释)        步骤1:5分钟-95℃
1μl核苷酸混合物           步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液  步骤3:30秒-55℃
1μl Oal14S(10pMol/μl)    步骤4:1分钟-72℃
1μl Oal9AS(10pMol/μl)
1μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液40μl H2O
步骤2至4重复35次。
对A.niger ATCC9142的gDNA进行的PCR给出了具有期望大小的PCR产物。通过琼脂糖凝胶电泳对PCR产物进行纯化。用来自Qiagen(Qiagen,Hilden,德国)的QIAEX II试剂盒从凝胶中提取出PCR产物,将其用于第三次PCR:
PCR产物1和2各0.5μl            步骤1:5分钟-95℃
1μl核苷酸混合物               步骤2:30秒-95℃
5μl带Mg2+的PCR标准缓冲液      步骤3:30秒-55℃
1μl Oal12S(10pMol/μl)        步骤4:1分钟-72℃
1μl Oal10AS(10pMol/μl)
1μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液40μl H2O
步骤2至4重复30次。
通过琼脂糖凝胶电泳对终产物进行纯化,从凝胶中提取出来,并按照Invitrogen(carlsbad,CA,USA)提供的方法将其克隆进TA-载体,用于对PCR产物进行直接克隆。所有其它必需的克隆步骤都按照Sambrook et al.(1989)所述来进行。通过测序检测出来的含有正确插入(oal1)的质粒在所有后续的构建步骤中被用作模板。
(a)用于在E.coli和Saccharomyces cerevisiae中表达的构建体oal和oalEco:按照下述方案,用引物pQE80EcoS和pQE80BamAS对oal1进行PCR,以产生构建体Eco-oal-Bam:
1μl含有作为插入的oal1的质粒(10ng)
1μl核苷酸混合物
5μl带Mg2+的PCR标准缓冲液
1μl pQE80EcoS(10pMol/μl)
1μl pQE80BamAS(10pMol/μl)
1μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液40μl H2O
步骤1:5分钟-95℃
步骤1:30秒-95℃
步骤1:30秒-55℃
步骤4:1分钟-72℃
步骤2至4重复30次。
通过琼脂糖凝胶电泳对PCR产物进行纯化,从凝胶中提取人们感兴趣的片段(QIAEX II,Qiagen),用EcoRI和BamHI进行消化,用琼脂糖凝胶电泳再次进行纯化,将其连接到来自Qiagen的载体pQE80上,转化进E.coli Top10。分离出四个克隆的质粒,对插入进行测序。含有正确构建体的质粒被转化进E.coli M15或相当的E.coli菌株。所有分子技术都是技术人员已知的标准技术。
对酵母表达构建体而言,将所用的引物换为Oal10EcoS和Oal12ASEco,用EcoRI对PCR产物进行单独消化,通过载体上的EcoRI限制性位点,将终产物克隆进pYES2或用于S.cerevisiae的相当的表达载体。按照Hinnen et al.,Proc.Natl.Acad.Sci.USA 75:1929-1933(1978)或按照与菌株同时提供的说明书,来进行对S.cerevisiae菌株,例如INVScl(Invitrogen,Carlsbad,CA,USA)的转化。
(b)用于在E.coli中表达的构建体pQE80oalS(用第二个可能的Met的31个氨基酸的减短版本):
用跟上述内容一样的PCR方案,用同样的模板,引物用pQE80EcoSshort和pQE80BamAS。按照(a)中所述对PCR反应完成之后的反应液进行处理。
(c)用于在S.cerevisiae中表达的构建体oalS:
使用引物Oal16S和Oal12ASEco。其它都按照(a)中所述来进行。
(d)用于在E.coli中表达的含有C-末端his-标签的构建体pQE80oalhis:
使用引物pQE80EcoS和pQE80BamhisAS来进行PCR,见(a)。
(e)用于在S.cerevisiae中表达的构建体oalhis:
使用引物Oal10Seco和Oal12ASHisEco来进行PCR,见(a)。
(f)用于在E.coli中表达的含有N-末端His-标签的构建体pQE80oalNhis:
使用引物pQE80EcoNhisS和pQE80BamAS来进行PCR(见a)。
(g)用于在S.cerevisiae中表达的构建体oalENhis:
使用引物OalENhis和Oal12ASEco来进行PCR(见a)。
(h)构建体oalsec,其含有A.terreus cbs的植酸酶的信号肽,该信号肽用于在S.cerevisiae中的表达和分泌:
用三次独立的PCR来制备该构建体。首先,通过对保守植酸酶基因进行PCR分离出信号序列[Lehmann et al.,Protein Eng.13:49-57(2000)]。
1.0μl含有作为插入的保守植酸酶基因的质粒(10ng)
1.0μl核苷酸混合物
5.0μl带Mg2+的PCR标准缓冲液
1.0μl CP-a(10pMol/μl)
1.0μl OalsecAS(10pMol/μl)
1.0μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液
40μl H2O
步骤1:5分钟-95℃
步骤1:30秒-95℃
步骤1:30秒-55℃
步骤4:30秒-72℃
步骤2至4重复30次。
1.0μl含有oal1基因的质粒(10ng)
1.0μl核苷酸混合物
5.0μl带Mg2+的PCR标准缓冲液
1.0μl OalsecS(10pMol/μl)
1.0μl Oal12ASEco(10pMol/μl)
1.0μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液
40μl H2O
步骤1:5分钟-95℃
步骤1:30秒-95℃
步骤1:30秒-55℃
步骤4:45秒-72℃
步骤2至4重复30次。
通过在1.5%的琼脂糖凝胶上进行琼脂糖凝胶电泳来纯化PCR产物,从凝胶中提取PCR产物(QIAEX II,Qiagen),将其用于第三次PCR:
0.5μl PCR1的产物
05μl PCR2的产物
1.0μl核苷酸混合物
5.0μl带Mg2+的PCR标准缓冲液
1.0μl CP-a(10pMol/μl)
1.0μl Oal12ASEco(10pMol/μl)
1.0μl来自Roche Molecular Biochemicals的High Fidelity聚合酶混合液
40μl H2O
步骤1:5分钟-95℃
步骤1:30秒-95℃
步骤1:30秒-55℃
步骤4:1分钟-72℃
步骤2至4重复30次。
通过琼脂糖凝胶电泳对PCR产物进行纯化,从凝胶中提取出PCR产物,用EcoRI进行消化,再次用琼脂糖凝胶电泳进行纯化,按照上述连接到S.cerevisiae表达载体中。
实施例12 oal的表达
(a)在E.coli中:
在E.coli M15中表达pQE80oal、pQE80oalS、pQE80oalhis和pQE80oalNhis,所述E.coli M15含有pREP4,其含有lac启动子的阻遏子(见德国,Hilden的Qiagen的表达说明书)。将过夜培养物稀释至600nm的OD为0.1,在30℃培养至OD600nm为1.5。然后用0.5mM IPTG诱导培养物,再在30℃培养6小时。通过离心(5000g,20分钟)收获细胞,冷冻于-80℃。按照厂商提供的方案,用B-PER(Pierce,Rockford,IL,USA)对它们进行裂解。再一次离心步骤之后,将上清液用于对(R)-泛酸内酯的水解。
在含有构建体pQE80oalS和pQE80oalhis的转化子中,上清液和细胞裂解液中都没有发现活性,而用构建体pQE80oal和pQE80oalNhis的情况下,可溶蛋白质中的大约5%是具有活性的(R)-泛酸内酯酶。
用与没有His-标签的基因同样的方法,来表达含有N-末端His-标签的构建体。用来自Qiagen(Hilden,德国)的“QIAexpressionist”所述的方案,从细胞裂解液中对天然形式的加上His-标签的蛋白质进行纯化。
(b)在S.cerevisiae中:
构建体oalEco、oalES、oalEhis、oalENhis和oalsec在S.cerevisiaeINVScl或类似相当的菌株中表达。转化并在SDura-培养基[Sherman et al.,Laboratory course manual for methods in yeast genetics,Cold Spring HarborLaboratory,Cold Spring Harbor,New York(1986)]上涂布之后,在30℃对平板进行3至4天的培养,捡出培养出的菌落,将其转移至2ml SDura-液体培养基中,在猛烈振荡下于30℃培养3天。上述培养物被用作为25mlSDura-培养基的预培养物。在猛烈振荡下于30℃再培养3天后,用制备的培养物[Sherman et al.,如上所述]接种21瓶中的500ml YPD培养基。再在相同条件下培养3天之后,通过离心从培养基中分离出细胞,用Y-PER(Pierce,Rockford,IL)进行裂解。
如在E.coli中表达的情况一样,仅有oalEco和oalENhis构建体导致了活性(R)-泛酸内酯酶的表达,其仅在细胞裂解液中被发现。用75ml YPD培养物,也可以产生300U的(R)-泛酸内酯酶。相应的裂解液显示大约5U/mg总蛋白的比活性。
用上述内含子位置的序列数据,还可用类似的方式对来自A.awamori的oal基因和来自A.niger ATCC46951的oal基因进行构建和表达。
实施例13对在E.coli或S.cerevisiae中异源表达的Oal进行固定,以及 将其用于对(RS)-泛酸内酯的水解拆分
为在生物反应器中发挥多种用途,对来自A.niger的(R)-泛酸内酯酶进行固定。在E.coli或S.cerevisiae中表达之后,通过化学手段,例如B-PER(E.coli)或Y-PER(S.cerevisiae)(Pierce,Rockford,IL,USA),或通过机械手段例如超声波或高压对细胞进行破碎。通过离心来澄清裂解液。将制剂直接用于固定。或者,在固定之前,用另一项纯化步骤,例如硫酸铵沉淀,来进一步地增加Oal比活性。
按照下述方法来固定该生物催化剂:
(1)在二氧化硅溶胶凝胶(Silica Sol-Gel)上固定:
按照文献[Gill and Ballesteros,J.Am.Chem.Soc.120:8587-8598(1998)]所述来制备聚(硅酸甘油)-1.0(PGS-1.0),将其溶于其质量一半的冰冷的水中。取其中100或200mg的部分,与50或100mg冰冷的生物催化剂贮存液制剂(来自若干制剂的可溶的酶)彻底地混合,混合于2ml或5ml小瓶中的50mM磷酸盐中进行,pH7.0,将小瓶轻柔旋转2分钟,以在瓶壁上形成水凝胶的薄层。将小瓶置于冰上20分钟,然后(开启)转移至冰箱。水凝胶在5℃成熟48-72小时,以形成干凝胶(xerogel)。通过在5℃以100rpm振荡,用2×1或2×4ml pH为7的50mM磷酸缓冲液来洗涤有干凝胶的小瓶,然后是2×1或2×4ml pH为7的50mM TEA-乙酸盐,其中含有10mM乙酸镁。
(2)将Oal固定于二氧化硅聚乙烯醇溶胶凝胶(Sol-Gel Silica-Polyvinyl Alcohol)上:
方法与(1)中类似,不同之处是在与内酯酶贮存液结合之前,DGS溶液要与恰当数量的聚乙烯醇(PVA,来自Aldrich,13%w/w的水中的85K)混合。后续方法如(1)所示。
(3)将Oal固定到用戊二醛活化并支持的聚乙烯亚胺上:
将聚乙烯亚胺(1g,无水,高分子量,分支聚合物,来自Aldrich)、CA(0.2g,36%Ac)和乙酸丁酸纤维素(0.2g,48%的乙酸和丁酸含量,来自Aldrich)溶于5mL的二氯甲烷中,用溶液对7g漂白土(Fullers Earth,30-60目,来自Aldrich)进行包衣。经过湿包衣的材料在空气中于室温下干燥0.5小时,直到给出大约9g的被包衣的漂白土。然后将其重新悬浮于戊二醛(8mL,50%w/w,来自Aldrich)和磷酸缓冲液(50mL,50mM,pH 8)的冰冷的混合物中,以200rpm搅拌2小时。用水洗(4×10mL)经过活化的支持物,然后用磷酸缓冲液洗(4×10mL,20mM,pH 8),然后排出液体。将湿的支持物与冰冷的内酯酶贮存液(50mM磷酸中,pH8)混合,以200rpm对悬浮液进行20-30小时的搅拌。将液体从被固定的酶上轻柔移走,用磷酸盐洗(3×5mL)湿的固定物,用乙醇胺(20mL,20mM,pH 8)进行处理,再用磷酸盐洗(2×5mL,20mM,pH 7),然后排出液体。
(4)用于对(RS)-泛酸内酯进行水解拆分的反应条件
反应在2或4mL的小瓶中进行,其中使用50或100mg的生物催化剂以及1或2mL的0.5M外消旋内酯(在0.75M三乙胺-乙酸盐中,pH8.5,含有20mM的乙酸镁)。将小瓶在40℃、200rpm下培养必需的时间段,将溶液排出,并用手性HPLC进行分析,在开始下一次循环之前用新鲜的底物溶液洗(2×1或2mL)催化剂。用等体积的500mM MES缓冲液来终止用于分析的样品的反应,所述缓冲液pH为5.5,其中含有50mM EDTA,离心(10000g,10分钟)然后通过HPLC进行分析,其中使用0.46×15cm的CHIRADEX柱,用70∶30的水-甲醇进行洗脱,1mL/分钟,在20℃进行。在15分钟的时候对初始速度进行测量,在每个循环的末尾测定E值。
表2中概括了选用的被固定的酶制剂在对(RS)-泛酸内酯进行分批拆分过程中的作用。溶胶凝胶和共价固定方案都被证明为有效的,甚至在24个每批为1小时的循环后,催化剂保留了其初始活性的62-72%,并显示出:对映异构体的过量(excess)值和对(R)-泛酸内酯的对映体选择性分别为89-98%和71-88%。此外,当延长批次进行的时间进行试验时,催化剂运作方式也是非常相似的,即当每批反应进行一天而不是1小时的情况下,其展示出了良好的长时间操作稳定性。
表2:通过被固定的内酯酶制剂对(RS)-泛酸内酯进行分批拆分
Figure G04808504219960328D000341
催化剂*:Biocatalyst/Prod.Organism(Recomb.Activity)
实施例14被固定的由重组E.coli表达的Oal对(RS)-泛酸内酯进行连续 拆分的应用
按照实施例14(2)中所述来制备的经溶胶凝胶-PVA固定的重组内酯酶生物催化剂(E.coli中表达的),被用于在填充床(packed-bed)反应器中对外消旋内酯进行连续拆分:将被固定的生物催化剂(1.1g,0.21kUg-1,总共0.231kU)干填入带有Teflon末端(endpiece)的0.46×15cm的Omnifit加套玻璃柱中。其与1×10cm的Omnifit加套玻璃柱相连,1×10cm的玻璃柱中填有1-2mm的纤维素珠,其是通过两个装有50mL玻璃/Teflon注射器的注射器泵填入的。这些柱都与循环水浴相连,拆分进行期间被保持在40℃。按照下述方法对反应器进行调节:室温下以5mL min-1的速率加入Tris-乙酸盐缓冲液(100mM,pH 7,含有100mM乙酸镁),进行30分钟;接着是在室温下以1∶1的体积比,2mL min-1的总流速,加入外消旋内酯溶液(水中1.5M)和Tris-乙酸缓冲液(2.5M,pH8.25,含有50mM乙酸镁)的组合,进行30分钟。然后将流速降为1.2mL min-1,将柱子加热到40℃,系统被允许平衡15分钟。因此对反应器进行了大约45分钟的操作,在冰浴上收集洗脱液,在此条件下,以46-48%的不变的转化率对总共52.7mL的进料物(相当于5.14g RSPL)进行了处理。用硫酸(10%v/v水溶液)将洗脱液的pH调为6.5,用二氯甲烷对溶液进行萃取(10×75mL),有机层在无水硫酸镁上干燥,旋转式蒸发,产生由10%的RPL和90%的SPL(由手性HPLC分析得出)组成的(S)-泛酸内酯富含物(2.67g,理论上98%)。用硫酸(40%w/w)对水相进行酸化,至pH1.5,加热至70℃,1小时,再在冰上冷却,用氯化钠饱和,然后用二氯甲烷萃取(10×75mL),有机层在无水硫酸镁上干燥,旋转式蒸发,产生(R)-泛酸内酯富含物(2.23g,理论产量92%),其对映异构体纯度为93%。对(R)-/(S)-的组合回收率为95%。
实施例(13)和(14)的结果清楚地表明,重组内酯酶对于水解拆分外消旋泛酸内酯来说是有效的生物催化剂,该催化剂还可被有效固定,固定物可用于生产对映异构过量达90-98%的高度富集的(R)-泛酸内酯,不管是分批操作还是连续操作的情况下都如此。
实施例15克隆和表达来自B.subtilis的(S)-泛酸内酯特异性内酯酶
用来自牛和马肝脏的内酯酶的氨基酸序列,我们发现了若干种其它显示与上述序列具有有限同源性的序列。通过PCR将它们中间来自B.subtilis的yvre基因(YVRE BACSU,被注释为SMP30/CGR1家族的成员/假设的33.2kDa蛋白)从基因组DNA中克隆出来,其中使用的引物的5’和3’-末端还含有后续向表达载体中克隆的步骤所需要的限制性位点(EcoRI和PstI)。PCR条件与从A.niger的基因组DNA分离oal基因(见实施例8)所用的条件相同。用EcoRI和PstI来消化PCR产物和载体(来自Stratagene(La Jolla,CA,USA)的PET41a),通过琼脂糖凝胶电泳来纯化,连接,并将其转化进E.coli Top10细胞(Stratagene,La Jolla,CA,USA)。使用该种策略,该基因被融合进来自E.coli的GST蛋白基因的阅读框中。
根据厂商提供的方案来进行表达和纯化。用其中额外含有5mM CaCl2的标准试验在40℃来测定被纯化的蛋白质的活性。该酶显示了对(S)-泛酸内酯的非常高的选择性。该制剂具有相对于每mg富集融合蛋白1-2U的比活性。该酶仅在Mg2+或Ca2+离子存在的情况下具有活性。
序列表
<110>帝斯曼知识产权资产管理有限公司
<120>新颖的酶
<130>21717
<160>99
<170>PatentIn version 3.1
<210>1
<211>900
<212>DNA
<213>Equus caballus
<220>
<221>CDS
<222>(1)..(900)
<223>
<400>1
atg tct tcc att aag att gag tgt gtt ctg ccc gag aac tgc cag tgc    48
Met Ser Ser Ile Lys Ile Glu Cys Val Leu Pro Glu Asn Cys Gln Cys
1               5                   10                  15
ggt gag tcg cca gtg tgg gag gaa gcg tcc agc tct ctg ctc ttc gta    96
Gly Glu Ser Pro Val Trp Glu Glu Ala Ser Ser Ser Leu Leu Phe Val
            20                  25                  30
gat att cct gcc aaa aag gtt tgc cgg tgg gat gcg ctc agc aag caa    144
Asp Ile Pro Ala Lys Lys Val Cys Arg Trp Asp Ala Leu Ser Lys Gln
        35                  40                  45
gtg cag cga atg acc gtg gat gcc ccg gtt ggc tca gtg gcc ctc cgc    192
Val Gln Arg Met Thr Val Asp Ala Pro Val Gly Ser Val Ala Leu Arg
    50                  55                  60
cag tcg gga ggc tat gtc gcc aca att gga acg aag ttc tgt gct ttg    240
Gln Ser Gly Gly Tyr Val Ala Thr Ile Gly Thr Lys Phe Cys Ala Leu
65                  70                  75                  80
aac tgg gaa gat cag tca gta gtt gtc ctg gcc gcg gta gag aaa gac    288
Asn Trp Glu Asp Gln Ser Val Val Val Leu Ala Ala Val Glu Lys Asp
                85                  90                  95
aag aaa aac aat cga ttc aat gac ggg aag gtg gat ccc gcg ggg aga    336
Lys Lys Asn Asn Arg Phe Asn Asp Gly Lys Val Asp Pro Ala Gly Arg
           100                 105                 110
tac ttt gct ggc acc atg gct gag gaa aca gcc ccg gca gtt acg gag    384
Tyr Phe Ala Gly Thr Met Ala Glu Glu Thr Ala Pro Ala Val Thr Glu
        115                 120                 125
cgg cac caa ggg tcc ctg tac gcc ctc ttt cct gac cac cac gtg gaa    432
Arg His Gln Gly Ser Leu Tyr Ala Leu Phe Pro Asp His His Val Glu
    130                 135                 140
aag tac ttt gac cag gtg gac atc tcc aac ggt ttg gat tgg tcc ctg    480
Lys Tyr Phe Asp Gln Val Asp Ile Ser Asn Gly Leu Asp Trp Ser Leu
145                 150                 155                 160
gac cac aaa atc ttc tat tac atc gac agc ctg tcc tac tct gtg gat    528
Asp His Lys Ile Phe Tyr Tyr Ile Asp Ser Leu Ser Tyr Ser Val Asp
                165                 170                 175
gcc ttt gac tatgac ctg ctg aca gga agg atc tct aac cgc aga agt    576
Ala Phe Asp Tyr Asp Leu Leu Thr Gly ArgIle Ser Asn Arg Arg Ser
            180                 185                 190
gtt tac aag ctg gag aag gaa gaa cat atc cca gat gga atg tgt att    624
Val Tyr Lys Leu Glu Lys Glu Glu His Ile Pro Asp Gly Met Cys Ile
        195                 200                 205
gat act gag ggg aag ctc tgg gtg gcc tgt tac aac gga gga aga gtg    672
Asp Thr Glu Gly Lys Leu Trp Val Ala Cys Tyr Asn Gly Gly Arg Val
    210                 215                 220
att cgt tta gat cct gag aca ggg aaa aga ctc caa act gtg aag ttg    720
Ile Arg Leu Asp pro Glu Thr Gly Lys Arg Leu Gln Thr Val Lys Leu
225                 230                 235                 240
cct gtt gat aaa acc act tcg tgc tgc ttc gga ggg aag gat tac tct    768
Pro Val Asp Lys Thr Thr Ser Cys Cys Phe Gly Gly Lys Asp Tyr Ser
                245                 250                 255
gaa atg tac gtg acc tgc gcc cgg gct gga ctc gac ccc gag gct ctc    816
Glu Met Tyr Val Thr Cys Ala Arg Ala Gly Leu Asp Pro Glu Ala Leu
            260                 265                 270
tcg cgg cag cct gaa gct ggt ggc att ttc aag ata act ggc ctg ggg    864
Ser Arg Gln Pro Glu Ala Gly Gly Ile Phe Lys Ile Thr Gly Leu Gly
        275                 280                 285
gtc aaa gga att cct ccc tat gcc tac gca gga tga                    900
Val Lys Gly Ile Pro Pro Tyr Ala Tyr Ala Gly
    290                 295
<210>2
<211>299
<212>PRT
<213>Equus caballus
<400>2
Met Ser Ser Ile Lys Ile Glu Cys Val Leu Pro Glu Asn Cys Gln Cys
1               5                   10                  15
Gly Glu Ser Pro Val Trp Glu Glu Ala Ser Ser Ser Leu Leu Phe Val
            20                  25                  30
Asp Ile Pro Ala Lys Lys Val Cys Arg Trp Asp Ala Leu Ser Lys Gln
        35                  40                  45
Val Gln Arg Met Thr Val Asp Ala Pro Val Gly Ser Val Ala Leu Arg
    50                  55                  60
Gln Ser Gly Gly Tyr Val Ala Thr Ile Gly Thr Lys Phe Cys Ala Leu
65                  70                  75                  80
Asn Trp Glu Asp Gln Ser Val Val Val Leu Ala Ala Val Glu Lys Asp
                85                  90                  95
Lys Lys Asn Asn Arg Phe Asn Asp Gly Lys Val Asp Pro Ala Gly Arg
            100                 105                 110
Tyr Phe Ala Gly Thr Met Ala Glu Glu Thr Ala Pro Ala Val Thr Glu
        115                 120                 125
Arg His Gln Gly Ser Leu Tyr Ala Leu Phe Pro Asp His His Val Glu
    130                 135                 140
Lys Tyr Phe Asp Gln Val Asp Ile Ser Asn Gly Leu Asp Trp Ser Leu
145                 150                 155                 160
Asp His Lys Ile Phe Tyr Tyr Ile Asp Ser Leu Ser Tyr Ser Val Asp
                165                 170                 175
Ala Phe Asp Tyr Asp Leu Leu Thr Gly Arg Ile Ser Asn Arg Arg Ser
            180                 185                 190
Val Tyr Lys Leu Glu Lys Glu Glu His Ile Pro Asp Gly Met Cys Ile
        195                 200                 205
Asp Thr Glu Gly Lys Leu Trp Val Ala Cys Tyr Asn Gly Gly Arg Val
    210                 215                 220
Ile Arg Leu Asp Pro Glu Thr Gly Lys Arg Leu Gln Thr Val Lys Leu
225                 230                 235                 240
Pro Val Asp Lys Thr Thr Ser Cys Cys Phe Gly Gly Lys Asp Tyr Ser
                245                 250                 255
Glu Met Tyr Val Thr Cys Ala Arg Ala Gly Leu Asp Pro Glu Ala Leu
            260                 265                 270
Ser Arg Gln Pro Glu Ala Gly Gly Ile Phe Lys Ile Thr Gly Leu Gly
        275                 280                 285
Val Lys Gly Ile Pro Pro Tyr Ala Tyr Ala Gly
    290                 295
<210>3
<211>879
<212>DNA
<213>Bacillus subtilis
<220>
<221>CDS
<222>(1)..(879)
<223>
<400>3
atg gat gca gta ttg gaa gca gac act cgg gca gtg att ggt gaa ggc    48
Met Asp Ala Val Leu Glu Ala Asp Thr Arg Ala Val Ile Gly Glu Gly
1               5                   10                  15
ccg tta tgg gat gaa gag aac ggc cgc tta tat tgg gtt gat atc ctg    96
Pro Leu Trp Asp Glu Glu Asn Gly Arg Leu Tyr Trp Val Asp Ile Leu
            20                  25                  30
ggg agc gag ctc cac atc ttt gac cct gaa gaa aaa atc aac cga tca    144
Gly Ser Glu Leu His Ile Phe Asp Pro Glu Glu Lys Ile Asn Arg Ser
        35                  40                  45
atc aaa ttc aaa tcc ttt gtg acg gcg ctt gcg aaa tat tca aag gat    192
Ile Lys Phe Lys Ser Phe Val Thr Ala Leu Ala Lys Tyr Ser Lys Asp
    50                  55                  60
gaa ctg att atg acg atg aag gac ggg ttt tac ctg tat cat ctt cgg    240
Glu Leu Ile Met Thr Met Lys Asp Gly Phe Tyr Leu Tyr His Leu Arg
65                  70                  75                  80
gat gac agc ttg gaa aaa att aaa cag ccg aag gac atg cat gag agc    288
Asp Asp Ser Leu Glu Lys Ile Lys Gln Pro Lys Asp Met His Glu Ser
                85                  90                  95
ctg aga ttt aat gat gct aaa tgt gac ccg tac gga agg ctt tgg gcg    336
Leu Arg Phe Asn Asp Ala Lys Cys Asp Pro Tyr Gly Arg Leu Trp Ala
           100                 105                 110
ggg acg acg agc atg gaa ggc gag caa aaa cag gcg tcg ctg tac cgt    384
Gly Thr Thr Ser Met Glu Gly Glu Gln Lys Gln Ala Ser Leu Tyr Arg
        115                 120                 125
ttg aat cta gac ggc agt ctt gtc aaa atc aag gat caa gtc tcc acc    432
Leu Asn Leu Asp Gly Ser Leu Val Lys Ile Lys Asp Gln Val Ser Thr
    130                 135                 140
tca aac ggt ttg gat tgg gac cgc gag cgg aat ttg atg tat tac atc    480
Ser Asn Gly Leu Asp Trp Asp Arg Glu Arg Asn Leu Met Tyr Tyr Ile
145                 150                 155                 160
gac acg ccg acc cag gag att gta cgt tac agc tat gat cct caa agc    528
Asp Thr Pro Thr Gln Glu Ile Val Arg Tyr Ser Tyr Asp Pro Gln Ser
                165                 170                 175
gga gat gtt tcg aat cca gaa cct gtc tat cgt ttt gat cag tca gac    576
Gly Asp Val Ser Asn Pro Glu Pro Val Tyr Arg Phe Asp Gln Ser Asp
           180                 185                 190
gga ttg ccg gac ggc atg aca att gac caa aat ggc atg ctg tgg gtg    624
Gly Leu Pro Asp Gly Met Thr Ile Asp Gln Asn Gly Met Leu Trp Val
        195                 200                 205
gcg ctg ttt ggc ggc agc cgc gtt gtt cac att gac ccg ttt cag aaa    672
Ala Leu Phe Gly Gly Ser Arg Val Val His Ile Asp Pro Phe Gln Lys
    210                 215                 220
aaa gaa atc aat tca atc agc gtg ccg gct aaa tat gtc acg tgc tgc    720
Lys Glu Ile Asn Ser Ile Ser Val Pro Ala Lys Tyr Val Thr Cys Cys
225                 230                 235                 240
gcg ttc ggc ggc aga gac tta aaa acc ctt tac att aca acg gca aca    768
Ala Phe Gly Gly Arg Asp Leu Lys Thr Leu Tyr Ile Thr Thr Ala Thr
                245                 250                 255
gaa caa atg aca gaa aaa gag aga tac gag cag cct cac gct gga ggg       816
Glu Gln Met Thr Glu Lys Glu Arg Tyr Glu Gln Pro His Ala Gly Gly
            260                 265                 270
ttg ttt tca gca caa ctg gaa aca ggc gga tat cag ccg gta cca ttt       864
Leu Phe Ser Ala Gln Leu Glu Thr Gly Gly Tyr Gln Pro Val Pro Phe
        275                 280                 285
gct gga gac gta taa                                                   879
Ala Gly Asp Val
    290
<210>4
<211>292
<212>PRT
<213>Bacillus subtilis
<400>4
Met Asp Ala Val Leu Glu Ala Asp Thr Arg Ala Val Ile Gly Glu Gly
1               5                   10                  15
Pro Leu Trp Asp Glu Glu ASn Gly Arg Leu Tyr Trp Val Asp Ile Leu
            20                  25                  30
Gly Ser Glu Leu His Ile Phe Asp Pro Glu Glu Lys Ile Asn Arg Ser
        35                  40                  45
Ile Lys Phe Lys Ser Phe Val Thr Ala Leu Ala Lys Tyr Ser Lys Asp
    50                  55                  60
Glu Leu Ile Met Thr Met Lys Asp Gly Phe Tyr Leu Tyr His Leu Arg
65                  70                  75                  80
Asp Asp Ser Leu Glu Lys Ile Lys Gln Pro Lys Asp Met His Glu Ser
                85                  90                  95
Leu Arg Phe Asn Asp Ala Lys Cys Asp Pro Tyr Gly Arg Leu Trp Ala
            100                 105                 110
Gly Thr Thr Ser Met Glu Gly Glu Gln Lys Gln Ala Ser Leu Tyr Arg
        115                 120                 125
Leu Asn Leu Asp Gly Ser Leu Val Lys Ile Lys Asp Gln Val Ser Thr
    130                 135                 140
Ser Asn Gly Leu Asp Trp Asp Arg Glu Arg Asn Leu Met Tyr Tyr Ile
145                 150                 155                 160
Asp Thr Pro Thr Gln Glu Ile Val Arg Tyr Ser Tyr Asp Pro Gln Ser
                165                 170                 175
Gly Asp Val Ser Asn Pro Glu Pro Val Tyr Arg Phe Asp Gln Ser Asp
            180                 185                 190
Gly Leu Pro Asp Gly Met Thr Ile Asp Gln Asn Gly Met Leu Trp Val
        195                 200                 205
Ala Leu Phe Gly Gly Ser Arg Val Val His Ile Asp Pro Phe Gln Lys
    210                 215                 220
Lys Glu Ile Asn Ser Ile Ser Val Pro Ala Lys Tyr Val Thr Cys Cys
225                 230                 235                 240
Ala Phe Gly Gly Arg Asp Leu Lys Thr Leu Tyr Ile Thr Thr Ala Thr
                245                 250                 255
Glu Gln Met Thr Glu Lys Glu Arg Tyr Glu Gln Pro His Ala Gly Gly
            260                 265                 270
Leu Phe Ser Ala Gln Leu Glu Thr Gly Gly Tyr Gln Pro Val Pro Phe
        275                 280                 285
Ala Gly Asp Val
    290
<210>5
<211>726
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(726)
<223>
<400>5
aac tgg gac ctg gaa aaa ctc aat cct cca ggc ttc ggc cgc aaa ccc    48
Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe Gly Arg Lys Pro
1               5                   10                  15
ttc gcc cac cag gtt aaa tgg gtc agc gaa ggc cac gcc ttc gac gac    96
Phe Ala His Gln Val Lys Trp Val Ser Glu Gly His Ala Phe Asp Asp
            20                  25                  30
gag tac cac ttc aac cca cag caa tcc tcc caa tgg gac ggc cta cga    144
Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly Leu Arg
        35                  40                  45
cac cac aat gcc cca gcc cca aca ccc gac gac cct gac cgc cgc gtc    192
His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asp Arg Arg Val
    50                  55                  60
ttc tac ggc ggc acc acc tcc acc gag atc ctc gac ccg tcc tca gct    240
Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser Ser Ala
65                  70                  75                  80
cgc atc ggc atc gct cac tgg gcc aag aag ggc atc gcc ggc cgt ggc    288
Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly Arg Gly
                85                  90                  95
gtc ctc atc gac tac gcg tcc tac atc cag cga acc aag ggc ata cca    336
Val Leu Ile Asp Tyr Ala Ser Tyr Ile Gln Arg Thr Lys Gly Ile Pro
            100                 105                 110
gta aac gcc cta acc cgg cac acc gtc tcc ctg gac gac gtc ctc acc       384
Val Ash Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val Leu Thr
        115                 120                 125
atc gcg aaa gaa tgc aac atc acc ttc cag cca ggc gac att ctc ttc       432
Ile Ala Lys Glu Cys Asn Ile Thr Phe Gln Pro Gly Asp Ile Leu Phe
    130                 135                 140
ttg cgt gtc ggc ctg ccc acc aca tgg gat aac atg tcc gat gac gag       480
Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Ser Asp Asp Glu
145                 150                 155                 160
aag gtc aaa tac agt caa cag gaa atg cct cag cat gca ggg tta gag       528
Lys Val Lys Tyr Ser Gln Gln Glu Met Pro Gln His Ala Gly Leu Glu
                165                 170                 175
cag agt gag cgc gtg gtg cgg ttc ctc tgg gac cag cat ttc gcg gct       576
Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe Ala Ala
            180                 185                 190
gtg gcg ggt gat gcg gtc agc ttc gag gtg tat ccg cct gta gag aag       624
Val Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val Glu Lys
        195                 200                 205
gag tgg gat ttg cat cat ttt ctg ttg gcc ggg tgg gga gtg ccg att       672
Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Val Pro Ile
    210                 215                 220
ggg gag atg ttt gat ctg gag ggg ttg aag gag gtt tgt gag agg ttg       720
Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu Arg Leu
225                 230                 235                 240
ggc agg                                                               726
Gly Arg
<210>6
<211>242
<212>PRT
<213>Aspergillus niger
<400>6
Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe Gly Arg Lys Pro
1               5                   10                  15
Phe Ala His Gln Val Lys Trp Val Ser Glu Gly His Ala Phe Asp Asp
            20                  25                  30
Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly Leu Arg
        35                  40                  45
His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asp Arg Arg Val
    50                  55                  60
Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser Ser Ala
65                  70                  75                  80
Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly Arg Gly
                85                  90                  95
Val Leu Ile Asp Tyr Ala Ser Tyr Ile Gln Arg Thr Lys Gly Ile Pro
            100                 105                 110
Val Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val Leu Thr
        115                 120                 125
Ile Ala Lys Glu Cys Asn Ile Thr Phe Gln Pro Gly Asp Ile Leu Phe
    130                 135                 140
Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Ser Asp Asp Glu
145                 150                 155                 160
Lys Val Lys Tyr Ser Gln Gln Glu Met Pro Gln His Ala Gly Leu Glu
                165                 170                 175
Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe Ala Ala
            180                 185                 190
Val Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val Glu Lys
        195                 200                 205
Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Val Pro Ile
    210                 215                 220
Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu Arg Leu
225                 230                 235                 240
Gly Arg
<210>7
<211>2443
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(774)..(977)
<223>
<220>
<221>CDS
<222>(1050)..(1820)
<223>
<400>7
ccgctatcac tcagcggcag tcgggcgcag acaatgctac cgaggattca gggcacaagg     60
gggatcagtt acgtggggcg tgacgatgta tgggtttcat gaggatgcgt ttacgagtgc    120
gtttggggtg gtggaagagt tgggggcgaa gatcccgttt ccggtggctg atagtcggtt    180
gagagggggt gcagtgaagg aggtgagatg gttggaatat gtgttcagat tggtgttgca    240
gggggtgcag ggcttgattt tgtggctggt gggagaggga aaagggaagc agaaggcgag    300
ctagaacctt ttacacactg cctctcgaat gaacattcag aaattttgga tagacaaggt     360
ttctgtcggt gctattctgg gcgttgcaat acctgtcaca ttgaataacc tccgaggtga     420
ttatccacgc aatcccatat catctgatgt accccttgca taatctgtct ttaccaaatc     480
aggtagaaag taagaccatc cggataggct gtatactacc tcgtgtccac atcggggata     540
ctgaacacga ttgtatatca attcgatgat ggagatacaa ccctaatgaa ccaagcacag     600
ccgtggatct ccccggactt tctccgatgg cttccccacc cgccaatcca gcatcaacta     660
aacaacccct cacgctcttc atcatctctc atttcactcc cacctatcat ctacagcttc     720
acaaacaaca ctactccctc ccaagcacac acctctactg acaagatacc acg atg        776
                                                          Met
                                                          1
gcc gac tcc ctc ccg aaa acc tac gac gac ctc ccc gac aag cgg cgc       824
Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg Arg
            5                   10                  15
tac tgg ccc gca acc ccc aac tcc gcc gac gag gga ctg ggg atg ctc       872
Tyr Trp Pro Ala Thr Pro Asn Ser Ala Asp Glu Gly Leu Gly Met Leu
        20                  25                  30
cgt ctc ctc act cca gaa att gtc gcc aac gca gca cgc acc cag atc       920
Arg Leu Leu Thr Pro Glu Ile Val Ala Asn Ala Ala Arg Thr Gln Ile
    35                  40                  45
cag acc ggc gag cgc gta tgc ctg aac tgg gac ctg gag aag ctg aac      968
Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu Asn
50                  55                  60                  65
cca cca ggt accctccctt ctacctcagt gacataggtt cacccccaac             1017
Pro Pro Gly
ctcacccatc aacctaactt aaaaacatag gc ttc ggc cgc aaa ccc ttc gcc     1070
                                    Phe Gly Arg Lys Pro Phe Ala
                                        70                  75
cac cac gta aaa tgg gtc tcc gaa ggc cac gcc ttc gac gac gaa tac     1118
His His Val Lys Trp Val Ser Glu Gly His Ala Phe Asp Asp Glu Tyr
                 80                  85                  90
cac ttc aac ccg caa caa tcc tcc caa tgg gac ggt ctg cga cac cac     1166
His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly Leu Arg His His
            95                  100                 105
aac gcc ccg gct cca acc ccc gac gac cct aac cgc cgg gtc ttc tac     1214
Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asn Arg Arg Val Phe Tyr
        110                 115                 120
ggc ggc acc acc tcc acc gag atc ctc gac ccc tcg tcc acc cga atc     1262
Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser Ser Thr Arg Ile
    125                 130                 135
ggc ata gcc cac tgg gcc aag aaa ggc atc gcc ggc cgc ggc gtc ctc      1310
Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu
140                 145                 150                 155
atc gac tac gcc tcc tac gtg caa cga acc aag ggc gtc aca gta aac      1358
Ile Asp Tyr Ala Ser Tyr Val Gln Arg Thr Lys Gly Val Thr Val Asn
                160                 165                 170
gcc cta acc cgc cac acc gtc tcc ctg gac gac gtc ctc acc atc gcg      1406
Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala
            175                 180                 185
aag gaa tgc aac atc acc ttc gaa cca ggc gac att ctc ttc ctg cgc      1454
Lys Glu Cys Asn Ile Thr Phe Glu Pro Gly Asp Ile Leu Phe Leu Arg
        190                 195                 200
gtc ggt cta ccg act aca tgg gat aac atg acc gat gag gag agg gtc      1502
Val Gly Leu Pro Thr Thr Trp Asp Asn Met Thr Asp Glu Glu Arg Val
    205                 210                 215
aag tat agt cag cag gaa acg ccc aac cat gca gga tta gag cag agt      1550
Lys Tyr Ser Gln Gln Glu Thr Pro Asn His Ala Gly Leu Glu Gln Ser
220                 225                 230                 235
gag cgt gtg gtg cgg ttc ctt tgg gat cag cat ttc gcc gct gta gcg      1598
Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala
                240                 245                 250
ggt gat gcg gtc agc ttt gag gtg tat ccg ccg gta gag aag gag tgg     1646
Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp
            255                 260                 265
gat tta cat cat ttt ttg ctg gct ggg tgg gga cta ccg att ggg gag      1694
Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Leu Pro Ile Gly Glu
        270                 275                 280
atg ttt gat ctt gag ggg ttg aag gag gtg tgt gag agg ttg gga agg      1742
Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg
    285                 290                 295
tgg acg ttt ttc gtt agt tct agt ccg ttg aac tgt ggg aga ggt gtg      1790
Trp Thr Phe Phe Val Ser Ser Ser Pro Leu Asn Cys Gly Arg Gly Val
300                 305                 310                 315
tcg agt ccg ccg aat tgt atg gca att ttt taaaatgcag aggtggtgtg        1840
Ser Ser Pro Pro Asn Cys Met Ala Ile Phe
                320                 325
ggaacggagt tggatggacg atggagtgga tagaacagcg ggagttgatg tattgagctg   1900
gggccctagt catgatttgt ctgaatctgg agactataca tagcaccttc agggcatcaa   1960
gaggcataat atgcagttat acttgtgata ttacattctt tggccacagt tatgactgtc   2020
tcttatattg actttgaagt gtcttctttg agccgagtat acttggatta taggattcca   2080
atgacggtac atcccgaagg tctgtcccag cacttcccta atcgcagtgg taatacctac   2140
tactagccag tatatctaaa gtacaccact cggaactcat tcacatatac gaatggtgac   2200
tatgaagggg taatacattc acaacaagat cagtaaatag cagttgcgag gaatgcaaga   2260
ctagcccttc gtacattcaa tatcagaagt tgggactata aaggccactg cctccctcac   2320
tagcccgtaa agcaatacct cgctgctacc attgccaact gcagggtgtt tccagtaaac   2380
ggagtggctg ttcccaccgt gcagcactct gtacccactc cccttcctgc tgtcattctg   2440
att                                                                 2443
<210>8
<211>325
<212>PRT
<213>Aspergillus niger
<400>8
Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg
1               5                   10                  15
Arg Tyr Trp Pro Ala Thr Pro Asn Ser Ala Asp Glu Gly Leu Gly Met
            20                  25                  30
Leu Arg Leu Leu Thr Pro Glu Ile Val Ala Asn Ala Ala Arg Thr Gln
        35                  40                  45
Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu
    50                  55                  60
Asn Pro Pro Gly Phe Gly Arg Lys Pro Phe Ala His His Val Lys Trp
65                  70                  75                  80
Val Ser Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln
                85                  90                  95
Gln Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro Ala Pro
            100                 105                 110
Thr Pro Asp Asp Pro Asn Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser
        115                 120                 125
Thr Glu Ile Leu Asp Pro Ser Ser Thr Arg Ile Gly Ile Ala His Trp
    130                 135                 140
Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser
145                 150                 155                 160
Tyr Val Gln Arg Thr Lys Gly Val Thr Val Asn Ala Leu Thr Arg His
                165                 170                 175
Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile
            180                 185                 190
Thr Phe Glu Pro Gly Asp Ile Leu Phe Leu Arg Val Gly Leu Pro Thr
        195                 200                 205
Thr Trp Asp Asn Met Thr Asp Glu Glu Arg Val Lys Tyr Ser Gln Gln
    210                 215                 220
Glu Thr Pro Asn His Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg
225                 230                 235                 240
Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala Val Ser
                245                 250                 255
Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His His Phe
             260                 265                 270
Leu Leu Ala Gly Trp Gly Leu Pro Ile Gly Glu Met Phe Asp Leu Glu
        275                 280                 285
Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val
    290                 295                 300
Ser Ser Ser Pro Leu Asn Cys Gly Arg Gly Val Ser Ser Pro Pro Asn
305                 310                 315                 320
Cys Met Ala Ile Phe
                325
<210>9
<211>1025
<212>DNA
<213>Aspergillus awamorii
<220>
<221>CDS
<222>(1)..(204)
<223>
<220>
<221>CDS
<222>(255)..(1025)
<223>
<400>9
atg gcc gac tcc ctc ccg aaa acc tac gac gac ctc ccc gac aag cgg        48
Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg
1               5                   10                  15
cgc tac tgg ccc gca gcc ccc aac tcc gcc gac gag ggg ctg ggg atg        96
Arg Tyr Trp Pro Ala Ala Pro Asn Ser Ala Asp Glu Gly Leu Gly Met
            20                  25                  30
ctc cgt ctc ctc acc cca gaa gtg gtc gcc aac gca gca cgc acc cag       144
Leu Arg Leu Leu Thr Pro Glu Val Val Ala Asn Ala Ala Arg Thr Gln
        35                  40                  45
atc cag acc ggc gag cgt gta tgc ctc aac tgg gac ctg gag aag cta       192
Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu
    50                  55                  60
aac cca cca ggt gcccctcctt ccacccccat cgtctctcac caactaacca            244
Asn Pro Pro Gly
65
aaacacaggt  ttc ggc cgc aaa ccc ttc gcc cac cag gtt aaa tgg gtc    293
            Phe Gly Arg Lys Pro Phe Ala His Gln Val Lys Trp Val
                70                  75                  80
aac gaa ggc cac gcc ttc gac gac gaa tac cac ttc aat ccc cag caa    341
Asn Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln Gln
            85                  90                  95
tcc tcc caa tgg gac ggc ctc cga cac cac aac gcc ccg gcc cca aca    389
Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro Ala Pro Thr
        100                 105                 110
ccc gaa gac cct gag cgc cgc gtc ttc tac ggc ggc acc acc tcc acc    437
Pro Glu Asp Pro Glu Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser Thr
    115                 120                 125
gag atc ctc gac ccc tcg tcc gca cgg atc ggc ata gcc cac tgg gcc    485
Glu Ile Leu Asp Pro Ser Ser Ala Arg Ile Gly Ile Ala His Trp Ala
130                 135                 140                 145
aag aag ggc atc gcc ggc cgc ggc gtc ctc ata gac tac gcc tcc tac    533
Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser Tyr
                150                 155                 160
atc cag cga acc aag ggc atc aca gta aac gcc cta acc cgc cac acc    581
Ile Gln Arg Thr Lys Gly Ile Thr Val Asn Ala Leu Thr Arg His Thr
            165                 170                 175
gtc tcc ctc gac gac gtc ctc acc atc gcg aag gaa tgc aac att acc    629
Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile Thr
        180                 185                 190
ttc cag cca ggc gac att ctc ttc ctg cgc gtt ggt cta ccg aca acg    677
Phe Gln Pro Gly Asp Ile Leu Phe Leu Arg Val Gly Leu Pro Thr Thr
    195                 200                 205
tgg gat aac atg tcc gat gaa gag aag gtc gagtat agt caa cag caa    725
Trp Asp Asn Met Ser Asp Glu Glu Lys Val Glu Tyr Ser Gln Gln Gln
210                 215                 220                 225
aca ccc cag cat gca ggt tta gag cag agc gag cgt gtg gtg cgg ttc    773
Thr Pro Gln His Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg Phe
                230                 235                 240
ctc tgg gac cag cat ttc gcg gct gtg gcg ggc gat gcg gtc agc ttt    821
Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala Val Ser Phe
            245                 250                 255
gag gtg tat ccg ccg gta gag aag gag tgg gat tta cac cat ttc ttg    869
Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His His Phe Leu
        260                 265                 270
ctt gct ggg tgg gga gtg ccg att gga gag atg ttt gat ctg gag ggg    917
Leu Ala Gly Trp Gly Val Pro Ile Gly Glu Met Phe Asp Leu Glu Gly
    275                 280                 285
ttg aag gag gtg tgt gag agg ttg ggc agg tgg acg ttt ttt gtt agt    965
Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val Ser
290                 295                 300                 305
tcg agt ccg ttg aat tgt aag acg ggg gtg tcg agt ccg ccg aat tgt    1013
Ser Ser Pro Leu Asn Cys Lys Thr Gly Val Ser Ser Pro Pro Asn Cys
                310                 315                 320
atg gca att ttt                                                    1025
Met Ala Ile Phe
            325
<210>10
<211>325
<212>PRT
<213>Aspergillus awamorii
<400>10
Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg
1               5                   10                  15
Arg Tyr Trp Pro Ala Ala Pro Asn Ser Ala Asp Glu Gly Leu Gly Met
            20                  25                  30
Leu Arg Leu Leu Thr Pro Glu Val Val Ala Asn Ala Ala Arg Thr Gln
        35                  40                  45
Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu
    50                  55                  60
Asn Pro Pro Gly Phe Gly Arg Lys Pro Phe Ala His Gln Val Lys Trp
65                  70                  75                  80
Val Asn Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln
                85                  90                  95
Gln Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro Ala Pro
            100                 105                 110
Thr Pro Glu Asp Pro Glu Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser
        115                 120                 125
Thr Glu Ile Leu Asp Pro Ser Ser Ala Arg Ile Gly Ile Ala His Trp
    130                 135                 140
Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser
145                 150                 155                 160
Tyr Ile Gln Arg Thr Lys Gly Ile Thr Val Asn Ala Leu Thr Arg His
                165                 170                 175
Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile
            180                 185                 190
Thr Phe Gln Pro Gly Asp Ile Leu Phe Leu Arg Val Gly Leu Pro Thr
        195                 200                 205
Thr Trp Asp Asn Met Ser Asp Glu Glu Lys Val Glu Tyr Ser Gln Gln
    210                 215                 220
Gln Thr Pro Gln His Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg
225                 230                 235                 240
Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala Val Ser
                245                 250                 255
Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His His Phe
            260                 265                 270
Leu Leu Ala Gly Trp Gly Val Pro Ile Gly Glu Met Phe Asp Leu Glu
        275                 280                 285
Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val
    290                 295                 300
Ser Ser Ser Pro Leu Asn Cys Lys Thr Gly Val Ser Ser Pro pro Asn
305                 310                 315                 320
Cys Met Ala Ile Phe
            325
<210>11
<211>11
<212>PRT
<213>Eguus caballus
<400>11
His Gln Gly Ser Leu Val Ala Leu Phe Pro Asp
1               5                   10
<210>12
<211>23
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(23)
<223>5’-引物
<400>12
atgtcttcca tcaagattga atg    23
<210>13
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>3’-引物
<400>13
gtcaaaggaa ttccccccta t    21
<210>14
<211>30
<212>DNA
<213>Bos sp.
<400>14
atgtcttcca ttaagattga gtgtgttttg    30
<210>15
<21l>30
<212>DNA
<213>Oryctolagus cuniculus
<400>15
atgtcttcca ttaagatcga gtgtgttttg    30
<210>16
<211>30
<212>DNA
<213>Homo sapiens
<400>16
atgtcttcca ttaagattga gtgtgttttg    30
<210>17
<211>30
<212>DNA
<213>Rattus norvegicus
<400>17
atgtcttcca tcaagattga atgtgtttta    30
<210>18
<211>30
<212>DNA
<213>Mus sp.
<400>18
atgtcttcca tcaaagttga atgtgtttta    30
<210>19
<211>30
<212>DNA
<213>Gallus sp.
<400>19
atgtcgtccg t taagatcga gtgcgtcggg    30
<210>20
<211>30
<212>DNA
<213>Xenopus sp.
<400>20
atgtcttcca tcaagataga atgtgtagtc                30
<210>21
<211>39
<212>DNA
<213>Bos sp.
<400>21
ataactggcc taggagtcaa aggaattcct ccctatcct      39
<210>22
<211>39
<212>DNA
<213>Oryctolagus cuniculus
<400>22
ataactggcc tgggggtcaa aggaattccc ccctactcc     39
<210>23
<211>39
<212>DNA
<213>Homo sapiens
<400>23
ataactggtc tgggggtcaa aggaattgct ccctactcc     39
<210>24
<211>39
<212>DNA
<213>Rattus norvegicus
<400>24
ataacaggtc ttggggtcaa aggaattgct ccatattcc     39
<210>25
<211>39
<212>DNA
<213>Mus sp.
<400>25
ataacaggtc tcggagtcaa aggaattgcc ccatattcc    39
<210>26
<211>39
<212>DNA
<213>Gallus sp.
<400>26
atcactgggc ttggtgtgaa aggaatcccg ccatatcca    39
<210>27
<211>39
<212>DNA
<213>Xenopus sp.
<400>27
attactggac ttggagtaaa aggaatcgca ccaactgca    39
<210>28
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>完美匹配的引物
<400>28
aatacacatt ccatctggga t    21
<210>29
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>正向引物
<400>29
gaactgtgaa gttgcctgtt g    21
<210>30
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物
<400>30
ggaagaggat gtcactcatc c    21
<210>31
<211>26
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(6)..(6)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(9)..(9)
<223>n表示C或T
<220>
<221>misc_feature
<222>(12)..(12)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或T
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示A或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C或G
<220>
<221>misc_feature
<222>(1)..(26)
<223>寡核苷酸Fxn42
<400>31
aagccnttng cncancangt naagac    26
<210>32
<211>26
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或T
<220>
<221>misc_feature
<222>(1)..(26)
<223>寡核苷酸Fxn42S
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示A或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示A或G
<400>32
aagccgttcg cccancangt naanac    26
<210>33
<211>26
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(6)..(6)
<223>n表示C或G
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或G
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示A或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示A、C、T或G
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示C或T
<220>
<221>misc_feature
<222>(1)..(26)
<223>寡核苷酸Fxn42AS
<400>33
gtcttnacct ggtgngcnaa nggntt    26
<210>34
<211>24
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(3)..(3)
<223>n表示C或T
<220>
<221>misc_feature
<222>(6)..(6)
<223>n表示A、C或G
<220>
<221>misc_feature
<222>(9)..(9)
<223>n表示C或T
<220>
<221>misc_feature
<222>(12)..(12)
<223>n表示C或G
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或T
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C或G
<220>
<221>misc_feature
<222>(1)..(24)
<223>寡核苷酸Fxn57
<400>34
atnggnatng cncantgggc naag    24
<210>35
<211>24
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(9)..(9)
<223>n表示C或T
<220>
<221>misc_feature
<222>(12)..(12)
<223>n表示C或G
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或T
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示A或G
<220>
<221>misc_feature
<222>(1)..(24)
<223>寡核苷酸Fxn57S
<400>35
atcggcatng cncantgggc naan    24
<210>36
<211>24
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(13)..(13)
<223>n表示A、C或G
<220>
<221>misc_feature
<222>(16)..(16)
<223>n表示A或G
<220>
<221>misc_feature
<222>(19)..(19)
<223>n表示A、C、T或G
<220>
<221>misc_feature
<222>(22)..(22)
<223>n表示A或G
<220>
<221>misc_feature
<222>(1)..(24)
<223>寡核苷酸Fxn57AS
<400>36
cttggcccag tgngcnatnc cnat    24
<210>37
<211>39
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(6)..(6)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(9)..(9)
<223>n表示C或T
<220>
<221>misc_feature
<222>(12)..(12)
<223>n表示C或T
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或G
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示C或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C或G
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示C或G
<220>
<221>misc_feature
<222>(27)..(27)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(30)..(30)
<223>n表示C或G
<220>
<221>misc_feature
<222>(33)..(33)
<223>n表示C或T
<220>
<221>misc_feature
<222>(1)..(39)
<223>寡核苷酸Fx73
<220>
<221>misc_feature
<222>(36)..(36)
<223>n表示C或T
<400>37
tggacnttnt tngtntcntc ntcnccnctn aantgnaag    39
<210>38
<211>39
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示C或G
<220>
<221>misc_feature
<222>(27)..(27)
<223>n表示C或G
<220>
<221>misc_feature
<222>(30)..(30)
<223>n表示C或G
<220>
<221>misc_feature
<222>(33)..(33)
<223>n表示C或T
<220>
<221>misc_feature
<222>(36)..(36)
<223>n表示C或T
<220>
<221>misc_feature
<222>(39)..(39)
<223>n表示A或G
<220>
<221>misc_feature
<222>(1)..(39)
<223>寡核苷酸Fx73S
<400>38
tggaccttgt tggtgtcctc ctcnccnctn aantgnaan    39
<210>39
<211>39
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(22)..(22)
<223>n表示C或G
<220>
<221>misc_feature
<222>(25)..(25)
<223>n表示C或G
<220>
<221>misc_feature
<222>(28)..(28)
<223>n表示A或C
<220>
<221>misc_feature
<222>(31)..(31)
<223>n表示A或C
<220>
<221>misc_feature
<222>(34)..(34)
<223>n表示A、C或G
<220>
<221>misc_feature
<222>(1)..(39)
<223>寡核苷酸Fx73AS
<400>39
cttgcagttc agcggggagg anganacnaa naangtcca    39
<210>40
<211>38
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(3)..(3)
<223>n表示C或G
<220>
<221>misc_feature
<222>(6)..(6)
<223>n表示C或T
<220>
<221>misc_feature
<222>(9)..(9)
<223>n表示C或G
<220>
<221>misc_feature
<222>(12)..(12)
<223>n表示C或T
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示C或T
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C或G
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示A或G
<220>
<221>misc_feature
<222>(27)..(27)
<223>n表示A或G
<220>
<221>misc_feature
<222>(30)..(30)
<223>n表示C或G
<220>
<221>misc_feature
<222>(33)..(33)
<223>n表示C或T
<220>
<221>misc_feature
<222>(36)..(36)
<223>n表示C或G
<220>
<221>misc_feature
<222>(1)..(38)
<223>寡核苷酸FX74
<400>40
gtntgnctna antggganct nganaanctn aanccncc    38
<210>41
<211>29
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示A或G
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示A或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示C或G
<220>
<221>misc_feature
<222>(24)..(24)
<223>n表示C或T
<220>
<221>misc_feature
<222>(27)..(27)
<223>n表示C、G或T
<220>
<221>misc_feature
<222>(1)..(29)
<223>寡核苷酸Fx74S
<400>41
aactgggacc tgganaanct naanccncc    29
<210>42
<211>27
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(12)..(12)
<223>n表示C或T
<220>
<221>misc_feature
<222>(15)..(15)
<223>n表示C或T
<220>
<221>misc_feature
<222>(18)..(18)
<223>n表示C或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>n表示A或G
<220>
<221>misc_feature
<222>(27)..(27)
<223>n表示A或G
<220>
<221>misc_feature
<222>(1)..(27)
<223>寡核苷酸Fx74AS
<400>42
ggcgggttca gnttntcnag ntcccan    27
<210>43
<211>8
<212>PRT
<213>Aspergillus sp.
<400>43
Lys Pro Phe Ala His Gln Val Lys
1               5
<210>44
<211>16
<212>PRT
<213>Aspergillus sp.
<400>44
Arg His His Asn Ala Pro Ala Pro Thr Pro Glu Asp Pro Glu Arg Arg
1               5                   10                  15
<210>45
<211>12
<212>PRT
<213>Aspergillus sp.
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>x表示?
<400>45
Lys Pro Phe Ala His Gln Val Lys Thr Xaa Glu Asp
1               5                   10
<210>46
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal1AS
<400>46
cgaagggtttgcggccgaag c    21
<210>47
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal2AS
<400>47
aaggcgtggc c ttcggagac c    21
<210>48
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal3S
<400>48
gtagcgggtg atgcggtcag c    21
<210>49
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal4S
<400>49
tgtatccgcc ggtagagaag g    21
<210>50
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal5S
<400>50
ccctcgtcca cccgaatcgg c    21
<210>51
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal6AS
<400>51
gcgtagtcgatgaggacgcc g    21
<210>52
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal7AS
<400>52
tgactatact tgaccctctc c    21
<210>53
<211>22
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(22)
<223>引物Oal8AS
<400>53
ggagacccat tttacgtggtgg    22
<210>54
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal9AS
<400>54
ccgttcccac accacctctg c    21
<210>55
<211>24
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(24)
<223>引物Oal10S
<400>55
atggccgact ccctcccgaa aacc    24
<210>56
<211>27
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(27)
<223>引物Oal10SEco
<400>56
atataagaat tcaaatggcc gactccc                                   27
<210>57
<211>53
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(53)
<223>引物OalENhis
<400>57
gaattcaaat gagaggatcc catcaccatc accatcacgc cgactccctc ccg    53
<210>58
<211>19
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(19)
<223>引物Oal10SShis
<400>58
atgagaggat cgcatcacc                                         19
<210>59
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal11S
<400>59
ctctactgac aagataccac g                                      21
<210>60
<211>26
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(26)
<223>引物Oal12AS
<400>60
ttaaaaaatt gccatacaat tcggcg                  26
<210>61
<211>38
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(38)
<223>引物Oal12ASEco
<400>61
tatatagaat tcttaaaaaattgccataca attcggcg     38
<210>62
<211>44
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(44)
<223>引物Oal12AShis
<400>62
tcaatggtga tggtgatgat gaaaaattgc catacaattc ggcg    44
<210>63
<211>56
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(56)
<223>引物Oal12ASHisEco
<400>63
tatatagaat tcttaatggt gatggtgatg atgaaaaatt gccatacaat tcggcg    56
<210>64
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal13S
<400>64
ggagatacaa ccctaatgaa c                                          21
<210>65
<211>21
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(21)
<223>引物Oal13AS
<400>65
gttcattagg gttgtatctc c                    21
<210>66
<211>37
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(37)
<223>引物Oal14S
<400>66
gagaagctga acccaccagg cttcggccgc aaaccct    37
<210>67
<211>37
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(37)
<223>引物Oal14AS
<400>67
agggtttgcg gccgaagcct ggtgggttca gcttctc    37
<210>68
<211>37
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(37)
<223>引物Oal15S
<400>68
cttcgcccac cacgtaaaaa cccccgacga ccctaac    37
<210>69
<211>37
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(37)
<223>引物Oal15AS
<400>69
gttagggtcg tcgggggttt ttacgtggtg ggcgaag    37
<210>70
<211>32
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(32)
<223>引物Oal16S
<400>70
gaattcaaat gctccgtctc ctcactccac tc        32
<210>71
<211>30
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(30)
<223>引物OalsecS
<400>71
ggtcctcgtg gtaatgccga ctccctcccg          30
<210>72
<211>27
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(27)
<223>引物OalsecAS
<400>72
cgggagggag tcggcattac cacgagg             27
<210>73
<211>48
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(48)
<223>引物pQE80EcoS
<400>73
tatatagaat tcattaaaga ggagaaatta actatggccg actccctc          48
<210>74
<211>52
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(52)
<223>引物pQE80EcoNhisS
<400>74
tatatagaat tcattaaaga ggagaaatta actatgagag gatcgcatca cc    52
<210>75
<211>34
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(34)
<223>引物pQE80BamAS
<400>75
tatatagtcg acttaaaaaa ttgccataca attc                       34
<210>76
<211>56
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(56)
<223>引物pQE80BamhisAS
<400>76
tatatagtcg actcaatggtgatggtgatg atgaaaaatt gccatacaat tcggcg    56
<210>77
<211>57
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(57)
<223>引物pQE80EcoSshort
<400>77
tatatagaat tcattaaaga ggagaaatta actatgctcc gtctcctcac tccactc         57
<210>78
<211>26
<212>DNA
<213>人工
<220>
<221>misc_feature
<222>(1)..(26)
<223>引物CP-a
<400>78
tatatgaatt catgggcgtg ttcgtc                                           26
<210>79
<211>777
<212>DNA
<213>Aspergillus niger
<220>
<221>Intron
<222>(32)..(82)
<223>
<220>
<221>CDS
<222>(83)..(777)
<223>
<220>
<221>CDS
<222>(1)..(31)
<223>
<400>79
aac tgg gac ctg gaa aaa ctc aat cct cca g gtaatcccct ccttccaacc        51
Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro
1               5                   10
catcctctat cgccaactaa cctaaacaca g gc  ttc ggc cgc aaa ccc ttc        102
                                   Gly Phe Gly Arg Lys Pro Phe
                                                   15
gcc cac cag gtt aaa tgg gtc agc gaa ggc cac gcc ttc gac gac gag       150
Ala His Gln Val Lys Trp Val Ser Glu Gly His Ala Phe Asp Asp Glu
        20                  25                  30
tac cac ttc aac cca cag caa tcc tcc caa tgg gac ggc cta cga cac       198
Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly Leu Arg His
    35                  40                  45
cac aat gcc cca gcc cca aca ccc gac gac cct gac cgc cgc gtc ttc       246
His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asp Arg Arg Val Phe
50                  55                  60                  65
tac ggc ggc acc acc tcc acc gag atc ctc gac ccg tcc tca gct cgc       294
Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser Ser Ala Arg
                70                  75                  80
atc ggc atc gct cac tgg gcc aag aag ggc atc gcc ggc cgt ggc gtc       342
Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly Arg Gly Val
            85                  90                  95
ctc atc gac tac gcg tcc tac atc cag cga acc aag ggc ata cca gta       390
Leu Ile Asp Tyr Ala Ser Tyr Ile Gln Arg Thr Lys Gly Ile Pro Val
        100                 105                 110
aac gcc cta acc cgg cac acc gtc tcc ctg gac gac gtc ctc acc atc       438
Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val Leu Thr Ile
    115                 120                 125
gcg aaa gaa tgc aac atc acc ttc cag cca ggc gac att ctc ttc ttg       486
Ala Lys Glu Cys Asn Ile Thr Phe Gln Pro Gly Asp Ile Leu Phe Leu
130                 135                 140                 145
cgt gtc ggc ctg ccc acc aca tgg gat aac atg tcc gat gac gag aag       534
Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Ser Asp Asp Glu Lys
                150                 155                 160
gtc aaa tac agt caa cag gaa atg cct cag cat gca ggg tta gag cag       582
Val Lys Tyr Ser Gln Gln Glu Met Pro Gln His Ala Gly Leu Glu Gln
            165                 170                 175
agt gag cgc gtg gtg cgg ttc ctc tgg gac cag cat ttc gcg gct gtg       630
Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe Ala Ala Val
        180                 185                 190
gcg ggt gat gcg gtc agc ttc gag gtg tat ccg cct gta gag aag gag       678
Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val Glu Lys Glu
    195                 200                 205
tgg gat ttg cat cat ttt ctg ttg gcc ggg tgg gga gtg ccg att ggg       726
Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Val Pro Ile Gly
210                 215                 220                 225
gag atg ttt gat ctg gag ggg ttg aag gag gtt tgt gag agg ttg ggc       774
Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu Arg Leu Gly
                230                 235                 240
agg                                                                   777
Arg
<210>80
<211>242
<212>PRT
<213>Aspergillus niger
<400>80
Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe Gly Arg Lys Pro
1               5                   10                  15
Phe Ala His Gln Val Lys Trp Val Ser Glu Gly His Ala Phe Asp Asp
            20                  25                  30
Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly Leu Arg
        35                  40                  45
His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asp Arg Arg Val
    50                  55                  60
Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser Ser Ala
65                  70                  75                  80
Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly Arg Gly
                85                  90                  95
Val Leu Ile Asp Tyr Ala Ser Tyr Ile Gln Arg Thr Lys Gly Ile Pro
            100                 105                 110
Val Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val Leu Thr
        115                 120                 125
Ile Ala Lys Glu Cys Asn Ile Thr Phe Gln Pro Gly Asp Ile Leu Phe
    130                 135                 140
Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Ser Asp Asp Glu
145                 150                 155                 160
Lys Val Lys Tyr Ser Gln Gln Glu Met Pro Gln His Ala Gly Leu Glu
                165                 170                 175
Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe Ala Ala
            180                 185                 190
Val Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val Glu Lys
        195                 200                 205
Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Val Pro Ile
    210                 215                 220
Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu Arg Leu
225                 230                 235                 240
Gly Arg
<210>81
<211>12
<212>PRT
<213>Aspergillus niger
<220>
<221>MISC_FEATURE
<222>(10)..(10)
<223>undefined amino acid
<400>81
Lys Pro Phe Ala His Gln Val Lys Thr Xaa Glu Asp
1               5                   10
<210>82
<211>8
<212>PRT
<213>Aspergillus niger
<400>82
Ile Gly Ile Ala His Trp Ala Lys
1               5
<210>83
<211>13
<212>PRT
<213>Aspergillus niger
<400>83
Trp Thr Phe Phe Val Ser Ser Ser Pro Leu Asn Cys Lys
1               5                   10
<210>84
<211>15
<212>PRT
<213>Aspergillus niger
<220>
<221>MISC_FEATURE
<222>(5)..(5)
<223>氨基酸无法被明确确定
<220>
<221>MISC_FEATURE
<222>(14)..(14)
<223>未确定的氨基酸
<400>84
Val Cys Leu Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Xaa Phe
1               5                   10                  15
<210>85
<211>15
<212>PRT
<213>Aspergillus niger
<400>85
Glu Cys Asn Ile Thr Phe Gln Pro Gly Asp Ile Leu Phe Leu Arg
1               5                   10                  15
<210>86
<211>11
<212>PAT
<213>Aspergillus niger
<220>
<221>MISC_FEATURE
<222>(8)..(8)
<223>未确定的氨基酸
<400>86
Ala Glu Thr Thr Thr Asn Pro Xaa Tyr Phe Phe
1               5                   10
<210>87
<211>8
<212>PRT
<213>Aspergillus niger
<400>87
Tyr His Leu Leu Gln Ala Glu Asp
1               5
<210>88
<211>10
<212>PRT
<213>Aspergillus niger
<400>88
Leu Glu Ser Leu Val Glu Glu Val Tyr Lys
1               5                   10
<210>89
<211>16
<212>PRT
<213>Aspergillus niger
<220>
<221>MISC_FEATURE
<222>(15)..(15)
<223>未确定的氨基酸
<400>89
Leu Phe Glu Asp Val Tyr Ala Gln Lys Pro Glu Thr Ala Pro Xaa Asp
1               5                   10                  15
<210>90
<211>9
<212>PRT
<213>Aspergillus niger
<220>
<221>MISC_FEATURE
<222>(7)..(7)
<223>氨基酸无法被明确确定
<400>90
Phe Leu Phe Asn Val Pro Tyr Thr Ser
1               5
<210>91
<211>8
<212>PRT
<213>Aspergillus niger
<220>
<221>MISC_FEATURE
<222>(8)..(8)
<223>氨基酸无法被明确确定
<400>91
Gly Val Met Gly Gly Leu Gly Gly
1               5
<210>92
<211>1005
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(1002)
<223>
<400>92
atg aga gga tcg cat cac cat cac cat cac gcc gac tcc ctc ccg aaa        48
Met Arg Gly Ser His His His His His His Ala Asp Ser Leu Pro Lys
1               5                   10                  15
acc tac gac gac ctc ccc gac aag cgg cgc tac tgg ccc gca acc ccc        96
Thr Tyr Asp Asp Leu Pro Asp Lys Arg Arg Tyr Trp Pro Ala Thr Pro
            20                  25                  30
aac tcc gcc gac gag gga ctg ggg atg ctc cgt ctc ctc act cca gaa       144
Asn Ser Ala Asp Glu Gly Leu Gly Met Leu Arg Leu Leu Thr Pro Glu
        35                  40                  45
att gtc gcc aac gca gca cgc acc cag atc cag acc ggc gag cgc gta       192
Ile Val Ala Asn Ala Ala Arg Thr Gln Ile Gln Thr Gly Glu Arg Val
    50                  55                  60
tgc ctg aac tgg gac ctg gag aag ctg aac cca cca ggc ttc ggc cgc       240
Cys Leu Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe Gly Arg
65                  70                  75                  80
aaa ccc ttc gcc cac cac gta aaa tgg gtc tcc gaa ggc cac gcc ttc       288
Lys Pro Phe Ala His His Val Lys Trp Val Ser Glu Gly His Ala Phe
                85                  90                  95
gac gac gaa tac cac ttc aac ccg caa caa tcc tcc caa tgg gac ggt       336
Asp Asp Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly
            100                 105                 110
ctg cga cac cac aac gcc ccg gct cca acc ccc gac gac cct aac cgc       384
Leu Arg His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asn Arg
        115                 120                 125
cgg gtc ttc tac ggc ggc acc acc tcc acc gag atc ctc gac ccc tcg       432
Arg Val Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser
    130                 135                 140
tcc acc cga atc ggc ata gcc cac tgg gcc aag aaa ggc atc gcc ggc       480
Ser Thr Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly
145                 150                 155                 160
cgc ggc gtc ctc atc gac tac gcc tcc tac gtg caa cga acc aag ggc       528
Arg Gly Val Leu Ile Asp Tyr Ala Ser Tyr Val Gln Arg Thr Lys Gly
                165                 170                 175
gtc aca gta aac gcc cta acc cgc cac acc gtc tcc ctg gac gac gtc       576
Val Thr Val Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val
            180                 185                 190
ctc acc atc gcg aag gaa tgc aac atc acc ttc gaa cca ggc gac att       624
Leu Thr Ile Ala Lys Glu Cys Asn Ile Thr Phe Glu Pro Gly Asp Ile
        195                 200                 205
ctc ttc ctg cgc gtc ggt cta ccg act aca tgg gat aac atg acc gat       672
Leu Phe Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Thr Asp
    210                 215                 220
gag gag agg gtc aag tat agt cag cag gaa acg ccc aac cat gca gga       720
Glu Glu Arg Val Lys Tyr Ser Gln Gln Glu Thr Pro Asn His Ala Gly
225                 230                 235                 240
tta gag cag agt gag cgt gtg gtg cgg ttc ctt tgg gat cag cat ttc       768
Leu Glu Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe
                 245                 250                 255
gcc gct gta gcg ggt gat gcg gtc agc ttt gag gtg tat ccg ccg gta       816
Ala Ala Val Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val
            260                 265                 270
gag aag gag tgg gat tta cat cat ttt ttg ctg gct ggg tgg gga cta       864
Glu Lys Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Leu
        275                 280                 285
ccg att ggg gag atg ttt gat ctt gag ggg ttg aag gag gtg tgt gag       912
Pro Ile Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu
    290                 295                 300
agg ttg gga agg tgg acg ttt ttc gtt agt tct agt ccg ttg aac tgt       960
Arg Leu Gly Arg Trp Thr Phe Phe Val Ser Ser Ser Pro Leu Asn Cys
305                 310                 315                 320
ggg aga ggt gtg tcg agt ccg ccg aat tgt atg gca att ttt taa          1005
Gly Arg Gly Val Ser Ser Pro Pro Asn Cys Met Ala Ile Phe
                325                 330
<210>93
<211>334
<212>PRT
<213>Aspergillus niger
<400>93
Met Arg Gly Ser His His His His His His Ala Asp Ser Leu Pro Lys
1               5                   10                  15
Thr Tyr Asp Asp Leu Pro Asp Lys Arg Arg Tyr Trp Pro Ala Thr Pro
            20                  25                  30
Asn Ser Ala Asp Glu Gly Leu Gly Met Leu Arg Leu Leu Thr Pro Glu
        35                  40                  45
Ile Val Ala Asn Ala Ala Arg Thr Gln Ile Gln Thr Gly Glu Arg Val
     50                  55                  60
Cys Leu Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe Gly Arg
65                  70                  75                  80
Lys Pro Phe Ala His His Val Lys Trp Val Ser Glu Gly His Ala Phe
                85                  90                  95
Asp Asp Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly
            100                 105                 110
Leu Arg His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asn Arg
        115                 120                 125
Arg Val Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser
    130                 135                 140
Ser Thr Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly
145                 150                 155                 160
Arg Gly Val Leu Ile Asp Tyr Ala Ser Tyr Val Gln Arg Thr Lys Gly
                165                 170                 175
Val Thr Val Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val
            180                 185                 190
Leu Thr Ile Ala Lys Glu Cys Asn Ile Thr Phe Glu Pro Gly Asp Ile
        195                 200                 205
Leu Phe Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Thr Asp
    210                 215                 220
Glu Glu Arg Val Lys Tyr Ser Gln Gln Glu Thr Pro Asn His Ala Gly
225                 230                 235                 240
Leu Glu Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe
                245                 250                 255
Ala Ala Val Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val
            260                 265                 270
Glu Lys Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Leu
        275                 280                 285
Pro Ile Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu
    290                 295                 300
Arg Leu Gly Arg Trp Thr Phe Phe Val Ser Ser Ser Pro Leu Asn Cys
305                 310                 315                 320
Gly Arg Gly Val Ser Ser Pro Pro Asn Cys Met Ala Ile Phe
                325                 330
<210>94
<211>992
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(9)..(983)
<223>
<400>94
gaattcaa atg gcc gac tcc ctc ccg aaa acc tac gac gac ctc ccc gac       50
         Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp
         1               5                   10
aag cgg cgc tac tgg ccc gca acc ccc aac tcc gcc gac gag gga ctg        98
Lys Arg Arg Tyr Trp Pro Ala Thr Pro Asn Ser Ala Asp Glu Gly Leu
15                  20                  25                  30
ggg atg ctc cgt ctc ctc act cca gaa att gtc gcc aac gca gca cgc       146
Gly Met Leu Arg Leu Leu Thr Pro Glu Ile Val Ala Asn Ala Ala Arg
                35                  40                  45
acc cag atc cag acc ggc gag cgc gta tgc ctg aac tgg gac ctg gag       194
Thr Gln Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu
            50                  55                  60
aag ctg aac cca cca ggc ttc ggc cgc aaa ccc ttc gcc cac cac gta       242
Lys Leu Asn Pro Pro Gly Phe Gly Arg Lys Pro Phe Ala His His Val
        65                  70                  75
aaa tgg gtc tcc gaa ggc cac gcc ttc gac gac gaa tac cac ttc aac       290
Lys Trp Val Ser Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn
    80                  85                  90
ccg caa caa tcc tcc caa tgg gac ggt ctg cga cac cac aac gcc ccg       338
Pro Gln Gln Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro
95                  100                 105                 110
gct cca acc ccc gac gac cct aac cgc cgg gtc ttc tac ggc ggc acc       386
Ala Pro Thr Pro Asp Asp Pro Asn Arg Arg Val Phe Tyr Gly Gly Thr
                115                 120                 125
acc tcc acc gag atc ctc gac ccc tcg tcc acc cga atc ggc ata gcc       434
Thr Ser Thr Glu Ile Leu Asp Pro Ser Ser Thr Arg Ile Gly Ile Ala
            130                 135                 140
cac tgg gcc aag aaa ggc atc gcc ggc cgc ggc gtc ctc atc gac tac       482
His Trp Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr
        145                 150                 155
gcc tcc tac gtg caa cga acc aag ggc gtc aca gta aac gcc cta acc       530
Ala Ser Tyr Val Gln Arg Thr Lys Gly Val Thr Val Asn Ala Leu Thr
    160                 165                 170
cgc cac acc gtc tcc ctg gac gac gtc ctc acc atc gcg aag gaa tgc       578
Arg His Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys
175                 180                 185                 190
aac atc acc ttc gaa cca ggc gac att ctc ttc ctg cgc gtc ggt cta       626
Asn Ile Thr Phe Glu Pro Gly Asp Ile Leu Phe Leu Arg Val Gly Leu
                195                 200                 205
ccg act aca tgg gat aac atg acc gat gag gag agg gtc aag tat agt       674
Pro Thr Thr Trp Asp Asn Met Thr Asp Glu Glu Arg Val Lys Tyr Ser
            210                 215                 220
cag cag gaa acg ccc aac cat gca gga tta gag cag agt gag cgt gtg       722
Gln Gln Glu Thr Pro Asn His Ala Gly Leu Glu Gln Ser Glu Arg Val
        225                 230                 235
gtg cgg ttc ctt tgg gat cag cat ttc gcc gct gta gcg ggt gat gcg       770
Val Arg Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala
    240                 245                 250
gtc agc ttt gag gtg tat ccg ccg gta gag aag gag tgg gat tta cat       818
Val Ser Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His
255                 260                 265                 270
cat ttt ttg ctg gct ggg tgg gga cta ccg att ggg gag atg ttt gat       866
His Phe Leu Leu Ala Gly Trp Gly Leu Pro Ile Gly Glu Met Phe Asp
                275                 280                 285
ctt gag ggg ttg aag gag gtg tgt gag agg ttg gga agg tgg acg ttt       914
Leu Glu Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe
            290                 295                 300
ttc gtt agt tct agt ccg ttg aac tgt ggg aga ggt gtg tcg agt ccg       962
Phe Val Ser Ser Ser Pro Leu Asn Cys Gly Arg Gly Val Ser Ser Pro
        305                 310                 315
ccg aat tgt atg gca att ttt taagaattc                                992
Pro Asn Cys Met Ala Ile Phe
    320                 325
<210>95
<211>325
<212>PRT
<213>Aspergillus niger
<400>95
Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg
1               5                   10                  15
Arg Tyr Trp Pro Ala Thr Pro Asn Ser Ala Asp Glu Gly Leu Gly Met
            20                  25                  30
Leu Arg Leu Leu Thr Pro Glu Ile Val Ala Asn Ala Ala Arg Thr Gln
        35                  40                  45
Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu
    50                  55                  60
Asn Pro Pro Gly Phe Gly Arg Lys Pro Phe Ala His His Val Lys Trp
65                  70                  75                  80
Val Ser Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln
                85                  90                  95
Gln Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro Ala Pro
            100                 105                 110
Thr Pro Asp Asp Pro Asn Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser
        115                 120                 125
Thr Glu Ile Leu Asp Pro Ser Ser Thr Arg Ile Gly Ile Ala His Trp
    130                 135                 140
Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser
145                 150                 155                 160
Tyr Val Gln Arg Thr Lys Gly Val Thr Val Asn Ala Leu Thr Arg His
                165                 170                 175
Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile
            180                 185                 190
Thr Phe Glu Pro Gly Asp Ile Leu Phe Leu Arg Val Gly Leu Pro Thr
        195                 200                 205
Thr Trp Asp Asn Met Thr Asp Glu Glu Arg Val Lys Tyr Ser Gln Gln
    210                 215                 220
Glu Thr Pro Asn His Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg
225                 230                 235                 240
Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala Val Ser
                245                 250                 255
Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His His Phe
            260                 265                 270
Leu Leu Ala Gly Trp Gly Leu Pro Ile Gly Glu Met Phe Asp Leu Glu
        275                 280                 285
Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val
    290                 295                 300
Ser Ser Ser Pro Leu Asn Cys Gly Arg Gly Val Ser Ser Pro Pro Asn
305                 310                 315                 320
Cys Met Ala Ile Phe
                325
<210>96
<211>1019
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(9)..(1010)
<223>
<400>96
gaattcaa atg aga gga tcg cat cac cat cac cat cac gcc gac tcc ctc       50
         Met Arg Gly Ser His His His His His His Ala Asp Ser Leu
         1               5                   10
ccg aaa acc tac gac gac ctc ccc gac aag cgg cgc tac tgg ccc gca        98
Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg Arg Tyr Trp Pro Ala
15                  20                  25                  30
acc ccc aac tcc gcc gac gag gga ctg ggg atg ctc cgt ctc ctc act       146
Thr Pro Asn Ser Ala Asp Glu Gly Leu Gly Met Leu Arg Leu Leu Thr
                35                  40                  45
cca gaa att gtc gcc aac gca gca cgc acc cag atc cag acc ggc gag       194
Pro Glu Ile Val Ala Asn Ala Ala Arg Thr Gln Ile Gln Thr Gly Glu
            50                  55                  60
cgc gta tgc ctg aac tgg gac ctg gag aag ctg aac cca cca ggc ttc       242
Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe
        65                  70                  75
ggc cgc aaa ccc ttc gcc cac cac gta aaa tgg gtc tcc gaa ggc cac       290
Gly Arg Lys Pro Phe Ala His His Val Lys Trp Val Ser Glu Gly His
    80                  85                  90
gcc ttc gac gac gaa tac cac ttc aac ccg caa caa tcc tcc caa tgg       338
Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp
95                  100                 105                 110
gac ggt ctg cga cac cac aac gcc ccg gct cca acc ccc gac gac cct       386
Asp Gly Leu Arg His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro
                115                 120                 125
aac cgc cgg gtc ttc tac ggc ggc acc acc tcc acc gag atc ctc gac       434
Asn Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp
            130                 135                 140
ccc tcg tcc acc cga atc ggc ata gcc cac tgg gcc aag aaa ggc atc       482
Pro Ser Ser Thr Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile
        145                 150                 155
gcc ggc cgc ggc gtc ctc atc gac tac gcc tcc tac gtg caa cga acc       530
Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser Tyr Val Gln Arg Thr
    160                 165                 170
aag ggc gtc aca gta aac gcc cta acc cgc cac acc gtc tcc ctg gac       578
Lys Gly Val Thr Val Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp
175                 180                 185                 190
gac gtc ctc acc atc gcg aag gaa tgc aac atc acc ttc gaa cca ggc       626
Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile Thr Phe Glu Pro Gly
                195                 200                 205
gac att ctc ttc ctg cgc gtc ggt cta ccg act aca tgg gat aac atg       674
Asp Ile Leu Phe Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met
            210                 215                 220
acc gat gag gag agg gtc aag tat agt cag cag gaa acg ccc aac cat       722
Thr Asp Glu Glu Arg Val Lys Tyr Ser Gln Gln Glu Thr Pro Asn His
        225                 230                 235
gca gga tta gag cag agt gag cgt gtg gtg cgg ttc ctt tgg gat cag       770
Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln
    240                 245                 250
cat ttc gcc gct gta gcg ggt gat gcg gtc agc ttt gag gtg tat ccg       818
His Phe Ala Ala Val Ala Gly Asp A la Val Ser Phe Glu Val Tyr Pro
255                 260                 265                 270
ccg gta gag aag gag tgg gat tta cat cat ttt ttg ctg gct ggg tgg       866
Pro Val Glu Lys Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp
                275                 280                 285
gga cta ccg att ggg gag atg ttt gat ctt gag ggg ttg aag gag gtg       914
Gly Leu Pro Ile Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val
            290                 295                 300
tgt gag agg ttg gga agg tgg acg ttt ttc gtt agt tct agt ccg ttg      962
Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val Ser Ser Ser Pro Leu
        305                 310                 315
aac tgt ggg aga ggt gtg tcg agt ccg ccg aat tgt atg gca att ttt      1010
Asn Cys Gly Arg Gly Val Ser Ser Pro Pro Asn Cys Met Ala Ile Phe
    320                 325                 330
taagaattc                                                            1019
<210>97
<211>334
<212>PRT
<213>Aspergillus niger
<400>97
Met Arg Gly Ser His His His His His His Ala Asp Ser Leu Pro Lys
1               5                   10                  15
Thr Tyr Asp Asp Leu Pro Asp Lys Arg Arg Tyr Trp Pro Ala Thr Pro
            20                  25                  30
Asn Ser Ala Asp Glu Gly Leu Gly Met Leu Arg Leu Leu Thr Pro Glu
        35                  40                  45
Ile Val Ala Asn Ala Ala Arg Thr Gln Ile Gln Thr Gly Glu Arg Val
    50                  55                  60
Cys Leu Asn Trp Asp Leu Glu Lys Leu Asn Pro Pro Gly Phe Gly Arg
65                  70                  75                  80
Lys Pro Phe Ala His His Val Lys Trp Val Ser Glu Gly His Ala Phe
                85                  90                  95
Asp Asp Glu Tyr His Phe Asn Pro Gln Gln Ser Ser Gln Trp Asp Gly
            100                 105                 110
Leu Arg His His Asn Ala Pro Ala Pro Thr Pro Asp Asp Pro Asn Arg
        115                 120                 125
Arg Val Phe Tyr Gly Gly Thr Thr Ser Thr Glu Ile Leu Asp Pro Ser
    130                 135                 140
Ser Thr Arg Ile Gly Ile Ala His Trp Ala Lys Lys Gly Ile Ala Gly
145                 150                 155                 160
Arg Gly Val Leu Ile Asp Tyr Ala Ser Tyr Val Gln Arg Thr Lys Gly
                165                 170                 175
Val Thr Val Asn Ala Leu Thr Arg His Thr Val Ser Leu Asp Asp Val
            180                 185                 190
Leu Thr Ile Ala Lys Glu Cys Asn Ile Thr Phe Glu Pro Gly Asp Ile
        195                 200                 205
Leu Phe Leu Arg Val Gly Leu Pro Thr Thr Trp Asp Asn Met Thr Asp
     210                 215                 220
Glu Glu Arg Val Lys Tyr Ser Gln Gln Glu Thr Pro Asn His Ala Gly
225                 230                 235                 240
Leu Glu Gln Ser Glu Arg Val Val Arg Phe Leu Trp Asp Gln His Phe
                245                 250                 255
Ala Ala Val Ala Gly Asp Ala Val Ser Phe Glu Val Tyr Pro Pro Val
            260                 265                 270
Glu Lys Glu Trp Asp Leu His His Phe Leu Leu Ala Gly Trp Gly Leu
        275                 280                 285
Pro Ile Gly Glu Met Phe Asp Leu Glu Gly Leu Lys Glu Val Cys Glu
    290                 295                 300
Arg Leu Gly Arg Trp Thr Phe Phe Val Ser Ser Ser Pro Leu Asn Cys
305                 310                 315                 320
Gly Arg Gly Val Ser Ser Pro Pro Asn Cys Met Ala Ile Phe
                325                 330
<210>98
<211>975
<212>DNA
<213>Aspergillus niger
<220>
<221>CDS
<222>(1)..(975)
<223>
<400>98
atg gcc gac tcc ctc ccg aaa acc tac gac gac ctc ccc gac aag cgg        48
Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg
1               5                   10                  15
cgc tac tgg ccc gca acc ccc aac tcc gcc gac gag gga ctg ggg atg        96
Arg Tyr Trp Pro Ala Thr Pro Asn Ser A la Asp Glu Gly Leu Gly Met
            20                  25                  30
ctc cgt ctc ctc act cca gaa att gtc gcc aac gca gca cgc acc cag       144
Leu Arg Leu Leu Thr Pro Glu Ile Val Ala Asn Ala Ala Arg Thr Gln
        35                  40                  45
atc cag acc ggc gag cgc gta tgc ctg aac tgg gac ctg gag aag ctg       192
Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu
    50                  55                  60
aac cca cca ggc ttc ggc cgc aaa ccc ttc gcc cac cac gta aaa tgg       240
Asn Pro Pro Gly Phe Gly Arg Lys Pro Phe Ala His His Val Lys Trp
65                  70                  75                  80
gtc tcc gaa ggc cac gcc ttc gac gac gaa tac cac ttc aac ccg caa       288
Val Ser Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln
                85                  90                  95
caa tcc tcc caa tgg gac ggt ctg cga cac cac aac gcc ccg gct cca       336
Gln Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro Ala Pro
                100                 105                 110
acc ccc gac gac cct aac cgc cgg gtc ttc tac ggc ggc acc acc tcc       384
Thr Pro Asp Asp Pro Asn Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser
            115                 120                 125
acc gag atc ctc gac ccc tcg tcc acc cga atc ggc ata gcc cac tgg       432
Thr Glu Ile Leu Asp Pro Ser Ser Thr Arg Ile Gly Ile Ala His Trp
        130                 135                 140
gcc aag aaa ggc atc gcc ggc cgc ggc gtc ctc atc gac tac gcc tcc       480
Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser
145                 150                 155                 160
tac gtg caa cga acc aag ggc gtc aca gta aac gcc cta acc cgc cac       528
Tyr Val Gln Arg Thr Lys Gly Val Thr Val Asn Ala Leu Thr Arg His
                165                 170                 175
acc gtc tcc ctg gac gac gtc ctc acc atc gcg aag gaa tgc aac atc       576
Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile
            180                 185                 190
acc ttc gaa cca ggc gac att ctc ttc ctg cgc gtc ggt cta ccg act       624
Thr Phe Glu Pro Gly AspIle Leu Phe Leu Arg Val Gly Leu Pro Thr
        195                 200                 205
aca tgg gat aac atg acc gat gag gag agg gtc aag tat agt cag cag       672
Thr Trp Asp Asn Met Thr Asp Glu Glu Arg Val Lys Tyr Ser Gln Gln
    210                 215                 220
gaa acg ccc aac cat gca gga tta gag cag agt gag cgt gtg gtg cgg       720
Glu Thr Pro Asn His Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg
225                 230                 235                 240
ttc ctt tgg gat cag cat ttc gcc gct gta gcg ggt gat gcg gtc agc       768
Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala Val Ser
                245                 250                 255
ttt gag gtg tat ccg ccg gta gag aag gag tgg gat tta cat cat ttt       816
Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His His Phe
             260                 265                 270
ttg ctg gct ggg tgg gga cta ccg att ggg gag atg ttt gat ctt gag       864
Leu Leu Ala Gly Trp Gly Leu Pro Ile Gly Glu Met Phe Asp Leu Glu
        275                 280                 285
ggg ttg aag gag gtg tgt gag agg ttg gga agg tgg acg ttt ttc gtt       912
Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val
    290                 295                 300
agt tct agt ccg ttg aac tgt ggg aga ggt gtg tcg agt ccg ccg aat       960
Ser Ser Ser Pro Leu Asn Cys Gly Arg Gly Val Ser Ser Pro Pro Asn
305                 310                 315                 320
tgt atg gca att ttt                                                   975
Cys Met Ala Ile Phe
                325
<210>99
<211>325
<212>PRT
<213>Aspergillus niger
<400>99
Met Ala Asp Ser Leu Pro Lys Thr Tyr Asp Asp Leu Pro Asp Lys Arg
1               5                   10                  15
Arg Tyr Trp Pro Ala Thr Pro Asn Ser Ala Asp Glu Gly Leu Gly Met
            20                  25                  30
Leu Arg Leu Leu Thr Pro Glu Ile Val Ala Asn Ala Ala Arg Thr Gln
        35                  40                  45
Ile Gln Thr Gly Glu Arg Val Cys Leu Asn Trp Asp Leu Glu Lys Leu
    50                  55                  60
Asn Pro Pro Gly Phe Gly Arg Lys Pro Phe Ala His His Val Lys Trp
65                  70                  75                  80
Val Ser Glu Gly His Ala Phe Asp Asp Glu Tyr His Phe Asn Pro Gln
                85                  90                  95
Gln Ser Ser Gln Trp Asp Gly Leu Arg His His Asn Ala Pro Ala Pro
            100                 105                 110
Thr Pro Asp Asp Pro Asn Arg Arg Val Phe Tyr Gly Gly Thr Thr Ser
        115                 120                 125
Thr Glu Ile Leu Asp Pro Ser Ser Thr Arg Ile Gly Ile Ala His Trp
    130                 135                 140
Ala Lys Lys Gly Ile Ala Gly Arg Gly Val Leu Ile Asp Tyr Ala Ser
145                 150                 155                 160
Tyr Val Gln Arg Thr Lys Gly Val Thr Val Asn Ala Leu Thr Arg His
                165                 170                 175
Thr Val Ser Leu Asp Asp Val Leu Thr Ile Ala Lys Glu Cys Asn Ile
            180                 185                 190
Thr Phe Glu Pro Gly Asp Ile Leu Phe Leu Arg Val Gly Leu Pro Thr
        195                 200                 205
Thr Trp Asp Asn Met Thr Asp Glu Glu Arg Val Lys Tyr Ser Gln Gln
     210                 215                 220
Glu Thr Pro Asn His Ala Gly Leu Glu Gln Ser Glu Arg Val Val Arg
225                 230                 235                 240
Phe Leu Trp Asp Gln His Phe Ala Ala Val Ala Gly Asp Ala Val Ser
                245                 250                 255
Phe Glu Val Tyr Pro Pro Val Glu Lys Glu Trp Asp Leu His His Phe
             260                 265                 270
Leu Leu Ala Gly Trp Gly Leu Pro Ile Gly Glu Met Phe Asp Leu Glu
        275                 280                 285
Gly Leu Lys Glu Val Cys Glu Arg Leu Gly Arg Trp Thr Phe Phe Val
    290                 295                 300
Ser Ser Ser Pro Leu Asn Cys Gly Arg Gly Val Ser Ser Pro Pro Asn
305                 310                 315                 320
Cys Met Ala Ile Phe
                325

Claims (9)

1.一种核苷酸序列,其编码具有选择性水解R-或S-泛酸内酯的活性的蛋白,所述核苷酸序列选自下述多核苷酸构成的组:
(a)如SEQ ID NO:5所示的多核苷酸;
(b)编码如SEQ ID NO:6所示的多肽的多核苷酸。
2.如权利要求1所述的核苷酸序列,其从A.niger MacRae ATCC46951获得。
3.一种表达载体,其中包含如权利要求1或2所述的核苷酸序列。
4.用如权利要求3所述的表达载体转化过的宿主细胞。
5.一种多肽,其具有泛酸内酯水解酶活性,由权利要求1所述的核苷酸序列编码。
6.如权利要求5所述的多肽,其为SEQ ID NO:6。
7.如权利要求5或6中任意一项所述的多肽,其从A.niger MacRaeATCC 46951获得。
8.如权利要求5至7中任意一项所述的多肽用于对R-或S-泛酸内酯进行选择性水解的用途。
9.一种生产R-泛酸或其盐或R-泛酰醇的方法,所述方法包括如下步骤:在如权利要求5至7中任意一项所述的多肽存在的情况下,对R-或S-泛酸内酯进行选择性水解。
CN2004800085042A 2003-03-28 2004-03-19 泛酸内酯水解酶 Expired - Lifetime CN1768141B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US45922003P 2003-03-28 2003-03-28
US60/459,220 2003-03-28
PCT/EP2004/002902 WO2004085651A2 (en) 2003-03-28 2004-03-19 Pantolactone hydrolase

Publications (2)

Publication Number Publication Date
CN1768141A CN1768141A (zh) 2006-05-03
CN1768141B true CN1768141B (zh) 2012-10-10

Family

ID=33098294

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2004800085042A Expired - Lifetime CN1768141B (zh) 2003-03-28 2004-03-19 泛酸内酯水解酶

Country Status (5)

Country Link
JP (1) JP4571936B2 (zh)
KR (1) KR101156882B1 (zh)
CN (1) CN1768141B (zh)
GB (1) GB2413329B (zh)
WO (1) WO2004085651A2 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105669837B (zh) * 2015-06-03 2020-01-17 苏州大学 血管内皮钙黏蛋白抗原表位、抗体及其应用
CN110358687B (zh) * 2018-12-19 2020-12-04 安徽瑞达健康产业有限公司 一株产d泛解酸内酯水解酶的赤霉菌及应用、发酵方法
CN111621541B (zh) * 2019-02-27 2025-10-31 广安摩珈生物科技有限公司 使用电渗析技术拆分光学异构体的方法
EP3748009A1 (en) * 2019-06-07 2020-12-09 DSM IP Assets B.V. Synthesis of (r)-pantolactone acetate

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1166182A (zh) * 1995-09-13 1997-11-26 富士药品工业株式会社 D-泛酸内酯水解酶和编码该酶的基因

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5411875A (en) * 1991-11-01 1995-05-02 University Of Iowa Research Foundation Method for retrieval of unknown flanking DNA sequence
WO1993011261A1 (en) * 1991-11-25 1993-06-10 Keygene N.V. A novel pcr method with a single primer for nucleic acid analysis
DE19849348A1 (de) * 1998-10-26 2000-04-27 Univ Ludwigs Albert Linear Amplification mediated PCR (=LAM PCR)
MXPA02003417A (es) * 1999-10-29 2002-08-20 Basf Ag L-pantolactona-hidrolasa y un procedimiento para la obtencion de d-pantolactona.

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1166182A (zh) * 1995-09-13 1997-11-26 富士药品工业株式会社 D-泛酸内酯水解酶和编码该酶的基因

Also Published As

Publication number Publication date
JP2006521103A (ja) 2006-09-21
GB2413329B (en) 2007-09-19
WO2004085651A2 (en) 2004-10-07
GB2413329A (en) 2005-10-26
JP4571936B2 (ja) 2010-10-27
CN1768141A (zh) 2006-05-03
KR20050119151A (ko) 2005-12-20
GB0516602D0 (en) 2005-09-21
KR101156882B1 (ko) 2012-07-05
WO2004085651A3 (en) 2005-01-20

Similar Documents

Publication Publication Date Title
JP2001505403A (ja) エステラーゼ
KR20020097210A (ko) 아시도보락스 파실리스 72w로부터의 니트릴라제에 대한유전자의 단리 및 발현 방법
US8034579B2 (en) Proteins with enhanced functionality and methods of making novel proteins using circular permutation
US11634698B2 (en) Nucleases and methods for making and using them
EP0433117B1 (en) Novel polypeptides, the DNA sequences allowing their expression, method of preparation, and utilization
ES2628225T3 (es) Preparación de beta-aminoácidos
CN1768141B (zh) 泛酸内酯水解酶
CN100379867C (zh) 丁炔醇ⅰ酯酶
US7229817B2 (en) Recombinant porcine liver esterases, their use and a method for the production thereof
JPWO2004078951A1 (ja) ラクトナーゼの製法およびその利用
CN110951711A (zh) 一种具有降解手性酯活性的酯酶及其编码基因和应用
KR101081012B1 (ko) 클로로히드린 및 하이드록시카르복실산 에스테르 부제가수분해 효소 유전자
CA2635380C (en) Polypeptide having esterase activity and recombinant esterase and use thereof
JP2540540B2 (ja) リパ―ゼ遺伝子及び組み換え体dna
JP5619400B2 (ja) 酸性ホスファターゼ及びそれをコードする核酸、並びにこれらを利用したリボフラビン−5’−リン酸の製造方法
JP3855329B2 (ja) エステラーゼ遺伝子及びその利用
JP4345425B2 (ja) クロロヒドリン及びヒドロキシカルボン酸エステル不斉加水分解酵素遺伝子
WO1993023547A1 (en) ENZYMATIC PROCESS FOR PRODUCTION OF S-6-METHOXY-α-METHYL-2-NAPHTHALENEACETIC ACID
CN114736887A (zh) 羧酸酯酶的用途
CN102382847A (zh) 一种环氧水解酶基因、编码蛋白及其应用
JP2002247985A (ja) Dna修復酵素遺伝子
JP2001238682A (ja) 還元酵素をコードする遺伝子
JP2005261317A (ja) ジメチルアルギニンジメチルアミノヒドロラーゼ、その遺伝子、組み換え体dna及びジメチルアルギニンジメチルアミノヒドロラーゼの製造法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20121010