CN1169734A

CN1169734A - 角化细胞生长因子的纯化方法

Info

Publication number: CN1169734A
Application number: CN95196795A
Authority: CN
Inventors: E·W·徐; W·C·肯尼; T·特雷塞尔
Original assignee: Amgen Inc
Current assignee: Swedish Orphan Biovitrum AB
Priority date: 1994-10-13
Filing date: 1995-10-12
Publication date: 1998-01-07
Anticipated expiration: 2015-10-12
Also published as: DE69530599T2; HU220584B1; HUT76879A; DK0785949T3; CA2201762A1; DE69530599D1; JP3877226B2; EP1334981B1; IL147575A; CN1161380C; WO1996011952A1; EP1334981A2; CA2201762C; EP0785949B1; MX9702481A; EP1334981A3; AU709362B2; NO971567D0; SK43097A3; IL115605A0

Abstract

本发明涉及角化细胞生长因子的纯化。

Description

角化细胞生长因子的纯化方法

发明领域

本发明涉及蛋白纯化领域。具体地说，本发明涉及角化细胞生长因子纯化领域。

发明背景

多肽生长因子是细胞间通讯的重要介质(Rubin等(1989)美国国家科学院院刊86：802-806)。这些分子通常由一种细胞类型释放，影响其它细胞类型的增殖。

生长因子的一个家族是成纤维细胞生长因子(FGF)。目前已知8种FGF家族成员，它们在一级结构上有亲缘关系：碱性成纤维细胞生长因子，bFGF(Abraham等(1986)，EMBO杂志，5：2523-2528)；酸性成纤维细胞生长因子aFGF(Jaye等(1986)，科学，233：541-545)；int-2基因产物，int-2(Dickson和Peters(1987)，自然，326：833)；hst/kFGF(Delli-Bovi等(1987)，细胞，50：729-737)和Yoshida等(1987)美国国家科学院院刊84：7305-7309)；FGF-5(Zhan等(1988)，分子细胞生物学8：3487-3495)；FGF-6(Marics等(1989)，癌基因，4：335-340)；角化细胞生长因子(Finch等(1989)，科学，24：752-755；Rubin等(1989)，美国国家科学院院刊，86：802-806；Ron等(1993)，生物化学杂志，268(4)：2984-2988；和Yan等(1991)，体外细胞发育生物学27A：437-438)；以及富组亲动蛋白(hisactophilin)(Habazzettl等(1992)，自然，359：855-858)。

FGF家族蛋白中角化细胞生长因子(KGF)是间质组织来源的非成纤维上皮(尤其是角化细胞)细胞增殖的专一性效应物。术语“天然KGF”指具有SEQ ID NO：2给出的氨基酸序列的天然人类(hKGF)或重组(rKGF)多肽(带或不带信号序列)或其等位变异体。(除非另有说明，本文描述的分子的氨基酸编号对应SEQ ID NO：2的氨基酸32至194给出的天然分子成熟形式(无信号序列)的编号。)

可从天然来源分离到天然KGF。例如可从胚胎肺成纤维细胞系条件化的培养基中分离到hKGF(Rubin等(1989)，引文同上)。三个层析步骤，即肝素-琼脂糖^TM(Pharmacia，Piscataway，新泽西)亲和层析，HPLC凝胶过滤和反相HPLC被用来获得纯化的hKGF制备物。从10升条件培养基中回收约6mg hKGF。根据细胞分裂素活性试验，这些层析步骤仅回收了0.8％的总hKGF。另一个实施例讲授用另一种层析步骤，用肝素-琼脂糖^TM亲和层析和Mono-S^TM离子交换层析(Pharmacia，Piscataway，新泽西)分离细菌生产的rKGF(Ron等(1993)，生物化学杂志，268：2984-2988)。

角化细胞生长因子的性质表明有可能将它用作特异性刺激上皮细胞生长的药物。因此需要研制出一种或多种方法来得到相当大量的均质角化细胞生长因子，以提供足够量的物质用于全面的体外和体内生物评价及用于潜在的医疗用途。

本发明的目的是提供一种新的角化细胞生长因子纯化方法。

发明概述

本发明涉及角化细胞生长因子(KGF)的第一种纯化方法，该方法包括：

a)得到含KGF的溶液；

b)将来自步骤(a)溶液中的KGF与阳离子交换树脂结合；

c)用洗脱溶液从阳离子交换树脂上洗脱KGF；

d)将步骤(c)的洗脱液通过分子量排阻基质；

e)从分子量排阻基质中回收KGF。

本发明进一步涉及角化细胞生长因子(KGF)的第二种纯化方法，该方法包括：

a)得到含KGF的溶液；

b)将来自步骤(a)溶液中的KGF与阳离子交换树脂结合；

c)用洗脱溶液从阳离子交换树脂上洗脱KGF；

d)对步骤(c)洗脱液作斥水作用层析；

e)从步骤(d)的斥水作用层析中回收KGF。

一般可用适当的缓冲液(例如磷酸盐缓冲盐水，乙酸钠或Tris-HCl)在优选pH 6.8-7.5范围进行第一和第二种方法的阳离子交换层析步骤。用于该步骤的合适的柱子包括羧甲基纤维素，羧甲基琼脂糖和硫酸化琼脂糖和纤维素柱(例如S-琼脂糖Fast Flow^TM树脂柱，Mono-S^TM树脂柱和CM-纤维素柱^TM脂柱，购自Pharmacia，Piscataway，新泽西)。流速依柱大小而变。

可用任意合适的缓冲液(例如磷酸盐缓冲液，优选pH为约7.0和7.5进行第一种方法的凝胶过滤步骤。用于此步骤的合适柱子包括基于琼脂糖、基于丙烯酰胺、基于二氧化硅或基于聚合物的排阻柱(例如SephadexG-75^TM和Superdex-75^TM树脂柱，可购自Pharmacia)。

在第二种方法的具体优选实施方案中，在斥水作用步骤之前可将游离巯基氧化，讨论见下。可用任何氧化方式。例如蛋白可暴露于空气中的氧一段时间。可选地用各种氧化方法。一种方法特别适用于角化细胞生长因子，其中与天然KGF分子相比，一个或多个半胱氨酸残基缺失或被取代。该方法中将氧化剂(例如，胱胺二盐酸盐或其它适当的氧化剂，如胱氨酸、氧化型谷胱甘肽或二价铜)加至终浓度，优选地调pH至7-9.5之间，在用胱胺二盐酸盐时更优选pH9.0±0.3，优选地保持温度10-30℃一段时间。氧化天然KGF或有类似半胱氨酸残基模式(pattern)的其它角化细胞生长因子可用第二种方法。该方法中，氧化是这样完成的：加入合适量的离子强度修饰剂(例如(NH₄)₂SO₄)，优选地调pH至7.5-9.5，优选地23±5℃适当时间。

用合适的缓冲液(例如磷酸钠)，pH优选地在约6.0-8.0之间，更优选地为约pH7.0，以2-0M的递减线性(NH₄)₂SO₄梯度洗脱，以完成第二种方法的斥水作用步骤。用于些步骤的适宜柱子包括烷基或苯基取代的树脂(例如丁基-650 Toyopearl^TM树脂柱，购自Toyohaas Inc.，Montgomeryville，宾州，以及苯基琼脂糖^TM树脂柱和苯基Superose^TM树脂柱，购自Pharmacia)。

本发明的方法可用于纯化KGF。因此应当理解术语“角化细胞生长因子”和“KGF”用在本说明书中指包括，并且除非另有说明，可互换地指，天然KGF和KGF类似物蛋白(或“突变蛋白”)，KGF类似物蛋白的特征在于，其肽序列基本上与天然KGF肽序列相同并且保留天然KGF的部分或全部生物活性，尤其是非成纤维上皮细胞增殖活性(例如表现为激活BALB/MK角化细胞的激活比NIH/3T3成纤维细胞强至少500倍，BALB/MK角化细胞的激活比BS/589上皮细胞或CC1208上皮细胞的激活强至少50倍，由H胸苷掺入确定)。“特征在于，其肽序列基本上与天然KGF肽序列相同”指的是能优选地在严谨杂交条件下与SEQ ID NO：1的核苷酸201至684杂交的DNA序列编码的肽序列。

为确定两段氨基酸序列的对应氨基酸位置可将两段序列并列，使残基的匹配最大化，包括平移氨基和/或羧基端，需要时在候选物中引入间隙(gap)或去除作为插入序列的残基。可用已知且常规的序列同源性/-致性扫描算法程序(例如Pearson和Lipman(1988)，美国国家科学院院刊，85：2444-2448；Altschul等(1990)，分子生物学杂志，215：403-410；Lipman和Pearson(1985)，科学，222：1435或Devereux等(1984)，核酸研究，12：387-395)作数据库检索、序列分析和操作。

杂交时的严谨条件是杂交反应中盐、温度、有机溶剂和其它典型受控参数的严谨组合条件。严谨杂交条件的例子是在4×SSC中62-67℃杂交，然后用0.1×SSC在62-67℃洗约1小时。可选地，严谨杂交条件的例子为在45-55％甲酰胺、4×SSC中40-45℃杂交(见T.Maniatis等，分子克隆实验指南，冷泉港实验室(1982)，387至389页)。

因此，蛋白包括天然KGF的片段、嵌合体或杂交分子的等位变异体或氨基酸的缺失、替换或插入。KGF的一个例子包括这样一些蛋白，其相应于SEQ ID NO：2中的Cys¹和Cys¹⁵的残基被替换或缺失，所得分子的稳定性比原分子高(见共有的U.S.S.N.0.8/487,825，1995年7月7日提交)。KGF的另一个例子包括电荷变化多肽，其中天然KGF的氨基酸残基41-154中一个或多个(优选的是残基Arg⁴¹、Gln⁴³、Lys⁵⁵、Lys⁹⁵、Lys¹²⁸、Asn¹³⁷、Gln¹³⁸、Lys¹³⁹、Arg¹⁴⁴、Lys¹⁴⁷、Gln¹⁵²、Lys¹⁵³或Thr¹⁵⁴)缺失或被中性残基或带负电荷的残基替换，使蛋白正电荷减少(见共有的U.S.S.N.08/323,337，1994年10月13日提交)，另一KGF的例子包括将具有高度环形成能力的至少一个氨基酸替换天然KGF的环形成区Asn¹¹⁵-His¹¹⁶-Tyr¹¹⁷-Asn¹¹⁸-Thr¹¹⁹中至少一个氨基酸得到的蛋白(见共有的U.S.S.N.08/327,473，1994年10月13日提交)。另一个例子包括在天然KGF的123-133区(SEQ ID NO：2的氨基酸154-164)有一个或多个氨基酸替换、缺失或添加的蛋白；这些蛋白可能具有激动或拮抗活性。

特别公开的蛋白包括下列KGF分子(表示的方法为：SEQ ID NO：2给出的成熟蛋白(无信号序列)中该位置的氨基酸，后面是括号中的该氨基酸位置，再后面是替换的残基或用“-”表示缺失)：C(1，15)S、ΔN15-ΔN24、ΔN3/C(15)S、ΔN3/C(15)-、ΔN8/C(15)S、ΔN8/C(15)-、C(1，15)S/R(144)E、C(1，15)S/R(144)Q、ΔN23/R(144)Q、C(1，15，40)S、C(1，15，102)S、C(1，15，102，106)S、ΔN23/N(137)E、ΔN23/K(139)E、ΔN23/K(139)Q、ΔN23/R(144)A、ΔN23/R(144)E、ΔN23/R(144)L、ΔN23/K(147)E、ΔN23/K(147)Q、ΔN23/K(153)E、ΔN23/K(153)Q、ΔN23/Q(152)E/K(153)E；R(144)Q和H(116)G。

本领域专业人员也应当理解，许多宿主-载体系统可用来表达KGF蛋白编码序列。这包括但不限于真核细胞系统，如病毒(例如牛痘病毒、腺病毒等)感染的哺乳动物细胞系统；病毒(如杆状病毒)感染的昆虫细胞系统；微生物如含有酵母载体的酵母；或原核细胞系统如噬菌体DNA，质粒DNA或粘粒DNA转化的细菌。这些载体的表达元件的强度和特异性不同。根据所用的宿主-载体系统可用许多合适的转录和翻译元件中的任一种。

一旦KGF表达的蛋白产物被分离、纯化及检测KGF活性(用本领域专业人员所知的方法)，可将其配成许多药物组合物。典型地这些组合物含有合适的，通常化学成分确定的药剂载体或赋形剂，根据给药所需形式，还可含有其它成分。这种组合物可含有水质载体或由固相制剂组成，其中KGF被加入非水质载体如胶原、透明质酸和各种聚合物。组合物可适当地配制以便用多种途径给药，包括注射、口服、局部、鼻腔内和肺部给药。

附图简述

图1给出天然KGF的核苷酸(SEQ ID NO：1)和氨基酸(SEQ IDNO：2)序列(编码天然KGF成熟形式的核苷酸由SEQ ID NO：1的碱基201至681给出，KGF成熟形式由SEQ ID NO：2的氨基酸残基32至194给出)。

图2A、2B和2C分别给出pCFM 1156，pCFM 1656和pCFM 3102的质粒图谱。

图3给出RSH-KGF构建体的核苷酸(SEQ ID NO：3)和氨基酸(SEQ ID NO：4)序列。

图4给出包含于KGF质粒的构建体的核苷酸(SEQ ID NO：5)和氨基酸(SEQ ID NO：6)序列。

图5给出化学合成的OLIGO(OLIGO#6至OLIGO#11；分别为SEQID NO：12-17)。它们被用于在包含于KGF质粒的构建体中将Kpn I位点和EcoRI位点之间的DNA序列替换成Kpn I位点(SEQ ID NO：6中的氨基酸位置46-85)，以制备KGF(dsd)中的构建体。

图6给出用于构建KGF(密码子最优化)的化学合成OLIGO(OLIGO#12至OLIGO#24，分别为SEQ ID NO：18-30)。

图7给出在天然KGF氨基酸位置1和15用丝氨酸替换半胱氨酸的KGF类似物C(1，15)S的核苷酸(SEQ ID NO：31)和氨基酸(SEQ IDNO：32)序列。

图8给出天然KGF氨基酸位置1和15的半胱氨酸被替换成丝氨酸且氨基酸位置144的精氨酸被替换成谷氨酸的KGF类似物C(1，15)S/R(144)E的核苷酸(SEQ ID NO：33)和氨基酸(SEQ ID NO：34)序列。

图9给出天然KGF氨基酸位置1和15的半胱氨酸被替换成丝氨酸且氨基酸位置144的精氨酸被替换成谷酰胺的KGF类似物C(1，15)S/R(144)Q的核苷酸(SEQ ID NO：35)和氨基酸(SEQ ID NO：36)序列。

图10给出天然KGF N末端前15个氨基酸缺失的KGF类似物ΔN15的核苷酸(SEQ ID NO：37)和氨基酸(SEQ ID NO：38)序列。

图11给出天然KGF N末端前23个氨基酸缺失的KGF类似物ΔN23的核苷酸(SEQ ID NO：39)和氨基酸(SEQ ID NO：40)序列。

图12给出天然KGF N末端前23个氨基酸缺失且氨基酸位置144的精氨酸被替换成谷酰胺的KGF类似物ΔN23/R(144)Q的核苷酸(SEQ ID NO：41)和氨基酸(SEQ ID NO：42)序列。

实施例

下列实施例描述的许多操作规程的标准方法或合适的可选操作规程，由常见的分子生物学手册提供，如《分子克隆》第二版，Sambrook等，冷泉港实验室出版社(1987)和《分子生物学当代操作方法》Ausabel等，Green出版附属机构/Wiley交叉科学，纽约(1990)。实施例1：制备编码KGF和KGF类似物的DNA

通过动物细胞RNA的聚合酶链式反应(PCR)和化学合成的(大肠杆菌最优化密码子)寡聚核苷酸(“OLIGO”)的PCR克隆全长人类KGF基因(编码具有天然KGF序列的多肽)。两种方法的描述如下：

用从已知生产该多肽的细胞中分离的RNA作PCR扩增。首先用硫氰胍破碎人类成纤维细胞系AG1523A(得自医学研究用人类遗传变异细胞培养物保藏中心，Camden，新泽西)细胞，然后提取(根据Chomyzinski等(1987)，生化年刊，172：156的方法)。用总RNA的标准逆转录酶操作方法生成KGF cDNA。用KGF cDNA作模板，引物OLIGO#1和OLIGO#2编码KGF基因5′和3′的DNA序列，进行KGF基因的PCR(PCR#1)扩增(9600型热循环仪(Perkin-Elmer Cetus，Norwalk，康涅迪格)；28个循环；每个循环为94℃变性1分钟，60℃退火2分钟，72℃延长3分钟)。PCR#1产物的等分试样用作第二轮KGF PCR(PCR#2)扩增的模板，扩增条件同上，仅是退火温度为50℃。对KGF基因的表达克隆用嵌套PCR引物制造KGF基因两端的方便的限制位点。用OLIGO#3和OLIGO#4修饰PCR#2的DNA产物，在基因的5′和3′端分别引入MluI和Bam HI限制位点(PCR#3，30个循环；每个循环包括94℃变性1分钟，60℃退火2分钟，72℃延长3分钟)。然后将DNA用MluI和Bam HI切割，酚抽提，乙醇沉淀。再重悬并(用T4连接酶)连接到含“RSH”信号序列的序列的pCFM1156质粒中(图2A)得到RSH-KGF构建体(图3)。

连接产物转化(根据Hanahan(1983)，分子生物学杂志，166：557的方法)大肠杆菌FM5菌株(ATCC：53911)，在LB+卡那霉素上28℃铺平板。选几个转化体，在含20μg/ml卡那霉素的小量液体培养物中生长。从每种培养物的细胞中分离RSH-KGF质粒，进行DNA测序。由于KGF基因内在的Nde I位点不可能将天然基因序列直接克隆到含有括号内的NdelI和Bam HI限制位点的所需表达载体中。用三步(three-way)连接可以做到。在专一的Bsm I和Sst I限制位点切割RSH-KGF质粒，用1％琼脂糖凝胶电泳后分离到～3kbp的DNA片段(含有KGF基因的3′端)。进行PCR(PCR#4)，如进行PCR#3时所述但将OLIGO#3换成OLIGO#5。然后用Nde I和Bsm I切割PCR DNA产物，4％琼脂糖凝胶电泳后分离到311bp的DNA片段。连接用的第三段是pCFM1156用NdeI和Sst I切割后1％琼脂糖凝胶电泳分离的1.8kbpDNA片段。如上述连接(T4连接酶)、转化、卡那霉素筛选和DNA测序，挑选含有图4的构建体和名为KGF的质粒的克隆。由于有产生截短产物的内在核糖体结合位点，用嵌合合成的OLIGO(OLIGO#6至OLIGO#11)取代专一性Kpn I和EcoR I位点间的KGF DNA序列以最少使用内在起始位点(图5)。

OLIGO#1 (SEQID NO：7)： 5′-CAATGACCTAGGAGTAACAATCAAC-3′

OLIGO#2 (SEQID NO：8)： 5′-AAAACAAACATAAATGCACAAGTCCA-3′

OLIGO#3 (SEQID NO：9)： 5′-ACAACGCGTGCAATGACATGACTCCA-3′

OLIGO#4 (SEQID NO：10)：

5′-ACAGGATCCTATTAAGTTATTGCCATAGGAA-3′

OLIGO#5 (SEQID NO：11)：

5′-ACACATATGTGCAATGACATGACTCCA-3′

OLIGO#6 (SEQID NO：12)：

5′-CTGCGTATCGACAAACGCGGCAAAGTCAAGGGCACCC-3′

OLIGO#7 (SEQID NO：13)：

5′-AAGAGATGAAAAACAACTACAATATTATGGAAATCCGTACTGTT-3′

OLIGO#8 (SEQID NO：14)：

5′-GCTGTTGGTATCGTTGCAATCAAAGGTGTTGAATCTG-3′

OLIGO#9 (SEQID NO：15)：

5′-TCTTGGGTGCCCTTGACTTTGCCGCGTTTGTCGATACGCAGGTAC-3′

OLIGO#10 (SEQID NO：16)：

5 ′-ACAGCAACAGTACGGATTTCCATAATATTGTAGTTGTTTTTCATC-3′

OLIGO#11 (SEQID NO：17)：

5′-AATTCAGATTCAACACCTTTGATTGCAACGATACCA-3′

OLIGO用T4多聚核苷酸激酶磷酸化，再热变性。温度缓慢降至室温使单链(ss)OLIGO形成双链DNA片段。用T4连接酶将内在OLIGO粘末端和整个双链OLIGO片段共价连接到Kpn I和EcoR I切割的KGF质粒上。将新质粒命名为KGF(dsd)。

用PCR扩增化学合成的OLIGO#12至24，构建完整的大肠杆菌密码子最优化的KGF基因。OLIGO#12 (SEQID NO：18)： 5′-AGTTTTGATCTAGAAGGAGG-3′OLIGO#13 (SEQID NO：19)： 5′-TCAAAACTGGATCCTATTAA-3′OLIGO#14 (SEQID NO：20)：

5′-AGTTTTGATCTAGAAGGAGGAATAACATATGTGCAACGACATGAC-

TCCGGAACAGATGGCTACCAACGTTAACTGCTCCAGCCCGGAACGT-3′OLIGO#15 (SEQID NO：21)：

5′-CACACCCGTAGCTACGACTACATGGAAGGTGGTGACATCCGTGTTC-

GTCGTCTGTTCTGCCGTACCCAGTGGTACCTGCGTATCGACAAA-3′OLIGO#16 (SEQID NO：22)：

5′-CGTGGTAAAGTTAAAGGTACCCAGGAAATGAAAAACAACTA-

CAACATCATGGAAATCCGTACTGTTGCTGTTGGTATCGTTGCAATCAAA-3′

OLIGO#17(SEQ ID NO：23)：

5′-GGTGTTGAATCTGAATTCTACCTGGCAATGAACAAAGAAGGTAAAC-

TGTACGCAAAAAAAGAATGCAACGAAGACTGCAACTTCAAAGAA-3′

OLIGO#18(SEQ ID NO：24)：

5 ′-CTGATCCTGGAAAACCACTACAACACCTACGCATCTGCTAAATGGA-

CCCACAACGGTGGTGAAATGTTCGTTGCTCTGAACCAGAAAGGT-3′

OLIGO#19(SEQID NO：25)：

5′-ATCCCGGTTCGTGGTAAAAAAACCAAAAAAGAACAGAAAACCGCT-

CACTTCCTGCCGATGGCAATCACTTAATAGGATCCAGTTTTGA-3′

OLIGO#20(SEQ ID NO：26)：5′-TACGGGTGTGACGTTCCGGG-3′

OLIGO#21(SEQ ID NO：27)：5′-CTTTACCACGTTTGTCGATA-3′

OLIGO#22(SEQ ID NO：28)：5′-ATTCAACACCTTTGATTGCA-3′

OLIGO#23(SEQ ID NO：29)：5′-CCAGGATCAGTTCTTTGAAG-3′

OLIGO#24(SEQ ID NO：30)：5′-GAACCGGGATACCTTTCTGG-3′

OLIGO#12至24被设计成无论是“Watson”还是“Crick”链编码天然KGF的整个DNA序列均由OLIGO表示，经PCR扩增能生产出需要的双链DNA序列(图6)(PCR#5，9600型热循环仪，Perkin-ElmerCetus；21个循环；每个循环包括94℃变性31秒，50℃退火31秒，73℃延伸31秒；21个循环完成后最后延伸7分钟终止PCR)。PCR扩增后用Xba I和Bam HI切割DNA片段，将521bp片段连接到用相同酶切割的表达质粒pCFM1156中。PCR#5用外在引物(100pmol/100μlrxn)OLIGO#12和OLIGO#13，1μl/100μl rxn的由连接(T4连接酶)OLIGO#14至OLIGO#19(OLIGO#15至OLIGO#18用T4多聚核苷酸激酶磷酸化)并且OLIGO#20至OLIGO#24作连接的band-aid寡聚核苷酸(Jayaraman等(1992)，生物技术12∶392)得到的KGF模板。最终的构建体称为KGF(密码子最优化)。

所有本文描述的KGF类似物部分地由见于KGF(dsd)或KGF(密码子最优化)或二者组合的DNA序列组成。在编码用一种或多种上述DNA片段合成技术制得的特定KGF氨基酸的DNA序列中方便的限制位点插入序列以进一步修饰这些序列。用上述技术可合成任一全部上述类似物。不过，作为一般OLIGO设计的一部分，适当时用最优化的大肠杆菌密码子，尽管在受检查的任一基因中部分或全部为大肠杆菌优化密码子并不会显著增大从培养的细菌细胞中得到的蛋白的产率。图7到12用合适的例子给出如下特定KGF类似物的核苷酸和氨基酸序列构建体：C(1，15)S(图7)；C(1，15)S/R(144)E(图8)；C(1，15)S/R(144)Q(图9)；ΔN15(图10)；ΔN23(图11)和ΔN23/R(144)Q(图12)。本文描述的所有KGF类似物构建体均由DNA序列证实。实施例2从大肠杆菌中纯化

用三种不同的表达质粒克隆KGF类似物基因，即pCFM1156(ATCC#69702)，pCFM1656(ATCC#69576)和pCFM 3102(分别为图2A，2B和2C)。通过用PCR重叠寡聚物诱变作一系列定点碱基变化可从pCFM1156质粒得到p3 102质粒。从质粒复制启动子PcopB紧邻5′的Bgl III位点(pCFM1656质粒bP#180)开始前进至质粒复制基因，碱基对变化如下：pCFM1656 bp# pCFM1656中的碱基对在pCFM3102中碱基对变成

# 204 T/A C/G

# 428 A/T G/C

# 509 G/C A/T

# 617 -- 插入2个G/C碱基对

# 677 G/C T/A

# 978 T/A C/G

# 992 G/C A/T

# 1002 A/T C/G

# 1005 C/G T/A

# 1026 A/T T/A

# 1045 C/G T/A

# 1176 G/C T/A

# 1464 G/C T/A

# 2026 G/C 碱基对缺失

# 2186 C/G T/A

# 2479 A/T T/A

# 2498-2501 AGTG GTCA

TCAC CAGT# 2641-2647 TCCGAGC 碱基对缺失

AGGCTCG# 3441 G/C A/T# 3452 G/C A/T# 3649 A/T T/A# 4556 -- 插入的碱基对

(SEQ ID NO：67)5′-GAGCTCACTAGTGTCGACCTGCAG-3′

(SEQ ID NO：68)3′-CTCGAGTGATCACAGCTGGACGTC-5′

从上可见pCFM1156，pCFM1656和pCFM3102十分相似且含有许多相同的限制位点。为方便起见选取了这些质粒，以便新构建体可简单地交换载体DNA组分。所有克隆操作均用宿主大肠杆菌菌株FM5(ATCC：53911)，用Gene Pulser^TM转染仪(BioRad Laboraties INC.Hercules加州)。根据生产商的说明用电洗脱或根据Hanahan((1983)，引文见上)的方法进行转化。

首先，将O.1ml适当菌株的冷冻甘油贮存物转移到含500ml Luria肉汤的2L烧瓶中，得到在3个pCFM载体之一含有所需构建体的所需重组大肠杆菌克隆的小量新鲜培养接种物。30℃振荡培养16小时，然后将培养物转移到含8L无菌分批培养基的15L发酵罐中(Tsai等(1987)，工业微生物学杂志2：181-187)。

从用投料#1培养基送料开始批量送料发酵(Tsai等(1987)，引文见上)。OD600达到35时，迅速将培养物温度升至37℃以扩增质粒。37℃两小时后，将培养物的温度迅速升至使CI阻遏物变性。停加投料1，改加投料2，开始送料的速率为300ml/小时。投料2含有175g/L胰蛋白胨，87.5g/L酵母提取物，260g/L葡萄糖。42℃1小时后，将培养物温度降至36℃，保温6小时。

然后终止发酵，通过离心至1L离心管中的塑料袋里收集细胞。400rpm离心60分钟得细胞沉淀，除去上清，-90℃冰冻细胞糊状物。

各种KGF类似物在大肠杆菌中表达后，用下述方法纯化天然KGF、C(1，15)S、C(1，15)S/R(144)E、C(1，15)S/R(144)Q、ΔN15、ΔN23和ΔN23/R(144)Q。高细胞密度发酵得到的细胞糊悬浮于4℃O.2M NaCl，20mM NaPO₄、pH7.5中得10-20％溶液(重量/体积)，用合适的高剪切混合器完成。然后将溶液通过匀浆器(APV Gaulin，Inc.Everett，麻省)三次裂解悬浮细胞。用合适的热交换装置将流出的匀浆冷却至4-8℃。用J-6B^TM离心机(Beckman仪器公司，Brea，加州)，JS4.2转头，4200 rpm 4℃离心30-60分钟除去裂解物中的残片。然后将上清小心地脱水，上样到预先制好的4℃0.2M NaCl，20mM NaPO₄，pH7.5平衡的450ml(5cm×23cm)S-琼脂糖Fast Flow^TM树脂柱上(Pharmacia，Piscataway，新泽西)。接下来用5倍柱体积的0.4M NaCl，20mM NaPO₄，pH7.5 4℃洗柱。用5L 0.5M NaCl，20mM NaPO₄，pH7.5洗脱下所需蛋白。再次收集50mL级分，持续监测洗脱液的A₂₈₀。A₂₈₀鉴定的含有洗脱物质的级分用14％凝胶作SDS-PAGE来验证所需多肽的存在。

然后收集含所需蛋白的级分，再加入等体积蒸馏水。将稀释的样品上样到先前制好的用0.4M NaCl，20mM NaPO₄，pH6.8 4℃平衡的450ml(5cm×23cm)S-琼脂糖Fast Flow柱。用2250mL 0.4M NaCl，20mMNaPO₄，pH6.8洗柱，再用20柱体积的从0.4M NaCl，20mM NaPO₄，pH6.8到0.6M NaCl，20mM NaPO₄，pH6.8的线性梯度洗脱蛋白。再收集50mL级分，持续监测洗脱液的A₂₈₀。收集含有蛋白的级分(用14％SDS-PAGE确定)，再通过一个350cc搅拌室(Amicon Inc.Mayberry，麻省)中的YM-10膜(10,000截断分子量)浓缩至30-40 mL体积。

预先制好1,300mL(44cm×85cm)Superdex-75^TM树脂(Pharmacia)用含有1×PBS(Dulbecco氏磷酸盐缓冲盐水，“D-PBS”，无钙无镁)或0.15M NaCl，20mM NaPO₄，pH7.0的柱缓冲液平衡，将浓缩物加样。样品进入柱后，用柱缓冲液从凝胶过滤基质中洗脱蛋白。此后回收10mL级分，汇集含类似物(14％SDS-PAGE确定)的级分。典型的最终汇集物中蛋白浓度为约5-10mg/mL。除非另有说明，上述操作均在4-8℃下进行。

用可选的纯化方法纯化天然KGF、C(1，15)S和ΔN23。该方法包括下述步骤，除非特别说明，所有方法、溶液和物质均在23±5℃。

细菌发酵生产阶段完成后，将细胞培养物冷却至4-8℃，离心或用相似方法收集细胞。根据每单位重量细胞糊中预计的蛋白产量和需要纯化的蛋白量，将适当重量的细胞糊悬浮于5倍细胞糊重量的20mMNaPO₄，0.2M NaCl，pH7.5温和缓冲液。用高剪切混合器将细胞分散成均质溶液。匀浆过程中保持细胞糊分散液的温度为4-8℃。

然后加压裂解细胞，例如将细胞浆分散液通过适当大小的细胞匀浆器两次。将匀浆低温保持于5±3℃。用预先制好的装备了具有适当量的滤器表面积的滤器，用适当体积的0.2M NaCl，20mM NaPO₄，pH7.5平衡的深度滤器套(housing)(Cuno公司，Meriden，CT)使细胞裂解物澄清。平衡和澄清在5±3℃下进行。澄清前用适当量的合适的过滤助剂将滤器预包被并且与细胞裂解物彻底混合，之后将溶液通过滤器以澄清裂解物。用0.2M NaCl，20mM NaPO₄，pH7.5洗滤器。将滤过液和任何后续清洗液收集于适当容积的冷冻容器中，所有操作均低于10℃。

澄清后的裂解物通过预先制好的SP-琼脂糖Fast Flow柱，每2g细胞裂解物至少1mL树脂。SP-琼脂糖Fast Flow柱用冷的(5±3℃)0.2M NaCl，20mM NaPO₄，pH7.5平衡。保持柱的温度低于10℃。澄清后的裂解物(5±3℃)加样到离子交换树脂上，持续监测洗脱物的A₂₈₀。样品上样后先用冷的0.2M NaCl，20mM NaPO₄，pH7.5洗柱再用23±5℃的0.3M NaCl，20mM NaPO₄，pH7.5洗柱。

用范围为0.2-1M NaCl，20mM NaPO₄，pH7.5的线性梯度洗脱所需蛋白。根据洗脱物的A₂₈₀收集几个级分的大量产品。洗脱后合并这些级分并记下体积。

进行氧化步骤以氧化游离的巯基。对于与天然KGF相比半胱氨酸模式改变的蛋白，加氧化剂(例如，胱胺二盐酸化物或其它合适的氧化剂如胱氨酸，氧化型谷胱甘肽或二价铜)至终浓度1-20mM，pH调至7-9.5，用胱胺二盐酸化物时在pH9.0±0.3 10-30℃下氧化适当长的时间。氧化天然KGF蛋白时加入适量的(NH₄)₂SO₄，如1-2M(NH₄)₂SO₄，调pH7.5±0.5，在一段时间内保持温度为23±5℃。

氧化后，将溶液pH调到6.5和9.5之间。必要的话在溶液中加入固体(NH₄)₂SO₄，终浓度2M。将溶液通过适当的澄清滤器除去颗粒。

过滤的氧化产物作斥水作用层析(HIC)。HIC基质是丁基-650MToyopearl^TM树脂(Tosohaas Inc.，Montgomeryville，宾州)。将含蛋白溶液上样到预先用2M(NH₄)₂SO₄，0.15M NaCl，20mM NaPO₄，pH7.0平衡的柱上。上样后用2M(NH₄)₂SO₄，0.15M NaCl，20mM NaPO₄，pH7.0洗柱。用0.15M NaCl，20mM NaPO₄，pH7.0中递降线性2-0M的(NH₄)₂SO₄梯度洗脱所需蛋白。洗脱液A₂₈₀增加显示所需蛋白开始洗脱，收集这些级分。每级分的等分试样用SDS-PAGE分析。然后收集含所需蛋白的各级分，彻底混合，确定合并物体积及其中蛋白浓度。

合并的含蛋白HIC洗脱液被浓缩并更换洗脱缓冲液。典型地将蛋白浓缩至5.0-10.0mg/ml。用配备了PelLIcon^TM盒式系统(Millipore公司，Bedford，麻省)和合适截止大小的膜的超滤系统作超滤。

浓缩后，将样品对合适的缓冲液透滤。浓缩步骤的留存物对0.15MNaCl，20mM NaPO₄，pH7.0透滤直到留存物的电导在0.15M NaCl，20mM NaPO₄，pH7.0溶液的电导的5％以内。

另外将浓缩透滤的含蛋白样品通过0.1μm Posidyne^TM滤膜(PallInc.，Cortland，NY)去除可能存在的沉淀物和细菌内毒素。确定了溶液的蛋白浓度并根据最终大量产品所需浓度，用0.15M NaCl，20mM磷酸钠，pH7.0将溶液稀释至所需终浓度。然后用0.22μm滤膜作最后的无菌过滤，将最终的大量产品转移至不含致热源的容器中贮存(约5℃)和进一步配制。实施例3：从哺乳动物细胞培养物中纯化

本实施例描述在哺乳动物表达系统中生产的两种生物活性重组KGF(rKGF)形式的表达，分离和表征。

用PCR扩增得自正常人类真皮成纤维细胞(Clonetech公司，圣迭戈，加州)的cDNA，分离到人类KGF基因。用逆转录酶制得cDNA后用PCR扩增KGF基因。用OLIGO#25和OLIGO#26从cDNA中扩增出基因，第二次PCR扩增后用OLIGO#27和OLIGO#28在片段末端加上Hind III和BglII限制位点，如图1所述。

OLIGO#25(SEQ ID NO：45)： 5′-CAATCTACAATTCACAGA-3′

OLIGO#26(SEQ ID NO：46)： 5′-TTAAGTTATTGCCATAGG-3′

OLIGO#27(SEQ ID NO：47)： 5′-AACAAAGCTTCTACAATTCACAGATAGGA-3′

OLIGO#28(SEQ ID NO：48)： 5′-AACAAGATCTTAAGTTATTGCCATAGG-3′

克隆和确证DNA序列后使用KGF基因DNA。用OLIGO#29和OLIGO#30进行扩增。

OLIGO#29(SEQ.ID.NO：49)：

5′-CGGTCTAGACCACCATGCACAAATGGATACTGACATGG-3′

OLIGO#30(SEQ.ID.NO：50)：

5′-GCCGTCGACCTATTAAGTTATTGCCATAGGAAG-3′

有义引物OLIGO#29在起始密码子ATG上游有Xba I位点和一致Kozak翻译序列(5′-CCACC-3′)。反义引物OLIGO#30含有SalI克隆位点和另一个终止密码子。PCR扩增(94℃变性30秒，55℃退火40秒，72℃延伸40秒)18个循环后，用Xba I和SalI消化产物并与类似消化的pDSRα2的DNA连接(根据Bourdrel等(1993)，蛋白实验与纯化，4：130-140和Lu等(1992)，Arch.Biochem.Biophys.，298：150-158)的方法)。这样得到KGF/pDSRα2质粒，其中人类KGF基因在SV40早期启动子和α-FSH多聚腺苷化序列之间。选出两个克隆，DNA序列分析证实构建到所需载体。

用Pvu I线性化2微克KGF/pDSRα2 DNA。然后用标准磷酸钙沉淀法(Bourdrel等，引文见上)用处理过的DNA转染前一天接种到0.8×10⁶细胞/60mm的培养血中的中国仓鼠卵巢(CHO)细胞里。两周后选出单个的克隆转移到24孔板上。细胞汇合后调节培养基被认为不含血清，用抗大肠杆菌表达的人类KGF的多克隆兔抗血清Western印迹法分析其等分试样。

Western印迹：样品在12.5％(W/V)SDS聚丙烯酰胺上走胶，用半干转移仪(Hoefer Scientific Instruments，旧金山，加州)400mA 1小时电印迹到硝酸纤维素膜上。转移缓冲液是20mM Tris，150mM甘氨酸，25％甲醇。用PBS中10％正常山羊血清温育，封闭硝酸纤维素膜。用抗大肠杆菌来源的KGF的兔抗血清作一抗。使用时用PBS中1％正常山羊血清稀释10,000倍，与封闭的硝酸纤维素膜室温温育12小时，然后用PBS洗3次，每次30分钟，除去多余的抗体。硝酸纤维素膜在100ml含Vectastain^TM生物素化山羊抗兔IgG(二抗，Vector Labs，Burlingame，加州)的PBS中1％正常山羊血清里室温温育30分钟。用PBS洗3次，每次10分钟。之后在100ml依制造商说明(Vector Labs)制备的含链亲合素(streptavidin)和生物素化过氧化物酶的1％正常山羊血清溶液中室温温育30分钟。用PBS洗3次后用100ml PBS中的60μL30％(W/V)H₂O₂和20mL甲醇中的50mg 4-氯萘酚混合物温育，将KGF交叉反应物质显色。10分钟后水洗终止反应。

分析印迹显示KGF特异性抗体与三个不同蛋白带相联系，其中两个紧密相关，分子量为约25-29KDa，另一个估计分子量为约17KDa，而163个氨基酸的成熟蛋白的估计分子量约为18.8KDa。另外，用Western分析确定分泌量大于2.0mg rKGF每升的几个高度表达克隆被选出并被移入摇瓶(根据Lu等人的方法，引文见上)以得到大体积的无血清的条件化培养基，用于阳离子交换层析和凝胶过滤纯化KGF，如下述。

纯化3升无血的条件化培养基中的KGF。将填充了450ml磺乙基阳离子交换柱，一种用20mM磷酸钠pH7.5预平衡过的S琼脂糖Fast Flow(Pharmacia)柱用培养基直接上柱。用5倍柱体积的20mM磷酸钠，0.2M NaCl pH7.5洗柱。然后用20倍柱体积的20mM磷酸钠，pH7.5中0.2至1.0M NaCl线性梯度洗脱rKGF。收集50mL级分并持续A₂₈₀监测。用SDS-PAGE分析每一级分的等分试样以检测KGF蛋白。用预制的14％Tris-甘氨酸预制凝胶(根据Laemmli(1970)自然，227：680-685的方法)在电泳系统(Novex，圣迭戈，加州)上作SDS-PAGE。上样前将样品与非还原性SDS样品缓冲液混合，不需加热。用考马斯蓝或银染检测蛋白。看到两个晚期洗脱峰含有蛋白带，对应Western印迹检测到的25-29KDa和17KDa带。含有这些峰的级分分别浓缩到小于1.0mL的体积中作凝胶过滤。

凝胶过滤用的Superdex-75^TM树脂柱(HR10/30，Pharmacia)用PBS，pH7.2预平衡，用下述分子量标准(BioRad，旧金山，加州)甲状腺球蛋白(670KDa)，γ球蛋白(158KDa)，卵清蛋白(44KDa)，肌球蛋白(17KDa)和维生素B-12(1.4KDa)标定。经过这些纯化步骤得到的rKGF约被纯化2000倍，特别包括由银染确定的17KDa和30KDa的物质。

由于是较高分子量的物质，rKGF被作为主要对称峰洗出，该峰被称作KGF-a。用SDS-PAGE分析少量该物质(3μg/泳道对6μg/泳道)分辨出有1-2KDa分子量差异的两条带。将低分子量物质KGF-b凝胶过滤得到具有预计移动率的蛋白制备物。KGF-a和KGF-b的纯化后总回收率均为约30-40％。

还分析了KGF-a和KGF-b的氨基酸序列。仪器是自动测序仪(477A或470A型，应用生物系统公司，Foster城，加州)，装备有120A型在线PTH氨基酸分析仪和900A型数据收集系统(用Lu等(1991)，生物化学杂志，266：8102-8107的方法)。KGF-a的Edman序列分析显示主要N末端序列为X₁-N-D-M-T-P-E-Q-M-A-T-N-V-X₂-X₃-S-[SEQID NO：51]。从N末端第三个氨基酸天冬氨酸起始的次级序列占整个可测序蛋白的1.6％。由于序列分析时没有苯基乙内酰硫脲基(phenylthiohydantoinyl)(PHT)氨基酸信号，因此不能确定X₁，X₂和X₃。由cDNA预测的KGF的N末端氨基酸序列显示X₁和X₃是Cys残基，X₂是天冬酰胺。X₁和X₃不存在显示这些半胱氨酸可能形成二硫桥。根据同义N连糖基化序列Asn-X-Ser，对应于X₂的预测的Asn残基不存在显示这是潜在的N连糖基化位点。

有趣的是，KGF-bN末端序列分析显示N末端氨基酸序列为S-Y-D-Y-M-E-G-G-D-I-R-V-(SEQ ID NO：52)表明它是KGF的N末端截短形式，在Arg³²-Ser²⁴肽键处被蛋白水解切割。

用已知方法(Sasaki等(1987)，生物化学杂志，262：12059-12076；Takeuchi等(1988)，生物化学杂志，263：3657-3663；Zsebo等(1990)，细胞，63：195-201)用糖苷酶(唾液酸苷酶，O-聚糖酶和/或N-聚糖酶)处理蛋白来进一步将纯化的KGF-a和KGF-b定性。这些数据显示KGF-a含N连和O连糖。而低分子量形式的KGF-b可能只含N连糖。糖苷酶处理并不能使KGF-b分子量减少，表明该分子未糖基化。实施例4：生物活性

稀释每种KGF类似物，通过测量Balb/MK细胞的[³H]胸苷摄入(用Rubin等(1989)的方法，引文见上)试验其生物活性。首先用含有50％定制的Eagle氏MEM，50％定制的F12，5μg/mL转铁蛋白，5ng/ml硒酸钠，0.0005％HSA和0.005％Tween 20的生物试验培养基稀释样品。然后将KGF样品加到接种了Balb/MK细胞的Falcon primeria 96孔板中。测量DNA合成中[³H]胸苷的摄入，并通过与天然KGF标准曲线对照转化成输入天然KGF浓度。每种受试的类似物均表现促细胞分裂剂活性。

用从Balb/MK小鼠表皮角化细胞制取的分离的KGF受体膜制备物检查与KGF受体的相互作用(操作步骤依据Massague(19932)，生物化学杂志，258：13614-13620)。具体地说，各种形式的KGF用50mMTirs-HCl，pH7.5含0.2％牛血清清蛋白稀释至浓度在每50μL 0.8至100ng范围内。它们单独地与膜制备物(75ng/mL)和¹²⁵I标记的大肠杆菌来源的KGF(1.5ng)温育。在4℃进行受体结合和竞争实验16小时，其后取样、离心，用上述稀释缓冲液洗两次，除去未结合和非特异性结合的标记的KGF。对样品计量剩余的放射性。用非竞争百分比对每个KGF样品浓度作图，做KGF样品和标记的KGF受体结合的竞争曲线。放射性受体试验非竞争实验显示大肠杆菌来源的KGF，KGF-a和KGF-b有相似的受体结合活性。

尽管本发明已被一般地以及用优选实施方案作了如上描述，本领域专业人员应当理解基于上述描述，可以有其它的变异形式或修饰存在。

序列表(1)一般资料：(i) 申请人：Amgen Inc.(ii) 发明名称：角化细胞生长因子的纯化方法(iii)序列数：52(iv)相关地址：

(A)收信人：Amgen Inc

(B)街道：1840 DeHavilland Drive

(C)城市：Thousand Oaks

(D)州：California

(E)国家：U.S.A

(F)邮编：91320-1789(v)计算机可读形式：

(A)介质类型：软盘

(B)计算机：IBM PC兼容型

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0，Version#1.25(vi)当前申请资料：

(A)申请号：US08/487,830

(B)提交日期：

(C)分类：未知(2)SEQ ID NO：1的资料：(i)序列特征：

(A)长度：862个碱基对

(B)类型：核酸

(C)链型：未知

(D)拓扑类型：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：1：CAATCTACAA TTCACAGATA GGAAGAGGTC AATGACCTAG GAGTAACAAT CAACTCAAGA 60TTCATTTTCA TTATGTTATT CATGAACACC CGGAGCACTA CACTATAATG CACAAATGGA 120TACTGACATG GATCCTGCCA ACTTTGCTCT ACAGATCATG CTTTCACATT ATCTGTCTAG 180TGGGTACTAT ATCTTTAGCT TGCAATGACA TGACTCCAGA GCAAATGGCT ACAAATGTGA 240ACTGTTCCAG CCCTGAGCGA CACACAAGAA GTTATGATTA CATGGAAGGA GGGGATATAA 300GAGTGAGAAG ACTCTTCTGT CGAACACAGT GGTACCTGAG GATCGATAAA AGAGGCAAAG 360TAAAAGGGAC CCAAGAGATG AAGAATAATT ACAATATCAT GGAAATCAGG ACAGTGGCAG 420TTGGAATTGT GGCAATCAAA GGGGTGGAAA GTGAATTCTA TCTTGCAATG AACAAGGAAG 480GAAAACTCTA TGCAAAGAAA GAATGCAATG AAGATTGTAA CTTCAAAGAA CTAATTCTGG 540AAAACCATTA CAACACATAT GCATCAGCTA AATGGACACA CAACGGAGGG GAAATGTTTG 600TTGCCTTAAA TCAAAAGGGG ATTCCTGTAA GAGGAAAAAA AACGAAGAAA GAACAAAAAA 660CAGCCCACTT TCTTCCTATG GCAATAACTT AATTGCATAT GGTATATAAA GAACCCAGTT 720CCAGCAGGGA GATTTCTTTA AGTGGACTGT TTTCTTTCTT CTCAAAATTT TCTTTCCTTT 780TATTTTTTAG TAATCAAGAA AGGCTGGAAA AACTACTGAA AAACTGATCA AGCTGGACTT 840GTGCATTTAT GTTTGTTTTA AG 862(2)SEQ ID NO：2的资料：(i)序列特征：

(A)长度：194个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述： SEQ ID NO：2：Met His Lys Trp Ile Leu Thr Trp Ile Leu Pro Thr Leu Leu Tyr Arg1 5 10 15Ser Cys Phe His Ile Ile Cys Leu Val Gly Thr Ile Ser Leu Ala Cys

20 25 30Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Cys Ser Ser

35 40 45Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile

50 55 60Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg Ile Asp65 70 75 80Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn Tyr Asn

85 90 95Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile Lys Gly

100 105 110Val Glu Ser Glu phe Tyr Leu Ala Met Asn Lys Glu Gly Lys Leu Tyr

115 120 125Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu Ile Leu

130 135 140Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His Asn Gly145 150 155 160Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val Arg Gly

165 170 175Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro Met Ala

180 185 190Ile Thr(2)SEQ ID NO：3的资料：(i)序列特征：

(A)长度：595个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述： SEQ ID NO：3：ATCGATTTGA TTCTAGAAGG AGGAATAACA TATGAAAAAG CGCGCACGTG CTATCGCCAT 60TGCTGTGGCT CTGGCAGGTT TCGCAACTAG TGCACACGCG TGCAATGACA TGACTCCAGA 120GCAAATGGCT ACAAATGTGA ACTGTTCCAG CCCTGAGCGA CACACAAGAA GTTATGATTA 180CATGGAAGGA GGGGATATAA GAGTGAGAAG ACTCTTCTGT CGAACACAGT GGTACCTGAG 240GATCGATAAA AGAGGCAAAG TAAAAGGGAC CCAAGAGATG AAGAATAATT ACAATATCAT 300GGAAATCAGG ACAGTGGCAG TTGGAATTGT GGCAATCAAA GGGGTGGAAA GTGAATTCTA 360TCTTGCAATG AACAAGGAAG GAAAACTCTA TGCAAAGAAA GAATGCAATG AAGATTGTAA 420CTTCAAAGAA CTAATTCTGG AAAACCATTA CAACACATAT GCATCAGCTA AATGGACACA 480CAACGGAGGG GAAATGTTTG TTGCCTTAAA TCAAAAGGGG ATTCCTGTAA GAGGAAAAAA 540AACGAAGAAA GAACAAAAAA CAGCCCACTT TCTTCCTATG GCAATAACTT AATAG 595(2)SEQ ID NO：4的资料：(i)序列特征：

(A)长度：186个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：4：Met Lys Lys Arg Ala Arg Ala Ile Ala Ile Ala Val Ala Leu Ala Gly1 5 10 15Phe Ala Thr Ser Ala His Ala Cys Asn Asp Met Thr Pro Glu Gln Met

20 25 30Ala Thr Asn Val Asn Cys Ser Ser Pro Giu Arg His Thr Arg Ser Tyr

35 40 45Asp Tyr Met Glu Gly Gly Asp Iie Arg Val Arg Arg Leu Phe Cys Arg

50 55 60Thr Gln Trp Tyr Leu Arg Ile Asp Lys Arg Gly Lys Val Lys Gly Thr65 70 75 80Gln Glu Met Lys Asn Asn Tyr Asn Ile Met Glu Ile Arg Thr Val Ala

85 90 95Val Gly Ile Val Ala Ile Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala

100 105 110Met Asn Lys Glu Gly Lys Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp

115 120 125Cys Asn Phe Lys Glu Leu Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala

130 135 140Ser Ala Lys Trp Thr His Asn Gly Gly Glu Met Phe Val Ala Leu Asn145 150 155 160Gln Lys Gly Ile Pro Val Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys

165 170 175Thr Ala His Phe Leu Pro Met Ala Ile Thr

180 185(2)SEQ ID NO：5的资料：(i)序列特征：

(A)长度：499个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：5：TATGTGCAAT GACATGACTC CAGAGCAAAT GGCTACAAAT GTGAACTGTT CCAGCCCTGA 60GCGACACACA AGAAGTTATG ATTACATGGA AGGAGGGGAT ATAAGAGTGA GAAGACTCTT 120CTGTCGAACA CAGTGGTACC TGAGGATCGA TAAAAGAGGC AAAGTAAAAG GGACCCAAGA 180GATGAAGAAT AATTACAATA TCATGGAAAT CAGGACAGTG GCAGTTGGAA TTGTGGCAAT 240CAAAGGGGTG GAAAGTGAAT TCTATCTTGC AATGAACAAG GAAGGAAAAC TCTATGCAAA 300GAAAGAATGC AATGAAGATT GTAACTTCAA AGAACTAATT CTGGAAAACC ATTACAACAC 360ATATGCATCA GCTAAATGGA CACACAACGG AGGGGAAATG TTTGTTGCCT TAAATCAAAA 420GGGGATTCCT GTAAGAGGAA AAAAAACGAA GAAAGAACAA AAAACAGCCC ACTTTCTTCC 480TATGGCAATA ACTTAATAG 499(2)SEQ ID NO：6的资料：(i)序列特征：

(A)长度：164个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：6：Met Cys Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Cys1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly

20 25 30Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg

35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn

50 55 60Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile65 70 75 80Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly Lys

85 90 95Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu

100 105 110Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His

115 120 125Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val

130 135 140Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro145 150 155 160Met Ala Ile Thr(2)SEQ ID NO：7的资料：(i)序列特征：

(A)长度：25个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：7：CAATGACCTA GGAGTAACAA TCAAC 25(2)SEQ ID NO：8的资料：(i)序列特征：

(A)长度：26个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：8：AAAACAAACA TAAATGCACA AGTCCA 26(2)SEQ ID NO：9的资料：(i)序列特征：

(A)长度：26个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：9：

26

ACAACGCGTG CAATGACATG ACTCCA(2)SEQ ID NO：10的资料：(i)序列特征：

(A)长度： 31个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：10：ACAGGATCCT ATTAAGTTAT TGCCATAGGA A 31(2)SEQ ID NO：11的资料：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：11：ACACATATGT GCAATGACAT GACTCCA 27(2)SEQ ID NO：12的资料：(i)序列特征：

(A)长度：37个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知 (ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：12：CTGCGTATCG ACAAACGCGG CAAAGTCAAG GGCACCC 37(2)SEQ ID NO：13的资料：(i)序列特征：

(A)长度：44个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：13：AAGAGATGAA AAACAACTAC AATATTATGG AAATCCGTAC TGTT 44(2)SEQ ID NO：14的资料：(i)序列特征：

(A)长度：37个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：14：

37GCTGTTGGTA TCGTTGCAAT CAAAGGTGTT GAATCTG(2)SEQ ID NO：15的资料：(i)序列特征：

(A)长度：45个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述： SEQ ID NO：15：TCTTGGGTGC CCTTGACTTT GCCGCGTTTG TCGATACGCA GGTAC 45(2)SEQ ID NO：16的资料：(i)序列特征：

(A)长度：45个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述： SEQ ID NO：16：ACAGCAACAG TACGGATTTC CATAATATTG TAGTTGTTTT TCATC 45(2)SEQ ID NO：17的资料：(i)序列特征：

(A)长度：36个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：17：AATTCAGATT CAACACCTTT GATTGCAACG ATACCA 36(2)SEQ ID NO：18的资料：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：18：

AGTTTTGATC TAGAAGGAGG 20(2)SEQ ID NO：19的资料：

(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：19：TCAAAACTGG ATCCTATTAA 20(2)SEQ ID NO：20的资料：(i)序列特征：

(A)长度：91个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：20：AGTTTTGATC TAGAAGGAGG AATAACATAT GTGCAACGAC ATGACTCCGG AACAGATGGC 60TACCAACGTT AACTGCTCCA GCCCGGAACG T 91(2)SEQ ID NO：21的资料：(i)序列特征：

(A)长度：90个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：21：CACACCCGTA GCTACGACTA CATGGAAGGT GGTGACATCC GTGTTCGTCG TCTGTTCTGC 60CGTACCCAGT GGTACCTGCG TATCGACAAA 90(2)SEQ ID NO：22的资料：(i)序列特征：

(A)长度：90个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：22：CGTGGTAAAG TTAAAGGTAC CCAGGAAATG AAAAACAACT ACAACATCAT GGAAATCCGT 60ACTGTTGCTG TTGGTATCGT TGCAATCAAA 90(2)SEQ ID NO：23的资料：

(i)序列特征：

(A)长度：90个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：23：GGTGTTGAAT CTGAATTCTA CCTGGCAATG AACAAAGAAG GTAAACTGTA CGCAAAAAAA 60GAATGCAACG AAGACTGCAA CTTCAAAGAA 90(2)SEQ ID NO：24的资料：

(i)序列特征：

(A)长度：90个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：24：CTGATCCTGG AAAACCACTA CAACACCTAC GCATCTGCTA AATGGACCCA CAACGGTGGT 60GAAATGTTCG TTGCTCTGAA CCAGAAAGGT 90(2)SEQ ID NO：25的资料：(i)序列特征：

(A)长度：88个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：25：ATCCCGGTTC GTGGTAAAAA AACCAAAAAA GAACAGAAAA CCGCTCACTT CCTGCCGATG 60GCAATCACTT AATAGGATCC AGTTTTGA 88(2)SEQ ID NO：26的资料：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：26：TACGGGTGTG ACGTTCCGGG

20(2)SEQ ID NO：27的资料：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：27：CTTTACCACG TTTGTCGATA 20(2)SEQ ID NO：28的资料：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：28：

ATTCAACACC TTTGATTGCA 20(2)SEQ ID NO：29的资料：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：29：CCAGGATCAG TTCTTTGAAG 20(2)SEQ ID NO：30的资料：(i)序列特征：

(A)长度：20个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：30：GAACCGGGAT ACCTTTCTGG 20(2)SEQ ID NO：31的资料：(i)序列特征：

(A)长度：495个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：31：ATGTCTAATG ATATGACTCC GGAACAGATG GCTACCAACG TTAACTCCTC CTCCCCGGAA 60CGTCACACGC GTTCCTACGA CTACATGGAA GGTGGTGACA TCCGCGTACG TCGTCTGTTC 120TGCCGTACCC AGTGGTACCT GCGTATCGAC AAACGCGGCA AAGTCAAGGG CACCCAAGAG 180ATGAAAAACA ACTACAATAT TATGGAAATC CGTACTGTTG CTGTTGGTAT CGTTGCAATC 240AAAGGTGTTG AATCTGAATT CTACCTGGCA ATGAACAAAG AAGGTAAACT GTACGCAAAA 300AAAGAATGCA ACGAAGACTG CAACTTCAAA GAACTGATCC TGGAAAACCA CTACAACACC 360TACGCATCTG CTAAATGGAC CCACAACGGT GGTGAAATGT TCGTTGCTCT GAACCAGAAA 420GGTATCCCGG TTCGTGGTAA AAAAACCAAA AAAGAACAGA AAACCGCTCA CTTCCTGCCG 480ATGGCAATCA CTTAA 495(2)SEQ ID NO：32的资料：(i)序列特征：

(A)长度：164个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：32：Met Ser Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Ser1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly

20 25 30Asp Ile Arg Val Arg Arg Leu phe Cys Arg Thr Gln Trp Tyr Leu Arg

35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn

50 55 60

Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile

65 70 75 80

Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly Lys

85 90 95

Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu

100 105 110

Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His

115 120 125

Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val

130 135 140

Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro

145 150 155 160

Met Ala Ile Thr(2)SEQ ID NO：33的资料：(i)序列特征：

(A)长度：495个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：33：ATGTGCAATG ATATGACTCC TGAACAAATG GCTACCAATG TCAACTGTTC CTCTCCGGAG 60CGCCACACCC GGAGTTACGA TTACATGGAA GGTGGGGATA TTCGCGTACG TCGTCTGTTC 120TGCCGTACCC AGTGGTACCT GCGTATCGAC AAACGCGGCA AAGTCAAGGG CACCCAAGAG 180ATGAAAAACA ACTACAATAT TATGGAAATC CGTACTGTTG CTGTTGGTAT CGTTGCAATC 240AAAGGTGTTG AATCTGAATT CTATCTTGCA ATGAACAAGG AAGGAAAACT CTATGCAAAG 300AAAGAATGCA ATGAAGATTG TAACTTCAAA GAACTAATTC TGGAAAACCA TTACAACACA 360TATGCATCTG CTAAATGGAC CCACAACGGT GGTGAAATGT TCGTTGCTCT GAACCAGAAA 420GGTATCCCTG TTCAAGGTAA GAAAACCAAG AAAGAACAGA AAACCGCTCA CTTCCTGCCG 480ATGGCAATCA CTTAA 495(2)SEQ ID NO：34的资料：(i)序列特征：

(A)长度：164个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：34：Met Cys Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Cys1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly

20 25 30Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg

35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn

85 90 95Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu

100 105 110Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His

115 120 125Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val

130 135 140Gln Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro145 150 155 160Met Ala Ile Thr(2)SEQ ID NO：35的资料：(i)序列特征：

(A)长度：495个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：35： ATGTCTAATG ATATGACTCC GGAACAGATG GCTACCAACG TTAACTCCTC CTCCCCGGAA 60CGTCACACGC GTTCCTACGA CTACATGGAA GGTGGTGACA TCCGCGTACG TCGTCTGTTC 120TGCCGTACCC AGTGGTACCT GCGTATCGAC AAACGCGGCA AAGTCAAGGG CACCCAAGAG 180ATGAAAAACA ACTACAATAT TATGGAAATC CGTACTGTTG CTGTTGGTAT CGTTGCAATC 240AAAGGTGTTG AATCTGAATT CTATCTTGCA ATGAACAAGG AAGGAAAACT CTATGCAAAG 300AAAGAATGCA ATGAAGATTG TAACTTCAAA GAACTAATTC TGGAAAACCA TTACAACACA 360TATGCATCTG CTAAATGGAC CCACAACGGT GGTGAAATGT TCGTTGCTCT GAACCAGAAA 420GGTATCCCTG TTCAAGGTAA GAAAACCAAG AAAGAACAGA AAACCGCTCA CTTCCTGCCG 480ATGGCAATCA CTTAA 495(2)SEQ ID NO：36的资料：(i)序列特征：

(A)长度：164个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：36：Met Ser Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Ser1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly

20 25 30Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg

35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn

85 90 95Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu

100 105 110Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His

115 120 125 Asn Gly Gly Glu Met Pne Val Ala Leu Asn Gln Lys Gly Ile Pro Val

130 135 140Gln Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro145 150 155 160Met Ala Ile Thr(2)SEQ ID NO：37的资料：

(i)序列特征：

(A)长度：450个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：37：ATGTCTTCTC CTGAACGTCA TACGCGTTCC TACGACTACA TGGAAGGTGG TGACATCCGC 60GTACGTCGTC TGTTCTGCCG TACCCAGTGG TACCTGCGTA TCGACAAACG CGGCAAAGTC 120AAGGGCACCC AAGAGATGAA AAACAACTAC AATATTATGG AAATCCGTAC TGTTGCTGTT 180GGTATCGTTG CAATCAAAGG TGTTGAATCT GAATTCTACC TGGCAATGAA CAAAGAAGGT 240AAACTGTACG CAAAAAAAGA ATGCAACGAA GACTGCAACT TCAAAGAACT GATCCTGGAA 300AACCACTACA ACACCTACGC ATCTGCTAAA TGGACCCACA ACGGTGGTGA AATGTTCGTT 360GCTCTGAACC AGAAAGGTAT CCCGGTTCGT GGTAAAAAAA CCAAAAAAGA ACAGAAAACC 420GCTCACTTCC TGCCGATGGC AATCACTTAA 450(2)SEQ ID NO：38的资料：(i)序列特征：

(A)长度：149个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：38：Met Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly1 5 10 15Gly Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu

20 25 30Arg Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn

35 40 45Asn Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala

50 55 60Ile Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly65 70 75 80Lys Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu

85 90 95Leu Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr

100 105 110His Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro

115 120 125Val Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu

130 135 140Pro Met Ala Ile Thr145(2)SEQ ID NO：39的资料：(i)序列特征：

(A)长度：426个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：39：ATGTCCTACG ACTACATGGA AGGTGGTGAC ATCCGCGTAC GTCGTCTGTT CTGCCGTACC 60CAGTGGTACC TGCGTATCGA CAAACGCGGC AAAGTCAAGG GCACCCAAGA GATGAAAAAC 120AACTACAATA TTATGGAAAT CCGTACTGTT GCTGTTGGTA TCGTTGCAAT CAAAGGTGTT 180GAATCTGAAT TCTACCTGGC AATGAACAAA GAAGGTAAAC TGTACGCAAA AAAAGAATGC 240AACGAAGACT GCAACTTCAA AGAACTGATC CTGGAAAACC ACTACAACAC CTACGCATCT 300GCTAAATGGA CCCACAACGG TGGTGAAATG TTCGTTGCTC TGAACCAGAA AGGTATCCCG 360GTTCGTGGTA AAAAAACCAA AAAAGAACAG AAAACCGCTC ACTTCCTGCC GATGGCAATC 420ACTTAA 426(2)SEQ ID NO：40的资料：(i)序列特征：

(A)长度：141个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：40：

Met Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile Arg Val Arg Arg Leu

1 5 10 15

Phe Cys Arg Thr Gln Trp Tyr Leu Arg Ile Asp Lys Arg Gly Lys Val

20 25 30

Lys Gly Thr Gln Glu Met Lys Asn Asn Tyr Asn Ile Met Glu Ile Arg

35 40 45

Thr Val Ala Val Gly Ile Val Ala Ile Lys Gly Val Glu Ser Glu Phe

50 55 60

Tyr Leu Ala Met Asn Lys Glu Gly Lys Leu Tyr Ala Lys Lys Glu Cys

65 70 75 80

Asn Glu Asp Cys Asn Phe Lys Glu Leu Ile Leu Glu Asn His Tyr Asn

85 90 95

Thr Tyr Ala Ser Ala Lys Trp Thr His Asn Gly Gly Glu Met Phe Val

100 105 110

Ala Leu Asn Gln Lys Gly Ile Pro Val Arg Gly Lys Lys Thr Lys Lys

115 120 125

Glu Gln Lys Thr Ala His Phe Leu Pro Met Ala Ile Thr

130 135 140(2)SEQ ID NO：41的资料：(i)序列特征：

(A)长度：426个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：41： ATGTCCTACG ACTACATGGA AGGTGGTGAC ATCCGCGTAC GTCGTCTGTT CTGCCGTACC 60CAGTGGTACC TGCGTATCGA CAAACGCGGC AAAGTCAAGG GCACCCAAGA GATGAAAAAC 120AACTACAATA TTATGGAAAT CCGTACTGTT GCTGTTGGTA TCGTTGCAAT CAAAGGTGTT 180GAATCTGAAT TCTATCTTGC AATGAACAAG GAAGGAAAAC TCTATGCAAA GAAAGAATGC 240AATGAAGATT GTAACTTCAA AGAACTAATT CTGGAAAACC ATTACAACAC ATATGCATCT 300GCTAAATGGA CCCACAACGG TGGTGAAATG TTCGTTGCTC TGAACCAGAA AGGTATCCCT 360GTTCAAGGTA AGAAAACCAA GAAAGAACAG AAAACCGCTC ACTTCCTGCC GATGGCAATC 420ACTTAA 426(2)SEQ ID NO：42的资料：(i)序列特征：

(A)长度：141个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述： SEQ ID NO：42：Met Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile Arg Val Arg Arg Leu1 5 10 15Phe Cys Arg Thr Gln Trp Tyr Leu Arg Ile Asp Lys Arg Gly Lys Val

20 25 30Lys Gly Thr Gln Glu Met Lys Asn Asn Tyr Asn Ile Met Glu Ile Arg

35 40 45Thr Val Ala Val Gly Ile Val Ala Ile Lys Gly Val Glu Ser Glu Phe

50 55 60Tyr Leu Ala Met Asn Lys Glu Gly Lys Leu Tyr Ala Lys Lys Glu Cys65 70 75 80Asn Glu Asp Cys Asn Phe Lys Glu Leu Ile Leu Glu Asn His Tyr Asn

85 90 95Thr Tyr Ala Ser Ala Lys Trp Thr His Asn Gly Gly Glu Met Phe Val

100 105 110Ala Leu Asn Gln Lys Gly Ile Pro Val Gln Gly Lys Lys Thr Lys Lys

115 120 125Glu Gln Lys Thr Ala His Phe Leu Pro Met Ala Ile Thr

130 135 140(2)SEQ ID NO：43的资料：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：43：GAGCTCACTA GTGTCGACCT GCAG 24(2)SEQ ID NO：44的资料：(i)序列特征：

(A)长度：24个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(ix)特征：

(A)名称/关键词： -

(B)位置：互补(1..24)(xi)序列描述：SEQ ID NO：44：CTGCAGGTCG ACACTAGTGA GCTC 24(2)SEQ ID NO：45的资料：(i)序列特征：

(A)长度：18个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：45： 18

CAATCTACAA TTCACAGA(2)SEQ ID NO：46的资料：

(i)序列特征：

(A)长度：18个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：46：TTAAGTTATT GCCATAGG 18(2)SEQ ID NO：47的资料：(i)序列特征：

(A)长度：29个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：47：AACAAAGCTT CTACAATTCA CAGATAGGA 29(2)SEQ ID NO：48的资料：(i)序列特征：

(A)长度：27个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：48：AACAAGATCT TAAGTTATTG CCATAGG 27(2)SEQ ID NO：49的资料：(i)序列特征：

(A)长度：38个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知

(ii)分子类型：cDNA

(xi)序列描述：SEQ ID NO：49：CGGTCTAGAC CACCATGCAC AAATGGATAC TGACATGG 38(2)SEQ ID NO：50的资料：(i)序列特征：

(A)长度：33个碱基对

(B)类型：核苷酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：cDNA(xi)序列描述：SEQ ID NO：50：GCCGTCGACC TATTAAGTTA TTGCCATAGG AAG 33(2)SEQ ID NO：51的资料：(i)序列特征：

(A)长度：16个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：51：Xaa Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Xaa Xaa Ser1 5 10 15(2)SEQ ID NO：52的资料：(i)序列特征：

(A)长度：12个氨基酸

(B)类型：氨基酸

(C)链型：未知

(D)拓扑结构：未知(ii)分子类型：蛋白(xi)序列描述：SEQ ID NO：52：Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile Arg Val1 5 10

Claims

1.一种纯化角化细胞生长因子(KGF)的方法，其包括：

a)得到含KGF的溶液；

b)将步骤(a)溶液中的KGF与阳离子交换树脂结合；

c)用洗脱溶液从阳离子交换树脂上洗脱KGF；

d)将步骤(c)的洗脱溶液通过合适的分子量排阻基质；

e)从分子量排阻基质中回收KGF。

2.权利要求1的方法，其中KGF在原核细胞中生产。

3.权利要求1的方法，其中KGF在大肠杆菌中生产。

4.权利要求1的方法，其中KGF在哺乳动物细胞中生产。

5.权利要求4的方法，其中KGF在中国仓鼠卵巢细胞中生产。

6.一种纯化角化细胞生长因子(KGF)的方法，其包括：

a)得到含KGF的溶液；

b)将步骤(a)溶液中的KGF与阳离子交换树脂结合；

c)用洗脱溶液从阳离子交换树脂上洗脱KGF；

d)对步骤(c)的洗脱溶液作斥水作用层析；

e)从步骤(d)的斥水作用层析中回收KGF。

7.权利要求6的方法，其进一步包括氧化KGF中的自由巯基。

8.权利要求6的方法，其中KGF在原核细胞中生产。

9.权利要求7的方法，其中KGF在大肠杆菌中生产。

10.权利要求6的方法，其中KGF在哺乳动物细胞中生产。

11.权利要求10的方法，其中KGF在中国仓鼠卵巢细胞中生产。