实施例
下列实施例描述的许多操作规程的标准方法或合适的可选操作规程,由常见的分子生物学手册提供,如《分子克隆》第二版,Sambrook等,冷泉港实验室出版社(1987)和《分子生物学当代操作方法》Ausabel等,Green出版附属机构/Wiley交叉科学,纽约(1990)。实施例1:制备编码KGF和KGF类似物的DNA
通过动物细胞RNA的聚合酶链式反应(PCR)和化学合成的(大肠杆菌最优化密码子)寡聚核苷酸(“OLIGO”)的PCR克隆全长人类KGF基因(编码具有天然KGF序列的多肽)。两种方法的描述如下:
用从已知生产该多肽的细胞中分离的RNA作PCR扩增。首先用硫氰胍破碎人类成纤维细胞系AG1523A(得自医学研究用人类遗传变异细胞培养物保藏中心,Camden,新泽西)细胞,然后提取(根据Chomyzinski等(1987),生化年刊,172:156的方法)。用总RNA的标准逆转录酶操作方法生成KGF cDNA。用KGF cDNA作模板,引物OLIGO#1和OLIGO#2编码KGF基因5′和3′的DNA序列,进行KGF基因的PCR(PCR#1)扩增(9600型热循环仪(Perkin-Elmer Cetus,Norwalk,康涅迪格);28个循环;每个循环为94℃变性1分钟,60℃退火2分钟,72℃延长3分钟)。PCR#1产物的等分试样用作第二轮KGF PCR(PCR#2)扩增的模板,扩增条件同上,仅是退火温度为50℃。对KGF基因的表达克隆用嵌套PCR引物制造KGF基因两端的方便的限制位点。用OLIGO#3和OLIGO#4修饰PCR#2的DNA产物,在基因的5′和3′端分别引入MluI和Bam HI限制位点(PCR#3,30个循环;每个循环包括94℃变性1分钟,60℃退火2分钟,72℃延长3分钟)。然后将DNA用MluI和Bam HI切割,酚抽提,乙醇沉淀。再重悬并(用T4连接酶)连接到含“RSH”信号序列的序列的pCFM1156质粒中(图2A)得到RSH-KGF构建体(图3)。
连接产物转化(根据Hanahan(1983),分子生物学杂志,166:557的方法)大肠杆菌FM5菌株(ATCC:53911),在LB+卡那霉素上28℃铺平板。选几个转化体,在含20μg/ml卡那霉素的小量液体培养物中生长。从每种培养物的细胞中分离RSH-KGF质粒,进行DNA测序。由于KGF基因内在的Nde I位点不可能将天然基因序列直接克隆到含有括号内的NdelI和Bam HI限制位点的所需表达载体中。用三步(three-way)连接可以做到。在专一的Bsm I和Sst I限制位点切割RSH-KGF质粒,用1%琼脂糖凝胶电泳后分离到~3kbp的DNA片段(含有KGF基因的3′端)。进行PCR(PCR#4),如进行PCR#3时所述但将OLIGO#3换成OLIGO#5。然后用Nde I和Bsm I切割PCR DNA产物,4%琼脂糖凝胶电泳后分离到311bp的DNA片段。连接用的第三段是pCFM1156用NdeI和Sst I切割后1%琼脂糖凝胶电泳分离的1.8kbpDNA片段。如上述连接(T4连接酶)、转化、卡那霉素筛选和DNA测序,挑选含有图4的构建体和名为KGF的质粒的克隆。由于有产生截短产物的内在核糖体结合位点,用嵌合合成的OLIGO(OLIGO#6至OLIGO#11)取代专一性Kpn I和EcoR I位点间的KGF DNA序列以最少使用内在起始位点(图5)。
OLIGO#1 (SEQID NO:7): 5′-CAATGACCTAGGAGTAACAATCAAC-3′
OLIGO#2 (SEQID NO:8): 5′-AAAACAAACATAAATGCACAAGTCCA-3′
OLIGO#3 (SEQID NO:9): 5′-ACAACGCGTGCAATGACATGACTCCA-3′
OLIGO#4 (SEQID NO:10):
5′-ACAGGATCCTATTAAGTTATTGCCATAGGAA-3′
OLIGO#5 (SEQID NO:11):
5′-ACACATATGTGCAATGACATGACTCCA-3′
OLIGO#6 (SEQID NO:12):
5′-CTGCGTATCGACAAACGCGGCAAAGTCAAGGGCACCC-3′
OLIGO#7 (SEQID NO:13):
5′-AAGAGATGAAAAACAACTACAATATTATGGAAATCCGTACTGTT-3′
OLIGO#8 (SEQID NO:14):
5′-GCTGTTGGTATCGTTGCAATCAAAGGTGTTGAATCTG-3′
OLIGO#9 (SEQID NO:15):
5′-TCTTGGGTGCCCTTGACTTTGCCGCGTTTGTCGATACGCAGGTAC-3′
OLIGO#10 (SEQID NO:16):
5 ′-ACAGCAACAGTACGGATTTCCATAATATTGTAGTTGTTTTTCATC-3′
OLIGO#11 (SEQID NO:17):
5′-AATTCAGATTCAACACCTTTGATTGCAACGATACCA-3′
OLIGO用T4多聚核苷酸激酶磷酸化,再热变性。温度缓慢降至室温使单链(ss)OLIGO形成双链DNA片段。用T4连接酶将内在OLIGO粘末端和整个双链OLIGO片段共价连接到Kpn I和EcoR I切割的KGF质粒上。将新质粒命名为KGF(dsd)。
用PCR扩增化学合成的OLIGO#12至24,构建完整的大肠杆菌密码子最优化的KGF基因。OLIGO#12 (SEQID NO:18): 5′-AGTTTTGATCTAGAAGGAGG-3′OLIGO#13 (SEQID NO:19): 5′-TCAAAACTGGATCCTATTAA-3′OLIGO#14 (SEQID NO:20):
5′-AGTTTTGATCTAGAAGGAGGAATAACATATGTGCAACGACATGAC-
TCCGGAACAGATGGCTACCAACGTTAACTGCTCCAGCCCGGAACGT-3′OLIGO#15 (SEQID NO:21):
5′-CACACCCGTAGCTACGACTACATGGAAGGTGGTGACATCCGTGTTC-
GTCGTCTGTTCTGCCGTACCCAGTGGTACCTGCGTATCGACAAA-3′OLIGO#16 (SEQID NO:22):
5′-CGTGGTAAAGTTAAAGGTACCCAGGAAATGAAAAACAACTA-
CAACATCATGGAAATCCGTACTGTTGCTGTTGGTATCGTTGCAATCAAA-3′
OLIGO#17(SEQ ID NO:23):
5′-GGTGTTGAATCTGAATTCTACCTGGCAATGAACAAAGAAGGTAAAC-
TGTACGCAAAAAAAGAATGCAACGAAGACTGCAACTTCAAAGAA-3′
OLIGO#18(SEQ ID NO:24):
5 ′-CTGATCCTGGAAAACCACTACAACACCTACGCATCTGCTAAATGGA-
CCCACAACGGTGGTGAAATGTTCGTTGCTCTGAACCAGAAAGGT-3′
OLIGO#19(SEQID NO:25):
5′-ATCCCGGTTCGTGGTAAAAAAACCAAAAAAGAACAGAAAACCGCT-
CACTTCCTGCCGATGGCAATCACTTAATAGGATCCAGTTTTGA-3′
OLIGO#20(SEQ ID NO:26):5′-TACGGGTGTGACGTTCCGGG-3′
OLIGO#21(SEQ ID NO:27):5′-CTTTACCACGTTTGTCGATA-3′
OLIGO#22(SEQ ID NO:28):5′-ATTCAACACCTTTGATTGCA-3′
OLIGO#23(SEQ ID NO:29):5′-CCAGGATCAGTTCTTTGAAG-3′
OLIGO#24(SEQ ID NO:30):5′-GAACCGGGATACCTTTCTGG-3′
OLIGO#12至24被设计成无论是“Watson”还是“Crick”链编码天然KGF的整个DNA序列均由OLIGO表示,经PCR扩增能生产出需要的双链DNA序列(图6)(PCR#5,9600型热循环仪,Perkin-ElmerCetus;21个循环;每个循环包括94℃变性31秒,50℃退火31秒,73℃延伸31秒;21个循环完成后最后延伸7分钟终止PCR)。PCR扩增后用Xba I和Bam HI切割DNA片段,将521bp片段连接到用相同酶切割的表达质粒pCFM1156中。PCR#5用外在引物(100pmol/100μlrxn)OLIGO#12和OLIGO#13,1μl/100μl rxn的由连接(T4连接酶)OLIGO#14至OLIGO#19(OLIGO#15至OLIGO#18用T4多聚核苷酸激酶磷酸化)并且OLIGO#20至OLIGO#24作连接的band-aid寡聚核苷酸(Jayaraman等(1992),生物技术12∶392)得到的KGF模板。最终的构建体称为KGF(密码子最优化)。
所有本文描述的KGF类似物部分地由见于KGF(dsd)或KGF(密码子最优化)或二者组合的DNA序列组成。在编码用一种或多种上述DNA片段合成技术制得的特定KGF氨基酸的DNA序列中方便的限制位点插入序列以进一步修饰这些序列。用上述技术可合成任一全部上述类似物。不过,作为一般OLIGO设计的一部分,适当时用最优化的大肠杆菌密码子,尽管在受检查的任一基因中部分或全部为大肠杆菌优化密码子并不会显著增大从培养的细菌细胞中得到的蛋白的产率。图7到12用合适的例子给出如下特定KGF类似物的核苷酸和氨基酸序列构建体:C(1,15)S(图7);C(1,15)S/R(144)E(图8);C(1,15)S/R(144)Q(图9);ΔN15(图10);ΔN23(图11)和ΔN23/R(144)Q(图12)。本文描述的所有KGF类似物构建体均由DNA序列证实。实施例2从大肠杆菌中纯化
用三种不同的表达质粒克隆KGF类似物基因,即pCFM1156(ATCC#69702),pCFM1656(ATCC#69576)和pCFM 3102(分别为图2A,2B和2C)。通过用PCR重叠寡聚物诱变作一系列定点碱基变化可从pCFM1156质粒得到p3 102质粒。从质粒复制启动子PcopB紧邻5′的Bgl III位点(pCFM1656质粒bP#180)开始前进至质粒复制基因,碱基对变化如下:pCFM1656 bp# pCFM1656中的碱基对 在pCFM3102中碱基对变成
# 204 T/A C/G
# 428 A/T G/C
# 509 G/C A/T
# 617 -- 插入2个G/C碱基对
# 677 G/C T/A
# 978 T/A C/G
# 992 G/C A/T
# 1002 A/T C/G
# 1005 C/G T/A
# 1026 A/T T/A
# 1045 C/G T/A
# 1176 G/C T/A
# 1464 G/C T/A
# 2026 G/C 碱基对缺失
# 2186 C/G T/A
# 2479 A/T T/A
# 2498-2501 AGTG GTCA
TCAC CAGT# 2641-2647 TCCGAGC 碱基对缺失
AGGCTCG# 3441 G/C A/T# 3452 G/C A/T# 3649 A/T T/A# 4556 -- 插入的碱基对
(SEQ ID NO:67)5′-GAGCTCACTAGTGTCGACCTGCAG-3′
(SEQ ID NO:68)3′-CTCGAGTGATCACAGCTGGACGTC-5′
从上可见pCFM1156,pCFM1656和pCFM3102十分相似且含有许多相同的限制位点。为方便起见选取了这些质粒,以便新构建体可简单地交换载体DNA组分。所有克隆操作均用宿主大肠杆菌菌株FM5(ATCC:53911),用Gene PulserTM转染仪(BioRad Laboraties INC.Hercules加州)。根据生产商的说明用电洗脱或根据Hanahan((1983),引文见上)的方法进行转化。
首先,将O.1ml适当菌株的冷冻甘油贮存物转移到含500ml Luria肉汤的2L烧瓶中,得到在3个pCFM载体之一含有所需构建体的所需重组大肠杆菌克隆的小量新鲜培养接种物。30℃振荡培养16小时,然后将培养物转移到含8L无菌分批培养基的15L发酵罐中(Tsai等(1987),工业微生物学杂志2:181-187)。
从用投料#1培养基送料开始批量送料发酵(Tsai等(1987),引文见上)。OD600达到35时,迅速将培养物温度升至37℃以扩增质粒。37℃两小时后,将培养物的温度迅速升至使CI阻遏物变性。停加投料1,改加投料2,开始送料的速率为300ml/小时。投料2含有175g/L胰蛋白胨,87.5g/L酵母提取物,260g/L葡萄糖。42℃1小时后,将培养物温度降至36℃,保温6小时。
然后终止发酵,通过离心至1L离心管中的塑料袋里收集细胞。400rpm离心60分钟得细胞沉淀,除去上清,-90℃冰冻细胞糊状物。
各种KGF类似物在大肠杆菌中表达后,用下述方法纯化天然KGF、C(1,15)S、C(1,15)S/R(144)E、C(1,15)S/R(144)Q、ΔN15、ΔN23和ΔN23/R(144)Q。高细胞密度发酵得到的细胞糊悬浮于4℃O.2M NaCl,20mM NaPO4、pH7.5中得10-20%溶液(重量/体积),用合适的高剪切混合器完成。然后将溶液通过匀浆器(APV Gaulin,Inc.Everett,麻省)三次裂解悬浮细胞。用合适的热交换装置将流出的匀浆冷却至4-8℃。用J-6BTM离心机(Beckman仪器公司,Brea,加州),JS4.2转头,4200 rpm 4℃离心30-60分钟除去裂解物中的残片。然后将上清小心地脱水,上样到预先制好的4℃0.2M NaCl,20mM NaPO4,pH7.5平衡的450ml(5cm×23cm)S-琼脂糖Fast FlowTM树脂柱上(Pharmacia,Piscataway,新泽西)。接下来用5倍柱体积的0.4M NaCl,20mM NaPO4,pH7.5 4℃洗柱。用5L 0.5M NaCl,20mM NaPO4,pH7.5洗脱下所需蛋白。再次收集50mL级分,持续监测洗脱液的A280。A280鉴定的含有洗脱物质的级分用14%凝胶作SDS-PAGE来验证所需多肽的存在。
然后收集含所需蛋白的级分,再加入等体积蒸馏水。将稀释的样品上样到先前制好的用0.4M NaCl,20mM NaPO4,pH6.8 4℃平衡的450ml(5cm×23cm)S-琼脂糖Fast Flow柱。用2250mL 0.4M NaCl,20mMNaPO4,pH6.8洗柱,再用20柱体积的从0.4M NaCl,20mM NaPO4,pH6.8到0.6M NaCl,20mM NaPO4,pH6.8的线性梯度洗脱蛋白。再收集50mL级分,持续监测洗脱液的A280。收集含有蛋白的级分(用14%SDS-PAGE确定),再通过一个350cc搅拌室(Amicon Inc.Mayberry,麻省)中的YM-10膜(10,000截断分子量)浓缩至30-40 mL体积。
预先制好1,300mL(44cm×85cm)Superdex-75TM树脂(Pharmacia)用含有1×PBS(Dulbecco氏磷酸盐缓冲盐水,“D-PBS”,无钙无镁)或0.15M NaCl,20mM NaPO4,pH7.0的柱缓冲液平衡,将浓缩物加样。样品进入柱后,用柱缓冲液从凝胶过滤基质中洗脱蛋白。此后回收10mL级分,汇集含类似物(14%SDS-PAGE确定)的级分。典型的最终汇集物中蛋白浓度为约5-10mg/mL。除非另有说明,上述操作均在4-8℃下进行。
用可选的纯化方法纯化天然KGF、C(1,15)S和ΔN23。该方法包括下述步骤,除非特别说明,所有方法、溶液和物质均在23±5℃。
细菌发酵生产阶段完成后,将细胞培养物冷却至4-8℃,离心或用相似方法收集细胞。根据每单位重量细胞糊中预计的蛋白产量和需要纯化的蛋白量,将适当重量的细胞糊悬浮于5倍细胞糊重量的20mMNaPO4,0.2M NaCl,pH7.5温和缓冲液。用高剪切混合器将细胞分散成均质溶液。匀浆过程中保持细胞糊分散液的温度为4-8℃。
然后加压裂解细胞,例如将细胞浆分散液通过适当大小的细胞匀浆器两次。将匀浆低温保持于5±3℃。用预先制好的装备了具有适当量的滤器表面积的滤器,用适当体积的0.2M NaCl,20mM NaPO4,pH7.5平衡的深度滤器套(housing)(Cuno公司,Meriden,CT)使细胞裂解物澄清。平衡和澄清在5±3℃下进行。澄清前用适当量的合适的过滤助剂将滤器预包被并且与细胞裂解物彻底混合,之后将溶液通过滤器以澄清裂解物。用0.2M NaCl,20mM NaPO4,pH7.5洗滤器。将滤过液和任何后续清洗液收集于适当容积的冷冻容器中,所有操作均低于10℃。
澄清后的裂解物通过预先制好的SP-琼脂糖Fast Flow柱,每2g细胞裂解物至少1mL树脂。SP-琼脂糖Fast Flow柱用冷的(5±3℃)0.2M NaCl,20mM NaPO4,pH7.5平衡。保持柱的温度低于10℃。澄清后的裂解物(5±3℃)加样到离子交换树脂上,持续监测洗脱物的A280。样品上样后先用冷的0.2M NaCl,20mM NaPO4,pH7.5洗柱再用23±5℃的0.3M NaCl,20mM NaPO4,pH7.5洗柱。
用范围为0.2-1M NaCl,20mM NaPO4,pH7.5的线性梯度洗脱所需蛋白。根据洗脱物的A280收集几个级分的大量产品。洗脱后合并这些级分并记下体积。
进行氧化步骤以氧化游离的巯基。对于与天然KGF相比半胱氨酸模式改变的蛋白,加氧化剂(例如,胱胺二盐酸化物或其它合适的氧化剂如胱氨酸,氧化型谷胱甘肽或二价铜)至终浓度1-20mM,pH调至7-9.5,用胱胺二盐酸化物时在pH9.0±0.3 10-30℃下氧化适当长的时间。氧化天然KGF蛋白时加入适量的(NH4)2SO4,如1-2M(NH4)2SO4,调pH7.5±0.5,在一段时间内保持温度为23±5℃。
氧化后,将溶液pH调到6.5和9.5之间。必要的话在溶液中加入固体(NH4)2SO4,终浓度2M。将溶液通过适当的澄清滤器除去颗粒。
过滤的氧化产物作斥水作用层析(HIC)。HIC基质是丁基-650MToyopearlTM树脂(Tosohaas Inc.,Montgomeryville,宾州)。将含蛋白溶液上样到预先用2M(NH4)2SO4,0.15M NaCl,20mM NaPO4,pH7.0平衡的柱上。上样后用2M(NH4)2SO4,0.15M NaCl,20mM NaPO4,pH7.0洗柱。用0.15M NaCl,20mM NaPO4,pH7.0中递降线性2-0M的(NH4)2SO4梯度洗脱所需蛋白。洗脱液A280增加显示所需蛋白开始洗脱,收集这些级分。每级分的等分试样用SDS-PAGE分析。然后收集含所需蛋白的各级分,彻底混合,确定合并物体积及其中蛋白浓度。
合并的含蛋白HIC洗脱液被浓缩并更换洗脱缓冲液。典型地将蛋白浓缩至5.0-10.0mg/ml。用配备了PelLIconTM盒式系统(Millipore公司,Bedford,麻省)和合适截止大小的膜的超滤系统作超滤。
浓缩后,将样品对合适的缓冲液透滤。浓缩步骤的留存物对0.15MNaCl,20mM NaPO4,pH7.0透滤直到留存物的电导在0.15M NaCl,20mM NaPO4,pH7.0溶液的电导的5%以内。
另外将浓缩透滤的含蛋白样品通过0.1μm PosidyneTM滤膜(PallInc.,Cortland,NY)去除可能存在的沉淀物和细菌内毒素。确定了溶液的蛋白浓度并根据最终大量产品所需浓度,用0.15M NaCl,20mM磷酸钠,pH7.0将溶液稀释至所需终浓度。然后用0.22μm滤膜作最后的无菌过滤,将最终的大量产品转移至不含致热源的容器中贮存(约5℃)和进一步配制。实施例3:从哺乳动物细胞培养物中纯化
本实施例描述在哺乳动物表达系统中生产的两种生物活性重组KGF(rKGF)形式的表达,分离和表征。
用PCR扩增得自正常人类真皮成纤维细胞(Clonetech公司,圣迭戈,加州)的cDNA,分离到人类KGF基因。用逆转录酶制得cDNA后用PCR扩增KGF基因。用OLIGO#25和OLIGO#26从cDNA中扩增出基因,第二次PCR扩增后用OLIGO#27和OLIGO#28在片段末端加上Hind III和BglII限制位点,如图1所述。
OLIGO#25(SEQ ID NO:45): 5′-CAATCTACAATTCACAGA-3′
OLIGO#26(SEQ ID NO:46): 5′-TTAAGTTATTGCCATAGG-3′
OLIGO#27(SEQ ID NO:47): 5′-AACAAAGCTTCTACAATTCACAGATAGGA-3′
OLIGO#28(SEQ ID NO:48): 5′-AACAAGATCTTAAGTTATTGCCATAGG-3′
克隆和确证DNA序列后使用KGF基因DNA。用OLIGO#29和OLIGO#30进行扩增。
OLIGO#29(SEQ.ID.NO:49):
5′-CGGTCTAGACCACCATGCACAAATGGATACTGACATGG-3′
OLIGO#30(SEQ.ID.NO:50):
5′-GCCGTCGACCTATTAAGTTATTGCCATAGGAAG-3′
有义引物OLIGO#29在起始密码子ATG上游有Xba I位点和一致Kozak翻译序列(5′-CCACC-3′)。反义引物OLIGO#30含有SalI克隆位点和另一个终止密码子。PCR扩增(94℃变性30秒,55℃退火40秒,72℃延伸40秒)18个循环后,用Xba I和SalI消化产物并与类似消化的pDSRα2的DNA连接(根据Bourdrel等(1993),蛋白实验与纯化,4:130-140和Lu等(1992),Arch.Biochem.Biophys.,298:150-158)的方法)。这样得到KGF/pDSRα2质粒,其中人类KGF基因在SV40早期启动子和α-FSH多聚腺苷化序列之间。选出两个克隆,DNA序列分析证实构建到所需载体。
用Pvu I线性化2微克KGF/pDSRα2 DNA。然后用标准磷酸钙沉淀法(Bourdrel等,引文见上)用处理过的DNA转染前一天接种到0.8×106细胞/60mm的培养血中的中国仓鼠卵巢(CHO)细胞里。两周后选出单个的克隆转移到24孔板上。细胞汇合后调节培养基被认为不含血清,用抗大肠杆菌表达的人类KGF的多克隆兔抗血清Western印迹法分析其等分试样。
Western印迹:样品在12.5%(W/V)SDS聚丙烯酰胺上走胶,用半干转移仪(Hoefer Scientific Instruments,旧金山,加州)400mA 1小时电印迹到硝酸纤维素膜上。转移缓冲液是20mM Tris,150mM甘氨酸,25%甲醇。用PBS中10%正常山羊血清温育,封闭硝酸纤维素膜。用抗大肠杆菌来源的KGF的兔抗血清作一抗。使用时用PBS中1%正常山羊血清稀释10,000倍,与封闭的硝酸纤维素膜室温温育12小时,然后用PBS洗3次,每次30分钟,除去多余的抗体。硝酸纤维素膜在100ml含VectastainTM生物素化山羊抗兔IgG(二抗,Vector Labs,Burlingame,加州)的PBS中1%正常山羊血清里室温温育30分钟。用PBS洗3次,每次10分钟。之后在100ml依制造商说明(Vector Labs)制备的含链亲合素(streptavidin)和生物素化过氧化物酶的1%正常山羊血清溶液中室温温育30分钟。用PBS洗3次后用100ml PBS中的60μL30%(W/V)H2O2和20mL甲醇中的50mg 4-氯萘酚混合物温育,将KGF交叉反应物质显色。10分钟后水洗终止反应。
分析印迹显示KGF特异性抗体与三个不同蛋白带相联系,其中两个紧密相关,分子量为约25-29KDa,另一个估计分子量为约17KDa,而163个氨基酸的成熟蛋白的估计分子量约为18.8KDa。另外,用Western分析确定分泌量大于2.0mg rKGF每升的几个高度表达克隆被选出并被移入摇瓶(根据Lu等人的方法,引文见上)以得到大体积的无血清的条件化培养基,用于阳离子交换层析和凝胶过滤纯化KGF,如下述。
纯化3升无血的条件化培养基中的KGF。将填充了450ml磺乙基阳离子交换柱,一种用20mM磷酸钠pH7.5预平衡过的S琼脂糖Fast Flow(Pharmacia)柱用培养基直接上柱。用5倍柱体积的20mM磷酸钠,0.2M NaCl pH7.5洗柱。然后用20倍柱体积的20mM磷酸钠,pH7.5中0.2至1.0M NaCl线性梯度洗脱rKGF。收集50mL级分并持续A280监测。用SDS-PAGE分析每一级分的等分试样以检测KGF蛋白。用预制的14%Tris-甘氨酸预制凝胶(根据Laemmli(1970)自然,227:680-685的方法)在电泳系统(Novex,圣迭戈,加州)上作SDS-PAGE。上样前将样品与非还原性SDS样品缓冲液混合,不需加热。用考马斯蓝或银染检测蛋白。看到两个晚期洗脱峰含有蛋白带,对应Western印迹检测到的25-29KDa和17KDa带。含有这些峰的级分分别浓缩到小于1.0mL的体积中作凝胶过滤。
凝胶过滤用的Superdex-75TM树脂柱(HR10/30,Pharmacia)用PBS,pH7.2预平衡,用下述分子量标准(BioRad,旧金山,加州)甲状腺球蛋白(670KDa),γ球蛋白(158KDa),卵清蛋白(44KDa),肌球蛋白(17KDa)和维生素B-12(1.4KDa)标定。经过这些纯化步骤得到的rKGF约被纯化2000倍,特别包括由银染确定的17KDa和30KDa的物质。
由于是较高分子量的物质,rKGF被作为主要对称峰洗出,该峰被称作KGF-a。用SDS-PAGE分析少量该物质(3μg/泳道对6μg/泳道)分辨出有1-2KDa分子量差异的两条带。将低分子量物质KGF-b凝胶过滤得到具有预计移动率的蛋白制备物。KGF-a和KGF-b的纯化后总回收率均为约30-40%。
还分析了KGF-a和KGF-b的氨基酸序列。仪器是自动测序仪(477A或470A型,应用生物系统公司,Foster城,加州),装备有120A型在线PTH氨基酸分析仪和900A型数据收集系统(用Lu等(1991),生物化学杂志,266:8102-8107的方法)。KGF-a的Edman序列分析显示主要N末端序列为X1-N-D-M-T-P-E-Q-M-A-T-N-V-X2-X3-S-[SEQID NO:51]。从N末端第三个氨基酸天冬氨酸起始的次级序列占整个可测序蛋白的1.6%。由于序列分析时没有苯基乙内酰硫脲基(phenylthiohydantoinyl)(PHT)氨基酸信号,因此不能确定X1,X2和X3。由cDNA预测的KGF的N末端氨基酸序列显示X1和X3是Cys残基,X2是天冬酰胺。X1和X3不存在显示这些半胱氨酸可能形成二硫桥。根据同义N连糖基化序列Asn-X-Ser,对应于X2的预测的Asn残基不存在显示这是潜在的N连糖基化位点。
有趣的是,KGF-bN末端序列分析显示N末端氨基酸序列为S-Y-D-Y-M-E-G-G-D-I-R-V-(SEQ ID NO:52)表明它是KGF的N末端截短形式,在Arg32-Ser24肽键处被蛋白水解切割。
用已知方法(Sasaki等(1987),生物化学杂志,262:12059-12076;Takeuchi等(1988),生物化学杂志,263:3657-3663;Zsebo等(1990),细胞,63:195-201)用糖苷酶(唾液酸苷酶,O-聚糖酶和/或N-聚糖酶)处理蛋白来进一步将纯化的KGF-a和KGF-b定性。这些数据显示KGF-a含N连和O连糖。而低分子量形式的KGF-b可能只含N连糖。糖苷酶处理并不能使KGF-b分子量减少,表明该分子未糖基化。实施例4:生物活性
稀释每种KGF类似物,通过测量Balb/MK细胞的[3H]胸苷摄入(用Rubin等(1989)的方法,引文见上)试验其生物活性。首先用含有50%定制的Eagle氏MEM,50%定制的F12,5μg/mL转铁蛋白,5ng/ml硒酸钠,0.0005%HSA和0.005%Tween 20的生物试验培养基稀释样品。然后将KGF样品加到接种了Balb/MK细胞的Falcon primeria 96孔板中。测量DNA合成中[3H]胸苷的摄入,并通过与天然KGF标准曲线对照转化成输入天然KGF浓度。每种受试的类似物均表现促细胞分裂剂活性。
用从Balb/MK小鼠表皮角化细胞制取的分离的KGF受体膜制备物检查与KGF受体的相互作用(操作步骤依据Massague(19932),生物化学杂志,258:13614-13620)。具体地说,各种形式的KGF用50mMTirs-HCl,pH7.5含0.2%牛血清清蛋白稀释至浓度在每50μL 0.8至100ng范围内。它们单独地与膜制备物(75ng/mL)和125I标记的大肠杆菌来源的KGF(1.5ng)温育。在4℃进行受体结合和竞争实验16小时,其后取样、离心,用上述稀释缓冲液洗两次,除去未结合和非特异性结合的标记的KGF。对样品计量剩余的放射性。用非竞争百分比对每个KGF样品浓度作图,做KGF样品和标记的KGF受体结合的竞争曲线。放射性受体试验非竞争实验显示大肠杆菌来源的KGF,KGF-a和KGF-b有相似的受体结合活性。
尽管本发明已被一般地以及用优选实施方案作了如上描述,本领域专业人员应当理解基于上述描述,可以有其它的变异形式或修饰存在。
序列表(1)一般资料:(i) 申请人:Amgen Inc.(ii) 发明名称:角化细胞生长因子的纯化方法(iii)序列数:52(iv)相关地址:
(A)收信人:Amgen Inc
(B)街道:1840 DeHavilland Drive
(C)城市:Thousand Oaks
(D)州:California
(E)国家:U.S.A
(F)邮编:91320-1789(v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容型
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,Version#1.25(vi)当前申请资料:
(A)申请号:US08/487,830
(B)提交日期:
(C)分类:未知(2)SEQ ID NO:1的资料:(i)序列特征:
(A)长度:862个碱基对
(B)类型:核酸
(C)链型:未知
(D)拓扑类型:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:1:CAATCTACAA TTCACAGATA GGAAGAGGTC AATGACCTAG GAGTAACAAT CAACTCAAGA 60TTCATTTTCA TTATGTTATT CATGAACACC CGGAGCACTA CACTATAATG CACAAATGGA 120TACTGACATG GATCCTGCCA ACTTTGCTCT ACAGATCATG CTTTCACATT ATCTGTCTAG 180TGGGTACTAT ATCTTTAGCT TGCAATGACA TGACTCCAGA GCAAATGGCT ACAAATGTGA 240ACTGTTCCAG CCCTGAGCGA CACACAAGAA GTTATGATTA CATGGAAGGA GGGGATATAA 300GAGTGAGAAG ACTCTTCTGT CGAACACAGT GGTACCTGAG GATCGATAAA AGAGGCAAAG 360TAAAAGGGAC CCAAGAGATG AAGAATAATT ACAATATCAT GGAAATCAGG ACAGTGGCAG 420TTGGAATTGT GGCAATCAAA GGGGTGGAAA GTGAATTCTA TCTTGCAATG AACAAGGAAG 480GAAAACTCTA TGCAAAGAAA GAATGCAATG AAGATTGTAA CTTCAAAGAA CTAATTCTGG 540AAAACCATTA CAACACATAT GCATCAGCTA AATGGACACA CAACGGAGGG GAAATGTTTG 600TTGCCTTAAA TCAAAAGGGG ATTCCTGTAA GAGGAAAAAA AACGAAGAAA GAACAAAAAA 660CAGCCCACTT TCTTCCTATG GCAATAACTT AATTGCATAT GGTATATAAA GAACCCAGTT 720CCAGCAGGGA GATTTCTTTA AGTGGACTGT TTTCTTTCTT CTCAAAATTT TCTTTCCTTT 780TATTTTTTAG TAATCAAGAA AGGCTGGAAA AACTACTGAA AAACTGATCA AGCTGGACTT 840GTGCATTTAT GTTTGTTTTA AG 862(2)SEQ ID NO:2的资料:(i)序列特征:
(A)长度:194个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述: SEQ ID NO:2:Met His Lys Trp Ile Leu Thr Trp Ile Leu Pro Thr Leu Leu Tyr Arg1 5 10 15Ser Cys Phe His Ile Ile Cys Leu Val Gly Thr Ile Ser Leu Ala Cys
20 25 30Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Cys Ser Ser
35 40 45Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile
50 55 60Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg Ile Asp65 70 75 80Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn Tyr Asn
85 90 95Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile Lys Gly
100 105 110Val Glu Ser Glu phe Tyr Leu Ala Met Asn Lys Glu Gly Lys Leu Tyr
115 120 125Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu Ile Leu
130 135 140Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His Asn Gly145 150 155 160Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val Arg Gly
165 170 175Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro Met Ala
180 185 190Ile Thr(2)SEQ ID NO:3的资料:(i)序列特征:
(A)长度:595个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述: SEQ ID NO:3:ATCGATTTGA TTCTAGAAGG AGGAATAACA TATGAAAAAG CGCGCACGTG CTATCGCCAT 60TGCTGTGGCT CTGGCAGGTT TCGCAACTAG TGCACACGCG TGCAATGACA TGACTCCAGA 120GCAAATGGCT ACAAATGTGA ACTGTTCCAG CCCTGAGCGA CACACAAGAA GTTATGATTA 180CATGGAAGGA GGGGATATAA GAGTGAGAAG ACTCTTCTGT CGAACACAGT GGTACCTGAG 240GATCGATAAA AGAGGCAAAG TAAAAGGGAC CCAAGAGATG AAGAATAATT ACAATATCAT 300GGAAATCAGG ACAGTGGCAG TTGGAATTGT GGCAATCAAA GGGGTGGAAA GTGAATTCTA 360TCTTGCAATG AACAAGGAAG GAAAACTCTA TGCAAAGAAA GAATGCAATG AAGATTGTAA 420CTTCAAAGAA CTAATTCTGG AAAACCATTA CAACACATAT GCATCAGCTA AATGGACACA 480CAACGGAGGG GAAATGTTTG TTGCCTTAAA TCAAAAGGGG ATTCCTGTAA GAGGAAAAAA 540AACGAAGAAA GAACAAAAAA CAGCCCACTT TCTTCCTATG GCAATAACTT AATAG 595(2)SEQ ID NO:4的资料:(i)序列特征:
(A)长度:186个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:4:Met Lys Lys Arg Ala Arg Ala Ile Ala Ile Ala Val Ala Leu Ala Gly1 5 10 15Phe Ala Thr Ser Ala His Ala Cys Asn Asp Met Thr Pro Glu Gln Met
20 25 30Ala Thr Asn Val Asn Cys Ser Ser Pro Giu Arg His Thr Arg Ser Tyr
35 40 45Asp Tyr Met Glu Gly Gly Asp Iie Arg Val Arg Arg Leu Phe Cys Arg
50 55 60Thr Gln Trp Tyr Leu Arg Ile Asp Lys Arg Gly Lys Val Lys Gly Thr65 70 75 80Gln Glu Met Lys Asn Asn Tyr Asn Ile Met Glu Ile Arg Thr Val Ala
85 90 95Val Gly Ile Val Ala Ile Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala
100 105 110Met Asn Lys Glu Gly Lys Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp
115 120 125Cys Asn Phe Lys Glu Leu Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala
130 135 140Ser Ala Lys Trp Thr His Asn Gly Gly Glu Met Phe Val Ala Leu Asn145 150 155 160Gln Lys Gly Ile Pro Val Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys
165 170 175Thr Ala His Phe Leu Pro Met Ala Ile Thr
180 185(2)SEQ ID NO:5的资料:(i)序列特征:
(A)长度:499个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:5:TATGTGCAAT GACATGACTC CAGAGCAAAT GGCTACAAAT GTGAACTGTT CCAGCCCTGA 60GCGACACACA AGAAGTTATG ATTACATGGA AGGAGGGGAT ATAAGAGTGA GAAGACTCTT 120CTGTCGAACA CAGTGGTACC TGAGGATCGA TAAAAGAGGC AAAGTAAAAG GGACCCAAGA 180GATGAAGAAT AATTACAATA TCATGGAAAT CAGGACAGTG GCAGTTGGAA TTGTGGCAAT 240CAAAGGGGTG GAAAGTGAAT TCTATCTTGC AATGAACAAG GAAGGAAAAC TCTATGCAAA 300GAAAGAATGC AATGAAGATT GTAACTTCAA AGAACTAATT CTGGAAAACC ATTACAACAC 360ATATGCATCA GCTAAATGGA CACACAACGG AGGGGAAATG TTTGTTGCCT TAAATCAAAA 420GGGGATTCCT GTAAGAGGAA AAAAAACGAA GAAAGAACAA AAAACAGCCC ACTTTCTTCC 480TATGGCAATA ACTTAATAG 499(2)SEQ ID NO:6的资料:(i)序列特征:
(A)长度:164个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:6:Met Cys Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Cys1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly
20 25 30Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg
35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn
50 55 60Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile65 70 75 80Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly Lys
85 90 95Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu
100 105 110Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His
115 120 125Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val
130 135 140Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro145 150 155 160Met Ala Ile Thr(2)SEQ ID NO:7的资料:(i)序列特征:
(A)长度:25个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:7:CAATGACCTA GGAGTAACAA TCAAC 25(2)SEQ ID NO:8的资料:(i)序列特征:
(A)长度:26个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:8:AAAACAAACA TAAATGCACA AGTCCA 26(2)SEQ ID NO:9的资料:(i)序列特征:
(A)长度:26个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:9:
26
ACAACGCGTG CAATGACATG ACTCCA(2)SEQ ID NO:10的资料:(i)序列特征:
(A)长度: 31个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:10:ACAGGATCCT ATTAAGTTAT TGCCATAGGA A 31(2)SEQ ID NO:11的资料:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:11:ACACATATGT GCAATGACAT GACTCCA 27(2)SEQ ID NO:12的资料:(i)序列特征:
(A)长度:37个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知 (ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:12:CTGCGTATCG ACAAACGCGG CAAAGTCAAG GGCACCC 37(2)SEQ ID NO:13的资料:(i)序列特征:
(A)长度:44个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:13:AAGAGATGAA AAACAACTAC AATATTATGG AAATCCGTAC TGTT 44(2)SEQ ID NO:14的资料:(i)序列特征:
(A)长度:37个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:14:
37GCTGTTGGTA TCGTTGCAAT CAAAGGTGTT GAATCTG(2)SEQ ID NO:15的资料:(i)序列特征:
(A)长度:45个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述: SEQ ID NO:15:TCTTGGGTGC CCTTGACTTT GCCGCGTTTG TCGATACGCA GGTAC 45(2)SEQ ID NO:16的资料:(i)序列特征:
(A)长度:45个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述: SEQ ID NO:16:ACAGCAACAG TACGGATTTC CATAATATTG TAGTTGTTTT TCATC 45(2)SEQ ID NO:17的资料:(i)序列特征:
(A)长度:36个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:17:AATTCAGATT CAACACCTTT GATTGCAACG ATACCA 36(2)SEQ ID NO:18的资料:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:18:
AGTTTTGATC TAGAAGGAGG 20(2)SEQ ID NO:19的资料:
(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:19:TCAAAACTGG ATCCTATTAA 20(2)SEQ ID NO:20的资料:(i)序列特征:
(A)长度:91个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:20:AGTTTTGATC TAGAAGGAGG AATAACATAT GTGCAACGAC ATGACTCCGG AACAGATGGC 60TACCAACGTT AACTGCTCCA GCCCGGAACG T 91(2)SEQ ID NO:21的资料:(i)序列特征:
(A)长度:90个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:21:CACACCCGTA GCTACGACTA CATGGAAGGT GGTGACATCC GTGTTCGTCG TCTGTTCTGC 60CGTACCCAGT GGTACCTGCG TATCGACAAA 90(2)SEQ ID NO:22的资料:(i)序列特征:
(A)长度:90个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:22:CGTGGTAAAG TTAAAGGTAC CCAGGAAATG AAAAACAACT ACAACATCAT GGAAATCCGT 60ACTGTTGCTG TTGGTATCGT TGCAATCAAA 90(2)SEQ ID NO:23的资料:
(i)序列特征:
(A)长度:90个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:23:GGTGTTGAAT CTGAATTCTA CCTGGCAATG AACAAAGAAG GTAAACTGTA CGCAAAAAAA 60GAATGCAACG AAGACTGCAA CTTCAAAGAA 90(2)SEQ ID NO:24的资料:
(i)序列特征:
(A)长度:90个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:24:CTGATCCTGG AAAACCACTA CAACACCTAC GCATCTGCTA AATGGACCCA CAACGGTGGT 60GAAATGTTCG TTGCTCTGAA CCAGAAAGGT 90(2)SEQ ID NO:25的资料:(i)序列特征:
(A)长度:88个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:25:ATCCCGGTTC GTGGTAAAAA AACCAAAAAA GAACAGAAAA CCGCTCACTT CCTGCCGATG 60GCAATCACTT AATAGGATCC AGTTTTGA 88(2)SEQ ID NO:26的资料:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:26:TACGGGTGTG ACGTTCCGGG
20(2)SEQ ID NO:27的资料:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:27:CTTTACCACG TTTGTCGATA 20(2)SEQ ID NO:28的资料:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:28:
ATTCAACACC TTTGATTGCA 20(2)SEQ ID NO:29的资料:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:29:CCAGGATCAG TTCTTTGAAG 20(2)SEQ ID NO:30的资料:(i)序列特征:
(A)长度:20个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:30:GAACCGGGAT ACCTTTCTGG 20(2)SEQ ID NO:31的资料:(i)序列特征:
(A)长度:495个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:31:ATGTCTAATG ATATGACTCC GGAACAGATG GCTACCAACG TTAACTCCTC CTCCCCGGAA 60CGTCACACGC GTTCCTACGA CTACATGGAA GGTGGTGACA TCCGCGTACG TCGTCTGTTC 120TGCCGTACCC AGTGGTACCT GCGTATCGAC AAACGCGGCA AAGTCAAGGG CACCCAAGAG 180ATGAAAAACA ACTACAATAT TATGGAAATC CGTACTGTTG CTGTTGGTAT CGTTGCAATC 240AAAGGTGTTG AATCTGAATT CTACCTGGCA ATGAACAAAG AAGGTAAACT GTACGCAAAA 300AAAGAATGCA ACGAAGACTG CAACTTCAAA GAACTGATCC TGGAAAACCA CTACAACACC 360TACGCATCTG CTAAATGGAC CCACAACGGT GGTGAAATGT TCGTTGCTCT GAACCAGAAA 420GGTATCCCGG TTCGTGGTAA AAAAACCAAA AAAGAACAGA AAACCGCTCA CTTCCTGCCG 480ATGGCAATCA CTTAA 495(2)SEQ ID NO:32的资料:(i)序列特征:
(A)长度:164个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:32:Met Ser Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Ser1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly
20 25 30Asp Ile Arg Val Arg Arg Leu phe Cys Arg Thr Gln Trp Tyr Leu Arg
35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn
50 55 60
Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile
65 70 75 80
Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly Lys
85 90 95
Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu
100 105 110
Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His
115 120 125
Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val
130 135 140
Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro
145 150 155 160
Met Ala Ile Thr(2)SEQ ID NO:33的资料:(i)序列特征:
(A)长度:495个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:33:ATGTGCAATG ATATGACTCC TGAACAAATG GCTACCAATG TCAACTGTTC CTCTCCGGAG 60CGCCACACCC GGAGTTACGA TTACATGGAA GGTGGGGATA TTCGCGTACG TCGTCTGTTC 120TGCCGTACCC AGTGGTACCT GCGTATCGAC AAACGCGGCA AAGTCAAGGG CACCCAAGAG 180ATGAAAAACA ACTACAATAT TATGGAAATC CGTACTGTTG CTGTTGGTAT CGTTGCAATC 240AAAGGTGTTG AATCTGAATT CTATCTTGCA ATGAACAAGG AAGGAAAACT CTATGCAAAG 300AAAGAATGCA ATGAAGATTG TAACTTCAAA GAACTAATTC TGGAAAACCA TTACAACACA 360TATGCATCTG CTAAATGGAC CCACAACGGT GGTGAAATGT TCGTTGCTCT GAACCAGAAA 420GGTATCCCTG TTCAAGGTAA GAAAACCAAG AAAGAACAGA AAACCGCTCA CTTCCTGCCG 480ATGGCAATCA CTTAA 495(2)SEQ ID NO:34的资料:(i)序列特征:
(A)长度:164个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:34:Met Cys Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Cys1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly
20 25 30Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg
35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn
50 55 60Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile65 70 75 80Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly Lys
85 90 95Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu
100 105 110Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His
115 120 125Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro Val
130 135 140Gln Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro145 150 155 160Met Ala Ile Thr(2)SEQ ID NO:35的资料:(i)序列特征:
(A)长度:495个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:35: ATGTCTAATG ATATGACTCC GGAACAGATG GCTACCAACG TTAACTCCTC CTCCCCGGAA 60CGTCACACGC GTTCCTACGA CTACATGGAA GGTGGTGACA TCCGCGTACG TCGTCTGTTC 120TGCCGTACCC AGTGGTACCT GCGTATCGAC AAACGCGGCA AAGTCAAGGG CACCCAAGAG 180ATGAAAAACA ACTACAATAT TATGGAAATC CGTACTGTTG CTGTTGGTAT CGTTGCAATC 240AAAGGTGTTG AATCTGAATT CTATCTTGCA ATGAACAAGG AAGGAAAACT CTATGCAAAG 300AAAGAATGCA ATGAAGATTG TAACTTCAAA GAACTAATTC TGGAAAACCA TTACAACACA 360TATGCATCTG CTAAATGGAC CCACAACGGT GGTGAAATGT TCGTTGCTCT GAACCAGAAA 420GGTATCCCTG TTCAAGGTAA GAAAACCAAG AAAGAACAGA AAACCGCTCA CTTCCTGCCG 480ATGGCAATCA CTTAA 495(2)SEQ ID NO:36的资料:(i)序列特征:
(A)长度:164个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:36:Met Ser Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Asn Ser1 5 10 15Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly Gly
20 25 30Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu Arg
35 40 45Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn Asn
50 55 60Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala Ile65 70 75 80Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly Lys
85 90 95Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu Leu
100 105 110Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr His
115 120 125 Asn Gly Gly Glu Met Pne Val Ala Leu Asn Gln Lys Gly Ile Pro Val
130 135 140Gln Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu Pro145 150 155 160Met Ala Ile Thr(2)SEQ ID NO:37的资料:
(i)序列特征:
(A)长度:450个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:37:ATGTCTTCTC CTGAACGTCA TACGCGTTCC TACGACTACA TGGAAGGTGG TGACATCCGC 60GTACGTCGTC TGTTCTGCCG TACCCAGTGG TACCTGCGTA TCGACAAACG CGGCAAAGTC 120AAGGGCACCC AAGAGATGAA AAACAACTAC AATATTATGG AAATCCGTAC TGTTGCTGTT 180GGTATCGTTG CAATCAAAGG TGTTGAATCT GAATTCTACC TGGCAATGAA CAAAGAAGGT 240AAACTGTACG CAAAAAAAGA ATGCAACGAA GACTGCAACT TCAAAGAACT GATCCTGGAA 300AACCACTACA ACACCTACGC ATCTGCTAAA TGGACCCACA ACGGTGGTGA AATGTTCGTT 360GCTCTGAACC AGAAAGGTAT CCCGGTTCGT GGTAAAAAAA CCAAAAAAGA ACAGAAAACC 420GCTCACTTCC TGCCGATGGC AATCACTTAA 450(2)SEQ ID NO:38的资料:(i)序列特征:
(A)长度:149个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:38:Met Ser Ser Pro Glu Arg His Thr Arg Ser Tyr Asp Tyr Met Glu Gly1 5 10 15Gly Asp Ile Arg Val Arg Arg Leu Phe Cys Arg Thr Gln Trp Tyr Leu
20 25 30Arg Ile Asp Lys Arg Gly Lys Val Lys Gly Thr Gln Glu Met Lys Asn
35 40 45Asn Tyr Asn Ile Met Glu Ile Arg Thr Val Ala Val Gly Ile Val Ala
50 55 60Ile Lys Gly Val Glu Ser Glu Phe Tyr Leu Ala Met Asn Lys Glu Gly65 70 75 80Lys Leu Tyr Ala Lys Lys Glu Cys Asn Glu Asp Cys Asn Phe Lys Glu
85 90 95Leu Ile Leu Glu Asn His Tyr Asn Thr Tyr Ala Ser Ala Lys Trp Thr
100 105 110His Asn Gly Gly Glu Met Phe Val Ala Leu Asn Gln Lys Gly Ile Pro
115 120 125Val Arg Gly Lys Lys Thr Lys Lys Glu Gln Lys Thr Ala His Phe Leu
130 135 140Pro Met Ala Ile Thr145(2)SEQ ID NO:39的资料:(i)序列特征:
(A)长度:426个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:39:ATGTCCTACG ACTACATGGA AGGTGGTGAC ATCCGCGTAC GTCGTCTGTT CTGCCGTACC 60CAGTGGTACC TGCGTATCGA CAAACGCGGC AAAGTCAAGG GCACCCAAGA GATGAAAAAC 120AACTACAATA TTATGGAAAT CCGTACTGTT GCTGTTGGTA TCGTTGCAAT CAAAGGTGTT 180GAATCTGAAT TCTACCTGGC AATGAACAAA GAAGGTAAAC TGTACGCAAA AAAAGAATGC 240AACGAAGACT GCAACTTCAA AGAACTGATC CTGGAAAACC ACTACAACAC CTACGCATCT 300GCTAAATGGA CCCACAACGG TGGTGAAATG TTCGTTGCTC TGAACCAGAA AGGTATCCCG 360GTTCGTGGTA AAAAAACCAA AAAAGAACAG AAAACCGCTC ACTTCCTGCC GATGGCAATC 420ACTTAA 426(2)SEQ ID NO:40的资料:(i)序列特征:
(A)长度:141个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:40:
Met Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile Arg Val Arg Arg Leu
1 5 10 15
Phe Cys Arg Thr Gln Trp Tyr Leu Arg Ile Asp Lys Arg Gly Lys Val
20 25 30
Lys Gly Thr Gln Glu Met Lys Asn Asn Tyr Asn Ile Met Glu Ile Arg
35 40 45
Thr Val Ala Val Gly Ile Val Ala Ile Lys Gly Val Glu Ser Glu Phe
50 55 60
Tyr Leu Ala Met Asn Lys Glu Gly Lys Leu Tyr Ala Lys Lys Glu Cys
65 70 75 80
Asn Glu Asp Cys Asn Phe Lys Glu Leu Ile Leu Glu Asn His Tyr Asn
85 90 95
Thr Tyr Ala Ser Ala Lys Trp Thr His Asn Gly Gly Glu Met Phe Val
100 105 110
Ala Leu Asn Gln Lys Gly Ile Pro Val Arg Gly Lys Lys Thr Lys Lys
115 120 125
Glu Gln Lys Thr Ala His Phe Leu Pro Met Ala Ile Thr
130 135 140(2)SEQ ID NO:41的资料:(i)序列特征:
(A)长度:426个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:41: ATGTCCTACG ACTACATGGA AGGTGGTGAC ATCCGCGTAC GTCGTCTGTT CTGCCGTACC 60CAGTGGTACC TGCGTATCGA CAAACGCGGC AAAGTCAAGG GCACCCAAGA GATGAAAAAC 120AACTACAATA TTATGGAAAT CCGTACTGTT GCTGTTGGTA TCGTTGCAAT CAAAGGTGTT 180GAATCTGAAT TCTATCTTGC AATGAACAAG GAAGGAAAAC TCTATGCAAA GAAAGAATGC 240AATGAAGATT GTAACTTCAA AGAACTAATT CTGGAAAACC ATTACAACAC ATATGCATCT 300GCTAAATGGA CCCACAACGG TGGTGAAATG TTCGTTGCTC TGAACCAGAA AGGTATCCCT 360GTTCAAGGTA AGAAAACCAA GAAAGAACAG AAAACCGCTC ACTTCCTGCC GATGGCAATC 420ACTTAA 426(2)SEQ ID NO:42的资料:(i)序列特征:
(A)长度:141个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述: SEQ ID NO:42:Met Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile Arg Val Arg Arg Leu1 5 10 15Phe Cys Arg Thr Gln Trp Tyr Leu Arg Ile Asp Lys Arg Gly Lys Val
20 25 30Lys Gly Thr Gln Glu Met Lys Asn Asn Tyr Asn Ile Met Glu Ile Arg
35 40 45Thr Val Ala Val Gly Ile Val Ala Ile Lys Gly Val Glu Ser Glu Phe
50 55 60Tyr Leu Ala Met Asn Lys Glu Gly Lys Leu Tyr Ala Lys Lys Glu Cys65 70 75 80Asn Glu Asp Cys Asn Phe Lys Glu Leu Ile Leu Glu Asn His Tyr Asn
85 90 95Thr Tyr Ala Ser Ala Lys Trp Thr His Asn Gly Gly Glu Met Phe Val
100 105 110Ala Leu Asn Gln Lys Gly Ile Pro Val Gln Gly Lys Lys Thr Lys Lys
115 120 125Glu Gln Lys Thr Ala His Phe Leu Pro Met Ala Ile Thr
130 135 140(2)SEQ ID NO:43的资料:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:43:GAGCTCACTA GTGTCGACCT GCAG 24(2)SEQ ID NO:44的资料:(i)序列特征:
(A)长度:24个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(ix)特征:
(A)名称/关键词: -
(B)位置:互补(1..24)(xi)序列描述:SEQ ID NO:44:CTGCAGGTCG ACACTAGTGA GCTC 24(2)SEQ ID NO:45的资料:(i)序列特征:
(A)长度:18个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:45: 18
CAATCTACAA TTCACAGA(2)SEQ ID NO:46的资料:
(i)序列特征:
(A)长度:18个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:46:TTAAGTTATT GCCATAGG 18(2)SEQ ID NO:47的资料:(i)序列特征:
(A)长度:29个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:47:AACAAAGCTT CTACAATTCA CAGATAGGA 29(2)SEQ ID NO:48的资料:(i)序列特征:
(A)长度:27个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:48:AACAAGATCT TAAGTTATTG CCATAGG 27(2)SEQ ID NO:49的资料:(i)序列特征:
(A)长度:38个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知
(ii)分子类型:cDNA
(xi)序列描述:SEQ ID NO:49:CGGTCTAGAC CACCATGCAC AAATGGATAC TGACATGG 38(2)SEQ ID NO:50的资料:(i)序列特征:
(A)长度:33个碱基对
(B)类型:核苷酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:cDNA(xi)序列描述:SEQ ID NO:50:GCCGTCGACC TATTAAGTTA TTGCCATAGG AAG 33(2)SEQ ID NO:51的资料:(i)序列特征:
(A)长度:16个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:51:Xaa Asn Asp Met Thr Pro Glu Gln Met Ala Thr Asn Val Xaa Xaa Ser1 5 10 15(2)SEQ ID NO:52的资料:(i)序列特征:
(A)长度:12个氨基酸
(B)类型:氨基酸
(C)链型:未知
(D)拓扑结构:未知(ii)分子类型:蛋白(xi)序列描述:SEQ ID NO:52:Ser Tyr Asp Tyr Met Glu Gly Gly Asp Ile Arg Val1 5 10