具体实施方式
本发明涉及方法,其用于确定是否感兴趣的物质调节第一检测蛋白,例如膜结合蛋白,象受体,例如跨膜受体,与第二检测蛋白,象抑制蛋白家族的成员之间的相互作用。该方法涉及用两个构建子共转化或共转染真核或原核细胞。第一构建子包括,一段序列,其编码(i)第一检测蛋白,例如跨膜受体,(ii)蛋白酶识别的剪切位点,以及(iii)编码激活报道基因的蛋白的序列。第二构建子包括,(i)编码与第一检测蛋白相互作用的被检测和/或被确定的第二检测蛋白的一段序列,以及(ii)编码充分作用于是第一构建子一部分的剪切位点的蛋白酶或蛋白酶片段的核苷酸序列。在特别优选的实施方案中,这些构建子被稳定整合入细胞中。
在图1中以图表示了本发明实施方案的特点。简言之,首先,采用标准技术将编码转录因子的DNA融合到编码第一检测蛋白的DNA中,例如要研究的跨膜受体分子。这种融合的实现包括在实验中采用不能被宿主细胞内源表达的蛋白酶识别和裂解位点。
编码这种第一融合蛋白的DNA被导入并且在依赖于被融合到第一检测蛋白(例如受体)的转录因子的启动子元件的控制下,被还包含报道基因序列的细胞表达。如果外源蛋白酶不存在,转录因子仍然维系在第一检测蛋白上并且不能进入核以刺激报道基因的表达。
重组技术也可以被用于生产第二融合。在所述的实施方案中,编码抑制蛋白家族成员的DNA被融合到编码外源蛋白酶的DNA分子上,结果在第二融合蛋白中包含第二检测蛋白,即抑制蛋白家族成员。
然后进行检测,其中第二融合蛋白与第一融合蛋白一起被表达,并且检测化合物与细胞接触,优选特异的时间长度。如果检测化合物调节两种检测蛋白的相互作用,例如通过刺激,提高或增强第一和第二检测蛋白的联系,这会导致转录因子的释放,其转而移动到核中,并且诱导报道基因的表达。报道基因的活性被检测。
在可替代的系统中,两种检测蛋白可以在缺乏检测化合物的情况下相互作用,并且检测化合物可以导致两种检测蛋白解离,减弱或抑制其相互作用。在这样的情况下,在检测化合物存在时自由的有功能的活性转录因子的水平会降低,导致蛋白水解的下降,并且可检测到报道基因活性的降低。
在所述的实施方案中,为第二检测蛋白的抑制蛋白,在激活剂存在的情况下结合至受体;然而,要理解的是由于受体仅是类型的蛋白,检测不依赖于受体分子的使用,也不取决于仅仅结合能被涉及的相互作用结合的激活剂。虽然明显感兴趣的跨膜蛋白,但是任何蛋白都将是可行的。而且,结合到受体的激活剂不是能被检测的结合的唯一类型。人们可以确定激活剂,以及确定根据本发明的不同拮抗剂和/或激活剂的相对强度。
本发明的其他细节包括制造和使用其中主要物质的具体方法和技术,将在下文中描述。
I.表达构建子和转化
术语"载体"被用来指载体核酸分子,在其中能够插入核苷酸序列以便将其导入能被复制的细胞。核苷酸序列可以是“外源”的,即意味着其对于载体被导入的细胞来说是外来的或与细胞中的序列同源的但是在宿主细胞核酸的位置通常并没有发现该序列。载体包括质粒,粘粒,病毒(噬菌体,动物病毒和植物病毒),以及人工染色体(例如YACs)。本领域技术人员完全能够通过标准的重组技术构建载体(例如,参见Maniatis等,Molecular Cloning,A Laboratory Manual(ColdSpring Harbor,1990)以及Ausubel,等,1994,Current Protocols InMolecular Biology(John Wiley & Sons,1996),两者都引入作为参考)。
术语"表达载体"指的是任何类型的遗传构建子,其包含编码能够翻译的RNA的核酸。在某些情况下,RNA分子随后被翻译成蛋白,多肽或肽。在其他情况下,这些序列不被翻译,例如,反义分子或核酶的产物。表达载体可以包含多个“控制序列”,其指的是在特定的宿主细胞中可操作的连接编码序列转录和可能的翻译所必需的核酸序列。除了管理转录和翻译的控制序列之外,载体和表达载体可以包含行使其它功能的核酸序列并在下文中描述。
在特定实施方案中,质粒载体被设计用于克隆和基因传递。一般地,包含取自能与宿主细胞相容物种中的复制子和控制序列的质粒载体被用于与这些宿主结合。载体通常携带了一个复制位点,以及能够在转化细胞中提供表型选择的标记序列。在一个非限制性的例子中,E.Coli经常采用pBR322的衍生物转化,其为源自E.coli物种的质粒。pBR322含氨苄青霉素和四环素抗性的基因并且因而提供了识别转化细胞的简易方法。pBR质粒,或其他微生物质粒或噬菌体必须还要包含,或被修饰以包含,例如,能被微生物有机体利用以表达其自身蛋白的启动子。
此外,包含能与宿主微生物相容的复制子和控制序列的噬菌体载体可被用作转化载体与这些宿主结合。例如,噬菌体λGEMTM-11可用于制造重组噬菌体载体,其能被用于转化宿主细胞,例如,E.coli LE392。
细菌宿主细胞,例如,包含表达载体的E.coli,生长在任何合适的培养基,例如,LB。在特定载体中的重组蛋白的表达可以通过使宿主细胞与特定启动子特异的试剂相接触,例如通过转换到培养基中添加IPTG或通过在更高温度中间断而被诱导,这是本领域人员可以理解的。在培养菌株更长一段时间后,一般为2至24小时,通过离心收集细胞并清洗以去除残余的培养基。
[0058许多原核载体也可被用于转化真核宿主细胞。然而,理想的是选择已经被修饰从而在真核宿主细胞中表达特异性目标蛋白的载体。已经被设计用于在这样的细胞中调节和/或更高水平表达的表达系统。例如,昆虫细胞/杆状病毒系统可以产生高水平的异源核酸片段的蛋白表达,这些见于U.S.专利5,871,986和4,879,236,两者在此引入作为参考,其可以如下商品名买到,例如,来自的2.0和来自的BACPACKTM BACULOVIRUS表达系统。
表达系统的其他例子包括
的COMPLETECONTROL
TM可诱导的哺乳动物表达系统,其包含合成蜕皮激素-可诱导的受体,或者它的pET表达系统,E.coli表达系统。另一种可诱导的表达系统的例子是来自
其携带T-REX
TM(四环素调节的表达)系统,采用全长CMV启动子的可诱导哺乳动物表达系统。
还提供酵母表达系统名称为Pichia methanolica表达系统,其被设计成在嗜甲醇酵母Pichia methanolica中高表达生产重组蛋白。本领域技术人员知道如何表达载体,例如表达构建子,以生产核酸序列或其同源的多肽,蛋白,或肽。
调节信号
构建子可以包含附加的5′和/或3′元件,例如启动子,polyA序列等等。元件可以源自宿主细胞,即与宿主同源,或者它们可以源自不同的来源即异源的。
"启动子"是一段核酸序列的控制序列,其控制转录起始和速度。它可包含调节蛋白的分子可以结合的遗传元件,例如RNA聚合酶和其它转录因子,以起始核酸序列的特异转录。术语“可操作地位于”,“可操作地连接”,“控制下”和“转录控制下”意味着启动子相对于核酸序列是处于正确的功能位置和/或方向,从而控制该序列的转录起始和/或表达。
启动子一般包含位于RNA合成起始位点的序列。这种情况的最佳例子是TATA盒,但是在某些缺乏TATA盒的启动子中,例如,哺乳动物末端脱氧核苷酸转移酶基因的启动子和SV40后期基因的启动子,覆盖起始位点分离元件,以帮助固定起始位置。附加的启动子元件调节转录起始的频率。典型地,这些元件位于起始位点上游的30-110碱基区域,虽然许多启动子已被显示包含位于起始位点下游的功能元件。为了携带在启动子“控制下”的编码序列,将转录阅读框架的转录起始位点的5‘端定位于所选择启动子的“下游”(即3’端)。“上游”启动子刺激DNA的转录和所编码RNA的表达。[0063]启动子元件之间的间隔通常是可变的,因此当元件被颠倒或彼此移动时启动子的功能被保持。在tk启动子中,启动子元件之间的间隔在活性开始下降之前可以提高到50碱基。取决于启动子,表现出单个元件能够协同或单独激活转录。启动子可以或不可以与“增强子”结合,增强子指的是涉及核酸序列转录活性的顺式作用调节序列。
一个启动子可以是一个天然与核酸分子结合的,也可以是通过分离位于编码片段和/或外显子上游的5’非编码序列。这样的一个启动子可以被称为“内源”的。相似地,一个增强子可以是一个天然与核酸分子结合的,位于该序列的上游或下游。可替换地,通过将编码核酸片段定位在重组或异源启动子的控制之下可获得一定的优势,其指的启动子是指在其正常的天然环境中没有与核酸结合。重组或异源的增强子也指的是正常的在其天然环境中没有与核酸结合的增强子。这样的启动子或增强子可以包括其它基因的启动子或增强子,以及从其他病毒,原核或真核细胞分离的启动子或增强子,和非“天然产生的”启动子或增强子,即包含不同转录调节区域和/或改变表达的突变的不同元件。例如,最常用于重组DNA构建子中的启动子包括β-内酰胺酶(青霉素酶),乳糖和色氨酸(trp)启动子系统。除了产生合成的启动子和增强子核酸序列之外,序列可以采用重组克隆和/或核酸扩增技术产生,包括PCRTM,结合这里公开的组合物(参见U.S.专利Nos.4,683,202和5,928,906,在此引入作为参考)。而且,设计成在非核细胞器官例如线粒体,叶绿体,及其类似物中直接转录和/或表达序列的控制序列也可以被采用。
天然地,采用一个能在选择用于表达的细胞器官,细胞类型,组织,器官,或有机体中有效直接表达DNA片段的启动子和/或增强子将是重要的。分子生物学领域的技术人员一般都知道采用启动子,增强子,和重组细胞类型用于蛋白表达,(参见,例如Sambrook,等,1989,在此引入作为参考)。所采用的启动子可以是组成性的,组织特异的,可诱导的,和/或在适宜条件下能够高表达被导入的DNA片段,这样在重组蛋白和/或肽的大规模生产中有优势。启动子可以是异源的或内源的。
此外,任何启动子/增强子组合(根据,例如,真核启动子数据基础库EPDB,www.epd.isb-sib.ch/)也可用于操纵表达。利用T3,T7或SP6细胞质表达系统是另一种可行的实施方案。如果提供了合适的细菌聚合酶,真核细胞可以支持从特定细菌启动子所进行细胞质的转录,作为释放复合物的一部分或作为附加的遗传表达构建子。
对于编码序列有效地翻译也可以要求一个特异的起始信号。这些信号包括ATG启动密码子或邻近序列。包括外源翻译控制信号ATG启动密码子,可能需要被提供。本领域的人员将很容易确定这一点并提供必需的信号。公知的是启动密码子必须“在框架内”处于预定的编码序列的框架中以确保整个插入子的翻译。外源翻译控制信号和启动密码子既可以是天然的也可以是合成的。表达的效率可以通过包含合适的转录增强子元件而被增强。
在本发明的特定实施方案中,内源核糖体进入位点(IRES)元件被用于产生多基因或多顺反子的信息。IRES元件能够绕过5′甲基化帽子依赖翻译的核糖体扫描模型并在内部位点开始翻译(Pelletier和Sonenberg,Nature,334:320-325(1988))。来自细小核糖核酸病毒家族的两个成员的IRES元件(脊髓灰质炎病毒和脑心肌炎病毒)已经被公开(上述的Pelletier和Sonenberg),以及来自哺乳动物信息的IRES(Macejak和Sarnow,Nature,353:90-94(1991))1991)。IRES元件可以被连接至异源的开放阅读框架。多个开放阅读框架可以被一起转录,每个由一个IRES分离开,产生多顺反子信息。通过IRES元件的特性,每个开放阅读框架能靠近核糖体以便有效翻译。采用单个启动子/增强子转录单个信息就可以有效表达多个基因(参见U.S.专利Nos.5,925,565和5,935,819,每个在此引入作为参考)。
其它载体序列元件
载体可以包括多个克隆位点(MCS),其为包含多个限制性酶位点的核酸区,其任何一个能被用于与标准的重组技术结合以消化载体(参见,例如,Carbonelli,等,FEMS Microbiol.Lett.,172(1):75-82(1999),Levenson,等,Hum.Gene Ther.9(8):1233-1236(1998),以及Cocea,Biotechniques,23(5):814-816(1997)),在此引入作为参考)“限制性酶消化”指的是用一种仅仅作用于核酸分子中特异位置的酶来催化核酸分子的剪切。许多这样的限制性酶可以从商品中获得。本领域技术人员普遍理解这样酶的利用。通常,一个载体采用限制性酶在MCS内剪切从而线性化或片断化以使外源序列被连接到载体。"连接"指的是在两个可以是或不是连续的核酸片段之间形成磷酸二酯键的过程。涉及限制性酶和连接反应的技术对于重组领域技术人员来说是公知的。
大多数转录的真核RNA分子要进行RNA剪接以从原始转录本中去除内含子。含有基因组真核序列的载体可能需要供体和/或受体剪接位点以确保用于蛋白表达的转录本的正确过程(参见,例如,Chandler等,1997,在此引入作为参考)。
本发明的载体或构建子一般包含至少一个终止信号。一个"终止信号"或"终止子"包含参与通过RNA聚合酶的RNA转录本特异终止的DNA序列。这样,在特定实施方案中设计了结束RNA转录本生产的终止信号。在体内一个终止子可能是必需的以达到理想的信号水平。
在真核系统中,终止子区域还可以包含允许新转录本位点特异剪切的特异DNA序列以便于暴露聚腺苷酸化位点。其指示一个特异的内源聚合酶一段大约200腺苷残基(polyA)的序列加至转录本的3′端。采用这种聚A尾巴修饰的RNA分子更加稳定并且被更有效地翻译。因此,在涉及真核的其他实施方案中,优选的是终止子包含一个用于RNA剪切的信号,更优选的是终止子信号提高了聚腺苷酸化的信息。终止子和/或聚腺苷酸化位点元件可服务于增强信息水平并使从阅读框通读而进入其它序列最小化。
设计用于本发明的终止子包括任何这里描述的或本领域已知的转录本的终止子,包括但不限于,例如,基因的终止序列,例如牛生长激素终止子,病毒终止序列,例如SV40终止子。在特定实施方案中,终止信号可以是可转录的或可翻译序列的缺失,例如一个由于基因截断导致的不可转录或不可翻译的序列。
在表达中,特别是真核表达,其典型地包括一个聚腺苷酸化信号以有效促进转录本的正确聚腺苷酸化。聚腺苷酸化信号的特性不被认为是本发明成功操作的关键并可使用任何这样的序列。优选的实施方案包括SV40聚腺苷酸化信号或牛生长激素聚腺苷酸化信号,两者都是方便的,容易得到的,并且已知在各种目标细胞中都具有良好功能。聚腺苷酸化可以提高转录本的稳定性或促进细胞质运输。
为了在宿主细胞中增殖载体,可包括一个或更多复制位点(经常被称为"ori"),其为复制被起始的特异核苷酸序列。可替代地,如果宿主细胞是酵母可采用一个自主复制序列(ARS)。
转化方法
用于本发明的合适的核酸递送方法被认为包括事实上任何这里所描述的或本领域公知的可将核酸分子(例如DNA)导入细胞中的方法。这样的方法包括,但不限于,直接分送DNA例如通过来自体内(ex vivo)的转染(Wilson等,Science,244:1344-1346(1989),(Nabel等,Science,244:1342-1344(1989),并通过注射(U.S.专利Nos.5,994,624,5,981,274,5,945,100,5,780,448,5,736,524,5,702,932,5,656,610,5,589,466和5,580,859每个都在此引入作为参考),包括微注射(Harlan和Weintraub,J.Cell Biol.,101(3):1094-1099(1985);U.S.专利No.5,789,215,在此引入作为参考);通过电穿孔(U.S.专利No.5,384,253,在此引入作为参考;Tur-Kaspa等,Mol.Cell Biol.,6:716-718(1986);Potter等,Proc.Natl.Acad.Sci.USA,81:7161-7165(1984);通过磷酸钙沉淀(Graham和Van Der Eb,Virology,52:456-467(1973);Chen和Okayama,Mol.CellBiol.,7(8):2745-2752(1987);Rippe等,Mol.CellBiol.,10:689-695(1990);通过采用DEAE-葡聚糖随后采用聚乙二醇(Gopal,Mol.Cell Biol.,5:1188-190(1985);通过直接声波装载(Fechheimer,等,Proc.Natl.Acad.Sci.USA,89(17):8463-8467(1987);通过脂质体介导的转染(Nicolau和Sene,Biochem.&Biophys.Acta.,721:185-190(1982);Fraley等,Proc.Natl.Acad.Sci.USA,76:3348-3352(1979);Nicolau,等,Meth.Enzym.,149:157-176(1987);Wong,等,基因,10:879-894(1980);Kaneda等,Science,243:375-378(1989);Kato等,J.Biol.Chem.,266:3361-3364(1991)和受体介导的转染(Wu和Wu,J.Biol.Chem.,262:4429-4432(1987);Wu和Wu,1988);通过PEG-介导的原生质体转化(Omirulleh,等,PlantMol.Biol.,21(3):415-428(1987);U.S.专利Nos.4,684,611和4,952,500,在此引入作为参考);通过干燥/抑制介导的DNA摄取(Potrykus等,Mol.Gen.Genet.,199(2):169-177(1985),以及任何这样方法的结合。
II.检测系统的组成
对于这里所描述的方法,作为本发明特征的产品具有优选的实施方案。例如,在“三部分构建子”中,即包含编码检测蛋白,剪切位点,和活化剂蛋白的序列,检测蛋白优选膜结合蛋白,例如跨膜受体,例如,GPCR家族的成员。这些序列可以被修饰以便它们编码的蛋白的C末端具有与第二蛋白更好和更强的相互作用。修饰可以包括,例如,用编码AVPR2,AGTRLI,GRPR,F2PLI,CCR4,CXCR2/IL-8,CCR4,或GRPR的C末端编码区域置换例如GPCR检测蛋白编码序列的C-末端,,所有这些如前定义。
激活报道基因的蛋白可以是在核内作用的蛋白,就像转录因子(例如tTA,GAL4等),或者它可以是产生级联反应的分子,导致通过另蛋白的细胞核内反应。本领域人员很熟悉这样的级联反应。
第二构建子,如上所述,包括编码与第一蛋白相互作用的蛋白的区域,导致一些可检测的现象。该蛋白可以是活化剂,抑制剂或,更多,通常地,第一蛋白的“调节剂”。抑制蛋白家族成员是优选的,特别是在第一蛋白是GPCR时,但是也可以采用其他蛋白编码序列,特别是在第一蛋白不是GPCR时。这些两部分构建子的第二部分编码蛋白酶,或蛋白酶的片段,其用于从由第一构建子编码的融合蛋白中去除活化分子。
然而,这些优选的实施方案如随后要讨论的补充实施方案一样并不是限制本发明。
宿主细胞
这里所用的术语“细胞”,“细胞系”和“细胞培养物”可以相互变化使用。所有这些术语也包括它们的后代,任何以及所有随后的传代。要理解的是后代可能因为计划或偶然的突变而不相同。宿主细胞一般已经被工程化以表达可筛选的或可选择的标记,其被随着第一检测蛋白,作为融合蛋白一部分的转录因子激活。
在表达异源的核酸序列的内容中,"宿主细胞"指的是能够复制载体和/或表达由载体所编码的异源基因的原核或真核细胞。当宿主细胞用核酸分子"转染"或"转化"时,它们被称为"重组"细胞或宿主细胞,例如,一种被外源核酸序列,例如载体所引入的细胞。因此,重组细胞是可以与不包含被引入重组核酸的天然发生细胞相区别的。
大量的细胞系和培养物可被用作宿主细胞,作为它们可以从American Type Culture Collection(ATCC)中获得,其为获得活培养物和遗传材料的机构(www.atcc.org)。本领域人员可以根据载体的主链和预期的结果来确定合适的宿主。例如质粒或粘粒,可以被引入原核宿主细胞用于复制许多载体。可得到用于载体复制和/或表达的细胞类型包括但不限于,细菌,例如E.coli(例如,E.coli菌株RR1,E.coli LE392,E.colB,E.coli X1776(ATCC No.31537)以及E.coliW3110(F-,lambda-,prototrophic,ATCC No.273325),DH5α,JM109,和KC8,杆菌例如枯草芽孢杆菌;以及其它肠杆菌例如鼠伤寒沙门氏菌,粘质沙雷菌(Serratia rnarcescens),各种假单胞杆菌属种类,以及各种商业可获得的细菌宿主例如
Competent细胞和SOLOPACK
TMGold细胞(STRATAGENE
La Jolla)。在特定实施方案中,细菌细胞例如E.coli LE392被特别设计作为噬菌体病毒的宿主细胞。
用于复制和/或表达载体的真核宿主细胞的例子包括,但不限于,HeLa,NIH3T3,Jurkat,293,COS,CHO,Saos,和PC12。来自各种细胞类型和有机体的宿主细胞是可获得的并且对本领域人员是已知的。相似的,病毒载体可被用于与真核或原核宿主细胞相结合,尤其是能够用于载体的复制或表达的细胞。
检测蛋白
本发明考虑任何两种相互作用是已知的或猜测的蛋白。蛋白将作为融合蛋白存在,第一检测蛋白融合到一个转录因子,而第二检测蛋白融合到识别位于第一检测蛋白的剪切位点的蛋白酶上,该位点的剪切导致转录因子释放。对于检测蛋白/融合子的唯一要求是(a)第一检测蛋白在剪切前不能定位于核,并且(b)在与第二检测蛋白融合以及第一检测蛋白与第二检测蛋白结合之后该蛋白酶都要维持活性。
对应于第一构建子,第一检测蛋白可以是,例如,天然膜结合蛋白,或者是通过标准的技术被工程化后成为膜结合的。第一检测蛋白可以是,例如,跨膜受体,例如任何的GPCRs,或感兴趣的任何跨膜受体,包括,但不限于,酪氨酸激酶受体,丝氨酸苏氨酸激酶受体,细胞因子受体等等。而且,公知的是蛋白片段,将以与第一检测蛋白全长同样的方式起作用,第一检测蛋白这样的活性片段通过这里定义的蛋白来囊括。
对于本领域技术人员来说显然的是,本发明可以用于检测任何蛋白的相互作用,并且不限于检测膜结合受体,比如GPCRs。例如,其它种类跨膜受体的活性,包括但不限于:受体酪氨酸激酶(RTKs),例如IGF11R,例如表皮生长因子受体(EGFR),ErbB2/HER2/Neu或相关RTKs;丝氨酸/苏氨酸激酶受体,例如转化生长因子-beta(TGFβ),活化素,或骨形态发生蛋白(BMP)受体;细胞因子受体,例如干扰素家族受体,白细胞介素、促红细胞生成素、G-CSF、GM-CSF、肿瘤坏死因子(TNF)和瘦素leptin受体;以及其它受体,其不一定必须是膜结合的,例如雌激素受体1(ESR1),和雌激素受体2(ESR2)。在每种情况中,该方法涉及用调控包含感兴趣的受体的嵌合蛋白表达的经修饰了的受体构建子转染细胞,该构建子添加了蛋白酶剪切位点以及编码转录因子的核酸分子。调控由感兴趣的蛋白融合至识别和裂解上面所述位点的蛋白酶组成的嵌合蛋白的表达的第二构建子对细胞进行共转染,。在RTKs的情况下,例如EGFR,这种相互作用的蛋白可以由班汉蛋白或其片段的SH2组成(Src同源结构域2),例如磷脂酶C(PLC)或包含转化蛋白1(SHC1)的Src同源结构域2。在丝氨酸/苏氨酸激酶受体的情况下,例如TGFβ,活化素,BMP受体,这种相互作用蛋白可以是Smad蛋白或其片段。在细胞因子受体的情况下,例如干扰素-α/β或干扰素-γgamma受体,这种相互作用蛋白可以是信号转导子和转录活化子(STAT)蛋白,例如,但不限于,Statl,Stat2;Janus激酶(JAK)蛋白Jak1,Jak2或Tyk2或其片段。在每种情况中,转染细胞包含一个被融合至受体的转录因子所调节的报道基因。然后,检测通过用检测化合物处理转染细胞一定的时间并且在检测时期结束时检测报道基因的活性而得以进行。如果检测化合物激活感兴趣的受体,感兴趣的受体和相互作用蛋白之间的相互作用被刺激,导致蛋白酶位点的剪切和融合的转录因子的释放,其作为报道基因活性的提高转而可得到检测。
其它可能的蛋白对包括抗体-配体,酶-底物二聚蛋白,信号级联转导的成员,以及本领域公知的其他蛋白对。
报道基因
激活报道基因的蛋白可以是对基因具有影响的任何蛋白,其表达或缺乏会导致可检测的信号。典型的蛋白报道基因包括酶,例如氯霉素乙酰转移酶(CAT),β-葡糖醛酸酶(GUS)或β-半乳糖苷酶。也考虑荧光素和化学发光蛋白例如绿色荧光蛋白,红色荧光蛋白,蓝绿色荧光蛋白,荧光素酶,β内酰胺酶,以及碱性磷酸酶。
转录因子和阻抑蛋白
根据本发明,转录因子被用于激活在工程化宿主细胞中的报道基因的表达。转录因子典型的根据它们的DNA结合区域来分类,一般为(a)锌指,(b)螺旋-拐弯-螺旋,(c)亮氨酸拉链,(d)螺旋-圈-螺旋,或(e)高度可变基团。转录因子的活化结构域与转录装置的元件(RNA聚合酶)以及其它调节蛋白相互作用,因此影响DNA结合的效率。
Rel/核因子κB(NF-κB)和激活因子-1(AP-1)是最常被研究的转录因子家族。它们被鉴定为信号转导通路重要的成员,会导致病理结果,例如炎症和肿瘤发生。其它转录因子家族包括热休克/E2F家族,POU家族和ATF家族。具体的转录因子,例如tTA和GAL4,被考虑用在本发明中。
虽然转录因子是一类可以利用的分子,检测也可以被修饰以接受采用转录抑制分子,其中可检测信号是信号发生器的下调节,或甚至是细胞死亡。
蛋白酶和剪切位点
蛋白酶是特征为在特定位点剪切其他蛋白的酶。Ser/Thr蛋白酶家族,在丝氨酸和苏氨酸残基剪切。其它蛋白酶包括半胱氨酸或巯基蛋白酶,天冬氨酸蛋白酶,金属蛋白酶,氨基肽酶,双&三肽酶,羧基肽酶,以及肽基肽酶。这些物质的选择留给本领域技术人员并且特定的需要并不局限于在这里描述的这些分子。公知的是酶具有催化区域并且这些可以被用来替代全长的蛋白酶。这些也包括在本发明中。一个具体实施方案是烟草蚀纹病毒核内包涵体A蛋白酶,或其活性片段。也可以采用其他用于蛋白酶的特异剪切位点,这对于本领域人员是显而易见的。
检测蛋白的修饰
在此检测中,第一检测蛋白可以被修饰以增强与相互作用蛋白的结合。例如,已知的是特定的GPCRs在配体的刺激下能更稳定或更具亲和性地结合抑制蛋白并且这种增强的相互作用被独立的介导,例如,C-末端的丝氨酸和苏氨酸残基簇(Oakley等,J.Biol.Chem.,274:32248-32257,1999和Oakley,等,J.Biol.Chem.,276:19452-19460,2001)。采用这作为例子,清楚的是受体编码序列本身可以被修饰,以便提高膜结合蛋白的亲和性,例如受体与其结合的蛋白。这样修饰的例子是对膜结合蛋白C-末端区域的修饰,例如,受体,例如如上所描述的那些,其包括用相应的与结合蛋白具有更高亲和性但是不影响受体功能的另一种受体的区域替换其一部分。在前的例子16和20,显示了本发明这种特征的实施方案。
此外,第二检测蛋白可以被修饰以增强其与第一检测蛋白的相互作用。例如,检测可以掺入点突变的、截断的或其它变体的第二检测蛋白,例如,已知的与激活剂-偶联的GPCRs结合更稳定的或在磷酸化非依赖方式中的抑制蛋白(Kovoor,等,J.Biol.Chem.,274:6831-6834,1999)。
III.检测方式
如上所述,本发明在一个实施方案中提供了一个直接的方法去检测当表达在一个相同的细胞中时两种蛋白的相互作用。一个第一构建子,如上所述,包含编码第一蛋白的序列,其连接至一个编码用于蛋白酶或蛋白酶片段的剪切位点的序列,该序列本身连接在编码报道基因激活子的序列。采用"连接着"指的是所描述的序列被融合以产生单一的,完整的开放阅读框架,其可以被翻译成包含所有元件的单一多肽的序列。这些可以是,但不必须是,被可以编码或不编码附加蛋白或肽的附加核苷酸序列分离开。插入重组细胞中的第二构建子也在上文中被描述了,即它既包含编码第二蛋白的序列也包含编码蛋白酶或蛋白酶片段的序列。总而言之,这些元件在与能够影响所寻找的目标蛋白相互作用的待选试剂结合时构成了基本的检测方式。
然而,本发明也用于检测多于膜结合蛋白,例如受体,同时采用不同的报道基因,每被一个蛋白激活,例如这里所描述的蛋白种类。例如,这可以通过采用不同的受体构建子和不同的报道基因转染细胞的混合而实现,或者通过将不同的转录因子融合至每个检测受体,并且采用检测化合物检测每个报道基因的活性。例如,它可以是确定是否感兴趣的分子激活第一受体并还可以确定作为与第二受体相互作用的结果的副效应是否是预期的。在这样的情况中,例如,采用编码第一受体和第一报道子的第一细胞系,例如lacZ,以及编码第二受体和第二报道子的第二细胞系,例如GFP。这样系统的优选实施方案见于实施例17和18。人们可以混合这两种细胞系,加入感兴趣的化合物,并寻找对一个具有正效应而对另一个没有效应的物质。
要知道的是本发明既涉及检查的是相互作用检测蛋白的单一对的方法,但是更为优选的是,其也可以指的是这里的采用“多个”检测的方法。这样的检测可以各种方法进行,但是在所有的情况下,多于一对的检测蛋白被同时检测。这可以被实现,例如,通过提供多于一个细胞样本,每种都已经被转化或转染,以检测每种的蛋白相互作用对。不同的转化细胞可以在一个容器中结合并被同时检测,或者将每种不同类型的转化置于不同的孔中,然后检测。
这里所描述的用于多个检测的细胞可以是,但不必须是相同的。类似地,在每种样本中所采用的报道子系统可以是,但不必须是相同的。在样本或多个样本被置入容器中后,例如微量检测板的孔中,抗(against)容器中所产生的多个蛋白相互作用一种或多种化合物可以被筛选。
构建子所表达的融合蛋白也是本发明的一个特征。对于本领域人员来说本发明的其它特征很清楚包括,能鉴别融合蛋白以及用于确定蛋白存在的检测基础上的各种蛋白的抗体,以及杂交检测,例如基于PCR(确定基因的表达)的检测。
III.试剂盒
这里所描述的任何组合物都将包含在试剂盒中。这样,试剂盒将包含处于合适包装方式的本发明的载体或细胞,以及根据本发明所采用的任何附加试剂。
试剂盒可以包含合适的整数倍的本发明的组合物。试剂盒的成分可以为液体的或冻干的形式包装起来。试剂盒的包装中一般包括至少一个玻璃瓶,试管,培养瓶,瓶子,注射器或其他容器方式,在其中可放置成分,并且优选地,合适的整数倍。在试剂盒中有多于一种成分时,试剂盒也一般会包含第二,第三或其他附加容器,使得附加成分可以单独放置。然而,各种成分的结合物可以放置在一个瓶子中。本发明的试剂盒还典型的包含用于容纳试剂容器的装置,以便用于商品销售。这样的容器可以包括注射或吹模塑料容器以便放置预定的瓶子。
当试剂盒的成分是以一种和/或更多液体溶液提供时,液体溶液是一种水溶液,特别优选无菌水溶液。然而,试剂盒的成分可以以干的粉末提供。当试剂和/或成分以干的粉末提供时,粉末可以通过合适的溶剂而重构成。预想的是溶剂可以以另一种包装方式提供。
IV.实施例
描述本发明的特异实施方案将见于以下实施例中,但本发明不限于此。
实施例1
一个融合构建子采用编码人β2肾上腺素受体的DNA而产生,编码人β2肾上腺素受体的DNA根据标准术语在这里及以后被称为"ADRB2"。它的核苷酸序列可以在GenBank中找到,其登记号为NM_000024(SEQ ID NO:1)。四环素控制的反式激活蛋白(transactivator)tTA,由Gossen等公开,Proc.Natl.Acad.Sci.USA,87:5547-5551(1992),引入作为参考及使用。一个编码烟草蚀纹病毒核内包涵体A蛋白酶识别和剪切位点的序列(由Parks等公开,Anal.Biochem.,216:413-417(1994),引入作为参考),被插入在融合编码基因中的这些序列之间。CMV启动子区域被置于ADRB2编码区域的上游,而一个poly A序列被置于tTA区域的下游。
融合构建子通过缺乏内源BamHI和BglII限制位点的ADRB2的第一产生形式而被制备。而且,内部终止密码子被唯一的BamHI位点替换。
采用重叠PCR做到这一点。详细来说,编码区域的5′部分采用如下序列扩增:
gattgaagatctgccttcttgctggc(SEQ ID NO:2),以及
gcagaacttggaagacctgc ggagtcc(SEQ ID NO:3),
而编码区域的3′部分采用如下序列扩增:
ggactccgca ggtcttccaa gttctgc(SEQ ID NO:4),以及
ttcggatcct agcagtgagt catttgt(SEQ ID NO:5)。
[001081PCR结果的产品具有27个核苷酸的重叠序列并且通过标准的琼脂糖凝胶电泳纯化。这些混合在一起,并采用SEQ ID NO:2,和SEQ ID NO:5扩增。
PCR也可以用于修饰tTA的编码区域以便内源开始密码子被置换为TEV NIa-Pro剪切位点。该剪切位点,由七个氨基酸序列ENLYFQS(SEQ ID NO:6)限定,是由Parks等教导的,Anal.Biochem.,216:413-417(1994),引入作为参考。第七个氨基酸已知是作为PI′位置,并且将它与其它氨基酸已知减小TEV NIa-Pro剪切效率的。见于Kapust等,Biochem.Biophys.Res.Commun..294:949-955(2002)。
产生了第七氨基酸变成Tyr和Leu的变体。这些导致与天然的高效率位点相比,中等的和低效率的剪切位点。
在两个步骤中将编码天然高效率位点的DNA序列加入tTA编码区域。简言之,通过以下序列进行PCR而使BamHI和XbaI限制位点被加入到tTA编码区域5′端而Xhol限制位点被加入到tTA区域3′端,:
ccggatcctc tagattagat aaaagtaaag tg(SEQ ID NO:7),以及
gactcgagct agcagtatcctcgcgccccc taccc(SEQ ID NO:8),
通过将具有如下序列:gagaacctgt acttccag(SEQ ID NO:9)的寡核苷酸连接在5′端,而在BamHI和XbaI位点之间加入TEV NIa-Pro剪切位点。
进行修饰以编码中等的和低效率剪切位点的DNA序列的PCR采用如下序列:
ggatccgaga acctgtacttccagtacaga tta(SEQ ID NO:10),以及
ctcgagagatcctcgcgccc cctacccacc(SEQ ID NO:11),而
用于ENLYFQY(SEQID NO:12),以及
ggatccgagaacctgtactt ccagctaaga tta(SEQ ID NO:13),以及
ctcgagagatcctcgcgccc cctacccacc(SEQ ID NO:11)而用于ENLYFQL(SEQ ID NO:14)。
这些PCR步骤还包括将一个BamHI限制位点引入编码每个剪切位点的序列中5′端,以及一个XhoI限制位点至tTA终止密码子的3′端。
这样修饰的ADRB2编码区域采用在编码区域中的核苷酸位置260使用Pst I以及BamHI消化。这个3′片段与具有TEV NIa-Pro剪切位点修饰的tTA的三个变体连接,其已被BamHI和Xhol消化,并且最终复合物被克隆进BlueScriptII,其已被PstI和Xhol消化。
再次通过PCR将NotI限制位点引至ADRB2编码区域的开始密码子中的5′端,其采用
gcggccgcca ccatgaacggtaccgaaggc cca(SEQ ID NO:15),以及
ctggtgggtggcccggtacc a(SEQ ID NO:16)。
通过NotI和PstI消化分离修饰的ADRB2编码区域5′片段并且连接至在之前已经被消化的ADRB2-TEV-NIa-Pro-剪切位点tTA融合蛋白的3′片段的每个构建子之中,以产生三个编码融合蛋白的全长构建子。
每个被NotI和XhoI消化的构建子,随后被插入到用NotI和Xhol消化的商业可得的表达载体pcDNA3中。
实施例2
第二构建子也可以被制造,通过将这里及以后被称为"β抑制蛋白2或ARRB2"(GenBank,NM_004313)(SEQ ID NO:17)的编码序列,被连接至TEV蛋白中的TEV NIa蛋白酶的催化结构域(即成熟NIa蛋白酶的氨基酸189—424,残基2040-2279)。为了做到这一点,编码ARRB2的DNA序列被修饰,以便在其5′端加入一个BamHI限制位点。而且,该序列被修饰以一个BamHI位点替换内源终止密码子。寡核苷酸
caggatcctctggaatgggggagaaacccg ggacc(SEQ ID NO:18),以及
ggatccgcagagttgatcat catagtcgtc(SEQID NO:19)被采用。PCR结果的产品被克隆进商业可得的载体pGEM-T EASY(Promega)。pGEM-TEASY载体的多克隆位点包括一个在ARRB2开始密码子5′的EcoRI位点。
TEV NIa-Pro编码区域随后被修饰以用BglII位点替换内源开始密码子,并且在3′端插入编码流行性感冒血凝素(hemagluttinin)表位YPYDVPDYA(SEQ ID NO:20)的序列,根据Kolodziej等,Meth.Enzvmol.,194:508-519(1991),之后为一个终止密码子和NotI限制位点。这通过PCR实现,采用:
agatctagct tgtttaaggg accacgtg(SEQ ID NO:21),以及
gcggccgctc aagcgtaatc tggaacatca tatgggtacg agtacaccaattcattcatg ag(SEQID NO:22).
结果,修饰了的ARRB2编码区域被EcoRI和BamHI消化,而修饰了的TEV编码区域被BglII和NotI剪切。两个片段被连接至商业可得的采用EcoRI和NotI消化的pcDNA3表达载体。
实施例3
将编码ADRB2-TEV-NIa-Pro剪切位点-tTA和ARRB2-TEV-NIa蛋白酶融合蛋白的质粒转染到HEK-293T细胞,并且进入为HEK-293T衍生物的"克隆41",其具有稳定整合的在tTA依赖的启动子控制之下的β-半乳糖苷酶基因。大约5x104细胞被放置在24孔板的每个孔中,用带有10%胎牛血清的,2mM L-谷氨酰胺,100units/ml青霉素,100μg/ml G4I8,和5μg/ml purimycin的DMEM培养基中培养。第二天细胞达到50%融合度,然后采用0.4μg质粒DNA,和2μlFμgene(一种合适的包含脂质体和其他材料转染试剂)转染。混合物在100μl DMEM培养基中混合,并且在加入细胞之前在室温下孵育15分钟。转染细胞在通过加入已知的受体拮抗剂进行检测之前孵育8-20小时,然后在药物加入后孵育16-24小时。
实施例4
细胞中β-半乳糖苷酶活性水平首先通过用产色的底物染色细胞而检测,即:“X-gal”,由MacGregor等,Somat.Cell Mol.Genet.,13:253-265(1987)教导,引入作为参考。培养后,细胞采用带有钙和镁的D-PBS清洗两次,在4%多聚甲醛中固定5分钟,随后再用D-PBS(含钙和镁)清洗两次,每次10分钟。固定了的细胞用含有钙和镁、5mM铁氰化钾,5mM亚铁氰化钾,2mM MgCl2,由储存在二甲基甲酰胺中的4%X-Gal中1:40稀释而制备的0.1%X-Gal的D-PBS孵育。
室温下反应在黑暗中被孵育3-4小时至过夜。去除底物溶液,采用mowiol封固介质(mounting medium)(10%mowiol,0.1%1.4-二氮杂双环[2.2.2]辛烷,24%甘油)将细胞封固在玻璃盖玻片下。
结果显示无论是单独采用ADRB2-TEV-NIa-Pro剪切位点-tTA质粒还是ARRB2-TEV-NIa蛋白酶质粒转染的细胞都不表达β-半乳糖苷酶。采用两种质粒转染的小部分细胞则表达β-半乳糖苷酶,可能是由于未刺激的ADRB2和ARRB2之间存在基底水平的相互作用。在采用10uM异丙基肾上腺素,或10uM肾上腺素(这两者均为ADRB2激活剂)处理细胞后,大约3-5倍更多的细胞表达报道基因。
当细胞采用ADRB2拮抗剂阿普洛尔(alprenolol)(10uM)预处理5分钟时,激活剂所引起的细胞中β-半乳糖苷酶表达的提高被阻断,而单独采用阿普洛尔处理不会引起明显的效果。
这些结果使人们可以将激活剂结合与GPCR刺激报道基因的转录活性相联系。
实施例5
为了更加精确的定量报道基因在细胞中的活性水平和使检测信号对背景最大化而进行了一系列的试验。这通过采用商业可得的针对β-半乳糖苷酶的化学发光检测进行报道基因诱导水平的检测而实现。克隆41细胞用前述的包含高,中或低效应的剪切位点的ADRB2-tTA融合构建子以及ARRB2-TEV-NIa蛋白酶表达质粒转染。转染之后20小时采用或不采用1uM异丙基肾上腺素处理细胞,并且在药物加入后的24小时后进行发光检测。简言之,细胞培养后,去除培养基,将50μl裂解缓冲液(100mM磷酸钾,pH7.8,0.2%TritonX-100)加入到每孔中。通过在室温下轻微搅拌5分钟而裂解细胞。收集裂解物并且通过商业可得的产品进行分析。
在所有情况下,采用激活剂处理会提高β-半乳糖苷酶活性水平。然而,在带有低效应剪切位点的未处理的细胞中报道基因活性的背景水平相对于中间和高的效应位点来说是最低的。而且,激活剂处理后,带有低效应剪切位点的细胞中报道基因的活性为4.8倍而相比于含有中等效应剪切位点的2.8倍的活性和含有高效应剪切位点的细胞的1.2倍的活性。这样,通过采用低效应蛋白酶剪切位点就获得了最高的信噪比。
实施例6
这些试验被设计以确定。激活剂刺激引起的报道基因表达的提高是依赖于被激活剂结合和激活的受体。
为了做到这一点,采用前述方式产生了ADRB2-tTA融合构建子的变体,其中不包括每个中在位置113从D到S的单个氨基酸变化的突变,其导致对激活剂异丙基肾上腺素亲和性的大量降低,参见Strader等,J.Biol.Chem.,266:5-8(1991)。形成了带有不同剪切位点的三种受体-tTA融合构建子突变体。
在采用包含前述的D113S点突变的ADRB2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶表达质粒共转染的克隆41细胞中检测β-半乳糖苷酶活性的水平。活性检测如前述进行。结果显示激活剂异丙基肾上腺素不刺激报道基因在表达突变的ADRB2-tTA融合构建子的细胞中的表达。
实施例7
这些试验被设计以检查是否激活剂刺激的报道基因表达的提高是依赖于TEV NIa-Pro与ARRB2的融合。
为了做到这一点,检测在采用带有低效应剪切位点的ADRB2-tTA融合构建子和前述的ARRB2TEV-NIa蛋白酶表达质粒,或者和一个融合至磷脂酶C的SH2结构域的TEV-NIa蛋白酶对照共转染的克隆41细胞中检测β-半乳糖苷酶活性水平。活性检测如前述进行。结果表明激活剂刺激报道基因表达的提高仅仅在TEV蛋白酶被融合至ARRB2上被检测到而在融合至不相关的多肽时不能检测到。
实施例8
这些试验被设计以确定是否基因表达是由目标受体的激活剂选择性诱导的,或者其能被其他分子刺激。
ATP是G蛋白偶联受体P2Y1和P2Y2的激活剂,其被HEK-293T细胞内源表达。
采用前述的带有低效应剪切位点的ADRB2-tTA融合构建子和抑制蛋白TEV-NIa蛋白酶融合共转染的,并用异丙基肾上腺素、ATP或未处理的克隆41细胞进行试验。检测如前述进行。
结果显示报道基因活性的诱导是目标受体激活所特异的。另一种GPCR通路的刺激是不相关的。
实施例9
采用前述的带有低效应剪切位点的ADRB2-tTA融合构建子和ARRB2TEV-NIa蛋白酶融合共转染的克隆41细胞进行一系列试验,其采用数量变化的肾上腺受体激活剂之一的异丙基肾上腺素和肾上腺素处理。检测如前所述进行。图2a中所代表的结果显示报道基因表达对这两种配体刺激的剂量应答曲线。每个点代表从三个试验中获得的平均值。
一系列的试验如前述进行,在其中共转染的克隆41细胞采用各种浓度的肾上腺素受体拮抗剂阿普洛尔预处理15分钟,然后用1uM肾上腺素处理。在图2b中显示的结果说明这种拮抗剂的剂量抑制曲线。
实施例10
制造类似的系列构建子以建立对于偶联的G蛋白的精氨酸血管加压素受体2(AVPR2)检测。AVPR2编码区域(Genbank登记号:NM_000054)(SEQ ID NO:23)被修饰为在5’端放置EcoRI位点并且用BamHI位点替换终止密码子,采用如下引物进行PCR:
gaattcatgc tcatggcgtc caccac(SEQ ID NO:24)以及
ggatcccgat gaagtgtcct tggccag(SEQ ID NO:25)。
修饰的AVPR2编码区域被连接至前述的已经被EcoRI和BamHI剪切的三种ADRB2-tTA构建子。这用AVPR2的编码序列替换了ADRB2的整个编码序列。
克隆41细胞被前述的包含低效应剪切位点的AVPR2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合蛋白共转染,并且采用各种浓度(1pM到2uM)的[Arg8]血管加压素(AVPR2激活剂)进行检测。在图3中代表的数据显示对这种激活剂的剂量应答曲线,采用3.3nM的EC50,与以前公开的数据一致(Oakley,R.等,Assay and DrμgDevelopment Technologies,1:21-30,(2002))。最大应答结果是诱导的报道基因表达大约是背景水平的40倍。
实施例11
一系列相似的构建子被制造以建立G蛋白偶联的血清素受体1a(HTR1A)的检测。HTR1A编码区域(Genbank登记号:NM_000524)(SEQ ID NO:26)被修饰为在5’端放置一个EcoRI位点而用一个BamHI位点替换终止密码子,采用如下引物进行PCR:gaattcatggatgtgctcagccctgg(SEQ ID NO:27),以及
ggatccctgg cggcagaact tacac(SEQ ID NO:28).
修饰的HTR1A编码区被连接至前述的已被EcoRI和BamHI剪切的AVPR2-tTA构建子。这采用HTR1A的编码序列替换了整个AVPR2编码序列。最终构建子在这里即以后被称为“HTR1A-tTA”。
克隆41细胞被前述的包含低效应剪切位点的HTR1A-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染,并采用10μM8-氢氧基-DPAT HBr(OH-DPAT),HTR1A激活剂,以及10uM血清素,HTR1A天然激活剂进行检测。检测如前述进行。对OH-DPAT最大应答结果是诱导的报道基因表达大约是背景水平的6.3倍,而血清素最大应答结果是诱导的报道基因表达大约是背景水平的4.6倍。
实施例12
相似的构建子被制造以建立G蛋白偶联的m2毒蕈碱性乙酰胆碱受体(CHRM2)的检测。CHRM2编码区域(Genbank登记号:NM_000739)(SEQ ID NO:29)被修饰为在5’端放置一个EcoRI位点并且采用一个BglII位点替换终止密码子,采用如下引物进行PCR:
gaattcatga ataactcaac aaactcc(SEQ ID NO:30)以及
agatctccttgtagcgccta tgttc(SEQ ID NO:31)。
修饰的CHRM2编码区域被连接至前述AVPR2-tTA构建子,其已被EcoRI和BamHI剪切。这用CHRM2的编码序列替换了整个AVPR2编码序列。
克隆41细胞被前述的包含高效应剪切位点的CHRM2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染,其中ARRB2-蛋白酶融合构建子在单纯疱疹病毒胸腺嘧啶核苷激酶(HSV-TK)启动子的控制下表达,并采用10uM氨甲酰基胆碱Cl(卡巴胆碱carbochol),CHRM2激活剂,如前述进行检测。卡巴胆碱最大应答结果是诱导的报道基因表达大约是背景水平的7.2倍。
实施例13
构建子也可被制造以建立G蛋白偶联趋化因子(C-C模序)受体5(CCR5)的检测。CCR5编码区域(Genbank登记号:NM_000579)(SEQID NO:32)被修饰以在5’端放置一个Not I位点并采用一个BamHI位点替换终止密码子,采用如下引物进行PCR:
gcggccgcatggattatcaa gtgtcaagtc c(SEQ ID NO:33)以及
ggatccctggcggcagaact tacac(SEQ ID NO:34)。
CCR5编码区域也被修饰以在5’端放置一个BsaI位点,其在被剪切时,留下与EcoRI剪切DNA相容的核苷酸突出端,采用如下引物:
ggtctccaattcatggatta tcaagtgtca agt(SEQ ID NO:35),以及
gacgacagcc aggtacctat c(SEQ ID NO:36)。
第一修饰的编码区域被ClaI和BamHI剪切而第二被Bsal和Clal剪切。这两个片段被连接至前述AVPR2-tTA构建子,其已被EcoRI和BamHI剪切。这用CCR5的编码序列替换了整个AVPR2编码序列。
含有低效应剪切位点的CCR5-tTA融合构建子被转染至"克隆34"细胞,其为前述HEK细胞系"克隆41"的衍生物,但是其包含一个在CMV启动子控制之下的稳定整合了的ARRB2-TEV-NIa蛋白酶融合基因。采用1μg/ml“调节正常T—细胞表达和分泌活性”(RANTES)的已知CCR5激活剂进行检测。对RANTES的最大应答如前述检测的结果为诱导大约40倍于背景的报道基因的表达。
实施例14
其次,一系列构建子被制造以建立G蛋白偶联的多巴胺2受体(DRD2)的检测。DRD2编码区域(Genbank登记号:NM_000795)(SEQ ID NO:37)被修饰以在5’端放置一个EcoRI位点并且用一个BglII位点替换整个终止密码子,采用如下引物进行PCR:
gaattcatgg atccactgaa tctgtcc(SEQ ID NO:38),以及
agatctgcag tggaggatct tcagg(SEQ ID NO:39).
修饰的DRD2编码区域被连接至前述用EcoRI和BamHI剪切的AVPR2-tTA构建子。这用DRD2的编码序列替换了整个AVPR2编码序列。
克隆41细胞被前述的包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用10uM多巴胺HCl(多巴胺),一种DRD2激活剂进行检测。结果在前述的检测中被检测。对多巴胺的最大应答为诱导的报道基因表达是背景的2.7倍。
实施例15
这些试验被设计来证明采用结合激活剂-偶联的GPCRs的抑制蛋白变体的增强作用更稳定。首先,构建TEVNIa蛋白酶至(β-抑制蛋白-1(ARRB1)的融合构建子。ARRB1的编码区域(Genbank登记号:NM_004041)(SEQ ID NO:40)被修饰以在5’端放置一个Asp718位点并用一个BamHI位点替换终止密码子,采用如下引物进行PCR:
ggtaccatgg gcgacaaagggacgcgagtg(SEQ ID NO:41),以及
ggatcctctg ttgttgagctgtggagagcc tgtaccatcc tcctcttc(SEQ ID NO:42)。
结果,修饰的ARRB1编码区域被Asp718和EcoRI以及EcoRI和BamHI剪切,而前述的修饰的TEV NIa-Pro编码区域被BglII和NotI剪切。所有这三个片段被连接至商业可得的pcDNA3表达载体,其已经被Asp718和NotI消化。
克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB1-TEV-NIa蛋白酶融合构建子共转染,并且检测采用如前述的10μM多巴胺HCI(多巴胺),一种D2受体的激活剂进行。对多巴胺的最大应答为诱导的报道基因表达是背景的2.1倍。
在氨基酸382后截断ARRB1已被报道会导致不依赖GRK-介导的磷酸化对激活剂结合的GPCRs亲和性增加,(Kovoor A.等,J.Biol.Chem.,274(11):6831-6834(1999))。为了在目前的检测中使用这样的“组成性活性的”抑制蛋白,β-抑制蛋白-1的编码区域被修饰以在5’端放置一个Asp718位点并在氨基酸382之后放置一个BamHI位点,采用如下序列以及前述的SEQID NO:41进行PCR:
ggatccatttgtgtcaagtt ctatgag(SEQ ID NO:43)。
结果产生比全长的编码区域短36个氨基酸的ARRb1编码区域于。称为"ARRB1(Δ383)"的获得的修饰的ARRB1编码区域采用Asp718和EcoRI以及采用EcoRI和BamHI剪切,而前述的修饰的TEV NIa-Pro编码区域采用BglII和Notl剪切。所有这三种片段被连接至商业可得的采用Asp718和NotI消化pcDNA3表达载体。
克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB1(Δ383)-TEV-NIa蛋白酶融合构建子共转染,并且采用10μM多巴胺HCl(多巴胺),一种前述的DRD2受体激活剂进行检测。对多巴胺的最大应答是诱导的报道基因表达是背景的8.3倍。。
为了检查ARRB2编码区域类似的截断,ARRB2的编码区域被修饰以在5’端放置一个Asp718位点并且用一个BamHI位点替换3’端的81核苷酸,采用如下引物进行PCR:
ggtaccatgggggagaaacc cgggacc(SEQ ID NO:44),以及
ggatcctgtg gcatagttgg tatc(SEQID NO:45)。
结果产生短于全长的编码区域27个氨基酸的ARRB2编码区。最终修饰的ARRB2编码区域采用Asp718和BamHI剪切,而前述修饰的TEV NIa-Pro编码区域采用BglII和Notl剪切。这两种片段被连接至商业可得的采用Asp718和NotI消化pcDNA3表达载体,。
克隆41细胞被包含中等效应剪切位点的DRD2-tTA融合构建子和ARRB2(Δ383)-TEV-NIa蛋白酶融合构建子共转染,并且采用10μM多巴胺HCl(多巴胺),如前述的一种DRD2受体拮抗剂进行检测。对多巴胺的最大应答是诱导的报道基因为背景的2.1倍。
这些结果如图4所代表,证明DRD2多巴胺受体检测显示采用抑制蛋白变体ARRB1(Δ383)获得最高信噪比。
实施例16
进行一系列的试验已证明采用被设计成提高蛋白相互作用的受体修饰增强了检测。在这个实施例中,检测受体的C-末端区域被用来自AVPR2的相应尾巴区域替换,其为一种已知的具有高亲和性结合抑制蛋白的物质。在这些实施例中,在第七跨膜螺旋末端保存的NPXXY模序之后15—18个氨基酸融合连接,其典型的相对应于紧挨着受体C末端的公认的棕榈酰化位点之后。
首先,PCR被用来生产一个编码AVPR2C-末端29个氨基酸DNA片段,之后为低效应TEV剪切位点和tTA转录因子。该片段还被设计成前两个氨基酸(Ala,A和Arg,R)被BssHII限制位点GCGCGC编码。这通过扩增具用前述低效应剪切位点的AVPR2-tTA构建子而实现,引物如下:
tgtgcgcgcg gacgcacccc acccagcctg ggt(SEQ ID NO:46),以及
ctcgagagat cctcgcgccc cctacccacc(SEQ ID NO:11).
其次,DRD2的编码区域被修饰以在5’端放置一个EcoRI位点并将一个BssHII位点插入到编码区域中的最后氨基酸之后(Cys-443)。这采用如下引物进行PCR:
gaattcatgg atccactgaatctgtcc(SEQ ID NO:47),以及
tgtgcgcgcg cagtggagga tcttcaggaa ggc(SEQ ID NO:48)。
获得的修饰的D2编码区域采用EcoRI和BssHII剪切并且获得的AVPR2C-末端低效应剪切位点-tTA片段采用BssHII和BamHI剪切。这两个片段被连接至前述的用EcoRI和BamHI剪切的AVPR2-低效应剪切位点-tTA构建子。
克隆41细胞被包含低效应TEV剪切位点的DRD2-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用如前述的10μM多巴胺HCl(多巴胺),一种DRD2受体激活剂,进行检测。对多巴胺的最大应答是诱导的报道基因为背景的60倍。
制造了一种构建子,其中通过在5’端插入一个Asp718位点和在Cys-341之后放置一个BssHII位点而修饰ADRB2受体。通过如下引物进行PCR:
gcggccgcca ccatgaacgg taccgaaggc cca(SEQ ID NO:49),以及
tgtgcgcgcgcacagaagct cctggaaggc(SEQ ID NO:50)。
修饰的ADRB2受体编码区域采用EcoRI和BssHII剪切而AVPR2C-末端尾巴低效应剪切位点-tTA片段采用BssHII和BamHI剪切。这两个片段被连接至前述的采用EcoRI和BamHI剪切的AVPR2-低效应剪切位点-tTA构建子,。获得构建子是"ADRB2-AVPR2尾巴-tTA."(也参见出版的上述专利U.S.2002/0106379,特别是SEQ IDNO:3)
克隆41细胞被包含低效应剪切位点的DRB2-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用如前述的10μM异丙肾上腺素,一种ADRB2受体激活剂进行检测。对异丙肾上腺素的最大应答是诱导的报道基因为背景的10倍。
制造了一种构建子,其中通过在Cys-345之后放置一个BssHII位点而修饰卡巴阿片样物质受体(OPRK;Genbank登记号:NM_000912)(SEQIDNO:51)编码区域。通过如下引物进行PCR:
ggtctacttg atgaattcct ggcc(SEQ ID NO:52),以及
gcgcgcacag aagtcccgga aacaccg(SEQ ID NO:53)
修饰的OPRK受体编码区域采用EcoRI和BssHII剪切而AVPR2C-末端尾巴低效应剪切位点-tTA片段采用BssHII和Xhol剪切。这两个片段被连接至包含克隆进入在Asp718(5′)和XhoI(3′)的pcDNA3.1+的修饰的OPRK受体序列的质粒中,其被EcoRI和Xhol剪切。
克隆41细胞被包含低效应剪切位点的OPRK-AVPR2尾巴-tTA融合构建子和前述的ARRB2-TEV-NIa蛋白酶融合构建子共转染,并且采用10μMU-69593,一种OPRK受体激活剂进行检测。对U-69593的最大应答是诱导的报道基因为背景的12倍。
实施例17
该试验被设计已证明利用该检测方法采用一种多重方式同时检测两种待测受体的活性。
克隆41细胞和"克隆1H10"细胞,其为包含受tTA依赖的启动子控制的荧光素酶基因稳定整合的HEK-293T细胞系,每个被置于24孔培养盘中并且分别用前述嵌合的ADRB2-AVPR2尾巴-tTA或DRD2-AVPR2尾巴-tTA融合构建子瞬时转染。采用每孔100μμl培养基,0.4μg DNA和2μl Fμgene试剂实现瞬时转染。孵育24小时之后,表达ADRB2-AVPR2尾巴-tTA的克隆41细胞和表达DRD2-AVPR2尾巴-tTA的克隆H10细胞被胰酶消化,等量混合,重置于96孔板的12孔中。三个孔不加药进行孵育或立刻用1μM异丙基肾上腺素,1μM多巴胺,或1μM两者的混合物处理。在配体加入之后的24小时对细胞报道基因的活性检测。培养基被废弃,细胞在40μμl裂解缓冲液中[100mM磷酸钾,pH7.8,0.2%Triton X-100]中裂解而细胞裂解物采用商业可获得的发光检测试剂检测β-半乳糖苷酶和荧光素酶活性。
图5A和5B代表了结果。用异丙基肾上腺素处理的结果是β-半乳糖苷酶报道基因活性大约诱导了7倍,而荧光素酶活性维持不变。用多巴胺处理的结果是荧光素酶活性大约诱导了3.5倍,而β-半乳糖苷酶活性维持不变。用异丙基肾上腺素和多巴胺同时处理的结果是分别诱导了7倍的β半乳糖苷酶和3倍的荧光素酶活性。
实施例18
这个试验被设计证明采用一个多重方式利用该检测方法同时检测两种待测受体。
"克隆34.9"细胞,其为克隆41细胞的衍生物并且包含一个稳定整合的ARRB2-TEVNIa蛋白酶融合蛋白基因,采用前述的嵌合的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合构建子瞬时转染。平行地,"克隆HTL5B8.1"细胞,其为包含在tTA依赖的启动子控制下的荧光素酶基因稳定整合子的HEK-293T细胞系,采用前述的ADRB-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合构建子瞬时转染。在每种情况下,5x105细胞被置入6孔盘的每个孔中,并且在添加有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μg/ml G418和3μμg/ml嘌呤霉素的DMEM培养基中培养24小时。细胞用100μl的DMEM,0.5μg的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA DNA和2.5μlFμgene("克隆34.9细胞")或100μμl的DMEM,0.5μμlg的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTADNA,0.5μgμl的ARRB2-TEV NIa蛋白酶DNA和5μlFμgene("克隆HTL5B8.1细胞")瞬时转染。瞬时转染细胞被培养24小时,然后用胰酶消化,等量混合并重置于96孔板中。在采用10μM U-69593,10μM异丙基肾上腺素或10μM这两者的混合物处理之前细胞孵育24小时。每种试验条件检测16个孔。24小时之后,细胞被裂解并且采用前述的方法检测β-半乳糖苷酶和荧光素酶报道基因活性。结果见于图6。采用U-69593处理结果诱导了大约15倍的β-半乳糖苷酶报道基因活性,而荧光素酶活性维持不变。采用异丙基肾上腺素处理结果诱导了145倍的荧光素酶活性,而β-半乳糖苷酶活性维持不变。采用U-69593和异丙基肾上腺素结果分别诱导了9倍的β-半乳糖苷酶和136倍的荧光素酶活性。
实施例19
实施该试验以证明在本发明的检测中不同转录因子和启动子的使用。
制造一种融合构建子,包含编码AVPR2的DNA,融合进入编码包括前述的TEV Nla-Pro低效应剪切位点的氨基酸连接子GSENLYFQLR(SEQ ID NO:54)的DNA序列的框架中,融合进入编码酵母GAL4蛋白(GenBank登记号P04386)(SEQ ID NO:55)氨基酸2-147的DNA序列中,其后为一个连接子,即序列PELGSASAELTMVF(SEQ ID NO:56),其后为鼠核因子卡巴-B链p65蛋白(GenBank登记号A37932)(SEQ ID NO:57)的氨基酸368-549。CMV启动子被放置于AVPR2编码区域的上游而一个polyA序列被放置于GAL4-NFkB区域的下游。这种构建子是重新设计的AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4。
HμL5C1.1是HEK-293T细胞的一种衍生物,其包含在一个商业可得的pFR-LUC的GAL4上游激活序列(UAS)控制之下稳定整合的荧光素酶报道基因。
这个AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4质粒和前述的β-抑制蛋白2-TEV Nla蛋白酶共转染入HμL5C1.1细胞。大约2.5x104细胞被放置在96孔板的每孔中,在10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μμg/ml G418以及3μμg/ml嘌呤霉素的DMEM培养基中培养。第二天细胞生长至50%融合度融合度并且采用10μμl每孔的包含85μμl的DMEM,0.1μμg的AVPR2-TEV-Nia-Pro剪切(Leu)-GAL4DNA,0.1μμg的ARRB2-TEVNla蛋白酶DNA,以及1μμl的Fμgene的混合物进行转染,这些物质在加入细胞之前在室温孵育15分钟。在采用10μM血管加压素处理之前培养细胞大约16小时。6小时之后,裂解细胞并且如前述进行荧光素酶活性检测。在这些条件下,血管加压素处理导致报道基因活性提高180倍。
实施例20
进行这一系列的试验以证明采用进一步的受体修饰可增强检测,该受体修饰被设计成提高与相互作用蛋白的亲和性。在这个实施例中,检测受体的C末端尾巴区域采用如下受体相应的尾巴区域替换:apelin J受体-AGTRL1(登记号:NM_005161)(SEQ ID NO:58),胃泌激素释放肽受体-GRPR(登记号:NM_005314)(SEQ ID NO:59),蛋白酶活化受体2-F2RL1(登记号:NM_005242)(SEQ ID NO:60),CCR4(登记号:NM_005508)(SEQ ID NO:61),趋化因子(C-X-C模序)受体4-CXCR4(登记号:NM_003467)(SEQ ID NO:62),以及白细胞介素8受体,β-CXCR2/IL8b(登记号:NM_001557)(SEQ ID NO:63)。
用第一PCR产生编码上述受体C-末端尾巴的DNA片段。这些片段是这样设计的,即前两个氨基酸(Ala,A和Arg,R)通过BssHII限制位点编码。
AGTRL1C-末端片段采用如下引物扩增:
tgtgcgcgcggccagagcag gtgcgca(SEQID NO:64),以及
gaggatccgt caaccacaagggtctc(SEQ ID NO:65)。
GRPR C-末端片段采用如下引物扩增:
tgtgcgcgcg gcctgatcatccggtct(SEQ ID NO:66),以及
gaggatccgacataccgctc gtgaca(SEQ ID NO:67)。
F2RL1C-末端片段采用如下引物扩增:
tgtgcgcgcagtgtccgcactgtaaagc(SEQ ID NO:68)以及
gaggatccataggaggtcttaacagt(SEQ ID NO:69).
CCR4C-末端片段采用如下引物扩增:
tgtgcgcgcggcctttttgtgctctgc(SEQIN :70),以及
gaggatccca gagcatcatg aagatc(SEQ ID NO:71)。
CXCR2/IL8b C-末端片段采用如下引物扩增:
tgtgcgcgcggcttgatcagcaagggac(SEQ ID NO:72),以及
gaggatccga gagtagtgga agtgtg(SEQ ID NO:73)。
CXCR4C-末端片段采用如下引物扩增:
tgtgcgcgcgggtccagcct caagatc(SEQ ID NO:74),以及
gaggatccgc tggagtgaaaacttga(SEQ ID NO:75)。
获得的编码这些受体C-末端修饰的DNA片段采用BssHII和BamHI剪切并且片段被连接至OPRK受体编码区域框架,在前述的OPRK-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA表达构建子中替换AVPR2-C-末端片段。
前述的HTL5B8.1细胞采用上面修饰的每个OPRK编码区域-TEV-NIa-Pro剪切(Leu)-tTA构建子和前述的β-抑制蛋白2-TEVNIa蛋白酶融合构建子进行共转染。放置每孔大约2.5x104细胞在96孔板中,用10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μg/ml G418,和3μμg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50%融合度融合度并且采用每孔10μl的如下混合物进行转染:85μl的DMEM,0.25μμg的AVPR2-TEV-NIa-Pro剪切(Leu)-GAL4DNA,0.25μμg的ARRB2-TEV NIa蛋白酶DNA,以及2.5μμl的Fμgene(一种合适的包含脂质体和其他材料的转染试剂),在加入细胞之前在室温下孵育15分钟。转染细胞在用10μM U-69593处理前孵育大约16小时。6小时之后,裂解细胞并如前述检测荧光素酶活性。在这些条件下,采用U-69593处理,结果导致对于每种修饰的OPRK受体下述的报道基因活性的提高:OPRK-AGTRLI C-末端尾巴-30倍;OPRK-GRPRC-末端尾巴-312倍;OPRK-F2RL1C-末端尾巴-69.5倍;OPRK-CCR4C-末端尾巴-3.5倍;OPRK-CXCR4C-末端尾巴-9.3倍;OPAK-IL8b C-末端尾巴-113倍。
实施例21
这个实验被设计以生产前述的稳定表达ARRB2-TEV
NIa蛋白酶融合蛋白的细胞系。
制造了一种在EF1α启动子控制之下表达ARRB2-TEV
NIa蛋白酶融合蛋白并且还在胸腺嘧啶核苷激酶(TK)启动子控制之下表达潮霉素抗性基因的质粒。
该质粒被转染进HTL5B8.1,并且通过在100μμg/ml潮霉素存在下进行培养而选择出质粒稳定整合在基因组的克隆。抗性克隆被分离的和扩展并且通过前述的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA质粒转染而进行筛选。采用这一程序进行选择的三个细胞系,分别称为"HTLA4C2.10","HTLA2C11.6"和"HTLA5D4"。大约每孔2.5x104细胞被植入到96孔板上,在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μμg/ml G418,3μμg/ml嘌呤霉素,和100μg/ml潮霉素的DMEM培养基中培养。第二天细胞生长至50%融合度融合度并且被每孔10μl的如下混合物转染:85μμl的DMEM,0.25μμg的ADRB2-AVPR2-TEV-NIa-Pro剪切(Leu)-GALADNA和0.5μμl的Fμgene,其在加入细胞之前在室温孵育15分钟。在用10μM异丙基肾上腺素处理之前培养转染细胞大约16小时。6小时之后,细胞被裂解并如前述检测荧光素酶活性。在这些条件下,用异丙基肾上腺素处理导致这三个细胞系中分别有如下报道基因活性的提高:112-倍("HTLA4C2.10"),56-倍("HTLA2C11.6")和180-倍("HTLA5D4")。
实施例22
该实验被设计以生产稳定表达前述的ARRB2-TEV NIa蛋白酶和ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合蛋白的细胞系。
包含潮霉素抗性基因的ARRB2-TEV NIa蛋白酶质粒与前述的ADRB2-AVPR2尾巴-TEV-NIa-Pro剪切(Leu)-tTA融合蛋白质粒一起转染进HTL5B8.1细胞并且通过在100μμg/ml潮霉素的存在下培养而选择包含质粒稳定整合到基因组的克隆。抗性克隆被分离并扩展,并通过采用10μM异丙基肾上腺素处理而被筛选并检测如前述诱导的报道基因活性。采用该程序选择的三个细胞系被称为"HTLAR
1E4","HTLAR1C10"和"HTLAR2G2"。用异丙基肾上腺素处理6小时结果导致分别在三种细胞系中如下报道基因活性的提高:208-倍("HTLAR1E4"),197-倍("HTLAR1C10")和390-倍("HTLAR2G2")。
实施例23
该实验被设计以证明利用该检测方法检测受体酪氨酸激酶表皮生长因子受体(EGFR)的活性。
制造第一融合构建子,包含编码人EGFR的DNA,其可以在GenBank登记号NM_005228(SEQ ID NO:76)中找到,融合进入编码前述四环素控制的反式激活蛋白(transactivator)tTA的氨基酸3-335的DNA序列的框架中。插入在这些序列之间的是一个编码包括前述TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)低效应剪切位点的氨基酸序列GGSGSENLYFQL(SEQID NO:77)的DNA序列。CMV启动子被放置在表皮生长因子受体编码区域的上游,而polyA序列被放置在tTA区域的下游。这一构建子被称为EGFR-TEV-NIa-Pro剪切(Leu)-tTA。
制造第二融合构建子,其包含编码两个人磷脂酶CGamma1相应于氨基酸538-759(基因Bank登记号NP_002651.2)(SEQ ID NO:78)的SH2结构域的DNA,其被融合进入一个编码前述成熟TEV NIa蛋白酶对应于氨基酸2040-2279(基因Bank登记号AAA47910)(SEQ ID NO:79)的催化结构域的DNA序列的框架中。在这些序列之间插入的一个编码氨基酸NSSGGNSGS(SEQ ID NO:80)的连接子DNA序列。CMV启动子被放置在PLC-Gamma SH2结构域编码序列的上游并且polyA序列被放置在TEV NIa蛋白酶序列的下游。这个构建子被称为PL CGammal-TEV。
EGFR-TEV-NIa-Pro剪切(Leu)-tTA和PLC Gammal-TEV融合构建子被转染进入前述克隆HTL5B8.1细胞。大约2.5x104细胞被放置于96孔板的每孔中,在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μg/ml G418,和3μμg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50%融合度融合度并采用每孔15μl如下混合物进行转染:100μμl的DMEM,0.4μμg的pcDNA3DNA("携带子"载体DNA),0.04μμg的EGFR-TEV-NIa-Pro剪切(Leu)-tTA DNA,0.04μμg的PLC Gammal-TEVDNA,以及2μμlFμgene(一种合适的包含脂质体和其他材料的转染试剂),在加入细胞之前在室温下孵育15分钟。在采用特异的受体激活剂和抑制剂处理之前转染细胞被培养大约16小时。6小时之后,裂解细胞并如前述方法检测荧光素酶活性。结果见图7。
加入2.5ng/ml人表皮生长因子(对应于该配体的EC80)结果导致荧光素酶报道基因活性增加12.3倍,而加入100ng/ml人转化生长因子-Alpha结果导致增加18.3倍。在加入人表皮生长因子之前采用酪氨酸激酶抑制子(70μM AG-494;0.3μM AG-1478;2mMRG-130022)预处理阻断了报道基因活性的诱导。
实施例24
该实验被设计以证明采用该检测方法检测人I型干扰素受体的活性。
制造一种融合构建子,其包含编码人干扰素受体I(IFNAR1)(557氨基酸)的NA,可以在Genbank登记号NM_000629(SEQ ID NO:81)中找到,被融合进入编码前述四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA序列框架中。在这些序列之间插入的是一个编码包括前述TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQ ID NO:82)的DNA序列。CMV启动子被放置于人干扰素受体I(IFNAR1)编码区域的上游,而一个poly A序列被放置于tTA区域的下游。这个构建子被称为IFNAR1-TEV-NIa-Pro剪切(L)-tTA。
制造一个第二融合构建子,采用编码人干扰素受体2的DNA,即剪接变体2(IFNAR2.2)(515个氨基酸),其可以在Genbank登记号L41942(SEQ ID NO:83)中找到,被融合进入一个编码前述对应于氨基酸2040-2279(GenBank登记号AAA47910)(SEQ ID NO:84)的TEVNIa蛋白酶的催化结构域的DNA序列的框架中。在这些序列之间插入的是一个编码氨基酸序列RS(Arg-Ser)的DNA序列。CMV启动子区域被放置于人干扰素受体2(IFNAR2.2)编码区域的上游,而一个poly A序列被放置于TEV区域的下游。该构建子被称为IFNAR2.2-TEV。
构建了Genbank登记号为NM_007315(SEQ ID NO:85)的人信号传导和转录激活因子1(STAT1)的基因和人转录本2(STAT2)信号转换和活化子见于Genbank登记号为NM_005419(SEQID NO:86)的人信号传导和转录激活因子2(STAT2)的基因的表达构建子,其表达受CMV启动子区域控制。这些构建子分别被称为CMV-STAT1和CMV-STAT2。
IFNAR1-TEV-NIa-Pro剪切(L)-tTA和IFNAR2.2-TEV融合构建子与CMV-STAT1和CMV-STAT2一起被瞬时转染进入前述HTL5B8.1细胞。大约2.5x104细胞被种植在96孔板的每孔中并在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,100μμg/mlG418,和5μμg/ml嘌呤霉素的DMEM培养基中培养。孵育24小时之后,细胞采用每种15ng的IFNAR1-TEV-NIa-Pro剪切(L)-tTA,IFNAR2.2-TEV,CMV-STAT1和CMV-STAT2DNA,或者采用60ng对照pcDNA质粒,与0.3μlFμgene每孔进行转染。转染细胞在采用5000U/ml人干扰素α或5000U/ml人干扰素β处理之前孵育8—20小时。在加入干扰素时,吸出培养基并采用带有2mM L-谷氨酰胺,100units/ml青霉素,3μμg/ml嘌呤霉素和500μμg/ml的G418的293SFM II培养基替换。在进行前述的荧光素酶报道基因活性检测之前干扰素-处理的细胞被培养18—20小时。结果见图8。采用5000U/ml IFNα处理结果导致报道基因活性提高15倍,而采用5000U/ml IFNβ处理导致10倍的提高。用干扰素处理采用对照质粒pcDNA3转染的HTL5B8.1细胞对报道基因活性没有影响。图9显示在采用前述的IFNAR1(ENLYFQ(L)-tTa,IFNAR2.2-TEV,STAT1和STAT2表达构建子转染的HTL5B8.1细胞中对于IFNa所产生的剂量应答曲线。
实施例25
该实验证明该检测方法采用不同的转录因子和不同的细胞系检测人I型干扰素受体的活性。
制造融合构建子,采用编码人干扰素受体I(IFNAR1)的DNA,融合进入一个编码前述GAL4-NF-KB融合子的DNA序列。在这些序列之间插入的是一个编码包括前述的TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO:87)的DNA序列。CMV启动子被放置在人干扰素受体I(IFNAR1)编码区域的上游,而一个poly A序列被放置在GAL4-NE-κB区域的下游。该构建子被称为IFNAR1-TEV-NIa-Pro剪切(L)-GAL4-NF-κB。
CHO-K1细胞随后被采用如下5种质粒的混合物瞬时转染:IFNAR1-TEV-NIa-Pro剪切(L)-GAL4-NF-κB,IFNAR2.2-TEV,CMV-STAT1,CMV-STAT2和GAL4依赖的启动子控制下的荧光素酶报道基因质粒pFR-Luc。在转染前大约每孔1.0x104细胞被种植在96孔板中,采用带有如下成分的DMEM培养基培养:10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素。细胞在第二天被转染,采用10ng报道基因质粒(pFR-Luc),加上20ng前述的每种表达构建子,或者采用10ng报道基因质粒加上80ng对照pcDNA3质粒,以及每孔0.3μl Fμgene。在采用5000U/ml人干扰素-α处理之前培养转染细胞8—20小时。在加入干扰素之前,吸出培养基,用带有2mM L-谷氨酰胺,100units/ml青霉素的DMEM培养基替换。干扰素α处理的细胞在进行前述的荧光素酶报道基因活性检测之前培养6小时。结果见图10。采用报道基因,IFNAR和STAT构建子CHO-K1转染的细胞经IFNα处理结果导致报道基因活性提高3倍,而采用报道基因和对照质粒转染的转染细胞经干扰素处理对报道基因活性没有影响。
实施例26
设计本系列的试验以证明采用设计好的提高检测受体与相互作用蛋白之间亲和性的修饰增强检测。在这些例子中,在检测受体和GRPR(Genbank登记号:NM_005314)(SEQ ID NO:59)C-末端尾巴区域之间的融合连接在第七跨膜螺旋末端保存的NPXXY模序之后形成17-23个氨基酸。
首先,PCR被用来产生一个编码在假定的棕榈酰化位点之后的从GRPR开始2个氨基酸的C-末端42氨基酸的DNA片段(自此以后被称为GRPR42aa)。该片段被设计魏C-末端尾巴的第一氨基酸之前为由XbaI限制位点TCTAGA所编码的两个氨基酸(Ser,S andArg,R),而终止密码子被由BamHI限制位点GGATCC所编码的两个氨基酸(Gly,G and Ser,S)替换。这通过扩增包含GRPR编码区域的质粒而完成,采用的引物是:
tctagaggcctgatcatccggtctcac(SEQ ID NO:88),以及
gaggatccgacataccgctcgtgaca(SEQ ID NO:67)
接下来OPRK(Genbank登记号:NM_000912)(SEQ ID
NO:51)的编码区域被修饰以在Pro-347之后插入Xbal位点。采用如下引物进行PCR:
ggtctacttgatgaattcctggcc(SEQ ID NO:52),以及
tctagatggaaaacagaagtcccggaaac(SEQ ID NO:89)
此外,ADRA1A(Genbank登记号:Nom_000680)(SEQIDNO:90)的编码区域被修饰以在Lys-349之后插入Xbal位点。采用如下引物进行PCR:
ctcggatatctaaacagctgcatcaa(SEQ ID NO:91),以及tctagactttctgcagagacactggattc(SEQ ID NO:92)
此外,DRD2(Genbank登记号:NM_000795)(SEQ IDNO:37)的编码区域被修饰以在Cys-343之后插入两个氨基酸(Leu和Arg)以及XbaI位点。这采用如下引物进行PCR:
gaattcatggatccactgaatctgtcc(SEQ ID NO:38),以及
tctagatcgaaggcagtggaggatcttcagg(SEQ ID NO:93)
修饰的OPRK受体编码区域采用EcoRI和XbaI剪切而GRPR42aa C-末端尾巴片段采用XbaI和BamHI剪切。两个片段被连接至包含具有前述的AVPR2C-末端尾巴-低效应剪切位点-tTA的OPRK受体的质粒中,其采用EcoRI和BamHI消化。
修饰的ADRA1A受体编码区域采用EcoRV和Xbal剪切而包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子采用XbaI和XhoI剪切。两个片段被连接至包含ADRA1A受体的质粒中,其被EcoRV和XhoI消化。
修饰的DRD2受体编码区域采用EcoRI和Xbal剪切而包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子采用XbaI和Xhol剪切。两个片段被连接至pcDNA6质粒,其被EcoRI和XhoI消化。
如前述的HTLA2C11.6细胞,被包含低效应剪切位点的OPRK-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μMU-69593,一种OPRK激活剂而进行。对U-69593的最大应答为报道基因活性提高大约200倍。
HTLA2C11.6细胞采用包含低效应剪切位点的ADRA1A-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μM肾上腺素,一种ADRAIA激活剂而进行。对肾上腺素最大应答为报道基因活性提高大约14倍。
HTLA2C11.6细胞采用包含低效应剪切位点的DRD2-GRPR42aa尾巴-tTA融合构建子转染并且检测采用10μM多巴胺,一种DRD2激活剂而进行。对多巴胺最大应答为报道基因活性提高大约30倍。
实施例27
本系列的试验本设计以证明采用设计好的提高检测受体与相互作用蛋白之间亲和性的修饰的不同检测受体进一步增强检测。在这些实施例中,检测受体的C-末端区域被GRPR内源的C-末端尾巴结构域的一个片断替换。
首先,PCR被用于生产一个编码截断的GRPR尾巴的DNA片段,特别是编码从Gly-343至Asn-365的23氨基酸的序列。片段被设计为C-末端尾巴的第一氨基酸之前为由XbaI限制位点TCTAGA所编码的两个氨基酸(Ser,S和Arg,R),而Ser-366被由BamHI限制位点GGATCC所编码的两个氨基酸(Gly,G和Ser,S)替换。这通过扩增一个包含GRPR编码区域的质粒而完成,所用引物如下:tctagaggcctgatcatccggtctcac(SEQ ID NO:94)以及
cggatccgttggtactcttgagg(SEQID NO:95)。
接下来,截断的GRPR片段(自此以后被称为GRPR
23aa尾巴)采用Xbal和BamHI剪切并插入到包含这里所述的低效应检测位点的OPRK-GRPR42aa尾巴-tTA融合构建子中,其采用Xbal和BamHI消化。
同样地,GRPR23aa尾巴片段采用Xbal和BamHI消化并且被插入到这里所述的包含低效应剪切位点的ARRA1A-GRPR42aa尾巴-tTA融合构建子中,其采用Xbal和BamHI消化。
HTLA2C11.6细胞采用包含低效应剪切位点的OPRK-GRPR23aa尾巴-tTA融合构建子转染并且检测采用10μMU-69593,一种OPRK激活剂而进行。对U-69593的最大应答为报道基因表达比背景提高了大约115倍。
HTLA2C11.6细胞采用包含低效应剪切位点的ADRA1A-GRPR23aa尾巴-tTA融合构建子转染并且检测采用10μM肾上腺素,一种ADRA1A激活剂而进行。对肾上腺素的最大应答为报道基因的表达比背景提高了大约102倍。
实施例28
该实验被设计以证明利用该检测方法能检测受体酪氨酸激酶胰岛素样生长因子1受体(IGF1R)的活性,特别是通过监控配体诱导细胞内信号蛋白SHCI(包含Src同源2结构域转化蛋白1)的募集而检测。
制造第一融合构建子被,包含编码人IGF-1R的DNA,其可在GenBank登记号NM_000875(SEQ ID NO:96)下找到,其被融合进入一个编码前述的四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA序列中。在这些序列中插入的是一个编码包括前述的TEVNIa-Pro,ENLYFQL(SEQ ID NO:14)低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO:82)的DNA序列。CMV启动子被放置在IGF1R编码区域的上游,并且polyA序列被放置在tTA区域的下游。该构建子被称为IGF1R-TEV-NIa-Pro剪切(Leu)-tTA。
制造第二融合构建子,包含编码人SHC1,对应于氨基酸1-238(基因Bank登记号BC014158)(SEQ ID NO:97)的PTB区域的DNA被融合进入一个编码前述的成熟TEV NIa蛋白酶,对应于氨基酸2040-2279(基因Bank登记号AAA47910)(SEQ ID NO:79)的催化结构域的DNA序列中。在这些序列中插入的是一个连接子DNA序列,其编码氨基酸NSGS(SEQ ID NO:98)。CMV启动子被放置在SHC1PTB结构域编码序列的上游而一个polyA序列被放置在TEV NIa蛋白酶序列的下游。该构建子被称为SHC1-TEV。
IGF1R-TEV-NIa-Pro剪切(Leu)-tTA和SHC1-TEV融合构建子被转染进入前述的克隆HTL5B8.1细胞中。大约2.5x104细胞放置于96孔板的每孔中,采用带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,500μμg/ml G418,和3μg/ml嘌呤霉素的DMEM培养基培养。第二天细胞生长至50%融合度融合度并且采用每孔15μl如下混合物进行转染:100μμgl DMEM,0.2μμg IGF1R-TEV-NIa-Pro剪切(Leu)-tTA DNA,0.2μμg SHC1-TEV DNA,以及2μμl Fμgene(一种合适的包含脂质体和其他材料的转染试剂),在加入细胞之前在室温下孵育15分钟。在采用特异受体激活剂处理之前,转染细胞被培养大约16小时。24小时之后,裂解细胞并如前述检测荧光素酶活性。
加入1μM人胰岛素样生长因子1导致荧光素酶报道基因活性提高90倍。
实施例29
该试验本设计以证明采用该检测方法能检测不是正常膜结合蛋白的两种检测蛋白之间的相互作用。在这个实施例中,该检测方法被用来检测配体诱导的核类固醇激素受体,ESR1(雌激素受体1或ERα)和ESR2(雌激素受体2或ERβ)二聚化。在这个实施例中,ESR1被融合至转录因子tTA,其中TEV NIa-Pro蛋白酶剪切位点在ESRI和tTA序列之间插入。该ESRI-tTA通过融合细胞内跨膜蛋白CD8的C末端而系在膜上。CD8基本功能为一个插入支架,而使ESR1连系在细胞膜的细胞质侧。这样融合的转录因子不能进入核直到与ESR2和蛋白酶相互作用。可采用任何跨膜蛋白。这种CD8-ESR1-TEV NIa Pro剪切-tTA融合蛋白与一个包含ESR2和TEV NIa-Pro蛋白酶的第二融合蛋白一起在包含一个tTA依赖的报道基因的细胞系中表达。雌激素诱导的ESR1和ESR2二聚化因而触发了tTA转录因子从膜结合的融合蛋白中释放,其可以通过随后诱导的报道基因活性而得以检测。
制造融合构建子,其包含编码人CD8基因(235氨基酸)的DNA序列,其可在Genbank登记号NM_001768(SEQ ID NO:99)下发现,被融合进入编码人ESR1(596氨基酸s)的DNA序列中,其可在Genbank登记号NM_000125(SEQ ID NO:100)下发现。在这些序列中插入的是一个编码氨基酸序列GRA(Gly-Arg-Ala)的DNA序列。最终构建子随后被融合至编码前述的四环素控制的反式激活蛋白tTA的氨基酸3-335的DNA编码序列框中。在这些序列中插入的是一个编码包含前述的TEV NIa-Pro,ENLYFQL(SEQ ID NO:14)的低效应剪切位点的氨基酸序列GSENLYFQL(SEQID NO:82)的DNA序列。CMV启动子被放置在人CD8编码区域的上游,而polyA序列被放置在tTA区域的下游。该构建子被称为CD8-ESR1-TEV-NIa-Pro剪切(L)-tTA。
制造第二融合构建子,采用编码人雌激素受体β(ESR2)(530个氨基酸)的DNA,其可在Genbank登记号NM_001437(SEQIDNO:101)下被找到,其被融合进入一个编码前述的TEVNIa蛋白酶催化结构域,对应于氨基酸2040-2279(GenBank登记号AAA47910)(SEQ ID NO:84)的DNA序列中。在这些序列中插入的是一个编码氨基酸序列RS(Arg-Ser)的DNA序列。CMV启动子区域被放置在人雌激素受体β(ESR2)编码区域的上游,而poly A序列被放置在TEV区域的下游。该构建子被称为ESR2-TEV。
CD8-ESR1-TEV-NIa-Pro剪切(L)-tTA和ESR2-TEV融合构建子,与pCDNA3一起被瞬时转染入前述的HTL5B8.1细胞中。大约2.0x104细胞被种植在96孔板的每孔中并且在带有10%胎牛血清,2mM L-谷氨酰胺,100units/ml青霉素,100μμg/ml G418和5μμg/ml嘌呤霉素的不含酚的DMEM培养基中培养。在孵育24小时后,细胞每孔采用5ng的ESR1-TEV-NIa-Pro剪切(L)-tTA,15ngESR2-TEV和40ng pCDNA3以及0.3μμl Fμgene的混合物一起进行转染。转染6小时之后,细胞用PBS清洗并在采用50nM17-β雌二醇处理之前用100μμl不含酚和血清的DMEM中孵育24小时。配体处理的细胞在如前述检测荧光素酶报道基因活性之前再培养18—20小时。用50nM17-β雌二醇处理使得报道基因活性增加16倍。
本发明的其它特征对于本领域技术人员是清楚的并且不需要在此再介绍。
序列表
<110>K·J·李
R·阿谢尔
W·斯特拉波斯
G·巴尔内亚
<120>检测蛋白-蛋白相互作用的方法
<130>SENTI203.3PCT
<140>PCT/US2004/021887
<141>2004-07-09
<150>60/566,113
<151>2004-04-27
<150>60/511,918
<151>2003-10-15
<150>60/485,968
<151>2003-07-09
<160>101
<210>1
<211>2015
<212>DNA
<213>人
<400>1
actgcgaagc ggcttcttca gagcacgggc tggaactggc aggcaccgcg agcccctagc 60
acccgacaag ctgagtgtgc aggacgagtc cccaccacac ccacaccaca gccgctgaat 120
gaggcttcca ggcgtccgct cgcggcccgc agagccccgc cgtgggtccg cccgctgagg 180
cgcccccagc cagtgcgctt acctgccaga ctgcgcgcca tggggcaacc cgggaacggc 240
agcgccttct tgctggcacc caatagaagc catgcgccgg accacgacgt cacgcagcaa 300
agggacgagg tgtgggtggt gggcatgggc atcgtcatgt ctctcatcgt cctggccatc 360
gtgtttggca atgtgctggt catcacagcc attgccaagt tcgagcgtct gcagacggtc 420
accaactact tcatcacttc actggcctgt gctgatctgg tcatgggcct ggcagtggtg 480
ccctttgggg ccgcccatat tcttatgaaa atgtggactt ttggcaactt ctggtgcgag 540
ttttggactt ccattgatgt gctgtgcgtc acggccagca ttgagaccct gtgcgtgatc 600
gcagtggatc gctactttgc cattacttca cctttcaagt accagagcct gctgaccaag 660
aataaggccc gggtgatcat tctgatggtg tggattgtgt caggccttac ctccttcttg 720
cccattcaga tgcactggta ccgggccacc caccaggaag ccatcaactg ctatgccaat 780
gagacctgct gtgacttctt cacgaaccaa gcctatgcca ttgcctcttc catcgtgtcc 840
ttctacgttc ccctggtgat catggtcttc gtctactcca gggtctttca ggaggccaaa 900
aggcagctcc agaagattga caaatctgag ggccgcttcc atgtccagaa ccttagccag 960
gtggagcagg atgggcggac ggggcatgga ctccgcagat cttccaagtt ctgcttgaag 1020
gagcacaaag ccctcaagac gttaggcatc atcatgggca ctttcaccct ctgctggctg 1080
cccttcttca tcgttaacat tgtgcatgtg atccaggata acctcatccg taaggaagtt 1140
tacatcctcc taaattggat aggctatgtc aattctggtt tcaatcccct tatctactgc 1200
cggagcccag atttcaggat tgccttccag gagcttctgt gcctgcgcag gtcttctttg 1260
aaggcctatg ggaatggcta ctccagcaac ggcaacacag gggagcagag tggatatcac 1320
gtggaacagg agaaagaaaa taaactgctg tgtgaagacc tcccaggcac ggaagacttt 1380
gtgggccatc aaggtactgt gcctagcgat aacattgatt cacaagggag gaattgtagt 1440
acaaatgact cactgctgta aagcagtttt tctactttta aagacccccc cccccccaac 1500
agaacactaa acagactatt taacttgagg gtaataaact tagaataaaa ttgtaaaaat 1560
tgtatagaga tatgcagaag gaagggcatc cttctgcctt ttttattttt ttaagctgta 1620
aaaagagaga aaacttattt gagtgattat ttgttatttg tacagttcag ttcctctttg 1680
catggaattt gtaagtttat gtctaaagag ctttagtcct agaggacctg agtctgctat 1740
attttcatga cttttccatg tatctacctc actattcaag tattaggggt aatatattgc 1800
tgctggtaat ttgtatctga aggagatttt ccttcctaca cccttggact tgaggatttt 1860
gagtatctcg gacctttcag ctgtgaacat ggactcttcc cccactcctc ttatttgctc 1920
acacggggta ttttaggcag ggatttgagg agcagcttca gttgttttcc cgagcaaagg 1980
tctaaagttt acagtaaata aaatgtttga ccatg 2015
<210>2
<211>26
<212>DNA
<213>人
<400>2
gattgaagat ctgccttctt gctggc 26
<210>3
<211>27
<212>DNA
<213>人
<400>3
gcagaacttg gaagacctgc ggagtcc 27
<210>4
<211>27
<212>DNA
<213>人
<400>4
ggactccgca ggtcttccaa gttctgc 27
<210>5
<211>27
<212>DNA
<213>人
<400>5
ttcggatcct agcagtgagt catttgt 27
<210>6
<211>7
<212>PRT
<213>人
<400>6
Glu Asn Leu Tyr Phe Gln Ser
5
<210>7
<211>32
<212>DNA
<213>人
<400>7
ccggatcctc tagattagat aaaagtaaag tg 32
<210>8
<211>35
<212>DNA
<213>人
<400>8
gactcgagct agcagtatcc tcgcgccccc taccc 35
<210>9
<211>18
<212>DNA
<213>人
<400>9
gagaacctgt acttccag 18
<210>10
<211>33
<212>DNA
<213>人
<400>10
ggatccgaga acctgtactt ccagtacaga tta 33
<210>11
<211>30
<212>DNA
<213>人
<400>11
ctcgagagat cctcgcgccc cctacccacc 30
<210>12
<211>7
<212>PRT
<213>人
<400>12
Glu Asn Leu Tyr Phe Gln Tyr
5
<210>13
<211>33
<212>DNA
<213>人
<400>13
ggatccgaga acctgtactt ccagctaaga tta 33
<210>14
<211>7
<212>PRT
<213>人
<400>14
Glu Asn Leu Tyr Phe Gln Leu
5
<210>15
<211>33
<212>DNA
<213>人
<400>15
gcggccgcca ccat gaacgg taccgaaggc cca 33
<210>16
<211>21
<212>DNA
<213>人
<400>16
ctggtgggtg gcccggtacc a 21
<210>17
<211>1936
<212>DNA
<213>人
<400>17
ccccgcgtgt ctgctaggag agggcgggca gcgccgcggc gcgcgcgatc cggctgacgc 60
atctggcccc ggttccccaa gaccagagcg gggccgggag ggagggggaa gaggcgagag 120
cgcggagggc gcgcgtgcgc attggcgcgg ggaggagcag ggatcttggc agcgggcgag 180
gaggctgcga gcgagccgcg aaccgagcgg gcggcgggcg cgcgcaccat gggggagaaa 240
cccgggacca gggtcttcaa gaagtcgagc cctaactgca agctcaccgt gtacttgggc 300
aagcgggact tcgtagatca cctggacaaa gtggaccctg tagatggcgt ggtgcttgtg 360
gaccctgact acctgaagga ccgcaaagtg tttgtgaccc tcacctgcgc cttccgctat 420
ggccgtgaag acctggatgt gctgggcttg tccttccgca aagacctgtt catcgccacc 480
taccaggcct tccccccggt gcccaaccca ccccggcccc ccacccgcct gcaggaccgg 540
ctgctgagga agctgggcca gcatgcccac cccttcttct tcaccatacc ccagaatctt 600
ccatgctccg tcacactgca gccaggccca gaggatacag gaaaggcctg cggcgtagac 660
tttgagattc gagccttctg tgctaaatca ctagaagaga aaagccacaa aaggaactct 720
gtgcggctgg tgatccgaaa ggtgcagttc gccccggaga aacccggccc ccagccttca 780
gccgaaacca cacgccactt cctcatgtct gaccggtccc tgcacctcga ggcttccctg 840
gacaaggagc tgtactacca tggggagccc ctcaatgtaa atgtccacgt caccaacaac 900
tccaccaaga ccgtcaagaa gatcaaagtc tctgtgagac agtacgccga catctgcctc 960
ttcagcaccg cccagtacaa gtgtcctgtg gctcaactcg aacaagatga ccaggtatct 1020
cccagctcca cattctgtaa ggtgtacacc ataaccccac tgctcagcga caaccgggag 1080
aagcggggtc tcgccctgga tgggaaactc aagcacgagg acaccaacct ggcttccagc 1140
accatcgtga aggagggtgc caacaaggag gtgctgggaa tcctggtgtc ctacagggtc 1200
aaggtgaagc tggtggtgtc tcgaggcggg gatgtctctg tggagctgcc ttttgttctt 1260
atgcacccca agccccacga ccacatcccc ctccccagac cccagtcagc cgctccggag 1320
acagatgtcc ctgtggacac caacctcatt gaatttgata ccaactatgc cacagatgat 1380
gacattgtgt ttgaggactt tgcccggctt cggctgaagg ggatgaagga tgacgactat 1440
gatgatcaac tctgctagga agcggggtgg gaagaaggga ggggatgggg ttgggagagg 1500
tgagggcagg attaagatcc ccactgtcaa tgggggattg tcccagcccc tcttcccttc 1560
ccctcacctg gaagcttctt caaccaatcc cttcacactc tctcccccat ccccccaaga 1620
tacacactgg accctctctt gctgaatgtg ggcattaatt ttttgactgc agctctgctt 1680
ctccagcccc gccgtgggtg gcaagctgtg ttcataccta aattttctgg aaggggacag 1740
tgaaaagagg agtgacagga gggaaagggg gagacaaaac tcctactctc aacctcacac 1800
caacacctcc cattatcact ctctctgccc ccattccttc aagaggagac cctttgggga 1860
caaggccgtt tctttgtttc tgagcataaa gaagaaaata aatcttttac taagcatgaa 1920
aaaaaaaaaa aaaaaa 1936
<210>18
<211>35
<212>DNA
<213>人
<400>18
caggatcctc tggaatgggg gagaaacccg ggacc 35
<210>19
<211>30
<212>DNA
<213>人
<400>19
ggatccgcag agttgatcat catagtcgtc 30
<210>20
<211>9
<212>PRT
<213>人
<400>20
Tyr Pro Tyr Asp Val Pro Asp Tyr Ala
5
<210>21
<211>28
<212>DNA
<213>人
<400>21
agatctagct tgtttaaggg accacgtg 28
<210>22
<211>62
<212>DNA
<213>人
<400>22
gcggccgctc aagcgtaatc tggaacatca tatgggtacg agtacaccaa ttcattcatg 60
ag 62
<210>23
<211>1809
<212>DNA
<213>人
<400>23
agaagatcct gggttctgtg catccgtctg tctgaccatc cctctcaatc ttccctgccc 60
aggactggcc atactgccac cgcacacgtg cacacacgcc aacaggcatc tgccatgctg 120
gcatctctat aagggctcca gtccagagac cctgggccat tgaacttgct cctcaggcag 180
aggctgagtc cgcacatcac ctccaggccc tcagaacacc tgccccagcc ccaccatgct 240
catggcgtcc accacttccg ctgtgcctgg gcatccctct ctgcccagcc tgcccagcaa 300
cagcagccag gagaggccac tggacacccg ggacccgctg ctagcccggg cggagctggc 360
gctgctctcc atagtctttg tggctgtggc cctgagcaat ggcctggtgc tggcggccct 420
agctcggcgg ggccggcggg gccactgggc acccatacac gtcttcattg gccacttgtg 480
cctggccgac ctggccgtgg ctctgttcca agtgctgccc cagctggcct ggaaggccac 540
cgaccgcttc cgtgggccag atgccctgtg tcgggccgtg aagtatctgc agatggtggg 600
catgtatgcc tcctcctaca tgatcctggc catgacgctg gaccgccacc gtgccatctg 660
ccgtcccatg ctggcgtacc gccatggaag tggggctcac tggaaccggc cggtgctagt 720
ggcttgggcc ttctcgctcc ttctcagcct gccccagctc ttcatcttcg cccagcgcaa 780
cgtggaaggt ggcagcgggg tcactgactg ctgggcctgc tttgcggagc cctggggccg 840
tcgcacctat gtcacctgga ttgccctgat ggtgttcgtg gcacctaccc tgggtatcgc 900
cgcctgccag gtgctcatct tccgggagat tcatgccagt ctggtgccag ggccatcaga 960
gaggcctggg gggcgccgca ggggacgccg gacaggcagc cccggtgagg gagcccacgt 1020
gtcagcagct gtggccaaga ctgtgaggat gacgctagtg attgtggtcg tctatgtgct 1080
gtgctgggca cccttcttcc tggtgcagct gtgggccgcg tgggacccgg aggcacctct 1140
ggaaggggcg ccctttgtgc tactcatgtt gctggccagc ctcaacagct gcaccaaccc 1200
ctggatctat gcatctttca gcagcagcgt gtcctcagag ctgcgaagct tgctctgctg 1260
tgcccgggga cgcaccccac ccagcctggg tccccaagat gagtcctgca ccaccgccag 1320
ctcctccctg gccaaggaca cttcatcgtg aggagctgtt gggtgtcttg cctctagagg 1380
ctttgagaag ctcagctgcc ttcctggggc tggtcctggg agccactggg agggggaccc 1440
gtggagaatt ggccagagcc tgtggccccg aggctgggac actgtgtggc cctggacaag 1500
ccacagcccc tgcctgggtc tccacatccc cagctgtatg aggagagctt caggccccag 1560
gactgtgggg gcccctcagg tcagctcact gagctgggtg taggaggggc tgcagcagag 1620
gcctgaggag tggcaggaaa gagggagcag gtgcccccag gtgagacagc ggtcccaggg 1680
gcctgaaaag gaaggaccag gctggggcca ggggaccttc ctgtctccgc ctttctaatc 1740
cctccctcct cattctctcc ctaataaaaa ttggagctct tttccacatg gcaaggggtc 1800
tccttggaa 1809
<210>24
<211>26
<212>DNA
<213>人
<400>24
gaattcatgc tcatggcgtc caccac 26
<210>25
<211>27
<212>DNA
<213>人
<400>25
ggatcccgat gaagtgtcct tggccag 27
<210>26
<211>1266
<212>DNA
<213>人
<400>26
atggatgtgc tcagccctgg tcagggcaac aacaccacat caccaccggc tccctttgag 60
accggcggca acactactgg tatctccgac gtgaccgtca gctaccaagt gatcacctct 120
ctgctgctgg gcacgctcat cttctgcgcg gtgctgggca atgcgtgcgt ggtggctgcc 180
atcgccttgg agcgctccct gcagaacgtg gccaattatc ttattggctc tttggcggtc 240
accgacctca tggtgtcggt gttggtgctg cccatggccg cgctgtatca ggtgctcaac 300
aagtggacac tgggccaggt aacctgcgac ctgttcatcg ccctcgacgt gctgtgctgc 360
acctcatcca tcttgcacct gtgcgccatc gcgctggaca ggtactgggc catcacggac 420
cccatcgact acgtgaacaa gaggacgccc cggccgcgtg cgctcatctc gctcacttgg 480
cttattggct tcctcatctc tatcccgccc atcctgggct ggcgcacccc ggaagaccgc 540
tcggaccccg acgcatgcac cattagcaag gatcatggct acactatcta ttccaccttt 600
ggagctttct acatcccgct gctgctcatg ctggttctct atgggcgcat attccgagct 660
gcgcgcttcc gcatccgcaa gacggtcaaa aaggtggaga agaccggagc ggacacccgc 720
catggagcat ctcccgcccc gcagcccaag aagagtgtga atggagagtc ggggagcagg 780
aactggaggc tgggcgtgga gagcaaggct gggggtgctc tgtgcgccaa tggcgcggtg 840
aggcaaggtg acgatggcgc cgccctggag gtgatcgagg tgcaccgagt gggcaactcc 900
aaagagcact tgcctctgcc cagcgaggct ggtcctaccc cttgtgcccc cgcctctttc 960
gagaggaaaa atgagcgcaa cgccgaggcg aagcgcaaga tggccctggc ccgagagagg 1020
aagacagtga agacgctggg catcatcatg ggcaccttca tcctctgctg gctgcccttc 1080
ttcatcgtgg ctcttgttct gcccttctgc gagagcagct gccacatgcc caccctgttg 1140
ggcgccataa tcaattggct gggctactcc aactctctgc ttaaccccgt catttacgca 1200
tacttcaaca aggactttca aaacgcgttt aagaagatca ttaagtgtaa cttctgccgc 1260
cagtga 1266
<210>27
<211>26
<212>DNA
<213>人
<400>27
gaattcatgg atgtgctcag ccctgg 26
<210>28
<211>25
<212>DNA
<213>人
<400>28
ggatccctgg cggcagaact tacac 25
<210>29
<211>1401
<212>DNA
<213>人
<400>29
atgaataact caacaaactc ctctaacaat agcctggctc ttacaagtcc ttataagaca 60
tttgaagtgg tgtttattgt cctggtggct ggatccctca gtttggtgac cattatcggg 120
aacatcctag tcatggtttc cattaaagtc aaccgccacc tccagaccgt caacaattac 180
tttttattca gcttggcctg tgctgacctt atcataggtg ttttctccat gaacttgtac 240
accctctaca ctgtgattgg ttactggcct ttgggacctg tggtgtgtga cctttggcta 300
gccctggact atgtggtcag caatgcctca gttatgaatc tgctcatcat cagctttgac 360
aggtacttct gtgtcacaaa acctctgacc tacccagtca agcggaccac aaaaatggca 420
ggtatgatga ttgcagctgc ctgggtcctc tctttcatcc tctgggctcc agccattctc 480
ttctggcagt tcattgtagg ggtgagaact gtggaggatg gggagtgcta cattcagttt 540
ttttccaatg ctgctgtcac ctttggtacg gctattgcag ccttctattt gccagtgatc 600
atcatgactg tgctatattg gcacatatcc cgagccagca agagcaggat aaagaaggac 660
aagaaggagc ctgttgccaa ccaagacccc gtttctccaa gtctggtaca aggaaggata 720
gtgaagccaa acaataacaa catgcccagc agtgacgatg gcctggagca caacaaaatc 780
cagaatggca aagcccccag ggatcctgtg actgaaaact gtgttcaggg agaggagaag 840
gagagctcca atgactccac ctcagtcagt gctgttgcct ctaatatgag agatgatgaa 900
ataacccagg atgaaaacac agtttccact tccctgggcc attccaaaga tgagaactct 960
aagcaaacat gcatcagaat tggcaccaag accccaaaaa gtgactcatg taccccaact 1020
aataccaccg tggaggtagt ggggtcttca ggtcagaatg gagatgaaaa gcagaatatt 1080
gtagcccgca agattgtgaa gatgactaag cagcctgcaa aaaagaagcc tcctccttcc 1140
cgggaaaaga aagtcaccag gacaatcttg gctattctgt tggctttcat catcacttgg 1200
gccccataca atgtcatggt gctcattaac accttttgtg caccttgcat ccccaacact 1260
gtgtggacaa ttggttactg gctttgttac atcaacagca ctatcaaccc tgcctgctat 1320
gcactttgca atgccacctt caagaagacc tttaaacacc ttctcatgtg tcattataag 1380
aacataggcg ctacaaggta a 1401
<210>30
<211>27
<212>DNA
<213>人
<400>30
gaattcatga ataactcaac aaactcc 27
<210>31
<211>25
<212>DNA
<213>人
<400>31
agatctcctt gtagcgccta tgttc 25
<210>32
<211>3655
<212>DNA
<213>人
<400>32
cttcagatag attatatctg gagtgaagga tcctgccacc tacgtatctg gcatagtatt 60
ctgtgtagtg ggatgagcag agaacaaaaa caaaataatc cagtgagaaa agcccgtaaa 120
taaaccttca gaccagagat ctattctcca gcttatttta agctcaactt aaaaagaaga 180
actgttctct gattcttttc gccttcaata cacttaatga tttaactcca ccctccttca 240
aaagaaacag catttcctac ttttatactg tctatatgat tgatttgcac agctcatctg 300
gccagaagag ctgagacatc cgttccccta caagaaactc tccccgggtg gaacaagatg 360
gattatcaag tgtcaagtcc aatctatgac atcaattatt atacatcgga gccctgccaa 420
aaaatcaatg tgaagcaaat cgcagcccgc ctcctgcctc cgctctactc actggtgttc 480
atctttggtt ttgtgggcaa catgctggtc atcctcatcc tgataaactg caaaaggctg 540
aagagcatga ctgacatcta cctgctcaac ctggccatct ctgacctgtt tttccttctt 600
actgtcccct tctgggctca ctatgctgcc gcccagtggg actttggaaa tacaatgtgt 660
caactcttga cagggctcta ttttataggc ttcttctctg gaatcttctt catcatcctc 720
ctgacaatcg ataggtacct ggctgtcgtc catgctgtgt ttgctttaaa agccaggacg 780
gtcacctttg gggtggtgac aagtgtgatc acttgggtgg tggctgtgtt tgcgtctctc 840
ccaggaatca tctttaccag atctcaaaaa gaaggtcttc attacacctg cagctctcat 900
tttccataca gtcagtatca attctggaag aatttccaga cattaaagat agtcatcttg 960
gggctggtcc tgccgctgct tgtcatggtc atctgctact cgggaatcct aaaaactctg 1020
cttcggtgtc gaaatgagaa gaagaggcac agggctgtga ggcttatctt caccatcatg 1080
attgtttatt ttctcttctg ggctccctac aacattgtcc ttctcctgaa caccttccag 1140
gaattctttg gcctgaataa ttgcagtagc tctaacaggt tggaccaagc tatgcaggtg 1200
acagagactc ttgggatgac gcactgctgc atcaacccca tcatctatgc ctttgtcggg 1260
gagaagttca gaaactacct cttagtcttc ttccaaaagc acattgccaa acgcttctgc 1320
aaatgctgtt ctattttcca gcaagaggct cccgagcgag caagctcagt ttacacccga 1380
tccactgggg agcaggaaat atctgtgggc ttgtgacacg gactcaagtg ggctggtgac 1440
ccagtcagag ttgtgcacat ggcttagttt tcatacacag cctgggctgg gggtggggtg 1500
ggagaggtct tttttaaaag gaagttactg ttatagaggg tctaagattc atccatttat 1560
ttggcatctg tttaaagtag attagatctt ttaagcccat caattataga aagccaaatc 1620
aaaatatgtt gatgaaaaat agcaaccttt ttatctcccc ttcacatgca tcaagttatt 1680
gacaaactct cccttcactc cgaaagttcc ttatgtatat ttaaaagaaa gcctcagaga 1740
attgctgatt cttgagttta gtgatctgaa cagaaatacc aaaattattt cagaaatgta 1800
caacttttta cctagtacaa ggcaacatat aggttgtaaa tgtgtttaaa acaggtcttt 1860
gtcttgctat ggggagaaaa gacatgaata tgattagtaa agaaatgaca cttttcatgt 1920
gtgatttccc ctccaaggta tggttaataa gtttcactga cttagaacca ggcgagagac 1980
ttgtggcctg ggagagctgg ggaagcttct taaatgagaa ggaatttgag ttggatcatc 2040
tattgctggc aaagacagaa gcctcactgc aagcactgca tgggcaagct tggctgtaga 2100
aggagacaga gctggttggg aagacatggg gaggaaggac aaggctagat catgaagaac 2160
cttgacggca ttgctccgtc taagtcatga gctgagcagg gagatcctgg ttggtgttgc 2220
agaaggttta ctctgtggcc aaaggagggt caggaaggat gagcatttag ggcaaggaga 2280
ccaccaacag ccctcaggtc agggtgagga tggcctctgc taagctcaag gcgtgaggat 2340
gggaaggagg gaggtattcg taaggatggg aaggagggag gtattcgtgc agcatatgag 2400
gatgcagagt cagcagaact ggggtggatt tggtttggaa gtgagggtca gagaggagtc 2460
agagagaatc cctagtcttc aagcagattg gagaaaccct tgaaaagaca tcaagcacag 2520
aaggaggagg aggaggttta ggtcaagaag aagatggatt ggtgtaaaag gatgggtctg 2580
gtttgcagag cttgaacaca gtctcaccca gactccaggc tgtctttcac tgaatgcttc 2640
tgacttcata gatttccttc ccatcccagc tgaaatactg aggggtctcc aggaggagac 2700
tagatttatg aatacacgag gtatgaggtc taggaacata cttcagctca cacatgagat 2760
ctaggtgagg attgattacc tagtagtcat ttcatgggtt gttgggagga ttctatgagg 2820
caaccacagg cagcatttag cacatactac acattcaata agcatcaaac tcttagttac 2880
tcattcaggg atagcactga gcaaagcatt gagcaaaggg gtcccatata ggtgagggaa 2940
gcctgaaaaa ctaagatgct gcctgcccag tgcacacaag tgtaggtatc attttctgca 3000
tttaaccgtc aataggcaaa ggggggaagg gacatattca tttggaaata agctgccttg 3060
agccttaaaa cccacaaaag tacaatttac cagcctccgt atttcagact gaatgggggt 3120
ggggggggcg ccttaggtac ttattccaga tgccttctcc agacaaacca gaagcaacag 3180
aaaaaatcgt ctctccctcc ctttgaaatg aatatacccc ttagtgtttg ggtatattca 3240
tttcaaaggg agagagagag gtttttttct gttctttctc atatgattgt gcacatactt 3300
gagactgttt tgaatttggg ggatggctaa aaccatcata gtacaggtaa ggtgagggaa 3360
tagtaagtgg tgagaactac tcagggaatg aaggtgtcag aataataaga ggtgctactg 3420
actttctcag cctctgaata tgaacggtga gcattgtggc tgtcagcagg aagcaacgaa 3480
gggaaatgtc tttccttttg ctcttaagtt gtggagagtg caacagtagc ataggaccct 3540
accctctggg ccaagtcaaa gacattctga catcttagta tttgcatatt cttatgtatg 3600
tgaaagttac aaattgcttg aaagaaaata tgcatctaat aaaaaacacc ttcta 3655
<210>33
<211>31
<212>DNA
<213>人
<400>33
gcggccgcat ggattatcaa gtgtcaagtc c 31
<210>34
<211>25
<212>DNA
<213>人
<400>34
ggatccctgg cggcagaact tacac 25
<210>35
<211>33
<212>DNA
<213>人
<400>35
ggtctccaat tcatggatta tcaagtgtca agt 33
<210>36
<211>21
<212>DNA
<213>人
<400>36
gacgacagcc aggtacctat c 21
<210>37
<211>2643
<212>DNA
<213>人
<400>37
ggcagccgtc cggggccgcc actctcctcg gccggtccct ggctcccgga ggcggccgcg 60
cgtggatgcg gcgggagctg gaagcctcaa gcagccggcg ccgtctctgc cccggggcgc 120
cctatggctt gaagagcctg gccacccagt ggctccaccg ccctgatgga tccactgaat 180
ctgtcctggt atgatgatga tctggagagg cagaactgga gccggccctt caacgggtca 240
gacgggaagg cggacagacc ccactacaac tactatgcca cactgctcac cctgctcatc 300
gctgtcatcg tcttcggcaa cgtgctggtg tgcatggctg tgtcccgcga gaaggcgctg 360
cagaccacca ccaactacct gatcgtcagc ctcgcagtgg ccgacctcct cgtcgccaca 420
ctggtcatgc cctgggttgt ctacctggag gtggtaggtg agtggaaatt cagcaggatt 480
cactgtgaca tcttcgtcac tctggacgtc atgatgtgca cggcgagcat cctgaacttg 540
tgtgccatca gcatcgacag gtacacagct gtggccatgc ccatgctgta caatacgcgc 600
tacagctcca agcgccgggt caccgtcatg atctccatcg tctgggtcct gtccttcacc 660
atctcctgcc cactcctctt cggactcaat aacgcagacc agaacgagtg catcattgcc 720
aacccggcct tcgtggtcta ctcctccatc gtctccttct acgtgccctt cattgtcacc 780
ctgctggtct acatcaagat ctacattgtc ctccgcagac gccgcaagcg agtcaacacc 840
aaacgcagca gccgagcttt cagggcccac ctgagggctc cactaaaggg caactgtact 900
caccccgagg acatgaaact ctgcaccgtt atcatgaagt ctaatgggag tttcccagtg 960
aacaggcgga gagtggaggc tgcccggcga gcccaggagc tggagatgga gatgctctcc 1020
agcaccagcc cacccgagag gacccggtac agccccatcc cacccagcca ccaccagctg 1080
actctccccg acccgtccca ccatggtctc cacagcactc ccgacagccc cgccaaacca 1140
gagaagaatg ggcatgccaa agaccacccc aagattgcca agatctttga gatccagacc 1200
atgcccaatg gcaaaacccg gacctccctc aagaccatga gccgtaggaa gctctcccag 1260
cagaaggaga agaaagccac tcagatgctc gccattgttc tcggcgtgtt catcatctgc 1320
tggctgccct tcttcatcac acacatcctg aacatacact gtgactgcaa catcccgcct 1380
gtcctgtaca gcgccttcac gtggctgggc tatgtcaaca gcgccgtgaa ccccatcatc 1440
tacaccacct tcaacattga gttccgcaag gccttcctga agatcctcca ctgctgactc 1500
tgctgcctgc ccgcacagca gcctgcttcc cacctccctg cccaggccgg ccagcctcac 1560
ccttgcgaac cgtgagcagg aaggcctggg tggatcggcc tcctcttcac cccggcaggc 1620
cctgcagtgt tcgcttggct ccatgctcct cactgcccgc acaccctcac tctgccaggg 1680
cagtgctagt gagctgggca tggtaccagc cctggggctg ggccccccag ctcaggggca 1740
gctcatagag tcccccctcc cacctccagt ccccctatcc ttggcaccaa agatgcagcc 1800
gccttccttg accttcctct ggggctctag ggttgctgga gcctgagtca gggcccagag 1860
gctgagtttt ctctttgtgg ggcttggcgt ggagcaggcg gtggggagag atggacagtt 1920
cacaccctgc aaggcccaca ggaggcaagc aagctctctt gccgaggagc caggcaactt 1980
cagtcctggg agacccatgt aaataccaga ctgcaggttg gaccccagag attcccaagc 2040
caaaaacctt agctccctcc cgcaccccga tgtggacctc tactttccag gctagtccgg 2100
acccacctca ccccgttaca gctccccaag tggtttccac atgctctgag aagaggagcc 2160
ctcatcttga agggcccagg agggtctatg gggagaggaa ctccttggcc tagcccaccc 2220
tgctgccttc tgacggccct gcaatgtatc ccttctcaca gcacatgctg gccagcctgg 2280
ggcctggcag ggaggtcagg ccctggaact ctatctgggc ctgggctagg ggacatcaga 2340
ggttctttga gggactgcct ctgccacact ctgacgcaaa accactttcc ttttctattc 2400
cttctggcct ttcctctctc ctgtttccct tcccttccac tgcctctgcc ttagaggagc 2460
ccacggctaa gaggctgctg aaaaccatct ggcctggcct ggccctgccc tgaggaagga 2520
ggggaagctg cagcttggga gagcccctgg ggcctagact ctgtaacatc actatccatg 2580
caccaaacta ataaaacttt gacgagtcac cttccaggac ccctgggtaa aaaaaaaaaa 2640
aaa 2643
<210>38
<211>27
<212>DNA
<213>人
<400>38
gaattcatgg atccactgaa tctgtcc 27
<210>39
<211>25
<212>DNA
<213>人
<400>39
agatctgcag tggaggatct tcagg 25
<210>40
<211>1301
<212>DNA
<213>人
<400>40
atgggcgaca aagggacgcg agtgttcaag aaggccagtc caaatggaaa gctcaccgtc 60
tacctgggaa agcgggactt tgtggaccac atcgacctcg tggaccctgt ggatggtgtg 120
gtcctggtgg atcctgagta tctcaaagag cggagagtct atgtgacgct gacctgcgcc 180
ttccgctatg gccgggagga cctggatgtc ctgggcctga cctttcgcaa ggacctgttt 240
gtggccaacg tacagtcgtt cccaccggcc cccgaggaca agaagcccct gacgcggctg 300
caggaacgcc tcatcaagaa gctgggcgag cacgcttacc ctttcacctt tgagatccct 360
ccaaaccttc catgttctgt gacactgcag ccggggcccg aagacacggg gaaggcttgc 420
ggtgtggact atgaagtcaa agccttctgc gcggagaatt tggaggagaa gatccacaag 480
cggaattctg tgcgtctggt catccggaag gttcagtatg ccccagagag gcctggcccc 540
cagcccacag ccgagaccac caggcagttc ctcatgtcgg acaagccctt gcacctagaa 600
gcctctctgg ataaggagat ctattaccat ggagaaccca tcagcgtcaa cgtccacgtc 660
accaacaaca ccaacaagac ggtgaagaag atcaagatct cagtgcgcca gtatgcagac 720
atctgccttt tcaacacagc tcagtacaag tgccctgttg ccatggaaga ggctgatgac 780
actgtggcac ccagctcgac gttctgcaag gtctacacac tgaccccctt cctagccaat 840
aaccgagaga agcggggcct cgccttggac gggaagctca agcacgaaga cacgaacttg 900
gcctctagca ccctgttgag ggaaggtgcc aaccgtgaga tcctggggat cattgtttcc 960
tacaaagtga aagtgaagct ggtggtgtct cggggcggcc tgttgggaga tcttgcatcc 1020
agcgacgtgg ccgtggaact gcccttcacc ctaatgcacc ccaagcccaa agaggaaccc 1080
ccgcatcggg aagttccaga gaacgagacg ccagtagata ccaatctcat agaacttgac 1140
acaaatgatg acgacattgt atttgaggac tttgctcgcc agagactgaa aggcatgaag 1200
gatgacaagg aggaagagga ggatggtacc ggctctccac agctcaacaa cagatagacg 1260
ggccggccct gcctccacgt ggctccggct ccactctcgt g 1301
<210>41
<211>30
<212>DNA
<213>人
<400>41
ggtaccatgg gcgacaaagg gacgcgagtg 30
<210>42
<211>48
<212>DNA
<213>人
<400>42
ggatcctctg ttgttgagct gtggagagcc tgtaccatcc tcctcttc 48
<210>43
<211>27
<212>DNA
<213>人
<400>43
ggatccattt gtgtcaagtt ctatgag 27
<210>44
<211>27
<212>DNA
<213>人
<400>44
ggtaccatgg gggagaaacc cgggacc 27
<210>45
<211>24
<212>DNA
<213>人
<400>45
ggatcctgtg gcatagttgg tatc 24
<210>46
<211>33
<212>DNA
<213>人
<400>46
tgtgcgcgcg gacgcacccc acccagcctg ggt 33
<210>47
<211>27
<212>DNA
<213>人
<400>47
gaattcatgg atccactgaa tctgtcc 27
<210>48
<211>33
<212>DNA
<213>人
<400>48
tgtgcgcgcg cagtggagga tcttcaggaa ggc 33
<210>49
<211>33
<212>DNA
<213>人
<400>49
gcggccgcca ccatgaacgg taccgaaggc cca 33
<210>50
<211>30
<212>DNA
<213>人
<400>50
tgtgcgcgcg cacagaagct cctggaaggc 30
<210>51
<211>1602
<212>DNA
<213>人
<400>51
gagctccgtg ctgggaggtg ggaagggggc ttgaccctgg ggactcaggc agtctgggga 60
cagttccacc aggggccggt gcctagaatt ggtgagggag gcacctcagg ggctggggga 120
gaaggaacga gcgctcttcg cccctctctg gcacccagcg gcgcgcctgc tggccggaaa 180
ggcagcgaga agtccgttct ccctgtcctg cccccggcga cttgcggccc gggtgggagt 240
ccgcaggctc cgggtcccca gcgccgctgg ccagggcgcg ggcaaagttt gcctctccgc 300
gtccagccgg ttctttcgct cccgcagcgc cgcaggtgcc gcctgtcctc gccttcctgc 360
tgcaatcgcc ccaccatgga ctccccgatc cagatcttcc gcggggagcc gggccctacc 420
tgcgccccga gcgcctgcct gccccccaac agcagcgcct ggtttcccgg ctgggccgag 480
cccgacagca acggcagcgc cggctcggag gacgcgcagc tggagcccgc gcacatctcc 540
ccggccatcc cggtcatcat cacggcggtc tactccgtag tgttcgtcgt gggcttggtg 600
ggcaactcgc tggtcatgtt cgtgatcatc cgatacacaa agatgaagac agcaaccaac 660
atttacatat ttaacctggc tttggcagat gctttagtta ctacaaccat gccctttcag 720
agtacggtct acttgatgaa ttcctggcct tttggggatg tgctgtgcaa gatagtaatt 780
tccattgatt actacaacat gttcaccagc atcttcacct tgaccatgat gagcgtggac 840
cgctacattg ccgtgtgcca ccccgtgaag gctttggact tccgcacacc cttgaaggca 900
aagatcatca atatctgcat ctggctgctg tcgtcatctg ttggcatctc tgcaatagtc 960
cttggaggca ccaaagtcag ggaagacgtc gatgtcattg agtgctcctt gcagttccca 1020
gatgatgact actcctggtg ggacctcttc atgaagatct gcgtcttcat ctttgccttc 1080
gtgatccctg tcctcatcat catcgtctgc tacaccctga tgatcctgcg tctcaagagc 1140
gtccggctcc tttctggctc ccgagagaaa gatcgcaacc tgcgtaggat caccagactg 1200
gtcctggtgg tggtggcagt cttcgtcgtc tgctggactc ccattcacat attcatcctg 1260
gtggaggctc tggggagcac ctcccacagc acagctgctc tctccagcta ttacttctgc 1320
atcgccttag gctataccaa cagtagcctg aatcccattc tctacgcctt tcttgatgaa 1380
aacttcaagc ggtgtttccg ggacttctgc tttccactga agatgaggat ggagcggcag 1440
agcactagca gagtccgaaa tacagttcag gatcctgctt acctgaggga catcgatggg 1500
atgaataaac cagtatgact agtcgtggag atgtcttcgt acagttcttc gggaagagag 1560
gagttcaatg atctaggttt aactcagatc actactgcag tc 1602
<210>52
<211>24
<212>DNA
<213>人
<400>52
ggtctacttg atgaattcct ggcc 24
<210>53
<211>27
<212>DNA
<213>人
<400>53
gcgcgcacag aagtcccgga aacaccg 27
<210>54
<211>10
<212>PRT
<213>人
<400>54
Gly Ser Glu Asn Leu Tyr Phe Gln Leu Arg
5 10
<210>55
<211>881
<212>PRT
<213>人
<400>55
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Gln Leu Phe Leu Leu Ile Phe Pro Arg Glu Asp Leu Asp Met Ile
65 70 75 80
Leu Lys Met Asp Ser Leu Gln Asp Ile Lys Ala Leu Leu Thr Gly Leu
85 90 95
Phe Val Gln Asp Asn Val Asn Lys Asp Ala Val Thr Asp Arg Leu Ala
100 105 110
Ser Val Glu Thr Asp Met Pro Leu Thr Leu Arg Gln His Arg Ile Ser
115 120 125
Ala Thr Ser Ser Ser Glu Glu Ser Ser Asn Lys Gly Gln Arg Gln Leu
130 135 140
Thr Val Ser Ile Asp Ser Ala Ala His His Asp Asn Ser Thr Ile Pro
145 150 155 160
Leu Asp Phe Met Pro Arg Asp Ala Leu His Gly Phe Asp Trp Ser Glu
165 170 175
Glu Asp Asp Met Ser Asp Gly Leu Pro Phe Leu Lys Thr Asp Pro Asn
180 185 190
Asn Asn Gly Phe Phe Gly Asp Gly Ser Leu Leu Cys Ile Leu Arg Ser
195 200 205
Ile Gly Phe Lys Pro Glu Asn Tyr Thr Asn Ser Asn Val Asn Arg Leu
210 215 220
Pro Thr Met Ile Thr Asp Arg Tyr Thr Leu Ala Ser Arg Ser Thr Thr
225 230 235 240
Ser Arg Leu Leu Gln Ser Tyr Leu Asn Asn Phe His Pro Tyr Cys Pro
245 250 255
Ile Val His Ser Pro Thr Leu Met Met Leu Tyr Asn Asn Gln Ile Glu
260 265 270
Ile Ala Ser Lys Asp Gln Trp Gln Ile Leu Phe Asn Cys Ile Leu Ala
275 280 285
Ile Gly Ala Trp Cys Ile Glu Gly Glu Ser Thr Asp Ile Asp Val Phe
290 295 300
Tyr Tyr Gln Asn Ala Lys Ser His Leu Thr Ser Lys Val Phe Glu Ser
305 310 315 320
Gly Ser Ile Ile Leu Val Thr Ala Leu His Leu Leu Ser Arg Tyr Thr
325 330 335
Gln Trp Arg Gln Lys Thr Asn Thr Ser Tyr Asn Phe His Ser Phe Ser
340 345 350
Ile Arg Met Ala Ile Ser Leu Gly Leu Asn Arg Asp Leu Pro Ser Ser
355 360 365
Phe Ser Asp Ser Ser Ile Leu Glu Gln Arg Arg Arg Ile Trp Trp Ser
370 375 380
Val Tyr Ser Trp Glu Ile Gln Leu Ser Leu Leu Tyr Gly Arg Ser Ile
385 390 395 400
Gln Leu Ser Gln Asn Thr Ile Ser Phe Pro Ser Ser Val Asp Asp Val
405 410 415
Gln Arg Thr Thr Thr Gly Pro Thr Ile Tyr His Gly Ile Ile Glu Thr
420 425 430
Ala Arg Leu Leu Gln Val Phe Thr Lys Ile Tyr Glu Leu Asp Lys Thr
435 440 445
Val Thr Ala Glu Lys Ser Pro Ile Cys Ala Lys Lys Cys Leu Met Ile
450 455 460
Cys Asn Glu Ile Glu Glu Val Ser Arg Gln Ala Pro Lys Phe Leu Gln
465 470 475 480
Met Asp Ile Ser Thr Thr Ala Leu Thr Asn Leu Leu Lys Glu His Pro
485 490 495
Trp Leu Ser Phe Thr Arg Phe Glu Leu Lys Trp Lys Gln Leu Ser Leu
500 505 510
Ile Ile Tyr Val Leu Arg Asp Phe Phe Thr Asn Phe Thr Gln Lys Lys
515 520 525
Ser Gln Leu Glu Gln Asp Gln Asn Asp His Gln Ser Tyr Glu Val Lys
530 535 540
Arg Cys Ser Ile Met Leu Ser Asp Ala Ala Gln Arg Thr Val Met Ser
545 550 555 560
Val Ser Ser Tyr Met Asp Asn His Asn Val Thr Pro Tyr Phe Ala Trp
565 570 575
Asn Cys Ser Tyr Tyr Leu Phe Asn Ala Val Leu Val Pro Ile Lys Thr
580 585 590
Leu Leu Ser Asn Ser Lys Ser Asn Ala Glu Asn Asn Glu Thr Ala Gln
595 600 605
Leu Leu Gln Gln Ile Asn Thr Val Leu Met Leu Leu Lys Lys Leu Ala
610 615 620
Thr Phe Lys Ile Gln Thr Cys Glu Lys Tyr Ile Gln Val Leu Glu Glu
625 630 635 640
Val Cys Ala Pro Phe Leu Leu Ser Gln Cys Ala Ile Pro Leu Pro His
645 650 655
Ile Ser Tyr Asn Asn Ser Asn Gly Ser Ala Ile Lys Asn Ile Val Gly
660 665 670
Ser Ala Thr Ile Ala Gln Tyr Pro Thr Leu Pro Glu Glu Asn Val Asn
675 680 685
Asn Ile Ser Val Lys Tyr Val Ser Pro Gly Ser Val Gly Pro Ser Pro
690 695 700
Val Pro Leu Lys Ser Gly Ala Ser Phe Ser Asp Leu Val Lys Leu Leu
705 710 715 720
Ser Asn Arg Pro Pro Ser Arg Asn Ser Pro Val ThrIle Pro Arg Ser
725 730 735
Thr Pro Ser His Arg Ser Val Thr Pro Phe Leu Gly Gln Gln Gln Gln
740 745 750
Leu Gln Ser Leu Val Pro Leu Thr Pro Ser Ala Leu Phe Gly Gly Ala
755 760 765
Asn Phe Asn Gln Ser Gly Asn Ile Ala Asp Ser Ser Leu Ser Phe Thr
770 775 780
Phe Thr Asn Ser Ser Asn Gly Pro Asn Leu Ile Thr Thr Gln Thr Asn
785 790 795 800
Ser Gln Ala Leu Ser Gln Pro Ile Ala Ser Ser Asn Val His Asp Asn
805 810 815
Phe Met Asn Asn Glu Ile Thr Ala Ser Lys Ile Asp Asp Gly Asn Asn
820 825 830
Ser Lys Pro Leu Ser Pro Gly Trp Thr Asp Gln Thr Ala Tyr Asn Ala
835 840 845
Phe Gly Ile Thr Thr Gly Met Phe Asn Thr Thr Thr Met Asp Asp Val
850 855 860
Tyr Asn Tyr Leu Phe Asp Asp Glu Asp Thr Pro Pro Asn Pro Lys Lys
865 870 875 880
Glu
<210>56
<211>13
<212>PRT
<213>人
<400>56
Pro Gln Lys Gly Ser Ala Ser Glu Lys Thr Met Val Phe
5 10
<210>57
<211>549
<212>PRT
<213>人
<400>57
Met Asp Asp Leu Phe Pro Leu Ile Phe Pro Ser Glu Pro Ala Gln Ala
5 10 15
Ser Gly Pro Tyr Val Glu Ile Ile Glu Gln Pro Lys Gln Arg Gly Met
20 25 30
Arg Phe Arg Tyr Lys Cys Glu Gly Arg Ser Ala Gly Ser Ile Pro Gly
35 40 45
Glu Arg Ser Thr Asp Thr Thr Lys Thr His Pro Thr Ile Lys Ile Asn
50 55 60
Gly Tyr Thr Gly Pro Gly Thr Val Arg Ile Ser Leu Val Thr Lys Asp
65 70 75 80
Pro Pro His Arg Pro His Pro His Glu Leu Val Gly Lys Asp Cys Arg
85 90 95
Asp Gly Tyr Tyr Glu Ala Asp Leu Cys Pro Asp Arg Ser Ile His Ser
100 105 110
Phe Gln Asn Leu Gly Ile Gln Cys Val Lys Lys Arg Asp Leu Glu Gln
115 120 125
Ala Ile Ser Gln Arg Ile Gln Thr Asn Asn Asn Pro Phe His Val Pro
130 135 140
Ile Glu Glu Gln Arg Gly Asp Tyr Asp Leu Asn Ala Val Arg Leu Cys
145 150 155 160
Phe Gln Val Thr Val Arg Asp Pro Ala Gly Arg Pro Leu Leu Leu Thr
165 170 175
Pro Val Leu Ser His Pro Ile Phe Asp Asn Arg Ala Pro Asn Thr Ala
180 185 190
Glu Leu Lys Ile Cys Arg Val Asn Arg Asn Ser Gly Ser Cys Leu Gly
195 200 205
Gly Asp Glu Ile Phe Leu Leu Cys Asp Lys Val Gln Lys Glu Asp Ile
210 215 220
Glu Val Tyr Phe Thr Gly Pro Gly Trp Glu Ala Arg Gly Ser Phe Ser
225 230 235 240
Gln Ala Asp Val His Arg Gln Val Ala Ile Val Phe Arg Thr Pro Pro
245 250 255
Tyr Ala Asp Pro Ser Leu Gln Ala Pro Val Arg Val Ser Met Gln Leu
260 265 270
Arg Arg Pro Ser Asp Arg Glu Leu Ser Glu Pro Met Glu Phe Gln Tyr
275 280 285
Leu Pro Asp Thr Asp Asp Arg His Arg Ile Glu Glu Lys Arg Lys Arg
290 295 300
Thr Tyr Glu Thr Phe Lys Ser Ile Met Lys Lys Ser Pro Phe Asn Gly
305 310 315 320
Pro Thr Glu Pro Arg Pro Pro Thr Arg Arg Ile Ala Val Pro Thr Arg
325 330 335
Asn Ser Thr Ser Val Pro Lys Pro Ala Pro Gln Pro Tyr Thr Phe Pro
340 345 350
Ala Ser Leu Ser Thr Ile Asn Phe Asp Glu Phe Ser Pro Met Leu Leu
355 360 365
Pro Ser Gly Gln Ile Ser Asn Gln Ala Leu Ala Leu Ala Pro Ser Ser
370 375 380
Ala Pro Val Leu Ala Gln Thr Met Val Pro Ser Ser Ala Met Val Pro
385 390 395 400
Leu Ala Gln Pro Pro Ala Pro Ala Pro Val Leu Thr Pro Gly Pro Pro
405 410 415
Gln Ser Leu Ser Ala Pro Val Pro Lys Ser Thr Gln Ala Gly Glu Gly
420 425 430
Thr Leu Ser Glu Ala Leu Leu His Leu Gln Phe Asp Ala Asp Glu Asp
435 440 445
Leu Gly Ala Leu Leu Gly Asn Ser Thr Asp Pro Gly Val Phe Thr Asp
450 455 460
Leu Ala Ser Val Asp Asn Ser Glu Phe Gln Gln Leu Leu Asn Gln Gly
465 470 475 480
Val Ser Met Ser His Ser Thr Ala Glu Pro Met Leu Met Glu Tyr Pro
485 490 495
Glu Ala Ile Thr Arg Leu Val Thr Gly Ser Gln Arg Pro Pro Asp Pro
500 505 510
Ala Pro Thr Pro Leu Gly Thr Ser Gly Leu Pro Asn Gly Leu Ser Gly
515 520 525
Asp Glu Asp Phe Ser Ser Ile Ala Asp Met Asp Phe Ser Ala Leu Leu
530 535 540
Ser Gln Ile Ser Ser
545
<210>58
<211>1833
<212>DNA
<213>人
<400>58
ggaggtggga ggagggagtg acgagtcaag gaggagacag ggacgcagga gggtgcaagg 60
aagtgtctta actgagacgg gggtaaggca agagagggtg gaggaaattc tgcaggagac 120
aggcttcctc cagggtctgg agaacccaga ggcagctcct cctgagtgct gggaaggact 180
ctgggcatct tcagcccttc ttactctctg aggctcaagc cagaaattca ggctgcttgc 240
agagtgggtg acagagccac ggagctggtg tccctgggac cctctgcccg tcttctctcc 300
actccccagc atggaggaag gtggtgattt tgacaactac tatggggcag acaaccagtc 360
tgagtgtgag tacacagact ggaaatcctc gggggccctc atccctgcca tctacatgtt 420
ggtcttcctc ctgggcacca cgggcaacgg tctggtgctc tggaccgtgt ttcggagcag 480
ccgggagaag aggcgctcag ctgatatctt cattgctagc ctggcggtgg ctgacctgac 540
cttcgtggtg acgctgcccc tgtgggctac ctacacgtac cgggactatg actggccctt 600
tgggaccttc ttctgcaagc tcagcagcta cctcatcttc gtcaacatgt acgccagcgt 660
cttctgcctc accggcctca gcttcgaccg ctacctggcc atcgtgaggc cagtggccaa 720
tgctcggctg aggctgcggg tcagcggggc cgtggccacg gcagttcttt gggtgctggc 780
cgccctcctg gccatgcctg tcatggtgtt acgcaccacc ggggacttgg agaacaccac 840
taaggtgcag tgctacatgg actactccat ggtggccact gtgagctcag agtgggcctg 900
ggaggtgggc cttggggtct cgtccaccac cgtgggcttt gtggtgccct tcaccatcat 960
gctgacctgt tacttcttca tcgcccaaac catcgctggc cacttccgca aggaacgcat 1020
cgagggcctg cggaagcggc gccggctgct cagcatcatc gtggtgctgg tggtgacctt 1080
tgccctgtgc tggatgccct accacctggt gaagacgctg tacatgctgg gcagcctgct 1140
gcactggccc tgtgactttg acctcttcct catgaacatc ttcccctact gcacctgcat 1200
cagctacgtc aacagctgcc tcaacccctt cctctatgcc tttttcgacc cccgcttccg 1260
ccaggcctgc acctccatgc tctgctgtgg ccagagcagg tgcgcaggca cctcccacag 1320
cagcagtggg gagaagtcag ccagctactc ttcggggcac agccaggggc ccggccccaa 1380
catgggcaag ggtggagaac agatgcacga gaaatccatc ccctacagcc aggagaccct 1440
tgtggttgac tagggctggg agcagagaga agcctggcgc cctcggccct ccccggcctt 1500
tgcccttgct ttctgaaaat cagagtcacc tcctctgccc agagctgtcc tcaaagcatc 1560
cagtgaacac tggaagaggc ttctagaagg gaagaaattg tccctctgag gccgccgtgg 1620
gtgacctgca gagacttcct gcctggaact catctgtgaa ctgggacaga agcagaggag 1680
gctgcctgct gtgatacccc cttacctccc ccagtgcctt cttcagaata tctgcactgt 1740
cttctgatcc tgttagtcac tgtggttcat caaataaaac tgtttgtgca actgttgtgt 1800
ccaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaa 1833
<210>59
<211>1666
<212>DNA
<213>人
<400>59
aactgcagcc agggagactc agactagaat ggaggtagaa agaactgatg cagagtgggt 60
ttaattctaa gcctttttgt ggctaagttt tgttgttgtt aacttattga atttagagtt 120
gtattgcact ggtcatgtga aagccagagc agcaccagtg tcaaaatagt gacagagagt 180
tttgaatacc atagttagta tatatgtact cagagtattt ttattaaaga aggcaaagag 240
cccggcatag atcttatctt catcttcact cggttgcaaa atcaatagtt aagaaatagc 300
atctaaggga acttttaggt gggaaaaaaa atctagagat ggctctaaat gactgtttcc 360
ttctgaactt ggaggtggac catttcatgc actgcaacat ctccagtcac agtgcggatc 420
tccccgtgaa cgatgactgg tcccacccgg ggatcctcta tgtcatccct gcagtttatg 480
gggttatcat tctgataggc ctcattggca acatcacttt gatcaagatc ttctgtacag 540
tcaagtccat gcgaaacgtt ccaaacctgt tcatttccag tctggctttg ggagacctgc 600
tcctcctaat aacgtgtgct ccagtggatg ccagcaggta cctggctgac agatggctat 660
ttggcaggat tggctgcaaa ctgatcccct ttatacagct tacctctgtt ggggtgtctg 720
tcttcacact cacggcgctc tcggcagaca gatacaaagc cattgtccgg ccaatggata 780
tccaggcctc ccatgccctg atgaagatct gcctcaaagc cgcctttatc tggatcatct 840
ccatgctgct ggccattcca gaggccgtgt tttctgacct ccatcccttc catgaggaaa 900
gcaccaacca gaccttcatt agctgtgccc catacccaca ctctaatgag cttcacccca 960
aaatccattc tatggcttcc tttctggtct tctacgtcat cccactgtcg atcatctctg 1020
tttactacta cttcattgct aaaaatctga tccagagtgc ttacaatctt cccgtggaag 1080
ggaatataca tgtcaagaag cagattgaat cccggaagcg acttgccaag acagtgctgg 1140
tgtttgtggg cctgttcgcc ttctgctggc tccccaatca tgtcatctac ctgtaccgct 1200
cctaccacta ctctgaggtg gacacctcca tgctccactt tgtcaccagc atctgtgccc 1260
gcctcctggc cttcaccaac tcctgcgtga acccctttgc cctctacctg ctgagcaaga 1320
gtttcaggaa acagttcaac actcagctgc tctgttgcca gcctggcctg atcatccggt 1380
ctcacagcac tggaaggagt acaacctgca tgacctccct caagagtacc aacccctccg 1440
tggccacctt tagcctcatc aatggaaaca tctgtcacga gcggtatgtc tagattgacc 1500
cttgattttg ccccctgagg gacggttttg ctttatggct agacaggaac ccttgcatcc 1560
attgttgtgt ctgtgccctc caaagagcct tcagaatgct cctgagtggt gtaggtgggg 1620
gtggggaggc ccaaatgatg gatcaccatt atattttgaa agaagc 1666
<210>60
<211>2876
<212>DNA
<213>人
<400>60
tgaaacctaa cccgccctgg ggaggcgcgc agcagaggct ccgattcggg gcaggtgaga 60
ggctgacttt ctctcggtgc gtccagtgga gctctgagtt tcgaatcggc ggcggcggat 120
tccccgcgcg cccggcgtcg gggcttccag gaggatgcgg agccccagcg cggcgtggct 180
gctgggggcc gccatcctgc tagcagcctc tctctcctgc agtggcacca tccaaggaac 240
caatagatcc tctaaaggaa gaagccttat tggtaaggtt gatggcacat cccacgtcac 300
tggaaaagga gttacagttg aaacagtctt ttctgtggat gagttttctg catctgtcct 360
cactggaaaa ctgaccactg tcttccttcc aattgtctac acaattgtgt ttgtggtggg 420
tttgccaagt aacggcatgg ccctgtgggt ctttcttttc cgaactaaga agaagcaccc 480
tgctgtgatt tacatggcca atctggcctt ggctgacctc ctctctgtca tctggttccc 540
cttgaagatt gcctatcaca tacatggcaa caactggatt tatggggaag ctctttgtaa 600
tgtgcttatt ggctttttct atggcaacat gtactgttcc attctcttca tgacctgcct 660
cagtgtgcag aggtattggg tcatcgtgaa ccccatgggg cactccagga agaaggcaaa 720
cattgccatt ggcatctccc tggcaatatg gctgctgatt ctgctggtca ccatcccttt 780
gtatgtcgtg aagcagacca tcttcattcc tgccctgaac atcacgacct gtcatgatgt 840
tttgcctgag cagctcttgg tgggagacat gttcaattac ttcctctctc tggccattgg 900
ggtctttctg ttcccagcct tcctcacagc ctctgcctat gtgctgatga tcagaatgct 960
gcgatcttct gccatggatg aaaactcaga gaagaaaagg aagagggcca tcaaactcat 1020
tgtcactgtc ctggccatgt acctgatctg cttcactcct agtaaccttc tgcttgtggt 1080
gcattatttt ctgattaaga gccagggcca gagccatgtc tatgccctgt acattgtagc 1140
cctctgcctc tctaccctta acagctgcat cgaccccttt gtctattact ttgtttcaca 1200
tgatttcagg gatcatgcaa agaacgctct cctttgccga agtgtccgca ctgtaaagca 1260
gatgcaagta tccctcacct caaagaaaca ctccaggaaa tccagctctt actcttcaag 1320
ttcaaccact gttaagacct cctattgagt tttccaggtc ctcagatggg aattgcacag 1380
taggatgtgg aacctgttta atgttatgag gacgtgtctg ttatttccta atcaaaaagg 1440
tctcaccaca taccatgtgg atgcagcacc tctcaggatt gctaggagct cccctgtttg 1500
catgagaaaa gtagtccccc aaattaacat cagtgtctgt ttcagaatct ctctactcag 1560
atgaccccag aaactgaacc aacagaagca gacttttcag aagatggtga agacagaaac 1620
ccagtaactt gcaaaaagta gacttggtgt gaagactcac ttctcagctg aaattatata 1680
tatacacata tatatatttt acatctggga tcatgataga cttgttaggg cttcaaggcc 1740
ctcagagatg atcagtccaa ctgaacgacc ttacaaatga ggaaaccaag ataaatgagc 1800
tgccagaatc aggtttccaa tcaacagcag tgagttggga ttggacagta gaatttcaat 1860
gtccagtgag tgaggttctt gtaccacttc atcaaaatca tggatcttgg ctgggtgcgg 1920
tgcctcatgc ctgtaatcct agcactttgg gaggctgagg caggcaatca cttgaggtca 1980
ggagttcgag accagcctgg ccatcatggc gaaacctcat ctctactaaa aatacaaaag 2040
ttaaccaggt gtgtggtgca cgtttgtaat cccagttact caggaggctg aggcacaaga 2100
attgagtatc actttaactc aggaggcaga ggttgcagtg agccgagatt gcaccactgc 2160
actccagctt gggtgataaa ataaaataaa atagtcgtga atcttgttca aaatgcagat 2220
tcctcagatt caataatgag agctcagact gggaacaggg cccaggaatc tgtgtggtac 2280
aaacctgcat ggtgtttatg cacacagaga tttgagaacc attgttctga atgctgcttc 2340
catttgacaa agtgccgtga taatttttga aaagagaagc aaacaatggt gtctctttta 2400
tgttcagctt ataatgaaat ctgtttgttg acttattagg actttgaatt atttctttat 2460
taaccctctg agtttttgta tgtattatta ttaaagaaaa atgcaatcag gattttaa ac 2520
atgtaaatac aaattttgta taacttttga tgacttcagt gaaattttca ggtagtctga 2580
gtaatagatt gttttgccac ttagaatagc atttgccact tagtatttta aaaaataatt 2640
gttggagtat ttattgtcag ttttgttcac ttgttatcta atacaaaatt ataaagcctt 2700
cagagggttt ggaccacatc tctttggaaa atagtttgca acatatttaa gagatacttg 2760
atgccaaaat gactttatac aacgattgta tttgtgactt ttaaaaataa ttattttatt 2820
gtgtaattga tttataaata acaaaatttt ttttacaact taaaaaaaaa aaaaaa 2876
<210>61
<211>1668
<212>DNA
<213>人
<400>61
gggagataac tcgtgctcac aggaagccac gcacccttga aaggcaccgg gtccttctta 60
gcatcgtgct tcctgagcaa gcctggcatt gcctcacaga ccttcctcag agccgctttc 120
agaaaagcaa gctgcttctg gttgggccca gacctgcctt gaggagcctg tagagttaaa 180
aaatgaaccc cacggatata gcagacacca ccctcgatga aagcatatac agcaattact 240
atctgtatga aagtatcccc aagccttgca ccaaagaagg catcaaggca tttggggagc 300
tcttcctgcc cccactgtat tccttggttt ttgtatttgg tctgcttgga aattctgtgg 360
tggttctggt cctgttcaaa tacaagcggc tcaggtccat gactgatgtg tacctgctca 420
accttgccat ctcggatctg ctcttcgtgt tttccctccc tttttggggc tactatgcag 480
cagaccagtg ggtttttggg ctaggtctgt gcaagatgat ttcctggatg tacttggtgg 540
gcttttacag tggcatattc tttgtcatgc tcatgagcat tgatagatac ctggcaattg 600
tgcacgcggt gttttccttg agggcaagga ccttgactta tggggtcatc accagtttgg 660
ctacatggtc agtggctgtg ttcgcctccc ttcctggctt tctgttcagc acttgttata 720
ctgagcgcaa ccatacctac tgcaaaacca agtactctct caactccacg acgtggaagg 780
ttctcagctc cctggaaatc aacattctcg gattggtgat ccccttaggg atcatgctgt 840
tttgctactc catgatcatc aggaccttgc agcattgtaa aaatgagaag aagaacaagg 900
cggtgaagat gatctttgcc gtggtggtcc tcttccttgg gttctggaca ccttacaaca 960
tagtgctctt cctagagacc ctggtggagc tagaagtcct tcaggactgc acctttgaaa 1020
gatacttgga ctatgccatc caggccacag aaactctggc ttttgttcac tgctgcctta 1080
atcccatcat ctactttttt ctgggggaga aatttcgcaa gtacatccta cagctcttca 1140
aaacctgcag gggccttttt gtgctctgcc aatactgtgg gctcctccaa atttactctg 1200
ctgacacccc cagctcatct tacacgcagt ccaccatgga tcatgatctt catgatgctc 1260
tgtagaaaaa tgaaatggtg aaatgcagag tcaatgaact ttccacattc agagcttact 1320
taaaattgta ttttggtaag agatccctga gccagtgtca ggaggaaggc ttacacccac 1380
agtggaaaga cagcttctca tcctgcaggc agctttttct ctcccactag acaagtccag 1440
cctggcaagg gttcacctgg gctgaggcat ccttcctcac accaggcttg cctgcaggca 1500
tgagtcagtc tgatgagaac tctgagcagt gcttgaatga agttgtaggt aatattgcaa 1560
ggcaaagact attcccttct aacctgaact gatgggtttc tccagaggga attgcagagt 1620
actggctgat ggagtaaatc gctacctttt gctgtggcaa atgggccc 1668
<210>62
<211>1679
<212>DNA
<213>人
<400>62
gtttgttggc tgcggcagca ggtagcaaag tgacgccgag ggcctgagtg ctccagtagc 60
caccgcatct ggagaaccag cggttaccat ggaggggatc agtatataca cttcagataa 120
ctacaccgag gaaatgggct caggggacta tgactccatg aaggaaccct gtttccgtga 180
agaaaatgct aatttcaata aaatcttcct gcccaccatc tactccatca tcttcttaac 240
tggcattgtg ggcaatggat tggtcatcct ggtcatgggt taccagaaga aactgagaag 300
catgacggac aagtacaggc tgcacctgtc agtggccgac ctcctctttg tcatcacgct 360
tcccttctgg gcagttgatg ccgtggcaaa ctggtacttt gggaacttcc tatgcaaggc 420
agtccatgtc atctacacag tcaacctcta cagcagtgtc ctcatcctgg ccttcatcag 480
tctggaccgc tacctggcca tcgtccacgc caccaacagt cagaggccaa ggaagctgtt 540
ggctgaaaag gtggtctatg ttggcgtctg gatccctgcc ctcctgctga ctattcccga 600
cttcatcttt gccaacgtca gtgaggcaga tgacagatat atctgtgacc gcttctaccc 660
caatgacttg tgggtggttg tgttccagtt tcagcacatc atggttggcc ttatcctgcc 720
tggtattgtc atcctgtcct gctattgcat tatcatctcc aagctgtcac actccaaggg 780
ccaccagaag cgcaaggccc tcaagaccac agtcatcctc atcctggctt tcttcgcctg 840
ttggctgcct tactacattg ggatcagcat cgactccttc atcctcctgg aaatcatcaa 900
gcaagggtgt gagtttgaga acactgtgca caagtggatt tccatcaccg aggccctagc 960
tttcttccac tgttgtctga accccatcct ctatgctttc cttggagcca aatttaaaac 1020
ctctgcccag cacgcactca cctctgtgag cagagggtcc agcctcaaga tcctctccaa 1080
aggaaagcga ggtggacatt catctgtttc cactgagtct gagtcttcaa gttttcactc 1140
cagctaacac agatgtaaaa gacttttttt tatacgataa ataacttttt tttaagttac 1200
acatttttca gatataaaag actgaccaat attgtacagt ttttattgct tgttggattt 1260
ttgtcttgtg tttctttagt ttttgtgaag tttaattgac ttatttatat aaattttttt 1320
tgtttcatat tgatgtgtgt ctaggcagga cctgtggcca agttcttagt tgctgtatgt 1380
ctcgtggtag gactgtagaa aagggaactg aacattccag agcgtgtagt gaatcacgta 1440
aagctagaaa tgatccccag ctgtttatgc atagataatc tctccattcc cgtggaacgt 1500
ttttcctgtt cttaagacgt gattttgctg tagaagatgg cacttataac caaagcccaa 1560
agtggtatag aaatgctggt ttttcagttt tcaggagtgg gttgatttca gcacctacag 1620
tgtacagtct tgtattaagt tgttaataaa agtacatgtt aaacttactt agtgttatg 1679
<210>63
<211>2859
<212>DNA
<213>人
<400>63
cattcagaga cagaaggtgg atagacaaat ctccaccttc agactggtag gctcctccag 60
aagccatcag acaggaagat gtgaaaatcc ccagcactca tcccagaatc actaagtggc 120
acctgtcctg ggccaaagtc ccaggacaga cctcattgtt cctctgtggg aatacctccc 180
caggagggca tcctggattt cccccttgca acccaggtca gaagtttcat cgtcaaggtt 240
gtttcatctt ttttttcctg tctaacagct ctgactacca cccaaccttg aggcacagtg 300
aagacatcgg tggccactcc aataacagca ggtcacagct gctcttctgg aggtgtccta 360
caggtgaaaa gcccagcgac ccagtcagga tttaagttta cctcaaaaat ggaagatttt 420
aacatggaga gtgacagctt tgaagatttc tggaaaggtg aagatcttag taattacagt 480
tacagctcta ccctgccccc ttttctacta gatgccgccc catgtgaacc agaatccctg 540
gaaatcaaca agtattttgt ggtcattatc tatgccctgg tattcctgct gagcctgctg 600
ggaaactccc tcgtgatgct ggtcatctta tacagcaggg tcggccgctc cgtcactgat 660
gtctacctgc tgaacctagc cttggccgac ctactctttg ccctgacctt gcccatctgg 720
gccgcctcca aggtgaatgg ctggattttt ggcacattcc tgtgcaaggt ggtctcactc 780
ctgaaggaag tcaacttcta tagtggcatc ctgctactgg cctgcatcag tgtggaccgt 840
tacctggcca ttgtccatgc cacacgcaca ctgacccaga agcgctactt ggtcaaattc 900
atatgtctca gcatctgggg tctgtccttg ctcctggccc tgcctgtctt acttttccga 960
aggaccgtct actcatccaa tgttagccca gcctgctatg aggacatggg caacaataca 1020
gcaaactggc ggatgctgtt acggatcctg ccccagtcct ttggcttcat cgtgccactg 1080
ctgatcatgc tgttctgcta cggattcacc ctgcgtacgc tgtttaaggc ccacatgggg 1140
cagaagcacc gggccatgcg ggtcatcttt gctgtcgtcc tcatcttcct gctctgctgg 1200
ctgccctaca acctggtcct gctggcagac accctcatga ggacccaggt gatccaggag 1260
acctgtgagc gccgcaatca catcgaccgg gctctggatg ccaccgagat tctgggcatc 1320
cttcacagct gcctcaaccc cctcatctac gccttcattg gccagaagtt tcgccatgga 1380
ctcctcaaga ttctagctat acatggcttg atcagcaagg actccctgcc caaagacagc 1440
aggccttcct ttgttggctc ttcttcaggg cacacttcca ctactctcta agacctcctg 1500
cctaagtgca gccccgtggg gttcctccct tctcttcaca gtcacattcc aagcctcatg 1560
tccactggtt cttcttggtc tcagtgtcaa tgcagccccc attgtggtca caggaagtag 1620
aggaggccac gttcttacta gtttcccttg catggtttag aaagcttgcc ctggtgcctc 1680
accccttgcc ataattacta tgtcatttgc tggagctctg cccatcctgc ccctgagccc 1740
atggcactct atgttctaag aagtgaaaat ctacactcca gtgagacagc tctgcatact 1800
cattaggatg gctagtatca aaagaaagaa aatcaggctg gccaacgggg tgaaaccctg 1860
tctctactaa aaatacaaaa aaaaaaaaaa attagccggg cgtggtggtg agtgcctgta 1920
atcacagcta cttgggaggc tgagatggga gaatcacttg aacccgggag gcagaggttg 1980
cagtgagccg agattgtgcc cctgcactcc agcctgagcg acagtgagac tctgtctcag 2040
tccatgaaga tgtagaggag aaactggaac tctcgagcgt tgctgggggg gattgtaaaa 2100
tggtgtgacc actgcagaag acagtatggc agctttcctc aaaacttcag acatagaatt 2160
aacacatgat cctgcaattc cacttatagg aattgaccca caagaaatga aagcagggac 2220
ttgaacccat atttgtacac caatattcat agcagcttat tcacaagacc caaaaggcag 2280
aagcaaccca aatgttcatc aatgaatgaa tgaatggcta agcaaaatgt gatatgtacc 2340
taacgaagta tccttcagcc tgaaagagga atgaagtact catacatgtt acaacacgga 2400
cgaaccttga aaactttatg ctaagtgaaa taagccagac atcaacagat aaatagttta 2460
tgattccacc tacatgaggt actgagagtg aacaaattta cagagacaga aagcagaaca 2520
gtgattacca gggactgagg ggaggggagc atgggaagtg acggtttaat gggcacaggg 2580
tttatgttta ggatgttgaa aaagttctgc agataaacag tagtgatagt tgtaccgcaa 2640
tgtgacttaa tgccactaaa ttgacactta aaaatggttt aaatggtcaa ttttgttatg 2700
tatattttat atcaatttaa aaaaaaacct gagccccaaa aggtatttta atcaccaagg 2760
ctgattaaac caaggctaga accacctgcc tatatttttt gttaaatgat ttcattcaat 2820
atcttttttt taataaacca tttttacttg ggtgtttat 2859
<210>64
<211>27
<212>DNA
<213>人
<400>64
tgtgcgcgcg gccagagcag gtgcgca 27
<210>65
<211>26
<212>DNA
<213>人
<400>65
gaggatccgt caaccacaag ggtctc 26
<210>66
<211>27
<212>DNA
<213>人
<400>66
tgtgcgcgcg gcctgatcat ccggtct 27
<210>67
<211>26
<212>DNA
<213>人
<400>67
gaggatccga cataccgctc gtgaca 26
<210>68
<211>28
<212>DNA
<213>人
<400>68
tgtgcgcgca gtgtccgcac tgtaaagc 28
<210>69
<211>26
<212>DNA
<213>人
<400>69
gaggatccat aggaggtctt aacagt 26
<210>70
<211>27
<212>DNA
<213>人
<400>70
tgtgcgcgcg gcctttttgt gctctgc 27
<210>71
<211>26
<212>DNA
<213>人
<400>71
gaggatccca gagcatcatg aagatc 26
<210>72
<211>28
<212>DNA
<213>人
<400>72
tgtgcgcgcg gcttgatcag caagggac 28
<210>73
<211>26
<212>DNA
<213>人
<400>73
gaggatccga gagtagtgga agtgtg 26
<210>74
<211>27
<212>DNA
<213>人
<400>74
tgtgcgcgcg ggtccagcct caagatc 27
<210>75
<211>26
<212>DNA
<213>人
<400>75
gaggatccgc tggagtgaaa acttga 26
<210>76
<211>5616
<212>DNA
<213>人
<400>76
ccccggcgca gcgcggccgc agcagcctcc gccccccgca cggtgtgagc gcccgacgcg 60
gccgaggcgg ccggagtccc gagctagccc cggcggccgc cgccgcccag accggacgac 120
aggccacctc gtcggcgtcc gcccgagtcc ccgcctcgcc gccaacgcca caaccaccgc 180
gcacggcccc ctgactccgt ccagtattga tcgggagagc cggagcgagc tcttcgggga 240
gcagcgatgc gaccctccgg gacggccggg gcagcgctcc tggcgctgct ggctgcgctc 300
tgcccggcga gtcgggctct ggaggaaaag aaagtttgcc aaggcacgag taacaagctc 360
acgcagttgg gcacttttga agatcatttt ctcagcctcc agaggatgtt caataactgt 420
gaggtggtcc ttgggaattt ggaaattacc tatgtgcaga ggaattatga tctttccttc 480
ttaaagacca tccaggaggt ggctggttat gtcctcattg ccctcaacac agtggagcga 540
attcctttgg aaaacctgca gatcatcaga ggaaatatgt actacgaaaa ttcctatgcc 600
ttagcagtct tatctaacta tgatgcaaat aaaaccggac tgaaggagct gcccatgaga 660
aatttacagg aaatcctgca tggcgccgtg cggttcagca acaaccctgc cctgtgcaac 720
gtggagagca tccagtggcg ggacatagtc agcagtgact ttctcagcaa catgtcgatg 780
gacttccaga accacctggg cagctgccaa aagtgtgatc caagctgtcc caatgggagc 840
tgctggggtg caggagagga gaactgccag aaactgacca aaatcatctg tgcccagcag 900
tgctccgggc gctgccgtgg caagtccccc agtgactgct gccacaacca gtgtgctgca 960
ggctgcacag gcccccggga gagcgactgc ctggtctgcc gcaaattccg agacgaagcc 1020
acgtgcaagg acacctgccc cccactcatg ctctacaacc ccaccacgta ccagatggat 1080
gtgaaccccg agggcaaata cagctttggt gccacctgcg tgaagaagtg tccccgtaat 1140
tatgtggtga cagatcacgg ctcgtgcgtc cgagcctgtg gggccgacag ctatgagatg 1200
gaggaagacg gcgtccgcaa gtgtaagaag tgcgaagggc cttgccgcaa agtgtgtaac 1260
ggaataggta ttggtgaatt taaagactca ctctccataa atgctacgaa tattaaacac 1320
ttcaaaaact gcacctccat cagtggcgat ctccacatcc tgccggtggc atttaggggt 1380
gactccttca cacatactcc tcctctggat ccacaggaac tggatattct gaaaaccgta 1440
aaggaaatca cagggttttt gctgattcag gcttggcctg aaaacaggac ggacctccat 1500
gcctttgaga acctagaaat catacgcggc aggaccaagc aacatggtca gttttctctt 1560
gcagtcgtca gcctgaacat aacatccttg ggattacgct ccctcaagga gataagtgat 1620
ggagatgtga taatttcagg aaacaaaaat ttgtgctatg caaatacaat aaactggaaa 1680
aaactgtttg ggacctccgg tcagaaaacc aaaattataa gcaacagagg tgaaaacagc 1740
tgcaaggcca caggccaggt ctgccatgcc ttgtgctccc ccgagggctg ctggggcccg 1800
gagcccaggg actgcgtctc ttgccggaat gtcagccgag gcagggaatg cgtggacaag 1860
tgcaaccttc tggagggtga gccaagggag tttgtggaga actctgagtg catacagtgc 1920
cacccagagt gcctgcctca ggccatgaac atcacctgca caggacgggg accagacaac 1980
tgtatccagt gtgcccacta cattgacggc ccccactgcg tcaagacctg cccggcagga 2040
gtcatgggag aaaacaacac cctggtctgg aagtacgcag acgccggcca tgtgtgccac 2100
ctgtgccatc caaactgcac ctacggatgc actgggccag gtcttgaagg ctgtccaacg 2160
aatgggccta agatcccgtc catcgccact gggatggtgg gggccctcct cttgctgctg 2220
gtggtggccc tggggatcgg cctcttcatg cgaaggcgcc acatcgttcg gaagcgcacg 2280
ctgcggaggc tgctgcagga gagggagctt gtggagcctc ttacacccag tggagaagct 2340
cccaaccaag ctctcttgag gatcttgaag gaaactgaat tcaaaaagat caaagtgctg 2400
ggctccggtg cgttcggcac ggtgtataag ggactctgga tcccagaagg tgagaaagtt 2460
aaaattcccg tcgctatcaa ggaattaaga gaagcaacat ctccgaaagc caacaaggaa 2520
atcctcgatg aagcctacgt gatggccagc gtggacaacc cccacgtgtg ccgcctgctg 2580
ggcatctgcc tcacctccac cgtgcagctc atcacgcagc tcatgccctt cggctgcctc 2640
ctggactatg tccgggaaca caaagacaat attggctccc agtacctgct caactggtgt 2700
gtgcagatcg caaagggcat gaactacttg gaggaccgtc gcttggtgca ccgcgacctg 2760
gcagccagga acgtactggt gaaaacaccg cagcatgtca agatcacaga ttttgggctg 2820
gccaaactgc tgggtgcgga agagaaagaa taccatgcag aaggaggcaa agtgcctatc 2880
aagtggatgg cattggaatc aattttacac agaatctata cccaccagag tgatgtctgg 2940
agctacgggg tgaccgtttg ggagttgatg acctttggat ccaagccata tgacggaatc 3000
cctgccagcg agatctcctc catcctggag aaaggagaac gcctccctca gccacccata 3060
tgtaccatcg atgtctacat gatcatggtc aagtgctgga tgatagacgc agatagtcgc 3120
ccaaagttcc gtgagttgat catcgaattc tccaaaatgg cccgagaccc ccagcgctac 3180
cttgtcattc agggggatga aagaatgcat ttgccaagtc ctacagactc caacttctac 3240
cgtgccctga tggatgaaga agacatggac gacgtggtgg atgccgacga gtacctcatc 3300
ccacagcagg gcttcttcag cagcccctcc acgtcacgga ctcccctcct gagctctctg 3360
agtgcaacca gcaacaattc caccgtggct tgcattgata gaaatgggct gcaaagctgt 3420
cccatcaagg aagacagctt cttgcagcga tacagctcag accccacagg cgccttgact 3480
gaggacagca tagacgacac cttcctccca gtgcctgaat acataaacca gtccgttccc 3540
aaaaggcccg ctggctctgt gcagaatcct gtctatcaca atcagcctct gaaccccgcg 3600
cccagcagag acccacacta ccaggacccc cacagcactg cagtgggcaa ccccgagtat 3660
ctcaacactg tccagcccac ctgtgtcaac agcacattcg acagccctgc ccactgggcc 3720
cagaaaggca gccaccaaat tagcctggac aaccctgact accagcagga cttctttccc 3780
aaggaagcca agccaaatgg catctttaag ggctccacag ctgaaaatgc agaataccta 3840
agggtcgcgc cacaaagcag tgaatttatt ggagcatgac cacggaggat agtatgagcc 3900
ctaaaaatcc agactctttc gatacccagg accaagccac agcaggtcct ccatcccaac 3960
agccatgccc gcattagctc ttagacccac agactggttt tgcaacgttt acaccgacta 4020
gccaggaagt acttccacct cgggcacatt ttgggaagtt gcattccttt gtcttcaaac 4080
tgtgaagcat ttacagaaac gcatccagca agaatattgt ccctttgagc agaaatttat 4140
ctttcaaaga ggtatatttg aaaaaaaaaa aaagtatatg tgaggatttt tattgattgg 4200
ggatcttgga gtttttcatt gtcgctattg atttttactt caatgggctc ttccaacaag 4260
gaagaagctt gctggtagca cttgctaccc tgagttcatc caggcccaac tgtgagcaag 4320
gagcacaagc cacaagtctt ccagaggatg cttgattcca gtggttctgc ttcaaggctt 4380
ccactgcaaa acactaaaga tccaagaagg ccttcatggc cccagcaggc cggatcggta 4440
ctgtatcaag tcatggcagg tacagtagga taagccactc tgtcccttcc tgggcaaaga 4500
agaaacggag gggatggaat tcttccttag acttactttt gtaaaaatgt ccccacggta 4560
cttactcccc actgatggac cagtggtttc cagtcatgag cgttagactg acttgtttgt 4620
cttccattcc attgttttga aactcagtat gctgcccctg tcttgctgtc atgaaatcag 4680
caagagagga tgacacatca aataataact cggattccag cccacattgg attcatcagc 4740
atttggacca atagcccaca gctgagaatg tggaatacct aaggatagca ccgcttttgt 4800
tctcgcaaaa acgtatctcc taatttgagg ctcagatgaa atgcatcagg tcctttgggg 4860
catagatcag aagactacaa aaatgaagct gctctgaaat ctcctttagc catcacccca 4920
accccccaaa attagtttgt gttacttatg gaagatagtt ttctcctttt acttcacttc 4980
aaaagctttt tactcaaaga gtatatgttc cctccaggtc agctgccccc aaaccccctc 5040
cttacgcttt gtcacacaaa aagtgtctct gccttgagtc atctattcaa gcacttacag 5100
ctctggccac aacagggcat tttacaggtg cgaatgacag tagcattatg agtagtgtgg 5160
aattcaggta gtaaatatga aactagggtt tgaaattgat aatgctttca caacatttgc 5220
agatgtttta gaaggaaaaa agttccttcc taaaataatt tctctacaat tggaagattg 5280
gaagattcag ctagttagga gcccaccttt tttcctaatc tgtgtgtgcc ctgtaacctg 5340
actggttaac agcagtcctt tgtaaacagt gttttaaact ctcctagtca atatccaccc 5400
catccaattt atcaaggaag aaatggttca gaaaatattt tcagcctaca gttatgttca 5460
gtcacacaca catacaaaat gttccttttg cttttaaagt aatttttgac tcccagatca 5520
gtcagagccc ctacagcatt gttaagaaag tatttgattt ttgtctcaat gaaaataaaa 5580
ctatattcat ttccactcta aaaaaaaaaa aaaaaa 5616
<210>77
<211>12
<212>PRT
<213>人
<400>77
Gly Gly Ser Gly Ser Glu Asn Leu Tyr Phe Gln Leu
5 10
<210>78
<211>1291
<212>PRT
<213>人
<400>78
Met Ala Gly Ala Ala Ser Pro Cys Ala Asn Gly Cys Gly Pro Gly Ala
5 10 15
Pro Ser Asp Ala Glu Val Leu His Leu Cys Arg Ser Leu Glu Val Gly
20 25 30
Thr Val Met Thr Leu Phe Tyr Ser Lys Lys Ser Gln Arg Pro Glu Arg
35 40 45
Lys Thr Phe Gln Val Lys Leu Glu Thr Arg Gln Ile Thr Trp Ser Arg
50 55 60
Gly Ala Asp Lys Ile Glu Gly Ala Ile Asp Ile Arg Glu Ile Lys Glu
65 70 75 80
Ile Arg Pro Gly Lys Thr Ser Arg Asp Phe Asp Arg Tyr Gln Glu Asp
85 90 95
Pro Ala Phe Arg Pro Asp Gln Ser His Cys Phe Val Ile Leu Tyr Gly
100 105 110
Met Glu Phe Arg Leu Lys Thr Leu Ser Leu Gln Ala Thr Ser Glu Asp
115 120 125
Glu Val Asn Met Trp Ile Lys Gly Leu Thr Trp Leu Met Glu Asp Thr
130 135 140
Leu Gln Ala Pro Thr Pro Leu Gln Ile Glu Arg Trp Leu Arg Lys Gln
145 150 155 160
Phe Tyr Ser Val Asp Arg Asn Arg Glu Asp Arg Ile Ser Ala Lys Asp
165 170 175
Leu Lys Asn Met Leu Ser Gln Val Asn Tyr Arg Val Pro Asn Met Arg
180 185 190
Phe Leu Arg Glu Arg Leu Thr Asp Leu Glu Gln Arg Ser Gly Asp Ile
195 200 205
Thr Tyr Gly Gln Phe Ala Gln Leu Tyr Arg Ser Leu Met Tyr Ser Ala
210 215 220
Gln Lys Thr Met Asp Leu Pro Phe Leu Glu Ala Ser Thr Leu Arg Ala
225 230 235 240
Gly Glu Arg Pro Glu Leu Cys Arg Val Ser Leu Pro Glu Phe Gln Gln
245 250 255
Phe Leu Leu Asp Tyr Gln Gly Glu Leu Trp Ala Val Asp Arg Leu Gln
260 265 270
Val Gln Glu Phe Met Leu Ser Phe Leu Arg Asp Pro Leu Arg Glu Ile
275 280 285
Glu Glu Pro Tyr Phe Phe Leu Asp Glu Phe Val Thr Phe Leu Phe Ser
290 295 300
Lys Glu Asn Ser Val Trp Asn Ser Gln Leu Asp Ala Val Cys Pro Asp
305 310 315 320
Thr Met Asn Asn Pro Leu Ser His Tyr Trp Ile Ser Ser Ser His Asn
325 330 335
Thr Tyr Leu Thr Gly Asp Gln Phe Ser Ser Glu Ser Ser Leu Glu Ala
340 345 350
Tyr Ala Arg Cys Leu Arg Met Gly Cys Arg Cys Ile Glu Leu Asp Cys
355 360 365
Trp Asp Gly Pro Asp Gly Met Pro Val Ile Tyr His Gly His Thr Leu
370 375 380
Thr Thr Lys Ile Lys Phe Ser Asp Val Leu His Thr Ile Lys Glu His
385 390 395 400
Ala Phe Val Ala Ser Glu Tyr Pro Val Ile Leu Ser Ile Glu Asp His
405 410 415
Cys Ser Ile Ala Gln Gln Arg Asn Met Ala Gln Tyr Phe Lys Lys Val
420 425 430
Leu Gly Asp Thr Leu Leu Thr Lys Pro Val Glu Ile Ser Ala Asp Gly
435 440 445
Leu Pro Ser Pro Asn Gln Leu Lys Arg Lys Ile Leu Ile Lys His Lys
450 455 460
Lys Leu Ala Glu Gly Ser Ala Tyr Glu Glu Val Pro Thr Ser Met Met
465 470 475 480
Tyr Ser Glu Asn Asp Ile Ser Asn Ser Ile Lys Asn Gly Ile Leu Tyr
485 490 495
Leu Glu Asp Pro Val Asn His Glu Trp Tyr Pro His Tyr Phe Val Leu
500 505 510
Thr Ser Ser Lys Ile Tyr Tyr Ser Glu Glu Thr Ser Ser Asp Gln Gly
515 520 525
Asn Glu Asp Glu Glu Glu Pro Lys Glu Val Ser Ser Ser Thr Glu Leu
530 535 540
His Ser Asn Glu Lys Trp Phe His Gly Lys Leu Gly Ala Gly Arg Asp
545 550 555 560
Gly Arg His Ile Ala Glu Arg Leu Leu Thr Glu Tyr Cys Ile Glu Thr
565 570 575
Gly Ala Pro Asp Gly Ser Phe Leu Val Arg Glu Ser Glu Thr Phe Val
580 585 590
Gly Asp Tyr Thr Leu Ser Phe Trp Arg Asn Gly Lys Val Gln His Cys
595 600 605
Arg Ile His Ser Arg Gln Asp Ala Gly Thr Pro Lys Phe Phe Leu Thr
610 615 620
Asp Asn Leu Val Phe Asp Ser Leu Tyr Asp Leu Ile Thr His Tyr Gln
625 630 635 640
Gln Val Pro Leu Arg Cys Asn Glu Phe Glu Met Arg Leu Ser Glu Pro
645 650 655
Val Pro Gln Thr Asn Ala His Glu Ser Lys Glu Trp Tyr His Ala Ser
660 665 670
Leu Thr Arg Ala Gln Ala Glu His Met Leu Met Arg Val Pro Arg Asp
675 680 685
Gly Ala Phe Leu Val Arg Lys Arg Asn Glu Pro Asn Ser Tyr Ala Ile
690 695 700
Ser Phe Arg Ala Glu Gly Lys Ile Lys His Cys Arg Val Gln Gln Glu
705 710 715 720
Gly Gln Thr Val Met Leu Gly Asn Ser Glu Phe Asp Ser Leu Val Asp
725 730 735
Leu Ile Ser Tyr Tyr Glu Lys His Pro Leu Tyr Arg Lys Met Lys Leu
740 745 750
Arg Tyr Pro Ile Asn Glu Glu Ala Leu Glu Lys Ile Gly Thr Ala Glu
755 760 765
Pro Asp Tyr Gly Ala Leu Tyr Glu Gly Arg Asn Pro Gly Phe Tyr Val
770 775 780
Glu Ala Asn Pro Met Pro Thr Phe Lys Cys Ala Val Lys Ala Leu Phe
785 790 795 800
Asp Tyr Lys Ala Gln Arg Glu Asp Glu Leu Thr Phe Ile Lys Ser Ala
805 810 815
Ile Ile Gln Asn Val Glu Lys Gln Glu Gly Gly Trp Trp Arg Gly Asp
820 825 830
Tyr Gly Gly Lys Lys Gln Leu Trp Phe Pro Ser Asn Tyr Val Glu Glu
835 840 845
Met Val Asn Pro Val Ala Leu Glu Pro Glu Arg Glu His Leu Asp Glu
850 855 860
Asn Ser Pro Leu Gly Asp Leu Leu Arg Gly Val Leu Asp Val Pro Ala
865 870 875 880
Cys Gln Ile Ala Ile Arg Pro Glu Gly Lys Asn Asn Arg Leu Phe Val
885 890 895
Phe Ser Ile Ser Met Ala Ser Val Ala His Trp Ser Leu Asp Val Ala
900 905 910
Ala Asp Ser Gln Glu Glu Leu Gln Asp Trp Val Lys Lys Ile Arg Glu
915 920 925
Val Ala Gln Thr Ala Asp Ala Arg Leu Thr Glu Gly Lys Ile Met Glu
930 935 940
Arg Arg Lys Lys Ile Ala Leu Glu Leu Ser Glu Leu Val Val Tyr Cys
945 950 955 960
Arg Pro Val Pro Phe Asp Glu Glu Lys Ile Gly Thr Glu Arg Ala Cys
965 970 975
Tyr Arg Asp Met Ser Ser Phe Pro Glu Thr Lys Ala Glu Lys Tyr Val
980 985 990
Asn Lys Ala Lys Gly Lys Lys Phe Leu Gln Tyr Asn Arg Leu Gln Leu
995 1000 1005
Ser Arg Ile Tyr Pro Lys Gly Gln Arg Leu Asp Ser Ser Asn Tyr Asp
1010 1015 1020
Pro Leu Pro Met Trp Ile Cys Gly Ser Gln Leu Val Ala Leu Asn Phe
1025 1030 1035 1040
Gln Thr Pro Asp Lys Pro Met Gln Met Asn Gln Ala Leu Phe Met Thr
1045 1050 1055
Gly Arg His Cys Gly Tyr Val Leu Gln Pro Ser Thr Met Arg Asp Glu
1060 1065 1070
Ala Phe Asp Pro Phe Asp Lys Ser Ser Leu Arg Gly Leu Glu Pro Cys
1075 1080 1085
Ala Ile Ser Ile Glu Val Leu Gly Ala Arg His Leu Pro Lys Asn Gly
1090 1095 1100
Arg Gly Ile Val Cys Pro Phe Val Glu Ile Glu Val Ala Gly Ala Glu
1105 1110 1115 1120
Tyr Asp Ser Thr Lys Gln Lys Thr Glu Phe Val Val Asp Asn Gly Leu
1125 1130 1135
Asn Pro Val Trp Pro Ala Lys Pro Phe His Phe Gln Ile Ser Asn Pro
1140 1145 1150
Glu Phe Ala Phe Leu Arg Phe Val Val Tyr Glu Glu Asp Met Phe Ser
1155 1160 1165
Asp Gln Asn Phe Leu Ala Gln Ala Thr Phe Pro Val Lys Gly Leu Lys
1170 1175 1180
Thr Gly Tyr Arg Ala Val Pro Leu Lys Asn Asn Tyr Ser Glu Asp Leu
1185 1190 1195 1200
Glu Leu Ala Ser Leu Leu Ile Lys Ile Asp Ile Phe Pro Ala Lys Gln
1205 1210 1215
Glu Asn Gly Asp Leu Ser Pro Phe Ser Gly Thr Ser Leu Arg Glu Arg
1220 1225 1230
Gly Ser Asp Ala Ser Gly Gln Leu Phe His Gly Arg Ala Arg Glu Gly
1235 1240 1245
Ser Phe Glu Ser Arg Tyr Gln Gln Pro Phe Glu Asp Phe Arg Ile Ser
1250 1255 1260
Gln Glu His Leu Ala Asp His Phe Asp Ser Arg Glu Arg Arg Ala Pro
1265 1270 1275 1280
Arg Arg Thr Arg Val Asn Gly Asp Asn Arg Leu
1285 1290
<210>79
<211>3054
<212>PRT
<213>人
<400>79
Met Ala Leu Ile Phe Gly Thr Val Asn Ala Asn Ile Leu Lys Glu Val
5 10 15
Phe Gly Gly Ala Arg Met Ala Cys Val Thr Ser Ala His Met Ala Gly
20 25 30
Ala Asn Gly Ser Ile Leu Lys Lys Ala Glu Glu Thr Ser Arg Ala Ile
35 40 45
Met His Lys Pro Val Ile Phe Gly Glu Asp Tyr Ile Thr Glu Ala Asp
50 55 60
Leu Pro Tyr Thr Pro Leu His Leu Glu Val Asp Ala Glu Met Glu Arg
65 70 75 80
Met Tyr Tyr Leu Gly Arg Arg Ala Leu Thr His Gly Lys Arg Arg Lys
85 90 95
Val Ser Val Asn Asn Lys Arg Asn Arg Arg Arg Lys Val Ala Lys Thr
100 105 110
Tyr Val Gly Arg Asp Ser Ile Val Glu Lys Ile Val Val Pro His Thr
115 120 125
Glu Arg Lys Val Asp Thr Thr Ala Ala Val Glu Asp Ile Cys Asn Glu
130 135 140
Ala Thr Thr Gln Leu Val His Asn Ser Met Pro Lys Arg Lys Lys Gln
145 150 155 160
Lys Asn Phe Leu Pro Ala Thr Ser Leu Ser Asn Val Tyr Ala Gln Thr
165 170 175
Trp Ser Ile Val Arg Lys Arg His Met Gln Val Glu Ile Ile Ser Lys
180 185 190
Lys Ser Val Arg Ala Arg Val Lys Arg Phe Glu Gly Ser Val Gln Leu
19 5200 205
Phe Ala Ser Val Arg His Met Tyr Gly Glu Arg Lys Arg Val Asp Leu
210 215 220
Arg Ile Asp Asn Trp Gln Gln Glu Thr Leu Leu Asp Leu Ala Lys Arg
225 230 235 240
Phe Lys Asn Glu Arg Val Asp Gln Ser Lys Leu Thr Phe Gly Ser Ser
245 250 255
Gly Leu Val Leu Arg Gln Gly Ser Tyr Gly Pro Ala His Trp Tyr Arg
260 265 270
His Gly Met Phe Ile Val Arg Gly Arg Ser Asp Gly Met Leu Val Asp
275 280 285
Ala Arg Ala Lys Val Thr Phe Ala Val Cys His Ser Met Thr His Tyr
290 295 300
Ser Asp Lys Ser Ile Ser Glu Ala Phe Phe Ile Pro Tyr Ser Lys Lys
305 310 315 320
Phe Leu Glu Leu Arg Pro Asp Gly Ile Ser His Glu Cys Thr Arg Gly
325 330 335
Val Ser Val Glu Arg Cys Gly Glu Val Ala Ala Ile Leu Thr Gln Ala
340 345 350
Leu Ser Pro Cys Gly Lys Ile Thr Cys Lys Arg Cys Met Val Glu Thr
355 360 365
Pro Asp Ile Val Glu Gly Glu Ser Gly Glu Ser Val Thr Asn Gln Gly
370 375 380
Lys Leu Leu Ala Met Leu Lys Glu Gln Tyr Pro Asp Phe Pro Met Ala
385 390 395 400
Glu Lys Leu Leu Thr Arg Phe Leu Gln Gln Lys Ser Leu Val Asn Thr
405 410 415
Asn Leu Thr Ala Cys Val Ser Val Lys Gln Leu Ile Gly Asp Arg Lys
420 425 430
Gln Ala Pro Phe Thr His Val Leu Ala Val Ser GluIle Leu Phe Lys
435 440 445
Gly Asn Lys Leu Thr Gly Ala Asp Leu Glu Glu Ala Ser Thr His Met
450 455 460
Leu Glu Ile Ala Arg Phe Leu Asn Asn Arg Thr Glu Asn Met Arg Ile
465 470 475 480
Gly His Leu Gly Ser Phe Arg Asn Lys Ile Ser Ser Lys Ala His Val
485 490 495
Asn Asn Ala Leu Met Cys Asp Asn Gln Leu Asp Gln Asn Gly Asn Phe
500 505 510
Ile Trp Gly Leu Arg Gly Ala His Ala Lys Arg Phe Leu Lys Gly Phe
515 520 525
Phe Thr Glu Ile Asp Pro Asn Glu Gly Tyr Asp Lys Tyr Val Ile Arg
530 535 540
Lys His Ile Arg Gly Ser Arg Lys Leu Ala Ile Gly Asn Leu Ile Met
545 550 555 560
Ser Thr Asp Phe Gln Thr Leu Arg Gln Gln Ile Gln Gly Glu Thr Ile
565 570 575
Glu Arg Lys Glu Ile Gly Asn His Cys Ile Ser Met Arg Asn Gly Asn
580 585 590
Tyr Val Tyr Pro Cys Cys Cys Val Thr Leu Glu Asp Gly Lys Ala Gln
595 600 605
Tyr Ser Asp Leu Lys His Pro Thr Lys Arg His Leu Val Ile Gly Asn
610 615 620
Ser Gly Asp Ser Lys Tyr Leu Asp Leu Pro Val Leu Asn Glu Glu Lys
625 630 635 640
Met Tyr Ile Ala Asn Glu Gly Tyr Cys Tyr Met Asn Ile Phe Phe Ala
645 650 655
Leu Leu Val Asn Val Lys Glu Glu Asp Ala Lys Asp Phe Thr Lys Phe
660 665 670
Ile Arg Asp Thr Ile Val Pro Lys Leu Gly Ala Trp Pro Thr Met Gln
675 680 685
Asp Val Ala Thr Ala Cys Tyr Leu Leu Ser Ile Leu Tyr Pro Asp Val
690 695 700
Leu Arg Ala Glu Leu Pro Arg Ile Leu Val Asp His Asp Asn Lys Thr
705 710 715 720
Met His Val Leu Asp Ser Tyr Gly Ser Arg Thr Thr Gly Tyr His Met
725 730 735
Leu Lys Met Asn Thr Thr Ser Gln Leu Ile Glu Phe Val His Ser Gly
740 745 750
Leu Glu Ser Glu Met Lys Thr Tyr Asn Val Gly Gly Met Asn Arg Asp
755 760 765
Val Val Thr Gln Gly Ala Ile Glu Met Leu Ile Lys Ser Ile Tyr Lys
770 775 780
Pro His Leu Met Lys Gln Leu Leu Glu Glu Glu Pro Tyr Ile Ile Val
785 790 795 800
Leu Ala Ile Val Ser Pro Ser Ile Leu Ile Ala Met Tyr Asn Ser Gly
805 810 815
Thr Phe Glu Gln Ala Leu Gln Met Trp Leu Pro Asn Thr Met Arg Leu
820 825 830
Ala Asn Leu Ala Ala Ile Leu Ser Ala Leu Ala Gln Lys Leu Thr Leu
835 840 845
Ala Asp Leu Phe Val Gln Gln Arg Asn Leu Ile Asn Glu Tyr Ala Gln
850 855 860
Val Ile Leu Asp Asn Leu Ile Asp Gly Val Arg Val Asn His Ser Leu
865 870 875880
Ser Leu Ala Met Glu Ile Val Thr Ile Lys Leu Ala Thr Gln Glu Met
885 890 895
Asp Met Ala Leu Arg Glu Gly Gly Tyr Ala Val Thr Ser Glu Lys Val
900 905 910
His Glu Met Leu Glu Lys Asn Tyr Val Lys Ala Leu Lys Asp Ala Trp
915 920 925
Asp Glu Leu Thr Trp Leu Glu Lys Phe Ser Ala Ile Arg His Ser Arg
930 935 940
Lys Leu Leu Lys Phe Gly Arg Lys Pro Leu Ile Met Lys Asn Thr Val
945 950 955 960
Asp Cys Gly Gly His Ile Asp Leu Ser Val Lys Ser Leu Phe Lys Phe
965 970 975
His Leu Glu Leu Leu Lys Gly Thr Ile Ser Arg Ala Val Asn Gly Gly
980 985 990
Ala Arg Lys Val Arg Val Ala Lys Asn Ala Met Thr Lys Gly Val Phe
995 1000 1005
Leu Lys Ile Tyr Ser Met Leu Pro Asp Val Tyr Lys Phe Ile Thr Val
1010 1015 1020
Ser Ser Val Leu Ser Leu Leu Leu Thr Phe Leu Phe Gln Ile Asp Cys
1025 1030 1035 1040
Met Ile Arg Ala His Arg Glu Ala Lys Val Ala Ala Gln Leu Gln Lys
1045 1050 1055
Glu Ser Glu Trp Asp AsnIle Ile Asn Arg Thr Phe Gln Tyr Ser Lys
1060 1065 1070
Leu Glu Asn Pro Ile Gly Tyr Arg Ser Thr Ala Glu Glu Arg Leu Gln
1075 1080 1085
Ser Glu His Pro Glu Ala Phe Glu Tyr Tyr Lys Phe Cys Ile Gly Lys
1090 1095 1100
Glu Asp Leu Val Glu Gln Ala Lys Gln Pro Glu Ile Ala Tyr Phe Glu
1105 1110 1115 1120
Lys Ile Ile Ala Phe Ile Thr Leu Val Leu Met Ala Phe Asp Ala Glu
1125 1130 1135
Arg Ser Asp Gly Val Phe LysIle Leu Asn Lys Phe Lys Gly Ile Leu
1140 1145 1150
Ser Ser Thr Glu Arg Glu Ile Ile Tyr Thr Gln Ser Leu Asp Asp Tyr
1155 1160 1165
Val Thr Thr Phe Asp Asp Asn Met Thr Ile Asn Leu Glu Leu Asn Met
1170 1175 1180
Asp Glu Leu His Lys Thr Ser Leu Pro Gly Val Thr Phe Lys Gln Trp
1185 1190 1195 1200
Trp Asn Asn Gln Ile Ser Arg Gly Asn Val Lys Pro His Tyr Arg Thr
1205 1210 1215
Glu Gly His Phe Met Glu Phe Thr Arg Asp Thr Ala Ala Ser Val Ala
1220 1225 1230
Ser Glu Ile Ser His Ser Pro Ala Arg Asp Phe Leu Val Arg Gly Ala
1235 1240 1245
Val Gly Ser Gly Lys Ser Thr Gly Leu Pro Tyr His Leu Ser Lys Arg
1250 1255 1260
Gly Arg Val Leu Met Leu Glu Pro Thr Arg Pro Leu Thr Asp Asn Met
1265 1270 1275 1280
His Lys Gln Leu Arg Ser Glu Pro Phe Asn Cys Phe Pro Thr Leu Arg
1285 1290 1295
Met Arg Gly Lys Ser Thr Phe Gly Ser Ser Pro Ile Thr Val Met Thr
1300 1305 1310
Ser Gly Phe Ala Leu His His Phe Ala Ar gAsn Ile Ala Glu Val Lys
1315 1320 1325
Thr Tyr Asp Phe Val Ile Ile Asp Glu Cys His Val Asn Asp Ala Ser
1330 1335 1340
Ala Ile Ala Phe Arg Asn Leu Leu Phe Glu His Glu Phe Glu Gly Lys
1345 1350 1355 1360
Val Leu Lys Val Ser Ala Thr Pro Pro Gly Arg Glu Val Glu Phe Thr
1365 1370 1375
Thr Gln Phe Pro Val Lys Leu Lys Ile Glu Glu Ala Leu Ser Phe Gln
1380 1385 1390
Glu Phe Val Ser Leu Gln Gly Thr Gly Ala Asn Ala Asp Val Ile Ser
1395 1400 1405
Cys Gly Asp Asn Ile Leu Val Tyr Val Ala Ser Tyr Asn Asp Val Asp
1410 1415 1420
Ser Leu Gly Lys Leu Leu Val Gln Lys Gly Tyr Lys Val Ser Lys Ile
1425 1430 1435 1440
Asp Gly Arg Thr Met Lys Ser Gly Gly Thr Glu Ile Ile Thr Glu Gly
1445 1450 1455
Thr Ser Val Lys Lys His Phe Ile Val Ala Thr Asn Ile Ile Glu Asn
1460 1465 1470
Gly Val Thr Ile Asp Ile Asp Val Val Val Asp Phe Gly Thr Lys Val
1475 1480 1485
Val Pro Val Leu Asp Val Asp Asn Arg Ala Val Gln Tyr Asn Lys Thr
1490 1495 1500
Val Val Ser Tyr Gly Glu Arg Ile Gln Lys Leu Gly Arg Val Gly Arg
1505 1510 1515 1520
His Lys Glu Gly Val Ala Leu Arg Ile Gly Gln Thr Asn Lys Thr Leu
1525 1530 1535
Val Glu Ile Pro Glu Met Val Ala Thr Glu Ala Ala Phe Leu Cys Phe
1540 1545 1550
Met Tyr Asn Leu Pro Val Thr Thr Gln Ser Val Ser Thr Thr Leu Leu
1555 1560 1565
Glu Asn Ala Thr Leu Leu Gln Ala Arg Thr Met Ala Gln Phe Glu Leu
1570 1575 1580
Ser Tyr Phe Tyr Thr Ile Asn Phe Val Arg Phe Asp Gly Ser Met His
1585 1590 1595 1600
Pro Val Ile His Asp Lys Leu Lys Arg Phe Lys Leu His Thr Cys Glu
1605 1610 1615
Thr Phe Leu Asn Lys Leu Ala Ile Pro Asn Lys Gly Leu Ser Ser Trp
1620 1625 1630
Leu Thr Ser Gly Glu Tyr Lys Arg Leu Gly Tyr Ile Ala Glu Asp Ala
1635 1640 1645
Gly Ile Arg Ile Pro Phe Val Cys Lys Glu Ile Pro Asp Ser Leu His
1650 1655 1660
Glu Glu Ile Trp His Ile Val Val Ala His Lys Gly Asp Ser Gly Ile
1665 1670 1675 1680
Gly Arg Leu Thr Ser Val Gln Ala Ala Lys Val Val Tyr Thr Leu Gln
1685 1690 1695
Thr Asp Val His Ser Ile Ala Arg Thr Leu Ala Cys Ile Asn Arg Arg
1700 1705 1710
Ile Ala Asp Glu Gln Met Lys Gln Ser His Phe Glu Ala Ala Thr Gly
1715 1720 1725
Arg Ala Phe Ser Phe Thr Asn Tyr Ser Ile Gln Ser Ile Phe Asp Thr
1730 1735 1740
Leu Lys Ala Asn Tyr Ala Thr Lys His Thr Lys Glu Asn Ile Ala Val
1745 1750 1755 1760
Leu Gln Gln Ala Lys Asp Gln Leu Leu Glu Phe Ser Asn Leu Ala Lys
1765 1770 1775
Asp Gln Asp Val Thr Gly Ile Ile Gln Asp Phe Asn His Leu Glu Thr
1780 1785 1790
Ile Tyr Leu Gln Ser Asp Ser Glu Val Ala Lys His Leu Lys Leu Lys
1795 1800 1805
Ser His Trp Asn Lys Ser Gln Ile Thr Arg Asp Ile Ile Ile Ala Leu
1810 1815 1820
Ser Val Leu Ile Gly Gly Gly Trp Met Leu Ala Thr Tyr Phe Lys Asp
1825 1830 1835 1840
Lys Phe Asn Glu Pro Val Tyr Phe Gln Gly Lys Lys Asn Gln Lys His
1845 1850 1855
Lys Leu Lys Met Arg Glu Ala Arg Gly Ala Arg Gly Gln Tyr Glu Val
1860 1865 1870
Ala Ala Glu Pro Glu Ala Leu Glu His Tyr Phe Gly Ser Ala Tyr Asn
1875 1880 1885
Asn Lys Gly Lys Arg Lys Gly Thr Thr Arg Gly Met Gly Ala Lys Ser
1890 1895 1900
Arg Lys Phe Ile Asn Met Tyr Gly Phe Asp Pro Thr Asp Phe Ser Tyr
1905 1910 1915 1920
Ile Arg Phe Val Asp Pro Leu Thr Gly His Thr Ile Asp Glu Ser Thr
1925 1930 1935
Asn Ala Pro Ile Asp Leu Val Gln His Glu Phe Gly Lys Val Arg Thr
1940 1945 1950
Arg Met Leu Ile Asp Asp Glu Ile Glu Pro Gln Ser Leu Ser Thr His
1955 1960 1965
Thr Thr Ile His Ala Tyr Leu Val Asn Ser Gly Thr Lys Lys Val Leu
1970 1975 1980
Lys Val Asp Leu Thr Pro His Ser Ser Leu Arg Ala Ser Glu Lys Ser
1985 1990 1995 2000
Thr Ala Ile Met Gly Phe Pro Glu Arg Glu Asn Glu Leu Arg Gln Thr
2005 2010 2015
Gly Met Ala Val Pro Val Ala Tyr Asp Gln Leu Pro Pro Lys Asn Glu
2020 2025 2030
Asp Leu Thr Phe Glu Gly Glu Ser Leu Phe Lys Gly Pro Arg Asp Tyr
2035 2040 2045
Asn Pro Ile Ser Ser Thr Ile Cys His Leu Thr Asn Glu Ser Asp Gly
2050 2055 2060
His Thr Thr Ser Leu Tyr Gly Ile Gly Phe Gly Pro Phe Ile Ile Thr
2065 2070 2075 2080
Asn Lys His Leu Phe Arg Arg Asn Asn Gly Thr Leu Leu Val Gln Ser
2085 2090 2095
Leu His Gly Val Phe Lys Val Lys Asn Thr Thr Thr Leu Gln Gln His
2100 2105 2110
Leu Ile Asp Gly Arg Asp Met Ile Ile Ile Arg Met Pro Lys Asp Phe
2115 2120 2125
Pro Pro Phe Pro Gln Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu
2130 2135 2140
Arg Ile Cys Leu Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser
2145 2150 2155 2160
Met Val Ser Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe
2165 2170 2175
Trp Lys His Trp Ile Gln Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu
2180 2185 2190
Val Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn
2195 2200 2205
Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asn Phe Met
2210 2215 2220
Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly Trp Arg
2225 2230 2235 2240
Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val Phe Met Ser
2245 2250 2255
Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala Thr Gln Leu Met
2260 2265 2270
Asn Glu Leu Val Tyr Ser Gln Gly Glu Lys Arg Lys Trp Val Val Glu
2275 2280 2285
Ala Leu Ser Gly Asn Leu Arg Pro Val Ala Glu Cys Pro Ser Gln Leu
2290 2295 2300
Val Thr Lys His Val Val Lys Gly Lys Cys Pro Leu Phe Glu Leu Tyr
2305 2310 2315 2320
Leu Gln Leu Asn Pro Glu Lys Glu Ala Tyr Phe Lys Pro Met Met Gly
2325 2330 2335
Ala Tyr Lys Pro Ser Arg Leu Asn Arg Glu Ala Phe Leu Lys Asp Ile
2340 2345 2350
Leu Lys Tyr Ala Ser Glu Ile Glu Ile Gly Asn Val Asp Cys Asp Leu
2355 2360 2365
Leu Glu Leu AlaIle Ser Met Leu Val Thr Lys Leu Lys Ala Leu Gly
2370 2375 2380
Phe Pro Thr Val Asn Tyr Ile Thr Asp Pro Glu Glu Ile Phe Ser Ala
2385 2390 2395 2400
Leu Asn Met Lys Ala Ala Met Gly Ala Leu Tyr Lys Gly Lys Lys Lys
2405 2410 2415
Glu Ala Leu Ser Glu Leu Thr Leu Asp Glu Gln Glu Ala Met Leu Lys
2420 2425 2430
Ala Ser Cys Leu Arg Leu Tyr Thr Gly Lys Leu Gly Ile Trp Asn Gly
2435 2440 2445
Ser Leu Lys Ala Glu Leu Arg Pro Ile Glu Lys Val Glu Asn Asn Lys
2450 2455 2460
Thr Arg Thr Phe Thr Ala Ala Pro Ile Asp Thr Leu Leu Ala Gly Lys
2465 2470 2475 2480
Val Cys Val Asp Asp Phe Asn Asn Gln Phe Tyr Asp Leu Asn Ile Lys
2485 2490 2495
Ala Pro Trp Thr Val Gly Met Thr Lys Phe Tyr Gln Gly Trp Asn Glu
2500 2505 2510
Leu Met Glu Ala Leu Pro Ser Gly Trp Val Tyr Cys Asp Ala Asp Gly
2515 2520 2525
Ser Gln Phe Asp Ser Ser Leu Thr Pro Phe Leu Ile Asn Ala Val Leu
2530 2535 2540
Lys Val Arg Leu Ala Phe Met Glu Glu Trp Asp Ile Gly Glu Gln Met
2545 2550 2555 2560
Leu Arg Asn Leu Tyr Thr Glu Ile Val Tyr Thr Pro Ile Leu Thr Pro
2565 2570 2575
Asp Gly Thr Ile Ile Lys Lys His Lys Gly Asn Asn Ser Gly Gln Pro
2580 2585 2590
Ser Thr Val Val Asp Asn Thr Leu Met Val Ile Ile Ala Met Leu Tyr
2595 2600 2605
Thr Cys Glu Lys Cys Gly Ile Asn Lys Glu Glu Ile Val Tyr Tyr Val
2610 2615 2620
Asn Gly Asp Asp Leu Leu Ile Ala Ile His Pro Asp Lys Ala Glu Arg
2625 2630 2635 2640
Leu Ser Arg Phe Lys Glu Ser Phe Gly Glu Leu Gly Leu Lys Tyr Glu
2645 2650 2655
Phe Asp Cys Thr Thr Arg Asp Lys Thr Gln Leu Trp Phe Met Ser His
2660 2665 2670
Arg Ala Leu Glu Arg Asp Gly Met Tyr Ile Pro Lys Leu Glu Glu Glu
2675 2680 2685
Arg Ile Val Ser Ile Leu Glu Trp Asp Arg Ser Lys Glu Pro Ser His
2690 2695 2700
Arg Leu Glu Ala Ile Cys Ala Ser Met Ile Glu Ala Trp Gly Tyr Asp
2705 2710 2715 2720
Lys Leu Val Glu Glu Ile Arg Asn Phe Tyr Ala Trp Val Leu Glu Gln
2725 2730 2735
Ala Pro Tyr Ser Gln Leu Ala Glu Glu Gly Lys Ala Pro Tyr Leu Ala
2740 2745 2750
Glu Thr Ala Leu Lys Phe Leu Tyr Thr Ser Gln His Gly Thr Asn Ser
2755 2760 2765
Glu Ile Glu Glu Tyr Leu Lys Val Leu Tyr Asp Tyr Asp Ile Pro Thr
2770 2775 2780
Thr Glu Asn Leu Tyr Phe Gln Ser Gly Thr Val Asp Ala Gly Ala Asp
2785 2790 2795 2800
Ala Gly Lys Lys Lys Asp Gln Lys Asp Asp Lys Val Ala Glu Gln Ala
2805 2810 2815
Ser Lys Asp Arg Asp Val Asn Ala Gly Thr Ser Gly Thr Phe Ser Val
2820 2825 2830
Pro Arg Ile Asn Ala Met Ala Thr Lys Leu Gln Tyr Pro Arg Met Arg
2835 2840 2845
Gly Glu Val Val Val Asn Leu Asn His Leu Leu Gly Tyr Lys Pro Gln
2850 2855 2860
Gln Ile Asp Leu Ser Asn Ala Arg Ala Thr His Glu Gln Phe Ala Ala
2865 2870 2875 2880
Trp His Gln Ala Val Met Thr Ala Tyr Gly Val Asn Glu Glu Gln Met
2885 2890 2895
Lys Ile Leu Leu Asn Gly Phe Met Val Trp Cys Ile Glu Asn Gly Thr
2900 2905 2910
Ser Pro Asn Leu Asn Gly Thr Trp Val Met Met Asp Gly Glu Asp Gln
2915 2920 2925
Val Ser Tyr Pro Leu Lys Pro Met Val Glu Asn Ala Gln Pro Thr Leu
2930 2935 2940
Arg Gln Ile Met Thr His Phe Ser Asp Leu Ala Glu Ala Tyr Ile Glu
2945 2950 2955 2960
Met Arg Asn Arg Glu Arg Pro Tyr Met Pro Arg Tyr Gly Leu Gln Arg
2965 2970 2975
Asn Ile Thr Asp Met Ser Leu Ser Arg Tyr Ala Phe Asp Phe Tyr Glu
2980 2985 2990
Leu Thr Ser Lys Thr Pro Val Arg Ala Arg Glu Ala His Met Gln Met
2995 3000 3005
Lys Ala Ala Ala Val Arg Asn Ser Gly Thr Arg Leu Phe Gly Leu Asp
3010 3015 3020
Gly Asn Val Gly Thr Ala Glu Glu Asp Thr Glu Arg His Thr Ala His
3025 3030 3035 3040
Asp Val Asn Arg Asn Met His Thr Leu Leu Gly Val Arg Gln
3045 3050
<210>80
<211>9
<212>PRT
<213>人
<400>80
Asn Ser Ser Gly Gly Asn Ser Gly Ser
5
<210>81
<211>2755
<212>DNA
<213>人
<400>81
ttaggacggg gcgatggcgg ctgagaggag ctgcgcgtgc gcgaacatgt aactggtggg 60
atctgcggcg gctcccagat gatggtcgtc ctcctgggcg cgacgaccct agtgctcgtc 120
gccgtgggcc catgggtgtt gtccgcagcc gcaggtggaa aaaatctaaa atctcctcaa 180
aaagtagagg tcgacatcat agatgacaac tttatcctga ggtggaacag gagcgatgag 240
tctgtcggga atgtgacttt ttcattcgat tatcaaaaaa ctgggatgga taattggata 300
aaattgtctg ggtgtcagaa tattactagt accaaatgca acttttcttc actcaagctg 360
aatgtttatg aagaaattaa attgcgtata agagcagaaa aagaaaacac ttcttcatgg 420
tatgaggttg actcatttac accatttcgc aaagctcaga ttggtcctcc agaagtacat 480
ttagaagctg aagataaggc aatagtgata cacatctctc ctggaacaaa agatagtgtt 540
atgtgggctt tggatggttt aagctttaca tatagcttac ttatctggaa aaactcttca 600
ggtgtagaag aaaggattga aaatatttat tccagacata aaatttataa actctcacca 660
gagactactt attgtctaaa agttaaagca gcactactta cgtcatggaa aattggtgtc 720
tatagtccag tacattgtat aaagaccaca gttgaaaatg aactacctcc accagaaaat 780
atagaagtca gtgtccaaaa tcagaactat gttcttaaat gggattatac atatgcaaac 840
atgacctttc aagttcagtg gctccacgcc tttttaaaaa ggaatcctgg aaaccatttg 900
tataaatgga aacaaatacc tgactgtgaa aatgtcaaaa ctacccagtg tgtctttcct 960
caaaacgttt tccaaaaagg aatttacctt ctccgcgtac aagcatctga tggaaataac 1020
acatcttttt ggtctgaaga gataaagttt gatactgaaa tacaagcttt cctacttcct 1080
ccagtcttta acattagatc ccttagtgat tcattccata tctatatcgg tgctccaaaa 1140
cagtctggaa acacgcctgt gatccaggat tatccactga tttatgaaat tattttttgg 1200
gaaaacactt caaatgctga gagaaaaatt atcgagaaaa aaactgatgt tacagttcct 1260
aatttgaaac cactgactgt atattgtgtg aaagccagag cacacaccat ggatgaaaag 1320
ctgaataaaa gcagtgtttt tagtgacgct gtatgtgaga aaacaaaacc aggaaatacc 1380
tctaaaattt ggcttatagt tggaatttgt attgcattat ttgctctccc gtttgtcatt 1440
tatgctgcga aagtcttctt gagatgcatc aattatgtct tctttccatc acttaaacct 1500
tcttccagta tagatgagta tttctctgaa cagccattga agaatcttct gctttcaact 1560
tctgaggaac aaatcgaaaa atgtttcata attgaaaata taagcacaat tgctacagta 1620
gaagaaacta atcaaactga tgaagatcat aaaaaataca gttcccaaac tagccaagat 1680
tcaggaaatt attctaatga agatgaaagc gaaagtaaaa caagtgaaga actacagcag 1740
gactttgtat gaccagaaat gaactgtgtc aagtataagg tttttcagca ggagttacac 1800
tgggagcctg aggtcctcac cttcctctca gtaactacag agaggacgtt tcctgtttag 1860
ggaaagaaaa aacatcttca gatcataggt cctaaaaata cgggcaagct cttaactatt 1920
taaaaatgaa attacaggcc cgggcacggt ggctcacacc tgtaatccca gcactttggg 1980
aggctgaggc aggcagatca tgaggtcaag agatcgagac cagcctggcc aacgtggtga 2040
aaccccatct ctactaaaaa tacaaaaatt agccgggtag taggtaggcg cgcgcctgtt 2100
gtcttagcta ctcaggaggc tgaggcagga gaatcgcttg aaaacaggag gtggaggttg 2160
cagtgagccg agatcacgcc actgcactcc agcctggtga cagcgtgaga ctctttaaaa 2220
aaagaaatta aaagagttga gacaaacgtt tcctacattc ttttccatgt gtaaaatcat 2280
gaaaaagcct gtcaccggac ttgcattgga tgagatgagt cagaccaaaa cagtggccac 2340
ccgtcttcct cctgtgagcc taagtgcagc cgtgctagct gcgcaccgtg gctaaggatg 2400
acgtctgtgt tcctgtccat cactgatgct gctggctact gcatgtgcca cacctgtctg 2460
ttcgccattc ctaacattct gtttcattct tcctcgggag atatttcaaa catttggtct 2520
tttcttttaa cactgagggt aggcccttag gaaatttatt taggaaagtc tgaacacgtt 2580
atcacttggt tttctggaaa gtagcttacc ctagaaaaca gctgcaaatg ccagaaagat 2640
gatccctaaa aatgttgagg gacttctgtt cattcatccc gagaacattg gcttccacat 2700
cacagtatct acccttacat ggtttaggat taaagccagg caatctttta ctatg 2755
<210>82
<211>9
<212>PRT
<213>人
<400>82
Gly Ser Glu Asn Leu Tyr Phe Gln Leu
5
<210>83
<211>2897
<212>DNA
<213>人
<400>83
cccgcactaa agacgcttct tcccggcggg taggaatccc gccggcgagc cgaacagttc 60
cccgagcgca gcccgcggac caccacccgg ccgcacgggc cgcttttgtc ccccgcccgc 120
cgcttctgtc cgagaggccg cccgcgaggc gcatcctgac cgcgagcgtc gggtcccaga 180
gccgggcgcg gctggggccc gaggctagca tctctcggga gccgcaaggc gagagctgca 240
aagtttaatt agacacttca gaattttgat cacctaatgt tgatttcaga tgtaaaagtc 300
aagagaagac tctaaaaata gcaaagatgc ttttgagcca gaatgccttc atcttcagat 360
cacttaattt ggttctcatg gtgtatatca gcctcgtgtt tggtatttca tatgattcgc 420
ctgattacac agatgaatct tgcactttca agatatcatt gcgaaatttc cggtccatct 480
tatcatggga attaaaaaac cactccattg taccaactca ctatacattg ctgtatacaa 540
tcatgagtaa accagaagat ttgaaggtgg ttaagaactg tgcaaatacc acaagatcat 600
tttgtgacct cacagatgag tggagaagca cacacgaggc ctatgtcacc gtcctagaag 660
gattcagcgg gaacacaacg ttgttcagtt gctcacacaa tttctggctg gccatagaca 720
tgtcttttga accaccagag tttgagattg ttggttttac caaccacatt aatgtgatgg 780
tgaaatttcc atctattgtt gaggaagaat tacagtttga tttatctctc gtcattgaag 840
aacagtcaga gggaattgtt aagaagcata aacccgaaat aaaaggaaac atgagtggaa 900
atttcaccta tatcattgac aagttaattc caaacacgaa ctactgtgta tctgtttatt 960
tagagcacag tgatgagcaa gcagtaataa agtctccctt aaaatgcacc ctccttccac 1020
ctggccagga atcagaatca gcagaatctg ccaaaatagg aggaataatt actgtgtttt 1080
tgatagcatt ggtcttgaca agcaccatag tgacactgaa atggattggt tatatatgct 1140
taagaaatag cctccccaaa gtcttgaatt ttcataactt tttagcctgg ccatttccta 1200
acctgccacc gttggaagcc atggatatgg tggaggtcat ttacatcaac agaaagaaga 1260
aagtgtggga ttataattat gatgatgaaa gtgatagcga tactgaggca gcgcccagga 1320
caagtggcgg tggctatacc atgcatggac tgactgtcag gcctctgggt caggcctctg 1380
ccacctctac agaatcccag ttgatagacc cggagtccga ggaggagcct gacctgcctg 1440
aggttgatgt ggagctcccc acgatgccaa aggacagccc tcagcagttg gaactcttga 1500
gtgggccctg tgagaggaga aagagtccac tccaggaccc ttttcccgaa gaggactaca 1560
gctccacgga ggggtctggg ggcagaatta ccttcaatgt ggacttaaac tctgtgtttt 1620
tgagagttct tgatgacgag gacagtgacg acttagaagc ccctctgatg ctatcgtctc 1680
atctggaaga gatggttgac ccagaggatc ctgataatgt gcaatcaaac catttgctgg 1740
ccagcgggga agggacacag ccaacctttc ccagcccctc ttcagagggc ctgtggtccg 1800
aagatgctcc atctgatcaa agtgacactt ctgagtcaga tgttgacctt ggggatggtt 1860
atataatgag atgactccaa aactattgaa tgaacttgga cagacaagca cctacagggt 1920
tctttgtctc tgcatcctaa cttgctgcct tatcgtctgc aagtgttctc caagggaagg 1980
aggaggaaac tgtggtgttc ctttcttcca ggtgacatca cctatgcaca ttcccagtat 2040
ggggaccata gtatcattca gtgcattgtt tacatattca aagtggtgca ctttgaagga 2100
agcacatgtg cacctttcct ttacactaat gcacttagga tgtttctgca tcatgtctac 2160
cagggagcag ggttccccac agtttcagag gtggtccagg accctatgat atttctcttc 2220
tttcgttctt tttttttttt ttttgagaca gagtctcgtt ctgtcgccca agctggagcg 2280
caatggtgtg atcttggctc actgcaacat ccgcctcccg ggttcaggtg attctcctgc 2340
ctcagcctcc ctcgcaagta gctgggatta caggcgcctg ccaccatgcc tagcaaattt 2400
ttgtattttt agtggagaca ggattttacc atgttggcca ggctggtctc gaactcctga 2460
cctcaagtga tctgccctcc tcagcctcgt aaagtgctgg gattacaggg gtgagccgct 2520
gtgcctggct ggccctgtga tatttctgtg aaataaattg ggccagggtg ggagcaggga 2580
aagaaaagga aaatagtagc aagagctgca aagcaggcag gaagggagga ggagagccag 2640
gtgagcagtg gagagaaggg gggccctgca caaggaaaca gggaagagcc atcgaagttt 2700
cagtcggtga gccttgggca cctcacccat gtcacatcct gtctcctgca attggaattc 2760
caccttgtcc agccctcccc agttaaagtg gggaagacag actttaggat cacgtgtgtg 2820
actaatacag aaaggaaaca tggcgtcggg gagagggata aaacctgaat gccatatttt 2880
aagttaaaaa aaaaaaa 2897
<210>84
<211>3054
<212>PRT
<213>人
<400>84
Met Ala Leu Ile Phe Gly Thr Val Asn Ala Asn Ile Leu Lys Glu Val
1 5 10 15
Phe Gly Gly Ala Arg Met Ala Cys Val Thr Ser Ala His Met Ala Gly
20 25 30
Ala Asn Gly Ser Ile Leu Lys Lys Ala Glu Glu Thr Ser Arg Ala Ile
35 40 45
Met His Lys Pro Val Ile Phe Gly Glu Asp Tyr Ile Thr Glu Ala Asp
50 55 60
Leu Pro Tyr Thr Pro Leu His Leu Glu Val Asp Ala Glu Met Glu Arg
65 70 75 80
Met Tyr Tyr Leu Gly Arg Arg Ala Leu Thr His Gly Lys Arg Arg Lys
85 90 95
Val Ser Val Asn Asn Lys Arg Asn Arg Arg Arg Lys Val Ala Lys Thr
100 105 110
Tyr Val Gly Arg Asp Ser Ile Val Glu Lys Ile Val Val Pro His Thr
115 120 125
Glu Arg Lys Val Asp Thr Thr Ala Ala Val Glu Asp Ile Cys Asn Glu
130 1351 40
Ala Thr Thr Gln Leu Val His Asn Ser Met Pro Lys Arg Lys Lys Gln
145 150 155 160
Lys Asn Phe Leu Pro Ala Thr Ser Leu Ser Asn Val Tyr Ala Gln Thr
165 170 175
Trp Ser Ile Val Arg Lys Arg His Met Gln Val Glu Ile Ile Ser Lys
180 185 190
Lys Ser Val Arg Ala Arg Val Lys Arg Phe Glu Gly Ser Val Gln Leu
195 200 205
Phe Ala Ser Val Arg His Met Tyr Gly Glu Arg Lys Arg Val Asp Leu
210 215 220
Arg Ile Asp Asn Trp Gln Gln Glu Thr Leu Leu Asp Leu Ala Lys Arg
225 230 235 240
Phe Lys Asn Glu Arg Val Asp Gln Ser Lys Leu Thr Phe Gly Ser Ser
245 250 255
Gly Leu Val Leu Arg Gln Gly Ser Tyr Gly Pro Ala His Trp Tyr Arg
260 265 270
His Gly Met Phe Ile Val Arg Gly Arg Ser Asp Gly Met Leu Val Asp
275 280 285
Ala Arg Ala Lys Val Thr Phe Ala Val Cys His Ser Met Thr His Tyr
290 295 300
Ser Asp Lys Ser Ile Ser Glu Ala Phe Phe Ile Pro Tyr Ser Lys Lys
305 310 315 320
Phe Leu Glu Leu Arg Pro Asp Gly Ile Ser His Glu Cys Thr Arg Gly
325 330 335
Val Ser Val Glu Arg Cys Gly Glu Val Ala Ala Ile Leu Thr Gln Ala
340 345 350
Leu Ser Pro Cys Gly Lys Ile Thr Cys Lys Arg Cys Met Val Glu Thr
355 360 365
Pro Asp Ile Val Glu Gly Glu Ser Gly Glu Ser Val Thr Asn Gln Gly
370 375 380
Lys Leu Leu Ala Met Leu Lys Glu Gln Tyr Pro Asp Phe Pro Met Ala
385 390 395 400
Glu Lys Leu Leu Thr Arg Phe Leu Gln Gln Lys Ser Leu Val Asn Thr
405 410 415
Asn Leu Thr Ala Cys Val Ser Val Lys Gln Leu Ile Gly Asp Arg Lys
420 425 430
Gln Ala Pro Phe Thr His Val Leu Ala Val Ser Glu Ile Leu Phe Lys
435 440 445
Gly Asn LysLeu Thr Gly Ala Asp Leu Glu Glu Ala Ser Thr His Met
450 455 460
Leu Glu Ile Ala Arg Phe Leu Asn Asn Arg Thr Glu Asn Met Arg Ile
465 470 475 480
Gly His Leu Gly Ser Phe Arg Asn Lys Ile Ser Ser Lys Ala His Val
485 490 495
Asn Asn Ala Leu Met Cys Asp Asn Gln Leu Asp Gln Asn Gly Asn Phe
500 505 510
Ile Trp Gly Leu Arg Gly Ala His Ala Lys Arg Phe Leu Lys Gly Phe
515 520 525
Phe Thr Glu Ile Asp Pro Asn Glu Gly Tyr Asp Lys Tyr Val Ile Arg
530 535 540
Lys His Ile Arg Gly Ser Arg Lys Leu Ala Ile Gly Asn Leu Ile Met
545 550 555 560
Ser Thr Asp Phe Gln Thr Leu Arg Gln Gln Ile Gln Gly Glu Thr Ile
565 570 575
Glu Arg Lys Glu Ile Gly Asn His Cys Ile Ser Met Arg Asn Gly Asn
580 585 590
Tyr Val Tyr Pro Cys Cys Cys Val Thr Leu Glu Asp Gly Lys Ala Gln
595 600 605
Tyr Ser Asp Leu Lys His Pro Thr Lys Arg His Leu Val Ile Gly Asn
610 615 620
Ser Gly Asp Ser Lys Tyr Leu Asp Leu Pro Val Leu Asn Glu Glu Lys
625 630 635 640
Met Tyr Ile Ala Asn Glu Gly Tyr Cys Tyr Met Asn Ile Phe Phe Ala
645 650 655
Leu Leu Val Asn Val Lys Glu Glu Asp Ala Lys Asp Phe Thr Lys Phe
660 665 670
Ile Arg Asp Thr Ile Val Pro Lys Leu Gly Ala Trp Pro Thr Met Gln
675 680 685
Asp Val Ala Thr Ala Cys Tyr Leu Leu Ser Ile Leu Tyr Pro Asp Val
690 695 700
Leu Arg Ala Glu Leu Pro Arg Ile Leu Val Asp His Asp Asn Lys Thr
705 710 715 720
Met His Val Leu Asp Ser Tyr Gly Ser Arg Thr Thr Gly Tyr His Met
725 730 735
Leu Lys Met Asn Thr Thr Ser Gln Leu Ile Glu Phe Val His Ser Gly
740 745 750
Leu Glu Ser Glu Met Lys Thr Tyr Asn Val Gly Gly Met Asn Arg Asp
755 760 765
Val Val Thr Gln Gly Ala Ile Glu Met Leu Ile Lys Ser Ile Tyr Lys
770 775 780
Pro His Leu Met Lys Gln Leu Leu Glu Glu Glu Pro Tyr Ile Ile Val
785 790 795 800
Leu Ala Ile Val Ser Pro Ser Ile Leu Ile Ala Met Tyr Asn Ser Gly
805 810 815
Thr Phe Glu Gln Ala Leu Gln Met Trp Leu Pro Asn Thr Met Arg Leu
820 825 830
Ala Asn Leu Ala Ala Ile Leu Ser Ala Leu Ala Gln Lys Leu Thr Leu
835 840 845
Ala Asp Leu Phe Val Gln Gln Arg Asn Leu Ile Asn Glu Tyr Ala Gln
850 855 860
Val Ile Leu Asp Asn Leu Ile Asp Gly Val Arg Val Asn His Ser Leu
865 870 875 880
Ser Leu Ala Met Glu Ile Val Thr Ile Lys Leu Ala Thr Gln Glu Met
885 890 895
Asp Met Ala Leu Arg Glu Gly Gly Tyr Ala Val Thr Ser Glu Lys Val
900 905 910
His Glu Met Leu Glu Lys Asn Tyr Val Lys Ala Leu Lys Asp Ala Trp
915 920 925
Asp Glu Leu Thr Trp Leu Glu Lys Phe Ser Ala Ile Arg His Ser Arg
930 935 940
Lys Leu Leu Lys Phe Gly Arg Lys Pro Leu Ile Met Lys Asn Thr Val
945 950 955 960
Asp Cys Gly Gly His Ile Asp Leu Ser Val Lys Ser Leu Phe Lys Phe
965 970 975
His Leu Glu Leu Leu Lys Gly Thr Ile Ser Arg Ala Val Asn Gly Gly
980 985 990
Ala Arg Lys Val Arg Val Ala Lys Asn Ala Met Thr Lys Gly Val Phe
995 1000 1005
Leu Lys Ile Tyr Ser Met Leu Pro Asp Val Tyr Lys Phe Ile Thr
1010 1015 1020
Val Ser Ser Val Leu Ser Leu Leu Leu Thr Phe Leu Phe Gln Ile
1025 1030 1035
Asp Cys Met Ile Arg Ala His Arg Glu Ala Lys Val Ala Ala Gln
1040 1045 1050
Leu Gln Lys Glu Ser Glu Trp Asp Asn Ile Ile Asn Arg Thr Phe
1055 1060 1065
Gln Tyr Ser Lys Leu Glu Asn Pro Ile Gly Tyr Arg Ser Thr Ala
1070 1075 1080
Glu Glu Arg Leu Gln Ser Glu His Pro Glu Ala Phe Glu Tyr Tyr
1085 1090 1095
Lys Phe Cys Ile Gly Lys Glu Asp Leu Val Glu Gln Ala Lys Gln
1100 1105 1110
Pro Glu Ile Ala Tyr Phe Glu Lys Ile Ile Ala Phe Ile Thr Leu
1115 1120 1125
Val Leu Met Ala Phe Asp Ala Glu Arg Ser Asp Gly Val Phe Lys
1130 1135 1140
Ile Leu Asn Lys Phe Lys Gly Ile Leu Ser Ser Thr Glu Arg Glu
1145 1150 1155
Ile Ile Tyr Thr Gln Ser Leu Asp Asp Tyr Val Thr Thr Phe Asp
1160 1165 1170
Asp Asn Met Thr Ile Asn Leu Glu Leu Asn Met Asp Glu Leu His
1175 1180 1185
Lys Thr Ser Leu Pro Gly Val Thr Phe Lys Gln Trp Trp Asn Asn
1190 1195 1200
Gln Ile Ser Arg Gly Asn Val Lys Pro His Tyr Arg Thr Glu Gly
1205 1210 1215
His Phe Met Glu Phe Thr Arg Asp Thr Ala Ala Ser Val Ala Ser
1220 1225 1230
Glu Ile Ser His Ser Pro Ala Arg Asp Phe Leu Val Arg Gly Ala
1235 1240 1245
Val Gly Ser Gly Lys Ser Thr Gly Leu Pro Tyr His Leu Ser Lys
1250 1255 1260
Arg Gly Arg Val Leu Met Leu Glu Pro Thr Arg Pro Leu Thr Asp
1265 1270 1275
Asn Met His Lys Gln Leu Arg Ser Glu Pro Phe Asn Cys Phe Pro
1280 1285 1290
Thr Leu Arg Met Arg Gly Lys Ser Thr Phe Gly Ser Ser Pro Ile
1295 1300 1305
Thr Val Met Thr Ser Gly Phe Ala Leu His His Phe Ala Arg Asn
1310 1315 1320
Ile Ala Glu Val Lys Thr Tyr Asp Phe Val Ile Ile Asp Glu Cys
1325 1330 1335
His Val Asn Asp Ala Ser Ala Ile Ala Phe Arg Asn Leu Leu Phe
1340 1345 1350
Glu His Glu Phe Glu Gly Lys Val Leu Lys Val Ser Ala Thr Pro
1355 1360 1365
Pro Gly Arg Glu Val Glu Phe Thr Thr Gln Phe Pro Val Lys Leu
1370 1375 1380
Lys Ile Glu Glu Ala Leu Ser Phe Gln Glu Phe Val Ser Leu Gln
1385 1390 1395
Gly Thr Gly Ala Asn Ala Asp Val Ile Ser Cys Gly Asp Asn Ile
1400 1405 1410
Leu Val Tyr Val Ala Ser Tyr Asn Asp Val Asp Ser Leu Gly Lys
1415 1420 1425
Leu Leu Val Gln Lys Gly Tyr Lys Val Ser Lys Ile Asp Gly Arg
1430 1435 1440
Thr Met Lys Ser Gly Gly Thr Glu Ile Ile Thr Glu Gly Thr Ser
1445 1450 1455
Val Lys Lys His Phe Ile Val Ala Thr Asn Ile Ile Glu Asn Gly
1460 1465 1470
Val Thr Ile Asp Ile Asp Val Val Val Asp Phe Gly Thr Lys Val
1475 1480 1485
Val Pro Val Leu Asp Val Asp Asn Arg Ala Val Gln Tyr Asn Lys
1490 1495 1500
Thr Val Val Ser Tyr Gly Glu Arg Ile Gln Lys Leu Gly Arg Val
1505 1510 1515
Gly Arg His Lys Glu Gly Val Ala Leu Arg Ile Gly Gln Thr Asn
1520 1525 1530
Lys Thr Leu Val Glu Ile Pro Glu Met Val Ala Thr Glu Ala Ala
1535 1540 1545
Phe Leu Cys Phe Met Tyr Asn Leu Pro Val Thr Thr Gln Ser Val
1550 1555 1560
Ser Thr Thr Leu Leu Glu Asn Ala Thr Leu Leu Gln Ala Arg Thr
1565 1570 1575
Met Ala Gln Phe Glu Leu Ser Tyr Phe Tyr Thr Ile Asn Phe Val
1580 1585 1590
Arg Phe Asp Gly Ser Met His Pro Val Ile His Asp Lys Leu Lys
1595 1600 1605
Arg Phe Lys Leu His Thr Cys Glu Thr Phe Leu Asn Lys Leu Ala
1610 1615 1620
Ile Pro Asn Lys Gly Leu Ser Ser Trp Leu Thr Ser Gly Glu Tyr
1625 1630 1635
Lys Arg Leu Gly Tyr Ile Ala Glu Asp Ala Gly Ile Arg Ile Pro
1640 1645 1650
Phe Val Cys Lys Glu Ile Pro Asp Ser Leu His Glu Glu Ile Trp
1655 1660 1665
His Ile Val Val Ala His Lys Gly Asp Ser Gly Ile Gly Arg Leu
1670 1675 1680
Thr Ser Val Gln Ala Ala Lys Val Val Tyr Thr Leu Gln Thr Asp
1685 1690 1695
Val His Ser Ile Ala Arg Thr Leu Ala Cys Ile Asn Arg Arg Ile
1700 1705 1710
Ala Asp Glu Gln Met Lys Gln Ser His Phe Glu Ala Ala Thr Gly
1715 1720 1725
Arg Ala Phe Ser Phe Thr Asn Tyr Ser Ile Gln Ser Ile Phe Asp
1730 1735 1740
Thr Leu Lys Ala Asn Tyr Ala Thr Lys His Thr Lys Glu Asn Ile
1745 1750 1755
Ala Val Leu Gln Gln Ala Lys Asp Gln Leu Leu Glu Phe Ser Asn
1760 1765 1770
Leu Ala Lys Asp Gln Asp Val Thr Gly Ile Ile Gln Asp Phe Asn
1775 1780 1785
His Leu Glu Thr Ile Tyr Leu Gln Ser Asp Ser Glu Val Ala Lys
1790 1795 1800
His Leu Lys Leu Lys Ser His Trp Asn Lys Ser Gln Ile Thr Arg
1805 1810 1815
Asp Ile Ile Ile Ala Leu Ser Val Leu Ile Gly Gly Gly Trp Met
1820 1825 1830
Leu Ala Thr Tyr Phe Lys Asp Lys Phe Asn Glu Pro Val Tyr Phe
1835 1840 1845
Gln Gly Lys Lys Asn Gln Lys His Lys Leu Lys Met Arg Glu Ala
1850 1855 1860
Arg Gly Ala Arg Gly Gln Tyr Glu Val Ala Ala Glu Pro Glu Ala
1865 1870 1875
Leu Glu His Tyr Phe Gly Ser Ala Tyr Asn Asn Lys Gly Lys Arg
1880 1885 1890
Lys Gly Thr Thr Arg Gly Met Gly Ala Lys Ser Arg Lys Phe Ile
1895 1900 1905
Asn Met Tyr Gly Phe Asp Pro Thr Asp Phe Ser Tyr Ile Arg Phe
1910 1915 1920
Val Asp Pro Leu Thr Gly His Thr Ile Asp Glu Ser Thr Asn Ala
1925 1930 1935
Pro Ile Asp Leu Val Gln His Glu Phe Gly Lys Val Arg Thr Arg
1940 1945 1950
Met Leu Ile Asp Asp Glu Ile Glu Pro Gln Ser Leu Ser Thr His
1955 1960 1965
Thr Thr Ile His Ala Tyr Leu Val Asn Ser Gly Thr Lys Lys Val
1970 1975 1980
Leu Lys Val Asp Leu Thr Pro His Ser Ser Leu Arg Ala Ser Glu
1985 1990 1995
Lys Ser Thr Ala Ile Met Gly Phe Pro Glu Arg Glu Asn Glu Leu
2000 2005 2010
Arg Gln Thr Gly Met Ala Val Pro Val Ala Tyr Asp Gln Leu Pro
2015 2020 2025
Pro Lys Asn Glu Asp Leu Thr Phe Glu Gly Glu Ser Leu Phe Lys
2030 2035 2040
Gly Pro Arg Asp Tyr Asn Pro Ile Ser Ser Thr Ile Cys His Leu
2045 2050 2055
Thr Asn Glu Ser Asp Gly His Thr Thr Ser Leu Tyr Gly Ile Gly
2060 2065 2070
Phe Gly Pro Phe Ile Ile Thr Asn Lys His Leu Phe Arg Arg Asn
2075 2080 2085
Asn Gly Thr Leu Leu Val Gln Ser Leu His Gly Val Phe Lys Val
2090 2095 2100
Lys Asn Thr Thr Thr Leu Gln Gln His Leu Ile Asp Gly Arg Asp
2105 2110 2115
Met Ile Ile Ile Arg Met Pro Lys Asp Phe Pro Pro Phe Pro Gln
2120 2125 2130
Lys Leu Lys Phe Arg Glu Pro Gln Arg Glu Glu Arg Ile Cys Leu
2135 2140 2145
Val Thr Thr Asn Phe Gln Thr Lys Ser Met Ser Ser Met Val Ser
2150 2155 2160
Asp Thr Ser Cys Thr Phe Pro Ser Ser Asp Gly Ile Phe Trp Lys
2165 2170 2175
His Trp Ile Gln Thr Lys Asp Gly Gln Cys Gly Ser Pro Leu Val
2180 2185 2190
Ser Thr Arg Asp Gly Phe Ile Val Gly Ile His Ser Ala Ser Asn
2195 2200 2205
Phe Thr Asn Thr Asn Asn Tyr Phe Thr Ser Val Pro Lys Asn Phe
2210 2215 2220
Met Glu Leu Leu Thr Asn Gln Glu Ala Gln Gln Trp Val Ser Gly
2225 2230 2235
Trp Arg Leu Asn Ala Asp Ser Val Leu Trp Gly Gly His Lys Val
2240 2245 2250
Phe Met Ser Lys Pro Glu Glu Pro Phe Gln Pro Val Lys Glu Ala
2255 2260 2265
Thr Gln Leu Met Asn Glu Leu Val Tyr Ser Gln Gly Glu Lys Arg
2270 2275 2280
Lys Trp Val Val Glu Ala Leu Ser Gly Asn Leu Arg Pro Val Ala
2285 2290 2295
Glu Cys Pro Ser Gln Leu Val Thr Lys His Val Val Lys Gly Lys
2300 2305 2310
Cys Pro Leu Phe Glu Leu Tyr Leu Gln Leu Asn Pro Glu Lys Glu
2315 2320 2325
Ala Tyr Phe Lys Pro Met Met Gly Ala Tyr Lys Pro Ser Arg Leu
2330 2335 2340
Asn Arg Glu Ala Phe Leu Lys Asp Ile Leu Lys Tyr Ala Ser Glu
2345 2350 2355
Ile Glu Ile Gly Asn Val Asp Cys Asp Leu Leu Glu Leu Ala Ile
2360 2365 2370
Ser Met Leu Val Thr Lys Leu Lys Ala Leu Gly Phe Pro Thr Val
2375 2380 2385
Asn Tyr Ile Thr Asp Pro Glu Glu Ile Phe Ser Ala Leu Asn Met
2390 2395 2400
Lys Ala Ala Met Gly Ala Leu Tyr Lys Gly Lys Lys Lys Glu Ala
2405 2410 2415
Leu Ser Glu Leu Thr Leu Asp Glu Gln Glu Ala Met Leu Lys Ala
2420 2425 2430
Ser Cys Leu Arg Leu Tyr Thr Gly Lys Leu Gly Ile Trp Asn Gly
2435 2440 2445
Ser Leu Lys Ala Glu Leu Arg Pro Ile Glu Lys Val Glu Asn Asn
2450 2455 2460
Lys Thr Arg Thr Phe Thr Ala Ala Pro Ile Asp Thr Leu Leu Ala
2465 2470 2475
Gly Lys Val Cys Val Asp Asp Phe Asn Asn Gln Phe Tyr Asp Leu
2480 2485 2490
Asn Ile Lys Ala Pro Trp Thr Val Gly Met Thr Lys Phe Tyr Gln
2495 2500 2505
Gly Trp Asn Glu Leu Met Glu Ala Leu Pro Ser Gly Trp Val Tyr
2510 2515 2520
Cys Asp Ala Asp Gly Ser Gln Phe Asp Ser Ser Leu Thr Pro Phe
2525 2530 2535
Leu Ile Asn Ala Val Leu Lys Val Arg Leu Ala Phe Met Glu Glu
2540 2545 2550
Trp Asp Ile Gly Glu Gln Met Leu Arg Asn Leu Tyr Thr Glu Ile
2555 2560 2565
Val Tyr Thr Pro Ile Leu Thr Pro Asp Gly Thr Ile Ile Lys Lys
2570 2575 2580
His Lys Gly Asn Asn Ser Gly Gln Pro Ser Thr Val Val Asp Asn
2585 2590 2595
Thr Leu Met Val Ile Ile Ala Met Leu Tyr Thr Cys Glu Lys Cys
2600 2605 2610
Gly Ile Asn Lys Glu Glu Ile Val Tyr Tyr Val Asn Gly Asp Asp
2615 2620 2625
Leu Leu Ile Ala Ile His Pro Asp Lys Ala Glu Arg Leu Ser Arg
2630 2635 2640
Phe Lys Glu Ser Phe Gly Glu Leu Gly Leu Lys Tyr Glu Phe Asp
2645 2650 2655
Cys Thr Thr Arg Asp Lys Thr Gln Leu Trp Phe Met Ser His Arg
2660 2665 2670
Ala Leu Glu Arg Asp Gly Met Tyr Ile Pro Lys Leu Glu Glu Glu
2675 2680 2685
Arg Ile Val Ser Ile Leu Glu Trp Asp Arg Ser Lys Glu Pro Ser
2690 2695 2700
His Arg Leu Glu Ala Ile Cys Ala Ser Met Ile Glu Ala Trp Gly
2705 2710 2715
Tyr Asp Lys Leu Val Glu Glu Ile Arg Asn Phe Tyr Ala Trp Val
2720 2725 2730
Leu Glu Gln Ala Pro Tyr Ser Gln Leu Ala Glu Glu Gly Lys Ala
2735 2740 2745
Pro Tyr Leu Ala Glu Thr Ala Leu Lys Phe Leu Tyr Thr Ser Gln
2750 2755 2760
His Gly Thr Asn Ser Glu Ile Glu Glu Tyr Leu Lys Val Leu Tyr
2765 2770 2775
Asp Tyr Asp Ile Pro Thr Thr Glu Asn Leu Tyr Phe Gln Ser Gly
2780 2785 2790
Thr Val Asp Ala Gly Ala Asp Ala Gly Lys Lys Lys Asp Gln Lys
2795 2800 2805
Asp Asp Lys Val Ala Glu Gln Ala Ser Lys Asp Arg Asp Val Asn
2810 2815 2820
Ala Gly Thr Ser Gly Thr Phe Ser Val Pro Arg Ile Asn Ala Met
2825 2830 2835
Ala Thr Lys Leu Gln Tyr Pro Arg Met Arg Gly Glu Val Val Val
2840 2845 2850
Asn Leu Asn His Leu Leu Gly Tyr Lys Pro Gln Gln Ile Asp Leu
2855 2860 2865
Ser Asn Ala Ar gAla Thr His Glu Gln Phe Ala Ala Trp His Gln
2870 2875 2880
Ala Val Met Thr Ala Tyr Gly Val Asn Glu Glu Gln Met Lys Ile
2885 2890 2895
Leu Leu Asn Gly Phe Met Val Trp Cys Ile Glu Asn Gly Thr Ser
2900 2905 2910
Pro Asn Leu Asn Gly Thr Trp Val Met Met Asp Gly Glu Asp Gln
2915 2920 2925
Val Ser Tyr Pro Leu Lys Pro Met Val Glu Asn Ala Gln Pro Thr
2930 2935 2940
Leu Arg Gln Ile Met Thr His Phe Ser Asp Leu Ala Glu Ala Tyr
2945 2950 2955
Ile Glu Met Arg Asn Arg Glu Arg Pro Tyr Met Pro Arg Tyr Gly
2960 2965 2970
Leu Gln Arg Asn Ile Thr Asp Met Ser Leu Ser Arg Tyr Ala Phe
2975 2980 2985
Asp Phe Tyr Glu Leu Thr Ser Lys Thr Pro Val Arg Ala Arg Glu
2990 2995 3000
Ala His Met Gln Met Lys Ala Ala Ala Val Arg Asn Ser Gly Thr
3005 3010 3015
Arg Leu Phe Gly Leu Asp Gly Asn Val Gly Thr Ala Glu Glu Asp
3020 3025 3030
Thr Glu Arg His Thr Ala His Asp Val Asn Arg Asn Met His Thr
3035 3040 3045
Leu Leu Gly Val Arg Gln
3050
<210>85
<211>4157
<212>DNA
<213>人
<400>85
agcggggcgg ggcgccagcg ctgccttttc tcctgccggg tagtttcgct ttcctgcgca 60
gagtctgcgg aggggctcgg ctgcaccggg gggatcgcgc ctggcagacc ccagaccgag 120
cagaggcgac ccagcgcgct cgggagaggc tgcaccgccg cgcccccgcc tagcccttcc 180
ggatcctgcg cgcagaaaag tttcatttgc tgtatgccat cctcgagagc tgtctaggtt 240
aacgttcgca ctctgtgtat ataacctcga cagtcttggc acctaacgtg ctgtgcgtag 300
ctgctccttt ggttgaatcc ccaggccctt gttggggcac aaggtggcag gatgtctcag 360
tggtacgaac ttcagcagct tgactcaaaa ttcctggagc aggttcacca gctttatgat 420
gacagttttc ccatggaaat cagacagtac ctggcacagt ggttagaaaa gcaagactgg 480
gagcacgctg ccaatgatgt ttcatttgcc accatccgtt ttcatgacct cctgtcacag 540
ctggatgatc aatatagtcg cttttctttg gagaataact tcttgctaca gcataacata 600
aggaaaagca agcgtaatct tcaggataat tttcaggaag acccaatcca gatgtctatg 660
atcatttaca gctgtctgaa ggaagaaagg aaaattctgg aaaacgccca gagatttaat 720
caggctcagt cggggaatat tcagagcaca gtgatgttag acaaacagaa agagcttgac 780
agtaaagtca gaaatgtgaa ggacaaggtt atgtgtatag agcatgaaat caagagcctg 840
gaagatttac aagatgaata tgacttcaaa tgcaaaacct tgcagaacag agaacacgag 900
accaatggtg tggcaaagag tgatcagaaa caagaacagc tgttactcaa gaagatgtat 960
ttaatgcttg acaataagag aaaggaagta gttcacaaaa taatagagtt gctgaatgtc 1020
actgaactta cccagaatgc cctgattaat gatgaactag tggagtggaa gcggagacag 1080
cagagcgcct gtattggggg gccgcccaat gcttgcttgg atcagctgca gaactggttc 1140
actatagttg cggagagtct gcagcaagtt cggcagcagc ttaaaaagtt ggaggaattg 1200
gaacagaaat acacctacga acatgaccct atcacaaaaa acaaacaagt gttatgggac 1260
cgcaccttca gtcttttcca gcagctcatt cagagctcgt ttgtggtgga aagacagccc 1320
tgcatgccaa cgcaccctca gaggccgctg gtcttgaaga caggggtcca gttcactgtg 1380
aagttgagac tgttggtgaa attgcaagag ctgaattata atttgaaagt caaagtctta 1440
tttgataaag atgtgaatga gagaaataca gtaaaaggat ttaggaagtt caacattttg 1500
ggcacgcaca caaaagtgat gaacatggag gagtccacca atggcagtct ggcggctgaa 1560
tttcggcacc tgcaattgaa agaacagaaa aatgctggca ccagaacgaa tgagggtcct 1620
ctcatcgtta ctgaagagct tcactccctt agttttgaaa cccaattgtg ccagcctggt 1680
ttggtaattg acctcgagac gacctctctg cccgttgtgg tgatctccaa cgtcagccag 1740
ctcccgagcg gttgggcctc catcctttgg tacaacatgc tggtggcgga acccaggaat 1800
ctgtccttct tcctgactcc accatgtgca cgatgggctc agctttcaga agtgctgagt 1860
tggcagtttt cttctgtcac caaaagaggt ctcaatgtgg accagctgaa catgttggga 1920
gagaagcttc ttggtcctaa cgccagcccc gatggtctca ttccgtggac gaggttttgt 1980
aaggaaaata taaatgataa aaattttccc ttctggcttt ggattgaaag catcctagaa 2040
ctcattaaaa aacacctgct ccctctctgg aatgatgggt gcatcatggg cttcatcagc 2100
aaggagcgag agcgtgccct gttgaaggac cagcagccgg ggaccttcct gctgcggttc 2160
agtgagagct cccgggaagg ggccatcaca ttcacatggg tggagcggtc ccagaacgga 2220
ggcgaacctg acttccatgc ggttgaaccc tacacgaaga aagaactttc tgctgttact 2280
ttccctgaca tcattcgcaa ttacaaagtc atggctgctg agaatattcc tgagaatccc 2340
ctgaagtatc tgtatccaaa tattgacaaa gaccatgcct ttggaaagta ttactccagg 2400
ccaaaggaag caccagagcc aatggaactt gatggcccta aaggaactgg atatatcaag 2460
actgagttga tttctgtgtc tgaagttcac ccttctagac ttcagaccac agacaacctg 2520
ctccccatgt ctcctgagga gtttgacgag gtgtctcgga tagtgggctc tgtagaattc 2580
gacagtatga tgaacacagt atagagcatg aatttttttc atcttctctg gcgacagttt 2640
tccttctcat ctgtgattcc ctcctgctac tctgttcctt cacatcctgt gtttctaggg 2700
aaatgaaaga aaggccagca aattcgctgc aacctgttga tagcaagtga atttttctct 2760
aactcagaaa catcagttac tctgaagggc atcatgcatc ttactgaagg taaaattgaa 2820
aggcattctc tgaagagtgg gtttcacaag tgaaaaacat ccagatacac ccaaagtatc 2880
aggacgagaa tgagggtcct ttgggaaagg agaagttaag caacatctag caaatgttat 2940
gcataaagtc agtgcccaac tgttataggt tgttggataa atcagtggtt atttagggaa 3000
ctgcttgacg taggaacggt aaatttctgt gggagaattc ttacatgttt tctttgcttt 3060
aagtgtaact ggcagttttc cattggttta cctgtgaaat agttcaaagc caagtttata 3120
tacaattata tcagtcctct ttcaaaggta gccatcatgg atctggtagg gggaaaatgt 3180
gtattttatt acatctttca cattggctat ttaaagacaa agacaaattc tgtttcttga 3240
gaagagaata ttagctttac tgtttgttat ggcttaatga cactagctaa tatcaataga 3300
aggatgtaca tttccaaatt cacaagttgt gtttgatatc caaagctgaa tacattctgc 3360
tttcatcttg gtcacataca attattttta cagttctccc aagggagtta ggctattcac 3420
aaccactcat tcaaaagttg aaattaacca tagatgtaga taaactcaga aatttaattc 3480
atgtttctta aatgggctac tttgtccttt ttgttattag ggtggtattt agtctattag 3540
ccacaaaatt gggaaaggag tagaaaaagc agtaactgac aacttgaata atacaccaga 3600
gataatatga gaatcagatc atttcaaaac tcatttccta tgtaactgca ttgagaactg 3660
catatgtttc gctgatatat gtgtttttca catttgcgaa tggttccatt ctctctcctg 3720
tactttttcc agacactttt ttgagtggat gatgtttcgt gaagtatact gtatttttac 3780
ctttttcctt ccttatcact gacacaaaaa gtagattaag agatgggttt gacaaggttc 3840
ttccctttta catactgctg tctatgtggc tgtatcttgt ttttccacta ctgctaccac 3900
aactatatta tcatgcaaat gctgtattct tctttggtgg agataaagat ttcttgagtt 3960
ttgttttaaa attaaagcta aagtatctgt attgcattaa atataatatg cacacagtgc 4020
tttccgtggc actgcataca atctgaggcc tcctctctca gtttttatat agatggcgag 4080
aacctaagtt tcagttgatt ttacaattga aatgactaaa aaacaaagaa gacaacatta 4140
aaacaatatt gtttcta 4157
<210>86
<211>4451
<212>DNA
<213>人
<400>86
gctcatacta gggacgggaa gtcgcgacca gagccattgg agggcgcggg gactgcaacc 60
ctaatcagca gagcccaaat ggcgcagtgg gaaatgctgc agaatcttga cagccccttt 120
caggatcagc tgcaccagct ttactcgcac agcctcctgc ctgtggacat tcgacagtac 180
ttggctgtct ggattgaaga ccagaactgg caggaagctg cacttgggag tgatgattcc 240
aaggctacca tgctattctt ccacttcttg gatcagctga actatgagtg tggccgttgc 300
agccaggacc cagagtcctt gttgctgcag cacaatttgc ggaaattctg ccgggacatt 360
cagccctttt cccaggatcc tacccagttg gctgagatga tctttaacct ccttctggaa 420
gaaaaaagaa ttttgatcca ggctcagagg gcccaattgg aacaaggaga gccagttctc 480
gaaacacctg tggagagcca gcaacatgag attgaatccc ggatcctgga tttaagggct 540
atgatggaga agctggtaaa atccatcagc caactgaaag accagcagga tgtcttctgc 600
ttccgatata agatccaggc caaagggaag acaccctctc tggaccccca tcagaccaaa 660
gagcagaaga ttctgcagga aactctcaat gaactggaca aaaggagaaa ggaggtgctg 720
gatgcctcca aagcactgct aggccgatta actaccctaa tcgagctact gctgccaaag 780
ttggaggagt ggaaggccca gcagcaaaaa gcctgcatca gagctcccat tgaccacggg 840
ttggaacagc tggagacatg gttcacagct ggagcaaagc tgttgtttca cctgaggcag 900
ctgctgaagg agctgaaggg actgagttgc ctggttagct atcaggatga ccctctgacc 960
aaaggggtgg acctacgcaa cgcccaggtc acagagttgc tacagcgtct gctccacaga 1020
gcctttgtgg tagaaaccca gccctgcatg ccccaaactc cccatcgacc cctcatcctc 1080
aagactggca gcaagttcac cgtccgaaca aggctgctgg tgagactcca ggaaggcaat 1140
gagtcactga ctgtggaagt ctccattgac aggaatcctc ctcaattaca aggcttccgg 1200
aagttcaaca ttctgacttc aaaccagaaa actttgaccc ccgagaaggg gcagagtcag 1260
ggtttgattt gggactttgg ttacctgact ctggtggagc aacgttcagg tggttcagga 1320
aagggcagca ataaggggcc actaggtgtg acagaggaac tgcacatcat cagcttcacg 1380
gtcaaatata cctaccaggg tctgaagcag gagctgaaaa cggacaccct ccctgtggtg 1440
attatttcca acatgaacca gctctcaatt gcctgggctt cagttctctg gttcaatttg 1500
ctcagcccaa accttcagaa ccagcagttc ttctccaacc cccccaaggc cccctggagc 1560
ttgctgggcc ctgctctcag ttggcagttc tcctcctatg ttggccgagg cctcaactca 1620
gaccagctga gcatgctgag aaacaagctg ttcgggcaga actgtaggac tgaggatcca 1680
ttattgtcct gggctgactt cactaagcga gagagccctc ctggcaagtt accattctgg 1740
acatggctgg acaaaattct ggagttggta catgaccacc tgaaggatct ctggaatgat 1800
ggacgcatca tgggctttgt gagtcggagc caggagcgcc ggctgctgaa gaagaccatg 1860
tctggcacct ttctactgcg cttcagtgaa tcgtcagaag ggggcattac ctgctcctgg 1920
gtggagcacc aggatgatga caaggtgctc atctactctg tgcaaccgta cacgaaggag 1980
gtgctgcagt cactcccgct gactgaaatc atccgccatt accagttgct cactgaggag 2040
aatatacctg aaaacccact gcgcttcctc tatccccgaa tcccccggga tgaagctttt 2100
gggtgctact accaggagaa agttaatctc caggaacgga ggaaatacct gaaacacagg 2160
ctcattgtgg tctctaatag acaggtggat gaactgcaac aaccgctgga gcttaagcca 2220
gagccagagc tggagtcatt agagctggaa ctagggctgg tgccagagcc agagctcagc 2280
ctggacttag agccactgct gaaggcaggg ctggatctgg ggccagagct agagtctgtg 2340
ctggagtcca ctctggagcc tgtgatagag cccacactat gcatggtatc acaaacagtg 2400
ccagagccag accaaggacc tgtatcacag ccagtgccag agccagattt gccctgtgat 2460
ctgagacatt tgaacactga gccaatggaa atcttcagaa actgtgtaaa gattgaagaa 2520
atcatgccga atggtgaccc actgttggct ggccagaaca ccgtggatga ggtttacgtc 2580
tcccgcccca gccacttcta cactgatgga cccttgatgc cttctgactt ctaggaacca 2640
catttcctct gttcttttca tatctcttgc ccttcctact cctcatagca tgatattgtt 2700
ctccaaggat gggaatcagg catgtgtccc ttccaagctg tgttaactgt tcaaactcag 2760
gcctgtgtga ctccattggg gtgagaggtg aaagcataac atgggtacag aggggacaac 2820
aatgaatcag aacagatgct gagccatagg tctaaatagg atcctggagg ctgcctgctg 2880
tgctgggagg tataggggtc ctgggggcag gccagggcag ttgacaggta cttggagggc 2940
tcagggcagt ggcttctttc cagtatggaa ggatttcaac attttaatag ttggttaggc 3000
taaactggtg catactggca ttggcccttg gtggggagca cagacacagg ataggactcc 3060
atttctttct tccattcctt catgtctagg ataacttgct ttcttctttc ctttactcct 3120
ggctcaagcc ctgaatttct tcttttcctg caggggttga gagctttctg ccttagccta 3180
ccatgtgaaa ctctaccctg aagaaaggga tggataggaa gtagacctct ttttcttacc 3240
agtctcctcc cctactctgc ccctaagctg gctgtacctg ttcctccccc ataaaatgat 3300
cctgccaatc taatgtgagt gtgaagcttt gcacactagt ttatgctacc tagtctccac 3360
tttctcaatg cttaggagac agatcactcc tggaggctgg ggatggtagg attgctgggg 3420
attttttttt ttttaaacag ggtctcactc tgttgcccag gctagagtgc aatggtgcaa 3480
tcacagctca ctgcagcctc aacctcctgg gttcaagcaa tcctcctacc tcagcctcct 3540
gggtagctag caccatggca tgcgccacca tgccctattt ttttttttta aagacagggt 3600
cttgctatat tgcccaggct ggtcttgaac tgggctcaag tgatcctcac gccttggcct 3660
cccaaagtgc tgggattata ggcatgagcc actgtgcttg gccaggattt tttttttttt 3720
ttttttgaga tggagtttct ctcttgttgt ccaggctgga gtgcaatggt gtgatctcgg 3780
ctcactgcaa cctccgcctt ccgggttcaa gtgactctcc tgcctcagcc tccccagtag 3840
ctgggattac agatctgcac caccatgccc agctaatttt gtatttttag tagagacggg 3900
gtttctccat gttggtcagg ctggtctcga actcctgacc tcaagtgatc tgtccacctc 3960
ggcctcccag agtgctggga ttacaggcgt gagccactgt tcccagcagg aatttctttt 4020
ttatagtatt ggataaagtt tggtgttttt acagaggaga agcaatgggt cttagctctt 4080
tctctattat gttatcatcc tccctttttt gtacaatatg ttgtttacct gaaaggaagg 4140
tttctattcg ttggttgtgg acctggacaa agtccaagtc tgtggaactt aaaaccttga 4200
aggtctgtca taggactctg gacaatctca caccttagct attcccaggg aaccccaggg 4260
ggcaactgac attgctccaa gatgttctcc tgatgtagct tgagatataa aggaaaggcc 4320
ctgcacaggt ggctgtttct tgtctgttat gtcagaggaa cagtcctgtt cagaaagggg 4380
ctcttctgag cagaaatggc taataaactt tgtgctgatc tggaaaaaaa aaaaaaaaaa 4440
aaaaaaaaaa a 4451
<210>87
<211>9
<212>PRT
<213>人
<400>87
Gly Ser Glu Asn Leu Tyr Phe Gln Leu
5
<210>88
<211>27
<212>DNA
<213>人
<400>88
tctagaggcc tgatcatccg gtctcac 27
<210>89
<211>29
<212>DNA
<213>人
<400>89
tctagatgga aaacagaagt cccggaaac 29
<210>90
<211>2290
<212>DNA
<213>人
<400>90
gaattccgaa tcatgtgcag aatgctgaat cttcccccag ccaggacgaa taagacagcg 60
cggaaaagca gattctcgta attctggaat tgcatgttgc aaggagtctc ctggatcttc 120
gcacccagct tcgggtaggg agggagtccg ggtcccgggc taggccagcc cggcaggtgg 180
agagggtccc cggcagcccc gcgcgcccct ggccatgtct ttaatgccct gccccttcat 240
gtggccttct gagggttccc agggctggcc agggttgttt cccacccgcg cgcgcgctct 300
cacccccagc caaacccacc tggcagggct ccctccagcc gagacctttt gattcccggc 360
tcccgcgctc ccgcctccgc gccagcccgg gaggtggccc tggacagccg gacctcgccc 420
ggccccggct gggaccatgg tgtttctctc gggaaatgct tccgacagct ccaactgcac 480
ccaaccgccg gcaccggtga acatttccaa ggccattctg ctcggggtga tcttgggggg 540
cctcattctt ttcggggtgc tgggtaacat cctagtgatc ctctccgtag cctgtcaccg 600
acacctgcac tcagtcacgc actactacat cgtcaacctg gcggtggccg acctcctgct 660
cacctccacg gtgctgccct tctccgccat cttcgaggtc ctaggctact gggccttcgg 720
cagggtcttc tgcaacatct gggcggcagt ggatgtgctg tgctgcaccg cgtccatcat 780
gggcctctgc atcatctcca tcgaccgcta catcggcgtg agctacccgc tgcgctaccc 840
aaccatcgtc acccagagga ggggtctcat ggctctgctc tgcgtctggg cactctccct 900
ggtcatatcc attggacccc tgttcggctg gaggcagccg gcccccgagg acgagaccat 960
ctgccagatc aacgaggagc cgggctacgt gctcttctca gcgctgggct ccttctacct 1020
gcctctggcc atcatcctgg tcatgtactg ccgcgtctac gtggtggcca agagggagag 1080
ccggggcctc aagtctggcc tcaagaccga caagtcggac tcggagcaag tgacgctccg 1140
catccatcgg aaaaacgccc cggcaggagg cagcgggatg gccagcgcca agaccaagac 1200
gcacttctca gtgaggctcc tcaagttctc ccgggagaag aaagcggcca aaacgctggg 1260
catcgtggtc ggctgcttcg tcctctgctg gctgcctttt ttcttagtca tgcccattgg 1320
gtctttcttc cctgatttca agccctctga aacagttttt aaaatagtat tttggctcgg 1380
atatctaaac agctgcatca accccatcat atacccatgc tccagccaag agttcaaaaa 1440
ggcctttcag aatgtcttga gaatccagtg tctccgcaga aagcagtctt ccaaacatgc 1500
cctgggctac accctgcacc cgcccagcca ggccgtggaa gggcaacaca aggacatggt 1560
gcgcatcccc gtgggatcaa gagagacctt ctacaggatc tccaagacgg atggcgtttg 1620
tgaatggaaa tttttctctt ccatgccccg tggatctgcc aggattacag tgtccaaaga 1680
ccaatcctcc tgtaccacag cccgggtgag aagtaaaagc tttttggagg tctgctgctg 1740
tgtagggccc tcaaccccca gccttgacaa gaaccatcaa gttccaacca ttaaggtcca 1800
caccatctcc ctcagtgaga acggggagga agtctaggac aggaaagatg cagaggaaag 1860
gggaataatc ttaggtaccc accccacttc cttctcggaa ggccagctct tcttggagga 1920
caagacagga ccaatcaaag aggggacctg ctgggaatgg ggtgggtggt agacccaact 1980
catcaggcag cgggtagggc acagggaaga gggagggtgt ctcacaacca accagttcag 2040
aatgatacgg aacagcattt ccctgcagct aatgctttct tggtcactct gtgcccactt 2100
caacgaaaac caccatggga aacagaattt catgcacaat ccaaaagact ataaatatag 2160
gattatgatt tcatcatgaa tattttgagc acacactcta agtttggagc tatttcttga 2220
tggaagtgag gggattttat tttcaggctc aacctactga cagccacatt tgacatttat 2280
gccggaattc 2290
<210>91
<211>26
<212>DNA
<213>人
<400>91
ctcggatatc taaacagctg catcaa 26
<210>92
<211>29
<212>DNA
<213>人
<400>92
tctagacttt ctgcagagac actggattc 29
<210>93
<211>31
<212>DNA
<213>人
<400>93
tctagatcga aggcagtgga ggatcttcag g 31
<210>94
<211>27
<212>DNA
<213>人
<400>94
tctagaggcc tgatcatccg gtctcac 27
<210>95
<211>23
<212>DNA
<213>人
<400>95
cggatccgtt ggtactcttg agg 23
<210>96
<211>4989
<212>DNA
<213>人
<400>96
tttttttttt ttttgagaaa gggaatttca tcccaaataa aaggaatgaa gtctggctcc 60
ggaggagggt ccccgacctc gctgtggggg ctcctgtttc tctccgccgc gctctcgctc 120
tggccgacga gtggagaaat ctgcgggcca ggcatcgaca tccgcaacga ctatcagcag 180
ctgaagcgcc tggagaactg cacggtgatc gagggctacc tccacatcct gctcatctcc 240
aaggccgagg actaccgcag ctaccgcttc cccaagctca cggtcattac cgagtacttg 300
ctgctgttcc gagtggctgg cctcgagagc ctcggagacc tcttccccaa cctcacggtc 360
atccgcggct ggaaactctt ctacaactac gccctggtca tcttcgagat gaccaatctc 420
aaggatattg ggctttacaa cctgaggaac attactcggg gggccatcag gattgagaaa 480
aatgctgacc tctgttacct ctccactgtg gactggtccc tgatcctgga tgcggtgtcc 540
aataactaca ttgtggggaa taagccccca aaggaatgtg gggacctgtg tccagggacc 600
atggaggaga agccgatgtg tgagaagacc accatcaaca atgagtacaa ctaccgctgc 660
tggaccacaa accgctgcca gaaaatgtgc ccaagcacgt gtgggaagcg ggcgtgcacc 720
gagaacaatg agtgctgcca ccccgagtgc ctgggcagct gcagcgcgcc tgacaacgac 780
acggcctgtg tagcttgccg ccactactac tatgccggtg tctgtgtgcc tgcctgcccg 840
cccaacacct acaggtttga gggctggcgc tgtgtggacc gtgacttctg cgccaacatc 900
ctcagcgccg agagcagcga ctccgagggg tttgtgatcc acgacggcga gtgcatgcag 960
gagtgcccct cgggcttcat ccgcaacggc agccagagca tgtactgcat cccttgtgaa 1020
ggtccttgcc cgaaggtctg tgaggaagaa aagaaaacaa agaccattga ttctgttact 1080
tctgctcaga tgctccaagg atgcaccatc ttcaagggca atttgctcat taacatccga 1140
cgggggaata acattgcttc agagctggag aacttcatgg ggctcatcga ggtggtgacg 1200
ggctacgtga agatccgcca ttctcatgcc ttggtctcct tgtccttcct aaaaaacctt 1260
cgcctcatcc taggagagga gcagctagaa gggaattact ccttctacgt cctcgacaac 1320
cagaacttgc agcaactgtg ggactgggac caccgcaacc tgaccatcaa agcagggaaa 1380
atgtactttg ctttcaatcc caaattatgt gtttccgaaa tttaccgcat ggaggaagtg 1440
acggggacta aagggcgcca aagcaaaggg gacataaaca ccaggaacaa cggggagaga 1500
gcctcctgtg aaagtgacgt cctgcatttc acctccacca ccacgtcgaa gaatcgcatc 1560
atcataacct ggcaccggta ccggccccct gactacaggg atctcatcag cttcaccgtt 1620
tactacaagg aagcaccctt taagaatgtc acagagtatg atgggcagga tgcctgcggc 1680
tccaacagct ggaacatggt ggacgtggac ctcccgccca acaaggacgt ggagcccggc 1740
atcttactac atgggctgaa gccctggact cagtacgccg tttacgtcaa ggctgtgacc 1800
ctcaccatgg tggagaacga ccatatccgt ggggccaaga gtgagatctt gtacattcgc 1860
accaatgctt cagttccttc cattcccttg gacgttcttt cagcatcgaa ctcctcttct 1920
cagttaatcg tgaagtggaa ccctccctct ctgcccaacg gcaacctgag ttactacatt 1980
gtgcgctggc agcggcagcc tcaggacggc tacctttacc ggcacaatta ctgctccaaa 2040
gacaaaatcc ccatcaggaa gtatgccgac ggcaccatcg acattgagga ggtcacagag 2100
aaccccaaga ctgaggtgtg tggtggggag aaagggcctt gctgcgcctg ccccaaaact 2160
gaagccgaga agcaggccga gaaggaggag gctgaatacc gcaaagtctt tgagaatttc 2220
ctgcacaact ccatcttcgt gcccagacct gaaaggaagc ggagagatgt catgcaagtg 2280
gccaacacca ccatgtccag ccgaagcagg aacaccacgg ccgcagacac ctacaacatc 2340
accgacccgg aagagctgga gacagagtac cctttctttg agagcagagt ggataacaag 2400
gagagaactg tcatttctaa ccttcggcct ttcacattgt accgcatcga tatccacagc 2460
tgcaaccacg aggctgagaa gctgggctgc agcgcctcca acttcgtctt tgcaaggact 2520
atgcccgcag aaggagcaga tgacattcct gggccagtga cctgggagcc aaggcctgaa 2580
aactccatct ttttaaagtg gccggaacct gagaatccca atggattgat tctaatgtat 2640
gaaataaaat acggatcaca agttgaggat cagcgagaat gtgtgtccag acaggaatac 2700
aggaagtatg gaggggccaa gctaaaccgg ctaaacccgg ggaactacac agcccggatt 2760
caggccacat ctctctctgg gaatgggtcg tggacagatc ctgtgttctt ctatgtccag 2820
gccaaaacag gatatgaaaa cttcatccat ctgatcatcg ctctgcccgt cgctgtcctg 2880
ttgatcgtgg gagggttggt gattatgctg tacgtcttcc atagaaagag aaataacagc 2940
aggctgggga atggagtgct gtatgcctct gtgaacccgg agtacttcag cgctgctgat 3000
gtgtacgttc ctgatgagtg ggaggtggct cgggagaaga tcaccatgag ccgggaactt 3060
gggcaggggt cgtttgggat ggtctatgaa ggagttgcca agggtgtggt gaaagatgaa 3120
cctgaaacca gagtggccat taaaacagtg aacgaggccg caagcatgcg tgagaggatt 3180
gagtttctca acgaagcttc tgtgatgaag gagttcaatt gtcaccatgt ggtgcgattg 3240
ctgggtgtgg tgtcccaagg ccagccaaca ctggtcatca tggaactgat gacacggggc 3300
gatctcaaaa gttatctccg gtctctgagg ccagaaatgg agaataatcc agtcctagca 3360
cctccaagcc tgagcaagat gattcagatg gccggagaga ttgcagacgg catggcatac 3420
ctcaacgcca ataagttcgt ccacagagac cttgctgccc ggaattgcat ggtagccgaa 3480
gatttcacag tcaaaatcgg agattttggt atgacgcgag atatctatga gacagactat 3540
taccggaaag gaggcaaagg gctgctgccc gtgcgctgga tgtctcctga gtccctcaag 3600
gatggagtct tcaccactta ctcggacgtc tggtccttcg gggtcgtcct ctgggagatc 3660
gccacactgg ccgagcagcc ctaccagggc ttgtccaacg agcaagtcct tcgcttcgtc 3720
atggagggcg gccttctgga caagccagac aactgtcctg acatgctgtt tgaactgatg 3780
cgcatgtgct ggcagtataa ccccaagatg aggccttcct tcctggagat catcagcagc 3840
atcaaagagg agatggagcc tggcttccgg gaggtctcct tctactacag cgaggagaac 3900
aagctgcccg agccggagga gctggacctg gagccagaga acatggagag cgtccccctg 3960
gacccctcgg cctcctcgtc ctccctgcca ctgcccgaca gacactcagg acacaaggcc 4020
gagaacggcc ccggccctgg ggtgctggtc ctccgcgcca gcttcgacga gagacagcct 4080
tacgcccaca tgaacggggg ccgcaagaac gagcgggcct tgccgctgcc ccagtcttcg 4140
acctgctgat ccttggatcc tgaatctgtg caaacagtaa cgtgtgcgca cgcgcagcgg 4200
ggtggggggg gagagagagt tttaacaatc cattcacaag cctcctgtac ctcagtggat 4260
cttcagttct gcccttgctg cccgcgggag acagcttctc tgcagtaaaa cacatttggg 4320
atgttccttt tttcaatatg caagcagctt tttattccct gcccaaaccc ttaactgaca 4380
tgggccttta agaaccttaa tgacaacact taatagcaac agagcacttg agaaccagtc 4440
tcctcactct gtccctgtcc ttccctgttc tccctttctc tctcctctct gcttcataac 4500
ggaaaaataa ttgccacaag tccagctggg aagccctttt tatcagtttg aggaagtggc 4560
tgtccctgtg gccccatcca accactgtac acacccgcct gacaccgtgg gtcattacaa 4620
aaaaacacgt ggagatggaa atttttacct ttatctttca cctttctagg gacatgaaat 4680
ttacaaaggg ccatcgttca tccaaggctg ttaccatttt aacgctgcct aattttgcca 4740
aaatcctgaa ctttctccct catcggcccg gcgctgattc ctcgtgtccg gaggcatggg 4800
tgagcatggc agctggttgc tccatttgag agacacgctg gcgacacact ccgtccatcc 4860
gactgcccct gctgtgctgc tcaaggccac aggcacacag gtctcattgc ttctgactag 4920
attattattt gggggaactg gacacaatag gtctttctct cagtgaaggt ggggagaagc 4980
tgaaccggc 4989
<210>97
<211>3076
<212>DNA
<213>人
<400>97
gtttctccag ggaggcaggg cccggggaga aagttggagc ggtaacctaa gctggcagtg 60
gcgtgatccg gcaccaaatc ggcccgcggt gcggtgcgga gactccatga ggccctggac 120
atgaacaagc tgagtggagg cggcgggcgc aggactcggg tggaaggggg ccagcttggg 180
ggcgaggagt ggacccgcca cgggagcttt gtcaataagc ccacgcgggg ctggctgcat 240
cccaacgaca aagtcatggg acccggggtt tcctacttgg ttcggtacat gggttgtgtg 300
gaggtcctcc agtcaatgcg tgccctggac ttcaacaccc ggactcaggt caccagggag 360
gccatcagtc tggtgtgtga ggctgtgccg ggtgctaagg gggcgacaag gaggagaaag 420
ccctgtagcc gcccgctcag ctctatcctg gggaggagta acctgaaatt tgctggaatg 480
ccaatcactc tcaccgtctc caccagcagc ctcaacctca tggccgcaga ctgcaaacag 540
atcatcgcca accaccacat gcaatctatc tcatttgcat ccggcgggga tccggacaca 600
gccgagtatg tcgcctatgt tgccaaagac cctgtgaatc agagagcctg ccacattctg 660
gagtgtcccg aagggcttgc ccaggatgtc atcagcacca ttggccaggc cttcgagttg 720
cgcttcaaac aatacctcag gaacccaccc aaactggtca cccctcatga caggatggct 780
ggctttgatg gctcagcatg ggatgaggag gaggaagagc cacctgacca tcagtactat 840
aatgacttcc cggggaagga accccccttg gggggggtgg tagacatgag gcttcgggaa 900
ggagccgctc caggggctgc tcgacccact gcacccaatg cccagacccc cagccacttg 960
ggagctacat tgcctgtagg acagcctgtt gggggagatc cagaagtccg caaacagatg 1020
ccacctccac caccctgtcc agcaggcaga gagctttttg atgatccctc ctatgtcaac 1080
gtccagaacc tagacaaggc ccggcaagca gtgggtggtg ctgggccccc caatcctgct 1140
atcaatggca gtgcaccccg ggacctgttt gacatgaagc ccttcgaaga tgctcttcgc 1200
gtgcctccac ctccccagtc ggtgtccatg gctgagcagc tccgagggga gccctggttc 1260
catgggaagc tgagccggcg ggaggctgag gcactgctgc agctcaatgg ggacttcctg 1320
gtacgggaga gcacgaccac acctggccag tatgtgctca ctggcttgca gagtgggcag 1380
cctaagcatt tgctactggt ggaccctgag ggtgtggttc ggactaagga tcaccgcttt 1440
gaaagtgtca gtcaccttat cagctaccac atggacaatc acttgcccat catctctgcg 1500
ggcagcgaac tgtgtctaca gcaacctgtg gagcggaaac tgtgatctgc cctagcgctc 1560
tcttccagaa gatgccctcc aatcctttcc accctattcc ctaactctcg ggacctcgtt 1620
tgggagtgtt ctgtgggctt ggccttgtgt cagagctggg agtagcatgg actctgggtt 1680
tcatatccag ctgagtgaga gggtttgagt caaaagcctg ggtgagaatc ctgcctctcc 1740
ccaaacatta atcaccaaag tattaatgta cagagtggcc cctcacctgg gcctttcctg 1800
tgccaacctg atgccccttc cccaagaagg tgagtgcttg tcatggaaaa tgtcctgtgg 1860
tgacaggccc agtggaacag tcacccttct gggcaagggg gaacaaatca cacctctggg 1920
cttcagggta tcccagaccc ctctcaacac ccgccccccc catgtttaaa ctttgtgcct 1980
ttgaccatct cttaggtcta atgatatttt atgcaaacag ttcttggacc cctgaattca 2040
atgacaggga tgccaacacc ttcttggctt ctgggacctg tgttcttgct gagcaccctc 2100
tccggtttgg gttgggataa cagaggcagg agtggcagct gtcccctctc cctggggata 2160
tgcaaccctt agagattgcc ccagagcccc actcccggcc aggcgggaga tggacccctc 2220
ccttgctcag tgcctcctgg ccggggcccc tcaccccaag gggtctgtat atacatttca 2280
taaggcctgc cctcccatgt tgcatgccta tgtactctac gccaaagtgc agcccttcct 2340
cctgaagcct ctgccctgcc tccctttctg ggagggcggg gtgggggtga ctgaatttgg 2400
gcctcttgta cagttaactc tcccaggtgg attttgtgga ggtgagaaaa ggggcattga 2460
gactataaag cagtagacaa tccccacata ccatctgtag agttggaact gcattctttt 2520
aaagttttat atgcatatat tttagggctg tagacttact ttcctatttt cttttccatt 2580
gcttattctt gagcacaaaa tgataatcaa ttattacatt tatacatcac ctttttgact 2640
tttccaagcc cttttacagc tcttggcatt ttcctcgcct aggcctgtga ggtaactggg 2700
atcgcacctt ttataccaga gacctgaggc agatgaaatt tatttccatc taggactaga 2760
aaaacttggg tctcttaccg cgagactgag aggcagaagt cagcccgaat gcctgtcagt 2820
ttcatggagg ggaaacgcaa aacctgcagt tcctgagtac cttctacagg cccggcccag 2880
cctaggcccg gggtggccac accacagcaa gccggccccc cctcttttgg ccttgtggat 2940
aagggagagt tgaccgtttt catcctggcc tccttttgct gtttggatgt ttccacgggt 3000
ctcacttata ccaaagggaa aactcttcat taaagtccgt atttcttcta aaaaaaaaaa 3060
aaaaaaaaaa aaaaaa 3076
<210>98
<211>4
<212>PRT
<213>人
<400>98
Asn Ser Gly Ser
1
<210>99
<211>2261
<212>DNA
<213>人
<400>99
gaaatcaggc tccgggccgg ccgaagggcg caactttccc ccctcggcgc cccaccggct 60
cccgcgcgcc tcccctcgcg cccgagcttc gagccaagca gcgtcctggg gagcgcgtca 120
tggccttacc agtgaccgcc ttgctcctgc cgctggcctt gctgctccac gccgccaggc 180
cgagccagtt ccgggtgtcg ccgctggatc ggacctggaa cctgggcgag acagtggagc 240
tgaagtgcca ggtgctgctg tccaacccga cgtcgggctg ctcgtggctc ttccagccgc 300
gcggcgccgc cgccagtccc accttcctcc tatacctctc ccaaaacaag cccaaggcgg 360
ccgaggggct ggacacccag cggttctcgg gcaagaggtt gggggacacc ttcgtcctca 420
ccctgagcga cttccgccga gagaacgagg gctactattt ctgctcggcc ctgagcaact 480
ccatcatgta cttcagccac ttcgtgccgg tcttcctgcc agcgaagccc accacgacgc 540
cagcgccgcg accaccaaca ccggcgccca ccatcgcgtc gcagcccctg tccctgcgcc 600
cagaggcgtg ccggccagcg gcggggggcg cagtgcacac gagggggctg gacttcgcct 660
gtgatatcta catctgggcg cccttggccg ggacttgtgg ggtccttctc ctgtcactgg 720
ttatcaccct ttactgcaac cacaggaacc gaagacgtgt ttgcaaatgt ccccggcctg 780
tggtcaaatc gggagacaag cccagccttt cggcgagata cgtctaaccc tgtgcaacag 840
ccactacatt acttcaaact gagatccttc cttttgaggg agcaagtcct tccctttcat 900
tttttccagt cttcctccct gtgtattcat tctcatgatt attattttag tgggggcggg 960
gtgggaaaga ttactttttc tttatgtgtt tgacgggaaa caaaactagg taaaatctac 1020
agtacaccac aagggtcaca atactgttgt gcgcacatcg cggtagggcg tggaaagggg 1080
caggccagag ctacccgcag agttctcaga atcatgctga gagagctgga ggcacccatg 1140
ccatctcaac ctcttccccg cccgttttac aaagggggag gctaaagccc agagacagct 1200
tgatcaaagg cacacagcaa gtcagggttg gagcagtagc tggagggacc ttgtctccca 1260
gctcagggct ctttcctcca caccattcag gtctttcttt ccgaggcccc tgtctcaggg 1320
tgaggtgctt gagtctccaa cggcaaggga acaagtactt cttgatacct gggatactgt 1380
gcccagagcc tcgaggaggt aatgaattaa agaagagaac tgcctttggc agagttctat 1440
aatgtaaaca atatcagact tttttttttt ataatcaagc ctaaaattgt atagacctaa 1500
aataaaatga agtggtgagc ttaaccctgg aaaatgaatc cctctatctc taaagaaaat 1560
ctctgtgaaa cccctatgtg gaggcggaat tgctctccca gcccttgcat tgcagagggg 1620
cccatgaaag aggacaggct acccctttac aaatagaatt tgagcatcag tgaggttaaa 1680
ctaaggccct cttgaatctc tgaatttgag atacaaacat gttcctggga tcactgatga 1740
ctttttatac tttgtaaaga caattgttgg agagcccctc acacagccct ggcctctgct 1800
caactagcag atacagggat gaggcagacc tgactctctt aaggaggctg agagcccaaa 1860
ctgctgtccc aaacatgcac ttccttgctt aaggtatggt acaagcaatg cctgcccatt 1920
ggagagaaaa aacttaagta gataaggaaa taagaaccac tcataattct tcaccttagg 1980
aataatctcc tgttaatatg gtgtacattc ttcctgatta ttttctacac atacatgtaa 2040
aatatgtctt tcttttttaa atagggttgt actatgctgt tatgagtggc tttaatgaat 2100
aaacatttgt agcatcctct ttaatgggta aacagcaaaa aaaaaaaaaa aaaaaaaaaa 2160
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa 2220
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa a 2261
<210>100
<211>6450
<212>DNA
<213>人
<400>100
gagttgtgcc tggagtgatg tttaagccaa tgtcagggca aggcaacagt ccctggccgt 60
cctccagcac ctttgtaatg catatgagct cgggagacca gtacttaaag ttggaggccc 120
gggagcccag gagctggcgg agggcgttcg tcctgggagc tgcacttgct ccgtcgggtc 180
gccggcttca ccggaccgca ggctcccggg gcagggccgg ggccagagct cgcgtgtcgg 240
cgggacatgc gctgcgtcgc ctctaacctc gggctgtgct ctttttccag gtggcccgcc 300
ggtttctgag ccttctgccc tgcggggaca cggtctgcac cctgcccgcg gccacggacc 360
atgaccatga ccctccacac caaagcatct gggatggccc tactgcatca gatccaaggg 420
aacgagctgg agcccctgaa ccgtccgcag ctcaagatcc ccctggagcg gcccctgggc 480
gaggtgtacc tggacagcag caagcccgcc gtgtacaact accccgaggg cgccgcctac 540
gagttcaacg ccgcggccgc cgccaacgcg caggtctacg gtcagaccgg cctcccctac 600
ggccccgggt ctgaggctgc ggcgttcggc tccaacggcc tggggggttt ccccccactc 660
aacagcgtgt ctccgagccc gctgatgcta ctgcacccgc cgccgcagct gtcgcctttc 720
ctgcagcccc acggccagca ggtgccctac tacctggaga acgagcccag cggctacacg 780
gtgcgcgagg ccggcccgcc ggcattctac aggccaaatt cagataatcg acgccagggt 840
ggcagagaaa gattggccag taccaatgac aagggaagta tggctatgga atctgccaag 900
gagactcgct actgtgcagt gtgcaatgac tatgcttcag gctaccatta tggagtctgg 960
tcctgtgagg gctgcaaggc cttcttcaag agaagtattc aaggacataa cgactatatg 1020
tgtccagcca ccaaccagtg caccattgat aaaaacagga ggaagagctg ccaggcctgc 1080
cggctccgca aatgctacga agtgggaatg atgaaaggtg ggatacgaaa agaccgaaga 1140
ggagggagaa tgttgaaaca caagcgccag agagatgatg gggagggcag gggtgaagtg 1200
gggtctgctg gagacatgag agctgccaac ctttggccaa gcccgctcat gatcaaacgc 1260
tctaagaaga acagcctggc cttgtccctg acggccgacc agatggtcag tgccttgttg 1320
gatgctgagc cccccatact ctattccgag tatgatccta ccagaccctt cagtgaagct 1380
tcgatgatgg gcttactgac caacctggca gacagggagc tggttcacat gatcaactgg 1440
gcgaagaggg tgccaggctt tgtggatttg accctccatg atcaggtcca ccttctagaa 1500
tgtgcctggc tagagatcct gatgattggt ctcgtctggc gctccatgga gcacccagtg 1560
aagctactgt ttgctcctaa cttgctcttg gacaggaacc agggaaaatg tgtagagggc 1620
atggtggaga tcttcgacat gctgctggct acatcatctc ggttccgcat gatgaatctg 1680
cagggagagg agtttgtgtg cctcaaatct attattttgc ttaattctgg agtgtacaca 1740
tttctgtcca gcaccctgaa gtctctggaa gagaaggacc atatccaccg agtcctggac 1800
aagatcacag acactttgat ccacctgatg gccaaggcag gcctgaccct gcagcagcag 1860
caccagcggc tggcccagct cctcctcatc ctctcccaca tcaggcacat gagtaacaaa 1920
ggcatggagc atctgtacag catgaagtgc aagaacgtgg tgcccctcta tgacctgctg 1980
ctggagatgc tggacgccca ccgcctacat gcgcccacta gccgtggagg ggcatccgtg 2040
gaggagacgg accaaagcca cttggccact gcgggctcta cttcatcgca ttccttgcaa 2100
aagtattaca tcacggggga ggcagagggt ttccctgcca cagtctgaga gctccctggc 2160
tcccacacgg ttcagataat ccctgctgca ttttaccctc atcatgcacc actttagcca 2220
aattctgtct cctgcataca ctccggcatg catccaacac caatggcttt ctagatgagt 2280
ggccattcat ttgcttgctc agttcttagt ggcacatctt ctgtcttctg ttgggaacag 2340
ccaaagggat tccaaggcta aatctttgta acagctctct ttcccccttg ctatgttact 2400
aagcgtgagg attcccgtag ctcttcacag ctgaactcag tctatgggtt ggggctcaga 2460
taactctgtg catttaagct acttgtagag acccaggcct ggagagtaga cattttgcct 2520
ctgataagca ctttttaaat ggctctaaga ataagccaca gcaaagaatt taaagtggct 2580
cctttaattg gtgacttgga gaaagctagg tcaagggttt attatagcac cctcttgtat 2640
tcctatggca atgcatcctt ttatgaaagt ggtacacctt aaagctttta tatgactgta 2700
gcagagtatc tggtgattgt caattcactt ccccctatag gaatacaagg ggccacacag 2760
ggaaggcaga tcccctagtt ggccaagact tattttaact tgatacactg cagattcaga 2820
gtgtcctgaa gctctgcctc tggctttccg gtcatgggtt ccagttaatt catgcctccc 2880
atggacctat ggagagcaac aagttgatct tagttaagtc tccctatatg agggataagt 2940
tcctgatttt tgtttttatt tttgtgttac aaaagaaagc cctccctccc tgaacttgca 3000
gtaaggtcag cttcaggacc tgttccagtg ggcactgtac ttggatcttc ccggcgtgtg 3060
tgtgccttac acaggggtga actgttcact gtggtgatgc atgatgaggg taaatggtag 3120
ttgaaaggag caggggccct ggtgttgcat ttagccctgg ggcatggagc tgaacagtac 3180
ttgtgcagga ttgttgtggc tactagagaa caagagggaa agtagggcag aaactggata 3240
cagttctgag cacagccaga cttgctcagg tggccctgca caggctgcag ctacctagga 3300
acattccttg cagaccccgc attgcctttg ggggtgccct gggatccctg gggtagtcca 3360
gctcttattc atttcccagc gtggccctgg ttggaagaag cagctgtcaa gttgtagaca 3420
gctgtgttcc tacaattggc ccagcaccct ggggcacggg agaagggtgg ggaccgttgc 3480
tgtcactact caggctgact ggggcctggt cagattacgt atgcccttgg tggtttagag 3540
ataatccaaa atcagggttt ggtttgggga agaaaatcct cccccttcct cccccgcccc 3600
gttccctacc gcctccactc ctgccagctc atttccttca atttcctttg acctataggc 3660
taaaaaagaa aggctcattc cagccacagg gcagccttcc ctgggccttt gcttctctag 3720
cacaattatg ggttacttcc tttttcttaa caaaaaagaa tgtttgattt cctctgggtg 3780
accttattgt ctgtaattga aaccctattg agaggtgatg tctgtgttag ccaatgaccc 3840
aggtagctgc tcgggcttct cttggtatgt cttgtttgga aaagtggatt tcattcattt 3900
ctgattgtcc agttaagtga tcaccaaagg actgagaatc tgggagggca aaaaaaaaaa 3960
aaaaagtttt tatgtgcact taaatttggg gacaatttta tgtatctgtg ttaaggatat 4020
gcttaagaac ataattcttt tgttgctgtt tgtttaagaa gcaccttagt ttgtttaaga 4080
agcaccttat atagtataat atatattttt ttgaaattac attgcttgtt tatcagacaa 4140
ttgaatgtag taattctgtt ctggatttaa tttgactggg ttaacatgca aaaaccaagg 4200
aaaaatattt agtttttttt tttttttttg tatacttttc aagctacctt gtcatgtata 4260
cagtcattta tgcctaaagc ctggtgatta ttcatttaaa tgaagatcac atttcatatc 4320
aacttttgta tccacagtag acaaaatagc actaatccag atgcctattg ttggatattg 4380
aatgacagac aatcttatgt agcaaagatt atgcctgaaa aggaaaatta ttcagggcag 4440
ctaattttgc ttttaccaaa atatcagtag taatattttt ggacagtagc taatgggtca 4500
gtgggttctt tttaatgttt atacttagat tttcttttaa aaaaattaaa ataaaacaaa 4560
aaaaatttct aggactagac gatgtaatac cagctaaagc caaacaatta tacagtggaa 4620
ggttttacat tattcatcca atgtgtttct attcatgtta agatactact acatttgaag 4680
tgggcagaga acatcagatg attgaaatgt tcgcccaggg gtctccagca actttggaaa 4740
tctctttgta tttttacttg aagtgccact aatggacagc agatattttc tggctgatgt 4800
tggtattggg tgtaggaaca tgatttaaaa aaaaaactct tgcctctgct ttcccccact 4860
ctgaggcaag ttaaaatgta aaagatgtga tttatctggg gggctcaggt atggtgggga 4920
agtggattca ggaatctggg gaatggcaaa tatattaaga agagtattga aagtatttgg 4980
aggaaaatgg ttaattctgg gtgtgcacca aggttcagta gagtccactt ctgccctgga 5040
gaccacaaat caactagctc catttacagc catttctaaa atggcagctt cagttctaga 5100
gaagaaagaa caacatcagc agtaaagtcc atggaatagc tagtggtctg tgtttctttt 5160
cgccattgcc tagcttgccg taatgattct ataatgccat catgcagcaa ttatgagagg 5220
ctaggtcatc caaagagaag accctatcaa tgtaggttgc aaaatctaac ccctaaggaa 5280
gtgcagtctt tgatttgatt tccctagtaa ccttgcagat atgtttaacc aagccatagc 5340
ccatgccttt tgagggctga acaaataagg gacttactga taatttactt ttgatcacat 5400
taaggtgttc tcaccttgaa atcttataca ctgaaatggc cattgattta ggccactggc 5460
ttagagtact ccttcccctg catgacactg attacaaata ctttcctatt catactttcc 5520
aattatgaga tggactgtgg gtactgggag tgatcactaa caccatagta atgtctaata 5580
ttcacaggca gatctgcttg gggaagctag ttatgtgaaa ggcaaataaa gtcatacagt 5640
agctcaaaag gcaaccataa ttctctttgg tgcaagtctt gggagcgtga tctagattac 5700
actgcaccat tcccaagtta atcccctgaa aacttactct caactggagc aaatgaactt 5760
tggtcccaaa tatccatctt ttcagtagcg ttaattatgc tctgtttcca actgcatttc 5820
ctttccaatt gaattaaagt gtggcctcgt ttttagtcat ttaaaattgt tttctaagta 5880
attgctgcct ctattatggc acttcaattt tgcactgtct tttgagattc aagaaaaatt 5940
tctattcatt tttttgcatc caattgtgcc tgaactttta aaatatgtaa atgctgccat 6000
gttccaaacc catcgtcagt gtgtgtgttt agagctgtgc accctagaaa caacatactt 6060
gtcccatgag caggtgcctg agacacagac ccctttgcat tcacagagag gtcattggtt 6120
atagagactt gaattaataa gtgacattat gccagtttct gttctctcac aggtgataaa 6180
caatgctttt tgtgcactac atactcttca gtgtagagct cttgttttat gggaaaaggc 6240
tcaaatgcca aattgtgttt gatggattaa tatgcccttt tgccgatgca tactattact 6300
gatgtgactc ggttttgtcg cagctttgct ttgtttaatg aaacacactt gtaaacctct 6360
tttgcacttt gaaaaagaat ccagcgggat gctcgagcac ctgtaaacaa ttttctcaac 6420
ctatttgatg ttcaaataaa gaattaaact 6450
<210>101
<211>2011
<212>DNA
<213>人
<400>101
tttcagtttc tccagctgct ggctttttgg acacccactc ccccgccagg aggcagttgc 60
aagcgcggag gctgcgagaa ataactgcct cttgaaactt gcagggcgaa gagcaggcgg 120
cgagcgctgg gccggggagg gaccacccga gctgcgacgg gctctggggc tgcggggcag 180
ggctggcgcc cggagcctga gctgcaggag gtgcgctcgc tttcctcaac aggtggcggc 240
ggggcgcgcg ccgggagacc ccccctaatg cgggaaaagc acgtgtccgc attttagaga 300
aggcaaggcc ggtgtgttta tctgcaagcc attatacttg cccacgaatc tttgagaaca 360
ttataatgac ctttgtgcct cttcttgcaa ggtgttttct cagctgttat ctcaagacat 420
ggatataaaa aactcaccat ctagccttaa ttctccttcc tcctacaact gcagtcaatc 480
catcttaccc ctggagcacg gctccatata cataccttcc tcctatgtag acagccacca 540
tgaatatcca gccatgacat tctatagccc tgctgtgatg aattacagca ttcccagcaa 600
tgtcactaac ttggaaggtg ggcctggtcg gcagaccaca agcccaaatg tgttgtggcc 660
aacacctggg cacctttctc ctttagtggt ccatcgccag ttatcacatc tgtatgcgga 720
acctcaaaag agtccctggt gtgaagcaag atcgctagaa cacaccttac ctgtaaacag 780
agagacactg aaaaggaagg ttagtgggaa ccgttgcgcc agccctgtta ctggtccagg 840
ttcaaagagg gatgctcact tctgcgctgt ctgcagcgat tacgcatcgg gatatcacta 900
tggagtctgg tcgtgtgaag gatgtaaggc cttttttaaa agaagcattc aaggacataa 960
tgattatatt tgtccagcta caaatcagtg tacaatcgat aaaaaccggc gcaagagctg 1020
ccaggcctgc cgacttcgga agtgttacga agtgggaatg gtgaagtgtg gctcccggag 1080
agagagatgt gggtaccgcc ttgtgcggag acagagaagt gccgacgagc agctgcactg 1140
tgccggcaag gccaagagaa gtggcggcca cgcgccccga gtgcgggagc tgctgctgga 1200
cgccctgagc cccgagcagc tagtgctcac cctcctggag gctgagccgc cccatgtgct 1260
gatcagccgc cccagtgcgc ccttcaccga ggcctccatg atgatgtccc tgaccaagtt 1320
ggccgacaag gagttggtac acatgatcag ctgggccaag aagattcccg gctttgtgga 1380
gctcagcctg ttcgaccaag tgcggctctt ggagagctgt tggatggagg tgttaatgat 1440
ggggctgatg tggcgctcaa ttgaccaccc cggcaagctc atctttgctc cagatcttgt 1500
tctggacagg gatgagggga aatgcgtaga aggaattctg gaaatctttg acatgctcct 1560
ggcaactact tcaaggtttc gagagttaaa actccaacac aaagaatatc tctgtgtcaa 1620
ggccatgatc ctgctcaatt ccagtatgta ccctctggtc acagcgaccc aggatgctga 1680
cagcagccgg aagctggctc acttgctgaa cgccgtgacc gatgctttgg tttgggtgat 1740
tgccaagagc ggcatctcct cccagcagca atccatgcgc ctggctaacc tcctgatgct 1800
cctgtcccac gtcaggcatg cgagtaacaa gggcatggaa catctgctca acatgaagtg 1860
caaaaatgtg gtcccagtgt atgacctgct gctggagatg ctgaatgccc acgtgcttcg 1920
cgggtgcaag tcctccatca cggggtccga gtgcagcccg gcagaggaca gtaaaagcaa 1980
agagggctcc cagaacccac agtctcagtg a 2011