CN1681835A

CN1681835A - 胃癌相关的基因家族

Info

Publication number: CN1681835A
Application number: CNA03821976XA
Authority: CN
Inventors: 高祥锡; 刘晴; 郑贤镐; 曾文; 李福万; 宋始英
Original assignee: LG Life Sciences Ltd
Current assignee: LG Chem Ltd
Priority date: 2002-08-14
Filing date: 2003-08-14
Publication date: 2005-10-12
Also published as: EP1546171A1; EP1546171A4; JP2006508644A; KR20050037574A; AU2003251202A1; WO2004016636A1; US20060121471A1

Abstract

本发明一般涉及胃癌中的基因表达的变化。本发明具体涉及对应于mRNA的人类基因家族，所述mRNA在癌性胃组织和正常胃组织中进行差异表达。

Description

胃癌相关的基因家族

技术领域

本发明一般涉及胃癌患者的胃组织中的基因表达相对于正常胃组织中的基因表达所发生的变化。本发明具体涉及与正常组织相比在晚期胃癌以及其它恶性肿瘤中进行差异表达的人类基因家族。

技术背景

胃癌

在美国，每年诊断出大约24000个胃癌新病例。尽管近60年来，胃癌的发病率显著降低，但是胃癌仍然是一种起因不明的严重疾病。在相似的境况下，某些人就患上了胃癌而其它人则没有患上胃癌。

胃癌通常发生在年龄大于55岁的人群中并且男人的发病率是妇女发病率的两倍。这类癌症在美国并不普遍，但是在日本、韩国、拉丁美洲和东欧部分地区却很普遍，这些地区的人食用了较多的经干燥、酸渍、烟熏或盐渍保存的食物。相反，食用新鲜水果和蔬菜可以预防这种疾病。

胃癌可以发生在胃的任何部位并且会扩散到整个胃和/或其它器官。这种癌症还可以沿着胃壁生长从而扩散到食管或小肠中。如果这种癌透过胃壁生长则会蔓延到附近的淋巴结、肝脏、胰腺和结肠。胃癌甚至能够扩散得更远，甚至到卵巢、肺和远距离的淋巴结。当胃癌转移到身体的另一个部位时，这些肿瘤细胞与原发肿瘤中的那些肿瘤细胞属于同一类型。换句话说，肝脏中的转移性细胞仍然是胃癌细胞。扩散到卵巢并生长成一个或多个卵巢肿瘤的这种肿瘤细胞被称作Krukenberg肿瘤而且是由被转化的胃细胞而不是卵巢细胞组成。

由于胃癌的症状是非特异性的，因此在胃癌早期很难检测出这种癌症。症状包括消化不良、胃灼热、腹痛、恶心和呕吐，腹泻或便秘、食欲减退、虚弱和疲劳，以及便血或吐血。诊断通常借助X-光检测胃肠道上部和食道来进行，当患者喝下液体钡示踪剂后进行X-光片的拍摄。利用胃镜还可以对胃和食道进行内窥镜检测。如果发现异常组织，还可以通过胃镜进行活组织检查。如果结果表明活组织样品具有癌细胞，则对周围淋巴结进行活组织检查，通过CT扫描检测周围的器官如肝脏和胰腺来确定疾病的程度或阶段。胃癌的治疗方法与那些用于其它类型癌的方法相似：切除受影响的器官(部分或整体胃切除术)，还可以清除附近淋巴结、化疗、放射疗法和免疫疗法(刺激袭击癌细胞的免疫系统组分)(http：//cancernet.nci.nih.gov/canceertype s.html)。由于早期胃癌基本没有症状，所以在该疾病没有发展到晚期前通常不作诊断，而晚期的治疗却没有效果。

胃癌中的分子变化

对与胃癌的发生和发展相关的胃细胞中的分子变化基本没有了解。因此，存在着对在基因表达水平发生的变化进行研究的需求，以及存在着对与胃癌发生和发展相关的新分子标记物进行鉴定的需求。而且，如果期望阻止或减缓胃癌发展的干预能够成功，需要建立准确评估这种疾病早期症状的方法。一种准确评估胃癌早期症状的方法是识别与疾病进展相关的独特标记(参见例如Kim等(2001)，癌基因20：4568-4575)。同样，预防或终止胃癌发展的治疗方法的建立取决于对在胃内部引起癌变和癌生长的基因进行的识别。

本发明的公开

本发明基于对在晚期胃癌(AGC)和其它恶性肿瘤中的表达与在正常组织中的表达具有差异性的新基因家族的发现。本发明包括：含有SEQ ID NO：3，5，7，9，11，13，17或19的分离核酸分子；编码SEQ ID NO：4，14或18的氨基酸序列的分离核酸分子；编码在胃癌中被表达的蛋白并与SEQ ID NO：3或17的全长序列具有至少约92％核苷酸序列相同性的分离核酸分子；编码在胃癌中被表达的蛋白并与SEQ ID NO：13的全长序列具有至少约95％核苷酸序列相同性的分离核酸分子；和含有上述任一核酸分子的互补链的分离核酸分子。

本发明还包括与包括含所述分离核酸分子的载体在内的一种或多种表达控制元件可操作性连接的核酸分子。本发明还包括被转化而含有本发明的核酸分子的宿主细胞和用于生产蛋白的方法，该方法包括在该蛋白被表达的条件下培养经本发明核酸分子转化的宿主细胞的步骤。

本发明还提供了一种分离多肽，该多肽选自含SEQ ID NO：4，6，8，10，12，14或18的氨基酸序列的分离多肽、含SEQ ID NO：6，8，10或12的至少10个氨基酸的片段的分离多肽、含SEQ ID NO：6，8，10或12的保守氨基酸取代物的分离多肽和含SEQ ID NO：6，8，10或12的自然存在的氨基酸序列变异体的分离多肽。本发明的多肽还包括其氨基酸序列与SEQ ID NO：4所示序列具有至少约90％、优选地至少约92-95％以及更优选地至少约95-98％氨基酸序列相同性的多肽。本发明的多肽还包括其氨基酸序列与SEQ ID NO：6，8，10或12所示序列具有至少约50％、60％、70％或75％，优选地至少约80％，更优选地至少约90-95％以及最优选地至少约95-98％氨基酸序列相同性的多肽。本发明的多肽还包括其氨基酸序列分别与SEQ ID NO：14和SEQ ID NO：18所示序列具有至少约95％和至少约92％氨基酸序列相同性的多肽。

本发明还提供了一种与本发明的多肽发生特异性结合的分离抗体或抗原-结合型抗体片段，包括单克隆或多克隆抗体。

本发明还提供了鉴定调控编码本发明蛋白的核酸分子表达的介质(agent)的方法，该方法包括：使表达所述核酸分子的细胞与所述介质接触；和确定所述介质是否调控所述核酸分子的表达，从而鉴定出调控编码所述蛋白的核酸分子的表达的介质。

本发明还提供了鉴定调控本发明蛋白的水平或至少一种活性的介质的方法，该方法包括：使表达所述蛋白的细胞与所述介质接触；和确定所述介质是否调控所述蛋白的水平或至少一种活性，从而鉴定出调控所述蛋白的水平或至少一种活性的介质。

本发明还提供了鉴定本发明蛋白的结合配偶体的方法，该方法包括以下步骤：使所述蛋白与可能的结合配偶体接触；和确定所述可能的配偶体是否与所述蛋白结合，从而鉴定出所述蛋白的结合配偶体。

本发明还提供了对编码本发明蛋白的核酸分子的表达进行调控的方法，该方法包括以下步骤：施用有效量的调控编码所述蛋白的核酸分子的表达的介质。本发明还提供了调控本发明蛋白的至少一种活性的方法，该方法包括以下步骤：施用有效量的调控本发明蛋白的至少一种活性的介质。

本发明还包括被改造而含有本发明的核酸分子的非-人类转基因动物或被改造而含有突变的核酸分子从而不能表达本发明的被编码的多肽的非-人类转基因动物。

本发明还包括非-人类转基因动物，其中含有SEQ ID NO：3，5，7，9，11，13或17的全长或部分序列的完整或部分基因被从该动物的基因组中敲除或删除。

本发明还提供了诊断胃癌或恶性肿瘤的方法，该方法包括以下步骤：从受试者身上获取组织、血液、尿液或其它样品，并确定本发明的核酸分子或本发明的多肽的表达水平。

本发明还包括含有稀释剂和多肽或蛋白的组合物，该多肽或蛋白选自含SEQ ID NO：4，6，8，10，12，14或18的氨基酸序列的分离多肽、其氨基酸序列与SEQ ID NO：4所示序列具有至少约90％、优选地至少约92-95％以及更优选地至少约95-98％氨基酸序列相同性的分离多肽、含SEQ ID NO：6，8，10或12的至少10个氨基酸的片段的分离多肽、含SEQ ID NO：6，8，10或12的保守氨基酸取代物的分离多肽、SEQ ID NO：6，8，10或12的自然存在的氨基酸序列变异体、其氨基酸序列与SEQ ID NO：6，8，10或12所示序列具有至少约50％、60％、70％或75％，优选地至少约80％，更优选地至少约90-95％以及最优选地至少约95-98％氨基酸序列相同性的分离多肽、其氨基酸序列与SEQ ID NO：14所示序列具有至少约95％的分离多肽或其氨基酸序列与SEQ ID NO：18所示序列具有至少约92％氨基酸序列相同性的分离多肽。

附图的简要描述

图1是显示SEQ ID NO：1(克隆AD12)与SEQ ID NO：3(克隆CH4)的序列差异的图表，其中SEQ ID NO：1(克隆AD12)和SEQ ID NO：3(克隆CH4)是被命名为LBFL301的基因的剪接变体。

图2是由LBFL301变体AD12的可读框编码的蛋白(SEQ ID NO：2)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

图3是由LBFL301变体CH4的可读框编码的蛋白(SEQ ID NO：4)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

图4是由LBFL304的可读框中的最长可读框编码的蛋白(SEQ IDNO：6)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

图5是由LBFL305的可读框编码的蛋白(SEQ ID NO：14)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

图6表示三个LBFL306克隆的相对比对位置。

图7是由克隆序号为LBFL306-EF3的可读框编码的蛋白(SEQ IDNO：18)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

图8是由克隆序号为LBFL306-GC7的可读框编码的蛋白(SEQ IDNO：20)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

图9是由克隆序号为LBFL306-GE2的可读框编码的蛋白(SEQ IDNO：22)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。

实施本发明的最好方式

I.总述

本发明部分基于对新基因家族的鉴定，所述新基因家族在人的癌性胃组织和其它恶性肿瘤中的表达不同于在人正常组织中的表达。这些基因家族包括SEQ ID NOS：1，3，5，7，9，11，1 3，17，19和21的人cDNA。

本发明的基因和蛋白可被用作检测样品中的胃癌或监视样品中的胃癌的发展的诊断试剂或标记物。它们还可以作为调控基因表达或活性的试剂的靶标。例如，可以鉴定调控与包括胃癌增生过程在内的肿瘤生长有关的生物学过程的介质。

II.具体的技术方案

A.与胃癌相关的蛋白质

本发明提供了分离的蛋白质、所述蛋白质的等位基因变体和所述蛋白质的保守氨基酸取代物。本文中所使用的“蛋白质”或“多肽”部分是指具有SEQ ID NO：2，4，6，8，10，12，14或18所示的人氨基酸序列的蛋白质。该术语还指其氨基酸序列与以上具体列举的氨基酸序列略有差异的自然存在的等位基因变体和蛋白质。尽管等位基因变体具有的氨基酸序列与以上列举的氨基酸序列略有差异，但等位基因变体却仍然具有与这些蛋白质相同或相似的生物学功能。

本文中的与SEQ ID N0：2，4，6，8，10，12，14或18所示的人氨基酸序列相关的蛋白质家族包括从除人以外的生物体中分离的蛋白质。被用于鉴定和分离与这些蛋白质相关的蛋白质家族的其它成员的方法如以下所述。

本发明的蛋白质优选地是分离形式的。当采用物理、机械或化学方法从通常与蛋白质结合的细胞组分中移出所述蛋白质时该蛋白质就被认为是分离的。一个技术人员可以轻而易举地采用标准的纯化方法来获得一种分离蛋白。

本发明的蛋白质还包括SEQ ID NO：2，4，6，8，10，12，14或18的剪接变体和插入、缺失或保守氨基酸取代变异体。本文中的保守变异体是指对蛋白质的生物学功能不产生负作用的氨基酸序列的改变。当改变的序列阻碍或破坏蛋白质的相关生物学功能时，取代、插入或缺失被认为对蛋白质具有副作用。例如，蛋白质的整体带电性、结构或疏水性/亲水性在某些情况下是可以被改变的，而对生物学活性则不产生副作用。因此，可以改变氨基酸的序列从而提供疏水性或亲水性更强的肽而对蛋白质的生物学活性不产生副作用。

通常，等位变体、保守取代变异体和由LBFL301编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO：2或4所示的序列具有至少约50％，60％，70％或75％的氨基酸序列相同性，更优选地至少约80-90％，甚至更优选地至少约92-95％以及最优选地至少约95-98％的序列相同性。等位变体、保守取代变异体和由LBFL304编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO：6，8，10或12所示的序列具有至少约50％，60％，70％或75％的氨基酸序列相同性，更优选地至少约80％，甚至更优选地至少约92-95％以及最优选地至少约99％或99.5％的序列相同性。等位变体、保守取代变异体和由LBFL305或LBFL306编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO：14或18所示的序列具有至少约50％，60％，70％或75％的氨基酸序列相同性，更优选地至少约80-90％，甚至更优选地至少约92-94％以及最优选地至少约95％，98％或99％的序列相同性。关于这种序列的相同性或同源性在本文中被定义为：当进行序列比对和引入缺口(如果必要)以获得最大百分比的同源性后，候选序列中的与SEQ ID NO：2，4，6，8，10，12，14或18相同的氨基酸残基的百分比，其中不考虑将任何保守取代作为序列相同性的一部分(参见B部分中的相关参数)。认为融合蛋白或肽序列中的N-端、C-端或内部延长、缺失或插入并不影响同源性。

因此，本发明的蛋白质包括：具有SEQ ID NO：2，4，6，8，10，12，14或18所示的氨基酸序列的分子；其具有这些蛋白质的至少约3，4，5，6，10，15，20，25，30，35或更多个氨基酸残基的连续序列的片段；所公开的编码序列的N-或C-端或内部已被插入一个或多个氨基酸残基而生成的氨基酸序列变异体；和被公开的序列的氨基酸序列变异体或其如上定义已被至少一个残基取代的片段。也被称作肽或多肽的这种片段可含有蛋白质的抗原区域、功能区域，这些区域被确认为是对应于已知蛋白结构域的氨基酸序列区域，其还可含有强亲水性区域。利用常规获得的蛋白序列分析软件如MacVector(OxfordMolecular)可以轻而易举地鉴定出所述的所有区域。

所预期的变异体还包括那些含有通过例如同源性重组、定点或PCR诱变所进行的预定突变的变异体，和包括但不限于兔子、小鼠、大鼠、猪、牛、羊、马和非人类灵长目动物品种在内的其它动物品种的相应蛋白质，和等位基因或蛋白家族的其它自然存在的变异体(例如，一种与对应于GenBank序列号为XM_128002，XM_129365，NM_021420，NM_133971(DNA序列)的小鼠蛋白和NP_598732(蛋白质序列)具有相似性的小鼠类似物，所有这些内容被引入本文作为参考)。其它变异体包括其中蛋白质已经通过取代的、化学的、酶的或其它适当的方法用除自然存在的氨基酸以外的其它部分(例如一种可测部分如酶或放射性同位素)进行了共价修饰的衍生物。

本发明还提供了含有本发明的蛋白或多肽和稀释剂的组合物。合适的稀释剂可以是水性或非水性溶剂或其组合物，并且可含有其它增加所述蛋白质或多肽的稳定性、溶解性、活性和/或贮存期的组分，例如水溶性盐或甘油。

如下所述，可以使用蛋白质家族中的成员：(1)来识别调控该蛋白质的水平或至少一种活性的介质，(2)来识别蛋白质的结合配偶体，(3)作为抗原以产生多克隆或单克隆抗体，(4)作为一种治疗剂或靶标和(5)作为胃癌和其它增生疾病的诊断试剂或标记物。

B.核酸分子

本发明还提供了编码如SEQ ID NO：2，4，6，8，10，12，14或18所示的蛋白质及本文记载的相关蛋白质的核酸分子，优选地是以分离的形式存在。本文中使用的“核酸”被定义为如下列的RNA或DNA：编码上述蛋白或肽；与编码这种肽的核酸序列互补；与SEQ ID NO：1，3，5，7，9，11，13或17所示的核酸杂交并且在合适的严紧条件下仍然与其稳定结合；编码与SEQ ID NO：2或4的肽序列具有至少约50％，60％，70％或75％，优选地至少约80-90％，更优选地至少约92-95％以及最优选地至少约95-98％或更高相同性的多肽；与SEQ ID NO：1或3的可读框具有至少50％，60％，70％或75％，优选地至少约80-90％，更优选地至少约92-95％以及甚至更优选的至少约95-98％或更高的核苷酸序列相同性；编码与SEQ ID NO：6，8，10或12的肽序列具有至少约50％，60％，70％或75％，优选地至少约80％，更优选地至少约85％以及最优选地至少约90％，95％，98％，99％，99.5％或更高相同性的多肽；与SEQ ID NO：5，7，9或11的可读框具有至少50％，60％，70％或75％，优选地至少约80％，更优选地至少约85％和甚至更优选地至少约90％，95％，98％，99％，99.5％或更高的核苷酸序列相同性；编码与SEQID NO：14或18的肽序列具有至少约50％，60％，70％或75％，优选的至少约80-90％，更优选地至少约92-94％以及最优选地至少约95％，98％，99％或更高相同性的多肽；或者与SEQ ID NO：13或17的可读框具有至少50％，60％，70％或75％，优选地至少约80-90％，更优选地至少约92-94％，和甚至更优选的至少约95％，98％，99％或更高的核苷酸序列相同性。

本发明还包括与SEQ ID NO：1，3，5，7，9，11，13或17的互补链进行特异性杂交的分离的核酸分子，具体地是与可读框进行特异性杂交的分子。与SEQ ID NO：1，3，5，7，9，11，13或17的互补链进行特异性杂交的这种分子一般是在严紧的杂交条件下进行杂交的。

具体预期的是基因组DNA，cDNA，mRNA和反义分子以及基于自然界来源或合成的可替代性主链或包含替代性碱基的核酸。然而，这种杂交或互补核酸被进一步定义为相对于现有技术中的核酸是新的和非显而易见性的，所述核酸包括编码本发明的蛋白质、在适当严紧条件下与编码本发明的蛋白质的核酸杂交或与编码本发明的蛋白质的核酸互补的核酸。

核苷酸或氨基酸序列水平的同源性或相同性通过BLAST(BasicLocal Alignment Search Tool)分析法来测定，所述分析法利用特意为序列相似性检索而改进的程序blastp，blastn，blastx，tblastn和tblastx(Altschul等，(1997)Nucleic Acids Res25：3389-3402，和Karlin等，(1990)Proc Natl Acad SciUSA 87：2264-2268，两者被全部引入作为参考)所使用的算法。BLAST程序所采用的方法首先考虑了查询序列与数据库序列之间的具有或不具有缺口的相似片段，然后评价所有被识别的匹配物的统计学显著性并且最终仅仅加和那些满足显著性预选阈值的匹配物。为了讨论序列数据库相似性检索的基本问题，参见Altschul等，(1994)Nature Genetics 6：119-129，其内容被全部引入作参考。将直方图(histogram)、描述项(descriptions)、序列比对(alignments)、期待值(expect)(即用于反映相对于数据序列的匹配物的统计学显著性阈值)、截止(cutoff)、矩阵和过滤器(低复杂性)的检索参数设置在默认值。blastp，blastx，tblastn和tblastx所采用的默认评分矩阵是BLOSUM62矩阵(Henikoff等，(1992)Proc Natl Acad Sci USA89：10915-10919，被全部引入作为参考)，被推荐用于长度超过85个核苷酸或氨基酸的查询序列。

对于blastn，所述评分矩阵被设置成M(即匹配残基的奖励评分)与N(即错配残基的罚分)的比例，其中M和N的默认值分别为5和-4。四个blastn参数按照以下方式进行调节：Q＝10(缺口产生罚分)；R＝10(缺口延伸罚分)；wink＝1(查询序列的每个wink^th位置产生字串命中值)；和gapw＝16(设定其中产生缺口比对的窗口宽度)。Blastp的相应参数设定值是Q＝9；R＝2；wink＝1；和gapw＝32。10.0版本的GCG软件包中用于序列比较的Bestfit采用了DNA参数GAP＝50(缺口产生罚分)和LEN＝3(缺口延伸罚分)以及蛋白质比较过程中相应的设定值是GAP-8和LEN＝2。

“严紧条件”是如下：(1)采用了低离子强度和高温进行冲洗，例如在50℃下利用0.015M NaCl/0.0015M柠檬酸钠/0.1％SDS进行冲洗，或(2)在杂交过程中采用了变性剂如甲酰胺，例如在42℃下50％(vol/vol)的甲酰胺与0.1％牛血清白蛋白/0.1％Ficoll/0.1％聚乙烯吡咯烷酮/50mM pH 6.5的磷酸钠缓冲液与750mM NaCl，75mM柠檬酸钠。另一个例子是于42℃下在50％甲酰胺，5×SSC(0.75M NaCl，0.075M柠檬酸钠)，50mM的磷酸钠(pH 6.8)，0.1％的焦磷酸钠，5×Denhardt溶液，超声处理的鲑精DNA(50μg/ml)，0.1％SDS，和10％的葡聚糖硫酸酯中进行的杂交，并在42℃用0.2×SSC和0.1％SDS进行冲洗。技术人员能够轻而易举地适当确定和改变严紧条件从而获得清晰的和可检测的杂交信号。优选的分子是那些在上述条件下与SEQ ID NO：1，3，5，7，9，11，13或17的互补链杂交并且编码具有功能的或全长蛋白质的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO：1，3，5，7，9，11，13或17的可读框的互补链杂交的分子。

如本文中使用的，当核酸分子基本上从编码其它多肽的杂质核酸分子中分离时，所述核酸分子被认为是“分离的”。

本发明还提供了被公开的核酸分子的片段。本文中使用的核酸分子片段是指编码或非-编码序列的小的部分。片段的大小由使用目的来决定。例如，如果所述片段被选择用来编码所述蛋白质的活性部分，那么该片段则需要足够大以便编码所述蛋白的功能域。例如可以制备编码对应于预测抗原区域的肽的片段。如果所述片段被用作核酸探针或PCR引物，那么则需要对所述片段的长度进行选择从而使得探测/引发过程中出现的假阳性的数目较小(参见H部分的讨论)。

本发明被用作聚合酶链反应(PCR)的探针或特定引物或用来合成编码本发明的蛋白质的基因序列的核酸分子片段(即合成的寡核苷酸)可以通过化学技术，例如Matteucci等的亚磷酰胺技术((1981)J AmChem Soc 103：3185-3191)或利用自动合成法来轻而易举地得到。另外，大的DNA片段可以通过已经通晓的方法来制备，诸如合成一组限定该基因各个模块片段的寡核苷酸，接着连接这些寡核苷酸从而构建出完整的修饰基因。

本发明的核酸分子还可以被修饰成含有用于诊断和探针目的的可测标记物。许多这种标记物在本技术领域中是已知的并且可以轻易用于本文记载的编码分子。合适的标记物包括但不限于生物素、放射性或荧光标记的核苷酸等。技术人员可以轻而易举地采用任何这种标记物来获得本发明的核酸分子的标记变异体。

C.其它相关核酸分子的分离

如上所述，具有SEQ ID NO：1，3，5，7，9，11，13或17所示序列的核酸分子的鉴定和表征允许技术人员分离除本文记载的序列以外的编码该蛋白质家族中的其它成员的核酸分子。而且，本文公开的核酸分子允许技术人员分离除具有SEQ ID NO：2，4，6，8，10，12，14或18所示序列的蛋白质以外的编码蛋白质家族的其它成员的核酸分子。

例如，技术人员可以轻易地利用SEQ ID NO：2，4，6，8，10，12，14或18的氨基酸序列来制备抗体探针以便筛选从合适的细胞中制备的表达文库。典型地，得自哺乳动物如经纯化蛋白免疫的兔子(如下所述)的多克隆抗血清或单克隆抗体可以被用来探测哺乳动物的cDNA或基因组表达文库，诸如λgt11文库，从而获得编码蛋白质家族其它成员的合适序列。被克隆的cDNA序列可以以融合蛋白的形式进行表达，直接利用其自身的调控序列进行表达或通过利用适于用于表达酶的特定宿主的调控序列经构建体来进行表达。

或者，可以合成本文记载的编码序列的一部分片段并将其用作检测DNA的探针，该DNA编码源自哺乳动物的蛋白质家族的成员。制备含约18-20个核苷酸的低聚物(编码约6-7个氨基酸的片段)并将其用来筛选基因组DNA或cDNA文库从而实现在能够消除过高水平的假阳性的严紧条件或充分严紧的条件下的杂交。

另外，可以制备用于聚合酶链式反应(PCR)的寡苷酸引物对以便选择性地克隆一种编码核酸分子。利用这种PCR引物的PCR变性/退火/延伸循环在本技术领域中是熟知的并且非常适用于分离其它编码核酸分子。

利用任何可获得的算法，包括但不限于PSI-BLAST(Altschul等，(1997)Nucleic Acids Res 25：3389-3402)；PHI-BLAST(Zhang等，(1998)Nucleic Acids Res 26：3986-3990)，3D-PSSM(Kelly等，(2000)J Mol Biol 299(2)：499-520)和其它计算分析方法(Shi等，(1999)Biochem Biophys Res Commun 262(1)：132-138和Matsunami等，(2000)Nature 404(6778)：601-604)，还可以在已有基因组或其它序列中鉴定出编码蛋白质家族其它成员的核酸分子。

D.含核酸分子的rDNA分子

本发明还提供了含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是一种已经进行了原位分子操纵的DNA分子，用于产生rDNA分子的方法在本技术领域中是已知的，例如参见Sambrook等，Molecular Cloning-A Laboratory Manual，第三版，Cold SpringHarbor Laboratory Press，Cold Spring Harbor，NY，2001。在优选的rDNA分子中，DNA编码序列与表达控制序列和/或载体序列进行了可操作性的连接。

正如本技术领域所熟知的，可操作性地连接于本发明的蛋白家族编码序列的载体和/或表达控制序列的选择直接依赖于所需要的功能特性，例如蛋白质的表达，和待转化的宿主细胞。本发明所预期的载体至少能够指导rDNA分子中所含的结构基因在宿主染色体中的复制和插入，而且优选地还能指导rDNA分子中所含结构基因的表达。

被用于调节可操作连接的蛋白编码序列的表达的表达控制元件在本技术领域中是已知的，并且包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调节元件。优选地，所述诱导型启动子容易得到控制，诸如响应于宿主细胞培养基的营养成分。

在一个实施方案中，含有编码核酸分子的载体包括原核复制子，即一种能够指导自主复制和将重组DNA分子保持在经其转化的原核宿主细胞如细菌宿主细胞的染色体外的DNA序列。这种复制子在本技术领域中是已知的。另外，含有原核复制子的载体还可包括其表达产生一个可检测标记物如抗药性的基因。典型的细菌抗药性基因是那些对氨苄青霉素、卡那霉素、氯霉素或四环素具有抗性的基因。

含有原核复制子的载体可包含能够指导编码基因序列在细菌宿主细胞如大肠杆菌中进行表达(转录和翻译)的原核或噬菌体启动子。启动子是由允许RNA聚合酶的结合和转录进行的DNA序列形成的一种表达控制元件。适用于细菌宿主的启动子序列通常以质粒载体的形式来提供，所述质粒载体含有方便的限制性位点用于插入本发明的DNA片段。这种载体质粒的典型实例是从BioRad实验室(Richmond，CA)得到的pUC8，pUC9，pBR322和pBR329，从Pharmacia(Piscataway，NJ)得到的pPL和pKK223。

适用于真核细胞的表达载体，优选地是那些适用于脊椎动物细胞诸如胃细胞的表达载体，还可被用来制备含编码序列的rDNA分子。包括病毒载体在内的真核细胞表达载体在本技术领域中是已知的并且购自几个商业途径。通常，这种载体是以含有适于插入所需DNA片段的限制位点的形式提供。这种载体的典型实例是pSVL和pKSV-10(Pharmacia)，pBPV-1/pML2d(Interna tionational Biotechnologies，Inc.)，pTDT1(ATCC，#31255)，本文记载的载体pCDM8以及类似真核表达载体。如果需要，载体可以被修饰以含有胃细胞特异性启动子。

被用于构建本发明rDNA分子的真核细胞表达载体还可含有在真核细胞中有效的选择性标记物，优选地是一种药物抗性选择标记物。一种优选的药物抗性标记物是其表达产生新霉素抗性的基因，即新霉素磷酸转移酶(neo)基因(Southern等，(1982)J Mol Anal Genet1：327-341)。或者，选择性标记物可以存在于分开的质粒上，而且，两个载体通过共-转染宿主细胞而被引进，并且通过在适于该选择性标记物的合适药物中进行培养来进行选择。

E.含外源编码核酸分子的宿主细胞

本发明还提供了被编码本发明蛋白质的核酸分子转化的宿主细胞。所述宿主细胞既可以是原核细胞也可以是真核细胞。用于表达本发明蛋白质的真核细胞不受什么限制，只要所述细胞系适于细胞培养方法并适于表达载体的增殖和基因产物的表达就行。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞，优选脊椎动物细胞，如那些源自小鼠、大鼠、猴子或人细胞系的细胞。优选的真核宿主细胞包括得自ATCC的中国仓鼠卵巢(CHO)细胞CCL61，得自ATCC的NIH瑞士小鼠胚胎细胞(NIH/3T3)CRL 1658，幼小仓鼠肾细胞(BHK)和类似真核组织培养细胞系。

任何原核宿主可以被用来表达编码本发明蛋白质的rDNA分子。优选的原核宿主是大肠杆菌。

利用本发明的rDNA分子对适当宿主细胞进行的转化可以通过取决于所用载体和宿主系统类型的已知方法来实现。针对原核宿主细胞的转化，通常采用电穿孔和盐处理方法(参见，例如Cohen等，(1972)Proc Natl Acad Sci USA 69：2110；和Sambrook等，上文)。针对利用含rDNA分子的载体对脊椎动物细胞进行的转化，通常采用电穿孔、阳离子脂质或盐处理方法，参见例如Graham等，(1973)Virol 52：456；Wigler等，(1979)Proc Natl Acad Sci USA 76；1373-1376。

被成功转化的细胞，即含本发明rDNA分子的细胞，可以通过包括筛选选择性标记物的方法在内的已知技术进行鉴定。例如，可以克隆出引入本发明的rDNA的细胞以便制备单个菌落。得自这些菌落的细胞被收集和溶胞后，利用诸如由Southern，(1975)J Mol Bio l98：503或Berent等，(1985)Biotech 3：208记载的方法进行DNA含量检测以便确定rDNA的存在，或通过免疫学方法测定产自所述细胞的蛋白质。

F.利用rDNA分子生产重组蛋白质

本发明还提供了利用本文记载的核酸分子生产本发明蛋白质的方法。总之，重组形式的蛋白质的生产通常包括下列步骤：

首先，得到编码本发明蛋白质的核酸分子，诸如下列、基本由下列组成或由下列组成的核酸分子：SEQ ID NO：1，SEQ ID NO：3，SEQID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：17，SEQ ID NO：1的131-862位或131-859位核苷酸，SEQ ID NO：3的174-587位或174-584位核苷酸，SEQ ID NO：5的38-892位或38-895位核苷酸，SEQ ID NO：7的53-892位或53-895位核苷酸，SEQ ID NO：9的65-892位或65-895位核苷酸，或SEQ IDNO：11的92-892位或92-895位核苷酸，或SEQ ID NO：13的49-1437位或49-1434位核苷酸，或SEQ ID NO：17的75-575位或75-572位核苷酸。如果编码序列不被内含子所打断，如这些可读框，那么所述编码序列直接适用于在任何宿主中进行表达。

其次，如上所述，所述核酸分子优选地与合适的控制序列可操作性地连接从而形成一种含有蛋白可读框的表达单位。该表达单位被用于转化合适的宿主以及在能使重组蛋白产生的条件下培养该转化宿主。所述重组蛋白质可选择性地分离自培养基或细胞；在可以容忍某些杂质的情况下，所述蛋白的回收和纯化不是必需的。

上述每一个步骤能以各种方式进行。例如，所需的编码序列可以从基因组片段中获得并被直接用于合适的宿主中。如上所述，可以在各种宿主中操作的表达载体的构建是通过利用合适的复制子和控制序列完成的。控制序列、表达载体和转化方法取决于被用于表达基因的宿主细胞的类型并且已在以前进行过详细讨论。如果不能正常得到，可以将合适的限制位点加到编码序列的末端从而提供一种可剪切基因以便插入到这些载体中。一个技术人员可以轻而易举地对本技术领域中已知的宿主/表达系统进行改造以便适用于本发明的核酸分子来产生重组蛋白。

G.鉴定结合配偶体的方法

本发明的另一个技术方案提供了用于分离和鉴定本发明的结合配偶体的方法。总之，在能使潜在的结合配偶体与本发明的蛋白质结合的条件下将本发明的蛋白质与所述的潜在配偶体或细胞的提取物或级分相混合。混合后，从所述混合物中分离出结合了本发明蛋白质的肽、多肽、蛋白质或其它分子。然后除去与本发明蛋白质结合的结合配偶体并进一步进行分析。为了鉴定和分离结合配偶体，可以利用完整蛋白，例如含有SEQ ID NO：2，4，6，8，10，12，14或18的全长氨基酸序列的蛋白。或者，可以利用所述蛋白的片段。

本文中使用的细胞提取物是指由溶胞的或裂解的细胞制得的制品或级分。优选的细胞提取物的来源是得自人胃肿瘤或被转化的胃细胞的细胞，例如来源于胃癌的活检组织或组织培养细胞。或者，可以由正常组织或可得到的细胞系，尤其是得自胃的细胞系，来制备细胞提取物。

可以使用多种方法来获得细胞提取物。利用物理或化学裂解方法可以将细胞裂解。物理裂解方法的实例包括但不限于超声处理和机械剪切，化学溶胞方法的实例包括但不限于去污剂溶胞和酶溶胞。一名技术人员可以轻而易举地对制备细胞提取物的方法进行改变以便获得用于本发明的提取物。

一旦制备出细胞提取物，就在能使本发明的蛋白与结合配偶体进行结合的条件下将该提取物与本发明的蛋白质相混合。可以采用多种条件，最优选的是与人类细胞的胞质中的条件极其相似的条件。可以改变诸如摩尔渗透压浓度、pH、温度和所用细胞提取物的浓度的特性以便使所述蛋白质与结合配偶体的结合达到最佳状态。

在适当条件下混合后，从所述混合物中分离出结合的复合体。可以利用多种技术来对所述混合物进行分离。例如，特异于本发明蛋白质的抗体可以被用来免疫沉淀所述结合配偶体复合物。或者，可以采用标准化学分离技术如色谱法和密度/沉淀离心。

当除去所述提取物中的未结合细胞成分后，利用常规的方法就可以使结合配偶体从复合体中解离。例如，通过改变所述混合物的盐浓度或pH可以实现解离的目的。

为了有助于从所述混合提取物中分离出结合的结合配偶体对子，可以将本发明的蛋白质固定在固相载体上。例如，可以将蛋白质连接在硝化纤维素基质或丙烯酸珠子上。所述蛋白与固相载体的连接有助于从所述提取物中的其它组分中分离出肽/结合配偶体对子。被鉴定出来的结合配偶体可以是单一蛋白或由两种或多种蛋白组成的复合体。或者，可以利用在Takayama等，(1997)Methods Mol Biol 69：171-184或Sauder等，(1996)J Gen Virol 77：991-996中记载的方法用Far-Western测定法来鉴定结合配偶体，或者通过利用表位标记的蛋白或GST融合蛋白来鉴定结合配偶体。

或者，本发明的核酸分子可被用于酵母双杂交系统中或其它体内蛋白-蛋白检测系统。酵母双杂交系统已被用来鉴定其它蛋白质配偶体对子，并可以被适当地改变从而适用于本文所记载的核酸分子。

H. 鉴定调控编码胃癌相关基因的核酸的表达的介质的方法

本发明的另一个实施例提供了用于鉴定调控编码本发明蛋白的核酸的表达的介质的方法，所述本发明蛋白诸如是具有SEQ ID NO：2，4，6，8，10，12或18所示氨基酸序列的蛋白或Mst1蛋白或本发明的剪接变体，如具有SEQ ID NO：14所示氨基酸序列的蛋白。调控编码Mst1蛋白或剪接变体的核酸的表达的介质在治疗胃癌中具有特定的用途。这种测定法可以利用任何有效检测手段来检测本发明核酸的表达水平。只要本文中的介质能够上调或下调所述核酸在细胞中的表达，那么就认为其能调控本发明核酸的表达。

在一种测定形式中，可制备出在下列核苷酸和任何可检测的融合配偶体之间的报道基因融合体：由SEQ ID NO：1的131-862位核苷酸、SEQ ID NO：3的174-587位核苷酸、SEQ ID NO：5的38-895位核苷酸、SEQ ID NO：7的53-895位核苷酸、SEQ ID NO：9的65-895位核苷酸、SEQ ID NO：11的92-895位核苷酸、SEQ ID NO：13的49-1437位或49-1434位核苷酸、SEQ ID NO：17的75-575位核苷酸所定义的可读框和/或5’和/或3’调节元件。包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶在内的大量可测定融合配偶体是已知的并且容易得到(Alam等，(1990)Anal Biochem 188：245-254)。然后在适当条件和时间下使含报道基因融合体的细胞系与待测的介质进行接触。接触所述介质的样品与对照样品之间的报道基因的差异表达能够鉴定调控本发明核酸表达的介质。

可以采用其它测定形式来监测介质调控核酸表达的能力，所述核酸编码本发明蛋白质，诸如具有SEQ ID NO：2，4，6，8，10，12，14或18所示序列的蛋白质。例如，mRNA表达可以直接通过与本发明的核酸进行杂交来监测。在适当条件和时间下细胞系与待测介质进行接触并且总RNA或mRNA通过常规方法如那些被公开于Sambrook等，Molecular Cloning-A Laboratory Manual，Third Ed.，Cold SpringHarbor Laboratory Press，Cold Spring Harbor，NY，2001中的方法而得到分离。

优选的细胞是那些得自人胃组织，例如，胃活检组织的细胞或源自胃癌患者的培养细胞。可以使用细胞系如目录号为NCI-SNU-16，CRL-1863，HTB-103，CRL-1739和CRL-1864的ATCC胃癌细胞系。或者，可以使用其它可得到的细胞或细胞系。

用于检测接触了所述介质的细胞与对照细胞之间的RNA表达水平差异的探针可以由本发明的核酸来制备。更好地是，但不是必需的，设计仅与靶核酸在高严紧条件下进行杂交的探针。在高严紧条件下仅仅形成高度互补的核酸杂交体。因此，测定条件的严紧性决定两条核酸链之间为了形成杂交体应该存在的互补量。应当对严紧性进行选择从而使探针：靶标杂交体与探针：非靶标杂交体之间的稳定性差异最大化。

可以通过本领域中的已知方法由本发明的核酸设计探针。例如，探针的G+C含量和探针的长度能够影响探针与其靶序列的结合。使探针特异性最佳化的方法通常被记载在Sambrook等，上文，或Ausubel等，Short Protocols in Molecular Biology，第四版，John Wiley& Sons，Inc.，New York，1999中。

根据每一探针的需要，杂交条件利用已知方法来改变，所述已知方法诸如是由Sambrook等和Ausubel等记载的方法。总细胞RNA或富集了聚腺苷酸RNA的RNA的杂交能以任何可用形式得到实现。例如，在探针进行特异性杂交的条件下，总细胞RNA或富集了聚腺苷酸RNA的RNA可以被附着于固相载体，固相载体暴露于至少一种含有本发明的至少一种序列或本发明的一种序列的部分序列的探针。或者，含本发明的至少一种序列或本发明的一种序列的部分序列的核酸片段可以被附着于固相载体上，所述固相载体例如是硅片、多孔玻璃胶片或膜。然后在被附着的序列进行特异性杂交的条件下使所述固相载体与得自样品的总细胞RNA或聚腺苷酸RNA接触。这种固相载体和杂交方法是广泛可用的，例如由Beattie，(1995)WO 95/11755公开的方法。通过检测给定探针与源自未处理细胞群和与所述介质接触的细胞群的RNA样品进行特异性杂交的能力，可以鉴定出上调或下调核酸表达的介质，该核酸编码具有SEQ ID NO：2，4，6，8，10，12，14或18所示序列的蛋白质。

通过利用RNase Protection Assay(即RPA，参见Ma等，(1996)Methods 10：273-238)也可以实施适用于对mRNA进行定性和定量分析的杂交。简要地说，含编码基因产物的cDNA和噬菌体特定DNA依赖性RNA聚合酶启动子(例如T7，T3或SP6 RNA聚合酶)的表达载体在cDNA分子的3’端，噬菌体启动子的下游，被线性化，其中这种线性化分子被随后用作合成cDNA的被标记的反义转录物的模板，所述反义转录物是通过体外转录得到的。然后通过在含80％甲酰胺、40mM Pipes，0.4M NaCl和1mM EDTA的pH为6.4的缓冲液中进行45℃的过夜孵育来使被标记的转录物与被分离的RNA混合物(即总mRNA或分级的mRNA)进行杂交。然后在含40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中对所得到的杂交体进行消化。在使外来蛋白质失活并提取外来蛋白质后，将样品加载到分析用的尿素/聚丙烯酰胺凝胶上。

在另一个分析方法中，为了鉴定影响本发明基因产物表达的介质，首先鉴定生理表达本发明基因产物的细胞或细胞系。如此鉴定的细胞和/或细胞系可望含有必需的细胞结构以便当介质进行体外接触时转录结构的调控保真度被维持，所述介质具有适当的表面转导机制和/或胞质级联传导。而且，这种细胞或细胞系被表达载体(例如质粒或病毒载体)构建物转导或转染，所述表达载体构建物含有融合于一个或多个抗原性片段上的编码本发明基因产物的结构基因的可操作的非翻译5′末端(该末端含有启动子)，所述抗原性片段对于本发明基因产物来说是独特的，其中所述片段处于所述启动子的转录控制下并以其分子量不同于天然多肽的多肽形式进行表达或进一步含有免疫上不同的标签或其它可检测标记物。这种方法在本技术领域中是已知的(参见Sambrook等，见上文)。

然后在适当的条件下使上述被转导或转染的细胞或细胞系与介质接触。例如，药学可接受赋形剂中的介质与含水生理缓冲液如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐溶液(BSS)、含血清的PBS或BSS或者37℃下温育的含PBS或BSS和/或血清的条件培养基中的细胞接触。所述条件可以由本技术领域中的技术人员根据需要进行调节。细胞与所述介质接触后，将所述细胞进行裂解并且对溶胞产物的多肽进行分部分离，从而将多肽级分合并起来并且与抗体接触以通过免疫学测定方法进一步加工(例如，ELISA，免疫沉淀或蛋白质印迹)。将从“介质-接触的”样品中分离的蛋白的合并物与其中只有赋形剂与细胞接触的对照样品进行比较，并且由“介质-接触的”样品所产生的免疫学信号相对于对照物的增强或减弱来识别所述介质的有效性。

I.调控胃癌相关蛋白的水平或至少一种活性的介质的识别方法

本发明的另一个实施方案提供了用于鉴定调控本发明蛋白或本发明的Mst1蛋白或剪接变体的水平或至少一种活性的介质的方法，所述本发明蛋白例如是具有SEQ ID NO：2，4，6，8，10，12或18的氨基酸序列的蛋白，所述本发明的Mst1蛋白或剪接变体例如是具有SEQID NO：14的氨基酸序列的蛋白。这种方法或测定方法可以利用任何监控或检测所需活性的手段。

在一种情况下，可以检测与待测介质接触过的细胞群相对于未接触的对照细胞群的本发明蛋白的相对含量。在这种情况下，探针诸如特定抗体被用来监控所述蛋白在不同细胞群中的差异表达。在适当条件下和时间内使细胞系或细胞群与所述介质接触。可以从接触过的细胞系或细胞群和未接触过的对照细胞系或细胞群中制备细胞溶胞产物。然后利用探针对该细胞溶胞产物进行分析。

如果本发明的肽、多肽或蛋白质足够长，或如果需要，或如果需要加强免疫原性，则将所述肽、多肽或蛋白质结合到适当的载体上，就在适当的免疫方案中通过利用本发明的所述肽、多肽或蛋白质免疫合适的哺乳动物宿主来制备抗体探针。用于制备结合在载体如BSA，KLH或其它载体蛋白上的免疫原性缀合物的方法在本技术领域中是已知的。在某些情况下，利用例如碳二亚胺试剂直接进行缀合可能是有效的；在其它情况下，可能需要连接试剂如那些由Pierce ChemicalCo.(Rockford，IL)提供的连接试剂来提供对半抗原的可接近性。例如为了便于与载体进行连接，所述半抗原肽可以用半胱氨酸残基在氨基或羧基端进行延伸，或用半胱氨酸残基进行点缀。如本技术领域中所知晓的，通常通过适当长时间的注射和利用合适的佐剂来施用免疫原。在免疫程序中，测定抗体滴度以确定足够抗体的形成。

尽管以这种方式产生的多克隆抗血清可以满足某些用途，但对于药物组合物，单克隆制备物的利用是优选的。众所周知，可以利用Kohler和Milstein((1975)Nature 256：495-497)的标准方法或引起淋巴细胞或脾细胞的无限增殖的改进方法来制备分泌所需单克隆抗体的永生化细胞系。分泌所需抗体的无限增殖细胞系通过其中抗原是肽半抗原、多肽或蛋白质的免疫分析法来筛选。当鉴定了分泌所需抗体的适当的无限增殖细胞培养物后，可以体外培养所述细胞或通过利用腹水来制备所述细胞。

然后从培养上清中或从腹水上清中回收所需单克隆抗体。含有免疫学显性(抗原-结合)部分的单克隆抗体片段或多克隆抗血清以及完整抗体可被用作拮抗剂。利用免疫反应(抗原-结合)性抗体片段，诸如Fab，Fab’或F(ab’)₂片段通常是优选的，尤其是在治疗方面，因为这些片段的免疫原性通常比完整免疫球蛋白的免疫源性小。

抗体或抗原-结合型片段还可以利用现有技术，通过重组手段来生产。与所述蛋白的所需区域特异结合的抗体区域可以产生于多个物种来源的嵌合体中，诸如人源化抗体中。

可以对以上述方法测定的介质进行随机选择或理性选择或设计。本文中的介质是随机选择的，这里指这样的介质是随机选择的而没有考虑参与与本发明蛋白单独结合或联合相关的底物、结合配偶体等与本发明蛋白结合的特定序列。随机选择的介质的实例是利用化学文库或肽组合文库或微生物培养肉汤。

当在考虑了靶位点的序列和/或与所述介质的作用有关的构象的非随机基础上选择本文使用的介质时，所述介质被认为是理性选择或设计的。可以利用组成这些位点的肽序列对介质进行理性的选择或设计。例如，理性选择的肽介质可以是其氨基酸序列与任何功能性共有序列位点相同的肽或其氨基酸序列是任何功能性共有序列位点的衍生物的肽。

本发明的介质可以是，例如肽、小分子、维生素衍生物以及碳水化合物。可以将显性失活蛋白，编码这些蛋白的DNA、针对这些蛋白的抗体、这些蛋白的肽片段或这些蛋白的模拟物引进细胞来实现功能。本文使用的“模拟物”是指对肽分子的一个区域或几个区域进行修饰从而使其化学结构有别于母本肽而拓扑学和功能却类似于母本肽(参见Grant：Molecular Biology and Biotechno logy，Meyers编辑，659-664页，VCH Publishers，Inc.，纽约，1995)。技术人员可以轻而易举地得知本发明介质的结构特性不受限定。

本发明的肽介质可以利用在本技术领域中已知的标准固相(或液相)肽合成法来制备。另外，编码这些肽的DNA可以利用商购寡核苷酸合成仪来合成并且利用常规重组生产体系来进行重组制备。如果包含非基因编码氨基酸，那么利用固相肽合成法的生产则成为必需。

本发明的另一种介质是与本发明蛋白的关键位点发生免疫反应的抗体。抗体介质通过用肽对合适哺乳动物主体进行免疫而获得，所述肽含有要作为所述抗体的靶标的那些蛋白部分作为免疫原性区域。

J.调控胃癌相关蛋白的表达或至少一种活性的介质的用途

如实施例所提供的，本发明的蛋白和核酸，诸如具有SEQ ID NO：2，4，6，8，10，12或18所示氨基酸序列的蛋白，和本发明的Mst1或Mst1剪接变体蛋白和核酸，诸如具有SEQ ID NO：14所示氨基酸序列的蛋白，在胃癌组织进行差异性表达。上调或下调或调控蛋白质表达或蛋白质至少一种活性的介质，诸如激动剂或拮抗剂，可以被用来调控与蛋白质功能和活性有关的生物和病理的过程。

例如，两种类型的药物已经被证明通过Mst1(例如，GenBank序号为NM_006282，核酸序列和蛋白序列分别如SEQ ID NO：15和16所示)，一种与SEQ ID NOS：13和14相关的基因，起作用。首先，已经证明二膦酸盐，即被用来治疗骨质疏松和其它骨病的药物，直接作用于破骨细胞从而在编程性细胞死亡的过程中诱导Mst1的caspase裂解。其次，cytotrienin A是一种被用来治疗白血病、乳腺癌和肺癌的抗肿瘤药物(美国专利US 6,251,885)。Cytotrienin A已经被证明在cytotrienin A-诱导的编程性细胞死亡过程中能够激活Mst1(Watabe等，(2000)J Biol Chem 275：8766-8771)。

在本文中，主体可以是任何哺乳动物，只要所述哺乳动物需要调控由本发明的蛋白介导的病理学或生物学过程就行。术语“哺乳动物”被定义为是一种属于哺乳动物纲的个体。本发明被特别用于人体的治疗。

病理学过程是指一类产生有害作用的生物过程。例如，本发明的蛋白表达可能与胃细胞的生长或增生有关。在本文中，介质被认为能够调控病理学过程，就是指所述介质降低了所述过程的程度或严重性。例如，可以通过施用以某种方式上调或下调或调控本发明蛋白的表达或至少一种活性的介质来预防胃癌或调控疾病进展。

本发明的介质能以单独的形式进行提供，或者以与其它调控特定病理学过程的介质组合的形式来提供。例如，本发明的介质可以与其它已知药物联合进行施用。在本文中，当两种介质同时施用或以所述介质同时发挥作用的方式分别独立地施用时，所述两种介质就被认为是进行联合施用的。

本发明的介质可以通过非肠道、皮下、静脉内、肌内、腹膜内、透皮或口腔途径进行用药。替代性地，或同时地，可以通过口服进行用药。用药剂量将取决于受试者的年龄、健康和重量，共同治疗的类型(如果有的话)，还取决于治疗的频率和所需作用的特性。

本发明进一步提供了含有一种或多种调控本发明蛋白的表达或至少一种活性的介质的组合物。尽管个体需要会变化，确定每个组分的有效量的优化范围是本技术领域中的技术人员所能控制的。典型的剂量含有0.1至100μg/kg体重。优选的剂量含有0.1至10μg/kg体重。最优选的剂量含有0.1至1μg/kg体重。

除了药理学活性介质外，本发明的组合物可以含有适当的药学可接受载体以递送至作用位点，该载体含有有利于将所述活性化合物加工成可被药学利用的制剂的赋形剂和辅剂。适用于非肠道用药的制剂包括水溶形式的活性化合物的水溶液，例如水溶性盐。另外，可以施用活性化合物的悬液例如合适的含油注射悬液。合适的亲脂性溶剂或载体包括脂肪油，例如芝麻油，或合成脂肪酸酯，例如乙基油酸酯或甘油三酯。注射用水悬液可以含有增加悬液粘度的物质，这种物质包括，例如，羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地，所述悬液还可以含有稳定剂。脂质体也能被用来将所述介质包囊化以便输入到细胞内。

本发明的全身用药的药物制剂可以被配制成适于肠内、非肠道或局部用药。实际上，所有三种类型的制剂都可以被用来实现活性成分的全身用药。

合适的口服制剂包括硬明胶胶囊剂或软明胶胶囊剂、丸剂、片剂包括有包衣的片剂、酏剂、悬液、糖浆或吸入剂及其控释剂型。

为了实施本发明的方法，本发明的化合物可以进行单独使用，或以与其它治疗剂或诊断试剂联合的形式使用。在某些优选的实施例中，根据通常接受的医学实践，本发明的化合物可以与其它化合物一起共同施用，所述化合物被通常指定用于这些病症。本发明的化合物可以进行体内用药或体外用药，通常在哺乳动物体内用药，所述哺乳动物诸如是人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠。

K.转基因动物

本发明也包括含有突变、敲除或修饰基因的转基因动物，所述基因对应于SEQ ID NO：1，3，5，7，9，11，13或17所示的cDNA序列或编码SEQ ID NO：2，4，6，8，10，12，14或18所示多肽序列或其具有至少约3，4，5，6，10，15，20，25，30，35或更多个氨基酸残基的连续序列的片段的可读框。转基因动物是其体内已通过实验转入了重组的、外源的或克隆的遗传物质的被遗传修饰的动物。这种遗传物质通常被称作“转基因”。在本案中，可以将SEQ ID NO：1，3，5，7，9，11，13或17形式的转基因核酸序列整合到其中该特定核酸通常不存在的基因组的基因座上或整合到该转基因的正常基因座上。所述转基因可由得自相同物种或不同于靶动物物种的其它物种的基因组的核酸序列组成。

在某些实施方案中，可以构建其中缺失了含SEQ ID NO：1，3，5，7，9，11，13或17所示基因的全部或部分片段的转基因动物。当对应于SEQ ID NO：1，3，5，7，9，11，13或17的基因含有一个或多个内含子时，可以删除全长基因，即所有外显子、内含子和调控序列。或者，可以删除全长基因的一部分序列。例如，可以删除单个外显子和/或内含子，以便创建一种表达经修饰的本发明蛋白的动物。

术语“生殖细胞系转基因动物”是指其中生殖细胞进行了遗传改构或引入了遗传信息从而赋予了转基因动物将遗传信息传给后代的能力的转基因动物。如果这种后代事实上拥有了一部分或全部的遗传改构或遗传信息，那么它们也是转基因动物。

所述改构或遗传信息相对受体所属动物品种来说可以是外源的，仅相对该特定个体受体是外源的或者可以是已经被受体拥有的遗传信息。在最后一种情况下，被改构或引进的基因与天然基因的表达可能有差异。

转基因动物可以通过多种不同的方法来生产，所述方法包括转染、电穿孔、显微注射、基因在胚胎干细胞中的定位以及重组病毒和逆转录病毒传染(参见例如US专利号4736866；US专利号5602307；Mullins等，(1993)Hypertension 22：630-633；Brenin等，(1997)Surg Oncol 6：99-110；Recombinant Gene Expression Protocols(Methods in Molecular Biology，Vol.62)，Tuan编辑，Humana出版社，Totowa，NJ，1997)。

已经制备出许多重组或转基因小鼠，包括那些表达活化的致癌基因序列(US专利号4,736,866)；表达猿SV40 T-抗原(US专利号5,728,915)；不进行干扰素调控因子1(IRF-1)表达(US专利号5,731,490)；表现出多巴胺能机能障碍(US专利号5,723,719)；表达至少一种参与血压调控的人类基因(US专利号5,731,489)；表现出与自然发生的阿尔茨海墨氏病中存在的症状更相似的症状(US专利号5,720,936)；介导细胞粘附的能力降低(US专利号5,602,307)；具有牛生长激素基因(Clutter等，(1996)Genetics 143：1753-1760)；或能够产生完全人体抗体应答(McCarthy(1997)Lancet 349：405)的重组或转基因小鼠。

尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物，但是，在某些情况下，优选地或必要地是利用其它动物品种。转基因方法已被成功用于多种非-鼠科动物，这些动物包括绵羊、山羊、猪、狗、猫、猴子、黑猩猩、仓鼠、兔子、牛和豚鼠(参见例如Kim等，(1997)MolReprod Dev 46：515-526；Houdebine，(1995)Reprod Nutr Dev35：609-617；Petters(1994)Reprod Fertil Dev 6：643-645；Schnieke等，(1997)Science 278：2130-2133；和Amoah，(1997)JAnimal Science 75：578-585)。

将核酸片段引入能够重组的哺乳动物细胞的方法可以是任何利于进行多个核酸分子的共转化的方法。用于生产转基因动物的详细过程对于本技术领域的技术人员来说很容易获得，包括US专利号5,489,743和US专利号5,602,307所公开的内容。

L.诊断方法

本发明的基因和蛋白在胃癌细胞和其它恶性肿瘤细胞中的表达不同于在同类型的非癌性组织中的表达，因此本发明的基因和蛋白可以被用来诊断或监控这种癌或跟踪疾病的进程。一种利用本发明的核酸分子或蛋白诊断包括胃癌在内的癌症的手段涉及从活体如活检组织样本中获得组织。

分子生物学工具的利用已经成为常规的法医技术。例如，含有SEQID NO：1，3，5，7，9，11，13或17所示序列的全长序列或至少部分序列的核酸探针可以被用来测定法医/病理样本中的核酸分子的表达。而且，核酸分析可以通过任何转录图谱分析手段来进行。除了核酸分析，本发明的法医方法可以指向本发明的蛋白，尤其是一种含SEQID NO：2，4，6，8，10，12，14，16，18或20的蛋白，来确定基因的上调或下调(Shiverick等，(1975)Biochim Biophys Acta393：124-133)。

本发明的方法可以包括利用胶原酶或其它蛋白酶进行的组织处理来使组织易于细胞溶解(Semenov等，(1987)Biull Eksp Biol Med104：113-116)。而且，有可能从分析用的胃的不同区域获得活检组织样品。

检测本发明核酸或蛋白分子的试验可以是任何可利用的形式。用于核酸分子的常规测定方法包括杂交或基于PCR的方法。用于检测本发明的蛋白、多肽或肽的常规试验包括任何可利用形式的抗体探针的使用，如原位结合试验等(参见Harlow & Lane，Antibodies-ALaboratory Manual，Cold Spring Harbor Laboratory Press，ColdSpring Harbor，NY，1988)。在一个优选的实施方案中，试验利用适当的对照来进行。

上述方法还可以被用于其它诊断方案，包括检测其它组织或器官的疾病状况的方案和方法，例如其中检测到表达本发明的核酸分子的组织。

无需再描述，确信本技术领域的普通技术人员能够利用前面的描述和下面的说明性实施例制备和利用本发明的化合物并实施所要求的方法。因此下面的实施例具体指出了本发明的优选实施方案。并且无论如何不应被解释为是对所公开的其余部分的限定。

实施例

实施例 1a

对晚期胃癌中差异表达的mRNA进行的鉴定

材料和方法

将患者组织样品从5名年龄在47-68岁的朝鲜患者(包括四名男性和一名女性)体内取出，所述朝鲜患者被诊断患有晚期胃癌。对于每名患者来说，从胃的两个区域中取得组织来制备一套活检组织样品，所述两个区域是胃肿瘤和非癌性区域。对每个组织样品进行组织学分析，并将样品分类成非癌类或癌类。

按照Affymetrix GeneChip Expression Analysis Manual(稍加改动)制备样品。首先利用Spex Certiprep 6800 Freezer Mil将冷冻组织研磨成粉末。然后利用Trizol(Life Technologies)提取总RNA。每个样品的总RNA产率(组织平均重量为300mg)是200-500μg。接着，利用Oligotex mRNA Midi试剂盒(Qiagen)分离mRNA。由于mRNA洗脱于终体积400μl中，因此需要通过乙醇沉淀步骤将浓度变到1μg/μl。利用1-5μg的mRNA，通过SuperScript Choice系统(Gibco-BRL)制备双链cDNA。采用T7-(dT₂₄)寡核苷酸引发第一链cDNA链的合成。然后对cDNA进行酚-氯仿提取，并且进行乙醇沉淀直到终浓度为1μg/μl。

从2μg的cDNA，按照常规方法合成cRNA。为了对cRNA进行生物素标记，将核苷酸Bio-11-CTP和Bio-16-UTP(Enzo Diagnostics)加到反应物中。在37℃下温育6小时后，按照RNeasy Mini试剂盒方案(Qiagen)清理被标记的cRNA。然后在94℃下对cRNA进行35分钟的片段化(5×片段化缓冲液：200mM Tris-醋酸盐(pH 8.1)，500mMKOAc，150mM MgOAc)。

在45℃的杂交箱中以60rpm将55μg片段化的cRNA杂交到Affymetrix Human Genome装置U95和U133的阵列上，杂交进行24小时。冲洗芯片并在Affymetrix流体平台中用StreptavidinPhycoerythrin(SAPE)(Molecular Probes)对所述芯片进行染色。为了增强染色，两次加入SAPE溶液，在两次之间有一个抗-链霉亲和素生物素化抗体(Vector Laboratories)染色步骤。利用荧光测定扫描技术(Hewlett Packard Gene Array Scanner)检测探针阵列上的杂交。杂交和扫描后，对微阵列图像进行分析以进行质量控制，寻找出芯片的主要缺陷或杂交信号中的异常。当所有芯片通过QC后，利用Affymetrix Microarray Suite(v4.0)和LIMS(v1.5)分析U95的数据，或用Affymetrix Microarray Suite(v5.0)和LIMS(v3.0)分析U133的数据。

按照以下统计学方法，通过利用Affymetrix human GeneChip装置U95和U133来测定癌性或非癌性肝组织样品之间的基因差异性表达。(1)对于每种基因，Affymetrix GeneChip的U95平均差值通过利用Affymetrix Microarray Suite(v4.0)来测定，其中AffymetrixMicroarray Suite(v4.0)还针对每个GeneChip单元设定“Absent”(＝未检测到)，“Present”(＝检测到的)或“Marginal”(＝不能清楚地确定Absent或Present)这三个指征。U133的信号值通过AffymetrixMicroarray Suite(v5.0)来测定，Affymetrix Microarray Suite(v5.0)也设定了Absent、Present或Marginal这三个指征。(2)以癌性和非癌性肝组织样品中的至少10％Present指征以及癌性或非癌性肝组织样品组中的至少40％Present指征为标准，选择一组基因用于进一步分析。(3)基于U95数据的平均差值，将该组基因分成两组，一个高表达组和一个低表达组。高表达组含有在癌性和非癌性样品中平均差值大于或等于5的基因。其余的基因被包含在低表达组中。对于高表达组来说，平均差值被转化成对数值，而对于低表达组来说没有转化。对于U133数据，所有信号值都被转化为对数值，而不考虑表达水平。(4)Analysis of Variance(ANOVA)方法被用于数据分析(Steel等，Principles and Procedures of Statistics：A Biome tricalApproach，Third Ed.，McGraw-Hill，1997)。在进行最终分析前，排除法(leave-one-out)被用于外部(outlier)检测。ANOVA分析中每次排除一个样品来确定是否从分析中省略一个特定样品对最终结果具有显著影响。如果有影响，就从最终分析中排除那个特定样品。外部检测后，差异表达的p值小于或等于0.05的一列基因通过ANOVA来产生。来源于Affymetrix GeneChip U133芯片的数据也利用相似方法来分析。(5)另外两个标准被用来减少基因列表中的得自U95的基因数目。首先，比较非癌性对照组样品与癌症组样品之间的几何平均值从而获得一组表达水平提高或降低至少2倍的基因。其次，变化倍数值与p值的比例应该为400或更高。

结果与分析

a)LBFL301基因家族：

芯片数据的分析结果表明胃癌样品与得自正常胃组织的样品相比，标记物LBFL301的表达明显上调了(13.75-倍；p＝0.0172)。这些数据表明LBFL301的上调可以被用于胃癌的诊断。

LBFL301(SEQ ID NO：1或3)的表达水平可以分别采用AffymetrixGeneChipsU95和U133，通过利用序号为48774_at和225681_at的芯片序列片段来测定。不同恶性肿瘤中的48774_at和225681_at相对于正常对照组织的表达水平见表1a，其中还显示了变化倍数和变化的趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。

表1a

Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat
Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat	48774_at	骨头，NOS	恶性骨癌，NOS	骨巨细胞瘤，NOS	5.7	上调	3.5
225681_at	乳房，NOS	女性恶性乳腺癌，NOS	浸润管癌	3.4	上调	12.1	48774_at	骨头，NOS	恶性骨癌，NOS	骨巨细胞瘤，NOS	5.7	上调	3.5
225681_at			浸润管癌	3.4	上调	12.1	225681_at	浸润管和小叶癌	3.3	上调	3.3
225681_at			浸润小叶癌	2.8	上调	5.3	225681_at	浸润管和小叶癌	3.3	上调	3.3
225681_at			浸润小叶癌	2.8	上调	5.3	225681_at	子宫颈，NOS	恶性子宫颈癌	鳞状细胞癌，NOS	3.6	上调	3.4
225681_at	结肠，NOS	恶性结肠癌，NOS	粘液性腺癌	12.7	上调	2.5	225681_at	子宫颈，NOS	恶性子宫颈癌	鳞状细胞癌，NOS	3.6	上调	3.4
225681_at			粘液性腺癌	12.7	上调	2.5	225681_at	腺癌，NOS	6.9	上调	7.9
225681_at			子宫内膜，NOS	恶性子宫内膜癌	米勒混合瘤	11.0	225681_at	腺癌，NOS	6.9	上调	7.9	上调	5.5
	腺癌，NOS	2.2			米勒混合瘤	11.0	上调	3.7				上调	5.5
	腺癌，NOS	2.2			225681_at	食管，NOS	上调	3.7	恶性食管癌，NOS	腺癌，NOS	7.2	上调	3.6
225681_at	肾，NOS	恶性肾癌，NOS	透明细胞腺癌，NOS	9.8	225681_at	食管，NOS	上调	5.4	恶性食管癌，NOS	腺癌，NOS	7.2	上调	3.6
225681_at			透明细胞腺癌，NOS	9.8	225681_at	维耳姆斯氏瘤	上调	5.4	7.2	上调	3.4
225681_at			喉，NOS	恶性喉癌，NOS	225681_at	维耳姆斯氏瘤	鳞状细胞瘤，NOS	6.6	7.2	上调	3.4	上调	4.3
225681_at	225681_at	肝脏，NOS	喉，NOS	恶性喉癌，NOS	继发性恶性肝癌，NOS	腺癌，NOS	鳞状细胞瘤，NOS	6.6	12.4	上调	3.5	上调	4.3
225681_at	225681_at	肝脏，NOS	肺，NOS	恶性肺癌，NOS	继发性恶性肝癌，NOS	腺癌，NOS	鳞状细胞癌，NOS	5.4	12.4	上调	3.5	上调	5.4
225681_at	225681_at	腺癌，NOS			4.4	上调	鳞状细胞癌，NOS	5.4	5.1			上调	5.4
225681_at	225681_at	腺癌，NOS			4.4	上调	淋巴结，NOS	继发性恶性淋巴结癌，NOS	5.1	鳞状细胞癌	4.1	上调	2.7
225681_at	225681_at	恶性淋巴和组织细胞组织癌，NOS	恶性淋巴瘤，NOS	-4.3	下调	-3.2		继发性恶性淋巴结癌，NOS		鳞状细胞癌	4.1	上调	2.7
225681_at	225681_at	恶性淋巴和组织细胞组织癌，NOS	恶性淋巴瘤，NOS	-4.3	下调	-3.2		网膜，NOS	恶性网膜癌	乳头状浆液腺癌	7.2	上调	4.1
225681_at	225681_at	继发性恶性网膜癌	乳头状浆液腺癌	4.8	上调	4.3			恶性网膜癌	乳头状浆液腺癌	7.2	上调	4.1
225681_at	225681_at		乳头状浆液腺癌	4.8	上调	4.3	米勒混合瘤		4.7	上调	11.0
225681_at	225681_at		卵	恶性卵巢癌	腺癌，NOS	13.8	米勒混合瘤		4.7	上调	11.0	上调	2.6

225681_at	巢，NOS		浆液囊细胞腺癌，NOS	10.7	上调	2.8
225681_at			浆液囊细胞腺癌，NOS	10.7	上调	2.8	225681_at	卵巢不明性质的癌	卵巢甲状腺肿样瘤	9.5	上调	6.4
225681_at		恶性卵巢癌	乳头状浆液腺瘤	7.7	上调	3.7	225681_at	卵巢不明性质的癌	卵巢甲状腺肿样瘤	9.5	上调	6.4
225681_at		恶性卵巢癌	乳头状浆液腺瘤	7.7	上调	3.7	225681_at	继发性恶性卵巢癌	腺癌，NOS	6.9	上调	3.7
225681_at		卵巢不明性质的癌	浆液囊细胞腺癌，边缘癌	5.3	上调	7.2	225681_at	继发性恶性卵巢癌	腺癌，NOS	6.9	上调	3.7
225681_at		卵巢不明性质的癌	浆液囊细胞腺癌，边缘癌	5.3	上调	7.2	225681_at	胰腺，NOS	恶性胰腺癌，NOS	腺癌，NOS	7.8	上调	9.3
225681_at	直肠，NOS	恶性直肠癌	腺癌，NOS	7.7	上调	5.8	225681_at	胰腺，NOS	恶性胰腺癌，NOS	腺癌，NOS	7.8	上调	9.3
225681_at	直肠，NOS	恶性直肠癌	腺癌，NOS	7.7	上调	5.8	225681_at	软组织，NOS	结缔组织和其它软组织不明性质的肿瘤，NOS	纤维瘤	12.5	上调	7.6
225681_at	结缔组织和其它软组织的继地性恶性病，NOS	鳞状细胞癌，NOS	5.3	上调	3.2		225681_at		结缔组织和其它软组织不明性质的肿瘤，NOS	纤维瘤	12.5	上调	7.6
225681_at	结缔组织和其它软组织的继地性恶性病，NOS	鳞状细胞癌，NOS	5.3	上调	3.2	225681_at	结缔组织和其它软组织的恶性病，NOS		纤维组织细胞瘤，恶性	3.7	上调	3.1
225681_at	胃，NOS	恶性胃癌，NOS	腺癌，NOS	3.6	上调	225681_at	结缔组织和其它软组织的恶性病，NOS		纤维组织细胞瘤，恶性	3.7	上调	3.1	3.5
225681_at			腺癌，NOS	3.6	上调	225681_at	印戒细胞癌	3.5	上调	4.5			3.5
225681_at			甲状腺NOS	恶性甲状腺癌	乳头状瘤，NOS	225681_at	印戒细胞癌	3.5	上调	4.5	4.5	上调	4.1

表2列出了从利用Affymetrix GeneChip的实验中收集的组织类型差异表达数据。对芯片进行扫描并利用相关专利申请60/331,182，60/388,745和60/390,608中记载的GX Scan算法对数据进行分析，其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-based Algorithm for Organizing andMining Gene Expression Data Derived from Biological Sampleswith Complex Clinical Attributes)”，而且其全部内容被引入本文作参考。

表2-LBFL301(U95：48774_at，U133：225681_at)：克隆AD12 & CH4

源自U95数据的48774_at 源自U133数据的225681_at

1.骨升高 —

2.乳房升高升高

3.子宫颈升高升高

4.结肠升高升高

5.子宫内膜升高升高

6.食道升高升高

7.肾升高升高

8.喉升高升高

9.肝脏升高升高

10.肺升高升高

11.网膜升高升高

12.卵巢升高升高

13.胰腺升高升高

14.直肠升高升高

15.软组织升高升高

16.胃升高升高

17.甲状腺升高升高

通过使样品与芯片序列片段48774_at结合测定到的GeneChip表达结果由利用Taqman检测物(Perkin-Elmer)的定量RT-PCR得到证实。在测定中使用了由特定的Affymetrix片段(48774_at)的sif序列设计的PCR引物。每个RNA样品(10ng的总RNA)中的靶基因相对于外源性掺入(spike)的参比基因进行分析。出于这一目的，四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(cycle threshold)(Ct)相对于恒定的Tet掺入物的Ct值测定的相对表达。样品组包括用U95 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外，没有用GeneChip分析的几个新样品被用于定量RT-PCR中以对表达进行验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL301的上调。

b)LBFL304基因家族：

芯片数据的分析表明AGC样品中的标记物LBFL304的表达与得自正常胃组织的样品中的标记物LBFL304的表达相比被明显地上调了(对于U95为3.5-倍，p＝2.54×10^-3；对于U133为6.13-倍，p＝2.43×10^-4)。该数据表明LBFL304的上调可被用于胃癌的诊断。

LBFL304(SEQ ID NO：5，7，9或11)的表达水平可以通过利用Affymetrix GeneChipsU95上的序号为35832_at的芯片序列片段和利用Affymetrix GeneChipsU133上的序号为212344_at，212353_at和212354的芯片序列片段来测定。相对于正常对照组织，各种恶性肿瘤中的51263_at，212344_at，212353_at，和212354_at的表达水平被列于表1b，其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。

通过使样品结合到序号为35832_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(35832_at)的序列信息文件设计的PCR引物被用于分析当中。相对于外源加入的参比基因，检测了每一RNA样品(10ng总RNA)中的目标基因。为了这个目的，将四环素抗性基因用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U95 GeneChip测定的正常胃(Normal)组织和晚期胃癌(AGC)组织RNA。另外，没有用GeneChip分析的几个新样品被用于通过Q-RT-PCR对表达进行验证。相对于正常胃活检组织样品，Q-RT-PCR数据证实了AGC中观察到的LBFL304的上调。

表1b

表1
表1							Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat
212344_at	骨头，NOS	恶性骨癌，NOS	骨巨细胞瘤，NOS	6.8	上调	6.9	Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat
212344_at		恶性骨癌，NOS	骨巨细胞瘤，NOS	6.8	上调	6.9	212353_at	恶性骨癌，NOS	骨巨细胞瘤，NOS	5.5	上调	5.7
212354_at		恶性骨癌，NOS	骨巨细胞瘤，NOS	5.9	上调	7.1	212353_at	恶性骨癌，NOS	骨巨细胞瘤，NOS	5.5	上调	5.7
212354_at		恶性骨癌，NOS	骨巨细胞瘤，NOS	5.9	上调	7.1	35832_at	恶性骨癌，NOS	骨巨细胞瘤，NOS	10.6	上调	5.7
212344_at		结肠，NOS	恶性结肠癌，NOS	粘液性腺癌	3.7	上调	35832_at	恶性骨癌，NOS	骨巨细胞瘤，NOS	10.6	上调	5.7	2.8
212344_at	212344_at		恶性结肠癌，NOS	粘液性腺癌	3.7	上调	恶性结肠癌，NOS	腺癌，NOS	2.7	上调	7.9		2.8
212353_at	212344_at		恶性结肠癌，NOS	粘液性腺癌	5.7	上调	恶性结肠癌，NOS	腺癌，NOS	2.7	上调	7.9	3.7
212353_at	212353_at		恶性结肠癌，NOS	粘液性腺癌	5.7	上调	恶性结肠癌，NOS	腺癌，NOS	4.1	上调	9.0	3.7
212354_at	212353_at		恶性结肠癌，NOS	粘液性腺癌	4.7	上调	恶性结肠癌，NOS	腺癌，NOS	4.1	上调	9.0	3.5
212354_at	212354_at		恶性结肠癌，NOS	粘液性腺癌	4.7	上调	恶性结肠癌，NOS	腺癌，NOS	3.0	上调	8.6	3.5
35832_at	212354_at		恶性结肠癌，NOS	粘液性腺癌	9.4	上调	恶性结肠癌，NOS	腺癌，NOS	3.0	上调	8.6	3.8
35832_at	35832_at		恶性结肠癌，NOS	粘液性腺癌	9.4	上调	恶性结肠癌，NOS	腺癌，NOS	6.5	上调	10.2	3.8

表1b

表1
表1							Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat
212344_at	软组织，NOS	结缔组织和其它软组织恶性癌，NOS	纤维组织细胞癌，恶性的	2.7	上调	3.2	Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat
212344_at		结缔组织和其它软组织恶性癌，NOS	纤维组织细胞癌，恶性的	2.7	上调	3.2	212353_at	结缔组织和其它软组织恶性癌，NOS	纤维组织细胞癌，恶性的	2.1	上调	2.2
212353_at		结缔组织和其它软组织恶性癌，NOS	粘液样脂肉瘤	-2.7	下调	-2.4	212353_at	结缔组织和其它软组织恶性癌，NOS	纤维组织细胞癌，恶性的	2.1	上调	2.2
212353_at		结缔组织和其它软组织恶性癌，NOS	粘液样脂肉瘤	-2.7	下调	-2.4	212354_at	结缔组织和其它软组织恶性癌，NOS	纤维组织细胞瘤，恶性的	2.2	上调	2.6
35832_at		结缔组织和其它软组织恶性癌，NOS	纤维组织细胞瘤，恶性的	3.5	上调	2.6	212354_at	结缔组织和其它软组织恶性癌，NOS	纤维组织细胞瘤，恶性的	2.2	上调	2.6
35832_at		结缔组织和其它软组织恶性癌，NOS	纤维组织细胞瘤，恶性的	3.5	上调	2.6	35822_at	结缔组织和其它软组织恶性癌，NOS	脂肪肉瘤，NOS	4.8	上调	2.6
212344_at		子宫内膜，NOS	恶性子宫内膜癌	米勒混合瘤	2.4	上调	35822_at	结缔组织和其它软组织恶性癌，NOS	脂肪肉瘤，NOS	4.8	上调	2.6	3.3
212344_at	212344_at		恶性子宫内膜癌	米勒混合瘤	2.4	上调	恶性子宫内膜癌	腺癌，NOS	2.2	上调	5.5		3.3
212353_at	212344_at		恶性子宫内膜癌	米勒混合瘤	1.9	上调	恶性子宫内膜癌	腺癌，NOS	2.2	上调	5.5	2.9
212353_at	212353_at		恶性子宫内膜癌	米勒混合瘤	1.9	上调	恶性子宫内膜癌	腺癌，NOS	2.0	上调	4.2	2.9
212354_at	212353_at		恶性子宫内膜癌	米勒混合瘤	2.0	上调	恶性子宫内膜癌	腺癌，NOS	2.0	上调	4.2	2.7
212354_at	212354_at		恶性子宫内膜癌	米勒混合瘤	2.0	上调	恶性子宫内膜癌	腺癌，NOS	1.9	上调	4.7	2.7
35832_at	212354_at		恶性子宫内膜癌	米勒混合瘤	3.0	上调	恶性子宫内膜癌	腺癌，NOS	1.9	上调	4.7	3.9
35832_at	35832_at		恶性子宫内膜癌	米勒混合瘤	3.0	上调	恶性子宫内膜癌	腺癌，NOS	2.4	上调	4.7	3.9
212344_at	35832_at		食管，NOS	恶性食管癌，NOS	腺癌，NOS	1.7	恶性子宫内膜癌	腺癌，NOS	2.4	上调	4.7	上调	2.3
212344_at	212353_at	恶性食管癌，NOS		恶性食管癌，NOS	腺癌，NOS	1.7	腺癌，NOS	5.5	上调	3.2		上调	2.3
212354_at	212353_at	恶性食管癌，NOS		恶性食管癌，NOS	腺癌，NOS	2.9	腺癌，NOS	5.5	上调	3.2	上调	3.1
212354_at	35832_at	恶性食管癌，NOS		恶性食管癌，NOS	腺癌，NOS	2.9	腺癌，NOS	10.7	上调	3.2	上调	3.1

212344_at	乳房，NOS	女性恶性乳腺癌，NOS	粘液性腺癌	3.3	上调	4.8
212344_at		女性恶性乳腺癌，NOS	粘液性腺癌	3.3	上调	4.8	212344_at	女性恶性乳腺癌，NOS	浸润小叶癌	1.6	上调	2.9
212344_at		女性恶性乳腺癌，NOS	浸润管癌	2.5	上调	8.7	212344_at	女性恶性乳腺癌，NOS	浸润小叶癌	1.6	上调	2.9
212344_at		女性恶性乳腺癌，NOS	浸润管癌	2.5	上调	8.7	212344_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	2.6	上调	2.8
212353_at		女性恶性乳腺癌，NOS	浸润小叶癌	2.8	上调	4.7	212344_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	2.6	上调	2.8
212353_at		女性恶性乳腺癌，NOS	浸润小叶癌	2.8	上调	4.7	212354_at	女性恶性乳腺癌，NOS	浸润管癌	3.9	上调	13.0
212353_at		女性恶性乳腺癌，NOS	浸润管和小叶癌	3.4	上调	3.7	212354_at	女性恶性乳腺癌，NOS	浸润管癌	3.9	上调	13.0
212353_at		女性恶性乳腺癌，NOS	浸润管和小叶癌	3.4	上调	3.7	212354_at	女性恶性乳腺癌，NOS	浸润小叶癌	1.7	上调	3.1
212354_at		女性恶性乳腺癌，NOS	浸润管癌	2.6	上调	8.5	212354_at	女性恶性乳腺癌，NOS	浸润小叶癌	1.7	上调	3.1
212354_at		女性恶性乳腺癌，NOS	浸润管癌	2.6	上调	8.5	212354_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	2.7	上调	2.6
35832_at		女性恶性乳腺癌，NOS	粘液性腺癌	4.0	上调	5.5	212354_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	2.7	上调	2.6
35832_at		女性恶性乳腺癌，NOS	粘液性腺癌	4.0	上调	5.5	35832_at	女性恶性乳腺癌，NOS	浸润小叶癌	3.2	上调	4.4
35832_at		女性恶性乳腺癌，NOS	浸润管癌	4.5	上调	12.0	35832_at	女性恶性乳腺癌，NOS	浸润小叶癌	3.2	上调	4.4
35832_at		女性恶性乳腺癌，NOS	浸润管癌	4.5	上调	12.0	35832_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	4.3	上调	4.5
212353_at		肾，NOS	恶性肾癌，NOS	透明细胞腺癌，NOS	2.8	上调	35832_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	4.3	上调	4.5	5.5
212353_at	212354_at		恶性肾癌，NOS	透明细胞腺癌，NOS	2.8	上调	恶性肾癌，NOS	透明细胞腺癌，NOS	2.4	上调	5.3		5.5
35832_at	212354_at		恶性肾癌，NOS	透明细胞腺癌，NOS	6.1	上调	恶性肾癌，NOS	透明细胞腺癌，NOS	2.4	上调	5.3	5.6

212344_at	喉，NOS	恶性喉癌，NOS	鳞状细胞腺癌，NOS	3.0	上调	3.3
212344_at		恶性喉癌，NOS	鳞状细胞腺癌，NOS	3.0	上调	3.3	212353_at	恶性喉癌，NOS	鳞状细胞癌，NOS	5.1	上调	3.8
212354_at		恶性喉癌，NOS	鳞状细胞癌，NOS	3.7	上调	3.6	212353_at	恶性喉癌，NOS	鳞状细胞癌，NOS	5.1	上调	3.8
212354_at		恶性喉癌，NOS	鳞状细胞癌，NOS	3.7	上调	3.6	35832_at	恶性喉癌，NOS	鳞状细胞癌，NOS	7.2	上调	3.7
212344_at		肺，NOS	恶性肺癌，NOS	癌，NOS	4.1	上调	35832_at	恶性喉癌，NOS	鳞状细胞癌，NOS	7.2	上调	3.7	3.9
212344_at	212344_at		恶性肺癌，NOS	癌，NOS	4.1	上调	恶性肺癌，NOS	鳞状细胞癌，NOS	3.1	上调	5.8		3.9
212344_at	212344_at		恶性肺癌，NOS	巨细胞癌，NOS	2.7	上调	恶性肺癌，NOS	鳞状细胞癌，NOS	3.1	上调	5.8	2.5
212344_at	212344_at		恶性肺癌，NOS	巨细胞癌，NOS	2.7	上调	恶性肺癌，NOS	腺癌，NOS	2.8	上调	6.2	2.5
212353_at	212344_at		恶性肺癌，NOS	癌，NOS	4.1	上调	恶性肺癌，NOS	腺癌，NOS	2.8	上调	6.2	3.2
212353_at	212353_at		恶性肺癌，NOS	癌，NOS	4.1	上调	恶性肺癌，NOS	鳞状细胞癌，NOS	3.6	上调	6.5	3.2
212353_at	212353_at		恶性肺癌，NOS	巨细胞癌，NOS	3.8	上调	恶性肺癌，NOS	鳞状细胞癌，NOS	3.6	上调	6.5	2.7
212353_at	212353_at		恶性肺癌，NOS	巨细胞癌，NOS	3.8	上调	恶性肺癌，NOS	腺癌，NOS	3.6	上调	6.9	2.7
212354_at	212353_at		恶性肺癌，NOS	癌，NOS	3.5	上调	恶性肺癌，NOS	腺癌，NOS	3.6	上调	6.9	2.9
212354_at	212354_at		恶性肺癌，NOS	癌，NOS	3.5	上调	恶性肺癌，NOS	鳞状细胞癌，NOS	3.1	上调	5.6	2.9
212354_at	212354_at			恶性肺癌，NOS	巨细胞癌，NOS	2.9	恶性肺癌，NOS	鳞状细胞癌，NOS	3.1	上调	5.6	上调	2.6
212354_at	212354_at	恶性肺癌，NOS		恶性肺癌，NOS	巨细胞癌，NOS	2.9	腺癌，NOS	2.9	上调	6.2		上调	2.6
35832_at	212354_at	恶性肺癌，NOS		恶性肺癌，NOS	鳞状细胞癌，NOS	8.8	腺癌，NOS	2.9	上调	6.2	上调	6.0
35832_at	35832_at	恶性肺癌，NOS		恶性肺癌，NOS	鳞状细胞癌，NOS	8.8	腺癌，NOS	8.9	上调	7.2	上调	6.0
212344_at	35832_at	恶性肺癌，NOS		卵巢，NOS	恶性卵巢癌	乳头状浆液腺癌	腺癌，NOS	8.9	上调	7.2	3.0	上调	3.9
212344_at	212353_at	恶性卵巢癌	乳头状浆液腺癌		恶性卵巢癌	乳头状浆液腺癌	3.6	上调	3.9		3.0	上调	3.9
212354_at	212353_at	恶性卵巢癌	乳头状浆液腺癌		恶性卵巢癌	乳头状浆液腺癌	3.6	上调	3.9	2.6	上调	3.4
212354_at	212344_at	胰腺，NOS	恶性胰腺癌，NOS		恶性卵巢癌	乳头状浆液腺癌	腺癌，NOS	6.9	上调	2.6	上调	3.4	9.0
212353_at	212344_at		恶性胰腺癌，NOS	恶性胰腺癌，NOS	腺癌，NOS	7.8	腺癌，NOS	6.9	上调	上调	11.2		9.0
212353_at	212354_at		恶性胰腺癌，NOS	恶性胰腺癌，NOS	腺癌，NOS	7.8	腺癌，NOS	8.6	上调	上调	11.2	11.0

35832_at		恶性胰腺癌，NOS	腺癌，NOS	99.8	上调	11.1
35832_at		恶性胰腺癌，NOS	腺癌，NOS	99.8	上调	11.1	212353_at	前列腺，NOS	恶性前列腺癌	非典型疑似恶性	-2.2	下调	-4.7
212353_at	恶性前列腺癌	腺癌，NOS	-1.5	下调	-2.5		212353_at		恶性前列腺癌	非典型疑似恶性	-2.2	下调	-4.7
212353_at	恶性前列腺癌	腺癌，NOS	-1.5	下调	-2.5	212354_at	恶性前列腺癌		非典型疑似恶性	-1.8	下调	-3.8
212354_at	恶性前列腺癌	腺癌，NOS	-1.7	下调	-3.8	212354_at	恶性前列腺癌		非典型疑似恶性	-1.8	下调	-3.8
212354_at	恶性前列腺癌	腺癌，NOS	-1.7	下调	-3.8	35832_at	恶性前列腺癌		非典型疑似恶性	-4.3	下调	-4.4
35832_at	恶性前列腺癌	腺癌，NOS	-1.7	下调	-2.6	35832_at	恶性前列腺癌		非典型疑似恶性	-4.3	下调	-4.4
35832_at	恶性前列腺癌	腺癌，NOS	-1.7	下调	-2.6	212344_at	直肠，NOS		恶性直肠癌	腺癌，NOS	3.0	上调	6.9
212353_at	恶性直肠癌	腺癌，NOS	4.1	上调	7.6	212344_at			恶性直肠癌	腺癌，NOS	3.0	上调	6.9
212353_at	恶性直肠癌	腺癌，NOS	4.1	上调	7.6	212354_at		恶性直肠癌	腺癌，NOS	3.0	上调	7.2
35832_at	恶性直肠癌	腺癌，NOS	5.4	上调	8.8	212354_at		恶性直肠癌	腺癌，NOS	3.0	上调	7.2
35832_at	恶性直肠癌	腺癌，NOS	5.4	上调	8.8	212344_at		皮肤，NOS	恶性皮肤癌，NOS	鳞状细胞癌，NOS	2.8	上调	2.4
212353_at	恶性皮肤癌，NOS	鳞状细胞癌，NOS	3.5	上调	2.4	212344_at			恶性皮肤癌，NOS	鳞状细胞癌，NOS	2.8	上调	2.4
212353_at	恶性皮肤癌，NOS	鳞状细胞癌，NOS	3.5	上调	2.4	35832_at	恶性皮肤癌，NOS		基底细胞癌，NOS	3.6	上调	2.5
35832_at	恶性皮肤癌，NOS	鳞状细胞癌，NOS	5.5	上调	3.0	35832_at	恶性皮肤癌，NOS		基底细胞癌，NOS	3.6	上调	2.5
35832_at	恶性皮肤癌，NOS	鳞状细胞癌，NOS	5.5	上调	3.0	212344_at	胃，NOS		恶性胃癌，NOS	粘液性腺癌	7.6	上调	3.1
212344_at	恶性胃癌，NOS	印戒细胞癌	3.9	上调	2.4	212344_at			恶性胃癌，NOS	粘液性腺癌	7.6	上调	3.1
212344_at	恶性胃癌，NOS	印戒细胞癌	3.9	上调	2.4	212344_at		恶性胃癌，NOS	腺癌，NOS	2.5	上调	4.9
212353_at	恶性胃癌，NOS	粘液性腺癌	11.0	上调	3.7	212344_at		恶性胃癌，NOS	腺癌，NOS	2.5	上调	4.9
212353_at	恶性胃癌，NOS	粘液性腺癌	11.0	上调	3.7	212353_at		恶性胃癌，NOS	印戒细胞癌	4.9	上调	2.9
212353_at	恶性胃癌，NOS	腺癌，NOS	3.4	上调	5.6	212353_at		恶性胃癌，NOS	印戒细胞癌	4.9	上调	2.9
212353_at	恶性胃癌，NOS	腺癌，NOS	3.4	上调	5.6	212354_at		恶性胃癌，NOS	粘液性腺癌	7.5	上调	3.2
212354_at	恶性胃癌，NOS	印戒细胞癌	3.7	上调	2.4	212354_at		恶性胃癌，NOS	粘液性腺癌	7.5	上调	3.2
212354_at	恶性胃癌，NOS	印戒细胞癌	3.7	上调	2.4	212354_at		恶性胃癌，NOS	腺癌，NOS	2.7	上调	5.1
35832_at	恶性胃癌，NOS	印戒细胞癌	8.4	上调	3.4	212354_at		恶性胃癌，NOS	腺癌，NOS	2.7	上调	5.1
35832_at	恶性胃癌，NOS	印戒细胞癌	8.4	上调	3.4	35832_at		恶性胃癌，NOS	腺癌，NOS	8.6	上调	6.7
212344_at	睾丸，NOS	恶性睾丸癌，NOS	混合型生殖细胞瘤	2.0	上调	35832_at		恶性胃癌，NOS	腺癌，NOS	8.6	上调	6.7	2.4

212353_at		恶性睾丸癌，NOS	混合型生殖细胞瘤	4.1	上调	2.8
212353_at		恶性睾丸癌，NOS	混合型生殖细胞瘤	4.1	上调	2.8	212354_at	恶性睾丸癌，NOS	混合型生殖细胞瘤	3.4	上调	2.6
212353_at		网膜，NOS	恶性网膜癌	乳头状浆液腺癌	1.7	上调	212354_at	恶性睾丸癌，NOS	混合型生殖细胞瘤	3.4	上调	2.6	2.6
212353_at	35832_at	网膜，NOS	恶性网膜癌	乳头状浆液腺癌	1.7	上调	甲状腺，NOS	恶性甲状腺癌	乳头状瘤，NOS	2.5	上调	2.5	2.6
35832_at	35832_at	子宫颈，NOS	恶性子宫颈癌	鳞状细胞癌，NOS	3.5	上调	甲状腺，NOS	恶性甲状腺癌	乳头状瘤，NOS	2.5	上调	2.5	2.3

c)LBFL305基因家族：

芯片数据的分析表明胃癌样品中的标记物LBFL305的表达与得自正常胃组织的样品中的标记物LBFL305的表达相比被明显地上调了(2.2-倍，p＝0.0051，利用U95 GeneChip；2.14-倍，p＝0.0109，利用U133 GeneChip)。该数据表明LBFL305的上调可被用于胃癌的诊断。

LBFL305(SEQ ID NO：13)的表达水平可以通过分别利用AffymetrixGeneChipsU95和U133上的序号为53858_at和225364_at的芯片序列来测定。从利用Affymetrix GeneChips^的实验收集通过组织类型进行差异表达的数据并利用GX Scan算法对这些数据进行分析，GXScan算法被记载在相关专利申请60/331,182，60/388,745和60/390,608中，其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-based Algorithm forOrganizing and Mining Gene Expression Data Derived fromBiological Samples with Complex Clinical Attributes)”，而且其全部内容被引入本文作参考。相对于正常对照组织，各种恶性肿瘤中的53858_at和225364_at的表达水平被列于表1c，其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。

表1c

Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat
Affy ID	组织	疾病	形态学	变化倍数	趋势	T-Stat	53858_at	膀胱，NOS	女性恶性膀胱癌，NOS	过渡细胞癌，NOS	1.691	上调	2.377
53858_at	乳房，NOS	女性恶性乳腺癌，NOS	浸润管癌	1.538	上调	6.824	53858_at	膀胱，NOS	女性恶性膀胱癌，NOS	过渡细胞癌，NOS	1.691	上调	2.377
53858_at		女性恶性乳腺癌，NOS	浸润管癌	1.538	上调	6.824	53858_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	1.599	上调	2.408
225364_at		女性恶性乳腺癌，NOS	浸润管和小叶癌	1.525	上调	3.251	53858_at	女性恶性乳腺癌，NOS	浸润管和小叶癌	1.599	上调	2.408
225364_at		女性恶性乳腺癌，NOS	浸润管和小叶癌	1.525	上调	3.251	53858_at	子宫颈，NOS	恶性子宫颈癌	鳞状细胞癌，NOS	1.637	上调	4.056
53858_at	子宫内膜，NOS	恶性子宫内膜癌	米勒混合瘤	1.548	上调	2.647	53858_at	子宫颈，NOS	恶性子宫颈癌	鳞状细胞癌，NOS	1.637	上调	4.056
53858_at	子宫内膜，NOS	恶性子宫内膜癌	米勒混合瘤	1.548	上调	2.647	53858_at	食管，NOS	恶性食管癌，NOS	腺癌，NOS	2.079	上调	3.145
225364_at	恶性食管癌，NOS	腺癌，NOS	1.615	上调	2.915		53858_at		恶性食管癌，NOS	腺癌，NOS	2.079	上调	3.145
225364_at	恶性食管癌，NOS	腺癌，NOS	1.615	上调	2.915	53858_at	肾，NOS		恶性肾癌，NOS	肾细胞癌	1.864	上调	6.093
53858_at	恶性肾癌，NOS	透明细胞腺癌，NOS	2.167	上调	6.877	53858_at			恶性肾癌，NOS	肾细胞癌	1.864	上调	6.093
53858_at	恶性肾癌，NOS	透明细胞腺癌，NOS	2.167	上调	6.877	225364_at		恶性肾癌，NOS	肾细胞癌	1.593	上调	5.045
225364_at	恶性肾癌，NOS	透明细胞腺癌，NOS	1.683	上调	7.924	225364_at		恶性肾癌，NOS	肾细胞癌	1.593	上调	5.045
225364_at	恶性肾癌，NOS	透明细胞腺癌，NOS	1.683	上调	7.924	225364_at		肺，NOS	恶性肺癌，NOS	小细胞癌，NOS	-1.79	下调	-7.071
53858_at	淋巴结，NOS	何杰金氏病，多位点淋巴结的NOS	何杰金氏病，NOS	1.539	上调	225364_at	2.519	肺，NOS	恶性肺癌，NOS	小细胞癌，NOS	-1.79	下调	-7.071
53858_at		何杰金氏病，多位点淋巴结的NOS	何杰金氏病，NOS	1.539	上调	53858_at	2.519	恶性淋巴和组织细胞组织瘤	恶性淋巴癌，NOS	1.635	上调	3.243
53858_at		胰腺，NOS	恶性胰岛癌	岛细胞癌	3.845	53858_at	上调	恶性淋巴和组织细胞组织瘤	恶性淋巴癌，NOS	1.635	上调	3.243	7.929
53858_at	53858_at		恶性胰岛癌	岛细胞癌	3.845	恶性胰腺癌，NOS	上调	腺癌，NOS	4.171	上调	7.165		7.929
225364_at	53858_at		恶性胰岛癌	岛细胞癌	2.343	恶性胰腺癌，NOS	上调	腺癌，NOS	4.171	上调	7.165	3.551
225364_at	225364_at		恶性胰岛癌	岛细胞癌	2.343	恶性胰腺癌，NOS	上调	腺癌，NOS	2.278	上调	10.793	3.551
225364_at	225364_at		前列腺，NOS	恶性前列腺癌	非典型疑性恶性	恶性胰腺癌，NOS	-1.641	腺癌，NOS	2.278	上调	10.793	下调	-4.8
225364_at	53858_at	直肠，NOS	前列腺，NOS	恶性前列腺癌	非典型疑性恶性	恶性直肠癌	-1.641	腺癌，NOS	1.935	上调	5.416	下调	-4.8

53858_at	小肠，NOS	恶性淋巴癌，未确定的，结节外的或实体器官位点的NOS	恶性淋巴癌，NOS	3.935	上调	3.535
53858_at		恶性淋巴癌，未确定的，结节外的或实体器官位点的NOS	恶性淋巴癌，NOS	3.935	上调	3.535	225364_at	恶性淋巴癌，未确定的，结节外的或实体器官位点的NOS	恶性淋巴癌，NOS	3.024	上调	3.816
53858_at		胃，NOS	恶性胃癌，NOS	印戒细胞癌	1.507	上调	225364_at	恶性淋巴癌，未确定的，结节外的或实体器官位点的NOS	恶性淋巴癌，NOS	3.024	上调	3.816	2.46
53858_at	53858_at		恶性胃癌，NOS	印戒细胞癌	1.507	上调	恶性胃癌，NOS	腺癌，NOS	2.076	上调	5.928		2.46
225364_at	53858_at		恶性胃癌，NOS	印戒细胞癌	1.524	上调	恶性胃癌，NOS	腺癌，NOS	2.076	上调	5.928	3.076
225364_at	225364_at		恶性胃癌，NOS	印戒细胞癌	1.524	上调	恶性胃癌，NOS	腺癌，NOS	1.637	上调	6.053	3.076
225364_at	225364_at		甲状腺，NOS	恶性淋巴癌，未确定的，结节外的或实体器官位点的NOS	恶性淋巴癌，NOS	4.371	恶性胃癌，NOS	腺癌，NOS	1.637	上调	6.053	上调	9.429
225364_at	225364_at	恶性甲状腺癌		恶性淋巴癌，未确定的，结节外的或实体器官位点的NOS	恶性淋巴癌，NOS	4.371	乳头状癌，NOS	1.634	上调	3.22		上调	9.429
53858_at	225364_at	恶性甲状腺癌		女阴，NOS	恶性女阴癌，NOS	鳞状细胞癌，NOS	乳头状癌，NOS	1.634	上调	3.22	1.505	上调	2.596

通过使样品结合到序号为53858_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(53858_at)的序列信息文件设计的PCR引物被用于分析当中。每个RNA样品(10ng的总RNA)中的靶基因相对于外源掺入的参比基因进行分析。出于这一目的，四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U95 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外，没有用GeneChip分析的几个新样品被用于通过定量RT-PCR对表达进行的验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL305的上调。

d)LBFL306基因家族

芯片数据的分析表明胃癌样品中的标记物LBFL306的表达与得自正常胃组织的样品中的标记物LBFL306的表达相比被明显地上调了(3.27-倍，p＝0.00217，利用U133 GeneChip)。该数据表明LBFL306的上调可被用于胃癌的诊断。

LBFL306(SEQ ID NO：17，19或21)的表达水平可以通过分别利用Affymetrix GeneChipsU95和U133上的序号为57861_at和223251_s_at的芯片序列片段来测定。从利用Affymetrix GeneChips^的实验收集通过组织类型进行差异表达的数据并利用GX Scan算法对这些数据进行分析，GX Scan算法被记载在相关专利申请60/331,182，60/388,745和60/390,608中，其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-basedAlgorithm for Organizing and Mining Gene Expression DataDerived from Biological Samples with Complex ClinicalAttributes)”，而且其全部内容被引入本文作为参考。相对于正常对照组织，各种恶性肿瘤中的223251_at的表达水平被列于表1d，其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。所述数据表明除了胃癌外，膀胱癌、结肠癌、食道癌、肾癌、网膜癌、胰腺癌、直肠癌和软组织癌中的LBFL306的表达也被上调了，并且这种基因家族的表达在乳腺癌、子宫内膜癌和小肠癌中被下调了。

序列为SEQ ID NO：17或19或21的全长cDNA通过利用GeneTrappercDNA Positive Selection System Kits(Invitrogen)而获得。所获得的cDNA被转化成双链质粒DNA，该双链质粒DNA被用于转化大肠杆菌细胞(DH10B)，并筛选出最长的cDNA。通过利用基因-特异性引物由PCR证实了阳性筛选后，对cDNA克隆进行DNA测序。

进行RNA印迹分析来测定对应于LBFL306的mRNA转录物大小。使用了含有得自各种人组织的总RNA的RNA印迹物(ClonTech H12)，并且通过随机引物法对LBFL306-GE2(SEQ ID NO：21)进行放射性标记后用于探测印迹物。这些印迹物在65℃下于Church和Gilbert缓冲液中进行杂交并在室温下用含0.1％SDS的0.1×SSC冲洗。RNA印迹显示了该基因的具有约1.5kb大小的单一转录物。这对应于全长克隆中的插入物的大小，其也为约1.5kb。

通过使样品结合到序号为223251_s_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(223251_s_at)的序列信息文件设计的PCR引物被用于分析中。每个RNA样品(10ng的总RNA)中的靶基因相对于外源掺入的参比基因进行分析。出于这一目的，四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U133 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外，没有用GeneChip分析的几个新样品被用于通过Q-RT-PCR对表达进行的验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL306的上调。

表1d

芯片位置号	组织	疾病	形态学	变化倍数	趋势	T-Stat
芯片位置号	组织	疾病	形态学	变化倍数	趋势	T-Stat	223251_s_at	膀胱，NOS	膀胱恶性肿瘤，NOS	过渡细胞癌，NOS	1.649	上调	2.572
223251_s_at	乳房，NOS	女性乳腺恶性肿瘤，NOS	管内癌，NOS	-1.701	下调	-5.202	223251_s_at	膀胱，NOS	膀胱恶性肿瘤，NOS	过渡细胞癌，NOS	1.649	上调	2.572
223251_s_at	乳房，NOS	女性乳腺恶性肿瘤，NOS	管内癌，NOS	-1.701	下调	-5.202	223251_s_at	结肠，NOS	结肠恶性肿瘤，NOS	腺癌，NOS	2.651	上调	8.164
223251_s_at	子宫内膜，NOS	子宫内膜恶性肿瘤	米勒混合肿瘤	-1.806	下调	-2.367	223251_s_at	结肠，NOS	结肠恶性肿瘤，NOS	腺癌，NOS	2.651	上调	8.164
223251_s_at	子宫内膜，NOS	子宫内膜恶性肿瘤	米勒混合肿瘤	-1.806	下调	-2.367	223251_s_at	食道，NOS	食管恶性肿瘤，NOS	腺癌，NOS	5.016	上调	4.269
223251_s_at	肾，NOS	肾恶性肿瘤，NOS	过渡细胞癌，NOS	1.755	上调	4.563	223251_s_at	食道，NOS	食管恶性肿瘤，NOS	腺癌，NOS	5.016	上调	4.269
223251_s_at		肾恶性肿瘤，NOS	过渡细胞癌，NOS	1.755	上调	4.563	223251_s_at	肾恶性肿瘤，NOS	透明细胞腺癌，NOS	1.611	上调	4.054
223251_s_at		肾恶性肿瘤，NOS	Wilm′s肿瘤	4.565	上调	3.891	223251_s_at	肾恶性肿瘤，NOS	透明细胞腺癌，NOS	1.611	上调	4.054
223251_s_at		肾恶性肿瘤，NOS	Wilm′s肿瘤	4.565	上调	3.891	223251_s_at	网膜，NOS	网膜恶性肿瘤	乳头状浆液腺癌	1.762	上调	3.398
223251s_at	胰腺，NOS	胰腺恶性肿瘤，NOS	腺癌，NOS	2.672	上调	7.13	223251_s_at	网膜，NOS	网膜恶性肿瘤	乳头状浆液腺癌	1.762	上调	3.398
223251s_at	胰腺，NOS	胰腺恶性肿瘤，NOS	腺癌，NOS	2.672	上调	7.13	223251_s_at	直肠，NOS	直肠恶性肿瘤	腺癌，NOS	2.482	上调	6.042
223251_s_at	小肠，NOS	小肠恶性肿瘤，NOS	肉瘤，NOS	-1.944	下调	-5.716	223251_s_at	直肠，NOS	直肠恶性肿瘤	腺癌，NOS	2.482	上调	6.042

223251_s_at	软组织，NOS	结缔组织和其它软组织的恶性肿瘤，NOS	粘液性脂肉瘤	1.878	上调	3.894
223251_s_at	软组织，NOS	结缔组织和其它软组织的恶性肿瘤，NOS	粘液性脂肉瘤	1.878	上调	3.894	223251_s_at	胃，NOS	胃恶性肿瘤，NOS	腺癌，NOS	2.522	上调	5.101

实施例2

对应于差异表达的mRNA品种的全长人cDNA(LBFL301，LBFL304， LBFL305和LBFL306)的克隆

通过寡核苷酸-牵引(oligo-pulling)法获得序列为SEQ ID NO：1，3，5，7，9，11，13，17，19或21的全长cDNA。简要地说，在LBFL301，LBFL304，LBFL305或LBFL306的序列基础上设计基因-特异性寡核苷酸。该寡核苷酸被标记上生物素后按照Sambrook等的方法与2μg的单链质粒DNA(cDNA重组体)进行杂交，其中所述单链质粒DNA得自完全分化的胃腺癌文库(NCI CGAP Gas 4)或由Jurkat细胞制备的文库。利用结合了链霉亲和素的珠子分离所述杂交cDNA并通过加热洗脱。洗脱下来的cDNA被转化成双链质粒DNA并被用于转化大肠杆菌细胞(DH10B)，筛选出最长的cDNA。利用基因-特异性引物证实阳性筛选后，对所述cDNA克隆进行DNA测序。

对应于以上检测的差异调控的mRNA的全长人cDNA的核苷酸序列如SEQ ID NOS：1，3，5，7，9，11，13，17，19和21所示。在SEQID NO 1中，所述cDNA含1272个碱基对(1255个碱基对和一个多聚腺苷酸尾)。在SEQ ID NO 3中，cDNA含1355个碱基对(1334个碱基对和一个多聚腺苷酸尾)。LBFL304具有几个可能的启动密码子，并且它们被命名为SEQ ID NOS：5，7，9和11。SEQ ID NO：13中的cDNA含6405个碱基对(6369个碱基对和一个多聚腺苷酸尾)。与SEQ IDNO：17对应的cDNA含1299个碱基对(1284个碱基对和一个多聚腺苷酸尾)。与SEQ ID NO：19对应的cDNA含2451个碱基对(2435个碱基对和一个多聚腺苷酸尾)。与SEQ ID NO：21对应的cDNA含1194个碱基对(1178个碱基对和一个多聚腺苷酸尾)。

SEQ ID NO：1所示的cDNA核苷酸序列内的可读框位于第131-859位核苷酸(131-862位含终止密码子)，编码243个氨基酸的蛋白。对应于由SEQ ID NO：1编码的预测蛋白的氨基酸序列如SEQ ID NO：2所示。

SEQ ID NO：3所示的cDNA核苷酸序列内的可读框位于第174-584位核苷酸(174-587位含终止密码子)，编码137个氨基酸的蛋白。对应于由SEQ ID NO：3编码的预测蛋白的氨基酸序列如SEQ ID NO：4所示。SEQ ID NO：4的蛋白序列与SEQ ID NO：2的蛋白序列在前124个氨基酸上相同，而SEQ ID NO：4的最后13个氨基酸是独特的。如图1所示，与SEQ ID NO：4对应的蛋白序列的终端是由45-bp插入子产生，所述插入子在可读框中引进了终止密码子。

SEQ ID NO：2和4稍微类似于胰凝乳蛋白酶丝氨酸蛋白酶家族基序(signature)(S1)和NUDIX水解酶家族基序。胰凝乳蛋白酶丝氨酸蛋白酶家族基序(S1)含有三个区域，第三个区域不存在于SEQ ID NO：4中。另外，两种蛋白都含有胶原三螺旋重复区域。

图2和3表示对SEQ ID NO：2和4的氨基酸序列的疏水性进行分析的结果。如上所述，亲水性区域可被用来制备抗原肽。两个序列都具有疏水性的N-端，约30个氨基酸长度，最强疏水性部分集中在第20位氨基酸的附近。由SPScan(GCG Wisconsin Package)进行的进一步的蛋白序列分析展示出由1-30位氨基酸形成的疏水区域似乎就是分泌信号肽。

SEQ ID NO：5所示的cDNA核苷酸序列内的可读框位于第38-892位核苷酸(38-895位含终止密码子)，编码285个氨基酸的蛋白。对应于由SEQ ID NO：5编码的预测蛋白的氨基酸序列如SEQ ID NO：6所示。SEQ ID NO：6稍微类似于胰凝乳蛋白酶丝氨酸蛋白酶家族基序(S1)。图4表示对SEQ ID NO：6的氨基酸序列的疏水性进行分析的结果。如上所述，亲水性区域可被用来制备抗原肽。

SEQ ID NO：7所示的cDNA核苷酸序列内的可读框位于第53-892位核苷酸(53-895位含终止密码子)，编码280个氨基酸的蛋白。对应于由SEQ ID NO：7编码的预测蛋白的氨基酸序列如SEQ ID NO：8所示。SEQ ID NO：8的蛋白序列与SEQ ID NO：6的蛋白序列相同，但是SEQ ID NO：8缺乏SEQ ID NO：6的N-端的头五个氨基酸。

SEQ ID NO：9所示的cDNA核苷酸序列内的可读框位于第65-892位核苷酸(65-895位含终止密码子)，编码276个氨基酸的蛋白。对应于由SEQ ID NO：9编码的预测蛋白的氨基酸序列如SEQ ID NO：10所示。SEQ ID NO：10的蛋白序列与SEQ ID NO：6的蛋白序列相同，但是SEQ ID NO：10缺乏SEQ ID NO：6的N-端的头九个氨基酸。

SEQ ID NO：11所示的cDNA核苷酸序列内的可读框位于第92-892位核苷酸(92-895位含终止密码子)，编码267个氨基酸的蛋白。对应于由SEQ ID NO：11编码的预测蛋白的氨基酸序列如SEQ ID NO：12所示。SEQ ID NO：12的蛋白序列与SEQ ID NO：6的蛋白序列相同，但是SEQ ID NO：12缺乏SEQ ID NO：6的N-端的头18个氨基酸。

SEQ ID NO：13所示的cDNA核苷酸序列内的可读框位于第49-1434位核苷酸(49-1437位含终止密码子)，编码462个氨基酸的蛋白。对应于由SEQ ID NO：13编码的蛋白的氨基酸序列如SEQ ID NO：14所示。

BLAST检索结果和两个序列间的高度同源性表明LBFL305是Mst1的(例如，SEQ ID NO：16的)剪接变体。比对序列的下划线氨基酸残基表示SEQ ID NO：14与SEQ ID NO：18之间的差异。基于Mst1的公开的研究，SEQ ID NO：14含有激酶区域(氨基酸位点1-299)(Creasy等，(1996)J Biol Chem 271：21049-21053)，接下来的是调节激酶功能的调控区域(氨基酸位点300-462)(Creasy等，(1996)JBiol Chem 271：21049-21053)。在氨基酸位点326-327与349-350之间(Graves等，(2001)J Biol Chem 276：14909-14915)还存在两个caspase裂解位点，和一个NES域(氨基酸位点361-370)(Ura等，(2002)Proc Nat1 Acad Sci USA 98：10148-10153)。与SEQ ID NO：16相比，SEQ ID NO：14缺失了第二个NES域(SEQ ID NO：16中的氨基酸位点441-451)(Ura等，(2002)Proc Nat1 Acad Sci USA 98：10148-10153)。而且，SEQ ID NO：14不含自身缔合所需的多聚化区域(Mst1中的氨基酸位点431-4871)(Creasy等，(1996)J Biol Chem271：21049-21053)。有趣地是，与NORE(一种假设的Ras效应物)发生相互作用所需的Mst1中的区域(SEQ ID NO：16中的氨基酸位点449-487)(Khokh1atchev等，Curr Biol 12：253-265)不存在于SEQ IDNO：14中。

图5表示对SEQ ID NO：14所示氨基酸序列进行疏水性分析的结果。如上所述，亲水区域可以被用来制备抗原肽。

SEQ ID NO：17所示的cDNA核苷酸序列内的可读框位于第75-572位核苷酸(75-575位含终止密码子)，编码166个氨基酸的蛋白。对应于由SEQ ID NO：17编码的蛋白的氨基酸序列如SEQ ID NO：18所示。图7表示对SEQ ID NO：18所示氨基酸序列进行疏水性分析的结果。如上所述，亲水区域可以被用来制备抗原肽。

SEQ ID NO：19所示的cDNA核苷酸序列内的可读框位于第78-1337位核苷酸(78-1340位含终止密码子)，编码420个氨基酸的蛋白。对应于由SEQ ID NO：19编码的蛋白的氨基酸序列如SEQ ID NO：20所示。图8表示对SEQ ID NO：20所示氨基酸序列进行疏水性分析的结果。如上所述，亲水区域可以被用来制备抗原肽。

SEQ ID NO：21所示的cDNA核苷酸序列内的可读框位于第78-737位核苷酸(78-740位含终止密码子)，编码220个氨基酸的蛋白。对应于由SEQ ID NO：21编码的蛋白的氨基酸序列如SEQ ID NO：22所示。图9表示对SEQ ID NO：22所示氨基酸序列进行疏水性分析的结果。如上所述，亲水区域可以被用来制备抗原肽。

利用GCG Wisconsin软件包通过hmmerpfam确定：全部三个LBFL306克隆，即EF3(SEQ ID NO：17)，GC7(SEQ ID NO：19)和GE2(SEQ ID NO：21)都含多个锚蛋白重复序列。所述锚蛋白重复序列是从EF3，GC7和GE2中的氨基酸残基57至89，91至123和124至156。除了这三个锚蛋白重复序列，GC7还含从157至190的另一个锚蛋白重复子。

通过进行RNA印迹分析来确定对应于LBFL301，LBFL304和LBFL305的mRNA转录物的大小。采用含有源自各种人体组织的总RNA的RNA印迹物(ClonTech)，而且克隆CH4(SEQ ID NO：3)、克隆EA10(SEQ ID NO：5，7，9或11)和LBFL305(SEQ ID NO：13)通过随机引物法被放射性标记后用于探测所述印迹物。所述印迹物在65℃下于Church和Gilbert缓冲液中进行杂交，然后在室温下用含0.1％SDS的0.1×SSC缓冲液冲洗。RNA印迹分析结果显示了每个基因的单个转录物，大小约为1.57kb(LBFL301)，2.6kb(LBFL304)和7.95kb(LBFL305)。这与克隆CH4(1.355kb)，克隆EA10(SEQID NO：5，7，9或11)和LBFL305(6.5kb)中的插入物大小相对应。当克隆AD12(SEQ ID NO：1)的序列被用作探针时，检测到了1.44kb的转录物，其对应于克隆AD12中插入物的大小，即1.272kb。

为了检测各种正常组织中的LBFL301，LBFL304，LBFL305或LBFL306的表达，按照以下方法制备电子RNA印迹(e-Northern)。利用实施例1中的芯片和方法，将如表3中所示的得自一组正常组织的mRNA杂交到Affymetrix U95 human GeneChip上。这些实验的结果被列于表3中。针对每种组织类型，被注明有或无的样品数目与样品组中样品的总数目一起列了出来。另外，列出了每种组织类型中的中值和25％和75％的点。有趣地是，尽管该基因在胃癌中是上调的，但是在大多数正常胃组织样品中没能检测到LBFL301或LBFL304的表达。另外，尽管在检测的大多数正常胃组织样品中发现了LBFL305和LBFL306，但是表达水平比大多数其它被检测的正常胃组织中的表达水平低。如下所述，这种观察结果表明LBFL301，LBFL304，LBFL305或LBFL306可被用作诊断试剂或标记物以检测或筛选胃癌。LBFL301的表达水平似乎在皮肤组织中最高，其次是胎盘、动物脂肪、动脉、膀胱、骨头、乳房和软组织。尽管在肝脏或大脑和心脏的大部分区域中没有检测到该基因，但是在表3a中列出的其它大多数组织中检测到了较低水平的表达。LBFL304的表达水平似乎在动脉、网膜、子宫、子宫内膜、子宫肌层和前列腺中最高。LBFL305的表达水平似乎在免疫系统中的器官(例如白细胞、淋巴结、脾脏和胸腺)中最高，其次是得自阑尾、动脉、骨头和肺的样品。而且在表3c中所列的其它大多数组织中检测到了更低的表达水平。LBFL306的表达水平似乎在免疫系统的器官(例如淋巴结、脾脏和胸腺)和生殖系统的器官(例如乳房、子宫内膜、前列腺和子宫)中最高。

表3a-48774_at的e-Northern数据：正常组织中的LBFL301基因表达

总存在频率	组织	存在	不存在	下面25％	平均	上面75％
总存在频率	组织	存在	不存在	下面25％	平均	上面75％	0.5492
	脂肪	29/33	4/33	130.90	200.78	302.98	0.5492
	脂肪	29/33	4/33	130.90	200.78	302.98		肾上腺	1/12	11/12	-4.10	8.75	22.07
	阑尾	1/3	2/3	21.54	31.31	71.81		肾上腺	1/12	11/12	-4.10	8.75	22.07
	阑尾	1/3	2/3	21.54	31.31	71.81		动脉	3/3	0/3	148.46	203.96	262.32
	膀胱	6/7	1/7	142.72	195.44	361.02		动脉	3/3	0/3	148.46	203.96	262.32
	膀胱	6/7	1/7	142.72	195.44	361.02		骨	2/4	2/4	75.00	240.38	412.62
	乳房	74/82	8/82	104.43	222.98	506.27		骨	2/4	2/4	75.00	240.38	412.62
	乳房	74/82	8/82	104.43	222.98	506.27		小脑	0/5	5/5	-7.5 1	-6.91	0.94
	子宫颈	75/99	24/99	42.04	93.36	144.25		小脑	0/5	5/5	-7.5 1	-6.91	0.94
	子宫颈	75/99	24/99	42.04	93.36	144.25		结肠	36/148	112/148	1.75	12.16	29.05
	皮层前叶	1/7	6/7	5.96	14.07	18.05		结肠	36/148	112/148	1.75	12.16	29.05
	皮层前叶	1/7	6/7	5.96	14.07	18.05		皮层颞叶	0/3	3/3	-0.59	4.13	4.66
	十二指肠	9/61	52/61	3.99	11.54	20.62		皮层颞叶	0/3	3/3	-0.59	4.13	4.66
	十二指肠	9/61	52/61	3.99	11.54	20.62		子宫内膜	16/21	5/21	46.25	85.18	113.55
	食管	14/27	13/27	17.91	42.08	81.58		子宫内膜	16/21	5/21	46.25	85.18	113.55
	食管	14/27	13/27	17.91	42.08	81.58		输卵管	21/51	30/51	7.97	20.39	33.96
	胆囊	4/8	4/8	16.22	80.97	400.47		输卵管	21/51	30/51	7.97	20.39	33.96
	胆囊	4/8	4/8	16.22	80.97	400.47		心脏	0/3	3/3	-3.80	6.00	11.57
	海马	1/5	4/5	-6.49	-0.18	7.81		心脏	0/3	3/3	-3.80	6.00	11.57
	海马	1/5	4/5	-6.49	-0.18	7.81		肾	12/87	75/87	-14.80	-4.61	9.24
	喉	4/4	0/4	48.51	119.88	248.62		肾	12/87	75/87	-14.80	-4.61	9.24
	喉	4/4	0/4	48.51	119.88	248.62		左心房	64/141	77/141	8.19	27.15	61.94
	左心室	2/15	13/15	-7.49	7.08	13.24		左心房	64/141	77/141	8.19	27.15	61.94
	左心室	2/15	13/15	-7.49	7.08	13.24		肝	0/33	33/33	-15.13	-8.62	0.03
	肺	43/92	49/92	10.45	30.14	63.21		肝	0/33	33/33	-15.13	-8.62	0.03
	肺	43/92	49/92	10.45	30.14	63.21		淋巴结	9/12	3/12	43.28	81.96	225.75
	肌肉	19/38	19/38	23.70	40.22	108.40		淋巴结	9/12	3/12	43.28	81.96	225.75
	肌肉	19/38	19/38	23.70	40.22	108.40		子宫肌层	68/106	38/106	19.39	56.42	99.78
	网膜	12/16	4/16	76.26	148.41	236.54		子宫肌层	68/106	38/106	19.39	56.42	99.78
	网膜	12/16	4/16	76.26	148.41	236.54		卵巢	26/75	49/75	4.20	21.96	47.43

胰腺	7/34	27/34	-12.61	0.83	17.69
胰腺	7/34	27/34	-12.61	0.83	17.69	胎盘	5/5	0/5	284.63	361.07	414.51
前列腺	7/32	25/32	0.03	12.08	36.90	胎盘	5/5	0/5	284.63	361.07	414.51
前列腺	7/32	25/32	0.03	12.08	36.90	直肠	17/44	27/44	3.23	12.57	37.41
右心房	60/171	111/171	2.99	15.73	53.22	直肠	17/44	27/44	3.23	12.57	37.41
右心房	60/171	111/171	2.99	15.73	53.22	右心室	43/160	117/160	1.85	16.64	39.58
皮肤	56/59	3/59	321.45	906.78	1515.60	右心室	43/160	117/160	1.85	16.64	39.58
皮肤	56/59	3/59	321.45	906.78	1515.60	小肠	18/68	50/68	0.41	12.19	28.53
软组织	5/6	1/6	148.50	202.33	794.03	小肠	18/68	50/68	0.41	12.19	28.53
软组织	5/6	1/6	148.50	202.33	794.03	脾	5/29	24/29	-3.61	3.04	12.46
胃	15/45	30/45	7.73	18.66	50.97	脾	5/29	24/29	-3.61	3.04	12.46
胃	15/45	30/45	7.73	18.66	50.97	睾丸	3/5	2/5	14.11	27.34	64.24
胸腺	19/71	52/71	4.06	25.61	40.45	睾丸	3/5	2/5	14.11	27.34	64.24
胸腺	19/71	52/71	4.06	25.61	40.45	甲状腺	7/19	12/19	12.43	32.64	40.31
子宫	35/56	21/56	32.20	44.73	143.10	甲状腺	7/19	12/19	12.43	32.64	40.31
子宫	35/56	21/56	32.20	44.73	143.10	WBC	1/41	40/41	-18.91	-13.33	-6.24

表3b-35832_at的e-Northern数据：正常组织中的LBFL304基因表达

片段	总存在频率	组织	存在	不存在	下面25％	平均	上面75％
片段	总存在频率	组织	存在	不存在	下面25％	平均	上面75％	35832_at	0.5228
		脂肪	26/34	8/34	29.09	59.51	89.67	35832_at	0.5228
		脂肪	26/34	8/34	29.09	59.51	89.67			肾上腺	1/12	11/12	-11.00	-6.08	8.14
		阑尾	1/3	2/3	43.26	53.50	66.52			肾上腺	1/12	11/12	-11.00	-6.08	8.14
		阑尾	1/3	2/3	43.26	53.50	66.52			动脉	3/4	1/4	182.70	291.81	428.36
		膀胱	5/7	2/7	56.36	62.71	64.68			动脉	3/4	1/4	182.70	291.81	428.36
		膀胱	5/7	2/7	56.36	62.71	64.68			骨	3/4	1/4	19.34	77.40	167.06
		乳房	65/82	17/82	33.67	63.19	108.61			骨	3/4	1/4	19.34	77.40	167.06
		乳房	65/82	17/82	33.67	63.19	108.61			小脑	0/5	5/5	-19.26	-14.78	-13.16
		子宫颈	69/102	33/102	18.76	57.45	94.99			小脑	0/5	5/5	-19.26	-14.78	-13.16
		子宫颈	69/102	33/102	18.76	57.45	94.99			结肠	85/146	61/146	10.73	35.22	87.91
		皮层前叶	1/7	6/7	-5.03	8.78	14.71			结肠	85/146	61/146	10.73	35.22	87.91
		皮层前叶	1/7	6/7	-5.03	8.78	14.71			皮层颞叶	0/3	3/3	-16.73	-16.67	-15.85
		十二指肠	19/53	34/53	6.47	20.39	41.95			皮层颞叶	0/3	3/3	-16.73	-16.67	-15.85
		十二指肠	19/53	34/53	6.47	20.39	41.95			子宫内膜	15/21	6/21	31.44	93.20	137.68

食管	15/27	12/27	5.12	27.03	52.89
食管	15/27	12/27	5.12	27.03	52.89	输卵管	19/47	28/47	5.38	22.48	54.99
胆囊	2/7	5/7	8.71	28.94	50.85	输卵管	19/47	28/47	5.38	22.48	54.99
胆囊	2/7	5/7	8.71	28.94	50.85	心脏	0/3	3/3	-35.98	-28.2 5	-6.72
海马	2/5	3/5	-7.43	-3.64	5.68	心脏	0/3	3/3	-35.98	-28.2 5	-6.72
海马	2/5	3/5	-7.43	-3.64	5.68	肾	28/89	61/89	1.67	20.45	45.18
喉	4/4	0/4	36.13	54.20	79.75	肾	28/89	61/89	1.67	20.45	45.18
喉	4/4	0/4	36.13	54.20	79.75	左心房	80/141	61/141	8.32	25.37	52.28
左心室	0/15	15/15	-21.85	-17.01	-8.17	左心房	80/141	61/141	8.32	25.37	52.28
左心室	0/15	15/15	-21.85	-17.01	-8.17	肝	2/35	33/35	-10.51	0.02	8.05
肺	29/93	64/93	2.56	19.47	43.63	肝	2/35	33/35	-10.51	0.02	8.05
肺	29/93	64/93	2.56	19.47	43.63	淋巴结	3/12	9/12	-17.5 8	-2.85	9.56
肌肉	12/42	30/42	-13.74	3.99	23.23	淋巴结	3/12	9/12	-17.5 8	-2.85	9.56
肌肉	12/42	30/42	-13.74	3.99	23.23	子宫肌层	92/108	16/108	67.57	129.39	203.58
网膜	14/15	1/15	176.65	310.28	368.41	子宫肌层	92/108	16/108	67.57	129.39	203.58
网膜	14/15	1/15	176.65	310.28	368.41	卵巢	31/74	43/74	0.66	27.78	54.33
胰腺	4/33	29/33	-9.60	2.09	9.94	卵巢	31/74	43/74	0.66	27.78	54.33
胰腺	4/33	29/33	-9.60	2.09	9.94	胎盘	0/5	5/5	-21.32	-3.06	6.08
前列腺	30/32	2/32	82.37	104.56	190.72	胎盘	0/5	5/5	-21.32	-3.06	6.08
前列腺	30/32	2/32	82.37	104.56	190.72	直肠	37/44	7/44	51.53	86.73	125.67
右心房	69/170	101/170	-3.30	8.80	33.56	直肠	37/44	7/44	51.53	86.73	125.67
右心房	69/170	101/170	-3.30	8.80	33.56	右心室	35/160	125/160	-11.65	-0.46	16.02
皮肤	28/61	33/61	4.2 2	25.33	67.56	右心室	35/160	125/160	-11.65	-0.46	16.02
皮肤	28/61	33/61	4.2 2	25.33	67.56	小肠	36/67	31/67	10.76	33.92	64.75
软组织	4/6	2/6	25.95	40.91	58.70	小肠	36/67	31/67	10.76	33.92	64.75
软组织	4/6	2/6	25.95	40.91	58.70	脾	1/29	28/29	-19.20	-13.77	-6.69
胃	16/47	31/47	-8.30	13.38	47.93	脾	1/29	28/29	-19.20	-13.77	-6.69
胃	16/47	31/47	-8.30	13.38	47.93	睾丸	1/5	4/5	-18.20	5.01	37.66
胸腺	1/73	72/73	-22.55	-12.50	-3.27	睾丸	1/5	4/5	-18.20	5.01	37.66
胸腺	1/73	72/73	-22.55	-12.50	-3.27	甲状腺	14/19	5/19	45.56	98.30	141.24
子宫	43/58	15/58	37.47	103.26	180.98	甲状腺	14/19	5/19	45.56	98.30	141.24
子宫	43/58	15/58	37.47	103.26	180.98	WBC	0/43	43/43	-33.45	-25.32	-20.23

表3c-48774_at的e-Northern数据：正常组织中的LBFL305基因表达

总存在频率	组织	存在	不存在	下面25％	平均	上面75％
总存在频率	组织	存在	不存在	下面25％	平均	上面75％	0.9444
	脂肪	31/32	1/32	221.82	286.63	38 0.88	0.9444
	脂肪	31/32	1/32	221.82	286.63	38 0.88		肾上腺	12/12	0/12	162.12	214.21	310.82
	阑尾	3/3	0/3	352.94	506.01	633.71		肾上腺	12/12	0/12	162.12	214.21	310.82
	阑尾	3/3	0/3	352.94	506.01	633.71		动脉	3/3	0/3	343.80	419.88	643.55
	膀胱	5/5	0/5	221.82	290.82	301.11		动脉	3/3	0/3	343.80	419.88	643.55
	膀胱	5/5	0/5	221.82	290.82	301.11		骨	3/3	0/3	410.63	508.38	662.78
	乳房	80/80	0/80	236.84	279.81	338.22		骨	3/3	0/3	410.63	508.38	662.78
	乳房	80/80	0/80	236.84	279.81	338.22		小脑	5/5	0/5	182.09	198.28	283.55
	子宫颈	97/101	4/101	179.11	246.50	317.62		小脑	5/5	0/5	182.09	198.28	283.55
	子宫颈	97/101	4/101	179.11	246.50	317.62		结肠	146/151	5/151	247.18	314.49	389.23
	皮层前叶	7/7	0/7	222.19	230.28	268.13		结肠	146/151	5/151	247.18	314.49	389.23
	皮层前叶	7/7	0/7	222.19	230.28	268.13		皮层颞叶	3/3	0/3	305.66	365.62	377.16
	十二指肠	58/61	3/61	206.17	276.14	331.91		皮层颞叶	3/3	0/3	305.66	365.62	377.16
	十二指肠	58/61	3/61	206.17	276.14	331.91		子宫内膜	21/21	0/21	158.91	193.40	257.17
	食管	25/27	2/27	182.29	223.24	303.93		子宫内膜	21/21	0/21	158.91	193.40	257.17
	食管	25/27	2/27	182.29	223.24	303.93		输卵管	50/51	1/51	168.69	220.72	265.95
	胆囊	7/8	1/8	237.67	270.08	312.45		输卵管	50/51	1/51	168.69	220.72	265.95
	胆囊	7/8	1/8	237.67	270.08	312.45		心脏	2/3	1/3	44.79	55.84	56.46
	海马	5/5	0/5	165.94	212.72	32 8.59		心脏	2/3	1/3	44.79	55.84	56.46
	海马	5/5	0/5	165.94	212.72	32 8.59		肾	79/86	7/86	121.83	158.99	209.67
	喉	4/4	0/4	140.76	209.46	302.84		肾	79/86	7/86	121.83	158.99	209.67
	喉	4/4	0/4	140.76	209.46	302.84		左心房	127/141	14/141	58.48	92.78	123.06
	左心室	9/15	6/15	50.50	74.69	101.06		左心房	127/141	14/141	58.48	92.78	123.06
	左心室	9/15	6/15	50.50	74.69	101.06		肝	27/34	7/34	87.73	146.60	197.27
	肺	92/93	1/93	365.58	454.87	550.48		肝	27/34	7/34	87.73	146.60	197.27
	肺	92/93	1/93	365.58	454.87	550.48		淋巴结	11/11	0/11	493.34	943.95	1141.06
	肌肉	19/39	20/39	41.41	64.44	110.74		淋巴结	11/11	0/11	493.34	943.95	1141.06
	肌肉	19/39	20/39	41.41	64.44	110.74		子宫肌层	104/106	2/106	188.94	263.73	322.65
	网膜	15/15	0/15	198.02	244.56	334.75		子宫肌层	104/106	2/106	188.94	263.73	322.65
	网膜	15/15	0/15	198.02	244.56	334.75		卵巢	70/74	4/74	133.44	181.39	246.40
	胰腺	13/34	21/34	24.30	53.13	84.64		卵巢	70/74	4/74	133.44	181.39	246.40
	胰腺	13/34	21/34	24.30	53.13	84.64		胎盘	4/5	1/5	156.58	174.21	182.71
	前列腺	32/32	0/32	184.16	234.60	289.05		胎盘	4/5	1/5	156.58	174.21	182.71
	前列腺	32/32	0/32	184.16	234.60	289.05		直肠	42/43	1/43	284.60	365.66	434.01
	右心房	148/169	21/169	54.96	89.92	129.13		直肠	42/43	1/43	284.60	365.66	434.01

右心室	132/160	28/160	55.58	78.85	114.70
右心室	132/160	28/160	55.58	78.85	114.70	皮肤	57/59	2/59	250.81	320.57	398.56
小肠	64/68	4/68	196.50	279.29	393.83	皮肤	57/59	2/59	250.81	320.57	398.56
小肠	64/68	4/68	196.50	279.29	393.83	软组织	6/6	0/6	234.21	307.07	363.66
脾	31/31	0/31	775.25	879.84	1022.49	软组织	6/6	0/6	234.21	307.07	363.66
脾	31/31	0/31	775.25	879.84	1022.49	胃	41/47	6/47	137.91	217.53	3 38.54
睾丸	5/5	0/5	326.62	358.69	377.26	胃	41/47	6/47	137.91	217.53	3 38.54
睾丸	5/5	0/5	326.62	358.69	377.26	胸腺	71/71	0/71	691.12	802.96	9 84.42
甲状腺	18/18	0/18	121.11	162.16	238.53	胸腺	71/71	0/71	691.12	802.96	9 84.42
甲状腺	18/18	0/18	121.11	162.16	238.53	子宫	57/58	1/58	157.19	202.53	265.91
WBC	38/40	2/40	1863.06	2264.27	2743.82	子宫	57/58	1/58	157.19	202.53	265.91

表3d-48774_at的e-Northern数据：正常组织中的LBFL306基因表达

总存在频率	组织	存在	不存在	下面25％	平均	上面75％
总存在频率	组织	存在	不存在	下面25％	平均	上面75％	0.8143
	脂肪	31/32	1/32	184.04	242.67	285.20	0.8143
	脂肪	31/32	1/32	184.04	242.67	285.20		肾上腺	6/12	6/12	130.70	157.08	187.26
	阑尾	3/3	0/3	259.39	301.05	388.31		肾上腺	6/12	6/12	130.70	157.08	187.26
	阑尾	3/3	0/3	259.39	301.05	388.31		动脉	4/4	0/4	168.95	207.06	295.97
	膀胱	7/8	1/8	196.52	239.43	374.54		动脉	4/4	0/4	168.95	207.06	295.97
	膀胱	7/8	1/8	196.52	239.43	374.54		骨	4/4	0/4	209.35	226.22	292.55
	乳房	60/61	1/61	238.09	315.29	421.47		骨	4/4	0/4	209.35	226.22	292.55
	乳房	60/61	1/61	238.09	315.29	421.47		子宫颈	92/102	10/102	180.90	224.31	342.25
	结肠	168/192	24/192	147.41	175.83	215.95		子宫颈	92/102	10/102	180.90	224.31	342.25
	结肠	168/192	24/192	147.41	175.83	215.95		皮层前叶	5/5	0/5	133.94	148.22	162.91
	皮层颞叶	3/3	0/3	137.28	147.77	172.44		皮层前叶	5/5	0/5	133.94	148.22	162.91
	皮层颞叶	3/3	0/3	137.28	147.77	172.44		十二指肠	68/68	0/68	186.24	218.73	336.00
	子宫内膜	19/19	0/19	273.57	359.17	436.85		十二指肠	68/68	0/68	186.24	218.73	336.00
	子宫内膜	19/19	0/19	273.57	359.17	436.85		食管	14/25	11/25	105.83	140.56	195.89
	胆囊	7/8	1/8	232.71	293.00	410.47		食管	14/25	11/25	105.83	140.56	195.89
	胆囊	7/8	1/8	232.71	293.00	410.47		心脏	1/3	2/3	86.39	100.48	129.68
	海马	9/10	1/10	125.62	140.94	194.06		心脏	1/3	2/3	86.39	100.48	129.68
	海马	9/10	1/10	125.62	140.94	194.06		肾	53/91	38/91	108.29	147.35	186.69
	喉	3/4	1/4	160.96	190.50	219.55		肾	53/91	38/91	108.29	147.35	186.69
	喉	3/4	1/4	160.96	190.50	219.55		左心房	65/143	78/143	100.94	128.86	157.57
	左心室	0/13	13/13	82.54	106.63	117.06		左心房	65/143	78/143	100.94	128.86	157.57
	左心室	0/13	13/13	82.54	106.63	117.06		肝	15/44	29/44	145.82	204.77	244.58
	肺	104/114	10/114	168.03	203.35	283.11		肝	15/44	29/44	145.82	204.77	244.58
	肺	104/114	10/114	168.03	203.35	283.11		淋巴结	14/14	0/14	207.66	319.53	366.70

淋巴细胞(B+T细胞)	24/24	0/24	224.46	292.01	348.07
淋巴细胞(B+T细胞)	24/24	0/24	224.46	292.01	348.07	肌肉	31/40	9/40	183.43	24 0.15	329.99
子宫肌层	122/128	6/128	209.83	244.58	294.20	肌肉	31/40	9/40	183.43	24 0.15	329.99
子宫肌层	122/128	6/128	209.83	244.58	294.20	网膜	13/15	2/15	162.83	236.23	265.24
卵巢	80/81	1/81	219.28	259.00	331.64	网膜	13/15	2/15	162.83	236.23	265.24
卵巢	80/81	1/81	219.28	259.00	331.64	胰腺	8/40	32/40	97.07	136.80	174.54
前列腺	47/47	0/47	318.31	397.81	525.43	胰腺	8/40	32/40	97.07	136.80	174.54
前列腺	47/47	0/47	318.31	397.81	525.43	直肠	38/46	8/46	143.79	188.95	232.42
右心房	87/162	75/162	104.22	132.56	161.54	直肠	38/46	8/46	143.79	188.95	232.42
右心房	87/162	75/162	104.22	132.56	161.54	皮肤	38/44	6/44	162.29	198.90	236.86
小肠	72/79	7/79	184.41	230.96	270.34	皮肤	38/44	6/44	162.29	198.90	236.86
小肠	72/79	7/79	184.41	230.96	270.34	软组织	5/5	0/5	240.30	258.33	499.21
脾	36/36	0/36	253.03	322.87	390.61	软组织	5/5	0/5	240.30	258.33	499.21
脾	36/36	0/36	253.03	322.87	390.61	胃	32/54	22/54	139.62	174.76	269.47
胸腺	70/70	0/70	352.12	438.94	511.11	胃	32/54	22/54	139.62	174.76	269.47
胸腺	70/70	0/70	352.12	438.94	511.11	甲状腺	25/25	0/25	177.32	211.27	276.25
子宫	54/56	2/56	243.74	312.71	387.50	甲状腺	25/25	0/25	177.32	211.27	276.25
子宫	54/56	2/56	243.74	312.71	387.50	WBC	21/25	4/25	149.63	176.72	209.49

工业实用性

实施例3

用于胃癌筛选的LBFL301，LBFL304，LBFL305或LBFL306mRNA的检测

如实施例1中所述，即通过利用GeneChip筛选mRNA样品，或者如实施例2中所述，即通过利用RNA印迹筛选mRNA样品，测定了对应于SEQ ID NO：1，3，5，7，9，11，13，17，19或21的mRNA在胃组织活检样品中的表达水平。或者，可以对得自恶性状态或非恶性状态的非-胃增生组织的样品进行分析。得自胃癌患者的胃组织样品和得自正常个体的胃组织样品可以被用作阳性和阴性对照。利用任何分析基因表达的手段进行检测，表达水平高于正常对照则是胃癌的表征或表示有可能患上胃癌。

尽管参照上述实施例已经对本发明进行了详尽的描述，但是应当理解可以进行各种修改而不偏离本发明的实质。因此，本发明仅仅通过下列权利要求得到限定。本申请中引用的所有专利、专利申请和公开出版物被本文全部引入作为参考。

序列表

<110>LG Life Sciences Ltd.

<120>胃癌相关的基因家族

<130>PC03015-LG

<150>US 60/402,904

<151>2002-08-14

<150>US 60/404,408

<151>2002-08-20

<150>US 60/405,304

<151>2002-08-23

<150>US 60/421,582

<151>2002-10-28

<160>22

<170>KopatentIn 1.71

<210>1

<211>1272

<212>DNA

<213>智人

<220>

<221>CDS

<222>(131)..(859)

<223>基因LBFL301，克隆AD12

<400>1

ggcgcgcggg tgaaaggcgc attgatgcag cctgcggcgg cctcggagcg cggcggagcc 60

agacgctgac cacgttcctc tcctcggtct cctccgcctc cagctccgcg ctgcccggca 120

gccgggagcc atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc 172

Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg

1 5 10

ggc ctc ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc 220

Gly Leu Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala

15 20 25 30

tct gag atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag 268

Ser Glu Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu

35 40 45

gtg gtg gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg 316

Val Val Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val

50 55 60

cct ggt cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct 364

Pro Gly Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro

65 70 75

ggg atc cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg 412

Gly Ile Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu

80 85 90

agg gaa agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca 460

Arg Glu Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser

95 100 105 110

tgg agt tca ttg aat tat ggc ata gat ctt ggg aaa att gcg gag tgt 508

Trp Ser Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys

115 120 125

aca ttt aca aag atg cgt tca aat agt gct cta aga gtt ttg ttc agt 556

Thr Phe Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser

130 135 140

ggc tca ctt cgg cta aaa tgc aga aat gca tgc tgt cag cgt tgg tat 604

Gly Ser Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr

145 150 155

ttc aca ttc aat gga gct gaa tgt tca gga cct ctt ccc att gaa gct 652

Phe Thr Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala

160 165 170

ata att tat ttg gac caa gga agc cct gaa atg aat tca aca att aat 700

Ile Ile Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn

175 180 185 190

att cat cgc act tct tct gtg gaa gga ctt tgt gaa gga att ggt gct 748

Ile His Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala

195 200 205

gga tta gtg gat gtt gct atc tgg gtt ggc act tgt tca gat tac cca 796

Gly Leu Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro

210 215 220

aaa gga gat gct tct act gga tgg aat tca gtt tct cgc atc att att 844

Lys Gly Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile

225 230 235

gaa gaa cta cca aaa t aaatgcttta attttcattt gctacctctt tttttattat 900

Glu Glu Leu Pro Lys

240

gccttggaat ggttcactta aatgacattt taaataagtt tatgtataca tctgaatgaa 960

aagcaaagct aaatatgttt acagaccaaa gtgtgatttc acactgtttt taaatctagc 1020

attattcatt ttgcttcaat caaaagtggt ttcaatattt tttttagttg gttagaatac 1080

tttcttcata gtcacattct ctcaacctat aatttggaat attgttgtgg tcttttgttt 1140

tttctcttag tatagcattt ttaaaaaaat ataaaagcta ccaatctttg tacaatttgt 1200

aaatgttaag aatttttttt atatctgtta aataaaaatt atttccaaca accttaaaaa 1260

aaaaaaaaaa aa 1272

<210>2

<211>243

<212>PRT

<213>智人

<400>2

Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu

1 5 10 15

Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu

20 25 30

Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val

35 40 45

Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly

50 55 60

Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile

65 70 75 80

Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu

85 90 95

Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser

100 105 110

Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys Thr Phe

115 120 125

Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser Gly Ser

130 135 140

Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr Phe Thr

145 150 155 160

Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala Ile Ile

165 170 175

Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn Ile His

180 185 190

Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala Gly Leu

195 200 205

Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro Lys Gly

210 215 220

Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile Glu Glu

225 230 235 240

Leu Pro Lys

<210>3

<211>1355

<212>DNA

<213>智人

<220>

<221>CDS

<222>(174)..(584)

<223>基因LBFL301，克隆CH4

<400>3

ctccgggtgt cgcgggggcg ggaggaatta agggagggag agaggcgcgc gggtgaaagg 60

cgcattgatg cagcctgcgg cggcctcgga gcgcggcgga gccagacgct gaccacgttc 120

ctctcctcgg tctcctccgc ctccagctcc gcgctgcccg gcagccggga gcc 173

atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc ggc ctc 221

Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu

1 5 10 15

ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc tct gag 269

Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu

20 25 30

atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag gtg gtg 317

Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val

35 40 45

gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg cct ggt 365

Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly

50 55 60

cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct ggg atc 413

Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile

65 70 75 80

cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg agg gaa 461

Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu

85 90 95

agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca tgg agt 509

Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser

100 105 110

tca ttg aat tat ggc ata gat ctt ggg aaa att gcg aaa cac gtc aag 557

Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys

115 120 125

agt caa tac gaa tgg aca gaa cta gtc tagaat gagtgtacat ttacaaagat 610

Ser Gln Tyr Glu Trp Thr Glu Leu Val

130 135

gcgttcaaat agtgctctaa gagttttgtt cagtggctca cttcggctaa aatgcagaaa 670

tgcatgctgt cagcgttggt atttcacatt caatggagct gaatgttcag gacctcttcc 730

cattgaagct ataatttatt tggaccaagg aagccctgaa atgaattcaa caattaatat 790

tcatcgcact tcttctgtgg aaggactttg tgaaggaatt ggtgctggat tagtggatgt 850

tgctatctgg gttggcactt gttcagatta cccaaaagga gatgcttcta ctggatggaa 910

ttcagtttct cgcatcatta ttgaagaact accaaaataa atgctttaat tttcatttgc 970

tacctctttt tttattatgc cttggaatgg ttcacttaaa tgacatttta aataagttta 1030

tgtatacatc tgaatgaaaa gcaaagctaa atatgtttac agaccaaagt gtgatttcac 1090

actgttttta aatctagcat tattcatttt gcttcaatca aaagtggttt caatattttt 1150

tttagttggt tagaatactt tcttcatagt cacattctct caacctataa tttggaatat 1210

tgttgtggtc ttttgttttt tctcttagta tagcattttt aaaaaaatat aaaagctacc 1270

aatctttgta caatttgtaa atgttaagaa ttttttttat atctgttaaa taaaaattat 1330

ttccaacaaa aaaaaaaaaa aaaaa 1355

<210>4

<211>137

<212>PRT

<213>智人

<400>4

Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu

1 5 10 15

Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Set Ala Ser Glu

20 25 30

Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val

35 40 45

Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly

50 55 60

Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile

65 70 75 80

Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu

85 90 95

Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser

100 105 110

Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys

115 120 125

Ser Gln Tyr Glu Trp Thr Glu Leu Val

130 135

<210>5

<211>2500

<212>DNA

<213>智人

<220>

<221>CDS

<222>(38)..(892)

<223>克隆LBFL304，ORF1

<400>5

ggatataagc agtgcaaccc aagacctaag aatcttg atg ttg gaa ata aag 52

Met Leu Glu Ile Lys

1 5

atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg 100

Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly

10 15 20

aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta 148

Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu

25 30 35

gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac 196

Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn

40 45 50

tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat 244

Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp

55 60 65

aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat 292

Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn

70 75 80 85

aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag 340

Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu

90 95 100

cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca 388

His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro

105 110 115

agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt 436

Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu

120 125 130

caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt 484

Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu

135 140 145

gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac 532

Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His

150 155 160 165

tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg 580

Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu

170 175 180

gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc 628

Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro

185 190 195

agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag 676

Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln

200 205 210

tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct 724

Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro

215 220 225

gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc 772

Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr

230 235 240 245

gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag 820

Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys

250 255 260

gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc 868

Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser

265 270 275

gcc tcc tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac 920

Ala Ser Ser Ser Leu Ser Ser Asp

280 285

acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac 980

attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg 1040

tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg 1100

gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac 1160

agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg 1220

ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca 1280

cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc 1340

cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta 1400

gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa 1460

gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct 1520

tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg 1580

catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct 1640

gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata 1700

ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt 1760

tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt 1820

tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac 1880

aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt 1940

ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata 2000

tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag 2060

taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct 2120

tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt 2180

aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct 2240

ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg 2300

tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca 2360

agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata 2420

gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa 2480

actttaaaaa aaaaaaaaaa 2500

<210>6

<211>285

<212>PRT

<213>智人

<400>6

Met Leu Glu Ile Lys Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser

1 5 10 15

Tyr Gly Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile

20 25 30

Asn Trp Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr

35 40 45

Glu Tyr Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr

50 55 60

Leu Lys Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu

65 70 75 80

Gln Asn Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu

85 90 95

Val Val Ser Ala Glu His Ala Val Ser Met Glu Met Ala Set Ala Asp

100 105 110

Ser Asp Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr

115 120 125

Leu Pro Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser

130 135 140

Pro Glu Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His

145 150 155 160

Leu Asn Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu

165 170 175

Glu Thr Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu

180 185 190

Leu Glu Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro

195 200 205

Lys Glu Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp

210 215 220

Gln Leu Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met

225 230 235 240

Phe Thr Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly

245 250 255

Lys Met Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln

260 265 270

His Leu Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp

275 280 285

<210>7

<211>2500

<212>DNA

<213>智人

<220>

<221>CDS

<222>(53)..(892)

<223>克隆LBFL304，ORF2

<400>7

ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa ag 52

atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg 100

Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly

1 5 10 15

aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta 148

Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu

20 25 30

gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac 196

Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn

35 40 45

tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat 244

Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp

50 55 60

aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat 292

Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn

65 70 75 80

aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag 340

Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu

85 90 95

cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca 388

His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro

100 105 110

agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt 436

Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu

115 120 125

caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt 484

Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu

130 135 140

gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac 532

Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His

145 150 155 160

tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg 580

Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu

165 170 175

gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc 628

Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro

180 185 190

agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag 676

Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln

195 200 205

tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct 724

Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro

210 215 220

gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc 772

Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr

225 230 235 240

gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag 820

Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys

245 250 255

gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc 868

Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser

260 265 270

gcc tcc tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac 920

Ala Ser Ser Ser Leu Ser Ser Asp

275 280

acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac 980

attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg 1040

tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg 1100

gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac 1160

agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg 1220

ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca 1280

cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc 1340

cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta 1400

gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa 1460

gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct 1520

tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg 1580

catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct 1640

gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata 1700

ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt 1760

tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt 1820

tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac 1880

aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt 1940

ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata 2000

tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag 2060

taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct 2120

tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt 2180

aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct 2240

ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg 2300

tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca 2360

agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata 2420

gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa 2480

actttaaaaa aaaaaaaaaa 2500

<210>8

<211>280

<212>PRT

<213>智人

<400>8

Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly

1 5 10 15

Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu

20 25 30

Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn

35 40 45

Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp

50 55 60

Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn

65 70 75 80

Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu

85 90 95

His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro

100 105 110

Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu

115 120 125

Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu

130 135 140

Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His

145 150 155 160

Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu

165 170 175

Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro

180 185 190

Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln

195 200 205

Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro

210 215 220

Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr

225 230 235 240

Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys

245 250 255

Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser

260 265 270

Ala Ser Ser Ser Leu Ser Ser Asp

275 280

<210>9

<211>2500

<212>DNA

<213>智人

<220>

<221>CDS

<222>(65)..(892)

<223>克隆LBFL304，ORF3

<400>9

ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga 60

agct atg acc tac aca gag gac agt tat ggg atg gat ggg aag gtt 106

Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val

1 5 10

aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag 154

Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu

15 20 25 30

cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga 202

Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg

35 40 45

ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta 250

Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val

50 55 60

ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act 298

Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr

65 70 75

caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct 346

Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala

80 85 90

gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat 394

Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His

95 100 105 110

aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc 442

Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr

115 120 125

ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg 490

Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp

130 135 140

aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga 538

Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg

145 150 155

aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc 586

Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr

160 165 170

gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc 634

Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro

175 180 185 190

agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt 682

Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly

195 200 205

ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat 730

Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His

210 215 220

tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa 778

Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu

225 230 235

cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag 826

His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu

240 245 250

aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc 874

Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser

255 260 265 270

tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc 930

Ser Ser Leu Ser Ser Asp

275

tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct 990

accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg 1050

gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg 1110

ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct 1170

tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt 1230

gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc 1290

ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc 1350

agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt 1410

tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa 1470

cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa 1530

aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat 1590

aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg 1650

tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta 1710

ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt 1770

ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga 1830

acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt 1890

aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt 1950

ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt 2010

gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta 2070

ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt 2130

agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt 2190

aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga 2250

ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca 2310

gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg 2370

aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct 2430

ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa 2490

aaaaaaaaaa 2500

<210>10

<211>276

<212>PRT

<213>智人

<400>10

Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val Asn Gln

1 5 10 15

Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu Leu His

20 25 30

Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg Leu Ser

35 40 45

Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val Phe Ala

50 55 60

Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr Gln Thr

65 70 75 80

Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala Val Ser

85 90 95

Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His Lys Val

100 105 110

Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr Leu His

115 120 125

Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp Asn Asn

130 135 140

Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg Lys Thr

145 150 155 160

Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr Asp Phe

165 170 175

Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro Arg Leu

180 185 190

Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly Gly Pro

195 200 205

Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His Ser Asp

210 215 220

Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu His Arg

225 230 235 240

Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu Lys Asn

245 250 255

His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser Ser Ser

260 265 270

Leu Ser Ser Asp

275

<210>11

<211>2500

<212>DNA

<213>智人

<220>

<221>CDS

<222>(92)..(892)

<223>克隆LBFL304，ORF4

<400>11

ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga 60

agctatgacc tacacagagg acagttatgg g atg gat ggg aag gtt 106

Met Asp Gly Lys Val

1 5

aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag 154

Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu

10 15 20

cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga 202

Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg

25 30 35

ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta 250

Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val

40 45 50

ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act 298

Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr

55 60 65

caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct 346

Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala

70 75 80 85

gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat 394

Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His

90 95 100

aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc 442

Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr

105 110 115

ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg 490

Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp

120 125 130

aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga 538

Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg

135 140 145

aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc 586

Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr

150 155 160 165

gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc 634

Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro

170 175 180

agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt 682

Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly

185 190 195

ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat 730

Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His

200 205 210

tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa 778

Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu

215 220 225

cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag 826

His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu

230 235 240 245

aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc 874

Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser

250 255 260

tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc 930

Ser Ser Leu Ser Ser Asp

265

tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct 990

accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg 1050

gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg 1110

ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct 1170

tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt 1230

gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc 1290

ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc 1350

agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt 1410

tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa 1470

cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa 1530

aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat 1590

aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg 1650

tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta 1710

ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt 1770

ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga 1830

acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt 1890

aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt 1950

ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt 2010

gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta 2070

ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt 2130

agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt 2190

aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga 2250

ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca 2310

gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg 2370

aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct 2430

ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa 2490

aaaaaaaaaa 2500

<210>12

<211>267

<212>PRT

<213>智人

<400>12

Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp

1 5 10 15

Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr

20 25 30

Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys

35 40 45

Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn

50 55 60

Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val

65 70 75 80

Ser Ala Glu His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp

85 90 95

Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro

100 105 110

Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu

115 120 125

Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn

130 135 140

Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr

145 150 155 160

Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu

165 170 175

Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu

180 185 190

Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu

195 200 205

Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr

210 215 220

Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met

225 230 235 240

Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu

245 250 255

Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp

260 265

<210>13

<211>6405

<212>DNA

<213>智人

<220>

<221>CDS

<222>(49)..(1434)

<223>基因LBFL305

<400>13

gcgggaggat ggagcagtga gcgggtctgg gcggctgctg gcagcgcc atg gag acg 57

Met Glu Thr

1

gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa 105

Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu

5 10 15

gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa 153

Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys

20 25 30 35

ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag 201

Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu

40 45 50

acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc 249

Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu

55 60 65

cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct 297

Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro

70 75 80

cat gta gtc aaa tat tac ggc agt tat ttt aag aac aca gac tta tgg 345

His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp

85 90 95

atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga 393

Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg

100 105 110 115

tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa 441

Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln

120 125 130

tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac 489

Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His

135 140 145

cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca 537

Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala

150 155 160

aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc 585

Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala

165 170 175

aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg 633

Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val

180 185 190 195

att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga 681

Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly

200 205 210

ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc 729

Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile

215 220 225

cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca 777

His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr

230 235 240

ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa 825

Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys

245 250 255

cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc 873

Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu

260 265 270 275

ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga 921

Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg

280 285 290

gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc 969

Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser

295 300 305

cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat 1017

Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp

310 315 320

gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc 1065

Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly

325 330 335

act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att 1113

Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile

340 345 350 355

gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat 1161

Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn

360 365 370

gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc 1209

Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr

375 380 385

atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa 1257

Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu

390 395 400

aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg 1305

Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu

405 410 415

aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt 1353

Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe

420 425 430 435

aaa act agc caa gaa cag cag tct gga aaa gac ata tgt atc caa aat 1401

Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys Ile Gln Asn

440 445 450

tgc cag gga aac ctg ctg tgt aga tac gct ttc tgagaa accacatgct 1450

Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe

455 460

taagagttgg acagtggagg accttcagaa gaggctcttg gccctggacc ccatgatgga 1510

gcaggagatt gaagagatcc ggcagaagta ccagtccaag cggcagccca tcctggatgc 1570

catagaggct aagaagagac ggcaacaaaa cttctgagca aggccaggct gtgagggccc 1630

cagctccacc caggctttgg gtgaattctg gatggcttgc ctcatgtttg ttagccagca 1690

cttctgctct gtcgtctctc cacagcacct ttgtgaactc aggaatgtgc gccagtggga 1750

agggctctct tgacagtcag cgtgccatct tgatgtgtgt atgtacattg gtcaggtata 1810

ttatctcaaa ggatttatat tggcgctttt aactcagagt tttaaacccc aggaacagag 1870

actcctagtt gagtgatagc tgggaaagtt ttacattgtc tgtttttctt ctcccaatag 1930

ctttcaattg ttctttctgg aagactttta aaaaaatata aatatgcata tatatatata 1990

aattataaat agattcccca cgcagtgtgg tggcatctct gtacaggtac agttttaaac 2050

ggtttgcctc ttttctgtaa gattatggta ctgtggaaca tgagggcaga ggacaccggg 2110

aggctgttag ggggtcactg aatcccagga gccaacctcc ccctttgcag ggctgcattt 2170

aaaaattagg tttgggacag ttcttgtacc gtggtttcag ccttgtgtgg tcatcactgg 2230

cttctggagc tattggtgat gtccaaggga aagctttgag agtttatgtt tactctttga 2290

gtcccaggag aagcctggca ccctctttgc aaattggcct ttgctctttc aatgcctttc 2350

atccatctcc actctctcaa ctgcctaaag tcacagcaca gatactgccc agtgccttaa 2410

gaggagacat gatctctacc agggactctc agcaaacacg ggactgtgtt cagtccacaa 2470

aggaaaagcg tttttgaagc tctcattgtt catgtaaaaa tcatacacgt ggcatgttgc 2530

tccacattcc ttacacacag gggtagaggg gattgctttt gtgacccacg ttcaaatatg 2590

tgactgtttt cttttctctt ttactgctaa gcagcctgga aaggataaat gaatattaga 2650

ctaagatttg ttttccagga ggctcaatct gaacacacag aatgtcagag ctggaaggga 2710

ctatagagat catctgatct gatcctcttg tacggatgat cgcaaaactg aggtgtagag 2770

aggggaatgg ccaaaatcac aaagcaagtt agcgttaaga gctgagacta gaattcaggg 2830

tcctcactcc caggccaccg aaccatgcag ccccttcttt gggggaagag acctgtgtca 2890

gtcttggtta attgttccag ggaaccttgc taacagaaac ttgctcttgc cttggctctt 2950

cagtagatga cctggctgta aagagattcc ctggacgagc cagatcattc agtttcagcg 3010

agtccttgag ctccacaaca tctaccagat atagcagaca agcacccatg gaggcaggtt 3070

tcgggcctga agcagatcag agggctttgc aaaagacagc atagagccat cttcctgcaa 3130

ctttacctct ttccctcaga tggggagcca tgactgggtt gcacctcagg atactgtaat 3190

ttgactccat aattgctttt gctcctgaaa cctgggaatc aatggaaagg cagggaatgt 3250

gcctcttctg tggccagatt ctgttatttg caattaaagc aagtttttaa aaaatgcaag 3310

aggcagttgt tagtcttcag ggcttggcaa ctgaaatagc tatgtggcgg atacggaaaa 3370

cagaggacaa tttgaggatc ttgctggaat aataaatgac agctaccatt tgttgagcac 3430

ctattatata tcaggcactg agctgggtag gctctaaact tcacaataac cctgtgactt 3490

aactacttta tctccatttt gtagttgaag aaataagttc agagagaaag attccttccc 3550

aaggtcatgc agctagtaaa tgatagaatc aggattcata gcatcactat agggggtcaa 3610

tatttacaca aaaaaggaaa gtcacaagcc tgtttaaaat gaagtgacca ccttttcttg 3670

catagactaa ataactcgaa ctggcatttt taggttggaa agacagctga attagtagtt 3730

aagtctgata gccaagtaag ttttaaaaac caaagcatcc aggatgcaca cccctgcacc 3790

atttgctgtg cgaattaata gttctgtctc tctctctctt tcttttttct ttttattctt 3850

tgagatggat tttcgctctt gtcgcccagg ctggagtaca atggcacgat cttggctcac 3910

tgcaacctcc gcctcccggg ttcaagcgat tcttctgctg ggattacagc atatgccacc 3970

atgcccagat tatttttttg tatttgtagt agagacgggg tttcaccatg tcagtcaggc 4030

tggtcttgaa ctcctgacct caggtgatcc acccgcctca gcctcccaca ctgctgggat 4090

tacaggcatg agccaccgct cctggcctct ctttcttttt taaacaaaga actttgcact 4150

tggccagaga ggaggagaaa gcccattttc tcccttccta agctagatcc aaataaaaga 4210

aagttcagtt ttcccccata actattcttg ggtcatgaac tttgatctgg agtttgtttt 4270

gtttcaggaa tgtgtgcacc cagcttgctg atccaacaaa gtctattgct taccagtcta 4330

gcttgatgaa gccttttggc cagaagtcaa tttgttttgg atcagagaaa tttcctgaca 4390

aggtatattt gttttctagt gacagaaagg caaaggaaca agtcctagtt gttgttgttg 4450

ttgttgaata ctaaatttaa gatatgtcag cttgctttca atgagccttg ggcttctgtt 4510

attgcttgag catttggaac tcgagcttcc agagaaattt gaggtcctcg cttgttctct 4570

gccttcaaga aacaatgacc tgattctgtc tttaaaaaaa aaatctcaga attctttttt 4630

tgtttgtgtt tttttttttg agacagagtc tcactctgtt gcccaggctg gagtgcagtg 4690

gcgccatctc ggctcactgc aacctccgcc tcccaggttc aagcaattct cctgcctcag 4750

cctcccaggt agctgccact acaggtgctg caccaccacg cccggctaat ttttgtattt 4810

ttagtagaga cagggtttca ccatattagc caggtgggtc ttgaactcct gaccttgtga 4870

tccacccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccacc ttgcctggcc 4930

aaaaatctca gaattcttta agactgtttt aattgctcca tcagtaattt tgaagcactt 4990

tccttttttt ttttcccctt tttgtccctt tccccaagcc accaattgga tggatgaatg 5050

tttgacgggg aagaggaagg gtaggaggat gcatggatga gtggatgagt ggatcgatgg 5110

atgtattgat aaatagatag aaccagtcat ctgaagcaac ttaagaattg tagccttgac 5170

tccttgagac tgtagatttc gatccaggaa acatttattt agcacctgcc agatgccaga 5230

aatttatacc atttaaaact cagtaagtct tttaaatatc aggaaggaga gaagcgacat 5290

catgatacat cctatgggta ttaaaaagcc aatagaatat tatgaataat tttatgctaa 5350

taaatttaac aacttcaaca tcataaacaa attccttgaa aaataaaaag taccaaaatt 5410

cattcaagaa gaaatagata ccagcctgag caacatggca aaatcccatc tctacaaaac 5470

atcaaaaaaa aaaaattagt cgggcatggt ggtgcacacc tgtaatccca gcttgtcagg 5530

aggctgaagt gggaggatca cctgagccca gggaggtcaa ggatgcagtg agccatggtc 5590

tcaccactgc actctagcct aggtgacaga atgagacccc gtctcaaaaa aaaagaagaa 5650

gtagataatc tgaatagccc tatatctata gaaacttaat agtgctggga gatataggta 5710

ttattatcct cattttacag atgtgaaaat tgaggctcag agaagtaaag tctattgctc 5770

aaggtcatgt ggctagaata tggcagagcc atgattcaga tccaggtctt ctgattctta 5830

ttccagtgtc ctttctagca taccatgttg cctctaaaga ttgcagctcc ttatttacta 5890

gaaaattgtt cctgcccaat ctacatctcc acctcacccc atcttttctt aagcactatg 5950

tttgtgtttt tatcagtatt atattcattg tctttggaat acatgttctt gtttgtgttt 6010

ggaaaaaaaa tctcttttac cagcttgcac tcggaccaac ttggaaaaaa aaagcttaaa 6070

tgtttttgct atgtacagtt taaaaatgtg aagtttgtag ctttaacttt ttgtaagaaa 6130

atctaataac actggcttaa gtgctgactt gaaatgctat tttgtaaggt ttggatgtaa 6190

gtaatcaatt gaggtcagca gtttgtatga gacatagctt cctccattgc ccccactcct 6250

tttttctttt ttaagtttga gatgcttcct gtgtttttat gttagaattg ttgttctcct 6310

tcttttcttc ttcctatacc tcatcacgtt tgttttaaat aaactgtcct ttggaccaca 6370

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa 6405

<210>14

<211>462

<212>PRT

<213>智人

<400>14

Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys

1 5 10 15

Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val

20 25 30

Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile

35 40 45

His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu

50 55 60

Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys

65 70 75 80

Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr

85 90 95

Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp

100 105 110

Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr

115 120 125

Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg

130 135 140

Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu

145 150 155 160

Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp

165 170 175

Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala

180 185 190

Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp

195 200 205

Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr

210 215 220

Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro

225 230 235 240

Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp

245 250 255

Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala

260 265 270

Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser

275 280 285

Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg

290 295 300

Gln Glu Ser Gln Gln Arg Glu ValAsp Gln Asp Asp Glu Glu Asn Ser

305 310 315 320

Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp

325 330 335

Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn

340 345 350

Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met

355 360 365

Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg

370 375 380

Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu

385 390 395 400

Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro

405 410 415

Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp

420 425 430

Tyr Glu Phe Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys

435 440 445

Ile Gln Asn Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe

450 455 460

<210>15

<211>1931

<212>DNA

<213>智人

<220>

<221>CDS

<222>(43)..(1503)

<223>Mst1/STK4基因

<400>15

cggcacgaga gtgagcgggt ctgggcggct gctggcagcg cc atg gag acg 51

Met Glu Thr

1

gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa 99

Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu

5 10 15

gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa 147

Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys

20 25 30 35

ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag 195

Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu

40 45 50

acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc 243

Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu

55 60 65

cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct 291

Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro

70 75 80

cat gta gtc aaa tat tat ggc agt tat ttt aag aac aca gac tta tgg 339

His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp

85 90 95

atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga 387

Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg

100 105 110 115

tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa 435

Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln

120 125 130

tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac 483

Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His

135 140 145

cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca 531

Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala

150 155 160

aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc 579

Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala

165 170 175

aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg 627

Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val

180 185 190 195

att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga 675

Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly

200 205 210

ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc 723

Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile

215 220 225

cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca 771

His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr

230 235 240

ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa 819

Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys

245 250 255

cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc 867

Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu

260 265 270 275

ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga 915

Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg

280 285 290

gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc 963

Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser

295 300 305

cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat 1011

Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp

310 315 320

gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc 1059

Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly

325 330 335

act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att 1107

Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile

340 345 350 355

gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat 1155

Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn

360 365 370

gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc 1203

Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr

375 380 385

atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa 1251

Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu

390 395 400

aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg 1299

Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu

405 410 415

aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt 1347

Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe

420 425 430 435

ctt aag agt tgg aca gtg gag gac ctt cag aag agg ctc ttg gcc ctg 1395

Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu Leu Ala Leu

440 445 450

gac ccc atg atg gag cag gag att gaa gag atc cgg cag aag tac cag 1443

Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln Lys Tyr Gln

455 460 465

tcc aag cgg cag ccc atc ctg gat gcc ata gag gct aag aag aga cgg 1491

Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys Lys Arg Arg

470 475 480

caa caa aac ttc tgagcaa ggccaggctg tgagggcccc agctccaccc 1540

Gln Gln Asn Phe

485

aggctttggg tgaattctgg atggcttgcc tcatgtttgt tagccagcac ttctgctctg 1600

tcgtctctcc acagcacctt tgtgaactca ggaatgtgcg ccagtgggaa gggctctctt 1660

gacagtcagc gtgccatctt gatgtgtgta tgtacattgg tcaggtatat tatctcaaag 1720

gatttatatt ggcgctttta actcagagtt ttaaacccca ggaacagaga ctcctagttg 1780

agtgatagct gggaaagttt tacattgtct gtttttcttc tcccaatagc tttcaattgt 1840

tctttctgga agacttttaa aaaaatataa atatgcatat atatatataa attataaata 1900

gattccccac gcaggtggtg gcatctctgt a 1931

<210>16

<211>487

<212>PRT

<213>智人

<400>16

Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys

1 5 10 15

Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val

20 25 30

Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile

35 40 45

His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu

50 55 60

Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys

65 70 75 80

Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr

85 90 95

Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp

100 105 110

Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr

115 120 125

Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg

130 135 140

Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu

145 150 155 160

Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp

165 170 175

Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala

180 185 190

Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp

195 200 205

Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr

210 215 220

Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro

225 230 235 240

Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp

245 250 255

Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala

260 265 270

Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser

275 280 285

Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg

290 295 300

Gln Glu Ser Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser

305 310 315 320

Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp

325 330 335

Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn

340 345 350

Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met

355 360 365

Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg

370 375 380

Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu

385 390 395 400

Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro

405 410 415

Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp

420 425 430

Tyr Glu Phe Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu

435 440 445

Leu Ala Leu Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln

450 455 460

Lys Tyr Gln Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys

465 470 475 480

Lys Arg Arg Gln Gln Asn Phe

485

<210>17

<211>1299

<212>DNA

<213>智人

<220>

<221>CDS

<222>(75)..(572)

<223>克隆no.LBFL306-EF3

<400>17

gcggcggcgg cttctcgagt cctccccgac gcgtcctcta ggccagcgag ccccgcgctc 60

tccggtgacg gacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag 107

Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu

1 5 10

gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 155

Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His

15 20 25

cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 203

Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln

30 35 40

cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 251

Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp

45 50 55

acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 299

Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val

60 65 70 75

cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 347

Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr

80 85 90

gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 395

Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys

95 100 105

ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 443

Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys

110 115 120

gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 491

Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu

125 130 135

tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gat aac ccc aag 539

Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Asn Pro Lys

140 145 150 155

aaa ggc atc agg gtt ctg gag tgg ttg ttt gag tgacacag cacaaggcct 590

Lys Gly Ile Arg Val Leu Glu Trp Leu Phe Glu

160 165

tgatttcatc atgcttttgc tgtggatgta gtgtagcttg ctgaacaggt ttatttcaca 650

gagcagtgta cattcttgtc ttccagggga acttcaacat ggagttactt ttgatccctc 710

agttttaatt cagtgtctaa agcctgagaa atgccagtgg cctgacagca gcagacattg 770

cacaaaccca gggtttccaa gagtgtgccc agtttctctt gaacctccag aattgtcatc 830

tgaaccattt ctataacaat ggcatcttaa atgggggtca tcagaatgta tttcctaatc 890

atattagtgt gggaacaaat cgaaagagat gcttggaaga ctcagaagac tttggagtaa 950

agaaagctag aactgaaggt gagaccgctt tgcgggtggg aagagcacac ttatttttcc 1010

tttctgtaat atgttttctt tttatggctg agcgcacctt cgagatgaga ccttcacttc 1070

aggtggtaat gcgcctggtg gattgtgcgg tgacggtgga gatttctcct gtactgccac 1130

tgcgaagatg ggacacttaa caaaagggaa tgtgagggaa atactgatgg cccaagtgta 1190

aatgtctatg tggaactttt tgagcaccca tgtttacctg ccgtgaatta gattttttaa 1250

tttgttgtat ctgtttgaaa tatatctatt aaagaaaaaa aaaaaaaaa 1299

<210>18

<211>166

<212>PRT

<213>智人

<400>18

Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser

1 5 10 15

Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp

20 25 30

Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala

35 40 45

His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp

50 55 60

Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala

65 70 75 80

Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala

85 90 95

Hi s Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile

100 105 110

Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro

115 120 125

Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu

130 135 140

Val Ala Asn Gly Ala His Val Asp Asn Pro Lys Lys Gly Ile Arg Val

145 150 155 160

Leu Glu Trp Leu Phe Glu

165

<210>19

<211>2451

<212>DNA

<213>智人

<220>

<221>CDS

<222>(78)..(1337)

<223>克隆no.LBFL306-GC7

<400>19

gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg 60

ctctccggtg acggacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag 110

Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu

1 5 10

gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 158

Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His

15 20 25

cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 206

Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln

30 35 40

cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 254

Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp

45 50 55

acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 302

Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val

60 65 70 75

cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 350

Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr

80 85 90

gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 398

Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys

95 100 105

ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 446

Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys

110 115 120

gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 494

Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu

125 130 135

tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gac ctg aga aat 542

Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Leu Arg Asn

140 145 150 155

gcc agt ggc ctg aca gca gca gac att gca caa acc cag ggt ttc caa 590

Ala Ser Gly Leu Thr Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln

160 165 170

gag tgt gcc cag ttt ctc ttg aac ctc cag aat tgt cat ctg aac cat 638

Glu Cys Ala Gln Phe Leu Leu Asn Leu Gln Asn Cys His Leu Asn His

175 180 185

ttc tat aac aat ggc atc tta aat ggg ggt cat cag aat gta ttt cct 686

Phe Tyr Asn Asn Gly Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro

190 195 200

aat cat att agt gtg gga aca aat cga aag aga tgc ttg gaa gac tca 734

Asn His Ile Ser Val Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser

205 210 215

gaa gac ttt gga gta aag aaa gct aga act gaa gct caa agc ttg gat 782

Glu Asp Phe Gly Val Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp

220 225 230 235

tct gcc gtg cca ctc acg aat ggc gac aca gaa gac gat gct gac aaa 830

Ser Ala Val Pro Leu Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys

240 245 250

atg cac gtt gat agg gag ttt gct gtt gta aca gat atg aaa aac agt 878

Met His Val Asp Arg Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser

255 260 265

agc tcc gta tcg aat aca ttg aca aat gga tgt gtc atc aat gga cat 926

Ser Ser Val Ser Asn Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His

270 275 280

ttg gac ttc ccc tcc acg acc ccg ctc agt ggg atg gaa agc agg aat 974

Leu Asp Phe Pro Ser Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn

285 290 295

ggc cag tgc ttg aca gga act aac gga att agc agt gga tta gcc cca 1022

Gly Gln Cys Leu Thr Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro

300 305 310 315

gga cag ccg ttt ccg agt agc cag ggt tct ctc tgc att agt ggg act 1070

Gly Gln Pro Phe Pro Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr

320 325 330

gag gag cca gag aag acc ctg aga gct aac cct gag ttg tgc ggt tct 1118

Glu Glu Pro Glu Lys Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser

335 340 345

ctg cac ctg aac ggg agt cca agt agc tgc ata gcc agt agg cct tcc 1166

Leu His Leu Asn Gly Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser

350 355 360

tgg gtg gaa gac att ggg gat aac ctg tac tat gga cac tac cac ggg 1214

Trp Val Glu Asp Ile Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly

365 370 375

ttt ggg gac act gct gaa agc atc cca gaa ctg aac agt gtg gtc gag 1262

Phe Gly Asp Thr Ala Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu

380 385 390 395

cat tcc aag tcc gtg aag gtg cag gag cgg tac gac agt gcc gtg ctg 1310

His Ser Lys Ser Val Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu

400 405 410

ggc acc atg cac ctg cac cac ggc tcc tag agacgctgac ctggctctcg 1360

Gly Thr Met His Leu His His Gly Ser

415 420

gaaacgcagg agtccttcct ggtagccagc tcagaatacc catgtagcag caacttgaac 1420

gaatgtcaca acttgtacgt tttttatata cttcaacttt ctgaaaaagt aaacttcgac 1480

aagttcccag caactgcttg tttgtgcatg agtagggctt actaagtgca tagatgtttc 1540

tacagtgagg tgtccttttt ataaggtgca cttttggagt tcttctgatg ccaatctcaa 1600

cattgtcttt ttaatactgt caccagatat tgccattttt ctttttgtta aaagattata 1660

tgatcaagat aaattggggt ggtaaatcag gtgcctggta atttatctct ttgcacatgg 1720

gcatcatttt aaaaagcttg cttccactct tttctgtaga atttgacgga acacagctat 1780

ttccctatgc aaggtacagc cttacaaaga tttctgcagt gatttgtgtg aagaagagaa 1840

cgtttgtctt tttcaatgaa gctttgcaga tcaccatgtg gttgaaggtt ttagttgtgg 1900

acacagtggt ccctccttaa tgatgaagat cactgccttg ggcttcatgg aaaacaggcc 1960

cagcctgggg ctgcgtttgg atttattgtt tttattccac acttcctact tggtctctgg 2020

aagttttacc acatgtaaca gattccttta tatgtagtgg aaatcactat ttgtagaaac 2080

tgtcaggtca aaatatttaa ctgactgttg acatgtattt tcttttttcc ttgtttttgt 2140

tttttagggt tttctgcttt aagatatata ccactatgta tatccagtta actgagagaa 2200

ttttgactct cttaataaaa ctgcattaag tttttgattt tgtagaaatt agcttttgtc 2260

taggcaacta gtggttatac tctgcaaata ttgtaatgaa tttttacttt tttgattttt 2320

gtaataaaaa ttggtgcaga taaaatgtca aatgaacaaa ccagtgttct aagagtgtta 2380

ctaacatttt gttctaaaac tgtccttcac aaattgaata aaaaactctc acactcaaaa 2440

aaaaaaaaaa a 2451

<210>20

<211>420

<212>PRT

<213>智人

<400>20

Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser

1 5 10 15

Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp

20 25 30

Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala

35 40 45

His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp

50 55 60

Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala

65 70 75 80

Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala

85 90 95

His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile

100 105 110

Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro

115 120 125

Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu

130 135 140

Val Ala Asn Gly Ala His Val Asp Leu Arg Asn Ala Ser Gly Leu Thr

145 150 155 160

Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln Glu Cys Ala Gln Phe

165 170 175

Leu Leu Asn Leu Gln Asn Cys His Leu Asn His Phe Tyr Asn Asn Gly

180 185 190

Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro Asn His Ile Ser Val

195 200 205

Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser Glu Asp Phe Gly Val

210 215 220

Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp Ser Ala Val Pro Leu

225 230 235 240

Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys Met His Val Asp Arg

245 250 255

Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser Ser Ser Val Ser Asn

260 265 270

Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His Leu Asp Phe Pro Ser

275 280 285

Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn Gly Gln Cys Leu Thr

290 295 300

Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro Gly Gln Pro Phe Pro

305 310 315 320

Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr Glu Glu Pro Glu Lys

325 330 335

Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser Leu His Leu Asn Gly

340 345 350

Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser Trp Val Glu Asp Ile

355 360 365

Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly Phe Gly Asp Thr Ala

370 375 380

Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu His Ser Lys Ser Val

385 390 395 400

Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu Gly Thr Met His Leu

405 410 415

His His Gly Ser

420

<210>21

<211>1194

<212>DNA

<213>智人

<220>

<221>CDS

<222>(78)..(737)

<223>克隆no.LBFL-306-GE2

<400>21

gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg 60

ctctccggtg acggacc atg tcg gcg gcg gga gcg ggc gcg ggc gta gag 110

Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu

1 5 10

gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac 158

Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His

15 20 25

cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag 206

Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln

30 35 40

cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg 254

Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp

45 50 55

acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg 302

Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val

60 65 70 75

cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac 350

Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr

80 85 90

gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc 398

Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys

95 100 105

ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt 446

Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys

110 115 120

gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa 494

Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu

125 130 135

tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gag ttt att tca 542

Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Glu Phe Ile Ser

140 145 150 155

cag agc agt gta cat tct tgt ctt cca ggg gaa ctt caa cat gga gtt 590

Gln Ser Ser Val His Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val

160 165 170

act ttt gat ccc tca gtt tta att cag tgt cta aag cct gag aaa tgc 638

Thr Phe Asp Pro Ser Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys

175 180 185

cag tgg cct gac agc agc aga cat tgc aca aac cca ggg ttt cca aga 686

Gln Trp Pro Asp Ser Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg

190 195 200

gtg tgc cca gtt tct ctt gaa cct cca gaa ttg tca tct gaa cca ttt 734

Val Cys Pro Val Ser Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe

205 210 215

cta taa caatggcatc ttaaatgggg gtcatcagaa tgtatttcct aatcatatta 790

Leu

220

gtgtgggaac aaatcgaaag agatgcttgg aagactcaga agactttgga gtaaagaaag 850

ctagaactga aggtgagacc gctttgcggg tgggaagagc acacttattt ttcctttctg 910

taatatgttt tctttttatg gctgagcgca ccttcgagat gagaccttca cttcaggtgg 970

taatgcgcct ggtggattgt gcggtgacgg tggagatttc tcctgtactg ccactgcgaa 1030

gatgggacac ttaacaaaag ggaatgtgag ggaaatactg atggcccaag tgtaaatgtc 1090

tatgtggaac tttttgagca cccatgttta cctgccgtga attagatttt ttaatttgtt 1150

gtatctgttt gaaatatatc tattaaagaa aaaaaaaaaa aaaa 1194

<210>22

<211>220

<212>PRT

<213>智人

<400>22

Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser

1 5 10 15

Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu Hi s Arg Ala Cys Arg Asp

20 25 30

Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala

35 40 45

His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp

50 55 60

Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala

65 70 75 80

Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala

85 90 95

His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile

100 105 110

Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro

115 120 125

Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu

130 135 140

Val Ala Asn Gly Ala His Val Glu Phe Ile Ser Gln Ser Ser Val His

145 150 155 160

Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val Thr Phe Asp Pro Ser

165 170 175

Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys Gln Trp Pro Asp Ser

180 185 190

Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg Val Cys Pro Val Ser

195 200 205

Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe Leu

210 215 220

Claims

1.一种分离的核酸分子，该分离的核酸分子选自：(a)含有SEQID NO：3，5，7，9，11，13，17或19的分离核酸分子；(b)编码SEQID NO：4，14或18的氨基酸序列的分离核酸分子；(c)编码在胃癌中被表达的蛋白并与SEQ ID NO：3或17的全长具有至少约92％核苷酸序列相同性的分离核酸分子；(d)编码在胃癌中被表达的蛋白并与SEQID NO：13的全长具有至少约95％核苷酸序列相同性的分离核酸分子；(e)含有(a)，(b)，(c)或(d)的核酸分子的互补链的分离核酸分子。

2.如权利要求1所述的分离的核酸分子，其中所述核酸分子含有SEQ ID NO：3的174-584位核苷酸。

3.如权利要求1所述的分离的核酸分子，其中所述核酸分子由SEQ ID NO：3的174-584位核苷酸组成。

4.如权利要求1所述的分离的核酸分子，其中所述核酸分子包含SEQ ID NO：3的174-587位核苷酸。

5.如权利要求1所述的分离的核酸分子，其中所述核酸分子选自以下：由SEQ ID NO：5的38-892位核苷酸组成的核酸分子和由SEQID NO：5的38-895位核苷酸组成的核酸分子。

6.如权利要求1所述的分离的核酸分子，其中所述核酸分子选自以下：由SEQ ID NO：7的53-892位核苷酸组成的核酸分子和由SEQID NO：7的53-895位核苷酸组成的核酸分子。

7.如权利要求1所述的分离的核酸分子，其中所述核酸分子选自以下：由SEQ ID NO：9的65-892位核苷酸组成的核酸分子和由SEQID NO：9的65-895位核苷酸组成的核酸分子。

8.如权利要求1所述的分离的核酸分子，其中所述核酸分子选自以下：由SEQ ID NO：11的92-892位核苷酸组成的核酸分子和由SEQ ID NO：11的92-895位核苷酸组成的核酸分子。

9.如权利要求1所述的分离的核酸分子，其中所述核酸分子含有SEQ ID NO：13的49-1434位核苷酸。

10.如权利要求1所述的分离的核酸分子，其中所述核酸分子由SEQ ID NO：13的49-1437位核苷酸组成。

11.如权利要求1所述的分离的核酸分子，其中所述核酸分子含有SEQ ID NO：13的49-1437位核苷酸。

12.如权利要求1所述的分离的核酸分子，其中所述核酸分子含有SEQ ID NO：17的75-575位核苷酸。

13.如权利要求1所述的分离的核酸分子，其中所述核酸分子由SEQ ID NO：17的75-575位核苷酸组成。

14.如权利要求1所述的分离的核酸分子，其中所述核酸分子含有SEQ ID NO：17的75-572位核苷酸。

15.如权利要求1-14中任一项所述的分离的核酸分子，其中所述核酸分子与一个或多个表达控制元件进行可操作性的连接。

16.一种含有权利要求1-14中任一项所述的分离的核酸分子的载体。

17.一种被转化而含有权利要求1-14中任一项所述的核酸分子的宿主细胞。

18.一种含有权利要求16的载体的宿主细胞。

19.如权利要求18所述的宿主细胞，其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。

20.一种用于生产多肽或蛋白的方法，包括在由核酸编码的所述多肽或蛋白表达的条件下培养被权利要求1-14中任一项所述的核酸分子转化的宿主细胞。

21.如权利要求20所述的方法，其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。

22.一种由权利要求21所述的方法生产的分离的多肽或蛋白。

23.一种分离的多肽或蛋白，选自以下：(a)含SEQ ID NO：4，6，8，10，12，14或18的氨基酸序列的分离多肽或蛋白；(b)与SEQ IDNO：4具有至少约92％氨基酸序列相同性的分离多肽或蛋白；(c)由SEQID NO：4的31-137位氨基酸组成的分离多肽或蛋白；(d)含SEQ ID NO：6，8，10或12的至少10个氨基酸的片段的分离多肽；(e)含SEQ IDNO：6，8，10或12的保守氨基酸取代物的分离多肽；(f)含SEQ ID NO：6，8，10或12的自然存在的氨基酸序列变异体的分离多肽；(g)与SEQID NO：6，8，10或12具有至少约75％氨基酸序列相同性的分离多肽；(h)与SEQ ID NO：14具有至少约95％氨基酸序列相同性的分离多肽或蛋白；和(i)与SEQ ID NO：18具有至少约92％氨基酸序列相同性的分离多肽或蛋白。

24.一种与权利要求23所述的多肽或蛋白结合的或与含有SEQ IDNO：2的氨基酸序列的分离多肽或蛋白结合的分离的抗体或抗原-结合型抗体片段。

25.如权利要求24所述的抗体，其中所述抗体是单克隆或多克隆抗体。

26.调控编码权利要求23的蛋白、含SEQ ID NO：2，20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的核酸分子表达的介质的鉴定方法，该方法包括：

使表达所述核酸的细胞与所述介质接触；和

确定所述介质是否调控所述核酸的表达，从而鉴定出调控编码所述蛋白的核酸分子的表达的介质。

27.调控权利要求23的蛋白、含SEQ ID NO：2，20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的水平或至少一种活性的介质的鉴定方法，该方法包括：

使表达所述蛋白的细胞与所述介质接触；和

确定所述介质是否调控所述蛋白的水平或至少一种活性，从而鉴定出调控所述蛋白的水平或至少一种活性的介质。

28.如权利要求27的方法，其中所述介质调控所述蛋白的一种活性。

29.一种鉴定权利要求23的蛋白或含SEQ ID NO：2所示氨基酸序列的蛋白的结合配偶体的方法，该方法包括以下步骤：

使所述蛋白与潜在的结合配偶体接触；和

确定所述潜在的结合配偶体是否与所述蛋白结合，从而鉴定出所述蛋白的结合配偶体。

30.对编码权利要求23的蛋白、含SEQ ID NO：2，20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的核酸分子的表达进行调控的方法，该方法包括以下步骤：

施用有效量的调控编码所述蛋白的核酸分子的表达的介质。

31.对权利要求23的蛋白、含SEQ ID NO：2，20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的至少一种活性进行调控的方法，该方法包括以下步骤：

施用有效量的调控所述蛋白的至少一种活性的介质。

32.一种经修饰而含有权利要求1-14中的任一项所述的核酸分子的非人类转基因动物。

33.如权利要求32所述的转基因动物，其中所述核酸分子含有防止被编码蛋白进行表达的突变。

34.在受试者中诊断疾病状态的方法，包括：

确定权利要求1-14中的任一项所述的核酸分子或编码Mst1蛋白或Mst1剪接变体蛋白的核酸分子的表达水平，或者确定权利要求23的蛋白或含SEQ ID NO：2，20或22所示氨基酸序列的蛋白或Mst1蛋白或Mst1剪接变体蛋白的表达水平。

35.如权利要求34所述的方法，其中所述疾病状态是胃癌。

36.如权利要求34所述的方法，其中所述疾病状态是晚期胃癌。

37.如权利要求34所述的方法，其中所述疾病状态是恶性肿瘤。

38.如权利要求37所述的方法，其中所述恶性肿瘤发生在软组织、骨头、乳房、子宫颈、结肠、子宫内膜、食道、肾、喉、肝脏、肺、网膜、卵巢、胰腺、直肠、甲状腺、子宫肌层、前列腺、皮肤、小肠、膀胱、脾或胃。

39.如权利要求16-21或24-25中任一项所述的方法，其中所述剪接变体是SEQ ID NO：13或SEQ ID NO：14。

40.含有稀释剂和多肽或蛋白的组合物，其中所述多肽或蛋白选自以下：(a)含SEQ ID NO：4，6，8，10，12，14，18，20或22所示氨基酸序列的分离多肽或蛋白；(b)与SEQ ID NO：4或18具有至少约92％氨基酸序列相同性的分离多肽或蛋白；(c)由SEQ ID NO：4的31-137位氨基酸组成的分离多肽或蛋白；(d)含SEQ ID NO：6，8，10或12的至少10个氨基酸的片段的分离多肽；(e)含SEQ ID NO：6，8，10或12的保守氨基酸取代物的分离多肽；(f)含SEQ ID NO：6，8，10或12的自然存在的氨基酸序列变异体的分离多肽；(g)与SEQ ID NO：6，8，10或12具有至少约75％氨基酸序列相同性的分离多肽；(h)与SEQ ID NO：14具有至少约95％氨基酸序列相同性的分离多肽。