[go: up one dir, main page]

CN1681835A - 胃癌相关的基因家族 - Google Patents

胃癌相关的基因家族 Download PDF

Info

Publication number
CN1681835A
CN1681835A CNA03821976XA CN03821976A CN1681835A CN 1681835 A CN1681835 A CN 1681835A CN A03821976X A CNA03821976X A CN A03821976XA CN 03821976 A CN03821976 A CN 03821976A CN 1681835 A CN1681835 A CN 1681835A
Authority
CN
China
Prior art keywords
nucleic acid
seq
acid molecule
nos
albumen
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA03821976XA
Other languages
English (en)
Inventor
高祥锡
刘晴
郑贤镐
曾文
李福万
宋始英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Chem Ltd
Original Assignee
LG Life Sciences Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by LG Life Sciences Ltd filed Critical LG Life Sciences Ltd
Publication of CN1681835A publication Critical patent/CN1681835A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4748Tumour specific antigens; Tumour rejection antigen precursors [TRAP], e.g. MAGE
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • G01N33/5753
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/136Screening for pharmacological compounds
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2500/00Screening for compounds of potential therapeutic value

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Pathology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Toxicology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Oncology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)

Abstract

本发明一般涉及胃癌中的基因表达的变化。本发明具体涉及对应于mRNA的人类基因家族,所述mRNA在癌性胃组织和正常胃组织中进行差异表达。

Description

胃癌相关的基因家族
                   技术领域
本发明一般涉及胃癌患者的胃组织中的基因表达相对于正常胃组织中的基因表达所发生的变化。本发明具体涉及与正常组织相比在晚期胃癌以及其它恶性肿瘤中进行差异表达的人类基因家族。
                   技术背景
胃癌
在美国,每年诊断出大约24000个胃癌新病例。尽管近60年来,胃癌的发病率显著降低,但是胃癌仍然是一种起因不明的严重疾病。在相似的境况下,某些人就患上了胃癌而其它人则没有患上胃癌。
胃癌通常发生在年龄大于55岁的人群中并且男人的发病率是妇女发病率的两倍。这类癌症在美国并不普遍,但是在日本、韩国、拉丁美洲和东欧部分地区却很普遍,这些地区的人食用了较多的经干燥、酸渍、烟熏或盐渍保存的食物。相反,食用新鲜水果和蔬菜可以预防这种疾病。
胃癌可以发生在胃的任何部位并且会扩散到整个胃和/或其它器官。这种癌症还可以沿着胃壁生长从而扩散到食管或小肠中。如果这种癌透过胃壁生长则会蔓延到附近的淋巴结、肝脏、胰腺和结肠。胃癌甚至能够扩散得更远,甚至到卵巢、肺和远距离的淋巴结。当胃癌转移到身体的另一个部位时,这些肿瘤细胞与原发肿瘤中的那些肿瘤细胞属于同一类型。换句话说,肝脏中的转移性细胞仍然是胃癌细胞。扩散到卵巢并生长成一个或多个卵巢肿瘤的这种肿瘤细胞被称作Krukenberg肿瘤而且是由被转化的胃细胞而不是卵巢细胞组成。
由于胃癌的症状是非特异性的,因此在胃癌早期很难检测出这种癌症。症状包括消化不良、胃灼热、腹痛、恶心和呕吐,腹泻或便秘、食欲减退、虚弱和疲劳,以及便血或吐血。诊断通常借助X-光检测胃肠道上部和食道来进行,当患者喝下液体钡示踪剂后进行X-光片的拍摄。利用胃镜还可以对胃和食道进行内窥镜检测。如果发现异常组织,还可以通过胃镜进行活组织检查。如果结果表明活组织样品具有癌细胞,则对周围淋巴结进行活组织检查,通过CT扫描检测周围的器官如肝脏和胰腺来确定疾病的程度或阶段。胃癌的治疗方法与那些用于其它类型癌的方法相似:切除受影响的器官(部分或整体胃切除术),还可以清除附近淋巴结、化疗、放射疗法和免疫疗法(刺激袭击癌细胞的免疫系统组分)(http://cancernet.nci.nih.gov/canceertype s.html)。由于早期胃癌基本没有症状,所以在该疾病没有发展到晚期前通常不作诊断,而晚期的治疗却没有效果。
胃癌中的分子变化
对与胃癌的发生和发展相关的胃细胞中的分子变化基本没有了解。因此,存在着对在基因表达水平发生的变化进行研究的需求,以及存在着对与胃癌发生和发展相关的新分子标记物进行鉴定的需求。而且,如果期望阻止或减缓胃癌发展的干预能够成功,需要建立准确评估这种疾病早期症状的方法。一种准确评估胃癌早期症状的方法是识别与疾病进展相关的独特标记(参见例如Kim等(2001),癌基因20:4568-4575)。同样,预防或终止胃癌发展的治疗方法的建立取决于对在胃内部引起癌变和癌生长的基因进行的识别。
                     本发明的公开
本发明基于对在晚期胃癌(AGC)和其它恶性肿瘤中的表达与在正常组织中的表达具有差异性的新基因家族的发现。本发明包括:含有SEQ ID NO:3,5,7,9,11,13,17或19的分离核酸分子;编码SEQ ID NO:4,14或18的氨基酸序列的分离核酸分子;编码在胃癌中被表达的蛋白并与SEQ ID NO:3或17的全长序列具有至少约92%核苷酸序列相同性的分离核酸分子;编码在胃癌中被表达的蛋白并与SEQ ID NO:13的全长序列具有至少约95%核苷酸序列相同性的分离核酸分子;和含有上述任一核酸分子的互补链的分离核酸分子。
本发明还包括与包括含所述分离核酸分子的载体在内的一种或多种表达控制元件可操作性连接的核酸分子。本发明还包括被转化而含有本发明的核酸分子的宿主细胞和用于生产蛋白的方法,该方法包括在该蛋白被表达的条件下培养经本发明核酸分子转化的宿主细胞的步骤。
本发明还提供了一种分离多肽,该多肽选自含SEQ ID NO:4,6,8,10,12,14或18的氨基酸序列的分离多肽、含SEQ ID NO:6,8,10或12的至少10个氨基酸的片段的分离多肽、含SEQ ID NO:6,8,10或12的保守氨基酸取代物的分离多肽和含SEQ ID NO:6,8,10或12的自然存在的氨基酸序列变异体的分离多肽。本发明的多肽还包括其氨基酸序列与SEQ ID NO:4所示序列具有至少约90%、优选地至少约92-95%以及更优选地至少约95-98%氨基酸序列相同性的多肽。本发明的多肽还包括其氨基酸序列与SEQ ID NO:6,8,10或12所示序列具有至少约50%、60%、70%或75%,优选地至少约80%,更优选地至少约90-95%以及最优选地至少约95-98%氨基酸序列相同性的多肽。本发明的多肽还包括其氨基酸序列分别与SEQ ID NO:14和SEQ ID NO:18所示序列具有至少约95%和至少约92%氨基酸序列相同性的多肽。
本发明还提供了一种与本发明的多肽发生特异性结合的分离抗体或抗原-结合型抗体片段,包括单克隆或多克隆抗体。
本发明还提供了鉴定调控编码本发明蛋白的核酸分子表达的介质(agent)的方法,该方法包括:使表达所述核酸分子的细胞与所述介质接触;和确定所述介质是否调控所述核酸分子的表达,从而鉴定出调控编码所述蛋白的核酸分子的表达的介质。
本发明还提供了鉴定调控本发明蛋白的水平或至少一种活性的介质的方法,该方法包括:使表达所述蛋白的细胞与所述介质接触;和确定所述介质是否调控所述蛋白的水平或至少一种活性,从而鉴定出调控所述蛋白的水平或至少一种活性的介质。
本发明还提供了鉴定本发明蛋白的结合配偶体的方法,该方法包括以下步骤:使所述蛋白与可能的结合配偶体接触;和确定所述可能的配偶体是否与所述蛋白结合,从而鉴定出所述蛋白的结合配偶体。
本发明还提供了对编码本发明蛋白的核酸分子的表达进行调控的方法,该方法包括以下步骤:施用有效量的调控编码所述蛋白的核酸分子的表达的介质。本发明还提供了调控本发明蛋白的至少一种活性的方法,该方法包括以下步骤:施用有效量的调控本发明蛋白的至少一种活性的介质。
本发明还包括被改造而含有本发明的核酸分子的非-人类转基因动物或被改造而含有突变的核酸分子从而不能表达本发明的被编码的多肽的非-人类转基因动物。
本发明还包括非-人类转基因动物,其中含有SEQ ID NO:3,5,7,9,11,13或17的全长或部分序列的完整或部分基因被从该动物的基因组中敲除或删除。
本发明还提供了诊断胃癌或恶性肿瘤的方法,该方法包括以下步骤:从受试者身上获取组织、血液、尿液或其它样品,并确定本发明的核酸分子或本发明的多肽的表达水平。
本发明还包括含有稀释剂和多肽或蛋白的组合物,该多肽或蛋白选自含SEQ ID NO:4,6,8,10,12,14或18的氨基酸序列的分离多肽、其氨基酸序列与SEQ ID NO:4所示序列具有至少约90%、优选地至少约92-95%以及更优选地至少约95-98%氨基酸序列相同性的分离多肽、含SEQ ID NO:6,8,10或12的至少10个氨基酸的片段的分离多肽、含SEQ ID NO:6,8,10或12的保守氨基酸取代物的分离多肽、SEQ ID NO:6,8,10或12的自然存在的氨基酸序列变异体、其氨基酸序列与SEQ ID NO:6,8,10或12所示序列具有至少约50%、60%、70%或75%,优选地至少约80%,更优选地至少约90-95%以及最优选地至少约95-98%氨基酸序列相同性的分离多肽、其氨基酸序列与SEQ ID NO:14所示序列具有至少约95%的分离多肽或其氨基酸序列与SEQ ID NO:18所示序列具有至少约92%氨基酸序列相同性的分离多肽。
                    附图的简要描述
图1是显示SEQ ID NO:1(克隆AD12)与SEQ ID NO:3(克隆CH4)的序列差异的图表,其中SEQ ID NO:1(克隆AD12)和SEQ ID NO:3(克隆CH4)是被命名为LBFL301的基因的剪接变体。
图2是由LBFL301变体AD12的可读框编码的蛋白(SEQ ID NO:2)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图3是由LBFL301变体CH4的可读框编码的蛋白(SEQ ID NO:4)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图4是由LBFL304的可读框中的最长可读框编码的蛋白(SEQ IDNO:6)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图5是由LBFL305的可读框编码的蛋白(SEQ ID NO:14)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图6表示三个LBFL306克隆的相对比对位置。
图7是由克隆序号为LBFL306-EF3的可读框编码的蛋白(SEQ IDNO:18)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图8是由克隆序号为LBFL306-GC7的可读框编码的蛋白(SEQ IDNO:20)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
图9是由克隆序号为LBFL306-GE2的可读框编码的蛋白(SEQ IDNO:22)的疏水性图。按照Kyte-Doolittle和Goldman等的方法进行分析。
                 实施本发明的最好方式
I.总述
本发明部分基于对新基因家族的鉴定,所述新基因家族在人的癌性胃组织和其它恶性肿瘤中的表达不同于在人正常组织中的表达。这些基因家族包括SEQ ID NOS:1,3,5,7,9,11,1 3,17,19和21的人cDNA。
本发明的基因和蛋白可被用作检测样品中的胃癌或监视样品中的胃癌的发展的诊断试剂或标记物。它们还可以作为调控基因表达或活性的试剂的靶标。例如,可以鉴定调控与包括胃癌增生过程在内的肿瘤生长有关的生物学过程的介质。
II.具体的技术方案
A.与胃癌相关的蛋白质
本发明提供了分离的蛋白质、所述蛋白质的等位基因变体和所述蛋白质的保守氨基酸取代物。本文中所使用的“蛋白质”或“多肽”部分是指具有SEQ ID NO:2,4,6,8,10,12,14或18所示的人氨基酸序列的蛋白质。该术语还指其氨基酸序列与以上具体列举的氨基酸序列略有差异的自然存在的等位基因变体和蛋白质。尽管等位基因变体具有的氨基酸序列与以上列举的氨基酸序列略有差异,但等位基因变体却仍然具有与这些蛋白质相同或相似的生物学功能。
本文中的与SEQ ID N0:2,4,6,8,10,12,14或18所示的人氨基酸序列相关的蛋白质家族包括从除人以外的生物体中分离的蛋白质。被用于鉴定和分离与这些蛋白质相关的蛋白质家族的其它成员的方法如以下所述。
本发明的蛋白质优选地是分离形式的。当采用物理、机械或化学方法从通常与蛋白质结合的细胞组分中移出所述蛋白质时该蛋白质就被认为是分离的。一个技术人员可以轻而易举地采用标准的纯化方法来获得一种分离蛋白。
本发明的蛋白质还包括SEQ ID NO:2,4,6,8,10,12,14或18的剪接变体和插入、缺失或保守氨基酸取代变异体。本文中的保守变异体是指对蛋白质的生物学功能不产生负作用的氨基酸序列的改变。当改变的序列阻碍或破坏蛋白质的相关生物学功能时,取代、插入或缺失被认为对蛋白质具有副作用。例如,蛋白质的整体带电性、结构或疏水性/亲水性在某些情况下是可以被改变的,而对生物学活性则不产生副作用。因此,可以改变氨基酸的序列从而提供疏水性或亲水性更强的肽而对蛋白质的生物学活性不产生副作用。
通常,等位变体、保守取代变异体和由LBFL301编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO:2或4所示的序列具有至少约50%,60%,70%或75%的氨基酸序列相同性,更优选地至少约80-90%,甚至更优选地至少约92-95%以及最优选地至少约95-98%的序列相同性。等位变体、保守取代变异体和由LBFL304编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO:6,8,10或12所示的序列具有至少约50%,60%,70%或75%的氨基酸序列相同性,更优选地至少约80%,甚至更优选地至少约92-95%以及最优选地至少约99%或99.5%的序列相同性。等位变体、保守取代变异体和由LBFL305或LBFL306编码的蛋白质家族的成员具有的氨基酸序列与SEQ ID NO:14或18所示的序列具有至少约50%,60%,70%或75%的氨基酸序列相同性,更优选地至少约80-90%,甚至更优选地至少约92-94%以及最优选地至少约95%,98%或99%的序列相同性。关于这种序列的相同性或同源性在本文中被定义为:当进行序列比对和引入缺口(如果必要)以获得最大百分比的同源性后,候选序列中的与SEQ ID NO:2,4,6,8,10,12,14或18相同的氨基酸残基的百分比,其中不考虑将任何保守取代作为序列相同性的一部分(参见B部分中的相关参数)。认为融合蛋白或肽序列中的N-端、C-端或内部延长、缺失或插入并不影响同源性。
因此,本发明的蛋白质包括:具有SEQ ID NO:2,4,6,8,10,12,14或18所示的氨基酸序列的分子;其具有这些蛋白质的至少约3,4,5,6,10,15,20,25,30,35或更多个氨基酸残基的连续序列的片段;所公开的编码序列的N-或C-端或内部已被插入一个或多个氨基酸残基而生成的氨基酸序列变异体;和被公开的序列的氨基酸序列变异体或其如上定义已被至少一个残基取代的片段。也被称作肽或多肽的这种片段可含有蛋白质的抗原区域、功能区域,这些区域被确认为是对应于已知蛋白结构域的氨基酸序列区域,其还可含有强亲水性区域。利用常规获得的蛋白序列分析软件如MacVector(OxfordMolecular)可以轻而易举地鉴定出所述的所有区域。
所预期的变异体还包括那些含有通过例如同源性重组、定点或PCR诱变所进行的预定突变的变异体,和包括但不限于兔子、小鼠、大鼠、猪、牛、羊、马和非人类灵长目动物品种在内的其它动物品种的相应蛋白质,和等位基因或蛋白家族的其它自然存在的变异体(例如,一种与对应于GenBank序列号为XM_128002,XM_129365,NM_021420,NM_133971(DNA序列)的小鼠蛋白和NP_598732(蛋白质序列)具有相似性的小鼠类似物,所有这些内容被引入本文作为参考)。其它变异体包括其中蛋白质已经通过取代的、化学的、酶的或其它适当的方法用除自然存在的氨基酸以外的其它部分(例如一种可测部分如酶或放射性同位素)进行了共价修饰的衍生物。
本发明还提供了含有本发明的蛋白或多肽和稀释剂的组合物。合适的稀释剂可以是水性或非水性溶剂或其组合物,并且可含有其它增加所述蛋白质或多肽的稳定性、溶解性、活性和/或贮存期的组分,例如水溶性盐或甘油。
如下所述,可以使用蛋白质家族中的成员:(1)来识别调控该蛋白质的水平或至少一种活性的介质,(2)来识别蛋白质的结合配偶体,(3)作为抗原以产生多克隆或单克隆抗体,(4)作为一种治疗剂或靶标和(5)作为胃癌和其它增生疾病的诊断试剂或标记物。
B.核酸分子
本发明还提供了编码如SEQ ID NO:2,4,6,8,10,12,14或18所示的蛋白质及本文记载的相关蛋白质的核酸分子,优选地是以分离的形式存在。本文中使用的“核酸”被定义为如下列的RNA或DNA:编码上述蛋白或肽;与编码这种肽的核酸序列互补;与SEQ ID NO:1,3,5,7,9,11,13或17所示的核酸杂交并且在合适的严紧条件下仍然与其稳定结合;编码与SEQ ID NO:2或4的肽序列具有至少约50%,60%,70%或75%,优选地至少约80-90%,更优选地至少约92-95%以及最优选地至少约95-98%或更高相同性的多肽;与SEQ ID NO:1或3的可读框具有至少50%,60%,70%或75%,优选地至少约80-90%,更优选地至少约92-95%以及甚至更优选的至少约95-98%或更高的核苷酸序列相同性;编码与SEQ ID NO:6,8,10或12的肽序列具有至少约50%,60%,70%或75%,优选地至少约80%,更优选地至少约85%以及最优选地至少约90%,95%,98%,99%,99.5%或更高相同性的多肽;与SEQ ID NO:5,7,9或11的可读框具有至少50%,60%,70%或75%,优选地至少约80%,更优选地至少约85%和甚至更优选地至少约90%,95%,98%,99%,99.5%或更高的核苷酸序列相同性;编码与SEQID NO:14或18的肽序列具有至少约50%,60%,70%或75%,优选的至少约80-90%,更优选地至少约92-94%以及最优选地至少约95%,98%,99%或更高相同性的多肽;或者与SEQ ID NO:13或17的可读框具有至少50%,60%,70%或75%,优选地至少约80-90%,更优选地至少约92-94%,和甚至更优选的至少约95%,98%,99%或更高的核苷酸序列相同性。
本发明还包括与SEQ ID NO:1,3,5,7,9,11,13或17的互补链进行特异性杂交的分离的核酸分子,具体地是与可读框进行特异性杂交的分子。与SEQ ID NO:1,3,5,7,9,11,13或17的互补链进行特异性杂交的这种分子一般是在严紧的杂交条件下进行杂交的。
具体预期的是基因组DNA,cDNA,mRNA和反义分子以及基于自然界来源或合成的可替代性主链或包含替代性碱基的核酸。然而,这种杂交或互补核酸被进一步定义为相对于现有技术中的核酸是新的和非显而易见性的,所述核酸包括编码本发明的蛋白质、在适当严紧条件下与编码本发明的蛋白质的核酸杂交或与编码本发明的蛋白质的核酸互补的核酸。
核苷酸或氨基酸序列水平的同源性或相同性通过BLAST(BasicLocal Alignment Search Tool)分析法来测定,所述分析法利用特意为序列相似性检索而改进的程序blastp,blastn,blastx,tblastn和tblastx(Altschul等,(1997)Nucleic Acids Res25:3389-3402,和Karlin等,(1990)Proc Natl Acad SciUSA 87:2264-2268,两者被全部引入作为参考)所使用的算法。BLAST程序所采用的方法首先考虑了查询序列与数据库序列之间的具有或不具有缺口的相似片段,然后评价所有被识别的匹配物的统计学显著性并且最终仅仅加和那些满足显著性预选阈值的匹配物。为了讨论序列数据库相似性检索的基本问题,参见Altschul等,(1994)Nature Genetics 6:119-129,其内容被全部引入作参考。将直方图(histogram)、描述项(descriptions)、序列比对(alignments)、期待值(expect)(即用于反映相对于数据序列的匹配物的统计学显著性阈值)、截止(cutoff)、矩阵和过滤器(低复杂性)的检索参数设置在默认值。blastp,blastx,tblastn和tblastx所采用的默认评分矩阵是BLOSUM62矩阵(Henikoff等,(1992)Proc Natl Acad Sci USA89:10915-10919,被全部引入作为参考),被推荐用于长度超过85个核苷酸或氨基酸的查询序列。
对于blastn,所述评分矩阵被设置成M(即匹配残基的奖励评分)与N(即错配残基的罚分)的比例,其中M和N的默认值分别为5和-4。四个blastn参数按照以下方式进行调节:Q=10(缺口产生罚分);R=10(缺口延伸罚分);wink=1(查询序列的每个winkth位置产生字串命中值);和gapw=16(设定其中产生缺口比对的窗口宽度)。Blastp的相应参数设定值是Q=9;R=2;wink=1;和gapw=32。10.0版本的GCG软件包中用于序列比较的Bestfit采用了DNA参数GAP=50(缺口产生罚分)和LEN=3(缺口延伸罚分)以及蛋白质比较过程中相应的设定值是GAP-8和LEN=2。
“严紧条件”是如下:(1)采用了低离子强度和高温进行冲洗,例如在50℃下利用0.015M NaCl/0.0015M柠檬酸钠/0.1%SDS进行冲洗,或(2)在杂交过程中采用了变性剂如甲酰胺,例如在42℃下50%(vol/vol)的甲酰胺与0.1%牛血清白蛋白/0.1%Ficoll/0.1%聚乙烯吡咯烷酮/50mM pH 6.5的磷酸钠缓冲液与750mM NaCl,75mM柠檬酸钠。另一个例子是于42℃下在50%甲酰胺,5×SSC(0.75M NaCl,0.075M柠檬酸钠),50mM的磷酸钠(pH 6.8),0.1%的焦磷酸钠,5×Denhardt溶液,超声处理的鲑精DNA(50μg/ml),0.1%SDS,和10%的葡聚糖硫酸酯中进行的杂交,并在42℃用0.2×SSC和0.1%SDS进行冲洗。技术人员能够轻而易举地适当确定和改变严紧条件从而获得清晰的和可检测的杂交信号。优选的分子是那些在上述条件下与SEQ ID NO:1,3,5,7,9,11,13或17的互补链杂交并且编码具有功能的或全长蛋白质的分子。更优选的杂交分子是那些在上述条件下与SEQ ID NO:1,3,5,7,9,11,13或17的可读框的互补链杂交的分子。
如本文中使用的,当核酸分子基本上从编码其它多肽的杂质核酸分子中分离时,所述核酸分子被认为是“分离的”。
本发明还提供了被公开的核酸分子的片段。本文中使用的核酸分子片段是指编码或非-编码序列的小的部分。片段的大小由使用目的来决定。例如,如果所述片段被选择用来编码所述蛋白质的活性部分,那么该片段则需要足够大以便编码所述蛋白的功能域。例如可以制备编码对应于预测抗原区域的肽的片段。如果所述片段被用作核酸探针或PCR引物,那么则需要对所述片段的长度进行选择从而使得探测/引发过程中出现的假阳性的数目较小(参见H部分的讨论)。
本发明被用作聚合酶链反应(PCR)的探针或特定引物或用来合成编码本发明的蛋白质的基因序列的核酸分子片段(即合成的寡核苷酸)可以通过化学技术,例如Matteucci等的亚磷酰胺技术((1981)J AmChem Soc 103:3185-3191)或利用自动合成法来轻而易举地得到。另外,大的DNA片段可以通过已经通晓的方法来制备,诸如合成一组限定该基因各个模块片段的寡核苷酸,接着连接这些寡核苷酸从而构建出完整的修饰基因。
本发明的核酸分子还可以被修饰成含有用于诊断和探针目的的可测标记物。许多这种标记物在本技术领域中是已知的并且可以轻易用于本文记载的编码分子。合适的标记物包括但不限于生物素、放射性或荧光标记的核苷酸等。技术人员可以轻而易举地采用任何这种标记物来获得本发明的核酸分子的标记变异体。
C.其它相关核酸分子的分离
如上所述,具有SEQ ID NO:1,3,5,7,9,11,13或17所示序列的核酸分子的鉴定和表征允许技术人员分离除本文记载的序列以外的编码该蛋白质家族中的其它成员的核酸分子。而且,本文公开的核酸分子允许技术人员分离除具有SEQ ID NO:2,4,6,8,10,12,14或18所示序列的蛋白质以外的编码蛋白质家族的其它成员的核酸分子。
例如,技术人员可以轻易地利用SEQ ID NO:2,4,6,8,10,12,14或18的氨基酸序列来制备抗体探针以便筛选从合适的细胞中制备的表达文库。典型地,得自哺乳动物如经纯化蛋白免疫的兔子(如下所述)的多克隆抗血清或单克隆抗体可以被用来探测哺乳动物的cDNA或基因组表达文库,诸如λgt11文库,从而获得编码蛋白质家族其它成员的合适序列。被克隆的cDNA序列可以以融合蛋白的形式进行表达,直接利用其自身的调控序列进行表达或通过利用适于用于表达酶的特定宿主的调控序列经构建体来进行表达。
或者,可以合成本文记载的编码序列的一部分片段并将其用作检测DNA的探针,该DNA编码源自哺乳动物的蛋白质家族的成员。制备含约18-20个核苷酸的低聚物(编码约6-7个氨基酸的片段)并将其用来筛选基因组DNA或cDNA文库从而实现在能够消除过高水平的假阳性的严紧条件或充分严紧的条件下的杂交。
另外,可以制备用于聚合酶链式反应(PCR)的寡苷酸引物对以便选择性地克隆一种编码核酸分子。利用这种PCR引物的PCR变性/退火/延伸循环在本技术领域中是熟知的并且非常适用于分离其它编码核酸分子。
利用任何可获得的算法,包括但不限于PSI-BLAST(Altschul等,(1997)Nucleic Acids Res 25:3389-3402);PHI-BLAST(Zhang等,(1998)Nucleic Acids Res 26:3986-3990),3D-PSSM(Kelly等,(2000)J Mol Biol 299(2):499-520)和其它计算分析方法(Shi等,(1999)Biochem Biophys Res Commun 262(1):132-138和Matsunami等,(2000)Nature 404(6778):601-604),还可以在已有基因组或其它序列中鉴定出编码蛋白质家族其它成员的核酸分子。
D.含核酸分子的rDNA分子
本发明还提供了含有编码序列的重组DNA分子(rDNAs)。本文中使用的rDNA分子是一种已经进行了原位分子操纵的DNA分子,用于产生rDNA分子的方法在本技术领域中是已知的,例如参见Sambrook等,Molecular Cloning-A Laboratory Manual,第三版,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001。在优选的rDNA分子中,DNA编码序列与表达控制序列和/或载体序列进行了可操作性的连接。
正如本技术领域所熟知的,可操作性地连接于本发明的蛋白家族编码序列的载体和/或表达控制序列的选择直接依赖于所需要的功能特性,例如蛋白质的表达,和待转化的宿主细胞。本发明所预期的载体至少能够指导rDNA分子中所含的结构基因在宿主染色体中的复制和插入,而且优选地还能指导rDNA分子中所含结构基因的表达。
被用于调节可操作连接的蛋白编码序列的表达的表达控制元件在本技术领域中是已知的,并且包括但不限于诱导型启动子、组成型启动子、分泌信号和其它调节元件。优选地,所述诱导型启动子容易得到控制,诸如响应于宿主细胞培养基的营养成分。
在一个实施方案中,含有编码核酸分子的载体包括原核复制子,即一种能够指导自主复制和将重组DNA分子保持在经其转化的原核宿主细胞如细菌宿主细胞的染色体外的DNA序列。这种复制子在本技术领域中是已知的。另外,含有原核复制子的载体还可包括其表达产生一个可检测标记物如抗药性的基因。典型的细菌抗药性基因是那些对氨苄青霉素、卡那霉素、氯霉素或四环素具有抗性的基因。
含有原核复制子的载体可包含能够指导编码基因序列在细菌宿主细胞如大肠杆菌中进行表达(转录和翻译)的原核或噬菌体启动子。启动子是由允许RNA聚合酶的结合和转录进行的DNA序列形成的一种表达控制元件。适用于细菌宿主的启动子序列通常以质粒载体的形式来提供,所述质粒载体含有方便的限制性位点用于插入本发明的DNA片段。这种载体质粒的典型实例是从BioRad实验室(Richmond,CA)得到的pUC8,pUC9,pBR322和pBR329,从Pharmacia(Piscataway,NJ)得到的pPL和pKK223。
适用于真核细胞的表达载体,优选地是那些适用于脊椎动物细胞诸如胃细胞的表达载体,还可被用来制备含编码序列的rDNA分子。包括病毒载体在内的真核细胞表达载体在本技术领域中是已知的并且购自几个商业途径。通常,这种载体是以含有适于插入所需DNA片段的限制位点的形式提供。这种载体的典型实例是pSVL和pKSV-10(Pharmacia),pBPV-1/pML2d(Interna tionational Biotechnologies,Inc.),pTDT1(ATCC,#31255),本文记载的载体pCDM8以及类似真核表达载体。如果需要,载体可以被修饰以含有胃细胞特异性启动子。
被用于构建本发明rDNA分子的真核细胞表达载体还可含有在真核细胞中有效的选择性标记物,优选地是一种药物抗性选择标记物。一种优选的药物抗性标记物是其表达产生新霉素抗性的基因,即新霉素磷酸转移酶(neo)基因(Southern等,(1982)J Mol Anal Genet1:327-341)。或者,选择性标记物可以存在于分开的质粒上,而且,两个载体通过共-转染宿主细胞而被引进,并且通过在适于该选择性标记物的合适药物中进行培养来进行选择。
E.含外源编码核酸分子的宿主细胞
本发明还提供了被编码本发明蛋白质的核酸分子转化的宿主细胞。所述宿主细胞既可以是原核细胞也可以是真核细胞。用于表达本发明蛋白质的真核细胞不受什么限制,只要所述细胞系适于细胞培养方法并适于表达载体的增殖和基因产物的表达就行。优选的真核宿主细胞包括但不限于酵母、昆虫和哺乳动物细胞,优选脊椎动物细胞,如那些源自小鼠、大鼠、猴子或人细胞系的细胞。优选的真核宿主细胞包括得自ATCC的中国仓鼠卵巢(CHO)细胞CCL61,得自ATCC的NIH瑞士小鼠胚胎细胞(NIH/3T3)CRL 1658,幼小仓鼠肾细胞(BHK)和类似真核组织培养细胞系。
任何原核宿主可以被用来表达编码本发明蛋白质的rDNA分子。优选的原核宿主是大肠杆菌。
利用本发明的rDNA分子对适当宿主细胞进行的转化可以通过取决于所用载体和宿主系统类型的已知方法来实现。针对原核宿主细胞的转化,通常采用电穿孔和盐处理方法(参见,例如Cohen等,(1972)Proc Natl Acad Sci USA 69:2110;和Sambrook等,上文)。针对利用含rDNA分子的载体对脊椎动物细胞进行的转化,通常采用电穿孔、阳离子脂质或盐处理方法,参见例如Graham等,(1973)Virol 52:456;Wigler等,(1979)Proc Natl Acad Sci USA 76;1373-1376。
被成功转化的细胞,即含本发明rDNA分子的细胞,可以通过包括筛选选择性标记物的方法在内的已知技术进行鉴定。例如,可以克隆出引入本发明的rDNA的细胞以便制备单个菌落。得自这些菌落的细胞被收集和溶胞后,利用诸如由Southern,(1975)J Mol Bio l98:503或Berent等,(1985)Biotech 3:208记载的方法进行DNA含量检测以便确定rDNA的存在,或通过免疫学方法测定产自所述细胞的蛋白质。
F.利用rDNA分子生产重组蛋白质
本发明还提供了利用本文记载的核酸分子生产本发明蛋白质的方法。总之,重组形式的蛋白质的生产通常包括下列步骤:
首先,得到编码本发明蛋白质的核酸分子,诸如下列、基本由下列组成或由下列组成的核酸分子:SEQ ID NO:1,SEQ ID NO:3,SEQID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:17,SEQ ID NO:1的131-862位或131-859位核苷酸,SEQ ID NO:3的174-587位或174-584位核苷酸,SEQ ID NO:5的38-892位或38-895位核苷酸,SEQ ID NO:7的53-892位或53-895位核苷酸,SEQ ID NO:9的65-892位或65-895位核苷酸,或SEQ IDNO:11的92-892位或92-895位核苷酸,或SEQ ID NO:13的49-1437位或49-1434位核苷酸,或SEQ ID NO:17的75-575位或75-572位核苷酸。如果编码序列不被内含子所打断,如这些可读框,那么所述编码序列直接适用于在任何宿主中进行表达。
其次,如上所述,所述核酸分子优选地与合适的控制序列可操作性地连接从而形成一种含有蛋白可读框的表达单位。该表达单位被用于转化合适的宿主以及在能使重组蛋白产生的条件下培养该转化宿主。所述重组蛋白质可选择性地分离自培养基或细胞;在可以容忍某些杂质的情况下,所述蛋白的回收和纯化不是必需的。
上述每一个步骤能以各种方式进行。例如,所需的编码序列可以从基因组片段中获得并被直接用于合适的宿主中。如上所述,可以在各种宿主中操作的表达载体的构建是通过利用合适的复制子和控制序列完成的。控制序列、表达载体和转化方法取决于被用于表达基因的宿主细胞的类型并且已在以前进行过详细讨论。如果不能正常得到,可以将合适的限制位点加到编码序列的末端从而提供一种可剪切基因以便插入到这些载体中。一个技术人员可以轻而易举地对本技术领域中已知的宿主/表达系统进行改造以便适用于本发明的核酸分子来产生重组蛋白。
G.鉴定结合配偶体的方法
本发明的另一个技术方案提供了用于分离和鉴定本发明的结合配偶体的方法。总之,在能使潜在的结合配偶体与本发明的蛋白质结合的条件下将本发明的蛋白质与所述的潜在配偶体或细胞的提取物或级分相混合。混合后,从所述混合物中分离出结合了本发明蛋白质的肽、多肽、蛋白质或其它分子。然后除去与本发明蛋白质结合的结合配偶体并进一步进行分析。为了鉴定和分离结合配偶体,可以利用完整蛋白,例如含有SEQ ID NO:2,4,6,8,10,12,14或18的全长氨基酸序列的蛋白。或者,可以利用所述蛋白的片段。
本文中使用的细胞提取物是指由溶胞的或裂解的细胞制得的制品或级分。优选的细胞提取物的来源是得自人胃肿瘤或被转化的胃细胞的细胞,例如来源于胃癌的活检组织或组织培养细胞。或者,可以由正常组织或可得到的细胞系,尤其是得自胃的细胞系,来制备细胞提取物。
可以使用多种方法来获得细胞提取物。利用物理或化学裂解方法可以将细胞裂解。物理裂解方法的实例包括但不限于超声处理和机械剪切,化学溶胞方法的实例包括但不限于去污剂溶胞和酶溶胞。一名技术人员可以轻而易举地对制备细胞提取物的方法进行改变以便获得用于本发明的提取物。
一旦制备出细胞提取物,就在能使本发明的蛋白与结合配偶体进行结合的条件下将该提取物与本发明的蛋白质相混合。可以采用多种条件,最优选的是与人类细胞的胞质中的条件极其相似的条件。可以改变诸如摩尔渗透压浓度、pH、温度和所用细胞提取物的浓度的特性以便使所述蛋白质与结合配偶体的结合达到最佳状态。
在适当条件下混合后,从所述混合物中分离出结合的复合体。可以利用多种技术来对所述混合物进行分离。例如,特异于本发明蛋白质的抗体可以被用来免疫沉淀所述结合配偶体复合物。或者,可以采用标准化学分离技术如色谱法和密度/沉淀离心。
当除去所述提取物中的未结合细胞成分后,利用常规的方法就可以使结合配偶体从复合体中解离。例如,通过改变所述混合物的盐浓度或pH可以实现解离的目的。
为了有助于从所述混合提取物中分离出结合的结合配偶体对子,可以将本发明的蛋白质固定在固相载体上。例如,可以将蛋白质连接在硝化纤维素基质或丙烯酸珠子上。所述蛋白与固相载体的连接有助于从所述提取物中的其它组分中分离出肽/结合配偶体对子。被鉴定出来的结合配偶体可以是单一蛋白或由两种或多种蛋白组成的复合体。或者,可以利用在Takayama等,(1997)Methods Mol Biol 69:171-184或Sauder等,(1996)J Gen Virol 77:991-996中记载的方法用Far-Western测定法来鉴定结合配偶体,或者通过利用表位标记的蛋白或GST融合蛋白来鉴定结合配偶体。
或者,本发明的核酸分子可被用于酵母双杂交系统中或其它体内蛋白-蛋白检测系统。酵母双杂交系统已被用来鉴定其它蛋白质配偶体对子,并可以被适当地改变从而适用于本文所记载的核酸分子。
H.  鉴定调控编码胃癌相关基因的核酸的表达的介质的方法
本发明的另一个实施例提供了用于鉴定调控编码本发明蛋白的核酸的表达的介质的方法,所述本发明蛋白诸如是具有SEQ ID NO:2,4,6,8,10,12或18所示氨基酸序列的蛋白或Mst1蛋白或本发明的剪接变体,如具有SEQ ID NO:14所示氨基酸序列的蛋白。调控编码Mst1蛋白或剪接变体的核酸的表达的介质在治疗胃癌中具有特定的用途。这种测定法可以利用任何有效检测手段来检测本发明核酸的表达水平。只要本文中的介质能够上调或下调所述核酸在细胞中的表达,那么就认为其能调控本发明核酸的表达。
在一种测定形式中,可制备出在下列核苷酸和任何可检测的融合配偶体之间的报道基因融合体:由SEQ ID NO:1的131-862位核苷酸、SEQ ID NO:3的174-587位核苷酸、SEQ ID NO:5的38-895位核苷酸、SEQ ID NO:7的53-895位核苷酸、SEQ ID NO:9的65-895位核苷酸、SEQ ID NO:11的92-895位核苷酸、SEQ ID NO:13的49-1437位或49-1434位核苷酸、SEQ ID NO:17的75-575位核苷酸所定义的可读框和/或5’和/或3’调节元件。包括萤火虫荧光素酶基因和编码氯霉素乙酰转移酶在内的大量可测定融合配偶体是已知的并且容易得到(Alam等,(1990)Anal Biochem 188:245-254)。然后在适当条件和时间下使含报道基因融合体的细胞系与待测的介质进行接触。接触所述介质的样品与对照样品之间的报道基因的差异表达能够鉴定调控本发明核酸表达的介质。
可以采用其它测定形式来监测介质调控核酸表达的能力,所述核酸编码本发明蛋白质,诸如具有SEQ ID NO:2,4,6,8,10,12,14或18所示序列的蛋白质。例如,mRNA表达可以直接通过与本发明的核酸进行杂交来监测。在适当条件和时间下细胞系与待测介质进行接触并且总RNA或mRNA通过常规方法如那些被公开于Sambrook等,Molecular Cloning-A Laboratory Manual,Third Ed.,Cold SpringHarbor Laboratory Press,Cold Spring Harbor,NY,2001中的方法而得到分离。
优选的细胞是那些得自人胃组织,例如,胃活检组织的细胞或源自胃癌患者的培养细胞。可以使用细胞系如目录号为NCI-SNU-16,CRL-1863,HTB-103,CRL-1739和CRL-1864的ATCC胃癌细胞系。或者,可以使用其它可得到的细胞或细胞系。
用于检测接触了所述介质的细胞与对照细胞之间的RNA表达水平差异的探针可以由本发明的核酸来制备。更好地是,但不是必需的,设计仅与靶核酸在高严紧条件下进行杂交的探针。在高严紧条件下仅仅形成高度互补的核酸杂交体。因此,测定条件的严紧性决定两条核酸链之间为了形成杂交体应该存在的互补量。应当对严紧性进行选择从而使探针:靶标杂交体与探针:非靶标杂交体之间的稳定性差异最大化。
可以通过本领域中的已知方法由本发明的核酸设计探针。例如,探针的G+C含量和探针的长度能够影响探针与其靶序列的结合。使探针特异性最佳化的方法通常被记载在Sambrook等,上文,或Ausubel等,Short Protocols in Molecular Biology,第四版,John Wiley& Sons,Inc.,New York,1999中。
根据每一探针的需要,杂交条件利用已知方法来改变,所述已知方法诸如是由Sambrook等和Ausubel等记载的方法。总细胞RNA或富集了聚腺苷酸RNA的RNA的杂交能以任何可用形式得到实现。例如,在探针进行特异性杂交的条件下,总细胞RNA或富集了聚腺苷酸RNA的RNA可以被附着于固相载体,固相载体暴露于至少一种含有本发明的至少一种序列或本发明的一种序列的部分序列的探针。或者,含本发明的至少一种序列或本发明的一种序列的部分序列的核酸片段可以被附着于固相载体上,所述固相载体例如是硅片、多孔玻璃胶片或膜。然后在被附着的序列进行特异性杂交的条件下使所述固相载体与得自样品的总细胞RNA或聚腺苷酸RNA接触。这种固相载体和杂交方法是广泛可用的,例如由Beattie,(1995)WO 95/11755公开的方法。通过检测给定探针与源自未处理细胞群和与所述介质接触的细胞群的RNA样品进行特异性杂交的能力,可以鉴定出上调或下调核酸表达的介质,该核酸编码具有SEQ ID NO:2,4,6,8,10,12,14或18所示序列的蛋白质。
通过利用RNase Protection Assay(即RPA,参见Ma等,(1996)Methods 10:273-238)也可以实施适用于对mRNA进行定性和定量分析的杂交。简要地说,含编码基因产物的cDNA和噬菌体特定DNA依赖性RNA聚合酶启动子(例如T7,T3或SP6 RNA聚合酶)的表达载体在cDNA分子的3’端,噬菌体启动子的下游,被线性化,其中这种线性化分子被随后用作合成cDNA的被标记的反义转录物的模板,所述反义转录物是通过体外转录得到的。然后通过在含80%甲酰胺、40mM Pipes,0.4M NaCl和1mM EDTA的pH为6.4的缓冲液中进行45℃的过夜孵育来使被标记的转录物与被分离的RNA混合物(即总mRNA或分级的mRNA)进行杂交。然后在含40μg/ml核糖核酸酶A和2μg/ml核糖核酸酶的缓冲液中对所得到的杂交体进行消化。在使外来蛋白质失活并提取外来蛋白质后,将样品加载到分析用的尿素/聚丙烯酰胺凝胶上。
在另一个分析方法中,为了鉴定影响本发明基因产物表达的介质,首先鉴定生理表达本发明基因产物的细胞或细胞系。如此鉴定的细胞和/或细胞系可望含有必需的细胞结构以便当介质进行体外接触时转录结构的调控保真度被维持,所述介质具有适当的表面转导机制和/或胞质级联传导。而且,这种细胞或细胞系被表达载体(例如质粒或病毒载体)构建物转导或转染,所述表达载体构建物含有融合于一个或多个抗原性片段上的编码本发明基因产物的结构基因的可操作的非翻译5′末端(该末端含有启动子),所述抗原性片段对于本发明基因产物来说是独特的,其中所述片段处于所述启动子的转录控制下并以其分子量不同于天然多肽的多肽形式进行表达或进一步含有免疫上不同的标签或其它可检测标记物。这种方法在本技术领域中是已知的(参见Sambrook等,见上文)。
然后在适当的条件下使上述被转导或转染的细胞或细胞系与介质接触。例如,药学可接受赋形剂中的介质与含水生理缓冲液如生理pH的磷酸盐缓冲液(PBS)、生理pH的Eagles平衡盐溶液(BSS)、含血清的PBS或BSS或者37℃下温育的含PBS或BSS和/或血清的条件培养基中的细胞接触。所述条件可以由本技术领域中的技术人员根据需要进行调节。细胞与所述介质接触后,将所述细胞进行裂解并且对溶胞产物的多肽进行分部分离,从而将多肽级分合并起来并且与抗体接触以通过免疫学测定方法进一步加工(例如,ELISA,免疫沉淀或蛋白质印迹)。将从“介质-接触的”样品中分离的蛋白的合并物与其中只有赋形剂与细胞接触的对照样品进行比较,并且由“介质-接触的”样品所产生的免疫学信号相对于对照物的增强或减弱来识别所述介质的有效性。
I.调控胃癌相关蛋白的水平或至少一种活性的介质的识别方法
本发明的另一个实施方案提供了用于鉴定调控本发明蛋白或本发明的Mst1蛋白或剪接变体的水平或至少一种活性的介质的方法,所述本发明蛋白例如是具有SEQ ID NO:2,4,6,8,10,12或18的氨基酸序列的蛋白,所述本发明的Mst1蛋白或剪接变体例如是具有SEQID NO:14的氨基酸序列的蛋白。这种方法或测定方法可以利用任何监控或检测所需活性的手段。
在一种情况下,可以检测与待测介质接触过的细胞群相对于未接触的对照细胞群的本发明蛋白的相对含量。在这种情况下,探针诸如特定抗体被用来监控所述蛋白在不同细胞群中的差异表达。在适当条件下和时间内使细胞系或细胞群与所述介质接触。可以从接触过的细胞系或细胞群和未接触过的对照细胞系或细胞群中制备细胞溶胞产物。然后利用探针对该细胞溶胞产物进行分析。
如果本发明的肽、多肽或蛋白质足够长,或如果需要,或如果需要加强免疫原性,则将所述肽、多肽或蛋白质结合到适当的载体上,就在适当的免疫方案中通过利用本发明的所述肽、多肽或蛋白质免疫合适的哺乳动物宿主来制备抗体探针。用于制备结合在载体如BSA,KLH或其它载体蛋白上的免疫原性缀合物的方法在本技术领域中是已知的。在某些情况下,利用例如碳二亚胺试剂直接进行缀合可能是有效的;在其它情况下,可能需要连接试剂如那些由Pierce ChemicalCo.(Rockford,IL)提供的连接试剂来提供对半抗原的可接近性。例如为了便于与载体进行连接,所述半抗原肽可以用半胱氨酸残基在氨基或羧基端进行延伸,或用半胱氨酸残基进行点缀。如本技术领域中所知晓的,通常通过适当长时间的注射和利用合适的佐剂来施用免疫原。在免疫程序中,测定抗体滴度以确定足够抗体的形成。
尽管以这种方式产生的多克隆抗血清可以满足某些用途,但对于药物组合物,单克隆制备物的利用是优选的。众所周知,可以利用Kohler和Milstein((1975)Nature 256:495-497)的标准方法或引起淋巴细胞或脾细胞的无限增殖的改进方法来制备分泌所需单克隆抗体的永生化细胞系。分泌所需抗体的无限增殖细胞系通过其中抗原是肽半抗原、多肽或蛋白质的免疫分析法来筛选。当鉴定了分泌所需抗体的适当的无限增殖细胞培养物后,可以体外培养所述细胞或通过利用腹水来制备所述细胞。
然后从培养上清中或从腹水上清中回收所需单克隆抗体。含有免疫学显性(抗原-结合)部分的单克隆抗体片段或多克隆抗血清以及完整抗体可被用作拮抗剂。利用免疫反应(抗原-结合)性抗体片段,诸如Fab,Fab’或F(ab’)2片段通常是优选的,尤其是在治疗方面,因为这些片段的免疫原性通常比完整免疫球蛋白的免疫源性小。
抗体或抗原-结合型片段还可以利用现有技术,通过重组手段来生产。与所述蛋白的所需区域特异结合的抗体区域可以产生于多个物种来源的嵌合体中,诸如人源化抗体中。
可以对以上述方法测定的介质进行随机选择或理性选择或设计。本文中的介质是随机选择的,这里指这样的介质是随机选择的而没有考虑参与与本发明蛋白单独结合或联合相关的底物、结合配偶体等与本发明蛋白结合的特定序列。随机选择的介质的实例是利用化学文库或肽组合文库或微生物培养肉汤。
当在考虑了靶位点的序列和/或与所述介质的作用有关的构象的非随机基础上选择本文使用的介质时,所述介质被认为是理性选择或设计的。可以利用组成这些位点的肽序列对介质进行理性的选择或设计。例如,理性选择的肽介质可以是其氨基酸序列与任何功能性共有序列位点相同的肽或其氨基酸序列是任何功能性共有序列位点的衍生物的肽。
本发明的介质可以是,例如肽、小分子、维生素衍生物以及碳水化合物。可以将显性失活蛋白,编码这些蛋白的DNA、针对这些蛋白的抗体、这些蛋白的肽片段或这些蛋白的模拟物引进细胞来实现功能。本文使用的“模拟物”是指对肽分子的一个区域或几个区域进行修饰从而使其化学结构有别于母本肽而拓扑学和功能却类似于母本肽(参见Grant:Molecular Biology and Biotechno logy,Meyers编辑,659-664页,VCH Publishers,Inc.,纽约,1995)。技术人员可以轻而易举地得知本发明介质的结构特性不受限定。
本发明的肽介质可以利用在本技术领域中已知的标准固相(或液相)肽合成法来制备。另外,编码这些肽的DNA可以利用商购寡核苷酸合成仪来合成并且利用常规重组生产体系来进行重组制备。如果包含非基因编码氨基酸,那么利用固相肽合成法的生产则成为必需。
本发明的另一种介质是与本发明蛋白的关键位点发生免疫反应的抗体。抗体介质通过用肽对合适哺乳动物主体进行免疫而获得,所述肽含有要作为所述抗体的靶标的那些蛋白部分作为免疫原性区域。
J.调控胃癌相关蛋白的表达或至少一种活性的介质的用途
如实施例所提供的,本发明的蛋白和核酸,诸如具有SEQ ID NO:2,4,6,8,10,12或18所示氨基酸序列的蛋白,和本发明的Mst1或Mst1剪接变体蛋白和核酸,诸如具有SEQ ID NO:14所示氨基酸序列的蛋白,在胃癌组织进行差异性表达。上调或下调或调控蛋白质表达或蛋白质至少一种活性的介质,诸如激动剂或拮抗剂,可以被用来调控与蛋白质功能和活性有关的生物和病理的过程。
例如,两种类型的药物已经被证明通过Mst1(例如,GenBank序号为NM_006282,核酸序列和蛋白序列分别如SEQ ID NO:15和16所示),一种与SEQ ID NOS:13和14相关的基因,起作用。首先,已经证明二膦酸盐,即被用来治疗骨质疏松和其它骨病的药物,直接作用于破骨细胞从而在编程性细胞死亡的过程中诱导Mst1的caspase裂解。其次,cytotrienin A是一种被用来治疗白血病、乳腺癌和肺癌的抗肿瘤药物(美国专利US 6,251,885)。Cytotrienin A已经被证明在cytotrienin A-诱导的编程性细胞死亡过程中能够激活Mst1(Watabe等,(2000)J Biol Chem 275:8766-8771)。
在本文中,主体可以是任何哺乳动物,只要所述哺乳动物需要调控由本发明的蛋白介导的病理学或生物学过程就行。术语“哺乳动物”被定义为是一种属于哺乳动物纲的个体。本发明被特别用于人体的治疗。
病理学过程是指一类产生有害作用的生物过程。例如,本发明的蛋白表达可能与胃细胞的生长或增生有关。在本文中,介质被认为能够调控病理学过程,就是指所述介质降低了所述过程的程度或严重性。例如,可以通过施用以某种方式上调或下调或调控本发明蛋白的表达或至少一种活性的介质来预防胃癌或调控疾病进展。
本发明的介质能以单独的形式进行提供,或者以与其它调控特定病理学过程的介质组合的形式来提供。例如,本发明的介质可以与其它已知药物联合进行施用。在本文中,当两种介质同时施用或以所述介质同时发挥作用的方式分别独立地施用时,所述两种介质就被认为是进行联合施用的。
本发明的介质可以通过非肠道、皮下、静脉内、肌内、腹膜内、透皮或口腔途径进行用药。替代性地,或同时地,可以通过口服进行用药。用药剂量将取决于受试者的年龄、健康和重量,共同治疗的类型(如果有的话),还取决于治疗的频率和所需作用的特性。
本发明进一步提供了含有一种或多种调控本发明蛋白的表达或至少一种活性的介质的组合物。尽管个体需要会变化,确定每个组分的有效量的优化范围是本技术领域中的技术人员所能控制的。典型的剂量含有0.1至100μg/kg体重。优选的剂量含有0.1至10μg/kg体重。最优选的剂量含有0.1至1μg/kg体重。
除了药理学活性介质外,本发明的组合物可以含有适当的药学可接受载体以递送至作用位点,该载体含有有利于将所述活性化合物加工成可被药学利用的制剂的赋形剂和辅剂。适用于非肠道用药的制剂包括水溶形式的活性化合物的水溶液,例如水溶性盐。另外,可以施用活性化合物的悬液例如合适的含油注射悬液。合适的亲脂性溶剂或载体包括脂肪油,例如芝麻油,或合成脂肪酸酯,例如乙基油酸酯或甘油三酯。注射用水悬液可以含有增加悬液粘度的物质,这种物质包括,例如,羧甲基纤维素钠、山梨醇和/或葡聚糖。任选地,所述悬液还可以含有稳定剂。脂质体也能被用来将所述介质包囊化以便输入到细胞内。
本发明的全身用药的药物制剂可以被配制成适于肠内、非肠道或局部用药。实际上,所有三种类型的制剂都可以被用来实现活性成分的全身用药。
合适的口服制剂包括硬明胶胶囊剂或软明胶胶囊剂、丸剂、片剂包括有包衣的片剂、酏剂、悬液、糖浆或吸入剂及其控释剂型。
为了实施本发明的方法,本发明的化合物可以进行单独使用,或以与其它治疗剂或诊断试剂联合的形式使用。在某些优选的实施例中,根据通常接受的医学实践,本发明的化合物可以与其它化合物一起共同施用,所述化合物被通常指定用于这些病症。本发明的化合物可以进行体内用药或体外用药,通常在哺乳动物体内用药,所述哺乳动物诸如是人、绵羊、马、牛、猪、狗、猫、大鼠和小鼠。
K.转基因动物
本发明也包括含有突变、敲除或修饰基因的转基因动物,所述基因对应于SEQ ID NO:1,3,5,7,9,11,13或17所示的cDNA序列或编码SEQ ID NO:2,4,6,8,10,12,14或18所示多肽序列或其具有至少约3,4,5,6,10,15,20,25,30,35或更多个氨基酸残基的连续序列的片段的可读框。转基因动物是其体内已通过实验转入了重组的、外源的或克隆的遗传物质的被遗传修饰的动物。这种遗传物质通常被称作“转基因”。在本案中,可以将SEQ ID NO:1,3,5,7,9,11,13或17形式的转基因核酸序列整合到其中该特定核酸通常不存在的基因组的基因座上或整合到该转基因的正常基因座上。所述转基因可由得自相同物种或不同于靶动物物种的其它物种的基因组的核酸序列组成。
在某些实施方案中,可以构建其中缺失了含SEQ ID NO:1,3,5,7,9,11,13或17所示基因的全部或部分片段的转基因动物。当对应于SEQ ID NO:1,3,5,7,9,11,13或17的基因含有一个或多个内含子时,可以删除全长基因,即所有外显子、内含子和调控序列。或者,可以删除全长基因的一部分序列。例如,可以删除单个外显子和/或内含子,以便创建一种表达经修饰的本发明蛋白的动物。
术语“生殖细胞系转基因动物”是指其中生殖细胞进行了遗传改构或引入了遗传信息从而赋予了转基因动物将遗传信息传给后代的能力的转基因动物。如果这种后代事实上拥有了一部分或全部的遗传改构或遗传信息,那么它们也是转基因动物。
所述改构或遗传信息相对受体所属动物品种来说可以是外源的,仅相对该特定个体受体是外源的或者可以是已经被受体拥有的遗传信息。在最后一种情况下,被改构或引进的基因与天然基因的表达可能有差异。
转基因动物可以通过多种不同的方法来生产,所述方法包括转染、电穿孔、显微注射、基因在胚胎干细胞中的定位以及重组病毒和逆转录病毒传染(参见例如US专利号4736866;US专利号5602307;Mullins等,(1993)Hypertension 22:630-633;Brenin等,(1997)Surg Oncol 6:99-110;Recombinant Gene Expression Protocols(Methods in Molecular Biology,Vol.62),Tuan编辑,Humana出版社,Totowa,NJ,1997)。
已经制备出许多重组或转基因小鼠,包括那些表达活化的致癌基因序列(US专利号4,736,866);表达猿SV40 T-抗原(US专利号5,728,915);不进行干扰素调控因子1(IRF-1)表达(US专利号5,731,490);表现出多巴胺能机能障碍(US专利号5,723,719);表达至少一种参与血压调控的人类基因(US专利号5,731,489);表现出与自然发生的阿尔茨海墨氏病中存在的症状更相似的症状(US专利号5,720,936);介导细胞粘附的能力降低(US专利号5,602,307);具有牛生长激素基因(Clutter等,(1996)Genetics 143:1753-1760);或能够产生完全人体抗体应答(McCarthy(1997)Lancet 349:405)的重组或转基因小鼠。
尽管小鼠和大鼠仍然是大多数转基因实验所选择的动物,但是,在某些情况下,优选地或必要地是利用其它动物品种。转基因方法已被成功用于多种非-鼠科动物,这些动物包括绵羊、山羊、猪、狗、猫、猴子、黑猩猩、仓鼠、兔子、牛和豚鼠(参见例如Kim等,(1997)MolReprod Dev 46:515-526;Houdebine,(1995)Reprod Nutr Dev35:609-617;Petters(1994)Reprod Fertil Dev 6:643-645;Schnieke等,(1997)Science 278:2130-2133;和Amoah,(1997)JAnimal Science 75:578-585)。
将核酸片段引入能够重组的哺乳动物细胞的方法可以是任何利于进行多个核酸分子的共转化的方法。用于生产转基因动物的详细过程对于本技术领域的技术人员来说很容易获得,包括US专利号5,489,743和US专利号5,602,307所公开的内容。
L.诊断方法
本发明的基因和蛋白在胃癌细胞和其它恶性肿瘤细胞中的表达不同于在同类型的非癌性组织中的表达,因此本发明的基因和蛋白可以被用来诊断或监控这种癌或跟踪疾病的进程。一种利用本发明的核酸分子或蛋白诊断包括胃癌在内的癌症的手段涉及从活体如活检组织样本中获得组织。
分子生物学工具的利用已经成为常规的法医技术。例如,含有SEQID NO:1,3,5,7,9,11,13或17所示序列的全长序列或至少部分序列的核酸探针可以被用来测定法医/病理样本中的核酸分子的表达。而且,核酸分析可以通过任何转录图谱分析手段来进行。除了核酸分析,本发明的法医方法可以指向本发明的蛋白,尤其是一种含SEQID NO:2,4,6,8,10,12,14,16,18或20的蛋白,来确定基因的上调或下调(Shiverick等,(1975)Biochim Biophys Acta393:124-133)。
本发明的方法可以包括利用胶原酶或其它蛋白酶进行的组织处理来使组织易于细胞溶解(Semenov等,(1987)Biull Eksp Biol Med104:113-116)。而且,有可能从分析用的胃的不同区域获得活检组织样品。
检测本发明核酸或蛋白分子的试验可以是任何可利用的形式。用于核酸分子的常规测定方法包括杂交或基于PCR的方法。用于检测本发明的蛋白、多肽或肽的常规试验包括任何可利用形式的抗体探针的使用,如原位结合试验等(参见Harlow & Lane,Antibodies-ALaboratory Manual,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,NY,1988)。在一个优选的实施方案中,试验利用适当的对照来进行。
上述方法还可以被用于其它诊断方案,包括检测其它组织或器官的疾病状况的方案和方法,例如其中检测到表达本发明的核酸分子的组织。
无需再描述,确信本技术领域的普通技术人员能够利用前面的描述和下面的说明性实施例制备和利用本发明的化合物并实施所要求的方法。因此下面的实施例具体指出了本发明的优选实施方案。并且无论如何不应被解释为是对所公开的其余部分的限定。
实施例
实施例  1a
对晚期胃癌中差异表达的mRNA进行的鉴定
材料和方法
将患者组织样品从5名年龄在47-68岁的朝鲜患者(包括四名男性和一名女性)体内取出,所述朝鲜患者被诊断患有晚期胃癌。对于每名患者来说,从胃的两个区域中取得组织来制备一套活检组织样品,所述两个区域是胃肿瘤和非癌性区域。对每个组织样品进行组织学分析,并将样品分类成非癌类或癌类。
按照Affymetrix GeneChip Expression Analysis Manual(稍加改动)制备样品。首先利用Spex Certiprep 6800 Freezer Mil将冷冻组织研磨成粉末。然后利用Trizol(Life Technologies)提取总RNA。每个样品的总RNA产率(组织平均重量为300mg)是200-500μg。接着,利用Oligotex mRNA Midi试剂盒(Qiagen)分离mRNA。由于mRNA洗脱于终体积400μl中,因此需要通过乙醇沉淀步骤将浓度变到1μg/μl。利用1-5μg的mRNA,通过SuperScript Choice系统(Gibco-BRL)制备双链cDNA。采用T7-(dT24)寡核苷酸引发第一链cDNA链的合成。然后对cDNA进行酚-氯仿提取,并且进行乙醇沉淀直到终浓度为1μg/μl。
从2μg的cDNA,按照常规方法合成cRNA。为了对cRNA进行生物素标记,将核苷酸Bio-11-CTP和Bio-16-UTP(Enzo Diagnostics)加到反应物中。在37℃下温育6小时后,按照RNeasy Mini试剂盒方案(Qiagen)清理被标记的cRNA。然后在94℃下对cRNA进行35分钟的片段化(5×片段化缓冲液:200mM Tris-醋酸盐(pH 8.1),500mMKOAc,150mM MgOAc)。
在45℃的杂交箱中以60rpm将55μg片段化的cRNA杂交到Affymetrix Human Genome装置U95和U133的阵列上,杂交进行24小时。冲洗芯片并在Affymetrix流体平台中用StreptavidinPhycoerythrin(SAPE)(Molecular Probes)对所述芯片进行染色。为了增强染色,两次加入SAPE溶液,在两次之间有一个抗-链霉亲和素生物素化抗体(Vector Laboratories)染色步骤。利用荧光测定扫描技术(Hewlett Packard Gene Array Scanner)检测探针阵列上的杂交。杂交和扫描后,对微阵列图像进行分析以进行质量控制,寻找出芯片的主要缺陷或杂交信号中的异常。当所有芯片通过QC后,利用Affymetrix Microarray Suite(v4.0)和LIMS(v1.5)分析U95的数据,或用Affymetrix Microarray Suite(v5.0)和LIMS(v3.0)分析U133的数据。
按照以下统计学方法,通过利用Affymetrix human GeneChip装置U95和U133来测定癌性或非癌性肝组织样品之间的基因差异性表达。(1)对于每种基因,Affymetrix GeneChip的U95平均差值通过利用Affymetrix Microarray Suite(v4.0)来测定,其中AffymetrixMicroarray Suite(v4.0)还针对每个GeneChip单元设定“Absent”(=未检测到),“Present”(=检测到的)或“Marginal”(=不能清楚地确定Absent或Present)这三个指征。U133的信号值通过AffymetrixMicroarray Suite(v5.0)来测定,Affymetrix Microarray Suite(v5.0)也设定了Absent、Present或Marginal这三个指征。(2)以癌性和非癌性肝组织样品中的至少10%Present指征以及癌性或非癌性肝组织样品组中的至少40%Present指征为标准,选择一组基因用于进一步分析。(3)基于U95数据的平均差值,将该组基因分成两组,一个高表达组和一个低表达组。高表达组含有在癌性和非癌性样品中平均差值大于或等于5的基因。其余的基因被包含在低表达组中。对于高表达组来说,平均差值被转化成对数值,而对于低表达组来说没有转化。对于U133数据,所有信号值都被转化为对数值,而不考虑表达水平。(4)Analysis of Variance(ANOVA)方法被用于数据分析(Steel等,Principles and Procedures of Statistics:A Biome tricalApproach,Third Ed.,McGraw-Hill,1997)。在进行最终分析前,排除法(leave-one-out)被用于外部(outlier)检测。ANOVA分析中每次排除一个样品来确定是否从分析中省略一个特定样品对最终结果具有显著影响。如果有影响,就从最终分析中排除那个特定样品。外部检测后,差异表达的p值小于或等于0.05的一列基因通过ANOVA来产生。来源于Affymetrix GeneChip U133芯片的数据也利用相似方法来分析。(5)另外两个标准被用来减少基因列表中的得自U95的基因数目。首先,比较非癌性对照组样品与癌症组样品之间的几何平均值从而获得一组表达水平提高或降低至少2倍的基因。其次,变化倍数值与p值的比例应该为400或更高。
结果与分析
a)LBFL301基因家族:
芯片数据的分析结果表明胃癌样品与得自正常胃组织的样品相比,标记物LBFL301的表达明显上调了(13.75-倍;p=0.0172)。这些数据表明LBFL301的上调可以被用于胃癌的诊断。
LBFL301(SEQ ID NO:1或3)的表达水平可以分别采用AffymetrixGeneChipsU95和U133,通过利用序号为48774_at和225681_at的芯片序列片段来测定。不同恶性肿瘤中的48774_at和225681_at相对于正常对照组织的表达水平见表1a,其中还显示了变化倍数和变化的趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。
表1a
 Affy ID 组织 疾病 形态学 变化倍数 趋势 T-Stat
 48774_at 骨头,NOS 恶性骨癌,NOS 骨巨细胞瘤,NOS 5.7 上调 3.5
 225681_at 乳房,NOS 女性恶性乳腺癌,NOS 浸润管癌 3.4 上调 12.1
 225681_at 浸润管和小叶癌 3.3 上调 3.3
 225681_at 浸润小叶癌 2.8 上调 5.3
 225681_at 子  宫颈,NOS 恶性子宫颈癌 鳞状细胞癌,NOS 3.6 上调 3.4
 225681_at 结肠,NOS 恶性结肠癌,NOS 粘液性腺癌 12.7 上调 2.5
 225681_at 腺癌,NOS 6.9 上调 7.9
 225681_at 子宫内膜,NOS 恶性子宫内膜癌 米勒混合瘤 11.0 上调 5.5
腺癌,NOS 2.2 上调 3.7
 225681_at 食管,NOS 恶性食管癌,NOS 腺癌,NOS 7.2 上调 3.6
 225681_at 肾,NOS 恶性肾癌,NOS 透明细胞腺癌,NOS 9.8 上调 5.4
 225681_at 维耳姆斯氏瘤 7.2 上调 3.4
 225681_at 喉,NOS 恶性喉癌,NOS 鳞状细胞瘤,NOS 6.6 上调 4.3
 225681_at 肝脏,NOS 继发性恶性肝癌,NOS 腺癌,NOS 12.4 上调 3.5
 225681_at 肺,NOS 恶性肺癌,NOS 鳞状细胞癌,NOS 5.4 上调 5.4
 225681_at 腺癌,NOS 4.4 上调 5.1
 225681_at 淋  巴结,NOS 继发性恶性淋巴结癌,NOS 鳞状细胞癌 4.1 上调 2.7
 225681_at 恶性淋巴和组织细胞组织癌,NOS 恶性淋巴瘤,NOS -4.3 下调 -3.2
 225681_at 网膜,NOS 恶性网膜癌 乳头状浆液腺癌 7.2 上调 4.1
 225681_at 继发性恶性网膜癌 乳头状浆液腺癌 4.8 上调 4.3
 225681_at 米勒混合瘤 4.7 上调 11.0
 225681_at 恶性卵巢癌 腺癌,NOS 13.8 上调 2.6
  225681_at   巢,NOS   浆液囊细胞腺癌,NOS   10.7   上调   2.8
  225681_at   卵巢不明性质的癌   卵巢甲状腺肿样瘤   9.5   上调   6.4
  225681_at   恶性卵巢癌   乳头状浆液腺瘤   7.7   上调   3.7
  225681_at   继发性恶性卵巢癌   腺癌,NOS   6.9   上调   3.7
  225681_at   卵巢不明性质的癌   浆液囊细胞腺癌,边缘癌   5.3   上调   7.2
  225681_at   胰腺,NOS   恶性胰腺癌,NOS   腺癌,NOS   7.8   上调   9.3
  225681_at   直肠,NOS   恶性直肠癌   腺癌,NOS   7.7   上调   5.8
  225681_at   软  组织,NOS   结缔组织和其它软组织不明性质的肿瘤,NOS   纤维瘤   12.5   上调   7.6
  225681_at   结缔组织和其它软组织的继地性恶性病,NOS   鳞状细胞癌,NOS   5.3   上调   3.2
  225681_at   结缔组织和其它软组织的恶性病,NOS   纤维组织细胞瘤,恶性   3.7   上调   3.1
  225681_at   胃,NOS   恶性胃癌,NOS   腺癌,NOS   3.6   上调   3.5
  225681_at   印戒细胞癌   3.5   上调   4.5
  225681_at   甲  状腺NOS   恶性甲状腺癌   乳头状瘤,NOS   4.5   上调   4.1
表2列出了从利用Affymetrix GeneChip的实验中收集的组织类型差异表达数据。对芯片进行扫描并利用相关专利申请60/331,182,60/388,745和60/390,608中记载的GX Scan算法对数据进行分析,其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-based Algorithm for Organizing andMining Gene Expression Data Derived from Biological Sampleswith Complex Clinical Attributes)”,而且其全部内容被引入本文作参考。
表2-LBFL301(U95:48774_at,U133:225681_at):克隆AD12 & CH4
          源自U95数据的48774_at  源自U133数据的225681_at
1.骨                 升高             —
2.乳房               升高             升高
3.子宫颈             升高             升高
4.结肠               升高             升高
5.子宫内膜           升高             升高
6.食道               升高             升高
7.肾                 升高             升高
8.喉                 升高             升高
9.肝脏               升高             升高
10.肺                升高             升高
11.网膜              升高             升高
12.卵巢              升高             升高
13.胰腺              升高             升高
14.直肠              升高             升高
15.软组织            升高             升高
16.胃                升高             升高
17.甲状腺            升高             升高
通过使样品与芯片序列片段48774_at结合测定到的GeneChip表达结果由利用Taqman检测物(Perkin-Elmer)的定量RT-PCR得到证实。在测定中使用了由特定的Affymetrix片段(48774_at)的sif序列设计的PCR引物。每个RNA样品(10ng的总RNA)中的靶基因相对于外源性掺入(spike)的参比基因进行分析。出于这一目的,四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(cycle threshold)(Ct)相对于恒定的Tet掺入物的Ct值测定的相对表达。样品组包括用U95 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外,没有用GeneChip分析的几个新样品被用于定量RT-PCR中以对表达进行验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL301的上调。
b)LBFL304基因家族:
芯片数据的分析表明AGC样品中的标记物LBFL304的表达与得自正常胃组织的样品中的标记物LBFL304的表达相比被明显地上调了(对于U95为3.5-倍,p=2.54×10-3;对于U133为6.13-倍,p=2.43×10-4)。该数据表明LBFL304的上调可被用于胃癌的诊断。
LBFL304(SEQ ID NO:5,7,9或11)的表达水平可以通过利用Affymetrix GeneChipsU95上的序号为35832_at的芯片序列片段和利用Affymetrix GeneChipsU133上的序号为212344_at,212353_at和212354的芯片序列片段来测定。相对于正常对照组织,各种恶性肿瘤中的51263_at,212344_at,212353_at,和212354_at的表达水平被列于表1b,其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。
通过使样品结合到序号为35832_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(35832_at)的序列信息文件设计的PCR引物被用于分析当中。相对于外源加入的参比基因,检测了每一RNA样品(10ng总RNA)中的目标基因。为了这个目的,将四环素抗性基因用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U95 GeneChip测定的正常胃(Normal)组织和晚期胃癌(AGC)组织RNA。另外,没有用GeneChip分析的几个新样品被用于通过Q-RT-PCR对表达进行验证。相对于正常胃活检组织样品,Q-RT-PCR数据证实了AGC中观察到的LBFL304的上调。
                                          表1b
 表1
 Affy ID 组织 疾病 形态学 变化倍数 趋势 T-Stat
 212344_at 骨头,NOS 恶性骨癌,NOS 骨巨细胞瘤,NOS 6.8 上调 6.9
 212353_at 恶性骨癌,NOS 骨巨细胞瘤,NOS 5.5 上调 5.7
 212354_at 恶性骨癌,NOS 骨巨细胞瘤,NOS 5.9 上调 7.1
 35832_at 恶性骨癌,NOS 骨巨细胞瘤,NOS 10.6 上调 5.7
 212344_at 结肠,NOS 恶性结肠癌,NOS 粘液性腺癌 3.7 上调 2.8
 212344_at 恶性结肠癌,NOS 腺癌,NOS 2.7 上调 7.9
 212353_at 恶性结肠癌,NOS 粘液性腺癌 5.7 上调 3.7
 212353_at 恶性结肠癌,NOS 腺癌,NOS 4.1 上调 9.0
 212354_at 恶性结肠癌,NOS 粘液性腺癌 4.7 上调 3.5
 212354_at 恶性结肠癌,NOS 腺癌,NOS 3.0 上调 8.6
 35832_at 恶性结肠癌,NOS 粘液性腺癌 9.4 上调 3.8
 35832_at 恶性结肠癌,NOS 腺癌,NOS 6.5 上调 10.2
                                                  表1b
表1
 Affy ID 组织 疾病 形态学 变化倍数 趋势 T-Stat
 212344_at 软  组织,NOS 结缔组织和其它软组织恶性癌,NOS 纤维组织细胞癌,恶性的 2.7 上调 3.2
 212353_at 结缔组织和其它软组织恶性癌,NOS 纤维组织细胞癌,恶性的 2.1 上调 2.2
 212353_at 结缔组织和其它软组织恶性癌,NOS 粘液样脂肉瘤 -2.7 下调 -2.4
 212354_at 结缔组织和其它软组织恶性癌,NOS 纤维组织细胞瘤,恶性的 2.2 上调 2.6
 35832_at 结缔组织和其它软组织恶性癌,NOS 纤维组织细胞瘤,恶性的 3.5 上调 2.6
 35822_at 结缔组织和其它软组织恶性癌,NOS 脂肪肉瘤,NOS 4.8 上调 2.6
 212344_at 子宫内膜,NOS 恶性子宫内膜癌 米勒混合瘤 2.4 上调 3.3
 212344_at 恶性子宫内膜癌 腺癌,NOS 2.2 上调 5.5
 212353_at 恶性子宫内膜癌 米勒混合瘤 1.9 上调 2.9
 212353_at 恶性子宫内膜癌 腺癌,NOS 2.0 上调 4.2
 212354_at 恶性子宫内膜癌 米勒混合瘤 2.0 上调 2.7
 212354_at 恶性子宫内膜癌 腺癌,NOS 1.9 上调 4.7
 35832_at 恶性子宫内膜癌 米勒混合瘤 3.0 上调 3.9
 35832_at 恶性子宫内膜癌 腺癌,NOS 2.4 上调 4.7
 212344_at 食管,NOS 恶性食管癌,NOS 腺癌,NOS 1.7 上调 2.3
 212353_at 恶性食管癌,NOS 腺癌,NOS 5.5 上调 3.2
 212354_at 恶性食管癌,NOS 腺癌,NOS 2.9 上调 3.1
 35832_at 恶性食管癌,NOS 腺癌,NOS 10.7 上调 3.2
  212344_at   乳房,NOS   女性恶性乳腺癌,NOS   粘液性腺癌   3.3   上调   4.8
  212344_at   女性恶性乳腺癌,NOS   浸润小叶癌   1.6   上调   2.9
  212344_at   女性恶性乳腺癌,NOS   浸润管癌   2.5   上调   8.7
  212344_at   女性恶性乳腺癌,NOS   浸润管和小叶癌   2.6   上调   2.8
  212353_at   女性恶性乳腺癌,NOS   浸润小叶癌   2.8   上调   4.7
  212354_at   女性恶性乳腺癌,NOS   浸润管癌   3.9   上调   13.0
  212353_at   女性恶性乳腺癌,NOS   浸润管和小叶癌   3.4   上调   3.7
  212354_at   女性恶性乳腺癌,NOS   浸润小叶癌   1.7   上调   3.1
  212354_at   女性恶性乳腺癌,NOS   浸润管癌   2.6   上调   8.5
  212354_at   女性恶性乳腺癌,NOS   浸润管和小叶癌   2.7   上调   2.6
  35832_at   女性恶性乳腺癌,NOS   粘液性腺癌   4.0   上调   5.5
  35832_at   女性恶性乳腺癌,NOS   浸润小叶癌   3.2   上调   4.4
  35832_at   女性恶性乳腺癌,NOS   浸润管癌   4.5   上调   12.0
  35832_at   女性恶性乳腺癌,NOS   浸润管和小叶癌   4.3   上调   4.5
  212353_at   肾,NOS   恶性肾癌,NOS   透明细胞腺癌,NOS   2.8   上调   5.5
  212354_at   恶性肾癌,NOS   透明细胞腺癌,NOS   2.4   上调   5.3
  35832_at   恶性肾癌,NOS   透明细胞腺癌,NOS   6.1   上调   5.6
  212344_at   喉,NOS   恶性喉癌,NOS   鳞状细胞腺癌,NOS   3.0   上调   3.3
  212353_at   恶性喉癌,NOS   鳞状细胞癌,NOS   5.1   上调   3.8
  212354_at   恶性喉癌,NOS   鳞状细胞癌,NOS   3.7   上调   3.6
  35832_at   恶性喉癌,NOS   鳞状细胞癌,NOS   7.2   上调   3.7
  212344_at   肺,NOS   恶性肺癌,NOS   癌,NOS   4.1   上调   3.9
  212344_at   恶性肺癌,NOS   鳞状细胞癌,NOS   3.1   上调   5.8
  212344_at   恶性肺癌,NOS   巨细胞癌,NOS   2.7   上调   2.5
  212344_at   恶性肺癌,NOS   腺癌,NOS   2.8   上调   6.2
  212353_at   恶性肺癌,NOS   癌,NOS   4.1   上调   3.2
  212353_at   恶性肺癌,NOS   鳞状细胞癌,NOS   3.6   上调   6.5
  212353_at   恶性肺癌,NOS   巨细胞癌,NOS   3.8   上调   2.7
  212353_at   恶性肺癌,NOS   腺癌,NOS   3.6   上调   6.9
  212354_at   恶性肺癌,NOS   癌,NOS   3.5   上调   2.9
  212354_at   恶性肺癌,NOS   鳞状细胞癌,NOS   3.1   上调   5.6
  212354_at   恶性肺癌,NOS   巨细胞癌,NOS   2.9   上调   2.6
  212354_at   恶性肺癌,NOS   腺癌,NOS   2.9   上调   6.2
  35832_at   恶性肺癌,NOS   鳞状细胞癌,NOS   8.8   上调   6.0
  35832_at   恶性肺癌,NOS   腺癌,NOS   8.9   上调   7.2
  212344_at   卵巢,NOS   恶性卵巢癌   乳头状浆液腺癌   3.0   上调   3.9
  212353_at   恶性卵巢癌   乳头状浆液腺癌   3.6   上调   3.9
  212354_at   恶性卵巢癌   乳头状浆液腺癌   2.6   上调   3.4
  212344_at   胰腺,NOS   恶性胰腺癌,NOS   腺癌,NOS   6.9   上调   9.0
  212353_at   恶性胰腺癌,NOS   腺癌,NOS   7.8   上调   11.2
  212354_at   恶性胰腺癌,NOS   腺癌,NOS   8.6   上调   11.0
  35832_at   恶性胰腺癌,NOS   腺癌,NOS   99.8   上调   11.1
  212353_at   前列腺,NOS   恶性前列腺癌   非典型疑似恶性   -2.2   下调   -4.7
  212353_at   恶性前列腺癌   腺癌,NOS   -1.5   下调   -2.5
  212354_at   恶性前列腺癌   非典型疑似恶性   -1.8   下调   -3.8
  212354_at   恶性前列腺癌   腺癌,NOS   -1.7   下调   -3.8
  35832_at   恶性前列腺癌   非典型疑似恶性   -4.3   下调   -4.4
  35832_at   恶性前列腺癌   腺癌,NOS   -1.7   下调   -2.6
  212344_at   直肠,NOS   恶性直肠癌   腺癌,NOS   3.0   上调   6.9
  212353_at   恶性直肠癌   腺癌,NOS   4.1   上调   7.6
  212354_at   恶性直肠癌   腺癌,NOS   3.0   上调   7.2
  35832_at   恶性直肠癌   腺癌,NOS   5.4   上调   8.8
  212344_at   皮肤,NOS   恶性皮肤癌,NOS   鳞状细胞癌,NOS   2.8   上调   2.4
  212353_at   恶性皮肤癌,NOS   鳞状细胞癌,NOS   3.5   上调   2.4
  35832_at   恶性皮肤癌,NOS   基底细胞癌,NOS   3.6   上调   2.5
  35832_at   恶性皮肤癌,NOS   鳞状细胞癌,NOS   5.5   上调   3.0
  212344_at   胃,NOS   恶性胃癌,NOS   粘液性腺癌   7.6   上调   3.1
  212344_at   恶性胃癌,NOS   印戒细胞癌   3.9   上调   2.4
  212344_at   恶性胃癌,NOS   腺癌,NOS   2.5   上调   4.9
  212353_at   恶性胃癌,NOS   粘液性腺癌   11.0   上调   3.7
  212353_at   恶性胃癌,NOS   印戒细胞癌   4.9   上调   2.9
  212353_at   恶性胃癌,NOS   腺癌,NOS   3.4   上调   5.6
  212354_at   恶性胃癌,NOS   粘液性腺癌   7.5   上调   3.2
  212354_at   恶性胃癌,NOS   印戒细胞癌   3.7   上调   2.4
  212354_at   恶性胃癌,NOS   腺癌,NOS   2.7   上调   5.1
  35832_at   恶性胃癌,NOS   印戒细胞癌   8.4   上调   3.4
  35832_at   恶性胃癌,NOS   腺癌,NOS   8.6   上调   6.7
  212344_at   睾丸,NOS   恶性睾丸癌,NOS   混合型生殖细胞瘤   2.0   上调   2.4
  212353_at   恶性睾丸癌,NOS   混合型生殖细胞瘤   4.1   上调   2.8
  212354_at   恶性睾丸癌,NOS   混合型生殖细胞瘤   3.4   上调   2.6
  212353_at   网膜,NOS   恶性网膜癌   乳头状浆液腺癌   1.7   上调   2.6
  35832_at   甲  状腺,NOS   恶性甲状腺癌   乳头状瘤,NOS   2.5   上调   2.5
  35832_at   子  宫颈,NOS   恶性子宫颈癌   鳞状细胞癌,NOS   3.5   上调   2.3
c)LBFL305基因家族:
芯片数据的分析表明胃癌样品中的标记物LBFL305的表达与得自正常胃组织的样品中的标记物LBFL305的表达相比被明显地上调了(2.2-倍,p=0.0051,利用U95 GeneChip;2.14-倍,p=0.0109,利用U133 GeneChip)。该数据表明LBFL305的上调可被用于胃癌的诊断。
LBFL305(SEQ ID NO:13)的表达水平可以通过分别利用AffymetrixGeneChipsU95和U133上的序号为53858_at和225364_at的芯片序列来测定。从利用Affymetrix GeneChips的实验收集通过组织类型进行差异表达的数据并利用GX Scan算法对这些数据进行分析,GXScan算法被记载在相关专利申请60/331,182,60/388,745和60/390,608中,其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-based Algorithm forOrganizing and Mining Gene Expression Data Derived fromBiological Samples with Complex Clinical Attributes)”,而且其全部内容被引入本文作参考。相对于正常对照组织,各种恶性肿瘤中的53858_at和225364_at的表达水平被列于表1c,其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。
                                           表1c
 Affy ID 组织 疾病 形态学  变化倍数 趋势 T-Stat
 53858_at 膀胱,NOS 女性恶性膀胱癌,NOS 过渡细胞癌,NOS  1.691 上调 2.377
 53858_at 乳房,NOS 女性恶性乳腺癌,NOS 浸润管癌  1.538 上调 6.824
 53858_at 女性恶性乳腺癌,NOS 浸润管和小叶癌  1.599 上调 2.408
 225364_at 女性恶性乳腺癌,NOS 浸润管和小叶癌  1.525 上调 3.251
 53858_at 子宫颈,NOS 恶性子宫颈癌 鳞状细胞癌,NOS  1.637 上调 4.056
 53858_at 子宫内膜,NOS 恶性子宫内膜癌 米勒混合瘤  1.548 上调 2.647
 53858_at 食管,NOS 恶性食管癌,NOS 腺癌,NOS  2.079 上调 3.145
 225364_at 恶性食管癌,NOS 腺癌,NOS  1.615 上调 2.915
 53858_at 肾,NOS 恶性肾癌,NOS 肾细胞癌  1.864 上调 6.093
 53858_at 恶性肾癌,NOS 透明细胞腺癌,NOS  2.167 上调 6.877
 225364_at 恶性肾癌,NOS 肾细胞癌  1.593 上调 5.045
 225364_at 恶性肾癌,NOS 透明细胞腺癌,NOS  1.683 上调 7.924
 225364_at 肺,NOS 恶性肺癌,NOS 小细胞癌,NOS  -1.79 下调 -7.071
 53858_at 淋巴结,NOS 何杰金氏病,多位点淋巴结的NOS 何杰金氏病,NOS  1.539 上调 2.519
 53858_at 恶性淋巴和组织细胞组织瘤 恶性淋巴癌,NOS  1.635 上调 3.243
 53858_at 胰腺,NOS 恶性胰岛癌 岛细胞癌  3.845 上调 7.929
 53858_at 恶性胰腺癌,NOS 腺癌,NOS  4.171 上调 7.165
 225364_at 恶性胰岛癌 岛细胞癌  2.343 上调 3.551
 225364_at 恶性胰腺癌,NOS 腺癌,NOS  2.278 上调 10.793
 225364_at 前列腺,NOS 恶性前列腺癌 非典型疑性恶性  -1.641 下调 -4.8
 53858_at 直肠,NOS 恶性直肠癌 腺癌,NOS  1.935 上调 5.416
 53858_at 小肠,NOS 恶性淋巴癌,未确定的,结节外的或实体器官位点的NOS 恶性淋巴癌,NOS  3.935 上调 3.535
 225364_at 恶性淋巴癌,未确定的,结节外的或实体器官位点的NOS 恶性淋巴癌,NOS  3.024 上调 3.816
 53858_at 胃,NOS 恶性胃癌,NOS 印戒细胞癌  1.507 上调 2.46
 53858_at 恶性胃癌,NOS 腺癌,NOS  2.076 上调 5.928
 225364_at 恶性胃癌,NOS 印戒细胞癌  1.524 上调 3.076
 225364_at 恶性胃癌,NOS 腺癌,NOS  1.637 上调 6.053
 225364_at 甲状腺,NOS 恶性淋巴癌,未确定的,结节外的或实体器官位点的NOS 恶性淋巴癌,NOS  4.371 上调 9.429
 225364_at 恶性甲状腺癌 乳头状癌,NOS  1.634 上调 3.22
 53858_at 女阴,NOS 恶性女阴癌,NOS 鳞状细胞癌,NOS  1.505 上调 2.596
通过使样品结合到序号为53858_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(53858_at)的序列信息文件设计的PCR引物被用于分析当中。每个RNA样品(10ng的总RNA)中的靶基因相对于外源掺入的参比基因进行分析。出于这一目的,四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U95 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外,没有用GeneChip分析的几个新样品被用于通过定量RT-PCR对表达进行的验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL305的上调。
d)LBFL306基因家族
芯片数据的分析表明胃癌样品中的标记物LBFL306的表达与得自正常胃组织的样品中的标记物LBFL306的表达相比被明显地上调了(3.27-倍,p=0.00217,利用U133 GeneChip)。该数据表明LBFL306的上调可被用于胃癌的诊断。
LBFL306(SEQ ID NO:17,19或21)的表达水平可以通过分别利用Affymetrix GeneChipsU95和U133上的序号为57861_at和223251_s_at的芯片序列片段来测定。从利用Affymetrix GeneChips的实验收集通过组织类型进行差异表达的数据并利用GX Scan算法对这些数据进行分析,GX Scan算法被记载在相关专利申请60/331,182,60/388,745和60/390,608中,其中所述专利申请的题目全部是“用于组织和采集得自具有综合临床特性的生物样品的基因表达数据的基于自动化计算机的数据处理法(An Automated Computer-basedAlgorithm for Organizing and Mining Gene Expression DataDerived from Biological Samples with Complex ClinicalAttributes)”,而且其全部内容被引入本文作为参考。相对于正常对照组织,各种恶性肿瘤中的223251_at的表达水平被列于表1d,其中还显示了变化倍数和变化趋势(上调或下调)。变化倍数大于1.5的被认为是显著的。所述数据表明除了胃癌外,膀胱癌、结肠癌、食道癌、肾癌、网膜癌、胰腺癌、直肠癌和软组织癌中的LBFL306的表达也被上调了,并且这种基因家族的表达在乳腺癌、子宫内膜癌和小肠癌中被下调了。
序列为SEQ ID NO:17或19或21的全长cDNA通过利用GeneTrappercDNA Positive Selection System Kits(Invitrogen)而获得。所获得的cDNA被转化成双链质粒DNA,该双链质粒DNA被用于转化大肠杆菌细胞(DH10B),并筛选出最长的cDNA。通过利用基因-特异性引物由PCR证实了阳性筛选后,对cDNA克隆进行DNA测序。
进行RNA印迹分析来测定对应于LBFL306的mRNA转录物大小。使用了含有得自各种人组织的总RNA的RNA印迹物(ClonTech H12),并且通过随机引物法对LBFL306-GE2(SEQ ID NO:21)进行放射性标记后用于探测印迹物。这些印迹物在65℃下于Church和Gilbert缓冲液中进行杂交并在室温下用含0.1%SDS的0.1×SSC冲洗。RNA印迹显示了该基因的具有约1.5kb大小的单一转录物。这对应于全长克隆中的插入物的大小,其也为约1.5kb。
通过使样品结合到序号为223251_s_at的芯片序列片段而测定的GeneChip表达结果通过利用Taqman分析法(Perkin-Elmer)的定量RT-PCR(Q-RT-PCR)得到了验证。由特定Affymetrix片段(223251_s_at)的序列信息文件设计的PCR引物被用于分析中。每个RNA样品(10ng的总RNA)中的靶基因相对于外源掺入的参比基因进行分析。出于这一目的,四环素抗性基因被用作外源添加的掺入物。该方法提供了通过由靶mRNA的循环阈值(Ct)相对于恒定量的Tet掺入物的Ct而测定的相对表达。样品组包括用U133 GeneChip测定的正常胃组织和晚期胃癌组织RNA。另外,没有用GeneChip分析的几个新样品被用于通过Q-RT-PCR对表达进行的验证。Q-RT-PCR数据证实了晚期胃癌中观察到的LBFL306的上调。
                                              表1d
 芯片位置号 组织 疾病 形态学 变化倍数 趋势 T-Stat
 223251_s_at 膀胱,NOS 膀胱恶性肿瘤,NOS 过渡细胞癌,NOS 1.649 上调 2.572
 223251_s_at 乳房,NOS 女性乳腺恶性肿瘤,NOS 管内癌,NOS -1.701 下调 -5.202
 223251_s_at 结肠,NOS 结肠恶性肿瘤,NOS 腺癌,NOS 2.651 上调 8.164
 223251_s_at 子宫内膜,NOS 子宫内膜恶性肿瘤 米勒混合肿瘤 -1.806 下调 -2.367
 223251_s_at 食道,NOS 食管恶性肿瘤,NOS 腺癌,NOS 5.016 上调 4.269
 223251_s_at 肾,NOS 肾恶性肿瘤,NOS 过渡细胞癌,NOS 1.755 上调 4.563
 223251_s_at 肾恶性肿瘤,NOS 透明细胞腺癌,NOS 1.611 上调 4.054
 223251_s_at 肾恶性肿瘤,NOS  Wilm′s肿瘤 4.565 上调 3.891
 223251_s_at 网膜,NOS 网膜恶性肿瘤 乳头状浆液腺癌 1.762 上调 3.398
 223251s_at 胰腺,NOS 胰腺恶性肿瘤,NOS 腺癌,NOS 2.672 上调 7.13
 223251_s_at 直肠,NOS 直肠恶性肿瘤 腺癌,NOS 2.482 上调 6.042
 223251_s_at 小肠,NOS 小肠恶性肿瘤,NOS 肉瘤,NOS -1.944 下调 -5.716
 223251_s_at 软组织,NOS 结缔组织和其它软组织的恶性肿瘤,NOS 粘液性脂肉瘤  1.878 上调 3.894
 223251_s_at 胃,NOS 胃恶性肿瘤,NOS 腺癌,NOS  2.522 上调 5.101
实施例2
对应于差异表达的mRNA品种的全长人cDNA(LBFL301,LBFL304, LBFL305和LBFL306)的克隆
通过寡核苷酸-牵引(oligo-pulling)法获得序列为SEQ ID NO:1,3,5,7,9,11,13,17,19或21的全长cDNA。简要地说,在LBFL301,LBFL304,LBFL305或LBFL306的序列基础上设计基因-特异性寡核苷酸。该寡核苷酸被标记上生物素后按照Sambrook等的方法与2μg的单链质粒DNA(cDNA重组体)进行杂交,其中所述单链质粒DNA得自完全分化的胃腺癌文库(NCI CGAP Gas 4)或由Jurkat细胞制备的文库。利用结合了链霉亲和素的珠子分离所述杂交cDNA并通过加热洗脱。洗脱下来的cDNA被转化成双链质粒DNA并被用于转化大肠杆菌细胞(DH10B),筛选出最长的cDNA。利用基因-特异性引物证实阳性筛选后,对所述cDNA克隆进行DNA测序。
对应于以上检测的差异调控的mRNA的全长人cDNA的核苷酸序列如SEQ ID NOS:1,3,5,7,9,11,13,17,19和21所示。在SEQID NO 1中,所述cDNA含1272个碱基对(1255个碱基对和一个多聚腺苷酸尾)。在SEQ ID NO 3中,cDNA含1355个碱基对(1334个碱基对和一个多聚腺苷酸尾)。LBFL304具有几个可能的启动密码子,并且它们被命名为SEQ ID NOS:5,7,9和11。SEQ ID NO:13中的cDNA含6405个碱基对(6369个碱基对和一个多聚腺苷酸尾)。与SEQ IDNO:17对应的cDNA含1299个碱基对(1284个碱基对和一个多聚腺苷酸尾)。与SEQ ID NO:19对应的cDNA含2451个碱基对(2435个碱基对和一个多聚腺苷酸尾)。与SEQ ID NO:21对应的cDNA含1194个碱基对(1178个碱基对和一个多聚腺苷酸尾)。
SEQ ID NO:1所示的cDNA核苷酸序列内的可读框位于第131-859位核苷酸(131-862位含终止密码子),编码243个氨基酸的蛋白。对应于由SEQ ID NO:1编码的预测蛋白的氨基酸序列如SEQ ID NO:2所示。
SEQ ID NO:3所示的cDNA核苷酸序列内的可读框位于第174-584位核苷酸(174-587位含终止密码子),编码137个氨基酸的蛋白。对应于由SEQ ID NO:3编码的预测蛋白的氨基酸序列如SEQ ID NO:4所示。SEQ ID NO:4的蛋白序列与SEQ ID NO:2的蛋白序列在前124个氨基酸上相同,而SEQ ID NO:4的最后13个氨基酸是独特的。如图1所示,与SEQ ID NO:4对应的蛋白序列的终端是由45-bp插入子产生,所述插入子在可读框中引进了终止密码子。
SEQ ID NO:2和4稍微类似于胰凝乳蛋白酶丝氨酸蛋白酶家族基序(signature)(S1)和NUDIX水解酶家族基序。胰凝乳蛋白酶丝氨酸蛋白酶家族基序(S1)含有三个区域,第三个区域不存在于SEQ ID NO:4中。另外,两种蛋白都含有胶原三螺旋重复区域。
图2和3表示对SEQ ID NO:2和4的氨基酸序列的疏水性进行分析的结果。如上所述,亲水性区域可被用来制备抗原肽。两个序列都具有疏水性的N-端,约30个氨基酸长度,最强疏水性部分集中在第20位氨基酸的附近。由SPScan(GCG Wisconsin Package)进行的进一步的蛋白序列分析展示出由1-30位氨基酸形成的疏水区域似乎就是分泌信号肽。
SEQ ID NO:5所示的cDNA核苷酸序列内的可读框位于第38-892位核苷酸(38-895位含终止密码子),编码285个氨基酸的蛋白。对应于由SEQ ID NO:5编码的预测蛋白的氨基酸序列如SEQ ID NO:6所示。SEQ ID NO:6稍微类似于胰凝乳蛋白酶丝氨酸蛋白酶家族基序(S1)。图4表示对SEQ ID NO:6的氨基酸序列的疏水性进行分析的结果。如上所述,亲水性区域可被用来制备抗原肽。
SEQ ID NO:7所示的cDNA核苷酸序列内的可读框位于第53-892位核苷酸(53-895位含终止密码子),编码280个氨基酸的蛋白。对应于由SEQ ID NO:7编码的预测蛋白的氨基酸序列如SEQ ID NO:8所示。SEQ ID NO:8的蛋白序列与SEQ ID NO:6的蛋白序列相同,  但是SEQ ID NO:8缺乏SEQ ID NO:6的N-端的头五个氨基酸。
SEQ ID NO:9所示的cDNA核苷酸序列内的可读框位于第65-892位核苷酸(65-895位含终止密码子),编码276个氨基酸的蛋白。对应于由SEQ ID NO:9编码的预测蛋白的氨基酸序列如SEQ ID NO:10所示。SEQ ID NO:10的蛋白序列与SEQ ID NO:6的蛋白序列相同,但是SEQ ID NO:10缺乏SEQ ID NO:6的N-端的头九个氨基酸。
SEQ ID NO:11所示的cDNA核苷酸序列内的可读框位于第92-892位核苷酸(92-895位含终止密码子),编码267个氨基酸的蛋白。对应于由SEQ ID NO:11编码的预测蛋白的氨基酸序列如SEQ ID NO:12所示。SEQ ID NO:12的蛋白序列与SEQ ID NO:6的蛋白序列相同,但是SEQ ID NO:12缺乏SEQ ID NO:6的N-端的头18个氨基酸。
SEQ ID NO:13所示的cDNA核苷酸序列内的可读框位于第49-1434位核苷酸(49-1437位含终止密码子),编码462个氨基酸的蛋白。对应于由SEQ ID NO:13编码的蛋白的氨基酸序列如SEQ ID NO:14所示。
BLAST检索结果和两个序列间的高度同源性表明LBFL305是Mst1的(例如,SEQ ID NO:16的)剪接变体。比对序列的下划线氨基酸残基表示SEQ ID NO:14与SEQ ID NO:18之间的差异。基于Mst1的公开的研究,SEQ ID NO:14含有激酶区域(氨基酸位点1-299)(Creasy等,(1996)J Biol Chem 271:21049-21053),接下来的是调节激酶功能的调控区域(氨基酸位点300-462)(Creasy等,(1996)JBiol Chem 271:21049-21053)。在氨基酸位点326-327与349-350之间(Graves等,(2001)J Biol Chem 276:14909-14915)还存在两个caspase裂解位点,和一个NES域(氨基酸位点361-370)(Ura等,(2002)Proc Nat1 Acad Sci USA 98:10148-10153)。与SEQ ID NO:16相比,SEQ ID NO:14缺失了第二个NES域(SEQ ID NO:16中的氨基酸位点441-451)(Ura等,(2002)Proc Nat1 Acad Sci USA 98:10148-10153)。而且,SEQ ID NO:14不含自身缔合所需的多聚化区域(Mst1中的氨基酸位点431-4871)(Creasy等,(1996)J Biol Chem271:21049-21053)。有趣地是,与NORE(一种假设的Ras效应物)发生相互作用所需的Mst1中的区域(SEQ ID NO:16中的氨基酸位点449-487)(Khokh1atchev等,Curr Biol 12:253-265)不存在于SEQ IDNO:14中。
图5表示对SEQ ID NO:14所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
SEQ ID NO:17所示的cDNA核苷酸序列内的可读框位于第75-572位核苷酸(75-575位含终止密码子),编码166个氨基酸的蛋白。对应于由SEQ ID NO:17编码的蛋白的氨基酸序列如SEQ ID NO:18所示。图7表示对SEQ ID NO:18所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
SEQ ID NO:19所示的cDNA核苷酸序列内的可读框位于第78-1337位核苷酸(78-1340位含终止密码子),编码420个氨基酸的蛋白。对应于由SEQ ID NO:19编码的蛋白的氨基酸序列如SEQ ID NO:20所示。图8表示对SEQ ID NO:20所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
SEQ ID NO:21所示的cDNA核苷酸序列内的可读框位于第78-737位核苷酸(78-740位含终止密码子),编码220个氨基酸的蛋白。对应于由SEQ ID NO:21编码的蛋白的氨基酸序列如SEQ ID NO:22所示。图9表示对SEQ ID NO:22所示氨基酸序列进行疏水性分析的结果。如上所述,亲水区域可以被用来制备抗原肽。
利用GCG Wisconsin软件包通过hmmerpfam确定:全部三个LBFL306克隆,即EF3(SEQ ID NO:17),GC7(SEQ ID NO:19)和GE2(SEQ ID NO:21)都含多个锚蛋白重复序列。所述锚蛋白重复序列是从EF3,GC7和GE2中的氨基酸残基57至89,91至123和124至156。除了这三个锚蛋白重复序列,GC7还含从157至190的另一个锚蛋白重复子。
通过进行RNA印迹分析来确定对应于LBFL301,LBFL304和LBFL305的mRNA转录物的大小。采用含有源自各种人体组织的总RNA的RNA印迹物(ClonTech),而且克隆CH4(SEQ ID NO:3)、克隆EA10(SEQ ID NO:5,7,9或11)和LBFL305(SEQ ID NO:13)通过随机引物法被放射性标记后用于探测所述印迹物。所述印迹物在65℃下于Church和Gilbert缓冲液中进行杂交,然后在室温下用含0.1%SDS的0.1×SSC缓冲液冲洗。RNA印迹分析结果显示了每个基因的单个转录物,大小约为1.57kb(LBFL301),2.6kb(LBFL304)和7.95kb(LBFL305)。这与克隆CH4(1.355kb),克隆EA10(SEQID NO:5,7,9或11)和LBFL305(6.5kb)中的插入物大小相对应。当克隆AD12(SEQ ID NO:1)的序列被用作探针时,检测到了1.44kb的转录物,其对应于克隆AD12中插入物的大小,即1.272kb。
为了检测各种正常组织中的LBFL301,LBFL304,LBFL305或LBFL306的表达,按照以下方法制备电子RNA印迹(e-Northern)。利用实施例1中的芯片和方法,将如表3中所示的得自一组正常组织的mRNA杂交到Affymetrix U95 human GeneChip上。这些实验的结果被列于表3中。针对每种组织类型,被注明有或无的样品数目与样品组中样品的总数目一起列了出来。另外,列出了每种组织类型中的中值和25%和75%的点。有趣地是,尽管该基因在胃癌中是上调的,但是在大多数正常胃组织样品中没能检测到LBFL301或LBFL304的表达。另外,尽管在检测的大多数正常胃组织样品中发现了LBFL305和LBFL306,但是表达水平比大多数其它被检测的正常胃组织中的表达水平低。如下所述,这种观察结果表明LBFL301,LBFL304,LBFL305或LBFL306可被用作诊断试剂或标记物以检测或筛选胃癌。LBFL301的表达水平似乎在皮肤组织中最高,其次是胎盘、动物脂肪、动脉、膀胱、骨头、乳房和软组织。尽管在肝脏或大脑和心脏的大部分区域中没有检测到该基因,但是在表3a中列出的其它大多数组织中检测到了较低水平的表达。LBFL304的表达水平似乎在动脉、网膜、子宫、子宫内膜、子宫肌层和前列腺中最高。LBFL305的表达水平似乎在免疫系统中的器官(例如白细胞、淋巴结、脾脏和胸腺)中最高,其次是得自阑尾、动脉、骨头和肺的样品。而且在表3c中所列的其它大多数组织中检测到了更低的表达水平。LBFL306的表达水平似乎在免疫系统的器官(例如淋巴结、脾脏和胸腺)和生殖系统的器官(例如乳房、子宫内膜、前列腺和子宫)中最高。
表3a-48774_at的e-Northern数据:正常组织中的LBFL301基因表达
总存在频率 组织 存在 不存在 下面25%  平均 上面75%
0.5492
脂肪 29/33  4/33  130.90  200.78  302.98
肾上腺 1/12  11/12  -4.10  8.75  22.07
阑尾 1/3  2/3  21.54  31.31  71.81
动脉 3/3  0/3  148.46  203.96  262.32
膀胱 6/7  1/7  142.72  195.44  361.02
2/4  2/4  75.00  240.38  412.62
乳房 74/82  8/82  104.43  222.98  506.27
小脑 0/5  5/5  -7.5 1  -6.91  0.94
子宫颈 75/99  24/99  42.04  93.36  144.25
结肠 36/148  112/148  1.75  12.16  29.05
皮层前叶 1/7  6/7  5.96  14.07  18.05
皮层颞叶 0/3  3/3  -0.59  4.13  4.66
十二指肠 9/61  52/61  3.99  11.54  20.62
子宫内膜 16/21  5/21  46.25  85.18  113.55
食管 14/27  13/27  17.91  42.08  81.58
输卵管 21/51  30/51  7.97  20.39  33.96
胆囊 4/8  4/8  16.22  80.97  400.47
心脏 0/3  3/3  -3.80  6.00  11.57
海马 1/5  4/5  -6.49  -0.18  7.81
12/87  75/87  -14.80  -4.61  9.24
4/4  0/4  48.51  119.88  248.62
左心房 64/141  77/141  8.19  27.15  61.94
左心室 2/15  13/15  -7.49  7.08  13.24
0/33  33/33  -15.13  -8.62  0.03
43/92  49/92  10.45  30.14  63.21
淋巴结 9/12  3/12  43.28  81.96  225.75
肌肉 19/38  19/38  23.70  40.22  108.40
子宫肌层 68/106  38/106  19.39  56.42  99.78
网膜 12/16  4/16  76.26  148.41  236.54
卵巢 26/75  49/75  4.20  21.96  47.43
胰腺 7/34  27/34  -12.61  0.83  17.69
胎盘 5/5  0/5  284.63  361.07  414.51
前列腺 7/32  25/32  0.03  12.08  36.90
直肠 17/44  27/44  3.23  12.57  37.41
右心房 60/171  111/171  2.99  15.73  53.22
右心室 43/160  117/160  1.85  16.64  39.58
皮肤 56/59  3/59  321.45  906.78  1515.60
小肠 18/68  50/68  0.41  12.19  28.53
软组织 5/6  1/6  148.50  202.33  794.03
5/29  24/29  -3.61  3.04  12.46
15/45  30/45  7.73  18.66  50.97
睾丸 3/5  2/5  14.11  27.34  64.24
胸腺 19/71  52/71  4.06  25.61  40.45
甲状腺 7/19  12/19  12.43  32.64  40.31
子宫 35/56  21/56  32.20  44.73  143.10
WBC  1/41  40/41  -18.91  -13.33  -6.24
表3b-35832_at的e-Northern数据:正常组织中的LBFL304基因表达
片段 总存在频率 组织 存在 不存在 下面25% 平均 上面75%
35832_at  0.5228
脂肪 26/34  8/34  29.09  59.51  89.67
肾上腺 1/12  11/12  -11.00  -6.08  8.14
阑尾 1/3  2/3  43.26  53.50  66.52
动脉 3/4  1/4  182.70  291.81  428.36
膀胱 5/7  2/7  56.36  62.71  64.68
3/4  1/4  19.34  77.40  167.06
乳房 65/82  17/82  33.67  63.19  108.61
小脑 0/5  5/5  -19.26  -14.78  -13.16
子宫颈 69/102  33/102  18.76  57.45  94.99
结肠 85/146  61/146  10.73  35.22  87.91
皮层前叶 1/7  6/7  -5.03  8.78  14.71
皮层颞叶 0/3  3/3  -16.73  -16.67  -15.85
十二指肠 19/53  34/53  6.47  20.39  41.95
子宫内膜 15/21  6/21  31.44  93.20  137.68
食管 15/27  12/27  5.12  27.03  52.89
输卵管 19/47  28/47  5.38  22.48  54.99
胆囊 2/7  5/7  8.71  28.94  50.85
心脏 0/3  3/3  -35.98  -28.2 5  -6.72
海马 2/5  3/5  -7.43  -3.64  5.68
28/89  61/89  1.67  20.45  45.18
4/4  0/4  36.13  54.20  79.75
左心房 80/141  61/141  8.32  25.37  52.28
左心室 0/15  15/15  -21.85  -17.01  -8.17
2/35  33/35  -10.51  0.02  8.05
29/93  64/93  2.56  19.47  43.63
淋巴结 3/12  9/12  -17.5 8  -2.85  9.56
肌肉 12/42  30/42  -13.74  3.99  23.23
子宫肌层 92/108  16/108  67.57  129.39  203.58
网膜 14/15  1/15  176.65  310.28  368.41
卵巢 31/74  43/74  0.66  27.78  54.33
胰腺 4/33  29/33  -9.60  2.09  9.94
胎盘 0/5  5/5  -21.32  -3.06  6.08
前列腺 30/32  2/32  82.37  104.56  190.72
直肠 37/44  7/44  51.53  86.73  125.67
右心房 69/170  101/170  -3.30  8.80  33.56
右心室 35/160  125/160  -11.65  -0.46  16.02
皮肤 28/61  33/61  4.2 2  25.33  67.56
小肠 36/67  31/67  10.76  33.92  64.75
软组织 4/6  2/6  25.95  40.91  58.70
1/29  28/29  -19.20  -13.77  -6.69
16/47  31/47  -8.30  13.38  47.93
睾丸 1/5  4/5  -18.20  5.01  37.66
胸腺 1/73  72/73  -22.55  -12.50  -3.27
甲状腺 14/19  5/19  45.56  98.30  141.24
子宫 43/58  15/58  37.47  103.26  180.98
 WBC 0/43  43/43  -33.45  -25.32 -20.23
表3c-48774_at的e-Northern数据:正常组织中的LBFL305基因表达
总存在频率 组织 存在 不存在 下面25% 平均 上面75%
0.9444
脂肪 31/32  1/32  221.82  286.63  38 0.88
肾上腺 12/12  0/12  162.12  214.21  310.82
阑尾 3/3  0/3  352.94  506.01  633.71
动脉 3/3  0/3  343.80  419.88  643.55
膀胱 5/5  0/5  221.82  290.82  301.11
3/3  0/3  410.63  508.38  662.78
乳房 80/80  0/80  236.84  279.81  338.22
小脑 5/5  0/5  182.09  198.28  283.55
子宫颈 97/101  4/101  179.11  246.50  317.62
结肠 146/151  5/151  247.18  314.49  389.23
皮层前叶 7/7  0/7  222.19  230.28  268.13
皮层颞叶 3/3  0/3  305.66  365.62  377.16
十二指肠 58/61  3/61  206.17  276.14  331.91
子宫内膜 21/21  0/21  158.91  193.40  257.17
食管 25/27  2/27  182.29  223.24  303.93
输卵管 50/51  1/51  168.69  220.72  265.95
胆囊 7/8  1/8  237.67  270.08  312.45
心脏 2/3  1/3  44.79  55.84  56.46
海马 5/5  0/5  165.94  212.72  32 8.59
79/86  7/86  121.83  158.99  209.67
4/4  0/4  140.76  209.46  302.84
左心房 127/141  14/141  58.48  92.78  123.06
左心室 9/15  6/15  50.50  74.69  101.06
27/34  7/34  87.73  146.60  197.27
92/93  1/93  365.58  454.87  550.48
淋巴结 11/11  0/11  493.34  943.95  1141.06
肌肉 19/39  20/39  41.41  64.44  110.74
子宫肌层 104/106  2/106  188.94  263.73  322.65
网膜 15/15  0/15  198.02  244.56  334.75
卵巢 70/74  4/74  133.44  181.39  246.40
胰腺 13/34  21/34  24.30  53.13  84.64
胎盘 4/5  1/5  156.58  174.21  182.71
前列腺 32/32  0/32  184.16  234.60  289.05
直肠 42/43  1/43  284.60  365.66  434.01
右心房 148/169  21/169  54.96  89.92  129.13
右心室 132/160  28/160  55.58  78.85  114.70
皮肤 57/59  2/59  250.81  320.57  398.56
小肠 64/68  4/68  196.50  279.29  393.83
软组织 6/6  0/6  234.21  307.07  363.66
31/31  0/31  775.25  879.84  1022.49
41/47  6/47  137.91  217.53  3 38.54
睾丸 5/5  0/5  326.62  358.69  377.26
胸腺 71/71  0/71  691.12  802.96  9 84.42
甲状腺 18/18  0/18  121.11  162.16  238.53
子宫 57/58  1/58  157.19  202.53  265.91
 WBC 38/40  2/40  1863.06  2264.27  2743.82
表3d-48774_at的e-Northern数据:正常组织中的LBFL306基因表达
总存在频率 组织 存在 不存在 下面25%  平均 上面75%
0.8143
脂肪 31/32  1/32  184.04  242.67  285.20
肾上腺 6/12  6/12  130.70  157.08  187.26
阑尾 3/3  0/3  259.39  301.05  388.31
动脉 4/4  0/4  168.95  207.06  295.97
膀胱 7/8  1/8  196.52  239.43  374.54
4/4  0/4  209.35  226.22  292.55
乳房 60/61  1/61  238.09  315.29  421.47
子宫颈 92/102  10/102  180.90  224.31  342.25
结肠 168/192  24/192  147.41  175.83  215.95
皮层前叶 5/5  0/5  133.94  148.22  162.91
皮层颞叶 3/3  0/3  137.28  147.77  172.44
十二指肠 68/68  0/68  186.24  218.73  336.00
子宫内膜 19/19  0/19  273.57  359.17  436.85
食管 14/25  11/25  105.83  140.56  195.89
胆囊 7/8  1/8  232.71  293.00  410.47
心脏 1/3  2/3  86.39  100.48  129.68
海马 9/10  1/10  125.62  140.94  194.06
53/91  38/91  108.29  147.35  186.69
3/4  1/4  160.96  190.50  219.55
左心房 65/143  78/143  100.94  128.86  157.57
左心室 0/13  13/13  82.54  106.63  117.06
15/44  29/44  145.82  204.77  244.58
104/114  10/114  168.03  203.35  283.11
淋巴结 14/14  0/14  207.66  319.53  366.70
淋巴细胞(B+T细胞) 24/24  0/24  224.46  292.01  348.07
肌肉 31/40  9/40  183.43  24 0.15  329.99
子宫肌层 122/128  6/128  209.83  244.58  294.20
网膜 13/15  2/15  162.83  236.23  265.24
卵巢 80/81  1/81  219.28  259.00  331.64
胰腺 8/40  32/40  97.07  136.80  174.54
前列腺 47/47  0/47  318.31  397.81  525.43
直肠 38/46  8/46  143.79  188.95  232.42
右心房 87/162  75/162  104.22  132.56  161.54
皮肤 38/44  6/44  162.29  198.90  236.86
小肠 72/79  7/79  184.41  230.96  270.34
软组织 5/5  0/5  240.30  258.33  499.21
36/36  0/36  253.03  322.87  390.61
32/54  22/54  139.62  174.76  269.47
胸腺 70/70  0/70  352.12  438.94  511.11
甲状腺 25/25  0/25  177.32  211.27  276.25
子宫 54/56  2/56  243.74  312.71  387.50
WBC 21/25  4/25  149.63  176.72  209.49
工业实用性
实施例3
用于胃癌筛选的LBFL301,LBFL304,LBFL305或LBFL306mRNA的检测
如实施例1中所述,即通过利用GeneChip筛选mRNA样品,或者如实施例2中所述,即通过利用RNA印迹筛选mRNA样品,测定了对应于SEQ ID NO:1,3,5,7,9,11,13,17,19或21的mRNA在胃组织活检样品中的表达水平。或者,可以对得自恶性状态或非恶性状态的非-胃增生组织的样品进行分析。得自胃癌患者的胃组织样品和得自正常个体的胃组织样品可以被用作阳性和阴性对照。利用任何分析基因表达的手段进行检测,表达水平高于正常对照则是胃癌的表征或表示有可能患上胃癌。
尽管参照上述实施例已经对本发明进行了详尽的描述,但是应当理解可以进行各种修改而不偏离本发明的实质。因此,本发明仅仅通过下列权利要求得到限定。本申请中引用的所有专利、专利申请和公开出版物被本文全部引入作为参考。
序列表
<110>LG Life Sciences Ltd.
<120>胃癌相关的基因家族
<130>PC03015-LG
<150>US 60/402,904
<151>2002-08-14
<150>US 60/404,408
<151>2002-08-20
<150>US 60/405,304
<151>2002-08-23
<150>US 60/421,582
<151>2002-10-28
<160>22
<170>KopatentIn 1.71
<210>1
<211>1272
<212>DNA
<213>智人
<220>
<221>CDS
<222>(131)..(859)
<223>基因LBFL301,克隆AD12
<400>1
ggcgcgcggg tgaaaggcgc attgatgcag cctgcggcgg cctcggagcg cggcggagcc    60
agacgctgac cacgttcctc tcctcggtct cctccgcctc cagctccgcg ctgcccggca    120
gccgggagcc atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc   172
           Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg
             1               5                  10
ggc ctc ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc      220
Gly Leu Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala
 15                  20                  25                  30
tct gag atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag      268
Ser Glu Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu
                 35                  40                  45
gtg gtg gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg    316
Val Val Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val
             50                  55                  60
cct ggt cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct    364
Pro Gly Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro
         65                  70                  75
ggg atc cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg    412
Gly Ile Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu
     80                  85                  90
agg gaa agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca    460
Arg Glu Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser
 95                 100                 105                 110
tgg agt tca ttg aat tat ggc ata gat ctt ggg aaa att gcg gag tgt    508
Trp Ser Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys
                115                 120                 125
aca ttt aca aag atg cgt tca aat agt gct cta aga gtt ttg ttc agt    556
Thr Phe Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser
            130                 135                 140
ggc tca ctt cgg cta aaa tgc aga aat gca tgc tgt cag cgt tgg tat    604
Gly Ser Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr
        145                 150                 155
ttc aca ttc aat gga gct gaa tgt tca gga cct ctt ccc att gaa gct    652
Phe Thr Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala
    160                 165                 170
ata att tat ttg gac caa gga agc cct gaa atg aat tca aca att aat    700
Ile Ile Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn
175                 180                 185                 190
att cat cgc act tct tct gtg gaa gga ctt tgt gaa gga att ggt gct    748
Ile His Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala
                195                 200                 205
gga tta gtg gat gtt gct atc tgg gtt ggc act tgt tca gat tac cca    796
Gly Leu Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro
            210                 215                 220
aaa gga gat gct tct act gga tgg aat tca gtt tct cgc atc att att    844
Lys Gly Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile
        225                 230                 235
gaa gaa cta cca aaa t aaatgcttta attttcattt gctacctctt tttttattat    900
Glu Glu Leu Pro Lys
    240
gccttggaat ggttcactta aatgacattt taaataagtt tatgtataca tctgaatgaa    960
aagcaaagct aaatatgttt acagaccaaa gtgtgatttc acactgtttt taaatctagc    1020
attattcatt ttgcttcaat caaaagtggt ttcaatattt tttttagttg gttagaatac    1080
tttcttcata gtcacattct ctcaacctat aatttggaat attgttgtgg tcttttgttt    1140
tttctcttag tatagcattt ttaaaaaaat ataaaagcta ccaatctttg tacaatttgt    1200
aaatgttaag aatttttttt atatctgtta aataaaaatt atttccaaca accttaaaaa    1260
aaaaaaaaaa aa                                                        1272
<210>2
<211>243
<212>PRT
<213>智人
<400>2
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu
  1               5                  10                  15
Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu
             20                  25                  30
Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val
         35                  40                  45
Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly
     50                  55                  60
Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile
 65                  70                  75                  80
Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu
                 85                  90                  95
Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser
        100                     105                 110
Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Glu Cys Thr Phe
        115                 120                 125
Thr Lys Met Arg Ser Asn Ser Ala Leu Arg Val Leu Phe Ser Gly Ser
    130                 135                 140
Leu Arg Leu Lys Cys Arg Asn Ala Cys Cys Gln Arg Trp Tyr Phe Thr
145                 150                 155                 160
Phe Asn Gly Ala Glu Cys Ser Gly Pro Leu Pro Ile Glu Ala Ile Ile
                165                 170                 175
Tyr Leu Asp Gln Gly Ser Pro Glu Met Asn Ser Thr Ile Asn Ile His
            180                 185                 190
Arg Thr Ser Ser Val Glu Gly Leu Cys Glu Gly Ile Gly Ala Gly Leu
        195                 200                 205
Val Asp Val Ala Ile Trp Val Gly Thr Cys Ser Asp Tyr Pro Lys Gly
    210                 215                 220
Asp Ala Ser Thr Gly Trp Asn Ser Val Ser Arg Ile Ile Ile Glu Glu
225                 230                 235                 240
Leu Pro Lys
<210>3
<211>1355
<212>DNA
<213>智人
<220>
<221>CDS
<222>(174)..(584)
<223>基因LBFL301,克隆CH4
<400>3
ctccgggtgt cgcgggggcg ggaggaatta agggagggag agaggcgcgc gggtgaaagg    60
cgcattgatg cagcctgcgg cggcctcgga gcgcggcgga gccagacgct gaccacgttc    120
ctctcctcgg tctcctccgc ctccagctcc gcgctgcccg gcagccggga gcc           173
atg cga ccc cag ggc ccc gcc gcc tcc ccg cag cgg ctc cgc ggc ctc      221
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu
  1               5                  10                  15
ctg ctg ctc ctg ctg ctg cag ctg ccc gcg ccg tcg agc gcc tct gag      269
Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Ser Ala Ser Glu
             20                  25                  30
atc ccc aag ggg aag caa aag gcg cag ctc cgg cag agg gag gtg gtg     317
Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val
         35                  40                 45
gac ctg tat aat gga atg tgc tta caa ggg cca gca gga gtg cct ggt     365
Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly
    50                   55                  60
cga gac ggg agc cct ggg gcc aat ggc att ccg ggt aca cct ggg atc     413
Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile
 65                  70                  75                  80
cca ggt cgg gat gga ttc aaa gga gaa aag ggg gaa tgt ctg agg gaa     461
Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu
                 85                  90                  95
agc ttt gag gag tcc tgg aca ccc aac tac aag cag tgt tca tgg agt     509
Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser
    100                         105                 110
tca ttg aat tat ggc ata gat ctt ggg aaa att gcg aaa cac gtc aag     557
Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys
        115                 120                 125
agt caa tac gaa tgg aca gaa cta gtc tagaat gagtgtacat ttacaaagat    610
Ser Gln Tyr Glu Trp Thr Glu Leu Val
    130                 135
gcgttcaaat agtgctctaa gagttttgtt cagtggctca cttcggctaa aatgcagaaa   670
tgcatgctgt cagcgttggt atttcacatt caatggagct gaatgttcag gacctcttcc   730
cattgaagct ataatttatt tggaccaagg aagccctgaa atgaattcaa caattaatat   790
tcatcgcact tcttctgtgg aaggactttg tgaaggaatt ggtgctggat tagtggatgt   850
tgctatctgg gttggcactt gttcagatta cccaaaagga gatgcttcta ctggatggaa   910
ttcagtttct cgcatcatta ttgaagaact accaaaataa atgctttaat tttcatttgc   970
tacctctttt tttattatgc cttggaatgg ttcacttaaa tgacatttta aataagttta  1030
tgtatacatc tgaatgaaaa gcaaagctaa atatgtttac agaccaaagt gtgatttcac  1090
actgttttta aatctagcat tattcatttt gcttcaatca aaagtggttt caatattttt  1150
tttagttggt tagaatactt tcttcatagt cacattctct caacctataa tttggaatat  1210
tgttgtggtc ttttgttttt tctcttagta tagcattttt aaaaaaatat aaaagctacc  1270
aatctttgta caatttgtaa atgttaagaa ttttttttat atctgttaaa taaaaattat    1330
ttccaacaaa aaaaaaaaaa aaaaa                                          1355
<210>4
<211>137
<212>PRT
<213>智人
<400>4
Met Arg Pro Gln Gly Pro Ala Ala Ser Pro Gln Arg Leu Arg Gly Leu
  1               5                  10                  15
Leu Leu Leu Leu Leu Leu Gln Leu Pro Ala Pro Ser Set Ala Ser Glu
             20                  25                  30
Ile Pro Lys Gly Lys Gln Lys Ala Gln Leu Arg Gln Arg Glu Val Val
         35                  40                  45
Asp Leu Tyr Asn Gly Met Cys Leu Gln Gly Pro Ala Gly Val Pro Gly
     50                  55                  60
Arg Asp Gly Ser Pro Gly Ala Asn Gly Ile Pro Gly Thr Pro Gly Ile
 65                  70                  75                  80
Pro Gly Arg Asp Gly Phe Lys Gly Glu Lys Gly Glu Cys Leu Arg Glu
                 85                  90                  95
Ser Phe Glu Glu Ser Trp Thr Pro Asn Tyr Lys Gln Cys Ser Trp Ser
            100                 105                 110
Ser Leu Asn Tyr Gly Ile Asp Leu Gly Lys Ile Ala Lys His Val Lys
        115                 120                 125
Ser Gln Tyr Glu Trp Thr Glu Leu Val
    130                 135
<210>5
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(38)..(892)
<223>克隆LBFL304,ORF1
<400>5
ggatataagc agtgcaaccc aagacctaag aatcttg atg ttg gaa ata aag      52
                                         Met Leu Glu Ile Lys
                                           1               5
atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg  100
Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly
                 10                  15                  20
aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta  148
Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu
             25                  30                  35
gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac  196
Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn
         40                  45                  50
tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat  244
Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp
     55                  60                  65
aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat  292
Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn
 70                  75                  80                  85
aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag  340
Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu
                 90                  95                 100
cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca  388
His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro
            105                 110                 115
agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt  436
Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu
        120                 125                 130
caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt  484
Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu
    135                 140                 145
gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac  532
Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His
150                 155                 160                 165
tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg  580
Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu
                170                 175                 180
gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc  628
Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro
            185                 190                 195
agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag    676
Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln
        200                 205                 210
tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct    724
Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro
    215                 220                 225
gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc    772
Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr
230                 235                 240                 245
gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag    820
Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys
                250                 255                 260
gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc    868
Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser
            265                 270                 275
gcc tcc tct tca ctc tcc tct gat  tagatgaa actgttacct taccctaaac    920
Ala Ser Ser Ser Leu Ser Ser Asp
    280                    285
acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac  980
attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg  1040
tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg  1100
gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac  1160
agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg  1220
ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca  1280
cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc  1340
cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta  1400
gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa  1460
gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct  1520
tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg  1580
catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct  1640
gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata    1700
ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt    1760
tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt    1820
tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac    1880
aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt    1940
ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata    2000
tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag    2060
taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct    2120
tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt    2180
aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct    2240
ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg    2300
tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca    2360
agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata    2420
gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa    2480
actttaaaaa aaaaaaaaaa                                                2500
<210>6
<211>285
<212>PRT
<213>智人
<400>6
Met Leu Glu Ile Lys Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser
  1               5                  10                  15
Tyr Gly Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile
             20                  25                  30
Asn Trp Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr
         35                  40                  45
Glu Tyr Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr
    50                  55                  60
Leu Lys Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu
 65                  70              75                      80
Gln Asn Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu
                 85                  90                  95
Val Val Ser Ala Glu His Ala Val Ser Met Glu Met Ala Set Ala Asp
            100                 105                 110
Ser Asp Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr
        115                 120                 125
Leu Pro Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser
    130                 135                 140
Pro Glu Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His
145                 150                 155                 160
Leu Asn Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu
                165                 170                 175
Glu Thr Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu
            180                 185                 190
Leu Glu Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro
    195                     200                 205
Lys Glu Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp
    210                 215                 220
Gln Leu Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met
225                 230                 235                 240
Phe Thr Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly
                245                 250                 255
Lys Met Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln
            260                 265                 270
His Leu Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp
        275                 280                 285
<210>7
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(53)..(892)
<223>克隆LBFL304,ORF2
<400>7
ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa ag           52
atg gag gaa gct atg acc tac aca gag gac agt tat ggg atg gat ggg    100
Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly
  1               5                  10                  15
aag gtt aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta    148
Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu
             20                  25                  30
gag gag cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac    196
Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn
         35                  40                  45
tac aga ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat    244
Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp
     50                  55                  60
aga gta ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat    292
Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn
 65              70                      75                  80
aag act caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag    340
Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu
                 85                  90                  95
cac gct gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca    388
His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro
            100                 105                 110
agg cat aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt    436
Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu
        115                 120                 125
caa acc ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt    484
Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu
    130                 135                 140
gaa tgg aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac    532
Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His
145                 150                 155                 160
tgg aga aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg    580
Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu
                165                 170                 175
gaa acc gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc       628
Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro
            180                 185                 190
agc ccc agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag       676
Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln
        195                 200                 205
tat ggt ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct       724
Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro
    210                 215                 220
gtg cat tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc       772
Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr
225                 230                 235                 240
gca gaa cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag       820
Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys
                245                 250                 255
gtg gag aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc       868
Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser
            260                 265                 270
gcc tcc tct tca ctc tcc tct gat  tagatgaa actgttacct taccctaaac       920
Ala Ser Ser Ser Leu Ser Ser Asp
        275                 280
acagtatttc tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac     980
attccaagct accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg    1040
tgtgcacacg gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg    1100
gggatatttg ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac    1160
agtattatct tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg    1220
ctagaatggt gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca    1280
cttccactgc ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc    1340
cgtcattttc agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta    1400
gtcttatttt tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa    1460
gtcaaataaa cccccaagga cgacacacag tatggatcac atattgtttg acattaagct    1520
tttgccagaa aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg    1580
catggctaat aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct    1640
gctctctctg tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata    1700
ttttgggtta ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt    1760
tggttttctt ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt    1820
tacaccaaga acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac    1880
aagagaagtt aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt    1940
ctgatatctt ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata    2000
tccttgttgt gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag    2060
taccctccta ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct    2120
tcttattttt agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt    2180
aaactctttt aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct    2240
ttatcataga ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg    2300
tgggatgaca gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca    2360
agttattagg aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata    2420
gaacaattct ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa    2480
actttaaaaa aaaaaaaaaa                                                2500
<210>8
<211>280
<212>PRT
<213>智人
<400>8
Met Glu Glu Ala Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly
  1               5                  10                  15
Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu
             20                  25                  30
Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn
         35                  40                  45
Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp
     50                  55                 60
Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn
 65                  70                  75                  80
Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu
                 85                  90                  95
His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro
            100                 105                 110
Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu
    115                     120                 125
Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu
    130                 135                 140
Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His
145                 150                 155                 160
Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu
                165                 170                 175
Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro
            180                 185                 190
Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln
        195                 200                 205
Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro
    210                 215                 220
Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr
225                 230                 235                 240
Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys
                245                 250                 255
Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser
            260         265                         270
Ala Ser Ser Ser Leu Ser Ser Asp
        275                 280
<210>9
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(65)..(892)
<223>克隆LBFL304,ORF3
<400>9
ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga     60
agct       atg acc tac aca gag gac agt tat ggg atg gat ggg aag gtt   106
           Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val
             1               5                  10
aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag      154
Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu
 15                  20                  25                  30
cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga      202
Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg
                 35                  40                  45
ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta      250
Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val
             50                  55                  60
ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act      298
Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr
         65                  70                  75
caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct      346
Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala
     80                  85                  90
gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat      394
Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His
 95                 100                 105                 110
aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc      442
Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr
                115                 120                 125
ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg       490
Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp
            130                 135                 140
aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga       538
Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg
        145                 150                 155
aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc       586
Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr
    160                 165                 170
gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc       634
Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro
175                 180                 185                 190
agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt       682
Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly
                195                 200                 205
ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat       730
Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His
            210                 215                 220
tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa       778
Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu
        225                 230                 235
cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag       826
His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu
    240                 245                 250
aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc       874
Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser
255                 260                 265                 270
tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc     930
Ser Ser Leu Ser Ser Asp
                275
tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct     990
accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg    1050
gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg    1110
ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct    1170
tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt    1230
gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc    1290
ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc    1350
agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt    1410
tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa    1470
cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa    1530
aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat    1590
aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg    1650
tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta    1710
ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt    1770
ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga    1830
acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt    1890
aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt    1950
ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt    2010
gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta    2070
ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt    2130
agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt    2190
aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga    2250
ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca    2310
gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg    2370
aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct    2430
ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa    2490
aaaaaaaaaa                                                           2500
<210>10
<211>276
<212>PRT
<213>智人
<400>10
Met Thr Tyr Thr Glu Asp Ser Tyr Gly Met Asp Gly Lys Val Asn Gln
  1               5                  10                  15
Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu Leu His
             20                  25                  30
Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg Leu Ser
         35                  40                  45
Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val Phe Ala
     50                  55                  60
Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr Gln Thr
 65                  70                  75                  80
Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala Val Ser
                 85                  90                  95
Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His Lys Val
            100                 105                 110
Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr Leu His
        115         120                         125
Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp Asn Asn
    130                 135                 140
Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg Lys Thr
145                 150                 155                 160
Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr Asp Phe
                165                 170                 175
Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro Arg Leu
            180                 185                 190
Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly Gly Pro
        195                 200                 205
Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His Ser Asp
    210                 215                 220
Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu His Arg
225                 230                 235                 240
Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu Lys Asn
                245                 250                 255
His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser Ser Ser
            260                 265                 270
Leu Ser Ser Asp
        275
<210>11
<211>2500
<212>DNA
<213>智人
<220>
<221>CDS
<222>(92)..(892)
<223>克隆LBFL304,ORF4
<400>11
ggatataagc agtgcaaccc aagacctaag aatcttgatg ttggaaataa agatggagga    60
agctatgacc tacacagagg acagttatgg g           atg gat ggg aag gtt    106
                                             Met Asp Gly Lys Val
                                               1               5
aat cag ccc cgt ctc act gca gac atc aac tgg caa ggc cta gag gag    154
Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp Gln Gly Leu Glu Glu
                 10                  15                  20
cta cac agt gtg aat gaa aac atc tat gag tac aga caa aac tac aga    202
Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr Arg Gln Asn Tyr Arg
             25                  30                  35
ctt agt ctg gtg gac tgg act aat tac ttg aag gat tta gat aga gta    250
Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys Asp Leu Asp Arg Val
         40                  45                  50
ttt gca ctg ctg aag agt cac tat gag caa aat aaa aca aat aag act    298
Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn Lys Thr Asn Lys Thr
     55                  60                  65
caa act gct caa agt gac ggg ttc ttg gtt gtc tct gct gag cac gct    346
Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val Ser Ala Glu His Ala
 70                  75                  80                  85
gtg tca atg gag atg gcc tct gct gac tca gat gaa gac cca agg cat    394
Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp Glu Asp Pro Arg His
         90              95                             100
aag gtt ggg aaa aca cct cat ttg acc ttg cca gct gac ctt caa acc    442
Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro Ala Asp Leu Gln Thr
            105                 110                 115
ctg cat ttg aac cga cca aca tta agt cca gag agt aaa ctt gaa tgg    490
Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu Ser Lys Leu Glu Trp
        120                 125                 130
aat aac gac att cca gaa gtt aat cat ttg aat tct gaa cac tgg aga    538
Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn Ser Glu His Trp Arg
    135                 140                 145
aaa acc gaa aaa tgg acg ggg cat gaa gag act aat cat ctg gaa acc       586
Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr Asn His Leu Glu Thr
150                 155                 160                 165
gat ttc agt ggc gat ggc atg aca gag cta gag ctc ggg ccc agc ccc       634
Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu Leu Gly Pro Ser Pro
                170                 175                 180
agg ctg cag ccc att cgc agg cac ccg aaa gaa ctt ccc cag tat ggt       682
Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu Leu Pro Gln Tyr Gly
            185                 190                 195
ggt cct gga aag gac att ttt gaa gat caa cta tat ctt cct gtg cat       730
Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu Tyr Leu Pro Val His
        200                 205                 210
tcc gat gga att tca gtt cat cag atg ttc acc atg gcc acc gca gaa       778
Ser Asp Gly Ile Ser Val His Gln Met Phe Thr Met Ala Thr Ala Glu
    215                 220                 225
cac cga agt aat tcc agc ata gcg ggg aag atg ttg acc aag gtg gag       826
His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met Leu Thr Lys Val Glu
230                     235             240                 245
aag aat cac gaa aag gag aag tca cag cac cta gaa ggc agc gcc tcc       874
Lys Asn His Glu Lys Glu Lys Ser Gln His Leu Glu Gly Ser Ala Ser
                250                 255                 260
tct tca ctc tcc tct gat tagatgaa actgttacct taccctaaac acagtatttc     930
Ser Ser Leu Ser Ser Asp
            265
tttttaactt ttttatttgt aaactaataa aggtaatcac agccaccaac attccaagct     990
accctgggta cctttgtgca gtagaagcta gtgagcatgt gagcaagcgg tgtgcacacg    1050
gagactcatc gttataattt actatctgcc aagagtagaa agaaaggctg gggatatttg    1110
ggttggcttg gttttgattt tttgcttgtt tgtttgtttt gtactaaaac agtattatct    1170
tttgaatatc gtagggacat aagtatatac atgttatcca atcaagatgg ctagaatggt    1230
gcctttctga gtgtctaaaa cttgacaccc ctggtaaatc tttcaacaca cttccactgc    1290
ctgcgtaatg aagttttgat tcatttttaa ccactggaat ttttcaatgc cgtcattttc    1350
agttagatga ttttgcactt tgagattaaa atgccatgtc tatttgatta gtcttatttt    1410
tttattttta caggcttatc agtctcactg ttggctgtca ttgtgacaaa gtcaaataaa    1470
cccccaagga cgacacacag tatggatcac atattgtttg acattaagct tttgccagaa    1530
aatgttgcat gtgttttacc tcgacttgct aaaatcgatt agcagaaagg catggctaat    1590
aatgttggtg gtgaaaataa ataaataagt aaacaaaatg aagattgcct gctctctctg    1650
tgcctagcct caaagcgttc atcatacatc atacctttaa gattgctata ttttgggtta    1710
ttttcttgac aggagaaaaa gatctaaaga tcttttattt tcatcttttt tggttttctt    1770
ggcatgacta agaagcttaa atgttgataa aatatgacta gttttgaatt tacaccaaga    1830
acttctcaat aaaagaaaat catgaatgct ccacaatttc aacataccac aagagaagtt    1890
aatttcttaa cattgtgttc tatgattatt tgtaagacct tcaccaagtt ctgatatctt    1950
ttaaagacat agttcaaaat tgcttttgaa aatctgtatt cttgaaaata tccttgttgt    2010
gtattaggtt tttaaatacc agctaaagga ttacctcact gagtcatcag taccctccta    2070
ttcagctccc caagatgatg tgtttttgct taccctaaga gaggttttct tcttattttt    2130
agataattca agtgcttaga taaattatgt tttctttaag tgtttatggt aaactctttt    2190
aaagaaaatt taatatgtta tagctgaatc tttttggtaa ctttaaatct ttatcataga    2250
ctctgtacat atgttcaaat tagctgcttg cctgatgtgt gtatcatcgg tgggatgaca    2310
gaacaaacat atttatgatc atgaataatg tgctttgtaa aaagatttca agttattagg    2370
aagcatactc tgttttttaa tcatgtataa tattccatga tacttttata gaacaattct    2430
ggcttcagga aagtctagaa gcaatatttc ttcaaataaa aggtgtttaa actttaaaaa    2490
aaaaaaaaaa                                                           2500
<210>12
<211>267
<212>PRT
<213>智人
<400>12
Met Asp Gly Lys Val Asn Gln Pro Arg Leu Thr Ala Asp Ile Asn Trp
  1               5                  10                  15
Gln Gly Leu Glu Glu Leu His Ser Val Asn Glu Asn Ile Tyr Glu Tyr
             20                  25                  30
Arg Gln Asn Tyr Arg Leu Ser Leu Val Asp Trp Thr Asn Tyr Leu Lys
         35                  40                 45
Asp Leu Asp Arg Val Phe Ala Leu Leu Lys Ser His Tyr Glu Gln Asn
     50                  55                  60
Lys Thr Asn Lys Thr Gln Thr Ala Gln Ser Asp Gly Phe Leu Val Val
 65                  70                  75                  80
Ser Ala Glu His Ala Val Ser Met Glu Met Ala Ser Ala Asp Ser Asp
                 85                  90                  95
Glu Asp Pro Arg His Lys Val Gly Lys Thr Pro His Leu Thr Leu Pro
            100                 105                 110
Ala Asp Leu Gln Thr Leu His Leu Asn Arg Pro Thr Leu Ser Pro Glu
        115                 120                 125
Ser Lys Leu Glu Trp Asn Asn Asp Ile Pro Glu Val Asn His Leu Asn
    130                 135                 140
Ser Glu His Trp Arg Lys Thr Glu Lys Trp Thr Gly His Glu Glu Thr
145                 150                 155                 160
Asn His Leu Glu Thr Asp Phe Ser Gly Asp Gly Met Thr Glu Leu Glu
                165                 170                 175
Leu Gly Pro Ser Pro Arg Leu Gln Pro Ile Arg Arg His Pro Lys Glu
            180                 185                 190
Leu Pro Gln Tyr Gly Gly Pro Gly Lys Asp Ile Phe Glu Asp Gln Leu
        195                 200                 205
Tyr Leu Pro Val His Ser Asp Gly Ile Ser Val His Gln Met Phe Thr
    210                 215                 220
Met Ala Thr Ala Glu His Arg Ser Asn Ser Ser Ile Ala Gly Lys Met
225                 230             235                     240
Leu Thr Lys Val Glu Lys Asn His Glu Lys Glu Lys Ser Gln His Leu
                245                 250                 255
Glu Gly Ser Ala Ser Ser Ser Leu Ser Ser Asp
            260                 265
<210>13
<211>6405
<212>DNA
<213>智人
<220>
<221>CDS
<222>(49)..(1434)
<223>基因LBFL305
<400>13
gcgggaggat ggagcagtga gcgggtctgg gcggctgctg gcagcgcc  atg gag acg   57
                                                      Met Glu Thr
                                                        1
gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa    105
Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu
      5                  10                  15
gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa    153
Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys
 20                  25                  30                  35
ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag    201
Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu
                 40                  45                  50
acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc    249
Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu
             55                  60                  65
cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct    297
Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro
         70                  75                  80
cat gta gtc aaa tat tac ggc agt tat ttt aag aac aca gac tta tgg    345
His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp
     85                  90                  95
atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga    393
Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg
100                 105                 110                 115
tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa    441
Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln
                120                 125                 130
tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac    489
Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His
            135                 140                 145
cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca    537
Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala
        150                 155                160
aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc    585
Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala
    165                 170                 175
aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg    633
Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val
180                 185                 190                 195
att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga    681
Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly
                200                 205                 210
ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc    729
Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile
            215                 220                 225
cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca    777
His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr
        230                 235                 240
ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa    825
Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys
    245                 250                 255
cag tgt ctt  gta aag agc cct gag cag agg gcc aca gcc act cag ctc    873
Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu
260                 265                 270                 275
ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga     921
Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg
                280                 285                 290
gac  tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc    969
Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser
            295                 300                 305
cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat     1017
Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp
        310                 315                 320
gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc     1065
Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly
    325                 330                 335
act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att     1113
Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile
340                 345                 350                 355
gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat      1161
Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn
                360                 365                 370
gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc      1209
Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr
            375                 380                 385
atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa      1257
Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu
        390                 395                 400
aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg      1305
Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu
    405                 410                 415
aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt      1353
Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe
420                 425                         430         435
aaa act agc caa gaa cag cag tct gga aaa gac ata tgt atc caa aat      1401
Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys Ile Gln Asn
            440                     445                 450
tgc cag gga aac ctg ctg tgt aga tac gct ttc     tgagaa accacatgct    1450
Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe
            455                 460
taagagttgg acagtggagg accttcagaa gaggctcttg gccctggacc ccatgatgga    1510
gcaggagatt gaagagatcc ggcagaagta ccagtccaag cggcagccca tcctggatgc    1570
catagaggct aagaagagac ggcaacaaaa cttctgagca aggccaggct gtgagggccc    1630
cagctccacc caggctttgg gtgaattctg gatggcttgc ctcatgtttg ttagccagca    1690
cttctgctct gtcgtctctc cacagcacct ttgtgaactc aggaatgtgc gccagtggga    1750
agggctctct tgacagtcag cgtgccatct tgatgtgtgt atgtacattg gtcaggtata    1810
ttatctcaaa ggatttatat tggcgctttt aactcagagt tttaaacccc aggaacagag    1870
actcctagtt gagtgatagc tgggaaagtt ttacattgtc tgtttttctt ctcccaatag    1930
ctttcaattg ttctttctgg aagactttta aaaaaatata aatatgcata tatatatata    1990
aattataaat agattcccca cgcagtgtgg tggcatctct gtacaggtac agttttaaac    2050
ggtttgcctc ttttctgtaa gattatggta ctgtggaaca tgagggcaga ggacaccggg    2110
aggctgttag ggggtcactg aatcccagga gccaacctcc ccctttgcag ggctgcattt    2170
aaaaattagg tttgggacag ttcttgtacc gtggtttcag ccttgtgtgg tcatcactgg    2230
cttctggagc tattggtgat gtccaaggga aagctttgag agtttatgtt tactctttga    2290
gtcccaggag aagcctggca ccctctttgc aaattggcct ttgctctttc aatgcctttc    2350
atccatctcc actctctcaa ctgcctaaag tcacagcaca gatactgccc agtgccttaa    2410
gaggagacat gatctctacc agggactctc agcaaacacg ggactgtgtt cagtccacaa    2470
aggaaaagcg tttttgaagc tctcattgtt catgtaaaaa tcatacacgt ggcatgttgc    2530
tccacattcc ttacacacag gggtagaggg gattgctttt gtgacccacg ttcaaatatg    2590
tgactgtttt cttttctctt ttactgctaa gcagcctgga aaggataaat gaatattaga    2650
ctaagatttg ttttccagga ggctcaatct gaacacacag aatgtcagag ctggaaggga    2710
ctatagagat catctgatct gatcctcttg tacggatgat cgcaaaactg aggtgtagag    2770
aggggaatgg ccaaaatcac aaagcaagtt agcgttaaga gctgagacta gaattcaggg    2830
tcctcactcc caggccaccg aaccatgcag ccccttcttt gggggaagag acctgtgtca    2890
gtcttggtta attgttccag ggaaccttgc taacagaaac ttgctcttgc cttggctctt    2950
cagtagatga cctggctgta aagagattcc ctggacgagc cagatcattc agtttcagcg    3010
agtccttgag ctccacaaca tctaccagat atagcagaca agcacccatg gaggcaggtt    3070
tcgggcctga agcagatcag agggctttgc aaaagacagc atagagccat cttcctgcaa    3130
ctttacctct ttccctcaga tggggagcca tgactgggtt gcacctcagg atactgtaat    3190
ttgactccat aattgctttt gctcctgaaa cctgggaatc aatggaaagg cagggaatgt    3250
gcctcttctg tggccagatt ctgttatttg caattaaagc aagtttttaa aaaatgcaag    3310
aggcagttgt tagtcttcag ggcttggcaa ctgaaatagc tatgtggcgg atacggaaaa    3370
cagaggacaa tttgaggatc ttgctggaat aataaatgac agctaccatt tgttgagcac    3430
ctattatata tcaggcactg agctgggtag gctctaaact tcacaataac cctgtgactt    3490
aactacttta tctccatttt gtagttgaag aaataagttc agagagaaag attccttccc    3550
aaggtcatgc agctagtaaa tgatagaatc aggattcata gcatcactat agggggtcaa    3610
tatttacaca aaaaaggaaa gtcacaagcc tgtttaaaat gaagtgacca ccttttcttg    3670
catagactaa ataactcgaa ctggcatttt taggttggaa agacagctga attagtagtt    3730
aagtctgata gccaagtaag ttttaaaaac caaagcatcc aggatgcaca cccctgcacc    3790
atttgctgtg cgaattaata gttctgtctc tctctctctt tcttttttct ttttattctt    3850
tgagatggat tttcgctctt gtcgcccagg ctggagtaca atggcacgat cttggctcac    3910
tgcaacctcc gcctcccggg ttcaagcgat tcttctgctg ggattacagc atatgccacc    3970
atgcccagat tatttttttg tatttgtagt agagacgggg tttcaccatg tcagtcaggc    4030
tggtcttgaa ctcctgacct caggtgatcc acccgcctca gcctcccaca ctgctgggat    4090
tacaggcatg agccaccgct cctggcctct ctttcttttt taaacaaaga actttgcact    4150
tggccagaga ggaggagaaa gcccattttc tcccttccta agctagatcc aaataaaaga    4210
aagttcagtt ttcccccata actattcttg ggtcatgaac tttgatctgg agtttgtttt    4270
gtttcaggaa tgtgtgcacc cagcttgctg atccaacaaa gtctattgct taccagtcta    4330
gcttgatgaa gccttttggc cagaagtcaa tttgttttgg atcagagaaa tttcctgaca    4390
aggtatattt gttttctagt gacagaaagg caaaggaaca agtcctagtt gttgttgttg    4450
ttgttgaata ctaaatttaa gatatgtcag cttgctttca atgagccttg ggcttctgtt    4510
attgcttgag catttggaac tcgagcttcc agagaaattt gaggtcctcg cttgttctct    4570
gccttcaaga aacaatgacc tgattctgtc tttaaaaaaa aaatctcaga attctttttt    4630
tgtttgtgtt tttttttttg agacagagtc tcactctgtt gcccaggctg gagtgcagtg    4690
gcgccatctc ggctcactgc aacctccgcc tcccaggttc aagcaattct cctgcctcag    4750
cctcccaggt agctgccact acaggtgctg caccaccacg cccggctaat ttttgtattt    4810
ttagtagaga cagggtttca ccatattagc caggtgggtc ttgaactcct gaccttgtga    4870
tccacccgcc tcggcctccc aaagtgctgg gattacaggc gtgagccacc ttgcctggcc    4930
aaaaatctca gaattcttta agactgtttt aattgctcca tcagtaattt tgaagcactt    4990
tccttttttt ttttcccctt tttgtccctt tccccaagcc accaattgga tggatgaatg    5050
tttgacgggg aagaggaagg gtaggaggat gcatggatga gtggatgagt ggatcgatgg    5110
atgtattgat aaatagatag aaccagtcat ctgaagcaac ttaagaattg tagccttgac    5170
tccttgagac tgtagatttc gatccaggaa acatttattt agcacctgcc agatgccaga    5230
aatttatacc atttaaaact cagtaagtct tttaaatatc aggaaggaga gaagcgacat    5290
catgatacat cctatgggta ttaaaaagcc aatagaatat tatgaataat tttatgctaa    5350
taaatttaac aacttcaaca tcataaacaa attccttgaa aaataaaaag taccaaaatt    5410
cattcaagaa gaaatagata ccagcctgag caacatggca aaatcccatc tctacaaaac    5470
atcaaaaaaa aaaaattagt cgggcatggt ggtgcacacc tgtaatccca gcttgtcagg    5530
aggctgaagt gggaggatca cctgagccca gggaggtcaa ggatgcagtg agccatggtc    5590
tcaccactgc actctagcct aggtgacaga atgagacccc gtctcaaaaa aaaagaagaa    5650
gtagataatc tgaatagccc tatatctata gaaacttaat agtgctggga gatataggta    5710
ttattatcct cattttacag atgtgaaaat tgaggctcag agaagtaaag tctattgctc    5770
aaggtcatgt ggctagaata tggcagagcc atgattcaga tccaggtctt ctgattctta    5830
ttccagtgtc ctttctagca taccatgttg cctctaaaga ttgcagctcc ttatttacta    5890
gaaaattgtt cctgcccaat ctacatctcc acctcacccc atcttttctt aagcactatg    5950
tttgtgtttt tatcagtatt atattcattg tctttggaat acatgttctt gtttgtgttt    6010
ggaaaaaaaa tctcttttac cagcttgcac tcggaccaac ttggaaaaaa aaagcttaaa    6070
tgtttttgct atgtacagtt taaaaatgtg aagtttgtag ctttaacttt ttgtaagaaa    6130
atctaataac actggcttaa gtgctgactt gaaatgctat tttgtaaggt ttggatgtaa    6190
gtaatcaatt gaggtcagca gtttgtatga gacatagctt cctccattgc ccccactcct    6250
tttttctttt ttaagtttga gatgcttcct gtgtttttat gttagaattg ttgttctcct    6310
tcttttcttc ttcctatacc tcatcacgtt tgttttaaat aaactgtcct ttggaccaca    6370
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaa                               6405
<210>14
<211>462
<212>PRT
<213>智人
<400>14
Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys
  1               5                  10                  15
Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val
             20                  25                 30
Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile
         35                  40                  45
His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu
     50                  55                  60
Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys
 65                  70                  75                  80
Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr
                 85                  90                  95
Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp
            100                 105                 110
Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr
        115                 120                 125
Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg
    130                 135                 140
Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu
145                 150                 155                 160
Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp
                165                 170                 175
Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala
            180                 185                 190
Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp
        195                 200                 205
Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr
    210                 215                 220
Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro
225                 230                 235                 240
Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp
                245                 250                 255
Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala
            260                 265                 270
Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser
        275                 280                 285
Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg
    290                 295                 300
Gln Glu Ser Gln Gln Arg Glu ValAsp Gln Asp Asp Glu Glu Asn Ser
305                 310                315                 320
Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp
                325                 330                 335
Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn
            340                 345                 350
Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met
        355                 360                 365
Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg
    370                 375                 380
Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu
385                 390                 395                 400
Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro
                405                 410                 415
Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp
            420                 425                 430
Tyr Glu Phe Lys Thr Ser Gln Glu Gln Gln Ser Gly Lys Asp Ile Cys
        435                 440                 445
Ile Gln Asn Cys Gln Gly Asn Leu Leu Cys Arg Tyr Ala Phe
    450                 455                 460
<210>15
<211>1931
<212>DNA
<213>智人
<220>
<221>CDS
<222>(43)..(1503)
<223>Mst1/STK4基因
<400>15
cggcacgaga gtgagcgggt ctgggcggct gctggcagcg cc         atg gag acg    51
                                                       Met Glu Thr
                                                         1
gta cag ctg agg aac ccg ccg cgc cgg cag ctg aaa aag ttg gat gaa       99
Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys Leu Asp Glu
      5                  10                  15
gat agt tta acc aaa caa cca gaa gaa gta ttt gat gtc tta gag aaa      147
Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val Leu Glu Lys
  20                 25                  30                  35
ctt gga gaa ggg tcc tat ggc agc gta tac aaa gct att cat aaa gag      195
Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile His Lys Glu
                 40                  45                  50
acc ggc cag att gtt gct att aag caa gtt cct gtg gaa tca gac ctc      243
Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu Ser Asp Leu
             55                  60                  65
cag gag ata atc aaa gaa atc tct ata atg cag caa tgt gac agc cct      291
Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys Asp Ser Pro
         70                  75                  80
cat gta gtc aaa tat tat ggc agt tat ttt aag aac aca gac tta tgg      339
His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr Asp Leu Trp
     85                  90                  95
atc gtt atg gag tac tgt ggg gct ggt tct gta tct gat atc att cga      387
Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp Ile Ile Arg
100                 105                 110                 115
tta cga aat aaa acg tta aca gaa gat gaa ata gct aca ata tta caa      435
Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr Ile Leu Gln
                120         125                         130
tca act ctt aag gga ctt gaa tac ctt cat ttt atg aga aaa ata cac      483
Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg Lys Ile His
            135                 140                 145
cga gat atc aag gca gga aat att ttg cta aat aca gaa gga cat gca      531
Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu Gly His Ala
        150                 155                 160
aaa ctt gca gat ttt ggg gta gca ggt caa ctt aca gat acc atg gcc      579
Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp Thr Met Ala
    165                 170                 175
aag cgg aat aca gtg ata gga aca cca ttt tgg atg gct cca gaa gtg     627
Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala Pro Glu Val
180                 185                 190                 195
att cag gaa att gga tac aac tgt gta gca gac atc tgg tcc ctg gga     675
Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp Ser Leu Gly
                200                 205                 210
ata act gcc ata gaa atg gct gaa gga aag ccc cct tat gct gat atc     723
Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr Ala Asp Ile
            215                 220                 225
cat cca atg agg gca atc ttc atg att cct aca aat cct cct ccc aca     771
His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro Pro Pro Thr
        230                 235                 240
ttc cga aaa cca gag cta tgg tca gat aac ttt aca gat ttt gtg aaa     819
Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp Phe Val Lys
    245                 250                 255
cag tgt ctt gta aag agc cct gag cag agg gcc aca gcc act cag ctc     867
Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala Thr Gln Leu
260                 265                 270                 275
ctg cag cac cca ttt gtc agg agt gcc aaa gga gtg tca ata ctg cga     915
Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser Ile Leu Arg
                280                 285                 290
gac tta att aat gaa gcc atg gat gtg aaa ctg aaa cgc cag gaa tcc     963
Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg Gln Glu Ser
            295                 300                 305
cag cag cgg gaa gtg gac cag gac gat gaa gaa aac tca gaa gag gat    1011
Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser Glu Glu Asp
        310                 315                 320
gaa atg gat tct ggc acg atg gtt cga gca gtg ggt gat gag atg ggc    1059
Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp Glu Met Gly
    325                 330                 335
act gtc cga gta gcc agc acc atg act gat gga gcc aat act atg att    1107
Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn Thr Met Ile
340                 345                 350                 355
gag cac gat gac acg ttg cca tca caa ctg ggc acc atg gtg atc aat    1155
Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met Val Ile Asn
                360                 365                 370
gca gag gat gag gaa gag gaa gga act atg aaa aga agg gat gag acc    1203
Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg Asp Glu Thr
            375                 380                 385
atg cag cct gcg aaa cca tcc ttt ctt gaa tat ttt gaa caa aaa gaa     1251
Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu Gln Lys Glu
        390                 395                 400
aag gaa aac cag atc aac agc ttt ggc aag agt gta cct ggt cca ctg     1299
Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro Gly Pro Leu
    405                 410             415
aaa aat tct tca gat tgg aaa ata cca cag gat gga gac tac gag ttt     1347
Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp Tyr Glu Phe
420                 425                 430                 435
ctt aag agt tgg aca gtg gag gac ctt cag aag agg ctc ttg gcc ctg     1395
Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu Leu Ala Leu
                440                 445                 450
gac ccc atg atg gag cag gag att gaa gag atc cgg cag aag tac cag     1443
Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln Lys Tyr Gln
            455                 460                 465
tcc aag cgg cag ccc atc ctg gat gcc ata gag gct aag aag aga cgg     1491
Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys Lys Arg Arg
        470                 475                 480
caa caa aac ttc          tgagcaa ggccaggctg tgagggcccc agctccaccc   1540
Gln Gln Asn Phe
    485
aggctttggg tgaattctgg atggcttgcc tcatgtttgt tagccagcac ttctgctctg   1600
tcgtctctcc acagcacctt tgtgaactca ggaatgtgcg ccagtgggaa gggctctctt   1660
gacagtcagc gtgccatctt gatgtgtgta tgtacattgg tcaggtatat tatctcaaag   1720
gatttatatt ggcgctttta actcagagtt ttaaacccca ggaacagaga ctcctagttg   1780
agtgatagct gggaaagttt tacattgtct gtttttcttc tcccaatagc tttcaattgt   1840
tctttctgga agacttttaa aaaaatataa atatgcatat atatatataa attataaata   1900
gattccccac gcaggtggtg gcatctctgt a                                  1931
<210>16
<211>487
<212>PRT
<213>智人
<400>16
Met Glu Thr Val Gln Leu Arg Asn Pro Pro Arg Arg Gln Leu Lys Lys
  1               5                  10                  15
Leu Asp Glu Asp Ser Leu Thr Lys Gln Pro Glu Glu Val Phe Asp Val
             20                  25                  30
Leu Glu Lys Leu Gly Glu Gly Ser Tyr Gly Ser Val Tyr Lys Ala Ile
         35                  40                  45
His Lys Glu Thr Gly Gln Ile Val Ala Ile Lys Gln Val Pro Val Glu
     50                  55                  60
Ser Asp Leu Gln Glu Ile Ile Lys Glu Ile Ser Ile Met Gln Gln Cys
 65                  70                  75                  80
Asp Ser Pro His Val Val Lys Tyr Tyr Gly Ser Tyr Phe Lys Asn Thr
                 85                  90                  95
Asp Leu Trp Ile Val Met Glu Tyr Cys Gly Ala Gly Ser Val Ser Asp
            100                 105                 110
Ile Ile Arg Leu Arg Asn Lys Thr Leu Thr Glu Asp Glu Ile Ala Thr
        115                 120         125
Ile Leu Gln Ser Thr Leu Lys Gly Leu Glu Tyr Leu His Phe Met Arg
    130                 135                 140
Lys Ile His Arg Asp Ile Lys Ala Gly Asn Ile Leu Leu Asn Thr Glu
145                 150                 155                 160
Gly His Ala Lys Leu Ala Asp Phe Gly Val Ala Gly Gln Leu Thr Asp
                165                 170                 175
Thr Met Ala Lys Arg Asn Thr Val Ile Gly Thr Pro Phe Trp Met Ala
            180                 185                 190
Pro Glu Val Ile Gln Glu Ile Gly Tyr Asn Cys Val Ala Asp Ile Trp
        195                 200                 205
Ser Leu Gly Ile Thr Ala Ile Glu Met Ala Glu Gly Lys Pro Pro Tyr
    210                 215                  220
Ala Asp Ile His Pro Met Arg Ala Ile Phe Met Ile Pro Thr Asn Pro
225                 230                 235                 240
Pro Pro Thr Phe Arg Lys Pro Glu Leu Trp Ser Asp Asn Phe Thr Asp
                245                 250                 255
Phe Val Lys Gln Cys Leu Val Lys Ser Pro Glu Gln Arg Ala Thr Ala
            260                 265                 270
Thr Gln Leu Leu Gln His Pro Phe Val Arg Ser Ala Lys Gly Val Ser
        275                 280                 285
Ile Leu Arg Asp Leu Ile Asn Glu Ala Met Asp Val Lys Leu Lys Arg
    290                 295                 300
Gln Glu Ser Gln Gln Arg Glu Val Asp Gln Asp Asp Glu Glu Asn Ser
305                 310         315                         320
Glu Glu Asp Glu Met Asp Ser Gly Thr Met Val Arg Ala Val Gly Asp
                325                 330                 335
Glu Met Gly Thr Val Arg Val Ala Ser Thr Met Thr Asp Gly Ala Asn
            340                 345                 350
Thr Met Ile Glu His Asp Asp Thr Leu Pro Ser Gln Leu Gly Thr Met
        355                 360                 365
Val Ile Asn Ala Glu Asp Glu Glu Glu Glu Gly Thr Met Lys Arg Arg
    370                 375                 380
Asp Glu Thr Met Gln Pro Ala Lys Pro Ser Phe Leu Glu Tyr Phe Glu
385                 390                 395                 400
Gln Lys Glu Lys Glu Asn Gln Ile Asn Ser Phe Gly Lys Ser Val Pro
                405                 410                 415
Gly Pro Leu Lys Asn Ser Ser Asp Trp Lys Ile Pro Gln Asp Gly Asp
            420                 425                 430
Tyr Glu Phe Leu Lys Ser Trp Thr Val Glu Asp Leu Gln Lys Arg Leu
        435                 440                 445
Leu Ala Leu Asp Pro Met Met Glu Gln Glu Ile Glu Glu Ile Arg Gln
    450                 455                 460
Lys Tyr Gln Ser Lys Arg Gln Pro Ile Leu Asp Ala Ile Glu Ala Lys
465                 470                 475                 480
Lys Arg Arg Gln Gln Asn Phe
                485
<210>17
<211>1299
<212>DNA
<213>智人
<220>
<221>CDS
<222>(75)..(572)
<223>克隆no.LBFL306-EF3
<400>17
gcggcggcgg cttctcgagt cctccccgac gcgtcctcta ggccagcgag ccccgcgctc     60
tccggtgacg gacc       atg tcg gcg gcg gga gcg ggc gcg ggc gta gag    107
                      Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu
                        1               5                  10
gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac      155
Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His
             15                  20                  25
cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag      203
Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln
         30                  35                  40
cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg      251
Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp
     45                  50                  55
acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg      299
Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val
 60                  65                  70                  75
cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac      347
Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr
                 80                  85                  90
gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc      395
Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys
             95             100                     105
ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt      443
Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys
        110                 115                120
gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa      491
Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu
    125                 130                 135
tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gat aac ccc aag      539
Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Asn Pro Lys
140                 145                 150                 155
aaa ggc atc agg gtt ctg gag tgg ttg ttt gag   tgacacag cacaaggcct     590
Lys Gly Ile Arg Val Leu Glu Trp Leu Phe Glu
                160                 165
tgatttcatc atgcttttgc tgtggatgta gtgtagcttg ctgaacaggt ttatttcaca     650
gagcagtgta cattcttgtc ttccagggga acttcaacat ggagttactt ttgatccctc     710
agttttaatt cagtgtctaa agcctgagaa atgccagtgg cctgacagca gcagacattg     770
cacaaaccca gggtttccaa gagtgtgccc agtttctctt gaacctccag aattgtcatc     830
tgaaccattt ctataacaat ggcatcttaa atgggggtca tcagaatgta tttcctaatc     890
atattagtgt gggaacaaat cgaaagagat gcttggaaga ctcagaagac tttggagtaa     950
agaaagctag aactgaaggt gagaccgctt tgcgggtggg aagagcacac ttatttttcc    1010
tttctgtaat atgttttctt tttatggctg agcgcacctt cgagatgaga ccttcacttc    1070
aggtggtaat gcgcctggtg gattgtgcgg tgacggtgga gatttctcct gtactgccac    1130
tgcgaagatg ggacacttaa caaaagggaa tgtgagggaa atactgatgg cccaagtgta    1190
aatgtctatg tggaactttt tgagcaccca tgtttacctg ccgtgaatta gattttttaa    1250
tttgttgtat ctgtttgaaa tatatctatt aaagaaaaaa aaaaaaaaa                1299
<210>18
<211>166
<212>PRT
<213>智人
<400>18
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser
  1               5                  10                  15
Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp
             20                  25                  30
Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala
         35                  40                  45
His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp
     50                  55                  60
Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala
65                  70                  75                  80
Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala
                 85                  90                  95
Hi s Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile
             100                 105                 110
Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro
        115                 120                 125
Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu
    130                 135                 140
Val Ala Asn Gly Ala His Val Asp Asn Pro Lys Lys Gly Ile Arg Val
145                 150                 155                 160
Leu Glu Trp Leu Phe Glu
                165
<210>19
<211>2451
<212>DNA
<213>智人
<220>
<221>CDS
<222>(78)..(1337)
<223>克隆no.LBFL306-GC7
<400>19
gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg     60
ctctccggtg acggacc    atg tcg gcg gcg gga gcg ggc gcg ggc gta gag    110
                      Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu
                        1               5                  10
gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac      158
Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His
             15                  20                  25
cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag      206
Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln
         30                  35                  40
cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg      254
Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp
     45                  50                  55
acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg      302
Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val
 60                  65                  70                  75
cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac    350
Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr
                 80                  85                  90
gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc    398
Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys
             95             100                     105
ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt    446
Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys
    110                     115                 120
gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa    494
Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu
    125                 130                 135
tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gac ctg aga aat    542
Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Asp Leu Arg Asn
140                 145                 150                 155
gcc agt ggc ctg aca gca gca gac att gca caa acc cag ggt ttc caa    590
Ala Ser Gly Leu Thr Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln
                160                 165                 170
gag tgt gcc cag ttt ctc ttg aac ctc cag aat tgt cat ctg aac cat    638
Glu Cys Ala Gln Phe Leu Leu Asn Leu Gln Asn Cys His Leu Asn His
            175                 180                 185
ttc tat aac aat ggc atc tta aat ggg ggt cat cag aat gta ttt cct    686
Phe Tyr Asn Asn Gly Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro
        190                 195                 200
aat cat att agt gtg gga aca aat cga aag aga tgc ttg gaa gac tca    734
Asn His Ile Ser Val Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser
    205                 210                 215
gaa gac ttt gga gta aag aaa gct aga act gaa gct caa agc ttg gat    782
Glu Asp Phe Gly Val Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp
220                 225                 230                 235
tct gcc gtg cca ctc acg aat ggc gac aca gaa gac gat gct gac aaa    830
Ser Ala Val Pro Leu Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys
    240             245                                 250
atg cac gtt gat agg gag ttt gct gtt gta aca gat atg aaa aac agt    878
Met His Val Asp Arg Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser
            255                 260                 265
agc tcc gta tcg aat aca ttg aca aat gga tgt gtc atc aat gga cat       926
Ser Ser Val Ser Asn Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His
        270                 275                 280
ttg gac ttc ccc tcc acg acc ccg ctc agt ggg atg gaa agc agg aat       974
Leu Asp Phe Pro Ser Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn
    285                 290                 295
ggc cag tgc ttg aca gga act aac gga att agc agt gga tta gcc cca      1022
Gly Gln Cys Leu Thr Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro
300                 305                 310                 315
gga cag ccg ttt ccg agt agc cag ggt tct ctc tgc att agt ggg act      1070
Gly Gln Pro Phe Pro Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr
                320                 325                 330
gag gag cca gag aag acc ctg aga gct aac cct gag ttg tgc ggt tct      1118
Glu Glu Pro Glu Lys Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser
    335                         340                 345
ctg cac ctg aac ggg agt cca agt agc tgc ata gcc agt agg cct tcc      1166
Leu His Leu Asn Gly Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser
        350                 355                 360
tgg gtg gaa gac att ggg gat aac ctg tac tat gga cac tac cac ggg      1214
Trp Val Glu Asp Ile Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly
    365                 370                 375
ttt ggg gac act gct gaa agc atc cca gaa ctg aac agt gtg gtc gag      1262
Phe Gly Asp Thr Ala Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu
380                 385                 390                 395
cat tcc aag tcc gtg aag gtg cag gag cgg tac gac agt gcc gtg ctg      1310
His Ser Lys Ser Val Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu
                400                 405                 410
ggc acc atg cac ctg cac cac ggc tcc     tag agacgctgac ctggctctcg    1360
Gly Thr Met His Leu His His Gly Ser
            415                 420
gaaacgcagg agtccttcct ggtagccagc tcagaatacc catgtagcag caacttgaac    1420
gaatgtcaca acttgtacgt tttttatata cttcaacttt ctgaaaaagt aaacttcgac    1480
aagttcccag caactgcttg tttgtgcatg agtagggctt actaagtgca tagatgtttc    1540
tacagtgagg tgtccttttt ataaggtgca cttttggagt tcttctgatg ccaatctcaa    1600
cattgtcttt ttaatactgt caccagatat tgccattttt ctttttgtta aaagattata    1660
tgatcaagat aaattggggt ggtaaatcag gtgcctggta atttatctct ttgcacatgg    1720
gcatcatttt aaaaagcttg cttccactct tttctgtaga atttgacgga acacagctat    1780
ttccctatgc aaggtacagc cttacaaaga tttctgcagt gatttgtgtg aagaagagaa    1840
cgtttgtctt tttcaatgaa gctttgcaga tcaccatgtg gttgaaggtt ttagttgtgg    1900
acacagtggt ccctccttaa tgatgaagat cactgccttg ggcttcatgg aaaacaggcc    1960
cagcctgggg ctgcgtttgg atttattgtt tttattccac acttcctact tggtctctgg    2020
aagttttacc acatgtaaca gattccttta tatgtagtgg aaatcactat ttgtagaaac    2080
tgtcaggtca aaatatttaa ctgactgttg acatgtattt tcttttttcc ttgtttttgt    2140
tttttagggt tttctgcttt aagatatata ccactatgta tatccagtta actgagagaa    2200
ttttgactct cttaataaaa ctgcattaag tttttgattt tgtagaaatt agcttttgtc    2260
taggcaacta gtggttatac tctgcaaata ttgtaatgaa tttttacttt tttgattttt    2320
gtaataaaaa ttggtgcaga taaaatgtca aatgaacaaa ccagtgttct aagagtgtta    2380
ctaacatttt gttctaaaac tgtccttcac aaattgaata aaaaactctc acactcaaaa    2440
aaaaaaaaaa a                                                         2451
<210>20
<211>420
<212>PRT
<213>智人
<400>20
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser
  1               5                  10                  15
Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His Arg Ala Cys Arg Asp
             20                  25                  30
Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala
         35                  40                  45
His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp
     50                  55                  60
Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala
 65                  70                  75                  80
Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala
                 85                  90                  95
His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile
            100                 105                 110
Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro
        115                 120                 125
Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu
    130                 135                 140
Val Ala Asn Gly Ala His Val Asp Leu Arg Asn Ala Ser Gly Leu Thr
145                 150                 155                 160
Ala Ala Asp Ile Ala Gln Thr Gln Gly Phe Gln Glu Cys Ala Gln Phe
                165                 170                 175
Leu Leu Asn Leu Gln Asn Cys His Leu Asn His Phe Tyr Asn Asn Gly
            180                 185                 190
Ile Leu Asn Gly Gly His Gln Asn Val Phe Pro Asn His Ile Ser Val
        195                 200                 205
Gly Thr Asn Arg Lys Arg Cys Leu Glu Asp Ser Glu Asp Phe Gly Val
    210                 215                 220
Lys Lys Ala Arg Thr Glu Ala Gln Ser Leu Asp Ser Ala Val Pro Leu
225                 230                 235                 240
Thr Asn Gly Asp Thr Glu Asp Asp Ala Asp Lys Met His Val Asp Arg
                245                 250                 255
Glu Phe Ala Val Val Thr Asp Met Lys Asn Ser Ser Ser Val Ser Asn
            260                 265                 270
Thr Leu Thr Asn Gly Cys Val Ile Asn Gly His Leu Asp Phe Pro Ser
        275                 280                 285
Thr Thr Pro Leu Ser Gly Met Glu Ser Arg Asn Gly Gln Cys Leu Thr
    290                 295                 300
Gly Thr Asn Gly Ile Ser Ser Gly Leu Ala Pro Gly Gln Pro Phe Pro
305                 310                 315                 320
Ser Ser Gln Gly Ser Leu Cys Ile Ser Gly Thr Glu Glu Pro Glu Lys
                325                 330                 335
Thr Leu Arg Ala Asn Pro Glu Leu Cys Gly Ser Leu His Leu Asn Gly
            340                 345                 350
Ser Pro Ser Ser Cys Ile Ala Ser Arg Pro Ser Trp Val Glu Asp Ile
        355                 360                 365
Gly Asp Asn Leu Tyr Tyr Gly His Tyr His Gly Phe Gly Asp Thr Ala
    370                 375                 380
Glu Ser Ile Pro Glu Leu Asn Ser Val Val Glu His Ser Lys Ser Val
385                 390                 395                 400
Lys Val Gln Glu Arg Tyr Asp Ser Ala Val Leu Gly Thr Met His Leu
                405                 410                 415
His His Gly Ser
            420
<210>21
<211>1194
<212>DNA
<213>智人
<220>
<221>CDS
<222>(78)..(737)
<223>克隆no.LBFL-306-GE2
<400>21
gctgcggcgg cggcttctcg agtcctcccc gacgcgtcct ctaggccagc gagccccgcg    60
ctctccggtg acggacc    atg tcg gcg gcg gga gcg ggc gcg ggc gta gag    110
                      Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu
                        1               5                  10
gcg ggc ttc tcc agc gag gag ctg ctc tcg ctc cgt ttc ccg ctg cac      158
Ala Gly Phe Ser Ser Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu His
             15                  20                  25
cgc gcc tgc cgc gac ggg gac ctg gcc acg ctc tgc tcg ctg ctg cag    206
Arg Ala Cys Arg Asp Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln
         30                  35                  40
cag aca ccc cac gcc cac ctg gcc tct gag gac tcc ttc tat ggc tgg    254
Gln Thr Pro His Ala His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp
     45                  50                  55
acg ccc gtg cac tgg gcc gcg cat ttc ggc aag ttg gag tgc tta gtg    302
Thr Pro Val His Trp Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val
 60                  65                  70                  75
cag ttg gtg aga gcg gga gcc aca ctc aac gtc tcc acc aca cgg tac      350
Gln Leu Val Arg Ala Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr
                 80                  85                  90
gcg cag acg cca gcc cac att gca gcc ttt ggg gga cat cct cag tgc      398
Ala Gln Thr Pro Ala His Ile Ala Ala Phe Gly Gly His Pro Gln Cys
             95                 100                 105
ctg gtc tgg ctg att caa gca gga gcc aac att aac aaa ccg gat tgt      446
Leu Val Trp Leu Ile Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys
        110                 115                 120
gag ggt gaa act ccc att cac aag gca gct cgc tct ggg agc cta gaa      494
Glu Gly Glu Thr Pro Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu
    125                 130                 135
tgc atc agt gcc ctt gtg gcg aat ggg gct cac gtc gag ttt att tca      542
Cys Ile Ser Ala Leu Val Ala Asn Gly Ala His Val Glu Phe Ile Ser
140                 145                 150                 155
cag agc agt gta cat tct tgt ctt cca ggg gaa ctt caa cat gga gtt      590
Gln Ser Ser Val His Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val
                160                 165                 170
act ttt gat ccc tca gtt tta att cag tgt cta aag cct gag aaa tgc      638
Thr Phe Asp Pro Ser Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys
            175                 180                 185
cag tgg cct gac agc agc aga cat tgc aca aac cca ggg ttt cca aga      686
Gln Trp Pro Asp Ser Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg
        190                 195                 200
gtg tgc cca gtt tct ctt gaa cct cca gaa ttg tca tct gaa cca ttt      734
Val Cys Pro Val Ser Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe
    205                 210                 215
cta    taa caatggcatc ttaaatgggg gtcatcagaa tgtatttcct aatcatatta    790
Leu
220
gtgtgggaac aaatcgaaag agatgcttgg aagactcaga agactttgga gtaaagaaag    850
ctagaactga aggtgagacc gctttgcggg tgggaagagc acacttattt ttcctttctg    910
taatatgttt tctttttatg gctgagcgca ccttcgagat gagaccttca cttcaggtgg    970
taatgcgcct ggtggattgt gcggtgacgg tggagatttc tcctgtactg ccactgcgaa   1030
gatgggacac ttaacaaaag ggaatgtgag ggaaatactg atggcccaag tgtaaatgtc    1090
tatgtggaac tttttgagca cccatgttta cctgccgtga attagatttt ttaatttgtt    1150
gtatctgttt gaaatatatc tattaaagaa aaaaaaaaaa aaaa                     1194
<210>22
<211>220
<212>PRT
<213>智人
<400>22
Met Ser Ala Ala Gly Ala Gly Ala Gly Val Glu Ala Gly Phe Ser Ser
  1               5                  10                  15
Glu Glu Leu Leu Ser Leu Arg Phe Pro Leu Hi s Arg Ala Cys Arg Asp
             20                  25                   30
Gly Asp Leu Ala Thr Leu Cys Ser Leu Leu Gln Gln Thr Pro His Ala
         35                 40                   45
His Leu Ala Ser Glu Asp Ser Phe Tyr Gly Trp Thr Pro Val His Trp
     50                  55                  60
Ala Ala His Phe Gly Lys Leu Glu Cys Leu Val Gln Leu Val Arg Ala
 65                  70                  75                  80
Gly Ala Thr Leu Asn Val Ser Thr Thr Arg Tyr Ala Gln Thr Pro Ala
                 85                  90                  95
His Ile Ala Ala Phe Gly Gly His Pro Gln Cys Leu Val Trp Leu Ile
            100                 105                 110
Gln Ala Gly Ala Asn Ile Asn Lys Pro Asp Cys Glu Gly Glu Thr Pro
    115                     120                 125
Ile His Lys Ala Ala Arg Ser Gly Ser Leu Glu Cys Ile Ser Ala Leu
    130                 135                 140
Val Ala Asn Gly Ala His Val Glu Phe Ile Ser Gln Ser Ser Val His
145                 150                 155                 160
Ser Cys Leu Pro Gly Glu Leu Gln His Gly Val Thr Phe Asp Pro Ser
                165                 170                 175
Val Leu Ile Gln Cys Leu Lys Pro Glu Lys Cys Gln Trp Pro Asp Ser
            180                 185                 190
Ser Arg His Cys Thr Asn Pro Gly Phe Pro Arg Val Cys Pro Val Ser
        195                 200                205
Leu Glu Pro Pro Glu Leu Ser Ser Glu Pro Phe Leu
    210                 215                 220

Claims (40)

1.一种分离的核酸分子,该分离的核酸分子选自:(a)含有SEQID NO:3,5,7,9,11,13,17或19的分离核酸分子;(b)编码SEQID NO:4,14或18的氨基酸序列的分离核酸分子;(c)编码在胃癌中被表达的蛋白并与SEQ ID NO:3或17的全长具有至少约92%核苷酸序列相同性的分离核酸分子;(d)编码在胃癌中被表达的蛋白并与SEQID NO:13的全长具有至少约95%核苷酸序列相同性的分离核酸分子;(e)含有(a),(b),(c)或(d)的核酸分子的互补链的分离核酸分子。
2.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO:3的174-584位核苷酸。
3.如权利要求1所述的分离的核酸分子,其中所述核酸分子由SEQ ID NO:3的174-584位核苷酸组成。
4.如权利要求1所述的分离的核酸分子,其中所述核酸分子包含SEQ ID NO:3的174-587位核苷酸。
5.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下:由SEQ ID NO:5的38-892位核苷酸组成的核酸分子和由SEQID NO:5的38-895位核苷酸组成的核酸分子。
6.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下:由SEQ ID NO:7的53-892位核苷酸组成的核酸分子和由SEQID NO:7的53-895位核苷酸组成的核酸分子。
7.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下:由SEQ ID NO:9的65-892位核苷酸组成的核酸分子和由SEQID NO:9的65-895位核苷酸组成的核酸分子。
8.如权利要求1所述的分离的核酸分子,其中所述核酸分子选自以下:由SEQ ID NO:11的92-892位核苷酸组成的核酸分子和由SEQ ID NO:11的92-895位核苷酸组成的核酸分子。
9.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO:13的49-1434位核苷酸。
10.如权利要求1所述的分离的核酸分子,其中所述核酸分子由SEQ ID NO:13的49-1437位核苷酸组成。
11.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO:13的49-1437位核苷酸。
12.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO:17的75-575位核苷酸。
13.如权利要求1所述的分离的核酸分子,其中所述核酸分子由SEQ ID NO:17的75-575位核苷酸组成。
14.如权利要求1所述的分离的核酸分子,其中所述核酸分子含有SEQ ID NO:17的75-572位核苷酸。
15.如权利要求1-14中任一项所述的分离的核酸分子,其中所述核酸分子与一个或多个表达控制元件进行可操作性的连接。
16.一种含有权利要求1-14中任一项所述的分离的核酸分子的载体。
17.一种被转化而含有权利要求1-14中任一项所述的核酸分子的宿主细胞。
18.一种含有权利要求16的载体的宿主细胞。
19.如权利要求18所述的宿主细胞,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
20.一种用于生产多肽或蛋白的方法,包括在由核酸编码的所述多肽或蛋白表达的条件下培养被权利要求1-14中任一项所述的核酸分子转化的宿主细胞。
21.如权利要求20所述的方法,其中所述宿主细胞选自原核宿主细胞和真核宿主细胞。
22.一种由权利要求21所述的方法生产的分离的多肽或蛋白。
23.一种分离的多肽或蛋白,选自以下:(a)含SEQ ID NO:4,6,8,10,12,14或18的氨基酸序列的分离多肽或蛋白;(b)与SEQ IDNO:4具有至少约92%氨基酸序列相同性的分离多肽或蛋白;(c)由SEQID NO:4的31-137位氨基酸组成的分离多肽或蛋白;(d)含SEQ ID NO:6,8,10或12的至少10个氨基酸的片段的分离多肽;(e)含SEQ IDNO:6,8,10或12的保守氨基酸取代物的分离多肽;(f)含SEQ ID NO:6,8,10或12的自然存在的氨基酸序列变异体的分离多肽;(g)与SEQID NO:6,8,10或12具有至少约75%氨基酸序列相同性的分离多肽;(h)与SEQ ID NO:14具有至少约95%氨基酸序列相同性的分离多肽或蛋白;和(i)与SEQ ID NO:18具有至少约92%氨基酸序列相同性的分离多肽或蛋白。
24.一种与权利要求23所述的多肽或蛋白结合的或与含有SEQ IDNO:2的氨基酸序列的分离多肽或蛋白结合的分离的抗体或抗原-结合型抗体片段。
25.如权利要求24所述的抗体,其中所述抗体是单克隆或多克隆抗体。
26.调控编码权利要求23的蛋白、含SEQ ID NO:2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的核酸分子表达的介质的鉴定方法,该方法包括:
使表达所述核酸的细胞与所述介质接触;和
确定所述介质是否调控所述核酸的表达,从而鉴定出调控编码所述蛋白的核酸分子的表达的介质。
27.调控权利要求23的蛋白、含SEQ ID NO:2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的水平或至少一种活性的介质的鉴定方法,该方法包括:
使表达所述蛋白的细胞与所述介质接触;和
确定所述介质是否调控所述蛋白的水平或至少一种活性,从而鉴定出调控所述蛋白的水平或至少一种活性的介质。
28.如权利要求27的方法,其中所述介质调控所述蛋白的一种活性。
29.一种鉴定权利要求23的蛋白或含SEQ ID NO:2所示氨基酸序列的蛋白的结合配偶体的方法,该方法包括以下步骤:
使所述蛋白与潜在的结合配偶体接触;和
确定所述潜在的结合配偶体是否与所述蛋白结合,从而鉴定出所述蛋白的结合配偶体。
30.对编码权利要求23的蛋白、含SEQ ID NO:2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的核酸分子的表达进行调控的方法,该方法包括以下步骤:
施用有效量的调控编码所述蛋白的核酸分子的表达的介质。
31.对权利要求23的蛋白、含SEQ ID NO:2,20或22所示氨基酸序列的蛋白、或Mst1蛋白或Mst1剪接变体蛋白的至少一种活性进行调控的方法,该方法包括以下步骤:
施用有效量的调控所述蛋白的至少一种活性的介质。
32.一种经修饰而含有权利要求1-14中的任一项所述的核酸分子的非人类转基因动物。
33.如权利要求32所述的转基因动物,其中所述核酸分子含有防止被编码蛋白进行表达的突变。
34.在受试者中诊断疾病状态的方法,包括:
确定权利要求1-14中的任一项所述的核酸分子或编码Mst1蛋白或Mst1剪接变体蛋白的核酸分子的表达水平,或者确定权利要求23的蛋白或含SEQ ID NO:2,20或22所示氨基酸序列的蛋白或Mst1蛋白或Mst1剪接变体蛋白的表达水平。
35.如权利要求34所述的方法,其中所述疾病状态是胃癌。
36.如权利要求34所述的方法,其中所述疾病状态是晚期胃癌。
37.如权利要求34所述的方法,其中所述疾病状态是恶性肿瘤。
38.如权利要求37所述的方法,其中所述恶性肿瘤发生在软组织、骨头、乳房、子宫颈、结肠、子宫内膜、食道、肾、喉、肝脏、肺、网膜、卵巢、胰腺、直肠、甲状腺、子宫肌层、前列腺、皮肤、小肠、膀胱、脾或胃。
39.如权利要求16-21或24-25中任一项所述的方法,其中所述剪接变体是SEQ ID NO:13或SEQ ID NO:14。
40.含有稀释剂和多肽或蛋白的组合物,其中所述多肽或蛋白选自以下:(a)含SEQ ID NO:4,6,8,10,12,14,18,20或22所示氨基酸序列的分离多肽或蛋白;(b)与SEQ ID NO:4或18具有至少约92%氨基酸序列相同性的分离多肽或蛋白;(c)由SEQ ID NO:4的31-137位氨基酸组成的分离多肽或蛋白;(d)含SEQ ID NO:6,8,10或12的至少10个氨基酸的片段的分离多肽;(e)含SEQ ID NO:6,8,10或12的保守氨基酸取代物的分离多肽;(f)含SEQ ID NO:6,8,10或12的自然存在的氨基酸序列变异体的分离多肽;(g)与SEQ ID NO:6,8,10或12具有至少约75%氨基酸序列相同性的分离多肽;(h)与SEQ ID NO:14具有至少约95%氨基酸序列相同性的分离多肽。
CNA03821976XA 2002-08-14 2003-08-14 胃癌相关的基因家族 Pending CN1681835A (zh)

Applications Claiming Priority (8)

Application Number Priority Date Filing Date Title
US40290402P 2002-08-14 2002-08-14
US60/402,904 2002-08-14
US40440802P 2002-08-20 2002-08-20
US60/404,408 2002-08-20
US40530402P 2002-08-23 2002-08-23
US60/405,304 2002-08-23
US42158202P 2002-10-28 2002-10-28
US60/421,582 2002-10-28

Publications (1)

Publication Number Publication Date
CN1681835A true CN1681835A (zh) 2005-10-12

Family

ID=31892257

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA03821976XA Pending CN1681835A (zh) 2002-08-14 2003-08-14 胃癌相关的基因家族

Country Status (7)

Country Link
US (1) US20060121471A1 (zh)
EP (1) EP1546171A4 (zh)
JP (1) JP2006508644A (zh)
KR (1) KR20050037574A (zh)
CN (1) CN1681835A (zh)
AU (1) AU2003251202A1 (zh)
WO (1) WO2004016636A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2389010T3 (es) * 2007-07-16 2012-10-22 Dentalpoint Ag Implante dental
US10190986B2 (en) 2011-06-06 2019-01-29 Abbott Laboratories Spatially resolved ligand-receptor binding assays

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1090299A1 (en) * 1998-06-26 2001-04-11 Biomira, Inc. Methods of detecting t-cell activation
JP2002521055A (ja) * 1998-07-30 2002-07-16 ヒューマン ジノーム サイエンシーズ, インコーポレイテッド 98個のヒト分泌タンパク質
NZ531664A (en) * 1998-09-01 2005-07-29 Genentech Inc Pro1317 polypeptides and sequences thereof with homology to the semaphorin B glycoprotein family
WO2001053455A2 (en) * 1999-12-23 2001-07-26 Hyseq, Inc. Novel nucleic acids and polypeptides
EP1165766A2 (en) * 1999-03-05 2002-01-02 Incyte Pharmaceuticals, Inc. Human secretory proteins
ATE399793T1 (de) * 1999-04-02 2008-07-15 Corixa Corp Verbindungen und verfahren für therapie und diagnose von lungenkrebs
CA2374341A1 (en) * 1999-05-20 2000-11-30 Takeda Chemical Industries, Ltd. Novel polypeptide
AU2001251223A1 (en) * 2000-03-30 2001-10-15 Diadexus, Inc. Compositions and methods for diagnosing, monitoring, staging, imaging and treating stomach cancer

Also Published As

Publication number Publication date
EP1546171A1 (en) 2005-06-29
EP1546171A4 (en) 2008-01-02
JP2006508644A (ja) 2006-03-16
KR20050037574A (ko) 2005-04-22
AU2003251202A1 (en) 2004-03-03
WO2004016636A1 (en) 2004-02-26
US20060121471A1 (en) 2006-06-08

Similar Documents

Publication Publication Date Title
CN1310942C (zh) 校正基因
CN1839205A (zh) 用于鉴定、评估、预防和治疗乳腺癌的组合物、试剂盒及方法
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1289670C (zh) 用于调节癌细胞增生的多核苷酸
CN1170850C (zh) 人血管生成素样蛋白和编码序列及其用途
CN1681835A (zh) 胃癌相关的基因家族
CN1169954C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1399644A (zh) 新的人g蛋白偶联受体
CN1170848C (zh) 新的人肝癌相关蛋白及其编码序列
CN1246457C (zh) 人tsc403基因和人ing1l基因
CN1199998C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1303102C (zh) 利用人和鼠Rhor基因及其编码产物诊断和治疗秃发的方法
CN1681834A (zh) 肝癌相关的基因家族
CN1169958C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1155616C (zh) 具有促进癌细胞生长功能的新的人蛋白及其编码序列
CN1209373C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1194989C (zh) 具有抑制癌细胞生长功能的新的人蛋白及其编码序列
CN1705745A (zh) 与癌症相关的基因家族
CN1160472C (zh) 人类17号染色体1区3带3亚带区域内人肿瘤相关基因及检测试剂盒
CN1209372C (zh) 人类17p13.3区域内人肿瘤相关基因CT120及其编码蛋白
CN1169955C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1155613C (zh) 人类17号染色体短臂1区3带3亚带区域内人肿瘤相关基因和编码蛋白
CN1169957C (zh) 编码具有抑制癌细胞生长功能的人蛋白的多核苷酸
CN1170844C (zh) 人长寿保障蛋白和编码序列及其用途

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication