[go: up one dir, main page]

CN101160524A - 用于生物样品分类的组合物和方法 - Google Patents

用于生物样品分类的组合物和方法 Download PDF

Info

Publication number
CN101160524A
CN101160524A CNA2006800126573A CN200680012657A CN101160524A CN 101160524 A CN101160524 A CN 101160524A CN A2006800126573 A CNA2006800126573 A CN A2006800126573A CN 200680012657 A CN200680012657 A CN 200680012657A CN 101160524 A CN101160524 A CN 101160524A
Authority
CN
China
Prior art keywords
binding activity
epitopes
samples
type
epitope
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800126573A
Other languages
English (en)
Inventor
T·纽曼
M·波尔德
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
CeMines Inc
Original Assignee
CeMines Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by CeMines Inc filed Critical CeMines Inc
Publication of CN101160524A publication Critical patent/CN101160524A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/543Immunoassay; Biospecific binding assay; Materials therefor with an insoluble carrier for immobilising immunochemicals
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/68Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing involving proteins, peptides or amino acids
    • G01N33/6803General methods of protein analysis not limited to specific proteins or families of proteins
    • G01N33/6842Proteomic analysis of subsets of protein mixtures with reduced complexity, e.g. membrane proteins, phosphoproteins, organelle proteins
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K17/00Carrier-bound or immobilised peptides; Preparation thereof
    • C07K17/02Peptides being immobilised on, or in, an organic carrier
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K17/00Carrier-bound or immobilised peptides; Preparation thereof
    • C07K17/14Peptides being immobilised on, or in, an inorganic carrier
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K7/00Peptides having 5 to 20 amino acids in a fully defined sequence; Derivatives thereof
    • C07K7/04Linear peptides containing only normal peptide links
    • C07K7/08Linear peptides containing only normal peptide links having 12 to 20 amino acids
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Molecular Biology (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Medicinal Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Genetics & Genomics (AREA)
  • Hematology (AREA)
  • Physics & Mathematics (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Cell Biology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Microbiology (AREA)
  • Food Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • General Physics & Mathematics (AREA)
  • Pathology (AREA)
  • Inorganic Chemistry (AREA)
  • Peptides Or Proteins (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及自身抗体和用肽表位对它的检测。本发明还涉及自身抗体模式以及它们与生物学类型区分的相关性。

Description

用于生物样品分类的组合物和方法
背景技术
在美国,癌是死亡的第二大原因。尽管着眼于常规诊断和治疗的研究,但5年生存率在过去的25年里仅得到极小的提高。需要更好地了解肿瘤新生的复杂性用以研发和商业化极其需要的、有效的诊断和治疗性产品。
基于观察到的对人肿瘤的免疫应答,已经提出血清自身抗体(autoantibodie,“aAB”)可用于癌诊断学(Fernandez-Madrid等,Clin Cancer Res.5:1393-400(1999))。例如,某些血清aAB的存在据称可在有患病风险的患者中预测肺癌的表现(Lubin等,Nat Med.1995;1:701-2),以及非小细胞型肺癌(NSCLC)患者的预后(Blaes等,Ann Thorac Surg.2000;69:254-8)。然而值得注意的是,这些癌研究只报告了对癌的存在或不存在不起决定性作用的少量标记,并总是集中于癌患者中癌-相关血清aAB和它们的肿瘤-相关抗原的出现(Vernino等,Clin.Cancer Res.10:7270-5(2004);Metcalfe等,Breast Cancer Res.2:438-43(2000);Tan,J.Clin.Invest.108:1411-5(2001);Lubin等,Nat Med.1:701-2(1995);Torchilin等,Trends Immunol.22:424-7(2001);Koziol等,Clin.Cancer Res.9:5120-5126,(2003);Zhang等,Clin.Exp.Immunol.125:3-9,(2001))。此外,检测出对任意单独的肿瘤-相关抗原特异性的自身抗体的低的频率已经排除了将自身抗体用作有用的诊断标记。
关于多路分析(multiplex analysis)疾病中aAB的研究鲜有报道。在该特定领域中,Robinson等人的开创性研究于2002年公开并描述了多种aAB,所述多种aAB识别多种生物分子并存在于8种不同的人自身免疫病(包括系统性红斑狼疮和类风湿性关节炎)中,(Robinson等,Nat Med.8:295-301(2002))。还没报道类似的有关癌的研究。
所有目前使用的aAB检测策略具有它们固有的优势和缺点。例如,通过ELISA检测单独的aAB具有简易性。可是,该方法的主要缺点是:其对于其它潜在信息性aAB是沉默的并从而它的预测价值是有限制的。SEREX分析(cDNA表达文库的血清学分析)能够同时鉴定具有已知特异性的不同aAB(Gure等,Cancer Res.58:1034-41(1998))。然而,该技术是耗时耗力的,并因此不适合临床使用。患者血清的蛋白质印迹可迅速鉴定蛋白质样品中潜在的自身抗原的数量,但是其信息性能力受限于使用的蛋白质样品和自身抗体:抗原复合物的有限的分辨力,并且未提供进一步的关于自身抗原身份的信息(Fernandez-Madrid等,Clin Cancer Res.5:1393-400(1999))。
总之,尚未描述对癌、癌亚型以及该疾病的其它方面起决定性作用的自身抗体模式。此外,用于检测与癌的诊断和鉴定相关的生物样品中的自身抗体和自身抗体模式的高通量分析工具将是非常有用的。
发明内容
本发明涉及生物样品中自身抗体(aAB)的检测,并利用如通过自身抗体谱分析确定的免疫状态的差异来区分生理状态或表型(在此称为类型)并产生诊断和预后信息。本发明用肽表位来模拟抗原-抗体结合并测定生物样品中的自身抗体结合活性(自身抗体谱分析)作为对免疫状态的半定量测量。提供了用于选择可用于自身抗体谱分析和类型预测(包括诊断和预后确定)的信息性表位集(sets of informativeepitopes),以及可用于特定疾病类型区分的信息性表位集的方法。如在此公开的,在一个实施例中,不同肿瘤状态的患者在他们的血清aAB谱中具有可检测的差异,这具有诊断相关性。将一组合成的肽用于测量癌样品和非癌样品中的自身抗体结合活性,并鉴别信息性表位的子集并将其用于表征与癌相关的免疫状态以及提供高度精确的癌诊断。在于此公开的另一个实施例中,提供了可用于区分肺癌亚型的一组信息性表位。有利地是,本发明利用自身抗体结合活性模式识别和信息性表位集,因为与传统的单-实体生物标记(包括单个aAB)比较,多种自身抗体结合活性组合为组合物使得更有可能准确地表征癌。
除了可用于检测自身抗体结合活性模式(用于诊断多种癌)的信息性表位集,本发明还提供了可用于确定特定疾病阶段或肿瘤的组织病理学表型的信息性表位集,所述的确定是基于用其检测到的自身抗体结合活性模式。在此另外提供的是信息性表位集,所述的表位集可用于将样品分类为来自有表现疾病风险的个体,所述的分类是基于用其检测到的自身抗体结合活性模式。值得注意的是,与基因-阵列不同,用于在此公开的aAB-检测的生物样品不需要活组织检查或费时的样品纯化。
重要的是,本发明利用表位而不是整个蛋白质或其片段来检测样品的自身抗体。如在此证明的,对应于单个蛋白质的不同片段的表位在不同类型样品之间它们的结合活性可以显示出不同。因此,用整个蛋白质或其片段(即多种表位组合物)进行自身抗体检测可能对类型区分不能提供信息,而使用单个蛋白质中单独的表位可能很好地提供信息。例如,第一种表位可在非癌样品中以一定频率存在表位结合活性,而在来自小细胞型肺癌患者的样品中缺少可检测的表位结合活性。第二种表位,其对应相同的蛋白质且不与第一种表位交叠,可在正常样品和癌样品两者中都以相似的频率存在丰富的表位结合活性。在这种情况下,基于这些结果第一种表位将能为类型区分提供信息,如在此讨论的,而第二种表位和整个蛋白质将不能为类型区分提供信息。
在此公开的诊断和预后方法的另一重要方面是,它们考虑不同分布的自身抗体,特别是包括存在于正常样品中而在疾病样品中减少的表位结合活性。也就是说,本发明方法不只是集中于疾病状态中出现的响应疾病-相关自身抗原的自身抗体。而是,本发明利用多种表位,许多这些表位以一定频率在正常样品中检测到高水平的表位结合活性,而在对应疾病状态的样品中显示出低或不可检测水平的表位结合活性。尽管事实是:能够结合这些表位的自身抗体通常在疾病样品中是不可检测到的,但是,这些表位是能提供关于类型区分的信息的,并且可用于在此公开的诊断和预后方法。
因此,在一个方面,本发明提供鉴定一组信息性表位的方法,所述表位的自身抗体结合活性与样品间的类型区分相关。该方法包括:通过表位在样品中的自身抗体结合活性与类型区分的相关程度将表位分类,并确定该相关性是否比预想的随机相关性强。其自身抗体结合活性与类型区分比预想的随机相关性更强相关的表位是信息性表位。鉴定一组信息性表位。在一个实施方案中,类型区分在已知类型之间确定。优选地,类型区分是在疾病类型和非疾病类型之间,更优选癌类型和正常类型之间进行。在另一个优选的实施方案中,类型区分是在高危类型和非疾病类型之间,更优选在高危癌类型和非癌类型之间进行。已知类型也可以是对化学疗法反应良好的个体类型或对化学疗法反应不好的个体类型。
在另一个实施方案中,已知类型的区分是疾病类型区分,优选癌类型区分,更加优选肺癌类型区分、乳腺癌类型区分、胃肠癌类型区分或前列腺癌类型区分。在一个实施方案中,已知类型的区分是SCLC类型和NSCLC类型之间的肺癌类型区分。
通过表位在样品中的自身抗体结合活性与类型区分的相关程度将表位分类并测定该相关性的显著性可以通过邻域分析(neighborhoodanalysis)(例如,采用信噪比公式、皮尔逊相关公式或欧几里德距离公式)完成,所述的邻域分析包括:定义理想化的自身抗体结合活性模式,其中所述理想化模式是在第一种类型中一致较高而在第二种类型中一致较低的自身抗体结合活性;并与相当的随机模式比较,确定是否存在高密度的、其自身抗体结合活性与理想模式相似的表位。信噪比公式是:
P(g,c)=(μ1(g)-μ2(g))/(σ1(g)+σ2(g)),
其中g是表位的自身抗体结合活性值;c是类型区分,μ1(g)是对于第一种类型的自身抗体结合活性值g的均值;μ2(g)是对于第二种类型的自身抗体结合活性值g的均值;σ1(g)是第一种类型的标准偏差;而σ2(g)是第二种类型的标准偏差。
在一个实施方案中,将信噪比公式用于确定能为癌分类提供信息的表位的加权投票(weighted vote),而不需要邻域分析。
本发明的另一方面是将样品归为已知类型或推定类型的方法,该方法包括:根据用加权投票方案建立的模型确定其中一种类型的一种或多种信息性表位(例如,多于20、50、100、150种)的加权投票,其中每次投票的大小取决于给定表位在样品中的自身抗体结合活性,并取决于给定表位的自身抗体结合活性与类型区分的相关程度;并将投票加和以确定获胜的类型。加权投票方案是:
Vg=ag(xg-bg),
其中Vg是表位g的加权投票;ag是表位的自身抗体结合活性与类型区分P(g,c)之间的相关性,P(g,c)是如在此定义的;bg=(μ1(g)+μ2(g))/2,其为表位在第一种类型和第二种类型中的自身抗体结合活性值的平均对数值的平均值;xg是表位在要检验样品中的自身抗体结合活性值的对数值;并且其中正的V值表示对第一种类型的投票,而负V值表示对第一种类型的反对票(第二种类型的投票)。还可以测定预测强度,其中如果预测强度大于特定的阈值,例如0.3,则该样品归为获胜的类型。预测强度通过如下测定:
(Vwin-Vlose)/(Vwin+Vlose),
其中Vwin和Vlose分别是获胜的和失败的类型的投票总和。
本发明还包括确定要用于分类样品的信息性表位的加权投票的方法,该方法包括确定一种或多种信息性表位关于其中一种类型的加权投票,其中每次投票的大小取决于表位在样品中的自身抗体结合活性,并取决于表位的自身抗体结合活性与类型区分的相关程度。将投票加和以确定获胜的类型。
本发明的又一个实施方案是用于从两个或多个样品确定多种分类的方法,该方法包括:通过自身抗体结合活性将样品聚类(clustering)而产生推断的类型;并通过进行基于推断类型的类型预测并评定所述类型预测是否具有高的预测强度来确定所述推断类型是否正确。样品的聚类可以例如根据自组织作图(self organizing map)来完成。自组织作图由多个节点N组成,并且该作图图根据竞争学习(competitive learning)程序使矢量聚类。竞争学习程序是:
fi+1(N)=fi(N)+τ(d(N,Np),i)(P-fi(N))
其中i=重复数,N=自组织作图的节点,τ=学习率(learningrate),P=主体工作矢量(subject working vector),d=距离,Np=作图最接近P的节点,并且fi(N)是在i时N的位置。为了确定推断的类型是否正确,可以如在此描述的进行构建加权投票方案的步骤并且可以对样品执行类型预测。
本发明还涉及用于将从一个个体获得的样品归为一类的方法,该方法包括:评估样品关于至少一种表位的自身抗体结合活性;并利用用加权投票方案建立的模型,将样品分类为样品的自身抗体结合活性关于该模型的自身抗体结合活性的函数。
本发明还涉及例如在计算机系统中使用,用于将从个体获得的样品分类的方法。该方法包括:提供通过加权投票方案建立的模型;评估样品对至少一种表位的自身抗体结合活性,从而获得每种表位的自身抗体结合活性值;利用用加权投票方案建立的模型对样品分类,包括将样品的自身抗体结合活性与该模型比较,从而实现分类;并提供指示分类的输出。在这里描述了加权投票方案和邻域分析的程序。该方法可以用代表样品的一系列抗体结合活性值的矢量进行。所述的矢量由计算机系统接收,并随后进行上述步骤。该方法进一步包括进行模型的交叉验证。模型的交叉验证包括:除去或截留一种用于建立该模型的样品;利用加权投票程序,建立无除去的样品的交叉验证模型用于分类;并用该交叉验证模型,通过将除去的样品的自身抗体结合活性与交叉验证模型的自身抗体结合活性比较将除去的样品归类为一种获胜的类型;并基于除去的样品的交叉验证模型分类确定除去的样品的获胜类型的预测强度。该方法可进一步包括筛掉任意表现出不显著变化的样品中的自身抗体结合活性值,使矢量的自身抗体结合活性值标准化,和/或重计量(rescaling)所述的值。该方法进一步包括提供指示簇的输出(例如,形成的工作簇(working cluster))。
本发明还包括用于确定至少一种先前未知的类型(例如,一种癌类型)的方法,至少一种要检验样品归类为所述的先前未知的类型中,其中所述的样品从一个个体获得。该方法包括:获得来自两种或更多种样品的多种表位的自身抗体结合活性值;形成样品的各自的矢量,每个矢量为一系列指示相应样品中的自身抗体结合活性的自身抗体结合活性值;并利用聚类程序,将样品的矢量分组而使得表现出类似的自身抗体结合活性的矢量聚类在一起(例如,采用自组织作图)而形成工作簇,该工作簇确定了至少一种先前未知的类型。所述的先前未知的类型通过用在此描述的加权投票方案的方法验证。自组织作图由多个节点(N)组成,并且根据竞争学习程序使矢量聚类。竞争学习程序是:
fi+1(N)=fi(N)+τ(d(N,Np),i)(P-fi(N))
其中i=重复数,N=自组织作图的节点,τ=学习率,P=主体工作矢量,d=距离,Np=作图最接近P的节点,并且fi(N)是在i时N的位置。
本发明还提供了用于增加信息性表位的数量的方法,所述的表位可用于特定类型预测。该方法包括:测定表位的自身抗体结合活性与类型区分的相关性,并确定该表位是否为信息性表位。在一个实施方案中,该方法涉及信噪比方法的使用。如果表位经确定是能信息性,即具有重要的预测价值,则可以将它与其它信息性表位组合并依照如在此描述的加权投票模型用于类型预测。
在一个实施方案中,将全部第一种类型样品的两种或更多种表位的平均的平均抗体结合活性(±SEM)与全部第二种类型样品的两种或更多种表位的平均的平均抗体结合活性(±SEM)比较,并进行采用双侧Student t-检验的邻域分析来确定信息性表位。
在一个实施方案中,本发明提供了用于确定一组信息性表位的方法,所述的表位具有与样品间类型区分相关的自身抗体结合活性,该方法包括步骤:(a)测定两种或更多种类型的每种的多个样品中多种表位的自身抗体结合活性;(b)从多种在来自多个样品的相同类型样品中具有自身抗体结合活性的表位鉴定表位簇(cluster of epitope),其中所述表位簇具有与来自多个样品的不同类型样品间的类型区分相关的自身抗体结合活性;以及(c)确定该相关性是否比预想的随机相关性强;其中具有与类型区分比预想的随机相关性更强相关的自身抗体结合活性的一簇表位是一组信息性表位。
在一个优选的实施方案中,将一种模式识别算法用来鉴定一组信息性表位,所述的模式识别利用两种或更多种类型中每种的多个样品中的多种表位的自身抗体结合活性。该模式识别算法识别可用于区分样品类型的自身抗体结合活性簇。在一个优选的实施方案中,所述的模式识别算法用于验证得到的模式。在一个优选的实施方案中,使用神经网络模式识别算法。在另一个优选的实施方案中,将支持向量机算法用于模式识别。当使用少量样品时,优选使用支持向量机算法。训练可用来自想要区分的任意类型的样品,例如癌样品或对照样品进行。
本发明还涉及用于将样品归为一种类型的计算机设备,其中样品从一个个体获得,其中该设备包括:样品的自身抗体结合活性值来源;通过数字处理器执行的处理程序,所述的数字处理器经连接而接收来自所述来源的自身抗体结合活性值,该处理程序通过将样品的自身抗体结合活性值与用加权投票方案或模式识别算法及训练样品建立的模型比较而确定样品分类;以及连接至数字处理器的输出装置,其用于提供样品分类的指示。模型用如在此描述的加权投票方案构建,或用如在此描述的模式识别算法和训练样品建立。输出装置包括分类的显示器。
然而,另一个实施方案是用于构建将至少一种想要检验的样品分类的模型的计算机设备,其中该设备包括:来自属于两种或更多种类型的两种或更多种样品的自身抗体结合活性值的矢量源,该矢量为所述样品的一系列自身抗体结合活性值;由数字处理器执行的处理程序,所述的数字处理器经连接而从所述矢量源接收矢量的自身抗体结合活性值,该处理程序基于自身抗体结合活性值确定用于样品分类的相关表位,并通过利用加权投票方案用一部分相关表位构建模型。该设备可进一步包括在矢量来源和处理程序之间连接的过滤器(filter),用于筛掉样品中显示不显著变化的任何自身抗体结合活性值;或包括连接至所述过滤器的规范器(normalizer),用于使自身抗体结合活性值标准化。输出装置可以是一种图示。
本发明还包括用于构建用于将至少一种要检验样品分类的模型的计算机设备,其中所述模型是基于通过利用模式识别算法和训练样品建立的自身抗体结合活性模式。
本发明还包括用于将样品归为一种类型的机器可读的计算机装置,其中所述样品从一个个体获得,其中所述计算机设备包括:样品的自身抗体结合活性值来源;通过数字处理器执行的处理程序,所述的数字处理器经连接而从所述活性值来源接收自身抗体结合活性值,该处理程序通过将样品的自身抗体结合活性值与用加权投票方案构建的模型比较来确定样品的分类;以及连接至数字处理器的输出设备,用于提供样品分类的指示。本发明还包括用于构建将至少一种要检验样品分类的模型的机器可读的计算机装置,其中该计算机装置包括:来自属于两种或更多种类型的两种或更多种样品的自身抗体结合活性值的矢量源,所述矢量为所述样品的一系列自身抗体结合活性值;由数字处理器执行的处理程序,所述的数字处理器经连接而从所述矢量源接收矢量的自身抗体结合活性值,该处理程序确定用于样品分类的相关表位,并通过采用加权投票方案用一部分相关表位构建模型。
本发明也包括用于将样品归为一种类型的机器可读的计算机装置,包括由数字处理器运行的处理程序,其中所述处理程序通过将样品的自身抗体结合活性与模型比较来确定样品分类,所述的模型是基于通过采用模式识别算法和训练样品建立的自身抗体结合活性模式。
在一个实施方案中,本发明包括为患有疾病的个体确定治疗方案的方法,所述的方法包括:从个体获得样品;评估该样品对至少一种表位的自身抗体结合活性;采用用加权投票方案建立的计算机模型,将样品归为一种疾病类型作为样品的自身抗体结合活性关于该模型的自身抗体结合活性的函数;并用该疾病类型确定治疗方案。另一应用是诊断或协助诊断一个个体的方法,其中从该个体获得样品,该方法包括:评估该样品对至少一种表位的自身抗体结合活性;并利用用加权投票方案建立的计算机模型,将样品归为一种疾病类型,这包括相对于模型的自身抗体结合活性评估样品的自身抗体结合活性;以及诊断或协助诊断个体。本发明还包括用于测定用来治疗一种疾病类型的药物的效力的方法,其中个体已经接受了该药物,该方法包括:从接受所述药物的个体获得样品;评估该样品对至少一种表位的自身抗体结合活性;并利用用加权投票方案建立的模型,将样品归为一种疾病类型,这包括与该模型的自身抗体结合活性比较评估样品的自身抗体结合活性。然而,另一应用是确定一个个体是否属于一种表型类型的方法,该方法包括:从所述个体获得样品;评估该样品对至少一种表位的自身抗体结合活性;并利用用加权投票方案构建的模型,将样品归为一种类型,这包括与所述模型的自身抗体结合活性比较评估样品的自身抗体结合活性。
在另一个实施方案中,确定治疗方案的方法包括:利用计算机模型评估患者样品对两种或更多种表位的自身抗体结合活性,所述的计算机模型是基于通过利用模式识别算法和训练样品建立的自身抗体结合活性模式。
在一方面,本发明提供一组能为乳腺癌诊断提供信息的表位。在一个优选的实施方案中,本发明提供了一组信息性表位,所述表位是能为乳腺癌诊断提供信息性,包含1-27、更优选2-27、更优选5-27、更优选10-27、更优选15-27、更优选20-27、更优选25-27个选自图2中公开的那些表位的信息性表位。在一个优选的实施方案中,所述的信息性表位集包括在图2中公开的那些。在另一个优选实施方案中,信息性表位集基本上由图2中公开的那些组成。
在另一个优选的实施方案中,本发明提供了一组信息性表位,这些表位是能为肺癌(尤其是NSCLC)的诊断提供信息,其包含1-51,更优选2-51,更优选5-51,更优选10-51,更优选15-51,更优选20-51,更优选25-51,更优选30-51,更优选35-51,更优选40-51,更优选45-51个选自表2中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在表2中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由表2中公开的那些组成。
在一个方面,本发明提供了能为区分NSCLC和SCLC提供信息的一组表位。在一个优选的实施方案中,本发明提供了一组信息性表位,这些表位是能为区分NSCLC和SCLC提供信息,其包含1-28,更优选2-28,更优选5-28,更优选10-28,更优选15-28,更优选20-28,更优选25-28个选自图3中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在图3中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由图3中公开的那些组成。
在一个方面,本发明提供了能为区分NSCLC和SCLC提供信息的一组表位。在一个优选的实施方案中,本发明提供了一组信息性表位,这些表位是能为区分NSCLC和SCLC提供信息,其包含1-51,更优选2-51,更优选5-51,更优选10-51,更优选15-51,更优选20-51,更优选25-51,更优选30-51,更优选35-51,更优选40-51,更优选45-51个选自表2中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在表2中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由表2中公开的那些组成。
在另一个优选的实施方案中,本发明提供了一组提供信息的表位,这些表位是能为肺癌(尤其是NSCLC)的诊断提供信息,其包含1-25,更优选2-25,更优选5-25,更优选10-25,更优选15-25,更优选20-25个选自表11中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在表11中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由表11中公开的那些组成。
在一个方面,本发明提供了数组肽,所述的肽可用于确定一组能为特定类型区分的信息性表位。在一个实施方案中,这组肽包括1-1448,更优选2-1448,更优选5-1448,更优选10-1448,更优选25-1448,更优选50-1448,更优选100-1448,更优选250-1448,更优选500-1448,更优选750-1448,更优选1000-1448,更优选1250-1448个选自表1中公开的肽的肽;和/或1-31,更优选2-31,更优选5-31更优选10-31,更优选15-31,更优选20-31,更优选25-31个选自表10中公开的肽的肽;和/或1-83,更优选2-83,更优选5-83,更优选10-83,更优选15-83,更优选20-83,更优选25-83,更优选50-83,更优选75-83个选自表9中公开的肽的肽;和/或1-42,更优选2-42,更优选5-42,更优选10-42,更优选15-42,更优选20-42,更优选25-42,更优选30-42,更优选35-42个选自表8中公开的肽的肽;和/或1-52,更优选2-52,更优选5-52,更优选10-52,更优选15-52,更优选20-52,更优选25-52,更优选30-52,更优选35-52,更优选40-52,更优选45-52个选自表7中公开的肽的肽。
在一个方面,本发明提供了用于区分生物样品的多种类型的表位微阵列,其中所述微阵列包括多种肽,每种肽在以选自多种特定类型中的一种特定类型为特征的样品中独立地具有相应的表位结合活性,其中总的来看,所述的多种肽在汇总性的以所有多种特定类型为特征的多种样品中具有相应的表位结合活性,其中每种肽的自身抗体结合活性独立地在以所述多种特定类型中的一种为特征的样品中比在表征所述多种特定类型中另一类型的样品中高。
在一个优选的实施方案中,本发明提供了用于对生物样品中的第一种类型和第二种类型之间区分的表位微阵列。所述的表位微阵列包括多种肽,每种肽在以第一种类型为特征的样品或以第二种类型为特征的样品中独立地具有相应的表位结合活性,其中总的来看,所述的多种肽在汇总性地以第一种和第二种类型为特征的样品中具有相应的表位结合活性,其中每种肽的自身抗体结合活性独立地在以第一种类型或第二种类型为特征的样品中与在以另一种类型为特征的样品中它的自身抗体结合活性相比要高。
优选的不同的类型包括非疾病类型和疾病类型,更优选非癌类型和癌类型,后者优选为肺癌、乳腺癌、胃肠癌或前列腺癌。其它优选的特定类型是高危类型和非疾病类型,优选高危的癌类型和非癌类型。其它优选的不同的类型是不同的癌类型,例如不同的肺癌类型如NSCLC和SCLC。其它优选的不同癌类型是转移性癌和非转移性癌类型。
在一个优选的实施方案中,表位微阵列的两个或多种肽对应单个蛋白质的不同区域,优选所述单个蛋白质的非交叠区域。
在另一个优选的实施方案中,本发明提供了可用于诊断肺癌,尤其是NSCLC的表位微阵列,该表位微阵列包含1-25,更优选2-25,更优选5-25,更优选10-25,更优选15-25,更优选20-25个选自表11中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在表11中公开的那些表位。在另一个优选实施方案中,所述信息性表位基本上由表11中公开的那些组成。
在另一个优选的实施方案中,本发明提供了可用于诊断肺癌,尤其是NSCLC的表位微阵列,该阵列包含1-51,更优选2-51,更优选5-51,更优选10-51,更优选15-51,更优选20-51,更优选25-51,更优选30-51,更优选35-51,更优选40-51,更优选45-51个选自表2中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在表2中公开的那些表位。在另一个优选实施方案中,所述信息性表位集基本上由表2中公开的那些组成。
在另一个优选的实施方案中,本发明提供了可用于诊断乳腺癌的表位微阵列,该阵列包含1-27,更优选2-27,更优选5-27,更优选10-27,更优选15-27,更优选20-27,更优选25-27个选自图2中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在图2中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由图2中公开的那些组成。
在另一个优选的实施方案中,本发明提供了可用于区分NSCLC和SCLC的表位微阵列,该阵列包含1-51,更优选2-51,更优选5-51,更优选10-51,更优选15-51,更优选20-51,更优选25-51,更优选30-51,更优选35-51,更优选40-51,更优选45-51个选自表2中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在表2中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由表2中公开的那些组成。
在另一个优选的实施方案中,本发明提供了可用于区分NSCLC和SCLC的表位微阵列,该阵列包含1-28,更优选2-28,更优选5-28,更优选10-28,更优选15-28,更优选20-28,更优选25-28个选自图3中公开的那些表位的信息性表位。在一个优选的实施方案中,所述信息性表位集包括在图3中公开的那些。在另一个优选实施方案中,所述信息性表位集基本上由图3中公开的那些组成。
在一个优选的实施方案中,本发明提供了可用于鉴定用于一特定类型区分的信息性表位的表位微阵列。该表位微阵列包括1-1448,更优选2-1448,更优选5-1448,更优选10-1448,更优选25-1448,更优选50-1448,更优选100-1448,更优选250-1448,更优选500-1448,更优选750-1448,更优选1000-1448,更优选1250-1448个选自表1中公开的肽的肽;和/或1-31,更优选2-31,更优选5-31更优选10-31,更优选15-31,更优选20-31,更优选25-31个选自表10中公开的肽的肽;和/或1-83,更优选2-83,更优选5-83,更优选10-83,更优选15-83,更优选20-83,更优选25-83,更优选50-83,更优选75-83个选自表9中公开的肽的肽;和/或1-42,更优选2-42,更优选5-42,更优选10-42,更优选15-42,更优选20-42,更优选25-42,更优选30-42,更优选35-42个选自表8中公开的肽的肽;和/或1-52,更优选2-52,更优选5-52,更优选10-52,更优选15-52,更优选20-52,更优选25-52,更优选30-52,更优选35-52,更优选40-52,更优选45-52个选自表7中公开的肽的肽。
在一个实施方案中,本发明提供了可用于区分两种或更多种类型并从而用以预测样品分类的表位微阵列,所述表位阵列包括一组能为类型区分信息性表位,所述的表位用在此公开的方法选择。
附图简述
图1.表位微阵列设计。将两个阵列都与相同的血清杂交并通过与(A)碱性磷酸酶或(B)Cy3缀合的二抗抗-人Ig检测肽-aAb复合物。用这两种独立的检测方法获得了类似的信号模式。因此,该表位微阵列可与不同的检测方法兼容。(C)用于数据标准化的IgG系列稀释物。PC-阳性对照;NC-阴性对照。
图2.为乳腺癌信息性表位的样本集。用方差齐性的双侧t检验确定一组乳腺癌信息性表位,并随后基于I/D信号二分将其分为两组。EB和EC如实验部分中描述的测定。
图3.能为肺癌提供信息的表位的样本组。用Student t-检验确定一组能为肺癌提供信息的表位,并随后基于I/D信号二分将其分为两组。EN和ES如实验部分中描述的测定。
图4.与先前公开的癌存活数据(参见Marcus等,J Natl CancerInst.92:1308-16(2000))比较的我们的结果的聚类。
图5.表位评估和信号分析。每名患者和对照个体中的信号强度用5为标度表示。随后对每种单独表位进行成对表位信号比较。仅将产生显著不同的信号(p≤.05)的表位随后用于组成区分两组的标记集(marker set)。该图中的所有表位认为是能为乳腺癌提供信息的,因为与非癌对照比较在乳腺癌中它们都产生了显著不同的信号。
发明详述
“自身抗体结合活性”和“自身抗体结合活性值”指对给定表位和给定样品中的自身抗体之间的结合相互作用的测量,其为能反映样品中的结合表位的自身抗体的数量的可半定量测量。如在此使用的,“样品的”、“样品中的”、“与样品的”或“关于样品的”自身抗体结合活性指对给定表位和给定样品中的自身抗体之间的结合相互作用的测量。
如在此使用的,“表位结合活性”指样品中的结合表位的自身抗体。特定表位的“相应表位结合活性”是特异性结合该特定表位的自身抗体。
“自身抗体”(“ aAB”)特异性结合产生它们的相同身体的成分。修饰过的血清自身抗体成分已经在许多不同癌,包括乳腺癌(Metcalfe等,Breast Cancer Res.2:438-43(2000))和肺癌(Lubin等,Nat Med.1:701-2(1995);Blaes等,Ann Thorac Surg.69:254-8(2000);Gure等,Cancer Res.58:1034-41(1998)),以及多种其它疾病包括红斑狼疮、干燥综合征、硬皮病、皮肤病/多发性肌炎(dermato/polymyositis)、I型糖尿病、副肿瘤性神经综合征(paraneoplastic neuronal syndromes)、炎性肠病和甲状腺内分泌病(thyroid endocrinopathies)(参见Schwarz,Autoimmunity andAutoimmune Disease,In:Fundamental Immunology,3rd ed.(Ed.Paul WE)pp.1033-99 Raven Press,New York,1993)中注意到。
在此公开的方法通常涉及两个领域:类型预测和类型发现。类型预测指将特定样品归为确定的类型,所述确定的类型可以反映当前状态、易感性或将来的结果。类型发现指定义一种或多种先前未承认的生物学类型。
在一个方面,本发明涉及预测或确定样品类型,包括鉴定一组信息性表位,所述表位的自身抗体结合活性与样品间的类型区分相关。在一个实施方案中,该方法包括:将表位通过所有样品的自身抗体与其结合的活性与类型区分的相关程度分类,并随后确定该相关性是否比预想的随机相关性(expected by chance)强(即,统计上显著)。如果自身抗体结合活性与类型区分的相关性是统计上显著的,则表位认为是“信息性的”或“相关的”表位。
基于基因表达谱分析的相关分类方法先前已经有描述。参见Golub等,美国专利No.6,647,341,在此通过明确地将其全文引用作为参考。值得注意地是,本发明与Golub等人的公开内容的不同之处是,本分类方案和方法不涉及基因表达的测量。而是,本发明方法涉及免疫状态的测量,所述的测量是基于生物样品中的自身抗体与肽表位的结合。本发明基于这样的发现:给定一组合适的信息性表位,通过样品的自身抗体结合活性表明的免疫状态就生物学类型区分而言是高度信息性的。
一旦鉴定了一组信息性表位,则由每种信息性表位提供的信息的权重得以确定。每次投票(vote)是对新样品的自身抗体结合活性水平与一特定类型的训练样品(training sample)中自身抗体结合活性的典型水平有多相似的测量。自身抗体结合活性与类型区分的相关性越强,则给予该表位提供的信息的权重越大。换而言之,如果结合一特定表位的自身抗体与类型区分强相关,则该表位将会在确定样品所归属的类型中具有大的权重。相反,如果结合一特定表位的自身抗体只与类型区分弱相关,则该表位将会在确定样品所归属的类型中给予小的权重。给来自一组信息性表位的将要使用的每种信息性表位赋予一个权重。无需使用全组的信息性表位;可以随意地使用全部的信息性表位的子集。使用这种方法,可以确定加权投票方案,并且可从一组信息性表位产生用于类型区分的预测子(predictor)或模型。
本发明的另一方面包括通过评估样品对能提供信息表位的自身抗体结合活性将生物样品归为一种已知或推断的类型(即,类型预测)。对于每种信息性表位,对一种或另一种类型的投票是基于样品的自身抗体结合活性来确定。随后根据上述加权投票方案将每次投票加权,并且将加权的投票加和以确定样品的获胜类型。获胜的类型定义为给予最大得票数的类型。任选地,也可以测定获胜类型的预测强度(PS)。预测强度是获胜类型的获胜程度(范围为0-1)。在一个实施方案中,样品只有在PS超过某一阈值(例如,0.3)时才可以归为获胜的类型,否则该预测认为是不确定的。
在另一个实施方案中,将模式识别算法与以特定类型为特征的训练样品一起使用。特定类型的使用样品的可以是将要区分的那些类型中的任意一种。例如,可以将以一种癌类型为特征的样品,或以非癌类型为特征的样品与一种模式识别算法一起用来产生用于区分癌和非癌样品的模型。
在一个实施方案中,采用支持向量机算法。在另一个实施方案中,采用神经网络算法。优选地,如果使用少量的训练样品,择优选采用支持向量机算法。
本发明的另一个实施方案涉及从样品中发现或确定两种或更多种类型的方法,该方法通过基于自身抗体结合活性使样品聚类以获得推断类型(即,类型发现)而实现。所述推断类型通过实施如上描述的类型预测步骤确认。在优选的实施方案中,所述方法的一个或多个步骤用合适的处理手段,例如计算机完成。
在一个实施方案中,本发明方法用于将样品关于一特定疾病类型或一特定疾病类型中的亚型分类。本发明可用于对基本上任何疾病、病症或综合征,包括但不限于癌、自身免疫性疾病、传染性疾病、神经变性疾病等将样品分类。也就是说,本发明可用于确定样品是否属于(分类为)一种特定疾病类型(例如,现存的肺癌,而不是无癌,也不是有表现肺癌的高风险)和/或一特定疾病中的一种类型(例如小细胞型肺癌(SCLC)类型而不是非小细胞型肺癌(NSCLC)类型)。
如在此使用的,术语“类型”和“亚型”旨在表示共有一种或多种特征的组。例如,疾病类型可以是广义的(例如增殖性疾病)、中等范围的(例如,癌)或狭义的(例如,肺癌)。术语“亚型”旨在进一步定义或区分一种类型。例如,在肺癌类型中,NSCLC和SCLC是亚型的实例;然而,NSCLC和SCLC也可以认为是它们自身的类型。这些术语无意于给予组的成员个数任何特殊的限制。而是,它们仅旨在帮助组织这些组的不同集合和子集,如进行生物区分而制定。
本发明可用于关于实际上任何类型或应答鉴定样品间的类型或亚型,并可用于对一种给定样品关于所述类型或应答分类。在一个实施方案中,类型或亚型是先前已知的。例如,本发明可用于将样品分类(基于自身抗体结合活性)为来自更易受病毒性(例如,HIV、人乳头状瘤病毒、脑膜炎)或细菌性(例如衣原体性、葡萄球菌性、链球菌性)感染的个体还是来自不易受这些感染的个体。本发明可用于基于任意表型或生理学性状来分类样品,所述的表型成生理学性状包括(但不限于)癌、肥胖症、糖尿病、高血压、对化学疗法的反应等。本发明可进一步用于确定先前未知的生物学类型。
在特定的实施方案中,类型预测用来自已知患有正研究的疾病种类或类型的个体的样品,以及来自未患有所述疾病或患有一种不同种类或类型的疾病的个体的样品来进行。这提供了评估覆盖全部表型范围的自身抗体结合模式的能力。采用在此描述的方法,用来自这些样品的自身抗体结合活性建立分类模型。
在一个实施方案中,该模型通过确定一组能信息性或相关的表位构建,所述表位在样品中的自身抗体结合活性与要预测的类型区分相关。例如,将表位通过它们的自身抗体结合活性与类型区分的相关程度分类,并评估这些数据以确定这种观察到的相关性是否比预想的随机相关性强(例如,是统计上显著的)。如果关于一特殊表位的相关性是在统计上是显著的,那么该表位认为是信息性表位。如果相关性在统计上不显著,则该表位认为不是信息性表位。
自身抗体结合活性与类型区分之间的相关性程度可采用许多方法评估。在一个优选的实施方案中,每个表位通过自身抗体结合活性矢量v(g)=(a1,a2,...,an)表示,其中ai表示初始样品组中第i种样品的表位g的自身抗体结合活性。类型区分通过理想化的自身抗体结合活性模式c=(c1,c2,...,cn)表示,其中根据第i种样品是属于类型1还是类型2,ci=+1或0。表位和类型区分之间的相关性可以以多种方式测量。合适的方法包括,例如,标准化矢量之间的皮尔逊相关系数r(g,c)或欧几里德距离法d(g*,c*)(其中矢量g*和c*已经标准化为具有均值0和标准偏差1)。
在一个优选的实施方案中,用在将表位用作预测子中强调“信噪比”的相关性的指标来评估相关性。在该实施方案中,(μ1(g)、σ1(g)和μ2(g)、σ2(g))分别表示类型1和类型2样品中表位g的自身抗体结合活性值的对数的均值和标准偏差。P(g,c)=(μ1(g)-μ2(g))/(σ1(g)+σ2(g)),其反映相对于类型内的标准偏差,类型之间的差别。大的|P(g,c)|值表示自身抗体结合活性与类型区分之间的强相关性,而小的|P(g,c)|值表示自身抗体结合活性与类型区分之间的弱相关性。P(g,c)的符号为正或负分别对应g在类型1或类型2中具有更大的自身抗体结合活性。需注意的是,与皮尔逊相关系数不同,P(g,c)不限于范围[-1,+1]。如果N1(c,r)表示一组基因且P(g,c)>=r,并且如果N2(c,r)表示一组表位且P(g,c)≤r,则N1(c,r)和N2(c,r)是类型1和类型2周围半径为r的邻域。在邻域内非常大量的表位说明许多表位具有与该类型矢量密切相关的自身抗体结合活性模式。
对观察到的相关性是否比预想的随机相关性的强的评估最优选用“邻域分析”完成。在该方法中,确定了对应在一种类型中一致较高且另一类型中一致较低的自身抗体结合活性的理想化模式,并且检验了在理想化模式的“附近”或其“邻域”中是否存在非常高密度的自身抗体结合活性,即比相对的随机模式更类似该模式。测定邻近的自身抗体结合活性密度在统计上是否比期望的显著高可用已知的用于测定差异的统计学显著性的方法完成。一种优选的方法是排列测验(permutation test),其中将邻域中(邻近)的自身抗体结合活性的数量与对应随机类型区分的理想化模式周围的类似邻域中的自身抗体结合活性数量比较,这通过置换c坐标而获得。
评估的样品可以是可能包含结合表位的自身抗体的任何样品。优选的样品是来自个体的血清样品。也优选的是滑液和脑脊髓液样品。采用在此描述的方法,可同时测量多种表位的自身抗体结合活性。大量自身抗体结合活性的评估(自身抗体谱分析)提供了对样品更精确的评价,因为存在更多可助于样品分类的自身抗体结合活性。
自身抗体结合活性例如通过将样品与合适的表位微阵列接触,并测定样品中自身抗体与微阵列上的表位的结合程度来获得。一旦获得样品的自身抗体结合活性,将它们相对于模型进行比较或评估,并随后将所述样品分类。样品的评估确定该样品是否应归为正在研究的特定类型。
测量或评估的自身抗体结合活性是从可测量自身抗体结合活性水平的设备获得的数值。如在此描述的,自身抗体结合活性值指对于给定表位所检测到的自身抗体结合的数量。该值是来自设备的未经处理的值,或任选经再计量、过滤和/或标准化的值。这些数据例如用基于荧光测定的或比色测定的自身抗体检测技术,从表位微阵列平台获得。
该数据可任选通过采用下列组合准备:再计量数据、过滤数据和标准化数据。可再计量自身抗体结合活性值消除在试验或条件间的变化,或用以校准总的阵列强度中的微小差异。这些变化取决于研究员选择的试验设计。数据的准备有时还涉及在将自身抗体结合活性值接受聚类之前将该值进行过滤和/或标准化。
过滤自身抗体活性值涉及除去其中自身抗体活性值在样品之间显示无变化或非显著变化的任何矢量。一旦过滤了表位的自身抗体活性,则保留的表位/自身抗体结合活性的子集在此称为“工作矢量”。
本发明还可涉及将自身抗体结合活性值水平标准化。自身抗体结合活性值的标准化不总是需要的,并取决于用于测定自身抗体结合活性与类型区分之间的相关性的类型或算法。自身抗体结合活性的绝对水平与自身抗体结合活性对一种特定类型的相关性程度不是同等重要的。标准化用下面的等式进行:
NV=(ABV-AABV)/SDV
其中NV是标准化的值,ABV是样品的自身抗体结合活性值,AABV是全部样品的平均自身抗体结合活性值,并且SDV是自身抗体结合活性值的标准偏差。
一旦准备了自身抗体结合活性值,则将数据分类或用于建立用于分类的模型。首先确定与分类相关的表位。术语“相关表位”指其自身抗体结合活性与类型区分相关的那些表位。与分类相关的表位在这里还称为“信息性表位”。自身抗体结合活性和类型区分之间的相关性可用多种方法测定;例如可以采用邻域分析。邻域分析包括进行排列测验,并与随机的类型区分的邻域比较,确定类型区分的邻域中的基因数的概率。邻域的大小或半径用距离量度确定。例如,邻域分析可采用皮尔逊相关系数、欧几里德距离系数或信噪比系数。相关表位通过采用例如定义了理想的自身抗体结合模式的邻域分析来确定,所述的理想模式对应在一种类型中一致较高且在其它类型中一致较低的自身抗体结合活性。当将一种类型中的自身抗体结合活性水平与其它类型比较时,存在自身抗体结合活性的不同。这种表位是基于其自身抗体活性来评估和分类样品的好的指示子。在一个实施方案中,邻域分析采用下面的信噪比公式:
P(g,c)=(μ1(g)-μ2(g))/(σ1(g)+σ2(g)),
其中g是一给定表位的自身抗体结合活性值;c是类型区分,μ1(g)是对于第一种类型g的自身抗体结合活性值的均值;μ2(g)是对于第二种类型g的自身抗体结合活性值的均值;σ1(g)是对于第一种类型g的标准偏差;并且σ2(g)是对于第二种类型的标准偏差。本发明包括将样品归为两种类型的其中一种,或归为多种(众多)类型中的一种。
特别相关的表位是最适合用于样品分类的那些表位。确定相关表位的步骤还提供了用于分离抗体的手段,所述的抗体可用于鉴定可能涉及类型的表现的免疫原蛋白,例如涉及发病机理的蛋白质。从而,本发明方法还涉及确定基于免疫原蛋白的药物靶标,所述的免疫原蛋白特异性结合至表位结合自身抗体并与正在研究的类型(例如,疾病)有联系,以及自身如通过这种方法确定的药物。
用于分类表位的下一步骤涉及建立或构建可用于将要检验的样品分类的模型或预测子。人们用其类型已经确定了的样品(在这里称为“原始数据集”)建立了模型。一旦建立了模型,那么相对于该模型评价要检验的样品(例如,以样品的相对自身抗体结合活性关于该模型的自身抗体结合活性的函数分类)。
可选择如上面描述确定的一部分相关表位用于建立该模型。不需要使用所有的表位。用于建立模型的相关表位数量可以通过本领域技术人员确定。例如,在1000个显示出自身抗体结合活性与类型区分高度相关的表位中,25、50、75或100或者更多这些表位可用于建立模型。
模型或预测子采用“加权投票方案”或“加权投票程序”建立。加权投票方案让这些信息性表位为其中一种类型投加权票。投票的大小取决于自身抗体结合活性水平以及自身抗体结合活性与类型区分的相关程度。一种类型和下一种类型的自身抗体结合活性之间的差异或不同越大,则该表位的投票越大。具有较大差别的表位是用于类型区分的更好的指示物,并因此投出更大的票。
模型根据下面的加权投票公式建立:
Vg=ag(xg-bg),
其中Vg是表位g的加权投票;ag是表位的自身抗体结合活性与类型区分之间的相关性,如在此定义的P(g,c);bg=(μ1(g)+μ2(g))/2,其为第一种类型和第二种类型中的平均对数自身抗体结合活性值的平均值;xg是要检验样品中的对数自身抗体结合活性值。正的加权投票是对第一种类型中新的样品成员的投票赞成,而负的加权投票是对第二种类型中新的样品成员的投票赞成。第一种样品的总值V1通过将所有信息性表位的正投票的绝对值求和获得,而第二种类型的总值V2通过负投票的绝对值求和获得。
也可以测量预测强度以确定该模型将要检验的样品分类的置信度。预测强度传达了样品分类的置信度并评价了在什么时候样品不能分类。可能存在这样的情况即其中样品得以检验,但不属于一种特定类型。这通过利用阈值来完成,其中打分低于确定的阈值的样品不是可以分类的样品(例如,“no call”)。例如,如果建立一个模型用以确定一种样品是否属于两种肺癌类型中的一种,但该样品来自不患肺癌的个体,那么该样品将会是“no call”并将不能够进行分类。预测强度阈值可以基于已知因素通过技术人员确定,所述因素包括(但不限于)假阳性分类对“no call”的值。
一旦建立了模型,该模型的有效性可用本领域已知的方法检验。检验模型有效性的一种方法是通过数据集的交叉验证。为了进行交叉验证,除去其中一种样品并如上描述的建立无所述除去了的样品的模型,形成“交叉验证模型”。随后如上描述的,将该除去了的样品根据该模型分类。用初始数据集的所有样品进行该方法并测定错误率。则该模型的准确性得以评估。该模型应该以高的准确性将要检验的样品分类为已知的类型,或先前已经确定或通过类型发现确定的类型。另一种验证模型的方法是将模型应用于无关数据集。其它标准生物学或医学研究技术(已知的或未来发展的)可用于验证类型发现或类型预测。
本发明还提供了用于增加信息性表位数量的方法,所述表位可用于特定类型预测。该方法包括:测定对于一种表位的自身抗体结合活性与类型区分的相关性,并确定该表位是否是信息性表位。在一个实施方案中,该方法包括使用信噪比公式。如果表位确定为能信息性,即具有重要的预测价值,则它可以与其它信息性表位集合并依照如在此描述的加权投票方案模型使用,用于类型预测。
本发明还提供了用于确定表位是否能为一特殊生物学类型区分信息性备选手段。例如,在一个实施方案中,将第一种类型的所有样品对两种或更多种表位的平均的平均抗体结合活性(±SEM)与第二种类型的所有样品的两种或更多种表位的平均的平均抗体结合活性(±SEM)比较,并且进行双侧Student t检验以确定信息性表位。
本发明的一个方面还包括确定或发现先前未知的类型,或者验证先前推断的类型。该方法在这里称为“类型发现”。本发明的这个实施方案包括确定先前未知的一种类型或多种类型,并随后验证所述类型的确定(例如,验证所述的类型确定是正确的)。
为了确定先前没有未知或没有识别的类型,或者为了验证基于其它发现而提出的类型,将样品基于自身抗体结合活性分组或聚类。将样品的自身抗体结合活性模式(即aAB谱)和具有类似自身抗体结合活性模式的样品分组或聚类在一起。样品的组或类标识为一种类型。这种聚类方法学可应用于鉴定任意类型,其中这些类型基于它们的自身抗体结合活性模式而不同。
确定先前未知的类型可利用聚类方法通过本发明方法完成。本发明可利用数种聚类方法来确定先前未知的类型,例如贝叶斯聚类法、逐步聚类法、系统聚类法和自组织作图(SOM)聚类法。
一旦准备了自身抗体结合活性,则将数据聚类或分组。本发明的一个特定方面利用SOM(竞争学习程序)将自身抗体结合活性模式成簇以确定类型。SOM在数据上产生结构,邻近节点倾向定义为“相关的”簇或类型。
SOM首先通过选择“节点”的几何结构来构建。优选地,使用二维网格(例如,3×2的网格),但是也可使用其它的几何结构。将节点作图进k-维空间中,最初是随机地并随后交互式地进行调整。每次重复包括随机选择一个矢量并将节点向该矢量的方向移动。最近的节点移动得最多,同时其它节点较小量地移动,这取决于在起始几何结构中与最靠近的节点之间的距离。以这种方式,起始几何结构中的邻近点趋向于作图至k-维空间中的邻近点。该过程持续多次(例如20000-50000)重复。
SOM中的节点数可根据数据变化。例如,使用者可以增加节点数以获得更多的簇。恰当的节点数使得能更好且更明显地表示样品的特殊簇。网格大小与节点数对应。例如,3×2的网格包含6个节点并且4×5的网格包含20个节点。当SOM算法基于自身抗体结合活性数据应用于样品时,节点在多次重复过程中移向样品簇。节点数与簇的数量直接相关。因此,节点数增加会引起簇的数量增加。具有太少的节点将会产生没有区别的模式。额外的簇导致自身抗体结合活性皆然不同的、紧密的簇。添加甚至超过这一点的更多簇不会产生任何根本上新的模式。例如,人们可选择3×2的网格、4×5的网格和/或6×7的网格,并研究输出以确定最适合的网格大小。
存在可根据自身抗体结合活性矢量使样品成簇的多种SOM算法。本发明采用任意地SOM方法(例如,使自身抗体结合活性模式成簇的竞争学习方法),并优选采用下列的SOM方法:
fi+1(N)=fi(N)+τ(d(N,Np),i)(P-fi(N)),
其中i=重复数,N=自组织作图的节点,τ=学习率,P=主体工作矢量,d=距离,Np=作图最接近P的节点,并且fi(N)是在i时N的位置。
一旦将样品用聚类方法聚合成类,推断的类型得以确认。用于样品分类(例如类型预测)的步骤可用于检验类型。基于加权投票方案的模型(如在此描述的)用已经对其进行了类型发现的相同样品的自身抗体结合活性数据建立。该模型在所述类型经准确测定或确定时将会良好运行(例如,通过交叉验证并通过对独立的样品分类),如果新发现的类型没有被恰当地确定或认定,那么该模型将不会很好地运行(例如,不比通过多数类型预测好)。可以比较通过所选择的类型发现方法发现的所有类型对。对于每一对C1、C2,S是C1或C2中的样品组。通过在此描述的交叉验证方法预测类型成员(C1或C2)的S中的每种样品。作为类型区分的可预测程度的指标的中位数PS(|S|预测)来自给定的数据。低的中位数PS值(例如,接近0.3)表示假的类型区分或支持真的区分的数据量不足。高的中位数PS值(例如0.8)表示强的、可预测的类型区分。
上述类型发现技术可用于鉴定任何病患(例如癌)的基本亚型。类型发现方法也可用于研究不同类型的癌的基本免疫机制。例如,可将不同癌(例如乳腺肿瘤和前列腺肿瘤)组成一单个数据集并基于表位结合活性使样品聚类。此外,在一个优选的实施方案中,使在此描述的类型预测子适合于临床环境,具有在此描述的合适的表位微阵列。
基于分析或评价对多种表位的自身抗体结合活性,样品的分类提供给保健提供者关于该样品所属类型的信息。该方法提供了比传统检测更准确的评估,因为与传统试验进行的对一个或两个标记的分析相比,其分析了多个自身抗体结合活性或标记。通过本发明提供的信息单独或与其它检测结果一起有助于保健提供者诊断个体。
而且,本发明提供了用于确定治疗方案的方法。一旦保健提供者知道样品(并因此知道个体)属于哪种疾病类型,保健提供者可以为该个体确定适当的治疗方案。不同的疾病类型通常需要不同的治疗。正确诊断和了解个体的疾病类型使得能进行更好、更成功的治疗和预后。
本发明的其它应用包括确定有可能用特定药物或食物疗法能成功治疗的人的类型或将他们分类。对测定药物效力感兴趣的那些人可采用本发明方法。在研究正在试验的药物或疗法的过程中,患有疾病的个体可能对该药物或疗法起好的反应,而其它人可能不会起好的反应。样品从已经接受试验药物的个体以及对治疗起预先确定的反应的个体获得。可以采用在这里描述的加权投票方案,从一部分相关表位建立模型。要检验样品可随后相对于该模型评估并基于治疗将是成功还是失败来分类。试验药物的公司可以提供有关所述药物对其最有用的个体类型的更多准确信息。该信息也有助于保健提供者确定个体的最佳治疗方案。
本发明的另一应用是将来自个体的样品分类以确定特定疾病或病症将会在个体中出现的可能性。例如,更容易产生心脏病或高血压的人可能具有与不太可能遭受这些疾病的那些人不同的自身抗体结合活性谱。用在这里描述的方法,可以用加权投票方案,从患有心脏病或高血压的个体和不患这些疾病的那些个体建立一个模型。一旦建立了模型,可以相对于该模型检验和评估来自个体的样品以确定所述样品属于哪种类型。属于患有该疾病的个体类型的个体可以采取预防措施(例如运动、阿司匹林等)。心脏病和高血压是可以分类的疾病的实例,但是本发明可用于对实际上任何疾病的样品(包括癌的倾向性)进行分类。
用于鉴定和预测对疾病的易感性的优选实施方案包括:用来自未患有一特定疾病但具有患该特定疾病的高风险性的个体的样品,利用在这里描述的方法建立加权投票方案模型。这种个体的实例是尚未表现肺癌的长期高频率吸烟者,或者是其系谱预测有家族性疾病发生,但是其尚未表现该疾病的家庭成员。一旦建立了模型,可以相对于该模型检验和评价来自个体的样品以确定该样品属于哪种类型。属于倾向患有该疾病的个体类型的个体可以采取预防措施(例如运动、阿司匹林、停止吸烟等)。
更一般地,类型预测子可用于多个方面。首先,可以对已知病理类型构建类型预测子,反映肿瘤细胞的起源、阶段或等级。这种预测子可提供诊断确认或阐明异常病例。其次,类型预测技术可应用于涉及未来的临床结果(例如药物反应或存活)的区分。
表位微阵列
在一个方面,本发明提供了表位微阵列,其是附着于阵列上的结合自身抗体的肽(表位)的位置可以确定的阵列。该阵列含有两种至数千种表位,更优选10-1500种,更优选20-1000种、更优选50-500种表位。使用的表位优选约3-20个,更优选约15个氨基酸长,尽管可以使用其它长度的表位。将结合剂,优选特异性结合样品中存在的自身抗体的二抗用于检测特异性结合阵列表位的自身抗体的存在。在与表位阵列孵育之前,将检测剂优选用可检测标记物(例如32P、比色指示剂或荧光标记物)标记。
用于自身抗体检测以及表位微阵列的表位的选择可取决于期望的类型区分。备选地,可以使用一组随机表位,并且该组表位中的信息性表位可以用在这里公开的方法确定。
在一个优选的实施方案中,本发明提供了用于诊断癌的表位微阵列,并且存在于该微阵列上的表位选自基于下列方案设计的一套表位。该套表位的第一组表位对应于在胚组织中表达,并且它们在成人组织中的异常表达能引起体液免疫应答的蛋白质。这些蛋白质包括转录因子(TF),所述的转录因子在胚的发育中活跃,并当在肿瘤细胞中表达时也引发免疫应答。例如,抗SOX-家族转录因子成员的aAb已经在小细胞型肺癌(SCLC)患者的血清中得以鉴定(Gure等,同上)。SOX-家族TF的成员通常在发育的神经系统中表达并且它们的表达尚未在正常的肺上皮组织中证明(Gure等,同上)。而且,在胚神经系统中起作用的碱性螺旋-环-螺旋(bHLH)家族TF成员的表达已经在NSCLC和SCLC中得以证明(Chen等,Proc Natl Acad Sci USA.(1997)94:5355-60)。
另外,癌诊断表位微阵列优选整合了先前公开的B-细胞表位和预计可结合II类主要组织相容性复合物(MHC)的多种亚型的表位。可以使用可公开获得的MHC II结合算法例如ProPred和RankPept。在表位设计中特别应注意的是其自身抗体已经与癌关联的蛋白质。这些包括p53和SOX、FOX、IMP、ELAV/HU以及其它家族的多个成员(Tan,J Clin Invest.(2001)108:1411-5)。还优选包含于癌诊断微阵列上的是已知能引发T-细胞应答的表位,因为T-和B-免疫原性之间的交叠可以从以前的研究中推断(Scanlan等,Cancer Immun.(2001)1:4;Chen等,Proc Natl Acad Sci USA.(1998)95:6919-23)。已知的T-细胞表位的一个极好的集合存在于癌免疫数据库(Cancer Immunitydatabase)中。因此,一个高度优选的癌诊断表位微阵列组合了先前鉴定的免疫原序列和上述胚因子表位设计。合成所述的肽并可以用已知的方法将其打印在微阵列上。例如,参加Robinson等,同上。
优选的用于诊断乳腺癌的信息性表位包括在图2中公开的那些。
优选的用于区分NSCLC和SCLC的信息性表位包括在图3、7和13中公开的那些。
优选的用于诊断NSCLC的信息性表位包括在图7和13中公开的那些。
从中选择用于预测一种类型区分的信息性表位的优选表位包括在图6、7、9、10、11、12和13中公开的那些。
在一个方面,本发明提供了用于区分生物样品的多种类型的表位微阵列,其中所述微阵列包括多种肽,每种肽在以选自多种特定类型的一种特定类型为特征的样品中独立地具有相应的表位结合活性,其中总的来看,多种肽在汇总性地以征所有特定类型为特征的多个样品中具有相应的表位结合活性,其中每种肽的自身抗体结合活性独立地在以多种特定类型中的一种为特征的样品中比在表征多种特定类型中的另一类型的样品中高。
在一个优选的实施方案中,本发明提供了用于对一种生物样品在一种类型和另一种类型之间区分的表位微阵列。所述的表位微阵列包括多种肽,每种肽在以第一种类型为特征或以第二种类型为特征的样品中独立地具有相应的表位结合活性,其中总的来看,所述的多种肽在共同表征第一种和第二种类型的样品中具有相应的表位结合活性,其中每种肽在以第一种类型或第二种类型为特征的样品中的自身抗体结合活性与在以另一种类型为特征的样品中它的自身抗体结合活性比较,独立地更高。
在一个实施方案中,本发明提供了包含多种肽的表位微阵列(epitope microarray),每种肽在第一种样品或第二种样品中具有相应的表位结合活性,其中每种肽与第一种样品的自身抗体结合活性较于与第二种样品的活性要高或低,并且其中第一种样品和第二种样品对应不同的类型。
在一个优选的实施方案中,表位微阵列的至少第一种肽与对应第一种类型的第一种样品,较于其与对应第二种类型的第二种样品的自身抗体结合活性,具有更高的自身抗体结合活性,并且所述表位微阵列的至少第二种肽与与对应第二种类型的第二种样品,较于其与对应第一种类型的第一种样品的自身抗体结合活性,具有更高的自身抗体结合活性。
包含于表位微阵列上的每种肽显示出与类型区分相关的自身抗体结合活性,尽管检测到对任意特殊表位的自身抗体结合活性的频率可能低,并且在以特定类型为特征的样品中检测到特定的表位-结合自身抗体的可能性可能低。但是这些表位在组合使用时仍然可用于诊断,如在这里公开的。
优选的不同类型包括非疾病类型和疾病类型,更优选非癌类型和癌类型,后者优选为肺癌、乳腺癌、胃肠癌或前列腺癌。其它优选的不同类型是高危类型和非疾病类型,优选高危癌类型和非癌类型。其它优选的不同类型是不同的癌类型,例如不同的肺癌类型如NSCLC和SCLC。其它优选的不同癌类型是转移性癌和非转移性癌类型。
在一个优选的实施方案中,表位微阵列的两种或更多种肽对应于一单个蛋白质的不同区域,优选该单个蛋白质的非交叠区域。
如在此公开的,对应单个蛋白质的不同片段的表位可在不同类型样品之间显示出它们的结合活性的不同。不受理论的束缚,对应于相同蛋白质的表位之间自身抗体结合活性的这种不一致性可部分地归因于蛋白质改变和随之发生的表位改变,这些改变有助于类型区分。作为支持,大量mRNA(包括编码胚转录因子的mRNA)的剪接变体已经在多种癌中确定。
在一个实施方案中,阵列的一种或多种肽针对特异性结合备选剪接的mRNA的蛋白质产物的自身抗体,所述的mRNA就该特定基因的转录物而言,在第一种类型中存在或占优势,但是在第二种类型中不存在或不占优势。
表位微阵列的至少第一种肽在此与对应第一种类型的第一种样品,较于其与对应第二种类型的第二种样品的自身抗体结合活性,具有更高的自身抗体结合活性,并且所述表位微阵列的至少第二种肽与与对应第二种类型的第二种样品,较于其与对应第一种类型的第一种样品的自身抗体结合活性,具有更高的自身抗体结合活性。因而,在两种不同类型之间,在每种类型中更高的自身抗体结合活性用本发明优选的微阵列可检测到。就癌诊断而论,优选的癌诊断微阵列包括能够检测在非癌样品中比癌样品更高的自身抗体结合活性的表位,以及能够检测在癌样品中比非癌样品更高的自身抗体结合活性的表位,后者可潜在地可归因于在患有癌的个体中与肿瘤相关的抗原的存在。
一旦自身抗体与阵列-结合的表位的结合,以及检测剂与固定了的自身抗体的结合发生,则将该阵列插入至可检测结合模式的扫描仪中。自身抗体结合数据可以作为从结合至阵列的检测剂的标记基团发出的光收集。由于阵列上每个表位的位置是已知的,可测定特定的自身抗体结合活性。通过扫描仪检测到的光的量成为本发明应用和利用的原始数据。所述的表位阵列只是获得自身抗体结合活性原始数据的一个实例。本发明可使用本领域已知的或将来开发的,用于测定自身抗体结合活性的其它方法(例如,ELISA、噬菌体展示等)。
肽表位和微阵列制备
如在此使用的,肽包括经修饰的肽,例如磷酸肽。如本领域技术人员理解的,肽可源于许多来源的任意一种。例如,随机肽可以通过本领域已知的表达系统产生。肽可以通过广泛的蛋白质片段化产生。优选地,肽根据本领域熟知的方法合成。例如参见Methods inEnzymology,Volume 289:Solid-Phase Peptide Synthesis,J.Abelson等,Academic Press,lst edition,November15,1997,ISBN0121821900。在一个优选的实施方案中,将Perkin-Elmer AppliedBiosystems 433A肽合成仪用于合成肽,使得合成经修饰的肽。
表位微阵列可以根据本领域熟知的方法制备。例如,参见ProteinMicroarray Technology,D.Kambhampati(ed.),John Wiley&Sons,March5,2004,ISBN3527305971;Protein Microarrays,M.Schena,Jones&Bartlett Publishers,July,2004,ISBN 0763731277;以及Protein Arrays:Methods and Protocols(Methods in MolecularBiology),E.Fung,Humana Press,Aprill,2004,ISBN 158829255X。在一个优选的实施方案中,根据制造商的说明书使用购自PerkinElmer的Piezorray非接触式点样系统。
样品来源和处理
样品可以是含有自身抗体的任意样品。优选的样品包括血液、血浆、脑脊髓液和滑液。
血液可通过静脉穿刺从每个个体收集。0.1-0.5ml可用于制备血清或血浆。血清可以在抽出血液后立刻制备。试管可以在室温下保留4小时,随后以170xg离心5分钟,之后移出血清。可将血清等分并在-20℃下存储。血浆可通过加入EDTA(终浓度为5mM)至血样中制备。将血样以170xg离心5分钟,移出上清液并在-20℃下存储。
表1-公开的-信息性表位是1448种肽表位,以及相应的蛋白质名称、Genbank登记号以及肽位置。这些表位可用作用于自身抗体谱分析的初始组。其中,将1253种用作初始组以测量肺癌样品中的自身抗体结合活性。参见试验。
表1
基因 登记号 位置 表位 长度
ACADVL-乙酰辅酶A脱氢酶,十分长的链 NM_000018
ACADVL745 745 KHKKGIVNEQFLLQ 14
ACADVL860 860 WQQELYRNFKSISKA 15
ACADVL407 407 KMGIKASNTAEVFFD 15
ACADVL324 324 CGKYYTLNGSKLWIS 15
ACADVL487 487 KAVDHATNRTQFGEK 15
ACADVL257 257 LFGTKAQKEKYLPKL 15
ACADVL661 661 ALKNPFGNAGLLLGE 15
ADSL-腺苷酸(基)琥珀酸裂解酶 NM_000026
ADSL244 244 DLCMDLQNLKRVRDD 15
ADSL85 85 QIQEMKSNLENIDFK 15
ADSL164 164 TDLIILRNALDLLLP 15
ADSL156 156 TSCYVGDNTDLIILR 15
ADSL476 476 TADTILNTLQNISEG 15
ADSL411 411 RCCSLARHLMTLVMD 15
ADSL97 97 DFKMAAEEEKRLRHD 15
AP1G2-接头相关蛋白复合物3δ-1亚单位 NM_003917
AP1G2584 584 VRDDAVANLTQLIGG 15
AP1G2497 497 ELSLALVNSSNVRAM 15
AP1G2500 500 LALVNSSNVRAMMQE 15
AP1G2425 425 FLLNSDRNIRYVALT 15
AP1G21020 1020 LFRILNPNKAPLRLK 15
AP1G2656 656 GDLLLAGNCEEIEPL 15
AP1G2938 938 SFIRPPENPALLLIT 15
AP1G2701 701 LLEKVLQSHMSLPAT 15
AP1G2967 967 CQAAVPKSLQLQLQ 15
AP1G2388 388 DTSRNAGNAVLFETV 15
ASCC3L1-激活信号辅整合素1复合体亚基3样1 NM_014014
ASCC3L1884 884 GLSATLPNYEDVATF 15
ASCC3L12395 2395 RRMTQNPNYYNLQGI 15
ASCC3L11965 1965 RRWKQRKNVQNINLF 15
ASCC3L12472 2472 AAYYYINYTTIELF 15
ASCC3L1405 405 SDDRECENQLVLLLG 15
ASCC3L11968 1968 KQRKNVQNINLFVVD 15
ASCC3L12519 2519 GLIEIISNAAEYENI 15
ASCC3L1659 659 LYRAALETDENLLLC 15
BAIAP3-BAI1-相关蛋白3 NM_003933
BAIAP31198 1198 LSPDSIQNDEAVAPL 15
BAIAP31099 1099 ALCVVLNNVELVRKA 15
BAIAP3121 7 1217 DEKLALLNASLVVRK 15
BAIAP3567 567 EHSAEEPNSSSWRGE 15
B0P1-增殖阻断蛋白1      NM_015201
BOP1641 641 LVAAAVEDSVLLLNP 15
BOP1825 825 LTKKLMPNCKWVS 13
Cep290-人类中心体蛋白cep290(Cep290),m RNA. NM_025114
Cep290707 707 DLTEFRNSKHLKQQ 15
Cep2901287 1287 ALQKVVDNSVSLSEL 15
Cep2901345 1345 MLVQRTSNLEHLECE 15
Cep2901423 1423 KAKKSITNSDIVSIS 15
Cep2903023 3023 KLRIAKNNLEILNEK 15
Cep290471 471 QLDADKSNVMALQQG 15
Cep2902537 2537 QGKPLTDNKQSLIEE 15
Cep2902465 2465 RENSLTDNLNDLNNE 15
Cep2901107 1107 RKFAVIRHQQSLLYK 15
CGI-09-人类CGI-09蛋白(CGI-09),mRNA. NM_015939
CGI-09637 637 ADTSLKSNASTLESH 15
CGI-09169 169 VQQLIENSTTFRDK 15
CGI-09575 575 LSETWLRNYQVLPDR 15
CGI-09490 490 AALLSERNADGLIVA 15
CGI-0987 87 GTAFEVTSGGSLQPK 15
CGI-63-人类核受体结合因子1(CGI-63) NM_016011
CGI-63100 100 KMLAAPINPSDINMI 15
CGI-63156 156 QVVAVGSNVTGLKPG 15
CHTF18-CTF18,染色体传递保真因子18同系物 NM_022092
CHTF181110 1110 YIYRLEPNVEELCRF 15
CHTF18882 882 VVQGLFDNFLRLRLR 15
CLK3-CDC-样激酶3      NM_001292
CLK3158 158 RRTRSCSSASSMRLW 15
COTL1-coactosin-样蛋白1      NM_021149
COTL1154 154 AKEFVISDRKELEED 15
CSDA
CSDA-冷休克结构域蛋白A      NM_003651
CSDA422 422 QQATSGPNQPSVRRG 15
CSDA7 7 AGEATTTTTTTLPQA 15
CSDA175 175 PQARSVGDGETVEFD 15
DKFZp434F054-人类假定蛋白DKFZp434F054 NM_032259
DKFZp434F054-113 113 LLATAATNGVVVTW 14
DKFZp434F054-650 650 LPLMNSFNLKDMAPG 15
DKFZp434F054-647 647 SCGLPLMNSFNLKDM 15
DKFZp434F054-26 26 CHLDAPANAISVCRD 15
DKFZp434F054-701 701 SDTVLLDSSATLITN 15
EEF1D-真核翻译延伸因子1δ NM_001960
EEF1D-37 37 AGASRQENGAS 11
EFHD2-含EF手结构域蛋白2 NM_024329
EFHD2-113 113 FSRKQIKDMEKMFK 14
EXOSC9-外切酶体组分9 NM_005033
EXOSC9-246 246 LILKALENDQKVRKE 15
EXOSC9-24 24 LMERCLRNSKCIDTE 15
FAHD1-含延胡索酰乙酰乙酸水解酶结构域蛋白1 NM_031208
FAHD1-104 104 KRCRAVPEAAAMDYV 15
FAHD1-36 36 EMRSAVLSEPVL 12
FAHD1-237 237 YIISYVSKIITLEEG 15
FLJ10385-人类假定蛋白FLJ10385 NM_018081
FLJ10385-629 629 LPQKDCTNGVSLHPS 15
FLJ10385-332 332 VASSSRENPIHIWDA 15
FLJ10385-250 250 LTNSADNILRIYNL 15
FLJ10385-157 157 SLSEEEANGPELGSG 15
FLJ10385-556 556 SLGREVTTNQRIYFD 15
FLJ10385-247 247 GSCILTNSADNILRI 15
FLJ10385-578 578 LVSGSTSGAVSVWDT 15
FLJ10385-557 557 LGREVTTNQRIYFDL 15
FLJ10385-321 321 LMSSAQPDTSYVASS 15
GL009-人类假定蛋白GL009 NM_032492
GL009-113 113 LLSFPRNNISYLVL 14
GL009-184 184 LFGFSAVSIMYLVLV 15
GL009-76 76 VAKMSVGHLRLLSHD 15
GL009-15 15 TDGSDFQHRERVAMH 15
GNPTAG-N-乙酰葡萄糖胺-1-磷酸转移酶,γ亚基 NM_032520
GNPTAG-379 379 SNLEHL 12
GNPTAG-263 263 DELITPQGHEKLLRT 15
GNPTAG-109 109 PFHNVTQHEQTFRWN 15
GRINA-谷氨酸受体,亲离子型, XM_291268
GRINA-299 299 NTEAVIMA 8
GRINA-255 255 FRRKHPWNLVALSVL 15
GRINA-421 421 YVFAALNLYTDIINI 15
GRINA-224 224 FVRENVWTYYVS 12
GRINA-398 398 TCFLAVDTQLLLGNK 15
GTF2H2-基本转录因子IIH,多肽2 NM_001515
GTF2H2-240 240 LTTCDPSNIYDLIKT 15
GTF2H2-185 185 HGEPSLYNSLSIAMQ 15
GTF2H2-325 325 PPPASSSSECSLIRM 15
GTF2H2-487 487 YVCAVCQNVFCVDCD 15
GTF2H2-151 151 IVTKSKRAEKLTEL 15
GTF2H2-193 193 SLSIAMQTLKHMP 13
GTF2H2-462 462 PLEEYNGERFCYG 13
HAGH-羟酰谷胱甘肽水解酶 NM_005326
HAGH-8 8 VLPALTDNYMYLVID 15
HAGH-238 238 GHEYTINNLKFARHV 15
HAGH-108 108 ALTHKITHLSTLQVG 15
HAGH-80 80 HWDHAGGNEKLVKLE 15
HAGH-105 105 RIGALTHKITHLSTL 15
HAGHL-羟酰谷胱甘肽水解酶-样蛋白 NM_032304
HAGHL-8 8 VIPVLEDNYMYLVIE 15
HAGHL-237 237 GHEHTLSNLEFAQKV 15
HAGHL-190 190 LEGSAQQMYQSLAEL 15
HAGHL-193 193 SAQQMYQSLAELG 13
HAGHL-108 108 SLTRRLAHGEELRFG 15
HDAC5-组蛋白脱乙酰基酶5 NM_005474
HDAC5-1027 1027 LYGTSPLNRQKLDSK 15
HDAC5-481 481 LPLDSSPNQFSLYTS 15
HDAC5-1194 1194 GTQQAFYNDPSVLYI 15
HDAC5-1112 1112 VAAGELKNGFAIIRP 15
HDAC5-102 102 QELLALKQQQQLQKQ 15
HDAC5-1136 1136 AMGFCFFNSVAITAK 15
HDAC5-1414 1414 AVLQQKPNINAVATL 15
HDAC5-702 702 QLVMQQQHQQFL 15
HDAC5-175 175 QEMLAAKRQQELEQQ 15
HDAC5-506 506 QATVTVTNSHLTASP 15
HDAC5-426 426 GPSSPNSSHSTIAEN 15
HDAC5-487 487 PNQFSLYTSPSLPNI 15
HDAC5-644 644 TGERVATSMRTVGKL 15
HLA-B-主要组织相容性复合物I,B NM_005514
HLA-B-115 115 YKAQAQTDRESL 12
HLA-B-182 182 HDQYAYDGKDYIALN 15
HLA-C-主要组织相容性复合物I,C NM_002117
HLA-C-479 479 CSNSAQGSDESLITC 15
HLA-C-182 182 YDQSAYDGKDYIALN 15
HLA-C-258 258 LRRYLENGKETLQRA 15
HSPA4-70kDa热休克蛋白4 NM_002154
HSPA4-1022 1022 NNKLNLQNKQSLTMD 15
HSPA4-381 381 MSANASDLPLS 12
HSPA4-76 76 AKSQVISNAKNTVQG 15
HSPA4-873 873 FVSEDDRNSFTLKLE 15
HSPA4-1016 1016 AMEWMNNKLNLQNK 14
HSPA4-966 966 KIISSFKNKEDQYDH 15
HSPA4-806 806 MLNLYIENEGKMIMQ 15
HSPA4-658 658 HGIFSVSSASLVEVH 15
HSPH1-105kDa/110kDa热休克蛋白1 NM_006644
HSPH1-381 381 MSSNSTDLPLN 12
HSPH1-83 83 HANNTVSNFKRFHGR 15
HSPH1-891 891 CEQDHQNFLRLLTE 15
HSPH1-780 780 PDADKANEKKVDQP 15
HSPH1-71 71 TIGVAAKNQQITHAN 15
HSPH1-1141 1141 ECYPNEKNSVNMD 13
HSPH1-1107 1107 PKLERTPNGPNIDKK 15
QWD1-IQ基序和WD重复1
QWD1-173 173 LDEQQDNNNEKLSPK 15
QWD1-315 315 SAENPVENHINITQS 15
IQWD1-655 655 LMLEETRNTITVPAS 15
IQWD1-28 28 RGGTSQSDISTLPTV 15
QWD1-338 338 DSNSGERNDLNLDRS 15
IQWD1-646 646 ADEVITRNELMLEET 15
QWD1-395 395 TSTESATNENNTNPE 15
JPH4-junctophilin4  NM_032452
JPH44-98 498 RAVSAARQRQEIAAA 15
KIAA0373/中心体蛋白cep290  NM_025114
KIAA0373-707 707 DLTEFRNSKHLKQQ 15
KIAA0373-1287 1287 ALQKVVDNSVSLSEL 15
KIAA0373-1345 1345 MLVQRTSNLEHLECE 15
KIAA0373-1410 1410 ETKLGNESSMDKA 13
KIAA0373-1423 1423 KAKKSITNSDIVSIS 15
KIAA0373-3203 3203 KLRIAKNNLEILNEK 15
KIAA0373-271 271 RSQLSKKNYELIQY 14
KIAA03734-71 471 QLDADKSNVMALQQG 15
KIAA0373-113 113 TKVMKLENELEMAQ 14
KIAA0373-2537 2537 QGKPLTDNKQSLIEE 15
KIAA0373-2465 2465 RENSLTDNLNDLNNE 15
KIAA0373-938 938 VNAIESKNAEGIFDA 15
KIAA0373-1107 1107 RKFAVIRHQQSLLYK 15
KIAA0373-807 807 LDLLSLKNMSEAQSK 15
KIAA0373-634 634 VEIKNCKNQIKIRDR 15
KIAA0373-2401 2401 SQKEAHLNVQQIVDR 15
KIAA0373-1203 1203 KITVLQVNEKSLIRQ 15
KIAA0373-1193 1193 MKKILAENSRKITVL 15
KIAA0373-720 720 QQQYRAENQILLKEI 15
KIAA0373-3110 3110 KKNQSITDLKQLVKE 15
KIAA0373-2294 2294 KVKAEVEDLKYLLDQ 15
KIAA0373-1050 1050 ASIINSQNEYLIHLL 15
KIAA0373-64 64 QENVIHLFRI 10
KIAA0373-2692 2692 LGIRALESEKELEEL 15
KIAA0373-1972 1972 DPSLPLPNQLEIALR 15
KIAA0373-3234 3234 GAESTIPDADQLKEK 15
KIAA0373-1210 1210 NEKSLIRQYTTLVEL 15
KIAA0683 NM_016111
KIAA0683-234 234 GNRLQQENLAEFFPQ 15
KIAA0683-242 242 LAEFFPQNYFRLLGE 15
KIAA0683-868 868 QPGSPSPNTPCLPEA 15
KIAA0683-323 323 PRLAALTQGSYLHQR 15
KRT18-keratin18 NM_000224
KRT18-8 8 TRSTFSTNYRSLGSV 15
KRT18-343 343 YDELARKNREELDKY 15
KRT18-185 185 FANTVDNARIVLQI 15
KRT18-566 566 GKVVSETNDTKVLRH 15
KRT18-544 544 DALDSSNSMQTIQKT 15
KRT18-252 252 RKVIDDTNITRLQLE 15
KRT18-567 567 KVVSETNDTKVLRH 14
KRT18-484 484 EGQRQAQEYEALLNI 15
KRT18-96 96 AGMGGIQNEKETMQS 15
LDHB-乳酸脱氢酶B NM_002300
LDHB-347 347 LIESMLKNLSRIHPV 15
LDHB-18 18 EEATVPNNKITVVGV 15
LDHB-387 387 KGMYGIENEVFLSLP 15
LDHB-177 177 CIIIVVSNPVDILTY 15
LDHB-106 106 KDYSVTANSKIVVVT 15
LDHB-307 307 GTDNDSENWKEVHKM 15
LDHB-17 17 EEEATVPNNKITVVG 15
LGALS4-凝集素,半乳糖苷-结合的,可溶的,4(半乳凝素4) NM_006149
LGALS4-391 391 DRFKVYANGQHLFDF 15
LGALS4-237 237 HCHQQLNSLPTMEGP 15
LGALS4-407 407 HRLSAFQRVDTLEIQ 15
LGALS44-15 415 VDTLEIQGDVTLSYV 15
 LGALS4-155 155 EHYKVVVNGNPFYEY 15
LOC162962-与锌指蛋白616类似 XM_091886
LOC162962-177 177 VENKCIENQLTLSFQ 15
LOC162962-232 232 QSEKTVNNSSLVSPL 15
LOC162962-36 36 YWDVMLENYRNL 12
LOC162962-497 497 RQNSNLVNHQRIHTG 15
LOC162962-315 315 RVSSSLINHQMVHTT 15
LOC162962-854 854 LSNHKRIHTG 10
LOC162962-799 799 ECGTVFRNYSCLARH 15
LOC162962-1113 1113 RVRSILVNHQKMHTG 15
LOC162962-231 231 NQSEKTVNNSSLVSP 15
LOC162962-111 111 YLREIQKNLQDLEFQ 15
LOC162962-1189 1189 FGRFSCLNKHQMIES 15
LOC162962-543 543 KSFSQSSNLATHQTV 15
LOC162962-904 904 DCGKAYTQRSSLT 13
LOC388198- XM_373655
LOC388198-145 145 RSSTGAYALRLC 12
LOC388198-9 9 GAAYSAQRMAGLVLP 15
LOC388561-与锌指蛋白600类似 XM_371192
LOC388561-230 230 NESGKAFNYSSLLRK 15
LOC388561-182 182 NHGNNFWNSSLLTQK 15
LOC388561-7 7 FLSTAQGNREVFHAG 15
LOC388561-461 461 KTFSHKSSLTCH 12
LOC388561-412 412 ECGKTFSHKSSLTCH 15
LOC388561-307 307 ECGKTFSQTSSLTCH 15
LOC388561-874 874 ECGKNFSQKSSLICH 15
LOC401193-与Ψ神经元凋亡抑制蛋白类似 XM_376391
LOC401193-87 87 NTASSSLNIFSLLPT 15
LOC401193-77 77 KEPISLNNSINTASS 15
LOC401193-156 156 EFLRSKKSSEEITQY 15
LOC90333 XM_030958
LOC90333-12 12 QSFKSFNCSSLLKK 15
LOC90333-398 398 ECGKTFSQMSSLVYH 15
LOC90333-321 321 VCDKAFQRDSHLAQH 15
LSM1-LSM1同系物,U6核内小RNA相关的 NM_014462
LSM1-164 164 DRGLSIPRADTLDEY 15
LSM1-33 33 GFLRSIDQFANLVLH 15
LSM1-87 87 FVVRGENVVLLGEI 15
MAGEA4-黑色素瘤抗原,家族A,4 NM_002362
MAGEA4-234 234 KEVDPTSNTYTLVTC 15
MAGEA4-181 181 MLERVIKNYKRCFPV 15
MAGEA4-85 85 GPPQSPQGASALPTT 15
MIF-巨噬细胞游走抑制因子 NM_002415
MIF-141 141 NAANVGWN 8
MIF-92 92 GGAQNRSYSKLLCG 15
MIF115 115 SPDRVYINYYDM 12
MSLN-间皮素 NM_005823
MSLN-74 74 GVLANPPNISSLSPR 15
MSLN-71 71 PLDGVLANPPNISSL 15
MSLN-186 186 FSRITKANVDLLPRG 15
MSLN-652 652 RLAFQNMNGSEYFVK 15
MSLN-510 510 PEDIRKWNVTSL 12
MSLN-324 324 PSTWSVSTMDALRGL 15
MSLN-259 259 PGRFVAESAEVLLPR 15
NACA-新生肽相关复合物α NM_005594
NACA-261 261 AVRALKNNSNDIVNA 15
NACA-66 66 QATTQQAQLAAA 12
NACA-251 251 MSQANVSRAKAVRAL 15
NISCH-nischarin NM_007184
NISCH-428 428 NGLLVVDNLQHLYNL 15
NISCH-478 478 GLHTKLGNIKTLNLA 15
NISCH-805 805 CIGYTATNQDFIQRL 15
NISCH-1764 1764 KTTGKMENYELIHSS 15
NISCH-555 555 EHVSLLNNPLSIIPD 15
NISCH-710 710 ALASSLSSTDSLTPE 15
NISCH-1271 1271 THNCRNRNSFKLSRV 15
NISCH-97 97 PKKIIGKNSRSLVEK 15
NISCH-1360 1360 QLRASLQDLKTVVIA 15
NISCH-465 465 HLDLSYNKLSSLEGL 15
NISCH-333 333 SVRFSATSMKEVLVP 15
NISCH-1105 1105 RSCFAPQHMAMLCSP 15
NUBP2-核苷酸结合蛋白2 NM_012225
NUBP2-179 179 PPGTSDEHMATIEAL 15
NUBP2-5 5 EAAAEPGNLAGVRHI 15
NUBP2-249 249 RVMGIVENMSGFTCP 15
OGFR-阿片生长因子受体 NM_007346
OGFR-165 165 NYDLLEDNHSYIQWL 15
OGFR-639 639 SAAVASGGAQTLALA 15
OGFR-269 269 LNWRSHNNLRITRIL 15
PABPC1-聚(A)结合蛋白cytoplasmic1 NM_002568
PABPC1-796 796 GMLLEIDNSELLHML 15
PABPC1-150 150 NLDKSIDNKALYDTF 15
PABPC1-90 90 ERALDTMNFDVIKGK 15
PABPC1-650 650 TQRVANTSTQTMGPR 15
PABPC1-332 332 QKAVDEMNGKELNGK 15
PAI-RBP1-mRNA-结合蛋白 NM_015640
PAI-RBP1-304 304 GTVKDELTDLDQS 13
PAI-RBP1-102 102 RKNPLPPSVGVVDKK 15
PAI-RBP1-158 158 PDQQLQGEGKIIDRR 15
PDXK-吡哆醛(吡哆醇,维生素B6)激酶 NM_003681
PDXK-111 111 DKSFLAMVVDIVQEL 15
PDXK-7 7 ECRVLSIQSHVIRGY 15
PDXK-114 114 FLAMVVDIVQELK 13
PDXK-346 346 TVSTLHHVLQRTIQC 15
PDXK-339 339 LKVACEKTVSTLHHV 15
PDXK-89 89 LYEGLRLNNMNKYDY 15
PDXK-263 263 NYLIVLGSQRRRNPA 15
PDXK-101 101 YDYVLTGYTRDKSFL 15
RAB40C-RAS成员癌基因家族 NM_021168
RAB40C-310 310 KSFSMANGMNAVMMH 15
RAB40C-319 319 NAVMMHGRSYSLASG 15
RAB40C-225 225 FNVIESFTELSRI 13
RAB40C-164 164 VPRILVGNRLHLAFK 15
RAB40C-78 78 TTILLDGRRVRLELW 15
RAB40C-237 237 SRIVLMRHGMEKIWR 15
RAB40C-340 340 KGNSLKRSKSIRPPQ 15
RAB40C-334 334 AGGGGSKGNSLKRSK 15
RBMS1-RNA结合基序,单股相互作用蛋白1 NM_002897
RBMS1-21 21 YPQYLQAKQSLVPAH 15
RBMS1-79 79 GWDQLSKTNLYIRGL 15
RBMS1-462 462 SPLAQQMSHLSLG 13
RBMS1-157 157 SPAAAQKAVSALKAS 15
RBMS14-95 495 QYAHMQTTVPVEEA 15
RBMS1-108 108 PYGKIVSTKAILDKT 15
RHBDL1-菱形,小静脉样蛋白1 NM_003961
RHBDL1-464 464 CPYKLLRMVLALVCM 15
RHBDL1-267 267 ASVTLAQIIVFLCYG 15
RHBDL1-349 349 GFNALLQLMIGVPLE 15
RHBDL1-503 503 FMAHLAGAVVGVSMG 15
RHBDL1-471 471 MVLALVCMSSEVGRA 15
RHBDL1-401 401 LAGSLTVSITDMRAP 15
RHBDL1-555 555 WWVVLLAYGTFLLFA 15
RHBDL1-332 332 AWRFLTYMFMHVGLE 15
RHOT2-ras同系物基因家族,成员T2 NM_138769
RHOT2-309 309 APQALEDVKTVVCRN 15
RHOT2-807 807 LLGVVGAAVAAVLSF 15
RHOT2-815 815 VAAVLSFSLYRVLVK 15
RHOT2-7 7 DVRILLLGEAQVGKT 15
RHOT2-335 335 LDGFLFLNTLFIQRG 15
RHOT2-543 543 QAHAITVTREKRLDQ 15
RHOT2-659 659 VACLMFDGSDPKSFA 15
RNPC2-含RNA结合区(RNA1,RRM)蛋白2 NM_004902
RNPC2-642 642 KCPSIAAAIAAVNAL 15
RNPC2-701 701 FPDSMTATQLLVPSR 15
RNPC2-231 231 RPRDLEEFFSTVGKV 15
RNPC2-420 420 NGFELAGRPMKVGHV 15
RNPC2-662 662 AGKMITAAYVPLPTY 15
RNPC2-551 551 TEASALAAAASVQPL 15
RNPC2-561 561 SVQPLATQCFQLSNM 15
RNPC2-266 266 EFVDVSSVPLAIGLT 15
ROCK2-Rho-相关的、含卷曲螺旋的蛋白激酶2 NM_004850
ROCK2-1334 1334 TNRTLTSDVANLANE 15
ROCK2-403 403 YADSLVGTYSKIMDH 15
ROCK2-1517 1517 DIEQLRSQLQALHIG 15
ROCK2-163 163 YAMKLLSKFEMIKRS 15
ROCK2-66 66 SLLDGLNSLVLD 12
ROCK2-1127 1127 ENNHLMEMKMNLEKQ 15
ROCK2-1018 1018 EERTLKQKVENLLLE 15
ROCK2-1296 1296 HKQELTEKDATIASL 15
ROCK2-644 644 VNTRLEKTAKELEEE 15
ROCK2-818 818 KNCLLETAKLKLEKE 15
RPL15-核糖体蛋白L15 NM_002948
RPL15-118 118 FARSLQSVA 9
RPL15-114 114 NQLKFARSLQSVA 12
RPL15-17 17 KQSDVMRFLLRVRCW 15
RUNDC1-含RUN结构域蛋白1 NM_173079
RUNDC1-704 704 PKQSLLTAIHMVLTE 15
RUNDC1-795 795 SALNLLSRLSSLKFS 15
RUNDC1-110 110 ERRRLDSALLALSSH 15
RUNDC1-466 466 TGLHLMRRALAVLQI 15
RUNDC1-439 439 NEQRLVSWVNLICKS 15
RUNDC1-316 316 LDMNLNEDISSLSTE 15
RUNDC1-507 507 YSPLLKRLEVSVDRV 15
RUNDC1-332 332 LRQRVDAAVAQIVNP 15
RUNDC1-248 248 QKELILQLKTQLDDL 15
RUNDC1-3 3 MAAIEAAAEPVTVV 15
RUNDC1-576 576 VRKELTVAVRDLLAH 15
RUTBC3-含RUN和TBC1结构域蛋白3 NM_015705
RUTBC3-862 862 PEELLYRAVQSVNVT 15
RUTBC3-386 386 LHWFLTAFASVVDIK 15
RUTBC3-904 904 WLEVLCSSLPTVE 13
RUTBC3-482 482 VAMRLAGSLTDVAVE 15
RUTBC3-475 475 DAELLLGVAMRLAGS 15
RUTBC3-581 581 LVADLREAILRVARH 15
RUTBC3-892 892 CVGLNEQVLHLWLE 15
RUTBC3-462 462 NTLSDIPSQMEDA 13
RUTBC3-81 81 PGSSLLANSPLMEDA 15
RUTBC3-307 307 AFWMMSAIIEDLLPA 15
RUTBC3-246 246 GVPRLRRVLRALAWL 15
RUTBC3-413 413 GSRVLFQLTLGMLHL 15
RUTBC3-338 338 LRHLIVQYLPRLDKL 15
RUTBC3-740 740 GDDSVTEGVTDLVRG 15
RUTBC3-349 349 LDKLLQEHDIELSLI 15
RUTBC3-502 502 HLAYLIADQGQLLGA 15
SBDS-Shwachman-Bodian-Diamond综合征 NM_016038
SBDS-71 71 LDEVLQTHSVFVNVS 15
SBDS-108 108 CKQILTKGEVQVSDK 15
SBDS-252 252 LKEKLKPLIKVIESE 15
SBDS-148 148 QLEQMFRDIATIVAD 15
SCNN1A-钠通道,非电压门控蛋白1α NM_001038
SCNN1A-732 732 PSVTMVTLLSNLGSQ 15
SCNN1A-346 346 ILSRLPETLPSLEED 15
SCNN1A-786 786 VFDLLVIMFLMLLRR 15
SCNN1A-343 343 YINILSRLPETLPSL 15
SCNN1A-88 88 NNTTIHGAIRLVCSQ 15
SCNN1A-272 272 VASSLRDNNPQVD 13
SCNN1A-166 166 NSDKLVFPAVTICTL 15
SCNN1A-778 778 VEMAELVFDLLVI 13
SCNN1A-471 471 LLSTVTGARVMVHGQ 15
SCNN1A-787 787 FDLLVIMFLMLLRRF 15
SCNN1A-502 502 VETSISMRKETLDRL 15
SCNN1A-745 745 SQWSLWFGSSVLSV 14
SCNN1A-226 226 LYKYSSFTTLVAGS 14
SCNN1A-184 184 RYPEI KEELEELDRI 15
SCP2-固醇载体蛋白2 NM_002979
SCP2-330 330 QKYGLQSKAVEILAQ 15
SCP2-318 318 AAAAILASEAFVQKY 15
SCP2-719 719 GNMGLAMKLQNLQLQ 15
SCP2-728 728 QNLQLQPGNAKL 13
SCP2-165 165 GFEKMSKGSLGIKFS 15
SCP2-418 418 TNELLTYEALGLCPE 15
SCP2-153 153 QGGVAECVLALGFE 16
SCP2-268 268 DEYSLDEVMASKEVF 15
SCP2-233 233 GKEHMEKYGTKIEHF 15
SCP2-100 100 YHSLGMTGIPIINV 15
SDCCAG1-血清学决定性结肠癌抗原1,NY-CO-1 NM_004713
SDCCAG1-13 13 LRAVLAELNASLLGM 15
SDCCAG1-934 934 LASCTSELISE 13
SDCCAG1-232 232 TLERLTEIVASAPKG 15
SDCCAG1-860 860 TGEYLTTGSFMIRGK 15
SDCCAG1-475 475 LKGELIEMNLQIVDR 15
SDCCAG1-417 417 DLKALQQEKQALKKL 15
SDCCAG1-942 942 TSELISEEMEQLDGG 15
SDCCAG1-9 9 STIDLRAVLAELNAS 15
SDCCAG1-482 482 MNLQIVDRAIQVVRS 15
SDCCAG1-165 165 GNIVLTDYEYVILNI 15
SDCCAG1-71 71 KATLLLESGIRIHTT 15
SDCCAG1-627 627 NKPLLVDVDLSLSAY 15
SDCCAG1-21 21 NASLLGMRVNNVYDV 15
SDCCAG1 0-血清学决定性结肠癌抗原10,NY-CO-10 NM_005869
SDCCAG10-311 311 KRELLAAKQKKVENA 15
SDCCAG10-400 400 FKSKLTQAIAETPEN 15
SDCCAG10-393 393 TLALLNQFKSKLTQA 15
SDCCAG10-159 159 EEEEVNRVSQSMKGK 15
SDCCAG3-血清学决定性结肠癌抗原3,NY-CO-3 NM_006643
SDCCAG3-322 322 DYHDLESVVQQVEQN 15
SDCCAG3-350 350 HVVKLKQEISLLQA 14
SDCCAG3-192 192 PSWALSDTDSRVSP 14
SDCCAG3-418 418 LRVVMNSAQASIKQL 15
SDCCAG3-428 428 SIKQLVSGAETLNLV 15
SDCCAG3-262 262 ENSKLRRKLNEVQSF 15
SDCCAG3-255 255 SYDALKDENSKLRRK 15
SDCCAG3-411 411 ADVALQNLRVVMNSA 15
SDCCAG3-462 462 AEILKSIDRISEI 13
SDCCAG3-248 248 HLRTLQISYDALKDE 15
SDCCAG8-血清学决定性结肠癌抗原8,NY-CO-8 NM_006642
SDCCAG8-419 419 ERDDLMSALVSVRSS 15
SDCCAG8-557 557 KMLILSQNIAQLEAQ 15
SDCCAG8-815 815 ECCTLAKKLEQISQK 15
SDCCAG8-423 423 LMSALVSVRSSLADT 15
SDCCAG8-945 945 ERQSLSEEVDRLRTQ 15
SDCCAG8-564 564 NIAQLEAQVEKVTKE 15
SDCCAG8-397 397 HEAVLSQTHTNVHMQ 15
SDCCAG8-582 582 AINQLEEIQSQLASR 15
SDCCAG8-798 798 QYLLLTSQNTFLTKL 15
SDCCAG8-776 776 LTQKIQQMEAQ 13
SDCCAG8-589 589 QSQLASREMDV 13
SDCCAG8-156 156 NMPTMHDLVHTINDQ 15
SDCCAG8-561 561 LSQNIAQLEAQVEKV 15
SDCCAG8-184 184 CKEELSGMKNKIQVV 15
SDCCAG8-35 35 LTCALKEGDVTIG 13
SDCCAG8-28 28 ASRSIHQLTCALKEG 15
SDCCAG8-952 952 EVDRLRTQLPSMPQS 15
SDCCAG8-13 13 LEEILGQYQRSLREH 15
SDCCAG8-550 550 EREYMGSKMLILSQN 15
SEC14L1-SEC14-样蛋白1 NM_003003
SEC14L1-488 488 GEEALLRYVLSVNEE 15
SEC14L1-560 560 GVKALLRIIEVVEAN 15
SEC14L1-190 190 EKIAMKQYTSNIKKG 15
SEC14L1-88 88 DAPRLLKKIAGVDYV 15
SEC14L1-730 730 LIQIVDASSVITWD 15
SEC14L1-106 106 QKNSLNSRERTLHIE 15
SEC14L1-948 948 GFSQLSAATTSSSQS 15
SEC14L1-810 810 KVWQLGRDYSMVESP 15
SEC14L1-803 803 NNVQLIDKVWQLGRD 15
SEC14L1-882 882 SLPRVDDVLASLQVS 15
SEC14L1-579 579 LGRLLILRAPRVFPV 15
SEC14L1-1 1 MVQKYQSPVRVY 12
SEC14L1-493 493 LRYVLSVNEERLRRC 15
SEC14L1-263 263 SKKQAASMAVVIPEA 15
SEC14L1-898 898 HKCKVMYYTEVIGSE 15
SFRS2IP-剪接因子,富精氨酸/丝氨酸2,相互作用蛋白 NM_004719
SFRS2IP-1417 1417 AAVKLAESKVSVAVE 15
SFRS2IP-339 339 PLSDLSENVESVVNE 15
SFRS2IP-491 491 LEKSLEEKNESLTEH 15
SFRS2IP-336 336 VSCPLSDLSENVESV 15
SFRS2IP-400 400 ESPKLESSEGEIIQT 15
SFRS2IP-1277 1277 LPLHLHTGVPLMQVA 15
SFRS2IP-1206 1206 LPINMMQPQMNVMQQ 15
SFRS2IP-1492 1492 YKEIVRKAVDKVCHS 15
SFRS2IP-1207 1207 PINMMQPQMNVMQQQ 15
SFRS2IP-158 158 DSSNICTVQTHVENQ 15
SFRS2IP-232 232 DLPVLVGEEGEVKKL 15
SFRS2IP-173 173 SANCLKSCNEQIEES 15
SLC2A11-溶质载体家族2,成员11,GLUT10;GLUT11 NM_030807
SLC2A11-403 403 GNDSVYAYASSVFRK 15
SLC2A11-381 381 LRRQVTSLVVL 12
SLC2A11-147 147 KSLLVNNIFVVSAA 14
SLC2A11-110 110 LFGALLAGPLAITLG 15
SLC2A11-93 93 LVLLMWSLIVSLYPL 15
SLC2A11-501 501 FPWTLYLAMACIFAF 15
SLC2A11-174 171 EMIMLGRLLVGVNAG 15
SLC2A11-151 151 LVNNIFVVSAAILFG 15
SLC2A11-233 233 MSSAIFTALGIVMGQ 15
SLC2A11-229 229 GAVAMSSAIFTALGI 15
SLC2A11-91 91 DHLVLLMWSLIVSLY 15
SLC2A11-237 237 FTALGIVMGQVVGL 15
SLC2A11-178 178 LGRLLVGVNAGVSMN 15
SLC2A11-567 567 VCGALMWIMLILVGL 15
SOX8-SRY(性别决定区Y)-box8 NM_014587
SOX8-173 173 HNAELSKTLGKLWRL 15
SOX8-349 349 SNVDISELSSEVMGT 15
SOX8-88 88 FPACIRDAVSQVLKG 15
SOX8-161 161 ARRKLADQYPHLHNA 15
SOX8-352 352 DISELSSEVMGT 12
SOX8-263 263 GGGAVYKAEAGLGDG 15
SOX8-17 17 SPSGTASSMSHVEDS 15
SOX8-177 177 LSKTLGKLWRLLSES 15
SOX8-96 96 VSQVLKGYDWSLVPM 15
SSRP1-结构特异性识别蛋白1 NM_003146
SSRP1-414 414 MSGSLYEMVSRVMKA 15
SSRP1-425 425 VMKALVNRKITVPGN 15
SSRP1-418 418 LYEMVSRVMKALVNR 15
SSRP1-786 786 SITDLSKKAGEIWKG 15
SSRP1-391 391 SLTLNMNEEEVEKR 15
SSRP1-78 78 RRVALGHGLKLLTKN 15
SSRP1-410 410 LTKNMSGSLYEMVSR 15
SSRP1-84 84 HGLKLLTKNGHVYKY 15
SSTR5-生长抑素受体5 NM_001053
SSTR5-152 152 FGPVLCRLVMTLDGV 15
SSTR5-100 100 NIYILNLAVADVLYM 15
SSTR5-329 329 SERKVTRMVLVVVLV 15
SSTR5-352 352 FTVNIVNLAVAL 15
SSTR5-230 230 WVLSLCMSLPLLVFA 15
SSTR5-104 104 LNLAVADVLYMLGLP 15
SSTR5-332 332 KVTRMVLVVVLVFAG 15
SSTR5-176 176 TVMSVDRYLAVVHPL 15
SSTR5-75 75 CAAGLGGNTLVIYVV 15
STK16-丝氨酸/苏氨酸激酶16,MPSK;PKL12 NM_003691
STK16-351 351 ALRQLLNSMMTVD 13
STK16-390 390 HIPLLLSQLEALQPP 15
STK16-348 348 HSSALRQLLNSMMTV 15
STK16-147 147 RGTLWNEIERLKDK 14
STK16-232 232 DLGSMNQACIHVEGS 15
STK16-304 304 WSLGCVLYAMMFG 13
STUB1-STIP1同源性和含U-Box的蛋白1,NY-CO-7 NM_005861
STUB1-223 223 LHSYLSRLIAA 12
STUB1-100 100 HEQALADCRRALELD 15
STUB1-93 93 CYLKMQQHEQALADC 15
STUB1-340 340 DRKDIEEHLQRVGHF 15
STUB1-273 273 YMADMDELFSQV 12
TAF10-TAF10 NM_006284
TAF10-164 164 FLMQLEDYTPTIPDA 15
TAF10-266 266 LTPALSEYGINVKKP 15
TAF10-157 157 SSTPLVDFLMQLEDY 15
TAF10-112 112 PEGAISNGVYVLPSA 15
TAF10-259 259 YTLTMEDLTPALSEY 15
TP53-肿瘤蛋白p53 NM_000546
TP53-171 171 YSPALNKMFCQLAKT 15
TP53-348 348 SGNLLGRNSFEVRVC 15
TP53-340 340 TIITLEDSSGNLLGR 15
TP53-224 224 AIYKQSQHMTEV 12
TP53-86 86 EAPRMPEAAPRVAPA 15
TP53-24 24 DLWKLLPENNVLSPL 15
TP53-31 31 ENNVLSPLPSQAMDD 15
TPS1-类胰蛋白酶,α NM_003293
TPS1-1 1 MLSLLLLALPVL 12
TPS1-174 174 EPVNISSRVHTVMLP 15
TPS1-165 165 ADIALLELEEPVNIS 15
TPS1-11 11 ALPVLASRAYAAPAP 15
TPS1-103 103 DVKDLATLRVQLREQ 15
TPS1-237 237 PPFPLKQVKVPIMEN 15
TPSB1-胰蛋白酶β 1 NM_003294
TPSB1-174 174 EPVNVSSHVHTVTLP 15
TPSB1-1 1 MLNLLLLALPVL 12
TPSB1-165 165 ADIALLELEEPVNVS 15
TPSB1-103 103 DVKDLAALRVQLREQ 15
TPSB1-11 11 ALPVLASRAYAAPAP 15
TPSB1-159 159 YTAQIGADIALLELE 15
TPSD1-胰蛋白酶δ1 NM_012217
TPSD1-3 3 MLLLAPQMLSLLLL 15
TPSD1-181 181 EPVNISSHIHTVTLP 15
TPSD1-149 149 YQDQLLPVSRIIVHP 15
TPSD1-10 10 QMLSLLLLALPVLAS 15
TPSD1-172 172 ADIALLELEEPVNIS 15
UBE2I-遍在蛋白缀合酶E21 NM_003345
UBE2I-150 150 PAITIKQILLGIQEL 15
UBE2I-154 154 IKQILLGIQELLNEP 15
UTP14A-UTP14,U3核仁小核糖核蛋白,homA,NY-CO-16 NM_006649
UTP14A-66 66 KLLEAISSLDGK 12
UTP14A-5 5 TANRLAESLLALSQQ 15
UTP14A-107 107 EKLVLADLLEPVKTS 15
UTP14A-905 905 EKRNIHAAAHQV 12
UTP14A-668 668 EEPLLLQRPERV 12
UTP14A-144 144 VKKQLSRVKSK 12
UTP14A-818 818 IRDFLKEKREAVEAS 15
UTP14A-223 223 LEKEEPAIAPI 12
UTP14A-182 182 TAQVLSKWDPVVLKN 15
UTP14A-89 89 SEASLKVSEFNVSSE 15
UTP14A-627 627 VLSELRVLSQKLKEN 15
UTP14A-254 254 IFNLLHKNKQPVTDP 15
UTP14A-246 246 ARTPLEQEIFNLLHK 15
WFIKKN1-含WAP,follis/kazal,im,kunitz和神经生长因子结构域的蛋白 NM_053284
WFIKKN1-583 583 SDFAIVGRLTEVLEE 15
WFIKKN1-15 15 LLLRLTSGAGLLPGL 15
WFIKKN1-3 3 MPALRPLLPLLLLL 14
WFIKKN1-723 723 ILELLEKQACELLNR 15
WFIKKN1-640 640 GLKFLGTKYLEVTLS 15
WFIKKN1-576 576 LALSLCRSDFAIVGR 15
WFIKKN1-645 645 GTKYLEVTLSGMDWA 15
WFIKKN1-324 324 YGNVVVTSIGQLVLY 15
WFIKKN1-701 701 DGVAVLDAGSYVRAA 15
WFIKKN1-716 716 SEKRVKKILELLEKQ 15
WFIKKN1-506 506 YSPLLQQCHPFVYGG 15
ZNF28-锌指蛋白28(KOX24) NM_006969
ZNF28-15 15 VYDKIFEYNSYLAKH 15
ZNF28-92 92 ECGIVFNQQSHLASH 15
ZNF292-锌指蛋白292 XM_048070
ZNF292-2597 2597 QMMALNSCTTSINSD 15
ZNF292-562 562 PNGKLIEEISEVDCK 15
ZNF292-3236 3236 TPEEIESMTASVDVG 15
ZNF292-1500 1500 TTPLLQSSEVAVSIK 15
ZNF292-2768 2768 SQCVLINTSVTLTPT 15
ZNF292-2630 2630 KTAMNSQILEVKSG 15
ZNF292-861 861 QCLALMGEEASIVSS 15
ZNF292-662 662 QLSLLTKTVYHIFFL 15
ZNF292-2165 2165 ASMILSTNAVNLQQP 15
ZNF292-1850 1850 FPAHLASVSTPLLSS 15
ZNF292-330 330 PLPLLEVYTVAIQSY 15
ZNF292-659 659 RCRQLSLLTKTVYHI 15
ZNF292-502 502 KTNQLSQATALAKLC 15
ZNF292-2529 2529 LVENLTQKLNNVNNQ 15
ZNF292-2160 2160 QPSLLASMILSTNAV 15
ZNF292-3885 3885 VLKQLQEMKPTVSLK 15
ZNF292-1902 1902 QGGMLCSQMENLPST 15
ZNF292-2479 2479 TTMGLIAKSVEIPTT 15
ZNF292-1105 1105 KKNSLYSTDFIVFND 15
ZNF292-347 347 ARPYLTSECENVALV 15
ZNF292-868 868 EEASIVSSIDELNDS 15
ZNF292-3630 3630 TKLINEDSTSVETQ 15
ZNF292-1921 1921 QMEDLTKTVLPLNID 15
ZNF292-263 263 LGERLQELELQLRES 15
ZNF292-2553 2553 FKTSLESHTVLAPLT 15
ZNF292-3415 3415 KKNNLENKNAKIVQI 15
ZNF292-1612 1612 TPQNLERQVNNLMTF 15
ZNF292-1597 1597 QNSLVNSETLKIGDL 15
ZNF292-3193 3193 DCSRIFQAITGLIQH 15
ZNF292-3154 3154 HKSDLPAFSAEVEEE 15
ZNF292-2846 2846 TKDALFKHYGKIHQY 15
ZNF292-2533 2533 LTQKLNNVNNQLFMT 15
ZNF292-2163 2163 LIASMILSTNAVNLQ 15
ZNF292-862 862 CLALMGEEASIVSSI 15
AHSA2-AHA1,热休克90蛋白ATP酶同系物2的激活物 NM_152392
AHSA2-18 18 VKRKLSGNTLQVQAS 15
AHSA2-7 7 PTKAMATQELTVKRK 15
AHSA2-33 33 SPVALGVRIPTVALH 15
AHSA2-115 115 FVPTLGQTELQL 12
CSNK1G1-酪蛋白激酶1,γ1 NM_022048
CSNK1G1-189 189 AIQLLSRMEYVHSK 15
CSNK1G1-183 183 LKTVLMIAIQLLSRM 15
CSNK1G1-342 342 KADTLKERYQKIGDT 15
CSNK1G1-273 273 EHKSLTGTARYM 12
CSNK1G1-390 390 FPEEMATYLRYVRRL 15
CSNK1G1-411 411 DYEYLRTLFTDLFEK 15
CSNK1G1-467 467 GSVHVDSGASAITRE 15
DKFZp451M2119 NM_182585
DKFZp451M2119-80 80 APTQMSTVPSGLPLP 15
DKFZp451M2119-30 30 DEGLVEGKVVRLGQG 15
DKFZp451M2119-234 234 QILWLYSKSSLAL 13
DKFZP564M182 NM_015659
DKFZP564M182-309 309 QIEHIIENIVAVTKG 15
DKFZP564M182-77 77 NYGLLLNENESLFLM 15
DKFZP564M182-86 86 ESLFLMVVLWKIPSK 15
DKFZP564M182-344 344 KSAALPIFSSFVSNW 15
DKFZP564M182-190 190 KLRLLSSFDFFLTDA 15
DKFZP564M182-585 585 KEEAVKEKSPSLGKK 15
DKFZP564M182-313 313 IENIVAVTKGLSEK 15
DKFZP564M182-164 164 NKHGIKTVSQIISLQ 15
DKFZP564M182-260 260 INDCIGGTVLNISKS 15
MAGEA4 NM_002362
MAGEA4-151 151 FREALSNKVDELAHF 15
MAGEA4-171 171 RAKELVTKAEMLERV 15
MAGEA4-391 391 SYVKVLEHVVRVNAR 15
MAGEA4-265 265 KTGLLIIVLGTIAME 15
MAGEA4-414 414 REAALLEEEEGV 12
MAGEA4-395 395 VLEHVVRVNARVRIA 15
MELK-母体胚亮氨酸拉链激酶 NM_014791
MELK-783 783 NPDQLLNEIMSILPK 15
MELK-322 322 SSILLLQQMLQVDPK 15
MELK-157 157 VFRQIVSAVAYVHSQ 15
MELK-31 31 ACHILTGEMVAIKIM 15
MELK-784 784 PDQLLNEIMSILPKK 15
MELK-145 145 RLSEEETRVVFR 12
MELK-417 417 QYDHLTATYLLLLAK 15
MELK-722 722 LERGLDKVITVLTRS 15
MELK-234 234 CCGSLAYAAPELIQG 15
MELK-67 67 NTLGSDLPRIKTE 13
MELK-315 315 VPKWLSPSSILLLQQ 15
MELK-718 718 VFGSLERGLDKVITV 15
MELK-95 95 QLYHVLETANKIFMV 15
MELK-74 74 DLPRIKTEIEALKNL 15
MELK-642 642 RNQCLKETPIKIPVN 15
MELK-180 180 PENLLFDEYHKLKLI 15
MELK-241 241 AAPELIQGKSYLGSE 15
NEXN-nexilin(F肌动蛋白结合蛋白) NM_144573
NEXN-81 81 GDDSLLITVVPVKSY 15
NEXN-34 34 QRELAKRAEQIED 14
NEXN-382 382 NLKSKFEKIGQL 12
NEXN-340 340 ETFGLSREYEELIKL 15
NEXN-261 261 SQEFLTPGKLEINFE 15
NEXN-661 661 KGSAASTCILTIESK 15
NFE2L2-核因子(源于红细胞的蛋白2)-样蛋白2 NM_006164
NFE2L2-409 409 SPATLSHSLSELLNG 15
NFE2L2-741 741 SLHLLKKQLSTLYLE 15
NFE2L2-745 745 LKKQLSTLYLEVFS 14
NFE2L2-164 164 CMQLLAQTFPFVDDN 15
NFE2L2-626 626 TRDELRAKALHIPFP 15
NFE2L2-506 506 EVEELDSAPGSVKQN 15
NFE2L2-249 249 DIEQVWEELLSIPEL 15
NFE2L2-315 315 FYSSIPSMEKEVGNC 15
NFRKB-与KB结合蛋白相关的核因子 NM_006165
NFRKB-413 413 GDLTLNDIMTRVNAG 15
NFRKB-559 559 LEILLLESQASLPML 15
NFRKB-1575 1575 SAVSLPSMNAAVSKT 15
NFRKB-1221 1221 TVTSLPATASPV 12
NFRKB-626 626 ALQYLAGESRAVPSS 15
NFRKB-1599 1599 TPISISTGAPTVRQV 15
NFRKB-553 553 SFFSLLLEILLLESQ 15
NFRKB-226 226 KQILASRSDLLEMA 14
NFRKB-1568 1568 GTVHTSAVSLPSM 13
NFRKB-1094 1094 TMLSPASSQTAPS 13
NFRKB-546 546 GINEISSSFFSLLLE 15
NFRKB-88 88 DVVSLSTWQEVLSDS 5
NFRKB-1675 1675 IKGNLGANLSGLGRN 5
NUP107-核孔蛋白107kDa NM_020401
NUP107-413 413 KQRQLTSYVGSVRPL 15
NUP107-577 577 IYAALSGNLKQLLPV 15
NUP107-345 345 QRDSLVRQSQLVVDW 15
NUP107-471 471 DEVRLLKYLFTLIRA 15
NUP107-1218 1218 LLQKLRESSLMLLDQ 15
NUP107-632 632 VEQEIQTSVATLDET 15
NUP107-782 782 SIEVLKTYIQLLIRE 15
NUP107-225 225 SFLKHSSSTVFDL 13
NUP107-1099 1099 WKGHLDALTADVKEK 15
NUP107-734 734 LPGHLLRFMTHLILF 15
NUP107-339 339 VVEALFQRDSLVRQS 15
NUP107-250 250 QVNILSKIVSRATPG 15
NUP107-1110 11 10 VKEKMYNVLLFVDGG 15
NUP107-1211 1211 SKEELRKLLQKLRES 15
NUP107-656 656 ANWTLEKVFEELQAT 15
NUP107-811 811 QDLAVAQYALFLESV 15
NUP107-472 472 EVRLLKYLFTLIRAG 15
NUP107-420 420 YVGSVRPLVTELDPD 15
NUP107-940 940 RAEALKQGNAIMRKF 15
RPA2-复制蛋白A2,32kDa NM_002946
RPA2-79 79 LSATLVDEVFRIGNV 15
RPA2-322 322 KHMSVSSIKQAVDFL 15
RPA2-267 267 PANGLTVAQNQVLNL 15
RPA2-71 71 VPCTISQLLSATLVD 15
RPA2-325 325 SVSSIKQAVDFLSNE 15
USP34-泛素特异性蛋白酶34 NM_014709
USP34-3151 3151 FLLSLQAISTMVHFY 15
USP34-1119 1119 QKHALYSHSAEVQVR 15
USP34-1967 1967 QGTSLIQRLMSVAYT 15
USP34-2383 2383 ATCYLASTIQQLYMI 15
USP34-3318 3318 IVSMLFTSIAKLTPE 15
USP34-397 397 PLRHLLNLVSALEPS 15
USP34-4106 4106 FTETVKLSVLVAYE 15
USP34-1351 1351 CMESLMIASSSLEQE 15
USP34-3874 3874 DLVELLSIFLSVLKS 15
USP34-3310 3310 YNNRLAEHIVSMLFT 15
USP34-2226 2226 GLTGLLRLATSVVKH 15
USP34-4264 4264 NRVEISKASASLNGD 15
USP34-4202 4202 MTHFLLKVQSQVFSE 15
USP34-1961 1961 LVQGTSLIQRL 11
USP34-4518 4518 PSTSISAVLSDLADL 15
USP34-414 414 TEQTLYLASMLIKAL 15
USP34-245     245     RLAGLSQITNQLHTF     15
USP34-4294     4294     LNPALIPTLQELLSK     15
USP34-2529     2529     FGGVITNNVVSLDCE     15
USP34-2517     2517     SPELKNTVKSLFGG     14
USP34-4219     4219     CANLISTLITNLISQ     15
USP34-3226     3226     KMIALVALLVEQ     12
USP34-3875     3875     LVELLSIFLSVLKST     15
USP34-3507     3507     LLGLLSRAKLYVDAA     15
USP34-4593     4593     LCRTIESTIHVVTRI     15
USP34-3106     3106     HSKHLTEYFAFLYEF     15
USP34-2227 2227 LTGLLRLATSVVKHK 15
USP34-2090     2090     NRSFLLLAASTL     12
USP34-1103     1103     FFDNLVYYIQTVREG     15
USP34-416     416     QTLYLASMLIKALWN     15
USP34-3801     3801     CWTTLISAFRILLES     15
USP34-2439     2439     TLLELQKMFTYLMES     15
USP34-465     465     SFASLLNTNIPIGNK     15
USP34-238     238     MSPTLTMRLAGLSQI     15
USP34-3556     3556     MTYCLISKTEKLMFS     15
USP34-3496     3496     TTVVLHQVYNVLLGL     15
USP34-3488     3488     RDLPLSPDTTVVLHQ     15
USP34-3327     3327     KMIALVALLVEQS     13
USP34-2925     2925     DPKAVSLMTAKLSTS     15
AARS-丙氨酰-tRNA合成酶     NM_001605
AARS-1289     1289     EALQLATSFAQLRLG     15
AARS-402     402     AYRVLADHARTITVA     15
AARS-1108     1108     QKDELRETLKSLKKV     15
AARS-327     327     TGMGLERLVSVLQNK     15
AARS-889     889     ANEMIEAAKAVYTQ     15
AARS-1046     1046     LKKCLSVMEAKVKAQ     15
AARS-539     539     LDRKIQSLGDS     15
AARS-1115     1115     TLKSLKKVMDDLDRA     15
AARS-1042     1042     KAESLKKCLSVMEAK     15
AARS-1017     1017     TEEAIAKGIRRIVAV     15
AARS-820     820     ATHILNFALRSVLGE     15
AARS-482     482     VVQSLGDAFPELKKD     15
AARS-658     658     YNYHLDSSGSYVFEN     15
AARS-1135     1135     QKRVLEKTKQFIDSN     15
ABL1-v-ab1艾贝尔逊鼠白血病病毒癌基因同系物1 NM_005157
ABL1-1515     1515     DFSKLLSSVKEISDI     15
ABL1-1342     1342     PLSTLPSASSALAGD     15
ABL1-349     349     KKYSLTVAVKTLKED     15
ABL1-465     465     NAVVLLYMATQISSA     15
ABL1-1427     1427     NSEQMASHSAVLEAG     15
ABL1-472     472     MATQISSAMEYLEKK     15
ABL1-937 937 SPHLWKKSSTLTSS 14
ABL1-1488 1488 KLENNLRELQIC 12
ABL1-1362 1362 AFIPLISTRVSLRKT 15
ABL1-260 260 TLAELVHHHSTVADG 15
ABL1-1409 1409 VVLDSTEALCLA 12
ABL1-557 557 APESLAYNKFSIKSD 15
ACAT2-乙酰辅酶A转乙酰酶2 NM_005891
ACAT2-488 488 GCRILVTLLHTLERM 15
ACAT2-9 9 DPVVIVSAARTIIGS 15
ACAT2-424 424 DIFEINEAFAAVSAA 15
ACAT2-322 322 KPYFLTDGTGTVTPA 15
ACAT2-428 428 INEAFAAVSAAIVKE 15
ACAT2-491 491 LVTLLHTLERMGRS 15
ACAT2-337 337 NASGINDGAAAVALM 15
AKAP13-A激酶(PRKA)锚定蛋白13 NM_006738
AKAP13-2954 2954 EQEDLAQSLSLVKDV 15
AKAP13-3489 3489 LTRSLSRPSSLIEQE 15
AKAP13-3096 3096 FASLDQKSTVISLK 15
AKAP13-229 229 PRETLMHFAVRLGLL 15
AKAP13-3077 3077 QAVLLTDILVFLQEK 15
AKAP13-1520 1520 PNVLLSQEKNAVLGL 15
AKAP13-585 585 DQESLSSGDAVLQRD 15
AKAP13-3420 3420 LVFMLKRNSEQVVQS 15
AKAP13-3306 3306 PLMKSAINEVEIL 13
AKAP13-3069 3069 GRLKEVQAVLLTD 13
AKAP13-1688 1688 GADLIEEAASRIVDA 15
AKAP13-1052 1052 DQAVISDSTFSLANS 15
AKAP13-383 383 FKLMNIQQQLMKT 13
AKAP13-1024 1024 LDKPLTNMLEVVSHP 15
AKAP9-A激酶(PRKA)锚定蛋白(yotiao)9 NM_005751
AKAP9-5282 5282 DRALTDYITRLEAL 14
AKAP9-4202 4202 DRRSLLSEIQALHAQ 15
AKAP9-1964 1964 QEQLEEEVAKVIVS 14
AKAP9-3115 3115 EIDQLNEQVTKLQQ 14
AKAP9-1825 1825 QVQELESLISSLQQQ 15
AKAP9-3715 3715 NMTSLQKDLSQVRDH 15
AKAP9-2532 2532 LLEAISETSSQLEHA 15
AKAP9-4287 4287 LQEQLSSEKMVVAEL 15
AKAP9-2360 2360 ANNRLLKILLEVVKT 15
AMOTL2-angiomotin样蛋白2 NM_016201
AMOTL2-415 415 GSAHLAQMEAVLREN 15
AMOTL2-583 583 EQEKLEREMALLRGA 15
AMOTL2-473 473 RIEKLESEIQRLSEA 15
AMOTL2-656 656 KVERLQQALGQLQAA 15
AMOTL2-480 480 EIQRLSEAHESLTRA 15
AMOTL2-330 330 EVRILQAQVPPVFLQ 15
ANKHD1-含锚蛋白重复序列和KH结构域的蛋白1 NM_017747
ANKHD1-245 245 VSCALDEAAAALTRM 15
ANKHD1-2244 2244 TPNSLSTSYKTVSLP 15
ANKHD1-1352 1352 LTDTLDDLIAAVSTR 15
ANKHD1-234 234 DPEVLRRLTSSVSCA 15
ANKHD1-2955 2955 AAVQLSSAVNIMNGS 15
ANKHD1-1356 1356 LDDLIAAVSTRVPTG 15
ANKHD1-1061 1061 KLNELGQRISAIEK 14
ANKHD1-336 336 GYYELAQVLLAMHAN 15
ANKHD1-340 340 LAQVLLAMHANVEDR 15
ANKHD1-3006 3006 GPATLFNHFSSLFDS 15
ANKHD1-2308 2308 RSKKLSVPASVVSRI 15
ANKRD11-锚蛋白重复序列结构域11 NM_013275
ANKRD11-3272 3272 TREVIQQTLAAIVDA 15
ANKRD11-304 304 KQLLAAGAEVNTK 13
ANKRD11-3400 3400 PPPSLAEPLKELFRQ 15
ANKRD11-822 822 KSPFLSSAEGAVPKL 15
ANKRD11-2154 2154 FERMLSQKDLEIEER 15
ANKRD11-3407 3407 PLKELFRQQEAVRGK 15
ANKRD13-锚蛋白重复序列结构域13 NM_033121
ANKRD13-499 499 FPLSLVEQVIPIIDL 15
ANKRD13-720 720 QESLLTSTEGLCPS 15
ANKRD13-781 781 WELRLQEEEAELQQV 15
ANKRD13-266 266 ERFDLSQEMERLTLD 15
ANKRD13-74 74 SLGHLESARVLLRHK 15
ANKRD13-404 404 DRNPLESLLGTVEHQ 15
ANKRD17-锚蛋白重复序列结构域17 NM_032217
ANKRD17-1379 1379 LNDTLDDIMAAV 12
ANKRD17-263 263 DPEVLRRLTSSVSCA 15
ANKRD17-3102 3102 PESMLSGKSSYLPNS 15
ANKRD17-386 386 GYYELAQVLLAMHAN 15
ANKRD17-1667 1667 MLAAMNGHTAAVKLL 15
ANKRD17-478 478 VVKVLLESGASIEDH 15
ANKRD17-390 390 LAQVLLAMHANVEDR 15
ANKRD17-188 188 ENPMLETASKLLLSG 15
ANKRD30A-锚蛋白重复序列结构域30A NM_052997
ANKRD30A-577 577 DSRSLFESSAKIQVC 15
ANKRD30A-158 158 NKASLTPLLLSITKR 15
ANKRD30A-1219 1219 DSTSLSKILDTVHS 14
ANKRD30A-1428 1428 ENCMLKKEIAMLKLE 15
ANKRD30A-115 115 VYSEILSVVAKL 12
ANKRD30A-1435 1435 EIAMLKLEIATLKHQ  5
ANKRD30A-230 230 VGMLLQQNVDVFAA 15
APEX2-APEX核酸酶 NM_014481
APEX2-76 76 TRDALTEPLAIVEGY 15
APEX2-247 247 RAEALLAAGSHVIIL 15
APEX2-384 384 DYVLGDRTLVIDTF 14
APEX2-240 240 FYRLLQIRAEALLAA 15
ARID4B-富AT相互作用结构域4BBCAA;BRCAA1;SAP180 NM_016374
ARID4B-1690 1690 HYLSLKSEVASIDRR 15
ARID4B-1676 1676 RITILQEKLQEIRKH 15
ARID4B-468 468 NLFKLFRLVHKLGGF 15
ARID4B-234 234 QIDELLGKVVCVDYI 15
ARNTL-芳烃受体核转位蛋白-样蛋白 NM_001178
ARNTL-665 665 GRMIAEEIMEIHRI 15
ARNTL-808 808 DEAAMAVIMSLLEAD 15
ARNTL-579 579 EVEYIVSTNTVVLAN 15
ARNTL-153 153 KLDKLTVLRMAVQHM 15
ARNTL-814 814 VIMSLLEADAGLGGP 15
ARNTL-234 234 KILFVSESVFKILNY 15
ASPSCR1-泡状软组织肉瘤染色体部位,候选者1 NM_024083
ASPSCR1-345 345 PTRPLTSSSAKLPKS 15
ASPSCR1-223 223 LTGGSATIRFV 12
ASPSCR1-648 648 LEHAISPSAADVLVA 15
ASPSCR1-158 158 TLWELLSHFPQIREC 15
ATF3-转录激活因子3 NM_001674
ATF3-78 78 LCHRMSSALESVTVS 15
ATF3-162 162 ESEKLESVNAELKAQ 15
ATF3-169 169 VNAELKAQIEELKNE 15
ATXN3-ataxin3 NM_004993
ATXN3-32 32 SPVELSSIAHQLDEE 15
ATXN3-189 189 SDTYLALFLAQLQQE 15
ATXN3-469 469 LQAAVTMSLETVRND 15
ATXN3-254 254 RPKLIGEELAQLKEQ 15
ATXN3-99 99 FSIQVISNALKVWGL 15
B3GALT4-UDP-Gal:βGlcNAcβ1,3-半乳糖转移酶 NM_003782
B3GALT4-352 352 TGYVLSASAVQL 12
B3GALT4-9 9 FRRLLLAALLLVIVW 15
B3GALT4-32 32 GEELLSLSLASLLPA 15
BAIAP3-BAI1-相关蛋白3 NM_003933
BAIAP3-227 227 DEEALLSYLQQVFGT 15
BAIAP3-578 578 WRGELSTPAATILCL 15
BAIAP3-239 239 FGTSLEEHTEAIERV 15
BAIAP3-1261 1261 WELLLQAILQALGAN 15
BAIAP3-555 555 SHLLLLSHLLRLEHS 15
BAIAP3-1212 1212 LMKYLDEKLALLNAS 15
BAIAP3-406 406 DDVSLVEACRKLNEV 15
BCR-断裂点簇集区 NM_004327
BCR-265 265 RISSLGSQAMQMERK 15
BCR-1196 1196 ELQMLTNSCVKLQTV 15
BCR-1111 1111 LKKKLSEQESLLLLM 15
BCR-1188 1188 RSFSLTSVELQMLTN 15
BCR-1059 1059 ELDALKIKISQIKSD 15
BDP1-TFIIIB150;TFIIIB90 NM_018429
BDP1-145 145 SLVKSSVSVPSE 12
BDP1-2842 2842 TRNTISKVTSNLRIR 15
BDP1-341 341 GSIILDEESLTVEVL 15
BDP1-2385 2385 KESALAKIDAELEEV 15
BDP1-1837 1837 DIQNISSEVLSMMHT 15
BDP1-2205 2205 EKKVLTVSNSQIETE 15
BDP1-2358 2358 QLLLKEKAELLTS 13
BRD2-包含溴结构域的蛋白2,NAT;RING3 NM_005104
BRD2-711 711 RLAELQEQLRAVHEQ 15
BRD2-410 410 PPGSLEPKAARLPPM 15
BRD2-267 267 KLAALQGSVTSAHQV 15
BRD2-227 227 DIVLMAQTLEKIFLQ 15
BRD2-718 718 QLRAVHEQLAALSQG 15
BRD2-708 708 RAHRLAELQEQLRAV 15
BZW2-碱性亮氨酸拉链和W2结构域2 NM_014038
BZW2-426 426 ALKHLKQYAPLLAVF 15
BZW2-65 65 LEAVAKFLDST 12
CHTF18-染色体传递保真因子18同系物 NM_022092
CHTF18-328 328 EAQKLSDTLHSLRSG 15
CHTF18-306 306 LGVSLASLKKQVDGE 15
CHTF18-706 706 LPSRLVQRLQEVSLR 15
CHTF18-1061 1061 EKQQLASLVGTMLA 15
CHTF18-896 896 RDSSLGAVCVALDWL 15
CHTF18-321 321 RRERLLQEAQKLSDT 15
CHTF18-1045 1045 LAPKLRPVSTQLYST 15
CHTF18-1030 1030 PQALLLDALCLLLDI 15
CLIC6-氯离子细胞内通道6 NM_053277
CLIC6-408 408 GDGSLSPQAEAIEVA 15
CLIC6-787 787 HEKNLLKALRKLDNY 15
CTNNA1-连环蛋白(连环蛋白相关蛋白),α1,102kDa NM_001903
CTNNA1-172 172 AARALLSAVTRLLIL 15
CTNNA1-331 331 IYKQLQQAVTGISNA 15
CTNNA1-28 28 VERLLEPLVTQV1TL 15
CTNNA1-966 966 DIIVLAKQMCMIMME 15
CTNNA1-409 409 FRPSLEERLESIISG 15
CTNNA1-1119 1119 AKNLMNAVVQTVKAS 15
CTNNA1-1111 1111 SAMSLIQAAKNLMNA 15
CTTN-皮层肌动蛋白 NM_005231
CTTN-149 149 YQSKLSKHCSQVDSV 15
CTTN-468 468 PVEAVTSKTSNIRAN 15
CTTN-629 629 SQQGLAYATEAVYES 15
CTTN-706 706 DPDDIITNIEMIDDG 15
CTTN-660 660 YENDLGITAVALYDY 15
CTTN-427 427 KNASTFEDVTQVSSA 15
CTTNBP2-皮层肌动蛋白结合蛋白2 NM_033427
CTTNBP2-1035 1035 CVRLLLSAEAQVNAA 15
CTTNBP2-2134 2134 NNPVLSATINNLRMP 15
CTTNBP2-254 254 EAQKLEDVMAKLEEE 15
CTTNBP2-1373 1373 VSQALTNHFQAISSD 15
CTTNBP2-1901 1901 GQQAVVKAALSILLN 15
CTTNBP2-1296 1296 DCKHLLENLNALKIP 15
DAD1-细胞死亡防御因子1 NM_001344
DAD1-26 26 RLKLLDAYLLYILLT 15
DAD1-77 77 FNSFLSGFISCVGSF 15
DAD1-16 16 LEEYLSSTPQRLKLL 15
DDX5-DEAD(Asp-Glu-Ala-Asp)盒多肽5 NM_004396
DDX5-241 241 PTRELAQQVQQVAAE 15
DDX5-190 190 TLSYLLPAIVHINHQ 15
DDX5-627 627 LISVLREANQAINPK 15
DDX5-322 322 GKTNLRRTTYLVLDE 15
DDX5-620 620 KQVSDLISVLREA 13
DDX5-634 634 ANQAINPKLLQLVED 15
DDX58-DEAD(Asp-GIu-AIa-Asp)盒多肽58 NM_014314
DDX58-488 488 TIPSLSIFTLMIFDE 15
DDX58-965 965 NLVILYEYVGNVIKM 15
DDX58-1109 1109 KCKALACYTADVRVI 15
DDX58-1013 1013 LTSNAGVIEKE 12
DDX58-726 726 ICKALFLYTSHLRKY 15
DDX58-645 645 IIAQLMRDTESLAKR 15
DNAJA1-DnaJ(Hsp40)同系物,亚家族A,成员1 NM_001539
DNAJA1-384 384 ISTLDNRTIVITSH 14
DNAJA1-231 231 GPGMVQQIQSVCME 15
DNAJA1-152 152 VVHQLSVTLEDLYNG 15
DNAJA1-68 68 FKQISQAYEVLSDA 14
DNAJA1-21 21 TQEELKKAYRKLALK 15
DNAJA2-DnaJ(Hsp40)同系物,亚家族A,成员2 NM_005880
DNAJA2-240 240 LAPGMVQQMQSVCSD 15
DNAJA2-335 335 VLLLQEKEHEVFQR 15
DNAJA2-473 473 NPDKLSELEDLLPSR 15
DNAJA2-23 23 SENELKKAYRKLAKE 15
DNAJA2-489 489 EVPNIIGETEEVELQ 15
DNAJB1-DnaJ(Hsp40)同系物,亚家族B,成员1 NM_006145
DNAJB1-349 349 LREALCGCTVNVPTL 15
DNAJB1-430 430 FPERIPQTSRTVL 13
DNAJB1-338 338 GSDVIYPARISLREA 15
DNAJB1-230 230 VTHDLRVSLEEIYSG 15
DNM1L-发动蛋白1-样蛋白,DRP1;DVLP;DYMPLE;HDYNIV;VPS NM_005690
DNM1L-627 627 RFPKLHDAIVEVVTC 15
DNM1L-415 415 RINVLAAQYQSLLNS 15
DNM1L-389 389 GTKYLARTLNRLLMH 15
DNM1L-313 313 AMDVLMGRVIPVKLG 15
DNM1L-3 3 MEALIPVINKLQDV 14
DNM1L-10 10 VINKLQDVFNTVGAD 15
DRCTNNB1A-由Ctnnb1,a下调的蛋白(DRCTNNB1A) NM_032581
DRCTNNB1A-36 36 DKSSLVSSLYKV 12
DRCTNNB1A-588 588 SSHGLAKTAATVF 13
DRCTNNB1A-23 23 PETSLPNYATNLKDK 15
DRCTNNB1A-265 265 SLQSLCQICSRICVC 15
DRCTNNB1A-164 164 HTKVLSFTIPSLSKP 15
DUSP12-双特异性磷酸酶12 NM_007240
DUSP12-311 311 CRRSLFRSSSILDHR 15
DUSP12-259 259 ELQNLPQELFAVDPT 15
DUSP12-160 160 CHAGVSRSVAIITAF 15
DUSP12-114 114 LLSHLDRCVAFIG 13
ELKS-Rab6-相互作用蛋白2(ELKS) NM_015064
ELKS-241 241 KESKLSSSMNSIKTF 15
ELKS-1120 1120 MKAKLSSTQQSLAEK 15
ELKS-778 778 SSLKERVKSLQAD 13
ELKS-984 984 EVDRLLEILKEV 12
ELKS-624 624 ELLALQTKLETLTNQ 15
ELKS-1102 1102 QVEELLMAMEKVKQE 15
ELKS-1113 1113 VKQELESMKAKLSST 15
ELKS-803 803 LEEALAEKERTIERL 15
EXOSC6-外切酶体组分6 NM_058219
EXOSC6-224 224 ALTAAALALADA 12
EXOSC6-273 273 AAAGLTVALMPV 12
EXOSC6-185 185 PRAQLEVSALLLEDG 15
EXOSC6-302 302 LNQVAGLLGSG 12
EXOSC6-338 338 LYPVLQQSLVRAARR 15
EXOSC6-231 231 AALALADAGVEMYDL 15
EXOSC6-229 229 TAAALALADAGVEMY 15
EXOSC10-外切酶体组分10 NM_001001998
EXOSC10-883 883 TTCLIATAVITLFNE 15
EXOSC10-100 100 QGDRLLQCMSRVMQY 15
EXOSC10-168 168 RVGILLDEASGVNKN 15
EXOSC10-876 876 KEDNLLGTTCLIATA 15
EXOSC10-725 725 PNHMMLKIAEELPKE 15
FAHD1-含延胡索酰乙酰乙酸水解酶结构域的蛋白1 NM_031208
FAHD1-234 234 SIPYIISYVSKIITL 15
FAHD1-228 228 TSSMIFSIPYIISYV 15
FAHD1-251 251 GDIILTGTPKGVGPV 15
FRS2-成纤维细胞生长因子受体底物2 NM_006654
FRS2-32 32 DGNELGSGIMELTDT 15
FRS2-649 649 RTAAMSNLQKALPRD 15
FRS2-497 497 EDDNLGPKTPSLNGY 15
FRS2-146 146 EIMQNNSINVVEE 13
FRS2-504 504 KTPSLNGYHNNLDPM 15
FRS2-539 539 VNTENVTVPAS 12
GLIPR1-GLI发病相关蛋白1(神经胶质瘤) NM_006851
GLIPR1-329 329 SVILILSVIITILVQ 15
GLIPR1-330 330 VILILSVIITILVQL 15
GLIPR1-319 319 RYTSLFLIVNSVILI 15
GLIPR1-4 4 MRVTLATIAWMVSFV 15
GLIPR1-227 227 GFDALSNGAHFICNY 15
GMRP-1-K+离子通道四聚体化蛋白 NM_032320
GMRP-1-574 574 SITNLAAAAADIPQD 15
GMRP-1-393 393 FEFYLEEMILPLMVA 15
GMRP-1-352 352 KCRDLSALMHEL 12
GMRP-1-467 467 YSTKLYRFFKYIENR 15
GMRP-1-571 571 KSKSITNLAAAAADI 15
GNPTAG-N-乙酰半乳糖胺-1-磷酸转移酶,γ亚基 NM_032520
GNPTAG-335 335 AHKELSKEIKRLKGL 15
GNPTAG-4 4 MAAGLARLLLLLGLS 15
GNPTAG-87 87 HLFRLSGKCFSLVES 15
GOLGA1-高尔基自身抗原,高尔基亚家族a,1 NM_002077
GOLGA1-561 561 RTQALEAQIVALERT 15
GOLGA1-400 400 VITHLQEKVASLEKR 15
GOLGA1-967 967 EAFHLIKAVSVLLNF 15
GOLGA1-94 94 LEARLSDYAEQVRNL 15
GOLGA1-649 649 VSVAMAQALEEVRKQ 15
GOLGA1-351 351 KEQELQALIQQLS 13
GOLGA1-743 743 ALRTLKAEEAAVVAE 15
GOLGA1-733 733 QIHQLQAELEALRTL 15
GOLGA1-785 785 LRGPLQAEALSVNES 15
GOLGA1-904 904 PGPEMANMAPSVT 13
GOLGA2-高尔基自身抗原,高尔基亚家族a,2 NM_004486
GOLGA2-339 339 RVGELERALSAVSTQ 15
GOLGA2-1130 1130 EYIALYQSQRAVLKE 15
GOLGA2-492 492 LEAHLGQVMESVRQL 15
GOLGA2-1187 1187 KLLELQELVLRLVGD 15
GOLGA2-1061 1061 THRALQGAMEKLQS 14
GOLGA2-569 569 RVQELETSLAELRNQ 15
GOLGA2-788 788 LQEKLSELKETVELK 15
GOLGA2-721 721 QNRELKEQLAELQSG 15
GOLGA2-156 156 STESLRQLSQQLNGL 15
GOLGA4-高尔基自身抗原,高尔基亚家族a,4 NM_002078
GOLGA4-940 940 ELESLSSELS EVLKA 15
GOLGA4-1131 1 131 ERILLTKQVAEVEAQ 15
GOLGA4-2867 2867 LQTQLAQKTTLISDS 15
GOLGA4-622 622 ERISLQQELSRVKQE 15
GOLGA4-2991 2991 TKTMAKVITTVLKF 14
GOLGA4-1892 1892 NSISLSEKEAAISSL 15
GOLGA4-307 307 YISVLQTQVSLLKQR 15
GOLGA4-2065 2065 LETELKSQTARIMEL 15
GOLGA4-1830 1830 LKKELSENINAVTLM 15
GOLGA4-1572 1572 ENTFLQEQLVELKML 15
GOLGA4-2299 2299 EVHILEEKLKSVESS 15
GOLGA4-954 954 ARHKLEEELSVLKDQ 15
GOLGA4-937 937 QTELESLSSELSEV 14
GOLGB1-高尔基自身抗原,高尔基亚家族b,macrogolgin NM_004487
GOLGB1-3907 3907 EVQSLKKAMSSL 12
GOLGB1-3322 3322 KTNQLMETLKTIKKE 15
GOLGB1-3558 3558 SISQLTRQVTALQEE 15
GOLGB1-2956 2956 LQENLDSTVTQLAAF 15
GOLGB1-2618 2618 LEERLMNQLAELNGS 15
GOLGB1-2131 2131 ENQSLSSSCESLKLA 15
GOLGB1-640 640 NIASLQKRVVELENE 15
GOLGB1-2065 2065 LTKSLADVESQVSAQ 15
GOLGB1-1925 1925 KEAALTKIQTEIIEQ 15
GOLGB1-1021 1021 ERDQLLSQVKELSMV 15
GOLGB1-2381 2381 EKDSLSEEVQDLKHQ 15
GOLGB1-3551 3551 EIESLKVSISQLTRQ 15
GOLGB1-2772 2772 KISALERTVKALEFV 15
GRASP-GRP1-相关支架蛋白 NM_181711
GRASP-319 319 KDPSIYDTLESVRSC 15
GRASP-502 502 FRRRLLKFIPGLNRS 15
GRASP-259 259 RKAELEARLQYLKQT 15
GRAASP-323 323 IYDTLESVRSCLYGA 15
GRIM19-细胞死亡-调节蛋白GRIM19(GRIM19) NM_015965
GRIM19-76 76 VPRTISSASATLIMA 15
GRIM19-20 20 KTPQLQPGSAFLPRV 15
GRIM19-236 236 LRENLEEEAIIMKDV 15
GRIM19-160 160 GYSMLAIGIGTLIYG 15
GSPT1-G1至S期转换蛋白1 NM_002094
GSPT1-267 267 REHAMLAKTAGVKHL 15
GSPT1-324 324 CKEKLVPFLKKVGFN 15
GSPT1-655 655 KTIAIGKVLKLVPEK 15
HAGH-羟酰谷胱甘肽水解酶 NM_005326
HAGH-105 105 RIGALTHKITHLSTL 15
HAGH-8 8 VLPALTDNYMYLVID 15
HAGH-115 115 HLSTLQVGSLNV 12
HNRPAB-A/B异质核核糖核蛋白A/B NM_004499
HNRPAB-156 156 FGFILFKDAASVEKV 15
HNRPAB-273 273 VKKVLEKKFHTV 12
HNRPAB-167 167 VEKVLDQKEHRLDGR 15
HNRPAB-252 252 MDPKLNKRRGFVFIT 15
HSPCA-热休克90kDa蛋白1,α NM_005348
HSPCA-184 184 YSAYLVAEKVTVITK 15
HSPCA-25 25 FQAEIAQLMSLIINT 15
HSPCA-788 788 MKDILEKKVEKVVVS 15
HSPCA-901 901 YETALLSSGFSLEDP 15
HSPCA-895 895 DLVILLYETALLSSG 15
HSPD1-热休克60kDa蛋白1 NM_002156
HSPD1-726 726 GVASLLTTAEVVVTTE 15
HSPD1-543 543 RLAKLSDGVAVLKVG 15
HSPD1-571 571 VTDALNATRAAVEEG 15
HSPD1-661 661 VEKIMQSSSEVGYD 15
HSPD1-337 337 KISSIQSIVPALEIA 15
HSPD1-248 248 GNIISDAMKKVGRK 15
HUMAUANTIG-核仁GTP酶 NM_013285
HUMAUANTIG-641 641 APQLLPSSSLEVVPE 15
HUMAUANTIG-478 478 QYITLMRRIFLIDCP 15
HUMAUANTIG-710 710 ANTEMQQILTRVRQN 15
HUMAUANTIG-502 502 ETDIVLKGVVQVEKI 15
IFI16-干扰素γ-可诱导蛋白16 NM_005531
IFI16-95 95 DIPTLEDLAETLKKE 15
IFI16-9 9 KNIVLLKGLEVINDY 15
IFI16-715 715 EVMVLNATESFVYEP 15
IFI16-500 500 KKNQMSKLISEMHSF 15
IKBKAP-κ轻链多肽基因增强子的抑制物 NM_003640
IKBKAP-1658 1658 EDLALLEALSEVVQN 15
IKBKAP-1584 1584 QESDLFSETSSVVSG 15
IKBKAP-313 313 REFALQSTSEPVAGL 15
IKBKAP-719 719 VIHHLTAASSEMDEE 15
IKBKAP-1116 11 16 VCDAMRAVMESINPH 15
ILF3-白介素增强子结合因子3,90kDa NM_004516
ILF3-246 246 MEKVLAGETLSVNDP 15
ILF3-173 173 VADNLAIQLAAVTED 15
ILF3-622 622 KTAKLHVAVKVLQDM 15
ILF3-566 566 LQYKLVSQTGPVHAP 15
IQWD1-IQ基序和WD重复序列1 NM_018442
IQWD1-667 667 PASFMLRMLASLN 13
IQWD1-67 67 LEVSETAMEVDTP 13
IQWD1-653 653 NELMLEETRNTITVP 15
IQWD1-237 237 EWSSIASSSRGIGSH 15
IQWD1-575 575 EHLMLLEADNHVVNC 15
IKLHL2-kelch-样蛋白2 NM_007246
IKLHL2-661 661 GVGVLNNLLYAVGGH 15
IKLHL2-544 544 GAAVLNGLLYAVGGF 15
IKLHL2-409 409 TPMNLPKLMVVVGGQ 15
IKLHL2-252 252 ADVVLSEEFLNLGIE 15
LIMS1-LIM和衰老细胞抗原-样结构域1 NM_004987
LIMS1-419 419 LKKRLKKLAETLGRK 15
LIMS1-230 230 CGKELTADARELKGE 15
LIMS1-182 182 KCHAIIDEQPLIFKN 15
LMNA-核纤层蛋白A/C NM_005572
LMNA-406 406 RIDSLSAQLSQLQKQ 15
LMNA-731 731 AMRKLVRSVTVVEDD 15
LMNA-324 324 FESRLADALQELRAQ 15
LMNA-182 182 LEALLNSKEAALSTA 15
LMNA-410 410 LSAQLSQLQKQLAAK 15
LMNA-417 417 LQKQLAAKEAKLRDL 15
LMNA-403 403 SRIRIDSLSAQLSQL 15
LMNA-238 238 LEAALGEAKKQLQDE 15
LMNA-487 487 EYQELLDIKLALDME 15
MED6-RNA聚合酶II转录中介体,亚基6 NM_005466
MED6-77 77 QRLTLEHLNQMVGIE 15
MED6-91 91 EYILLHAQEPILFII 15
MED6-160 160 NSRVLTAVHGIQSA 15
MED6239 239 QRQRVDALLLDLRQK 15
MKRN1-makorin,环指蛋白,1 NM_013446
MKRN1-175 175 ASSSLSSIVGPLVEM 15
MKRN1-101 101 YSHDLSDSPYSVVCK 15
MKRN1-163 163 TATELTTKSSLAASS 15
MKRN1-483 483 KQKLILKYKEAMSNK 15
NAP1L3-核小体装配蛋白1-样蛋白3 NM_004538
NAP1L3-145 145 AVRNRVQALRNI 12
NAP1L3-648 648 ILKSIYYYTGEVNGT 15
NAP1L3-173 173 AIHDLERKYAELNKP 15
NEDD9-神经前体细胞表达的,dev.下调蛋白 NM_006403
NEDD9-1100 1100 STTALQEMVHQVTDL 15
NEDD9-973 973 HFISLLNAIDALFSC 15
NEDD9-566 566 LQQALEMGVSSLMAL 15
NEDD9-1055 1055 SSNQLCEQLKTIVMA 15
NEDD9-980 980 AIDALFSCVSSAQPP 15
NEDD9-626 626 VELFLKEYLHFVKGA 15
NS-nucleostemin NM_014366
NS-392 392 VSMGLTRSMQVVPLD 15
NS-257 257 WLNYLKKELPTVVFR 15
NS-401 401 QVVPLDKQITIIDSP 15
NS-250 250 PKENLESWLNYLKKE 15
NUBP2-核苷酸结合蛋白2 NM_012225
NUBP2-338 338 AFAALTSIAQKILDA 15
NUBP2-109 109 QSISLMSVGFLLEKP 15
NUBP2-155 155 KNALIKQFVSDVAWG 15
OGFR-阿片生长因子受体 NM_007346
OGFR-570 570 SQGSLRTGTQEVGGQ 15
OGFR-337 337 RQSALDYFMFAVRCR 15
OGFR-565 565 EGCALSQGSLRTGTQ 15
PARC-p53-相关的parkin-样胞浆蛋白 NM_015089
PARC-956 956 GLSALSQAVEEVTER 15
PARC-722 722 GEKALGEISVSVEMA 15
PARC-981 981 LREKLVKMLVELLTN 15
PARC-1368 1368 NKTLLLSVLRVITRL 15
PARC-1140 1140 SESLLLTVPAAVIL 14
PARC-3152 3152 FAVNLRNRVSAIHEV 15
PARC-2454 2454 SPELLLQALVPLTSG 15
PARC-1654 1654 HRGVLVRQLTLLVAS 15
PARC-731 731 VSVEMAESLLQVLSS 15
PIAS1-活化的STAT的蛋白抑制剂,1 NM_016166
PIAS1-338 338 NITSLVRLSTTVPNT 15
PIAS1-6 6 DSAELKQMVMSLRVS 15
PIAS1-166 166 ELPHLTSALHPVHPD 15
PIAS1-428 428 PDSEIATTSLRVSLL 15
PPIL4-肽酰脯氨酰异构酶(亲环素)-样蛋白4 NM_139126
PPIL4-8 8 LETTLGDVVIDLYTE 15
PPIL4-306 306 TQAILLEMVGDLPDA 15
PPIL4-419 419 IHVDFSQSVAKVKWK 15
PPIL4-150 150 GSQFLITTGENLDYL 15
PSME3-蛋白酶体(prosome,macropain)激活因子亚基3 NM_005789
PSME3-156 156 SNQQLVDIIEKVKPE 15
PSME3-150 150 PNGMLKSNQQLVDII 15
PSME3-3 3 MASLLKVDQEVKLK 14
PSME3-318 318 LHDMILKNIEKIKRP 15
RAB40C-成员RAS癌家族 NM_021168
RAB40C-310 310 KSFSMANGMNAVMMH 15
RAB40C-319 319 NAVMMHGRSYSLASG 15
RAB40C-225 225 FNVIESFTELSRI 13
RABEP1-rabaptin,RABGTP酶结合效应蛋白1 NM_004703
RABEP1-13 13 PDVSLQQRVAELEKI 15
RABEP1-810 810 SALVLRAQASEILLE 15
RABEP1-1044 1044 QLESLQEIKISLEEQ 15
RABEP1-1016 1016 SSLKAELERIKVE 14
RABEP1-861 861 QMAVLMQSREQVSEE 15
RABEP1-657 657 TASLLSSVTQGMESA 15
RABEP1-1034 1034 LESTLREKSQQLESL 15
RABEP1-246 246 DAEKLRSVVMPMEKE 15
RBM25-RNA结合基序蛋白25 XM_027330
RBM25-34 34 VPMSIMAPAPTVLV 14
RBM25-978 978 KRKHIKSLIEKIPTA 15
RBM25-266 266 IEVLIREYSSELNAP 15
RBM25-258 258 RDQMIKGAIEVLIRE 15
RBPSUH-hairless的重组结合蛋白抑制剂 NM_005349
RBPSUH-658 658 NSTSVTSSTATVVS 14
RBPSUH-628 628 AGAILRANSSQVPPN 15
RBPSUH-255 255 LFNRLRSQTVSTRYL 15
RBPSUH-659 659 STSVTSSTATVVS 13
RBPSUH-350 350 IIRKVDKQTALLDA 14
RBPSUH-236 236 KKQSLKNADLCIASG 15
SDCCAG1-血清学决定性结肠癌抗原1,NY-CO-1 NM_004713
SDCCAG1-13 13 LRAVLAELNASLLGM 15
SDCCAG1-934 934 LASCTSELISE 12
SDCCAG1-232 232 TLERLTEIVASAPKG 15
SDCCAG1-860 860 TGEYLTTGSFMIRGK 15
SDCCAG1-475 475 LKGELIEMNLQIVDR 15
SDCCAG1-229 229 PLLTLERLTEIVASA 15
SR-A1-富丝氨酸精氨酸的前-mRA剪接因子 NM_021228
SR-A1-1126 1126 RKVKLQSKVAVLIRE 15
SR-A1-394 394 EEEGLSQSISRISET 15
SR-A1-1525 1525 KAQELIQATNQILSH 15
SR-A1-1683 1683 YKDILRKAVHKICHS 15
SR-A1-1504 1504 GVLALTALLFKMEEA 15
HUB-Hu抗原B(ELAVL2) NM_004432
HUB-146 146 LRLQTKTIKVSYA 13
HUB-467 467 NGYRLGDRVLQVSFK 15
HUB-78 78 ELKSLFGSIGEIESC 15
HUB-325 325 RLDNLLNMAYGVKRF 15
HUB-185 185 ELEQLFSQYGRIITS 15
HUB-75 75 TQEELKSLFGSIGEI 15
HUC-Hu抗原C(ELAVL3) NM_001420
HUC-146 146 LKLQTKTIKVSYA 13
HUC-475 475 NGYRLGERVLQVSFK 15
HUC-5 5 VTQILGAMESQVGGG 15
HUC-338 338 SPLSLIARFSPIAID 15
HUC-325 325 RLDNLLNMAYGVKSP 15
HUC-78 78 EFKSLFGSIGDIESC 15
HUD-Hu抗原D(ELAVL4) NM_021952
HUD-153 153 NGLRLQTKTIKVSYA 15
HUD-226 226 SRILVDQVTGVSRG 15
HUD-488 488 NGYRLGDRVLQVSFK 15
HUD-85 85 EFRSLFGSIGEIESC 15
HUR-Hu抗原R(ELAVL1) NM_001419
HUR-106 106 NGLRLQSKTIKVSYA 15
HUR-35 35 TQDELRSLFSSIG 13
HUR-414 414 NGYRLGDKILQVSFK 15
HUR-186 186 QTTGLSRGVAFIRFD 15
HUR-179 179 NSRVLVDQTTGLSRG 15
CRMP5-colapsin rec.二氢嘧啶酶-样蛋白5 NM_020134
CRMP5-110 110 TKAALVGGTTMIIGH 15
CRMP5-660 660 RTPYLGDVAVVVHPG 15
CRMP5-418 418 LMSLLANDTLNIVAS 15
CRMP5-716 716 GMRDLHESSFSLSGS 15
CRMP5-642 642 VYKKLVQREKTLKVR 15
CRMP5-111 111 KAALVGGTTMIIGHV 15
CRMP5-558 558 EATKTISASTQVQGG 15
EXOSC1 hRrp46p NM_016046
EXOSC1-98 98 KVSSINSRFAKVHIL 15
EXOSC1-185 185 SNYLLTTAENELGVV 15
EXOSC1-169 169 PGDIVLAKVISLGDA 15
EXOSC1-83 83 TESQLLPDVGAIVTC 15
EXOSC7 NM_015004
EXOSC7-306 306 EACSLASLLVSVTSK 15
EXOSC7-349 349 VGKVLHASLQSVLHK 15
EXOSC7-176 176 HCWVLYVDVLLLECG 15
EXOSC5 NM_020158
EXOSC5-255 255 ERKLLMSSTKGLYSD 15
EXOSC5-157 157 PRTSITVVLQVVSDA 15
EXOSC5-175 175 LACCLNAACMALVDA 15
EXOSC5-243 243 ARAVLTFALDSVERK 15
PGP9.5泛素羧基末端水解酶UCH-L3 M30496
PGP9.5-263 263 SDETLLEDAIEVCKK 15
PGP9.5-111 111 MKQTISNACGTIGLI 15
GAD2-谷氨酸脱羧酶2 NM_000818
GAD2-714 714 RMSRLSKVAPVIKAR 15
GAD2-389 389 SHFSLKKGAAALGIG 15
GAD2-644 644 KCLELAEYLYNIIKN 15
GAD2-244 244 YFNQLSTGLDMVGLA 15
GAD2-328 328 PGGAISNMYAMMIAR 15
GAD2-152 152 TLAFLQDVMNILLQY 15
GAD2-783 783 DIDFLIEEIERLGQD 15
GAD2-304 304 VTLKKMREIIGWP 13
表2-公开的是来自表1中1448个肽表位的51个肽表位,其确定为能为区分NSCLC、SCLC和对照信息性表位。参见试验。
    号码 基因/表位     mer
TRP-2/4 ANDPIFVVL     9
HAGHL-237 GHEHTLSNLEFAQKV     15
    14 QWD1-315 SAENPVENHINITQS     15
    33 KIAA0373-1107 RKFAVIRHQQSLLYK     15
    38 KIAA0373-1193 MKKILAENSRKITVL     15
    88 LOC401193-156 EFLRSKKSSEEITQY     15
    103 MSLN-186 FSRITKANVDLLPRG     15
    108 NACA-261 AVRALKNNSNDIVNA     15
    113 NISCH-805 CIGYTATNQDFIQRL     15
    114 NISCH-1764 KTTGKMENYELIHSS     15
    117 NISCH-1271 THNCRNRNSFKLSRV     15
    122 NISCH-1105 RSCFAPQHMAMLCSP     15
    158 RBMS1-108 PYGKIVSTKAILDKT     15
    189 ROCK2-1296 HKQELTEKDATIASL     15
    272 SDCCAG3-255 SYDALKDENSKLRRK     15
    274 SDCCAG3-462 AEILKSIDRISEI     13
    278 SDCCAG8-815 ECCTLAKKLEQISQK     15
    377 TP53-171 YSPALNKMFCQLAKT     15
    409 UTP14A-818 RDFLKEKREAVEAS     15
    411 UTP14A-182 TAQVLSKWDPVVLKN     15
    454 ZNF292-3415 KKNNLENKNAKIVQI     15
    455 ZNF292-1612 TPQNLERQVNNLMTF     15
    458 ZNF292-3154 HKSDLPAFSAEVEEE     15
    501 MELK-67 NTLGSDLPRIKTE     13
508 MELK-241 AAPELIQGKSYLGSE 15
    525 NFRKB-1575 SAVSLPSMNAAVSKT     15
    608 AARS-1017 TEEAIAKGIRRIVAV     15
    616 ABL1-465 NAVVLLYMATQISSA     15
    625 ACAT2-488 GCRILVTLLHTLERM     15
    780 CTTNBP2-254 EAQKLEDVMAKLEEE     15
    788 DDX5-190 TLSYLLPAIVHINHQ     15
    803 DNAJA1-21 TQEELKKAYRKLALK     15
    817 DNM1L-3 MEALIPVINKLQDV     14
    820 DRCTNNB1A-588 SSHGLAKTAATVF     13
    828 ELKS-241 KESKLSSSMNSIKTF     15
    843 EXOSC10-883 TTCLIATAVITLFNE     15
    884 GOLGA2-1061 THRALQGAMEKLQS     14
    965 QWD1-575 EHLMLLEADNHVVNC     15
    972 LIMS1-182 KCHAIIDEQPLIFKN     15
    978 LMNA-417 LQKQLAAKEAKLRDL     15
    989 MKRN1-483 KQKLILKYKEAMSNK     15
    990 NAP1L3-145 AVRNRVQALRNI     12
    1042 RBM25-978 KRKHIKSLIEKIPTA     15
    1049 RBPSUH-350 IRKVDKQTALLDA     14
    1050 RBPSUH-236 KKQSLKNADLCIASG     15
    1053 SDCCAG1-232 TLERLTEIVASAPKG     15
    1057 SR-A1-1126 RKVKLQSKVAVLIRE     15
    1115 SOX1/17 HPHAHPHNPQPMHRY     15
    1145 NY-ESO-1/2 GDADGPGGPGIPDGP     15
    1146 NY-ESO-1/6 PRGPHGGAASGLNGC     15
  1149 SSX1/11  SGPQNDGKQLHPPGK     15
表3-6公开了在NSCLC、SCLC和对照样品中用表2中公开的51个表位进行自身抗体谱分析的结果。参见试验。
表3
    分类器:非小细胞型肺癌作为训练组
    训练组中标记的数目:1253
    方法:神经网络   统计匹配
    血浆样品   统计匹配 血浆样品   统计匹配     血浆样品
    NSCLC   0% 对照   0%     SCLC   100%
    NSCLC   100% 对照   0%     SCLC   100%
    NSCLC   100% 对照   0%     SCLC   100%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   100%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   60%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   100%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   100%
    NSCLC   0% 对照   0%     SCLC   100%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   56%
    NSCLC   100% 对照   100%     SCLC   1%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   7%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   2%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   0% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   0%     SCLC   0%
    NSCLC   100% 对照   65%     SCLC   0%
    NSCLC   100% 对照   0%
    NSCLC   100% 对照   0%
    NSCLC   100% 对照   0%
    NSCLC   0% 对照   0%
    NSCLC     100% 对照     9%
    NSCLC     100% 对照     0%
    NSCLC     100% 对照     0%
    NSCLC     0%
    NSCLC     100%
    NSCLC     100%
    NSCLC     0%
    均值     0.837837838     0.054848485     0.315
    标准误差     0.061433251     0.035571953     0.08852857
    中值     1     0     0
    众数     1     0     0
    标准偏差     0.373683877     0.204345315     0.451408906
    样本方差     0.13963964     0.041757008     0.20377
    峰度     1.745188398     16.66992414     -1.295276226
    偏态     -1.911470521     4.095015871     0.831444585
    极差     1     1     1
    最小值     0     0     0
    最大值     1     1     1
    总和     31     1.81     8.19
    个数     37     33     26
表4
  方法:支持向量机径向基函数核
  血浆样品     统计匹配     血浆样品     统计匹配     血浆样品     统计匹配
  NSCLC     81%     对照     41%     SCLC     35%
  NSCLC     98%     对照     1%     SCLC     58%
  NSCLC     98%     对照     0%     SCLC     30%
  NSCLC     100%     对照     3%     SCLC     6%
  NSCLC     101%     对照     -2%     SCLC     32%
  NSCLC     100%     对照     -3%     SCLC     91%
  NSCLC     86%     对照     1%     SCLC     13%
  NSCLC     102%     对照     2%     SCLC     4%
  NSCLC     90%     对照     1%     SCLC     43%
  NSCLC     88%     对照     2%     SCLC     21%
  NSCLC     90%     对照     -2%     SCLC     4%
  NSCLC     66%     对照     -21%     SCLC     4%
  NSCLC     100%     对照     2%     SCLC     4%
  NSCLC     97%     对照     4%     SCLC     43%
  NSCLC     92%     对照     -12%     SCLC     22%
  NSCLC     78%     对照     -20%     SCLC     19%
  NSCLC     92%     对照     0%     SCLC     3%
  NSCLC     42%     对照     1%     SCLC     5%
    NSCLC     102%     对照     -1%     SCLC     5%
    NSCLC     100%     对照     5%     SCLC     2%
    NSCLC     98%     对照     -2%     SCLC     12%
    NSCLC     98%     对照     -6%     SCLC     13%
    NSCLC     59%     对照     1%     SCLC     3%
    NSCLC     36%     对照     -5%     SCLC     -2%
    NSCLC     97%     对照     23%     SCLC     3%
    NSCLC     90%     对照     4%     SCLC     -3%
    NSCLC     97%     对照     1%
    NSCLC     87%     对照     -9%
    NSCLC     97%     对照     -15%
    NSCLC     23%     对照     1%
    NSCLC     82%     对照     1%
    NSCLC     100%     对照     3%
    NSCLC     81%     对照     1%
    NSCLC     101%
    NSCLC     83%
    NSCLC     60%
    NSCLC     56%
    均值     0.850810811     -0.0003125     0.180769231
    标准误差     0.032816668     0.019257824     0.042891359
    中值     0.92     0.01     0.09
    众数     1     0.01     0.04
    标准偏差     0.199615998     0.108938704     0.218703874
    样本方差     0.039846547     0.011867641     0.047831385
    峰度     2.220723288     6.551736654     3.841127046
    偏态     -1.669600142     1.551257739     1.830688658
    极差     0.79     0.62     0.94
    最小值     0.23     -0.21     -0.03
    最大值     1.02     0.41     0.91
    总和     31.48     -0.01     4.7
    个数     37     32     26
表5
  数组的分类器:50个标记集上的NSCLC样品
  方法:支持向量机径向基函数核
  血浆样品     统计匹配     血浆样品  统计匹配   血浆样品     统计匹配
  NSCLC     102%     对照     51%   SCLC     3%
  NSCLC     89%     对照     -2%   SCLC     2%
  NSCLC     85%     对照     12%   SCLC     15%
  NSCLC     98%     对照     -5%   SCLC     30%
  NSCLC     76%     对照     -14%   SCLC     53%
  NSCLC     102%     对照     -2%   SCLC     88%
    NSCLC     94%     对照     0%     SCLC    -3%
    NSCLC     99%     对照     10%     SCLC    4%
    NSCLC     77%     对照     -6%     SCLC    20%
    NSCLC     82%     对照     4%     SCLC    17%
    NSCLC     71%     对照     -1%     SCLC    3%
    NSCLC     62%     对照     -22%     SCLC    4%
    NSCLC     63%     对照     5%     SCLC    2%
    NSCLC     57%     对照     2%     SCLC    21%
    NSCLC     101%     对照     2%     SCLC    3%
    NSCLC     100%     对照     -30%     SCLC    11%
    NSCLC     64%     对照     4%     SCLC    0%
    NSCLC     11%     对照     -13%     SCLC    0%
    NSCLC     101%     对照     -15%     SCLC    2%
    NSCLC     97%     对照     3%     SCLC    7%
    NSCLC     97%     对照     -4%     SCLC    6%
    NSCLC     82%     对照     -14%     SCLC    -1%
    NSCLC     68%     对照     0%     SCLC    4%
    NSCLC     34%     对照     -17%     SCLC    10%
    NSCLC     98%     对照     20%     SCLC    -2%
    NSCLC     79%     对照     34%     SCLC    2%
    NSCLC     76%     对照     3%
    NSCLC     98%     对照     -15%
    NSCLC     85%     对照     -1%
    NSCLC     17%     对照     3%
    NSCLC     43%     对照     -32%
    NSCLC     71%     对照     4%
    NSCLC     45%     对照     -4%
    NSCLC     82%
    NSCLC     98%
    NSCLC     26%
    NSCLC     75%
    均值     0.758108     -0.012121212    0.115769231
    标准误差     0.040918     0.027987272    0.03869873
    中值     0.82     -0.01    0.04
    众数     0.98     0.04    0.02
    标准偏差     0.248896     0.16077464    0.19732558
    样本方差     0.061949     0.025848485    0.038937385
    峰度     0.581168     3.018160625    9.147145282
    偏态     -1.1099     0.984452432    2.863009047
    极差     0.91     0.83    0.91
    最小值     0.11     -0.32    -0.03
    最大值     1.02     0.51    0.88
    总和     28.05     -0.4    3.01
    个数     37     33    26
表6
分类器:非小细胞肺癌将癌症样品作为训练组(training group)
训练组中的标记数量整个肽文库
方法1
方法:神经网络
NSCLC 非癌对照 SCLC
统计匹配 统计匹配 统计匹配
均值 0.837837838 0.054848485 0.315
标准误差 0.061433251 0.035571953 0.08852857
样品数 37 33 26
方法2
支持向量机径向基函数核(Support Vector Machine:Radial Bεse Function Kernel)
NSCLC 非癌对照 SCLC
统计匹配 统计匹配 统计匹配
0.850810811 -0.0003125 0.180769
0.032816668 0.019257824 0.042891
37 32 26
分类器:以NSCLC样品作为训练组
标记数量:50个肽
支持向量机径向基函数核(Support Vector Machine:Radial Base Function Kernel)
NSCLC 非癌对照 SCLC
统计匹配 统计匹配 统计匹配
均值 0.758108108 -0.012121212 0.115769231
标准误差 0.040918211 0.027987272 0.03869873
样品数 37 33 26
缩写:
NSCLC-非小细胞型肺癌
SCLC-小细胞型肺癌
表7公开了对应分化抗原的额外的表位,其可用于自身抗体谱分析。
分化抗原
CEA YLSGANLNL
IMIGVLVGV
HLFGYSWYK
YACFVSNLATGRNNS
LWWVNNQSLPVSP
gp100/Pmel 17 KTWGQYWQV
AMLGTHTMEV
TDQVPFSV
YLEPGPVTA
LLDGTATLRL
VLYRYGSFSV
SLADTNSLAV
RLMKQDFSV
RLPRIFCSC
LIYRRRLMK
ALLAVGATK
ALNFPGSQK
ALNFPGSQK
VYFFLPDHL
RTKQLYPEW
HTMEVTVYHR
VPLDCVLYRY
SNDGPTLI
激肽释放酶4 SVSESDTIRSISIAS
LLANGRMPTVLQCVN
RMPTVLQCVNVSVVS
乳腺球蛋白-A PLLENVISK
黑色素-A/MART-1 EAAGIGILTV
LTVILGVL
AEEAAGIGILT
RNGYRALMDKSLHVGTQCALTRR
PSA FLTPKKLQCV
VISNDVCAQV
TRP-1/gp75 MSLQRQFLR
SLPYWNFATG
TRP-2 SVYDFFVWL
TLDSQVMSL
LLGPGRPYR
ANDPIFVVL
ALPYWNFATG
酪氨酸酶 KCDICTDEY
SSDYVIPIGTY
MLLAVLYCL
CLLWSFQTSA
YMDGTMSQV
AFLPWHRLF
TPRLPSSADVEF
LPSSADVEF
SEIWRDIDFd
QNILLSNAPLGPQFP
SYLQDSDPDSFQD
FLLHHAFVDSIFEQWLQRHRP
表8公开了对应在肿瘤中过度表达的抗原的额外的表位,其可用于自身抗体谱分析。
肿瘤中过度表达的抗原
adipophilin SVASTITGV
CPSF KVHPVIWSL
LMLQNALTTM
EphA3 DVTFNIICKKCG
G250/MN/CAIX HLSTAFARV
HER-2/neu KIFGSLAFL
ISAVVGIL
ALCRWGLLL
LHNGAYSL
RLLQETELV
VVLGVVFGI
YMIMVKCWMI
HLYQGCQVV
YLVPQQGFFC
PLQPEQLQV
TLEEITGYL
ALIHHNTHL
PLTSIISAV
VLRENTSPK
肠羧酸酯酶 SPRWWPTCL
α-甲胎蛋白 GVALQTMKQ
M-CSF LPAVVGLSPGEQEY
MUC1 STAPPVHNV
LLLLTVLTV
PGSTAPPAHGVT
p53 LLGRNSFEV
RMPEAAPPV
SQKTYQGSY
PRAME VLDGLDVLL
SLYSFPEPEA
ALYVDSLFFL
SLLQHLIGL
LYVDSLFFL
PSMA NYARTEDFF
RAGE-1 SPSSNRIRNT
RU2AS LPRWPPPQL
survivin ELTLGEFLKL
端粒酶 ILAKFLHWL
RLVDDFLLV
RPGLLGASVLGLDDI
LTDLQPYMRQFVAHL
WT1 CMTWNQMNL
表9公开了对应在多个肿瘤类型中表达的抗原的额外的表位,其可用于自身抗体谱分析。
共有的肿瘤特异性抗原
BAGE-1 AARAVFLAL
GAGE-1,2,8 YRPRPRRY
GAGE-3,4,5,6,7 YYWPRPRRY
GnTVf VLPDVFIRCV
HERV-K-MEL MLAVISCAV
LAGE-1 MLMAQEALAFL
SLLMWITQC
LAAQERRVPR
SLLMWITQCFLPVF
QGAMLAAQERRVPRAAEVPR
AADHRQLQLSISSCLQQL
CLSRRPWKRSWSAGSCPGMPHL
LSRDAAPLPRPG
MAGE-A1 EADPTGHSY
SLFRAVITK
EVYDGREHSA
RVRFFFPSL
EADPTGHSY
REPVTKAEML
DPARYEFLW
ITKKVADLVGF
SAFPTTINF
SAYGEPRKL
LLKYRAREPVTKAE
EYVIKVSARVRF
MAGE-A2 YLQLVFGIEV
EYLQLVFGI
REPVTKAEML
EGDCAP EEK
LLKYRAREPVTKAE
MAGE-A3 EVDPIGHLY
FLWGPRALV
KVAELVHFL
TFPDLESEF
MEVDPIGHLY
EVDPIGHLY
REPVTKAEML
AELVHFLLL
MEVDPIGHLY
WQYFFPVIF
EGDCAPEEK
KKLLTQHFVQENYLEY
ACYEFLWGPRALVETS
VIFSKASSSLQL
GDNQIMPKAGLLIIV
TSYVKVLHHMVKISG
AELVHFLLLKYRAR
LLKYRAREPVTKAE
MAGE-A4 EVDPASNTY
GVYDGREHTV
SESLKMIF
MAGE-A6 MVKISGGPR
EVDPIGHVY
REPVTKAEML
EGDCAPEEK
LLKYRAREPVTKAE
MAGE-A10 GLYDGMEHL
DPARYEFLW
MAGE-A12 FLWGPRALV
VRIGHLYIL
EGDCAPEEK
AELVHFLLLKYRAR
MAGE-C2 LLFGLALIEV
ALKDVEERV
NA-88 QGQHFLQKV
NY-ESO-1/LAGE-2 SLLMWITQC
ASGPGGGAPR
LAAQERRVPR
MPFATPMEA
MPFATPMEA
LAMPFATPM
ARGPESRLL
SLLMWITQCFLPVF
QGAMLAAQERRVPRAAEVPR
PGVLLKEFTVSGNILTIRLT
VLLKEFTVSG
AADHRQLQLSISSCLQQL
PGVLLKEFTVSGNILTIRLTAADHR
Sp17 LDSSEEDK
SSX-2 KASEKIFYV
EKIQKAFDDIAKYFSK
KIFYVYMKRKYEAM
TRP2-INT2g EVISCKLIKR
表10公开了对应通过突变产生的肿瘤抗原的额外的表位,其可用于自身抗体谱分析。
突变得到的肿瘤抗原
α-辅肌动蛋白-4 FIASNGVKLV
BCR-ABL融合蛋白(b3a2) SSKALQRPV
GFKQSSKAL
ATGFKQSSKALQRPVAS
CASP-8 FPSDSWCYF
β-连环蛋白 SYLDSGIHF
Cdc27 FSWAMDLDPKGA
CDK4 ACDPHSGHFV
CDKN2A AVCPWTWLR
COA-1f TLYQDDTLTLQAAG
dek-can融合蛋白 TMKQICKKEIRRLHQY
延伸因子2 ETVSEQSNV
ETV6-AML1融合蛋白 RIAECILGM
GRIAECILGMNPSR
LDLR-作为融合蛋白的岩藻糖转移酶 WRRAPAPGA
PVTWRRAPA
hsp70-2 SLFEGIDIYT
KIAAO205 AEPINIQTW
MART2 FLEGNEVGKTY
MUM-1f EEKLIVVLF
MUM-2 SELFRSGLDSY
FRSGLDSYV
MUM-3 EAFIQPITR
neo-PAP RVIKNSIRLTL
肌球蛋白I KINKNPKYK
OS-9g KELEGILLL
pmI-RARα融合蛋白 NSNHVASGAGEAAIETQSSSSEEIV
PTPRK PYYFAAELPPRNLPEP
K-ras VVVGAVGVG
N-ras LDTAGREEY
磷酸丙糖异构酶 GELIGILNAAKVPAD
表11公开了来自表1中1,448个肽表位的25个优选的肺癌确定性表位。参见试验。
    1 GRINA-398 TCFLAVDTQLLLGNK     15
    2 AP1G21020 LFRILNPNKAPLRLK     15
    14 IQWD1-315 SAENPVENHINITQS     15
    33 KIAA0373-1107 RKFAVIRHQQSLLYK     15
    38 KIAA0373-1193 MKKILAENSRKITVL     15
    88 LOC401193-156 EFLRSKKSSEEITQY     15
    103 MSLN-186 FSRITKANVDLLPRG     15
    108 NACA-261 AVRALKNNSNDIVNA     15
    114 NISCH-1764 KTTGKMENYELIHSS     15
    117 NISCH-1271 THNCRNRNSFKLSRV     15
    122 NISCH-1105 RSCFAPQHMAMLCSP     15
    158 RBMS1-108 PYGKIVSTKAILDKT     15
    274 SDCCAG3-462 AEILKSIDRISEI     13
    411 UTP14A-182 TAQVLSKWDPVVLKN     15
    454 ZNF292-3415 KKNNLENKNAKIVQI     15
    455 ZNF292-1612 TPQNLERQVNNLMTF     15
    525 NFRKB-1575 SAVSLPSMNAAVSKT     15
    608 AARS-1017 TEEAIAKGIRRIVAV     15
    616 ABL1-465 NAVVLLYMATQISSA     15
    828 ELKS-241 KESKLSSSMNSIKTF     15
    965 QWD1-575 EHLMLLEADNHVVNC     15
    972 LIMS1-182 KCHAIIDEQPLIFKN     15
    1050 RBPSUH-236 KKQSLKNADLCIASG     15
    1057 SR-A1-1126 RKVKLQSKVAVLIRE     15
    1146 NY-ESO-1/6 PRGPHGGAASGLNGC     15
表12公开了在NSCLC对照样品中用表11的25个表位进行的自身抗体谱分析的结果。参见试验。
支持向量机:径向基函数核
层:原始数据
子集:全集
    与NSCLC分类器的统计匹配
均值标准误差     NSCLC0.9482758620.020541134     CONTROL0.1245161290.037884484
t-检验:两样本假设方差齐性
    变量1 变量2
Mean方差观测数合并方差假设的均值差dft StatP(T<=t)单尾t Critical单尾P(T<=t)双尾t临界双尾     0.9482758620.012236207290.0289203710581 8.750068021.35315E-261.6715527632.70629E-262.001717468 0.1245161290.04449225831
NSCLC=非小细胞型肺癌
我们试验了含有25个我们的最佳标记(在整个肽文库中打分最高的标记)的阵列
我们用29个NSCLC和31个非癌对照标记检验了含这25个标记的阵列
我们用支持向量机(可从GeneMath XT生物信息学软件包获得)进行模式识别
试验
我们已经进行了对乳腺癌和肺癌的探索性研究。在我们的乳腺癌研究中,我们确定了在16个乳腺癌患者和16个性别匹配的非癌对照个体中的血清aAB组合物。作为对NSCLC和SCLC血清的对比研究进行肺癌研究以便检测肺癌的这两种主要类型之间的差异。这两种探索性研究都用相同表位集同时进行。该表位集包括代表135个不同蛋白质的428个不同的表位。将信息性表位基于增加/减少的(I/D)信号二分分成两组。简而言之,我们采用邻域分析对乳腺癌进行癌与非癌的比较,以及对肺癌进行NSCLC对SCLC的比较。该方法鉴定了能信息性肽表位,所述的方法经大规模的基因表达研究(Golub等,Science(1999)286:531-7)。信息性表位是较于另一组患者血清在一组患者血清中产生显著不同的信号的表位。
乳腺癌:信息性表位
乳腺癌的探索性研究产生了显示出增加/减少(I/D)二分(dichotomy)的一组27种信息性表位(图2)。有趣地是,与非癌对照比较,在乳腺癌中产生减少的信号的表位子集大于产生增加的信号的表位子集。对于这两种信息性表位的子集,在EB对EC比较中测定出高度显著的p值(图2)。
能为乳腺癌提供信息的表位的I/D二分法是明显不成比例的。测定未分类的信息性表位,EB显著地小于EC(分别为22±0.8对30±1.3;p=0.00000183)。因此,如通过能为乳腺癌提供信息的表位证明的,与非癌对照比较,乳腺癌中肽表位与血清aAB产生体外免疫反应的能力较小(图2)。我们把该结果解释为一种指示:乳腺癌血清含有比对照血清滴度低的aAB或低亲和力的aAB。实际上,我们猜测:乳腺癌中这种“体外免疫反应”的“衰减”指向削弱的B-细胞免疫。然而,我们相信抗-肿瘤体液免疫应答也出现于乳腺癌中,因为我们检测到了信息性表位的一个子集,该子集在乳腺癌血清中产生显著增加的体外免疫反应(图2)。
肺癌:NSCLC对SCLC:信息性表位
肺癌的探索性研究产生了鉴定NSCLC和SCLC之间的血清aAB差异的28种信息性表位。与能为乳腺癌提供信息的表位类似,能为肺癌提供信息的表位显示出显著不成比例的I/D-二分(图3)。特别地,ES显著小于EN(28.4±1.0对32.5±0.9;p=0.006)。同样鉴于我们的乳腺癌研究,以及有关癌生存率的公开数据,可以提出下面的假设:乳腺癌和SCLC中降低的信息性表位的平均强度[E]表明:乳腺癌和SCLC患者与他们的参照组比较显示出受损的免疫状态。这种减弱的免疫状态解释了分别相对于非癌对照和NSCLC患者乳腺癌和SCLC中较低的生存率。如Mayo Lung Project证明的,与NSCLC比较在SCLC中生存中值更短并且5年生存率更低(Marcus等,J Natl Cancer Inst.(2000)92:1308-16)。此外,鉴于上述假设,与EB和EC比较,在ES和EN之间显现出更小的差别是合理的,因为非癌个体通常比癌患者具有更长的预期寿命。
表位微阵列揭示了能为癌提供信息的表位之中的更高等级:(i)交叠的信息性表位
上述两种探索性研究显示出交叠(图4)。我们检测到能为乳腺癌和肺癌两者都提供信息的3种表位(图4)。有趣地是,就关于癌生存率的公开知识而论,所有这三个交叠的表位显示出相同的I/D-二分。具体而言,相对于非癌对照和NSCLC,ZFP-200在乳腺癌和SCLC两者中分别产生了增加的信号;相对于非癌对照和NSCLC,MAGE4a/14和SOX2/5在乳腺癌和SCLC中产生了减少的信号。
(ii)交叠的能信息性蛋白质
我们还检测到非交叠但代表相同蛋白质的信息性表位(图4)。来自四种蛋白质(MAGE4a、NY-ESO、SOX-1和SOX-2)的非交叠的表位产生了用于乳腺癌和肺癌两者的信息性信号。就公开的癌生存率数据(Marcus等,J Natl Cancer Inst.(2000)92:1308-16)而言,所有这四种蛋白质的I/D二分是相同的,因为它们在较低生存率的组中都显示出减少的体外免疫反应(图4)。因此,使用表位微阵列有可能实现:聚类信息性表位和蛋白质这两者以揭示癌类型间的aAB关联,和揭示共同的致病机制。
表位验证(epitope Validation)
利用我们的癌表位微阵列,我们着眼于(1)在胚组织中表达的转录因子(Gure等,同上;Chen等,(1997)同上)、(2)已知在癌中引发B-细胞应答的蛋白质(Tan,同上;Lubin,同上),以及(3)具有胚/睾丸/肿瘤特异性的蛋白质,该蛋白质已知可激活肿瘤特异性细胞裂解性T细胞(Van Der Bruggen等,Immunol Rev.(2002)188:51-64;Boon等,Annu Rev Immunol.(1994)12:337-65)。如我们的探索性研究表明的,该方法看来凑效,因为能为乳腺癌和肺癌两者提供信息的表位包括SOX-家族的成员(胚特异性转录因子)、p53、IMP和HuD家族的成员(癌中B-细胞应答的已知诱导物),以及肿瘤/睾丸/癌蛋白例如MAGE和NY-ESO家族的成员(图2-4)。
表位信号分析
我们采用邻域分析(Golub等,同上)以便确定信息性表位。我们将信号频率和强度都包含于数据分析中。一组中每种特定表位的信号强度的平均的均值±SEM称为表位信号。为了评估表位,我们对表位信号进行了方差齐性双侧Student t检验(图5)。在双向比较中产生显著不同的表位信号的所有表位认为是信息性表位。图5中的实例举例说明了对表位的评价。除了表位信号,在数据分析中计算和评价了下列终点(endpoint):
∑P-每个独立的检验主体的所有信息性表位的组合信号强度;
E-每组患者的信息性表位的平均强度;
E=[∑P1+...+∑Pn/N]±SEM,其中N表示组中的患者数目(图5)。该参数对未分类和分类数据两者都进行计算。
信号检测和定量
我们关于基于碱性磷酸酶(“AP”)的比色测定法和基于Cy3的荧光测定法的初步比较试验表明:在用Cy3代替AP时信号对背景的比率达到更大的数量级(数据未显示)。该结果与以前研究表明的荧光测定法标记产生比传统的生色标记更好的动力学信号范围的结果(Boon等,同上)一致。
我们现有的、基于比色测定法的数据在99%的情况下具有最大范围3。对基于Cy3-荧光的试验进行邻域分析以便减少基于比色数据对表位重要性的低估和高估。可能会出现稍微不同的信息性表位集。因为更高的灵敏性,所以可预见每次检验需要更小量的血清,这是基于荧光测定法的显影平台带来的非常相关的好处;在微阵列上的表位密度增加时其优势得到突显。
数据标准化
如图1中描述的,信号定量和标准化通过实施基于人IgG的系列稀释物的内部对照改善。与基于单一浓度的信号定量比较,这种内部对照使得能更准确地将每种独立的肽:aAB相互作用的每个信号标准化。结果,单个肽表位/aAB-结合活性可以表示为x-量的人IgG的免疫反应性的等价物。引入这种特定的标准化特征将会提高来自不同试验和试验点的数据的兼容性。
数据分析
拣选在t检验中产生最大方差的表位以便测定最偏差的表位的值。如我们的初步的数据显示的,约1%的全部单个肽/自身抗体结合反应产生了非常强的信号,其在一些案例中甚至超过了阳性对照(数据未显示)。这些罕见的、非常强的信号可说明这样一种情况:其中某种表位检测到了特定的高亲和力的抗肿瘤血清aAB。基于Cy3的荧光测定检测得以验证,因为对于表位微阵列它产生了更大的动力学范围。Cy3的使用显示了识别高滴度和高亲和力的抗-肿瘤血清aAB的表位。比色测定法和荧光测定法两者产生的数据都进行了分析和交叉验证。交叉验证包括基于p值和方差的分析。
单独的aAB和aAB模式的效力
使用的体系确定了(1)每个信息性表位的单独的诊断效力,以及(2)验证了信息性表位的多个组合(aAB模式)的诊断效力。前者可利用Golub等人,同上,描述的“加权投票”原理实现,而后者可采用不同的模式识别算法,并随后个别地验证获得的模式而实现。简而言之,为了说明单独表位的诊断效力,可使用“加权投票”体系。在这种类型的体系中,一种信息性表位预测某种肿瘤的能力取决于(1)其改变一组信息性表位的诊断效力的能力,和(2)其在盲法试验(blinded study)中预测一种肿瘤类型的能力。具体而言,单个表位改变一组表位的诊断效力的能力越大,则该表位越可能预测某种肿瘤。具有最大的单独预测能力的表位在盲法试验中将同样是最有价值的标记。由于癌巨大的遗传复杂性,以及免疫应答和抗原递呈的可变性,多种aAB模式的诊断效用超过了单个表位的诊断效用。
对应于相同抗原的不同表位具有不同的诊断价值。
作为抗原的蛋白质携带有大量的表位,所述表位不具有同等的免疫原性并且不通过抗原递呈和肿瘤细胞来同等地递呈。
例如,22个KIA0373肽中,只有两个肽(KIAA0373-1107-RKFAVIRHQQSLLYK和KIAA0373-1193-MKKILAENSRKITVL)显示出一致的自身抗体结合活性和强的NSCLC诊断价值。在NISCH、SDCCAG3、ZNF292、RBPSUH和许多其它的蛋白质中观察到单独的表位间的诊断价值的类似差别。
总而言之,我们的分析已经证明:来自相同蛋白质抗原的不同表位可具有不同的并甚至相反的诊断价值。例如,抗体识别表位S0X3/7(肽-PAMYSLLETELKNPV)得以递呈并表征NSCLC,并且表位SOX3/14(肽-DEAKRLRAVHMKEYP)表征SCLC。
肺癌患者的大规模自身抗体谱分析:自身抗体模式的诊断价值
该试验具有三组患者:
1.具有重度吸烟历史的健康患者(32名患者)
2.非小细胞型肺癌患者(36名患者)
3.小细胞型肺癌患者(26名患者)
将来自所有试验个体的血清用具有表1中公开的1448种肽表位的1253种的肽表位阵列分析。
阵列图像用Array-Pro Analyzer(Media Cybernetics)分析并且图像数据用GeneMaths XT(Applied Maths)分析以获得自身抗体结合活性的模式,所述的模式表征癌患者并可用作诊断工具。(表3-6)
使用神经网络和支持向量机软件的分析证明,离散的自身抗体组存在于每种患者类型中。在该特定的试验个体组中,非小细胞型癌患者以83-85%的特异性分组在一起,然而对照患者以低于5%的概率属于该组。(表3-6)
肺癌患者的自身抗体谱分析:肺癌确定性肽
将含有25个最提供信息的表位(表11)的肽阵列用于上面描述的样品。该阵列含有在大规模筛选中在非小细胞型肺癌(NSCLC)和对照样品间产生最佳区分的肽,所述的大规模筛选使用了表1中公开的1448个肽表位的1253种。我们称这些肽为“肺癌确定性肽”,其可作为非常准确的一组肺癌诊断表位使用。我们将支持向量机用作模式识别算法。首先,我们用所有的NSCLC样品组成分类器(classifier)并随后我们将该分类器应用至NSCLC和对照样品两者上。NSCLC样品与NSCLC分类器的平均相似性为~95%,并且对照样品的平均相似性为12.5%。(表12)
自身抗体的检测:在盖玻片上使用硝化纤维垫(pad)的肽微阵列流程
微阵列载玻片是可商业获得的,例如从Schleicher&Schuell获得。该方法如下:
1.在室温下用基于TBS(pH7.4)的Superblock,(Pierce Cat#37535)、0.05%吐温20封闭1小时。每孔使用100-150μl的封闭溶液(16垫的载玻片)。
2.在室温下用TBS,pH7.4和0.05%吐温20洗涤两次(每次洗涤2分钟)。每次洗涤150μl。
3.用含有1∶10稀释的Superblock和0.05%吐温20的TBS,pH7.4以1∶15稀释血清。
4.将阵列在+4℃下与150μl稀释的血清孵育过夜(最短16小时)。
5.在室温下用含有0.05%吐温20的TBS,pH7.4洗涤5次(每次洗涤5分钟)。每次洗涤150μl。
6.在室温下,用经TBS,pH7.4以1∶3000稀释的二抗(缀合碱性磷酸酶的抗人IgA、IgM、IgG;ChemiconAP120A,lot 23091469)孵育1小时,所述的TBS含有1∶10稀释的Superblock和0.05%吐温20。体积为150μl。
7.在室温下用含有0.05%吐温20的TBS,pH7.4洗涤5次(每次洗涤5分钟)。每次洗涤150μl。
8.用碱性磷酸酶底物(Pierce 1-Step NBT/BCIP,产品#34042)使自身抗体结合显影。将需要15-30分钟才看见反应产物。不要过度孵育。长的孵育时间将会导致高的本底。
9.通过用水冲洗终止反应。
10.干燥载玻片并分析。
使用Perkin Elmer Piezzo Arrayer的肽打印流程
制剂:
PBS缓冲液中的0.1%吐温
HPLC级水
50mM NaOH
疏水硅烷ES
HPLC甲醇
方法:
在任何操作之前实施下列各项:
1)用Prime Utility初始化(Prime)针尖;
2)利用高级的NaOH的清洁功能,用50mM NaOH清洗针尖;
3)利用Prime Utility初始化针尖;
4)利用Silanate Utility使针尖硅烷化,最开始的4个孔应填充100%HPLC级甲醇;由于NaOH的清洗应该不会发生蛋白质沉淀;最后的四个孔将会装有疏水硅烷ES溶液;
5)用Prime Utility初始化针尖;
6)使用Tuning Utility调准针尖;
7)进行标准洗涤。
设置操作流程:
1)洗涤设置表应该如下设置:注射器的洗液体积是400μl,蠕动泵工作时间是10秒钟,并且超声设置为yes;
2)操作流程设置应该执行洗液溶液;该溶液应该是PBS中的1%吐温;接触时间应该是35秒,冲洗体积为400μl,并且抽吸体积为15μl;
3)阵列应该打印55份样品(一式两份)或110个样品点于一片16Pad Fast Slide上;
4)一旦有错误(Error),在忽视之前应该立即尝试重试一次。
打印:
1)肽样品(2mg/ml于H2O中)与对照样品一起到达96孔平板中并且只需要将其准确置于样品源支持器中;
2)打印后,所有载玻片需适当地标记。
重复上述步骤进行清理用于下一次打印。
在这里引用的所有参考文献和专利在此明确地通过全文引入作为参考。

Claims (3)

1.用于鉴定一组信息性表位的方法,所述的表位具有与样品间类型区分相关的自身抗体结合活性,所述的方法包括步骤:
a)测定多种样品中多种表位的自身抗体结合活性,所述的样品来自两种或更多种类型中的每种;
b)将所述表位通过它们在所述多种样品中的自身抗体结合活性与类型区分的相关程度进行分类;并
c)确定所述的相关性是否比预期的随机相关性强;
其中具有这样的自身抗体结合活性的表位是信息性表位,所述的自身抗体结合活性与类型区分的相关性比预期的随机相关性更强,因而鉴定出一组信息性表位。
2.用于鉴定一组信息性表位的方法,所述的表位具有与样品间类型区分相关的自身抗体结合活性,所述的方法包括步骤:
a)测定多种样品中多种表位的自身抗体结合活性,所述的样品来自两种或更多种类型中的每种;
b)从所述的多种表位确定表位簇,所述的多种表位在来自所述的多种样品的相同类型样品中具有自身抗体结合活性,其中所述的表位簇具有与类型区分相关的自身抗体结合活性,所述的类型区分是来自所述多种样品的不同类型样品间的区分;并且
c)确定所述的相关性是否比预期的随机相关性强;
其中这样的一簇表位是一组信息性表位,所述的这样一簇表位的自身抗体结合活性比预期的随机相关性更强地与类型区分相关。
3.用于区分生物样品的多种类型的表位微阵列,所述的表位微阵列包含多种肽,每种所述的肽在以选自多种特定类型中的一种特定类型为特征的样品中独立地具有相应的表位结合活性,其中总的来看,所述多种肽在汇总性地以全部所述的多种特定类型为特征的多种样品中具有相应的表位结合活性,其中每种所述肽的自身抗体结合活性在以所述多种特定类型中的一种为特征的样品中独立地比以所述多种特定类型中的另一类型为特征的样品高。
CNA2006800126573A 2005-02-24 2006-02-24 用于生物样品分类的组合物和方法 Pending CN101160524A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US65685905P 2005-02-24 2005-02-24
US60/656,859 2005-02-24

Publications (1)

Publication Number Publication Date
CN101160524A true CN101160524A (zh) 2008-04-09

Family

ID=36928007

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800126573A Pending CN101160524A (zh) 2005-02-24 2006-02-24 用于生物样品分类的组合物和方法

Country Status (11)

Country Link
US (1) US20090075832A1 (zh)
EP (1) EP1859266A4 (zh)
JP (1) JP2008532014A (zh)
KR (1) KR20080003321A (zh)
CN (1) CN101160524A (zh)
AU (1) AU2006216683A1 (zh)
CA (1) CA2598889A1 (zh)
IL (1) IL185458A0 (zh)
MX (1) MX2007010349A (zh)
RU (1) RU2007135030A (zh)
WO (1) WO2006091734A2 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102171340A (zh) * 2008-08-01 2011-08-31 肿瘤疗法科学股份有限公司 Melk表位肽及包含它的疫苗
CN102822193A (zh) * 2010-01-25 2012-12-12 肿瘤疗法科学股份有限公司 修饰的melk肽及包含它们的疫苗
CN108184330A (zh) * 2015-06-26 2018-06-19 加利福尼亚大学董事会 抗原肽及其用于诊断和治疗自闭症的用途
CN108779149A (zh) * 2016-03-16 2018-11-09 伊玛提克斯生物技术有限公司 用于非小细胞肺癌和其他癌症免疫治疗的肽和肽组合物
CN108948184A (zh) * 2017-05-22 2018-12-07 广东香雪精准医疗技术有限公司 一种识别衍生自prame抗原短肽的t细胞受体
CN109400697A (zh) * 2017-08-17 2019-03-01 广东香雪精准医疗技术有限公司 一种识别prame抗原短肽的tcr及其相关组合物
CN110922492A (zh) * 2019-12-18 2020-03-27 重庆医科大学 融合肽、ctp介导的诱导cml细胞免疫应答的dc疫苗及其制备方法
CN111337678A (zh) * 2020-02-21 2020-06-26 杭州凯保罗生物科技有限公司 与肿瘤免疫治疗效果相关的生物标志物及其应用
CN116773798A (zh) * 2023-06-16 2023-09-19 北京三品医疗科技有限公司 多肽的应用

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060222656A1 (en) 2005-04-01 2006-10-05 University Of Maryland, Baltimore MAGE-A3/HPV 16 peptide vaccines for head and neck cancer
WO2002094994A2 (en) 2001-05-18 2002-11-28 Mayo Foundation For Medical Education And Research Chimeric antigen-specific t cell-activating polypeptides
JP5564249B2 (ja) * 2006-06-23 2014-07-30 アレシア・バイオセラピューティクス・インコーポレーテッド 癌に関与するポリヌクレオチド配列およびポリペプチド配列
WO2008053573A1 (fr) * 2006-10-30 2008-05-08 National University Corporation Hokkaido University Remède pour néoplasme malin
TWI610939B (zh) * 2007-02-21 2018-01-11 腫瘤療法 科學股份有限公司 表現腫瘤相關抗原之癌症的胜肽疫苗
WO2009029716A1 (en) * 2007-08-28 2009-03-05 Ramot At Tel Aviv University Peptides inducing a cd4i conformation in hiv gp120 while retaining vacant cd4 binding site
TW201008574A (en) 2008-08-19 2010-03-01 Oncotherapy Science Inc INHBB epitope peptides and vaccines containing the same
CN104829714A (zh) 2008-11-03 2015-08-12 阿莱斯亚生物疗法股份有限公司 特异性地阻滞肿瘤抗原的生物活性的抗体
GB0823366D0 (en) 2008-12-22 2009-01-28 Uni I Oslo Synthesis
KR101067815B1 (ko) * 2009-02-05 2011-09-27 서울대학교산학협력단 제1형 당뇨병의 신규한 진단 마커
CN105911275B (zh) 2009-08-14 2018-06-29 加利福尼亚大学董事会 诊断自闭症的试剂盒
US8075895B2 (en) * 2009-09-22 2011-12-13 Janssen Pharmaceutica N.V. Identification of antigenic peptides from multiple myeloma cells
RS59080B1 (sr) 2011-03-31 2019-09-30 Adc Therapeutics Sa Antitela protiv antigena 1 povezanog sa bubrezima i njihovi fragmenti koji se vezuju za antigen
US10060911B2 (en) * 2011-08-19 2018-08-28 Protagen Aktiengesellschaft Method for diagnosis of high-affinity binders and marker sequences
WO2013031757A1 (ja) * 2011-08-29 2013-03-07 東レ株式会社 膵癌、乳癌、肺癌又は前立腺癌の検出用マーカー及び検査方法
LT2802351T (lt) 2012-01-09 2019-06-25 Adc Therapeutics Sa Agentai, skirti trigubai neigiamo krūties vėžio gydymui
US20130183242A1 (en) * 2012-01-18 2013-07-18 University Of Connecticut Methods for identifying tumor-specific polypeptides
GB201319446D0 (en) 2013-11-04 2013-12-18 Immatics Biotechnologies Gmbh Personalized immunotherapy against several neuronal and brain tumors
WO2015172843A1 (en) * 2014-05-16 2015-11-19 Biontech Diagnostics Gmbh Methods and kits for the diagnosis of cancer
US20150335679A1 (en) * 2014-05-20 2015-11-26 Kiromic, Llc Methods and Compositions for Treating Malignancies with Dendritic Cells
CA3226056A1 (en) 2015-01-21 2016-07-28 Inhibrx, Inc. Non-immunogenic single domain antibodies
GB201505305D0 (en) * 2015-03-27 2015-05-13 Immatics Biotechnologies Gmbh Novel Peptides and combination of peptides for use in immunotherapy against various tumors
SI3322734T1 (sl) 2015-07-16 2021-02-26 Inhibrx, Inc. Multivalentni in multispecifični DR5-vezavni fuzijski proteini
HK1258386A1 (zh) 2015-10-05 2019-11-08 Immatics Biotechnologies Gmbh 用於小细胞肺癌和其他癌症免疫治疗的肽和肽组合物
EP3193173A1 (en) * 2016-01-14 2017-07-19 Deutsches Krebsforschungszentrum, Stiftung des öffentlichen Rechts Serological autoantibodies as biomarker for colorectal cancer
DE102016123893A1 (de) 2016-12-08 2018-06-14 Immatics Biotechnologies Gmbh T-Zellrezeptoren mit verbesserter Bindung
SI3573647T1 (sl) * 2017-01-27 2023-07-31 Immatics Biotechnologies Gmbh Peptidi in kombinacija peptidov za uporabo v imunoterapiji proti raku jajčnikov in drugim oblikam raka
EP3756680A1 (en) * 2019-06-26 2020-12-30 Universitat de Lleida Intermediate filament-derived peptides and their uses
WO2021011636A1 (en) * 2019-07-15 2021-01-21 Geisinger Health COMPOSITIONS AND METHODS OF TREATMENT FOR BREAST CANCER INVOLVING A NOVEL CAPERα-MLL1 COMPLEX

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7625697B2 (en) * 1994-06-17 2009-12-01 The Board Of Trustees Of The Leland Stanford Junior University Methods for constructing subarrays and subarrays made thereby
US20030092009A1 (en) * 2000-11-16 2003-05-15 Kaia Palm Profiling tumor specific markers for the diagnosis and treatment of neoplastic disease
EP1410037A2 (de) * 2001-03-10 2004-04-21 Affina Immuntechnik GmbH Verfahren zur identifikation von immunreaktiven epitopen auf proteinen und verwendung der epitope zu prophylaktischen und therapeutischen zwecken
JP4594588B2 (ja) * 2001-04-10 2010-12-08 ザ ボード オブ トラスティーズ オブ ザ リランド スタンフォード ジュニア ユニヴァーシティ 抗体特異的プロファイルの治療的および診断的使用方法
WO2003042357A2 (en) * 2001-09-28 2003-05-22 Incyte Genomics, Inc. Enzymes
EP1578970A1 (de) * 2002-12-23 2005-09-28 Hans-Jürgen Thiesen Human-autoantigene und deren verwendung
AU2003300368A1 (en) * 2002-12-26 2004-07-29 Cemines, Llc. Methods and compositions for the diagnosis, prognosis, and treatment of cancer

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102171340A (zh) * 2008-08-01 2011-08-31 肿瘤疗法科学股份有限公司 Melk表位肽及包含它的疫苗
US8674069B2 (en) 2008-08-01 2014-03-18 Oncotherapy Science, Inc. MELK epitope peptides and vaccines containing the same
US9193765B2 (en) 2008-08-01 2015-11-24 Oncotherapy Science, Inc. Melk epitope peptides and vaccines containing the same
CN102171340B (zh) * 2008-08-01 2016-12-21 肿瘤疗法科学股份有限公司 Melk表位肽及包含它的疫苗
US9675680B2 (en) 2008-08-01 2017-06-13 OncoTherapy Science MELK epitope peptides and vaccines containing the same
CN102822193A (zh) * 2010-01-25 2012-12-12 肿瘤疗法科学股份有限公司 修饰的melk肽及包含它们的疫苗
US8871719B2 (en) 2010-01-25 2014-10-28 Oncotherapy Science, Inc. Modified MELK peptides and vaccines containing the same
CN102822193B (zh) * 2010-01-25 2016-03-30 肿瘤疗法科学股份有限公司 修饰的melk肽及包含它们的疫苗
CN108184330A (zh) * 2015-06-26 2018-06-19 加利福尼亚大学董事会 抗原肽及其用于诊断和治疗自闭症的用途
CN108779149A (zh) * 2016-03-16 2018-11-09 伊玛提克斯生物技术有限公司 用于非小细胞肺癌和其他癌症免疫治疗的肽和肽组合物
CN108948184A (zh) * 2017-05-22 2018-12-07 广东香雪精准医疗技术有限公司 一种识别衍生自prame抗原短肽的t细胞受体
CN109400697A (zh) * 2017-08-17 2019-03-01 广东香雪精准医疗技术有限公司 一种识别prame抗原短肽的tcr及其相关组合物
CN110922492A (zh) * 2019-12-18 2020-03-27 重庆医科大学 融合肽、ctp介导的诱导cml细胞免疫应答的dc疫苗及其制备方法
CN110922492B (zh) * 2019-12-18 2022-02-15 重庆医科大学 融合肽、ctp介导的诱导cml细胞免疫应答的dc疫苗及其制备方法
CN111337678A (zh) * 2020-02-21 2020-06-26 杭州凯保罗生物科技有限公司 与肿瘤免疫治疗效果相关的生物标志物及其应用
CN116773798A (zh) * 2023-06-16 2023-09-19 北京三品医疗科技有限公司 多肽的应用

Also Published As

Publication number Publication date
MX2007010349A (es) 2008-04-09
JP2008532014A (ja) 2008-08-14
EP1859266A4 (en) 2010-07-28
KR20080003321A (ko) 2008-01-07
WO2006091734A2 (en) 2006-08-31
EP1859266A2 (en) 2007-11-28
US20090075832A1 (en) 2009-03-19
IL185458A0 (en) 2008-01-06
AU2006216683A1 (en) 2006-08-31
WO2006091734A3 (en) 2007-02-08
WO2006091734A9 (en) 2006-10-19
RU2007135030A (ru) 2009-03-27
CA2598889A1 (en) 2006-08-31

Similar Documents

Publication Publication Date Title
CN101160524A (zh) 用于生物样品分类的组合物和方法
Broodman et al. Serum protein markers for the early detection of lung cancer: a focus on autoantibodies
Lacombe et al. Use of autoantibodies to detect the onset of breast cancer
Zhong et al. Using protein microarray as a diagnostic assay for non–small cell lung cancer
CN102749447B (zh) 改进的免疫测定方法
US20080081339A1 (en) Tumor associated markers in the diagnosis of prostate cancer
Adeola et al. Novel potential serological prostate cancer biomarkers using CT100+ cancer antigen microarray platform in a multi-cultural South African cohort
US20120100558A1 (en) Lung cancer diagnosis
EP3606507A1 (en) Serological biomarkers for early diagnosis of lung cancer
EP2951592A1 (en) Autoantibody signature for the early detection of ovarian cancer
Pei et al. Discovering novel lung cancer associated antigens and the utilization of their autoantibodies in detection of lung cancer
Pin et al. Identification of a novel autoimmune peptide epitope of prostein in prostate cancer
EP3230745A1 (en) Plasma autoantibody biomarkers for basal like breast cancer
JP2020515826A (ja) 抗体アッセイ
WO2010108638A9 (en) Tumour gene profile
WO2020069661A1 (en) Serological biomarkers for early diagnosis of lung cancer
CN103245784A (zh) 肺癌的诊断分析法
JP2012531581A (ja) 癌の検出のための方法およびシステム
Luo et al. High‐throughput and multi‐phases identification of autoantibodies in diagnosing early‐stage breast cancer and subtypes
JP2016519767A (ja) 前立腺がんに対するバイオマーカー検出における使用のための方法とアレイ
GB2478734A (en) Auto-antibody biomarkers of prostate cancer
CN113702636B (zh) 血浆自身抗体标志物在乳腺癌早期诊断及其分子亚型表征中的应用
HK1120108A (zh) 用於生物樣品分類的組合物和方法
US9797906B2 (en) Detectors of serum biomarkers for predicting ovarian cancer recurrence
WO2010063761A1 (en) An in-vitro method or assay for detecting a tumor or a cancerous disease by screening for antibodies

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1120108

Country of ref document: HK

C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080409

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1120108

Country of ref document: HK