HK1160923A - 結核分枝杆菌感染的血液轉錄標籤 - Google Patents
結核分枝杆菌感染的血液轉錄標籤 Download PDFInfo
- Publication number
- HK1160923A HK1160923A HK12101117.2A HK12101117A HK1160923A HK 1160923 A HK1160923 A HK 1160923A HK 12101117 A HK12101117 A HK 12101117A HK 1160923 A HK1160923 A HK 1160923A
- Authority
- HK
- Hong Kong
- Prior art keywords
- active
- latent
- patients
- genes
- infection
- Prior art date
Links
Description
发明技术领域
本发明总的来说涉及结核分枝杆菌感染的领域,更具体地,涉及用于在治疗之前、期间和之后,诊断、预测和监测潜伏性的和活性的结核分枝杆菌感染和疾病进展。
长表格
本专利申请包括长表格部分。所述表格的拷贝以电子的形式可得自USPTO网站(http://seqdata.uspto.gov/)。该表格的电子拷贝经要求及缴纳37CFR 1.19(b)(3)所规定的费用可从USPTO获得。
发明背景
不限制本发明的范围下,将其背景结合结核分枝杆菌感染的鉴定和治疗进行描述。
肺结核(PTB)是全世界结核分枝杆菌(M.tuberculosis)引起的发病和死亡的主要的和增长的起因。然而,多数感染了M.tuberculosis的个体保持无症状,将感染保持在潜伏性的形式,并认为该潜伏性的状态是通过主动免疫响应维持的(WHO;Kaufmann,SH & McMichael,AJ.,Nat Med,2005)。这受到报道的支持,所述报道显示使用抗-TNF抗体治疗患克罗恩病(Crohn’sDisease)或者类风湿关节炎(Rheumatoid Arthritis)的患者,引起自身免疫症状的改善,然而另一个方面在事先接触M.tuberculosis(Keane)的患者中引起TB的再活化。对M.tuberculosis的免疫响应是多因子的,并包括遗传学上确定的宿主因子,如Th1轴上的TNF和IFN-γ以及IL-12(综述于Casanova,Ann Rev;Newport)。然而,来自成年肺TB患者的免疫细胞能产生IFN-γ、IL-12和TNF,以及IFN-γ疗法不帮助改进疾病(综述于Reljic,2007,JInterferon & Cyt Res.,27,353-63),说明了更广泛数量的宿主免疫因子牵涉到抗M.tuberculosis的保护以及潜伏性的保持中。因此,在潜伏性的或者活性的TB中所诱导的宿主因子的认识能提供关于免疫响应的信息,所述免疫响应能够控制M.tuberculosis的感染。
PTB的诊断可能由于多种原因而困难及有问题。首先,通过显微检查(涂布阳性)来证明典型的结核分枝杆菌在痰中的存在仅有50-70%的灵敏性,并且阳性诊断要求M.tuberculosis通过培养进行分离,这可能长达8周。除此之外,一些患者的痰是涂布阴性的,或者不能产生痰,故需要通过支气管镜检查法这种介入性操作进行额外的取样。由于PTB的诊断中的这些限制,有时涂布阴性的患者要测试结核菌素(PPD)皮肤反应(曼托试验)。然而,结核菌素(PPD)皮肤反应不能区分BCG接种、潜在或者活性的TB。针对这个问题,已经开发了证明对特异M.tuberculosis抗原的免疫反应性的检测,所述抗原不存在于BCG中。然而,对这些M.tuberculosis抗原的反应性(由在γ干扰素释放检测(IGRA)中通过血细胞产生IFN-γ而测量)并不将潜伏性的与活性的疾病区分开。在临床上,当患者经皮下注射PPD,在没有临床症状或迹象或者放射学显示的活性的疾病而具有IGRA阳性结果时,通过延迟类型的高度灵敏反应来定义潜伏性的TB。潜伏性的/潜在的肺结核(TB)的再活化表现出严重的健康危害,具有向其他个体传播的风险,因此反映潜伏性的和活性的TB患者的区别的生物标记物在疾病控制中可能是有用的,尤其是由于抗分枝杆菌的药物治疗是困难的,并可能导致严重的副作用。
发明概述
本发明包括用于鉴别潜伏性的与活性的结核(TB)患者的方法和试剂盒(与健康的对照相比)。在一个实施方案中,采用不同的和相互的免疫标签(signature)的血液微阵列分析来确定、诊断、跟踪及治疗潜伏性的与活性的结核(TB)患者。
在一个实施方案中,本发明包括在怀疑感染了结核分枝杆菌的患者中,区分活性和潜伏性的结核分枝杆菌感染的方法、系统和试剂盒,所述方法包括下述步骤:从患者的全血样品中获得基因表达数据集;测定一个或多个转录基因表达模块的有差别的表达,所述模块区别感染的患者及未感染的个体,其中所述数据集显示了与所对应的未感染的个体相比,在一个或多个转录基因表达模块中多核苷酸水平的总体变化,并且基于区分活性和潜伏性的感染的一个或者多个转录基因表达模块,区分活性的和潜伏性的结核分枝杆菌(TB)感染。在一个方面,本发明还可以包括使用所测定的对比基因产物信息来制定诊断的步骤。
在另一个方面,本方法还可以包括使用所测定的对比基因产物信息来规划预测的步骤,或者使用所测定的对比基因产物信息来制定治疗计划的步骤。在一个可选的方面,本发明可以包括区分具有潜伏的TB的患者与活性的TB患者的步骤。在一个方面,所述模块可以包括模块M1.2、M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9中的基因的数据集,从而检测活性的肺部感染。在另一个方面,所述模块可以包括模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3中基因的数据集,从而检测潜伏性的感染。在再另一个方面,下列基因在活性的肺部感染中被下调:CD3、CTLA-4、CD28、ZAP-70、IL-7R、CD2、SLAM、CCR7和GATA-3。在一个具体的方面,图9的模块表达谱指示活性的肺部感染,图10的模块表达谱指示潜伏性的感染。已经发现了在模块M3.4、M3.6、M3.7、M3.8和M3.9中基因的低表达指示活性的感染。也已经发现了在模块M3.1中的基因的过表达指示活性的感染。
在本发明的再另一个方面,所述方法还可以包括区分TB感染与其他细菌感染的步骤,其通过测定模块M2.2、M2.3和M3.5中的基因表达进行,这些模块在分枝杆菌之外的感染中,由外周血液单核细胞或者全血过表达。可选地,所述方法可以包括区分在潜伏性的和活性的TB患者血液中有差别的和相互的转录标签的步骤,其使用下列的模块的两个或更多个:M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9(用于活性的肺部感染)以及模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3(用于潜伏性的感染)。与健康的患者相比,在活性的肺部TB感染中上调的基因的实例选自表7A、7D、7I、7J和7K。与健康的患者相比,在活性的肺部TB感染中下调的基因的进一步实例选自表7B、7C、7E、7F、7G、7H、7L、7M、7N、7O和7P。在一个具体的方面,相对于健康的患者,在潜伏性的TB感染中上调的基因可以选自表8B。在另一个具体的方面,相对于健康的患者,在潜伏性的TB感染中下调的基因可以选自表8A、8C、8D、8E和8F。
本发明的另一个实施方案是在怀疑感染了结核分枝杆菌的患者中区分活性的和潜伏性的结核分枝杆菌感染的方法,所述方法包括下述步骤:从具有活性的结核分枝杆菌感染的第一个临床组得到第一基因表达数据集,从具有潜伏性的结核分枝杆菌感染患者的临床组得到的第二基因表达数据集以及从未感染个体的临床组得到的第三基因表达谱;产生基因簇数据集,所述数据集包含第一、第二和第三数据集的任意两者之间基因有差别的表达;并确定表达/表现的独特的样式,所述样式指示潜伏性的感染、活性的感染或者健康。在一个方面,将各个临床组按照表6中119个基因中的每一个分到独特的表达/表现图谱中。在另一个方面,第一和第三数据集的数值进行比较,并将来自第三数据集的数据集的数值从中减去。在另一个具体的方面,将第二及第三数据集的数值进行比较,并将来自第三数据集的数据集的数值从中减去。在一个具体的实施方案中,所述方法可以进一步包括比较两个不同的数据集的数值,并将剩下的数据集的数值减去的步骤,从而区分具有潜伏性感染的患者、具有活性的感染的患者以及未感染的个体。在一个方面,本发明可以进一步包括使用所测定的对比基因产物信息来制定诊断或者预测的步骤。在再另一个方面,所述方法包括使用所测定的对比基因产物信息来制定治疗计划的步骤。该方法还可以包括通过分析在基因和患者簇中的表达/表现,区分具有潜伏性的TB的患者与活性的TB患者的步骤。
在一个具体的方面,该方法可以进一步包括测定下述基因的表达水平的步骤:ST3GAL6、PAD14、TNFRSF12A、VAMP3、BR13、RGS19、PILRA、NCF1、LOC652616、PLAUR(CD87)、SIGLEC5、B3GALT7、IBRDC3(NKLAM)、ALOX5AP(FLAP)、MMP9、ANPEP(APN)、NALP12、CSF2RA、IL6R(CD126)、RASGRP4、TNFSF14(CD258)、NCF4、HK2、ARID3A、PGLYRP1(PGRP),其在潜伏性的TB患者低表达/低表现,而在健康的个体或者活性的TB患者的血液中不是如此。在另一个具体的方面,该方法可以进一步地包括测定所述基因的表达水平的步骤:ABCG1、SREBF1、RBP7(CRBP4)、C22orf5、FAM101B、S100P、LOC649377、UBTD1、PSTPIP-1、RENBP、PGM2、SULF2、FAM7A1、HOM-TES-103、NDUFAF1、CES1、CYP27A1、FLJ33641、GPR177、MID1IP1(MIG-12)、PSD4、SF3A1、NOV(CCN3)、SGK(SGK1)、CDK5R1、LOC642035,其在健康的对照个体的血液中过表达/过表现,但是在潜伏性的TB患者的血液中低表达/低表现,并在活性的TB患者的血液中低表达/低表现。在另一个具体的方面,该方法可以进一步包括测定下述基因的表达水平的步骤:ARSG、LOC284757、MDM4、CRNKL1、IL8、LOC389541、CD300LB、NIN、PHKG2、HIP1,其在健康个体的血液中过表达/过表现,在潜伏性和活性的TB患者中低表达/低表现。在一个具体的方面,该方法可以进一步包括测定下述基因的表达水平的步骤:PSMB8(LMP7)、APOL6、GBP2、GBP5、GBP4、ATF3、GCH1、VAMP5、WARS、LIMK1、NPC2、IL-15、LMTK2、STX11(FHL4),其在活性的TB的血液中过表达/过表现,并在潜伏性的TB患者和健康的对照个体的血液中低表达/低表现。在一个具体的方面,该方法可以进一步包括测定下述基因的表达水平的步骤:FLJ11259(DRAM)、JAK2、GSDMDC1(DF5L)(FKSG10)、SIPAIL1、[2680400](KIAA1632)、ACTA2(ACTSA)、KCNMB1(SLO-BETA),其在来自活性的TB患者的血液中过表达/过表现,并在来自潜伏性的TB患者和健康的对照个体的血液中低表达/低表现。在一个具体的方面,该方法可以进一步包括测定下述基因的表达水平的步骤:SPTANI、KIAAD179(Nnp1)(RRP1)、FAM84B(NSE2)、SELM、IL27RA、MRPS34、[6940246](IL23A)、PRKCA(PKCA)、CCDC41、CD52(CDW52)、[3890241](ZN404)、MCCC1(MCCA/B)、SOX8、SYNJ2、FLJ21127、FHIT,其在活性的TB患者的血液中低表达/低表现,而在潜伏性的TB患者或者健康的对照个体的血液中不如此。在一个具体的方面,该方法可以进一步包括测定下述基因的表达水平的步骤:CDKL1(p42)、MICALCL、MBNL3、RHD、ST7(RAY1)、PPR3R1、[360739](PIP5K2A)、AMFR、FLJ22471、CRAT(CAT1)、PLA2G4C、ACOT7(ACT)(ACH1)、RNF182、KLRC3(NKG2E)、HLA-DPB1,其在健康对照个体的血液中低表达/低表现,在潜伏性的TB患者的血液中过表达/过表现,以及在活性的TB患者的血液中过表达/过表现。
本发明的再另一个实施方案是用于在疑似结核分枝杆菌感染的患者中区分活性的和潜伏性的结核分枝杆菌感染的方法,所述方法包括下述步骤:从全血样品中获得基因表达数据集;将所述基因表达数据集分类到一个或多个转录基因表达模块中;并将区分活性的和潜在的结核分枝杆菌感染的所述一个或者多个转录基因表达模块的有差别的表达进行绘图,从而区分活性的和潜伏性的结核分枝杆菌感染。在一个方面,所述数据集包括TRIM基因。在一个方面,所述数据集包括TRIM基因,具体地,TRIM5、6、19(PML)、21、22、25、68,在活性的肺部TB中过表达/表达。在一个方面,TRIM基因的数据集,包括TRIM 28、32、51、52、68,在活性的肺部TB中低表达/表达。
本发明的另一个实施方案是在怀疑感染了结核分枝杆菌的患者中诊断具有活性的和潜伏性的结核分枝杆菌感染的方法,所述方法包括:检测得自全血的一个或者多个转录基因表达模块的有差别的表达,所述模块区分感染的和未感染的患者,其中全血证实了与相对应的未感染的患者相比,在所述一个或多个转录基因表达模块中多核苷酸水平的总体变化,从而区分活性的和潜伏性的结核分枝杆菌感染。在另一个方面,所述方法包括下述的一个或多个的步骤:使用所测定的对比基因产物信息制定诊断,使用所测定的对比基因产物信息制定诊断的步骤和使用所测定的对比基因产物信息制定治疗计划的步骤。在一个可选的方面,所述方法可以包括区分潜伏性的TB与活性TB患者的步骤。在一个方面,所述模块可以包括在下述模块中的基因数据集:M1.2、M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9,从而检测活性的肺部感染。在另一个方面,所述模块可以包括在下述模块中的基因数据集:M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3,从而检测潜伏性的感染。在再另一个方面,下述基因在活性的肺部感染中被下调,CD3、CTLA-4、CD28、ZAP-70、IL-7R、CD2、SLAM、CCR7和GATA-3。在一个具体的方面,在图9中的模块的表达谱指示活性的肺部感染,在图10中的模块的表达谱指示潜伏性的感染。已经发现了在模块M3.4、M3.6、M3.7、M3.8和M3.9中的基因的低表达指示活性的感染。还发现了在模块M3.1中的基因的过表达指示活性的感染。
在本发明的再另一个方面,该方法还包括通过测定模块M2.2、M2.3和M3.5中的基因表达,区分TB感染与其他的细菌感染的步骤,所述模块在分枝杆菌之外的感染中,由外周血液单核细胞或者全血过表达。可选地,该方法可以包括在潜伏性的和活性的TB患者的血液中,使用两个或更多个下述模块区分不同的和相互的转录标签的步骤:对于活性的肺部感染,为M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9,对于潜伏性的感染,为模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3。相对于健康的患者,在活性的肺部TB感染中上调的基因的实例选自表7A、7D、7I、7J和7K。相对于健康的患者,在活性的肺部TB感染中下调的基因的其它实例选自表7B、7C、7E、7F、7G、7H、7L、7M、7N、7O和7P。在一个具体的方面,相对于健康的患者,在潜伏性的TB感染中上调的基因的实例选自表8B。在另一个具体的方面,相对于健康的患者,在潜伏性的TB感染中下调的基因的实例选自表8A、8C、8D、8E和8F。
本发明的另一个实施方案是试剂盒,所述试剂盒用于在怀疑感染了结核分枝杆菌的患者中,诊断具有活性和潜伏性的结核分枝杆菌感染,该试剂盒包括用于从患者获得基因表达数据集的基因表达检测器;以及能够将得自全血的基因表达与预设的基因模块数据集进行比较的处理器,所述数据集区分感染的和未感染的患者,其中全血证实了与相对应的未感染的患者相比,在一个或者多个转录基因表达模块中的多核苷酸水平的总体变化,从而区分活性的和潜伏性的结核分枝杆菌感染。
再另一个实施方案包括诊断具有活性的和潜伏性的结核分枝杆菌感染的患者的系统,其包括:来自所述患者的基因表达数据集;以及能够将得自全血的基因表达与预设的基因模块数据集进行比较的处理器,所述数据集区分感染的和未感染的患者,其中全血证实了与相对应的未感染的患者相比,在一个或者多个转录基因表达模块中的多核苷酸水平的总体变化,从而区分活性的和潜伏性的结核分枝杆菌感染,其中对于活性的肺部感染而言,所述模块选自M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9,对于潜伏性的感染而言,选自模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3。
附图的简要说明
为了更完全地理解本发明的特征和优点,在此参考本发明的详述以及所附的图,以及其中:
图1显示了来自42个参与者的基因阵列表达,存在于至少2个样品中的基因(PLA2),与中间数相比上调或者下调2倍的基因,通过皮尔逊相关系数集中,来比较活性的PTB、潜伏性的TB、健康的BCG未接种的对照及健康的BCG经接种的对照;
图2显示了基因阵列表达结果,所述结果得自PAL2,上调或者下调表达2倍的,在各临床组之间筛选在表达中统计上显著的差别,所述筛选使用非参数检验(Kruskal-Wallis),P<0.01,以及使用Benjamini-Hochberg相关系数(1473个基因),并使用皮尔逊相关系数独立地合并,来比较活性的PTB、潜伏性的TB和健康的对照;
图3A-3D显示了基因阵列表达结果,其来自PAL2,2倍表达上调或者下调的,在各个临床组之间筛选在表达中统计上显著的差别,所述筛选使用非参数检验(Kruskal-Wallis),P<0.01,以及使用Benjamini-Hochberg矫正,并随后筛选对于基因注释中的生物过程“免疫响应”的基因本体论术语的存在,并使用皮尔逊相关系数独立地集中(158个基因)。这158个基因分别显示在4个图中以便阅览(图3A-3D)。
图3A显示了比较活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照的基因阵列表达结果;
图3B显示了比较活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照的基因阵列表达结果;
图3C显示了比较活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照的基因阵列表达结果;
图3D显示了比较活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照的基因阵列表达结果;
图4显示了来自42名参与者的基因阵列表达结果,存在于至少2个样品中的基因(PAL2),与中位数相比高或者低2倍的基因,通过皮尔逊相关系数集中的选择作为TRIM的基因,比较了活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照;
图5A显示了来自42名参与者的基因阵列表达结果的细节,存在于至少2个样品中的基因(PAL2),与中位数相比高或者低2倍的基因,通过皮尔逊相关系数集中,比较了活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照,显示了抑制性免疫调控配体(PDL1/CD274,PDL2/CD273)在活性的TB患者中过表达。
图5B显示了未经筛选的基因阵列表达结果,其证实了PDL1仅在活性的TB患者中表达。
图6显示了在基因阵列表达结果中筛选至少存在于2个样品中的基因,其与中位数相比上调或下调2倍,在组之间表达统计上显著差异(P<0.1,带有Bonferroni相关系数的Kruskal-Wallis非因数检验)(46个基因),其中独立地使用皮尔逊相关系数集中,比较了活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照;
图7显示了在基因阵列表达结果中筛选存在于至少2个样品中的基因,其与中位数相比“表现得”上调或者下调2倍,在组之间表达统计上显著差异(P<0.05,带有Bonferroni相关系数的Kruskal-Wallis非因数检验)(18个基因),其中独立地使用皮尔逊相关系数集中,比较了活性的PTB、潜伏性的TB、健康BCG的未接种的对照及健康BCG的经接种的对照;
图8A显示了将不同统计筛选合并区分全部3个临床组的结果,所述筛选应用到筛选存在于至少2个样品中的基因列表,其与中位数相比“表现得”上调或者下调2倍。在潜伏性的和健康的之间,所示的转录物统计上显著不同地表达(P<0.005,无相关系数的Wilcoxon-Mann-Whitney非参数检验),和在活性的和健康的之间,转录物统计上显著不同地表达(P<0.5,具有Bonferroni相关系数的Wilcoxon-Mann-Whitney非参数检验)-使用皮尔逊相关系数独立地集中的总计119个基因(患者/临床组的群组表示于水平方向,基因的群组表示于竖直方向);这些119个基因分别在5个进一步的图中显示(图8B-8F),以便阅览,并显示这些基因的亚组也可能用于区分不同的临床组(也即活性的、潜伏性的和健康的)。
图8B显示了将基因阵列表达结果筛选至少存在于2个样品中的基因,其与中位数相比“表现得”上调或下调2倍,转录物在潜伏性的和健康的表达中统计上显著差异(P<0.005,无相关系数的Wilcoxon-Mann-Whitney非因数检验),并且在活性的和健康的之间,转录物统计上显著不同地表达(P<0.5,具有Bonferroni相关系数的Wilcoxon-Mann-Whitney非参数检验)(患者/临床组的群组在水平方向上表示,基因的群组在竖直方向上表示);
图8C显示了将基因阵列表达结果筛选至少存在于2个样品中的基因,其与中位数相比“表现得”上调或下调2倍,转录物在潜伏性的和健康的表达中统计上显著差异(P<0.005,无相关系数的Wilcoxon-Mann-Whitney非因数检验),并且在活性的和健康的之间,转录物统计上显著不同地表达(P<0.5,具有Bonferroni相关系数的Wilcoxon-Mann-Whitney非参数检验);
图8D显示了将基因阵列表达结果筛选至少存在于2个样品中的基因,其与中位数相比“表现得”上调或下调2倍,转录物在潜伏性的和健康的表达中统计上显著差异(P<0.005,无相关系数的Wilcoxon-Mann-Whitney非因数检验),并且在活性的和健康的之间,转录物统计上显著不同地表达(P<0.5,具有Bonferroni相关系数的Wilcoxon-Mann-Whitney非参数检验)患者/临床组的群组在水平方向上表示,基因的群组在竖直方向上表示);
图8E显示了将基因阵列表达结果筛选至少存在于2个样品中的基因,其与中位数相比“表现得”上调或下调2倍,转录物在潜伏性的和健康的表达中统计上显著差异(P<0.005,无相关系数的Wilcoxon-Mann-Whitney非因数检验),并且,在活性的和健康的之间,转录物统计上显著不同地表达(P<0.5,具有Bonferroni相关系数的Wilcoxon-Mann-Whitney非参数检验)(患者/临床组的群组在水平方向上表示,基因的群组在竖直方向上表示);
图8F显示了将基因阵列表达结果筛选至少存在于2个样品中的基因,其与中位数相比上调或下调2倍,转录物在潜伏性的和健康的表达中统计上显著差异(P<0.005,无相关系数的Wilcoxon-Mann-Whitney非因数检验),并且在活性的和健康的之间,转录物统计上显著不同地表达(P<0.5,具有Bonferroni相关系数的Wilcoxon-Mann-Whitney非参数检验)(患者/临床组的群组在水平方向上表示,基因的群组在竖直方向上表示);
图9显示了来自PTB(9)与对照(6)的基因模块分析的基因阵列表达结果:来自5281个基因,筛选PAL2,通过Wilcoxon-Mann-Whitney检验,p<0.05和无多次检验校准下,活性的PTB和健康的对照在统计上显著不同地表达;以及
图10显示了来自PTB(9)与对照(6)的基因模块分析的基因阵列表达结果:来自3137个基因,筛选PAL2,通过Wilcoxon-Mann-Whitney检验,p<0.05和无多次检验校准下,活性的PTB和健康的对照在统计上显著不同地表达。
发明详述
尽管在下文详细地讨论了本发明不同实施方案的制备和应用,应该理解本发明提供了多种可实施的发明概念,所述概念能够在多种具体的环境下体现。在此讨论的具体实施方案仅仅为了说明产生和应用本发明的具体方式,而不限制本发明的范围。
为了便于理解本发明,以下定义了多个术语。在此定义的术语具有本发明相关领域的普通技术人员通常所理解的含义。术语如“一个(a/an)”、“一种(a/an)”和“该”不意图仅指单数的实体,而包括一般的类,该类中具体的实例可能使用作为说明。本文使用的该术语用于描述本发明的具体实施方案,然而其使用不限制本发明,除非在权利要求中指出。除非另外限定,本文使用的所有技术及科学术语具有本发明所属领域的技术人员所一般地理解的含义。随后的参考文献为技术人员提供了在本发明中所使用的多个术语的一般定义:Singleton等人,Dictionary of Microbiology and MolecularBiology(2d ed.1994);The Cambridge Dictionary of Science and Technology(Walker ed.,1988);The Glossary of Genetics,5TH ED.,R.Rieger等人(eds.),Springer Verlag(1991);以及Hale & Marham,The Harper Collins Dictionary ofBiology(1991)。
在本领域中不同的生物化学和分子生物学方法是公知的。例如,分离和纯化核酸的方法详细描述于WO 97/10365;WO 97/27317;LaboratoryTechniques in Biochemistry and Molecular Biology:Hybridization with NucleicAcid Probes,Part I.Theory and Nucleic Acid Preparation,(P.Tijssen,ed.)Elsevier,N.Y.(1993)的第三章;Sambrook等人,Molecular Cloning:ALaboratory Manual,Cold Spring Harbor Press,N.Y.,(1989);以及CurrentProtocols in Molecular Biology,(Ausubel,F.M等人,eds.)John Wiley & Sons,Inc.,New York(1987-1999),包括附录。
生物信息学定义
如本文所使用的,“对象”指任意目标项目或者信息(通常是文本的,包括名词、动词、形容词、副词、短语、句子、符号、数字符号等等)。因此,对象是能够构成关系的任何事物,以及能够获得、鉴定和/或从源中搜索的任何事物。“对象”包括但不限于目标实体,如基因,蛋白质,疾病,显型,机理,药物等等。在一些方面中,如下文进一步所描述地,对象可能为数据。
如本文所使用的,“关系”指在同一单元(如短语、句子、文本的两行或更多行、段落、网页的部分、页面、杂志、论文、书籍等等)中共同出现的对象。其可能为文本、符号、数字及其组合。
如本文所使用的,“元数据内容”指根据数据源中的文本组织的信息。元数据可能包括标准的元数据(如都柏林核心元数据)或者可能是标本特异的。元数据格式的实例包括但不限于,用于图书馆目录的机器可读目录(MARC)记录,源描述格式(RDF)以及可扩展标记语言(XML)。元对象可能人工产生或者通过自动化的信息提取运算法则产生。
如本文所使用的,“引擎”指实施其他程序的核心或关键功能的程序。例如引擎可以为操作系统或者应用程序中的中心程序,其调节其他程序的全部操作。术语“引擎”还可能指包括可以改变的运算法则的程序。例如可以设计知识发掘引擎,从而其确定关系的方式可能变化,从而反映确定和排序关系的新规则。
如本文所使用的,“语义分析”指表示相似概念的词之间的关系的确定,如通过去除后缀或者添加部分或者通过采用同义词词典。“统计分析”指基于计算各项目(词、词根、词干、元语法、短语等等)发生数量的技术。在不限定对象的集合中,用于不同的上下文的相同短语可能代表不同的概念。对短语共同出现的统计分析可能帮助分析语义含糊。“语法分析(Syntacticanalysis)”可以用于通过词类分析进一步地减少模糊。如本文使用的,更一般地将一种或多种该分析称作“语法分析(lexical analysis)”。“人工智能(AI)”指某些方法,通过该方法,非人的设备如计算机实施人认为值得注意的或者“智能的”任务。实例包括鉴定图片,理解口语词汇或者书写的文字,以及解决问题。
术语如“数据”、“数据集”及“信息”通常可交换地与使用,“信息”和“知识”也是如此。如本文所使用的,“数据”是最基础的单元,其为依据试验的测量或测量的集合。收集数据以构成信息,但是它基本上独立于此,且可以组合成数据集,即数据的集合。于此相对,信息得自目标,如数据(单元)可能在种族、性别、身高、体重及饮食方面收集,用于发现与心血管疾病风险有关的变量的目的。然而,相同的数据可能用于开发食谱或者产生关于饮食偏好的“信息”,所谓饮食偏好即这样的可能性,在超级市场中特定的产品具有更高的销售可能性。
如本文所使用的,术语“数据库”是原始的或者收集的数据的储存库,甚至在数据领域中能找到不同的信息方面。数据库可能包括一个或多个数据集。一般地将数据库进行组织从而能访问、管理并更新(例如,该数据库是动态的)其内容。术语“数据库”及“源”也能在本发明中交换地使用,这是由于数据和信息的原始来源是数据库。然而“源数据库”或者“源数据”一般地指数据,例如,输入到系统中用于鉴定对象及确定关系的无结构的文本和/或有结构的数据。源数据库可能是或者可能不是关系数据库。然而,系统数据库通常包括关系数据库或者某种等效类型的数据库,其储存对象之间的关系的相关数值。
如本文所使用的,“系统数据库”及“关系数据库”可替换地使用,并指数据的一个或多个集合,所述集合组织为包括数据的一套表格,其中的数据组合于预先设定的种类。例如,数据库表可能包括列(例如,属性)所设定的一个或多个种类,而数据库的行可能包括对于列所设定的种类而言独特的对象。因此,对象如基因的性质可能具有其存在、缺失、和/或该基因表达水平的列。关系数据库的一行可能也指“一个集合”,并通常地通过其各列的数值定义。关系数据库的情况中的“域”是一系列有效的数值,例如列可能包括的领域。
如本文所使用的,“知识域”指研究的领域,在该领域中系统是可操作的,例如,所有的生物医学数据。应该指出从几个域中合并数据是有益的,例如,生物医学数据及工程数据,这是由于不同的数据有时候能将对于只熟悉一个领域或者探索/研究(一个域)的平常人无法放在一起的事物进行联系。“分布的数据库”指可能在网络上不同点中分布或者复制的数据库。
如本文所使用的,“信息”指数据集合,其可能包括数字、字母、数字的集合、字母的集合或由数据的集合导致或者得到的结论。“数据”则为测量或者统计量,并且为信息的基本单元。“信息”可能还包括其他类型的数据,如词语、符号、文字,如无结构的自由的文字、编码等等。“知识”被松散地定义为信息的集合,其提供对于系统的充分的理解,从而为原因和效果进行建模。为了延伸前述的实例,对于人口特征、性别和此前的购买的信息可以用于发展用于食物销售的区域市场战略,而关于国籍的信息可能由购买者用作产品进口的指导方针。重要的是,需指出在数据、信息和知识之间没有严格的界限;这三种术语有时认为是等价的。一般地,数据来自测试,信息来自关联,而知识来自建模。
如本文所使用的,“程序”或者“计算机程序”一般地指句法单元,其符合特定的编程语言的规则并包括声明文件和陈述或者说明,可分成“代码段”,其被需要用于解决或者执行特定的功能、任务以及问题。编程语言一般地是用于表达程序的人工语言。
如本文所使用的,“系统”或者“计算机系统”一般地指一台或多台计算机,外部设备以及进行数据处理的软件。“用户”或者“系统操作者”一般地包括通过“用户设备”(如计算机,无线设备等),为了数据处理和信息交换而使用计算机网络的人。“计算机”一般地是能够进行实质上的计算的功能性单元,其包括无人为干涉下的多种算术运算和逻辑操作。
如本文所使用的,“应用软件”或者“应用程序”一般地指对于应用问题的解决特异性的软件或者程序。“应用问题”一般地是由终端用户提交,其解决需要信息处理。
如本文所使用的,“自然语言”指其规则基于现有的使用而不特别地规定的语言,如英语、西班牙语或者中文。如在此所使用的,“人工语言”指其规则在其使用前明确地建立的语言,如计算机编程语言,诸如C、C++、JAVA、BASIC、FORTRAN或者COBOL。
如本文所使用的,“统计关联性”指使用一种或者多种排序方案(O/E比率、强度等等),其中如果比随机几率预期其发生显著地更加频繁,则确定关系是统计相关的。
如本文所使用的,术语“共同调控的基因”或者“转录模块”可交换地使用,指特定基因的成组的基因表达谱(如与特定的基因序列相关的信号数值)。各个转录模块在两部分关键的数据之间建立联系,即文献检索部分和得自基因微阵列的实际试验的基因表达数值数据。选入转录模块的基因集合基于对基因表达数据的分析(前述的模块选取运算法则)。示教了此外的步骤的有Chaussabel,D.& Sher,A.Mining microarray expression data by literatureprofiling.Genome Biol 3,RESEARCH0055(2002),(http://genomebiology.com/2002/3/10/research/0055)(相关的部分在此结合作为参考)以及得自感兴趣的疾病或者症状的表达数据,所述疾病或者症状如系统性红斑狼疮、关节炎,淋巴瘤,癌,黑色素瘤,急性感染,自身免疫性疾病,自身炎症性疾病等。
下表中列出了用于得到文献检索部分或者对转录模块有贡献的关键词的实例。技术人员应意识到在其他情况下能容易地选择其他术语,如具体的癌症、具体的感染性疾病、移植等等。例如,与T细胞活化有关的那些基因的基因和信号以“M 2.8”的模块ID描述于下文,其中特定的关键词(如淋巴瘤、T-细胞、CD4、CD8、TCR、胸腺、淋巴、IL2)用于确定关键的T-细胞相关的基因,如T-细胞表面标记物(CD5、CD6、CD7、CD26、CD28、CD96);由淋巴谱系细胞表达的分子(淋巴毒素β、IL2诱导的T细胞激酶、TCF7;以及T细胞分化蛋白mal、GATA3、STAT5B)。随后,整个模块通过将来自患者群体的这些基因的数据建立联系(不管平台、存在/缺失和/或上调或者下调)从而产生转录模块。在一些情况下,基因表达谱并不匹配(在此时)这些疾病症状的任何具体的基因簇和数据,然而在“未确定的”模块中发现了特定的生理通路(例如cAMP信号转导、锌指蛋白、细胞表面标记物等等)。实际上,基因表达数据集合可能用于在与关键词检索匹配之前,提取具有协调的表达的基因,也即任意数据集合可能在与第二个数据集合交叉引用之前相互关联。
表1.转录模块
生物学定义
如本文所使用的,术语“阵列”指固体的支持物或者基质,其具有连接于支持物的一种或多种肽或者核酸探针。阵列一般地具有偶联于基质表面不同已知位置的一种或多种不同的核酸或者肽探针。这些阵列,也称作“微阵列”或者“基因芯片”,其可能具有基于已知的基因组(如人类基因组)的10,000;20000;30,000或者40,000个不同的可鉴定的基因。这些阵列用于检测在样品中表达或者发现的基因的整个“转录组”或者转录池,例如,表达为RNA、mRNA等的核酸,其可能进行RT和/或RT-PCR,从而产生DNA复制子的互补集合。可以使用机械合成方法、光诱导合成方法等加入非光刻的和/或光刻的方法与固相合成方法组合的方法,来制备阵列。
描述了合成这些核酸阵列的不同技术,如在事实上任意形状的表面或者甚至多个表面上制造。阵列可以是在珠、凝胶、聚合物表面、纤维如光学纤维、玻璃或者其他合适的任意基质上的肽或核酸。阵列可以以这样的方式组装,从而可以进行诊断或者全部所包括设备的其他操作,参见例如第6,955,788号美国专利,其相关的部分在此结合作为参考。
如本文所使用的,术语“疾病”指生物体具有细胞的任何异常生物状态的生理状态。疾病包括但不限于,细胞、组织、身体功能、系统或者器官的中断、停止或者失调,其可能是内在的、遗传的、感染导致的、异常细胞功能、异常细胞分裂等等所导致的。导致“疾病状态”的疾病一般地对于生物系统也即疾病的宿主是有害的。关于本发明,任何的生物状态,如感染(如病毒、细菌、真菌、寄生虫等等)、炎症、自发炎症、自身免疫、过敏反应、过敏症、癌前病变、恶性肿瘤、外科手术、移植、生理上的等等与疾病或者障碍相关的认为是疾病状态。病理状态通常与疾病状态等价。
疾病状态也可能归类为不同级别的疾病状态。如本文所使用的,疾病或者疾病状态的级别是主观的量度,其反映疾病或者疾病状态的进展,以及在治疗前、中和后的生理反应。一般地,疾病或者疾病状态沿着级别或者阶段进行发展,其中疾病的影响变得越来越严重。疾病状态的级别可能由样品中细胞的生理状态所影响。
如本文所使用的,术语“疗法”或者“治疗方案”指采取的缓和或者改变疾病状态的医学步骤,如使用药理学上的、外科的、饮食的和/或其他技术旨在减少或者消除疾病影响或症状的治疗过程。治疗方案可以包括一种或多种药物的给药或者外科手术的处方剂量。疗法在大多数情况下是有益的并降低疾病状态,但是在多种实例中疗法的效果具有不期待作用或者副作用。疗法的效果也受到宿主的生理状态的影响,所述生理状态如年龄、性别、遗传、体重、其他疾病的症状等。
如本文所使用的,术语“药理学状态(pharmacological state)”或者“药理学状态(pharmacological status)”指这些样品,即,其将和/或已经使用一种或多种药物、外科手术等治疗,该药物、外科手术等可能影响样品中的一种或多种核酸的药理学状态,如作为药物干涉结果的新转录、稳定化和/或去稳定化的。样品的药理学状态涉及在药物治疗之前、之中和/或之后生物状态的变化,并如本文示教地可以用作诊断或者预测功能。在药物治疗或者外科手术之后的一些变化可能与疾病状态相关和/或可能与疗法的副作用无关。在药理学状态上的变化可能是下述的结果:疗法的持续时间、所处方的药物的类型和剂量、对给定治疗过程的顺从性和/或摄取的未处方的药物。
如本文所使用的,术语“生物学状态”指为分析表达状态而分离和纯化的细胞样品的转录组(其为RNA转录物的全部集合)的状态。生物学状态通过测量细胞组分的充足性和/或活性、根据形态学表型的表征或者用于检测转录物的所述方法的组合,反映了样品中细胞的生理状态。
如本文所使用的,术语“表达谱”指RNA的相对丰度、DNA或者蛋白质丰度或者活性水平。表达谱可以为例如转录状态或者翻译状态的量度,其通过多种方法并使用基因芯片、基因阵列、珠、多重PCR、定量PCR、连缀分析(run-on assay)、RNA印迹分析、蛋白质印迹分析、蛋白质表达、荧光活化的细胞分选(FACS)、酶联免疫吸附试验(ELISA)、化学荧光研究、酶分析、增殖研究或者任意其他方法、设备和系统的多种的任一种进行,用于确定和/或分析基因表达,上述所使用的可容易地商业获得。
如本文所使用的,术语样品的“转录状态”包括存在于样品中的RNA种类、尤其是mRNA的性质和相对丰度。样品的整个转录状态,也即RNA的性质和丰度的组合也在此称为转录组。一般地说,测量了样品中RNA种类的整个集合的全部相对组成部分的一大部分。
如本文所使用的,术语“模块转录载体”指反映“不同表达的基因的比例”的转录表达数据。例如,对于各个模块而言,在至少两个组之间(如健康的受试者与患者)不同地表达的转录物的比例。该载体得自两个组的样品的比较。第一分析步骤用于在各个模块中选择疾病特异性的转录集合。随后,为“表达水平”。给定疾病的组比较提供了对于各个模块不同地表达的转录物的列表。发现了不同的疾病导致不同的模块转录物的集合。随后可能以此表达水平,通过将鉴别为不同表达的疾病特异性的基因的亚集合的表达数值取平均,来计算用于单个样品的各个模块(或者多个模块)的载体。该方法使得能够产生单个样品的模块表达载体图谱,所述载体例如,本文公开的模块图谱中所描述的那些。这些载体模块图谱代表了各个模块的平均表达水平(而不是一部分不同地表达的基因),可以获得各个样品的所述图谱。
使用本发明,不仅能够从模块水平上,还能在基因水平上确定并区分疾病;也即,两种疾病可能具有相同的载体(相同比例的不同地表达的转录物,相同的“极性”),然而载体的基因组成可能仍然是疾病特异性的。基因水平表达提供了明显的益处,即分析的分辨率大大提高。进一步地,本发明利用组合的转录标记物。如本文使用的,术语“组合的转录标记物”指与使用单个基因作为标记物相比,多个基因(模块的亚集合)的表达数值平均值(以及这些标记物的组成可能是疾病特异性的)。组合的转录标记物方法是唯一的,这是由于用户能够开发多变量的微阵列积分,以使用如SLE来评估患者的疾病严重性,或者得到本文公开的表达载体。最重要的是,已经发现了使用本发明的组合模块转录标记物,在此得到的结果在微阵列平台之间是可复制的,从而为注册审批提供了更大的可靠性。
用于本发明的基因表达监控系统可能包括具有有限的和/或基础数目的基因的定制的基因阵列,所述基因是特定的和/或是为了一种或多种目标疾病定制的。不像一般的习惯上使用的泛基因组阵列,本发明不仅提供了这些一般的阵列在回顾基因和基因组分析中的应用(不需要使用特定平台),更重要地,其提供了定制的阵列的开发,所述定制的阵列为分析提供了可选的基因集合,而不需要几千个其他不相关的基因。本发明的经优化的阵列和模块相对于现有的技术的一个明显的优点是财务成本的降低(例如每次分析的成本、材料、设备、时间、人工、培训等),更重要地,也降低了生产泛阵列的环境成本(在数据的绝大部分是不相干的情况下)。本发明的模块首次使得简单、定制的阵列的设计成为可能,该阵列使用最少数量的探针提供优化的数据,并使信噪比最大。通过减少用于分析的基因的总数,可能,例如减少制备几千个昂贵的铂掩蔽物的需要,所述铂掩蔽物用于泛基因芯片的制备中的光刻中,所述泛基因芯片产生大量不相关的数据。使用本发明,如果将本发明的有限的探针集合(或者多个集合)和用于测定和/或分析基因表达的下述方法或任意其他方法、设备和系统(可容易地商业获得的)一起使用,可能完全避免对微阵列的需要:例如,数码光学化学阵列、球珠阵列、珠(如Luminex)、多重PCR、定量PCR、连续分析、RNA印迹分析、甚至用于蛋白质分析如蛋白质印迹分析、2D和3D凝胶蛋白质表达、MALDI、MALDI-TOF、荧光活化细胞分选(FACS)(细胞表面或者细胞内)、酶联免疫吸附分析(ELISA)、化学荧光研究、酶分析、增值研究。
本发明的“分子指纹系统”可用于,在不同细胞或组织中、相同的细胞或者组织的不同的亚群体中、相同细胞或组织的不同生理状态、相同的细胞或组织的不同发育阶段,或者相同组织的不同细胞群体中,针对其他的疾病和/或正常的细胞对照,便于及进行表达的比较分析。在一些情况下,正常的或者野生型的表达数据可能来自在同样时间或者在同样时间附近分析的样品,或者其可能是得自或者选自现有的基因阵列表达数据库的表达数据,该数据库例如公共的数据库,如NCBI Gene Expression Omnibus数据库。
如本文所使用的,术语“有差别地表达的”指在两个或者更多的样品(如疾病样品和正常样品)之间中变化的细胞成分(如核酸、蛋白质、酶的活性等等)的测量值。细胞成分可能是启动或者关闭的(存在或者不存在),与对照相比上调的或者与对照相比下调的。对于使用基因芯片或者基因阵列的应用,核酸(如mRNA或者其他RNA(miRNA、siRNA、hnRNA、rRNA、tRNA等))的有差别的基因表达可能用于区分细胞类型或者核酸。最一般地,细胞的转录状态的测量通过定量的逆转录酶(RT)和/或定量的逆转录酶-聚合酶链式反应(RT-PCR)、基因组表达分析、翻译后分析、对基因组DNA的修饰、易位、原位杂交等来完成的。
对于一些疾病状态,可以鉴定细胞的或者形态上的差别,尤其地在疾病状态的早期水平。本发明避免了以下需要:通过考察细胞自身的基因模块或者更重要地通过考察来自免疫效应细胞的基因的细胞RNA表达来鉴定特异突变或者一个或多个基因,所述免疫效应细胞在其常规生理状态下作用,也即在免疫活化、免疫耐受或者甚至免疫无力过程中作用。尽管遗传突变可能导致一组基因的表达水平的显著变化,生物系统通常通过改变其他基因的表达来补偿变化。这些内在的补偿响应的结果是,许多扰动可能对于系统的可观察的表型具有很小的效果,然而对细胞组分的组成具有深远的影响。类似地,基因转录物的实际拷贝数可能不增加或者减少,然而,所述转录物的持久性或者半衰期可能受影响,这导致蛋白质产量的大幅度增长。本发明通过,在一个实施例中,观察效应细胞(如白细胞、淋巴细胞和/或其亚群体)而不是单个的信号和/或突变,消除了检测实际信号的需要。
技术人员容易地认识到样品可能得自多种来源,包括如单个的细胞,细胞的集合,组织,细胞培养物等等。在特定的情况下,甚至可能从细胞中分离足够的RNA,所述细胞见于例如尿液、血液、唾液、组织或者活检样品等等。在特定的情况下,可能从粘膜分泌物、粪便、眼泪、血浆、腹水、间质液、硬膜内的、脑脊液、汗或其他体液中得到足够的细胞和/或RNA。核酸的来源,如来自组织或者细胞来源的,可能包括组织活检样品,一种或多种分选的细胞群,细胞培养物、细胞克隆、转化的细胞、活检样品或者单个的细胞。所述组织的来源可能包括如大脑、肝脏、心脏、肾脏、肺、脾脏、视网膜、骨骼、神经的(neural)、淋巴节、内分泌腺、生殖器官、血液、神经(nerve)、血管组织以及嗅上皮。
本发明包括以下的基本组分,其可能单独使用或组合地使用,即,一个或多个数据挖掘算法;一个或多个模块水平的分析过程;对血液白细胞转录模块的表征;汇总的模块数据在人类疾病的分子诊断/预测的多变量分析中的应用;和/或模块水平的数据和结果的可视化。使用本发明,也可能开发及分析组合的转录标记物,所述标记物可能进一步地汇总于单个的多变量计分中。
数据采集速率的爆炸刺激了用于开发微阵列数据和生物医学知识的挖掘工具和算法的发展。旨在揭开转录系统的模块组织及功能的方法包括了用于鉴定疾病的强大的分子标签的有希望的方法。实际上,该分析通过将微阵列数据概念化到超过个体基因或者系列基因的层面上,能够转变对于大规模转录研究的理解。
本发明人认识到当前基于微阵列的研究正面临着显著的挑战,对数据的分析众所周知地“有噪音”,也即难以解释数据,并且难以在实验室及平台之间良好比较。对于微阵列数据的分析,广泛接受的方式以鉴定在研究组之间有差别地表达的基因的亚集合开始。接下来,用户随后尝试使用模式识别算法及现有的科技知识来“搞清楚”所得到的基因系列。
本发明人开发了在分析的早期强调生物上相关基因的选择的策略,而非处理平台之间的巨大可变性。简单地说,所述方法包括了表征给定生物系统的转录组分的鉴定,,为此开发了改进的数据挖掘算法,从而从大的数据集合中分析及提取共同表达的基因的组或者转录模块。
肺结核(PTB)是结核分枝杆菌(M.tuberculosis)引起的全球范围内发病率和死亡率主要的和增长的原因。然而,多数M.tuberculosis感染的个体保持为无症状的,将感染保持为潜伏性的形式,并且认为该潜伏性状态通过主动免疫响应维持。血液是免疫系统的管线,并因此是理想的生物材料,从血液能够建立个体的健康和免疫状态。因此,使用微阵列技术来评估血液细胞中的整个基因组的活性,我们在具有活性的肺结核和潜伏性的肺结核的患者中鉴定了不同的和相互的血液转录生物标记物标签。这些标签也不同于在对照个体中的那些。潜伏性的结核的信号,其在全血中显示出免疫细胞毒性基因表达的过表现,可能对于确定抗M.tuberculosis感染的保护性免疫因子有帮助,这是由于这些患者受到感染然而大多数不发展为明显的疾病。这种来自活性的和潜伏性的TB患者的不同的转录生物标记物标签也可用于诊断感染,并用于监测对使用抗分枝杆菌药物治疗的响应。除此之外,在活性的结核病患者中的标签能帮助确定涉及于免疫发病机理中的因子,并可能带来用于免疫治疗干预的策略。本发明涉及在先的申请,其要求了血液转录生物标记物在感染诊断中的用途的权利。然而,此在先申请未公开活性的和潜伏性的结核的生物标记物的存在,而是重点在于具有其他急性感染的儿童(Ramillo,Blood,2007)。
在此对来自潜伏性的和活性的TB患者的血液中转录标签的鉴定可以用于测试怀疑具有结核分枝杆菌感染的患者,以及用于该疾病的健康筛查/早期检测。本发明还使评估对使用抗分枝杆菌药物治疗的响应成为可能。在这一背景下,在药物测试中,尤其在评估多抗药性患者的药物治疗中,试验也可能是特别有价值的。进一步地,本发明可能用于从潜伏性的结核病的免疫标签获得即时的、间隔的及长期的数据,从而更好地在接种试验中界定保护性的免疫响应。同时,在活性的结核患者中的标签能帮助确定涉及于免疫致病性的因子,并很可能带来用于免疫治疗干预的策略。
血液代表了固有的和适应性的免疫系统的细胞的储存库和迁移区域,该细胞包括中性粒细胞、树突细胞和单核细胞或者B和T淋巴细胞,分别地在感染过程中暴露于组织中的感染性因素。因为如此,来自感染个体的全血提供了临床上相关材料的可得来源,其中使用前面所描述的用于组织内癌症(Alizadeh AA.,2000;Golub,TR.,1999;Bittner,2000)和自免疫性(Bennet,2003;Baechler,EC,2003;Burczynski,ME,2005;Chaussabel,D.,2005;Cobb,JP.,2005;Kaizer,EC.,2007;Allantaz,2005;Allantaz,2007)以及炎症(Thach,DC.,2005)和血液或组织中(Bleharski,JR et al.,2003)的感染性疾病(Ramillo,Blood,2007)研究的基因表达微阵列,可以得到无偏见的分子表型。血液白细胞中基因表达的微阵列分析鉴定了诊断的和预测的基因表达标签,这对于疾病发作及对于治疗的响应的机理带来了更好的理解(Bennet,L 2003;Rubins,KH.,2004;Baechler,EC,2003;Pascual,V.,2005;Allantaz,F.,2007;Allantaz,F.,2007)。这些微阵列方法已经尝试了用于研究活性的和潜伏性的TB,然而到现在为止只得到了少量的有差别地表达的基因(Jacobsen,M.,Kaufmann,SH.,2006;Mistry,R,Lukey,PT,2007)并且在相对少数的患者中(Mistry,R.,2007),其可能不足以区分其他的炎症及感染性疾病。
为了界定TB的免疫标签,分析了活性的和潜伏性的TB患者及对照的血液;使用非常严格的临床标准选择患者。患者招募自英国伦敦,在那里活性的TB案例数量处于增长中,最重要的是,混淆同时感染的风险是很小的,从而得到能够区分潜伏性性的和活性TB的强大的标签。使用微阵列来分析整个基因组,随后的数据挖掘显示了所发现的大量基因在统计显著的水平上,在所有组的患者(包括活性的及潜伏性的患者以及健康的对照)中有差别地表达。随后,使用了基于模块数据挖掘策略的新方法,该方法为选择临床上相关的转录生物标记物提供了基础,所述生物标记物用于SLE及其他疾病中血液微阵列转录谱的分析,并改变了我们关于疾病发病的认识(Chaussabel,2008,Immunity)。在本研究中所定义的模块图谱提供将复杂的数据组织起来并减少其维度的方式,而仍然保持了人类血液中表达的大量基因,从而可以观察特定疾病指纹(Chaussabel,2008,Immunity)。使用此模块方法,得到了定义清晰的模块转录标签,所述转录标签在活性的和潜伏性的TB患者的全血中是不同的和相互的,并且还不同于健康的对照。本文描述的生物标记物改进了PTB的诊断,并进一步帮助定义在潜伏性的TB患者中抗M.tuberculosis的保护中重要的宿主因子,以及在活性TB的免疫致病中涉及的那些主因子,并从而用于减少及控制TB疾病。
患者、材料及方法
参与者募集及患者描述:参与者募集自伦敦的St.Mary’s Hospital TBClinic,Imperial College Healthcare NHS Trust,并从伦敦的Mill Hill的国立医学研究所(NIMR)的志愿者中募集健康的对照。本研究经当地位于St MarysHospital(LREC),London,UK的NHS Research Ethics Committee核准。所有的参与者(18岁及以上)给出了书面的知情同意书。在所募集的参与者确定其临时的研究分组前,满足了严格的临床标准,此后才使其分配到最终分析组中。患者及对照的群组如下:(i)根据临床诊断并随后由结核菌培养的实验室分离M.tuberculosis确认活性的PTB;(ii)潜伏性的TB-由阳性的结核菌素皮肤试验确定(TST,使用2TU结核菌素(Serum Statens Institute,Copenhagen,Denmark),如果未接种BCG,≥6mm;如果接种了BCG,≥15mm,同时具有使用干扰素γ释放分析的阳性结果(IGRA,具体为Quantiferon-TBGold In-tube assay,Cellestis,Australia))。该IGRA分析通过从全血的IFN-γ释放测量对抗原的反应性(ESAT-6/CFP-10/TB 7.7-存在于M.tuberculosis,然而不存在于多数的环境结核杆菌中或者M.bovis BCG疫苗中)。
潜伏性的TB患者还必须具有暴露于感染性的TB病例的迹象,通过亲密的居家或工作接触,或者作为病区的“新参加者”;具有偶然发现TST阳性而没有暴露于感染的人的迹象的患者不选入本研究。(iii)健康的志愿者对照(BCG接种的和未接种的,按照TST分别≤14mm或者≤5mm;以及按照IGRA阴性的)。怀孕、已知免疫抑制、进行免疫抑制疗法或者有糖尿病或者自身免疫疾病的患者也无选入资格并从开始的研究中排除。HIV阳性的个体(伦敦的TB患者仅有1%具有此前未诊断的HIV)从研究中排除。在给予任何抗分枝杆菌药物之前,并随后在设定的时间间隔为了本研究收集来自活性的及潜伏性的PTB患者的血液,作为随后的研究的纵向部分。
对每位参与者,收集预期的详细的临床信息,并将其输入到本发明人开发的可经网络访问的数据库中。使用该记录的临床数据,以及前文所述的基于免疫的分析,将58名参与者中的15人从本研究中排除,这是由于其不满足本研究的标准准则。这产生了下述群体:6名未接种BCG的健康志愿者;6名接种BCG的健康志愿者,17名潜伏性的TB患者及14名活性的PTB患者,将所有的这些样品用于RNA分离。在处理进行之后,来自活性TB患者的一个样品未产生足够的除去球蛋白的RNA,故将其从最终的分析中排除。
用于微阵列的RNA采样,提取,处理:将来自上述患者群体的全血采集到Tempus试管(Applied Biosystems,Foster City,CA,USA)中,并于RNA提取之前储存于-20℃到-80℃下。使用PerfectPure RNA血液试剂盒(5PRIME Inc,Gaithersburg,MD,USA)提取总RNA。将样品用100%冷乙醇匀浆,涡旋震荡,随后在4000g下在0℃下离心60分钟,去除上清。将300μl裂解溶液加入沉淀中并进行涡旋震荡。随后根据生产商的说明进行RNA结合,Dnase处理,洗涤及RNA洗脱步骤。经分离的总RNA使用GLOBINclearTM96-孔格式化试剂盒(Ambion,Austin,TX,USA)根据生产商的说明除去球蛋白。总的及除去球蛋白的RNA完整性使用Agilent 2100 Bioanalyzer(Agilent,Palo Alto,CA)进行评估。在处理进行后,来自活性的TB患者的一个样品未得到足量的除去球蛋白的RNA,并因此从最终的分析中排除。随后从所述除去球蛋白的RNA使用Illumina CustomPrep RNA扩增试剂盒(Ambion,Austin,TX,USA)制备生物素化的扩增的RNA靶(cRNA)。按照生产商的规程,将标记的cDNA在Sentrix Human-6 V2 BeadChip阵列(>48,000个探针,Illumina Inc,San Diego,CA,USA)上杂交过夜,洗涤,封闭,染色并在Illumina BeadStation 500上扫描。使用Illumina’s BeadStudio的第2版软件来从扫描中产生信号强度数值,扣除背景,并将各个微阵列与所有样品(每个芯片的校正)的中间平均强度进行比较。该经校正的数据用于所有随后的数据分析。
微阵列数据分析:使用基因表达分析软件程序,Genespring 7.1.3版(Agilent)来进行样品的统计分析及分级聚类。按照在结果和图示部分所述地,将有差别地表达的基因选出并聚类。
结果和讨论
血液标签将活性的和潜伏性的TB患者彼此分开,并从健康的对照个体区分开:为了确定来自活性的和潜伏性的TB患者的血液样品是否携带使活性的和潜伏性的TB与健康对照相比能够区分的基因表达标签,进行了分步的分析。在滤除了偏离中位数小于2倍(即,具有平坦的图谱)的未检测的转录物及基因之后,通过得自全血RNA样品(来自活性的及潜伏性的TB及健康的对照)的表达谱的皮尔逊相关系数对6269个基因进行无人监管的聚类分析(图1)。所述无人监管的分析确定了不同的标签,该标签发现对应于不同的临床表型:在具有活性肺部TB的患者(活性的PTB)中;以及在具有潜伏性的结核病的个体(潜伏性的TB)中。样品的分组不是完美的(13名具有活性的患者的10名,以及17名具有潜伏性TB的患者的11名)。然而,在来自患者的训练集合的该组中的大部分活性的PTB及潜伏性的TB患者显示出具有清楚及不同的转录标签。重要的是,这些标签显示出表现在本研究所选择的大量种族中,包括白人,非洲黑人,亚洲印第安人,亚洲孟加拉人,亚洲其他人种,爱尔兰白人,混血白人,加勒比海黑人(这些数据的细节未显示。)
将6269个基因的列表进一步使用非参数的统计组比较(Kruskal-Wallis试验)进行分析,从而鉴定在组之间有差别地表达的基因。使用适度严格的多点比较校正法来控制I型误差(Benjamini-Hochberg校正),在活性的TB和潜伏性的TB以及健康的对照之间有1473个基因有差别地表达/表现(P<0.01)(图2;以及随同此文件递交的长表格中列举的1473个基因)。这些聚类的基因随后与文献中的相关发现进行联系。对于本体论术语“免疫响应”,这些基因的过滤产生了一列158个这类基因(图3A-D;表2)。158个基因的表达/表现谱(图3A-3D)使活性的TB患者从潜伏性的TB患者及从健康的对照个体能区分出来。
表2.标注了基因本体论术语的生物过程的158个基因的列表:免疫响应,及发现在活性的TB及其他的临床组之间有差别地表达的(p<0.01)
在活性的TB中过表达/表现的基因:感兴趣的是大量IFN-相关的/可诱导的基因被表达:例如干扰素(IFN)-可诱导的基因,如SOCS1、STAT1、PML(TRIM19)、TRIM22、多种鸟苷酸结合蛋白以及多种其他的表2中所标出的IFN-可诱导的基因,然而有趣的是,这些在潜伏性的TB患者中是不明显的,尽管这些患者在全血中的IFN-γ转录物的表现/表达实际上比活性的TB患者更高。为了关注这一点,特定家族的基因(部分基因已知由IFN上调,而其他的则不)进行进一步的研究,包括TRIM家族。
TRIMS的亚集合在活性的TB中过表达/表现:蛋白质的三结构域蛋白(TRIM)家族特征在于慎重的结构(Reymond,A.,EMBO J.,2001)并已经显示出具有多种功能,包括E3泛素连接酶活性,诱导细胞增殖、分化和凋亡,免疫细胞信号转导(Meroni,G.,Bioessays,2005)。它们的参与牵涉到蛋白质-蛋白质相互作用,自身免疫以及发育(Meroni,G.,Bioessays,2005)。进一步地,许多TRIM蛋白据发现具有抗病毒活性,并可能地牵涉到先天免疫(Nisole,F,2005,Nat.Rev.Microbiol.;Gack,MU.,2007,Nature)。有趣的是,30种TRIM转录物(一些重叠的探针)显示在活性的TB中表达,一些也在潜伏性的TB及健康的对照血液中表达(图4;表3)。这些TRIM中的大多数此前显示在人类巨噬细胞和小鼠巨噬细胞及树突细胞中表达(Rajsbaum,2008,EJI;Martinez,FO.,J.Imm.,2006),并由IFN所调控,然而显示出在DC或者在T细胞中必要地表达的TRIM(Rajsbaum,2008,EJI)未被检测到,或者未发现相对于健康的对照血液,在活性的或者潜伏性的TB中有差别地表达。有趣的是,发现了TRIM 5、6、19(PML)、21、22、25、68过表现/表达;尽管其他的低表现/表达:TRIM 28、32、51、52、68。感兴趣的是一组TRIM在活性的TB中高度表达,然而在潜伏性的TB及健康的对照中低到无法检测,并且它们中的四个(TRIM 5、6、21、22)已经显示集中在人类染色体11上,并据报道具有抗病毒的活性(Song,B.,2005,J.Virol;Li,X,Virology,2007)。然而发现了相对于潜伏性的TB及健康的对照,一组TRIM在活性的TB患者的血液中低表达,其包括TRIM 28、32、51、52、68以及根据报道这些或者不在得自人类血液的巨噬细胞中表达(TRIM 51),或者仅仅在未分化的单核细胞(TRIM-28、52)或者未活化的巨噬细胞或者交替活化的巨噬细胞(TRIM-32)中表达,或者在来自人类血液的经分化的活化巨噬细胞中仅仅上调到低的水平(TRIM-68)(Martinez,FO.,J.Imm.,2006)。
表3.在活性的肺结核、潜伏性的结核和健康的对照中有差别地表达的TRIM基因
在活性的TB患者中特定的免疫调节配体的选择性过表达/表现:对不同的转录谱的分析显示来自基因CD274(PDL1)和PCDLG2(PDL2,CD273)的转录物仅仅在活性的TB患者中表达(图5A及B)。这些分子已经此前显示出牵涉到对急性和慢性的病毒感染的免疫响应的调控中(A Sharpe,Ann.Rev.Imm.)。在T细胞和APC相互作用中,这些分子作为对于分子PD1的抑制性共刺激受体起作用,并且该通路的阻碍显示出恢复了在HIV,乙肝和丙肝感染中抗原特异的T细胞的增殖和效应功能。
在活性的TB中低表达/表现的基因:引人注目的是,已知在T细胞中表达的多种基因(一些也在NK及B细胞上表达)发现在活性的TB患者的血液中极度下调/低表现(图3D),(然而不在潜伏性的TB或者健康的对照中,其包括CD3,CTLA-4,CD28,ZAP-70(T,NK和B细胞),IL-7R,CD2(也在B细胞上),SLAM(也在NK细胞上),CCR7,GATA-3(也在NK细胞中)。这可能意味着在T,NK和B细胞中,在活性的PTB期间基因表达下调,或者细胞已经由于M.tuberculosis的感染在别处(如肺)重新募集。现在对来自不同患者组的血液采用流式细胞分析进行研究,同时也通过对来自不同患者组的T细胞的经纯化的群落的转录分析。
相对于健康的对照,在潜伏性的和活性的患者中对转录谱的更加严格的统计分析。此前通过鉴定在各组之间有差别地表达的基因,利用非参数的Kruskal-Wallis试验进一步进行了统计组比较,然而现在为了控制I型误差,使用最严格的多重比较校正(Bonferroni校正)。在这种增加的严格性之下,有46个基因(P<0.1)和18个基因(P<0.05)被鉴定为在各组之间有差别地表达(图6和7;表4和5)。在所述46个基因中,在活性的TB患者的血液中大量的IFN可诱导的基因如STAT-1、GBP和IRF-1仍然观察到是过表达/表现的,并且在潜伏性的患者或健康对照中为下调或不改变。在活性的TB患者的血液中,也发现大量的这些基因为过表达/表现的,甚至在严格性最高的分析中仍然提取出基因(Bonferroni校正,<0.05)。在活性的TB中观察到46个基因的组中,仅有3个转录物下调/低表现,其包括IL-7R(在T细胞中表达),趋化因子受体CXCR3(在更高的统计严格性下丢失)和αII-血影蛋白。对CXCR3的低表达/表现感兴趣,这是由于已表明该趋化因子受体在Th1细胞中高度地表达,所述Th1细胞在抗分枝杆菌感染的保护中是需要的,这可能反映它们抑制或者迁移出血液到达受感染的组织。表5包括18个基因,其中在活性的PTB中IL7R和SPTAN1低表现/表达,其他所有的过表现/表达并且对于活性的疾病是诊断性的。
表4在活性的·TB和其他的临床组之间有差别地表达的基因。
表5.在活性的TB和其他的临床组之间显著不同地表达的18个基因。
在具有活性的和潜伏性的TB的患者和健康的对照之间改进的识别:前述的方法尽管能够从潜伏性的TB和健康的对照中识别活性的TB,但是较不能在全部三个临床组之间识别。为了选择识别基因,使用了随后的方法。首先,在来自健康的个体的血液中表达的基因与潜伏性的TB患者进行比较,其在p<0.005下使用Wilcoxon-Mann-Whitney试验,得到了89个有识别力的基因。随后在p<0.5下再次使用Wilcoxon-Mann-Whitney试验以及最严格的Bonferroni相关系数将来自健康的个体的血液中表达的基因与活性的TB患者进行比较,得到了一组30个有识别力的基因。该列表合并得到总计119个的识别基因(表6)。随后使用通过皮尔逊相关系数进行的无人监督的聚类分析,将该列基因用于审查全部临床组的数据集。该分析产生三个不同的临床组聚类(图8A到8F):一个聚类由13名活性的TB患者中的11名组成(图8,聚类C);第二个聚类由17名潜伏性的TB患者中的16名和1名活性的TB患者组成(图8,聚类B);第三个聚类含包括于本研究中的全部12名健康对照,外加1名活性的TB以及1名潜伏性的TB落单者(图8,聚类A)。对于图8A到8F中的各个,患者/临床组的聚落水平地表示,基因的聚落竖直地表示。全部119个基因的表达/表现谱的形式(图8A)现在使得所有三个临床组能从彼此识别出来:也即,使得活性TB,潜伏性的TB和健康的个体彼此识别,各个临床组显示这些119个基因或者其亚组的独特的表达/表现谱。技术人员应该认识到可以将1、2、3、4、5、6、7、8、10、12、15、20、25、30、35或者更多的基因置于代表基因聚类的数据集中,所述基因可以单独地或者与其他的聚类共同在临床组A(健康的),B(潜伏性的),C(活性的)的聚落之间比较,各个临床组可以显示得自这些119个基因的独特的表达/表现谱。
具体地,图8B证明了基因ST3GAL6、PAD14、TNFRSF12A、VAMP3、BR13、RGS19、PILRA、NCF1、LOC652616、PLAUR(CD87)、SIGLEC5、B3GALT7、IBRDC3(NKLAM)、ALOX5AP(FLAP)、MMP9、ANPEP(APN)、NALP12、CSF2RA、IL6R(CD126)、RASGRP4、TNFSF14(CD258)、NCF4、HK2、ARID3A、PGLYRP1(PGRP)在潜伏性的TB患者的血液中低表达/低表现,而在健康的个体或者活性的TB患者的血液中不如此。
表现于图8C中的基因ABCG1、SREBF1、RBP7(CRBP4)、C22orf5、FAM101B、S100P、LOC649377、UBTD1、PSTPIP-1、RENBP、PGM2、SULF2、FAM7A1、HOM-TES-103、NDUFAF1、CES1、CYP27A1、FLJ33641、GPR177、MID1IP1(MIG-12)、PSD4、SF3A1、NOV(CCN3)、SGK(SGK1)、CDK5R1、LOC642035显示出在健康对照个体的血液中过表达/过表现,而在潜伏性的TB患者的血液中低表达/低表现,并在很大程度上在活性的TB患者的血液中低表达/低表现。
在图8D中,ARSG、LOC284757、MDM4、CRNKL1、IL8、LOC389541、CD300LB、NIN、PHKG2、HIP1的基因谱在健康个体的血液中显示为过表达/过表现,然而在潜伏性的及活性的TB患者的血液中低表达/低表现。相反地,在图8D中的基因PSMB8(LMP7)、APOL6、GBP2、GBP5、GBP4、ATF3、GCH1、VAMP5、WARS、LIMK1、NPC2、IL-15、LMTK2、STX11(FHL4)在活性TB的血液中显示为过表达/过表现,然而在潜伏性的TB患者以及健康的对照个体中低表达/低表现。
在图8E中,FLJ11259(DRAM)、JAK2、GSDMDC1(DF5L)(FKSG10)、SIPAIL1、[2680400](KIAA1632)、ACTA2(ACTSA)、KCNMB1(SLO-B)的基因谱全部在来自活性的TB患者的血液中过表达/过表现,然而在来自潜伏性的TB患者和健康的对照个体的血液中未表现或者甚至低表达/低表现。与此相反地,基因SPTANI、KIAAD179(Nnp1)(RRP1)、FAM84B(NSE2)、SELM、IL27RA、MRPS34、[6940246](IL23A)、PRKCA(PKCA)、CCDC41、CD52(CDW52)、[3890241](ZN404)、MCCC1(MCCA/B)、SOX8、SYNJ2、FLJ21127、FHIT在活性的TB患者中的血液中低表达/低表现,然而在潜伏性的TB患者或者健康的对照个体中不如此,在此它们过表达/过表现。
列于图8D和8E中的多个(在按照前述的本方法选择的119个基因内)在活性的TB患者的血液中发现过表达/过表现的这些基因对于在活性的、潜伏性的TB患者以及健康的对照中,通过前文描述的使用转录谱的更强严格性分析的可选方法所鉴定的那些而言是常见的(在图8D和图8E中表示为下划线的基因包括于图7、表5的基因列表中,18个基因,p<0.05;图8D及8E中表示为斜体的基因包括于图6,表4的基因列表中,46个基因,P<0.1)。
在图8F中显示CD52(CDW52)、[3890241](ZNF404)、MCCC1(MCCA/B)、SOX8、SYNJ2、FLJ21127、FHIT的基因谱在活性的TB患者的血液中低表达/低表现,然而在潜伏性的TB患者或者健康的对照个体的血液中不如此,在此其过表达/过表现。在图8E中也表现了(重叠)。基因CDKL1(p42)、MICALCL、MBNL3、RHD、ST7(RAY1)、PPR3R1、[360739](PIP5K2A)、AMFR、FLJ22471、CRAT(CAT1)、PLA2G4C、ACOT7(ACT)(ACH1)、RNF182、KLRC3(NKG2E)、HLA-DPB1在健康的对照个体的血液中低调表达/低表现,然而在潜伏性的TB患者的血液中过表达/过表现,并在多数活性的TB患者的血液中过表达/过表现(图8F)。总之,在图8A中全部119个基因的总体表达谱(为易于理解基因和在临床状态之间的特异性而在图8B-8F中进行了划分),所述表达谱将受感染的(活性的TB和潜伏性的TB)患者从未感染的患者(健康的对照)中区分开,并且除此之外,将两组受感染的患者区分开,也即活性的和潜伏性的TB患者。通过这种方法,在活性的TB患者的血液中过表达的多个基因即使用最严格的统计学筛选所鉴定的相同的基因(示于图7,表6),并且许多是IFN-可诱导的和/或涉及于胞吞作用的细胞交通和/或脂类代谢。
表6.发现在潜伏性的和健康的之间,或者在活性的和健康的之间显著差别地表达的基因,其当组合地使用时使用无监管的皮尔逊校正系数聚类算法(119个基因)区分活性的、健康的和潜伏性的。
在活性的和潜伏性的TB中不同的和相互的免疫标签通过模块的方法揭示。为了得到关于发病机理的进一步信息,经校准的各个芯片的数据使用刚刚描述的稳定模块分析框架进行进一步分析,所述框架基于预先设定的基因转录物的聚类,所述聚类显示出在宽范围的疾病中共同表达,并通常在功能的水平上表现分子或者细胞的聚类(Chaussabel等,2008,Immunity)。
由于本分析的目标是得到各组转录标签中所含的基因的功能性信息,所述分析致力于在我们此前的分析中紧密地聚类到一起的患者的亚集合,排除了落单者,其原因在于这样的组更可能显示出涉及到疾病过程的共同路径及过程。
选择了九名具有活性TB的患者,六名健康的对照以及九名具有潜伏性的TB的患者,并将其用于模块分析中。将各个比较分别地进行,从而在一个分析中将九名活性的TB患者与六名健康的对照进行比较,随后在另外的分析中将九名潜伏性的患者与同样的六名健康的对照进行比较。对转录物进行筛选,从而排除在所比较的任意组的至少两个个体中任何未检测出来的。随后对患者和健康的对照组进行统计比较(非参数的Wilcoxon-Mann-Whitney试验,P<0.05),从而确定在患者组和健康的对照之间有差别地表达的基因。这些有差别地表达的基因随后划分到那些在疾病组中与对照相比上调/过表现的那些中,以及在疾病组中与对照相比下调/低表现的那些中。这些列表随后通过模块基础在模块上进行分析。在各个模块中有差别地表达的基因或者显著地过表达,或者显著地低表达。为了确保确定,各个模块在表现的方面必须有>25%的总基因变化,并且在特定的方面变化的基因的数目必须>10。为了图示全部的转录变化,在活性的TB相对健康的对照中,或者潜伏性的TB相对健康的对照中,在网格上排列,其各个位置按照它们最初的定义与不同的模块相对应。点强度显示了在所显示方向上有差别地表达的转录物占在该模块中检测到的转录物的总数的比例,而点颜色显示了变化的极性(红色:过表达/表现,蓝色:低表达/表现)。除此之外,可以将模块坐标与功能的注解相关联,从而便于数据解释(Chaussabel,Immunity,2008;以及图9和10)。
与健康的对照相比,活性的TB的模块图谱(图9,表7A-P;以及表8)显示出不同于和健康的对照相比的潜伏性的TB的图谱(图10,表7A-F;和表9)。实际上,与健康的对照相比在对两种疾病状态下都显示变化的模块中,这些从活性的TB和潜伏性的TB独立地产生的模块图谱显示了基因表达/表现的相反的样式。与细胞毒素细胞关联的在模块M2.1中的基因在活性的TB中低表达/表现(36%-表6F中列出的基因中,在模块中检测的50个中的18个基因低表达/表现),并且在潜伏性的TB中过表达/表现(43%-表7B中列出的基因中,在模块中检测的51个中的22个基因过表达/表现)。从另一方面来说,M3.2和M3.3中的多个基因(“炎症”)(列于表6J和6K的基因)在活性的TB患者中过表达/表现,然而在潜伏性的TB患者中低表达/表现(列于表7E和7F的基因)。类似地,在M1.5中的基因(“骨髓系”)在活性的TB中过表达/表现(列于表6D的基因),然而在潜伏性的TB中低表达/表现(列于表7A的基因)。在模块M2.10中的基因(所述模块未形成连贯的功能性模块,而是由表面上不同的基因集合组成)在潜伏性的TB中低表达/表现(列于表7D中的基因),然而与对照相比在活性的TB中不过表达或者低表达/表现。这些基因之一是toll-样受体接头,TRAM,其是TLR-4(LPS)和TLR-3(dsRNA)信号转导的下游(Akira,Nat.Rev.Imm.)。
对于表7A到7O,对于活性的TB的相对经校正的表达以在活性的患者相对于对照的表达给出。在表8A及8F中,对于潜伏性的TB的相对经校正的表达以在健康对照相对于潜伏性的患者的表达给出。
表7A M1.2PTBv.对照,在活性的TB中过表现的基因。
表7B M1.3PTBv.对照,在活性的TB中低表达的基因。
表7C M1.4PTBv.对照,在活性的TB中低表现的基因
表7D M1.5PTBv.对照,在活性的TB中过表现的基因。
表7E M1.8PTBv.对照,在活性的TB中低表现的基因。
表7F M2.1PTBv.对照,在活性的TB中低表现的基因.
表7G M2.4PTBv.对照,在活性的TB中低表现的基因。
表7H M2.8PTBv.对照,在活性的TB中低表现的基因。
表7I M3.1PTBv.对照,在活性TB中过表现的基因。
表7J M3.2PTBv.对照,在活性的TB中过表现的基因。
表7K M3.3PTBv.对照,在活性的TB中过表现的基因。
表7L M3.4PTBv.对照,在活性的TB中低表现的基因。
表7M M3.6PTBv.对照,在活性的TB中低表现的基因。
表7N M3.7PTBv.对照,在活性的TB中低表现的基因。
表7O M3.8PTBv.对照,在活性的TB中低表现的基因。
表7P M3.9PTBv.对照,在活性的TB中低表现的基因。
表8A M1.5LTBv.对照,在潜伏性的TB中低表现的基因。
表8B M2.1LTBv.对照,在潜伏性的TB中过表现的基因。
表8C M2.6LTBv.对照,在潜伏性的TB中低表现的基因。
表8D M2.10LTBv.对照,在潜伏性的TB中低表现的基因。
表8E M3.2LTBv.对照,在潜伏性的TB中低表现的基因。
表8F M3.3LTBv.对照,在潜伏性的TB中低表现的基因
与健康的对照相比,活性的TB组显示了5281个基因有差别地表达,如与潜伏性的组相比,仅显示了和对照相比的3137个有差别地表达的基因,可能反映了如细胞毒的模块中基因的过表达/表现显示的更为温和的(尽管清晰的)主动免疫响应。作为本发明的解释而非限制,这些结果很可能解释了与对照相比,在活性的TB患者中观察到的额外模块的变化这一现象,但是在相比对照的潜伏性的TB中不是如此。这些包括了在M1.2(血小板,列于表7A中的基因)中的过达/表现,和在M1.3(B细胞,列于表7B中的基因)以及M2.8(T细胞,列于表7H中的基因)中低表达/表现的基因,可能期待后者,这是由于在T细胞对M.tuberculosis感染的响应中,T细胞可能在感染的位点募集和/或在慢性感染期间受到抑制。在模块M2.4中的基因,下调表达的/表现的(列于表7G中的基因)包括编码核糖体蛋白家族成员的转录物(其表达在急性感染和脓毒疾中被改变(Calvano,2005;Thach,2005)),以及在该模块中的基因已经显示在SLE、肺移植的患者中以及Streptococcus(S)pneumoniae感染的人中低表达(Chaussabel,Immunity,2005)。在活性的TB中,在模块M3.1中(IFN-可诱导的)观察到最大集合的过量表达的基因(90个经检测的中的60个基因,表7I),该基因的集合处于保护的IFN-γ的功能相符合,然而在此模块中的基因在潜伏性的TB患者中未有差别地表达,所述潜伏性的患者与对照相比控制了感染。在活性的TB中,基因在多个含有基因的模块(M3.4、M3.6、M3.7、M3.8和M3.9,列于表7L-7P中的基因)中低表达,所述基因不显示为一致的功能性模块,而是包括明显地不同集合的基因,并已经观察到在肺移植受体中低表达(Chaussabel.,2008,Immunity)。
根据对全血的转录分析并使用此模块图谱方法,可以将活性的TB患者从潜伏性的TB患者中区分。进一步地,在本研究中得到的活性的TB的模块图谱与其他的为不同的疾病创建的模块图谱的比较下,清楚的是,与SLE、移植,黑色素瘤或者S.pneumoniae患者相比,活性的TB患者具有不同的总体转录谱(图9)(Chaussabel,2008,Immunity)。特定的模块如M2.4可能对于多种疾病是常见的,所述模块包括编码核糖体蛋白家族成员的转录物,其在活性的TB、SLE、肺移植患者及感染了S.pneumoniae的人中是低表达的。然而,在其他的模块中的基因更不广泛地受影响,如3.1(IFN-可诱导的),其尽管在活性的TB中(图9)和SLE(Chaussabel,2008,Immunity)中过表达,而在其他的疾病中不如此,尤其在S.pneumoniae中,此时其与对照相比,M3.1中不显示有差别的基因表达。在关于在多个其他模块中的基因的过表达或者低表达,SLE中的转录谱与活性的TB的不同。类似地,尽管在活性的TB及S.pneumoniae中观察到模块M3.2和M3.3(“炎症”)、M1.2(血小板)和M1.5(“髓的”)中的基因过表达,以及在模块M3.4、5、6、7、8和9(非功能性的一致的模块)中基因的低表达,这些疾病仍然能通过这种方法进行区别,这是由于与对照相比,模块M2.2(中性粒细胞)、M2.3(红细胞)、M3.5(非功能上一致的模块)中的基因在S.pneumoniae中过表达,而不在TB中有差别地受到影响。因此,通过保留数据的复杂性和重要性,然而将复杂的数据进行组织及减少其维度,可能将不同的感染性及炎症性疾病通过血液的转录谱区分开(Chaussabel,2008,Immunity)。
潜伏性和活性的TB患者的血液中,本发明鉴别出了谨慎的有差别的及相互的转录标签的数据集。具体地,活性的TB患者在功能性的IFN-可诱导的、炎症以及髓的模块中显示出基因的过表达/表现,其在另一个方面在潜伏性的TB中下调/低表现。活性的TB患者显示出免疫调节基因PDL-1和PDL-2的表达增加/过表现,其可能对TB中的免疫发病机理有贡献。来自潜伏性的TB患者血液显示出细胞毒性模块中基因的过表达/表现,其可能有助于保护性响应,该响应包括M.tuberculosis在这些患者中的感染,并可能为临床尝试中试验接种的效果提供生物标记物。我们相信我们初步研究的成功依赖于我们采用的严格的临床准则,为了支持潜在因素的归属进行的伴随免疫反应性研究,改进的RNA收集和分离的质量,先进的高通量全基因组微阵列平台,以及精密的数据挖掘工具,所述工具保持了基因表达的尺寸而具有可读的格式(Chaussabel等人提供)。该发现作为潜伏性的和活性的TB的诊断是有价值的,可能带来对下述的理解:免疫保护(潜伏性的TB)相对于免疫发病(活性的TB)的潜在机理(这些转录区别所隐含的),以及用于保护的新型疗法的设计或者在活性的TB中免疫疗法的设计,从而利用抗分枝杆菌药物得到更快的治疗效果。
预期在本说明书中讨论的,关于本发明的任意方法、试剂盒、试剂或者组合物的任意实施方案能够实现,反之亦真。进一步地,可以将本发明的组合物用于实现本发明的方法。
应当理解的是在此描述的具体实施方案以说明的方式提供,而非作为本发明的限制。可能在不同的实施方案中采用本发明的主要特征,而不背离本发明的范围。本领域技术人员应认识到,或者能够确定使用不超过常规的试验,在此描述的特定过程的多个等价物。该等价物被认为在本发明的范围内,并由权利要求所覆盖。
在本说明书中所提到的全部出版物和专利申请对于本发明相关领域的技术人员的技术水平而言是指示性的。将全部的出版物及专利申请在此结合作为参考,其引用的程度相当于指出各个单独的出版物或者专利申请特别地及单独地结合作为参考。
词语“一个(a)”或者”一个(an)”的使用,当与术语“包括”在权利要求和/或说明书中一起使用时,其可能表示“一”,然而其也可能与“一个或多个”,“至少一个”和“一个或者多于一个”的意思相同。虽然说明书支持仅指可选方案以及“和/或”的定义,术语“或者”在权利要求中的使用用于表示“和/或”,除非明确地指出其仅指可供选择的或者可选的方案是互相排斥的。在本申请中,术语“约“用于表示数值包括对于设备误差,所采用的以测定数值方法的固有的变化,或者在研究的对象中存在的变化。
如本说明书和权利要求(或多个权利要求)中所使用的,词语“包括(comprising)”(及包括的任意形式如“包括(comprise)”和“包括(comprises)”),“具有(having)”(及具有的任意形式,如“具有(have)”和“具有(has)”),“包括(including)”(及包括的任意形式如“包括(includes)”和“包括(include)”)或者“含有(containing)”(及含有的任意形式如“含有(contains)”和“含有(contain)”)为包括的或者开放边界的,并不排除额外的、未列出的要素或者方法步骤。
本文使用的术语“或其组合”指在该术语前所列出的个体的全部排列组合。例如,“A、B、B或其组合”期待包括A、B、C、AB、AC、BC或者ABC的至少一种,以及如果顺序在特定环境下重要的话,还包括BA、CA、CB、CBA、BCA、ACB、BAC或者CAB。继续此例子,包括一个或者多个要素或者术语的重复的组合也明确地包括在内,如BB、AAA、MB、BBC、AAABCCCC、CBBAAA、CABABB等等。技术人员理解典型地对于以任意组合的项目或者术语没有数目的限制,除非文字中明显表示的。
本文公开并要求保护的全部的组合物和/或方法可能依照本公开在不过度的实验下制备和执行。尽管本发明的组合物和方法已经以优选的实施方式的形式进行了描述,对于本领域技术人员显而易见的是,可能对本文描述的组合物和/或方法进行变化,以及在所述方法的步骤或者步骤的顺序进行变化,而同时不悖离本发明的原理,精神以及范围。所有这样的对于本领域技术人员而言显而易见的类似替代和修改认为是在本发明由所附权利要求所限定的精神,范围及原理之内的。
参考文献
Alizadeh,A.A.,Eisen,M.B.,Davis,R.E.,Ma,C.,Lossos,I.S.,Rosenwald,A.,Boldrick,J.C.,Sabet,H.,Tran,T.,Yu,x.,et al.(2000).Distinct types of diffuselarge Bcell lymphoma identified by gene expression profiling.Nature 403,503-511.
Allantaz,F.,Chaussabel,D.,Stichweh,D.,Bennett,L.,Allman,W.,Mejias,A.,Ardura,M.,Chung,W.,Wise,C.,Palucka,K.,et al.(2007).Blood leukocytemicroarrays to diagnose systemic onset juvenile idiopathic arthritis and followthe response to IL-1blockade.J Exp Med 204,2131-2144.AHantaz F,Chaussabel D,Banchereau J,Pascual V(2007)Microarray-basedidentification of novel biomarkers in IL-1-mediated diseases.Curr Opin Immunol19:623-632.
Baechler,E.C.,Batliwalla,F.M.,Karypis,G.,Gaffney,P.M.,Ortmann,W.A.,Espe,K.J.,Shark,K.B.,Grande,W.J.,Hughes,K.M.,Kapur,V.,et al.(2003).Interferon inducible gene expression signature in peripheral blood cells ofpatients with severe lupus.Proc Natl Acad Sci USA 100,2610-2615.
Bennett,L.,Palucka,A.K.,Arce,E.,Cantrell,V.,Borvak,J.,Banchereau,J.,andPascual,V.(2003).Interferon and granulopoiesis signatures in systemic lupuserythematosus blood.J Exp Med 197,711-723.
Bittner,M.,Meltzer,P.,Chen,Y.,Jiang,Y.,Seftor,E.,Hendrix,M.,Radmacher,M.,Simon,R.,Yakhini,Z.,Ben-Dor,A.,et al.(2000).Molecular classification ofcutaneous malignant melanoma by gene expression profiling.Nature 406,536-540.
Bleharski,J.R.,H.Li,C.Meinken,T.G.Graeber,M.T.Ochoa,M.Yamamur,A.Burdick,E.N.Saro,M.Wagner,Rollinghoff,T.H.Rea,M.Colonna,S.Stenger,B.R.Bloom,D.Eisenberg,and R.L.Modlin.Use of genetic profiling in leprosyto discriminate clinical forms of the disease.Science(New York,N.Y 2003.301:1527-1530.
Burczynski,M.E.,Twine,N.C.,Dukart,G.,Marshall,B.,Hidal go,M.,Stadler,W.M.,Logan,T.,Dutcher,J.,Hudes,G.,Trepicchio,W.L.,et al.(2005).
Transcriptional profiles in peripheral blood mononuclear cells prognostic ofclinical outcomes in patients with advanced renal cell carcinoma.Clin CancerRes 11,1181-1189.
Casanova,J.L.,and L.Abel.Genetic dissection of immunity to mycobacteria:thehuman model.Aunual review of immunology 2002.20:581-620.
Chaussabel,D.,Allman,W.,Mejias,A.,Chung,W.,Bennett,L.,Ramilo,O.,Pascual,V.,Palucka,A.K.,and Banchereau,J.(2005).Analysis of significancepatterns identifies ubiquitous and disease-specific gene-expression signatures inpatient peripheral blood leukocytes.Ann N Y Acad Sci 1062,146-154.
Chaussabel,C.,Quinn,C.,Shen,J.,Patel,P,Glaser,C.,Baldwin,N.,Stichweh,D.,Blankenship,D.,Li,L.,Munagala,I.,Bennett,L.,Allantaz,F.,Mejias,A.,Ardura,M.,Kaizer,E.,Mounet,L.,Allman,W.,Randall,H.,Johnson,D.,Lanier,A.,Punar,M.,Wittkowski,K.M.,White,P.,Fay,J.,Klintmalm,G.,Ramilo,O.,Palucka,A.K.,Banchereau,J.,and Pascual,V.(2008).A ModularFramework for Biomarker and Knowledge Discovery from Blood
Transcriptional Profiling Studies:Application to Systemic Lupus Erythematosus.Immunity.In press.
Cobb,J.P.,Mindrinos,M.N.,Miller-Graziano,C.,Calvano,S.E.,Baker,H.V.,Xiao,W.,Laudanski,K.,Brownstein,B.H.,Elson,C.M.,Hayden,D.L.,et al.(2005).Application of genome-wide expression analysis to human health anddisease.Proc N atl Acad Sci USA 102,4801-4806.
Gack,M.U.,Y.C.Shin,C.H.Joo,T.Urano,C.Liang,L.Sun,O.Takeuchi,S.Akira,Z.Chen,S.Inoue,and J.U.Jung.TRIM25 RING-finger E3 ubiquitinligase is essential for RIG-I-mediated antiviral activity.Nature2007.446:916-920.
Greenwald,R.J.,Y.E.Latchman,and A.H.Sharpe.Negative co-receptors onlymphocytes.Current opinion in immunology 2002.14:391-396.
Golub,T.R.,Slonim,D.K.,Tamayo,P.,Huard,C.,Gaasenbeek,M.,Mesirov,J.P.,Coller,H.,Loh,M.L.,Downing,J.R.,Caligiuri,M.A.,et al.(1999).
Molecular classification of cancer:class discovery and class prediction by geneexpression monitoring.Science 286,531-537.
Jacobsen,M.,J.Mattow,D.Repsilber,and S.H.Kaufmann.Novel strategies toidentify biomarkers in tuberculosis.Biological chemistry 2008.
Jacobsen,M.,D.Repsilber,A.Gutschmidt,A.Neher,K.Feldmann,H.J.Mollenkopf,A.Ziegler,and S.H.Kaufmann.Candidate biomarkers fordiscrimination between infection and disease caused by Mycobacteriumtuberculosis.Journal of molecular medicine(Berlin,Germany)2007.85:613-621.Kaizer,E.C.,Glaser,C.L.,Chaussabel,D.,Banchereau,J.,Pascual,V.,andWhite,P.C.(2007).Gene expression in peripheral blood mononuclear cells fromchildren with diabetes.J Clin Endocrinol Metab 92,3705-3711.
Kaufmann,S.H.,and A.J.McMichael.Annulling a dangerous liaison:
vaccination strategies against AIDS and tuberculosis.Nature medicine2005.11:S33-44.
Keane,J.TNF-blocking agents and tuberculosis:new drugs illuminate an oldtopic.Rheumatology(Oxford,England)2005.44:714-720.
Li,X.,B.Gold,C.O′Huigin,F.Diaz-Griffero,B.Song,Z.Si,Y.Li,W.Yuan,M.Stremlau,C.Mische,H.Javanbakht,M.Scally,C.Winkler,M.Dean,and J.Sodroski.Unique features of TRIM5alpha among closely related human TRIMfamily members.Virology 2007.360:419-433.
Martinez,F.O.,S.Gordon,M.Locati,and A.Mantovani.Transcriptionalprofiling of the human monocyte-to-macrophage differentiation and polarization:new molecules and pattems of gene expression.J Immunol 2006.177:7303-7311.
Meroni,G.,and G.Diez-Roux.TRIM/RBCC,a novel class of′single proteinRING finger′E3 ubiquitin ligases.Bioessays 2005.27:1147-1157.
Mistry,R.,J.M.Cliff,c.L.Clayton,N.Beyers,Y.S.Mohamed,P.A.Wilson,H.M.Dockrell,D.M.Wallace,P.D.van Helden,K.Duncan,and P.T.Lukey.Gene-expression pattems in whole blood identify subjects at risk for recurrenttuberculosis.The J oumal of infectious diseases 2007.195:357-365.
Nisole,S.,J.P.Stoye,and A.Saib.TRIM family proteins:retroviral restrictionand antiviral defence.Nat Rev MicrobioI2005.3:799-808.
Pascual V,Allantaz F,Arce E,Punaro M,Banchereau J(2005)Role ofinterleukin-1(IL-1)in the pathogenesis of systemic onset juvenile idiopathicarthritis and clinical response to IL-1blockade.JExp Med 201:1479-1486.Rajsbaum,R.,J.P.Stoye,and A.O′Garra.Type I interferon-dependent and-independent expression of tripartite motif proteins in immune cells.Europeanjoumal ofimmunology 2008.38:619-630.
Ramilo,O.,Allman,W.,Chung,W.,Mejias,A.,Ardura,M.,Glaser,C.,Wittkowski,K.M.,Piqueras,B.,Banchereau,J.,Palucka,A.K.,and Chaussabel,D.(2007).Gene expression pattems in blood leukocytes discriminate patientswith acute infections.Blood 109,2066-2077.
Reljic,R.IFN-gamma therapy of tuberculosis and related infections.J InterferonCytokine Res 2007.27:353-364
Reymond,A.,G.Meroni,A.Fantozzi,G.Merla,S.Cairo,L.Luzi,D.Riganelli,E.Zanaria,S.Messali,S.Cainarca,A.Guffanti,S.Minucci,P.G.Pelicci,and A.Ballabio.The tripartite motif family identifies cell compartments.Embo J 2001.20:2140-2151.
Rubins,K.H.,L.E.Hensley,P.B.Jahrling,A.R.Whitney,T.W.Geisbert,J.W.Huggins,A.Owen,J.W.Leduc,P.O.Brown,and D.A.Relman.The hostresponse to smallpox:analysis of the gene expression program in peripheralblood cells in a nonhuman primate model.Proceedings of the National Academyof Sciences of the United States of America 2004.101:15190-15195.
Song,B.,B.Gold,C.O′Huigin,H.Javanbakht,X.Li,M.Stremlau,C.Winkler,M.Dean,and J.Sodroski.The B30.2(SPRY)domain of the retroviral restrictionfactor TRIM5alpha exhibits lineage-specific length and sequence variation inprimates.J Virol 2005.79:6111-6121.
Thach,D.C.,Agan,B.K.,Olsen,C.,Diao,J.,Lin,B.,Gomez,J.,Jesse,M.,Jenkins,M.,Rowley,R.,Hanson,E.,et al.(2005).Surveillance of transcriptomesin basic military trainees with normal,febrile respiratory illness,andconvalescent phenotypes.Genes Immun.6(7):588-95.
Claims (52)
1.一种用于在疑似结核分枝杆菌感染的患者中区分活性的和潜伏性的结核分枝杆菌感染的方法,所述方法包括:
从来自所述患者的全血样品中获得基因表达数据集;
测定一个或者多个转录基因表达模块的有差别的表达,所述模块区分被感染的患者和未感染的个体,其中所述数据集显示了与相对应的未感染的个体相比,在所述一个或者多个转录基因表达模块中多核苷酸水平的总体变化;以及
根据所述在活性的和潜伏性的感染之间有差别的一个或者多个转录基因表达模块,区分活性的和潜伏性的结核分枝杆菌(TB)感染。
2.权利要求1所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定诊断的步骤。
3.权利要求1所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定预测的步骤。
4.权利要求1所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定治疗计划的步骤。
5.权利要求1所述的方法,其进一步包括区分具有潜伏性的TB的患者和活性的TB患者的步骤。
6.权利要求1所述的方法,其中所述模块包括在模块M1.2、M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9中的基因的数据集,从而检测活性的肺部感染。
7.权利要求1所述的方法,其中所述模块包括在模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3中的基因的数据集,从而检测潜伏性的感染。
8.权利要求1所述的方法,其中下列基因在活性的肺部感染中被下调:CD3、CTLA-4、CD28、ZAP-70、IL-7R、CD2、SLAM、CCR7和GATA-3。
9.权利要求1所述的方法,其中图9的表达谱指示活性的肺部感染。
10.权利要求1所述的方法,其中图10的表达谱指示潜伏性的感染。
11.权利要求1所述的方法,其中在模块M3.4、M3.6、M3.7、M3.8和M3.9中基因的低表达指示活性的感染。
12.权利要求1所述的方法,其中在模块M3.1中的基因的过表达指示活性的感染。
13.权利要求1所述的方法,其进一步包括通过测定模块M2.2、M2.3和M3.5中的基因表达,区分TB感染与其他细菌感染的步骤,所述模块由分枝杆菌之外的感染的外周血液单核细胞或者全血过表达。
14.权利要求1所述的方法,其进一步包括在潜伏性的和活性的TB患者血液中区分有差别的和相互的转录标签的步骤,其使用下列模块的两个或更多个:对于活性的肺部感染,为M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9,以及对于潜伏性的感染,为模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3。
15.权利要求1所述的方法,其中相对于健康的患者,在活性的肺部TB感染中上调的基因选自表7A、7D、7I、7J和7K。
16.权利要求1所述的方法,其中相对于健康的患者,在活性的肺部TB感染中下调的基因选自表7B、7C、7E、7F、7G、7H、7L、7M、7N、7O和7P。
17.权利要求1所述的方法,其中相对于健康的患者,在潜伏性的TB感染中上调的基因选自表8B。
18.权利要求1所述的方法,其中相对于健康的患者,在潜伏性的TB感染中下调的基因选自表8A、8C、8D、8E和8F。
19.一种用于在疑似结核分枝杆菌感染的患者中区分活性的和潜伏性的结核分枝杆菌感染的方法,所述方法包括:
从具有活性的结核分枝杆菌感染的第一个临床组得到第一基因表达数据集,从具有潜伏性的结核分枝杆菌感染患者的第二个临床组得到第二基因表达数据集,和从未感染个体的临床组得到的第三基因表达数据集;
产生基因簇数据集,所述数据集包括第一、第二和第三数据集的任意两者之间基因有差别的表达;以及
测定表达/表现的独特的图谱,所述图谱指示潜伏性的感染、活性的感染或者健康。
20.权利要求19所述的方法,其中将各个临床组分成表6中119个基因中的各个的独特的表达/表现图谱。
21.权利要求19所述的方法,其中比较第一和第三数据集的数值,并且从中减去来自第三数据集的数据集的数值。
22.权利要求19所述的方法,其中比较第二及第三数据集的数值,并且从中减去来自第三数据集的数据集的数值。
23.权利要求19所述的方法,其进一步包括比较两个不同的数据集的数值,并且减去剩下的数据集的数值的步骤,从而区分具有潜伏性的感染的患者、具有活性的感染的患者以及未感染的个体。
24.权利要求19所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定诊断或者预测的步骤。
25.权利要求19所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定治疗计划的步骤。
26.权利要求19所述的方法,其进一步包括区分具有潜伏性的TB的患者和活性的TB患者的步骤。
27.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:ST3GAL6、PAD14、TNFRSF12A、VAMP3、BR13、RGS19、PILRA、NCF1、LOC652616、PLAUR(CD87)、SIGLEC5、B3GALT7、IBRDC3(NKLAM)、ALOX5AP(FLAP)、MMP9、ANPEP(APN)、NALP12、CSF2RA、IL6R(CD126)、RASGRP4、TNFSF14(CD258)、NCF4、HK2、ARID3A、PGLYRP1(PGRP),其在潜伏性的TB患者的血液中低表达/低表现,而在健康的个体或者活性的TB患者的血液中不是如此。
28.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:ABCG1、SREBF1、RBP7(CRBP4)、C22orf5、FAM101B、S100P、LOC649377、UBTD1、PSTPIP-1、RENBP、PGM2、SULF2、FAM7A1、HOM-TES-103、NDUFAF1、CES1、CYP27A1、FLJ33641、GPR177、MID1IP1(MIG-12)、PSD4、SF3A1、NOV(CCN3)、SGK(SGK1)、CDK5R1、LOC642035,其在健康的对照个体的血液中过表达/过表现,而在潜伏性的TB患者的血液中低表达/低表现,并在活性的TB患者的血液中低表达/低表现。
29.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:ARSG、LOC284757、MDM4、CRNKL1、IL8、LOC389541、CD300LB、NIN、PHKG2、HIP1,其在健康的个体的血液中过表达/过表现,在潜伏性和活性的TB患者的血液中低表达/低表现
30.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:PSMB8(LMP7)、APOL6、GBP2、GBP5、GBP4、ATF3、GCH1、VAMP5、WARS、LIMK1、NPC2、IL-15、LMTK2、STX11(FHL4),其在活性的TB的血液中过表达/过表现,并在潜伏性的TB患者和健康的对照个体的血液中低表达/低表现。
31.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:FLJ11259(DRAM)、JAK2、GSDMDC1(DF5L)(FKSG10)、SIPAIL1、[2680400](KIAA1632)、ACTA2(ACTSA)、KCNMB1(SLO-BETA),其在来自活性的TB患者的血液中过表达/过表现,并在来自潜伏性的TB患者和健康的对照个体的血液中低表达/低表现。
32.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:SPTANI、KIAAD179(Nnp1)(RRP1)、FAM84B(NSE2)、SELM、IL27RA、MRPS34、[6940246](IL23A)、PRKCA(PKCA)、CCDC41、CD52(CDW52)、[3890241](ZN404)、MCCC1(MCCA/B)、SOX8、SYNJ2、FLJ21127、FHIT,其在活性的TB患者的血液中低表达/低表现,而在潜伏性的TB患者或者健康的对照个体的血液中不是如此。
33.权利要求19所述的方法,其进一步包括测定下述基因的表达水平:CDKL1(p42)、MICALCL、MBNL3、RHD、ST7(RAY1)、PPR3R1、[360739](PIP5K2A)、AMFR、FLJ22471、CRAT(CAT1)、PLA2G4C、ACOT7(ACT)(ACH1)、RNF182、KLRC3(NKG2E)、HLA-DPB1,其在健康的对照个体的血液中低表达/低表现,在潜伏性的TB患者的血液中过表达/过表现,并且在活性的TB患者的血液中过表达/过表现。
34.一种用于在疑似结核分枝杆菌感染的患者中区分活性的和潜伏性的结核分枝杆菌感染的方法,所述方法包括:
从全血样品中获得基因表达数据集;
将所述基因表达数据集分类到一个或多个转录基因表达模块中;以及
将区分活性的和潜伏的结核分枝杆菌感染的一个或者多个转录基因表达模块的有差别的表达进行绘图,从而区分活性的和潜伏性的结核分枝杆菌感染。
35.权利要求34所述的方法,其中所述数据集包括TRIM基因。
36.权利要求34所述的方法,其中所述数据集包括TRIM基因,并且TRIM 5、6、19(PML)、21、22、25、68在活性的肺部TB中过表现/表达。
37.权利要求34所述的方法,其中所述数据集包括TRIM基因,并且TRIM 28、32、51、52、68在活性的肺部TB中低表现/表达。
38.一种在疑似结核分枝杆菌感染的患者中诊断具有活性的和潜伏性的结核分枝杆菌感染的患者的方法,所述方法包括检测得自全血的一个或者多个转录基因表达模块的有差别的表达,所述模块区分感染的和未感染的患者,其中全血显示了与相对应的未感染的患者相比,在所述一个或多个转录基因表达模块中多核苷酸水平的总体变化,从而区分活性的和潜伏性的结核分枝杆菌感染。
39.权利要求38所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定诊断的步骤。
40.权利要求38所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定预测的步骤。
41.权利要求38所述的方法,其进一步包括使用所述测定的对比基因产物信息来制定治疗计划的步骤。
42.权利要求38所述的方法,其中所述模块包括在模块M1.2、M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9中的基因的数据集,从而检测活性的肺部感染。
43.权利要求38所述的方法,其中所述模块包括在模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3中的基因的数据集,从而检测潜伏性的感染。
44.权利要求38所述的方法,其中以下基因在活性的肺部感染中被下调:CD3、CTLA-4、CD28、ZAP-70、IL-7R、CD2、SLAM、CCR7和GATA-3。
45.权利要求38所述的方法,其中图9的模块的表达谱为活性的肺部感染的诊断。
46.权利要求38所述的方法,其中图10的模块的表达谱为潜伏性的感染的诊断。
47.权利要求38所述的方法,其中在模块M3.4、M3.6、M3.7、M3.8和M3.9中的基因的低表达指示活性的感染。
48.权利要求38所述的方法,其中在模块M3.1中的基因的过表达指示活性的感染。
49.权利要求38所述的方法,其进一步包括通过测定模块M2.2、M2.3和M3.5中的基因表达区分TB感染和其他的细菌感染的步骤,所述模块在分枝杆菌之外的感染中,由外周血液单核细胞或者全血过表达。
50.权利要求38所述的方法,其进一步包括在潜伏性的和活性的TB患者的血液中使用两个或更多个以下模块区分不同的和相互的转录标签的步骤:对于活性的肺部感染,为M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9,以及对于潜伏性的感染,为模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3。
51.一种用于在疑似结核分枝杆菌感染的患者中诊断具有活性和潜伏性的结核分枝杆菌感染的患者的试剂盒,所述试剂盒包含:
用于从所述患者获得基因表达数据集的基因表达检测器;以及
能够比较所述基因表达与得自全血的预设的基因模块数据集的处理器,所述数据集区分感染的和未感染的患者,其中全血显示了与相对应的未感染的患者相比,在一个或者多个转录基因表达模块中的多核苷酸水平的总体变化,从而区分活性的和潜伏性的结核分枝杆菌感染。
52.一种诊断具有活性的和潜伏性的结核分枝杆菌感染的患者的系统,所述系统包含:
来自所述患者的基因表达数据集;以及
能够比较所述基因表达与得自全血的预设的基因模块数据集的处理器,所述数据集区分感染的和未感染的患者,其中全血显示了与相对应的未感染的患者相比,在一个或者多个转录基因表达模块中的多核苷酸水平的总体变化,从而区分活性的和潜伏性的结核分枝杆菌感染,其中对于活性的肺部感染,所述模块选自M1.3、M1.4、M1.5、M1.8、M2.1、M2.4、M2.8、M3.1、M3.2、M3.3、M3.4、M3.6、M3.7、M3.8或者M3.9,以及对于潜伏性的感染,选自模块M1.5、M2.1、M2.6、M2.10、M3.2或者M3.3。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US61/075728 | 2008-06-25 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| HK1160923A true HK1160923A (zh) | 2012-08-17 |
Family
ID=
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2011526152A (ja) | マイコバクテリウム・ツベルクローシス感染症の血液転写サイン | |
| AU2010325179B2 (en) | Blood transcriptional signature of active versus latent Mycobacterium tuberculosis infection | |
| Greenberg et al. | Molecular profiles of inflammatory myopathies | |
| McKinney et al. | A CD8+ T cell transcription signature predicts prognosis in autoimmune disease | |
| US20070238094A1 (en) | Diagnosis, prognosis and monitoring of disease progression of systemic lupus erythematosus through blood leukocyte microarray analysis | |
| AU2007347118B2 (en) | Diagnosis of metastatic melanoma and monitoring indicators of immunosuppression through blood leukocyte microarray analysis | |
| Cusanovich et al. | The combination of a genome-wide association study of lymphocyte count and analysis of gene expression data reveals novel asthma candidate genes | |
| JP2010500038A (ja) | 血液白血球中の遺伝子発現サインが、急性感染の差次的診断を可能にする | |
| US20140179807A1 (en) | Module-level analysis of peripheral blood leukocyte transcriptional profiles | |
| Arriens et al. | Systemic lupus erythematosus diagnostics in the ‘omics’ era | |
| Teruel et al. | Integrative epigenomics in Sjögren´ s syndrome reveals novel pathways and a strong interaction between the HLA, autoantibodies and the interferon signature | |
| Elsink et al. | Implementation of early next-generation sequencing for inborn errors of immunity: a prospective observational cohort study of diagnostic yield and clinical implications in Dutch genome diagnostic centers | |
| Sklavenitis-Pistofidis et al. | Single-cell RNA sequencing defines distinct disease subtypes and reveals hypo-responsiveness to interferon in asymptomatic Waldenstrom’s Macroglobulinemia | |
| Jiang et al. | Single-cell RNA sequencing reveals cell type-specific immune regulation associated with human neuromyelitis optica spectrum disorder | |
| Galbraith et al. | Peripheral blood gene expression in postinfective fatigue syndrome following from three different triggering infections | |
| HK1160923A (zh) | 結核分枝杆菌感染的血液轉錄標籤 | |
| AU2015203028A1 (en) | Blood transcriptional signature of active versus latent mycobacterium tuberculosis infection | |
| WO2003016476A2 (en) | Gene expression profiles in glomerular diseases | |
| HK1179660A (zh) | 活性與潛伏性結核分枝杆菌感染的血液轉錄簽名 | |
| WO2018085897A1 (en) | Transplant rejection assay |