CN108027847A - 用于综合分析跨越多种肿瘤和种系外显子组的分子图谱的系统和方法 - Google Patents
用于综合分析跨越多种肿瘤和种系外显子组的分子图谱的系统和方法 Download PDFInfo
- Publication number
- CN108027847A CN108027847A CN201580037939.8A CN201580037939A CN108027847A CN 108027847 A CN108027847 A CN 108027847A CN 201580037939 A CN201580037939 A CN 201580037939A CN 108027847 A CN108027847 A CN 108027847A
- Authority
- CN
- China
- Prior art keywords
- information
- method described
- approach
- group
- tumour
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 106
- 238000000034 method Methods 0.000 title claims description 32
- 238000004458 analytical method Methods 0.000 title abstract description 29
- 210000004602 germ cell Anatomy 0.000 title description 4
- 238000013459 approach Methods 0.000 claims abstract description 62
- 238000013518 transcription Methods 0.000 claims abstract description 25
- 230000035897 transcription Effects 0.000 claims abstract description 25
- 108090000623 proteins and genes Proteins 0.000 claims description 39
- 239000003147 molecular marker Substances 0.000 claims description 24
- 230000035772 mutation Effects 0.000 claims description 21
- 102000004169 proteins and genes Human genes 0.000 claims description 19
- 238000011282 treatment Methods 0.000 claims description 19
- 210000004881 tumor cell Anatomy 0.000 claims description 17
- 239000003814 drug Substances 0.000 claims description 11
- 230000037361 pathway Effects 0.000 claims description 11
- 238000002224 dissection Methods 0.000 claims description 7
- 230000006870 function Effects 0.000 claims description 7
- 210000004027 cell Anatomy 0.000 claims description 5
- 238000012163 sequencing technique Methods 0.000 claims description 4
- 230000006552 constitutive activation Effects 0.000 claims description 3
- 230000007812 deficiency Effects 0.000 claims description 3
- 238000003780 insertion Methods 0.000 claims description 3
- 230000037431 insertion Effects 0.000 claims description 3
- 230000003993 interaction Effects 0.000 claims description 3
- 230000009467 reduction Effects 0.000 claims description 3
- 230000002103 transcriptional effect Effects 0.000 claims description 3
- 230000001771 impaired effect Effects 0.000 claims description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 claims 1
- 201000010099 disease Diseases 0.000 abstract description 6
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 abstract description 6
- 230000001225 therapeutic effect Effects 0.000 abstract description 6
- 239000003471 mutagenic agent Substances 0.000 abstract description 4
- 210000003484 anatomy Anatomy 0.000 abstract 1
- 230000008859 change Effects 0.000 description 7
- 239000000523 sample Substances 0.000 description 7
- 230000000694 effects Effects 0.000 description 6
- 210000001519 tissue Anatomy 0.000 description 6
- 230000008685 targeting Effects 0.000 description 5
- 230000004913 activation Effects 0.000 description 4
- 230000009946 DNA mutation Effects 0.000 description 3
- 108700020796 Oncogene Proteins 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 239000013610 patient sample Substances 0.000 description 3
- 101000984753 Homo sapiens Serine/threonine-protein kinase B-raf Proteins 0.000 description 2
- 102100027103 Serine/threonine-protein kinase B-raf Human genes 0.000 description 2
- 230000005754 cellular signaling Effects 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 210000000664 rectum Anatomy 0.000 description 2
- 201000001275 rectum cancer Diseases 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000004291 uterus Anatomy 0.000 description 2
- 208000010507 Adenocarcinoma of Lung Diseases 0.000 description 1
- 206010001167 Adenocarcinoma of colon Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 206010011953 Decreased activity Diseases 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 229940078123 Ras inhibitor Drugs 0.000 description 1
- 208000015634 Rectal Neoplasms Diseases 0.000 description 1
- 208000002495 Uterine Neoplasms Diseases 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 201000010897 colon adenocarcinoma Diseases 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000001447 compensatory effect Effects 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 210000005075 mammary gland Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007479 molecular analysis Methods 0.000 description 1
- 201000002528 pancreatic cancer Diseases 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 208000029340 primitive neuroectodermal tumor Diseases 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 206010038038 rectal cancer Diseases 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000004614 tumor growth Effects 0.000 description 1
- 206010046766 uterine cancer Diseases 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/20—Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Analytical Chemistry (AREA)
- Medical Informatics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
Abstract
对患者的生物组学数据进行了分析,其中使用肿瘤和匹配的正常组织的序列或diff对象鉴定患者和疾病特异性突变,使用转录组学数据鉴定突变基因的表达水平,以及基于如此获得的生物组学数据的途径分析鉴定患病组织特定的途径特征。最显著地,许多不同的肿瘤具有共有的途径特征,因此肿瘤途径特征的鉴定可以显示能够进行当肿瘤分析仅基于肿瘤的解剖学类型时通常不会考虑的有效的治疗选择。
Description
本申请要求2014年5月30日提交的、系列号为62/005766的美国临时申请的优先权益,并且该申请的内容以引用方式并入本文。
技术领域
本发明的领域为计算生物组学,特别是本发明涉及跨越得自多个患者和肿瘤样品的大量肿瘤和种系外显子组的分子图谱分析。
背景技术
背景描述包括可以用于理解本发明的信息。并非承认本发明提供的任何信息是现有技术或者与目前要求权益的本发明有关,或者并非承认明确或隐含引用的任何公开文献是现有技术。
尽管临床上熟悉靶向有限突变数量的基因组学测试用作获得治疗的分子学信息的手段,但是特别需要更加综合性、非假设性且随机的分子学分析的能力来指导治疗决定,这些决定不偏离于传统的组织及组织的治疗解剖工作,或先验的假设:几百个DNA突变为癌症的驱动者。事实上,大部分的临床医生目前都面临这样的挑战:越来越难以跟上纷至沓来的快速进步的科学。在这种个性化医疗的时代中,接近800种药品处于靶向驱动肿瘤生长的特定蛋白质靶标的研发中。在对复杂如癌症的威胁生命的疾病作出决定的过程中,这种认知的超负荷可以具有显著的结果。
目前,肿瘤学家最广泛使用的用于指导药品(靶向改变的蛋白质)治疗选择的方法是鉴定肿瘤样品中的基因DNA突变,其中利用多组少于500个的“可作用的”基因。此类可作用的基因通常由多种癌症的大规模研究来鉴定(例如参见Nature Genetics 45,1127–1133(2013))。本发明中的所有出版物和申请均以引用方式并入,如同每一份单独的出版物或专利申请明确且单独地表明以引用方式并入。所并入参考文献中的术语的定义或使用与本发明提供的该术语的定义不一致或矛盾时,以本发明提供的该术语的定义为准,并且不使用参考文献中该术语的定义。
不幸的是,目前依赖于肿瘤样品的基因分型来推导治疗决定很大程度上是基于以下假设:突变DNA的鉴定通常(由“DNA至蛋白质表达”)向下游翻译成由所选治疗所靶向的潜在的蛋白质途径中的变化,并且这些鉴定的DNA突变由此命名为是临床可作用的。然而,肿瘤基因组学中基因突变的大量分析未考虑突变的基因是否被转录,基因组学的改变是否是变体或疾病-驱动者,和/或此类突变的功能性环境如何,以及受此类突变影响的细胞中是否存在补偿性机制。
因此,忽视上述缺点对所选突变进行分析可能导致多种假阳性、假阴性和不相关的结果,这转而可以误导患者的治疗。因此,仍需要改善的系统和方法以用于分子图谱的广泛分析。
发明概述
本发明的主题是生物组学分析的系统和方法,其中从多种不同的肿瘤样品中获得共有的途径特征。更优选地,生物组学分析包括肿瘤和匹配的正常组织的分析,以鉴定患者和肿瘤特异性改变,其可以使用转录组学数据进行进一步精炼。基于此类分析,接着准备治疗建议,所述治疗建议通常不依赖于解剖的肿瘤类型,而是考虑共有的途径特征的分子标志特征。
在本发明的主题的一个方面中,本发明人考虑了鉴定肿瘤细胞的分子标志的方法,其包括使用分析仪接收来由各种大量患者的大量数据组的步骤,其中大量患者的至少2个(或者至少3个,或者至少5个)被诊断患有不同的肿瘤,并且其中各个数据组代表得自肿瘤和匹配的正常细胞的基因组学信息。在另一个步骤中,分析仪接收至少2个患者的转录组学信息,而在另一个步骤中,分析仪利用基因组学信息和转录组学信息鉴定至少2个患者的肿瘤细胞中共有的途径特征。在另一个步骤中,随后使用分析仪根据共有的途径特征来分配肿瘤细胞的分子标志,其中所述分子标志是不依赖于解剖的肿瘤类型而分配的,并且随后使用分析标志来制作或更新患者记录。
不限于本发明的主题,通常考虑BAMBAM格式、SAMBAM格式、FASTQ格式或FASTA格式的数据库,并且通常优选数据库为BAMBAM diff对象(diff object)。因此,在另外所考虑的方面中,数据库通常优选包括突变信息、拷贝数信息、插入信息、缺失信息、定向信息和/或断裂点信息。
关于基因组学信息,考虑了此类信息可以是完整的基因组学测序信息或外显子组测序信息,并且转录组学信息包括转录水平上的信息和/或序列信息。更通常地,转录组学信息覆盖得自肿瘤细胞的基因组学信息中所有外显子组的至少50%(或者至少80%)。此外,考虑在鉴定步骤中使用转录组学信息,以推断由突变基因编码的蛋白质的功能的降低或缺乏。
因此,本发明人考虑共有的途径特征包括组成型激活的途径、功能性受损的途径以及失调途径,和/或共有的途径特征可以表征为突变的非功能蛋白质、突变的失调蛋白质、过表达的蛋白质或表达不足的蛋白质。在另一些优选的实施方案中,使用PARADIGM或以途径为中心的其他分析方法来实施鉴定步骤。
此外,考虑了分子标志包括关于一个或多个途径元件的信息,特别是药品鉴定以及与一个或多个途径元件相互作用的类型。因此,应该领会的是,患者记录还可以包括基于肿瘤细胞的分子标志的治疗建议(例如对于患有第一肿瘤的第一患者的治疗建议可以基于与患有不同的第二肿瘤的第二患者共有的途径特征)。
通过下文中优选实施方案的详细描述以及附图,本发明的主题的多个目标、特征、方面和益处将变得更明显,其中相同的数字代表相同的组分。
附图简述
图1为示出所选肿瘤“可作用基因”的频率分布的图。
图2为与所选肿瘤的突变基因组DNA的RNA表达水平相关的图。
图3为描绘所选肿瘤中所选致癌基因的主要组成分析的示例图。
图4为描绘作为基因组重排的函数的存活时间的示例图。
图5为描绘所选肿瘤的示例性断裂点分析的图表。
图6为描绘基于过度激活的或激活不足的核心途径的途径活性簇的图。
图7为描绘跨越多种肿瘤类型的成簇的途径活性的图。
图8为描绘多种肿瘤类型的突变分布的示例图。
发明详述
以下描述包括可以用于理解本发明的信息。并非承认本发明提供的任何信息是现有技术或与本要求权益的发明相关,或者明确地或隐含引用的任何公开都是现有技术。
本发明的主题提供了用于改善的多种肿瘤生物组学分析的装置、系统和方法。更具体而言,本发明人发现,通常通过对肿瘤和匹配的正常样品进行比较从而首先鉴定基因组学中患者和肿瘤相关的改变,可以显著地改善生物组学数据分析。一旦弄清这些差异,可以利用相同患者进一步的转录组学数据来鉴定改变的序列是否在肿瘤中表达。对如此获得的患者数据随后进行途径分析以鉴定肿瘤的途径特征,特别是与多种其他类型的肿瘤共有的肿瘤途径特征。应该容易领会的是,共有的途径特征可以用于预示治疗,其中使用由解剖上不相关的肿瘤(其尚未以其他方式鉴定)得到的一种或多种治疗模式。由不同的方面来看,不同的肿瘤类型共有途径特征,而与解剖的肿瘤类型无关,并且具有各自分子标志的共有途径特征的知识可以鉴定尚未用于特定肿瘤类型的药品治疗策略。
因此,在本发明的主题的一个方面中,本发明人考虑了鉴定肿瘤细胞的分子标志的方法,特别是细胞信号传递途径的分子标志。最通常地,使用全集成的、基于云计算的超级计算机所驱动的基因组学和转录组学分析仪来实施鉴定和分析。应该注意的是,计算机所涉及的任何语言都应该读取,以包含计算装置的任何合适的组合,包括服务器、界面、系统、数据库、代理、智能体、引擎、控制器或者单独或共同运行的其他计算装置。应该领会计算装置包括处理器,其被构造成执行储存在有形的非临时性计算机可读储存介质(例如硬件、固态硬盘、RAM、闪盘、ROM等)上的软件指令。软件指令优选地将计算装置构造成提供如下文所讨论所公开仪器的作用、职能或其他功能。在特别优选的实施方案中,各种服务器、系统、数据库或界面使用标准的方案或算法来交换数据(可能基于HTTP、HTTPS、AES、公私密钥交换、web服务API、已知的金融交换协议或其他电子信息交换方法)。数据交换优选在分组交换网络、Internet、LAN、WAN、VPN或其他类型的分组交换网络上实施。
在特别优选的方法中,分析仪接收来自各种大量患者的大量数据组,其中大量患者中的至少2个被诊断患有不同的肿瘤,并且其中各个数据组代表得自肿瘤和匹配的正常细胞的基因组学信息。在另一个步骤中,分析仪接收至少2个患者的转录组学信息,并使用基因组学信息和转录组学信息鉴定至少2个患者的肿瘤细胞中共有的途径特征(当然,应该注意的是还可以仅鉴定单一患者样品的共有途径特征,而其他肿瘤的途径特征可以得自途径数据库)。在另一个步骤中,分析仪则用于基于共有的途径特征将分子标志分配给肿瘤细胞,其中所述分子标志是不依赖于(即以无关方式)解剖的肿瘤类型而分配的。在另一个步骤中,可以使用分子标志制作或更新患者记录。
关于得自大量患者的数据组,考虑了数据组的类型可以大幅改变,并且多种类型的数据组适用于本发明。因此,数据组可以包括未处理的或处理的数据组,并且示例性数据组包括具有BAMBAM格式、SAMBAM格式、FASTQ格式或FASTA格式的那些。然而,特别优选数据组以BAMBAM格式或BAMBAM diff对象提供(例如参见US2012/0059670A1和US2012/0066001A1)。因此,由另一个方面来看,应该注意的是,数据组反映的是相同患者的肿瘤和匹配的正常样品,以获得患者和肿瘤特定的信息。因此,可以排除不会引起肿瘤的基因种系改变(例如沉默突变、SNP等)。当然,应该意识到肿瘤样品可以得自最初的肿瘤、开始治疗时的肿瘤、复发的肿瘤或转移位点等。在大多数情况下,患者的匹配的正常样品可以是得自血液或者与肿瘤相同类型组织的非疾病组织。
还应该注意的是,数据组可以源自数据组生成装置(例如测序仪、qPCR仪等),或者由储存数据组的数据库提供。例如合适的数据组可以得自BAM服务器(例如US2012/0059670A1和US2012/0066001A1中所述)和/或途径分析仪(例如WO2011/139345A2和WO2013/062505A1中所述)。这在肿瘤和匹配的正常样品的数据组并非得自患者的情况下是特别真实的。因此,至少一些数据组是独立储存和提供的,并且可以在新获得的患者样品(例如在获得患者组织样品的一周内)上进行分析,其中使用得自患者肿瘤和匹配的正常样品的数据组,以及得自之前储存的肿瘤和匹配的正常样品(并非得自患者)的数据组。
对于数据组而言,应该注意的是,得自所有肿瘤的数据组均为无需转化和/或处理即可容易地进行比较的形式。因此,数据组优选包括肿瘤和患者特异性突变信息、甲基化状态信息、拷贝数信息、插入/缺失信息、定向信息和/或断裂点信息。还进一步考虑了数据组代表完整基因组的至少一部分,并且最通常地考虑了整个基因组。因此,优选数据组制备自覆盖完整基因组(或者完整基因组的至少50%或者至少70%或者至少90%)的整个基因组序列。备选地,还考虑了外显子组测序,并且在大多数情况下,考虑对完整外显子组的至少50%,更通常至少70,或者最通常至少90%进行测序。
此外,并且对于数据组的起源而言,应该领会的是,使用了大量的非患者的肿瘤数据。因此,考虑了除了患者数据组以外,数据组衍生自至少2种不同的肿瘤,更优选地衍生自至少3种或者至少5种不同的肿瘤类型,以鉴定共有的途径特征。得自不同肿瘤类型的数据组可以得自不同的患者样品,因为此类样品是可获得的(例如得自医院、临床试验、流行病学研究等)和/或可以由之前获得的分析或数据提供。例如TCGA提供了良好表征的生物组学信息的优秀样本,其可用于制备适用于本发明的数据组,并且下面表1示例性地示出本分析中使用的数据。
对于TCGA数据,进一步观察到不同的肿瘤类型在多个基因中具有多个突变。由此,显而易见的是,简单靶向单个可成药的靶标在大多数情况下下并非可行的选择。事实上,图1示例性地示出传统的单分子诊断的困境,其中示出各种肿瘤类型中潜在的可作用基因各自的数值分布。由图1可以容易地看出,在几乎所有的肿瘤中都具有大量的可作用基因,并非只是单一的突变。因此,应该理解的是,肿瘤的分析和治疗需要考虑多于一个的改变的基因。此外,之前尚未理解的是,并非所有突变的基因事实上都被表达,在这种情况下,可以或者不能得到可作用的或可成药的蛋白质靶标,如图2示例性描绘的那样。
如图2可得,某些肿瘤中所选的突变是不表达的或仅微弱地表达(即转录成RNA,参见下方的盒)。因此,预计靶向此类突变蛋白质(例如靶向成胶质细胞瘤中的BRAF V600)的药物干预不会以明显的方式影响肿瘤。相反,某些其他突变的蛋白质由于极高的表达率而提供了具有吸引力的靶标(例如通过靶向黑素瘤中的BRAF V600)。因此,应该理解的是,在一些癌症或患者中,相同的突变的蛋白质可以是合适的靶标,而在其他的癌症或患者中则为完全不合适的靶标。由不同的方面来看,不考虑转录组学数据的基因组学信息将缺乏指导治疗决定所需的细节。
在特别优选的方面中,获得转录信息,使其覆盖得自肿瘤细胞的基因组学信息中所有外显子组的至少50%或至少70%或至少80%或至少90%。因此,考虑了还对肿瘤细胞或组织的转录子进行定量分析(可任选地还对序列信息进行分析,以鉴定RNA编辑和/或RNA剪接)。此类分析可以包括通常由用户定义的阈值,如在共同未决的美国临时申请(2015年5月15日提交,系列号为62/162530)中进一步描述。
除了未考虑转录组学数据以外,在多数目前已知的系统和方法中,尚未理解细胞信号传递网络中突变的功能性影响,特别是其中多个突变存在于与肿瘤有关的多个基因中。为了克服这些缺点,本发明人在细胞信号传递途径的分析中使用患者和肿瘤特异性突变信息以及相关的表达水平,从而获得与途径利用和补偿(其中途径功能受到损害)有关的信息。因此,应该注意的是,转录组学信息优选地用于推断由突变基因编码的蛋白质的功能的降低或缺乏,以及在这种情况下对特定途径的影响。
尽管多种途径分析工具是本领域已知的,但是本发明人特别考虑了使用动态途径图,其中多个途径表示为概率途径模型。例如途径分析可以使用PARADIGM进行,如WO2011/139345、WO2013/062505、WO2014/059036或WO2014/193982中所述,其中使用数据组和转录组学信息,从而达到特定肿瘤的特定途径用途。如容易领会的那样,得自多个患者的多个数据组具有不同于所用的肿瘤时,分析仪能够使用肿瘤细胞的分子标志鉴定各种肿瘤的特定的途径特征。例如分析仪可以鉴定多种肿瘤类型中共有的途径特征,其中此类共有的特征可以包括组成型激活的途径、功能受损的途径和失调途径。此类共有的途径可以被表征,或者导致特定途径特征的多种因素和示例性因素包括途径中突变的非功能蛋白质、突变的失调的蛋白质、过表达的蛋白质或表达不足的蛋白质等。当然,应该注意的是,至少一些途径特征是事先确定并储存在数据库中的,或者至少一些途径特征也可以重新确定。因此,应该意识到新的患者数据可以与已经从数据库得到的数据进行比较。
在对多个患者的多个肿瘤类型进行集成基因组学、转录组学和途径分析的其他益处中,应该理解的是,多种随后的分析现状可以将某些分子事件分组或分类成观察不到的其他类别中。例如如图3所示,可以对得自不同肿瘤的多个表达的突变致癌基因进行主要组成分析,从而使多个特定的突变与多种不同的肿瘤相关联。同样,对不同肿瘤的断裂点分析可以与图4中示例性示出的预测结果相关联,或者断裂频率和分布可以与图5示例性示出的不同肿瘤相关联。
最显著地,如图6示例性示出,基于基因组学和转录组学信息的途径分析可以用于鉴定多种不同肿瘤共同的某些共有分子标志。因此,应该意识到可以基于属于由特定的共有途径特征所表征的一类肿瘤对肿瘤进行分类。进一步参见图6,应该注意的是,表1所示肿瘤以及基因组学和转录组学信息分层为6个不同的类别,与解剖位点无关。在本发明中,通过所选信号传递途径的激活或抑制来定义不同肿瘤的共同类别(例如myc转录的过度激活和NOTCH信号传递的抑制),其完全与基因解剖的肿瘤类型的分类无关(分成胰腺肿瘤、乳腺导管肿瘤等)。
图7示例性示出图6发现的不同方面,其中肿瘤分类表示成根据图6的簇。在本发明中,易于显而易见的是,可以根据具有特定分子标志的特定信号传递途径特征对完全不相关的肿瘤进行分类(例如子宫、直肠、肺腺癌)。例如分子标志可以包括途径中一个或多个途径元件的信息(例如Ras、Raf、MEK、Myc)。由此,在肿瘤与另一种不相关的肿瘤共有共同的途径特征(具有一个或多个共同的分子标志)的情况下,事实上所述肿瘤可以使用已知用于不相关肿瘤的治疗模式治疗。最通常地,分子标志信息可以包括药品鉴定(例如Ras突变和过表达时,药品信息可以包括合适的Ras抑制剂),和/或与一种或多种途径元件相互作用的类型(例如Hec1突变和过度激活时,药品信息可以包括合适的Hec1/Nek抑制剂)。因此,由另一个方面来看,患者肿瘤可以表征为属于特定类型,其中所述类型定义为具有不相关的且不同的成员(肿瘤),其在途径内共有共同的途径特征/分子标志。基于如此建立的分类,可以基于对于不相关和不同成员来说已知的或可利用的治疗选择来选取治疗选择。应该领会的是,治疗选择可以靶向特定途径的突变元件,而且治疗选择可以靶向另一个途径的非突变元件,其中所述另一个途径补偿了含有突变元件的途径中的缺陷。
在另一个分类方式中,本发明人考虑了可以由多种不同的肿瘤来分析所选的途径和/或途径元件,如图8中示例性示出。其中,针对不同的肿瘤来绘制所选途径的元件(例如肿瘤抑制剂或致癌基因),其提供了与多种肿瘤共同的共有途径特征和分子标志的快速鉴定。例如KRAS G12突变体与子宫、直肠和结肠癌相关联,而突变的APC与结肠腺癌和直肠癌相关联。
因此,本发明人考虑了患者记录通常包括基于肿瘤细胞的分子标志(并且基于与其他不相关的肿瘤共有的途径特征)的一个或多个治疗建议。换言之,对患有第一肿瘤的第一患者的治疗建议可以基于与患有不同的第二肿瘤的第二患者共有的途径特征。
如本说明书和所附的整个权利要求书所用,“a”、“an”和“the”的含义包括复数参照物,除非内容中另外清楚地指出。此外,如本说明书中所用,“在……中”的含义包括“在……中”和“在……上”,除非内容中另外清楚地指出。此外,如本文所用并且除非内容中另外指出,否则术语“与……偶联”是指包括直接偶联(其中彼此偶联的两个元件彼此接触)和间接偶联(其中至少一个额外的元件位于所述2个元件之间)。因此,术语“偶联至……上”和“与……偶联”同义使用。此外,本文所述的所有方法都可以以任何合适的顺序实施,除非本发明另外指出或内容中另外明确地作出相反的指示。对于本文某些实施方案提供的任何和所有实例或示例性语言(例如“例如”)的使用仅是为了更好地说明本发明,并非对另外要求权益的本发明的范围进行限定。说明书中的语言均不应该视为表明实施本发明所必需的任何未要求权益的元件。
对于本领域那些技术人员显而易见的是除了已经描述的那些以外,在不脱离本文的发明概念的条件下,更多的修改是可行的。因此,除了所附的权利要求书的范围以外,本发明的主题没有限定。此外,在解释说明书和权利要求书的过程中,所有术语都应该以内容一致的最广义可行的方式进行解释。具体而言,术语动词形式的“包含”和分词形式的“包含”应该以非排他性的方式解释为元件、成分或步骤,表明所指的元件、成分或步骤可以存在、使用或与未明确指明的其他元件、成分或步骤结合。在权利要求书指明选自A、B、C……和N中的至少一种某物的情况下,该内容应该解释为仅需要该组中的一个元素,并非为A加N、或者B加N等等。
Claims (20)
1.一种鉴定肿瘤细胞的分子标志的方法,其包括:
通过分析仪接收来自各种大量患者的大量数据组,其中所述大量患者的至少2个被诊断患有不同的肿瘤;
其中各个数据组代表得自肿瘤和匹配的正常细胞的基因组学信息;
通过所述分析仪接收所述至少2个患者的转录组学信息;
通过所述分析仪,利用所述基因组学信息和所述转录组学信息,鉴定所述至少2个患者的肿瘤细胞中共有的途径特征;
基于所述共有的途径信息,利用所述分析仪将分子标志分配给所述的肿瘤细胞,其中所述分子标志不依赖于解剖的肿瘤类型进行分配;以及
使用所述分子标志来制作或更新患者记录。
2.权利要求1所述的方法,其中所述大量数据组为BAMBAM格式、SAMBAM格式、FASTQ格式或FASTA格式。
3.权利要求1所述的方法,其中所述大量数据组为BAMBAM diff对象。
4.权利要求1所述的方法,其中所述大量数据组包括突变信息、拷贝数信息、插入信息、缺失信息、定向信息和/或断裂点信息。
5.权利要求1所述的方法,其中所述大量患者的至少3位患者被诊断患有不同的肿瘤。
6.权利要求1所述的方法,其中所述大量患者的至少5位患者被诊断患有不同的肿瘤。
7.权利要求1所述的方法,其中所述基因组学信息为完整的基因组测序信息。
8.权利要求1所述的方法,其中所述基因组学信息为外显子组测序信息。
9.权利要求1所述的方法,其中所述转录组学信息包括转录水平上的信息。
10.权利要求1所述的方法,其中所述转录组学信息包括RNA序列信息。
11.权利要求1所述的方法,其中所述转录组学信息覆盖得自所述肿瘤细胞的所述基因组学信息中所有外显子组的至少50%。
12.权利要求1所述的方法,其中所述转录组学信息覆盖得自所述肿瘤细胞的所述基因组学信息中所有外显子组的至少80%。
13.权利要求1所述的方法,其中所述共有的途径特征选自组成型激活的途径、功能性受损途径和失调途径。
14.权利要求1所述的方法,其中所述共有的途径特征表征为途径中突变的非功能蛋白质、突变的失调蛋白质、过表达的蛋白质或表达不足的蛋白质。
15.权利要求1所述的方法,其中所述转录组学信息用于鉴定步骤,从而推断由突变基因编码的蛋白质的功能的降低或缺乏。
16.权利要求1所述的方法,其中所述鉴定步骤是使用PARADIGM实施的。
17.权利要求1所述的方法,其中所述分子标志包括关于一个或多个途径元件的信息。
18.权利要求17所述的方法,其中所述分子标志的信息包括药品鉴定,以及与所述的一个或多个途径元件相互作用的类型。
19.权利要求1所述的方法,其中所述患者记录包括基于所述肿瘤细胞的所述分子标志的治疗建议。
20.权利要求19所述的方法,其中对患有第一肿瘤的第一患者的治疗建议是基于与患有不同的第二肿瘤的第二患者共有的途径特征。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201462005766P | 2014-05-30 | 2014-05-30 | |
| US62/005,766 | 2014-05-30 | ||
| PCT/US2015/033497 WO2015184439A1 (en) | 2014-05-30 | 2015-06-01 | Systems and methods for comprehensive analysis of molecular profiles across multiple tumor and germline exomes |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN108027847A true CN108027847A (zh) | 2018-05-11 |
Family
ID=54699962
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201580037939.8A Withdrawn CN108027847A (zh) | 2014-05-30 | 2015-06-01 | 用于综合分析跨越多种肿瘤和种系外显子组的分子图谱的系统和方法 |
Country Status (9)
| Country | Link |
|---|---|
| US (2) | US10614910B2 (zh) |
| EP (1) | EP3149641A4 (zh) |
| JP (3) | JP6195682B2 (zh) |
| KR (3) | KR101945093B1 (zh) |
| CN (1) | CN108027847A (zh) |
| AU (3) | AU2015266612A1 (zh) |
| CA (1) | CA2953937A1 (zh) |
| IL (2) | IL249259A (zh) |
| WO (1) | WO2015184439A1 (zh) |
Families Citing this family (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102004335B1 (ko) * | 2013-09-26 | 2019-07-26 | 파이브3 제노믹스, 엘엘씨 | 바이러스-연관 종양을 위한 시스템, 방법, 및 조성물 |
| EP3149641A4 (en) | 2014-05-30 | 2018-01-24 | Nantomics, LLC | Systems and methods for comprehensive analysis of molecular profiles across multiple tumor and germline exomes |
| CN109789190A (zh) | 2016-06-30 | 2019-05-21 | 河谷控股Ip有限责任公司 | Nant癌症疫苗 |
| US20200248267A1 (en) * | 2017-05-03 | 2020-08-06 | Nantomics, Llc | TUMOR VS. MATCHED NORMAL cfRNA |
| US11823773B2 (en) | 2018-04-13 | 2023-11-21 | Nant Holdings Ip, Llc | Nant cancer vaccine strategies |
| US11564980B2 (en) | 2018-04-23 | 2023-01-31 | Nantcell, Inc. | Tumor treatment method with an individualized peptide vaccine |
| TWI816603B (zh) | 2018-04-23 | 2023-09-21 | 美商南特細胞公司 | 新抗原表位疫苗及免疫刺激組合物及方法 |
| WO2020028862A1 (en) * | 2018-08-03 | 2020-02-06 | Nantomics, Llc | Panbam: bambam across multiple organisms in parallel |
| US20210381058A1 (en) * | 2018-10-01 | 2021-12-09 | Nantomics, Llc | Evidence based selection of patients for clinical trials using histopathology |
| CN109817337B (zh) * | 2019-01-30 | 2020-09-08 | 中南大学 | 一种单个疾病样本通路激活度的评估方法及相似疾病区分方法 |
Family Cites Families (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005516310A (ja) * | 2002-02-01 | 2005-06-02 | ロゼッタ インファーマティクス エルエルシー | 遺伝子を特定し、形質に関連する経路を明らかにするコンピュータ・システムおよび方法 |
| EP1644858B1 (en) * | 2003-07-10 | 2017-12-06 | Genomic Health, Inc. | Expression profile algorithm and test for cancer prognosis |
| US20060293859A1 (en) | 2005-04-13 | 2006-12-28 | Venture Gain L.L.C. | Analysis of transcriptomic data using similarity based modeling |
| US20070172847A1 (en) * | 2005-11-15 | 2007-07-26 | The Regents Of The University Of California | Molecular signaling pathways triggered by rituximab: prognostic, diagnostic, and therapeutic uses |
| GB0922006D0 (en) * | 2009-12-17 | 2010-02-03 | Genome Res Ltd | Diagnostic |
| US10192641B2 (en) | 2010-04-29 | 2019-01-29 | The Regents Of The University Of California | Method of generating a dynamic pathway map |
| JP6073217B2 (ja) | 2010-04-29 | 2017-02-08 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | ゲノムモデルに関するデータ統合を用いたパスウェイ認識アルゴリズム(paradigm) |
| CN103384887B (zh) * | 2010-05-25 | 2017-01-18 | 加利福尼亚大学董事会 | Bambam:高通量测序数据的平行比较分析 |
| US9646134B2 (en) | 2010-05-25 | 2017-05-09 | The Regents Of The University Of California | Bambam: parallel comparative analysis of high-throughput sequencing data |
| EP2614161B1 (en) * | 2010-09-09 | 2020-11-04 | Fabric Genomics, Inc. | Variant annotation, analysis and selection tool |
| JP2015533473A (ja) | 2012-07-12 | 2015-11-26 | ペルシミューン,インコーポレイテッド | 個別のがんワクチン及び適応免疫細胞療法 |
| KR101626487B1 (ko) | 2012-10-09 | 2016-06-01 | 파이브3 제노믹스, 엘엘씨 | 생물학적 경로 내의 조절 상호작용의 학습 및 확인을 위한 시스템 및 방법 |
| WO2014193982A1 (en) | 2013-05-28 | 2014-12-04 | Five3 Genomics, Llc | Paradigm drug response networks |
| EP3149641A4 (en) | 2014-05-30 | 2018-01-24 | Nantomics, LLC | Systems and methods for comprehensive analysis of molecular profiles across multiple tumor and germline exomes |
-
2015
- 2015-06-01 EP EP15799022.7A patent/EP3149641A4/en not_active Withdrawn
- 2015-06-01 KR KR1020167036845A patent/KR101945093B1/ko active Active
- 2015-06-01 WO PCT/US2015/033497 patent/WO2015184439A1/en not_active Ceased
- 2015-06-01 KR KR1020197024219A patent/KR20190100440A/ko not_active Withdrawn
- 2015-06-01 AU AU2015266612A patent/AU2015266612A1/en not_active Abandoned
- 2015-06-01 CN CN201580037939.8A patent/CN108027847A/zh not_active Withdrawn
- 2015-06-01 KR KR1020197002709A patent/KR102014054B1/ko active Active
- 2015-06-01 US US14/726,930 patent/US10614910B2/en active Active
- 2015-06-01 JP JP2016569600A patent/JP6195682B2/ja active Active
- 2015-06-01 CA CA2953937A patent/CA2953937A1/en not_active Withdrawn
-
2016
- 2016-11-28 IL IL249259A patent/IL249259A/en active IP Right Grant
-
2017
- 2017-08-15 JP JP2017156816A patent/JP6449391B2/ja active Active
- 2017-12-11 IL IL256238A patent/IL256238A/en unknown
-
2018
- 2018-02-12 AU AU2018201019A patent/AU2018201019B2/en not_active Withdrawn - After Issue
- 2018-12-05 JP JP2018228211A patent/JP2019083021A/ja active Pending
-
2019
- 2019-11-08 AU AU2019261808A patent/AU2019261808A1/en not_active Withdrawn
-
2020
- 2020-01-02 US US16/733,013 patent/US20200185053A1/en not_active Abandoned
Also Published As
| Publication number | Publication date |
|---|---|
| KR20170077063A (ko) | 2017-07-05 |
| AU2019261808A1 (en) | 2019-12-05 |
| EP3149641A1 (en) | 2017-04-05 |
| US10614910B2 (en) | 2020-04-07 |
| JP2017522646A (ja) | 2017-08-10 |
| IL249259A0 (en) | 2016-12-29 |
| US20160026752A1 (en) | 2016-01-28 |
| IL249259A (en) | 2017-12-31 |
| WO2015184439A1 (en) | 2015-12-03 |
| JP2019083021A (ja) | 2019-05-30 |
| KR102014054B1 (ko) | 2019-08-23 |
| CA2953937A1 (en) | 2015-12-03 |
| AU2018201019A1 (en) | 2018-03-01 |
| JP2018010658A (ja) | 2018-01-18 |
| US20200185053A1 (en) | 2020-06-11 |
| EP3149641A4 (en) | 2018-01-24 |
| JP6195682B2 (ja) | 2017-09-13 |
| AU2018201019B2 (en) | 2020-03-26 |
| KR101945093B1 (ko) | 2019-02-07 |
| AU2015266612A1 (en) | 2017-01-19 |
| KR20190100440A (ko) | 2019-08-28 |
| KR20190011344A (ko) | 2019-02-01 |
| JP6449391B2 (ja) | 2019-01-09 |
| IL256238A (en) | 2018-02-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN108027847A (zh) | 用于综合分析跨越多种肿瘤和种系外显子组的分子图谱的系统和方法 | |
| Cohen et al. | Genomic analysis of pigmented epithelioid melanocytomas reveals recurrent alterations in PRKAR1A, and PRKCA genes | |
| Simpson et al. | Sporadic naturally occurring melanoma in dogs as a preclinical model for human melanoma | |
| Muzevic et al. | Stereotactic radiotherapy for vestibular schwannoma | |
| Arslan et al. | A systematic pan-cancer study on deep learning-based prediction of multi-omic biomarkers from routine pathology images | |
| Vibert et al. | Identification of tissue of origin and guided therapeutic applications in cancers of unknown primary using deep learning and RNA sequencing (TransCUPtomics) | |
| Lee et al. | Genomic and evolutionary characteristics of metastatic gastric cancer by routes | |
| Nicoś et al. | Genetic clonality as the hallmark driving evolution of non-small cell lung cancer | |
| Gomes et al. | Progress towards personalized medicine for ameloblastoma | |
| Li et al. | Mutational landscape and clonal diversity of pulmonary adenoid cystic carcinoma | |
| Adami et al. | Future roles for FoxM1 inhibitors in cancer treatments | |
| Sinkala et al. | Machine learning and bioinformatic analyses link the cell surface receptor transcript levels to the drug response of breast cancer cells and drug off-target effects | |
| Jansen et al. | Correlation of gene expression with magnetic resonance imaging features of retinoblastoma: a multi-center radiogenomics validation study | |
| Mollica et al. | An evaluation of current prostate cancer diagnostic approaches with emphasis on liquid biopsies and prostate cancer | |
| Wang et al. | Efficacy generated by afatinib in a lung adenocarcinoma patient harboring HER2 S310Y mutation | |
| Cavic et al. | Two decades of progress in personalized medicine of colorectal cancer in Serbia—Insights from the Institute for Oncology and Radiology of Serbia | |
| Yoshida et al. | Prediction of improvement after extended thymectomy in non-thymomatous myasthenia gravis patients | |
| Cook | Studying the Tissue-Specificity of Cancer Driver Genes through KRAS and Genetic Dependency Screens | |
| Batra et al. | Identification of a novel ALK variant intrinsically resistant to crizotinib | |
| Qiao | Multi-omic spatial heterogeneity and evolution landscape in primary breast cancer | |
| Keelan | Translational and Clinical Research Identifies Novel Therapeutic Targets and Surgical Advances in The Modern Management of Breast Cancer | |
| Sousa-Squiavinato et al. | Modelling Acral Melanoma in Admixed Brazilians Uncovers Genomic Drivers and Targetable Pathways | |
| Chen | Mapping the Single-Cell Spatial Landscape of Pulmonary Lymphoepithelioma-Like Carcinoma | |
| Gopisetty et al. | EPCO-47. ITCC-P4: GENOMIC PROFILING AND ANALYSES OF PEDIATRIC PATIENT TUMOR AND PATIENT-DERIVED XENOGRAFT (PDX) MODELS FOR HIGH THROUGHPUT IN VIVO TESTING | |
| Hoeijmakers et al. | Neoadjuvant ipilimumab plus nivolumab in melanoma: 5-year survival and biomarker analysis from the phase 2 PRADO-trial |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WW01 | Invention patent application withdrawn after publication |
Application publication date: 20180511 |
|
| WW01 | Invention patent application withdrawn after publication |