CN111304334A

CN111304334A - 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备

Info

Publication number: CN111304334A
Application number: CN202010221309.9A
Authority: CN
Inventors: 高树庚; 应建明; 李文斌; 郭蕾; 宋朋
Original assignee: Cancer Hospital and Institute of CAMS and PUMC
Current assignee: Cancer Hospital and Institute of CAMS and PUMC
Priority date: 2020-03-26
Filing date: 2020-03-26
Publication date: 2020-06-19
Anticipated expiration: 2040-03-26
Also published as: CN111304334B

Abstract

本发明公开了一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备，涉及生物信息技术领域，具体地，用于预测肿瘤突变负荷的方法，通过检测9个基因的外显子和/或启动子及其上游区域，能够有效快速地预测待测样本的TMB状态。

Description

一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备

技术领域

本发明涉及生物信息技术领域，具体而言，涉及一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备。

背景技术

随着肿瘤免疫治疗的兴起，人们发现免疫治疗的效果在不同患者中的疗效不尽相同。例如，在非小细胞肺癌(Non-small cell lung cancer,NSCLC)患者中，相同病理类型的患者接受免疫治疗疗效存在较大差异，治疗客观有效率和患者生存期不尽一致。这促使医生需要一个可以量化的指标/标志物在病理上衡量特定患者对于肿瘤免疫疗法的敏感性。

目前，已经广泛应用的肿瘤免疫疗法标志物包括PD-L1免疫组化染色，微卫星不稳定性(Microsatellite instability，MSI)，错配修复缺陷(deficient Mismatch Repairprotein，dMMR)和肿瘤突变负荷(Tumor mutational burden，TMB)等等。

其中，TMB定义为每一百万碱基中非同义的体细胞突变，体细胞突变的检测方法对于准确测量TMB极其重要，在多个临床试验中，当肿瘤样本的TMB>10时，称之为TMB-High(TMB-H)状态，反之为TMB-Low(TMB-L)状态。

TMB在很多种类的癌症中都具有指标意义，例如，肺癌、黑色素瘤和结直肠癌等等。当肿瘤呈现TMB-H状态时，对某些免疫治疗药物(Pembrolizumab等)敏感。

但迄今为止，大部分TMB的测定仍然依赖于全外显子组测序(WES)。虽然WES可以从理论上直接测量TMB，但是在实际临床过程中却很难应用，因为它耗时费力，并且成本高昂。

鉴于此，特提出本发明。

发明内容

本发明的目的在于提供用于预测肿瘤突变负荷的核酸组合物、用于预测肿瘤突变负荷的方法、设备和计算机可读介质。

本发明是这样实现的：

第一方面，实施例提供一种用于预测肿瘤突变负荷的核酸组合物，其包括探针组1～9；

其中，探针组1包括用于捕获KMT2D基因的外显子区域的探针；

探针组2～9分别包括用于捕获DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因的启动子及其上游区域的探针。

第二方面，实施例提供一种用于预测肿瘤突变负荷的方法，所述方法包括采用如前述实施方式任一项所述的核酸组合物获取待测样本的肿瘤突变负荷。

第三方面，实施例提供一种用于预测肿瘤突变负荷的设备，其包括存储单元及与所述存储单元电连接的执行单元；

其中，所述存储单元，用于存储预测待测样本肿瘤突变负荷的预测模型；

所述执行单元，用于接收如前述实施方式任一项所述的核酸组合物中的探针组1～9分别获取的对应基因的突变总数，并通过预测模型计算所述待测样本的肿瘤突变负荷。

第四方面，实施例提供一种计算机可读介质，所述计算机可读介质存储有计算机程序，其中，所述计算机程序能被处理器执行以实现如前述实施方式任一项所述的方法的步骤。

本发明具有以下有益效果：

本发明实施例提供了一种用于预测肿瘤突变负荷的方法，该方法包括对目标基因及其区域进行选择限定，通过检测9个基因的外显子和/或启动子及其上游区域，以有效快速地预测待测样本的TMB状态。

附图说明

为了更清楚地说明本发明实施例的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本发明的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。

图1为本发明试验例1中的9个TMB相关基因的线性回归曲线图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚，下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市售购买获得的常规产品。

名词定义

本说明书的“待测样本的肿瘤突变负荷”又称TMB，被定义为每百万碱基中被检测出的，体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。

本说明书中的“探针”是指一小段单链DNA或RNA片段，用于检测与其互补的核酸序列。当将探针与样品杂交时，探针和与其互补的核酸(DNA或RNA)序列通过氢键紧密相连，随后，未被杂交的多余探针被洗去。最后，根据探针的标记物种类，可进行放射自显影、荧光发光和酶联化学发光等方法来判断样品中是否，或者何位置含有被测序列(即与探针互补的序列)。

本发明技术方案的具体实施方式。

其中，探针组1包括用于捕获KMT2D基因的外显子区域的探针；

本申请研究发现，通过对选定特定基因(上述9个基因)或特定目标区域(KMT2D基因的外显子区域和DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因的启动子及其上游区域)的检测和分析，能够快速且有效的预测待测样本的TMB状态，与全基因组或全外显子测序相比，具有检测时间更快，检测成本更低的优点。

需要说明的是，探针组1用于检测KMT2D的外显子区域，是指探针组1包括能够对KMT2D的外显子区域进行继续连续检测、或间隔检测，或对其中的任意部分区域进行检测的探针；探针组2用于检测DUSP22的启动子及其上游区域，是指探针组2包括能够对DUSP22的启动子及其上游区域进行继续连续检测、或间隔检测，或其中的任意部分区域进行检测的探针；探针组3～9依此类推。

在可选的实施方式中，所述KMT2D基因的外显子区域包括区域1～54中的至少一个区域或多个区域的组合。

其中，区域1选自染色体12的第49021778～49021872位碱基的区域。需要说明的是，本申请中“区域1选自染色体12的第49021778～49021872位碱基的区域”是指：区域1为染色体12的第49021778～49021872位碱基或染色体12的第49021778～49021872位碱基中的部分区域。且用于检测区域1的探针包括但不限制为1个，可以是多个探针的组合，只要是用于检测上述区域1的探针均包含于探针组1中，区域2～54依次类推。

区域2选自染色体12的第49022041～49022151位碱基的区域；

区域3选自染色体12的第49022278～49022353位碱基的区域；

区域4选自染色体12的第49022588～49022875位碱基的区域；

区域5选自染色体12的第49024576～49024708位碱基的区域；

区域6选自染色体12的第49024808～49024946位碱基的区域；

区域7选自染色体12的第49026180～49027322位碱基的区域；

区域8选自染色体12的第49027801～49027930位碱基的区域；

区域9选自染色体12的第49028007～49028141位碱基的区域；

区域10选自染色体12的第49028826～49028958位碱基的区域；

区域11选自染色体12的第49029059～49029236位碱基的区域；

区域12选自染色体12的第49029399～49029476位碱基的区域；

区域13选自染色体12的第49030278～49030439位碱基的区域；

区域14选自染色体12的第49030599～49030768位碱基的区域；

区域15选自染色体12的第49030891～49031033位碱基的区域；

区域16选自染色体12的第49031173～49033964位碱基的区域；

区域17选自染色体12的第49034065～49034299位碱基的区域；

区域18选自染色体12的第49034408～49034476位碱基的区域；

区域19选自染色体12的第49034580～49034666位碱基的区域；

区域20选自染色体12的第49034810～49034935位碱基的区域；

区域21选自染色体12的第49037123～49038989位碱基的区域；

区域22选自染色体12的第49039220～49039358位碱基的区域；

区域23选自染色体12的第49039433～49039617位碱基的区域；

区域24选自染色体12的第49039722～49041535位碱基的区域；

区域25选自染色体12的第49041653～49041705位碱基的区域；

区域26选自染色体12的第49041915～49041990位碱基的区域；

区域27选自染色体12的第49042087～49042330位碱基的区域；

区域28选自染色体12的第49042559～49042645位碱基的区域；

区域29选自染色体12的第49042739～49042878位碱基的区域；

区域30选自染色体12的第49043074～49043186位碱基的区域；

区域31选自染色体12的第49043361～49043428位碱基的区域；

区域32选自染色体12的第49043633～49043782位碱基的区域；

区域33选自染色体12的第49043866～49043998位碱基的区域；

区域34选自染色体12的第49044198～49044304位碱基的区域；

区域35选自染色体12的第49044401～49044522位碱基的区域；

区域36选自染色体12的第49044742～49044965位碱基的区域；

区域37选自染色体12的第49045918～49045967位碱基的区域；

区域38选自染色体12的第49046063～49046174位碱基的区域；

区域39选自染色体12的第49046258～49046424位碱基的区域；

区域40选自染色体12的第49046607～49046790位碱基的区域；

区域41选自染色体12的第49047963～49048069位碱基的区域；

区域42选自染色体12的第49048657～49048769位碱基的区域；

区域43选自染色体12的第49049103～49049218位碱基的区域；

区域44选自染色体12的第49049680～49050790位碱基的区域；

区域45选自染色体12的第49050884～49052424位碱基的区域；

区域46选自染色体12的第49052562～49052709位碱基的区域；

区域47选自染色体12的第49052913～49053072位碱基的区域；

区域48选自染色体12的第49053205～49053321位碱基的区域；

区域49选自染色体12的第49053474～49053641位碱基的区域；

区域50选自染色体12的第49053976～49054140位碱基的区域；

区域51选自染色体12的第49054305～49054416位碱基的区域；

区域52选自染色体12的第49054526～49054751位碱基的区域；

区域53选自染色体12的第49054898～49055026位碱基的区域；

区域54选自染色体12的第49055274～49055324位碱基的区域。

在可选的实施方式中，DUSP22基因的启动子及其上游区域选自染色体6的第289100～292460位碱基的区域。

优选地，MYCT1基因的启动子及其上游区域选自染色体6的第152694894～152697893位碱基的区域。

优选地，OR1C1基因的启动子及其上游区域选自染色体1的第247758680～247761405位碱基的区域。

优选地，OR4D11基因的启动子及其上游区域选自染色体11的第59500575～59503574位碱基的区域。

优选地，OR4M2基因的启动子及其上游区域选自染色体15的第22077526～22080525位碱基的区域。

优选地，OR4N4基因的启动子及其上游区域选自染色体15的第22091521～22094429位碱基的区域。

优选地，TMEM132C基因的启动子及其上游区域选自染色体12的第128264402～128268401位碱基的区域。

优选地，ZNF595基因的启动子及其上游区域选自染色体4的第50332～53302位碱基的区域。

在可选的实施方式中，所述探针组1包括探针1～77，探针1～77的碱基序列分别如SEQ ID No.1～77所示。

优选地，探针组2包括探针78～101，探针78～101的碱基序列分别如SEQ ID No.78～101所示。

优选地，探针组3包括探针102～116，探针102～116的碱基序列分别如SEQ IDNo.102～116所示。

优选地，探针组4包括探针117～122，探针117～122的碱基序列分别如SEQ IDNo.117～122所示。

优选地，探针组5包括探针123～131，探针123～131的碱基序列分别如SEQ IDNo.123～131所示。

优选地，探针组6包括探针132～153，探针132～153的碱基序列分别如SEQ IDNo.132～153所示。

优选地，探针组7包括探针154～174，探针154～174的碱基序列分别如SEQ IDNo.154～174所示。

优选地，探针组8包括探针175～197，探针175～197的碱基序列分别如SEQ IDNo.175～197所示。

优选地，探针组9包括探针198～211，探针198～211的碱基序列分别如SEQ IDNo.198～211所示。

本文公开的方法具有优于传统检测肿瘤突变负荷方式的优势，如检测周期和成本，且该方法可以为肿瘤患者的治疗方法提供参考依据。在可选的实施方式中，待测样本可以为肿瘤样本(外周血样本或肿瘤组织样本)、FFPE样品和胸水等，肿瘤组织样本建议进行病理质控，肿瘤细胞含量最好不低于20％。检测中，对照样本可以选择白细胞样本、唾液样本、口腔拭子或者癌旁组织样本等可获取个人全部遗传信息的非癌症组织样本，优选白细胞样本。

在可选的实施方式中，所述方法还包括提取待测样本的DNA，获取待测样本的DNA文库，以用于后续的杂交捕获，或将已经提取自肿瘤样本的DNA文库(DNA片段)作为待测样本。

在可选的实施方式中，获取待测样本的肿瘤突变负荷包括：采用预测模型，基于所述核酸组合物中的探针组1～9分别获取的对应基因的突变总数，计算待测样本的肿瘤突变负荷；

优选地，所述预测模型的公式为：TMB＝3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595；

公式中，KMT2D为KMT2D基因的突变总数；DUSP22为DUSP22基因的突变总数，以此类推。

在可选的实施方式中，所述突变总数的获取方法为：通过对探针组1～9中的1组或多组获取的捕获片段进行测序比对，获取捕获片段对应目标捕获区域的突变总数(本文中的突变总数是指点突变的总数)的数量。需要说明的是，每组探针组获取的捕获片段的突变总数，即为对应基因的突变总数。

在可选的实施方式中，在计算肿瘤突变负荷前，所述方法包括采用探针组1～9对待测样本的基因组文库进行杂交捕获，杂交捕获后，对探针组1～9捕获的片段进行分离、纯化和扩增，经测序比对后，获取目标区域的突变总数。

在可选的实施方式中，所述方法还包括所述方法还包括根据TMB值进行判读：当TMB值大于或等于10时，判读待测样本为TMB-H状态，当待测样本的TMB值小于10时，判定待测样本为TMB-L状态。需要说明的是，根据“TMB值”是指预测模型计算的数值。

存储单元可以是但不限于，随机存取存储器(Random Access Memory，RAM)，只读存储器(Read Only Memory，ROM)，可编程只读存储器(Programmable Read-Only Memory，PROM)，可擦除只读存储器(Erasable Programmable Read-Only Memory，EPROM)，电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory，EEPROM)等。

执行单元可以是一种集成电路芯片，具有信号处理能力。该执行单元可以是通用处理器，包括中央处理器(Central Processing Unit，CPU)、网络处理器(NetworkProcessor，NP)等；还可以是数字信号处理器(Digital Signal Processing，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件和分立硬件组件。

在可选的实施方式中，所述预测模型的公式为：TMB＝3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595；

在可选的实施方式中，所述设备还用于根据TMB指进行判读，当TMB值大于或等于10时，判读待测样本为TMB-H状态，当待测样本的TMB值小于10时，判定待测样本为TMB-L状态。

需要说明的是，本实施例提供的计算机可读介质等同于前述实施方式中的存储单元。本实施例中的“处理器”等同于前述实施方式中的“执行单元”。

以下结合实施例对本发明的特征和性能作进一步的详细描述。

实施例1

本实施例提供一种用于预测肿瘤突变负荷的核酸组合物，其包括探针组1～9。

具体地，请参照表1，所述探针组1包括序列分别如SEQ ID No.1～77所示的探针1～77，探针组2包括碱基序列分别如SEQ ID No.78～101所示的探针78～101；探针组3包括碱基序列分别如SEQ ID No.102～116所示的探针102～116；探针组4包括碱基序列分别如SEQ ID No.117～122所示的探针117～122；探针组5包括碱基序列分别如SEQ ID No.123～131所示的探针123～131；探针组6包括碱基序列分别如SEQ ID No.132～153所示的探针132～153；探针组7包括碱基序列分别如SEQ ID No.154～174所示的探针154～174；探针组8包括碱基序列分别如SEQ ID No.175～197所示的探针175～197；探针组9包括碱基序列分别如SEQ ID No.198～211所示的探针198～211。

表1核酸组合物

实施例2

本实施例提供一种用于预测肿瘤突变负荷的方法，其包括以下步骤。

(1)样本采集

待测样本可以为肿瘤样本(外周血样本或肿瘤组织样本)、FFPE样品和胸水等，肿瘤组织样本建议进行病理质控，肿瘤细胞含量最好不低于20％。检测中，对照样本可以选择白细胞样本、唾液样本、口腔拭子或者癌旁组织样本等可获取个人全部遗传信息的非癌症组织样本，优选白细胞样本。(2)DNA提取

使用DNA提取试剂盒进行DNA提取，DNA质量应不低于10ng，260/280吸光值在1.8～2.0之间，组织样本主要DNA片段分布应不低于200bp。

(3)文库制备

文库制备包括4个主要过程(末端修复、加A、加接头和文库扩增)，两端接头含有6～12bp的随机分子标签，用于分子校准，接头为Illumina、ThermoFisher或BGISeq等测序平台中的任意一种。需要说明的是，ctDNA样本(循环肿瘤DNA)可直接进行建库，组织样本需进行片段化，使其长度集中在200～500bp左右，再开始建库步骤。

(4)杂交捕获

采用实施例1提供的探针1～211对制备好的全基因组文库进行探针捕获，探针的序列和捕获的区域详细参见表1所示。

以Agilent SureSelect Fast Hybridization试剂盒为例，杂交开始时将步骤(3)制备的预文库(片段化的DNA)轻弹混匀后瞬时离心，冰上放置融化。融化后加入水稀释，使之浓度不超过83ng/μL。每12μL预文库中加入5μL Low Input Blocker Mix，混匀后放入PCR仪中按照表2所示的杂交程序反应。

表2杂交程序

备注：13μL杂交液的成分包括：2μL 25％RNase Block，6μL Agilent SureSelectFast Hybridization Buffer，2μL探针溶液(实施例1中的探针1～211)和3μL水。

(5)磁珠捕获

准备捕获试剂，按要求平衡室温、混匀。按样本数量准备PCR管，标记Cn。涡旋磁珠1min以上，充分混匀后按每反应50μL的量将磁珠装入合适的离心管中(离心管容量需大于磁珠体积的5倍，可分装多管)，取出的磁珠按以下步骤进行洗涤。

每50μLT1磁珠加200μL Binding Buffer(结合缓冲液)，涡旋8s充分混匀，将离心管放置在磁力架上5min，待溶液澄清后吸弃上清；重复上一步骤2次，共洗3次；每反应(50μL磁珠原液)加入200μL Binding Buffer，涡旋1min以上充分重悬磁珠；按样本数量准备1.5mL或0.6mL离心管，标记Cn。并将重悬好的T1磁珠按200μL每管分装到Cn管中。

取出步骤(4)得到的杂交产物Zn，瞬时离心后全部转移到含T1磁珠的Cn管中(检查每管Zn液体损耗不超过4μL)。震荡混匀，放置到恒温混匀仪上，室温1600rpm(在其他实施例中，可以为1400～1800rpm)混合30min(混合15min时取出离心管涡旋混匀一次)。用合适规格的离心管分装，每反应1.3ml Wash Buffer 2(清洗缓冲液)，然后放到70℃3h的PCR仪上预热，热盖105℃(如PCR仪不能预热足够的试剂，则可使用70℃恒温金属浴或水浴锅预热)。混合结束从恒温混匀仪上取下样本，瞬时离心后放到磁力架上，待溶液澄清，去除上清。将样本管从磁力架上取下，每管加入200μl Wash Buffer 1，吸打15-20次或涡旋5-10s混匀，并转移到标记Cn的PCR管中。将PCR管放置在磁力架上1min，待溶液澄清，去除上清。将样本管从磁力架上取下，按以下步骤洗涤磁珠：

a.样本管加入200μL 70℃预热的SureSelect Wash Buffer 2，盖上管盖涡旋8s混匀，瞬时离心(注意不要使磁珠沉淀)；

b.将步骤a得到的样本管放在PCR仪上70℃孵育10min；

c.将步骤b的样本管取出放置在磁力架上室温静置1min，待溶液澄清，吸弃上清。

d.将a到c步骤再重复5次，共6次。

最后，将样本管短暂离心后置于磁力架上静置1min，用10μL移液器吸弃剩余液体。向每个样本管加入25μL水，盖上管盖涡旋8s混匀，瞬时离心(注意避免磁珠沉淀)，把样本(捕获文库)置于冰上待用。

(6)捕获文库的扩增

准备终文库扩增试剂，按要求解冻、混匀、瞬时离心。取出步骤(5)获得的捕获文库Cn，涡旋重悬磁珠，瞬时离心后，冰上放置备用，并按照表3配置扩增反应液。

表3文库扩增反应液

将按照表3配置好的反应液与25μL步骤(5)的捕获文库混合后(总体积50μL)，放入PCR仪，按照表4所示的扩增程序进行PCR反应。

表4扩增反应程序

(7)产物纯化

提前将XP磁珠从冰箱中取出放置室温平衡30min，涡旋1min以上充分混匀，按样本数量准备1.5mL离心管，标记PCn；往PCn离心管内加50μL已混匀的XP磁珠。将步骤(6)获得的PCR产物放置磁力架上2min，待溶液澄清后，将全部上清(约50μL)转移到分装好的50μL磁珠中，吸打5-8次混匀，盖上管盖涡旋5-10s混匀；室温孵育5min，短暂离心后放置磁力架上吸附磁珠5min至液体澄清，吸弃上清；加入200μL 80％乙醇，盖上离心管盖，在磁力架上顺时针旋转离心管8次，每次45°，将离心管转回原位置，快速吸弃上清；重复上个步骤两次；将样本管瞬时离心后置于磁力架上，吸弃管底余液；磁力架上开盖晾干至磁珠表面哑光，加入25μL水洗脱，涡旋混匀，室温孵育5min，瞬时离心。样本管置于磁力架吸附磁珠5min至液体澄清，收集全部上清于对应标记Lib-样本条码的低吸附1.5mL管中，管身标记对应样本条形码及检测批次。放置冰上进行下一步质检，或将产物放置于-20℃保存。

(8)上机测序

将步骤(7)获得的纯化产物进行测序，测序可以为单端测序或双端测序，单条模板测序总读长应不低于2×75bp，测序深度在2000×以上；具体步骤应使用文库试剂盒和测序仪生产厂商的推荐流程。

数据处理

使用FastQC检测测序数据质量；使用Trimmomatic去除平均测序质量小于28的reads，去掉长度小于74bp的reads(读长，为高通量测序中一个反应获得的测序序列)；使用bwa，或者与之相当的软件将测序结果map至人类基因组参考序列；使用GATK BestPractices Workflows其中的Data pre-processing流程得到处理完毕的BAM文件；使用GATK mutect2检测肿瘤样本的突变总数；使用GATK FilterMutectCalls过滤掉突变reads支持数小于3的变异，得到用于计算TMB的VCF文件。将获得的VCF文件经过oncotator软件注释，得到maf结果文件，在此文件中，首先去除在Hugo_Symbol列中不属于DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595九个基因名称的条目。

然后，对于KMT2D基因，过滤出(选择)在Variant_Classification列为“Missense_Mutation”的条目，得到KMT2D基因点突变的数量，即KMT2D的突变总数)。

对于其他基因(DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595)，过滤出(选择)在Variant_Classification列为“5’UTR”和“5’Flank”的条目，条目的数量即为这些基因在启动子和启动子上游区域的突变的数量(即每个基因相对应的突变总数)。

(9)TMB的计算

采用预测模型，基于探针组1～9分别获取的9个TMB相关基因(KMT2D、DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因)的突变总数，计算待测样本的肿瘤突变负荷。

预测模型为：

TMB＝3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595；

设定TMB的阈值为10，当待测样本的TMB值大于或等于10时，判定样本为TMB-H状态，当待测样本的TMB值小于10时，判定样本为TMB-L状态。

试验例1

采用实施例1提供的核酸组合物，按照实施例2提供的用于预测肿瘤突变负荷的方法，针对109个已知TMB状态的肺鳞癌样本进行验证，验证结果如附图1和表4所示。

由图1为9个TMB相关基因的线性回归曲线，所得线性回归结果的R²(确定系数)在0.8以上(图1)，Cutoff＝10为界限，设定样本的TMB值在10以上为TMB-H状态，低于10为TMB-L状态。由图1可以看出，对于109个验证样本，落在预测正确区域的有94个样本，对于两个预测错误区域，在左上为11个样本，右下为4个样本。由此可绘制表4

表4预测结果

由表4可以计算出，灵敏度＝真阳性人数/(真阳性人数+假阴性人数)ⅹ100％＝31/35ⅹ100％＝88.6％

特异度＝真阴性人数/(真阴性人数+假阳性人数)ⅹ100％＝63/74ⅹ100％＝85.1％。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

SEQUENCE LISTING

<110> 中国医学科学院肿瘤医院

<120> 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备

<160> 211

<170> PatentIn version 3.5

<210> 1

<211> 120

<212> DNA

<213> 人工序列

<400> 1

tgtggtgaca gttgggggca atgccctcat catgctggct gtggcctcta gtcggacact 60

gcacccacca atgtacttct tcctctgcca cttctccctg ctggagattg gctatacctc 120

<210> 2

<211> 120

<212> DNA

<213> 人工序列

<400> 2

atctgctgcc cccttcacta tcctgccctg atgagcacct ggttttgtca ctgcctggcc 60

gctggtgctt ggttcagtgg cttcttctcc tctgccttca ctatggccct ggcagcacct 120

<210> 3

<211> 120

<212> DNA

<213> 人工序列

<400> 3

agcatctcag gcttcctgac actggccgcc ttcctactga ttgtggcatc ctctgccttc 60

attgagggct gtactgcaaa taccctcagg ccatgagagg cagaaagcct tcttcacctg 120

<210> 4

<211> 120

<212> DNA

<213> 人工序列

<400> 4

ctcaagaacc aagaggtgaa gggggctctg cataggctca ggggacagct catcccagga 60

cacactcact aaggaggaca ggacagcttt tgacttcttc ctggattgat ttcagcttag 120

<210> 5

<211> 119

<212> DNA

<213> 人工序列

<400> 5

ccccttcctc aaagtctgat ggactagaga ccactgcaat aaaaagatgg agactgtggg 60

attgaaaatg gatgtctacc aaaatgaggt aactgtattt tccaattgga attggcctc 119

<210> 6

<211> 120

<212> DNA

<213> 人工序列

<400> 6

gtgagccact gcacccggcc tcaactcagt cttaaaaatg gattttcatt tcagatagca 60

ctagtacagc ataagttatg tctcatcttt cccatggcct attggatgac ctctcatcat 120

<210> 7

<211> 120

<212> DNA

<213> 人工序列

<400> 7

ggagcactct cccttttcta tccatacctt ttgctctctc tgacacaggg atctgcttgg 60

ttcagtgtga gagtaatttg aacacccagg cctttaatgg aaaaaactgc tgatggcagt 120

<210> 8

<211> 120

<212> DNA

<213> 人工序列

<400> 8

taaatacctg accagctgta agctgtgaga ctgtttaaac atggctcttg gagaaggtag 60

cccagaagat ggggtaattt ctcaaggttc tttgaagttc tgaatcttcc cccatctctg 120

<210> 9

<211> 120

<212> DNA

<213> 人工序列

<400> 9

cctccaaaat aaaagttact caagttcacc tgtctcaagc agaatgctta aggactgggt 60

caagatggag cctttcctac atgatataaa cagctggata tcccattctc tccaagccca 120

<210> 10

<211> 120

<212> DNA

<213> 人工序列

<400> 10

ccactgaagt ttcctatatc tcctctggaa agatgattaa ggaaaattat tgtctcagaa 60

attcctgagg gtcatccaga ttgggctaaa attgacagct gaatatggca ttctagatgc 120

<210> 11

<211> 120

<212> DNA

<213> 人工序列

<400> 11

tagctctcaa aatgccagct cttataaaat tcatttattg gagagggtta atcttattct 60

ccatcaccag aaggagactc aagaggaaac agaaggaaat tgtgggagag gtttgattta 120

<210> 12

<211> 120

<212> DNA

<213> 人工序列

<400> 12

cagacaggga aagattggca gaatatcagg gtgatgagct tagggaaata actaaactgc 60

tgtaagaaag tcccaaaaat atggtgctag acatttattt gtctctcaca atagtctaag 120

<210> 13

<211> 119

<212> DNA

<213> 人工序列

<400> 13

atgggtagac aggctccttt attccacaaa gacattcaga aacccaggtt ctttccattt 60

tgcatctcca ccattctctt tattaaaata tattttattt attttttatt ttatttatt 119

<210> 14

<211> 120

<212> DNA

<213> 人工序列

<400> 14

gtgagccacc atgcctggcc actttacgtt ttactttgga atgtggcatc tgtctattgt 60

ctttaggact cagctgaaac taaaatgaaa agcgtttctc attttatctc ctgattcatt 120

<210> 15

<211> 120

<212> DNA

<213> 人工序列

<400> 15

gttttacttt ggaatgtggc atctgtctat tgtctttagg actcagctga aactaaaatg 60

aaaagcgttt ctcattttat ctcctgattc attgtctttt aacagtttat aaagcacttt 120

<210> 16

<211> 120

<212> DNA

<213> 人工序列

<400> 16

aaaaaaaaaa aaaaaaagaa ttctgtcccc tccttgggta gaatgaatta ttattcccaa 60

ttccttacct cctacgtcag tgtgatcttc cagaccacac ataggacaga gtattatttc 120

<210> 17

<211> 119

<212> DNA

<213> 人工序列

<400> 17

tctaatgcaa ctcctttctg ctccctacat aaaatcatca aagttgagag tgcatacata 60

tttttttgta gatgtttact ttgcacttaa gaaataaggc caggcacagt ggctcatgc 119

<210> 18

<211> 120

<212> DNA

<213> 人工序列

<400> 18

aaaaaaaaga aagaaagaaa agttaattct tttgtttggg acacttcttt taacagagct 60

ttggatgtgg agtgttttca ttcaatccta gaagcacaac attgttcttt ttagtctttt 120

<210> 19

<211> 120

<212> DNA

<213> 人工序列

<400> 19

agcaagacat gaacttttct gcccatttaa aaaaacaaaa caaaaagcag tagcagaggt 60

aacagtggac ttttttgatc atccccaaat ctggatgtaa attggacttt gaagcagttt 120

<210> 20

<211> 120

<212> DNA

<213> 人工序列

<400> 20

gcctcagagc gctgaattca aacacatgtc ctaaaaactt gacctacctt tttttaatgc 60

tgcatccaaa gagcaagtgc agagggaagg gggctacact aaaagaaaag caagcaatca 120

<210> 21

<211> 119

<212> DNA

<213> 人工序列

<400> 21

acaggaaaaa ctgccattcc atacagaagt aatgctttga tcttccactg tattatttta 60

ttgaaagcca ataagctttc tttattagga aggagatgct gggcacggtg gctcacgcc 119

<210> 22

<211> 120

<212> DNA

<213> 人工序列

<400> 22

aaaaaaaaaa gaaaaggaaa ggaaaagaag gaaggagatt aggaaagatt aggcttgttg 60

ctctcatttt tgttccagca acactgacct cacggttaaa ggggaaaaaa agaaaatcct 120

<210> 23

<211> 120

<212> DNA

<213> 人工序列

<400> 23

tcaataaagc tgttaaaaaa taaaattggt aacagtcaac cacaaataag acaataaaat 60

ataaatctca aaattgctct atggctaaag agaaagaggt ttgactaaaa ctttgagtta 120

<210> 24

<211> 120

<212> DNA

<213> 人工序列

<400> 24

aaaactttga gttatatcca atgaatgtgg aataaacaca ttacaagaat atgaactcat 60

atggggcaca acgtaaaaat tatctcattg atgaatctat ttgcattctt atgccagctc 120

<210> 25

<211> 120

<212> DNA

<213> 人工序列

<400> 25

gtaaaatgga gataattata taacaatgcc tggcacatgc aagcactaac tgtaagctga 60

taattacaca aaccagtaat agcagtagtg actctttcag ttctggcaat ctatggccta 120

<210> 26

<211> 120

<212> DNA

<213> 人工序列

<400> 26

tcagttctgg caatctatgg cctataacca atcccaaagg atatgaggtt tatatgtcca 60

gtgaattcta gaaacaacaa ttcaacagga agaaaaatac cctacagttt ttggatgagg 120

<210> 27

<211> 120

<212> DNA

<213> 人工序列

<400> 27

ataccctaca gtttttggat gagggcaaaa taaggagtca gacaaccaga aaggagtcct 60

aaatagctgt gacaaagggt cagacacagg aaggcaggca ttctcatagc agtaggtcct 120

<210> 28

<211> 120

<212> DNA

<213> 人工序列

<400> 28

ggcattctca tagcagtagg tccttccact tcctccacta ctttacattt catggtaagc 60

ccatcccaac tttacccgag cccctccagg agtgagaaca ctctctccca tacaggttcc 120

<210> 29

<211> 120

<212> DNA

<213> 人工序列

<400> 29

aacactctct cccatacagg ttcctgctgc taagtggctc acccagtctg atcatggtac 60

cacttttatt agatttttct actaattatt caatgcaaat atacaccagg cactacacag 120

<210> 30

<211> 120

<212> DNA

<213> 人工序列

<400> 30

cttggaaaga aatggttaga gaaatgcatt ggtaaaatgt gattggtgtc agggaccttg 60

ggatgctgct tccagcagct caaaacccca ccactgagat tctgctgaac agaattcttc 120

<210> 31

<211> 120

<212> DNA

<213> 人工序列

<400> 31

catctagagg gaacctgagt ttctgtactt catgatgctt tttcaagcag atctagaggc 60

tacagacact cctaacaatg ggtgatgtgt cactgataaa tgactaggga ctgggagcag 120

<210> 32

<211> 120

<212> DNA

<213> 人工序列

<400> 32

acttttcctt cttcaccagg ttactggggc ccaactgagc tggctgagga gtaacccctg 60

cccctttaca gtgcctcatc cgtcacaggt tgtttctcct ccacctttcc acctctgtgc 120

<210> 33

<211> 120

<212> DNA

<213> 人工序列

<400> 33

tctccgagtg tagggagatt tccccaacct tagaggtccc ctcaagaggg tactgtctcc 60

ctagtcccct cttgtcactg cagccatggt ggcctatgca gacttgggcc agaggggaca 120

<210> 34

<211> 120

<212> DNA

<213> 人工序列

<400> 34

gacagatcct ggtctgaagg cagacttttc cccagactac agtaaaactg actgttgcac 60

catgcttcag ctttgtgtcc agcatttttt ctgcagctga agacagtgac aacaagctag 120

<210> 35

<211> 120

<212> DNA

<213> 人工序列

<400> 35

atgttatgtg gtgcatgact atatgcttta ggtagcatgt gggtgcaaaa tgagttactc 60

cacactaaga cttgtataaa acacatgcaa agttacttta aaaatataaa acagccctag 120

<210> 36

<211> 120

<212> DNA

<213> 人工序列

<400> 36

aacacatgca aagttacttt aaaaatataa aacagcccta ggccaagatt tgactgaaac 60

atttattgat attaacattt tcttttggtt tgtgtgtgtt ttcttttttt taagaggtag 120

<210> 37

<211> 120

<212> DNA

<213> 人工序列

<400> 37

gtgagcctcc atacccagcc agtttgtgta tttttgatag ccctagcata accttttggt 60

ctcctagggt aacgcagcta agagtcagac gattctggct cacaaaatct caggatagta 120

<210> 38

<211> 120

<212> DNA

<213> 人工序列

<400> 38

attctggctc acaaaatctc aggatagtat attactgtat aatagctgct ggacaccatg 60

aaaaatagga catggtccaa agtgtccccc caccaccctt ttctttcttt gagacggagt 120

<210> 39

<211> 120

<212> DNA

<213> 人工序列

<400> 39

gtgagccacc acacctggcc ccaaaggatc cattttttaa cacacacaca ctggttgcag 60

aaaacgacat tcccattaca tcatttccac ccttttacta ttaccatgac attcaagggt 120

<210> 40

<211> 120

<212> DNA

<213> 人工序列

<400> 40

attaccatga cattcaaggg taataaagga agaagcctga tactgcaacc ttatacctca 60

ttcagagcct ctagtcaaag tcacttccct acctgtttct tgtcacctgg gcatcctaag 120

<210> 41

<211> 120

<212> DNA

<213> 人工序列

<400> 41

ttgtcacctg ggcatcctaa gacattttgc tccacaagtt agcatgtggg aattccctcc 60

atgcctgtca tcaacaaatc aaaagaatat catagagttg acctatcaac aagtgaaagg 120

<210> 42

<211> 120

<212> DNA

<213> 人工序列

<400> 42

gacctatcaa caagtgaaag gtaaggggat gagcattcta aaacaaagga gtacaaactg 60

ttactaggtc cagtgtttga gataatgaaa atctacaggc ttatattttt gtaaacagga 120

<210> 43

<211> 120

<212> DNA

<213> 人工序列

<400> 43

tacaggaaga aaatgggtgg ccatgaattg atgtcagaag aaactatcca agaaggcaac 60

aaaaagatga aaaatttcca tgtaagaggt atagagtaag aagatattta gcacagattt 120

<210> 44

<211> 120

<212> DNA

<213> 人工序列

<400> 44

aaggcaacaa aaagatgaaa aatttccatg taagaggtat agagtaagaa gatatttagc 60

acagatttaa tcagaatctc agagggagac agaagattct ggcttggact tccagaacaa 120

<210> 45

<211> 120

<212> DNA

<213> 人工序列

<400> 45

aattcaaacc ccatgtactt ggctacattt cagtttcctt ttcaaataaa tctaagaatg 60

gctggagaat agcctgtaag agaaagaaca tttcaggatg actgcccata gataaatatg 120

<210> 46

<211> 119

<212> DNA

<213> 人工序列

<400> 46

gccatgctga agcagctggt tgttttgttt tttcctgaca acaatgaggt gtaactgaag 60

gctaggggtt gccataagca gtgagagaca ggataaagtt ttcaagatca ttctggctg 119

<210> 47

<211> 110

<212> DNA

<213> 人工序列

<400> 47

tagtcagatc acatctcaaa tataaacaca cacataaata aaaagtaatg tttgtctttg 60

tggataaagt ataaaatgca ctagactagg ctaggcatgg tggctcacac 110

<210> 48

<211> 120

<212> DNA

<213> 人工序列

<400> 48

aaaaaaaaaa aaaaaaaaaa gtactagact agagaatcaa aaaagcagtg ggaactacaa 60

acttaaaaag agtatcactg gaagacccag taaaggcaat ctccccagtg gttcatctga 120

<210> 49

<211> 120

<212> DNA

<213> 人工序列

<400> 49

tgggcctttt atgagttact ttcaaccatt ctctgaatgt aaatgcttaa agttaagatg 60

atggtataac tgtaagccat tctgtgccca tttcagttct tatagaaagt aatcttttgc 120

<210> 50

<211> 120

<212> DNA

<213> 人工序列

<400> 50

tttctagcat aggtacctca accctaactg aacttctatt ttaatcctgc tctaagattc 60

agtgtcaaaa cgatcttgac aatacctatc tatgtctatc ttagtgatcc agcatcaggc 120

<210> 51

<211> 119

<212> DNA

<213> 人工序列

<400> 51

ccaatttctc tatgttttaa gtatattcct accactagag aattctgaga tggtattagc 60

attatttttt taaaaataat tatttaaaat ttaaaaatat agacacaggg tctcaccac 119

<210> 52

<211> 120

<212> DNA

<213> 人工序列

<400> 52

ccctgttaaa agaaataaag gcacttcagt tagtaattca ttcactgtgg tctgaagtat 60

gaatctgact tatcagtggc cacttaaact agcaataaga acaatacaac agaaattaat 120

<210> 53

<211> 120

<212> DNA

<213> 人工序列

<400> 53

tctagcaggg aaccctctgc ctggccaggt cactacatga gggaaacagg tgggactgtt 60

cttcacttgc caaaatatcc actgggtctt cagcaatttc tttgactaaa tgatcttcaa 120

<210> 54

<211> 119

<212> DNA

<213> 人工序列

<400> 54

caacaaatga aacaagatcc aaaagcactg agagcttttg ctgccaagtg taaaacatag 60

accaatacag tagattaaaa aacaaaattc tggccaccac acctctaatc ccagcactt 119

<210> 55

<211> 120

<212> DNA

<213> 人工序列

<400> 55

ttttactaca attaaaaaaa tattttttaa aaaagcatat tctctgaggc tacctgtaat 60

gaacatgtaa gttcaccagt gattaattta aatatgaaca atgctacgtt aaaattaaat 120

<210> 56

<211> 120

<212> DNA

<213> 人工序列

<400> 56

tacgttaaaa ttaaatattg ctgggtaata caagattgcc tgattaatat cctaacagcc 60

acaaagcaag caaacaagct ccaacaaggg aaagggagaa ggtaggaaga aaggaaggac 120

<210> 57

<211> 119

<212> DNA

<213> 人工序列

<400> 57

ggaagaaagg aaggacaaca gaaaactcac agttcctctg aatggctagg aaatattatt 60

ttggttaagt ccctatcccg acagagcaac aacctggttt tttttgtttt gtttttttt 119

<210> 58

<211> 120

<212> DNA

<213> 人工序列

<400> 58

aaaaaaaaaa aaaaaaaaaa tgacattaca ttctagacta tgtttcttcc aactgaattg 60

gcaattcgca ctggaatact gaatagccaa cagaccacaa ggaagacatc actcttagct 120

<210> 59

<211> 120

<212> DNA

<213> 人工序列

<400> 59

cctgtttgaa accaacagct acagcaaacc attggtcttg attcagggcc taaggcaata 60

caaactcaaa caatatatca aactaacttt catgccactg cttttcaaga gtctggtgct 120

<210> 60

<211> 120

<212> DNA

<213> 人工序列

<400> 60

aaattctcct tcttcctaag aattaaaaat atccaggagg tttgtacccc cctatgttta 60

atccagttta tagatgctcc gtgtttctat tcatctagct tcacgagaag cttagttcta 120

<210> 61

<211> 120

<212> DNA

<213> 人工序列

<400> 61

cgcttttaaa taaatctaag aatttgcaat cctttcccat ttgttggtgt gctaatcacc 60

aaaaatgaga atcacaacat cttcacatta aagaatatat ataattttaa aatctactta 120

<210> 62

<211> 119

<212> DNA

<213> 人工序列

<400> 62

ttcccatttg ttggtgtgct aatcaccaaa aatgagaatc acaacatctt cacattaaag 60

aatatatata attttaaaat ctacttaaag ctgctcaggc cgggtgcagt ggctcacgc 119

<210> 63

<211> 120

<212> DNA

<213> 人工序列

<400> 63

aaaaaaaata ataaaataaa gctgctcaat ttaagcagaa acatagggca caggatacac 60

tcaacctacc attcattttc aggtgagttg gaaacttctg tactacccac agaaaccagt 120

<210> 64

<211> 120

<212> DNA

<213> 人工序列

<400> 64

ggtgagttgg aaacttctgt actacccaca gaaaccagtg ttctcacacc attaagacta 60

taaatctgtt ttctcccatt cttttactat gtgcaatttg tgtgtgtgtg tgtgcgtgcg 120

<210> 65

<211> 120

<212> DNA

<213> 人工序列

<400> 65

gagcgagact ctgtcaaaaa taataatgac tagcttggaa ttatttaaac actgaatcaa 60

aaggcatcta aatctcaaga taataatgga atgtgtatgt tttcagaaaa ggcttttctc 120

<210> 66

<211> 120

<212> DNA

<213> 人工序列

<400> 66

aataatggaa tgtgtatgtt ttcagaaaag gcttttctca tatatacaaa gggttgtctt 60

ttataagatt ttaaactggg aaaaggatcc taaaataaga aaatcagcaa aaatgcctat 120

<210> 67

<211> 120

<212> DNA

<213> 人工序列

<400> 67

aaaggatcct aaaataagaa aatcagcaaa aatgcctatt aaaacaggag tgttttaaaa 60

attgaagtat caggatataa agagaatcca tgttttcagc tgggcgcgat gtctcatgtc 120

<210> 68

<211> 120

<212> DNA

<213> 人工序列

<400> 68

ataaagataa aataagagaa tccacgtttt gttactatct ccaaaaccag caatagagaa 60

tgagagagaa ggaactcaaa agtagtaaga ttaaggtgtt aagttactac ttgccaacca 120

<210> 69

<211> 120

<212> DNA

<213> 人工序列

<400> 69

tccttgcatc aaagcacaga aaacaagcaa atatccagaa tgaacggctg tgtttttact 60

catattaata tctgatgcct agtcttcccg caagtaaaat caccaaagtt atcattaaca 120

<210> 70

<211> 120

<212> DNA

<213> 人工序列

<400> 70

ctaaaaaggt atgggaagag tctggaaaaa aatataaggt agggtagatt tctctaaatg 60

aatatgctaa catataaata caactatacg tatatatcac ttcaaaaact ttgtcgattc 120

<210> 71

<211> 120

<212> DNA

<213> 人工序列

<400> 71

tcctaaccac aaagactaac ctattctcac cattaataaa taaggctttg tctcaagggc 60

ctgaaccaaa gcagagcttc tctaacttac atcactgaac tccagaggta aactctcagt 120

<210> 72

<211> 120

<212> DNA

<213> 人工序列

<400> 72

gggatcctca gagaggctta caggaacagg tttgttgcag ggtacctctt cagatccctg 60

gcagcacttg aagagaacct gattcgtatc ctgacaaata tctgtagaaa aatggtcaag 120

<210> 73

<211> 120

<212> DNA

<213> 人工序列

<400> 73

catttgatac agaataccaa atgcagttag caatttttaa agttacttct caaaataaat 60

gtcatttact agcatcaaat tctagctcta ccagtaattt aaaacttgtc cccaacctcc 120

<210> 74

<211> 120

<212> DNA

<213> 人工序列

<400> 74

ttttcaggat cctggtcatt taaactagac accatcccat tctcccttaa gcaagtagca 60

gtaacactcc taggaacaca cacatattca gaagaaacat gtagtggcaa atgcaaatag 120

<210> 75

<211> 120

<212> DNA

<213> 人工序列

<400> 75

aacaatttct tggacctcgt ttccaaagat gattacatga taaattcatt taaagcacca 60

ctggaatagg gggaaacaga gctctagtaa aagtcactag gtatcatatc ctaacaagaa 120

<210> 76

<211> 120

<212> DNA

<213> 人工序列

<400> 76

attaaatata catgcctttt ttttttaggg gagtgtgcta gtacagagga atccttttat 60

gatcctaaag gaagaagaaa attttgtgta tgaaggccca ttgaaaaaaa aaagtattct 120

<210> 77

<211> 120

<212> DNA

<213> 人工序列

<400> 77

aagtgctacc atttcttgaa atctgttaac tacctggtta tcttcctaga ttaataaaca 60

ttattttaaa atttgactta tttttaacca gaaaacacaa tttttcttaa actgatagta 120

<210> 78

<211> 120

<212> DNA

<213> 人工序列

<400> 78

gccgaggttg agaaaccctg gactgcaata tgttcaagag gccagtgaag attacataat 60

tacttctctg ttggatagag gttaatcttg atgctctgaa attatcacta acacctataa 120

<210> 79

<211> 120

<212> DNA

<213> 人工序列

<400> 79

taatgatttg gctaactcta atggttgagc ttctgcttgc gggcttttaa acaccgccac 60

cttaaagttt aaggttactg ctcactaaat acactattaa ccagttatcc ttaaccatgt 120

<210> 80

<211> 120

<212> DNA

<213> 人工序列

<400> 80

tgtgtaagta tggactcagc tatcctacac actctgtaga ccattcctta ttgtgcacac 60

atgaaggctt gacttctttc ggagttgttg ccaaaatttg tgatgttggc agaactgaga 120

<210> 81

<211> 120

<212> DNA

<213> 人工序列

<400> 81

agaggaagaa aataacaaga agaaaagtgg aagtaaaaat cttacatagt gtgaaaatcc 60

accaggcttg tgatgcctta aaatttttat gagtgagata aagcacaaat gaatagagat 120

<210> 82

<211> 120

<212> DNA

<213> 人工序列

<400> 82

gattctacta tggatgtgaa atacgccagc tttgttgaag tgtttccctt cttcctttct 60

ttccataatc aagagctaga gagtaaaagt catagaactg caagacatga acaactggga 120

<210> 83

<211> 120

<212> DNA

<213> 人工序列

<400> 83

ggaattatta ttgtaataaa gagaggtgtt cagggttagg gtggaggaga gtacagcaag 60

tctcttgtgg gaaacccccc aaccccacag aatcaataat tttttttttt ttgagacgga 120

<210> 84

<211> 120

<212> DNA

<213> 人工序列

<400> 84

ttgagccacc acgcccagcc aaaaccaata attttttttt ttttaaatct tactcttctg 60

acttctggtg ttaatagtct cctcttttcc tatttaaccc aaaagaaaaa tttgagattt 120

<210> 85

<211> 120

<212> DNA

<213> 人工序列

<400> 85

tatttaaccc aaaagaaaaa tttgagattt tgataggaac tctgggcatg tggacctttt 60

aggccatact gaatgctgat tttgacggta aggaggaagc catggcaggt tctgagttta 120

<210> 86

<211> 120

<212> DNA

<213> 人工序列

<400> 86

aggaggaagc catggcaggt tctgagttta gggggaaaag cagatggtcc aagctggaga 60

aatatatcta caagaagagt atgaataaga gagaaatatt gcaagtggat gacagaagaa 120

<210> 87

<211> 120

<212> DNA

<213> 人工序列

<400> 87

gagaaatatt gcaagtggat gacagaagaa aaaaatcagt atgaatttgt cattcatggt 60

caagtaccag tttatgaact ggttgtgttc ttaaacgttc atctgactgt tggatgaatg 120

<210> 88

<211> 120

<212> DNA

<213> 人工序列

<400> 88

ttaaacgttc atctgactgt tggatgaatg gcccaaggag ggcagaaggc tgcagaagta 60

attcattggt tgctggatag aagcttcaaa aattcacagt ttaatgctct tgttttaaag 120

<210> 89

<211> 120

<212> DNA

<213> 人工序列

<400> 89

ctgggattcc ccaggcagtc cactaacgat tctgtgttgt ctctaagcag gaaggtggta 60

aaaacagtta cttaatggca gtgtgtggca gaggggaaag ggcaggctgt ccaggtgact 120

<210> 90

<211> 120

<212> DNA

<213> 人工序列

<400> 90

gcaggctgtc caggtgactg agaagcaggc gggagaagag gaagtgaagg cagtgaagaa 60

ggaacactct cccaaaacaa gaggcagaaa gggcactccg ggtctgggtc ccattctacc 120

<210> 91

<211> 120

<212> DNA

<213> 人工序列

<400> 91

gtctgggtcc cattctacct agagaaaaca tgcaagcgca tattgattga gggctttcta 60

cacggggggt tttgatacca tttgttgccc agaagatatg gggtacaagt acagaaatgg 120

<210> 92

<211> 120

<212> DNA

<213> 人工序列

<400> 92

ggtacaagta cagaaatggc gacagatgga gtctacaagc tctttccaaa cgttcacatt 60

cctcagaacc tcacccgttt tctcggccac aagaaattat taatttattt gacaaatatt 120

<210> 93

<211> 120

<212> DNA

<213> 人工序列

<400> 93

aaaaaccact ggctcaagga ttctgtcgct ggagagaaac ttcagagttt aataacgttg 60

atagaacacc caaaacaatt ctgctacagt ttagaaattg atccattcca gacagaacca 120

<210> 94

<211> 120

<212> DNA

<213> 人工序列

<400> 94

caatgcagac attaagggac acacatcatc taaggccgtg aggtctgagg tcagagatcc 60

agccatctgc tcccccaggg tagggaggtc gggcctcccc ggggtgagtc acgtagccca 120

<210> 95

<211> 120

<212> DNA

<213> 人工序列

<400> 95

cctctcccca ccaggcgagg cttctcggtc ttggtgcatg gggcagggcc gcaggaaatc 60

ccccagccta aatctgccgc actcagaaaa cccaggcagg ggagccccca gagaccaggc 120

<210> 96

<211> 120

<212> DNA

<213> 人工序列

<400> 96

ctctgattag cacctgattc acggaggcag ccaaggctgg gtagcgactg ctggtaactg 60

gcccccggag tcgccccagg ggaaaaggcc aaagggggat ctggagaccc ccggccgggg 120

<210> 97

<211> 120

<212> DNA

<213> 人工序列

<400> 97

agcgggctcc gagacgagcg cagccgcccg gtcagggcag cgcctgcgcg tccgccaggc 60

cccgccgcgc agcctcgggt gtcccggcgg ggcggctcgg gccgcgcacg cgctctggcc 120

<210> 98

<211> 120

<212> DNA

<213> 人工序列

<400> 98

tccggggccg gccgcctggg agcccgagcc tagtgcctcc cacgcccggc ggccgcgagc 60

cggggtccgc gagggcggag tggggcgcgg cagccaggaa cccgactacg aatcccaggg 120

<210> 99

<211> 120

<212> DNA

<213> 人工序列

<400> 99

tgcgggcggg cggagcgagg agggacgctg ggcctgcccg gtgcgcacgg gggcggggac 60

cggcaaggcg ggaccatttc ccggcatagg ctccggtgcc cctgcccggc tcccgccggg 120

<210> 100

<211> 120

<212> DNA

<213> 人工序列

<400> 100

aagttctagg ccgccgcaca gaaagccctg ccctccacgc cgggtctctg gagcgccctg 60

ggttgcccgg ccggtccctg ccgctgactt gttgacactg cgagcactca gtccctcccg 120

<210> 101

<211> 120

<212> DNA

<213> 人工序列

<400> 101

cgcgcctcct ccccgcccgc cccgccgctc ctcctccctg taacatgcca tagtgcgcct 60

gcgaccacac ggccggggcg ctagcgttcg ccttcagcca ccatggggaa tgggatgaac 120

<210> 102

<211> 120

<212> DNA

<213> 人工序列

<400> 102

ccaaagtgta gtttaataaa gtgtagctac agtatatact tttcctttca tgtggctaga 60

gctcaaagaa tagtcttcct ctagaaaaat gggtagattc tgtattctac agtcgattct 120

<210> 103

<211> 120

<212> DNA

<213> 人工序列

<400> 103

ctcaatattt tcaagtgcta aagaagaaat tgaaagcaca agctcaaagt tatttattct 60

gacaagaaac agaagcatag atattttgtc atagattttg attaaagaaa ctttgccagg 120

<210> 104

<211> 120

<212> DNA

<213> 人工序列

<400> 104

ggacatttgt cttaatggat ggccatccct gtccatggag gcatgctgtg gtgggagggt 60

cagagaaaag gccaaaggct atcctctaaa acagtactag ccatgtgtgg tggctcatgc 120

<210> 105

<211> 120

<212> DNA

<213> 人工序列

<400> 105

taaataaata aataaataaa aagaaaagaa aaatagcact gtgtttctcc aatatagaaa 60

aataggtgat tgagtttctg cagttctacc caccagcctg aagcaaaacg ggaagaattt 120

<210> 106

<211> 120

<212> DNA

<213> 人工序列

<400> 106

aatatagaaa aataggtgat tgagtttctg cagttctacc caccagcctg aagcaaaacg 60

ggaagaattt tacattttat ttttagttta ttattttatt ttattttatt ttattttatt 120

<210> 107

<211> 120

<212> DNA

<213> 人工序列

<400> 107

tgtgagccgc cgcgcctggc ttggaagaat tttaaatgga gcaaattttc acaggcagag 60

ttgtcctgtt atattaagtt attaaccaag aatttaaaaa ggtgaactac atatgaacaa 120

<210> 108

<211> 120

<212> DNA

<213> 人工序列

<400> 108

acaatactgt ttcagagtct gctcctacta gagacacttc aagcacgagt gcttacacac 60

agtgttctac atacctgtgc cctctgaaag aaactcaaat ttcataacca atcactcaga 120

<210> 109

<211> 120

<212> DNA

<213> 人工序列

<400> 109

cagaactgct gctatgtgaa atgagcggac atacaggtac gaaaagcaat ttcaataact 60

gtgcttaaaa agtgctgcta ttgaatgaag gtggtatgtg aattagcacc atgaagttac 120

<210> 110

<211> 119

<212> DNA

<213> 人工序列

<400> 110

ttacagttag gttaaaaaaa aagactagaa aaataaaccc aaatgaacaa acataaaata 60

taaccgcagc tctggctatc ttaacacacc agctctgtga cctcactgac gcttttacc 119

<210> 111

<211> 120

<212> DNA

<213> 人工序列

<400> 111

caatgcttgt cacatagaaa aaacgtttta ttatttcctg gatcaccatt aatatataaa 60

aatagtgtgc atttatataa atgaactggt tcctcttcat atacagaagc aattgtttta 120

<210> 112

<211> 120

<212> DNA

<213> 人工序列

<400> 112

atatacagaa gcaattgttt taagtgggga tttatttgaa atttgaattt cttacgcaaa 60

acttttatat gttctgccct tctgaaaaga tctagagaag cggtccccaa cctttttggc 120

<210> 113

<211> 120

<212> DNA

<213> 人工序列

<400> 113

ccaggagatg gggacccttg atttagaggt taactttagt tcacatcagc actgctacta 60

gaattaattg ataacaccct tacctgtatt ttctgaagac tagttgaaac ttcacttata 120

<210> 114

<211> 120

<212> DNA

<213> 人工序列

<400> 114

ttttgaggta tatcaaaaca cttggcggta gtgatttttg cattaaccaa ccactgctgg 60

aaatccctga aggcctttcg aaatctttgc tgtaaaatct gttctttatt ctggcagccc 120

<210> 115

<211> 120

<212> DNA

<213> 人工序列

<400> 115

ttggatgctt gcaaacaaag actgaaaagg tgacgcaaaa atttaatggc aggaaaaagc 60

gataaagttg atgaaaatca tgtttgatag aatcaccagt tcttagaatg tgcacttacc 120

<210> 116

<211> 120

<212> DNA

<213> 人工序列

<400> 116

tcacttagta atatatttaa tgctgaacta atattatttt gaaattacac cttaaaataa 60

acttctagct tctaatttgt ataaaaatat cttgaacacc aataaggttc atgctcacca 120

<210> 117

<211> 117

<212> DNA

<213> 人工序列

<400> 117

atgtatgata aaagttgaaa tgattagtta ttagaatggt gagttttttg ttgtgtatat 60

tttatcactt tatattttat tttacatata tgcttatata catataattt aataaat 117

<210> 118

<211> 120

<212> DNA

<213> 人工序列

<400> 118

gtgagccacc gcgtccggcc tacatatacg ttttaaaaat taaaaacagg ctatgaattc 60

agaggggaaa gagttcagga aggaagtcta aaaaatacag tgattataca agaggttgaa 120

<210> 119

<211> 120

<212> DNA

<213> 人工序列

<400> 119

acatatgaaa aactaacaat ttcaatatgt caaataacct cccaagtgac tgtagtacaa 60

agatcaccag actcagaaga atagttttga atttcagtcc taactctttt atacctagta 120

<210> 120

<211> 120

<212> DNA

<213> 人工序列

<400> 120

agataaagtt attgacagtt acatcaaaga tgggcctaaa tttctagctt gcataattgg 60

ataatagtga cattattcac ttttacagca aacaaaatgg agagagcaag ggtttagatt 120

<210> 121

<211> 120

<212> DNA

<213> 人工序列

<400> 121

atgatagctt taatataaag tatctcagtt ctaagagaat gatgctcaag gttagaaatc 60

caaagtacgg gcaaagagat tctctttaaa ggggatgacg aagatcttct ctatggtaac 120

<210> 122

<211> 120

<212> DNA

<213> 人工序列

<400> 122

tagagtgaag gaggagggac acagaagact taagtgggtt ttcttttcgc tctttcacgt 60

tggacaagtt tgatggcttc tatttcctat gtgaagtacg aggtgccaga ataatactga 120

<210> 123

<211> 120

<212> DNA

<213> 人工序列

<400> 123

tcaaaagaaa aaaaaaagaa tgaatgaatg aatggatgga tggattggtg ggagcaggtg 60

gtagagtgga tgccatcctg tctgctgttt tgagggccta cagccctgaa ggcatgcaga 120

<210> 124

<211> 120

<212> DNA

<213> 人工序列

<400> 124

gagtggatgc catcctgtct gctgttttga gggcctacag ccctgaaggc atgcagaccc 60

aatggattta catatccgta tgtctttttg accctttgtc ttttaaggcc tgctcaagtt 120

<210> 125

<211> 120

<212> DNA

<213> 人工序列

<400> 125

gtgtgtatat gtgtgtgtgt atctttaagg ttcttagtca cttgcaactg aatagctctc 60

gctaagttgt gtaagtctca ccttcctgaa ggtcatatca gctcttccca aagtgagtag 120

<210> 126

<211> 120

<212> DNA

<213> 人工序列

<400> 126

aagtgagtag tagagtcagc tacttcttat ggcagtatat tggatcctgc aatccttcca 60

ggggaatgcc aaaaccgcaa taggcaatga gcagggttgt tacagagatt ggtggagagg 120

<210> 127

<211> 120

<212> DNA

<213> 人工序列

<400> 127

ggtggagagg ctcaaatgga agattaggag tagggaaaga tattttcaag ataccttcct 60

taataagata aaagaaaata gtctccattc tcttctgctt tttttctttt tctttcgata 120

<210> 128

<211> 120

<212> DNA

<213> 人工序列

<400> 128

gtgagccacc atgcctggcc cctcattatc ttctcgatgt ggcaaatgca atgcaataga 60

tgatagaagc cactctatcc catatctaat cgtgcaatat acaaaaaagg gaaaaaatga 120

<210> 129

<211> 120

<212> DNA

<213> 人工序列

<400> 129

ggaaaaaatg aagaaaacca atatggaaac ccagtggcaa gaattcttgg ggtccttggc 60

tgggcaacaa cattaagaag tgaagggtca tacaagcatt ttatttattt tattttattt 120

<210> 130

<211> 120

<212> DNA

<213> 人工序列

<400> 130

tgagtttttg ggattacaag gatcaaccat agtgctgagc acaagtattt ttaatagtgc 60

taatgtggag aagatttgat aaatatttta tctataacaa tggcatttgt tgaacttaat 120

<210> 131

<211> 120

<212> DNA

<213> 人工序列

<400> 131

cacaagtatt tttaatagtg ctaatgtgga gaagatttga taaatatttt atctataaca 60

atggcatttg ttgaacttaa taaattactt ctctattttt catctattct attcccaatc 120

<210> 132

<211> 120

<212> DNA

<213> 人工序列

<400> 132

ctggccctta cacaggtcaa tgttaacacg aatgcatttc agtattttga agataaaatt 60

ggtagatcta taccttgttt tttgattcaa tatcagcacc atataagagc agtgctttgg 120

<210> 133

<211> 120

<212> DNA

<213> 人工序列

<400> 133

ccattaattt atcttcattg tagatagcat agtgtagagc ggtatttcca tactcatctt 60

gaatatttcc atcagcgcca tgttccagca acattaacac acattcatct tcctggcatt 120

<210> 134

<211> 120

<212> DNA

<213> 人工序列

<400> 134

gtacggcctg tcagtattag accaaaaaca aattataagt cctaggaatt caaaataaca 60

ttccacagct ttcaccaact agttatattt aaatgagaaa actcattttt atgctatcta 120

<210> 135

<211> 120

<212> DNA

<213> 人工序列

<400> 135

ttgaaatcaa acccatctca cgctgatata gttgactact gcataccttt atcagagctg 60

tccttttttt gttgtcaagg acgttaagtt gacatcgtct gtccagcagg agttgtacta 120

<210> 136

<211> 120

<212> DNA

<213> 人工序列

<400> 136

cttctgaatt tccattggca gaggccaaat gtagagcagt cctatgagag tgagaagact 60

tcaggaaatt gtagtgcact agctaatgcc acattaatga ttcatgtagt tgcaaacact 120

<210> 137

<211> 119

<212> DNA

<213> 人工序列

<400> 137

gaatagccta ttactctgcc ttcaaaacaa actcaatttt cctttgaaga aagcacacta 60

cttattacct ctcattagtc actgtattaa tgaaagagca gcctatttga atagaaaga 119

<210> 138

<211> 120

<212> DNA

<213> 人工序列

<400> 138

caaaaattgt aagatattat aatttttact aataccacta aagacaacat ttgaattaag 60

tgaaacgata caattatacc tacactttca ggtacatttt aaagattaca ggtagcgttg 120

<210> 139

<211> 120

<212> DNA

<213> 人工序列

<400> 139

tttactaata ccactaaaga caacatttga attaagtgaa acgatacaat tatacctaca 60

ctttcaggta cattttaaag attacaggta gcgttgtact gtattttatt gagtctaaga 120

<210> 140

<211> 120

<212> DNA

<213> 人工序列

<400> 140

cttacattaa gtagaatatg ttataatata acaggtctgg ggcagttcca gtcagatgac 60

tagcatttag ataaatttta gttcttaaaa gaactatgga ataagagggc tgaggtgaaa 120

<210> 141

<211> 120

<212> DNA

<213> 人工序列

<400> 141

ttcttaaaag aactatggaa taagagggct gaggtgaaaa caaaaacaat tttctaaaat 60

aatctatttc ttactttggt tttcaaaaac tttaagccaa agaaatcttg aaattcaaat 120

<210> 142

<211> 120

<212> DNA

<213> 人工序列

<400> 142

ttcaaaaact ttaagccaaa gaaatcttga aattcaaatg aatagcatgg gctcattttt 60

ttcaatactt agatttatac aacgtatgta catcagatat ttccaatcat tcatattagg 120

<210> 143

<211> 120

<212> DNA

<213> 人工序列

<400> 143

acgtatgtac atcagatatt tccaatcatt catattagga tttaagactg ttataaattt 60

tctcttttta aaatggattt atgaaactat ttgtggagct tttttcaact tttacattcg 120

<210> 144

<211> 120

<212> DNA

<213> 人工序列

<400> 144

gctgtttatg taccacattt aagttcttaa aacagctaaa acagtgttta cccaagtctt 60

atacattttc aaaagggcag ttaagggtta tcttttacta ttttccacct tcagaagtgc 120

<210> 145

<211> 120

<212> DNA

<213> 人工序列

<400> 145

ttttgtttga aaggagggag gaaaagcttc aattgagatt aagtcctaat gccccaattt 60

tgattctctc agcttgctca ggcgcagcag gtaaacatga agttttcaaa ggtggaagga 120

<210> 146

<211> 120

<212> DNA

<213> 人工序列

<400> 146

tcctgagaga tagcagaata tgcctgccat ataataggtg tctggcttat gtttgatgac 60

taaacggatt gaaagaatgg ataaacatag gttggaagtt caatattttt aaaagaaaac 120

<210> 147

<211> 120

<212> DNA

<213> 人工序列

<400> 147

tcctgttgag tagagcaata catttgcgat agtaacgatc atttatattt gctattttag 60

ttttcataaa tatataacta aactaaaata attaatccat actatttaca catcaatcta 120

<210> 148

<211> 120

<212> DNA

<213> 人工序列

<400> 148

tatataataa gatgtataca caataaaatc taccagaaga ggtaaacaga agccctctac 60

ttctgaagag ggtaaaagtt cacagaagat agccatccac aggtataaaa ataaataata 120

<210> 149

<211> 120

<212> DNA

<213> 人工序列

<400> 149

gaatgtaaga aattatttgt atctatgcaa gtagcatatt ccttctcttc ccaaggatta 60

tttcattact aatgaaactt aactaaaact ttgcagatgt tcattgcaga aatcacagat 120

<210> 150

<211> 120

<212> DNA

<213> 人工序列

<400> 150

aagagaaagg gaaaaacttc acttacaaat ccccagaaat aagtttgatt atattttcca 60

catatttcca gctaacacaa gagcagattc tatttgtgta tatgtataac aaactgattt 120

<210> 151

<211> 120

<212> DNA

<213> 人工序列

<400> 151

tttctcactt gatacagcaa agtacatctc tgcatgccga catatctctg tatctactga 60

caccctcaat ggttacatat tattccatcc tatggatgca ctgaaatttg ttcataaaat 120

<210> 152

<211> 120

<212> DNA

<213> 人工序列

<400> 152

ctttatatga gttcttctca atacatggct attttaagca atactaagaa aaacagctgt 60

gtctgtttca tatagatatt tcggtataat ggaacagatg ggtaaaaggc atacacattt 120

<210> 153

<211> 120

<212> DNA

<213> 人工序列

<400> 153

taaaaatgtg gttcttacca tcaaagtgtc tatttgaaaa gtcgcagcaa cttaaacttt 60

cagcaggtat ataagtacca ctgttcttca ccctcacaaa ctttgtggac acaaaacagt 120

<210> 154

<211> 120

<212> DNA

<213> 人工序列

<400> 154

actagtgaag acaaaataga tacaatgaaa ttagaaaaaa attaaaatcc tttaaaaagc 60

cccatttgcc tcgattttcc taattacaca aaggaggcaa agtgtgaaaa aggatagatc 120

<210> 155

<211> 120

<212> DNA

<213> 人工序列

<400> 155

caaagtgtga aaaaggatag atcacgttcc tctaaggacc catgtcaggt atctgtggaa 60

tgcaggcggt gcaggagggt gggaatgggt gggtgcccag cgttgctaaa gctatggagt 120

<210> 156

<211> 120

<212> DNA

<213> 人工序列

<400> 156

cagcgttgct aaagctatgg agtgtcttcc catttttaaa gaaatccaga agtgcagatc 60

tattcattca accattcatt gatgtaaaat ctggtttcta aggtgttcag tttgatgact 120

<210> 157

<211> 120

<212> DNA

<213> 人工序列

<400> 157

aacacattgt ctcacttata ggatgacact gcattcacgt ttcagccacc tctgccacac 60

ccacccatgc aaacacaccc acccatctca gttcctgccc ctgactgggg gacagggtgg 120

<210> 158

<211> 120

<212> DNA

<213> 人工序列

<400> 158

gcgctctctg gcacatgttc cactcatgct tctccacctc cagctatttt aggctctgac 60

actgaaaatg aaattcttac caagacgata tgtgttgtgt tgacataaaa ctgatagaaa 120

<210> 159

<211> 120

<212> DNA

<213> 人工序列

<400> 159

gtgtaccaaa aaacatggaa gttttaaaca taatccacca aaagaacata ctcacagtcg 60

acgtttcttt cattattaag aatgaatgtc cataaccctc actaagacaa aagtcatccc 120

<210> 160

<211> 120

<212> DNA

<213> 人工序列

<400> 160

atttgtctac attttttttc tttgcaaaca cacactgaat gactttgtgt gacaagctgt 60

gaagttttac caattcttca aactctttga tttgcattat gctgtttaat cctgagaggc 120

<210> 161

<211> 120

<212> DNA

<213> 人工序列

<400> 161

gagcagctgt cgctggtaat tctaagccta gaattccacc acctaatagg tgaaaattat 60

agtaggctga tcataaaacc atgttgttaa ctttttaaaa tttaatgact accaaggaat 120

<210> 162

<211> 120

<212> DNA

<213> 人工序列

<400> 162

ttcaccttag tgatacatct tttgagagat tagaaaatga agaaatgcac gtgttcaatg 60

atccatttta gaatttaaaa agtctttcaa atgagcatct tattcatata ttgtgaagaa 120

<210> 163

<211> 120

<212> DNA

<213> 人工序列

<400> 163

ccactggaaa cagttattta ataatgtggc taaacgcgta ttcagagtaa tgcttcctgt 60

atatttgcac atttatacac ttatgtcccg ctcctggaat agacttacca gtttcctttt 120

<210> 164

<211> 120

<212> DNA

<213> 人工序列

<400> 164

cagaaaattt cagaatttct gaaatgtgcc gaagtactag tgggtaactt agatttggaa 60

tacactgtat taggtgtaac tggaaaactg agaggcttcc tacactggaa ggtcaaagat 120

<210> 165

<211> 120

<212> DNA

<213> 人工序列

<400> 165

ctttcctgga ggagagttaa gaatttgcct tttcttacca tgactctgtt aaaagagaat 60

ataaacaatg cagtttcaca aaaggaaggg gacagtggtg taaataaacc tccccatcat 120

<210> 166

<211> 120

<212> DNA

<213> 人工序列

<400> 166

gttctggtgg ctttcctgta agtcttgaac gttttccact gggtgttaca gtcgagaggc 60

ccccacctcc tgaggaagca agaccccgaa accccgagac gatgggctgt gctgctttgg 120

<210> 167

<211> 120

<212> DNA

<213> 人工序列

<400> 167

ccccatcttg cttgtgttgt ttgaaggggc cctgctgcca cccagctgtc attaacgcca 60

ccctcacctc ccaggaactg catcactcgg acggacaaga cacctatgta atgaccatag 120

<210> 168

<211> 120

<212> DNA

<213> 人工序列

<400> 168

taagacccca tgtgcgtggc taatgaggca gtgcccaacg tggcgtggaa gccctgctag 60

ggaaatcccg ccccgccacc ccagatgcgc caccccagac ctgctctcgg acctgcggcc 120

<210> 169

<211> 120

<212> DNA

<213> 人工序列

<400> 169

cctggcccct ggccctttcc cgttgtcacc gaggcttctt gctaagaaat ggaacttcag 60

aaaaccccca aatatatact gcattaggta agggtttcat tctaatggag tcccatgtga 120

<210> 170

<211> 120

<212> DNA

<213> 人工序列

<400> 170

ccctggcttt ccgtccggca gcaatgcact cctgtctatg aatgagatga aaagagtgcc 60

cacaacaagc caatttcttt caggagcgac taagacatgc gcatgtccgg gggtgcctca 120

<210> 171

<211> 120

<212> DNA

<213> 人工序列

<400> 171

gagcacccgg gagggaccca ggcctgggca gggagggggg gccggcccta ggggagcaaa 60

gctcttgaaa ctggcctctg ttgccgggct cctgaccctg ccctcccatc cctgcactac 120

<210> 172

<211> 120

<212> DNA

<213> 人工序列

<400> 172

aagaggacag cggcgactac aggaggcgcc gaagacgctg ctgaaggccc taaagaaact 60

tcagcagaac cggaactccc cttgcaggtc cagccgcggg ccctgcgccc tcccgctcag 120

<210> 173

<211> 120

<212> DNA

<213> 人工序列

<400> 173

ccgagcgggg ccgagggcgc gtttgctgag tgtctggtgg cctctaccca agcgcctctt 60

cagagggctg ttcctgcggc ccagagactg cttgaggcgc tcggggaagg aaaagcaggc 120

<210> 174

<211> 120

<212> DNA

<213> 人工序列

<400> 174

gctggtgcgc cgggggctct gctggggacg gcgcggagct gactgaaggg ccgctgcggt 60

agcgcagggc gcaggagctg ctccgccccg gagcgccggg aaggttggcg ctggcagcct 120

<210> 175

<211> 120

<212> DNA

<213> 人工序列

<400> 175

cttgatccca caggaatctt ggtcctcatt aggatcatga gccagacgat gatggtaaca 60

aatagagact tctgtttccc gggagactgc ctgccgtgag tgtcttacct ggagtagcgg 120

<210> 176

<211> 120

<212> DNA

<213> 人工序列

<400> 176

gaaataggtg tgaatgggtg gccttcagaa actggtagtt caatcaccgg ttgcaggtcc 60

tggaagaatg caaagcaaga ggagggcttt tttaagtagc ccttgtgatc tggttctgtc 120

<210> 177

<211> 119

<212> DNA

<213> 人工序列

<400> 177

ctctcttaca aagcatgaag gccttgttct ctcacacgtg gtttccctct ggcaccccgt 60

acatcggtct ctgcagaccc ttcattttag acgagctgtt ctgaatccac actacacat 119

<210> 178

<211> 120

<212> DNA

<213> 人工序列

<400> 178

aagtgacttg accatggcca tgtgtgaata tgaagactgt aagtgtatca cattgttgtt 60

ctgagataaa ctggttaatg caaattaaag tgttttctct cgtagggttg tctttcttct 120

<210> 179

<211> 120

<212> DNA

<213> 人工序列

<400> 179

gggttgtctt tcttctaaca tccatgcatt gcacagatgt ttattgagaa tcatttctga 60

gtcaagcagc aaccctggtg cagtagctac aaccgtatat ctgaaaccac tgctgaaccc 120

<210> 180

<211> 119

<212> DNA

<213> 人工序列

<400> 180

aaccactgct gaacccacag gcctcgggtt cgtggaggtt atggacaagt gaacagctgt 60

gtaaagtagc gcggtgatat aatggccatc cctgaatact gctctaggtc ctttaccat 119

<210> 181

<211> 120

<212> DNA

<213> 人工序列

<400> 181

agccaacatt taaacacagg agggactgcc ccatgcatta gactgtttac tgagaatttt 60

tcctgtgttc tgcagtattt tacactttca ttactgtggc catggggttc tgaaagtctc 120

<210> 182

<211> 120

<212> DNA

<213> 人工序列

<400> 182

gttctgaaag tctccttctc tgtaaacaac cctgtgacac atgattctgg aggtgactgt 60

tgaagcagaa cacattccat atggcgtttt gacgtggaag ctgactgtgt tcacctggca 120

<210> 183

<211> 120

<212> DNA

<213> 人工序列

<400> 183

gtgttcacct ggcaagcgta caaatgtctc caaaatccca ttccttagaa caaaaggttt 60

gaacatcgtt gcattcaatt gtctctacag aatgaataat accaactgcc atggtttcag 120

<210> 184

<211> 120

<212> DNA

<213> 人工序列

<400> 184

tgccatggtt tcagagtcag gtgcttaaga attacttcac ttgtgggagc ttatctgcgg 60

ctctgtattt actgtgattg aatagtttca cattgatgag ggaaatggct ctcttaacta 120

<210> 185

<211> 120

<212> DNA

<213> 人工序列

<400> 185

ggctctctta actaggtcat ctcttactgg catttacaag ttttaaattt aaaatccaac 60

catacgtcat tgcattgcaa acaacacctg gaataccagt tactattagt aatattatta 120

<210> 186

<211> 120

<212> DNA

<213> 人工序列

<400> 186

actaatacaa ttagtaataa ctagtatact gttagtatgt tgttactaaa aacatacata 60

aaaacggtat gtttcttttc attgactttg ataaataaag tggttaaaaa aaacaaacaa 120

<210> 187

<211> 120

<212> DNA

<213> 人工序列

<400> 187

aaaacaaaca aacaatctta agcatgaaac attggtatgc caaccaccca taagaagcca 60

ctcaagagct taacaaatta gaagaatcca aaagtatcta taaatgccct agggacgata 120

<210> 188

<211> 120

<212> DNA

<213> 人工序列

<400> 188

tagggacgat actaccaaaa gtaggatatc acaaatgcca tgaacaggag cattaaagaa 60

actcttatgc atcacttaac agagatgcca gctcacgatc tgctactcgt gaatttccta 120

<210> 189

<211> 120

<212> DNA

<213> 人工序列

<400> 189

tgaatttcct atccataatc ttttagtaga agatgctacc aaagaggttg gtaatgcaag 60

cacaacccca gagtcgagtc tctttgcccc ctttcgggtt ccatgatgaa tgcagaggca 120

<210> 190

<211> 120

<212> DNA

<213> 人工序列

<400> 190

atgcagaggc aattaccatg ggaagggaaa cgcaatgcat tgattggcgg agctttggac 60

tcctaaccag agctattgcc ggaagctcag ggcctctgct aacagcagag tgtcaaagtg 120

<210> 191

<211> 120

<212> DNA

<213> 人工序列

<400> 191

gtgtcaaagt ggagaacagg tgttgtccca ggaaatcggt gttccattac ctggacaagg 60

gagagggggt ggatatgggt caagaacagc caaggatgtt ccttgagatg tgcatttact 120

<210> 192

<211> 120

<212> DNA

<213> 人工序列

<400> 192

gtgcatttac ttgcctgctc cagggcacca tgctaactgt gctaaaaact tggtaatgtc 60

attgtggccg gtcctgttat ttaagatgag gtccttcttg gatgatgatg atgatgatga 120

<210> 193

<211> 120

<212> DNA

<213> 人工序列

<400> 193

cgtgagccac tgtgcccagc tactgtgtgt gttcttaacc atgctctatc tccctcagcc 60

ccacagttaa catctagttg ctagtagatc ctgactctcc atcctacttg accatactct 120

<210> 194

<211> 120

<212> DNA

<213> 人工序列

<400> 194

tctcactcat ggcagtccac aatgataagt aaaaataaaa taatacaata caatacaata 60

caatacaata aatctaccac aaccaaaaac aataaaaggc taaatcttga ggactgagta 120

<210> 195

<211> 120

<212> DNA

<213> 人工序列

<400> 195

gtaaaaattt gactgcaaac aggcaacctg actcagtaca tctttttaag aggcttttga 60

taaaggggct gagataagga gaaatgcagt ggatctttta aagccaaaaa tatcgttgaa 120

<210> 196

<211> 120

<212> DNA

<213> 人工序列

<400> 196

gaactgcatc tctcctacgg taggaaagcg acattcctga gtcgggtttc ttgcatggcg 60

acctcctcat ctcaacttcg tgtaagccct ggactatttg gagacaatct tctatgtatg 120

<210> 197

<211> 120

<212> DNA

<213> 人工序列

<400> 197

atgtagggtc cccgtgtcca gatttggcat ctagctgcct tgtgaagaac ctgagttggg 60

cttttatctc ttggtcattt tttaaatttt aacttaatat ttatttattt ttttttttga 120

<210> 198

<211> 120

<212> DNA

<213> 人工序列

<400> 198

aaaaaagaaa aaaaaagaaa tataaatagc caagatgata gtaccctatc tcactctttc 60

tgtacgagat ggagggtgac ttagagccac ttagagccac ttacagctga aggtaaggta 120

<210> 199

<211> 120

<212> DNA

<213> 人工序列

<400> 199

ataaatagcc aagatgatag taccctatct cactctttct gtacgagatg gagggtgact 60

tagagccact tagagccact tacagctgaa ggtaaggtag gcttacctgc aacaggcacc 120

<210> 200

<211> 120

<212> DNA

<213> 人工序列

<400> 200

cggccttcgt tctgggaaca gaagtgcagt tagatgtgga tgcatgtgat tggtgcttaa 60

actcacagtg ccccacacca aaggagaaaa acacatagtt acagcctgtg tgtccaaatt 120

<210> 201

<211> 120

<212> DNA

<213> 人工序列

<400> 201

cagcctgtgt gtccaaatta ggtccagatt aggtccaagg acaaatagca aaacaagaag 60

attgccttta atcttttccc tccacttcta aactctggag gacaaggctg tgaagagatc 120

<210> 202

<211> 120

<212> DNA

<213> 人工序列

<400> 202

acaaggctgt gaagagatct gaagacatgg tgttctctgc ttgtgtggcc ccaacattct 60

ttgtttgctg tctgatattt gaaaggaaga ggaacctttg atagaggagg cagtcggacg 120

<210> 203

<211> 120

<212> DNA

<213> 人工序列

<400> 203

gacctggctg aaccgaggag accaccacac ctccaccaaa cagcaactgg gaaaccgtgg 60

tcttcacgtg gatactctca gcttgcagcc cctgctctct ctaggggcac tgtcccaccc 120

<210> 204

<211> 120

<212> DNA

<213> 人工序列

<400> 204

cacgtggata ctctcagctt gcagcccctg ctctctctag gggcactgtc ccacccaccc 60

ttgagcctga ggagaaaagt tggtagagag gctggtccct tacttccagc agaaaagagg 120

<210> 205

<211> 120

<212> DNA

<213> 人工序列

<400> 205

gcctgaggag aaaagttggt agagaggctg gtcccttact tccagcagaa aagaggtgtt 60

caggccctca cttccctaag ggaagagagc cctcatggct gcgctcaatg tggcagccac 120

<210> 206

<211> 120

<212> DNA

<213> 人工序列

<400> 206

gctaataaaa acgcaaaatt cacaaattaa tattttattt tttaaaggat tgcttccctc 60

ttaaaatctc aggtgtccta ctcaaaagac tagcggccag aagggttatg aaatctaaaa 120

<210> 207

<211> 120

<212> DNA

<213> 人工序列

<400> 207

aatctcaggt gtcctactca aaagactagc ggccagaagg gttatgaaat ctaaaatatt 60

aaaataattg tcattatatc acttccgttt gtgaaaaagt gtgtgtgcat gcatgtgtgc 120

<210> 208

<211> 120

<212> DNA

<213> 人工序列

<400> 208

gcacgtctgt gtgtaagtgt attttacaag tggacataac cttacacaca acaaggttaa 60

aaaaaacacc cctgggctgc gtcaggccaa gccgggagag aaagccccgc ctgaaagggc 120

<210> 209

<211> 120

<212> DNA

<213> 人工序列

<400> 209

ctggaggccc cagcctgtca ctcttgccac atcagtggag tgtatggttg caaattctgt 60

tactcaaggc ccgagggcgg ggattggagt aatatccaat cagagtgtcg gaatgagaac 120

<210> 210

<211> 120

<212> DNA

<213> 人工序列

<400> 210

tgcccaatca ggcccgcagc cagagaggag gggttggctt ccgggatctg gcgcggcgtt 60

ttcctctggc tcctgcgagg gcttggttta gggcttcagc tctctgcgtt ctcggctccg 120

<210> 211

<211> 120

<212> DNA

<213> 人工序列

<400> 211

ggaggcctcg gtgattcagc cacagcctct gcctcccgtt gctctgtgac ctgagggtat 60

tggacaattt gtagctaaga ctcccggata ccctgaagtc gggaaatggt gagtgtgcgg 120

Claims

1.一种用于预测肿瘤突变负荷的核酸组合物，其特征在于，其包括探针组1～9；

其中，探针组1包括用于捕获KMT2D基因的外显子区域的探针；

2.根据权利要求1所述的用于预测肿瘤突变负荷的核酸组合物，其特征在于，所述KMT2D基因的外显子区域包括区域1～54中的至少一个区域或多个区域的组合；

其中，区域1选自染色体12的第49021778～49021872位碱基的区域；

区域2选自染色体12的第49022041～49022151位碱基的区域；

区域3选自染色体12的第49022278～49022353位碱基的区域；

区域4选自染色体12的第49022588～49022875位碱基的区域；

区域5选自染色体12的第49024576～49024708位碱基的区域；

区域6选自染色体12的第49024808～49024946位碱基的区域；

区域7选自染色体12的第49026180～49027322位碱基的区域；

区域8选自染色体12的第49027801～49027930位碱基的区域；

区域9选自染色体12的第49028007～49028141位碱基的区域；

区域10选自染色体12的第49028826～49028958位碱基的区域；

区域11选自染色体12的第49029059～49029236位碱基的区域；

区域12选自染色体12的第49029399～49029476位碱基的区域；

区域13选自染色体12的第49030278～49030439位碱基的区域；

区域14选自染色体12的第49030599～49030768位碱基的区域；

区域15选自染色体12的第49030891～49031033位碱基的区域；

区域16选自染色体12的第49031173～49033964位碱基的区域；

区域17选自染色体12的第49034065～49034299位碱基的区域；

区域18选自染色体12的第49034408～49034476位碱基的区域；

区域19选自染色体12的第49034580～49034666位碱基的区域；

区域20选自染色体12的第49034810～49034935位碱基的区域；

区域21选自染色体12的第49037123～49038989位碱基的区域；

区域22选自染色体12的第49039220～49039358位碱基的区域；

区域23选自染色体12的第49039433～49039617位碱基的区域；

区域24选自染色体12的第49039722～49041535位碱基的区域；

区域25选自染色体12的第49041653～49041705位碱基的区域；

区域26选自染色体12的第49041915～49041990位碱基的区域；

区域27选自染色体12的第49042087～49042330位碱基的区域；

区域28选自染色体12的第49042559～49042645位碱基的区域；

区域29选自染色体12的第49042739～49042878位碱基的区域；

区域30选自染色体12的第49043074～49043186位碱基的区域；

区域31选自染色体12的第49043361～49043428位碱基的区域；

区域32选自染色体12的第49043633～49043782位碱基的区域；

区域33选自染色体12的第49043866～49043998位碱基的区域；

区域34选自染色体12的第49044198～49044304位碱基的区域；

区域35选自染色体12的第49044401～49044522位碱基的区域；

区域36选自染色体12的第49044742～49044965位碱基的区域；

区域37选自染色体12的第49045918～49045967位碱基的区域；

区域38选自染色体12的第49046063～49046174位碱基的区域；

区域39选自染色体12的第49046258～49046424位碱基的区域；

区域40选自染色体12的第49046607～49046790位碱基的区域；

区域41选自染色体12的第49047963～49048069位碱基的区域；

区域42选自染色体12的第49048657～49048769位碱基的区域；

区域43选自染色体12的第49049103～49049218位碱基的区域；

区域44选自染色体12的第49049680～49050790位碱基的区域；

区域45选自染色体12的第49050884～49052424位碱基的区域；

区域46选自染色体12的第49052562～49052709位碱基的区域；

区域47选自染色体12的第49052913～49053072位碱基的区域；

区域48选自染色体12的第49053205～49053321位碱基的区域；

区域49选自染色体12的第49053474～49053641位碱基的区域；

区域50选自染色体12的第49053976～49054140位碱基的区域；

区域51选自染色体12的第49054305～49054416位碱基的区域；

区域52选自染色体12的第49054526～49054751位碱基的区域；

区域53选自染色体12的第49054898～49055026位碱基的区域；

区域54选自染色体12的第49055274～49055324位碱基的区域。

3.根据权利要求2所述的用于预测肿瘤突变负荷的核酸组合物，其特征在于，DUSP22基因的启动子及其上游区域选自染色体6的第289100～292460位碱基的区域；

优选地，MYCT1基因的启动子及其上游区域选自染色体6的第152694894～152697893位碱基的区域；

优选地，OR1C1基因的启动子及其上游区域选自染色体1的第247758680～247761405位碱基的区域；

优选地，OR4D11基因的启动子及其上游区域选自染色体11的第59500575～59503574位碱基的区域；

优选地，OR4M2基因的启动子及其上游区域选自染色体15的第22077526～22080525位碱基的区域；

优选地，OR4N4基因的启动子及其上游区域选自染色体15的第22091521～22094429位碱基的区域；

优选地，TMEM132C基因的启动子及其上游区域选自染色体12的第128264402～128268401位碱基的区域；

4.根据权利要求3所述的用于预测肿瘤突变负荷的核酸组合物，其特征在于，所述探针组1包括探针1～77，探针1～77的碱基序列分别如SEQ ID No.1～77所示；

优选地，探针组2包括探针78～101，探针78～101的碱基序列分别如SEQ ID No.78～101所示；

优选地，探针组3包括探针102～116，探针102～116的碱基序列分别如SEQ ID No.102～116所示；

优选地，探针组4包括探针117～122，探针117～122的碱基序列分别如SEQ ID No.117～122所示；

优选地，探针组5包括探针123～131，探针123～131的碱基序列分别如SEQ ID No.123～131所示；

优选地，探针组6包括探针132～153，探针132～153的碱基序列分别如SEQ ID No.132～153所示；

优选地，探针组7包括探针154～174，探针154～174的碱基序列分别如SEQ ID No.154～174所示；

优选地，探针组8包括探针175～197，探针175～197的碱基序列分别如SEQ ID No.175～197所示；

优选地，探针组9包括探针198～211，探针198～211的碱基序列分别如SEQ ID No.198～211所示。

5.一种用于预测肿瘤突变负荷的方法，其特征在于，所述方法包括采用如权利要求1～4任一项所述的核酸组合物获取待测样本的肿瘤突变负荷。

6.根据权利要求5所述的用于预测肿瘤突变负荷的方法，其特征在于，获取待测样本的肿瘤突变负荷包括：采用预测模型，基于所述核酸组合物中的探针组1～9分别获取的对应基因的突变总数，计算待测样本的肿瘤突变负荷；

公式中，KMT2D为KMT2D基因的突变总数；DUSP22为DUSP22基因的突变总数，以此类推；

优选地，所述方法还包括根据TMB值进行判读：当TMB值大于或等于10时，判读待测样本为TMB-H状态，当待测样本的TMB值小于10时，判定待测样本为TMB-L状态。

7.根据权利要求6所述的用于预测肿瘤突变负荷的方法，其特征在于，所述突变总数的获取方法为：通过对探针组1～9中1组或多组获取的捕获片段进行测序比对，获取捕获片段对应目标捕获区域内的突变总数。

8.一种用于预测肿瘤突变负荷的设备，其特征在于，其包括存储单元及与所述存储单元电连接的执行单元；

所述执行单元，用于接收如权利要求1～4任一项所述的核酸组合物中的探针组1～9分别获取的对应基因的突变总数，并通过预测模型计算所述待测样本的肿瘤突变负荷。

9.根据权利要求8所述的用于预测肿瘤突变负荷的设备，其特征在于，所述预测模型的公式为：TMB＝3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595；

优选地，所述设备还用于根据TMB值进行判读：当TMB值大于或等于10时，判读待测样本为TMB-H状态，当待测样本的TMB值小于10时，判定待测样本为TMB-L状态。

10.一种计算机可读介质，其特征在于，所述计算机可读介质存储有计算机程序，其中，所述计算机程序能被处理器执行以实现如权利要求5～7任一项所述的方法的步骤。