CN111304334A - 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备 - Google Patents
一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备 Download PDFInfo
- Publication number
- CN111304334A CN111304334A CN202010221309.9A CN202010221309A CN111304334A CN 111304334 A CN111304334 A CN 111304334A CN 202010221309 A CN202010221309 A CN 202010221309A CN 111304334 A CN111304334 A CN 111304334A
- Authority
- CN
- China
- Prior art keywords
- region
- chromosome
- bases
- dna
- artificial sequences
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 206010028980 Neoplasm Diseases 0.000 title claims abstract description 59
- 238000000034 method Methods 0.000 title claims abstract description 36
- 239000000203 mixture Substances 0.000 title claims abstract description 32
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 24
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 23
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 23
- 230000000869 mutational effect Effects 0.000 title claims description 12
- 230000035772 mutation Effects 0.000 claims abstract description 62
- 238000011144 upstream manufacturing Methods 0.000 claims abstract description 24
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 21
- 239000000523 sample Substances 0.000 claims description 182
- 210000000349 chromosome Anatomy 0.000 claims description 127
- 101001017467 Homo sapiens Dual specificity protein phosphatase 22 Proteins 0.000 claims description 22
- 102100033992 Dual specificity protein phosphatase 22 Human genes 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 15
- 101100398309 Homo sapiens KMT2D gene Proteins 0.000 claims description 13
- 101150032040 KMT2D gene Proteins 0.000 claims description 13
- 102100027768 Histone-lysine N-methyltransferase 2D Human genes 0.000 claims description 11
- 101001008894 Homo sapiens Histone-lysine N-methyltransferase 2D Proteins 0.000 claims description 11
- 101000584314 Homo sapiens Myc target protein 1 Proteins 0.000 claims description 10
- 238000003860 storage Methods 0.000 claims description 9
- 101000586092 Homo sapiens Olfactory receptor 1C1 Proteins 0.000 claims description 8
- 101000721115 Homo sapiens Olfactory receptor 4D11 Proteins 0.000 claims description 8
- 101000611364 Homo sapiens Olfactory receptor 4M2 Proteins 0.000 claims description 8
- 101000614002 Homo sapiens Olfactory receptor 4N4 Proteins 0.000 claims description 8
- 101000787972 Homo sapiens Transmembrane protein 132C Proteins 0.000 claims description 8
- 102100030625 Myc target protein 1 Human genes 0.000 claims description 8
- 102100030028 Olfactory receptor 1C1 Human genes 0.000 claims description 8
- 102100025146 Olfactory receptor 4D11 Human genes 0.000 claims description 8
- 102100040741 Olfactory receptor 4M2 Human genes 0.000 claims description 8
- 102100040575 Olfactory receptor 4N4 Human genes 0.000 claims description 8
- 102100025916 Transmembrane protein 132C Human genes 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 101000976471 Homo sapiens Zinc finger protein 595 Proteins 0.000 claims description 6
- 238000004590 computer program Methods 0.000 claims description 6
- 101150067445 OR1C1 gene Proteins 0.000 claims description 2
- 101150059989 OR4D11 gene Proteins 0.000 claims description 2
- 101150099187 OR4M2 gene Proteins 0.000 claims description 2
- 101150009784 OR4N4 gene Proteins 0.000 claims description 2
- 101150057963 Tmem132c gene Proteins 0.000 claims description 2
- 101150056987 ZNF595 gene Proteins 0.000 claims description 2
- 108700024394 Exon Proteins 0.000 abstract description 2
- 108020004414 DNA Proteins 0.000 description 221
- 239000011324 bead Substances 0.000 description 20
- 239000000243 solution Substances 0.000 description 14
- 238000001514 detection method Methods 0.000 description 12
- 238000009396 hybridization Methods 0.000 description 10
- 210000001519 tissue Anatomy 0.000 description 10
- 230000003321 amplification Effects 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 8
- 239000006228 supernatant Substances 0.000 description 8
- 238000003199 nucleic acid amplification method Methods 0.000 description 7
- 238000009169 immunotherapy Methods 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 239000007788 liquid Substances 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 239000000047 product Substances 0.000 description 5
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 210000000265 leukocyte Anatomy 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 238000007482 whole exome sequencing Methods 0.000 description 4
- 238000007400 DNA extraction Methods 0.000 description 3
- 239000012148 binding buffer Substances 0.000 description 3
- 201000011510 cancer Diseases 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 238000012417 linear regression Methods 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000001575 pathological effect Effects 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 206010069754 Acquired gene mutation Diseases 0.000 description 2
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 2
- 208000032818 Microsatellite Instability Diseases 0.000 description 2
- 208000002151 Pleural effusion Diseases 0.000 description 2
- 102100023632 Zinc finger protein 595 Human genes 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 239000013068 control sample Substances 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 2
- 210000005259 peripheral blood Anatomy 0.000 description 2
- 239000011886 peripheral blood Substances 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 230000037439 somatic mutation Effects 0.000 description 2
- 210000004881 tumor cell Anatomy 0.000 description 2
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 2
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 102000008096 B7-H1 Antigen Human genes 0.000 description 1
- 108010074708 B7-H1 Antigen Proteins 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 1
- 102000053602 DNA Human genes 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 238000000376 autoradiography Methods 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000003339 best practice Methods 0.000 description 1
- 239000000872 buffer Substances 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000011532 immunohistochemical staining Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 201000001441 melanoma Diseases 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000033607 mismatch repair Effects 0.000 description 1
- 229960002621 pembrolizumab Drugs 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000001556 precipitation Methods 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 239000012264 purified product Substances 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000000392 somatic effect Effects 0.000 description 1
- 238000001179 sorption measurement Methods 0.000 description 1
- 239000011550 stock solution Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- -1 thaw Substances 0.000 description 1
- 238000010257 thawing Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 238000003260 vortexing Methods 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
- G16B20/50—Mutagenesis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
- G16B30/10—Sequence alignment; Homology search
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biotechnology (AREA)
- General Health & Medical Sciences (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Immunology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Software Systems (AREA)
- Hospice & Palliative Care (AREA)
- Public Health (AREA)
- Oncology (AREA)
- Evolutionary Computation (AREA)
- Epidemiology (AREA)
- Microbiology (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Bioethics (AREA)
- Artificial Intelligence (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备,涉及生物信息技术领域,具体地,用于预测肿瘤突变负荷的方法,通过检测9个基因的外显子和/或启动子及其上游区域,能够有效快速地预测待测样本的TMB状态。
Description
技术领域
本发明涉及生物信息技术领域,具体而言,涉及一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备。
背景技术
随着肿瘤免疫治疗的兴起,人们发现免疫治疗的效果在不同患者中的疗效不尽相同。例如,在非小细胞肺癌(Non-small cell lung cancer,NSCLC)患者中,相同病理类型的患者接受免疫治疗疗效存在较大差异,治疗客观有效率和患者生存期不尽一致。这促使医生需要一个可以量化的指标/标志物在病理上衡量特定患者对于肿瘤免疫疗法的敏感性。
目前,已经广泛应用的肿瘤免疫疗法标志物包括PD-L1免疫组化染色,微卫星不稳定性(Microsatellite instability,MSI),错配修复缺陷(deficient Mismatch Repairprotein,dMMR)和肿瘤突变负荷(Tumor mutational burden,TMB)等等。
其中,TMB定义为每一百万碱基中非同义的体细胞突变,体细胞突变的检测方法对于准确测量TMB极其重要,在多个临床试验中,当肿瘤样本的TMB>10时,称之为TMB-High(TMB-H)状态,反之为TMB-Low(TMB-L)状态。
TMB在很多种类的癌症中都具有指标意义,例如,肺癌、黑色素瘤和结直肠癌等等。当肿瘤呈现TMB-H状态时,对某些免疫治疗药物(Pembrolizumab等)敏感。
但迄今为止,大部分TMB的测定仍然依赖于全外显子组测序(WES)。虽然WES可以从理论上直接测量TMB,但是在实际临床过程中却很难应用,因为它耗时费力,并且成本高昂。
鉴于此,特提出本发明。
发明内容
本发明的目的在于提供用于预测肿瘤突变负荷的核酸组合物、用于预测肿瘤突变负荷的方法、设备和计算机可读介质。
本发明是这样实现的:
第一方面,实施例提供一种用于预测肿瘤突变负荷的核酸组合物,其包括探针组1~9;
其中,探针组1包括用于捕获KMT2D基因的外显子区域的探针;
探针组2~9分别包括用于捕获DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因的启动子及其上游区域的探针。
第二方面,实施例提供一种用于预测肿瘤突变负荷的方法,所述方法包括采用如前述实施方式任一项所述的核酸组合物获取待测样本的肿瘤突变负荷。
第三方面,实施例提供一种用于预测肿瘤突变负荷的设备,其包括存储单元及与所述存储单元电连接的执行单元;
其中,所述存储单元,用于存储预测待测样本肿瘤突变负荷的预测模型;
所述执行单元,用于接收如前述实施方式任一项所述的核酸组合物中的探针组1~9分别获取的对应基因的突变总数,并通过预测模型计算所述待测样本的肿瘤突变负荷。
第四方面,实施例提供一种计算机可读介质,所述计算机可读介质存储有计算机程序,其中,所述计算机程序能被处理器执行以实现如前述实施方式任一项所述的方法的步骤。
本发明具有以下有益效果:
本发明实施例提供了一种用于预测肿瘤突变负荷的方法,该方法包括对目标基因及其区域进行选择限定,通过检测9个基因的外显子和/或启动子及其上游区域,以有效快速地预测待测样本的TMB状态。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本发明试验例1中的9个TMB相关基因的线性回归曲线图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将对本发明实施例中的技术方案进行清楚、完整地描述。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市售购买获得的常规产品。
名词定义
本说明书的“待测样本的肿瘤突变负荷”又称TMB,被定义为每百万碱基中被检测出的,体细胞基因编码错误、碱基替换、基因插入或缺失错误的总数。
本说明书中的“探针”是指一小段单链DNA或RNA片段,用于检测与其互补的核酸序列。当将探针与样品杂交时,探针和与其互补的核酸(DNA或RNA)序列通过氢键紧密相连,随后,未被杂交的多余探针被洗去。最后,根据探针的标记物种类,可进行放射自显影、荧光发光和酶联化学发光等方法来判断样品中是否,或者何位置含有被测序列(即与探针互补的序列)。
本发明技术方案的具体实施方式。
第一方面,实施例提供一种用于预测肿瘤突变负荷的核酸组合物,其包括探针组1~9;
其中,探针组1包括用于捕获KMT2D基因的外显子区域的探针;
探针组2~9分别包括用于捕获DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因的启动子及其上游区域的探针。
本申请研究发现,通过对选定特定基因(上述9个基因)或特定目标区域(KMT2D基因的外显子区域和DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因的启动子及其上游区域)的检测和分析,能够快速且有效的预测待测样本的TMB状态,与全基因组或全外显子测序相比,具有检测时间更快,检测成本更低的优点。
需要说明的是,探针组1用于检测KMT2D的外显子区域,是指探针组1包括能够对KMT2D的外显子区域进行继续连续检测、或间隔检测,或对其中的任意部分区域进行检测的探针;探针组2用于检测DUSP22的启动子及其上游区域,是指探针组2包括能够对DUSP22的启动子及其上游区域进行继续连续检测、或间隔检测,或其中的任意部分区域进行检测的探针;探针组3~9依此类推。
在可选的实施方式中,所述KMT2D基因的外显子区域包括区域1~54中的至少一个区域或多个区域的组合。
其中,区域1选自染色体12的第49021778~49021872位碱基的区域。需要说明的是,本申请中“区域1选自染色体12的第49021778~49021872位碱基的区域”是指:区域1为染色体12的第49021778~49021872位碱基或染色体12的第49021778~49021872位碱基中的部分区域。且用于检测区域1的探针包括但不限制为1个,可以是多个探针的组合,只要是用于检测上述区域1的探针均包含于探针组1中,区域2~54依次类推。
区域2选自染色体12的第49022041~49022151位碱基的区域;
区域3选自染色体12的第49022278~49022353位碱基的区域;
区域4选自染色体12的第49022588~49022875位碱基的区域;
区域5选自染色体12的第49024576~49024708位碱基的区域;
区域6选自染色体12的第49024808~49024946位碱基的区域;
区域7选自染色体12的第49026180~49027322位碱基的区域;
区域8选自染色体12的第49027801~49027930位碱基的区域;
区域9选自染色体12的第49028007~49028141位碱基的区域;
区域10选自染色体12的第49028826~49028958位碱基的区域;
区域11选自染色体12的第49029059~49029236位碱基的区域;
区域12选自染色体12的第49029399~49029476位碱基的区域;
区域13选自染色体12的第49030278~49030439位碱基的区域;
区域14选自染色体12的第49030599~49030768位碱基的区域;
区域15选自染色体12的第49030891~49031033位碱基的区域;
区域16选自染色体12的第49031173~49033964位碱基的区域;
区域17选自染色体12的第49034065~49034299位碱基的区域;
区域18选自染色体12的第49034408~49034476位碱基的区域;
区域19选自染色体12的第49034580~49034666位碱基的区域;
区域20选自染色体12的第49034810~49034935位碱基的区域;
区域21选自染色体12的第49037123~49038989位碱基的区域;
区域22选自染色体12的第49039220~49039358位碱基的区域;
区域23选自染色体12的第49039433~49039617位碱基的区域;
区域24选自染色体12的第49039722~49041535位碱基的区域;
区域25选自染色体12的第49041653~49041705位碱基的区域;
区域26选自染色体12的第49041915~49041990位碱基的区域;
区域27选自染色体12的第49042087~49042330位碱基的区域;
区域28选自染色体12的第49042559~49042645位碱基的区域;
区域29选自染色体12的第49042739~49042878位碱基的区域;
区域30选自染色体12的第49043074~49043186位碱基的区域;
区域31选自染色体12的第49043361~49043428位碱基的区域;
区域32选自染色体12的第49043633~49043782位碱基的区域;
区域33选自染色体12的第49043866~49043998位碱基的区域;
区域34选自染色体12的第49044198~49044304位碱基的区域;
区域35选自染色体12的第49044401~49044522位碱基的区域;
区域36选自染色体12的第49044742~49044965位碱基的区域;
区域37选自染色体12的第49045918~49045967位碱基的区域;
区域38选自染色体12的第49046063~49046174位碱基的区域;
区域39选自染色体12的第49046258~49046424位碱基的区域;
区域40选自染色体12的第49046607~49046790位碱基的区域;
区域41选自染色体12的第49047963~49048069位碱基的区域;
区域42选自染色体12的第49048657~49048769位碱基的区域;
区域43选自染色体12的第49049103~49049218位碱基的区域;
区域44选自染色体12的第49049680~49050790位碱基的区域;
区域45选自染色体12的第49050884~49052424位碱基的区域;
区域46选自染色体12的第49052562~49052709位碱基的区域;
区域47选自染色体12的第49052913~49053072位碱基的区域;
区域48选自染色体12的第49053205~49053321位碱基的区域;
区域49选自染色体12的第49053474~49053641位碱基的区域;
区域50选自染色体12的第49053976~49054140位碱基的区域;
区域51选自染色体12的第49054305~49054416位碱基的区域;
区域52选自染色体12的第49054526~49054751位碱基的区域;
区域53选自染色体12的第49054898~49055026位碱基的区域;
区域54选自染色体12的第49055274~49055324位碱基的区域。
在可选的实施方式中,DUSP22基因的启动子及其上游区域选自染色体6的第289100~292460位碱基的区域。
优选地,MYCT1基因的启动子及其上游区域选自染色体6的第152694894~152697893位碱基的区域。
优选地,OR1C1基因的启动子及其上游区域选自染色体1的第247758680~247761405位碱基的区域。
优选地,OR4D11基因的启动子及其上游区域选自染色体11的第59500575~59503574位碱基的区域。
优选地,OR4M2基因的启动子及其上游区域选自染色体15的第22077526~22080525位碱基的区域。
优选地,OR4N4基因的启动子及其上游区域选自染色体15的第22091521~22094429位碱基的区域。
优选地,TMEM132C基因的启动子及其上游区域选自染色体12的第128264402~128268401位碱基的区域。
优选地,ZNF595基因的启动子及其上游区域选自染色体4的第50332~53302位碱基的区域。
在可选的实施方式中,所述探针组1包括探针1~77,探针1~77的碱基序列分别如SEQ ID No.1~77所示。
优选地,探针组2包括探针78~101,探针78~101的碱基序列分别如SEQ ID No.78~101所示。
优选地,探针组3包括探针102~116,探针102~116的碱基序列分别如SEQ IDNo.102~116所示。
优选地,探针组4包括探针117~122,探针117~122的碱基序列分别如SEQ IDNo.117~122所示。
优选地,探针组5包括探针123~131,探针123~131的碱基序列分别如SEQ IDNo.123~131所示。
优选地,探针组6包括探针132~153,探针132~153的碱基序列分别如SEQ IDNo.132~153所示。
优选地,探针组7包括探针154~174,探针154~174的碱基序列分别如SEQ IDNo.154~174所示。
优选地,探针组8包括探针175~197,探针175~197的碱基序列分别如SEQ IDNo.175~197所示。
优选地,探针组9包括探针198~211,探针198~211的碱基序列分别如SEQ IDNo.198~211所示。
第二方面,实施例提供一种用于预测肿瘤突变负荷的方法,所述方法包括采用如前述实施方式任一项所述的核酸组合物获取待测样本的肿瘤突变负荷。
本文公开的方法具有优于传统检测肿瘤突变负荷方式的优势,如检测周期和成本,且该方法可以为肿瘤患者的治疗方法提供参考依据。在可选的实施方式中,待测样本可以为肿瘤样本(外周血样本或肿瘤组织样本)、FFPE样品和胸水等,肿瘤组织样本建议进行病理质控,肿瘤细胞含量最好不低于20%。检测中,对照样本可以选择白细胞样本、唾液样本、口腔拭子或者癌旁组织样本等可获取个人全部遗传信息的非癌症组织样本,优选白细胞样本。
在可选的实施方式中,所述方法还包括提取待测样本的DNA,获取待测样本的DNA文库,以用于后续的杂交捕获,或将已经提取自肿瘤样本的DNA文库(DNA片段)作为待测样本。
在可选的实施方式中,获取待测样本的肿瘤突变负荷包括:采用预测模型,基于所述核酸组合物中的探针组1~9分别获取的对应基因的突变总数,计算待测样本的肿瘤突变负荷;
优选地,所述预测模型的公式为:TMB=3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595;
公式中,KMT2D为KMT2D基因的突变总数;DUSP22为DUSP22基因的突变总数,以此类推。
在可选的实施方式中,所述突变总数的获取方法为:通过对探针组1~9中的1组或多组获取的捕获片段进行测序比对,获取捕获片段对应目标捕获区域的突变总数(本文中的突变总数是指点突变的总数)的数量。需要说明的是,每组探针组获取的捕获片段的突变总数,即为对应基因的突变总数。
在可选的实施方式中,在计算肿瘤突变负荷前,所述方法包括采用探针组1~9对待测样本的基因组文库进行杂交捕获,杂交捕获后,对探针组1~9捕获的片段进行分离、纯化和扩增,经测序比对后,获取目标区域的突变总数。
在可选的实施方式中,所述方法还包括所述方法还包括根据TMB值进行判读:当TMB值大于或等于10时,判读待测样本为TMB-H状态,当待测样本的TMB值小于10时,判定待测样本为TMB-L状态。需要说明的是,根据“TMB值”是指预测模型计算的数值。
第三方面,实施例提供一种用于预测肿瘤突变负荷的设备,其包括存储单元及与所述存储单元电连接的执行单元;
其中,所述存储单元,用于存储预测待测样本肿瘤突变负荷的预测模型;
所述执行单元,用于接收如前述实施方式任一项所述的核酸组合物中的探针组1~9分别获取的对应基因的突变总数,并通过预测模型计算所述待测样本的肿瘤突变负荷。
存储单元可以是但不限于,随机存取存储器(Random Access Memory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-Only Memory,EEPROM)等。
执行单元可以是一种集成电路芯片,具有信号处理能力。该执行单元可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(Digital Signal Processing,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件和分立硬件组件。
在可选的实施方式中,所述预测模型的公式为:TMB=3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595;
公式中,KMT2D为KMT2D基因的突变总数;DUSP22为DUSP22基因的突变总数,以此类推。
在可选的实施方式中,所述设备还用于根据TMB指进行判读,当TMB值大于或等于10时,判读待测样本为TMB-H状态,当待测样本的TMB值小于10时,判定待测样本为TMB-L状态。
第四方面,实施例提供一种计算机可读介质,所述计算机可读介质存储有计算机程序,其中,所述计算机程序能被处理器执行以实现如前述实施方式任一项所述的方法的步骤。
需要说明的是,本实施例提供的计算机可读介质等同于前述实施方式中的存储单元。本实施例中的“处理器”等同于前述实施方式中的“执行单元”。
以下结合实施例对本发明的特征和性能作进一步的详细描述。
实施例1
本实施例提供一种用于预测肿瘤突变负荷的核酸组合物,其包括探针组1~9。
具体地,请参照表1,所述探针组1包括序列分别如SEQ ID No.1~77所示的探针1~77,探针组2包括碱基序列分别如SEQ ID No.78~101所示的探针78~101;探针组3包括碱基序列分别如SEQ ID No.102~116所示的探针102~116;探针组4包括碱基序列分别如SEQ ID No.117~122所示的探针117~122;探针组5包括碱基序列分别如SEQ ID No.123~131所示的探针123~131;探针组6包括碱基序列分别如SEQ ID No.132~153所示的探针132~153;探针组7包括碱基序列分别如SEQ ID No.154~174所示的探针154~174;探针组8包括碱基序列分别如SEQ ID No.175~197所示的探针175~197;探针组9包括碱基序列分别如SEQ ID No.198~211所示的探针198~211。
表1核酸组合物
实施例2
本实施例提供一种用于预测肿瘤突变负荷的方法,其包括以下步骤。
(1)样本采集
待测样本可以为肿瘤样本(外周血样本或肿瘤组织样本)、FFPE样品和胸水等,肿瘤组织样本建议进行病理质控,肿瘤细胞含量最好不低于20%。检测中,对照样本可以选择白细胞样本、唾液样本、口腔拭子或者癌旁组织样本等可获取个人全部遗传信息的非癌症组织样本,优选白细胞样本。(2)DNA提取
使用DNA提取试剂盒进行DNA提取,DNA质量应不低于10ng,260/280吸光值在1.8~2.0之间,组织样本主要DNA片段分布应不低于200bp。
(3)文库制备
文库制备包括4个主要过程(末端修复、加A、加接头和文库扩增),两端接头含有6~12bp的随机分子标签,用于分子校准,接头为Illumina、ThermoFisher或BGISeq等测序平台中的任意一种。需要说明的是,ctDNA样本(循环肿瘤DNA)可直接进行建库,组织样本需进行片段化,使其长度集中在200~500bp左右,再开始建库步骤。
(4)杂交捕获
采用实施例1提供的探针1~211对制备好的全基因组文库进行探针捕获,探针的序列和捕获的区域详细参见表1所示。
以Agilent SureSelect Fast Hybridization试剂盒为例,杂交开始时将步骤(3)制备的预文库(片段化的DNA)轻弹混匀后瞬时离心,冰上放置融化。融化后加入水稀释,使之浓度不超过83ng/μL。每12μL预文库中加入5μL Low Input Blocker Mix,混匀后放入PCR仪中按照表2所示的杂交程序反应。
表2杂交程序
备注:13μL杂交液的成分包括:2μL 25%RNase Block,6μL Agilent SureSelectFast Hybridization Buffer,2μL探针溶液(实施例1中的探针1~211)和3μL水。
(5)磁珠捕获
准备捕获试剂,按要求平衡室温、混匀。按样本数量准备PCR管,标记Cn。涡旋磁珠1min以上,充分混匀后按每反应50μL的量将磁珠装入合适的离心管中(离心管容量需大于磁珠体积的5倍,可分装多管),取出的磁珠按以下步骤进行洗涤。
每50μLT1磁珠加200μL Binding Buffer(结合缓冲液),涡旋8s充分混匀,将离心管放置在磁力架上5min,待溶液澄清后吸弃上清;重复上一步骤2次,共洗3次;每反应(50μL磁珠原液)加入200μL Binding Buffer,涡旋1min以上充分重悬磁珠;按样本数量准备1.5mL或0.6mL离心管,标记Cn。并将重悬好的T1磁珠按200μL每管分装到Cn管中。
取出步骤(4)得到的杂交产物Zn,瞬时离心后全部转移到含T1磁珠的Cn管中(检查每管Zn液体损耗不超过4μL)。震荡混匀,放置到恒温混匀仪上,室温1600rpm(在其他实施例中,可以为1400~1800rpm)混合30min(混合15min时取出离心管涡旋混匀一次)。用合适规格的离心管分装,每反应1.3ml Wash Buffer 2(清洗缓冲液),然后放到70℃3h的PCR仪上预热,热盖105℃(如PCR仪不能预热足够的试剂,则可使用70℃恒温金属浴或水浴锅预热)。混合结束从恒温混匀仪上取下样本,瞬时离心后放到磁力架上,待溶液澄清,去除上清。将样本管从磁力架上取下,每管加入200μl Wash Buffer 1,吸打15-20次或涡旋5-10s混匀,并转移到标记Cn的PCR管中。将PCR管放置在磁力架上1min,待溶液澄清,去除上清。将样本管从磁力架上取下,按以下步骤洗涤磁珠:
a.样本管加入200μL 70℃预热的SureSelect Wash Buffer 2,盖上管盖涡旋8s混匀,瞬时离心(注意不要使磁珠沉淀);
b.将步骤a得到的样本管放在PCR仪上70℃孵育10min;
c.将步骤b的样本管取出放置在磁力架上室温静置1min,待溶液澄清,吸弃上清。
d.将a到c步骤再重复5次,共6次。
最后,将样本管短暂离心后置于磁力架上静置1min,用10μL移液器吸弃剩余液体。向每个样本管加入25μL水,盖上管盖涡旋8s混匀,瞬时离心(注意避免磁珠沉淀),把样本(捕获文库)置于冰上待用。
(6)捕获文库的扩增
准备终文库扩增试剂,按要求解冻、混匀、瞬时离心。取出步骤(5)获得的捕获文库Cn,涡旋重悬磁珠,瞬时离心后,冰上放置备用,并按照表3配置扩增反应液。
表3文库扩增反应液
将按照表3配置好的反应液与25μL步骤(5)的捕获文库混合后(总体积50μL),放入PCR仪,按照表4所示的扩增程序进行PCR反应。
表4扩增反应程序
(7)产物纯化
提前将XP磁珠从冰箱中取出放置室温平衡30min,涡旋1min以上充分混匀,按样本数量准备1.5mL离心管,标记PCn;往PCn离心管内加50μL已混匀的XP磁珠。将步骤(6)获得的PCR产物放置磁力架上2min,待溶液澄清后,将全部上清(约50μL)转移到分装好的50μL磁珠中,吸打5-8次混匀,盖上管盖涡旋5-10s混匀;室温孵育5min,短暂离心后放置磁力架上吸附磁珠5min至液体澄清,吸弃上清;加入200μL 80%乙醇,盖上离心管盖,在磁力架上顺时针旋转离心管8次,每次45°,将离心管转回原位置,快速吸弃上清;重复上个步骤两次;将样本管瞬时离心后置于磁力架上,吸弃管底余液;磁力架上开盖晾干至磁珠表面哑光,加入25μL水洗脱,涡旋混匀,室温孵育5min,瞬时离心。样本管置于磁力架吸附磁珠5min至液体澄清,收集全部上清于对应标记Lib-样本条码的低吸附1.5mL管中,管身标记对应样本条形码及检测批次。放置冰上进行下一步质检,或将产物放置于-20℃保存。
(8)上机测序
将步骤(7)获得的纯化产物进行测序,测序可以为单端测序或双端测序,单条模板测序总读长应不低于2×75bp,测序深度在2000×以上;具体步骤应使用文库试剂盒和测序仪生产厂商的推荐流程。
数据处理
使用FastQC检测测序数据质量;使用Trimmomatic去除平均测序质量小于28的reads,去掉长度小于74bp的reads(读长,为高通量测序中一个反应获得的测序序列);使用bwa,或者与之相当的软件将测序结果map至人类基因组参考序列;使用GATK BestPractices Workflows其中的Data pre-processing流程得到处理完毕的BAM文件;使用GATK mutect2检测肿瘤样本的突变总数;使用GATK FilterMutectCalls过滤掉突变reads支持数小于3的变异,得到用于计算TMB的VCF文件。将获得的VCF文件经过oncotator软件注释,得到maf结果文件,在此文件中,首先去除在Hugo_Symbol列中不属于DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595九个基因名称的条目。
然后,对于KMT2D基因,过滤出(选择)在Variant_Classification列为“Missense_Mutation”的条目,得到KMT2D基因点突变的数量,即KMT2D的突变总数)。
对于其他基因(DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595),过滤出(选择)在Variant_Classification列为“5’UTR”和“5’Flank”的条目,条目的数量即为这些基因在启动子和启动子上游区域的突变的数量(即每个基因相对应的突变总数)。
(9)TMB的计算
采用预测模型,基于探针组1~9分别获取的9个TMB相关基因(KMT2D、DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因)的突变总数,计算待测样本的肿瘤突变负荷。
预测模型为:
TMB=3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595;
公式中,KMT2D为KMT2D基因的突变总数;DUSP22为DUSP22基因的突变总数,以此类推。
设定TMB的阈值为10,当待测样本的TMB值大于或等于10时,判定样本为TMB-H状态,当待测样本的TMB值小于10时,判定样本为TMB-L状态。
试验例1
采用实施例1提供的核酸组合物,按照实施例2提供的用于预测肿瘤突变负荷的方法,针对109个已知TMB状态的肺鳞癌样本进行验证,验证结果如附图1和表4所示。
由图1为9个TMB相关基因的线性回归曲线,所得线性回归结果的R2(确定系数)在0.8以上(图1),Cutoff=10为界限,设定样本的TMB值在10以上为TMB-H状态,低于10为TMB-L状态。由图1可以看出,对于109个验证样本,落在预测正确区域的有94个样本,对于两个预测错误区域,在左上为11个样本,右下为4个样本。由此可绘制表4
表4预测结果
由表4可以计算出,灵敏度=真阳性人数/(真阳性人数+假阴性人数)ⅹ100%=31/35ⅹ100%=88.6%
特异度=真阴性人数/(真阴性人数+假阳性人数)ⅹ100%=63/74ⅹ100%=85.1%。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
SEQUENCE LISTING
<110> 中国医学科学院肿瘤医院
<120> 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备
<160> 211
<170> PatentIn version 3.5
<210> 1
<211> 120
<212> DNA
<213> 人工序列
<400> 1
tgtggtgaca gttgggggca atgccctcat catgctggct gtggcctcta gtcggacact 60
gcacccacca atgtacttct tcctctgcca cttctccctg ctggagattg gctatacctc 120
<210> 2
<211> 120
<212> DNA
<213> 人工序列
<400> 2
atctgctgcc cccttcacta tcctgccctg atgagcacct ggttttgtca ctgcctggcc 60
gctggtgctt ggttcagtgg cttcttctcc tctgccttca ctatggccct ggcagcacct 120
<210> 3
<211> 120
<212> DNA
<213> 人工序列
<400> 3
agcatctcag gcttcctgac actggccgcc ttcctactga ttgtggcatc ctctgccttc 60
attgagggct gtactgcaaa taccctcagg ccatgagagg cagaaagcct tcttcacctg 120
<210> 4
<211> 120
<212> DNA
<213> 人工序列
<400> 4
ctcaagaacc aagaggtgaa gggggctctg cataggctca ggggacagct catcccagga 60
cacactcact aaggaggaca ggacagcttt tgacttcttc ctggattgat ttcagcttag 120
<210> 5
<211> 119
<212> DNA
<213> 人工序列
<400> 5
ccccttcctc aaagtctgat ggactagaga ccactgcaat aaaaagatgg agactgtggg 60
attgaaaatg gatgtctacc aaaatgaggt aactgtattt tccaattgga attggcctc 119
<210> 6
<211> 120
<212> DNA
<213> 人工序列
<400> 6
gtgagccact gcacccggcc tcaactcagt cttaaaaatg gattttcatt tcagatagca 60
ctagtacagc ataagttatg tctcatcttt cccatggcct attggatgac ctctcatcat 120
<210> 7
<211> 120
<212> DNA
<213> 人工序列
<400> 7
ggagcactct cccttttcta tccatacctt ttgctctctc tgacacaggg atctgcttgg 60
ttcagtgtga gagtaatttg aacacccagg cctttaatgg aaaaaactgc tgatggcagt 120
<210> 8
<211> 120
<212> DNA
<213> 人工序列
<400> 8
taaatacctg accagctgta agctgtgaga ctgtttaaac atggctcttg gagaaggtag 60
cccagaagat ggggtaattt ctcaaggttc tttgaagttc tgaatcttcc cccatctctg 120
<210> 9
<211> 120
<212> DNA
<213> 人工序列
<400> 9
cctccaaaat aaaagttact caagttcacc tgtctcaagc agaatgctta aggactgggt 60
caagatggag cctttcctac atgatataaa cagctggata tcccattctc tccaagccca 120
<210> 10
<211> 120
<212> DNA
<213> 人工序列
<400> 10
ccactgaagt ttcctatatc tcctctggaa agatgattaa ggaaaattat tgtctcagaa 60
attcctgagg gtcatccaga ttgggctaaa attgacagct gaatatggca ttctagatgc 120
<210> 11
<211> 120
<212> DNA
<213> 人工序列
<400> 11
tagctctcaa aatgccagct cttataaaat tcatttattg gagagggtta atcttattct 60
ccatcaccag aaggagactc aagaggaaac agaaggaaat tgtgggagag gtttgattta 120
<210> 12
<211> 120
<212> DNA
<213> 人工序列
<400> 12
cagacaggga aagattggca gaatatcagg gtgatgagct tagggaaata actaaactgc 60
tgtaagaaag tcccaaaaat atggtgctag acatttattt gtctctcaca atagtctaag 120
<210> 13
<211> 119
<212> DNA
<213> 人工序列
<400> 13
atgggtagac aggctccttt attccacaaa gacattcaga aacccaggtt ctttccattt 60
tgcatctcca ccattctctt tattaaaata tattttattt attttttatt ttatttatt 119
<210> 14
<211> 120
<212> DNA
<213> 人工序列
<400> 14
gtgagccacc atgcctggcc actttacgtt ttactttgga atgtggcatc tgtctattgt 60
ctttaggact cagctgaaac taaaatgaaa agcgtttctc attttatctc ctgattcatt 120
<210> 15
<211> 120
<212> DNA
<213> 人工序列
<400> 15
gttttacttt ggaatgtggc atctgtctat tgtctttagg actcagctga aactaaaatg 60
aaaagcgttt ctcattttat ctcctgattc attgtctttt aacagtttat aaagcacttt 120
<210> 16
<211> 120
<212> DNA
<213> 人工序列
<400> 16
aaaaaaaaaa aaaaaaagaa ttctgtcccc tccttgggta gaatgaatta ttattcccaa 60
ttccttacct cctacgtcag tgtgatcttc cagaccacac ataggacaga gtattatttc 120
<210> 17
<211> 119
<212> DNA
<213> 人工序列
<400> 17
tctaatgcaa ctcctttctg ctccctacat aaaatcatca aagttgagag tgcatacata 60
tttttttgta gatgtttact ttgcacttaa gaaataaggc caggcacagt ggctcatgc 119
<210> 18
<211> 120
<212> DNA
<213> 人工序列
<400> 18
aaaaaaaaga aagaaagaaa agttaattct tttgtttggg acacttcttt taacagagct 60
ttggatgtgg agtgttttca ttcaatccta gaagcacaac attgttcttt ttagtctttt 120
<210> 19
<211> 120
<212> DNA
<213> 人工序列
<400> 19
agcaagacat gaacttttct gcccatttaa aaaaacaaaa caaaaagcag tagcagaggt 60
aacagtggac ttttttgatc atccccaaat ctggatgtaa attggacttt gaagcagttt 120
<210> 20
<211> 120
<212> DNA
<213> 人工序列
<400> 20
gcctcagagc gctgaattca aacacatgtc ctaaaaactt gacctacctt tttttaatgc 60
tgcatccaaa gagcaagtgc agagggaagg gggctacact aaaagaaaag caagcaatca 120
<210> 21
<211> 119
<212> DNA
<213> 人工序列
<400> 21
acaggaaaaa ctgccattcc atacagaagt aatgctttga tcttccactg tattatttta 60
ttgaaagcca ataagctttc tttattagga aggagatgct gggcacggtg gctcacgcc 119
<210> 22
<211> 120
<212> DNA
<213> 人工序列
<400> 22
aaaaaaaaaa gaaaaggaaa ggaaaagaag gaaggagatt aggaaagatt aggcttgttg 60
ctctcatttt tgttccagca acactgacct cacggttaaa ggggaaaaaa agaaaatcct 120
<210> 23
<211> 120
<212> DNA
<213> 人工序列
<400> 23
tcaataaagc tgttaaaaaa taaaattggt aacagtcaac cacaaataag acaataaaat 60
ataaatctca aaattgctct atggctaaag agaaagaggt ttgactaaaa ctttgagtta 120
<210> 24
<211> 120
<212> DNA
<213> 人工序列
<400> 24
aaaactttga gttatatcca atgaatgtgg aataaacaca ttacaagaat atgaactcat 60
atggggcaca acgtaaaaat tatctcattg atgaatctat ttgcattctt atgccagctc 120
<210> 25
<211> 120
<212> DNA
<213> 人工序列
<400> 25
gtaaaatgga gataattata taacaatgcc tggcacatgc aagcactaac tgtaagctga 60
taattacaca aaccagtaat agcagtagtg actctttcag ttctggcaat ctatggccta 120
<210> 26
<211> 120
<212> DNA
<213> 人工序列
<400> 26
tcagttctgg caatctatgg cctataacca atcccaaagg atatgaggtt tatatgtcca 60
gtgaattcta gaaacaacaa ttcaacagga agaaaaatac cctacagttt ttggatgagg 120
<210> 27
<211> 120
<212> DNA
<213> 人工序列
<400> 27
ataccctaca gtttttggat gagggcaaaa taaggagtca gacaaccaga aaggagtcct 60
aaatagctgt gacaaagggt cagacacagg aaggcaggca ttctcatagc agtaggtcct 120
<210> 28
<211> 120
<212> DNA
<213> 人工序列
<400> 28
ggcattctca tagcagtagg tccttccact tcctccacta ctttacattt catggtaagc 60
ccatcccaac tttacccgag cccctccagg agtgagaaca ctctctccca tacaggttcc 120
<210> 29
<211> 120
<212> DNA
<213> 人工序列
<400> 29
aacactctct cccatacagg ttcctgctgc taagtggctc acccagtctg atcatggtac 60
cacttttatt agatttttct actaattatt caatgcaaat atacaccagg cactacacag 120
<210> 30
<211> 120
<212> DNA
<213> 人工序列
<400> 30
cttggaaaga aatggttaga gaaatgcatt ggtaaaatgt gattggtgtc agggaccttg 60
ggatgctgct tccagcagct caaaacccca ccactgagat tctgctgaac agaattcttc 120
<210> 31
<211> 120
<212> DNA
<213> 人工序列
<400> 31
catctagagg gaacctgagt ttctgtactt catgatgctt tttcaagcag atctagaggc 60
tacagacact cctaacaatg ggtgatgtgt cactgataaa tgactaggga ctgggagcag 120
<210> 32
<211> 120
<212> DNA
<213> 人工序列
<400> 32
acttttcctt cttcaccagg ttactggggc ccaactgagc tggctgagga gtaacccctg 60
cccctttaca gtgcctcatc cgtcacaggt tgtttctcct ccacctttcc acctctgtgc 120
<210> 33
<211> 120
<212> DNA
<213> 人工序列
<400> 33
tctccgagtg tagggagatt tccccaacct tagaggtccc ctcaagaggg tactgtctcc 60
ctagtcccct cttgtcactg cagccatggt ggcctatgca gacttgggcc agaggggaca 120
<210> 34
<211> 120
<212> DNA
<213> 人工序列
<400> 34
gacagatcct ggtctgaagg cagacttttc cccagactac agtaaaactg actgttgcac 60
catgcttcag ctttgtgtcc agcatttttt ctgcagctga agacagtgac aacaagctag 120
<210> 35
<211> 120
<212> DNA
<213> 人工序列
<400> 35
atgttatgtg gtgcatgact atatgcttta ggtagcatgt gggtgcaaaa tgagttactc 60
cacactaaga cttgtataaa acacatgcaa agttacttta aaaatataaa acagccctag 120
<210> 36
<211> 120
<212> DNA
<213> 人工序列
<400> 36
aacacatgca aagttacttt aaaaatataa aacagcccta ggccaagatt tgactgaaac 60
atttattgat attaacattt tcttttggtt tgtgtgtgtt ttcttttttt taagaggtag 120
<210> 37
<211> 120
<212> DNA
<213> 人工序列
<400> 37
gtgagcctcc atacccagcc agtttgtgta tttttgatag ccctagcata accttttggt 60
ctcctagggt aacgcagcta agagtcagac gattctggct cacaaaatct caggatagta 120
<210> 38
<211> 120
<212> DNA
<213> 人工序列
<400> 38
attctggctc acaaaatctc aggatagtat attactgtat aatagctgct ggacaccatg 60
aaaaatagga catggtccaa agtgtccccc caccaccctt ttctttcttt gagacggagt 120
<210> 39
<211> 120
<212> DNA
<213> 人工序列
<400> 39
gtgagccacc acacctggcc ccaaaggatc cattttttaa cacacacaca ctggttgcag 60
aaaacgacat tcccattaca tcatttccac ccttttacta ttaccatgac attcaagggt 120
<210> 40
<211> 120
<212> DNA
<213> 人工序列
<400> 40
attaccatga cattcaaggg taataaagga agaagcctga tactgcaacc ttatacctca 60
ttcagagcct ctagtcaaag tcacttccct acctgtttct tgtcacctgg gcatcctaag 120
<210> 41
<211> 120
<212> DNA
<213> 人工序列
<400> 41
ttgtcacctg ggcatcctaa gacattttgc tccacaagtt agcatgtggg aattccctcc 60
atgcctgtca tcaacaaatc aaaagaatat catagagttg acctatcaac aagtgaaagg 120
<210> 42
<211> 120
<212> DNA
<213> 人工序列
<400> 42
gacctatcaa caagtgaaag gtaaggggat gagcattcta aaacaaagga gtacaaactg 60
ttactaggtc cagtgtttga gataatgaaa atctacaggc ttatattttt gtaaacagga 120
<210> 43
<211> 120
<212> DNA
<213> 人工序列
<400> 43
tacaggaaga aaatgggtgg ccatgaattg atgtcagaag aaactatcca agaaggcaac 60
aaaaagatga aaaatttcca tgtaagaggt atagagtaag aagatattta gcacagattt 120
<210> 44
<211> 120
<212> DNA
<213> 人工序列
<400> 44
aaggcaacaa aaagatgaaa aatttccatg taagaggtat agagtaagaa gatatttagc 60
acagatttaa tcagaatctc agagggagac agaagattct ggcttggact tccagaacaa 120
<210> 45
<211> 120
<212> DNA
<213> 人工序列
<400> 45
aattcaaacc ccatgtactt ggctacattt cagtttcctt ttcaaataaa tctaagaatg 60
gctggagaat agcctgtaag agaaagaaca tttcaggatg actgcccata gataaatatg 120
<210> 46
<211> 119
<212> DNA
<213> 人工序列
<400> 46
gccatgctga agcagctggt tgttttgttt tttcctgaca acaatgaggt gtaactgaag 60
gctaggggtt gccataagca gtgagagaca ggataaagtt ttcaagatca ttctggctg 119
<210> 47
<211> 110
<212> DNA
<213> 人工序列
<400> 47
tagtcagatc acatctcaaa tataaacaca cacataaata aaaagtaatg tttgtctttg 60
tggataaagt ataaaatgca ctagactagg ctaggcatgg tggctcacac 110
<210> 48
<211> 120
<212> DNA
<213> 人工序列
<400> 48
aaaaaaaaaa aaaaaaaaaa gtactagact agagaatcaa aaaagcagtg ggaactacaa 60
acttaaaaag agtatcactg gaagacccag taaaggcaat ctccccagtg gttcatctga 120
<210> 49
<211> 120
<212> DNA
<213> 人工序列
<400> 49
tgggcctttt atgagttact ttcaaccatt ctctgaatgt aaatgcttaa agttaagatg 60
atggtataac tgtaagccat tctgtgccca tttcagttct tatagaaagt aatcttttgc 120
<210> 50
<211> 120
<212> DNA
<213> 人工序列
<400> 50
tttctagcat aggtacctca accctaactg aacttctatt ttaatcctgc tctaagattc 60
agtgtcaaaa cgatcttgac aatacctatc tatgtctatc ttagtgatcc agcatcaggc 120
<210> 51
<211> 119
<212> DNA
<213> 人工序列
<400> 51
ccaatttctc tatgttttaa gtatattcct accactagag aattctgaga tggtattagc 60
attatttttt taaaaataat tatttaaaat ttaaaaatat agacacaggg tctcaccac 119
<210> 52
<211> 120
<212> DNA
<213> 人工序列
<400> 52
ccctgttaaa agaaataaag gcacttcagt tagtaattca ttcactgtgg tctgaagtat 60
gaatctgact tatcagtggc cacttaaact agcaataaga acaatacaac agaaattaat 120
<210> 53
<211> 120
<212> DNA
<213> 人工序列
<400> 53
tctagcaggg aaccctctgc ctggccaggt cactacatga gggaaacagg tgggactgtt 60
cttcacttgc caaaatatcc actgggtctt cagcaatttc tttgactaaa tgatcttcaa 120
<210> 54
<211> 119
<212> DNA
<213> 人工序列
<400> 54
caacaaatga aacaagatcc aaaagcactg agagcttttg ctgccaagtg taaaacatag 60
accaatacag tagattaaaa aacaaaattc tggccaccac acctctaatc ccagcactt 119
<210> 55
<211> 120
<212> DNA
<213> 人工序列
<400> 55
ttttactaca attaaaaaaa tattttttaa aaaagcatat tctctgaggc tacctgtaat 60
gaacatgtaa gttcaccagt gattaattta aatatgaaca atgctacgtt aaaattaaat 120
<210> 56
<211> 120
<212> DNA
<213> 人工序列
<400> 56
tacgttaaaa ttaaatattg ctgggtaata caagattgcc tgattaatat cctaacagcc 60
acaaagcaag caaacaagct ccaacaaggg aaagggagaa ggtaggaaga aaggaaggac 120
<210> 57
<211> 119
<212> DNA
<213> 人工序列
<400> 57
ggaagaaagg aaggacaaca gaaaactcac agttcctctg aatggctagg aaatattatt 60
ttggttaagt ccctatcccg acagagcaac aacctggttt tttttgtttt gtttttttt 119
<210> 58
<211> 120
<212> DNA
<213> 人工序列
<400> 58
aaaaaaaaaa aaaaaaaaaa tgacattaca ttctagacta tgtttcttcc aactgaattg 60
gcaattcgca ctggaatact gaatagccaa cagaccacaa ggaagacatc actcttagct 120
<210> 59
<211> 120
<212> DNA
<213> 人工序列
<400> 59
cctgtttgaa accaacagct acagcaaacc attggtcttg attcagggcc taaggcaata 60
caaactcaaa caatatatca aactaacttt catgccactg cttttcaaga gtctggtgct 120
<210> 60
<211> 120
<212> DNA
<213> 人工序列
<400> 60
aaattctcct tcttcctaag aattaaaaat atccaggagg tttgtacccc cctatgttta 60
atccagttta tagatgctcc gtgtttctat tcatctagct tcacgagaag cttagttcta 120
<210> 61
<211> 120
<212> DNA
<213> 人工序列
<400> 61
cgcttttaaa taaatctaag aatttgcaat cctttcccat ttgttggtgt gctaatcacc 60
aaaaatgaga atcacaacat cttcacatta aagaatatat ataattttaa aatctactta 120
<210> 62
<211> 119
<212> DNA
<213> 人工序列
<400> 62
ttcccatttg ttggtgtgct aatcaccaaa aatgagaatc acaacatctt cacattaaag 60
aatatatata attttaaaat ctacttaaag ctgctcaggc cgggtgcagt ggctcacgc 119
<210> 63
<211> 120
<212> DNA
<213> 人工序列
<400> 63
aaaaaaaata ataaaataaa gctgctcaat ttaagcagaa acatagggca caggatacac 60
tcaacctacc attcattttc aggtgagttg gaaacttctg tactacccac agaaaccagt 120
<210> 64
<211> 120
<212> DNA
<213> 人工序列
<400> 64
ggtgagttgg aaacttctgt actacccaca gaaaccagtg ttctcacacc attaagacta 60
taaatctgtt ttctcccatt cttttactat gtgcaatttg tgtgtgtgtg tgtgcgtgcg 120
<210> 65
<211> 120
<212> DNA
<213> 人工序列
<400> 65
gagcgagact ctgtcaaaaa taataatgac tagcttggaa ttatttaaac actgaatcaa 60
aaggcatcta aatctcaaga taataatgga atgtgtatgt tttcagaaaa ggcttttctc 120
<210> 66
<211> 120
<212> DNA
<213> 人工序列
<400> 66
aataatggaa tgtgtatgtt ttcagaaaag gcttttctca tatatacaaa gggttgtctt 60
ttataagatt ttaaactggg aaaaggatcc taaaataaga aaatcagcaa aaatgcctat 120
<210> 67
<211> 120
<212> DNA
<213> 人工序列
<400> 67
aaaggatcct aaaataagaa aatcagcaaa aatgcctatt aaaacaggag tgttttaaaa 60
attgaagtat caggatataa agagaatcca tgttttcagc tgggcgcgat gtctcatgtc 120
<210> 68
<211> 120
<212> DNA
<213> 人工序列
<400> 68
ataaagataa aataagagaa tccacgtttt gttactatct ccaaaaccag caatagagaa 60
tgagagagaa ggaactcaaa agtagtaaga ttaaggtgtt aagttactac ttgccaacca 120
<210> 69
<211> 120
<212> DNA
<213> 人工序列
<400> 69
tccttgcatc aaagcacaga aaacaagcaa atatccagaa tgaacggctg tgtttttact 60
catattaata tctgatgcct agtcttcccg caagtaaaat caccaaagtt atcattaaca 120
<210> 70
<211> 120
<212> DNA
<213> 人工序列
<400> 70
ctaaaaaggt atgggaagag tctggaaaaa aatataaggt agggtagatt tctctaaatg 60
aatatgctaa catataaata caactatacg tatatatcac ttcaaaaact ttgtcgattc 120
<210> 71
<211> 120
<212> DNA
<213> 人工序列
<400> 71
tcctaaccac aaagactaac ctattctcac cattaataaa taaggctttg tctcaagggc 60
ctgaaccaaa gcagagcttc tctaacttac atcactgaac tccagaggta aactctcagt 120
<210> 72
<211> 120
<212> DNA
<213> 人工序列
<400> 72
gggatcctca gagaggctta caggaacagg tttgttgcag ggtacctctt cagatccctg 60
gcagcacttg aagagaacct gattcgtatc ctgacaaata tctgtagaaa aatggtcaag 120
<210> 73
<211> 120
<212> DNA
<213> 人工序列
<400> 73
catttgatac agaataccaa atgcagttag caatttttaa agttacttct caaaataaat 60
gtcatttact agcatcaaat tctagctcta ccagtaattt aaaacttgtc cccaacctcc 120
<210> 74
<211> 120
<212> DNA
<213> 人工序列
<400> 74
ttttcaggat cctggtcatt taaactagac accatcccat tctcccttaa gcaagtagca 60
gtaacactcc taggaacaca cacatattca gaagaaacat gtagtggcaa atgcaaatag 120
<210> 75
<211> 120
<212> DNA
<213> 人工序列
<400> 75
aacaatttct tggacctcgt ttccaaagat gattacatga taaattcatt taaagcacca 60
ctggaatagg gggaaacaga gctctagtaa aagtcactag gtatcatatc ctaacaagaa 120
<210> 76
<211> 120
<212> DNA
<213> 人工序列
<400> 76
attaaatata catgcctttt ttttttaggg gagtgtgcta gtacagagga atccttttat 60
gatcctaaag gaagaagaaa attttgtgta tgaaggccca ttgaaaaaaa aaagtattct 120
<210> 77
<211> 120
<212> DNA
<213> 人工序列
<400> 77
aagtgctacc atttcttgaa atctgttaac tacctggtta tcttcctaga ttaataaaca 60
ttattttaaa atttgactta tttttaacca gaaaacacaa tttttcttaa actgatagta 120
<210> 78
<211> 120
<212> DNA
<213> 人工序列
<400> 78
gccgaggttg agaaaccctg gactgcaata tgttcaagag gccagtgaag attacataat 60
tacttctctg ttggatagag gttaatcttg atgctctgaa attatcacta acacctataa 120
<210> 79
<211> 120
<212> DNA
<213> 人工序列
<400> 79
taatgatttg gctaactcta atggttgagc ttctgcttgc gggcttttaa acaccgccac 60
cttaaagttt aaggttactg ctcactaaat acactattaa ccagttatcc ttaaccatgt 120
<210> 80
<211> 120
<212> DNA
<213> 人工序列
<400> 80
tgtgtaagta tggactcagc tatcctacac actctgtaga ccattcctta ttgtgcacac 60
atgaaggctt gacttctttc ggagttgttg ccaaaatttg tgatgttggc agaactgaga 120
<210> 81
<211> 120
<212> DNA
<213> 人工序列
<400> 81
agaggaagaa aataacaaga agaaaagtgg aagtaaaaat cttacatagt gtgaaaatcc 60
accaggcttg tgatgcctta aaatttttat gagtgagata aagcacaaat gaatagagat 120
<210> 82
<211> 120
<212> DNA
<213> 人工序列
<400> 82
gattctacta tggatgtgaa atacgccagc tttgttgaag tgtttccctt cttcctttct 60
ttccataatc aagagctaga gagtaaaagt catagaactg caagacatga acaactggga 120
<210> 83
<211> 120
<212> DNA
<213> 人工序列
<400> 83
ggaattatta ttgtaataaa gagaggtgtt cagggttagg gtggaggaga gtacagcaag 60
tctcttgtgg gaaacccccc aaccccacag aatcaataat tttttttttt ttgagacgga 120
<210> 84
<211> 120
<212> DNA
<213> 人工序列
<400> 84
ttgagccacc acgcccagcc aaaaccaata attttttttt ttttaaatct tactcttctg 60
acttctggtg ttaatagtct cctcttttcc tatttaaccc aaaagaaaaa tttgagattt 120
<210> 85
<211> 120
<212> DNA
<213> 人工序列
<400> 85
tatttaaccc aaaagaaaaa tttgagattt tgataggaac tctgggcatg tggacctttt 60
aggccatact gaatgctgat tttgacggta aggaggaagc catggcaggt tctgagttta 120
<210> 86
<211> 120
<212> DNA
<213> 人工序列
<400> 86
aggaggaagc catggcaggt tctgagttta gggggaaaag cagatggtcc aagctggaga 60
aatatatcta caagaagagt atgaataaga gagaaatatt gcaagtggat gacagaagaa 120
<210> 87
<211> 120
<212> DNA
<213> 人工序列
<400> 87
gagaaatatt gcaagtggat gacagaagaa aaaaatcagt atgaatttgt cattcatggt 60
caagtaccag tttatgaact ggttgtgttc ttaaacgttc atctgactgt tggatgaatg 120
<210> 88
<211> 120
<212> DNA
<213> 人工序列
<400> 88
ttaaacgttc atctgactgt tggatgaatg gcccaaggag ggcagaaggc tgcagaagta 60
attcattggt tgctggatag aagcttcaaa aattcacagt ttaatgctct tgttttaaag 120
<210> 89
<211> 120
<212> DNA
<213> 人工序列
<400> 89
ctgggattcc ccaggcagtc cactaacgat tctgtgttgt ctctaagcag gaaggtggta 60
aaaacagtta cttaatggca gtgtgtggca gaggggaaag ggcaggctgt ccaggtgact 120
<210> 90
<211> 120
<212> DNA
<213> 人工序列
<400> 90
gcaggctgtc caggtgactg agaagcaggc gggagaagag gaagtgaagg cagtgaagaa 60
ggaacactct cccaaaacaa gaggcagaaa gggcactccg ggtctgggtc ccattctacc 120
<210> 91
<211> 120
<212> DNA
<213> 人工序列
<400> 91
gtctgggtcc cattctacct agagaaaaca tgcaagcgca tattgattga gggctttcta 60
cacggggggt tttgatacca tttgttgccc agaagatatg gggtacaagt acagaaatgg 120
<210> 92
<211> 120
<212> DNA
<213> 人工序列
<400> 92
ggtacaagta cagaaatggc gacagatgga gtctacaagc tctttccaaa cgttcacatt 60
cctcagaacc tcacccgttt tctcggccac aagaaattat taatttattt gacaaatatt 120
<210> 93
<211> 120
<212> DNA
<213> 人工序列
<400> 93
aaaaaccact ggctcaagga ttctgtcgct ggagagaaac ttcagagttt aataacgttg 60
atagaacacc caaaacaatt ctgctacagt ttagaaattg atccattcca gacagaacca 120
<210> 94
<211> 120
<212> DNA
<213> 人工序列
<400> 94
caatgcagac attaagggac acacatcatc taaggccgtg aggtctgagg tcagagatcc 60
agccatctgc tcccccaggg tagggaggtc gggcctcccc ggggtgagtc acgtagccca 120
<210> 95
<211> 120
<212> DNA
<213> 人工序列
<400> 95
cctctcccca ccaggcgagg cttctcggtc ttggtgcatg gggcagggcc gcaggaaatc 60
ccccagccta aatctgccgc actcagaaaa cccaggcagg ggagccccca gagaccaggc 120
<210> 96
<211> 120
<212> DNA
<213> 人工序列
<400> 96
ctctgattag cacctgattc acggaggcag ccaaggctgg gtagcgactg ctggtaactg 60
gcccccggag tcgccccagg ggaaaaggcc aaagggggat ctggagaccc ccggccgggg 120
<210> 97
<211> 120
<212> DNA
<213> 人工序列
<400> 97
agcgggctcc gagacgagcg cagccgcccg gtcagggcag cgcctgcgcg tccgccaggc 60
cccgccgcgc agcctcgggt gtcccggcgg ggcggctcgg gccgcgcacg cgctctggcc 120
<210> 98
<211> 120
<212> DNA
<213> 人工序列
<400> 98
tccggggccg gccgcctggg agcccgagcc tagtgcctcc cacgcccggc ggccgcgagc 60
cggggtccgc gagggcggag tggggcgcgg cagccaggaa cccgactacg aatcccaggg 120
<210> 99
<211> 120
<212> DNA
<213> 人工序列
<400> 99
tgcgggcggg cggagcgagg agggacgctg ggcctgcccg gtgcgcacgg gggcggggac 60
cggcaaggcg ggaccatttc ccggcatagg ctccggtgcc cctgcccggc tcccgccggg 120
<210> 100
<211> 120
<212> DNA
<213> 人工序列
<400> 100
aagttctagg ccgccgcaca gaaagccctg ccctccacgc cgggtctctg gagcgccctg 60
ggttgcccgg ccggtccctg ccgctgactt gttgacactg cgagcactca gtccctcccg 120
<210> 101
<211> 120
<212> DNA
<213> 人工序列
<400> 101
cgcgcctcct ccccgcccgc cccgccgctc ctcctccctg taacatgcca tagtgcgcct 60
gcgaccacac ggccggggcg ctagcgttcg ccttcagcca ccatggggaa tgggatgaac 120
<210> 102
<211> 120
<212> DNA
<213> 人工序列
<400> 102
ccaaagtgta gtttaataaa gtgtagctac agtatatact tttcctttca tgtggctaga 60
gctcaaagaa tagtcttcct ctagaaaaat gggtagattc tgtattctac agtcgattct 120
<210> 103
<211> 120
<212> DNA
<213> 人工序列
<400> 103
ctcaatattt tcaagtgcta aagaagaaat tgaaagcaca agctcaaagt tatttattct 60
gacaagaaac agaagcatag atattttgtc atagattttg attaaagaaa ctttgccagg 120
<210> 104
<211> 120
<212> DNA
<213> 人工序列
<400> 104
ggacatttgt cttaatggat ggccatccct gtccatggag gcatgctgtg gtgggagggt 60
cagagaaaag gccaaaggct atcctctaaa acagtactag ccatgtgtgg tggctcatgc 120
<210> 105
<211> 120
<212> DNA
<213> 人工序列
<400> 105
taaataaata aataaataaa aagaaaagaa aaatagcact gtgtttctcc aatatagaaa 60
aataggtgat tgagtttctg cagttctacc caccagcctg aagcaaaacg ggaagaattt 120
<210> 106
<211> 120
<212> DNA
<213> 人工序列
<400> 106
aatatagaaa aataggtgat tgagtttctg cagttctacc caccagcctg aagcaaaacg 60
ggaagaattt tacattttat ttttagttta ttattttatt ttattttatt ttattttatt 120
<210> 107
<211> 120
<212> DNA
<213> 人工序列
<400> 107
tgtgagccgc cgcgcctggc ttggaagaat tttaaatgga gcaaattttc acaggcagag 60
ttgtcctgtt atattaagtt attaaccaag aatttaaaaa ggtgaactac atatgaacaa 120
<210> 108
<211> 120
<212> DNA
<213> 人工序列
<400> 108
acaatactgt ttcagagtct gctcctacta gagacacttc aagcacgagt gcttacacac 60
agtgttctac atacctgtgc cctctgaaag aaactcaaat ttcataacca atcactcaga 120
<210> 109
<211> 120
<212> DNA
<213> 人工序列
<400> 109
cagaactgct gctatgtgaa atgagcggac atacaggtac gaaaagcaat ttcaataact 60
gtgcttaaaa agtgctgcta ttgaatgaag gtggtatgtg aattagcacc atgaagttac 120
<210> 110
<211> 119
<212> DNA
<213> 人工序列
<400> 110
ttacagttag gttaaaaaaa aagactagaa aaataaaccc aaatgaacaa acataaaata 60
taaccgcagc tctggctatc ttaacacacc agctctgtga cctcactgac gcttttacc 119
<210> 111
<211> 120
<212> DNA
<213> 人工序列
<400> 111
caatgcttgt cacatagaaa aaacgtttta ttatttcctg gatcaccatt aatatataaa 60
aatagtgtgc atttatataa atgaactggt tcctcttcat atacagaagc aattgtttta 120
<210> 112
<211> 120
<212> DNA
<213> 人工序列
<400> 112
atatacagaa gcaattgttt taagtgggga tttatttgaa atttgaattt cttacgcaaa 60
acttttatat gttctgccct tctgaaaaga tctagagaag cggtccccaa cctttttggc 120
<210> 113
<211> 120
<212> DNA
<213> 人工序列
<400> 113
ccaggagatg gggacccttg atttagaggt taactttagt tcacatcagc actgctacta 60
gaattaattg ataacaccct tacctgtatt ttctgaagac tagttgaaac ttcacttata 120
<210> 114
<211> 120
<212> DNA
<213> 人工序列
<400> 114
ttttgaggta tatcaaaaca cttggcggta gtgatttttg cattaaccaa ccactgctgg 60
aaatccctga aggcctttcg aaatctttgc tgtaaaatct gttctttatt ctggcagccc 120
<210> 115
<211> 120
<212> DNA
<213> 人工序列
<400> 115
ttggatgctt gcaaacaaag actgaaaagg tgacgcaaaa atttaatggc aggaaaaagc 60
gataaagttg atgaaaatca tgtttgatag aatcaccagt tcttagaatg tgcacttacc 120
<210> 116
<211> 120
<212> DNA
<213> 人工序列
<400> 116
tcacttagta atatatttaa tgctgaacta atattatttt gaaattacac cttaaaataa 60
acttctagct tctaatttgt ataaaaatat cttgaacacc aataaggttc atgctcacca 120
<210> 117
<211> 117
<212> DNA
<213> 人工序列
<400> 117
atgtatgata aaagttgaaa tgattagtta ttagaatggt gagttttttg ttgtgtatat 60
tttatcactt tatattttat tttacatata tgcttatata catataattt aataaat 117
<210> 118
<211> 120
<212> DNA
<213> 人工序列
<400> 118
gtgagccacc gcgtccggcc tacatatacg ttttaaaaat taaaaacagg ctatgaattc 60
agaggggaaa gagttcagga aggaagtcta aaaaatacag tgattataca agaggttgaa 120
<210> 119
<211> 120
<212> DNA
<213> 人工序列
<400> 119
acatatgaaa aactaacaat ttcaatatgt caaataacct cccaagtgac tgtagtacaa 60
agatcaccag actcagaaga atagttttga atttcagtcc taactctttt atacctagta 120
<210> 120
<211> 120
<212> DNA
<213> 人工序列
<400> 120
agataaagtt attgacagtt acatcaaaga tgggcctaaa tttctagctt gcataattgg 60
ataatagtga cattattcac ttttacagca aacaaaatgg agagagcaag ggtttagatt 120
<210> 121
<211> 120
<212> DNA
<213> 人工序列
<400> 121
atgatagctt taatataaag tatctcagtt ctaagagaat gatgctcaag gttagaaatc 60
caaagtacgg gcaaagagat tctctttaaa ggggatgacg aagatcttct ctatggtaac 120
<210> 122
<211> 120
<212> DNA
<213> 人工序列
<400> 122
tagagtgaag gaggagggac acagaagact taagtgggtt ttcttttcgc tctttcacgt 60
tggacaagtt tgatggcttc tatttcctat gtgaagtacg aggtgccaga ataatactga 120
<210> 123
<211> 120
<212> DNA
<213> 人工序列
<400> 123
tcaaaagaaa aaaaaaagaa tgaatgaatg aatggatgga tggattggtg ggagcaggtg 60
gtagagtgga tgccatcctg tctgctgttt tgagggccta cagccctgaa ggcatgcaga 120
<210> 124
<211> 120
<212> DNA
<213> 人工序列
<400> 124
gagtggatgc catcctgtct gctgttttga gggcctacag ccctgaaggc atgcagaccc 60
aatggattta catatccgta tgtctttttg accctttgtc ttttaaggcc tgctcaagtt 120
<210> 125
<211> 120
<212> DNA
<213> 人工序列
<400> 125
gtgtgtatat gtgtgtgtgt atctttaagg ttcttagtca cttgcaactg aatagctctc 60
gctaagttgt gtaagtctca ccttcctgaa ggtcatatca gctcttccca aagtgagtag 120
<210> 126
<211> 120
<212> DNA
<213> 人工序列
<400> 126
aagtgagtag tagagtcagc tacttcttat ggcagtatat tggatcctgc aatccttcca 60
ggggaatgcc aaaaccgcaa taggcaatga gcagggttgt tacagagatt ggtggagagg 120
<210> 127
<211> 120
<212> DNA
<213> 人工序列
<400> 127
ggtggagagg ctcaaatgga agattaggag tagggaaaga tattttcaag ataccttcct 60
taataagata aaagaaaata gtctccattc tcttctgctt tttttctttt tctttcgata 120
<210> 128
<211> 120
<212> DNA
<213> 人工序列
<400> 128
gtgagccacc atgcctggcc cctcattatc ttctcgatgt ggcaaatgca atgcaataga 60
tgatagaagc cactctatcc catatctaat cgtgcaatat acaaaaaagg gaaaaaatga 120
<210> 129
<211> 120
<212> DNA
<213> 人工序列
<400> 129
ggaaaaaatg aagaaaacca atatggaaac ccagtggcaa gaattcttgg ggtccttggc 60
tgggcaacaa cattaagaag tgaagggtca tacaagcatt ttatttattt tattttattt 120
<210> 130
<211> 120
<212> DNA
<213> 人工序列
<400> 130
tgagtttttg ggattacaag gatcaaccat agtgctgagc acaagtattt ttaatagtgc 60
taatgtggag aagatttgat aaatatttta tctataacaa tggcatttgt tgaacttaat 120
<210> 131
<211> 120
<212> DNA
<213> 人工序列
<400> 131
cacaagtatt tttaatagtg ctaatgtgga gaagatttga taaatatttt atctataaca 60
atggcatttg ttgaacttaa taaattactt ctctattttt catctattct attcccaatc 120
<210> 132
<211> 120
<212> DNA
<213> 人工序列
<400> 132
ctggccctta cacaggtcaa tgttaacacg aatgcatttc agtattttga agataaaatt 60
ggtagatcta taccttgttt tttgattcaa tatcagcacc atataagagc agtgctttgg 120
<210> 133
<211> 120
<212> DNA
<213> 人工序列
<400> 133
ccattaattt atcttcattg tagatagcat agtgtagagc ggtatttcca tactcatctt 60
gaatatttcc atcagcgcca tgttccagca acattaacac acattcatct tcctggcatt 120
<210> 134
<211> 120
<212> DNA
<213> 人工序列
<400> 134
gtacggcctg tcagtattag accaaaaaca aattataagt cctaggaatt caaaataaca 60
ttccacagct ttcaccaact agttatattt aaatgagaaa actcattttt atgctatcta 120
<210> 135
<211> 120
<212> DNA
<213> 人工序列
<400> 135
ttgaaatcaa acccatctca cgctgatata gttgactact gcataccttt atcagagctg 60
tccttttttt gttgtcaagg acgttaagtt gacatcgtct gtccagcagg agttgtacta 120
<210> 136
<211> 120
<212> DNA
<213> 人工序列
<400> 136
cttctgaatt tccattggca gaggccaaat gtagagcagt cctatgagag tgagaagact 60
tcaggaaatt gtagtgcact agctaatgcc acattaatga ttcatgtagt tgcaaacact 120
<210> 137
<211> 119
<212> DNA
<213> 人工序列
<400> 137
gaatagccta ttactctgcc ttcaaaacaa actcaatttt cctttgaaga aagcacacta 60
cttattacct ctcattagtc actgtattaa tgaaagagca gcctatttga atagaaaga 119
<210> 138
<211> 120
<212> DNA
<213> 人工序列
<400> 138
caaaaattgt aagatattat aatttttact aataccacta aagacaacat ttgaattaag 60
tgaaacgata caattatacc tacactttca ggtacatttt aaagattaca ggtagcgttg 120
<210> 139
<211> 120
<212> DNA
<213> 人工序列
<400> 139
tttactaata ccactaaaga caacatttga attaagtgaa acgatacaat tatacctaca 60
ctttcaggta cattttaaag attacaggta gcgttgtact gtattttatt gagtctaaga 120
<210> 140
<211> 120
<212> DNA
<213> 人工序列
<400> 140
cttacattaa gtagaatatg ttataatata acaggtctgg ggcagttcca gtcagatgac 60
tagcatttag ataaatttta gttcttaaaa gaactatgga ataagagggc tgaggtgaaa 120
<210> 141
<211> 120
<212> DNA
<213> 人工序列
<400> 141
ttcttaaaag aactatggaa taagagggct gaggtgaaaa caaaaacaat tttctaaaat 60
aatctatttc ttactttggt tttcaaaaac tttaagccaa agaaatcttg aaattcaaat 120
<210> 142
<211> 120
<212> DNA
<213> 人工序列
<400> 142
ttcaaaaact ttaagccaaa gaaatcttga aattcaaatg aatagcatgg gctcattttt 60
ttcaatactt agatttatac aacgtatgta catcagatat ttccaatcat tcatattagg 120
<210> 143
<211> 120
<212> DNA
<213> 人工序列
<400> 143
acgtatgtac atcagatatt tccaatcatt catattagga tttaagactg ttataaattt 60
tctcttttta aaatggattt atgaaactat ttgtggagct tttttcaact tttacattcg 120
<210> 144
<211> 120
<212> DNA
<213> 人工序列
<400> 144
gctgtttatg taccacattt aagttcttaa aacagctaaa acagtgttta cccaagtctt 60
atacattttc aaaagggcag ttaagggtta tcttttacta ttttccacct tcagaagtgc 120
<210> 145
<211> 120
<212> DNA
<213> 人工序列
<400> 145
ttttgtttga aaggagggag gaaaagcttc aattgagatt aagtcctaat gccccaattt 60
tgattctctc agcttgctca ggcgcagcag gtaaacatga agttttcaaa ggtggaagga 120
<210> 146
<211> 120
<212> DNA
<213> 人工序列
<400> 146
tcctgagaga tagcagaata tgcctgccat ataataggtg tctggcttat gtttgatgac 60
taaacggatt gaaagaatgg ataaacatag gttggaagtt caatattttt aaaagaaaac 120
<210> 147
<211> 120
<212> DNA
<213> 人工序列
<400> 147
tcctgttgag tagagcaata catttgcgat agtaacgatc atttatattt gctattttag 60
ttttcataaa tatataacta aactaaaata attaatccat actatttaca catcaatcta 120
<210> 148
<211> 120
<212> DNA
<213> 人工序列
<400> 148
tatataataa gatgtataca caataaaatc taccagaaga ggtaaacaga agccctctac 60
ttctgaagag ggtaaaagtt cacagaagat agccatccac aggtataaaa ataaataata 120
<210> 149
<211> 120
<212> DNA
<213> 人工序列
<400> 149
gaatgtaaga aattatttgt atctatgcaa gtagcatatt ccttctcttc ccaaggatta 60
tttcattact aatgaaactt aactaaaact ttgcagatgt tcattgcaga aatcacagat 120
<210> 150
<211> 120
<212> DNA
<213> 人工序列
<400> 150
aagagaaagg gaaaaacttc acttacaaat ccccagaaat aagtttgatt atattttcca 60
catatttcca gctaacacaa gagcagattc tatttgtgta tatgtataac aaactgattt 120
<210> 151
<211> 120
<212> DNA
<213> 人工序列
<400> 151
tttctcactt gatacagcaa agtacatctc tgcatgccga catatctctg tatctactga 60
caccctcaat ggttacatat tattccatcc tatggatgca ctgaaatttg ttcataaaat 120
<210> 152
<211> 120
<212> DNA
<213> 人工序列
<400> 152
ctttatatga gttcttctca atacatggct attttaagca atactaagaa aaacagctgt 60
gtctgtttca tatagatatt tcggtataat ggaacagatg ggtaaaaggc atacacattt 120
<210> 153
<211> 120
<212> DNA
<213> 人工序列
<400> 153
taaaaatgtg gttcttacca tcaaagtgtc tatttgaaaa gtcgcagcaa cttaaacttt 60
cagcaggtat ataagtacca ctgttcttca ccctcacaaa ctttgtggac acaaaacagt 120
<210> 154
<211> 120
<212> DNA
<213> 人工序列
<400> 154
actagtgaag acaaaataga tacaatgaaa ttagaaaaaa attaaaatcc tttaaaaagc 60
cccatttgcc tcgattttcc taattacaca aaggaggcaa agtgtgaaaa aggatagatc 120
<210> 155
<211> 120
<212> DNA
<213> 人工序列
<400> 155
caaagtgtga aaaaggatag atcacgttcc tctaaggacc catgtcaggt atctgtggaa 60
tgcaggcggt gcaggagggt gggaatgggt gggtgcccag cgttgctaaa gctatggagt 120
<210> 156
<211> 120
<212> DNA
<213> 人工序列
<400> 156
cagcgttgct aaagctatgg agtgtcttcc catttttaaa gaaatccaga agtgcagatc 60
tattcattca accattcatt gatgtaaaat ctggtttcta aggtgttcag tttgatgact 120
<210> 157
<211> 120
<212> DNA
<213> 人工序列
<400> 157
aacacattgt ctcacttata ggatgacact gcattcacgt ttcagccacc tctgccacac 60
ccacccatgc aaacacaccc acccatctca gttcctgccc ctgactgggg gacagggtgg 120
<210> 158
<211> 120
<212> DNA
<213> 人工序列
<400> 158
gcgctctctg gcacatgttc cactcatgct tctccacctc cagctatttt aggctctgac 60
actgaaaatg aaattcttac caagacgata tgtgttgtgt tgacataaaa ctgatagaaa 120
<210> 159
<211> 120
<212> DNA
<213> 人工序列
<400> 159
gtgtaccaaa aaacatggaa gttttaaaca taatccacca aaagaacata ctcacagtcg 60
acgtttcttt cattattaag aatgaatgtc cataaccctc actaagacaa aagtcatccc 120
<210> 160
<211> 120
<212> DNA
<213> 人工序列
<400> 160
atttgtctac attttttttc tttgcaaaca cacactgaat gactttgtgt gacaagctgt 60
gaagttttac caattcttca aactctttga tttgcattat gctgtttaat cctgagaggc 120
<210> 161
<211> 120
<212> DNA
<213> 人工序列
<400> 161
gagcagctgt cgctggtaat tctaagccta gaattccacc acctaatagg tgaaaattat 60
agtaggctga tcataaaacc atgttgttaa ctttttaaaa tttaatgact accaaggaat 120
<210> 162
<211> 120
<212> DNA
<213> 人工序列
<400> 162
ttcaccttag tgatacatct tttgagagat tagaaaatga agaaatgcac gtgttcaatg 60
atccatttta gaatttaaaa agtctttcaa atgagcatct tattcatata ttgtgaagaa 120
<210> 163
<211> 120
<212> DNA
<213> 人工序列
<400> 163
ccactggaaa cagttattta ataatgtggc taaacgcgta ttcagagtaa tgcttcctgt 60
atatttgcac atttatacac ttatgtcccg ctcctggaat agacttacca gtttcctttt 120
<210> 164
<211> 120
<212> DNA
<213> 人工序列
<400> 164
cagaaaattt cagaatttct gaaatgtgcc gaagtactag tgggtaactt agatttggaa 60
tacactgtat taggtgtaac tggaaaactg agaggcttcc tacactggaa ggtcaaagat 120
<210> 165
<211> 120
<212> DNA
<213> 人工序列
<400> 165
ctttcctgga ggagagttaa gaatttgcct tttcttacca tgactctgtt aaaagagaat 60
ataaacaatg cagtttcaca aaaggaaggg gacagtggtg taaataaacc tccccatcat 120
<210> 166
<211> 120
<212> DNA
<213> 人工序列
<400> 166
gttctggtgg ctttcctgta agtcttgaac gttttccact gggtgttaca gtcgagaggc 60
ccccacctcc tgaggaagca agaccccgaa accccgagac gatgggctgt gctgctttgg 120
<210> 167
<211> 120
<212> DNA
<213> 人工序列
<400> 167
ccccatcttg cttgtgttgt ttgaaggggc cctgctgcca cccagctgtc attaacgcca 60
ccctcacctc ccaggaactg catcactcgg acggacaaga cacctatgta atgaccatag 120
<210> 168
<211> 120
<212> DNA
<213> 人工序列
<400> 168
taagacccca tgtgcgtggc taatgaggca gtgcccaacg tggcgtggaa gccctgctag 60
ggaaatcccg ccccgccacc ccagatgcgc caccccagac ctgctctcgg acctgcggcc 120
<210> 169
<211> 120
<212> DNA
<213> 人工序列
<400> 169
cctggcccct ggccctttcc cgttgtcacc gaggcttctt gctaagaaat ggaacttcag 60
aaaaccccca aatatatact gcattaggta agggtttcat tctaatggag tcccatgtga 120
<210> 170
<211> 120
<212> DNA
<213> 人工序列
<400> 170
ccctggcttt ccgtccggca gcaatgcact cctgtctatg aatgagatga aaagagtgcc 60
cacaacaagc caatttcttt caggagcgac taagacatgc gcatgtccgg gggtgcctca 120
<210> 171
<211> 120
<212> DNA
<213> 人工序列
<400> 171
gagcacccgg gagggaccca ggcctgggca gggagggggg gccggcccta ggggagcaaa 60
gctcttgaaa ctggcctctg ttgccgggct cctgaccctg ccctcccatc cctgcactac 120
<210> 172
<211> 120
<212> DNA
<213> 人工序列
<400> 172
aagaggacag cggcgactac aggaggcgcc gaagacgctg ctgaaggccc taaagaaact 60
tcagcagaac cggaactccc cttgcaggtc cagccgcggg ccctgcgccc tcccgctcag 120
<210> 173
<211> 120
<212> DNA
<213> 人工序列
<400> 173
ccgagcgggg ccgagggcgc gtttgctgag tgtctggtgg cctctaccca agcgcctctt 60
cagagggctg ttcctgcggc ccagagactg cttgaggcgc tcggggaagg aaaagcaggc 120
<210> 174
<211> 120
<212> DNA
<213> 人工序列
<400> 174
gctggtgcgc cgggggctct gctggggacg gcgcggagct gactgaaggg ccgctgcggt 60
agcgcagggc gcaggagctg ctccgccccg gagcgccggg aaggttggcg ctggcagcct 120
<210> 175
<211> 120
<212> DNA
<213> 人工序列
<400> 175
cttgatccca caggaatctt ggtcctcatt aggatcatga gccagacgat gatggtaaca 60
aatagagact tctgtttccc gggagactgc ctgccgtgag tgtcttacct ggagtagcgg 120
<210> 176
<211> 120
<212> DNA
<213> 人工序列
<400> 176
gaaataggtg tgaatgggtg gccttcagaa actggtagtt caatcaccgg ttgcaggtcc 60
tggaagaatg caaagcaaga ggagggcttt tttaagtagc ccttgtgatc tggttctgtc 120
<210> 177
<211> 119
<212> DNA
<213> 人工序列
<400> 177
ctctcttaca aagcatgaag gccttgttct ctcacacgtg gtttccctct ggcaccccgt 60
acatcggtct ctgcagaccc ttcattttag acgagctgtt ctgaatccac actacacat 119
<210> 178
<211> 120
<212> DNA
<213> 人工序列
<400> 178
aagtgacttg accatggcca tgtgtgaata tgaagactgt aagtgtatca cattgttgtt 60
ctgagataaa ctggttaatg caaattaaag tgttttctct cgtagggttg tctttcttct 120
<210> 179
<211> 120
<212> DNA
<213> 人工序列
<400> 179
gggttgtctt tcttctaaca tccatgcatt gcacagatgt ttattgagaa tcatttctga 60
gtcaagcagc aaccctggtg cagtagctac aaccgtatat ctgaaaccac tgctgaaccc 120
<210> 180
<211> 119
<212> DNA
<213> 人工序列
<400> 180
aaccactgct gaacccacag gcctcgggtt cgtggaggtt atggacaagt gaacagctgt 60
gtaaagtagc gcggtgatat aatggccatc cctgaatact gctctaggtc ctttaccat 119
<210> 181
<211> 120
<212> DNA
<213> 人工序列
<400> 181
agccaacatt taaacacagg agggactgcc ccatgcatta gactgtttac tgagaatttt 60
tcctgtgttc tgcagtattt tacactttca ttactgtggc catggggttc tgaaagtctc 120
<210> 182
<211> 120
<212> DNA
<213> 人工序列
<400> 182
gttctgaaag tctccttctc tgtaaacaac cctgtgacac atgattctgg aggtgactgt 60
tgaagcagaa cacattccat atggcgtttt gacgtggaag ctgactgtgt tcacctggca 120
<210> 183
<211> 120
<212> DNA
<213> 人工序列
<400> 183
gtgttcacct ggcaagcgta caaatgtctc caaaatccca ttccttagaa caaaaggttt 60
gaacatcgtt gcattcaatt gtctctacag aatgaataat accaactgcc atggtttcag 120
<210> 184
<211> 120
<212> DNA
<213> 人工序列
<400> 184
tgccatggtt tcagagtcag gtgcttaaga attacttcac ttgtgggagc ttatctgcgg 60
ctctgtattt actgtgattg aatagtttca cattgatgag ggaaatggct ctcttaacta 120
<210> 185
<211> 120
<212> DNA
<213> 人工序列
<400> 185
ggctctctta actaggtcat ctcttactgg catttacaag ttttaaattt aaaatccaac 60
catacgtcat tgcattgcaa acaacacctg gaataccagt tactattagt aatattatta 120
<210> 186
<211> 120
<212> DNA
<213> 人工序列
<400> 186
actaatacaa ttagtaataa ctagtatact gttagtatgt tgttactaaa aacatacata 60
aaaacggtat gtttcttttc attgactttg ataaataaag tggttaaaaa aaacaaacaa 120
<210> 187
<211> 120
<212> DNA
<213> 人工序列
<400> 187
aaaacaaaca aacaatctta agcatgaaac attggtatgc caaccaccca taagaagcca 60
ctcaagagct taacaaatta gaagaatcca aaagtatcta taaatgccct agggacgata 120
<210> 188
<211> 120
<212> DNA
<213> 人工序列
<400> 188
tagggacgat actaccaaaa gtaggatatc acaaatgcca tgaacaggag cattaaagaa 60
actcttatgc atcacttaac agagatgcca gctcacgatc tgctactcgt gaatttccta 120
<210> 189
<211> 120
<212> DNA
<213> 人工序列
<400> 189
tgaatttcct atccataatc ttttagtaga agatgctacc aaagaggttg gtaatgcaag 60
cacaacccca gagtcgagtc tctttgcccc ctttcgggtt ccatgatgaa tgcagaggca 120
<210> 190
<211> 120
<212> DNA
<213> 人工序列
<400> 190
atgcagaggc aattaccatg ggaagggaaa cgcaatgcat tgattggcgg agctttggac 60
tcctaaccag agctattgcc ggaagctcag ggcctctgct aacagcagag tgtcaaagtg 120
<210> 191
<211> 120
<212> DNA
<213> 人工序列
<400> 191
gtgtcaaagt ggagaacagg tgttgtccca ggaaatcggt gttccattac ctggacaagg 60
gagagggggt ggatatgggt caagaacagc caaggatgtt ccttgagatg tgcatttact 120
<210> 192
<211> 120
<212> DNA
<213> 人工序列
<400> 192
gtgcatttac ttgcctgctc cagggcacca tgctaactgt gctaaaaact tggtaatgtc 60
attgtggccg gtcctgttat ttaagatgag gtccttcttg gatgatgatg atgatgatga 120
<210> 193
<211> 120
<212> DNA
<213> 人工序列
<400> 193
cgtgagccac tgtgcccagc tactgtgtgt gttcttaacc atgctctatc tccctcagcc 60
ccacagttaa catctagttg ctagtagatc ctgactctcc atcctacttg accatactct 120
<210> 194
<211> 120
<212> DNA
<213> 人工序列
<400> 194
tctcactcat ggcagtccac aatgataagt aaaaataaaa taatacaata caatacaata 60
caatacaata aatctaccac aaccaaaaac aataaaaggc taaatcttga ggactgagta 120
<210> 195
<211> 120
<212> DNA
<213> 人工序列
<400> 195
gtaaaaattt gactgcaaac aggcaacctg actcagtaca tctttttaag aggcttttga 60
taaaggggct gagataagga gaaatgcagt ggatctttta aagccaaaaa tatcgttgaa 120
<210> 196
<211> 120
<212> DNA
<213> 人工序列
<400> 196
gaactgcatc tctcctacgg taggaaagcg acattcctga gtcgggtttc ttgcatggcg 60
acctcctcat ctcaacttcg tgtaagccct ggactatttg gagacaatct tctatgtatg 120
<210> 197
<211> 120
<212> DNA
<213> 人工序列
<400> 197
atgtagggtc cccgtgtcca gatttggcat ctagctgcct tgtgaagaac ctgagttggg 60
cttttatctc ttggtcattt tttaaatttt aacttaatat ttatttattt ttttttttga 120
<210> 198
<211> 120
<212> DNA
<213> 人工序列
<400> 198
aaaaaagaaa aaaaaagaaa tataaatagc caagatgata gtaccctatc tcactctttc 60
tgtacgagat ggagggtgac ttagagccac ttagagccac ttacagctga aggtaaggta 120
<210> 199
<211> 120
<212> DNA
<213> 人工序列
<400> 199
ataaatagcc aagatgatag taccctatct cactctttct gtacgagatg gagggtgact 60
tagagccact tagagccact tacagctgaa ggtaaggtag gcttacctgc aacaggcacc 120
<210> 200
<211> 120
<212> DNA
<213> 人工序列
<400> 200
cggccttcgt tctgggaaca gaagtgcagt tagatgtgga tgcatgtgat tggtgcttaa 60
actcacagtg ccccacacca aaggagaaaa acacatagtt acagcctgtg tgtccaaatt 120
<210> 201
<211> 120
<212> DNA
<213> 人工序列
<400> 201
cagcctgtgt gtccaaatta ggtccagatt aggtccaagg acaaatagca aaacaagaag 60
attgccttta atcttttccc tccacttcta aactctggag gacaaggctg tgaagagatc 120
<210> 202
<211> 120
<212> DNA
<213> 人工序列
<400> 202
acaaggctgt gaagagatct gaagacatgg tgttctctgc ttgtgtggcc ccaacattct 60
ttgtttgctg tctgatattt gaaaggaaga ggaacctttg atagaggagg cagtcggacg 120
<210> 203
<211> 120
<212> DNA
<213> 人工序列
<400> 203
gacctggctg aaccgaggag accaccacac ctccaccaaa cagcaactgg gaaaccgtgg 60
tcttcacgtg gatactctca gcttgcagcc cctgctctct ctaggggcac tgtcccaccc 120
<210> 204
<211> 120
<212> DNA
<213> 人工序列
<400> 204
cacgtggata ctctcagctt gcagcccctg ctctctctag gggcactgtc ccacccaccc 60
ttgagcctga ggagaaaagt tggtagagag gctggtccct tacttccagc agaaaagagg 120
<210> 205
<211> 120
<212> DNA
<213> 人工序列
<400> 205
gcctgaggag aaaagttggt agagaggctg gtcccttact tccagcagaa aagaggtgtt 60
caggccctca cttccctaag ggaagagagc cctcatggct gcgctcaatg tggcagccac 120
<210> 206
<211> 120
<212> DNA
<213> 人工序列
<400> 206
gctaataaaa acgcaaaatt cacaaattaa tattttattt tttaaaggat tgcttccctc 60
ttaaaatctc aggtgtccta ctcaaaagac tagcggccag aagggttatg aaatctaaaa 120
<210> 207
<211> 120
<212> DNA
<213> 人工序列
<400> 207
aatctcaggt gtcctactca aaagactagc ggccagaagg gttatgaaat ctaaaatatt 60
aaaataattg tcattatatc acttccgttt gtgaaaaagt gtgtgtgcat gcatgtgtgc 120
<210> 208
<211> 120
<212> DNA
<213> 人工序列
<400> 208
gcacgtctgt gtgtaagtgt attttacaag tggacataac cttacacaca acaaggttaa 60
aaaaaacacc cctgggctgc gtcaggccaa gccgggagag aaagccccgc ctgaaagggc 120
<210> 209
<211> 120
<212> DNA
<213> 人工序列
<400> 209
ctggaggccc cagcctgtca ctcttgccac atcagtggag tgtatggttg caaattctgt 60
tactcaaggc ccgagggcgg ggattggagt aatatccaat cagagtgtcg gaatgagaac 120
<210> 210
<211> 120
<212> DNA
<213> 人工序列
<400> 210
tgcccaatca ggcccgcagc cagagaggag gggttggctt ccgggatctg gcgcggcgtt 60
ttcctctggc tcctgcgagg gcttggttta gggcttcagc tctctgcgtt ctcggctccg 120
<210> 211
<211> 120
<212> DNA
<213> 人工序列
<400> 211
ggaggcctcg gtgattcagc cacagcctct gcctcccgtt gctctgtgac ctgagggtat 60
tggacaattt gtagctaaga ctcccggata ccctgaagtc gggaaatggt gagtgtgcgg 120
Claims (10)
1.一种用于预测肿瘤突变负荷的核酸组合物,其特征在于,其包括探针组1~9;
其中,探针组1包括用于捕获KMT2D基因的外显子区域的探针;
探针组2~9分别包括用于捕获DUSP22、MYCT1、OR1C1、OR4D11、OR4M2、OR4N4、TMEM132C和ZNF595基因的启动子及其上游区域的探针。
2.根据权利要求1所述的用于预测肿瘤突变负荷的核酸组合物,其特征在于,所述KMT2D基因的外显子区域包括区域1~54中的至少一个区域或多个区域的组合;
其中,区域1选自染色体12的第49021778~49021872位碱基的区域;
区域2选自染色体12的第49022041~49022151位碱基的区域;
区域3选自染色体12的第49022278~49022353位碱基的区域;
区域4选自染色体12的第49022588~49022875位碱基的区域;
区域5选自染色体12的第49024576~49024708位碱基的区域;
区域6选自染色体12的第49024808~49024946位碱基的区域;
区域7选自染色体12的第49026180~49027322位碱基的区域;
区域8选自染色体12的第49027801~49027930位碱基的区域;
区域9选自染色体12的第49028007~49028141位碱基的区域;
区域10选自染色体12的第49028826~49028958位碱基的区域;
区域11选自染色体12的第49029059~49029236位碱基的区域;
区域12选自染色体12的第49029399~49029476位碱基的区域;
区域13选自染色体12的第49030278~49030439位碱基的区域;
区域14选自染色体12的第49030599~49030768位碱基的区域;
区域15选自染色体12的第49030891~49031033位碱基的区域;
区域16选自染色体12的第49031173~49033964位碱基的区域;
区域17选自染色体12的第49034065~49034299位碱基的区域;
区域18选自染色体12的第49034408~49034476位碱基的区域;
区域19选自染色体12的第49034580~49034666位碱基的区域;
区域20选自染色体12的第49034810~49034935位碱基的区域;
区域21选自染色体12的第49037123~49038989位碱基的区域;
区域22选自染色体12的第49039220~49039358位碱基的区域;
区域23选自染色体12的第49039433~49039617位碱基的区域;
区域24选自染色体12的第49039722~49041535位碱基的区域;
区域25选自染色体12的第49041653~49041705位碱基的区域;
区域26选自染色体12的第49041915~49041990位碱基的区域;
区域27选自染色体12的第49042087~49042330位碱基的区域;
区域28选自染色体12的第49042559~49042645位碱基的区域;
区域29选自染色体12的第49042739~49042878位碱基的区域;
区域30选自染色体12的第49043074~49043186位碱基的区域;
区域31选自染色体12的第49043361~49043428位碱基的区域;
区域32选自染色体12的第49043633~49043782位碱基的区域;
区域33选自染色体12的第49043866~49043998位碱基的区域;
区域34选自染色体12的第49044198~49044304位碱基的区域;
区域35选自染色体12的第49044401~49044522位碱基的区域;
区域36选自染色体12的第49044742~49044965位碱基的区域;
区域37选自染色体12的第49045918~49045967位碱基的区域;
区域38选自染色体12的第49046063~49046174位碱基的区域;
区域39选自染色体12的第49046258~49046424位碱基的区域;
区域40选自染色体12的第49046607~49046790位碱基的区域;
区域41选自染色体12的第49047963~49048069位碱基的区域;
区域42选自染色体12的第49048657~49048769位碱基的区域;
区域43选自染色体12的第49049103~49049218位碱基的区域;
区域44选自染色体12的第49049680~49050790位碱基的区域;
区域45选自染色体12的第49050884~49052424位碱基的区域;
区域46选自染色体12的第49052562~49052709位碱基的区域;
区域47选自染色体12的第49052913~49053072位碱基的区域;
区域48选自染色体12的第49053205~49053321位碱基的区域;
区域49选自染色体12的第49053474~49053641位碱基的区域;
区域50选自染色体12的第49053976~49054140位碱基的区域;
区域51选自染色体12的第49054305~49054416位碱基的区域;
区域52选自染色体12的第49054526~49054751位碱基的区域;
区域53选自染色体12的第49054898~49055026位碱基的区域;
区域54选自染色体12的第49055274~49055324位碱基的区域。
3.根据权利要求2所述的用于预测肿瘤突变负荷的核酸组合物,其特征在于,DUSP22基因的启动子及其上游区域选自染色体6的第289100~292460位碱基的区域;
优选地,MYCT1基因的启动子及其上游区域选自染色体6的第152694894~152697893位碱基的区域;
优选地,OR1C1基因的启动子及其上游区域选自染色体1的第247758680~247761405位碱基的区域;
优选地,OR4D11基因的启动子及其上游区域选自染色体11的第59500575~59503574位碱基的区域;
优选地,OR4M2基因的启动子及其上游区域选自染色体15的第22077526~22080525位碱基的区域;
优选地,OR4N4基因的启动子及其上游区域选自染色体15的第22091521~22094429位碱基的区域;
优选地,TMEM132C基因的启动子及其上游区域选自染色体12的第128264402~128268401位碱基的区域;
优选地,ZNF595基因的启动子及其上游区域选自染色体4的第50332~53302位碱基的区域。
4.根据权利要求3所述的用于预测肿瘤突变负荷的核酸组合物,其特征在于,所述探针组1包括探针1~77,探针1~77的碱基序列分别如SEQ ID No.1~77所示;
优选地,探针组2包括探针78~101,探针78~101的碱基序列分别如SEQ ID No.78~101所示;
优选地,探针组3包括探针102~116,探针102~116的碱基序列分别如SEQ ID No.102~116所示;
优选地,探针组4包括探针117~122,探针117~122的碱基序列分别如SEQ ID No.117~122所示;
优选地,探针组5包括探针123~131,探针123~131的碱基序列分别如SEQ ID No.123~131所示;
优选地,探针组6包括探针132~153,探针132~153的碱基序列分别如SEQ ID No.132~153所示;
优选地,探针组7包括探针154~174,探针154~174的碱基序列分别如SEQ ID No.154~174所示;
优选地,探针组8包括探针175~197,探针175~197的碱基序列分别如SEQ ID No.175~197所示;
优选地,探针组9包括探针198~211,探针198~211的碱基序列分别如SEQ ID No.198~211所示。
5.一种用于预测肿瘤突变负荷的方法,其特征在于,所述方法包括采用如权利要求1~4任一项所述的核酸组合物获取待测样本的肿瘤突变负荷。
6.根据权利要求5所述的用于预测肿瘤突变负荷的方法,其特征在于,获取待测样本的肿瘤突变负荷包括:采用预测模型,基于所述核酸组合物中的探针组1~9分别获取的对应基因的突变总数,计算待测样本的肿瘤突变负荷;
优选地,所述预测模型的公式为:TMB=3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595;
公式中,KMT2D为KMT2D基因的突变总数;DUSP22为DUSP22基因的突变总数,以此类推;
优选地,所述方法还包括根据TMB值进行判读:当TMB值大于或等于10时,判读待测样本为TMB-H状态,当待测样本的TMB值小于10时,判定待测样本为TMB-L状态。
7.根据权利要求6所述的用于预测肿瘤突变负荷的方法,其特征在于,所述突变总数的获取方法为:通过对探针组1~9中1组或多组获取的捕获片段进行测序比对,获取捕获片段对应目标捕获区域内的突变总数。
8.一种用于预测肿瘤突变负荷的设备,其特征在于,其包括存储单元及与所述存储单元电连接的执行单元;
其中,所述存储单元,用于存储预测待测样本肿瘤突变负荷的预测模型;
所述执行单元,用于接收如权利要求1~4任一项所述的核酸组合物中的探针组1~9分别获取的对应基因的突变总数,并通过预测模型计算所述待测样本的肿瘤突变负荷。
9.根据权利要求8所述的用于预测肿瘤突变负荷的设备,其特征在于,所述预测模型的公式为:TMB=3.0784+2.8282ⅹKMT2D+3.5622ⅹDUSP22+3.4638ⅹMYCT1+3.5757ⅹOR1C1+5.0473ⅹOR4D11+1.3990ⅹOR4M2+2.3760ⅹOR4N4+4.6992ⅹTMEM132C+1.1025ⅹZNF595;
公式中,KMT2D为KMT2D基因的突变总数;DUSP22为DUSP22基因的突变总数,以此类推;
优选地,所述设备还用于根据TMB值进行判读:当TMB值大于或等于10时,判读待测样本为TMB-H状态,当待测样本的TMB值小于10时,判定待测样本为TMB-L状态。
10.一种计算机可读介质,其特征在于,所述计算机可读介质存储有计算机程序,其中,所述计算机程序能被处理器执行以实现如权利要求5~7任一项所述的方法的步骤。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010221309.9A CN111304334B (zh) | 2020-03-26 | 2020-03-26 | 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202010221309.9A CN111304334B (zh) | 2020-03-26 | 2020-03-26 | 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN111304334A true CN111304334A (zh) | 2020-06-19 |
| CN111304334B CN111304334B (zh) | 2022-03-29 |
Family
ID=71156100
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202010221309.9A Active CN111304334B (zh) | 2020-03-26 | 2020-03-26 | 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111304334B (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112342296A (zh) * | 2020-11-16 | 2021-02-09 | 至本医疗科技(上海)有限公司 | 用于实体瘤免疫检查点抑制剂疗法预测的kmt2家族基因变异标志物和试剂盒 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108009400A (zh) * | 2018-01-11 | 2018-05-08 | 至本医疗科技(上海)有限公司 | 全基因组肿瘤突变负荷预测方法、设备以及存储介质 |
| US20180355436A1 (en) * | 2017-06-13 | 2018-12-13 | Genetics Research, Llc, D/B/A Zs Genetics, Inc. | Tumor mutation burden |
| CN109427412A (zh) * | 2018-11-02 | 2019-03-05 | 北京吉因加科技有限公司 | 用于检测肿瘤突变负荷的序列组合和其设计方法 |
| CN109880910A (zh) * | 2019-04-25 | 2019-06-14 | 南京世和基因生物技术有限公司 | 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及系统 |
-
2020
- 2020-03-26 CN CN202010221309.9A patent/CN111304334B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180355436A1 (en) * | 2017-06-13 | 2018-12-13 | Genetics Research, Llc, D/B/A Zs Genetics, Inc. | Tumor mutation burden |
| CN108009400A (zh) * | 2018-01-11 | 2018-05-08 | 至本医疗科技(上海)有限公司 | 全基因组肿瘤突变负荷预测方法、设备以及存储介质 |
| CN109427412A (zh) * | 2018-11-02 | 2019-03-05 | 北京吉因加科技有限公司 | 用于检测肿瘤突变负荷的序列组合和其设计方法 |
| CN109880910A (zh) * | 2019-04-25 | 2019-06-14 | 南京世和基因生物技术有限公司 | 一种肿瘤突变负荷的检测位点组合、检测方法、检测试剂盒及系统 |
Non-Patent Citations (2)
| Title |
|---|
| MATTHEW A. REYNA ET AL: "Pathway and network analysis of more than 2500 whole cancer genomes", 《NATURE COMMUNICATIONS》 * |
| WEIGUANG GU ET AL: "KMT2C mutation associated with tumor mutational burden in small cell lung cancer", 《JOURNAL OF CLINICAL ONCOLOGY》 * |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112342296A (zh) * | 2020-11-16 | 2021-02-09 | 至本医疗科技(上海)有限公司 | 用于实体瘤免疫检查点抑制剂疗法预测的kmt2家族基因变异标志物和试剂盒 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN111304334B (zh) | 2022-03-29 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU2022203184B2 (en) | Sequencing controls | |
| AU2020202153B2 (en) | Single-molecule sequencing of plasma DNA | |
| DK3260555T3 (en) | Hitherto UNKNOWN PROTOCOL FOR PREPARING SEQUENCE LIBRARIES | |
| CN104120132B (zh) | Fbn1基因突变体及其应用 | |
| KR20140006898A (ko) | 결장암 유전자 발현 시그니처 및 이용 방법 | |
| CN101772578A (zh) | 作为标记物用在乳腺癌风险评估、诊断、预后和治疗中的在CHR 5p12和10q26上的遗传变异体 | |
| JP5695385B2 (ja) | 毛髪形状感受性遺伝子 | |
| CN107058538B (zh) | 一种引物组合物及其组成的试剂盒和应用 | |
| CN110033827B (zh) | Hla基因分型的方法、装置、存储介质及处理器 | |
| CN112301123A (zh) | 一种用于50种遗传病单基因突变检测的试剂盒及其使用的探针组 | |
| CN111690748A (zh) | 使用高通量测序检测微卫星不稳定的探针组、试剂盒及微卫星不稳定的检测方法 | |
| CN102643904B (zh) | 焦磷酸测序法检测cyp19a1基因多态性的试剂盒及方法 | |
| CN107236037A (zh) | 一种突变的msh6蛋白及其编码基因、应用 | |
| CN111575379B (zh) | 甲状腺癌相关58基因检测试剂盒及其使用方法 | |
| CN108841823A (zh) | circRNA_26852及其应用 | |
| CN111304334B (zh) | 一种用于预测肿瘤突变负荷的核酸组合物及其方法和设备 | |
| CN116716397A (zh) | 检测dmd基因变异的方法及装置和探针、试剂盒 | |
| CN101883864B (zh) | 用在癌症检测中的约12317-16254残基之间的线粒体dna缺失 | |
| CN104774918A (zh) | 基于实时荧光pcr的il28b基因多态性检测试剂盒 | |
| BRPI0610794A2 (pt) | métodos para diagnosticar uma susceptibilidade a um cáncer e para predizer um risco aumentado de cáncer, kit para ensaiar uma amostra de um indivìduo para detectar uma susceptibilidade a um cáncer, e, métodos para diagnosticar um risco aumentado de cáncer e para diagnosticar um cáncer associado com chr8q24.21 | |
| CN103789436B (zh) | 一种基于人工修饰引物的定量突变检测系统 | |
| CN104212884B (zh) | 胰腺神经内分泌肿瘤易感基因位点及检测方法和试剂盒 | |
| CN111518896A (zh) | 用于检测尼古丁依赖相关的snp位点的引物组、应用、产品及方法 | |
| CN111763734A (zh) | 一种扩增环状rna的方法、特异性扩增引物及试剂盒 | |
| KR101985864B1 (ko) | 유방암 및 난소암 등 암 진단용 조성물 및 이의 용도 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |