[go: up one dir, main page]

CN111263964A - 基因解析方法、基因解析装置、管理服务器、基因解析系统、程序、及记录介质 - Google Patents

基因解析方法、基因解析装置、管理服务器、基因解析系统、程序、及记录介质 Download PDF

Info

Publication number
CN111263964A
CN111263964A CN201880069344.4A CN201880069344A CN111263964A CN 111263964 A CN111263964 A CN 111263964A CN 201880069344 A CN201880069344 A CN 201880069344A CN 111263964 A CN111263964 A CN 111263964A
Authority
CN
China
Prior art keywords
gene
information
analysis
combination
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880069344.4A
Other languages
English (en)
Inventor
井上二三夫
铃木誓吾
铃木健一郎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sysmex Corp
Original Assignee
Sysmex Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sysmex Corp filed Critical Sysmex Corp
Priority claimed from PCT/JP2018/039963 external-priority patent/WO2019083024A1/ja
Publication of CN111263964A publication Critical patent/CN111263964A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/20Allele or variant detection, e.g. single nucleotide polymorphism [SNP] detection
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/20Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/10Signal processing, e.g. from mass spectrometry [MS] or from PCR
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • G16B50/30Data warehousing; Computing architectures

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Analytical Chemistry (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Public Health (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • Apparatus Associated With Microorganisms And Enzymes (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

当使用各种各样的基因组合而解析基因序列时,提升使用者的便利性。对基因的序列信息进行解析的基因解析装置(1)具备:取得由测序仪(2)读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息的控制部(11),及输出基于控制部(11)取得的关于基因组合的信息的读长序列信息的解析结果的输出部(13)。

Description

基因解析方法、基因解析装置、管理服务器、基因解析系统、程 序、及记录介质
【技术领域】
本发明涉及为了对基因的变异进行解析而由计算机实施的基因解析方法、基因解析装置、管理服务器、基因解析系统、程序、及记录介质。
【背景技术】
在近年的基因检查技术的进展之中,对受试体的基因序列进行解析,对适合地选择对应于受试体的特性的治疗法或药剂的个别化医疗的期待升高。在基因序列的解析中,已知例如使用第二代测序仪高通量地解析在与特定的疾病关联的特定的基因中的异常或在翻译成蛋白质的外显子区域中的异常的组合检查。
在专利文献1中记载了判断基因等与成为参照的序列比是否有异常,鉴定对应于显示异常的基因等而使用的药物疗法,根据受试体而确定治疗方法的系统。
【现有技术文献】
【专利文献】
专利文献1:特表2015-200678号公报
【发明的概要】
【发明要解决的课题】
在基因检查中,每个成为解析对象的基因不同的解析变得必要。例如,在使用第二代测序仪的组合检查中,通过同时并列读取片段化的基因,将作为读取的各片段的碱基序列的读长序列信息定位到参照序列上,进行碱基序列的解析。其中,在针对每个基因组合成为解析对象的基因不同时,有每个测定对象基因组合不同的解析程序变得必要的情况。从而,在实施组合检查时,有不得不分开使用针对每个基因组合使用的解析程序这样的烦琐。
另外,在基因检查中,在解析外显子区域整体时,在受试体的基因中检测到多个变异。其中,也含在变异之中未确立该变异的临床上意义或对治疗有效的药剂,医师可活用于实际的治疗的信息以外的。在医师要将基因检查的结果适用于受试体的实际的治疗时,有从检测的多个变异之中想要选择性地知变得能活用于实际的治疗的变异这样的期盼。
这样的状况之中,实施组合检查的使用者有对应于检查对象基因或期盼,针对每个基因组合准备在利用测序仪的基因解析中使用的专用解析程序,进行基因解析的必要。
本发明的一实施方式旨在实现当使用基因组合而解析解析对象基因时,能适用于各种各样的基因组合的使用者的便利性高的基因解析方法、基因解析装置、管理服务器、及基因解析系统等。
【用于解决课题的手段】
为了解决上述的课题,本发明的一实施方式涉及的基因解析方法是对基因的序列信息进行解析的基因解析方法,其包括:取得由测序仪(2)读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息,基于取得的关于基因组合的信息而输出读长序列信息的解析结果。
根据此实施方式,基于取得的关于基因组合的信息而输出读长序列信息的解析结果。根据此实施方式,例如,实施组合检查的使用者,当使用各种各样的基因组合而解析各种组合的解析对象基因时,由于得到了对应于基因组合的输出,使用者的便利性提升。
“基因”含从起始密码子至终止密码子的基因组上的序列、从基因组上的序列生成的mRNA、及基因组上的启动子区域等。成为解析对象的基因含从基因组上的基因转录的mRNA。mRNA含pre-mRNA。
“读长序列”是指由测序得到的多核苷酸序列,“读长序列信息”是指由测序仪2输出的读长序列的信息。
“基因组合”是指用于通过1次执行(1次运行)一系列的解析处理而解析多个解析对象的试剂盒。基因组合在多数情况,含引物或探针等的一套的试剂。其中,“多个解析对象”可为多个基因序列,也可为某的基因的多个外显子。例如,含用于对基因A的序列及基因B的序列进行解析的试剂盒、用于对基因A的外显子1的序列及同基因的外显子2的序列进行解析的试剂盒等。作为基因组合的更具体性的例,可举出用于解析关于特定的疾病的多个基因序列的试剂盒。在使用此基因组合时,可对变得诊疗上重要的1或多个基因的扩增、序列的取代、缺损、插入、启动子区域的甲基化、及融合基因等进行解析。基因组合,作为解析对象,含多个基因。作为基因组合,可使用例如,成为解析对象的基因是100以上的大组合。
“关于基因组合的信息”是可用于确定基因组合的信息即可,例如,可为基因组合名、及在组合检查中的成为解析对象的基因的名等。
也可基于取得的关于基因组合的信息而变更成为解析结果的输出对象的基因。
根据此实施方式,可输出对于基因组合作为解析对象的基因的解析结果。
也可变更用于基于取得的关于基因组合的信息而解析成为解析结果的输出对象的基因的解析算法。
根据此实施方式,在对基因组合作为对象的基因进行解析时,也可不针对每个基因设定在解析中使用的解析程序。
也可将用于以对应多个基因的信息作为关于基因组合的信息输入的输入画面显示于显示部(16)。
也可将用于从多个关于基因组合的信息选择至少1个信息的输入画面显示于显示部(16)。
也可将用于以试剂盒名作为关于基因组合的信息输入的输入画面显示于显示部(16)。
也可将用于以成为解析对象的多个基因作为关于基因组合的信息输入的输入画面显示于显示部(16)。
也可将用于以成为解析对象的疾病作为关于基因组合的信息输入的输入画面显示于显示部(16)。
也可基于取得的关于基因组合的信息而选择要作为读长序列信息的比较对象的参照序列信息,输出基于读长序列信息和选择的参照序列信息的比较的解析结果。
“参照序列”是为了判断读长序列对应于基因上的何区域,及读长序列对应于基因上的何变异等,成为定位读长序列的对象的序列。另外,“定位”是指使各读长序列对齐于成为对象的参照序列的处理。具体而言,在参照的基因组序列中发现有与读取的读长序列相同或类似的序列的区域而旨在使读长序列归属于该区域。
也可基于取得的关于基因组合的信息而从含变异序列的多个参照序列信息选择要作为读长序列信息的比较对象的参照序列信息,输出基于选择的参照序列的解析结果。
“变异”是指基因的多态性、取代及InDel等的变异之中的至少任一个。“InDel(Insertion and/or Deletion)”是指含插入、缺失、或者,插入及缺失的两方的变异。基因的“多态性”含SNV(Single Nucleotide Variant、单核苷酸多态性)、VNTR(VariableNucleotide of Tandem Repeat、串联重复序列多态性)、及STRP(Short Tandem RepeatPolymorphism、微卫星多态性)等。
也可使用针对每个基因组合存储关于作为基因组合的解析对象的基因的信息的基因组合关联信息数据库(121)而输出读长序列信息的解析结果。
也可通过从参照序列数据库(122)读取选择的参照序列,对于读取的参照序列定位读长序列信息来进行比对。
也可从参照序列数据库读取选择的参照序列,基于参照序列和读长序列信息的一致度而确定读长序列信息的位置,鉴定读长序列信息中所含的变异。
也可在由读长序列信息的解析鉴定的变异之中,输出含对应于取得的关于基因组合的信息的关于变异的信息的解析结果。
也可基于取得的关于基因组合的信息而作为读长序列信息的解析结果输出与由读长序列信息的解析鉴定的变异关联的药剂信息。
也可基于由读长序列信息的解析鉴定的变异而检索将作为解析对象的基因的变异和与基因组合关联的药剂对应存储的药剂数据库(124)。
也可生成在药剂数据库(124)的检索中提取的与由读长序列信息的解析鉴定的变异关联的药剂的列表。
也可生成在药剂数据库(124)的检索中提取的与由读长序列信息的解析鉴定的变异关联的药剂的列表。
也可作为读长序列信息的解析结果,输出含药剂的承认状况的药剂信息。
也可基于由读长序列信息的解析鉴定的变异而检索将作为解析对象的基因的变异和与变异关联的参照信息对应存储的参照数据库(125)。
也可基于读长序列信息的解析结果而制成报告,报告在由读长序列信息的解析鉴定的变异之中含对应于与取得的基因组合关联的信息的关于变异的信息。
也可从鉴定的全部的变异之中,将对应于取得的关于基因组合的信息的变异基于关于基因组合的信息而选择,作为读长序列信息的解析结果,输出与选择的变异关联的信息。
报告也可含与基因组合关联的信息。
报告也可含药剂的列表及参照信息的至少任一方。
也可向管理服务器(3)发送关于基因的序列信息的解析状况的信息。
也可针对每个关于基因组合的信息,向管理服务器(3)发送关于基因的序列信息的解析状况的信息。
也可针对每个关于基因组合的信息,向管理服务器(3)发送基因的序列解析次数。
也可针对每个关于基因组合的信息,向管理服务器(3)发送解析的基因的数。
也可针对每个关于基因组合的信息,向管理服务器(3)发送在基因的序列解析中处理的关于数据量的信息。
也可以对读长序列信息和与取得的关于基因组合的信息相关联的基因组合作为解析对象的基因的序列信息进行比较的比较结果作为读长序列信息的解析结果输出。
也可在取得的关于基因组合的信息不是已注册的时,表示错误。
例如,取得的关于基因组合的信息未注册到基因组合关联信息数据库(121)等之时,在使用所述基因组合进行解析时,有成为不适合的解析结果的可能性。根据此实施方式,可防止使用未注册的基因组合而输出不适合的结果,或执行不要的解析。
也可在取得的关于基因组合的信息不是从医疗机关(210)指定的时,表示错误。
也可在表示错误之后,在进行请求从使用者输入的基因组合的使用的许可的输入时,许可基因组合的解析。
也可在取得的关于基因组合的信息不是已注册的时,禁止基因组合的解析。
也可在取得的关于基因组合的信息不是从医疗机关(210)指定的时,禁止基因组合的解析。
也可在取得关于基因组合的信息的工序中有多个模式,能选择多个模式之中之任一者。
也可在读长序列信息之中含取得的关于基因组合的信息所示的基因组合不作为解析对象的基因的序列的读长序列信息是指定数以上时,表示错误。
也可在读长序列信息中含与关于基因组合的信息相关联的索引序列。
索引序列也可针对每个关于基因组合的信息不同。
也可在与读长序列信息中所含的索引序列相关联的关于基因组合的信息与取得的关于基因组合的信息不同时,表示错误。
也可对于第1试样,对使用用于解析第1解析对象基因组的第1基因组合而读取的第1读长序列信息进行解析,对于第2试样,对使用用于解析第2解析对象基因组的第2基因组合而读取的第2读长序列信息进行解析,接受确定基因组合的信息的选择而取得关于基因组合的信息,基于选择的关于基因组合的信息而输出对第1读长序列信息进行解析的解析结果及对第2读长序列信息进行解析的解析结果。
其中,“试样”也可称为受试体或样品,在本领域中与标本、调制物同义使用,是指从作为供给源的生物材料(例如,个体、体液、细胞株、组织培养物或组织切片)得到的任意的标本或调制物。
也可还含评价基因组合检查的品质的工序,在输出解析结果的工序中,基于取得的关于基因组合的信息而输出品质的评价结果。
根据此实施方式,可在使用各种各样的基因组合而解析各种组合的解析对象基因时,进行对应于基因组合的适合的品质管理。
“品质评价指标”是评价基因组合检查的品质的指标,可举出例如,测序仪(2)输出的读长序列信息中所含的读取品质、多个成为解析对象的基因中所含的碱基之中,由测序仪(2)读取的碱基的比例、读长序列信息的读取深度(深度)、读长序列信息的读取深度(深度)的偏差,检测到品质管理试样中所含的各标准基因的全部变异与否,等的指标。
也可在评价基因组合检查的品质的工序中,基于取得的关于基因组合的信息而选择评价品质时使用的品质管理指标。
也可在评价基因组合检查的品质的工序中,基于取得的关于基因组合的信息而选择评价品质时使用的品质管理指标的评价基准。
也可在评价基因组合检查的品质的工序中,基于取得的关于基因组合的信息而选择评价品质时使用的品质管理指标的数。
为了解决上述的课题,本发明的一实施方式涉及的基因解析装置(1)是对基因的序列信息进行解析的基因解析装置(1),其具备:取得由测序仪(2)读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息的控制部(11)和输出部(13),控制部(11)基于取得的关于基因组合的信息而向输出部(13)输出读长序列信息的解析结果。
根据此实施方式,基因解析装置(1)基于取得的关于基因组合的信息而输出读长序列信息的解析结果。根据此实施方式,实施组合检查的使用者当使用各种各样的基因组合而解析基因时,由于得到了对应于使用的基因组合的输出,使用者的便利性提升。
控制部(11)也可基于取得的关于基因组合的信息而选择要作为读长序列信息的比较对象的参照序列信息,向输出部(13)输出基于读长序列信息和选择的参照序列信息的比较的解析结果。
控制部(11)也可在由读长序列信息的解析鉴定的变异之中,向输出部(13)输出含对应于取得的关于基因组合的信息的关于变异的信息的解析结果。
控制部(11)也可基于取得的关于基因组合的信息而向输出部(13)输出与由读长序列信息的解析鉴定的变异关联的药剂信息读长序列信息的解析结果。
控制部(11)也可基于取得的上述关于基因组合的信息而向输出部(13)输出基因组合检查的品质的评价结果。
为了解决上述的课题,本发明的一实施方式涉及的管理服务器(3)从基因解析装置(1)接收含确定进行基因的序列解析的使用者的信息,使用的关于基因组合的信息和关于序列信息的解析状况的信息的信息。
“关于序列信息的解析状况的信息”,例如,可为在基因解析装置1中使用指定的基因组合的解析被执行的序列解析次数,也可为解析的基因数,也可为鉴定的变异的数等的累计。或者,也可为关于解析中处理的数据量的信息。
管理服务器(3)也可从基因解析装置(1)接收关于基因的序列信息的解析状况的信息。
管理服务器(3)也可针对每个关于基因组合的信息,从基因解析装置(1)接收关于基因的序列信息的解析状况的信息。
管理服务器(3)也可针对每个关于基因组合的信息,从基因解析装置(1)接收基因的序列解析次数。
管理服务器(3)也可针对每个关于基因组合的信息,从基因解析装置(1)接收解析的基因的数。
管理服务器(3)也可针对每个关于基因组合的信息,从基因解析装置(1)接收关于基因的序列解析中处理的数据量的信息。
管理服务器(3)也可基于关于基因的序列信息的解析状况的信息而计算使用者使用基因解析装置(1)而进行序列解析时的费用。
管理服务器(3)也可从基因解析装置(1)接收关于基因组合的信息的更新要求。
为了解决上述的课题,本发明的一实施方式涉及的基因解析系统(100)具备:具备取得由测序仪(2)读取的读长序列信息及关于含成为解析对象的多个基因的基因组合的信息的控制部(11),输出基于控制部(11)取得的关于基因组合的信息的读长序列信息的解析结果的输出部(13)的基因解析装置(1),从基因解析装置(1)经网络(4)接收含确定进行基因的序列解析的使用者的信息,使用的关于基因组合的信息和关于基因的序列的解析状况的信息的信息的管理服务器(3)。
根据此实施方式,基因解析装置(1)基于取得的关于基因组合的信息而输出读长序列信息的解析结果。一方面,管理服务器(3)从基因解析装置(1)接收含确定进行基因的序列解析的使用者的信息,使用的关于基因组合的信息和关于基因的序列的解析状况的信息的信息。
根据此实施方式,例如,实施组合检查的使用者,当使用各种各样的基因组合而解析各种组合的基因时,由于得到了对应于使用的基因组合的输出,便利性提升。再者,管理服务器(3)可将使用者使用基因解析装置(1)而进行的解析的解析成效确认-管理。从而,例如,可适合地确定基因解析系统(100)的利用费等的费用,向使用者请求。
也可基于关于基因的序列信息的解析状况的信息而计算使用者使用上述基因解析装置而进行序列解析时的费用。
本发明的各实施方式涉及的基因解析装置(1)可由计算机实现,在此时,通过以计算机作为基因解析装置(1)所具备的各部(软件要素)运行来用计算机实现基因解析装置(1)的程序、及记录其的计算机能读取的记录介质也在本发明的范畴内。
为了解决上述的课题,本发明的一实施方式涉及的程序是对基因的序列信息进行解析的程序,其为用于使计算机执行取得由测序仪读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息的工序,基于取得的关于基因组合的信息而输出读长序列信息的解析结果的工序的程序。
根据此实施方式,得到与本发明的一实施方式涉及的基因解析方法同样的效果。
本发明的一实施方式涉及的记录介质是记录本发明的一实施方式涉及的程序的计算机能读取的记录介质。
本发明的一实施方式涉及的基因解析方法是取得由测序仪(2)读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息,对基于取得的关于基因组合的信息而输出读长序列信息的解析结果的基因的序列信息进行解析的基因解析方法,在取得的关于基因组合的信息不是已注册的时,显示错误。
本发明的一实施方式涉及的基因解析方法是取得由测序仪(2)读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息,对基于取得的关于基因组合的信息而输出读长序列信息的解析结果的基因的序列信息进行解析的基因解析方法,在取得的关于基因组合的信息不是从医疗机关(210)指定的时,显示错误。
【发明的效果】
根据本发明,当使用各种各样的基因组合而测定各种组合的解析对象基因时,可提升使用者的便利性。
【附图的简单的说明】
【图1】图1是显示本发明的一实施方式涉及的基因解析系统的适用例的图。
【图2】图2是显示在基因解析系统中进行的主要的处理的例的序列图。
【图3】图3是显示存储在管理服务器的数据的数据结构的例的图。
【图4】图4是显示基因解析装置的构成的例的图。
【图5】图5是显示接受关于基因组合的信息的输入的处理的流程的一例的流程图。
【图6】图6是显示在关于基因组合的信息的输入中使用的GUI的例的图。
【图7】图7是显示基因组合关联信息数据库的数据结构的例的图。
【图8】图8是显示在使用者更新关于基因组合的信息时使用的GUI的例的图。
【图9】图9是对用于将试样DNA的碱基序列由测序仪解析的预处理至测序的顺序的一例进行说明的流程图。
【图10】图10是对于试样的片段化的工序(a)、及索引序列及适配体序列的赋予的工序(b)的例进行说明的图。
【图11】图11是对于杂交的工序的一例进行说明的图。
【图12】图12是对于回收成为解析对象的DNA片段的工序的一例进行说明的图。
【图13】图13是对于将DNA片段供于流动池的工序的一例进行说明的图。
【图14】图14是对于扩增成为解析对象的DNA片段的工序的一例进行说明的图。
【图15】图15是对于测序工序的一例进行说明的图。
【图16】图16是对利用基因解析装置的解析的流程的一例进行说明的流程图。
【图17】图17是显示读长序列信息的文件格式的一例的图。
【图18】图18的(a)是对由数据调整部的比对进行说明的图,(b)是显示数据调整部的比对结果的格式的一例的图。
【图19】图19是显示参照序列数据库的结构例的图。
【图20】图20是显示整合到参照序列数据库中所含的参照序列(不是显示野生型的序列的)的已知的变异的例的图。
【图21】图21是对比对的详细的工序的一例进行说明的流程图。
【图22】图22的(a)是显示评分算出的一例的图,(b)是显示评分算出的其他例的图。
【图23】图23是显示变异鉴定部生成的结果文件的格式的一例的图。
【图24】图24是显示变异数据库的结构的一例的图。
【图25】图25是显示变异数据库中的变异信息的结构的详细例的图。
【图26】图26的(a)是显示解析对象的基因和位置信息的对应关系的表,(b)是显示从结果文件除外不对应于关于基因组合的信息的变异的样式的图。
【图27】图27是显示基因解析装置的构成的别的一例的图。
【图28】图28是显示药剂检索部生成关于变异的药剂的列表的处理的一例的流程图。
【图29】图29是显示药剂数据库的数据结构的例的图。
【图30】图30是显示药剂数据库的数据结构的例的图。
【图31】图31是显示药剂检索部生成含与关于变异的药剂相关的信息的列表的处理的一例的流程图。
【图32】图32是显示基于药剂检索部检索药剂数据库而得到的信息而判断有适用外使用的可能性的药剂的有无,生成含判断结果的列表的处理的一例的流程图。
【图33】图33是显示药剂数据库的数据结构的例的图。
【图34】图34是显示含药剂检索部生成关于药剂的治验的信息的列表的处理的一例的流程图。
【图35】图35是显示基因解析装置的构成的其他一例的图。
【图36】图36是显示参照数据库的数据结构的一例的图。
【图37】图37是显示制成的报告的一例的图。
【图38】图38是显示基因解析装置的构成的其他一例的图。
【图39】图39是显示基因组合关联信息数据库的数据结构的例的图。
【图40】图40是显示在关于基因组合的信息的输入中使用的GUI的别的例的图。
【图41】图41是显示在关于基因组合的信息的输入中使用的GUI的其他例的图。
【图42】图42是显示接受关于基因组合的信息的输入的处理的流程的别的例的流程图。
【图43】图43是显示基因解析装置的其他一例的图。
【图44】图44是显示用于对基因序列进行解析的处理的流程的一例的流程图。
【图45】图45是显示品质评价指标的一例的图。
【图46】图46是显示制成的报告的一例的图。
【具体实施方式】
〔实施方式1〕
以下,对于本发明的一实施方式而具体进行说明。
(基因解析方法的概要)
本发明的一实施方式涉及的基因解析方法取得关于基因组合的信息,基于取得的关于基因组合的信息而输出由测序仪读取的读长序列的解析结果。由此,当使用各种各样的基因组合而解析各种组合的解析对象基因时,即使不分开使用针对每个基因组合使用的解析程序,也可得到对应于基因组合的适合的解析结果的输出,使用者的便利性提升。
(基因解析系统100的适用例)
首先,对于本发明的一实施方式涉及的基因解析系统100的概略而使用图1进行说明。图1是显示本发明的一实施方式涉及的基因解析系统100的适用例的图。基因解析系统100是对基因的序列信息进行解析的系统,其具备至少基因解析装置1和管理服务器3。
图1中所示的基因解析系统100对应于自管理检查机关120中执行的解析整体的解析系统管理机关130、及医疗机关210的解析委托,对提供的试样进行解析,在将解析结果提供于医疗机关210的检查机关120中适用。基因解析装置1设置于检查机关120,管理服务器3设置于解析系统管理机关130,由这些基因解析装置1及管理服务器3构成基因解析系统100。
检查机关120是将从医疗机关210提供的试样检查-解析,制成基于解析结果的报告,向医疗机关210提供该报告的机关。在检查机关120设置测序仪2、及基因解析装置1等,但不限于此。
解析系统管理机关130是管理在利用基因解析系统100的各检查机关120中执行的解析整体的机关。例如,解析系统管理机关130是将基因解析装置1设置于检查机关120,提供对应于各种各样的基因组合的基因解析服务的事业者。解析系统管理机关130以更新存储在基因解析装置1的数据库的信息,基于最新的信息而进行基因解析的方式进行基因解析系统100的管理。解析系统管理机关130也可取得在基因解析装置1中的基因解析的状况,对应于基因解析的成效而从检查机关120得到报酬。
医疗机关210是医师、看护师、药剂师等对于患者进行诊断、治疗、调剂等的医疗行为的机关,可举出例如,医院、诊疗所、药局等。
(将基因解析系统100在适用例中的处理)
接下来,对于图1中所示的基因解析系统100的适用例中的处理的流程而使用图2更具体性地进行说明。图2是显示在基因解析系统100中进行的主要的处理的例的序列图。再者,图2中所示的处理不过是在各机关中进行的处理的一部分。
<基因解析系统利用的申请及利用开始>
首先,希望基因解析系统100的利用的检查机关120导入基因解析装置1。进而,向解析系统管理机关130申请基因解析系统100的利用(步骤S101)。
检查机关120及解析系统管理机关130可从多个契约类别之中,关于基因解析系统100的利用,在事前缔结期望的契约。例如,从解析系统管理机关130提供于检查机关120的服务内容、解析系统管理机关130对于检查机关120请求的系统利用费的确定方法、及系统利用费的支付方法等也可为从不同的多个契约类别选择。解析系统管理机关130的管理服务器3对应于自检查机关120的申请,确定在与检查机关120之间缔结的契约的内容(步骤S102)。
接下来,由解析系统管理机关130管理的管理服务器3对于缔结契约的检查机关120的基因解析装置1赋予检查机关ID,开始各种服务的提供(步骤S103)。
基因解析装置1从管理服务器3接收各种服务。在各种服务中,含可从基因解析装置1输出的基因序列的解析结果,及用于控制基于该解析结果的报告等的程序或信息的提供。由此,基因解析装置1可输出适合于输入的关于基因组合的信息的解析结果及报告等。
<向检查机关120的解析委托>
在医疗机关210中,医师等根据需要,采集受试体的病变部位的组织及血液等的试样。向检查机关120委托采集的试样的解析时,例如,从设于医疗机关210的通信终端5发送解析委托(步骤S105)。向检查机关120委托试样的解析时,医疗机关210与解析委托的发送一同,将每个试样赋予的试样ID提供于检查机关120。赋予每个试样的试样ID将采集各试样的受试体的信息等和各试样对应。
在本说明书中,“受试体”是指人受试体以及不是人的受试体、例如,哺乳类、无脊椎动物、脊椎动物、菌类、酵母、细菌、病毒及植物等。本说明书的实施例关于人受试体,但本发明的概念可适用于人以外的任意的动物或植物等的生物来源的基因组,在医疗、兽医学及动物科学等的领域中有用。
以下,对医疗机关210将组合检查向检查机关120委托解析的情况举例进行说明。再者,组合检查不限于临床检查,也含研究用途的检查。
也可在从医疗机关210委托基因组合检查时,指定期望的基因组合。所以,在图2的步骤S105中从医疗机关210发送的解析委托中,可含关于基因组合的信息。其中,关于基因组合的信息是可用于确定基因组合的信息即可,例如可为基因组合名、及在组合检查中的成为解析对象的基因的名等。
<用检查机关120的解析>
基因解析装置1从医疗机关210接收解析委托(S106)。再者,基因解析装置1从作为该解析委托的发送方的医疗机关210接受试样。
再者,可在检查机关120从医疗机关210受委托的解析中使用的基因组合有多个,并且,成为解析对象的基因组针对每个基因组合确定。检查机关120也能根据解析的目的而分开使用多个基因组合。即,可对于从医疗机关210提供的第1试样,为了对第1解析对象基因组进行解析而使用第1基因组合,对于第2试样,为了对第2解析对象基因组进行解析而使用第2基因组合。
基因解析装置1从使用者接受用于解析试样的关于基因组合的信息的输入(步骤S107)。
在检查机关120中,进行接受的试样的预处理,进行使用测序仪2的测序(步骤S108)。
其中,预处理可含使试样中所含的DNA等的基因片段化,至回收片段化的基因的处理。另外,测序含读取用预处理回收的成为解析对象的1或多个DNA片段的序列的处理。由利用测序仪2的测序读取的序列信息作为读长序列信息输出到基因解析装置1。
接下来,基因解析装置1从测序仪2取得读长序列信息而进行基因序列的解析(步骤S109)。
基因解析装置1基于步骤S109中的解析结果而制成报告(步骤S110)、向通信终端5发送制成的报告(步骤S111)。
<向医疗机关210请求解析费>
如上所述,在检查机关120中,对应于自医疗机关210的解析委托,解析试样,制成基于解析结果的报告。医疗机关210从检查机关120接收报告(步骤S112)。检查机关120也可对试样进行解析,对于该医疗机关210请求作为将基于解析结果的报告提供于解析委托方的医疗机关210的费用的解析费。
<系统利用费的请求>
解析系统管理机关130也可如上所述,与提供对应于与检查机关120的契约内容的各种信息及服务一同,对于各检查机关120请求系统利用费等的费用。
利用基因解析系统100的检查机关120的基因解析装置1向管理服务器3通知在解析中使用的关于基因组合的信息、关于解析的基因的信息、及解析成效等(步骤S113)。具体而言,基因解析装置1将检查机关ID、基因组合ID、基因ID及解析成效等送附到管理服务器3。
管理服务器3将取得的检查机关ID、基因组合ID、基因ID、及解析成效等对应存储(步骤S114)。
检查机关ID是确定进行基因的序列解析的使用者的信息,也可为赋予利用基因解析装置1的每个使用者的识别信息的使用者ID。
基因组合ID是为了确定在成为对象的基因的解析中使用的基因组合而赋予的识别信息。赋予基因组合的基因组合ID与提供基因组合名及该基因组合的公司名等对应。
基因ID是为了确定解析对象的基因而赋予每个基因的识别信息。
解析成效是关于基因的序列信息的解析状况的信息。解析成效,例如,可为在基因解析装置1中使用指定的基因组合的解析被执行的序列解析次数,也可为解析的基因数,也可为鉴定的变异的数等的累计。或者,也可为关于解析中处理的数据量的信息。
管理服务器3针对每个检查机关120合计在指定的期间(例如,日、周、月、年等任意的期间)的解析成效,确定对应于合计结果及契约类别的系统利用费(步骤S115)。解析系统管理机关130也可以对于检查机关120请求确定的系统利用费,向解析系统管理机关130支付系统利用费的方式要求。
(基因解析系统100的构成)
基因解析系统100是对基因的序列信息进行解析的系统,其具备至少基因解析装置1和管理服务器3。基因解析装置1经内部网及互联网等的网络4而与管理服务器3连接。
(测序仪2)
测序仪2是为了读取试样中所含的基因的碱基序列而利用的碱基序列解析装置。
本实施方式涉及的测序仪2优选进行使用优选为第二代测序技术的测序的第二代测序仪、或者第3代的测序仪。第二代测序仪是近年开发的推进的一组的碱基序列解析装置,通过在流动池内进行大量并列处理克隆地扩增的DNA模板或单独DNA分子而有飞跃性地提升的解析能力。
另外,在本实施方式中能使用的测序技术可为通过重复阅读相同的区域(深度测序)而取得多个读长的测序技术。
作为能在本实施方式中使用的测序技术的例,可举出离子半导体测序、焦磷酸测序(pyrosequencing)、使用可逆染料终止子的边测序边合成(sequencing-by-synthesis)、边测序边连接(sequencing-by-ligation)、及由寡核苷酸的探针结扎的测序等的,基于Sanger法以外的序列原理的,每1次运行能取得多数的读长的测序技术。
在测序中使用的测序引物不特别限定,基于对于扩增目的区域适宜的序列而适宜设定。另外,对于在测序中使用的试剂,也对应于使用的测序技术及测序仪2选择适宜的试剂即可。对于预处理~测序的顺序,随后举具体例进行说明。
(管理服务器3)
接下来,对于收纳在管理服务器3的数据而使用图3进行说明。图3是显示存储在管理服务器3的数据的数据结构的例的图。解析系统管理机关130基于图3中所示的各数据而确定向各检查机关请求的系统利用费。管理服务器3从基因解析装置1经网络4接收含确定进行基因的序列解析的使用者的信息(例如,检查机关ID),使用的关于基因组合的信息和关于基因的序列的解析状况的信息(例如,解析成效)的信息。
在图3中所示的数据3A中,利用基因解析系统100的检查机关的名称和针对每个检查机关赋予的检查机关ID相关联。在图3中所示的数据3B中,在解析系统管理机关130与检查机关120之间缔结的契约的类别,对缔结各契约的检查机关提供的服务(例如,能使用的基因组合)和系统利用费相关联。
例如,在检查机关“P机关”与解析系统管理机关130之间缔结“计划1”的契约时,解析系统管理机关130对于检查机关P请求对应于动作次数的利用费。再者,“动作次数”是指例如,基因解析装置1进行的组合检查的次数。
图3中所示的数据3C~3E各自是关于利用基因解析系统100的检查机关在2017年8月1日~2017年8月31日的期间进行的动作次数、解析的基因、及鉴定的变异的总数的解析成效。这些解析成效从基因解析装置1向管理服务器3发送,在管理服务器3中存储。解析系统管理机关130基于这些解析成效的数据而确定向各检查机关请求的系统利用费。成效的合计期间不限于上述,在日、周、月、年等任意的期间合计即可。
再者,也可在解析系统管理机关130确定系统利用费时,对应于是否由提供(例如,制造或销售)检查中使用的基因组合的公司提供,变更系统的利用费。此时,在管理服务器3中,存储图3中所示的数据3F即可。在图3中所示的数据3F中,“A公司”、“B公司”等的提供基因组合的公司名,基因组合ID,及关于系统利用费的约定(例如,系统利用费的要否等)相关联。
举例说明在“P机关”与解析系统管理机关130之间缔结“计划1”的契约,其解析成效是如图3所示的情况。P机关进行5次使用由A公司提供的基因组合(基因组合ID“AAA”)的检查,进行10次使用由B公司提供的基因组合(基因组合ID“BBB”)的检查。根据图3中所示的数据,对于使用由A公司提供的基因组合的5次分而不要系统利用费。所以,解析系统管理机关130对于P机关,除外使用由A公司提供的基因组合的检查的次数,确定系统利用费。
(基因解析装置1的构成)
图4是基因解析装置1的构成的一例。基因解析装置1是具备取得由测序仪2读取的读长序列信息及关于含成为解析对象的多个基因的基因组合的信息的控制部11,输出基于控制部11取得的关于基因组合的信息的读长序列信息的解析结果的输出部13的装置。基因解析装置1可使用计算机构成。例如,控制部11是CPU等的处理器,存储部12是硬盘驱动器。
另外,在存储部12中,也存储用于序列解析的程序、用于生成单一的参照序列的程序等。输出部13含显示器、打印机、扬声器等。输入部17含键盘、鼠标、触摸传感器等。另外,也可使用如触摸传感器和显示器一体化的触控面板一样的有输入部及输出部的双方的功能的装置。通信部14是控制部11用于与外部的装置通信的接口。
基因解析装置1具备统括基因解析装置1所具备的各部而控制的控制部11、存储解析执行部110使用的各种数据的第1存储部12、输出部13、通信部14、显示部16、及输入部17。控制部11具备解析执行部110及管理部116。解析执行部110还具备序列数据读取部111、信息选择部112、数据调整部113、变异鉴定部114、及报告制成部115。在第1存储部12中,存储基因组合关联信息数据库121、参照序列数据库122、变异数据库123、及解析成效日志151。
基因解析装置1即使在每个解析使用不同的基因组合时,也制成含对应于使用的基因组合的解析结果的报告。利用基因解析系统100的使用者不根据基因组合的类别,而用共同的解析程序解析组合检查的结果,制成报告变得可能。从而,解除了在实施组合检查时,分开使用针对每个基因组合使用的解析程序,或对于解析程序,不得不针对使用的每个基因组合进行特殊的设定的这样的烦琐,使用者的便利性提升。
基因解析装置1的使用者从输入部17输入关于基因组合的信息时,信息选择部112以参照基因组合关联信息数据库121,对应于输入的关于基因组合的信息,解析程序执行解析对象的基因的解析的方式控制解析程序的算法。即,基因解析装置1对应于输入的关于基因组合的信息,变更解析算法。
其中,关于基因组合的信息是确定在利用测序仪2的测定中使用的基因组合即可,例如,基因组合名、基因组合的成为解析对象的基因名、及基因组合ID等。
信息选择部112基于从输入部17输入的关于基因组合的信息而变更用于进行对应于关于该基因组合的信息显示的作为基因组合的解析对象的基因的解析的解析算法。作为本实施方式中的具体性的解析算法的变更点,可举出(1)参照序列的变更、及(2)为了鉴定变异而参照的变异数据库123的区域的变更。
信息选择部112对于数据调整部113、变异鉴定部114、及报告制成部115的至少任1个,输出基于关于基因组合的信息的指示。通过采用此构成,基因解析装置1可基于输入的关于基因组合的信息而输出读长序列信息的解析结果。
即,信息选择部112是以取得关于含成为解析对象的多个基因的基因组合的信息,基于取得的关于基因组合的信息而从输出部13输出读长序列信息的解析结果的方式控制的功能块。
由实施组合检查的使用者解析各种各样的试样中所含的基因时,对应于每试样的解析对象基因组使用各种各样的基因组合。
即,基因解析装置1可从第1试样取得使用用于解析第1解析对象基因组的第1基因组合读取的第1读长序列信息、及从第2试样取得使用用于解析第2解析对象基因组的第2基因组合读取的第2读长序列信息。
基因解析装置1即使在使用各种各样的基因组合解析各种组合的解析对象基因时,通过具备信息选择部112,也可适合地输出对读长序列信息进行解析的解析结果。
即,无需对于使用者,针对每个解析对象基因设定在读长序列信息的解析中使用的解析程序,或进行解析,而能仅通过选择关于基因组合的信息来适合地输出各读长序列信息的解析结果。
例如,在信息选择部112对于数据调整部113输出基于关于基因组合的信息的指示时,由数据调整部113进行反映关于该基因组合的信息的比对处理等。
信息选择部112以对应于关于基因组合的信息,将数据调整部113在读长序列信息的定位中使用的参照序列(野生型的基因组序列及掺入了变异序列的参照序列)仅限定于关于对应于关于基因组合的信息的基因的参照序列的方式指示。
此时,由于由数据调整部113的处理的结果已经反映关于基因组合的信息,信息选择部112也可对于进行由数据调整部113的处理的以下处理的变异鉴定部114,不输出基于关于基因组合的信息的指示。
例如,在信息选择部112对于变异鉴定部114输出基于关于基因组合的信息的指示时,由变异鉴定部114进行反映关于该基因组合的信息的处理。
例如,信息选择部112以对应于关于基因组合的信息,将变异鉴定部114参照的变异数据库123的区域仅限定于关于对应于关于基因组合的信息的基因的变异的方式指示。由此,变得在由变异鉴定部114的处理的结果中反映关于基因组合的信息。
(关于基因组合的信息的输入)
其中,对于图2的步骤S107中所示的接受关于基因组合的信息的输入的处理而使用图5进行说明。图5是显示接受关于基因组合的信息的输入的处理的流程的一例的流程图。
其中,举例说明控制部11将用于输入关于基因组合的信息的GUI显示于显示部16,使使用者输入关于基因组合的信息的构成。
此时,输入部17可为能进行对于向使用者提示的GUI的输入操作的装置(例如,鼠标及键盘等)。在显示部16重叠触控面板时,显示部16有作为输入部17的功能。即,在作为显示部16,使用触控面板时,显示部16也兼有作为输入部17的功能。
首先,基因解析装置1的控制部11向显示部16显示用于使使用者选择关于基因组合的信息的GUI。基于对于GUI的使用者的输入操作而进行关于基因组合的信息的取得(步骤S201)。
信息选择部112,在作为GUI表示的信息之中,基于由使用者选择的信息而检索基因组合关联信息数据库121,读取对应于选择的信息的关于基因组合的信息。
另外,基因解析装置1读取从医疗机关210接受的解析委托中所含的关于基因组合的信息。
在对应于选择的信息的基因组合注册在基因组合关联信息数据库121(步骤S202中YES)、并且其基因组合与从医疗机关210接受的解析委托中所含的基因组合一致时(步骤S203中YES),信息选择部112接受该输入。进而,信息选择部112显示能使用对于显示部16输入的基因组合的意思的消息(步骤S204)。
一方面,在对应于选择的信息的基因组合未注册到基因组合关联信息数据库121的情况中,即,选择未注册的基因组合时(步骤S202中NO)、信息选择部112向显示部16显示无法使用输入的基因组合的意思的消息(步骤S205)、禁止利用基因解析装置1的解析。
此时,也可代替基因组合是不可使用的意思的消息而表示通知错误的消息。作为这样的消息,例如,可为“选择的基因组合未注册”这样的消息,也可为加进一步催促“请再次输入关于基因组合的信息”等的再输入的消息。
另外,在对应于选择的信息的基因组合与从医疗机关210接受的解析委托中所含的基因组合不一致的情况(步骤S203中NO)中,信息选择部112向显示部16显示无法使用输入的基因组合的意思的消息(步骤S205)、禁止利用基因解析装置1的解析。
在此时,也可代替基因组合无法使用的意思的消息而表示通知错误的消息。作为这样的消息,例如,可为“选择的基因组合与命令不同”这样的消息,也可为加进一步催促“请再次输入关于基因组合的信息”等的再输入的消息。
由这样的处理,可防止使用不适合的基因组合进行测序,或执行不要的解析动作,消除基因组合的浪费的使用或基因解析系统100的浪费的动作。
(在关于基因组合的信息的输入中使用的GUI的例)
接下来,使用图6而对于使使用者输入关于基因组合的信息的输入画面的几个例进行说明。图6是显示在关于基因组合的信息的输入中使用的GUI的例的图。
如图6所示,也可作为关于基因组合的信息,将“xxxxx”、“yyyyy”等的基因组合名的列表显示于GUI,从列表中所示的基因组合之中使使用者选择期望的基因组合。
GUI中所表示的基因组合名的列表将注册到基因组合关联信息数据库121的赋予基因组合ID的基因组合的基因组合名表示于基部。
在图6中所示的GUI中,“基因组合2(基因组合名:“yyyyy”)”表示由使用者选择的样式。信息选择部112以与选择的基因组合名“yyyyy”相关联的基因组合ID作为关键字使用,检索基因组合关联信息数据库121而取得对应于输入的基因组合名的关于基因组合的信息。
(基因组合关联信息数据库121)
接下来,对于经输入部17输入关于基因组合的信息时,存储在信息选择部112参照的基因组合关联信息数据库121的数据而使用图7进行说明。图7是显示基因组合关联信息数据库121的数据结构的例的图。
在基因组合关联信息数据库121中,如图7中所示的数据121A一样,可成为解析对象的基因的名称及赋予每个基因的基因ID针对每个基因组合存储。
另外,在基因组合关联信息数据库121中,如图7中所示的数据121B一样,能选择的基因组合的名称、赋予各基因组合的基因组合ID、及各基因组合作为解析对象的基因的基因ID(关联基因ID)相关联存储。再者,也可对于各基因组合,也对应关于其使用被公共机关(例如,日本的厚生省等)承认与否的信息。
如图6所示,从向GUI提示的基因组合之中使使用者选择期望的基因组合时,信息选择部112参照基因组合关联信息数据库121而提取与选择的基因组合名相关联的基因组合ID及关联基因ID。
如图40所示,从向GUI提示的基因名之中选择解析对象的基因时,信息选择部112参照基因组合关联信息数据库121而提取与选择的基因名相关联的基因ID、及在关联基因ID含这些基因ID的基因组合的基因组合ID。
再者,也可在基因组合关联信息数据库121中,如图7中所示的数据121C一样,关于疾病的基因组合的名称及各基因组合的成为解析对象的基因名(或者基因ID)被相关联存储。
从向GUI提示的每疾病的基因组合名的列表之中选择关于期望的疾病的基因组合时(即,如图41所示的情况)、信息选择部112参照基因组合关联信息数据库121,从与关于选择的疾病的基因组合名相关联的基因名提取它们的基因ID、及在关联基因ID中含这些基因ID的基因组合的基因组合ID。
<基因组合关联信息数据库121的更新>
其中,对于存储在基因组合关联信息数据库121的信息的更新而使用图8进行说明。图8是显示在使用者更新基因组合关联信息数据库121时使用的GUI的例的图。
存储在基因组合关联信息数据库121的信息的更新可由从解析系统管理机关130提供于检查机关120的更新补丁进行。例如,变更成为基因组合的解析对象的基因,或进行新的基因组合的追加等时,存储在基因组合关联信息数据库121的信息更新为最新的。
再者,自解析系统管理机关130的更新补丁的提供也可为以缴纳了系统利用费的检查机关120作为对象而进行的构成。例如,解析系统管理机关130也可向检查机关120通知存在能提供的更新补丁,及支付系统利用费是更新补丁的提供的条件的意思。通过这样通知,可对于检查机关120适合地促进系统利用费的支付。
一并更新多个基因时,也可如图8的(a)所示,显示输入“注册文件名”的栏,向该栏输入记载了“基因组合对象基因.csv”等基因名的文件名。在图8的(a)中所示的例中,在此“基因组合对象基因.csv”中,含RET、CHEK2、PTEN、MEK1这样的多个基因名。
在输入文件名之后,当按下“注册”按钮时,关于对应于该文件中所含的基因名的基因的信息的更新要求与检查机关ID对应,经通信部14而发送到管理服务器3。此更新要求的生成及与检查机关ID的对应也可为例如,图4的控制部11进行的构成。
解析系统管理机关130许可基因解析装置1下载含对于管理服务器3接收的更新要求中所含的基因名而赋予的基因ID、及对于以该基因作为解析对象的基因组合赋予的基因组合ID的信息。
或者,在使用者个别地输入基因名而更新时,也可如图8的(b)所示,显示输入“基因名”的栏,向该栏输入“FBXW7”等,基因名。
在输入基因名之后,当按下“注册”按钮时,关于对应于该基因名的基因的信息的更新要求与检查机关ID对应,经通信部14而发送到管理服务器3。解析系统管理机关130许可基因解析装置1下载含对于管理服务器3接收的更新要求中所含的基因名而赋予的基因ID、及对于以该基因作为解析对象的基因组合而赋予的基因组合ID的信息。
再者也可具备在图8的(a)的输入“注册文件名”的栏、及图8的(b)的输入“基因名”的栏中,将输入候选显示为建议的构成。
例如,显示的输入候选的信息预先从管理服务器3提供于基因解析装置1,存储在第1存储部12。进而,在检测对于输入的栏的GUI的点击操作时,以能更新的基因名作为输入候选全部提示,从其中使使用者选择,或以与使用者输入的字符串一致的能更新的基因名作为输入候选提示即可。或者,例如也可在使用者在图8的(b)的输入“基因名”的栏显示“E”和在输入的时间点,“EGFR”及“ESR”等的能更新的基因名的列表,使从该列表之中使使用者选择。这样,通过提示输入候选,可防止由使用者的输入错误。
也可各基因名,该基因的基因ID和该基因编码的蛋白质名被相关联存储在基因组合关联信息数据库121。
此时,在输入的字符串不是基因名,而是该基因所编码的蛋白质等时,信息选择部112也可参照基因组合关联信息数据库121而取得与输入的蛋白质名相关联的基因名及基因ID。
再者,也可在向输入“基因名”的栏输入蛋白质名,在按下注册按钮时,表示与该蛋白质名相关联的基因名而表示使使用者确认此基因名无错的GUI。
(管理部116)
管理部116将含解析执行部110运行的动作次数、解析的基因数、及鉴定的权威的总数等的解析成效与基因组合ID、基因ID相关联而随时存储在解析成效日志151。管理部116以任意的频度(例如,每日、每周、每月)从解析成效日志151读取含解析成效等的数据,将该数据与检查机关ID对应,经通信部14而发送到管理服务器。
(通信部14)
通信部14用于基因解析装置1经网络4而与管理服务器3通信。在从通信部14向管理服务器3发送的数据中,可含检查机关ID、基因组合ID、基因ID、解析成效、更新要求等。另外,在从管理服务器3接收的数据中,可含关于基因组合的信息、能更新的基因名等。
(利用测序仪2的读长序列的读取)
其中,一边适宜参照图10~图15,一边对于图2的S108中所示的测序的顺序,沿图9中所示的流程进行说明。图9是对用于将试样DNA的碱基序列由测序仪2解析的预处理至测序的顺序的一例进行说明的流程图。
在本实施方式中可使用的测序仪2的种类不特别限定,可适宜地使用可将多个解析对象用一次运行解析的测序仪。以下,作为一例,对于使用Illumina公司(San Diego、CA)的测序仪(例如,MySeq、HiSeq、NextSeq等)、或者,采用与Illumina公司的测序仪同样的方式的装置时进行说明。
Illumina公司的测序仪可由桥式PCR法和被称为边合成边测序(Sequencing-by-synthesis)的方法的组合,在流动池上使庞大的数的目的DNA扩增,进行一边合成,一边测序。
(a.预处理)
首先,如图10的(a)所示,将试样(DNA)片段化为用于在测序仪2中读取序列的长度(图9的步骤S301)。试样DNA的片段化可例如,由超声波处理或利用使核酸片段化的试剂的处理等的公知的方法进行。得到的DNA片段(核酸片段)可为例如,数十至数百bp的长度。再者,以下,举例说明成为解析对象的基因是DNA的情况,但成为解析对象的基因也可为RNA。
接下来,如图10的(b)所示,向步骤S301中得到的DNA片段的两端(3′末端及5′末端)赋予对应于使用的测序仪2的种类或测序流程的适配体序列(图9的步骤S302)。但是,本工序在测序仪2是Illumina公司的测序仪、或者,采用与Illumina公司的测序仪同样的方式的装置时是必须的工序,但在使用其他种类的测序仪2时,也有可省略的情况。
适配体序列是为了在后述工序中执行测序而使用的序列,在一实施方式中,可为在桥式PCR法中,用于与固定化在流动池的寡DNA杂交的序列。
在一实施方式中,也可如图10的(b)的上段所示,向DNA片段的两端附加直接适配体序列(例如,图10中的适配体1序列及适配体2序列)。向DNA片段附加适配体序列可使用在本领域中公知的方法。例如,也可使DNA序列平末端化,连接适配体序列。
另外,在其他一实施方式中,也可如图10的(b)的下段所示,向DNA片段的两端和适配体序列之间插入索引序列。
索引序列是用于区别各试样的数据的,每个试样、每个基因组合、及每个提供基因组合的公司固有的序列。作为索引序列使用的碱基序列不限于此,例如,有10~14个腺嘌呤连续的序列、在5~7个腺嘌呤连续之后5~7个鸟嘌呤连续等的序列模式、及给定的长度。
索引序列可用于基于其序列模式及长度,对于附加所述索引序列的DNA片段的序列,识别关于是何试样的读长序列信息,使用的基因组合是什么,提供使用的基因组合的公司是何公司等的信息。利用索引序列,对于识别关于基因组合的信息的构成,在后详述(参照实施方式4)。
例如,也可以使用基因组合A的解析中的索引序列作为14个腺嘌呤连续的序列模式,以使用基因组合B的解析中的索引序列作为7个腺嘌呤连续之后7个鸟嘌呤连续的序列模式。或者,也可以使用基因组合A的解析中的索引序列作为14个腺嘌呤连续的序列(即,索引序列的长度是14),以使用基因组合C的解析中的索引序列作为10个腺嘌呤连续的序列(即,索引序列的长度是10)。
向DNA片段附加索引序列及适配体序列可使用在本领域中公知的方法。例如,也可使DNA片段平末端化,连接索引序列之后,进一步连接适配体序列。
接下来,如图11所示,对于赋予适配体序列的DNA片段,使生物素化RNA诱饵库杂交(图9的步骤S303)。生物素化RNA诱饵库由与成为解析对象的基因杂交的生物素化RNA(以下,称为RNA诱饵)构成。RNA诱饵的长度是任意的,例如,也可为了提高特异性而使用120bp左右的长寡RNA诱饵。
再者,在本实施方式中的使用测序仪2的组合检查中,多数的基因(例如,100以上)成为解析对象的基因。在组合检查中使用的试剂中,含对应于各所述多数的基因的RNA诱饵的组。当基因组合不同时,由于检查对象的基因的数及种类不同,在组合检查中使用的试剂中所含的RNA诱饵的组也不同。
进而,如图12所示,回收成为解析对象的DNA片段(图9的步骤S304)。具体而言,如图12的上段所示,对于使生物素化RNA诱饵库杂交的DNA片段,将链霉亲和素和磁性珠相结合的链霉亲和素磁性珠混合。由此,如图12的中段所示,链霉亲和素磁性珠的链霉亲和素部分和RNA诱饵的生物素部分相结合。
进而,如图12的下段所示,与将链霉亲和素磁性珠用磁铁集磁一同,将不与RNA诱饵杂交的片段(即,不成为解析对象的DNA片段)由清洗除去。由此,可将与RNA诱饵杂交的DNA片段、即,成为解析对象的DNA片段选择-浓缩。测序仪2通过读取使用这样多个RNA诱饵而选择的DNA片段的核酸序列而取得多个读长序列。
再者,如图13的左栏至中央栏所示,通过从浓缩的DNA片段解下链霉亲和素磁性珠及RNA诱饵,由PCR法扩增,使预处理结束。
(b.测序)
首先,如图13的右栏所示,将扩增的DNA片段的序列应用于流动池(图9的步骤S305)。接下来,如图14所示,在流动池上,由桥式PCR法扩增成为解析对象的DNA片段(图9的步骤S306)。
即,成为解析对象的DNA片段(例如,图14中的模板DNA)是由上述的预处理在两末端附加2种不同的适配体序列(例如,图14中的适配体1序列及适配体2序列)的状态(图14的“1”)、使此DNA片段成为单链,将5’末端侧的适配体1序列固定于流动池上(图14的“2”)。通过向流动池上预先固定5’末端侧的适配体2序列,DNA片段的3’末端侧的适配体2序列与流动池上的5’末端侧的适配体2序列结合,成为进行桥渡的状态,形成了桥(图14的“3”)。在此状态下由DNA聚合酶进行DNA延伸反应(图14的“4”)、使变性,则得到了2条单链DNA片段(图14的“5”)。通过以此顺序重复这样的桥的形成、DNA延伸反应及变性,可使多数的单链DNA片段局部扩增固定而形成群集(图14的“6”~“10”)。
进而,如图15所示,以形成群集的单链DNA作为模板,由边合成边测序(Sequencing-by-synthesis)读取序列(图9的步骤S307)。
首先,对于固定于流动池上的单链DNA(图15的上段左栏),添加DNA聚合酶、及,被荧光标记,3’末端侧被阻断的dNTP(图15的上段中央栏)、再者,添加序列引物(图15的上段右栏)。序列引物以与例如,适配体序列的一部分杂交的方式设计即可。换言之,序列引物以对试样DNA来源的DNA片段进行扩增的方式设计即可,在附加索引序列时,再者以对索引序列进行扩增的方式设计即可。
添加序列引物后,由DNA聚合酶进行3’末端封闭荧光dNTP的1碱基延伸反应。由于使用3’末端侧被阻断的dNTP,在1碱基1碱基延伸时,聚合酶反应停止。进而,除去DNA聚合酶(图15的中段右栏)、对于1碱基延伸的单链DNA(图15的下段右栏),由激光激发与碱基结合的荧光物质而以该时发生的发光作为照片记录(图15的下段左栏)。照片使用荧光显微镜,为了确定4种碱基,一边改变波长滤器,一边各自对应于每个A、C、G、T的荧光色而进行摄影。拍摄全部的照片之后,从照片数据确定碱基。进而,除去阻断荧光物质及3’末端侧的保护基而进到以下的聚合酶反应。以此流程作为1个循环,通过重复第2个循环、第3个循环,可对全长进行测序。
根据以上的方法,可解析的链长达至150个碱基×2,由于能用比皮量滴定板都远小的单位的解析,通过高密度化,可在1次的解析中得到40~200Gb这样的庞大的序列信息。
(c.基因组合)
在利用测序仪2的读长序列的读取中使用的基因组合是指如上所述,用于将多个解析对象用一次运行解析的解析试剂盒,在一实施方式中,可为用于对关于特定的疾病的多个基因序列进行解析的解析试剂盒。
在本说明书中使用时,用语“试剂盒”是指具备内包特定的材料的容器(例如,瓶、板、管、皿等)的包装。优选具备用于使用各材料的指示书。在本说明书中在试剂盒的方面使用时,“具备(具备)”是指内包在构成试剂盒的各容器之任一者之中的状态。另外,试剂盒可为将多个别的组合物捆包为1个包装、其中,组合物的形态可为如上述的形态、也可在容器中内包溶液形态的情况。试剂盒可在相同的容器中混合物质A及物质B而准备,也可在分别的容器中准备。在“指示书”中,显示将试剂盒中的各构成适用于治疗及/或诊断的顺序。再者,“指示书”可书面打印到纸或其他介质,也可附在磁带、计算机能读取盘或带、CD-ROM的任何电子介质。试剂盒还可具备内包稀释剂、溶剂、清洗液或其他试剂的容器。再者,试剂盒也可还具备对于适用于治疗及/或诊断必要的器具。
在一实施方式中,基因组合也可具备上述的使核酸片段化的试剂、连接用试剂、清洗液、PCR试剂(dNTP、DNA聚合酶等)等的试剂、及磁性珠之中一个以上。另外,基因组合也可具备用于向片段化的DNA附加适配体序列的寡核苷酸、用于向片段化的DNA附加索引序列的寡核苷酸、RNA诱饵库等之中一个以上。
特别是,各基因组合具备的索引序列可为所述基因组合固有的用于识别所述基因组合的序列。另外,各基因组合具备的RNA诱饵库可为含对应于所述基因组合的各检查基因的RNA诱饵的所述基因组合固有的库。
(序列数据读取部111、数据调整部113、变异鉴定部114)
接下来,对于解析执行部110的序列数据读取部111、数据调整部113、及变异鉴定部114的处理而一边适宜参照图17~图26,一边沿图16中所示的处理的流程说明。
图16是对利用基因解析装置1的解析的流程的一例进行说明的流程图。再者,图16中所示的处理对应于图2中所示的步骤S109。
<序列数据读取部111>
首先,在图16的步骤S11中,序列数据读取部111读入从测序仪2提供的读长序列信息。
读长序列信息是表示由测序仪2读取的碱基序列的数据。测序仪2对使用特定的基因组合而得到的多数的核酸片段进行测序而读取它们的序列信息,作为读长序列信息提供于基因解析装置1。
在一实施方式中,在读长序列信息中,也可与读取的序列一同,含序列中的各碱基的质量评分。另外,向基因解析装置1输入将从受试体的病变部位采集的FFPE试样供于测序仪2而得到的读长序列信息和将同受试体的血液试样供于测序仪2而得到的读长序列信息的两方。
图17是显示读长序列信息的文件格式的一例的图。在图17中所示的例中,在读长序列信息中,含序列名、序列、及,质量评分。序列名也可为赋予测序仪2输出的读长序列信息的序列ID等。序列表示用测序仪2读取的碱基序列。质量评分表示未正确地进行利用测序仪2的碱基配比的概率。任意的碱基的序列质量评分(Q)由以下的式表示。
Q=-10log10E
在此式中,E表示未正确地进行碱基配比的概率的推定值。Q值越高,越表示错误的概率低。Q值越低,其读长无法使用的部分越变大。另外,假阳性的变异配比也增加,有作为结果的精度降低的担忧。再者,“假阳性”是指读长序列尽管无成为判断对象的实际变异,但判断为有变异。再者,“阳性”是指读长序列有成为判断对象的实际变异,“阴性”是指读长序列无成为对象的变异。
<数据调整部113>
接下来,在图16的步骤S12中,数据调整部113基于序列数据读取部111读入的读长序列信息而执行读长序列信息中所含的各核酸片段的读长序列的比对。
图18的(a)是对由数据调整部113的比对进行说明的图。数据调整部113通过参照收纳在参照序列数据库122的参照序列,将各核酸片段的读长序列对于要作为读长序列信息的比较对象的参照序列定位来执行比对。在一实施方式中,在参照序列数据库122中,收纳多种对应于各解析对象的基因的参照序列。
另外,数据调整部113对于将从受试体的病变部位采集的FFPE试样供于测序仪2而得到的读长序列信息和将同受试体的血液试样供于测序仪2而得到的读长序列信息的两方而执行比对。
图18的(b)是显示数据调整部113的比对结果的格式的一例的图。比对结果的格式只要是可各自确定读长序列、参照序列及定位位置,就不特别限定,也可为如图18的(b)一样,含参照序列信息、读长序列名、位置信息、定位品质及序列。
参照序列信息是表示在参照序列数据库122中的参照序列名(参照序列ID)、参照序列的序列长等的信息。参照序列信息优选可识别参照序列,例如,含参照序列名、参照序列ID。读长序列名是表示成为比对对象的各读长序列的名称(读长序列ID)的信息。
位置信息是表示定位读长序列的最左碱基的参照序列上的位置(Leftmostmapping position)的信息。定位品质是表示对应于所述读长序列的定位品质的信息。序列是表示对应于各读长序列的碱基序列(例:…GTAAGGCACGTCATA…)的信息。
图19是显示参照序列数据库122的结构例的图。如图19所示,在参照序列数据库122中,存储显示野生型的序列的参照序列(例如,染色体#1~23的基因组序列)和对于野生型的序列整合已知的变位的参照序列。
再者,向参照序列数据库122中的各参照序列赋予表示关于基因组合的信息的元数据。赋予各参照序列的关于基因组合的信息是可直接或间接显示例如,各参照序列所对应的解析对象的基因的。
在一实施方式中,信息选择部112也可以在数据调整部113从参照序列数据库122取得参照序列时,参照输入的关于基因组合的信息和各参照序列的元数据而选择对应于所述关于基因组合的信息的参照序列的方式控制。例如,在一实施方式中,信息选择部112也可以选择对应于由输入的关于基因组合的信息确定的解析对象的基因的参照序列的方式控制数据调整部113。由此,数据调整部113由于只要可进行仅对于与使用的基因组合关联的参照序列的定位即可,从而可提升解析的效率。
另外,在其他实施方式中,信息选择部112也可不进行上述控制。此时,信息选择部112如后所述,只要控制变异鉴定部114或报告制成部115即可。
图20是显示整合到参照序列数据库122中所含的参照序列(不是显示野生型的序列的)的已知的变异的例的图。
已知的变异是注册到外部的数据库(例如,COSMIC、ClinVar等)的变异,如图20所示,确定染色体位置、基因名及变异。
在图20的例中,确定氨基酸的变异,但也可确定核酸的变异。变异的种类不特别限定,可为取代、插入、缺失等各种各样的变异,也可为其他染色体的一部分的序列或反向互补序列相结合的变异。
图21是对在图16的步骤S12中的比对的详细的工序的一例进行说明的流程图。在一实施方式中,在图16的步骤S12中的比对由图21中所示的步骤S401~S405执行。
在图21的步骤S401中,数据调整部113在序列数据读取部111取得的读长序列信息中所含的各核酸片段的读长序列之中,选择未进行比对的而与从参照序列数据库122取得的参照序列比较。进而,在步骤S402中,数据调整部113确定与读长序列的一致度满足指定的基准的参照序列上的位置。其中,一致度是指表示取得的读长序列信息和参照序列以何程度一致的值,例如,作为一例可举一致的碱基的数或比例等。
在一实施方式中,数据调整部113算出表示读长序列和参照序列的一致度的评分。表示一致度的评分可作为例如2个序列间的相同性的百分率(percentage identity)。
数据调整部113通过确定例如,读长序列的碱基和参照序列的碱基变得相同的位置的数,求出一致的位置的数,一致的位置的数除以与参照序列比较的读长序列的碱基数(比较窗的碱基数)而算出百分率。
图22的(a)是显示评分算出的一例的图。在一实施方式中,在图22的(a)中所示的位置中,读长序列R1和参照序列的一致度的评分由于读长序列13碱基中13碱基一致而成为100%,读长序列R2和参照序列的一致度的评分由于读长序列13个碱基中12个碱基一致而成为92.3%。
另外,数据调整部113也可在表示读长序列和参照序列的一致度的评分的计算中,在读长序列相对于参照序列而含指定的变异(例如,插入-缺失(InDel:Insertion/Deletion))时,以附比通常的计算低的评分的方式计算。
在一实施方式中,数据调整部113也可对于读长序列相对于参照序列而含插入及缺失的至少一方的序列,例如,通过向用如上所述的通常计算算出的评分乘以根据对应于插入-缺失的碱基数的加权系数,修正评分。加权系数W也可由例如,W={1-(1/100)×(对应于插入-缺失的碱基数)}计算。
图22的(b)是显示评分算出的其他例的图。在一实施方式中,在图22的(b)中所示的位置中,读长序列R3和参照序列的一致度的评分由于在通常计算中,在读长序列17个碱基(显示缺失的*也作为一碱基计算)中15个碱基一致而成为88%,修正后的评分成为88%×0.98=86%。
另外,读长序列R4和参照序列的一致度的评分由于在通常计算中,读长序列21个碱基中17个碱基一致而成为81%,修正后的评分成为81%×0.96=77.8%。
数据调整部113一边通过改变相对于各参照序列的读长序列的定位位置,一边算出一致度的评分,确定与读长序列的一致度满足指定的基准的参照序列上的位置。此时,也可使用动态规划法、FASTA法、BLAST法等的在本领域中公知的算法。
回到图21,接下来,数据调整部113在与读长序列的一致度满足指定的基准的参照序列上的位置是单一的位置时(步骤S403中NO),在所述位置比对读长序列,在与读长序列的一致度满足指定的基准的参照序列上的位置是多个位置时(步骤S403中YES)、数据调整部113在一致度最高的位置比对读长序列(步骤S404)。
进而,数据调整部113在不比对序列数据读取部111取得的读长序列信息中所含的全读长序列时(步骤S405中NO)、回到步骤S401,在比对读长序列信息中所含的全读长序列时(步骤S405中YES),结束步骤S12的处理。
<数据调整部113的其他功能>
再者,数据调整部113也可以对读长序列信息和与取得的关于基因组合的信息相关联的基因组合作为解析对象的基因的序列信息进行比较的比较结果作为读长序列信息的解析结果输出。
在基因组合作为解析对象的基因的序列信息中,可含附加在成为解析对象的基因(例如,外显子)的序列、及,成为解析对象的基因的序列的索引序列。
例如,在以下的(1)、及(2)中所示的情况中,数据调整部113也可作为读长序列信息的解析结果,在显示部16显示错误。
(1)在进行读长序列的定位时,序列数据读取部111读取的读长序列信息中所含的索引序列与对应于信息选择部112取得的关于基因组合的信息的索引序列(参照例如,图39)不同。
(2)读长序列信息含指定数以上对应于信息选择部112取得的关于基因组合的信息的基因组合不作为解析对象的基因的序列。或者,读长序列信息仅含不足指定数的信息选择部取得的基因组合表示的基因组合作为解析对象的基因的序列。
这些由使用者的关于基因组合的信息的输入错误发生的可能性高。从而,数据调整部113也可将“无法解析”、及“在关于基因组合的信息中有错误”等的错误显示于显示部16。
或者,数据调整部113也可将“请再次输入关于基因组合的信息”等的消息还显示于显示部16,催促使用者重新开始基因组合名及解析对象的基因名等的输入。
再者,仅在含对应于关于基因组合的信息的基因组合不作为解析对象的基因的序列的读长序列信息的数是指定数以上时,也可为向显示部16显示错误的构成。或者,读长序列信息之中,仅在对于对应于关于基因组合的信息的基因组合不作为解析对象的基因定位的读长序列信息的数是指定数以上时,也可为表示错误的构成。
再者,对于作为输出错误的输出端而使用显示部16的例进行说明,但输出错误的实施方式不限于此。例如,也可从扬声器将错误内容由声音输出。或者,也可为通过使灯等点灯或灭灯,向使用者通知错误的构成。
<变异鉴定部114>
接下来,回到图16,在步骤S13中,变异鉴定部114对于比对了供从受试体的病变部位采集的试样而得到的读长序列的参照序列的序列(比对序列)和比对了供于同受试体的血液试样而得到的读长序列的参照序列的序列进行比较。
进而,在图16的步骤S14中,以两比对序列间的相异作为变异提取。例如,当对于相同的解析对象的基因的相同的位置的血液受试体来源的比对序列是ATCGA,肿瘤组织来源的比对序列是ATCCA时,变异鉴定部114以G和C的相异作为变异提取。
在一实施方式中,变异鉴定部114基于提取的变异而生成结果文件。图23是显示变异鉴定部114生成的结果文件的格式的一例的图。所述格式可为例如,基于Variant CallFormat(VCF)的。
如图23所示,在结果文件中,针对每个被提取的变异,记述位置信息、参照碱基及变异碱基。位置信息含表示参照基因组上的位置的,例如,染色体编号和该染色体上的位置。参照碱基表示在上述位置信息所示的位置的参照碱基(A、T、C、G等)。变异碱基表示参照碱基的变异后的碱基。参照碱基是血液受试体来源的比对序列上的碱基,变异碱基是肿瘤组织来源的比对序列上的碱基。
再者,在图23中,参照碱基是C、变异碱基是G的变异是取代变异的例,参照碱基是C、变异碱基是CTAG的变异是插入(Insertion)变异的例,参照碱基是TCG、变异碱基是T的变异是缺失(Deletion)变异的例。另外,变异碱基是G]17:198982]、]13:123456]T、C[2:321682[、或是[17:198983[A的变异是结合了其他染色体的一部分的序列或反向互补序列的变异的例。
回到图16,接下来,在步骤S15中,变异鉴定部114检索变异数据库123。进而,在步骤S16中,变异鉴定部114通过参照变异数据库123的变异信息而向结果文件中所含的变异赋予注释,鉴定变异。
图24是显示变异数据库123的结构的一例的图。变异数据库123,例如,基于COSMIC或ClinVar等的外部数据库构建。另外,在一实施方式中,向数据库中的各变异信息赋予与关于基因组合的信息相关的元数据。在图24中所示的例中,在数据库中的各变异信息中,作为元数据赋予解析对象的基因的基因ID。
图25是显示变异数据库123中的变异信息的结构的详细例的图。如图25所示,在一实施方式中,在变异数据库123中所含的变异信息中,也可含变异ID、变异的位置信息(例如,“CHROM”、及“POS”)、“REF”、“ALT”、“Annotation”。变异ID是用于识别变异的识别码。变异的位置信息之中,表示“CHROM”表示染色体编号,“POS”表示染色体编号上的位置。“REF”表示在野生型(Wild type)中的碱基,“ALT”表示变异后的碱基。
“Annotation”表示关于变异的信息。“Annotation”也可为表示例如,“EGFRC2573G”、“EGFR L858R”这样的氨基酸的变异的信息。例如,“EGFR C2573G”是表示蛋白质“EGFR”的第2573个残基的半胱氨酸取代为甘氨酸的变异。
上述的如例一样,变异信息的“Annotation”也可为用于将基于碱基信息的变异变换为基于氨基酸信息的变异的信息。此时,变异鉴定部114基于参照的“Annotation”的信息而能将基于碱基信息的变异变换为基于氨基酸信息的变异。
变异鉴定部114以确定结果文件中所含的变异的信息(例如,变异的位置信息和对应于变异的碱基信息)作为关键字,检索变异数据库123。例如,变异鉴定部114也可以“CHROM”、“POS”、“REF”及“ALT”的信息之任一者作为关键字检索变异数据库123。变异鉴定部114通过对血液受试体来源的比对序列和病变部位来源的比对序列进行比较而在提取的变异注册到变异数据库123时,以所述变异作为存在于试样中的变异鉴定,向结果文件中所含的所述变异赋予注释(例如,“EGFR L858R”、“BRAF V600E”等)。
再者,在一实施方式中,信息选择部112也可在变异鉴定部114基于结果文件而检索变异数据库123之前,将未对应于向变异鉴定部114输入的关于基因组合的信息的变异从结果文件罩住(除外)。
例如,在一实施方式中,从信息选择部112通知关于基因组合的信息的变异鉴定部114也可参照如图26的(a)一样的显示解析对象的基因和位置信息(例如,“CHROM”和“POS”)的对应关系的表,确定对应于通知的关于基因组合的信息确定的解析对象的基因的变异的位置,如图26的(b)一样,将此外的位置的变异从结果文件罩住(除外)。由此,由于只要变异鉴定部114可向结果文件中的仅与使用的基因组合关联的变异赋予注释即可,从而可提升变异的鉴定的效率。
另外,在一实施方式中,信息选择部112也可以变异鉴定部114,为了赋予注释,在参照变异数据库123中的变异信息时,变异鉴定部114参照输入的关于基因组合的信息和各变异信息的元数据而选择对应于所述关于基因组合的信息的变异信息而参照的方式控制。
例如,在一实施方式中,信息选择部112也可以参照对应于由输入的关于基因组合的信息确定的解析对象的基因的变异信息的方式控制变异鉴定部114。由此,由于只要变异鉴定部114参照变异数据库123中的仅与使用的基因组合关联的变异信息即可,从而可提升注释的效率。
再者,也可从鉴定的全部的变异之中,将对应于输入的关于基因组合的信息的变异基于关于该基因组合的信息而选择,作为读长序列信息的解析结果,输出与选择的变异关联的信息。
此时,例如,在存储在变异数据库的各变异信息的元数据中,除了解析对象的基因的基因ID之外,每个该基因的变异含关于是基因组合作为解析对象的变异与否的信息即可。
根据此构成,变异鉴定部114也可以参照自信息选择部112的关于基因组合的信息和各变异信息的元数据,从鉴定的全部的变异之中仅选择对应于所述关于基因组合的信息的变异信息的方式控制。例如,尽管不同的基因组合以相同的基因ID的基因作为解析对象,可有成为解析对象的变异互相不同的情况。
即使是这样的情况,通过作为上述的构成,变异鉴定部114可向报告制成部115输出仅对应于由使用者输入的关于基因组合的信息的变异信息。再者,作为读长序列信息的解析结果,也可为将变异信息从输出部13输出,或显示于显示部16的构成。
(报告制成部115)
由组合检查解析外显子区域整体时,在受试体的基因中检测到多个变异。其中,也可含在变异之中未确立该变异的临床上意义或对治疗有效的药剂,医师活用于实际的治疗的信息以外的。在医师要将基因检查的结果适用于受试体的实际的治疗时,有从检测的多数变异之中想要选择性地知变得能活用于实际的治疗的变异这样的期盼。
报告制成部115基于变异鉴定部114输出的信息、及从信息选择部112提供的关于基因组合的信息而制成报告(对应于图2的步骤S110)。在制成的报告中披露的信息含关于基因组合的信息、及关于鉴定的变异的信息。
报告制成部115信息选择部112基于自信息选择部112的关于基因组合的信息而对报告中披露的对象进行取舍选择,未选择的信息从报告删除。或者,信息选择部112也可为以与对应于经输入部17输入的关于基因组合的信息的基因关联的信息作为报告中披露的对象选择,未选择的信息从报告删除的方式控制报告制成部115的构成。
(输出部13)
由报告制成部115制成的报告也可作为读长序列信息的解析结果,从输出部13,数据发送到设置于医疗机关210的终端装置5(对应于图2的步骤S111)。或者,也可发送到与基因解析装置1连接的打印机(未图示),由该打印机打印之后,作为纸介质,从检查机关120向医疗机关210送附。
〔实施方式2〕
接下来对本发明的其他实施方式进行说明。再者,在说明的便利上、对于与由上述实施方式说明的部件有相同的功能的部件而付记相同的符号,不重复其说明。
(基因解析装置1a的构成)
其中,对于能制成含关于与由变异鉴定部114鉴定的变异关联的药剂的信息(药剂信息)的报告的基因解析装置1a而使用图27进行说明。
图27是显示基因解析装置1a的构成的别的一例的图。在基因解析装置1a的解析执行部110a还具备药剂检索部117,第1存储部12a还具备药剂数据库124的点,与图4中所示的基因解析装置1不同。
(药剂检索部117)
对于药剂检索部117生成含关于药剂的信息的列表的处理的流程而使用图28进行说明。图28是显示药剂检索部117生成关于变异的药剂的列表的处理的一例的流程图。
药剂检索部117以赋予由变异鉴定部114鉴定的变异的变异ID作为关键字,检索药剂数据库124(步骤S15a)。药剂检索部117基于检索结果而生成含与关于变异的药剂相关的信息的列表(步骤S16a)。生成的列表整合到报告制成部115制成的报告中。
(药剂数据库124)
对于药剂检索部117检索药剂数据库124而生成药剂列表时,存储在药剂数据库124的数据124A而使用图29进行说明。图29是显示药剂数据库124的数据结构的例的图。
在药剂数据库124中,如图29所示,赋予每个变异的变异ID、关联药剂名、及赋予每个药剂的药剂ID被互相相关联存储。再者,也可对于图29的变异ID“#3”,以“药剂A”及“药剂B”相关联的方式对各变异ID关联多个关联药剂。
另外,也可向药剂数据库124的各变异ID赋予作为与关于基因组合的信息相关的元数据的“关于基因组合关联信息的元数据”。药剂检索部117对应于自信息选择部112的指示,参照此“关于基因组合关联信息的元数据”。
进而,药剂检索部117将检索药剂数据库124的范围变更为该元数据中所示的范围。由此,药剂检索部117可对应于赋予各药剂的“关于基因组合关联信息的元数据”和输入的关于基因组合的信息,在药剂数据库中锁定要参照的药剂,可生成含关于对应于关于基因组合的信息的药剂的信息的列表。
<变形例1>
药剂检索部117也可检索有图30中所示的数据结构的药剂数据库124而生成含关于与变异关联的药剂的其他信息的列表。具体而言,除了实施方式2中生成的与变异关联的药剂的列表之外,附加药剂的承认信息。关于此,使用图31而进行说明。图31是显示药剂检索部117生成含与关于变异的药剂相关的信息的列表的处理的一例的流程图。
药剂检索部117从图30中所示的存储数据的药剂数据库124检索关联药剂被机构(FDA、PMDA等)承认与否。具体而言,药剂检索部117,例如,以“变异ID”等的关于变异的信息作为关键字,检索表示对应于变异的关联药剂是否被机构承认的“承认状况”、表示被哪国的机构承认的“承认国”(步骤S15b)。
药剂检索部117基于检索结果,生成含变异、对应于该变异的关联药剂、及关于该关联药剂的承认的信息等的列表(步骤S16b)。
<变形例2>
药剂检索部117也可检索有图30中所示的数据结构的药剂数据库124而生成含关于与变异关联的药剂的还其他信息的列表。具体而言,除了在实施方式2中生成的与变异关联的药剂的列表之外,附加对应于受试体的疾病的药剂的信息。关于此,使用图32而进行说明。图32是显示基于药剂检索部117检索药剂数据库124而得到的信息而判断有Off-labeluse(适用外使用)的可能性的药剂的有无,生成含判断结果的列表的处理的一例的流程图。
药剂检索部117从图30中所示的存储数据124B的药剂数据库124检索关联药剂被机构(FDA、PMDA等)承认与否(步骤S15b)。检索的药剂是未被承认的时(步骤S21中NO)、药剂检索部117以该药剂作为未承认药与变异相关联(步骤S23)、生成与变异关联的药剂的报告(步骤S16a)。
在检索的药剂是被承认的时(步骤S21中YES)、药剂检索部117判断采集试样的受试体的疾病和对应于从药剂数据库124检索的关联药剂的疾病(例如,图30中所示的“对象疾病”)一致与否(步骤S22)。
受试体的疾病和“对象疾病”一致时(步骤S22中YES)、以检索结果的药剂作为承认药进行与变异相关联(步骤S24)、生成含变异、对应于该变异的关联药剂、及关于该关联药剂的承认的信息等的列表(步骤S16a)。
一方面,受试体的疾病和“对象疾病”不同时(步骤S22中NO)、判断为检索的关联药剂是有Off-label use(适用外使用)的可能性的药剂,将其判断结果与变异相关联(步骤S25),生成含变异、对应于该变异的关联药剂、及关于该关联药剂的承认的信息等的列表(步骤S16a)。
再者,关于受试体的疾病的信息可例如,在执行基因解析时,由操作者等从输入部17输入。另外,例如,也可在读长序列信息的头区域含作为对应于受试体的疾病的识别信息的疾病ID。
<变形例3>
药剂检索部117也可检索有图33中所示的数据结构的药剂数据库124而生成含关于与变异关联的药剂的治验的信息的列表。具体而言,除了在实施方式2中生成的与变异关联的药剂的列表之外,附加药剂的治验信息。关于此,使用图34而进行说明。图34是显示药剂检索部117生成含关于药剂的治验的信息的列表的处理的一例的流程图。
药剂检索部117从图33中所示的存储数据124C的药剂数据库124检索关联药剂的治验的进展情况等的信息。具体而言,药剂检索部117以变异ID等作为关键字,关于变异的治验的信息、例如,图33中所示的“治验/临床试验状况”、实施治验的“实施国”、及检索“实施机关”等(图34的步骤S15c)。药剂检索部117基于检索结果,生成含变异、对应于该变异的关联药剂、及关于该关联药剂的治验的信息等的列表(图34的步骤S16c)。
再者,图29中所示的数据124A、图30中所示的数据124B、及图33中所示的数据124C可统合为一个而存储在药剂数据库124,也可分散存储在含药剂数据库124的多个数据库。
〔实施方式3〕
接下来对本发明的其他实施方式进行说明。再者,在说明的便利上,对于与由上述实施方式说明的部件有相同的功能的部件而付记相同的符号,不重复其说明。
(基因解析装置1b的构成)
其中,对于能制成含由变异鉴定部114鉴定的与变异关联的各种各样的参照信息(参照信息)的报告的基因解析装置1b而使用图35进行说明。
图35是显示基因解析装置1b的构成的其他一例的图。在基因解析装置1b的解析执行部110b还具备参照检索部118,第1存储部12b还具备参照数据库125的点,与图4中所示的基因解析装置1不同。
(参照检索部118)
参照检索部118以赋予由变异鉴定部114鉴定的变异的变异ID作为关键字,检索参照数据库125。参照检索部118基于检索结果而提取关于变异的参照信息。被提取的参照信息整合到报告制成部115制成的报告中。
(参照数据库125)
对于存储在参照检索部118检索的参照数据库125的数据而使用图36进行说明。图36是显示参照数据库125的数据结构的例的图。
在参照数据库125中,如图36所示,变异ID、关于该变异的生物学背景的信息、分子功能信息、临床信息、及关于该变异的著书以及科学论文等的文献信息等被互相相关联存储。
另外,也可向参照数据库125的各变异ID赋予作为与关于基因组合的信息相关的元数据的“关于基因组合关联信息的元数据”(未图示)。此时,参照检索部118对应于自信息选择部112的指示,参照此“关于基因组合关联信息的元数据”,将检索参照数据库125的范围变更为该元数据中所示的范围。由此,参照检索部118可对应于与各变异相关联的“关于基因组合关联信息的元数据”和输入的关于基因组合的信息,在药剂数据库中锁定要参照的参照信息,可提取对应于关于基因组合的信息的参照信息。
(基因解析装置1a、1b的报告制成部115)
报告制成部115可基于药剂检索部117输出的信息而制成报告,也可基于参照检索部118输出的信息而制成报告。再者,报告制成部115也可基于药剂检索部117及参照检索部118的双方输出的信息而制成报告。
在由报告制成部115制成的报告中,可披露关于鉴定的变异的信息、与该变异关联的药剂的信息、关于该变异的参照(例如,含关于对于各变异的分子生物学的见解及文献的信息等)、或者,任意组合这些信息的信息。
信息选择部112通过例如,以与对应于输入的关于基因组合的信息的对象基因关联的信息作为报告中披露的对象选择,报告制成部115制成披露选择的信息的报告的方式进行控制。
图37是显示由报告制成部115制成的报告的一例的图。在此例中所示的报告的左上的部分中,记载了显示受试体ID的“患者ID”、“患者的性别”、“患者的病名”、作为医疗机关210中担当该受试体的医师的名字的“担当医师名”、及表示医疗机关名的“机关名”。再者,作为关于基因组合的信息,也含“A基因组合”这样的基因组合名。在此报告中,在称为“检测的基因变异及关联药剂”的栏含关于由变异鉴定部114鉴定的变异的信息,药剂检索部117检索药剂数据库124而基于检索结果而生成的列表。
另外,在“临床试验一览”的栏中,含关于药剂检索部117检索药剂数据库124,基于检索结果而生成的药剂的治验的信息的列表。
〔实施方式4〕
接下来对本发明的其他实施方式进行说明。再者,在说明的便利上,对于与由上述实施方式说明的部件有相同的功能的部件而付记相同的符号,不重复其说明。
(基因解析装置1c的构成)
其中,对于除了使使用者输入关于基因组合的信息的功能之外,还具备基于读长序列信息中所含的索引序列而信息选择部112c取得关于基因组合的信息的功能的基因解析装置1c进行说明。以下,特别是,对于图38中所示的基因组合关联信息数据库121c、数据调整部113c、及信息选择部112c而参照图39进行说明。
图38是显示基因解析装置1c的构成的其他一例的功能块图。再者,也可向序列数据读取部111读取的读长序列信息,每个试样、或者每个基因组合的类别插入例如,用于识别读长序列信息的索引序列。
另外,索引序列也可在基因组合作为解析对象的基因之中,仅插入特定的基因的序列。当未插入有索引序列的读长序列信息时,如图6所示,使使用者输入关于基因组合的信息即可。
<基因组合关联信息数据库121c>
首先,对于存储在信息选择部112c参照的基因组合关联信息数据库121c的数据121D而使用图39进行说明。图39是显示基因组合关联信息数据库121c的数据结构的例的图。在基因组合关联信息数据库121c中,能选择的基因组合的名称、赋予各基因组合的基因组合ID、及针对每个基因组合插入的索引序列信息被相关联存储。
在图39中所示的例中,在使用基因组合ID是“AAA”的基因组合“A基因组合”而解析的读长序列信息中,含索引序列“pppppppppp”,在使用基因组合ID是“BBB”的基因组合“B基因组合”而解析的读长序列信息中,表示显示含索引序列“qqqqqqqqqq”的数据。再者,“p”及“q”表示碱基。
<数据调整部113c>
数据调整部113c对序列数据读取部111读取的读长序列信息进行解析,判断在其序列中含存储在基因组合关联信息数据库121c的索引序列“pppppppppp”、“qqqqqqqqqq”等与否。在不含索引序列的情况中,数据调整部113c向信息选择部112c通知该意思。一方面,在含索引序列时,数据调整部113c向信息选择部112c输出检测的索引序列(例如,“pppppppppp”)。
<信息选择部112c>
信息选择部112c从数据调整部113c通知不含索引序列时,与“请输入关于基因组合的信息”等的消息一同,图6中所示的GUI显示于显示部16。一方面,从数据调整部113c接收索引序列时,以其索引序列作为关键字检索基因组合关联信息数据库121c,确定对应于该索引序列的基因组合名、及基因组合ID等的基因组合关联信息。例如,从数据调整部113c接收的索引序列是“qqqqqqqqqq”时,信息选择部112c检索基因组合关联信息数据库121c,作为基因组合,确定使用“B基因组合”,取得该基因组合的基因组合关联信息。取得的基因组合关联信息如上所述,适用于对数据调整部113c、变异鉴定部114、报告制成部115等的控制。
这样,在向读长序列信息插入索引序列时,能不使使用者进行基因组合关联信息的输入地确定基因组合关联信息。从而,可对于使用者提供进一步的便利性。
本发明不限定于上述的各实施方式,在权利要求中所示的范围内各种变更是可能的,对于适宜组合各自在不同的实施方式中公开的技术性手段而得到的实施方式也包括在本发明的技术性范围内。
例如,在图1中显示1个医疗机关210及1个检查机关120,但不限定于此。即,医疗机关210可对于多个检查机关120委托解析,检查机关120也可接受自多个医疗机关210的解析委托。即,医疗机关210及检查机关120各自也可为多个。
在图1及图2中显示各1个检查机关120的测序仪2及基因解析装置1,但不限于此。即,也可在检查机关120中具备多个测序仪2及多个基因解析装置1。
另外,在有医疗机关210和检查机关120的双方的功能的机关(例如,兼备临床设施和检查设施的研究所、及大学医院等)中,也能适宜地适用基因解析系统100。这不限于基因解析系统100,由基因解析装置1执行的基因解析方法、用于控制用计算机实现基因解析方法的基因解析装置1的程序、及记录其的计算机能读取的记录介质也可适宜地适用在有医疗机关210和检查机关120的双方的功能的机关中。
再者,使用基因组合的解析也可在单核苷酸多态性(SNP、Single NucleotidePolymorphism)、及拷贝数多态性(CNV、Copy Number Polymorphism)等的多态性的解析中使用。另外,基因组合也可在关于解析对象基因整体的变异等的量的信息(也称为TumorMutation Burden等)的输出或甲基化频度的算出中使用。
另外,显示作为用于使使用者输入关于基因组合的信息的手段,表示输入用的GUI的例,但不限于此。例如,输入部17是条码读码器,也可为使使用者读取条码的构成。在各基因组合的各试剂的容器的标签、及收容基因组合的一套的试剂的箱的表面等显示条码时,通过使用条码读码器而读取该条码,输入关于基因组合的信息。
再者,控制部11也可在将用于输入关于基因组合的信息的GUI显示于显示部16时,使使用者选择解析对象的基因。此时,如图40所示,也可在GUI显示成为候选的基因的列表,使使用者选择基因组合作为解析对象的基因。
GUI中所表示的基因名是将注册到基因组合关联信息数据库121的赋予基因ID的基因的基因名表示于基部。再者,作为选择枝表示的列表中的基因名是将注册到基因组合关联信息数据库121的关于基因组合的信息表示于基部。
在图40中,显示含多个成为解析对象的基因名(例如,“AKT1”及“APC”等)的列表,显示在各基因名的左侧设复选框的例。在图40中所示的例中,选择“AKT1”及“APC”等的基因名,不选择“EML4”及“JAK3”等的基因名。信息选择部112从选择的基因名确定与这些基因名相关联的基因组合ID,检索基因组合关联信息数据库121而取得对应于输入的基因组合名的关于基因组合的信息。
或者,如图41所示,也可针对每个“肺癌基因组合”、“大肠癌基因组合”等的疾病,将基因组合名的列表显示于GUI,从列表中所示的基因组合之中使使用者选择关于期望的疾病的基因组合。也可将“肺癌”、“大肠癌”等的疾病名的列表表示于GUI,从列表中所示的疾病名之中使使用者选择期望的疾病。
此时,信息选择部112从选择的疾病名确定与该疾病名相关联的基因组合ID,检索基因组合关联信息数据库121而取得对应于选择的疾病名的关于基因组合的信息即可。
作为选择与选择的疾病关联的基因组合的选择枝表示于GUI的基因名是将注册到基因组合关联信息数据库121的信息表示于基部。
再者,关于疾病的基因组合的基因组合名也可为试剂盒名。在基因组合中,含在为了将解析对象的基因的序列由测序仪2读取而进行的靶向测序中使用的各种缓冲液、酶、及引物等,一套的试剂。对于这一套的试剂赋予试剂盒名或基因组合名。
其中,对于图2的步骤S107中所示的接受关于基因组合的信息的输入的处理的流程的别的例而使用图42进行说明。再者,在说明的便利上,对于与由图5说明的处理相同的处理而付记相同的符号,不重复其说明。
图5中所示的处理的流程推定例如,在受自医疗机关210的解析委托的检查机关120中,进行使用从医疗机关210指定的基因组合的组合检查的情况。但是,不限定于其,也可有使用从试样提供元指定的基因组合以外的基因组合而解析的情况。例如,在探索最适的基因组合或模索更有效的基因组合的利用方法的研究机关中,从医疗机关210取得试样,除了使用指定的基因组合的解析之外,也可进行使用各种各样的基因组合的组合检查。
在对应于选择的信息的基因组合与从医疗机关210接受的解析委托中所含的基因组合不一致的情况(步骤S203中NO)中,信息选择部112在显示部16显示与输入的基因组合与指定的基因组合不同的意思一同,问使用输入的基因组合与否的消息(步骤S206)。在接受请求输入的基因组合的使用的许可的意思的输入的情况(步骤S207中YES)中,信息选择部112接受该输入。进而,信息选择部112显示对于显示部16输入的基因组合是能使用的的意思的消息(步骤S204)。
一方面,在接受请求输入的基因组合的使用的许可的意思的输入的情况(步骤S207中NO)中,信息选择部112在显示部16显示输入的基因组合无法使用的意思的消息(步骤S205)、禁止利用基因解析装置1的解析。
再者,在基因解析装置1接受关于基因组合的信息的输入时,也可为可选择图5中所示的输入模式和图42中所示的输入模式之任一者的构成。例如,当进行使用从医疗机关210指定的基因组合的组合检查时,优选选择图5中所示的输入模式,在使用指定的基因组合以外的基因组合进行解析时,优选选择图42中所示的输入模式。这样,通过具备多个接受关于基因组合的信息的输入的处理的模式,使用基因解析装置1的使用者可选择对应于用途的输入模式。
〔实施方式5〕
接下来对本发明的其他实施方式进行说明。再者,在说明的便利上,对于与由上述实施方式说明的部件有相同的功能的部件而付记相同的符号,不重复其说明。
本实施方式涉及的基因解析方法取得关于基因组合的信息,基于取得的关于基因组合的信息而变更评价组合检查的品质的解析算法。由此,当使用各种各样的基因组合而解析各种组合的解析对象基因时,进行对应于基因组合的适合的品质管理变得可能。
作为对应于基因组合变更的品质评价的处理的一例,可举出例如,(1)变更在组合检查的品质评价中使用的品质评价指标的,(2)变更在使用相同的品质评价指标时是否有充分的可靠性的判断中使用的基准的,(3)变更在组合检查的品质评价中使用的品质评价指标的数的,等。
作为品质评价指标,可举出例如,测序仪2输出的读长序列信息中所含的读取品质、多个成为解析对象的基因中所含的碱基之中用测序仪2读取的碱基的比例、读长序列信息的读取深度(深度)、读长序列信息的读取深度(深度)的偏差,检测到品质管理试样中所含的各标准基因的全部变异与否,等的指标。
(基因解析装置1d的构成)
其中,对于具备基于品质评价指标而评价组合检查的品质的功能的基因解析装置1d而使用图43进行说明。图43是显示基因解析装置1d的构成的别的一例的图。基因解析装置1d能制成含组合检查的品质的评价结果的报告。再者,在图43中,将数据的流程用箭头表示。
在基因解析装置1d的解析执行部110d还具备品质管理部119,存储部12d还具备品质评价基准数据库126的点,与图4中所示的基因解析装置1不同。
在品质评价基准数据库126中,存储规定在组合检查中的解析结果的可靠性达一定的基准与否的基准值。其中,一定的基准,例如,在具备为了将组合检查的解析结果适用于治疗或诊断而要求的可靠性与否的判断中使用。
本实施方式涉及的信息选择部112基于从输入部17输入的关于基因组合的信息而变更品质评价指标的基准值。
(品质评价指标)
作为对于测定而品质管理部119生成的品质评价指标,可举出例如,测序仪2输出的读长序列信息中所含的读取品质、多个成为解析对象的基因中所含的碱基之中用测序仪2读取的碱基的比例、读长序列信息的读取深度(深度)、读长序列信息的读取深度(深度)的偏差,检测到品质管理试样中所含的各标准基因的全部变异与否等的指标。
对于上述的品质评价指标的例而具体进行说明。
品质评价指标(1):质量评分
质量评分是表示由测序仪2读取的基因序列中的各碱基的正确性的指标。
例如,从测序仪2以FASTQ文件输出读长序列信息时,质量评分含在读长序列信息中(参照图17)。再者,对于质量评分的详细内容,由于在实施方式1中说明了,从而这里省略其说明。
品质评价指标(2):群集浓度
群集浓度是表示测序仪2输出的读长序列信息中所含的读取品质的指标。测序仪2在流动池上局部扩增固定多数的单链DNA片段而形成群集(参照图14的9)。进而,通过使用荧光显微镜而拍摄流动池上的群集组,检测各自对应于A、C、G、T的不同的波长的荧光而读取序列。群集密度是表示形成在流动池上的各基因的群集以何程度近似的指标。
例如,当群集的密度过度变高,群集彼此过度接近或重合时,由于拍摄流动池的图像的对比度即S/N比变低,变得难以取得荧光显微镜的焦点。所以,变得无法正确地检测荧光,结果,有序列读取精度降低的担忧。
品质评价指标(3):表示用测序仪2读取的碱基序列之中用测序仪2读取的靶区域的碱基序列的比例的指标
此指标是表示在也含由测序仪2读取的靶区域以外的碱基之中,读取仅哪个靶区域的碱基的指标,作为读取的碱基的总数和靶区域的碱基的总数的比算出。
品质评价指标(4):表示读长序列信息的读取深度(深度)的指标
此指标是基于对于成为解析对象的基因中所含的各碱基读取其碱基的读长序列的总数的指标,作为读取的碱基之中深度是指定的值以上的碱基的总数和读取的碱基的总数的比算出。
再者,读取深度(深度)是指对于相同的碱基读取的读长序列信息的总数,也称为被覆率、覆盖度、覆盖深度。
在图45中,显示表示在解析对象的基因(图中的“目标基因”)的全长是L碱基,读取的区域的碱基是t1碱基时的各碱基的深度的坐标图。图45中的坐标图的横轴是碱基的位置,纵轴是各碱基的深度。在图45中所示的例中,读取的区域的t1碱基之中,深度是指定的值(例如100)以上的区域的总碱基数是(t2+t3)碱基。此时,品质评价指标(4)作为(t2+t3)/t1的值生成。
品质评价指标(5):表示读长序列信息的读取深度(深度)的偏差的指标
此指标是表示深度的一致性的指标。在仅读取读取的区域之中的某部分的读长序列信息极端多的情况中,深度的一致性变低。一方面,经读取的区域的整体而到处存在读长序列信息时,深度的一致性变高。深度的一致性可例如,使用四分位范围(IQR)而数值化。IQR越高,表示一致性越低,IQR越低,表示一致性越高。
品质评价指标(6):表示检测到品质管理试样中所含的各标准基因所具有的全部变异与否的指标
此指标是表示在与从受试体采集的试样合并而对品质管理试样进行测定时,检测到品质管理试样中所含的各标准基因所具有的变异,正确地鉴定与否的指标。例如,以可正确地鉴定品质管理试样中所含的各标准基因所具有的已知的变异的位置、变异类别等与否作为品质评价指标使用。品质管理试样通过将多个标准基因混合来调制。
对于进行组合检查的品质评价的处理的流程而使用图44进行说明。图44是显示用于对基因序列进行解析的处理的流程的一例的流程图。
首先,在图44的步骤S31中,进行用于解析基因序列的预处理。在预处理中,含使试样中所含的DNA等的基因片段化,至回收片段化的基因的处理。其中,在进行品质评价的组合检查中的解析对象可为从受试体采集的试样,也可为通过将多个标准基因混合来调制的品质管理试样。
品质管理试样含SNV的标准基因、含Insertion的标准基因、含Deletion的标准基因、含CNV的标准基因、及含Fusion的标准基因之中,含至少2个。例如,品质管理试样,作为标准基因,含相对于野生型而含“SNV”的基因A的部分序列和相对于野生型而含“Insertion”的基因B的部分序列。
接下来,在步骤S32中,测序仪2读取预处理的试样中所含的DNA的碱基序列。
接下来,在步骤S33中,基因解析装置1d的控制部11d在输入部17表示用于使使用者选择关于基因组合的信息的GUI。基于对于GUI的使用者的输入操作而进行关于基因组合的信息的取得。关于基因组合的信息的取得不限于由GUI的使用者的输入,例如,可由附在基因组合的条码等的识别码的取得,也可通过读取索引序列来识别。
基因解析装置1d的控制部11d基于取得的关于基因组合的信息而判断基因组合的种类。基因解析装置1d以对应于取得的基因组合的种类而执行组合检查的品质管理的方式变更解析算法。
在S34中,基因解析装置1d确定对应于基因组合的种类解析基因序列,碱基序列中的变异的有无、变异的位置、变异的类别等。通过对读取的基因序列进行解析而鉴定检测的变异。
(品质管理部119)
基因解析装置1d基于生成的品质评价指标而评价组合检查的品质。品质管理部119从序列数据读取部111取得质量评分(品质评价指标1)及群集浓度(品质评价指标2)。另外,从数据调整部113取得用测序仪2读取的靶区域的碱基的比例(品质评价指标3)、读长序列信息的读取深度(品质评价指标4)及读长序列信息的读取深度的偏差(品质评价指标5)。再者,从变异鉴定部114取得检测到品质管理试样中所含的各标准基因所具有的全部变异与否(品质评价指标6)。品质管理部119无取得这些品质评价指标的全部的必要,取得1个或多个任意的指标即可。
品质管理部119对取得的品质评价指标和存储在品质评价基准数据库126的品质评价指标的基准值进行比较,判断解析结果是否具备充分的可靠性。其中,品质评价基准数据库126将品质评价指标的基准值与确定基因组合的信息相关联存储。
在S35中基因组合的种类是A基因组合时,例如,对于品质评价指标A而使用基准值a进行判断,对于质评价指标B而使用基准值b进行判断。一方面,在S35中基因组合的种类是B基因组合时,对于品质评价指标A而使用基准值c进行判断,对于质评价指标B而使用基准值b进行判断。这样,在A基因组合的解析及B基因组合的解析中,使用相同的品质管理指标A,另一方面,其评价的基准使用不同的。另外,在A基因组合的解析中使用品质管理指标A及B,另一方面,在B基因组合的解析中使用品质管理指标A及C,使用互相不同的品质管理指标。
另外,在S35中基因组合的种类是C基因组合时,对于品质评价指标D而使用基准值e进行判断。这样,在A基因组合的解析中,基于品质评价指标A及B的2个指标而进行品质评价,在C基因组合的解析中,使用仅品质评价指标D而进行品质评价。这样,也可对应于基因组合,变更使用的品质评价指标的数。
最后,在S36中,基因解析装置1d制成含鉴定的变异、及在步骤S34中判断的组合检查的品质的评价结果的报告。
图46是显示由报告制成部115制成的报告的一例的图。在此例中所示的报告的左上的部分中,记载了显示受试体ID的“患者ID”、“患者的性别”、“患者的病名”、作为在医疗机关210中担当该受试体的医师的名字的“担当医师名”、及表示医疗机关名的“机关名”。
在其下,作为关于基因组合的信息,也含“A基因组合”这样的基因组合名。再者,向报告输出作为关于组合检查的品质的信息的品质评价指标“QC指标”。
再者,品质评价指标低于指定的基准时,可向检测的基因变异附“*”。另外,不限于其,可附表示可靠性低的意思的评论。
本发明不限定于上述的各实施方式,在权利要求中所示的范围内各种变更是可能的,对于适宜组合各自在不同的实施方式中公开的技术性手段而得到的实施方式也包括在本发明的技术性范围内。
【符号的说明】
1、1a、1b、1c、1d:基因解析装置
2:测序仪
3:管理服务器
4:网络
11、11a、11b、11c、11d:控制部
13:输出部
16:显示部
100:基因解析系统
121、121c:基因组合关联信息数据库
122:参照序列数据库
124:药剂数据库
125:参照数据库

Claims (63)

1.对基因的序列信息进行解析的基因解析方法,其特征在于,包括:
取得下列信息:
由测序仪读取的读长序列信息、和
关于含成为解析对象的多个基因的基因组合的信息,
基于取得的关于上述基因组合的信息而输出上述读长序列信息的解析结果。
2.权利要求1所述的基因解析方法,其特征在于,基于取得的关于上述基因组合的信息而变更成为上述解析结果的输出对象的基因。
3.权利要求1或2所述的基因解析方法,其特征在于,基于取得的关于上述基因组合的信息而变更用于对成为上述解析结果的输出对象的基因进行解析的解析算法。
4.权利要求1~3之任一项所述的基因解析方法,其特征在于,将用于输入关于上述基因组合的信息的输入画面显示于显示部。
5.权利要求1~4之任一项所述的基因解析方法,其特征在于,将用于从多个关于上述基因组合的信息选择至少1个信息的输入画面显示于显示部。
6.权利要求1~5之任一项所述的基因解析方法,其特征在于,将用于以试剂盒名作为关于上述基因组合的信息输入的输入画面显示于显示部。
7.权利要求1~6之任一项所述的基因解析方法,其特征在于,将用于以成为解析对象的多个基因名作为关于上述基因组合的信息输入的输入画面显示于显示部。
8.权利要求1~7之任一项所述的基因解析方法,其特征在于,将用于以成为解析对象的疾病名作为关于上述基因组合的信息输入的输入画面显示于显示部。
9.权利要求1~8之任一项所述的基因解析方法,其特征在于,
基于取得的关于上述基因组合的信息而选择要作为上述读长序列信息的比较对象的参照序列信息,及
输出基于上述读长序列信息和选择的上述参照序列信息的比较的上述解析结果。
10.权利要求1~9之任一项所述的基因解析方法,其特征在于,
为了确定上述读长序列信息中所含的变异,基于取得的关于上述基因组合的信息而从含变异序列的多个参照序列信息选择作为比较对象的参照序列信息,及
输出基于选择的上述参照序列的上述解析结果。
11.权利要求1~10之任一项所述的基因解析方法,其特征在于,使用每基因组合存储关于作为基因组合的解析对象的基因的信息的基因组合关联信息数据库而输出上述读长序列信息的解析结果。
12.权利要求1~11之任一项所述的基因解析方法,其特征在于,通过从参照序列数据库读取选择的参照序列,对于读取的上述参照序列定位上述读长序列信息来进行比对。
13.权利要求1~12之任一项所述的基因解析方法,其特征在于,从参照序列数据库读取选择的参照序列,基于上述参照序列和上述读长序列信息的一致度而确定上述读长序列信息的位置,鉴定上述读长序列信息中所含的变异。
14.权利要求1~13之任一项所述的基因解析方法,其特征在于,在由上述读长序列信息的解析鉴定的变异之中,输出含关于对应于取得的关于上述基因组合的信息的变异的信息的解析结果。
15.权利要求1~14之任一项所述的基因解析方法,其特征在于,基于取得的关于上述基因组合的信息而作为上述读长序列信息的解析结果输出与由上述读长序列信息的解析鉴定的变异关联的药剂信息。
16.权利要求1~15之任一项所述的基因解析方法,其特征在于,基于由上述读长序列信息的解析鉴定的变异而检索将作为解析对象的基因的变异和与上述基因组合关联的药剂对应存储的药剂数据库。
17.权利要求16所述的基因解析方法,其特征在于,生成在上述药剂数据库的检索中提取的与由上述读长序列信息的解析鉴定的变异关联的药剂的列表。
18.权利要求1~17之任一项所述的基因解析方法,其特征在于,作为上述读长序列信息的解析结果,输出含药剂的承认状况的药剂信息。
19.权利要求1~18之任一项所述的基因解析方法,其特征在于,基于由上述读长序列信息的解析鉴定的变异而检索将作为解析对象的基因的变异和与上述变异关联的参照信息对应存储的参照数据库。
20.权利要求1~19之任一项所述的基因解析方法,其特征在于,基于上述读长序列信息的解析结果而制成报告,
上述报告在由上述读长序列信息的解析鉴定的变异之中含关于对应于取得的与上述基因组合关联的信息的变异的信息。
21.权利要求1~20之任一项所述的基因解析方法,其特征在于,从鉴定的全部的变异之中,基于关于上述基因组合的信息而选择对应于取得的关于上述基因组合的信息的变异,作为上述读长序列信息的解析结果,输出与选择的上述变异关联的信息。
22.权利要求20所述的基因解析方法,其特征在于,上述报告含与上述基因组合关联的信息。
23.权利要求20或22所述的基因解析方法,其特征在于,上述报告含药剂的列表及参照信息的至少任一方。
24.权利要求1~23之任一项所述的基因解析方法,其特征在于,向管理服务器发送关于上述基因的序列信息的解析状况的信息。
25.权利要求1~24之任一项所述的基因解析方法,其特征在于,针对每个关于上述基因组合的信息,向管理服务器发送关于上述基因的序列信息的解析状况的信息。
26.权利要求1~25之任一项所述的基因解析方法,其特征在于,针对每个关于上述基因组合的信息,向管理服务器发送上述基因的序列解析次数。
27.权利要求1~26之任一项所述的基因解析方法,其特征在于,针对每个关于上述基因组合的信息,向管理服务器发送解析的上述基因的数。
28.权利要求1~27之任一项所述的基因解析方法,其特征在于,针对每个关于上述基因组合的信息,向管理服务器发送关于上述基因的序列解析中处理的数据量的信息。
29.权利要求1~28之任一项所述的基因解析方法,其特征在于,以对上述读长序列信息和与关于取得的上述基因组合的信息相关联的基因组合作为解析对象的基因的序列信息进行比较的比较结果作为读长序列信息的解析结果输出。
30.权利要求1~29之任一项所述的基因解析方法,其特征在于,在取得的关于上述基因组合的信息不是已注册的时,表示错误。
31.权利要求1~30之任一项所述的基因解析方法,其特征在于,在取得的关于上述基因组合的信息不是从医疗机关指定的时,表示错误。
32.权利要求30或31所述的基因解析方法,其特征在于,在表示错误之后,在进行请求从使用者输入的基因组合的使用的许可的输入时,许可基因组合的解析。
33.权利要求1~32之任一项所述的基因解析方法,其特征在于,在取得的关于上述基因组合的信息不是已注册的时,禁止基因组合的解析。
34.权利要求1~33之任一项所述的基因解析方法,其特征在于,在取得的关于上述基因组合的信息不是从医疗机关指定的时,禁止基因组合的解析。
35.权利要求1~34之任一项所述的基因解析方法,其特征在于,在取得关于上述基因组合的信息的工序中有多个模式,能选择上述多个模式之中之任一者。
36.权利要求1~35之任一项所述的基因解析方法,其特征在于,上述读长序列信息之中,在取得的关于上述基因组合的信息所示的基因组合含不作为解析对象的基因的序列的读长序列信息是指定数以上时,表示错误。
37.权利要求1~36之任一项所述的基因解析方法,其特征在于,在上述读长序列信息中含与关于上述基因组合的信息相关联的索引序列。
38.权利要求37所述的基因解析方法,其特征在于,针对每个关于基因组合的信息,上述索引序列均不同。
39.权利要求38所述的基因解析方法,其特征在于,在关于与上述读长序列信息中所含的上述索引序列相关联的基因组合的信息与取得的关于上述基因组合的信息不同时,表示错误。
40.权利要求1~39之任一项所述的基因解析方法,其特征在于,
对于第1试样,使用用于对第1解析对象基因组进行解析的第1基因组合而对读取的第1读长序列信息进行解析,及
对于第2试样,使用用于对第2解析对象基因组进行解析的第2基因组合而对读取的第2读长序列信息进行解析,
接受确定上述基因组合的信息的选择而取得关于基因组合的信息,
基于选择的关于上述基因组合的信息而输出:
对上述第1读长序列信息进行解析的解析结果,及
对上述第2读长序列信息进行解析的解析结果。
41.权利要求1~40之任一项所述的基因解析方法,其特征在于,还含评价基因组合检查的品质的工序,
基于取得的关于上述基因组合的信息而输出上述品质的评价结果。
42.权利要求41所述的基因解析方法,其特征在于,在评价上述基因组合检查的品质的工序中,基于取得的关于上述基因组合的信息而选择评价上述品质时使用的品质管理指标。
43.权利要求41或42所述的基因解析方法,其特征在于,在评价上述基因组合检查的品质的工序中,基于取得的关于上述基因组合的信息而选择评价上述品质时使用的品质管理指标的评价基准。
44.权利要求41或42所述的基因解析方法,其特征在于,在评价上述基因组合检查的品质的工序中,基于取得的关于上述基因组合的信息而选择评价上述品质时使用的品质管理指标的数。
45.对基因的序列信息进行解析的基因解析装置,其具备:
控制部,其取得:
由测序仪读取的读长序列信息、和
关于含成为解析对象的多个基因的基因组合的信息,及
输出部,
其特征在于,上述控制部基于取得的关于上述基因组合的信息而向上述输出部输出上述读长序列信息的解析结果。
46.权利要求45所述的基因解析装置,其特征在于,上述控制部:
基于取得的关于上述基因组合的信息而选择要作为上述读长序列信息的比较对象的参照序列信息,及
向上述输出部输出基于上述读长序列信息和选择的上述参照序列信息的比较的上述解析结果。
47.权利要求45或46所述的基因解析装置,其特征在于,上述控制部在由上述读长序列信息的解析鉴定的变异之中,向上述输出部输出含关于对应于取得的关于上述基因组合的信息的变异的信息的解析结果。
48.权利要求45~47之任一项所述的基因解析装置,其特征在于,上述控制部基于取得的关于上述基因组合的信息而向上述输出部输出与由上述读长序列信息的解析鉴定的变异关联的药剂信息作为上述读长序列信息的解析结果。
49.权利要求42所述的基因解析装置,其中上述控制部基于取得的关于上述基因组合的信息而向上述输出部输出基因组合检查的品质的评价结果。
50.管理服务器,其特征在于,从基因解析装置接收含下列信息的信息:
确定进行基因的序列解析的使用者的信息,
关于使用的基因组合的信息,和
关于序列信息的解析状况的信息。
51.权利要求50所述的管理服务器,其特征在于,从上述基因解析装置接收关于上述基因的序列信息的解析状况的信息。
52.权利要求50或51所述的管理服务器,其特征在于,针对每个关于上述基因组合的信息,从上述基因解析装置接收关于上述基因的序列信息的解析状况的信息。
53.权利要求50~52之任一项所述的管理服务器,其特征在于,针对每个关于上述基因组合的信息,从上述基因解析装置接收上述基因的序列解析次数。
54.权利要求50~53之任一项所述的管理服务器,其特征在于,针对每个关于上述基因组合的信息,从上述基因解析装置接收解析的上述基因的数。
55.权利要求50~54之任一项所述的管理服务器,其特征在于,针对每个关于上述基因组合的信息,从上述基因解析装置接收关于上述基因的序列解析中处理的数据量的信息。
56.权利要求50~55之任一项所述的管理服务器,其特征在于,基于关于上述基因的序列信息的解析状况的信息而计算上述使用者使用上述基因解析装置而进行序列解析时的费用。
57.权利要求50~56之任一项所述的管理服务器,其特征在于,从基因解析装置接收关于上述基因组合的信息的更新要求。
58.基因解析系统,其特征在于,具备:
基因解析装置,其具备:
取得由测序仪读取的读长序列信息和关于含成为解析对象的多个基因的基因组合的信息的控制部,和
输出基于上述控制部取得的关于上述基因组合的信息的上述读长序列信息的解析结果的输出部,及
从基因解析装置接收含下列信息的信息的管理服务器:
确定进行基因的序列解析的使用者的信息,
关于使用的基因组合的信息,和
关于上述基因的序列的解析状况的信息。
59.权利要求58所述的基因解析系统,其特征在于,基于关于上述基因的序列信息的解析状况的信息而计算上述使用者使用上述基因解析装置而进行序列解析时的费用。
60.对基因的序列信息进行解析的程序,其用于使计算机执行下列工序:
取得下列信息的工序:
由测序仪读取的读长序列信息、和
关于含成为解析对象的多个基因的基因组合的信息,及
基于取得的关于上述基因组合的信息而输出上述读长序列信息的解析结果的工序。
61.计算机能读取的记录介质,其记录权利要求60所述的程序。
62.对基因的序列信息进行解析的基因解析方法,其包括:
取得下列信息:
由测序仪读取的读长序列信息、和
关于含成为解析对象的多个基因的基因组合的信息,及
基于取得的关于上述基因组合的信息而输出上述读长序列信息的解析结果,
其特征在于,在取得的关于上述基因组合的信息不是已注册的时,表示错误。
63.对基因的序列信息进行解析的基因解析方法,其包括:
取得下列信息:
由测序仪读取的读长序列信息、和
关于含成为解析对象的多个基因的基因组合的信息,及
基于取得的关于上述基因组合的信息而输出上述读长序列信息的解析结果,
其特征在于,在取得的关于上述基因组合的信息不是从医疗机关指定的时,表示错误。
CN201880069344.4A 2017-10-27 2018-10-26 基因解析方法、基因解析装置、管理服务器、基因解析系统、程序、及记录介质 Pending CN111263964A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2017-208651 2017-10-27
JP2017208651 2017-10-27
JP2018201317A JP7320345B2 (ja) 2017-10-27 2018-10-25 遺伝子解析方法、遺伝子解析装置、遺伝子解析システム、プログラム、および記録媒体
JP2018-201317 2018-10-25
PCT/JP2018/039963 WO2019083024A1 (ja) 2017-10-27 2018-10-26 遺伝子解析方法、遺伝子解析装置、管理サーバ、遺伝子解析システム、プログラム、および記録媒体

Publications (1)

Publication Number Publication Date
CN111263964A true CN111263964A (zh) 2020-06-09

Family

ID=66670522

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880069344.4A Pending CN111263964A (zh) 2017-10-27 2018-10-26 基因解析方法、基因解析装置、管理服务器、基因解析系统、程序、及记录介质

Country Status (4)

Country Link
US (1) US20200350035A1 (zh)
EP (1) EP3702473A4 (zh)
JP (1) JP7320345B2 (zh)
CN (1) CN111263964A (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112599192A (zh) * 2020-12-31 2021-04-02 杭州柏熠科技有限公司 基于纳米孔测序的新冠病毒全基因组分析系统
CN114395619B (zh) * 2021-12-29 2024-04-30 福建和瑞基因科技有限公司 一种高通量测序方法以及内参质控品
WO2024130660A1 (zh) * 2022-12-22 2024-06-27 深圳华大生命科学研究院 基因测序数据的分析系统、方法、电子设备和存储介质
CN117012285B (zh) * 2023-10-07 2024-05-14 广州盛安医学检验有限公司 一种高通量测序数据处理及分析流程管控系统
CN118053495B (zh) * 2024-02-18 2024-09-13 中科计算技术西部研究院 一种加速碱基识别的测序和分析系统及碱基识别装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020026292A1 (en) * 2000-08-25 2002-02-28 Yasushi Isami Method and system of producing analytical data
CN101666807A (zh) * 2008-09-03 2010-03-10 株式会社东芝 自动分析装置
CN104968806A (zh) * 2013-02-01 2015-10-07 Sk电信有限公司 提供与基于基因序列的个人标记有关的信息的方法和装置
US20160273049A1 (en) * 2015-03-16 2016-09-22 Personal Genome Diagnostics, Inc. Systems and methods for analyzing nucleic acid
CN107004069A (zh) * 2015-04-30 2017-08-01 株式会社Xcoo 基因组解析装置及基因组可视化方法

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3324594B2 (ja) * 1999-12-20 2002-09-17 株式会社日立製作所 バイオ製品の品質保証方法及びバイオ情報の配信方法
JP5379102B2 (ja) * 2000-08-25 2013-12-25 シスメックス株式会社 臨床検査装置の管理方法、サーバ装置および臨床検査装置の管理システム
CA2439854A1 (en) * 2001-03-01 2002-09-12 Epigenomics Ag Method for the development of gene panels for diagnostic and therapeutic purposes based on the expression and methylatoin status of the genes
JP5348840B2 (ja) * 2003-02-20 2013-11-20 メイヨ・ファウンデーション・フォー・メディカル・エデュケーション・アンド・リサーチ 薬物を選択する方法
JPWO2004109551A1 (ja) * 2003-06-05 2006-07-20 株式会社日立ハイテクノロジーズ 塩基配列関連情報を用いた情報提供システム及びプログラム
US9218450B2 (en) * 2012-11-29 2015-12-22 Roche Molecular Systems, Inc. Accurate and fast mapping of reads to genome
US20160281171A1 (en) * 2013-11-06 2016-09-29 Invivoscribe Technologies, Inc. Targeted screening for mutations
JP6596424B2 (ja) * 2013-12-12 2019-10-23 アビ−バイオティクス エス.エー. 薬剤の使用に関する個人別推奨案をコンピュータの補助のもとでウエブ・ベースで提供する方法とシステムとコンピュータで読み取り可能な記憶媒体
JP2017067605A (ja) * 2015-09-30 2017-04-06 高電工業株式会社 検体測定装置と検体測定方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020026292A1 (en) * 2000-08-25 2002-02-28 Yasushi Isami Method and system of producing analytical data
CN101666807A (zh) * 2008-09-03 2010-03-10 株式会社东芝 自动分析装置
CN104968806A (zh) * 2013-02-01 2015-10-07 Sk电信有限公司 提供与基于基因序列的个人标记有关的信息的方法和装置
US20160273049A1 (en) * 2015-03-16 2016-09-22 Personal Genome Diagnostics, Inc. Systems and methods for analyzing nucleic acid
CN107004069A (zh) * 2015-04-30 2017-08-01 株式会社Xcoo 基因组解析装置及基因组可视化方法

Also Published As

Publication number Publication date
EP3702473A1 (en) 2020-09-02
EP3702473A4 (en) 2021-09-01
US20200350035A1 (en) 2020-11-05
JP7320345B2 (ja) 2023-08-03
JP2019083011A (ja) 2019-05-30

Similar Documents

Publication Publication Date Title
JP7781018B2 (ja) 品質評価方法
Rehm et al. ACMG clinical laboratory standards for next-generation sequencing
US20200350035A1 (en) Gene analysis method, gene analysis apparatus, management server, gene analysis system, program, and storage medium
JP7577822B2 (ja) 解析方法、情報処理装置、レポート提供方法
CN109949860B (zh) 序列解析方法及装置、参照序列生成方法及装置及程序及记录介质
JP2019083011A5 (zh)
Robinson et al. Computational exome and genome analysis
JP6891150B2 (ja) 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体
JP7646752B2 (ja) 遺伝子解析方法および遺伝子解析装置
JP6891151B2 (ja) 解析方法、情報処理装置、遺伝子解析システム、プログラム、記録媒体
US20210098075A1 (en) Method for managing test request by computer, management device, management computer program, and management system
EP3267347A1 (en) Electronic platform for providing methods for the interpretation of nucleic acid sequences

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination