JP2020028278A - 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 - Google Patents
被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 Download PDFInfo
- Publication number
- JP2020028278A JP2020028278A JP2018157870A JP2018157870A JP2020028278A JP 2020028278 A JP2020028278 A JP 2020028278A JP 2018157870 A JP2018157870 A JP 2018157870A JP 2018157870 A JP2018157870 A JP 2018157870A JP 2020028278 A JP2020028278 A JP 2020028278A
- Authority
- JP
- Japan
- Prior art keywords
- biomarker
- patient
- discriminator
- survival rate
- subpopulation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G01N33/575—
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/01—Dynamic search techniques; Heuristics; Dynamic trees; Branch-and-bound
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/30—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N2800/00—Detection or diagnosis of diseases
- G01N2800/52—Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Public Health (AREA)
- Physics & Mathematics (AREA)
- Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Biomedical Technology (AREA)
- Theoretical Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Organic Chemistry (AREA)
- Epidemiology (AREA)
- Genetics & Genomics (AREA)
- Primary Health Care (AREA)
- Biophysics (AREA)
- Zoology (AREA)
- Software Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Artificial Intelligence (AREA)
- Analytical Chemistry (AREA)
- Evolutionary Computation (AREA)
- Immunology (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Oncology (AREA)
- Computing Systems (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Hospice & Palliative Care (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
Abstract
Description
本開示は、以下の態様を含む。
項1.
被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程1と、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程2と、
第2の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程3と、
を含む、判別器の生成方法であって、
前記判別器は、第2の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程3で算出された各バイオマーカーの重みを用いて、第2の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。
項2.
被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程Aと、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程Bと、
第2の亜集団に属するバイオマーカーから、機械学習法により、前記体に生じるイベントとの関連性がさらに強いと統計学的に予測されるバイオマーカー群を第3の亜集団として抽出する工程Cと、
第3の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程Dと、
を含む、判別器の生成方法であって、
前記判別器は、第3の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程Dで算出された各バイオマーカーの重みを用いて、第3の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。
項3.
前記機械学習法がランダムフォレストである、項1又は2に記載の判別器の生成方法。
項4.
前記深層学習法が勾配降下法である、項1〜3のいずれか一項に記載の判別器の生成方法。
項5.
前記検証がメタアナリシスである、項1〜4のいずれか一項に記載の判別器の生成方法。
項6.
前記体に生じるイベントが患者における所定期間内、又は所定期間後の生存率である、項1〜5のいずれか一項に記載の判別器の生成方法。
項7.
前記患者が罹患している疾患ががんである、項6に記載の判別器の生成方法。
項8.
前記バイオマーカーが遺伝子であり、前記バイオマーカーの測定値が、遺伝子に由来するmRNA、又はタンパク質の発現量である、項1〜7のいずれか一項に記載の判別器の生成方法。
項9.
処理部を備え、前記処理部が、項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器生成装置。
項10.
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を、患者の所定期間内、又は所定期間後の生存率の予測のために使用する、使用方法。
項11.
前記患者ががん患者である、項10に記載の使用方法。
項12.
がんが乳がんである、項11に記載の使用方法。
項13.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値以下であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。
項14.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値よりも大きいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。
項15.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値以上であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。
項16.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値よりも小さいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。
項17.
前記患者ががん患者である、項13〜16のいずれか一項に記載の予測方法。
項18.
がんが乳がんである、項17に記載の予測方法。
項19.
判別器を生成する際に第2の亜集団として抽出されるバイオマーカーが、下記表1−1、及び表1−2に示される遺伝子を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、項18に記載の予測方法。
項20.
判別器を生成する際に第3の亜集団として抽出されるバイオマーカーが、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、項18に記載の予測方法。
項21.
処理部を備え、前記処理部が、項13〜20のいずれか一項に記載の予測方法を実行するための、患者の生存率予測装置。
項22.
患者について、項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を、対応する基準範囲と比較する工程と、
前記患者の重み付け和が属する基準範囲の分位を決定する工程と、
を含む、患者を生存率に応じて層別化することを補助する方法。
項23.
前記患者ががん患者である、項22に記載の方法。
項24.
前記基準範囲が、がんの臨床ステージクラス分類、がんの組織型、臨床ステージ毎、病理組織グレード毎、又は年齢層毎のカテゴリーに応じて決定されており、
前記方法が、さらに、前記カテゴリーに応じて、被検体のがんの臨床ステージクラス分類、がんの組織型、臨床ステージ、病理組織グレード、及び年齢層の情報を取得する工程を含む、項22又は23に記載の方法。
項25.
下記表1−1、及び表1−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用。
項26.
FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用。
項27.
下記表1−1、及び表1−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬。
項28.
FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬。
項29.
項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器。
項30.
項29に記載の判別器を記憶した記憶媒体。
項31.
コンピュータに実行させたときに、項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器を生成するためのコンピュータプログラム。
項32.
コンピュータに実行させたときに、項13〜20のいずれか一項に記載の予測方法を実行する、患者の生存率を予測するためのコンピュータプログラム。
判別器は、複数のバイオマーカーの測定値に基づいて生成される。はじめに、バイオマーカーの母集団について、バイオマーカーの測定値に基づいて、被検体の体に生じるイベントと関連して変動しうる複数のバイオマーカーを決定する。判別器は、抽出された複数のバイオマーカーについて、各バイオマーカーの測定値に基づいて決定されるスコアと統計学的手法により算出された各バイオマーカーの重みから生成される。
より具体的には、判別器は、後述する判別器の生成装置の処理部101が、例えば、図1に示す各ステップを実行することにより生成される。
各ステップについてより詳細に説明する。
また、各ステップの典型例を、図7に示すが、本開示は、図7に限定して解釈されるものではない。
ステップ1は、被検体の体に生じるイベントと関連して変動しうるバイオマーカー群を決定する工程である。
疾患が悪性腫瘍である場合、被検体において悪性腫瘍の転移が認められないことが好ましい。
本開示において、被検体の体に生じるイベントの最も典型的な例は、10年後又は20年後の乳がん患者の生存である。
ステップS2において、処理部101は、ステップS1において、有意差検定により「差がある」と決定された第1の亜集団に対して、バリデーションコホートを使用し候補バイオマーカーとしての正しさを検証する。検証は、第1の亜集団として抽出した全てのバイオマーカーに対して網羅的に行い、候補バイオマーカーとしての正しいと判定されたバイオマーカーを第2の亜集団として抽出する。
処理部101は、機械学習と検証により第2の亜集団から第3の亜集団を抽出する。
機械学習法は、特徴量を抽出できる限り制限されない。機械学習法として例えば、ランダムフォレスト、決定木、サポートベクターリグレッション、サポートベクターマシーン、ロジスティック解析、スパースロジスティック解析、深層学習等を挙げることができる。好ましくは、ランダムフォレストである。機械学習は、例えばPythonベースのscikit−learnライブラリ等を使用して行うことができる。
図7に示す典型例で抽出された遺伝子は、図11−1aに示す23遺伝子である。
ステップ4では、第3の亜集団に属するバイオマーカーについて、訓練データをニューラルネットワークに入力し、深層学習法により第3の亜集団に属する各バイオマーカーの重み(「Weight」又は「wi」で表すことがある。iは各バイオマーカーを示す。)を算出する。
前記判別器を使用した重み付け和を分子予後予測スコア(molecular prognostic score:mPS)とよぶ。
ステップ5は、任意のステップである。ステップ5では、ステップ4で生成した判別器が、コホートの種類、疾患のサブタイプ、被検体の年齢等によって群分けされたコホートを問わず適用可能であるか、検証するステップである。
本開示は、判別器を生成するための装置10(判別器生成装置10とも呼ぶ)に関する。判別器生成装置10は、少なくとも処理部101を備え、前記処理部101は、上記1.、図1又は図2に記載のステップにしたがって、上記1.で述べた判別器を生成する。
本開示のある実施形態は、判別器を生成するためのコンピュータプログラムに関する。
前記コンピュータプログラムは、図1に記載のステップS1、ステップS2及びステップS4、好ましくはステップS1〜S5及び図2に記載のステップS31〜S34を処理部101に実行させる。
本開示のある実施形態は、患者の生存率の予測方法に関する。本実施形態においては、上記1.の方法にて生成された判別器を用いて、患者の所定期間後の生存率を予測する。患者が罹患している疾患は、特に制限されないが、好ましくは、がんであり、より好ましくは、乳がんである。
本実施形態において、判別器、患者、がん、生存率、所定期間、mPS等、上記1.において使用されている用語については、上記1.の説明をここに援用する。
本開示は、患者の生存率を予測するための装置20(生存率予測装置20とも呼ぶ)に関する。生存率予測装置20は、少なくとも処理部201を備える。生存率予測装置20の構成は、判別器生成装置10と同じであるため、上記2.の説明、図3及び図4は、ここに援用する。
本開示のある実施形態は、がん患者の生存率を予測するためのコンピュータプログラムに関する。
本開示のある実施形態は、生存率に基づいて、がん患者の層別化を補助する方法に関する。
本開示は、患者を層別化するための装置30(層別化装置30とも呼ぶ)に関する。層別化装置30は、少なくとも処理部301を備える。層別化装置30の構成は、判別器生成装置10と同じであるため、上記2.の説明、図3及び図4は、ここに援用する。
図6を用いて、層別化装置30の動作について説明する。
本開示のある実施形態は、がん患者を層別化するためのコンピュータプログラムに関する。
本開示のある実施形態は、表1−1及び表1−2に記載の遺伝子から選択される少なくとも一種の遺伝子を、乳がん患者における生存率を予測するためのバイオマーカーとして使用することに関する。好ましくは、前記バイオマーカーには、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない。より好ましくは、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)を、乳がんの生存率を予測するためのバイオマーカーとして使用する。前記遺伝子群から選択される少なくとも一種の遺伝子に由来するmRNA及び/又はタンパク質の発現量をバイオマーカーとして使用する。
本開示のある実施形態は、表1−1及び表1−2に記載の遺伝子から選択される少なくとも一種の遺伝子に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬に関する。好ましくは、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない。より好ましくは、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)である。本検査試薬は、RT−PCR法、マイクロアレイ法、RNA−Seq法、ELISA法、ウエスタンブロッティング法等に使用できる限り制限されない。
<コホート>
判別器を生成するため、複数の公知の乳がんコホートを使用した。今回の検討に使用するコホートからは転移のある患者はほとんどいなかった。
ヒト遺伝子のリストは、HUGO Gene Nomenclature Committee (HGNC)から取得した。
cBioPortalからのデータのダウンロードには、cBioPortalが提供するCGDS-R package及びWeb APIsを使用した。機械学習のランダムフォレストアプローチには、n_estimators(= 500)、max_depth(= 10)を除いて、パラメータをデフォルトとしたPythonベースのscikit-learnライブラリを使用した。ニューラルネットワーク解析にも、PythonベースのTensorFlowライブラリを使用した。他の解析は、Anaconda distributionにおいて構築された、カスタムスクリプトで書かれたPython(3.6.2)を使用した。
Kaplan-Meier plotsはR (survival package)を使用して作成し、Python (lifelines package)を使用してバリデーションを行った。各遺伝子の低発現群と高発現群を分けるカットオフ値には中央値を使用した。本実施例において、低発現を上付文字 “low”、高発現を上付文字 “high”で表すことがある。分子予測スコア[molecular prognostic score (mPS)]のバリデーションは、特に断りのない限り、10年後まででデータを打ち切った。図8eに示すmeta-analysisを除き、いずれの場合も、生存期間は、診断日から死亡日までとした。生存率の比較はLog-rank検定で行った。meta-analysis は、R survival package を使用し、Cox回帰を用いたハザード比(HR)とその95%信頼区間(CIs)を推定した。
有意差の有無は、ディスカバリコホート(図8)を除いて両側検定のp値0.05で決定され、候補遺伝子数を減らすためのカットオフは0.01とした。
図7に、複数のコホートから、がんの予後を予測するための判別器を生成するまでの概要を示す。
ステップ1:候補遺伝子の抽出
ステップ2:候補遺伝子の検証
ステップ3:機械学習による特徴量抽出
ステップ4:深層学習による判別器の構築
ステップ5:判別器の検証
各ステップについて説明する。
ステップ1では、TCGAコホートをダウンロードし、このRNAのリード数(発現量)に基づいて、乳がん患者における10年後の生存率と関連する遺伝子の候補の探索を行った。このディスカバリコホートの年齢の中央値は、59歳(IQR 49-68)であった。
ステップ2では、Log-rank検定によりピックアップされた286遺伝子について、バリデーションコホートとして、multicenterコホートを使用してmeta-analysisによるバリデーションを行い、184遺伝子をさらに候補遺伝子として抽出した(図8e)。抽出された遺伝子の中で、TMEM65、及び RILPL2は、multicenterコホートの中で、それぞれの発現量が最も高いHR(図9−1a)と、最も低いHR(図9−1b)を示し、乳がんの予後と最も関連性が強いと考えられる遺伝子であった。これらの遺伝子は、これまで、基礎的ながん研究でも臨床的ながん研究でも取り上げられていない遺伝子であった。
ステップ3では、ランダムフォレストにより、ステップ2で抽出された184遺伝子について特徴量抽出を行い、さらに乳がんの生存率と関連性の高い遺伝子を抽出した。訓練データとして、METABRIC コホートからランダムに抽出したn=952のコホートを使用した。ランダムフォレストによって得られた結果をクロスバリデーションにより検証した。このようにして、乳がんの10年後の生存率を予測するための予測遺伝子として、図11−1aに示す23遺伝子を選別した。23遺伝子のうちの13遺伝子は、発現が中央値より高い場合に予後が不良となる可能性があり、10遺伝子は、発現が中央値より低い場合に予後が不良となる可能性がある。
ステップ4では、ニューラルネットワークを使って、ステップ3で抽出された23遺伝子の重みを算出した。訓練データとして、ステップ3でも使用した、METABRIC コホートからランダムに抽出したn=952のコホートを使用した。前記訓練データを使ったニューラルネットワークによる深層学習により、各遺伝子の交差エントロピーによる損失関数を規定し、各遺伝子の重み“Gene_Weight”を勾配降下法により算出した[図12: Kourou, K., et al.Computational and structural biotechnology journal 13, 8-17,doi:10.1016/j.csbj.2014.11.005 (2015)]。
図11−2cに、乳がんのステージ分類と、mPS=0〜50までの範囲を6段階で分位した各分位におけるコホートの分布を示す。分位は第1分位がmPS=0〜5(以下、図面において符号「1st」で表す)、第2分位がmPS=5〜11(以下、図面において符号「2nd」で表す)、第3分位がmPS=11〜25(以下、図面において符号 「3rd」で表す)、第4分位がmPS=25〜36(以下、図面において符号「4th」で表す)、第5分位がmPS=36〜45(以下、図面において符号「5th」で表す)、第6分位がmPS=45〜50(以下、図面において符号「6th」で表す)である。また、図11−2cにおいて、符号S1は乳がんステージIを、符号S2は乳がんステージIIを、符号S3は乳がんステージIIIを示す。
図11−2cに示すように、mPSは、臨床ステージと良好な相関を示した。
前記判別器(数3)が、どのような乳がんのサブセットに適用可能であるか検証するため、以下の検討を行った。
そこで、TNM分類とmPSがどのような関係になるか検討した。
したがって、mPSは、ステージとも相関を示すことが証明された。
Claims (32)
- 被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程1と、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程2と、
第2の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程3と、
を含む、判別器の生成方法であって、
前記判別器は、第2の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程3で算出された各バイオマーカーの重みを用いて、第2の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。 - 被検体に由来するバイオマーカーの母集団について、各バイオマーカーの測定値に基づいて各バイオマーカーが前記被検体の体に生じるイベントと関連して変動するか否かを統計学的手法により判定し、変動すると判定されたバイオマーカー群を第1の亜集団として抽出する工程Aと、
第1の亜集団に属する各バイオマーカーを検証し、前記体に生じるイベントとの関連性がより強いと統計学的に予測されるバイオマーカー群を第2の亜集団として抽出する工程Bと、
第2の亜集団に属するバイオマーカーから、機械学習法により、前記体に生じるイベントとの関連性がさらに強いと統計学的に予測されるバイオマーカー群を第3の亜集団として抽出する工程Cと、
第3の亜集団に属する各バイオマーカーの重みを深層学習法により算出する工程Dと、
を含む、判別器の生成方法であって、
前記判別器は、第3の亜集団に属する各バイオマーカーの測定値から得られるスコアと工程Dで算出された各バイオマーカーの重みを用いて、第3の亜集団に属するバイオマーカーのスコアの重み付け和を算出する、
前記判別器の生成方法。 - 前記機械学習法がランダムフォレストである、請求項1又は2に記載の判別器の生成方法。
- 前記深層学習法が勾配降下法である、請求項1〜3のいずれか一項に記載の判別器の生成方法。
- 前記検証がメタアナリシスである、請求項1〜4のいずれか一項に記載の判別器の生成方法。
- 前記体に生じるイベントが患者における所定期間内、又は所定期間後の生存率である、請求項1〜5のいずれか一項に記載の判別器の生成方法。
- 前記患者が罹患している疾患ががんである、請求項6に記載の判別器の生成方法。
- 前記バイオマーカーが遺伝子であり、前記バイオマーカーの測定値が、遺伝子に由来するmRNA、又はタンパク質の発現量である、請求項1〜7のいずれか一項に記載の判別器の生成方法。
- 処理部を備え、前記処理部が、請求項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器生成装置。
- 請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を、患者の所定期間内、又は所定期間後の生存率の予測のために使用する、使用方法。
- 前記患者ががん患者である、請求項10に記載の使用方法。
- がんが乳がんである、請求項11に記載の使用方法。
- 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値以下であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。 - 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど小さな値を示す場合であって、前記患者の重み付け和が基準値よりも大きいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。 - 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値以上であるときに、前記患者の生存率が良好であると決定する工程を含む、患者の生存率の予測方法。 - 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を取得する工程と、
請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和が、所定期間内、又は所定期間後の生存率が良好なほど大きな値を示す場合であって、前記患者の重み付け和が基準値よりも小さいときに、前記患者の生存率が不良であると決定する工程を含む、患者の生存率の予測方法。 - 前記患者ががん患者である、請求項13〜16のいずれか一項に記載の予測方法。
- がんが乳がんである、請求項17に記載の予測方法。
- 判別器を生成する際に第2の亜集団として抽出されるバイオマーカーが、下記表1−1、及び表1−2に示される遺伝子を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、請求項18に記載の予測方法;
。 - 判別器を生成する際に第3の亜集団として抽出されるバイオマーカーが、FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3を含み、前記バイオマーカーの測定値が遺伝子に由来するmRNA、又はタンパク質の発現量である、請求項18に記載の予測方法。
- 処理部を備え、前記処理部が、請求項13〜20のいずれか一項に記載の予測方法を実行するための、患者の生存率予測装置。
- 患者について、請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器を用いて算出した重み付け和を、対応する基準範囲と比較する工程と、
前記患者の重み付け和が属する基準範囲の分位を決定する工程と、
を含む、患者を生存率に応じて層別化することを補助する方法。 - 前記患者ががん患者である、請求項22に記載の方法。
- 前記基準範囲が、がんの臨床ステージクラス分類、がんの組織型、臨床ステージ毎、病理組織グレード毎、又は年齢層毎のカテゴリーに応じて決定されており、
前記方法が、さらに、前記カテゴリーに応じて、被検体のがんの臨床ステージクラス分類、がんの組織型、臨床ステージ、病理組織グレード、及び年齢層の情報を取得する工程を含む、請求項22又は23に記載の方法。 - 下記表2−1、及び表2−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用;
。 - FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)の、乳がん患者の生存率を予測するためのバイオマーカーとしての使用。
- 下記表3−1、及び表3−2に示される遺伝子から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬;
。 - FOXM1、CPT1A、GARS、MARS、UTP23、ANLN、HMGB3、ATP5B、APOOL、CYB561、GRHL2、ESRP1、EZR、RBBP8、CIRBP、PTGER3、LAMA3、OARD1、ANKRD29、EGR3、DIRAS3、MITD1及びLAMB3よりなる遺伝子群から選択される少なくとも一種(ただし、ANLN、FOXM1、RBBP8又はこれらの遺伝子の組み合わせのみの態様は含まない)に由来するmRNA、又はタンパク質の発現量を検出するためのプローブ、プライマー、又は抗体を含む、乳がん患者の生存率を予測するために使用される検査試薬。
- 請求項1〜8のいずれか一項に記載の判別器の生成方法により生成された判別器。
- 請求項29に記載の判別器を記憶した記憶媒体。
- コンピュータに実行させたときに、請求項1〜8のいずれか一項に記載の判別器の生成方法を実行する、判別器を生成するためのコンピュータプログラム。
- コンピュータに実行させたときに、請求項13〜20のいずれか一項に記載の予測方法を実行する、患者の生存率を予測するためのコンピュータプログラム。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018157870A JP2020028278A (ja) | 2018-08-24 | 2018-08-24 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
| PCT/JP2019/033085 WO2020040300A1 (ja) | 2018-08-24 | 2019-08-23 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
| EP19852485.2A EP3842540A4 (en) | 2018-08-24 | 2019-08-23 | METHODS OF GENERATION OF A CLASSIFIER FOR USE IN PREDICTING AN EVENT THAT OCCURS IN A SUBJECT AND METHODS OF STRATIFICATION OF SUBJECTS USING SAID CLASSIFIER |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018157870A JP2020028278A (ja) | 2018-08-24 | 2018-08-24 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2020028278A true JP2020028278A (ja) | 2020-02-27 |
Family
ID=69593239
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018157870A Ceased JP2020028278A (ja) | 2018-08-24 | 2018-08-24 | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 |
Country Status (3)
| Country | Link |
|---|---|
| EP (1) | EP3842540A4 (ja) |
| JP (1) | JP2020028278A (ja) |
| WO (1) | WO2020040300A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021245850A1 (ja) | 2020-06-03 | 2021-12-09 | 富士通株式会社 | 診断支援プログラム、装置、及び方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014072349A (ja) * | 2012-09-28 | 2014-04-21 | Sanken Electric Co Ltd | 半導体装置 |
| JP2014532428A (ja) * | 2011-11-08 | 2014-12-08 | ジェノミック ヘルス, インコーポレイテッド | 乳癌の予後を予測する方法 |
| JP2018500276A (ja) * | 2014-10-09 | 2018-01-11 | デイナ ファーバー キャンサー インスティチュート,インコーポレイテッド | 免疫障害を処置するための複数の可変il−2用量レジメン |
| JP2018520366A (ja) * | 2015-07-22 | 2018-07-26 | ミノミック インターナショナル リミティド | 前立腺疾患のためのバイオマーカーの組み合わせ |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3884767A (en) | 1973-09-21 | 1975-05-20 | Jr John E Pottharst | Multi-effect flash evaporator |
| WO2007041238A2 (en) * | 2005-09-29 | 2007-04-12 | Stratagene California | Methods of identification and use of gene signatures |
| US8026055B2 (en) * | 2006-11-15 | 2011-09-27 | University Health Network | Materials and methods for prognosing lung cancer survival |
| CN105821125A (zh) * | 2010-03-31 | 2016-08-03 | 斯维丹诊断有限责任公司 | 用于内分泌治疗下的乳腺癌复发预测的方法 |
| JP2014509189A (ja) * | 2011-01-25 | 2014-04-17 | アルマック ダイアグノスティックス リミテッド | 結腸ガン遺伝子発現シグネチャーおよび使用方法 |
| CN103649336A (zh) * | 2011-05-10 | 2014-03-19 | 雀巢产品技术援助有限公司 | 用于个体化治疗管理的疾病活动性表征方法 |
| WO2016094330A2 (en) * | 2014-12-08 | 2016-06-16 | 20/20 Genesystems, Inc | Methods and machine learning systems for predicting the liklihood or risk of having cancer |
-
2018
- 2018-08-24 JP JP2018157870A patent/JP2020028278A/ja not_active Ceased
-
2019
- 2019-08-23 EP EP19852485.2A patent/EP3842540A4/en not_active Withdrawn
- 2019-08-23 WO PCT/JP2019/033085 patent/WO2020040300A1/ja not_active Ceased
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014532428A (ja) * | 2011-11-08 | 2014-12-08 | ジェノミック ヘルス, インコーポレイテッド | 乳癌の予後を予測する方法 |
| JP2014072349A (ja) * | 2012-09-28 | 2014-04-21 | Sanken Electric Co Ltd | 半導体装置 |
| JP2018500276A (ja) * | 2014-10-09 | 2018-01-11 | デイナ ファーバー キャンサー インスティチュート,インコーポレイテッド | 免疫障害を処置するための複数の可変il−2用量レジメン |
| JP2018520366A (ja) * | 2015-07-22 | 2018-07-26 | ミノミック インターナショナル リミティド | 前立腺疾患のためのバイオマーカーの組み合わせ |
Non-Patent Citations (3)
| Title |
|---|
| N. ENGL. J. MED., vol. 351, no. 27, JPN6019035519, 2004, pages 2817 - 2826, ISSN: 0004964405 * |
| NATURE, vol. 415, JPN6019044609, 2002, pages 530 - 536, ISSN: 0004964406 * |
| PROC. NATL. ACAD. SCI. U.S.A., vol. 98, no. 19, JPN7019003689, 2001, pages 10869 - 10874, ISSN: 0004964407 * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2021245850A1 (ja) | 2020-06-03 | 2021-12-09 | 富士通株式会社 | 診断支援プログラム、装置、及び方法 |
| JPWO2021245850A1 (ja) * | 2020-06-03 | 2021-12-09 | ||
| JP7444252B2 (ja) | 2020-06-03 | 2024-03-06 | 富士通株式会社 | 診断支援プログラム、装置、及び方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP3842540A4 (en) | 2022-10-05 |
| EP3842540A1 (en) | 2021-06-30 |
| WO2020040300A1 (ja) | 2020-02-27 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US20230393150A1 (en) | Methods and algorithms for aiding in the detection of cancer | |
| CN109036571B (zh) | 用于预测患有癌症的可能性或风险的方法和机器学习系统 | |
| Klein et al. | A 17-gene assay to predict prostate cancer aggressiveness in the context of Gleason grade heterogeneity, tumor multifocality, and biopsy undersampling | |
| Chen et al. | Prognostic fifteen-gene signature for early stage pancreatic ductal adenocarcinoma | |
| Amaro et al. | Validation of proposed prostate cancer biomarkers with gene expression data: a long road to travel | |
| US20090275057A1 (en) | Diagnostic markers predictive of outcomes in colorectal cancer treatment and progression and methods of use thereof | |
| US20240159753A1 (en) | Methods for the detection and treatment of lung cancer | |
| Zhu et al. | Three immunomarker support vector machines–based prognostic classifiers for stage IB non–small-cell lung cancer | |
| US20120101002A1 (en) | Lung Cancer Biomarkers and Uses Thereof | |
| Matsui | Genomic biomarkers for personalized medicine: development and validation in clinical studies | |
| US20140073522A1 (en) | Pancreatic Cancer Biomarkers and Uses Thereof | |
| EP2386854A1 (en) | Diagnostic markers of breast cancer treatment and progression and methods of use thereof | |
| US20090061422A1 (en) | Diagnostic markers of breast cancer treatment and progression and methods of use thereof | |
| JP2011523049A (ja) | 頭頚部癌の同定、モニタリングおよび治療のためのバイオマーカー | |
| KR20230124038A (ko) | 결장 세포 증식 장애의 조기 검출을 위한 마커 | |
| AU2019250606A1 (en) | Improved classification and prognosis of prostate cancer | |
| JP2022505295A (ja) | ヒト腫瘍のがん細胞における分子活性を定量化するための方法 | |
| KR101378919B1 (ko) | 혈액으로부터 직접 폐암 진단 및 폐암의 서브타입 진단이 가능한 마커를 선별하는 시스템 생물학적 방법 및 이로부터 선별된 혈액으로부터 직접 폐암 진단 및 폐암 서브타입 진단이 가능한 마커 | |
| Browne et al. | MicroRNA expression profiles in upper tract urothelial carcinoma differentiate tumor grade, stage, and survival: implications for clinical decision-making | |
| WO2020040300A1 (ja) | 被検体に生じるイベントを予測するための判別器の生成方法、及び前記判別器を用いた被検体の層別化方法 | |
| CN113234823A (zh) | 胰腺癌预后风险评估模型及其应用 | |
| US20250305057A1 (en) | Bladder cancer biomarkers and methods of use | |
| US20220065872A1 (en) | Lung Cancer Biomarkers and Uses Thereof | |
| JP2024540836A (ja) | 肺癌の予測及びその利用 | |
| Ramirez et al. | Discovery and validation of ovarian cancer biomarkers utilizing high density antibody microarrays |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210603 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220607 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20220805 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221005 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230117 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20230320 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230517 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230808 |
|
| A045 | Written measure of dismissal of application [lapsed due to lack of payment] |
Free format text: JAPANESE INTERMEDIATE CODE: A045 Effective date: 20231220 |