[go: up one dir, main page]

TWI780781B - 微衛星不穩定性檢測方法及系統 - Google Patents

微衛星不穩定性檢測方法及系統 Download PDF

Info

Publication number
TWI780781B
TWI780781B TW110122325A TW110122325A TWI780781B TW I780781 B TWI780781 B TW I780781B TW 110122325 A TW110122325 A TW 110122325A TW 110122325 A TW110122325 A TW 110122325A TW I780781 B TWI780781 B TW I780781B
Authority
TW
Taiwan
Prior art keywords
mss
msi
cancer
computer
implemented method
Prior art date
Application number
TW110122325A
Other languages
English (en)
Other versions
TW202205301A (zh
Inventor
葉雅琪
陳建宏
淑貞 陳
陳映嘉
陳冠螢
Original Assignee
香港商行動基因(智財)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 香港商行動基因(智財)有限公司 filed Critical 香港商行動基因(智財)有限公司
Publication of TW202205301A publication Critical patent/TW202205301A/zh
Application granted granted Critical
Publication of TWI780781B publication Critical patent/TWI780781B/zh

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Biophysics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Data Mining & Analysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Analytical Chemistry (AREA)
  • Chemical & Material Sciences (AREA)
  • Molecular Biology (AREA)
  • Genetics & Genomics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioethics (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本發明揭露一種用於檢測微衛星不穩定性(MSI)狀態的方法和系統,係利用次世代定序(NGS)以及一種機器學習模型。本發明進一步提供一種依據人類個體MSI狀態的運算資料而決定療法的方法以及系統。

Description

微衛星不穩定性檢測方法及系統
本申請案主張2020年6月18日提出的美國臨時申請案第63/041,103號的優先權,其全部內容通過引用併入本文。
本發明係關於分子診斷學、癌症基因體學及分子生物學的領域。
微衛星不穩定性(microsatellite instability,MSI)是一種分子表型,其指示潛在的基因體高突變性。微衛星區(microsatellite tract)中核苷酸的獲得或喪失可能源自錯配修復(mismatch repair,MMR)系統的缺陷,以致限制了重複性DNA序列中自發突變的修正。因此,受MSI影響的腫瘤可能是由MMR途徑中的基因突變失活或表觀基因靜默(epigenetic silencing)而引起。MSI與改善預後是相關的。MSI用於預測對帕博利珠單抗(pembrolizumab)反應的能力使食品藥物管理局在2017年5月批准了第一項不定腫瘤類型(tumor-agnostic)藥物。另有證據顯示,微衛星高度不穩定(microsatellite instability-high,MSI-H)的患者對於抗PD-1藥物之納武利尤單抗(nivolumab)與MEDI0680、抗PD-L1藥物之度伐利尤單抗(durvalumab)以及抗CTLA-4藥物之伊匹木單抗(ipilimumab)有較佳反應。基於這些結果,MSI-H已被批准作為免疫檢查點(immune checkpoint)抑制劑的分子標誌。
MSI之偵測通常是透過聚合酶連鎖反應檢測法(MSI-PCR),利用五個微衛星位點(microsatellite loci)的波峰型態進行片段分析(fragment analysis,FA),以判定個別樣品的MSI狀態。帶有二個或更多不穩定微衛星的樣本被稱為高MSI (MSI-H),而只有一個或未檢測到不穩定微衛星的樣本被稱為微衛星穩定(microsatellite stable,MSS)。由於對每個微衛星位點的評估需要比較成對的腫瘤與正常組織,因此對於組織樣本有限的病例,特別是含有少量正常細胞的樣本,MSI-PCR檢測並不總是可行的。免疫組織化學染色法(immunohistochemistry,IHC)是另一種可用於MSI狀態檢測的典型檢測方法,其係透過錯配修復(MMR)蛋白表現測試去檢測含MSI的樣本。然而,MMR-IHC無法每次都檢測到錯義突變(missense mutations)導致的突變蛋白缺失,甚至對一些蛋白截斷突變(protein-truncating mutations)也可能有正常的染色結果。此外,目前對MSI-PCR及IHC資料的解讀皆是人工且定性的。本技術領域需要開發一種有效且準確測定患者的MSI狀態的定量檢測方法。
目前發現數種次世代定序(next-generation sequencing,NGS)檢測方法可用於測定MSI狀態。一般而言,基於NGS的MSI檢測具備的優勢是依據定量統計結果提供自動化分析。相比MSI-PCR檢測,此方法減少了分析時間,並且降低來自觀察者之間及來自實驗室之間的差異。然而,一些基於NGS的MSI檢測方法,例如MANTIS及MSIsensor需要一個配對的正常樣本用於評估。至於其他方法,例如MSIplus,儘管在檢測中不需要一個配對的正常樣本,但可能需要進一步改進,例如增加更多微衛星位點。故基於NGS的MSI檢測仍有改進空間。
本揭露針對微衛星不穩定性(MSI)狀態的檢測提供了改良技術。本揭露係使用一種經過訓練的機器學習模型(machine learning model)來檢測MSI狀態,該模型訓練自臨床目的之大範疇基因套組(large-panel)的次世代定序資料,將至少六個微衛星位點,較佳為至少一百個微衛星位點納入。該經過訓練的機器學習模型對不同的特徵使用不同的權重,例如波峰寬度(peak width)、波峰高度(peak height)、波峰位置(peak location)及簡單序列重複(simple sequence repeat,SSR)的類型等特徵,以便由沒有相配對正常樣本的NGS資料檢測MSI狀態時,可達到高穩健性及高效率。此外,藉由使用覆蓋不同癌症類型的獨立臨床樣本資料集進行驗證,該經過訓練的機器學習模型被證實對MSI狀態檢測具有高度的敏感性和特異性。
總括而言,本揭露係關於一種產生用於預測MSI狀態的模型的方法,包含: (a) 收集一臨床樣本及該樣本的一預估所得MSI狀態資料; (b) 透過次世代定序(NGS)對該臨床樣本的至少六個微衛星位點進行定序,以產生一定序資料; (c) 從該定序資料中擷取一MSI特徵; (d) 藉由將一MSI特徵資料與該預估所得MSI狀態資料彼此對應以訓練一機器學習模型;及 (e) 輸出一經過訓練的機器學習模型。
在一些實施例中,該MSI特徵資料是由一基線(baseline)計算。在一些實施例中,計算該MSI特徵資料的該基線是建立自正常樣本或具有MSS狀態的樣本。在一些實施例中,該基線是建立自正常樣本中每個SSR區域的各該MSI特徵的平均值。較佳地,該基線是建立自每個SSR區域的平均波峰寬度。
在一些實施例中,該預估所得MSI狀態資料是透過已知的檢測方法從癌症患者獲取。已知的檢測方法包括但不限於MSI-PCR檢測、免疫組織化學染色法、及基於NGS的MSI檢測,包括MANTIS、MSIsensor、MSIplus或大範疇基因套組NGS (large-panel NGS)。在一些實施例中,該MSI狀態係為微衛星穩定(MSS)或微衛星高度不穩定(MSI-H)。在一些實施例中,該MSI特徵包括波峰寬度、波峰高度、波峰位置、SSR類型、或其任意組合。
在一些實施例中,該機器學習模型包括但不限於迴歸模型(regression-based models)、決策樹模型(tree-based models)、貝氏模型(Bayesian models)、支援向量機(support vector machines)、提升模型(boosting models)或神經網路模型(neural network-based models)。在一些實施例中,該機器學習模型包括但不限於邏輯式迴歸模型(logistic regression model)、隨機森林模型(random forest model)、極端隨機樹模型(extremely randomized trees model)、多項式迴歸模型(polynomial regression model)、線性迴歸模型(linear regression model)、梯度下降模型(gradient descent model)及極端梯度提升模型(extreme gradient boost model)。
在一些實施例中,該經過訓練的機器學習模型包含對各微衛星位點所界定的一權重。在一些實施例中,該經過訓練的機器學習模型包含對各微衛星位點的MSI特徵所界定的一權重。該經過訓練的機器學習模型可以預測MSI狀態。
在一些實施例中,該機器學習模型具有一閾值(cutoff value),該閾值為0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45或0.5。
在一些實施例中,該預估所得MSI狀態資料或運算所得MSI狀態資料指示微衛星穩定(MSS)或微衛星高度不穩定(MSI-H)。
另一方面,本揭露大體上係關於一種測定MSI狀態的電腦執行方法,包含: (a) 從一個體收集一臨床樣本; (b) 透過次世代定序(NGS)對該臨床樣本的至少六個微衛星位點進行定序,以產生一定序資料; (c) 從該定序資料中擷取一MSI特徵; (d) 將一MSI特徵資料導入前述經過訓練的機器學習模型;及 (e) 產出一運算所得MSI狀態。
在一些實施例中,該電腦執行方法進一步包含步驟(f):將該運算所得MSI狀態資料輸出至一電子儲存媒體或一顯示器。
在一些實施例中,該方法進一步包含一步驟,係依據該運算所得MSI狀態資料而決定對該個體的療法及/或向該個體施予一治療有效量的療法。
在一些實施例中,該療法包括但不限於手術、個人療法、化學治療、放射線治療、免疫療法或其任意組合。在一些實施例中,該免疫療法包括施予藥物,該藥物包括但不限於抗PD-1藥物如帕博利珠單抗(pembrolizumab)、納武利尤單抗(nivolumab)及MEDI0680,抗PD-L1藥物如度伐利尤單抗(durvalumab),及抗CTLA-4藥物如伊匹木單抗(ipilimumab)。
在一些實施例中,該微衛星位點是至少7、10、15、20、30、40、50、100、150、200、250、300、350、400、450、500、550或600個位點。在一些實施例中,該微衛星位點是透過對染色體區域的SSR區域進行定序而確定。在一些實施例中,微衛星位點會因為定序覆蓋率(coverage)低、波峰不穩定(unstable peak call)、波峰寬度高變異性或貢獻權重低而被排除。在一些實施例中,波峰寬度高變異性的微衛星位點在5次重複量測中其波峰寬度變異大於2、在6次重複量測中的波峰寬度變異大於3、在7次重複量測中的波峰寬度變異大於3、在8次重複量測中的波峰寬度變異大於3、在9次重複量測中的波峰寬度變異大於3、或在10次重複量測中的波峰寬度變異大於4。
在一些實施例中,該樣本來自細胞株(cell line)、活體組織檢體(biopsy)、原發組織(primary tissue)、冷凍組織、福馬林固定石蠟包埋(formalin-fixed paraffin-embedded,FFPE)組織、液態活體組織檢體(liquid biopsy)、血液、血清、血漿、白血球層(buffy coat)、體液、內臟液、腹水、腔液穿刺(paracentesis)、腦脊髓液、唾液、尿液、淚液、精液、陰道分泌物、抽取物(aspirate)、灌洗液(lavage)、口腔抹片(buccal swab)、循環腫瘤細胞(circulating tumor cell,CTC)、游離DNA(cell-free DNA,cfDNA)、循環腫瘤DNA(circulating tumor DNA,ctDNA)、DNA、RNA、核酸、純化之核酸、純化之DNA、或純化之RNA。
在一些實施例中,該樣本是一臨床樣本。在一些實施例中,該樣本來自一病患。在一些實施例中,該樣本來自一患者,其患有癌症、實體瘤、血液惡性腫瘤、罕見遺傳病、複合性疾病、糖尿病、心血管疾病、肝病、或神經系統疾病。在一些實施例中,該樣本來自一患者,其患有腺癌(adenocarcinoma)、腺樣囊性癌(adenoid cystic carcinoma)、腎上腺皮質癌(adrenal cortical carcinoma)、壺腹周圍瘤(ampulla vater cancer)、肛門癌(anal cancer)、闌尾癌(appendix cancer)、基底核膠質瘤(basal ganglia glioma)、膀胱癌(bladder cancer)、腦癌(brain cancer)、腦瘤(brain tumor)、神經膠質瘤(glioma)、乳癌(breast cancer)、頰癌(buccal cancer)、子宮頸癌(cervical cancer)、膽管癌(cholangiocarcinoma)、軟骨肉瘤(chondrosarcoma)、卵巢亮細胞癌(clear cell carcinoma)、結腸癌(colon cancer)、結腸直腸癌(colorectal cancer)、囊管癌(cystic duct carcinoma)、去分化脂肪肉瘤(dedifferentiated liposarcoma)、硬纖維瘤(desmoid tumor)、彌漫性中線膠質瘤(diffuse midline glioma)、子宮內膜癌(endometrial cancer)、子宮內膜樣腺癌(endometrioid adenocarcinoma)、上皮樣橫紋肌肉瘤(epithelioid rhabdomyosarcoma)、食道癌(esophageal cancer)、骨骼外軟骨母細胞骨肉瘤(extraskeletal chondroblastic osteosarcoma)、眼瞼皮脂腺癌(eyelid sebaceous carcinoma)、輸卵管癌(fallopian tube cancer)、膽囊癌(gallbladder cancer)、胃癌(gastric cancer)、胃腸道基質瘤(gastrointestinal stromal tumor,GIST)、多形性膠質母細胞瘤(glioblastoma multiforme)、頭頸癌(head and neck cancers)、肝細胞癌(hepatocellular carcinoma)、高惡性度膠質瘤(high grade glioma)、下咽癌(hypopharyngeal cancer)、內膜肉瘤(intimal sarcoma)、嬰兒型纖維肉瘤(infantile fibrosarcoma)、侵襲性乳腺管癌(invasive ductal carcinoma)、腎癌(kidney cancer)、平滑肌肉瘤(leiomyosarcoma)、脂肪肉瘤(liposarcoma)、肝臟血管肉瘤(liver angiosarcoma)、肝癌(liver cancer)、肺癌(lung cancer)、黑色素瘤(melanoma)、原發部位不明轉移癌(metastasis of unknown origin,MUO)、鼻咽癌(nasopharyngeal cancer)、非小細胞肺腺癌(NSCLC adenocarcinoma)、食道癌(oesophageal cancer)、口腔癌(oral cancer)、口咽癌(oropharyngeal cancer)、骨肉瘤(osteosarcoma)、卵巢癌(ovarian cancer)、胰臟癌(pancreatic cancer)、甲狀腺乳突癌(papillary thyroid carcinoma)、腹膜癌(peritoneal cancer)、原發性漿液性腹膜癌(primary peritoneal serous carcinoma,PPSC)、前列腺癌(prostate cancer)、直腸癌(rectal cancer)、腎癌(renal cancer)、唾液腺癌(salivary gland cancer)、肉瘤樣癌(sarcomatoid carcinoma)、乙狀結腸癌(sigmoid cancer)、鼻竇癌(sinus cancer)、皮膚癌(skin cancer)、軟組織肉瘤(soft tissue sarcoma)、鱗狀細胞癌(squamous cell carcinoma)、胃腺瘤(stomach adenocarcinoma)、頜下腺癌(submandibular gland cancer)、胸腺癌(thymic cancer)、胸腺瘤(thymoma)、甲狀腺癌(thyroid cancer)、舌癌(tongue cancer)、扁桃體癌(tonsillar cancer)、移行細胞癌(transitional cell carcinoma)、子宮癌(uterine cancer)、子宮肉瘤(uterine sarcoma)、或惡性子宮肌瘤(uterus leiomyosarcoma)。在一些實施例中,該樣本來自孕婦、兒童、青少年、老年人或成年人。在一些實施例中,該樣本是一研究樣本。在一些實施例中,該樣本來自一組樣本。在一些實施例中,該組樣本來自相關物種。在一些實施例中,該組樣本來自不同物種。
在一些實施例中,該機器學習模型是藉由使用具有MSI狀態資料及MSI特徵資料的一訓練資料組(training set)進行訓練。
在一些實施例中,該次世代定序系統包括但不限於Illumina公司製造的MiSeq、HiSeq、MiniSeq、iSeq、NextSeq、及NovaSeq定序儀,Life Technologies公司製造的Ion Personal Genome Machine (PGM)、Ion Proton、Ion S5系列、及Ion GeneStudio S5系列,以及BGI公司製造的BGIseq系列、DNBseq系列及MGIseq系列,以及由Oxford Nanopore Technologies公司製造的MinION/PromethION定序儀。
在一些實施例中,定序片段(sequencing reads)是由初始樣本擴增後的核酸或用誘餌(bait)捕獲的核酸而產生。在一些實施例中,該定序片段是從需要添加一轉接子序列(adapter sequence)的定序儀所產生。在一些實施例中,該定序片段是從包括但不限於下列的方法所產生:雜交捕獲(hybrid capture)、引子延伸目標擴增(primer extension target enrichment)、基於分子倒位探針(molecular inversion probe)的方法、或多重目標特異性PCR (multiplex target-specific PCR)。
另一方面,本揭露大體上係關於一種測定MSI狀態的系統。該系統包含一資料儲存裝置,該裝置儲存有用於測定MSI狀態特徵的指令,以及一處理器,該處理器被設置成執行指令以運行一方法。該方法包含以下步驟: (a) 訓練一機器學習模型,其中該機器學習模型將一個或多個MSI特徵的訓練資料與一供訓練用的預估所得MSI狀態資料彼此對應; (b) 收集來自一人類個體的一臨床樣本; (c) 透過使用次世代定序(NGS)對該臨床樣本的至少六個微衛星位點進行定序,以產生一定序資料; (d) 藉由將從該定序資料中擷取出的一MSI特徵資料導入經過訓練的該機器學習模型,以運算MSI狀態;及 (e) 輸出一運算所得MSI狀態資料。
以下將詳細討論本發明實施例的製作及運用。然而,應當理解的是,該些實施例提供了許多可應用的發明概念,其能在各種特定情況下實施。所討論的特定實施例只是說明製造和使用該些實施例的具體方法,但不限制本揭露的範圍。
除非另有定義,本文中使用的所有技術及科學術語具有與本揭露所屬技術領域中熟習技藝者通常理解的相同含義。除非上下文另有明確指示,本文中所使用的單數形式「一」、「一個」及「該」包含複數指稱。
本文中所用的「微衛星」意指一個重複性DNA片段,其中某些DNA序列單元是重複的。「微衛星位點」係指該微衛星的區域。在文義許可的情況下,術語「微衛星 」和「SSR」以及「微衛星位點」和「SSR區域」分別可以互換使用。 在本發明的一些實施例中,微衛星位點或SSR區域的類型係指核苷酸序列中的單、雙、三、四或五核苷酸的重複或某些複合核苷酸類型。較佳地,微衛星位點或SSR區域的類型係指至少重複十次的單核苷酸、至少重複六次的雙核苷酸、至少重複五次的三核苷酸、至少重複五次的四核苷酸、至少重複五次的五核苷酸、以及包括但不限於SEQ ID NOs: 1-37的複合核苷酸類型。
本文中所用「MSI狀態」或「MMR狀態」係指有「MSI」或「不穩定微衛星(位點)」的存在,即微衛星中有細胞群落(clonal)或體細胞(somatic)之重複性DNA核苷酸單元的數量變化。本揭露中的預估所得MSI狀態係為MSS或MSI-H。「MSI-H」係指存在於微衛星位點中的重複片段數與正常細胞DNA中的重複片段數有顯著差異的情況。「MSS」係指沒有DNA錯配修復的功能缺陷,並且微衛星位點中的重複片段數在腫瘤與正常細胞間沒有顯著差異的情況。
本文中所用「閾值(cutoff value)」或「臨界點(threshold) 」係指用於區分一生物樣本的兩個或多個分類狀態的一數值或其他表示方法。在本發明的一些實施例中,閾值是依據機器學習模型的訓練結果而設定,用於區分MSI-H和MSS。如果MSI分數大於閾值,則MSI狀態被判定為MSI-H;或者如果MSI分數小於閾值,則MSI狀態被判定為MSS。
本文中所用「波峰(peak)」係指微衛星位點中的微衛星分布型態(distribution pattern)。可以使用使次世代定序產生的資料對波峰進行分析,其中,每個微衛星位點內的等位基因(allele)重複序列長度的數目稱為波峰寬度,最常被觀察到的等位基因的讀取數(read counts)被稱為波峰高度,而腫瘤組織與參考基因體中個別微衛星位點不同的波峰高度的位置被稱為波峰位置。在本發明的一些實施例中,波峰寬度、波峰高度、或波峰位置被用作估計MSI狀態的MSI特徵。
如圖1(a)至1(c)所示,每個位點是一個短重複序列。當以PCR及Sanger定序或藉由次世代定序(NGS)方法測定時,每個微衛星位點顯示出一種波峰型態。一個波峰可以用其波峰寬度、波峰高度及波峰位置作為表徵。當一個微衛星位點變得不穩定時,其波峰寬度、波峰高度及/或波峰位置可能會發生變化。圖中,X軸顯示每個波峰訊號代表的等位基因。例如,在圖1(a)中,第一個訊號表示在該微衛星位點上的等位基因有8個核苷酸A的重複。該波峰具有的寬度為5,波峰高度約為35%,波峰位置為11A。波峰位置也可以用在染色體上的位置來描述,例如4號染色體:55598211 (chr4:55598211)。y軸顯示某一波峰訊號相對其他波峰訊號的讀取次數的百分比。因此,某一波峰的波峰高度之和為1。圖1(a)顯示,當一位點變得不穩定時,其波峰寬度從5變寬至8的波峰分布。圖1(b)顯示,當一波峰不穩定時,波峰高度可能會變低。在這個例子中,波峰高度從50%變成25%。圖1(c)顯示,當一波峰不穩定時,波峰位置可能會改變。在這個例子中,波峰位置從11A變成13A。
一般而言,為了知曉MSI狀態,會進行成對比對分析以確定腫瘤中相比配對的正常組織有所差異的微衛星位點。本文中所用的「配對的正常組織」或「正常的成對組織」係指來自同一病患的正常組織。然而,在本發明的一些實施例中,機器學習模型在沒有配對的正常組織的情況下,由NGS資料檢測MSI狀態。使用一匯集的正常樣本建立正常群體中每個SSR區域的MSI特徵的平均值,以作為MSI檢測的基線。將來自單個臨床腫瘤組織的資料與該基線資料的波峰型態相比較,以判定該樣本中每個SSR區域的微衛星狀態。
本文中所用「腫瘤純度(tumor purity)」是一腫瘤樣本中的癌細胞占比。腫瘤純度會影響使用NGS方法所測定的分子與基因體學特徵的準確評估。 在本發明的一些實施例中,臨床樣本的腫瘤純度為至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%。較佳地,本揭露的樣本的腫瘤純度為至少20%。
本文中所用「深度(depth)」或「總深度」係指每一位置的定序片段數。「平均深度」、「平均總深度」或「總平均深度」係指整個定序區域的平均片段數。一般而言,總平均深度對NGS檢測的效能有影響。總平均深度越高,突變的變異頻率的變異性越低。在本發明的一些實施例中,樣本整個定序區域的平均深度為至少200x、300x、400x、500x、600x、700x、800x、900x、1000x、2000x、3000x、4000x、5000x、6000x、8000x、10000x、或20000x。較佳地,樣本整個定序區域的平均深度為為至少500x。
本文中所用「定序覆蓋率(coverage)」係指在某一位點的總深度,其可與「深度」互換使用。在本發明的一些實施例中,「定序覆蓋率低」意指在一樣本的一位點的定序深度(read depth)低於5x、10x、15x、20x、25x、30x、35x、40x、45x、或50x。
本文中所用「目標鹼基定序覆蓋率(target base coverage)」係指以高於一預定值的深度進行定序的區域所占的百分比。目標鹼基定序覆蓋率需要指出進行評估時的深度。在一些實施例中,100x時的目標鹼基定序覆蓋率是85%,此表示85%的定序目標鹼基被深度為至少100x的定序片段所覆蓋。在一些實施例中,30x、40x、50x、60x、70x、80x、90x、100x、125x、150x、175x、200x、300x、400x、500x、750x、1000x時的目標鹼基定序覆蓋率是高於70%、75%、80%、85%、90%或95%。
本文中所用「人類個體(human subject)」係指被正式診斷出疾病的人、未被正式確認疾病的人、接受醫療關注的人、有罹病風險的人等。
本文中所用「治療(treat)」、「療法(treatment)」及「治療(treating)」包括治療性治療、預防性治療以及減少個體患病風險或降低其他風險因子的處置。治療不要求完全治癒疾病,而是涵蓋減輕症狀或潛在風險因子的實施例。
本文中所用「治療有效量(therapeutically effective amount)」係指引起所期望的生物或臨床效果所需的治療活性分子的量。在本發明的較佳實施例中,「治療有效量」是治療具備MSI-H的癌症患者所需的藥物量。
本揭露將藉由以下實施例進一步說明,該些實施例的目的是示範而非限制。實施例
實施例 1 訓練用於檢測 MSI 狀態的機器學習模型
福馬林固定石蠟包埋(FFPE)樣本是從癌症患者身上經由手術或穿刺活體組織檢體(needle biopsy)製備而得。使用QIAamp DNA FFPE Tissue套組(QIAamp DNA FFPE Tissue Kit;QIAGEN,Hilden,德國)提取基因體DNA。使用多重PCR,以440個基因和1.8 Mbps的範疇為目標,對80 ng的DNA進行擴增。使用Ion Proton或Ion S5 Prime系統(Thermo Fisher Scientific,Waltham,MA)及Ion PI或540晶片(Thermo Fisher Scientific,Waltham,MA)依據製造商建議的作業程序對樣本進行定序。原始序列讀值經過製造商提供的軟體Torrent Variant Caller (TVC) v5.2處理,並生成.bam和.vcf檔案。
(1) 選擇候選位點
使用MIcroSAtellite識別工具(MISA;Beier, Thiel, Munch, Scholz, & Mascher, 2017),辨識染色體區域中被ACTOnco Panel檢測所覆蓋的SSR區域。 MISA辨識出總共600個SSR區域,包括至少重複十次的單核苷酸、至少重複六次的雙核苷酸、至少重複五次的三核苷酸、至少重複五次的四核苷酸、至少重複五次的五核苷酸、以及複合核苷酸類型。 表1提供了複合SSR區域的序列。
表1 複合微衛星位點
SEQ ID NO 微衛星序列 長度 (bp)
1 (A)11(T)10 21
2 (CA)10ctctctctct(CA)6ctcagt(CA)13 74
3 (AC)7atacttc(T)12 33
4 (TA)12(T)21 45
5 (A)19caaac(A)11 35
6 (T)16(TG)8 32
7 (A)10(AT)9 28
8 (AT)6tcttttctctatacatttatgcaaacttgcatttgatgacatcatattttgcagg(T)10 77
9 (T)10ctttttc(T)12 29
10 (TG)9(AG)9acagagac(AG)6 56
11 (T)10acaagaccatttttcattatgaatttgtaccatgtgtcagcacc(T)14 68
12 (GATG)10(GACG)5 60
13 (CAC)5catgc(CCA)6 38
14 (CAG)7caa(CAG)7 45
15 (A)12c(A)12 25
16 (AC)14(CA)7 42
17 (A)11g(A)10 22
18 (CT)8ata(TG)6(TA)6 43
19 (TG)9(AG)11 40
20 (TG)7tatgtatgtg(TA)7tc(TA)6gat(ATAG)6 79
21 (A)13gaaaaag(A)11 31
22 (TA)11(T)10 32
23 (T)10caatccattcagacaactt(TTG)6ttttgtgtttttcggtg(T)11 75
24 (GCT)7gaagttgctgttgctgttgca(GCT)5 57
25 (ATG)8ataatgatgatagct(ATG)6 57
26 (A)12t(TA)11tttcgtggcaa(T)19 65
27 (T)11caaactttctc(T)14 36
28 (A)14gggaatagatact(A)14 41
29 (T)12cc(T)13 27
30 (T)27(GA)6 39
31 (TG)9(T)25 43
32 (T)11(A)11 22
33 (A)12g(A)10gaa(AAG)7 47
34 (AC)6(GC)6(AC)16 56
35 (TCTG)5(TC)10(TA)8 56
36 (GA)10ggg(AAAT)11 67
37 (TG)11tttttt(C)11(T)11 50
注:括弧內的大寫字母序列是重複序列,其重複次數由其後的數字表示。不在括弧內的小寫字母序列是在一被識別位點內的兩個重複區域之間的序列。
我們首先檢查每個SSR區域的染色體位置。共有34個SSR位點被發現是位於X染色體上,將其排除在外。
為了開發用於ACTOnco檢測的穩健的MSI預測演算法,我們計畫自餘下的566個候選位點中,僅將在臨床FFPE樣本表現出可重複的波峰型態的SSR區域納入預測模型。為了識別不同次定序量測中具有良好可重複性的SSR,我們對一組10個FFPE臨床樣本的6次重複量測中,檢視其566個SSR區域的定序覆蓋率和波峰型態。
為了使該預測模型只納入每個SSR區域內的高可信度片段,在一樣本的一個位點的最小定序深度必須為30x。此外,當測定一SSR區域內不同長度的重複序列的總數(波峰寬度),一重複序列長度需有至少5%的等位基因頻率才會被納入。例如,對於具有單核苷酸重複片段的位點的一樣本,如果檢測到15個鹼基的等位基因頻率為2%,16個鹼基的等位基因頻率為10%,17個鹼基的等位基因頻率為20%,18個鹼基的等位基因頻率為30%,19個鹼基的等位基因頻率為20%,20個鹼基的等位基因頻率為10%,及21個鹼基的等位基因頻率為8%,那麼不同長度的重複片段的總數(波峰寬度)將是6,長度為15個鹼基者不被計算在內。
我們排除了138個SSR區域,因為它們的定序覆蓋率低(該些SSR區域的片段數<30)、波鋒訊號不穩定(在任一次定序中有波峰寬度資料缺失)、波峰寬度高變異性(在6次重複量測中波峰寬度的變異大於3)或貢獻權重低(MSI特徵資料中對預測模型的貢獻為最後5%)。餘下的428個微衛星位點被用於後續建立基線及訓練模型。
(2) 建立基線
對所有428個位點建立群體基線。使用Ion Proton定序儀所定序的77個正常樣本的平均波峰寬度建立一基線。Ion S5 Prime定序儀所定序的81個正常樣本的平均波峰寬度被用於建立另一基線。MSI基線是基於正常群體中的每個SSR區域的平均波峰寬度而建立。同時亦計算每個候選位點的波峰寬度的標準差。對於某個位點,如果一特定臨床樣本與基線之間的波峰寬度差距落在2個標準差之外,則認定該位點不穩定。總不穩定位點百分比係以不穩定位點的數目除以所用位點的總數來計算。
(3) MSI預測模型及模型驗證
由Ion Proton及Ion S5 Prime所定序的共122個結腸直腸癌樣本(FFPE樣本)被用於訓練機器學習模型。基於5標記MSI-PCR檢測系統(Promega MSI Analysis System, version 1.2),這些樣本中的76個是MSS樣本,46個是的MSI-H樣本。每個樣本中,定序深度小於30x的位點不考慮用於訓練模型,而是被列為缺失資訊。此外,為了測定一SSR區域的波峰寬度,一重複序列長度(等位基因)的等位基因頻率需為至少5%,才會被納入模型的訓練。MSS基線和臨床樣本之間的波峰寬度差異被用於下列邏輯式回歸模型的計算。
MSI狀態 (MSS/MSI-H) = β0 + β1位點1+ β2位點2 + β3位點3 + …… + β428位點428 其中β是一權重。
我們將122筆訓練資料按7:3的比例進行訓練和測試,並且隨機分配樣本以進行1000次訓練及測試的反覆運算。由於樣本小,該122筆訓練資料皆被用於閾值的設定。用於設定閾值的MSI分數之計算是透過選定在1000次反覆運算中每個樣本作為測試資料時的MSI分數中位數(the median MSI score)。模型性能的ROC曲線如圖2所示。依據分析結果,我們決定選擇0.15作為MSI預測模型的閾值,以達到高靈敏度(100%)和高特異性(100%)。
實施例 2 使用 MSI 模型判定癌症樣本的 MSI 狀態
我們接著使用獨立的一組439個臨床FFPE樣本,包括30個MSI-H樣本和409個MSS樣本,來驗證MSI模型的有效性。該些樣本包括但不限於肺癌、結腸直腸癌、乳癌、卵巢癌、胰臟癌、膽管癌、胃癌、膠質母細胞瘤、肉瘤、子宮頸癌、平滑肌肉瘤及脂肪肉瘤。利用同於實施例1所述的方法處理這些樣本,以便對428個位點區域進行定序,平均定序深度為至少500x,≥85%的目標區域達到≥100x的目標鹼基定序覆蓋率。
圖3顯示所得到的MSI-H樣本和MSS樣本的MSI分數有明顯區別。模型驗證的結果表明該模型的陽性一致率(positive percent agreement,PPA)和陰性一致率(negative percent agreement,NPA)分別為93.3%和98.5%。該驗證結果參見表2-5。
表2 臨床樣本的MSI檢測
樣本 ID 癌症種類 腫瘤純度 平均深度 100x 時的目標鹼基定序覆蓋率 MSI 分數 MSI 模型判定的 MSI 狀態 不穩定位點 % 5 位點 PCR 判定的 MSI 狀態
F00173 肺癌 NA 1877 0.97 0.01 MSS 3.49 MSS
F00212 食道癌 50% 900.7 0.94 0.01 MSS 3.94 MSS
F01597 胰臟癌 60% 1488 0.95 0.01 MSS 3.59 MSS
F02095 腺癌 NA 1155 0.96 0.02 MSS 5.01 MSS
F01143 肺癌 40% 1127 0.96 0.06 MSS 3.4 MSS
F01407 原發部位不明癌 5% 1355 0.96 0 MSS 4.81 MSS
E00708 腺樣囊性癌 50% 1454 0.94 0.01 MSS 4.99 MSS
F01911 腺樣囊性癌 45% 983.3 0.96 0.01 MSS 3.33 MSS
F02161 腺樣囊性癌 40% 1238 0.97 0 MSS 3.86 MSS
F01464 腎上腺皮質癌 40% 1174 0.96 0.01 MSS 5.57 MSS
F00249 壺腹周圍瘤 25% 1097 0.96 0.01 MSS 2.21 MSS
F01517 闌尾癌 90% 1441 0.96 0 MSS 4.07 MSI-L
F00507 腦癌 25% 1142 0.96 0.03 MSS 3.5 MSS
F02040 腦癌 30% 2237 0.99 0.05 MSS 5.8 MSS
F01581 基底核膠質瘤 70% 794.5 0.92 0.01 MSS 3.57 MSS
F01530 腦神經膠質瘤 40% 2411 0.97 0.01 MSS 4.58 MSS
F02387 乳癌 NA 1640 0.98 0 MSS 10.52 MSI-L
F02197 乳癌 20% 1226 0.95 0.02 MSS 5.14 MSS
E00086 乳癌 55% 1064 0.94 0.01 MSS 7.1 MSS
E00494 乳癌 30% 1479 0.96 0.02 MSS 7.09 MSS
E00557 乳癌 40% 1525 0.94 0.02 MSS 5.14 MSS
F02573 乳癌 45% 674.4 0.92 0.01 MSS 6.73 MSS
F02092 乳癌 40% 753 0.94 0 MSS 6.2 MSS
F00107 乳癌 20% 1054 0.95 0.02 MSS 5.44 MSS
F01141 乳癌 70% 844.1 0.92 0.01 MSS 5.53 MSS
F01409 乳癌 70% 641.4 0.93 0 MSS 8.08 MSS
F01898 乳癌 35% 1264 0.96 0.01 MSS 4.07 MSS
E00086 乳癌 55% 828.7 0.93 0 MSS 7.81 MSS
F02386 乳癌 55% 1391 0.96 0.01 MSS 8.38 MSS
D01394 乳癌 45% 1003 0.94 0.01 MSS 5.18 MSS
F02385 乳癌 50% 1666 0.97 0.3 MSS 10.28 MSS
D01491 乳癌 65% 1206 0.95 0 MSS 5.63 MSS
F00564 乳癌 80% 1309 0.97 0 MSS 4.63 MSS
F00201 乳癌 80% 1518 0.96 0.02 MSS 3.56 MSS
F01424 乳癌 10% 1247 0.96 0 MSS 3.69 MSS
F00486 乳癌 85% 1605 0.98 0.04 MSS 3.62 MSS
F01178 乳癌 25% 1334 0.96 0.01 MSS 3.33 MSS
F01459 乳癌 40% 1265 0.95 0.02 MSS 4.31 MSS
F01333 乳癌 60% 1414 0.97 0.02 MSS 4.03 MSS
F00110 乳癌 70% 1812 0.97 0.02 MSS 6.42 MSS
F00678 乳癌 50% 1936 0.98 0 MSS 3.27 MSS
F01362 乳癌 85% 1634 0.94 0.03 MSS 5.79 MSS
F01468 乳癌 60% 1009 0.93 0.01 MSS 7.29 MSS
F00817 乳癌 NA 2227 0.97 0.01 MSS 4.36 MSS
F01130 乳癌 40% 2128 0.98 0 MSS 3.09 MSS
F01933 乳癌 15% 1042 0.94 0.06 MSS 6.12 MSS
F02365 乳癌 60% 1498 0.98 0.01 MSS 5.63 MSS
F02208 頰癌 40% 861.3 0.94 0.01 MSS 4.26 MSS
D01571 膀胱癌 65% 886.3 0.95 0.02 MSS 5.46 MSS
E00495 結腸癌 55% 1574 0.88 0.01 MSS 10.3 MSS
F00369 食道癌 50% 2115 0.96 0.01 MSS 2.8 MSS
F00716 前列腺癌 75% 2231 0.97 0.04 MSS 5.81 MSI-L
F01155 直腸癌 60% 708.6 0.92 0.01 MSS 4.17 MSS
E00705 胃癌 40% 1045 0.94 0.04 MSS 6.94 MSS
F00426 子宮肉瘤 90% 1122 0.94 0.01 MSS 4.91 MSS
D01878 子宮頸癌 60% 1302 0.95 0.01 MSS 6.62 MSS
D01878 子宮頸癌 60% 1671 0.95 0.03 MSS 6.17 MSS
D01870 子宮頸癌 40% 876.5 0.94 0.01 MSS 10.31 MSS
D01870 子宮頸癌 40% 969.7 0.95 0 MSS 5.76 MSS
E00208 子宮頸癌 55% 840.8 0.94 0.01 MSS 11.47 MSS
F01426 子宮頸癌 70% 991.8 0.94 0 MSS 4.73 MSS
F01287 子宮頸癌 25% 1663 0.96 0.02 MSS 3.33 MSS
E01827 膽管癌 25% 1217 0.96 0.11 MSS 6.57 MSS
F00381 膽管癌 60% 1498 0.96 0.03 MSS 6.25 MSS
E00224 膽管癌 60% 883.4 0.94 0 MSS 5.12 MSS
F00137 膽管癌 50% 1021 0.96 0.01 MSS 3.89 MSS
F01536 膽管癌 60% 1068 0.95 0 MSS 4.1 MSS
F02049 膽管癌 15% 1348 0.96 0.01 MSS 4.49 MSS
F02132 膽管癌 10% 1949 0.98 0.01 MSS 6.38 MSS
F02086 軟骨肉瘤 60% 764.2 0.94 0.01 MSS 6.45 MSS
E00167 腦癌 85% 541.1 0.88 0 MSS 7.25 MSI-L
F00844 卵巢癌 90% 1100 0.97 0 MSS 3.34 MSS
F02495 結腸癌 30% 1360 0.97 0.01 MSS 4.38 MSS
F02346 結腸癌 15% 2403 0.98 0 MSS 9.65 MSS
D01774 結腸癌 60% 706.8 0.94 0.03 MSS 5.48 MSS
D01124 結腸癌 NA 1488 0.95 0.02 MSS 4.11 MSS
F00409 結腸癌 15% 1215 0.96 0.01 MSS 3.73 MSS
F00556 結腸癌 50% 1227 0.95 0.01 MSS 3.36 MSS
F00003 結腸癌 35% 1349 0.95 0.02 MSS 7.12 MSS
F01115 結腸癌 30% 1727 0.96 0.04 MSS 4.39 MSS
F02580 結腸癌 15% 1487 0.95 0.01 MSS 3.59 MSS
F01402 結腸癌 10% 2262 0.98 0.03 MSS 4.14 MSS
F02414 結腸癌 35% 1600 0.98 0.01 MSS 4.37 MSS
F02071 結腸癌 5% 1430 0.95 0.02 MSS 6.45 MSS
D00846 NA NA 511.8 0.93 1 MSI-H 24.47 MSI-H
D00923 NA NA 608.8 0.94 1 MSI-H 17.92 MSI-H
D00854 NA NA 674.8 0.94 0.99 MSI-H 18.3 MSI-H
D00927 NA NA 712.1 0.94 1 MSI-H 19.81 MSI-H
D00932 NA NA 716.2 0.95 0.99 MSI-H 20.57 MSI-H
D00938 NA NA 755.2 0.95 1 MSI-H 25.18 MSI-H
D00868 NA NA 768.1 0.95 0.96 MSI-H 18.66 MSI-H
D00881 NA NA 788.4 0.95 1 MSI-H 17.57 MSI-H
D00848 NA NA 803.9 0.95 1 MSI-H 17.2 MSI-H
D00900 NA NA 815.9 0.95 0.02 MSS 6.21 MSI-H
D00849 NA NA 821.8 0.96 1 MSI-H 26.77 MSI-H
D00895 NA NA 828.2 0.95 0.97 MSI-H 17.29 MSI-H
D00864 NA NA 864.1 0.95 1 MSI-H 20.08 MSI-H
D00918 NA NA 906.7 0.96 1 MSI-H 13.6 MSI-H
D00847 NA NA 979.4 0.96 1 MSI-H 18.6 MSI-H
D00893 NA NA 986.2 0.96 0.99 MSI-H 18.48 MSI-H
D00879 NA NA 1054 0.96 0.99 MSI-H 12.45 MSI-H
D00926 NA NA 1116 0.97 0.99 MSI-H 20.11 MSI-H
D00915 NA NA 1330 0.95 0.79 MSI-H 20.98 MSI-H
D00878 NA NA 1377 0.96 0.87 MSI-H 14.44 MSI-H
D00873 NA NA 1498 0.96 0.16 MSS 10.17 MSI-H
D00909 NA NA 1575 0.96 0.05 MSS 13.73 MSI-H
D00853 NA NA 1995 0.97 0.76 MSI-H 9.26 MSI-L
F00124 結腸直腸癌 90% 1058 0.94 0.01 MSS 4.58 MSI-L
F01012 結腸直腸癌 10% 592.7 0.94 0.01 MSS 6.49 MSS
F01495 結腸直腸癌 40% 857.8 0.96 0 MSS 7.28 MSS
F01460 結腸直腸癌 35% 1731 0.97 0.01 MSS 5.44 MSS
F01944 結腸直腸癌 15% 3667 0.98 0.01 MSS 3.99 MSI-L
F01080 直腸癌 60% 1735 0.98 0 MSS 3.27 MSS
F02388 囊管癌 40% 1328 0.98 0.01 MSS 7.35 MSS
F01194 去分化脂肪肉瘤 85% 1144 0.94 0 MSS 4.17 MSS
F00950 硬纖維瘤 50% 1675 0.97 0.01 MSS 2.92 MSS
F00211 彌漫性中線膠質瘤 70% 945.6 0.95 0.07 MSS 4.31 MSS
F00713 子宮內膜癌 50% 1006 0.95 0.01 MSS 4.49 MSS
F00318 子宮內膜癌 60% 2074 0.97 0.06 MSS 1.83 MSS
F01480 子宮內膜癌 30% 948.9 0.94 0.23 MSS 11.22 MSI-L
F01425 食道癌 20% 965.4 0.93 0.02 MSS 4.1 MSS
F01313 食道癌 25% 629 0.94 0.03 MSS 11.74 MSS
F00145 食道癌 10% 1452 0.94 0.02 MSS 4.19 MSS
F01089 食道癌 75% 1146 0.93 0.01 MSS 5.74 MSS
F01383 骨骼外軟骨母細胞骨肉瘤 65% 1708 0.95 0 MSS 3.74 MSS
F01410 眼瞼皮脂腺癌 40% 1019 0.96 0.09 MSS 3.53 MSS
E02217 輸卵管癌 85% 1394 0.95 0.43 MSS 6.18 MSI-H
F01537 膽囊癌 40% 1317 0.95 0.09 MSS 3.74 MSS
D00304 胃癌 13% 836.6 0.95 0.03 MSS 9.21 MSS
F02397 胃癌 15% 1326 0.98 0.01 MSS 7.4 MSS
F00108 胃癌 15% 1571 0.97 0.02 MSS 7.26 MSS
F00292 胃癌 20% 1809 0.98 0.04 MSS 5.47 MSS
F01291 胃癌 55% 1156 0.97 0.05 MSS 4.77 MSS
E00545 多形性膠質母細胞瘤 70% 2408 0.96 0 MSS 4.22 MSS
F01907 多形性膠質母細胞瘤 40% 1389 0.97 0 MSS 5.08 MSS
F01781 多形性膠質母細胞瘤 45% 1370 0.95 0.01 MSS 5.66 MSI-L
F00041 多形性膠質母細胞瘤 65% 1169 0.95 0.08 MSS 3.62 MSS
F00766 多形性膠質母細胞瘤 80% 648.3 0.93 0.02 MSS 5.38 MSS
F01073 多形性膠質母細胞瘤 50% 1138 0.95 0.02 MSS 2.62 MSS
F00345 多形性膠質母細胞瘤 60% 1715 0.96 0 MSS 4.1 MSS
F00120 多形性膠質母細胞瘤 45% 1318 0.96 0.01 MSS 4.81 MSI-L
F02320 胃腸道基質瘤 70% 1114 0.95 0 MSS 5.61 MSS
F00620 胃腸道基質瘤 65% 602.6 0.88 0.01 MSS 7.75 MSS
F02142 胃腸道基質瘤 80% 1187 0.96 0.01 MSS 5.24 MSS
E00413 肝細胞癌 70% 1461 0.96 0.01 MSS 2.59 MSS
F00052 肝細胞癌 90% 1240 0.96 0.03 MSS 3.68 MSS
F01560 肝細胞癌 60% 1723 0.97 0.02 MSS 2.93 MSS
F00881 肝細胞癌 35% 789.9 0.93 0.02 MSS 5.02 MSS
F00882 膽管癌 40% 835.6 0.94 0.03 MSS 5.7 MSS
E00787 高惡性度膠質瘤 40% 729.1 0.93 0.01 MSS 3.85 MSS
E00421 內膜肉瘤(intima sarcoma) 90% 1097 0.95 0.01 MSS 3.2 MSS
E00421 內膜肉瘤 90% 840.8 0.94 0.01 MSS 5.33 MSS
F02066 侵襲性乳腺管癌 50% 1065 0.96 0.02 MSS 5.6 MSS
F01380 腎癌 85% 1627 0.97 0.03 MSS 4.92 MSS
E01811 平滑肌肉瘤 45% 1627 0.97 0.01 MSS 12.84 MSS
F02519 平滑肌肉瘤 90% 1298 0.96 0 MSS 9.94 MSS
E00237 平滑肌肉瘤 85% 1108 0.94 0.01 MSS 10.19 MSS
F02519 平滑肌肉瘤 90% 1298 0.96 0 MSS 9.94 MSS
F02065 平滑肌肉瘤 75% 1016 0.97 0.03 MSS 5.51 MSS
F00988 平滑肌肉瘤 90% 544.3 0.93 0.07 MSS 9.47 MSS
D00546 脂肪肉瘤 98% 1090 0.96 0.01 MSS 11.5 MSS
F02026 脂肪肉瘤 90% 1234 0.97 0 MSS 6.04 MSS
F00942 脂肪肉瘤 75% 1152 0.96 0.05 MSS 4.82 MSS
F00805 脂肪肉瘤 40% 1260 0.96 0.03 MSS 6.36 MSS
F00962 脂肪肉瘤 90% 1511 0.96 0 MSS 3.56 MSS
F01154 肝癌 NA 1929 0.96 0.01 MSS 3.53 MSS
F02019 肝臟血管肉瘤 5% 964.5 0.95 0.02 MSS 4.17 MSS
F01489 肝癌 55% 1219 0.97 0.01 MSS 3.49 MSS
E00811 肺癌 10% 660.2 0.95 0 MSS 5.93 MSS
E00695 肺癌 5% 861.3 0.94 0.01 MSS 5.47 MSS
F00593 肺癌 40% 948.3 0.95 0 MSS 9.51 MSS
F00679 肺癌 0% 1137 0.95 0.05 MSS 7.87 MSS
E00704 肺癌 60% 1415 0.96 0.01 MSS 7.02 MSS
F01960 肺癌 3% 1474 0.96 0.22 MSS 8.67 MSI-H
E00561 肺癌 85% 1522 0.96 0.01 MSS 4.25 MSS
E01825 肺癌 35% 1598 0.97 0 MSS 6.49 MSS
F01282 肺癌 50% 1840 0.96 0.01 MSS 3.11 MSS
F02483 肺癌 10% 1297 0.96 0.01 MSS 9.29 MSS
F00269 肺癌 2% 811.8 0.95 0.03 MSS 7.33 MSI-L
F00815 肺癌 60% 1410 0.96 0.01 MSS 4.28 MSS
F02497 肺癌 10% 1491 0.96 0.01 MSS 3.56 MSS
F00758 肺癌 60% 1154 0.95 0.2 MSS 17.29 MSS
F01494 肺癌 15% 1329 0.96 0.01 MSS 6.2 MSI-L
F02514 肺癌 40% 2222 0.97 0.02 MSS 3.49 MSS
F01321 肺癌 80% 1498 0.97 0.04 MSS 5.45 MSS
F01196 肺癌 35% 1639 0.96 0.04 MSS 8.52 MSS
F01151 肺癌 15% 1813 0.96 0.03 MSS 2.79 MSI-L
F02043 肺癌 30% 1162 0.97 0.07 MSS 7.08 MSS
F02483 肺癌 10% 1297 0.96 0.01 MSS 9.29 MSS
F02096 肺癌 55% 1710 0.95 0.02 MSS 6.24 MSS
D01492 肺癌 65% 714.5 0.93 0.02 MSS 5.56 MSS
F01782 肺癌 20% 2187 0.96 0 MSS 6.15 MSS
E00639 肺癌 45% 1619 0.96 0.01 MSS 4.34 MSS
F00946 肺癌 35% 757.1 0.93 0.06 MSS 8.66 MSS
F00251 肺癌 60% 871.1 0.97 0.11 MSS 5.19 MSS
F00762 肺癌 30% 543.8 0.93 0.02 MSS 5.96 MSS
F00159 肺癌 70% 1085 0.95 0.02 MSS 3.93 MSS
F00317 肺癌 50% 1142 0.96 0.01 MSS 4.07 MSS
F00790 肺癌 10% 742.8 0.95 0.04 MSS 6.65 MSS
F00141 肺癌 45% 1302 0.96 0 MSS 4.26 MSI-L
F00892 肺癌 40% 1213 0.95 0.06 MSS 4.51 MSS
F00895 肺癌 30% 1256 0.96 0.08 MSS 4.98 MSS
F00286 肺癌 15% 1416 0.95 0.13 MSS 4.84 MSS
F00654 肺癌 35% 1471 0.95 0.01 MSS 3.37 MSS
F00114 肺癌 25% 1499 0.97 0.01 MSS 5.74 MSS
F00479 肺癌 55% 1511 0.95 0 MSS 5.45 MSS
F01596 肺癌 60% 921.1 0.94 0.01 MSS 4.34 MSI-L
F00408 肺癌 60% 1636 0.96 0.01 MSS 4.41 MSS
F00994 肺癌 30% 911.5 0.94 0.01 MSS 4.18 MSS
F00038 肺癌 20% 1930 0.98 0.01 MSS 3.24 MSS
F00675 肺癌 15% 1836 0.97 0.01 MSS 3.48 MSS
F00610 肺癌 50% 1613 0.98 0.01 MSS 3.26 MSS
F00509 肺癌 40% 1872 0.96 0 MSS 4.24 MSS
F00559 肺癌 20% 1947 0.98 0.12 MSS 3.43 MSS
F02212 肺癌 25% 697.5 0.94 0.03 MSS 9.35 MSS
F00856 肺癌 85% 1557 0.96 0.03 MSS 5.36 MSS
F00413 肺癌 35% 1998 0.98 0.03 MSS 4.55 MSS
F01404 肺癌 25% 927.3 0.96 0 MSS 6.65 MSS
F02060 肺癌 20% 857 0.96 0 MSS 6.48 MSS
F01116 肺癌 10% 1303 0.95 0 MSS 3.36 MSS
F01290 肺癌 8% 1284 0.96 0.01 MSS 5.52 MSS
F00412 肺癌 25% 2380 0.98 0.05 MSS 4.71 MSS
F00894 肺癌 5% 1863 0.96 0.08 MSS 2.99 MSS
F00725 肺癌 40% 2578 0.99 0.03 MSS 4.68 MSS
F02579 肺癌 30% 1345 0.96 0.01 MSS 3.02 MSS
F02296 肺癌 10% 1670 0.96 0 MSS 5.91 MSS
F01125 肺癌 65% 2208 0.97 0.02 MSS 4.03 MSS
F01109 肺癌 80% 1961 0.96 0.01 MSS 2.77 MSS
F01163 胰臟癌 10% 1497 0.96 0.01 MSS 6.33 MSS
E00784 肉瘤樣癌 10% 1339 0.95 0.02 MSS 4.1 MSS
F00712 黑色素瘤 80% 1611 0.97 0.01 MSS 14.18 MSS
F00712 黑色素瘤 80% 720.3 0.94 0.01 MSS 3.01 MSS
F00040 腦膜瘤(meningioma) 85% 2058 0.98 0.01 MSS 2.89 MSS
F02202 卵巢癌 NA 1683 0.97 0.08 MSS 4.04 MSS
E00674 乳癌 40% 3108 0.95 0.06 MSS 4.11 MSS
E00674 乳癌 40% 1168 0.95 0 MSS 3.72 MSS
F02451 上皮樣橫紋肌肉瘤 75% 1211 0.97 0.02 MSS 4.66 MSS
F02478 黑色素瘤 25% 1808 0.96 0.02 MSS 3.9 MSS
F01075 胰臟癌 20% 2340 0.98 0.03 MSS 2.52 MSS
F00793 扁桃體癌 35% 670.8 0.92 0.02 MSS 5.71 MSS
F01305 原發部位不明轉移癌 35% 1654 0.98 0.01 MSS 2.53 MSS
F01576 原發部位不明轉移癌 10% 1042 0.95 0.02 MSS 3.38 MSS
F00585 鼻咽癌 50% 1482 0.96 0.02 MSS 7.42 MSS
F01438 鼻咽癌 30% 1519 0.97 0.01 MSS 5.63 MSS
F02024 肺癌 3% 1718 0.97 0 MSS 9.44 MSS
F02429 腺癌 40% 672.9 0.95 0.05 MSS 6.03 MSS
F02329 肺癌 35% 1508 0.94 0 MSS 7.9 MSS
F00414 非小細胞肺腺癌 85% 1062 0.97 0 MSS 4.39 MSS
F00673 非小細胞肺腺癌 65% 995 0.93 0.04 MSS 6.8 MSS
E00744 食道癌 25% 1974 0.96 0 MSS 9.26 MSS
F00288 口咽癌 50% 838.3 0.95 0.03 MSS 4.29 MSS
F01785 骨肉瘤 35% 1004 0.91 0 MSS 3.68 MSS
F02155 卵巢癌 40% 2518 0.99 0.03 MSS 3.93 MSS
D01410 卵巢癌 70% 757.5 0.94 0.38 MSS 15.75 MSI-H
F01265 卵巢癌 60% 1101 0.96 0.02 MSS 5.02 MSS
E00608 子宮內膜癌 40% 1611 0.96 0.04 MSS 2.41 MSS
F02083 卵巢癌 50% 837.3 0.94 0.01 MSS 5.64 MSS
F00893 卵巢癌 35% 759.7 0.94 0.01 MSS 5.63 MSS
F02494 卵巢癌 85% 1540 0.97 0.02 MSS 5.12 MSS
F01200 卵巢癌 50% 1174 0.94 0.01 MSS 4.73 MSS
F01145 卵巢癌 95% 2072 0.96 0.01 MSS 2.43 MSS
F02390 卵巢癌 35% 1081 0.94 0.11 MSS 9.04 MSS
D00944 卵巢亮細胞癌 85% 1506 0.96 0.01 MSS 5.59 MSI-L
F00298 卵巢癌 60% 1001 0.96 0.05 MSS 3.7 MSS
F00698 卵巢癌 60% 834.9 0.95 0.03 MSS 7.52 MSS
F00724 卵巢癌 20% 1259 0.97 0.01 MSS 3.88 MSS
F00920 卵巢癌 75% 1483 0.97 0.04 MSS 6.42 MSS
F00983 卵巢癌 60% 764.5 0.96 0.01 MSS 8.6 MSS
F01090 卵巢癌 90% 1260 0.96 0.01 MSS 5.45 MSS
F02070 卵巢癌 15% 1281 0.96 0.01 MSS 4.08 MSS
F01467 卵巢癌 35% 1523 0.97 0.01 MSS 5.28 MSI-L
F01763 卵巢癌 NA 1624 0.95 0.03 MSS 4.1 MSS
F01400 卵巢癌 70% 2197 0.98 0.01 MSS 5.1 MSS
F02059 卵巢癌 75% 1710 0.98 0.01 MSS 4.52 MSS
F02010 卵巢癌 70% 854.9 0.94 0 MSS 4.75 MSS
F02194 卵巢癌 70% 1051 0.95 0 MSS 5.28 MSS
F00898 卵巢癌 80% 841.6 0.92 0 MSS 5.8 MSS
F00955 卵巢癌 45% 1547 0.97 0.02 MSS 5.84 MSS
F00900 卵巢癌 40% 1771 0.96 0.05 MSS 5.22 MSS
F02517 卵巢癌 70% 1774 0.98 0.04 MSS 4.39 MSI-L
F02025 胰臟癌 70% 1646 0.97 0 MSS 7.13 MSS
F00880 胰臟癌 25% 1165 0.95 0.04 MSS 5.59 MSS
F00627 胰臟癌 20% 1624 0.96 0.01 MSS 3.58 MSS
F01909 胰臟癌 40% 1231 0.96 0 MSS 5.33 MSS
F00936 胰臟癌 5% 2249 0.98 0.02 MSS 5.23 MSS
F01771 胰臟癌 15% 1912 0.97 0.01 MSS 4.6 MSS
F02526 胰臟癌 35% 1359 0.97 0.01 MSS 8.82 MSS
F02525 胰臟癌 10% 869.2 0.95 0 MSS 3.75 MSS
E00666 胰臟癌 5% 1357 0.94 0.01 MSS 5.75 MSS
F00081 胰臟癌 80% 909.1 0.95 0.01 MSS 9.63 MSS
F01436 胰臟癌 40% 1782 0.97 0.09 MSS 5.28 MSS
F01769 胰臟癌 40% 1557 0.96 0 MSS 4.53 MSS
F00296 胰臟癌 15% 1299 0.97 0.03 MSS 6.04 MSS
F00728 胰臟癌 15% 1570 0.97 0.01 MSS 14.15 MSS
F00788 胰臟癌 15% 1490 0.97 0.02 MSS 3.62 MSS
E01854 甲狀腺乳突癌 40% 1538 0.97 0 MSS 5.96 MSS
F00992 胃癌 50% 1156 0.96 0.01 MSS 3.31 MSI-L
F00834 原發性漿液性腹膜癌 40% 695.5 0.95 0.01 MSS 4.15 MSS
E01902 前列腺癌 5% 1551 0.97 0.02 MSS 8.74 MSS
F02364 前列腺癌 25% 1139 0.97 0.02 MSS 4.78 MSS
F00044 前列腺癌 35% 2999 0.98 0.02 MSS 3.26 MSS
E00755 腎細胞癌 60% 830.9 0.92 0 MSS 12.65 MSS
E00755 腎細胞癌 60% 1279 0.94 0 MSS 3.48 MSS
F00394 腎細胞癌 85% 1182 0.96 0.01 MSS 3.94 MSS
F01081 直腸癌 10% 1240 0.95 0 MSS 5.31 MSS
F00326 直腸癌 50% 1468 0.96 0.01 MSS 2.79 MSS
F02135 直腸癌 10% 2202 0.97 0.01 MSS 4.8 MSS
F00586 直腸癌 25% 1393 0.95 0 MSS 3.74 MSS
F00119 腎癌 60% 1837 0.96 0.01 MSS 4.45 MSS
F00035 子宮癌 45% 1554 0.98 0.06 MSS 3.45 MSS
D02004 皮膚癌 65% 805.9 0.93 0 MSS 13.93 MSS
D02004 皮膚癌 65% 526.5 0.91 0.01 MSS 5.27 MSS
F02332 肉瘤 5% 2019 0.96 0.01 MSS 6.79 MSS
F00987 肉瘤 70% 1701 0.97 0.01 MSS 3.28 MSS
F00887 肉瘤 40% 555.2 0.93 0.03 MSS 6.65 MSS
F00144 肉瘤 60% 1140 0.97 0.02 MSS 3.31 MSS
F00603 肉瘤 10% 1608 0.97 0.1 MSS 4.25 MSS
F01472 肉瘤 50% 1062 0.97 0.03 MSS 3.66 MSS
F01520 肉瘤 80% 1080 0.95 0.01 MSS 3.95 MSS
E01878 乙狀結腸癌 5% 1435 0.92 0.01 MSS 6.12 MSS
F02430 鱗狀細胞癌 40% 903.3 0.95 0 MSS 8.21 MSS
E00318 胃腺瘤 40% 1456 0.96 0.02 MSS 4.81 MSS
F01162 胃癌 10% 920.3 0.94 0.02 MSS 4.91 MSS
F00171 胃癌 10% 1565 0.96 0.02 MSS 3.31 MSS
F01377 胃癌 75% 1421 0.97 0.05 MSS 5.28 MSS
F00274 頜下腺癌 75% 1012 0.97 0.01 MSS 5.17 MSS
F00172 胸腺癌 80% 1273 0.95 0 MSS 3.56 MSS
F01274 胸腺瘤 35% 1109 0.94 0.02 MSS 3.4 MSS
F00245 甲狀腺癌 40% 871.4 0.94 0.05 MSS 3.58 MSS
F02375 乳癌 40% 1242 0.94 0 MSS 4.96 MSS
F00656 乳癌 85% 2417 0.98 0.01 MSS 2.53 MSS
F02369 舌癌 40% 1473 0.96 0.01 MSS 5.54 MSS
E00764 扁桃體癌 50% 1304 0.94 0.01 MSS 6.54 MSS
E00764 扁桃體癌 50% 1655 0.94 0 MSS 2.51 MSS
F01546 移行細胞癌 45% 680.3 0.95 0.02 MSS 6.38 MSI-L
F01014 子宮內膜樣腺癌 40% 1646 0.97 0.03 MSS 3.65 MSS
F00624 惡性子宮肌瘤 40% 1422 0.95 0.02 MSS 3.61 MSS
F01281 下咽癌 60% 2083 0.96 0 MSS 3.53 MSS
F01414 口腔癌 35% 521.5 0.92 0.03 MSS 11.35 MSS
D01425 結腸癌 60% 858.9 0.95 0.01 MSS 5.83 MSS
F01837 子宮內膜癌 25% 1477 0.96 0.93 MSI-H 9.98 MSI-H
F00956 子宮內膜癌 10% 1485 0.95 0 MSS 2.64 MSS
F02435 子宮內膜癌 60% 1934 0.97 0.02 MSS 4.4 MSS
F00891 子宮內膜癌 35% 922.7 0.94 0.01 MSS 6.21 MSS
F01833 平滑肌肉瘤 60% 1693 0.97 0.03 MSS 4.04 MSS
F00763 原發部位不明癌 10% 1383 0.98 0.01 MSS 3.43 MSS
F01174 原發部位不明癌 25% 809 0.94 0.06 MSS 6.79 MSS
F00811 原發部位不明癌 80% 1318 0.97 0.03 MSS 6.07 MSS
F00113 原發部位不明癌 60% 1737 0.96 0.01 MSS 3.31 MSS
F00765 乳癌 70% 1272 0.97 0.01 MSS 4.62 MSS
F01780 甲狀腺癌 10% 703.7 0.92 0 MSS 5.98 MSI-L
F02213 皮膚癌 60% 907.3 0.97 0.01 MSS 4.66 MSS
F02485 卵巢癌 40% 1026 0.95 0.03 MSS 3.82 MSS
F02415 卵巢癌 65% 1581 0.96 0.09 MSS 15.76 MSS
F01318 卵巢癌 20% 1420 0.96 0 MSS 3.66 MSS
F01267 卵巢癌 20% 1729 0.96 0.03 MSS 3.53 MSS
F00696 卵巢癌 70% 828.9 0.94 0.01 MSS 5.36 MSS
F02644 卵巢癌 50% 2333 0.98 0.01 MSS 4.32 MSS
F01519 卵巢癌 40% 1407 0.97 0 MSS 4.61 MSS
D00465 卵巢癌 80% 1545 0.96 0.02 MSS 7.28 MSS
F02189 卵巢癌 35% 1528 0.98 0.06 MSS 3.82 MSS
F02443 卵巢癌/子宮內膜癌 70% 1940 0.97 0 MSS 4.41 MSS
F02100 膽管癌 45% 1639 0.97 0.03 MSS 4.44 MSS
E00771 乳癌 50% 963 0.94 0.02 MSS 14.75 MSS
F00730 乳癌 35% 1905 0.98 0.01 MSS 17.6 MSS
F01173 乳癌 45% 1282 0.95 0.05 MSS 4.36 MSS
F00984 乳癌 35% 1744 0.97 0.07 MSS 3.07 MSS
E00771 乳癌 50% 1238 0.95 0.01 MSS 4.75 MSS
F00985 乳癌 30% 1463 0.96 0.09 MSS 3.94 MSS
F01399 直腸癌 5% 797.4 0.93 0 MSS 4.78 MSS
F01401 直腸癌 30% 1021 0.95 0 MSS 6.77 MSI-L
F01118 肺癌 NA 1564 0.96 0.07 MSS 2.22 MSS
F01539 肺癌/甲狀腺癌 20% 1353 0.98 0.08 MSS 8.01 MSS
F00421 胃癌 50% 1420 0.96 0.01 MSS 4.11 MSS
F01598 胃癌 15% 965.3 0.96 0 MSS 6.02 MSS
F01478 胃癌 20% 683.9 0.95 0.01 MSS 5.42 MSS
F01482 胃癌 15% 760.4 0.94 0.01 MSS 5.83 MSS
F02434 胃癌 25% 879.4 0.95 0.16 MSS 5.28 MSS
F01929 食道癌 65% 547.5 0.92 0 MSS 8.38 MSS
F00396 原發部位不明癌 10% 1741 0.97 0.01 MSS 3.81 MSS
F02028 胰臟癌 40% 680.9 0.96 0.01 MSS 6.9 MSS
F01198 胰臟癌 40% 1600 0.97 0.02 MSS 7.51 MSS
F01903 胰臟癌 15% 1194 0.97 0 MSS 3.67 MSS
F01912 胰臟癌 10% 1501 0.97 0 MSS 3.61 MSS
F00360 胰臟癌 20% 1167 0.97 0.01 MSS 3.85 MSS
F00789 胰臟癌 35% 861.8 0.94 0.03 MSS 4.95 MSS
F00160 胰臟癌 10% 1472 0.95 0.04 MSS 2.82 MSS
F01264 胰臟癌 80% 1383 0.98 0.03 MSS 5.8 MSS
F01473 胰臟癌 10% 557.8 0.93 0.02 MSS 5.3 MSS
F00674 胰臟癌 65% 2158 0.97 0.01 MSS 2.54 MSS
F01582 胰臟癌 30% 771.1 0.93 0.01 MSS 5.27 MSS
F01969 胰臟癌 2% 1669 0.98 0.01 MSS 4.01 MSI-L
F01997 胰臟癌 35% 1013 0.94 0.01 MSS 7.13 MSS
F01986 胰臟癌 10% 1923 0.99 0.03 MSS 4.89 MSS
F01773 胰臟癌 10% 1450 0.97 0.04 MSS 4.55 MSS
F01550 胰臟癌 40% 1781 0.96 0.01 MSS 5.57 MSS
F02116 胰臟癌 60% 1966 0.98 0 MSS 3.09 MSS
F02433 胰臟癌 20% 953.9 0.95 0.04 MSS 6.02 MSS
F02527 胰臟癌 10% 2167 0.98 0.01 MSS 5.82 MSS
F02041 胰臟癌 40% 1960 0.99 0.17 MSS 7.01 MSS
F00868 胸腺癌 25% 911.8 0.95 0.01 MSS 4.92 MSS
F02432 骨肉瘤 90% 1298 0.95 0 MSS 5.86 MSS
F02646 骨肉瘤 10% 1453 0.93 0.01 MSS 4.84 MSS
F00190 唾液腺癌 2% 1620 0.96 0 MSS 3.9 MSS
F01171 肉瘤 35% 1193 0.91 0 MSS 4.31 MSS
F01427 腎癌 80% 1084 0.94 0 MSS 4.97 MSS
E01792 黑色素瘤 40% 1383 0.95 0.03 MSS 13.13 MSS
E00467 腹膜癌 40% 996.4 0.94 0.01 MSS 5.44 MSS
F01169 腹膜癌 25% 861.6 0.95 0.01 MSS 5.28 MSS
F00129 腹膜癌 60% 1257 0.96 0.02 MSS 5.44 MSS
F00803 膀胱癌 80% 704.9 0.94 0.03 MSS 3.2 MSS
F02403 鼻咽癌 85% 1633 0.98 0.01 MSS 7.01 MSS
F01176 鼻竇癌 40% 1373 0.95 0.03 MSS 2.6 MSS
F02171 頭頸癌 40% 1302 0.93 0.01 MSS 4.54 MSS
F00731 膽管癌 40% 1525 0.97 0.99 MSI-H 15.72 MSI-H
E00407 膽管癌 NA 1555 0.97 0 MSS 4.02 MSS
F01172 膽管癌 25% 944.7 0.93 0 MSS 3.03 MSS
F00836 膽管癌 20% 2087 0.97 0.01 MSS 3.68 MSS
F01120 膽管癌 65% 1250 0.97 0.02 MSS 2.93 MSS
D00831 膽管癌 70% 1498 0.97 0 MSS 3.85 MSS
F00068 膽管癌 60% 991.8 0.95 0.02 MSS 10.69 MSS
F00493 膽管癌 2% 1447 0.96 0.02 MSS 3.89 MSS
F00727 膽管癌 20% 1244 0.97 0.02 MSS 4.03 MSS
F02115 膽管癌 10% 3378 0.98 0.01 MSS 3.26 MSS
F00246 膽管癌 40% 1803 0.96 0.02 MSS 3.29 MSS
F01288 膽管癌 65% 1336 0.97 0.01 MSS 4.74 MSS
F00976 膽管癌 20% 1825 0.97 0.01 MSS 4.17 MSS
F01060 膽管癌 10% 1797 0.97 0 MSS 3.86 MSS
F00186 膽囊癌 40% 1244 0.97 0.01 MSS 5.47 MSS
F01266 肺癌 40% 507.6 0.93 0.02 MSS 6.47 MSS
F02384 前列腺癌 35% 1302 0.98 0.01 MSS 7.07 MSS
ACT0744 NA NA 554.2 0.92 1 MSI-H 27.02 MSI-H
ACT0953 NA NA 983.7 0.94 0.95 MSI-H 36.59 MSI-H
ACT0893 NA NA 1105 0.96 0 MSS 4.37 MSS
ACT0897 NA NA 1209 0.96 0.02 MSS 4.66 MSS
ACT0894 NA NA 1403 0.97 0.05 MSS 6.92 MSS
ACT0887 NA NA 1682 0.97 0.99 MSI-H 19.78 MSI-H
ACT1217 NA NA 1731 0.96 0.05 MSS 10.2 MSS
F03491 肛門癌 75% 1394 0.96 0 MSS 4.98 MSS
表3 MSI模型的驗證結果
  5 標記 MSI-PCR 檢測系統
MSI-H MSS 總和
MSI 模型 MSI-H 28 6 34
MSS 2 403 405
總和 30 409 439
表4 MSI模型的效能
效能摘要
一致性統計量 點估計 威爾森得分 95% 信賴區間
陽性一致率(PPA) 93% 79%, 98%
陰性一致率(NPA) 99% 97%, 99%
陽性預測值(PPV) 82% 66%, 92%
陰性預測值(NPV) 100% 98%, 100%
實施例 3 對不同腫瘤純度的樣本進行 MSI
利用狀態為MSI-H的三種癌細胞株(依其來源)去決定用於檢測MSI狀態所需的最低腫瘤純度。該三種癌細胞株以其各自配對的正常細胞進行稀釋而形成一系列的稀釋樣本,腫瘤含量為100%、80%、50%、40%、30%及20%。表5顯示該些樣本中各樣本的MSI分數。
表5 由MSI模型測定之不同腫瘤純度的細胞株的MSI狀態
細胞株 定序深度 100x 時的目標鹼基定序覆蓋率 腫瘤 / 正常百分比 MSI 分數 MSI 狀態
RKO 746.6 0.91 100% / 0% 0.85 MSI-H
RKO 623.3 0.92 80% / 20% 0.98 MSI-H
RKO 800.4 0.93 50% / 50% 1 MSI-H
RKO 824.1 0.92 40% / 60% 1 MSI-H
RKO 702.3 0.92 30% / 70% 1 MSI-H
RKO 712 0.92 20% / 80% 0.92 MSI-H
C33A 894.4 0.92 100% / 0% 0.99 MSI-H
C33A 687.3 0.92 80% / 20% 1 MSI-H
C33A 789.3 0.92 50% / 50% 1 MSI-H
C33A 763.8 0.92 40% / 60% 1 MSI-H
C33A 680.1 0.92 30% / 70% 0.99 MSI-H
C33A 694 0.92 20% / 80% 0.97 MSI-H
SW48 1670 0.92 100% / 0% 1 MSI-H
SW48 832.4 0.92 80% / 20% 1 MSI-H
SW48 721.8 0.92 50% / 50% 1 MSI-H
SW48 870.8 0.93 40% / 60% 1 MSI-H
SW48 784.5 0.93 30% / 70% 0.99 MSI-H
SW48 848 0.93 20% / 80% 0.66 MSI-H
無。
以下一個或多個實施例將在所附圖式中以舉例方式進行說明,但非用以限制,圖中具有相同參考數位的元件在本文中代表類似的元件。除非另有說明,圖式不按比例繪製。
圖1(a)-1(c)係為用於表示微衛星不穩定性特徵的參數的示意圖。
圖2係為MSI模型的ROC曲線。
圖3係為驗證資料集的MSI分數的盒形圖(box plot)。
以上圖式僅是示意性的,且沒有限制作用。 在附圖中,出於說明目的,一些元件的尺寸可能被誇大而沒有按比例繪製。該尺寸及相對尺寸不一定與本揭露實施時的真實還原相對應。
無。
 
Figure 12_A0101_SEQ_0001
Figure 12_A0101_SEQ_0002
Figure 12_A0101_SEQ_0003
Figure 12_A0101_SEQ_0004
Figure 12_A0101_SEQ_0005
Figure 12_A0101_SEQ_0006
Figure 12_A0101_SEQ_0007
Figure 12_A0101_SEQ_0008

Claims (26)

  1. 一種產生用於預測微衛星不穩定性(MSI)狀態的模型的電腦執行方法,包含:(a)收集一臨床樣本的一預估所得MSI狀態資料;(b)透過次世代定序(NGS)對該臨床樣本的至少六個微衛星位點進行定序,以產生一定序資料;(c)從該定序資料中擷取一MSI特徵;(d)藉由將一MSI特徵資料與該預估所得MSI狀態資料彼此對應以訓練一機器學習模型,其中該MSI特徵資料是由一基線計算,該基線是建立自正常樣本中每個簡單序列重複(SSR)區域的一平均波峰寬度;及(e)輸出一經過訓練的機器學習模型。
  2. 如請求項1所述之電腦執行方法,其中該預估所得MSI狀態資料是透過一檢測方法從一癌症患者獲取,該檢測方法包含MSI-聚合酶連鎖反應檢測法、免疫組織化學染色法、或基於NGS的MSI檢測。
  3. 如請求項1所述之電腦執行方法,其中該機器學習模型包括一邏輯式迴歸模型、一隨機森林模型、一極端隨機樹模型、一多項式迴歸模型、一線性迴歸模型、一梯度下降模型、或一極端梯度提升模型。
  4. 如請求項1所述之電腦執行方法,其中該經過訓練的機器學習模型包含對各微衛星位點所界定的一權重,並且可以預測MSI狀態。
  5. 如請求項1所述之電腦執行方法,其中該經過訓練的機器學習模型包含對各微衛星位點的該MSI特徵所界定的一權重,並且可以預測MSI狀態。
  6. 如請求項1所述之電腦執行方法,其中該經過訓練的機器學習模型具有一閾值,該閾值為0.1、0.15、0.2、0.25、0.3、0.35、0.4、0.45或0.5。
  7. 如請求項1所述之電腦執行方法,其中該預估所得MSI狀態資料指示微衛星穩定(MSS)或微衛星高度不穩定(MSI-H)。
  8. 一種測定MSI狀態的電腦執行方法,包含:(a)透過次世代定序(NGS)對一個體的一臨床樣本的至少六個微衛星位點進行定序,以產生一定序資料;(b)從該定序資料中擷取一MSI特徵; (c)將一MSI特徵資料導入如請求項1所述方法產生之經過訓練的機器學習模型;及(d)產出一運算所得MSI狀態資料。
  9. 如請求項8所述之電腦執行方法,進一步包含步驟(e):將該運算所得MSI狀態資料輸出至一電子儲存媒體或一顯示器。
  10. 如請求項8所述之電腦執行方法,進一步包含依據該運算所得MSI狀態資料而決定對該個體的療法的步驟。
  11. 如請求項10所述之電腦執行方法,進一步包含向該個體施予一治療有效量的該療法的步驟。
  12. 如請求項10所述之電腦執行方法,其中該療法包含手術、個人療法、化學治療、放射線治療、或免疫療法。
  13. 如請求項12所述之電腦執行方法,其中該免疫療法包含施予一藥物的步驟,該藥物係選自由帕博利珠單抗(pembrolizumab)、納武利尤單抗(nivolumab)、MEDI0680、度伐利尤單抗(durvalumab)、及伊匹木單抗(ipilimumab)所組成的群組。
  14. 如請求項8所述之電腦執行方法,其中該運算所得MSI狀態資料指示微衛星穩定(MSS)或微衛星高度不穩定(MSI-H)。
  15. 如請求項1或8所述之電腦執行方法,其中該微衛星位點是至少7、10、15、20、30、40、50、100、150、200、250、300、350、400、450、500、550或600個位點。
  16. 如請求項1或8所述之電腦執行方法,其中該微衛星位點呈現定序覆蓋率低、波峰不穩定、波峰寬度高變異性或貢獻權重低時會被排除。
  17. 如請求項16所述之電腦執行方法,其中該定序覆蓋率低的微衛星位點是在一樣本的一位點有低於5x、10x、15x、20x、25x、30x、35x、40x、45x、或50x的一定序深度。
  18. 如請求項16所述之電腦執行方法,其中該波峰寬度高變異性的微衛星位點的波峰寬度變異是在5次重複量測中大於2、在6次重複量測中大於3、在7次重複量測中大於3、在8次重複量測中大於3、在9次重複量測中大於3、或在10次重複量測中大於4。
  19. 如請求項1或8所述之電腦執行方法,其中該MSI特徵包括波峰寬度或其與波峰高度、波峰位置及SSR類型之任意組合。
  20. 如請求項19所述之電腦執行方法,其中該SSR類型包含至少重複10次的單核苷酸、至少重複6次的雙核苷酸、至少重複5次的三核苷酸、至少重複5次的四核苷酸、至少重複5次的五核苷酸、以及具有SEQ ID NOs:1-37序列的複合核苷酸類型。
  21. 如請求項1或8所述之電腦執行方法,其中該臨床樣本來自細胞株、活體組織檢體、原發組織、冷凍組織、福馬林固定石蠟包埋組織、液態活體組織檢體、血液、血清、血漿、白血球層、體液、內臟液、腹水、腔液穿刺、腦脊髓液、唾液、尿液、淚液、精液、陰道分泌物、抽取物、灌洗液、口腔抹片、循環腫瘤細胞、游離DNA、循環腫瘤DNA、DNA、RNA、核酸、純化之核酸、純化之DNA、或純化之RNA。
  22. 如請求項1或8所述之電腦執行方法,其中該樣本來自一患者,該患者患有癌症、實體瘤、血液惡性腫瘤、罕見遺傳病、複合性疾病、糖尿病、心血管疾病、肝病、或神經系統疾病。
  23. 如請求項1或8所述之電腦執行方法,其中該臨床樣本的腫瘤純度為至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、或100%。
  24. 一種測定MSI狀態的系統,包含:一資料儲存裝置,儲存有用於測定MSI狀態特徵的指令;及一處理器,被設置成執行該指令以運行一方法,該方法包含:(a)藉由將一MSI特徵的訓練資料與一供訓練用的預估所得MSI狀態資料彼此對應,以訓練一機器學習模型;(b)透過次世代定序(NGS)對一個體的一臨床樣本的至少六個微衛星位點進行定序,以產生一定序資料;(c)藉由使用一經過訓練的機器學習模型以運算MSI狀態,其中該經過訓練的機器學習模型具有從該定序資料中擷取出的一MSI特徵資料,其中該MSI特徵資料是由一基線計算,該基線是建立自正常樣本中每個SSR區域的一平均波峰寬度;(d)產生一運算所得MSI狀態資料;及 (e)輸出該運算所得MSI狀態資料。
  25. 如請求項24所述之系統,其中該方法進一步包含步驟(f):依據該運算所得MSI狀態資料而決定對該個體的療法。
  26. 如請求項25所述之系統,其中該方法進一步包含步驟(g):向該個體施予一治療有效量的該療法。
TW110122325A 2020-06-18 2021-06-18 微衛星不穩定性檢測方法及系統 TWI780781B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US202063041103P 2020-06-18 2020-06-18
US63/041,103 2020-06-18

Publications (2)

Publication Number Publication Date
TW202205301A TW202205301A (zh) 2022-02-01
TWI780781B true TWI780781B (zh) 2022-10-11

Family

ID=77051126

Family Applications (1)

Application Number Title Priority Date Filing Date
TW110122325A TWI780781B (zh) 2020-06-18 2021-06-18 微衛星不穩定性檢測方法及系統

Country Status (4)

Country Link
US (1) US20230230661A1 (zh)
CN (1) CN116438602A (zh)
TW (1) TWI780781B (zh)
WO (1) WO2021257926A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115132327B (zh) * 2022-05-25 2023-03-24 中国医学科学院肿瘤医院 微卫星不稳定预测系统及其构建方法、终端设备及介质
CN115131630A (zh) * 2022-07-20 2022-09-30 元码基因科技(苏州)有限公司 模型训练、微卫星状态预测方法、电子设备及存储介质
CN117198399B (zh) * 2023-09-21 2024-07-19 杭州链康医学检验实验室有限公司 预测msi状态的微卫星位点、系统及试剂盒

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201816645A (zh) * 2016-09-23 2018-05-01 美商德萊福公司 用於生物樣本的自動化處理及分析、臨床資訊處理及臨床試驗配對之整合系統及方法
WO2019204208A1 (en) * 2018-04-16 2019-10-24 Memorial Sloan Kettering Cancer Center SYSTEMS AND METHODS FOR DETECTING CANCER VIA cfDNA SCREENING
TW202013385A (zh) * 2018-06-07 2020-04-01 美商河谷控股Ip有限責任公司 基於差異的基因組之辨識分數

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW201816645A (zh) * 2016-09-23 2018-05-01 美商德萊福公司 用於生物樣本的自動化處理及分析、臨床資訊處理及臨床試驗配對之整合系統及方法
WO2019204208A1 (en) * 2018-04-16 2019-10-24 Memorial Sloan Kettering Cancer Center SYSTEMS AND METHODS FOR DETECTING CANCER VIA cfDNA SCREENING
TW202013385A (zh) * 2018-06-07 2020-04-01 美商河谷控股Ip有限責任公司 基於差異的基因組之辨識分數

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
期刊 Flores-Renteria, L., & Krohn, A. Scoring Microsatellite Loci 1006 Protein Electrophoresis 2013/01/01 319~336 *

Also Published As

Publication number Publication date
US20230230661A1 (en) 2023-07-20
TW202205301A (zh) 2022-02-01
CN116438602A (zh) 2023-07-14
WO2021257926A1 (en) 2021-12-23

Similar Documents

Publication Publication Date Title
TWI532843B (zh) 與癌症有關之基因或分子變異之檢測
KR101437718B1 (ko) 위암의 예후 예측용 마커 및 이를 이용하는 위암의 예후 예측 방법
TWI780781B (zh) 微衛星不穩定性檢測方法及系統
AU2009234444A1 (en) Methods, agents and kits for the detection of cancer
JP7665659B2 (ja) 循環腫瘍核酸分子のマルチモーダル分析
WO2020175903A1 (ko) 간암 재발 예측용 dna 메틸화 마커 및 이의 용도
EP2780476B1 (en) Methods for diagnosis and/or prognosis of gynecological cancer
WO2022178108A1 (en) Cell-free dna methylation test
CN102325902A (zh) 对包括结肠直肠癌细胞的样品进行分型的方法和装置
AU2018244758B2 (en) Method and kit for diagnosing early stage pancreatic cancer
US11466327B2 (en) Use of the expression of specific genes for the prognosis of patients with triple negative breast cancer
CN111763740B (zh) 基于lncRNA分子模型预测食管鳞癌患者新辅助放化疗的疗效和预后的系统
US20210295948A1 (en) Systems and methods for estimating cell source fractions using methylation information
CN101457254B (zh) 用于肝癌预后的基因芯片和试剂盒
US20090297506A1 (en) Classification of cancer
US20200265922A1 (en) Comprehensive Genomic Transcriptomic Tumor-Normal Gene Panel Analysis For Enhanced Precision In Patients With Cancer
CN114045344B (zh) 前列腺癌诊断用尿液miRNA标志物、诊断试剂及试剂盒
EP4623099A1 (en) Cell-free dna methylation test for breast cancer
CN118922561A (zh) 肾癌诊断用尿液miRNA标志物、诊断试剂及试剂盒
JP2023552177A (ja) 癌の診断、予後診断および療法に関連するバイオマーカーの新規ソースとしてのリボソームrnaの2’o-メチル化
TWI824488B (zh) 預測胃癌患者預後的方法及其套組
WO2025109033A1 (en) Method for identifying if a subject is at risk of developing lung cancer
HK40092784A (zh) 循环肿瘤核酸分子的多模态分析
AU2024309260A1 (en) Biomarkers and uses therefor
CN120380169A (zh) 用于在唾液中检测神经内分泌癌的方法

Legal Events

Date Code Title Description
GD4A Issue of patent certificate for granted invention patent