[go: up one dir, main page]

TWM648156U - 以機器學習模型建立拔管預測之系統 - Google Patents

以機器學習模型建立拔管預測之系統 Download PDF

Info

Publication number
TWM648156U
TWM648156U TW112205118U TW112205118U TWM648156U TW M648156 U TWM648156 U TW M648156U TW 112205118 U TW112205118 U TW 112205118U TW 112205118 U TW112205118 U TW 112205118U TW M648156 U TWM648156 U TW M648156U
Authority
TW
Taiwan
Prior art keywords
extubation
data
prediction
machine learning
learning model
Prior art date
Application number
TW112205118U
Other languages
English (en)
Inventor
趙文震
白鎧誌
詹明澄
吳杰亮
王敏嫻
廖建倫
洪大鈞
林彥男
楊惠喬
許瑞愷
陳倫奇
Original Assignee
臺中榮民總醫院
東海大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 臺中榮民總醫院, 東海大學 filed Critical 臺中榮民總醫院
Priority to TW112205118U priority Critical patent/TWM648156U/zh
Publication of TWM648156U publication Critical patent/TWM648156U/zh

Links

Landscapes

  • Testing And Monitoring For Control Systems (AREA)
  • Numerical Control (AREA)
  • Jib Cranes (AREA)

Abstract

本創作係提供一種以機器學習模型建立拔管預測之系統,其係能夠透過一機器學習模型之訓練及/或驗證得到一拔管預測模型及其所使用之關鍵特徵,而透過該拔管預測模型即時分析一病人之關鍵特徵資料,係能得到該病人之拔管可能性及其相關說明。據此,本創作所揭以機器學習模型建立拔管預測之系統係做為臨床照護者評估拔管之工具,以降低拔管後無法自主呼吸致使重新插管之可能性。

Description

以機器學習模型建立拔管預測之系統
本創作係有關於一種拔管預測系統,特別係指一種以機器學習模型建立拔管預測之系統。
按,根據統計,有約80%以上重症加護病房中病人需要靠著機械式呼吸輔助(mechanical ventilation)維持生命,而研究顯示,當病人依賴機械式呼吸輔助之時間越長,要使病人脫離機械式呼吸輔助則會難度增加,甚至演變成會長期依賴機械式呼吸輔助才能維生,或是短時間脫離呼吸器後,又很快地必須重新插管仰賴機械式呼吸輔助才能維持存活。
為能提高病人脫離機械式呼吸輔助之成功率增加,目前許多研究是透過各類研究方式來預測病人脫離機械式呼吸輔助之時間點及成功率,例如有研究係透過整理加護病房及慢性呼吸照顧病房中病人及其臨床特徵、使用呼吸器之原因、慢性併發症、呼吸器脫離困難原因等之資訊進行統計分析,以歸納出難以脫離機械式呼吸輔助之病人特徵,惟,各個病人病情不相當且病況瞬息萬變,透過回溯性統計分析方法所得之結果將無法準確預測適合拔管之時間點。
本創作之主要目的係在於提供一種以機器學習模型建立拔管預測之系統,其係能夠自動化方式即時地預測住院病人之拔管可能性,以做為臨床醫生評估病人拔管成功率之工具。
本創作之另一目的係在於提供一種以機器學習模型建立拔管預測之系統,其係提供得到預測拔管可能性之理由或是相關說明,以能達到提升拔管可能性之可信度及可解釋性。
緣是,為能達成上述目的,本創作係提供一種以機器學習模型建立拔管預測之系統,係包含有一處理裝置,用以透過一拔管預測模型分析一待測病人之一關鍵特徵資料,以產出該待測病人之拔管可能性,其中,該關鍵特徵資料係包含有該生理參數資料,以及於進行拔管預測之日的前1日或/及前2日所獲得之該意識資料、該輸入/輸出液體資料、該呼吸功能資料。
其中,該拔管預測模型係選自由極限梯度提升(Extreme Gradient Boosting,XGBoost)、類別梯度提升(Categorical Boosting,CatBoost)、輕量梯度提升機器(Light Gradient Boosting Machine,LightGBM)、隨機森林演算法(Random Forest,RF)及邏輯回歸(Logistic Regression,LR)所組成之群。
其中,該拔管可能性係為該待測病人於該於進行拔管預測日後24小時內脫離呼吸輔助設備之可能性。
其中,該處理裝置係具有一資料處理模組及一拔管預測模組,而該資料處理模組係用以自該待測病人之特徵資料中擷取出該關鍵特徵資料;該拔管預測模組係以該拔管預測模型分析該關鍵特徵資料。
於本創作之一實施例中,以機器學習模型建立拔管預測之系統係更包含有一資料庫,其係用以收集複數病人之特徵資料,其中,該特徵資料係包含有一意識資料、一輸入/輸出液體資料、一呼吸功能資料及一生理參數資料; 該處理裝置係包含有一資料處理模組;並各該病人於住院期間係有使用一呼吸輔助設備之記錄。
於本創作之另一實施例中,該處理裝置係與該資料庫連接,而該資料處理模組係能用以對該資料庫中該些病人之該特徵資料進行一資料預處理程序,以刪除該特徵資料中超出一預設合理範圍之資料,及/或補足該特徵資料中缺失之資料。
於本創作之另一實施例中,該拔管預測模組以該拔管預測模型分析該關鍵特徵資料後,產出該關鍵特徵資料與拔管可能率間之關連性資訊。
於本創作之次一實施例中,該處理裝置係更包含有一可視化模組,其係將該關鍵特徵資料與拔管可能率間之關連性資訊轉化為一可視化介面,例如直條圖、折線圖、SHAP力值圖、部分依賴圖(PDP圖)等。
本創作之又一實施例中,該處理裝置係更包含有一模型訓練模組,其係以該些病人之該些特徵資料之至少一部訓練一機器學習模型,並得進行驗證,以產生該拔管預測模型及一關鍵特徵。
其中,該關鍵特徵係包含年紀、使用呼吸器之天數,以及進行於拔管預測之日前1天及前2天的GCS分數、尿量、注射量、營養量、RASS分數、PIP、MAP、呼吸頻率、心率。
本創作所以機器學習模型建立拔管預測之系統的實際執行方法,包含有下列步驟:(a)取得訓練用特徵資料;(b)以機器學習模型進行訓練並得到拔管訓練模型;(c)取得待測病人之關鍵特徵資料;(d)以拔管訓練模型分析該關鍵特徵資料而得到待測病人之拔管可能性。
其中,該步驟a中係更包含有一數據預處理步驟,用以除去該些訓練用特徵資料中不符合一標準者,及/或以插補方式補足該些訓練用特徵資料數量不足之部分。
其中,該步驟d係更包含得到各該關鍵特徵與該拔管可能率間之關連性,並將之轉化為一可視化介面。
10:以機器學習模型建立拔管預測之系統
20:資料庫
30:處理裝置
31:資料處理模組
32:模型訓練模組
33:拔管預測模組
34:可視化模組
圖1係為本創作之一實施例所揭以機器學習模型建立拔管預測之系統的示意圖。
圖2A係為本創作所揭數據分析之流程圖(一)。
圖2B係為本發明所揭數據分析之流程圖(二)。
圖3A係以校正曲線分析顯示不同機器學習模型預測拔管之表現。
圖3B係以決策曲線分析顯示不同機器學習模型預測拔管之表現。
圖3C係以曲線下面積顯示不同機器學習模型預測拔管之表現。
圖4係為顯示各主要臨床區塊對於重症監護之重要度。
圖5係以SHAP值說明於各關鍵特徵於拔管預測模型之關連性。
圖6A係為GCS影響XGBoost預測拔管概率之部分依賴圖。
圖6B係為RASS影響XGBoost預測拔管概率之部分依賴圖。
圖6C係為尿量影響XGBoost預測拔管概率之部分依賴圖。
圖6D係為注射量影響XGBoost預測拔管概率之部分依賴圖。
圖6E係為PIP影響XGBoost預測拔管概率之部分依賴圖。
圖6F係為MAP影響XGBoost預測拔管概率之部分依賴圖。
圖7A係為案例1藉由關鍵特徵的LIME及SHAP力值顯示關鍵特徵對於兩個不同個體之拔管預測的總體影響之結果。
圖7B係為案例2藉由關鍵特徵的LIME及SHAP力值顯示關鍵特徵對於兩個不同個體之拔管預測的總體影響之結果。
本創作係揭露一種以機器學習模型建立拔管預測之系統,其係能夠透過一機器學習模型之訓練及/或驗證得到一拔管預測模型及其所使用之關鍵特徵,而透過該拔管預測模型即時分析一病人之關鍵特徵資料,係能得到該病人之拔管可能性及其相關說明。據此,本創作所揭以機器學習模型建立拔管預測之系統係做為臨床照護者評估拔管之工具,以降低拔管後無法自主呼吸或是需重新插管之可能性。
必須要加以強調者,本創作所揭露之以機器學習模型建立拔管預測之系統係納入病人意識資料及其輸入/輸出液體資料,以達到使所得到之拔管預測結果能夠更為貼近醫生於臨床上判斷之結果,意即本創作所揭以機器學習模型建立拔管預測之系統及其方法係能夠達到更為精準之拔管預測率。
以下將說明本創作中所使用之術語,若未列於以下說明者,將依據本創作所屬技術領域且具通常知識者所認可參考資料,如辭典、字典、文獻或周知常識進行解釋。
術語「動態參數」,係指病人於住院期間定期或不定期進行檢測所得到之數據或結果。
術語「意識/認知區塊」,係指依據評估病人意識狀態之系統、量表或方法所得之數據,例如格拉斯哥昏迷量表(Glasgow Coma Scale,GCS)、RASS鎮靜程度評估量表(Richmond Agitation Sedation Scale,RASS)等。
術語「體液平衡區塊」,係指與進入病人體內之液體或是病人所排除之液體相關之數據,例如尿量、注射量、輸液量、營養總量。
術語「呼吸功能區塊,」,係指與病人呼吸功能或心肺功能相關之數據,如氣道壓峰值(PIP)、平均氣道壓(MAP)、呼吸器天數、呼吸頻率。
術語「生理參數區塊」,係指病人之生理數據,如體重、身體質量指數、身高等。
術語「呼吸輔助設備」或「呼吸器」,係指設置於病人身上,用以協助病人進行換氣/吸氣之外部裝置。
術語「模組」,係指由數個基礎功能元件所組成具有特定功能之組件,其係能夠用以組成一具完整功能的系統、裝置或程式,舉例來說,模組係得為一電子電路。
術語「ICU」,全名為Intensive Care Unit,為醫院中之重症加護病房,會依據科別而有隸屬於不同科室。
術語「機器學習」,係會以一機器學習模型於資料中進行學習以及改善,尋找到模式與關連,並根據其學習及分析結果制訂出決策與預測。以本創作中所列舉之實例來說,該機器學習模型係包含有XGBoost(Extreme Gradient Boosting)、CatBoost(Categorical Boosting)、LightGBM(Light Gradient Boosting Machine)、隨機森林演算法(Random Forest,RF)及邏輯回歸(Logistic Regression,LR)。
術語「拔管」中之「管」,係指用以通氣或提供氣體之管路,因此,「拔管」代表脫離呼吸器或是其他呼吸輔助設備。
術語「APACHE II」,全名為acute physiology and chronic health evaluation II,係為一種疾病嚴重度評分系統,介於0-71分,該評分系統係藉由12項生理數據、病人年齡與健康狀態作為評分的輸入,各項數據為病人入院24小時後的最差值。
術語「SOFA」,全名Sequential Organ Failure Assessment,係一種評估疾病嚴重度之系統,其係將器官分為肺、凝血、肝、心臟、神經、腎,並分別進行評估,每個器官最高分為4分,最低分為0分,於進入ICU 24小時後,每48小時會計算一次總分。
術語「GCS(Glasgow Coma Scale)」,中文為格拉斯哥昏迷量表,其係為一昏迷指標,是昏迷指數中最被廣泛使用之一種,其評估包含有三個面向:睜眼反應、說話反應、運動反應,每個面向最高可得5分,最低為1分,當總得分月低代表昏迷程序越嚴重。
術語「RASS鎮靜程度評估表(Richmond Agitation-Sedation Scale)」,係用於測量病人之躁動或鎮靜程度之量表,分數由-4-+4,分別代表不同之行為狀態。
術語「SHAP值」、「SHAP力值(SHAP force plot)」或「SHAP數值」,係指當一預定機器學習模型對一數據或是一組數據產生一個預測值,於數據或是該組數據中每個特徵所被分配到之數值。
術語「LIME(Local Interpretable Model-Agnostic Explanations)」,係為局部可解釋模型,其目的係在於瞭解複雜難解釋之模型,而所使用之原理係根據欲解釋之個體提供一個局部可解釋或是可理解的模型。
術語「可視化界面」,係指藉由圖形化將數據或訊息以圖形之方式表現出來,以利使用者能夠更好理解數據與訊息,而所謂之圖形係包含有圖、表、顏色、符號、記號、圖標或其他視覺元素。
具體來說,請參圖1,於本創作之一實施例係提供一種以機器學習模型建立拔管預測之系統10,其包含有一資料庫20及一處理裝置30,其中:該資料庫20係為一結構化之資訊或資料集合,會以一預定方式儲存,如以電子方式存於電腦系統、硬碟或是雲端空間內等。該資料庫20收集且存 放複數病人之一特徵資料,其中,各該病人於重症加護病房住院期間係有使用一呼吸輔助設備之記錄,並該特徵資料係包含有一意識資料、一輸入/輸出液體資料、一呼吸功能資料及一生理參數資料。而該資料庫20之資料來源係得為直接輸入或是與其他外部資料庫串接後所得者。
於本實施例中,該意識資料係與病人意識或認知程度評估之結果,如格拉斯哥昏迷量表所得之分數、RASS鎮靜程度評估量表所得之分數;該輸入/輸出液體資料係為一預定時間內投入病人體內之液體量,或是病人排出之液體量,例如輸液量、注射量、飲食中所攝取之液體量、尿量等;該呼吸功能資料係為與病人呼吸或/及心肺功能狀態相關之數據,例如配戴呼吸輔助設備之天數、氣道壓峰值(PIP)、平均氣道壓(MAP)、呼吸頻率;該生理參數資料係為病人生理數據,例如年紀、體重、身體質量指數等。
該處理裝置30係能夠用以一系列執行程式、指令或是對資料進行操作之硬體,如電腦、計算機處理器等。該處理裝置30係與該資料庫20連接,並具有一資料處理模組31、一模型訓練模組32、一拔管預測模組33及一可視化模組34;其中:該資料處理模組31係用以處理來自病人之特徵資料,包含有進行一資料預處理程序及一擷取特徵資料程序。具體來說,該資料預處理程序係指該資料處理模組31讀取該資料庫20中該些病人之該特徵資料後,會對該些特徵資料進行刪除或/及差補之步驟,意即該資料處理模組係接收各特徵之一預設合理範圍,並以之做為判斷標準,當有一特徵資料未落於該預設合理範圍時,則刪除該特徵資料;並檢核該特徵資料之數量是否符合一預定值,倘若不符合該預定值時,則判定該特徵資料缺失,應透過取該特徵資料之平均值補足該資料缺失的部分。而該擷取關鍵特徵程序係指該資料處理模組31係讀取一待測病人之特徵資料後,並從中擷取出與一關鍵特徵相關之數據做為一關鍵特徵資料。
該模型訓練模組32係接收來自該資料處理模組31處理後之該些特徵資料,並以該些特徵資料之至少一部訓練一機器學習模型,且以該些特徵資料之至少一部驗證訓練後之機器學習模型及其所得結果,以產出一拔管預測模型及用於該拔管預測訓練模型之該關鍵特徵。
於本實施例中,該機器學習模型係為本創作所屬技術領域所周知之演算邏輯或演算法,例如XGBoost(Extreme Gradient Boosting)、CatBoost(Categorical Boosting)、LightGBM(Light Gradient Boosting Machine)、隨機森林演算法(Random Forest,RF)及邏輯回歸(Logistic Regression,LR)等。
於本實施例中,該關鍵特徵係有20個,包含有年齡、使用呼吸輔助設備之天數、並以進行於拔管預測之當日的前1天及前2天所測得的GCS分數、尿量、注射量、營養量、RASS分數、PIP、MAP、呼吸頻率、心率。
該拔管預測模組33係自該模型訓練模組32取得該拔管預測模型,並以該拔管預測模型分析來自該待測病人之該關鍵特徵資料,以產出該待測病人於該於進行拔管預測之日後的24小時內之拔管可能率、以及各關鍵特徵與該拔管可能率間之關連性資訊。
該可視化模組34係將各關鍵特徵與該拔管可能率間之關連性資訊轉化為一可視化介面,用以呈現於一顯示器或是具有顯示器之設備上,如電腦、螢幕、平版電腦、手機等。
藉由上述構件之組成,本創作係揭露一種以機器學習模型建立拔管預測之系統係能以自動化方式即時地分析住院於重症照護病房之病人是否處於適合脫離呼吸輔助設備之狀態,除能以量化方式將拔管可能率供予臨床醫生做為評估拔管之參考,且更能進一步提供各關鍵特徵與拔管可能率間之關連性資訊與臨床醫生,以透過增加拔管可能率之可解釋性,達到能增加該拔管可能率之可信度的功效。
更進一步來說,本創作所揭以機器學習模型建立拔管預測之系統實際執行步驟係如下:
步驟101:輸入複數訓練用特徵資料,其中,該些特徵資料係來自於重症照護病房住院期間有使用呼吸輔助設備之複數病人,並該特徵資料係包含有一意識資料、一輸入/輸出液體資料、一呼吸功能資料及一生理參數資料,而該意識資料、該輸入/輸出液體資料、該呼吸功能資料及該生理參數資料之說明係與前述實施例中所述者相同,故於此不加以贅述。
步驟102:對該些訓練用特徵資料進行一資料預處理程序,以刪除其內不合理之特徵資料及/或補足缺失之特徵資料;以完成該資料預處理程序之該些訓練用特徵資料的至少一部訓練一機器學習模型,並得以完成該資料預處理程序之該些訓練用特徵資料的至少一部對於完成訓練之該機器學習模型進行驗證程序,以產出一拔管預測模型及一關鍵特徵。
其中,該拔管預測模型係選自由XGBoost(Extreme Gradient Boosting)、CatBoost(Categorical Boosting)、LightGBM(Light Gradient Boosting Machine)、隨機森林演算法(Random Forest,RF)及邏輯回歸(Logistic Regression,LR)所組成之群。
其中,該關鍵特徵係包含年紀、使用呼吸器之天數,以及進行於拔管預測之日前1天及前2天的GCS分數、尿量、注射量、營養量、RASS分數、PIP、MAP、呼吸頻率、心率。
步驟103:輸入一待測病人之一關鍵特徵資料,其中,該待測病人係處於施用一呼吸輔助設備之狀態,而該關鍵特徵資料係為自該待測病人所測得之該關鍵特徵的數據或數值。
步驟104:以該拔管預測模型分析關鍵特徵資料,產出該待測病人於拔管預測之日後24小時內之拔管可能率,以及該關鍵特徵資料與該拔管可能 率間之關連性資訊,並得之轉化為一可視化介面,包含如顏色、圖樣、圖形、形狀、線條或上述至少任二之組合。
以下,為能說明本創作之技術特徵所能達成之功效,將茲舉若干實例做詳細說明如後。
以下實例中所有試驗皆經過台中榮民總醫院研究倫理審查委員會審查且批准,並且遵循知情後同意及匿名化之準則。
實例一:受試者之資料分析
收集2015年7月至2019年7月間入住臺中榮民總醫院重症加護病房之病人的資料,並排除未使用呼吸器之病人資料、使用呼吸器天數少於72小時之病人資料,最後篩選出使用呼吸器超過48小時的受試者,共5940位,而受試者的特徵資料之統計分析結果如表1所示,其中,表1中之數據係以平均值±標準差或數量(百分比)之方式呈現;CCI代表查爾森合併症指數(Charlson Comorbidity Index)。由表1之內容可知,於ICU期間脫離呼吸器之受試者有3657位,於ICU期間未脫離呼吸器之受試者有2283位;所使用之特徵資料共有65個;受試者之平均年齡為66.2±16.2歲,並64.0%為男性;受試者之疾病嚴重度皆明顯偏高,APACHE II分數及SOFA分數分別為25.7±6.6及8.5±3.6,並且,有61.5%之受試者於ICU住院期間拔管,不過拔管受試者與未拔管受試者於年齡、性別、CCI指數間分布相似,但未拔管者之APACHE II分數及SOFA分數係高於拔管者。
再根據臨床工作流程中之四個主要臨床區塊(main clinical domain),將之受試者於ICU住院期間之動態參數進行分類處理及其統計分析,結果如表2所示,其中,該四個主要臨床區塊分別為意識/認知區塊(consciousness/awareness domain)、體液平衡區塊(fluid balance domain)、呼吸功能區塊(ventilatory function domain)、生理參數區塊(physiological parameter domain),其中,意識/認知區塊包含格拉斯哥昏迷量表(Glasgow coma scale,以下簡稱GCS)及RASS鎮靜程度評 估表(Richmond Agitation Sedation Scale,以下簡稱RASS);體液平衡區塊包含給予病人之液體、尿量、營養總量;呼吸功能區塊包含有氣道壓峰值((PIP)、平均氣道壓(MAP)、呼吸器天數、呼吸頻率;生理參數區塊則包含有心率。由表2之結果可知,於ICU住院期間拔管之病人的意識持續改善、鎮靜狀態下降、心率及輸液量逐漸下降,且尿量與營養量係呈現穩定增加。
Figure 112205118-A0305-02-0013-1
Figure 112205118-A0305-02-0013-2
Figure 112205118-A0305-02-0014-3
實例二:進行機器學習模型演算之結果
請參圖2A,自實例一中所收集之受試者特徵資料中取關連性最高之20個特徵(以下稱為20個關鍵特徵)做為建模數據,並以不同之機器學習模型進行分析,其中,所使用之機器學習模型係包含有XGBoost(Extreme Gradient Boosting)、CatBoost(Categorical Boosting)、LightGBM(Light Gradient Boosting Machine)、隨機森林(Random Forest,簡稱RF)及邏輯回歸(Logistic Regression,簡稱LR),並且訓練/測試比例為80/20。而20個關鍵特徵係透過遞歸特徵剔除分析法(recursive feature elimination analysis)進行原始特徵數據之分析得到之結果。
請參圖2B,為能達到能夠於拔管前1天進行預測之目的,係以受試者特徵資料取得時點進行分類,意即將拔管前1天之數據做為預測視窗(prediction window),並以脫離呼吸管前兩天(及拔管前第2天及第3天)之特徵資料做為特徵視窗(feature window),因此,建模資料係包含有年紀、使用呼吸器之天數,以及分別於拔管前第2天及第3天的GCS、尿量、注射量、營養量、RASS、PIP、MAP、呼吸頻率、心率。
於進行分析前,得對於實例一中所收集之受試者特徵資料進行數據預處理程序。所謂數據預處理係包含有去除異常數據及輸入缺失數據,其中,異常數據係指超出變數合理範圍之數值者,於本實例中,變數合理範圍係為醫生所設定者,舉例來說,各變數之合理範圍如下:年齡為1-100歲、配戴呼吸器的天數為1-60日、GCS為3-15、尿量為0-5000ml、注射量為0-10000ml、營養量為0-3000ml、RASS為-5-+4、PIP為0-50、MAP為10-40、呼吸頻率為0-40、心率為0-300;並於本實例中係輸入每個變數之平均值而填補缺失數據。
又,於進行機器學習模型進行數據分析前,所有數據都進行+1~-1的標準化處理;並,為避免抽樣偏差之產生,於拔管受試者中使用兩組數據,其中一組為拔管前1天的數據,另一組為隨機數據,並從未拔管受試者中隨機挑選五組數據;拔管受試者之特徵數據與未拔管受試者之特徵數據的比例為1:3.4。
各機器學習模型之分析結果如圖3及表3所示,其中,表3中之準確度係以下列公式算出:(TP+TN)/(TP+FN+TN+FP)。
表3:各機器學習模型進行拔管預測之表現指標
Figure 112205118-A0305-02-0016-4
由圖3及表3之結果可知,相對於LR之較低準確率,其他四個機器學習模型之準確率皆為高,具體來說,XGBoost、LightGBM、CatBoost及RF之AUC分別為0.921、0.921、0.920及0.918;並且由圖3B可知各機器學習模型之預測值與實際觀察值間具有良好一致性,又以XGBoost之一致性最佳:又由圖3C之結果可知,五個機器學習模型皆有一定之臨床有效性,其中又以XGBoost及LightGBM之表現最佳。
實例三:與拔管預測相關之特徵關連性分析
於本實例中,所使用之機器學習模型係為XGBoost。
按照實例一中所揭示的四個主要臨床區塊,將實例二所得之20個關鍵特徵中分別分類所對應的主要臨床區塊中,分析各關鍵特徵之重要度,並藉由累加各主要臨床區塊中之關鍵特徵的重要度數值,得到各主要臨床區塊與拔管 預測間之重要度,結果如圖4所示。由圖4之結果可知,意識/認知區塊、體液平衡區塊、呼吸功能區塊、生理參數區塊於重症監護之重要性,其數值分別為0.284、0.425、0.232、0.045。
再藉由SHAP值得到20個關鍵特徵分別如何影響拔管可能性,結果如圖5所示。由圖5之結果可知,GCS之改善及尿量增加與一天後有較高拔管概率呈正相關;而注射液體量高則於拔管概率呈現負相關。
更進一步,如圖6A至圖6F所示,藉由部分依賴圖(Partial dependence plot,PDP),得到GCS、RASS、尿量、注射量、PIP、MAP等關鍵特徵係分別如何影響機器學習模型評估拔管概率。由圖6A至圖6F之結果可顯示透過將各主要臨床區塊或/及各特徵進行可視化處理後,係可以作為解釋拔管成功率之基礎,意即透過各主要臨床區塊或/及各特徵之SHAP值或部分依賴圖,可使臨床醫生得知透過本創作所揭以機器學習模型建立拔管預測之方法得到之拔管預測結果的理由或是立論基礎。
實例四:分析關鍵特徵對於拔管預測之影響
圖7A及圖7B分別藉由關鍵特徵的LIME及SHAP力值說明關鍵特徵對於兩個不同個體之拔管預測的總體影響,其中,於圖7A及圖7B中,紅色代表對於拔管總預測概率有增量影響(incremental effect)的變量,而藍色代表對於拔管總預測概率有減量影響(decremental effect)的變量。具體來說,由圖7A之結果可知,雖然案例1於拔管前第2天的注射量偏高(2521ml),但是仍具有許多有利於拔管的變數存在,包含意識清楚(GCS為14及RASS為0)、高尿量(於拔管前第2天的尿量為2450ml)且低呼吸頻率(於拔管前第2天的呼吸頻率為14.5),因此,於案例1的拔管預測可能性為0.81。反之,由圖7B之結果可知,案例2存在許多不利拔管之變數,包含有高注射量(拔管前1天為2811ml)、高PIP(29.50cmH2O) 及MAP(15.5mg/dL),因此即便案例2具有相對清楚的意識(GCS為15及RASS為-1),案例2之拔管預測可能性仍僅有0.19。
實例五:缺少關鍵特徵進行機器學習模型演算之結果
參照實例二所揭內容,以不同機器學習模型分析受試者資料特徵,惟,不同者在於,所用以進行分析受試者資料特徵中不包含有意識區塊之特徵:GCS及RASS,而後,檢核每個機器學習模型所得結果之精準度、專一性、靈敏性、準確度及AUROC,結果如下表4所示。
Figure 112205118-A0305-02-0018-5
將表3與表4之結果進行比較可知,當缺少本創作所揭關鍵特徵時,所得之拔管預測可能性的可信度將會降低。
10:以機器學習模型建立拔管預測之系統
20:資料庫
30:處理裝置
31:資料處理模組
32:模型訓練模組
33:拔管預測模組
34:可視化模組

Claims (6)

  1. 一種以機器學習模型建立拔管預測之系統,其包含有:一資料庫,係收集複數病人之一特徵資料,其中,各該病人於住院期間係有使用一呼吸輔助設備之記錄,並該特徵資料係包含有一意識資料、一輸入/輸出液體資料、一呼吸功能資料及一生理參數資料;一處理裝置,係與該資料庫連接,並具有一資料處理模組,自一待測病人之特徵資料中擷取出一關鍵特徵資料,其中,該關鍵特徵資料係包含有該生理參數資料,以及於進行拔管預測之日的前1日或/及前2日所獲得之該意識資料、該輸入/輸出液體資料、該呼吸功能資料;一拔管預測模組,以一拔管預測模型分析該關鍵特徵資料,得到該待測病人於該於進行拔管預測之日後的24小時內之拔管可能率。
  2. 如請求項1所述以機器學習模型建立拔管預測之系統,其中,該拔管預測模組係以該拔管預測模型分析該關鍵特徵資料後,產出該關鍵特徵資料與拔管可能率間之關連性資訊。
  3. 如請求項2所述以機器學習模型建立拔管預測之系統,其中,該處理裝置係更包含有一可視化模組,其係將該關鍵特徵資料與拔管可能率間之關連性資訊轉化為一可視化介面。
  4. 如請求項1所述以機器學習模型建立拔管預測之系統,其中,該拔管預測模型係選自由XGBoost(Extreme Gradient Boosting)、CatBoost(Categorical Boosting)、LightGBM(Light Gradient Boosting Machine)、隨機森林演算法(Random Forest,RF)及邏輯回歸(Logistic Regression,LR)所組成之群。
  5. 如請求項1所述以機器學習模型建立拔管預測之系統,其中,該處理裝置係更包含有一模型訓練模組; 該模型訓練模組係藉由該些病人之該些特徵資料之至少一部訓練一機器學習模型,並得進行驗證,以產生一拔管預測模型及一關鍵特徵。
  6. 如請求項5所述以機器學習模型建立拔管預測之系統,其中,該資料處理模組係讀取該資料庫中該些病人之該特徵資料並進行一資料預處理程序,以刪除超出一預設合理範圍之資料或/及補足缺失部分之資料。
TW112205118U 2023-05-23 2023-05-23 以機器學習模型建立拔管預測之系統 TWM648156U (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
TW112205118U TWM648156U (zh) 2023-05-23 2023-05-23 以機器學習模型建立拔管預測之系統

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW112205118U TWM648156U (zh) 2023-05-23 2023-05-23 以機器學習模型建立拔管預測之系統

Publications (1)

Publication Number Publication Date
TWM648156U true TWM648156U (zh) 2023-11-11

Family

ID=89721150

Family Applications (1)

Application Number Title Priority Date Filing Date
TW112205118U TWM648156U (zh) 2023-05-23 2023-05-23 以機器學習模型建立拔管預測之系統

Country Status (1)

Country Link
TW (1) TWM648156U (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI886994B (zh) * 2024-06-07 2025-06-11 中國醫藥大學 應用於臨床醫學的可解釋性人工智慧方法及其系統

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI886994B (zh) * 2024-06-07 2025-06-11 中國醫藥大學 應用於臨床醫學的可解釋性人工智慧方法及其系統

Similar Documents

Publication Publication Date Title
TWI852579B (zh) 以機器學習模型建立拔管預測之系統及其方法
CN110051324B (zh) 一种急性呼吸窘迫综合征死亡率预测方法及系统
CN110827993A (zh) 基于集成学习的早期死亡风险评估模型建立方法及装置
CN111899866B (zh) 基于深度学习的外科手术并发症评测系统
CN110136788A (zh) 一种基于自动检测的病历质检方法、装置、设备及存储介质
CN113257371B (zh) 基于医学知识图谱的临床检验结果分析方法及系统
JP2013513846A (ja) 医学データの自動注釈
CN112652398A (zh) 一种基于机器学习算法的新冠肺炎重症化预测方法及系统
CN117219275A (zh) 一种儿童药物性肝损伤风险识别预测方法及系统
CN107145715B (zh) 一种基于推举算法的临床医学智能判别装置
CN116844733B (zh) 一种基于人工智能的医疗数据完整性分析方法
CN112967803A (zh) 基于集成模型的急诊患者早期死亡率预测方法及系统
WO2022178947A1 (zh) 基于多维度的监测预警方法、装置、设备及存储介质
CN111063448A (zh) 输血不良反应数据库建立方法、存储系统以及主动预警系统
CN116564521A (zh) 一种慢性病风险评估模型建立方法、介质及系统
CN118312816B (zh) 基于成员选择的簇加权聚类集成医学文本处理方法及系统
CN117672532A (zh) 住院患者护理风险评估预警监控系统及方法
CN120600308A (zh) 智能健康体检数据质控分析方法及系统
TWM648156U (zh) 以機器學習模型建立拔管預測之系統
Junger et al. Automatic calculation of a modified APACHE II score using a patient data management system (PDMS)
CN118737438B (zh) 一种围术期风险分级模型构建方法和围术期风险分级方法
CN114724701A (zh) 基于叠加集成算法和自动编码器的无创通气疗效预测系统
CN120221055A (zh) 基于感染性肺部疾病诊断模型的临床性能验证系统
CN118737467A (zh) 监测重症监护室心衰患者院内死亡风险的机器学习模型
CN112205965B (zh) 基于时间窗口切割的健康风险关键事件检测方法及系统