CN111028223B - 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 - Google Patents
一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 Download PDFInfo
- Publication number
- CN111028223B CN111028223B CN201911269293.2A CN201911269293A CN111028223B CN 111028223 B CN111028223 B CN 111028223B CN 201911269293 A CN201911269293 A CN 201911269293A CN 111028223 B CN111028223 B CN 111028223B
- Authority
- CN
- China
- Prior art keywords
- intestinal cancer
- value
- image
- features
- energy spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10081—Computed x-ray tomography [CT]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20092—Interactive image processing based on input by user
- G06T2207/20104—Interactive definition of region of interest [ROI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30028—Colon; Small intestine
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,包括:收集肠癌样本图像;对肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;对提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;采用相关性分析方法对组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数,得到过滤后的组学特征;基于模型层面,引入LASSO算法,对组学特征进行降维处理;基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,采用ROC方法对L2正则化Logistic回归模型进行评价。
Description
技术领域
本发明涉及影像医学与核医学、影像组学技术领域,具体而言,尤其涉及一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法。
背景技术
肠癌是全球第三大常见的恶性肿瘤,其微卫星不稳定(microsatelliteinstability,MSI)状态与预后和治疗密切相关。2017年NCCN指南指出,MSI结直肠癌患者往往预后更好,更易获益于免疫治疗,并对氟尿嘧啶药物不敏感。目前对MSI的判断依赖于术后病理组织检测,但考虑到医疗设备的限制以及手术对患者造成的创伤,术前寻找无创方法获取MSI状态是十分必要的。已经有学者尝试基于影像特征评估子宫内膜癌、肠癌及胃癌MSI状态,但这些研究的诊断价值尚不明确,且更多定量的影像特征尚未被充分挖掘。
能谱CT作为临床常用的影像检查手段,能够通过碘水浓度图反映组织的血供状态。本团队前期研究发现,与微卫星稳定(microsatellite stability,MSS)结直肠癌组织相比,MSI结直肠癌的血供更少,平均碘浓度更低,但该研究忽略了碘浓度分布的空间异质性。影像组学分析是基于像素强度和空间分布特点,定量描述了组织异质性,一定程度上可作为肿瘤分子状态的潜在影像学标记物。
肠癌的MSI状态与其疗效及预后密切相关,目前,MSI已经成为肠癌组织标本的常规检测手段。但MSI的检测依赖于侵入性手术或活组织检查所获取的组织样本,而肿瘤异质性限制了该样本的有效性,因为小组织样本不可能代表整个肿瘤。此外,虽然MSI的检测已经被纳入临床实践中,但受到其成本、检测周期和技术复杂性的限制,大规模肿瘤分子检测难以在临床得到推广。影像检查能够直观地涵盖整个肿块的信息,避免了因肿瘤异质性造成的差异。它还可以观察肿瘤外周区域,而这些区域通常不能通过外科手术切除,很难获取其病理信息。
发明内容
根据上述提出的技术问题,而提供一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法。本发明将高通量的影像组学特征与MSI信息相关联,为MSI肠癌提供一种基于放射影像组学特征的非侵袭性的可视化方法。
本发明采用的技术手段如下:
一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
进一步地,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。
进一步地,所述步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2;
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
进一步地,所述步骤S5中还包括当|corxy|≥0.9时,剔除卡方检验p值较大特征的步骤;所述计算相关性系数corxy的公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和。
进一步地,所述L1正则化Logistic回归模型的损失函数具体为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,|β1|为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
进一步地,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度特异度以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
较现有技术相比,本发明具有以下优点:
1、本发明提供的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,将高通量的影像组学特征与MSI信息相关联,为MSI肠癌提供一种基于放射影像组学特征的非侵袭性的可视化方法。
2、本发明提供的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,对影像组学特征进行哑变量处理后模型的效果较优,具有较高的准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明方法流程图。
图2为本发明实施例提供的ROC曲线图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
实施例
如图1所示,本发明提供了一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,
包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2;
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;具体的,当|corxy|≥0.9时,剔除卡方检验p值较大特征,相关性系数corxy的计算公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;numberof disconcordant pairs表示在混淆矩阵Tk中副对角线的和。
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;具体的,Logistic回归模型的损失函数为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其L1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,|β1|为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L1、L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度特异度以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,如图2所示,为本实施例提供的ROC曲线图,进而得出ROC曲线下面积AUC值;与表1ROC曲线下AUC值及其诊断效果做对比。
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
本实施例中,分别对训练数据集、验证集、HD750数据集进行模型构建、内部验证、外部测试。采用ROC方法对上述模型进行评价,得出AUC值,随后采用DeLong’s test对ROC进行显著性检验以评价AUC统计学意义。
表1 ROC曲线下AUC值及其诊断效果
研究的结论为对影像组学特征进行哑变量化后模型的效果较优,具有较高的准确性。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。
Claims (6)
1.一种微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,包括如下步骤:
S1、收集肠癌样本图像,所述样本图像为MSI肠癌能谱CT碘水图像和MSS肠癌能谱CT碘水图像;
S2、对所述肠癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;
S3、对所述步骤S2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;
S4、引用卡方检验,对经过哑变量处理后的图像特征采用假设检验法过滤出具有统计学意义的组学特征;
S5、采用相关性分析方法对所述组学特征之间的冗余性进行过滤,引用Kendall相关性分析,计算相关性系数corxy,得到过滤后的组学特征;
S6、基于模型层面,引入LASSO算法,对所述步骤S5中过滤后的组学特征进行降维处理;通过5折交叉验证技术,构建L1正则化Logistic回归模型,得到L1正则化Logistic回归模型的损失函数,当所述损失函数最小时,由于是L1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;
S7、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过L2正则化模型构建思想,最优化得到L2正则化Logistic回归模型,并采用ROC方法对L2正则化Logistic回归模型进行评价。
2.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S3中的哑变量处理过程具体为:
S31、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,提取的图像特征为p;
S32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;
S33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;
S34、将所述肠癌样本图像的类别与新特征相匹配,得到混淆矩阵Ti;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S35、根据混淆矩阵Ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;
S36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵Tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。
3.根据权利要求2所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S4的具体过程如下:
S41、设置Q为离散化后的新特性,分别对步骤S3中经过哑变量处理后的图像特征,寻找出与所述步骤S36中对应的混合矩阵Tk,通过四个表卡方检验得出卡方值x2;
S42、将所述卡方值x2与卡方界值表匹配,得到卡方检验p值;
S43、将p值大于0.05的图像特征剔除,保留p值小于0.05的图像特征,即为所述具有统计学意义的组学特征。
4.根据权利要求3所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述步骤S5中还包括当|corxy|≥0.9时,剔除卡方检验p值较大特征的步骤;所述计算相关性系数corxy的公式如下:
其中,number of concordant pairs表示在混淆矩阵Tk中主对角线的和;number ofdisconcordant pairs表示在混淆矩阵Tk中副对角线的和。
5.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述L1正则化Logistic回归模型的损失函数具体为:
其中,n为肠癌样本图像的个数,β为具有统计学意义的组学特征的权重,PβP1为其L1范数,即PβP1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个肠癌样本图像的特征组,y(i)为第i个肠癌样本图像的肠癌类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。
6.根据权利要求1所述的微卫星不稳定肠癌能谱CT碘水图影像组学特征处理方法,其特征在于,所述采用ROC方法对L2正则化Logistic回归模型进行评价的具体过程如下:
S71、假设所述肠癌样本图像的数量为n,所述MSI肠癌能谱CT碘水图像的数量为n1,MSS肠癌能谱CT碘水图像的数量为n2,降维处理后的组学特征数量为m;
S72、根据m个降维处理后的组学特征,构建L2正则化Logistic回归模型并对其进行内部验证,得到每个肠癌样本图像中属于MSI肠癌能谱CT碘水图像的概率P;
S73、对P中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;
S74、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;
S75、将所述肠癌样本图像的类别与新特征p”相匹配,得到混淆矩阵Ti’;其中,MSI肠癌能谱CT碘水图像的类别为1类,MSS肠癌能谱CT碘水图像的类别为0类;
S76、根据混淆矩阵Ti’,计算出与其对应的敏感度sensitivityi'、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);
S77、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;
S78、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到ROC曲线,进而得出ROC曲线下面积AUC值;
S79、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵Tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911269293.2A CN111028223B (zh) | 2019-12-11 | 2019-12-11 | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201911269293.2A CN111028223B (zh) | 2019-12-11 | 2019-12-11 | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN111028223A CN111028223A (zh) | 2020-04-17 |
| CN111028223B true CN111028223B (zh) | 2023-11-07 |
Family
ID=70206052
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201911269293.2A Active CN111028223B (zh) | 2019-12-11 | 2019-12-11 | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN111028223B (zh) |
Families Citing this family (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN112183557A (zh) * | 2020-09-29 | 2021-01-05 | 山西医科大学 | 基于胃癌组织病理图像纹理特征的msi预测模型构建方法 |
| CN112651955A (zh) * | 2020-12-30 | 2021-04-13 | 深圳大学 | 一种肠道图像的识别方法及终端设备 |
| CN113362932B (zh) * | 2021-06-24 | 2023-02-17 | 河北大学 | 一种基于cc-注意力机制的影像组学特征筛选方法 |
| CN113921079B (zh) * | 2021-12-06 | 2022-03-18 | 四川省肿瘤医院 | 基于免疫相关基因的msi预测模型构建方法 |
| CN115132327B (zh) | 2022-05-25 | 2023-03-24 | 中国医学科学院肿瘤医院 | 微卫星不稳定预测系统及其构建方法、终端设备及介质 |
| CN117540346B (zh) * | 2024-01-09 | 2024-03-19 | 四川国蓝中天环境科技集团有限公司 | 大气污染数据高维回归建模的秩序类别变量冗余去除方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107220966A (zh) * | 2017-05-05 | 2017-09-29 | 郑州大学 | 一种基于影像组学的脑胶质瘤分级预测方法 |
| CN108460809A (zh) * | 2017-02-22 | 2018-08-28 | 西门子保健有限责任公司 | 用于前列腺癌检测和分类的深度卷积编码器-解码器 |
| WO2019172621A1 (ko) * | 2018-03-09 | 2019-09-12 | 연세대학교 산학협력단 | 질환 예측 방법 및 이를 이용한 질환 예측 디바이스 |
| CN110472629A (zh) * | 2019-08-14 | 2019-11-19 | 青岛大学附属医院 | 一种基于深度学习的病理图像自动识别系统及其训练方法 |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10438699B2 (en) * | 2016-05-10 | 2019-10-08 | Macau University Of Science And Technology | Method and system for determining an association of biological features with a medical condition |
| US10441225B2 (en) * | 2018-02-21 | 2019-10-15 | Case Western Reserve University | Predicting disease recurrence following trimodality therapy in non-small cell lung cancer using computed tomography derived radiomic features and clinico-pathologic features |
-
2019
- 2019-12-11 CN CN201911269293.2A patent/CN111028223B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN108460809A (zh) * | 2017-02-22 | 2018-08-28 | 西门子保健有限责任公司 | 用于前列腺癌检测和分类的深度卷积编码器-解码器 |
| CN107220966A (zh) * | 2017-05-05 | 2017-09-29 | 郑州大学 | 一种基于影像组学的脑胶质瘤分级预测方法 |
| WO2019172621A1 (ko) * | 2018-03-09 | 2019-09-12 | 연세대학교 산학협력단 | 질환 예측 방법 및 이를 이용한 질환 예측 디바이스 |
| CN110472629A (zh) * | 2019-08-14 | 2019-11-19 | 青岛大学附属医院 | 一种基于深度学习的病理图像自动识别系统及其训练方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN111028223A (zh) | 2020-04-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN111028223B (zh) | 一种微卫星不稳定肠癌能谱ct碘水图影像组学特征处理方法 | |
| Wu et al. | Artificial intelligence-assisted system for precision diagnosis of PD-L1 expression in non-small cell lung cancer | |
| Wang et al. | A novel approach combined transfer learning and deep learning to predict TMB from histology image | |
| CN110916666B (zh) | 一种预测手术切除肝细胞癌复发的影像组学特征处理方法 | |
| CN114171115A (zh) | 一种差异性甲基化区域筛选方法及其装置 | |
| CN111755073B (zh) | 基于转录组的pd-1疗法治疗效果预测系统 | |
| WO2007089583A9 (en) | Systems and methods for statistical genomic dna based analysis and evaluation | |
| CN115440383B (zh) | 用于预测晚期癌症患者pd-1/pd-l1单抗治疗疗效的系统 | |
| CN107305596A (zh) | 肝门部胆管癌患者预后预测模型 | |
| CN115274119B (zh) | 一种融合多影像组学特征的免疫治疗预测模型的构建方法 | |
| Du Terrail et al. | Collaborative federated learning behind hospitals’ firewalls for predicting histological response to neoadjuvant chemotherapy in triple-negative breast cancer | |
| CN117497059B (zh) | 一种基于单细胞空间转录图谱的肺腺癌预后分子筛选方法 | |
| Zargar et al. | Using VGG16 Algorithms for classification of lung cancer in CT scans Image | |
| CN111584064A (zh) | 一种结、直肠癌转移预测系统及其使用方法 | |
| CN110930402B (zh) | 一种基于子宫内膜癌的dki序列mk图的影像组学特征处理方法 | |
| Tong et al. | Unveiling the distinctive variations in multi-omics triggered by TP53 mutation in lung cancer subtypes: An insight from interaction among intratumoral microbiota, tumor microenvironment, and pathology | |
| CN110055331A (zh) | 一种用于膀胱癌辅助诊断或筛查的试剂盒及其应用 | |
| Schroeder et al. | Scaling up spatial transcriptomics for large-sized tissues: uncovering cellular-level tissue architecture beyond conventional platforms with iSCALE | |
| Forjaz et al. | Three-dimensional assessments are necessary to determine the true spatial tissue composition of diseased tissues. | |
| CN110930401B (zh) | 一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法 | |
| CN116364179A (zh) | 结直肠癌预后标志物筛选系统及方法、结直肠癌预后风险评估系统 | |
| CN116168826A (zh) | 一种可解释的乳腺癌血液miRNA诊断系统构建的方法 | |
| CN115595370A (zh) | 一种用于非小细胞肺癌分型诊断的基因转录本标记物组合及分型诊断装置 | |
| Wu et al. | A multivariate to multivariate approach for voxel‐wise genome‐wide association analysis | |
| CN105018585B (zh) | 一种预测甲状腺肿瘤良恶性的试剂盒 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |