CN110084800B - 一种用于四肢软组织肉瘤病人的肺转移预测方法 - Google Patents
一种用于四肢软组织肉瘤病人的肺转移预测方法 Download PDFInfo
- Publication number
- CN110084800B CN110084800B CN201910350067.0A CN201910350067A CN110084800B CN 110084800 B CN110084800 B CN 110084800B CN 201910350067 A CN201910350067 A CN 201910350067A CN 110084800 B CN110084800 B CN 110084800B
- Authority
- CN
- China
- Prior art keywords
- data
- tumor
- suv
- region
- features
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/24323—Tree-organised classifiers
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/25—Determination of region of interest [ROI] or a volume of interest [VOI]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/40—Extraction of image or video features
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10072—Tomographic images
- G06T2207/10104—Positron emission tomography [PET]
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30096—Tumor; Lesion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Radiology & Medical Imaging (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Quality & Reliability (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Nuclear Medicine (AREA)
- Magnetic Resonance Imaging Apparatus (AREA)
Abstract
本发明公开了一种用于四肢软组织肉瘤病人的肺转移预测方法,该方法包含:S1、利用PET图像的标准摄取值对所有被试进行特征提取,包括SUV特征及纹理特征;S2、利用one‑hot编码方法对所有被试的临床信息进行特征提取;S3、利用随机森林算法对所有特征进行特征贡献度排序,对高贡献度特征进行融合,并利用BP神经网络构建四肢软组织肉瘤病人肺转移预测模型。本发明能利用更少的病人特征更准确得预测四肢软组织肉瘤患者的肺转移情况。
Description
技术领域
本发明涉及用于四肢软组织肉瘤病人的肺转移预测系统及方法,具体是指一种融合PET图像及临床特征用于四肢软组织肉瘤病人的肺转移预测系统及方法。
背景技术
肉瘤是一组高度异质的肿瘤,根据组织发生中相似的成人组织类型分类。其特征是侵袭性或破坏性生长,可以复发和远处转移。作为肉瘤之一,软组织肉瘤(STSs)可以发生在身体的任何部位,其中59%起源于肢体。不幸的是,10%-20%的肉瘤或STS患者在诊断时有远处转移。随访过程中转移率约为30%-40%,其中肺转移占约90%。此外,对肺转移瘤切除的预后因素的认识存在很大的不足,切除后的复发率很高。因此,早期筛查和预测肺转移可以帮助STS患者在早期找到相应的治疗措施,提高患者的生存率。
评估肺转移风险的最常用方法是从组织病理学样本中研究肿瘤的异质性,而尚不清楚不同克隆亚组或克隆与实体瘤如STS中的微环境之间的生物学关系,以便获得的样本信息同样受采样区域的影响,且实体癌是空间和时间异质的。因此,从分子水平的角度来研究肿瘤的异质性是很困难的。从医学图像中提取大量特征可以解决这个问题,因为放射学有能力在非侵入性中捕获肿瘤内异质性。仅从单个STS图像获得的特征是有限的,并且可能忽略更多其他的模态数据,例如临床数据。
因此,针对现有的利用影像数据构建四肢软组织肉瘤病人肺转移预测模型的方法还有待进一步发展与提高,需要在更加深入研究的基础上,提出更加完善的技术方案。
发明内容
本发明的目的是提供一种用于四肢软组织肉瘤病人的肺转移预测方法,融合PET图像和临床特征,利用随机森林袋外法进行特征排序挑选出高贡献度的特征,通过BP神经网络构建四肢软组织肉瘤肺转移预测模型。
为了实现以上目的,本发明是通过以下技术方案实现的:
一种用于四肢软组织肉瘤病人的肺转移预测方法,其特点是,包括如下步骤:
S1,采集四肢软组织肉瘤患者的临床数据和PET图像数据;
S2,对采集到的PET图像数据与预先标定的肿瘤区域进行融合得到感兴趣的区域,同时计算SUV,对临床数据进行合并整理,所述SUV为标准摄取值;
S3,对所述的感兴趣的区域进行特征提取,并利用one-hot编码方法对临床数据进行文本特征提取;
S4,合并所有特征,并利用随机森林算法及双样本T检验算法对所有特征进行特征贡献度排序;
S5,选取贡献度高的特征,利用反向传播神经网络构建四肢软组织肉瘤患者的肺转移预测模型。
所述的步骤S2包括如下步骤:
S2.1,对采集到的数据提取肿瘤区域数据,具体为:对于每个被试,利用专业医生勾勒的肿瘤区域,定位四肢软组织肉瘤患者PET影像的原始数据中的肿瘤体素区域,所述的肿瘤体素区域记为感兴趣的区域,然后提取每个被试的感兴趣的区域;
S2.2,计算感兴趣的区域中的SUV,同时对所有临床数据进行合并整理。
所述的步骤S3包括:
S3.1,提取PET图像的SUV特征,所述的SUV特征包括SUVmax、SUVpeak、SUVmean、AUC-CSH和PercentInactive,其中SUVmax表示肿瘤区域的最大SUV值;SUVpeak表示肿瘤区域与其相邻居之间平均值,取最大值;SUVmean表示肿瘤区域的平均SUV值;AUC-CSH表示累积标准摄取值体积直方图曲线下面积,描述总肿瘤体积百分比超过最大SUV阈值的百分比;PercentInactive表示不活跃肿瘤区域的百分比;
S3.2,对临床数据进行文本特征提取:利用one-hot编码方法对临床文本信息进行特征提取,所述的临床文本信息包括:年龄、性别、生存状态、肿瘤分化水平、肿瘤类型、肿瘤位置或治疗方式中的一种或几种。
所述的步骤S4包括:
S4.1,融合所有特征将其合并得到特征矩阵,其中行为样本,列为所有的特征,最后一列表示每个被试是否肺转移的标签,肺转移为1,非肺转移为0,基于特征矩阵和每个被试的标签,利用重采样方法对所有被试进行随机划分N组,划分每组中一部分的数据作为袋内数据,即训练集,剩下一部分的数据作为袋外数据,即测试数据。
S4.2,N组数据即对应随机森林中的N颗决策树,对于每一颗决策树,使用相应的袋外数据来计算它的袋外数据误差,记为err1。
S4.3,随机地对袋外数据所有样本的特征M加入噪声干扰,再次计算该颗决策树的袋外数据误差,记为err2,因此,对于特征M的重要性可计算为IM=∑(err1-err2)/N,其中IM值越大,则特征M的重要性更高,对预测模型的贡献度更高。
所述的步骤S5包括:
S5.1,将所有的被试随机分为三组,包括训练集、测试集和验证集。
S5.2,基于随机森林挑选出的高贡献度的特征,构建BP神经网络模型,输入层神经元数目为特征个数,设置隐层神经元数目,输出层的神经元个数为标签类型数量,设置最高迭代次数、最小梯度、初始参数随机及激活函数。
S5.3,随机打乱样本顺序,重复步骤S5.1和步骤S5.2的操作N次,其N次的均值作为模型性能结果,以避免局部最优,其中训练集、验证集和测试集准确率、敏感性和特征性最高的模型即为最终的预测模型,选取其中性能最好的模型作为最终的预测模型。
本发明与现有技术相比,具有以下优点:
1.提出了一种基于PET图像和临床信息的特征融合方法,用于获得四肢软组织肉瘤肺转移预测的特征。
2.采用机器学习的方法,包括随机森林和BP神经网络,通过消除不相关或冗余的特征来选择有效特征,然后构建肺转移的预测模型。所提出的融合特征模型的预测能力明显优于单独使用图像或临床特征的模型,包括准确性,特异性还是敏感性。
附图说明
图1为本发明一种用于四肢软组织肉瘤病人的肺转移预测方法的流程图。
具体实施方式
以下结合附图,通过详细说明一个较佳的具体实施例,对本发明做进一步阐述。
如图1所示,一种用于四肢软组织肉瘤病人的肺转移预测方法,包括:
步骤1:采集四肢软组织肉瘤患者的临床数据和PET图像数据,其中PET图像数据为DICOM格式,包括51个被试的数据,其中
步骤2:对采集到的图像数据与预先标定的肿瘤区域进行融合得到感兴趣的区域(ROI),同时计算标准摄取值(SUV值),对临床数据进行合并整理;
在具体实施例中,该步骤2包括:
步骤2.1,对采集到的数据提取肿瘤区域数据,具体方法如下,对于每个被试,利用专业医生勾勒的肿瘤区域,定位四肢软组织肉瘤患者PET影像的原始DICOM数据中的肿瘤体素区域,记为ROI,然后将每个被试的ROI提取出来;
步骤2.2,计算ROI区域的标准摄取值(SUV),具体方法如下:利用公式SUV=病灶的放射性浓度/注射计量*体重,逐一计算每个被试肿瘤部分的SUV值。同时对所有临床数据进行合并整理。
步骤3:基于预处理的数据,对ROI进行特征提取,包括SUV特征及纹理特征,利用one-hot编码方法对临床数据进行文本特征提取;
在具体实施例中,该步骤3包括:
步骤3.1,提取PET图像的SUV特征,具体方法如下,SUV特征包括5个,即SUVmax、SUVpeak、SUVmean、AUC-CSH和PercentInactive。其中SUVmax表示肿瘤区域的最大SUV值;SUVpeak表示肿瘤区域与其相邻居之间平均值,取最大值;SUVmean表示肿瘤区域的平均SUV值;AUC-CSH表示累积SUV体积直方图曲线下面积,描述总肿瘤体积百分比超过最大SUV阈值的百分比;PercentInactive表示不活跃肿瘤区域的百分比。
步骤3.2,提取四肢软组织肉瘤患者的临床特征,具体方法如下,利用one-hot编码方法对临床文本信息进行特征提取,如性别包括男性和女性,男性编码为01,女性编码为10,其它文本特征也按照这种方法进行特征选取,包括年龄、性别、生存状态、肿瘤分化水平、肿瘤类型、肿瘤位置及治疗方式。
在具体实施例中,该步骤4包括:
步骤4:合并所有特征,并利用随机森林算法及双样本T检验算法对所有特征进行特征贡献度排序,上述合并所有特征包括:SUV特征、纹理特征及文本特征;
步骤4.1,融合所有特征将其合并得到特征矩阵,其中行为样本,列为所有的特征,最后一列表示每个被试是否肺转移的标签,肺转移为1,非肺转移为0,基于特征矩阵和每个被试的标签,利用Bootstrap重采样方法对所有被试进行随机划分N组,其中每组中的2/3的数据作为袋内数据,即训练集,1/3的数据作为袋外数据,即测试数据。
步骤4.2,N组数据即对应随机森林中的N颗决策树,对于每一颗决策树,使用相应的袋外数据来计算它的袋外数据误差,记为err1。
步骤4.3,随机地对袋外数据所有样本的特征M加入噪声干扰,再次计算该颗决策树的袋外数据误差,记为err2,因此,对于特征M的重要性可计算为IM=∑(err1-err2)/N,其中IM值越大,则特征M的重要性更高,对预测模型的贡献度更高。
步骤5:选取贡献度高的特征,利用BP神经网络构建四肢软组织肉瘤患者的肺转移预测模型。
在具体实施例中,该步骤5包括:
步骤5.1,将所有的被试随机分为三组,包括训练集、测试集和验证集。
步骤5.2,基于随机森林挑选出的高贡献度的特征,构建BP神经网络模型,输入层神经元数目为特征个数,隐层神经元数目为10,输出层的神经元个数为2,设置最高迭代数为1000,最小梯度为0.001,初始参数随机,激活函数为sigmod函数。
步骤5.3,随机打乱样本顺序,重复步骤5.1和步骤5.2的操作100次,其100次的均值作为模型性能结果,以避免局部最优,其中训练集、验证集和测试集准确率、敏感性和特征性最高的模型即为最终的预测模型,选取其中性能最好的模型作为最终的预测模型。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。
Claims (2)
1.一种用于四肢软组织肉瘤病人的肺转移预测方法,其特征在于,包括如下步骤:
S1,采集四肢软组织肉瘤患者的临床数据和PET图像数据;
S2,对采集到的PET图像数据与预先标定的肿瘤区域进行融合得到感兴趣的区域,同时计算SUV,对临床数据进行合并整理,所述SUV为标准摄取值;
S3,对所述的感兴趣的区域进行特征提取,并利用one-hot编码方法对临床数据进行文本特征提取;
S4,合并所有特征,并利用随机森林算法及双样本T检验算法对所有特征进行特征贡献度排序;
S5,选取贡献度高的特征,利用反向传播神经网络构建四肢软组织肉瘤患者的肺转移预测模型;
所述的步骤S2包括如下步骤:
S2.1,对采集到的数据提取肿瘤区域数据,具体为:对于每个被试,利用专业医生勾勒的肿瘤区域,定位四肢软组织肉瘤患者PET影像的原始数据中的肿瘤体素区域,所述的肿瘤体素区域记为感兴趣的区域,然后提取每个被试的感兴趣的区域;
S2.2,计算感兴趣的区域中的SUV,同时对所有临床数据进行合并整理;
所述的步骤S3包括:
S3.1,提取PET图像的SUV特征,所述的SUV特征包括SUVmax、SUVpeak、SUVmean、AUC-CSH和PercentInactive,其中SUVmax表示肿瘤区域的最大SUV值;SUVpeak表示肿瘤区域与其相邻居之间平均值,取最大值;SUVmean表示肿瘤区域的平均SUV值;AUC-CSH表示累积标准摄取值体积直方图曲线下面积,描述总肿瘤体积百分比超过最大SUV阈值的百分比;PercentInactive表示不活跃肿瘤区域的百分比;
S3.2,对临床数据进行文本特征提取:利用one-hot编码方法对临床文本信息进行特征提取,所述的临床文本信息包括:年龄、性别、生存状态、肿瘤分化水平、肿瘤类型、肿瘤位置或治疗方式中的一种或几种;所述的步骤S4包括:
S4.1,融合所有特征将其合并得到特征矩阵,其中行为样本,列为所有的特征,最后一列表示每个被试是否肺转移的标签,肺转移为1,非肺转移为0,基于特征矩阵和每个被试的标签,利用重采样方法对所有被试进行随机划分N组,划分每组中一部分的数据作为袋内数据,即训练集,剩下一部分的数据作为袋外数据,即测试数据;
S4.2,N组数据即对应随机森林中的N颗决策树,对于每一颗决策树,使用相应的袋外数据来计算它的袋外数据误差,记为err1 ;
S4.3,随机地对袋外数据所有样本的特征M加入噪声干扰,再次计算该颗决策树的袋外数据误差,记为err2 ,因此,对于特征M的重要性可计算为IM=∑(err1-err2)/N,其中IM值越大,则特征M的重要性更高,对预测模型的贡献度更高。
2.如权利要求1所述的用于四肢软组织肉瘤病人的肺转移预测方法,其特征在于,所述的步骤S5包括:
S5.1,将所有的被试随机分为三组,包括训练集、测试集和验证集;
S5.2,基于随机森林挑选出的高贡献度的特征,构建BP神经网络模型,输入层神经元数目为特征个数,设置隐层神经元数目,输出层的神经元个数为标签类型数量,设置最高迭代次数、最小梯度、初始参数随机及激活函数;
S5.3,随机打乱样本顺序,重复步骤S5.1和步骤S5.2的操作N次,其N次的均值作为模型性能结果,以避免局部最优,其中训练集、验证集和测试集准确率、敏感性和特征性最高的模型即为最终的预测模型,选取其中性能最好的模型作为最终的预测模型。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910350067.0A CN110084800B (zh) | 2019-04-28 | 2019-04-28 | 一种用于四肢软组织肉瘤病人的肺转移预测方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910350067.0A CN110084800B (zh) | 2019-04-28 | 2019-04-28 | 一种用于四肢软组织肉瘤病人的肺转移预测方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN110084800A CN110084800A (zh) | 2019-08-02 |
| CN110084800B true CN110084800B (zh) | 2021-03-16 |
Family
ID=67417293
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910350067.0A Expired - Fee Related CN110084800B (zh) | 2019-04-28 | 2019-04-28 | 一种用于四肢软组织肉瘤病人的肺转移预测方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN110084800B (zh) |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110516759B (zh) * | 2019-09-02 | 2022-09-30 | 河南师范大学 | 一种基于机器学习的软组织肉瘤转移风险预测系统 |
| CN115171905B (zh) * | 2022-06-20 | 2023-04-07 | 复旦大学 | 一种基于独热编码无监督聚类的肿瘤患者相似性计算方法 |
Family Cites Families (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB0913314D0 (en) * | 2009-07-31 | 2009-09-02 | Siemens Medical Solutions | Facilitated percist evaluation |
| US8824752B1 (en) * | 2013-03-15 | 2014-09-02 | Heartflow, Inc. | Methods and systems for assessing image quality in modeling of patient anatomic or blood flow characteristics |
| CN104463840A (zh) * | 2014-09-29 | 2015-03-25 | 北京理工大学 | 基于pet/ct影像的发热待查计算机辅助诊断方法 |
| CN105869137B (zh) * | 2015-01-22 | 2019-02-19 | 山东师范大学 | 一种基于多尺度技术的肿瘤纹理特征的提取方法 |
| CN105427325A (zh) * | 2015-12-07 | 2016-03-23 | 苏州大学 | 基于随机森林和单调下降函数的肺肿瘤的自动分割方法 |
| CN106251313B (zh) * | 2016-08-15 | 2020-06-26 | 上海联影医疗科技有限公司 | 医学成像方法及系统 |
-
2019
- 2019-04-28 CN CN201910350067.0A patent/CN110084800B/zh not_active Expired - Fee Related
Also Published As
| Publication number | Publication date |
|---|---|
| CN110084800A (zh) | 2019-08-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7411619B2 (ja) | 疾患の罹患判定装置、疾患の罹患判定方法及び疾患の罹患判定プログラム | |
| US20200286614A1 (en) | A system and method for automated labeling and annotating unstructured medical datasets | |
| WO2024065987A1 (zh) | 一种基于影像、病理和基因多组学的肺癌预后预测系统 | |
| CN112561869B (zh) | 一种胰腺神经内分泌肿瘤术后复发风险预测方法 | |
| CN117116477B (zh) | 基于随机森林和XGBoost的前列腺癌患病风险预测模型的构建方法及系统 | |
| CN117253625B (zh) | 肺癌筛查模型的构建装置、肺癌筛查装置、设备及介质 | |
| CN111445946A (zh) | 一种利用pet/ct图像推算肺癌基因分型的演算方法 | |
| CN110992312B (zh) | 医学图像处理方法、装置、存储介质及计算机设备 | |
| CN115661149B (zh) | 一种基于肺部组织数据的肺部影像处理系统 | |
| CN118737442A (zh) | 融合多模态数据的产后乳腺健康检测方法 | |
| CN110084800B (zh) | 一种用于四肢软组织肉瘤病人的肺转移预测方法 | |
| Zhang et al. | Developing a weakly supervised deep learning framework for breast cancer diagnosis with HR status based on mammography images | |
| CN113554640A (zh) | Ai模型的训练方法、使用方法、计算机设备及存储介质 | |
| CN113362927A (zh) | 一种基于深度学习的鳞状食道癌放化疗效果预测方法 | |
| CN120408127B (zh) | 基于粗糙集正域与信息熵综合的医学检验指标约简方法 | |
| CN115101197A (zh) | 胰腺癌影像学联合ca19-9诊断模型构建方法、系统及装置 | |
| CN115762786A (zh) | 一种食管癌病人的辅助筛查系统 | |
| Roy et al. | Digital Organ Twins from Single Imaging Scans: A Hybrid Physics-ML Framework for Predictive Medicine | |
| CN116433691B (zh) | 器官周边血管自动分割方法、系统、介质、电子设备 | |
| CN116453648B (zh) | 基于对比学习的康复运动质量评估系统 | |
| CN116487038A (zh) | 轻度认知障碍向阿尔茨海默发展的预测系统和存储介质 | |
| CN115662635A (zh) | 一种对放射性肺炎建立联合回归预测模型的方法 | |
| Ning et al. | Artificial neural network based model for cardiovascular risk stratification in hypertension | |
| Nalla et al. | Influence of Convolutional Neural Network Depth on the Efficacy of Automated Breast Cancer Screening Systems | |
| CN112686091A (zh) | 基于深度神经网络的两步骤心律失常分类方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20210316 |
|
| CF01 | Termination of patent right due to non-payment of annual fee |