CN114120057A - 一种基于PaddleDetection的混淆矩阵生成方法 - Google Patents
一种基于PaddleDetection的混淆矩阵生成方法 Download PDFInfo
- Publication number
- CN114120057A CN114120057A CN202111320510.3A CN202111320510A CN114120057A CN 114120057 A CN114120057 A CN 114120057A CN 202111320510 A CN202111320510 A CN 202111320510A CN 114120057 A CN114120057 A CN 114120057A
- Authority
- CN
- China
- Prior art keywords
- paddledetection
- matrix
- detection
- confusion matrix
- detection frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种基于PaddleDetection的混淆矩阵生成方法,包括:在PaddlePaddle平台下运用PaddleDetection目标检测开发套件训练目标检测网络;获取有标注的测试数据集,分为两个文件夹,一个文件夹放json文件,另一个放对应的图片文件,并得到真实的目标物体外接矩形框;运用infer.py图片文件进行预测,得到预测标签;得出预测修正得到的矩形检测框;将真实矩形框与预测修正得到的矩形检测框进行循环匹配,将统计得到的值记录在矩阵上;创建excle表格,将记录的矩阵填充到excle表格中,绘制出用于评价模型实际应用效果的混淆矩阵,本发明方法能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
Description
技术领域
本发明涉及深度学习目标检测领域,特别是指一种基于PaddleDetection的混淆矩阵生成方法。
背景技术
飞桨(PaddlePaddle)是集深度学习核心框架、工具组件和服务平台为一体的百度自主研发的开源深度学习平台。PaddleDetection是飞桨深度学习平台下的优秀的目标检测开发套件,提供多种主流目标检测、实例分割、关键点检测算法,并且将各个网络组件进行模块化、提供数据增强策略、损失函数策略等,模型的压缩和跨平台的的高性能部署能够帮助工业项目更好的完成落地。
对于目标检测而言,检测识别的准确率很大程度上取决于模型本身的识别精度,因此前期在对神经网络识别模型进行训练的时候需要找到一个合适的适合实际生产的评价指标。在PaddleDetection套件中评价神经网络模型评价指标是通过mAP来进行评价,不能反应实际分拣中的各个类别的识别精度。
混淆矩阵(Confusion Matrix)也称误差矩阵,用n行n列的矩阵来表示。在人工智能图像分类精度的评价中,主要用于比较分类结果和实际测得的值。混淆矩阵的每一列代表了预测类别,每一列的总数表示预测为该类别的数据的数目;每一行代表了数据的真实归属类别,每一行的数据总数表示该类别的数据实例的数目。每一列中的数值表示真实数据被预测为该类的数目.如图1所示,第一行第一列中的96表示有96个实际归属第一类的实例被预测为第一类,同理,第一行第二列的2表示有2个实际归属为第一类的实例被错误预测为第二类,依次类推。
发明内容
本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于PaddleDetection的混淆矩阵生成方法,能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
本发明采用如下技术方案:
步骤一,在PaddlePaddle平台下运用PaddleDetection目标检测开发套件训练一个目标检测网络。
步骤二,准备一批新的有标注的测试数据集,分为两个文件夹,一个文件夹放json文件,另一个放对应的图片文件。运用openCV的rect函数对json文件下的轮廓标签进行处理可以得到真实的目标物体外接矩形框;
步骤三,运用PaddleDetection开发套件下的infer.py对步骤二中的图片文件进行预测,得到预测标签;
步骤四,以图片文件的数量i来循环遍历,利用模型对每张图片进行预测,得到图片中每个物体的检测框,对物体的检测框进行iou判断,对于同类且iou大于阈值的检测框删除其他的框,仅保留置信度得分最高的检测框、对于不同类的且iou大于阈值的,只保留一个检测框,其他的删除,并把相应的标签改为others,由此便可以得到预测修正后的矩形检测框;
步骤五,将步骤二得出的真实的目标物体外接矩形框与步骤四预测修正得到的矩形检测框进行循环匹配,将统计得到的值记录在矩阵上;
步骤六,创建excle表格,将步骤五得出的矩阵填充到表格中,绘制出用于评价模型实际应用效果的混淆矩阵。
由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
(1)本发明提出一种基于PaddleDetection的混淆矩阵生成方法,能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
附图说明
图1为混淆矩阵的示例图;
图2为本发明实施例中iou的计算方法;
图3为本发明实施例中删除目标检测预测的重叠框的示意图;
图4为本发明实施例中匹配预测框与真实框的程序流程示意图;
图5为本发明实施例得出的混淆矩阵示意图。
以下结合附图和具体实施例对本发明作进一步详述。
具体实施方式
本发明提出一种基于PaddleDetection的混淆矩阵生成方法,用于评价神经网络模型对实际目标检测的识别效果,所述神经网络为包括Mask-RCNN在内的目标检测网络;本发明提供的方法能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便我们对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
本发明具体实施例以生活垃圾后端分选的实际工况为例。采集的图片数据为生活垃圾低值可回收物在传送带上的图片,运用labelme对图片数据进行标注,将图片中的目标物体分为十个类别,包括Trans_HDPE、Color_HDPE、White_HDPE、Trans_PP、White_PP、Black_PP、Color_PP、Trans_PET、Bottle_PET、Others。
参照图2、图3、图4、图5具体步骤如下:
步骤一,采集并标注生活垃圾低值可回收物数据集12000张,80%划为训练集和20%验证集。使用GPU进行训练,计算机配置为Windows10,Intel(R)i5-10400F CPU,NVIDIA GeForce GTX3090显卡,24G显存,平台为PaddlePaddle。使用PaddleDetection 2.0版本开发套件静态版本中的Mask_RCNN神经网络模型,训练的初始学习率为0.00125,最大迭代步数max_iters为48000步,训练得到目标检测网络模型;
步骤二,准备一批新的有标注的测试数据集,分为两个文件夹,一个文件夹放json文件,另一个放对应的图片文件;json文件为通过labelme标注生成的json文件,里面记录每个目标物体的种类及位置信息等。运用openCV的rect函数对json文件下的轮廓标签进行处理可以得到真实的目标物体外接矩形框。
步骤三,以步骤二中图片文件的数量i来循环遍历,利用步骤一训练得到的目标检测模型导出并在PaddleDetection2.0开发套件下执行infer.py对步骤二中的每张图片进行预测,将会得到np_boxes的列表,每一个np_boxes包含图片中每个物体的矩形检测框、类别、置信度。
步骤四,由于工况复杂的情况下,神经网络模型预测存在复选框和重叠框,会对最终检测精度的统计造成影响,因此需要对预测框进行修正。预测框位置可能与实际框存在微小的差别,经过实验统计预测框与实际框的iou值大于0.7即认为两个框试重合的,因此设iou阈值为0.7。
图片中每个目标物体的预测结果由步骤三得出,每个目标物体经过步骤三的预测都会得出一个或多个np_boxes,每一个np_boxes包含图片中每个物体的矩形检测框、类别、置信度。图片中的每个目标物体的实际结果由步骤二得出,每张图片目标物体的真实标签存放在对应的json文件中,运用标签中目标物体的点坐标可以得出目标物体的最小外接矩形框。
对于同一个物体如果预测结果有多个np_boxes(每一个np_boxes包含图片中每个物体的矩形检测框、类别、置信度),比较预测的每个np_boxes。对于同一个物体预测的每一个np_boxes都是同类的情况,保留iou(iou的计算方法如图2所示)大于阈值且置信度得分最高的np_boxes,删除其他的np_boxes;对于同一个物体预测的np_boxes属于不同类的情况,保留iou大于阈值且置信度得分最高的np_boxes并把相应的类别标签改为others,删除其它的np_boxes,单个物体的预测标签修正如图3所示,由此便可以得到预测修正后的矩形检测框。
步骤五,用步骤二得到的真实标签与步骤四修正的预测标签进行比对,匹配流程图如图4所示。程序的最外层循环以需要预测的图片数量来遍历,接着第二层循环以每张图片中的预测标签数量来循环,第三层循环以每张图片的实际标签数量来循环,通过每个物体的实际标签与预测标签进行iou判断,当iou大于阈值0.7即认为匹配到位,在矩阵的对应位置上计数。如果实际标签没有匹配到预测标签即认为是漏识别的也在矩阵对应的位置上进行统计。
步骤六,创建excle表格将记录的矩阵填充到表格中,绘制出混淆矩阵,纵向为实际类别,横向为预测类别,如图5所示。图5所示神经网络模型为11分类(包括背景),以第一行为例,实际中有64个Color_PP被正确识别成Color_PP,有10个被错误识别成Black_PP,以此类推。
本发明提出一种基于PaddleDetection的混淆矩阵生成方法,能通过目标检测网络预测的检测框与实际的目标检测框进行匹配,将匹配的实际结果记录下来,绘制在混淆矩阵上,以便对于模型各个种类的识别结果进行统计研究,优化网络模型的训练方法。
上述仅为本发明的具体实施方式,但本发明的设计构思并不局限于此,凡利用此构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
Claims (1)
1.一种基于PaddleDetection的混淆矩阵生成方法,其特征在于,包括以下步骤:
步骤一,在PaddlePaddle平台下运用PaddleDetection目标检测开发套件训练目标检测网络;
步骤二,获取有标注的测试数据集,分为两个文件夹,一个文件夹存放json文件,另一个存放对应的图片文件;运用openCV的rect函数对json文件下的轮廓标签进行处理可以得到真实的目标物体外接矩形框;
步骤三,运用PaddleDetection开发套件下的infer.py对步骤二中的图片文件进行预测,得到预测标签;
步骤四,以图片文件的数量i来循环遍历,利用模型对每张图片进行预测,得到图片中每个物体的矩形检测框,对物体的检测框进行iou判断,对于同类且iou大于阈值的检测框,保留置信度得分最高的检测框;对于不同类的且iou大于阈值的,仅保留一个检测框,并把相应的标签改为others,得到预测修正后的矩形检测框;
步骤五,将步骤二得出的真实的目标物体外接矩形框矩形框与步骤四预测修正后的矩形检测框进行循环匹配,将统计得到的值记录在矩阵上;
步骤六,创建excle表格,将步骤五得出的矩阵填充到表格中,绘制出用于评价模型实际应用效果的混淆矩阵。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111320510.3A CN114120057B (zh) | 2021-11-09 | 2021-11-09 | 一种基于PaddleDetection的混淆矩阵生成方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN202111320510.3A CN114120057B (zh) | 2021-11-09 | 2021-11-09 | 一种基于PaddleDetection的混淆矩阵生成方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN114120057A true CN114120057A (zh) | 2022-03-01 |
| CN114120057B CN114120057B (zh) | 2025-01-17 |
Family
ID=80377811
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN202111320510.3A Active CN114120057B (zh) | 2021-11-09 | 2021-11-09 | 一种基于PaddleDetection的混淆矩阵生成方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN114120057B (zh) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116204670A (zh) * | 2023-04-27 | 2023-06-02 | 菲特(天津)检测技术有限公司 | 车辆目标检测数据的管理方法、系统及电子设备 |
| CN116665223A (zh) * | 2023-05-06 | 2023-08-29 | 中国科学院软件研究所 | 一种表格结构识别精准度评估方法 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080154807A1 (en) * | 2006-12-22 | 2008-06-26 | Yahoo! Inc. | Confusion matrix for classification systems |
| CN109597965A (zh) * | 2018-11-19 | 2019-04-09 | 深圳力维智联技术有限公司 | 基于深度神经网络的数据处理方法、系统、终端及介质 |
| CN111275082A (zh) * | 2020-01-14 | 2020-06-12 | 中国地质大学(武汉) | 一种基于改进端到端神经网络的室内物体目标检测方法 |
| CN111401148A (zh) * | 2020-02-27 | 2020-07-10 | 江苏大学 | 一种基于改进的多级YOLOv3的道路多目标检测方法 |
| CN111444809A (zh) * | 2020-03-23 | 2020-07-24 | 华南理工大学 | 一种基于改进YOLOv3的输电线路异常目标检测方法 |
| CN112149808A (zh) * | 2020-09-28 | 2020-12-29 | 上海交通大学 | 拓展单机图神经网络训练至分布式训练方法、系统及介质 |
-
2021
- 2021-11-09 CN CN202111320510.3A patent/CN114120057B/zh active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20080154807A1 (en) * | 2006-12-22 | 2008-06-26 | Yahoo! Inc. | Confusion matrix for classification systems |
| CN109597965A (zh) * | 2018-11-19 | 2019-04-09 | 深圳力维智联技术有限公司 | 基于深度神经网络的数据处理方法、系统、终端及介质 |
| CN111275082A (zh) * | 2020-01-14 | 2020-06-12 | 中国地质大学(武汉) | 一种基于改进端到端神经网络的室内物体目标检测方法 |
| CN111401148A (zh) * | 2020-02-27 | 2020-07-10 | 江苏大学 | 一种基于改进的多级YOLOv3的道路多目标检测方法 |
| CN111444809A (zh) * | 2020-03-23 | 2020-07-24 | 华南理工大学 | 一种基于改进YOLOv3的输电线路异常目标检测方法 |
| CN112149808A (zh) * | 2020-09-28 | 2020-12-29 | 上海交通大学 | 拓展单机图神经网络训练至分布式训练方法、系统及介质 |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116204670A (zh) * | 2023-04-27 | 2023-06-02 | 菲特(天津)检测技术有限公司 | 车辆目标检测数据的管理方法、系统及电子设备 |
| CN116204670B (zh) * | 2023-04-27 | 2023-07-21 | 菲特(天津)检测技术有限公司 | 车辆目标检测数据的管理方法、系统及电子设备 |
| CN116665223A (zh) * | 2023-05-06 | 2023-08-29 | 中国科学院软件研究所 | 一种表格结构识别精准度评估方法 |
| CN116665223B (zh) * | 2023-05-06 | 2025-08-12 | 中国科学院软件研究所 | 一种表格结构识别精准度评估方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN114120057B (zh) | 2025-01-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN110569701B (zh) | 计算机执行的车辆定损方法及装置 | |
| CN112085024A (zh) | 一种罐表面字符识别方法 | |
| CN110929795B (zh) | 高速焊线机焊点快速识别与定位方法 | |
| CN111860494A (zh) | 图像目标检测的优化方法、装置、电子设备和存储介质 | |
| CN108052523A (zh) | 基于卷积神经网络的赌博网站识别方法和系统 | |
| CN112926694A (zh) | 基于改进的神经网络对图像中的猪只进行自动识别的方法 | |
| CN107016409A (zh) | 一种基于图像显著区域的图像分类方法和系统 | |
| CN110674808A (zh) | 一种变电站压板状态智能识别方法及装置 | |
| CN114359199A (zh) | 一种基于深度学习的鱼类计数方法、装置、设备和介质 | |
| CN109284779A (zh) | 基于深度全卷积网络的物体检测方法 | |
| CN112446259A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
| CN112184679A (zh) | 一种基于YOLOv3的酒瓶瑕疵自动检测方法 | |
| CN110648323B (zh) | 一种缺陷检测分类系统及其方法 | |
| CN109816634A (zh) | 检测方法、模型训练方法、装置及设备 | |
| CN115294039A (zh) | 一种钢卷端面缺陷检测方法 | |
| CN115661582A (zh) | 一种训练深度学习模型的方法、装置、电子设备及存储介质 | |
| CN113591931A (zh) | 一种弱监督目标定位方法、装置、设备及介质 | |
| CN114120057A (zh) | 一种基于PaddleDetection的混淆矩阵生成方法 | |
| CN113420839B (zh) | 用于堆叠平面目标物体的半自动标注方法及分割定位系统 | |
| CN116342525A (zh) | 基于Lenet-5模型的SOP芯片引脚缺陷检测方法及系统 | |
| CN115909493A (zh) | 一种面向课堂实录视频的教师不当手势检测方法及系统 | |
| CN114648792A (zh) | 基于多特征融合的表情识别方法及装置 | |
| CN118334001A (zh) | 基于nmcdp框架的工业图像缺陷检测方法、设备及介质 | |
| CN117636379A (zh) | 一种基于深度学习的表格识别方法 | |
| CN112084103B (zh) | 界面测试方法、装置、设备和介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant |