CN109902629A - 一种复杂交通场景下的实时车辆目标检测模型 - Google Patents
一种复杂交通场景下的实时车辆目标检测模型 Download PDFInfo
- Publication number
- CN109902629A CN109902629A CN201910154171.2A CN201910154171A CN109902629A CN 109902629 A CN109902629 A CN 109902629A CN 201910154171 A CN201910154171 A CN 201910154171A CN 109902629 A CN109902629 A CN 109902629A
- Authority
- CN
- China
- Prior art keywords
- model
- target detection
- real
- learning
- feature map
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 52
- 230000006870 function Effects 0.000 claims abstract description 18
- DRADWUUFBCYMDM-UHFFFAOYSA-L [hydroxy(oxido)phosphinothioyl] 3,7,11-trimethyldodeca-2,6,10-trienyl phosphate Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCOP([O-])(=O)OP(O)([O-])=S DRADWUUFBCYMDM-UHFFFAOYSA-L 0.000 claims abstract description 11
- 238000000605 extraction Methods 0.000 claims abstract description 10
- 238000011176 pooling Methods 0.000 claims description 9
- 230000004913 activation Effects 0.000 claims description 6
- 230000010339 dilation Effects 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 239000000284 extract Substances 0.000 claims description 3
- 238000002513 implantation Methods 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 abstract description 3
- 230000004927 fusion Effects 0.000 abstract description 3
- 230000004048 modification Effects 0.000 abstract 1
- 238000012986 modification Methods 0.000 abstract 1
- 238000005457 optimization Methods 0.000 abstract 1
- 238000013461 design Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 230000007547 defect Effects 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 238000000034 method Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011897 real-time detection Methods 0.000 description 2
- 238000002679 ablation Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000020169 heat generation Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000011551 log transformation method Methods 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T10/00—Road transport of goods or passengers
- Y02T10/10—Internal combustion engine [ICE] based vehicles
- Y02T10/40—Engine management systems
Landscapes
- Image Analysis (AREA)
Abstract
本发明创造提供一种复杂交通场景下的实时车辆目标检测模型,包括改进Tiny YOLO模型并将其作为基础网络模型用于图片特征提取;利用多尺度特征结构增强模型,提高对不同尺寸目标的学习能力;通过修改传统目标检测损失函数上增强模型对于难学物体的学习能力;对于传统目标检测增加两个超参数,用于调节数据集中不同学习难度目标的数量差距,平衡模型的学习倾向,防止模型只学习占多数的易学物体而完全放弃学习少数的难学物体。本发明通过优化传统Tiny YOLO模型,大幅度削减网络的参数量,还设计了一种新的多尺寸特征融合结构FSPP以维持网络的检测精度,并且针对数据集中远距离车辆难以检测的问题改进了损失函数,进一步提高车辆目标检测的精度。
Description
技术领域
本发明创造属于深度学习车辆目标检测技术领域,尤其是涉及一种复杂交通场景下的实时车辆目标检测模型。
背景技术
车辆目标检测是自动驾驶中的关键技术之一,需要对车载摄像头采集到视频的每一帧图片中的车辆,行人等进行检测,并给出对应的检测框位置和分类结果。现阶段最先进的检测技术,如Mask RCNN,YOLO,SSD等均基于卷积神经网络实现。其中YOLO模型由于其端到端的设计,使得实现过程简单,并且仅对图片提取一次特征,速度很快,成为经典的目标检测模型之一。但是缺陷在于,模型包含大量权重,导致检测时模型的计算量以及占用的内存极高,仅能在 GPU上同时满足检测精度与检测速度。但GPU由于价格昂贵,体积庞大,发热量高,无法装载在汽车上。而低成本的嵌入式平台由于计算速度慢,内存小,加载模型后无法达到实时检测的效果。
发明内容
本发明创造要解决的问题是旨在克服上述现有技术中存在的缺陷,提出一种复杂交通场景下的实时车辆目标检测模型。
为解决上述技术问题,本发明创造的技术方案是这样实现的:
一种复杂交通场景下的实时车辆目标检测模型,包括:
改进Tiny YOLO模型并将其作为基础网络模型用于图片特征提取;
通过截取部分传统Tiny YOLO网络模型结构,并适当缩小模型中部分层所使用卷积核的数量,使得模型能够适合植入在嵌入式平台中;
利用多尺度特征结构增强模型,提高对不同尺寸目标的学习能力;
通过使用不同空洞率的卷积层对基础网路提取到的图片特征图进行进一步提取,从而可以获得不同感受野尺寸下的图片特征,将其融合,能够使得深层特征图囊括不同尺寸的特征信息,增强学习能力;
修改传统目标检测损失函数上增强模型对于难学物体的学习能力;
对于传统目标检测增加两个超参数,用于调节数据集中不同学习难度目标的数量差距,平衡模型的学习倾向,防止模型只学习占多数的易学物体而完全放弃学习少数的难学物体,进一步增强模型的鲁棒性。
进一步,改进Tiny YOLO模型同时,维持当前基础模型对于图片特征的提取能力。
进一步,改进的Tiny YOLO模型SPTNet由卷积层、批处理层、最大池化层、以及激活层构成,其中,卷积层是使用固定尺寸的卷积核在特征图上滑动,并通过对应乘加计算得到新的特征图的像素值;批处理层是对卷积层输出的特征图进行批处理操作,将特征图的分布转化为正态分布;最大池化层是在特征图中滑动地选取2*2的网格中的最大值来形成新的特征图;激活层是对特征图进行激活操作,将其中负值全部设为0,不占据任何内存。
进一步,SPTNet结构包括基础网络模型以及FSPP结构,其中,基础网络模型用于提取图片特征,FSPP结构用于融合图像的多尺度特征。
进一步,基础网络模型主要由6个卷积层和最大池化层构成,主要负责从图像中提取出与目标相关的语义特征和空间特征,形成特征图。
进一步,特征图的尺寸相较于原始图片的尺寸缩小了32倍,特征图上每一个像素的感受野大小为32*32。
进一步,SPTNet主要是通过削减各层卷积层的通道数来降低网络的参数量和计算量。
进一步,SPTNet主要是削减模型后端卷积层的通道数量,而保留浅层卷积层的通道数量,以维持模型的特征提取能力。
本发明创造具有的优点和积极效果是:
本发明通过优化传统Tiny YOLO模型,大幅度削减了网络的参数量,同时设计了一种新的多尺寸特征融合结构FSPP以维持网络的检测精度,并且针对数据集中远距离车辆难以检测的问题改进了损失函数,使得网络检测车辆的精度进一步提高。
附图说明
图1是本发明模型的结构图;
图2是FSPP结构图;
图3是数据集中远近距离车辆对比图;
图4是模型中各部件消融实验结果对比图;
图5是部分数据集模型测试图。
具体实施方式
需要说明的是,在不相冲突的情况下,本发明创造中的实施例及实施例中的特征可以相互组合。
为了在嵌入式平台上实现实时车辆检测,同时达到一定的检测精度。本发明设计了一种轻量级的车辆检测模型,解决现有目标检测模型权重数量多,检测时间长,无法移植到嵌入式平台等缺陷。下面对本发明创造的具体实施例做详细说明。
一种复杂交通场景下的实时车辆目标检测模型,如图1至5所示,包括:
1.改进Tiny YOLO模型并将其作为基础网络模型用于图片特征提取;
Tiny YOLO由于其端到端的模型设计,快速的检测速度和精确的检测能力,是目前常用的轻量级目标检测模型之一。
然而由于Tiny YOLO模型的参数量和计算量过高,导致模型在嵌入式平台上无法达到实时检测的速度需求。同时,通过对Tiny YOLO网络权重的统计分析,网络中大部分权重值接近于0,这意味着这些权重均是冗余的,因此,合理削减网络权重并不会影响网络的学习能力。
通过借鉴Tiny YOLO的网络结构设计加以改进,提出了一种新的轻量化检测模型——SPTNet,其网络结构如图1所示。SPTNet由四种部件构成,分别是卷积层(convolution layer),批处理层(BatchNorm layer),最大池化层(MaxPooling layer)以及激活层(Relu layer)。
其中卷积层是使用固定尺寸的卷积核在特征图上滑动,并通过对应乘加计算得到新的特征图的像素值,批处理层是对卷积层输出的特征图进行批处理操作,将特征图的分布转化为正态分布。最大池化层是在特征图中滑动地选取2*2 的网格中的最大值来形成新的特征图,而激活层是对特征图进行激活操作,将其中负值全部设为0,计算量很低,并且不占据任何内存。
SPTNet结构可分为两部分,第一部分为基础网络模型,用于提取图片特征,第二部分为FSPP结构,用于融合图像的多尺度特征。基础网络模型主要由6个卷积层和最大池化层构成,主要负责从图像中提取出与目标相关的语义特征和空间特征,形成特征图,此时特征图的尺寸相较于原始图片的尺寸缩小了32倍,特征图上每一个像素的感受野大小为32*32。
在基础网络模型中,由于车辆检测任务仅仅检测车辆,目标相似度高,特征提取难度相对较低,因此SPTNet主要通过削减各层卷积层的通道数来降低网络的参数量和计算量,而根据给出的结论,网络模型的浅层卷积层的通道数量对模型的特征提取能力影响较大,因此SPTNet主要削减了模型后端卷积层的通道数量,而保留浅层卷积层的通道数量,以维持模型的特征提取能力。SPTNet 与Tiny YOLO网络结构对比如表1。
表1 SPTNet与Tiny YOLO结构对比表
2.设计一种新的多尺度特征结构增强模型对于不同尺寸目标的学习能力
为了增强网络对于不同尺度的特征学习,在网络结构中加入了FSPP结构来增强模型对于多尺度特征的学习能力,结构如图2所示。
FSPP结构主要由三个卷积核大小为3*3的空洞卷积层和一个卷积核大小为1*1的标准卷积层组成,并将这四层卷积层输出的特征图在通道维上进行连接,形成新的特征图进行类别和位置的回归。其中空洞卷积层是通过在卷积核中插入特定数量的0,在不增加网络参数量的前提下改变卷积核的大小。假设卷积核尺寸为K,空洞率dilation为D,则扩张后的卷积核尺寸为K+2(D-1),而标准卷积层则是空洞率为1的特殊空洞卷积层。
通过扩大卷积核的尺寸,可以增加深层特征图上像素的感受野范围,使得像素能够融合浅层特征图上更多像素的信息。而通过整合不同空洞率的卷积核捕捉到的特征图,可以更有效的捕捉物体在不同尺度下的特征。
在交通环境中,由于摄像头的拍摄距离较远,因此远近车辆在图像中的大小不一,如图3所示。因此提高模型捕捉车辆的多尺寸特征的能力能够提升模型的检测精度。
3.修改传统目标检测损失函数上增强模型对于难学物体的学习能力对于网络结构的改进,模型增强了对图像特征的提取能力,然而在数据集中,由于车辆和非车辆的图像面积差距很大,容易导致模型更倾向于学习背景特征,因此为了解决这个问题,对损失函数进行了一定改进。传统的目标检测的损失函数比较复杂,一般由三个部分构成,定位损失函数,IoU损失函数,以及分类损失函数。
其中第一部分是计算关于检测框坐标的loss,其中表示在第i个grid 里预测的第j个bounding box含有obj,而λcoord表示调节coordErr占据整个loss 的权重值。
第二部分是计算关于IoU的loss,其中λnoobj表示当模型预测出的 bounding box无法匹配到任何ground truth时所计算出loss的调节系数。由于模型预测出来的大部分bounding box实际上都是不包含任何obj,因此为了平衡正负检测结果的样本比例,一般将λnoobj设为0.5,以此削弱负样本对于loss的影响程度。
第三部分是计算关于分类的loss,
然而当前目标检测的损失函数其主要缺陷在于无法区分被学习物体的难易程度,对于易学物体和难学物体都会给予同样的梯度惩罚,而当易学物体较多的时候,模型会倾向于拟合易学物体,而完全放弃对难学物体的学习,这样一方面浪费了模型的学习能力,另一方面会隐式地为模型学习的精确度设置上限。
而在交通场景下,由于如卡车,货车等体积庞大,特征明显,易于被网络捕捉到特征并加以学习,而小轿车,面包车等体积较小,容易被网络忽略。在传统的损失函数的设计中,并没有将二者显式的区分开来,从而向后传导的梯度惩罚完全相同,这就导致网络在学习的过程当中更加倾向于学习大型车辆,而忽略小型车辆,但在现实应用中这种情况是完全不能接受的。
此外,对于同类对象中,也会存在某些物体比其他物体更加难学的情况,例如在实验中我们发现在黑夜中深色的车辆比浅色的车辆的检测精度更低,距离较远的车辆比距离较近的车辆检测效果更差。为了解决上述问题,在损失函数中增加了两个系数α和γ来对目标物体的难易程度进行约束,公式如下:
Loss=-a*(1-f(loss))γ*logf(loss),
f(x)=e-x
当一个目标物体越难区分时,传统的损失函数数值将会越大,则经过的变换之后,其数值会趋近于0,因而log变换下的损失函数值将会增大,此时再通过系数进行数值变换,可以扩张当前的损失函数,因此进一步扩张惩罚梯度,增强网络对困难目标的学习。而针对不同的类别,可以选择不同的加以区分,这样的话可以增强网络对某一类物体的学习强度。通过实验表明,α=0.3,γ=2时实验效果较好。
本发明通过优化传统Tiny YOLO模型,大幅度削减了网络的参数量,同时设计了一种新的多尺寸特征融合结构FSPP以维持网络的检测精度,并且针对数据集中远距离车辆难以检测的问题改进了损失函数,使得网络检测车辆的精度进一步提高。相较于原先的TinyYOLO模型的44.9M下降到15.3M,可在ZYNQ-7020 芯片上达到20fps(frames per second)的检测速度,并且在自采集的车辆数据集当中达到77.65%的mAP。
对于本领域技术人员而言,显然本发明创造不限于上述示范性实施例的细节,而且在不背离本发明创造的精神或基本特征的情况下,能够以其他的具体形式实现本发明创造。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明创造的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明创造内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。
此外,应当理解,虽然本说明书按照实施方式加以描述,但并非每个实施方式仅包含一个独立的技术方案,说明书的这种叙述方式仅仅是为清楚起见,本领域技术人员应当将说明书作为一个整体,各实施例中的技术方案也可以经适当组合,形成本领域技术人员可以理解的其他实施方式。
Claims (8)
1.一种复杂交通场景下的实时车辆目标检测模型,其特征在于,包括:
改进Tiny YOLO模型并将其作为基础网络模型用于图片特征提取;
通过截取部分传统Tiny YOLO网络模型结构,并适当缩小模型中部分层所使用卷积核的数量,使得模型能够适合植入在嵌入式平台中;
利用多尺度特征结构增强模型,提高对不同尺寸目标的学习能力;
通过使用不同空洞率的卷积层对基础网路提取到的图片特征图进行进一步提取,从而可以获得不同感受野尺寸下的图片特征,将其融合;
修改传统目标检测损失函数上增强模型对于难学物体的学习能力;
对于传统目标检测增加两个超参数,用于调节数据集中不同学习难度目标的数量差距,平衡模型的学习倾向,防止模型只学习占多数的易学物体而完全放弃学习少数的难学物体。
2.根据权利要求1所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:改进Tiny YOLO模型同时,维持当前基础模型对于图片特征的提取能力。
3.根据权利要求1所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:改进的Tiny YOLO模型SPTNet由卷积层、批处理层、最大池化层、以及激活层构成,其中,卷积层是使用固定尺寸的卷积核在特征图上滑动,并通过对应乘加计算得到新的特征图的像素值;批处理层是对卷积层输出的特征图进行批处理操作,将特征图的分布转化为正态分布;最大池化层是在特征图中滑动地选取2*2的网格中的最大值来形成新的特征图;激活层是对特征图进行激活操作,将其中负值全部设为0,不占据任何内存。
4.根据权利要求3所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:SPTNet结构包括基础网络模型以及FSPP结构,其中,基础网络模型用于提取图片特征,FSPP结构用于融合图像的多尺度特征。
5.根据权利要求4所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:基础网络模型主要由6个卷积层和最大池化层构成,主要负责从图像中提取出与目标相关的语义特征和空间特征,形成特征图。
6.根据权利要求5所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:特征图的尺寸相较于原始图片的尺寸缩小了32倍,特征图上每一个像素的感受野大小为32*32。
7.根据权利要求3至6任一项所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:SPTNet通过削减各层卷积层的通道数来降低网络的参数量和计算量。
8.根据权利要求7所述的一种复杂交通场景下的实时车辆目标检测模型,其特征在于:SPTNet削减模型后端卷积层的通道数量,而保留浅层卷积层的通道数量,以维持模型的特征提取能力。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910154171.2A CN109902629A (zh) | 2019-03-01 | 2019-03-01 | 一种复杂交通场景下的实时车辆目标检测模型 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201910154171.2A CN109902629A (zh) | 2019-03-01 | 2019-03-01 | 一种复杂交通场景下的实时车辆目标检测模型 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN109902629A true CN109902629A (zh) | 2019-06-18 |
Family
ID=66945984
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201910154171.2A Pending CN109902629A (zh) | 2019-03-01 | 2019-03-01 | 一种复杂交通场景下的实时车辆目标检测模型 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN109902629A (zh) |
Cited By (10)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110263732A (zh) * | 2019-06-24 | 2019-09-20 | 京东方科技集团股份有限公司 | 多尺度目标检测方法及装置 |
| CN110728310A (zh) * | 2019-09-27 | 2020-01-24 | 聚时科技(上海)有限公司 | 一种基于超参数优化的目标检测模型融合方法及融合系统 |
| CN111191621A (zh) * | 2020-01-03 | 2020-05-22 | 北京同方软件有限公司 | 一种大焦距监控场景下多尺度目标的快速精准识别方法 |
| CN111597868A (zh) * | 2020-01-08 | 2020-08-28 | 浙江大学 | 一种基于ssd的变电站隔离开关状态分析方法 |
| CN111639623A (zh) * | 2020-06-09 | 2020-09-08 | 中国地质大学(武汉) | 结合空间距离约束的多尺度船企场景识别与提取方法 |
| CN112154454A (zh) * | 2019-09-10 | 2020-12-29 | 深圳市大疆创新科技有限公司 | 目标对象的检测方法、系统、设备及存储介质 |
| CN112966697A (zh) * | 2021-03-17 | 2021-06-15 | 西安电子科技大学广州研究院 | 基于场景语义的目标检测方法、装置、设备及存储介质 |
| CN113052237A (zh) * | 2021-03-25 | 2021-06-29 | 中国工商银行股份有限公司 | 目标对象的检测方法、装置和服务器 |
| CN113994391A (zh) * | 2021-09-23 | 2022-01-28 | 深圳市锐明技术股份有限公司 | 车辆通行提醒方法、装置及车载终端 |
| CN117197571A (zh) * | 2023-09-12 | 2023-12-08 | 阳光智维科技股份有限公司 | 一种光伏组件故障检测方法、装置、电子设备及存储介质 |
Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107358596A (zh) * | 2017-04-11 | 2017-11-17 | 阿里巴巴集团控股有限公司 | 一种基于图像的车辆定损方法、装置、电子设备及系统 |
| US20180068198A1 (en) * | 2016-09-06 | 2018-03-08 | Carnegie Mellon University | Methods and Software for Detecting Objects in an Image Using Contextual Multiscale Fast Region-Based Convolutional Neural Network |
| CN108510012A (zh) * | 2018-05-04 | 2018-09-07 | 四川大学 | 一种基于多尺度特征图的目标快速检测方法 |
| CN108537197A (zh) * | 2018-04-18 | 2018-09-14 | 吉林大学 | 一种基于深度学习的车道线检测预警装置及预警方法 |
| CN108647665A (zh) * | 2018-05-18 | 2018-10-12 | 西安电子科技大学 | 基于深度学习的航拍车辆实时检测方法 |
| CN108830131A (zh) * | 2018-04-10 | 2018-11-16 | 中科院微电子研究所昆山分所 | 基于深度学习的交通目标检测与测距方法 |
| CN108875600A (zh) * | 2018-05-31 | 2018-11-23 | 银江股份有限公司 | 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质 |
| CN109101966A (zh) * | 2018-06-08 | 2018-12-28 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的工件识别定位和姿态估计系统和方法 |
| CN109190662A (zh) * | 2018-07-26 | 2019-01-11 | 北京纵目安驰智能科技有限公司 | 一种基于关键点回归的车辆三维检测方法、系统、终端和存储介质 |
| CN109285376A (zh) * | 2018-08-09 | 2019-01-29 | 同济大学 | 一种基于深度学习的公交车客流统计分析系统 |
| CN109363698A (zh) * | 2018-10-16 | 2019-02-22 | 杭州依图医疗技术有限公司 | 一种乳腺影像征象识别的方法及装置 |
-
2019
- 2019-03-01 CN CN201910154171.2A patent/CN109902629A/zh active Pending
Patent Citations (12)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20180068198A1 (en) * | 2016-09-06 | 2018-03-08 | Carnegie Mellon University | Methods and Software for Detecting Objects in an Image Using Contextual Multiscale Fast Region-Based Convolutional Neural Network |
| CN107358596A (zh) * | 2017-04-11 | 2017-11-17 | 阿里巴巴集团控股有限公司 | 一种基于图像的车辆定损方法、装置、电子设备及系统 |
| US20180293552A1 (en) * | 2017-04-11 | 2018-10-11 | Alibaba Group Holding Limited | Image-based vehicle maintenance plan |
| CN108830131A (zh) * | 2018-04-10 | 2018-11-16 | 中科院微电子研究所昆山分所 | 基于深度学习的交通目标检测与测距方法 |
| CN108537197A (zh) * | 2018-04-18 | 2018-09-14 | 吉林大学 | 一种基于深度学习的车道线检测预警装置及预警方法 |
| CN108510012A (zh) * | 2018-05-04 | 2018-09-07 | 四川大学 | 一种基于多尺度特征图的目标快速检测方法 |
| CN108647665A (zh) * | 2018-05-18 | 2018-10-12 | 西安电子科技大学 | 基于深度学习的航拍车辆实时检测方法 |
| CN108875600A (zh) * | 2018-05-31 | 2018-11-23 | 银江股份有限公司 | 一种基于yolo的车辆信息检测和跟踪方法、装置及计算机存储介质 |
| CN109101966A (zh) * | 2018-06-08 | 2018-12-28 | 中国科学院宁波材料技术与工程研究所 | 基于深度学习的工件识别定位和姿态估计系统和方法 |
| CN109190662A (zh) * | 2018-07-26 | 2019-01-11 | 北京纵目安驰智能科技有限公司 | 一种基于关键点回归的车辆三维检测方法、系统、终端和存储介质 |
| CN109285376A (zh) * | 2018-08-09 | 2019-01-29 | 同济大学 | 一种基于深度学习的公交车客流统计分析系统 |
| CN109363698A (zh) * | 2018-10-16 | 2019-02-22 | 杭州依图医疗技术有限公司 | 一种乳腺影像征象识别的方法及装置 |
Non-Patent Citations (5)
| Title |
|---|
| MDUDUZI MANANA 等: "A survey on vehicle detection based on convolution neural networks", 《2017 3RD IEEE INTERNATIONAL CONFERENCE ON COMPUTER AND COMMUNICATIONS》 * |
| 王万良 等: "基于空间金字塔和特征集成的智能机器人目标检测算法", 《计算机集成制造系统》 * |
| 罗雨珊: "基于cnn的车辆目标检测关键技术研究与设计", 《中国优秀博硕士学位论文全文数据库(硕士)工程科技Ⅱ辑》 * |
| 肖永杰: "基于卷积神经网络的多尺度车辆检测及其域自适应研究", 《中国优秀博硕士学位论文全文数据库(硕士)信息科技辑》 * |
| 陈飞 等: "基于多尺度特征融合的Faster-RCNN道路目标检测", 《中国计量大学学报》 * |
Cited By (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN110263732A (zh) * | 2019-06-24 | 2019-09-20 | 京东方科技集团股份有限公司 | 多尺度目标检测方法及装置 |
| CN110263732B (zh) * | 2019-06-24 | 2022-01-21 | 京东方科技集团股份有限公司 | 多尺度目标检测方法及装置 |
| CN112154454A (zh) * | 2019-09-10 | 2020-12-29 | 深圳市大疆创新科技有限公司 | 目标对象的检测方法、系统、设备及存储介质 |
| CN110728310A (zh) * | 2019-09-27 | 2020-01-24 | 聚时科技(上海)有限公司 | 一种基于超参数优化的目标检测模型融合方法及融合系统 |
| CN110728310B (zh) * | 2019-09-27 | 2023-09-01 | 聚时科技(上海)有限公司 | 一种基于超参数优化的目标检测模型融合方法及融合系统 |
| CN111191621A (zh) * | 2020-01-03 | 2020-05-22 | 北京同方软件有限公司 | 一种大焦距监控场景下多尺度目标的快速精准识别方法 |
| CN111597868A (zh) * | 2020-01-08 | 2020-08-28 | 浙江大学 | 一种基于ssd的变电站隔离开关状态分析方法 |
| CN111639623B (zh) * | 2020-06-09 | 2022-04-26 | 中国地质大学(武汉) | 结合空间距离约束的多尺度船企场景识别与提取方法 |
| CN111639623A (zh) * | 2020-06-09 | 2020-09-08 | 中国地质大学(武汉) | 结合空间距离约束的多尺度船企场景识别与提取方法 |
| CN112966697A (zh) * | 2021-03-17 | 2021-06-15 | 西安电子科技大学广州研究院 | 基于场景语义的目标检测方法、装置、设备及存储介质 |
| CN113052237A (zh) * | 2021-03-25 | 2021-06-29 | 中国工商银行股份有限公司 | 目标对象的检测方法、装置和服务器 |
| CN113994391A (zh) * | 2021-09-23 | 2022-01-28 | 深圳市锐明技术股份有限公司 | 车辆通行提醒方法、装置及车载终端 |
| CN113994391B (zh) * | 2021-09-23 | 2023-06-09 | 深圳市锐明技术股份有限公司 | 车辆通行提醒方法、装置及车载终端 |
| CN117197571A (zh) * | 2023-09-12 | 2023-12-08 | 阳光智维科技股份有限公司 | 一种光伏组件故障检测方法、装置、电子设备及存储介质 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109902629A (zh) | 一种复杂交通场景下的实时车辆目标检测模型 | |
| CN111274976B (zh) | 基于视觉与激光雷达多层次融合的车道检测方法及系统 | |
| CN111104898B (zh) | 基于目标语义和注意力机制的图像场景分类方法及装置 | |
| WO2024051296A1 (zh) | 一种复杂天气下障碍物检测方法及装置 | |
| CN117037004B (zh) | 基于多尺度特征融合和上下文增强的无人机影像检测方法 | |
| CN111695633B (zh) | 基于rpf-cam的低照度目标检测方法 | |
| CN113420607A (zh) | 无人机多尺度目标检测识别方法 | |
| CN110490256A (zh) | 一种基于关键点热图的车辆检测方法 | |
| CN108305260B (zh) | 一种图像中角点的检测方法、装置及设备 | |
| CN107563372A (zh) | 一种基于深度学习ssd框架的车牌定位方法 | |
| CN111209858B (zh) | 一种基于深度卷积神经网络的实时车牌检测方法 | |
| CN108647655A (zh) | 基于轻型卷积神经网络的低空航拍影像电力线异物检测方法 | |
| CN113361466A (zh) | 一种基于多模态交叉指导学习的多光谱目标检测方法 | |
| CN111160100A (zh) | 一种基于样本生成的轻量级深度模型航拍车辆检测方法 | |
| CN112070070A (zh) | 一种用于城市遥感场景识别的lw-cnn方法和系统 | |
| CN119152453B (zh) | 一种基于Mamba架构的红外高速公路异物检测方法 | |
| CN116012686A (zh) | 一种引入动态位置损失的改进YOLOv6目标检测方法 | |
| CN111340019A (zh) | 基于Faster R-CNN的粮仓害虫检测方法 | |
| TWI696958B (zh) | 影像適應性特徵提取法及其應用 | |
| CN120107313A (zh) | 一种基于YOLOv8模型和Byte Track算法的多目标追踪方法 | |
| CN118505671A (zh) | 一种铜带缺陷检测方法 | |
| CN114332754A (zh) | 基于多度量检测器的Cascade R-CNN行人检测方法 | |
| CN119445070A (zh) | 一种基于改进轻量化YOLOv8模型的夜间红外检测方法及系统 | |
| CN111797795A (zh) | 一种基于YOLOv3与SSR的行人检测算法 | |
| CN119131886A (zh) | 一种基于改进YOLOv8的密集行人检测方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| WD01 | Invention patent application deemed withdrawn after publication | ||
| WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20190618 |