CN106709568A - 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 - Google Patents
基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 Download PDFInfo
- Publication number
- CN106709568A CN106709568A CN201611168200.3A CN201611168200A CN106709568A CN 106709568 A CN106709568 A CN 106709568A CN 201611168200 A CN201611168200 A CN 201611168200A CN 106709568 A CN106709568 A CN 106709568A
- Authority
- CN
- China
- Prior art keywords
- frame
- network
- images
- rcnn
- fcn
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/084—Backpropagation, e.g. using gradient descent
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/40—Scenes; Scene-specific elements in video content
- G06V20/41—Higher-level, semantic clustering, classification or understanding of video scenes, e.g. detection, labelling or Markovian modelling of sport events or news items
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本发明公开了基于深层卷积网络的RGB‑D图像的物体检测和语义分割方法,属于深度学习及机器视觉领域。本方法采用的技术方案中使用Faster‑RCNN替换原来缓慢的RCNN,Faster‑RCNN使用GPU不仅在提取特征方面拥有很快速度,而且在网络中能同时产生区域方案,能够实现整个训练过程是端到端的训练,同时使用FCN执行RGB‑D图像的语义分割,FCN使用GPU和深层卷积网络快速提取图像的深层特征,利用反卷积操作把图像卷积的深层特征和浅层特征进行融合,把图像的局部语义信息融入到全局语义信息中。
Description
技术领域
本发明属于深度学习及机器视觉领域,尤其涉及一种包含RGB-D图像的物体检测和语义分割方法,这在现实场景中具有非常广泛的应用,例如在监控视频中对行人进行检测与跟踪、无人机导航、自动驾驶等。
背景技术
物体检测和语义分割是计算机视觉的两个重要研究领域,物体检测主要用于检测图像中物体的位置以及物体的类别,物体检测的主要有两个任务,一是找出物体的区域方案(Region Proposals),区域方案是一种预选边框,代表着一个物体在图像中的大致位置;二是对预选边框中的物体进行分类。语义分割解决的问题是对图像的每一个像素点赋以正确的标签,语义分割主要应用于场景理解并且存在很多潜在的应用。随着深层卷积神经网络的兴起,基于深层卷积神经网络的物体检测已成为目前最为盛行的检测算法,同样基于(Region Proposals)的语义分割已成为目前最为盛行的语义分割算法。
一、比较盛行的用于产生Region Proposals的方法如下。
传统的产生Region Proposals的方法有很多种,比如选择性搜索(SelectiveSearch),根据图像的不同颜色特征(如HSV颜色空间,Lab颜色空间等)合并超像素(具有相似特征的相邻像素块),一张图像在CPU模式下使用选择性搜索产生Region Proposals的时间为2s。多尺度组合分组(MCG),需要在多种缩放尺度下根据轮廓特征合并超像素产生区域候选方案,然后根据区域方案的面积、周长、边界强度等二维特征进行排名。边缘边框(EdgeBoxes),使用滑动窗口的方法产生区域方案,利用边缘信息(边框内的轮廓个数和与边框边缘重叠的轮廓个数),对Region Proposals进行排序。上面这些方法都是在CPU模式下进行。区域方案网络(Region Proposals Network,简称RPN)能够在GPU模式下利用深层卷积神经网络提取图像特征的同时产生的Region Proposals。这使得物体检测的速度得到很大提高。
二、快速的用于物体检测的区域深层卷积神经网络如下。
随着快速的区域深层卷积神经网络在物体检测的速度和准确率上的明显提高,随后出现了很多更快的深层卷积神经网络,比如Faster-RCNN由两个网络组成,一个是RPN,用于产生Region Proposals,一个是快速的区域深层卷积神经网络,用于物体识别;YOLO把物体边框的选择与识别进行了结合,经过一次网络同步完成,但是YOLO对一幅图像产生的区域方案只有98个,导致物体边框的精确度比较低;SSD是在每一层特征图像上产生默认边框,优点是对于低分辨率的输入图像,也能产生高精确度的边框,缺点是检测系统对边框的大小很敏感,对于小物体,检测性能较差;R-FCN是一种基于FCN的物体检测网络,该网络舍弃了分类器层,把全连接层转变为卷积层,主干网络选择ResNet-101,并且提出了一种对物体位置敏感的映射方法来解决物体的平移可变性。
三、语义分割网络如下。
全卷积网络改编自卷积神经网络,它使用卷积层代替全连接层。为了实现图像的语义分割,FCN采用的方法是对深层特征图像执行一个或多个反卷积操作,使得深层特征图像的尺寸和原图像尺寸一样,然后利用Softmax分类器对每一个像素点进行分类,它实现了针对整张图片的端到端的像素到像素的语义分割,但反卷积操不能考虑到下采样过程中失真信息。SegNet不采取反卷积操作,而是对深层特征图像执行逐层上采样操作,同样使得深层特征图像的尺寸和原图像尺寸一样,然后利用Softmax分类器对每一个像素点进行分类,它考虑了图像在卷积过程因为下采样而失去的失真信息,但这样会带来很大的内存消耗。DeepLab模型在FCN之后添加一个条件随机场(Conditional Random Field,简称CRF)的后处理操作,对分割后的图像在边缘细节方面进行优化,但是这个处理过程不是端到端的处理过程,为了解决这个问题,CRFasRNN把CRF和深度学习技术进行结合,使得整个网络结构是一个端到端的可训练的网络。
以上这些研究工作主要集中在RGB彩色图像上,随着深度图像传感器的普及,例如Intel RealSense 3D Camera、Asus Xtion PRO LIVE、Microsoft Kinect,越来越多的研究者都把研究重心转移到RGB-D图像上,例如物体检测、三维重建、机器人视觉、虚拟现实、图像分割等。图像分割主要集中在语义分割、实例分割、情景标签等领域。
关于RGB-D图像的研究,其中最典型的是Gupta等人在RCNN的基础上充分使用了RGB-D图像研究物体检测,以及基于超像素特征的语义分割。物体检测过程中他们提出一种新颖的把深度图像转变为三通道图像的转变方法,并把这三通道命名为HHA,首先使用多尺度组合分组的方法产生区域方案,然后分别训练RGB和HHA的RCNN,合并这两个网络提取的特征,最后使用支持向量机对每个区域方案进行分类。语义分割过程中,基于超像素的深度特征(以地球为中心的姿态)和几何特征(大小、形状)利用支持向量机对超像素进行类别标签的预言,但是该方法非常缓慢,使用多尺度组合分组的方法产生区域方案是一种非常缓慢的过程,使用速度缓慢并且冗余的RCNN,训练分为多个流水线阶段,计算超像素的特征是一个复杂并缓慢的过程。
发明内容
为了解决上面这些问题,本方法采用的技术方案中使用Faster-RCNN替换原来缓慢的RCNN,Faster-RCNN使用GPU不仅在提取特征方面拥有很快速度,而且在网络中能同时产生区域方案,能够实现整个训练过程是端到端的训练,同时使用FCN执行RGB-D图像的语义分割,FCN使用GPU和深层卷积网络快速提取图像的深层特征,利用反卷积操作把图像卷积的深层特征和浅层特征进行融合,把图像的局部语义信息融入到全局语义信息中。
为了实现上述目的,本发明采用的技术方案为基于深层卷积网络的RGB-D图像的物体检测和语义分割方法,关于物体检测和语义分割任务,本方法的内容在于:
S1、通过RGB图像计算灰度图像,通过灰度图像和HHA图像合并成HHG图像。如图2所示,HHA三个通道的离散傅里叶变换的光学图像中,有最明显的区别是A通道的离散傅里叶变换,其体现在直流分量即横纵坐标轴的强度很微弱,故舍去这个通道。由于RGB三个通道的离散傅里叶变换的光学图像都相似而且直流分量的强度也强烈,使用RGB图像的灰度图像替换HHA图像的中的A通道图像,所以使用融合RGB图像和深度图像的三通道图像为HHG图像。
S2、使用Faster-RCNN作为HHG图像的物体检测系统。使用HHG图像作为网络的输入数据,通过Faster-RCNN中的RPN产生Region Proposals,通过Fast-RCNN提取RegionProposals的特征,然后对每一个Region Proposals进行分类,本方法的检测结果为,在HHG图像中用一个矩形框标出物体的位置和范围,并且标出该矩形框中物体的类别,如图1中物体检测图所示。
S3、改变非极大值抑制(Non-Maximum Suppression,简称NMS)保留边框的机制,把边框周围的边框数量作为评价因素。如图3所示。具体的步骤如下:
每一个边框是一个5元组(x1,y1,x2,y2,score),其中(x1,y1)是边框左上角的坐标,(x2,y2)是边框右下角的坐标,score是边框中包含物体的置信度。边框首先按照score值对每一个元组进行升序排序。按如下公式计算边框的交比并(Intersection-over-union)重叠率。
其中,O(i,j)表示边框i和边框j的交比并重叠率,inter(i,j)表示边框i和边框j的重叠面积,area(i)表示边框i的面积,area(j)表示框j的面积。对于边框i,统计的数量Sumi,如果Sumi≥δ,舍去边框i,反之保留,n代表边框总数量,δ代表取舍阈值。
S4、利用HHG图像和FCN完成RGB-D图像的语义分割任务。使用HHG图像作为FCN的输入数据,通过FCN提取语义特征并分类后,输出HHG图像中每一个像素点的类别标签,用标签值作为该像素点的像素值。本方法的分割结果为HHG图像中属于同一类别的像素点显示相同的颜色如图1中语义分割图所示。
本文的物体检测和语义分割的结构框架如图1所示。
附图说明
图1 RGB-D图像的物体检测和语义分割的流程图以及效果图
图2 HHG图像和RGB图像,HHA图像对比图
图3减少边框时nms’和top2000对比图
具体实施方式
以下将结合附图和实施例对本发明作进一步详细说明。
本发明将会从以下几个方面进行阐述:RGB图像和深度图像的融合、修改过的NMS、模型的训练以及实验结果。
基于深层卷积网络的RGB-D图像的物体检测和语义分割方法包括如下步骤:
第一、按照上述方法把RGB图像和深度图像融合成HHG图像;
第二、训练物体检测系统模型;
Faster-RCNN的训练方式有三种:一是交替训练(Alternating Training),二是近似联合训练(Approximate Joint Training),三是非近似联合训练(Non-approximateJoint Training)。本方法使用的是交替训练方案,交替训练方案的思路是使区域方案网络和Fast-RCNN共享卷积层参数,微调属于各自网络的参数,这种方案首先训练区域方案网络,其次根据区域方案网络产生的区域方案训练Fast-RCNN模型,然后使用Fast-RCNN模型初始化区域方案网络。这个过程能够重复执行。
本方法使用的是4-步交替训练方案:第一步,使用在ImageNet数据集上预训练的模型初始化网络,训练区域方案网络;第二步,使用第一步的区域方案网络产生的区域方案作为Fast-RCNN的预检测边框,使用在ImageNet数据集上预训练的模型初始化网络,训练Fast-RCNN。第三步,使用第二步训练的网络初始化区域方案网络并训练网络,因为使用了共享卷积层参数,所以这里只微调属于区域方案网络的网络层参数。第四步,同样共享卷积层参数,使用第二步训练的网络初始化Fast-RCNN并微调只属于该网络的网络层参数。我们把第一步和第二步统称为第一阶段,第三步和第四步统称为第二阶段。
本文损失函数的计算方法参考于Faster-RCNN的多任务损失(Multi-task loss)公式,公式表达式如下:
其中,pi表示第i个锚点边框(Anchors box)包含物体的预言概率,表示地面真值(Ground-Truth)标签,如果锚点边框是正例,如果锚点边框是反例,ti表示预言边框i的坐标(4个参数),表示与正例锚点边框有关联的地面真值边框。Lcls表示Softmax分类损失,表示边框回归损失,Ncls表示块大小,实验中Ncls=256。Nreg表示锚点边框的数量,λ表示一个均衡系数,实验中取λ=10,的计算方法参考于Fast-RCNN,公式如下:
第三、训练语义分割系统模型
全卷积的训练时,反向传播同样使用随机梯度下降(Stochastic gradientdescent,简称SGD)进行反向传播,损失是对每一个像素点的Softmax损失进行求和。全卷积的训练网络(本文中只使用Vgg-16网络)分为三种。第一种是在conv7卷积层后执行一个跨步(Stride)为32的反卷积操作(FCN-32s);第二种是对conv7卷积层执行一个跨步为2的反卷积结果与pool4池化层结果执行一个融合(均值),然后对这个融合结果执行一个跨步为16的反卷积操作(FCN-16s);第三种是对三种结果进行融合,这三种结果分别为对conv7执行一个跨步为4的反卷积结果,对pool4池化层执行一个跨步为2的反卷积结果,pool3池化层。利用这个融合结果再进行一次跨步为8的反卷积操作(FCN-8s);其中第二种和第三种方式被称为全卷积网络的跳跃框架。
全卷积网络训练过程通常是使用一个训练好的模型微调FCN-32s网络,然后FCN-16s基于FCN-32s模型微调跳跃框架的模型,最后使用FCN-16s的模型微调FCN-8s的模型。本文沿用这种训练模式,使用FCN-8s训练的模型进行测试,并作为最后的实验结果。
第四、实验结果;
使用RGB彩色图像和深度图像的融合图像---HHG图像进行实验,使用HHG图像实现物体检测的平均正确率为37.6%(表1,第6列),比Gupta等人的结果提高5.1%。
表1:1,2,3列是Gupta等人的实验结果,4-8列是本方法的实验结果,其中nms’代表的是使用修改过的非极大值抑制后的实验。实验结果是平均准确率的百分数。
经过区域方案网络产生的边框数量约有17000个,再经过非极大值抑制处理重叠的边框,剩下2000到3000个边框,这个过程需要的平均时间为0.71s,然后再进行一次修改后的非极大值抑制让边框的数量降低到2,000(±50),这个过程需要的平均时间为0.133s。其中关于δ的取值请参考表2。当边框数量在不同区域(2050到3000之间)时δ的取值(δ∈[8,13])有所不同,当数量低于2050时,不执行修改过的非极大值抑制,当数量大于3000时(这种情况很少出现),取score值最高的2000个框。实验结果的平均正确率在HHG图像的基础上提高1.6%(表1,第7列)。
最后使用VGG-16网络模型作为最终的物体检测实验结果,平均正确率为43.7%(表1,第8列),比Gupta等人的实验结果提高11.2%。
表2:第一行代表经过第一次非极大值抑制处理剩下的边框数量区间,第二行代表δ在不同区间的取值。
关于分割结果如表3所示。本方法使用HHG图像在FCN-8s网络下获得了最好的分割结果,平均交比并从Gupta等人的28.6%提高到30.9%。
表3:40种语义分割标签的IU(%),第一行是Gupta等人的语义分割结果,第二行到第四行是我们使用HHG图像分别在FCN-32s,FCN-16s,FCN-8s网络下的语义分割结果。
Claims (4)
1.基于深层卷积网络的RGB-D图像的物体检测和语义分割方法,其特征在于:
S1、通过RGB图像计算灰度图像,通过灰度图像和HHA图像合并成HHG图像;HHA三个通道的离散傅里叶变换的光学图像中,有最明显的区别是A通道的离散傅里叶变换,其体现在直流分量即横纵坐标轴的强度很微弱,故舍去这个通道;由于RGB三个通道的离散傅里叶变换的光学图像都相似而且直流分量的强度也强烈,使用RGB图像的灰度图像替换HHA图像的中的A通道图像,所以使用融合RGB图像和深度图像的三通道图像为HHG图像;
S2、使用Faster-RCNN作为HHG图像的物体检测系统;使用HHG图像作为网络的输入数据,通过Faster-RCNN中的RPN产生Region Proposals,通过Fast-RCNN提取RegionProposals的特征,然后对每一个Region Proposals进行分类,本方法的检测结果为,在HHG图像中用一个矩形框标出物体的位置和范围,并且标出该矩形框中物体的类别;
S3、改变非极大值抑制即NMS保留边框的机制,把边框周围的边框数量作为评价因素;具体的步骤如下:
每一个边框是一个5元组(x1,y1,x2,y2,score),其中(x1,y1)是边框左上角的坐标,(x2,y2)是边框右下角的坐标,score是边框中包含物体的置信度;边框首先按照score值对每一个元组进行升序排序;按如下公式计算边框的交比并重叠率;
其中,O(i,j)表示边框i和边框j的交比并重叠率,inter(i,j)表示边框i和边框j的重叠面积,area(i)表示边框i的面积,area(j)表示框j的面积;对于边框i,统计的数量Sumi,如果Sumi≥δ,舍去边框i,反之保留,n代表边框总数量,δ代表取舍阈值;
S4、利用HHG图像和FCN完成RGB-D图像的语义分割任务;使用HHG图像作为FCN的输入数据,通过FCN提取语义特征并分类后,输出HHG图像中每一个像素点的类别标签,用标签值作为该像素点的像素值。
2.根据权利要求1所述的基于深层卷积网络的RGB-D图像的物体检测和语义分割方法,其特征在于:
Faster-RCNN的训练方式有三种:一是交替训练,二是近似联合训练,三是非近似联合训练;本方法使用的是交替训练方案,交替训练方案的思路是使区域方案网络和Fast-RCNN共享卷积层参数,微调属于各自网络的参数,这种方案首先训练区域方案网络,其次根据区域方案网络产生的区域方案训练Fast-RCNN模型,然后使用Fast-RCNN模型初始化区域方案网络;这个过程能够重复执行。
3.根据权利要求2所述的基于深层卷积网络的RGB-D图像的物体检测和语义分割方法,其特征在于:
本方法使用的是4-步交替训练方案:第一步,使用在ImageNet数据集上预训练的模型初始化网络,训练区域方案网络;第二步,使用第一步的区域方案网络产生的区域方案作为Fast-RCNN的预检测边框,使用在ImageNet数据集上预训练的模型初始化网络,训练Fast-RCNN;第三步,使用第二步训练的网络初始化区域方案网络并训练网络,因为使用了共享卷积层参数,所以这里只微调属于区域方案网络的网络层参数;第四步,同样共享卷积层参数,使用第二步训练的网络初始化Fast-RCNN并微调只属于该网络的网络层参数;我们把第一步和第二步统称为第一阶段,第三步和第四步统称为第二阶段;
本文损失函数的计算方法参考于Faster-RCNN的多任务损失公式,公式表达式如下:
其中,pi表示第i个锚点边框包含物体的预言概率,表示地面真值标签,如果锚点边框是正例,如果锚点边框是反例,ti表示预言边框i的坐标(4个参数),表示与正例锚点边框有关联的地面真值边框;Lcls表示Softmax分类损失,表示边框回归损失,Ncls表示块大小,实验中Ncls=256;Nreg表示锚点边框的数量,λ表示一个均衡系数,实验中取λ=10,的计算方法参考于Fast-RCNN,公式如下:
4.根据权利要求1所述的基于深层卷积网络的RGB-D图像的物体检测和语义分割方法,其特征在于:
全卷积的训练时,反向传播同样使用随机梯度下降进行反向传播,损失是对每一个像素点的Softmax损失进行求和;全卷积的训练网络分为三种;第一种是在conv7卷积层后执行一个跨步为32的反卷积操作FCN-32s;第二种是对conv7卷积层执行一个跨步为2的反卷积结果与pool4池化层结果执行一个融合,然后对这个融合结果执行一个跨步为16的反卷积操作FCN-16s;第三种是对三种结果进行融合,这三种结果分别为对conv7执行一个跨步为4的反卷积结果,对pool4池化层执行一个跨步为2的反卷积结果,pool3池化层;利用这个融合结果再进行一次跨步为8的反卷积操作FCN-8s;其中第二种和第三种方式被称为全卷积网络的跳跃框架;
全卷积网络训练过程通常是使用一个训练好的模型微调FCN-32s网络,然后FCN-16s基于FCN-32s模型微调跳跃框架的模型,最后使用FCN-16s的模型微调FCN-8s的模型;本文沿用这种训练模式,使用FCN-8s训练的模型进行测试,并作为最后的实验结果。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201611168200.3A CN106709568B (zh) | 2016-12-16 | 2016-12-16 | 基于深层卷积网络的rgb-d图像的物体检测和语义分割方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN201611168200.3A CN106709568B (zh) | 2016-12-16 | 2016-12-16 | 基于深层卷积网络的rgb-d图像的物体检测和语义分割方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN106709568A true CN106709568A (zh) | 2017-05-24 |
| CN106709568B CN106709568B (zh) | 2019-03-22 |
Family
ID=58938969
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN201611168200.3A Active CN106709568B (zh) | 2016-12-16 | 2016-12-16 | 基于深层卷积网络的rgb-d图像的物体检测和语义分割方法 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN106709568B (zh) |
Cited By (107)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN107103613A (zh) * | 2017-03-28 | 2017-08-29 | 深圳市未来媒体技术研究院 | 一种三维手势姿态估计方法 |
| CN107392189A (zh) * | 2017-09-05 | 2017-11-24 | 百度在线网络技术(北京)有限公司 | 用于确定无人车的驾驶行为的方法和装置 |
| CN107437099A (zh) * | 2017-08-03 | 2017-12-05 | 哈尔滨工业大学 | 一种基于机器学习的特定服饰图像识别与检测方法 |
| CN107507126A (zh) * | 2017-07-27 | 2017-12-22 | 大连和创懒人科技有限公司 | 一种利用rgb图像还原3d场景的方法 |
| CN107545263A (zh) * | 2017-08-02 | 2018-01-05 | 清华大学 | 一种物体检测方法及装置 |
| CN107563381A (zh) * | 2017-09-12 | 2018-01-09 | 国家新闻出版广电总局广播科学研究院 | 基于全卷积网络的多特征融合的目标检测方法 |
| CN107563284A (zh) * | 2017-07-26 | 2018-01-09 | 中国农业大学 | 行人追踪方法及装置 |
| CN107563290A (zh) * | 2017-08-01 | 2018-01-09 | 中国农业大学 | 一种基于图像的行人检测方法及装置 |
| CN107563405A (zh) * | 2017-07-19 | 2018-01-09 | 同济大学 | 基于多分辨率神经网络的车库自动驾驶语义目标识别方法 |
| CN107564025A (zh) * | 2017-08-09 | 2018-01-09 | 浙江大学 | 一种基于深度神经网络的电力设备红外图像语义分割方法 |
| CN107563372A (zh) * | 2017-07-20 | 2018-01-09 | 济南中维世纪科技有限公司 | 一种基于深度学习ssd框架的车牌定位方法 |
| CN107578436A (zh) * | 2017-08-02 | 2018-01-12 | 南京邮电大学 | 一种基于全卷积神经网络fcn的单目图像深度估计方法 |
| CN107657257A (zh) * | 2017-08-14 | 2018-02-02 | 中国矿业大学 | 一种基于多通道卷积神经网络的语义图像分割方法 |
| CN107680113A (zh) * | 2017-10-27 | 2018-02-09 | 武汉大学 | 基于贝叶斯框架边缘先验的多层分割网络的图像分割方法 |
| CN107680109A (zh) * | 2017-09-15 | 2018-02-09 | 盐城禅图智能科技有限公司 | 一种引用逆注意力与像素相似度学习的图像语义分割方法 |
| CN107688784A (zh) * | 2017-08-23 | 2018-02-13 | 福建六壬网安股份有限公司 | 一种基于深层特征和浅层特征融合的字符识别方法及存储介质 |
| CN107742311A (zh) * | 2017-09-29 | 2018-02-27 | 北京易达图灵科技有限公司 | 一种视觉定位的方法及装置 |
| CN107808131A (zh) * | 2017-10-23 | 2018-03-16 | 华南理工大学 | 基于双通路深度卷积神经网络的动态手势识别方法 |
| CN107862674A (zh) * | 2017-11-08 | 2018-03-30 | 杭州测度科技有限公司 | 深度图像融合方法及系统 |
| CN107886117A (zh) * | 2017-10-30 | 2018-04-06 | 国家新闻出版广电总局广播科学研究院 | 基于多特征提取和多任务融合的目标检测算法 |
| CN107886477A (zh) * | 2017-09-20 | 2018-04-06 | 武汉环宇智行科技有限公司 | 无人驾驶中立体视觉与低线束激光雷达的融合矫正方法 |
| CN107908635A (zh) * | 2017-09-26 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 建立文本分类模型以及文本分类的方法、装置 |
| CN107944457A (zh) * | 2017-11-23 | 2018-04-20 | 浙江清华长三角研究院 | 一种复杂场景下的绘画物体识别与提取方法 |
| CN108009481A (zh) * | 2017-11-22 | 2018-05-08 | 浙江大华技术股份有限公司 | 一种cnn模型的训练方法及装置、人脸识别方法及装置 |
| CN108090442A (zh) * | 2017-12-15 | 2018-05-29 | 四川大学 | 一种基于卷积神经网络的机场场面监视方法 |
| CN108171141A (zh) * | 2017-12-25 | 2018-06-15 | 淮阴工学院 | 基于注意力模型的级联多模式融合的视频目标跟踪方法 |
| CN108182428A (zh) * | 2018-01-31 | 2018-06-19 | 福州大学 | 前车状态识别和车辆跟随的方法 |
| CN108320286A (zh) * | 2018-02-28 | 2018-07-24 | 苏州大学 | 图像显著性检测方法、系统、设备及计算机可读存储介质 |
| CN108334955A (zh) * | 2018-03-01 | 2018-07-27 | 福州大学 | 基于Faster-RCNN的身份证复印件检测方法 |
| CN108345887A (zh) * | 2018-01-29 | 2018-07-31 | 清华大学深圳研究生院 | 图像语义分割模型的训练方法及图像语义分割方法 |
| CN108399361A (zh) * | 2018-01-23 | 2018-08-14 | 南京邮电大学 | 一种基于卷积神经网络cnn和语义分割的行人检测方法 |
| CN108446662A (zh) * | 2018-04-02 | 2018-08-24 | 电子科技大学 | 一种基于语义分割信息的行人检测方法 |
| CN108491803A (zh) * | 2018-03-27 | 2018-09-04 | 北京中硕众联智能电子科技有限公司 | 一种识别图像中物体和温度的装置及相应的识别方法 |
| CN108520219A (zh) * | 2018-03-30 | 2018-09-11 | 台州智必安科技有限责任公司 | 一种卷积神经网络特征融合的多尺度快速人脸检测方法 |
| CN108537292A (zh) * | 2018-04-10 | 2018-09-14 | 上海白泽网络科技有限公司 | 语义分割网络训练方法、图像语义分割方法及装置 |
| CN108596240A (zh) * | 2018-04-20 | 2018-09-28 | 华中科技大学 | 一种基于判别特征网络的图像语义分割方法 |
| CN108596102A (zh) * | 2018-04-26 | 2018-09-28 | 北京航空航天大学青岛研究院 | 基于rgb-d的室内场景物体分割分类器构造方法 |
| CN108647562A (zh) * | 2018-03-27 | 2018-10-12 | 北京中硕众联智能电子科技有限公司 | 识别图像中物体和温度的装置和相应的方法 |
| CN108664974A (zh) * | 2018-04-03 | 2018-10-16 | 华南理工大学 | 一种基于rgbd图像与全残差网络的语义分割方法 |
| CN108710863A (zh) * | 2018-05-24 | 2018-10-26 | 东北大学 | 基于深度学习的无人机航拍场景语义分割方法及系统 |
| CN108734694A (zh) * | 2018-04-09 | 2018-11-02 | 华南农业大学 | 基于faster r-cnn的甲状腺肿瘤超声图像自动识别方法 |
| CN108876796A (zh) * | 2018-06-08 | 2018-11-23 | 长安大学 | 一种基于全卷积神经网络和条件随机场的道路分割系统及方法 |
| CN108876793A (zh) * | 2018-04-13 | 2018-11-23 | 北京迈格威科技有限公司 | 语义分割方法、装置和系统及存储介质 |
| CN108875588A (zh) * | 2018-05-25 | 2018-11-23 | 武汉大学 | 基于深度学习的跨摄像头行人检测跟踪方法 |
| CN108895981A (zh) * | 2018-05-29 | 2018-11-27 | 南京怀萃智能科技有限公司 | 一种三维测量方法、装置、服务器和存储介质 |
| CN108985194A (zh) * | 2018-06-29 | 2018-12-11 | 华南理工大学 | 一种基于图像语义分割的智能车辆可行驶区域的识别方法 |
| WO2018232592A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | Fully convolutional instance-aware semantic segmentation |
| CN109102457A (zh) * | 2018-06-12 | 2018-12-28 | 杭州米绘科技有限公司 | 一种基于卷积神经网络的智能化变色系统及方法 |
| CN109101914A (zh) * | 2018-08-01 | 2018-12-28 | 北京飞搜科技有限公司 | 一种基于多尺度的行人检测方法和装置 |
| CN109271990A (zh) * | 2018-09-03 | 2019-01-25 | 北京邮电大学 | 一种针对rgb-d图像的语义分割方法及装置 |
| CN109325385A (zh) * | 2017-07-31 | 2019-02-12 | 株式会社理光 | 目标检测和区域分割方法、装置和计算机可读存储介质 |
| CN109325505A (zh) * | 2018-09-11 | 2019-02-12 | 北京陌上花科技有限公司 | 用于嵌入式设备的实例分割方法及装置、手机端 |
| CN109377479A (zh) * | 2018-09-27 | 2019-02-22 | 中国电子科技集团公司第五十四研究所 | 基于遥感影像的蝶形卫星天线目标检测方法 |
| CN109564684A (zh) * | 2018-01-15 | 2019-04-02 | 深圳鲲云信息科技有限公司 | 图像语义分割方法、可编程逻辑电路、系统及电子设备 |
| CN109598728A (zh) * | 2018-11-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、诊断系统及存储介质 |
| CN109598268A (zh) * | 2018-11-23 | 2019-04-09 | 安徽大学 | 一种基于单流深度网络的rgb-d显著目标检测方法 |
| CN109655019A (zh) * | 2018-10-29 | 2019-04-19 | 北方工业大学 | 一种基于深度学习和三维重建的货物体积测量方法 |
| CN109685762A (zh) * | 2018-11-09 | 2019-04-26 | 五邑大学 | 一种基于多尺度深度语义分割网络的天线下倾角测量方法 |
| CN109711413A (zh) * | 2018-12-30 | 2019-05-03 | 陕西师范大学 | 基于深度学习的图像语义分割方法 |
| CN109711367A (zh) * | 2018-12-29 | 2019-05-03 | 北京中科寒武纪科技有限公司 | 运算方法、装置及相关产品 |
| CN109753903A (zh) * | 2019-02-27 | 2019-05-14 | 北航(四川)西部国际创新港科技有限公司 | 一种基于深度学习的无人机检测方法 |
| CN109782771A (zh) * | 2019-02-26 | 2019-05-21 | 西安交通大学 | 一种果园移动机器人及地头转向方法 |
| CN109801337A (zh) * | 2019-01-21 | 2019-05-24 | 同济大学 | 一种基于实例分割网络和迭代优化的6d位姿估计方法 |
| CN109870983A (zh) * | 2017-12-04 | 2019-06-11 | 北京京东尚科信息技术有限公司 | 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统 |
| CN109872357A (zh) * | 2019-01-16 | 2019-06-11 | 创新奇智(广州)科技有限公司 | 一种物品排列面占比计算方法、系统及电子设备 |
| CN109903331A (zh) * | 2019-01-08 | 2019-06-18 | 杭州电子科技大学 | 一种基于rgb-d相机的卷积神经网络目标检测方法 |
| CN109902572A (zh) * | 2019-01-24 | 2019-06-18 | 哈尔滨理工大学 | 一种基于深度学习的车辆检测方法 |
| CN109934342A (zh) * | 2018-12-28 | 2019-06-25 | 深圳奥比中光科技有限公司 | 神经网络模型训练方法、深度图像修复方法及系统 |
| CN110009648A (zh) * | 2019-03-04 | 2019-07-12 | 东南大学 | 基于深浅特征融合卷积神经网络的路侧图像车辆分割方法 |
| CN110008808A (zh) * | 2018-12-29 | 2019-07-12 | 北京迈格威科技有限公司 | 全景分割方法、装置和系统及存储介质 |
| CN110008848A (zh) * | 2019-03-13 | 2019-07-12 | 华南理工大学 | 一种基于双目立体视觉的道路可行驶区域识别方法 |
| CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
| CN110084257A (zh) * | 2018-01-26 | 2019-08-02 | 北京京东尚科信息技术有限公司 | 用于检测目标的方法和装置 |
| CN110188780A (zh) * | 2019-06-03 | 2019-08-30 | 电子科技大学中山学院 | 用于定位多目标特征点的深度学习模型的构建方法及装置 |
| CN110263731A (zh) * | 2019-06-24 | 2019-09-20 | 电子科技大学 | 一种单步人脸检测系统 |
| CN110287777A (zh) * | 2019-05-16 | 2019-09-27 | 西北大学 | 一种自然场景下的金丝猴躯体分割算法 |
| CN110298330A (zh) * | 2019-07-05 | 2019-10-01 | 东北大学 | 一种输电线路巡检机器人单目检测与定位方法 |
| CN110348342A (zh) * | 2019-06-27 | 2019-10-18 | 广东技术师范大学天河学院 | 一种基于全卷积网络的管道病害图像分割方法 |
| CN110363201A (zh) * | 2019-07-10 | 2019-10-22 | 上海交通大学 | 基于协同学习的弱监督语义分割方法及系统 |
| CN110388931A (zh) * | 2018-04-17 | 2019-10-29 | 百度(美国)有限责任公司 | 将对象的二维边界框转换成自动驾驶车辆的三维位置的方法 |
| CN110399884A (zh) * | 2019-07-10 | 2019-11-01 | 浙江理工大学 | 一种特征融合自适应锚框模型车辆检测方法 |
| CN110473288A (zh) * | 2019-08-23 | 2019-11-19 | 清华四川能源互联网研究院 | 堤坝模型重建方法、装置和电子设备 |
| CN110599538A (zh) * | 2019-09-30 | 2019-12-20 | 山东信通电子股份有限公司 | 一种输电线路导线覆冰厚度的识别方法和装置 |
| CN110738132A (zh) * | 2019-09-23 | 2020-01-31 | 中国海洋大学 | 一种具备判别性感知能力的目标检测质量盲评价方法 |
| CN110766096A (zh) * | 2019-10-31 | 2020-02-07 | 北京金山云网络技术有限公司 | 视频分类方法、装置及电子设备 |
| US10600167B2 (en) | 2017-01-18 | 2020-03-24 | Nvidia Corporation | Performing spatiotemporal filtering |
| CN110941995A (zh) * | 2019-11-01 | 2020-03-31 | 中山大学 | 基于轻量级网络的实时目标检测与语义分割的多任务学习方法 |
| CN111027493A (zh) * | 2019-12-13 | 2020-04-17 | 电子科技大学 | 一种基于深度学习多网络软融合的行人检测方法 |
| CN111104840A (zh) * | 2018-10-26 | 2020-05-05 | 斯特拉德视觉公司 | 基于回归损失的学习及测试的方法及装置 |
| CN111222468A (zh) * | 2020-01-08 | 2020-06-02 | 浙江光珀智能科技有限公司 | 一种基于深度学习的人流检测方法及系统 |
| CN111368829A (zh) * | 2020-02-28 | 2020-07-03 | 北京理工大学 | 一种基于rgb-d图像的视觉语义关系检测方法 |
| CN111507985A (zh) * | 2020-03-19 | 2020-08-07 | 北京市威富安防科技有限公司 | 图像实例分割优化处理方法、装置和计算机设备 |
| CN111553925A (zh) * | 2020-04-27 | 2020-08-18 | 南通智能感知研究院 | 一种基于fcn的端对端农作物影像分割方法及系统 |
| TWI702536B (zh) * | 2019-12-31 | 2020-08-21 | 財團法人工業技術研究院 | 基於適應標註的物件偵測模型的訓練方法及系統 |
| CN111712853A (zh) * | 2018-02-16 | 2020-09-25 | 松下知识产权经营株式会社 | 一种处理方法及利用了它的处理装置 |
| CN111783784A (zh) * | 2020-06-30 | 2020-10-16 | 创新奇智(合肥)科技有限公司 | 建筑的空洞检测方法及装置、电子设备、存储介质 |
| WO2020237693A1 (zh) * | 2019-05-31 | 2020-12-03 | 华南理工大学 | 一种水面无人装备多源感知方法及系统 |
| CN112528705A (zh) * | 2019-09-17 | 2021-03-19 | 同方威视技术股份有限公司 | 基于语义的图像识别系统及其方法 |
| CN112667832A (zh) * | 2020-12-31 | 2021-04-16 | 哈尔滨工业大学 | 一种未知室内环境下基于视觉的互定位方法 |
| CN113033398A (zh) * | 2021-03-25 | 2021-06-25 | 深圳市康冠商用科技有限公司 | 一种手势识别方法、装置、计算机设备及存储介质 |
| CN113763422A (zh) * | 2021-07-30 | 2021-12-07 | 北京交通大学 | 一种rgb-d图像显著性目标检测方法 |
| CN114343579A (zh) * | 2022-01-05 | 2022-04-15 | 浙江大学 | 一种患儿医源性皮肤损伤自动评估手持装置 |
| CN114373218A (zh) * | 2022-03-21 | 2022-04-19 | 北京万里红科技有限公司 | 一种用于检测活体对象的卷积网络的生成方法 |
| CN114677658A (zh) * | 2022-03-10 | 2022-06-28 | 清华大学 | 十亿像素动态大场景图像采集和多目标检测方法及装置 |
| CN114782705A (zh) * | 2017-08-31 | 2022-07-22 | 北京图森未来科技有限公司 | 一种物体封闭轮廓的检测方法和装置 |
| TWI794414B (zh) * | 2018-02-21 | 2023-03-01 | 德商羅伯特博斯奇股份有限公司 | 用於使用深度感測器進行即時物件偵測的系統和方法 |
| US11651229B2 (en) | 2017-11-22 | 2023-05-16 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for face recognition |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101478709B1 (ko) * | 2012-06-27 | 2015-01-05 | 한국과학기술원 | Rgb-d 영상 특징점 추출 및 특징 기술자 생성 방법 및 장치 |
| WO2016045711A1 (en) * | 2014-09-23 | 2016-03-31 | Keylemon Sa | A face pose rectification method and apparatus |
| CN106203506A (zh) * | 2016-07-11 | 2016-12-07 | 上海凌科智能科技有限公司 | 一种基于深度学习技术的行人检测方法 |
| CN106204165A (zh) * | 2016-08-11 | 2016-12-07 | 广州出益信息科技有限公司 | 一种广告投放方法及装置 |
-
2016
- 2016-12-16 CN CN201611168200.3A patent/CN106709568B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101478709B1 (ko) * | 2012-06-27 | 2015-01-05 | 한국과학기술원 | Rgb-d 영상 특징점 추출 및 특징 기술자 생성 방법 및 장치 |
| WO2016045711A1 (en) * | 2014-09-23 | 2016-03-31 | Keylemon Sa | A face pose rectification method and apparatus |
| CN106203506A (zh) * | 2016-07-11 | 2016-12-07 | 上海凌科智能科技有限公司 | 一种基于深度学习技术的行人检测方法 |
| CN106204165A (zh) * | 2016-08-11 | 2016-12-07 | 广州出益信息科技有限公司 | 一种广告投放方法及装置 |
Non-Patent Citations (4)
| Title |
|---|
| JONATHAN LONG,EVAN SHELHAMER,TREVOR DARRELL: ""Fully Convolutional Networks for Semantic Segmentation"", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
| SAURABH GUPTA等: ""Aligning 3D Models to RGB-D Images of Cluttered Scenes"", 《2015 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION (CVPR)》 * |
| SAURABH GUPTA等: ""Perceptual Organization and Recognition of Indoor Scenes from RGB-D Images"", 《2013 IEEE CONFERENCE ON COMPUTER VISION AND PATTERN RECOGNITION》 * |
| 蔡强等: ""基于ANNet网络的RGB-D图像的目标检测"", 《系统仿真学报》 * |
Cited By (154)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US10600167B2 (en) | 2017-01-18 | 2020-03-24 | Nvidia Corporation | Performing spatiotemporal filtering |
| US11113800B2 (en) | 2017-01-18 | 2021-09-07 | Nvidia Corporation | Filtering image data using a neural network |
| CN107103613B (zh) * | 2017-03-28 | 2019-11-15 | 深圳市未来媒体技术研究院 | 一种三维手势姿态估计方法 |
| CN107103613A (zh) * | 2017-03-28 | 2017-08-29 | 深圳市未来媒体技术研究院 | 一种三维手势姿态估计方法 |
| WO2018232592A1 (en) * | 2017-06-20 | 2018-12-27 | Microsoft Technology Licensing, Llc. | Fully convolutional instance-aware semantic segmentation |
| CN107563405A (zh) * | 2017-07-19 | 2018-01-09 | 同济大学 | 基于多分辨率神经网络的车库自动驾驶语义目标识别方法 |
| CN107563372B (zh) * | 2017-07-20 | 2021-01-29 | 济南中维世纪科技有限公司 | 一种基于深度学习ssd框架的车牌定位方法 |
| CN107563372A (zh) * | 2017-07-20 | 2018-01-09 | 济南中维世纪科技有限公司 | 一种基于深度学习ssd框架的车牌定位方法 |
| CN107563284A (zh) * | 2017-07-26 | 2018-01-09 | 中国农业大学 | 行人追踪方法及装置 |
| CN107507126B (zh) * | 2017-07-27 | 2020-09-18 | 和创懒人(大连)科技有限公司 | 一种利用rgb图像还原3d场景的方法 |
| CN107507126A (zh) * | 2017-07-27 | 2017-12-22 | 大连和创懒人科技有限公司 | 一种利用rgb图像还原3d场景的方法 |
| CN109325385A (zh) * | 2017-07-31 | 2019-02-12 | 株式会社理光 | 目标检测和区域分割方法、装置和计算机可读存储介质 |
| CN107563290A (zh) * | 2017-08-01 | 2018-01-09 | 中国农业大学 | 一种基于图像的行人检测方法及装置 |
| CN107545263A (zh) * | 2017-08-02 | 2018-01-05 | 清华大学 | 一种物体检测方法及装置 |
| CN107578436A (zh) * | 2017-08-02 | 2018-01-12 | 南京邮电大学 | 一种基于全卷积神经网络fcn的单目图像深度估计方法 |
| CN107545263B (zh) * | 2017-08-02 | 2020-12-15 | 清华大学 | 一种物体检测方法及装置 |
| CN107437099A (zh) * | 2017-08-03 | 2017-12-05 | 哈尔滨工业大学 | 一种基于机器学习的特定服饰图像识别与检测方法 |
| CN107564025B (zh) * | 2017-08-09 | 2020-05-29 | 浙江大学 | 一种基于深度神经网络的电力设备红外图像语义分割方法 |
| CN107564025A (zh) * | 2017-08-09 | 2018-01-09 | 浙江大学 | 一种基于深度神经网络的电力设备红外图像语义分割方法 |
| CN107657257A (zh) * | 2017-08-14 | 2018-02-02 | 中国矿业大学 | 一种基于多通道卷积神经网络的语义图像分割方法 |
| CN107688784A (zh) * | 2017-08-23 | 2018-02-13 | 福建六壬网安股份有限公司 | 一种基于深层特征和浅层特征融合的字符识别方法及存储介质 |
| CN114782705A (zh) * | 2017-08-31 | 2022-07-22 | 北京图森未来科技有限公司 | 一种物体封闭轮廓的检测方法和装置 |
| WO2019047655A1 (zh) * | 2017-09-05 | 2019-03-14 | 百度在线网络技术(北京)有限公司 | 用于确定无人车的驾驶行为的方法和装置 |
| CN107392189A (zh) * | 2017-09-05 | 2017-11-24 | 百度在线网络技术(北京)有限公司 | 用于确定无人车的驾驶行为的方法和装置 |
| CN107563381A (zh) * | 2017-09-12 | 2018-01-09 | 国家新闻出版广电总局广播科学研究院 | 基于全卷积网络的多特征融合的目标检测方法 |
| CN107563381B (zh) * | 2017-09-12 | 2020-10-23 | 国家新闻出版广电总局广播科学研究院 | 基于全卷积网络的多特征融合的目标检测方法 |
| CN107680109A (zh) * | 2017-09-15 | 2018-02-09 | 盐城禅图智能科技有限公司 | 一种引用逆注意力与像素相似度学习的图像语义分割方法 |
| CN107886477A (zh) * | 2017-09-20 | 2018-04-06 | 武汉环宇智行科技有限公司 | 无人驾驶中立体视觉与低线束激光雷达的融合矫正方法 |
| CN107908635A (zh) * | 2017-09-26 | 2018-04-13 | 百度在线网络技术(北京)有限公司 | 建立文本分类模型以及文本分类的方法、装置 |
| US10783331B2 (en) | 2017-09-26 | 2020-09-22 | Baidu Online Network Technology (Beijing) Co., Ltd. | Method and apparatus for building text classification model, and text classification method and apparatus |
| CN107908635B (zh) * | 2017-09-26 | 2021-04-16 | 百度在线网络技术(北京)有限公司 | 建立文本分类模型以及文本分类的方法、装置 |
| CN107742311B (zh) * | 2017-09-29 | 2020-02-18 | 北京易达图灵科技有限公司 | 一种视觉定位的方法及装置 |
| CN107742311A (zh) * | 2017-09-29 | 2018-02-27 | 北京易达图灵科技有限公司 | 一种视觉定位的方法及装置 |
| CN107808131B (zh) * | 2017-10-23 | 2019-12-10 | 华南理工大学 | 基于双通路深度卷积神经网络的动态手势识别方法 |
| CN107808131A (zh) * | 2017-10-23 | 2018-03-16 | 华南理工大学 | 基于双通路深度卷积神经网络的动态手势识别方法 |
| CN107680113A (zh) * | 2017-10-27 | 2018-02-09 | 武汉大学 | 基于贝叶斯框架边缘先验的多层分割网络的图像分割方法 |
| CN107886117A (zh) * | 2017-10-30 | 2018-04-06 | 国家新闻出版广电总局广播科学研究院 | 基于多特征提取和多任务融合的目标检测算法 |
| CN107862674A (zh) * | 2017-11-08 | 2018-03-30 | 杭州测度科技有限公司 | 深度图像融合方法及系统 |
| CN107862674B (zh) * | 2017-11-08 | 2020-07-03 | 杭州测度科技有限公司 | 深度图像融合方法及系统 |
| US11651229B2 (en) | 2017-11-22 | 2023-05-16 | Zhejiang Dahua Technology Co., Ltd. | Methods and systems for face recognition |
| CN108009481A (zh) * | 2017-11-22 | 2018-05-08 | 浙江大华技术股份有限公司 | 一种cnn模型的训练方法及装置、人脸识别方法及装置 |
| CN107944457A (zh) * | 2017-11-23 | 2018-04-20 | 浙江清华长三角研究院 | 一种复杂场景下的绘画物体识别与提取方法 |
| CN109870983B (zh) * | 2017-12-04 | 2022-01-04 | 北京京东尚科信息技术有限公司 | 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统 |
| CN109870983A (zh) * | 2017-12-04 | 2019-06-11 | 北京京东尚科信息技术有限公司 | 处理托盘堆垛图像的方法、装置及用于仓储拣货的系统 |
| CN108090442A (zh) * | 2017-12-15 | 2018-05-29 | 四川大学 | 一种基于卷积神经网络的机场场面监视方法 |
| CN108171141B (zh) * | 2017-12-25 | 2020-07-14 | 淮阴工学院 | 基于注意力模型的级联多模式融合的视频目标跟踪方法 |
| CN108171141A (zh) * | 2017-12-25 | 2018-06-15 | 淮阴工学院 | 基于注意力模型的级联多模式融合的视频目标跟踪方法 |
| WO2019136760A1 (zh) * | 2018-01-15 | 2019-07-18 | 深圳鲲云信息科技有限公司 | 图像语义分割方法、可编程逻辑电路、系统及电子设备 |
| CN109564684B (zh) * | 2018-01-15 | 2023-05-02 | 深圳鲲云信息科技有限公司 | 图像语义分割方法、可编程逻辑电路、系统及电子设备 |
| US11636665B2 (en) | 2018-01-15 | 2023-04-25 | Shenzhen Corerain Technologies Co., Ltd. | Streaming image semantic segmentation method, logical integrated circuit system and electronic device |
| CN109564684A (zh) * | 2018-01-15 | 2019-04-02 | 深圳鲲云信息科技有限公司 | 图像语义分割方法、可编程逻辑电路、系统及电子设备 |
| CN108399361A (zh) * | 2018-01-23 | 2018-08-14 | 南京邮电大学 | 一种基于卷积神经网络cnn和语义分割的行人检测方法 |
| CN110084257A (zh) * | 2018-01-26 | 2019-08-02 | 北京京东尚科信息技术有限公司 | 用于检测目标的方法和装置 |
| CN108345887A (zh) * | 2018-01-29 | 2018-07-31 | 清华大学深圳研究生院 | 图像语义分割模型的训练方法及图像语义分割方法 |
| CN108345887B (zh) * | 2018-01-29 | 2020-10-02 | 清华大学深圳研究生院 | 图像语义分割模型的训练方法及图像语义分割方法 |
| CN108182428A (zh) * | 2018-01-31 | 2018-06-19 | 福州大学 | 前车状态识别和车辆跟随的方法 |
| CN111712853B (zh) * | 2018-02-16 | 2023-11-07 | 松下知识产权经营株式会社 | 一种处理方法及利用了它的处理装置 |
| CN111712853A (zh) * | 2018-02-16 | 2020-09-25 | 松下知识产权经营株式会社 | 一种处理方法及利用了它的处理装置 |
| TWI794414B (zh) * | 2018-02-21 | 2023-03-01 | 德商羅伯特博斯奇股份有限公司 | 用於使用深度感測器進行即時物件偵測的系統和方法 |
| CN108320286A (zh) * | 2018-02-28 | 2018-07-24 | 苏州大学 | 图像显著性检测方法、系统、设备及计算机可读存储介质 |
| CN108334955A (zh) * | 2018-03-01 | 2018-07-27 | 福州大学 | 基于Faster-RCNN的身份证复印件检测方法 |
| CN108491803A (zh) * | 2018-03-27 | 2018-09-04 | 北京中硕众联智能电子科技有限公司 | 一种识别图像中物体和温度的装置及相应的识别方法 |
| CN108647562A (zh) * | 2018-03-27 | 2018-10-12 | 北京中硕众联智能电子科技有限公司 | 识别图像中物体和温度的装置和相应的方法 |
| CN108520219A (zh) * | 2018-03-30 | 2018-09-11 | 台州智必安科技有限责任公司 | 一种卷积神经网络特征融合的多尺度快速人脸检测方法 |
| CN108446662A (zh) * | 2018-04-02 | 2018-08-24 | 电子科技大学 | 一种基于语义分割信息的行人检测方法 |
| CN108664974A (zh) * | 2018-04-03 | 2018-10-16 | 华南理工大学 | 一种基于rgbd图像与全残差网络的语义分割方法 |
| CN108734694A (zh) * | 2018-04-09 | 2018-11-02 | 华南农业大学 | 基于faster r-cnn的甲状腺肿瘤超声图像自动识别方法 |
| CN108537292B (zh) * | 2018-04-10 | 2020-07-31 | 上海白泽网络科技有限公司 | 语义分割网络训练方法、图像语义分割方法及装置 |
| CN108537292A (zh) * | 2018-04-10 | 2018-09-14 | 上海白泽网络科技有限公司 | 语义分割网络训练方法、图像语义分割方法及装置 |
| CN108876793A (zh) * | 2018-04-13 | 2018-11-23 | 北京迈格威科技有限公司 | 语义分割方法、装置和系统及存储介质 |
| CN110388931B (zh) * | 2018-04-17 | 2023-11-10 | 百度(美国)有限责任公司 | 将对象的二维边界框转换成自动驾驶车辆的三维位置的方法 |
| CN110388931A (zh) * | 2018-04-17 | 2019-10-29 | 百度(美国)有限责任公司 | 将对象的二维边界框转换成自动驾驶车辆的三维位置的方法 |
| CN108596240A (zh) * | 2018-04-20 | 2018-09-28 | 华中科技大学 | 一种基于判别特征网络的图像语义分割方法 |
| CN108596240B (zh) * | 2018-04-20 | 2020-05-19 | 华中科技大学 | 一种基于判别特征网络的图像语义分割方法 |
| CN108596102B (zh) * | 2018-04-26 | 2022-04-05 | 北京航空航天大学青岛研究院 | 基于rgb-d的室内场景物体分割分类器构造方法 |
| CN108596102A (zh) * | 2018-04-26 | 2018-09-28 | 北京航空航天大学青岛研究院 | 基于rgb-d的室内场景物体分割分类器构造方法 |
| CN108710863A (zh) * | 2018-05-24 | 2018-10-26 | 东北大学 | 基于深度学习的无人机航拍场景语义分割方法及系统 |
| CN108875588B (zh) * | 2018-05-25 | 2022-04-15 | 武汉大学 | 基于深度学习的跨摄像头行人检测跟踪方法 |
| CN108875588A (zh) * | 2018-05-25 | 2018-11-23 | 武汉大学 | 基于深度学习的跨摄像头行人检测跟踪方法 |
| CN108895981A (zh) * | 2018-05-29 | 2018-11-27 | 南京怀萃智能科技有限公司 | 一种三维测量方法、装置、服务器和存储介质 |
| CN108876796A (zh) * | 2018-06-08 | 2018-11-23 | 长安大学 | 一种基于全卷积神经网络和条件随机场的道路分割系统及方法 |
| CN109102457A (zh) * | 2018-06-12 | 2018-12-28 | 杭州米绘科技有限公司 | 一种基于卷积神经网络的智能化变色系统及方法 |
| CN109102457B (zh) * | 2018-06-12 | 2023-01-17 | 杭州米绘科技有限公司 | 一种基于卷积神经网络的智能化变色系统及方法 |
| CN108985194A (zh) * | 2018-06-29 | 2018-12-11 | 华南理工大学 | 一种基于图像语义分割的智能车辆可行驶区域的识别方法 |
| CN109101914B (zh) * | 2018-08-01 | 2021-08-20 | 苏州飞搜科技有限公司 | 一种基于多尺度的行人检测方法和装置 |
| CN109101914A (zh) * | 2018-08-01 | 2018-12-28 | 北京飞搜科技有限公司 | 一种基于多尺度的行人检测方法和装置 |
| CN109271990A (zh) * | 2018-09-03 | 2019-01-25 | 北京邮电大学 | 一种针对rgb-d图像的语义分割方法及装置 |
| CN109325505A (zh) * | 2018-09-11 | 2019-02-12 | 北京陌上花科技有限公司 | 用于嵌入式设备的实例分割方法及装置、手机端 |
| CN109377479A (zh) * | 2018-09-27 | 2019-02-22 | 中国电子科技集团公司第五十四研究所 | 基于遥感影像的蝶形卫星天线目标检测方法 |
| CN111104840A (zh) * | 2018-10-26 | 2020-05-05 | 斯特拉德视觉公司 | 基于回归损失的学习及测试的方法及装置 |
| CN111104840B (zh) * | 2018-10-26 | 2024-01-09 | 斯特拉德视觉公司 | 基于回归损失的学习及测试的方法及装置 |
| CN109655019A (zh) * | 2018-10-29 | 2019-04-19 | 北方工业大学 | 一种基于深度学习和三维重建的货物体积测量方法 |
| CN109685762A (zh) * | 2018-11-09 | 2019-04-26 | 五邑大学 | 一种基于多尺度深度语义分割网络的天线下倾角测量方法 |
| CN109598268B (zh) * | 2018-11-23 | 2021-08-17 | 安徽大学 | 一种基于单流深度网络的rgb-d显著目标检测方法 |
| CN109598268A (zh) * | 2018-11-23 | 2019-04-09 | 安徽大学 | 一种基于单流深度网络的rgb-d显著目标检测方法 |
| CN109598728A (zh) * | 2018-11-30 | 2019-04-09 | 腾讯科技(深圳)有限公司 | 图像分割方法、装置、诊断系统及存储介质 |
| CN109934342A (zh) * | 2018-12-28 | 2019-06-25 | 深圳奥比中光科技有限公司 | 神经网络模型训练方法、深度图像修复方法及系统 |
| CN109934342B (zh) * | 2018-12-28 | 2022-12-09 | 奥比中光科技集团股份有限公司 | 神经网络模型训练方法、深度图像修复方法及系统 |
| CN110008808A (zh) * | 2018-12-29 | 2019-07-12 | 北京迈格威科技有限公司 | 全景分割方法、装置和系统及存储介质 |
| CN109711367A (zh) * | 2018-12-29 | 2019-05-03 | 北京中科寒武纪科技有限公司 | 运算方法、装置及相关产品 |
| CN109711413A (zh) * | 2018-12-30 | 2019-05-03 | 陕西师范大学 | 基于深度学习的图像语义分割方法 |
| CN109903331B (zh) * | 2019-01-08 | 2020-12-22 | 杭州电子科技大学 | 一种基于rgb-d相机的卷积神经网络目标检测方法 |
| CN109903331A (zh) * | 2019-01-08 | 2019-06-18 | 杭州电子科技大学 | 一种基于rgb-d相机的卷积神经网络目标检测方法 |
| CN109872357A (zh) * | 2019-01-16 | 2019-06-11 | 创新奇智(广州)科技有限公司 | 一种物品排列面占比计算方法、系统及电子设备 |
| CN109801337A (zh) * | 2019-01-21 | 2019-05-24 | 同济大学 | 一种基于实例分割网络和迭代优化的6d位姿估计方法 |
| CN109801337B (zh) * | 2019-01-21 | 2020-10-02 | 同济大学 | 一种基于实例分割网络和迭代优化的6d位姿估计方法 |
| CN109902572A (zh) * | 2019-01-24 | 2019-06-18 | 哈尔滨理工大学 | 一种基于深度学习的车辆检测方法 |
| CN109782771A (zh) * | 2019-02-26 | 2019-05-21 | 西安交通大学 | 一种果园移动机器人及地头转向方法 |
| CN109782771B (zh) * | 2019-02-26 | 2021-01-19 | 西安交通大学 | 一种果园移动机器人及地头转向方法 |
| CN109753903B (zh) * | 2019-02-27 | 2020-09-15 | 北航(四川)西部国际创新港科技有限公司 | 一种基于深度学习的无人机检测方法 |
| CN109753903A (zh) * | 2019-02-27 | 2019-05-14 | 北航(四川)西部国际创新港科技有限公司 | 一种基于深度学习的无人机检测方法 |
| CN110009648A (zh) * | 2019-03-04 | 2019-07-12 | 东南大学 | 基于深浅特征融合卷积神经网络的路侧图像车辆分割方法 |
| CN110009648B (zh) * | 2019-03-04 | 2023-02-24 | 东南大学 | 基于深浅特征融合卷积神经网络的路侧图像车辆分割方法 |
| CN110008848A (zh) * | 2019-03-13 | 2019-07-12 | 华南理工大学 | 一种基于双目立体视觉的道路可行驶区域识别方法 |
| CN110070124A (zh) * | 2019-04-15 | 2019-07-30 | 广州小鹏汽车科技有限公司 | 一种基于生成式对抗网络的图像扩增方法及系统 |
| CN110287777A (zh) * | 2019-05-16 | 2019-09-27 | 西北大学 | 一种自然场景下的金丝猴躯体分割算法 |
| WO2020237693A1 (zh) * | 2019-05-31 | 2020-12-03 | 华南理工大学 | 一种水面无人装备多源感知方法及系统 |
| CN110188780A (zh) * | 2019-06-03 | 2019-08-30 | 电子科技大学中山学院 | 用于定位多目标特征点的深度学习模型的构建方法及装置 |
| CN110263731B (zh) * | 2019-06-24 | 2021-03-16 | 电子科技大学 | 一种单步人脸检测系统 |
| CN110263731A (zh) * | 2019-06-24 | 2019-09-20 | 电子科技大学 | 一种单步人脸检测系统 |
| CN110348342A (zh) * | 2019-06-27 | 2019-10-18 | 广东技术师范大学天河学院 | 一种基于全卷积网络的管道病害图像分割方法 |
| CN110298330A (zh) * | 2019-07-05 | 2019-10-01 | 东北大学 | 一种输电线路巡检机器人单目检测与定位方法 |
| CN110399884A (zh) * | 2019-07-10 | 2019-11-01 | 浙江理工大学 | 一种特征融合自适应锚框模型车辆检测方法 |
| CN110399884B (zh) * | 2019-07-10 | 2021-08-20 | 浙江理工大学 | 一种特征融合自适应锚框模型车辆检测方法 |
| CN110363201A (zh) * | 2019-07-10 | 2019-10-22 | 上海交通大学 | 基于协同学习的弱监督语义分割方法及系统 |
| CN110363201B (zh) * | 2019-07-10 | 2021-06-01 | 上海交通大学 | 基于协同学习的弱监督语义分割方法及系统 |
| CN110473288B (zh) * | 2019-08-23 | 2022-08-05 | 清华四川能源互联网研究院 | 堤坝模型重建方法、装置和电子设备 |
| CN110473288A (zh) * | 2019-08-23 | 2019-11-19 | 清华四川能源互联网研究院 | 堤坝模型重建方法、装置和电子设备 |
| CN112528705A (zh) * | 2019-09-17 | 2021-03-19 | 同方威视技术股份有限公司 | 基于语义的图像识别系统及其方法 |
| CN110738132B (zh) * | 2019-09-23 | 2022-06-03 | 中国海洋大学 | 一种具备判别性感知能力的目标检测质量盲评价方法 |
| CN110738132A (zh) * | 2019-09-23 | 2020-01-31 | 中国海洋大学 | 一种具备判别性感知能力的目标检测质量盲评价方法 |
| CN110599538A (zh) * | 2019-09-30 | 2019-12-20 | 山东信通电子股份有限公司 | 一种输电线路导线覆冰厚度的识别方法和装置 |
| CN110766096A (zh) * | 2019-10-31 | 2020-02-07 | 北京金山云网络技术有限公司 | 视频分类方法、装置及电子设备 |
| CN110941995A (zh) * | 2019-11-01 | 2020-03-31 | 中山大学 | 基于轻量级网络的实时目标检测与语义分割的多任务学习方法 |
| CN111027493A (zh) * | 2019-12-13 | 2020-04-17 | 电子科技大学 | 一种基于深度学习多网络软融合的行人检测方法 |
| CN111027493B (zh) * | 2019-12-13 | 2022-05-20 | 电子科技大学 | 一种基于深度学习多网络软融合的行人检测方法 |
| TWI702536B (zh) * | 2019-12-31 | 2020-08-21 | 財團法人工業技術研究院 | 基於適應標註的物件偵測模型的訓練方法及系統 |
| US11321590B2 (en) | 2019-12-31 | 2022-05-03 | Industrial Technology Research Institute | Training method and system of objects detection model based on adaptive annotation design |
| CN111222468A (zh) * | 2020-01-08 | 2020-06-02 | 浙江光珀智能科技有限公司 | 一种基于深度学习的人流检测方法及系统 |
| CN111368829B (zh) * | 2020-02-28 | 2023-06-30 | 北京理工大学 | 一种基于rgb-d图像的视觉语义关系检测方法 |
| CN111368829A (zh) * | 2020-02-28 | 2020-07-03 | 北京理工大学 | 一种基于rgb-d图像的视觉语义关系检测方法 |
| CN111507985A (zh) * | 2020-03-19 | 2020-08-07 | 北京市威富安防科技有限公司 | 图像实例分割优化处理方法、装置和计算机设备 |
| CN111553925A (zh) * | 2020-04-27 | 2020-08-18 | 南通智能感知研究院 | 一种基于fcn的端对端农作物影像分割方法及系统 |
| CN111783784A (zh) * | 2020-06-30 | 2020-10-16 | 创新奇智(合肥)科技有限公司 | 建筑的空洞检测方法及装置、电子设备、存储介质 |
| CN112667832A (zh) * | 2020-12-31 | 2021-04-16 | 哈尔滨工业大学 | 一种未知室内环境下基于视觉的互定位方法 |
| CN112667832B (zh) * | 2020-12-31 | 2022-05-13 | 哈尔滨工业大学 | 一种未知室内环境下基于视觉的互定位方法 |
| CN113033398A (zh) * | 2021-03-25 | 2021-06-25 | 深圳市康冠商用科技有限公司 | 一种手势识别方法、装置、计算机设备及存储介质 |
| CN113763422B (zh) * | 2021-07-30 | 2023-10-03 | 北京交通大学 | 一种rgb-d图像显著性目标检测方法 |
| CN113763422A (zh) * | 2021-07-30 | 2021-12-07 | 北京交通大学 | 一种rgb-d图像显著性目标检测方法 |
| CN114343579A (zh) * | 2022-01-05 | 2022-04-15 | 浙江大学 | 一种患儿医源性皮肤损伤自动评估手持装置 |
| CN114677658A (zh) * | 2022-03-10 | 2022-06-28 | 清华大学 | 十亿像素动态大场景图像采集和多目标检测方法及装置 |
| CN114677658B (zh) * | 2022-03-10 | 2024-07-26 | 清华大学 | 十亿像素动态大场景图像采集和多目标检测方法及装置 |
| CN114373218B (zh) * | 2022-03-21 | 2022-06-14 | 北京万里红科技有限公司 | 一种用于检测活体对象的卷积网络的生成方法 |
| CN114373218A (zh) * | 2022-03-21 | 2022-04-19 | 北京万里红科技有限公司 | 一种用于检测活体对象的卷积网络的生成方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN106709568B (zh) | 2019-03-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN106709568A (zh) | 基于深层卷积网络的rgb‑d图像的物体检测和语义分割方法 | |
| CN114820579B (zh) | 一种基于语义分割的图像复合缺陷的检测方法及系统 | |
| JP7236545B2 (ja) | ビデオターゲット追跡方法と装置、コンピュータ装置、プログラム | |
| CN108304798B (zh) | 基于深度学习及运动一致性的街面秩序事件视频检测方法 | |
| CN107341517B (zh) | 基于深度学习层级间特征融合的多尺度小物体检测方法 | |
| Uhrig et al. | Box2pix: Single-shot instance segmentation by assigning pixels to object boxes | |
| CN107767405B (zh) | 一种融合卷积神经网络的核相关滤波目标跟踪方法 | |
| CN108229338B (zh) | 一种基于深度卷积特征的视频行为识别方法 | |
| WO2021218786A1 (zh) | 一种数据处理系统、物体检测方法及其装置 | |
| CN108416266B (zh) | 一种利用光流提取运动目标的视频行为快速识别方法 | |
| CN103984953B (zh) | 基于多特征融合与Boosting决策森林的街景图像的语义分割方法 | |
| CN107423760A (zh) | 基于预分割和回归的深度学习目标检测方法 | |
| Lu et al. | Cross stage partial connections based weighted bi-directional feature pyramid and enhanced spatial transformation network for robust object detection | |
| CN113887649B (zh) | 一种基于深层特征和浅层特征融合的目标检测方法 | |
| CN110517270B (zh) | 一种基于超像素深度网络的室内场景语义分割方法 | |
| CN114821665A (zh) | 一种基于卷积神经网络的城市人流小目标检测方法 | |
| CN113362347B (zh) | 一种基于超像素特征增强的图像缺陷区域分割方法和系统 | |
| CN104123417B (zh) | 一种基于聚类融合的图像分割的方法 | |
| CN107463881A (zh) | 一种基于深度增强学习的人物图像搜索方法 | |
| CN117557784B (zh) | 目标检测方法、装置、电子设备及存储介质 | |
| CN103761747B (zh) | 一种基于加权分布场的目标跟踪方法 | |
| CN105046689A (zh) | 一种基于多层次图结构的交互式立体图像快速分割方法 | |
| CN106780564A (zh) | 一种基于先验模型约束的抗干扰轮廓跟踪方法 | |
| CN111931603A (zh) | 基于竞合网络的双流卷积网络的人体动作识别系统及方法 | |
| CN116310688A (zh) | 基于级联融合的目标检测模型及其构建方法、装置及应用 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| PB01 | Publication | ||
| PB01 | Publication | ||
| SE01 | Entry into force of request for substantive examination | ||
| GR01 | Patent grant | ||
| GR01 | Patent grant | ||
| TR01 | Transfer of patent right | ||
| TR01 | Transfer of patent right |
Effective date of registration: 20211123 Address after: 518052 Room 201, building A, 1 front Bay Road, Shenzhen Qianhai cooperation zone, Shenzhen, Guangdong Patentee after: Shenzhen Xiaofeng Technology Co.,Ltd. Address before: 100124 No. 100 Chaoyang District Ping Tian Park, Beijing Patentee before: Beijing University of Technology |