WO2017166586A1

WO2017166586A1 - 基于卷积神经网络的图片鉴别方法、系统和电子设备

Info

Publication number: WO2017166586A1
Application number: PCT/CN2016/096031
Authority: WO
Inventors: 刘阳; 白茂生; 魏伟; 蔡砚刚; 祁海
Original assignee: Le Holdings Beijing Co Ltd; LeCloud Computing Co Ltd
Current assignee: Le Holdings Beijing Co Ltd; LeCloud Computing Co Ltd
Priority date: 2016-03-30
Filing date: 2016-08-19
Publication date: 2017-10-05
Anticipated expiration: 2018-09-30
Also published as: CN105868785A

Abstract

本发明公开了一种基于卷积神经网络的图片鉴别方法、系统和电子设备，包括：将图片数据输入至少两个串联连接的卷积层进行特征的提取，获得提取后的特征数据，其中，所述卷积层的核大小均不大于5×5；将提取后的特征数据通过池化层和卷积层进行特征数据的降维和提取，获得降维后的特征数据；其中，池化层采用平均值池化；将图片降维后的特征数据输入全连接层中，得到图片数据的二维特征值；将二维特征值通过分类器进行分类处理，得到图片的鉴别结果。本发明还公开了基于卷积神经网络的图片鉴别系统。所述基于卷积神经网络的图片鉴别方法及系统通过较小核的卷积层进行特征数据的提取，使得能够更好、更快地提取出图片的局部特征，进而提高了图片鉴别的速度和效率。

Description

基于卷积神经网络的图片鉴别方法、系统和电子设备

交叉引用

本申请要求在2016年03月30日提交中国专利局、申请号为201610195777.7、发明名称为“基于卷积神经网络的图片鉴别方法及系统”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本发明涉及卷积神经网络技术领域，特别是指一种基于卷积神经网络的图片鉴别方法、系统和电子设备。

背景技术

卷积神经网络(Convolutional Neural Network，CNN)是近年发展起来，并引起广泛重视的一种高效识别方法。目前，卷积神经网络已经成为众多科学领域的研究热点之一，特别是在模式分类领域，由于该网络避免了对图像的复杂前期预处理，可以直接输入原始图像，因而得到了更为广泛的应用。

一般地，卷积神经网络的基本结构中包括多个卷积层，每个卷积层上设置有多个神经元，每个神经元的输入与前一个卷积层的局部接受域(local receptive filed)相连，通过对前一个卷积层的局部接受域的数据进行卷积运算，以提取该局部接受域的特征，一旦该局部特征被提取后，它与其它特征间的位置关系也随之确定下来；然后，通过求局部平均(也称池化处理)与二次特征提取以进行特征映射，得到特征信息，该特征信息输出到下一个卷积层继续进行处理，直到到达最后一层(输出层)，从而得到最终输出结果。特征映射通常采用sigmoid函数作为卷积神经网络的激活函数。在卷积神经网络中，一个卷积层上的神经元与同一层的其他神经元共享权重，因而减少了网络自由参数的个数。在卷积神经网络模型中，可将激活函数(activation function)应用于每个作为输出结果的数据值以确定是否达到阈值，因此而产生的数据值作为下一个卷积层的输入。

通常的，一个用于识别的卷积神经网络计算模型包括卷积层、池化层、全连接层以及后续的分类器。通过对已有的样本数据的训练，能够获得较好的卷积神经网络计算模型，当需要识别新的目标时，只需要将目标的数据输入计算模型，就能够实现对新的目标的识别。

但是，现有的利用卷积神经网络的计算模型进行目标鉴别时，通常按照现有较为固定的模型架构进行计算，如AlexNet、VGG、GoogLeNet等，这些模型中卷积层、池化层、全连接层及激活函数等参数及架构都已经固定，虽然其具有通用性，但是也使得这些模型在应用于特定的场景时，其识别结果不佳。例如：在针对于视频或图片的鉴黄中，鉴别的效果较差。

发明内容

本发明的目的在于提出一种基于卷积神经网络的图片鉴别方法及系统，能够大大提高图片鉴别的速度和准确性。

基于上述目的本发明提供的一种基于卷积神经网络的图片鉴别方法，包括：

将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据，其中，所述至少两个卷积层的核大小均不大于5×5；

将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；

将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；

将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

可选的，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。

进一步，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。

可选的，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：

将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为256个；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。

可选的，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

可选的，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

可选的，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。

本发明还提供了一种基于卷积神经网络的图片鉴别系统，包括：

数据提取模块，用于将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据，并将图片提取后的特征数据发送给数据降维模块；其中，所述至少两个卷积层的核大小均不大于5×5；

数据降维模块，用于接收所述数据提取模块发送的图片提取后的特征数据，将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据，将获得的图片降维后的特征数据发送给全连接模块；其中，所述池化层采用平均值池化；

全连接模块，用于接收所述特征降维模块发送的图片降维后的特征数据，将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将获得的图片数据的二维特征值发送给分类模块；

分类模块，用于接收所述全连接模块发送的图片数据的二维特征值，将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

可选的，所述数据提取模块包括：

四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层核大小为3×3、C2层核大小为3×3、C3层核大小为5×5、C4层核大小为5×5。

可选的，所述数据降维模块包括：

依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为256个；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256。

可选的，所述全连接模块包括：

依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

可选的，所述系统包括依次连接的卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

本发明实施例又公开了一种电子设备，包括至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

上述的电子设备，其中，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。

上述的电子设备，其中，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。

上述的电子设备，其中，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。

上述的电子设备，其中，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

上述的电子设备，其中，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

上述的电子设备，其中，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。

本发明还公开了一种非易失性计算机存储介质，其中，所述存储介质存储有计算机可执行指令，所述计算机可执行指令当由电子设备执行时使得电子设备能够：将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

上述的存储介质，其中，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。

上述的存储介质，其中，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。

上述的存储介质，其中，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。

上述的存储介质，其中，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

上述的存储介质，其中，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

上述的存储介质，其中，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。

本发明实施例还提供了一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述任一所述的方法。

从上面所述可以看出，本发明实施例提供的基于卷积神经网络的图片鉴别方法及系统首先通过多个小窗口(卷积层的核小)的卷积层相连，使得能够更好、更快地提取出图片的局部特征，并将这些局部特征快速组合成高级特征，能够大大提高图片鉴别的速度和效率。

此外，本发明实施例所述的基于卷积神经网络的图片鉴别方法及系统通过采用平均值池化以及全连接层的处理，使得图片数据最后输出为2个特征，进而使得分类器进行分类鉴别处理时，不仅速度更快，而且准确性更高。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明提供的基于卷积神经网络的图片鉴别方法的实施例的流程图；

图2为本发明提供的卷积神经网络计算模型的结构示意图；

图3为本发明提供的基于卷积神经网络的图片鉴别系统的实施例的结构示意图。

图4为本发明实施例中电子设备的硬件结构示意图。

具体实施方式

下面将结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，术语“第一”、“第二”、“第三”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，术语“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，还可以是两个元件内部的连通，可以是无线连接，也可以是有线连接。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

参照图1所示，为本发明提供的基于卷积神经网络的图片鉴别方法的实施例的流程图。所述基于卷积神经网络的图片鉴别方法，包括：

步骤101，将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据，其中，优选的，所述至少两个卷积层的核大小均不大于5×5；

其中，所述待鉴别的图片数据既可以为直接的图片数据信息，还可以为视频中获取的图片信息，也即本发明所述的方法也同样适用于视频的鉴别。所述卷积层用于对输入的图片数据进行局部块特征的提取，获得更高一级的特征数据，且每个卷积层中均会进行多次的卷积操作。通常卷积层的核采用n×n的结构(也可以采用m×n)，所述卷积层的核越小，则能够提取出更多的特征，但是相应的特征数据也更多。

步骤102，将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；

其中，所述池化层用于将卷积层输出的特征数据进行降维处理，也即在保证数据有效性的基础上大大减少数据量。这里所述的反复是指重复池化或卷积的过程，例如：池化层-卷积层-池化层-卷积层，当然，也可以在中间的某一层中多次出现池化层或者卷积层。所述平均值池化是指按照池化的原则，取池化核大小范围内数据的平均值作为池化后的输出数据。

步骤103，将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；

不论经过多少个全连接层的处理，最后一个全连接层都输出一个2维的特征数据，这样，在进行分类鉴别时能够更加准确。

步骤104，将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

由上述实施例可知，所述基于卷积神经网络的图片鉴别方法通过多个小窗口(即卷积层的核较小)的卷积层依次相连，使得能够更好、更快地提取出图片的局部特征，并将这些局部特征快速组合成高级特征，能够大大提高图片鉴别的速度和效率。同时，本发明所述的基于卷积神经网络的图片鉴别方法及系统通过采用平均值池化以及全连接层的处理，使得图片数据最后输出为2个特征，进而使得分类器进行分类鉴别处理时，不仅速度更快，而且准确性更高。

作为本发明一个较佳的实施例，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层核大小为3×3、C2层核大小为3×3、C3层核大小为5×5、C4层核大小为5×5。这样，依次连接的卷积层能够更有效地提取图片的特征数据，同时还减少了神经网络计算模型的参数，对于提升鉴别速度，防止过度拟合由较大的作用。

作为本发明进一步的实施例，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。其中，所述卷积层的步数指卷积层的核每次移动的步长，所述pad值是指在输入数据的周围是否添加一圈数据参与运算，pad值的大小也即添加数据的圈数。这样，能够进一步提高卷积层的处理效率和速度，进而提高图片鉴别的效率。

作为本发明一个优选的实施例，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤102包括：将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。

作为本发明另一个优选的实施例，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。这里，所述的节点数据也可以理解为特征数目。所述dropout方式是通过随机开启一定数目的数据，而将剩下的数据丢弃，这样能够有效地防止数据的过拟合，进而提高鉴别的效率。

参照图2所示，为本发明提供的卷积神经网络计算模型的结构示意图。所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。其中，所有卷积层以及全连接层fc9、全连接层fc10、全连接层fc11均通过激活函数LEAKY RELU进行数据的处理，使得前一层的数据能够向下一层传递。所述激活函数是将上一次的输出数据通过激活函数中的算法计算得到新的输出结果，将所述新的输出结果作为下一层的输入数据。本发明通过选用分类器SVM(支持向量机)，使得能够更加适用于二分问题的鉴别。同时，本发明所采用的激活函数LEAKY RELU相比于传统的激活函数RELU，在函数值小于零时，也具有一定的输出值，也即使得函数值小于零这一部分的数据也可以参与训练过程。这里，当函数值小于0时，输出值为输入值乘以一个系数a，所述系数a优选采用固定值。

优选的，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。其中，最后一个全连基层可以不需要激活函数。这样，能够使得数据的传递更为有效。

在一些可选的实施例中，本发明准备正负训练样本一共100小时视频，从视频中截取110万张图片，其中，正样本训练图片50万张，负样本训练图片50万张。测试样本10万张，正负样本各5万张。网络中卷积层采用标准偏差为0.01的高斯分布进行初始化。LEAKY RELU函数的系数a参数为0.01。全连接层中参数采用标准偏差为0.002的高斯分布进行初始化。dropout模块的参数为0.5。训练过程采用反向传播算法(BP算法)进行参数的训练及更新。本发明中一共训练30万次迭代。

参照图3所示，为本发明提供的一种基于卷积神经网络的图片鉴别系统的一个实施例的结构示意图。所述基于卷积神经网络的图片鉴别系统包括：

数据提取模块201，用于将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据，并将图片提取后的特征数据发送给数据降维模块202；其中，所述至少两个卷积层的核大小均不大于5×5；

数据降维模块202，用于接收所述数据提取模块201发送的图片提取后的特征数据，将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据，将获得的图片降维后的特征数据发送给全连接模块203；其中，所述池化层采用平均值池化；

全连接模块203，用于接收所述特征降维模块202发送的图片降维后的特征数据，将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将获得的图片数据的二维特征值发送给分类模块204；

分类模块204，用于接收所述全连接模块203发送的图片数据的二维特征值，将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

由上述实施例可知，所述基于卷积神经网络的图片鉴别系统通过所述数据提取模块201完成数据的卷积，进而数显图片数据特征的提取，然后通过所述数据降维模块202实现特征的降维处理，通过所述全连接模块203获得图片数据的二维特征值，最后通过所述分类模块204实现图片数据的鉴别。所述基于卷积神经网络的图片鉴别系统通过采用较小核的卷积层实现特征数据的有效提取，不仅提高了图片鉴别的效率和速度，而且有效的防止了过拟合。

作为本发明一个优选的实施例，所述数据提取模块201包括：四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层核大小为3×3、C2层核大小为3×3、C3层核大小为5×5、C4层核大小为5×5。

作为本发明进一步的实施例，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。

作为本发明另一个优选的实施例，所述数据降维模块202包括：依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为256个；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256。

在一些可选的实施例中，所述全连接模块203包括：依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

在本发明另一些可选的实施例中，所述系统包括依次连接的卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

优选的，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。

如图4所示，本发明实施例又公开了一种电子设备，包括至少一个处理器810；以及，与所述至少一个处理器810通信连接的存储器800；其中，所述存储器800存储有可被所述至少一个处理器810执行的指令，所述指令被所述至少一个处理器810执行，以使所述至少一个处理器810能够将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。所述电子设备还包括与所述存储器800和所述处理器电连接的输入装置830和输出装置840，所述电连接优选为通过总线连接。

本实施例的电子设备，优选地，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。

本实施例的电子设备，优选地，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。

本实施例的电子设备，优选地，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。

本实施例的电子设备，优选地，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

本实施例的电子设备，优选地，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

本实施例的电子设备，优选地，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。

本发明实施例还公开了一种非易失性计算机存储介质，其中，所述存储介质存储有计算机可执行指令的所述计算机可执行指令，当由电子设备执行时使得电子设备能够将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。

本实施例的存储介质，优选地，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。

本实施例的存储介质，优选地，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。

本实施例的存储介质，优选地，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。

本实施例的存储介质，优选地，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。

本实施例的存储介质，优选地，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。

本实施例的存储介质，优选地，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。

本发明实施例还提供了一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，当所述程序指令被计算机执行时，使所述计算机执行上述实施例所述的方法。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引伸出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

一种基于卷积神经网络的图片鉴别方法，应用于终端，其特征在于，包括：

将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；

将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；

将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；

将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。
根据权利要求1所述的方法，其特征在于，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。
根据权利要求2所述的方法，其特征在于，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。
根据权利要求1所述的方法，其特征在于，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：

将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。
根据权利要求1所述的方法，其特征在于，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。
根据权利要求1所述的方法，其特征在于，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。
根据权利要求1-6任意一项所述的方法，其特征在于，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。
一种基于卷积神经网络的图片鉴别系统，其特征在于，包括：

数据提取模块，用于将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据，并将图片提取后的特征数据发送给数据降维模块；其中，所述至少两个卷积层的核大小均不大于5×5；

数据降维模块，用于接收所述数据提取模块发送的图片提取后的特征数据，将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据，将获得的图片降维后的特征数据发送给全连接模块；其中，所述池化层采用平均值池化；

全连接模块，用于接收所述特征降维模块发送的图片降维后的特征数据，将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；将获得的图片数据的二维特征值发送给分类模块；

分类模块，用于接收所述全连接模块发送的图片数据的二维特征值，将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。
根据权利要求8所述的系统，其特征在于，所述数据提取模块包括：

四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层核大小为3×3、C2层核大小为3×3、C3层核大小为5×5、C4层核大小为5×5。
根据权利要求9所述的系统，其特征在于，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。
根据权利要求8所述的系统，其特征在于，所述数据降维模块包括：

依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为256个；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。
根据权利要求8所述的系统，其特征在于，所述全连接模块包括：

依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。
根据权利要求8所述的系统，其特征在于，所述系统包括依次连接的卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。
根据权利要求8-13任意一项所述的系统，其特征在于，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。
一种电子设备，其特征在于包括至少一个处理器；以及，与所述至少一个处理器通信连接的存储器；其中，所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够

将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；

将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；

将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；

将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。
根据权利要求15所述的电子设备，其特征在于，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、 C3层的核大小为5×5、C4层的核大小为5×5。
根据权利要求16所述的电子设备，其特征在于，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。
根据权利要求15所述的电子设备，其特征在于，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：

将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。
根据权利要求15所述的电子设备，其特征在于，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。
根据权利要求15所述的电子设备，其特征在于，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。
根据权利要求15-20任意一项所述的电子设备，其特征在于，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。
一种非易失性计算机存储介质，其特征在于：所述存储介质存储有计算机可执行指令，所述计算机可执行指令当由电子设备执行时使得电子设备能够：

将待鉴别的图片数据输入至少两个串联连接的卷积层进行特征的连续提取，获得图片提取后的特征数据；

将所述图片提取后的特征数据通过至少一个池化层和至少一个卷积层进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据；其中，所述池化层采用平均值池化；

将所述图片降维后的特征数据输入至少一个全连接层中，得到图片数据的二维特征值；

将所述二维特征值通过分类器进行分类处理，得到图片的鉴别结果。
根据权利要求22所述的存储介质，其特征在于，所述至少两个串联连接的卷积层包含四个依次连接的卷积层C1层、C2层、C3层和C4层，且所述卷积层的核大小分别为：C1层的核大小为3×3、C2层的核大小为3×3、C3层的核大小为5×5、C4层的核大小为5×5。
根据权利要求23所述的存储介质，其特征在于，所述四个依次连接的卷积层的步数均为1；四个卷积层的卷积核的个数均为96个；所述C1层和C2层的pad值均为1，所述C3层和C4层的pad值均为2。
根据权利要求22所述的存储介质，其特征在于，所述将所述图片提取后的特征数据通过至少一个的池化层和至少一个卷积层反复的进行特征数据的降维和特征数据的提取，获得图片降维后的特征数据的步骤包括：

将所述图片提取后的特征数据通过依次连接的池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8和池化层P8；其中，所述池化层P4、池化层P5、池化层P8的核大小均为3，步数均为2，pad值均为0；所述卷积层C5的核大小为5，步数为1，pad值为2，卷积核的个数为为256；所述卷积层C6、卷积层C7、卷积层C8的核大小均为3，步数均为1，pad值均为1，卷积核的个数分别为384、384、256个。
根据权利要求22所述的存储介质，其特征在于，所述至少一个全连接层为依次连接的全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12；其中所述全连接层的节点数目分别为2048、2048、2048、2；且所有全连接层均采用dropout方式进行数据处理。
根据权利要求22所述的存储介质，其特征在于，所述待鉴别的图片数据依次经过卷积层C1、卷积层C2、卷积层C3、卷积层C4、池化层P4、卷积层C5、池化层P5、卷积层C6、卷积层C7、卷积层C8、池化层P8、全连接层fc9、全连接层fc10、全连接层fc11、全连接层fc12的处理，然后连接到分类器SVM中经过分类处理，得到图片的鉴别结果。
根据权利要求22-27任意一项所述的存储介质，其特征在于，所有所述卷积层和所有所述全连接层均采用激活函数LEAKY RELU进行数据的激活处理。
一种计算机程序产品，所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，所述计算机程序包括程序指令，其特征在于，当所述程序指令被计算机执行时，使所述计算机执行上述任一权利要求所述的方法。