CN114463814B

CN114463814B - 一种基于图像处理的快速证件照眼镜检测方法

Info

Publication number: CN114463814B
Application number: CN202210094313.2A
Authority: CN
Inventors: 兰志才; 张正德; 李坚
Original assignee: Shanghai Xihongqiao Navigation Technology Co ltd
Current assignee: Shanghai Xihongqiao Navigation Technology Co ltd
Priority date: 2022-01-26
Filing date: 2022-01-26
Publication date: 2024-08-23
Anticipated expiration: 2042-01-26
Also published as: CN114463814A

Abstract

本发明公开了一种基于图像处理的快速证件照眼镜检测方法，属于图像识别技术领域。本发明通过图像处理增强证件照的对比度，突出镜框和脸部的分界线，不断对证件照进行切片，获得眼镜可能存在区域的切片，在此基础上进一步图像处理，对眼镜可能存在区域进行高斯平滑处理，基于非极大值抑制输出边缘强度矩阵，强调鼻梁和眼下的眼镜特征，极大程度的提高了本发明识别眼镜的正确率；本发明不依赖深度学习算法进行眼镜识别，针对无框眼镜识别同样有很高的正确率，同时本发明不仅快速，可以满足实时性，而且具有极高的正确率较低的召回率，极大程度的降低了对于计算资源的需求，可以满足内网安全的需求。

Description

一种基于图像处理的快速证件照眼镜检测方法

技术领域

本发明涉及图像识别技术领域，具体为一种基于图像处理的快速证件照眼镜检测方法。

背景技术

证件照是各种证件各种场景中证明身份的照片，证件照是要求各不一致，部分证件照是不允许申请者佩戴眼镜的，通过人工进行筛选不仅需要大量的人工，还会拖慢流程时间，因此需要计算机智能的判别证件照中人物是否佩戴眼镜，传统计算机视觉算法无法正确识别种类繁杂的眼镜，而网络自发训练的端到端识别方法由于缺乏先验知识，吸纳了大量冗余特征，无法较好地取得性能和正确性之间的平衡，如：直接使用支持向量机对戴眼镜的人脸进行学习，由于人脸本身的复杂性，眼镜框的形状和粗细之间的相互作用，无框眼镜缺乏可以用于支持向量机识别的显著的方向梯度直方图特征，这些因素使得识别的正确率和召回率之间无法得到较好的平衡；而深度学习计算方法依赖于大量的计算资源，导致算法运行时间过长。

发明内容

本发明的目的在于提供一种基于图像处理的快速证件照眼镜检测方法，以解决上述背景技术中提出的问题。

为了解决上述技术问题，本发明提供如下技术方案：一种基于图像处理的快速证件照眼镜检测方法，眼镜检测方法的具体步骤包括：

步骤一：获取证件照，通过相机或摄像头或数据采集系统获取证件照；

步骤二：图像处理，对证件照进行图像增强；

步骤三：不断对证件照进行切片，获得眼镜可能存在区域的切片；

步骤四：对眼镜可能存在区域进行高斯平滑处理；

步骤五：基于非极大值抑制输出边缘强度矩阵；

步骤六：基于更新后的边缘强度矩阵进一步切片重组眼镜可能区域；

步骤七：将重组眼镜可能区域输入眼镜支持向量机，输出最终结果。

本发明不依赖深度学习算法进行眼镜识别，通过图像处理不断强化证件照中可能存在的眼镜的特征，配合不断的切片一步步的定位镜框可能存在的位置，极大程度的提高了最终支持向量机识别眼镜的正确率，本发明不仅快速，可以满足实时性，而且具有极高的正确率较低的召回率，极大程度的降低了对于计算资源的需求，同时可以满足内网安全的需求。

所述步骤二中对于证件照进行图像增强包括直方图均衡化和高光修正；

增强证件照的对比度，抑制证件照在空间域中的噪声，突出镜框和脸部的分界线，降低光照对图像的影响，进行高光修正消除图像中的高亮度奇异区域；

所述直方图均衡化具体内容为：将证件照的RGB三通道转化为HSV通道，对于亮度V通道基于累积分布函数进行直方图均衡化，将直方图均衡化的HSV通道重新转化为RGB图像输出；

直接将证件照基于RGB三通道分别进行直方图均衡化会导致出现奇异点，证件照的RGB三通道转化为HSV通道，映射后灰度级为0～255，灰度级得到了扩展，基于累积分布函数将灰度值重新分配，再转化为RGB图像输出。

所述直方图均衡化具体步骤包括：

Step 1.1：计算RGB三通道像素的最大值和最小值的具体公式为：

A＝max(r，g，b)

I＝min(r，g，b)

其中，r，g，b表示证件照RGB三通道的数值，A表示r，g，b中最大值，I表示r，g，b中最小值；

Step 1.2：将证件照RGB三通道转化为HSV通道具体计算公式为：

V＝A

其中，H表示HSV通道中的色调，S表示HSV通道中的饱和度，V表示HSV通道中的亮度；

Step 1.3：直方图均衡化亮度通道具体公式为：

其中，V_hist表示直方图均衡化后的新亮度通道，cdf(V)表示原亮度通道的累积分布函数，定义域为[0，255]，值域记作[cdf(V)_min，cdf(V)_max]。

Step 1.4：将H、S和V_hist重新转换为RGB三通道输出证件照。

所述高光修正具体内容为：基于双边滤波的高光抑制算法进行高光修正，建立双色反射模型得到镜面反射分量与最大漫反射色度之间的转换关系，设置阈值分离仅含漫反射分量的像素点与含有镜面反射分量的像素点，估算仅含漫反射分量的像素点与含有镜面反射分量的像素点的最大漫反射色度，以估算的最大漫反射色度的相似度作为双边滤波器的值域，同时以图像的最大色度图作为双边滤波的引导图保边去噪，去除镜面反射分量，从而进行高光修正。

所述步骤三的具体步骤包括：

Step 2.1：通过方向梯度直方图特征提取器和线性支持向量机识别图像中的人脸，输出人脸区域切片；

Step 2.2：通过方向梯度直方图特征提取器和线性支持向量机识别人脸区域切片中的五官，获取左右眼虹膜中心区域坐标；

Step 2.3：获取眼镜可能存在区域切片，旋转图片直至左右眼虹膜中心坐标的连线水平，通过缩放图像直至左右眼虹膜中心坐标的线段长度为d个像素；裁剪左眼虹膜中心坐标上d像素，左眼虹膜中心坐标下d像素，左眼虹膜中心坐标左侧像素，左眼虹膜中心坐标右侧像素，最终输出2d*2d像素的眼镜可能存在区域切片。

不断的切片一步步逼近眼镜的范围，一方面减少无关信息的干扰提高支持向量机的正确率，另一方面极大的程度的缩小数据量，避免数据冗余。

所述Step 2.1具体步骤包括：

Step 2.1.a：将证件照灰度化，降低图像在后续计算中所占用的计算资源，增强视觉上的对比，突出目标特征，具体计算公式为：

gray＝0.299r+0.587g+0.114b

其中，gray表示证件照灰度值，r，g，b表示证件照RGB三通道的数值；

Step 2.1.b：计算每个像素的梯度值和梯度方向，具体计算公式为：

其中，g(x，y)表示坐标为(x，y)的像素的梯度值，g_x表示水平方向梯度，g_y表示垂直方向梯度；

Step 2.1.c：计算梯度方向，具体计算公式为：

其中，θ(x，y)表示坐标为(x，y)的像素的梯度方向；

Step 2.1.d：计算梯度直方图向量，具体的计算公式为：

HOG(i)＝∑g(x，y)，(i*20≤θ(x，y)＜(i+1)*20)

其中i取值范围{0，1，2，3，4，5，6，7，8}，将图片切分为8*8的单元，根据每个单元的角度分组计算方向梯度直方图特征向量；

Step 2.1.e：归一化方向梯度直方图，以2*2的单元为一个块，块的方向梯度直方图特征向量是4个单元的方向梯度直方图特征向量组成的36维向量，计算块的方向梯度直方图特征向量的归一值，具体计算公式为：

其中，k表示向量的维度，HOG′(k)表示块的方向梯度直方图特征向量；

Step 2.1.f：输入块的方向梯度直方图特征向量至人脸支持向量机中进行分类，输出人脸区域；

块的方向梯度直方图特征向量是一个36维向量，可以认为每一个块的方向梯度直方图特征向量是36维空间中的一个点，预先通过标注好的人脸区域获得人脸支持向量机，所述人脸支持向量机就是一组36维超平面可以框柱被认为是人脸的点，在二维空间中，人脸支持向量机通过一组直线框柱人脸所在区域，最终输出人脸切片。

所述步骤四对眼镜可能存在区域进行高斯平滑处理具体内容包括：

对于眼镜可能存在区域的每一个点(x，y)，其他点(x±u，y±v)关于点(x，y)的权重具体计算公式为：

其中，u表示其他点(x±u，y±v)与点(x，y)沿着X轴的距离，v表示其他点(x±u，y±v)与点(x，y)沿着Y轴的距离，G(u，v)表示其他点(x±u，y±v)关于点(x，y)的权重；

将眼镜可能存在区域每一个点进行高斯平滑处理，具体计算公式为：

其中，pixel(x±u，y±v)表示其他点(x±u，y±v)的像素值，c表示眼镜可能存在区域的长，w表示眼镜可能存在区域的宽，pixel′(x，y)表示点(x，y)高斯平滑处理后的像素值。对眼镜可能存在区域进行高斯平滑处理过滤掉眼镜可能存在区域的细小噪声，以便进一步的获取边缘强度矩阵，防止噪声引起的错误检测。

通过梯度计算后的图像边缘是模糊的，通过非极大值抑制计算边缘强度矩阵，进一步的对于边缘进行强化，同时将局部最大值之外的所有梯度值抑制为0，进一步更新边缘强度矩阵，极大程度的强化边缘。

所述步骤五基于非极大值抑制输出边缘强度矩阵的具体内容包括：

Step 3.1：计算眼镜可能存在区域每一个沿着Y轴方向上的一阶导数矩阵gray’；

Step 3.2：输出通过非极大值抑制得到边缘强度矩阵g(x，y)，具体计算公式为：

Step 3.3：判断g(x，y)每个像素邻接的8个像素中为0的元素的个数输出零度矩阵e(x，y)，具体计算公式为：

Step 3.4：计算零度矩阵E进行步进为1的含上下阈值Q和H的最大池化更新边缘强度矩阵，具体计算公式为：

其中，g(x，y)′表示更新后的边缘强度矩阵。

所述步骤六重组眼镜可能区域的具体内容包括：

从边缘强度矩阵中裁剪鼻梁区域，眼睛下方区域，得到重组眼镜可能区域切片：基于边缘强度矩阵和上述步骤中对于证件照的切片，进一步的定位鼻梁和眼镜下面的镜框，强调鼻梁和眼镜下面的镜框特征。

鼻梁区域以点(x₁，y₁)和点(x₂，y₂)确定的矩形组成，具体计算公式为：

眼睛下方区域由以点(x₁₁，y₁₁)和点(x₁₂，y₁₂)确定的矩形及以点(x₂₁，y₂₁)和点(x₂₂，y₂₂)确定的矩形拼接而成，具体计算公式为：

所述步骤七判断是否具有眼镜框具体内容包括：将重组眼镜可能区域的矩阵提取方向梯度直方图特征，输入眼镜支持向量机进行检测，设置上限阈值B，当眼镜支持向量机的返回值大于阈值B，判断照片中人脸带了眼镜，当眼镜支持向量机的返回值小于阈值B，判断照片中人脸没有佩戴眼镜，根据判断结果输出最终结果。

所述步骤七判断是否具有眼镜框具体内容还包括：将重组眼镜可能区域的矩阵提取方向梯度直方图特征，输入眼镜支持向量机进行检测，设置上限阈值B和下限阈值S，当眼镜支持向量机的返回值大于阈值B，判断照片中人脸带了眼镜，当眼镜支持向量机的返回值小于阈值S，判断照片中人脸没有佩戴眼镜，基于玻璃检测网络GDNet建立玻璃检测模型，当眼镜支持向量机的返回值小于B大于S时，将证件照输入玻璃检测模型，如果检测到玻璃，判断照片中人脸带了眼镜，如果没有检测到玻璃，判断照片中人脸没有佩戴眼镜，根据判断结果输出最终结果。

与现有技术相比，本发明所达到的有益效果是：

1.本发明不依赖深度学习算法进行眼镜识别，通过图像处理不断强化证件照中可能存在的眼镜的特征，配合不断的切片一步步的定位镜框可能存在的位置，极大程度的提高了最终支持向量机识别眼镜的正确率；

2.本发明配合图像处理一步步的切片，强调可能存在的眼镜镜框的特征，本发明针对无框眼镜识别同样有很高的正确率；

3.本发明不仅快速，可以满足实时性，而且具有极高的正确率较低的召回率，极大程度的降低了对于计算资源的需求，同时可以满足内网安全的需求。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1是本发明一种基于图像处理的快速证件照眼镜检测方法的流程示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参阅图1，本发明提供技术方案：

实施例一：一种基于图像处理的快速证件照眼镜检测方法，眼镜检测方法的具体步骤包括：

步骤二：图像处理，对证件照进行图像增强；

步骤四：对眼镜可能存在区域进行高斯平滑处理；

步骤五：基于非极大值抑制输出边缘强度矩阵；

步骤二中对于证件照进行图像增强包括直方图均衡化和高光修正；

直方图均衡化具体内容为：将证件照的RGB三通道转化为HSV通道，对于亮度V通道基于累积分布函数进行直方图均衡化，将直方图均衡化的HSV通道重新转化为RGB图像输出；

直方图均衡化具体步骤包括：

A＝max(r，g，b)

I＝min(r，g，b)

Step 1.2：将证件照RGB三通道转化为HSV通道具体计算公式为：

V＝A

Step 1.3：直方图均衡化亮度通道具体公式为：

Step 1.4：将H、S和V_hist重新转换为RGB三通道输出证件照。

高光修正具体内容为：基于双边滤波的高光抑制算法进行高光修正，建立双色反射模型得到镜面反射分量与最大漫反射色度之间的转换关系，设置阈值分离仅含漫反射分量的像素点与含有镜面反射分量的像素点，估算仅含漫反射分量的像素点与含有镜面反射分量的像素点的最大漫反射色度，以估算的最大漫反射色度的相似度作为双边滤波器的值域，同时以图像的最大色度图作为双边滤波的引导图保边去噪，去除镜面反射分量，从而进行高光修正。

步骤三的具体步骤包括：

Step 2.3：获取眼镜可能存在区域切片，旋转图片直至左右眼虹膜中心坐标的连线水平，通过缩放图像直至左右眼虹膜中心坐标的线段长度为128个像素；裁剪左眼虹膜中心坐标上128像素，左眼虹膜中心坐标下128像素，左眼虹膜中心坐标左侧64像素，左眼虹膜中心坐标右侧192像素，最终输出256*256像素的眼镜可能存在区域切片。

Step 2.1具体步骤包括：

gray＝0.299r+0.587g+0.114b

Step 2.1.c：计算梯度方向，具体计算公式为：

其中，θ(x，y)表示坐标为(x，y)的像素的梯度方向；

Step 2.1.d：计算梯度直方图向量，具体的计算公式为：

HOG(i)＝∑g(x，y)，(i*20≤θ(x，y)＜(i+1)*20)

块的方向梯度直方图特征向量是一个36维向量，可以认为每一个块的方向梯度直方图特征向量是36维空间中的一个点，预先通过标注好的人脸区域获得人脸支持向量机，人脸支持向量机就是一组36维超平面可以框柱被认为是人脸的点，在二维空间中，人脸支持向量机通过一组直线框柱人脸所在区域，最终输出人脸切片。

步骤四对眼镜可能存在区域进行高斯平滑处理具体内容包括：

步骤五基于非极大值抑制输出边缘强度矩阵的具体内容包括：

Step 3.4：计算零度矩阵E进行步进为1的含上下阈值L和H的最大池化更新边缘强度矩阵，具体计算公式为：

其中，g(x，y)′表示更新后的边缘强度矩阵。

步骤六重组眼镜可能区域的具体内容包括：

步骤七判断是否具有眼镜框具体内容包括：将重组眼镜可能区域的矩阵提取方向梯度直方图特征，输入眼镜支持向量机进行检测，设置上限阈值B，当眼镜支持向量机的返回值大于阈值B，判断照片中人脸带了眼镜，当眼镜支持向量机的返回值小于阈值B，判断照片中人脸没有佩戴眼镜，根据判断结果输出最终结果。

步骤七判断是否具有眼镜框具体内容还包括：将重组眼镜可能区域的矩阵提取方向梯度直方图特征，输入眼镜支持向量机进行检测，设置上限阈值B和下限阈值S，当眼镜支持向量机的返回值大于阈值B，判断照片中人脸带了眼镜，当眼镜支持向量机的返回值小于阈值S，判断照片中人脸没有佩戴眼镜，基于玻璃检测网络GDNet建立玻璃检测模型，当眼镜支持向量机的返回值小于B大于S时，将证件照输入玻璃检测模型，如果检测到玻璃，判断照片中人脸带了眼镜，如果没有检测到玻璃，判断照片中人脸没有佩戴眼镜，根据判断结果输出最终结果。

需要说明的是，在本文中，诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来，而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、物品或者设备所固有的要素。

最后应说明的是：以上所述仅为本发明的优选实施例而已，并不用于限制本发明，尽管参照前述实施例对本发明进行了详细的说明，对于本领域的技术人员来说，其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于图像处理的快速证件照眼镜检测方法，其特征在于：眼镜检测的具体步骤包括：

步骤一：获取证件照；

步骤二：图像处理，对证件照进行图像增强；

步骤四：对眼镜可能存在区域进行高斯平滑处理；

步骤五：基于非极大值抑制输出边缘强度矩阵；

步骤七：将重组眼镜可能区域输入眼镜支持向量机，输出最终结果；

其中，所述步骤三具体步骤包括：

Step 2.1.a：将证件照灰度化，具体计算公式为：

；

其中，gray表示证件照灰度值，表示证件照RGB三通道的数值；

；

其中，表示坐标为(x,y)的像素的梯度值，表示水平方向梯度，表示垂直方向梯度；

Step 2.1.c：计算梯度方向，具体计算公式为：

；

其中，表示坐标为(x,y)的像素的梯度方向；

Step 2.1.d：计算梯度直方图向量，具体的计算公式为：

；

其中i取值范围{0,1,2,3,4,5,6,7,8}，将图片切分为8*8的单元，根据每个单元的角度分组计算方向梯度直方图特征向量；

；

其中，表示向量的维度, 表示块的方向梯度直方图特征向量；

Step 2.3：获取眼镜可能存在区域切片，旋转图片直至左右眼虹膜中心坐标的连线水平，通过缩放图像直至左右眼虹膜中心坐标的线段长度为d个像素；裁剪左眼虹膜中心坐标上d像素，左眼虹膜中心坐标下d像素，左眼虹膜中心坐标左侧像素，左眼虹膜中心坐标右侧像素，最终输出像素的眼镜可能存在区域切片。

2.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法，其特征在于：所述步骤二中对于证件照进行图像增强包括直方图均衡化和高光修正；

所述直方图均衡化具体步骤包括：

，

其中，表示证件照RGB三通道的数值，表示中最大值，表示中最小值；

Step 1.2：将证件照RGB三通道转化为HSV通道具体计算公式为：

，

其中，表示HSV通道中的色调，表示HSV通道中的饱和度，表示HSV通道中的亮度；

Step 1.3：直方图均衡化亮度通道具体公式为：

；

其中，表示直方图均衡化后的新亮度通道，表示原亮度通道的累积分布函数，定义域为[0,255]，值域为；

Step 1.4：将H、S和重新转换为RGB三通道输出证件照。

3.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法，其特征在于：所述步骤四对眼镜可能存在区域进行高斯平滑处理具体内容包括：

对于眼镜可能存在区域的每一个点(x, y)，其他点(x±u, y±v)关于点(x, y)的权重具体计算公式为：

；

其中，表示其他点(x±u, y±v)与点(x, y) 沿着X轴的距离，表示其他点(x±u, y±v)与点(x, y) 沿着Y轴的距离，表示其他点(x±u, y±v)关于点(x, y)的权重；

；

其中，表示其他点(x±u, y±v)的像素值，表示眼镜可能存在区域的长，表示眼镜可能存在区域的宽，表示点(x, y)高斯平滑处理后的像素值。

4.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法，其特征在于：所述步骤五基于非极大值抑制输出边缘强度矩阵的具体内容包括：

Step 3.1：计算眼镜可能存在区域每一个沿着Y轴方向上的一阶导数矩阵gray'；

Step 3.2：输出通过非极大值抑制得到边缘强度矩阵，具体计算公式为：

；

Step 3.3：判断每个像素邻接的8个像素中为0的元素的个数输出零度矩阵，具体计算公式为：

；

其中，表示更新后的边缘强度矩阵。

5.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法，其特征在于：所述步骤六重组眼镜可能区域的具体内容包括：从边缘强度矩阵中裁剪鼻梁区域，眼睛下方区域，得到重组眼镜可能区域切片；

鼻梁区域以点()和点()确定的矩形组成，具体计算公式为：

；

眼睛下方区域由以点和点确定的矩形及以点和点确定的矩形拼接而成，具体计算公式为：

。

6.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法，其特征在于：所述步骤七判断是否具有眼镜框具体内容包括：将重组眼镜可能区域的矩阵提取方向梯度直方图特征，输入眼镜支持向量机进行检测，设置上限阈值B，当眼镜支持向量机的返回值大于阈值B，判断照片中人脸带了眼镜，当眼镜支持向量机的返回值小于阈值B，判断照片中人脸没有佩戴眼镜，根据判断结果输出最终结果。

7.根据权利要求1所述的一种基于图像处理的快速证件照眼镜检测方法，其特征在于：所述步骤七判断是否具有眼镜框具体内容还包括：将重组眼镜可能区域的矩阵提取方向梯度直方图特征，输入眼镜支持向量机进行检测，设置上限阈值B和下限阈值S，当眼镜支持向量机的返回值大于阈值B，判断照片中人脸带了眼镜，当眼镜支持向量机的返回值小于阈值S，判断照片中人脸没有佩戴眼镜，基于玻璃检测网络GDNet建立玻璃检测模型，当眼镜支持向量机的返回值小于B大于S时，将证件照输入玻璃检测模型，如果检测到玻璃，判断照片中人脸带了眼镜，如果没有检测到玻璃，判断照片中人脸没有佩戴眼镜，根据判断结果输出最终结果。