一种基于视觉系统的宽动态处理方法
技术领域:
本发明属于图像处理领域,特指一种基于视觉系统的宽动态处理方法。
背景技术:
宽动态技术是亮度变化范围非常大的情况下让摄像机看清影像的一种技术。当我们用摄像机对同时包括高亮区域和背光区域的场景进行取景时,输出图像在高亮区域由于曝光过度成为一片白色,而在阴暗区域因曝光不足成为一片黑色,从而无法看清这些区域的景象使图像质量完全无法满足实际应用的需要。造成这种现象的原因在于普通摄像机的成像缺陷,也就是通常所讲的动态范围不足。而宽动态技术由于能够覆盖更宽的动态范围,有效提高光线变化范围大的场景的成像质量,在视频监控、遥感测量、军事侦察等方面有广泛的应用。
目前宽动态技术按照处理方式分两类:一类是硬件方式,另一类是软件方式。基于硬件的实现方法主要是改进采集设备的结构组织,包括基于高动态范围相机、对传感器芯片进行特殊改造等。但这类方法实现工艺较为复杂,成本较高,不利于大面积应用推广。
更广泛的处理方式是基于软件的方法,代表方法为色调映射法和多曝光融合法,都是利用普通相机对同一场景以不同的曝光方式采集多次数据,然后通过各种算法处理将它们的细节融合成新的图像也即宽动态范围图像,最后在普通显示器上显示出来。这类方法的不足之处在于需要对场景进行多次拍摄,然后对多幅图像进行处理,实时性无法得到满足。
发明内容:
本发明针对现有宽动态方法的不足,提出一种基于视觉系统的宽动态处理方法,其只使用当前场景的一帧图像信息,根据人眼视觉系统特点制定一个两层宽动态处理机制,并且使用像素邻域信息计算参数环境变量,使得处理后的图像能够对暗区域还原信息,对亮区域抑制强光减少光晕影响,对中间区域拉伸,获得更大的动态范围。
本发明的技术方案是:
一种基于视觉系统的宽动态处理方法,具体步骤如下:
(1)对指定场景拍摄一幅图像,得到该场景的RGB颜色空间图像;
(2)将图像从RGB颜色空间转换到YUV颜色空间,获得其中的亮度信息Y分量;
将图像从RGB颜色空间变换到YUV颜色空间,变换公式如下:
在YUV颜色空间,亮度信息Y和两个色度信息U、V是完全分离的,所以这种颜色表示方法更符合人眼的视觉特性。
(3)使用Y分量的像素邻域信息计算每个像素点的环境因子;
环境因子a的取值直接决定输出结果,也即决定了宽动态图像的效果,环境因子a采用YUV颜色空间的亮度分量信息Y来进行计算,公式如下:
其中G是一个高斯模板,是亮度信息Y的均值。
(4)根据人眼视觉系统特点,利用环境因子得到宽动态变换公式;
人眼视觉系统(Human Visual System,简称HVS)主要由视网膜组成,包含三个功能层:感光层、外网层。内网层。感光层主要负责光信号的转换、传递、压缩处理。这里本发明将需处理的光信号分为两部分:第一部分为入射光信号,第二部分为外网层基于邻域反馈的光信号。
第一部分入射光信号用经典压缩公式Naka-Rushton方程表示:
其中x是输入,y是输出,a是环境因子,环境因子a是大于0的一个正数。
公式1的曲线示意图如图1所示,可以得出一个规律:在输入x属于[0,1]区间时,a越小,y提升越大;a越大,y提升越小。
第二部分外网层基于邻域反馈的光信号是对入射光信号起调节作用,这是由于人眼在暗的地方进入亮的地方有个适应过程,或者在亮的地方进入暗的地方有个适应过程,这个过程就是一个逐渐反馈适应的过程。本发明用下面的公式来表示这个过程:
公式2的曲线示意图如图2所示,可以得出一个规律:在输入x属于[0,1]区间时,a越小,y提升越小;a越大,y提升越大。这个变化规律和公式1的变化规律正好相反,起到一个调节平衡的作用,正好符合人眼的视觉特性。
综合公式1和公式2可以得到一个模拟的两层视觉系统,也即本发明提出的最终的宽动态变换公式:
从图3可以看出,通过对a进行不同的调整,输出y与输入x形成由多簇类伽马曲线组合的非线性关系。在输入x属于[0,1]区间时,a越小,y提升越大;a越大,y提升越小。
(5)利用宽动态变换公式对原始RGB图像进行变换,得到宽动态RGB图像。
变换时把每个像素在RGB颜色空间的三个分量(R,G,B)依次当做公式3的输入x,用公式3计算新的输出(R′,G′,B′)。
本发明提出的基于视觉系统的宽动态方法较好的保留高亮区域和阴暗区域的细节信息,得到的宽动态图像质量较好且资源消耗少,特别是由于无需通过多次拍摄合成一幅高动态图像,能够很好的满足实时处理的需求。
附图说明:
图1是Naka-Rushton方程曲线示意图
图2是外网层基于邻域反馈的方程曲线示意图;
图3是宽动态变换方程曲线示意图;
图4是白天场景的原图和宽动态结果图;
图5是夜晚场景的原图和宽动态结果图。
具体实施方式:
下面结合附图对本发明做进一步详细说明。
首先对指定场景拍摄一幅图像,得到该场景的RGB颜色空间图像。众所周知,自然界中任何一种色光都可由R、G、B三基色按不同的比例相加混合而成,当三基色分量都为0时混合为黑色光;当三基色分量都为255时混合为白色光。RGB颜色空间采用物理三基色表示,适合彩色显象管工作,然而这种表示方法并不符合人眼的视觉特点。因而,我们将图像从RGB颜色空间变换到YUV颜色空间,变换公式如下:
在YUV颜色空间,亮度信息Y和两个色度信息U、V是完全分离的,所以这种颜色表示方法更符合人眼的视觉特性。
人眼视觉系统(Human Visual System,简称HVS)主要由视网膜组成,包含三个功能层:感光层、外网层。内网层。感光层主要负责光信号的转换、传递、压缩处理。这里本发明将需处理的光信号分为两部分:第一部分为入射光信号,第二部分为外网层基于邻域反馈的光信号。
第一部分入射光信号用经典压缩公式Naka-Rushton方程表示:
其中x是输入,y是输出,a是环境因子,环境因子a是大于0的一个正数。
公式1的曲线示意图如图1所示,可以得出一个规律:在输入x属于[0,1]区间时,a越小,y提升越大;a越大,y提升越小。
第二部分的反馈是对第一部分起调节作用,这是由于人眼在暗的地方进入亮的地方有个适应过程,或者在亮的地方进入暗的地方有个适应过程,这个过程就是一个逐渐反馈适应的过程。本发明用下面的公式来表示这个过程:
公式2的曲线示意图如图2所示,可以得出一个规律:在输入x属于[0,1]区间时,a越小,y提升越小;a越大,y提升越大。这个变化规律和公式1的变化规律正好相反,起到一个调节平衡的作用,正好符合人眼的视觉特性。
综合公式1和公式2可以得到一个模拟的两层视觉系统,也即本发明提出的最终宽动态变换公式:
从图3我们可以看出,通过对a进行不同的调整,输出y与输入x形成由多簇类伽马曲线组合的非线性关系。在输入x属于[0,1]区间时,a越小,y提升越大;a越大,y提升越小。
环境因子a的取值直接决定输出结果,也即决定了宽动态图像的效果。为了获得更好的输出效果,本发明提出一种使用像素的领域信息计算环境因子的方法,且为了符合人眼特性,采用YUV颜色空间的亮度分量信息Y来进行计算,公式如下:
其中G是一个高斯模板,是亮度信息Y的均值。
每个像素的环境因子通过Y分量和高斯模板的卷积得到,说明在计算当前点时考虑了像素的领域信息,这样做能够对暗区域还原信息;对亮区域抑制强光,减少光晕影响;对中间区域拉伸,从而获得更大的动态范围。
本发明一种基于视觉系统的宽动态处理方法,具体步骤如下:
1、对指定场景拍摄一幅图像,得到该场景的RGB颜色空间图像
2、将图像从RGB颜色空间变换到YUV颜色空间;
3、通过公式4使用像素领域信息计算每个像素的环境因子;
4、根据人眼视觉系统特点,利用环境因子得到宽动态变换公式;
5、把每个像素在RGB颜色空间的三个分量(R,G,B)依次当做输入,用公式3计算新的输出(R′,G′,B′)。
图4和图5中给出原图和宽动态图像的结果,可以看到,无论是白天场景还是夜晚场景,宽动态图像明显优于原图像,在明亮区域和阴暗区域均保留了更多细节信息,能够满足实际的应用需求。