[go: up one dir, main page]

CN104937935A - 用于视觉条件意识视频编码的感知预处理滤波器 - Google Patents

用于视觉条件意识视频编码的感知预处理滤波器 Download PDF

Info

Publication number
CN104937935A
CN104937935A CN201380070579.2A CN201380070579A CN104937935A CN 104937935 A CN104937935 A CN 104937935A CN 201380070579 A CN201380070579 A CN 201380070579A CN 104937935 A CN104937935 A CN 104937935A
Authority
CN
China
Prior art keywords
pixel
filter
display screen
video
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201380070579.2A
Other languages
English (en)
Inventor
R·瓦纳莫
Y·雷兹尼克
L·克拉夫斯基
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Vid Scale Inc
Original Assignee
Vid Scale Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Vid Scale Inc filed Critical Vid Scale Inc
Publication of CN104937935A publication Critical patent/CN104937935A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/80Details of filtering operations specially adapted for video compression, e.g. for pixel interpolation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/164Feedback from the receiver or from the transmission channel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)
  • Picture Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

感知滤波器可以实现从视频信号中滤波一个或者更多个空间频率,其低于该视频信号观看者的对比敏感度限度。感知滤波器可以配置用于基于例如内容、观看距离、显示密度、对比度、显示屏亮度、背景亮度、和/或观看者年龄,以像素为基础调整一个或者更多个感知滤波器参数。可以执行对DC、幅度、以及视频帧对比敏感度的估计。感知滤波器的空间截止频率可以映射至对比敏感度。感知滤波器可以作为视频编码器的预处理步骤以减低编码后的比特率。可将人类视觉系统的倾斜效应现象结合到感知滤波器中。

Description

用于视觉条件意识视频编码的感知预处理滤波器
相关申请的交叉引用
本申请要求2012年11月16日提交的美国临时申请序列号No.61/727,203、2013年6月13日提交的美国临时申请序列号No.61/834,789、以及2013年9月9日提交的美国临时申请序列号No.61/875,415的权益,各申请的全部内容以引用的方式结合于此。
背景技术
视频与移动视频是在全球互联网与移动互联网中迅猛增长流量部分。视频流客户端,例如无线发射接收单元(WTRU),可以应用流速率适配技术,例如根据通信网络条件(例如,可用带宽)选择比特率、分辨率等等,来提供尽可能最高的流多媒体播放品质。
视频流速率适配技术可能无法考虑到视觉条件,其可能会影响可由视频流客户端的端用户所感知的视频质量。
发明内容
可以实现一种感知滤波器用以从一个视频信号中滤波一个或者多个空间频率,其低于其观看者的对比敏感度极限。感知滤波器例如基于局部对比度和/或一个或多个振动的方向可以对空间频率进行自适应滤波。感知滤波器可以被配置用于基于例如内容、观看距离、显示密度、对比度、显示亮度、背景亮度、和/或观看者的年龄,以像素为基础调节一个或者更多个感知滤波器基于像素的参数。可以执行对视频帧的DC电平、振幅偏差、以及对比敏感度的估计。感知滤波器的空间截止频率可被映射到对比敏感度。感知滤波器可以作为视频编码器的预处理步骤以便减少编码后的比特率。人类视觉系统的倾斜效应现象可以结合到感知滤波器中。
输入视频信号的预处理可以包括接收至少一个属于视频信号的观看者对该输入视频信号的感知的参数。至少一个参数可以包括显示亮度和背景亮度中的至少一个。预处理可以包括根据至少一个参数配置自适应低通滤波器。预处理可以包括使用自适应低通滤波器对输入视频信号滤波以产生输出视频信号。对自适应低通滤波器进行配置可以包括将人类视觉系统的倾斜效应现象结合到自适应低通滤波器中。
附图说明
图1描绘利用坎贝尔-罗伯逊(campbell-robson)图的示例对比敏感度函数;
图2描绘示例感知滤波器的方框图,该感知滤波器可为感知倾斜滤波器;
图3为示出示例环境自适应感知滤波器的方框图;
图4描绘应用感知预处理滤波器的示例视频系统架构;
图5描绘示例视频观看设置的参数;
图6为视频系统的方框图;
图7为视频滤波装置的方框图;
图8为供应装置的方框图;
图9示出视频流;
图10示出视频帧;
图11为方法的流程图;
图12A描绘示例输入视频和/或图像;
图12B描绘图12A所描绘的示例输入视频和/或图像的亮度分量;
图12C描绘在黑电平调整之后图12B所描绘的示例输入视频和/或图像的亮度分量;
图12D描绘了与图12A所描绘的示例输入视频和/或图像对应的DC估计;
图12E描绘了与图12A所描绘的示例输入视频和/或图像对应的振幅包络线估计;
图12F描绘了与图12A所描绘的示例输入视频和/或图像对应的截止频率分布图;
图12G描绘了图12A所描绘的示例输入视频和/或图像的滤波后的输出图像;
图13为示出环境光反射的示意图;
图14为示出环境对比度计算的示例输入的示意图;
图15描绘感知DC的中央凹的视野中的周期数量的示例;
图16描绘由周期每度到周期每像素的示例转换;
图17是选择包含在各自局部区域中的像素的方法的流程图;
图18描绘振幅包络线估计的示例流程图;
图19描绘示例Movshon与Kiorpes对比敏感度函数(CSF)模型;
图20为示出示例CSF与近似逆的曲线图;
图21描绘可以用于使用对比敏感度计算截止频率的示例关系;
图22示出作为环境和目标亮度比的函数的示例比例因子;
图23为示出示例的CSF随年龄变化的图表;
图24为示出示例的CSF随年龄缩放的图表;
图25描绘了示例感知滤波器的频率特性;
图26为将截止频率描绘为定位角的函数的图表;
图27描绘针对可由可分离低通滤波器实现的频率特性的示例近似频率特性;
图28描绘了利用三对可分离滤波器实现频率特性的示例;
图29A描绘了测试图像;
图29B描绘了图29A的示例测试图像,其由示例感知滤波器滤波;
图29C描绘了图29A的示例测试图像,其由示例感知倾斜滤波器滤波;
图29D描绘了对应于图29B与29C的滤波后的图像的差值图像;
图30描绘了示例预处理滤波器设置;
图31描绘了对于示例视频的应用示例感知倾斜滤波器相较于无滤波(原始编码)示例比特率节省(bitrate saving);
图32描绘了对于示例视频的应用示例感知倾斜滤波器相较于统一预滤波示例比特率节省;
图33描绘了环境自适应滤波的示例结果;
图34A描绘了其中可以实现一个或者更多个所公开的实施方式的示例通信系统的系统图;
图34B描述可于图34A中所示的通信系统中使用的示例无线发射/接收单元(WTRU)的系统图;
图34C描述了可于图34A中所示的通信系统中使用的示例无线接入网络与示例核心网的系统图;
图34D描述了可于图34A中所示的通信系统中使用的示例无线接入网络与示例核心网的系统图;
图34E描述了可于图34A中所示的通信系统中使用的示例无线接入网络与示例核心网的系统图。
具体实施方式
移动视频流与移动视频会议可在各种场所以及各种时刻为用户提供对视频内容的灵活接入和/或观看。与传统的可能较为静止的电视显示相比,例如移动装置的WTRU可以在期望的距离与方向上为用户灵活建立WTRU以符合用户端偏好。用户可以不被局限在特定的位置,例如在家、在剧院等等观看内容,而可以在各种位置中的任意位置观看内容。
除通信网络条件外的一个或者更多个因素可决定流客户端(例如,移动装置)的显示屏上呈现的视频信息的可视性,其可能包括下述中的一个或者更多个:距移动装置的观看距离、移动装置的显示屏尺寸、显示屏的对比敏感度、显示屏的像素密度诸如此类。例如,距用户一臂长处所持的移动装置可能相较于用户握持距离较近的移动装置以更高的空间密度显现视频信息。类似地,观看阳光直射下的移动装置较观看位于暗环境下的移动装置,视频信息的可视性可能更低。
此类影响视觉信息感知的因素可以为感知预处理滤波器所考虑,该滤波器可以用于,例如,降低发送给观看装置的编码视频的比特率。感知滤波器可以用于将视频发送至移动或静止装置,并且可以根据与观看装置相关的当前条件进行调整。观看者利用移动装置可以体验更为多样的观看条件并且可能更需要降低带宽。因此感知滤波器可以在保持视频感知质量的同时通过压缩视频降低所得到的比特率。
1.引言
对比度或亮度对比度可以为感知度量,例如,其可以定义两种颜色的感知亮度之间的差异。周期性图样的对比度(例如,正弦光栅)可以利用迈克尔逊对比测量,其可以表达为
C = L m a x - L min L m a x + L m i n   (等式1)
其中Lmax与Lmin分别可以为最大与最小亮度值。
或者,对比度可以表达为
  (等式2)
对比度阈值可以与能够引起人类视觉系统的感知响应的对比度等级相一致。对比度阈值的倒数可以称为对比敏感度。对比敏感度可以表达为
  (等式3)
对比敏感度可以随着空间频率变化,例如如图1中所描绘的坎贝尔-罗伯逊(campbell-robson)图所示。在坎贝尔-罗伯逊(campbell-robson)图中,空间频率可以从左侧至右侧对数增长并且对比度可以从底端到顶端对数减少。对比敏感度与空间频率之间的关系可被称为对比敏感度函数(CSF)。图1中示出示例CSF曲线。
CSF可以在4周期每度(CPD)具有最大值,并且敏感度可以在较低与较高频率均减少,从而形成带通特性。CSF曲线可以定义视觉阈值,其中在该曲线下的区域可对观看者可见,而该曲线上的区域可对观看者不可见(例如,可以为看不见的)。CSF模型可以包括Movshon与Kiorpes模型、Barten模型和/或Daly模型中的一个或者更多个。
自适应低通滤波器(例如,感知滤波器)可以基于人类视觉系统的CSF模型,例如,如图2中所描绘的。感知滤波器202的输入可以包含输入视频和/或图像、移动装置显示屏与移动装置用户之间的观看距离、与显示屏相关的对比度、和/或显示屏的显示像素密度中的一个或更多个。可对输入进行信号处理,例如,以生成自适应低通滤波器202的截止频率。
本公开的一些实施方式、或其部分,可以组合一个或者更多个硬件组件,例如微处理器、微控制器、或者数字时序逻辑等,例如具有一个或者更多个软件组件(例如,程序代码、固件、常驻软件、微代码等)的处理器,软件组件存储在虚拟计算机可读存储装置例如计算机存储器中,以组合形成为实现本申请中所描述的功能的特别配置的设备。这些组合形成被特别编程的装置,在本申请中通常可称为“模块”。模块的软件组件部分可以以任何计算机语言编写并且可以为单片代码库的一部分、或者可以在更离散代码部分发展,例如为面向对象的计算机语言中的典型。此外,模块可以分布在多个计算机平台、服务器、终端、诸如此类之上。甚至可以实施所给定的模块以便所描述的功能由单独的处理器和/或计算机硬件平台执行。
如图2中所示,结合各功能模块描绘自适应滤波器设备的实施方式。色彩空间转换模块204接收图像(例如,视频帧)并且将所接收的图像的色彩空间转换为线性色彩空间。然后模块204将色彩空间转换图像提供给亮度计算模块206以及自适应低通滤波器202。亮度计算模块206基于接收到的色彩空间转换图像生成亮度图像并且将亮度图像提供给黑电平调节模块208。
感知特性模块向黑电平调节模块208提供预期显示装置对比度的对比度标示。感知特性模块进一步向DC估计模块210与截止频率计算模块218提供观看距离标示与像素密度标示,该观看距离标示包括从显示装置用户到预期显示装置之间的距离,而像素密度标示包括预期显示装置的像素密度。
黑电平调节模块208基于接收到的亮度图像与接收到的对比度标示生成黑电平调节图像。然后模块208向DC估计模块210与差分模块214提供黑电平调节图像。DC估计模块210基于接收到的观看距离与像素密度标示,通过估计黑电平调节图像的每个像素各自局部DC生成DC估计图像。然后模块210向差分模块214与对比敏感度估计模块216提供DC估计图像。
差分模块214基于接收到的黑电平调节及DC估计图像生成差分图像并且将差分图像提供给振幅估计模块212。模块212经估计所接收的差分图像每个像素的各自局部振幅生成振幅估计图像。然后模块212将振幅估计图像提供给对比敏感估计模块216。
模块216生成所接收的DC估计及振幅估计图像每个像素各自的对比敏感度值并且将该对比敏感度值提供给截止频率计算模块218。模块218基于对比敏感度函数并且基于所接收的观看距离与像素密度标示计算每个接收到的对比敏感度值各自的截止频率值。然后模块218将截止频率值提供给自适应低通滤波模块202。
模块202基于从色彩空间转换模块204接收到的色彩空间转换图像以及从截止频率计算模块218接收到的截止频率值生成滤波后的图像。然后模块202将滤波后的图像提供给第二色彩空间转换模块220。模块220将接收到的滤波后的图像的色彩空间转换为原始色彩空间(如色彩空间转换模块204所接收到的)并且输出感知预滤波的图像。
在实施方式中,感知滤波应用CSF模块以确定为不可见的一个或者更多个空间频率。这些可以用于例如确定自适应低通滤波器(例如,感知滤波器)的局部截止频率。例如如本文所述的感知滤波器可以结合(例如,考虑)人类视觉系统的倾斜效应现象。例如,感知滤波器可以对相对于水平和/或垂直方向的倾斜方向上一个或者更多个空间频率进行滤波(例如,强滤波)。结合倾斜效应,感知滤波器可以例如通过单独运用等式(1)减少空间振动。这可以实现使用于编码视频的比特率降低,而较小或者不损失视觉质量。
图3为示出示例环境自适应感知滤波器302的方框图。至环境自适应感知滤波器302的输入可以包括输入视频和/或图像、移动装置的显示屏与移动装置用户之间的观看距离、与显示屏相关联的对比度、显示屏的显示像素密度、环境照度水平、背景反射系数、和/或用户年龄中的一个或者更多个。可以对输入进行信号处理,例如,以生成自适应低通滤波器302的截止频率。
结合图3中示出的各功能模块描绘自适应滤波设备的实施方式。色彩空间转换模块304接收图像(例如,视频帧)并将所接收的图像的色彩空间转换为线性色彩空间。然后模块304将色彩空间转换图像提供给亮度计算模块306以及自适应低通滤波模块334。亮度计算模块306基于接收到的色彩空间转换图像生成亮度图像并且将该亮度图像提供给黑电平调节模块310。
环境对比度模块308从感知特性模块接收环境照度标示、显示反射率标示、峰值亮度标示、以及原生对比度标示。环境照度标示包括预期显示装置的环境照度,显示反射率标示包括预期显示装置的反射率,峰值亮度标示包括预期显示装置的峰值亮度,以及原生对比度标示包括预期显示装置的原生对比度。模块308基于接收到的标示计算预期显示装置的环境对比度并且将计算的对比度的环境对比度标示提供给黑电平调节模块310。
模块310基于接收到的亮度图像以及接收到的环境对比度标示生成黑电平调节图像。然后模块310将黑电平调节图像提供给DC估计模块312、差分模块316、以及整体DC估计模块326。
DC估计模块312经估计所接收到的黑电平调节图像每个像素各自的局部DC生成DC估计图像。然后模块312将DC估计图像提供给差分模块316与对比敏感度估计模块318。差分模块316基于接收到的黑电平调节及DC估计图像生成差分图像并且将差分图像提供给振幅估计模块314。
模块314经估计接收到的差分图像每个像素各自的局部振幅生成振幅估计图像。然后模块314将振幅估计图像提供给对比敏感度估计模块318。模块318生成所接收的DC估计及振幅估计图像的每个像素各自的对比敏感度值并且将对比敏感度值提供给截止频率计算模块320。
显示尺寸模块322从感知特性模块接收显示宽度标示、显示高度标示、像素密度标示、以及观看距离标示。显示宽度及显示高度标示分别包括预期显示装置的宽度与高度。像素密度标示包括预期接收装置的像素密,而观看距离标示包括从显示装置用户到预期显示装置的距离。模块322基于接收到的标示确定预期显示装置的角大小(度),并且将确定的角大小的角大小标示提供给截止频率计算模块320。
周围环境亮度模块324从感知特性模块接收环境照度标示与显示反射率标示二者,标示分别包括预期显示装置的环境照度以及预期显示装置的反射率。模块324基于接收到的标示确定预期显示装置的周围环境亮度,并且将确定的周围环境亮度的周围环境亮度标示提供给截止频率计算模块320。
整体DC模块326确定从模块310接收到的黑电平调节图像的平均DC值。然后模块326将确定的平均DC值的整体DC标示提供给时域滤波模块328。模块328基于接收到的整体DC标示以及基于之前滤波的图像的时域滤波DC值确定当前图像的时域滤波DC值。然后模块328将时域滤波DC值的时域滤波DC标示提供给峰值亮度模块330。
模块330基于接收到的时域滤波DC标示以及基于从感知特性模块接收到的峰值亮度标示确定比例DC值(scaled DC value),接收到的峰值亮度标示包括预期显示装置的峰值亮度。然后模块30将比例DC值的比例DC标示提供给截止频率计算模块320。
截止频率计算模块320计算每个接收到的对比敏感度值各自的截止频率值。计算是基于(i)对比敏感度函数的倒数(ii)接收到的角大小、周围环境亮度、以及比例DC标示、以及(iii)从感知特性模块接收到的用户年龄标示,接收到的用户年龄标示包括预期显示装置的用户的年龄。然后模块320将计算的截止频率值提供给频率转换模块332。
频率转换模块332以周期每度(CPD)取值,并且以周期每像素(CPP)将值提供给自适应滤波器。每度的像素进一步可以基于例如显示屏每度的像素数量和/或用户与显示屏之间的观看距离确定。在一实施方式中,每个像素的周期数量可以确定为:
C P P = 1 2 × D × t a n ( 1 2 × C P D )
其中D为像素的观看距离且CPD为每度的周期所选数量。
自适应低通滤波器334基于从色彩转换模块304接收到的色彩转换图像以及从频率转换模块332接收到的转换的截止频率值生成滤波后的图像。然后模块334将滤波后的图像提供给第二色彩转换模块336。模块336将接收到的滤波后的图像的色彩空间转换为原始色彩空间(如色彩空间转换模块304所接收到的)并且输出感知预滤波图像。
2.示例系统
图4描绘应用感知预处理滤波器402的示例视频系统架构400。感知预处理滤波器402可以应用于即将到来的视频内容,例如在编码之前。预处理滤波器402可以根据一个或者更多个属于观看设置参数的输入,例如移动装置的显示屏的观看距离(例如,利用移动装置的前置摄像头计算)、显示屏的显示密度、和/或显示屏的有效对比度进行操作。可以预先确定(例如基于一个或者更多个典型考虑因素选择)或者可以动态选择(例如,估计并传达回编码系统)参数。
如果感知滤波器提供有一个或者更多个再现设置特性,感知滤波器例如可以用于选择性地移除空间振动,其可能对于端用户不可见。通过移除此类振动,感知滤波器可以简化视频信号,其可作为传统视频编码器(例如高效视频编码(HEVC)编码器,H.264编码器,诸如此类)的输入而被提供。简化输入视频信号可能致使用于传播所产生的输出视频信号(例如,经一个或者更多个信道)的比特率降低。由感知预处理滤波器对视频信号滤波并且随后编码视频信号,可以被称为观看条件意识视频编码。
图5描绘了示例视频观看设置的参数,例如,观看无线发射接收单元(WTRU)的显示屏502上的流视频。视野504可由双眼视觉形成,从而视野504可以为大致水平一百二十度(120°)。与所示视频设置相关联的参数可以包括下列中的一个或者更多个:WTRU的显示屏尺寸、距显示屏502的观看距离、显示屏502的显示分辨率、显示屏502的显示密度(例如,像素每英寸)、以及与观看者508(例如,WTRU的用户)相关联的观看角度506。一个或者更多个参数可能相互关联。例如,观看角度可以表达为
  (等式4)
图6为根据一些实施方式的视频系统的方框图。如图6中所示,视频系统600包括视频源602、视频滤波装置604、视频编码器606、数据库服务器608、视频解码器610、显示屏612、传感器614、用户界面616、网络618、以及供应装置620。
视频滤波装置604可以是能够执行本申请所述的视频滤波装置功能的任何组件。图7为根据一些实施方式的示例视频滤波装置的方框图。如图7中所示,视频滤波装置604包括处理器702、存储程序指令706的数据存储器704、通信接口708、以及滤波器710,其中每个经由系统总线712相互连接。
处理器702可以采用一个或者更多个通用处理器和/或一个或者更多个专用处理器的形式(或者包括一个或者更多个通用处理器和/或一个或者更多个专用处理器),并且可以与数据存储器704和/或通信接口706整体集成或者部分集成。处理器702也可以采用其他形式。
除存储程序指令706之外,在大量其他可能性中,数据存储器704可以存储特性数据、数据库数据、和/或用户界面数据。数据存储可以采用永久计算机可读介质的形式(或包括永久计算机可读介质),例如硬件驱动器、固态驱动器、EPROM、USB存储装置、CD-ROM盘、DVD盘、任何其他非易失性存储器、或这些的任意组合,仅仅是列举几个实例。程序指令706可以包括处理器702可执行的机器语言指令以实施本文中的各种功能。数据存储和/或程序指令也可以采用此形式。
通信接口708可以是能够进行本文中所述的通信接口功能的任何组件。通信接口可有助于例如从视频源602接收视频帧、向视频编码器606提供滤波后的帧、从供应装置620接收感知消息、向数据库服务器608发送查询并从数据库服务器608接收查询响应、和/或与其他实体通信。通信接口可以采用下列形式(或者包括)以太网(Ethernet)、Wi-Fi、蓝牙、和/或通用串行总线(USB)接口、和/或系统总线,除了其他的之外。本领域技术人员可知晓通信接口708和/或系统总线712也可采用其他形式。
滤波器710可以是能够实现本文中所描述的滤波功能的任何组件。如此,滤波器710可以采用下述形式:有限冲击响应(FIR)滤波器、兰索斯(Lanczos)滤波器、高斯(Gaussian)滤波器、任何其他模拟或数字滤波器、或在众多其他可能中,这些滤波器的任何组合。
再参考图6,视频源602可以是能够实现本文中所描述的视频源功能的任何组合。视频源可以采用下列的形式(和/或包括)DVD和/或蓝光播放器、摄像机(可能结合到其他装置,例如智能手机或平板电脑)、和/或视频订阅服务(例如)的计算机,在众多其他可能中。视频源可以被配置用于给视频滤波装置提供一个或者更多个视频帧。
视频编码器606可以是能够实现本文中所描述的视频编码器功能的任何组件。编码器可以被配置用于从视频滤波装置604接收滤波后的视频帧。在众多其他可能中,可能通过使用一个或者更多个已知视频压缩算法,根据MPEG-2 Part2、MPEG-4 Part2、H.264(MPEG-4 Part 10)、Theora、Dirac、RealVideo RV40、VP8、和/或HEVC,编码器可以将接收到的滤波后的视频帧编码。编码器可以被配置用于可能经由网络618向视频解码器610提供编码后的视频帧。
数据库服务器806可以是能够实现本文中所描述的数据库服务器功能的任何组件。数据库服务器可以被配置用于从视频滤波装置604接收检索查询并且向视频滤波装置提供查询响应。
视频解码器610可以是能够实现本文中所描述的视频解码器功能的任何组件。解码器可以被配置用于可能经由互联网618从视频编码器606接收已编码的视频帧。解码器可能利用上文所述的一个或者更多个视频压缩算法可以解码接收到的已编码的视频帧。编码器可以被配置用于向显示装置612提供已解码的视频帧。
显示屏612可以是能够实现本文所描述的显示功能的任何组件。在众多其他可能下,显示屏可以包括例如阴极射线管(CRT)显示屏、发光二极管(LED)显示屏、等离子显示屏、液晶显示屏(LCD)、薄膜晶体管(TFT)显示屏、和/或有机发光二极管(OLED)显示屏的显示屏。在众多其他可能下,显示装置可以采用电视、计算机监视器、智能手机、和/或平板电脑的形式。显示装置可以被配置用于从视频解码器610接收已解码的视频帧并且经由显示屏显现接收到的已解码的视频帧。显示装置可以向供应装置620提供显示屏特性,例如显示屏反射率、显示屏最大亮度、和/或显示屏原生对比度。
供应装置620可以是能够实现本文所描述的供应装置功能的任何组件。图8为根据一些实施方式的供应装置620的方框图。如所示的,供应装置620包括处理器802、存储程序指令806的数据存储器804、以及通信接口808,其中每个经由系统总线810相互连接。这些中的每一个可如上述参考图7所述的一样起作用。
如图8所示,供应装置320可以经由通信链路818与显示屏612、传感器614、和/或用户界面616中的一个或者更多个通信连接。作为另一种可能,显示屏、传感器、和用户界面中的任一个或者更多个可以结合在供应装置中。
传感器614可以是能够实现本文所描述的传感器功能的任何组件。传感装置可以被配置用于检测显示装置612的一个或者更多个观看条件。在众多其他可能下,所检测的观看条件可以是显示屏用户到显示屏612的观看距离和/或显示装置环境光的亮度。
用户界面616可以是能够实现本文所描述的用户界面装置功能的任何组件。用户界面可以包括或者结合键盘、鼠标、和/或显示屏(例如显示屏612)。用户界面装置可以获取用户特性(例如显示装置612的显示装置用户的年龄)。
在其他可能下,供应装置可以被配置用于例如从显示屏612、传感器614、用户界面616、和/或数据存储器804获取感知特性。供应装置可以向视频滤波装置604提供已获取的感知特性。
应该理解的是视频系统600的任何一个或者更多个实体可以与视频系统的任何其他实体或多个实体结合和/或并入其中。例如,视频滤波装置604可以与视频编码器606结合、和/或视频解码器610可以与显示屏612结合。显示屏612、传感器614、和用户界面装置616中的任何一个或者更多个可以结合到一个组件中。
图9根据示例实施方式阐明视频流。如图9中所示,视频流900包括经过908的多个视频帧902。视频流沿空间x-轴910与y-轴912、以及沿时域t-轴914是三维的。
图10根据示例实施方式阐明视频帧。如图10中所示,视频帧902包括N行像素以及M列像素。x-轴与y-轴分别沿视频帧水平与垂直延伸。视频帧中的每个像素P0,0至PM-1,N-1可以称为Px,y,其中x与y分别由x与y的值所代替。每个像素具有一个或者更多个相应值,可能指示亮度、色度、颜色、或像素的其他值。
3.示例操作
3.1 接收视频帧
图11为根据示例实施方式的方法流程图。如图11中所示,方法1100于步骤1102开始于视频滤波装置604经908接收多个视频帧902。在实施方式中,每个帧具有多个像素P0,0至PM-1,N-1。图12A-12G阐明应用感知滤波器的预处理过程期间在各种状态下的示例输入视频和/或图像。图12A阐明如可被接收到的输入视频和/或图像(例如,全彩色)。
3.2 确定局部对比敏感度
3.2.1 变换色彩空间
在步骤1104中,视频滤波装置604确定P0,0至PM-1,N-1的每个象素各自的局部对比敏感度CSx,y。确定各自的局部对比敏感度CSx,y可能涉及变换视频帧的色彩空间。输入视频和/或图像可以转换为线性空间。例如,如果输入视频和/或图像为YUV 4:2:0格式,可以使用色彩转换矩阵例如基于YUV输入是否是利用ITU-Rec、BT.709、和/或SMPTE 240标准生成,将输入视频和/或图像转换为伽马域(gamma-domain)RGB色彩空间。伽马域RGB可以例如应用逆伽马操作转换为线性RGB帧。对于AVI、BMP、或PNG格式中的输入视频和/或图像,可以从输入视频和/或图像中抽取RGB图像,并且可以对输入视频和/或图像适用灰度操作以生成线性RGB帧。其他色彩空间变换也是可能的。
3.2.2.获取感知特性
各自对比敏感度CSx,y的确定可以至少部分基于至少一个感知特性。在实施方式中,感知因素从由显示屏612的显示特性、显示屏612的观看条件、以及显示屏612的用户的用户特性组成的组中选取。接收装置的显示特性可以为例如显示屏612的像素密度、显示屏612的高度和/或宽度、显示屏612的原生对比度、和/或显示屏612的反射率。在其他可能下,观看条件可以为显示屏612的环境照度和/或用户与显示屏612之间的距离(被称为“观看距离”)。用户特性可以为年龄和/或用户的任何其他特性。表1中列出示例感知特性的一览表。
观看条件 显示特性 用户特性
环境亮度 像素密度 用户年龄
观看距离 显示高度
显示宽度
原声对比度
显示屏反射率
表1
显示特性、观看条件、和/或用户特性也可以采用其他形式,且感知特性可以包括没有明确列于上文的其他类型的特性。
感知特性可以经由视频滤波装置604的通信接口708获取。获取的特性可以为模拟信号例如光电二极管的电流或电压。如另一种可能,获取的感知特性可以以数字格式表现。例如,显示高度为32英寸可以以二进制格式接收为00100000。在其他可能中,获取的数字格式的感知特性可以封装在例如IP封包的数据报文中。
在实施方式中,感知特性从供应装置620获取。在另一实施方式中,获取感知特性涉及从供应装置620接收感知信息(除感知特性外)。感知信息可以为例如用户名、装置序列号、装置型号等。当接收到感知信息时,视频滤波装置604可以至少部分基于接收到的感知信息向数据库服务器608发送查询。
响应于接收到查询,数据库服务器选取与所接收到的查询相关联的感知特性。例如,数据库可以存储一个或者更多个型号或序列号以及一个或者更多个与每个型号或序列号相关联的感知特性。在一些实施方式中数据库可以基于序列号确定型号。当基于指定的型号或序列号接收查询时,数据库服务器选取例如与给定的编号相关联的装置的像素密度、高度与宽度、和/或反射率。如果服务器基于用户名接收查询,数据库服务器可以选取与用户名关联的用户的年龄。在基于接收到的查询选取感知特性后,数据库服务器可以向视频滤波装置604发送选取的感知特性。视频滤波装置604可以从数据库服务器608接收感知特性并且基于接收到的感知特性确定各自局部对比敏感度。
本领域技术人员可知晓感知特性也可以采用其他形式,以及其他获取感知特性的方法也是可能的。
3.2.3.调节黑电平
在一些实施方式中确定各自局部对比敏感度CSx,y可能涉及调节P0,0至PM-1,N-1每个像素的黑电平。黑电平调节可以对示例输入视频和/或图像进行。归一化亮度组件可以从线性RGB帧中提取,例如,具有[0,1]的范围。显示屏上的黑色可以不对应于亮度测量值零,并且可以例如因显示屏的一个或者更多个特性反而具有正值。为使显示屏上黑的亮度与实际黑像素值之间不同,可对亮度帧应用黑电平调节。显示屏的对比度Cd可以表达为
  (等式5)
倒数α可以定义为α=1/Cd。例如,可通过对亮度分量x应用下列操作,进行黑电平调节:
y=α+(1-α)x  (等式6)
图12B与12C分别描绘了归一化亮度分量以及示例输入视频和/或图像的黑电平已调节亮度分量。
可以特征化一个显示屏的对比度可以在黑暗中被测量并且可被称为显示屏的原生对比度。在环境光存在的情况下,显示屏表面可能反射部分光,其可增加白与黑亮度水平,如图13中所示。对比度可因此而减少。可用于黑电平调节的对比度可以为估计环境照度I(a)(例如,勒克斯(lux))、显示屏反射率的估计(例如,表示为百分比,例如4%Rd)、无环境光情况下白显示屏的亮度W、和/或原生对比度CR0的函数。环境对比度可以被计算为
  (等式7)
其中图13中所示的的值可以由给出。因子π可以将lux转换为cd/m2单位。
环境照度可以由显示装置上的传感器提供或者例如可以由当日时间估计。白亮度可以由相关显示亮度与峰值亮度确定。原生对比度与显示屏反射率值可以由显示屏规格或由假设典型值(例如CR0=1000与Rd=4%)确定。图14为一方框图,阐明示例输入用于环境对比度计算的环境照度1402、显示屏反射率1404、显示屏白点1406、以及显示屏原生CR 1408。
回到图11的方法1100,步骤1104处的确定可以涉及调节P0,0至PM-1,N-1每个像素的黑电平并且确定每个黑电平调节像素各自的局部对比敏感度。在实施方式中,每个像素的黑电平调节基于显示屏612的环境对比度C1。基于环境对比度调节每个像素的黑电平可以包括视频滤波装置604从显示屏612的环境亮度、显示屏612的反射率、显示屏612的峰值亮度、以及显示屏612的原生对比度组成的群组中选取至少一个感知特性。视频滤波装置可以(至少)基于至少一个如上所述的获取的感知特性确定环境对比度C1。然后视频滤波器可以基于如前确定的环境对比度C1调节每个像素的黑电平。在实施方式中,基于确定的环境对比度C1调节每个像素的黑电平包括如下确定各个像素值的调节值
P A x , y = 1 C 1 + ( 1 - 1 C 1 ) P x , y   (等式8)
其中Px,y为各个像素的值。
3.2.4.确定局部平均值与局部峰值振幅的比
各像素Px,y的各局部对比敏感度CSx,y可以至少部分基于像素Px,y周围各局部区域Rx,y中各像素的值。在一些实施方式中还可以(或者替换为)至少部分基于至少一个感知因素。可以基于至少一个感知因素选取包含在Rx,y中的像素。至少一个感知因素可以为例如在下文所说明的其他可能中,显示屏612的观看条件、显示屏的显示特性、和/或显示屏用户的用户特性。
可以估计对比敏感度(例如,基于每个像素)。例如,对于位置(i,j)(在此其还可以设计使用坐标(x,y))中的每个输入像素,可以通过取各自的DC与振幅的比值来计算对比敏感度(例如,此处所描述的计算),其可表达为
  (等式9)
在实施方式中,步骤1104的确定涉及确定P0,0至PM-1,N-1每个像素各自的DC(或“局部平均”)DCx,y与各自的振幅(或“局部峰值振幅”)Ax,y。各像素Px,y的各局部平均DCx,y与各局部峰值振幅Ax,y中的一者或两者可以基于各自局部区域Rx,y中的像素的值。
可以估计示例输入视频和/或图像的黑电平调节后的亮度分量的DC,例如,通过应用高斯低通滤波器,其表达为
h 1 [ m ] = 1 2 π σ exp ( - m 2 2 σ 1 2 ) ; - N ≤ m ≤ N   (等式10)
  (等式11)
其中后一个公式中中括起来的操作()可以代表基础操作(flooroperation)并且σ1可以为标准偏差。例如,可以基于人眼视觉敏锐度选择σ1。人眼的中央窝可以看到大概两度的图15中所示的视野。如果输入为正弦光栅,则DC可以对应于中央窝的视野中的最大半周期。低通滤波器的最大截止频率可以表达为
  (等式12)
例如,可以选择3dB截止频率=1/2CPD。DCij可以代表在位置(i,j)处的DC值。图12D描绘了与利用截止频率=1/2CPD低通滤波后的示例输入视频和/或图像对应的DC估计。
CPD中的截止频率可以转换为周期每像素并且可以计算关联的σ1。在CPD中的截止频率向周期每像素的转换的过程中,n可以是一个周期中像素的数量,d可以是一些像素的观看距离,β可以是每周期以度为单位的观看角度,如图16中所描绘的。像素的观看距离可以表述为
  (等式13)
例如如图2或图3中所描绘的,观看距离与显示像素密度二者均可以为感知滤波器202或302的输入参数。
图16可以得出下列关系
t a n ( β 2 ) = ( n 2 ) d   (等式14)
由于β可以是每周期的度数,周期每度的频率可以为cpd=1/β。上述等式(19)可以表达为
t a n ( 1 c p d 2 ) = ( n 2 ) d   (等式15)
此等式(15)可以表达为
  (等式16)
  (等式17)
截止频率可以由σ计算。例如,等式(21)可以用来导出周期每像素中的截止频率。可以导出用于根据周期每像素的截止频率fc计算σ1的公式。可以将离散福利叶变换应用到等式(16)获得频率响应,由下列等式给出
H ( f ) = e - 2 π 2 σ 1 2 f 2   (等式18)
3dB截止频率fc处,
H ( f c ) = e - 2 π 2 σ 1 2 f c 2 = 1 2   (等式19)
· · · σ 1 = 0.1325 f c   (等式20)
图18描绘了用于振幅包络线估计的示例流程图1600。在1602中,可以计算估计的DC与亮度图像之间的绝对差值以获得差值图像。例如,通过找到11×11像素大小的滑动窗口中的最大值,最大滤波器可以应用于差值图像。最大滤波器可以估计差值图像的包络线。差值图像在1604处使用高斯低通滤波器可以变平滑,例如,类似于等式(16),以产生估计的振幅包络线图像。
例如,高斯低通滤波器参数σ与N可以如下计算,
σ=0.1325×2×(2.5N2+1)  (等式21)
  (等式22)
其中N2=4。振幅包络线在位置(i,j)的估计可以由amplitudeij(振幅ij)代表。图12E描绘了与图21A中描绘的示例测试图像相对应的振幅包络线估计。
图17为根据一些实施方式选择包括在Rx,y中的像素的方法的流程图。如图17中所示,方法1700开始于步骤1702,视频滤波装置604选择多个周期每度作为截止频率。在实施方式中,所选的周期每度为1/4或1/2。本领域技术人员能够了解也可以选择其他截止频率而不脱离权利要求的范围。
步骤1704中,视频滤波装置604基于周期每度的数量确定周期每像素的数量。像素每度的确定进一步可以基于例如显示屏612的像素每度的数量和/或用户与显示屏612之间的观看距离。在实施方式中,周期每像素的数量被确定为:
C P P = 1 2 × D × t a n ( 1 2 × C P D )
其中D为像素的观看距离且CPD为所选的周期每度的数量。
步骤1706中,视频滤波装置基于确定的周期每像素数量确定高斯滤波器的标准方差σ1。在实施方式中,标准方差σ1确定为:
H ( f ) = e - 2 π 2 σ 1 2 f 2   (等式23)
其中f为确定的周期每像素数量。
步骤1708中,视频滤波装置604至少部分基于标准方差σ1的值选择包括在Rx,y中的像素。在实施方式中,视频滤波装置604选择包括在Px,y周围的Rx,y中由Px-N,y-N、Px-N,y+N、Px+N,y-N、Px+N,y+N所界定的像素,其中N的值至少部分基于标准方差σ1的值。在实施方式中,本领域技术人员可以了解可以使用N的其他值作为替代而不脱离权利要求的范围。
在一些实施方式中,视频滤波装置604可以选择包括在Rx,y中由Px-N,y-N、Px-N,y+N、Px+N,y-N、Px+N,y+N所界定的像素,其中N为预先确定的值。在实施方式中,N=9。N也可以为其他值。
在实施方式中,各局部区域Rx,y包括各局部DC区域RDC x,y以及各局部振幅区域RA x,y。视频滤波装置604至少部分基于各局部DC区域RDC x,y中的像素的值确定各局部平均DCx,y并且至少部分基于各局部振幅区域RA x,y中的像素的值确定各局部峰值振幅Ax,y。RDC x,y中的像素组可以与或可以不与RDC x,y中的像素组相同。
在实施方式中,将各像素Px,y的各局部平均DCx,y确定为RDC x,y中的像素值的平均。在实施方式中,视频滤波装置604选择包括在Px,y周围的Rx,y中的Px-N,y-N、Px-N,y+N、Px+N,y-N、Px+N,y+N所界定的像素,其中其他集中趋势的测量(例如,中数、众数)或任何其他方式可以用于确定各局部平均DCx,y
在实施方式中,为各像素Px,y确定各局部峰值振幅Ax,y涉及视频滤波装置604确定P0,0至PM-1,N-1每个像素的各绝对差值Dx,y=|Px,y-DCx,y|。视频滤波装置然后通过使用“最大”滤波器,其从滑动窗口各窗口RW x,y中的像素中为各像素Px,y选择各局部最大值Dmax x,y,选择各像素周围各窗口RW x,y中已确定的像素的各绝对均差值的最大值。在一实施方式中,各窗口RW x,y为11x11区域的像素。
在实施方式中,视频滤波装置604至少部分基于Px,y周围的各局部振幅区域RA x,y中的像素值,对各像素Px,y的每个各局部最大值Dmax x,y的每个应用高斯滤波器。视频滤波装置604选择包括在Px,y周围的Rx,y中由Px-N,y-N、Px-N,y+N、Px+N,y-N、Px+N,y+N所界定的像素,其中例如N=9。视频滤波装置将各滤波值Dmax x,y选为各像素Px,y的各局部峰值振幅Ax,y
3.3 选择滤波带宽
回到图11,视频滤波装置在步骤1106至少部分基于各像素的各局部对比敏感度CSx,y选择P0,0至PM-1,N-1每个像素的各滤波带宽fc x,y。对各滤波带宽的选择可以涉及对各对比敏感度应用对比敏感度模型,如下所述。
Movshon与Kiorpes CSF模型可以应用三个参数指数函数以模型化CSF,其可以表达为
csf(f)=afce-bf  (等式24)
其中,例如a=75,b=0.2,以及c=0.8,并且f可以为CPD中的空间频率。图17阐释示例Movshon与Kiorpes CSF模型,其可以显示带通滤波器特性在4CPD的峰值。
Barten CSF模型可以包括多个观看参数。模型可以表达为
S ( u ) = Ae - Du 2 ( B + u 2 ) ( C + 1 1 - e - 0.02 u 2 )   (等式25)
其中A、B、C以及D可以是常数,其值例如可由下式给出
A = 5200 0.64 , B = 1 0.64 ( 1 + 144 X 0 ) , C = 63 L 0.83 , 和/或 D = 0.0016 ( 1 + 100 L ) 0.08 (等式26)
X0可以是以视觉度为单位的目标大小。值L可以是目标亮度(cd/m2)。S(u)可近似表达为
S ( u ) ≈ S ^ = Ae - Du 2 ( B + u 2 ) ( C + 1 )   (等式27)
可使用LambertW函数分析地对此近似公式取反给出
u = S ^ - 1 ( s ) = L a m b e r t w ( 2 DA 2 e 2 D B ( C + 1 ) s 2 ) 2 D - B   (等式28)
此反函数可进而近似为
u = S ^ - 1 ( s ) ≈ I ( s ) = 0.777 l o g ( 1 + 2 DA 2 e 2 D B ( C + 1 ) s 2 ) 2 D - B   (等式29)
此对Barten CSF逆的近似的精确度可以通过图绘Barten CSF,例如原始Barten CSF以及此近似的逆I-1(u)来评价,如图18中所示。在CSF的峰值之后,近似逆可能接近Barten CSF。
可计算截止频率。例如,对比敏感度可以映射到自适应低通滤波器的截止频率。基于CSF模型(例如,Movshon与Kiorpes的CSF模型)用于计算截止频率的逆关系可根据对比敏感度来构建。示例模型可表达为
f c ( i , j ) = f , F min &le; f i j &le; F max F min , f i j < F min F max , f i j > F max   (等式30)
其中
fij=-42.26+78.463 csij -0.079-0.04894 csij 1.0809  (等式31)
Fmin=4CPD  (等式32)
Fmax=35.9CPD  (等式33)
如果使用Barten CSF,截止频率可以例如利用此处公开的关系(8)中的反函数I(s)来选择,而非关系(26)中表达的模型。
模型可将CSF近似为低通滤波器,其拥有对低于4CPD的频率的通带。自适应低通滤波器可以分别具有4CPD的最小截止频率以及35.9CPD的最大截止频率。图19描绘了示例模型例如在包含4CPD与35.9CPD的范围内如何能够紧密符合Movshon与Kiorpes的模型。可以应用上述过程计算一个或者更多个输入像素(例如,每个输入像素)各自的截止频率。图12F中描绘了示例输入视频和/或图像的示例截止频率每像素。
回到方法1100,对各滤波器带宽的选择可以至少部分基于反对比敏感度函数。反对比敏感度相应地可以至少部分基于Movshon与Kiorpes对比敏感度模型的反函数。附加地或者可替换地,反对比敏感度函数可以至少部分基于Barten对比敏感度模型的反函数。
在实施方式中,反对比敏感度函数为各像素Px,y提供截止频率fc x,y,利用
fc x,y=-42.26+78.463 CSx,y -0.079-0.04894 CSx,y 1.0809  (等式34)
其中CSx,y为Px,y各自的对比敏感度。本领域技术人员可以了解反对比敏感度函数也可以基于其他对比敏感度模型与对比敏感度函数。
可利用视野周围环境执行对比敏感度测量,测试等于测试情况下的模式的DC平均。当视野环境不同时HVS敏感度可能会改变。例如,点亮的头灯的出现可能在晚上与白天变化极大,即使头灯发出的光线可能几乎相同。Barten模型通过引入CSF的比例函数模型化此行为,比例函数取决于测试情况下周围环境亮度与目标亮度的比例,例如CSF测试模式。例如,此处等式(5)中披露的Barten模型的常数A可以由因子f缩放。此比例因子f可以应用到Movshon与Kiorpes CSF模型。比例因子f可以表达为
f ( L S L o , X O ) = e ( ln 2 ( L S L O ( 1 + 144 X O ) 0.25 ) - ln 2 ( ( 1 + 144 X O ) 0.25 ) 2 ln 2 ( 32 ) )   (等式35)
其中Ls为周围环境亮度,Lo为目标亮度,以及Xo为以视觉度数表示的目标的大小。图20示出,以示例的方式,比例因子f作为周围环境与目标亮度的比例的函数。
CSF可以以随年龄衰减为特性。图21示出了CSF随年龄变化的示例。比例因子可以被确定能够应用于CSF。对应至20s内的年龄的CSF可以作为基准线。比例因子由图23中示出的数据以及可以近似于随年龄缩放的包络线的线性模型来计算,如图22中所描绘
可以获得可以计算基于年龄的比例因子的模型。基于年龄的比例因子可以应用于此处等式(5)中披露的Barten模型和/或Movshon与Kiorpes CSF模型的常数A。标比例因子可以表达为
S c a l e ( a g e ) = 1.000 , a < 20 1 - 0.00735 ( a - 20 ) , 20 &le; a &le; 80 0.5590 , a > 80   (等式36)
可以使用周围环境影响。为使用周围环境影响,比例因子可以确定用于适当修改CSF。模型可以使用三个常数,例如周围环境亮度LS、目标亮度LO、以及目标大小XO。
显示屏大小可用于XO。XO的值可以以视觉度数表达。观看距离可用于在视觉角度与像素尺寸之间转换。
目标亮度可以利用显示屏在相应的亮度设置下的峰值亮度来确定,例如直接利用目标亮度的显示屏峰值亮度。平均显示屏亮度可以用于缩放峰值亮度。平均显示屏亮度可以针对该计算随年龄平滑。
目标亮度可通过计算DC图像的平均值计算出图像上整体DC来估计。可以时域滤波整体DC,例如通过单抽头IIR滤波器,其定义为
  (等式37)
可以是时域滤波后的整体DC且DCj可以是帧j的整体DC。滤波后的DC可以由峰值亮度缩放以得出目标亮度LO。
周围环境亮度可以通过利用环境光等级A估计,例如,以勒克司为单位,类似于环境对比度的情况。可以假设统一的背景反射值RS。环境亮度LS,例如,以cd/m2为单位,可以计算为
L S = R S &pi; A   (等式38)
CSF比例因子f可以由参数LS、LO、与XO计算,例如在使用CSF确定截止频率之前。CSF可以保持不变,并且敏感值可以由比例因子的到数来缩放,例如在计算截止频率之前。
类似于环境影响,年龄影响可为比例因子所考虑。示例数学模型将年龄转换为比例因子,作为关系(10)披露于此。用户可以将年龄值作为配置例如初始配置的一部分来提供。作为替换或者附加的,视频内容的人口统计可以用来选择年龄值。例如,相比于音乐视频,较高年龄值可能被分配至高尔夫活动。缺省年龄值,例如,如果没额外的信息可用则可以使用20作为年龄参数。
在实施方式中,在步骤1106中选择各滤波器带宽fc x,y涉及获取各像素Px,y的各缩放的对比敏感度CSs x,y以及至少部分基于各缩放的局部对比敏感度选择各滤波器带宽。在实施方式中,利用比例因子fs获取缩放的对比敏感度。例如,视频滤波装置602可以选取比例因子fs的值并且将各局部对比敏感度CSs x,y与所选的比例因子相乘。
在实施方式中,比例因子fs基于感知特性集被选取,其包括显示屏612的环境亮度、显示屏的峰值亮度、以及显示屏612的尺寸。在另一实施方式中,比例因子fs基于显示屏612的用户年龄被选取。可利用下式选取滤波器带宽
f s ( a g e ) = 1.000 , a g e < 20 1 - 0.00735 ( a g e - 20 ) , 20 &le; a g e &le; 80 0.5590 , a g e > 80   (等式39)
其中age为用户的年龄。比例因子可以基于年龄、环境亮度、峰值亮度、显示屏尺寸、或任何其他感知特性的任何组合。
3.4滤波器视频帧
在步骤1108,视频滤波装置604通过根据像素各自所选滤波器带宽fc x,y对P0,0至PM-1,N-1每个像素滤波,生成滤波后的视频帧。每个滤波后的像素可以具有各自滤波后的值
自适应低通滤波器(例如感知滤波器)可以基于Lanczos滤波器,例如。一个或者更多个输入线性RGB像素可以使用Lanczos滤波器滤波。位置(i,j)处的Lanczos滤波器可以定义如下
h i j &lsqb; k &rsqb; = s i n 2 &pi;f c ( i , j ) k &pi; k s i n &pi; k / n &pi; k / n , k = - n , ... , 0 , ... , n   (等式40)
其中fc(i,j)可以是位置(i,j)处的截止频率以及n可以是滤波器次序(即,n=4)。可以使用两个可分离的Lanczos滤波器。例如第一个Lanczos滤波器可以用于沿一个或者更多像素行滤波,且第二Lanczos滤波器可以用于沿一个或者更多个像素列滤波。对于一个或者更多个将由Lanczos滤波器滤波的输入像素(例如,每个输入像素),可使用各自的截止频率,例如如此处所述的所计算的各自的截止频率fc。Lanczos滤波器可基于像素自适应。两个可分离的Lanczos滤波器可以在水平与垂直方向中的一者或者两者上具有截止频率fc。这可以导致频率特性,例如如图23中所绘示的。截止频率fc可以适用于(例如,可被适用于)局部对比度。
一堆Lanczos滤波器对应于一组fc值,其可以被预先计算。例如,一组fc值可以为F={fc1,fc2,…,fcM},其中M为滤波器排的总数。当像素的截止频率fc(i,j)利用等式(27)计算时,其可以近似于组F中最接近的截止频率,其可以用于从滤波器排中选取滤波器。
倾斜方向模式的可视性减少,例如与水平和/或垂直模式相比,可称为倾斜效应。生理学实验已经表明方向模式可能影响人类视觉系统的对比敏感度。倾斜模式与水平和/或垂直模式相比可能具有较差的敏感度,Daly CSF模型可以通过考量输入方向来考虑倾斜效应现象。
倾斜效应可以结合到(例如,考虑到)自适应低通滤波器(例如,感知滤波器),如此该自适应低通、或感知滤波器可以称为感知倾斜滤波器。例如,这可以通过将截止频率在频域中调整至该方向角度实现。为模型化倾斜效应现象,可以使用截止频率fc与频率方向角θ之间的下述关系:
f c ( &theta; ) = f c ( ( 1 - &mu; 2 ) c o s 4 &theta; + ( 1 + &mu; 2 ) )   (等式41)
其中fc可以利用等式(26)获得。图24中描绘了对等式(28)的说明。如图26中所述,截止频率fc可以用于水平与垂直方向二者,而0.78 fc的较小截止频率可以用于θ=45°。
可执行各向异性二维有限冲击响应(FIR)滤波器以产生频率特性,例如图26中所示的频率特性。许多可分离的滤波器对可以用于近似该频率特性,如图27中所描绘的。如图27中所示,三对可分离的滤波器可用于实现频率特性。图28中描绘使用三对可分离的滤波器2102、2104、2106实现频率特性的示例。一个或者更多个可分离的滤波器对2102、2104、2106(例如,每个可分离的滤波器对)可以具有针对水平和/或垂直方向指定的各自的截止频率。如图28中所描绘的,可以增加来自可分离的滤波器对2102与2104的滤波后的输出,并且可以减去来自滤波器对2106的输出,以获取具有期望频率特性的滤波后的输出。
在实施方式中,滤波器710为具有三个可分离滤波器F1、F2、与F3形式的非可分离的滤波器。三个滤波器可以具有各自的水平截止频率f1 H、f2 H、与f3 H以及各自的垂直截止频率f1 V、f2 V、与f3 V
水平与垂直截止频率F1、F2、与F3的值可以如此选择:
f1 H=f2 V=f3 V
f1 V=f2 H=f3 H
截止频率可以被选择以便f1 H≠f1 V或f1 H=f1 V
进一步地,截止频率的值可以如此选择:
f1 H=s1×f2 H=s1×f3 H
f1 V=s2×f2 V=s2×f3 V
其中s1与s2为比例因子。比例因子s1可以与s2相同或者可以与s2不同。在实施方式中,s1=s2=.5515。s1与s2也可以使用其他值。
在实施方式中,用F1、F2、及F3对各像素Px,y滤波给出三个各自滤波后的值各像素Px,y的各复合滤波后的值可以被确定为:
p ^ x , y = P ^ 1 x , y + P ^ 2 x , y - P ^ 3 x , y
在实施方式中,可分离的滤波器F1、F2、与F3中至少一个滤波器是两个一维可分离滤波器形式的二维可分离滤波器:具有各自截止频率的一个水平滤波器与一个垂直滤波器。
3.5 提供视频帧
在步骤1110,视频滤波装置604向视频编码器606提供滤波后的视频帧。在向编码器606提供帧之前,可以对滤波后的线性RGB图像应用伽马操作以将滤波后的线性RGB图像转换为sRGB图像。如果输入为YUV4:2:0格式,sRBG可以转换回YUV4:2:0色彩空间。图12G描绘了示例输入视频和/或图像滤波后的输出图像在移动装置的显示屏(例如,全彩色)上呈现时可能显现的样子。
4.示例系统
本公开的实施方式采用视频滤波设备的形式,其包括数据存储器、接收机、对比敏感度确定模块、滤波器带宽选择模块、以及视频滤波模块。
在实施方式中,数据存储器被配置用于存储一个或者更多个视频帧,包括接收到的帧与滤波后的帧,以及在其他示例中,在视频滤波过程前、期间或之后处于其他中间状态的视频帧,例如亮度帧、色彩空间转换帧、以及黑电平调节帧。视频滤波设备的功能模块可以对存储于数据存储器中的视频帧实施操作并且可以将该操作的结果存储在数据存储器中以备其他功能模块使用。数据存储器可以采用例如前述的数据存储器704的形式。在实施方式中,视频帧包括多个具有各自像素值的像素。
在实施方式中,接收机被配置用于接收至少一个感知特性。感知特性作为示例,可以为显示屏的观看条件、显示屏的显示特性、和/或用户特性。在其他可能中,接收机可以向提供一个或者更多个其他模块例如黑电平调节模块、对比敏感度确定模块、和/或滤波器选择模块提供已获得的特性。
在实施方式中,视频滤波设备包括感知相关模块,被配置用于接收与显示屏的观看条件、显示屏的显示特性、和/或用户特性相关联的感知信息。在其他可能中,感知信息可以是显示屏的序列标识符、显示屏的型号标识符、显示屏的地理位置、显示屏在一天中所处的时间、和/或显示屏用户的用户名。
在实施方式中,感知相关模块被配置用于至少部分基于感知信息获取感知特性。例如,感知相关模块包括查找表,被配置用于存储一个或者更多个型号或者序列号以及一个或者更多个与每个型号或者序列号相关联的感知特性。感知相关模块可以基于序列号确定型号。感知相关模块可以获取感知特性,其与型号或者序列号相关联存储——感知特性例如与所给定号相关联的像素密度、高度与宽度、和/或装置的反射率。如果感知信息包括用户名,感知相关模块可以获取与用户名相关联的用户的年龄。如果感知信息包括显示屏的地理位置和/或显示屏所处的一天中的时间,感知相关模块可以获取显示屏的估计的环境亮度。其他示例也是可能的。
在实施方式中,视频滤波设备包括色彩空间转换模块,被配置用于将视频帧的色彩空间从第一色彩空间转换为第二色彩空间。例如,视频滤波设备可以接收视频帧,其代表CMYK、HSV/HSL、YIQ、YUV、YPbPr、和/或xvYCC色彩空间。色彩空间转换模块可以应用在视频滤波设备的实施方式中,视频滤波设备通常在设备兼容色彩空间例如sRBG(线性色彩空间,其可允许形式简化的帧转换功能)中操作。为了允许接收到的具有色彩空间而非设备兼容色彩空间的视频帧的转换,色彩空间转换模块可以在实施一个或者更多个色彩空间特定转换之前,将接收到的视频帧的色彩空间转换为设备兼容的色彩空间。在实施方式中,色彩空间转换模块将接收到的视频帧的色彩空间从初始色彩空间转换至线性RGB色彩空间(例如sRGB或者伽马修正线性色彩空间)并且将已滤波的视频帧的色彩空间转换回初始色彩空间。
在实施方式中,视频滤波设备包括黑电平调节模块,被配置用于至少部分基于显示屏的环境对比度调节每个像素各自的黑电平。作为一种可能,黑电平调节模块可以在视频滤波设备的实施方式中应用,其中该视频滤波设备在对比敏感度确定模块确定各自对比敏感度之前调节各自黑电平。例如,黑电平调节模块可以调节接收到的视频帧和/或色彩空间转换后的视频帧各自的像素黑电平。在实施方式中,黑电平调节模块利用下式确定每个像素值P确定各自调节后的值PA,利用:
P A = 1 C 1 + ( 1 - 1 C 1 ) P   (等式42)
其中C1为环境对比度。
在实施方式中,黑电平调节模块包括环境对比度确定模块,其被配置用于确定该装置的环境对比度。环境对比度确定模块可以至少部分基于感知特性集确定环境对比度,感知特性组包括显示屏的环境亮度、显示屏的最大亮度、显示屏的反射率、以及显示屏的原生对比度中的一个或者更多个。例如,环境对比度确定模块的实施方式确定环境对比度CR(a)为
  (等式43)
当I(a)为环境亮度时、Rd为环境反射率、在不存在环境亮度时白显示屏的亮度、以及CR0为原生对比度。在其他可能中,黑电平调节模块可以基于环境对比度确定模块确定的环境对比度调节每个像素的黑电平。
在实施方式中,对比敏感度确定模块被配置用于确定视频帧的每一个各自像素的各局部对比敏感度。对比敏感度模块可以被配置用于基于(至少部分地)位于各像素周围的各局部区域中的各像素值以及基于至少一个感知特性,确定各对比敏感度。其他配置也是可能的。
在实施方式中,对比敏感度确定模块包括局部平均估计模块、局部最大估计模块、以及对比敏感度模块。在实施方式中,对比敏感度模块被配置用于确定每个像素各自的比例,该各自的比例为各自局部平均与各自局部最大值的比例。对比敏感度确定模块可以被配置用于将所确定的各自比例选择作为各自像素的各自局部对比敏感度。
局部平均估计模块可以被配置用于至少部分基于各局部区域中像素值,确定各自局部平均。在实施方式中,局部平均估计模块被配置用于通过获取各局部区域中的像素的值的总和以及将获得的总和除以区域中像素的数量,确定各局部平均。其他配置也是可能的。
在实施方式中,各像素周围的各局部区域包括各局部平均区域与各局部最大区域二者,并且对比敏感度确定模块包括局部平均区域选取模块,被配置用于在局部平均区域中选取像素。局部平均区域选取模块可以通过选择局部截止频率以及将局部截止频率转换为视野的每度的像素的数量选取像素,其中局部截止频率具有视野的每度的空间振荡的数量。模块可以至少部分基于转换的局部截止频率选取包含在各局部平均区域中的像素。在实施方式中,局部平均区域选取模块(至少部分地)基于转换后的局部截止频率确定高斯滤波器的标准偏差值,然后在给定数量的标准偏差中从各像素选择像素。例如,在实施方式中,局部平均区域选取模块从各像素中选取像素中的像素。局部平均估计模块可以被配置用于确定由局部平均区域选取模块选取的像素的各局部平均。其他配置也是可能的。
在实施方式中,对比敏感度确定模块包括差值模块配置,用于确定各绝对差值。为确定各像素的各绝对差值,差值模块可以确定各值与各像素的各局部平均之间的差的绝对值。在其他可能中,各像素值可以为原始像素值、各色彩空间转换后的值、或黑电平调节后的值。
在实施方式中,局部最大值估计模块被配置用于确定各局部最大值区域中的像素的各绝对差值的各局部最大值。在实施方式中,局部最大值区域选取模块在预先确定的像素数量中从各像素选取包含在各局部最大值区域中的那些像素。例如,在实施方式中,局部最大值区域选取模块在5个像素中从各像素选取像素,得到11像素x11像素局部最大值区域。在实施方式中,局部最大值区域选取模块选取像素的方式类似于所描述的局部平均区域选取模块的方式。其他配置也是可能的。
在实施方式中,局部最大值估计模块进一步被配置用于在确定各局部最大值之前对每个像素的各绝对差值应用高斯滤波器。例如,在实施方式中,局部最大值估计模块应用由下式给出的的高斯滤波器:
σ=0.1325×2×(2.5N2+1)  (等式44)
其中且其中N2=4。σ、N、与N2可以应用其他值。
在实施方式中,对比敏感度确定模块包括对比敏感度缩放模块被配置用于(至少部分地)基于比例因子调节像素各自局部对比敏感度。比例因子可以(至少部分地)基于至少一个感知特性确定。例如,在实施方式中,对比敏感度模块包括周围亮度比例因子模块,被配置用于(至少部分地)基于感知特性集确定比例因子,感知特性集包括显示屏的环境亮度、显示屏的最大亮度、显示屏的反射率、以及显示屏的原生对比度。类似地,在实施方式中,对比敏感度模块包括年龄比例因子模块,被配置用于(至少部分地)基于显示屏的用户的显示屏用户年龄确定比例因子。周围亮度比例因子模块与年龄比例因子模块可以利用上述的各感知特性参考方法步骤1006确定各比例因子。
在实施方式中,滤波器带宽选择模块被配置用于至少部分基于像素各自局部对比敏感度确定每个像素各自的滤波器带宽fc。例如,滤波带宽选择模块可以被配置用于将各局部对比敏感度提供给反对比敏感度函数以获取截止频率,参考方法步骤1106如上文所述。
在实施方式中,滤波器带宽选择模块被配置用于至少部分基于各滤波器带宽选取每个像素对应的滤波器。例如,在实施方式中,滤波器带宽选取模块包括滤波器的查找表,其对应于给定的滤波器带宽;该模块从查找表中选取对应于已确定的各滤波器带宽的滤波器。
在实施方式中,对应的滤波器体现为滤波器系数集。例如,滤波器带宽f1的滤波器可以体现为滤波器系数集{f0 1,f1 1,f2 1,f3 1,和f4 1}且滤波器带宽f2的滤波器可以体现为滤波器系数集{f0 2,f1 2,f2 2,f3 2,和f4 2}。在实施方式中,给定滤波器带宽的系数参考步骤1108由上文所述的Lanczos滤波器得到。
在实施方式中,滤波带宽选择模块被配置用于选取每个像素的各水平带宽与各垂直带宽二者。水平与垂直带宽二者之一(或之二)可以为反对比敏感度函数提供的截止频率,反对比敏感度函数然后乘以缩放s。在实施方式中,s=.5515。在实施方式中,滤波带宽选取模块被配置用于为每个像素选取三对水平与垂直带宽:F1={s×fc,fc}、F1={fc,s×fc}、以及F3={s×fc,×fc},其中每对中的第一带宽为水平带宽,而第二带宽为垂直带宽。
在实施方式中,视频滤波模块被配置用于根据为每个像素所选取的各滤波器通过对每个像素滤波生成滤波后的视频帧。例如,视频滤波器模块可以被配置用于利用与为各像素所选的滤波器相对应的各滤波器系数集,生成滤波后的视频帧。在实施方式中,视频滤波模块被配置用于根据为每个像素所选的各水平和垂直滤波器对每个像素滤波。例如,在实施方式中,视频滤波器模块根据滤波器对F1、F2、与F3,通过对各像素滤波生成滤波后的视频帧,以获得各滤波器结果R1、R2、与R3。视频滤波设备的滤波器加和模块被配置用于确定总滤波器结果R1+R2-R3作为生成的已滤波的视频帧中每个像素的各滤波后的值。
5.总结
感知滤波器与感知倾斜滤波器各性能可通过使用两个滤波器滤波测试图像来说明。例如,感知滤波器与感知倾斜滤波器二者,如此处所述,用于对图29A中描绘的“星”测试图像滤波。图29B描绘了示例输出图像,其由感知滤波器对图29A的测试图像滤波生成。图29C描绘了示例输出图像,其由感知倾斜滤波器对图29A的测试图像滤波生成。图22B与22C中描绘的图像利用相同(例如,实质上相同)的观看条件获得。如图29D中所描绘,获取差值图像。如图29D中所描绘的,感知倾斜滤波器可以沿垂直与水平方向与感知滤波器效果上相同地运行,但可以沿一个或者更多个倾斜方向进行额外的滤波。
感知倾斜滤波器可以作为对视频编码器的预处理步骤。可通过应用感知倾斜滤波器而非例如均匀预滤波器(uniform pre-filter)和/或没有滤波机制实现有益效果。均匀预滤波器可以基于观看条件使用空间截止频率,所述观看条件对应于视觉敏锐度极限。相反,感知倾斜滤波器可以基于像素调节其自身的截止频率,例如基于局部对比敏感度与一个或者更多个空间振荡的方向二者中的一者或者两者。
应用感知倾斜滤波器的结果可以用角度特性,例如,用户的观察角度展现,用户的观察角度可以获得用户正在观看的显示屏的宽度。这可被称为观看角度γ。观看角度γ可以与显示屏宽度w以及观看距离d相关,例如,如下:
  (等式45)
此度量可以例如因结果可变为适用于不同屏幕密度和/或尺寸,而被简化,。利用此定义,选择十二个示例操作点以描述覆盖从6°至45°的观察角度范围的使用者位置。选择了下列的屏幕的有效对比度的示例测试点:CR∈{2:1,3:1,5:1,10:1,100:1,and 100000:1}。第一示例对比度可以对应于显示屏处于日光下的情景,而最后的示例对比度可以对应于黑暗室内演播室监视器的等同替换。应用感知倾斜滤波器的结果可以用其他适合的形式展现,例如,以不同的观看距离,诸如此类。
使用“呈树状(IntoTree)”1080p视频测试序列测试感知倾斜滤波器。具有恒定量化参数(QP)率控制的x264高属性(profile)视频编码器在测试中使用。图30中描绘了用于感知倾斜滤波器以及均匀预滤波的试验测试方案。
通过在未滤波(例如,原始编码)的情况使用感知预滤波(例如感知倾斜滤波器)实现示例比特节约(bit saving),如图31中所表明的。如示出的,感知倾斜滤波器可以在更窄的观看角度和/或更小的对比度上实现显著的比特节约,而且可以得到最大比特节约,例如,通过未滤波的机制节约75%。
图32中表明,在同样的观看条件(例如实质上相同的观看条件)下,在均匀预滤波器上应用感知倾斜滤波器可实现示例性能。如所示的,可实现相当大的比特率节约,例如,对介于15°与35°之间的观看角度节约大于10%,且在大概20°的观看角度节约40%。感知倾斜滤波器,例如在更低的对比度处,可以在均匀预滤波器之上得到更高的比特节约。
如图33中所示,比较示例结果可以了解到周围环境自适应滤波的有益效果。图33中示出的结果对应于50勒克斯(lux)、500勒克斯、以及10000勒克斯三个示例周围环境水平。显示屏亮度可以使相对亮度比可以为500勒克斯中等环境水平中的最大值。当环境亮度明显低于或者高于相应的显示屏的显示亮度时,可以增大比特率节约。这可以相当于从低于50勒克斯或高于10000勒克斯二者之一移除相对的环境目标亮度比。在二者之一的情况中,比例因子可以令比特率的节约减少以及增加。自适应滤波器可看出此效果,,其可以自适应照片内容当截止频率选择未适应照片内容时,其可如非自适应滤波器。
此处披露的感知滤波器与感知倾斜滤波器中的一者或者二者、以及与此关联的相应技术,可以根据无线通信系统中的传输视频(例如,视频流),例如示例无线通信系统2700和/或图27A-27E中所示的其组件实现。
图34A为示例通信系统3400的示意图,可于其中实施一项或者更多项已披露的实施方式。通信系统3400可以为多址接入系统,其向多个无线用户提供内容,例如语音、数据、视频、消息发送、广播等等。通信系统3400可以使多个无线用户通过系统资源(包括无线带宽)的共享访问所述内容。例如,通信系统3400可使用一种或多种信道接入方法,例如码分多址(CDMA)、时分多址(TDMA)、频分多址(FDMA)、正交FDMA(OFDMA)、单载波FDMA(SC-FDMA)等等。
如图34A所示,通信系统3400可以包括至少一个无线发射/接收单元(WTRU),例如多个WTRU,比如WTRU 3402a、3402b、3402c、以及3402d,无线电接入网(RAN)3404,核心网3406,公共交换电话网(PSTN)3408,因特网3410和其他网络3412,不过应该理解的是已披露的实施方式考虑到了任何数量的WTRU、基站、网络和/或网络元件。WTRU 3402a、3402b、3402c、3402d中的每一个可以是配置用于在无线环境中进行操作和/或通信的任何类型的设备。作为示例,WTRU 3402a、3402b、3402c、3402d可以配置为发射和/或接收无线信号并且可以包括用户设备(WTRU)、移动台、固定或移动用户单元、寻呼机、蜂窝电话、个人数字助理(PDA)、智能电话、笔记本电脑、上网本、个人计算机、无线传感器、消费性电子产品等等。
通信系统3400还可以包括基站3414a和基站3414b。基站3414a、3414b中的每一个可以是被配置为无线连接WTRU 3402a、3402b、3402c、3402d中的至少一个的任何类型的设备,以促进对一个或更多通信网络(例如CN3406、因特网3410和/或其他网络3412)的接入。作为示例,基站3414a、3414b可以是基站收发信台(BTS)、节点B、演进的节点B(e节点B)、家庭节点B(HNB)、家庭e节点B(HeNB)、站点控制器、接入点(AP)、无线路由器等等。虽然基站3414a、3414b各自被描述为单独的元件,但是应该理解的是基站3414a、3414b可以包括任何数量的互连的基站和/或网络元件。
基站3414a可以是RAN 3404的一部分,所述RAN 3404还可包括其他基站和/或网络元件(未示出),例如基站控制器(BSC)、无线电网络控制器(RNC)、中继节点等等。基站3414a和/或基站3414b可被配置为在特定地理区域内发射和/或接收无线信号,所述特定地理区域可被称作小区(未示出)。所述小区可进一步划分为小区扇区。例如,与基站3414a相关的小区可划分为三个扇区。因而,在一个实施方式中,基站3414a可包括三个收发信机,即小区的每个扇区使用一个收发信机。在另一个实施方式中,基站3414a可实施多输入多输出(MIMO)技术,并且,因此,可针对小区的每个扇区使用多个收发信机。
基站3414a、3414b可通过空中接口3416与WTRU 3402a、3402b、3402c、3402d中的一个或更多个通信,所述空中接口3416可以是任何适当的无线通信链路(例如,射频(RF),微波,红外线(IR),紫外线(UV),可见光等等)。可利用任何适当的无线电接入技术(RAT)建立空中接口3416。
更具体地,如上所述,通信系统3400可以是多址接入系统并且可以使用一种或多种信道接入方案,例如CDMA、TDMA、FDMA、OFDMA、SC-FDMA等等。例如,RAN 3404中的基站3414a和WTRU 3402a、3402b、3402c可以实现例如通用移动电信系统(UMTS)陆地无线电接入(UTRA)的无线电技术,其可以使用宽带CDMA(WCDMA)来建立空中接口3416。WCDMA可以包括通信协议,例如高速分组接入(HSPA)和/或演进的HSPA(HSPA+)。HSPA可以包括高速下行链路分组接入(HSDPA)和/或高速上行链路分组接入(HSUPA)。
在另一个实施方式中,基站3414a和WTRU 3402a、3402b、3402c可实现例如演进UTRA(E-UTRA)的无线电技术,其可以使用长期演进(LTE)和/或高级LTE(LTE-A)来建立空中接口3416.
在其他实施方式中,基站3414a和WTRU 3402a、3402b、3402c可实现无线电技术,例如IEEE 802.16(即,全球互通微波存取(WiMAX)),CDMA2000,CDMA20001X,CDMA2000演进-数据优化(EV-DO),临时标准2000(IS-2000),临时标准95(IS-95),临时标准856(IS-856),全球移动通信系统(GSM),GSM演进的增强型数据速率(EDGE),GSM/EDGERAN(GERAN)等等。
图34A中的基站3414b可以是无线路由器、家庭节点B(HNB)、家庭e节点B(HeNB)或接入点(AP),例如,并且可以利用任何适当的RAT来促进局部区域中的无线连接,例如商业场所、住宅、车辆、校园等等。在一个实施方式中,基站3414b和WTRU 3402c、3402d可以实现例如IEEE802.11的无线电技术来建立无线局域网(WLAN)。在另一个实施方式中,基站3414b和WTRU 3402c、3402d可以实现例如IEEE 802.15的无线电技术来建立无线个域网(WPAN)。在又一个实施方式中,基站3414b和WTRU102c、102d可以利用基于蜂窝的RAT(例如,WCDMA,CDMA2000,GSM,LTE,LTE-A等)建立微微小区或毫微微小区。如图34A所示,基站3414b可以拥有与因特网3410的直接连接。因此,基站3414b可以不必经由核心网(CN)3406而接入到因特网3410。
RAN 3404可以与CN 3406通信,所述CN 3406可以是被配置用于向WTRU 3402a、3402b、3402c、3402d中的一个或更多提供语音、数据、应用、和/或通过网络协议的语音(VoIP)服务的任何类型的网络。例如,核心网3406可以提供呼叫控制、计费服务、基于移动位置的服务、预付费呼叫、因特网连接、视频分配等等,和/或执行高级安全功能,例如用户认证。虽然图34A中未示出,但应该理解的是RAN 3404和/或核心网3406可以与使用和RAN 3404相同的RAT或不同RAT的其他RAN进行直接或间接的通信。例如,除了连接到正在使用E-UTRA无线电技术的RAN 3404之外,核心网3406还可以与使用GSM无线电技术的另一个RAN(未示出)通信。
核心网3406还可以充当WTRU 3402a、3402b、3402c、3402d接入到PSTN 3408、因特网3410和/或其他网络3412的网关。PSTN 3408可以包括提供普通老式电话服务(POTS)的电路交换电话网络。因特网3410可以包括使用公共通信协议的互联计算机网络和设备的全球系统,所述协议例如有TCP/IP网际协议组中的传输控制协议(TCP)、用户数据报协议(UDP)和网际协议(IP)。网络3412可以包括其他服务提供商拥有和/或操作的有线或无线的通信网络。例如,网络3412可以包括连接到一个或更多RAN中的另一个核心网,该RAN可以使用和RAN 3404相同的RAT或不同的RAT。
通信系统3400中,WTRU 3402a、3402b、3402c、3402d中的一些或全部可以包括多模式能力,即WTRU 3402a、3402b、3402c、3402d可以包括用于在不同无线链路上与不同无线网络进行通信的多个收发信机。例如,图34A中示出的WTRU 3402c可被配置为与基站3414a通信,所述基站3414a可以使用基于蜂窝的无线电技术,以及与基站3414b通信,所述基站3414b可以使用IEEE 802无线电技术。
图34B为示例WTRU 3402的系统示意图。如图34B所示,WTRU3402可以包括处理器3418、收发信机3420、发射/接收元件,(例如天线),3422、扬声器/麦克风3424、键盘3426、显示器/触摸板3428、不可移动存储器3430、可移动存储器3432、电源3434、全球定位系统(GPS)芯片组3436、和其他外围设备3438。应该理解的是WTRU 3402可以在保持与实施方式一致的同时,包括前述元件的任何子组合。
处理器3418可以是通用处理器、专用处理器、常规处理器、数字信号处理器(DSP)、多个微处理器、与DSP核相关联的一个或更多微处理器、控制器、微控制器、专用集成电路(ASIC)、场可编程门阵列(FPGA)电路、任何其他类型的集成电路(IC)、状态机等等。处理器3418可执行信号编码、数据处理、功率控制、输入/输出处理、和/或任何使WTRU 3402能够在无线环境中运转的其他功能。处理器3418可以耦合到收发信机3420,所述收发信机3420可耦合到发射/接收元件3422。虽然图34B将处理器3418和收发信机3420绘示为单独的部件,但是应该理解的是处理器3418和收发信机3420可以一同集成在电子封装或芯片中。
发射/接收元件3422可以被配置为通过空中接口3416将信号发送到、或接收自基站(例如,基站3414a)。例如,在一个实施方式中,发射/接收元件3422可以是配置成用于发送和/或接收RF信号的天线。在另一个实施方式中,发射/接收元件3422可以是被配置成用于发送和/或接收,例如IR、UV或可见光信号的发射器/检测器。在又一个实施方式中,发射/接收元件3422可以配置用于发射和接收RF和光信号两者。发射/接收元件3422可以配置为发射和/或接收无线信号的任何组合。
此外,虽然在图34B中将发射/接收元件3422绘示为单独的元件,但是WTRU 3402可以包括任意数量的发射/接收元件3422。更具体地,WTRU3402可以使用MIMO技术。因此,在一个实施方式中,WTRU 3402可以包括用于通过空中接口3416发射并接收无线信号的两个或更多个发射/接收元件3422(例如,多个天线)。
收发信机3420可以配置为调制将由发射/接收元件3422发送的信号,以及配置为解调发射/接收元件3422接收的信号。如上所述,WTRU 3402可以具有多模式能力。因此,收发信机3420可以包括使WTRU 3402能够经由多个RAT通信的多个收发信机,所述多个RAT例如为UTRA和IEEE 802.11。
WTRU 3402的处理器3418可以耦合到下述设备,并且可以从下述设备中接收用户输入数据:扬声器/麦克风3424、键盘3426,和/或显示器/触摸板3428(例如,液晶显示器(LCD)显示单元或有机发光二极管(OLED)显示单元)。处理器3418还可以将用户数据输出到扬声器/麦克风3424、键盘3426和/或显示/触摸板3428。此外,处理器3418可以从任何类型的适当的存储器,例如不可移动存储器3430和/或可移动存储器3432,访问信息,并且可以将数据存储到所述存储器中。不可移动存储器3430可以包括随机存取存储器(RAM)、只读存储器(ROM)、硬盘、或任何其他类型的存储器设备。可移动存储器3432可以包括用户标识模块(SIM)卡、记忆棒、安全数字(SD)存储卡等等。在其他的实施方式中,处理器3418可以从未物理设置在WTRU 3402,例如服务器或家用计算机(未示出)上的存储器访问信息,并且可以将数据存储在该存储器。
处理器3418可以从电源3434接收电能,并且可以配置为给WTRU 3402中的其他组件分配和/或控制电能。电源3434可以是任何适当的给WTRU3402供电的设备。例如,电源3434可以包括一个或更多干电池(例如,镍镉(NiCd)、镍锌(NiZn)、镍氢(NiMH)、锂离子(Li-ion)等等),太阳能电池,燃料电池等等。
处理器3418还可以耦合到GPS芯片组3436,所述GPS芯片组3436可以配置为提供关于WTRU 3402当前位置的位置信息(例如,经度和纬度)。除来自GPS芯片组3436的信息或作为其替代,WTRU 3402可以通过空中接口3416从基站(例如,基站3414a、3414b)接收位置信息,和/或基于两个或更多个邻近基站接收到的信号的时机确定其位置。WTRU 3402在保持与实施方式相一致的同时,可以通过任何适当的位置确定方法获得位置信息。
处理器3418可以进一步耦合到其他外围设备3438,所述外围设备3438可以包括一个或更多提供附加特性、功能和/或有线或无线连接的软件和/或硬件模块。例如,外围设备3438可以包括加速计、电子罗盘、卫星收发信机、数字相机(用于照片或视频)、通用串行总线(USB)端口、振动设备、电视收发器、免提耳机、模块、调频(FM)无线电单元、数字音乐播放器、媒体播放器、视频游戏机模块、因特网浏览器等等。
图34C为通信系统3400实施方式的系统示意图,其包括RAN 3404a与示例核心网3406a,分别包括RAN 3404与核心网3406的示例实现。如上所述,RAN 3404,例如RAN 3404a可应用UTRA无线电技术通过空中接口3416与WTRU 3402a、3402b和3402c通信。RAN 3404a还可以与核心网3406a通信。如图34C所示,RAN 3404a可以包括节点-B 3440a、3440b、3440c,其每个可以包括一个或者更多个收发信机用以在空中接口3416上与WTRU3402a、3402b、3402c通信。节点-B3440a、3440b、3440c中的每一个可与RAN 3404a中的特定小区(未示出)相关联。RAN 3404a也可以包括RNC3442a、3442b。应该理解的是在与实施方式相一致的同时RAN 3404a可以包括任何数量的节点-B以及RNC。
如图34C中所示,节点-B3440a、3440b可以与RNC 3442a通信。此外,节点-B 3440c可以与RNC 3442b通信。节点-B 3440a、3440b、3440c可以分别与RNC 3442a、3442b经由Iub接口通信。RNC 3442a、3442b可以经由Iur口彼此通信。RNC 3442a、3442b的每一个可以配置用于控制其所连接的各自节点-B 3440a、3440b、3440c。此外,RNC 3442a、3442b的每一个可以配置用于执行或支持其他功能,例如外环功率控制、负载控制、准入控制、封包调度、切换控制、宏分集、安全功能、数据加密、等等。
图34C中示出的核心网3406a可包括媒体网关(MGW)3444、移动交换中心(MSC)3446、服务GRPS支持节点(SGSN)3448、和/或网关GPRS支持节点(GGSN)3450。虽然前述的每个元件描述为核心网3406a的一部分,但是应该理解的是这些元件中的任何一个都可由除核心网运营商之外的实体所拥有和/或操作。
RAN 3404a中的RNC 3442a可以经由IuCS接口与核心网3406a中的MSC 3446连接。MSC 3446可以连接至MGW 3444。MSC 3446与MGW 3444可以向WTRU 3402a、3402b、3402c提供对电路交换网络(例如PSTN 3408)的接入,以促进WTRU 3402a、3402b、3402c和传统陆地线通信设备之间的通信。
RAN 3404a中的RNC 3442a还可以经由IuPS接口连接至核心网3406a中的SGSN 3448。SGSN 3448可以连接至GGSN 3450。SGSN 3448与GGSN3450可以向WTRU 3402a、3402b、3402c提供对封包交换网络,例如因特网3410的接入,以促进WTRU 3402a、3402b、3402c和IP启用设备之间的通信。
如上所述,核心网3406a还可以连接至网络3412,其可以包括由其他服务提供商所拥有和/或操作的其他有线或者无线网络。
图34D为通信系统3400实施方式的系统示意图,其包括RAN 3404b以及核心网3406b,分别包括RAN 3404与核心网3406的示例实现。如上所述,RAN 3404,例如RAN 3404b,可以应用E-UTRA无线电技术通过空中接口3416与WTRU 3402a、3402b和3402c通信。RAN 3404b还可以与核心网3406b通信。
虽然RAN 3404b可以包括e节点-B 3440d、3440e、3440f,但应该理解的是在与实施方式相一致的同时RAN 3404b可以包括任何数量的e节点-B。e节点-B3440d、3440e、3440f的每个可以包括一个或者更多个收发信机用以在空中接口3416上与WTRU 3402a、3402b、3402c通信。在一个实施方式中,e节点-B 3440d、3440e、3440f可以实施多输入多输出(MIMO)技术。因此,e节点-B 3440d,例如,可使用多个天线以发射无线信号至WTRU 3402a、以及从WTRU 3402a接收无线信号。
e节点-B 3440d、3440e、与3440f中的每一个可以与特定小区(未示出)相关联并且可以配置用于操控上行链路和/或下行链路中无线电资源管理判断、切换判断、用户调度、等等。如图34D中所示,e节点-B 3440d、3440e、3440f可以在X2接口上彼此通信。
图34D中示出的核心网3406d可以包括移动管理网关(MME)3443、服务网关3445、封包数据网络(PDN)网关3447。虽然前述的每个元件描述为核心网3406b的一部分,但是应该理解的是这些元件中的任何一个都可由除核心网运营商之外的实体所拥有和/或操作。
MME 3443可经由S1接口连接到RAN 3404b中的eNB 3440d、3440e、和3440f的每一个,并且可以充当控制节点。例如,MME 3443可负责认证WTRU 3402a、3402b、3402c的用户,承载激活/去激活,在WTRU 3402a、3402b、3402c的初始附着期间选择特定服务网关,等等。MME 3443还可以提供控制层面功能用以在RAN 3404b与使用其他无线电技术(例如GSM或WCDMA)的其他RAN(未示出)之间切换。
服务网关3445可经由S1接口连接到RAN 3404b中e节点B 3440d、3440e、3440f的每一个。服务网关3445通常可以向/自WTRU 3402a、3402b、3402c路由并且转发用户数据分组。服务网关3445还可以执行其他功能,例如在eNB之间切换的期间锚定用户层面、在WTRU102a、102b、102c下行链路数据可用时触发寻呼、管理和存储WTRU 102a、102b、102c的内容,等等。
服务网关3445还可连接到PDN网关3447,所述PDN网关3447可以向WTRU 3402a、3402b、3402c提供对封包交换网络,例如因特网3410的接入,以促进WTRU 3402a、3402b、3402c和IP启用设备之间的通信。
核心网3406b可促进与其他网络的通信。例如,核心网3406b可向WTRU3402a、3402b、3402c提供对电路交换网络(例如PSTN3408)的接入,以促进WTRU 3402a、3402b、3402c和传统陆地线通信设备之间的通信。例如,核心网3406b可包括IP网关,或可与IP网关通信,(例如,IP多媒体子系统(IMS)服务器),所述IP网关用作核心网3406b和PSTN 3408之间的接口。此外,核心网3406b可向WTRU 3402a、3402b、3402c提供对网络3412的接入,所述网络3412可包括由其他服务提供商拥有和/或操作的其他有线或无线网络。
图34E为通信系统3400的实施方式的系统示意图,通信系统3400包括RAN 3404c以及核心网3406c,其分别包含RAN 3404以及核心网3406。RAN 3404,例如RAN 3404c,可以接入服务网络(ASN),其应用IEEE 802.16无线电技术在空中接口3416上与WTRU 3402a、3402b、以及3402c通信。如此处所述,WTRU 3402a、3402b、3402c、RAN 3404c的不同功能实体与核心网3406c之间的通信链路可以定义为参考点。
如图34E中所示,RAN 3404c可以包括基站3402a、3402b、3402c、以及ASN网关3441,但应该理解的是RAN 3404可以在保持与实施方式一致的同时,包括任何数量的基站与ASN网关。基站3402a、3402b、3402c中的每一个可与RAN 3404c中的特定小区(未示出)相关联并且每一个可以包括一个或者更多个收发信机用以在空中接口3416上与WTRU 3402a、3402b、3402c通信。在一个实施方式中,基站3440g、3440h、3440i可以实施多输入多输出(MIMO)技术。因此,基站3440g,例如,可以使用多个天线以发射无线信号至WTRU 3402a、以及从WTRU 3402a接收无线信号。基站3440g、3440h、3440i还可以提供移动管理功能,例如切换触发、通道建立、无线资源管理、流量分类、服务质量政策实施、等等。ASN网关3441可以作为流量聚合点并且可以负责寻呼、缓存订阅者属性、路由至核心网3406c、等等。
WTRU 3402a、3402b、3402c与RAN 3404c之间的空中接口3416可以定义为R1参考点,实施IEEE 802.16规格。此外,WTRU 3402a、3402b、3402c的每一个可以建立与核心网3406c的逻辑接口(未示出)。WTRU 3402a、3402b、3402c与核心网3406c之间的逻辑接口可以定义为R2参考点,其可以用于验证、授权、IP主配置管理、和/或移动管理。
基站3440g、3440h、3440i的每一个之间的通信链路可以定义为R8参考点,其可以包括有助于WTRU在基站间交换以及传输数据的协议。基站3440g、3440h、3440i与ASN网关3441之间的通信链路可以定义为R6参考点。R6参考点可以包括有助于基于与WTRU 3402a、3402b、3402c每一个关联的移动事件的移动管理的协议。
如图34E中所示,RAN 3404c可与核心网3406c连接。RAN 3404c与核心网3406c之间的通信链路可以定义为R3参考点,其包括例如,有助于数据传输与移动管理性能的协议。核心网3406c可以包括移动IP家乡代理(MIP-HA)3444、验证、授权、记账(AAA)服务器3456、以及网关3458。虽然前述的每个元件描述为核心网3406c的一部分,但是应该理解的是这些元件中的任何一个都可由除核心网运营商之外的实体所拥有和/或操作。
MIP-HA可以负责IP地址管理,并且可以使WTRU 3402a、3402b、以及3402c在不同的ASN和/或不同核心网之间漫游。MIP-HA 1354可以向WTRU 3402a、3402b、3402c提供对封包交换网络,例如因特网3410的接入,以促进WTRU 3402a、3402b、3402c和IP启用设备之间的通信。AAA服务器3456可以负责用户验证并支持用户服务。网关3458可以促进与其他网络的相互配合。例如,网关3458可以向WTRU 3402a、3402b、3402c提供对电路交换网络(例如PSTN3408)的接入,以促进WTRU 3402a、3402b、3402c和传统陆地线通信设备之间的通信。此外,网关3458可以向WTRU3402a、3402b、3402c提供对网络3412的接入,其可以包括由其他服务提供商拥有和/或操作的其他有线或无线网络。
虽然图34E中未示出,但是应该可以理解的是RAN 3404c可以连接至其他ASN并且核心网3406c可以连接至其他核心网。RAN 3404c与其他ASN之间的通信链路可以定义为R4参考点,其可以包括用于协调RAN 3404c与其他ASN之间WTRU 3402a、3402b、3402c移动性的协议。核心网3406c与其他核心网之间的通信链路可以定义为R5参考点,其可以包括促进家乡核心网与受访核心网之间相互配合的协议
此处所描述的过程与手段可以以任何结合的方式适用,可以适用于其他无线技术,并用于其他服务(例如,并不限于相接近的服务)。
WTRU可以涉及物理装置本体、或者用户身份例如与身份相关的订阅,例如MSISDN、SIP URI等。WTRU可以涉及基于身份的应用,例如可能用于每个应用的用户名称。
虽然上文以特定结合的方式描述了特征与元件,但是本领域技术人员可以理解每个特征与原件可以单独使用或者与其他特征与元件结合使用。此外,此处所描述的方法可以以计算机程序、软件或固件实现,其包含于由计算机或处理器执行的计算机可读介质中。计算机可读介质的示例包括电子信号,(通过有线或无线连接传送),和计算机可读存储介质。计算机可读存储介质的示例包括,但不限定为只读存储器(ROM)、随机存取存储器(RAM)、寄存器、缓冲存储器、半导体存储器设备、磁性介质,(例如,内部硬盘与可移动磁盘)、磁光介质、和光介质例如光盘(CD)及数字通用盘(DVD)。与软件相关联的处理器可以用于实现在WTRU、WTRU、终端、基站、RNC、或任何主计算机中使用的射频收发信机。

Claims (30)

1.一种方法,该方法包括:
从视频源接收多个视频帧,每个帧具有多个像素,每个所述像素具有各自的值;
至少部分基于该像素周围各自局部区域中的所述像素各自的值以及至少一个感知特性,确定每个像素各自的局部对比敏感度,所述至少一个感知特性从由显示屏处的观看条件、所述显示屏的显示特性、以及用户特性构成的组中选取;
至少部分基于该像素各自的局部对比敏感度选取每个像素各自的滤波器带宽;
根据该像素各自选取的该滤波器带宽对每个像素滤波,生成滤波后的视频帧;以及
将该滤波后的视频帧提供给视频编码器。
2.根据权利要求1所述的方法,其中确定各像素各自的局部对比敏感度包括基于周围环境对比度调节该像素值以及基于各自的调节后的值确定所述各自的局部对比敏感度。
3.根据权利要求2所述的方法,其中该感知特性包括以下中的至少一者:接收装置处的周围环境亮度、该接收装置的反射率、该接收装置的峰值亮度、以及该接收装置的原生对比度,并且其中基于该周围环境对比度调节各自的像素值包括基于该感知特性调节该值。
4.根据权利要求1所述的方法,其中该感知特性包括以下中的至少一者:所述显示屏的像素密度以及显示屏用户与该显示屏之间的观看距离,其中确定所述各自的局部对比敏感度包括至少基于所述像素密度以及所述观看距离选取包含在所述各自的局部区域中的像素。
5.根据权利要求4所述的方法,其中选取包含在所述各自的局部区域中的像素包括基于高斯滤波器的标准方差值选取像素。
6.根据权利要求5所述的方法,其中基于所述标准方差值选取像素包括选取周期与像素之比并且至少基于所选的比确定所述标准方差值。
7.根据权利要求6所述的方法,其中选取周期与像素之比包括:
选取周期与视野度数之比、基于所述像素密度与所述观看距离确定像素与度数之比、并且至少基于所选取的周期与度数之比以及所确定的像素与度数之比确定周期与像素之比。
8.根据权利要求1所述的方法,其中确定各像素各自的局部对比敏感度包括:
至少部分基于所述各自的局部区域中的像素值确定各自的局部平均;
至少部分基于所述各自的局部平均以及所述各自的局部区域中的像素值确定各自的局部峰值振幅;以及
将所述各自的局部平均与所述各自的局部峰值振幅的各自的比确定为所述各自的局部对比敏感度。
9.根据权利要求8所述的方法,其中确定所述各自的局部峰值振幅包括:
确定多个像素中的每一个的各自的绝对差值,所述各自的绝对差值包括所述各自的局部平均与所述各自的像素值之间的各自的绝对差值;以及
从所述各自的局部区域中的各自的绝对差值中选取最大的绝对差值作为所述各自的局部峰值振幅。
10.根据权利要求9所述的方法,该方法进一步包括对每个各自的局部峰值振幅应用高斯滤波器,其中选取该最大绝对差值作为所述各自的局部峰值振幅包括选取最大滤波后的绝对差值作为所述各自的局部峰值振幅。
11.根据权利要求1所述的方法,其中至少部分基于所述各自的局部对比敏感度选取各像素的的各自的滤波器带宽包括至少部分基于利用反对比敏感度函数获取的带宽选取所述各自的滤波器带宽。
12.根据权利要求11所述的方法,其中所述反对比敏感度函数至少部分基于Movshon&Kiorpes对比敏感度模型与Barten对比敏感度模型中的至少一个的反函数。
13.根据权利要求1所述的方法,其中选取各像素的各自的滤波器带宽包括至少部分基于至少一个感知因素选取比例因子、利用该比例因子调节各自的局部对比敏感度、以及至少部分基于所述各自的调节后的局部对比敏感度选取所述各自的滤波器带宽。
14.根据权利要求13所述的方法,其中所述至少一个感知因素包括以下中的至少一者:所述显示屏处的周围环境亮度、所述显示屏的峰值亮度、显示屏用户与所述显示屏之间的观看距离、以及所述显示屏的像素密度。
15.根据权利要求13所述的方法,其中所述至少一个感知因素包括显示屏用户的年龄。
16.根据权利要求1所述的方法,其中生成滤波后的视频帧包括:使用一组三个二维的可分离的滤波器对每个像素滤波,该组中的每个二维可分离滤波器具有各自的水平截止频率以及各自的垂直截止频率,第一二维可分离滤波器的水平截止频率与第三二维可分离滤波器的水平截止频率相等,并且第二二维可分离滤波器的垂直截止频率与该第三二维可分离滤波器的垂直截止频率相等,其中利用该组二维可分离滤波器对每个像素滤波包括获取所述第一二维可分离滤波器与第二二维可分离滤波器各自的滤波结果之和以及获取该和与所述第三二维可分离滤波器各自的滤波结果之间的差。
17.根据权利要求16所述的方法,其中每个二维可分离滤波器包括各自的一维水平滤波器以及各自的一维垂直滤波器,该各自的一维水平滤波器的截止频率与该各自的二维滤波器的各自的水平截止频率相等,以及该各自的一维垂直滤波器的截止频率与该各自的二维滤波器的各自的垂直截止频率相等。
18.根据权利要求17所述的方法,其中所述各自的一维水平滤波器与所述各自的一维垂直滤波器包括Lanczos滤波器。
19.一种视频滤波设备,该设备包括:
存储元件,被配置用于存储多个视频帧,每个帧具有多个像素,每个像素具有各自的值,并且被配置用于使一个或者更多个滤波后的视频帧适用于视频编码器;
接收机,被配置用于接收至少一个感知特性,该至少一个感知特性选取于由显示屏处的观看条件、该显示屏的显示特性、以及用户特性构成的组;
对比敏感度确定模块,被配置用于至少部分基于该像素周围各自的局部区域中像素各自的值以及至少一个感知特性,确定每个像素各自的局部对比敏感度;
对比敏感度滤波器选取模块,被配置用于(i)至少部分基于所述像素的各自的局部敏感度确定每个像素各自的滤波器带宽以及(ii)至少部分基于所述各自的滤波器带宽选取每个像素对应的滤波器;
视频滤波器模块,被配置用于根据每个像素的各自的选取的滤波器对每个像素滤波生成滤波后的视频帧。
20.根据权利要求19所述的设备,该设备进一步包括感知关联模块,被配置用于:
接收与至少一个感知特性相关的感知信息,所述感知特性选取于该感知特性组;以及
至少部分基于该感知信息获取感知特性。
21.根据权利要求20所述的方法,其中所述感知信息选取于由所述显示屏的序列标识符、所述显示屏的型号标识符、所述显示屏的地理位置、所述显示屏在一天中所处的时间、和显示屏用户的用户名组成的组。
22.根据权利要求19所述的设备,该设备进一步包括色彩空间转换模块,被配置用于:
将接收到的视频帧的色彩空间由原始色彩空间转换为线性RGB色彩空间;以及
将滤波后的视频帧的色彩空间由线性RGB色彩空间转换为所述原始色彩空间。
23.根据权利要求19所述的设备,该设备进一步包括黑电平调节模块,被配置用于在所述对比敏感度确定模块确定每个像素的各自的局部对比敏感度之前调节每个像素的黑电平,所述调节至少部分基于所述显示屏的周围环境对比度。
24.根据权利要求22所述的设备,其中所述至少一个感知特性包括感知特性集,该感知特性集包括所述显示屏处的周围环境亮度、所述显示屏的最大亮度、所述显示屏的反射率、以及所述显示屏的原生对比度,其中所述黑电平调节模块包括周围环境对比度确定模块,被配置用于至少部分基于所述感知特性集确定所述周围环境对比度。
25.根据权利要求19所述的设备,
其中各像素周围各自的局部区域包括各自的局部平均区域以及各自的局部最大区域,
其中该对比敏感度确定模块包括:
局部平均估计模块,被配置用于确定各自的局部平均区域中各自的局部平均值;
局部最大估计模块,被配置用于确定各自的局部最大区域中的像素各自的绝对差值的各自的局部最大值;以及
对比敏感度模块,被配置用于确定所述各自的局部平均与所述各自的局部最大值的各自的比值;
其中所述对比敏感度确定模块被配置用于将确定的各自的比值选取作为所述各自的局部对比敏感度。
26.根据权利要求25所述的设备,其中所述对比敏感度确定模块进一步包括局部平均区域选取模块,被配置用于:
选取具有视野的每度多个空间振荡的局部截止频率;
将该局部截止频率转换为具有该视野的每度多个像素的转换后的局部截止频率;以及
至少部分基于该转换后的局部截止频率选取包含在各自的像素周围的各自的局部平均区域中的像素。
27.根据权利要求26所述的方法,其中所述至少一个感知特性包括感知特性集,该感知特性集包括所述显示屏的像素密度以及从所述显示屏至所述该显示屏用户的观看距离,其中所述局部平均区域选取模块至少部分基于所述感知特性集将所述局部截止频率转换为转换后的局部截止频率。
28.根据权利要求19所述的设备,其中所述对比敏感度确定模块包括对比敏感度缩放模块,被配置用于至少部分基于所确定的比例因子调节所述各自的局部对比敏感度,所述比例因子至少部分基于所述至少一个感知特性被确定。
29.根据权利要求28所述的设备,其中:
该至少一个感知特性包括感知特性集,该感知特性集包括所述显示屏处的周围环境亮度、所述显示屏的最大亮度、所述显示屏的反射率、以及所述显示屏的原生对比度;以及
所述对比敏感度缩放模块包括周围亮度比例因子确定模块,被配置用于至少部分基于所述感知特性集确定所述比例因子。
30.根据权利要求28所述的设备,其中:
所述至少一个感知特性包括所述显示屏用户的显示屏用户年龄;以及
所述对比敏感度缩放模块包括年龄比例因子确定模块,被配置用于至少部分基于所述显示屏用户年龄确定所述比例因子。
CN201380070579.2A 2012-11-16 2013-11-15 用于视觉条件意识视频编码的感知预处理滤波器 Pending CN104937935A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201261727203P 2012-11-16 2012-11-16
US61/727,203 2012-11-16
US201361834789P 2013-06-13 2013-06-13
US61/834,789 2013-06-13
US201361875415P 2013-09-09 2013-09-09
US61/875,415 2013-09-09
PCT/US2013/070444 WO2014078748A1 (en) 2012-11-16 2013-11-15 Perceptual preprocessing filter for viewing-conditions-aware video coding

Publications (1)

Publication Number Publication Date
CN104937935A true CN104937935A (zh) 2015-09-23

Family

ID=49724666

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201380070579.2A Pending CN104937935A (zh) 2012-11-16 2013-11-15 用于视觉条件意识视频编码的感知预处理滤波器

Country Status (6)

Country Link
US (1) US20150304685A1 (zh)
EP (1) EP2920965A1 (zh)
JP (1) JP2016508298A (zh)
KR (1) KR20150086327A (zh)
CN (1) CN104937935A (zh)
WO (1) WO2014078748A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107197266A (zh) * 2017-06-26 2017-09-22 杭州当虹科技有限公司 一种hdr视频编码方法

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY189001A (en) 2014-03-04 2022-01-17 Microsoft Technology Licensing Llc Adaptive switching of color spaces, color sampling rates and/or bit depths
WO2015131330A1 (en) 2014-03-04 2015-09-11 Microsoft Technology Licensing, Llc Encoding strategies for adaptive switching of color spaces, color sampling rates and/or bit depths
US10116937B2 (en) * 2014-03-27 2018-10-30 Microsoft Technology Licensing, Llc Adjusting quantization/scaling and inverse quantization/scaling when switching color spaces
US10045050B2 (en) 2014-04-25 2018-08-07 Vid Scale, Inc. Perceptual preprocessing filter for viewing-conditions-aware video coding
US10687069B2 (en) 2014-10-08 2020-06-16 Microsoft Technology Licensing, Llc Adjustments to encoding and decoding when switching color spaces
WO2016060672A1 (en) 2014-10-16 2016-04-21 Hewlett-Packard Development Company, L.P. Video coding using a saliency map
US10368105B2 (en) 2015-06-09 2019-07-30 Microsoft Technology Licensing, Llc Metadata describing nominal lighting conditions of a reference viewing environment for video playback
JP6523151B2 (ja) * 2015-12-09 2019-05-29 富士フイルム株式会社 表示装置
KR102646030B1 (ko) 2016-12-15 2024-03-12 삼성전자주식회사 영상제공장치, 그의 제어 방법 및 영상제공시스템
KR102895342B1 (ko) * 2017-02-01 2025-12-05 삼성전자주식회사 비디오 코딩 모듈 및 그것의 동작 방법
CN118540517A (zh) 2017-07-28 2024-08-23 杜比实验室特许公司 向客户端提供媒体内容的方法和系统
US10931977B2 (en) * 2018-03-15 2021-02-23 Comcast Cable Communications, Llc Systems, methods, and apparatuses for processing video
CA3037026A1 (en) 2018-03-15 2019-09-15 Comcast Cable Communications, Llc Systems, methods, and apparatuses for processing video
JP2020003704A (ja) * 2018-06-29 2020-01-09 株式会社デンソー 情報処理装置
CN119048993B (zh) * 2024-11-01 2025-03-14 山东科技大学 基于自适应全局感知与多尺度特征融合的人群计数方法
CN120050426B (zh) * 2025-04-25 2025-08-12 深圳华强电子网集团股份有限公司 基于自适应压缩算法的高精度cmos图像传感器数据存储优化方法、装置、介质及设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6907143B2 (en) * 2001-05-16 2005-06-14 Tektronix, Inc. Adaptive spatio-temporal filter for human vision system models
CN101127926A (zh) * 2007-09-14 2008-02-20 西安电子科技大学 基于多尺度几何分析的图像质量评测方法
US20100080302A1 (en) * 2008-09-29 2010-04-01 Microsoft Corporation Perceptual mechanism for the selection of residues in video coders
CN101710995A (zh) * 2009-12-10 2010-05-19 武汉大学 基于视觉特性的视频编码系统

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
US6633654B2 (en) * 2000-06-19 2003-10-14 Digimarc Corporation Perceptual modeling of media signals based on local contrast and directional edges
US6975776B2 (en) * 2002-02-14 2005-12-13 Tektronix, Inc. Predicting human vision perception and perceptual difference
JP3900017B2 (ja) * 2002-06-04 2007-04-04 富士ゼロックス株式会社 画像処理装置
US7471843B2 (en) * 2004-02-04 2008-12-30 Sharp Laboratories Of America, Inc. System for improving an image displayed on a display
JP2010521272A (ja) * 2007-03-16 2010-06-24 エスティーアイ・メディカル・システムズ・エルエルシー 標準化された撮像データを実現するために撮像デバイスに自動品質フィードバックを与える方法
US7813564B2 (en) * 2007-03-30 2010-10-12 Eastman Kodak Company Method for controlling the amount of compressed data
EP2120448A1 (en) * 2008-05-14 2009-11-18 Thomson Licensing Method of processing of a compressed image into a gamut mapped image using spatial frequency analysis
US8698961B2 (en) * 2010-05-21 2014-04-15 Vixs Systems, Inc. Enhanced histogram equalization
US9520101B2 (en) * 2011-08-31 2016-12-13 Microsoft Technology Licensing, Llc Image rendering filter creation
US9237343B2 (en) * 2012-12-13 2016-01-12 Mitsubishi Electric Research Laboratories, Inc. Perceptually coding images and videos
US10045050B2 (en) * 2014-04-25 2018-08-07 Vid Scale, Inc. Perceptual preprocessing filter for viewing-conditions-aware video coding

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6907143B2 (en) * 2001-05-16 2005-06-14 Tektronix, Inc. Adaptive spatio-temporal filter for human vision system models
CN101127926A (zh) * 2007-09-14 2008-02-20 西安电子科技大学 基于多尺度几何分析的图像质量评测方法
US20100080302A1 (en) * 2008-09-29 2010-04-01 Microsoft Corporation Perceptual mechanism for the selection of residues in video coders
CN101710995A (zh) * 2009-12-10 2010-05-19 武汉大学 基于视觉特性的视频编码系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ERLI ZHANG ET AL: ""A JND Guided Foveation Video Coding"", 《ADVANCES IN MULTIMEDIA INFORMATION PROCESSING - PCM 2008,SPRINGER BERLIN HEIDELBERG》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107197266A (zh) * 2017-06-26 2017-09-22 杭州当虹科技有限公司 一种hdr视频编码方法

Also Published As

Publication number Publication date
JP2016508298A (ja) 2016-03-17
KR20150086327A (ko) 2015-07-27
EP2920965A1 (en) 2015-09-23
US20150304685A1 (en) 2015-10-22
WO2014078748A1 (en) 2014-05-22

Similar Documents

Publication Publication Date Title
CN104937935A (zh) 用于视觉条件意识视频编码的感知预处理滤波器
JP2016508298A5 (zh)
US10045050B2 (en) Perceptual preprocessing filter for viewing-conditions-aware video coding
JP7674326B2 (ja) ビデオコーディングにおけるクロマ信号強調のためのクロスプレーンフィルタリング
JP7633312B2 (ja) ジオメトリ投影を使用する360度ビデオ符号化
JP7012048B2 (ja) マルチレイヤビデオコーディングのコンバインドスケーラビリティ処理
CN108141507B (zh) 利用查找表进行颜色校正
TWI764870B (zh) 視訊訊號處理裝置及方法
CN107534769B (zh) 用于高动态范围视频译码的色度增强滤波
US20180309995A1 (en) High dynamic range video coding
JP2020524963A (ja) 360度ビデオ符号化のための適応的量子化
TW201642655A (zh) 基於藝術意向之視訊編碼
TW201517631A (zh) 使用者適應視訊電話
KR20170100045A (ko) 다층 비디오 코딩을 위한 적응적 업샘플링
EP3042503B1 (en) Viewing conditions&#39; estimation for adaptive delivery of visual information in a viewing environment
US20240357113A1 (en) Systems and methods for processing video content based on viewing conditions
US20250274667A1 (en) Automatic exposure with simulated histogram data

Legal Events

Date Code Title Description
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20190507

AD01 Patent right deemed abandoned