CN1754390A

CN1754390A - 采用对过完全小波展开进行运动补偿时域滤波的三维小波视频编码

Info

Publication number: CN1754390A
Application number: CN 200480005074
Authority: CN
Inventors: J·C·叶; M·范德沙尔
Original assignee: Koninklijke Philips Electronics NV
Current assignee: Koninklijke Philips NV
Priority date: 2003-02-25
Filing date: 2004-02-23
Publication date: 2006-03-29

Abstract

提供了用于对视频帧进行编码和解码的编码解码方法和装置。编码方法(700)和装置(110)使用过完全小波域中的三维提升技术来压缩视频帧。解码方法(800)和装置(118)也使用过完全小波域中的三维提升技术来对视频帧进行解压缩。

Description

采用对过完全小波展开进行运动补偿时域滤波的三维小波视频编码

根据U.S.C35§119(e)，本申请要求享有2003年2月25日提交的美国专利申请60/449696号的优先权。

技术领域

本申请涉及视频编码系统，更加具体地讲，涉及利用三维提升(lifting)技术的视频编码。

背景技术

近年来，通过数据网络进行的多媒体内容实时流送(streaming)变成了越来越普及的应用。例如，多媒体应用(如点播新闻、直播网络电视收看、以及视频会议)通常依赖于端对端视频信息流送。流送视频应用典型地包括视频发送器，用于对视频信号进行编码并将视频信号通过网络发送给视频接收器，视频接收器实时地对视频信号进行解码并显示视频信号。

对于许多多媒体应用和服务来说，可调整(scalable)视频编码是主要的要求指标。可调整性使处理器能够以较低的运算能力来仅对视频流的子组进行解码，而具有较高运算能力的处理器能够对整个视频流进行解码。可调整性的另一用途是在可变的发送带宽的环境中。在这些环境中，具有较低接入带宽的接收器只接收和解码视频流的子组，而具有较高接入带宽的接收器能够接收和解码整个视频流。

几种视频可调整性方案已为领先的视频压缩标准如MPEG-2及MPEG-4所采用。在这些标准当中已定义了时间、空间以及质量(例如信噪比或“SNR”)的可调整性类型。这些方案主要包括基本层(BL)和增强层(EL)。视频流的基本层通常代表对流进行解码所需的最小数据量。流的增强层代表附加信息，用于当接收器进行解码时增强视频信号表达。

当前许多视频编码系统对基本层使用运动补偿预测编码，对增强层则使用离散余弦变换(DCT)余留编码。在这些系统当中，利用运动补偿可以降低时间冗余，而对于运动补偿的残余进行变换编码会使空间分辨率降低。不过，这些系统一般来说易于出现一些问题，如错误传播(或漂移)和真实可调整性不足。

发明内容

本发明提供改进的编码系统，它利用三维(3D)提升技术。一方面，在过完全(overcomplete)小波域内将3D提升结构用于部分精确(fractional-accuracy)运动补偿时域滤波。3D提升结构对于运动估计允许有不同的精度从而在弹性和效率之间提供了一种平衡，这是在不同的通道条件下的数据流的优点。

附图说明

为了更全面地理解本发明，可以结合相关附图，参考以下说明。

图1所示的是根据本发明一个实施例的实例视频发送系统；

图2所示的是根据本发明一个实施例的实例视频编码器；

图3A-3C所示的是根据本发明一个实施例的通过过完全小波展开生成实例参考帧的过程；

图4所示的是根据本发明一实施例的实例视频解码器；

图5所示的是根据本发明一实施例的实例运动补偿时域滤波；

图6A和6B所示的是根据本发明一实施例的实例小波分解；

图7所示的是根据本发明一实施例在过完全小波域内利用3D提升技术对视频信息进行编码的实例方法；

图8所示的是根据本发明一实施例在过完全小波域内利用3D提升技术对视频信息进行解码的实例方法。

具体实施方式

以下讨论的图1-8以及在此专利文件中描述的各个实施例都只是用来对本发明进行说明，而不应当被解释成以任何方式构成对本发明范围的限制。本领域的普通技术人员应当理解本发明的原理可以由任何适当设置的视频编码器、视频解码器或其它设备、器件或结构来实现。

图1表示依据本发明一实施例的实例视频发送系统100。在所示实施例中，系统100包括流送视频发送器102，流送视频接收器104，以及数据网106。在不背离本发明范围的情况下，也可以采用视频发送系统的其它实施方式。

流送视频发送器102将视频信息通过数据网106流送到流送视频接收器104中。流送视频发送器102也可以将音频或其它信息流送到流送视频接收器104。流送视频发送器102可以包括多种多样的视频帧源中的任何一种，包括数据网服务器，电视台发送器，有线网或台式个人计算机。

在所示实例中，流送视频发送器102包括视频帧源108，视频编码器110，编码缓冲器112，和存储器114。视频帧源108代表任何一种能够产生或提供一系列未压缩的视频帧的装置或结构，如电视天线和接收器单元，视频盒式磁带播放器，摄像机，或能够保存“素材”视频剪辑的盘存储装置。

未压缩的视频帧以给定的画面速率(或流送速率)进入到视频编码器110并由视频编码器110进行压缩。然后视频编码器110将压缩的视频帧发送给编码缓冲器112。视频编码器110代表任何一种适于对视频帧进行编码的编码器。按照某些实施方式，视频编码器110使用针对过完全小波域中的部分精确MCTF的3D提升技术。在附图2中给出了视频编码器110的一个例子，下面将对其进行介绍。

编码缓冲器112接收来自视频编码器110的压缩视频帧并缓存这些视频帧，以备通过数据网106进行发送。编码缓冲器112代表任何一种适于存储压缩视频帧的缓冲器。

流送视频接收器104接收由流送视频发送器102通过数据网106所流入的压缩视频帧。在所示实例中，流送视频接收器104包括解码缓冲器116，视频解码器118，视频显示器120，及存储器122。根据应用的要求，流送视频接收器104代表多种多样的视频帧接收器中的任何一种，包括电视接收器，台式个人计算机，或视频磁带录音机。解码缓冲器116存储通过数据网106接收到的压缩视频帧。然后，解码缓冲器116将压缩视频帧按要求发送给视频解码器118。解码缓冲器116可以是任何一种适于存储压缩视频帧的缓冲器。

视频解码器118对由视频编码器110压缩的视频帧进行解压缩。压缩的视频帧是可调整的，使得视频解码器118能够对部分或全部压缩视频帧进行解码。视频解码器118再将解压缩的帧传送给视频显示器120进行显示。视频解码器118代表任何一种适于对视频帧进行解码的解码器。按照某些实施方式，视频解码器118使用针对过完全小波域中的部分精度反向MCTF进行3D提升。视频解码器118的一个实例在图4中给出，下面将对其进行介绍。视频显示器120代表任何一种适于将视频帧显示给用户的装置或结构，如电视，PC显示屏，或投影仪。

按照某些实施方式，视频编码器110实现为由传统的数据处理器执行的软件程序，如标准的MPEG编码器。按照这些实施方式，视频编码器110包括多个计算机可执行的指令，如存储在存储器114中的指令。同样地，按照某些实施方式，将视频解码器118实现为由传统的数据处理器执行的软件程序，如标准的MPEG解码器。按照这些实施方式，视频解码器118包括多个计算机可执行的指令，如存储在存储器122中的指令。存储器114，122各自代表任何易失性或非易失性存储器以及一个检索装置或多个检索装置，如固定磁盘，可移动磁盘，CD，DVD，磁带，或视频盘。按照其它一些实施方式，视频编码器110和视频解码器118各自是以硬件、软件、固件或它们的任意组合的方式实现的。

数据网106使系统100的各个部分之间能够进行通信。例如，数据网106可以在网络地址或各部分之间传送网际协议(IP)信息包，帧中继帧，异步传输模式(ATM)单元或其它合适的信息。数据网106可包括一个或多个局域网(LAN)，城际网(MAN)，广域网(WAN)，全部或部分全球网(如因特网)，或任何其它位于一个或多个位置的通信系统。数据网106可以依据任何适当类型的协议或多个协议来运行，如以太网、IP、X.25、帧中继、或其它任何分组数据协议。

尽管图1所示的是视频发送系统100的一个实例，但是可以对图1的系统进行各种改变。例如，系统100可以包括任何数目的流送视频发送器102，流送视频接收器104以及网络106。

图2表示根据本发明一实施例的示例视频编码器110，图2所示的视频编码器110可以用于图1所示的视频发送系统100中。视频编码器110的其它实施例也可以用于视频发送系统100中。并且图2中所示的视频编码器110可以用在任何其它的适当的装置、结构或系统中，而不会超出本发明的范围。

在所示实例中，视频编码器110包括小波变换器202。小波变换器202接收未压缩的视频帧并将视频帧214从空间域变换到小波域。这种变换利用小波滤波从空间上将视频帧214分解成多个频段216a-216n，对应于该视频帧214的每个频段216都由一组小波系数来表示。小波变换器202利用任何合适的变换方式来将视频帧214分解成多个视频或小波频段216。按照某些实施方式，视频帧214被分解成第一分解级，包括低-低(LL)频段、低-高(LH)频段、高-低(HL)频段、高-高(HH)频段，这些频段中的一个或多个可以进一步地被分解为附加的分解级，如当将LL频段可进一步被分解成LLLL、LLLH、LLHL、LLHH子频段时。

小波频段216被提供给多个运动补偿时域滤波器(MCTF)204a-204n。MCTF 204对视频频段216进行时域滤波并去除帧214之间的时域相关性。例如，MCTF 204可以对视频频段216进行滤波并针对每个视频频段216生成高通帧和低通帧。

按照某些实施方式，帧组由MCTF 204进行处理。在特定实施例中，每个MCTF 204包括运动估计器和时域滤波器。MCTF 204中的运动估计器生成一个或多个运动向量，用于估计出当前视频帧和参考帧之间的运动量并产生一个或多个运动向量。MCTF 204中的时域滤波器利用该信息沿着运动方向对视频帧组进行时域滤波。按照其它的实施方式，MCTF 204可以由不受约束的运动补偿时域滤波器(UMCTF)所取代。

按照某些实施方式，运动估计器中的内插滤波器可以有不同的系数值。因为不同的频段216可以具有不同的时域相关性，这有助于提高MCTF 204的编码性能。此外，MCTF 204中可以使用不同的时域滤波器。按照某些实施方式，对较低频段216使用双向时域滤波器，对较高频段216仅使用前向时域滤波器。时域滤波器的选择可以基于使失真测量或复杂性测量最小的要求。时域滤波器可以代表任何合适的滤波器，如提升滤波器，它利用为每一频段216不同设计的预测和更新步骤来提高或最优化效率/复杂性局限。

此外，可以为每一频段216适应性地确定出组合在一起并由MCTF204所处理的帧数。按照某些实施方式，较低频段216具有较大的组合在一起的帧数，而较高频段具有较小的组合在一起的帧数。这使得，例如，每波段216组合在一起的帧的数量能够依据帧214序列的特性或复杂性或弹性的要求得到改变。而且，较高的空间频率频段216在长期的时域滤波过程中可以忽略不计。作为特殊的实例，LL，LH，HL和HH频段216中的帧可以分别放置在8，4和2帧的组中。这能够分别实现最大的分解级3，2和1。对每一频段216，时域分解级数可以利用任何适当的标准来确定，如帧内容，目标失真标准或针对每一频段216的期望时域可调整性的级别。另一特殊实例，LL，LH，HL，HH频段216中的每一个中的帧可以放置在8帧的组中。

如图2所示，MCTF 204在小波域中运算。在传统的编码器中，小波域中的运动估计和补偿一般来说效率很差。这是因为小波系数并非平移不变的(shift-invariant)。这种低效可以通过利用低频段平移(shifting)技术来克服。在所示实施例中，低频段平移器(shifter)206处理输入视频帧214，并生成一个或多个过完全小波展开(waveletexpansion)218。MCTF 204利用过完全小波展开218作为运动估计期间的参考帧。将过完全小波展开218作为参考帧使MCTF 204估计运动为变化的精确度。作为一个具体实例，MCTF 204可以对LL频段216采用1/16pel的精度来进行运动估计，对其它频段216采用1/8pel精度来进行运动估计。

按照某些实施方式，低频段平移器206通过对输入视频帧214的较低频段进行平移来生成过完全小波展开218。由低频段平移器206生成的过完全小波展开218如图3A-3C所示。在此例中，在特定空间位置上对应于同一分解级的各不相同的平移小波系数被称作“错相(cross phase)小波系数”。如图3A中所示，过完全小波展开218的每一相位都是通过对下一更小级LL频段的小波系数进行平移并进行一级小波分解来生成的。例如，小波系数302表示未进行平移时LL频段的系数。小波系数304表示LL频段进行(1，0)平移之后或右移一个位置之后的系数。小波系数306表示LL频段进行(0，1)平移或下移一个位置之后的系数。小波系数308表示LL频段进行(1，1)平移或右移一个位置并下移一个位置之后的系数。

图3A中的四组小波系数302-308经放大或组合后生成过完全小波展开218。图3B表示如何放大或组合小波系数302-308从而生成过完全小波展开218的一个例子。如图3B所示，对两组小波系数330，332进行交织从而产生一组过完全小波系数334。过完全小波系数334表示图3A中所示的过完全小波展开218。交织是这样进行的：过完全小波展开218中的新座标对应于原空间域中的相关的平移。此交织技术可以递归地用于每一分解级并能够对2D信号直接进行扩展。使用交织技术来生成过完全小波系数334能够实现视频编码器110和视频解码器118中的更佳或最佳子像素精度运动估计和补偿，这是因为它能够考虑相邻小波系数之间的错相从属关系。尽管图3B所示的是正在进行交织的两组系数330，332，但是任何数目的系数组都可以交织在一起从而形成过完全小波系数334，如四组小波系数。

低频段平移技术部分涉及生成如图3C所示的小波块。按照某些实施方式，在小波分解期间，给定划分比例下的系数(最高频带系数除外)可以与一组更细划分比例下的同样方位的系数相关联。在常规编码器中，通过将系数表示成称作小波树的数据结构来利用这种关系。在低频段平移技术中，对根部在最低频段中的每一小波树的系数进行重新排列，以形成如图3C所示的小波块350。其它系数同样地组合，以形成另外的小波块352，354。图3C中所示的小波块给出了该小波块中的小波系数之间的直接联系和这些系数在图象中在空间上代表什么。按照具体的实施方式，所有划分比例和方位下的相关系数都包括在每一小波块中。

按照某些实施方式，图3C所示的小波块在运动估计期间被MCTF204所使用。例如在运动估计期间。每个MCTF 204找出运动向量(dx，dy)，产生当前小波块和参考帧中的参考小波块之间的最小平均绝对差(MAD)。例如，如图3C中的第k个小波块的平均绝对差可以如下计算得出：

{MAD}_{k} (dx, dy) = Σ_{i = 1}^{3} Σ_{x_{i} = x_{i, k}}^{x_{i, k} + M / 2^{i}} Σ_{y_{i} = y_{i, k}}^{y_{i, k} + N / 2^{i}} {- - - (1)

| H L_{cur}^{(i)} (x_{i}, y_{i}) - LBS_H L_{ref}^{(i)} (2^{i} x_{i} + dx, 2^{i} y_{i} + dy) |

+ | L H_{cur}^{(i)} (x_{i}, y_{i}) - LBS_L H_{ref}^{(i)} (2^{i} x_{i} + dx, 2^{i} y_{i} + dy) |

+ | H H_{cur}^{(i)} (x_{i}, y_{i}) - LBS_H H_{ref}^{(i)} (2^{i} x_{i} + dx, 2^{i} y_{i} + dy) |}

+ Σ_{x_{i} = x_{3, k}}^{x_{3, k} + M / 2^{i}} Σ_{y_{i} = y_{3, k}}^{y_{3, k} + N / 2^{i}} | L L_{cur}^{(i)} (x_{i}, y_{i}) - LBS_L L_{ref}^{(i)} (2^{i} x_{i} + dx, 2^{i} y_{i} + dy) |

其中，例如，LBS_HL_ref ⁽¹⁾(x，y)表示使用如上所述的交织技术展开的参考帧的HL频段。即使当(d_x，d_y)是非整数值时，公式(1)也有效，而以前的低频段平移技术则不能。而且，按照具体的实施方式，利用这种采用小波块的编码方案不会导致任何运动向量溢出。

再回到图2，MCTF 204将已滤波的视频频段提供给嵌入式零填充编码(Bmbedded Zero Block Coding)(EZBC)编码器208中。EZBC编码器208对已滤波的视频频段进行分析，并识别出已滤波频段216内以及已滤波频段216之间的系数的相关性。EZBC编码器208利用此信息对已滤波频段216进行编码和压缩。作为一个具体实例，EZBC编码器208能够压缩由MCTF 204生成的高通帧和低通帧。

MCTF 204还将运动向量提供给运动向量编码器210。运动向量表示在提供给视频编码器110的视频帧214序列中检测出的运动。运动向量编码器210对MCTF 204所生成的运动向量进行编码。运动向量编码器210利用任何合适的编码技术，比如基于纹理的编码技术，象DCT编码。

总之，EZBC编码器208所产生的经过压缩并经过滤波的频段216以及运动向量编码器210所产生的压缩的运动向量代表输入视频帧214。多路复用器212接收压缩和滤波过的频段216以及压缩的运动向量并将其多路复用到单独一个输出位流220上。然后，位流220由流送视频发送器通过数据网106发送到流送视频接收器104上。

图4表示根据本发明一实施例的视频解码器118的一个实例。图4中所示的视频解码器118可以用在图1所示的视频发送系统100中。视频解码器118的其它实施例也可以用在视频发送系统100中，并且图4中所示的视频解码器118可以用在任何其它合适的装置、结构或系统上，而不会超出本发明的范围。

总地来说，视频解码器118进行由图2中视频编码器110所完成功能的反向功能，对由编码器110进行编码的视频帧214进行解码。在所示实例中，视频解码器118包括多路分用器402。多路分用器402接收视频编码器110产生的位流220。多路分用器402对位流220进行多路分用，并分离出编码视频频段和编码运动向量。

编码视频频段提供给EZBC解码器404。EZBC解码器404对由EZBC编码器208进行编码的视频频段进行解码。例如，EZBC解码器404执行EZBC编码器208所用的编码技术的反向的技术从而还原视频频段。作为一个具体实例，编码的视频频段代表经过压缩的高通帧和低通帧，EZBC解码器404可对高通和低通帧进行解压缩。同样地，运动向量提供给了运动向量解码器406。运动向量解码器406通过执行运动向量编码器210所用的编码技术的反向技术来解码和还原运动向量。

还原的视频频段416a-416n以及运动向量提供给多个反向运动补偿时域滤波器(反向MCTF)408a-408n。该反向MCTF408处理并还原视频频段416a-416n。例如，反向MCTF 408可以进行时域合成，与由MCTF 204所完成的时域滤波的效果相反。反向MCTF 408还能够进行运动补偿以便将运动再次引入到视频频段416中。特别地，反向MCTF 408还可以处理由MCTF204所生成的高通和低通帧从而还原视频频段416。在其它实施例中，反向MCTF 408可由反向UMCTF所代替。

还原的视频频段416再提供给反向小波变换器410。反向小波变换器410实现变换功能，从而将视频频段416从小波域变换回到空间域。取决于，例如，在位流220中接收到的信息量以及视频解码器118的处理能力，反向小波变换器410可以产生一个或多个不同的还原视频信号组414a-414c。按照某些实施方式，还原的视频信号414a-414c有不同的分辨率。例如第一还原视频信号414a具有一低分辨率，第二还原视频信号414b有中分辨率，第三还原视频信号414c具有高分辨率。这样，在系统100中，可以使用具有不同的处理能力或不同的带宽接入的不同类型的流送视频接收器104。

还原的视频信号414提供给低频段平移器412。如上所述，视频编码器110利用一个或多个过完全小波展开218来处理输入视频帧214。视频解码器118利用在还原的视频信号414中的以前还原的视频帧生成同样的或基本同样的过完全小波展开418。然后将过完全小波展开418提供给反向MCTF408用于对视频频段416进行解码。

尽管图2-4所示出的是视频编码器、过完全小波展开、及视频解码器的实例，但也可以对图2-4作各种改变。例如，视频编码器110可以包括任何数目的MCTF 204，视频解码器118可以包括任何数目的反向MCTF 408。而且，视频编码器110和视频解码器118可以使用任何其它的过完全小波展开。此外，视频解码器118中的反向小波变换器410能够产生具有任何数目分辨率的还原视频信号414。作为具体实例，视频解码器118能够产生n组还原视频信号414，其中n表示视频频段416的数目。

图5表示根据本发明一实施例的示例运动补偿时域滤波。此运动补偿时域滤波可以，例如，由图2的视频编码器110中的MCTF 204或由其它任何合适的视频编码器来完成。

如图5中所示，运动补偿时域滤波包括从前一视频帧A到当前视频帧B的运动估计。在时域滤波期间，视频帧中的某些象素502可以被参考多次或者从未被参考。这归因于，例如，视频帧中包含的运动以及图象中对象的覆盖或未覆盖。这些象素502一般被称作“未连接象素”；而被参考过一次的象素504一般被称作“连接象素”。在典型的编码系统中，视频帧中存在未连接象素需要特殊的处理，这降低了编码效率。

为了提高运动估计的质量，利用3D提升方案采用子-象素精确运动估计，该方案能够实现更为精确或甚至完美的压缩视频帧重建。当在视频编码器110中使用空间域MCTF时，如果运动向量具有子象素精度，则提升方案利用以下公式(2)和(3)为视频帧生成高通帧(H)和低通帧(L)：

H [m, n] = (B [m, m] - \tilde{A} [m - d_{m}, n - d_{n}]) / \sqrt{2} - - - (2)

L [m - {\overset{&OverBar;}{d}}_{m}, n - {\overset{&OverBar;}{d}}_{n}] = \tilde{H} [m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] + \sqrt{2} A [m - {\overset{&OverBar;}{d}}_{m}, n - {\overset{&OverBar;}{d}}_{n}] - - - (3)

其中A代表前一视频帧，B代表当前视频帧。

代表在A视频帧中位置(x，y)处的内插象素值；B(m，n)代表在B视频帧中位置(m，n)处的象素值。(dm，dn)代表子象素精度运动向量，( d_m， d_n)代表最接近整数值格构(lattice)的近似值。

在视频解码器118中，利用以下公式从L和H重建前一视频帧A：

A [m - {\overset{&OverBar;}{d}}_{m}, n - {\overset{&OverBar;}{d}}_{n}] = (L [m - {\overset{&OverBar;}{d}}_{m}, n - {\overset{&OverBar;}{d}}_{n}] - \tilde{H} [m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}]) / \sqrt{2} . - - - (4)

在已重建前一视频帧A之后，利用以下公式重建当前视频帧B：

B [m, n] = \sqrt{2} H [m, n] + \tilde{A} [m - d_{m}, n - d_{n}] - - - (5)

在此例中，对当前帧B中的未连接象素如公式(2)所示的那样进行处理，而前一帧A中的未连接象素进行如下处理：

L [m, n] = \sqrt{2} A [m, n] . - - - (6)

在视频编码器110的小波域中使用过完全小波展开218要求在MCTF 204的运动估计器中有内插滤波器，这样就能够在小波域中对每一视频频段216进行子象素运动估计。按照某些实施方式，这些内插滤波器从视频频段216内的相邻点以及从其它频段216的相邻点对象素进行卷积(convolute)。

例如，图6A表示小波分解的实例，其中在单独一个分解级内，将视频帧600分解成四个小波频段216。由修正公式(2)-(6)能够生成过完全小波域的提升结构。例如，通过简单地扩展公式(2)，第j分解级的高通帧可以表示如下：

H_{j}^{i} [m, n] = (B_{j}^{i} [m, n] - \tilde{A_{j}^{i}} [m - d_{j}^{i} (m), n - d_{j}^{i} (n)]) / \sqrt{2}, i = 0, \dots, 3 - - - (7)

其中dⁱ _j(m)＝d_m/2ⁱ，dⁱ _j(n)＝d_n/2^j，并且(d_m，d_n)代表空间域中的运动向量。不过，公式(7)中Aⁱ _j帧的内插可能不是最优的，因为它不包括错相小波系数的相关性。利用上述的交织技术，第j分解级更为优化的高通帧可以表示如下：

H_{j}^{i} [m, n] = (B_{j}^{i} [m, n] - LBS_\tilde{A_{j}^{i}} [2^{j} m - d_{m}, 2^{j} n - d_{n}]) / \sqrt{2}, i = 0, \dots, 3 - - - (8)

其中LBS_Aⁱ _j代表交织的过完全小波系数，且

LBS_\tilde{A_{j}^{i}} [2^{j} m - d_{m}, 2^{j} n - d_{n}]

代表其在位置[2^jm-d_m，2^jn-d_n]处的内插象素值。交织完成之后，内插操作代表相邻小波系数的简单的空间域内插。

类似地，低通滤波帧可表示如下：

L_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)] = LBS_{\tilde{H}}_{j}^{i} [2^{j} m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] - - - (9)

+ \sqrt{2} A_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)], i = 0, . ., 3

其中dⁱ _j(m)＝d_m/2^j，dⁱ _j(n)＝d_n/2^j，并且LBS_Hⁱ _j代表Hⁱ _j帧交织的过完全小波系数。

在解码器端，可以利用以下公式进行重建：

A_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)] = L_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)] / \sqrt{2} - - - - (10)

LBS_{\tilde{H}}_{j}^{i} [2^{j} m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] / \sqrt{2}

B_{j}^{i} [m, n] = \sqrt{2} H_{j}^{i} [m, n] + LBS_\tilde{A_{j}^{i}} [2^{j} m - d_{m}, 2^{j} n - d_{n}] . - - - (11)

按照某些实施方式，当视频编码器110和视频解码器118使用同样的子象素内插技术时，不管编码器110用的是何种内插技术，在视频解码器118上都能够得到完美的重建。在此例中，当前帧B中未连接象素按照公式(9)所示那样进行处理，而前一帧A中的未连接象素由下述公式进行处理：

L_{j}^{i} [m, n] = \sqrt{2} A_{j}^{i} [m, n] .

公式(9)使用内插的高通帧来获得低通帧。结果，按照某些实施方式，在同一分解级上的四个时域高通帧Hⁱ _j，i＝0，..，3利用公式(8)来生成。此后，利用根据公式(9)的时域高通帧生成四个低通帧Lⁱ _j，i＝0，..，3。

由视频编码器110和视频解码器118处理的视频帧可以具有一个以上分解级。例如，图6B表示了示例小波分解，其中视频帧650被分解成两个分解级。在此例中，A₁ ⁰频段被分解成多个子频段A₂ ^j，j＝0，..，3。对于该或其它具有多个分解级的视频帧，从最低分辨率的图象开始，递归地执行实现提升结构的公式(8)-(11)。换句话说，对频段A10中的子频段A₂ ^j，j＝0，..，3执行一次公式(8)-(11)。一旦完成，对于频段A₁ ^j，j＝0，..，3再次执行公式(8)-(11)。

总而言之，在视频编码器110中，用于具有L个分解级的视频帧的3D提升算法表示如下：

H_{L}^{0} [m, n] = (B_{L}^{0} [m, n] - LBS_{\tilde{A}}_{L}^{0} [2^{L} m - d_{m}, 2^{L} n - d_{n}]) / \sqrt{2}

L_{L}^{0} [m - {\overset{&OverBar;}{d}}_{L}^{0} (m), n - {\overset{&OverBar;}{d}}_{L}^{0} (n)] = LBS_{\tilde{H}}_{L}^{0} [2^{L} m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] +

\sqrt{2} A_{L}^{0} [m - {\overset{&OverBar;}{d}}_{L}^{0} (m), n - {\overset{&OverBar;}{d}}_{L}^{0} (n)]

对于j＝L:1

对于i＝1:3

H_{j}^{i} [m, n] = (B_{j}^{i} [m, n] - LBS_{\tilde{A}}_{j}^{i} [2^{j} m - d_{m}, 2^{j} n - d_{n}]) / \sqrt{2}

结束

对于i＝1:3

L_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)] = LBS_\tilde{H_{j}^{i}} [2^{j} m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] +

\sqrt{2} A_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)]

结束

由A_j ⁱ，i＝0，...，3重构A_j-1 ⁰

由H_j ⁱ，i＝0，...，3重构H_j-1 ⁰

结束

类似地，在视频解码器118上，对于具有L个分解级的视频帧，

其3D提升算法表示如下：

A_{L}^{0} [m - {\overset{&OverBar;}{d}}_{L}^{0} (m), n - {\overset{&OverBar;}{d}}_{L}^{0} (n)] = L_{L}^{0} [m - {\overset{&OverBar;}{d}}_{L}^{0} (m), n - {\overset{&OverBar;}{d}}_{L}^{0} (n)] / \sqrt{2}

- LBS_{\tilde{H}}_{L}^{0} [2^{L} m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] / \sqrt{2}

B_{L}^{0} [m, n] = \sqrt{2} H_{L}^{0} [m, n] + LBS_\tilde{A_{L}^{0}} [2^{L} m - d_{m}, 2^{L} n - d_{n}]

对于j＝L:1

对于i＝1:3

A_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)] = L_{j}^{i} [m - {\overset{&OverBar;}{d}}_{j}^{i} (m), n - {\overset{&OverBar;}{d}}_{j}^{i} (n)] / \sqrt{2}

- LBS_\tilde{H_{j}^{i}} [2^{j} m - {\overset{&OverBar;}{d}}_{m} + d_{m}, n - {\overset{&OverBar;}{d}}_{n} + d_{n}] / \sqrt{2}

结束

对于i＝1:3

B_{j}^{i} [m, n] = \sqrt{2} H_{j}^{i} [m, n] + LBS_{\tilde{A}}_{j}^{i} [2^{j} m - d_{m}, 2^{j} n - d_{n}] .

结束

由A_j ⁱ，i＝0，...，3重构A_j-1 ⁰

由H_j ⁱ，i＝0，...，3重构H_j-1 ⁰

结束

正如在此概括和在上述公式(8)-(11)中的所示出的，如果在从视频编码器110到视频解码器118的传输期间，某一分解级的一个频段遭到破坏或丢失，那么在解码器118上重建的视频帧会带来错误。这是因为公式(8)-(11)在视频解码器118上不会产生如其在视频帧编码器110上产生的参考值相同的参考值。为了提供错误弹性，在未平移下一更细等级的子频段时，便从相应的子频段(如A_j ⁱ)生成扩展的参考(如LBS_A_j ⁱ)。如此可以提高系统100的健壮性(robustness)并使视频编码器110和解码器118的复杂程度更低。

图7表示根据本发明一实施例在过完全小波域中利用3D提升技术对视频信息进行编码的示例方法700。下面针对在图1的系统100中操作的图2的视频编码器110来描述方法700。该方法700可以由任何其它合适的编码器使用并且可以用在任何其它合适的系统当中。

在步骤702，视频编码器110接收视频输入信号。这可以包括，例如，视频编码器110从视频帧源108接收多个视频数据帧。

在步骤704中，视频编码器110将每一视频帧分为频段，这可以包括，例如，小波变换器202对视频帧进行处理并将其分为n个不同的频段216。小波变换器202能够将帧分解为一个或多个分解级。

在步骤706，视频编码器110生成视频帧的一个或多个过完全小波展开。这可以包括，例如，低频段平移器206接收视频帧，识别出视频帧的较低频段，对较低频段进行不同量的平移，并一起扩充较低频段以生成过完全小波展开。

在步骤708中，视频编码器110压缩视频帧的基本层。这可以包括，例如，MCTF 204a处理最低分辨率的小波频段216a并生成高通帧H_L ⁰和低通帧L_L ⁰。

在步骤710中，视频编码器110压缩视频帧的增强层。这可以包括，例如，余下的MCTF 204b-204n接收余下的视频频段216b-216n。这还可以包括余下的MCTF 204利用公式(8)在最低分解级生成余下的时域高通帧，之后利用公式(9)在此分解级生成余下的时域低通帧。这还可以包括MCTF 204为任何其它分解级生成另外的高通帧和低通帧。此外，这可以包括MCTF 204生成识别视频帧中的运动的运动向量。

在步骤712中，视频编码器110对经滤波的视频频段进行编码。这可以包括EZBC编码器208从MCTF 204接收经滤波的视频频段216，如高通帧和低通帧，并压缩经滤波的频段216。在步骤714中，视频编码器110对运动向量进行编码。这可以包括，例如，运动向量编码器210接收由MCTF 204生成的运动向量，并压缩运动向量。在步骤716中，视频编码器110生成输出位流。这可以包括，例如，多路复用器212接收压缩的视频频段216和压缩的运动向量，并将它们多路复用到位流220上。在此处视频编码器110可采用任何适当的行为，如将位流传送给缓冲器，以通过数据网106进行传输。

尽管图7给出了在过完全小波域中利用3D提升技术对视频信息进行编码的方法700的一个例子，但还可以对图7作出各种改变。例如，图7中所示的各个步骤都可以在视频编码器110中并行执行，如步骤704和步骤706。而且，视频编码器110在编码过程中能够多次生成过完全小波展开，如对由编码器110处理的每组视频帧生成一次。

图8表示根据本发明一实施例在过完全小波域中利用3D提升对视频信息进行解码的示例方法800。下面针对在图1的系统100中操作的图4的视频解码器118来介绍方法800。该方法800可以由任何其它合适的编码器使用并且可以用在任何其它合适的系统当中。

在步骤802，视频解码器118接收视频位流。这可以包括，例如，视频解码器118通过数据网106接收位流。

在步骤804中，视频解码器118分离出位流中的编码视频频段和编码运动向量。这可以包括，例如，多路复用器402分离出视频频段和运动向量并将它们发送到视频解码器118中的不同部分。

在步骤806，视频解码器118对视频频段进行解码。这可以包括，例如，EZBC解码器404对视频频段进行反向操作从而对由EZBC编码器208完成的编码进行反向操作。在步骤808中，视频解码器118对运动向量进行解码。这可以包括，例如，运动向量解码器406对运动向量进行反向操作，从而对运动向量编码器210完成的编码操作进行反向操作。

在步骤810中，视频解码器118解压缩视频帧的基本层。这可以包括，例如，反向MCTF 408a利用高通帧H_L ⁰和低通帧L_L ⁰对前面和当前视频帧的最低分辨率频段416进行处理。

在步骤812中，视频解码器118对视频帧的增强层(如果可能)进行解压缩。这可以包括，例如，反向MCTF 408接收余下的视频频段416b-416n。这还可以包括反向MCTF 408还原一个分解级上的前一帧的剩余频段，之后再还原此分解级上的当前帧的剩余频段。这可以进一步包括反向MCTF 408对任何其它分解级还原视频帧。

在步骤814中，视频解码器118对还原的视频频段416进行变换。这可以包括，例如，反向小波变换器410将视频频段416从小波域变换到空间域。这还可以包括反向小波变换器410生成一组或多组还原信号414，其中不同的还原信号组414有不同的分辨率。

在步骤816中，视频解码器118产生还原信号414中的还原视频帧的一个或多个过完全小波展开。这可以包括，例如，低频段平移器412接收视频帧，识别出视频帧的较低频段，将较低频段平移不同的量，并扩充较低的频段。该过完全小波展开再提供给反向MCTF 408用于对其它的视频信息进行解码。

尽管图8给出了在过完全小波域中利用3D提升技术对视频信息进行解码的方法800，但还可以对图8作出各种改变。例如，图8中所示的各个步骤都可以在视频解码器118中并行执行，如步骤806和步骤808。此外，视频解码器118在解码过程中能够多次生成过完全小波展开，如对由解码器118解码的每组视频帧生成一次。

对于本专利文献中所使用的特定词和短语给出定义是比较有利的。术语“包括”、“包含”以及由其派生的相关词语意味着包含而不是限制。术语“或”是包含的，意味着和/或；短语“相关”以及“与其相关”以及由其派生的词语也意味着包括、被包括在其中、与其相连接、包含、被包含在其中、连接到或连接在一起、耦合到或耦合在一起、相通、相配合、交织、并列、靠近、连接到或连接在一起、具有、具有..性能、等等；在此专利文献中给出了某些词和短语的定义。本领域的普通技术人员应当理解，在许多但也许不是大多数情况下，这种定义都适用于现在以及将来使用这些被定义的词和短语。

本发明已描述了一些实施例和通常的相关方法，这些实施例及方法的变换及改变对于本领域的普通技术人员来说是显而易见的。因此，上述实施例的描述并不限定或限制本发明。在不背离如在后权利要求所限定的本发明实质和范围的情况下，其它的改变、替代以及变换也是可能的。

Claims

1、一种用于压缩视频帧的输入流(214)的方法(700)，包括：

将多个视频帧中的每一视频帧变换成一个或多个分解级中的多个小波频段；

对至少一部分小波频段进行运动补偿时域滤波，生成多个高通帧和多个低通帧，每一分解级上的低通帧是使用该分解级上的高通帧生成的；且

压缩高通帧和低通帧，以通过网络(106)进行传输。

2、权利要求1的方法(700)，进一步包括：

生成一个或多个在运动补偿时域滤波期间所用的过完全小波展开；

在运动补偿时域滤波期间生成一个或多个运动向量；

对所述一个或多个运动向量进行压缩；且

将压缩的高通帧、低通帧以及一个或多个运动向量多路复用到输出位流(220)上。

3、权利要求1的方法(700)，进一步包括通过下述步骤生成过完全小波展开：

平移特定一个小波频段多次，以产生多个平移的小波频段，平移的小波频段每一个都进行不同的平移；且

对特定小波频段中的小波系数和每一个平移的小波频段中的小波系数进行交织，以产生一组过完全小波系数来表示过完全小波展开。

4、一种用于解压缩视频位流(220)的方法(800)，包括：

接收包括多个压缩高通帧和低通帧的视频位流(220)；

对压缩高通帧和低通帧进行解压缩；

对至少一部分解压缩的高通帧和低通帧进行反向运动补偿时域滤波，以生成多个与视频帧相关的小波频段，这些小波频段与一个或多个分解级相关，这些小波频段是从最低分解级开始产生的，并且

将小波频段变换成一个或多个还原的视频帧。

5、权利要求4的方法(800)，进一步包括：

从位流(220)多路分用出一个或多个压缩运动向量以及压缩高通帧和低通帧；

对一个或多个压缩运动向量进行解压缩，所述一个或多个运动向量在反向运动补偿时域滤波期间使用；

生成一个或多个过完全小波展开，所述一个或多个过完全小波展开在反向运动补偿时域滤波期间使用。

6、权利要求4的方法(800)，进一步包括通过下述步骤生成过完全小波展开：

7、一种用于压缩视频帧输入流(214)的视频编码器(110)，包括：

小波变换器(202)，能够进行这样的操作：在一个或多个分解级上将多个视频帧的每个视频帧变换成多个小波频段；

多个运动补偿时域滤波器(204)，能够进行这样的操作：处理至少一部分小波频段并生成多个高通帧和多个低通帧，每个分解级上的低通帧是利用该分解级上的高通帧生成的；并且

编码器(208)，能够进行这样的操作：压缩高通帧和低通帧以通过网络(106)进行传输。

8、权利要求7所述的视频编码器(110)，进一步包括：

低频段平移器(206)，能够进行这样的操作：生成一个或多个由运动补偿时域滤波器(204)使用的过完全小波展开，运动补偿时域滤波器(204)进一步能够进行生成一个或多个运动向量的操作；

第二编码器(210)，能够进行压缩一个或多个运动向量的操作；以及

多路复用器(212)，能够进行这样的操作：将压缩高通帧、低通帧和一个或多个运动向量多路复用到输出位流(220)上。

9、权利要求8所述的视频编码器(110)，其中低频段平移器(206)通过如下所述生成过完全小波展开：

10、一种用于解压缩视频位流(220)的视频解码器(118)，包括：

解码器(404)，能够进行这样的操作：对包含在位流(220)中多个压缩高通帧和低通帧进行解压缩；

多个反向运动补偿时域滤波器(408)，能够进行这样的操作：处理至少一部分解压缩高通帧和低通帧以生成多个与视频帧相关的小波频段，这些小波频段与一个或多个分解级相关，这些小波频段是在最低分解级开始产生的，和

小波变换器(410)，能够进行将小波频段变换成一个或多个还原视频帧的操作。

11、权利要求10所述的视频解码器(118)，进一步包括：

多路分用器(402)，能够进行这样的操作：从位流中多路分用出一个或多个压缩运动向量和压缩高通帧以及低通帧；

第二解码器(406)，能够进行对一个或多个压缩运动向量进行解压缩的操作，反向运动补偿时域滤波器(408)能够进行利用一个或多个运动向量生成小波频段的操作；和

低频段平移器(412)，能够进行生成一个或多个过完全小波展开的操作，所述一个或多个过完全小波展开由反向运动补偿时域滤波器(408)使用。

12、权利要求11所述的视频解码器(118)，其中低频段平移器(412)通过如下所述生成过完全小波展开：

13、视频发送器(102)，包括：

视频帧源(108)，能够进行提供视频帧流的操作；

视频编码器(110)，能够进行压缩视频帧的操作，视频发送器(102)包括：

小波变换器(202)，能够进行在一个或多个分解级上将每个视频帧变换成多个小波频段的操作；

多个运动补偿时域滤波器(204)，能够进行处理至少一部分小波频段并生成多个高通帧和多个低通帧的操作，每个分解级上的低通帧是利用该分解级上的高通帧生成的；和

编码器(208)，能够进行压缩高通帧和低通帧的操作；和

缓冲器(112)，能够进行接收和存储压缩视频帧以通过网络(106)进行传输的操作。

14、权利要求13的视频发送器(102)，其中视频编码器(110)进一步包括能够进行生成由运动补偿时域滤波器(204)使用的一个或多个过完全小波展开的操作的低频段平移器(206)，其中低频段平移器(206)能够通过如下所述进行生成过完全小波展开的操作：

15、视频接收器(104)，包括：

缓冲器(116)，能够进行接收并存储视频位流的操作；

视频解码器(118)，能够进行解压缩视频位流并生成还原视频帧的操作，视频解码器(118)包括：

解码器(404)，能够进行对包含在位流(220)中多个压缩高通帧和低通帧进行解压缩的操作；

多个反向运动补偿时域滤波器(408)，能够进行处理至少一部分解压缩高通帧和低通帧以生成多个与视频帧相关的小波频段的操作，所述小波频段与一个或多个分解级相关，所述小波频段是自最低分解级开始产生的，和

小波变换器(410)，能够进行将小波频段变换成一个或多个还原视频帧的操作；

视频显示器(120)，能够进行显示还原视频帧的操作。

16、权利要求15的视频接收器(118)，其中视频解码器(118)进一步包括能够进行生成由反向运动补偿时域滤波器(408)使用的一个或多个过完全小波展开的操作的低频段平移器(412)，其中低频段平移器(412)能够通过如下所述进行生成过完全小波展开的操作：

平移特定一个小波频段多次，以产生多个平移的小波频段，平移的小波频段每一个都发生不同的平移；且

17、一种具体实现在计算机可读介质上并能够进行由处理器执行的操作的计算机程序，该计算机程序包括用于下述用途的计算机可读程序代码：

将多个视频帧的每一视频帧变换成一个或多个分解级中的多个小波频段；

对至少一部分小波频段进行运动补偿时域滤波，以生成多个高通帧和多个低通帧，每一分解级上的低通帧是使用该分解级上的高通帧生成的；且

压缩高通帧和低通帧，以通过数据网(106)进行发送。

18、一种具体实现在计算机可读介质上并能够进行由处理器执行的操作的计算机程序，该计算机程序包括实现下述功能的计算机可读程序代码：

对包含在视频位流(220)中的多个压缩高通帧和低通帧进行解压缩；

对至少一部分解压缩高通帧和低通帧进行反向运动补偿时域滤波，以生成多个与视频帧相关的小波频段，所述小波频段与一个或多个分解级相关，所述小波频段是自最低分解级开始产生的，并且

将小波频段变换成一个或多个还原视频帧。

19、一种由以下步骤产生的可传输视频信号，

压缩高通帧和低通帧，以通过数据网(106)进行发送。

20、权利要求19的视频接收器，其中低频段平移器通过如下所述生成过完全小波展开：

21、一种具体实现在计算机可读介质上并能够进行由处理器执行的操作的计算机程序，该计算机程序包括实现如下功能的计算机可读程序代码：

对至少一部分小波频段上进行运动补偿时域滤波，以生成多个高通帧和多个低通帧，每一分解级上的低通帧是使用该分解级上的高通帧生成的；且

压缩高通帧和低通帧，以通过数据网进行传输。

22、权利要求21的计算机程序，进一步包括计算机可读程序代码，用于：

在运动补偿时域滤波期间生成一个或多个运动向量；

对所述一个或多个运动向量进行压缩；且

将压缩高通帧、低通帧以及一个或多个运动向量多路复用到输出位流上。

23、权利要求22的计算机程序，其中用于生成一个或多个过完全小波展开的计算机可读程序代码包括实现如下功能的计算机可读程序代码：

24、一种具体实现在计算机可读介质上并能够进行由处理器执行的操作的计算机程序，该计算机程序包括实现下述功能的计算机可读程序代码：

对与多个视频帧相关的多个压缩高通帧和低通帧进行解压缩；

对至少一部分解压缩高通帧和低通帧上进行反向运动补偿时域滤波，以生成多个与视频帧相关的小波频段，所述小波频段与一个或多个分解级相关，所述小波频段是自最低分解级开始产生的，并且

将小波频段变换成一个或多个还原视频帧。

25、权利要求24所述的计算机程序，进一步包括计算机可读程序代码，用于：

从位流上多路分用出一个或多个压缩运动向量以及压缩高通帧和低通帧；

对一个或多个压缩的运动向量进行解压缩，所述一个或多个运动向量是在反向运动补偿时域滤波期间使用的；

26、权利要求25所述的计算机程序，其中用于生成一个或多个过完全小波展开的计算机可读程序代码包括实现如下功能的计算机可读程序代码：

27、一种通过下述步骤产生的可传输视频信号，

压缩高通帧和低通帧，以通过数据网进行传输。