[go: up one dir, main page]

CN1669328A - 三维小波视频编码和解码方法以及相应的设备 - Google Patents

三维小波视频编码和解码方法以及相应的设备 Download PDF

Info

Publication number
CN1669328A
CN1669328A CN03816840.5A CN03816840A CN1669328A CN 1669328 A CN1669328 A CN 1669328A CN 03816840 A CN03816840 A CN 03816840A CN 1669328 A CN1669328 A CN 1669328A
Authority
CN
China
Prior art keywords
sub
gof
subbands
temporal
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN03816840.5A
Other languages
English (en)
Inventor
A·伯格
E·巴尔劳
M·贝内蒂雷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of CN1669328A publication Critical patent/CN1669328A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明涉及一种三维(3D)视频编码方法,它应用到对应于原始视频序列的比特流上,所述原始视频序列已经分为连续的帧组(GOF)。该编码方法首先对每个连续的GOF应用一个时空分析步骤,其本身包括一个运动估计子步骤、一个运动补偿的时间滤波子步骤和一个空间分析子步骤,然后在从时空分析步骤产生的所述低和高频率时间子带上和通过所述运动估计步骤获得的运动向量上执行一个编码步骤,其本身包括一个熵编码子步骤,以及应用到这样获得的所述编码序列的一个算术编码子步骤。根据本发明,在分析步骤结束时可获得的频率子带按照与它们原始顺序的帧对的重建相对应的顺序进行编码,解码第一帧对所需的比特位于编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到最后一个帧对。

Description

三维小波视频编码和解码方法以及相应的设备
技术领域
本发明总的涉及视频压缩和解压缩的领域,并尤其涉及用于对相应于原始视频序列的比特流进行压缩的视频编码方法,所述原始视频序列已经分为连续的多组帧(GOF),其大小为N=2n,其中n=1,或2,或3,...,所述编码方法包括以下步骤,这些步骤应用到该序列的每个连续的GOF:
a)一个时空分析步骤,把当前的GOF时空多分辨率分解成为2n个低和高频时间子带,所述步骤本身包括以下子步骤:
- 一个运动估计子步骤;
- 一个运动补偿的时间滤波子步骤,根据所述的运动估计,在当前GOF的2n-1对帧的每一个上执行;
- 一个空间分析子步骤,在从所述时间滤波子步骤产生的子带上执行;
b)一个编码步骤,所述步骤本身包括:
- 一个熵编码子步骤,在从时空分析步骤产生的所述低和高频时间子带上和通过所述运动估计步骤获得的运动向量上执行;
- 一个算术编码子步骤,应用到这样获得的所述编码序列并传送一个嵌入的编码后的比特流。
本发明也涉及一种相应的编码设备,通过这样的编码方法产生的可发送视频信号,用于解码所述信号的方法和用于执行所述解码方法的解码设备。
背景技术
从MPEG-1到H.264,标准视频压缩方案是基于所谓的混合解决方案(一个混合视频编码器使用一个预测方案,其中输入视频序列的每个帧从一个给定参考帧时间预测,并且通过所述帧和它的预测之间的差获得预测误差进行空间变换,例如通过一个二维DCT变换,从而有效利用空间冗余)。在以后提出的一种不同的方案包括将一组帧(GOF)作为一个三维(3D或2D+t)结构进行处理并对它进行时空滤波从而把能量集中在低频(例如在C.I.podilchuk等撰写的“Three-dimensional subband coding of video”中所描述的,它发表在IEEETransactions on Image Processing,Vol.4,No2,1995年2月,125-139页)。而且,在这样的3D子带分解方案中运动补偿步骤的引入改善了整体的编码效率并产生视频信号的时空多分辨率(分级)表示,这归功于图1所述的子带树。
所述图1所示的具有运动补偿的3D小波分解同样应用于连续的帧组(GOF)。输入视频的每个GOF,即包括在所述情况中的八个帧F1到F8,首先进行第一运动补偿(MC),从而处理具有大运动的序列,随后使用Haar小波进行时间滤波(TF)(虚线箭头对应于高通时间滤波,而其他的对应于低通时间滤波)。分解的三个连续阶段被示出(L和H=第一阶段;LL和LH=第二阶段;LLL和LLH=第三阶段)。每个时间层的高频子带(以上例子中的H、LH和LLH)和最深的一个(LLL)的低频子带通过一个小波滤波器进行空间分析。一个熵编码器接着编码从时空分解产生的小波系数(例如,通过2D-SPIHT的一个扩展成为现在的3D小波分解,从而相对于时空分解结构有效编码最后的系数位平面,这最初由A.Said和W.A.Pearlman在“A new,fast,and efficientimage codec based on set partitioning in hierarchical trees”中提出,它发表在IEEE Transactions on Circuits and Systems for VideoTechnology,Vol.6,No3,1996年6月,243-250页)。
但是,所有的3D子带解决方案都有以下缺点:因为同时处理整个GOF,当前GOF中的所有图像必须在进行时空分析和编码之前存储。在解码器一侧问题是一样的,一个给定的GOF的所有帧被一起解码.对所述问题的一个解决方案在2002年6月28日提出申请的欧洲专利申请中进行了说明,其登记号为02291621.7(PHFR020065)。在所述文件中,提出的低存储解决方案基于以下的说明,该方案中执行序列的一个GOF的帧的渐次的一个分支一个分支的重建,而不是同时进行整个GOF的重建。如图2所示(为了对图进行简化,假设为八帧的GOF的情况),所述帧F1到F8分组为四对帧C0到C3。在原始序列的时间分解的第一步骤结束时,可获得低频时间子带L0,L1,L2,L3和高频时间子带H0,H1,H2,H3。在子带H0到H3进行编码和发送的同时,子带L0到L3进一步分解:在该分解的第二步骤结束时,可获得低频时间子带LL0,LL1和高频时间子带LH0,LH1。同样,在子带LH0、LH1被编码和发送的同时,子带LL0和LL1进一步分解,并且在分解的第三步骤结束时(图示情况的最后一个),可获得并将编码和发送一个低频时间子带LLL0和高频时间子带LLH0。在图2中整组发送子带由黑线包围。
很显然,只需要子带H0、LH0、LLH0和LLL0来解码GOF的头两帧F1,F2(即,对C0)。而且,第一子带H0只在这头两个帧F1、F2中包含一些信息。所以,一旦这些帧F1、F2被解码,第一子带H0就变得无用了并且能够被删除和取代:现在就载入下一个子带H1从而解码包含两个帧F3、F4的下一个对C1。现在只需要子带H1、LH0、LLL0和LLH0来解码这些帧F3、F4,如前面对H0进行的一样,子带H1只在这两帧F3、F4上包含一些信息。所以,一旦这两帧F3、F4被解码,第二子带H1就能够被删除并由H2取代。以此类推:这些操作对F5、F6和F7、F8重复(在通常情况下,对于GOF的所有连续帧对重复)。这样对每个连续GOF形成的比特流(其描述的结构只是一个示例,而不能在解码一侧限制本发明的范围)可以通过一个算术编码器以及其后的一个熵编码器编码(例如,分别对应于标记21和22)。在描述的特定例子中,最终可获得(和发送或存储)的编码比特流对于当前GOF包括一个首部和对应于子带LLL0,LLH0,LH0,LH1,H0,H1,H2和H3的编码比特。
根据在上述的欧洲专利申请中提出的低存储解决方案执行的实际操作如下。对应于当前GOF的编码比特流部分第一次被解码,但只有在所述比特流中对应于第一帧对C0(两个第一帧F1和F2)的编码部分,即子带H0、LH0、LLL0、LLH0实际上被存储并解码。当头两帧F1、F2已经被解码时,标记为H0的第一H子带变得无用并且它的存储空间能够用于将被解码的下一个子带。因此编码的比特流被第二次读取,从而解码标记为H1的第二个H子带和下一个帧对C1(F3,F4)。当已经执行了该第二解码步骤时,所述子带H1变得无用并且第一LH子带也是一样(标记为LH0)。从而它们被删除并由接下来的H和LH子带(标记分别为H2和LH1)取代,它们归功于同一个输入编码比特流的第三次解码而获得,并且对于当前GOF的每个帧对以此类推进行。
该多次解码方案参照图3到6详细说明,包括对GOF中的每个帧对的迭代。在第一迭代期间,解码侧接收的编码比特流CODB由一个运算解码器31解码,但只有对应于第一个帧对C0的解码部分,即子带LLL0,LLH0,LH0和H0(见图3)被存储。使用所述子带,接着执行反向操作(相对于图1所描述的操作):
-解码后的子带LLL0和LLH0用于合成子带LL0;
-所述合成的子带LL0和解码后的子带LH0用于合成子带L0;
-所述合成的子带L0和解码后的子带H0用于重建帧对C0的两个帧F1,F2。
当完成该第一解码步骤时,能够开始第二个解码步骤。编码比特流被第二次读取,并且现在只存储对应于第二个帧对C1的解码后的部分:子带LLL0,LLH0,LH0和H1(见图4)。实际上,图4画虚线的信息(LLL0,LLH0,LL0,LH0)能够从第一解码步骤再次使用(这对于运算解码之后的比特流信息尤其准确,因为缓冲该压缩后的信息不会实际地消耗存储)。使用这些子带,现在执行以下的反向操作:
-解码后的子带LLL0和LLH0用于合成子带LL0;
-所述合成后的子带LL0和解码后的子带LH0用于合成子带L1;
-所述合成后的子带L1和解码后的子带H1用于重建帧对C1的两个帧F3,F4。
当完成该第二解码步骤时,同样能够开始第三个解码步骤。编码比特流被第三次读取,并且现在只存储对应于第三帧对C2的解码后的部分:子带LLL0,LLH0,LH1和H2(见图5)。和前面一样,图5画虚线的信息(LLL0,LLH0)能够从第一(或第二)解码步骤再次使用。执行以下的反向操作:
-解码后的子带LLL0和LLH0用于合成于带LL1;
-所述合成后的子带LL1和解码后的子带LH1用于合成子带L2;
-所述合成后的子带L2和解码后的子带H2用于重建帧对C2的两个帧F5,F6。
当完成该第三解码步骤时,同样能够开始第四个解码步骤。编码比特流被第四次读取(对于四个帧对的GOF而言是最后一次),只存储对应于第四帧对C3的解码部分:子带LLL0,LLH0,LH1和H3(见图6)。同样,图6的画虚线的信息(LLL0,LLH0,LL1,LH1)能够从第三解码步骤再次使用。执行以下的反向操作:
-解码后的子带LLL0和LLH0用于合成子带LL1;
-所述合成后的子带LL1和解码后的子带LH1用于合成子带L3;
-所述合成后的子带L3和解码后的子带H3用于重建帧对C3的两个帧F7,F8。
对视频序列的所有连续GOF重复该过程。当根据该过程解码编码比特流时,最多必须同时存储两个帧(例如:F1,F2)和四个子带(对于同一例子为:H0,LH0,LLH0,LLL0),而不是整个GOF。但是,该低存储解决方案的缺点在于它的复杂性。同一输入比特流必须解码几次(和一个GOF中的帧对数目相同的次数),才能解码整个GOF。
发明内容
因此,本发明的第一个目的是提供一种编码方法,能够在解码侧显著降低解码3D子带编码比特流所需的存储空间,而避免使用先前的迭代解决方案。
为此,本发明涉及在说明书的导言部分所定义的视频编码方法,并且其进一步特征在于,在编码步骤,在每个GOF的分析步骤结束时可获得的2n个频率子带按照与它们原始顺序的帧对的渐次重建对应的顺序进行编码,后面解码第一帧对所需的比特位于该编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到当前GOF的最后一个帧对。本发明也涉及相应的编码设备,它允许执行所述的编码方法。
本发明的目的也是提出一种由这样的一个编码方法产生的编码比特流组成的可发送视频信号,一种相对于先前描述的解码方法来说使用降低了的存储空间来解码所述信号的方法,和允许执行所述解码方法的相应的解码设备。
附图说明
现在参照附图通过例子描述本发明,其中:
图1说明了在一个当前例子中八帧的组上执行一个3D子带分解;
图2示出了在通过所述分解获得的子带中,被发送的子带和这样形成的比特流;
图3到6说明了在本申请已经提出的解码方法中,为了对输入的编码比特流解码而迭代执行的操作;
图7说明了根据本发明的一个视频编码方法的基本原理;
图8到10分别示出了说明根据本发明的视频编码方法的执行的一个流程图的三个连续部分;
图11说明了根据本发明的解码方法。
具体实施方式
本发明的原理如下:输入比特流在编码侧以这样的方式重组,解码头两个帧所需的比特位于比特流的开始部分,随后是解码第二个帧对所需的额外的比特,随后是解码第三个帧对所需的额外的比特,等等。根据本发明的这一解决方案如图7所示,在n=3分解层的情况下描述,但是所述的解决方案显然不管层数n是几都可以应用。在熵编码器21的输出端,可获得的比特b在比特流BS0,BS1,BS2,BS3中组织,它们分别对应于:
-对在解码侧重建帧对C0有用的子带LLL0,LLH0,LH0,H0;
-额外的子带H1,它对重建帧对C1有用(与已经放到比特流中的子带LLL0,LLH0,LH0相关联);
-额外的子带LH1,H2,它们对重建帧对C2有用(与已经放到比特流中的子带LLL0,LLH0相关联)
-额外的子带H3,它对重建帧对C3有用(与已经放到比特流中的子带LLL0,LLH0,LH1相关联)。
如以上所表示的,接着这些基本流BS0到BS3连接起来,从而构成将被发送的总的比特流BS。在所述比特流BS中,并不意味着BS1部分(例如)就足以重建帧F3、F4或者甚至解码相关联的子带H1。只是表示使用比特流的BS0部分,可获得解码头两个帧F1、F2(对C0)所需的最小信息量,接着,使用所述BS0部分和BS1部分,能够解码随后的帧对C1,接着使用所述BS0和BS1部分和BS2部分,能够解码随后的帧对C1,接着使用所述的BS0,BS1,BS2部分和BS3部分,能够解码最后的帧对C3(依此类推,在通常的情况下一个GOF中有2n个帧对)。
使用该重组的比特流,不再需要先前提出的多次解码方案。编码后的比特流已经以这种方式组织,在解码侧,每个新的解码比特与当前帧的重建有关。
根据本发明的视频编码方法的执行在图8到10的流程图中描述。如图8中使用附图标记81到85所示,当前GOF(81)包括N=2n帧A0,A1,A2,...,A.(N-1),它们被组织(步骤82)为连续的帧对(或COF)C0=(A0,A1),C1=(A2,A3),...,C((N/2)-1)=(A(N-2),A(N-1)).在第一时间层TL1,时间滤波步骤TF首先在每个帧对上执行(步骤TFCOF 84),这产生输出TF(C0)=(L[1,0],H[1,0]),TF(C1)=(L[1,1],H[1,1]),...,TF(C((N/2)-1))=(L[1,((N/2)-1)],H[1,((N/2)-2)],其中L[.]和H[.]表示这样获得的低频和高频时间子带。一个更新步骤85(UPDAT)接着允许存储每个帧对C0,C1,等...和包含有关帧对的一些信息的每个子带之间的连接的逻辑指示。给定帧对和给定子带之间的这些连接通过以下类型的逻辑关系表示:
L[1,0]_IsLinkedWith_C0=TURE
H[1,0]_IsLinkedWith_C0=TURE
L[1,1]_I sLinkedWith_C1=TURE
H[1,1]_IsLinkedWith_C1=TURE
等......
(所述的逻辑关系已经先在步骤INIT83初始化为:“对于所有的时间子带S,对于所有的对C,S_IsLinkedWith_C=FALSE”)。
如图9中使用附图标记91到98所示,子带分解能够在称为jt=1(=第一时间分解层的开始)的操作91和称为jt=jt+1(=随后的时间分解层的控制,根据图9所示的反馈连接,并且只有在测试96之后,当jt低于一个与每个GOF内的帧数相关联的预定值jt-max时才起动)的操作95之间进行。在每个时间分解层,根据以下关系用L子带形成新的对K(步骤KFORM92):
K0=(L[jt,0],[jt,1])
K1=(L[jt,2],[jt,3])
....    ......    ......
并且时间滤波步骤TF再次在这新的K对上执行(步骤TFILT 93):
TF(K0)=(L[jt+1,0],H[jt+1,0])
TF(K1)=(L[jt+1,1],H[jt+1,1])
....    ......    ......
接着提供一个更新步骤94(UPDAT),用于建立这样获得的每个子带和原始帧对之间的连接,即,用于确定在解码侧对当前GOF的给定帧对进行重建时是否会包含所述给定子带。在时间分解结束时,提取以下子带(步骤EXTRAC97):
L(jt_max,n),其中=0到N/2jt
H(jt,n),其中jt=1到jt_max和n=0到N/(2jt)
它们对应于将被发送的子带。在说明书的以下部分中它们全体被称为T。接着执行所述子带的空间分解(步骤SDECOMP 98),并且产生的子带最后根据图10的流程图编码,以这种方式最终获得输出编码比特流BS(如图7所示)。
熵编码步骤110(ENC)之后,在编码器的输出端执行比特预算层的控制(步骤BUDLEV 111)。如果没有达到比特预算,考虑当前输出比特b(步骤112),初始化n(步骤113),并且在全体T被考虑的子带S(步骤114)上执行一个测试115。如果b包含一些关于S的信息(步骤BINFS 115)并且如果S与对Cn链接(步骤SLINKCN 116),相关比特b被添加(步骤BAPP 117)到比特流BSn(n=前面参照图1到7给出的例子中的0,1,2,3),并且考虑随后的输出比特b(即,执行步骤111到117的重复)。如果b不包含任何关于S的信息,或者如果S不与对Cn链接,考虑接下来的子带S(步骤NEXTS 118)。如果还没有考虑T中的所有子带(步骤ALLS 119),进一步执行操作(步骤115到118)。如果已经分析了所有子带,n的值增加1(步骤120),并且对接下来的原始帧对进一步执行操作(步骤114到120)(等等,直到n的最后一个值)。在编码步骤110的输出,如果已经达到比特预算,不再考虑其它的输出b。
最后,当已经考虑了所有输出比特时或者如果已经达到了比特预算(步骤111),认为完成了整个编码步骤并且获得的各个比特流BSn连接(步骤CCAT 130)为最后的比特流BS(从n=0到它的最大值)。在解码侧,执行解码步骤,如现在参照图11解释的,其中“状态0”(1,2,...,n)表示熵编码器的性能受到唯一对的重建的限制,在描述的例子中n=0到3时在这种情况下是C0(在通常的情况下是C0,C1,C2,...,Cn)。实际上,当接收和解码了编码比特流的比特b时,它解释为包含涉及给定的时空子带(或者一组这种子带中的几个像素)中的一个像素的一些像素有效性(或者组有效性)信息。如果这些子带都不对当前帧对Cn(在描述的例子中是C0)的重建做出贡献,必须再次解释比特b,熵解码器DEC跳到它的下一个状态,直到b被解释为对Cn(这种情况下是C0)的重建有贡献。对于接下来的比特也是这样,直到当前子比特流被完全解码。
因此,根据以上的解释,所描述的第一对C0(状态“0”)的解码功能已非常明了,并且图11清楚地示出了帧对C0的3D子带时空合成:在第三分解层jt=3,子带LLL0和LLH0与运动补偿组合(虚线箭头),从而合成第二分解层jt=2的适当的子带LL0,所述子带LL0和子带LH0依次与运动补偿组合,从而合成第一分解层jt=1的适当的子带L0,并且所述子带L0和子带H0依次与运动补偿组合,从而合成涉及的帧对C0(jt=1)。通常,如果完整的GOF的大小是N=2n,必须解码(n+1)个时间子带(一个低频时间子带和n个高频时间子带)并且必须重建(n-1)个低频时间子带,这相对于立即进行整个GOF的解码和重建的情况来说,存储空间被显著降低。在描述的情况下,在每个步骤,较低的时间层的重建后的低频子带(例如,jt=2,LL0)在前一个上写入(例如,在jt=3,LLL0),这会产生丢失。因此存储在存储器中的时间子带不超过(n+1)个。

Claims (6)

1.一种视频编码方法,用于对相应于原始视频序列的比特流进行压缩,所述原始视频序列已经分为连续的多组帧(GOF),其大小为N=2n,其中n=1,或2,或3,...,所述编码方法包括以下步骤,这些步骤应用到该序列的每个连续的GOF:
a)一个时空分析步骤,把当前的GOF时空多分辨率分解成为2n个低和高频时间子带,所述步骤本身包括以下子步骤:
-一个运动估计子步骤;
-一个运动补偿的时间滤波子步骤,根据所述的运动估计,在当前GOF的2n-1个帧对的每一个上执行;
-一个空间分析子步骤,在从所述时间滤波子步骤产生的子带上执行;
b)一个编码步骤,所述步骤本身包括:
-一个熵编码子步骤,在从时空分析步骤产生的所述低和高频时间子带上和通过所述运动估计步骤获得的运动向量上执行;
-一个算术编码子步骤,应用到这样获得的所述编码序列并传送一个嵌入的编码比特流;
所述编码方法进一步特征在于,在编码步骤,在每个GOF的分析步骤结束时可获得的2n个频率子带按照与它们原始顺序的帧对的渐次重建对应的顺序进行编码,后面解码第一帧对所需的比特位于编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到当前GOF的最后一个帧对。
2.一种按照权利要求1的编码方法,其特征在于,在所述分析步骤结束时对于当前GOF获得的子带组中n等于3,并且包括第一分解层的高频时间子带(H0,H1,H2,H3),第二分解层的高频时间子带(LH0,LH1)和第三分解层的低和高频时间子带(LLL0,LLH0),子带(LLL0,LLH0,LH0,H0)被首先编码,接着是子带H1,接着是子带(LH1,H2),接着是子带H3。
3.一种视频编码设备,用于对相应于原始视频序列的比特流进行压缩,所述原始视频序列已经分为连续的多组帧(GOF),其大小为N=2n,其中n=1,或2,或3,...,为了产生编码比特流,所述编码设备包括:
-运动估计装置,应用于该序列的每个当前GOF的帧;
-运动补偿的时间滤波装置,根据这样估计的运动向量,在当前GOF的2n-1个帧对的每一个上执行;
-空间分析装置,在这样获得的子带上执行;
-编码装置,应用到通过这样执行的时空分析获得的当前GOF的时空多分辨率分解的2n个低和高频时间子带上,所述编码装置本身包括熵编码装置,应用于所述低和高频时间子带和所述运动向量上,和算术编码装置,应用到这样获得的编码序列上,所述编码装置进一步特征在于,它们按照与它们原始顺序的所述GOF的帧对的渐次重建对应的顺序应用到所述2n个频率子带,后面解码第一帧对所需的比特位于编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到当前GOF的最后一个帧对。
4.一种可发送的视频信号,它由用于对相应于原始视频序列的比特流进行压缩的视频编码方法所产生的比特流组成,所述原始视频序列已经分为连续的多组帧(GOF),其大小为N=2n,其中n=1,或2,或3,...,所述编码方法包括以下步骤,这些步骤应用到该序列的每个连续的GOF:
a)一个时空分析步骤,把当前的GOF时空多分辨率分解成为2n个低和高频时间子带,所述步骤本身包括以下子步骤:
-一个运动估计子步骤;
-一个运动补偿的时间滤波子步骤,根据所述的运动估计,在当前GOF的2n-1个帧对的每一个上执行;
-一个空间分析子步骤,在从所述时间滤波子步骤产生的子带上执行;
b)一个编码步骤,所述步骤本身包括:
-一个熵编码子步骤,在从时空分析步骤产生的所述低和高频时间子带上和通过所述运动估计步骤获得的运动向量上执行;
-一个算术编码子步骤,应用到这样获得的所述编码序列并传送一个嵌入的编码比特流;
所述编码步骤按照与它们原始顺序的帧对的渐次重建相对应的顺序,应用于在每个GOF的分析步骤结束时可获得的2n个频率子带上,后面解码第一帧对所需的比特位于所述编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到当前GOF的最后一个帧对。
5.一种视频解码方法,用于对相应于原始视频序列的比特流进行解压缩,所述原始视频序列已经分为连续的多组帧(GOF),其大小为N=2n,其中n=1,或2,或3,...,该视频序列通过包括以下步骤的编码方法获得,这些步骤应用到该序列的每个连续的GOF:
a)一个时空分析步骤,把当前的GOF时空多分辨率分解成为2n个低和高频时间子带,所述步骤本身包括以下子步骤:
-一个运动估计子步骤;
-一个运动补偿的时间滤波子步骤,根据所述的运动估计,在当前GOF的2n-1个帧对的每一个上执行;
-一个空间分析子步骤,在从所述时间滤波子步骤产生的子带上执行;
b)一个编码步骤,所述步骤本身包括:
-一个熵编码子步骤,在从时空分析步骤产生的所述低和高频率时间子带上和通过所述运动估计步骤获得的运动向量上执行;
-一个算术编码子步骤,应用到这样获得的所述编码序列并传送一个嵌入的编码比特流;
所述编码步骤按照与它们原始顺序的帧对的渐次重建相对应的顺序应用到在每个GOF的分析步骤结束时可获得的2n个频率子带上,后面解码第一帧对所需的比特位于编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到当前GOF的最后一个帧对。
6.一种视频解码设备,用于对相应于原始视频序列的比特流进行解压缩,所述原始视频序列已经分为连续的多组帧(GOF),其大小为N=2n,其中n=1,或2,或3,...,该视频序列通过包括以下步骤的编码方法获得,这些步骤应用到该序列的每个连续的GOF上:
a)一个时空分析步骤,把当前的GOF时空多分辨率分解成为2n个低和高频时间子带,所述步骤本身包括以下子步骤:
-一个运动估计子步骤;
-一个运动补偿的时间滤波子步骤,根据所述的运动估计,在当前GOF的2n-1个帧对的每一个上执行;
-一个空间分析子步骤,在从所述时间滤波子步骤产生的子带上执行;
b)一个编码步骤,所述步骤本身包括:
-一个熵编码子步骤,在从时空分析步骤产生的所述低和高频时间子带上和通过所述运动估计步骤获得的运动向量上执行;
-一个算术编码子步骤,施加到这样获得的所述编码序列并传送一个嵌入的编码比特流;
所述编码步骤按照与它们原始顺序的帧对的渐次重建相对应的顺序应用到在每个GOF的分析步骤结束时可获得的2n个频率子带,后面解码第一帧对所需的比特位于编码比特流的开始部分,随后是解码第二帧对所需的额外比特,以此类推,直到当前GOF的最后一个帧对,并且所述解码设备包括用于按照所述顺序解码所述2n个频率子带,直到重建所述当前GOF的所有帧对的设备。
CN03816840.5A 2002-07-17 2003-07-11 三维小波视频编码和解码方法以及相应的设备 Pending CN1669328A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP02291803.1 2002-07-17
EP02291803 2002-07-17

Publications (1)

Publication Number Publication Date
CN1669328A true CN1669328A (zh) 2005-09-14

Family

ID=30011266

Family Applications (1)

Application Number Title Priority Date Filing Date
CN03816840.5A Pending CN1669328A (zh) 2002-07-17 2003-07-11 三维小波视频编码和解码方法以及相应的设备

Country Status (6)

Country Link
US (1) US20050265612A1 (zh)
EP (1) EP1525750A1 (zh)
JP (1) JP2005533432A (zh)
CN (1) CN1669328A (zh)
AU (1) AU2003247043A1 (zh)
WO (1) WO2004008771A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299819B (zh) * 2008-04-25 2010-04-14 清华大学 可伸缩视频编码中的三维小波子带排序及码流封包方法

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060072834A1 (en) * 2003-04-17 2006-04-06 Lynch William C Permutation procrastination
WO2004110068A1 (en) * 2003-06-04 2004-12-16 Koninklijke Philips Electronics N.V. Subband-video decoding method and device
US8340177B2 (en) * 2004-07-12 2012-12-25 Microsoft Corporation Embedded base layer codec for 3D sub-band coding
CN1319383C (zh) * 2005-04-07 2007-05-30 西安交通大学 高性能空域可伸缩的运动估计与运动矢量编码实现方法
CN1319382C (zh) * 2005-04-07 2007-05-30 西安交通大学 可伸缩视频编解码器体系结构设计方法
US7956930B2 (en) 2006-01-06 2011-06-07 Microsoft Corporation Resampling and picture resizing operations for multi-resolution video coding and decoding
US8953673B2 (en) 2008-02-29 2015-02-10 Microsoft Corporation Scalable video coding and decoding with sample bit depth and chroma high-pass residual layers
US8711948B2 (en) 2008-03-21 2014-04-29 Microsoft Corporation Motion-compensated prediction of inter-layer residuals
US9571856B2 (en) 2008-08-25 2017-02-14 Microsoft Technology Licensing, Llc Conversion operations in scalable video encoding and decoding
US20140294314A1 (en) * 2013-04-02 2014-10-02 Samsung Display Co., Ltd. Hierarchical image and video codec
KR102301232B1 (ko) 2017-05-31 2021-09-10 삼성전자주식회사 다채널 특징맵 영상을 처리하는 방법 및 장치
GB202319449D0 (en) * 2023-12-18 2024-01-31 V Nova Int Ltd Systems and methods

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6188333B1 (en) * 1999-08-12 2001-02-13 Unisys Corporation LZW data compression apparatus and method using look-ahead mathematical run processing
WO2002035849A1 (en) * 2000-10-24 2002-05-02 Eyeball Networks Inc. Three-dimensional wavelet-based scalable video compression
US6801573B2 (en) * 2000-12-21 2004-10-05 The Ohio State University Method for dynamic 3D wavelet transform for video compression
WO2004004355A1 (en) * 2002-06-28 2004-01-08 Koninklijke Philips Electronics N.V. Subband video decoding method and device

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101299819B (zh) * 2008-04-25 2010-04-14 清华大学 可伸缩视频编码中的三维小波子带排序及码流封包方法

Also Published As

Publication number Publication date
WO2004008771A1 (en) 2004-01-22
JP2005533432A (ja) 2005-11-04
AU2003247043A1 (en) 2004-02-02
US20050265612A1 (en) 2005-12-01
EP1525750A1 (en) 2005-04-27

Similar Documents

Publication Publication Date Title
US6898324B2 (en) Color encoding and decoding method
CN1650634A (zh) 利用根据多个参考帧的运动补偿时域滤波的基于可分级小波的编码
CN1684517A (zh) 用于支持运动可缩放性的方法和设备
US20050169379A1 (en) Apparatus and method for scalable video coding providing scalability in encoder part
CN1722838A (zh) 使用基础层的可伸缩性视频编码方法和设备
CN1722831A (zh) 对包括基本层的比特流预解码和解码的方法和设备
CN1134990C (zh) 着重区编码方法和系统
CN1669326A (zh) 使用根据单个和多个参考帧的运动补偿滤波的基于小波的编码
CN1620815A (zh) 无漂移的视频编码和解码方法以及相应的设备
CN1669328A (zh) 三维小波视频编码和解码方法以及相应的设备
KR100561587B1 (ko) 3차원 웨이브렛 변환 방법 및 장치
CN1237817C (zh) 视频序列压缩的编码方法
JP2003274185A (ja) 画像処理方法とその方法を利用可能な画像符号化装置
CN102006483B (zh) 一种视频编解码方法及装置
KR100643269B1 (ko) Roi를 지원하는 영상 코딩 방법 및 장치
CN1914926A (zh) 运动图像编码方法和设备以及运动图像解码方法和设备
JP2006509410A (ja) ビデオ符号化方法及び装置
CN1910925A (zh) 编码和解码视频比特流的方法和装置
CN1722837A (zh) 用于可分级视频编码和解码的方法和设备
CN1666530A (zh) 子带视频解码方法和设备
US20060012680A1 (en) Drift-free video encoding and decoding method, and corresponding devices
CN1633814A (zh) 存储器带宽效率高的精细可分级(fgs)编码器
US20070019722A1 (en) Subband-video decoding method and device
CN1868214A (zh) 3d视频可缩放视频编码方法
CN1706198A (zh) 无漂移视频编码和解码方法及相应的设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication