CN102006483B - 一种视频编解码方法及装置 - Google Patents
一种视频编解码方法及装置 Download PDFInfo
- Publication number
- CN102006483B CN102006483B CN 200910091982 CN200910091982A CN102006483B CN 102006483 B CN102006483 B CN 102006483B CN 200910091982 CN200910091982 CN 200910091982 CN 200910091982 A CN200910091982 A CN 200910091982A CN 102006483 B CN102006483 B CN 102006483B
- Authority
- CN
- China
- Prior art keywords
- code stream
- image
- band
- frequency sub
- video
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
本发明公开了一种视频编解码方法及装置,其中,该视频编解码方法包括:采用小波变换对输入的视频图像划分不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出;根据编码端的码流合并打包方法,从输入的合并码流中分别解析出最低频子带码流、高频子带码流;根据最低频子带、高频子带的编码方法,分别对最低频子带码流、高频子带码流进行对应的解码操作,得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像。采用本发明对视频图像进行可分级、实时且容错性能好的编解码操作。
Description
技术领域
本发明涉及视频图像信息处理,特别是涉及一种视频编解码方法及装置。
背景技术
随着第三代(3G)视频业务的不断发展和日渐普及,人们对视频通话质量的要求越来越高,视频压缩编码技术也越来越重要。因此,提高编码压缩效率、降低复杂度、提高容错性能、提高分级能力等便成为视频压缩编码技术发展的动力和目标。
就目前的视频压缩编码技术发展而言,根据是否国际标准化,将其分为两大类:一类是由两个国际标准组织制定的国际标准,如国际电信联盟远程通信标准化组(ITU-T,ITU Telecommunication Standardization Sector)制定的MPEGx系列和国际标准组织(ISO,International Standards Organization)/国际电工委员会(IEC,International Electrotechnical Commission)制定的H.26x系列,这类标准已成为视频业务的主流技术,得到了广泛的应用;另一类则是由某个国家制定推广的国家标准或者某个行业制定推广的行业标准,如数字音视频编解码技术标准(AVS)、VC1、VP7等。其中,这些标准技术基本采用了基于离散数字余弦变换(DCT)的混合编码算法框架,即分块的预测、DCT、熵编码(AC)的编码框架等。这类框架在压缩编码效率方面取得了很好的效果,但由于这类框架以及DCT自身的一些问题,使得这些标准技术都存在一些缺陷,比如:DCT频谱没有局部特性会引起块效应等,需要额外的技术,如去方块滤波等来去除块效应;又如:这类框架不具有天然的分级能力,可扩展性差,为了达到分级的目的需要额外添加增强层才能实现;此外,这类框架的容错性能设计麻烦,也需要额外的技术来实现。
为此,具有多分辨率等优点的基于小波变换编码算法框架一度成为研究热点,这类框架主要分为三种:1)预测+小波变换+熵编码框架;2)小波变换+预测+熵编码框架;3)2D空间小波变换+1D时间小波变换框架。鉴于小波变换编码算法的特性,这三种框架都容易实现分级以及容错设计。然而,相对基于DCT编码框架来讲,小波变换编码算法框架存在压缩效率不高、计算复杂度高的缺陷,且框架3)的时延和缓冲区需求较大,所以都没有得到很好的发展和应用。
因此,如何融合上述两类框架的优点,充分发挥各自的优势,提供一个实时、视频图像质量高、可分级、容错性能好的编码算法框架,则成为现今视频编码技术发展的一个难题。
发明内容
有鉴于此,本发明的主要目的在于提供一种视频编解码方法及装置,能对视频图像进行可分级、实时且容错性能好的编解码操作。
为达到上述目的,本发明公开了一种视频编码方法,该方法包括:采用小波变换对输入的视频图像划分不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出。
其中,将得到的码流合并打包之前,还包括:对所述低频子带码流和高频子带码流分别进行小波域图像重建,再对得到的小波域图像进行小波反变换,得到视频图像的重建图像;将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流;相应的,所述将得到的码流合并打包为:将所述低频子带码流、高频子带码流和差值图像码流合并打包。
上述方法中,所述合并打包还包括:按数据重要性排序和插入重同步标识。
相应的,本发明提供一种视频解码方法,该方法包括:根据编码端的码流合并打包方法,从输入的合并码流中分别解析出最低频子带码流、高频子带码流;根据最低频子带、高频子带的编码方法,分别对最低频子带码流、高频子带码流进行对应的解码操作,得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像。
其中,该方法还包括:根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;根据差值图像的编码方法,对差值图像码流进行解码操作而得到差值图像的重建图像,并将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
相应的,本发明提供一种视频编解码方法,该方法包括:在编码端,采用小波变换对输入的视频图像划分不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出;在解码端,根据编码端的码流合并打包方法,从输入的合并码流中分别解析出最低频子带码流、高频子带码流;根据最低频子带、高频子带的编码方法,分别对最低频子带码流、高频子带码流进行对应的解码操作,得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像。
其中,该方法还包括:在编码端,所述将得到的码流合并打包之前,还包括:对所述低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流;和/或,所述将得到的码流合并打包为:将所述低频子带码流、高频子带码流和差值图像码流合并打包;其中,所述合并打包操作还包括:按数据重要性排序和插入重同步标识。
上述方法中,该方法还包括:在解码端,根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;根据差值图像的编码方法,对差值图像码流进行解码操作而得到差值图像的重建图像,并将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
其中,所述通过小波反变换得到整幅视频图像的解码重建图像为:根据编码端所采用的小波变换,将所述最低频子带的重建图像、各个小波域高频子带的重建图像进行小波域重建,合成得到整幅小波域图像;对所述小波域图像进行小波反变换,得到整幅视频图像的解码重建图像。
为实现上述方法,本发明提供一种视频编码装置,该视频编码装置包括:子带划分模块、子带编码模块、码流合并模块;其中,子带划分模块,用于采用小波变换将输入的视频图像划分为不同的子带;子带编码模块,用于对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流;码流合并模块,用于将通过所述子带编码模块得到的码流合并打包,形成合并码流并输出。
其中,该视频编码装置还包括:编码侧重建模块和差值图像处理模块;其中,编码侧重建模块,用于对所述子带编码模块得到的低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;差值图像处理模块,用于将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流。
为实现上述方法,本发明还提供一种视频解码装置,该视频解码装置包括:码流拆分模块、码流解码模块、图像重建模块;其中,码流拆分模块,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流;码流解码模块,用于对最低频子带码流、高频子带码流进行对应的解码操作,分别得到最低频子带的重建图像、各个小波域高频子带的重建图像;图像重建模块,用于通过小波反变换得到整幅视频图像的解码重建图像。
上述装置中,该视频解码装置还包括:差值图像解码模块和差值图像重建模块;其中,差值图像解码模块,用于根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;差值图像重建模块,用于根据差值图像的编码方法,对所述差值图像码流进行解码操作而得到差值图像的重建图像;相应的,所述图像重建模块用于将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
为实现上述方法,本发明提供一种视频编解码装置,包括:视频编码装置和视频解码装置;其中,视频编码装置,用于采用小波变换将输入的视频图像划分为不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出;视频解码装置,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流,并分别对最低频子带码流、高频子带码流进行对应的解码操作得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像。
其中,所述视频编码装置包括:子带划分模块,用于采用小波变换将输入的视频图像划分为不同的子带;子带编码模块,用于对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流;码流合并模块,用于将通过所述子带编码模块得到的码流合并打包,形成合并码流并输出;编码侧重建模块,用于对所述子带编码模块得到的低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;和差值图像处理模块,用于将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流。
上述装置中,所述视频解码装置包括:码流拆分模块、码流解码模块、图像重建模块、差值图像解码模块和差值图像重建模块;其中,码流拆分模块,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流;码流解码模块,用于对最低频子带码流、高频子带码流进行对应的解码操作,分别得到最低频子带的重建图像、各个小波域高频子带的重建图像;图像重建模块,用于通过小波反变换得到整幅视频图像的解码重建图像;差值图像解码模块,用于根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;差值图像重建模块,用于根据差值图像的编码方法,对所述差值图像码流进行解码操作而得到差值图像的重建图像;相应的,所述图像重建模块用于将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
由以上技术方案可以看出,本发明所提供的视频编解码方法及装置,采用小波变换对输入的视频图像划分不同的子带,并基于DCT的混合编码算法框架对划分的不同子带进行编码,并根据编码方法采用对应的解码方法。其中,对最低频子带采用基于DCT的混合编码算法框架,能够提高方案的整体编码效率,例如:通过采用基于DCT的混合编码算法框架能去除时域相关性、空间相关性,提高编码效果;因此,本发明有效融合了基于DCT的混合编解码框架和基于小波变换的编解码框架,充分利用了基于DCT混合编码算法压缩效率高和复杂度低的优势,以及小波变换的多分辨率分析特性和容错特性,具有实时的、视频图像质量高的、可分级的和容错性能好的视频编解码方法,突出的优点如下:
1)具有天然的空间可分级、质量可分级、时间可分级能力,可以很容易的实现各种分级,以满足不同质量需求、不同空间分辨率需求、时间分辨率需求等应用,并且本发明只需一个码流就可以实现不同分级,而现有系统,则要针对每一个需求都需要相应的码流。其中,由于本发明的编码架构在小波变换后自然地将视频图像分成不同属性如不同空间分辨率等的子带,于是不同子带间的组合就天然地形成分级。而现有的一些分级方案如H264SVC,则需要设计额外的增强层来实现分级。
2)由于只对尺寸为原始视频图像1/4n的最低频LL子带进行运动估计,且高频子带以及差值图像采用时间预测时,其运动矢量能够通过最低频子带的运动矢量推导得出,因此本发明整体运算复杂度不高,编码时耗较低。
3)由于最低频LL子带的编码压缩效率高,且还对高频子带和差值图像进行有效的压缩编码,因此本发明具有较高的压缩效率。并且,支持视频的无损压缩,如对差值图像采用无损压缩的编码方式。
另外,本发明对最低频子带、各级的高频子带以及差值图像分别进行独立编码,在合并打包时还采用容错技术如按数据重要性排序、插入重同步标识等处理操作,因此本发明具有很强的容错性能,能保证一定丢包误码情况下的视频图像质量。此外,本发明编解码方法所涉及的计算复杂度不高,也无延时,能够满足实时性的要求。
由上述可见,本发明适用于多种视频业务,能提供实时的、多种分级且容错性能好的视频编解码方法,具有巨大的应用推广价值。
附图说明
图1为本发明视频编码方法的实现流程图;
图2为本发明二级小波变换的数据结构示意图;
图3为本发明视频编码方法的实现框架示意图;
图4为本发明视频解码方法的实现流程图;
图5为本发明视频解码方法的实现框架示意图;
图6为本发明视频编解码装置的结构示意图。
具体实施方式
本发明的基本思想在于:采用小波变换对输入的视频图像划分不同的子带,并基于DCT的混合编码算法框架对划分的不同子带进行编码,并根据编码方法采用对应的解码方法。如此,充分利用了基于DCT混合编码算法压缩效率高和复杂度低的优势,以及小波变换的多分辨率分析特性和容错特性,实现实时的、视频图像质量高的、可分级的和容错性能好的视频编解码方法。
为使本发明上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施例对本发明作进一步详细的说明。本发明包括编码方法和解码方法两部分,先描述编码端技术方案,本发明视频编码方法如图1所示,包括如下步骤:
步骤101,采用小波变换对输入的视频图像划分不同的子带;
这里,对视频图像帧F进行n级的小波变换,其中,n≥1且n为整数,每级小波变换后得到四个子带,即:在行和列方向的低通分量子带LL、在行方向的高通分量和在列方向的低通分量子带LH、在行方向的低通分量和列方向的高通子带HL、在行方向和列方向的高通分量子带HH。
在n级小波变换后,每一帧视频图像分为3n+1个子带,例如:对输入的视频图像进行二级离散数字小波变换(DWT),则n=2,如图2所示,形成LL2、LH2、HL2、HH2、LH1、HL1和HH1共7个子带。
其中,所述小波变换根据实际应用,如可视通话、会议电视、视频存储等应用,来选择采用的是离散二维正交小波变换,也可以是双正交小波变换,也可以是整数小波变换。
步骤102,对每一帧视频图像中的最低频子带进行编码,形成最低频子带码流;
这里,所述视频图像最低频子带为每一帧视频图像中的最低频LL子带,尺寸为原始视频图像的1/4n,采用基于DCT的混合编码算法框架进行编码,形成最低频LL子带码流,也即基本层码流。其中,所述基于DCT的混合编码算法框架包括:预测、DCT、量化、熵编码的编码算法框架。
需要指出的是,对最低频子带采用基于DCT的混合编码算法框架,能够提高方案的整体编码效率,例如:通过采用基于DCT的混合编码算法框架能去除时域相关性、空间相关性,提高编码效果。
这里,本实施例的编码方案支持的帧类型包括:I帧、P帧及B帧,其中,P帧指采用前向预测的帧,参考前面的重建图像;B帧指采用前向和后向的双向预测帧,参考前面和后面两个方向的重建图像;I帧则不参考其他重建图像,只采用空间预测的帧。因此,若待编码帧类型是I帧,则采用帧内预测、DCT、量化、熵编码的编码方式;若待编码帧类型是P帧或者B帧时,则采用帧间预测、DCT、量化、熵编码的编码方式。
步骤103,对高频子带分别进行独立编码,形成高频子带码流;
这里,为了提高码流的容错性能,每一级的高频子带均独立编码,不利用上一级或者下一级高频子带的系数相关性。并且,将每一级变换的高频子带统一打包,形成n个高频子带码流。这n个码流即可作为n个空间增强层,也可作为n个质量增强层。
其中,所述高频子带包括:每一帧最低频LL子带之外的所有子带,共有3n个,尺寸分别为原始视频图像1/4n、1/4n-1...。这里可参考图3,为本发明编码方法的实现框架示意图。其中,高频子带的编码方式有多种,包括:
1)采用直接量化、熵编码方式编码;
2)采用DCT、量化、熵编码的方式编码;
3)当帧类型是P帧或者B帧时,利用最低频LL子带的运动矢量推导出高频子带相应位置的运动矢量,采用预测、DCT、量化、熵编码的方式编码;
4)采用零块编码,根据高频子带系数重要性,按块进行编码。
当然,也可融合上述几种方法,来对高频子带进行编码。
步骤104,对所述最低频子带码流和高频子带码流分别进行小波域图像的重建,形成整幅小波域图像,再对小波域图像进行小波反变换,得到视频图像的重建图像;
其中,分别根据步骤102和步骤103采用的编码方式,采用相应的解码操作,对低频子带码流和高频子带码流分别进行小波域图像的重建,主要是对最低频、高频子带进行解码,并将解码出来的数据放在小波域的相应位置上,形成整幅小波域图像,再进行小波反变换,得到视频图像帧F的重建图像F′。
步骤105,将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流;
本步骤中,对视频图像帧F和其重建图像F′的差值图像进行编码,形成差值图像码流,也即另外一个质量增强层码流。这里可参考图3,为本发明实现编码方法的框架示意图。其中,差值图像的编码方式有多种,如:
1)采用直接量化、熵编码方式编码;
2)采用DCT、量化、熵编码的方法;
3)当帧类型是P帧或者B帧时,利用最低频LL子带的运动矢量推导出高频子带相应位置的运动矢量,采用预测、DCT、量化、熵编码的方式编码;
4)采用无损编码的方式。
步骤106,将所述低频子带码流、高频子带码流和差值图像码流合并打包,形成合并码流并输出。
其中,为进一步提高码流的容错性能,在合并打包时添加如:按数据重要性排序、插入重同步标识等处理操作。这里,由于本实施例的编码方案不必增加额外的增强层,只需根据具体的分级需求对码流进行截取即可,所以根据步骤102、步骤103以及步骤105得到的码流,较易于实现最多n+1层的空间分级、最多n+2层质量分级;且当采用B帧编码时,由于B帧是双向预测的帧,对B帧的取舍可以影响帧频的变化,于是还可实现时间分级。这里,需要说明的是,所述空间分级是指实现不同空间分辨率,如4CIF、CIF、QCIF的分级;所述质量分级指实现不同图像质量的分级,如256kbps码率、384kbps码率、768kbps码率的分级;所述时间分级指实现不同时间分辨率的分级,如帧频为15帧每秒、30帧每秒等。
至此,已对输入视频图像的编码过程进行了说明,下面描述一下对编码码流的解码过程,如图4所示,包括如下步骤:
步骤401,根据编码端的码流合并打包方法,从输入的合并码流中分别解析出最低频子带码流、高频子带码流以及差值图像码流;
其中,解码端根据合并码流中指示编码端所采用的合并打包方法的标识位,得知编码端所采用的码流合并打包方法。
步骤402,根据最低频子带的编码方法,对最低频子带码流进行对应的解码操作;
例如:解码端可根据最低频LL子带码流中指示编码方式的标识位得知,最低频LL子带采用了帧间预测、DCT、量化、熵编码的方法,因此解码方法则采用熵解码、反量化、反DCT、差值图像重建的操作,得到小波域最低频LL子带的重建。
步骤403,根据高频子带的编码方法,对高频子带码流进行对应的解码操作;
例如:解码端可根据高频子带码流中指示编码方式的标识位得知,高频子带采用量化、熵编码的方法,解码方法则采用熵解码、反量化的操作,得到各个小波域高频子带的重建。
其中,所述高频子带码流依据所采用的小波变换的级数不同而不同,可包括:一级高频子带、二级高频子带......n级高频子带。
步骤404,根据编码端所采用的小波变换,解码端将所述小波域最低频子带的重建图像、各个小波域高频子带的重建图像进行小波域重建,合成得到整幅小波域图像,并对所述小波域图像进行小波反变换,得到整幅视频图像的解码重建图像;
步骤405,根据差值图像的编码方法,对差值图像码流进行解码操作,得到差值图像;
例如:解码端可根据差值图像码流中指示编码方式的标识位得知,差值图像采用DCT、量化、熵编码的方法,于是解码则采用熵解码、反量化、反DCT的操作,得到差值图像的重建图像。
步骤406,将所述解码重建图像和差值图像的重建图像相加,进而得到解码视频图像。
其中,所述解码重建图像和差值图像的重建图像相加主要是指解码重建图像和差值图像的重建图像的对应位置上的像素值相加。
这里,上述解码流程可参照图5,图5示出了本发明视频解码方法的实现框架。由上述可见,上述解码方案易于得到各种分级码流的重建图像,如:最低频的LL子带解码重建图像与各个高频子带的重建图像组成的不同空间分辨率的视频图像;或者,由不同质量的视频图像如所述差值图像带来更好的视频图像质量,进一步增强视频图像质量。
以上所述为本发明视频编解码方法的实现流程,下面以尺寸为704×576的4CIF图像格式和二级离散数字小波变换DWT为例,对本发明视频编解码方法做进一步的详细描述。这里的704、576均为像素个数,以此表示图像的大小。其中,4CIF是视频图像的尺寸格式,对应的尺寸为704×576。
这里为便于描述,本实施例将视频图像经过小波变换后各个子带LL、LH、HL及HH后加上数字表示不同级的子带,参见图2所示,视频图像经过二级小波变换后的数据结构,形成了LL2、LH2、HL2、HH2、LH1、HL1和HH1一共7个子带,其中LL2子带属于最低频LL子带,LH2、HL2、HH2划为二级高频子带,LH1、HL1、HH1则划为一级高频子带。
步骤501,对输入的视频图像进行二级DWT,形成LL2、LH2、HL2、HH2、LH1、HL1和HH1一共7个子带;
其中,划分得到的最低频的LL2子带的尺寸为176×144,二级高频子带LH2、HL2、HH2的尺寸为176×144,一级高频子带LH1、HL1、HH1的尺寸为352×288。
步骤502,对最低频的LL2子带采用基于DCT的混合编码方式进行编码;
其中,采用基于DCT的混合编码方式编码如符合H264 base profile的编码工具进行编码,得到最低频子带码流,也即基本层码流。
步骤503,对二级高频子带LH2、HL2、HH2采用直接量化、熵编码的方式编码,得到二级高频子带码流,即第一个质量或者空间分级的增强层码流。
步骤504,对一级高频子带LH1、HL1、HH1采用直接量化、熵编码的方式编码,得到一级高频子带码流,即第二个质量或者空间分级的增强层码流。
步骤505,对最低频子带进行编码侧重建,并对二级、一级高频子带进行反量化重建,得到整幅的小波域图像;
本步骤主要进行的是小波域图像的重建,是指:将最低频子带重建图像的数据和二级、一级高频子带重建图像的数据分别放置于小波域的相应位置上,而得到小波域图像。其中,所述小波域图像的尺寸为704×576。
步骤506,对所述小波域图像进行二级小波反变换,得到原始视频图像的重建图像,并将该重建图像和原始的视频图像相减,得到差值图像;
原始视频图像的重建图像尺寸与差值图像的尺寸相同,均为704×576。
步骤507,对所述差值图像进行编码,采用DCT、量化、熵编码的方式,得到差值图像码流,即第三个质量增强层码流。
步骤508,将所述最低频子带码流、二级高频子带码流、一级高频子带码流码流统一合并打包,并输出。
通过采用二级小波变换,输出码流实现了三层的空间分级,如:704×576、352×288和176×144;以及四层的质量分级,如LL2、LL2+LH2+HL2+HH2、LL2+LH2+HL2+HH2+LH1+HL1+HH1、L2+LH2+HL2+HH2+LH1+HL1+HH1+差值图像四种质量分级。当然,还可实现这空间和质量的混合分级。
相应的,解码方法的实现过程如下:
步骤601,解码端解析输入码流,分别得到最低频子带码流、二级高频子带码流、一级高频子带码流以及差值图像码流;
步骤602,解码最低频子带码流,采用H264 base profile的解码工具集进行解码,得到最低频LL2子带的重建图像;
步骤603,解码二级高频子带码流,采用熵解码、反量化的方法,得到二级高频LH2、HL2、HH2子带的重建图像;
步骤604,解码一级高频子带码流,采用熵解码、反量化的方法,得到一级高频LH1、HL1、HH1子带的重建图像;
步骤605,根据最低频LL2子带的重建图像、二级高频LH2、HL2、HH2子带的重建图像、一级高频LH1、HL1、HH1子带的重建图像,进行二级小波反变换,得到小波域解码重建图像;
步骤606,解码差值图像码流,采用熵解码、反量化、反DCT的方法,得到差值图像的重建图像;
步骤607,将所述解码重建图像与差值图像的重建图像相加,得到输出的解码视频图像。
需要说明的是,如果编码端所述的码流可实现三层的空间分级和四层质量分级,而解码端根据需要,只需对上面的解码步骤进行适当的裁剪即可获得相应分级的重建图像。例如:需要352×288尺寸,且质量较好的重建图像,只需进行步骤601、步骤602、步骤603,及步骤605中进行一级小波变换即可。
对于上述的各实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。
为实现上述方法,本发明还分别提供一种视频编码装置、视频解码装置以及一种视频编解码装置,如图6所示:
所述视频编码装置包括:子带划分模块、子带编码模块、码流合并模块;其中,
子带划分模块,用于采用小波变换将输入的视频图像划分为不同的子带;
子带编码模块,用于对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流;
码流合并模块,用于将通过所述子带编码模块得到的码流合并打包,形成合并码流并输出。
其中,所述视频编码装置还包括:编码侧重建模块和差值图像处理模块;其中,
编码侧重建模块,用于对所述子带编码模块得到的低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;
差值图像处理模块,用于将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流。
这里,本发明还提供一种视频解码装置,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流,并分别对最低频子带码流、高频子带码流进行对应的解码操作得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像。
其中,所述视频解码装置包括:码流拆分模块、码流解码模块、图像重建模块;其中,
码流拆分模块,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流;
码流解码模块,用于对最低频子带码流、高频子带码流进行对应的解码操作,分别得到最低频子带的重建图像、各个小波域高频子带的重建图像;
图像重建模块,用于通过小波反变换得到整幅视频图像的解码重建图像。
其中,所述视频解码装置还包括:
差值图像解码模块,用于根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;
差值图像重建模块,用于根据差值图像的编码方法,对所述差值图像码流进行解码操作而得到差值图像的重建图像;
相应的,所述图像重建模块用于将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
这里,由上述视频编码装置和视频解码装置共同构成一种视频编解码装置。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述即可。以上所述,仅为本发明的较佳实施例而已,只是用来说明和解释本发明,并非用于限定本发明的保护范围。在本发明的精神和权利要求保护范围之内,对本发明所作的任何修改、等同替换,都落入本发明的保护范围。
Claims (10)
1.一种视频编码方法,其特征在于,该方法包括:
采用小波变换对输入的视频图像划分不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出;
其中,将得到的码流合并打包之前,还包括:
对所述低频子带码流和高频子带码流分别进行小波域图像重建,再对得到的小波域图像进行小波反变换,得到视频图像的重建图像;
将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流;
相应的,所述将得到的码流合并打包为:将所述低频子带码流、高频子带码流和差值图像码流合并打包。
2.根据权利要求1所述的视频编码方法,其特征在于,所述合并打包还包括:按数据重要性排序和插入重同步标识。
3.一种视频解码方法,其特征在于,该方法包括:
根据编码端的码流合并打包方法,从输入的合并码流中分别解析出最低频子带码流、高频子带码流;
根据最低频子带、高频子带的编码方法,分别对最低频子带码流、高频子带码流进行对应的解码操作,得到最低频子带的重建图像、各个小波域高频子带的重建图像;
通过小波反变换得到整幅视频图像的解码重建图像;
该方法还包括:
根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;
根据差值图像的编码方法,对差值图像码流进行解码操作而得到差值图像的重建图像,并将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
4.一种视频编解码方法,其特征在于,该方法包括:
在编码端,采用小波变换对输入的视频图像划分不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出;
在解码端,根据编码端的码流合并打包方法,从输入的合并码流中分别解析出最低频子带码流、高频子带码流;
根据最低频子带、高频子带的编码方法,分别对最低频子带码流、高频子带码流进行对应的解码操作,得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像;
该方法还包括:
在编码端,所述将得到的码流合并打包之前,还包括:
对所述低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流;
相应的,所述将得到的码流合并打包为:将所述低频子带码流、高频子带码流和差值图像码流合并打包;其中,所述合并打包操作还包括:按数据重要性排序和插入重同步标识。
5.根据权利要求4所述的视频编解码方法,其特征在于,该方法还包括:
在解码端,根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;
根据差值图像的编码方法,对差值图像码流进行解码操作而得到差值图像的重建图像,并将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
6.根据权利要求4所述的视频编解码方法,其特征在于,所述通过小波反变换得到整幅视频图像的解码重建图像为:
根据编码端所采用的小波变换,将所述最低频子带的重建图像、各个小波域高频子带的重建图像进行小波域重建,合成得到整幅小波域图像;
对所述小波域图像进行小波反变换,得到整幅视频图像的解码重建图像。
7.一种视频编码装置,其特征在于,该视频编码装置包括:子带划分模块、子带编码模块、码流合并模块;其中,
子带划分模块,用于采用小波变换将输入的视频图像划分为不同的子带;
子带编码模块,用于对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流;
码流合并模块,用于将通过所述子带编码模块得到的低频子带码流和高频子带码流与差值图像处理模块得到的差值图像码流合并打包,形成合并码流并输出;
该视频编码装置还包括:编码侧重建模块和差值图像处理模块;其中,
编码侧重建模块,用于对所述子带编码模块得到的低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;
差值图像处理模块,用于将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流。
8.一种视频解码装置,其特征在于,该视频解码装置包括:码流拆分模块、码流解码模块、图像重建模块;其中,
码流拆分模块,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流;
码流解码模块,用于对最低频子带码流、高频子带码流进行对应的解码操作,分别得到最低频子带的重建图像、各个小波域高频子带的重建图像;
图像重建模块,用于通过小波反变换得到整幅视频图像的解码重建图像;
该视频解码装置还包括:差值图像解码模块和差值图像重建模块;其中,
差值图像解码模块,用于根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;
差值图像重建模块,用于根据差值图像的编码方法,对所述差值图像码流进行解码操作而得到差值图像的重建图像;
相应的,所述图像重建模块还用于将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
9.一种视频编解码装置,其特征在于,包括:视频编码装置和视频解码装置;其中,
视频编码装置,用于采用小波变换将输入的视频图像划分为不同的子带,对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流,将得到的码流合并打包,形成合并码流并输出;
视频解码装置,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流,并分别对最低频子带码流、高频子带码流进行对应的解码操作得到最低频子带的重建图像、各个小波域高频子带的重建图像;通过小波反变换得到整幅视频图像的解码重建图像;
其中,所述视频编码装置包括:
子带划分模块,用于采用小波变换将输入的视频图像划分为不同的子带;
子带编码模块,用于对每一帧视频图像中的最低频子带进行编码形成最低频子带码流,并对高频子带分别进行独立编码形成高频子带码流;
码流合并模块,用于将通过所述子带编码模块得到的低频子带码流和高频子带码流与差值图像处理模块得到的差值图像码流合并打包,形成合并码流并输出;
编码侧重建模块,用于对所述子带编码模块得到的低频子带码流和高频子带码流分别进行小波域图像重建,对得到的小波域图像进行小波反变换,得到视频图像的重建图像;和
差值图像处理模块,用于将视频图像与其重建图像相减得到差值图像,并对所述差值图像进行编码,形成差值图像码流。
10.根据权利要求9所述的视频编解码装置,其特征在于,所述视频解码装置包括:码流拆分模块、码流解码模块、图像重建模块、差值图像解码模块和差值图像重建模块;其中,
码流拆分模块,用于从输入的合并码流中分别解析出最低频子带码流、高频子带码流;
码流解码模块,用于对最低频子带码流、高频子带码流进行对应的解码操作,分别得到最低频子带的重建图像、各个小波域高频子带的重建图像;
图像重建模块,用于通过小波反变换得到整幅视频图像的解码重建图像;
差值图像解码模块,用于根据编码端的码流合并打包方法,从输入的合并码流中分别解析出差值图像码流;
差值图像重建模块,用于根据差值图像的编码方法,对所述差值图像码流进行解码操作而得到差值图像的重建图像;
相应的,所述图像重建模块还用于将所述解码重建图像和差值图像的重建图像相加,得到解码视频图像。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN 200910091982 CN102006483B (zh) | 2009-09-03 | 2009-09-03 | 一种视频编解码方法及装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| CN 200910091982 CN102006483B (zh) | 2009-09-03 | 2009-09-03 | 一种视频编解码方法及装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| CN102006483A CN102006483A (zh) | 2011-04-06 |
| CN102006483B true CN102006483B (zh) | 2013-05-01 |
Family
ID=43813499
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CN 200910091982 Active CN102006483B (zh) | 2009-09-03 | 2009-09-03 | 一种视频编解码方法及装置 |
Country Status (1)
| Country | Link |
|---|---|
| CN (1) | CN102006483B (zh) |
Families Citing this family (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN103813174B (zh) | 2012-11-12 | 2016-04-27 | 腾讯科技(深圳)有限公司 | 一种混合分辨率编解码方法和装置 |
| CN106507113B (zh) * | 2016-11-28 | 2019-03-29 | 河海大学 | 一种三描述格型矢量量化预测边路解码方法 |
| CN107566842B (zh) * | 2017-08-31 | 2019-08-23 | 西安万像电子科技有限公司 | 图像编解码压缩的方法、装置和系统 |
| CN108156462A (zh) * | 2017-12-28 | 2018-06-12 | 上海通途半导体科技有限公司 | 一种图像压缩、解压缩方法、系统及其应用的me架构 |
| CN111147865B (zh) * | 2018-11-03 | 2021-10-22 | 广州灵派科技有限公司 | 一种视频编码前的预解码方法 |
| CN112422992B (zh) * | 2020-10-28 | 2024-10-18 | 西安万像电子科技有限公司 | 图像编码方法及装置 |
| CN116962712B (zh) * | 2023-09-20 | 2023-12-12 | 成都索贝数码科技股份有限公司 | 一种视频图像分层编码的增强层改进编码方法 |
Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1571514A (zh) * | 2003-07-23 | 2005-01-26 | 西北工业大学 | 一种基于小波变换的嵌入式图像压缩技术 |
| CN101132529A (zh) * | 2006-08-22 | 2008-02-27 | 中兴通讯股份有限公司 | 基于快速逐次逼近量化的小波图像压缩方法 |
| CN101276587A (zh) * | 2007-03-27 | 2008-10-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
| CN101516031A (zh) * | 2008-02-19 | 2009-08-26 | 索尼株式会社 | 图像处理装置,图像处理方法和程序 |
-
2009
- 2009-09-03 CN CN 200910091982 patent/CN102006483B/zh active Active
Patent Citations (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN1571514A (zh) * | 2003-07-23 | 2005-01-26 | 西北工业大学 | 一种基于小波变换的嵌入式图像压缩技术 |
| CN101132529A (zh) * | 2006-08-22 | 2008-02-27 | 中兴通讯股份有限公司 | 基于快速逐次逼近量化的小波图像压缩方法 |
| CN101276587A (zh) * | 2007-03-27 | 2008-10-01 | 北京天籁传音数字技术有限公司 | 声音编码装置及其方法和声音解码装置及其方法 |
| CN101516031A (zh) * | 2008-02-19 | 2009-08-26 | 索尼株式会社 | 图像处理装置,图像处理方法和程序 |
Also Published As
| Publication number | Publication date |
|---|---|
| CN102006483A (zh) | 2011-04-06 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| KR100679011B1 (ko) | 기초 계층을 이용하는 스케일러블 비디오 코딩 방법 및 장치 | |
| CN100435585C (zh) | 对包括基本层的比特流预解码和解码的方法和设备 | |
| CN101938656B (zh) | 基于关键帧超分辨率重建的视频编解码系统 | |
| CN108293138B (zh) | 有效和可缩放帧内视频/图像编码 | |
| CN101312529B (zh) | 生成上下采样滤波器及实现编码的方法、系统和装置 | |
| CN102006483B (zh) | 一种视频编解码方法及装置 | |
| KR100703788B1 (ko) | 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더 | |
| MX2013003871A (es) | Metodo y aparato para escalabilidad espacial para hevc. | |
| CN1650634A (zh) | 利用根据多个参考帧的运动补偿时域滤波的基于可分级小波的编码 | |
| CN101185334A (zh) | 利用加权预测编码/解码多层视频的方法和装置 | |
| CN1669326A (zh) | 使用根据单个和多个参考帧的运动补偿滤波的基于小波的编码 | |
| US8855198B2 (en) | Moving picture encoding method, moving picture decoding method, moving picture encoding device, moving picture decoding device, and computer program | |
| KR20000059799A (ko) | 웨이브릿 부호화를 이용한 움직임 보상 부호화 장치 및 방법 | |
| CN106060567A (zh) | 一种基于分层wz帧的小波域分布式多视点视频编码 | |
| CN100394800C (zh) | 编码方法、解码方法、编码装置及解码装置 | |
| KR100621584B1 (ko) | 스무딩 필터를 이용하는 비디오 디코딩 방법 또는 비디오디코더 | |
| Chen et al. | Adaptive image coding efficiency enhancement using deep convolutional neural networks | |
| US20060012680A1 (en) | Drift-free video encoding and decoding method, and corresponding devices | |
| CN102196258B (zh) | 一种i帧编码方法及装置 | |
| Wu et al. | Wavelet based distributed video coding with spatial scalability | |
| Fradj et al. | Scalable video coding using motion-compensated temporal filtering | |
| Zhang et al. | Mode-based temporal filtering for in-band wavelet video coding with spatial scalability | |
| CN103155561B (zh) | 用于视频编译的空间可缩放性的方法和设备 | |
| KR100582024B1 (ko) | 웨이블렛 변환 기반 동영상 부호화를 위한 3차원 블록분할방식 | |
| Cheng et al. | A Block-Based SNR Scalable Wavelet Video Codec with Sub-pixel Motion Vectors and RD Optimization |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C14 | Grant of patent or utility model | ||
| GR01 | Patent grant |