CN1581975A

CN1581975A - 动态影像压缩的可变位元率控制装置

Info

Publication number: CN1581975A
Application number: CN 03153181
Authority: CN
Inventors: 张永清; 姚若坛; 徐国平
Original assignee: Silicon Integrated Systems Corp
Current assignee: Silicon Integrated Systems Corp
Priority date: 2003-08-08
Filing date: 2003-08-08
Publication date: 2005-02-16
Anticipated expiration: 2023-08-08
Also published as: CN1245840C

Abstract

一种动态影像压缩的可变位元率控制装置。根据本发明，先计算一组连续画面中即将被编码的目前画面的全活动量，然后基于全活动量以及该组连续画面中同型态的先前编码画面其活动量对复杂度之比，估计目前画面的复杂度，并且以此复杂度更新该组连续画面的瞬间复杂度和统计复杂度，然后计算其瞬间位元率，而根据画面复杂度、该组连续画面的瞬间复杂度及瞬间位元率，分配目标位元额度给目前画面。在画面编码之后，根据目前画面的全活动量、实际消耗位元数和实际所用量化位阶的平均值，计算其活动量对复杂度之比。

Description

动态影像压缩的可变位元率控制装置

技术领域

本发明有关于资料压缩的领域，特别是指一种适用于视讯编码系统以执行可变位元率控制的装置。

背景技术

众所周知，电子通讯世界正经历一次数位革命，以数位表示信息的主要优点在于能够几近无误地储存、再生、传收、处理及运用的资料位元流(bitstream)。举例而言，NTSC的彩色视讯影像每秒有29.97张画面，每张画面约480条可见扫瞄线，每条扫瞄线约需480点以红、绿、蓝三色呈现的像素(pixel)，但若每种色彩成分以8位编码，则所产生的位元率(bitrate)每秒约168百万位元(Mbits/s)，故各种视讯格式其未经压缩处理的位元率非常高而不经济，因此不适于多数的应用。

与电脑、电信网络、消费性产品整合的数位音讯和视讯，更加刺激信息革命的前进，而这革命的核心则是视、音讯的数位压缩技术。许多的压缩标准，包含以压缩技术共通的精髓为基础的算法，如：ITU-T(前身是CCITT)建议书H.261和H.263，以及ISO/IEC的MPEG-1、MPEG-2和MPEG-4标准。MPEG的演算法是由动态影像专家群组(Moving Picture Experts Group，MPEG)所发展出来，该动态影像专家群组是国际标准组织(InternationalStandards Organization，ISO)及国际电子技术委员会(InternationalElectrotechnical Commission，IEC)的联合技术委员会，致力于发展视、音讯的压缩及多路传殊的表现方式，这些标准规定了压缩位元流的语法(syntax)以及解码的方法，但对于编码器所使用的演算法而言，却为编码的新颖性与多样性保留了相当多的自由度。

根据MPEG，一连串的视讯画面(picture)分成一序列的画面群组(groupof picture，GOP)，其中每组GOP以I-画面开始，后面跟着P-画面和B-画面的安排，图1以显示的顺序说明一组典型的GOP。I-画面的编码毋须参考先前或将来的画面，P-画面则参考连串的视讯画面中在时间上最接近的I-画面或P-画面来进行编码，而B-画面散布于I-画面和P-画面之间。并且利用先前的、将来的或两者兼具的紧邻I-画面和P-画面来编码。虽然好几张B-画面可以紧接着连续出现，但绝不能以B-画面预估其它的画面。

每张画面具有三种成分：亮度值(luminance，以Y表示)，红色差值(redcolor difference，以Cr表示)，以及蓝色差值(blue color difference，以Cb表示)。对于MPEG的4:2:0的格式而言，每一种Cr和Cb成分的取样点在水平与垂直方向只有Y成分的一半。如图2所示，一张MPEG的画面其基本构成方块是大区块(macroblock，以MB表示)。以4:2:0的视讯为例，每个MB包含一个Y成分16×16取样点的阵列，以及两个Cr和Cb成分8×8取样点的区块，其中Y成分16×16取样点的阵列实际上由4个8×8取样点的区块所组成。

编码器的作用在于决定何种画面编码型态以及何种预测模式为最佳。对每张I-画面，MB中的每个8×8方块均经过离散余弦转换(discrete cosinetransform，DCT)而形成8×8转换系数阵列，转换系数接着以一量化矩阵进行量化，然后用Z字形(zig-zag)扫瞄DCT系数的量化结果而得到一连串的DCT系数，并且此DCT系数序列以可变长度码(variable length code，VLC)进行编码。P-画面必须决定将每个MB以I型MB或P型MB进行编码，I型MB的编码是以上述的方式进行的，而对于每个P型MB，则需得到该MB以先前画面所做的预测，此预测是藉由一种移动向量(motion vector)获得，移动向量象征着目前画面中即将编码的MB及其在先前画面中的预估MB之间的变动，预估MB与目前MB间的预测误差则以DCT、量化、Z字形扫瞄以及VLC进行编码。

处理B-画面时，必须决定以下列何种MB模式来编码每个MB：I模式、F模式、B模式以及FB模式。I模式是以MB本身而不借助移动补偿来编码(如I型MB一般)；F模式为单向的向前预测编码，是以先前画面得到移动补偿的预估(如P型MB一般)；反之，B模式为单向的向后预测编码，是以后来的画面得到移动补偿的预估。特别的是FB模式，其是双向的预测编码，运用向前的和向后的移动补偿预估两者来做内插(interpolation)而得到FB模式的移动补偿预估。对F、B和FB模式而言，预测误差可以使用DCT、量化、Z字形扫瞄以及VLC进行编码。

视讯编码器必须为整张画面选取量化位阶以便在给定的位元率下控制可见的失真，然而，以选取的量化位阶编码一张画面所用的实际位元数，必然是在真正编码之后才会得知，现实中并不存在一个逆转函数，能够在给定希望达到的量化位阶下，事先决定一张画面所用的实际位元数。编码器很重要的一点即为位元率的控制。MPEG中重要的视讯编码器限制：即每张画面所用位元数变化的限制，特别是在固定位元率运作的情形，这种限制是透过视讯缓冲器检验者(Video Buffer Verifier，VBV)来施行。若对于每张画面而言，VBV的输入资料速率均相同，则视讯可说是以固定位元率(ConstantBitrate，CBR)编码；否则即为可变位元率(Variable Bitrate，VBR)编码。VBV乃一种虚拟缓冲器并且是在解码器端的输入缓冲器模型，以固定位元率而言，编码器分配给一张画面的位元额度须使VBV缓冲器不会满溢或匮乏；而对于可变位元率，编码过的位元流则是以特定的最大位元率进入VBV缓冲器直到其饱和、再没有多的位元输入为止，这可解释为进入VBV缓冲器的位元率实际上是可变的且能达到上述的最大位元率。故对于可变位元率，则只要防止VBV匮乏即可。

可变位元率控制的目的是尽可能的提高解码后视讯的品质而还能维持输出位元率在允许的范围内。和固定位元率的方式不同，可变位元率拥有较大的弹性来分配额外的位元数给景物较复杂、变动较剧烈的画面。不过，传统的可变位元率控制架构却相当复杂，通常需进行好几次才能完成视讯编码的处理。

发明内容

本发明的目的是提供一种新颖的动态影像压缩的可变位元率控制装置，可用于单次、即时的视讯编码器，再者，也期待能提供一种适合施行于积体电路、具有可变位元率控制的动态影像压缩装置。

根据本发明，每一张画面其目标位元的分配，是基于先前画面的编码结果和对即将被编码的目前画面其预先分析的活动量，再者，藉由目前画面的预先分析的活动量以及先前编码画面的实际复杂度间的关系，目前画面的复杂度将能够被估计而得。由于画面的复杂度含有该画面编码之后的品质资讯，故此预估的目前画面复杂度对视讯编码器是非常有用的，可以更精确地分配目标位元额度给每张画面，藉以达到视讯序列中不同画面之间均一的视觉品质。

本发明是针对于一种动态影像压缩的可变位元率控制装置。根据本发明，该装置包括一移动估算单元、一复杂度估计器、一目标位元分派器以及一参数更新器。移动估算单元接收视讯序列里的一组连续画面中即将被编码的目前画面，用以计算此目前画面的全活动量。基于目前画面的全活动量以及这组连续画面中一同型态的先前编码画面其活动量对复杂度之比，复杂度估计器可用来估计目前画面的复杂度。以目前画面预估的复杂度，目标位元分派器更新本组连续画面的瞬间复杂度，并且基于这组连续画面的既定平均位元率、统计复杂度及瞬间复杂度来计算该组连续画面的瞬间位元率，而根据目前画面的复杂度、这组连续画面的瞬间复杂度及瞬间位元率，目标位元分派器将目标位元额度分配给目前画面。而参数更新器在目前画面编码之后，根据目前画面的全活动量、实际消耗位元数和编码目前画面实际所用量化位阶的平均值，计算目前画面其活动量对复杂度之比；其中，目前画面的活动量对复杂度之比与目前画面的全活动量成正比，而与目前画面的实际消耗位元数以及目前画面实际所用量化位阶的平均值成反比。此外，参数更新器还以目前画面的复杂度为基础来计算前述的统计复杂度。

另一方面，本发明还揭露一种目标位元分派器，包括一瞬间位元率计算器、一配额计算器以及一限度单元。瞬间位元率计算器接收视讯序列中一组连续画面里即将被编码的目前画面所含的复杂度以及该组连续画面的统计复杂度，且以该复杂度为基础来更新此组连续画面的瞬间复杂度，并根据一函数来计算这组连续画面的瞬间位元率，其中该函数取决于该组连续画面的既定平均位元率、统计复杂度及瞬间复杂度。配额计算器则以目前画面的复杂度、这组连续画面的瞬间位元率及瞬间复杂度为基础，将目标位元额度分配给目前画面，而限度单元则用来将此目标位元额度限制在既定的上限之下。

附图说明

图1是以显示的顺序呈现典型的画面群组(GOP)。

图2是MPEG的大区块。

图3是本发明的可变位元率控制装置其较佳实施例的方块示意图。

图4是本发明的操作流程图。

图5是图3中的目标位元分派器的方块示意图。

图号说明

300......动态影像压缩装置

310......移动估算单元

312......讯号线

320......复杂度估计器

330......目标位元分派器

340......参数更新器

350......影像编码器

510......瞬间位元率计算器

520 ..........配额计算器

530 ..........限度单元

P⁽ⁱ⁾ ..........画面

A⁽ⁱ⁾ ..........全活动量

C_est ⁽ⁱ⁾..........预估复杂度

ACR⁽ⁱ⁾ ......活动量对复杂度之比

EB .............超用位元量

STAT_C ......统计复杂度

TB⁽ⁱ⁾ ......目标位元额度

AQ⁽ⁱ⁾ .......实际所用量化位阶的平均值

UB⁽ⁱ⁾ ......实际消耗位元数

CD .......编码后的资料

INST_R ......瞬间位元率

INST_C ......瞬间复杂度

具体实施方式

为使本发明的上述目的、特征和优点能更明显易懂，下文特举一较佳实施例，并配合所附图式，作详细说明如下：

一开始，预测用的I-画面和P-画面必须先在MPEG编码器内解码，利用计算原始画面及解码的画面间的均方根(root mean square)误差，可以得到解码画面其品质的客观量度。以均方根误差作为解码画面的失真度，则解码画面的复杂度(complex)-C定义如下：

C＝r×d

其中，r是编码该画面所需的位元率，d是解码的画面的失真度。理论上，平均的量化位阶(quantization step size)和失真度之间为一比例关系，故，画面的复杂度可定义成：

C \approx \frac{r \times q}{2}

其中，q是该画面的平均量化位阶。在画面编码之后，将可得知位元率(实际消耗位元数)以及平均量化位阶，而该画面的复杂度也因此获得。

画面的复杂度端视画面的本质及其编码的形式而定。先前技术利用最近编码画面的复杂度来表示目前画面的复杂度，并且为I-、P-及B-画面分别保持其复杂度以减轻不同编码形式的影响，倘若视讯序列的画面其内容为平顺的变化，则此方式可达到相当不错的效果。然而，由于画面编码的目标位元配额与其实际消耗位元数之间不相符合，如果视讯序列的内容大幅变动，上述方式并不适合用来达成一致的视觉品质。

根据本发明，预先分析目前画面的活动量(activity)以及先前编码画面的实际复杂度之间的关系，目前画面的复杂度将能藉此预估。活动量是一种在画面编码后其位元率和品质的量度尝试，假设一整张画面的全活动量A正比于复杂度C，则

A = k \times C \approx \frac{k}{2} \times r \times q = k^{'} \times r \times q

其中，k是比例常数。若k′为活动量对复杂度之比(activity-to-complexityratio，ACR)，则全活动量A还可以下列式子表示：

A＝ACR×r×q

根据本发明，可以从相同型态的先前编码画面来预估ACR。观念上，先在编码一张画面前计算其全活动量A，然后，即将被编码的画面P⁽ⁱ⁾的复杂度C_est ⁽ⁱ⁾以如下方式估算：

C_{est}^{(i)} = \frac{A^{(i)}}{AC R^{(i - 1)}}

其中，A⁽ⁱ⁾是画面P⁽ⁱ⁾的全活动量，ACR^(i-1)是同型态的先前编码画面其活动量对复杂度之比。以下，在符号或变数中的上标⁽ⁱ⁾表示该符号或变量是与即将被编码的目前画面有关；同理，在符号或变量中的上标^(i-1)则与先前编码画面相关。

估计的复杂度C_est ⁽ⁱ⁾可用来为合适型态的画面更新其复杂度，所以三种型态的画面其复杂度C_I、C_P和C_B将分别储存以利后续的处理。一组连续画面的瞬间复杂度(instantaneous complexity)也以如下方式更新：

INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

其中，N_I、N_P和N_B分别是该组连续画面中I-、P-及B-画面的数目，而且此处所指的一组连续画面至少包含一组GOP。除了C_I、C_P和C_B之外，也分别存放I-、P-及B-画面的复杂度统计量SC_I、SC_P和SC_B，并且取目前画面的复杂度C_est ⁽ⁱ⁾来更新同型态画面的复杂度统计量，则一组连续画面的统计复杂度为：

STAT_C＝N_I×SC_I+N_P×SC_P+N_B×SC_B

若是最大、最小位元率已根据每组连续画面期望达到的编码位元率而事先决定，如此，一组连续画面的瞬间位元率可由下列式子计算而得：

INST_R = E R_{mean} \cdot (1 + SF \cdot (\frac{INST_C}{STAT_C} - 1))

其中，ER_mean是本组连续画面的既定平均位元率，SF是一缩放因子，其范围在0到1之间；瞬间位元率INST_R还须进一步地限制在每组连续画面的既定最大、最小位元率之间：

ER_min≤INST_R≤ER_max

一旦瞬间复杂度INST_C和瞬间位元率INST_R已经决定，则目前画面P⁽ⁱ⁾的目标位元额度TB⁽ⁱ⁾为

T B^{(i)} = \frac{C_{est}^{(i)}}{INST_C} \times INST_R

由上式可知，目标位元额度TB⁽ⁱ⁾与复杂度C_est ⁽ⁱ⁾以及瞬间位元率INST_R成正比，而与瞬间复杂度INST_C成反比。

所有的MPEG-2资料位元流均必须遵循MPEG-2标准的VBV规则，分配的目标额度必须受限以使VBV缓冲器不会满溢(overflow)或匮乏(underflow)。当目前画面的目标位元额度决定好之后，便可利用许多不同型态的影像编码器，像是MPEG-2标准描述的测试原型5(Test Model 5)，根据目标位元额度来完成画面的压缩。

目前画面在完成编码之后，其实际的复杂度将可得知，而目前画面的全活动量和实际复杂度之间的关系，ACR⁽ⁱ⁾可从以下计算得到

AC R^{(i)} = \frac{A^{(i)}}{A Q^{(i)} \times U B^{(i)}}

其中，ACR⁽ⁱ⁾与全活动量A⁽ⁱ⁾成正比，而与目前画面的实际消耗位元数UB⁽ⁱ⁾以及平均量化位阶AQ⁽ⁱ⁾成反比。此ACR⁽ⁱ⁾可拿来预估下一张同型态的画面的复杂度。ACR⁽ⁱ⁾可以和ACR^(i-1)做线性结合来避免受到那些富含噪声画面的影响。

本发明的单次(single-pass)视讯编码可藉由图3的较佳实施例并配合图4的操作流程图来解释。如图3所示，动态影像压缩装置300包括一移动估算单元310、一复杂度估计器320、一目标位元分派器330、一参数更新器340以及一影像编码器350。移动估算单元310接收视讯序列里的一组连续画面中即将被编码的目前画面P⁽ⁱ⁾，用来在执行移动估算的区块匹配时，计算此目前画面P⁽ⁱ⁾的全活动量A⁽ⁱ⁾(步骤S410)。基于全活动量A⁽ⁱ⁾以及这组连续画面中同型态的先前编码画面的ACR^(i-1)，复杂度估计器320可用来估计目前画面的复杂度C_est ⁽ⁱ⁾(步骤S420)。目标位元分派器330以预估的复杂度C_est ⁽ⁱ⁾更新本组连续画面其瞬间复杂度INST_C(步骤S430)，同时，目标位元分派器330从参数更新器340接收该组连续画面的统计复杂度STAT_C，并根据这组连续画面的既定平均位元率ER_mean、统计复杂度STAT_C、瞬间复杂度INST_C，计算该组连续画面的瞬间位元率INST_R(步骤S440)。

目标位元分派器330接着以瞬间位元率INST_R、复杂度C_est ⁽ⁱ⁾以及瞬间复杂度INST_C为基础将目标位元额度TB⁽ⁱ⁾分配给目前画面P⁽ⁱ⁾(步骤S450)。因此，影像编码器350依目标位元额度TB⁽ⁱ⁾而决定目前画面P⁽ⁱ⁾使用的所有量化位阶，这些量化位阶作为画面P⁽ⁱ⁾中每一空间区域：大区块(MB)的编码之用。影像编码器350根据这些量化位阶编码目前画面P⁽ⁱ⁾(步骤S460)。在目前画面编码完成后，影像编码器350将画面P⁽ⁱ⁾的实际消耗位元数UB⁽ⁱ⁾以及实际所用量化位阶的平均值AQ⁽ⁱ⁾回报给参数更新器340。然后以全活动量A⁽ⁱ⁾、实际消耗位数UB⁽ⁱ⁾和实际所用量化位阶的平均值AQ⁽ⁱ⁾为基础，参数更新器340为目前画面P⁽ⁱ⁾计算其活动量对复杂度之比ACR⁽ⁱ⁾(步骤S470)。

等效上，图3的较佳实施例可考量以硬件以及/或是软件来实现。根据本发明，移动估算单元310和图3中的其它组件可以管线(pipeline)模式运作，在复杂度估计器320开始计算目前画面的复杂度之前，移动估算单元310必须先完成即将被编码的目前画面其全活动量的计算以及移动向量的估算，并且，当移动估算单元310为下张画面作准备时，复杂度估计器320和其它组件仍正忙于完成所有与目前画面相关的运作。接下来将详细地描述较佳实施例中的每个组件。

移动估算单元310的主要目的之一为决定用何种预测模式来编码一张画面里的每个MB，如果必要的话，也进行向前和向后的移动预测，还可从区块匹配运算中提取画面活动量的信息。首先，计算每个MB的自身活动量(intra-activity)，将一个MB中4个8×8亮度值区块的像素强度以Y_m，n，m＝0，...，7，n＝0，...，7来表示，并且每个8×8区块其平均值为 Y，则每个MB的内活动量IntraAct：

IntraAct = Σ_{k = 0}^{3} σ_{k}

其中

σ_{k} = \sqrt{Σ_{m = 0}^{7} Σ_{n = 0}^{7} {(Y_{m, n} - \overset{&OverBar;}{Y})}^{2}}

倘若需要较低的计算复杂度，可以相对 Y的绝对差值代替：

IntraAct = Σ_{k = 0}^{3} Δ_{k}

其中

Δ_{k} = Σ_{m = 0}^{7} Σ_{n = 0}^{7} | Y_{m, n} - \overset{&OverBar;}{Y} |

由于I-画面中的MB仅有一种模式：I模式，因此IntraAct即为I-画面的每个MB的活动量。

如果画面为P-或B-画面，则需进行移动估算。最常使用来发现最佳移动向量的技术是区块匹配。对非自身编码(nonintra coding)而言(如P-和B-画面)，利用将失真标准如变异数或失真绝对值和减至最低，来选择向前、向后、双向的预测或不需移动补偿。一旦P-或B-画面中每个MB的MB模式决定，在每个移动补偿的差值MB中4个8×8区块的变异数也可求得，移动补偿的差值MB是待处理MB和预估MB间像素对像素之差；失真绝对值和通常具有较佳的计算效率，因此可用来取代变异数。将4个8×8区块的变异数或失真绝对值和相加以求得非内编码画面中每个MB的相互活动量(inter-activity)，InterAct，然后把非内编码画面中每个MB的IntraAct及其InterAct拿来作比较，以判断InterAct是否较小，若是，则以InterAct作为该MB的活动量，并以相互模式(inter-mode)编码该MB；否则以IntraAct作为该MB的活动量，并以自身模式(intra-mode)编码该MB。最后，对目前的I-、P-或B-画面，将所有MB的活动量相加而得全活动量A⁽ⁱ⁾，移动估算单元310再把全活动量A⁽ⁱ⁾传送给复杂度估计器320以及参数更新器340。

接着，复杂度估计器320为某种型态的目前画面P⁽ⁱ⁾估算其复杂度，且依照三种画面型态，引进加权系数至预估的复杂度C_est ⁽ⁱ⁾。因为B-画面绝不能被用来预估其它的画面，故可减少B-画面的加权系数以分配较少的位元给B-画面而保留较多的位元给I-和P-画面；一般而言，编码I-画面会产生最多的位元，因此P-画面的加权系数又小于I-画面的加权系数。复杂度估计器320根据目前画面的型态更新复杂度C_I、C_P或C_B三者其中之一，目前画面P⁽ⁱ⁾的复杂度C_est ⁽ⁱ⁾以如下方式估算：

if(I-画面)

C_{est}^{(i)} = C_{I} = K_{I} \times \frac{A^{(i)}}{AC R_{I}^{(i - 1)}}

else if(P-画面)

C_{est}^{(i)} = C_{P} = K_{P} \times \frac{A^{(i)}}{AC R_{P}^{(i - 1)}}

else if(B-画面)

C_{est}^{(i)} = C_{B} = K_{B} \times \frac{A^{(i)}}{AC R_{B}^{(i - 1)}}

其中，ACR_I ^(i-1)、ACR_P ^(i-1)及ACR_B ^(i-1)是一组连续画面中，I、P和B型态的先前编码画面各自的活动量对复杂度之比。这些ACR_I ^(i-1)、ACR_P ^(i-1)和ACR_B ^(i-1)存放在参数更新器340之中，而复杂度估计器320会为适当型态的先前画面读取对应的活动量对复杂度之比。K_I、K_P及K_B分别是I-、P-和B-画面的加权系数，其范围一般是在0到1.0之间。至于I-画面，较佳实施例可以采用K_I＝1.0。

目标位元分派器330可为一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度C_I、复杂度C_P与复杂度C_B。当收到C_est ⁽ⁱ⁾的时候，视目前画面P⁽ⁱ⁾的型态，每次仅更新复杂度C_I、C_P、C_B三者其中之一，如下：

if(I-画面)

C_{I} = C_{est}^{(i)}

else if(P-画面)

C_{P} = C_{est}^{(i)}

else if(B-画面)

C_{B} = C_{est}^{(i)}

如图5所示的较佳实施例，目标位元分派器330是由瞬间位元率计算器510、配额计算器520以及限度单元530所组成。瞬间位元率计算器510为该组连续画面更新其瞬间复杂度INST_C，如下：

INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

其中，N_I、N_P和N_B分别是一组连续画面中I-、P-及B-画面的数目。在此同时，瞬间位元率计算器510还从参数更新器340读取这组连续画面的统计复杂度STAT_C，并且依据下式计算一组连续画面的瞬间位元率INST_R：

INST_R = E R_{mean} \cdot (1 + SF \cdot (\frac{INST_C}{STAT_C} - 1))

其中，ER_mean是本组连续画面的既定平均位元率，SF是一缩放因子，其范围在0到1之间；而瞬间位元率INST_R最好限制在这组连续画面的最大、最小位元率ER_max及ER_min之间。

配额计算器520接着分配目标位元额度TB⁽ⁱ⁾给目前画面P⁽ⁱ⁾，而目标位元额度TB⁽ⁱ⁾是根据

{TB}^{(i)} = \frac{C_{est}^{(i)}}{INST_C} \times INST_R

但是，实际的消耗位元数并不会和期望的位元额度刚好相等，因此发展一种回授策略来使画面实际消耗的位元数接近于目标位元额度，在较佳实施例中，编码至目前为止的超用位元量，可由正在编码的目前画面摊还一部份：

TB⁽ⁱ⁾＝TB⁽ⁱ⁾-AR×EB

其中，EB是参数更新器340传来的超用位元量，AR则是既定的摊还率，其范围一般是在0.05到0.2之间。按照前面的式子，目标位元额度TB⁽ⁱ⁾是与目前画面的复杂度C_est ⁽ⁱ⁾以及一组连续画面的瞬间位元率INST_R成正比，而与一组连续画面的瞬间复杂度INST_C成反比。限度单元530则能用来调整目标位元额度TB⁽ⁱ⁾以符合VBV规范，因此事先定下了额度的上限(U_bound)及下限(L_bound)。就固定位元率(CBR)的操作而言，分配给一张画面的目标位元额度须使VBV缓冲器不会满溢或匮乏，所以限度单元530将目标位元额度TB⁽ⁱ⁾限制在上、下限范围内：

if(TB⁽ⁱ⁾＞U_bound)then TB⁽ⁱ⁾＝U_bound

if(TB⁽ⁱ⁾＜L_bound)then TB⁽ⁱ⁾＝L_bound

若是可变位率(VBR)，则只要防止VBV匮乏即可，故：

if(TB⁽ⁱ⁾＞U_bound) then TB⁽ⁱ⁾＝U_bound

然后，目标位元额度TB⁽ⁱ⁾会被传送到参数更新器340以及影像编码器350。

回到图3，影像编码器350透过讯号线312从移动估算单元310接收画面资料以及每个MB的移动向量和MB模式。为了尽可能的使画面达到最佳品质，影像编码器350依据目标位元额度TB⁽ⁱ⁾来决定目前画面的每个MB编码所用的量化位阶，以这些资料为基础，影像编码器350开始对目前画面P⁽ⁱ⁾进行编码且输出编码后的资料CD。在目前画面P⁽ⁱ⁾编码之后，影像编码器350将所用的量化位阶做平均并且计算实际消耗位元数UB⁽ⁱ⁾，再回报目前画面的UB⁽ⁱ⁾以及实际所用量化位阶的平均值AQ⁽ⁱ⁾给参数更新器340。

参数更新器340会为一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度统计量SC_I、SC_P与SC_B，并且取画面的复杂度C_est ⁽ⁱ⁾来更新这三种型态中同型态画面的复杂度统计量，如下：

{SC}_{X} = \frac{{SC}_{X} \cdot (W_{X} - 1) + C_{est}}{W_{X}}

其中，下标_x所代表的I、P及B型态端视目前画面P⁽ⁱ⁾的型态而定，W_I、W_P和W_B分别是I-画面、P-画面及B-画面的既定加权系数。换言之，依据目前画面P⁽ⁱ⁾的型态，复杂度统计量SC_I、SC_P或SC_B每次只有其中一个会被更新：

if(I-画面)

{SC}_{I} = \frac{{SC}_{I} \cdot (W_{I} - 1) + C_{est}^{(i)}}{W_{I}}

else if(P-画面)

{SC}_{P} = \frac{{SC}_{P} \cdot (W_{P} - 1) + C_{est}^{(i)}}{W_{P}}

else if(B-画面)

{SC}_{B} = \frac{{SC}_{B} \cdot (W_{B} - 1) + C_{est}^{(i)}}{W_{B}}

其中，W_I、W_P和W_B的范围一般是在200至2000之间。参数更新器340接着以下列的方程式计算一组连续画面的统计复杂度STAT_C，

STAT_C＝N_I× SC_I+N_P×SC_P+N_B×SC_B

其中，N_I、N_P和N_B分别是每组连续画面中I-、P-及B-画面的数目。画面P⁽ⁱ⁾的目标位元额度TB⁽ⁱ⁾以及实际消耗位元数UB⁽ⁱ⁾间的差距，会由参数更新器340做累计以便在面P⁽ⁱ⁾编码的后得到超用位元量EB：

EB＝EB×(1-AR)+UB⁽ⁱ⁾-TB⁽ⁱ⁾

其中，AR是既定的摊还率。因此，活动量和实际复杂度之间的关系，ACR⁽ⁱ⁾，可从以下计算得到

{ACR}^{(i)} = \frac{A^{(i)}}{{AQ}^{(i)} \times {UB}^{(i)}}

这个刚编码完成画面P⁽ⁱ⁾所属的ACR⁽ⁱ⁾可用来预估下一张同型态画面的复杂度。为使ACR⁽ⁱ⁾不会受到富含噪声画面的影响，较佳实施例利用了ACR⁽ⁱ⁾和ACR^(i-1)的线性组合，例如：

if(I-画面)

{ACR}_{I}^{(i)} = {ACR}_{I}^{(i - 1)} \times (1 - CW) + {ACR}^{(i)} \times CW

else if(P-画面)

{ACR}_{P}^{(i)} = {ACR}_{P}^{(i - 1)} \times (1 - CW) + {ACR}^{(i)} \times CW

else if(B-画面)

{ACR}_{B}^{(i)} = {ACR}_{B}^{(i - 1)} \times (1 - CW) + {ACR}^{(i)} \times CW

其中，CW是线性组合既定的加权系数。更新过的ACR_I ⁽ⁱ⁾、ACR_P ⁽ⁱ⁾及ACR_B ⁽ⁱ⁾会被传送到复杂度估计器320，以便为下一张适当型态的画面估算其复杂度，此外，超用位元量EB以及统计复杂度STAT_C则送至目标位元分派器330作为位分配之用。

虽然本发明已以一具体实施例揭露如上，然其仅为了易于说明本发明的技术内容，而并非将本发明狭义地限定于该实施例，任何熟习此技艺者，在不脱离本发明的精神和范围内，当可作些许的更动与润饰，因此本发明的保护范围当视权利要求的界定为准。

Claims

1.一种动态影像压缩的可变位元率控制装置，其特征在于，至少包含：

一移动估算单元，接收一视讯序列里的一组连续画面中即将被编码的一目前画面，以计算该目前画面的一全活动量；

一复杂度估计器，基于该目前画面的该全活动量以及该组连续画面中一同型态的先前编码画面其活动量对复杂度之比，来估计该目前画面的一复杂度；

一目标位元分派器，以该目前画面的该复杂度更新该组连续画面的一瞬间复杂度，并且基于该组连续画面的一既定平均位元率、一统计复杂度及该瞬间复杂度来计算该组连续画面的一瞬间位元率，而根据该目前画面的该复杂度、该组连续画面的该瞬间复杂度及该瞬间位元率，分配一目标位元额度给该目前画面；以及

一参数更新器，根据该目前画面的该全活动量、该目前画面的一实际消耗位元数和编码该目前画面实际所用量化位阶的一平均值，计算该目前画面其活动量对复杂度之比，并且基于该目前画面的该复杂度来计算该组连续画面的该统计复杂度；

其中，该目前画面的该活动量对复杂度之比与该目前画面的该全活动量成正比，而与该目前画面的该实际消耗位元数以及该目前画面实际所用量化位阶的该平均值成反比。

2.根据权利要求1所述的动态影像压缩的可变位元率控制装置，其特征在于，更至少包含一影像编码器，依上述目前画面的上述目标位元额度而决定上述目前画面所使用的复数个量化位阶，该些量化位阶是作为上述目前画面中的每一空间区域编码之用，该影像编码器根据该些量化位阶编码上述目前画面，且将上述目前画面的上述实际消耗位元数以及上述目前画面实际所用量化位阶的上述平均值回报给上述参数更新器。

3.根据权利要求1所述的动态影像压缩的可变位元率控制装置，其特征在于，上述复杂度估计器所估计得到的上述目前画面的上述复杂度，是依据一方程式：

C_{est} = K \times \frac{A}{ACR}

其中，C_est是上述目前画面预估的上述复杂度，K是一既定的加权值，其范围在0到1之间，A是上述目前画面的上述全活动量，ACR是上述同型态的先前编码画面其活动量对复杂度之比。

4.根据权利要求2所述的动态影像压缩的可变位元率控制装置，其特征在于，上述参数更新器计算上述目前画面其活动量对复杂度之比，是依据：

ACR = \frac{A}{AQ \times UB}

其中，ACR代表上述目前画面其活动量对复杂度之比，A是上述目前画面的上述全活动量，AQ是上述目前画面实际所用量化位阶的上述平均值，UB是上述目前画面的上述实际消耗位元数。

5.根据权利要求1所述的动态影像压缩的可变位元率控制装置，其特征在于，上述目标位元分派器为上述一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度C_I、复杂度C_P与复杂度C_B，并且取上述目前画面的上述复杂度来更新该三种型态中同型态画面的复杂度。

6.根据权利要求5所述的动态影像压缩的可变位元率控制装置，其特征在于，上述目标位元分派器至少包含：

一瞬间位元率计算器，以上述目前画面的上述复杂度为基础，来更新上述一组连续画面的上述瞬间复杂度，并且根据一函数来计算上述一组连续画面的上述瞬间位元率，其中该函数取决于上述一组连续画面的上述既定平均位元率、上述瞬间复杂度及上述统计复杂度；

一配额计算器，以上述目前画面的上述复杂度、上述一组连续画面的上述瞬间位元率及上述瞬间复杂度为基础，来分配上述目标位元额度；

以及一限度单元，用来将上述目标位元额度限制在一既定上限之下。

7.根据权利要求6所述的动态影像压缩的可变位元率控制装置，其特征在于，上述瞬间位元率计算器求得的上述一组连续画面的上述瞬间复杂度，是根据：INST_C＝N_I×C_I+N_P×C_P+N_B×C_B

其中，INST_C代表上述瞬间复杂度，N_I、N_P和N_B分别是上述一组连续画面的中上述I-、P-及B-画面的数目。

8.根据权利要求6所述的动态影像压缩的可变位元率控制装置，其特征在于，上述瞬间位元率计算器计算上述一组连续画面的上述瞬间位元率，是根据：

INST_R = {ER}_{mean} \cdot (1 + SF \cdot (\frac{INST_C}{STAT_C} - 1))

其中，ER_mean是上述一组连续画面的上述既定平均位元率，SF是一缩放因子，其范围在0到1之间，INST_C、STAT_C分别是上述一组连续画面的上述瞬间复杂度与上述统计复杂度，INST_R代表上述瞬间位元率。

9.根据权利要求1所述的动态影像压缩的可变位元率控制装置，其特征在于，上述参数更新器为上述一组连续画面中的三种型态：I-画面、P-画面及B-画面分别储存其复杂度统计量SC_I、复杂度统计量SC_P与复杂度统计量SC_B，并且取上述目前画面的上述复杂度来更新该三种型态中同型态画面的复杂度统计量，如下：

{SC}_{X} = \frac{{SC}_{X} \cdot (W_{X} - 1) + C_{est}}{W_{X}}

其中，该下标x所代表的I、P及B型态端视上述目前画面的型态而定，W_I、W_P和W_B分别是I-画面、P-画面及B-画面的既定加权系数，C_est是上述目前画面的上述复杂度。

10.根据权利要求9所述的动态影像压缩的可变位元率控制装置，其特征在于，上述参数更新器计算上述一组连续画面的上述统计复杂度，是根据：

STAT_C＝N_I×SC_I+N_P×SC_P+N_B×SC_B

其中，STAT_C代表上述统计复杂度，N_I、N_P和N_B分别是上述一组连续画面的中上述I-、P-及B-画面的数目。