CN1248824A

CN1248824A - 音频信号编码装置和方法以及解码装置和方法

Info

Publication number: CN1248824A
Application number: CN99120310.0A
Authority: CN
Inventors: 后藤道代
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1998-09-17
Filing date: 1999-09-16
Publication date: 2000-03-29
Also published as: JP2000101436A; EP0987827A2; US6295009B1; JP3352406B2; EP0987827A3

Abstract

在一种编码数字音频信号以把信号传送格式如一串帧的编码比特流的方法和装置以及相应的解码该编码的比特流的方法和装置中,每帧中传送音频数据,利用计算得到的换算系数量化样本组,分配的位数由根据换算系数计算得到的位分配信息指示,从编码的比特流的每帧中省略了编码处理时产生的位分配信息,在解码处理时,利用接收到的解码换算系数再产生该位分配信息。与已有技术相比,实质上增加了可以分配给量化音频数据的帧位数,与已有技术的方法相比,显著地缩短了帧长度以及整体的编码/解码延时,而不会降低音频再现质量,同时仍对编码数据使用低比特率。

Description

音频信号编码装置和方法以及解码装置和方法

本发明涉及一种音频信号编码方法和装置以及音频信号解码方法和装置，从而可以减少编码和解码延时量。

近年来，已对数字音频信号编码方法进行了研究和开发，并且，音频编码(如国际标准ISO/IEC 11172-2规定的)MPEG-1方法已广泛使用，由于其能即使在以低比特率产生编码数据时，仍能实现高质量的音频再现。图13和14示出了一种符合MPEG-1标准的音频编码/解码系统的基本特征。图13是基本MPEG-1音频编码器的框图，而图14是相应解码器的框图。在MPEG-1音频标准下，对于实际的编码/解码系统有三种不同的模型，依次增加了复杂性，它们分别被称为层1、层2和层3。图15、16和17分别示出了MPEG-1音频层1编码、层2编码和层3编码的帧格式。编码效率的程度随着层数的增大而提高，即层3编码能以比层2编码更低的比特率对数据进行编码和传输而不会损失再现质量，层2编码同样比层1编码更好。然而随着层数的增加编码和解码延时量也增加。

在图13中，MPEG-1音频编码装置是由映射部分112、音质模型部分113、量化编码部分114和帧打包部分115。该编码器的映射部分112是子带滤波器，其把后续的各组PCM数字音频数据样本分解成多组频率域子带样本，这些子带样本对应于固定的多个子带的各个子带。对于MPEG-1音频层2编码，每组32个输入数字音频样本映射到对应的32个子带样本组，这些12组的32个输入音频样本(即，总计384个后续音频数据样本)的内容以量化和编码子带样本的形式由每个编码比特流帧传送，如ISO/IEC 11172-3的附录C中所描述的一样。从时间域向频率域的这种变换会产生数据样本的细化，由于对于每帧，都有一些幅度不能满足量化和编码的样本的子带。

在对每帧编码时，音质模型部分113得到各子带的表征值，每个表征值表示任一信号分量必须超过的音频信号电平，例如量化噪声，以便信号分量成为人可以听到的最终的再现音频信号。在MPEG-1音频层1编码的情况下，量化编码部分114利用各子带的表征值和子带的子带样本的信噪比，得到每个子带的相应的表征-噪声比，并相应地产生位分配信息，用于规定用于量化子带的各子带样本的比特数(在样本的幅度不满足编码的各子带分配零比特)。

得到位分配信息，以便在量化后，使各子带的表征-噪声比值基本平衡，即，把各个较大的量化比特数赋予较小换算系数的子带，把各个较小的量化比特数赋予较大换算系数的子带。对于MPEG-1音频层1编码，这是通过简单迭代算法，分配在帧内可用的比特量化这些样本来实现的，这在ISO/IEC 11172-3附录C中有描述。

帧打包部分115接收量化编码部分114的每帧产生的输出数据，而且，可能需要包括在该帧内的辅助数据产生帧首部和校错数据，以需要的比特流格式把这些数据组合成一帧。

根据是否使用层1、层2或层3确定量化编码部分114的操作方式以及帧打包部分115产生的帧格式。

图14所示的MPEG-1解码器由帧解包部分122、重构部分123和反映射部分124构成。解码器121的操作如下。当构成一帧的一串位被按序提供给帧解包部分122时，上述的帧的各数据部分被帧解码部分122分开，解码器输出辅助数据把余下的帧数据提供给重构部分123。重构部分123反量化各子带的子带样本，把得到的样本提供给反映射部分124。反映射部分124进行相对于编码器的映射部分112的反映射操作，即把该帧传送来的量化的子带样本转换成相应的PCM数字音频数据样本组。假设把384个音频数据样本编码成一帧，如上所述，反映射部分124将相应地把各帧传送来的子带样本转换成384个PCM音频数据样本，即解码器121的反映射部分124的输出数据的样本速率与输入到编码器111的音频数据的样本速率相等，为32kHz、44.1kHz或48kHz。

如上所述，层1、层2和层3 MPEG-1比特流格式的层数越高，编码效率就越高。因此，如果使用层2，或者尤其是使用层3格式，可以从解码PCM音频数据实现高质音频再现，即使是MPEG-1编码数据的低比特率。图15示出了层1情况下的MPEG-1比特流格式。如图所示，每帧由首部131、后跟校错部分132、音频数据部分133以及辅助数据部分134构成。音频数据部分133由包含每个子带的各位分配信息位分配信息部分、包含各子带的各换算系数的换算系数部分以及包含量化编码子带样本的数据样本部分组成。

图16示出了层2情况下的MPEG-1比特流格式。如图所示，它与上述的层1的比特流格式的不同仅在于音频数据部分还包括换算系数选择信息。

图17示出了层3情况下的MPEG-1比特流格式。如图所示，它与上述的层1的比特流格式的不同在于音频数据部分153由“附加信息”部分和“主信息”部分构成。在这种情况下，子带样本已经过Huffman编码，主数据由表示换算系数的位、经Huffman编码的数据和辅助数据组成。在编码产生的实际的比特流中，对于层3MPEG-1音频编码，帧的“主信息”部分位于在帧首部之前的时间轴部分上。帧的“主信息”的起始实际位置由帧的“附加信息”指定。在单声道音频的情况下，“附加信息”部分占用17个字节，而在双声道音频的情况下，它占用32个字节。

对于这种已有技术的音频信号编码方法，帧长度(即一帧编码和传送的原始数字音频信号的样本数)在层1格式的情况下为384个样本，在层2和层3格式的情况下为1152个样本。因此，假设音频数据取样频率为48kHz，则在层1格式的情况下，帧长度等于8ms，在层2和层3格式的情况下，为20ms。如果音频数据取样频率为32kHz，则在层1格式的情况下，帧长度为12ms，在层2和层3格式的情况下为36ms。

当进行上述的实时处理以实现已有技术的编码和解码方法时，执行编码然后进行解码所需要的延时总量为帧长度的四倍。这是因为，为了以帧为单位对音频数据进行编码，要在缓冲器中连续累积一帧的音频数据样本，同时要读取前一帧的音频数据样本，即当前保持在缓冲器中的样本，然后进行编码。通过提高处理速率是可以减少编码一帧数据所需要的时间的。然而，与处理速度的提高程度无关，在开始对一组样本编码处理之前，它仍必须等到一帧的音频数据样本都已累积到缓冲器中。因此，完成一帧编码所需要的时间是帧长度的两倍。

同样，在解码期间，一帧传送的音频数据样本按序累积到缓冲器中，从缓冲器中(以取样频率)按序读取解码音频数据样本，同时，对后一帧进行解码。通过提高传送编码比特流的比特率以及解码处理的速度可以减少把一帧的音频数据样本累积到缓冲器中所需的时间。然而，仍必须实时输出每帧的音频数据样本，所以解码一帧所需的时间是帧长度的两倍。

因此，执行编码和解码一帧所需的总时间，即总延时为帧长度的四倍。如果，例如音频数据的取样频率为48kHz，则在MPEG-1层1格式(帧长度为8ms)的情况下，延时变为32ms，而在MPEG-1层2和层3格式(帧长度为24ms)的情况下，延时变为96ms。此外，MPEG-1编码的子带滤波器以及执行相反功能的MPEG-1解码的相应的子带滤波器的操作还会进一步引入延时，如上所述，子带滤波器把音频数据分解成子带样本。这一滤波器的延时由抽头(tap)数确定，在MPEG-1音频编码和解码的情况下，每个子带滤波器具有512个抽头。当音频数据取样频率为48khz时，这种滤波器引入10.67ms的延时。因此，当取样频率为48kHz时，在层1格式的情况下，编码和解码延时的总量变成约为43ms，在层2和层3格式的情况下，变成约为107ms。

人的听觉可以检测到10至100ms或更高的延时，所以这种延时在某些MPEG-1音频编码解码系统的应用中可能是严重的缺点。例如，这种编码方法可以应用于对话筒接收到的声音进行编码并传送给接收器，在其内进行解码的音频系统中。如果一个人正在对着这种音频系统的话筒讲话或唱歌，则上述的延时将会造成该人嘴的动作与从扬声器中发出的声音之间有差异。这对听众将产生不自然的效果。同样，这种编码系统可以用于扬声器安装在舞台上的音频系统，这样，一个人可以听到扬声器发出的他或她自已的声音，同时，利用连接到该系统上的话筒。在这种情况下，如果编码和解码音频信号引起较长的延时，则会在直达人耳的声音与扬声器发出的声音之间存在显著的时间差。这可能会导至讲话或唱歌困难。

为了减少MPEG-1音频编码/解码系统的延时，必须减小子带滤波器的延时和/或帧长度。然而，如果减小帧长度，则除音频样本之外的其它信息，即首部和位分配信息等占用的每帧的比例将增加。对于MPEG-1层1格式，如果编码数据的比特率为128kbit/s，则构成一帧的总比特数为1024。这些位中，32位分配给首部，128位分配给位分配信息，余下的864位可用来分配给换算系数和音频数据样本。在这种情况下，如果帧长度减小到标准长度的1/4，即，使一帧的换算系数和音频样本(子带样本)表示96个原始音频信号的样本，则构成一帧的总位数将变成256，如果把其中32位分配给首部，128位分配给位分配信息，则仅96位分配给换算系数音频样本。因此，鉴于原始帧的长度，如果帧长度减少到其原始值的1/4，则平均2.25比特可用于每个编码换算系数和量化编码音频样本，仅1比特可用于每个样本。

因此，如果缩短帧长度，会导致可用来分配给实际编码音频数据的比特数减少，因此，音频再现质量将会变差。

本发明的一个目的在于克服已有技术的数字音频信号编码和解码的缺点，其方法为提供一种编码和解码数字音频信号的方法和装置，它把编码数字音频信号按帧顺序传输成格式化的比特流，从而可以缩短帧长度(如上所述定义)，同时保持编码比特流的比特率不变，不会使音频再现质量变差。因此，本发明能减少总体的编码和解码延时，同时仍使用低比特率，而避免已有技术的音频再现质量因可用于编码每帧传送的音频数据的帧位数的减少而引起的音频再现质量的降低的缺点。

本发明由于从编码数据流中取消了每帧的位分配信息，即，取消了已有技术中必须可用于解码装置以确定已分配给量化一帧内传送的数据每个数据样本的各位数，从而基本上实现了上述目的。如各换算系数所指示的，编码装置仅根据等待编码的数据样本的相对幅度计算每帧的位分配信息。由于在编码数据流中不传送每帧的位分配信息，所以在解码装置中要用与编码装置中相同的方法再计算位分配信息。对于本发明，这可以通过仅把换算系数用来取得位分配数据来实现。

因此，基本上增加的位数都变成可以在每帧中用来对音频数据进行编码，从而使帧长度缩短，因此缩短编码/解码延时，而不会增加编码数据的比特率，不会使音频再现质量变差，尽管帧长度的这种减小意味着必须将每帧的总位数的较多比例分配给不同于编码音频数据的数据。

本发明较佳地应用于编码和解码系统，其中编码装置对数字音频信号编码器的每组后续样本进行映射操作，以获得对应于覆盖音频范围的多个固定子带的各子带样本组，对这些子带样本组计算各换算系数，根据换算系数计算位分配信息，根据位分配信息对幅度足够大的每个子带样本组进行编码，然后归一化和量化。然后，对这些每个量化子带样本和所有换算系数组(对应于所有子带)在编码数据流的一帧中进行编码和传送。这种系统的解码装置从这些帧的每帧中取出量化子带样本和换算系数，进行解码，根据换算系数运算，得到与编码装置中计算的相同的位分配信息，利用该位分配信息对量化的子带样本进行去量化。然后对去量化的子带样本执行与解码装置进行的映射操作相反的映射操作，从而恢复数字音频信号的原始编码样本组。

根据本发明的另一个方面，不在每帧中对应于所有子带，对所有换算系数进行编码，仅对与前帧中相应子带的换算系数不同的那些换算系数进行编码和传送。这样，由于可以减少必须分配给换算系数的帧位数，所以可以进一步增加可以分配给编码音频数据的位数，从而能提高音频再现质量。

更具体地说，本发明提供一种编码数字音频信号的方法，这样产生各连续帧，构成编码比特流，即，对一组连续的数字音频信号数据样本进行映射操作，以获得多组对应于固定的多个子带的各个子带的多个子带样本组，计算对应于各子带样本组的各换算系数，利用这些换算系数计算位分配信息，根据位分配信息和换算系数量化子带样本，对换算系数和量化子带样本进行编码，组合成一帧作为格式化的位序列，它包括构成编码换算系数和编码量化子带样本的各位组，而不包括位分配信息。

本发明还提供一种解码这种编码比特流的方法，包含从帧中分离出换算系数和量化子带样本，利用换算系数计算位分配信息，利用位分配信息和换算系数对子带样本去量化，对去量化的子带样本进行反变换处理，以恢复出相应的数字音频信号的连续样本组。

本发明还提供一种编码数字音频信号的方法，这样产生各连续帧，构成编码比特流，即，对一组连续的数字音频信号数据样本进行映射操作，以获得多组对应于固定的多个子带的各个子带的多个子带样本组，计算对应于各子带样本组的各换算系数，把各换算系数与前一帧的相应换算系数进行比较，在检测到一致的情况下，设置相应的第一条件的换算系数标记，而当检测到不一致时，设置相应的第二条件的换算系数标记，利用换算系数计算位分配信息，根据位分配信息和换算系数量化子带样本，对于检测为一致的情况选择各换算系数，对所选的换算系数和量化子带样本进行编码，组合成帧作为格式化的位序列，它包括构成换算系数标记、编码换算系数和编码量化子带样本的各位组，而不包括位分配信息。

本发明还提供一种解码这种编码比特流的各帧的方法，包含从帧中分离出换算系数标记、所选的换算系数和量化子带样本，连续判断每个换算系数标记，当发现换算系数标记处于上述第一条件时，指定利用前一帧的相应换算系数，当发现换算系数标记处于上述第二条件时，指定使用当前接收的帧传送的相应换算系数，然后，利用指定的换算系数计算当前接收的帧的位分配信息，利用位分配信息和指定的换算系数对子带样本去量化，对去量化的子带样本进行反映射操作，恢复出相应的数字音频信号的连续样本组。

本发明还提供一种编码和解码系统的编码装置和相应的解码装置，把数字音频信号传送成如帧序列格式化的编码比特流。这种系统的编码装置包含映射装置，对一组数字音频信号的样本，即其数据由一帧传送的一组样本进行操作，获得多组子带样本，这些组分别对应于固定的多个子带；换算系数计算装置，计算这些子带样本组的各换算系数；位分配信息计算装置，对换算系数进行操作，计算该帧的位分配信息；量化装置，根据位分配信息和换算系数量化子带样本；以及帧打包装置，编码换算系数，量化子带样本，组合成一帧作为格式化的位序列，它包括构成编码换算系数和编码量化子带样本的各位组，而不包括位分配信息。

这种系统的相应解码装置包含帧解包装置，对每帧进行操作，分离出换算系数和量化子带样本；位分配信息计算装置，对换算系数进行操作，计算该帧的位分配信息；数据重构装置，对位分配信息和换算系数进行操作，恢复出一组去量化子带样本；以及反映射装置，对去量化子带样本进行操作，恢复出一组数字音频信号的连续样本。

本发明还提供一种编码和解码系统的编码装置和相应的解码装置，把数字音频信号传送成如帧序列格式化的编码比特流，从而可以使必须分配给编码音频数据的换算系数的帧位数最少。这种系统的编码装置包含：

映射装置，对一组数字音频信号的样本，即其数据由一帧传送的一组样本进行操作，以获得多组子带样本，这些组分别对应于固定的多个子带；

换算系数计算装置，计算这些子带样本组的各换算系数；

包括存储装置的换算系数判断装置，把每个帧换算系数与存储在存储装置中的前一帧的相应换算系数进行比较，当检测到一致时，设置预定的把该换算系数对应于第一条件的换算系数标记，当检测到比较结果为不一致时，设置预定的把该换算系数对应于第二条件的换算系数标记；

位分配信息计算装置，对换算系数进行操作，计算该帧的位分配信息；

量化装置，根据位分配信息和换算系数量化子带样本；以及

帧打包装置，编码所选的换算系数，量化子带样本，组合成一帧作为格式化的位序列，它包括构成换算系数标记、编码换算系数和编码量化子带样本的各位组，而不包括位分配信息。

这种系统的相应解码装置包含：

帧解包装置，对每帧进行操作，分离出换算系数标记、所选的换算系数和量化子带样本；

包括存储器的换算系数恢复装置，判断各换算系数标记的条件，当判断出换算系数标记处于第一条件时，从对应于换算系数标记的子带的存储器位置上读取出换算系数，输出该换算系数，而当判断出换算系数标记处于第二条件时，输出该帧传送的所选择的换算系数中相应的一个，并把该换算系数写入到存储装置中；

位分配信息计算装置，对换算系数恢复装置产生的换算系数进行操作，计算该帧的位分配信息；

数据重构装置，对位分配信息和换算系数进行操作，恢复出一组去量化子带样本；以及

反映射装置，对去量化子带样本进行操作，恢复出一组数字音频信号的连续样本。

图1示出了根据本发明的音频信号编码方法的第一实施例的算法；

图2是第一音频信号编码方法实施例产生的编码比特流的各帧的结构图；

图3示出了根据本发明的音频信号编码方法的第二实施例的算法；

图4是第二音频信号编码方法实施例产生的编码比特流的各帧的结构图；

图5示出了根据本发明的音频信号解码方法的第一实施例的算法；

图6示出了根据本发明的音频信号解码方法的第二实施例的算法；

图7是根据本发明的音频信号编码装置的第一实施例的一般系统框图；

图8是根据本发明的音频信号编码装置的第二实施例的一般系统框图；

图9是根据本发明的音频信号解码装置的第一实施例的一般系统框图；

图10是根据本发明的音频信号解码装置的第二实施例的一般系统框图；

图11是图8的音频信号编码装置的换算系数判断部分执行的处理的流程图；

图12是图10的音频信号解码装置的换算系数恢复部分执行的处理的流程图；

图13是已有技术的音频信号编码装置的一个例子的一般系统框图；

图14是已有技术的音频信号编码装置的一个例子的一般系统框图；以及

图15、16和17分别示出了MPEG-1音频层1、层2和层3编码产生的编码数据流的帧结构。

下面参照图1和图2描述根据本发明的音频信号编码方法的第一实施例。图1示出了这种音频信号编码方法实施例的各种处理阶段，图2示出了所产生的编码比特流的帧格式。在图1中数字1指示映射阶段，分解PCM数字音频信号样本，获得子带样本。数字2指示换算系数计算阶段，数字3表示位分配信息计算阶段，数字4表示量化阶段，数字5表示帧打包阶段。如图2所示，编码数据比特流的每帧由首部21、校错部分22、一组编码换算系数和一组编码量化子带样本构成的音频数据部分23组成。此外，还可以包括辅助数据部分24。

本实施例的工作情况如下。在映射阶段1，对连接的PCM音频数据样本组进行变换处理，得到相应的映射样本组，该映射组中可用的样本数比相应的输入PCM样本组少，即会发生一些样本细化。假设映射操作由这些动作组成，对各连续的PCM音频数据样本组进行子带滤波，取得相应的子带样本组，即，把各连续的32个输入PCM音频数据样本组映射到相应的32个子带样本组，在一帧编码形式中传送三组这样的32个PCM音频数据样本组(96个样本)的内容。

在换算系数计算阶段2，每次从映射阶段1已获得的一个子带的完全的三个子带样本组，为了插入到帧中，计算该组样本的换算系数。也就是说，对于一帧计算各子带的各个换算系数。当要插入到帧中的所有样本都已产生时，在位分配信息分配阶段3使用已为各子带计算得到的32个换算系数，取得位分配信息。位分配信息指定各子带的量化级数，从而得以量化位数，在量化该子带的各子带样本时使用。

位分配信息分配阶段3的操作可以与ISO/IEC 11172-3附录C中描述的迭代位分配方法相似，但是与子带的各表征噪声比相对，应用于各子带的信噪比值。这种方法分配较大量化位数来量化换算系数值较小的各子带的子带样本，分配较小量化位数来量化换算系数值较大的各子带的子带样本，即，分配全部可用位数量化帧子带样本，以使量化样本的各信噪比基本相等。

在量化阶段4，根据已为该帧计算得到的位分配信息量化为该帧取得的子带样本。具体地说，对于每个子带，相应的子带样本组首先利用在位分配信息分配阶段2已计算得到的该子带的换算系数进行归一化，然后，利用位分配信息为该子带指定的量化位数量化这些归一化样本中的每个样本。

如果在位分配信息分配阶段3判断出计算得到的子带换算系数的幅度不够大，表示它不能实际用来量化取得的该子带的样本，则为该子带分配的换算系数为零，表示为该子带取得的样本未被量化和插入到当前帧中。然而，为这一子带计算得到的换算系数被插入到该帧中。

在帧打包阶段5，产生首部和校错数据，这些数据与量化子带样本组一起对应于已分配了非零量化位数的每个子带，对为所有子带取得的换算系数以及辅助数据进行编码，然后把得到的位组排列在图2所示的帧格式中。可以理解，每帧传送的音频数据23对应于固定数量的原始输入音频数据样本(例如96个样本)。

图2示出了该实施例产生的编码比特流的比特流格式。如图所示，从图2的帧格式中省略了插入到图15中所示的已有技术的MPEG-1层1帧格式的每帧中的位分配信息。

由于不必在每帧中分配位来传送位分配信息，对于本实施例，可以实现更高的编码效率。也就是说，可以比上述的已有技术的编码方法可能分配的更多的位数分配成量化帧的子带样本。这可以使帧长度比已有技术的方法更短，而不会使最终的音频信号再现质量变差。如果例如帧长度从MPEG-1层1的384个数字音频信号样本减少96个样本，则如上所述，假设构成一帧的总位数变成256，这些位中的32位分配给首部，则由于位分配信息所需要的128位变成可以使用的，所以现在每帧中可以有总计224位分配给编码换算系数和音频样本。也就是说，对于MPEG-1层1编码的原始帧长度，在上述的利用128kbit/s和1024bits/frame的比特率的例子中，对于每个数字音频信号样本有平均2.25位可用，对于本发明的第一实施例，如果帧长度减少到其原始值的1/4，这样，一帧中的换算系数和子带样本表示96个原始音频信号的样本，则平均224/96，即约为2.33位变为可用于数字音频信号样本。因此，可以减少帧长度，从而减少延时，而并不降低音频再现质量。

下面参照图3和图4描述根据本发明的音频信号编码方法的第二实施例。图3示出了这种音频信号编码方法实施例的各个处理阶段，图4示出了所产生的编码比特流的帧格式。在图3中，数字31指示映射阶段，其功能如上述的第一实施例的映射阶段1一样，数字32指示换算系数计算阶段，数字33表示换算系数确定阶段，34表示位分配信息计算阶段，数字35表示量化阶段，数字36表示该方法的帧打包阶段。如图4所示，编码数据比特流的每帧由首部41、校错部分42、由一组每个与特定一个子带相关的换算系数标记、一组编码换算系数和一组编码量化子带样本构成的音频数据部分43以及辅助数据部分44组成。

如上所述，每次在映射阶段31中处理一组输入PCM音频数据样本，取得分别对应于各子带的一组子带样本，一般仅为全部子带组中的一部分取得可用的子带样本。对于已有技术的MPEG-1音频编码方法，仅对已得出有效子带样本组的各子带的换算系数进行编码，并插入到一帧中，如此，在位分配信息中指定分配的位(相对于该帧，余下的子带在ISO/IEC 1172-3中称为“非传送子带”)。在传送的帧中省略换算系数是可能的，这是因为解码装置可以利用位分配信息确定包含在传送的帧内的换算系数与相应的子带之间的关系，即，已知如果为一子带分配零量化位，则不传输对应于该子带的换算系数。

然而，对于本发明，由于没有传送位分配信息，所以如后所述，对于每帧，必须所有子带的换算系数都可以解码处理时使用。

因此，根据本发明的音频信号编码方法的第二实施例被设计成在上述的第一实施例上进行改进，如下所述，使编码必须在每帧中传送的全部换算系数组的效率更高。

参照图3，在映射阶段31通过如第一实施例所述的子带滤波处理取得对应于各子带的连续子带样本组，为对应于一子带的每组连续子带样本计算换算系数)例如，3个子带样本，假设总计有32个子带，每帧传送96个音频数据样本内容)，在换算系数计算阶段32中，如前一方法实施例的位分配信息分配阶段2中所描述的一样。然而，对于本实施例，在换算系数判断阶段33时，当编码起始帧时，把取得的对应于子带的换算系数写入到各预定的存储器位置上。此后，在帧打包阶段36，每次编码新帧时，当计算子带的换算系数时，从存储器中读取出刚为该子带计算得到的前一个换算系数，并与新换算系数比较。如果这些换算系数不一致，则把新换算系数写入到存储器中，更新该子带的换算系数，并选出插入到当前帧中。然后把已预定对应于该子带的换算系数标记设置成预定状态，例如设置成1。然而，如果发现新计算得到的换算系数和从存储器中读取的换算系数一致，则把该子带的换算系数标记设置成其它状态，例如设置成0，在当前帧中不传送该子带的换算系数。在帧打包阶段36，把得到的所有子带的换算系数标记插入到编码比特流中。

在位分配信息计算阶段34，以与前面的实施例的位分配信息分配阶段3中相同的方法，根据为各子带取得的换算系数计算位分配信息。

在帧打包阶段36，把上述的一帧的所选换算系数编码成各个固定大小的位组，并与各子带的各个换算系数标记和量化编码样本组合成位序列，如图4所示，构成帧格式的音频数据部分43。即与表示首部分41、校错数据42和辅助数据44组合，构成整个帧。

因此，可以理解，本实施例提供了上述的前一实施例的优点，即，从各个传送帧中取消了位分配信息，而且提供了改进编码效率的优点，由于仅当各换算系数与前一帧的相应子带的换算系数不同，才把各换算系数插入到帧中。因此，与上述的第一实施例相比，音频信号编码方法的第二实施例能减少每帧中必须分配给换算系数的位数，从而使分配给子带样本的位数更多。因此，如上所述，为了减少编码延时，帧长度与已有技术相比缩短了，而编码数据流的比特率没有改变，所以利用第二实施例的方法可以进一步改进再现声音质量。

图5示出了对应于图1的音频信号编码方法的音频信号解码方法的实施例。它由帧解包阶段51、位分配信息计算阶段52、重构阶段53和反映射阶段54组成。在描述本实施例的操作之前，先讨论解码已编码音频数据样本所必须的基本信息。对于如图15所示的MPEG-1音频层1帧格式，由于仅当位分配信息把非零位数分配给子带的样本，才为子带传送一个换算系数，所以音频数据部分133的换算系数部分的长度是变化的。然而由于在每帧内都把位分配信息传送给解码器，所以解码可以快速地确定接收到的换算系数与各子带之间的对应关系，以及表示各编码音频样本的位组与各子带之间的对应关系。对于本发明的方法，由于在编码比特流中不传送位分配信息，所以解码器必须使用各帧的音频数据部分的换算系数部分内传送的换算系数计算位分配信息。然后可以把位分配信息用来取得表示各编码音频样本(即子带样本)的位组，正确地把这些它相应的子带相关。参照图2的帧格式的例子，由于在每帧中都传送32个子带的所有换算系数，每个换算系数被编码成例如6位，则音频数据部分23的换算系数部分的长度被固定成192位，这样音频数据部分23的编码样本部分的起始位置是固定的。通过产生帧的位分配信息，解码装置可以确定已分配了零位的那些子带，以及已分配给其它每个子带的每个量化样本的相应各位数。从而这些子带样本可以根据帧的音频数据部分23的音频样本部分得到，正确地与它们相应的子带相关。

现在参照图5，在帧解包阶段51，分析每帧，如图2所示，把它分离成其各个分量部分，即首部、校错数据、换算系数等，并解码和输出这些数据。在位分配信息计算阶段52，把从帧中取出的换算系数用来计算该帧的位分配信息。在重构阶段53，把位分配信息与上述的该帧的换算系数一起用来去量化该帧的音频数据部分23的子带样本。在反映射阶段54，对子带样本进行反映射处理，也就是说，进行从频率域返回到时间域的变化，从该帧传送的子带样本恢复出原始数字音频信号样本组(例如，96个数字音频信号样本)。

因此，可以理解，图1的编码器实施例与图5的解码器实施例组合可以把编码音频数据传送成帧序列，而不需要把已有技术中必须的位分配信息插入到每帧中。因此，每帧中有更多的位数可用来分配给编码音频数据样本。因而，可以使用更短的帧长度，如上所述，相应地使编码延时值更小，而不会改变编码数据流的比特率，不会降低音频再现的质量。

图6示出了对应于图3的音频信号编码方法的音频信号解码方法的实施例。它由帧解包阶段61、位分配信息计算阶段63、重构阶段64和反映射阶段65组成，其功能对应于上述的图5所示实施例的帧解包阶段51、位分配信息计算阶段52、重构阶段53和反映射阶段54。然而，如参照图4所述，由于图3的音频信号编码方法使编码比特流传送成包含换算系数标记的帧，图6的音频信号解码方法实施例包括换算系数恢复阶段62，其功能是利用换算系数标记传送的信息产生每个接收到的帧的完整的换算系数组，即，分别对应于各子带的换算系数。

对于图6的实施例，当接收到编码比特流的帧时，在帧解包阶段61，取出表示量化子带样本的位组，还有所有子带的换算系数以及如参照图3和图4所示描述的一样，那些已被选出要在该帧中传送的换算系数。换算系数恢复阶段62中进行的对每个接收到的帧的处理如下。按序检查接收到的帧的换算系数标记。如果第一换算系数标记的状态指示已选出在该帧中要传送的相应的换算系数，则把该帧的接收到的换算系数的第一个系数设置到存储器中(即已预定成对应于该换算系数的子带所用的存储器的位置)，作为相应子带的更新存储换算系数。如果第一换算系数标记的状态指示在该帧中没有传送相应的换算系数，则从存储器中读取出存储在预定由对应于该换算系数标记的子带使用的存储器位置内的换算系数。该过程对接收到的每个换算系数标记连续重复，从而获得接收到的帧的所有换算系数组，从接收到的帧中获得每个换算系数，或者从存储器中读取换算系数。

以与图5的实施例相同的方式，在位分配信息计算阶段63利用在换算系数恢复阶段62中获得的换算系数产生接收到的帧的位分配信息。位分配信息与从帧中取得的换算系数一起用于在重构阶段64对从接收到的帧中取得的量化子带样本去量化，这样，恢复出对应于每个子带的各子带样本组。在反映射阶段65，执行这些子带样本的反映射，恢复其内容由接收到的帧传送的完整的时间域的PCM数字音频信号样本(例如96个样本)。

可以理解，由于仅当换算系数与前一帧中相应的子带的换算系数不同时，才把换算系数编码和插入到帧中，因此图3的编码方法实施例结合图6的解码方法实施例可以比图1的编码方法实施例与图5的解码方法实施例的结合可能达到的音频数据编码效果更高。因此，可以有更多的位数分配给编码子带样本，这样进一步改善了音频再现质量。

下面参照图7的一般系统框图描述根据本发明的音频信号编码装置的第一实施例，它实现了上述的图1的第一音频信号编码方法。图7的音频信号编码装置由映射部分71构成，它包含一排子带滤波器，以把输入的连续的PCM数字音频信号样本组分解成多个子带的各个子带的子带样本。为进行描述，再假设使用32个子带，由映射部分71响应于每个32个输入音频数据样本组，产生32个子带样本(即每个子带一个样本)。换算系数计算部分72从映射部分71接收要插入到各帧中的子带样本，并计算每个子带的各换算系数。把换算系数提供给位分配信息计算部分73，产生位分配信息，指示要分配给每个子带的各个位数，以便对一帧的该子带的各个子带样本进行量化。把一帧的子带样本、换算系数和位分配信息提供给量化部分74，根据位分配信息指示的量化位数对各子带的子带样本进行量化(即，位分配信息指示的非零量化位数的各子带)。

把一帧的量化子带样本、换算系数和辅助数据提供给帧打包部分75，产生该帧的首部和校错数据，并把该帧的首部、校错数据、量化子带样本、换算系数和辅助数据编码成具有图2所示和上述格式的比特流。假设映射部分71处理三组连续的数字音频样本，得到每帧的子带样本，即，如果每帧以编码形式传送96个输入PCM数字音频信号样本，则每帧的音频数据部分包含所有为子带取得的32个换算系数，这三个子带样本组的各组对应于该帧的位分配信息已分配的非零量化位数的各子带。然而，位分配信息本身并不包含在该帧内，所以如上面第一音频信号编码方法中所描述的，获得了这样的优点，即可用于编码音频数据的位数增加了。

下面参照图8的一般系统框图描述根据本发明的音频信号编码装置的第二实施例，它实现了上面描述的图3的第二音频信号编码方法。该音频信号编码装置由映射部分81、位分配信息计算部分84、换算系数判断部分83、量化部分85和帧打包部分86组成。映射部分81可以被构置成与上述的图7的映射部分71一样，把映射部分81的一帧的各子带的子带样本组提供给位分配信息计算部分84，计算每个子带的各换算系数。把计算得到的换算系数提供给换算系数判断部分83和量化部分85。换算系数判断部分83包含存储器(图中未示出)，具有预定成对应于各个子带的各存储器位置，并执行图11的流程图中所示的形式的算法(其中再假设子带数为32个)。如图所示，换算系数判断部分83连续地检查一帧的每个换算系数，判断该换算系数是否与前一帧的相应子带的换算系数相同，如果是后者，则从存储器中读取换算系数。如果不同，则把新的换算系数写入到该子带的存储器位置上，选择该换算系数由当前帧传送，而把相应的换算系数标记设置到预定的相应的条件，例如1。否则，把相应的换算系数标记设置成其它条件，例如0。

把换算系数标记提供给帧打包部分86，把选择的换算系数从换算系数判断部分83提供给量化部分85和帧打包部分86。

如前一实施例所述的一样，量化部分85对一帧的换算系数进行操作，取得该帧的位分配信息，把位分配信息提供给帧打包部分86，用于量化已分配了非零量化位数的各子带的子带样本。

把一帧的量化子带样本、换算系数、换算系数标记和辅助数据提供给帧打包部分86，产生该帧的首部和校错数据，并把该帧的首部、校错数据、量化子带样本和辅助数据编码成相应位序列，以如上所述的图4所示的帧格式把它与该帧的换算系数标记组合。

因此，由于仅把每个与前一帧中的相应子带的换算系数不同的换算系数插入到当前帧中，因此，对于本编码实施例，与图8所示的第一音频信号编码方法实施例相比，进一步增加了可以用来量化表示帧传送的音频数据的子带样本的帧位数。

下面参照图9的一般系统框图描述根据本发明的音频信号解码装置的第一实施例，它实现了上述的图5的第一音频信号解码方法。图9的音频信号解码装置由接收具有图2所示的帧格式的编码比特流的帧解包部分91、位分配信息计算部分92、数据重构部分93和反映射部分94组成。帧解包部分91分析每个接收到的帧，把它分离成如图2所示的各个分量部分，即首部、校错数据、换算系数、量化子带样本和辅助数据，并解码和输出它们，把换算系数提供给位分配信息计算部分92和数据重构部分93，把量化子带样本提供给数据重构部分93。

位分配信息计算部分92使用与图6的编码器实施例的重构阶段53所用的相同的算法，根据从该帧取得的换算系数计算该帧的位分配信息。数据重构部分93利用该位分配信息(即，为每个子带指示在编码时量化该子带的各子带样本时所用的量化位数的信息)以及子带的各换算系数，去量化该帧传送的子带样本。在反映射部分94中，把在编码时执行的反映射处理加到每个接收到的帧的去量化子带样本上，恢复其数据由该帧传送的数字音频信号样本组。

可以理解，图7的编码器实施例与图9的解码器实施例相结合可以使数字音频信号编码和解码系统把数字音频信号传送成要提供的编码比特流，把编码音频数据传送成帧序列，而不需要把位分配信息插入到每帧中，从而使在每帧中有更多的帧位数分配给编码音频数据，所以与已有技术相比，使帧长度缩短，整个编码和解码处理时产生的整体延时也实质性减少，并且不改变编码数据流的比特率，不会使音频再现质量变差。

下面参照图10的一般系统框图描述根据本发明的音频信号解码装置的第二实施例，它实现了图6所述的和上述的音频信号解码方法的第二实施例。图10的音频信号解码装置由接收具有图4所示的帧格式的编码比特流的帧解包部分101、换算系数恢复部分102、位分配信息计算部分103、数据重构部分104和反映射部分105组成。帧解包部分101分析每个接收到的帧，把它分离成图4所示的各个分量部分，即首部、校错数据、换算系数标记、换算系数、量化子带样本以及辅助数据，并编码和输出它们，把上述所选的换算系数与所有子带的换算系数标记一起提供给换算系数恢复部分102，把量化子带样本提供给数据重构部分104。

换算系数恢复部分102起到根据这些子带的各换算系数标记的状态，对每个接收到的帧，恢复所有子带的全部换算系数组的作用。换算系数恢复部分102包含一个存储器(图中未示出)，它具有预定对应于各个子带的各存储器位置，换算系数恢复部分102执行如图12的流程图所示的算法(其中，再假设子带数为32)。如图所示，在图12所示的反复循环中，换算系数恢复部分102按序检查接收到的帧传送的换算系数组。在每次循环中，换算系数恢复部分102判断是否应从存储器中读取对应于前一帧的子带的换算系数并提供给当前接收到的帧，或者是否使用接收到的帧传送的换算系数序列的下一个。在后一种情况下，把接收到的帧传送的换算系数写入到预定给相应的子带的存储器位置上，更新前面的换算系数。这样，根据部分换算系数组和该帧传送的换算系数标记，为每个接收到的帧获得了对应于子带的所有换算系数组。

位分配信息计算部分103用与图8的编码实施例的量化部分85所使用的相同的算法根据由换算系数恢复部分102提供的换算系数计算每个接收到的帧的位分配信息。数据重构部分104利用该位分配信息以及子带的各换算系数，去量化该帧传送的子带样本。把去量化子带样本提供给反映射部分105，进行与图10的编码装置的映射部分81相反的反映射处理，恢复其数据由接收到的帧传送的数字音频信号样本组。

因此可以理解，图8的编码器实施例与图10的解码器实施例结合可以使数字音频信号编码和解码系统把数字音频信号传送成要提供的编码比特流，把编码音频数据传送成帧序列，而不需要在每帧中插入已有技术必须的位分配信息，而且，仅仅传送与前一帧的相应子带的换算系数不同的那些换算系数，从而使每帧中分配给编码音频数据的帧位数更多，所以，与已有技术相比，可以减少帧长度，使整个编码和解码处理时产生的整个延时实质上减少，而且不需要改变编码数据传送的比特率，不会使音频再现质量变差。

Claims

1、一种编码数字音频信号的方法，产生各连接的帧，构成编码比特流，包含：

进行映射处理，把要由一帧传送的所述数字音频信号的数据样本组转换成多个子带样本组，所述多个子带样本组对应于多个子带中的各子带，

对所述子带样本组进行操作，得到分别对应于所述子带的多个换算系数，

根据所述换算系数，计算对应于每个所述子带的相应位分配信息组，

根据相应子带的位分配信息和换算系数量化每个所述子带样本，以及

编码所述换算系数和量化子带样本，把所述帧组合成格式位序列，包括表示所述编码换算系数和所述编码量化子带样本的各位组，但不包括所述位分配信息。

2、一种编码数字音频信号的方法，产生各连接的帧，构成编码比特流，包含：

对每个所述子带，把所述相应的换算系数与所述帧前一帧的对应于所述子带的换算系数比较，当所述比较结果为一致时，把预定对应于所述第一条件的换算系数标记设置到第一条件，而当所述比较结果为不一致时，把所述换算系数标记设置到第二条件，

根据所述换算系数，计算对应于每个所述子带的各位分配信息组，

对于每个所述子带，根据位分配信息和已为所述子带计算得到的换算系数量化相应的子带样本，以及

选择检测到所述一致的每个所述换算系数，编码所述换算系数和量化子带样本，把所述每帧组合成格式位序列，包括表示所述换算系数标记、所述编码换算系数和所述编码量化子带样本的各位组，但不包括所述位分配信息。

3、一种解码数字音频信号的方法，该数字音频信号已根据所述权利要求1的方法被编码成格式比特流，其中解码构成所述编码比特流的每个所述帧的步骤包含：

从所述帧中分离出所述换算系数和所述量化子带样本，

使用所述换算系数，计算所述位分配信息，

使用所述位分配信息和所述换算系数，去量化所述子带样本，

对所述去量化子带样本进行反映射处理，恢复所述数字音频信号的相应的连续样本组。

4、一种解码数字音频信号的方法，该数字音频信号已根据所述权利要求2的方法被编码成格式比特流，其中解码构成所述编码比特流的每个所述帧作为一个当前帧的步骤包含：

从所述帧中分离出所述换算系数标记、所述换算系数和所述量化子带样本，

连续判断每个所述换算系数标记，当发现所述每个换算系数标记处于所述第一条件时，指示使用对应于所述换算系数标记的所述帧的前一帧的子带的换算系数，而当发现所述每个换算系数标记处于所述第二条件时，指示使用所述当前帧传送的所述所选换算系数中相应的一个换算系数，

使用所述指定的换算系数，计算所述位分配信息，

5、一种把数字音频信号编码成帧序列的装置，帧序列构成编码比特流，该装置包含：

映射装置(71)，耦合成接收所述数字音频信号，对由一帧传送的所述数字音频信号的样本组进行映射操作，获得多个子带样本组，所述子带样本组对应于固定的多个子带中的各个，

换算系数计算装置(72)，对所述子带样本组进行操作，计算分别对应于所述子带的多个换算系数，

位分配信息计算装置(73)，对所述换算系数进行操作，计算分别对应于所述子带的多个位分配信息组，

量化装置(74)，根据相应的位分配信息和换算系数，量化每个所述子带样本组，获得对应于所述子带的各个量化子带样本组，

帧打包装置(75)，对所述换算系数和量化子带样本进行编码，把所述每帧组合成格式位序列，包括表示所述编码换算系数和所述编码量化子带样本的各位组，但不包括所述位分配信息。

6、一种把数字音频信号编码成帧序列的装置，帧序列构成编码比特流，该装置包含：

映射装置(81)，耦合成接收所述数字音频信号，对由一帧传送的所述数字音频信号的样本组进行映射操作，获得多个子带样本组，所述子带样本组对应于固定的多个子带中的各个，

换算系数计算装置(82)，对所述子带样本组进行操作，计算分别对应于所述子带的多个换算系数，

包括具有预定成分别对应于所述子带的多个存储器位置的存储装置的换算系数判断装置(83)，把一帧的每个所述换算系数与存储在所述存储器中的属于所述帧的前一帧的相应换算系数进行比较，当所述比较结构为一致时，把预定成对应于所述每个换算系数的换算系数标记设置成第一条件，当所述比较结构为不一致时，把所述换算系数标记设置成第二条件，选择要编码的所述第个换算系数，并把所述换算系数写入到所述存储器位置相应的位置上，

位分配信息计算装置(84)，耦合成从所述换算系数计算装置接收所述换算系数，对所述每个帧的所述换算系数进行操作，计算对应于所述子带的各个子带的位分配信息组，

量化装置(85)，量化对应于一帧的所述子带样本组，利用所述位分配信息组中相应的一个使所述子带样本对应于各所述子带，和

帧打包装置(88)，对已选出要编码的换算系数的所述一些换算系数进行编码，并对所述量化子带样本进行编码，把所述每个帧组合成格式序列，包括表示所述换算系数标记、所述编码换算系数和所述编码量化子带样本的各位组，但不包括所述位分配信息。

7、一种解码数字音频信号的装置，该数字音频信号已被根据权利要求5的编码装置编码成格式为一串帧的编码比特流，所述装置包含：

帧解包装置(91)，对每个所述帧进行操作，从所述每个帧中分离出所述换算系数和所述量化子带样本，

位分配信息计算装置(92)，耦接成从所述帧解包装置接收所述换算系数，对所述每个帧的所述换算系数进行操作，计算所述位分配信息，

数据重构装置(93)，耦接成接收所述每个帧的所述量化样本和所述位分配信息，对所述位分配信息和所述换算系数进行操作，恢复出去量化子带样本组，

反映射装置(94)，对所述去量化子带样本进行反变换处理，恢复所述数字音频信号的连续样本组。

8、一种解码数字音频信号的装置，该数字音频信号已被根据权利要求6的编码装置编码成格式如一串帧的编码比特流，所述装置包含：

帧解包装置(101)，对每个所述帧进行操作，从所述每个帧分离出所述换算系数标记、所述所选的换算系数和所述量化子带样本，

换算系数恢复装置(102)，包括具有预定成分别对应所述子带的多个存储器位置的存储装置，耦接成接收所述每个帧的所述换算系数标记和所述所选的换算系数，判断每个所述换算系数标记的条件，当换算系数标记被判断成处于所述第一条件时，从对应于所述换算系数标记的子带的存储器位置上读出换算系数，并输出所述换算系数，而当判断出所述换算系数标记处于所述第二条件时，输出所述每个帧传送的所述所选的换算系数中相应的一个换算系数，并把所选的换算系数中所述相应的一个换算系数写入到所述存储器位置上，

位分配信息计算装置(103)，耦接成接收换算系数恢复装置(102)产生的所述换算系数，对所述每个帧的所述换算系数进行操作，计算所述位分配信息，

数据重构装置(104)，耦接成接收所述每个帧的所述量化样本和所述位分配信息，对所述位分配信息和所述换算系数进行操作，恢复去量化子带样本组，以及

反映射装置(105)，对所述去量化子带样本进行反变换处理，恢复所述数字音频信号的连续样本组。

9、一种编码和解码系统，把数字音频信号传送成编码比特流，包含如权利要求5中要求的数字音频信号编码装置与如权利要求7要求的数字音频信号解码装置的组合。

10、一种编码和解码系统，把数字音频信号传送成编码比特流，包含如权利要求6中要求的数字音频信号编码装置与如权利要求8要求的数字音频信号解码装置的组合。