CN1372683A

CN1372683A - 改善音频信号编码效率的方法

Info

Publication number: CN1372683A
Application number: CN00812488A
Authority: CN
Inventors: J·奥延佩雷
Original assignee: Nokia Inc
Current assignee: Origin Asset Group Co Ltd
Priority date: 1999-07-05
Filing date: 2000-07-05
Publication date: 2002-10-02
Anticipated expiration: 2020-07-05
Also published as: EP1587062B1; DE60021083T2; AU761771B2; JP4426483B2; US20060089832A1; US7289951B1; KR100545774B1; BRPI0012182B1; AU5832600A; ATE418779T1; EP1203370A1; CA2378435A1; KR20050085977A; JP2003504654A; CN1235190C; CN100568344C; BR0012182A; DE60041207D1; EP1587062A1; ES2244452T3

Abstract

本发明涉及用于改善音频信号的编码精度以及传输效率的方法。依据本发明,将要编码的音频信号的一部分与该音频信号在先存储的采样进行比较,确定出与所述音频信号最相符的采样基准序列。通过长期预测,使用至少两种不同的LTP阶(M),以及用于每种间距预测阶的一组间距预测系数(b(K)),从该基准序列中产生出预测信号。将对预测信号进行编码所需的信息量与对原始信号进行编码所需的信息量进行比较,并选取能最好地表示音频信号,同时能使所需数据量最小的一种编码方法。

Description

改善音频信号编码效率的方法

本发明涉及如本发明附加权利要求1的前序所述的一种方法，用于改善音频信号的编码效率。本发明还涉及如附加权利要求21的一种数据传输系统、涉及如附加权利要求27前序部分的一种编码器、涉及如附加权利要求30前序部分的一种解码器、并涉及如附加权利要求38前序部分的一种解码方法。

一般来说，音频编码系统从诸如象语音信号这样的一种模拟音频信号中产生出编码信号。通常，借助于专用于某种数据传输系统的数据传输方法，将编码信号传送到一个接收机。在接收机中，音频信号的产生是以编码信号为基础的。将要传输的信息量例如受对系统内的信息进行编码所用的带宽的影响，同时还受执行编码的编码效率的影响。

为了编码，例如以0.125ms的固定的时间间隔，从模拟信号中产生出数字采样。通常，是以固定大小的组，例如是以具有大约20ms的间隔的组为单位来处理这些采样的。这样一组一组的采样也被称作“帧”。一般来说，帧是处理音频数据的基本单位。

音频编码系统的目的在于：产生在可用带宽内尽可能好的一种音质。为此，可以利用音频信号内，特别是语音信号内出现的周期性。语音的周期性例如是源于声带的振动。通常，振动的周期处于2ms到20ms的级别内。在已有技术的众多语音编码器中，使用了已知的一种长期预测(LTP)的技术，其目的是估计并利用这种周期性，以提高编码处理的效率。这样，在编码期间，将编码信号的所述部分(帧)与该信号的在先编码部分相比较。如果一个相似的信号位于在先编码部分，则检验该相似编码与将要编码的信号之间的时间延迟(滞后)。以该相似信号为基础，构成表示将要编码的信号的一个预测信号。另外，还产生了一个误差信号，它表示预测信号和将要编码的信号之间的差异。这样，非常方便地执行了编码，使得只传送滞后信息和误差信号。在接收机内，从存储器中检索出正确采样，用于对将要编码的信号部分进行预测，并基于滞后，与误差信号进行组合。在算术上，这种间距预测器可被看作执行了一种滤波操作，它可以由以下传输函数来表示：

P(z)＝β_Z ^-α

上述等式表示一阶间距预测器的传输函数。β是间距预测器的系数，α是周期性的延迟。在更高阶的间距预测滤波器的情况下，有可能使用更一般的传输函数：

P (z) = Σ_{k = - m_{1}}^{m_{n}} β_{k^{Z}} - (z + k)

其目的是以这样一种方式，为每一帧选取系数β_k，使得编码误差，即实际信号与利用在先采样构成的信号之间的差异，尽可能地小。能非常方便地选出编码时所使用的这些系数，这些系数使得在使用最小二乘法时，可以获取最小误差。能非常方便地一帧一帧地更新这些系数。

美国专利No.5,528,629公开了一种已有的语音编码系统，它采用了短期预测(STP)，同时还有一阶长期预测。

已有的编码器具有这样一种缺陷：没有注意到音频信号的频率与其周期性之间的关系。这样，不能在所有状态下，有效利用信号的周期性，从而编码信息量变得不必要地长，或接收机中所重建的音频信号的音质恶化。

在某些情况下，例如，当音频信号具有高度的周期特性，并很少随时间变化时，单独的滞后信息就可提供一个良好的主要部分，用于信号预测。在这种情况下，没有必要使用高阶间距预测器。在某些其它情况下，也存在相反的情形。滞后不必是采样间隔的整数倍。例如，滞后可以位于音频信号的两个连续采样之间。在这种情况下，高阶间距预测器可以有效地内插在多个离散采样时间之间，以提供对信号的更精确的表示。另外，作为频率的函数，高阶间距预测器的频率响应趋于减小。这意味着：高阶间距预测器为音频信号内的低频分量提供了较好的模型。在语音编码中，由于与高频分量相比，低频分量对语音信号的可觉察的品质具有更重要的影响，因而上述高阶间距预测器是一种优势。因此，应当理解，非常需要的是能依据信号的演化，而改变用于预测音频信号的间距预测器的阶数。采用固定阶的间距预测器在某些情况下过于复杂，同时也不能充分模拟其它情况下的音频信号。

本发明的一个目的是在数据传输系统内实现一种方法，用于改善音频信号的编码精度和传输效率，与已有技术的方法相比，在本发明中，音频信号被编码到一个更高的精度，并以更高的效率被传输。在依据本发明的编码器中，其目的是尽可能精确地对将要编码的音频信号一帧一帧地预测，同时，确保所要传输的信息量保持为低。依据本发明的方法的特征在于附加权利要求1的特征部分所述的内容。依据本发明的数据传输系统的特征在于附加权利要求21的特征部分所述的内容。依据本发明的编码器的特征在于附加权利要求27的特征部分所述的内容。依据本发明的解码器的特征在于附加权利要求30的特征部分所述的内容。此外，依据本发明的解码方法的特征在于附加权利要求38的特征部分所述的内容。

与已有的解决方案相比，本发明具有相当大的优势。与已有技术的方法相比，依据本发明的方法使得能更有效地对音频信号进行编码，同时确保表示编码信号所需的信息量保持为低。与已有技术的方法相比，本发明还允许以更灵活的方式来执行对音频信号的编码。可以以这样一种方式实现本发明，该方式特别考虑了对音频信号进行预测的精度(质量上最高)，特别考虑了减少表达编码音频信号所需的信息量(数量最少)，或交替使用这两种方法。使用依据本发明的方法，有可能更好地考虑存在于音频信号内的不同频率的周期性。

以下，将参照附图，详细说明本发明，其中：

图1显示了依据本发明一个最佳实施例的一种编码器，

图2显示了依据本发明一个最佳实施例的一种解码器，

图3是一种简化框图，该图显示了依据本发明一个最佳实施例的一种方法，

图4是一个流程图，它显示了依据本发明一个最佳实施例的一种方法，以及

图5a和5b是由依据本发明一个最佳实施例的编码器所产生的数据传输帧的例子。

图1是一个简化框图，它显示了依据本发明一个最佳实施例的编码器1。图4是一个流程图400，它说明了依据本发明的方法。编码器1例如可以是无线通信设备2(图3)的语音编码器，用于将音频信号转换为将要在数据传输系统中传送的编码信号，这种数据传输系统例如可以是移动通信网或互联网。这样，就可以非常方便地将解码器33安装在移动通信网的基站内。与此相对应，如果需要，可以在模拟-数字转换器4内，将模拟音频信号，例如是由麦克风29产生并在音频单元30内放大的一个信号，转换为数字信号。转换精度例如为8或12比特，连续采样之间的间隔(时间分辨率)例如是0.125ms。很明显，本说明书中所出现的数值仅仅是用于说明本发明的例子，并不能限制本发明。

所获得的来自音频信号的采样，被存储在采样缓冲器(未示出)中，可以用这样一种已知方式来实现存储，例如可以存储在无线通信设备2的存储装置5中。可以以逐帧为基础，来执行音频信号的编码，这样，预定数目的采样被传送到将要执行编码的编码器1，所述预定数目的采样例如可以是20ms的时间段(＝160个采样，假定连续采样之间的时间间隔为0.125ms)内所产生的采样。将要编码的一帧的采样被很方便地传送到变换单元6，在该单元内，例如可以借助于一种改进的离散余弦变换(MDCT)，将音频信号从时域变换到一个变换域(频域)。变换单元6的输出提供了一组值，这些值表示被变换信号在频域内的特性。在图4的流程图中，由方框404表示这种变换。

将时域信号变换到频域的另一种实现手段，是由几个带通滤波器组成的滤波器组。每一个滤波的通带相当窄，其中，这些滤波器输出端上的信号幅度表示所要变换的信号的频谱。

滞后单元7确定：在指定时刻，哪个在先采样序列与将要编码的帧最匹配(方框402)。很方便以这样一种方式来实现这一级的滞后的确定，滞后单元7将存储在基准缓冲器8内的值与将要编码的帧的采样进行比较，并利用例如可以是最小二乘法，来计算将要编码的帧的采样与基准缓冲器内存储的相应的采样序列之间的误差。最好是，选择由连续采样构成、并具有最小误差的采样序列，作为采样的基准序列。

当滞后单元7从所存储的采样中选出采样的基准序列时(方框403)，滞后单元7将与之有关的信息传送到系数计算单元9，以便对间距预测系数进行估计。这样，在系数计算单元9中，就以采样基准序列内的采样为基准，对不同的间距预测器的阶，例如是1，3，5和7，计算间距预测系数b(k)。之后，所计算出的系数b(k)被传送到间距预测单元10。在图4的流程图中，这些阶段被显示在方框405-411内。很明显，这里所出现的阶数仅仅是举例，用于说明本发明，而不是限制本发明，可实施的阶数也可以与本文中所出现的四种阶数完全不同。

在计算出间距预测系数之后，对其进行量化，这样就获得了经量化的间距预测系数。最好以这样一种方式对间距预测系数进行量化，使得在无误差数据传输条件下，接收机解码器33内所产生的重建信号尽可能地接近原始信号。在对间距预测系数进行量化时，使用最高分辨率(可能是最小的量化阶距)是非常有利的，以便能使舍入误差最小。

在采样基准序列内的存储采样被传送到间距预测单元10，在该单元中，利用所计算出的、并经量化的间距预测系数b(k)，为每一个间距预测阶数产生了一个预测信号。每一个预测信号代表对将要编码的信号的预测，它是利用所讨论的间距预测阶数而估计出的。在发明的当前最佳实施例中，预测信号还被传送到第二变换单元11，在该第二变换单元内，这些数据被变换到频域。第二变换单元11利用两个或更多不同的阶，来执行变换，其中，产生了与利用不同的间距预测阶数而预测出的信号相应的成组的变换值。可以以这样一种方式来实现间距预测单元10以及第二变换单元11，使得它们对每个间距预测阶执行必要的操作，或者是，对每一阶，实现单独的一个间距预测单元10和单独的一个第二变换单元11。

在计算单元12中，将预测信号经频域变换后的值，与所得到的来自变换单元6的、将要编码的音频信号经频域变换后的表示法进行比较。通过获取将要编码的音频信号频谱与利用间距预测器所预测出的信号频谱之间的差异，而计算出一个预测误差信号。非常有利的是，预测误差信号包括一组预测误差值，该组预测误差值与将要编码的信号频率分量和预测信号的频率分量之间的差相对应。例如可以用音频信号的频谱与预测信号的频谱之间的平均差来表示的编码误差，也被计算出来。最好是，利用最小二乘法来计算编码误差。可以使用任何其它合适的方法，包括以音频信号的心理声学模型为基础的方法，来确定能最好地表达将要编码的音频信号的预测信号。

在单元12中，还对编码效率度量(预测增益)进行了计算，以便确定将要传送给传输信道的信息(方框413)。其目的是使所需传送的信息量(比特)最小(数量最小)，同时也使信号内的失真最小(质量最高)。

为了能以存储在接收设备内的预先采样为基础，在接收机内重建信号，必须向接收机传送与阶、滞后相关的信息、与预测误差相关的信息，例如是用于所选阶的、经量化的间距预测系数。非常有利的是，编码效率度量指出：是否有可能利用比传送与原始信号有关的信息更少数目的比特，来传送对在间距预测单元10中经过编码的信号进行解码所需的信息。例如，可以以这样一种方式来实现这种判定，使得如果解码所必需的信息是利用特定的间距预测器来产生的，则第一基准值被定义为表示将要传送的信息量。另外，如果解码所必需的信息是以原始音频信号为基础形成的，则将第二基准值定义为表示所要传送的信息量。编码效率度量刚好是第二基准值与第一基准值的比值。表达预测信号所需的比特数目，例如可以取决于间距预测器的阶数(即将要传送的系数的数目)、每个系数所表示的(被量化的)精度、还有与预测信号相关的误差信息的量和精度。另一方面，传送与原始音频信号相关的信息所需的比特数目，例如可以取决于音频信号在频域内的精度。

如果以这种方式所确定的编码效率大于壹，则表示可以利用比与原始信号相关的信息少的比特数，来传送对预测信号进行解码所必需的信息。在计算单元12中，对于这两种不同选择的传送，确定它们所需的比特数目，并选出所需比特数目较小的那个方案(方框414)。

依据本发明的第一实施例，选择用于获取最小编码误差的间距预测器的阶，对音频信号进行编码(方框412)。如果用于所选间距预测器的编码效率度量大于壹，则选择与预测信号相关的信息，用于传输。如果编码效率信息不大于壹，则将要传送的信息是依据原始音频信号构成的。依据本发明的这个实施例，重点在于使预测误差最小(品质最高)。

依据本发明的第二个有益的实施例，为每一个间距预测器的阶，计算其编码效率度量。从那些编码效率度量大于壹的阶中，选取一个能提供最小编码误差的间距预测器的阶，用于对音频信号进行编码。如果没有一个预测编码器的阶能够提供一个预测增益(即没有编码效率度量大于壹)，则可以依据原始音频信号，而形成将要传送的信息。本发明的这一实施例使得在预测误差和编码效率之间进行了折中。

依据本发明的第三实施例，为每个间距预测器的阶，计算编码效率度量，从那些其编码效率度量大于壹的阶中，选出能提供最大编码效率的阶，对音频信号进行编码。如果没有一个间距预测器的阶能提供一个预测增益(即没有一个编码效率度量大于壹)，则所要传送的信息的构成，是以原始音频信号为基础的。这样，本发明的这个实施例的着眼点在于，使编码效率最高(数量最小)。

依据本发明的第四实施例，为每个间距预测器的阶，计算编码效率度量，选出能提供最大编码效率的阶，对音频信号进行编码，即便是没有编码效率大于壹。

对编码误差的计算以及与间距预测器的阶的选择是在每帧之间的间隙执行的，并且，最好是为每一帧分别执行上述操作，其中，在不同的帧内，有可能使用与指定时间处的音频信号特性最相符的间距预测阶数。

如上所述，如果在单元12内所确定的编码效率不大于壹，这表示传送原始信号的频谱非常有利，其中，将要传送到数据传输信道的位串501是以下述方式构成的(方框415)。在来自计算单元12的、与所选传输相关的信息被传送到选择单元13(图1中的线D1和D4)。在选择单元13中，经频域变换的表示原始音频信号的值被选出，传送到量化单元14。对于将原始音频信号经过频域变换后的值传送到量化单元14这一过程，是由图1的框图中的线A1所表示的。在量化单元14中，以所述方式对经过频域变换的信号值进行量化。量化值被传送到多路复用单元15，在该单元中，形成了将要传送的位串。图5a和5b显示了一种位串结构的一个例子，它可以有利地应用于本发明。与所选编码方法相关的信息，被从计算单元12传送到多路复用单元15(线D1和D3)，在这里，位串是依据传输选择而形成的。第一逻辑值，例如是逻辑0状态，被用作编码方法信息502，以指明表示原始音频信号的经过频域变换后的值是以所讨论的位串的形式传送的。除了编码方法信息502外，这些值本身也以被量化到指定精度的位串的形式进行传输。在图5a中，将用于传送这些值的字段标以参考号503。每个位串中所传送的值的数量，取决于采样频率，以及在一个时刻所检验到的帧的长度。在这种情况下，由于在接收机内，是依据位串501中所传送的原始音频信号的频域内的值，来重建信号的，因此，不传送间距预测器的阶信息、间距预测系数、滞后以及误差信息。

如果编码效率大于壹，则可以很方便是使用所选的间距预测器，对音频信号执行编码，并可以以下述方式(方框416)，形成将要传送到数据传输信道的位串501(图5b)。与所选传输选择相关的信息，被从计算单元12传送到选择单元13。这一过程，是由图1的方框中的线D1和D4来表示的。在选择单元13中，选取经量化的间距预测系数，将其传送到多路复用单元15。这一过程由图1框图内的线B1来表示。很明显，也可以不通过选择单元13，而使用另一条路径，将间距预测系数传送到多路复用单元15。将要传送的位串是在多路复用单元15内形成的。与所选编码方法有关的信息，被从计算单元12传送到多路复用单元15(线D1和D3)，其中，是依据传输选择而形成位串的。第二逻辑值，例如是逻辑1状态，被用作编码方法信息502，以表明是以所讨论的位串的形式，传送所述经量化的间距预测系数的。依据所选间距预测阶数，来设定一个阶字段504的比特。如果，有可能有4个不同的阶，则2比特(00，01，10，11)足以表明：在指定时间，选择了哪一阶。另外，以位串的形式，将有关滞后的信息传送到滞后字段505内。在这个最佳实施例中，使用了11比特来表示滞后，但很明显，也可以使用本发明范围内的其它长度。经量化的间距预测系数被添加到系数字段506内的位串中。如果所选的间距预测器的阶为1，则只传送1个系数，如果阶为3，则传送3个系数等等。在不同的实施方案中，也可以改变传输系数时所使用的比特数。在一个有利的实施例中，一阶系数是用3比特来表示的，3阶系数是由总计5比特来表示的，5阶系数是用总计9比特来表示的，而7阶系数是由10比特来表示的。一般来说，可以这样认为，所选的阶越高，则传送经量化的间距预测系数所需的比特数越多。

除了前述信息之外，当基于所选间距预测器，对音频信号进行编码时，必须传送误差字段507内的预测误差信息。这个预测误差信息是在计算单元12内作为一个差信号而产生的，该差信号表示了将要编码的音频信号的频谱与可被解码(即重建)的信号频谱之间的差，其中所述解码，利用了所选的间距预测器的经量化的间距预测系数，同时还利用了采样的基准序列。这样，误差信号例如可以经由第一选择单元13，被传送到量化单元14，接受量化。经量化的误差信号，被从量化单元14传送到多路复用单元15，其中量化预测误差值被添加到位串的误差字段507。

依据本发明的编码器1还包括本机解码功能。经编码的音频信号，被从量化单元14传送到反量化单元17。如上所述，在编码效率不大于1的情况下，音频信号由其量化频谱值来表示。在这种情况下，量化频谱值被传送到反量化单元17，在该单元中，以所述的已知方式，对这些值去量化，使得尽可能精确地还原音频信号的原始频谱。所提供的表示原始音频信号的频谱的去量化值，作为一个输出，从单元17输出到求和单元18。

如果编码效率大于1，则以间距预测信息来表示音频信号，这种间距预测信息例如可以是表现为量化频域值的间距预测器的阶信息、量化的间距预测系数、滞后值以及预测误差信息。如上所述，预测误差信息表示将要编码的音频信号频谱与可依据所选间距预测器以及采样的基准序列而重建的音频信号的频谱之间的差异。因此，在这种情况下，包含预测误差信息的量化频域值，被传送到反量化单元17，在该单元中，上述值被去量化，使得尽可能精确地还原预测误差的频域值。这样，单元17的输出包括去量化的预测误差值。这些值被进一步输入到求和单元18，在该单元中，将这些值与利用所选间距预测器预测的信号的频域值相加。以这种方式，就形成了所重建的原始音频信号的频域表示。从计算单元12中，可得到预测信号的频域值，在该计算单元中，联系预测误差的确定，对这些频域值进行计算，并将它们传送到求和单元18，正如图1中的线C1所指示的那样。

根据由计算单元12所提供的控制信息，来选通(接通和断开)求和单元18的操作。允许这一选通操作的控制信息的传输，是由计算单元12和求和单元18之间的连接(图1中的线D1和D2)来指示的。选通操作是必需的，以便考虑由反量化单元17所提供的不同类型的去量化频域值。如上所述，如果编码效率不大于1，则单元17的输出包括表示原始音频信号的去量化频域值。在这种情况下，不再需要求和操作，不再需要在计算单元12内，构建与任何预测音频信号的频域值相关的信息。在这种情况下，来自计算单元12的控制信息禁止求和单元18的操作，表示原始音频信号的去量化频域值通过求和单元18。另一方面，如果编码效率大于1，单元17的输出包含去量化预测误差值。在这种情况下，有必要将去量化预测误差值与预测信号的频谱相加，以便构成一个重建的原始音频信号的频域表示。现在，来自计算单元12的控制信息允许求和单元12执行操作，这使得去量化预测误差值与预测信号的频谱相加。必要控制信息是由编码方法信息提供的，而该编码方法信息是在单元12内，联系对音频信号所采用的编码的选择，而产生的。

在本发明的另一个实施例中，可以在计算预测误差和编码效率值之前进行量化，其中预测误差和编码效率的计算的执行，是利用了表示原始信号和预测信号的量化频域值。量化是在单元6和12以及单元11和12之间的量化单元(未示出)中执行的。在这一实施例中，不需要量化单元14，但在线C1所指使的路径中，需要额外的去量化单元。

求和单元18的输出，是与采样的编码序列(音频信号)相应的经采样的频域数据。在改进的DCT逆变换器19内，进一步将该经采样的频域数据变换到时域，在变换器19内，采样编码序列被传送到将要存储的基准缓冲器8内，并在与对后续帧进行编码的相关之处使用。可以依据所讨论的、获取使用的编码效率需要所必需的采样数目，来选择基准缓冲器8的存储容量，在基准缓冲器8中，最好通过改写缓冲器内最旧的采样，而存储一个新的采样序列，即该缓冲器是一个所谓的环行缓冲器。

编码器1中所形成的位串被传送到发送器16，在该发送器内，同样以已知方式执行调制。调制信号经由数据传输信道3，被传送到接收器，例如可以作为一个射频信号。非常方便的是，可以在对一个指定帧进行的编码结束之后，立即逐帧传送编码音频信号。或者也可以，对音频信号进行编码，并将其存储在发送端的存储器内，在之后的某个时刻进行传送。

在接收设备31中，在接收单元20内，同样以已知方式，对所接收的来自数据传输信道的信号进行解调。对解调数据帧内所包含的信息的确定，是在解码器33内执行的。在解码器33的信号分解单元21中，首先依据位串的编码方法信息502，来检验：所接收到的信息是否是基于原始音频信号而形成的。如果解码器确定出，编码器1中所形成的位串501，不包括原始信号的频域变换值，则按以下方式执行解码。由阶字段504确定出间距预测单元24中所使用的阶M，由滞后字段505确定出滞后。位串501的系数字段506内所接收的量化间距预测系数、同时还有与阶和滞后相关的信息，都被传送到解码器的间距预测单元24。这一过程用图2中的线B2来表示。在位串的字段507中所接收到的预测误差信号的量化值，在去量化单元22内被去量化，并被传送到解码器的求和单元23。依据滞后信息，解码器的间距预测单元24从采样缓冲器8中，搜索用作基准序列的采样，并基于所选的阶M，执行一个预测，间距预测单元24依据该阶M而使用所接收到的间距预测系数。因此，产生了第一重建的时域信号，它在变换单元25内，被变换到频域。该频域信号被传送到求和单元23，在该求和单元中，产生了作为该频域信号与去量化的预测误差信号之和的一个频域信号。这样，在无误差数据传输条件下，重建的频域信号充分与频域内的原始编码信号相对应。借助于逆变换单元26内的改进的DCT逆变换，将这一频域信号变换到时域，结果，数字音频信号出现在逆变换单元26的输出端。在数字/模拟转换器27中，将这一信号转换为模拟信号，如果需要还可将其放大，并按照同样是已知的方式，将其传送到其它更多的处理级中。这一点已由图3中的音频单元32所表示。

如果编码器1内形成的位串501包括变换到频域的原始信号的值，则以以下方式执行解码。量化的频域变换值在去量化单元22内被去量化，并经由求和单元23，被传送到拟变换单元。在逆变换单元26内，借助于改进的DCT逆变换，将频域信号变换到时域，其中，以数字格式，产生了了与原始音频信号相应的时域信号。如果需要，可在数字/模拟转换器27内，将这一信号转换为模拟信号。

图2中，标记A2显示了控制信号传输到求和单元23。以这样一种方式使用这种控制信息，这种方式与所描述的有关的编码器的本机解码器的功能相似。换言之，如果所接收的位串501的字段502中所提供的编码方法信息表明：位串包含由音频信号自身导出的量化频域值，则禁止求和单元23的操作。这使得音频信号的量化频域值能够通过求和单元23，到达逆变换单元26。另一方面，如果从所接收的位串的字段503中检索出的编码方法信息表明：对音频信号的编码使用了间距预测器，则允许求和单元23的操作，这使得去量化的预测误差数据能与变换单元25所产生的预测信号的频域表示法相加。

在图3所示的例子中，发送设备是一个无线通信设备2，接收设备是一个基站31，其中，在基站31的解码器33中，对从无线通信设备2发射出的信号进行解码，在解码器33中，模拟音频信号同样被以已知方式传送到更多的处理级中。

很明显，在本例中，仅出现了应用本发明所必需的特征，但在实际应用中，数据传输系统还包括本文所出现的特征以外的一些功能。也有可能使用与依据本发明的编码相关的其它编码方法，例如短期预测。此外，当发送依据本发明进行编码的信号时，也可以执行其它的处理步骤，例如信道编码。

还可以在时域内，确定预测信号与实际信号之间的一致性。这样，在本发明的另一个实施例中，就不需要将信号变换到频域，这样就不再需要变换单元6、11，也不再需要编码器的逆变换单元19，同时还有解码器的变换单元25以及逆变换单元26。这样，就可基于时域信号，来确定编码效率和预测误差。

先前说说明的音频信号编码/解码级可应用于各种不同的数据传输系统，例如移动通信系统、卫星TV系统、视频需求(video on demand)系统等。例如，对于全双工发送音频信号的移动通信系统，在无线通信设备2和基站31或类似设备中，需要一个编码器/解码器对。在图3的框图中，无线通信设备2和基站31的相应功能的单元被标记有相同的参考号。尽管图3中，编码器1和解码器33表现为分立单元，但在实际应用中，可以将它们实现于同一个单元内，即所谓的编解码器，在该编解码器中，可执行编码和解码所必需的所有操作。如果在移动通信系统中，以数字格式发送音频信号，则在基站中，就不再需要模拟/数字转换以及数字/模拟转换。这样，就会在通过其，而使移动通信网连接到另一种电通信网的无线通信设备以及接口内，执行这种变换，其中所述另一种无线电通信网例如是公共电话网。但是，如果该电话网是数字电话网，那么，也可以在例如是与这种电话网相连的一个数字电话(未示出)内，执行这种变换。

在有关传输中，前述编码级不是非有不可的，但但可以存储编码信息，用于后续传输。此外，加到编码器上的音频信号不必一定是一个实时音频信号，但对于将要编码的音频信号，可以从该音频信号的早期开始，对其进行信息存储。

以下，将用数学方法来描述依据本发明一个实施例的不同的编码

B (z) = Σ_{k = - m_{1}}^{m_{2}} b (k) z^{- (α + k)} . . . . . . (1)

级。间距预测单元的传输函数具有以下形式：

其中α是滞后，b(k)是间距预测器的系数，m₁和m₂取决于于阶(M)，它们被表示如下：

m₁＝(M-1)/2

m₂＝M-m1-1

有利的是，最相符的采样序列(即基准序列)的确定，是利用了最小二乘法。这可以表示如下：

E = Σ_{i = 0}^{N - 1} {(x (i) - Σ_{j = - m_{1}}^{m_{2}} b (j) \tilde{x} (i + j - α))}^{2} . . . . . (2)

其中E＝误差，xO是时域中的输入信号，

是从采样的在先序列中重建出的信号，N是帧检验中的采样数。可通过将变量设置为m₁＝0，m₂＝0，从而计算出滞后α，并从等式2中求解出b。求解出α的另一种方法是使用归一化相关方法，通过利用等式：

当发现最相符的(基准)采样序列时，滞后单元7具有有关滞后的信息，即音频信号中所出现的相符的采样序列究竟提前了多少。

可由等式(2)，计算出用于每种阶(M)的间距预测系数b(k)，可以以下形式重新表示等式(2)：

E = Σ_{i = 0}^{N - 1} x {(i)}^{2} - 2 \cdot Σ_{i = 0}^{N - 1} x (i) Σ_{j = - m_{1}}^{m_{2}} b (j) \tilde{x} (i + j - α) + Σ_{i = 0}^{N - 1} {(Σ_{j = - m_{1}}^{m_{2}} b (j) \tilde{x} (i + j - α))}^{2} . . . . (4)

可通过搜寻误差变化相对于b(k)为尽可能小的一个系数b(k)，来确定系数b(k)的一个优化值。可通过将相对于b的误差关系的偏导数设定为零(E/b＝0)，从而实现上述计算，其中实现了以下等式：

- 2 \cdot Σ_{i = 0}^{N - 1} x (i) Σ_{j = - m_{1}}^{m_{2}} \tilde{x} (i + j - α) + 2 \cdot Σ_{i = 0}^{N - 1} [(Σ_{j = - m_{1}}^{m_{2}} b (j) \tilde{x} (i + j - α)) \cdot Σ_{j = - m_{1}}^{m_{2}} \tilde{x} (i + j - α)] = 0 . . . (5)

即：

Σ_{i = 0}^{N - 1} [Σ_{j = - m_{1}}^{m_{2}} b (j) \tilde{x} (i + j - α) \cdot Σ_{j = - m_{1}}^{m_{2}} \tilde{x} (i + j - α)] = Σ_{i = 0}^{N - 1} x (i) Σ_{j = - m_{1}}^{m_{2}} \tilde{x} (i + j - α)

可以以矩阵形式写出该等式，其中可通过对矩阵等式求解，从而b＝ A^-1. r确定系数b(k)：其中，

在依据本发明的方法中，其目的是比依据已有技术的系统更有效地利用音频信号的周期性。可以通过对几种阶计算其间距预测系数，来增强编码器对音频信号频率内改变的适应性，从而实现这一点的。可以以这样一种方式来选择对音频信号进行编码所使用的间距预测器的阶，以便使预测误差最小，使编码效率最大，或交替使用预测误差和编码效率。这种选择是在某些间隔处执行的，最好为每帧单独执行这种选择。这样，可以一帧一帧地改变阶和间距预测系数。这样，与使用固定阶的已有技术的编码方法相比，在依据本发明的方法中，有可能提高编码的适应性。此外，在依据本发明的方法中，如果不能利用编码来减小将要传送给一个指定帧的信息量(比特数)，则可以发送变换到频域的原始信号，而不是间距预测系数和误差信号。

依据本发明的方法中所使用的先前出现的计算步骤，可以以程序的形式来方便地实现，以及/或以硬件形式来方便地实现，所述程序可以表现为：数字信号处理单元或类似单元内的控制器34的程序代码。依据本发明的上述说明，本领域技术人员可以依据本发明而实现编码器1，这样，就不需要在本文中更详细地讨论编码器1的不同功能的单元。

为了向接收机发送所述间距预测系数，有可能使用所谓的查找表。在这种查找表中，存储有不同的系数值，其中，发送的是查找表内的该系数的索引，而不是该系数。编码器1和解码器33都知道这个查找表。在接收端，有可能通过使用查找表，从而依据所发送的索引，来确定所讨论的间距预测系数。在某些情况下，与传送间距预测系数相比，使用查找表，可以减少将要发送的比特数。

本发明并不仅限于上述出现的几个实施例，也不只限于其它几个方面，但可以在附加权利要求书的范围内，实现一些改进。

Claims

1.用于对音频信号进行编码的方法，其特征在于至少执行以下步骤：

——检验将要编码的音频信号的一部分，以发现与将要编码的音频信号的该部分基本相符的音频信号的另一部分，

——基于所述音频信号的基本相符部分，利用一组间距预测器的阶，产生一组预测信号，

——对于所述预测信号中的至少一个，确定一个编码效率，以及

——利用所确定的编码效率，选取一种编码方法，用于将要编码的音频信号的所述部分。

2.依据权利要求1的所述方法，其特征在于可选编码方法包括这样一种方法：以一个预测信号为基础，对将要编码的音频信号进行编码。

3.依据权利要求2的所述方法，其特征在于可选编码方法包括这样一种方法：以音频信号自身为基础，对将要编码的音频信号进行编码。

4.依据权利要求1的所述方法，其特征在于为所述每一个预测信号，确定一个编码误差。

5.依据权利要求4的所述方法，其特征在于对具有最小所述编码误差的预测信号，确定一个编码效率，其特征还在于：如果所确定的编码效率信息表明：与依据将要编码的音频信号的所述部分而执行编码的情况相比，编码信息量较小，则所述编码是依据具有最小编码误差的预测信号而执行。

6.依据权利要求5的所述方法，其特征在于：将需编码的音频信号的所述部分变换到频域，以确定音频信号的频谱，将每个预测信号变换到频域，以确定每个预测信号的频谱，其特征还在于：依据所述音频信号的频谱，以及预测信号的频谱，为具有最小编码误差的所述预测信号，确定所述编码效率。

7.依据权利要求1的所述方法，其特征在于：为每个所述预测信号，确定一个编码效率，对那些所确定的编码效率信息表示出以下信息的预测信号，确定一个编码误差，并依据提供了最小编码误差的预测信息，而执行编码，其中所表示出的以下信息为：与依据即将要编码的音频信号的所述部分而执行编码的情况相比，该编码信息量较小。

8.依据权利要求1的方法，其特征在于：为每个所述预测信号，确定一个编码效率，如果所确定的编码效率表示：与依据将要编码的音频信号的所述部分而执行编码相比，该编码信息量较小，则以能提供最高编码效率的预测信号为基础，执行编码。

9.依据权利要求1的所述方法，其特征在于为每个所述预测信息，确定一个编码效率，并以能提供最高编码效率的预测信号为基础，执行编码。

10.依据权利要求7、8或9的方法，其特征在于：将需编码的音频信号的所述部分变换到频域，以确定所述音频信号的频谱，将每个预测信号变换到频域，以确定每个预测信号的频谱，其特征还在于：以所述音频信号的频谱，以及预测信号的频谱为基础，为每个预测信号确定所述编码效率。

11.依据权利要求5、6、7、8或9的所述方法，其特征在于：对每个所述预测信号，确定其预测误差信息。

12.依据权利要求5、6、7、8或9的所述方法，其特征在于：所述预测信号的构成，是对没个所述预测信号，使用了不同的预测阶数。

13.依据权利要求6或10的所述方法，其特征在于：为每个所述预测信号确定所述预测信息的计算，是利用的所述音频信号的所述频谱以及预测信号的所述频谱，求得一个差值谱表示法，从而计算出的。

14.依据权利要求10或13的所述方法，其特征在于：变换到频域的这种变换，是利用了改进的DCT变换而执行的。

15.依据权利要求1到14中任何一个权利要求所述的方法，其特征在于：预测信号的编码信息(501)至少包括与编码方法相关的数据(502)、与所选阶(504)、滞后(505)、间距预测系数(506)相关的数据、以及与预测误差相关的数据(507)。

16.依据权利要求1到15中任何一个权利要求所述的方法，其特征在于：所述音频信号被分为若干帧，其中编码是对由音频信号构成的每一帧单独执行的。

17.依据权利要求1到16中任何一个权利要求所述的方法，其特征在于：所述音频信号是一个语音信号。

18.依据权利要求4到7中任何一个权利要求所述的方法，其特征在于：是利用以下方法中的一种来确定所述编码误差的：

——最小二乘法；

——基于对将要编码的音频信号创建心理声学模型的一种方法。

19.依据权利要求18的所述方法，其特征在于：如果是利用最小二乘法确定的所述编码误差，则由所述预测误差，计算出所述编码误差。

20.依据权利要求1到19中任何一个权利更求所述的方法，其特征在于：所述编码的音频信号被发送到接收设备。

21.包含对音频信号进行编码的装置(16，20)的一种数据传输系统，其特征在于所述数据传输系统还包括：

——用于检验将要编码的音频信号的一部分，以发现与将要编码的该音频信号的所述部分基本相符的音频信号的另一部分的装置(7，8)，

——利用一组间距预测器的阶，以依据所述音频信号的基本相符部分，产生一组预测信号的装置(9，10)，

——为所述预测信号中的至少一个，确定编码效率的装置(12)，

——利用所确定的编码效率，为将要编码的音频信号的所述部分选取一种编码方法的装置(12，13，14)，以及

——用于发送编码音频信号的装置(16)。

22.依据权利要求21的数据传输系统，其特征在于它包括用于为所述预测信号中的至少一个，确定一个编码误差的装置。

23.依据权利要求21的数据传输系统，其特征在于它包括将需编码的音频信号的所述部分变换到频域的装置，以及将每个预测信号变换到频域的装置。

24.依据权利要求21的数据传输系统，其特征在于它包括形成一个位串(15)，以便发送到一个接收设备的装置，所述位串至少包括与所选编码方法相关的信息。

25.依据权利要求21到24中任何一个权利要求的数据传输系统，其特征在于它包括用于将所述音频信号分为若干帧的装置。

26.依据权利要求21到24中任何一个权利要求的数据传输系统，其特征在于它包括一个移动终端。

27.包括对一个音频信号进行编码的装置(16，20)的一个编码器(1)，其特征在于该编码器包括

——用于对将要编码的音频信号的一部分进行检验，以发现与将要编码的音频信号的所述部分基本相符的音频信号的另一部分的装置(7)，

——使用一组间距预测器的阶，以便依据所述音频信号的基本相符部分，产生一组预测信号的装置(9，10)，

——为至少一个所述预测信号，确定一个编码效率的装置(12)，以及

——利用所确定的编码效率，为将要编码的音频信号的所述部分选取一种编码方法的装置(12，13，14)。

28.依据权利要求27的一种编码器(1)，其特征在于它包括依据预测信号，对音频信号进行编码的装置(4，6-14)。

29.依据权利要求28的编码器(1)，其特征在于它包括对音频信号自身进行编码的装置(4，6，14)。

30.用于对在依据权利要求27的编码器内进行编码的音频信号进行解码的一种解码器(33)，其特征在于：该解码器包括对将要解码的音频信号的编码方法进行确定的装置，以及依据所确定的解码方法，对音频信号进行解码的方法。

31.依据权利要求30的一种解码器，其特征在于该解码器包括接收与预测信号相关的信息的装置(21)。

32.依据权利要求31的一种解码器，其特征在于：该解码器包括依据所接收的信息，而产生一个预测信号的装置(24，28)。

33.依据权利要求31或32的一种解码器，其特征在于：该解码器包括从所接收到的信号中，至少确定出与所选阶(504)、滞后(505)、至少一个间距预测系数(506)以及预测误差数据(507)相关的数据的装置(21)。

34.依据权利要求33的一种解码器，其特征在于它包括使用与所选阶(504)、滞后(505)、至少一个间距预测系数(506)相关的所述数据，产生一个预测信号的装置(24，28)。

35.依据权利要求33或34的一种解码器，其特征在于它包括利用所述预测信号以及所述预测误差数据，产生一个重建的音频信号的装置(23，24，28)。

36.依据权利要求30的一种解码器，其特征在于它包括用于接收与音频信号自身相关的信息的装置(21)。

37.依据权利要求36的一种解码器，其特征在于它包括利用所述与音频信号本身有关的接收信息，产生一个重建的音频信号的装置(22，23，26)。

38.对依据权利要求1的方法进行编码的音频信号执行解码的一种方法，其特征在于：对将要解码的音频信号的编码方法进行确定，并依据所确定的音频信号的编码方法，执行解码。

39.依据权利要求38的一种方法，其特征在于所述编码方法是以下方法中的一种：

——利用一个指定阶的间距预测器，对音频信号进行编码的方法，——依据音频信号自身，对音频信号进行编码的方法。