图1是一个简化框图,它显示了依据本发明一个最佳实施例的编码器1。图4是一个流程图400,它说明了依据本发明的方法。编码器1例如可以是无线通信设备2(图3)的语音编码器,用于将音频信号转换为将要在数据传输系统中传送的编码信号,这种数据传输系统例如可以是移动通信网或互联网。这样,就可以非常方便地将解码器33安装在移动通信网的基站内。与此相对应,如果需要,可以在模拟-数字转换器4内,将模拟音频信号,例如是由麦克风29产生并在音频单元30内放大的一个信号,转换为数字信号。转换精度例如为8或12比特,连续采样之间的间隔(时间分辨率)例如是0.125ms。很明显,本说明书中所出现的数值仅仅是用于说明本发明的例子,并不能限制本发明。
所获得的来自音频信号的采样,被存储在采样缓冲器(未示出)中,可以用这样一种已知方式来实现存储,例如可以存储在无线通信设备2的存储装置5中。可以以逐帧为基础,来执行音频信号的编码,这样,预定数目的采样被传送到将要执行编码的编码器1,所述预定数目的采样例如可以是20ms的时间段(=160个采样,假定连续采样之间的时间间隔为0.125ms)内所产生的采样。将要编码的一帧的采样被很方便地传送到变换单元6,在该单元内,例如可以借助于一种改进的离散余弦变换(MDCT),将音频信号从时域变换到一个变换域(频域)。变换单元6的输出提供了一组值,这些值表示被变换信号在频域内的特性。在图4的流程图中,由方框404表示这种变换。
将时域信号变换到频域的另一种实现手段,是由几个带通滤波器组成的滤波器组。每一个滤波的通带相当窄,其中,这些滤波器输出端上的信号幅度表示所要变换的信号的频谱。
滞后单元7确定:在指定时刻,哪个在先采样序列与将要编码的帧最匹配(方框402)。很方便以这样一种方式来实现这一级的滞后的确定,滞后单元7将存储在基准缓冲器8内的值与将要编码的帧的采样进行比较,并利用例如可以是最小二乘法,来计算将要编码的帧的采样与基准缓冲器内存储的相应的采样序列之间的误差。最好是,选择由连续采样构成、并具有最小误差的采样序列,作为采样的基准序列。
当滞后单元7从所存储的采样中选出采样的基准序列时(方框403),滞后单元7将与之有关的信息传送到系数计算单元9,以便对间距预测系数进行估计。这样,在系数计算单元9中,就以采样基准序列内的采样为基准,对不同的间距预测器的阶,例如是1,3,5和7,计算间距预测系数b(k)。之后,所计算出的系数b(k)被传送到间距预测单元10。在图4的流程图中,这些阶段被显示在方框405-411内。很明显,这里所出现的阶数仅仅是举例,用于说明本发明,而不是限制本发明,可实施的阶数也可以与本文中所出现的四种阶数完全不同。
在计算出间距预测系数之后,对其进行量化,这样就获得了经量化的间距预测系数。最好以这样一种方式对间距预测系数进行量化,使得在无误差数据传输条件下,接收机解码器33内所产生的重建信号尽可能地接近原始信号。在对间距预测系数进行量化时,使用最高分辨率(可能是最小的量化阶距)是非常有利的,以便能使舍入误差最小。
在采样基准序列内的存储采样被传送到间距预测单元10,在该单元中,利用所计算出的、并经量化的间距预测系数b(k),为每一个间距预测阶数产生了一个预测信号。每一个预测信号代表对将要编码的信号的预测,它是利用所讨论的间距预测阶数而估计出的。在发明的当前最佳实施例中,预测信号还被传送到第二变换单元11,在该第二变换单元内,这些数据被变换到频域。第二变换单元11利用两个或更多不同的阶,来执行变换,其中,产生了与利用不同的间距预测阶数而预测出的信号相应的成组的变换值。可以以这样一种方式来实现间距预测单元10以及第二变换单元11,使得它们对每个间距预测阶执行必要的操作,或者是,对每一阶,实现单独的一个间距预测单元10和单独的一个第二变换单元11。
在计算单元12中,将预测信号经频域变换后的值,与所得到的来自变换单元6的、将要编码的音频信号经频域变换后的表示法进行比较。通过获取将要编码的音频信号频谱与利用间距预测器所预测出的信号频谱之间的差异,而计算出一个预测误差信号。非常有利的是,预测误差信号包括一组预测误差值,该组预测误差值与将要编码的信号频率分量和预测信号的频率分量之间的差相对应。例如可以用音频信号的频谱与预测信号的频谱之间的平均差来表示的编码误差,也被计算出来。最好是,利用最小二乘法来计算编码误差。可以使用任何其它合适的方法,包括以音频信号的心理声学模型为基础的方法,来确定能最好地表达将要编码的音频信号的预测信号。
在单元12中,还对编码效率度量(预测增益)进行了计算,以便确定将要传送给传输信道的信息(方框413)。其目的是使所需传送的信息量(比特)最小(数量最小),同时也使信号内的失真最小(质量最高)。
为了能以存储在接收设备内的预先采样为基础,在接收机内重建信号,必须向接收机传送与阶、滞后相关的信息、与预测误差相关的信息,例如是用于所选阶的、经量化的间距预测系数。非常有利的是,编码效率度量指出:是否有可能利用比传送与原始信号有关的信息更少数目的比特,来传送对在间距预测单元10中经过编码的信号进行解码所需的信息。例如,可以以这样一种方式来实现这种判定,使得如果解码所必需的信息是利用特定的间距预测器来产生的,则第一基准值被定义为表示将要传送的信息量。另外,如果解码所必需的信息是以原始音频信号为基础形成的,则将第二基准值定义为表示所要传送的信息量。编码效率度量刚好是第二基准值与第一基准值的比值。表达预测信号所需的比特数目,例如可以取决于间距预测器的阶数(即将要传送的系数的数目)、每个系数所表示的(被量化的)精度、还有与预测信号相关的误差信息的量和精度。另一方面,传送与原始音频信号相关的信息所需的比特数目,例如可以取决于音频信号在频域内的精度。
如果以这种方式所确定的编码效率大于壹,则表示可以利用比与原始信号相关的信息少的比特数,来传送对预测信号进行解码所必需的信息。在计算单元12中,对于这两种不同选择的传送,确定它们所需的比特数目,并选出所需比特数目较小的那个方案(方框414)。
依据本发明的第一实施例,选择用于获取最小编码误差的间距预测器的阶,对音频信号进行编码(方框412)。如果用于所选间距预测器的编码效率度量大于壹,则选择与预测信号相关的信息,用于传输。如果编码效率信息不大于壹,则将要传送的信息是依据原始音频信号构成的。依据本发明的这个实施例,重点在于使预测误差最小(品质最高)。
依据本发明的第二个有益的实施例,为每一个间距预测器的阶,计算其编码效率度量。从那些编码效率度量大于壹的阶中,选取一个能提供最小编码误差的间距预测器的阶,用于对音频信号进行编码。如果没有一个预测编码器的阶能够提供一个预测增益(即没有编码效率度量大于壹),则可以依据原始音频信号,而形成将要传送的信息。本发明的这一实施例使得在预测误差和编码效率之间进行了折中。
依据本发明的第三实施例,为每个间距预测器的阶,计算编码效率度量,从那些其编码效率度量大于壹的阶中,选出能提供最大编码效率的阶,对音频信号进行编码。如果没有一个间距预测器的阶能提供一个预测增益(即没有一个编码效率度量大于壹),则所要传送的信息的构成,是以原始音频信号为基础的。这样,本发明的这个实施例的着眼点在于,使编码效率最高(数量最小)。
依据本发明的第四实施例,为每个间距预测器的阶,计算编码效率度量,选出能提供最大编码效率的阶,对音频信号进行编码,即便是没有编码效率大于壹。
对编码误差的计算以及与间距预测器的阶的选择是在每帧之间的间隙执行的,并且,最好是为每一帧分别执行上述操作,其中,在不同的帧内,有可能使用与指定时间处的音频信号特性最相符的间距预测阶数。
如上所述,如果在单元12内所确定的编码效率不大于壹,这表示传送原始信号的频谱非常有利,其中,将要传送到数据传输信道的位串501是以下述方式构成的(方框415)。在来自计算单元12的、与所选传输相关的信息被传送到选择单元13(图1中的线D1和D4)。在选择单元13中,经频域变换的表示原始音频信号的值被选出,传送到量化单元14。对于将原始音频信号经过频域变换后的值传送到量化单元14这一过程,是由图1的框图中的线A1所表示的。在量化单元14中,以所述方式对经过频域变换的信号值进行量化。量化值被传送到多路复用单元15,在该单元中,形成了将要传送的位串。图5a和5b显示了一种位串结构的一个例子,它可以有利地应用于本发明。与所选编码方法相关的信息,被从计算单元12传送到多路复用单元15(线D1和D3),在这里,位串是依据传输选择而形成的。第一逻辑值,例如是逻辑0状态,被用作编码方法信息502,以指明表示原始音频信号的经过频域变换后的值是以所讨论的位串的形式传送的。除了编码方法信息502外,这些值本身也以被量化到指定精度的位串的形式进行传输。在图5a中,将用于传送这些值的字段标以参考号503。每个位串中所传送的值的数量,取决于采样频率,以及在一个时刻所检验到的帧的长度。在这种情况下,由于在接收机内,是依据位串501中所传送的原始音频信号的频域内的值,来重建信号的,因此,不传送间距预测器的阶信息、间距预测系数、滞后以及误差信息。
如果编码效率大于壹,则可以很方便是使用所选的间距预测器,对音频信号执行编码,并可以以下述方式(方框416),形成将要传送到数据传输信道的位串501(图5b)。与所选传输选择相关的信息,被从计算单元12传送到选择单元13。这一过程,是由图1的方框中的线D1和D4来表示的。在选择单元13中,选取经量化的间距预测系数,将其传送到多路复用单元15。这一过程由图1框图内的线B1来表示。很明显,也可以不通过选择单元13,而使用另一条路径,将间距预测系数传送到多路复用单元15。将要传送的位串是在多路复用单元15内形成的。与所选编码方法有关的信息,被从计算单元12传送到多路复用单元15(线D1和D3),其中,是依据传输选择而形成位串的。第二逻辑值,例如是逻辑1状态,被用作编码方法信息502,以表明是以所讨论的位串的形式,传送所述经量化的间距预测系数的。依据所选间距预测阶数,来设定一个阶字段504的比特。如果,有可能有4个不同的阶,则2比特(00,01,10,11)足以表明:在指定时间,选择了哪一阶。另外,以位串的形式,将有关滞后的信息传送到滞后字段505内。在这个最佳实施例中,使用了11比特来表示滞后,但很明显,也可以使用本发明范围内的其它长度。经量化的间距预测系数被添加到系数字段506内的位串中。如果所选的间距预测器的阶为1,则只传送1个系数,如果阶为3,则传送3个系数等等。在不同的实施方案中,也可以改变传输系数时所使用的比特数。在一个有利的实施例中,一阶系数是用3比特来表示的,3阶系数是由总计5比特来表示的,5阶系数是用总计9比特来表示的,而7阶系数是由10比特来表示的。一般来说,可以这样认为,所选的阶越高,则传送经量化的间距预测系数所需的比特数越多。
除了前述信息之外,当基于所选间距预测器,对音频信号进行编码时,必须传送误差字段507内的预测误差信息。这个预测误差信息是在计算单元12内作为一个差信号而产生的,该差信号表示了将要编码的音频信号的频谱与可被解码(即重建)的信号频谱之间的差,其中所述解码,利用了所选的间距预测器的经量化的间距预测系数,同时还利用了采样的基准序列。这样,误差信号例如可以经由第一选择单元13,被传送到量化单元14,接受量化。经量化的误差信号,被从量化单元14传送到多路复用单元15,其中量化预测误差值被添加到位串的误差字段507。
依据本发明的编码器1还包括本机解码功能。经编码的音频信号,被从量化单元14传送到反量化单元17。如上所述,在编码效率不大于1的情况下,音频信号由其量化频谱值来表示。在这种情况下,量化频谱值被传送到反量化单元17,在该单元中,以所述的已知方式,对这些值去量化,使得尽可能精确地还原音频信号的原始频谱。所提供的表示原始音频信号的频谱的去量化值,作为一个输出,从单元17输出到求和单元18。
如果编码效率大于1,则以间距预测信息来表示音频信号,这种间距预测信息例如可以是表现为量化频域值的间距预测器的阶信息、量化的间距预测系数、滞后值以及预测误差信息。如上所述,预测误差信息表示将要编码的音频信号频谱与可依据所选间距预测器以及采样的基准序列而重建的音频信号的频谱之间的差异。因此,在这种情况下,包含预测误差信息的量化频域值,被传送到反量化单元17,在该单元中,上述值被去量化,使得尽可能精确地还原预测误差的频域值。这样,单元17的输出包括去量化的预测误差值。这些值被进一步输入到求和单元18,在该单元中,将这些值与利用所选间距预测器预测的信号的频域值相加。以这种方式,就形成了所重建的原始音频信号的频域表示。从计算单元12中,可得到预测信号的频域值,在该计算单元中,联系预测误差的确定,对这些频域值进行计算,并将它们传送到求和单元18,正如图1中的线C1所指示的那样。
根据由计算单元12所提供的控制信息,来选通(接通和断开)求和单元18的操作。允许这一选通操作的控制信息的传输,是由计算单元12和求和单元18之间的连接(图1中的线D1和D2)来指示的。选通操作是必需的,以便考虑由反量化单元17所提供的不同类型的去量化频域值。如上所述,如果编码效率不大于1,则单元17的输出包括表示原始音频信号的去量化频域值。在这种情况下,不再需要求和操作,不再需要在计算单元12内,构建与任何预测音频信号的频域值相关的信息。在这种情况下,来自计算单元12的控制信息禁止求和单元18的操作,表示原始音频信号的去量化频域值通过求和单元18。另一方面,如果编码效率大于1,单元17的输出包含去量化预测误差值。在这种情况下,有必要将去量化预测误差值与预测信号的频谱相加,以便构成一个重建的原始音频信号的频域表示。现在,来自计算单元12的控制信息允许求和单元12执行操作,这使得去量化预测误差值与预测信号的频谱相加。必要控制信息是由编码方法信息提供的,而该编码方法信息是在单元12内,联系对音频信号所采用的编码的选择,而产生的。
在本发明的另一个实施例中,可以在计算预测误差和编码效率值之前进行量化,其中预测误差和编码效率的计算的执行,是利用了表示原始信号和预测信号的量化频域值。量化是在单元6和12以及单元11和12之间的量化单元(未示出)中执行的。在这一实施例中,不需要量化单元14,但在线C1所指使的路径中,需要额外的去量化单元。
求和单元18的输出,是与采样的编码序列(音频信号)相应的经采样的频域数据。在改进的DCT逆变换器19内,进一步将该经采样的频域数据变换到时域,在变换器19内,采样编码序列被传送到将要存储的基准缓冲器8内,并在与对后续帧进行编码的相关之处使用。可以依据所讨论的、获取使用的编码效率需要所必需的采样数目,来选择基准缓冲器8的存储容量,在基准缓冲器8中,最好通过改写缓冲器内最旧的采样,而存储一个新的采样序列,即该缓冲器是一个所谓的环行缓冲器。
编码器1中所形成的位串被传送到发送器16,在该发送器内,同样以已知方式执行调制。调制信号经由数据传输信道3,被传送到接收器,例如可以作为一个射频信号。非常方便的是,可以在对一个指定帧进行的编码结束之后,立即逐帧传送编码音频信号。或者也可以,对音频信号进行编码,并将其存储在发送端的存储器内,在之后的某个时刻进行传送。
在接收设备31中,在接收单元20内,同样以已知方式,对所接收的来自数据传输信道的信号进行解调。对解调数据帧内所包含的信息的确定,是在解码器33内执行的。在解码器33的信号分解单元21中,首先依据位串的编码方法信息502,来检验:所接收到的信息是否是基于原始音频信号而形成的。如果解码器确定出,编码器1中所形成的位串501,不包括原始信号的频域变换值,则按以下方式执行解码。由阶字段504确定出间距预测单元24中所使用的阶M,由滞后字段505确定出滞后。位串501的系数字段506内所接收的量化间距预测系数、同时还有与阶和滞后相关的信息,都被传送到解码器的间距预测单元24。这一过程用图2中的线B2来表示。在位串的字段507中所接收到的预测误差信号的量化值,在去量化单元22内被去量化,并被传送到解码器的求和单元23。依据滞后信息,解码器的间距预测单元24从采样缓冲器8中,搜索用作基准序列的采样,并基于所选的阶M,执行一个预测,间距预测单元24依据该阶M而使用所接收到的间距预测系数。因此,产生了第一重建的时域信号,它在变换单元25内,被变换到频域。该频域信号被传送到求和单元23,在该求和单元中,产生了作为该频域信号与去量化的预测误差信号之和的一个频域信号。这样,在无误差数据传输条件下,重建的频域信号充分与频域内的原始编码信号相对应。借助于逆变换单元26内的改进的DCT逆变换,将这一频域信号变换到时域,结果,数字音频信号出现在逆变换单元26的输出端。在数字/模拟转换器27中,将这一信号转换为模拟信号,如果需要还可将其放大,并按照同样是已知的方式,将其传送到其它更多的处理级中。这一点已由图3中的音频单元32所表示。
如果编码器1内形成的位串501包括变换到频域的原始信号的值,则以以下方式执行解码。量化的频域变换值在去量化单元22内被去量化,并经由求和单元23,被传送到拟变换单元。在逆变换单元26内,借助于改进的DCT逆变换,将频域信号变换到时域,其中,以数字格式,产生了了与原始音频信号相应的时域信号。如果需要,可在数字/模拟转换器27内,将这一信号转换为模拟信号。
图2中,标记A2显示了控制信号传输到求和单元23。以这样一种方式使用这种控制信息,这种方式与所描述的有关的编码器的本机解码器的功能相似。换言之,如果所接收的位串501的字段502中所提供的编码方法信息表明:位串包含由音频信号自身导出的量化频域值,则禁止求和单元23的操作。这使得音频信号的量化频域值能够通过求和单元23,到达逆变换单元26。另一方面,如果从所接收的位串的字段503中检索出的编码方法信息表明:对音频信号的编码使用了间距预测器,则允许求和单元23的操作,这使得去量化的预测误差数据能与变换单元25所产生的预测信号的频域表示法相加。
在图3所示的例子中,发送设备是一个无线通信设备2,接收设备是一个基站31,其中,在基站31的解码器33中,对从无线通信设备2发射出的信号进行解码,在解码器33中,模拟音频信号同样被以已知方式传送到更多的处理级中。
很明显,在本例中,仅出现了应用本发明所必需的特征,但在实际应用中,数据传输系统还包括本文所出现的特征以外的一些功能。也有可能使用与依据本发明的编码相关的其它编码方法,例如短期预测。此外,当发送依据本发明进行编码的信号时,也可以执行其它的处理步骤,例如信道编码。
还可以在时域内,确定预测信号与实际信号之间的一致性。这样,在本发明的另一个实施例中,就不需要将信号变换到频域,这样就不再需要变换单元6、11,也不再需要编码器的逆变换单元19,同时还有解码器的变换单元25以及逆变换单元26。这样,就可基于时域信号,来确定编码效率和预测误差。
先前说说明的音频信号编码/解码级可应用于各种不同的数据传输系统,例如移动通信系统、卫星TV系统、视频需求(video on demand)系统等。例如,对于全双工发送音频信号的移动通信系统,在无线通信设备2和基站31或类似设备中,需要一个编码器/解码器对。在图3的框图中,无线通信设备2和基站31的相应功能的单元被标记有相同的参考号。尽管图3中,编码器1和解码器33表现为分立单元,但在实际应用中,可以将它们实现于同一个单元内,即所谓的编解码器,在该编解码器中,可执行编码和解码所必需的所有操作。如果在移动通信系统中,以数字格式发送音频信号,则在基站中,就不再需要模拟/数字转换以及数字/模拟转换。这样,就会在通过其,而使移动通信网连接到另一种电通信网的无线通信设备以及接口内,执行这种变换,其中所述另一种无线电通信网例如是公共电话网。但是,如果该电话网是数字电话网,那么,也可以在例如是与这种电话网相连的一个数字电话(未示出)内,执行这种变换。
在有关传输中,前述编码级不是非有不可的,但但可以存储编码信息,用于后续传输。此外,加到编码器上的音频信号不必一定是一个实时音频信号,但对于将要编码的音频信号,可以从该音频信号的早期开始,对其进行信息存储。
以下,将用数学方法来描述依据本发明一个实施例的不同的编码 级。间距预测单元的传输函数具有以下形式:
其中α是滞后,b(k)是间距预测器的系数,m1和m2取决于于阶(M),它们被表示如下:
m1=(M-1)/2
m2=M-m1-1
有利的是,最相符的采样序列(即基准序列)的确定,是利用了最小二乘法。这可以表示如下:
其中E=误差,xO是时域中的输入信号,
是从采样的在先序列中重建出的信号,N是帧检验中的采样数。可通过将变量设置为m
1=0,m
2=0,从而计算出滞后α,并从等式2中求解出b。求解出α的另一种方法是使用归一化相关方法,通过利用等式:
当发现最相符的(基准)采样序列时,滞后单元7具有有关滞后的信息,即音频信号中所出现的相符的采样序列究竟提前了多少。
可由等式(2),计算出用于每种阶(M)的间距预测系数b(k),可以以下形式重新表示等式(2):
可通过搜寻误差变化相对于b(k)为尽可能小的一个系数b(k),来确定系数b(k)的一个优化值。可通过将相对于b的误差关系的偏导数设定为零(E/b=0),从而实现上述计算,其中实现了以下等式:
即:
可以以矩阵形式写出该等式,其中可通过对矩阵等式求解,从而b=
A
-1.
r确定系数b(k):其中,
在依据本发明的方法中,其目的是比依据已有技术的系统更有效地利用音频信号的周期性。可以通过对几种阶计算其间距预测系数,来增强编码器对音频信号频率内改变的适应性,从而实现这一点的。可以以这样一种方式来选择对音频信号进行编码所使用的间距预测器的阶,以便使预测误差最小,使编码效率最大,或交替使用预测误差和编码效率。这种选择是在某些间隔处执行的,最好为每帧单独执行这种选择。这样,可以一帧一帧地改变阶和间距预测系数。这样,与使用固定阶的已有技术的编码方法相比,在依据本发明的方法中,有可能提高编码的适应性。此外,在依据本发明的方法中,如果不能利用编码来减小将要传送给一个指定帧的信息量(比特数),则可以发送变换到频域的原始信号,而不是间距预测系数和误差信号。
依据本发明的方法中所使用的先前出现的计算步骤,可以以程序的形式来方便地实现,以及/或以硬件形式来方便地实现,所述程序可以表现为:数字信号处理单元或类似单元内的控制器34的程序代码。依据本发明的上述说明,本领域技术人员可以依据本发明而实现编码器1,这样,就不需要在本文中更详细地讨论编码器1的不同功能的单元。
为了向接收机发送所述间距预测系数,有可能使用所谓的查找表。在这种查找表中,存储有不同的系数值,其中,发送的是查找表内的该系数的索引,而不是该系数。编码器1和解码器33都知道这个查找表。在接收端,有可能通过使用查找表,从而依据所发送的索引,来确定所讨论的间距预测系数。在某些情况下,与传送间距预测系数相比,使用查找表,可以减少将要发送的比特数。
本发明并不仅限于上述出现的几个实施例,也不只限于其它几个方面,但可以在附加权利要求书的范围内,实现一些改进。