CN101199005B

CN101199005B - 后置滤波器、解码装置以及后置滤波处理方法

Info

Publication number: CN101199005B
Application number: CN2006800216457A
Authority: CN
Inventors: 押切正浩
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: III Holdings 12 LLC
Priority date: 2005-06-17
Filing date: 2006-06-15
Publication date: 2011-11-09
Anticipated expiration: 2026-06-15
Also published as: CN101199005A; BRPI0612579A2; US8315863B2; JPWO2006134992A1; EP1892702A1; US20090216527A1; JP4954069B2; WO2006134992A1; EP1892702A4

Abstract

公开了后置滤波器以及解码装置，即使在每个频带中解码信号的语音质量不同时，也改善解码信号的语音质量。频率变换单元(111)求解码频谱，功率频谱计算单元(112)从解码频谱计算功率频谱。修正频带决定单元(113)基于层信息，决定进行功率频谱的修正的频带，在功率频谱修正单元(114)，基于所决定的频带进行修正，以使功率频谱在频率轴上的变化被抑制。逆变换单元(115)对修正后的功率频谱进行逆变换，求自相关函数，在LPC分析单元(116)中，从求出的自相关函数求LPC系数。

Description

后置滤波器、解码装置以及后置滤波处理方法

技术领域

本发明涉及抑制解码信号的频谱的量化噪声的后置滤波器、解码装置以及后置滤波处理方法，所述解码信号是对适用了可扩展编码方式的编码代码进行了解码而得到的解码信号。

背景技术

移动通信系统中，为了有效利用电波资源等，需要将语音信号压缩到低比特率并传输。另一方面却希望提高通话语音的质量及实现较高的现场感的通话服务，为实现该需求，除需提高语音信号的质量以外，还需对频带更宽的音频信号等语音信号以外的信号高质量地进行编码。

对于这样相反的两个需求，将多个编码技术分层地统一起来的技术比较具有前景。该技术将第一层和第二层分层地组合，所述第一层，以适合语音信号的模式用低比特率对输入信号进行编码，所述第二层，以对语音以外的信号也适合的模式对输入信号与第一层的解码信号之间的差分信号进行编码。这样分层地进行编码的技术，由于从编码装置得到的比特流具有扩展性，即具有即使从比特流的一部分信息也能够得到解码信号的性质，因此一般被称为可扩展编码(分层编码)。

可扩展编码方式基于其特性，能够灵活地对应比特率不同的网络之间的通信，因此可以说该方式适合于通过IP协议将多种网络合并的今后的网络环境。

作为利用MPEG-4(Moving Picture Experts Group phase-4)进行标准化的技术来实现可扩展编码的例子，例如有非专利文献1所记载的技术。该技术在第一层中，使用适合于语音信号的CELP(Code Excited Linear Prediction，编码激励线性预测)编码，在第二层中，对残差信号使用诸如AAC(AdvancedAudio Coder，高级音频编码器)或者TwinVQ(Transform Domain WeightedInterleave Vector Quantization，传输域加权交织向量量化)等的变换编码，所述残差信号为从原信号减去第一层解码信号而得到的信号。

但是，作为改善解码语音信号的语音质量的有效的技术，后置滤波器也为人所知。一般而言，以较低的比特率对语音信号进行编码的情况下，虽然解码信号的频谱的波谷部分的量化噪声被感觉出来，但是通过适用后置滤波器，能够抑制这样的频谱的波谷部分的量化噪声。其结果，能够减少解码信号的噪声感，从而改善主观质量。代表性的后置滤波器的传递函数PF(z)利用共振峰(formant)增强滤波器F(z)和斜率校正滤波器U(z)，由下式(1)表示(参照非专利文献2)

PF(z)＝F(z)·U(z)

\{\begin{matrix} F (z) = \frac{1 - Σ_{i = 1}^{NP} α (i) {γ_{n}}^{i} z^{- i}}{1 - Σ_{i = 1}^{NP} α (i) {γ_{d}}^{i} z^{- i}} \\ U (z) = 1 - μ \cdot z^{- 1} \end{matrix} \cdot \cdot \cdot (1)

其中，α(i)表示解码信号的LPC(Linear Prediction Coefficient)系数，NP表示LPC系数的次数，γn和γd是决定后置滤波器的噪声抑制的程度的设定值(0＜γn＜γd＜1)，μ表示用于校正由共振峰增强滤波器产生的频谱斜率的设定值。

而且，在专利文献1中，还公开了从解码信号在频域计算听觉掩蔽阈值，并从该听觉掩蔽阈值计算用于后置滤波器的LPC系数的方法。

因为像上述那样后置滤波器抑制解码信号的频谱的波谷部分，所以能够减轻以低比特率压缩/扩展了的解码信号的噪声感，从而改善主观质量。换言之，也可以说后置滤波器通过改变解码信号的频谱的形状来减轻噪声感。

【专利文献1】日本专利申请特开平7-160296号公报

【非专利文献1】三木弼一編著、「MPEG-4のすべて」、初版、(株)工業調查会、1998年9月30日、p.126-127

【非专利文献2】J.-H.Chen and A.Gersho，“Adaptive postfiltering forquality enhancement of coded speech，”IEEE Trans.Speech and Audio Processing，vol.SAP-3，pp.59-71，1995.

发明内容

发明所要解决的课题

但是，在将后置滤波器适用于以比特速率较高的编码方式压缩/扩展后的解码信号的情况下，会使没有施加任何改变的解码信号的频谱的形状变形，反而有时降低解码信号的主观质量。以下，具体说明。

在可扩展编码的情况下，虽然也取决于层的结构，但是有时在每个频带中解码信号的语音质量不同。这里所谓的语音质量是表示人收听声音而感受的主观质量，或者像信噪比(SNR：Signal to Noise Ratio)那样的客观质量。这里，比如考虑具有图1所示的层结构的可扩展编码。在图1中，横轴表示频率，纵轴表示语音质量，并表示出各个层所负责的频带以及语音质量。在此情况下，第1层负责低频域(频率k为0以上且低于FL)和高频域(频率k为FL以上且低于FH)的基本质量，第2层负责低频域的改善质量。而且，第3层负责高频域的改善质量。

假使根据网络的状况或使用设备的能力等在不将第3层用于解码处理的情况下，如图2所示，在低频域改善质量的解码信号被生成，而且在高频域基本质量的解码信号被生成。

在专利文献1或非专利文献2公开的后置滤波器中，尽管像这样每个频带的质量不同，可是一直根据一定的基准决定后置滤波器的特性。因此，对本来无需进行后置滤波的频带、应较弱地进行后置滤波的频带(图2的低频域)、或者应较强地进行后置滤波的频带(图2的高频域)，都一直根据一定的基准来决定后置滤波器的特性，因此无法充分得到源于后置滤波的语音质量的改善效果。

本发明的目的在于提供后置滤波器、解码装置以及后置滤波处理方法，即使在每个频带中解码信号的语音质量不同时，也改善解码信号的语音质量。

用于解决课题的手段

本发明的后置滤波器，对被分层编码的信号的解码信号的量化噪声进行抑制，所述分层编码通过具备多个层的编码方式进行，采用的结构包括：频带决定单元，决定进行所述解码信号的频谱修正的频带；频谱修正单元，对属于所决定的所述频带的所述解码信号的频谱进行修正，以使所述频谱在频率轴上的变化被抑制；以及滤波单元，利用基于修正后的所述频谱的系数，进行所述解码信号的滤波。

本发明的解码装置，对被分层编码的信号的解码信号的量化噪声进行抑制，所述分层编码通过具备多个层的编码方式进行，采用的结构包括：频带决定单元，决定进行所述解码信号的频谱修正的频带；频谱修正单元，对属于所决定的所述频带的所述解码信号的频谱进行修正，以使所述频谱在频率轴上的变化被抑制；以及滤波单元，利用基于修正过的所述频谱的系数，进行所述解码信号的滤波。

本发明的后置滤波处理方法，对被分层编码的信号的解码信号的量化噪声进行抑制，所述分层编码通过具备多个层的编码方式进行，包括：频带决定步骤，决定进行所述解码信号的频谱修正的频带；频谱修正步骤，对属于所决定的所述频带的所述解码信号的频谱进行修正，以使所述频谱在频率轴上的变化被抑制；以及滤波步骤，利用基于修正过的所述频谱的系数，进行所述解码信号的滤波。

发明的效果

根据本发明，即使在每个频带中解码信号的语音质量不同时，也能改善解码信号的语音质量。

附图说明

图1是表示可扩展编码的层结构的图。

图2是表示可扩展编码的层结构的图。

图3是表示本发明的实施方式1的解码装置的主要结构的方框图。

图4是表示图3所示的修正LPC计算单元的内部结构的方框图。

图5是表示根据图4所示的功率频谱修正单元的第一实现方法的功率频谱的修正的情况的图。

图6是表示根据图4所示的功率频谱修正单元的第二实现方法的功率频谱的修正的情况的图。

图7是用来说明图3所示的后置滤波器的频谱特性的图。

图8是表示本发明的实施方式2的解码装置的主要结构的方框图。

图9是表示图8所示的修正LPC计算单元的内部结构的方框图。

图10是表示本发明的实施方式3的解码装置的主要结构的方框图。

图11是表示图10所示的修正LPC计算单元的内部结构的方框图。

图12是表示本发明的实施方式4的解码装置的主要结构的方框图。

图13是表示图12所示的抑制信息计算单元的内部结构的方框图。

图14是表示本发明的实施方式5的解码装置的主要结构的方框图。

图15是表示本发明的实施方式6的解码装置的主要结构的方框图。

图16是表示图15所示的抑制信息计算单元的内部结构的方框图。

图17是表示可扩展编码的层结构的图。

图18是表示后置滤波处理的程度的图。

图19是表示本发明的实施方式7的解码装置的主要结构的方框图。

图20是表示图19所示的抑制信息计算单元的内部结构的方框图。

图21是表示本发明的其它实施方式的解码装置的主要结构的方框图。

图22是表示本发明的其它实施方式的解码装置的主要结构的方框图。

图23是表示本发明的其它实施方式的解码装置的主要结构的方框图。

图24是表示本发明的其它实施方式的解码装置的主要结构的方框图。

具体实施方式

以下，参照附图详细地说明本发明的实施方式。

但是，在实施方式中，对具有相同功能的结构附加相同的标号，并省略重复的说明。而且，在本发明的实施方式中，以三层的分层编码(可扩展编码、嵌入编码)为例，假设第1～3层负责图1所示的信号频带以及语音质量，并对此进行说明。

(实施方式1)

图3是表示本发明实施方式1的解码装置100的主要结构的方框图。在该图中，分离单元101接收从未图示的编码装置传送的比特流，基于记录于所接收的比特流的层信息，分离比特流，并将层信息输出到切换单元1 05以及后置滤波器106的修正LPC计算单元107。

在层信息表示第3层的情况下，也就是在所有的层(第一层～第三层)的编码代码被存储在比特流的情况下，分离单元101从比特流分离第一层编码代码、第二层编码代码和第三层编码代码。分离出的第一层编码代码被输出到第一层解码单元102，第二层编码代码被输出到第二层解码单元103，第三层编码代码被输出到第三层解码单元104。

而且，在层信息表示第2层的情况下，也就是在第一层以及第二层的编码代码被存储在比特流的情况下，分离单元101从比特流分离第一层编码代码和第二层编码代码。分离出的第一层编码代码被输出到第一层解码单元102，第二层编码代码被输出到第二层解码单元103。

进一步地，在层信息表示第1层的情况下，也就是在只有第一层的编码代码被存储在比特流的情况下，分离单元101从比特流分离第一层编码代码，并将分离出的第一层编码代码输出到第一层解码单元102。

第一层解码单元102利用从分离单元101输出的第一层编码代码，生成信号频带k为0以上且低于FH的基本质量的第一层解码信号，并将所生成的第一层解码信号输出到切换单元105以及第二层解码单元103。

当第二层编码代码从分离单元101输出，则第二层解码单元103利用该第二层编码代码和从第一层解码单元102输出的第一层解码信号，生成信号频带k为0以上且低于FL的改善质量的第二层解码信号、以及信号频带k为FL以上且低于FH的基本质量的第二层解码信号。所生成的第二层解码信号被输出到切换单元105以及第三层解码单元104。另外，在层信息表示第1层的情况下，无法得到第二层编码代码，因此第二层解码单元103完全不进行动作，或者更新第二层解码单元103所具有的变量。

当第三层编码代码从分离单元101输出，则第三层解码单元104利用该第三层编码代码和从第二层解码单元103输出的第二层解码信号，生成信号频带k为0以上且低于FH的改善质量的第三层解码信号。所生成的第三层解码信号被输出到切换单元105。另外，在层信息表示第1层或第2层的情况下，无法得到第三层编码代码，因此第三层解码单元104完全不进行动作，或者更新第三层解码单元104所具有的变量。

切换单元105基于从分离单元101输出的层信息，判断能获得哪一层的解码信号，将最高层的解码信号输出到修正LPC计算单元107以及滤波单元108。

后置滤波器106具备修正LPC计算单元107和滤波单元108，修正LPC计算单元107利用从分离单元101输出的层信息和从切换单元105输出的解码信号，计算修正LPC系数，并将计算出的修正LPC系数输出到滤波单元108。后面论述关于修正LPC计算单元107的细节。

滤波单元108利用从修正LPC计算单元107输出的修正LPC系数构成滤波器，对从切换单元105输出的解码信号进行后置滤波处理，并输出后置滤波处理过的解码信号。

图4是表示图3所示的修正LPC计算单元107的内部结构的方框图。在该图中，频率变换单元111进行从切换单元105输出的解码信号的频率分析而求解码信号的频谱(以下称为“解码频谱”)，并将求出的解码频谱输出到功率频谱计算单元112。

功率频谱计算单元112计算从频率变换单元111输出的解码频谱的功率(以下称为“功率频谱”)，并将求出的功率频谱输出到功率频谱修正单元114。

修正频带决定单元113基于从分离单元101输出的层信息，决定进行功率频谱的修正的频带(“修正频带”)，并将所决定的频带作为修正频带信息而输出到功率频谱修正单元114。

在本实施方式中，因为各层负责图1所示的信号频带以及语音质量，所以修正频带决定单元113在层信息表示第1层的情况下，使修正频带为0(不进行修正)，在层信息表示第2层的情况下，使修正频带为0～FL，在层信息表示第3层的情况下，使修正频带为0～FH，从而生成修正频带信息。

功率频谱修正单元114基于从修正频带决定单元113输出的修正频带信息，对从功率频谱计算单元112输出的功率频谱进行修正，并将修正后的功率频谱输出到逆变换单元115。

这里，所谓功率频谱的修正，意味着减弱后置滤波器106的特性，使频谱的变形变小，更具体而言，意味着进行修正以抑制功率频谱的在频率轴上的变化。由此，在层信息表示第2层的情况下，0～FL的频带的后置滤波器106的特性被减弱；在层信息表示第3层的情况下，0～FH的频带的后置滤波器106的特性被减弱。

逆变换单元115对从功率频谱修正单元114输出的修正功率频谱进行逆变换而求自相关函数。求出的自相关函数被输出到LPC分析单元116。另外，逆变换单元115通过利用FFT(Fast Fourier Transform)能够削减运算量。此时，在修正功率频谱的次数没有以2^N表示的情况下，既可以对修正功率频谱进行平均，也可以稀疏修正功率频谱，以使分析长度成为2^N。

LPC分析单元116将自相关法等用于从逆变换单元115输出的自相关函数而求LPC系数，并将求出的LPC系数作为修正LPC系数输出到滤波单元108。

接下来，说明上述的功率频谱修正单元114的具体的实现方法。首先，作为第一实现方法，说明对修正频带的功率频谱进行平滑化(smoothing)的方法。该方法为计算修正频带的功率频谱的平均值，并以计算出的平均值替换进行平均之前的频谱。

图5表示根据第一实现方法的功率频谱的修正的情况。在该图中，表示对于女性的有声部分(voiced part)(/o/)的功率频谱，层信息为第2层(减弱0～FL的频带的后置滤波器106的特性)时的修正的情况，也就是以约为22dB的功率频谱替换0～FL的频带。此时，较为理想的是，以避免在进行修正的频带与未进行修正的频带的连接部分的频谱的变化不连续的方式修正功率频谱。作为其具体的方法，比如，对上述连接部分与其附近的功率频谱求移动平均值，并以该移动平均值替换对应的功率频谱。由此能够求出具有更为正确的频谱特性的修正LPC系数。

接下来，说明上述的功率频谱修正单元114的第二实现方法。第二实现方法是求修正频带的功率频谱的频谱斜率，并以求出的频谱斜率替换该频带的频谱的方法。这里，频谱斜率表示该频带的功率频谱的整体的斜率。比如，使用解码信号的一次的PARCOR系数(反射系数)，或者将该PARCOR系数乘以常数而形成的数字滤波器的频谱特性。该频谱特性乘以使该频带的功率频谱的功率得以保存而计算出的系数，并以其替换该频带的功率频谱。

图6表示根据第二实现方法的功率频谱的修正的情况。在该图中，以约在23～26dB倾斜的功率频谱替换0～FL的频带的功率频谱。

通过这样以频谱斜率替换修正频带的功率频谱，使后置滤波器106的斜率校正滤波器(式1的U(z))的高频域增强的作用在该频带内抵消。也就是说，赋予了相当于式1的U(z)的频谱特性的逆特性的频谱特性。由此，能够使包含了后置滤波器106的该频带的频谱特性更加平滑。

而且，作为功率频谱修正单元114的第三实现方法，也可以利用修正频带的功率频谱的α次幂(0＜α＜1)。该方法与上述那样的对功率频谱进行平滑化的方法相比，能够更加灵活地设计后置滤波器106的特性。

接下来，利用图7说明后置滤波器106的频谱特性，该后置滤波器106是利用上述的修正LPC计算单元107所计算出的修正LPC系数构成的。这里，利用图6所示的频谱来求修正LPC系数，而且假设后置滤波器106的设定值为γ_n＝0.6，γ_d＝0.8，μ＝0.4，并以这样的情况的频谱特性为例进行说明。另外，假设LPC系数的次数为18次。

图7所示的实线表示进行了功率频谱修正的情况的频谱特性，虚线表示未进行功率频谱修正的情况(设定值与上述相同)的频谱特性。如图7所示，进行了功率频谱修正的情况的后置滤波器106的特性，在0～FL的频带基本上平滑，在FL～FH的频带成与未进行功率频谱修正的情况相同的频谱特性。

另一方面，在奈奎斯特频率附近，进行了功率频谱修正的情况的频谱特性与未进行功率频谱修正的情况的频谱特性相比，虽然有若干衰减，但是该频带的信号分量与其它频带的信号分量相比较小，因此该影响几乎可以忽视。

这样，根据实施方式1，对与层信息对应的频带的功率频谱进行修正，基于修正过的功率频谱计算修正LPC系数，利用计算出的修正LPC系数构成后置滤波器，由此即使在各层负责的每个频带语音质量不同时，也能够根据与语音质量对应的频谱特性对解码信号进行后置滤波处理，因此能够改善语音质量。

另外，虽然在本实施方式，说明了对层信息为第1～3层的每个情况都计算修正LPC系数，但是在作为编码的对象的所有的频带为基本上相同的语音质量的层的情况下(在本实施方式中，全频带为基本质量的第1层、以及全频带为改善质量的第3层)，不一定每个频带都需要计算修正LPC系数，在这样的情况下，也可以每层都预先准备规定后置滤波器106的强弱的设定值(γ_d、γ_n以及μ)，切换已准备的设定值来直接构成后置滤波器106。由此，能够削减修正LPC系数的计算所需的处理量和处理时间。

(实施方式2)

图8是表示本发明的实施方式2的解码装置200的主要结构的方框图。在该图中，第一层解码单元201利用从分离单元101输出的第一层编码代码，生成信号频带k为0以上且低于FH的基本质量的第一层解码信号，并将所生成的第一层解码信号输出到切换单元105以及第二层解码单元202。而且，在生成第一层解码信号的过程中生成第一层解码LPC系数，并将所生成的第一层解码LPC系数输出到第二切换单元204。

若从分离单元101输出第二层编码代码，则第二层解码单元202利用该第二层编码代码和从第一层解码单元201输出的第一层解码信号，生成信号频带k为0以上且低于FL的改善质量、以及信号频带k为FL以上且低于FH的基本质量的第二层解码信号。而且，在生成第二层解码信号的过程中生成第二层解码LPC系数。所生成的第二层解码信号被输出到切换单元105以及第三层解码单元203，所生成的第二层解码LPC系数被输出到第二切换单元204。

若从分离单元101输出第三层编码代码，则第三层解码单元203利用该第三层编码代码和从第二层解码单元202输出的第二层解码信号，生成信号频带k为0以上且低于FH的改善质量的第三层解码信号。而且，在生成第三层解码信号的过程中生成第三层解码LPC系数。所生成的第三层解码信号被输出到切换单元105，第三层解码LPC系数被输出到第二切换单元204。

第二切换单元204从分离单元101获取层信息，基于获取的层信息判断能得到哪一层的解码信号，并将最高层的解码LPC系数输出到修正LPC计算单元205。但是，还考虑在解码处理的过程中不生成解码LPC系数的情况，在这样的情况下，从第二切换单元204获取了的解码LPC系数选择一个解码LPC系数。

修正LPC计算单元205利用从分离单元101输出的层信息和从第二切换单元204输出的解码LPC系数，计算修正LPC系数，并将计算出的修正LPC系数输出到滤波单元108。

图9是表示图8所示的修正LPC计算单元205的内部结构的方框图。在该图中，LPC频谱计算单元211对从第二切换单元204输出的解码LPC系数进行离散傅立叶变换，计算各个复数频谱的功率，并将计算出的功率作为LPC频谱输出到LPC频谱修正单元212。

LPC频谱修正单元212基于从修正频带决定单元113输出的修正频带信息，从由LPC频谱计算单元211输出的LPC频谱计算修正LPC频谱，并将计算出的修正LPC频谱输出到逆变换单元115。

这样，根据实施方式2，从解码LPC系数计算出的LPC频谱为去除了解码信号的微细信息的频谱包络，通过基于该频谱包络求修正LPC系数，能够实现更加正确的后置滤波器，因此能够实现语音质量的提高。

(实施方式3)

图10是表示本发明的实施方式3的解码装置300的主要结构的方框图。在该图中，第一层解码单元301利用从分离单元101输出的第一层编码代码，生成信号频带k为0以上且低于FH的基本质量的第一层解码信号，并将所生成的第一层解码信号输出到切换单元105以及第二层解码单元302。而且，在生成第一层解码信号的过程中生成第一层解码频谱(比如，解码MDCT(Modified Discrete Cosine Transform)系数)，并将所生成的第一层解码频谱输出到第二切换单元204。

若从分离单元101输出第二层编码代码，则第二层解码单元302利用该第二层编码代码和从第一层解码单元301输出的第一层解码信号，生成信号频带k为0以上且低于FL的改善质量、以及信号频带k为FL以上且低于FH的基本质量的第二层解码信号。而且，在生成第二层解码信号的过程中生成第二层解码频谱。所生成的第二层解码信号被输出到切换单元105以及第三层解码单元303，第二层解码频谱被输出到第二切换单元204。

当第三层编码代码从分离单元101输出，则第三层解码单元303利用该第三层编码代码和从第二层解码单元302输出的第二层解码信号，生成信号频带k为0以上且低于FH的改善质量的第三层解码信号。而且，在生成第三层解码信号的过程中生成第三层解码频谱。所生成的第三层解码信号被输出到切换单元105，第三层解码频谱被输出到第二切换单元204。

修正LPC计算单元304利用从分离单元101输出的层信息和从第二切换单元204输出的解码频谱，计算修正LPC系数，并将计算出的修正LPC系数输出到滤波单元108。

修正LPC计算单元304具有如图11所示的内部结构，计算修正LPC系数而不进行频率变换。

这样，根据实施方式3，从在解码过程中生成的解码频谱计算功率频谱，并利用计算出的功率频谱计算修正LPC系数，能够削减将时域的信号变换成频域的信号的频率变换处理。

(实施方式4)

图12是表示本发明的实施方式4的解码装置400的主要结构的方框图。在该图中，第一层频谱解码单元401利用从分离单元101输出的第一层编码代码，生成信号频带k为0以上且低于FH的基本质量的第一层解码频谱，并将所生成的第一层解码频谱输出到切换单元105以及第二层频谱解码单元402。

若从分离单元101输出第二层编码代码，则第二层频谱解码单元402利用该第二层编码代码和从第一层频谱解码单元401输出的第一层解码频谱，生成信号频带k为0以上且低于FL的改善质量、以及信号频带k为FL以上且低于FH的基本质量的第二层解码频谱。所生成的第二层解码频谱被输出到切换单元105以及第三层频谱解码单元403。

若从分离单元101输出第三层编码代码，则第三层频谱解码单元403利用该第三层编码代码和从第二层频谱解码单元402输出的第二层解码频谱，生成信号频带k为0以上且低于FH的改善质量的第三层解码频谱。所生成的第三层解码频谱被输出到切换单元105。

后置滤波器404具备抑制信息计算单元405和乘法器406，抑制信息计算单元405基于从分离单元101输出的层信息，计算对每个子带抑制从切换单元105输出的解码频谱的抑制信息，并将计算出的抑制信息输出到乘法器406。后面论述关于抑制信息计算单元405的细节。

作为滤波器部件的乘法器406将从抑制信息计算单元405输出的抑制信息与从切换单元105输出的解码频谱相乘，并将与抑制信息相乘后的解码频谱输出到时域变换单元407。

时域变换单元407将从后置滤波器404的乘法器406输出的解码频谱变换成时域的信号，并作为解码信号输出。

图13是表示图12所示的抑制信息计算单元405的内部结构的方框图。在该图中，抑制系数计算单元411将从功率频谱修正单元114输出的修正功率频谱分割成预先规定的带宽的子带，并求经分割的每个子带的平均值。然后，选择求出的平均值低于规定的阈值的子带，并对于选择出的子带计算抑制解码频谱的系数(矢量值)。由此，能够使包含成为频谱的波谷的频带的子带衰减。顺便说明一句，抑制系数的计算是基于选择出的子带的平均值进行的。作为其具体的计算方法，比如将规定的系数乘以子带的平均值而计算抑制系数。而且，对于平均值在规定的阈值以上的子带，计算不使解码频谱发生变化的系数。

另外，抑制系数不一定为LPC系数，只要是能与解码频谱直接相乘的系数即可。由此，无需进行逆变换处理以及LPC分析处理，能够削减这些处理所需的运算量。

这样，根据实施方式4，通过从解码频谱求抑制系数，并将求出的抑制系数直接乘以解码频谱，从而在频域进行解码信号的频谱的变形，因此无需进行逆变换处理以及LPC分析处理，能够削减这些处理所需的运算量。

(实施方式5)

图14是表示本发明的实施方式5的解码装置600的主要结构的方框图。在该图中，后置滤波器601具备频域变换单元602、抑制信息计算单元603以及乘法器604，频域变换单元602将从切换单元105输出的第n解码信号(n为1～3)变换到频域而生成解码频谱，并将所生成的解码频谱输出到抑制信息计算单元603以及乘法器604。

抑制信息计算单元603基于从分离单元101输出的层信息，计算以子带为单位抑制从切换单元105输出的解码信号的抑制信息，并将计算出的抑制信息输出到乘法器604。抑制信息计算单元603的详情与图13所示的结构相同，因此在此省略说明。

作为滤波器部件的乘法器604将从抑制信息计算单元603输出的抑制信息与从频域变换单元602输出的解码频谱相乘，并将与抑制信息相乘后的解码频谱输出到时域变换单元605。

时域变换单元605将从后置滤波器601的乘法器604输出的解码频谱变换成时域的信号，并作为解码信号输出。

这样，根据实施方式5，通过从解码信号求抑制系数，并将求出的抑制系数直接乘以解码信号，从而在频域进行解码信号的频谱的变形，因此无需进行逆变换处理以及LPC分析处理，能够削减这些处理所需的运算量。

(实施方式6)

图15是表示本发明的实施方式6的解码装置700的主要结构的方框图。在该图中，第二切换单元701从分离单元101获取层信息，并基于获取了的层信息，判断能得到哪一层的解码频谱，将最高层的解码LPC系数输出到后置滤波器702的抑制信息计算单元703。但是，可推测到在解码处理的过程中不生成解码LPC系数的情况，在这样的情况下，从第二切换单元701获取了的解码LPC系数选择一个解码LPC系数。

抑制信息计算单元703利用从分离单元101输出的层信息和从第二切换单元701输出的LPC系数，计算抑制信息，并将计算出的抑制信息输出到乘法器704。后面论述关于抑制信息计算单元703的细节。

乘法器704将从抑制信息计算单元703输出的抑制信息乘以从切换单元105输出的解码频谱，并将与抑制信息相乘后的解码频谱输出到时域变换单元407。

图16是表示图15所示的抑制信息计算单元703的内部结构的方框图。在该图中，LPC频谱计算单元711对从第二切换单元701输出的解码LPC系数进行离散傅立叶变换，计算各个复数频谱的功率，并将计算出的功率作为LPC频谱输出到LPC频谱修正单元712。也就是说，在将解码LPC系数表示为α(i)时，构成下式(2)所表示的滤波器。

P (z) = \frac{1}{A (z)}

= \frac{1}{1 - Σ_{i = 1}^{NP} α (i) \cdot z^{- i}} \cdot \cdot \cdot (2)

PC频谱计算单元711计算由上式(2)表示的滤波器的频谱特性，并输出到LPC频谱修正单元712。其中，NP表示解码LPC系数的次数。

而且，还可以利用调整噪声抑制的强弱的程度的规定的参数γ_n和γ_d，构成下式(3)所表示的滤波器，并计算该滤波器的频谱特性(0＜γ_n＜γ_d ＜1)。

P (z) = \frac{A (z / γ_{n})}{A (z / γ_{d})}

= \frac{1 - Σ_{i = 1}^{NP} α (i) \cdot {γ_{n}}^{i} \cdot z^{- i}}{1 - Σ_{i = 1}^{NP} α (i) \cdot {γ_{d}}^{i} \cdot z^{- i}} \cdot \cdot \cdot (3)

而且，虽然在式(2)或式(3)所表示的滤波器中，有发生低频域(或者高频域)与高频域(或者低频域)相比被过分增强的特性(一般而言，将该特性称为“频谱倾斜(spectral slope)”)的情况，但是也可以并用校正该情况的滤波器(反斜率滤波器，anti-tilt filter)。

LPC频谱修正单元712和功率频谱修正单元114相同地，基于从修正频带决定单元113输出的修正频带信息，对从LPC频谱计算单元711输出的LPC频谱进行修正，并将修正过的LPC频谱输出到抑制系数计算单元713。

抑制系数计算单元713既可以基于在实施方式4中说明过的方法来计算抑制系数，也可以基于以下表示的方法来计算抑制系数。也就是说，抑制系数计算单元713将从LPC频谱修正单元712输出的修正LPC频谱分割成预先规定的带宽的子带，并求分割了的每个子带的平均值。然后，求各个子带中的平均值为最大的子带，利用该子带的平均值对各个子带的平均值进行归一化。将该归一化后的子带平均值作为抑制系数输出。

该方法中，虽然说明在分割成规定的子带后输出抑制系数的方法，但是为了更加细致地决定抑制系数，以频率为单位计算并输出抑制系数也是可以的。该情况，抑制系数计算单元713从LPC频谱修正单元712输出的修正LPC频谱中求最大的频率，利用该频率的频谱对各个频率的频谱进行归一化。将该归一化后的频谱作为抑制系数输出。

这样，根据实施方式6，从解码LPC系数计算出的LPC频谱为去除了解码信号的微细信息的频谱包络，通过基于该频谱包络而直接求抑制系数，能够以较少的运算量来实现更加正确的后置滤波器，从而能够实现语音质量的提高。

(实施方式7)

在本发明的实施方式7中，以两层的分层编码(可扩展编码、嵌入编码)为例，假设第1～2层负责图17所示的信号频带以及语音质量，并对此进行说明。第1层负责低频域(频率k为0以上且低于FL)，第2层负责高频域(频率k为FL以上且低于FH)。因为第1层的比特分配比第2层的比特分配大，所以第1层实现改善质量，第2层实现基本质量。

图18表示在这样的层结构中所需的后置滤波处理的程度。也就是说，在第1层实现低频域的改善质量，因此不需要低频域的后置滤波处理。另一方面，在第2层只实现高频域的基本质量，因此需要将高频域的后置滤波处理的程度设为“强”。

在本实施方式中，设想对LPC预测残差信号在频域进行编码的编码方式，并对其进行说明，所述LPC预测残差信号是通过由LPC系数构成的逆滤波器对输入信号进行滤波而得到的。

图19是表示本发明的实施方式7的解码装置800的主要结构的方框图。在该图中，分离单元101接收从未图示的编码装置传送的比特流，从接收了的比特流生成第一层编码代码、第二层编码代码(全频带预测残差频谱)、以及第二层编码代码(全频带LPC系数)，并将第一层编码代码输出到第一层解码单元801，将第二层编码代码(全频带预测残差频谱)输出到第二层频谱解码单元807，将第二层编码代码(全频带LPC系数)输出到全频带LPC系数解码单元804。

第一层解码单元801利用从分离单元101输出的第一层编码代码，生成信号频带k为0以上且低于FL的改善质量的第一层解码信号，并将所生成的第一层解码信号输出到上采样单元802。而且，在生成第一层解码信号的过程中生成解码LPC系数，并将所生成的解码LPC系数输出到全频带LPC系数解码单元804。

上采样单元802提高从第一层解码单元801输出的第一层解码信号的采样速率，并将经上采样的信号输出到逆滤波单元805以及切换单元105。

全频带LPC系数解码单元804利用从第一层解码单元801输出的解码 LPC系数，对从分离单元101输出的第二层编码代码(全频带LPC系数)进行解码，并将解码全频带LPC系数输出到逆滤波单元805、抑制信息计算单元809以及合成滤波单元812。另外，这里，全频带表示频率k为0以上且低于FH的频带，解码全频带LPC系数表示全频带的频谱包络。

逆滤波单元805根据从全频带LPC系数解码单元804输出的解码全频带LPC系数构成逆滤波器，使从上采样单元802输出的第一层解码信号通过该逆滤波器而生成预测残差信号，并将所生成的预测残差信号输出到频域变换单元806。逆滤波器A(z)利用LPC系数α(i)由下式表示。

A (z) = 1 - Σ_{i = 1}^{NP} α (i) \cdot z^{- i} \cdot \cdot \cdot (4)

其中，NP表示LPC系数的次数。而且，为了控制逆滤波器的强弱，利用γ_a(0＜γ_a＜1)构成下式所表示的逆滤波器而进行滤波处理也是可以的。

A (z) = 1 - Σ_{i = 1}^{NP} α (i) \cdot {γ_{a}}^{i} \cdot z^{- i} \cdot \cdot \cdot (5)

频域变换单元806进行从逆滤波单元805输出的预测残差信号的频率分析，求预测残差信号的频谱(预测残差频谱)，并将求出的预测残差频谱输出到第二层频谱解码单元807。

当第二层编码代码(全频带预测残差频谱)从分离单元101输出时，第二层频谱解码单元807利用从频域变换单元806输出的预测残差频谱，对第二层编码代码(全频带预测残差频谱)进行解码。被生成的全频带预测残差频谱输出到后置滤波器808。

后置滤波器808具备抑制信息计算单元809和乘法器810，抑制信息计算单元809基于从全频带LPC系数解码单元804输出的解码全频带LPC系数，计算抑制信息，并将计算出的抑制信息输出到乘法器810。关于抑制信息计算单元809的详情将后述。

乘法器810将从抑制信息计算单元809输出的抑制信息乘以从第二层频谱解码单元807输出的全频带预测残差频谱，并将与抑制信息相乘了的全频带预测残差频谱输出到逆变换单元811。

逆变换单元811对从后置滤波器808输出的全频带预测残差频谱进行逆变换，以求全频带预测残差信号。求出的全频带预测残差信号被输出到合成滤波单元812。

合成滤波单元812根据从全频带LPC系数解码单元804输出的解码全频带LPC系数构成合成滤波器，使从逆变换单元811输出的全频带预测残差信号通过该合成滤波器而生成全频带解码信号，并将所生成的全频带解码信号输出到切换单元105。合成滤波器H(z)利用逆滤波器A(z)由下式表示。

H (z) = \frac{1}{A (z)} \cdot \cdot \cdot (6)

这样，根据解码装置800，在层信息表示第1层的情况下，第二层解码单元803不进行动作，第一层解码单元801进行动作，没有后置滤波处理。而且，在层信息表示第2层的情况下，第一层解码单元801以及第二层解码单元803进行动作，后置滤波器在高频域进行程度“强”的处理。也就是说，后置滤波器在第二层解码单元803进行动作的情况下发挥作用，因此无需将层信息输出到后置滤波器。

图20是表示图19所示的抑制信息计算单元809的内部结构的方框图。抑制信息计算单元809的内部结构从如图16所示的抑制信息计算单元703的内部结构中去除了修正频带决定单元113，而其它的结构与抑制信息计算单元703相同，因此省略其详细说明。

这样，根据实施方式7，即使在由负责低频域的第1层和负责高频域的第2层的两层进行分层编码的情况，通过基于频谱包络直接求抑制系数，能够以较少的运算量实现更加正确的后置滤波器，从而能够实现语音质量的提高。

另外，在本实施方式中，虽然假设在第二层解码单元803内进行后置滤波处理，并对此进行了说明，但是本发明并不限于此，也可以在第一层解码单元801内进行改善低频域(频率k为0以上且低于FL)的质量的后置滤波处理。在此情况下，通过在低频域进行后置滤波处理，能够使低频域的语音质量为高质量(改善质量或者与其相当的语音质量)。因此，通过在第一层解码单元801和第二层解码单元803分别进行后置滤波处理，能够改善低频域和高频域、也就是全频带的语音质量。

(其它实施方式)

在上述各个实施方式中以可扩展编码为前提进行了说明，而在这里说明适用了可扩展编码以外的编码方式的情况。在此情况下，假设使用表示了比特分配的大小的比特分配信息来代替层信息。

图21示出与实施方式1对应的解码装置500的结构。如该图所示，比特流在分离单元501中被分离成编码代码和比特分配信息，分离出的编码代码被输出到解码单元502，分离出的比特分配信息被输出到解码单元502以及修正LPC计算单元107。

基于比特分配信息，编码代码在解码单元502中被解码，解码信号被输出到修正LPC计算单元107以及滤波单元108。

而且，图22示出与实施方式2对应的解码装置510的结构。如该图所示，在解码单元511，在编码代码的解码过程中生成解码LPC系数，所生成的解码LPC系数被输出到修正LPC计算单元205。而且，解码信号被输出到滤波单元108。

而且，图23示出与实施方式3对应的解码装置520的结构。如该图所示，在解码单元521，在编码代码的解码过程中生成解码频谱，所生成的解码频谱被输出到修正LPC计算单元304。而且，解码信号被输出到滤波单元1 08。

而且，图24示出与实施方式4对应的解码装置530的结构。如该图所示，在解码单元531，从编码代码生成解码频谱，所生成的解码频谱被输出到抑制信息计算单元405以及乘法器406。

另外，虽然在本实施方式中，说明了基于比特分配信息来决定对频谱进行修正的频带的情况，但是也可以预先规定对频谱进行修正的频带。

以上说明了本发明的各个实施方式。

另外，上述实施方式中的频率变换单元由FFT、DFT(Discrete FourierTransform，离散傅立叶变换)、DCT(Discrete Cosine Transform，离散余弦变换)、MDCT、子带滤波器等来实现。

而且，虽然在上述实施方式中，假定了语音信号作为解码信号，但本发明并不限于此，比如也可以是音频信号等。

而且，虽然在上述各个实施方式中以通过硬件来构成本发明的情况为例进行了说明，但是本发明还可以通过软件来实现。

而且，在上述各个实施方式的说明中使用的各功能块，通常被作为通过集成电路的LSI(大规模集成电路)来实现。这些块既可是每个块单独地集成到一个芯片，或者可以是部分或所有块集成到一个芯片。在此虽然称为LSI，但根据集成度的不同也可以称为IC、系统LSI、超大LSI(Super LSI)、或特大LSI(Ultra LSI)。

而且，实现集成电路化的技术不只限于LSI，也可以使用专用电路或通用处理器来实现。也可以利用可在LSI制造后编程的FPGA(FieldProgrammable Gate Array)，或利用可重构LSI内部的电路单元的连接和设定的可重构处理器。

进而，随着半导体技术的进步或随之派生的其他技术出现，如果出现可取代LSI集成电路的新技术，当然也可以利用该新技术进行功能块的集成化。并且存在着适用生物技术等的可能性。

本说明书基于2005年6月17日提交的日本专利申请特愿第2005-177781号以及2006年5月17日提交的日本专利申请特愿第2006-150356号。其内容全部包括在此。

工业实用性

本发明的后置滤波器、解码装置以及后置滤波处理方法，即使在每个频带，解码信号的语音质量不同时，也能改善解码信号的语音质量，能够适用于例如语音解码装置等。

Claims

1.一种后置滤波器，抑制由具备多个层的编码方式分层编码过的信号的解码信号的量化噪声，该后置滤波器包括：

频带决定单元，决定进行所述解码信号的频谱修正的频带；

频谱修正单元，对属于所决定的所述频带的所述解码信号的频谱进行修正，以使所述频谱在频率轴上的变化被抑制；以及

滤波单元，利用基于修正后的所述频谱的系数，对所述解码信号进行滤波。

2.如权利要求1所述的后置滤波器，其中，所述频带决定单元根据由哪层对所述解码信号进行了解码，来决定进行所述解码信号的频谱修正的频带。

3.如权利要求1所述的后置滤波器，其中，所述频谱修正单元进行修正，以使属于所决定的所述频带的所述解码信号的频谱、和属于与所决定的所述频带相邻的频带的所述解码信号的频谱是连续的。

4.如权利要求1所述的后置滤波器，其中，所述频谱修正单元根据属于所决定的所述频带的所述解码信号的功率频谱的平均值，进行置换所述功率频谱的修正。

5.如权利要求1所述的后置滤波器，其中，所述频谱修正单元根据属于所决定的所述频带的所述解码信号的功率频谱的频谱斜率，进行置换所述功率频谱的修正。

6.如权利要求1所述的后置滤波器，其中，所述频谱修正单元从所述分层编码后的信号的解码过程中所生成的解码LPC系数计算LPC频谱，并修正计算出的LPC频谱。

7.如权利要求6所述的后置滤波器，其中，还包括：

抑制系数计算单元，基于由所述频谱修正单元修正过的LPC频谱，计算抑制所述解码信号的频谱的系数，

所述滤波单元通过将所述抑制系数乘以解码信号的频谱，在频域对所述解码信号进行滤波。

8.如权利要求1所述的后置滤波器，其中，所述频谱修正单元从所述经分层编码的信号的解码过程中所生成的解码频谱计算功率频谱，并对计算出的功率频谱进行修正。

9.如权利要求1所述的后置滤波器，其中，还包括：

抑制系数计算单元，基于由所述频谱修正单元修正过的功率频谱，计算抑制所述解码信号的频谱的系数，

所述滤波单元通过将所述抑制系数乘以解码信号的频谱，在频域中进行所述解码信号的滤波。

10.如权利要求1所述的后置滤波器，其中，还包括：

逆变换单元，通过对由所述频谱修正单元修正过的功率频谱进行傅立叶逆变换，计算自相关函数；以及

LPC分析单元，利用计算出的所述自相关函数，计算LPC系数，

所述滤波单元利用所述LPC系数进行所述解码信号的滤波。

11.如权利要求10所述的后置滤波器，其中，在修正过的所述功率频谱的次数无法以2的幂次表示的情况下，所述逆变换单元对修正过的所述功率频谱进行平均，或者稀疏修正过的所述功率频谱而进行快速傅立叶逆变换，以使所述次数成为2的幂次。

12.一种解码装置，抑制由具备多个层的编码方式分层编码过的信号的解码信号的量化噪声，该装置包括：

频带决定单元，决定进行所述解码信号的频谱修正的频带；

滤波单元，利用基于修正过的所述频谱的系数，进行所述解码信号的滤波。

13.一种后置滤波处理方法，抑制由具备多个层的编码方式分层编码过的信号的解码信号的量化噪声，该方法包括：

频带决定步骤，决定进行所述解码信号的频谱修正的频带；

频谱修正步骤，对属于所决定的所述频带的所述解码信号的频谱进行修正，以使所述频谱在频率轴上的变化被抑制；以及

滤波步骤，利用基于修正过的所述频谱的系数，进行所述解码信号的滤波。