CN101826326B

CN101826326B - 一种立体声编码方法、装置和编码器

Info

Publication number: CN101826326B
Application number: CN2009101188708A
Authority: CN
Inventors: 郎玥; 吴文海; 苗磊; 刘泽新; 胡晨; 张清
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2009-03-04
Filing date: 2009-03-04
Publication date: 2012-04-04
Anticipated expiration: 2029-03-04
Also published as: EP2405424B1; CN101826326A; US20110317843A1; WO2010099752A1; EP2405424A1; ES2529732T3; EP2793228B1; EP2405424A4; US9064488B2; EP2793228A1

Abstract

本发明实施例公开了一种立体声编码方法、装置和编码器，涉及通信技术领域。本发明实施例提供的立体声编码方法包括：获得左声道能量关系系数以及与右声道能量关系系数；分别获得左能量和以及右能量和；根据所述左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带；以及根据所述右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带；采用所述左、右能量和以及互相关结果，获取缩放因子；根据所述缩放因子对所述立体声的左右声道信号进行编码。本发明实施例降低了确定缩放因子的复杂度，与现有技术相比，减小了立体声编码的计算量和复杂度，在较大程度上节省了系统资源。

Description

一种立体声编码方法、装置和编码器

技术领域

本发明涉及通信技术领域，尤其涉及一种立体声编码方法、装置和编码器。

背景技术

立体声编码技术将左、右声道信号下混成第一单声道信号；然后再对第一单声道信号与左右声道信号之间的能量关系进行编码；对第一单声道信号进行调整，得到第二单声道信号；对第二单声道信号与左，右声道的差值分别进行编码。在解码端用这些信息来重建声音信号，可以获得很好的立体声效果。

在现有的立体声编码技术中，需要确定缩放因子才能对第一单声道信号进行调整。为确定最佳的缩放因子，现有技术采用将所有可能的缩放因子进行计算和比较，因此，需要的计算量和复杂度非常高，占用了较多的系统资源。

发明内容

本发明实施例提供了一种立体声编码方法、装置和编码器，降低了确定缩放因子的复杂度，减小了需要的计算量和复杂度，从而在较大程度上节省了系统资源。

为实现上述目的，本发明实施例采用以下技术方案：

一方面，本发明实施例提供了一种立体声编码方法，包括：

获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数，所述第一单声道信号为立体声左右声道信号混合生成；

分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关系系数的左能量和，以及位于波谷位置的所述第一单声道信号各子带关于右声道能量关系系数的右能量和；

根据所述左声道能量关系系数，对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关；以及根据所述右声道能量关系系数，对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关，得到互相关结果；

采用所述左、右能量和、以及所述互相关结果，获取缩放因子；

根据所述缩放因子对所述立体声的左右声道信号进行编码。

一方面，本发明实施例提供了一种立体声编码装置，包括：

能量关系获取模块，用于获得第一单声道信号与左声道信号的左声道能量关系系数、以及所述第一单声道信号与右声道信号的右声道能量关系系数，所述第一单声道信号为立体声左右声道信号混合生成；

能量和获取模块，用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的左声道能量关系系数的左能量和，以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块生成的右声道能量关系系数的右能量和；

互相关模块，用于根据所述能量关系获取模块获得的左声道能量关系系数，对在波谷位置的第一单声道信号的各子带、和所述左声道信号的各子带进行互相关；以及根据所述能量关系获取模块获得的右声道能量关系系数，对在波谷位置的第一单声道信号的各子带、和所述右声道信号的各子带进行互相关，得到互相关结果；

缩放因子获取模块，用于根据所述能量和获取模块生成的左、右能量和、与互相关模块生成的互相关结果，获取缩放因子。

编码模块，用于根据所述缩放因子对所述立体声的左右声道信号进行编码。

另一方面，本发明实施例提供了一种编码器，包括：

本发明实施例提供的立体声编码方法、装置和编码器，通过降低确定缩放因子的复杂度，与现有技术相比，减小了立体声编码的计算量和复杂度，在较大程度上节省了系统资源。

附图说明

图1为本发明实施例一提供的一种立体声编码方法的流程图；

图2为本发明实施例二提供的确定最佳缩放因子的步骤的流程图；

图3为本发明实施例二提供的根据所述左、右能量和以及所述互相关结果，确定所述缩放因子所在的范围的步骤的流程图；

图4为本发明实施例二提供的在所述范围内确定最佳缩放因子的步骤的流程图；

图5为本发明实施例五提供的一种立体声编码装置的结构图；

图6为本发明实施例五提供的缩放因子获取模块的结构图；

图7为本发明实施例六提供的缩放因子范围确定单元的结构图；

图8为本发明实施例六提供的最佳缩放因子确定单元的结构图。

具体实施方式

为使本发明实施例的目的、技术方案及优点更加清楚明白，以下参照附图，对本发明实施例作进一步地详细说明。

如图1所示，本发明实施例一提供了一种立体声编码方法，包括：

101、获得第一单声道信号与左声道信号的左声道能量关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数，所述第一单声道信号为立体声左右声道信号混合生成；

在本发明实施例中，首先将左、右声道信号下混成一路单声道信号，并将所述单声道信号变换至MDCT域，对MDCT域的单声道信号进行编码后，再进行本地解码，从而得到单声道monoc信号，该单声道monoc信号即为第一单声道信号；计算所述第一单声道信号与左、右声道信号的能量关系(panning)系数，所述能量关系系数包括：左声道能量关系系数和右声道能量关系系数。

102、分别获得位于波谷位置的所述第一单声道信号各子带关于左声道能量关系系数的左能量和，以及位于波谷位置的所述第一单声道信号各子带关于右声道能量关系系数的右能量和；

利用下式获取左能量和，即波谷位置的所述第一单声道信号与左声道能量关系系数的乘积的能量和ml_e；

ml_e = \underset{n}{Σ} {(m (n) * wl)}^{2}

其中，m(n)为所述波谷位置的单声道信号，wl为波谷位置所在子带对应的左声道能量关系系数；

利用下式获取右能量和，即波谷位置的所述第一单声道信号与右声道能量关系系数的乘积的能量和mr_e

mr_e = \underset{n}{Σ} {(m (n) * wr)}^{2}

其中，m(n)为所述波谷位置的单声道信号，wr为波谷位置所在子带对应的右声道能量关系系数；

103、根据所述左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带；以及根据所述右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带，得到互相关结果；

利用下式使左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带，得到左互相关结果l_m；

l_m = \underset{n}{Σ} m (n) * wl * l (n)

其中，m(n)为所述波谷位置的单声道信号，wl为波谷位置所在子带对应的左声道能量关系系数，l(n)为所述波谷位置的左声道信号；

利用下式使所述右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带，得到右互相关结果r_m；

r_m = \underset{n}{Σ} m (n) * wr * r (n)

其中，m(n)为所述波谷位置的单声道信号，wr为波谷位置所在子带对应的右声道能量关系系数，r(n)为所述波谷位置的右声道信号；

104、采用所述左、右能量和以及所述互相关结果，获取缩放因子；

将步骤102、步骤103计算得到的ml_e、mr_e、l_m、r_m代入下式，计算得到缩放因子的值mult；

mult = \frac{l_m + r_m}{ml_e + mr_e}

105、根据所述缩放因子对所述立体声的左右声道信号进行编码。

使用所述缩放因子和所述能量关系(panning)系数调整所述第一单声道信号，得到第二单声道信号，所述第二单声道信号包括：第二单声道左信号和第二单声道右信号；对左声道信号与所述第二左单声道信号的差值、右声道信号与所述第二右单声道信号的差值分别进行编码。

在本发明实施例一提供的立体声编码方法中，利用波谷位置的单声道信号与左声道能量关系系数、右声道能量关系系数的乘积的能量和，波谷位置的单声道信号与左、右声道信号的互相关值来直接计算缩放因子，大大简化了现有技术中确定缩放因子的复杂度，从而在整体上减小来立体声编码的计算量和复杂度，显著的节省了系统资源。

在本发明实施例一中计算得到的缩放因子可以直接用于对第一声道信号的调整过程。为了取得更好的调整效果，在本发明实施例二中，提供了一种更为精确的确定最佳缩放因子的方法，由于其他步骤均与本发明实施例一相同，因此，下面仅对本发明实施例二中确定最佳缩放因子的方法进行描述。

如图2所示，本发明实施例二确定最佳缩放因子的步骤包括：

201、根据所述左、右能量和以及所述互相关结果，确定所述缩放因子所在的范围；

202、在所述范围内确定最佳缩放因子。

从码本里所述范围内所有的缩放因子中选取一个最佳的缩放因子。下面将结合附图对上述步骤分别进行详细描述。

如图3所示，在本发明实施例二中，根据所述左、右能量和以及所述互相关结果，确定所述缩放因子所在的范围的步骤包括：

301、根据所述左、右能量和以及所述互相关结果，计算初始缩放因子的值；

将将步骤102、步骤103计算得到的ml_e、mr_e、l_m、r_m代入下式，计算得到初始缩放因子的值mult。

mult = \frac{l_m + r_m}{ml_e + mr_e}

302、对所述初始缩放因子的值进行量化，得到量化索引；

利用缩放因子量化器对所述初始缩放因子的值进行量化，从而获得初始缩放因子的量化索引；

303、根据所述的量化索引，在缩放因子码本中，确定最佳缩放因子的搜索范围。

在所述缩放因子码本中，所有的缩放因子按照其对应的量化索引递增的顺序排列，因此可以确定，最佳的缩放因子为所得到的初始缩放因子、初始缩放因子的量化索引减一所对应的缩放因子、初始缩放因子的量化索引加一所对应的缩放因子三者中的其中一个；

或者还可以将所述搜索范围按照以下方式设定，先从初始缩放因子的量化索引减一所对应的缩放因子、初始缩放因子的量化索引加一所对应的缩放因子中找出与初始缩放因子距离最近的一个(即与初始缩放因子之差的绝对值最小的一个)，将其与初始缩放因子一起作为缩放因子的搜索范围；

若所述初始缩放因子的量化索引为码本中的最小索引，则最佳的缩放因子为所得到的初始缩放因子、初始缩放因子的量化索引加一所对应的缩放因子两者中的其中一个；

若所述初始缩放因子的量化索引为码本中的最大索引，则最佳的缩放因子为所得到的初始缩放因子、初始缩放因子的量化索引减一所对应的缩放因子两者中的其中一个。

如图4所示，在本发明实施例二中，在所述范围内确定最佳缩放因子的步骤包括：

401、根据所述范围内的缩放因子，分别计算预测误差能量；

将所述范围内的缩放因子，分别代入下式，计算各个缩放因子所对应的预测误差能量dist；

dist = \underset{n}{Σ} {(l (n) - wl * M (n))}^{2} + {(r (n) - wr * M (n))}^{2}

其中，l(n)为波谷位置的左声道信号，r(n)为波谷位置的右声道信号，wl为波谷位置所在子带对应的左声道能量关系系数，wr为波谷位置所在子带对应的右声道能量关系系数，M(n)为所述波谷位置的第一单声道信号m(n)与缩放因子的乘积；

402、从所述预测误差能量中，选取最小的预测误差能量；

将根据上式得到的预测误差能量进行排序，获取最小的预测误差能量；

403、所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。

找到计算得到所述最小的预测误差能量所用到的缩放因子，所述缩放因子即为最佳缩放因子。

在本发明实施例二中，通过先确定缩放因子的搜索范围，然后从所述搜索范围内的缩放因子中选取最佳缩放因子，与现有技术相关系，简化了确定缩放因子的复杂度，从而在整体上减小来立体声编码的计算量和复杂度，显著的节省了系统资源。

在本发明实施例二计算初始缩放因子的过程中，需要用到左、右声道的能量关系系数。在本发明实施例三计算初始缩放因子的过程中，可以将所述左、右声道的能量关系系数均设为1，计算初始缩放因子，并最终确定最佳缩放因子。

在本发明实施例四计算初始缩放因子的过程中，可以将所述左声道的能量关系系数设为频带内左声道能量关系系数的平均值，将所述右声道能量关系系数设为频带内右声道能量关系系数的平均值，计算初始缩放因子，并最终确定最佳缩放因子。

由于本发明实施例三、本发明实施例四仅在左、右声道的能量关系系数的选取中，与本发明实施例一有所不同，其余步骤均与本发明实施例一相同，因此不再过多复述。

基于上述方法实施例，本发明实施例五提供了一种立体声编码装置，如图5所示，该装置包括：

能量关系获取模块501，用于获得第一单声道信号与左声道信号的左声道能量关系系数以及所述第一单声道信号与右声道信号的右声道能量关系系数，所述第一单声道信号为立体声左右声道信号混合生成；

能量和获取模块502，用于分别获得位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块501生成的左声道能量关系系数的左能量和，以及位于波谷位置的所述第一单声道信号各子带关于所述能量关系获取模块501生成的右声道能量关系系数的右能量和；

互相关模块503，用于根据所述能量关系获取模块502获得的左声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述左声道信号的各子带；以及根据所述能量关系获取模块502获得的右声道能量关系系数互相关在波谷位置的第一单声道信号的各子带和所述右声道信号的各子带，得到互相关结果；

缩放因子获取模块504，用于根据所述能量和获取模块502生成的左、右能量和与互相关模块503生成的左、右互相关，获取缩放因子的值。

编码模块505，用于根据所述缩放因子获取模块504得到的缩放因子对所述立体声的左右声道信号进行编码。

在本发明实施例五提供的立体声编码装置中，利用波谷位置的单声道信号与左、右声道能量关系系数的乘积的能量和，波谷位置的单声道信号与左、右声道信号的互相关值来直接计算缩放因子，大大简化了现有技术中确定缩放因子的复杂度，从而在整体上减小来立体声编码的计算量和复杂度，显著的节省了系统资源。

在所述缩放因子获取模块504中计算得到的缩放因子可以直接用于编码模块505中对所述立体声的左右声道信号进行编码。为了取得更好的效果，在本发明实施例六中，如图6所示，所述缩放因子获取模块504，包括：

缩放因子范围确定单元601，用于根据所述能量和获取模块502生成的左、右能量和与互相关模块503生成的互相关结果，确定所述缩放因子的所在范围；

最佳缩放因子确定单元602，用于在所述缩放因子范围确定单元601确定的范围内确定最佳缩放因子。

如图7所示，在本发明实施例六中，所述缩放因子范围确定单元601，包括：

初始缩放因子求取单元701，用于根据所述能量和获取模块生成的左、右能量和与互相关模块生成的互相关结果，计算初始缩放因子的值；

量化单元702，用于对所述初始缩放因子求取单元701所得到的初始缩放因子的值进行量化，得到量化索引；

范围确定单元703，用于根据所述量化单元702得到的量化索引，在缩放因子码本中，确定缩放因子的搜索范围。

如图8所示，在本发明实施例六中，所述最佳缩放因子确定单元602包括：

预测误差能量计算单元801，用于根据所述范围内的缩放因子，分别计算预测误差能量；

最小预测误差能量选取单元802，用于从所述预测误差能量计算单元801得到的预测误差能量中，选取最小的预测误差能量；

确定最佳缩放因子单元803，用于将所述最小预测误差能量选取单元802选取的最小的预测误差能量所对应的缩放因子确定为最佳缩放因子。

本发明实施例六提供的立体编码装置，通过先确定缩放因子的搜索范围，然后从所述搜索范围内的缩放因子中选取最佳缩放因子，与现有技术相比，简化了确定缩放因子的复杂度，从而在整体上减小来立体声编码的计算量和复杂度，显著的节省了系统资源。

本发明实施例七提供了一种编码器，包括：

在本发明实施例七提供的编码器中，大大简化了现有技术中确定缩放因子的复杂度，从而在整体上减小来立体声编码的计算量和复杂度，显著的节省了系统资源。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分步骤是可以通过程序来指令相关的硬件完成，所述的程序可以存储于计算机可读存储介质中，如ROM/RAM、磁碟或光盘等。

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到变化或替换，都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应所述以权利要求的保护范围为准。

Claims

1.一种立体声编码方法，其特征在于，包括：

根据所述缩放因子对所述立体声的左右声道信号进行编码。

2.根据权利要求1所述的立体声编码方法，其特征在于，所述根据所述左、右能量和以及所述互相关结果，获取缩放因子的步骤包括：

采用所述左、右能量和以及所述互相关结果，确定所述缩放因子所在的范围；

在所述范围内确定最佳缩放因子。

3.根据权利要求2所述的立体声编码方法，其特征在于，所述根据所述左、右能量和以及所述互相关结果，确定所述缩放因子的范围的步骤包括：

根据所述左、右能量和以及所述互相关结果，计算初始缩放因子的值；

对所述初始缩放因子的值进行量化，得到量化索引；

根据所述的量化索引，在缩放因子码本中，确定缩放因子的搜索范围。

4.根据权利要求3所述的立体声编码方法，其特征在于，所述在所述范围内确定最佳缩放因子的步骤包括：

根据所述范围内的缩放因子，分别计算预测误差能量；

从所述预测误差能量中，选取最小的预测误差能量；

所述最小的预测误差能量所对应的缩放因子即为最佳缩放因子。

5.根据权利要求4所述的立体声编码方法，其特征在于，所述左声道能量关系系数和右声道能量关系系数均为1。

6.根据权利要求4所述的立体声编码方法，其特征在于，所述左声道能量关系系数为频带内左声道能量关系系数的平均值，所述右声道能量关系系数为频带内右声道能量关系系数的平均值。

7.一种立体声编码装置，其特征在于，包括：

编码模块，用于根据所述缩放因子获取模块得到的缩放因子对所述立体声的左右声道信号进行编码。

8.根据权利要求7所述的立体声编码装置，其特征在于，所述缩放因子获取模块包括：

缩放因子范围确定单元，用于根据所述能量和获取模块生成的左、右能量和与互相关模块生成的互相关结果，确定所述缩放因子的所在范围；

最佳缩放因子确定单元，用于在所述缩放因子范围确定单元确定的范围内确定最佳缩放因子。

9.根据权利要求8所述的立体声编码装置，其特征在于，所述缩放因子范围确定单元包括：

初始缩放因子求取单元，用于根据所述能量和获取模块生成的左、右能量和与互相关模块生成的互相关结果，计算初始缩放因子的值；

量化单元，用于对所述初始缩放因子求取单元所得到的初始缩放因子的值进行量化，得到量化索引；

范围确定单元，用于根据所述量化单元得到的量化索引，在缩放因子码本中，确定缩放因子的搜索范围。

10.根据权利要求8所述的立体声编码装置，其特征在于，所述最佳缩放因子确定单元包括：

预测误差能量计算单元，用于根据所述范围内的缩放因子，分别计算预测误差能量；

最小预测误差能量选取单元，用于从所述预测误差能量计算单元得到的预测误差能量中，选取最小的预测误差能量；

确定最佳缩放因子单元，用于将所述最小预测误差能量选取单元选取的最小的预测误差能量所对应的缩放因子确定为最佳缩放因子。

11.一种编码器，其特征在于，包括如权利要求7至权利要求10任意一项权利要求所述的立体声编码装置。