CN109036455B

CN109036455B - 直达声与背景声提取方法、扬声器系统及其声重放方法

Info

Publication number: CN109036455B
Application number: CN201811072475.6A
Authority: CN
Inventors: 叶超; 蔡野锋; 马登永; 沐永生
Original assignee: Zhongke Shangsheng Suzhou Electronics Co ltd
Current assignee: Zhongke Shangsheng Suzhou Electronics Co ltd
Priority date: 2018-09-17
Filing date: 2018-09-17
Publication date: 2020-11-06
Anticipated expiration: 2038-09-17
Also published as: CN109036455A; WO2020057050A1

Abstract

本发明涉及一种直达声与背景声提取方法，能够较好地区分直达声与背景声。本发明还涉及一种扬声器系统及其声重放方法。一种直达声与背景声提取方法，包括如下步骤：S1、分别将左声道信号x_L(n)和右声道信号x_R(n)进行短时傅里叶变换得到分别对应左声道信号和右声道信号的X_L(m,k)和X_R(m,k)，其中n表示时域采样点，m和k分别表示离散时间和离散频率；S2、引入空间因子，将背景声信号表达为一个信号经过房间内的不同传递路径而产生的信号，并分别对X_L(m,k)和X_R(m,k)进行能量估计，得出左右声道的能量P_L(m,k)和P_R(m,k)；S3、设定空间因子的值，进行信号分离得出时频域的直达声信号的估计

左声道背景声信号的估计

和右声道背景声信号的估计

S4、经过逆傅里叶变换得到时域的直达声信号

左声道背景声信号

和右声道背景声信号

Description

直达声与背景声提取方法、扬声器系统及其声重放方法

技术领域

本发明涉及立体声双通道信号转换为多通道信号的方法，具体涉及一种基于频域空间分解的直达声与背景声提取方法、扬声器系统及其声重放方法。

背景技术

目前大多数的音源仍然是立体声的，包括CD、MP3、广播信号等都是双通道输出，仅有左右通道(L、R)，所有的特征信息，比如直达声信号、混响声信号、声源位置、声场空间大小等都包含在两个通道内。当采用多个扬声器重放立体声音源时，如果直接将左右通道信号馈给各个扬声器，会造成空间声场的混乱。因此，需要采用数字信号处理技术将立体声信号转换为多通道信号，通过多个扬声器系统进行重放，以构建真实的空间声场。

传统处理方法一般采用时域逐点计算的方法，在分离直达声和背景声信号时，由于相关系数是采用逐点计算的方法，容易引入误差，导致直达声与背景声不能很好的区分。

如美国专利US6496584B2和中国专利ZL01802081.X公开的基于主成分分析(PCA)的方法，采用最小均方误差法计算左右通道的加权因子，分离出语言声与背景声，通过计算左右通道间的相关系数，确定在三维坐标下声信号的矢量关系，然后根据能量守恒原则将语言声与背景声分为左、中、右和环绕四个信号，再通过去相关滤波器把环绕信号分为左后和右后环绕，实现双通道到5通道的转换。这种方法从时域上进行计算，方法简单，运算速度快，但是通过PCA分析只能分离出一个环绕信号，而利用去相关滤波器分离左后和右后环绕的方法会产生一定的误差。

发明内容

针对上述问题，本发明旨在提出一种直达声与背景声提取方法，能够较好地区分直达声与背景声。本发明还旨在提出一种基于该直达声与背景声提取方法进行声重放的扬声器系统及其声重放方法。

根据本发明的第一个方面，本发明采用的技术方案为：

一种直达声与背景声提取方法，包括如下步骤：

S1、分别将左声道信号x_L(n)和右声道信号x_R(n)进行短时傅里叶变换得到分别对应左声道信号和右声道信号的X_L(m,k)和X_R(m,k)，其中n表示时域采样点，m和k分别表示离散时间和离散频率；

S2、引入空间因子，将背景声信号表达为一个信号经过房间内的不同传递路径而产生的信号，并分别对X_L(m,k)和X_R(m,k)进行能量估计，得出左右声道的能量P_L(m,k)和P_R(m,k)；

S3、设定空间因子的值，进行信号分离得出时频域的直达声信号的估计

左声道背景声信号的估计

和右声道背景声信号的估计

S4、经过逆傅里叶变换得到直达声信号

左声道背景声信号

和右声道背景声信号

在一实施例，步骤S1中，

其中，J表示空间中存在的直达声源的个数，s_j(n)表示某个时刻的直达声信号，

分别表示直达声信号分配给左右通道信号的系数，n_L(n)和n_R(n)分别表示左右通道的背景信号；

其中，S_j(m,k)表示时频域的直达声信号，

分别表示直达声信号分配给左右通道信号的系数的时频域表达式，N_L(m,k)和N_R(m,k)分别表示左右通道的背景信号的时频域表达式。

在一实施例中，步骤S2具体包括：

S21、在某一时间m和某一频段k，只存在一个声源S_i，则

其中，A_L、A_R分别表示直达声信号分配给左右通道信号的系数；

S22、引入空间因子B_L(m,k)和B_R(m,k)，得出如下表达式，N_L(m,k)＝B_L(m,k)N(m,k)，N_R(m,k)＝B_R(m,k)N(m,k)，

其中，N(m,k)表示时频域的背景信号，b_L(m,k)、b_R(m,k)分别表示左右通道空间因子的幅度，

分别表示左右通道空间因子的相位；

则，X_L(m,k)和X_R(m,k)分别简化为：

X_L(m,k)＝A_L(m,k)S(m,k)+B_L(m,k)N(m,k)

X_R(m,k)＝A_R(m,k)S(m,k)+B_R(m,k)N(m,k)

左右声道信号之间的相关系数

其中，E{}表示信号的期望；

S23、从能量角度可以得出左右声道的能量P_L(m,k)和P_R(m,k)分别为：

优选地，步骤S3具体包括：设定空间因子的值，得到P_S(m,k)，P_N(m,k)，A_L(m,k)，A_R(m,k)的解析解，计算出下式(1)和(2)

将空间因子B_L(m,k)和B_R(m,k)分别代入式(2)中，得到

和

更优选地，设定空间因子的值b_L(m,k)＝b_R(m,k)＝1，

根据本发明的第二个方面，本发明采用的技术方案为：

一种扬声器系统的声重放方法，采用如上所述的直达声与背景声提取方法分离出直达声信号和背景声信号，将直达声信号和背景声信号分配给扬声器系统的各个扬声器，以进行声重放。

具体地，根据立体声信号中声像的方位及所述扬声器系统的扬声器数量和位置，将直达声信号和背景声信号分配给扬声器系统的各个扬声器。

根据本发明的第三个方面，本发明采用的技术方案为：

一种扬声器系统，包括多个扬声器，其特征在于，所述扬声器系统还包括用于执行如上所述的直达声与背景声提取方法的提取装置。

具体地，所述提取装置包括包括依次连接的STFT模块、能量估计模块、信号分离模块及ISTFT模块，

所述STFT模块的输入为左声道信号x_L(n)和右声道信号x_R(n)，用于进行短时傅里叶变换后输出对应左声道信号和右声道信号的X_L(m,k)和X_R(m,k)；

所述能量估计模块，用于接收STFT模块输出的X_L(m,k)和X_R(m,k)，并引入空间因子，将背景声信号表达为一个信号经过房间内的不同传递路径而产生的信号，并分别对X_L(m,k)和X_R(m,k)进行能量估计，得出左右声道的能量P_L(m,k)和P_R(m,k)并输出至所述信号分离模块；

所述信号分离模块，用于设定空间因子的值，进行信号分离得出

和

并输出至所述ISTFT模块；

所述ISTFT模块，用于进行逆傅里叶变换，输出直达声信号

左声道背景声信号

和右声道背景声信号

本发明采用以上方案，相比现有技术具有如下优点：

通过定义左右声道信号之间的空间因子变量，以表征背景声信号在声传播过程中由于房间混响、空间大小等因素引起的左右通道之间的差异；可以分离出左右通道的背景声信号，而传统方法只能分离出一个背景信号。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为根据本发明的直达声与背景声提取方法的信号处理流程图；

图2示出了左右声道信号；

图3示出了左右声道信号在某个时刻的相关系数；

图4a、4b、4c分别示出了分离后的直达声信号、左声道背景声信号、右声道背景声信号。

具体实施方式

下面结合附图对本发明的较佳实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域的技术人员理解。在此需要说明的是，对于这些实施方式的说明用于帮助理解本发明，但并不构成对本发明的限定。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以互相结合。

本实施例提供一种直达声与背景声提取方法，参照图1所示的信号流程图，该提取方法包括如下步骤：

S1、分别将左声道信号x_L(n)和右声道信号x_R(n)进行短时傅里叶变换(STFT)得到分别对应左声道信号和右声道信号的X_L(m,k)和X_R(m,k)，其中n表示时域采样点，m和k分别表示离散时间和离散频率；

左声道背景声信号的估计

和右声道背景声信号的估计

S4、经过逆傅里叶变换(ISTFT)得到时域的直达声信号

左声道背景声信号

和右声道背景声信号

具体地，如图2所示，左、右声道信号分别为：

其中，s_j(n)表示某个时刻的直达声信号，

表示直达声信号分配给左右通道信号的系数，n_L(n)和n_R(n)表示左右通道的背景信号。

S1、经过短时傅里叶变换后(STFT)，得到

其中，m和k分别表示时间和频率。

S2、有两个假设：

S21、在某个时间m和某个频段k，只存在一个声源S_i，即

因此

S22、引入空间因子B，将背景声信号表达为一个信号经过房间内的不同传递路径而产生的信号，类似于直达声信号的表达方式，即N_L(m,k)＝B_L(m,k)N(m,k),N_R(m,k)＝B_R(m,k)N(m,k)

这样，上述公式可以简化为

X_L(m,k)＝A_L(m,k)S(m,k)+B_L(m,k)N(m,k)

X_R(m,k)＝A_R(m,k)S(m,k)+B_R(m,k)N(m,k)

左右声道信号之间的相关系数(如图3所示)定义为

S23、从能量角度可以得出左右通道的能量分别为：

S3、一般情况下，背景声能量小于直达声能量，并且

所以传统做法是忽略P_N(m,k)，即

在这里，假设空间因子的值为b_L＝b_R＝1，

没有忽略P_N(m,k)的贡献，这样就得到P_S(m,k)，P_N(m,k)，A_L(m,k)，A_R(m,k)的解析解。

于是，可以计算出S(m,k)，N(m,k)

再将空间因子B_L(m,k)和B_R(m,k)代入其中，可以得到N_L(m,k)，N_R(m,k)。

S4、最后经过逆傅里叶变换得到分别如图4a、4b、4c所示的直达声信号

背景声信号

和

该提取方法中，(1)通过定义左右声道信号之间的空间因子变量，以表征背景声信号在声传播过程中由于房间混响、空间大小等因素引起的左右通道之间的差异；(2)可以分离出左右通道的背景声信号，而传统方法只能分离出一个背景信号；(3)加入空间因子后的计算过程比较简单，可以得到直达声与背景声的解析解。

本实施例还提供一种扬声器系统的声重放方法，该扬声器系统包括多个扬声器，各扬声器分别布放在不同位置。该声重放方法是一种立体声转换多通道声信号的方法，具体包括：采用如上所述的直达声与背景声提取方法分离出直达声信号和背景声信号，根据立体声信号中声像的方位及所述扬声器系统的扬声器数量和位置，将直达声信号和背景声信号分配给扬声器系统的各个扬声器，从而完成声重放。

本实施例还提供一种扬声器系统，包括多个扬声器，所述扬声器系统还包括用于执行如上所述的直达声与背景声提取方法的提取装置。结合图1所示，该提取装置具体包括依次连接的STFT模块、能量估计模块、信号分离模块及ISTFT模块。其中，STFT模块的输入为左声道信号x_L(n)和右声道信号x_R(n)，进行短时傅里叶变换后输出对应左声道信号和右声道信号的X_L(m,k)和X_R(m,k)；能量估计模块接收STFT模块输出的X_L(m,k)和X_R(m,k)，并引入空间因子，将背景声信号表达为一个信号经过房间内的不同传递路径而产生的信号，并分别对X_L(m,k)和X_R(m,k)进行能量估计，得出左右声道的能量P_L(m,k)和P_R(m,k)以及A_L、A_R并输出至信号分离模块；信号分离模块还设定空间因子的值，进行信号分离得出

和

并输出至ISTFT模块；ISTFT模块分别进行逆傅里叶变换，输出直达声信号

左声道背景声信号

和右声道背景声信号

上述实施例只为说明本发明的技术构思及特点，是一种优选的实施例，其目的在于熟悉此项技术的人士能够了解本发明的内容并据以实施，并不能以此限定本发明的保护范围。