CN106067301A

CN106067301A - 一种使用多维化技术进行回声降噪的方法

Info

Publication number: CN106067301A
Application number: CN201610357764.5A
Authority: CN
Inventors: 张家重; 董毅; 李光瑞; 牛玉峰
Original assignee: Tide (suzhou) Financial Technology Service Co Ltd
Current assignee: Tide (suzhou) Financial Technology Service Co Ltd
Priority date: 2016-05-26
Filing date: 2016-05-26
Publication date: 2016-11-02
Anticipated expiration: 2036-05-26
Also published as: CN106067301B

Abstract

本发明公开了一种使用多维化技术进行回声降噪的方法，其实现过程为：根据音频采集设备的多少来定向音源方位，这里的音频采集设备是指至少两个采集器；根据多维空间的几何特征来模拟声波的传导过程，使用多维化技术处理延时传送的回声数据；通过几何特征来智能过滤杂波信号，精确控制音频信号的合成处理；导出合成后的音频数据。该一种使用多维化技术进行回声降噪的方法与现有技术相比，整个降噪过程中并不需要对采集设备做特别的要求，因此相对于专业的向音频采集设备来，具有成本低、部署简便，以及对用户的专业水平要求较低等优势；实用性强，适用范围广泛，该技术可被广泛的应用于各种平台上的VoIP产品之中，对提升通话质量，提高服务品质都具有重要的作用，易于推广。

Description

一种使用多维化技术进行回声降噪的方法

技术领域

本发明涉及噪声处理技术领域，具体地说是一种实用性强、使用多维化技术进行回声降噪的方法。

背景技术

在传统的音频降噪技术中，通常都要通过程序算法来对比并剔除音频中的杂音数据，然而类似的方法都存在一个较为明显的缺陷，那就是对杂音的去除往往不彻底，又或是会降低会话音频的质量。

这主要是由音频降噪处理的基本原理所造成的，如附图1所示，由于传统音频文件的固有特性，并不能很好的分辨出声音的来源与发声者的音纹特征，只能通过同时采集并记录远端/本地发声者的音频数据来对采集的声音进行对比，从而在回传的音频数据中剔除远端发声者自己的音频数据，如此以来就可以让远端的发声者听不到自己说话的声音。但是在这样的一种过程中，由于实际环境的复杂性，时常会导致音频数据在处理上的不同步，从而使得视频数据的处理产生延迟，使得回传的音频信号带有一定程度的回声拖尾现象。而且，由于音频波形数据无法做到精确的分离，只能对波形进行简单的裁剪处理，这就使得音频数据的完整性造到了一定程度的破坏，从而不可避免的会造成声音的缺失或是通话质量的下降。

为解决上述存在的问题，以便更加精准的分离音频数据，并在通讯数据不做大幅增加的基础上尽可能的提升音频传输的质量，现根据多维化技术的相关几何原理，设计出了一种使用多维化技术对声波传导过程进行几何化模拟的方法。

发明内容

本发明的技术任务是针对以上不足之处，提供一种实用性强、使用多维化技术进行回声降噪的方法。

一种使用多维化技术进行回声降噪的方法，其实现过程为：

根据音频采集设备的多少来定向音源方位，这里的音频采集设备是指至少两个采集器；

根据多维空间的几何特征来模拟声波的传导过程，使用多维化技术处理延时传送的回声数据；

通过几何特征来智能过滤杂波信号，精确控制音频信号的合成处理；

导出合成后的音频数据。

定向音源方向的具体过程为：

设置采集器位置，并制定主采集器，采集器用于接收音频数据；

监听并侦测不同采集器上所接收的音频数据；

对比相同频率音频信号在不同采集器上的时间间隔；

根据时间差和采集器方位设定，在数据空间中模拟定位音频源；

在数据空间中设定音源位置。

使用多维空间模拟技术找到并定位出可能存在的音源方位，具体为：当主发声源的位置为X，噪音源的位置为Y，主采集器的位置为O，辅助采集器的位置分别为A和B，同时音速为V时，通过对比主发音源到达主采集器0、辅助采集器A、B的时间X0、XA、XB，根据音波传播的物理规律，计算出主发音源X的大致方位，再结合音频传输时间的比例值，最终确定主发音源X在数据空间中的相对方位；采用相同方式，即可计算出噪音源Y的相对方位。

根据多维空间的几何特征来模拟声波的传导过程是指在数据空间中模拟音波信号的传递和叠加过程，其中音频信号在空间中的传播以相同速度向四周空间均匀传递，因此，其到达不同采集器的时间比例与其间距比例应当相同。

使用多维化技术处理延时传送的回声数据是指使用多维化技术控制不同音源中的音频传递时间差，即为不同的音源信号设定同步时间差，由于音源信号传递到每个采集器上的时间不同，以及回声在设备间传输延迟问题的存在，在消除回声的时候对不同音频源的时间维度做出调整，即对不同的音频源信号进行时间差矫正。

合成的音频信号中包括音频源信号、噪音信号，在不同的空间维度上记录不同音源的独立音频数据，即将不同频率或强度范围的音频数据存储在不同的数据空间之中。

与上述合成的音频信号相对应的，最后导出的音频数据为用户所指定频率或强度的音频数据，该数据同样为距离主采集器最近的音源数据。

本发明的一种使用多维化技术进行回声降噪的方法，具有以下优点：

该发明的一种使用多维化技术进行回声降噪的方法本方法是一种通过多维化几何特征识别技术来对音频通讯进行管理并编码的技术，经过多维化编码的音频数据既可以保持体积较小的优势，又能够相对完整的保留多声道音频信息，在进行回声降噪处理时便可以非常容易的找到并剔除那些无用数据，从而达到无损化降噪的目的；整个降噪过程中并不需要对采集设备做特别的要求，因此相对于专业的向音频采集设备来，具有成本低、部署简便，以及对用户的专业水平要求较低等优势；实用性强，适用范围广泛，该技术可被广泛的应用于各种平台上的VoIP产品之中，对提升通话质量，提高服务品质都具有重要的作用，易于推广。

附图说明

附图1为回声消除前波形图。

附图2为回声消除后波形图。

附图3为实施例中三个采集器的布局图。

附图4为实施例中主发声源、噪音源的相对空间方位图。

附图5为实施例中不同的空间维度上记录不同音源示意图。

具体实施方式

下面结合具体实施例对本发明作进一步说明。

本发明提供一种使用多维化技术进行回声降噪的方法，通过多维化几何特征识别技术来对音频通讯进行管理并编码的技术，经过多维化编码的音频数据既可以保持体积较小的优势，又能够相对完整的保留多声道音频信息，在进行回声降噪处理时便可以非常容易的找到并剔除那些无用数据，从而达到无损化降噪的目的。

该方法的实现过程为：

导出合成后的音频数据。

其具体实施步骤为：

步骤1：调用函数MDV_SetRecoder()，设置采集器位置，并制定主采集器。

步骤2：调用函数MDV_LisenVoice()，监听音频信号输入。

步骤3：调用函数MDV_VoiceCompare()，对比相同频率音频信号在不同采集器上的时间间隔。

步骤4：调用函数MDV_FindVoice()，根据时间差和采集器方位设定，在数据空间中模拟定位音频源(默认取最小值)。

步骤5：调用函数MDV_ResetVoice()，在数据空间中设定音源位置。

步骤6：调用函数MDV_TimeDimension()，为不同的音源信号设定同步时间差。

步骤7：调用函数MDV_RecordVoice()，在不同的数据空间中记录不同频率/强度范围的音频数据。

步骤8：调用函数MDV_OutputVoice()，输出指定频率/强度的音频数据。

本发明的实施例采用三个采集器，其中一个为主采集器，两个辅助采集器，根据上述步骤，本发明的具体实施过程为：

1）首先使用数据空间技术定位音频采集器的空间方位：

采集器数量应>=2，默认为3，典型的布局(在数据空间中需要根据实际布局的比例关系设置采集器的空间坐标)如附图3所示。

2）监听并侦测不同采集器上所接收到的音频数据。

计算不同音频采集器上所接收到的相同音频信号的时间间隔。

使用多维空间模拟技术找到并定位出可能存在的音源方位。

假设主发声源的位置为X，噪音源的位置为Y，主采集器的位置为O，辅助采集器的位置分别为A和B，同时设音速为V，则根据音波传播的物理规律，便可以通过计算音频信号到达每个采集器之间的时间间隔来估算定位音频源的相对空间方位，如附图4所示。

因为主发声源X的音频信号到达辅助采集器A和B的时间相同（XA和XB），而到达主采集器的时间最短（XO），便可以根据几何定律计算出主发声源X的大致方位应处于XO轴的延长线上，再结合音频传输时间的比例值，最终便可以确定主发声源X在数据空间中的相对方位。

同理，便可以计算出噪音源Y的方位。

3）在数据空间中模拟音波信号的传递和叠加过程。

参见附图4，音频信号在空间中的传播应是以相同速度向四周空间均匀传递，因此，其到达不同采集器的时间比例与其间距比例应当相同。

5）使用多维化技术控制不同音源中的音频传递时间差。

由于音源信号传递到每个采集器上的时间不同，以及回声在设备间传输延迟问题的存在，在消除回声的时候就需要对不同音频源的时间维度做出调整，因此，这就需要对不同的音频源信号进行时间差矫正。

比如，远端会话传递的音频数据，在本地接收之后还要经过一系列的处理后才会传递给音源设备播放，再经过声波的传递进入采集器接收，在这个过程中，将不可避免的产生时间上的延迟，如果回声降噪运算不进行时间矫正，将很容易在会话的尾部出现简短回音残留的问题。

6）在不同的空间维度上记录不同音源的独立音频数据。

如附图5所示，在空间中传递的噪音信号与音源信号都是以波状信号均匀分布的，但是由于每个音源发声的频率/强度都不同，可以将不同频率/强度范围的音频数据存储在不同的数据空间之中。

7）输出用户所指定的音源数据，默认为距离主采集器最近的音源数据。

本方法支持根据音源/音频频率等多种方式定向采集音频数据，因为不同的音频数据都存储在不同的数据空间之中，因此很容易对音频数据进行分离或整合。

经过上述处理后，最终产生的音频数据的信噪比将得到大幅改善，其实际降噪效果如附图2所示，甚至在硬件水平满足适当要求的前提下（如：音频采集设备的数量>=3，设备间距和角度都满足一定条件等），可以精准指定采集环境中任意一种音源中的数据，而在此过程中并不需要对采集设备做特别的要求，因此相对于专业的向音频采集设备来，具有成本低、部署简便，以及对用户的专业水平要求较低等优势。

上述具体实施方式仅是本发明的具体个案，本发明的专利保护范围包括但不限于上述具体实施方式，任何符合本发明的一种使用多维化技术进行回声降噪的方法的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换，皆应落入本发明的专利保护范围。

Claims

1.一种使用多维化技术进行回声降噪的方法，其特征在于，其实现过程为：

导出合成后的音频数据。

2.根据权利要求1所述的一种使用多维化技术进行回声降噪的方法，其特征在于，定向音源方向的具体过程为：

监听并侦测不同采集器上所接收的音频数据；

对比相同频率音频信号在不同采集器上的时间间隔；

在数据空间中设定音源位置。

3.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法，其特征在于，使用多维空间模拟技术找到并定位出可能存在的音源方位，具体为：当主发声源的位置为X，噪音源的位置为Y，主采集器的位置为O，辅助采集器的位置分别为A和B，同时音速为V时，通过对比主发音源到达主采集器0、辅助采集器A、B的时间X0、XA、XB，根据音波传播的物理规律，计算出主发音源X的大致方位，再结合音频传输时间的比例值，最终确定主发音源X在数据空间中的相对方位；采用相同方式，即可计算出噪音源Y的相对方位。

4.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法，其特征在于，根据多维空间的几何特征来模拟声波的传导过程是指在数据空间中模拟音波信号的传递和叠加过程，其中音频信号在空间中的传播以相同速度向四周空间均匀传递，因此，其到达不同采集器的时间比例与其间距比例应当相同。

5.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法，其特征在于，使用多维化技术处理延时传送的回声数据是指使用多维化技术控制不同音源中的音频传递时间差，即为不同的音源信号设定同步时间差，由于音源信号传递到每个采集器上的时间不同，以及回声在设备间传输延迟问题的存在，在消除回声的时候对不同音频源的时间维度做出调整，即对不同的音频源信号进行时间差矫正。

6.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法，其特征在于，合成的音频信号中包括音频源信号、噪音信号，在不同的空间维度上记录不同音源的独立音频数据，即将不同频率或强度范围的音频数据存储在不同的数据空间之中。

7.根据权利要求6所述的一种使用多维化技术进行回声降噪的方法，其特征在于，与上述合成的音频信号相对应的，最后导出的音频数据为用户所指定频率或强度的音频数据，该数据同样为距离主采集器最近的音源数据。