[go: up one dir, main page]

CN106067301A - 一种使用多维化技术进行回声降噪的方法 - Google Patents

一种使用多维化技术进行回声降噪的方法 Download PDF

Info

Publication number
CN106067301A
CN106067301A CN201610357764.5A CN201610357764A CN106067301A CN 106067301 A CN106067301 A CN 106067301A CN 201610357764 A CN201610357764 A CN 201610357764A CN 106067301 A CN106067301 A CN 106067301A
Authority
CN
China
Prior art keywords
sound
source
audio
data
multidimensional
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201610357764.5A
Other languages
English (en)
Other versions
CN106067301B (zh
Inventor
张家重
董毅
李光瑞
牛玉峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tide (suzhou) Financial Technology Service Co Ltd
Original Assignee
Tide (suzhou) Financial Technology Service Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tide (suzhou) Financial Technology Service Co Ltd filed Critical Tide (suzhou) Financial Technology Service Co Ltd
Priority to CN201610357764.5A priority Critical patent/CN106067301B/zh
Publication of CN106067301A publication Critical patent/CN106067301A/zh
Application granted granted Critical
Publication of CN106067301B publication Critical patent/CN106067301B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0264Noise filtering characterised by the type of parameter measurement, e.g. correlation techniques, zero crossing techniques or predictive techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)

Abstract

本发明公开了一种使用多维化技术进行回声降噪的方法,其实现过程为:根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;导出合成后的音频数据。该一种使用多维化技术进行回声降噪的方法与现有技术相比,整个降噪过程中并不需要对采集设备做特别的要求,因此相对于专业的向音频采集设备来,具有成本低、部署简便,以及对用户的专业水平要求较低等优势;实用性强,适用范围广泛,该技术可被广泛的应用于各种平台上的VoIP产品之中,对提升通话质量,提高服务品质都具有重要的作用,易于推广。

Description

一种使用多维化技术进行回声降噪的方法
技术领域
本发明涉及噪声处理技术领域,具体地说是一种实用性强、使用多维化技术进行回声降噪的方法。
背景技术
在传统的音频降噪技术中,通常都要通过程序算法来对比并剔除音频中的杂音数据,然而类似的方法都存在一个较为明显的缺陷,那就是对杂音的去除往往不彻底,又或是会降低会话音频的质量。
这主要是由音频降噪处理的基本原理所造成的,如附图1所示,由于传统音频文件的固有特性,并不能很好的分辨出声音的来源与发声者的音纹特征,只能通过同时采集并记录远端/本地发声者的音频数据来对采集的声音进行对比,从而在回传的音频数据中剔除远端发声者自己的音频数据,如此以来就可以让远端的发声者听不到自己说话的声音。但是在这样的一种过程中,由于实际环境的复杂性,时常会导致音频数据在处理上的不同步,从而使得视频数据的处理产生延迟,使得回传的音频信号带有一定程度的回声拖尾现象。而且,由于音频波形数据无法做到精确的分离,只能对波形进行简单的裁剪处理,这就使得音频数据的完整性造到了一定程度的破坏,从而不可避免的会造成声音的缺失或是通话质量的下降。
为解决上述存在的问题,以便更加精准的分离音频数据,并在通讯数据不做大幅增加的基础上尽可能的提升音频传输的质量,现根据多维化技术的相关几何原理,设计出了一种使用多维化技术对声波传导过程进行几何化模拟的方法。
发明内容
本发明的技术任务是针对以上不足之处,提供一种实用性强、使用多维化技术进行回声降噪的方法。
一种使用多维化技术进行回声降噪的方法,其实现过程为:
根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;
根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;
通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;
导出合成后的音频数据。
定向音源方向的具体过程为:
设置采集器位置,并制定主采集器,采集器用于接收音频数据;
监听并侦测不同采集器上所接收的音频数据;
对比相同频率音频信号在不同采集器上的时间间隔;
根据时间差和采集器方位设定,在数据空间中模拟定位音频源;
在数据空间中设定音源位置。
使用多维空间模拟技术找到并定位出可能存在的音源方位,具体为:当主发声源的位置为X,噪音源的位置为Y,主采集器的位置为O,辅助采集器的位置分别为A和B,同时音速为V时,通过对比主发音源到达主采集器0、辅助采集器A、B的时间X0、XA、XB,根据音波传播的物理规律,计算出主发音源X的大致方位,再结合音频传输时间的比例值,最终确定主发音源X在数据空间中的相对方位;采用相同方式,即可计算出噪音源Y的相对方位。
根据多维空间的几何特征来模拟声波的传导过程是指在数据空间中模拟音波信号的传递和叠加过程,其中音频信号在空间中的传播以相同速度向四周空间均匀传递,因此,其到达不同采集器的时间比例与其间距比例应当相同。
使用多维化技术处理延时传送的回声数据是指使用多维化技术控制不同音源中的音频传递时间差,即为不同的音源信号设定同步时间差,由于音源信号传递到每个采集器上的时间不同,以及回声在设备间传输延迟问题的存在,在消除回声的时候对不同音频源的时间维度做出调整,即对不同的音频源信号进行时间差矫正。
合成的音频信号中包括音频源信号、噪音信号,在不同的空间维度上记录不同音源的独立音频数据,即将不同频率或强度范围的音频数据存储在不同的数据空间之中。
与上述合成的音频信号相对应的,最后导出的音频数据为用户所指定频率或强度的音频数据,该数据同样为距离主采集器最近的音源数据。
本发明的一种使用多维化技术进行回声降噪的方法,具有以下优点:
该发明的一种使用多维化技术进行回声降噪的方法本方法是一种通过多维化几何特征识别技术来对音频通讯进行管理并编码的技术,经过多维化编码的音频数据既可以保持体积较小的优势,又能够相对完整的保留多声道音频信息,在进行回声降噪处理时便可以非常容易的找到并剔除那些无用数据,从而达到无损化降噪的目的;整个降噪过程中并不需要对采集设备做特别的要求,因此相对于专业的向音频采集设备来,具有成本低、部署简便,以及对用户的专业水平要求较低等优势;实用性强,适用范围广泛,该技术可被广泛的应用于各种平台上的VoIP产品之中,对提升通话质量,提高服务品质都具有重要的作用,易于推广。
附图说明
附图1为回声消除前波形图。
附图2为回声消除后波形图。
附图3为实施例中三个采集器的布局图。
附图4为实施例中主发声源、噪音源的相对空间方位图。
附图5为实施例中不同的空间维度上记录不同音源示意图。
具体实施方式
下面结合具体实施例对本发明作进一步说明。
本发明提供一种使用多维化技术进行回声降噪的方法,通过多维化几何特征识别技术来对音频通讯进行管理并编码的技术,经过多维化编码的音频数据既可以保持体积较小的优势,又能够相对完整的保留多声道音频信息,在进行回声降噪处理时便可以非常容易的找到并剔除那些无用数据,从而达到无损化降噪的目的。
该方法的实现过程为:
根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;
根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;
通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;
导出合成后的音频数据。
其具体实施步骤为:
步骤1:调用函数MDV_SetRecoder(),设置采集器位置,并制定主采集器。
步骤2:调用函数MDV_LisenVoice(),监听音频信号输入。
步骤3:调用函数MDV_VoiceCompare(),对比相同频率音频信号在不同采集器上的时间间隔。
步骤4:调用函数MDV_FindVoice(),根据时间差和采集器方位设定,在数据空间中模拟定位音频源(默认取最小值)。
步骤5:调用函数MDV_ResetVoice(),在数据空间中设定音源位置。
步骤6:调用函数MDV_TimeDimension(),为不同的音源信号设定同步时间差。
步骤7:调用函数MDV_RecordVoice(),在不同的数据空间中记录不同频率/强度范围的音频数据。
步骤8:调用函数MDV_OutputVoice(),输出指定频率/强度的音频数据。
本发明的实施例采用三个采集器,其中一个为主采集器,两个辅助采集器,根据上述步骤,本发明的具体实施过程为:
1)首先使用数据空间技术定位音频采集器的空间方位:
采集器数量应>=2,默认为3,典型的布局(在数据空间中需要根据实际布局的比例关系设置采集器的空间坐标)如附图3所示。
2)监听并侦测不同采集器上所接收到的音频数据。
计算不同音频采集器上所接收到的相同音频信号的时间间隔。
使用多维空间模拟技术找到并定位出可能存在的音源方位。
假设主发声源的位置为X,噪音源的位置为Y,主采集器的位置为O,辅助采集器的位置分别为A和B,同时设音速为V,则根据音波传播的物理规律,便可以通过计算音频信号到达每个采集器之间的时间间隔来估算定位音频源的相对空间方位,如附图4所示。
因为主发声源X的音频信号到达辅助采集器A和B的时间相同(XA和XB),而到达主采集器的时间最短(XO),便可以根据几何定律计算出主发声源X的大致方位应处于XO轴的延长线上,再结合音频传输时间的比例值,最终便可以确定主发声源X在数据空间中的相对方位。
同理,便可以计算出噪音源Y的方位。
3)在数据空间中模拟音波信号的传递和叠加过程。
参见附图4,音频信号在空间中的传播应是以相同速度向四周空间均匀传递,因此,其到达不同采集器的时间比例与其间距比例应当相同。
5)使用多维化技术控制不同音源中的音频传递时间差。
由于音源信号传递到每个采集器上的时间不同,以及回声在设备间传输延迟问题的存在,在消除回声的时候就需要对不同音频源的时间维度做出调整,因此,这就需要对不同的音频源信号进行时间差矫正。
比如,远端会话传递的音频数据,在本地接收之后还要经过一系列的处理后才会传递给音源设备播放,再经过声波的传递进入采集器接收,在这个过程中,将不可避免的产生时间上的延迟,如果回声降噪运算不进行时间矫正,将很容易在会话的尾部出现简短回音残留的问题。
6)在不同的空间维度上记录不同音源的独立音频数据。
如附图5所示,在空间中传递的噪音信号与音源信号都是以波状信号均匀分布的,但是由于每个音源发声的频率/强度都不同,可以将不同频率/强度范围的音频数据存储在不同的数据空间之中。
7)输出用户所指定的音源数据,默认为距离主采集器最近的音源数据。
本方法支持根据音源/音频频率等多种方式定向采集音频数据,因为不同的音频数据都存储在不同的数据空间之中,因此很容易对音频数据进行分离或整合。
经过上述处理后,最终产生的音频数据的信噪比将得到大幅改善,其实际降噪效果如附图2所示,甚至在硬件水平满足适当要求的前提下(如:音频采集设备的数量>=3,设备间距和角度都满足一定条件等),可以精准指定采集环境中任意一种音源中的数据,而在此过程中并不需要对采集设备做特别的要求,因此相对于专业的向音频采集设备来,具有成本低、部署简便,以及对用户的专业水平要求较低等优势。
上述具体实施方式仅是本发明的具体个案,本发明的专利保护范围包括但不限于上述具体实施方式,任何符合本发明的一种使用多维化技术进行回声降噪的方法的权利要求书的且任何所属技术领域的普通技术人员对其所做的适当变化或替换,皆应落入本发明的专利保护范围。

Claims (7)

1.一种使用多维化技术进行回声降噪的方法,其特征在于,其实现过程为:
根据音频采集设备的多少来定向音源方位,这里的音频采集设备是指至少两个采集器;
根据多维空间的几何特征来模拟声波的传导过程,使用多维化技术处理延时传送的回声数据;
通过几何特征来智能过滤杂波信号,精确控制音频信号的合成处理;
导出合成后的音频数据。
2.根据权利要求1所述的一种使用多维化技术进行回声降噪的方法,其特征在于,定向音源方向的具体过程为:
设置采集器位置,并制定主采集器,采集器用于接收音频数据;
监听并侦测不同采集器上所接收的音频数据;
对比相同频率音频信号在不同采集器上的时间间隔;
根据时间差和采集器方位设定,在数据空间中模拟定位音频源;
在数据空间中设定音源位置。
3.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法,其特征在于,使用多维空间模拟技术找到并定位出可能存在的音源方位,具体为:当主发声源的位置为X,噪音源的位置为Y,主采集器的位置为O,辅助采集器的位置分别为A和B,同时音速为V时,通过对比主发音源到达主采集器0、辅助采集器A、B的时间X0、XA、XB,根据音波传播的物理规律,计算出主发音源X的大致方位,再结合音频传输时间的比例值,最终确定主发音源X在数据空间中的相对方位;采用相同方式,即可计算出噪音源Y的相对方位。
4.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法,其特征在于,根据多维空间的几何特征来模拟声波的传导过程是指在数据空间中模拟音波信号的传递和叠加过程,其中音频信号在空间中的传播以相同速度向四周空间均匀传递,因此,其到达不同采集器的时间比例与其间距比例应当相同。
5.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法,其特征在于,使用多维化技术处理延时传送的回声数据是指使用多维化技术控制不同音源中的音频传递时间差,即为不同的音源信号设定同步时间差,由于音源信号传递到每个采集器上的时间不同,以及回声在设备间传输延迟问题的存在,在消除回声的时候对不同音频源的时间维度做出调整,即对不同的音频源信号进行时间差矫正。
6.根据权利要求2所述的一种使用多维化技术进行回声降噪的方法,其特征在于,合成的音频信号中包括音频源信号、噪音信号,在不同的空间维度上记录不同音源的独立音频数据,即将不同频率或强度范围的音频数据存储在不同的数据空间之中。
7.根据权利要求6所述的一种使用多维化技术进行回声降噪的方法,其特征在于,与上述合成的音频信号相对应的,最后导出的音频数据为用户所指定频率或强度的音频数据,该数据同样为距离主采集器最近的音源数据。
CN201610357764.5A 2016-05-26 2016-05-26 一种使用多维化技术进行回声降噪的方法 Active CN106067301B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201610357764.5A CN106067301B (zh) 2016-05-26 2016-05-26 一种使用多维化技术进行回声降噪的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201610357764.5A CN106067301B (zh) 2016-05-26 2016-05-26 一种使用多维化技术进行回声降噪的方法

Publications (2)

Publication Number Publication Date
CN106067301A true CN106067301A (zh) 2016-11-02
CN106067301B CN106067301B (zh) 2019-06-25

Family

ID=57421416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610357764.5A Active CN106067301B (zh) 2016-05-26 2016-05-26 一种使用多维化技术进行回声降噪的方法

Country Status (1)

Country Link
CN (1) CN106067301B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1645971A (zh) * 2004-01-19 2005-07-27 宏碁股份有限公司 结合定位技术的麦克风阵列收音方法及其系统
CN1830026A (zh) * 2001-01-30 2006-09-06 汤姆森特许公司 几何源分离的几何信号处理技术
CN1953060A (zh) * 2006-11-24 2007-04-25 北京中星微电子有限公司 一种麦克风回声消除装置及回声消除方法
CN101132839A (zh) * 2005-05-05 2008-02-27 索尼计算机娱乐公司 结合计算机交互处理的选择性声源监听
CN101398475A (zh) * 2007-09-27 2009-04-01 索尼株式会社 声源方向检测装置和方法以及声源方向检测相机
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN201417603Y (zh) * 2009-06-23 2010-03-03 深圳市奥尼电子工业有限公司 一种双麦克风语音处理装置
CN102111697A (zh) * 2009-12-28 2011-06-29 歌尔声学股份有限公司 一种麦克风阵列降噪控制方法及装置
CN103119461A (zh) * 2011-09-20 2013-05-22 丰田自动车株式会社 声源检测装置
CN103219012A (zh) * 2013-04-23 2013-07-24 中国人民解放军总后勤部军需装备研究所 一种基于声源距离的双麦克风噪声消除方法及装置

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1830026A (zh) * 2001-01-30 2006-09-06 汤姆森特许公司 几何源分离的几何信号处理技术
CN1645971A (zh) * 2004-01-19 2005-07-27 宏碁股份有限公司 结合定位技术的麦克风阵列收音方法及其系统
CN101132839A (zh) * 2005-05-05 2008-02-27 索尼计算机娱乐公司 结合计算机交互处理的选择性声源监听
CN1953060A (zh) * 2006-11-24 2007-04-25 北京中星微电子有限公司 一种麦克风回声消除装置及回声消除方法
CN101398475A (zh) * 2007-09-27 2009-04-01 索尼株式会社 声源方向检测装置和方法以及声源方向检测相机
CN101510426A (zh) * 2009-03-23 2009-08-19 北京中星微电子有限公司 一种噪声消除方法及系统
CN201417603Y (zh) * 2009-06-23 2010-03-03 深圳市奥尼电子工业有限公司 一种双麦克风语音处理装置
CN102111697A (zh) * 2009-12-28 2011-06-29 歌尔声学股份有限公司 一种麦克风阵列降噪控制方法及装置
CN103119461A (zh) * 2011-09-20 2013-05-22 丰田自动车株式会社 声源检测装置
CN103219012A (zh) * 2013-04-23 2013-07-24 中国人民解放军总后勤部军需装备研究所 一种基于声源距离的双麦克风噪声消除方法及装置

Also Published As

Publication number Publication date
CN106067301B (zh) 2019-06-25

Similar Documents

Publication Publication Date Title
Batteau The role of the pinna in human localization
CN104869524B (zh) 三维虚拟场景中的声音处理方法及装置
Gerhardt et al. Call matching in the quacking frog (Crinia georgiana)
EP4408022A3 (en) Methods and apparatus to adjust audio playback settings based on analysis of audio characteristics
US7957224B2 (en) Human echolocation system
CN106448722A (zh) 录音方法、装置和系统
DE69943265D1 (de) Verfahren und Vorrichtung zur Verarbeitung von Audiosignalen
CN203747885U (zh) 能够检测双端通话的声信号处理系统
CN109121057A (zh) 一种智能助听的方法及其系统
WO2008015449A3 (en) Apparatus and method for obtaining eeg data
US11115775B2 (en) Method and apparatus for acoustic crosstalk cancellation
EP1538868A3 (en) Audio amplification apparatus
CN101783656A (zh) 一种音响响度控制方法、模块和装置
CN105245355A (zh) 智能语音速记会议系统
CN109104683A (zh) 一种双麦克风相位测量校正的方法及校正系统
CN109874096A (zh) 一种基于智能终端选择输出的双耳麦克风助听器降噪算法
CN106254998A (zh) 包括用于掩蔽耳鸣的信号发生器的听力装置
CN108124221B (zh) 触觉低音响应
CN103873978B (zh) 信息处理的方法及电子设备
CN103680513B (zh) 语音信号处理方法、装置及服务器
CN108257617A (zh) 一种噪声场景识别系统及方法
DE112015003512B4 (de) Erfassungstechnik mit zwei Durchläufen für Impulsabstandsmessungen ohne Echos
CN106067301A (zh) 一种使用多维化技术进行回声降噪的方法
CN110225432A (zh) 一种声纳目标立体收听方法
DE102014200434A1 (de) Verfahren zum Abgleich eines Ortungssystems, Verfahren zum Orten eines Objekts und Ortungssystem

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: Wusong Industrial Park, Wuzhong Development District of Suzhou City, Jiangsu province 215100 Wusong Road No. 818

Applicant after: Tide Financial Information Technology Co Ltd

Address before: Wuzhong Economic Development Zone in Suzhou City, Jiangsu Province, the River Street 215104 tower rhyme Road No. 178 Building 2 layer 1

Applicant before: Tide (Suzhou) Financial Technology Service Co., Ltd.

GR01 Patent grant
GR01 Patent grant