[go: up one dir, main page]

CN1952684A - 利用麦克风定位声源的方法和装置 - Google Patents

利用麦克风定位声源的方法和装置 Download PDF

Info

Publication number
CN1952684A
CN1952684A CN200510116434.9A CN200510116434A CN1952684A CN 1952684 A CN1952684 A CN 1952684A CN 200510116434 A CN200510116434 A CN 200510116434A CN 1952684 A CN1952684 A CN 1952684A
Authority
CN
China
Prior art keywords
sound source
sound
time difference
estimating
microphones
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200510116434.9A
Other languages
English (en)
Inventor
崔玮玮
魏建强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to CN200510116434.9A priority Critical patent/CN1952684A/zh
Publication of CN1952684A publication Critical patent/CN1952684A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)

Abstract

一种定位声源位置的方法,包括步骤:由接收装置接收声源发出的声音信号;估算所述声音信号到达所述接收装置的时间差;估算所述接收装置分别接收的所述声音信号的能量比;根据估算的所述时间差和所述能量比确定所述声源的位置。本发明双麦克声源定位方法类似于人的双耳定位机制,同时利用了声音的能量和时延信息来进行定位,从而达到减小阵元数目的目的,并且不需要发射和接收特殊类型的参考信号。

Description

利用麦克风定位声源的方法和装置
技术领域
本发明涉及一种利用麦克风对声源进行定位的方法和装置。特别是,适合于在内部空间较小的设备中使用的、利用两个麦克风对声源进行定位的方法和装置。
背景技术
利用麦克风对声源进行定位是采用麦克风阵列对发出声音的声源位置进行定位。所谓麦克风阵列是指由多个麦克风按照不同的空间位置摆放,共同组成某一特定的接收系统的装置。
利用麦克风阵列的定位技术在我们当前社会中有着广泛的应用。例如在视频会议中,声源定位被用于检测说话人的位置,并自动聚焦摄像头。在助听器中的麦克风阵列被用作语音增强的预处理系统,它通过检测声源的位置信息,将阵列指向感兴趣的声源方向,从而抑制掉其它方向的干扰和噪声。基于阵列定位技术的数字笔可以用于取代鼠标作为新的无线输入设备。
目前利用麦克风阵列的定位技术主要是根据声音从声源到达麦克风阵列中的每个麦克风的时间差通过估计值来定位声源的位置。
现有的声源定位方法根据其实现方式不同大致可分为以下两类:单步和双步定位算法。单步定位方法又分为基于波束指向(Steered-Beamformer)的定位方法和基于高分辩率谱分析(High-Resolution Spectral Analysis)的定位方法。在前一种方法中,对各麦克风阵元采集到的信号在时间上进行移位。这种时间移位的目的是补偿声源到不同麦克风阵元之间的时间差τij。对补偿以后的信号再进行相加,求平均等操作得到阵列滤波输出。此时,在各路麦克风阵元信号中,与目标说话人对应的信号成分是同相相加,而来自其它方位上声源的信号成分在相加时则存在一定的相位差。这种相位差导致了阵列输出信号中这些方位上的声源信号的衰减,从而可以依据阵列的最大输出方向为声源的方向。
基于高分辩率谱分析主要涉及了自回归模型(AutoRegressive,AR)、最小方差谱估计(Minimum Variance,MV)和各种基于特征分析技术的方法。例如,主要用于音乐的多信号分类方法。对于这些方法,或者受模型假设的影响不能处理混响和方向性的噪声,或者计算复杂度太高,很少用于实际的定位系统中。
双步定位算法是目前应用最广泛的一种定位算法。其中利用音频信号到达麦克风阵列中的每个麦克风的时间差(Time Delay Of Arrival,TDOA)来进行定位的方法得到了特别地关注。该方法首先估计声源到达空间分离的多个麦克风对的TDOA值,然后根据几何关系,利用估计值定位出声源位置。
美国专利申请公开US20040100868 A1公开了一种识别和定位声音事件的系统和方法。该专利公开揭示的声定位系统需要多个阵元组成传感器网络来进行定位。通过传感器内嵌的同步时钟来确定信号传播的绝对时间。每个传感器需要包含GPS模块用于同步。这种定位方法估计出的位置精度高度依赖于同步时钟的精度。在获得传播时间后,该系统运用三角定位法进行定位。该专利申请公开主要涉及针对枪击事件,其系统中仅保存了几种特殊类型的信号,也就是说它只能识别和定位出有限种类的声源。
WO/2003/044516公开了一种用于声检测和缺陷定位的设备和方法。WO/2003/044516的公开中给出了一种新的双步定位方法,即,基于双耳电平差(Interaural Level Difference,ILD)的定位算法。该方法首先估计两个麦克风所接收到的信号的能量比。我们知道,声音在传播过程中,信号能量的衰减服从逆平方定律。因此,当信号到达麦克风阵列中的各个麦克风的传播距离不同时,其接收到的能量也会有差别。于是,可以借助这一信息来确定声源位置。
在WO/2003/044516的定位设备中,两个传感器被固定在一个可沿中心轴旋转的支架上。此时,它们接受到的信号经放大后进行相乘,产生输出。当声源恰好位于支架的中垂线上时,信号同时到达两个麦克风,在时间上严格对齐的信号将产生最大的输出。然而这一定位方法存在下列问题。它仅能够确定出声源的方位而不是位置信息。另外,它以输出信号最大作为指示来判断声源的方位,并没有考虑到反射和方向性干扰噪声的影响,一旦反射或者方向性的干扰噪声超过了主信号分量,它就不能正确的判断出声源的位置。此外,这种通过在整个空间搜索来确定声源方向的方法不但计算复杂度太高,而且不能够跟踪运动的声源。
美国专利申请公开US20010031053 A1公开了一种双耳信号处理技术。其中公开的定位系统通过波束形成技术来实现声源定位。它根据信号的传播距离对各通道信号进行加权,然后判断输出最大的方向为估计方向。与上一方法类似,它也只能确定声源的方位信息,不能给出精确的位置。
题为“使用超声波跟踪的数字笔”的美国专利US6703570 B1公开了一种基于两个传感器的定位技术。它同时发射超声波和红外线两种信号,并将红外线作为基准信号。该公开假定光的传播可以忽略不计,所以超声波与红外线的传播时间差即为超声波传播的绝对时间,然后利用三角定位的方法进行定位。然而,这种方法一方面需要附加的红外发射和接受装置,大大增加了设备的成本;另一方面,该定位系统对光线的强弱非常敏感,当日光灯的亮度超过一定限度时,它就不能使用。
综上所述,对于现有技术的定位方法,要确定一个二维平面内的点,一般都至少需要三个麦克风,或者是需要发射和接收特殊类型的参考信号的设备。这类声源定位方式的使用在体积有限的设备中受到了限制。
发明内容
本发明的目的是提供一种基于双麦克风的声源定位方法和装置,同时利用麦克风接收到的信号的时延和能量信息进行定位,能够有效地将麦克风阵列的阵元数量降为两个。本发明的方法和装置对于体积受到限制的语音通信设备非常有效。
根据本发明的一个方面,提供1.一种定位声源位置的方法,包括步骤:由接收装置接收声源发出的声音信号;估算所述声音信号到达所述接收装置的时间差;估算所述接收装置分别接收的所述声音信号的能量比;根据估算的所述时间差和所述能量比确定所述声源的位置。
根据本发明的另一个方面,提供一种利用两个麦克风定位声源位置的方法,包括步骤:两个麦克风分别接收声源发出的声音信号;估算所述声音信号到达所述两个麦克风的时间差;估算所述两个麦克风分别接收的所述声音信号的能量比;根据估算的所述时间差和所述能量比确定所述声源的位置。
根据本发明的再一个方面,提供一种定位声源位置的装置,包括:接收装置,用于接收声源发出的声音信号;到达时间差估算装置,用于估算所述声音信号到达所述接收装置的时间差;双耳电平差估算装置,用于估算所述接收装置分别接收的所述声音信号的能量比;和定位计算装置,用于根据估算的所述时间差和所述能量比确定所述声源的位置。
根据本发明的再一个方面,提供一种利用两个麦克风定位声源位置的装置,包括:接收装置,用于接收声源发出的声音信号;到达时间差估算装置,用于估算所述声音信号到达所述两个麦克风的时间差;双耳电平差估算装置,用于估算所述两个麦克风分别接收的所述声音信号的能量比;和定位计算装置,用于根据估算的所述时间差和所述能量比确定所述声源的位置。
根据本发明双麦克声源定位方法和装置,类似于人的双耳定位机制,同时利用了声音的能量和时延信息来进行定位,从而达到减小阵元数目的目的。另一方面,本发明的声源定位方法不同于现有的三角定位方法,它不需要发射和接收特殊类型的参考信号。
附图说明
图1是根据本发明由两个麦克风组成的阵列接收信号的示意图;
图2是表示声源到达各麦克风距离的示意图;
图3是时间差估算的广义互相关(GCC)方法的流程图;
图4是表示信号传播到达两个麦克风的距离差的示意图;
图5利用双曲线定位方法确定声源轨迹的示意图;
图6是表示利用两个圆确定声源的位置的示意图;
图7示出声音到达两个麦克风的能量相等的情况的示意图;
图8是根据本发明实施例利用两个麦克风组成的阵列定位声源的装置的结构示意图;
图9是根据本发明实施例对声音信号进行处理以得到声源坐标位置的流程图;
图10示出了根据本发明的定位进行仿真的环境的示意图;
图11示出了声源方向角定义的示意图;
图12(a)至(c)是声源位于阵列不同方向时的仿真结果的示意图,其中反射系数从0.1变到0.9。
具体实施方式
以下参考附图说明具体描述实施本发明的优选模式的实施例。在描述过程中省略了对于本发明来说是不必要的细节和功能,以防止对本发明的理解造成混淆。
图1是根据本发明由两个麦克风组成的阵列接收信号的示意图。首先,参考图1说明由两个麦克风组成的阵列接收声音信号的示意图。图1中以人作为发声的声源为例进行说明。应该理解,可以是诸如音响设备之类的其它发出的声音。人发出的声音信号通过麦克风1和麦克风2转换成电信号。到达麦克风1的声音信号可以用x1(t)表示,到达麦克风2的声音信号可以用x2(t)表示。对于两个麦克风组成的阵列,其接收声源信号的信号模型可以由下面的公式(1)表示。
xi(t)=s(t-τ)/di+ni(t);i=1,2    (1)
其中s(t)为源信号,ni(t)为加性白噪声。di和τi分别为从声源到达第I个麦克风的距离和时延,在(1)式中我们考虑了信号传播的逆平方定律,所谓逆平方律是指声音在传播过程中能量的衰减与所传播的距离的平方成反比。
由于ILD方法主要关心信号的能量,从而可以忽略其时延信息。如果假定语音信号存在于[0,W]时间段内,并且是平稳的。从而对于第i个麦克风所接收到的信号能量就是这段时间内的统计和。因此,可以将麦克风接收的那里表示为公式(2)所示。
E i = ∫ 0 W x i 2 ( t ) dt = 1 d i 2 ∫ 0 W s 2 ( t ) dt + ∫ 0 W n i 2 ( t ) dt ; i = 1 , 2 - - - ( 2 )
从上面的公式,可以得到能量和距离的关系如下面的公式(3)所示。
E 1 d 1 2 = E 2 d 2 2 + η - - - ( 3 )
其中 η = ∫ 0 W [ d 1 2 n 1 2 ( t ) - d 2 2 n 2 2 ( t ) ] dt 是一个具有零均值的误差项。如果我们假定(xi,yi)为第i个,麦克风的位置坐标,(xs,ys)为声源的位置坐标,则声源到第i个麦克风的距离可以用公式(4)表示。
d i = ( x i - x s ) 2 + ( y i - y s ) 2 - - - ( 4 )
图2示出了声源到达各麦克风距离的示意图。
将公式(4)带入(3)中,在不考虑噪声影响的条件下,我们可以得到
E 1 [ ( x 1 - x s ) 2 + ( y 1 - y s ) 2 ] = E 2 [ ( x 1 - x s ) 2 + ( y 1 - y s ) 2 ] - - - ( 5 )
另一方面,基于TDOA的定位器,其定位是通过估计两个麦克风处的到达时间差(TDOA)来确定的。在此可以忽略了路径衰减的影响。
图3时出了用于时间差估算的广义互相关(GCC)方法的流程图。如图3所示,首先,在步骤S301,对各个麦克风接收的声音信号x1(t)和x2(t)进行傅立叶变换得到X1(ω)和X2(ω)。在步骤S302,计算各麦克风得到声音信号的互功率谱。然后,在步骤S303,计算广义呼吸关函数,此后,在步骤S304通过检测R12(τ)的最大值来估计到达时间差。
一旦信号的时延估计出来以后,就可以利用双曲线定位方法利用下面的公式(3)来进行定位
( x 1 - x s ) 2 + ( y 1 - y s ) 2 - ( x 2 - x s ) 2 + ( y 2 - y s ) 2 = c τ 12 - - - ( 6 )
其中τ12=τ12为两麦克的时延差,c为声速,常温下近似等于340m/s。具体的cτ12可以用图4来表示。
由于到达两个定点的距离差为定值的点的轨迹为双曲线,所以利用双曲线定位方法的求解可以用图5来说明。
通过对公式(5)的进行变换可以得到如下的公式(7)。
( x 1 - x s ) 2 + ( y 1 - y s ) 2 = 1 γ ( x 2 - x s ) 2 + ( y 2 - y s ) 2 - - - ( 7 )
其中定义 γ = E 1 / E 2 ,并将(7)式带入(6),通过化简可变公式(8)。
( x s - x 1 ) 2 + ( y s - y 1 ) 2 = ( c τ 12 1 - γ ) 2 - - - ( 8 )
同理,可以得到另外一个公式(9)
( x s - x 2 ) 2 + ( y s - y 2 ) 2 = ( c τ 12 γ 1 - γ ) 2 - - - ( 9 )
通过求解方程组(8)和(9)就可以得到声源的位置坐标。通过公式(8)和(9)可以看出,两个公式中共有4个未知数,利用两个方程无法求出每个未知数的确定解。实际上,公式(8)和(9)两式确定了以(x1,y1)和(x2,y2)为圆心,cτ12/(1-γ)和cτ12γ/(1-γ)为半径的两个圆,两者的交点就是声源的位置,如图6所示。
根据如图6所示的两个圆的位置关系,可以确定出交点存在公式(10)表示的必要条件:
( c τ 12 1 - γ ) | 1 - γ | = | d 1 - d 2 | ≤ d ≤ ( d 1 + d 2 ) = ( c τ 12 1 - γ ) ( 1 + γ ) - - - ( 10 )
其中d为两麦克风的距离。如果τ12<0,也就是说,声源到达第1个麦克风要早于第2个麦克风,此时γ>1,所以,τ12和(1-γ)同时为正或者为负。如果我们进一步假定E1≠E1,则(10)可以写为公式(11)。
c | τ 12 | ≤ d ≤ c | τ 12 | 1 + γ | 1 - γ | - - - ( 11 )
由于声源到达两个麦克风的距离差最大不会超过两个麦克风之间的距离,且考虑到三角形三边关系,则有0<c|τ12|≤d和 d ≤ d 1 + d 2 = c | τ 12 | 1 + γ | 1 - γ | ,所以方程(11)是自动满足的。然而,如果E1=E2,由方程(5)和(6)所确定的圆和双曲线都将退化为一条直线,也就是麦克风对的垂直平分线。在这种情况下,声源的位置就无法确定,只能检测到声源的方向信息。如图9所示。
接下来,可以推导它的闭合解。对于公式(8)和(9)组成的方程组,可以得出下面的方程组(12)
( x s - x 1 ) 2 + ( y s - y 1 ) 2 = ( c τ 12 · 1 1 - γ ) 2 = r 1 2
( x s - x 2 ) 2 + ( y s - y 2 ) 2 = ( c τ 12 · γ 1 - γ ) 2 = r 2 2 - - - ( 12 )
经过适当的变形可以得到公式(13)。
x i x s + y i y s = 1 2 ( K i - r i 2 + R s 2 ) ; i = 1,2 - - - ( 13 )
其中可以令 K i = x i 2 + y i 2 ( i = 1,2 ) ,并设表达式(14)。
R s = x s 2 + y s 2 - - - ( 14 )
将方程(13)表示为矩阵形式可得公式(15)
x 1 y 1 x 2 y 2 × x s y s = 1 2 { R s 2 1 1 + K 1 - r 1 2 K 2 - r 2 2 } - - - ( 15 )
变形后得到公式(16)。
x s y s = x 1 y 1 x 2 y 2 - 1 × 1 2 { R s 2 1 1 + K 1 - r 1 2 K 2 - r 2 2 } - - - ( 16 )
为了简化期间,可以定义下面的公式(17)和(18)。
a = a 1 a 2 = 1 2 x 1 y 1 x 2 y 2 - 1 1 1 - - - ( 17 )
b = b 1 b 2 = 1 2 x 1 y 1 x 2 y 2 - 1 K 1 - r 1 2 K 2 - r 2 2 - - - ( 18 )
则声源的坐标可以表示为关于Rs的表达式,如公式(19)所示
x = x s y s = b 1 + a 1 R s 2 b 2 + a 2 R s 2 - - - ( 19 )
将(19)式代入方程(14)就可以得到关于Rs的表达式,如下面的公式(20)所不。
( a 1 2 + a 2 2 ) R s 4 + 2 ( a 1 b 1 + a 2 b 2 - 1 ) R s 2 + b 1 2 + b 2 2 = 0 - - - ( 20 )
解方程可得到公式(21),
R s 2 = ( 1 - a 1 b 1 + a 2 b 2 ) ± ( 1 - a 1 b 1 + a 2 b 2 ) 2 - ( a 1 2 + a 2 2 ) ( b 1 2 + b 2 2 ) a 1 2 + a 2 2 - - - ( 21 )
其中正根给出了声源到原点的距离的平方。将解得的结果再带回(19)就可以得到声源的位置坐标。最终的结果要根据实际应用环境来确定。
下面参考图8说明根据本发明实施例利用双麦克风对声源进行定位的装置的结构图。作为实例,该装置可以设置在麦克风内部,也可以设置在麦克风外部,并通过相应的控制装置与麦克风连接以控制麦克风的方向。根据本发明的声源定位装置包括接收单元81,到达时间差(TDOA)估算单元82,双耳电平差(ILD)估算单元83,和定位计算单元84。接收单元81接收声源发出的声音信号x1(t)和x2(t),并将声音信号提供给到达时间差估算单元82和双耳电平差估算单元83。在到达时间差估算单元82中按照如上所述的方式估算出声音信号到达两个麦克风的时间差τ12在双耳电平差估算单元83中按照估算如上所述的方式出到达两个麦克风的能量比 γ = E 1 / E 2 。此后,将到达时间差估算单元82和双耳电平差估算单元83得到了结果提供给定位计算单元84。定位计算单元84按照如上所述的方式计算出声源的位置坐标,从而得到声源的位置。
图9是根据本发明实施例对声音信号进行处理以得到声源坐标位置的流程图。在计算时间差的分支中,在步骤S91,对来自声源的源信号s1(t)和s2(t)分别进行傅立叶变化。另一方面,在计算能量的分支中,在另一个在步骤S96,对来自声源的源信号s1(t)和s2(t)分别逆平方律计算。此后,在步骤S92,在乘法器中对经过傅立叶变换的源信号s1(t)和s2(t)进行乘法运算。在步骤S93,利用例如相位变换(PHAT)加权的GCC方法对来自乘法器的信号进行处理,得到对应的TDOA估算所得的结果。此后,步骤S94,对估算结果进行反傅立叶变换。接下来,在步骤S96通过检测经过反傅立叶变换的信号,得到其中的最大值,由此得出到达两个麦克风的时间差τ12
在另一个分支,在步骤S96经过逆平方律计算后,在步骤S97计算麦克风所接收到的声音的能量(如上面的公式(2)所示)。此后,在步骤98,利用上面所述的公式(7)计算 γ = E 1 / E 2 ,得到能量比。最后,在步骤S99利用步骤S95和S98得到的结果建立方程以计算声源的坐标位置。
对根据本发明的方法得到的声源位置进行了仿真。首先在无反射的环境下验证它的可行性。所用声源为8KHz采样的女声信号。仿真环境为(4m×6m×3m)的矩形房间,假定各墙壁的反射为镜面反射,具相同的反射系数且与频率无关。图10示出了仿真环境的示意图。以房屋的一个顶点为圆心,以三条棱线为轴建立坐标系统。如图10所示,声源的初始位置为(1,3,1),两个麦克风的位置分别为(2,3.75,1)和(2,4,1)(坐标单位统一为m)。对于上节提到的定位算法,当TDOA估计采用相位变换(PhaseTransform,PHAT)加权的GCC方法时,仿真所得到的结果如图10所示,双曲线对应了TDOA估计所得的结果,圆为ILD方法对应的轨迹。同时,在图中标出了具体的声源(“*”)和麦克位置(“°”)。可以理解,对于线阵来说,它的定位结果会同时出现两个点,相对于阵列镜像对称(如图10中圆和双曲线的两个交点),这是线阵的一个固有缺陷。为了消除这种镜像模糊,可以将定位区域限制在感兴趣的范围内,或者借助于先验信息来排除多余的点。例如,当固定阵列于某一墙壁时,仅需要定位出阵列前方的区域的点,而另一侧是所不关心的(因为,另一侧是墙的外部,没有设置声源)。此外,图10中两曲线的交点很好的吻合了实际的声源位置,从而证明了本发明所提出方法的有效性。
下面给出在各种反射条件下进行仿真试验,房屋脉冲响应由Allen和Berkley提出的Image Method方法产生,其中反射时间利用Sabine公式进行估计,如下
R T 60 = 55 V c × Se - - - ( 22 )
Se=effective absorbing area=α1S12S23S3+…    (23)
其中V(m3)为房屋体积,Se(m2)为有效的声源吸收面积。对于已知的反射系数βi,吸收系数αi可以通过如下的关系得到
α i = 1 - β i 2 - - - ( 24 )
在本实验中,两个麦克风被放置于(2,3.2,1)和(2,2.8,1)两点。由于不同位置的声源其定位结果受混响的影响不同,所以我们将随机产生的高斯声源放置在距离阵列中心1m处,沿10°,45°以及80°角方向,其角度定义为声源与阵列中心连线与阵列法线方向夹角,如图11所示。同时改变反射系数从0.1(RT60=109ms)到0.9(RT60=568ms)变化,由此所得的结果如图12所示。
从图12可以看出,在低混响的条件下,本发明的方法可以得到很准确的声源位置。然而当混响增加到一定程度,定位的性能开始恶化。相对于TDOA加双曲定位的方法来说,这种基于能量的ILD方法更容易受混响的影响。当声源的方向接近于0时(图13c),各麦克风所接收到的信号能量相差不大,此时随着混响的增加,由能量获取的信息变得不再可靠,微小的误差可能使能量比值γ发生本质的变化。
比较特殊的情况,当声源位于两个麦克的中垂线上时,E1=E1以及τ12=0,双曲线和圆均退化为直线,所描述的算法此时也不能定位出声源的具体位置。在这种情况下,可以将线阵偏转一个小的角度,来避开这一特殊位置,再利用双麦克定位算法进行定位。
应该指出,本发明以麦克风为例描述利用两个声音接收单元对声源进行定位的方法。可以理解,本发明的范围不限于以麦克风作为声音接收单元,其基本思想可以应用其它声音接收装置。
本发明通过两个曲线的交点来获得声源的位置,可以通过解闭合表达式来实现。本发明的方法比空间搜索和迭代的方法计算量要小,处理速度要快,所以可以用于动源的跟踪。它以信号到达两个麦克风处的相对时间差作为定位参数,不需要同步时钟,所以也就不存在同步误差。
本发明的算法在低反射条件下取得了好的结果,尽管在高混响情况下的位置精度不是很令人满意,但是它仍然可以获得准确的方位估计;另一方面,一般的应用环境都能够满足我们的精确定位要求。
另外,同样由两个麦克风组成的定位系统,本发明算法不需要发射特殊类型的信号作为参考,例如红外线等。
尽管根据本发明的优选实施例以一定的详细程度说明了本发明,但是,优选实施例披露的内容在其结构细节上可以改变,并且可以对组件的组合与顺序进行任何改变,而不脱离权利要求中指出的本发明的范围和精神。

Claims (13)

1.一种定位声源位置的方法,包括步骤:
由接收装置接收声源发出的声音信号;
估算所述声音信号到达所述接收装置的时间差;
估算所述接收装置分别接收的所述声音信号的能量比;
根据估算的所述时间差和所述能量比确定所述声源的位置。
2.根据权利要求1所述的方法,其中用于定位所述声源的所述接收装置的数量是2。
3.根据权利要求1或2所述的方法,其中估算所述时间差的步骤包括利用广义互相关函数计算所述时间差的步骤。
4.根据权利要求3所述的方法,进一步包括检测广义互相关函数计算结果的最大值来估算所述声音信号到达所述接收装置时间差。
5.根据权利要求1或2所述的方法,进一步包括对接收的所述声音信号进行傅立叶变换的步骤。
6.一种利用两个麦克风定位声源位置的方法,包括步骤:
两个麦克风分别接收声源发出的声音信号;
估算所述声音信号到达所述两个麦克风的时间差;
估算所述两个麦克风分别接收的所述声音信号的能量比;
根据估算的所述时间差和所述能量比确定所述声源的位置。
7.根据权利要求6所述的方法,其中所述估算所述时间差的步骤包括利用广义互相关函数计算所述时间差的步骤。
8.根据权利要求7所述的方法,进一步包括检测广义互相关函数计算结果的最大值来估算所述声音信号到达所述麦克风时间差。
9.根据权利要求6所述的方法,进一步包括对接收的所述声音信号进行傅立叶变换的步骤。
10.一种定位声源位置的装置,包括:
接收装置,用于接收声源发出的声音信号;
到达时间差估算装置,用于估算所述声音信号到达所述接收装置的时间差:
双耳电平差估算装置,用于估算所述接收装置分别接收的所述声音信号的能量比;和
定位计算装置,用于根据估算的所述时间差和所述能量比确定所述声源的位置。
11.根据权利要求10所述的装置,其中所述接收装置的数量2。
12.根据权利要求10或11所述的装置,其中所述接收装置是麦克风。
13.一种利用两个麦克风定位声源位置的装置,包括:
接收装置,用于接收声源发出的声音信号;
到达时间差估算装置,用于估算所述声音信号到达所述两个麦克风的时间差;
双耳电平差估算装置,用于估算所述两个麦克风分别接收的所述声音信号的能量比;和
定位计算装置,用于根据估算的所述时间差和所述能量比确定所述声源的位置。
CN200510116434.9A 2005-10-20 2005-10-20 利用麦克风定位声源的方法和装置 Pending CN1952684A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200510116434.9A CN1952684A (zh) 2005-10-20 2005-10-20 利用麦克风定位声源的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200510116434.9A CN1952684A (zh) 2005-10-20 2005-10-20 利用麦克风定位声源的方法和装置

Publications (1)

Publication Number Publication Date
CN1952684A true CN1952684A (zh) 2007-04-25

Family

ID=38059124

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200510116434.9A Pending CN1952684A (zh) 2005-10-20 2005-10-20 利用麦克风定位声源的方法和装置

Country Status (1)

Country Link
CN (1) CN1952684A (zh)

Cited By (44)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102033223A (zh) * 2010-12-29 2011-04-27 北京信息科技大学 使用麦克风阵列对声源定位的方法
CN102541080A (zh) * 2010-12-11 2012-07-04 骅威科技股份有限公司 一种具有声源定位功能的移动装置
CN102707261A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种麦克风阵列声源定位系统
CN101595739B (zh) * 2007-01-26 2012-11-14 微软公司 多传感器声源定位
CN102819009A (zh) * 2012-08-10 2012-12-12 汽车零部件研究及发展中心有限公司 用于汽车的驾驶者声源定位系统及方法
CN101533090B (zh) * 2008-03-14 2013-03-13 华为终端有限公司 一种阵列麦克的声音定位方法和装置
CN101567969B (zh) * 2009-05-21 2013-08-21 上海交通大学 基于麦克风阵列声音制导的智能视频导播方法
CN103439689A (zh) * 2013-08-21 2013-12-11 大连理工大学 一种分布式麦克风阵列中麦克风位置估计系统
CN103645461A (zh) * 2013-12-24 2014-03-19 北京凯华信业科贸有限责任公司 基于声音信号利用双曲线交叉定位的室内定位方法
CN103675757A (zh) * 2013-12-17 2014-03-26 无锡清华信息科学与技术国家实验室物联网技术中心 基于多个手机麦克风阵列的定位方法
CN104041075A (zh) * 2012-01-17 2014-09-10 皇家飞利浦有限公司 音频源位置估计
CN104364844A (zh) * 2012-06-08 2015-02-18 英特尔公司 针对长延迟回声的回声消除算法
CN104422922A (zh) * 2013-08-19 2015-03-18 中兴通讯股份有限公司 一种移动终端实现声源定位的方法及装置
CN104424073A (zh) * 2013-08-21 2015-03-18 联想(北京)有限公司 一种信息处理的方法及电子设备
CN104848478A (zh) * 2015-04-28 2015-08-19 广东美的制冷设备有限公司 空调器中语音指令识别阈值的调整方法和系统
CN105025416A (zh) * 2015-07-10 2015-11-04 武汉科技大学 一种便携式双传声器声源识别与定位装置
CN105044676A (zh) * 2015-09-15 2015-11-11 北京理工大学 一种基于能量的声源定位方法
CN105223543A (zh) * 2014-06-25 2016-01-06 Tcl集团股份有限公司 一种基于音响装置的声波定位方法及其系统
CN105611167A (zh) * 2015-12-30 2016-05-25 联想(北京)有限公司 一种对焦平面调整方法及电子设备
CN105744454A (zh) * 2014-12-29 2016-07-06 Gn瑞声达 A/S 具有声源定位的听力设备及其方法
CN105812721A (zh) * 2014-12-30 2016-07-27 浙江大华技术股份有限公司 一种跟踪监控方法及跟踪监控设备
CN106054133A (zh) * 2016-05-11 2016-10-26 北京地平线信息技术有限公司 远场声源定位系统和方法
CN106199607A (zh) * 2016-06-29 2016-12-07 北京捷通华声科技股份有限公司 一种麦克风阵列的声源方向定位方法及装置
CN104238576B (zh) * 2014-09-17 2017-02-15 厦门亿联网络技术股份有限公司 一种基于多麦的视频会议摄像头定位方法
CN106453835A (zh) * 2016-09-09 2017-02-22 深圳市金立通信设备有限公司 一种切换接听方式的方法和终端
CN106597379A (zh) * 2015-10-20 2017-04-26 沈阳新松机器人自动化股份有限公司 基于复合算法的平面声源定位方法
CN106708041A (zh) * 2016-12-12 2017-05-24 西安Tcl软件开发有限公司 智能音箱、智能音箱定向移动方法及装置
CN106768284A (zh) * 2016-12-20 2017-05-31 西安科技大学 一种异常声源判断与定位系统及方法
CN106774901A (zh) * 2016-10-14 2017-05-31 厦门大学 基于超声定位的远距离pc体感输入方法
CN107205196A (zh) * 2017-05-19 2017-09-26 歌尔科技有限公司 麦克风阵列指向的调整方法和装置
CN108174143A (zh) * 2016-12-07 2018-06-15 杭州海康威视数字技术股份有限公司 一种监控设备控制方法及装置
CN108416996A (zh) * 2018-04-28 2018-08-17 上海市城市建设设计研究总院(集团)有限公司 基于城市道路附属设施的声源定位系统及其使用方法
WO2018223639A1 (zh) * 2017-06-06 2018-12-13 歌尔股份有限公司 一种麦克风阵列声源定位方法和装置
CN109743525A (zh) * 2018-12-03 2019-05-10 视联动力信息技术股份有限公司 一种数据采集方法及装置
CN109803171A (zh) * 2019-02-15 2019-05-24 深圳市锐明技术股份有限公司 一种用于语音位置显示的监控摄像机及其控制方法
CN109817227A (zh) * 2018-12-06 2019-05-28 洛阳语音云创新研究院 一种养殖场的异常声音监测方法和系统
CN110199254A (zh) * 2017-01-30 2019-09-03 昕诺飞控股有限公司 用于控制多个光源的控制器
CN111381211A (zh) * 2020-03-02 2020-07-07 北京声智科技有限公司 一种声源定位方法及装置
CN111815958A (zh) * 2020-06-18 2020-10-23 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法
CN111896961A (zh) * 2020-07-01 2020-11-06 北京小米移动软件有限公司 位置确定方法及装置、电子设备、计算机可读存储介质
CN112684413A (zh) * 2021-03-17 2021-04-20 杭州灵伴科技有限公司 声源寻向方法和xr设备
CN112946578A (zh) * 2021-02-02 2021-06-11 上海头趣科技有限公司 新型双耳定位方法
CN113702910A (zh) * 2021-08-31 2021-11-26 冠捷显示科技(厦门)有限公司 一种基于双麦克风的声音定位方法及其装置
CN117292516A (zh) * 2023-10-25 2023-12-26 国网山西省电力公司晋中供电公司 一种电缆防外破警报系统

Cited By (69)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101595739B (zh) * 2007-01-26 2012-11-14 微软公司 多传感器声源定位
CN101533090B (zh) * 2008-03-14 2013-03-13 华为终端有限公司 一种阵列麦克的声音定位方法和装置
CN101567969B (zh) * 2009-05-21 2013-08-21 上海交通大学 基于麦克风阵列声音制导的智能视频导播方法
CN102541080A (zh) * 2010-12-11 2012-07-04 骅威科技股份有限公司 一种具有声源定位功能的移动装置
CN102541080B (zh) * 2010-12-11 2014-04-02 骅威科技股份有限公司 一种具有声源定位功能的移动装置
CN102033223B (zh) * 2010-12-29 2012-10-03 北京信息科技大学 使用麦克风阵列对声源定位的方法
CN102033223A (zh) * 2010-12-29 2011-04-27 北京信息科技大学 使用麦克风阵列对声源定位的方法
CN104041075B (zh) * 2012-01-17 2017-10-24 皇家飞利浦有限公司 音频源位置估计
CN104041075A (zh) * 2012-01-17 2014-09-10 皇家飞利浦有限公司 音频源位置估计
CN104364844A (zh) * 2012-06-08 2015-02-18 英特尔公司 针对长延迟回声的回声消除算法
CN104364844B (zh) * 2012-06-08 2018-12-04 英特尔公司 针对长延迟回声的回声消除算法
CN102707261A (zh) * 2012-06-20 2012-10-03 太仓博天网络科技有限公司 一种麦克风阵列声源定位系统
CN102819009A (zh) * 2012-08-10 2012-12-12 汽车零部件研究及发展中心有限公司 用于汽车的驾驶者声源定位系统及方法
CN104422922A (zh) * 2013-08-19 2015-03-18 中兴通讯股份有限公司 一种移动终端实现声源定位的方法及装置
CN103439689A (zh) * 2013-08-21 2013-12-11 大连理工大学 一种分布式麦克风阵列中麦克风位置估计系统
CN104424073A (zh) * 2013-08-21 2015-03-18 联想(北京)有限公司 一种信息处理的方法及电子设备
CN103439689B (zh) * 2013-08-21 2015-12-23 大连理工大学 一种分布式麦克风阵列中麦克风位置估计系统
CN103675757A (zh) * 2013-12-17 2014-03-26 无锡清华信息科学与技术国家实验室物联网技术中心 基于多个手机麦克风阵列的定位方法
CN103675757B (zh) * 2013-12-17 2015-11-04 无锡清华信息科学与技术国家实验室物联网技术中心 基于多个手机麦克风阵列的定位方法
CN103645461A (zh) * 2013-12-24 2014-03-19 北京凯华信业科贸有限责任公司 基于声音信号利用双曲线交叉定位的室内定位方法
CN103645461B (zh) * 2013-12-24 2015-07-15 北京凯华信业科贸有限责任公司 基于声音信号利用双曲线交叉定位的室内定位方法
CN105223543A (zh) * 2014-06-25 2016-01-06 Tcl集团股份有限公司 一种基于音响装置的声波定位方法及其系统
CN105223543B (zh) * 2014-06-25 2018-06-19 Tcl集团股份有限公司 一种基于音响装置的声波定位方法及其系统
CN104238576B (zh) * 2014-09-17 2017-02-15 厦门亿联网络技术股份有限公司 一种基于多麦的视频会议摄像头定位方法
CN105744454A (zh) * 2014-12-29 2016-07-06 Gn瑞声达 A/S 具有声源定位的听力设备及其方法
CN105744454B (zh) * 2014-12-29 2021-09-21 Gn瑞声达 A/S 具有声源定位的听力设备及其方法
CN105812721A (zh) * 2014-12-30 2016-07-27 浙江大华技术股份有限公司 一种跟踪监控方法及跟踪监控设备
CN104848478B (zh) * 2015-04-28 2017-11-10 广东美的制冷设备有限公司 空调器中语音指令识别阈值的调整方法和系统
CN104848478A (zh) * 2015-04-28 2015-08-19 广东美的制冷设备有限公司 空调器中语音指令识别阈值的调整方法和系统
CN105025416B (zh) * 2015-07-10 2019-03-15 武汉科技大学 一种便携式双传声器声源识别与定位装置
CN105025416A (zh) * 2015-07-10 2015-11-04 武汉科技大学 一种便携式双传声器声源识别与定位装置
CN105044676A (zh) * 2015-09-15 2015-11-11 北京理工大学 一种基于能量的声源定位方法
CN105044676B (zh) * 2015-09-15 2016-12-21 北京理工大学 一种基于能量的声源定位方法
CN106597379A (zh) * 2015-10-20 2017-04-26 沈阳新松机器人自动化股份有限公司 基于复合算法的平面声源定位方法
CN105611167A (zh) * 2015-12-30 2016-05-25 联想(北京)有限公司 一种对焦平面调整方法及电子设备
CN106054133A (zh) * 2016-05-11 2016-10-26 北京地平线信息技术有限公司 远场声源定位系统和方法
CN106199607A (zh) * 2016-06-29 2016-12-07 北京捷通华声科技股份有限公司 一种麦克风阵列的声源方向定位方法及装置
CN106199607B (zh) * 2016-06-29 2019-03-01 北京捷通华声科技股份有限公司 一种麦克风阵列的声源方向定位方法及装置
CN106453835B (zh) * 2016-09-09 2019-10-22 深圳市金立通信设备有限公司 一种切换接听方式的方法和终端
CN106453835A (zh) * 2016-09-09 2017-02-22 深圳市金立通信设备有限公司 一种切换接听方式的方法和终端
CN106774901B (zh) * 2016-10-14 2019-10-01 厦门大学 基于超声定位的远距离pc体感输入方法
CN106774901A (zh) * 2016-10-14 2017-05-31 厦门大学 基于超声定位的远距离pc体感输入方法
CN108174143A (zh) * 2016-12-07 2018-06-15 杭州海康威视数字技术股份有限公司 一种监控设备控制方法及装置
CN108174143B (zh) * 2016-12-07 2020-11-13 杭州海康威视数字技术股份有限公司 一种监控设备控制方法及装置
CN106708041A (zh) * 2016-12-12 2017-05-24 西安Tcl软件开发有限公司 智能音箱、智能音箱定向移动方法及装置
CN106708041B (zh) * 2016-12-12 2020-12-29 西安Tcl软件开发有限公司 智能音箱、智能音箱定向移动方法及装置
CN106768284A (zh) * 2016-12-20 2017-05-31 西安科技大学 一种异常声源判断与定位系统及方法
CN106768284B (zh) * 2016-12-20 2021-04-20 西安科技大学 一种异常声源判断与定位系统及方法
CN110199254B (zh) * 2017-01-30 2024-04-16 昕诺飞控股有限公司 用于控制多个光源的控制器
CN110199254A (zh) * 2017-01-30 2019-09-03 昕诺飞控股有限公司 用于控制多个光源的控制器
WO2018209893A1 (zh) * 2017-05-19 2018-11-22 歌尔科技有限公司 麦克风阵列指向的调整方法和装置
CN107205196A (zh) * 2017-05-19 2017-09-26 歌尔科技有限公司 麦克风阵列指向的调整方法和装置
WO2018223639A1 (zh) * 2017-06-06 2018-12-13 歌尔股份有限公司 一种麦克风阵列声源定位方法和装置
US10848865B2 (en) 2017-06-06 2020-11-24 Weifang Goertek Microelectronics Co., Ltd. Method and device for sound source positioning using microphone array
CN108416996A (zh) * 2018-04-28 2018-08-17 上海市城市建设设计研究总院(集团)有限公司 基于城市道路附属设施的声源定位系统及其使用方法
CN109743525A (zh) * 2018-12-03 2019-05-10 视联动力信息技术股份有限公司 一种数据采集方法及装置
CN109817227B (zh) * 2018-12-06 2021-02-09 洛阳语音云创新研究院 一种养殖场的异常声音监测方法和系统
CN109817227A (zh) * 2018-12-06 2019-05-28 洛阳语音云创新研究院 一种养殖场的异常声音监测方法和系统
CN109803171A (zh) * 2019-02-15 2019-05-24 深圳市锐明技术股份有限公司 一种用于语音位置显示的监控摄像机及其控制方法
CN109803171B (zh) * 2019-02-15 2023-10-24 深圳市锐明技术股份有限公司 一种用于语音位置显示的监控摄像机及其控制方法
CN111381211A (zh) * 2020-03-02 2020-07-07 北京声智科技有限公司 一种声源定位方法及装置
CN111815958B (zh) * 2020-06-18 2022-11-29 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法
CN111815958A (zh) * 2020-06-18 2020-10-23 安徽超清科技股份有限公司 一种交通电子警察抓拍控制装置及方法
CN111896961A (zh) * 2020-07-01 2020-11-06 北京小米移动软件有限公司 位置确定方法及装置、电子设备、计算机可读存储介质
CN112946578A (zh) * 2021-02-02 2021-06-11 上海头趣科技有限公司 新型双耳定位方法
CN112946578B (zh) * 2021-02-02 2023-04-21 上海头趣科技有限公司 双耳定位方法
CN112684413A (zh) * 2021-03-17 2021-04-20 杭州灵伴科技有限公司 声源寻向方法和xr设备
CN113702910A (zh) * 2021-08-31 2021-11-26 冠捷显示科技(厦门)有限公司 一种基于双麦克风的声音定位方法及其装置
CN117292516A (zh) * 2023-10-25 2023-12-26 国网山西省电力公司晋中供电公司 一种电缆防外破警报系统

Similar Documents

Publication Publication Date Title
CN1952684A (zh) 利用麦克风定位声源的方法和装置
Cobos et al. A survey of sound source localization methods in wireless acoustic sensor networks
EP2724554B1 (en) Time difference of arrival determination with direct sound
US9949050B2 (en) Calibration method and system
CN105388459B (zh) 分布式麦克风阵列网络的鲁棒声源空间定位方法
Tervo et al. Acoustic reflection localization from room impulse responses
Ajdler et al. Acoustic source localization in distributed sensor networks
CN107102296A (zh) 一种基于分布式麦克风阵列的声源定位系统
Parsayan et al. N-dimensional N-microphone sound source localization
Murray et al. Robotic sound-source localisation architecture using cross-correlation and recurrent neural networks
Huang et al. Microphone arrays for video camera steering
Annibale et al. TDOA-based speed of sound estimation for air temperature and room geometry inference
Di Carlo et al. Mirage: 2d source localization using microphone pair augmentation with echoes
Ogiso et al. Robust indoor localization in a reverberant environment using microphone pairs and asynchronous acoustic beacons
Nguyen et al. Multilevel B-splines-based learning approach for sound source localization
US9081083B1 (en) Estimation of time delay of arrival
KR20090128221A (ko) 음원 위치 추정 방법 및 그 방법에 따른 시스템
Tervo et al. Estimation of reflections from impulse responses
CN115902776B (zh) 一种基于被动式声音信号的声源定位方法
Chen et al. A sound source localization device based on rectangular pyramid structure for mobile robot
Di Carlo et al. dEchorate: a calibrated room impulse response database for echo-aware signal processing
Al-Sheikh et al. Sound source direction estimation in horizontal plane using microphone array
Mita et al. Geometric sound profile: Multipath-time-of-flight fingerprint for high-accuracy acoustic localization
CN114994608B (zh) 基于深度学习的多设备自组织麦克风阵列声源定位方法
Pfreundtner et al. (W) Earable Microphone Array and Ultrasonic Echo Localization for Coarse Indoor Environment Mapping

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication