[go: up one dir, main page]

CN102347028A - 双麦克风语音增强装置及方法 - Google Patents

双麦克风语音增强装置及方法 Download PDF

Info

Publication number
CN102347028A
CN102347028A CN201110196850XA CN201110196850A CN102347028A CN 102347028 A CN102347028 A CN 102347028A CN 201110196850X A CN201110196850X A CN 201110196850XA CN 201110196850 A CN201110196850 A CN 201110196850A CN 102347028 A CN102347028 A CN 102347028A
Authority
CN
China
Prior art keywords
signal
noise
domain
microphone
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201110196850XA
Other languages
English (en)
Inventor
叶利剑
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ruisheng Acoustic Technology Changzhou Co ltd
AAC Technologies Holdings Shenzhen Co Ltd
AAC Technologies Holdings Nanjing Co Ltd
Original Assignee
Ruisheng Acoustic Technology Changzhou Co ltd
AAC Acoustic Technologies Shenzhen Co Ltd
AAC Acoustic Technologies Nanjing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ruisheng Acoustic Technology Changzhou Co ltd, AAC Acoustic Technologies Shenzhen Co Ltd, AAC Acoustic Technologies Nanjing Co Ltd filed Critical Ruisheng Acoustic Technology Changzhou Co ltd
Priority to CN201110196850XA priority Critical patent/CN102347028A/zh
Publication of CN102347028A publication Critical patent/CN102347028A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

本发明提供了一种双麦克风语音增强装置,包括双麦克风阵列模块、时延补偿模块、倒谱域去混响模块、语音增强处理模块及输出模块,其中,倒谱域去混响模块起到了去除混响的效果。本发明还提供了一种基于双麦克风语音增强装置的语音增强方法。本发明采用倒谱域模块进行波束形成和低通滤波,能较好地消除房间混响的影响,同时使用语音增强算法,则可以进一步抑制背景噪声。

Description

双麦克风语音增强装置及方法
【技术领域】
本发明涉及一种语音增强装置及方法,尤其涉及一种基于双麦克风语音增强装置及方法。
【背景技术】
随着通讯技术的发展,用户对通信设备的要求已不仅满足于通话,而且要能够提供高质量的通话效果,尤其是目前可视化技术的发展,电话的通话质量更显重要。通过各种语音增强方法提高通话质量,已经是通信设备中必不可少的组成部分。
近年来,电话会议在人们工作中的比重急剧上升,越发重要。然而,在电话会议的房间中,虽然室内安静,噪声不大,但房间混响则是一直存在且对电话会议有很大干扰的。相关技术的语音增强装置通常采用一个或两个一致性较好的麦克风,相互间距一定情况下,形成指向性拾音波束,抑制波束外噪声,再通过语音增强处理进一步消除背景噪声。这仅采用加性噪声的信号模型,没有考虑房间混响效应
因此,有必要提供一种新的语音增强装置及方法来克服上诉问题。
【发明内容】
本发明需解决的技术问题是提供一种能消除房间混响噪声的双麦克风阵列语音增强装置及方法。
本发明的技术方案如下:。
一种基于双麦克风语音增强装置,其中,该装置包括:
麦克风阵列模块,设有用于接收时域带噪语音信号,并将该时域带噪语音信号经过模数转换生成数字信号,以将其输出的第一麦克风和第二麦克风;
时延补偿模块,用于接收所述麦克风阵列模块输出的时域带噪语音数字信号,通过广义互相关发估计两个麦克风信号的相对时延,并对接收到的信号进行补偿;
倒谱域去混响模块,用于接收所述时延补偿模块输出的时延补偿后的时域带噪语音信号,将接收到的上述时域带噪语音信号在倒谱域进行波束合成低通滤波,以去除信号中的混响,并获得初步降噪的信号;
语音增强处理模块,用于接收倒谱域去混响模块输出的初步降噪的信号并将该初步降噪的信号进行语音增强处理,以得到进一步加强的语音信号;
输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。
作为本发明的一种改进,所述麦克风阵列模块中经模数转换输出的数字信号的采样率为16kHz,分辨率为16bit。
作为本发明的一种改进,所述麦克风阵列模块中的第一麦克风和第二麦克风是全指向麦克风。
作为本发明的一种改进,该方法包括如下步骤:
步骤S001:第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1、x2,经过模数转换将时域带噪语音信号x1、x2变为时域带噪语音数字信号传送给时延补偿模块,并由延补偿模块对接收到的时域带噪语音数字信号进行时延估计和补偿,得到同步信号x′1,x′2
步骤S002:由倒谱域去混响模块接受时延补偿模块输出的同步信号x′1,x′2,并对该信号在倒谱域上进行波束合成低通滤波,去除信号中的混响,获得初步降噪的信号,并对所述初步降噪的信号分为m帧、进行预加重处理,傅里叶变换成频域信号X1,X2
计算两路信号的复倒谱
Figure BDA0000075691560000021
并分解求得各自的最小相位分量
Figure BDA0000075691560000022
将两路信号的倒谱域最小相位分量进行波束形成,得到
Figure BDA0000075691560000023
并经过低通滤波,得到倒谱域的去除混响后的信号
Figure BDA0000075691560000024
结合由第一麦克风得到的相位信息Φ1(m,k),计算频域的去除混响初步降噪信号Y;
步骤S003:语音增强处理模块接收倒谱域去混响模块输出的去除混响的初步降噪频域信号Y,并将频域信号划分为若干频带k,计算各个频带的能量YE(m,k),其中m表示帧数,k为频带数;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比SNRpost(m,k),并由前一帧的先验信噪比估计值
Figure BDA0000075691560000032
得到当前帧的先验信噪比估计值
Figure BDA0000075691560000033
采用计权噪声估计法对当前帧的先验信噪比进行修正,得到修正先验信噪比估计值
Figure BDA0000075691560000034
根据得到的修正先验信噪比估计值
Figure BDA0000075691560000035
计算各个频带的衰减增益系数q(m,k);
采用门限判决对所述衰减增益系数进行调整;
用得到的调整后的衰减增益系数q′(m,k),对初步降噪后信号Y(m,k)的频谱进行处理;
由修正的先验信噪比估计值
Figure BDA0000075691560000036
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值V(m,k)进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值:V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
将经上述过程处理后的频域信号变换成时域信号,对该时域信号进行去加重处理,并输出;
步骤S004:将上述经去加重处理的时域信号输出。
作为本发明的一种改进,步骤S001中,由时延补偿模块对第一麦克风和第二麦克风分别接收的外界时域带噪语音信号分别经过延时补偿,
将两路信号x1(n),x2(n)进行傅里叶变换到频域X1(ω),X2(ω),两个麦克风的相对时延τ通过广义互相关得到,
R 12 ( τ ) = ∫ 0 π ψ 12 ( ω ) X 1 ( ω ) X 2 * ( ω ) e - jωπ dω
其中加权函数 ψ 12 ( ω ) = 1 | X 1 ( ω ) X 2 * ( ω ) | ,
求解出时相对时延τ,可得到延补偿后的信号x′1(t)=x1(t),x′2(t)=x2(t+τ)作为本发明的一种改进,步骤S002中,对两路经过时延补偿的信号进行分帧,预加重,并转换到频域。
语音增强处理模块对所述两路时延补偿后的信号x′1(t),x′2(t)进行分帧后的信号为x′i(m,n)i=1,2,m表示帧数,经过一个高通滤波器,作为预加重处理,高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325,z代表
短时傅里叶变换如下
X i ( f , m ) = 2 M Σ n = 0 M - 1 win ( n - m ) × x i ( m ) e - 2 πif n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,m表示第m帧信号,f表示频率值,X表示频域信号,x表示时域信号;
汉明窗函数定义如下:
win(n)={
        0.54-0.46cos(2*π*n/M)         0≤n≤M-1
                 0                      其余n
     }
计算信号的复倒谱
复倒谱的计算定义为
Figure BDA0000075691560000043
k=2πf/c
接着求两路信号各自的最小相位分量。
Figure BDA0000075691560000044
其中ΦMin(m,n)是
Figure BDA0000075691560000045
的希尔伯特变换。
将两路信号的倒谱域最小相位分量进行波束形成,这里采用比较简单的固定波束形成。
Figure BDA0000075691560000046
并对其进行低通滤波,去除混响。
Figure BDA0000075691560000051
其中H(n)为低通滤波器,其滤波器系数需根据实际情况确定。
变换到频域
由于人耳对语音相位不敏感,可以用一路麦克风采集到信号的相位Φ1(m,ω),代替波束形成后信号的相位信息。
Φ 1 ( m , ω ) = arg [ Real [ X ( m , ω ) ] Imag [ X ( m , ω ) ] ]
将两者结合,得到初步降噪的频域信号Y,并输出
Y(m,ω)=|X′min(m,ω)]|∠Φ1(m,ω)
作为本发明的一种改进,步骤S003中,采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|Y(m,k)|2                      0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)     0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比
Figure BDA0000075691560000055
并由前一帧的先验信噪比估计值
Figure BDA0000075691560000056
得到当前帧的先验信噪比估计值;
Figure BDA0000075691560000061
Figure BDA0000075691560000062
表示前一帧最后得到的降噪后语音信号,E{[V(m,k)|2}表示噪声能量估计值,,α为平滑系数;
采用计权噪声估计法对先验信噪比估计值进行修正;
先验信噪比估计值
Figure BDA0000075691560000063
乘以计权因子去qθ,得到修正先验信噪比估计值
Figure BDA0000075691560000064
计权因子计算如下
Figure BDA0000075691560000065
其中γ1取1.5左右,γ2取200,θz取20;
根据得到的修正先验信噪比估计值
Figure BDA0000075691560000066
计算各个频带的衰减增益q(m,k);
其具体方法为
Figure BDA0000075691560000067
其中,对于不同频带,a为不同的常数;
采用门限判决对所述衰减增益进行调整;
首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制噪声,
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure BDA0000075691560000072
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益,得到的就是该频带的增强后的语音信号
S ^ ( m , k ) = q ( m , k ) * Y ( m , k ) 0≤k≤N-1
由修正的先验信噪比估计值
Figure BDA0000075691560000075
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示平滑系数。
将经上述过程处理后的频域信号用前面所述短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,并输出。
本发明采用双麦克风阵列,首先将采集到的信号经过时延补偿后,变换到倒谱域,采用广义旁瓣抵消器,在倒谱域进行波束形成,滤除混响的影响,并初步抑制非相关噪声,接着通过单通道语音增强算法,进一步衰减各类型的背景噪声。大大提高了对噪声的衰减,保证了语音清晰度。
【附图说明】
图1是本发明双麦克风语音增强方法的流程示意图的前半部分;
图2是本发明双麦克风语音增强方法的流程示意图的后半部分,图1和图2的结合是本发明双麦克风语音增强方法的总流程示意图;
图3是本发明提供的倒谱分析的双麦克风语音增强装置的结构框图;
图4是非线性计权曲线。
【具体实施方式】
下面结合附图和实施方式对本发明作进一步说明。
如图1至图4所示,本发明的双麦克风的语音增强装置包括:
麦克风阵列模块,设有用于接收时域带噪语音信号,并将该时域带噪语音信号经过模数转换生成数字信号,以将其输出的第一麦克风和第二麦克风;
时延补偿模块,用于接收所述麦克风阵列模块输出的时域带噪语音数字信号,通过广义互相关发估计两个麦克风信号的相对时延,并对接收到的信号进行补偿;
倒谱域去混响模块,用于接收所述时延补偿模块输出的时延补偿后的时域带噪语音信号,将接收到的上述时域带噪语音信号在倒谱域进行波束合成低通滤波,以去除信号中的混响,并获得初步降噪的信号;
语音增强处理模块,用于接收倒谱域去混响模块输出的初步降噪的信号并将该初步降噪的信号进行语音增强处理,以得到进一步加强的语音信号;
输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。
其中,麦克风阵列模块中经模数转换输出的数字信号的采样率为16kHz,分辨率为16bit。所述麦克风阵列模块中的第一麦克风和第二麦克风是全指向麦克风。
本发明中的降噪算法基本步骤如下:
1.对双麦克风接收到的两路信号经过时延补偿后,分帧,预加重处理后转换到倒谱域;
2.在倒谱域求出信号的最小相位分量;
3.在倒谱域进行波束形成,再经过低通滤波处理,滤除混响成分,得到去除混响的初步降噪频域信号;
4.将去除混响的初步降噪频域信号划分为若干频带,计算各个频带能量并进行平滑,得到经平滑后的每个频带内的信号能量;
5.通过信号能量及噪声能量估计值,计算各个频带当前帧的后验信噪比,并由前一帧的先验信噪比估计值得到当前帧的先验信噪比估计值;
6.对得到的先验信噪比估计值,采用计权噪声估计法进行修正;
7.根据得到的修正先验信噪比估计值,计算各个频带的衰减增益因子;
8.采用门限判决对增益系数进行调整;
9.用得到的衰减增益,对划分到个频带的信号频谱进行处理;
10.由修正的先验信噪比估计值对当前帧进行判决,判断是否是噪声;
11.根据噪声判决结果对各频带的噪声估计值进行更新;
12.将处理后的频域信号变换到时间域,进行去加重处理,变成输出信号。
下面具体的实例介绍中,语音增强系统输入的噪语音信号的采样率为16kHZ,分辨率为16位。
首先输入的两路信号,经过时延估计及补偿,使传到两个麦克风的信号有相同幅度与相位,时延估计采用广义互相关法。
将两路信号x1(n),x2(n)进行傅里叶变换到频域X1(ω),X2(ω),两个麦克风的相对时延τ,则x1(n),x2(n)的广义互相关为,
R 12 ( τ ) = ∫ 0 π ψ 12 ( ω ) X 1 ( ω ) X 2 * ( ω ) e - jωπ dω
其中加权函数 ψ 12 ( ω ) = 1 | X 1 ( ω ) X 2 * ( ω ) | .
求解出时相对时延τ,可得到延补偿后的信号
Figure BDA0000075691560000093
其中,x′1(t)=x1(t),x′2(t)=x2(t+τ)
对进行时延补偿后的信号x′1(t),x′2(t)进行分帧。是指将带噪语音信号以帧为单位等分成若干带噪信号单元。所述带噪信号单元由采样点组成,本发明中选取了16kHz的采样频率,根据短时谱分析的需要,帧长一般设定成10~35ms之间,本实施方式以16ms分帧,即一帧带噪信号单元设有256个采样点,自然地,任意一帧带噪信号单元具有一定的帧长,本发明中任意帧的帧长为256。
为了防止相邻两帧的带噪信号单元间的块效应,在分帧时要使相邻两帧的带噪信号单元之间有一定的混叠部分,即,本帧数据中有D个数据为前一帧数据的部分数据,其中混叠部分描述如下:
si(n)=x’i(m,D+n)        0≤n<L,i=1,2
其中si表示输入带噪语音信号,i取1和2分别表示两路信号
x’i(m,n)=x’i(m-1,L+n)        0≤n<D
其中,di表示当前帧的256点采样信号,因为任意一帧的长度为256,重叠率为75%,所以重叠部分的采样点个数D=192。相邻帧的带噪信号单元的第一个采样点相隔的距离L=256-192=64。
本发明相邻两帧的带噪信号单元之间可以具有50%~75%的重叠率。本实施方式选取相邻两帧的带噪信号单元之间具有75%的重叠率,即以本帧的前75%(192点)的带噪信号单元和前一帧后75%(192点)的带噪语音信号单元一致。
分帧后的信号,经过一个高通滤波器,作为预加重处理。由于语音信号中背景噪声在低频部分能量一般较大,所以使用所述高通滤波器可以衰减低频部分的分量,使增强效果更好。其形式如下:
H(z)=1-αz-1
α一般取值在0.75-0.95之间,这里α=0.9,可以取得较好的效果。
由于语音信号是短时平稳的,所以对信号进行分帧处理是可行的,但分帧又会带来帧信号边界处的不连续造成的频率泄露。所以这里要进行短时傅里叶变换(STFT)。短时傅里叶变换可以理解为对帧信号先加窗再做傅里叶变换。加窗函数的目的就是为了在做短时傅里叶变换时,减少帧信号边界处的不连续造成的频率泄露。这里使用了一个长度等于帧长256点的汉明窗,它可以有效的降低吉布斯效应的震荡程度。
汉明窗函数定义如下:
win(n)={
        0.54-0.46cos(2*π*n/M)      0≤n≤M-1
                 0                   其余n
     }
则短时傅里叶变换如下
X i ( f , m ) = 2 M Σ n = 0 M - 1 win ( n - m ) × x i ( m ) e - 2 πif n M 0≤k1≤M-1
其中,M=256,为短时傅利叶变换的计算长度。m表示第m帧信号。
这样就将当前帧的带噪语音信号xi从时域变换到为频域信号Xi
接着计算两路信号的复倒谱。复倒谱是指时域信号做傅里叶变换后,取对数再做逆傅里叶变换。如下,
Figure BDA0000075691560000102
k=2πf/c
其中,^表示倒谱算子,F-1是逆傅里叶变换算子。
接着求两路信号各自的最小相位分量。
Figure BDA0000075691560000111
其中
Figure BDA0000075691560000112
是最小相位分量,
Figure BDA0000075691560000113
是全通分量。
ΦMin(m,n)是
Figure BDA0000075691560000116
的希尔伯特变换。
将两路信号的倒谱域最小相位分量进行波束形成,这里采用比较简单的固定波束形成。
并对其进行低通滤波,去除混响。
Figure BDA0000075691560000118
其中H(n)为低通滤波器,其滤波器系数需根据实际情况确定。
变换到频域
由于人耳对语音相位不敏感,可以用一路麦克风采集到信号的相位Φ1(m,ω),代替信号全通分量的相位信息。
Φ 1 ( m , ω ) = arg [ Real [ X ( m , ω ) ] Imag [ X ( m , ω ) ] ]
将两者结合,得到初步降噪的频域信号Y
Y(m,ω)=|X′min(m,ω)]|∠Φ1(m,ω)
F为傅里叶变换算子。
变换到频域后的初步降噪语音信号包括语音信号和部分环境噪声信号,将该信号划分为若干频带,之后操作针对不同频带有不同的策略。
对16kHz以下信号进行频带划分,之后的信号处理均在各个频带中进行,这样既可以减少运算复杂度,又可以针对不同的频带做不同的处理,得到更好的效果。
本发明中的信号共划分为30个频带。具体见表1。
表123个频带划分
  频带数   起始频率(Hz)   截止频率(Hz)
  1   62.5   93.75
  2   125   156.25
  3   187.5   218.75
  4   250   281.25
  5   312.5   343.75
  6   375   406.25
  7   437.5   468.75
  8   500   531.25
  9   562.5   593.75
  10   625   656.25
  11   687.5   718.75
  12   750   781.25
  13   812.5   906.25
  14   937.5   1062.5
  15   1093.75   1250
  16   1281.25   1468.75
  17   1500   1718.75
  18   1750   2000
  19   2031.25   2312.5
  20   2343.75   2687.5
  21   2718.75   3125
  22   3156.25   3687.5
  23   3718.75   3968.75
  24   4000   4312.5
  25   4343.75   4687.5
  26   4718.75   5156.5
  27   5187.5   5718.75
  28   5750   6250
  29   6281.25   6875
  30   6936.25   7968.75
频带能量估计,用如下公式计算每个子区间的能量并进行平滑:
E(m,k)=|Y(m,k)|2                       0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)      0≤k≤N-1
其中,Y(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子。N为选取的频带总数,即30。
经平滑后的每个子带区间的能量包括语音能量和噪声能量。
接着,计算当前帧信号的后验信噪比,如下
SNR post ( m , k ) = Y E ( m , k ) V ( k )
其中V(k)表示当前估计的噪声信号能量,这个值会在每帧数据处理的最后进行判决更新。
然后基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计公式,计算当前帧的先验信噪比估计值
基于Ephraim-Malah(伊弗雷-马拉)的先验信噪比估计值,会出现对噪声的过估计,即对于高信噪比的情况下,得到的信噪比估计值偏高,造成增强后的语音失真,这里采用计权噪声估计方法进行修正。
以之前得到的后验信噪比为判断值,参照如图3的非线性函数,得到计权因子,对先验信噪比估计值进行加权处理。
其中γ1取1.5左右,γ2取200,θz取20。
接下来,进行衰减增益因子的计算。这里基于前面计算得出的先验信噪比估计值,采用频谱相减的方法得到衰减因子。其具体公式如下。
Figure BDA0000075691560000141
其中,对于不同频带,a为不同的常数。
这里考虑到,噪声主要集中在较低的频带,因此对于中低频段和高频,取不同的a。
本发明中对于k≤14的频带,即1.2kHz以下的信号,a=8.89
对于14<k≤18的频带,即1.2~2kHz之间的信号,a=6.44
对于18<k≤23的频带,即2~4kHz以上的信号,a=6.21
对于k>23的频带,即4kHz以上的信号,a=5.37
接着,对得到的增益系数进行调整,首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制残余噪声。
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真。
可以表示为如下公式:
q &prime; ( k ) = q mod q ( k ) , &xi; ( k ) < &theta; G q ( k ) , otherwise
q &prime; ( k ) = q ( k ) , q ( k ) > q floor q floor , otherwise
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益因子,得到的就是该频带的增强后的语音信号。
S ^ ( k ) = q ( k ) * Y ( k ) 0≤k≤N-1
其中,N=30为频带总数,
Figure BDA0000075691560000145
为第k个频带增强后的语音信号估计值。
本发明中,每个频带的噪声能量的判决与更新采用了基于先验信噪比的语音激活检测(VAD)方法。首先判断当前帧是否是纯噪声信号。
VAD ( m ) = &Sigma; k = 1 N [ &gamma; ( m , k ) &zeta; ( m , k ) 1 + &zeta; ( m , k ) - lg ( 1 + &zeta; ( m , k ) ) ]
其中γ(m,k)=min[SNRpost(m,k),40],
Figure BDA0000075691560000147
对VAD(m)进行判断,并进行噪声更新,如下:
V ( m , k ) = &mu;V ( m - 1 , k ) + ( 1 - &mu; ) E ( m , , k ) VAD ( m ) < &eta; V ( m - 1 , k ) VAD ( m ) &GreaterEqual; &eta;
其中η为噪声更新判决因子,本发明中取η=0.01。
μ为平滑因子,这里取μ=0.9。
最后的时域变换及输出部分进行的操作有:
第一步:逆快速傅里叶变换(FFT),把频域的语音谱变换到时间域,得到增强后的时域语音信号。
时域的变换用通用的逆离散傅利叶变换(IDFT)实现。
s ( m , n ) = 1 2 * &Sigma; n = 0 M - 1 S ^ ( f ) e j 2 &pi;nf / M 0≤k≤M-1
其中,M=256,为帧长。s为变换到时域后的全频带增强后的语音信号。
第二步:进行去加重处理。
和前面的预加重处理相反,这里将信号通过一个低通滤波器,最大程度的还原原有的信号。滤波器的频响如下;
H(z)=1+αz-1
这里的系数与前面预加重处理相对应,取α=0.9。
第三步:将增强后的语音信号的相邻帧的重叠部分进行相加操作。
具体的重叠部分相加可以用如下的方法来表示。
s &prime; ( n ) = s ( m , n ) + s ( m - 1 , n + L ) 0 &le; n < M - L s ( m , n ) M - L &le; n < M
L=64为相邻的帧信号开始处的距离,M=256,为帧长。s’代表完成相加操作后的最终输出信号。
与相关技术比较,本发明降噪的方法与现有的算法相比,使用双麦克风阵列,采用广义旁瓣抵消器,波束形成初步抑制非相关噪声,并通过从语音增强算法,进一步衰减各类型的背景噪声。与现有技术相比,大大提高了对残余噪声的衰减,保证了语音可懂度。经主客观测试,性能优于现有单通道语音增强算法。
本发明的保护范围并不以上述实施方式为限,但凡本领域普通技术人员根据本发明所揭示内容所作的等效修饰或变化,皆应纳入权利要求书中记载的保护范围内。

Claims (7)

1.一种双麦克风语音增强装置,其特征在于:该装置包括:
麦克风阵列模块,设有用于接收时域带噪语音信号,并将该时域带噪语音信号经过模数转换生成数字信号,以将该数字信号输出的第一麦克风和第二麦克风;
时延补偿模块,用于接收所述麦克风阵列模块输出的时域带噪语音数字信号,通过广义互相关发估计两个麦克风信号的相对时延,并对接收到的信号进行补偿;
倒谱域去混响模块,用于接收所述时延补偿模块输出的时延补偿后的时域带噪语音数字信号,将接收到的上述时域带噪语音信号在倒谱域进行波束合成低通滤波,以去除信号中的混响,并获得初步降噪的信号;
语音增强处理模块,用于接收倒谱域去混响模块输出的初步降噪的信号并将该初步降噪的信号进行语音增强处理,以得到进一步加强的语音信号;
输出模块,用于接收语音增强处理模块输出的进一步加强的语音信号并输出。
2.根据权利要求1所述的双麦克风语音增强装置,其特征在于:所述麦克风阵列模块中经模数转换输出的数字信号的采样率为16kHz,分辨率为16bit。
3.根据权利要求2所述的双麦克风语音增强装置,其特征在于:所述麦克风阵列模块中的第一麦克风和第二麦克风是全指向麦克风。
4.一种基于权利要求1所述的双麦克风语音增强方法,其特征在于:该方法包括如下步骤:
步骤S001:第一麦克风和第二麦克风接收到时域带噪语音信号分别为x1、x2,经过模数转换将时域带噪语音信号x1、x2变为时域带噪语音数字信号传送给时延补偿模块,并由延补偿模块对接收到的时域带噪语音数字信号进行时延估计和补偿,得到同步信号x′1,x′2
步骤S002:由倒谱域去混响模块接受时延补偿模块输出的同步信号x′1,x′2,并对该信号在倒谱域上进行波束合成低通滤波,去除信号中的混响,获得初步降噪的信号,并对所述初步降噪的信号分为m帧、进行预加重处理,傅里叶变换成频域信号X1,X2
计算两路信号的复倒谱
Figure FDA0000075691550000021
并分解求得各自的最小相位分量
将两路信号的倒谱域最小相位分量进行波束形成,得到
Figure FDA0000075691550000023
并经过低通滤波,得到倒谱域的去除混响后的信号
结合由第一麦克风得到的相位信息Φ1(m,k),计算频域的去除混响初步降噪信号Y;
步骤S003:语音增强处理模块接收倒谱域去混响模块输出的去除混响的初步降噪频域信号Y,并将频域信号划分为若干频带k,计算各个频带的能量YE(m,k),其中m表示帧数,k为频带数;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比SNRpost(m,k),并由前一帧的先验信噪比估计值
Figure FDA0000075691550000026
得到当前帧的先验信噪比估计值
Figure FDA0000075691550000027
采用计权噪声估计法对当前帧的先验信噪比进行修正,得到修正先验信噪比估计值
Figure FDA0000075691550000028
根据得到的修正先验信噪比估计值
Figure FDA0000075691550000029
计算各个频带的衰减增益系数q(m,k);
采用门限判决对所述衰减增益系数进行调整;
用得到的调整后的衰减增益系数q′(m,k),对初步降噪后信号Y(m,k)的频谱进行处理;
由修正的先验信噪比估计值对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值V(m,k)进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值:V(m,k)=V(m-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
将经上述过程处理后的频域信号变换成时域信号,对该时域信号进行去加重处理,并输出;
步骤S004:将上述经去加重处理的时域信号输出。
5.根据权利要求4所述的双麦克风语音增强方法,其特征在于:
步骤S001中,由时延补偿模块对第一麦克风和第二麦克风分别接收的外界时域带噪语音信号分别经过延时补偿,
将两路信号x1(n),x2(n)进行傅里叶变换到频域X1(ω),X2(ω),两个麦克风的相对时延τ通过广义互相关得到,
R 12 ( &tau; ) = &Integral; 0 &pi; &psi; 12 ( &omega; ) X 1 ( &omega; ) X 2 * ( &omega; ) e - j&omega;&pi; d&omega;
其中加权函数 &psi; 12 ( &omega; ) = 1 | X 1 ( &omega; ) X 2 * ( &omega; ) | ,
求解出时相对时延τ,可得到延补偿后的信号x′1(t)=x1(t),x′2(t)=x2(t+τ)
6.根据权利要求4所述的双麦克风语音增强方法,其特征在于:步骤S002中,对两路经过时延补偿的信号进行分帧,预加重,并转换到频域。
语音增强处理模块对所述两路时延补偿后的信号x′1(t),x′2(t)进行分帧后的信号为x′i(m,n)i=1,2,m表示帧数,经过一个高通滤波器,作为预加重处理,高通滤波器其形式如下:
H(z)=1-αz-1
其中常数α=0.9325,z代表
短时傅里叶变换如下
X i ( f , m ) = 2 M &Sigma; n = 0 M - 1 win ( n - m ) &times; x i ( m ) e - 2 &pi;if n M 0≤k1≤M-1
其中,M为短时傅利叶变换的计算长度,m表示第m帧信号,f表示频率值,X表示频域信号,x表示时域信号;
汉明窗函数定义如下:
win(n)={
         0.54-0.46cos(2*π*n/M)       0≤n≤M-1
                  0                    其余n
     }
计算信号的复倒谱
复倒谱的计算定义为
Figure FDA0000075691550000041
k=2πf/c
接着求两路信号各自的最小相位分量。
Figure FDA0000075691550000042
其中ΦMin(m,n)是
Figure FDA0000075691550000043
的希尔伯特变换。
将两路信号的倒谱域最小相位分量进行波束形成,这里采用比较简单的固定波束形成。
Figure FDA0000075691550000044
并对其进行低通滤波,去除混响。
Figure FDA0000075691550000045
其中H(n)为低通滤波器,其滤波器系数需根据实际情况确定。
变换到频域
Figure FDA0000075691550000046
由于人耳对语音相位不敏感,可以用一路麦克风采集到信号的相位Φ1(m,ω),代替波束形成后信号的相位信息。
&Phi; 1 ( m , &omega; ) = arg [ Real [ X ( m , &omega; ) ] Imag [ X ( m , &omega; ) ] ]
将两者结合,得到初步降噪的频域信号Y,并输出
Y(m,ω)=|X′min(m,ω)]|∠Φ1(m,ω)
7.根据权利要求4所述的双麦克风语音增强方法,其特征在于:步骤S003中,采用如下方法计算每个频带的能量并进行平滑:
E(m,k)=|Y(m,k)|2                       0≤k≤N-1
YE(m,k)=αYE(m-1,k)+(1-α)E(m,k)      0≤k≤N-1
其中,YE(m,k)表示经平滑后的每个频带区间的能量,m表示当前帧的序号,k表示当前的子带的序号,α=0.75表示平滑因子;N为选取的频带总数,E(m,k)表示频带能量值,X(m,k)表示第m帧第k个频带的频域信号;
设初始的噪声能量估计值V(0,k)=0,初始的先验信噪比估计值 S N ^ R prior ( 0 , k ) = 0 ;
由各频带的能量YE(m,k)及前一帧得到的噪声能量估计值V(m-1,k),计算各个频带当前帧的后验信噪比
Figure FDA0000075691550000052
并由前一帧的先验信噪比估计值
Figure FDA0000075691550000053
得到当前帧的先验信噪比估计值;
Figure FDA0000075691550000054
Figure FDA0000075691550000055
表示前一帧最后得到的降噪后语音信号,E{|V(m,k)|2}表示噪声能量估计值,,α为平滑系数;
采用计权噪声估计法对先验信噪比估计值进行修正;
先验信噪比估计值
Figure FDA0000075691550000056
乘以计权因子去qθ,得到修正先验信噪比估计值
Figure FDA0000075691550000057
计权因子计算如下
其中γ1取1.5左右,γ2取200,θz取20;
根据得到的修正先验信噪比估计值
Figure FDA0000075691550000059
计算各个频带的衰减增益q(m,k);
其具体方法为
Figure FDA00000756915500000510
其中,对于不同频带,a为不同的常数;
采用门限判决对所述衰减增益进行调整;
首先以当前帧先验信噪比为判断,小于某一阈值频带的增益系数均乘以某一调整值qmod,这样做可以进一步抑制噪声,
接着将所有小于某阀值的增益系数调整到门限值qfloor,这样做可以避免一定的语音失真;
方法如下:
Figure FDA0000075691550000061
Figure FDA0000075691550000062
其中qmod=0.1,θG=1.2,qfloor=0.01
将当前帧的各频带的带噪语音信号Y(m,k),乘以前面得到的相应频带的衰减增益,得到的就是该频带的增强后的语音信号
Figure FDA0000075691550000063
S ^ ( m , k ) = q ( m , k ) * Y ( m , k ) 0≤k≤N-1
由修正的先验信噪比估计值
Figure FDA0000075691550000065
对当前帧进行判断,判断当前帧是否是噪声;
根据噪声判决结果对各频带的噪声能量估计值进行更新,如果判断为噪声,则噪声能量估计值等于前一帧的值V(m,k)=V(M-1,k),否则采用频带能量YE(m,k),对噪声能量估计值V(m,k)进行更新;
V(m,k)=μV(m-1,k)+(1-μ)E(m,k)
μ表示平滑系数。
将经上述过程处理后的频域信号用前面所述短时傅里叶变换变换成时域信号,将该时域信号经过低通滤波器,H(z)=1+αz-1进行去加重处理,并输出。
CN201110196850XA 2011-07-14 2011-07-14 双麦克风语音增强装置及方法 Pending CN102347028A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201110196850XA CN102347028A (zh) 2011-07-14 2011-07-14 双麦克风语音增强装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201110196850XA CN102347028A (zh) 2011-07-14 2011-07-14 双麦克风语音增强装置及方法

Publications (1)

Publication Number Publication Date
CN102347028A true CN102347028A (zh) 2012-02-08

Family

ID=45545649

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201110196850XA Pending CN102347028A (zh) 2011-07-14 2011-07-14 双麦克风语音增强装置及方法

Country Status (1)

Country Link
CN (1) CN102347028A (zh)

Cited By (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760432A (zh) * 2012-07-06 2012-10-31 广东美的制冷设备有限公司 一种家电用声控遥控器及其控制方法
CN103067821A (zh) * 2012-12-12 2013-04-24 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
CN105091236A (zh) * 2015-08-18 2015-11-25 耿懿超 一种基于语音识别的空调器控制方法及其控制系统
CN105427861A (zh) * 2015-11-03 2016-03-23 胡旻波 智能家居协同麦克风语音控制系统及控制方法
CN106303879A (zh) * 2015-05-28 2017-01-04 钰太芯微电子科技(上海)有限公司 一种基于时域分析的检测装置及检测方法
CN106448703A (zh) * 2014-03-05 2017-02-22 佛山科学技术学院 一种激光反射声源定位方法
CN106448691A (zh) * 2015-08-10 2017-02-22 深圳市潮流网络技术有限公司 一种用于扩音通信系统的语音增强方法
CN106558315A (zh) * 2016-12-02 2017-04-05 深圳撒哈拉数据科技有限公司 异质麦克风自动增益校准方法及系统
CN107045874A (zh) * 2016-02-05 2017-08-15 深圳市潮流网络技术有限公司 一种基于相关性的非线性语音增强方法
CN107371079A (zh) * 2017-04-17 2017-11-21 恒玄科技(上海)有限公司 一种耳机的双麦克降噪系统及降噪方法
CN107464564A (zh) * 2017-08-21 2017-12-12 腾讯科技(深圳)有限公司 语音交互方法、装置及设备
CN107680609A (zh) * 2017-09-12 2018-02-09 桂林电子科技大学 一种基于噪声功率谱密度的双通道语音增强方法
CN107845388A (zh) * 2017-12-25 2018-03-27 青岛海信移动通信技术股份有限公司 语音识别方法及装置
CN107863099A (zh) * 2017-10-10 2018-03-30 成都启英泰伦科技有限公司 一种新型双麦克风语音检测和增强方法
CN107889001A (zh) * 2017-09-29 2018-04-06 恒玄科技(上海)有限公司 可扩展麦克风阵列及其建立方法
CN108597498A (zh) * 2018-04-10 2018-09-28 广州势必可赢网络科技有限公司 一种多麦克风语音采集方法及装置
CN108615535A (zh) * 2018-05-07 2018-10-02 腾讯科技(深圳)有限公司 语音增强方法、装置、智能语音设备和计算机设备
CN108717855A (zh) * 2018-04-27 2018-10-30 深圳市沃特沃德股份有限公司 噪音处理方法与装置
CN108962274A (zh) * 2018-07-11 2018-12-07 会听声学科技(北京)有限公司 一种语音增强方法,装置及耳机
CN108986832A (zh) * 2018-07-12 2018-12-11 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN109036451A (zh) * 2018-07-13 2018-12-18 深圳市小瑞科技股份有限公司 一种基于人工智能的同声翻译终端及其同声翻译系统
CN109616134A (zh) * 2017-10-04 2019-04-12 国光电器股份有限公司 多通道子带处理
CN109901114A (zh) * 2019-03-28 2019-06-18 广州大学 一种适用于声源定位的时延估计方法
CN110268722A (zh) * 2017-02-15 2019-09-20 Jvc建伍株式会社 滤波器生成装置以及滤波器生成方法
CN110289011A (zh) * 2019-07-18 2019-09-27 大连理工大学 一种用于分布式无线声传感器网络的语音增强系统
CN110289009A (zh) * 2019-07-09 2019-09-27 广州视源电子科技股份有限公司 声音信号的处理方法、装置和交互智能设备
CN110310650A (zh) * 2019-04-08 2019-10-08 清华大学 一种基于二阶微分麦克风阵列的语音增强算法
CN110534127A (zh) * 2019-09-24 2019-12-03 华南理工大学 应用于室内环境中的麦克风阵列语音增强方法及装置
CN110660403A (zh) * 2018-06-28 2020-01-07 北京搜狗科技发展有限公司 一种音频数据处理方法、装置、设备及可读存储介质
CN110660405A (zh) * 2019-09-24 2020-01-07 上海优扬新媒信息技术有限公司 一种语音信号的提纯方法及装置
WO2020103035A1 (zh) * 2018-11-21 2020-05-28 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
CN111210836A (zh) * 2020-03-09 2020-05-29 成都启英泰伦科技有限公司 一种麦克风阵列波束形成动态调整方法
CN112216298A (zh) * 2019-07-12 2021-01-12 大众问问(北京)信息科技有限公司 双麦克风阵列声源定向方法、装置及设备
CN112735461A (zh) * 2020-12-29 2021-04-30 西安讯飞超脑信息科技有限公司 拾音方法以及相关装置、设备
CN112735459A (zh) * 2019-10-28 2021-04-30 清华大学 基于分布式麦克风的语音信号增强方法、服务器及系统
CN113689875A (zh) * 2021-08-25 2021-11-23 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN113838472A (zh) * 2021-08-24 2021-12-24 盛景智能科技(嘉兴)有限公司 一种语音降噪方法及装置
CN114023352A (zh) * 2021-11-12 2022-02-08 华南理工大学 一种基于能量谱深度调制的语音增强方法及装置
CN115474117A (zh) * 2022-11-03 2022-12-13 深圳黄鹂智能科技有限公司 基于三麦克风的收音方法和收音装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004188A2 (en) * 2005-07-06 2007-01-11 Koninklijke Philips Electronics N.V. Apparatus and method for acoustic beamforming
CN101894563A (zh) * 2010-07-15 2010-11-24 瑞声声学科技(深圳)有限公司 语音增强的方法
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN102074245A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及语音增强方法
CN102074246A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007004188A2 (en) * 2005-07-06 2007-01-11 Koninklijke Philips Electronics N.V. Apparatus and method for acoustic beamforming
CN101976565A (zh) * 2010-07-09 2011-02-16 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法
CN101894563A (zh) * 2010-07-15 2010-11-24 瑞声声学科技(深圳)有限公司 语音增强的方法
CN102074245A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及语音增强方法
CN102074246A (zh) * 2011-01-05 2011-05-25 瑞声声学科技(深圳)有限公司 基于双麦克风语音增强装置及方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
《中国优秀硕士学位论文全文数据库 信息科技辑》 20070315 苏先礼 语音去混响研究 1,6-7,27-33,46-50 1-7 , 第3期 *

Cited By (66)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102760432B (zh) * 2012-07-06 2015-08-19 广东美的制冷设备有限公司 一种家电用声控遥控器及其控制方法
CN102760432A (zh) * 2012-07-06 2012-10-31 广东美的制冷设备有限公司 一种家电用声控遥控器及其控制方法
CN103067821A (zh) * 2012-12-12 2013-04-24 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
WO2014089914A1 (zh) * 2012-12-12 2014-06-19 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
CN103067821B (zh) * 2012-12-12 2015-03-11 歌尔声学股份有限公司 一种基于双麦克的语音混响消减方法和装置
US9414157B2 (en) 2012-12-12 2016-08-09 Goertek, Inc. Method and device for reducing voice reverberation based on double microphones
CN106448703A (zh) * 2014-03-05 2017-02-22 佛山科学技术学院 一种激光反射声源定位方法
CN106303879B (zh) * 2015-05-28 2024-01-16 钰太芯微电子科技(上海)有限公司 一种基于时域分析的检测装置及检测方法
CN106303879A (zh) * 2015-05-28 2017-01-04 钰太芯微电子科技(上海)有限公司 一种基于时域分析的检测装置及检测方法
CN106448691A (zh) * 2015-08-10 2017-02-22 深圳市潮流网络技术有限公司 一种用于扩音通信系统的语音增强方法
CN106448691B (zh) * 2015-08-10 2020-12-11 深圳市潮流网络技术有限公司 一种用于扩音通信系统的语音增强方法
CN105091236A (zh) * 2015-08-18 2015-11-25 耿懿超 一种基于语音识别的空调器控制方法及其控制系统
CN105427861B (zh) * 2015-11-03 2019-02-15 胡旻波 智能家居协同麦克风语音控制的系统及其控制方法
CN105427861A (zh) * 2015-11-03 2016-03-23 胡旻波 智能家居协同麦克风语音控制系统及控制方法
CN107045874A (zh) * 2016-02-05 2017-08-15 深圳市潮流网络技术有限公司 一种基于相关性的非线性语音增强方法
CN106558315A (zh) * 2016-12-02 2017-04-05 深圳撒哈拉数据科技有限公司 异质麦克风自动增益校准方法及系统
CN110268722B (zh) * 2017-02-15 2021-04-20 Jvc建伍株式会社 滤波器生成装置以及滤波器生成方法
CN110268722A (zh) * 2017-02-15 2019-09-20 Jvc建伍株式会社 滤波器生成装置以及滤波器生成方法
CN107371079A (zh) * 2017-04-17 2017-11-21 恒玄科技(上海)有限公司 一种耳机的双麦克降噪系统及降噪方法
CN107464564A (zh) * 2017-08-21 2017-12-12 腾讯科技(深圳)有限公司 语音交互方法、装置及设备
CN107680609A (zh) * 2017-09-12 2018-02-09 桂林电子科技大学 一种基于噪声功率谱密度的双通道语音增强方法
CN107889001A (zh) * 2017-09-29 2018-04-06 恒玄科技(上海)有限公司 可扩展麦克风阵列及其建立方法
CN109616134A (zh) * 2017-10-04 2019-04-12 国光电器股份有限公司 多通道子带处理
CN107863099A (zh) * 2017-10-10 2018-03-30 成都启英泰伦科技有限公司 一种新型双麦克风语音检测和增强方法
CN107863099B (zh) * 2017-10-10 2021-03-26 成都启英泰伦科技有限公司 一种新型双麦克风语音检测和增强方法
CN107845388A (zh) * 2017-12-25 2018-03-27 青岛海信移动通信技术股份有限公司 语音识别方法及装置
CN107845388B (zh) * 2017-12-25 2021-06-01 青岛海信移动通信技术股份有限公司 语音识别方法及装置
CN108597498A (zh) * 2018-04-10 2018-09-28 广州势必可赢网络科技有限公司 一种多麦克风语音采集方法及装置
CN108717855B (zh) * 2018-04-27 2020-07-28 深圳市沃特沃德股份有限公司 噪音处理方法与装置
CN108717855A (zh) * 2018-04-27 2018-10-30 深圳市沃特沃德股份有限公司 噪音处理方法与装置
CN108615535B (zh) * 2018-05-07 2020-08-11 腾讯科技(深圳)有限公司 语音增强方法、装置、智能语音设备和计算机设备
CN108615535A (zh) * 2018-05-07 2018-10-02 腾讯科技(深圳)有限公司 语音增强方法、装置、智能语音设备和计算机设备
CN110660403A (zh) * 2018-06-28 2020-01-07 北京搜狗科技发展有限公司 一种音频数据处理方法、装置、设备及可读存储介质
CN110660403B (zh) * 2018-06-28 2024-03-08 北京搜狗科技发展有限公司 一种音频数据处理方法、装置、设备及可读存储介质
CN108962274A (zh) * 2018-07-11 2018-12-07 会听声学科技(北京)有限公司 一种语音增强方法,装置及耳机
CN108986832A (zh) * 2018-07-12 2018-12-11 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN108986832B (zh) * 2018-07-12 2020-12-15 北京大学深圳研究生院 基于语音出现概率和一致性的双耳语音去混响方法和装置
CN109036451A (zh) * 2018-07-13 2018-12-18 深圳市小瑞科技股份有限公司 一种基于人工智能的同声翻译终端及其同声翻译系统
CN113168843B (zh) * 2018-11-21 2022-04-22 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
CN113168843A (zh) * 2018-11-21 2021-07-23 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
WO2020103035A1 (zh) * 2018-11-21 2020-05-28 深圳市欢太科技有限公司 音频处理方法、装置、存储介质及电子设备
CN109901114A (zh) * 2019-03-28 2019-06-18 广州大学 一种适用于声源定位的时延估计方法
CN109901114B (zh) * 2019-03-28 2020-10-27 广州大学 一种适用于声源定位的时延估计方法
CN110310650A (zh) * 2019-04-08 2019-10-08 清华大学 一种基于二阶微分麦克风阵列的语音增强算法
CN110289009A (zh) * 2019-07-09 2019-09-27 广州视源电子科技股份有限公司 声音信号的处理方法、装置和交互智能设备
CN110289009B (zh) * 2019-07-09 2021-06-15 广州视源电子科技股份有限公司 声音信号的处理方法、装置和交互智能设备
CN112216298A (zh) * 2019-07-12 2021-01-12 大众问问(北京)信息科技有限公司 双麦克风阵列声源定向方法、装置及设备
CN112216298B (zh) * 2019-07-12 2024-04-26 大众问问(北京)信息科技有限公司 双麦克风阵列声源定向方法、装置及设备
CN110289011A (zh) * 2019-07-18 2019-09-27 大连理工大学 一种用于分布式无线声传感器网络的语音增强系统
CN110289011B (zh) * 2019-07-18 2021-06-25 大连理工大学 一种用于分布式无线声传感器网络的语音增强系统
CN110534127A (zh) * 2019-09-24 2019-12-03 华南理工大学 应用于室内环境中的麦克风阵列语音增强方法及装置
CN110660405B (zh) * 2019-09-24 2022-09-23 度小满科技(北京)有限公司 一种语音信号的提纯方法及装置
CN110660405A (zh) * 2019-09-24 2020-01-07 上海优扬新媒信息技术有限公司 一种语音信号的提纯方法及装置
CN112735459B (zh) * 2019-10-28 2024-03-26 清华大学 基于分布式麦克风的语音信号增强方法、服务器及系统
CN112735459A (zh) * 2019-10-28 2021-04-30 清华大学 基于分布式麦克风的语音信号增强方法、服务器及系统
CN111210836A (zh) * 2020-03-09 2020-05-29 成都启英泰伦科技有限公司 一种麦克风阵列波束形成动态调整方法
CN111210836B (zh) * 2020-03-09 2023-04-25 成都启英泰伦科技有限公司 一种麦克风阵列波束形成动态调整方法
CN112735461A (zh) * 2020-12-29 2021-04-30 西安讯飞超脑信息科技有限公司 拾音方法以及相关装置、设备
CN112735461B (zh) * 2020-12-29 2024-06-07 西安讯飞超脑信息科技有限公司 拾音方法以及相关装置、设备
CN113838472A (zh) * 2021-08-24 2021-12-24 盛景智能科技(嘉兴)有限公司 一种语音降噪方法及装置
CN113689875A (zh) * 2021-08-25 2021-11-23 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN113689875B (zh) * 2021-08-25 2024-02-06 湖南芯海聆半导体有限公司 一种面向数字助听器的双麦克风语音增强方法和装置
CN114023352B (zh) * 2021-11-12 2022-12-16 华南理工大学 一种基于能量谱深度调制的语音增强方法及装置
CN114023352A (zh) * 2021-11-12 2022-02-08 华南理工大学 一种基于能量谱深度调制的语音增强方法及装置
CN115474117A (zh) * 2022-11-03 2022-12-13 深圳黄鹂智能科技有限公司 基于三麦克风的收音方法和收音装置
CN115474117B (zh) * 2022-11-03 2023-01-10 深圳黄鹂智能科技有限公司 基于三麦克风的收音方法和收音装置

Similar Documents

Publication Publication Date Title
CN102347028A (zh) 双麦克风语音增强装置及方法
CN109727604B (zh) 用于语音识别前端的频域回声消除方法及计算机储存介质
CN101976565A (zh) 基于双麦克风语音增强装置及方法
CN103730125B (zh) 一种回声抵消方法和设备
CN102074246B (zh) 基于双麦克风语音增强装置及方法
CN101976566B (zh) 语音增强方法及应用该方法的装置
US8010355B2 (en) Low complexity noise reduction method
CN101916567B (zh) 应用于双麦克风系统的语音增强方法
CN102074245A (zh) 基于双麦克风语音增强装置及语音增强方法
DK2608197T3 (en) Method, device and system for noise reduction in multi-microphone array
JP4161628B2 (ja) エコー抑圧方法及び装置
US8521530B1 (en) System and method for enhancing a monaural audio signal
US9992572B2 (en) Dereverberation system for use in a signal processing apparatus
CN102739886B (zh) 基于回声频谱估计和语音存在概率的立体声回声抵消方法
CN102347027A (zh) 双麦克风语音增强装置及其语音增强方法
EP3080975B1 (en) Echo cancellation
CN102740214B (zh) 一种基于反馈信号频谱估计的啸叫抑制方法
CN101894563A (zh) 语音增强的方法
CN108376548B (zh) 一种基于麦克风阵列的回声消除方法与系统
EP4071757A1 (en) Echo cancellation method and device
CN103428385A (zh) 用于处理音频信号的方法及用于处理音频信号的电路布置
US9390718B2 (en) Audio signal restoration device and audio signal restoration method
US9245538B1 (en) Bandwidth enhancement of speech signals assisted by noise reduction
CN105679330A (zh) 基于改进子带信噪比估计的数字助听器降噪方法
US20200082839A1 (en) Method And Device For Equalizing Audio Signals

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120208