[go: up one dir, main page]

CN101335001A - 一种dtx判决方法和装置 - Google Patents

一种dtx判决方法和装置 Download PDF

Info

Publication number
CN101335001A
CN101335001A CNA2008100843191A CN200810084319A CN101335001A CN 101335001 A CN101335001 A CN 101335001A CN A2008100843191 A CNA2008100843191 A CN A2008100843191A CN 200810084319 A CN200810084319 A CN 200810084319A CN 101335001 A CN101335001 A CN 101335001A
Authority
CN
China
Prior art keywords
band
signal
characteristic information
variable quantity
band signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2008100843191A
Other languages
English (en)
Other versions
CN100555414C (zh
Inventor
代金良
艾雅·舒默特
张德明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Huawei Technologies Co Ltd
Original Assignee
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Huawei Technologies Co Ltd filed Critical Huawei Technologies Co Ltd
Priority to CNB2008100843191A priority Critical patent/CN100555414C/zh
Priority to PCT/CN2008/072774 priority patent/WO2009056035A1/zh
Priority to EP08844412.0A priority patent/EP2202726B1/en
Priority to AU2008318143A priority patent/AU2008318143B2/en
Publication of CN101335001A publication Critical patent/CN101335001A/zh
Application granted granted Critical
Publication of CN100555414C publication Critical patent/CN100555414C/zh
Priority to US12/763,573 priority patent/US9047877B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本发明公开了一种DTX判决方法,包括以下步骤:根据输入的信号获取分带信号;获取每一所述分带信号的特征信息变化量;根据每一所述分带信号的特征信息变化量进行DTX判决。本发明还公开了一种DTX判决装置。通过使用本发明,全面利用语音编解码带宽内的噪声特性,使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果,从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。

Description

一种DTX判决方法和装置
技术领域
本发明涉及信号处理技术领域,尤其涉及一种DTX(DiscontinuousTransmission System,非连续传输系统)判决方法和装置。
背景技术
语音编码技术可以压缩语音信号的传输带宽,增加通信系统的容量。由于语音通信中只有大约40%是包含语音的,其它时间都是静音或背景噪声,为了进一步节省传输带宽,DTX/CNG(Comfortable Noise Generation,舒适噪声生成)技术应运而生。该技术使得编码器可以对背景噪声信号采用不同于语音信号的编解码算法,降低了平均码率。简单说来,DTX/CNG技术就是在编码端对背景噪声段进行编码时,不需要像语音帧那样进行全速率的编码,也不需要对每一帧背景噪声进行编码,而是相隔若干帧才发送一次相比于语音帧更少量的编码参数(SID帧)即可;而在解码端,则根据接收到的非连续的背景噪声帧的参数,恢复出连续的背景噪声,并且不会明显影响主观听觉质量。
非连续的背景噪声编码帧通常称为SID(Silence Insertion Descriptor,静音插入描述)帧,SID帧中一般只包含谱参数和信号能量参数,相对于语音编码帧没有固定码本、自适应码本等相关参数,并且SID帧不会连续传输,从而降低了平均码率。背景噪声编码阶段,一般是通过提取出的噪声参数进行检测,确定是否需要发送SID帧。这一过程可以称为DTX(DiscontinuousTransmission,不连续发射)判决,DTX判决的输出是“1”或“0”,表示需要或不需要发送SID帧。DTX判决的结果也反映出了当前噪声的性质是否出现了明显的变化。
G.729.1是ITU最新发布的新一代语音编解码标准,这种嵌入式语音编解码标准最大的特点是具有分层编码的特性,能够提供码率范围在8kb/s~32kb/s的窄带到宽带的音频质量,允许在传输过程中,根据信道状况丢弃外层码流,具有良好的信道自适应性。
在G.729.1标准中,通过将码流构造成嵌入式的分层结构来达到分级性,其核心层使用G.729标准进行编码,是一种新型的嵌入式可分层的多速率语音编解码器编码器。G.729.1各层编码器系统框图如图1所示。输入为20ms的超帧,当采样率为16000Hz,帧长为320点,输入信号sWB(n)首先经过QMF滤波(H1(z),H2(z))分成两个子带,低子带信号sLB qmf(n)经过50Hz截止频率的高通滤波器进行预处理,输出信号sLB(n)使用8kb/s~12kb/s的窄带嵌入式CELP编码器进行编码,sLB(n)和12Kb/s码率下CELP编码器的本地合成信号
Figure A20081008431900091
之间的差值信号dLB(n)经过知觉加权滤波(WLB(z))后的信号dLB w(n)通过MDCT变换到频域。加权滤波器WLB(z)包含了增益补偿,用来保持滤波器输出dLB w(n)与高子带输入信号sHB(n)之间的谱连续性。加权后的差值信号要变换到频域内。
高子带分量乘上(-1)n进行谱反转之后的信号sHB fold(n)通过截止频率为3000HZ的低通滤波器进行预处理,滤波后的信号sHB(n)使用TDBWE编码器进行编码。进入TDAC编码模块的sHB(n)也要先使用MDCT变换到频域上。
两组MDCT系数DLB w(k)和SHB(k)最后使用TDAC进行编码。另外,还有一些参数用FEC(丢帧错误隐蔽)编码器进行传输,用以改进在传输中出现丢帧时造成的错误。
G.729.1编码器编码出的全速率码流共有12层,核心层速率为8kb/s,是G.729的码流;低带增强层编码速率为12kb/s,是对核心层固定码本编码的增强,12kb/s与8kb/s都对应着窄带的信号分量;编码速率为14kb/s的层采用TDBWE编码器,对应的是宽带信号分量;从16kb/s~32kb/s是对全带信号的增强编码。
3GPP(the 3rd Generation Partner Project,第三代合作伙伴计划)的语音编解码标准AMR(Adaptive Multi-Rate,自适应多码率声码器)采用的DTX策略是在语音段结束时,使用一个只有1比特有效数据的SID_FIRST帧表示噪声段的开始,在SID_FIRST帧之后第三帧发送第一个包含具体噪声信息的SID_UPDATE帧,以后按照固定间隔每8帧发送一次SID_UPDATE帧。只有SID_UPDATE帧包含有舒适噪声参数的编码数据。
AMR中使用固定间隔发送SID帧的策略无法根据噪声的实际特性自适应地发送SID帧,即无法保证在必需的时候才发送SID帧。在实际通信系统中使用该方法的缺点在于,一方面,噪声特性已经发生明显变化,但是由于没有发送SID帧,解码端无法及时得到已经变化的噪声信息;另一方面,到了可以发送SID帧的时候,可能噪声特性在相当长一段时间内(大于8帧)维持稳定,并不需要发送SID帧,这样就造成了带宽的浪费。
ITU(International Telecom Union,国际电信联盟)的语音编码标准-共轭结构代数码本激励线性预测声码器(G.729)定义的静音压缩方案中,在编码端的DTX策略使用的是根据窄带噪声参数的变化情况,自适应地确定是否发送SID,前后两帧SID的间隔最小为20毫秒,最大则不限。该方法的缺点在于,仅利用了从窄带信号中提取出的能量参数和谱参数来指导DTX判决,而没有使用宽带分量的信息,因此对于宽带语音应用场景可能无法给出全面恰当的DTX判决结果。
另外,随着宽带语音编码器的日益广泛应用,以及超宽带技术的逐步发展,类似G.729.1这样的嵌入式分层结构的宽带声码器标准已经发布并走向应用。在这种分层结构的宽带声码器中,上述AMR中的DTX机制以及ITU中的G.729无法最大限度地利用噪声窄带和宽带分量的信息,可能无法给出全面反映实际噪声性质的DTX判决结果,也就无法体现分层编码的优势。
发明内容
本发明的实施例提供一种DTX判决方法和装置,用于实现对噪声信号的分带及分层处理,得到全面合理的DTX判决结果。
为达到上述目的,本发明的实施例提供一种DTX判决方法,包括以下步骤:
根据输入的信号获取分带信号;
获取每一所述分带信号的特征信息变化量;
根据每一所述分带信号的特征信息变化量进行DTX判决。
本发明的实施例还提供一种DTX判决装置,包括:
分带模块,用于根据输入的信号获取分带信号;
特征信息变化量获取模块,用于获取所述分带模块分带后每一分带信号的特征信息变化量;
判决模块,用于根据所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行DTX判决。
与现有技术相比,本发明的实施例具有以下优点:
通过全面利用语音编解码带宽内的噪声特性,使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果,从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。
附图说明
图1是现有技术中G.729.1各层编码器系统框图;
图2是本发明的实施例一中一种DTX判决方法的流程图;
图3是本发明的实施例五中一种DTX判决装置的结构示意图;
图4是本发明的实施例五中DTX判决装置的低带特征信息变化量获取子模块的结构示意图;
图5是本发明的实施例五中DTX判决装置的使用场景示意图;
图6是本发明的实施例五中DTX判决装置的另一使用场景示意图。
具体实施方式
本发明的实施例一中,一种DTX判决方法如图1所示,包括以下步骤:
步骤s101、对输入的信号进行分带。
该步骤中,当输入的信号为宽带信号时,可以将该宽带信号分成低带和高带两个子带;当输入的信号为超宽带信号时,可以将该超宽带信号一次分为低带、高带和超高带信号;或先分为超高带信号和宽带信号,再将宽带信号分为低带和高带信号。对于低带信号,可以进一步分为低带核心层信号和低带增强层信号;对于高带信号,可以进一步分为高带核心层信号和高带增强层信号。该分带可以通过QMF(Quadrature Mirror Filter,正交镜像滤波器组)实现。具体的划分标准可以为:窄带信号是指频带0~4000Hz的信号,宽带信号是指频带在0~8000Hz的信号,超宽带信号是指频带在0~16000Hz的信号。窄带或低带(宽带分量)信号均指0~4000Hz的信号,高带(宽带分量)信号是指4000~8000Hz的信号,超高带(超宽带分量)信号是指8000~16000Hz的信号。
该步骤前还包括:当VAD(Voice Activity Detector,语音激活检测)功能检测到信号从语音变为噪声后,编码算法进入拖尾阶段。在拖尾阶段,编码器仍然按照语音帧编码算法对输入的信号进行编码,其主要作用是估计噪声的特性,对后续的噪声编码算法进行初始化。拖尾阶段结束后启动噪声编码,对输入的信号进行分带。
步骤s102、获取每一分带信号的特征信息和特征信息变化量。
具体的,对于低带信号,特征信息包括低带信号的能量信息和谱信息,可以通过使用线性预测分析模型获取。
对于高带信号和超高带信号,特征信息包括时域包络信息和频域包络信息,可以通过TDBWE(Time Domain Band Width Extension,时域带宽扩展)编码算法获取。
根据获取的分带内信号的特征信息,与过去时刻获取的分带内信号的特征信息进行比较,可以得到分带内信号的变化度量。
步骤s103、根据获取的分带信号的特征信息变化量进行DTX判决。
对于宽带信号,将低带噪声特性变化度量和高带噪声特性变化度量进行综合作为宽带的DTX判决结果;对于超宽带信号,将宽带信号特性变化度量和超高带信号特性变化度量进行综合作为整个超宽带的DTX判决结果。
假设将输入的噪声信号的全速率的编码信息分为低带核心层、低带增强层、高带核心层、高带增强层和超高带层,对应的编码速率依次增大。则噪声分层结构可以映射为实际的编码速率。
如果实际编码仅涉及低带核心层,则DTX判决仅计算低带核心层对应的特征信息变化量,如果判决函数值大于一定阈值,则发送SID帧,否则不发。
如果实际编码到了低带增强层,则DTX判决可以使用低带核心层及低带增强层的特征信息变化量进行联合判决,如果判决函数值大于一定阈值,则发送SID帧,否则不发。
如果实际编码到高带核心层,则使用低带分量的联合特征信息变化量与高带核心层对应的特征信息变化量进行综合DTX判决,如果判决函数值大于一定阈值,则发送SID帧,否则不发。
如果实际编码到了高带增强层,则使用低带分量的联合特征信息变化量与宽带分量的联合特征信息变化量进行综合DTX判决,如果判决函数值大于一定阈值,则发送SID帧,否则不发。
如果实际编码到了超高带,那么可以使用全带信号的联合特征信息变化量进行DTX判决,如果判决函数值大于一定阈值,则发送SID帧,否则不发。
基于上述描述,全带信号的特征信息变化量可用式(1)表示:
J=αJ1+βJ2+γJ3    (1)
根据该式,可以得到DTX判决的第一种方法:
其中,α+β+γ=1,J1,J2,J3分别表示计算出的低带、高带和超高带的特诊信息变化量。则DTX判决规则如式(2)表示,当J>1时,DTX判决输出dtx_flag为1,表示需要对噪声帧编码信息进行传输;否则dtx_flag为0,表示不需要对噪声帧编码信息进行传输:
dtx _ flag = 1 J > 1 dtx _ flag = 0 J ≤ 1 - - - ( 2 )
当只需要编码到低带核心层或低带增强层时,则式(1)简化为
J=J1          (3)
当需要编码到高带核心层或高带增强层时,式(1)简化为
J=αJ1+βJ2    (4)
其中,α+β=1。
当然也可以使用另外的DTX判决方式,如以下的第二种DTX判决方法:
使用J1,J2,J3分别表示计算出的低带、高带和超高带的特征信息变化量:
当编码到低带核心层或低带增强层时,同公式(3),使用J1作为DTX判决标准;
当需要编码到高带核心层或高带增强层时,使用J1和J2作为DTX判决标准,当J1和J2均小于1时,DTX判决输出dtx_flag为0,表示不需要对噪声帧编码信息进行传输;当J1和J2均大于1时,DTX判决输出dtx_flag为1,表示需要对噪声帧编码信息进行传输;当J1和J2不同时大于1或小于1时,按照公式(4)将J=αJ1+βJ2作为DTX判决标准;
当需要编码到超高带时,使用J1、J2和J3作为DTX判决标准,当J1、J2和J3均小于1时,DTX判决输出dtx_flag为0,表示不需要对噪声帧编码信息进行传输;当J1、J2和J3均大于1时,DTX判决输出dtx_flag为1,表示需要对噪声帧编码信息进行传输;当J1、J2和J3不同时大于1或小于1时,按照公式(1)将J=αJ1+βJ2+γJ3作为DTX判决标准。
上述两种方法都可以用于DTX的判决输出。
以下结合具体的应用场景,对本发明实施例的实施方式作进一步描述。
本发明的实施例二中,以对输入的宽带信号进行的DTX判决为例,说明本发明中一种DTX判决方法的实施方式。
本实施例中使用的SID帧的结构如表1所示:
表1:SID帧的比特分配
Figure A20081008431900141
系统工作在16k采样率,输入信号带宽8kHz。SID帧的全速率帧包含3层,分别是低带核心层、低带增强层和高带核心层。低带核心层使用的编码参数与G.729附录B中的SID帧编码参数基本类似,分别是对能量参数采用5比特进行量化,对于谱参数LSF采用10比特进行量化;低带增强层是在低带核心层的基础上,对能量和谱参数的量化误差进行进一步量化,也就是说对能量采用第二级量化,对谱采用第三级量化,其中能量的第二级量化使用3比特,谱的第三级量化使用6比特;高带核心层采用类似G.729.1中TDBWE算法中的编码参数,不过将16点时域包络简化为1个时域能量增益,使用6比特进行量化,频域包络仍然是12个,分裂为3个矢量共使用14比特进行量化。
首先对输入的信号进行分带,即分成高低两个子带,低带频率范围为0~4kHz,高带频率范围为4kHz~8kHz。具体的,使用QMF滤波器组对输入的16kHz采样率的信号sWB(n)进行分带,低通滤波器H1(z)是一个64抽头的对称的FIR滤波器,高通滤波器H2(z)可以由H1(z)得到:
h2(n)=(-1)nh1(n)    (5)
则窄带分量可由式(6)得到:
y l ( n ) = Σ j = 0 31 h 1 ( j ) [ s WB ( n + 1 + j ) + s WB ( n - j ) ] - - - ( 6 )
宽带分量可由式(7)得到:
y h ( n ) = Σ j = 0 31 h 2 ( j ) [ s WB ( n + 1 + j ) + s WB ( n - j ) ] - - - ( 7 )
低带分量yl(n)进行LPC分析,得到LPC系数ai(i=1...M),M是LPC分析的阶数,以及残差能量参数E;缓存区中保存上一个SID帧量化后的LPC系数asid q(i)和残差能量Esid q
如果编码器只需要编码到低带核心层或低带增强层,则DTX判决仅需要针对低带分量进行即可。
利用式(8)计算出低带的变化量J1
J 1 = w 1 * | E t q - E sid q | thr 1 + w 2 * Σ i = 0 M R sid q ( i ) · R t ( i ) E t q · thr 2 - - - ( 8 )
其中w1,w2分别表示对能量变化和谱变化的加权系数,Et q,Esid q分别表示当前帧和上一个SID帧量化后的能量参数,Rt(i)为当前帧窄带信号分量的自相关系数,thr1,thr2是常数,分别表示能量参数和谱参数变化的阈值,该阈值反映了人耳对能量和谱变化的敏感程度,M是线性预测的阶数,Rsid q(i)由上一个SID帧量化后的LPC系数用式(9)计算得到:
R sid q ( j ) = 2 Σ k = 0 M - j a sid q ( k ) × a sid q ( k + j ) , j ≠ 0 R sid q ( 0 ) = Σ k = 0 M ( a sid q ( k ) ) 2 , j = 0 - - - ( 9 )
则可以利用式(8)计算出低带信号的变化量,并利用式(3)和式(2)得到DTX判决结果。
由于本实施例中低带核心层和低带增强层使用的参数完全相同,增强层仅仅是对核心层的参数进行了进一步量化,因此如果编码速率达到了低带增强层,DTX判决的过程与式(8)和式(9)基本相同,只是使用的能量参数和谱参数是增强层中的量化结果,这里对此判决过程不做重复描述。
如果编码器需要编码高带核心层,则除了要按照式(8)计算出J1以外,还要计算出宽带的变化量J2。宽带部分用简化的TDBWE编码算法对宽带信号分量提取出时域包络和频域包络进行编码。其中时域包络由式(10)计算:
T env = 1 2 log 2 Σ n = 0 N - 1 y h ( n ) 2 - - - ( 10 )
其中,N为帧长,在G.729.1中N=160。
频域包络由式(11)、式(12)、式(13)和式(14)计算得到。首先使用一个128抽头的汉宁窗对宽带信号进行加窗,窗函数表达式如式(11)所示:
w F ( n ) = 1 2 ( 1 - cos ( 2 πn 143 ) ) , n = 0 , · · · , 71 1 2 ( 1 - cos ( 2 π ( n - 16 ) 111 ) ) , n = 72 , · · · , 127 - - - ( 11 )
加窗后的信号为:
y h w ( n ) = y h ( n ) · w F ( n + 31 ) , n=-31,…,96                  (12)
对加窗后的信号进行128点的FFT,使用多项结构实现:
Y h fft ( k ) = FFT 64 ( y h w ( n ) + y h w ( n + 64 ) ) , k=0,…,63,n=-31,…,32    (13)
利用计算出的FFT系数求取加权的频域包络:
F env ( j ) = 1 2 log 2 ( Σ k = 2 j 2 ( j + 1 ) W F ( k - 2 j ) · | S HB fft ( k ) | 2 ) , j=0,…,11                    (14)
内存中缓存了上一个SID帧的量化后的时域包络Tenvsid q和频域包络Fenvsid q(j),则当前帧宽带分量相比于上一个SID帧的变化量可用式(15a)或(15b)计算得到:
J 2 = w 3 * | T env - Tenv sid q | thr 3 + w 4 * Σ i = 0 11 F env ( i ) · Fenv sid q ( i ) thr 4 - - - ( 15 a )
或:
J 2 = w 3 * | T env - Tenv sid q | thr 3 + w 4 * Σ i = 0 11 | F env ( i ) - Fenv sid q ( i ) | thr 4 - - - ( 15 b )
分别得到窄带的变化量J1和宽带的变化量J2,则窄带和宽带的联合变化量可以用式(4)求得。利用式(2)所示的判决规则,即可判决出当前帧是否需要编码发送SID帧。
本发明的实施例三中,以对输入的超宽带信号进行的DTX判决为例,说明本发明中一种DTX判决方法的实施方式。
本实施例处理的信号为32kHz采样,经过分带处理分别得到低带、高带和超高带噪声分量。对于分带处理,可以给予树形结构实现,即经过一次QMF分成超高带和宽带信号,再经过一次QMF将宽带信号分成低带和高带信号;也可以基于一个非等宽子带滤波器组直接将输入信号分成低带、高带和超高带信号分量。显然,树形结构的分带器具有更好的可扩展性能。分带得到的窄带和宽带信息可以输入到实施例二的系统进行宽带DTX判决,并最终得到(4)式所示的宽带噪声特征信息变化度量J,对于本实施例就是联合超宽带噪声特征信息变化量Js及宽带的J得到全带噪声特征变化度量Ja,如(16)式所示:
Ja=γ·J+ξJs    (16)
利用全带的噪声特征变化度量Ja进行DTX判决,输出全带DTX判决结果dtx_flag,如(17)式所示:
dtx _ flag = 1 J a > 1 dtx _ flag = 0 J a ≤ 1 - - - ( 17 )
其中γ+ξ=1。
下面叙述超高带噪声特性变化度量Js,本实施例中使用的SID帧低带和高带部分的结构如表1中所示,不做重复描述;超高带部分的结构如表2所示:
表2:SID帧超高带比特分配
Figure A20081008431900182
超高带的时域能量包络由式(19)式计算得到:
T env = 1 2 log 2 ( Σ n = 0 N - 1 y s ( n ) 2 ) - - - ( 19 )
其中N在20ms帧处理时为320,ys为超高带信号。对于频域包络Fenvs(j)的计算类似高带的频域包络计算,不同的是频谱宽度不一样,因此频域包络的点数也可以不一样,如式(20)所示:
Fenv s = 1 2 log 2 ( Σ k = 20 · j 20 · j + 19 W F s ( k - 20 · j ) · | Y s ( k ) | 2 ) - - - ( 20 )
其中Ys为超高带频谱,可以通过FFT(Fast Fourier Transform,快速傅里叶变换)计算,也可以通过MDCT(Modified Discrete Cosine Transform,改进型离散余弦变换)计算,式(20)中是以320点频谱宽度为例的,并且计算频域包络为8Khz~14KHz共280个频点。为了量化的方便,仍然可以将频域包络分裂为3个子矢量进行量化。
内存中缓存了上一个SID帧的量化后的超高带时域包络Tenvsid q和频域包络Fenvsid q(j),则当前帧超高带分量相比于上一个SID帧的变化量可用式(21a)或(21b)计算得到:
J s = w 5 * | T env s - Tenv sid s ( q ) | thr 5 + w 6 * Σ i = 0 11 F env s ( i ) · Fenv sid s ( q ) ( i ) thr 6 - - - ( 21 )
或:
J s = w 5 * | T env s - Tenv sid s ( q ) | thr 5 + w 6 * Σ i = 0 11 | F env s ( i ) - Fenv sid s ( q ) ( i ) | thr 6 - - - ( 21 b )
再用式(16)计算全带噪声特征变化度量。再利用式(17)所示的判决规则,即可判决出当前帧是否需要编码发送SID帧。
上述实施例二和实施例三中所涉及的DTX判决流程,使用的均为实施例一的步骤s103中描述的第一种DTX判决方法。对于实施例二和实施例三,也可以使用实施例一的步骤s103中描述的第二种DTX判决方法,具体的判决过程于上述实施例二和实施例三种描述的过程相似,在此不进行重复描述。
本发明的实施例四中,以对输入的宽带信号进行的DTX判决为例,说明本发明中一种DTX判决方法的实施方式。
本实施例中使用的SID帧的结构如表3所示:
表3:SID帧的比特分配
Figure A20081008431900193
Figure A20081008431900201
系统工作在16k采样率,输入信号带宽8kHz。SID帧的全速率帧包含3层,分别是低带核心层、低带增强层和高带核心层。低带核心层使用的编码参数与G.729附录B中的SID帧编码参数基本类似,分别是对能量参数采用5比特进行量化,对于谱参数LSF采用10比特进行量化;低带增强层是在低带核心层的基础上,对能量和谱参数的量化误差进行进一步量化,也就是说对能量采用第二级量化,对谱采用第三级量化,其中能量的第二级量化使用3比特,谱的第三级量化使用6比特;高带核心层采用类似G.729.1中TDBWE算法中的编码参数,不过将16点时域包络简化为1个时域能量增益,使用6比特进行量化,频域包络仍然是12个,分裂为3个矢量共使用14比特进行量化。
首先对输入的信号进行分带,即分成高低两个子带,低带频率范围为0~4kHz,高带频率范围为4kHz~8kHz。具体的,使用QMF滤波器组对输入的16kHz采样率的信号sWB(n)进行分带,低通滤波器H1(z)是一个64抽头的对称的FIR滤波器,高通滤波器H2(z)可以由H1(z)得到:
h2(n)=(-1)nh1(n)    (22)
则窄带分量可由式(23)得到:
y l ( n ) = Σ j = 0 31 h 1 ( j ) [ s WB ( n + 1 + j ) + s WB ( n - j ) ] - - - ( 23 )
宽带分量可由式(24)得到:
y h ( n ) = Σ j = 0 31 h 2 ( j ) [ s WB ( n + 1 + j ) + s WB ( n - j ) ] - - - ( 24 )
低带分量yl(n)进行LPC分析,得到LPC系数ai(i=11...M),M是LPC分析的阶数,以及残差能量参数E;缓存区中保存上一个SID帧量化后的LPC系数asid q(i)和残差能量Esid q
如果编码器只需要编码到低带核心层或低带增强层,则DTX判决仅需要针对低带分量进行即可。
利用式(25)得出低带分量的DTX判决结果:
Figure A20081008431900212
其中w1,w2分别表示对能量变化和谱变化的加权系数,Et q,Esid q分别表示当前帧和上一个SID帧量化后的能量参数,如果当前编码速率仅为低带核心层,则使用核心层的量化结果,如果当前编码速率为低带增强层或者更高,则使用增强层的量化结果,Rt(i)为当前帧窄带信号分量的自相关系数,thr1,thr2是常数,分别表示能量参数和谱参数变化的阈值,该阈值反映了人耳对能量和谱变化的敏感程度,M是线性预测的阶数,Rsid q(i)由上一个SID帧量化后的LPC系数用式(26)计算得到:
R sid q ( j ) = 2 Σ k = 0 M - j a sid q ( k ) × a sid q ( k + j ) , j ≠ 0 R sid q ( 0 ) = Σ k = 0 M ( a sid q ( k ) ) 2 , j = 0 - - - ( 26 )
如果编码器需要编码高带核心层,宽带部分用简化的TDBWE编码算法对宽带信号分量提取出时域包络和频域包络进行编码。其中时域包络由式(27)计算:
T env = 1 2 log 2 Σ n = 0 N - 1 y h ( n ) 2 - - - ( 27 )
其中,N为帧长,在G.729.1中N=160。
频域包络由式(28)、式(29)、式(30)和式(31)计算得到。首先使用一个128抽头的汉宁窗对宽带信号进行加窗,窗函数表达式如式(11)所示:
w F ( n ) = 1 2 ( 1 - cos ( 2 πn 143 ) ) , n = 0 , · · · , 71 1 2 ( 1 - cos ( 2 π ( n - 16 ) 111 ) ) , n = 72 , · · · , 127 - - - ( 28 )
加窗后的信号为:
y h w ( n ) = y h ( n ) · w F ( n + 31 ) , n=-31,…,96                  (29)
对加窗后的信号进行128点的FFT,使用多项结构实现:
Y h fft ( k ) = FFT 64 ( y h w ( n ) + y h w ( n + 64 ) ) , k=0,…,63,n=-31,…,32    (30)
利用计算出的FFT系数求取加权的频域包络:
F env ( j ) = 1 2 log 2 ( Σ k = 2 j 2 ( j + 1 ) W F ( k - 2 j ) · | S HB fft ( k ) | 2 ) , j=0,…,11                    (31)
内存中缓存了噪声信号短时时域包络Tenvst和频域包络Fenvst(i),则当前帧宽带分量的短时DTX判决由式(32)给出:
Figure A20081008431900225
短时时域包络按下式更新:
Tenvst=ρ×Tenvst+(1-ρ)×Tenv
短时频域包络按下式更新:
Fenvst(i)=ρ×Fenvst(i)+(1-ρ)×Fenv(i)
内存中还缓存了噪声信号长时时域包络Tenvlt和频域包络Fenvlt(i),则当前帧宽带分量的长时DTX判决由式(33)给出:
Figure A20081008431900226
分别得到宽带分量的短时DTX判决和长时DTX判决之后,用下式获得宽带分量的综合判决:
dtx _ wb = 1 dtx _ w b st + dtx _ wb lt > 0 0 dtx _ wb st + dtx _ wb lt = 0
当dtx_wb=1时,长时时域包络按下式更新:
Tenvlt=ψ×Tenvlt+(1-ψ)×Tenv
长时频域包络按下式更新:
Fenvlt(i)=ψ×Fenvlt(i)+(1-ψ)×Fenv(i)
如果dtx_wb=dtx_nb,则dtx_flag=dtx_wb=dtx_nb;否则,需要进行综合判决,具体方法如下:
首先使用式(8)所示的方法,求得低带的变化量J1;然后使用式(15a)或(15b)所示的方法,求得高带的变化量J2;再用式(4)求得低带、高带的联合变化量J;最后使用式(2)所示的判决准则,得到最终的DTX判决结果dtx_flag。
在本实施例中,还可以使用上述实施例一中描述的第二种DTX判决方法:在低带、高带分别进行独立判决的基础上,如果两个带独立判决的结果不一致时,则使用低带分量、高带分量的特征参数的变化量进行联合判决,对独立判决的结果进行修正。
上述实施例提供的方法,全面的利用了语音编解码带宽内的噪声特性,使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果,从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。
本发明的实施例五还提供了一种DTX判决装置,如图3所示,包括:
分带模块10,用于根据输入的信号获取分带信号;可以利用使用QMF滤波器组对输入的特定采样率的信号进行分带。所述信号为窄带信号时,所述分带信号为低带信号,所述低带信号进一步包括低带核心层信号、或低带核心层信号和低带增强层信号;所述信号为宽带信号时,所述分带信号为低带信号和高带信号,所述低带信号进一步包括低带核心层信号和低带增强层信号,所述高带信号进一步包括高带核心层信号、或高带核心层信号和高带增强层信号;所述信号为超宽带信号时,所述分带信号为低带信号、高带信号和超高带信号,所述低带信号进一步包括低带核心层信号和低带增强层信号,所述高带信号进一步包括高带核心层信号和高带增强层信号。
特征信息变化量获取模块20,用于获取所述分带模块分带后每一分带信号的特征信息变化量。
判决模块30,用于根据所述特征信息变化量获取模块20获取的每一分带信号的特征信息变化量进行DTX判决。该判决模块30进一步包括:
加权判决子模块31,用于将特征信息变化量获取模块20获取的每一分带信号的特征信息变化量进行加权,将加权后的结果进行联合判决,作为DTX判决标准。分带判决子模块32,用于将特征信息变化量获取模块20获取的每一分带信号的特征信息变化量作为所述分带信号的判决标准,不同分带信号的判决结果一致时,将所述判决结果作为DTX判决标准;不同分带信号的判决结果不一致时,通知所述加权判决子模块进行联合判决。
具体的,根据所处理的信号的不同,特征信息变化量获取模块20的结构不同。
当用于低带信号时,特征信息变化量获取模块20进一步包括:低带特征信息变化量获取子模块21,用于获取低带信号的特征信息变化量。具体的,使用线性预测分析模型,获取低带分带信号的特征信息,该特征信息包括低带信号的能量信息和谱信息;根据低带信号当前时刻的特征信息和过去时刻的特征信息获取低带信号的特征信息变化量。
当用于宽带信号时,特征信息变化量获取模块20进一步包括:低带特征信息变化量获取子模块21,用于获取低带信号的特征信息变化量;高带特征信息变化量获取子模块22,用于获取高带信号的特征信息变化量。具体的,使用时域带宽扩展编码算法TDBWE,获取高带信号的特征信息,该特征信息包括高带信号的时域包络信息和频域包络信息。根据高带信号当前时刻的特征信息和过去时刻的特征信息获取高带信号的特征信息变化量。
当用于超宽带信号时,特征信息变化量获取模块进一步包括:低带特征信息变化量获取子模块21,用于获取低带信号的特征信息变化量;高带特征信息变化量获取子模块22,用于获取高带信号的特征信息变化量;超高带特征信息变化量获取子模块23,用于获取超高带信号的特征信息变化量。具体的,使用时域带宽扩展编码算法TDBWE,获取超高带信号的特征信息,该特征信息包括超高带信号的时域包络信息和频域包络信息。根据超高带信号当前时刻的特征信息和过去时刻的特征信息获取超高带信号的特征信息变化量。
具体的,当低带信号进一步包括低带核心层信号和低带增强层信号时,低带特征信息变化量获取子模块21的结构如图4所示,进一步包括:
低带分层单元,用于将输入的低带信号分层为低带核心层信号和低带增强层信号,并分别发送到低带核心层特征信息变化量获取单元和低带增强层特征信息变化量获取单元;
低带核心层特征信息变化量获取单元,用于获取低带核心层信号的特征信息变化量;
低带增强层特征信息变化量获取单元,用于获取低带增强层信号的特征信息变化量;
低带综合单元,用于将所述低带核心层特征信息变化量获取单元获取的低带核心层信号的特征信息变化量、和所述低带增强层特征信息变化量获取单元获取的低带增强层信号的特征信息变化量进行综合作为低带的特征信息变化量;
低带控制单元,用于当所述低带信号仅涉及低带核心层时,将所述低带核心层判决子模块的输出作为低带信号的特征信息变化量;当所述分带信号到达低带增强层时,将所述低带综合单元的输出作为低带信号的特征信息变化量。
具体的,当高带信号进一步包括高带核心层信号和高带增强层信号时,高带特征信息变化量获取子模块22的结构与图4所示低带特征信息变化量获取子模块21的结构相似,进一步包括:
高带分层单元,用于将输入的高带信号分层为高带核心层信号和高带增强层信号,并分别发送到高带核心层特征信息变化量获取单元和高带增强层特征信息变化量获取单元;
高带核心层特征信息变化量获取单元,用于获取高带核心层信号的特征信息变化量;
高带增强层特征信息变化量获取单元,用于获取高带增强层信号的特征信息变化量;
高带综合单元,用于将所述高带核心层特征信息变化量获取单元获取的高带核心层信号的特征信息变化量、和所述高带增强层特征信息变化量获取单元获取的高带增强层信号的特征信息变化量进行综合作为高带的特征信息变化量;
高带控制单元,用于当所述高带信号仅涉及高带核心层时,将所述高带核心层判决子模块的输出作为高带信号的特征信息变化量;当所述分带信号到达高带增强层时,将所述高带综合单元的输出作为高带信号的特征信息变化量。
使用如上述图3所示的DTX判决装置的一应用场景如图5所示,输入的信号经过VAD判决为语音帧或静音帧(背景噪音帧),对于语音帧则按照下面一条分支进行语音帧编码,输出语音帧码流;对于静音帧(背景噪音帧),则按照上面一条分支进行噪音的编码,在这条路径中,本发明实施例四提供的DTX判决装置用于确定编码器是否将当前噪音帧进行编码传输。
使用如上述图3所示的DTX判决装置的另一应用场景如图6所示,输入的信号经过VAD判决为语音帧或静音帧(背景噪音帧),对于语音帧则按照下面一条分支进行语音帧编码,输出语音帧码流;对于静音帧(背景噪音帧),则按照上面一条分支进行噪音的编码,在这条路径中,本发明实施例四提供的DTX判决装置用于确定编码器是否传输已编码的噪音帧数据。
通过使用上述实施例提供的装置,全面的利用了语音编解码带宽内的噪声特性,使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果,从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得终端设备执行本发明各个实施例所述的方法。
以上公开的仅为本发明的几个具体实施例,但是,本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims (30)

1、一种DTX判决方法,其特征在于,包括以下步骤:
根据输入的信号获取分带信号;
获取每一所述分带信号的特征信息变化量;
根据每一所述分带信号的特征信息变化量进行DTX判决。
2、如权利要求1所述DTX判决方法,其特征在于,所述根据输入的信号获取分带信号的步骤前还包括:
检测到信号从语音变为噪声后获取噪声的特性,对后续的DTX判决进行初始化。
3、如权利要求1所述DTX判决方法,其特征在于,所述信号为窄带信号,所述分带信号为低带信号。
4、如权利要求3所述DTX判决方法,其特征在于,
所述低带信号进一步包括低带核心层信号;或
所述低带信号进一步包括低带核心层信号和低带增强层信号。
5、如权利要求1所述DTX判决方法,其特征在于,所述信号为宽带信号,所述分带信号为低带信号和高带信号。
6、如权利要求5所述DTX判决方法,其特征在于,
所述低带信号进一步包括低带核心层信号;或所述低带信号进一步包括低带核心层信号和低带增强层信号;
所述高带信号进一步包括高带核心层信号;或所述高带信号进一步包括高带核心层信号和高带增强层信号。
7、如权利要求1所述DTX判决方法,其特征在于,所述信号为超宽带信号,所述分带信号为低带信号、高带信号和超高带信号。
8、如权利要求7所述DTX判决方法,其特征在于,
所述低带信号进一步包括低带核心层信号;或所述低带信号进一步包括低带核心层信号和低带增强层信号;
所述高带信号进一步包括高带核心层信号;或所述高带信号进一步包括高带核心层信号和高带增强层信号。
9、如权利要求3至8中任一项所述DTX判决方法,其特征在于,所述分带信号为低带信号时,获取所述分带信号的特征信息具体为:
使用线性预测分析模型,获取所述分带信号的特征信息,所述特征信息包括低带信号的能量信息和谱信息。
10、如权利要求5至8中任一项所述DTX判决方法,其特征在于,所述分带信号为高带信号或超宽带信号时,获取所述分带信号的特征信息具体为:获取所述分带信号的特征信息具体为:
使用时域带宽扩展编码算法TDBWE,获取所述分带信号的特征信息,所述特征信息包括高带信号或超高带信号的时域包络信息和频域包络信息。
11、如权利要求10所述DTX判决方法,其特征在于,所述频域包络信息通过快速傅里叶变换FFT或改进型离散余弦变换MDCT获取。
12、如权利要求3至8中任一项所述DTX判决方法,其特征在于,所述根据每一所述分带信号的特征信息变化量进行DTX判决具体为:
对每一所述分带信号的特征信息变化量进行联合判决,将所述联合判决结果作为DTX判决标准:若结果大于一特定阈值则判断为需要发送SID帧,否则判断为不需要发送SID帧。
13、如权利要求12所述DTX判决方法,其特征在于,所述信号为窄带信号时,所述联合判决具体为:
所述分带信号仅涉及低带核心层时,根据低带核心层信号对应的特征信息变化量作为DTX判决标准;
所述分带信号到达低带增强层时,根据低带核心层信号及低带增强层信号的特征信息变化量进行联合判决,作为DTX判决标准。
14、如权利要求12所述DTX判决方法,其特征在于,所述信号为宽带信号时,所述联合判决具体为:
所述分带信号到达高带核心层时,根据低带信号的联合特征信息变化量与高带核心层信号对应的特征信息变化量进行联合判决,作为DTX判决标准;
所述分带信号到达高带增强层时,根据低带信号的联合特征信息变化量与宽带信号的联合特征信息变化量进行联合判决,作为DTX判决标准。
15、如权利要求12所述DTX判决方法,其特征在于,所述信号为超宽带信号时,所述联合判决具体为:
根据低带信号、高带信号和超高带信号的联合特征信息变化量进行联合判决,作为DTX判决标准。
16、如权利要求12述DTX判决方法,其特征在于,所述对每一所述分带信号的特征信息变化量进行联合判决具体为:
将每一所述分带信号的所述特征信息变化量进行加权,将加权后的结果进行联合判决,作为DTX判决标准;或
将每一所述分带信号的所述特征信息变化量作为当前分带信号的判决标准,不同分带信号的判决结果一致时,将所述判决结果作为DTX判决标准;不同分带信号的判决结果不一致时,将每一所述分带信号的所述特征信息变化量进行加权,将加权后的结果进行联合判决,作为DTX判决标准。
17、一种DTX判决装置,其特征在于,包括:
分带模块,用于根据输入的信号获取分带信号;
特征信息变化量获取模块,用于获取所述分带模块分带后每一分带信号的特征信息变化量;
判决模块,用于根据所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行DTX判决。
18、如权利要求17所述DTX判决装置,其特征在于,所述信号为窄带信号,所述分带信号为低带信号。
19、如权利要求18所述DTX判决装置,其特征在于,
所述低带信号进一步包括低带核心层信号;或
所述低带信号进一步包括低带核心层信号和低带增强层信号。
20、如权利要求17所述DTX判决装置,其特征在于,所述信号为宽带信号,所述分带信号为低带信号和高带信号。
21、如权利要求20所述DTX判决装置,其特征在于,
所述低带信号进一步包括低带核心层信号;或所述低带信号进一步包括低带核心层信号和低带增强层信号;
所述高带信号进一步包括高带核心层信号;或所述高带信号进一步包括高带核心层信号和高带增强层信号。
22、如权利要求17所述DTX判决装置,其特征在于,所述信号为超宽带信号,所述分带信号为低带信号、高带信号和超高带信号。
23、如权利要求22所述DTX判决装置,其特征在于,
所述低带信号进一步包括低带核心层信号;或所述低带信号进一步包括低带核心层信号和低带增强层信号;
所述高带信号进一步包括高带核心层信号;或所述高带信号进一步包括高带核心层信号和高带增强层信号。
24、如权利要求17所述DTX判决装置,其特征在于,所述特征信息变化量获取模块进一步包括:
低带特征信息变化量获取子模块,用于获取低带信号的特征信息变化量。
25、如权利要求17所述DTX判决装置,其特征在于,所述特征信息变化量获取模块进一步包括:
低带特征信息变化量获取子模块,用于获取低带信号的特征信息变化量;
高带特征信息变化量获取子模块,用于获取高带信号的特征信息变化量。
26、如权利要求17所述DTX判决装置,其特征在于,所述特征信息变化量获取模块进一步包括:
低带特征信息变化量获取子模块,用于获取低带信号的特征信息变化量;
高带特征信息变化量获取子模块,用于获取高带信号的特征信息变化量;
超高带特征信息变化量获取子模块,用于获取超高带信号的特征信息变化量。
27、如权利要求24至26中任一项所述DTX判决装置,其特征在于,所述低带特征信息变化量获取子模块进一步包括:
低带分层单元,用于将输入的低带信号分层为低带核心层信号和低带增强层信号,并分别发送到低带核心层特征信息变化量获取单元和低带增强层特征信息变化量获取单元;
低带核心层特征信息变化量获取单元,用于获取低带核心层信号的特征信息变化量;
低带增强层特征信息变化量获取单元,用于获取低带增强层信号的特征信息变化量;
低带综合单元,用于将所述低带核心层特征信息变化量获取单元获取的低带核心层信号的特征信息变化量、和所述低带增强层特征信息变化量获取单元获取的低带增强层信号的特征信息变化量进行综合作为低带的特征信息变化量;
低带控制单元,用于当所述低带信号仅涉及低带核心层时,将所述低带核心层判决子模块的输出作为低带信号的特征信息变化量;当所述分带信号到达低带增强层时,将所述低带综合单元的输出作为低带信号的特征信息变化量。
28、如权利要求25或26所述DTX判决装置,其特征在于,所述高带特征信息变化量获取子模块进一步包括:
高带分层单元,用于将输入的高带信号分层为高带核心层信号和高带增强层信号,并分别发送到高带核心层特征信息变化量获取单元和高带增强层特征信息变化量获取单元;
高带核心层特征信息变化量获取单元,用于获取高带核心层信号的特征信息变化量;
高带增强层特征信息变化量获取单元,用于获取高带增强层信号的特征信息变化量;
高带综合单元,用于将所述高带核心层特征信息变化量获取单元获取的高带核心层信号的特征信息变化量、和所述高带增强层特征信息变化量获取单元获取的高带增强层信号的特征信息变化量进行综合作为高带的特征信息变化量;
高带控制单元,用于当所述高带信号仅涉及高带核心层时,将所述高带核心层判决子模块的输出作为高带信号的特征信息变化量;当所述分带信号到达高带增强层时,将所述高带综合单元的输出作为高带信号的特征信息变化量。
29、如权利要求17所述DTX判决装置,其特征在于,所述判决模块进一步包括:
加权判决子模块,用于将所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行加权,将加权后的结果进行联合判决,作为DTX判决标准。
30、如权利要求29所述DTX判决装置,其特征在于,所述判决模块还包括:
分带判决子模块,用于将所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量作为所述分带信号的判决标准,不同分带信号的判决结果一致时,将所述判决结果作为DTX判决标准;不同分带信号的判决结果不一致时,通知所述加权判决子模块进行联合判决。
CNB2008100843191A 2007-11-02 2008-03-18 一种dtx判决方法和装置 Active CN100555414C (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CNB2008100843191A CN100555414C (zh) 2007-11-02 2008-03-18 一种dtx判决方法和装置
PCT/CN2008/072774 WO2009056035A1 (fr) 2007-11-02 2008-10-21 Procédé et appareil pour estimation de transmission discontinue
EP08844412.0A EP2202726B1 (en) 2007-11-02 2008-10-21 Method and apparatus for judging dtx
AU2008318143A AU2008318143B2 (en) 2007-11-02 2008-10-21 Method and apparatus for judging DTX
US12/763,573 US9047877B2 (en) 2007-11-02 2010-04-20 Method and device for an silence insertion descriptor frame decision based upon variations in sub-band characteristic information

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CN200710166748.9 2007-11-02
CN200710166748 2007-11-02
CNB2008100843191A CN100555414C (zh) 2007-11-02 2008-03-18 一种dtx判决方法和装置

Publications (2)

Publication Number Publication Date
CN101335001A true CN101335001A (zh) 2008-12-31
CN100555414C CN100555414C (zh) 2009-10-28

Family

ID=40197558

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2008100843191A Active CN100555414C (zh) 2007-11-02 2008-03-18 一种dtx判决方法和装置

Country Status (5)

Country Link
US (1) US9047877B2 (zh)
EP (1) EP2202726B1 (zh)
CN (1) CN100555414C (zh)
AU (1) AU2008318143B2 (zh)
WO (1) WO2009056035A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102315901A (zh) * 2010-07-02 2012-01-11 中兴通讯股份有限公司 不连续发射dtx的判决方法和装置
WO2013017018A1 (zh) * 2011-07-29 2013-02-07 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
CN105846948A (zh) * 2015-01-13 2016-08-10 中兴通讯股份有限公司 一种实现harq-ack检测的方法及装置
CN113921020A (zh) * 2014-09-30 2022-01-11 索尼公司 发送装置、发送方法、接收装置和接收方法

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101246688B (zh) * 2007-02-14 2011-01-12 华为技术有限公司 一种对背景噪声信号进行编解码的方法、系统和装置
US20130155924A1 (en) * 2011-12-15 2013-06-20 Tellabs Operations, Inc. Coded-domain echo control
CN103187065B (zh) * 2011-12-30 2015-12-16 华为技术有限公司 音频数据的处理方法、装置和系统
EP3208800A1 (en) * 2016-02-17 2017-08-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for stereo filing in multichannel coding
US10978096B2 (en) * 2017-04-25 2021-04-13 Qualcomm Incorporated Optimized uplink operation for voice over long-term evolution (VoLte) and voice over new radio (VoNR) listen or silent periods
US10805191B2 (en) 2018-12-14 2020-10-13 At&T Intellectual Property I, L.P. Systems and methods for analyzing performance silence packets

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3090842B2 (ja) * 1994-04-28 2000-09-25 沖電気工業株式会社 ビタビ復号法に適応した送信装置
FI100840B (fi) * 1995-12-12 1998-02-27 Nokia Mobile Phones Ltd Kohinanvaimennin ja menetelmä taustakohinan vaimentamiseksi kohinaises ta puheesta sekä matkaviestin
SE507370C2 (sv) * 1996-09-13 1998-05-18 Ericsson Telefon Ab L M Metod och anordning för att alstra komfortbrus i linjärprediktiv talavkodare
JP3464371B2 (ja) * 1996-11-15 2003-11-10 ノキア モービル フォーンズ リミテッド 不連続伝送中に快適雑音を発生させる改善された方法
US5960389A (en) * 1996-11-15 1999-09-28 Nokia Mobile Phones Limited Methods for generating comfort noise during discontinuous transmission
US6526140B1 (en) * 1999-11-03 2003-02-25 Tellabs Operations, Inc. Consolidated voice activity detection and noise estimation
FI116643B (fi) * 1999-11-15 2006-01-13 Nokia Corp Kohinan vaimennus
JP2001242896A (ja) * 2000-02-29 2001-09-07 Matsushita Electric Ind Co Ltd 音声符号化/復号装置およびその方法
US7143178B2 (en) * 2000-06-29 2006-11-28 Qualcomm Incorporated System and method for DTX frame detection
US6691085B1 (en) * 2000-10-18 2004-02-10 Nokia Mobile Phones Ltd. Method and system for estimating artificial high band signal in speech codec using voice activity information
US6631139B2 (en) * 2001-01-31 2003-10-07 Qualcomm Incorporated Method and apparatus for interoperability between voice transmission systems during speech inactivity
US6721712B1 (en) * 2002-01-24 2004-04-13 Mindspeed Technologies, Inc. Conversion scheme for use between DTX and non-DTX speech coding systems
US7889783B2 (en) * 2002-12-06 2011-02-15 Broadcom Corporation Multiple data rate communication system
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7613606B2 (en) * 2003-10-02 2009-11-03 Nokia Corporation Speech codecs
CN1617605A (zh) * 2003-11-12 2005-05-18 皇家飞利浦电子股份有限公司 一种在语音信道传输非语音数据的方法及装置
US20060149536A1 (en) * 2004-12-30 2006-07-06 Dunling Li SID frame update using SID prediction error
US8102872B2 (en) * 2005-02-01 2012-01-24 Qualcomm Incorporated Method for discontinuous transmission and accurate reproduction of background noise information
US7983906B2 (en) * 2005-03-24 2011-07-19 Mindspeed Technologies, Inc. Adaptive voice mode extension for a voice activity detector
JP2008546341A (ja) * 2005-06-18 2008-12-18 ノキア コーポレイション 非連続音声送信の際の擬似背景ノイズパラメータ適応送信のためのシステム及び方法
US7610197B2 (en) * 2005-08-31 2009-10-27 Motorola, Inc. Method and apparatus for comfort noise generation in speech communication systems
CN101379548B (zh) * 2006-02-10 2012-07-04 艾利森电话股份有限公司 语音检测器和用于其中抑制子频带的方法
US8032370B2 (en) * 2006-05-09 2011-10-04 Nokia Corporation Method, apparatus, system and software product for adaptation of voice activity detection parameters based on the quality of the coding modes
JP4810335B2 (ja) * 2006-07-06 2011-11-09 株式会社東芝 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置
US8260609B2 (en) * 2006-07-31 2012-09-04 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of inactive frames
US8725499B2 (en) * 2006-07-31 2014-05-13 Qualcomm Incorporated Systems, methods, and apparatus for signal change detection
US8032359B2 (en) * 2007-02-14 2011-10-04 Mindspeed Technologies, Inc. Embedded silence and background noise compression
US8982744B2 (en) * 2007-06-06 2015-03-17 Broadcom Corporation Method and system for a subband acoustic echo canceller with integrated voice activity detection

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102315901A (zh) * 2010-07-02 2012-01-11 中兴通讯股份有限公司 不连续发射dtx的判决方法和装置
CN102315901B (zh) * 2010-07-02 2015-06-24 中兴通讯股份有限公司 不连续发射dtx的判决方法和装置
WO2013017018A1 (zh) * 2011-07-29 2013-02-07 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
CN102903364B (zh) * 2011-07-29 2017-04-12 中兴通讯股份有限公司 一种进行语音自适应非连续传输的方法及装置
CN113921020A (zh) * 2014-09-30 2022-01-11 索尼公司 发送装置、发送方法、接收装置和接收方法
CN105846948A (zh) * 2015-01-13 2016-08-10 中兴通讯股份有限公司 一种实现harq-ack检测的方法及装置
CN105846948B (zh) * 2015-01-13 2020-04-28 中兴通讯股份有限公司 一种实现harq-ack检测的方法及装置

Also Published As

Publication number Publication date
AU2008318143A1 (en) 2009-05-07
EP2202726A4 (en) 2013-01-23
AU2008318143B2 (en) 2011-12-01
WO2009056035A1 (fr) 2009-05-07
US9047877B2 (en) 2015-06-02
EP2202726B1 (en) 2017-04-05
US20100268531A1 (en) 2010-10-21
EP2202726A1 (en) 2010-06-30
CN100555414C (zh) 2009-10-28

Similar Documents

Publication Publication Date Title
CN100555414C (zh) 一种dtx判决方法和装置
CA2690433C (en) Method and device for sound activity detection and sound signal classification
CN101335000B (zh) 编码的方法及装置
KR101425944B1 (ko) 디지털 오디오 신호에 대한 향상된 코딩/디코딩
CA2556797C (en) Methods and devices for low-frequency emphasis during audio compression based on acelp/tcx
JP5149198B2 (ja) 音声コーデック内の効率的なフレーム消去隠蔽の方法およびデバイス
KR101295729B1 (ko) 비트 레이트­규모 가변적 및 대역폭­규모 가변적 오디오디코딩에서 비트 레이트 스위칭 방법
US9672840B2 (en) Method for encoding voice signal, method for decoding voice signal, and apparatus using same
US20070147518A1 (en) Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX
CN100585699C (zh) 一种音频解码的方法和装置
MXPA04011751A (es) Metodo y dispositivo para ocultamiento de borrado adecuado eficiente en codecs de habla de base predictiva lineal.
CN101430880A (zh) 一种背景噪声的编解码方法和装置
TW200926144A (en) Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands
WO2009039645A1 (en) Method and device for efficient quantization of transform information in an embedded speech and audio codec
WO2009056027A1 (en) An audio decoding method and device
CN101405792B (zh) 用于在音频解码器中对信号进行后处理的方法
CN101651752B (zh) 解码的方法及装置
Cho Speech Detection, Enhancement and Compression for Voice Communications
HK1184589B (zh) 用於对无效帧进行宽带编码和解码的系统、方法和设备

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant