CN101335001A

CN101335001A - 一种dtx判决方法和装置

Info

Publication number: CN101335001A
Application number: CNA2008100843191A
Authority: CN
Inventors: 代金良; 艾雅·舒默特; 张德明
Original assignee: Huawei Technologies Co Ltd
Current assignee: Huawei Technologies Co Ltd
Priority date: 2007-11-02
Filing date: 2008-03-18
Publication date: 2008-12-31
Anticipated expiration: 2028-03-18
Also published as: AU2008318143A1; EP2202726A4; AU2008318143B2; WO2009056035A1; US9047877B2; EP2202726B1; US20100268531A1; EP2202726A1; CN100555414C

Abstract

本发明公开了一种DTX判决方法，包括以下步骤：根据输入的信号获取分带信号；获取每一所述分带信号的特征信息变化量；根据每一所述分带信号的特征信息变化量进行DTX判决。本发明还公开了一种DTX判决装置。通过使用本发明，全面利用语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果，从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。

Description

一种DTX判决方法和装置

技术领域

本发明涉及信号处理技术领域，尤其涉及一种DTX(DiscontinuousTransmission System，非连续传输系统)判决方法和装置。

背景技术

语音编码技术可以压缩语音信号的传输带宽，增加通信系统的容量。由于语音通信中只有大约40％是包含语音的，其它时间都是静音或背景噪声，为了进一步节省传输带宽，DTX/CNG(Comfortable Noise Generation，舒适噪声生成)技术应运而生。该技术使得编码器可以对背景噪声信号采用不同于语音信号的编解码算法，降低了平均码率。简单说来，DTX/CNG技术就是在编码端对背景噪声段进行编码时，不需要像语音帧那样进行全速率的编码，也不需要对每一帧背景噪声进行编码，而是相隔若干帧才发送一次相比于语音帧更少量的编码参数(SID帧)即可；而在解码端，则根据接收到的非连续的背景噪声帧的参数，恢复出连续的背景噪声，并且不会明显影响主观听觉质量。

非连续的背景噪声编码帧通常称为SID(Silence Insertion Descriptor，静音插入描述)帧，SID帧中一般只包含谱参数和信号能量参数，相对于语音编码帧没有固定码本、自适应码本等相关参数，并且SID帧不会连续传输，从而降低了平均码率。背景噪声编码阶段，一般是通过提取出的噪声参数进行检测，确定是否需要发送SID帧。这一过程可以称为DTX(DiscontinuousTransmission，不连续发射)判决，DTX判决的输出是“1”或“0”，表示需要或不需要发送SID帧。DTX判决的结果也反映出了当前噪声的性质是否出现了明显的变化。

G.729.1是ITU最新发布的新一代语音编解码标准，这种嵌入式语音编解码标准最大的特点是具有分层编码的特性，能够提供码率范围在8kb/s～32kb/s的窄带到宽带的音频质量，允许在传输过程中，根据信道状况丢弃外层码流，具有良好的信道自适应性。

在G.729.1标准中，通过将码流构造成嵌入式的分层结构来达到分级性，其核心层使用G.729标准进行编码，是一种新型的嵌入式可分层的多速率语音编解码器编码器。G.729.1各层编码器系统框图如图1所示。输入为20ms的超帧，当采样率为16000Hz，帧长为320点，输入信号s_WB(n)首先经过QMF滤波(H₁(z)，H₂(z))分成两个子带，低子带信号s_LB ^qmf(n)经过50Hz截止频率的高通滤波器进行预处理，输出信号s_LB(n)使用8kb/s～12kb/s的窄带嵌入式CELP编码器进行编码，s_LB(n)和12Kb/s码率下CELP编码器的本地合成信号

之间的差值信号d_LB(n)经过知觉加权滤波(W_LB(z))后的信号d_LB ^w(n)通过MDCT变换到频域。加权滤波器W_LB(z)包含了增益补偿，用来保持滤波器输出d_LB ^w(n)与高子带输入信号s_HB(n)之间的谱连续性。加权后的差值信号要变换到频域内。

高子带分量乘上(-1)ⁿ进行谱反转之后的信号s_HB ^fold(n)通过截止频率为3000HZ的低通滤波器进行预处理，滤波后的信号s_HB(n)使用TDBWE编码器进行编码。进入TDAC编码模块的s_HB(n)也要先使用MDCT变换到频域上。

两组MDCT系数D_LB ^w(k)和S_HB(k)最后使用TDAC进行编码。另外，还有一些参数用FEC(丢帧错误隐蔽)编码器进行传输，用以改进在传输中出现丢帧时造成的错误。

G.729.1编码器编码出的全速率码流共有12层，核心层速率为8kb/s，是G.729的码流；低带增强层编码速率为12kb/s，是对核心层固定码本编码的增强，12kb/s与8kb/s都对应着窄带的信号分量；编码速率为14kb/s的层采用TDBWE编码器，对应的是宽带信号分量；从16kb/s～32kb/s是对全带信号的增强编码。

3GPP(the 3^rd Generation Partner Project，第三代合作伙伴计划)的语音编解码标准AMR(Adaptive Multi-Rate，自适应多码率声码器)采用的DTX策略是在语音段结束时，使用一个只有1比特有效数据的SID_FIRST帧表示噪声段的开始，在SID_FIRST帧之后第三帧发送第一个包含具体噪声信息的SID_UPDATE帧，以后按照固定间隔每8帧发送一次SID_UPDATE帧。只有SID_UPDATE帧包含有舒适噪声参数的编码数据。

AMR中使用固定间隔发送SID帧的策略无法根据噪声的实际特性自适应地发送SID帧，即无法保证在必需的时候才发送SID帧。在实际通信系统中使用该方法的缺点在于，一方面，噪声特性已经发生明显变化，但是由于没有发送SID帧，解码端无法及时得到已经变化的噪声信息；另一方面，到了可以发送SID帧的时候，可能噪声特性在相当长一段时间内(大于8帧)维持稳定，并不需要发送SID帧，这样就造成了带宽的浪费。

ITU(International Telecom Union，国际电信联盟)的语音编码标准-共轭结构代数码本激励线性预测声码器(G.729)定义的静音压缩方案中，在编码端的DTX策略使用的是根据窄带噪声参数的变化情况，自适应地确定是否发送SID，前后两帧SID的间隔最小为20毫秒，最大则不限。该方法的缺点在于，仅利用了从窄带信号中提取出的能量参数和谱参数来指导DTX判决，而没有使用宽带分量的信息，因此对于宽带语音应用场景可能无法给出全面恰当的DTX判决结果。

另外，随着宽带语音编码器的日益广泛应用，以及超宽带技术的逐步发展，类似G.729.1这样的嵌入式分层结构的宽带声码器标准已经发布并走向应用。在这种分层结构的宽带声码器中，上述AMR中的DTX机制以及ITU中的G.729无法最大限度地利用噪声窄带和宽带分量的信息，可能无法给出全面反映实际噪声性质的DTX判决结果，也就无法体现分层编码的优势。

发明内容

本发明的实施例提供一种DTX判决方法和装置，用于实现对噪声信号的分带及分层处理，得到全面合理的DTX判决结果。

为达到上述目的，本发明的实施例提供一种DTX判决方法，包括以下步骤：

根据输入的信号获取分带信号；

获取每一所述分带信号的特征信息变化量；

根据每一所述分带信号的特征信息变化量进行DTX判决。

本发明的实施例还提供一种DTX判决装置，包括：

分带模块，用于根据输入的信号获取分带信号；

特征信息变化量获取模块，用于获取所述分带模块分带后每一分带信号的特征信息变化量；

判决模块，用于根据所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行DTX判决。

与现有技术相比，本发明的实施例具有以下优点：

通过全面利用语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果，从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。

附图说明

图1是现有技术中G.729.1各层编码器系统框图；

图2是本发明的实施例一中一种DTX判决方法的流程图；

图3是本发明的实施例五中一种DTX判决装置的结构示意图；

图4是本发明的实施例五中DTX判决装置的低带特征信息变化量获取子模块的结构示意图；

图5是本发明的实施例五中DTX判决装置的使用场景示意图；

图6是本发明的实施例五中DTX判决装置的另一使用场景示意图。

具体实施方式

本发明的实施例一中，一种DTX判决方法如图1所示，包括以下步骤：

步骤s101、对输入的信号进行分带。

该步骤中，当输入的信号为宽带信号时，可以将该宽带信号分成低带和高带两个子带；当输入的信号为超宽带信号时，可以将该超宽带信号一次分为低带、高带和超高带信号；或先分为超高带信号和宽带信号，再将宽带信号分为低带和高带信号。对于低带信号，可以进一步分为低带核心层信号和低带增强层信号；对于高带信号，可以进一步分为高带核心层信号和高带增强层信号。该分带可以通过QMF(Quadrature Mirror Filter，正交镜像滤波器组)实现。具体的划分标准可以为：窄带信号是指频带0～4000Hz的信号，宽带信号是指频带在0～8000Hz的信号，超宽带信号是指频带在0～16000Hz的信号。窄带或低带(宽带分量)信号均指0～4000Hz的信号，高带(宽带分量)信号是指4000～8000Hz的信号，超高带(超宽带分量)信号是指8000～16000Hz的信号。

该步骤前还包括：当VAD(Voice Activity Detector，语音激活检测)功能检测到信号从语音变为噪声后，编码算法进入拖尾阶段。在拖尾阶段，编码器仍然按照语音帧编码算法对输入的信号进行编码，其主要作用是估计噪声的特性，对后续的噪声编码算法进行初始化。拖尾阶段结束后启动噪声编码，对输入的信号进行分带。

步骤s102、获取每一分带信号的特征信息和特征信息变化量。

具体的，对于低带信号，特征信息包括低带信号的能量信息和谱信息，可以通过使用线性预测分析模型获取。

对于高带信号和超高带信号，特征信息包括时域包络信息和频域包络信息，可以通过TDBWE(Time Domain Band Width Extension，时域带宽扩展)编码算法获取。

根据获取的分带内信号的特征信息，与过去时刻获取的分带内信号的特征信息进行比较，可以得到分带内信号的变化度量。

步骤s103、根据获取的分带信号的特征信息变化量进行DTX判决。

对于宽带信号，将低带噪声特性变化度量和高带噪声特性变化度量进行综合作为宽带的DTX判决结果；对于超宽带信号，将宽带信号特性变化度量和超高带信号特性变化度量进行综合作为整个超宽带的DTX判决结果。

假设将输入的噪声信号的全速率的编码信息分为低带核心层、低带增强层、高带核心层、高带增强层和超高带层，对应的编码速率依次增大。则噪声分层结构可以映射为实际的编码速率。

如果实际编码仅涉及低带核心层，则DTX判决仅计算低带核心层对应的特征信息变化量，如果判决函数值大于一定阈值，则发送SID帧，否则不发。

如果实际编码到了低带增强层，则DTX判决可以使用低带核心层及低带增强层的特征信息变化量进行联合判决，如果判决函数值大于一定阈值，则发送SID帧，否则不发。

如果实际编码到高带核心层，则使用低带分量的联合特征信息变化量与高带核心层对应的特征信息变化量进行综合DTX判决，如果判决函数值大于一定阈值，则发送SID帧，否则不发。

如果实际编码到了高带增强层，则使用低带分量的联合特征信息变化量与宽带分量的联合特征信息变化量进行综合DTX判决，如果判决函数值大于一定阈值，则发送SID帧，否则不发。

如果实际编码到了超高带，那么可以使用全带信号的联合特征信息变化量进行DTX判决，如果判决函数值大于一定阈值，则发送SID帧，否则不发。

基于上述描述，全带信号的特征信息变化量可用式(1)表示：

J＝αJ₁+βJ₂+γJ₃ (1)

根据该式，可以得到DTX判决的第一种方法：

其中，α+β+γ＝1，J₁，J₂，J₃分别表示计算出的低带、高带和超高带的特诊信息变化量。则DTX判决规则如式(2)表示，当J＞1时，DTX判决输出dtx_flag为1，表示需要对噪声帧编码信息进行传输；否则dtx_flag为0，表示不需要对噪声帧编码信息进行传输：

\{\begin{matrix} dtx_flag = 1 & J > 1 \\ dtx_flag = 0 & J \leq 1 \end{matrix} - - - (2)

当只需要编码到低带核心层或低带增强层时，则式(1)简化为

J＝J₁ (3)

当需要编码到高带核心层或高带增强层时，式(1)简化为

J＝αJ₁+βJ₂ (4)

其中，α+β＝1。

当然也可以使用另外的DTX判决方式，如以下的第二种DTX判决方法：

使用J₁，J₂，J₃分别表示计算出的低带、高带和超高带的特征信息变化量：

当编码到低带核心层或低带增强层时，同公式(3)，使用J₁作为DTX判决标准；

当需要编码到高带核心层或高带增强层时，使用J₁和J₂作为DTX判决标准，当J₁和J₂均小于1时，DTX判决输出dtx_flag为0，表示不需要对噪声帧编码信息进行传输；当J₁和J₂均大于1时，DTX判决输出dtx_flag为1，表示需要对噪声帧编码信息进行传输；当J₁和J₂不同时大于1或小于1时，按照公式(4)将J＝αJ₁+βJ₂作为DTX判决标准；

当需要编码到超高带时，使用J₁、J₂和J₃作为DTX判决标准，当J₁、J₂和J₃均小于1时，DTX判决输出dtx_flag为0，表示不需要对噪声帧编码信息进行传输；当J₁、J₂和J₃均大于1时，DTX判决输出dtx_flag为1，表示需要对噪声帧编码信息进行传输；当J₁、J₂和J₃不同时大于1或小于1时，按照公式(1)将J＝αJ₁+βJ₂+γJ₃作为DTX判决标准。

上述两种方法都可以用于DTX的判决输出。

以下结合具体的应用场景，对本发明实施例的实施方式作进一步描述。

本发明的实施例二中，以对输入的宽带信号进行的DTX判决为例，说明本发明中一种DTX判决方法的实施方式。

本实施例中使用的SID帧的结构如表1所示：

表1：SID帧的比特分配

系统工作在16k采样率，输入信号带宽8kHz。SID帧的全速率帧包含3层，分别是低带核心层、低带增强层和高带核心层。低带核心层使用的编码参数与G.729附录B中的SID帧编码参数基本类似，分别是对能量参数采用5比特进行量化，对于谱参数LSF采用10比特进行量化；低带增强层是在低带核心层的基础上，对能量和谱参数的量化误差进行进一步量化，也就是说对能量采用第二级量化，对谱采用第三级量化，其中能量的第二级量化使用3比特，谱的第三级量化使用6比特；高带核心层采用类似G.729.1中TDBWE算法中的编码参数，不过将16点时域包络简化为1个时域能量增益，使用6比特进行量化，频域包络仍然是12个，分裂为3个矢量共使用14比特进行量化。

首先对输入的信号进行分带，即分成高低两个子带，低带频率范围为0～4kHz，高带频率范围为4kHz～8kHz。具体的，使用QMF滤波器组对输入的16kHz采样率的信号s_WB(n)进行分带，低通滤波器H₁(z)是一个64抽头的对称的FIR滤波器，高通滤波器H₂(z)可以由H₁(z)得到：

h₂(n)＝(-1)ⁿh₁(n) (5)

则窄带分量可由式(6)得到：

y_{l} (n) = Σ_{j = 0}^{31} h_{1} (j) [s_{WB} (n + 1 + j) + s_{WB} (n - j)] - - - (6)

宽带分量可由式(7)得到：

y_{h} (n) = Σ_{j = 0}^{31} h_{2} (j) [s_{WB} (n + 1 + j) + s_{WB} (n - j)] - - - (7)

低带分量y_l(n)进行LPC分析，得到LPC系数a_i(i＝1...M)，M是LPC分析的阶数，以及残差能量参数E；缓存区中保存上一个SID帧量化后的LPC系数a_sid ^q(i)和残差能量E_sid ^q。

如果编码器只需要编码到低带核心层或低带增强层，则DTX判决仅需要针对低带分量进行即可。

利用式(8)计算出低带的变化量J₁：

J_{1} = w_{1} * \frac{| E_{t}^{q} - E_{sid}^{q} |}{thr 1} + w_{2} * \frac{Σ_{i = 0}^{M} R_{sid}^{q} (i) \cdot R^{t} (i)}{E_{t}^{q} \cdot thr 2} - - - (8)

其中w₁，w₂分别表示对能量变化和谱变化的加权系数，E_t ^q，E_sid ^q分别表示当前帧和上一个SID帧量化后的能量参数，R^t(i)为当前帧窄带信号分量的自相关系数，thr1，thr2是常数，分别表示能量参数和谱参数变化的阈值，该阈值反映了人耳对能量和谱变化的敏感程度，M是线性预测的阶数，R_sid ^q(i)由上一个SID帧量化后的LPC系数用式(9)计算得到：

\{\begin{matrix} R_{sid}^{q} (j) = 2 Σ_{k = 0}^{M - j} a_{sid}^{q} (k) \times a_{sid}^{q} (k + j), & j &NotEqual; 0 \\ R_{sid}^{q} (0) = Σ_{k = 0}^{M} {(a_{sid}^{q} (k))}^{2}, & j = 0 \end{matrix} - - - (9)

则可以利用式(8)计算出低带信号的变化量，并利用式(3)和式(2)得到DTX判决结果。

由于本实施例中低带核心层和低带增强层使用的参数完全相同，增强层仅仅是对核心层的参数进行了进一步量化，因此如果编码速率达到了低带增强层，DTX判决的过程与式(8)和式(9)基本相同，只是使用的能量参数和谱参数是增强层中的量化结果，这里对此判决过程不做重复描述。

如果编码器需要编码高带核心层，则除了要按照式(8)计算出J₁以外，还要计算出宽带的变化量J₂。宽带部分用简化的TDBWE编码算法对宽带信号分量提取出时域包络和频域包络进行编码。其中时域包络由式(10)计算：

T_{env} = \frac{1}{2} \log_{2} Σ_{n = 0}^{N - 1} y_{h} {(n)}^{2} - - - (10)

其中，N为帧长，在G.729.1中N＝160。

频域包络由式(11)、式(12)、式(13)和式(14)计算得到。首先使用一个128抽头的汉宁窗对宽带信号进行加窗，窗函数表达式如式(11)所示：

w_{F} (n) = \{\begin{matrix} \frac{1}{2} (1 - \cos (\frac{2 πn}{143})), & n = 0, \cdot \cdot \cdot, 71 \\ \frac{1}{2} (1 - \cos (\frac{2 π (n - 16)}{111})), & n = 72, \cdot \cdot \cdot, 127 \end{matrix} - - - (11)

加窗后的信号为：

y_{h}^{w} (n) = y_{h} (n) \cdot w_{F} (n + 31),

n＝-31，…，96 (12)

对加窗后的信号进行128点的FFT，使用多项结构实现：

Y_{h}^{fft} (k) = {FFT}_{64} (y_{h}^{w} (n) + y_{h}^{w} (n + 64)),

k＝0，…，63，n＝-31，…，32 (13)

利用计算出的FFT系数求取加权的频域包络：

F_{env} (j) = \frac{1}{2} \log_{2} (Σ_{k = 2 j}^{2 (j + 1)} W_{F} (k - 2 j) \cdot {| S_{HB}^{fft} (k) |}^{2}),

j＝0，…，11 (14)

内存中缓存了上一个SID帧的量化后的时域包络Tenv_sid ^q和频域包络Fenv_sid ^q(j)，则当前帧宽带分量相比于上一个SID帧的变化量可用式(15a)或(15b)计算得到：

J_{2} = w_{3} * \frac{| T_{env} - {Tenv}_{sid}^{q} |}{thr 3} + w_{4} * \frac{Σ_{i = 0}^{11} F_{env} (i) \cdot {Fenv}_{sid}^{q} (i)}{thr 4} - - - (15 a)

或：

J_{2} = w_{3} * \frac{| T_{env} - {Tenv}_{sid}^{q} |}{thr 3} + w_{4} * \frac{Σ_{i = 0}^{11} | F_{env} (i) {- Fenv}_{sid}^{q} (i) |}{thr 4} - - - (15 b)

分别得到窄带的变化量J₁和宽带的变化量J₂，则窄带和宽带的联合变化量可以用式(4)求得。利用式(2)所示的判决规则，即可判决出当前帧是否需要编码发送SID帧。

本发明的实施例三中，以对输入的超宽带信号进行的DTX判决为例，说明本发明中一种DTX判决方法的实施方式。

本实施例处理的信号为32kHz采样，经过分带处理分别得到低带、高带和超高带噪声分量。对于分带处理，可以给予树形结构实现，即经过一次QMF分成超高带和宽带信号，再经过一次QMF将宽带信号分成低带和高带信号；也可以基于一个非等宽子带滤波器组直接将输入信号分成低带、高带和超高带信号分量。显然，树形结构的分带器具有更好的可扩展性能。分带得到的窄带和宽带信息可以输入到实施例二的系统进行宽带DTX判决，并最终得到(4)式所示的宽带噪声特征信息变化度量J，对于本实施例就是联合超宽带噪声特征信息变化量Js及宽带的J得到全带噪声特征变化度量Ja，如(16)式所示：

J_a＝γ·J+ξJ_s (16)

利用全带的噪声特征变化度量Ja进行DTX判决，输出全带DTX判决结果dtx_flag，如(17)式所示：

\{\begin{matrix} dtx_flag = 1 & J_{a} > 1 \\ dtx_flag = 0 & J_{a} \leq 1 \end{matrix} - - - (17)

其中γ+ξ＝1。

下面叙述超高带噪声特性变化度量Js，本实施例中使用的SID帧低带和高带部分的结构如表1中所示，不做重复描述；超高带部分的结构如表2所示：

表2：SID帧超高带比特分配

超高带的时域能量包络由式(19)式计算得到：

T_{env} = \frac{1}{2} \log_{2} (Σ_{n = 0}^{N - 1} y_{s} {(n)}^{2}) - - - (19)

其中N在20ms帧处理时为320，ys为超高带信号。对于频域包络Fenv_s(j)的计算类似高带的频域包络计算，不同的是频谱宽度不一样，因此频域包络的点数也可以不一样，如式(20)所示：

{Fenv}_{s} = \frac{1}{2} \log_{2} (Σ_{k = 20 \cdot j}^{20 \cdot j + 19} W_{F}^{s} (k - 20 \cdot j) \cdot {| Y_{s} (k) |}^{2}) - - - (20)

其中Ys为超高带频谱，可以通过FFT(Fast Fourier Transform，快速傅里叶变换)计算，也可以通过MDCT(Modified Discrete Cosine Transform，改进型离散余弦变换)计算，式(20)中是以320点频谱宽度为例的，并且计算频域包络为8Khz～14KHz共280个频点。为了量化的方便，仍然可以将频域包络分裂为3个子矢量进行量化。

内存中缓存了上一个SID帧的量化后的超高带时域包络Tenv_sid ^q和频域包络Fenv_sid ^q(j)，则当前帧超高带分量相比于上一个SID帧的变化量可用式(21a)或(21b)计算得到：

J_{s} = w_{5} * \frac{| T_{env}^{s} - {Tenv}_{sid}^{s (q)} |}{thr 5} + w_{6} * \frac{Σ_{i = 0}^{11} F_{env}^{s} (i) \cdot {Fenv}_{sid}^{s (q)} (i)}{thr 6} - - - (21)

或：

J_{s} = w_{5} * \frac{| T_{env}^{s} - {Tenv}_{sid}^{s (q)} |}{thr 5} + w_{6} * \frac{Σ_{i = 0}^{11} | F_{env}^{s} (i) {- Fenv}_{sid}^{s (q)} (i) |}{thr 6} - - - (21 b)

再用式(16)计算全带噪声特征变化度量。再利用式(17)所示的判决规则，即可判决出当前帧是否需要编码发送SID帧。

上述实施例二和实施例三中所涉及的DTX判决流程，使用的均为实施例一的步骤s103中描述的第一种DTX判决方法。对于实施例二和实施例三，也可以使用实施例一的步骤s103中描述的第二种DTX判决方法，具体的判决过程于上述实施例二和实施例三种描述的过程相似，在此不进行重复描述。

本发明的实施例四中，以对输入的宽带信号进行的DTX判决为例，说明本发明中一种DTX判决方法的实施方式。

本实施例中使用的SID帧的结构如表3所示：

表3：SID帧的比特分配

h₂(n)＝(-1)ⁿh₁(n) (22)

则窄带分量可由式(23)得到：

y_{l} (n) = Σ_{j = 0}^{31} h_{1} (j) [s_{WB} (n + 1 + j) + s_{WB} (n - j)] - - - (23)

宽带分量可由式(24)得到：

y_{h} (n) = Σ_{j = 0}^{31} h_{2} (j) [s_{WB} (n + 1 + j) + s_{WB} (n - j)] - - - (24)

低带分量y_l(n)进行LPC分析，得到LPC系数a_i(i＝11...M)，M是LPC分析的阶数，以及残差能量参数E；缓存区中保存上一个SID帧量化后的LPC系数a_sid ^q(i)和残差能量E_sid ^q。

利用式(25)得出低带分量的DTX判决结果：

其中w₁，w₂分别表示对能量变化和谱变化的加权系数，E_t ^q，E_sid ^q分别表示当前帧和上一个SID帧量化后的能量参数，如果当前编码速率仅为低带核心层，则使用核心层的量化结果，如果当前编码速率为低带增强层或者更高，则使用增强层的量化结果，R^t(i)为当前帧窄带信号分量的自相关系数，thr1，thr2是常数，分别表示能量参数和谱参数变化的阈值，该阈值反映了人耳对能量和谱变化的敏感程度，M是线性预测的阶数，R_sid ^q(i)由上一个SID帧量化后的LPC系数用式(26)计算得到：

\{\begin{matrix} R_{sid}^{q} (j) = 2 Σ_{k = 0}^{M - j} a_{sid}^{q} (k) \times a_{sid}^{q} (k + j), & j &NotEqual; 0 \\ R_{sid}^{q} (0) = Σ_{k = 0}^{M} {(a_{sid}^{q} (k))}^{2}, & j = 0 \end{matrix} - - - (26)

如果编码器需要编码高带核心层，宽带部分用简化的TDBWE编码算法对宽带信号分量提取出时域包络和频域包络进行编码。其中时域包络由式(27)计算：

T_{env} = \frac{1}{2} \log_{2} Σ_{n = 0}^{N - 1} y_{h} {(n)}^{2} - - - (27)

其中，N为帧长，在G.729.1中N＝160。

频域包络由式(28)、式(29)、式(30)和式(31)计算得到。首先使用一个128抽头的汉宁窗对宽带信号进行加窗，窗函数表达式如式(11)所示：

w_{F} (n) = \{\begin{matrix} \frac{1}{2} (1 - \cos (\frac{2 πn}{143})), & n = 0, \cdot \cdot \cdot, 71 \\ \frac{1}{2} (1 - \cos (\frac{2 π (n - 16)}{111})), & n = 72, \cdot \cdot \cdot, 127 \end{matrix} - - - (28)

加窗后的信号为：

y_{h}^{w} (n) = y_{h} (n) \cdot w_{F} (n + 31),

n＝-31，…，96 (29)

对加窗后的信号进行128点的FFT，使用多项结构实现：

Y_{h}^{fft} (k) = {FFT}_{64} (y_{h}^{w} (n) + y_{h}^{w} (n + 64)),

k＝0，…，63，n＝-31，…，32 (30)

利用计算出的FFT系数求取加权的频域包络：

F_{env} (j) = \frac{1}{2} \log_{2} (Σ_{k = 2 j}^{2 (j + 1)} W_{F} (k - 2 j) \cdot {| S_{HB}^{fft} (k) |}^{2}),

j＝0，…，11 (31)

内存中缓存了噪声信号短时时域包络Tenv_st和频域包络Fenv_st(i)，则当前帧宽带分量的短时DTX判决由式(32)给出：

短时时域包络按下式更新：

Tenv_st＝ρ×Tenv_st+(1-ρ)×Tenv

短时频域包络按下式更新：

Fenv_st(i)＝ρ×Fenv_st(i)+(1-ρ)×Fenv(i)

内存中还缓存了噪声信号长时时域包络Tenv_lt和频域包络Fenv_lt(i)，则当前帧宽带分量的长时DTX判决由式(33)给出：

分别得到宽带分量的短时DTX判决和长时DTX判决之后，用下式获得宽带分量的综合判决：

dtx_wb = \{\begin{matrix} 1 & dtx_w b_{st} + dtx_{wb}_{lt} > 0 \\ 0 & dtx_{wb}_{st} + dtx_{wb}_{lt} = 0 \end{matrix}

当dtx_wb＝1时，长时时域包络按下式更新：

Tenv_lt＝ψ×Tenv_lt+(1-ψ)×Tenv

长时频域包络按下式更新：

Fenv_lt(i)＝ψ×Fenv_lt(i)+(1-ψ)×Fenv(i)

如果dtx_wb＝dtx_nb，则dtx_flag＝dtx_wb＝dtx_nb；否则，需要进行综合判决，具体方法如下：

首先使用式(8)所示的方法，求得低带的变化量J₁；然后使用式(15a)或(15b)所示的方法，求得高带的变化量J₂；再用式(4)求得低带、高带的联合变化量J；最后使用式(2)所示的判决准则，得到最终的DTX判决结果dtx_flag。

在本实施例中，还可以使用上述实施例一中描述的第二种DTX判决方法：在低带、高带分别进行独立判决的基础上，如果两个带独立判决的结果不一致时，则使用低带分量、高带分量的特征参数的变化量进行联合判决，对独立判决的结果进行修正。

上述实施例提供的方法，全面的利用了语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果，从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。

本发明的实施例五还提供了一种DTX判决装置，如图3所示，包括：

分带模块10，用于根据输入的信号获取分带信号；可以利用使用QMF滤波器组对输入的特定采样率的信号进行分带。所述信号为窄带信号时，所述分带信号为低带信号，所述低带信号进一步包括低带核心层信号、或低带核心层信号和低带增强层信号；所述信号为宽带信号时，所述分带信号为低带信号和高带信号，所述低带信号进一步包括低带核心层信号和低带增强层信号，所述高带信号进一步包括高带核心层信号、或高带核心层信号和高带增强层信号；所述信号为超宽带信号时，所述分带信号为低带信号、高带信号和超高带信号，所述低带信号进一步包括低带核心层信号和低带增强层信号，所述高带信号进一步包括高带核心层信号和高带增强层信号。

特征信息变化量获取模块20，用于获取所述分带模块分带后每一分带信号的特征信息变化量。

判决模块30，用于根据所述特征信息变化量获取模块20获取的每一分带信号的特征信息变化量进行DTX判决。该判决模块30进一步包括：

加权判决子模块31，用于将特征信息变化量获取模块20获取的每一分带信号的特征信息变化量进行加权，将加权后的结果进行联合判决，作为DTX判决标准。分带判决子模块32，用于将特征信息变化量获取模块20获取的每一分带信号的特征信息变化量作为所述分带信号的判决标准，不同分带信号的判决结果一致时，将所述判决结果作为DTX判决标准；不同分带信号的判决结果不一致时，通知所述加权判决子模块进行联合判决。

具体的，根据所处理的信号的不同，特征信息变化量获取模块20的结构不同。

当用于低带信号时，特征信息变化量获取模块20进一步包括：低带特征信息变化量获取子模块21，用于获取低带信号的特征信息变化量。具体的，使用线性预测分析模型，获取低带分带信号的特征信息，该特征信息包括低带信号的能量信息和谱信息；根据低带信号当前时刻的特征信息和过去时刻的特征信息获取低带信号的特征信息变化量。

当用于宽带信号时，特征信息变化量获取模块20进一步包括：低带特征信息变化量获取子模块21，用于获取低带信号的特征信息变化量；高带特征信息变化量获取子模块22，用于获取高带信号的特征信息变化量。具体的，使用时域带宽扩展编码算法TDBWE，获取高带信号的特征信息，该特征信息包括高带信号的时域包络信息和频域包络信息。根据高带信号当前时刻的特征信息和过去时刻的特征信息获取高带信号的特征信息变化量。

当用于超宽带信号时，特征信息变化量获取模块进一步包括：低带特征信息变化量获取子模块21，用于获取低带信号的特征信息变化量；高带特征信息变化量获取子模块22，用于获取高带信号的特征信息变化量；超高带特征信息变化量获取子模块23，用于获取超高带信号的特征信息变化量。具体的，使用时域带宽扩展编码算法TDBWE，获取超高带信号的特征信息，该特征信息包括超高带信号的时域包络信息和频域包络信息。根据超高带信号当前时刻的特征信息和过去时刻的特征信息获取超高带信号的特征信息变化量。

具体的，当低带信号进一步包括低带核心层信号和低带增强层信号时，低带特征信息变化量获取子模块21的结构如图4所示，进一步包括：

低带分层单元，用于将输入的低带信号分层为低带核心层信号和低带增强层信号，并分别发送到低带核心层特征信息变化量获取单元和低带增强层特征信息变化量获取单元；

低带核心层特征信息变化量获取单元，用于获取低带核心层信号的特征信息变化量；

低带增强层特征信息变化量获取单元，用于获取低带增强层信号的特征信息变化量；

低带综合单元，用于将所述低带核心层特征信息变化量获取单元获取的低带核心层信号的特征信息变化量、和所述低带增强层特征信息变化量获取单元获取的低带增强层信号的特征信息变化量进行综合作为低带的特征信息变化量；

低带控制单元，用于当所述低带信号仅涉及低带核心层时，将所述低带核心层判决子模块的输出作为低带信号的特征信息变化量；当所述分带信号到达低带增强层时，将所述低带综合单元的输出作为低带信号的特征信息变化量。

具体的，当高带信号进一步包括高带核心层信号和高带增强层信号时，高带特征信息变化量获取子模块22的结构与图4所示低带特征信息变化量获取子模块21的结构相似，进一步包括：

高带分层单元，用于将输入的高带信号分层为高带核心层信号和高带增强层信号，并分别发送到高带核心层特征信息变化量获取单元和高带增强层特征信息变化量获取单元；

高带核心层特征信息变化量获取单元，用于获取高带核心层信号的特征信息变化量；

高带增强层特征信息变化量获取单元，用于获取高带增强层信号的特征信息变化量；

高带综合单元，用于将所述高带核心层特征信息变化量获取单元获取的高带核心层信号的特征信息变化量、和所述高带增强层特征信息变化量获取单元获取的高带增强层信号的特征信息变化量进行综合作为高带的特征信息变化量；

高带控制单元，用于当所述高带信号仅涉及高带核心层时，将所述高带核心层判决子模块的输出作为高带信号的特征信息变化量；当所述分带信号到达高带增强层时，将所述高带综合单元的输出作为高带信号的特征信息变化量。

使用如上述图3所示的DTX判决装置的一应用场景如图5所示，输入的信号经过VAD判决为语音帧或静音帧(背景噪音帧)，对于语音帧则按照下面一条分支进行语音帧编码，输出语音帧码流；对于静音帧(背景噪音帧)，则按照上面一条分支进行噪音的编码，在这条路径中，本发明实施例四提供的DTX判决装置用于确定编码器是否将当前噪音帧进行编码传输。

使用如上述图3所示的DTX判决装置的另一应用场景如图6所示，输入的信号经过VAD判决为语音帧或静音帧(背景噪音帧)，对于语音帧则按照下面一条分支进行语音帧编码，输出语音帧码流；对于静音帧(背景噪音帧)，则按照上面一条分支进行噪音的编码，在这条路径中，本发明实施例四提供的DTX判决装置用于确定编码器是否传输已编码的噪音帧数据。

通过使用上述实施例提供的装置，全面的利用了语音编解码带宽内的噪声特性，使用分带及分层处理的方法在噪声编码阶段给出全面、合理的DTX判决结果，从而使得SID编码/CNG解码更能贴近实际噪声的特性变化。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到本发明可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得终端设备执行本发明各个实施例所述的方法。

以上公开的仅为本发明的几个具体实施例，但是，本发明并非局限于此，任何本领域的技术人员能思之的变化都应落入本发明的保护范围。

Claims

1、一种DTX判决方法，其特征在于，包括以下步骤：

根据输入的信号获取分带信号；

获取每一所述分带信号的特征信息变化量；

根据每一所述分带信号的特征信息变化量进行DTX判决。

2、如权利要求1所述DTX判决方法，其特征在于，所述根据输入的信号获取分带信号的步骤前还包括：

检测到信号从语音变为噪声后获取噪声的特性，对后续的DTX判决进行初始化。

3、如权利要求1所述DTX判决方法，其特征在于，所述信号为窄带信号，所述分带信号为低带信号。

4、如权利要求3所述DTX判决方法，其特征在于，

所述低带信号进一步包括低带核心层信号；或

所述低带信号进一步包括低带核心层信号和低带增强层信号。

5、如权利要求1所述DTX判决方法，其特征在于，所述信号为宽带信号，所述分带信号为低带信号和高带信号。

6、如权利要求5所述DTX判决方法，其特征在于，

所述低带信号进一步包括低带核心层信号；或所述低带信号进一步包括低带核心层信号和低带增强层信号；

所述高带信号进一步包括高带核心层信号；或所述高带信号进一步包括高带核心层信号和高带增强层信号。

7、如权利要求1所述DTX判决方法，其特征在于，所述信号为超宽带信号，所述分带信号为低带信号、高带信号和超高带信号。

8、如权利要求7所述DTX判决方法，其特征在于，

9、如权利要求3至8中任一项所述DTX判决方法，其特征在于，所述分带信号为低带信号时，获取所述分带信号的特征信息具体为：

使用线性预测分析模型，获取所述分带信号的特征信息，所述特征信息包括低带信号的能量信息和谱信息。

10、如权利要求5至8中任一项所述DTX判决方法，其特征在于，所述分带信号为高带信号或超宽带信号时，获取所述分带信号的特征信息具体为：获取所述分带信号的特征信息具体为：

使用时域带宽扩展编码算法TDBWE，获取所述分带信号的特征信息，所述特征信息包括高带信号或超高带信号的时域包络信息和频域包络信息。

11、如权利要求10所述DTX判决方法，其特征在于，所述频域包络信息通过快速傅里叶变换FFT或改进型离散余弦变换MDCT获取。

12、如权利要求3至8中任一项所述DTX判决方法，其特征在于，所述根据每一所述分带信号的特征信息变化量进行DTX判决具体为：

对每一所述分带信号的特征信息变化量进行联合判决，将所述联合判决结果作为DTX判决标准：若结果大于一特定阈值则判断为需要发送SID帧，否则判断为不需要发送SID帧。

13、如权利要求12所述DTX判决方法，其特征在于，所述信号为窄带信号时，所述联合判决具体为：

所述分带信号仅涉及低带核心层时，根据低带核心层信号对应的特征信息变化量作为DTX判决标准；

所述分带信号到达低带增强层时，根据低带核心层信号及低带增强层信号的特征信息变化量进行联合判决，作为DTX判决标准。

14、如权利要求12所述DTX判决方法，其特征在于，所述信号为宽带信号时，所述联合判决具体为：

所述分带信号到达高带核心层时，根据低带信号的联合特征信息变化量与高带核心层信号对应的特征信息变化量进行联合判决，作为DTX判决标准；

所述分带信号到达高带增强层时，根据低带信号的联合特征信息变化量与宽带信号的联合特征信息变化量进行联合判决，作为DTX判决标准。

15、如权利要求12所述DTX判决方法，其特征在于，所述信号为超宽带信号时，所述联合判决具体为：

根据低带信号、高带信号和超高带信号的联合特征信息变化量进行联合判决，作为DTX判决标准。

16、如权利要求12述DTX判决方法，其特征在于，所述对每一所述分带信号的特征信息变化量进行联合判决具体为：

将每一所述分带信号的所述特征信息变化量进行加权，将加权后的结果进行联合判决，作为DTX判决标准；或

将每一所述分带信号的所述特征信息变化量作为当前分带信号的判决标准，不同分带信号的判决结果一致时，将所述判决结果作为DTX判决标准；不同分带信号的判决结果不一致时，将每一所述分带信号的所述特征信息变化量进行加权，将加权后的结果进行联合判决，作为DTX判决标准。

17、一种DTX判决装置，其特征在于，包括：

分带模块，用于根据输入的信号获取分带信号；

18、如权利要求17所述DTX判决装置，其特征在于，所述信号为窄带信号，所述分带信号为低带信号。

19、如权利要求18所述DTX判决装置，其特征在于，

所述低带信号进一步包括低带核心层信号；或

20、如权利要求17所述DTX判决装置，其特征在于，所述信号为宽带信号，所述分带信号为低带信号和高带信号。

21、如权利要求20所述DTX判决装置，其特征在于，

22、如权利要求17所述DTX判决装置，其特征在于，所述信号为超宽带信号，所述分带信号为低带信号、高带信号和超高带信号。

23、如权利要求22所述DTX判决装置，其特征在于，

24、如权利要求17所述DTX判决装置，其特征在于，所述特征信息变化量获取模块进一步包括：

低带特征信息变化量获取子模块，用于获取低带信号的特征信息变化量。

25、如权利要求17所述DTX判决装置，其特征在于，所述特征信息变化量获取模块进一步包括：

低带特征信息变化量获取子模块，用于获取低带信号的特征信息变化量；

高带特征信息变化量获取子模块，用于获取高带信号的特征信息变化量。

26、如权利要求17所述DTX判决装置，其特征在于，所述特征信息变化量获取模块进一步包括：

高带特征信息变化量获取子模块，用于获取高带信号的特征信息变化量；

超高带特征信息变化量获取子模块，用于获取超高带信号的特征信息变化量。

27、如权利要求24至26中任一项所述DTX判决装置，其特征在于，所述低带特征信息变化量获取子模块进一步包括：

28、如权利要求25或26所述DTX判决装置，其特征在于，所述高带特征信息变化量获取子模块进一步包括：

29、如权利要求17所述DTX判决装置，其特征在于，所述判决模块进一步包括：

加权判决子模块，用于将所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量进行加权，将加权后的结果进行联合判决，作为DTX判决标准。

30、如权利要求29所述DTX判决装置，其特征在于，所述判决模块还包括：

分带判决子模块，用于将所述特征信息变化量获取模块获取的每一分带信号的特征信息变化量作为所述分带信号的判决标准，不同分带信号的判决结果一致时，将所述判决结果作为DTX判决标准；不同分带信号的判决结果不一致时，通知所述加权判决子模块进行联合判决。