[go: up one dir, main page]

CN102099857B - 用于解码器中的编码音频数据的频域后滤波的方法和系统 - Google Patents

用于解码器中的编码音频数据的频域后滤波的方法和系统 Download PDF

Info

Publication number
CN102099857B
CN102099857B CN200980127881.0A CN200980127881A CN102099857B CN 102099857 B CN102099857 B CN 102099857B CN 200980127881 A CN200980127881 A CN 200980127881A CN 102099857 B CN102099857 B CN 102099857B
Authority
CN
China
Prior art keywords
filter
post
decoder
data
lpc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN200980127881.0A
Other languages
English (en)
Other versions
CN102099857A (zh
Inventor
俞容山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN102099857A publication Critical patent/CN102099857A/zh
Application granted granted Critical
Publication of CN102099857B publication Critical patent/CN102099857B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

被配置为产生解码音频数据(例如,解码的语音数据)并且包含被耦合并被配置为在频域中对编码音频数据进行滤波的后滤波器的解码器,用于在解码器中对编码的音频数据进行频率后过滤的方法,以及用于在解码器中对编码的音频数据进行解码、包括通过在解码器中在频域中对编码音频数据进行后滤波的方法。在一些实施例中,解码器被配置为在不对编码的音频数据执行任何时-频域变换以为后滤波准备数据的情况下解码输入的编码音频。一般地,后滤波通过使音频信号的频谱谷区域衰减以在保留解码的音频信号的共振峰的同时去除存在于编码的输入音频中的过量的量子化噪声以避免引入不必要的畸变来提高解码的音频信号的质量。

Description

用于解码器中的编码音频数据的频域后滤波的方法和系统
(相关申请的交叉引用)
本申请要求在2008年7月18日提交的美国临时申请No.61/081800的优先权,在此通过引用将它并入。
技术领域
本发明涉及用于编码音频数据(例如,线性预测编码(LPC)语音数据、或者其它的编码语音数据或其它的音频数据)的解码的方法和系统。
背景技术
在本公开的全文中,包括在权利要求中,表达方式“编码数据”(或“代码数据”)表示通过将其它的数据(称为“输入数据”)编码产生的、并且必须执行至少一解码步骤以从中恢复输入数据(或输入数据的噪声版本)的数据。例如,如果必须在其上面执行至少一个附加的解码步骤以从中恢复输入数据,那么通过将输入数据编码产生的、并然后经受至少一个解码步骤的数据是“编码数据”。
在本公开的全文中,包括在权利要求中,术语“后滤波器(postfilter)”表示被配置为对音频数据进行滤波以减少或消除音频数据中的可听到的噪声、或者(在使用后滤波器以对编码的音频数据进行滤波的情况下)减少或消除编码音频数据的解码版本中的可听到的噪声的滤波器。
数字音频压缩系统被广泛用于现代的电信系统或家庭/个人视听娱乐系统中以减少数字音频信号的数据率。这些系统中的大多数依赖于预测或变换音频编码技术以减少音频信号的冗余,由此以最小的感知质量的损失产生信号的紧致表现(compact representation)。在预测音频编码器中,时域LPC(线性预测编码)滤波器被应用于将输入信号解相关,并且,通常通过使用矢量量子化器(quantizer)进一步压缩从LPC滤波器输出的白色残余信号。在变换音频编码器中,输入信号首先通过使用变换(例如,MDCT或FFT)从时域被转换到频域,并且,得到的频域数据值然后被量子化和编码。
已经发现,由于在预测编码中使用的LPC滤波器/残余模型与人发音(articulation)系统的机制非常相似,因此,与变换编码相比,预测编码对于纯语音信号提供更好的编码效率。另一方面,还已发现,对于将包含可在变换域(频域)中被更紧致地表现的许多正弦成分的许多音频信号(例如,音乐或不为纯语音信号的其它音频信号)编码,变换编码方案常常胜过预测编码方案。
变换预测编码模式组合上述的两种编码结构的优点,以提供可在简单的统一构架中有效地将语音、普通的音频以及混合(例如,混合的语音和音乐信号)编码的工具。在Juin-Hwey Chen and D.Wang,“Transform Predictive Coding of Wideband Speech Signals”,Proc.ICASSP 1996,pp.275-278中描述了变换预测编码方法和系统的例子。
图1是常规的变换预测编码器的框图。在图1的变换预测语音/音频编码器中,输入音频信号被采样,并且,采样(时域数字音频采样)被送到LPC分析滤波器。LPC分析滤波器去除输入信号的粗共振峰结构(语音信号的共振峰是扬声器的声道的共振频率处的信号频率成分),以产生LPC残余信号,并且还产生一组LPC参数。LPC残余信号然后被变换到频域(在图1中的标有“变换”的阶段中),以进一步利用保留于LPC残余信号中的任何信号相关性。然后,变换的LPC残余信号(包含频域数据值)被量子化和编码(在图1中的标有“量子化器”的阶段中),以实现数据率降低。用于LPC分析滤波器中的LPC参数然后与量子化的、变换的LPC残差(residual)被多路化(multiplex)(在图1中的标有“位流多路化”的阶段中),以产生压缩的音频位流。适当的常规的解码器可使用压缩的音频位流的LPC参数以重构解码的音频信号的共振峰结构。
从编码器输出的压缩的音频位流(与一系列的多组的LPC参数多路化的量子化的变换的LPC残差)被发送到解码器。变换预测语音/音频编码器的解码器执行编码器的反向信号处理。图2是用于将图1的变换预测编码器的输出解码的常规的解码器的框图。图2的第一阶段(标有“位流多路化”)将用于LPC分析滤波器和量子化的变换的LPC残差中的LPC参数去多路化(demultiplex)。量子化的变换的LPC残差被去量子化(在图2中的标有“去量子化”的阶段中),并且,去量子化的变换的LPC残差(由频域音频数据组成)被反向变换回到时域中(在图2中的标有“反向变换”的阶段中),以产生恢复的LPC残差(表示初始地在图1编码器的LPC分析滤波器中产生的LPC残差)。LPC合成滤波器用恢复的LPC参数处理恢复的LPC残差(在时域中),以产生表示初始输入到图1编码器的音频信号的恢复的时域数字音频采样。
不管是基于变换编码还是基于预测编码,音频编码系统的挑战之一是控制一般在初始输入信号被量子化和编码时引入的可听到的噪声。在现代的音频编码方案中,一般使用一些类别的知觉编码技术来控制这种编码噪声,使得噪声被初始信号中的其它主导的事件遮蔽(mask)。不幸的是,这种技术仅在音频编码器以高于一定的极限的位率工作时才有效。当音频编码器以低于该极限的位率工作时,编码噪声能变得可听到(在噪声编码数据被解码之后)。在这种情况下,必须进行一定的权衡,使得只有音频信号的基本部分以良好的保真度被表现。通过低数据率语音编码器,实际中一般牺牲语音的频谱谷区域并保留共振峰(共振峰频率附近并包含共振峰频率的区域中的语音的频率成分),原因是后者在语音感知中在知觉上是更加重要的。
由于认识到可在为了产生编码语音数据的语音采样的编码中引入过量的量子化噪声(用于解码器中的随后的解码),因此提出通过使用使解码的语音信号的频谱谷中的语音信号和噪声衰减的自适应后滤波器抑制解码器中的过量的量子化噪声。在J.-H.Chen and A.Gersho,“Adaptive Postfilter for Quality Enhancement of Coded Speech,”IEEE Transactions on Speech and Audio Processing,vol.3,no.1,Jan.1995中描述了使用的自适应后滤波器的这种噪声抑制的例子。
已提出通过在变换预测语音/音频解码器中使用自适应后滤波器抑制过量的量子化噪声。图3是包含这种后滤波器的常规的变换预测语音/音频解码器的框图。图3解码器的前四个阶段与图2系统的相同标记的阶段相同。在图3解码器中,如果在恢复的音频信号的频谱谷区域中存在过量的编码噪声,那么,为了进一步抑制这种噪声,后滤波器段接收在LPC合成滤波器中产生的时域音频数据的解压缩的(解码的)、恢复的采样并对所述采样进行运算(在时域中)。在图3解码器中,在常规上在LPC合成滤波器中使用的LPC参数也被用于后滤波器中,以适当地根据解码的信号的频谱包络线(spectral envelope)构建后滤波器。(在图3所示的类型的解码器中)实现后滤波器来实现两种滤波功能(例如,分别在后滤波器的不同的阶段中)是已知的:与在接近并包含恢复的音频信号的共振峰频率的频率区域中相比在更大程度上抑制恢复的音频信号的频谱谷区域中的过量编码噪声的短期后滤波器、以及使节距谐波之间的量子化噪声衰减的长期自适应后滤波器。
已提出为了增强噪声音频数据在频域中实现自适应后滤波。例如,Wang,et al.“Frequency Domain Adaptive Postfiltering forEnhancement of Noisy Speech,”Speech Communication,Vol.12,pp.41-56,1993描述了使用分别被耦合并被配置为接收输入音频数据的LPC分析滤波器和DFT(离散傅立叶变换)阶段的这种后滤波。DFT阶段在输入的音频上执行离散的傅立叶变换以产生频域音频数据。使用LPC分析滤波器的输出以确定后滤波器,并且,后滤波器被应用(在频域中)于频域音频数据的修改版本。但是,Wang等人没有解释或建议在解码器中实现后滤波器以在频域中对解码器中的编码音频数据(例如,在变换预测编码器和其它的音频数据编码器中产生的编码音频数据)进行运算,或者如何实现这种后滤波器。
在2005年9月6日授权的美国专利6941263描述了用于(在频域中)对在解码器中解码(合成)的语音数据进行滤波的后滤波器。解码器在编码语音数据(所述编码语音数据在预测编码器中的LPC分析滤波器中经受了编码)上执行LPC合成,以产生合成的语音信号(所述合成的语音信号包含语音数据的时域采样),然后在合成的语音信号上执行时-频域变换以产生指示合成的语音信号的频域数据,然后在频域数据在频域中执行后滤波,并然后在后滤波的数据上执行频-时域变换,以产生后滤波的、合成的语音信号。可能希望在不在解码器中执行任何时-频域变换以为后滤波准备数据的情况下在解码器在频域中实现后滤波,以在解码器中实现对编码的数据的后滤波、并且以产生感知质量比常规的频域后滤波可获得的感知质量好的输出音频的方式在解码器中对编码数据在频域中实现后滤波。
发明内容
在一类实施例中,本发明是被配置为通过解码编码的音频数据(例如,编码的语音数据)产生解码的音频数据(例如,解码的语音数据)的解码器。解码器包含被耦合并被配置为在频域中对编码音频数据(例如,在编码器中产生并作为解码器的输入的编码输入音频数据,或者这种编码输入音频数据的部分解码的版本)进行滤波的后滤波器(例如,频域自适应后滤波器)。解码器被配置为在不对编码的音频数据(例如,编码输入音频数据或其部分解码的版本)执行任何时-频域变换以为后滤波器中的滤波准备数据的情况下解码输入的编码音频数据。
在另一类实施例中,本发明是被配置为通过解码在变换预测编码器(例如,变换预测语音/音频编码器)中产生的编码的音频数据(例如,编码的语音数据)来产生解码的音频数据(例如,解码的语音数据)的解码器。解码器包含被耦合和配置为在变换预测编码器的固有频域中对编码的音频数据(例如,在变换预测编码器中产生的编码的输入音频数据,或者这种编码输入音频数据的部分解码的版本)进行滤波的后滤波器。
在任意类的典型的实施例中,由后滤波器执行的后滤波通过使其频谱谷区域衰减,以去除存在于编码输入音频中的过量的量子化噪声(当在编码输入音频中存在过量的量子化噪声时)、同时保留解码的音频信号的共振峰以避免引入不必要的畸变,来提高解码的音频信号的质量。在典型的实施例中,当编码的输入音频数据指示语音或像语音的音频信号并且在以低数据率工作的音频编码器中产生时,后滤波器是特别有用的。在典型的实施例中,当编码的输入音频数据指示同时包含语音和音乐的混合音频信号时,后滤波器也是有用和有利的。
可以以硬件、固件或软件实现本发明的后滤波器。在典型的实施例中,本发明的解码器为或包含可编程数字信号处理器或者通用或专用计算机系统,并且,在由数字信号处理器或计算机系统执行的软件或固件中实现后滤波器。在其它的实施例中,本发明的解码器为或包含数字信号处理器(例如,流水线数字信号处理器),并且,在数字信号处理器中的硬件中实现后滤波器。
在一些优选的实施例中,本发明的解码器的后滤波器被耦合和配置为接收LPC残差数据并在频域中滤波LPC残差数据。在一些情况下,解码器包含去量子化器(例如,包含去量子化器的子系统),并且,LPC残差数据在去量子化器中产生,并且指示去量子化的变换的LPC残差。在其它的实施例中,解码器包含组合的去量子化器和后滤波器,并且,LPC残差数据指示量子化的变换的LPC残差。组合的去量子化器和后滤波器接收LPC残差数据并在频域中对所述LPC残差数据进行运算,以产生后滤波和去量子化的LPC残差。
在一些优选的实施例中,本发明的解码器的后滤波器具有传递函数
Figure BDA0000044151240000061
这里,ω是频率(例如,ω是表示包含要被后滤波的数据值的音频信号段的频率,或者,要被后滤波的各数据值是具有频率ω的频率成分),并且,
H ( z ) = ( 1 - μz - 1 ) 1 - P ( z / β ) 1 - P ( z / α ) , z = e j ω ′ ,
α、β和μ是满足0<β<α<1和0<μ<1的参数,
是音频信号段的LPC预测算子,这里,ai,i=1、...、M是LPC系数,以及M是LPC预测顺序(order),并且,
G是增益滤波器(
Figure BDA0000044151240000072
的函数)。
在典型的实施例中,增益滤波器G为:
G ( e j ω ′ ) = G = [ 1 / ∫ 0 π | H ( e jω ) | 2 dω ] 1 / 2
在一些优选的实施例中,本发明的解码器的后滤波器具有传递函数
Figure BDA0000044151240000074
并且后滤波器将去量子化的变换的LPC残差信号的各数据值(与频率ω关联)乘以值
Figure BDA0000044151240000075
因此,简单地通过
Figure BDA0000044151240000076
给出各数据值(与频率ω关联)的后滤波值。在这种后滤波之后,后滤波的LPC残差信号被逆变换(到时域)。
本发明的其它方法是用于在本发明的解码器的任意实施例中在频域中后滤波编码的音频数据的方法。本发明的其它方面是用于在本发明的解码器的任意实施例中解码编码的音频数据(例如,编码的语音数据)的方法,各所述的解码方法包括在解码器中在频域中后滤波编码的音频数据的步骤。
附图说明
图1是常规的变换预测编码器的框图。
图2是用于解码图1的编码器的输出的常规的解码器的框图。
图3是用于解码图1编码器的输出的另一常规的解码器的框图,包括对在LPC合成滤波器中产生的时域音频数据的解压缩(解码)、恢复的采样进行运算(在时域中)的后滤波器(例如,自适应后滤波)。
图4是被配置为用于将图1所示的类型的编码器的输出解码的本发明的解码器的实施例的框图。
图5是被配置为用于将图1所示的类型的编码器的输出解码的本发明的解码器的另一实施例的框图。
具体实施方式
本发明的许多的实施例在技术上是可以的。本领域技术人员根据本公开将清楚如何实现它们。
参照图4描述本发明的解码器的第一实施例。图4解码器的前两个阶段可与图3的常规的解码器的相同标记的阶段相同,并且,图4解码器的第四和第五状态可分别与图3解码器的相同标记的第三和第四阶段相同。在图4解码器中,后滤波器(解码器的第三阶段)接收在第二(去量子化器)阶段中产生的去量子化的变换的LPC残差并且在频域中对所述去量子化的变换的LPC残差进行运算,以产生后滤波(“增强”)的变换的LPC残差。增强的变换的LPC残差(由频域音频数据组成)在第四阶段(在图4中标有“逆变换”)中被逆变换到时域,以产生增强的LPC残差。
图4的后滤波器使用恢复的LPC参数(在解码器的第一阶段中从量子化的变换的LPC残差去多路化,并被送到后滤波器),以自适应地确定用于产生增强的LPC残差的当前的后滤波器参数。LPC合成滤波器(解码器的第五阶段)用恢复的LPC参数处理时域中的增强的LPC残差,以产生指示原始输入到编码器中的音频信号的恢复的时域数字音频采样。
将参照图5描述本发明的解码器的第二实施例。图5解码器的第一阶段可与图3的常规的解码器的相同标记的阶段相同,并且,图5解码器的第三和第四阶段可分别与图3解码器的相同标记的第三和第四状态相同。在图5解码器中,组合的去量子化器和后滤波器(解码器的第二阶段)接收已与解码器的第一阶段中的LPC参数分离(去多路化)的量子化的变换的LPC残差,并在频域中对所述量子化的变换的LPC残差进行运算,以产生后滤波和去量子化(“增强”)的变换的LPC残差。增强的变换的LPC残差(包含频域音频数据)在第三阶段(在图5中标有“逆变换”)中被逆变换到时域,以产生增强的LPC残差。
图5的后滤波器使用恢复的LPC参数(在解码器的第一阶段中从量子化的变换的LPC残差去多路化,并被送到后滤波器),以自适应地确定用于产生增强的LPC残差的当前的后滤波器参数。LPC合成滤波器(解码器的第四阶段)用恢复的LPC参数处理时域中的增强的LPC残差,以产生指示原始输入到编码器中的音频信号的恢复的时域数字音频采样。
图4和图5中的每一个的解码器被配置为对输入的编码的音频数据进行解码,而不在编码音频数据(例如,编码的输入音频数据或编码的输入音频数据的部分解码的版本)上执行任何时-频域变换以为后滤波器中的后滤波准备数据。并且,图4和图5中的每一个的解码器被配置为通过解码在预测变换语音/音频编码器中产生的编码的音频数据(例如,编码的语音数据)来产生解码的音频数据(例如,解码的语音数据),并且,解码器的后滤波器被耦合并被配置为在变换预测编码器的固有频域中对在变换预测编码器中产生的编码的输入的音频数据(或这种编码的输入的音频数据的部分解码的版本)进行滤波。
本发明解码器的频域后滤波器(例如,图4的后滤波器和图5的后滤波器)优选在解码的音频信号的共振峰(共振峰是接近并包含共振峰频率的区域中的解码信号的频率成分)中提供平坦和统一的响应,并优选仅使解码的信号的频谱谷区域衰减。为了适于改变音频信号的特性,后滤波器优选在时间上具有自适应性。
对于要被解码的音频信号的任意给定段,后滤波器可被实现为以后面描述的方式具有希望的响应。描述将参照以下的极点-零点滤波器(pole-zero filter):
H ( z ) = ( 1 - &mu;z - 1 ) 1 - P ( z / &beta; ) 1 - P ( z / &alpha; ) , 0 < &beta; < &alpha; < 1,0 < &mu; < 1
在该极-零滤波器中,
Figure BDA0000044151240000092
是相关音频信号段的LPC预测算子,这里,ai,i=1、...、M是LPC系数,M是LPC预测顺序。在变换预测解码器中,可容易地从压缩的位流(被送到解码器的输入的编码的音频位流)得到LPC系数ai。参数α、β和μ控制后滤波器的衰减的总体斜率(音频信号的频率振幅谱的总体倾斜或平均倾斜)和水平,并且在确定后滤波器的质量中扮演重要的角色。已发现以下的参数在图4的后滤波器(和图5的后滤波器)的典型实现中给出令人满意的结果:
a=0.8,β=0.5和μ=0.5
为了避免改变解码输出的总体响度,优选进一步归一化后滤波器的增益。通过将频域滤波器H乘以增益滤波器(这里有时称为增益正确因子)G完成这一点。在典型的实施例中,G的值(对于频率位置ω处的相关音频信号段)为:
G = [ 1 / &Integral; 0 &pi; | H ( e j&omega; ) | 2 d&omega; ] 1 / 2
下面我们描述用于实现本发明的实施例中的频域后滤波器的两种方法,其中本发明的解码器为变换预测语音/音频解码器:
1.在第一方法(这里有时称为“显式”方法)中,如下实现后滤波器
Figure BDA0000044151240000102
这里,ω是与要被后滤波的各数据值关联的频率,符号“·”表示简单的乘法。在后滤波的LPC残差信号被逆变换之前,来自去量子化器的去量子化的变换的LPC残差信号的各数据值(与频率ω关联)被乘以值
Figure BDA0000044151240000103
因此,简单地通过
Figure BDA0000044151240000104
给出各数据值(与频率ω关联)的后滤波值。一般地,存在用于各频率ω的一个数据值(要被后滤波),但是,在一些实施例中,一组两个或更多个数据值(均要被后滤波)中的各数据值与单个频率ω(例如,与该组数据值关联的频率的中心频率)关联。可根据显式的方法实现图4的后滤波器。
2.在第二方法(这里有时称为“隐式”方法)中,与频率ω关联的各数据值的频域中的后滤波(例如,通过后滤波器G·H(ω),这里,符号“·”表示简单的乘法)与各个这种数据值(也在频域中)的去量子化的运算组合。根据实际使用的去量子化器的设计实现组合的后滤波和去量子化运算。例如,如果使用格子去量子化器,那么优选使得去量子化器的重构点为后滤波器(优选为后滤波器G·H(ω))的振幅响应的函数,使得在后滤波器的振幅响应较小的频率位置处产生变化较小的输出。可根据隐式方法实现图5的后滤波器。
虽然这里描述了本发明的特定的实施例和本发明的应用,但本领域技术人员容易理解,在不背离这里描述和要求保护的本发明的范围的情况下,这里描述的实施例和应用的许多变更方式是可以的。应当理解,虽然示出和描述了本发明的某些形式,但是,本发明不限于描述和表示的特定的实施例或描述的特定的方法。

Claims (19)

1.一种解码器,被配置为响应指示在变换预测编码器中产生的编码的输入音频数据的输入音频产生解码的音频数据,所述解码器包含:
被耦合并被配置为在频域中对编码的音频数据进行滤波的后滤波器,其中,所述解码器被配置为在不对编码的音频数据执行任何时-频域变换以为后滤波器中的滤波准备数据的情况下对编码的输入音频数据进行解码,
其中,所述后滤波器具有传递函数
Figure FDA00001985137000011
这里,ω是频率,并且其中,
H ( z ) = ( 1 - &mu; z - 1 ) 1 - P ( z / &beta; ) 1 - P ( z / &alpha; ) , z = e j &omega; &prime; ,
α、β和μ是满足0<β<α<1和0<μ<1的参数,
是音频信号段的LPC预测算子,这里,ai,i=1、…、M是LPC系数,以及M是LPC预测顺序,并且,
G是增益滤波器。
2.根据权利要求1的解码器,其中,所述后滤波器是频域自适应后滤波器。
3.根据权利要求1的解码器,还包括:
被耦合为接收所述输入音频并被配置为响应所述输入音频产生部分解码的音频数据的第一子系统,并且其中,所述后滤波器被耦合和配置为在频域中对所述部分解码的音频数据进行滤波。
4.根据权利要求1的解码器,其中,所述输入音频指示编码的输入音频数据和量子化噪声,解码的音频数据指示解码的音频信号,并且,所述后滤波器被配置为对所述编码的音频数据进行滤波,以通过使音频信号的频谱谷区域衰减以在保留解码的音频信号的共振峰的同时去除量子化噪声中的至少一些来提高解码的音频信号的质量。
5.根据权利要求1的解码器,其中,编码的输入音频数据包含LPC残差数据,并且所述后滤波器被耦合和配置为接收所述LPC残差数据并在频域中对所述LPC残差数据进行滤波。
6.根据权利要求1的解码器,其中,所述编码的输入音频数据包含量子化的LPC残差数据,并且其中,所述解码器还包括含有去量子化器的子系统,该子系统被配置为响应所述输入音频产生去量子化的LPC残差数据,并且所述后滤波器与所述子系统耦合并被配置为接收所述去量子化的LPC残差数据以及在频域中对所述去量子化的LPC残差数据进行滤波。
7.根据权利要求1的解码器,其中,所述编码的输入音频数据包含量子化的LPC残差数据,并且,所述解码器还包含:
被配置为从所述输入音频提取量子化的LPC残差数据的第一子系统,
并且其中,所述后滤波器是被耦合并被配置为响应量子化的LPC残差数据、包括通过在频域中对所述量子化的LPC残差数据进行滤波来产生去量子化的后滤波的LPC残差数据的所述解码器的组合的去量子化和后滤波子系统。
8.根据权利要求1的解码器,其中,增益滤波器G为:
G ( e j &omega; &prime; ) = G = [ 1 / &Integral; 0 &pi; | H ( e j&omega; ) | 2 d&omega; ] 1 / 2 .
9.根据权利要求1的解码器,还包括被配置为响应所述输入音频产生去量子化的变换的LPC残差的子系统,并且其中,所述后滤波器与所述子系统耦合并被配置为将与所述去量子化的变换的LPC残差的频率ω关联的各数据值乘以值
Figure FDA00001985137000031
10.一种解码器,被配置为响应指示在具有固有频域的变换预测编码器中产生的编码的输入音频数据的输入音频产生解码的音频数据,所述解码器包含:
被耦合和配置为在所述变换预测编码器的固有频域中对编码的音频数据进行滤波的后滤波器,其中,所述解码器被配置为在不对编码的音频数据执行任何时-频域变换以为后滤波器中的滤波准备数据的情况下对编码的输入音频数据进行解码,
其中,所述后滤波器具有传递函数
Figure FDA00001985137000032
这里,ω是频率,并且其中,
H ( z ) = ( 1 - &mu; z - 1 ) 1 - P ( z / &beta; ) 1 - P ( z / &alpha; ) , z = e j &omega; &prime; ,
α、β和μ是满足0<β<α<1和0<μ<1的参数,
是音频信号段的LPC预测算子,这里,ai,i=1、…、M是LPC系数,以及M是LPC预测顺序,并且,
G是增益滤波器。
11.根据权利要求10的解码器,其中,所述后滤波器是频域自适应后滤波器。
12.根据权利要求10的解码器,还包括:
被耦合为接收输入音频并被配置为响应所述输入音频产生部分解码的音频数据的第一子系统,并且其中,所述后滤波器被耦合和配置为在所述变换预测编码器的固有频域中对所述部分解码的音频数据进行滤波。
13.根据权利要求10的解码器,其中,编码的输入音频数据包含LPC残差数据,并且所述后滤波器被耦合和配置为接收LPC残差数据并在频域中对所述LPC残差数据进行滤波。
14.根据权利要求10的解码器,其中,所述编码的输入音频数据包含量子化的LPC残差数据,并且其中,所述解码器还包括含有去量子化器的子系统,该子系统被配置为响应所述输入音频产生去量子化的LPC残差数据,并且所述后滤波器与所述子系统耦合并被配置为接收所述去量子化的LPC残差数据以及在频域中对所述去量子化的LPC残差数据进行滤波。
15.一种解码器,被配置为响应指示在具有固有频域的变换预测编码器中产生的编码的输入音频数据的输入音频产生解码的音频数据,所述解码器包含:
被耦合和配置为在所述变换预测编码器的固有频域中对编码的音频数据进行滤波的后滤波器,其中,所述输入音频指示编码的输入音频数据和量子化噪声,以及解码的音频数据指示解码的音频信号,并且,所述后滤波器被配置为对所述编码的音频数据进行滤波,以通过使音频信号的频谱谷区域衰减以在保留解码的音频信号的共振峰的同时去除量子化噪声中的至少一些来提高解码的音频信号的质量,
其中,所述后滤波器具有传递函数
Figure FDA00001985137000041
这里,ω是频率,并且其中,
H ( z ) = ( 1 - &mu; z - 1 ) 1 - P ( z / &beta; ) 1 - P ( z / &alpha; ) , z = e j &omega; &prime; ,
α、β和μ是满足0<β<α<1和0<μ<1的参数,
Figure FDA00001985137000043
是音频信号段的LPC预测算子,这里,ai,i=1、…、M是LPC系数,以及M是LPC预测顺序,并且,
G是增益滤波器。
16.一种解码器,被配置为响应指示在具有固有频域的变换预测编码器中产生的编码的输入音频数据的输入音频产生解码的音频数据,所述解码器包含:
被耦合和配置为在所述变换预测编码器的固有频域中对编码的音频数据进行滤波的后滤波器,其中,所述编码的输入音频数据包含量子化的LPC残差数据,并且,所述解码器还包含:
被配置为从所述输入音频提取所述量子化的LPC残差数据的第一子系统,
并且其中,所述后滤波器是被耦合并被配置为响应量子化的LPC残差数据、包括通过在频域中对所述量子化的LPC残差数据进行滤波来产生去量子化的后滤波的LPC残差数据的所述解码器的组合的去量子化和后滤波子系统,
其中,所述后滤波器具有传递函数这里,ω是频率,并且其中,
H ( z ) = ( 1 - &mu; z - 1 ) 1 - P ( z / &beta; ) 1 - P ( z / &alpha; ) , z = e j &omega; &prime; ,
α、β和μ是满足0<β<α<1和0<μ<1的参数,
是音频信号段的LPC预测算子,这里,ai,i=1、…、M是LPC系数,以及M是LPC预测顺序,并且,
G是增益滤波器。
17.一种解码器,被配置为响应指示在具有固有频域的变换预测编码器中产生的编码的输入音频数据的输入音频产生解码的音频数据,所述解码器包含:
被耦合和配置为在所述变换预测编码器的固有频域中对编码的音频数据进行滤波的后滤波器,其中,所述后滤波器具有传递函数
Figure FDA00001985137000054
其中,ω是频率,并且其中,
H ( z ) = ( 1 - &mu; z - 1 ) 1 - P ( z / &beta; ) 1 - P ( z / &alpha; ) , z = e j &omega; &prime; ,
α、β和μ是满足0<β<α<1和0<μ<1的参数,
Figure FDA00001985137000061
是音频信号段的LPC预测算子,这里,ai,i=1、…、M是LPC系数,以及M是LPC预测顺序,并且,
G是增益滤波器。
18.根据权利要求17的解码器,其中,所述增益滤波器G为:
G ( e j &omega; &prime; ) = G = [ 1 / &Integral; 0 &pi; | H ( e j&omega; ) | 2 d&omega; ] 1 / 2 .
19.根据权利要求17的解码器,还包括被配置为响应所述输入音频产生去量子化的变换的LPC残差的子系统,并且其中,所述后滤波器与所述子系统耦合并被配置为将与所述去量子化的变换的LPC残差的频率ω关联的各数据值乘以值
Figure FDA00001985137000063
CN200980127881.0A 2008-07-18 2009-07-14 用于解码器中的编码音频数据的频域后滤波的方法和系统 Active CN102099857B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US8180008P 2008-07-18 2008-07-18
US61/081,800 2008-07-18
PCT/US2009/050501 WO2010009098A1 (en) 2008-07-18 2009-07-14 Method and system for frequency domain postfiltering of encoded audio data in a decoder

Publications (2)

Publication Number Publication Date
CN102099857A CN102099857A (zh) 2011-06-15
CN102099857B true CN102099857B (zh) 2013-03-13

Family

ID=41305677

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200980127881.0A Active CN102099857B (zh) 2008-07-18 2009-07-14 用于解码器中的编码音频数据的频域后滤波的方法和系统

Country Status (5)

Country Link
US (1) US20110125507A1 (zh)
EP (1) EP2347412B1 (zh)
CN (1) CN102099857B (zh)
ES (1) ES2396173T3 (zh)
WO (1) WO2010009098A1 (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8315398B2 (en) 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
US8538042B2 (en) * 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
ES2501840T3 (es) * 2010-05-11 2014-10-02 Telefonaktiebolaget Lm Ericsson (Publ) Procedimiento y disposición para el procesamiento de señales de audio
US9576590B2 (en) * 2012-02-24 2017-02-21 Nokia Technologies Oy Noise adaptive post filtering
US9312829B2 (en) 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
CN108269586B (zh) 2013-04-05 2022-04-05 杜比实验室特许公司 使用高级频谱延拓降低量化噪声的压扩装置和方法
RU2625444C2 (ru) * 2013-04-05 2017-07-13 Долби Интернэшнл Аб Система обработки аудио
EP2887350B1 (en) * 2013-12-19 2016-10-05 Dolby Laboratories Licensing Corporation Adaptive quantization noise filtering of decoded audio data
JP6398226B2 (ja) 2014-02-28 2018-10-03 セイコーエプソン株式会社 発光素子、発光装置、認証装置および電子機器
EP2980799A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using a harmonic post-filter
WO2020207593A1 (en) 2019-04-11 2020-10-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, apparatus for determining a set of values defining characteristics of a filter, methods for providing a decoded audio representation, methods for determining a set of values defining characteristics of a filter and computer program

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890108A (en) * 1995-09-13 1999-03-30 Voxware, Inc. Low bit-rate speech coding system and method using voicing probability determination
CN1254433A (zh) * 1997-03-03 2000-05-24 艾利森电话股份有限公司 用于语音解码器的高分辨率后处理方法
WO2005073959A1 (en) * 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
GB2388502A (en) * 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7590523B2 (en) * 2006-03-20 2009-09-15 Mindspeed Technologies, Inc. Speech post-processing using MDCT coefficients
KR20080073926A (ko) * 2007-02-07 2008-08-12 삼성전자주식회사 오디오 신호를 복호화하는 장치에서 이퀄라이저를 구현하는방법 및 이를 위한 장치
KR100922897B1 (ko) * 2007-12-11 2009-10-20 한국전자통신연구원 Mdct 영역에서 음질 향상을 위한 후처리 필터장치 및필터방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5890108A (en) * 1995-09-13 1999-03-30 Voxware, Inc. Low bit-rate speech coding system and method using voicing probability determination
CN1254433A (zh) * 1997-03-03 2000-05-24 艾利森电话股份有限公司 用于语音解码器的高分辨率后处理方法
WO2005073959A1 (en) * 2004-01-28 2005-08-11 Koninklijke Philips Electronics N.V. Audio signal decoding using complex-valued data

Also Published As

Publication number Publication date
WO2010009098A1 (en) 2010-01-21
EP2347412B1 (en) 2012-10-03
US20110125507A1 (en) 2011-05-26
WO2010009098A4 (en) 2010-03-11
EP2347412A1 (en) 2011-07-27
ES2396173T3 (es) 2013-02-19
CN102099857A (zh) 2011-06-15

Similar Documents

Publication Publication Date Title
CN102099857B (zh) 用于解码器中的编码音频数据的频域后滤波的方法和系统
RU2485606C2 (ru) Схема кодирования/декодирования аудио сигналов с низким битрейтом с применением каскадных переключений
JP5165559B2 (ja) オーディオコーデックポストフィルタ
RU2389085C2 (ru) Способы и устройства для введения низкочастотных предыскажений в ходе сжатия звука на основе acelp/tcx
EP2041745B1 (en) Adaptive encoding and decoding methods and apparatuses
US8738385B2 (en) Pitch-based pre-filtering and post-filtering for compression of audio signals
JP4567238B2 (ja) 符号化方法、復号化方法、符号化器、及び復号化器
TWI469136B (zh) 在一頻譜域中用以處理已解碼音訊信號之裝置及方法
KR101508819B1 (ko) 멀티 모드 오디오 코덱 및 이를 위해 적응된 celp 코딩
TWI330828B (en) Method,computer-readable medium and apparatus of signal processing
KR101373004B1 (ko) 고주파수 신호 부호화 및 복호화 장치 및 방법
CN105957532B (zh) 对音频/语音信号进行编码和解码的方法和设备
JP3483958B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
RU2648953C2 (ru) Наполнение шумом без побочной информации для celp-подобных кодеров
JP2009541802A (ja) 動的可変ワーピング特性を有するオーディオエンコーダ、オーディオデコーダ及びオーディオプロセッサ
RU2642894C2 (ru) Аудиодекодер, имеющий модуль расширения полосы частот с модулем регулирования энергии
EP4205107B1 (en) Multi-channel signal generator, audio encoder and related methods relying on a mixing noise signal
CN103999153B (zh) 用于以带选择的方式量化语音信号的方法和设备
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
JPH09127987A (ja) 信号符号化方法及び装置
RU2809646C1 (ru) Генератор многоканальных сигналов, аудиокодер и соответствующие способы, основанные на шумовом сигнале микширования
JP3598111B2 (ja) 広帯域音声復元装置
KR20080092823A (ko) 부호화/복호화 장치 및 방법
JP3560964B2 (ja) 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法
HK40088493B (zh) 依赖混合噪声信号的多声道信号产生器、音频编码器及相关方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant