CN1734555A - 恢复音频数据的高频分量的方法和设备 - Google Patents
恢复音频数据的高频分量的方法和设备 Download PDFInfo
- Publication number
- CN1734555A CN1734555A CNA2005100842636A CN200510084263A CN1734555A CN 1734555 A CN1734555 A CN 1734555A CN A2005100842636 A CNA2005100842636 A CN A2005100842636A CN 200510084263 A CN200510084263 A CN 200510084263A CN 1734555 A CN1734555 A CN 1734555A
- Authority
- CN
- China
- Prior art keywords
- window type
- filter bank
- high frequency
- frequency band
- current frame
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
一种在音频解码器中恢复MP3编码的音频信号的高频分量的方法和设备。该方法包括:从根据窗口类型从输入的比特流中提取的修正离散余弦变换(MDCT)系数生成低频带的滤波器组值;根据窗口类型提取帧的瞬态信息并根据提取的瞬态信息选择权重系数;从低频带的生成的滤波器组值恢复高频带的滤波器组值;以及根据权重系数调整恢复的高频分量的恢复的滤波器组值。
Description
本申请要求于2004年8月4日提交到韩国知识产权局的第10-2004-0061423号韩国专利申请的优先权,该申请公开于此以资参考。
技术领域
本发明总的概念涉及一种音频编码/解码系统,更具体地说,涉及一种在音频解码器中恢复MPEG层3(通常所知的MP3)编码的音频信号的高频分量的方法和设备。
背景技术
音频运动图像专家组(MPEG)是一种用于以高质量和高性能对立体声音频进行编码的ISO/IEC的标准,其中ISO表示国际标准化组织,IEC表示国际电工委员会。通过在如数字电视(DTV)、数字视频光盘(DVD)、数字音频广播(DAB)、以及MP3播放器的各种应用产品中组合MPEG标准音频和MPEG标准视频,可实现高性能多媒体数据压缩。具有“*.mp3”扩展名的MP3音频指的是通过MPEG-1音频层3标准的方法被编码的音频。此外,MP3音频使用通过忽略人类听觉对其具有低敏感性的细节信息来减少编码的量的知觉编码方法被编码。
然而,如果MP3音频数据被加重编码,则MP3音频数据的高频分量会损失。由于这种高频带的损失,产生音质变化并且声音的清晰度下降,从而输出受抑止的和/或模糊的声音。因此,频带复制(SBR)方法的MP3pro格式被用于恢复损失的高频分量。此外,后处理声音品质改善被应用于恢复的高频分量。
图1是示出使用SBR方法的传统MP3pro解码器的框图。
参照图1,解码器110将在频域中输入的MP3pro比特流解码成为时域中的脉码调制(PCM)音频数据和辅助数据。PCM音频数据被划分为左声道音频数据和右声道音频数据,辅助数据包括包络信息。正交镜像滤波器(QMF)分析器120将在时域中的PCM音频数据转换成为在频域中的32频带低频分量信号。高频生成器130根据包络信息生成高频分量,从而该高频分量具有与通过QMF分析器120转换的低频分量的标准频率相似的标准频率。包络调整器140使用低频带的频谱根据包络信息调整高频分量的能量。QMF合成器150合成通过包络调整器140调整的高频分量以及通过QMF分析器120分析的低频分量信号的能量,将合成的高频和低频分量转换成在时域中的音频数据,并输出该音频数据。因此,高频分量被恢复。声道划分器160输出具有根据由解码器110生成的辅助数据划分的左声道和右声道的音频数据。
也就是说,通过解码器110解码的MP3音频数据的高频分量通过如QMF分析器120、高频生成器130、包络调整器140、以及QMF合成器150的后处理器被恢复。然而,由于SBR方法使用后处理器,所以具有以下两个问题。
首先,在解码的MP3文件被转换成频域信号之后,从信号的频率分量中估计高频分量。估计的高频分量被转换成时域信号,被加入到解码的MP3文件中,并输出。在使用SBR方法的传统的MP3解码方法中,需要两个在时域信号和频域信号之间转换的过程。因此,使用SBR方法的传统的MP3解码方法需要在时域/频域转换过程中的大量的计算。
其次,由于使用SBR方法的MP3pro解码器处理从编码器中获得频谱包络信息以恢复在频域中的高频分量,所以使用其它传统的编码方法的MP3编码器不可与MP3pro解码器一起使用,必须被重构。也就是说,使用SBR方法的MP3pro解码器不能从不包括频谱包络信息的传统MP3文件中恢复高频分量。
发明内容
本发明总的概念提供一种恢复音频数据的高频分量的方法,其再现由于在传统的音频编解码方法中的高频分量的损失而恶化的原始声音的音频。通过使用MP3解码处理,恢复音频数据的高频分量的方法通过恢复损失的高频分量增加了原始声音的音质的清晰度。
本发明总的概念还提供一种用于通过应用恢复音频数据的高频的方法来恢复音频数据的高频分量的设备。
本发明总的概念的其它方面和优点将在下面的描述中部分地阐述,并且将从描述中变得显而易见,或可通过本发明总的概念实践被理解。
本发明总的概念的前述和/或其它方面和优点通过提供一种恢复压缩的音频信号的高频分量的方法被实现,该方法包括:从根据窗口类型从输入的比特流中提取的修正的离散余弦变换(MDCT)系数生成低频带的滤波器组值;根据该窗口类型提取输入的比特流的帧的瞬态信息,并且根据提取的瞬态信息选择权重系数;从生成的低频带的滤波器组值恢复损失的高频带的滤波器组值;以及根据选择的权重系数调整恢复的高频分量的恢复的滤波器组值。
本发明总的概念的前述和/或其它方面和优点还通过提供一种恢复压缩的音频信号的高频分量的设备被实现,该设备包括:逆量化器,其通过逆量化输入的压缩的音频比特流提取MDCT系数;逆MDCT单元,其从由逆量化器提取的MDCT系数生成低频带的滤波器组值;权重系数提取器,其根据由逆MDCT单元使用的窗口类型提取帧的瞬态信息,并且根据提取的瞬态信息选择权重系数以调整高频分量的大小;高频带生成器,其从由逆MDCT单元生成的低频带的滤波器组值恢复高频带的滤波器组值;以及乘法器,其将由权重系数提取器选择的权重系数与由高频带生成器恢复的高频带的滤波器组值相乘。
附图说明
通过下面结合附图进行的对实施例的描述,本发明总的概念的这些和/或其他方面和优点将会变得更加清楚和易于理解,其中:
图1是示出使用SBR方法的传统的MP3pro解码器的框图;
图2是示出根据本发明总的概念的实施例的使用高频恢复方法的MP3解码器的示意图;
图3A到3D示出根据本发明总的概念的实施例的恢复高频分量的过程;
图4是示出根据本发明总的概念的实施例的恢复高频的音频数据的方法的流程图。
具体实施方式
现将详细描述其例子在附图中被示出的本发明总的概念的实施例,其中,相同的标号始终描述相同的部件。以下将参照附图描述实施例以解释本发明总的概念。
输入到根据本发明总的概念的MP3解码器的MP3比特流由以下过程形成。第一步,脉码调制(PCM)音频数据被输入。第二步,对每一颗粒(执行编码的最小单元(576个采样))输入的PCM音频数据被划分为576个采样。第三步,通过将MPEG-1层3(MP3)的心理声学模型应用于该采样获得感知能量。第四步,将从心理声学模型中获得的感知能量与阈值进行比较,以确定修正的离散余弦变换(MDCT)窗口类型。根据MP3标准,该窗口类型包括长窗口、开始窗口、短窗口、以及停止窗口。这些窗口彼此交叠以防止混叠。窗口类型的局部部分或整个部分可根据阈值切换。也就是说,如果感知能量的级别比阈值大,则由于感知能量对应于能量级别突然增加的上升状态的信号,所以选择短窗口。此外,如果感知能量的级别小于阈值,则由于感知能量对应于能量级别在其中是恒定的状态的信号,所以选择长窗口。第五步,对应于每一选择的窗口范围的采样被MDCT处理,并被转换成在频域中的数据。开始窗口或停止窗口被用于切换长窗口到短窗口,反之亦然。第六步,根据分配的比特的数量,频域的MDCT处理的数据被量化。最后,量化的数据使用霍夫曼编码方法形成MP3比特流。MP3比特流包括多个帧单元。MP3帧格式包括头、边信息,以及主要数据。边信息包括如比例因子和窗口类型的用于对主要数据进行解码的信息。
图2是示出根据本发明总的概念的实施例的使用高频恢复方法的MP3解码器的框图。
参照图2,该MP3解码器包括:逆量化器210、边信息分析器220、逆MDCT单元230、高频带分析器250、高频带生成器260、权重系数提取器240、乘法器270、加法器280、以及逆多相滤波器组单元290。权重系数提取器240包括瞬态信息检测器242和权重表选择器244。
逆量化器210从输入的MP3比特流中提取MDCT系数。逆量化的MDCT系数分布在低频带。
边信息分析器220通过分析来自MP3比特流的边信息提取窗口类型。
逆MDCT单元230使用由边信息分析器220提取的窗口类型根据由逆量化器210提取的MDCT系数生成滤波器组值。
瞬态信息检测器242根据由逆MDCT单元230使用的窗口类型检测当前帧的瞬态信息。也就是说,瞬态信息检测器242确定:当窗口类型为“长”时,当前帧在非瞬态区域中;当窗口类型为“短”时,当前帧在瞬态区域中;以及当窗口类型为“开始”或“停止”时,当前帧在过渡区域中。
权重表选择器244根据由瞬态信息检测器242检测的瞬态信息选择权重系数以调整高频分量的权重。例如,当当前帧被确定在瞬态区域中时,具有大权重的谐波分量被选择,当当前帧被确定在非瞬态区域中时,具有小权重的谐波分量被选择,当当前帧被确定在过渡区域中时,具有中等权重的谐波分量被选择。
高频带分析器250通过分析由逆MDCT单元230生成的滤波器组值检测损失的高频带。例如,参照图3A,在96Kbps的MP3文件中,在32个滤波器组值中的超过11.025KHz的频率分量(即频带16到32的滤波器组值)损失。相似地,虽然未示出,但在128Kbps的MP3文件中,在32个滤波器组值中的超过15KHz的频率分量损失。
因此,逆MDCT单元230将关于MP3比特流的频域信息提供给频带分析器250,从而高频带分析器250可检测损失的高频带的高频分量。具体地说,逆MDCT单元230将低频带的滤波器组值提供给高频带分析器250。另一方面,逆MDCT单元230将与当前帧关联的窗口类型提供给权重系数提取器240的瞬态信息检测器242,从而瞬态信息检测器242可检测在MP3比特流中的多个帧中的当前帧的瞬态信息。可在MP3编码比特流的时间确定与当前帧关联的窗口的类型。具体地说,在MP3比特流中的多个帧中的每一个可与相应的窗口类型关联。这样,由于本发明总的概念的MP3解码器根据窗口类型和其低频分量恢复MP3比特流的损失的高频分量,所以无需在频域和时域之间的转换。
高频带生成器260恢复由高频带分析器250检测的损失的高频分量。参照图3B,96Kbps的MP3文件作为例子现将被描述。由于在32个滤波器组值中超过11.025KHz的频率分量已经损失,所以应该根据频带8到15的滤波器组值来恢复具有“0”值的频带16到32的滤波器组值。例如,由于频带16具有与频带8的谐波频率相似的谐波频率,所以频带8的滤波器组值被复制到频带16的滤波器组值。同样地,频带9的滤波器组值被复制到频带18的滤波器组值。此外,根据人类知觉特性,由于人类将不同的频率感觉为相同的频率的带宽在高频带是宽的,所以恢复的频带18的滤波器组值被复制到频带19的滤波器组值。语音声音通常具有小于6KHz的频率分量。当使用包括语音声音的低频分量(即低于6KHz)生成高频分量时,对应于在高频带存在的语音声音的频率分量存在问题。因此,在低于5.5KHz的低频带中的频带1到7的滤波器组值不被用于恢复高频分量。
参照图3B-3D,由于频带16、18、20、22......30具有与频带8、9、10、11......15的谐波频率相似的谐波频率,所以频带8、9、10、11......15的滤波器组值被复制到频带16、18、20、22......30的滤波器组值。此外,根据人类知觉特性,由于在高频带中人们将不同的频率觉察为相同的频率的带宽是宽的,所以频带16、18、20、22......30的滤波器组值被复制到频带17、19、21、23......31的滤波器组值。因为频带32的滤波器组值几乎不影响声音品质,所以其被忽略。
乘法器270通过将由权重表选择器244选择的权重系数乘以如图3C和3D所示的高频分量来调整高频分量的大小。图3C示出当当前帧在瞬态区域中时恢复的谐波分量。参照图3C,具有大权重的谐波分量在瞬态区域中生成。图3D示出当当前帧在非瞬态区域中时恢复的谐波分量。参照图3D,具有小权重的谐波分量在非瞬态区域中生成。
加法器280将由逆MDCT单元230生成的低频带的滤波器组值和由乘法器270生成的高频带的滤波器组值相加。
逆多相滤波器组单元290将具有恢复的高频分量的滤波器组值合成成为子频带,并通过使合成的子频带通过合成滤波器来恢复PCM音频数据。
图4是示出根据本发明总的概念的实施例的恢复音频数据的高频的方法的流程图。
参照图4,在操作410中,具有包括多个帧单元的压缩的音频数据的MP3比特流被输入到解码器。
在操作420中,通过逆量化输入的压缩的音频比特流,MDCT系数被提取。同时通过分析MP3比特流的边信息,窗口类型被提取。
在操作430中,通过根据窗口类型执行MDCT系数的逆MDCT来生成低频带的滤波器组值。在操作424中,根据窗口类型,瞬态信息随后被提取,在操作426中,根据提取的瞬态信息,从系数表中选择用于调整高频分量的大小的权重系数。
在操作440中,通过分析低频带的滤波器组值检测损失的高频带。
在操作450中,从低频带的滤波器组值恢复高频带的滤波器组值。
在操作460中,通过将从系数表中选择的权重系数和恢复的高频带的滤波器组值相乘来调整高频分量的大小。
在操作470中,将通过执行MDCT系数的逆MDCT生成的低频带的滤波器组值与调整的高频带的滤波器组值进行相加。
在操作480中,在将具有恢复的高频分量的滤波器组值合成为子频带后,通过使子频带通过合成滤波器来恢复PCM音频数据。
本发明总的概念不限于以上描述的实施例,本领域的普通技术人员将理解,在不脱离本发明总的概念的精神和范围的情况下,可对其在形式和细节上进行各种改变。也就是说,本发明总的概念可被应用于例如MP3播放器、膝上电脑、以及PC的各种音频再现装置以恢复音频数据的高频分量。
如上所述,根据本发明总的概念的实施例,由于在MP3解码过程期间当恢复损失的高频分量时无需已被传统地使用的域转换过程,所以可使用传统的MP3编码器,可用最小的计算量来改善MP3的声音品质。
虽然本发明总的概念的一些实施例已被示出和描述,但本领域技术人员应理解,在不脱离由所附权利要求及其等同物限定的范围的本发明总的概念的原理和精神的情况下,可对实施例进行改变。
Claims (46)
1、一种恢复压缩的音频信号的高频分量的方法,该方法包括:
从根据窗口类型从输入比特流中提取的修正离散余弦变换(MDCT)系数生成低频带的滤波器组值;
根据窗口类型提取输入比特流的帧的瞬态信息,并根据提取的瞬态信息选择权重系数;
从生成的低频带的滤波器组值恢复损失的高频带的滤波器组值;以及
根据选择的权重系数调整恢复的高频分量的滤波器组值。
2、如权利要求1所述的方法,其中,帧的瞬态信息的提取包括:
参照在逆MDCT中使用的窗口类型提取当前帧的瞬态信息;以及
根据提取的当前帧的瞬态信息选择权重系数以调整恢复的高频分量的滤波器组值的权重。
3、如权利要求2所述的方法,其中,瞬态信息包括瞬态区域信息、非瞬态区域信息、以及过渡区域信息。
4、如权利要求2所述的方法,其中,当窗口类型是‘长’时,当前帧在非瞬态区域中;当窗口类型是‘短’时,当前帧在瞬态区域中;以及当窗口类型是‘开始’或‘停止’时,当前帧在过渡区域中。
5、如权利要求1所述的方法,其中,滤波器组值的恢复包括:
将选择的权重系数和高频分量的滤波器组值相乘。
6、一种恢复在具有多个音频帧的数据比特流的高频带中的损失的高频分量的方法,该方法包括:
根据其一个或多个频谱系数确定一个或多个低频分量的滤波器组值;
根据与该一个或多个低频分量的滤波器组值的谐波相似性确定一个或多个损失的高频分量的估计的滤波器组值;
根据一个或多个根据在由对应于当前帧的窗口类型限定的当前帧中检测的瞬态信息确定的相应的权重系数调整该一个或多个估计的滤波器组值;以及
将调整的该一个或多个滤波器组值和该一个或多个低频分量的滤波器组值相结合以获得数据比特流的完全频带。
7、如权利要求6所述的方法,还包括:
接收在频域中的数据比特流;以及
将完全的数据比特流的频带转换到时域,并输出该数据比特流。
8、如权利要求6所述的方法,其中,根据该一个或多个相应的权重系数调整该一个或多个估计的滤波器组值的包括:
读取与数据比特流一起接收的边信息以确定当前帧的窗口类型;
根据确定的窗口类型确定当前帧的瞬态信息;
根据确定的当前帧的瞬态信息选择权重系数;以及
将该一个或多个估计的滤波器组值中的每一个与选择的权重系数相乘。
9、如权利要求8所述的方法,其中,窗口类型是长窗口类型、短窗口类型、开始窗口类型、以及停止窗口类型中的一种。
10、如权利要求9所述的方法,其中,当窗口类型是长窗口类型时,当前帧的瞬态信息被确定为在非瞬态区域中;当窗口类型是短窗口类型时,当前帧的瞬态信息被确定为在瞬态区域中;以及当窗口类型是开始窗口类型和停止窗口类型中的一种时,当前帧的瞬态信息被确定为在过渡区域中。
11、如权利要求9所述的方法,其中,当窗口类型是短窗口类型时,选择的权重系数是大的;当窗口类型是长窗口类型时,选择的权重系数是小的;以及当窗口类型是开始窗口类型和停止窗口类型中的一种时,选择的权重系数是中值。
12、如权利要求6所述的方法,还包括:
接收包括在频域中的多个音频帧的音频数据的数据比特流以及包括对应于该多个音频数据的音频帧的多个窗口类型的边信息。
13、如权利要求6所述的方法,其中,根据其该一个或多个频谱系数的低频分量来确定一个或多个滤波器组值包括:
分析与数据比特流关联的边信息以确定当前帧的窗口类型;以及
根据一个或多个频谱系数和窗口类型生成低频分量的一个或多个滤波器组值。
14、如权利要求6所述的方法,还包括:
从数据比特流的低频带提取该一个或多个频谱系数。
15、如权利要求6所述的方法,其中,该损失的高频分量的一个或多个估计的滤波器组值的确定包括:根据相似的低频带的非语音频率分量估计该损失的高频分量的滤波器组值。
16、如权利要求6所述的方法,其中,一个或多个频谱系数包括一个或多个修正的离散余弦变换系数。
17、如权利要求6所述的方法,其中,该一个或多个低频分量的滤波器组值的确定包括:
根据当前帧的窗口类型确定该一个或多个频谱系数的逆修正的离散余弦变换。
18、一种恢复通过解码器接收的音频数据比特流的高频带的损失的高频分量的方法,该方法包括:
根据与低频带的低频分量的相似性推导损失的高频带的高频分量;以及
根据音频数据比特流的当前帧的瞬态信息对推导的高频分量权重。
19、如权利要求18所述的方法,其中,低频带和高频带包括32个滤波器组值,损失的高频带的高频分量的推导包括根据频带8到15的滤波器组值恢复频带16到32的滤波器组值。
20、如权利要求18所述的方法,其中,无需在时域与频域之间转换,可执行损失的高频分量的推导和对推导的高频分量加权重。
21、如权利要求18所述的方法,其中,损失的高频带的高频分量的推导包括:根据人类知觉特性从在低频带中的低频分量复制滤波器组值。
22、一种对数据比特流进行解码并无需在时域和频域之间进行变换而恢复其高频分量的方法,该方法包括:
接收包括频域信息的数据比特流和关于该数据比特流的瞬态信息;
根据相似的低频分量的值和关于该数据比特流的瞬态信息恢复损失的高频分量;以及
输出在频域中的恢复的高频分量和低频分量的组合。
23、如权利要求22所述的方法,其中,数据比特流是MP3音频数据比特流,数据比特流的损失的高频分量的恢复包括:
根据低频分量估计该损失的高频分量;
根据由瞬态信息确定的与低频分量的期望的相似性对该估计的高频分量加权重。
24、如权利要求22所述的方法,其中,瞬态信息承载在数据比特流中作为一个或多个窗口类型。
25、一种恢复压缩的音频信号的高频分量的设备,该设备包括:
逆量化器,用于通过逆量化输入的压缩的音频比特流来提取MDCT系数;
逆MDCT单元,用于从由逆量化器提取的MDCT系数生成低频带的滤波器组值;
权重系数提取器,用于根据由逆MDCT单元使用的窗口类型提取帧的瞬态信息,以及根据提取的瞬态信息选择权重系数以调整高频分量的大小;
高频带生成器,用于从由逆MDCT单元生成的低频带的滤波器组值恢复高频带的滤波器组值;以及
乘法器,用于将由权重系数提取器选择的权重系数与由高频带生成器恢复的高频带的滤波器组值相乘。
26、如权利要求25所述的设备,还包括:
加法器,用于将由逆MDCT单元生成的低频带的滤波器组值与由乘法器生成的高频带的滤波器组值相加。
27、如权利要求25所述的设备,其中,权重系数提取器包括:
瞬态信息检测器,用于根据由逆MDCT单元使用的窗口类型检测当前帧的瞬态信息;以及
权重系数选择器,用于从预定的系数表中选择对应于由瞬态信息检测器检测的瞬态信息的权重系数。
28、一种用于恢复在具有多个音频帧的数据比特流的高频带中的损失的高频分量的解码器,包括:
输入单元,用于根据其一个或多个频谱系数确定低频分量的一个或多个滤波器组值,并检测当前帧的窗口类型;
高频带生成器,用于根据与该一个或多个低频分量的滤波器组值相似的谐波确定一个或多个损失的高频分量的估计的滤波器组值;
调整单元,用于根据根据在由当前帧的窗口类型限定的当前帧中检测的瞬态信息确定的一个或多个相应的权重系数来调整该一个或多个估计的滤波器组值;以及
组合单元,用于将调整的一个或多个滤波器组值与一个或多个低频分量的滤波器组值进行组合以获得数据比特流的完全频带。
29、如权利要求28所述的解码器,其中,
输入单元接收在频域中的数据比特流;以及
组合单元将数据比特流的完全频带转换到时域并输出该数据比特流。
30、如权利要求28所述的解码器,其中,调整单元包括:
边信息分析器,用于读取与数据比特流一起接收的边信息,并用于根据读取的边信息确定当前帧的窗口类型;
瞬态信息检测器,用于根据确定的窗口类型确定当前帧的瞬态信息;
权重表选择器,用于根据当前帧的确定的瞬态信息选择权重系数;以及
乘法器,用于将该一个或多个估计的滤波器组值中的每一个与选择的权重系数相乘。
31、如权利要求30所述的解码器,其中,窗口类型是长窗口类型、短窗口类型、开始窗口类型、以及停止窗口类型中的一种。
32、如权利要求31所述的解码器,其中,瞬态信息检测器确定:当窗口类型是长窗口类型时,当前帧在非瞬态区域中;当窗口类型是短窗口类型时,当前帧在瞬态区域中;当窗口类型是开始窗口类型和停止窗口类型中的一种时,当前帧在过渡区域中。
33、如权利要求31所述的解码器,其中,当窗口类型是短窗口类型时,权重表选择器选择大的权重系数;当窗口类型是长窗口类型时,权重表选择器选择小的权重系数;当窗口类型是开始窗口类型和结束窗口类型中的一种时,权重表选择器选择中值的权重系数。
34、如权利要求28所述的解码器,其中,输入单元接收包括在频域中的多个音频帧的音频数据和包括多个对应于该音频数据的音频帧的窗口类型的边信息。
35、如权利要求28所述的解码器,其中,高频带生成器包括:
边信息分析器:用于分析与数据比特流相关联的边信息以确定当前帧的窗口类型;以及
逆MDCT单元,用于根据该窗口类型和该一个或多个频谱系数生成一个或多个低频分量的滤波器组值。
36、如权利要求28所述的解码器,还包括:
逆量化器,用于从数据比特流的低频带提取一个或多个频谱系数。
37、如权利要求28所述的解码器,其中,高频带生成器根据相似的低频带的非语音频率分量估计损失的高频分量的滤波器组值。
38、如权利要求28所述的解码器,其中,该一个或多个频谱系数包括一个或多个修正的离散余弦变换系数。
39、如权利要求28所述的解码器,其中,输入单元包括:逆MDCT单元,用于根据当前帧的窗口类型确定一个或多个频谱系数的逆修正的余弦变换。
40、一种用于恢复音频数据比特流的高频带的损失的高频分量的解码设备,包括:
推导单元,用于根据与低频带的低频分量的相似性推导高频带的损失的高频分量;以及
权重单元,用于根据音频数据比特流的当前帧的瞬态信息对推导的高频分量加权重。
41、如权利要求40所述的设备,其中,低频带和高频带包括32个滤波器组值,推导单元通过根据频带8到15的滤波器组值恢复频带16到32的滤波器组值来推导损失的高频分量。
42、如权利要求40所述的设备,其中,推导单元和权重单元不进行时域和频域之间的转换接收音频数据比特流,恢复损失的高频分量,以及输出低频带和高频带的组合。
43、如权利要求40所述的设备,其中,推导单元根据人类知觉特征从在低频带中的低频分量复制滤波器组值。
44、一种无需在时域和频域之间变换对数据比特流解码并恢复高频分量的设备,该设备包括:
输入单元,用于接收包括频域信息的数据比特流以及关于该数据比特流的瞬态信息;
恢复单元,用于根据相似的低频分量的值以及关于数据比特流的瞬态信息恢复数据比特流的损失的高频分量;以及
输出单元,用于输出在频域中的恢复的高频分量和低频分量的组合。
45、如权利要求44所述的设备,其中,数据比特流是MP3音频数据比特流,恢复单元包括:
高频带估计器,用于根据低频分量估计损失的高频分量;以及
权重单元,用于根据由瞬态信息确定的与低频分量的期望的相似性对估计高频分量加权重。
46、如权利要求44所述的设备,其中,瞬态信息承载在数据比特流中作为一个或多个窗口类型。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| KR1020040061423 | 2004-08-04 | ||
| KR1020040061423A KR100608062B1 (ko) | 2004-08-04 | 2004-08-04 | 오디오 데이터의 고주파수 복원 방법 및 그 장치 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| CN1734555A true CN1734555A (zh) | 2006-02-15 |
Family
ID=36076940
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| CNA2005100842636A Pending CN1734555A (zh) | 2004-08-04 | 2005-07-15 | 恢复音频数据的高频分量的方法和设备 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US20060031075A1 (zh) |
| JP (1) | JP2006048043A (zh) |
| KR (1) | KR100608062B1 (zh) |
| CN (1) | CN1734555A (zh) |
| IT (1) | ITMI20051351A1 (zh) |
| NL (1) | NL1029619C2 (zh) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102822891A (zh) * | 2010-04-13 | 2012-12-12 | 索尼公司 | 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序 |
| CN102834864A (zh) * | 2010-04-13 | 2012-12-19 | 索尼公司 | 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法、以及程序 |
| CN101611440B (zh) * | 2007-01-05 | 2013-02-13 | 法国电信 | 一种使用加权窗的低延时变换编码的方法 |
| CN104541327A (zh) * | 2012-02-23 | 2015-04-22 | 杜比国际公司 | 用于高频音频内容的有效恢复的方法及系统 |
| CN105190747A (zh) * | 2012-10-05 | 2015-12-23 | 弗朗霍夫应用科学研究促进协会 | 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法 |
| CN109243485A (zh) * | 2018-09-13 | 2019-01-18 | 广州酷狗计算机科技有限公司 | 恢复高频信号的方法和装置 |
| CN109414170A (zh) * | 2015-12-07 | 2019-03-01 | 三星电子株式会社 | 电子设备及其控制方法 |
| CN111201569A (zh) * | 2017-10-25 | 2020-05-26 | 三星电子株式会社 | 电子装置及其控制方法 |
Families Citing this family (39)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR100530377B1 (ko) * | 2003-12-30 | 2005-11-22 | 삼성전자주식회사 | 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법 |
| KR100707177B1 (ko) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | 디지털 신호 부호화/복호화 방법 및 장치 |
| ATE458361T1 (de) * | 2005-12-13 | 2010-03-15 | Nxp Bv | Einrichtung und verfahren zum verarbeiten eines audio-datenstroms |
| DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
| JP4967618B2 (ja) * | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
| MX2009006201A (es) | 2006-12-12 | 2009-06-22 | Fraunhofer Ges Forschung | Codificador, decodificador y metodos para codificar y decodificar segmentos de datos que representan una corriente de datos del dominio temporal. |
| FR2911228A1 (fr) * | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
| KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
| JP5098530B2 (ja) * | 2007-09-12 | 2012-12-12 | 富士通株式会社 | 復号化装置、復号化方法および復号化プログラム |
| KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
| US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
| KR101413967B1 (ko) * | 2008-01-29 | 2014-07-01 | 삼성전자주식회사 | 오디오 신호의 부호화 방법 및 복호화 방법, 및 그에 대한 기록 매체, 오디오 신호의 부호화 장치 및 복호화 장치 |
| KR101441896B1 (ko) * | 2008-01-29 | 2014-09-23 | 삼성전자주식회사 | 적응적 lpc 계수 보간을 이용한 오디오 신호의 부호화,복호화 방법 및 장치 |
| KR101441897B1 (ko) * | 2008-01-31 | 2014-09-23 | 삼성전자주식회사 | 잔차 신호 부호화 방법 및 장치와 잔차 신호 복호화 방법및 장치 |
| US8983831B2 (en) | 2009-02-26 | 2015-03-17 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, and method therefor |
| KR101320963B1 (ko) * | 2009-03-31 | 2013-10-23 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 신호 잡음 제거 방법, 신호 잡음 제거 장치, 및 오디오 디코딩 시스템 |
| JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
| ES2805349T3 (es) | 2009-10-21 | 2021-02-11 | Dolby Int Ab | Sobremuestreo en un banco de filtros de reemisor combinado |
| JP5652658B2 (ja) * | 2010-04-13 | 2015-01-14 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
| JP6103324B2 (ja) * | 2010-04-13 | 2017-03-29 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
| KR101826331B1 (ko) * | 2010-09-15 | 2018-03-22 | 삼성전자주식회사 | 고주파수 대역폭 확장을 위한 부호화/복호화 장치 및 방법 |
| IL317702A (en) * | 2010-09-16 | 2025-02-01 | Dolby Int Ab | Method and system for harmonic, block, subchannel, and enhanced transposition by rhetorical multiplication |
| CN102436820B (zh) | 2010-09-29 | 2013-08-28 | 华为技术有限公司 | 高频带信号编码方法及装置、高频带信号解码方法及装置 |
| JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
| WO2012160472A1 (en) * | 2011-05-26 | 2012-11-29 | Koninklijke Philips Electronics N.V. | An audio system and method therefor |
| JP5942358B2 (ja) | 2011-08-24 | 2016-06-29 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
| KR101897455B1 (ko) | 2012-04-16 | 2018-10-04 | 삼성전자주식회사 | 음질 향상 장치 및 방법 |
| CN105229735B (zh) * | 2013-01-29 | 2019-11-01 | 弗劳恩霍夫应用研究促进协会 | 用于编码模式切换补偿的技术 |
| RU2622872C2 (ru) * | 2013-04-05 | 2017-06-20 | Долби Интернэшнл Аб | Аудиокодер и декодер для кодирования по форме волны с перемежением |
| EP2830054A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework |
| US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
| KR101498113B1 (ko) * | 2013-10-23 | 2015-03-04 | 광주과학기술원 | 사운드 신호의 대역폭 확장 장치 및 방법 |
| US9922660B2 (en) * | 2013-11-29 | 2018-03-20 | Sony Corporation | Device for expanding frequency band of input signal via up-sampling |
| CA3162763C (en) | 2013-12-27 | 2025-07-08 | Sony Corporation | DECODING APPARATUS, METHOD AND PROGRAM |
| US10460736B2 (en) * | 2014-11-07 | 2019-10-29 | Samsung Electronics Co., Ltd. | Method and apparatus for restoring audio signal |
| WO2016142002A1 (en) | 2015-03-09 | 2016-09-15 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal |
| TWI809289B (zh) | 2018-01-26 | 2023-07-21 | 瑞典商都比國際公司 | 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體 |
| CN112289343B (zh) * | 2020-10-28 | 2024-03-19 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频修复方法、装置及电子设备和计算机可读存储介质 |
| CN113035205B (zh) * | 2020-12-28 | 2022-06-07 | 阿里巴巴(中国)有限公司 | 音频丢包补偿处理方法、装置及电子设备 |
Family Cites Families (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS58145998A (ja) * | 1982-02-25 | 1983-08-31 | ソニー株式会社 | 音声過渡点検出方法 |
| US4797926A (en) * | 1986-09-11 | 1989-01-10 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech vocoder |
| US5222189A (en) * | 1989-01-27 | 1993-06-22 | Dolby Laboratories Licensing Corporation | Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio |
| CA2032765C (en) * | 1989-12-21 | 1995-12-12 | Hidetaka Yoshikawa | Variable rate encoding and communicating apparatus |
| CN1062963C (zh) * | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
| US5189701A (en) * | 1991-10-25 | 1993-02-23 | Micom Communications Corp. | Voice coder/decoder and methods of coding/decoding |
| US5214708A (en) * | 1991-12-16 | 1993-05-25 | Mceachern Robert H | Speech information extractor |
| US5893065A (en) * | 1994-08-05 | 1999-04-06 | Nippon Steel Corporation | Apparatus for compressing audio data |
| JP2976860B2 (ja) * | 1995-09-13 | 1999-11-10 | 松下電器産業株式会社 | 再生装置 |
| US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
| SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| GB2326572A (en) * | 1997-06-19 | 1998-12-23 | Softsound Limited | Low bit rate audio coder and decoder |
| US6233550B1 (en) * | 1997-08-29 | 2001-05-15 | The Regents Of The University Of California | Method and apparatus for hybrid coding of speech at 4kbps |
| US6115689A (en) | 1998-05-27 | 2000-09-05 | Microsoft Corporation | Scalable audio coder and decoder |
| SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
| SE0004818D0 (sv) | 2000-12-22 | 2000-12-22 | Coding Technologies Sweden Ab | Enhancing source coding systems by adaptive transposition |
| CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
| EP1701340B1 (en) * | 2001-11-14 | 2012-08-29 | Panasonic Corporation | Decoding device, method and program |
| KR100472442B1 (ko) * | 2002-02-16 | 2005-03-08 | 삼성전자주식회사 | 웨이브렛 패킷 변환을 이용한 오디오 압축 방법 및 그시스템 |
| US6985856B2 (en) * | 2002-12-31 | 2006-01-10 | Nokia Corporation | Method and device for compressed-domain packet loss concealment |
| KR20050027179A (ko) * | 2003-09-13 | 2005-03-18 | 삼성전자주식회사 | 오디오 데이터 복원 방법 및 그 장치 |
-
2004
- 2004-08-04 KR KR1020040061423A patent/KR100608062B1/ko not_active Expired - Fee Related
-
2005
- 2005-05-10 US US11/125,152 patent/US20060031075A1/en not_active Abandoned
- 2005-07-14 IT IT001351A patent/ITMI20051351A1/it unknown
- 2005-07-15 CN CNA2005100842636A patent/CN1734555A/zh active Pending
- 2005-07-26 NL NL1029619A patent/NL1029619C2/nl not_active IP Right Cessation
- 2005-07-29 JP JP2005221617A patent/JP2006048043A/ja not_active Withdrawn
Cited By (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN101611440B (zh) * | 2007-01-05 | 2013-02-13 | 法国电信 | 一种使用加权窗的低延时变换编码的方法 |
| CN102822891A (zh) * | 2010-04-13 | 2012-12-12 | 索尼公司 | 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序 |
| CN102834864A (zh) * | 2010-04-13 | 2012-12-19 | 索尼公司 | 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法、以及程序 |
| CN102822891B (zh) * | 2010-04-13 | 2014-05-07 | 索尼公司 | 信号处理装置及方法、编码装置及方法、解码装置及方法、以及程序 |
| CN102834864B (zh) * | 2010-04-13 | 2014-06-25 | 索尼公司 | 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法 |
| CN107993673A (zh) * | 2012-02-23 | 2018-05-04 | 杜比国际公司 | 确定噪声混合因子的方法、系统、编码器、解码器和介质 |
| CN104541327B (zh) * | 2012-02-23 | 2018-01-12 | 杜比国际公司 | 用于高频音频内容的有效恢复的方法及系统 |
| CN104541327A (zh) * | 2012-02-23 | 2015-04-22 | 杜比国际公司 | 用于高频音频内容的有效恢复的方法及系统 |
| US9984695B2 (en) | 2012-02-23 | 2018-05-29 | Dolby International Ab | Methods and systems for efficient recovery of high frequency audio content |
| CN107993673B (zh) * | 2012-02-23 | 2022-09-27 | 杜比国际公司 | 确定噪声混合因子的方法、系统、编码器、解码器和介质 |
| CN105190747A (zh) * | 2012-10-05 | 2015-12-23 | 弗朗霍夫应用科学研究促进协会 | 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法 |
| CN105190747B (zh) * | 2012-10-05 | 2019-01-04 | 弗朗霍夫应用科学研究促进协会 | 用于空间音频对象编码中时间/频率分辨率的反向兼容动态适应的编码器、解码器及方法 |
| CN109414170A (zh) * | 2015-12-07 | 2019-03-01 | 三星电子株式会社 | 电子设备及其控制方法 |
| CN109414170B (zh) * | 2015-12-07 | 2021-09-21 | 三星电子株式会社 | 电子设备及其控制方法 |
| CN111201569A (zh) * | 2017-10-25 | 2020-05-26 | 三星电子株式会社 | 电子装置及其控制方法 |
| CN111201569B (zh) * | 2017-10-25 | 2023-10-20 | 三星电子株式会社 | 电子装置及其控制方法 |
| CN109243485A (zh) * | 2018-09-13 | 2019-01-18 | 广州酷狗计算机科技有限公司 | 恢复高频信号的方法和装置 |
| CN109243485B (zh) * | 2018-09-13 | 2021-08-13 | 广州酷狗计算机科技有限公司 | 恢复高频信号的方法和装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| NL1029619A1 (nl) | 2006-02-07 |
| JP2006048043A (ja) | 2006-02-16 |
| KR100608062B1 (ko) | 2006-08-02 |
| US20060031075A1 (en) | 2006-02-09 |
| KR20060012783A (ko) | 2006-02-09 |
| NL1029619C2 (nl) | 2006-07-25 |
| ITMI20051351A1 (it) | 2006-02-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN1734555A (zh) | 恢复音频数据的高频分量的方法和设备 | |
| JP3579047B2 (ja) | オーディオ復号装置と復号方法およびプログラム | |
| EP1334484B1 (en) | Enhancing the performance of coding systems that use high frequency reconstruction methods | |
| JP4741476B2 (ja) | 符号化装置 | |
| JP5485909B2 (ja) | オーディオ信号処理方法及び装置 | |
| US8639500B2 (en) | Method, medium, and apparatus with bandwidth extension encoding and/or decoding | |
| US20220148606A1 (en) | Apparatus and method for generating an enhanced signal using independent noise-filling | |
| JP5975243B2 (ja) | 符号化装置および方法、並びにプログラム | |
| KR101375582B1 (ko) | 대역폭 확장 부호화 및 복호화 방법 및 장치 | |
| US20040002854A1 (en) | Audio coding method and apparatus using harmonic extraction | |
| CN1252678C (zh) | 可缩放的立体声音频编码/解码方法及装置 | |
| JP6573887B2 (ja) | オーディオ信号の符号化方法、復号方法及びその装置 | |
| KR100378796B1 (ko) | 디지탈 오디오 부호화기 및 복호화 방법 | |
| KR20050027179A (ko) | 오디오 데이터 복원 방법 및 그 장치 | |
| CN101673545A (zh) | 一种编解码方法及装置 | |
| JP2008519990A (ja) | 信号符号化の方法 | |
| Yu et al. | A scalable lossy to lossless audio coder for MPEG-4 lossless audio coding | |
| Deriche et al. | A novel scalable audio coder based on warped linear prediction and the wavelet transform | |
| HK1058096B (zh) | 增强使用高频重建方法的编码系统的性能 | |
| HK1082092B (zh) | 音频解码设备以及解码方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| C06 | Publication | ||
| PB01 | Publication | ||
| C10 | Entry into substantive examination | ||
| SE01 | Entry into force of request for substantive examination | ||
| C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
| WD01 | Invention patent application deemed withdrawn after publication |