TWI470621B - 以適應性低頻補償編碼音頻資料的方法、編碼器與系統 - Google Patents
以適應性低頻補償編碼音頻資料的方法、編碼器與系統 Download PDFInfo
- Publication number
- TWI470621B TWI470621B TW101135106A TW101135106A TWI470621B TW I470621 B TWI470621 B TW I470621B TW 101135106 A TW101135106 A TW 101135106A TW 101135106 A TW101135106 A TW 101135106A TW I470621 B TWI470621 B TW I470621B
- Authority
- TW
- Taiwan
- Prior art keywords
- low frequency
- frequency bands
- audio
- index
- compensation
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 92
- 230000003044 adaptive effect Effects 0.000 title claims description 22
- 239000000463 material Substances 0.000 claims description 177
- 238000012937 correction Methods 0.000 claims description 57
- 230000008569 process Effects 0.000 claims description 33
- 230000004044 response Effects 0.000 claims description 29
- 238000012545 processing Methods 0.000 claims description 27
- 238000001514 detection method Methods 0.000 claims description 26
- 230000005236 sound signal Effects 0.000 description 31
- 230000005284 excitation Effects 0.000 description 24
- 230000006870 function Effects 0.000 description 23
- 230000001965 increasing effect Effects 0.000 description 8
- HFFUXLCRPYMGFM-UHFFFAOYSA-N 1-fluoro-4-[2-(4-fluorophenyl)ethynyl]benzene Chemical compound C1=CC(F)=CC=C1C#CC1=CC=C(F)C=C1 HFFUXLCRPYMGFM-UHFFFAOYSA-N 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 6
- 238000013139 quantization Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000007774 longterm Effects 0.000 description 3
- 230000009467 reduction Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000008878 coupling Effects 0.000 description 2
- 238000010168 coupling process Methods 0.000 description 2
- 238000005859 coupling reaction Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Description
本發明屬於音頻信號處理,且更特別地,屬於具備適應性低頻補償之音頻資料的編碼。本發明之若干實施例係有用於依據熟知為Dolby Digital(AC-3)及Dolby Digital Plus(E-AC-3)之格式的其中一者,或依據另外的編碼格式,而編碼音頻資料。Dolby,Dolby Digital,及Dolby Digital Plus係Dolby Laboratories Licensing Corporation的商標。
雖然本發明未受限於在依據AC-3(Dolby Digital)格式(或Dolby Digital Plus格式)而編碼音頻資料之中使用,但為便利起見,將在實施例中敘述其中本發明係依據AC-3格式而編碼音頻位元流。AC-3編碼之位元流包含一至六個頻道的音頻內容,及表示該音頻內容之至少一特徵的元資料。該音頻內容係已使用知覺音頻編碼而予以壓縮之音頻資料。
AC-3(亦熟知為Dolby Digital)編碼之細節係熟知的,且被陳述於許多公開的參考文件中,包含以下:ATSC Sandard A52/A:Digital Audio Compression Standard(AC-3),修正版A,先進電視系統協會,2001年8月20日;“Flexible Perceptual Coding for Audio Transmission
and Storage”,C.Todd等人,第96屆音頻工程學會會議,1994年2月26日,預印本3796;“Design and Implementation of AC-3 Coders”,Steve Vernon,IEEE Trans.Consumer Electronics,第41冊,第3號,1995年8月;“Dolby Digital Audio Coding Standards”,2009年,CRC刊物,Vijay K.Madisetti所主筆之第二版的數位信號處理手冊中之Robert L.Andersen及Grant A.Davidson的章節;“High Quality,Low-Rate Audio Transform Coding for Transmission and Multimedia Applications”,Bosi等人,音頻工程學會預印本3365,第93屆AES會議,1992年10月;以及美國專利5,583,962;5,632,005;5,633,981;5,727,119;及6,021,386。
Dolby Digital(AC-3)及Dolby Digital Plus(有時候稱為增強型AC-3或“E-AC-3”)編碼之細節係陳述於AES會議論文6196“Introduction to Dolby Digital Plus,an Enhancement to the Dolby Digital Coding System”中,第117屆AES會議,2004年10月28日,及在Dolby Digital/Dolby Digital Plus Specification(ATSC A/52:2010)中,可獲得於http://www.atsc.org/cms/index.php/standards/published-standards。
在音頻位元流的AC-3編碼中,將被編碼之輸入音頻取樣的區塊經受時間至頻率域變換,而產生一般稱為變換係數、頻率係數、或頻率成分之頻域資料的區塊,座落於均勻間隔的頻率窗口中。然後,在各自窗口中之頻率係數係轉換(例如,在第1圖系統的BFPE級7中)成為包含指數及尾數的浮點格式。
AC-3(及Dolby Digital Plus)編碼器(及其他音頻資料編碼器)的典型實施例實施心理聲學模型,以頻帶為基礎分析頻域資料(亦即,典型地近似熟知的心理聲學標度(熟知為Bark標度)之頻帶的50個不均勻頻帶),而對每一個尾數決定位元的最佳分配。接著,尾數資料係量子化(例如,在第1圖系統的量子化器6中)為對應至所決定之位元分配的若干位元。然後,所量子化之尾數資料係格式化(例如,在第1圖系統的格式化器8中)為編碼之輸出位元流。
典型地,尾數位元指定係根據細密的信號頻譜(藉由用於各自頻率窗口之功率頻譜密度(“PSD”)所表示)與粗糙的掩碼曲線(藉由用於各自頻帶之掩碼值所表示)間之差異而定。亦典型地,該心理聲學模型實施低頻補償(有時候稱為“lowcomp”補償或“lowcomp”),以決定用以校正用於低頻帶之掩碼曲線值的校正值(在本文中有時候稱為“lowcomp”參數值)。各自lowcomp參數值可扣除自(或施加至)用於該等低頻帶之不同者的預掩碼曲線值,以便產生用於該頻帶之最終掩碼曲線值。
如所示地,在音頻編碼中之尾數位元指定可根據信號頻譜與掩碼曲線間之差異而定。用以實施該位元指定之簡單的演算可假定在一特殊頻帶中之量子化雜訊係與鄰近頻帶中的位元指定無關。然而,由於有限的頻率選擇性及在解碼器濾波器排組中之頻帶間的高度重疊,且由於在低頻率處自一頻帶至鄰近頻帶內的漏洩,其中掩碼曲線之斜率可相等於或超過濾波器排組之躍遷邊緣的斜率,所以典型地,此並非合理的假定,尤其在低頻率處。
因此,在音頻編碼中之尾數位元指定處理常包含決定校正掩碼曲線的低頻補償處理。然後,該校正掩碼曲線被使用以決定音頻資料之每一個頻率成分的信號對掩碼之比值。低頻補償係用於具有突出的低頻音調成分之信號的解碼器選擇性補償處理,以供增進低頻率處的編碼性能之用。典型地,低頻補償係濾波器排組的反應校正;為便利起見,其可結合至決定信號對掩碼值所使用之激勵函數的計算之內。如下文將更詳細解說地,低頻補償之典型的實施藉由搜尋具有小於下一個(較高頻率)頻帶之PSD值12 dB的PSD值之頻帶,而找尋突出的低頻信號成分。當發現該PSD值時,則立即降低用於該頻帶的激勵函數值18 dB(或直至18 dB的量)。然後,此降低係以每一隨後的頻道3 dB緩慢地退回。
第1圖係組構以執行AC-3(或增強型AC-3)編碼於時間域之輸入音頻資料1上的編碼器。分析濾波器排組2轉換該時間域之輸入音頻資料1為頻域音頻資料3,以及
區塊浮點編碼(BFPE)級7產生資料3之各自頻率成分的浮點表示,包含用於各自頻率窗口的指數及尾數。此處,來自級7所輸出之頻域資料有時候亦將稱為頻域音頻資料3。然後,將來自級7所輸出之頻域音頻資料予以編碼,包含藉由使其尾數量子化於量子化器6中且罩幕其指數(在罩幕級10中),及編碼該級10中所產生之罩幕指數(在指數編碼級11中)。格式化器8反應於來自量子化器6所輸出之量子化資料及來自級11所輸出之編碼的差動指數資料,產生AC-3(或增強型AC-3)編碼位元流9。
量子化器6根據藉由控制器4所產生之控制資料(包含掩碼資料),而執行位元分配及量子化。掩碼資料(決定掩碼曲線)係根據人的聽力及耳朵知覺之心理聲學模型(藉由控制器4所實施),而自頻域資料3產生。該心理聲學模型化考慮人的聽力之頻率相依臨限值及所謂遮蔽之心理聲學現象;因此,接近一或多個較弱的頻率成分之強的頻率成分易於遮蔽該等較弱成分,而使其無法被聆聽者聽見。此可在當編碼音頻資料時省略該等較弱的頻率成分,且可藉以獲得更高度的壓縮而不會不利地影響到編碼之音頻資料(位元流9)的感知品質。該掩碼資料包含用於頻域音頻資料3之各自頻帶的掩碼曲線值。該等掩碼曲線值表示各自頻帶中由於人的耳朵所遮蔽之信號的位準。量子化器6使用此資訊以決定使用可用數目之資料位元來表示輸入音頻信號之各自頻帶的頻域資料有多好。
控制器4可實施習知的低頻補償處理(在本文中有時候稱為“lowcomp”補償),以產生用以校正用於低頻帶之掩碼曲線值的lowcomp參數值。該等校正之掩碼曲線值係使用以產生用於頻域音頻資料3之各自頻率成分的信號對掩碼之比值。低頻補償係在音頻資料的AC-3(及Dolby Digital Plus)編碼期間所典型實施之心理聲學模型的特性。Lowcomp補償藉由優先降低相關聯之頻率區的掩碼,且因此,分配更多的位元至編碼該等成分所使用之碼字,而增進高度音調性低頻成分(將被編碼之輸入音頻資料)的編碼。
Lowcomp補償決定用於各自低頻帶的lowcomp參數。用於各自頻帶的lowcomp參數係從用於該頻帶之〝激勵〞值(其係以熟知方式決定)有效地扣除,且所生成的差異值係使用以決定校正的掩碼曲線值。針對以下理由,降低用於頻帶的激勵值(例如,藉由自該處扣除lowcomp參數,或增加自該處所扣除之lowcomp參數的值)可造成所分配至頻帶中之編碼型的音頻之位元的增加。雖然用於頻帶之激勵值無需一定要相等於最終的(校正的)掩碼值(其係從用於該頻帶之音頻資料值有效地扣除),但將被使用於最終掩碼值的計算中(該最終掩碼值考慮絕對聽力臨限值及潛在地,其他寬帶及/或頻帶的調整)。因為若用於頻帶之〝信號對掩碼〞比係愈大時,則所分配至頻帶中之音頻的編碼位元數目會更大,所以降低用於頻帶之掩碼值將增加所分配至該頻帶中之編碼型式的音頻之位元
數目。因此,降低用於頻帶的激勵值通常導致用於該頻帶之降低的掩碼值,且因而,增加用於該頻帶之所分配位元的數目。
接著,將更詳細地敘述其中習知之lowcomp補償將藉由心理聲學模型(例如,藉由第1圖之控制器4所實施的模型)而被典型地執行之方式。控制器4將透過低頻帶而掃描(在從0 Hz到2.05 kHz的範圍中,以48 kHz取樣頻率),以搜尋目前頻帶與隨後(更高頻率)頻帶間之功率頻譜密度(PSD)中的陡峭(12dB)增加,其係強的音調成分之一特徵。反應於辨識低頻帶中之PSD為強的音調成分之指示,lowcomp補償係施加以致使更多位元被分配到要編碼所辨之強的低頻音調成分所使用之資料。
將瞭解的是,在AC-3及Dolby Digital Plus編碼中,頻域資料3的各自成分(亦即,各自變換窗口的內容)具有包含尾數及指數的浮點表示。為簡化掩碼曲線的計算,Dolby Digital家族的編碼器僅使用指數以衍生掩碼曲線。或者,換言之,該掩碼曲線係根據變換係數指數值而定,但與變換係數尾數值無關。因為指數的範圍係略為受限(大致地,來自0至24的整數值),所以為計算掩碼曲線之目的,該等指數值係以較大範圍(大致地,來自0至3072的整數值)而映像至PSD標度上。因此,最強烈的頻率成分(亦即,具有0之指數的該等者)係映像至3072的PSD值,而最柔和的頻域資料成分(亦即,具有24之指數的該等者)則係映像至0的PSD值。
已知是,在習知的Dolby Digital(或Dolby Digital Plus)編碼中,係編碼差動指數(亦即,連續的指數間之差異)以取代絕對指數。該等差動指數僅可呈現2,1,0,-1,及-2之五個值的其中一者。若發現到超出此範圍的差動指數時,則修正將被扣除之該等指數的其中一者,使得該差動指數(在修正之後)係在所示的範圍中(此習知方法係熟知為〝指數罩幕〞或〝罩幕〞)。藉由執行該罩幕操作,第1圖編碼器的罩幕級10反應於對該處起作用的原始指數,產生罩幕指數。
考慮lowcomp補償之典型實施的實例,其中心理聲學模型(例如,藉由第1圖之控制器4所實施的模型)掃描穿過低頻帶,而頻帶〝N+1〞係下一個頻帶,以及〝N〞具有比該下一個頻帶更低的頻率。該掃描可自最低頻帶起,直至頻帶數22時為止,且典型地,不包含LFE(低頻效應)頻道的最後頻帶。若所決定的是,用於頻帶N+1之PSD值減用於頻帶N之PSD值係等於256時(其表示目前頻帶N至下一個(較高頻率)頻帶N+1之PSD中的陡峭增加(12 dB)),則lowcomp補償係藉由立即降低用於目前頻帶之激勵函數計算(亦即,降低用於該頻帶之激勵值)18 dB,而予以執行。用於該頻帶之激勵值係藉由從用於該頻帶所決定之激勵值扣除等於384的lowcomp參數,而降低。此激勵值降低係緩慢地退回(例如,藉由每一隨後頻帶直至3 dB)。
對於隨後的頻帶,亦即,在頻率中比初始致能
lowcomp之頻帶更高的頻帶,若所決定的是,在一頻帶與下一頻帶間之PSD中的差異係小於256時,則lowcomp參數(亦即,從用於該頻帶之激勵值所扣除者)係維持於與用於前一頻帶之值相同的值,或降低至更低值。直至最先所決定的是(在透過所有低頻帶之掃描的期間),兩個鄰接頻帶間之PSD中的差異係等於256時為止,並不執行lowcomp補償(亦即,具有值零的lowcomp參數係從用於該等頻帶之激勵值〝扣除〞)。
雖然習知之Lowcomp處理係有益於具有突出的低頻成分之音調信號,但不利在於可猝發掩碼降低之12 dB PSD差異準則常係由於具有低頻內容之大量非音調信號而符合。指示群眾之掌聲的音頻資料係該非音調信號的熟知實例,且將在本文中被視為該類型之非音調信號的代表(此係區別於本發明之典型實施例中的音調信號)。發明人已認知到的是,自低至中/高頻率重分佈編碼位元(相對於將使用於具有習知lowcomp補償之習知AC-3或E-AC-3編碼的編碼位元分佈)可增進循著信號之AC-3(或E-AC-3)編碼型式的解碼所再生之掌聲及其他非音調信號的感知品質,且因此,使該等非音調信號的lowcomp補償在其之AC-3或E-AC-3編碼期間失能將係所欲的(亦即,在該等信號之編碼期間關閉lowcomp將係所欲的)。發明人亦認知到具有在這類編碼期間低頻內容(例如,藉由調音管所產生之信號)之音調信號的AC-3(或E-AC-3)編碼期間lowcomp補償之失能降低了當其係循
著其AC-3(或E-AC-3)編碼型式之解碼而再生時的音調信號之感知品質。
因此,發明人認知到的是,要實施可在具有突出的低頻音調成分之音頻信號的編碼期間,而非在不具有突出的低頻音調成分之音頻信號(例如,具有低頻非音調內容,且不具有突出的音調性低頻內容之掌聲信號或其他音頻信號)的編碼期間,適應性地施加低頻補償,且要以無需改變解碼器之方式(亦即,以允許習知之解碼器解碼已藉由本發明的編碼器所產生之編碼的音頻之方式)做成,將係所欲的。
其中尾數位元指定係根據信號頻譜與掩碼曲線間之差異而定的一些習知音頻編碼方法在用於將被編碼之頻帶頻域音頻資料的掩碼值產生期間,執行除了低頻補償外之至少一掩碼值校正處理。
例如,若干習知之音頻編碼器(例如,AC-3及E-AC-3編碼器)依據額外改良的心理聲學分析而實施差量位元分配,其係提供用以參數調整用於將被編碼之各自音頻頻道的掩碼曲線。該編碼器傳送指明為差量之額外的位元流碼,而輸送所使用之掩碼曲線與缺設掩碼曲線間的差異(亦即,在各自頻率藉由缺設掩碼模型所決定之掩碼值與在相同頻率藉由實際所使用的改良掩碼模型所決定之掩碼間的差異)。
該差異位元分配函數係典型地受約束成階梯函數(例如,±6 dB直至±18 dB)。該階梯之各自梯級對應至用於
整數的鄰接二分之一Bark頻帶的掩碼位準調整。階梯包含若干未重疊之可變長度分段。該等分段係用於傳送效率所編碼之運轉長度。
差量位元分配的習知應用係用於掩碼位準校正之習知BABNDNORM處理。在BABNDNORM處理(掩碼值校正處理的實例)中,針對知覺帶數目29及以上(使用於AC-3及增強型AC-3編碼中之Bark頻帶),所使用以衍生激勵函數之各自知覺帶中的信號能量係藉由與該知覺帶寬度之倒數成比例的值所標度。因為在帶29之下面的所有知覺帶具有單元帶寬(亦即,僅包含單一頻率窗口),所以無需標度信號能量以供29以下的頻帶之用。在漸進更高的頻率處,激勵函數,且因此,掩碼臨限估計值會減低。此將增加在更高頻率處的位元分配,尤其在耦接頻道中。實例AC-3(或E-AC-3)編碼之若干編碼器係組構以實施該BABNDNORM處理,當作該編碼的步驟。
第5圖係頻帶頻域音頻資料之頻帶PSD(知覺能量)值(頂部曲線)的圖形,藉由施加習知BABNDNORM處理至該音頻資料所產生之縮放頻帶PSD值(自頂部起之第二曲線)的圖形,用以掩碼該音頻資料而產生(例如,藉由習知之AC-3或E-AC-3編碼器)之激勵函數(自頂部起之第三曲線)的圖形,及藉由施加習知BABNDNORM處理至該激勵函數所產生(例如,藉由習知之AC-3或E-AC-3編碼器)的激勵函數之縮放型式(底部曲線)的圖形。該四曲線之各者係在知覺帶(Bark頻率)標度上
顯示。明顯地,頂部二曲線在帶29處彼此相互地開始分散,且底部二曲線亦在帶29處彼此相互地開始分散。
第6圖係音頻信號之頻譜的圖形(第6圖之具有最寬動態範圍的曲線),用以掩碼該音頻信號之缺設掩碼曲線(自底部起之第二曲線)的圖形,及藉由施加習知BABNDNORM處理至該掩碼曲線所產生(例如,藉由習知之AC-3或E-AC-3編碼器)的該掩碼曲線之縮放型式(底部曲線)的圖形。從第6圖呈明顯的是,在漸進更高的頻率處,該BABNDNORM處理更大量地降低掩碼曲線。
在第一類的實施例中,本發明係用以決定將被編碼之頻域音頻資料的音頻資料值之尾數位元分配的方法(包含藉由經受量子化)。該分配方法包含決定該等音頻資料值之掩碼值,使得該等掩碼值係有用以決定信號對掩碼值,而決定該音頻資料之尾數位元分配的步驟,該步驟包含藉由執行適應性低頻補償於該音頻資料之低頻帶的組合之各自頻帶的音頻資料上。該適應性低頻補償包含以下步驟:(a)在該音頻資料上執行音調性偵測,以產生補償控制資料,而指示低頻帶的組合中之各自頻帶是否具有突出的音調內容;以及(b)執行低頻補償於如補償控制資料所指示之具有突出的音調內容之低頻帶的組合中之各自頻帶中的音頻資料上,包含藉由校正用於具有突出的音調內容之該各自頻
帶的預掩碼值,但不執行低頻補償於低頻帶的該組合中之任何其他頻帶中的音頻資料上,使得用於各自之該其他頻帶的掩碼值係未校正之預掩碼值。
在第一類中的若干實施例中,步驟(a)包含在音頻資料上執行音調性偵測,以產生補償控制資料,而指示音頻資料的頻帶之至少一子組合中的各自頻帶(無需一定係低頻帶)是否具有突出的音調內容之步驟,且決定用於音頻資料值之掩碼值的步驟亦包含以下步驟:(c)以第一方式執行掩碼值校正處理,用於如補償控制資料所指示之具有突出的音調內容之音頻資料的該各自頻帶,包含藉由校正用於具有突出的音調內容之該各自頻帶的預掩碼值,且以第二方式執行掩碼值校正處理,用於如補償控制資料所指示之缺少突出的音調內容之音頻資料的該各自頻帶。
例如,掩碼值校正處理可係BABNDNORM處理,該各自頻帶可係知覺帶,且步驟(c)可包含以第一縮放常數執行BABNDNORM處理,以供具有突出的音調內容的該各自頻帶之用,並以第二縮放常數執行BABNDNORM處理,以供缺少突出的音調內容的該各自頻帶之用的步驟。
本發明之另一實施例係編碼方法,包含該尾數分配方法的任何實施例。
在第二類的實施例中,本發明係音頻編碼方法,其克服施加低頻補償至所有輸入的音頻信號(包含具有音調及
非音調之低頻內容的信號二者),或不施加低頻補償至任何輸入的音頻信號之習知編碼方法的限制。該等實施例並非在不具有突出的低頻音調成分之音頻信號(例如,具有低頻非音調內容,且不具有突出的音調性低頻內容之掌聲或其他音頻信號)的編碼期間,而是在具有突出的低頻音調成分之音頻信號的編碼期間,選擇性地(適應性地)施加低頻補償。該適應性低頻補償係以允許解碼器執行該編碼之音頻的解碼,而無需決定(或被告知關於)低頻補償是否在該編碼期間被施加之方式,來加以執行。
在第二類中的典型實施例係音頻編碼方法,包含以下步驟:(a)在頻域音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;以及(b)執行低頻補償,以產生校正掩碼值,用於如補償控制資料所指示之具有突出的音調內容之該各自低頻帶中的音頻資料,且產生掩碼值,用於該組合中的其他低頻帶之各者中的音頻資料,而無需執行低頻補償。
在若干實施例中,音頻編碼方法係AC-3或增強型AC-3編碼方法。在該等實施例中,低頻補償係較佳地執行(亦即,開啟(ON)或致能)用於初始設計lowcomp之輸入音頻資料的頻帶(亦即,指示突出的、長期平穩的(〝音調的〞)低頻內容之頻帶);否則,不予以執行(亦即,關閉(OFF)或使有效地失能)。在該等實施例中
,反應於指示不應執行低頻補償於音頻資料的頻帶上之補償控制資料(例如,指示頻帶包含非音調音頻內容,且不包含突出的音調內容之補償控制資料),步驟(b)較佳地包含〝重罩幕〞該頻帶中之音頻資料,以產生用於該頻帶之修正音頻資料的步驟,而用於該頻帶之該修正音頻資料則包含修正指數。該重罩幕產生用於該頻帶之修正音頻資料,使得用於該頻帶之差動指數被阻止等於-2(例如,使得在下一個更高頻帶中之音頻資料的指數減用於該頻帶之修正音頻資料的修正指數必須等於2,1,0,或-1)。因此,lowcomp補償將不被施加至該頻帶,因為並不符合用以施加lowcomp補償至該頻帶之準則(相對於下一個更低頻帶之PSD,用於該頻帶之PSD增加12 dB)(若用於該頻帶之修正(重罩幕)音頻資料的指數減下一個更低頻帶的指數被阻止等於-2,則無法符合此準則)。
更特別地,在若干該等實施例中,對於重罩幕防止差動指數等於-2的各自頻帶(〝第N個〞頻帶),在以下方面中,lowcomp補償係〝不被施加〞(或關閉或使用有效地失能)。用於該頻帶之修正差動指數(由於重罩幕的緣故)係-1,0,1,或2。因此,若用於前一(更低頻率)頻帶(〝第(N-1)個〞頻帶)之差動指數係-2(其可發生於若音調性偵測步驟指示〝第(N-1)〞頻帶之強的音調內容以防止重罩幕用於該〝第(N-1)個〞頻帶,以及〝第N個〞頻帶之音調內容的缺少以猝發重罩幕用於該〝第N個〞頻帶),且lowcomp已施加(在習知方式
中)全部掩碼調整至〝第(N-1)個〞頻帶(亦即,本發明之音調性偵測尚未阻止lowcomp執行此)時,則習知之lowcomp(無重罩幕)將施加順序漸進式之較小的掩碼調整(用於緊隨著〝第(N-1)個〞頻帶之少數頻帶,包含〝第N個〞頻帶),直至達到做成零調整之頻帶(假定該等頻帶之差動指數均不等於-2)時為止。在本章節中所敘述的實施例中,當重罩幕(依據本發明)阻止頻帶(〝第N個〞頻帶)之差動指數等於-2時(亦即,因為本發明之音調偵測步驟指示該頻帶之非音調內容),若lowcomp已施加掩碼調整至前一頻帶(〝第(N-1)個〞頻帶)時,則允許lowcomp持續其順序漸進式之較小的掩碼調整用於該第N個頻帶(且亦可用於少數隨後的頻帶),直至達到做成零調整之第一頻帶時為止。此處,lowcomp被阻止做成任何進一步之掩碼調整,直至本發明之音調偵測指示音調信號時為止。
在其他實施例中,當本發明的音調性偵測步驟指示非音調內容於習知將施加lowcomp的組合中之任一低頻帶(或當一起考慮時,係所有低頻帶)時,則在以下方面中,lowcomp補償係〝不被施加〞(或關閉或使有效地失能)。反應於指示非音調內容於組合中之至少一低頻帶的本發明之音調性偵測步驟,自該組合中之所有頻帶的激勵函數之非零lowcomp參數的扣除將終止(例如,立即地)。此處,lowcomp被阻止做成任何掩碼調整(直至透過頻域音頻資料之下一個組合的頻帶之新的掃描開始時為
止)。
在若干實施例中,補償控制資料指示組合中之各自個別的低頻帶是否具有突出的音調內容,且低頻補償係選擇性地施加(或不施加)至該組合中之各自個別的低頻帶。在其他實施例中,補償控制資料指示組合中之該等低頻帶(當一起考慮時)是否具有突出的音調內容,且低頻補償係施加至該組合的所有低頻帶或不施加至該組合之該等低頻帶的任何者(根據該補償控制資料的內容)。
在第二類中的若干實施例中,步驟(a)包含在音頻資料上執行音調性偵測,以產生補償控制資料,而指示音頻資料的頻帶之至少一子組合的各自頻帶(無需一定係低頻帶)是否具有突出的音調內容之步驟,且決定用於音頻資料值之掩碼值的步驟亦包含以下步驟:(c)以第一方式執行掩碼值校正處理,用於如補償控制資料所指示之具有突出的音調內容之音頻資料的該各自頻帶,且以第二方式執行掩碼值校正處理,用於如補償控制資料所指示之缺少突出的音調內容之音頻資料的該各自頻帶。
例如,掩碼值校正處理可係BABNDNORM處理,該各自頻帶可係知覺帶,且步驟(c)可包含以第一縮放常數執行BABNDNORM處理,以供具有突出的音調內容的該各自頻帶之用,並以第二縮放常數執行BABNDNORM處理,以供缺乏突出的音調內容的該各自頻帶之用的步驟。
在另一類的實施例中,本發明係音頻編碼器,被組構以反應於頻域音頻資料產生編碼之音頻資料,包含藉由執行適應性低頻補償於該音頻資料上,該編碼器包含:音調性偵測器(例如,第2圖之元件15),係組構而在該音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;以及低頻補償控制級(例如,藉由第2圖之元件4而實施),係耦接且組構以反應於該補償控制資料適應性地致能(選擇性地致能或使有效地失能)低頻補償對該音頻資料之低頻帶的該組合之各自低頻帶的施加。
該音調性偵測器係組構以決定低頻補償是否應被施加至低頻帶的組合之各自頻帶的音頻資料(亦即,在低頻帶的組合之音頻資料的編碼期間,藉由產生補償控制資料而指示低頻帶的組合之各自頻帶的低頻補償是否應被開啟(因為該頻帶具有突出的音調內容),或被關閉(因為該頻帶缺少突出的音調內容))。該低頻補償控制級係組構以無需改變解碼器之方式(亦即,以允許解碼器執行編碼之音頻資料的解碼,而無需決定(或被告知關於)低頻補償是否在編碼期間被施加至任何的低頻帶之方式),反應於補償控制資料適應性地致能低頻補償對低頻帶之該組合的各自頻帶之音頻資料的施加。
反應於指示將被編碼的音頻資料之頻帶表示非音調信號的補償控制資料(用於應使低頻補償失能),該低頻補
償控制級藉由人為地修正其指數而〝重罩幕〞該頻帶的音頻資料。該重罩幕產生用於該頻帶之修正音頻資料,使得用於該頻帶之差動指數被阻止等於-2(例如,使得用於該頻帶之修正音頻資料的修正指數減下一個更低頻帶中之音頻資料的指數必須等於2,1,0,或-1)。在該編碼器的典型實施例中,lowcomp補償將不被施加至該頻帶,因為並不符合用以施加lowcomp補償至該頻帶之準則(相對於下一個更低頻帶之PSD,用於該頻帶之PSD增加12 dB)(若用於該頻帶之修正音頻資料的指數減下一個更低頻帶的指數被阻止等於-2時,則無法符合此準則)。
本發明之另一觀點係編碼之音頻資料的解碼方法,包含接收指示編碼之音頻資料的信號,及解碼該編碼之音頻資料,以產生指示該音頻資料的信號之步驟,其中該編碼之音頻資料已藉由依據本發明之編碼方法的任一實施例而編碼音頻資料所產生。本發明之又一觀點係系統,包含編碼器及解碼器,該編碼器係組構(例如,係編程)以執行本發明之編碼方法的任一實施例,反應於音頻資料而產生編碼之音頻資料,以及該解碼器係組構以解碼該編碼之音頻資料,而恢復音頻資料。
本發明之其他觀點包含系統或裝置(例如,編碼器或處理器),以及電腦可讀取式媒體(例如,碟片),該系統或裝置係組構(例如,係編程)以執行本發明之方法的任一實施例,以及該電腦可讀取式媒體儲存碼,用以實施本發明之方法或其步驟的任一實施例。例如,本發明之系
統可係或可包含可編程之通用型處理器、數位信號處理器、或微處理器,而編程以軟體或韌體,且/或其他方面,組構而在資料上執行包含本發明之方法或其步驟的實施例之任何各式各樣的操作。該通用型處理器可係可包含包括輸入裝置、記憶體、及處理電路之電腦系統,而編程(且/或其他方面,組構)以反應於對該處起作用的資料執行本發明之方法(或其步驟)的實施例。
將參照第2圖而敘述系統之實施例,該系統係組構以實施本發明的方法。第2圖之系統係AC-3(或增強型AC-3)編碼器,其係組構以反應於時間域輸入的音頻資料1而產生AC-3(或增強型AC-3)編碼之音頻位元流9。第2圖系統之元件2,4,6,7,8,10,及11係與上述第1圖系統之相同編號的元件一致。
分析濾波器排組2轉換時間域輸入的音頻資料1成為頻域音頻資料3,以及BFPE級7產生資料3之各自頻率成分的浮點表示,包含用於各自頻率窗口之指數及尾數。頻域音頻資料輸出自該級7(在本文中,有時候亦稱為頻域音頻資料3),且然後,被編碼,包含藉由在量子化器6中之其尾數的量子化。格式化器8係組構以反應於來自量子化器6所輸出之量子化的尾數資料,及來自級11所輸出之編碼的差動指數資料,而產生AC-3(或增強型AC-3)編碼之位元流9。量子化器6根據藉由控制器4所
產生之控制資料(包含掩碼資料),而執行位元分配及量子化。
控制器4係組構以在音頻資料3之低頻帶的組合之各自低頻帶上,藉由校正用於該頻帶的預掩碼值(激勵值),而執行低頻補償。用於該頻帶之藉由控制器4對量子化器6所起作用的校正掩碼資料係藉由用於該頻帶之校正掩碼值所決定。
因為第2圖的系統係AC-3(增強型AC-3)編碼器,所以控制器4實施心理聲學模型,而根據接近熟知之Bark標度的頻帶之50個不均勻的知覺頻率來分析頻域資料。本發明之其他實施例使用心理聲學模型,而以另一頻帶之基礎(亦即,根據據均勻的或不均的頻帶之任一組合)來分頻域資料(及/或實施低頻補償且亦選用地實施另外的掩碼值校正處理)。
第2圖的編碼器包含發明的重罩幕級18及音調性偵測器15。第2圖之罩幕級10係耦接至音調性偵測器15及重罩幕級18,且係組構以使所產生之罩幕指數對該音調性偵測器15及對該重罩幕級18起作用。重罩幕級18係組構以反應於指示低頻補償應被執行於頻帶上之補償控制資料(藉由偵測器15所產生且對級18起作用),產生重罩幕指數而致使控制器4(反應於該重罩幕指數而操作)僅執行低頻補償於該頻帶上。反應於指示低頻補償不應被執行於音頻資料3的頻帶上之補償控制資料(藉由偵測器15所產生且對級18起作用),控制器4不執行低頻補
償於該頻帶上,且取代地,用於該頻帶之藉由控制器4對量子化器6起作用的掩碼資料係由該頻帶之未校正的預掩碼值(激勵值)所決定。
用於頻域資料3的各自頻帶之藉由控制器4對量子化器6起作用的掩碼資料包含用於該頻帶之掩碼曲線值。該等掩碼曲線值表示在各自頻帶中受到人的耳朵所遮蔽之信號的數量。如第1圖之系統中一樣地,第2圖之量子化器6使用此資訊以決定出使用可用數目之資料位元來表示輸入音頻信號之各自頻帶的成份有多好。
更特別地,控制器4係組構以反應於來自級18之對該處起作用的重罩幕指數計算PSD值,反應於該等PSD值計算頻帶之PSD值,反應於頻帶之PSD值計算掩碼曲線,及反應於掩碼曲線決定尾數位元分配資料(在第2圖中所指示之〝掩碼資料〞)。
第2圖的音頻編碼器係組構以產生編碼之音頻資料9,包含藉由執行適應性低頻補償於音頻資料3上。為了要實施該適應性低頻補償,第2圖之系統包含音調性偵測級(音調性偵測器)15及適應性重罩幕級18,如圖式所耦接地,以及控制器4反應於藉由級18所產生之重罩幕指數而執行低頻補償。罩幕級10係以將於下文更詳細描述之方式而予以耦接,以接收頻域音頻資料3的原始指數,且組構,以決定用於音頻資料3之低頻帶的上述組合之各自低頻帶的罩幕指數。
音調性偵測器15係耦接以接收音頻資料3的最初(
原始)指數,及反應於透過音頻資料3之低頻帶的組合之掃描(自低至高頻率)期間的該等最初指數而藉由級10所產生的罩幕指數。
級10係組構以決定用於資料3的連續頻帶之頻域音頻資料3的指數間之差異,且產生該各自指數的罩幕型式(罩幕指數)。該罩幕係在透過頻域資料3(包含將執行適應性低頻補償於上之低頻帶的組合之該等頻帶)之掃描(自低至高頻率)期間,以上述習知方式而予以執行,以致使罩幕指數在該掃描期間被產生用於各自頻率窗口。級10決定用於各自頻帶的差動指數(各自〝下一〞窗口〝N+1〞之指數減目前(較低頻率)窗口〝N〞之指數)。若用於窗口〝N〞的差動指數係大於2(亦即,exp(N+1)-exp(N)>2)時,則級10決定用於窗口〝N+1〞之罩幕指數為滿足tentexp(N+1)-exp(N)=2之最小指數(tentexp(N+1))。在此情況中,用於窗口N之罩幕指數(tentexp(N))係等於用於窗口N之最初指數(tentexp(N)=exp(N)),且級10使窗口N之差動罩幕指數值2對級18起作用。若用於窗口〝N〞的差動指數係小於-2(亦即,exp(N+1)-exp(N)<-2)時,則級10決定用於窗口〝N〞之罩幕指數為滿足exp(N+1)-tentexp(N)=-2之最大指數(tentexp(N))。在此情況中,用於窗口N+1之罩幕指數(tentexp(N+1))係等於用於窗口N+1之最初指數(tentexp(N+1)=exp(N+1)),且級10使窗口N之差動罩幕指數值-2對級18起作用。
音調性偵測器15係組構以執行音調性偵測於包含音頻資料3的最初指數,以及反應於透過音頻資料3之低頻帶的組合之掃描(自低至高頻率)期間的該等最初指數而藉由級10所產生的罩幕指數上。音調信號的該等PSD值之陡峭的上升及下降特徵(當作頻率的函數)意指該信號常化非音調信號(例如,指示掌聲之非音調信號)被罩幕得更多。
例如,第3圖係指示音調信號(調音管信號)之頻域音頻資料的指數及罩幕指數當作頻率窗口之函數的圖形。第4圖係指示非音調(掌聲)信號之頻域音頻資料的指數及罩幕指數亦被繪圖當作頻率窗口之函數的圖形。在被典型地執行低頻補償之較低頻率處,各自窗口(第3及4圖)對應至單一頻帶。例如,由第3圖之檢查所顯而易見地,存在有其中在音調信號之指數與對應罩幕指數(由該指數所產生,例如,藉由級10)間具有非零差異的許多頻帶於低頻範圍中(例如,窗口7、11、14、15、20、及23)。例如,由第4圖之檢查所顯而易見地,存在有其中在非音調信號之指數與對應罩幕指數間具有非零差異的很少頻帶於低頻範圍中(僅窗口34)。
因此,音調性偵測器15的典型實施例所決定頻域音頻資料之組合的指數與對應罩幕指數間之均方差異程度(或指示該資料的指數與對應罩幕指數間之差異的另一程度)。例如,在透過自第一(最低)頻帶至頻帶N+1之低頻帶(資料3的低頻帶之指示的組合)的掃描(自低至高
頻率)期間,偵測器15的實施產生用於頻帶N+1的音調性程度為自第一頻帶至頻帶N+1的範圍中之各自頻帶的最初指數與罩幕指數期之平方差的平均值。
該均方差異程度係使用以決定補償控制資料,而指示自最低頻帶至目前頻帶(頻帶N+1)的頻率範圍中之音頻信號的音調性(突出的音調內容之存在或缺少)。對於各自頻率範圍(自最低頻帶至目前頻帶)而言,若均方差異程度(針對該頻率範圍)具有小於特定之預定的臨限值(例如,實驗性所決定的臨限值)之值時,則偵測器15以第一值(例如,等於零之二元位元)使補償控制資料起作用(對級18),而指示非音調音頻信號。此猝發由於級10所起作用的差動指數值所引起之藉由級18的重罩幕用於目前頻帶,而藉以猝發藉由控制器4之解碼器相容的lowcomp開關關閉(OFF)(亦即,防止控制器4施加習知之低頻補償於目前頻帶)。在下文所述的實例中,係採臨限值為0.05。
對於各自頻率範圍(自最低頻帶至目前頻帶)而言,若均方差異程度(針對該頻率範圍)具有大於或等於該臨限值之值時,則偵測器15以第二值(例如,等於1之二元位元)使補償控制資料起作用(對級18),而指示音調音頻信號。此使由於級10所起作用的差動指數值所引起之藉由級18的重罩幕失能於目前頻帶,而藉以允許此值(在級10的輸出處起作用)未改變地通過級18至控制器4,且因而,猝發藉由控制器4之解碼器相容的
lowcomp開關開啟(ON)(亦即,允許控制器4施加習知之低頻補償於目前頻帶)。
在選擇性實施例中,偵測器15以另一方式產生補償控制資料,且使得該補償控制資料指示藉由資料3之各自頻帶中、或資料3之各自低頻帶中、或包含將執行適應性低頻補償於上的資料3之低頻帶的組合(或子組合)之頻率範圍中的資料3所決定之音頻信號的音調性(或非音調性)。例如,在若干實施例中,偵測器15係實施成為專用的音調性偵測器,而操作於BFPE級7之輸出上(並未特別地在BFPE級7之輸出的指數及來自級10所輸出的罩幕指數上)。
針對另一實例,在若干實施例中,偵測器15(或使用於該等實施例之任一者中的另一音調性偵測器)係掌聲偵測器,其係組構以產生補償控制資料,而指示音頻資料之低頻帶的組合是否(例如,該組合之各自低頻帶是否)表示掌聲。關於此點,〝掌聲〞係以廣義方面被使用,其可僅表示掌聲,或表示掌聲及/或群眾歡呼。若在組合中之該等頻帶的至少一者係如藉由補償控制資料所指示地指示掌聲時,則對於指示掌聲之該組合中的各自頻帶,將使低頻補償失能(關閉)。低頻補償將被執行於如藉由補償控制資料所指示之並不指示掌聲的組合中之各自頻帶中的音頻資料上。
反應於來自偵測器15之指示非音調音頻信號的補償控制資料(例如,指示在自資料3之最低頻帶至目前頻帶
(頻帶N)的低頻率範圍中,藉由資料3所決定之音頻信號係非音調信號),級18執行重罩幕於目前頻帶的罩幕指數上。特別地,若用於目前頻帶的差動罩幕指數(頻帶N+1的罩幕指數減頻帶N的罩幕指數)係等於-2時(其指示在自前一頻帶N至目前(更高頻率)頻帶N+1之PSD中的陡峭增加(12 dB)),則級18決定用於頻帶〝N+1〞之差動重罩幕指數為等於-1。因此,反應於來自偵測器15之指示非音調音頻信號的補償控制資料(例如,指示在自資料3之最低頻帶至資料3之目前頻帶(頻帶N)的低頻範圍中,藉由資料3所決定之音頻信號係非音調信號),控制器4不執行低頻補償於音頻資料3的目前頻帶(N)上。
反應於來自偵測器15之指示音調音頻信號的補償控制資料(例如,指示在自資料3之最低頻帶至資料3之目前頻帶(頻帶N)的低頻率範圍中,藉由資料3所決定之音頻信號係音調信號),級18通過用於目前頻帶之罩幕指數差異至控制器4(無需改變該罩幕指數差異),且控制器4被允許執行低頻補償於音頻資料3的目前頻帶(N)上。特別地,若來自級10所輸出(且經由級18而通過至控制器4)之用於該頻帶的罩幕指數差異值係等於-2時,則控制器4執行低頻補償於音頻資料3的目前頻帶(N)上。
更通常地,本發明之典型實施例的音調性偵測器係組構以決定低頻補償是否應被施加至低頻帶的組合之各自頻
帶的音頻資料(亦即,藉由產生補償控制資料而指示在低頻帶的組合之音頻資料的編碼期間,低頻帶的組合之各自頻帶的低頻補償是否應被開啟(ON)(因為該頻帶具有突出的音調內容),或應被關閉(OFF)(因為該頻帶缺少突出的音調內容))。本發明之典型實施例的低頻補償控制級係組構以無需改變編碼器之方式(亦即,以允許解碼器執行編碼之音頻資料的解碼,而無需決定(或被告知關於)低頻補償是否在編碼期間被施加至任何的低頻帶之方式),反應於補償控制資料適應性地致能低頻補償對低頻帶之該組合的各自頻帶之音頻資料的施加。
在典型的實施例中,反應於指示將被編碼的音頻資料之頻帶表示非音調信號的補償資料(用於應使低頻補償失能),該低頻補償控制級的較佳實施例藉由人為地修正由罩幕資料所決定之有關聯的差動指數,而〝重罩幕〞該頻帶的罩幕音頻資料(例如,差動罩幕指數)。該重罩幕產生用於該頻帶之修正音頻資料,使得用於該頻帶之修正(重罩幕)差動指數被阻止等於-2(例如,使得用於該頻帶之修正音頻資料的修正指數減下一個更低頻帶中之音頻資料的指數必須等於2,1,0,或-1)。在本發明編碼器的典型實施例中,lowcomp補償將不被施加至該頻帶,因為並不符合用以施加lowcomp補償至該頻帶之準則(相對於下一個更低頻帶之PSD,用於該頻帶之PSD增加12 dB)(因為用於該頻帶之修正音頻資料的指數減下一個更低頻帶的指數被阻止等於-2,所以無法符合此準則)。
低頻補償可藉由人為修正(〝重罩幕〞)用於低頻帶之指數,使得差動指數(針對鄰接之低頻)不等於-2(亦即,避免PSD在從較低到較高頻帶之掃描期間增加12 dB),而予以關閉(OFF)(依據本發明之典型實施例),無需改變解碼器,且因而,避免lowcomp補償的施加。當本發明之音調性偵測器指示非音調信號時,則用於低頻帶之罩幕指數係以該意義而被重罩幕。此並不需要對於所使用以產生用於使尾數值量子化之掩碼資料(信號對掩碼比)的心理聲學模型加以改變,且因此,產生可藉由習知編碼器而予以解碼之編碼資料。更特別地,在透過低頻帶之掃描期間,而頻帶〝N+1〞係下一頻帶,且目前頻帶(〝N〞)具有比下一頻帶更低的頻率,若預決定的是,差動指數(用於頻帶N+1之指數減用於頻帶N之指數)等於-2時,則該等頻帶的其中一者之指數被改變(〝重罩幕〞),使得修正指數值的差動指數等於-1(亦即,用於頻帶N+1之修正指數減用於頻帶N之指數等於-1,或用於頻帶N+1之指數減用於頻帶N之修正指數等於-1)。較佳地,若用於頻帶N+1之指數減用於頻帶N之指數等於-2時,則此差異可藉由減少(〝重罩幕〞)用於頻帶N(目前頻帶)之指數,使得用於頻帶N+1之指數減用於頻帶N之修正指數等於-1,而增加至-1。後者之重罩幕的實施係典型較佳的,因為通常由於具有可使對應之尾數完全常態化的假定,所以增加指數值係非所欲的。增加對應於完全常態化尾數之指數值將導致過常態化或被
截除之尾數,其係非所欲的。因此,若用於頻帶N+1之指數減用於頻帶N之指數等於-2時,則為了要使此差異增加至-1,典型較佳地,可將用於頻帶N之指數減少1(而非將用於頻帶N+1之指數增加1)。
當本發明之音調性偵測器指示音調信號時,則輸入之音頻成分的指數不被重罩幕,且低頻補償係以習知方式施加至音調信號(亦即,至指示音調信號之習知罩幕值)。
本發明人已執行收聽測試,而比較習知E-AC-3編碼器的性能與E-AC-3編碼器之修正型式(實施參照第2圖所述之類型的適應性lowcomp補償)的性能。此測試不僅顯示後者(修正)編碼器用於所測試之掌聲信號,而且用於一些非掌聲信號的好處。更特別地,在具有音調性偵測器臨限值等於0.05的192 kb/s處(亦即,音調性偵測器係組構以當頻域音頻之指數與罩幕指數間的均方差異程度具有小於0.05之臨限值的值時,產生指示非音調信號而應使lowcomp補償關閉(OFF)之控制資料),對於調音管(長期,高度音調性,低頻率)輸入音頻及掌聲(高度非音調性,低頻率)輸入音頻,關閉lowcomp補償之區塊的平均百分比分別係0.5%及80%。
如所示地,音調信號之PSD的陡峭上升及下降特徵意指該等信號常係比非音調信號罩幕更多,且因而,指數與罩幕指數間之均方差異可用作音調性的指示。小於特定臨限值(實驗所決定)的音調性指示值意指應關閉lowcomp之非音調信號;反之亦然。在典型的實施中,該
音調性指示值係在透過將被編碼的音頻資料(例如,第2圖之資料3)之頻帶的掃描期間予以計算(例如,藉由第2圖之偵測器15),直至目前頻帶之頻率到達耦合開始頻率時為止(當使用耦合時)。當使用適應性混合變換(AHT)時,則可使本發明之適應性lowcomp處理的操作失能,且取代地,可執行習知(非適應性)lowcomp處理。AHT係描述於上文所參考之Dolby Digital/Dolby Digital Plus規格中,及上文所參考之2009年,CRC刊物,Vijay K.Madisetti所主筆之第二版的數位信號處理手冊中之Robert L.Andersen及Grant A.Davidson的〝Dolby Digital Audio Coding Standards〞章節中。
在第一類的實施例中,本發明係用以決定將被編碼之頻域音頻資料的音頻資料值之尾數位元分配的方法(包含藉由經受量子化)。該分配方法包含決定該等音頻資料值之掩碼值(例如,在第2圖的控制器4中),使得該等掩碼值係有用以決定信號對掩碼值,而決定該音頻資料之尾數位元分配的步驟,該步驟包含藉由執行適應性低頻補償於該音頻資料之低頻帶的組合之各自頻帶的音頻資料上。該適應性低頻補償包含以下步驟:(a)在該音頻資料上執行音調性偵測(例如,在第2圖的音調性偵測器15中),以產生補償控制資料,而指示低頻帶的組合中之各自頻帶是否具有突出的音調內容;以及(b)執行低頻補償於如補償於如補償控制資料所指
示之具有突出的音調內容之低頻帶的組合中之各自頻帶中的音頻資料上,包含藉由校正用於具有突出的音調內容之該各自頻帶的預掩碼值,但不執低頻補償於低頻帶的該組合中之任何其他頻帶中的音頻資料上,使得用於各自之該其他頻帶的掩碼值係未校正之預掩碼值。
在第一類中的若干實施例中,步驟(a)包含在音頻資料上執行音調性偵測(例如,在第2圖的音調性偵測器15中),以產生補償控制資料,而指示音頻資料的頻帶之至少一子組合中的各自頻帶是否具有突出的音調內容之步驟,且決定用於音頻資料值之掩碼值的步驟亦包含以下步驟:(c)以第一方式執行掩碼值校正處理,用於如補償控制資料所指示之具有突出的音調內容之音頻資料的該各自頻帶,包含藉由校正用於具有突出的音調內容之該各自頻帶的預掩碼值,且以第二方式執行掩碼值校正處理,用於如補償控制資料所指示之缺少突出的音調內容之音頻資料的該各自頻帶。
例如,掩碼值校正處理可係BABNDNORM處理,該各自頻帶可係知覺帶,且步驟(c)可包含以第一縮放常數執行BABNDNORM處理,以供具有突出的音調內容的該各自頻帶之用,並以第二縮放常數執行BABNDNORM處理,以供缺少突出的音調內容的該各自頻帶之用的步驟。
本發明之另一實施例係編碼方法,包含該尾數分配方
法的任何實施例。
在第二類的實施例中,本發明係音頻編碼方法,其克服施加低頻補償至所有輸入的音頻信號(包含具有音調及非音調之低頻內容的信號二者),或不施加低頻補償至任何輸入的音頻信號之習知編碼方法的限制。該等實施例並非在不具有突出的低頻音調成分之音頻信號(例如,具有低頻非音調內容,且不具有突出的音調性低頻內容之掌聲或其他音頻信號)的編碼期間,而是在具有突出的低頻音調成分之音頻信號的編碼期間,選擇性地(適應性地)施加低頻補償。該適應性低頻補償係以允許解碼器執行該編碼之音頻的解碼,而無需決定(或被告知關於)低頻補償是否在該編碼期間被施加之方式,來加以執行。
在第二類中的典型實施例係音頻編碼方法,包含以下步驟:(a)在頻域音頻資料上執行音調性偵測(例如,在第2圖的音調性偵測器15中),以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;以及(b)執行低頻補償(例如,在第2圖的控制器4中),以產生校正掩碼值,用於如補償控制資料所指示之具有突出的音調內容之該各自低頻帶中的音頻資料,且產生掩碼值,用於該組合中的其他低頻帶之各者中的音頻資料,而無需執行低頻補償(例如,在第2圖的控制器4中)。
在第二類中的若干實施例中,音頻編碼方法係AC-3或增強型AC-3編碼方法。在該等實施例中,低頻補償係較佳地執行(亦即,開啟(ON)或致能)用於初始設計lowcomp之輸入音頻資料的頻帶(亦即,指示突出的、長期平穩的(〝音調的〞)低頻內容之頻帶);否則,不予以執行(亦即,關閉(OFF)或使有效地失能)。在該等實施例中,反應於指示不應執行低頻補償於音頻資料的頻帶上之補償控制資料(例如,指示頻帶包含非音調音頻內容,且不包含突出的音調內容之補償控制資料),步驟(b)較佳地包含〝重罩幕〞該頻帶中之音頻資料,以產生用於頻帶之修正音頻資料的步驟,而用於該頻帶之該修正音頻資料則包含修正指數。該重罩幕產生用於該頻帶之修正音頻資料,使得用於該頻帶之差動指數被阻止等於-2(例如,使得用於該頻帶之修正音頻資料的修正指數減下一個更低頻帶中之音頻資料的指數必須等於2,1,0,或-1)。因此,lowcomp補償將不被施加至該頻帶,因為並不符合用以施加lowcomp補償至該頻帶之準則(相對於下一個更低頻帶之PSD,用於該頻帶之PSD增加12 dB)(若用於該頻帶之修正(〝重罩幕〞)音頻資料的指數減下一個更低頻帶的指數被阻止等於-2,則無法符合此準則)。
在第二類中的若干實施例中,步驟(a)包含在音頻資料上執行音調性偵測(例如,在第2圖的音調性偵測器15中),以產生補償控制資料,而指示音頻資料的頻帶
之至少一子組合的各自頻帶是否具有突出的音調內容之步驟,且決定用於音頻資料值之掩碼值的步驟亦包含以下步驟:(c)以第一方式執行掩碼值校正處理(例如,在第2圖的控制器4中),用於如補償控制資料所指示之具有突出的音調內容之音頻資料的該各自頻帶,且以第二方式執行掩碼值校正處理,用於如補償控制資料所指示之缺少突出的音調內容之音頻資料的該各自頻帶。
例如,掩碼值校正處理可係BABNDNORM處理,該各自頻帶可係知覺帶,且步驟(c)可包含以第一縮放常數執行BABNDNORM處理,以供具有突出的音調內容的該各自頻帶之用,並以第二縮放常數執行BABNDNORM處理,以供缺少突出的音調內容的該各自頻帶之用的步驟。
如所示地,本發明之編碼方法(及尾數位元分配方法)的若干實施例使用發明性的補償控制資料,而修正編碼/解碼之BABNDNORM觀點。
在實施例的一類別中,本發明之編碼方法使用發明性的補償控制資料,而如下地修正編碼/解碼之BABNDNORM觀點。習知之BABNDNORM及本發明之適應性低頻補償方法二者具有相似的目的,亦即,犠牲較低頻率而朝向較高頻率重分配編碼位元。惟,習知之BABNDNORM伴隨有傳送差量至解碼器的額外成本。
針對BABNDNORM及本發明適應性低頻補償二者的
最佳用法,編碼器係組構以根據用於知覺帶之適應性lowcomp決定,而調整用於該帶的BABNDNORM縮放常數。例如,在第2圖系統的實施中,若用於頻帶之藉由音調性偵測器15所產生的補償控制資料指示應使低頻補償失能(OFF)時,則控制器4之掩碼資料產生級選擇BABNDNORM的縮放常數(反應於該補償控制資料),使得掩碼臨限值少量地減低。若用於頻帶之藉由音調性偵測器15所產生的補償控制資料指示應致能(ON)低頻補償時,則掩碼資料產生級選擇BABNDNORM的縮放常數(反應於該補償控制資料),使得掩碼臨限值大量地減低。
在本發明之方法的若干實施例中,當音調性偵測步驟指示非音調內容於習知將被施加lowcomp之組合中的任一頻帶(或所有低頻帶,當一起考慮時),則在以下方面中,〝並不施加〞(或關閉或使有效地失能)lowcomp補償。反應於指示非音調內容於組合中之至少一低頻帶的本發明之音調性偵測步驟,自該組合中之所有頻帶的激勵值之非零lowcomp參數的扣除將終止(例如,立即地)。此處,lowcomp被阻止做成任何掩碼調整(直至透過頻域音頻資料之下一個組合的頻帶之新的掃描開始時為止)。
如上文所示地,在本發明之方法的若干實施例中,補償控制資料指示組合中之各自個別的低頻帶是否具有突出的音調內容,且低頻補償係選擇性地施加(或不施加)至該組合中之各自個別的低頻帶。在本發明之方法的其他實施例中,補償控制資料指示組合中之該等低頻帶(當一起
考慮時)是否具有突出的音調內容,且低頻補償係施加至該組合的所有低頻帶或不施加至該組合之該等低頻帶的任何者(根據該補償控制資料的內容)。實施例之一類別實施有關是否致能lowcomp或使lowcomp失能的二元(寬帶)決定,以供整個低頻區之用。在此類別中的若干實施例中,若音調性偵測指示應使lowcomp失能時,則重罩幕將自低頻lowcomp區消除值-2的所有差動指數,使得lowcomp參數一直係零。然而,本發明之方法的其他實施例實施更細密的音調性決定,使得lowcomp被允許維持主動以供整個低頻區的某些頻率區之用,但使失能於其他區。
本發明之另一觀點係系統,包含編碼器及解碼器,該編碼器係組構以執行本發明之編碼方法的任一實施例,反應於音頻資料而產生編碼之音頻資料,以及該解碼器係組構以解碼該編碼之音頻資料,而恢復音頻資料。第7圖系統係此系統之實例。第7圖之系統包含編碼器90、遞送系統91、及解碼器92,編碼器90係組構(例如,係編程)以執行本發明之編碼方法的任一實施例,反應於音頻資料而產生編碼之音頻資料。遞送系統91係組構以儲存藉由編碼器90所產生之編碼之音頻資料,及/或傳送表示該編碼之音頻資料的信號。解碼器92係耦接且組構(例如,編程)以接收來自子系統91之編碼之音頻資料(例如,藉由自子系統91中的儲存器讀取或檢索編碼之音頻資料,或接收已由子系統91所傳送之表示編碼之音頻資
料的信號),並解碼該編碼之音頻資料,而恢復音頻資料(且典型地,亦產生及輸出表示該音頻資料的信號)。
本發明之另一觀點係編碼之音頻資料的解碼方法(藉由第7圖之解碼器92所執行的方法),包含接收指示編碼之音頻資料的信號,及解碼該編碼之音頻資料,以產生指示該音頻資料的信號之步驟,其中該編碼之音頻資料已藉由依據本發明之編碼方法的任一實施例而編碼音頻資料所產生。
本發明可實施於硬體,韌體,或軟體,或任二者之結合(例如,成為可編程之邏輯陣列)中。除非另有指明,否則所包含成為本發明之一部分的演算和處理並不與任何特殊的電腦或其他的設備固有地相關聯。特別地,可以以依據本文中之教示所編寫的程式而使用各式各樣通用型之機器,或可更便利地建構更特殊化的設備(例如,積體電路),而執行所需之方法步驟。因此,本發明可實施於一或多個電腦程式中,而執行於一或多個可編程的電腦系統(例如,實施第2圖之編碼器的電腦系統)中,各電腦系統包含至少一處理器、至少一資料儲存系統(包含揮發性和非揮發性記憶體及/或儲存元件)、至少一輸入裝置或埠、以及至少一輸出裝置或埠。程式碼係施加以輸入資料執行本文所述之功能及產生輸出資訊。該輸出資訊係以已知方式施加至一或多個輸出裝置。
該各自程式可以以任何所欲的電腦語言(包含機器,組合,或高階知覺、邏輯、或目標取向之編程語言)實施
,而與電腦系統通信。無論如何,該語言可係編譯或解釋語言。
例如,當藉由電腦軟體指令順序而實施時,則本發明實施例之各式各樣的功能及步驟可藉由運轉於合適的數位信號處理硬體中之多線程軟體指令,而予以實施,其中,實施例之各式各樣的裝置、步驟、及功能可對應至軟體指令的一部分。
該各自電腦程式係較佳地儲存於或下載至可藉由通用型或特殊目的之可編程電腦所讀取的儲存媒體或裝置(例如,固態記憶體或媒體、或磁性或光學媒體)上,用以當該儲存媒體或裝置係藉由電腦系統所讀取而執行本文所述之程序時,組構及操作電腦。本發明之系統亦可實施為電腦可讀取式儲存媒體,而以電腦程式予以組構(亦即,儲存),其中所組構之儲存媒體致使電腦系統以特定及預定的方式操作,而執行本文所述之該等功能。
雖然已敘述本發明之若干實施例,但將瞭解的是,各式各樣的修正可予以做成,而不會背離本發明之精神及範疇。依照上述教示,本發明之許多修正及變化係可能的。將理解的是,除了如本文所特別敘述之外,本發明可實行於附錄申請專利範圍的範疇之內。
1‧‧‧時間域輸入音頻資料
2‧‧‧分析濾波器排組
3‧‧‧頻域音頻資料
4‧‧‧控制器
6‧‧‧量子化器
7‧‧‧BFPE級
8‧‧‧格式化器
9‧‧‧位元流
10‧‧‧罩幕級
11‧‧‧指數編碼級
15‧‧‧音調性偵測器
18‧‧‧重罩幕級
第1圖係習知編碼系統的方塊圖;第2圖係組構以執行本發明方法的實施例之編碼系統
的方塊圖;第3圖係指示調音管(音調)信號之頻域音頻資料的指數及罩幕指數當作頻率窗口之函數的圖形;第4圖係指示掌聲(非音調)信號之頻域音頻資料的指數及罩幕指數當作頻率窗口之函數的圖形;第5圖係頻帶頻域音頻資料之頻帶PSD(知覺能量)值(頂部曲線)的圖形、藉由施加習知BABNDNORM處理至該音頻資料所產生之縮放頻帶PSD值(自頂部起之第二曲線)的圖形、用以掩碼該音頻資料而產生之激勵函數(自頂部起之第三曲線)的圖形、及藉由施加習知BABNDNORM處理至該激勵函數所產生的該激勵函數之縮放型式(底部曲線)的圖形,該四曲線之各者係在知覺帶(Bark頻率)標度上顯示;第6圖係音頻信號之頻譜的圖形,用以掩碼該音頻信號之缺設掩碼曲線(自底部起之第二曲線)的圖形,及藉由施加習知BABNDNORM處理至該掩碼曲線所產生的該掩碼曲線之縮放型式(底部曲線)的圖形;以及第7圖係包含編碼器及解碼器之系統的方塊圖,該編碼器係組構以執行本發明之編碼方法的任一實施例,反應於音頻資料而產生編碼之音頻資料,及該解碼器係組構以解碼該編碼之音頻資料,而恢復該音頻資料。
1‧‧‧時間域輸入音頻資料
2‧‧‧分析濾波器排組
3‧‧‧頻域音頻資料
4‧‧‧控制器
6‧‧‧量子化器
7‧‧‧BFPE級
8‧‧‧格式化器
9‧‧‧位元流
10‧‧‧罩幕級
11‧‧‧指數編碼級
15‧‧‧音調性偵測器
18‧‧‧重罩幕級
Claims (28)
- 一種音頻編碼方法,包含以下步驟:(a)在頻域音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;(b)針對該各自的低頻帶,產生用於在該頻帶中該音頻資料的預掩碼值;以及(c)針對該各自的低頻帶,決定用於在該頻帶中該音頻資料的掩碼值,其中用於如該補償控制資料所指示之具有突出的音調內容之該各自低頻帶中該音頻資料的該掩碼值係藉由執行低頻補償來獲得,以校正用於在該頻帶中該音頻資料的該預掩碼值,且用於在該組合中各其它低頻帶中該音頻資料的該掩碼值係為用於在該頻帶中該音頻資料的該預掩碼值,其中該頻域音頻資料包含用於該組合之該各自低頻帶的指數值,且步驟(a)包含針對該組合之該各自低頻帶而決定該音頻資料的指數與對應之罩幕指數間之差異的程度之步驟。
- 如申請專利範圍第1項之方法,其中該補償控制資料指示該組合之至少一頻帶是否表示群眾噪聲或掌聲,且步驟(c)包含以下步驟:產生掩碼值,用於如該補償控制資料所指示之表示掌聲或群眾噪聲的該組合之各自低頻帶中的該音頻資料,而無需執行低頻補償。
- 如申請專利範圍第1項之方法,其中步驟(c)包含重罩幕如該補償控制資料所指示之缺少突出的音調內容之該組合的該各自低頻帶中之該音頻資料,以產生包含修正指數之修正音頻資料,用於缺少突出的音調內容之至少一該低頻帶的步驟。
- 如申請專利範圍第3項之方法,其中重罩幕之該步驟產生用於缺少突出的音調內容之至少一該低頻帶的該修正指數,使得在下一個更高頻帶中之該音頻資料的該指數減該修正指數必須具有2、1、0、及-1之其中一者的值。
- 如申請專利範圍第1項之方法,其中步驟(a)包含在該音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料的該等頻帶之至少一子組合中的各自頻帶是否具有突出的音調內容之步驟,該方法亦包含以下步驟:(d)以第一方式執行掩碼值校正處理,用於如該補償控制資料所指示之具有突出的音調內容之該音頻資料的該各自頻帶,且以第二方式執行該掩碼值校正處理,用於如該補償控制資料所指示之缺少突出的音調內容之該音頻資料的該各自頻帶。
- 如申請專利範圍第5項之方法,其中該掩碼值校正處理係BABNDNORM處理,且步驟(d)包含以第一縮放常數執行該BABNDNORM處理,以供具有突出的音調內容的該各自頻帶之用,並以第二縮放常數執行該 BABNDNORM處理,以供缺少突出的音調內容的該各自頻帶之用的步驟。
- 如申請專利範圍第1項之方法,其中該差異的程度係為該音頻資料的指數與對應之罩幕指數間之均方差異的程度。
- 如申請專利範圍第1項之方法,其中該補償控制資料指示該組合中之各個個別的低頻帶是否具有突出的音調內容,且在步驟(c)中,低頻補償係在該組合中之各個個別的低頻帶上被選擇性地執行或不執行。
- 如申請專利範圍第1項之方法,其中該補償控制資料指示該組合中之該等低頻帶於一起考慮時,是否具有突出的音調內容,且當該補償控制資料指示該組合中之該等低頻帶於一起考慮時具有突出的音調內容時,則在步驟(c)中,低頻補償被執行於該組合中之所有該等低頻帶上。
- 一種音頻編碼器,係組構以反應於頻域音頻資料產生編碼之音頻資料,包括藉由執行適應性低頻補償於該音頻資料上,該編碼器包含:音調性偵測器,係組構而在該音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;以及低頻補償級,係耦接且組構以反應於該補償控制資料適應性地執行低頻補償於該音頻資料之低頻帶的該組合之 各自低頻帶上,包括針對該各低頻帶,藉由產生用於在該頻帶中該音頻資料的預掩碼值,而針對該各低頻帶,決定用於在該頻帶中該音頻資料的掩碼值,其中用於如該補償控制資料所指示之具有突出的音調內容之該各自低頻帶中該音頻資料的該掩碼值係藉由執行低頻補償來獲得,以校正用於在該頻帶中該音頻資料的該預掩碼值,且用於在該組合中各個其它低頻帶中該音頻資料的該掩碼值係為用於在該頻帶中該音頻資料的該預掩碼值,其中該頻域音頻資料包含用於該組合之該各自低頻帶的指數值,且該音調性偵測器係組構以針對該組合之該各自低頻帶而決定該音頻資料的指數與對應之罩幕指數間之差異的程度。
- 如申請專利範圍第10項之編碼器,其中該補償控制資料指示該組合之至少一頻帶是否表示群眾噪聲或掌聲。
- 如申請專利範圍第10項之編碼器,其中該低頻補償級係組構而以允許解碼器執行該編碼之音頻資料的解碼,而無需決定或被告知關於低頻補償是否在該編碼的期間被施加至任一低頻帶之方式,反應於該補償控制資料適應性地致能低頻補償對低頻帶的該組合之各自頻帶的音頻資料之施加。
- 如申請專利範圍第10項之編碼器,其中該低頻補償級係組構而重罩幕如該補償控制資料所指示之缺少突出的音調內容之該各自低頻帶中的該音頻資料,以產生包含至少一修正指數之修正音頻資料。
- 如申請專利範圍第13項之編碼器,其中該低頻補償級係組構而重罩幕如該補償控制資料所指示之缺少突出的音調內容之該各自低頻帶中的該音頻資料,包括藉由產生用於缺少突出的音調內容之至少一該低頻帶的該修正指數,使得在下一個更高頻帶中之該音頻資料的該指數減該修正指數必須具有2、1、0、及-1之其中一者的值。
- 如申請專利範圍第10項之編碼器,其中該差異的程度係為該音頻資料的指數與對應之罩幕指數間之均方差異的程度。
- 如申請專利範圍第10項之編碼器,其中該編碼器係處理器,該處理器係以實施該音調性偵測器及該低頻補償級之軟體而予以編程。
- 如申請專利範圍第10項之編碼器,其中該編碼器係數位信號處理器。
- 如申請專利範圍第10項之編碼器,其中該音調性偵測器係組構而在該音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料的該等頻帶之至少一子組合的各自頻帶是否具有突出的音調內容,以及其中該編碼器包含掩碼值校正級,其係組構而以第一方式執行掩碼值校正處理,用於如該補償控制資料所指示之具有突出的音調內容之該音頻資料的該各自頻帶,並以第二方式執行掩碼值校正處理,用於如該補償控制資料所指示之缺少突出的音調內容之該音頻資料的該各自頻帶。
- 如申請專利範圍第18項之編碼器,其中該掩碼 值校正處理係BABNDNORM處理,且該掩碼值校正級係組構而以第一縮放常數執行該BABNDNORM處理,以供具有突出的音調內容的該各自頻帶之用,並以第二縮放常數執行該BABNDNORM處理,以供缺少突出的音調內容的該各自頻帶之用。
- 一種音頻系統,包含:編碼器,係組構以反應於頻域音頻資料產生編碼之音頻資料,包括藉由執行適應性低頻補償於該音頻資料上;以及解碼器,係組構以解碼該編碼之音頻資料,而恢復該音頻資料,其中該編碼器包含:音調性偵測器,係組構而在該音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;以及低頻補償級,係耦接且組構以反應於該補償控制資料適應性地執行低頻補償於該音頻資料之低頻帶的該組合之各自低頻帶上,包括針對該各低頻帶,藉由產生用於在該頻帶中該音頻資料的預掩碼值,而針對該各低頻帶,決定用於在該頻帶中該音頻資料的掩碼值,其中用於如該補償控制資料所指示之具有突出的音調內容之該各自低頻帶中該音頻資料的該掩碼值係藉由執行低頻補償來獲得,以校正用於在該頻帶中該音頻資料的該預掩碼值,且用於在該組合中各其它低頻帶中該音頻資料的該掩碼值係為用於在 該頻帶中該音頻資料的該預掩碼值,其中該頻域音頻資料包含用於該組合之該各自低頻帶的指數值,且該音調性偵測器係組構以針對該組合之該各自低頻帶而決定該音頻資料的指數與對應之罩幕指數間之差異的程度。
- 如申請專利範圍第20項之系統,其中該補償控制資料指示該組合之至少一頻帶是否表示群眾噪聲或掌聲。
- 如申請專利範圍第20項之系統,其中該解碼器係組構以解碼該編碼之音頻資料,而無需決定或被告知關於低頻補償是否在該編碼的期間被施加至任一低頻帶。
- 如申請專利範圍第20項之系統,其中該低頻補償級係組構而重罩幕如該補償控制資料所指示之缺少突出的音調內容之該各自低頻帶中的該音頻資料,以產生包含至少一修正指數之修正音頻資料。
- 如申請專利範圍第23項之系統,其中該低頻補償級係組構而重罩幕如該補償控制資料所指示之缺少突出的音調內容之該各自低頻帶中的該音頻資料,包括藉由產生用於缺少突出的音調內容之至少一該低頻帶的該修正指數,使得在下一個更高頻帶中之該音頻資料的該指數減該修正指數必須具有2、1、0、及-1之其中一者的值。
- 一種編碼之音頻資料的解碼方法,包含以下步驟:接收指示編碼之音頻資料的信號;以及解碼該編碼之音頻資料,以產生指示該音頻資料的信 號,其中該編碼之音頻資料已藉由以下而產生:(a)在頻域音頻資料上執行音調性偵測,以產生補償控制資料,而指示該音頻資料之至少一些低頻帶的組合之各自低頻帶是否具有突出的音調內容;(b)針對該各自的低頻帶,產生用於在該頻帶中該音頻資料的預掩碼值;以及(c)針對該各自的低頻帶,決定用於在該頻帶中該音頻資料的掩碼值,其中用於如該補償控制資料所指示之具有突出的音調內容之該各自低頻帶中該音頻資料的該掩碼值係藉由執行低頻補償來獲得,以校正用於在該頻帶中該音頻資料的該預掩碼值,且用於在該組合中各其它低頻帶中該音頻資料的該掩碼值係為用於在該頻帶中該音頻資料的該預掩碼值,其中該頻域音頻資料包含用於該組合之該各自低頻帶的指數值,且步驟(a)包含針對該組合之該各自低頻帶而決定該音頻資料的指數與對應之罩幕指數間之差異的程度之步驟。
- 如申請專利範圍第25項之方法,其中該補償控制資料指示該組合之至少一頻帶是否表示群眾噪聲或掌聲,且步驟(c)包含以下步驟:產生掩碼值,用於如該補償控制資料所指示之表示掌聲或群眾噪聲的該組合之各自低頻帶中的該音頻資料,而無需執行低頻補償。
- 如申請專利範圍第25項之方法,其中步驟(c) 包含重罩幕如該補償控制資料所指示之缺少突出的音調內容之該組合的各自低頻帶中之該音頻資料,以產生包含修正指數之修正音頻資料,用於缺少突出的音調內容之至少一該低頻帶的步驟。
- 如申請專利範圍第27項之方法,其中重罩幕之該步驟產生用於缺少突出的音調內容之至少一該低頻帶的該修正指數,使得在下一個更高頻帶中之該音頻資料的該指數減該修正指數必須具有2、1、0、及-1之其中一者的值。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201261584478P | 2012-01-09 | 2012-01-09 | |
| US13/588,890 US8527264B2 (en) | 2012-01-09 | 2012-08-17 | Method and system for encoding audio data with adaptive low frequency compensation |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201329961A TW201329961A (zh) | 2013-07-16 |
| TWI470621B true TWI470621B (zh) | 2015-01-21 |
Family
ID=48744528
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW101135106A TWI470621B (zh) | 2012-01-09 | 2012-09-25 | 以適應性低頻補償編碼音頻資料的方法、編碼器與系統 |
Country Status (18)
| Country | Link |
|---|---|
| US (2) | US8527264B2 (zh) |
| EP (1) | EP2803067B1 (zh) |
| JP (2) | JP5755379B2 (zh) |
| KR (1) | KR101621704B1 (zh) |
| AR (1) | AR088007A1 (zh) |
| AU (1) | AU2012364749B2 (zh) |
| BR (1) | BR112014016847B1 (zh) |
| CA (1) | CA2858663C (zh) |
| CL (1) | CL2014001805A1 (zh) |
| IL (1) | IL233029A0 (zh) |
| IN (1) | IN2014CN04457A (zh) |
| MX (1) | MX335999B (zh) |
| MY (1) | MY187728A (zh) |
| RU (1) | RU2583717C1 (zh) |
| SG (1) | SG11201402983UA (zh) |
| TW (1) | TWI470621B (zh) |
| UA (1) | UA110291C2 (zh) |
| WO (1) | WO2013106098A1 (zh) |
Families Citing this family (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010013752A1 (ja) * | 2008-07-29 | 2010-02-04 | ヤマハ株式会社 | 演奏関連情報出力装置、演奏関連情報出力装置を備えるシステム、及び電子楽器 |
| CN101983513B (zh) * | 2008-07-30 | 2014-08-27 | 雅马哈株式会社 | 音频信号处理装置、音频信号处理系统以及音频信号处理方法 |
| JP5782677B2 (ja) | 2010-03-31 | 2015-09-24 | ヤマハ株式会社 | コンテンツ再生装置および音声処理システム |
| EP2573761B1 (en) | 2011-09-25 | 2018-02-14 | Yamaha Corporation | Displaying content in relation to music reproduction by means of information processing apparatus independent of music reproduction apparatus |
| JP5494677B2 (ja) | 2012-01-06 | 2014-05-21 | ヤマハ株式会社 | 演奏装置及び演奏プログラム |
| US9830917B2 (en) | 2013-02-14 | 2017-11-28 | Dolby Laboratories Licensing Corporation | Methods for audio signal transient detection and decorrelation control |
| TWI618051B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於利用估計之空間參數的音頻訊號增強的音頻訊號處理方法及裝置 |
| KR101729930B1 (ko) | 2013-02-14 | 2017-04-25 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 업믹스된 오디오 신호들의 채널간 코히어런스를 제어하기 위한 방법 |
| TWI618050B (zh) | 2013-02-14 | 2018-03-11 | 杜比實驗室特許公司 | 用於音訊處理系統中之訊號去相關的方法及設備 |
| EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
| JP6492915B2 (ja) * | 2015-04-15 | 2019-04-03 | 富士通株式会社 | 符号化装置、符号化方法、及びプログラム |
| EP3288031A1 (en) | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
| US11232804B2 (en) * | 2017-07-03 | 2022-01-25 | Dolby International Ab | Low complexity dense transient events detection and coding |
| CN108616277B (zh) * | 2018-05-22 | 2021-07-13 | 电子科技大学 | 一种多通道频域补偿的快速校正方法 |
| WO2020253941A1 (en) | 2019-06-17 | 2020-12-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs |
| AU2020340937A1 (en) | 2019-09-03 | 2022-03-24 | Dolby Laboratories Licensing Corporation | Low-latency, low-frequency effects codec |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060004565A1 (en) * | 2004-07-01 | 2006-01-05 | Fujitsu Limited | Audio signal encoding device and storage medium for storing encoding program |
| US7509257B2 (en) * | 2002-12-24 | 2009-03-24 | Marvell International Ltd. | Method and apparatus for adapting reference templates |
Family Cites Families (17)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US4817155A (en) * | 1983-05-05 | 1989-03-28 | Briar Herman P | Method and apparatus for speech analysis |
| ES2087522T3 (es) | 1991-01-08 | 1996-07-16 | Dolby Lab Licensing Corp | Descodificacion/codificacion para campos sonoros multidimensionales. |
| US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
| US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
| US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
| JPH10261964A (ja) * | 1997-03-19 | 1998-09-29 | Sanyo Electric Co Ltd | 情報信号処理装置 |
| CA2230188A1 (en) * | 1998-03-27 | 1999-09-27 | William C. Treurniet | Objective audio quality measurement |
| EP1228569A1 (en) * | 1999-10-30 | 2002-08-07 | STMicroelectronics Asia Pacific Pte Ltd. | A method of encoding frequency coefficients in an ac-3 encoder |
| CN100431355C (zh) * | 2000-08-16 | 2008-11-05 | 多尔拜实验特许公司 | 响应补充信息修改音频或视频感知编码系统的一个或多个参数 |
| AU2211102A (en) * | 2000-11-30 | 2002-06-11 | Scient Generics Ltd | Acoustic communication system |
| US7747655B2 (en) * | 2001-11-19 | 2010-06-29 | Ricoh Co. Ltd. | Printable representations for time-based media |
| US7110941B2 (en) * | 2002-03-28 | 2006-09-19 | Microsoft Corporation | System and method for embedded audio coding with implicit auditory masking |
| US7333930B2 (en) * | 2003-03-14 | 2008-02-19 | Agere Systems Inc. | Tonal analysis for perceptual audio coding using a compressed spectral representation |
| US7516064B2 (en) | 2004-02-19 | 2009-04-07 | Dolby Laboratories Licensing Corporation | Adaptive hybrid transform for signal analysis and synthesis |
| WO2009000073A1 (en) * | 2007-06-22 | 2008-12-31 | Voiceage Corporation | Method and device for sound activity detection and sound signal classification |
| EP2193348A1 (en) * | 2007-09-28 | 2010-06-09 | Voiceage Corporation | Method and device for efficient quantization of transform information in an embedded speech and audio codec |
| KR20090122142A (ko) | 2008-05-23 | 2009-11-26 | 엘지전자 주식회사 | 오디오 신호 처리 방법 및 장치 |
-
2012
- 2012-08-17 US US13/588,890 patent/US8527264B2/en active Active
- 2012-09-25 AR ARP120103522A patent/AR088007A1/es active IP Right Grant
- 2012-09-25 UA UAA201407672A patent/UA110291C2/ru unknown
- 2012-09-25 MY MYPI2014001783A patent/MY187728A/en unknown
- 2012-09-25 BR BR112014016847-4A patent/BR112014016847B1/pt active IP Right Grant
- 2012-09-25 SG SG11201402983UA patent/SG11201402983UA/en unknown
- 2012-09-25 KR KR1020147018354A patent/KR101621704B1/ko active Active
- 2012-09-25 MX MX2014007400A patent/MX335999B/es unknown
- 2012-09-25 CA CA2858663A patent/CA2858663C/en active Active
- 2012-09-25 AU AU2012364749A patent/AU2012364749B2/en active Active
- 2012-09-25 IN IN4457CHN2014 patent/IN2014CN04457A/en unknown
- 2012-09-25 EP EP12784365.4A patent/EP2803067B1/en active Active
- 2012-09-25 RU RU2014127740/08A patent/RU2583717C1/ru active
- 2012-09-25 JP JP2014551236A patent/JP5755379B2/ja active Active
- 2012-09-25 TW TW101135106A patent/TWI470621B/zh active
- 2012-09-25 WO PCT/US2012/057132 patent/WO2013106098A1/en not_active Ceased
-
2014
- 2014-06-09 IL IL233029A patent/IL233029A0/en active IP Right Grant
- 2014-07-07 US US14/325,130 patent/US9275649B2/en active Active
- 2014-07-07 CL CL2014001805A patent/CL2014001805A1/es unknown
-
2015
- 2015-05-26 JP JP2015106044A patent/JP6093801B2/ja active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7509257B2 (en) * | 2002-12-24 | 2009-03-24 | Marvell International Ltd. | Method and apparatus for adapting reference templates |
| US20060004565A1 (en) * | 2004-07-01 | 2006-01-05 | Fujitsu Limited | Audio signal encoding device and storage medium for storing encoding program |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI470621B (zh) | 以適應性低頻補償編碼音頻資料的方法、編碼器與系統 | |
| RU2660605C2 (ru) | Концепция заполнения шумом | |
| JP6227117B2 (ja) | オーディオ・エンコーダおよびデコーダ | |
| RU2494477C2 (ru) | Устройство и способ генерирования выходных данных расширения полосы пропускания | |
| JP6779966B2 (ja) | 先進量子化器 | |
| JP2025114804A (ja) | オーディオ処理のための心理音響モデル | |
| KR20190042070A (ko) | 보상 값을 사용하여 오디오 신호를 인코딩하기 위한 장치 및 방법 | |
| US8589155B2 (en) | Adaptive tuning of the perceptual model | |
| RU2828411C2 (ru) | Звуковые кодирующее устройство и декодирующее устройство | |
| CN104040623B (zh) | 用于利用自适应低频补偿编码音频数据的方法和系统 | |
| US20240194209A1 (en) | Apparatus and method for removing undesired auditory roughness | |
| HK1201976B (zh) | 用於利用自适应低频补偿编码音频数据的方法和系统 |