TWI669705B - 用以使用側邊增益及殘餘增益編碼或解碼多通道信號之設備及方法 - Google Patents
用以使用側邊增益及殘餘增益編碼或解碼多通道信號之設備及方法 Download PDFInfo
- Publication number
- TWI669705B TWI669705B TW106138472A TW106138472A TWI669705B TW I669705 B TWI669705 B TW I669705B TW 106138472 A TW106138472 A TW 106138472A TW 106138472 A TW106138472 A TW 106138472A TW I669705 B TWI669705 B TW I669705B
- Authority
- TW
- Taiwan
- Prior art keywords
- channel
- gain
- signal
- residual
- calculate
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims description 39
- 238000013139 quantization Methods 0.000 claims description 53
- 238000004364 calculation method Methods 0.000 claims description 28
- 238000001228 spectrum Methods 0.000 claims description 17
- 230000001419 dependent effect Effects 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 10
- 238000012360 testing method Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 5
- 239000002131 composite material Substances 0.000 claims description 2
- 238000010276 construction Methods 0.000 claims description 2
- 239000000203 mixture Substances 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 238000011002 quantification Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 9
- 238000004422 calculation algorithm Methods 0.000 description 7
- 230000015572 biosynthetic process Effects 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-M argininate Chemical group [O-]C(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-M 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010363 phase shift Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Theoretical Computer Science (AREA)
- Mathematical Analysis (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Time-Division Multiplex Systems (AREA)
- Analogue/Digital Conversion (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Amplifiers (AREA)
Abstract
一種用於編碼包含至少兩個通道之一多通道信號之設備包含:一降混器,其用於自該多通道信號計算一降混信號;一參數計算器,其用於自該等至少兩個通道中之一第一通道及該等至少兩個通道中之一第二通道計算一側邊增益及用於自該第一通道及該第二通道計算一殘餘增益;以及一輸出介面,其用於產生一輸出信號,該輸出信號包含關於該降混信號以及關於該側邊增益及該殘餘增益之資訊。
Description
發明領域 本發明係關於音訊編碼之領域,且特定言之,係關於立體聲或多通道編碼/解碼之領域。
發明背景 用於以低位元率進行的對立體聲信號之有損參數編碼的目前先進技術方法係基於如在MPEG-4部分3中標準化的參數立體聲。一般的理念為藉由在提取作為側邊資訊發送至解碼器之立體聲參數後計算來自兩個輸入通道之降混信號來減少通道之數目。此等立體聲參數通常為在子頻帶中計算且在某一程度上捕獲空間影像之通道間位準差ILD、通道間相位差IPD及通道間連貫性ICC。
解碼器執行單聲道輸入之升混,從而創造滿足ILD、IPD及ICC關係之兩個通道。此係藉由使輸入信號連同在解碼器處產生的彼信號之去相關型式矩陣化來進行。
已發現,例如,此等參數之使用招致用於計算及處置此等參數之顯著複雜性。特定言之,ILD參數有問題,此係由於其可具有非常小或非常大之值,且此幾乎不受限制的值範圍引起了關於高效計算、量化等之問題。
發明概要 本發明之一目標為提供用於處理多通道數據之經改良概念。
此目標係藉由如技術方案1之一種用於編碼一多通道信號之設備、如技術方案25之一種用於解碼一經編碼多通道信號之設備、如技術方案41之一種編碼一多通道信號之方法、如技術方案42之一種解碼一經編碼多通道信號之方法、如技術方案43之一種電腦程式或如技術方案44之一種經編碼多通道信號來達成。
第一態樣之本發明係基於以下發現:與先前技術大不相同,採用依賴於兩個增益參數(亦即,側邊增益參數及殘餘增益參數)之不同參數編碼程序。兩個增益參數皆自多通道信號之至少兩個通道中之第一通道及該多通道信號之該等至少兩通道中之第二通道計算。此等增益參數兩者(亦即,側邊增益及殘餘增益)經傳輸或儲存,或通常與由降混器自該多通道信號計算之降混信號一起輸出。
該第一態樣的本發明之實施例係基於新中間/側邊方法,從而導致新參數集合:在編碼器處,將中間/側邊變換應用至一起捕獲兩個輸入通道之完全資訊的該等輸入通道。中間信號為左與右通道之加權平均值,其中權數為複數且經選擇以補償相位差。因此,側邊信號為輸入通道之對應的加權差。僅中間信號經波形寫碼,而側邊信號經參數模型化。編碼器在其提取IPD及兩個增益參數作為立體聲參數的子頻帶中操作。將被稱作側邊增益的第一增益自藉由中間信號預測側邊信號產生,而將被稱作殘餘增益之第二增益捕獲相對於中間信號之能量的其餘部分之能量。中間信號接著充當與立體聲參數一起傳輸至解碼器之降混信號。
解碼器藉由基於側邊增益及殘餘增益估計失去之側邊通道且使用對其餘部分之取代來合成兩個通道。
第一態樣之本發明的有利之處在於,一方面側邊增益及另一方面殘餘增益為限於某一小的數目範圍之增益。特定言之,在較佳實施例中,側邊增益限於-1至+1之範圍,且殘餘增益甚至限於0與1之範圍。並且,在較佳實施例中甚至更有用的為,殘餘增益取決於側邊增益,使得側邊增益變得愈大,殘餘增益可具有之值範圍正變得愈小。
特定言之,將側邊增益作為可適用於第一及第二通道之中間信號的側邊預測增益計算,以便預測第一及第二通道之側邊信號。且參數計算器亦經組配以將殘餘增益作為殘餘預測增益計算,殘餘預測增益指示藉由中間信號及側邊增益對側邊信號之此預測的殘餘信號之能量或振幅。
然而,重要地,不必對編碼器側實際執行預測,或實際編碼編碼器側上之側邊信號。取而代之,可藉由僅使用振幅相關量度(諸如,能量、功率或與左及右通道之振幅有關的其他特性)來計算側邊增益及殘餘增益。另外,側邊增益及殘餘增益之計算僅與兩個通道之間的內積有關,亦即,除了左通道及右通道之外任何其他通道(諸如,降混通道自身或側邊通道自身)並不必需在實施例中計算。然而,在其他實施例中,可計算側邊信號,可計算用於預測之不同試驗,且可自與某一側邊增益預測相關聯之殘餘信號計算諸如側邊增益及殘餘增益之增益參數,從而導致在不同試驗中的預定義準則,諸如,殘餘或剩餘信號之最小能量。因此,存在高靈活性,及仍然,用於一方面計算側邊增益及另一方面計算殘餘增益之低複雜性。
存在較之ILD及ICC的示範性之兩個增益參數優點。首先,其天然處於有限間隔中(側邊增益在[-1,1]中,且殘餘增益在[0,1]中),如與可採用任意大或小值之ILD參數相反。且第二,計算不太複雜,此係由於其僅涉及單個特殊函數評估,而ILD及ICC之計算涉及兩個。
第一態樣之優選實施例依賴於在頻譜域中的參數之計算,亦即,針對不同頻率區間,或者,更佳地,針對每一子頻帶包含某一數目個頻率區間之不同子頻帶,計算參數。在一較佳實施例中,一子頻帶內包括的頻率區間之數目自較低至較高子頻帶增加,以便模仿人類聆聽感覺之特性,亦即,較高頻帶覆蓋較高頻率範圍或頻寬,且較低頻帶覆蓋較低頻率範圍或頻寬。
在一較佳實施例中,降混器計算絕對相位補償之降混信號,其中,基於IPD參數,將相位旋轉應用至左及右通道,但按以下方式執行相位補償:具有較多能量之通道旋轉得比具有較少能量之通道少。為了控制相位補償,可較佳地使用側邊增益,然而,在其他實施例中,可使用任一其他降混,且此亦為本發明之具體優勢——僅基於原始第一及第二通道計算側邊信號之參數表示(亦即,一方面側邊增益,及另一方面殘餘增益),且不需要關於傳輸之降混的任何資訊。因此,可使用任一降混連同由側邊增益及殘餘增益組成之新參數表示,但本發明亦特別可用於與基於側邊增益之絕對相位補償一起應用。
在絕對相位補償之再一實施例中,相位補償參數特別係基於具體預定數計算,使得在計算相位補償參數時出現的反正切函數(atan或tan-1
)之奇點自中心移動至某一側位置。奇點之此移位確保對於+/-180°之相移及靠近0之增益參數(亦即,具有相當類似能量之左通道與右通道),歸因於奇點之任何問題不會出現。已發現此類信號相當頻繁地出現,但在自然情形中,彼此異相但具有(例如)3 dB與12 dB之間或大約6 dB的差之信號不會出現。因此,雖然僅移位奇點,但已發現,此移位仍然改良降混器之總體效能,此係由於此移位確保奇點出現在信號分佈圖情形中,在正常情形中,奇點出現得比直接反正切函數具有其奇點之情況少得多。
另外實施例使用側邊增益及殘餘增益之相依性用於實施高效量化程序。為此目的,較佳地執行聯合量化,在第一實施例中,執行聯合量化使得首先量化側邊增益,且接著使用基於側邊增益之值的量化步驟量化殘餘增益。然而,其他實施例依賴於聯合量化,其中將兩個參數量化成單一代碼,且此代碼之某些部分依賴於屬於由編碼器編碼的兩個通道之某一位準差特性的某些群組之量化點。
第二態樣係關於一種用於降混包含至少兩個通道之一多通道信號之設備,該設備包含:一降混器,其用於自該多通道信號計算一降混信號,其中該降混器經組配以使用一絕對相位補償計算該降混,使得在計算該降混信號時,僅在該等至少兩個通道當中具有一較低能量之一通道經旋轉或旋轉得比具有一較大能量之一通道強;以及一輸出介面,其用於產生一輸出信號,該輸出信號包含關於該降混信號之資訊。
較佳地,較佳地在次通道上進行旋轉,但次通道並不始終旋轉得比主通道多之情況可在小能量差情形中,但是,若能量比足夠大或足夠小,則優選實施例將次通道旋轉得比主通道多。因此,較佳地,僅當能量差顯著或大於預定義臨限值(諸如,1 dB或更大)時,將次通道旋轉得比主通道多。此不僅適用於降混器,而且適用於升混器。
較佳實施例之詳細說明 圖1說明用於編碼包含至少兩個通道之一多通道信號之設備。特定言之,該多通道信號在圖1中說明於100處,且具有一第一通道101及一第二通道102,且不具有額外通道或任意選定數目個額外通道,其中再一額外通道說明於103處。
將多通道信號100輸入至降混器120內以用於自多通道信號100計算降混信號122。取決於某一實施,降混器可使用第一通道101、第二通道102及第三通道103或僅第一及第二通道或多通道信號之所有通道用於計算多通道信號。
此外,用於編碼之設備包含用於自該等至少兩個通道中之第一通道101及第二通道102計算側邊增益141之一參數計算器140,且另外,參數計算器104自第一通道及第二通道計算一殘餘增益142。在其他實施例中,亦計算可選通道間相位差(IPD),如在143處所說明。將降混信號122、側邊增益141及殘餘增益142轉遞至輸出介面160,該輸出介面產生包含關於降混信號122、關於側邊增益141及殘餘增益142之資訊的經編碼多通道信號162。
應注意,通常針對訊框來計算側邊增益及殘餘增益,使得對於每一訊框,計算單一側邊增益及單一殘餘增益。然而,在其他實施例中,不僅針對每一訊框計算單一側邊增益及單一殘餘增益,而且針對各側邊增益及各殘餘增益與第一通道及第二通道之某一子頻帶有關之一訊框計算一群側邊增益及一群殘餘增益。因此,在較佳實施例中,參數計算器針對第一及第二通道之各訊框計算一群側邊增益及一群殘餘增益,其中對於一訊框的側邊及殘餘增益之數目通常等於子頻帶之數目。當應用高解析度時間-頻譜-轉換(諸如,DFT)時,自該第一通道及該第二通道之一群頻率區間計算針對某一子頻帶之側邊增益及殘餘增益。然而,當應用導致子頻帶信號之低解析度時間-頻率變換時,參數計算器140則針對各子頻帶或甚至針對一群子頻帶計算側邊增益及殘餘增益。
當針對一群子頻帶信號計算側邊增益及殘餘增益時,則降低參數解析度,從而導致較低位元率,並且導致側邊信號之參數表示之較低品質表示。在其他實施例中,亦可修改時間解析度,使得並不針對各訊框計算側邊增益及殘餘增益,而是針對一群訊框計算側邊增益及殘餘增益,其中該群訊框具有兩個或更多個訊框。因此,在此實施例中,較佳地,計算子頻帶有關之側邊/殘餘增益,其中側邊/殘餘增益指某一子頻帶,但是指包含兩個或更多個訊框之一群訊框。因此,根據本發明,可按高度靈活性修改由塊140執行的參數計算之時間及頻率解析度。
較佳地,如在圖2中關於第一實施例概述或如在圖3中關於第二實施例概述來實施參數計算器140。在圖2實施例中,參數計算器包含第一時間-頻譜轉換器21及第二時間-頻譜轉換器22。此外,圖1之參數計算器140包含用於計算第一振幅相關特性之一計算器23及用於計算第二振幅相關特性之一計算器24及用於計算區塊21及22之輸出之(亦即,第一及第二通道的頻譜表示之)內積之一計算器25。
區塊23、24、25之輸出經轉遞至側邊增益計算器26,且亦轉遞至殘餘增益計算器27。側邊增益計算器26及殘餘增益計算器27應用第一振幅相關特性、第二振幅相關特性與內積間的某一關係,且由殘餘增益計算器應用用於組合兩個輸入之關係與由側邊增益計算器26應用之關係不同。
在一較佳實施例中,第一及第二振幅相關特性為在子頻帶中之能量。然而,其他振幅相關特性係關於子頻帶自身中之振幅,係關於子頻帶中之信號功率,或係關於具有大於1之冪的振幅之任何其他功率,其中冪數可為大於1之實數或大於1之整數,此整數2係關於信號功率及能量,或係關於與響度等相關聯之數目3。因此,各振幅相關特性可用於計算側邊增益及殘餘增益。
在一較佳實施例中,側邊增益計算器及殘餘增益計算器27經組配以將側邊增益作為可適用於第一及第二通道之中間信號的側邊預測增益計算,以預測第一及第二通道或參數計算器之側邊信號,且特定言之,殘餘增益計算器27經組配以將殘餘增益作為殘餘預測增益計算,該殘餘預測增益指示由中間信號使用側邊增益進行的側邊信號之預測的殘餘信號之有振幅有關之量度。
詳言之,參數計算器140及圖2之側邊增益計算器26經組配以使用具有分子及分母之一分數計算側邊信號,其中該分子包含第一及第二通道之振幅特性,且該分母包含第一及第二通道之振幅特性及自內積導出之值。自內積導出之值較佳地為內積之絕對值,但可替代地為諸如大於1之冪的絕對值之任一冪,或可甚至為與絕對值不同之特性,諸如,共軛複數項或內積自身等等。
在再一實施例中,參數計算器及圖2之殘餘增益計算器27亦使用具有分子及分母之分數,分子及分母都使用自內積及另外其他參數導出之值。再次,自內積導出之值較佳地為內積之絕對值,但可替代地為諸如大於1之冪的絕對值之任一冪,或甚至可為與絕對值不同之特性,諸如,共軛複數項或內積自身等等。
詳言之,圖2之側邊計算器26經組配以使用第一通道之能量之差用於計算側邊增益,且分母使用兩個通道的能量或振幅特性之總和及另外內積且較佳地內積之兩倍,但亦可使用內積之其他倍數。
殘餘增益計算器27經組配以用於在分子中使用第一與第二通道之振幅特性之加權和及內積,其中該內積係自第一與第二通道之振幅特性之加權和減去。用於計算殘餘增益計算器之分母包含第一與第二通道之振幅特性之總和及內積,其中該內積較佳地由二相乘,但亦可由其他因子相乘。
此外,如由連接線28說明,殘餘增益計算器27經組配以用於使用由側邊增益計算器計算之側邊增益來計算殘餘增益。
在一較佳實施例中,殘餘增益及側邊增益如下運算。詳言之,可或可不計算隨後將描述的逐頻帶通道間相位差。然而,在特定概括如稍後在等式(9)中說明的側邊增益之計算及如稍後在等式(10)中說明的側邊增益之具體較佳計算前,給出編碼器之進一步描述,除了增益參數之計算外,其亦關於IPD及降混之計算。
在頻域中進行立體聲參數之編碼及降混信號之計算。為此目的,左通道及右通道之時間頻率向量及係藉由同時應用分析窗跟著為離散傅立葉變換(DFT)來產生:接著將DFT頻率區間分群到子頻帶∈及∈內,其中表示子頻帶索引之集合。 IPD及降混之計算
對於降混,將逐頻帶通道間相位差(IPD)計算為 IPDt,b
= arg() (1) 其中z *
表示z
之複數共軛。此用以產生逐頻帶中間及側邊信號(2) 及(3) 對於k
∈。絕對相位旋轉參數β
由以下給出 β =) (4) 其中表示將在下文指定之側邊增益。此處,atan2(y,x)為兩自變數反正切函數,其值為點(x,y)
與正x 軸
之間的角度。希望對具有較少能量之通道進行相當的IPD補償。因子2將在= ±π
且gt,b
=
0處之奇點移動至= ±π
且= -1/3。在於左與右通道中具有大致相等能量分佈之異相情形中,避免了β之此方式雙態觸發。藉由將反向DFT應用於,接著為合成窗及重疊相加,產生降混信號。
在其他實施例中,亦可使用與atan2函數不同之其他反正切函數,諸如,直接正切函數,但atan2函數歸因於其對所造成的問題之安全應用而為較佳的。 增益參數之計算
除了逐頻帶IPD之外,亦提取兩個另外立體聲參數。用於藉由預測之最佳增益,亦即,,使得其餘部分之能量(5) 最小,及增益因子,若應用於中間信號,則其使每一頻帶中的能量相等,亦即,(6)
可自子頻帶中之能量(7) 及與之內積之絕對值(8) 將最佳預測增益計算為(9)
由此得出,在[-1, 1]中。可自能量及內積類似地將殘餘增益計算為(10) 其暗示 0 ≤≤(11)
詳言之,此展示∈[0,1]。這樣,可藉由計算對應的能量及內積而與降混獨立的計算立體聲參數。詳言之,無必要計算殘餘,以便計算其能量。值得注意地,增益之計算涉及僅一個特殊函數評估,而自、及計算ILD及ICC涉及兩個,即,平方根及對數: IL(12) 及(13) 降低參數解析度
若需要如由窗長度給出之較低參數解析度,則吾人可藉由在(9)及(10)中用(14) 替換及用(15) 替換及來計算h
個連續窗上之增益參數。側邊增益則為權數取決於之能量或取決於逐頻帶能量之個別窗的側邊增益之加權平均值,其中s為等式14及15中之總和索引。
類似地,接著將在若干窗上之IPD值計算為(16)
較佳地,在圖1中所說明之參數計算器140經組配以將逐個子頻帶表示作為一複值頻譜序列計算,其中各頻譜與第一通道或第二通道之時間框有關,其中該序列之時間框彼此鄰近且其中鄰近時間框彼此重疊。
此外,參數產生器140經組配以藉由將子頻帶中的複頻譜值之量值求平方且藉由將子頻帶中之平方量值求和來計算第一及第二振幅相關量度,如例如先前亦在等式(7)中所說明,其中索引b表示子頻帶。
此外,如亦在等式8中概述,參數計算器140及(詳言之)圖2之內積計算器25經組配以藉由在子頻帶將積求和來計算內積,其中各積涉及在第一通道之頻率區間中的頻譜值及針對該頻率區間的第二通道之共軛複數頻譜值。隨後,形成加總在一起的結果之量值。
亦如在等式1至4中所概述,較佳地,使用絕對相位補償。因此,在此實施例中,降混器120經組配以使用絕對相位補償計算降混122,使得當計算降混信號時,僅旋轉兩個通道當中具有較低能量之通道,或將兩個通道當中具有較低能量之通道旋轉得比具有較大能量之另一通道強。此降混器120說明於圖4中。詳言之,降混器包含一通道間相位差(IPD)計算器30、一絕對相位旋轉計算器32、一降混計算器34及一能量差或側邊增益計算器36。應強調,可將能量差或側邊增益計算器36實施為圖2中之側邊增益計算器26。然而,替代地,出於相位旋轉之目的,在區塊36中亦可存在僅計算能量差或通常振幅相關特性差(其可為能量、功率或振幅自身或加在一起的振幅之冪,其中冪不同於二,諸如,一與二之間或大於二的冪)之不同實施。
詳言之,指數或冪三對應於(例如)響度,而非能量。
詳言之,圖4之IPD計算器30經組配以通常針對輸入至區塊30內之第一通道101及第二通道102中的每個之多個子頻帶中之各子頻帶計算通道間相位差。此外,降混器具有絕對相位旋轉參數,再次通常針對基於第一與第二通道之間的由區塊36提供之能量差或通常基於兩個通道101、102之間的振幅相關特性差操作的該等多個子頻帶中之各子頻帶。另外,降混計算器34經組配以當計算降混信號時使用IPD參數及指示為β之絕對相位旋轉參數對第一及第二通道進行加權。
較佳地,將區塊36實施為側邊增益計算器,使得絕對相位旋轉計算器基於側邊增益操作。
因此,在一較佳實施例中,圖4之區塊30經組配用於實施等式(1),區塊32經組配用於實施等式(4),且區塊34經組配用於實施等式(2)。
詳言之,在涉及側邊增益gt ,b
之項前的等式(4)中之因子2可設定為不同於2,且可為(例如)較佳地在0.1與100之間的值。自然,亦可使用-0.1與-100。此值確保對於幾乎相等左通道與右通道,在+-180°之IPD處存在之奇點移動至不同地方,亦即,至(例如)-1/3之不同側邊增益(對於因子2)。然而,可使用不同於2之其他因子。此等其他因子接著將奇點自-1/3移動至不同側邊增益參數。已展示所有此等不同因子有用,此係由於此等因子達成有問題之奇點處於具有相關聯之左及右通道信號之聲音階段中的“地方”,相關聯之左及右通道信號通常出現的頻繁度比不上異相及具有相等或幾乎相等能量之信號。
在較佳實施例中,圖1之輸出介面160經組配用於執行參數資訊之量化,亦即,如由參數計算器140線上141提供之側邊增益及如自圖1之參數計算器140線上142提供之殘餘增益的量化。
特定言之,在殘餘增益取決於側邊增益之實施例中,若較佳地,量化側邊增益且接著量化殘餘增益,其中,在此實施例中,殘餘增益之量化步長取決於側邊增益之值。
詳言之,此說明於圖11中,且類似地,亦說明於圖12及圖13中。
圖1展示用於條件量化之線。詳言之,已展示殘餘增益始終在由(1-g2
)1 /2
判定之範圍中。因此,當g = 0時,則r可在0與1之間的範圍中。然而,當g等於0.5時,則r可在0.866與0之範圍中。此外,當例如g = 0.75時,則範圍r限於0與0.66之間。在g = 0.9之極端實施例中,則r可僅範圍在0與0.43之間。此外,舉例而言,當g = 0.99時,則r可僅在0與0.14之間的範圍中。
因此,可藉由針對較高側邊增益降低殘餘增益之量化的量化步長來使用此相依性。因此,當考慮圖11時,展示r之值範圍的垂直線可始終由諸如8之某一整數相除,使得各條線具有八個量化步長。因此,明顯,對於反映較高側邊增益之線,量化步長比對於具有較低側邊增益之線小。因此,可在無位元率之任何增大之情況下更細地量化較高側邊增益。
在再一實施例中,量化器經組配以使用量化點之群組執行聯合量化,其中每個量化點群由第一與第二通道之間的固定振幅相關比率定義。用於振幅相關比率的一個實例為左與右之間的能量,亦即,此意謂針對第一與第二通道之間的相同ILD之線,如在圖12中所說明。在此實施例中,輸出介面如在圖5a中所說明而組配,且包含逐個子頻帶ILD計算器,其接收第一通道及第二通道或替代地側邊增益g及殘餘增益r作為輸入。由參考數字50指示的逐個子頻帶ILD計算器輸出待量化的針對參數值g、r之某一ILD。ILD或通常振幅相關比率經轉遞至群組匹配器52。群組匹配器52判定最佳匹配群組且將此資訊轉遞至點匹配器54。群組匹配器52及點匹配器54皆饋入最後自碼簿輸出諸如碼字之代碼的代碼生成器56。
詳言之,代碼生成器接收側邊增益g之正負號,且判定在圖5b中所說明之正負號位元57a,其針對一子頻帶展示用於g、r之代碼。此外,已判定與判定之ILD匹配的某些量化點群組之群組匹配器輸出在57b處說明之位元2至5,作為群組ID。最後,在圖57c處說明的圖5b之實施例中,點匹配器輸出位元6至8,其中此等位元指示點ID,亦即,在該群組內由位元57b指示的量化點之ID。雖然圖5b指示具有單一正負號位元、四個群組位元及三個點位元之八個位元代碼,但可使用具有一正負號位元及或多或少群組位元及或多或少點位元之其他代碼。歸因於側邊增益具有正及負值之事實,群組位元及點位元(亦即,位元57b之集合及位元57c之集合)僅具有純負值,或較佳地,純正值,且若正負號位元指示負號,則始終將殘餘增益解碼為正值,但接著將側邊增益解碼為負值,此意謂當將如等式9中說明之規則應用於計算側邊增益時,左通道之能量低於右通道之能量。 隨後,概述用於量化之另外實施例。 側邊及殘餘增益之量化
(11)中之不等式揭露了殘餘增益對側邊增益之強相依性,此係由於後者判定前者之範圍。藉由選擇[−1, 1]及[0, 1]中之量化點獨立地量化側邊增益g
及殘餘增益r
因此低效,此係由於用於r
的可能量化點之數目將隨著g
傾向於±1而減少。 條件量化
存在處置此問題之不同方式。最容易之方式為首先量化g
且接著量化以經量化值為條件之r
,其中量化點將處於間隔[0,]中。可接著(例如)在此等量化線上均勻地選擇量化點,此等量化線其中一些描繪於圖11中。 聯合量化
選擇量化點之較複雜方式為查看(g , r
)平面中對應於L
與R
之間的固定能量比之線。若c 2
≥ 1表示此能量比,則對應的線由(0, s
)(對於0 ≤ s ≤ 1,若c
= 1)或以下給出: (s,) 對於≤ s ≤(22)
此亦涵蓋情況c 2 <
1,此係由於交換Lt
與Rt
僅改變gt ,b
之正負號,且使rt ,b
不變。
此方法涵蓋具有相同數目個量化點之較大區域,如可自圖12看出。再次,該等線上之量化點可(例如)根據個別線之長度均勻地選擇。其他可能性包括選擇其以便匹配預選定ICC值,或以聲學方式將其最佳化。
已發現良好地工作之量化方案係基於對應於以下ILD值之能量線: ±{0,2,4,6,8,10,13,16,19,22,25,30,35,40,45,50}, (23) 在其中之每個上選擇8個量化點。此引起具有256個條目之碼簿,其經組織為擁有對應於g
之非負值的值及一正負號位元之8 × 16量化點表。此引起量化點(g , r
)之8位元整數表示,其中例如,第一位元指定g
之正負號,接下來四個位元擁有該8 × 16表中之列索引,且最後三個位元擁有行索引。
可藉由詳盡的碼簿搜尋來進行(gt ,b , rt ,b
)之量化,但首先計算子頻帶ILD且將搜尋限制於最佳匹配能量線係更高效的。這樣,僅需要考慮8個點。
藉由簡單的表查詢來進行解量化。
在圖12中顯示用於涵蓋g
之非負值的此方案之128個量化點。
雖然已揭示用於計算側邊增益及殘餘增益而不實際計算側邊信號(亦即,如等式(9)及等式(10)中說明的左與右信號之間的差信號)之程序,但再一實施例操作以不同地計算側邊增益及殘餘增益,即,伴有側邊信號之實際計算。此程序說明於圖3中。
在此實施例中,圖1中所說明之參數計算器140包含一側邊信號計算器60,其接收第一通道101及第二通道102作為一輸入,且輸出可在時域中但較佳地在頻域中計算(例如,如由等式3說明)之實際側邊信號。然而,雖然等式3指示每頻帶及訊框具有一絕對相位旋轉參數β及一IPD參數的側邊信號之計算之情形,但亦可在無相位補償之情況下計算側邊信號。等式3變為僅Lt ,k
及Rt ,k
出現之等式。因此,亦可將側邊信號作為左與右或第一與第二通道之間的簡單差計算,且可或可不使用具有平方根為2之正規化。
將如由側邊信號計算器60計算之側邊信號轉遞至殘餘信號計算器61。舉例而言,殘餘信號計算器62執行等式(5)中說明之程序。殘餘信號計算器61經組配以使用不同測試側邊增益,亦即,用於側邊增益gd ,b
之不同值,亦即,針對同一個頻帶及訊框之不同測試側邊增益,且因此,如所說明,藉由區塊61之多個輸出,獲得不同殘餘信號。
圖3中之側邊增益選擇器62接收所有不同殘餘信號,且選擇不同殘餘信號中之一者,或與滿足預定義條件的不同殘餘信號中之一者相關聯的測試側邊增益。此預定義條件可(例如)為選擇已導致所有不同殘餘信號當中具有最小能量之殘餘信號的側邊增益。然而,可使用其他預定條件,諸如,不同於能量的最小振幅相關條件,諸如響度。然而,亦可應用其他程序,以便使用不具有最小能量但具有在五個最小能量當中之能量的殘餘信號。實際上,預定義條件亦可為選擇正展示某一其他音訊特性(諸如,某些頻率範圍中之某些特徵)之殘餘信號。
選定具體測試側邊增益由側邊增益選擇器62判定為用於某一訊框或用於某一頻帶及某一訊框之側邊增益參數。將選定殘餘信號轉遞至殘餘增益計算器63,且在一實施例中,該殘餘增益計算器可簡單地計算選定殘餘信號的振幅相關特性,或可較佳地,將殘餘增益作為該殘餘信號的振幅相關特性關於降混信號或中間信號的振幅相關特性之間的關係計算。甚至當使用與經相位補償之降混不同或與由左與右之總和組成之降混不同的降混時,則視情況而定,殘餘增益可仍然與左與右的非相位補償之相加相關。
因此,圖3說明計算側邊增益及殘餘增益並實際計算側邊信號之方式,而在大致反映等式9及等式10的圖2之實施例中,在不明確計算側邊信號且不執行具有不同測試側邊增益之殘餘信號計算的情況下計算側邊增益及殘餘增益。因此,變得顯然地,兩個實施例導致自一預測將一殘餘信號參數化之一側邊增益及一殘餘增益,且除了圖2及圖3中說明之程序之外,或藉由對應的等式5至10,計算側邊增益及殘餘增益之其他程序亦係可能的。
此外,此處應注意,給出之所有等式始終為針對由對應的等式判定之值的較佳實施例。然而,已發現,在較佳地+-20%之範圍中與如由對應的等式判定之值不同的值亦有用,且已提供較之先前技術之優點,但當與如由該等等式判定之值的偏差變得較小時,優點變得更大。因此,在其他實施例中,較佳地,使用僅與如由對應的等式判定之值相差+-10%之值,且在一最佳實施例中,如由該等等式判定之值為用於若干資料項之計算的值。
圖6說明用於解碼一經編碼多通道信號200之一設備。用於解碼之該設備包含一輸入介面204、連接至該輸入介面204之一殘餘信號合成器208及一方面連接至該輸入介面204且另一方面連接至該殘餘合成器208之一升混器212。在一較佳實施例中,該解碼器另外包含一頻譜-時間轉換器260,以便最後輸出時域第一及第二通道,如在217及218處所說明。
詳言之,該輸入介面204經組配用於接收經編碼多通道信號200,及用於自該經編碼多通道信號200獲得降混信號207、側邊增益g 206及殘餘增益r 205。殘餘信號合成器208使用殘餘增益205合成一殘餘信號,且升混器212經組配以用於使用該側邊增益206及如由該殘餘信號合成器208判定之殘餘信號209升混該降混信號207以獲得一重建構之第一通道213及一重建構之第二通道214。在殘餘信號合成器208及升混器212在頻譜域中操作或至少升混器212在頻譜域中操作之實施例中,重建構之第一通道213及重建構之第二通道214係按頻譜域表示給出,且針對各通道之頻譜域表示可由頻譜-時間轉換器216轉換至時域中以最後輸出時域第一及第二重建構之通道。
詳言之,升混器212經組配以使用圖7中所說明之第一加權器70來執行第一加權運算以獲得第一加權之降混通道。此外,該升混器再次一方面使用側邊增益206且另一方面使用降混信號207,使用第二加權器執行第二加權運算,以獲得第二加權的降混信號。較佳地,由區塊70執行之第一加權運算與由區塊71執行之第二加權運算不同,使得第一加權之降混76與第二加權之降混77不同。此外,升混器212經組配以使用由第一加權之降混信號76與殘餘信號209之第一組合器72執行的組合計算重建構之第一通道。此外,升混器另外包含一第二組合器73,其用於執行第二加權之降混信號77與殘餘信號209之第二組合。
較佳地,由第一組合器72及第二組合器73執行之組合規則彼此不同,使得歸因於在區塊72、73中之不同組合規則且歸因於由區塊70及區塊71執行之不同加權規則,一方面區塊72與另一方面區塊73之輸出大體上彼此不同。
較佳地,歸因於以下事實,第一與第二組合規則彼此不同:一個組合規則為加法運算,且另一運算規則為減法運算。然而,亦可使用第一與第二組合規則之其他對。
此外,在區塊70與區塊71中使用之加權規則彼此不同,此係由於一個加權規則使用具有由預定數目與側邊增益之間的差判定之加權因子之加權,且另一加權規則使用由預定數目與側邊增益之間的總和判定之加權因子。預定數目可在兩個加權器中彼此相等,或可彼此不同,且預定數目可不同於零,且可為整數或非整數數目且較佳地等於1。
圖8說明殘餘信號合成器208之一較佳實施。殘餘信號合成器208包含一種原始殘餘信號選擇器,或通常,一去相關信號計算器80。此外,由區塊80輸出之信號經輸入至加權器82內,該加權器接收由圖6之輸入介面204輸出之殘餘增益(用參考數字205指示)作為輸入。此外,殘餘信號合成器較佳地包含一正規化器84,其接收當前訊框85之中間信號作為一輸入,且接收由區塊80輸出之信號(亦即,原始信號或去相關信號86)作為再一輸入。基於彼等兩個信號,計算正規化因子87,其中該正規化因子87較佳地由加權器82與殘餘增益r
一起用以最後獲得合成之殘餘信號209。
在一較佳實施例中,原始殘餘信號選擇器80經組配用於選擇一先前訊框(諸如,緊接在前之訊框或一甚至更早訊框)之一降混信號。然而,且取決於實施,原始殘餘信號選擇器80經組配以用於選擇如針對先前訊框計算之左或右信號或第一或第二通道信號,或原始殘餘信號選擇器80亦可基於(例如)針對緊接在前之訊框或一甚至更早先前訊框判定的左與右信號之組合(諸如,總和、差等)判定殘餘信號。在其他實施例中,去相關信號計算器80亦可經組配以實際上產生去相關信號。然而,優選地,原始殘餘信號選擇器80不藉由具體去相關器(諸如,諸如混響濾波器之去相關濾波器)操作,但為了低複雜性原因,僅自過去選擇一已存在之信號,諸如,中間信號、重建構之左信號、重建構之右信號或藉由諸如加權組合(亦即,(加權)加法、(加權)減法或使得不依賴於一具體混響或一解相關濾波器)之簡單運算自更早重建構之左及右信號導出的信號。
通常,加權器82經組配以計算殘餘信號,使得殘餘信號之能量等於由殘餘增益r
指示之信號能量,其中此能量可按絕對術語來指示,但較佳地,按關於當前訊框之中間信號207的相對術語來指示。
在用於編碼器側及解碼器側之較佳實施例中,側邊增益及(若適當地)自殘餘增益之值不同於零。
隨後,按等式形式給出針對解碼器之額外較佳實施例。
再次在頻域中進行升混。為此目的,將自編碼器之時間-頻率變換應用至產生時間-頻率向量M
˜ t,b
之經解碼降混。使用經去量化之值IP˜D t,b
、及,將左及右通道計算為=(17) 及=(18) 對於k
∈Ib
,其中為對來自編碼器之錯失殘餘的取代,且gnorm
為能量調整因子(19) 其將相對增益係數轉變為絕對增益係數。吾人可例如取=, (20) 其中db
>
0表示逐頻帶訊框延遲。再次將相位旋轉因子β
˜計算為β
˜ =) (21)
接著藉由將反向DFT應用於L
˜ t
及R
˜ t
,跟著為合成窗及重疊相加,來產生左通道及右通道。
圖9說明輸入介面204之再一實施例。此實施例反映去量化操作,如先前關於圖5A及圖5B針對編碼器側所論述。特定言之,輸入介面204包含一提取器90,其自經編碼多通道信號提取聯合代碼。將此接合代碼91轉遞至聯合碼簿92,該聯合碼簿經組配以針對各代碼輸出一正負號資訊、一群組資訊或一點資訊,或針對各代碼輸出最終去量化之值g及最終去量化之值r,亦即,去量化之側邊及殘餘增益。
圖10a說明時域第一及第二通道或左及右通道l (t )
及r (t )
之示意性表示。
在於頻譜域中計算側邊增益及殘餘增益之實施例中,將左及右通道或第一及第二通道分成較佳地重疊訊框F(1)、F(2)、F(3)及F(4)等等。在圖10a中說明之實施例中,訊框重疊50%,但其他重疊亦可用。此外,僅展示兩訊框重疊,亦即,始終只有兩個後續訊框彼此重疊。然而,亦可使用多重疊訊框,諸如,三個、四個或五個重疊訊框。接著,進展值(亦即,接下來的訊框與當前訊框有多不同)並非如在圖10a中說明之實施例中為50%,而是卻更小,諸如,10%、20%或30%等等。
圖10b說明諸如圖2中所說明之區塊21或區塊22的時間-頻譜轉換器之較佳實施。此時間-頻率轉換器接收訊框l (t )
或r (t )
之序列作為輸入。分析開窗器1300接著輸出一連串經開窗之訊框,該等訊框皆已經藉由較佳地同一分析窗開窗。分析窗可為正弦窗或任何其他窗,且針對第一通道計算單獨的序列,及針對第二通道計算再一單獨的序列。
接著,將經開窗之訊框之序列輸入至變換區塊1302內。較佳地,變換區塊1302執行變換演算法,從而導致諸如DFT及(具體言之)FFT之複頻譜值。然而,在其他實施例中,並且,亦可使用諸如DCT或MDCT(修改之離散餘弦變換)之純真實變換演算法,且隨後,可自純實數部分估計虛數部分,如此項技術中已知,且如(例如)在USAC(統一語音及音訊寫碼)標準中所實施。其他變換算法可為導致複值子頻帶信號之子頻帶濾波器組(諸如,QMF濾波器組)。通常,子頻帶信號濾波器頻帶具有比FFT算法低的頻率解析度,且可藉由集合某些頻段將具有某一數目個DFT頻段之FFT或DFT頻譜變換成逐個子頻帶表示。此說明於圖10c中。
特定言之,圖10c說明針對具體訊框t
的第一通道Lk
或第二通道Rk
之頻域表示之複頻譜。按量值/相位表示或按實部/虛部表示來給出頻譜值。通常,DFT導致具有相同頻率解析度或頻寬之頻率區間。然而,較佳地,逐個子頻帶計算側邊及殘餘增益,以便減少用於傳輸殘餘及側邊增益的位元之數目。較佳地,使用自較低頻率增大至較高頻率之子頻帶產生子頻帶表示。因此,在一實例中,子頻帶1可具有第一數目個頻率區間(諸如,兩個頻段),且第二較高子頻帶(諸如,子頻帶2、子頻帶3或任一其他子頻帶)可具有較高數目個頻率區間(諸如,如由子頻帶3說明之八個頻率區間)。因此,可較佳地將個別子頻帶之頻寬調整至人耳之特性,如關於Bark尺度之此項技術中已知。
因此,圖10c說明由在先前揭示之等式中之參數k
指示的不同頻率區間,且圖10c中所說明之個別子頻帶由子頻帶索引b
指示。
圖10d說明頻譜至時間轉換器之一實施,如(例如)由圖6中之區塊216實施。頻譜-時間轉換器需要一反向變換器1310、一隨後連接之合成開窗器1312及一隨後連接之重疊/加法器1314以最後獲得時域通道。因此,在至1310內之輸入處的為圖6中所說明的重建構之頻譜域通道213、214,且在重疊/加法器1340之輸出處,存在時域重建構之第一通道217及第二通道218。
反向變換器1310經組配以執行導致反向變換之演算法,及較佳地與在圖10b之區塊1302中在編碼器側上應用之演算法反向的演算法。此外,合成窗1312經組配以應用與對應的分析窗匹配之一合成窗,且較佳地,使用同樣的分析及合成窗,但該情況並非必要。重疊加法器1314經組配以執行如圖10a中所說明之重疊。因此,舉例而言,重疊/加法器1314選取對應於圖10a之F(3)的合成開窗之訊框,且另外選取圖10a之合成開窗之訊框F(4),且接著按逐個樣本方式將F(3)之第二半的對應樣本與F(4)之第一半的對應樣本相加以最後獲得實際時域輸出通道之樣本。
隨後,簡短給出本發明之不同具體態樣。 · 具有根據等式(4)之IPD補償及絕對相位補償的立體聲M/S。 · 具有根據(10)之IPD補償及S乘M之預測的立體聲M/S · 具有根據(9)之IPD補償、S乘M之預測及根據增益因子(10)之殘餘預測的立體聲M/S · 經由聯合量化之側邊及殘餘增益因子之高效量化 · 在(g, r)平面中的對應於Lt
與Rt
之固定能量比之線上之側邊及殘餘增益的聯合量化。
應注意,較佳地,所有以上提及之五個不同態樣皆在同一個編碼器/解碼器框架中實施。然而,另外應注意,亦可彼此分開來實施先前給出之個別態樣。因此,可在任一降混器中執行具有IPD補償及絕對相位補償之第一態樣,而與任何側邊增益/殘餘增益計算無關。此外,舉例而言,側邊增益計算及殘餘增益計算之態樣可藉由任一降混執行,亦即,亦藉由並非藉由某一相位補償計算之降混。
此外,甚至一方面側邊增益與另一方面殘餘增益之計算可彼此獨立地執行,其中側邊增益單獨或與不同於殘餘增益之任一其他參數一起之計算亦比此項技術(特定言之,關於ICC或ILD計算)有利,且甚至殘餘增益單獨或與不同於側邊增益之任一其他參數一起之計算亦已有用。
此外,側邊及殘餘增益或增益因子之高效聯合或條件量化在任一特定降混情況下有用。因此,亦可無任何降混地使用高效量化。且,此高效量化亦可應用於任何其他參數,其中第二參數關於其值範圍取決於第一參數,使得可針對此等相關參數執行非常高效且低複雜之量化,當然,此等相關參數亦可為不同於側邊增益及殘餘增益之參數。
因此,所有以上提到之五個態樣可彼此獨立地或一起在某一編碼器/解碼器實施中執行及實施,且同樣,僅該等態樣之一子群組可實施在一起,亦即,視具體情況,三個態樣實施在一起,而無其他兩個態樣,或五個態樣中僅兩個態樣實施在一起,而無其他三個態樣。
儘管已在設備之上下文中描述一些態樣,但顯然,此等態樣亦表示對應方法之描述,其中區塊或裝置對應於方法步驟或方法步驟之特徵。類似地,在方法步驟之上下文中所描述之態樣亦表示對應區塊或項目或對應設備之特徵的描述。
取決於某些實施要求,本發明之實施例可在硬體中或在軟體中實施。可使用數位儲存媒體來執行該實施,該媒體例如軟性磁碟、DVD、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體,該媒體上儲存有電子可讀控制信號,該等電子可讀控制信號與可規劃電腦系統合作(或能夠合作)以使得執行各別方法。
根據本發明之一些實施例包含具有電子可讀控制信號之資料載體,該等控制信號能夠與可規劃電腦系統合作,使得執行本文中所描述之方法中的一者。
通常,本發明之實施例可實施為具有程式碼之電腦程式產品,當電腦程式產品在電腦上運行時,程式碼操作性地用於執行該等方法中之一者。程式碼可(例如)儲存於機器可讀載體上。
其他實施例包含用於執行本文中描述的方法中之一者之電腦程式,其儲存於機器可讀載體或非暫時性儲存媒體上。
換言之,因此,本發明之方法之一實施例為具有用於當電腦程式在電腦上運行時執行本文中所描述之方法中之一者的程式碼之電腦程式。
因此,本發明之方法之再一實施例為資料載體(或數位儲存媒體,或電腦可讀媒體),該資料載體包含記錄於其上的用於執行本文中所描述之方法中之一者的電腦程式。
因此,本發明之方法之再一實施例為表示用於執行本文中所描述之方法中之一者的電腦程式之一資料流或一信號序列。資料流或信號序列可(例如)經組配以經由資料通訊連接(例如,經由網際網路)而傳送。
再一實施例包括經組配或經調適以執行本文中所描述之方法中的一者之處理構件,例如,電腦或可規劃邏輯裝置。
再一實施例包含其上安裝有用於執行本文中所描述之方法中之一者的電腦程式之電腦。
在一些實施例中,可規劃邏輯裝置(例如,場可規劃閘陣列)可用以執行本文中所描述之方法的功能性中之一些或全部。在一些實施例中,場可規劃閘陣列可與微處理器合作,以便執行本文中所描述之方法中的一者。通常,該等方法較佳地由任一硬體設備執行。
上述實施例僅說明本發明之原理。應理解,本文中所描述之配置及細節的修改及變化將對熟習此項技術者顯而易見。因此,意圖為僅受到接下來之專利申請專利範圍之範疇限制,而不受到藉由本文中之實施例之描述解釋所提出的具體細節限制。 參考文獻 MPEG-4 High Efficiency Advanced Audio Coding (HE-AAC) v2FROM JOINT STEREO TO SPATIAL AUDIO CODING - RECENT PROGRESS AND STANDARDIZATION
, Proc. of the 7th Int. Conference on digital Audio Effects (DAFX-04), Naples, Italy, October 5-8, 2004.
21‧‧‧第一時間-頻譜轉換器/區塊
22‧‧‧第二時間-頻譜轉換器/區塊
23、24、25‧‧‧計算器/區塊
26‧‧‧側邊增益計算器
27、63‧‧‧殘餘增益計算器
28‧‧‧連接線
30‧‧‧通道間相位差(IPD)計算器/區塊
32‧‧‧絕對相位旋轉計算器/區塊
34‧‧‧降混計算器/區塊
36‧‧‧能量差或側邊增益計算器/區塊
50‧‧‧逐個子頻帶ILD計算器
52‧‧‧群組匹配器
54‧‧‧點匹配器
56‧‧‧代碼生成器
57a‧‧‧正負號位元
57b、57c‧‧‧位元
60‧‧‧側邊信號計算器
61‧‧‧殘餘信號計算器
62‧‧‧側邊增益選擇器
70‧‧‧第一加權器/區塊/第一加權運算
71‧‧‧區塊/第二加權運算
72‧‧‧第一組合器/區塊/第一組合規則
73‧‧‧第二組合器/區塊/第二組合規則
76‧‧‧第一加權之降混信號
77‧‧‧第二加權之降混信號
80‧‧‧去相關信號計算器/區塊/原始殘餘信號選擇器
82‧‧‧加權器
84‧‧‧正規化器
85‧‧‧當前訊框
86‧‧‧原始信號或去相關信號
87‧‧‧正規化因子
90‧‧‧提取器
91‧‧‧聯合代碼
92‧‧‧聯合碼簿
100‧‧‧多通道信號
101‧‧‧第一通道
102‧‧‧第二通道
103‧‧‧第三通道
120‧‧‧降混器
122、207‧‧‧降混信號
140‧‧‧參數計算器/區塊
141、206‧‧‧側邊增益
142、205‧‧‧殘餘增益
143‧‧‧可選通道間相位差(IPD)
160‧‧‧輸出介面
162、200‧‧‧經編碼多通道信號
204‧‧‧輸入介面
208‧‧‧殘餘信號合成器
209‧‧‧殘餘信號
212‧‧‧升混器
213‧‧‧重建構之第一通道
214‧‧‧重建構之第二通道
216‧‧‧頻譜-時間轉換器/區塊
217‧‧‧時域重建構之第一通道
218‧‧‧時域重建構之第二通道
1300‧‧‧分析開窗器
1302‧‧‧變換區塊
1310‧‧‧反向變換器
1312‧‧‧合成開窗器
1314‧‧‧重疊/加法器
g‧‧‧側邊增益/參數值
r‧‧‧殘餘增益/參數值
ILD‧‧‧通道間位準差
IPD‧‧‧通道間相位差
ß‧‧‧絕對相位旋轉參數
gnorm ‧‧‧能量調整因子
l(t)‧‧‧左通道/訊框
r(t)‧‧‧右通道/訊框
F(1)、F(2)、F(3)、F(4)‧‧‧訊框
隨後在隨附圖式中論述本發明之較佳實施例,其中: 圖1為一實施例的用於編碼一多通道信號之一設備之方塊圖; 圖2為參數計算器之一實施例之方塊圖; 圖3為參數計算器之再一實施例; 圖4為執行絕對相位補償的降混器之一實施例; 圖5a為執行具體量化的輸出介面之一實施例之方塊圖; 圖5b指示一示範性碼字; 圖6為用於解碼一經編碼多通道信號的一設備之一實施例; 圖7為升混器之一實施例; 圖8為殘餘信號合成器之一實施例; 圖9為用於輸入介面之一實施例; 圖10a說明重疊訊框之處理; 圖10b說明時間-頻譜轉換器之一實施例; 圖10c說明左通道或右通道之一頻譜及不同子頻帶之一構造; 圖10d說明頻譜-時間轉換器之一實施例; 圖11說明在第一實施例中的用於條件量化之線; 圖12說明根據再一實施例的用於聯合量化之線;及 圖13說明用於側邊增益及殘餘增益之聯合量化點。
Claims (43)
- 一種用於編碼包含至少兩個通道之一多通道信號之設備,其包含:一降混器,其用於自該多通道信號計算一降混信號;一參數計算器,其用於自該等至少兩個通道中之一第一通道及該等至少兩個通道中之一第二通道計算一側邊增益,且用於自該第一通道及該第二通道計算一殘餘增益;以及一輸出介面,其用於產生一輸出信號,該輸出信號包含關於該降混信號以及關於該側邊增益及該殘餘增益之資訊。
- 如請求項1之設備,其中該參數計算器經組配以:產生該第一通道及該第二通道之一逐個子頻帶表示,計算一子頻帶中的該第一通道之一第一振幅相關特性,及計算該子頻帶中的該第二通道之一第二振幅相關特性,計算該子頻帶中的該第一通道與該第二通道之一內積;使用涉及該第一振幅相關特性、該第二振幅相關特性及該內積之一第一關係計算該子頻帶中之該側邊增益;以及使用涉及該第一振幅相關特性、該第二振幅相關特性及該內積之一第二關係計算該子頻帶中之該殘餘增益,該第二關係與該第一關係不同,其中該振幅相關特性係自振幅、自功率、自能量或自具有大於1之一指數的任何振幅冪判定。
- 如請求項1之設備,其中該參數計算器經組配以針對該第一通道及該第二通道之多個子頻帶中之各子頻帶計算該側邊增益及該殘餘增益。
- 如請求項1之設備,其中該參數計算器經組配以將該側邊增益作為可適用於該第一通道及該第二通道之一中間信號的一側邊預測增益計算,以預測該第一通道及該第二通道之一側邊信號,或其中該參數計算器經組配以將該殘餘增益作為一殘餘預測增益計算,該殘餘預測增益指示使用該側邊增益藉由該中間信號對該側邊信號之一預測的一殘餘信號之一振幅相關特性。
- 如請求項1之設備,其中該參數計算器經組配以使用具有一分子及一分母之一分數計算該側邊增益,該分子涉及該第一通道之一振幅相關特性及該第二通道之一振幅相關特性,且該分母涉及該第一通道之該振幅相關特性及該第二通道之該振幅相關特性以及該內積,或其中該參數計算器經組配以使用具有一分子及一分母之一分數計算該殘餘增益,該分子涉及該內積,且該分母涉及該內積。
- 如請求項5之設備,其中該參數計算器經組配以計算該側邊增益,其中該分子包含該第一通道之該第一振幅相關特性與該第二通道之一第二振幅相關特性的一差,且其中該分母包含該第一通道之該第一振幅相關特性與該第二通道之該第二振幅相關特性及自該內積導出之一值的一總和,或其中該參數計算器經組配以使用具有該分子及該分母之該分數計算該殘餘增益,其中該分子包含該第一通道之該第一振幅相關特性與該第二通道之該第二振幅相關特性的一加權和與該內積之間的一差,且其中該分母包含該第一通道之該第一振幅相關特性、該第二通道之該振幅相關特性與自該內積導出之一值的該總和。
- 如請求項1之設備,其中該參數計算器經組配以針對一子頻帶計算該側邊增益,及使用用於該子頻帶之該側邊增益計算用於該子頻帶之該殘餘增益。
- 如請求項1之設備,其中該參數計算器經組配以計算該側邊增益,使得用於該側邊增益之值在基於以下等式而判定的值之±20%之一範圍中:其中該參數計算器經組配以計算該殘餘增益,使得用於該殘餘增益之值在基於以下等式而判定的值之±20%之一範圍中:其中t為一訊框索引,其中b為一子頻帶索引,其中E l 為該訊框及該子頻帶中的該左通道之一能量,其中E R 為該訊框t及該子頻帶b中的該第二通道之一能量,且其中X為該訊框t及該子頻帶b中的該第一通道與該第二通道之間的該內積之一絕對值。
- 如請求項1之設備,其中該參數計算器經組配以將該第一通道及該第二通道之一逐個子頻帶表示作為一複值頻譜序列計算,其中各頻譜與該第一通道或該第二通道之一時間框有關,其中該序列之該等時間框在該頻譜序列中鄰近且彼此重疊,或其中該參數計算器經組配以藉由將一子頻帶中的複頻譜值之量值求平方且藉由將該子頻帶中之平方量值求和來計算該第一振幅相關量度及該第二振幅相關量度,或其中該參數計算器經組配以藉由在該子頻帶中將乘積求和及藉由形成該總和之一結果之一量值來計算一內積,其中各乘積涉及在該第一通道之一頻率區間中的一頻譜值及針對該頻率區間的該第二通道之一共軛複數頻譜值。
- 如請求項1之設備,其中該降混器經組配以使用一絕對相位補償計算該降混,使得在計算該降混信號時,僅旋轉具有一較低能量之一通道,或將該通道旋轉得比具有一較大能量之一通道強。
- 如請求項10之設備,其中該降混器經組配以計算一通道間相位差,且其中該降混器經組配以計算一相位旋轉參數,且其中該降混器經組配以在計算該降混信號時使用該通道間相位差及該相位旋轉參數對該第一通道及該第二通道進行加權。
- 如請求項11之設備,其中該降混器經組配以基於由該參數計算器判定之該側邊增益計算該相位旋轉參數。
- 如請求項11之設備,其中該降混器經組配以針對一訊框之各子頻帶計算該通道間相位差,且其中該降混器經組配以針對該訊框之各子頻帶計算該相位旋轉參數。
- 如請求項10之設備,其中該降混器經組配以計算該相位旋轉參數,使得該相位旋轉參數在由以下等式判定的值之±20%內:其中atan2為atan2函數,其中ß為該相位旋轉參數,其中IPD為該通道間相位差,其中t為一訊框索引,b為一子頻帶索引,且g t,b 為用於該訊框t及該子頻帶b之該側邊增益,且其中A為0.1與100之間或-0.1與-100之間的一值。
- 如請求項10之設備,其中該降混器經組配以計算該降混,使得該降混信號具有在由以下等式判定的值之±20%內之值:其中M t,k 為用於該訊框t及該頻帶區間k之一降混信號,其中L t,k 為用於該訊框t及該頻帶區間k之該第一通道,其中R t,k 為用於該訊框t及該頻帶區間k之該第二通道,其中IPD t,b 為用於該訊框t及包含該頻帶區間k之該子頻帶b之一通道間相位差,且其中ß為該相位旋轉參數。
- 如請求項1之設備,其中該輸出介面包含一波形編碼器,該波形編碼器經組配以用波形表示一經編碼降混信號以獲得關於該降混信號之該資訊。
- 如請求項1之設備,其中該參數計算器經組配以計算該側邊增益及該殘餘增益,使得該殘餘增益取決於該側邊增益,且其中該輸出介面經組配以量化該側邊增益及接著量化該殘餘增益,其中用於該殘餘增益之一量化步長取決於該側邊增益之該值。
- 如請求項1之設備,其中該參數計算器經組配以計算該側邊增益及該殘餘增益,使得該殘餘增益取決於該側邊增益,且其中該輸出介面經組配以使用量化點之群組執行一聯合量化,各量化點群組由該第一通道與該第二通道之間的固定振幅相關比率定義。
- 如請求項18之設備,其中該參數計算器經組配以計算該側邊增益,使得該側邊增益具有在-1與+1之間的一值範圍,且其中該輸出介面經組配以使用具有一正負號位元且具有僅為正或僅為負之側邊增益值的一代碼。
- 如請求項18之設備,其中該輸出介面經組配以:計算該第一通道與該第二通道之間的一通道間位準差,識別與該通道間位準差匹配的該量化點群組,以及僅在該識別之群組內搜尋;以及組合一正負號位元、該群組之一識別與該識別之群組內的該點之一識別以獲得表示該經量化側邊增益及該經量化殘餘增益之一碼字。
- 如請求項18之設備,其中由該輸出介面使用之碼簿包含具有大量條目之一碼表,各條目由二進位碼字識別,各二進位碼字具有一正負號位元,一第一位元群組識別該量化點群組,且一第二位元群組識別該量化點群組內之一量化點。
- 如請求項18之設備,其中由該輸出介面使用之一碼簿包含16個量化點群組,每群組8個量化點,且其中該碼簿之一碼字為一8位元碼字,該8位元碼字具有一單一正負號位元以及識別該等16個群組當中之一群組的一4位元群組及識別一識別之量化點群組內之一量化點的一3位元群組。
- 如請求項1之設備,其中該參數計算器經組配以:自該第一通道及該第二通道計算一側邊信號;自該側邊信號與藉由多個不同測試側邊增益加權之該降混信號之間的差判定多個殘餘增益;選擇該等多個不同測試側邊增益中之一具體測試側邊增益作為該側邊增益,對於該側邊增益,該殘餘信號滿足一預定義條件;以及自藉由該具體測試側邊增益判定之一具體殘餘信號計算該殘餘增益。
- 如請求項23之設備,其中該殘餘增益係自該具體殘餘信號之一能量及該降混信號之一能量或該第一通道與該第二通道的一總和之一能量判定。
- 一種用於解碼一經編碼多通道信號之設備,其包含:一輸入介面,其用於接收該經編碼多通道信號,及用於自該經編碼多通道信號獲得一降混信號、一側邊增益及一殘餘增益;一殘餘信號合成器,其用於使用該殘餘增益合成一殘餘信號;以及一升混器,其用於使用該側邊增益及該殘餘信號升混該降混信號以獲得一重建構之第一通道及一重建構之第二通道。
- 如請求項25之設備,其中該升混器經組配以使用該側邊增益執行該降混信號之一第一加權運算以獲得一第一加權之降混信號,其中該升混器經組配以使用該側邊增益及該降混信號執行一第二加權運算以獲得一第二加權之降混信號,其中該第一加權運算與該第二加權運算不同,使得該第一加權之降混信號與該第二加權之降混信號不同,且其中該升混器經組配以使用該第一加權之降混信號與該殘餘信號之一組合及使用該第二加權之降混信號與該殘餘信號之一第二組合計算該重建構之第一通道。
- 如請求項26之設備,其中該升混器經組配以在計算該重建構之第一通道時組合該加權之降混信號與該殘餘信號,且其中該升混器經組配以在計算該重建構之第二通道時使用一第二組合規則組合該第二加權之降混信號與該殘餘信號,其中該第一組合規則與該第二組合規則彼此不同。
- 如請求項27之設備,其中該第一組合規則及該第二組合規則中之一者為一加法運算,且該第一組合規則及該第二組合規則中之另一者為一減法運算。
- 如請求項26之設備,其中該升混器經組配以執行包含自該側邊增益與第一預定數目之一總和導出的一加權因子之該第一加權運算,且其中該升混器經組配以執行包含自一第二預定數目與該側邊增益之間的一差導出的一加權因子之該第二加權運算,其中該第一預定數目與該第二預定數目彼此相等或彼此不同。
- 如請求項25之設備,其中該殘餘信號合成器經組配以使用用於一當前訊框之該殘餘增益對一先前訊框之一降混信號進行加權,以獲得用於該當前訊框之該殘餘信號,或使用用於該當前訊框之該殘餘增益對自該當前訊框或自一或多個先前訊框導出之一去相關信號進行加權,以獲得用於該當前訊框之該殘餘信號。
- 如請求項25之設備,其中該殘餘信號計算器經組配以計算該殘餘信號,使得該殘餘信號之一能量等於由該殘餘增益指示之一信號能量。
- 如請求項25之設備,其中該殘餘信號計算器經組配以計算該殘餘信號,使得該殘餘信號之值在基於以下等式判定的值之±20%之一範圍中:其中R t,k 為用於訊框t及頻率區間k之該殘餘信號,其中為用於該訊框t及包含該頻率區間k之子頻帶b之該殘餘增益,且其中為一殘餘信號,且其中g norm 為可存在或不存在之一能量調整因子。
- 如請求項25之設備,其中g norm 為具有在由以下等式判定的值之±20%之範圍中之值的一能量正規化因子:其中為用於該訊框t及該子頻帶b的該降混信號之能量,且其中為用於該子頻帶b及該訊框t的該殘餘信號之該能量,或其中用於該殘餘信號之一原始信號係基於以下等式判定:其中為用於該殘餘信號之該原始信號,其中為用於訊框t-t b 及該頻率區間k之該降混信號,其中d b 為大於0之一訊框延遲,或其中該升混器經組配以計算該重建構之第一通道及該重建構之第二通道,使得該重建構之第一通道及該重建構之第二通道具有在關於如由以下等式判定之值之±20%之該範圍中的值:其中為用於該訊框t及該頻率區間k之該降混信號,其中為用於該訊框t及該子頻帶b之該側邊增益,其中為用於該訊框t及該子頻帶b之該殘餘增益,其中gnorm為可存在或不存在之一能量調整因子,且其中為用於該訊框t及該頻率區間k之一原始殘餘信號。
- 如請求項25之設備,其中該輸入介面經組配以自該經編碼多通道信號獲得通道間相位差值,且其中該殘餘信號合成器或該升混器經組配以當計算該殘餘信號或該重建構之第一通道及該重建構之第二通道時應用該通道間相位差值。
- 如請求項34之設備,其中該升混器經組配以自一IPD通道間相位差值計算一相位旋轉因子,以及當以一第一方式計算該重建構之第一通道時,應用該相位旋轉因子,及當以一第二方式計算該重建構之第二通道時,應用該通道間相位差值及/或該相位旋轉因子,其中該第一方式與該第二方式不同。
- 如請求項35之設備,其中該升混器經組配以計算相位旋轉參數,使得該相位旋轉參數在由以下等式判定的值之±20%內:其中atan2為atan2函數,其中ß為該相位旋轉參數,其中IPD為該通道間相位差,其中t為一訊框索引,b為一子頻帶索引,且g t,b 為用於該訊框t及該子頻帶b之該側邊增益,且其中A為0.1與100之間或-0.1與-100之間的一值。
- 如請求項25之設備,其中該輸入介面經組配以提取碼字,其中一碼字聯合地包含一經量化側邊增益及一經量化殘餘增益,且其中該輸入介面經組配以用於使用一預定義碼簿去量化該聯合碼字以獲得由該殘餘信號合成器及該升混器使用之該側邊增益及該殘餘增益。
- 如請求項37之設備其中由該輸入介面使用之一碼簿包含16個量化點群組,每群組8個量化點,且其中該碼簿之一碼字為一8位元碼字,該8位元碼字具有一單一正負號位元以及識別該等16個群組當中之一群組的一4位元群組及識別一識別之量化點群組內之一量化點的一3位元群組。
- 如請求項25之設備,其中該升混器經組配以在一頻譜域中計算該重建構之第一通道及該重建構之第二通道,其中該設備進一步包含用於將該重建構之第一通道及該重建構之第二通道轉換至一時域中的一頻譜-時間轉換器。
- 如請求項31之設備,其中該頻譜-時間轉換器經組配以針對該第一重建構之通道及該第二重建構之通道中之每一者將後續訊框轉換成訊框之一時間序列使用一合成窗對每一時間框進行加權;以及重疊及添加後續經開窗之時間框以獲得該第一重建構之通道的一時間區塊及該第二重建構之通道的該時間區塊。
- 一種編碼包含至少兩個通道之一多通道信號之方法,其包含:自該多通道信號計算一降混信號;自該等至少兩個通道中之一第一通道及該等至少兩個通道中之一第二通道計算一側邊增益,及自該第一通道及該第二通道計算一殘餘增益;以及產生一輸出信號,該輸出信號包含關於該降混信號以及關於該側邊增益及該殘餘增益之資訊。
- 一種解碼一經編碼多通道信號之方法,其包含:接收該經編碼多通道信號,及自該經編碼多通道信號獲得一降混信號、一側邊增益及一殘餘增益;使用該殘餘增益合成一殘餘信號;以及使用該側邊增益及該殘餘信號升混該降混信號,以獲得一重建構之第一通道及一重建構之第二通道。
- 一種電腦程式,其用於當在電腦或一處理器上運行時執行如請求項41之方法或如請求項42之方法。
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| ??16197816.8 | 2016-11-08 | ||
| EP16197816 | 2016-11-08 | ||
| PCT/EP2017/077822 WO2018086947A1 (en) | 2016-11-08 | 2017-10-30 | Apparatus and method for encoding or decoding a multichannel signal using a side gain and a residual gain |
| ??PCT/EP2017/077822 | 2017-10-30 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201820310A TW201820310A (zh) | 2018-06-01 |
| TWI669705B true TWI669705B (zh) | 2019-08-21 |
Family
ID=60190886
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW106138473A TWI664625B (zh) | 2016-11-08 | 2017-11-07 | 用以升混或降混多通道信號之設備及方法與相關電腦程式產品 |
| TW106138472A TWI669705B (zh) | 2016-11-08 | 2017-11-07 | 用以使用側邊增益及殘餘增益編碼或解碼多通道信號之設備及方法 |
Family Applications Before (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW106138473A TWI664625B (zh) | 2016-11-08 | 2017-11-07 | 用以升混或降混多通道信號之設備及方法與相關電腦程式產品 |
Country Status (18)
| Country | Link |
|---|---|
| US (4) | US11488609B2 (zh) |
| EP (4) | EP4167233A1 (zh) |
| JP (5) | JP7102427B2 (zh) |
| KR (2) | KR102291811B1 (zh) |
| CN (4) | CN116994592A (zh) |
| AR (2) | AR110146A1 (zh) |
| AU (3) | AU2017357454B2 (zh) |
| CA (3) | CA3127805C (zh) |
| ES (2) | ES2938244T3 (zh) |
| FI (1) | FI3539125T3 (zh) |
| MX (2) | MX387556B (zh) |
| MY (1) | MY196198A (zh) |
| PL (2) | PL3539126T3 (zh) |
| PT (2) | PT3539125T (zh) |
| RU (2) | RU2727799C1 (zh) |
| TW (2) | TWI664625B (zh) |
| WO (2) | WO2018086947A1 (zh) |
| ZA (2) | ZA201903534B (zh) |
Families Citing this family (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| AU2017357454B2 (en) * | 2016-11-08 | 2021-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation |
| CN110556116B (zh) * | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
| EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
| CN115132214A (zh) | 2018-06-29 | 2022-09-30 | 华为技术有限公司 | 立体声信号的编码、解码方法、编码装置和解码装置 |
| KR102847181B1 (ko) | 2019-03-06 | 2025-08-20 | 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 | 다운믹서 및 다운믹싱 방법 |
| WO2020185522A1 (en) * | 2019-03-14 | 2020-09-17 | Boomcloud 360, Inc. | Spatially aware multiband compression system with priority |
| US12142285B2 (en) | 2019-06-24 | 2024-11-12 | Qualcomm Incorporated | Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding |
| US12308034B2 (en) | 2019-06-24 | 2025-05-20 | Qualcomm Incorporated | Performing psychoacoustic audio coding based on operating conditions |
| US11361776B2 (en) * | 2019-06-24 | 2022-06-14 | Qualcomm Incorporated | Coding scaled spatial components |
| US11538489B2 (en) | 2019-06-24 | 2022-12-27 | Qualcomm Incorporated | Correlating scene-based audio data for psychoacoustic audio coding |
| US12100403B2 (en) * | 2020-03-09 | 2024-09-24 | Nippon Telegraph And Telephone Corporation | Sound signal downmixing method, sound signal coding method, sound signal downmixing apparatus, sound signal coding apparatus, program and recording medium |
| JP7380837B2 (ja) * | 2020-03-09 | 2023-11-15 | 日本電信電話株式会社 | 音信号符号化方法、音信号復号方法、音信号符号化装置、音信号復号装置、プログラム及び記録媒体 |
| WO2021181746A1 (ja) * | 2020-03-09 | 2021-09-16 | 日本電信電話株式会社 | 音信号ダウンミックス方法、音信号符号化方法、音信号ダウンミックス装置、音信号符号化装置、プログラム及び記録媒体 |
| CN115244618B (zh) * | 2020-03-09 | 2025-04-15 | 日本电信电话株式会社 | 声音信号编码方法、声音信号解码方法、声音信号编码装置、声音信号解码装置、程序产品以及记录介质 |
| US11575460B2 (en) * | 2020-05-21 | 2023-02-07 | Microsoft Technology Licensing, Llc | Adaptive radio configuration in wireless networks |
| WO2021252748A1 (en) | 2020-06-11 | 2021-12-16 | Dolby Laboratories Licensing Corporation | Encoding of multi-channel audio signals comprising downmixing of a primary and two or more scaled non-primary input channels |
| KR20230084251A (ko) | 2020-10-09 | 2023-06-12 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 파라미터 변환을 사용하여, 인코딩된 오디오 장면을 프로세싱하기 위한 장치, 방법, 또는 컴퓨터 프로그램 |
| MX2023003965A (es) | 2020-10-09 | 2023-05-25 | Fraunhofer Ges Forschung | Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una extension de ancho de banda. |
| CN116529813A (zh) * | 2020-10-09 | 2023-08-01 | 弗劳恩霍夫应用研究促进协会 | 使用参数转换来处理编码音频场景的装置、方法或计算机程序 |
| EP4226367A2 (en) | 2020-10-09 | 2023-08-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing |
| CN116962955A (zh) * | 2022-04-15 | 2023-10-27 | 华为技术有限公司 | 多通道的混音方法、设备及介质 |
| CN120917510A (zh) * | 2023-03-23 | 2025-11-07 | 杜比国际公司 | 复值滤波器组域中的联合立体声编码 |
| FR3157767A1 (fr) * | 2023-12-22 | 2025-06-27 | Orange | Traitement de réduction de canaux d’un signal audio stéréophonique par remise en phase optimisée |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060190247A1 (en) * | 2005-02-22 | 2006-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
| US20080195397A1 (en) * | 2005-03-30 | 2008-08-14 | Koninklijke Philips Electronics, N.V. | Scalable Multi-Channel Audio Coding |
Family Cites Families (52)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US6161089A (en) | 1997-03-14 | 2000-12-12 | Digital Voice Systems, Inc. | Multi-subframe quantization of spectral parameters |
| AR023424A1 (es) * | 1999-04-07 | 2002-09-04 | Dolby Lab Licensing Corp | Metodo para decodificacion, metodo para codificacion, aparato que comprende medios para llevar cabo ambos metodos y medio que soporta informacion formateada |
| US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
| KR100899825B1 (ko) * | 2000-03-28 | 2009-05-27 | 인터디지탈 테크날러지 코포레이션 | 송신 전에 사전 회전을 이용하는 코드 분할 다중 접속시스템 |
| WO2003090206A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Signal synthesizing |
| US7809579B2 (en) | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
| WO2005081229A1 (ja) * | 2004-02-25 | 2005-09-01 | Matsushita Electric Industrial Co., Ltd. | オーディオエンコーダ及びオーディオデコーダ |
| CA3026267C (en) * | 2004-03-01 | 2019-04-16 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
| CA2808226C (en) | 2004-03-01 | 2016-07-19 | Dolby Laboratories Licensing Corporation | Multichannel audio coding |
| SE0400998D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
| SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
| ES2297825T3 (es) * | 2005-04-19 | 2008-05-01 | Coding Technologies Ab | Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales. |
| US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
| TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
| BRPI0707969B1 (pt) * | 2006-02-21 | 2020-01-21 | Koninklijke Philips Electonics N V | codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador |
| US7536006B2 (en) | 2006-07-21 | 2009-05-19 | Motorola, Inc. | Method and system for near-end detection |
| CN101479786B (zh) * | 2006-09-29 | 2012-10-17 | Lg电子株式会社 | 用于编码和解码基于对象的音频信号的方法和装置 |
| KR101453732B1 (ko) * | 2007-04-16 | 2014-10-24 | 삼성전자주식회사 | 스테레오 신호 및 멀티 채널 신호 부호화 및 복호화 방법및 장치 |
| CN101067931B (zh) * | 2007-05-10 | 2011-04-20 | 芯晟(北京)科技有限公司 | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 |
| WO2009046909A1 (en) | 2007-10-09 | 2009-04-16 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating a binaural audio signal |
| US8060042B2 (en) * | 2008-05-23 | 2011-11-15 | Lg Electronics Inc. | Method and an apparatus for processing an audio signal |
| RU2497204C2 (ru) * | 2008-05-23 | 2013-10-27 | Конинклейке Филипс Электроникс Н.В. | Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер |
| EP2175670A1 (en) | 2008-10-07 | 2010-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Binaural rendering of a multi-channel audio signal |
| ES2733878T3 (es) * | 2008-12-15 | 2019-12-03 | Orange | Codificación mejorada de señales de audio digitales multicanales |
| ES2435792T3 (es) * | 2008-12-15 | 2013-12-23 | Orange | Codificación perfeccionada de señales digitales de audio multicanal |
| WO2010097748A1 (en) * | 2009-02-27 | 2010-09-02 | Koninklijke Philips Electronics N.V. | Parametric stereo encoding and decoding |
| AU2013206557B2 (en) * | 2009-03-17 | 2015-11-12 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
| WO2010105926A2 (en) * | 2009-03-17 | 2010-09-23 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
| JP5212407B2 (ja) | 2009-03-24 | 2013-06-19 | 株式会社豊田中央研究所 | 熱疲労試験装置 |
| ES2511390T3 (es) * | 2009-04-08 | 2014-10-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor de fase |
| JP4725691B2 (ja) | 2009-08-31 | 2011-07-13 | 凸版印刷株式会社 | コーティング量測定方法及び装置、コーティング量判定方法及び装置、並びにコーティング装置、コーティング製品の製造方法 |
| EP2323130A1 (en) * | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
| RU2425040C1 (ru) * | 2010-02-24 | 2011-07-27 | Новосибирский институт органической химии им. Н.Н. Ворожцова Сибирского отделения Российской академии наук (НИОХ СО РАН) | Способ получения 2,3-эпоксипинана из скипидара |
| CA3105050C (en) * | 2010-04-09 | 2021-08-31 | Dolby International Ab | Audio upmixer operable in prediction or non-prediction mode |
| EP2375409A1 (en) * | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
| PL3779979T3 (pl) * | 2010-04-13 | 2024-01-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Sposób dekodowania audio do przetwarzania sygnałów audio stereo z wykorzystaniem zmiennego kierunku predykcji |
| KR20110116079A (ko) * | 2010-04-17 | 2011-10-25 | 삼성전자주식회사 | 멀티 채널 신호의 부호화/복호화 장치 및 방법 |
| RU2573774C2 (ru) | 2010-08-25 | 2016-01-27 | Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. | Устройство для декодирования сигнала, содержащего переходные процессы, используя блок объединения и микшер |
| KR20120038311A (ko) * | 2010-10-13 | 2012-04-23 | 삼성전자주식회사 | 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법 |
| FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
| TWI488178B (zh) | 2011-03-18 | 2015-06-11 | Fraunhofer Ges Forschung | 表示音訊內容之位元串流之訊框中的訊框元件定位技術 |
| CN102446507B (zh) | 2011-09-27 | 2013-04-17 | 华为技术有限公司 | 一种下混信号生成、还原的方法和装置 |
| UA107771C2 (en) * | 2011-09-29 | 2015-02-10 | Dolby Int Ab | Prediction-based fm stereo radio noise reduction |
| EP2790419A1 (en) * | 2013-04-12 | 2014-10-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for center signal scaling and stereophonic enhancement based on a signal-to-downmix ratio |
| KR20140128564A (ko) | 2013-04-27 | 2014-11-06 | 인텔렉추얼디스커버리 주식회사 | 음상 정위를 위한 오디오 시스템 및 방법 |
| EP2838086A1 (en) * | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
| TWI579831B (zh) * | 2013-09-12 | 2017-04-21 | 杜比國際公司 | 用於參數量化的方法、用於量化的參數之解量化方法及其電腦可讀取的媒體、音頻編碼器、音頻解碼器及音頻系統 |
| EP3067889A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
| JP6412292B2 (ja) | 2016-01-22 | 2018-10-24 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
| AU2017357454B2 (en) * | 2016-11-08 | 2021-02-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for downmixing or upmixing a multichannel signal using phase compensation |
| GB2559199A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
| CN117690442A (zh) * | 2017-07-28 | 2024-03-12 | 弗劳恩霍夫应用研究促进协会 | 用于使用宽频带滤波器生成的填充信号对已编码的多声道信号进行编码或解码的装置 |
-
2017
- 2017-10-30 AU AU2017357454A patent/AU2017357454B2/en active Active
- 2017-10-30 EP EP22209969.9A patent/EP4167233A1/en not_active Withdrawn
- 2017-10-30 PT PT177914140T patent/PT3539125T/pt unknown
- 2017-10-30 PL PL17791415T patent/PL3539126T3/pl unknown
- 2017-10-30 RU RU2019117764A patent/RU2727799C1/ru active
- 2017-10-30 JP JP2019545853A patent/JP7102427B2/ja active Active
- 2017-10-30 RU RU2019117749A patent/RU2725178C1/ru active
- 2017-10-30 PT PT177914157T patent/PT3539126T/pt unknown
- 2017-10-30 KR KR1020197016395A patent/KR102291811B1/ko active Active
- 2017-10-30 CA CA3127805A patent/CA3127805C/en active Active
- 2017-10-30 MX MX2019005145A patent/MX387556B/es unknown
- 2017-10-30 CA CA3045948A patent/CA3045948C/en active Active
- 2017-10-30 ES ES17791414T patent/ES2938244T3/es active Active
- 2017-10-30 EP EP20190710.2A patent/EP3761311A1/en not_active Withdrawn
- 2017-10-30 MX MX2019005147A patent/MX394773B/es unknown
- 2017-10-30 JP JP2019545852A patent/JP7008716B2/ja active Active
- 2017-10-30 KR KR1020197016092A patent/KR102327767B1/ko not_active Expired - Fee Related
- 2017-10-30 WO PCT/EP2017/077822 patent/WO2018086947A1/en not_active Ceased
- 2017-10-30 PL PL17791414.0T patent/PL3539125T3/pl unknown
- 2017-10-30 WO PCT/EP2017/077824 patent/WO2018086948A1/en not_active Ceased
- 2017-10-30 CN CN202311048157.7A patent/CN116994592A/zh active Pending
- 2017-10-30 MY MYPI2019002415A patent/MY196198A/en unknown
- 2017-10-30 EP EP17791415.7A patent/EP3539126B1/en active Active
- 2017-10-30 AU AU2017357453A patent/AU2017357453B2/en active Active
- 2017-10-30 ES ES17791415T patent/ES2834083T3/es active Active
- 2017-10-30 CA CA3042580A patent/CA3042580C/en active Active
- 2017-10-30 EP EP17791414.0A patent/EP3539125B1/en active Active
- 2017-10-30 FI FIEP17791414.0T patent/FI3539125T3/fi active
- 2017-10-30 CN CN201780079910.5A patent/CN110100279B/zh active Active
- 2017-10-30 CN CN201780080571.2A patent/CN110114826B/zh active Active
- 2017-10-30 CN CN202311619874.0A patent/CN117676451A/zh active Pending
- 2017-11-07 TW TW106138473A patent/TWI664625B/zh active
- 2017-11-07 TW TW106138472A patent/TWI669705B/zh active
- 2017-11-08 AR ARP170103097A patent/AR110146A1/es active IP Right Grant
- 2017-11-08 AR ARP170103099A patent/AR110148A1/es active IP Right Grant
-
2019
- 2019-05-03 US US16/402,883 patent/US11488609B2/en active Active
- 2019-05-07 US US16/405,422 patent/US11450328B2/en active Active
- 2019-06-03 ZA ZA2019/03534A patent/ZA201903534B/en unknown
- 2019-06-03 ZA ZA2019/03535A patent/ZA201903535B/en unknown
-
2021
- 2021-04-20 AU AU2021202390A patent/AU2021202390B2/en active Active
- 2021-09-24 JP JP2021155666A patent/JP7443307B2/ja active Active
-
2022
- 2022-05-25 US US17/824,297 patent/US12100402B2/en active Active
- 2022-07-06 JP JP2022109004A patent/JP7520074B2/ja active Active
- 2022-08-10 US US17/884,910 patent/US12243541B2/en active Active
-
2023
- 2023-10-26 JP JP2023184075A patent/JP2024008967A/ja active Pending
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20060190247A1 (en) * | 2005-02-22 | 2006-08-24 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
| US20080195397A1 (en) * | 2005-03-30 | 2008-08-14 | Koninklijke Philips Electronics, N.V. | Scalable Multi-Channel Audio Coding |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI669705B (zh) | 用以使用側邊增益及殘餘增益編碼或解碼多通道信號之設備及方法 | |
| HK40006431B (zh) | 使用相位补偿来降混或升混多通道讯号的装置及方法 | |
| HK40006431A (zh) | 使用相位补偿来降混或升混多通道讯号的装置及方法 | |
| HK40013611B (zh) | 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法 | |
| HK40013611A (zh) | 使用边增益和残差增益对多声道信号进行编码或解码的装置和方法 |