TWI463485B - 音訊信號解碼器或編碼器、用以提供上混信號表示型態或位元串流表示型態之方法、電腦程式及機器可存取媒體 - Google Patents
音訊信號解碼器或編碼器、用以提供上混信號表示型態或位元串流表示型態之方法、電腦程式及機器可存取媒體 Download PDFInfo
- Publication number
- TWI463485B TWI463485B TW099132785A TW99132785A TWI463485B TW I463485 B TWI463485 B TW I463485B TW 099132785 A TW099132785 A TW 099132785A TW 99132785 A TW99132785 A TW 99132785A TW I463485 B TWI463485 B TW I463485B
- Authority
- TW
- Taiwan
- Prior art keywords
- audio
- parameter
- correlation
- bit stream
- cross
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims description 100
- 238000000034 method Methods 0.000 title claims description 55
- 238000004590 computer program Methods 0.000 title claims description 11
- 230000011664 signaling Effects 0.000 claims description 48
- 238000009877 rendering Methods 0.000 claims description 37
- 230000008569 process Effects 0.000 claims description 11
- 230000003595 spectral effect Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 23
- 239000011159 matrix material Substances 0.000 description 22
- 238000010586 diagram Methods 0.000 description 17
- 238000013139 quantization Methods 0.000 description 13
- 238000002156 mixing Methods 0.000 description 11
- 230000005540 biological transmission Effects 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 230000003993 interaction Effects 0.000 description 8
- 241000238634 Libellulidae Species 0.000 description 5
- 238000000926 separation method Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000001419 dependent effect Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000013507 mapping Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012805 post-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 238000003530 single readout Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S5/00—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation
- H04S5/005—Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation of the pseudo five- or more-channel type, e.g. virtual surround
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Stereophonic System (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
Description
依據發明的實施例係有關於一種用以基於一下混信號表示型態及一物件相關參數資訊且依一渲染資訊來提供一上混信號表示型態之音訊信號解碼器。
依據發明的其它實施例係有關於一種用以基於複數音訊物件信號來提供一位元串流表示型態之音訊信號編碼器。
依據發明的其它實施例係有關於一種用以基於一下混信號表示型態及一物件相關參數資訊且依一渲染資訊來提供一上混信號表示型態之方法。
依據本發明的其它實施例係有關於一種用以基於複數音訊物件信號來提供一位元串流表示型態之方法。
依據本發明的其它實施例係有關於一種用以執行該方法的電腦程式。
依據本發明的其它實施例係有關於表示一種多通道音訊信號之位元串流。
在習知音訊處理、音訊傳輸與音訊儲存技藝中,愈益期望處理多通道內容以便提高聽覺印象。多通道音訊內容的使用為使用者帶來顯著的改進。舉例而言,獲得一3維聽覺印象,其在娛樂應用中提高使用者的滿意度。然而,多通道音訊內容在例如電話會議應用之專業環境中也是有用的,因為揚聲器可懂度可藉由使用一多通道音訊播放來提高。
然而,亦期望在音訊品質與位元率要求間有一良好折衷以避免由多通道應用導致的一過度資源載入。
最近,已提出了針對包含多個音訊物件之音訊場景的位元率有效率傳輸及/或儲存的參數技術,例如,雙耳線索編碼(類型I)(參見,例如參考文獻[BCC])、聯合源編碼(參見,例如參考文獻[JSC])、及MPEG空間音訊物件編碼(SAOC)(參見,例如參考文獻[SAOC1]、[SAOC2]及未公開的參考文獻[SAOC])。
這些技術旨在感知地重建期望的輸出音訊場景而非用一波形匹配。
第8圖繪示此一系統的一系統概述(這裡:MPEG SAOC)。此外,第9a圖繪示此一系統(這裡:MPEG SAOC)的一系統概述。
在第8圖中繪示的MPEG SAOC系統800包含一SAOC編碼器810及一SAOC解碼器820。SAOC編碼器810接收複數物件信號x1
至xn
,它們可被表示為例如時域信號或時間-頻率-域信號(例如,為一傅立葉類型轉換之一組轉換係數的形式,或為QMF子頻帶信號的形式)。SAOC編碼器810典型地也接收下混係數d1
至dn
,它們與物件信號x1
至xn
相關聯。諸組下混係數可分別用於下混信號的每一通道。SAOC編碼器810典型地被組配來藉由依據相關聯的下混係數d1
至dn
組合物件信號x1
至xn
來獲得下混信號的一通道。典型地,下混通道比物件信號x1
至xn
少。為了在SAOC解碼器820端(至少近似)容許分離(或分開處理)物件信號,SAOC編碼器810提供一或多個下混信號(標示為下混通道)812及一旁側資訊814。旁側資訊814描述物件信號x1
至xN
的特性以便容許一解碼器端特定物件處理。
SAOC解碼器820被組配來接收該一或多個下混信號812及旁側資訊814。再者,SAOC解碼器820典型地被組配來接收描述一期望的渲染設置之一使用者互動資訊及/或一使用者控制資訊822。舉例而言,使用者互動資訊/使用者控制資訊822可描述一揚聲器設置及提供物件信號x1
至xN
之物件的期望空間布局。
SAOC解碼器820被組配來提供例如複數解碼上混通道信號至。上混通道信號可例如與一多揚聲器渲染安排之個別揚聲器相關聯。SAOC解碼器820可例如包含一物件分離器820a,該物件分離器820a被組配來基於一或多個下混信號812及旁側資訊814來至少近似重建物件信號x1
至xN
,藉此獲得重建物件信號820b。然而,重建物件信號820b可能略偏離原始物件信號x1
至xN
,舉例而言,因為旁側資訊814由於位元流限制不太夠進行完美重建。SAOC解碼器820可進一步包含一混合器820c,該混合器820c可被組配來接收重建物件信號820b及使用者互動資訊/使用者控制資訊822並基於它們來提供上混通道信號至。混合器820可被組配來使用使用者互動資訊/使用者控制資訊822來判定個別重建物件信號820b對上混通道信號至的貢獻。使用者互動資訊/使用者控制資訊822可例如包含渲染參數(也被表示為渲染係數),該等渲染參數判定個別重建物件信號822對上混通道信號至的貢獻。
然而,應該注意的是,在許多實施例中,在單一步驟中執行用第8圖中物件分離器820a指示的物件分離與用第8圖中混合器820c指示的混合。為實現此目的,可計算描述一或多個下混信號812到上混通道信號至上的一直接映射之總參數。這些參數可基於旁側資訊及使用者互動資訊/使用者控制資訊820來計算。
現在參考第9a、9b及9c圖,將描述用以基於一下混信號表示型態及物件相關旁側資訊來獲得一上混信號表示型態之不同裝置。第9a圖繪示包含一SAOC解碼器920之一MPEG SAOC系統900的一方塊示意圖。SAOC解碼器920包含作為分離功能區塊的一物件解碼器922及一混合器/渲染器926。物件解碼器922依賴於下混信號表示型態(例如,為在時域或時間-頻率-域中表示的一或多個下混信號的形式)及物件相關旁側資訊(例如,為物件元資料的形式)提供複數重建物件信號924。混合器/渲染器924接收與N個物件相關聯的重建物件信號924並基於它們提供一或多個上混通道信號928。在SAOC解碼器920中,物件信號924的擷取與混合/渲染分開執行,這允許將物件解碼功能與混合/渲染功能分離但帶來一相當高的計算複雜度。
現在參考第9b圖,將簡要討論另一MPEG SAOC系統930,該MPEG SAOC系統930包含一SAOC解碼器950。SAOC解碼器950依賴於一下混信號表示型態(例如,為一或多個下混信號的形式)及一物件相關旁側資訊(例如,為物件元資料的形式)提供複數上混通道信號958。SAOC解碼器950包含一組合的物件解碼器與混合器/渲染器,該組合的物件解碼器與混合器/渲染器被組配來在一聯合混合處理中獲得上混通道信號958而無需將物件解碼與混合/渲染分開,其中該聯合上混過程的參數是取決於物件相關旁側資訊與渲染資訊。聯合上混過程也取決於被視為物件相關旁側資訊的一部分之下混資訊。
綜上所述,可在一個一步驟過程或一個兩步驟過程中執行提供上混通道信號928、958。
現在參考第9c圖,將描述一MEPG SAOC系統960。SAOC系統960包含一SAOC至MPEG環繞轉碼器而非一SAOC解碼器。
SAOC至MPEG環繞轉碼器包含一旁側資訊轉碼器982,該旁側資訊轉碼器982被組配來接收物件相關旁側資訊(例如,為物件元資料的形式)及可取捨地關於一或多個下混信號的資訊及渲染資訊。旁側資訊轉碼器也被組配來基於一接收資料來提供一MPEG環繞旁側資訊(例如,為一MPEG環繞位元串流的形式)。因此,旁側資訊轉碼器982被組配來在計入渲染資訊及可取捨地有關一或多個下混信號內容的資訊之情況下將自物件編碼器出來的一物件相關(參數)旁側資訊轉換成一通道相關(參數)旁側資訊。
可取捨地,SAOC至MPEG環繞轉碼器980可被組配來操控例如下混信號表示型態所描述的一或多個下混信號以獲得一經操控的下混信號表示型態988。然而,下混信號操控器986可被省略使得SAOC至MPEG環繞轉碼器980之輸出下混信號表示型態988與SAOC至MPEG環繞轉碼器之輸入下混信號表示型態相同。舉例而言,如果通道相關MPEG環繞旁側資訊984基於SAOC至MPEG環繞轉碼器980之輸入下混信號表示型態可能不能提供一期望的聽覺印象(這在一些渲染群集(rendering constellation)中可能如此),則可使用下混信號操控器986。
因此,SAOC至MPEG環繞轉碼器980提供下混信號表示型態988及MPEG環繞位元串流984使得複數上混通道信號可使用一接收MPEG環繞位元串流984與下混信號表示型態988的MPEG環繞解碼器來產生,該複數上混通道信號依據輸入至SAOC至MPEG環繞轉碼器980的渲染資訊來表示音訊物件。
綜上所述,可使用解碼SAOC編碼音訊信號的不同構想。在一些情況中,一SAOC解碼器被使用,該SAOC解碼器依賴於下混信號表示型態及物件相關參數旁側資訊來提供上混通道信號(例如,上混通道信號928、958)。在第9a與9b圖中可見此構想的範例。可選擇地,SAOC編碼音訊資訊可被轉碼以獲得一下混信號表示型態(例如,一下混信號表示型態988)及一通道相關旁側資訊(例如,通道相關MPEG環繞位元串流984,),它們可被一MPEG環繞解碼器使用以提供期望的上混通道信號。
在MPEG SAOC系統800中(此一系統概述在第8圖中給出),一般處理是以一頻率選擇方式來完成且在每一頻帶內可如下描述:
● 作為SAOC編碼器處理的一部分,下混N個輸入音訊物件信號x1
至xN
。對於一單聲道下混,用d1
至dN
來表示下混係數。此外,SAOC編碼器810、910擷取描述輸入音訊物件的特性之旁側資訊814。此旁側資訊的一重要部分由彼此間物件功率與互相關的關係,亦即物件間互相關(IOC)上的物件層級差(OLD),組成。
● (數)下混信號812、912及旁側資訊814、914被傳輸及/或儲存。為此目的,下混音訊信號可使用習知的感知音訊編碼器來壓縮,諸如MPEG-1層II或III(也稱為“.mp3”)、MPEG高階音訊編碼(AAC)、或任一其它音訊編碼器。
● 在接收端,SAOC解碼器820、920感知地嘗試使用經傳輸的旁側資訊814、914(當然還有一或多個下混信號812、912)來恢復原始物件信號(「物件分離」)。這些近似物件信號(也表示為重建物件信號820b、924)接著使用一渲染矩陣被混合成用M個音訊輸出通道表示(例如可用上混通道信號至、928表示)的一目標場景。
● 實際上,物件信號的分離很少被執行(或甚至從不執行),因為分離步驟(用物件分離器820a指示、922)與混合步驟(用混合器820c、926指示)被組合成一單一轉碼步驟,這通常極大地降低計算複雜度。
已發現此一方案在傳輸位元率(僅需傳輸幾個下混通道外加一些旁側資訊來代替N個物件音訊信號)與計算複雜度(處理複雜度主要有關於輸出通道數目而非音訊物件數目)方面都極其有效。對接收端上的使用者的進一步好處包括自由選擇對他/她的選擇(單聲道、立體聲、環繞、虛擬化耳機播放等等)的一渲染設置與使用者互動性特徵:渲染矩陣,及因而,輸出場景可由使用者隨意願、個人偏好或其它準則來互動地設置及改變。舉例而言,可以將一群組的通話器一起置於一空間區域來與其它剩餘通話器最大的區別開。此互動性透過提供一解碼器使用者介面來實現:對於每一傳輸聲音物件,其相對層級及(對於非單聲道渲染)渲染的空間位置可被調整。這可隨使用者改變相關聯圖形使用者介面(GUI)滑動塊的位置而即時發生(例如,物件層級=+5dB,物件位置=-30deg)。
下面將給出對技術的一簡短參引,其早前已應用於基於通道的音訊編碼之領域中。
US 11/032,689描述用以將數個線索值組合成一單一傳輸值以保存旁側資訊之一過程。
然而,已發現的是,用於編碼一多通道音訊內容之物件相關參數資訊在一些情況中包含相當高的位元率。。
因此,本發明的一目标是產生一構想,其容許提供、儲存或傳輸具有緊密旁側資訊的一多通道音訊內容。
此目標藉由獨立申請專利範圍項所定義之一音訊信號解碼器、一音訊信號編碼器、用以提供一上混信號表示型態之一方法、用以提供一位元串流表示型態之一方法、一電腦程式及一位元串流來實現。
依據發明的一實施例產生一種用以基於一下混信號表示型態及一物件相關參數資訊並依一渲染資訊來提供一上混信號表示型態之音訊信號解碼器,該裝置包含一物件參數決定器,其組配來獲得複數對音訊物件的物件間互相關值。該物件參數決定器組配來評估一位元串流信令參數以便決定是評估個別物件間互相關位元串流參數值來獲得複數對相關音訊物件的物件間互相關值,還是使用一共用物件間互相關位元串流參數值來獲得複數對相關音訊物件的物件間互相關值。該音訊信號解碼器亦包含一信號處理器,其組配來基於該下混信號表示型態並使用複數對相關音訊物件的該等物件間互相關值及該渲染資訊來獲得該上混信號表示型態。
此音訊信號解碼器所依據的核心思路是:用以編碼物件間互相關值所需要的位元率在需要考慮許多對音訊物件間的互相關以獲得一良好聽覺印象之一些情況中會過高,及在此類情況中在不顯著折衷聽覺印象的情況下藉由使用一共用物件間互相關位元串流參數值而非個別物件間互相關位元串流參數值可顯著減小編碼物件間互相關值所需要的位元率。
已發現的是,在許多對音訊物件間有顯著的物件間互相關的情況中(應考慮以便獲得一良好聽覺印象),考慮物件間互相關通常會造成對物件間互相關位元串流參數值的高位元率需求。然而,已發現的是,在許多對音訊物件間有不可忽略物件間互相關的此類情況中,藉由僅僅編碼一單一共用物件間互相關位元串流參數值及藉由由此一共用物件間互相關位元串流參數值獲取複數對相關音訊物件的物件間互相關值可實現一良好的聽覺印象。因此,在大部分情況中能以足夠的精度來考慮許多音訊物件間的互相關,同時保證用以傳輸物件間互相關位元串流參數值所付出的努力足夠小。
因此,上面討論的構想造成在許多不同音訊物件信號間有不可忽略的物件間互相關之一些聲學環境中對物件相關旁側資訊的小的位元率需要,同時仍實現足夠良好的聽覺印象。
在一較佳實施例中,物件參數決定器組配來將所有對不同相關音訊物件的物件間互相關值設為由共用物件間互相關位元串流參數值所定義的一共用值。已發現的是,此簡單解決方法在許多相關情況中帶來足夠好的聽覺印象。
在一較佳實施例中,物件參數決定器組配來評估一物件關係資訊,其描述兩音訊物件是否彼此相關。物件參數決定器進一步組配來使用共用物件間互相關位元串流參數值選擇性獲得該物件關係資訊指示有關係之諸對音訊物件的物件間互相關值,並將該物件關係資訊指示沒有關係之諸對音訊物件的物件間互相關值設為一預定值(例如,零)。因此,能以高位元率效率來區分相關與無關音訊物件。因而,避免了將一非零物件間互相關值分配給(近乎)無關的諸對音訊物件。因此,避免了一聽覺印象的降低及分離此類近乎無關音訊物件是可能的。再者,相關及無關音訊物件的信令能以很高的位元率效率來執行,因為音訊物件關係通常在一段音訊間不隨時間變化,使得此信令所需要的位元率通常很低。因而,所描述的構想帶來位元率效率與聽覺印象間的一很好折衷。
在一較佳實施例中,物件參數決定器組配來評估對不同音訊物件的每一組合包含一個一位元旗標之一物件關係資訊,其中與不同音訊物件的一指定組合相關聯之該一位元旗標指示該指定組合的該等音訊物件是否相關。此一資訊可十分有效率地傳輸且造成實現一良好聽覺印象所需要的位元率顯著減小。
在一較佳實施例中,物件參數決定器組配來將所有對不同相關音訊物件的該等物件間互相關值設為由共用物件間互相關位元串流參數值所定義的一共用值。
在一較佳實施例中,物件參數決定器包含一位元串流剖析器,其組配來剖析一音訊內容的一位元串流表示型態,以獲得位元串流信令參數及個別物件間互相關位元串流參數值或共用物件間互相關位元串流參數值。藉由使用一位元串流剖析器,能以良好實施效率獲得位元串流信令參數及個別物件間互相關位元串流參數或共用物件間互相關位元串流參數。
在一較佳實施例中,音訊信號解碼器組配來,將與一對相關音訊物件相關聯之一物件間互相關值與,描述該對相關音訊物件之一第一音訊物件的一物件層級之一物件層級差值,及與描述該對相關音訊物件之一第二音訊物件的一物件層級之一物件層級差值相關聯,以獲得與該對相關音訊物件相關聯之一共變異數值。因此,即使一共用物件間互相關參數被使用,獲取與一對相關音訊物件相關聯的共變異數使得共變異數值適於該對音訊物件也是可能的。因此,可獲得針對不同對音訊物件的不同共變異數值。特別地,使用共用物件間互相關位元串流參數值可獲得大量不同的共變異數值。
在一較佳實施例中,音訊信號解碼器組配來處理三或更多個音訊物件。在此情況中,物件參數決定器組配來對每一對不同音訊物件提供一物件間互相關值。已發現的是,即使有相當大量彼此相關的音訊物件,使用發明構想也可獲得有意義的值。當使用一物件相關參數旁側資訊編碼及解碼音訊物件信號時,自音訊物件的許多組合獲得物件間互相關值是特別有用的。
在一較佳實施例中,物件參數決定器組配來評估被包括於一組態位元串流部分中之一位元串流信令參數,以便決定是評估個別物件間互相關參數值獲得複數對相關音訊物件的物件間互相關值,還是使用一共用物件間互相關位元串流參數值獲得複數對相關音訊物件的物件間互相關值。在此實施例中,物件參數決定器組配來評估被包括於該組態位元串流部分中的一物件關係資訊,以決定兩音訊物件是否相關。此外,物件參數決定器組配來,如果決定使用一共用物件間互相關位元串流參數值來獲得複數對相關音訊物件的物件間互相關值,則評估被包括於音訊內容的每一訊框的一訊框資料位元串流部分中之一共用物件間互相關位元串流參數值。因此,獲得一高位元率效率,因為相對大的物件關係資訊每音訊段僅評估一次(這由一組態位元串流部分的出現定義),而相對小的共用物件間互相關位元串流參數值係針對音訊段的每一訊框而評估,亦即每音訊段多次。這反映此觀測結果:音訊物件間的關係通常在一音訊段內不改變或僅極少地改變。因此,在適度低位元率下可獲得一良好聽覺印象。
然而,可選擇地,使用一共用物件間互相關位元串流參數值可在一訊框資料位元串流部分信號示意,這舉例而言允許對變化音訊內容的靈活適應。
依據發明的一實施例產生一種用以基於複數音訊物件信號提供一位元串流表示型態之音訊信號編碼器,該音訊信號編碼器包含一下混器,其組配來基於該等音訊物件信號及依描述該等音訊物件信號對一下混信號的該一或多個通道的貢獻之下混參數來提供該下混信號。該音訊信號編碼器亦包含一參數提供器,其組配來提供與複數對相關音訊物件信號相關聯之一共用物件間互相關位元串流參數值,及亦提供一位元串流信令參數,該位元串流信令參數指示該共用物件間互相關位元串流參數值被提供來代替複數個別物件間互相關位元串流參數值。該音訊信號編碼器亦包含一位元串流格式器,其組配來提供一位元串流,該位元串流包含該下混信號的一表示型態、該共用物件間互相關位元串流參數值的一表示型態及該位元串流信令參數。
依據發明的此實施例,允許提供表示具有緊密旁側資訊的一個多通道音訊內容之一位元串流。藉由提供一共用物件間互相關位元串流參數值,物件相關旁側資訊被緊密持有,同時仍提供有效率資訊來以良好聽覺印象重現多通道音訊內容。此外,應注意的是,這裡所描述的音訊信號編碼器提供與已就音訊信號解碼器所討論相同的優點。
在一較佳實施例中,參數提供器組配來依交功率項的和與平均功率項的和之間的一比值來提供共用物件間互相關位元串流參數值。已發現的是,此一物件間互相關位元串流參數值能以中等計算量來計算,同時在大部分情況中仍提供一準確的聽覺印象。
在依據發明的另一實施例中,參數提供器組配來提供一預定常數值來作為共用物件間互相關位元串流參數值。已發現的是,在一些情況中提供一常數值是有意義的。例如,對於在某些類型會議室內某些標準麥克風配置,一常數值可能非常適合於表示一期望聽覺印象。因此,在發明構想的許多標準應用中可最小化計算量同時提供一良好聽覺印象。
在另一較佳實施例中,參數提供器組配來亦提供描述兩音訊物件是否彼此相關之一物件關係資訊。如上所討論,此一物件關係資訊可被音訊解碼器利用。因此,可確保共用物件間互相關位元串流參數值僅應用於此類彼此確實相關的音訊物件,而不應用於完全無關的音訊物件。
在一較佳實施例中,參數提供器組配來選擇性評估物件關係資訊指示有關係之音訊物件的一物件間互相關,以計算共用物件間互相關位元串流參數值。這允許具有一特別有意義物件間互相關位元串流參數值。
依據發明的進一步實施例產生一種用以提供一上混信號表示型態之方法,及一種用以提供一位元串流表示型態之方法。這些方法是基於與上面所討論音訊解碼器及音訊編碼器相同的思路。
依據發明的另一實施例產生一種表示一個多通道音訊信號之位元串流。該位元串流包含將複數音訊物件的音訊信號組合之一下混信號的一表示型態。該位元串流亦包含描述音訊物件的特性之一物件相關參數旁側資訊。該物件相關參數旁側資訊包含一位元串流信令參數,其指示該位元串流是包含個別物件間互相關位元串流參數還是一共用物件間互相關位元串流參數值。因此,位元串流允許靈活使用來傳輸不同類型音訊通道內容。特別地,位元串流允許傳輸個別物件間互相關位元串流參數值或共用物件間互相關位元串流參數值,無論哪個更適合於聽覺場景。因此,位元串流十分適於處理此兩情況:有相對少量相關音訊物件(應傳輸詳細的(物件個別的)物件間互相關資訊),及有相對大量相關音訊物件(傳輸個別物件間互相關位元串流參數會導致過高的位元率需求,及一共用物件間互相關位元串流參數值仍允許以良好聽覺印象重現)之情況。
依據發明的實施例將隨後參考附圖描述,其中:第1圖繪示依據本發明之一實施例之一音訊信號解碼器的一方塊示意圖;第2圖繪示依據本發明之一實施例之一音訊信號編碼器的一方塊示意圖;第3圖繪示依據本發明之一實施例之一位元串流的一示意表示型態;第4圖繪示使用一單一物件間互相關參數計算之一MPEG SAOC系統的一方塊示意圖;第5圖繪示一SAOC特定組態資訊的一句法表示型態,其可以是一位元串流的一部分;第6圖繪示一SAOC訊框資訊的一句法表示型態,其可以是一位元串流的一部分;第7圖繪示表示對物件間互相關參數的一參數量化的一表;第8圖繪示一參考MPEG SAOC系統的一方塊示意圖;第9a圖繪示使用一分離的解碼器及混合器之一參考SAOC系統的一方塊示意圖;第9b圖繪示使用一整合的解碼器及混合器之一參考SAOC系統的一方塊示意圖;第9c圖繪示使用一SAOC至MPEG轉碼器之一參考SAOC系統的一方塊示意圖。
下面將參考第1圖描述一音訊信號解碼器100,第1圖繪示此一音訊信號解碼器100的一方塊示意圖。
首先將描述音訊信號解碼器100的輸入與輸出信號。隨後將描述音訊信號解碼器100的結構,及最後將討論音訊信號解碼器100的功能。
音訊信號解碼器100組配來接收典型地表示複數音訊物件信號之一下混信號表示型態110,舉例而言為一個一通道音訊信號表示型態或一個兩通道音訊信號表示型態的形式。
音訊信號解碼器100亦接收一物件相關參數資訊112,該物件相關參數資訊112典型地描述下混信號表示型態110中所包括的音訊物件。
舉例而言,物件相關參數資訊112使用物件層級差值(OLD)描述由下混信號表示型態110所表示之音訊物件的物件層級。
此外,物件相關參數資訊112典型地表示由下混信號表示型態110所表示之音訊物件的物件間互相關特性。物件相關參數資訊典型地包含一位元串流信令參數(文中亦用“bsOneIOC”標示),其信號示意物件相關參數資訊是包含與個別諸對音訊物件相關聯之個別物件間互相關位元串流參數值,抑或是與複數對音訊物件相關聯之一共用物件間互相關位元串流參數值。因此,依據位元串流信令參數“bsOneIOC”,物件相關參數資訊包含個別物件間互相關位元串流參數值或共用物件間互相關位元串流參數值。
物件相關參數資訊112亦可包含下混資訊,其描述個別音訊物件至下混信號表示型態的下混。舉例而言,物件相關參數資訊包含一下混增益資訊DMG,其描述音訊物件信號對下混信號表示型態110的貢獻。此外,物件相關參數資訊能可取捨地包含一下混通道層級差資訊DCLD,其描述不同下混通道間的下混增益差。
信號解碼器100亦組配來,例如自用以輸入一渲染資訊之一使用者介面接收該渲染資訊120。渲染資訊描述音訊物件信號到上混通道的分配。舉例而言,渲染資訊120可採用一渲染矩陣(或其入口)的形式。可選擇地,渲染資訊120可包含對音訊物件的期望渲染位置(例如,依據空間座標)及音訊物件的期望強度(或音量)之說明。
音訊信號解碼器100提供一上混信號表示型態130,其被認為是由下混信號表示型態與物件相關參數資訊所描述之音訊物件信號的一經渲染表示型態。舉例而言,上混信號表示型態可採用個別音訊通道信號的形式,或可採用一下混信號表示型態結合一通道相關參數旁側資訊(例如,MPEG環繞旁側資訊)的形式。
音訊信號解碼器100組配來基於下混信號表示型態110及物件相關參數資訊112且依渲染資訊120來提供上混信號表示型態130。裝置100包含一物件參數決定器140,其組配來,基於物件相關參數資訊112獲得(至少)針對複數對相關音訊物件的物件間互相關值。為此目的,物件參數決定器140組配來評估位元串流信令參數(“bsOneIOC”)以便決定,是評估個別物件間互相關位元串流參數值獲得複數對相關音訊物件的物件間互相關值,還是使用一共用物件間互相關位元串流參數值獲得複數對相關音訊物件的物件間互相關值。因此,若位元串流信令參數指示不可得一共用物件間互相關位元串流參數值,物件參數決定器140組配來基於個別物件間互相關位元串流參數值提供複數對相關音訊物件的物件間互相關值142。類似地,若位元串流信令參數指示可得此一共用物件間互相關位元串流參數值,物件參數決定器140基於共用物件間互相關位元串流參數值決定複數對相關音訊物件的物件間互相關值142。
物件參數決定器基於物件相關參數資訊112通常亦提供其它物件相關值,如舉例而言,物件層級差值OLD、下混增益值DMG及(可取捨地)下混通道層級差值DCLD。
音訊信號解碼器100亦包含一音訊信號處理器150,其組配來,基於下混信號表示型態110並使用複數對相關音訊物件的物件間互相關值142及渲染資訊120來獲得上混信號表示型態130。信號處理器150亦使用其他物件相關值,如物件層級差值、下混增益值及下混通道層級差值。
信號處理器150可例如估計一期望上混信號表示型態130的統計特徵並處理下混信號表示型態使得源自下混信號表示型態的上混信號表示型態130包含期望的統計特性。可選擇地,信號處理器150可利用對物件特性及下混處理的認識來嘗試分離複數音訊物件的音訊物件信號,它們被組合於下混信號表示型態110中。因此,信號處理器可計算一處理規則(例如,一縮放規則或一線性組合規則),其將會容許重建個別音訊物件信號或至少重建具有與個別音訊物件信號類似的統計特性之音訊信號。信號處理器150接著可應用期望渲染來獲得上混信號表示型態。當然,計算重建的音訊物件信號(其接近於原始的個別音訊物件信號)及渲染可組合於一單元處理步驟中以便減小計算複雜度。
綜上所述,音訊信號解碼器組配來,使用渲染資訊120、基於下混信號表示型態110及物件相關參數資訊112提供上混信號表示型態130。評估物件相關參數資訊112是為了瞭解個別音訊物件信號與個別音訊物件信號間關係的統計特性,這是信號處理器150所需要的。舉例而言,使用物件相關參數資訊112是為了獲得一估計的變異數矩陣,其描述個別音訊物件信號之估計的共變異數值。該估計的共變異數矩陣接著被信號處理器150應用以便決定用以自下混信號表示型態110獲取上混信號表示型態130之一處理規則(例如,如上所討論的規則),其中,當然亦可利用其它物件相關資訊。
物件參數決定器140包含不同模式以便獲得複數對相關音訊物件的物件間互相關值,其被認為是信號處理器150的一重要輸入資訊。在一第一模式中,使用個別物件間互相關位元串流參數值決定物件間互相關值。舉例而言,對每一對相關音訊物件可有一個別物件間互相關位元串流參數值,使得物件參數決定器140僅將此一個別物件間互相關位元串流參數值映射成與一指定對相關音訊物件相關聯之一或兩物件間互相關值。另一方面,亦可有一第二操作模式,其中物件參數決定器140僅自位元串流讀取一單一共用物件間互相關位元串流參數值並基於此單一共用物件間互相關位元串流參數值提供複數不同對相關音訊物件的複數物件間互相關值。因此,複數對相關音訊物件的物件間互相關值可例如與由單一共用物件間互相關位元串流參數值所表示的值相同,或可自相同共用物件間互相關位元串流參數值獲取。物件參數決定器140依位元串流信令參數(“bsOneIOC”)可在第一模式與第二模式間切換。
因此,有用以提供物件間互相關值的不同模式,該等物件間互相關值可由物件參數決定器140應用。如果有相對少量對相關音訊物件,該諸對相關音訊物件的物件間互相關值典型地(依位元串流信令參數)由物件參數決定器個別地決定,物件參數決定器允許特別精確表示該諸對相關音訊物件的特性,且隨後可能在信號處理器150中以良好精度重建個別音訊物件信號。因而,在僅相對少量對相關音訊物件間的互相關有關之情況中提供一良好聽覺印象通常是可能的。
物件參數決定器的第二操作模式(其中一共用物件間互相關位元串流參數值用來獲得複數對相關音訊物件的物件間互相關值)通常用於複數對音訊物件間有不可忽略的互相關之情況中。此類情況在不過度增加表示下混信號表示型態110與物件相關參數資訊112之一位元串流的位元率的情況下習知上可能無法處理。如果相對大量對音訊物件間有不可忽略的互相關(此互相關不包含聲學上的顯著變化),使用一共用物件間互相關位元串流參數值帶來特有優勢。在此情況中,可能以中等位元率付出考慮互相關,這帶來位元率需求與聽覺印象品質間的適度良好折衷。
因此,音訊信號解碼器100能夠有效率處理不同情況,即僅有幾對相關音訊物件(其之物件間互相關應以高精度計入)之情況,與有大量對相關音訊物件(其之物件間互相關不應完全忽略而是應具有一些類似性)之情況。音訊信號解碼器100能夠以良好聽覺印象品質處理此兩情況。
下面將參考第2圖描述一音訊信號編碼器200,第2圖繪示此一音訊信號編碼器200的一方塊示意圖。
音訊信號編碼器200組配來接收複數音訊物件信號210a至210N。音訊物件信號210a至210N可例如為一通道信號或表示不同音訊物件的兩通道信號。
音訊信號編碼器200亦組配來提供一位元串流表示型態220,其描述音訊物件信號210a至210N以一緊密且位元率有效率方式所表示的聽覺場景。
音訊信號編碼器200包含一下混器220,其組配來接收音訊物件信號210a至210N並基於音訊物件信號210a至210N來提供一下混信號232。下混器230組配來依下混參數提供下混信號232,下混參數描述音訊物件信號210a至210N對下混信號的一或多個通道的貢獻。。
音訊信號編碼器亦包含一參數提供器240,其組配來提供與複數對相關音訊物件信號210a至210N相關聯的一共用物件間互相關位元串流參數值242。參數提供器240亦組配來提供一位元串流信令參數244,其指示共用物件間互相關位元串流參數值242被提供來代替複數個別物件間互相關位元串流參數(與不同對音訊物件個別地相關聯)。
音訊信號編碼器200亦包含一位元串流格式器250,其組配來提供一位元串流表示型態250,其包含下混信號232的一表示型態(例如,下混信號232的一編碼表示型態)、共用物件間互相關位元串流參數值242的一表示型態(例如,其的一量化及編碼表示型態)及位元串流信令參數244(例如,為一個一位元參數值的形式)。
音訊信號解碼器200隨後提供一位元串流表示型態220,其以良好精度表示音訊物件信號210a至210N所描述的音訊場景。特別地,如果音訊物件信號210a至210N中的眾多者彼此相關,位元串流表示型態220包含一緊密旁側資訊,亦即包含一不可忽略物件間互相關。在此情況中,共用物件間互相關位元串流參數值242被提供來代替與諸對音訊物件個別相關聯之個別物件間互相關位元串流參數值。因此,音訊信號編碼器可在任一情況(有許多相關的諸對音訊物件信號210a至210N之情況及僅有幾對相關音訊物件信號210a至210N之情況)中都提供一緊密位元串流表示型態220。特別地,位元串流表示型態220可包含音訊信號解碼器100所需要來作為一輸入資訊之資訊,即下混信號表示型態110與物件相關參數資訊112。因此,參數提供器240可組配來提供額外的物件相關參數資訊,其描述音訊物件信號210a至210N及下混器230所執行的下混處理。舉例而言,參數提供器240可額外提供一物件層級差資訊OLD,其描述音訊物件信號210a至210N的物件層級(或物件層級差)。此外,參數提供器240可提供一下混增益資訊DMG,其描述在形成下混信號232的一或多個通道時應用於個別音訊物件信號210a至210N的下混增益。下混通道層級差值DCLD(其描述下混信號232之不同通道間的下混增益差)亦能可取捨地由參數提供器240提供以包括於位元串流表示型態220中。
綜上所述,音訊信號編碼器有效率地提供以良好聽覺印象重建音訊物件信號210a至210N所描述之音訊場景而需要的物件相關參數資訊,其中如果有大量相關對音訊物件,則使用一緊密共用物件間互相關位元串流參數值。這使用位元串流信令參數來信號示意。因此,在此一情況中避免了過多位元串流載入。
有關提供一位元串流表示型態的進一步細節將在下面描述。
第3圖繪示依據發明之一實施例之一位元串流300的一示意表示型態。
位元串流300可例如充當音訊信號解碼器100的一輸入串流,攜載下混信號表示型態110及物件相關參數資訊112。位元串流300可由音訊信號編碼器200作為一輸出位元串流220而提供。
位元串流300包含一下混信號表示型態310,其是將複數音訊物件的音訊信號組合之一個一通道或多通道下混信號(例如,下混信號232)的一表示型態。位元串流300亦包含描述音訊物件的特性之物件相關參數旁側資訊320,音訊物件的音訊物件信號由下混信號表示型態310以一組合形式來表示。物件相關參數旁側資訊320包含一位元串流信令參數322,其指示位元串流是包含個別物件間互相關位元串流參數(與不同對音訊物件個別地相關聯)還是一共用物件間互相關位元串流參數值(與複數不同對音訊物件相關聯)。
物件相關參數資訊亦包含複數個別物件間互相關位元串流參數值324a,其由位元串流信令參數322的一第一狀態指示,或一共用物件間互相關位元串流,其由位元串流信令參數322的一第二狀態指示。
因此,藉由使位元串流300的格式適於包含個別物件間互相關位元串流參數值的一表示型態或一共用物件間互相關位元串流參數值的一表示型態,位元串流300可適於音訊物件信號210a至210N的關係特性。
在僅有幾個強互相關音訊物件的情況下,位元串流300可隨後提供有效率編碼具有一緊密旁側資訊之不同類型音訊場景的機會,同時維持獲得一良好聽覺印象而引起的改變。
有關位元串流的進一步細節將隨後討論。
下面將參考第4圖描述使用一單一IOC參數計算的一MPEG SAOC系統。
依據第4圖的MPEG SAOC系統400包含一SAOC編碼器410及一SAOC解碼器420。
SAOC編碼器410組配來接收複數(例如L個)音訊物件信號420a至420N。SAOC編碼器410組配來提供一下混信號表示型態430及一旁側資訊432,它們較佳而非必需被包括於一位元串流中。
SAOC編碼器410包含一SAOC下混處理工具440,其接收音訊物件信號420a至420N並基於它們提供下混信號表示型態430。SAOC編碼器410亦包含一參數擷取器444,其可接收音訊物件信號420a至420N且亦能可取捨地接收有關SAOC下混處理工具440(例如,一或多個下混參數)的一資訊。參數擷取器444包含一單一物件間互相關計算器448,其組配來計算與複數對音訊物件相關聯之一單一(共用)物件間互相關值。此外,單一物件間互相關計算器448組配來提供一單一物件間互相關信令452,其指示是否一單一物件間互相關值被使用來代替物件對個別物件間互相關值。單一物件間互相關計算器448可例如基於對音訊物件信號420a至420N的分析而決定是否一單一共用物件間互相關值(或者與諸對音訊物件信號個別地相關聯之複數個別物件間互相關參數值)被提供。然而,單一物件間互相關計算器448亦可接收一外部控制資訊,其決定是應該計算一共用物件間互相關值(例如,一位元串流參數值)還是個別物件間互相關值(例如,多個位元串流參數值)。
參數擷取器444亦組配來提供描述音訊物件信號420a至420N的複數參數,如舉例而言物件層級差參數。參數擷取器444亦較佳地組配來提供描述下混的參數,如舉例而言一組下混增益參數DMG及一組下混通道層級差參數DCLD。
SAOC編碼器410包含一量化器456,其量化參數擷取器444所提供的參數。舉例而言,共用物件間互相關參數可由量化器456來量化。此外,物件層級差參數、下混增益參數及下混通道層級差參數亦可由量化器456來量化。因此,量化參數由量化器456獲得。
SAOC編碼器410亦包含一無雜訊編碼工具460,其組配來編碼由量化器456所提供的量化參數。舉例而言,無雜訊編碼工具可無雜訊地編碼量化共用物件間互相關參數及還有其他量化參數(例如,OLD、DMG及DCLD)。
因此,SAOC解碼器410提供旁側資訊432使得旁側資訊包含單一IOC信令452(其可作為一位元串流信令參數)與由無雜訊編碼工具480所提供的無雜訊編碼參數(其可作為位元串流參數值)。
SAOC解碼器420組配來接收SAOC編碼器410所提供的旁側資訊432及SAOC編碼器410所提供的下混信號表示型態430。
SAOC解碼器420包含一無雜訊解碼工具464,其組配來使在編碼器410內所執行之對旁側資訊432的無雜訊編碼460反向。SAOC解碼器420亦包含一反量化器(de-quantization)468,其亦可作為一反向量化器(inverse quantization)(即使嚴格說來,量化並不是以完美精度來反向),其中反量化器468組配來接收無雜訊解碼工具464的解碼旁側資訊466。反量化器468提供反量化參數470,例如,由單一物件間互相關計算器448所提供的解碼與反量化共用物件間互相關值,還有解碼與反量化物件層級差值OLD、解碼與反量化下混增益值DMG及解碼與反量化下混通道層級差值DCLD。SAOC解碼器420亦包含一單一物件間互相關擴充器474,其組配來基於共用物件間互相關值提供與複數對相關音訊物件相關聯之複數物件間互相關值。然而,應指出的是,單一物件間互相關擴充器474在一些實施例中可排列於無雜訊解碼工具464與反量化器468之前。舉例而言,單一物件間互相關擴充器474可整合於一位元串流剖析器中,該位元串流剖析器接收包含下混信號表示型態430與旁側資訊432之一位元串流。
SAOC解碼器420亦包含一SAOC解碼器處理及混合工具480,其組配來接收下混信號表示型態430及被包括(以一解碼形式)於旁側資訊432中之解碼參數。因此,SAOC解碼器處理及混合工具480可例如對每一對(不同)音訊物件接收一或兩物件間互相關值,其中該一或兩物件間互相關值對於非相關音訊物件可為零而對於相關音訊物件為非零。此外,SAOC解碼器處理及混合工具480可對每一音訊物件接收物件層級差值。此外,SAOC解碼器處理及混合工具480可接收描述在SAOC下混處理工具440中所執行的下混之下混增益值及(可取捨地)下混通道層級差值。因此,SAOC解碼器處理及混合工具480可依下混信號表示型態430、包括於旁側資訊432中的旁側資訊及描述對音訊物件的期望渲染之一互動資訊來提供複數通道信號484a至484N。然而,應指出的是,通道448a至448N能以個別音訊通道信號的形式或以一參數表示型態的形式來表示,如舉例而言依據MPEG環繞標準的一多通道表示型態(例如包含,一MPEG環繞下混信號及通道相關MPEG環繞旁側資訊)。換言之,一個別通道音訊信號表示型態與一參數多通道音訊信號表示型態在本說明中皆將作為一上混信號表示型態。
下面將描述有關SAOC編碼器410與SAOC解碼器420的功能的一些細節。
下面將討論的SAOC旁側資訊在SAOC編碼及SAOC解碼上發揮重要作用。SAOC旁側資訊描述借助於輸入物件的時間/頻率變化共變異數矩陣來描述輸入物件(音訊物件)。N個物件信號420a至420N(有時亦簡要標示為「物件」)可寫成一矩陣中的列:
這裡,si
(1)項標示針對具有時間指數1的複數時間部分具有音訊物件指數i之音訊物件的頻譜值。L個樣本的一信號區塊表示在一時間與頻率間隔中的信號,該時間與頻率間隔是用於描述信號性質之時間-頻率平面的感知激勵區塊(tiling)的一部分。
因此,共變異數矩陣指定為:
其中。
共變異數矩陣通常由SAOC解碼器處理及混合工具480使用以便獲得通道信號484a至484N。
對角元素可在SAOC解碼器側用OLD資料直接重建,及非對角元素由物件間互相關(OLC)來指定:
ρ mn
=∥s m
∥‧∥s n
∥‧IOC mn
應指出的是,物件層級差值描述sm
及sn
。
表達整個共變異數矩陣所需要的物件間互相關值數目是N*N/2-N/2。由於此數可為大(例如,對於物件信號的一大數N),導致高位元要求,SAOC編碼器410(以及音訊信號編碼器200)能可取捨地僅傳輸針對物件對之信號示意為彼此「有關」的選定物件間互相關值。此可取捨「有關」資訊例如在位元串流的一SAOC特定組態句法元素中靜態表達,該SAOC特定組態句法元素例如可用“SAOCSpecificConfig()”標示。彼此無關的物件舉例而言被假定為不相關,亦即它們的物件間互相關等於零。
然而,存在所有物件(或幾乎所有物件)彼此相關的應用情形。此一應用情形的一範例是一電話會議,其中一麥克風設置與室內聲學具有高程度的麥克風間串擾。在這些情況中,傳輸所有IOC值將是必需的(如果使用上面提到的習知機制),但通常會超出期望位元預算。作為選替方法,假定所有物件不互相關會導致模型中出現大錯及因而會產生渲染場景的次佳音訊品質。
所提出方法的基本設想是,對於某些SAOC應用情形,不互相關的聲音源因它們所處的聲學環境及因所應用的記錄技術而產生互相關的SAOC輸入物件。
例如考慮一電話會議設置,雖然個別物件的談話不互相關,但個別揚聲器的室內回響與不完美隔離的影響造成了互相關的SAOC物件。這些聲學情況及生成的互相關可用一單一頻率與時間變化值來近似描述。
因而,所提出的方法成功規避了表達所有期望物件互相關的高位元率要求。這可藉由在SAOC編碼器(參見第4圖)的一專用「單一IOC計算器」模組448中計算一依單一時間/頻率而定的單一IOC值來完成。使用「單一IOC」特徵在SAOC資訊中信號示意(例如,使用位元串流信令參數“bsOneIOC”)。每時間/頻率區塊的單一IOC值進而代替所有單獨的IOC值被傳輸(例如,使用共用物件間互相關位元串流參數值)。
在一典型應用中,位元串流標頭(例如,依據非預先公開SAOC標準[SAOC]的“SAOCSpecificConfig()”元素)包括一位元,其指示是使用「單一IOC信令」還是「一般」IOC信令。有關此問題的一些細節將在下面討論。
酬載訊框資料(例如,非預先公開SAOC標準[SAOC]中的“SAOCFrame()”元素)進而包括所有物件共用的IOC或幾個IOC,視「單一IOC」或「一般」模式而定。
因此,針對解碼器中酬載資料的一位元串流剖析器(其可以是SAOC解碼器的一部分)可依據如下範例(其以偽C程式碼公式化)來設計:
依據上面範例,位元串流剖析器檢查是否一旗標“iocMode”(在下面亦用“bsOneIOC”標示)指示僅有一單一物件間互相關位元串流參數值(其由參數值“SINGLE_IOC”信號示意)。如果位元串流剖析器發現僅有一單一物件間互相關值,位元串流剖析器自位元串流讀取一物件間互相關資料單元(亦即,一物件間互相關位元串流參數值),這用操作“readIocDataFromBitstream(1)”來指示。反之,如果位元串流剖析器發現旗標“iocMode”未指示使用一單一(共用)物件間互相關值,位元串流剖析器自位元串流讀取一些不同物件間互相關資料單元(例如,多個物件間互相關位元串流參數值),這用函數“readIocDataFromBitstream(numberOfTransmittedIocs)”來指示。在此情況中讀取的物件間互相關資料單元的數目(“numberOfTransmittedIocs”)通常由若干對相關音訊物件來決定。
可選擇地,「單一IOC」信令可在酬載訊框中(例如,在非預先公開SAOC標準的所謂“SAOCFrame()”元素中)呈現以在每訊框基礎上能夠於單一IOC模式與一般IOC模式間動態切換。
下面將描述單一IOC(IOCsingle
)計算的一些較佳實施。
在SAOC編碼器410的一較佳實施例中,共用物件間互相關位元串流參數值IOCsingle
可依據下列方程式來計算:
其中交功率項
其中n與k是SAOC參數所應用的時間與頻率實例(或時間與頻率指數)。
換言之,共用物件間互相關位元串流參數值IOCsingle
可根據交功率項nrgij
(其中物件指數i通常與物件指數j不相同)的和與平均能量值(該平均能量值表示能量值nrgii
與能量值nrgjj
間的一幾何平均值)的和之間的比值而計算。
例如可對所有對不同音訊物件或僅對諸對相關音訊物件執行求和。
交功率項nrgij
可形成為例如針對複數時間實例(具有時間指數n)及/或複數頻率實例(具有頻率指數k),與所考慮的該對音訊物件的音訊物件信號相關聯之頻譜係數si n,k
、sj n,k
的複共軛乘積(其中一因數取複共軛)的和。
該比值的一實數部分可形成(例如,透過一操作RE{})以便擁有上面方程式所示的一實數值共用物件間互相關位元串流參數值IOCsingle
。
在另一較佳實施例中,依據下式可選擇一常數值c來獲得共用物件間互相關位元串流參數值
IOCsingle
=c,
其中c是一常數。
此常數c可例如描述一電話會議發生時具有特定聲學(回響數量)之室內的一依時間及頻率而定的串擾。
常數c可例如依據對室內聲學的評估而設定,這可由SAOC編碼器來執行。可選擇地,常數c可經由一使用者介面來輸入,或可在SAOC編碼器410中預先決定。
下面將描述如何可獲得所有物件對的物件間互相關值。
在解碼器側(例如,在SAOC解碼器420),單一物件間互相關(位元串流)參數(IOCsingle
)用來決定所有物件對的物件間互相關值。這在例如「單一IOC擴充器」模組474(參見第4圖)中完成。
一較佳方法是一簡單複製操作。複製可被應用而用或不用考慮例如在SAOC位元串流標頭(例如,在部分“SAOCSpecificConfiguration()”)中表達的「有關」資訊。
在一較佳實施例中,沒有「有關」資訊的一複製(亦即,不傳送或考慮一「有關」資訊)能以下列方式來執行:
對於所有m、n,其中m≠n IOCmn
=IOCsingle
,
因而,針對諸對不同音訊物件的所有物件間互相關值可設為共用物件間互相關(位元串流)參數值。
在另一較佳實施例中,帶有「有關」資訊(亦即,計入一「有關」資訊)的一複製以下列方式來執行:
因此,如果物件關係資訊“relatedTo(m,n)”指示音訊物件彼此相關,與一對音訊物件(具有音訊物件指數m及n)相關聯之一或甚至兩物件間互相關值被設為例如由共用物件間互相關位元串流參數值所指定的值IOCsingle
。不然,亦即,如果物件關係資訊“relatedTo(m,n)”指示一對音訊物件的音訊物件無關,與該對音訊物件相關聯之一或甚至兩物件間互相關值被設為一預定值,例如零。
然而,不同分配方法是可能的,例如,計入物件功率。舉例而言,有關於具有相對低功率的物件之物件間互相關值可設為高值,諸如1(全互相關),以使SAOC解碼器中解相關濾波器的影響最小。
下面將描述使用依據第5及6圖的位元串流句法元素之一音訊信號解碼器的一解碼器構想。這裡應指出的是,將參考第5及6圖來描述的位元串流句法及位元串流評估構想可應用於,例如依據第1圖的音訊信號解碼器100及依據第4圖的音訊信號解碼器420中。此外,應指出的是,依據第2圖的音訊信號編碼器200及依據第4圖的音訊信號解碼器410可適於提供關於第5與6圖所討論的位元串流句法元素。
因此,包含下混信號表示型態110及物件相關參數資訊112的位元串流及/或位元串流表示型態220及/或位元串流300及/或包含下混資訊430及旁側資訊432的一位元串流可依據下面的說明來提供。
可由上述SAOC編碼器提供及由上述SAOC解碼器評估的一SAOC位元串流可包含一SAOC特定組態部分,其將在下面參考第5圖而描述,第5圖繪示此一SAOC特定組態部分“SAOCSpecificConfig()”的一句法表示型態。
SAOC特定組態資訊包含例如取樣頻率組態資訊,其描述一音訊信號編碼器所使用及/或一音訊信號解碼器所使用的取樣頻率。SAOC特定組態資訊亦包含一低延遲模式組態資訊,其描述是否一低延遲模式已被一音訊信號編碼器使用及/或應被一音訊信號解碼器使用。SAOC特定組態資訊亦包含一頻率解組態資訊,其描述由一音訊信號編碼器所使用及/或由一音訊信號解碼器所使用的一頻率解。SAOC特定組態資訊亦包含一訊框長度組態資訊,其描述由SAOC編碼器所使用及/或由SAOC解碼器所使用之音訊訊框的一訊框長度。SAOC特定組態資訊亦包含一物件數目組態資訊,其描述音訊物件數目。此物件數目組態資訊(其亦用“bsNumObjects”標示)例如描述上面已使用的值N。
SAOC特定組態資訊亦包含一物件關係組態資訊。舉例而言,針對每一對不同音訊物件可有一位元串流位元。然而,音訊物件的關係可例如用一平方N×N矩陣來表示,該矩陣針對音訊物件的每一組合有一個一位元項。描述一物件與其自身的關係之該矩陣的項,亦即,對角元素,可設為一,這指示一物件有關於自身。兩項,即具有一第一指數i及一第二指數j的一第一項,與具有一第一指數j及一第二指數i的一第二項,可與具有音訊物件指數i及j的每一對不同音訊物件相關聯。因此,一單一位元串流位元決定物件關係矩陣之兩項的值,它們被設為相同的值。
如可見,一第一音訊物件指數i自i=0移至i=bsNumObjects(外for循環)。對於i的所有值,一對角項“bsRelatedTo[i][i]”被設為一。對於一第一音訊物件指數i,描述音訊物件i與音訊物件j(具有音訊物件指數j)的關係之位元在j=i+1至j=bsNumObjects時被包括於位元串流中。因此,描述具有音訊物件指數i及j的音訊物件之間的關係之關係矩陣“bsRelatedTo[i][j]”的項設為在位元串流中指定的值。此外,一物件關係矩陣項“bsRelatedTo[j][i]”設為同一值,亦即設為矩陣項“bsRelatedTo[i][j]”的值。獲取詳情,參考第5圖的句法表示型態。
SAOC特定組態資訊亦包含一絕對能量傳輸組態資訊,其描述是否一音訊編碼器已將一絕對能量資訊包括於位元串流中,及/或是否一音訊解碼器應評估包括於位元串流中的一絕對能量傳輸組態資訊。
SAOC特定組態資訊亦包含一下混通道數目組態資訊,其描述由音訊編碼器所使用的及/或由音訊解碼器所使用的下混通道數目。SAOC特定組態資訊亦可包含額外組態資訊,其在本申請案中不相關且能可取捨地省略。
SAOC特定組態資訊亦包含一共用物件間互相關組態資訊(文中亦標示為一「位元串流信令參數」),其描述是否一共用物件間互相關位元串流參數值被包括於SAOC位元串流中,或是否物件對個別的物件間互相關位元串流參數值被包括於SAOC位元串流中,該共用物件間互相關組態資訊可例如用“bsOneIOC”標示,且可以是一個一位元值。
SAOC特定組態資訊亦可包含一失真控制單元組態資訊。
此外,SAOC特定組態資訊可包含一或多個填充位元,其用“ByteAlign()”標示,且可用來調整SAOC特定組態資訊的長度。此外,SAOC特定組態資訊可包含可取捨的額外組態資訊“SAOCExtensionConfig()”,其在本申請案中是不相關的及因為此原因將不在這裡討論。
這裡應指出的是,SAOC特定組態資訊可包含比上述組態資訊更多或更少的資訊。換言之,一些上述組態資訊在一些實施例中可省略,及在一些實施例中亦可包括額外組態資訊。
然而,應指出的是,SAOC特定組態資訊可例如被包括於一SAOC位元串流中(每段音訊一次)。然而,SAOC特定組態資訊能可取捨地更經常包括於位元串流中。
但是,SAOC特定組態資訊通常被提供用於複數SAOC訊框,因為SAOC特定組態資訊提供一顯著的位元載入負擔。
下面將參考第6圖描述一SAOC訊框的句法,第6圖繪示此一SAOC訊框的一句法表示型態。SAOC訊框包含編碼的物件層級差值OLD,其可逐頻帶及每音訊物件包括進來。
SAOC訊框亦包含編碼的絕對能量值NRG,其可作為可取捨的,且可逐頻帶包括進來。
SAOC訊框亦包含編碼的物件間互相關值IOC,其可逐頻帶提供,亦即對複數頻帶及對複數音訊物件組合個別地提供。
下面將就由剖析位元串流之一位元串流剖析器可執行的操作來描述位元串流。
位元串流剖析器可例如在一第一準備步驟將變數k,iocldx1、iocldx2初始化為零值。
隨後,位元串流剖析器可對在i=0與i=bsNumObjects之間的第一音訊物件指數i的複數值執行剖析(外部for循環)。位元串流剖析器可例如將一物件間互相關指數值idxIoc[i][i]設為零(指示一全互相關),該物件間互相關指數值idxIoc[i][i]描述具有音訊物件指數i的音訊物件與自身之間的關係。
隨後,一位元串流剖析器可對在i+1與bsNumObjects之間的一第二音訊物件指數評估位元串流。如果具有音訊物件指數i與j的音訊物件相關,它們由物件關係矩陣項“bsRelatedTo[i][j]”的一非零值來指示,位元串流剖析器執行一演算法610,不然,位元串流剖析器將與具有音訊物件指數i及j的音訊物件相關聯之物件間互相關指數設為五(操作“idxIOC[i][j]=5”),這描述一零相關。因而,對於物件關係矩陣指示沒有關係的諸對音訊物件,物件間互相關值設為零。然而,對於相關的諸對音訊物件,包括於SAOC特定組態中的位元串流信令參數“bsOneIOC”被評估以決定如何繼續進行。如果位元串流信令參數“bsOneIOC”指示有物件對個別的物件間互相關位元串流參數值,對“numBands”頻帶使用函數“EcDataSaoc”自位元串流擷取複數物件間關係指數idxIOC[i][j](其可作為物件間關係位元串流參數值),其中該函數可用來解碼物件間關係指數。
然而,如果位元串流信令參數“bsOneIOC”指示一共用物件間互相關位元串流參數值被用於複數對音訊物件,及id位元串流參數“bsRelatedTo[i][j]”指示具有音訊物件指數i及j的音訊物件相關,對複數numBands頻帶使用函數“EcDataSaoc”自位元串流讀取一單一組複數物件間互相關指數idxIOC[i][j],其中對任一指定頻帶僅讀取一單一物件間互相關指數。然而,在再執行演算法610之後,先前讀取的一物件間互相關指數idxIOC[iocldx1][iocldx2]被複製而不用評估位元串流。這藉由使用變數k來保證,變數k初始化為零且在評估第一組物件間互相關指數idxIOC[i][j]之後增加。
總之,對於每一兩音訊物件組合,首先評估此一組合的兩音訊物件是否被信號示意為彼此相關(例如,藉由檢查值「bsRelatedTo[i][j]是否取零值」)。如果該對音訊物件的音訊物件相關,執行進一步處理610。不然,與此對(實質上無關)音訊物件相關聯之值“idxIOC[i][j]”設為一預定值,例如指示一零物件間互相關的一預定值。
在處理610,如果信令“bsOneIOC”是不活動的,對每一對音訊物件(信號示意包含相關音訊物件)自位元串流讀取一位元串流值。不然,亦即,如果信令“bsOneIOC”是活動的,僅讀取一對音訊音訊物件的一位元串流值,及藉由將指數值iocldx1及iocldx2設為在此讀出值的點來維持對該單一對的引用。如果信令“bsOneIOC”是活動的,該單一讀出值被再用於其它對音訊物件(信號示意為彼此相關)。
最後,亦確保同一物件間互相關指數值與兩指定不同音訊物件的兩組合相關聯,而不論兩指定音訊物件中哪一個是第一音訊物件及兩指定音訊物件中哪一個是第二音訊物件。
此外,應注意的是,SAOC訊框通常在每一音訊物件的基礎上包含編碼的下混增益值(DMG)。
此外,SAOC訊框通常包含編碼的下混通道層級差(DCLD),其在每一音訊物件的基礎上能可取捨地被包括。
SAOC訊框進一步可取捨地包含編碼的後處理下混增益值(PDG),其可按一逐頻帶方式及每下混通道而被包括。
此外,SAOC訊框可包含編碼的失真控制單元參數,其決定失真控制量測的應用。
再者,SAOC訊框可包含一或多個填充位元“ByteAlign()”。
此外,一SAOC訊框可包含擴展資料“SAOCExtensionFrame()”,然而其在本申請案是不相關的且因為此原因將不在這裡詳細討論。
現在參考第7圖,將討論用以有利量化物件間互相關參數的一範例。
如可見,第7圖表格的一第一列710描述量化指數idx,其在零與七的範圍間。此量化指數可分配給變數“idxIOC[i][j]”。第7圖表格的一第二列720繪示相關聯的物件間互相關值,且在-0.99與1的範圍間。因此,參數值“idxIOC[i][j]”可使用第7圖表格的映射而映射至經反向量化的物件間互相關值。
總之,一SAOC組態部分“SAOCSpecificConfig()”較佳地包含一位元串流參數“bsOneIOC”,其指示是否僅傳送彼此有關係(由“bsRelatedTo[i][j]=1”信號示意)之所有物件共用的一單一IOC參數。物件間互相關值以編碼形式“EcDataSaoc(IOC,k,numBands)”被包括於位元串流中。一陣列“idxIOC[i][j]”係基於一或多個編碼的物件間互相關值而填充。陣列“idxIOC[i][j]”的項使用第7圖的映射表格而被映射至經反向量化的值。經反向量化的物件間互相關值(用OLDi,j
來標示)被用來獲得一共變異數矩陣的項。為此目的,亦應用經反向量化的物件層級差參數,它們用OLDi
來標示。
具有元素ei,j
大小為N×N的共變異數矩陣E
表示初始信號共變異數矩陣E SS *
的一近似矩陣,且由OLD及IOC參數獲得
雖然在一裝置的脈絡中已描述了一些層面,但顯然這些層面也表示對相對應方法的說明,其中一區塊或一裝置對應於一方法步驟或一方法步驟的一特徵。類似地,在一方法步驟的脈絡中所描述的層面也表示對一相對應裝置的一相對應區塊或項目或特徵之一說明,一些或所有方法步驟可由(或使用)一硬體裝置來執行,如舉例而言,微處理器、可程式化電腦或電子電路。在一些實施例中,某一或多個最重要方法步驟可由此一裝置來執行。
發明的編碼音訊信號可被儲存於一數位儲存媒體上或能以一傳輸媒介傳輸,諸如無線傳輸媒介或諸如網際網路之有線傳輸媒介。
視某些實施需求而定,發明實施例可在硬體或軟體中實施。使用儲存有電子可讀取控制信號之一數位儲存媒體,例如軟碟、DVD、藍光、CD、ROM、PROM、EPROM、EEPROM或快閃記憶體可執行該實施,該等電子可讀取控制信號與一可程式化電腦系統合作(或能夠合作)使得各自的方法被執行。因此,該數位儲存媒體可以是電腦可讀取的。
依據本發明的一些實施例包含具有電子可讀取控制信號的一資料載體,該等電子可讀取控制信號能夠與一可程式化電腦系統合作使得本文所予以描述之方法當中之一方法被執行。
大體上,本發明之實施例可作為具有一程式碼的一電腦程式產品而被實施,當該電腦程式產品運行於一電腦上時,該程式碼可操作用於執行該等方法當中之一方法。該程式碼可例如被儲存於一機器可讀取載體上。
其它實施例包含儲存於一機器可讀取媒體上、用於執行本文所予以描述之該等方法當中之一方法的電腦程式。
換言之,發明方法的一實施例因而是一電腦程式,具有當該電腦程式運行於一電腦上時用以執行本文所予以描述之該等方法當中之一方法的一程式碼。
發明方法的一進一步實施例因而是一資料載體(或一數位儲存媒體或一電腦可讀取媒體),其包含記錄於其上用以執行本文所予以描述之該等方法當中之一方法的電腦程式。
發明方法的一進一步實施例因而是一資料串流或一信號序列,表示用於執行本文所予以描述之該等方法當中之一方法的電腦程式。該資料串流或該信號序列可例如被組配來經由一資料通訊連接(例如經由網際網路)來被傳遞。
一進一步的實施例包含一處理裝置,例如一電腦,或一可程式化邏輯裝置,其被組配來或適於執行本文所予以描述之該等方法當中之一方法。
一進一步的實施例包含一上面安裝有用以執行本文所予以描述之該等方法當中之一方法的電腦程式之電腦。
在一些實施例中,一可程式化邏輯裝置(例如,一現場可程式化閘陣列)可被用來執行本文所予以描述之該等方法的一些或所有功能。在一些實施例中,一現場可程式化閘陣列可與一微處理器合作以便執行本文所予以描述之該等方法當中之一方法。大體上,該等方法較佳地被任一硬體裝置執行。
上述實施例僅僅是為了說明本發明的原理。要明白的是,對本文所予以描述之安排與細節的修改或改變對其他熟於此技者而言將是顯而易見的。因而,意圖是僅受後附的申請專利範圍之範圍限制而不受以本文實施例的說明與闡述方式呈現之特定細節限制。
[BCC] C. Faller and F. Baumgarte,“Binaural Cue Coding-Part II: Schemes and applications,”IEEE Trans. on Speech and Audio Proc.,vol. 11,no. 6,Nov. 2003
[JSC] C. Faller,“Parametric Joint-Coding of Audio Sources”,120th AES Convention,Paris,2006,Preprint 6752
[SAOC1] J. Herre,S. Disch,J. Hilpert,O. Hellmuth: "From SAC To SAOC-Recent Developments in Parametric Coding of Spatial Audio",22nd Regional UK AES Conference,Cambridge,UK,April 2007
[SAOC2] J. Engdegrd,B. Resch,C. Falch,O. Hellmuth,J. Hilpert,A. Hlzer,L. Terentiev,J. Breebaart,J. Koppens,E. Schuijers and W. Oomen: "Spatial Audio Object Coding(SAOC)-The Upcoming MPEG Standard on Parametric Object Based Audio Coding",124th AES Convention,Amsterdam 2008,Preprint 7377
[SAOC] ISO/IEC,“MPEG audio technologies-Part 2: Spatial Audio Object Coding(SAOC).”ISO/IEC JTC1/SC29/WG11(MPEG) FCD 23003-2.
100...音訊信號解碼器
110、430...下混信號表示型態
112...物件相關參數資訊
120...渲染資訊
130...上混信號表示型態
140...物件參數決定器
142...物件間互相關值
150...信號處理器
200...音訊信號編碼器
210a~210N、420a~420N...音訊物件信號
220...位元串流表示型態
230...下混器
232、812、912...下混信號
240...參數提供器
242...共用物件間互相關位元串流參數值
244、322...位元串流信令參數
250...位元串流格式器
300...位元串流
310...下混信號表示型態
320...物件相關參數旁側資訊
324a...個別物件間互相關位元串流參數值
400...MPEG SAOC系統
410...SAOC編碼器
420...SAOC解碼器
432...旁側資訊
440...SAOC下混處理工具
444...參數擷取器
448...單一物件間互相關計算器
452...單一物件間互相關信令
456...量化器
460...無雜訊編碼工具
464...無雜訊解碼工具
466...解碼的旁側資訊
468...反量化器
470...反量化參數
474...單一物件間互相關擴充器
480...SAOC解碼器處理及混合工具
482...互動資訊
484a~484N...通道信號、通道
610...演算法、處理
800、900、930、960...MPEG SAOC系統
810、910...SAOC編碼器
814、914...旁側資訊
820、920、950...SAOC解碼器
820a...物件分離器
820b、924...經重建物件信號
820c...混合器
822...使用者互動資訊/使用者控制資訊
922...物件解碼器
926...混合器、渲染器
928、958...上混通道信號
980...SAOC至MPEG環繞轉碼器
982...旁側資訊轉碼器
984...MPEG環繞旁側資訊、MPEG環繞位元串流
986...下混信號操控器
988...下混信號表示型態
第1圖繪示依據本發明之一實施例之一音訊信號解碼器的一方塊示意圖;
第2圖繪示依據本發明之一實施例之一音訊信號編碼器的一方塊示意圖;
第3圖繪示依據本發明之一實施例之一位元串流的一示意表示型態;
第4圖繪示使用一單一物件間互相關參數計算之一MPEG SAOC系統的一方塊示意圖;
第5圖繪示一SAOC特定組態資訊的一句法表示型態,其可以是一位元串流的一部分;
第6圖繪示一SAOC訊框資訊的一句法表示型態,其可以是一位元串流的一部分;
第7圖繪示表示對物件間互相關參數的一參數量化的一表;
第8圖繪示一參考MPEG SAOC系統的一方塊示意圖;
第9a圖繪示使用一分離的解碼器及混合器之一參考SAOC系統的一方塊示意圖;
第9b圖繪示使用一整合的解碼器及混合器之一參考SAOC系統的一方塊示意圖;
第9c圖繪示使用一SAOC至MPEG轉碼器之一參考SAOC系統的一方塊示意圖。
100‧‧‧音訊信號解碼器
110‧‧‧下混信號表示型態
112‧‧‧物件相關參數資訊
120‧‧‧渲染資訊
130‧‧‧上混信號表示型態
140‧‧‧物件參數決定器
142‧‧‧物件間互相關值
150‧‧‧信號處理器
Claims (19)
- 一種用以基於一下混信號表示型態及一物件相關參數資訊並依一渲染資訊而定來提供一上混信號表示型態之音訊信號解碼器,該音訊信號解碼器包含:一物件參數決定器,其組配來獲得複數對音訊物件的物件間互相關值,其中該物件參數決定器組配來評估一位元串流信令參數以便決定是評估個別物件間互相關位元串流參數值來獲得複數對相關音訊物件的物件間互相關值,還是使用一共用物件間互相關位元串流參數值來獲得該等複數對相關音訊物件的物件間互相關值;及一信號處理器,其組配來基於該下混信號表示型態並使用該等複數對相關音訊物件的該等物件間互相關值及該渲染資訊來獲得該上混信號表示型態。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該物件參數決定器組配來評估一物件關係資訊,其描述是否兩音訊物件彼此相關;及其中該物件參數決定器組配來使用該共用物件間互相關位元串流參數值選擇性獲得該物件關係資訊指示有關係之諸對音訊物件的物件間互相關值,並將該物件關係資訊指示沒有關係之諸對音訊物件的物件間互相關值設為一預定值。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該物件參數決定器組配來評估對不同音訊物件的每一組 合包含一個一位元旗標之一物件關係資訊,其中與不同音訊物件的一指定組合相關聯之該一位元旗標指示該指定組合的該等音訊物件是否相關。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該物件參數決定器組配來將針對所有對不同相關音訊物件的該物件間互相關值設為由該共用物件間互相關位元串流參數值所定義的一共用值,或由該共用物件間互相關位元串流參數值所定義的該共用值推導出的一值。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該物件參數決定器包含一位元串流剖析器,其組配來剖析一音訊內容的一位元串流表示型態,以獲得該位元串流信令參數及該個別物件間互相關位元串流參數值或該共用物件間互相關位元串流參數值。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該音訊信號解碼器組配來:將與該等相關音訊物件中之一對相關聯之一物件間互相關值,和描述該等相關音訊物件中之該對之一第一音訊物件的一物件層級之一物件層級差值、及描述該等相關音訊物件中之該對之一第二音訊物件的一物件層級之一物件層級差值組合,以獲得與該等相關音訊物件中之該對相關聯之一共變異數值。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該音訊信號解碼器組配來處理三或更多個音訊物件;及其中該物件參數決定器組配來對每一對不同音訊物件提供一物件間互相關值。
- 如申請專利範圍第1項所述之音訊信號解碼器,其中該物件參數決定器組配來評估包括於一組態位元串流部分中之一位元串流信令參數,以便決定是評估個別物件間互相關參數值來獲得該等複數對相關音訊物件的物件間互相關值,還是使用一共用物件間互相關位元串流參數值來獲得該等複數對相關音訊物件的物件間互相關值;及其中該物件參數決定器組配來評估包括於該組態位元串流部分中的一物件關係資訊,以決定兩音訊物件是否相關;及其中該物件參數決定器組配來,如果決定使用一共用物件間互相關位元串流參數值來獲得該等複數對相關音訊物件的物件間互相關值,則評估包括於該音訊內容的每一訊框的一訊框資料位元串流部分中之一共用物件間互相關位元串流參數值。
- 一種用以基於複數音訊物件信號提供一位元串流表示型態之音訊信號編碼器,該音訊信號編碼器包含:一下混器,其組配來基於該等音訊物件信號及依描述該等音訊物件信號對一下混信號的一或多個通道的貢獻之下混參數來提供該下混信號;一參數提供器,其組配來提供與複數對相關音訊物件信號相關聯之一共用物件間互相關位元串流參數值,及亦提供一位元串流信令參數,該位元串流信令參數指示該共用物件間互相關位元串流參數值被提供來 代替複數個別物件間互相關位元串流參數值;及一位元串流格式器,其組配來提供一位元串流,該位元串流包含該下混信號的一表示型態、該共用物件間互相關位元串流參數值的一表示型態及該位元串流信令參數。
- 如申請專利範圍第9項所述之音訊信號編碼器,其中該參數提供器組配來依交功率項的和與平均功率項的和之間的一比值來提供該共用物件間互相關位元串流參數值。
- 如申請專利範圍第10項所述之音訊信號編碼器,其中該參數提供器組配來,藉由對複數時間實例或對複數頻率實例,評估與一指定對音訊物件的該等音訊物件相關聯之頻譜係數的乘積和來計算該指定對音訊物件的該交功率項;及其中該參數提供器組配來,藉由評估對複數時間實例或對複數頻率實例表示一第一音訊物件的功率之一功率值,與對複數時間實例或對複數頻率實例表示一第二音訊物件的功率之一功率值的一幾何平均值,來計算一指定對音訊物件的該平均功率項。
- 如申請專利範圍第10項所述之音訊信號編碼器,其中該參數提供器組配來依據下式提供一共用物件間互相關位元串流參數值IOCsingle :
其中, 其中n與k描述該SAOC參數所應用的時間與頻率實例;及其中si n,k 是與具有音訊物件指數i的該音訊物件之時間實例n及頻率實例k相關聯的一頻譜值;sj nk 是與具有音訊物件指數j的該音訊物件之時間實例n及頻率實例k相關聯的一頻譜值;其中N標示音訊物件總數。 - 如申請專利範圍第9項所述之音訊信號編碼器,其中該參數提供器組配來提供一預定常數值作為該共用物件間互相關位元串流參數值。
- 如申請專利範圍第9項所述之音訊信號編碼器,其中該參數提供器組配來亦提供描述兩音訊物件是否彼此相關之一物件關係資訊。
- 如申請專利範圍第14項所述之音訊信號編碼器,其中該參數提供器組配來選擇性評估該物件關係資訊指示有關係之音訊物件的一物件間互相關性,以計算該共用物件間互相關位元串流參數值。
- 一種用以基於一下混信號表示型態及一物件相關參數資訊並依一渲染資訊而定來提供一上混信號表示型態 之方法,該方法包含以下步驟:獲得複數對音訊物件的物件間互相關值,其中一位元串流信令參數被評估以便決定是評估個別物件間互相關位元串流參數值來獲得複數對相關音訊物件的物件間互相關值,還是使用一共用物件間互相關位元串流參數值來獲得該等複數對相關音訊物件的物件間互相關值;及基於該下混信號表示型態並使用該等複數對相關音訊物件的該等物件間互相關值及該渲染資訊來獲得該上混信號表示型態。
- 一種用以基於複數音訊物件信號提供一位元串流表示型態之方法,該方法包含以下步驟:基於該等音訊物件信號並依描述該等音訊物件信號對一下混信號的一或多個通道的貢獻之下混參數來提供該下混信號;及提供與複數對相關音訊物件信號相關聯之一共用物件間互相關位元串流參數值;及提供一位元串流信令參數,其指示該共用物件間互相關位元串流參數值被提供來代替複數個別物件間互相關位元串流參數值;及提供一位元串流,該位元串流包含該下混信號的一表示型態、該共用物件間互相關位元串流參數值的一表示型態及該位元串流信令參數。
- 一種當運行於一電腦上時用以執行如申請專利範圍第 16項或第17項所述之方法的電腦程式。
- 一種機器可存取媒體,其承載表示一個多通道音訊信號之位元串流,該位元串流包含:將複數音訊物件的音訊信號組合之一下混信號的一表示型態;及描述該等音訊物件的特性之一物件相關參數旁側資訊,其中該物件相關參數旁側資訊包含一位元串流信令參數,其指示該位元串流是包含個別物件間互相關位元串流參數值還是一共用物件間互相關位元串流參數值。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US24668109P | 2009-09-29 | 2009-09-29 | |
| EP10171406 | 2010-07-30 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201120874A TW201120874A (en) | 2011-06-16 |
| TWI463485B true TWI463485B (zh) | 2014-12-01 |
Family
ID=43085706
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW099132785A TWI463485B (zh) | 2009-09-29 | 2010-09-28 | 音訊信號解碼器或編碼器、用以提供上混信號表示型態或位元串流表示型態之方法、電腦程式及機器可存取媒體 |
Country Status (17)
| Country | Link |
|---|---|
| US (4) | US9460724B2 (zh) |
| EP (2) | EP2483887B1 (zh) |
| JP (1) | JP5576488B2 (zh) |
| KR (1) | KR101391110B1 (zh) |
| CN (1) | CN102667919B (zh) |
| AR (1) | AR078474A1 (zh) |
| AU (1) | AU2010303039B9 (zh) |
| BR (1) | BR112012007138B1 (zh) |
| CA (1) | CA2775828C (zh) |
| ES (1) | ES2644520T3 (zh) |
| MX (1) | MX2012003785A (zh) |
| MY (1) | MY165328A (zh) |
| PL (2) | PL3093843T3 (zh) |
| PT (1) | PT2483887T (zh) |
| RU (1) | RU2576476C2 (zh) |
| TW (1) | TWI463485B (zh) |
| WO (1) | WO2011039195A1 (zh) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20230386485A1 (en) * | 2014-07-28 | 2023-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor , a time domain processor, and a cross processing for continuous initialization |
Families Citing this family (45)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| PL3093843T3 (pl) * | 2009-09-29 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder sygnału audio MPEG-SAOC, koder sygnału audio MPEG-SAOC, sposób dostarczania reprezentacji sygnału upmixu z wykorzystaniem dekodowania MPEG-SAOC, sposób dostarczania reprezentacji sygnału downmixu z wykorzystaniem dekodowania MPEG-SAOC oraz program komputerowy wykorzystujący wspólną wartość parametru korelacji międzyobiektowej zależną od czasu/częstotliwości |
| CN104822036B (zh) | 2010-03-23 | 2018-03-30 | 杜比实验室特许公司 | 用于局域化感知音频的技术 |
| US10158958B2 (en) | 2010-03-23 | 2018-12-18 | Dolby Laboratories Licensing Corporation | Techniques for localized perceptual audio |
| KR20120071072A (ko) * | 2010-12-22 | 2012-07-02 | 한국전자통신연구원 | 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법 |
| US9754595B2 (en) * | 2011-06-09 | 2017-09-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding 3-dimensional audio signal |
| PL2740222T3 (pl) | 2011-08-04 | 2015-08-31 | Dolby Int Ab | Usprawniony stereofoniczny radiowy odbiornik FM poprzez użycie stereo parametrycznego |
| EP2560161A1 (en) * | 2011-08-17 | 2013-02-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Optimal mixing matrices and usage of decorrelators in spatial audio processing |
| JP6096789B2 (ja) | 2011-11-01 | 2017-03-15 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | オーディオオブジェクトのエンコーディング及びデコーディング |
| KR101662680B1 (ko) * | 2012-02-14 | 2016-10-05 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 멀티-채널 오디오 신호의 적응적 다운-믹싱 및 업-믹싱을 수행하기 위한 방법 및 장치 |
| RU2643644C2 (ru) * | 2012-07-09 | 2018-02-02 | Конинклейке Филипс Н.В. | Кодирование и декодирование аудиосигналов |
| US9190065B2 (en) * | 2012-07-15 | 2015-11-17 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients |
| US9489954B2 (en) * | 2012-08-07 | 2016-11-08 | Dolby Laboratories Licensing Corporation | Encoding and rendering of object based audio indicative of game audio content |
| US9373335B2 (en) | 2012-08-31 | 2016-06-21 | Dolby Laboratories Licensing Corporation | Processing audio objects in principal and supplementary encoded audio signals |
| WO2014108738A1 (en) * | 2013-01-08 | 2014-07-17 | Nokia Corporation | Audio signal multi-channel parameter encoder |
| US10178489B2 (en) * | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
| BR112015025080B1 (pt) | 2013-04-05 | 2021-12-21 | Dolby International Ab | Método de decodificação e decodificador para decodificar dois sinais de áudio, método de codificação e codificador para codificar dois sinais de áudio, e meio legível não transitório |
| TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
| EP2804176A1 (en) * | 2013-05-13 | 2014-11-19 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio object separation from mixture signal using object-specific time/frequency resolutions |
| CN105229733B (zh) * | 2013-05-24 | 2019-03-08 | 杜比国际公司 | 包括音频对象的音频场景的高效编码 |
| CN105247611B (zh) | 2013-05-24 | 2019-02-15 | 杜比国际公司 | 对音频场景的编码 |
| EP3270375B1 (en) | 2013-05-24 | 2020-01-15 | Dolby International AB | Reconstruction of audio scenes from a downmix |
| BR112015028914B1 (pt) * | 2013-05-24 | 2021-12-07 | Dolby International Ab | Método e aparelho para reconstruir um bloco de tempo/frequência de objetos de áudio n, método e codificador para gerar pelo menos um parâmetro de ponderação, e meio legível por computador |
| CN104240711B (zh) * | 2013-06-18 | 2019-10-11 | 杜比实验室特许公司 | 用于生成自适应音频内容的方法、系统和装置 |
| EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
| EP2830045A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Concept for audio encoding and decoding for audio channels and audio objects |
| EP2830051A3 (en) | 2013-07-22 | 2015-03-04 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder, methods and computer program using jointly encoded residual signals |
| EP2830050A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for enhanced spatial audio object coding |
| EP2830049A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient object metadata coding |
| KR102243395B1 (ko) * | 2013-09-05 | 2021-04-22 | 한국전자통신연구원 | 오디오 부호화 장치 및 방법, 오디오 복호화 장치 및 방법, 오디오 재생 장치 |
| WO2015059154A1 (en) | 2013-10-21 | 2015-04-30 | Dolby International Ab | Audio encoder and decoder |
| US9911423B2 (en) | 2014-01-13 | 2018-03-06 | Nokia Technologies Oy | Multi-channel audio signal classifier |
| EP2928216A1 (en) * | 2014-03-26 | 2015-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for screen related audio object remapping |
| CN105989845B (zh) | 2015-02-25 | 2020-12-08 | 杜比实验室特许公司 | 视频内容协助的音频对象提取 |
| WO2016173659A1 (en) * | 2015-04-30 | 2016-11-03 | Huawei Technologies Co., Ltd. | Audio signal processing apparatuses and methods |
| CN106303897A (zh) * | 2015-06-01 | 2017-01-04 | 杜比实验室特许公司 | 处理基于对象的音频信号 |
| CN105740029B (zh) * | 2016-03-03 | 2019-07-05 | 腾讯科技(深圳)有限公司 | 一种内容呈现的方法、用户设备及系统 |
| CN109479178B (zh) * | 2016-07-20 | 2021-02-26 | 杜比实验室特许公司 | 基于呈现器意识感知差异的音频对象聚集 |
| CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
| US9820073B1 (en) | 2017-05-10 | 2017-11-14 | Tls Corp. | Extracting a common signal from multiple audio signals |
| CN109688497B (zh) * | 2017-10-18 | 2021-10-01 | 宏达国际电子股份有限公司 | 声音播放装置、方法及非暂态存储介质 |
| WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
| US12531072B2 (en) * | 2020-06-11 | 2026-01-20 | Dolby Laboratories Licensing Corporation | Methods and devices for encoding and/or decoding spatial background noise within a multi-channel input signal |
| EP4226367A2 (en) | 2020-10-09 | 2023-08-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing |
| MX2023003965A (es) * | 2020-10-09 | 2023-05-25 | Fraunhofer Ges Forschung | Aparato, metodo, o programa de computadora para procesar una escena de audio codificada utilizando una extension de ancho de banda. |
| GB2627507A (en) * | 2023-02-24 | 2024-08-28 | Nokia Technologies Oy | Combined input format spatial audio encoding |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI226041B (en) * | 1999-04-07 | 2005-01-01 | Dolby Lab Licensing Corp | Matrix improvements to lossless encoding and decoding |
| WO2005083679A1 (en) * | 2004-02-17 | 2005-09-09 | Koninklijke Philips Electronics N.V. | An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore |
| TW200641796A (en) * | 2005-05-31 | 2006-12-01 | Microsoft Corp | Sub-band voice codec with multi-stage codebooks and redundant coding |
| US20070043575A1 (en) * | 2005-07-29 | 2007-02-22 | Takashi Onuma | Apparatus and method for encoding audio data, and apparatus and method for decoding audio data |
| TWI302664B (en) * | 2005-08-12 | 2008-11-01 | Via Tech Inc | Method and apparatus for audio encoding and decoding |
| US20090192789A1 (en) * | 2008-01-29 | 2009-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio signals |
Family Cites Families (22)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US3268905A (en) | 1960-06-30 | 1966-08-23 | Atlantic Refining Co | Coordinate adjustment of functions |
| JP2006003580A (ja) * | 2004-06-17 | 2006-01-05 | Matsushita Electric Ind Co Ltd | オーディオ信号符号化装置及びオーディオ信号符号化方法 |
| US8843378B2 (en) | 2004-06-30 | 2014-09-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Multi-channel synthesizer and method for generating a multi-channel output signal |
| TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | 杜比實驗室特許公司 | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
| US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
| US8036904B2 (en) * | 2005-03-30 | 2011-10-11 | Koninklijke Philips Electronics N.V. | Audio encoder and method for scalable multi-channel audio coding, and an audio decoder and method for decoding said scalable multi-channel audio coding |
| US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
| BRPI0707969B1 (pt) * | 2006-02-21 | 2020-01-21 | Koninklijke Philips Electonics N V | codificador de áudio, decodificador de áudio, método de codificação de áudio, receptor para receber um sinal de áudio, transmissor, método para transmitir um fluxo de dados de saída de áudio, e produto de programa de computador |
| MX2008012251A (es) | 2006-09-29 | 2008-10-07 | Lg Electronics Inc | Metodos y aparatos para codificar y descodificar señales de audio basadas en objeto. |
| ATE539434T1 (de) | 2006-10-16 | 2012-01-15 | Fraunhofer Ges Forschung | Vorrichtung und verfahren für mehrkanalparameterumwandlung |
| EP2109861B1 (en) * | 2007-01-10 | 2019-03-13 | Koninklijke Philips N.V. | Audio decoder |
| ATE526663T1 (de) * | 2007-03-09 | 2011-10-15 | Lg Electronics Inc | Verfahren und vorrichtung zum verarbeiten eines audiosignals |
| AU2008243406B2 (en) * | 2007-04-26 | 2011-08-25 | Dolby International Ab | Apparatus and method for synthesizing an output signal |
| WO2008150141A1 (en) * | 2007-06-08 | 2008-12-11 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
| WO2009046909A1 (en) * | 2007-10-09 | 2009-04-16 | Koninklijke Philips Electronics N.V. | Method and apparatus for generating a binaural audio signal |
| US8280744B2 (en) | 2007-10-17 | 2012-10-02 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio object encoder, method for decoding a multi-audio-object signal, multi-audio-object encoding method, and non-transitory computer-readable medium therefor |
| RU2497204C2 (ru) * | 2008-05-23 | 2013-10-27 | Конинклейке Филипс Электроникс Н.В. | Устройство параметрического стереофонического повышающего микширования, параметрический стереофонический декодер, устройство параметрического стереофонического понижающего микширования, параметрический стереофонический кодер |
| EP2249334A1 (en) * | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
| BRPI1009648B1 (pt) * | 2009-06-24 | 2020-12-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | decodificador de sinal de áudio, método para decodificador um sinal de áudio e programa de computador com o uso de etapas de processamento de objeto de áudio em cascata |
| PL3093843T3 (pl) * | 2009-09-29 | 2021-06-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder sygnału audio MPEG-SAOC, koder sygnału audio MPEG-SAOC, sposób dostarczania reprezentacji sygnału upmixu z wykorzystaniem dekodowania MPEG-SAOC, sposób dostarczania reprezentacji sygnału downmixu z wykorzystaniem dekodowania MPEG-SAOC oraz program komputerowy wykorzystujący wspólną wartość parametru korelacji międzyobiektowej zależną od czasu/częstotliwości |
| WO2011083979A2 (en) | 2010-01-06 | 2011-07-14 | Lg Electronics Inc. | An apparatus for processing an audio signal and method thereof |
| US8625802B2 (en) | 2010-06-16 | 2014-01-07 | Porticor Ltd. | Methods, devices, and media for secure key management in a non-secured, distributed, virtualized environment with applications to cloud-computing security and management |
-
2010
- 2010-09-28 PL PL16176048T patent/PL3093843T3/pl unknown
- 2010-09-28 CA CA2775828A patent/CA2775828C/en active Active
- 2010-09-28 TW TW099132785A patent/TWI463485B/zh active
- 2010-09-28 AU AU2010303039A patent/AU2010303039B9/en active Active
- 2010-09-28 WO PCT/EP2010/064379 patent/WO2011039195A1/en not_active Ceased
- 2010-09-28 CN CN201080050553.8A patent/CN102667919B/zh active Active
- 2010-09-28 KR KR1020127010610A patent/KR101391110B1/ko active Active
- 2010-09-28 ES ES10757435.2T patent/ES2644520T3/es active Active
- 2010-09-28 RU RU2012116743/08A patent/RU2576476C2/ru active
- 2010-09-28 PL PL10757435T patent/PL2483887T3/pl unknown
- 2010-09-28 MX MX2012003785A patent/MX2012003785A/es active IP Right Grant
- 2010-09-28 EP EP10757435.2A patent/EP2483887B1/en active Active
- 2010-09-28 JP JP2012531366A patent/JP5576488B2/ja active Active
- 2010-09-28 PT PT107574352T patent/PT2483887T/pt unknown
- 2010-09-28 BR BR112012007138-6A patent/BR112012007138B1/pt active IP Right Grant
- 2010-09-28 EP EP16176048.3A patent/EP3093843B1/en active Active
- 2010-09-28 MY MYPI2012001410A patent/MY165328A/en unknown
- 2010-09-29 AR ARP100103539A patent/AR078474A1/es active IP Right Grant
-
2012
- 2012-03-29 US US13/434,450 patent/US9460724B2/en active Active
-
2015
- 2015-08-14 US US14/826,942 patent/US9466303B2/en active Active
- 2015-08-14 US US14/826,876 patent/US9805728B2/en active Active
-
2017
- 2017-10-11 US US15/730,652 patent/US10504527B2/en active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| TWI226041B (en) * | 1999-04-07 | 2005-01-01 | Dolby Lab Licensing Corp | Matrix improvements to lossless encoding and decoding |
| WO2005083679A1 (en) * | 2004-02-17 | 2005-09-09 | Koninklijke Philips Electronics N.V. | An audio distribution system, an audio encoder, an audio decoder and methods of operation therefore |
| US20070168183A1 (en) * | 2004-02-17 | 2007-07-19 | Koninklijke Philips Electronics, N.V. | Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore |
| TW200641796A (en) * | 2005-05-31 | 2006-12-01 | Microsoft Corp | Sub-band voice codec with multi-stage codebooks and redundant coding |
| US20070043575A1 (en) * | 2005-07-29 | 2007-02-22 | Takashi Onuma | Apparatus and method for encoding audio data, and apparatus and method for decoding audio data |
| TWI302664B (en) * | 2005-08-12 | 2008-11-01 | Via Tech Inc | Method and apparatus for audio encoding and decoding |
| US20090192789A1 (en) * | 2008-01-29 | 2009-07-30 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio signals |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20230386485A1 (en) * | 2014-07-28 | 2023-11-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor , a time domain processor, and a cross processing for continuous initialization |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI463485B (zh) | 音訊信號解碼器或編碼器、用以提供上混信號表示型態或位元串流表示型態之方法、電腦程式及機器可存取媒體 | |
| JP7000488B2 (ja) | マルチチャネル非相関器、マルチチャネル・オーディオ・デコーダ、マルチチャネル・オーディオ・エンコーダおよび非相関器入力信号のリミックスを使用したコンピュータ・プログラム | |
| CN103890841B (zh) | 音频对象编码和解码 | |
| TWI441165B (zh) | 用以基於下混信號表示型態而提供上混信號表示型態之裝置、用以提供表示多聲道音訊信號之位元串流之裝置、方法、電腦程式及利用線性組合參數表示多聲道音訊信號之位元串流 | |
| CN105593930B (zh) | 用于增强的空间音频对象编码的装置及方法 | |
| ES2856423T3 (es) | Decodificador de señal de audio MPEG-SAOC, codificador de señal de audio MPEG-SAOC, procedimiento para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC, procedimiento para proporcionar una representación de señal de mezcla descendente usando decodificación MPEG-SAOC, y programa informático que usa un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia | |
| HK1231619A1 (zh) | Mpeg-saoc音频信号解码器、mpeg-saoc音频信号编码器、利用mpeg-saoc解码提供上混信号表示的方法、利用mpeg-saoc解码提供下混信号表示的方法、以及使用时间/频率依赖的共有的对象间相关参数值的计算机程序 | |
| HK1231619B (zh) | Mpeg-saoc音频信号解码器、mpeg-saoc音频信号编码器、利用mpeg-saoc解码提供上混信号表示的方法、利用mpeg-saoc解码提供下混信号表示的方法、以及使用时间/频率依赖的共有的对象间相关参数值的计算机程序 | |
| HK1174732B (zh) | Mpeg-saoc音频信号解码器,使用mpeg-saoc解码和与时间/频率相关的公共物件相关参数值的电脑程式设置upmix信号表示的方法 | |
| HK1174732A (zh) | Mpeg-saoc音频信号解码器,使用mpeg-saoc解码和与时间/频率相关的公共物件相关参数值的电脑程式设置upmix信号表示的方法 |