TWI415111B

TWI415111B - 空間解碼器單元、空間解碼器裝置、音訊系統、消費型電子裝置、產生一對雙耳輸出聲道之方法及電腦可讀媒體

Info

Publication number: TWI415111B
Application number: TW095133155A
Authority: TW
Inventors: Dirk Jeroen Breebaart
Original assignee: Koninkl Philips Electronics Nv
Priority date: 2005-09-13
Filing date: 2006-09-08
Publication date: 2013-11-11
Also published as: KR101512995B1; EP1927266B1; US8654983B2; WO2007031896A1; EP1927266A1; JP2009508157A; KR20080047446A; CN101263742A; CN101263742B; RU2419249C2; KR20150008932A; US20080205658A1; BRPI0615899B1; JP5587551B2; KR101562379B1; TW200721111A; RU2008114359A; JP5698189B2; JP2012181556A; BRPI0615899A2

Description

空間解碼器單元、空間解碼器裝置、音訊系統、消費型電子裝置、產生一對雙耳輸出聲道之方法及電腦可讀媒體

本發明係關於音訊編碼。更具體而言，本發明係關於一種用於將一音訊輸入信號轉換為一雙耳輸出信號之裝置及方法，其中該輸入信號包括至少一個音訊聲道及若干代表額外聲道之參數。

記錄及再現雙耳音訊信號(亦即含有人耳所敏感之特定定向資訊之音訊信號)已為吾人所熟知。通常使用安裝於一人頭模型中之兩個微音器進行雙耳錄音，以使所記錄聲音對應於人耳所捕獲之聲音並包含因頭部及雙耳之形狀所導致之任何影響。雙耳錄音與立體(亦即立體聲)錄音不同之處在於一雙耳錄音之再現需要一頭戴式耳機，而進行立體錄音則係供揚聲器再現。雖然雙耳錄音容許僅使用兩個聲道來再現所有空間資訊，但一立體錄音將不能提供相同空間感知。

可藉由藉助一組感知傳遞函數捲積每一規則信號來將規則的雙聲道(立體聲)或多聲道(例如5.1)錄音轉變為雙耳錄音。此類感知傳遞函數模仿人頭及其他可能對象對信號之影響。一習知類型之感知傳遞函數係所謂頭部相關傳遞函數(HRTF)。一替代類型之感知傳遞函數係雙耳房間脈衝響應(BRIR)，其亦考量由一房間之牆壁、天花板及地板導致的反射。

在多聲道信號之情形中，藉助一組感知函數將該等信號轉變為雙耳錄音信號通常意味著將感知函數與所有聲道之信號捲積。由於一典型捲積在計算上要求高，則該等信號及HRTF通常被轉變為其中用一在計算上要求相當低之乘法來代替捲積的頻率(傅立葉)域。

進一步已熟知，藉由用指示該等原始聲道之間關係的一較小數量之聲道及參數表示該原始聲道數量來減少所要傳輸或儲存之音訊聲道數量。因而，一組立體信號可由一單(單聲道)聲道加上一定數量之相關聯空間參數來表示，而一組5.1信號可由兩個聲道及一組相關聯之空間參數或甚至由一單聲道加上相關聯之空間參數來表示。空間編碼器中多音訊聲道之此「減聲道混音」(downmix)及空間解碼器中音訊信號之對應「增聲道混音」(upmix)通常於一轉變域或子頻帶域中實施，例如QMF(四相位鏡像濾波器)域。

當將經減聲道混音輸入聲道轉換為雙耳輸出聲道時，先前技術方法係首先使用一空間解碼器將該等輸入聲道增聲道混音，以產生經增聲道混音中間聲道，隨後將該等經增聲道混音中間聲道轉換為雙耳聲道。此程序通常產生五個或六個中間聲道，該等中間聲道隨後必須被減少為兩個雙耳聲道。首先擴充並隨後減少聲道數量顯而易見並非高效且會增加計算複雜性。此外，將準備用於多聲道揚聲器再現之五個或六個中間聲道減少為僅兩個準備用於雙耳再現之聲道會不可避免地引入人為影響並從而降低音質。

上文提及之QMF域與頻率(傅立葉轉換)域相似但不相同。若一空間解碼器將產生雙耳輸出信號，則經減聲道混音之音訊信號將首先必須轉變至QMF域以用於增聲道混音，隨後經反向QMF轉變以產生時域中間信號，然後轉變至頻率域以與(經傅立葉轉換之)HRTF相乘，最後經反向轉變以產生時域輸出信號。顯而易見，此程序並非高效，乃因需連續執行數個轉變。

此先前技術方法中所涉及之計算量將使得設計一能夠自經減聲道混音音訊信號產生雙耳輸出信號之手持式消費型裝置(諸如一可攜式MP3播放器)變得非常困難。即使可構建一此類裝置，其電池壽命亦將因所需要之計算負載而非常短。

本發明之一目的係克服先前技術之該等及其他問題，並提供一能夠自一組由一個或多個音訊輸入聲道及一組相關聯之空間參數表示之經減聲道混音音訊聲道產生一對雙耳輸出聲道之空間解碼器單元，該解碼器具有提高之效率。

因此，本發明提供一種用於使用空間參數及一個或多個音訊輸入聲道產生一對雙耳輸出聲道之空間解碼器單元，該裝置包括一用於使用參數化感知傳遞函數將該等空間參數轉換為雙耳參數之參數轉換單元，及一用於使用該等雙耳參數及音訊聲道合成一對雙耳聲道之空間合成單元。

藉由將空間參數轉換為雙耳參數，空間合成單元可直接合成一對雙耳聲道而不需要一額外之雙耳合成單元。由於沒有產生多餘之中間信號，因而降低了計算需求同時充分排除了人為影響之引入。

在本發明之空間解碼器單元中，無需轉變至頻率域及後續反向轉變至時域的額外步驟即可於轉變域(例如QMF域)中實施雙耳聲道之合成。由於可省略兩個轉變步驟，計算量及記憶體需求兩者得到顯著減少。因而，本發明之空間解碼器單元可相對容易地構建於一可攜式消費型裝置中。

此外，於本發明之空間解碼器單元中，直接自經減聲道混音聲道產生雙耳聲道，每一雙耳聲道包括用於使用一頭戴式耳機或一類似裝置再現雙耳錄音之雙耳信號。參數轉換單元自空間(亦即增聲道混音)參數推導用於產生雙耳聲道之雙耳參數。雙耳參數之此類推導過程涉及參數化感知傳遞函數，諸如HRTF(頭部相關傳遞函數)及/或雙耳房間脈衝響應(BRIR)。因而，根據本發明，感知傳遞函數之處理過程係執行於參數域中，而在先前技術中，此處理過程係於時域或頻率域中實施。此可導致進一步減少計算複雜性，乃因參數域中之解析度通常低於時域或頻率域中之解析度。

較佳地，安排參數轉換單元以為了確定該等雙耳參數而在參數域中組合輸入(減聲道混音)音訊聲道將對雙耳聲道做出的所有感知傳遞函數貢獻。換言之，以如下方式組合該等空間參數及參數化感知傳遞函數：使所組合之參數產生一具有與先前技術方法中所獲得之彼等信號(包括經增聲道混音之中間信號)相似之統計屬性的雙耳輸出信號。

於一較佳實施例中，本發明之空間解碼器單元進一步包括一個或多個用於將音訊輸入聲道轉變為經轉變之音訊輸入聲道之轉變單元，及用於將所合成之雙耳聲道反向地轉變為該對雙耳輸出聲道之一對反向轉變單元，其中該空間合成單元經安排以運作於一轉變域或子頻帶域(較佳為QMF域)中。

本發明之空間解碼器單元可包括兩個轉變單元，該參數轉換單元經安排以利用僅涉及三個聲道之感知傳遞函數參數，該三個聲道中之兩個含納複合前及後聲道之貢獻。於此一實施例中，參數轉換單元可經安排以用於處理聲道位準(例如CLD)、聲道同調性(例如ICC)、聲道預測(例如CPC)及/或相位(例如IPD)參數。

於一替代實施例中，本發明之空間解碼器單元可僅包括一單個轉變單元，且可進一步包括一用於解相關該單個轉變單元所輸出之經轉變單元聲道之解相關單元。於此種實施例中，參數轉換單元可經安排以用於處理聲道位準(例如CLD)、聲道同調性(例如ICC)及/或相位(例如IPD)參數。

本發明之空間解碼器單元可額外包括一立體混響單元。此種立體混響單元可經安排以運作於該時域中或一轉變域或子頻帶(例如QMF)域中。

本發明亦提供一種用於自一輸入位元流產生一對雙耳輸出聲道之空間解碼器裝置，該裝置包括：一用於將該輸入位元流解多工為至少一個減聲道混音聲道及若干空間參數之解多工器單元、一用於解碼該至少一個減聲道混音聲道之減聲道混音解碼器單元及一用於使用該等空間參數及該至少一個減聲道混音聲道產生一對雙耳輸出聲道之空間解碼器單元，其中該空間解碼器單元包括一用於使用參數化感知傳遞函數將該等空間參數轉換為雙耳參數之參數轉換單元，及一用於使用該等雙耳參數及該至少一個減聲道混音聲道來合成一對雙耳聲道之空間合成單元。

此外，本發明提供一消費型裝置及一包括上文所界定之一空間解碼器單元及/或空間解碼器裝置的音訊系統。本發明進一步提供一種使用空間參數及一個或多個音訊輸入聲道產生一對雙耳輸出聲道之方法，該方法包括使用參數化感知傳遞函數將該等空間參數轉換為雙耳參數及使用該等雙耳參數及該等音訊聲道合成一對雙耳聲道之步驟。根據本發明之方法之進一步態樣將自下文闡述中變得顯而易見。

本發明額外提供一種用於實施上文所述方法之電腦程式產品。一電腦程式產品可包括一組儲存於一資料載體(諸如一CD或一DVD)上之電腦可執行指令。該組容許一可程式化電腦實施上文所述方法之電腦可執行指令亦可自一遠程伺服器(例如經由網際網路)下載而獲得。

圖1中示意性地圖解說明依照先前技術之諸如頭部相關傳遞函數(HRTF)等感知傳遞函數之應用。其顯示雙耳合成裝置3包括6個HRTF單元31，每一HRTF單元31皆含有用於一輸入聲道與一輸出聲道之一特定組合的傳遞函數。於所顯示實例中，存在三個音訊輸入聲道ch1、ch2及ch3，其可對應於聲道l(左)、c(中)及r(右)。第一聲道ch1被饋送至兩個分別含有HRTF(1，L)及HRTF(1，R)之HRTF單元31。在此實例中，HRTF(1，L)係頭部相關傳遞函數，其決定第一聲道對左聲道信號之貢獻。

熟習此項技術者應瞭解，可藉由進行規則(立體)錄音及雙耳錄音並推導一表示該雙耳錄音相對於規則錄音之形狀的傳遞函數來決定HRTF。使用兩個安裝於一人頭模型中之微音器進行雙耳錄音，以使所記錄聲音對應於入耳所捕獲聲音且包含因該頭部及雙耳形狀及甚至頭髮及肩膀之存在所導致之任何影響。

若HRTF處理發生於時域中，則HRTF與該等聲道之(時域)音訊信號捲積。然而，通常將HRTF轉變至頻率域，且隨後將所產生之傳遞函數與該等音訊信號之頻譜相乘(圖1中未顯示傅立葉轉換單元及反向傅立葉轉換單元)。可使用包括重疊時間訊框之合適疊加法(OLA)技術來容納在長度上較快速傅立葉轉換(FFT)訊框為大之HRTF。

於適當之HRTF單元31實施HRTF處理之後，一對應之加法器32將所產生之左信號與右信號相加以產生(時域)左聲道信號lb及右聲道信號rb。

圖1之實例性先前技術雙耳合成裝置3具有三個輸入聲道。當今之音訊系統經常具有五個或六個聲道，如所謂5.1系統中之情形。然而，為減少所要傳遞及/或儲存之資料量，通常將多個音訊聲道減少(「減聲道混音」)至一個或兩個聲道。指示原始聲道之屬性及相互關係之若干空間參數容許將該一個或兩個聲道擴充(「增聲道混音」)為原始聲道數量。圖2中示意性地圖解說明一根據先前技術之實例性空間編碼器裝置1。

空間編碼器裝置1包括一空間編碼(SE)單元11、一減聲道混音編碼(DE)單元12及一多工器(Mux)13。空間編碼單元11接收五個音訊輸入聲道lf(左前)、lr(左後)、rf(右前)rr(右後)及c(中)。空間編碼單元11減聲道混音該五個輸入聲道以產生兩個聲道l(左)及r(右)及若干空間參數sp(應注意，空間編碼單元11可產生一單個聲道代替該兩個聲道l及r)。於所顯示實施例中，其中將五個聲道減聲道混音至兩個聲道(一所謂5-2-5組態)，空間參數sp可(例如)包括：

應注意，「lfe」係一可選低頻率(子低音擴音器)聲道，且「後」聲道亦可稱作「環繞」聲道。

空間編碼單元11所產生之兩個減聲道混音聲道l及r被饋送至通常使用一種旨在減少資料量之編碼的減聲道混音編碼(DE)單元12。由此編碼之減聲道混音聲道l與r及空間參數sp被多工器單元13多工以產生一輸出位元流bs。

於一替代實施例(未顯示)中，將五個(或六個)聲道減聲道混音至一單個(單雙耳)聲道(一所謂5-1-5組態)，且該等空間參數sp可(例如)包括：

在此替代實施例中，經編碼之減聲道混音聲道及該等空間參數sp亦由多工器單元13多工以產生一輸出位元流bs。

假若欲使用此位元流bs產生一對雙耳聲道，則先前技術方法將係首先增聲道混音該兩個減聲道混音聲道l及r(或替代地，該單個減聲道混音聲道)以產生該五個或六個原始聲道，並隨後將該等五個或六個聲道轉換為兩個雙耳聲道。圖3中圖解說明此先前技術方法之一實例。

根據先前技術之空間解碼器裝置2'包括一解多工器(Demux)單元21'、一減聲道混音解碼單元22'及一空間解碼器單元23'。一雙耳合成裝置3耦接至空間解碼器裝置2'之空間解碼器單元23'。

解多工器單元21'接收一位元流bs(其可係與圖2之位元流bs相同)及輸出空間參數sp及兩個經解碼之減聲道混音聲道。將該等空間參數sp發送至空間解碼器單元23'，同時減聲道混音解碼單元22'解碼該等經編碼之減聲道混音聲道以產生經解碼之減聲道混音聲道l及r。空間解碼器單元23'實質上實施圖2中空間編碼單元11之反向運作並輸出五個音訊聲道。將該等五個音訊聲道饋送至雙耳合成裝置3，其中雙耳合成裝置3可具有一類似於圖1之裝置3的結構但亦具有額外之HRTF單元31以容納所有五個聲道。如圖1之實例中顯示，雙耳合成裝置3輸出兩個雙耳聲道lb(左雙耳)及rb(右雙耳)。

圖4中顯示一先前技術之空間解碼器單元23'之實例性結構。圖4之單元23'包括一2至3增聲道混音單元230'、三個空間合成(SS)單元232'及三個解相關(D)單元239'。2至3增聲道混音單元230'接收減聲道混音聲道l與r及空間參數sp，並產生三個聲道l、r及ce。該等聲道之每一個被饋送至一解相關器單元239'，解相關器單元239'產生各自聲道之一經解相關版本。每一聲道l、r及ce、其各自之經解相關版本及相關聯之空間參數sp皆被饋送至一各自之空間合成(或增聲道混音)單元232'。接收聲道l之空間合成單元232'(例如)輸出輸出聲道lf(左前)及lr(左後)。空間合成單元232'通常執行一矩陣乘法，其中該矩陣之參數由空間參數sp決定。

應注意，在圖4之實例中，產生六個輸出聲道。於某些實施例中，可省略第三解相關單元239'及第三空間合成單元232'，從而僅產生五個輸出聲道。然而，於所有實施例中，先前技術之空間合成單元23'將產生多於兩個輸出聲道。進一步應注意，為圖解說明之簡潔起見，已自圖4之說明性實例中省略任何(QMF)轉變單元及反向(QMF)轉變單元。於實際實施例中，空間解碼將實施於一轉變域(諸如QMF域)中。

圖3之組態並非高效。空間解碼器裝置2'將兩個減聲道混音聲道(l及r)轉換為五個經增聲道混音(中間)聲道，而雙耳合成裝置3隨後將該五個經增聲道混音聲道減少為兩個雙耳聲道。此外，空間解碼器單元23'中之增聲道混音通常實施於一子頻帶域中，諸如QMF(四相位鏡像濾波器)域中。然而，雙耳合成裝置3通常在頻率(亦即傅立葉轉變)域中處理信號。由於該兩個域並不相同，空間解碼器裝置2'首先將減聲道混音聲道之信號轉變成QMF域，處理該等經轉變信號，並隨後將該等經增聲道混音信號轉變回時域。隨後，雙耳合成裝置3將所有(本發明中為五個)該等經增聲道混音信號轉變成頻率域，處理該等經轉變信號，並隨後將該等雙耳信號轉變回時域。顯而易見，所涉及之計算耗費相當可觀，且需要一更有效之信號處理，特別是當欲在一手持式裝置中實施此處理時。

本發明藉由將雙耳合成裝置整合至空間解碼器裝置中並以該參數有效地實施雙耳處理來提供一更有效之處理。圖5中示意性地圖解說明根據本發明一空間解碼器單元之僅實例性實施例，而圖6中圖解說明一根據本發明之經組合空間及雙耳解碼器裝置(為簡潔起見，稱作空間解碼器裝置)。

圖5中僅以非限定性實例方式顯示之發明性空間解碼器單元23包括轉變單元231、一空間合成(SS)單元232、反向轉變單元233、一參數轉換(PC)單元234及一記憶體(Mem)單元235。於圖5之實例性實施例中，空間解碼器單元23包括兩個轉變單元231，但在替代實施例中僅包括一單個轉變單元231(如圖6中)，或可能存在多於兩個轉變單元231，此取決於減聲道混音聲道數量。

每一轉變單元231分別接收一減聲道混音聲道1及r(亦看圖3)。每一轉變單元231經安排以將各自聲道(之信號)轉變為一適合之轉變域或子頻帶域，在本實例中為QMF域。經QMF轉變聲道L及R被饋送至空間合成單元232，空間合成單元232較佳地對聲道L及R之信號實施一矩陣運算以產生轉變域雙耳聲道Lb及Rb。反向轉變單元233實施一反向轉變(在本實例中為一反向QMF轉變)以產生雙耳時域聲道lb及rb。

空間合成單元232可相似或相同於圖4之先前技術空間合成單元232'。然而，此單元所使用之參數不同於先前技術中使用之彼等參數。更具體而言，參數轉換單元234使用儲存於記憶體單元235中之HRTF參數hp，將習用之空間參數sp轉換為雙耳參數bp。該等HRTF參數hp可包括：－用於左傳遞函數之每頻帶一平均位準，作為一方位(一水平面中之角度)、上下仰角(一垂直面中之角度)及距離之函數，－用於右傳遞函數之每頻帶一平均位準，作為方位、上下仰角及距離之一函數，及－每頻帶一平均相位或時間差異，作為方位、上下仰角及距離之一函數。

此外，亦可包含下述參數：－每HRTF頻帶一左傳遞函數及右傳遞函數之同調性量度，作為方位、上下仰角及距離之一函數，及/或－左傳遞函數及右傳遞函數之絕對相位及/或時間參數，作為方位、上下仰角及距離之一函數。

所使用之實際HRTF參數可相依於特定實施例。

空間合成單元232可使用下述公式確定雙耳聲道Lb及Rb：其中指數k 表示QMF混合(頻)帶指數，且指數m 表示QMF槽(時間)指數。矩陣H _k 之參數h _i _j 係由雙耳參數(圖5中之bp)決定。如指數k 所指示，矩陣H _k 可相依於QMF混合帶。於一第一實施例中，參數轉換單元(圖5中之234)產生該等雙耳參數，並隨後由空間合成單元232將該等雙耳參數轉換為矩陣參數h _ij 。於一第二實施例中，矩陣參數h _ij 相同於由參數轉換單元(圖5中之234)產生之雙耳參數，且可不經轉換而由空間合成單元232直接應用。

於兩個減聲道混音聲道(5-2-5組態)之情形中，可以下述方式決定矩陣H _k 之參數h _ij 。於圖4之先前技術空間解碼器單元中，一2至3解碼器單元230'將該兩個(輸入)減聲道混音聲道l及r轉換為三個(輸出)聲道l、r及ce(應瞭解，輸出聲道l及r通常將不同於輸入聲道l及r，因此輸入聲道將在下文闡述中被標記為l₀ 及r₀ )。

依照本發明之一進一步態樣，參數轉換單元(圖5及6中之234)經安排以利用感知傳遞函數參數，其中僅考量三個聲道(例如l、r及c)之貢獻，該三個聲道之其中兩個(例如l及r)包括各自之複合前(lf，rf)聲道及後(lr，rr)聲道。亦即，各自之前聲道及後聲道被聚合在一起以改良效率。

2至3增聲道混音單元230'之運作可由下述矩陣運算來闡述：其中矩陣元m _ij 相依於空間參數。空間參數與矩陣元之關係相同於一5.1 MPEG環繞解碼器之空間參數與矩陣元之關係。對於所產生之三個信號l 、r 及c 之每一個而言，其效果由感知傳遞函數(在本實例中：HRTF)參數決定，其中感知傳遞函數參數對應於該等聲源之所需(所感知)位置。對於中央聲道(c )而言，可直接應用聲源位置之空間參數，從而為中央聲道產生兩個輸出信號l _B (c) 及r _B (c) ：

如自方程式(3)可觀察到，HRTF參數處理由該信號與對應於中央聲道之聲源位置之平均功率位準P_l 及P_r 之相乘組成，同時對稱地分佈相位差。藉由一方面使用自HRTF參數至QMF濾波器排之映射而另一方面使用自空間參數至QMF帶之映射來針對每一QMF帶獨立地執行此處理過程。

對於左(l )聲道，使用權數w _lf 及w _rf 將來自左前及左後聲道之HRTF參數組合為一單個貢獻。所產生之複合參數在統計意義上模仿前聲道及後聲道兩者之效果。使用下述方程式為左聲道產生雙耳輸出對(l _b ，r _b )：其中及權數w _lf 及w _rf 相依於lf及lr之1至2單元的CLD參數：

以一類似方式，根據下式獲得右聲道之雙耳輸出：其中

應注意，在兩種情形中，皆將相位修改項應用於對側耳。此外，由於人體聽覺系統對頻率高於約2 kHz之雙耳相位很不敏感，僅需於較低頻率區域中應用相位修改項。因此，對於剩餘頻率範圍而言，實值處理已足夠(假設實值m _ij )。

進一步應注意，上述方程式假設lf 及lr 之(HRTF)經過濾信號之非同調添加。一可能之延伸將係亦將lf 及lr (與lf 及rr )之經傳輸聲道間同調性(ICC)參數包含於該等方程式中以說明前/後相關性。

上述所有處理步驟亦可組合於參數域中以產生一單個、信號域2×2矩陣：其中h ₁ ₁ ＝m ₁ ₁ H _l (l )＋m ₂ ₁ H _l (r )＋m ₃ ₁ H _l (c ) (15a)h ₁ ₂ ＝m ₁ ₂ H _l (l )＋m ₂ ₂ H _l (r )＋m ₃ ₂ H _l (c ) (15b)h ₂ ₁ ＝m ₁ ₁ H _r (l )＋m ₂ ₁ H _r (r )＋m ₃ ₁ H _r (c ) (15c)h ₂ ₂ ＝m ₁ ₂ H _r (l )＋m ₂ ₂ H _r (r )＋m ₃ ₂ H _r (c ) (15d)。

自上述中顯而易見，本發明實質上在參數域中而非如先前技術中在頻率域或時域中處理雙耳(亦即HRTF)資訊。以此方式，可獲得顯著之計算節省。

圖6中僅以非限定實例形式顯示的根據本發明之空間解碼器裝置2包括一解多工器(Demux)單元21、一減聲道混音解碼單元22及一空間/雙耳解碼器單元23。解多工器單元21與減聲道混音解碼單元22可類似於圖3中顯示之先前技術解多工器單元21'及減聲道混音解碼單元22'。圖6之空間解碼器單元23與圖5之空間解碼器單元23相同，但減聲道混音聲道及相關聯轉變單元之數量除外。由於圖6之空間解碼器單元僅被安排用於一單個減聲道混音聲道s，因此當添加一解相關(D)單元239以產生一(轉變域)減聲道混音信號S之經解相關版本D時僅提供一單個轉變單元231。參數轉換單元234所產生之雙耳參數bp通常不同於圖5之實施例中之彼等參數，因為與一單個減聲道混音聲道s相關聯之空間參數sp通常不同於與兩個減聲道混音聲道相關聯之彼等空間參數。

於圖6之組態中，雙耳解碼器之輸入包括一伴有空間參數sp之單聲道輸入信號s。雙耳合成單元產生一具有統計屬性之立體輸出信號，該等統計屬性接近彼等將自原始5.1輸入之HRTF處理中得到的屬性，且可由下式闡述：

一旦給出闡述聲道lf 、rf 、lr 、rr 及c 之統計屬性及相互關係的空間參數及HRTF脈衝響應之參數，則亦可能估計雙耳輸出對l _b 、r _b 之統計屬性(亦即雙耳參數之近似值)。更具體而言，可藉助單聲道輸入信號之解相關及矩陣化估計並隨後恢復(每一聲道之)平均能量、平均相位差及同調性。

雙耳參數包括該兩個雙耳輸出聲道之每一個之一(相對)位準變化(並因此界定一聲道位準差參數)、一(平均)相位差及一同調性量度(每轉變域時間/頻率平鋪)。

作為第一步，使用經傳輸之CLD參數計算該五個(或六個)聲道(5.1)信號之相對功率(相對於單聲道輸入信號之功率)。左前聲道之相對功率由下式給出：其中及類似地，其他聲道之相對功率由下列各式給出：

可隨後計算左雙耳輸出聲道之相對功率σ_L ² 之預期值(參考單聲道輸入聲道)、右雙耳輸出聲道之相對功率σ_R ² 之預期值及叉積L _B R _B ^＊之預期值。隨後由下式給出雙耳輸出(ICC_B )之同調性：及平均相位角度(IPD_B )由下式給出：

雙耳輸出之聲道位準差(CLD_B )由下式給出：

最後，雙耳輸出相比於單聲道輸入之總(線性)增益g _B 由下式給出：

恢復雙耳矩陣中IPD_B 、CLD_B 、ICC_B 及g_B 參數所需之矩陣係數係簡單地自一習用參量立體解碼器獲得，並藉助總增益g_B 延展：h ₁ ₁ ＝g _B c _L cos(α＋β)exp(j IPD_B /2) (26a)h ₁ ₂ ＝g _B c _L sin(α＋β)exp(j IPD_B /2) (26b)h ₂ ₁ ＝g _B c _R cos(－α＋β)exp(－j IPD_B /2) (26c)h ₂ ₂ ＝g _B c _R sin(－α＋β)exp(－j IPD_B /2) (26d)其中α＝0.5 arccos(ICC_B ) (27)

本發明之空間解碼器單元之進一步實施例可含有一混響單元。已發現，添加混響會在產生雙耳聲音時改良感知距離。因此，圖7之空間解碼器單元23設置有一與空間合成單元232並行連接之立體混響單元237。圖7之立體混響單元237接收QMF轉變域單減聲道混音信號S並輸出兩個混響信號，添加單元238將該兩個混響信號添加至轉變域雙耳信號(圖6中之聲道Lb及Lr)。隨後，所組合信號在被輸出之前由反向轉變單元233反向轉變。

於圖8之實施例中，立體混響單元237經安排以在時域中產生一混響並接收時域單減聲道混音信號s。立體混響單元237輸出時域混響信號，該等時域混響信號由添加單元238添加至雙耳聲道lb及rb之時域信號中。任一實施例皆提供一合適混響。

本發明額外地提供一消費型裝置(諸如一手持消費型裝置)及一包括如上文所界定之空間解碼器單元或空間解碼器裝置之音訊系統。該手持消費型裝置可由一MP3播放器或類似裝置構成。圖9中示意性地圖解說明一消費型裝置。圖中顯示消費型裝置50包括一根據本發明之空間解碼器裝置2(看圖6)。

本發明係基於下述見識：藉由根據雙耳資訊來修改該等空間參數可顯著降低一經組合空間解碼器裝置與雙耳合成裝置之計算複雜性。此容許空間解碼器裝置在同一信號處理作業中有效地實施空間解碼及感知傳遞函數處理，同時避免引入任何人為影響。

應注意，此文件中使用之任何術語皆不應視為限定本發明之範疇。具體而言，措辭「包括」並不意味排除任何未明確指出之元件。可用多個(電路)元件或其等效物取代單個(電路)元件。

熟習此項技術者應瞭解，本發明並不限定於上文所圖解說明之實施例，且可做出諸多修改及添加，此並不背離隨附申請專利範圍中所界定之本發明範疇。

1．．．先前技術空間編碼器裝置

2．．．先前技術空間解碼器裝置

2'．．．先前技術空間解碼器裝置

3．．．雙耳合成裝置

11．．．空間編碼(SE)單元

12．．．減聲道混音編碼(DE)單元

13．．．多工器(Mux)

21．．．解多工器(Demux)單元

22．．．減聲道混音解碼單元

23．．．空間/雙耳解碼器單元

21'．．．解多工器(Demux)單元

22'．．．減聲道混音解碼單元

23'．．．空間解碼器單元

31．．．HRTF單元

32．．．加法器

50．．．消費型裝置

230'．．．2至3增聲道混音單元

232'．．．空間合成(SS)單元

239'．．．解相關(D)單元

231‧‧‧單個轉變單元

232‧‧‧空間合成單元

233‧‧‧反向轉變單元

234‧‧‧參數轉換單元

235‧‧‧記憶體(Mem)單元

237‧‧‧立體混響單元

238‧‧‧添加單元

239‧‧‧解相關(D)單元

sp‧‧‧空間參數

HRTF‧‧‧頭部相關傳遞函數

bp‧‧‧雙耳參數

PC‧‧‧參數轉換單元

hp‧‧‧參數化感知傳遞函數

1b‧‧‧雙耳輸出聲道

rb‧‧‧雙耳輸出聲道

lf‧‧‧音訊輸入聲道

rf‧‧‧音訊輸入聲道

lr‧‧‧音訊輸入聲道

rr‧‧‧音訊輸入聲道

lfe‧‧‧可選低頻率聲道

c‧‧‧音訊輸入聲道

ce‧‧‧音訊輸入聲道

QMF‧‧‧鏡向正交濾波器

QMF^-1 ‧‧‧反鏡向正交濾波器

DD‧‧‧減聲道混音解碼

SD‧‧‧空間/雙耳解碼器

BS‧‧‧雙耳合成

SR‧‧‧立體混響

上文已參照附圖中圖解說明之實例性實施例進一步闡述本發明，其中：圖1示意性地顯示根據先前技術之頭部相關傳遞函數之應用。

圖2示意性地顯示根據先前技術之一空間音訊編碼器裝置。

圖3示意性地顯示一耦接至一雙耳合成裝置之根據先前技術之空間音訊解碼器裝置。

圖4示意性地顯示一根據先前技術之空間音訊解碼器單元。

圖5示意性地顯示一根據本發明之空間音訊解碼器單元。

圖6示意性地顯示一根據本發明之空間音訊解碼器裝置。

圖7示意性地顯示裝備有一轉變域混響單元之圖5空間音訊解碼器單元。

圖8示意性地顯示裝備有一時域混響單元之圖5空間音訊解碼器單元。

圖9示意性地顯示一裝備有一根據本發明之空間音訊解碼器裝置之消費型裝置。

2．．．空間解碼器裝置

21．．．解多工器(Demux)單元

22．．．減聲道混音解碼單元

23．．．空間/雙耳解碼器單元

231．．．單個轉變單元

232．．．空間合成單元

233．．．反向轉變單元

234．．．參數轉換單元

235．．．記憶體(Mem)單元

239．．．解相關(D)單元

Claims

一種空間解碼器單元(23)，其用於使用空間參數(sp)及單一音訊輸入聲道(s)產生一對雙耳(binaural)輸出聲道(lb，rb)，該空間解碼器單元包括：一參數轉換單元(234)，其用於使用參數化感知傳遞函數(hp)將該等空間參數(sp)轉換為雙耳參數(bp)，該雙耳參數(bp)取決於該等空間參數(sp)與該等參數化感知傳遞函數(hp)；單一轉變單元(231)，其用於將該單一音訊輸入聲道(s)轉變為一經轉變之音訊聲道(S)；一解相關單元(239)，用於解相關該經轉變之音訊聲道(S)，以產生一經轉變之解相關信號(D)；一空間合成單元(232)，其用於藉由將該等雙耳參數(bp)施加至該經轉變之音訊聲道(S)與該經轉變之解相關信號(D)來合成一對經轉變之雙耳聲道(Lb，Rb)；及一對反向轉變單元(233)，其用於將該經轉變之雙耳聲道(Lb，Rb)反向轉變為該對雙耳輸出聲道(lb，rb)。
如請求項1之空間解碼器單元，其中該參數轉換單元(234)經安排以決定該等雙耳參數。
如請求項1之空間解碼器單元，其中該參數轉換單元經安排以處理聲道位準(CLD)、聲道同調性(ICC)及/或相位(IPD)參數。
如請求項1之空間解碼器單元，其進一步包括一經安排以運作於時域中之立體混響單元(237)。
如請求項1之空間解碼器單元，其進一步包括一經安排以運作於一轉變域或子頻帶域中之立體混響單元(237)。
如請求項1之空間解碼器單元，其中該參數轉換單元(234)包括：用於回應該空間參數(sp)與該單一音訊輸入聲道(s)以決定複數個虛擬音訊聲道(virtual audio channel)之相對功率的構件；用於回應該複數個虛擬音訊聲道之相對功率以評估該等雙耳輸出聲道(lb，rb)之統計屬性的構件；及用於回應該等雙耳輸出聲道(lb，rb)之該經評估之統計屬性以決定該等該雙耳參數(bp)的構件。
如請求項6之空間解碼器單元，其中該等統計屬性包括：該等經轉變之雙耳聲道(Lb，Rb)的一平均能量、該等經轉變之雙耳聲道(Lb，Rb)的一平均相位差、及該等經轉變之雙耳聲道(Lb，Rb)的一同調性(coherence)。
一種空間解碼器裝置(2)，其用於自一輸入位元流(bs)產生一對雙耳輸出聲道(lb，rb)，該裝置包括：一解多工器單元(21)，其用於將該輸入位元流解多工為單一減聲道混音(downmix)聲道及若干空間參數(sp)，一減聲道混音解碼器單元(22)，其用於解碼該單一減聲道混音聲道(s)，及一如請求項1之空間解碼器單元(23)。
如請求項8之裝置，其中該空間解碼器單元(23)包括一混響單元(237)。
一種音訊系統，其包括一如請求項1之空間解碼器單元(23)及/或一如請求項8之空間解碼器裝置(2)。
一種消費型電子裝置，其包括一如請求項1之空間解碼器單元(23)及/或一如請求項8之空間解碼器裝置(2)。
一種使用空間參數(sp)及單一音訊輸入聲道(s)產生一對雙耳輸出聲道(lb，rb)之方法，該方法包括下述步驟：使用參數化感知傳遞函數(hp)將該等空間參數(sp)轉換為若干雙耳參數(bp)，該等雙耳參數(bp)取決於該等空間參數(sp)與該等參數化感知傳遞函數(hp)；將該單一音訊輸入聲道(s)轉變為一經轉變之音訊聲道(S)；解相關該經轉變之音訊聲道(S)，以產生一經轉變之解相關信號(D)；藉由將該等雙耳參數(bp)施加至該經轉變之音訊聲道(S)與該經轉變之解相關信號(D)來合成一對經轉變之雙耳聲道(Lb，Rb)；及將該經轉變之雙耳聲道(Lb，Rb)反向轉變為該對雙耳輸出聲道(lb，rb)。
一種電腦可讀媒體，其上儲存有一用於實施如請求項12之方法的電腦程式。