[go: up one dir, main page]

TWI404429B - 用於將多頻道音訊信號編碼/解碼之方法與裝置 - Google Patents

用於將多頻道音訊信號編碼/解碼之方法與裝置 Download PDF

Info

Publication number
TWI404429B
TWI404429B TW097151236A TW97151236A TWI404429B TW I404429 B TWI404429 B TW I404429B TW 097151236 A TW097151236 A TW 097151236A TW 97151236 A TW97151236 A TW 97151236A TW I404429 B TWI404429 B TW I404429B
Authority
TW
Taiwan
Prior art keywords
quantization
cld
quantized
mode
channel
Prior art date
Application number
TW097151236A
Other languages
English (en)
Other versions
TW200932030A (en
Inventor
Yang Won Jung
Hee Suk Pang
Hyen O Oh
Dong Soo Kim
Jae Hyun Lim
Original Assignee
Lg Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020060065291A external-priority patent/KR20070035411A/ko
Priority claimed from KR1020060065290A external-priority patent/KR20070035410A/ko
Application filed by Lg Electronics Inc filed Critical Lg Electronics Inc
Publication of TW200932030A publication Critical patent/TW200932030A/zh
Application granted granted Critical
Publication of TWI404429B publication Critical patent/TWI404429B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Stereophonic System (AREA)

Description

用於將多頻道音訊信號編碼/解碼之方法與裝置
本發明係有關一種將多頻道音訊信號編碼與解碼之方法、以及有關於一種將多頻道音訊信號編碼與解碼之裝置。本發明更尤其係有關一種將多頻道音訊信號編碼與解碼之方法、以及有關於一種將多頻道音訊信號編碼與解碼之裝置,其可以藉由將關於多頻道音訊信號之複數個空間參數有效率地編碼/解碼,而可以降低位元速率。
最近,已經發展出各種數位音訊編碼技術,以及關於數位音訊編碼大量增加產品已經被商業化。而且,已經根據生理音學模式發展出各種多頻道音訊編碼技術,且其目前已被標準化。
此等生理音學模式是根據人類如何感知聲音而建立。例如,根據此事實:較弱的聲音在較響的聲音存在下變得無法聽到,以及人耳可以聽到20~20,000Hz範圍中之聲音。藉由使用此種生理音學模式,可以藉由在資料編碼期間去除並不必要之音訊信號,而有效地減少資料數量。
在傳統上,此多頻道音訊信號之位元流是藉由實施固定量化而產生,其僅涉及在被編碼之資料上使用單一量化表,因此,位元速率增加。
本發明提供一種種將多頻道音訊信號編碼與解碼之方法、以及有關於一種將多頻道音訊信號編碼與解碼之裝置,其可以將多頻道音訊信號與多頻道音訊信號之空間參數有效率地編碼/解碼,以及甚至因此可以應用至任意擴展之頻率環境。
根據本發明之一觀點,提供一種將具有複數個頻道之音訊信號編碼之方法。此方法包括:判斷在此等複數個頻道之一對頻道間之頻道位準差異(CLD),以及考慮到此對頻道之位置性質將CLD量化。
根據本發明之另一觀點,提供一種接收位元流且將具有複數個頻道之音訊信號解碼之方法。此方法包括:在複數個頻道之一對頻道間、從位元流擷取量化CLD,以及使用此考慮到此對頻道位置性質之量化表,將此 經量化之CLD逆量化。
根據本發明之另一觀點,提供一種接收位元流且將具有複數個頻道之音訊信號解碼之方法。此方法包括:在此等複數個頻道之一對頻道間之擷取此經量化CLD;從此位元流擷取有關量化模式之資訊;如果此量化模式為第一模式,則使用此第一量化表將此經量化之CLD逆-量化;以及如果此量化模式為第二模式,則使用此考慮到此對頻道位置性質之第二量化表,將此經量化之CLD逆-量化。
根據本發明之另一觀點,提供一種將具有複數個頻道之音訊信號編碼之裝置。此裝置包括:空間參數擷取單元,其判斷此等複數個頻道之一對頻道間之CLD;以及量化單元,其考慮到此對頻道位置性質將CLD量化。
根據本發明之另一觀點,提供一種接收位元流且將具有複數個頻道之音訊信號解碼之裝置。此裝置包括:去封裝單元,其在此等複數個頻道之一對頻道間從位元流擷取此經量化CLD;以及逆量化單元,其使用此考慮到此對頻道位置性質之量化表,將此經量化之CLD逆-量化。
根據本發明之另一觀點,提供一種具有程式記錄於其上之電腦可讀取記錄媒體,用於以執行此具有多個頻道之音訊信號編碼與解碼之方法。根據本發明之另一觀點,提供一種具有複數個頻道之音訊信號之位元流。此位元流包括:CLD欄位,其包含有關於一對頻道間量化CLD之資訊;以及表資訊欄位,其包含有關使用量化表以產生量化CLD之資訊。其中,此量化表考慮到此對頻道之位置。
本發明之多頻道音訊信號編碼與解碼之方法與多頻道音訊信號編碼與解碼之裝置,藉由減少所須量化位元之數目,而使得可以有效率地編碼/解碼。
本發明之以上或其他特性與優點將藉由:詳細說明之典範實施例並參考所附圖式,而成為更明顯。
以下參考所附圖式更詳細說明本發明,其中,顯示本發明之典範實施例。
第1圖為根據本發明實施例之多頻道音訊信號編碼器與解碼器之方塊 圖。參考第1圖,此多頻道音訊信號編碼器包括:向下混合器110與空間參數估計器120;以及此多頻道音訊信號解碼器包括:空間參數解碼器130與空間參數綜合器140。此向下混合器110產生信號,其根據多頻道來源例如5.1頻道來源而向下混合至立體聲或單音頻道。空間參數估計器120獲得此須要產生多頻道之空間參數。
此等空間參數包括:頻道位準差異(CLD),其顯示一對頻道能量位準間之差異,而此一對頻道由數個多頻道中選出;頻道預測係數(CPC),使用此預測係數根據一對頻道信號而產生三個頻道信號;頻道間相關(ICC),其顯示一對頻道間之相關;以及頻道時間差異(CTD),其顯示一對頻道間之時間差異。
可以將由外部處理之技術向下混合信號103輸入至:多頻道音訊信號編碼器。空間參數解碼器130將對其傳輸之空間參數解碼。空間參數綜合器140將經編碼之向下混合信號解碼,且將此經解碼之向下混合信號、與由空間參數解碼器130所提供經解碼空間參數綜合,因此產生多頻道音訊信號105。
第2圖用於說明根據一實施例之多頻道組態。特定而言,第2圖說明5.1頻道組態。由於0.1頻道為低頻加強頻道且與位置無關,在第2圖中並未說明。參考第2圖,其左頻道L與右頻道R為30,而與中間頻道C間隔距離。左圍繞頻道Ls與右圍頻道Rs為110而與為80之中間頻道C間隔距離,而各與左頻道L與右頻道R間隔距離。
第3圖說明人耳如何感受音訊信號,且更尤其是、音訊信號之空間參數。參考第3圖,此多頻道音訊信號之編碼是根據此事實,即人耳感受之音訊信號為三度空間(3D)。可以使用複數個組之參數,以代表作為3D空間資訊之音訊信號。此等代表多頻道音訊信號之空間參數可以包括:CLD、ICC、CPC、以及CTD。CLD代表頻道位準間之差異,且尤其是頻道能階間之差異。ICC代表頻道對間之相關。CPC為預測參數,其根據一對頻道信號而產生三個頻信號,以及CTD代表一對頻道間之差異。
以下參考第3圖詳細說明:人耳如何以空間方式感知音頻信號,以及如何產生關於音頻信號之空間參數。請參考第3圖,此第二直接聲波303從與使用者遙遠分開之聲源301傳送至使用者之左耳307,此第一直接聲波 302經由繞射從聲源301傳送至使用者之右耳306。第一與第二直接聲波302與303,可以具有不同抵達時間與不同能量位準。因此,造成第一與第二直接聲波302與303之CLD、CPC、以及CTD。
可以藉由將本發明應用至此根據上述原則所產生空間參數之量化,而提升此量化之效率。
第4圖為根據本發明實施例用於將多頻道音訊信號之空間參數編碼之裝置(以下稱為編碼裝置)之方塊圖。參考第4圖,當輸入此多頻道音訊信IN時,將此多頻道音訊信IN分割成此等信號,其各對應於濾波器庫401之複數個次-頻帶(即,次-頻帶1至N)。此濾波器庫401可以為次-頻帶濾波器庫或為四鏡濾波器(QMF)濾波庫。
空間參數擷取單元402從各此等分割信號擷取一或更多個空間參數。量化單元403將此等所擷取之空間參數量化。詳細而言,量化單元403可以依據此對頻道之位置性質,將此等複數個頻道之一對頻道間之CLD量化。此等將左頻道L與右頻道R間CLD量化所須量化步驟大小或量化步驟數目(以下稱為量化步驟數量)可以與:左頻道L與左周圍頻道Ls間CLD量化所須量化步驟大小或量化數量不同。
以下參考第13圖詳細說明根據本發明實施例空間參數之量化。
參考第13圖,在操作940中,空間參數擷取單元402從此等經分割之音訊信號擷取此等空間參數。此等所擷取空間參數之例包括:CLD、CTD、ICC、以及CPC。在操作945中,此量化單元403使用量化表,將此等所擷取空間參數、尤其是CLD量化,此量化表使用預先確定角度間隔作為量化步驟大小。此量化單元403可以將此對應於:在操作945中所獲得之量化CLD之指數資訊、輸出至位元流產生單元404。此在操作945中所獲得之量化CLD可以界定為:在複數個多頻道音訊信號間基準-10算法之功率比,如同由式(1)所示”:
而n代表時間間隔指數,以及m代表混合次-頻帶指數。
然後,位元流產生單元404使用:向下混合音訊信號與量化空間參數、包括在操作945中所獲得之量化CLD,以產生位元流。
第5圖說明藉由根據本發明實施例量化單元403以說明虛擬聲音來源位置之判斷,以及說明此須要解釋正弦/正切法則之振幅變化(panning)法則。
參考第5圖,當聽者面向前時,此虛擬聲源可以藉由調整頻道ch1與ch2對之大小,而位於任意位置(例如:點C)。在此情形中,此虛擬聲源之位置可以根據頻道ch1與ch2對之大小而決定,如同由式(2)所示:
而φ代表在虛擬聲源與頻道ch1與ch2間中心、之間之角度。而φ0 代表頻道ch1與ch2間中心、與頻道ch1間之角度,以及g1代表對應於ch1之增益因子。
當聽者面向虛擬聲源時,式(2)可以重新配置成式(3)。
根據式(1)、(2)、以及(3),此在頻道ch1與ch2間之CLD可以式(4)界定。
根據式(2)與(4),此在頻道ch1與ch2間之CLD亦可以使用虛擬聲源與頻道ch1與ch2式之角度位置界定,如同由式(5)與(6)所示:
根據式(5)與(6),此CLD可以對應於虛擬聲源之角度位置φ。換句話說,此在頻道ch1與ch2間之CLD、即頻道ch1與ch2間能量位準間之差異可以由:位在頻道ch1與ch2間之虛擬聲源之角度位置φ代表。
第6圖藉由根據本發明另一實施例第4圖中量化單元403以說明虛擬聲音來源位置之判斷。
當複數個說話者位於如同第6圖中所說明位置時、第i個頻道與第(i-1)個頻道間之CLD可以式(4)與(5)表示,則其位置可以由式(7)與(8)所示: 「數學式7」CLD=20log10(Gi )
而θi 代表位於第i個頻道與第(i-1)個頻道間虛擬聲源之角度位置,以及φi 顯示第I個說話者之角度位置。
根據式(7)與(8),此等一對頻道間之CLD可以由:用於任何說話者組態之此等頻道間之虛擬聲源之角度位置所代表。
第7圖說明使用此預先確定角度間隔將一對頻道間之空間分割成複數個區段。特定而言,第7圖說明將形成30°角度之中間頻道與左頻道間之空間分割成複數個區段。
人類空間資訊解析度顯示:此關於可以由人類感知任意聲音之空間資訊之最小差異。根據生理聲學研究,人類空間資訊之解析度大約為3°角度。因此,可以將一對頻道間CLD量化所須量化步驟大小設定為:3°之角度間隔。因此,可以將中間頻道與左頻道間之空間分割成複數個區段,各區段具有3°之角度。
請參考第7圖,φ2 -φ2-1 =30°。可以藉由從0°至30°、一次3°增加θi ,以計算中間頻道與左頻道間之CLD。此等計算之結果呈現於表1中。
可以藉由使用表1作為量化表將中間頻道與左頻道間之CLD量化。在此情形中,此將中間頻道與左頻道間之CLD量化所須之量化步驟數量為11。
第8圖藉由根據本發明實施例量化單元403使用量化表,以說明CLD之量化。參考第8圖,可以將此量化表中一對相鄰角度間之平均值設定作為量化臨界值。
假設此在中間頻道與右頻道間之角度為30°,且可以藉由將此中間頻道與右頻道間之空間分割成複數個區段、各區段具有角度3°,而將此中間頻道與右頻道間之CLD量化。
使用式(7)與(8)將由空間參數擷取單元402所擷取之CLD轉換成虛擬聲源角度位置。如果此虛擬聲源角度位置是介於1.5°與4.5°之間,則此所擷取之CLD可以被量化至與角度3°有關之值而儲存於表1中。
如果此虛擬聲源角度位置是介於4.5°與7.5°之間,則此所擷取之CLD可以被量化至與角度6°有關之值而儲存於表1中。
此以上述方式所獲得量化CLD可以藉由指數資訊代表。對於此,此包括指數資訊之量化表,即表2可根據表1而產生。
表2僅代表在表1中所呈現CLD值之整數部份,且各以150與-150之CLD值取代表1中8與-8之LCD值。
由於表2包括CLD值之對、其具有相同絕對值但不同符號,因此,可以將表2簡化為表3
在三個或更多頻道中將CLD量化之情形中,可以對於不同對之頻道使用不同之量化表。換句話說,可以將複數個量化表各使用於具有不同位置之複數個頻道對。此量化表適合用於上述方式所產生之各不同對之頻道。
表4為量化表,其被須要將此形成60°角度之左頻道與右頻道間之CLD量化。表4具有3°之量化步驟大小。
「表4」
表5為量化表,其被須要將此形成80°角度之左頻道與左周圍頻道間之CLD量化。表5具有3°之量化步驟大小。
表5不僅可以使用於形成80°角度之左頻道與左周圍頻道,亦可使用於形成80°角度之右頻道與右周圍頻道。
表6為量化表,其被須要將此形成80°角度之左周圍頻道與右周圍頻道間之CLD量化。表6具有3°之量化步驟大小。
在根據本實施例之多頻道音訊信號之空間參數之編碼方法中,此在一對頻道間CLD之量化是對於:此等頻道間虛擬聲源之角度位置線性地量化,而並非對於預先界定之值線性地量化。因此,可以使得能夠達成高度效率與適當量化,而使用於生理聲學模式中。
此根據本實施例之多頻道音訊信號之空間參數編碼方法,不僅可以應用至CLD,而且可以應用至CLD以外之空間參數例如:ICC與CPC。
根據本實施例,如果此用於將多頻道音訊信號之空間參數解碼之裝置(以下稱為解碼裝置)並不具有:由量化單元403使用以實施CLD量化之量化表,則此位元流產生單元404可以將有關於量化表之資訊插入於位流中,且將此位元流傳送至解碼裝置,且此將在以下更詳細說明。
根據本發明之實施例,可以藉由將在量化表中出現之所有值、包括各自對應於此等指數之指數與CLD值插入於位元流中,而將此關於在第4圖中說明而使用於編碼裝置中量化表之資訊傳輸至解碼裝置,且將位元流傳輸至解碼裝置。
根據本發明另一實施例,可以藉由傳輸此由解碼裝置所須資訊,而將此關於使用於編碼裝置中量化表之資訊傳輸至此解碼裝置,以恢復由此編碼裝置所使用之量化表。例如,可以將此使用於編碼裝置中而使用於量化表中之最小與最大角度、以及量化步驟數量插入於位元流中,以及然後,可以將此位元流傳輸至解碼裝置。然後,此解碼裝置可以根據由此編碼裝置所傳輸之資訊以及式(7)與(8),將此由編碼裝置所使用之量化表恢復。
以下參考第14圖詳細說明:此根據本發明另一實施例空間參數之量化。根據本發明,可以使用此等具有不同量化解析度之兩個或更多量化表,將關於多頻道音訊信號之空間參數量化。
參考第14圖,在操作950中,此空間參數擷取單元402從此將被編碼之音訊信號擷取一或更多個空間參數;此音訊信號為由將一多頻道音訊信號分割而獲得之複數個音訊信號之一,且各自對應於複數個次-頻帶。此等所擷取空間參數之例包括:CLD、CTD、ICC、以及CPC。
在操作955中,量化單元403決定:此具有完全量化解析度之精細模式、與此具有較作為量化模式之精細模式為低量化解析度之粗略模式兩者之一,作為用於被編碼音訊信號之量化模式。此精細模式對應於較粗略模式為大之量化步驟數量,與較小量化步驟大小。
量化單元403可以根據音訊信號之能量位準,以決定精細模式與粗略模式之一作為量化模式。根據心理聲學模式,以高能量位準將音訊信號精密複雜地量化較:以低能量位準將音訊信號精密複雜地量化更為有效率。因此,如果此多頻道音訊信號之能量位準大於預先界定之參考值,則此量化單元403可以精細模式將此多頻道音訊信號量化,否則,以粗略模式將此多頻道音訊信號量化。
例如,此量化單元403可以將此由R-OTT模組所處理信號之能量位準、與此將被編碼音訊信號之能量位準比較。然後,如果由R-OTT模組所處理信號之能量位準低於、此將被編碼音訊信號之能量位準,則此量化單元403可以粗略模式實施量化。另一方面,如果由R-OTT模組所處理信號之能量位準高於、此將被編碼音訊信號之能量位準,則此量化單元403可以粗略模式實施量化。
如果此模組具有5-1-5-1組態,則此量化單元403可以此將被編碼音訊信號之能量位準、與此等各經由左與右頻道輸入之音頻信號之能量位準相比較,以決定此用於輸入至R-OTT3音訊信號之CLD量化模式。
在操作960中,如果將此在在操作955中所決定之精細模式作為:用於此將被編碼音訊信號之量化模式,則量化單元403可以使用此具有完整量化解析度之第一量化表將CLD量化。此第一量化表包括31個量化步驟,且藉由將此等一對頻道間之空間分割成31個區段,而將一對頻道間之CLD量化。在精細模式中,可以將相同的量化表應用至各對頻道。
在操作965中,如果將此在在操作955中所決定之粗略模式作為:用於此將被編碼音訊信號之量化模式,則量化單元403可以使用此具有較第一量化表為低量化解析度之第二量化表將CLD量化。此第二量化表具有預先確定之角度區間作為量化步驟大小。此第二量化表之產生與使用第二量化表將CLD量化可以與:以上參考第7與8圖所說明者相同。
以下參考第15圖詳細說明此根據本發明另一實施例之此等空間參數 之量化。
參考第15圖,在操作970中,此空間參數擷取單元402從此一將被編碼音訊信號擷取一或更多個空間參數;此音訊信號為將一多頻道音訊信號分割、而獲得複數個且各對應於複數個次頻帶之音訊信號之一。此等所擷取空間參數之例包括:CLD、CTD、ICC、以及CPD。在操作975中,此量化單元403使用此使用兩個或更多角度作為量化步驟大小之量化表,所此等所擷取空間參數且尤是CLD量化。在此情形中,此量化單元403可以將此對應於在操作975中所獲得經量化CLD之指數資訊,傳輸至編碼單元404。
第9圖說明此根據此對頻道間位置、使用兩個或更多角度區間將一對頻道間之空間分割成數個區段,用於以可變角度區間實施CLD量化操作。
根據心理聲學研究,人類之空間資訊解析度根據聲源之位置而改變。當此聲源位在前方時,人類之空間資訊解析度可以為3.6°。當此聲源位在左側時,人類之空間資訊解析度可以為9.2°。當此聲源位在後方時,人類之空間資訊解析度可以為5.5°。
給定所有此等條件,對於在前方之頻道可以將此量化步驟大小設定為大約3.6°之角度區間,對於在左側或右側之頻道可以將此量化步驟大小設定為大約9.2°之角度區間,以及對於在後方之頻道可以將此量化步驟大小設定為大約5.5°之角度區間。
對於從前方至左側或從左側至後方之平穩移轉,可以將此等量化步驟大小設定為不規則角度區間。換句話說,在此從前方至左側之方向中逐漸增加此角度區間,以致於此量化步驟大小增加。另一方面,在此從左側至後方之方向中此角度區間逐漸減少,以致於此量化步驟大小減少。
請參考第9圖中所說明之複數個頻道,頻道X是位在前方,頻道Y是位在左側,頻道Z是位在後方。為了決定在頻道X與頻道Y間之CLD,可以將頻道X與頻道Y間之空間分割成k個區段,各具有角度1至k。此等角度1至k間之關係可以由式(9)代表: 「數學式9」α1 ≦α2 ≦...≦αk
為了決定在頻道Y與頻道Z間之CLD,可以將頻道X與頻道Y間之空間分割成m個區段,各具有角度β1 至βm ,以及n個區段,各具有y1 至yn 。在從頻道Y至左側之方向中,此角度區間逐漸增加,在從左側至頻道Z之方向中,此角度區間逐漸減少。在此等角度β1 至βm 間之關係與此等角度y1 至yn 間之關係,可以各由式(10)與(11)代表 「數學式10」β1 ≦β2 ≦...≦βm 「數學式11」γ1 ≧γ2 ≧...≧γn
此等角度αk 、βm 、γn 為典範角度,用於說明使用兩個或更多角度區間,將一對頻道間之空間分割。其中,此被使用將一對頻道間之空間分割之角度區間之數目、根據此等多頻道位置之數目與位置可以為4或更大。
而且,此等角度αk 、βm 、以及γn 可以為均勻或可變。如果此等角度αk 、βm 、γn 為均勻,則其可以由式(12)代表: 「數學式12」αk ≦γn ≦βm (除了當αk =γn =βm 之外)
式(10)顯示根據人類空間資訊解析度之角度區間特徵。例如,αk =3.6°,βm =9.2°以及γn =5.5°。
表7呈現此等複數個CLD值與複數個角度間之對應;此等複數個角度各對應於複數個相鄰區段,其藉由使用兩個或更多角度區間、將中間頻道與左頻道之間之空間分割而獲得,以形成30之角度。
「表7」
參考第7圖,其中之角度顯示此虛擬聲源與中間頻道間之角度,以及CLD(X)顯示對應於X之CLD值。可以使用式(7)與(8),以計算此等CLD值CLD(X)。
藉由使用表7作為量化表,可以將中間頻道與左頻道間之CLD量化。在此情形中,此將中間頻道與左頻道間之CLD量化所須量化步驟之數量為11。
參考第7圖,當此從前方至左側方向中之角度區間增加時,此量化步驟大小因此增加,且此顯示人類空間資訊解析度從前方至左側方向中增加。
此在表7中所呈現之CLD值可以由各對應指數代表。在此情形中,表8可以根據表7而獲得。
第10圖藉由根據本發明另一實施例,其由第4圖中所說明量化單元403使用量化表以說明CLD之量化。請參考第10圖,可以將此在量化表中所呈現相鄰一對角度間之平均值作為量化之臨界值。
詳細而言,在此將位於前方頻道A與位於右側上頻道B間之CLD量化之情形中,可以將頻道A與頻道B間之空間分割成k個區段,其各對應於k個角度θ1 、θ2 ...θk 。此等角度θ1 、θ2 ...θk 可以由式(13)表示。
「數學式13」θ1 ≦θ2 ≦...≦θk
式(13)顯示此根據此等頻道位置之角度區間特徵。根據式(13),人類之空間資訊解析度在從前方至左側之方向中增加。
此量化單元403使用式(7)與(8),將此由此空間參數擷取單元402所擷取之CLD轉換成虛擬聲源角度位置。如同由式(10)所顯示,如果虛擬聲源角度是介於之間,則可以將此所擷取CLD量化至對應於角度θ1 之值。在另一方面,如果虛擬聲源角度是介於之間,則可以將此所擷取CLD量化至對應於角度θ1 與θ2 和之值。
在將此用於三個或更多頻道之CLD量化之情形中,對於不同對之頻道可以使用不同之量化表。換句話說,可以將複數個量化表各別使用於:具有不同位置之複數個對之頻道。此用於各不同對頻道之量化表可以上述方式產生。
根據本發明,藉由使用此根據頻道對位置之兩個或更多個角度區間作為量化步驟大小,而將一對頻道間之CLD量化,而並非對於預先確定值線性地量化。因此,可以使得能夠有效率且合適CLD量化而使用於心理聲學模式中。
此根據本實施例之多頻道音訊信號之空間參數編碼方法可以應用至:除了CLD以外之空間參數,例如:ICC與CPC。
以下參考第16圖詳細說明:此根據本發明另一實施例之多頻道音訊信號之空間參數編碼方法。根據此在第16圖中所說明之實施例,可以使用此等具有不同量化解析度之兩個或更多量化表,將此等空間參數量化。
參考第16圖,在操作980中,此等空間參數由此等為複數個音訊信號之一之待編碼音訊信號擷取,此等音訊信號是藉由將一多頻道音訊信號分割而獲得,且各自對應於複數個次-頻道。此等所擷取空間參數之例包括:CLD、CTD、ICC、以及CPC。
在操作985中,此量化單元403決定:此具有完全量化解析度之精細模式、與此具有較此精細模式為低量化解析度之粗略模式之一,作為此用於待編碼音訊信號之量化模式。此精細模式對應於:較大量化步驟數量, 以及較粗略模式為小之量化步驟大小。
此量化單元403可以根據此待編碼音訊信號之能量位準以決定:此精細模式與粗略模式之一作為量化模式。根據心理聲學模式,以高能量位準將音訊信號精密複雜地量化較:以低能量位準將音訊信號精密複雜地量化更有效率。因此,如果此音訊信號之能量位準大於此預先界定參考值,則此量化單元403可以精細模式將此多頻道音訊信號量化,否則以粗略模式將此音訊信號量化。
例如,此量化單元403可以將由R-OTT模組所處理之信號之能量位準,與此待編碼音訊信號之能量位準比較。然後,如果此由R-OTT模組所處理之信號之能量位準低於此音訊信號之能量位準,則此量化單元403可以粗糙模式實施量化。另一方面,如果此由R-OTT模組所處理之信號之能量位準高於此待編碼之音訊信號之能量位準,則此量化單元403可以精細模式實施量化。
如果此模組具有5-1-5-1組態,則此量化單元403可以此將此各經由左側與右側頻道輸入之音訊信號之能量位準、與此待編碼音訊信號之能量位準相比較,以決定此用於輸入至R-OTT3音訊信號之CLD量化模式。
在操作990中,如果將此在操作985中所決定之精細模式作為:用於此將被編碼音訊信號之量化模式,則量化單元403可以使用此具有完整量化解析度之第一量化表將CLD量化。此第一量化表包括31個量化步驟。在精細模式中,可以將此等量化表應用至具有相同數目量化步驟之各此等頻道對。
在操作995中,如果將此在在操作985中所決定之粗略模式作為:用於此將被編碼音訊信號之量化模式,則量化單元403可以使用此具有較第一量化表為低量化解析度之第二量化表將CLD量化。此第二量化表可以具有兩個或更多角度區間作為量化步驟大小。此第二量化表之產生與使用第二量化表將CLD量化可以與:以上參考第9與10圖所說明者相同。
根據本發明,如果此用於將多頻道音訊信號之空間參數解碼之裝置(以下稱為解碼裝置),並不具有由此量化單元403所使用之量化表,以實施CLD量化,則此位元流產生單元404可以將關於量化表之資訊插入於位元流中,且將位元流傳輸至此解碼裝置,這以下將更詳細說明。
根據本發明另一實施例,可以將此關於在第4圖中所說明編碼裝置中所使用量化表之資訊,藉由將存在於量化表中所有值、包括指數與各對應於此等指數值之CLD值插入於位元流中,而傳輸至解碼裝置,以及將位元流傳輸至解碼裝置。
根據本發明另一實施例,可以將此關於在編碼裝置中所始用量化表之資訊,藉由將此解碼裝置所須資訊傳送而傳輸至解碼裝置,以恢復由此編碼裝置所使用之量化表。例如:最大與最小角度、量化步驟數量、以及使用於編碼裝置中量化表之兩個或更多角度區間插入於位元流中,以及然後,可以將此位元流傳輸至解碼裝置。然後,此解碼裝置可以根據此由編碼裝置所傳輸之資訊與式(7)與(8),而恢復此由編碼裝置所使用之量化表。
第11圖為在第4圖中所說明之空間參數擷取單元402、即空間參數擷取單元910之例之方塊圖。參考第11圖,此空間參數擷取單元910包括:第一空間參數測量單元911,與第二空間參數測量單元913。
此第一空間參數測量單元911根據輸入多頻道音訊信號,以測量在複數個頻道間之CLD。第二空間參數測量單元913,使用預先確定角度區間或兩個或更多個角度區間,將複數個頻道之一對頻道間之空間分割成數個區段,以及產生適用於此等頻道對組合之量化表。然後,此量化單元920使用量化表,將由此空間參數擷取單元910所擷取CLD量化。
第12圖為根據本發明實施例,用於將多頻道音訊信號之空間參數解碼之裝置(以下稱為解碼裝置)之方塊圖。參考第12圖,此解碼裝置包括:解封裝單元930與逆量化單元935。
此解封裝單元930擷取此經量化CLD,其對應於此來自輸入位元流一對頻道間能量位準間之差異。此逆量化單元935使用量化表、考慮此對頻道之位置性質,將此經量化CLD逆量化。
以下參考第17圖詳細說明此根據本發明實施例多頻道音訊信號之空間參數之解碼方法。
參考第17圖,在操作1000中,此解封裝單元930從輸入位元流擷取此經量化之CLD。在操作1005中,此逆量化單元935使用量化表將此經量化CLD逆量化;此量化表使用預先確定角度區間作為量化步驟大小。此量化表之量化步驟大小可以為3°。
此使用於操作1005中之量化表與以上參考第7與8圖所說明操作期間、由編碼裝置所使用之量化表相同,且因此將其詳細說明省略。
根據本實施例,如果此逆量化單元935並不具有關於此量化表之任何資訊,則此逆量化單元935可以從輸入位元流擷取有關量化表之資訊,且根據所擷取資訊恢復此量化表。
根據本發明實施例,可以將存在於量化表中所有值、包括此等指數與各自對應於此等指數之CLD值,插入於位元流中。
根據本發明另一實施例,可以將此量化表之最小與最大角度以及量化步驟數量包括於位元流中。
第18圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法。根據此在第18圖中所說明實施例,可以使用此具有不同量化解析度之兩個或更多量化表,將此等空間參數逆量化。
參考第18圖,在操作1010中,此解封裝單元930從輸入位元流擷取經量化CLD與量化模式資訊。
在操作1015中,此逆量化單元935根據此所擷取量化模式資訊以決定,此由編碼裝置所使用以產生經量化CLD之量化模式是:具有完全量化解析度之精細模式,或是具有較此精細模式為低量化解析度之粗略模式。此精細模式對應於:較大之量化步驟數量與較此粗略模式為小之量化步驟大小。
在操作1020中,如果在操作1015中所決定而使用於產生經量化CLD之量化模式為精細模式,則此逆量化單元935使用此具有完全量化解析度之第一量化表,將此經量化CLD逆量化。此第一量化表包括31個量化步驟,且藉由此等一對頻道間之空間分割成31個區段,而將一對頻道間之CLD量化。在精細模式中,可以將相同的量化步驟數量應用至各對頻道。
在操作1025中,如果將此在操作1015中所決定以產生經量化CLD量化模式為粗略模式,則此逆量化單元935使用此具有較第一量化表為低量量化解析度之第二量化表,將此經量化LCD逆量化。此第二量化表可以具有預先確定角度區間作為量化步驟大小。此使用預先確定角度區間作為量化步驟大小之第二量化表,可以與以上參考第7與8圖所說明之量化表相同。
以下參考第19圖詳細說明:此根據本發明另一實施例之多頻道音訊信號之此等空間參數之解碼方法。
參考第19圖,在操作1030中,此解封裝單元930從輸入位元流擷取經量化CLD。在操作1035中,此逆量化單元935使用量化表將此經量化CLD逆量化,此量化表使用兩個或更多角度區間作為量化步驟大小。
此在操作1035中所使用量化表與在以上參考第9與10圖所說明操作期間由編碼裝置所使用量化表相同,且因此將其詳細說明省略。
根據本實施例,如果此逆量化單元935並不具有關於量化表之任何資訊,則此逆量化單元935可以從輸入位元流擷取有關量化表之資訊,以及根據所擷取資訊恢復此量化表。
根據本發明實施例,可以將存在於量化表中所有值、包括此等指數與各自對應於此等指數之CLD值,插入於位元流中。
根據本發明另一實施例,可以將此量化表之最小與最大角度、量化步驟數量、以及此量化表之兩個或更多個角度區間包括於位元流中。
第20圖為流程圖,其說明根據本發明另一實施例,將多頻道音訊信號之空間參數解碼之方法。根據此在第20圖中所說明之實施例,可以使用此等具有不同量化解析度之兩個或更多量化表,將此等空間參數逆量化。
參考第20圖,在操作1040中,此解封裝單元930從輸入位元流擷取經量化CLD與量化模式資訊。
在操作1045中,此逆量化單元935根據此所擷取量化模式資訊以決定,此被使用以產生經量化CLD之量化模式是否為:具有完全量化解析度之精細模式,或是具有較此精細模式為低量化解析度之粗略模式。此精細模式對應於:較大之量化步驟數量與較此粗略模式為小之量化步驟大小。
在操作1050中,如果在操作1045中所決定而使用於產生經量化CLD之量化模式為精細模式,則此逆量化單元935使用此具有完全量化解析度之第一量化表,將此經量化CLD逆量化。此第一量化表包括31個量化步驟,且藉由此等對(pair)頻道間之空間分割成31個區段,而將一對頻道間之CLD量化。在精細模式中,可以將相同的量化步驟數量應用至各對頻 道。
在操作1055中,如果將此在操作1045中所決定以產生經量化CLD量化模式為粗略模式,則此逆量化單元935使用此具有較第一量化表為低量化解析度之第二量化表,將此經量化LCD逆量化。此第二量化表可以具有兩個或更多角度區間作為量化步驟大小。此使用兩個或更多角度區間作為量化步驟大小之第二量化表,可以與以上參考第9與10圖所說明之量化表相同。
本發明可以寫在電腦可讀取記錄媒體上之電腦可讀取碼而實現。此電腦可讀取記錄媒體可以為任何型式之記錄裝置,其中,資料以電腦可讀取方式儲存。此電腦可讀取記錄媒體之例包括:ROM、RAM、CD-ROM、磁帶、軟性磁碟、光學資料儲存體、以及載波(例如:經由網際網路之資料傳輸)。此電腦可讀取記錄媒體可以分佈於:此連接至網路之複數個電腦系統上,以致於可以非集中方式將電腦可讀取碼寫至此媒體且從其執行此等碼。此等須要用於實現本發明之功能程式、碼、以及碼區段,可以由對此技術有一般知識之人士容易地設想。
工業上之應用
如同以上說明,根據本發明可以藉由減少所須量化位元之數目,而加強編碼/解碼效率。在傳統上,可以藉由將此由複數個任意頻道間所構成各對頻道間之空間無區別地分割成31個區段,以計算複數個任意頻道間之CLD,以及因此總共須要5個量化位元。在另一方面,根據本發明,可以將一對頻道間之空間分割成若干區段,各區段具有例如角度3°。如果此對頻道間之角度為30°,則可以將此對頻道間之空間分割成11個區段,以及因而總共須要4個量化位元。因此,根據本發明,可以減少所須量化位元之數目。
此外,根據本發明,可以藉由參考說話者實際組態資訊以實施量化,而加強編碼/解碼之效率。隨著頻道數目增加,此資料數量增加31*N(而N為頻道之數目)。根據本發明,當頻道數目增加時,此將各對頻道間CLD量化所須量化步驟數量減少,以致於可以將整個資料數量維持均勻。因此,不僅可以將本發明應用至5.1頻道環境,而且將其應用至任意擴充頻道環境,以及因此可以使得能夠實施有效率之編碼/解碼。
雖然,以上參考典型實施例以特別顯示與說明本發明,然而,對於此技術有一般知識人士瞭解,其可以作形式與細節之各種改變,而不會偏離由以下申請專利範圍所界定本發明之精神與範圍。
101‧‧‧多頻道輸入
103‧‧‧技術向下混合信號(立體聲/單音)
105‧‧‧多頻道音訊信號
110‧‧‧向下混合器
120‧‧‧空間參數估計器
130‧‧‧空間參數解碼器
140‧‧‧空間參數綜合器
301‧‧‧聲源
302‧‧‧第一直接聲波
303‧‧‧第二直接聲波
306‧‧‧右耳
307‧‧‧左耳
401‧‧‧濾波器庫
402‧‧‧空間參數擷取單元
403‧‧‧量化單元
404‧‧‧位元流產生單元
910‧‧‧空間參數擷取單元
911‧‧‧第一空間參數測量單元
913‧‧‧第二空間參數測量單元
920‧‧‧量化單元
930‧‧‧解封裝單元
935‧‧‧逆量化單元
940、945、950‧‧‧操作
955、960、965‧‧‧操作
970、975、980‧‧‧操作
985、990、995‧‧‧操作
1000、1005‧‧‧操作
1010、1015‧‧‧操作
1020、1025‧‧‧操作
1030、1035‧‧‧操作
1040、1045‧‧‧操作
1050、1055‧‧‧操作
第1圖為根據本發明實施例之多頻道音訊信號編碼器與解碼器之方塊圖;第2圖用於說明多頻道組態;第3圖說明人耳如何感受音訊信號;第4圖為根據本發明實施例用於將多頻道音訊信號之空間參數編碼之裝置之方塊圖;第5圖說明藉由根據本發明實施例在第4圖中量化單元以說明虛擬聲音來源位置之判斷;第6圖藉由根據本發明另一實施例第4圖中量化單元以說明虛擬聲音來源位置之判斷;第7圖說明此根據本發明實施例使用角度區間將一對頻道間之空間分割成複數個區段;第8圖藉由根據本發明實施例第4圖中量化單元以說明頻道位準差異(CLD)之量化;第9圖說明此根據本發明實施例使用兩個或更多角度區間將一對頻道間之空間分割成數個區段;第10圖藉由根據本發明另一實施例第4圖中量化單元以說明CLD之量化;第11圖為根據本發明實施例在第4圖中所說明之空間參數擷取單元之方塊圖;第12圖為根據本發明實施例用於將多頻道音訊信號之空間參數解碼之裝置之方塊圖;第13圖為流程圖,其說明根據本發明實施例將多頻道音訊信號之空間參數編碼之方法; 第14圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數編碼之方法;第15圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數編碼之方法;第16圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數編碼之方法;第17圖為流程圖,其說明根據本發明實施例將多頻道音訊信號之空間參數解碼之方法;第18圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法;第19圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法;以及第20圖為流程圖,其說明根據本發明另一實施例將多頻道音訊信號之空間參數解碼之方法。
101‧‧‧多頻道輸入
103‧‧‧技術向下混合信號(立體聲/單音)
105‧‧‧多頻道音訊信號
110‧‧‧向下混合器
120‧‧‧空間參數估計器
130‧‧‧空間參數解碼器
140‧‧‧空間參數綜合器

Claims (9)

  1. 一種接收一位元流以及解碼具有複數個頻道之音訊信號的方法,該方法包括:從一位元流擷取複數個經量化空間參數以及量化資訊,該等經量化空間參數包括在該等複數個頻道的一對頻道之間的一經量化頻道位準差異(CLD)、一經量化頻道間相關(ICC)、以及一經量化頻道預測係數(CPC),以及該量化資訊係關於一量化模式;利用複數個量化表來逆量化該等經量化空間參數,該等量化表包括一CLD的量化表,該CLD的量化表具有複數個指數及CLD值,其中如果該量化模式為一第一模式,則利用該CLD的量化表將該經量化CLD逆量化為該等CLD值中的其中之一,以及如果該量化模式為一第二模式,則利用該CLD的量化表將該經量化CLD逆量化為該等CLD值的一部份中的其中之一。
  2. 依據申請專利範圍第1項所述的方法,其中,該第一模式的一量化解析度不同於該第二模式的一量化解析度。
  3. 依據申請專利範圍第1項所述的方法,其中,根據一欲被量化的信號之一能量位準來確定該量化模式。
  4. 依據申請專利範圍第3項所述的方法,其中,在該第一模式中欲被量化的信號之該能量位準高於一量化閾值。
  5. 依據申請專利範圍第1項所述的方法,其中,該CLD的量化表中的該等CLD值包括具有相同的絕對值以及不同的正負號的一對數值,以及該CLD的量化表中的該等CLD值的一範圍係在-150至150之間。
  6. 一種用於接收一位元流和解碼具有複數個頻道的音訊信號的裝置,該裝置包括:一解封裝單元,其用於從一位元流擷取複數個經量化空間參數以及量化資訊,該等經量化空間參數包括在該等複數個頻道的一對頻道之間的一經量化頻道位準差異(CLD)、一經量化頻道間相關(ICC)、以及一經量化頻道預測係數(CPC),以及該量化資訊係關於一量化模式;一逆量化單元,其利用複數個量化表來逆量化該等經量化空間參數,該等量 化表包括一CLD的量化表,該CLD的量化表具有複數個指數及CLD值,其中如果該量化模式為一第一模式,則利用該CLD的量化表將該經量化CLD逆量化為該等CLD值中的其中之一,並且如果該量化模式為一第二模式,則利用該CLD的量化表將該經量化CLD逆量化為該等CLD值的一部份中的其中之一。
  7. 依據申請專利範圍第6項所述的裝置,其中,該第一模式的一量化解析度不同於該第二模式的一量化解析度。
  8. 依據申請專利範圍第6項所述的裝置,其中,該CLD的量化表中的該等CLD值包括具有相同的絕對值以及不同的正負號的一對數值,以及該CLD的量化表中的該等CLD值的一範圍係在-150至150之間。
  9. 一種電腦可讀記錄媒體,具有記錄於其上的一程式,用於執行申請專利範圍第1項所述的方法。
TW097151236A 2005-09-27 2006-09-27 用於將多頻道音訊信號編碼/解碼之方法與裝置 TWI404429B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US72049505P 2005-09-27 2005-09-27
US75577706P 2006-01-04 2006-01-04
US78252106P 2006-03-16 2006-03-16
KR1020060065291A KR20070035411A (ko) 2005-09-27 2006-07-12 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치
KR1020060065290A KR20070035410A (ko) 2005-09-27 2006-07-12 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치

Publications (2)

Publication Number Publication Date
TW200932030A TW200932030A (en) 2009-07-16
TWI404429B true TWI404429B (zh) 2013-08-01

Family

ID=37899989

Family Applications (2)

Application Number Title Priority Date Filing Date
TW095135786A TWI333385B (en) 2005-09-27 2006-09-27 Method and apparatus for encoding/decoding multi-channel audio signal
TW097151236A TWI404429B (zh) 2005-09-27 2006-09-27 用於將多頻道音訊信號編碼/解碼之方法與裝置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
TW095135786A TWI333385B (en) 2005-09-27 2006-09-27 Method and apparatus for encoding/decoding multi-channel audio signal

Country Status (5)

Country Link
US (2) US8090587B2 (zh)
EP (2) EP1943642A4 (zh)
JP (2) JP2009518659A (zh)
TW (2) TWI333385B (zh)
WO (2) WO2007037613A1 (zh)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2629292B1 (en) * 2006-02-03 2016-06-29 Electronics and Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
WO2008076897A2 (en) * 2006-12-14 2008-06-26 Veoh Networks, Inc. System for use of complexity of audio, image and video as perceived by a human observer
US8560316B2 (en) * 2006-12-19 2013-10-15 Robert Vogt Confidence levels for speaker recognition
GB2470059A (en) * 2009-05-08 2010-11-10 Nokia Corp Multi-channel audio processing using an inter-channel prediction model to form an inter-channel parameter
CN102157151B (zh) 2010-02-11 2012-10-03 华为技术有限公司 一种多声道信号编码方法、解码方法、装置和系统
WO2011097903A1 (zh) * 2010-02-11 2011-08-18 华为技术有限公司 多声道信号编码、解码方法、装置及编解码系统
KR20120038311A (ko) * 2010-10-13 2012-04-23 삼성전자주식회사 공간 파라미터 부호화 장치 및 방법,그리고 공간 파라미터 복호화 장치 및 방법
BR112013026850B1 (pt) * 2011-04-20 2021-02-23 Panasonic Intellectual Property Corporation Of America Aparelhos de codificação e decodificação de áudio/fala e métodos decodificação e decodificação de áudio/fala
US8401863B1 (en) * 2012-04-25 2013-03-19 Dolby Laboratories Licensing Corporation Audio encoding and decoding with conditional quantizers
US9883312B2 (en) 2013-05-29 2018-01-30 Qualcomm Incorporated Transformed higher order ambisonics audio data
EP4294055B1 (en) 2014-03-19 2024-11-06 Wilus Institute of Standards and Technology Inc. Audio signal processing method and apparatus
FR3048808A1 (fr) 2016-03-10 2017-09-15 Orange Codage et decodage optimise d'informations de spatialisation pour le codage et le decodage parametrique d'un signal audio multicanal
US10559315B2 (en) 2018-03-28 2020-02-11 Qualcomm Incorporated Extended-range coarse-fine quantization for audio coding
US10762910B2 (en) 2018-06-01 2020-09-01 Qualcomm Incorporated Hierarchical fine quantization for audio coding
WO2020089510A1 (en) 2018-10-31 2020-05-07 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
US12308034B2 (en) 2019-06-24 2025-05-20 Qualcomm Incorporated Performing psychoacoustic audio coding based on operating conditions
US11361776B2 (en) 2019-06-24 2022-06-14 Qualcomm Incorporated Coding scaled spatial components
US12142285B2 (en) * 2019-06-24 2024-11-12 Qualcomm Incorporated Quantizing spatial components based on bit allocations determined for psychoacoustic audio coding
US11538489B2 (en) 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
CN112233682B (zh) * 2019-06-29 2024-07-16 华为技术有限公司 一种立体声编码方法、立体声解码方法和装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5995990A (en) * 1991-09-30 1999-11-30 Sgs-Thomson Microelectronics, S.A. Integrated circuit discrete integral transform implementation
TW453048B (en) * 2000-10-12 2001-09-01 Avid Electronics Corp Adaptive variable compression rate encoding/decoding method and apparatus
US6356870B1 (en) * 1996-10-31 2002-03-12 Stmicroelectronics Asia Pacific Pte Limited Method and apparatus for decoding multi-channel audio data
TW487833B (en) * 1999-12-21 2002-05-21 Casio Computer Co Ltd Body-wearable type music reproducing apparatus and music reproducing system which comprises such music reproducing apparatus
US20050180579A1 (en) * 2004-02-12 2005-08-18 Frank Baumgarte Late reverberation-based synthesis of auditory scenes

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
JP3237178B2 (ja) * 1992-03-18 2001-12-10 ソニー株式会社 符号化方法及び復号化方法
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP3024455B2 (ja) * 1992-09-29 2000-03-21 三菱電機株式会社 音声符号化装置及び音声復号化装置
JP3371590B2 (ja) * 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
JP3191257B2 (ja) * 1995-07-27 2001-07-23 日本ビクター株式会社 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置、音響信号復号化装置
JPH09230894A (ja) * 1996-02-20 1997-09-05 Shogo Nakamura 音声圧縮伸張装置及び音声圧縮伸張方法
US5812971A (en) * 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6442517B1 (en) * 2000-02-18 2002-08-27 First International Digital, Inc. Methods and system for encoding an audio sequence with synchronized data and outputting the same
JP2002016921A (ja) * 2000-06-27 2002-01-18 Matsushita Electric Ind Co Ltd 動画像符号化装置および動画像復号化装置
US6754624B2 (en) * 2001-02-13 2004-06-22 Qualcomm, Inc. Codebook re-ordering to reduce undesired packet generation
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
CN1312663C (zh) 2001-11-30 2007-04-25 皇家飞利浦电子股份有限公司 一种信号编码、解码的方法和装置
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
ES2323294T3 (es) * 2002-04-22 2009-07-10 Koninklijke Philips Electronics N.V. Dispositivo de decodificacion con una unidad de decorrelacion.
BR0305555A (pt) * 2002-07-16 2004-09-28 Koninkl Philips Electronics Nv Método e codificador para codificar um sinal de áudio, aparelho para fornecimento de um sinal de áudio, sinal de áudio codificado, meio de armazenamento, e, método e decodificador para decodificar um sinal de áudio codificado
JP4212591B2 (ja) * 2003-06-30 2009-01-21 富士通株式会社 オーディオ符号化装置
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
CN1867969B (zh) * 2003-10-13 2010-06-16 皇家飞利浦电子股份有限公司 用于对音频信号进行编码或解码的方法和设备
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
US7391870B2 (en) * 2004-07-09 2008-06-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V Apparatus and method for generating a multi-channel output signal
KR100737386B1 (ko) * 2004-12-31 2007-07-09 한국전자통신연구원 공간정보기반 오디오 부호화를 위한 채널간 에너지비 추정및 양자화 방법
ES2297825T3 (es) * 2005-04-19 2008-05-01 Coding Technologies Ab Cuantificacion dependiente de energia para la codificacion eficaz de parametros de audio espaciales.

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5995990A (en) * 1991-09-30 1999-11-30 Sgs-Thomson Microelectronics, S.A. Integrated circuit discrete integral transform implementation
US6356870B1 (en) * 1996-10-31 2002-03-12 Stmicroelectronics Asia Pacific Pte Limited Method and apparatus for decoding multi-channel audio data
TW487833B (en) * 1999-12-21 2002-05-21 Casio Computer Co Ltd Body-wearable type music reproducing apparatus and music reproducing system which comprises such music reproducing apparatus
TW453048B (en) * 2000-10-12 2001-09-01 Avid Electronics Corp Adaptive variable compression rate encoding/decoding method and apparatus
US20050180579A1 (en) * 2004-02-12 2005-08-18 Frank Baumgarte Late reverberation-based synthesis of auditory scenes

Also Published As

Publication number Publication date
EP1938313A4 (en) 2009-06-24
TW200932030A (en) 2009-07-16
US20090048847A1 (en) 2009-02-19
TWI333385B (en) 2010-11-11
EP1943642A1 (en) 2008-07-16
US7719445B2 (en) 2010-05-18
WO2007037621A1 (en) 2007-04-05
US8090587B2 (en) 2012-01-03
US20080252510A1 (en) 2008-10-16
EP1943642A4 (en) 2009-07-01
TW200719746A (en) 2007-05-16
WO2007037613A1 (en) 2007-04-05
JP2009510514A (ja) 2009-03-12
HK1132576A1 (zh) 2010-02-26
EP1938313A1 (en) 2008-07-02
JP2009518659A (ja) 2009-05-07

Similar Documents

Publication Publication Date Title
TWI404429B (zh) 用於將多頻道音訊信號編碼/解碼之方法與裝置
KR102230727B1 (ko) 광대역 정렬 파라미터 및 복수의 협대역 정렬 파라미터들을 사용하여 다채널 신호를 인코딩 또는 디코딩하기 위한 장치 및 방법
JP4887307B2 (ja) ニアトランスペアレントまたはトランスペアレントなマルチチャネルエンコーダ/デコーダ構成
EP2313886B1 (en) Multichannel audio coder and decoder
CN110890101B (zh) 用于基于语音增强元数据进行解码的方法和设备
CN111656441A (zh) 使用不同的时间/频率分辨率来编码或解码定向音频编码参数的装置和方法
US20100169102A1 (en) Low complexity mpeg encoding for surround sound recordings
JP2012177939A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP2020516955A (ja) マルチチャネル信号符号化方法、マルチチャネル信号復号方法、エンコーダ、およびデコーダ
JP6686015B2 (ja) オーディオ信号のパラメトリック混合
EP4258697B1 (en) Encoding and decoding method and encoding and decoding apparatus for stereo signal
KR20070001205A (ko) 방법, 디바이스, 인코더 장치, 디코더 장치 및 오디오시스템
IL244153A (en) Non-uniform parameter quantization for advanced coupling
WO2020008112A1 (en) Energy-ratio signalling and synthesis
CN112823534A (zh) 信号处理设备和方法以及程序
KR100917845B1 (ko) 상호상관을 이용한 다채널 오디오 신호 복호화 장치 및 그방법
JPWO2007029412A1 (ja) マルチチャンネル音響信号処理装置
EP1779385B1 (en) Method and apparatus for encoding and decoding multi-channel audio signal using virtual source location information
US8041041B1 (en) Method and system for providing stereo-channel based multi-channel audio coding
JP2006325162A (ja) バイノーラルキューを用いてマルチチャネル空間音声符号化を行うための装置
KR20070035411A (ko) 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치
HK1132576B (zh) 编码/解码多声道音频信号的方法和装置
KR20070075237A (ko) 멀티채널 오디오 신호의 인코딩 및 디코딩 방법
KR20070035410A (ko) 멀티 채널 오디오 신호의 공간 정보 부호화/복호화 방법 및장치