TWI440301B - 對於音訊動態處理具限制之階層式控制路徑 - Google Patents
對於音訊動態處理具限制之階層式控制路徑 Download PDFInfo
- Publication number
- TWI440301B TWI440301B TW096139833A TW96139833A TWI440301B TW I440301 B TWI440301 B TW I440301B TW 096139833 A TW096139833 A TW 096139833A TW 96139833 A TW96139833 A TW 96139833A TW I440301 B TWI440301 B TW I440301B
- Authority
- TW
- Taiwan
- Prior art keywords
- level
- channel
- dynamic
- audio
- signal
- Prior art date
Links
- 238000012545 processing Methods 0.000 title description 28
- 230000005236 sound signal Effects 0.000 claims description 84
- 230000004048 modification Effects 0.000 claims description 40
- 238000012986 modification Methods 0.000 claims description 40
- 238000000034 method Methods 0.000 claims description 20
- 230000004044 response Effects 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 4
- 230000006870 function Effects 0.000 description 56
- 238000005259 measurement Methods 0.000 description 19
- 238000012546 transfer Methods 0.000 description 15
- 230000006835 compression Effects 0.000 description 10
- 238000007906 compression Methods 0.000 description 10
- 238000001228 spectrum Methods 0.000 description 10
- 230000005284 excitation Effects 0.000 description 9
- 238000009499 grossing Methods 0.000 description 6
- 230000002238 attenuated effect Effects 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 230000007774 longterm Effects 0.000 description 5
- 230000006399 behavior Effects 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000009977 dual effect Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000008447 perception Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000000926 separation method Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 230000003595 spectral effect Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 210000003454 tympanic membrane Anatomy 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 210000000883 ear external Anatomy 0.000 description 1
- 210000000959 ear middle Anatomy 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G7/00—Volume compression or expansion in amplifiers
- H03G7/007—Volume compression or expansion in amplifiers of digital or coded signals
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03G—CONTROL OF AMPLIFICATION
- H03G9/00—Combinations of two or more types of control, e.g. gain control and tone control
- H03G9/005—Combinations of two or more types of control, e.g. gain control and tone control of digital or coded signals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S7/00—Indicating arrangements; Control arrangements, e.g. balance control
- H04S7/30—Control circuits for electronic adaptation of the sound field
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Stereophonic System (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
- Control Of Amplification And Gain Control (AREA)
- Circuit For Audible Band Transducer (AREA)
Description
本發明關於音訊信號處理器、音訊信號處理,及用於控制音訊信號處理器和音訊信號處理之軟體。依據本發明之層面,一種用於動態處理之階層式控制路徑被提供,且對於音訊信號動態處理之限制以一階層式方式被施加,以提供改良性能。
音訊動態處理之目的是改變一音訊信號之相對位準或動態,以在一些所希望的限制之內。這一般是藉由以下來實現的:建立一音訊信號之位準的某種時變量值(例如,均方根值(rms)位準或峰值位準),且接著計算並施加一信號修改(例如,一增益改變),該信號修改是該位準量值之一函數。共用這樣的一操作模式之動態處理器被提及於Alan Jeffrey Seefeldt的國際專利申請案PCT/US 2005/038579(以WO 2006/047600,於2006年5月4日被公開),且包括自動增益控制(AGC)、動態範圍控制(DRC)、擴充器、限制器、雜訊閘等。該Seefeldt申請案在其他實體中指定美國。該申請案全部在此以參照方式被併入本文。
第1圖描述處理一音訊信號(一多頻道音訊信號之一單一頻道或僅具有一個頻道之一音訊信號)的一般音訊動態處理器之一高階(high-level)方塊圖。該處理器可被認為具
有兩個路徑:一上“信號”路徑2和一下“控制”路徑4。在該下控制路徑上,該音訊信號之位準被一量測裝置或程序(“位準量測”)6量測,且此量測(該信號位準之一量值)接著被一動態控制裝置或程序(“動態控制”)8利用,以計算一個或更多信號修改參數。這些參數做為信號修改控制信號而作用,且被用以依據以下所描述的一動態處理函數修改該音訊信號,該動態處理函數可以是一所希望的動態處理曲線(profile),諸如第3b圖中所顯示的。正如所顯示的,該等修改參數自該輸入音訊信號獲得。另外,該等修改參數可自已處理(輸出)音訊獲得或從該輸入和輸出信號之一組合獲得。在該音訊信號路徑2中,由該動態控制8產生之該等修改參數被施加到該音訊,以控制該音訊的修改,從而產生已處理音訊。對一音訊信號施加該等修改參數可採用許多習知的方法來完成,且一般藉由乘法器符號12表示。在該音訊路徑2中,該音訊可被一延遲裝置或程序(“延遲(Delay)”)10延遲,以補償與位準估計和動態控制程序有關的任何延遲。
當處理複雜多頻道音訊材料時,在計算和施加該等信號修改時必須小心,以避免可察覺的人工因素的引入。一基本的動態處理器接收一多頻道音訊信號輸入,可能計算一代表全部被組合的所有頻道之一信號位準,且接著基於這樣一總體位準量值,施加相同的修改到所有頻道。採用相同方法修改所有頻道,這樣一種方式具有維持所有頻道之間相對位準的優勢,從而保持空間影像(包括例如,頻道
之間所平移虛擬影像的位置以及感知擴散性)。如果所施加修改並不過於侵犯性的話,這樣的一種方法可能效果良好。
然而,當所希望的修改過於劇烈時,問題可能顯現。考慮一多頻道音訊信號(例如,5.1頻道),一具有一非常高壓縮率的動態範圍控制器被用於該多頻道音訊信號。使用這樣一處理器,高於該壓縮臨限值的信號被明顯衰減,以使該信號位準較接近該臨限值。假設該音訊信號包含相對恒定位準背景音樂於所有頻道中,對此,組合所有頻道之後的總體位準低於該壓縮臨限值。進一步假設,一段簡短但響亮的對話被引入到中心頻道。由於該對話,被組合的所有頻道的該總體位準此時超出該壓縮臨限值,且整體信號因此被衰減。一旦該對話結束,該信號位準降回該壓縮臨限值以下,且無衰減被施加。因此,由於該中心頻道中的該對話,來自左側、右側、左環繞和右環繞頻道的該背景音樂被聽到是位準波動的或起伏不定的。此效果對於一聽者來說可能是非常不自然的聲音和擾動。這種類型的人工因素(交叉調變(cross-modulation)或交互調變(intermodulation)的類型)在音訊動態處理領域中已得到充分地認識,且一典型的習知解決方案涉及施加與各頻道無關的動態範圍控制。雖然這樣的解決方案可糾正上述問題,但其可能具有改變該音訊的該空間影像的缺點。特別是,由於被施加到兩個頻道的衰減量不同,該兩個頻道之間所平移的虛擬源可能像是在“遊蕩(wander)”。因此,就需要一種解決方案,處理包括該起伏(pumping)和不穩定影像
兩個問題。
當考慮一單一頻道音訊的頻譜時,存在類似的問題。考慮包含一持續弦樂音符於中至高頻的一單一頻道中,對此該信號位準低於壓縮臨限值。現在考慮一非常響亮的低音鼓敲擊聲被引入低頻,導致該信號位準即刻增加,高於該壓縮臨限值。由於該低音鼓,該整體信號即刻被衰減,導致該等弦樂被感覺位準不自然地上下起伏。對於此問題的一種典型的習知的解決方案是分解該音訊信號到多個頻帶,且接著施加與各頻帶無關的動態範圍控制。這減少起伏問題,但可能改變感知頻譜平衡或音色。因此,就需要一種減少起伏同時減少感知頻譜平衡中改變的解決方案。
依據本發明之層面,對修改一音訊信號之動態有用的資訊自一個或更多裝置或程序獲得,該一個或更多裝置或程序操作於複數個階層的每一個的一個或更多對應節點,每一階層具有一個或更多節點,其中操作於每一階層的該一個或更多裝置或程序,對該音訊信號之一個或更多特徵進行量測,藉此操作於每一相繼的較低階層的該一個或更多裝置或程序,對該音訊信號的進一步地較小分段(subdivision)之一個或更多特徵進行量測。對修改一音訊信號的動態有用的資訊可以一裝置或程序被施加到一音訊信號,該裝置或程序與獲得該資訊之裝置或程序相連,或此資訊可能與該音訊信號一起被運載作為元資料
(metadata),例如,藉此該資訊可被空間上和/或時間上遠端施加到該音訊信號。該音訊之該等進一步地較小分段可包括(1)頻道分段和(2)頻帶分段中之一個或兩個。在每一階層的每一節點之該一個或更多裝置或一個或更多程序,於該節點之階層對該音訊進行量測,且可自該音訊信號之此量值獲得資訊,也可自可能接收自另一階層之一個或更多裝置或程序的資訊獲得資訊,正如下面進一步所解釋的。
該層級之一第一(最頂)層可包含一根節點,其對該音訊信號之一總體進行量測。在一多頻道音訊信號情況中,至少一個較低階層可包含複數個節點,每一節點對該音訊信號之一頻道分段進行量測,且至少一個進一步較低階層可包含複數個節點,每一節點對該音訊信號之頻道之一頻率分段進行量測。在一單一頻道音訊信號情況中,至少一個較低階層可包含複數個節點,每一節點對該音訊信號之一頻率分段進行量測。
依據本發明之進一步層面,於一特定階層自該音訊信號的一量值所獲得之資訊可在該層級中被向下傳遞給一個或更多較低階層,以影響操作於此等階層之該等裝置或程序的操作。於一特定階層自該音訊資訊的一量值所獲得之資訊可不僅包含對影響操作於一個或更多較低階層之裝置或程序的操作有用之資訊,還包含對修改該音訊信號的動態有用之資訊。
依據本發明之又進一步層面,於一特定較低階層自該音訊信號所獲得的一量值所獲得之資訊和自被傳遞到這樣
一較低階層的資訊所獲得之資訊,可被使用以影響操作於這樣一較低階層之該等裝置或程序之操作。這樣的影響可能,例如,使得該較低階層產生該資訊之一修改,否則其將以其他產生。另外,或此外,於一特定較低階層自該音訊信號所獲得的一量值和同樣自被傳遞到這樣一較低階層的資訊所獲得之資訊可在該層級中被向上傳遞給一個或更多較高階層,以影響操作於此等較高階層之該等裝置或程序之操作。這樣的影響可能,例如,使得該較高階層產生該資訊之一修改,該修改又將傳遞給到一個或更多較低階層,或該修改將被使用於修改該音訊信號。
第2a圖描述依據本發明之層面的階層式控制路徑結構的一範例之一示意性概觀,其中資訊從頂部到底部被向下傳遞於一控制路徑層級(一“自上而下”階層式配置)。在此自上而下控制路徑階層式範例中,進入動態處理器或程序的輸入信號是一多頻帶音訊信號,且該等階層是(1)所有頻道的所有頻帶(“總體”階層)、(2)多頻道音訊信號中的頻道(“頻道”階層)和(3)每一頻道中的頻帶(“頻帶”階層)。在該頻帶階層之對應的動態控制裝置或程序之輸出(在該圖的右手側)可起信號修改信號之作用來控制信號,且可被應用,從而修改該等音訊信號於正在被處理之音訊信號的對應的頻道和頻帶中,正如第2b圖中所示,下面所描述的。另外,這樣的控制信號可與該音訊信號一起被運載作為元資料,藉此該資訊可被施加到該音訊信號,例如,採用第2b圖的方式,例如,於一空間上和/或時間上的遠端位置。正如下面
進一步所解釋的,被向下傳遞於該層級之該資訊可包括多於適用於控制該音訊信號的修改之修改參數(假如它們被施加到它的話)--被向下傳遞於該層級之該資訊可包括在動態控制裝置或程序中可用於影響這樣的裝置或程序之操作的控制參數(這樣的控制參數可被稱為“動態控制參數”,且這樣的參數可包括適用於直接或間接控制該音訊信號的“修改參數”)。
被施加於第2a圖階層式控制路徑之輸入信號可自被施加於一音訊動態處理器所獲得之一音訊信號(該第2a圖控制路徑是該音訊動態處理器之一部分)獲得,或另外自這樣的一音訊動態處理器之已處理(輸出)音訊信號獲得,或自這樣的輸入和輸出音訊信號之一組合獲得。
在第2a圖中,實線表示具有頻道x 1...x C 之一多頻道音訊信號之音訊流,且每一頻道具有一個或更多頻帶或“子頻帶”b 1...b n。雖然,原則上,本發明之層面可被實現於類比、數位或混合類比/數位實施例,但在實際實施例中,對該音訊的處理可於數位域中被執行。每一動態控制裝置或程序之虛線輸出表示一個或更多由對應的動態控制裝置或程序所產生之動態控制參數。動態控制參數可被耦接到在該控制路徑層級之較低階層的動態控制裝置或程序,為的是強加限制之目的。例如,正如結合下面所描述的一範例所解釋的,長期信號位準、長期增益和短期增益的值可被向下傳遞,從該總體階層向該頻道階層並從該頻道階層向該頻帶階層,來實施限制。在這之中,在此所描述的範例中,
僅在該頻帶階層的短期增益被應用以控制該音訊信號之動態(且這樣的短期增益可被時間平滑化,同樣如在所描述的一範例中)。
原則上,被向下傳遞於該層級之資訊可略過被施加到一個或更多階層。同樣,原則上,來自除該頻帶階層以外的階層之資訊可被應用(除了或代替來自該頻帶階層之資訊)以控制該音訊信號之動態。這樣的資訊可被時間平滑化。
因此,在該第2a圖控制路徑範例中,具有頻道x 1...x C 之一多頻道音訊信號被施加於一第一階層式控制路徑層(該總體階層),其中一裝置或程序(“總體位準量測”)14為被組合的所有音訊頻道的總體計算一平均信號位準量值。總體位準14之操作類似於第1圖之位準6之操作,除了總體位準14操作於一多頻道音訊信號之所有頻道,而非於一多頻道音訊信號或僅具有一個頻道之一音訊信號之單一頻道。藉由總體位準14所獲得之該量測(總體信號位準之一量值),可接著被一動態控制裝置或程序(“動態控制”)16所利用,以計算一個或更多總體階層動態控制參數,其可包括一個或更多信號修改參數。由動態控制16所計算的一些或所有該等動態控制參數可被向下傳遞給該頻道階層中的動態控制20,為了被這樣的動態控制於其等操作中使用。由該總體階層之動態控制16所計算的修改參數或其功能可被施加到該音訊信號,但並不於此範例中。
下一步,在一第二階層式控制路徑層中(該頻道階層,
此範例中的下一較低階層),每一頻道x 1到x C 分別被施加到其自己的位準量測和動態控制裝置或程序對18-1到18-c和20-1到20-c。每一位準量測18-1到18-c可操作於一類似於第1圖之位準量測6之方式,來為被施加到其上之特定音訊頻道計算一平均信號位準量值。自那位準量值,該位準/動態控制對中的每一動態控制20-1到20-c計算一個或更多動態控制參數,其可包括一個或更多信號修改參數。然而,除了與該第1圖動態控制8不同在於產生動態控制參數而非修改參數之外,第2a圖配置中之該等動態控制20-1到20-c還不同在於接收一個或更多由上面階層步驟中之動態控制16所計算之動態控制參數。這樣的較高階層動態控制參數可被使用以限制或影響對應的動態控制20-1到20-c之操作。由動態控制20所計算的一些或所有該等動態控制參數可被向下傳遞給該頻帶階層中之動態控制26,用於由這樣的動態控制於其等操作中使用。由一個或更多動態控制20所計算的修改參數或其功能可被施加到該音訊信號,但並不於此範例中。
下一步,在一第三階層式控制路徑層中(該頻帶階層),該音訊信號之每一頻道x 1到x C 被施加到一頻帶分離裝置或功能(“頻帶分離”)22-1到22-c,其將每一音訊頻道分離到複數個頻帶b 1到b n。用於將一音訊信號分離到頻帶的許多裝置和程序是該技藝中所習知的(濾波器組、帶通濾波器、正交鏡相濾波器、時頻轉換等)。任何特定的這樣的頻帶分離器的使用並非本發明之關鍵。每一頻道的每一頻帶分別被施
加到其自己的位準量測和動態控制裝置或程序對24-1-1到24-c-n和26-1-1到26-c-n。每一位準量測24-1-1到24-c-n可操作於一類似於第1圖之位準量測6之方式,來為被施加到其上之該音訊頻道之特定頻帶計算一平均信號位準量值--因此,其操作於一頻帶階層而非一頻道階層。自與其成對的該位準量測所提供之該信號位準量值,每一動態控制26-1-1到26-c-n以一類似於第1圖之動態控制8之方式來計算信號修改參數。然而,不同於該第1圖之動態控制8的是,該第2a圖範例中之該等動態控制26-1-1到26-c-n還可接收一個或更多由與上面階層步驟中之相同頻道相關的動態控制20所計算的動態控制參數。這樣的較高階層修改參數可被使用以限制或影響操作於一頻道中之頻帶的對應的動態控制26-1-1到26-c-n的操作。由動態控制26-1-1到26-c-n的每一個所計算的一個或更多修改參數可被施加到該音訊的每一頻道的頻帶,正如第2b圖中所示。在該頻帶階層中,由於在此範例中其為該層級之底層,該等動態控制26不必提供一動態控制參數輸出(不需要),但卻提供一個或更多修改參數之一輸出,其可被使用以控制該音訊信號之修改,正如第2b圖中所示。
參考第2b圖,以一類似於第1圖之該上方信號路徑之方式,音訊的每一頻道的一特定頻帶(音訊頻道1頻帶1到音訊頻道c頻帶n)被施加於具有一對應的延遲10-1-1到10-c-n和一對應的乘法器12-1-1到12-c-n之一對應的信號路徑。如第1圖中,該等乘法器一般地藉由一乘法器符號顯示,以表示
依據一個或更多修改參數修改該音訊信號之任何適當的方法。該等乘法器的每一個從一相對應的動態控制26-1-1到26-c-n接收一個或更多修改參數(即,該頻道1頻帶1音訊由來自用於頻道1頻帶1之該動態控制的修改參數來修改等)。另外,由該層級之其他層所產生的其等之修改參數或功能,可被施加到該音訊信號、其頻道之一個或更多個和/或其頻道之一個或更多個之一個或更多頻帶。
雖然第2a和2b圖之範例顯示總體階層、頻道階層和頻帶階層之一個三層層級,但本發明之層面並不僅限於一個三層層級,且該層級可以是一不同次序的。例如,可能不希望執行多頻帶修改,在這種情況中,僅具有一總體階層和一頻道階層之一個二層層級即可為合適。同樣地,可能不想允許頻道之間的任何無關(independence),從而可能使用一個僅具有一總體階層和一頻帶階層之二層層級。換句話說,可能不想對不同頻道施加不同修改參數--該等頻帶可能被不同地處理,但每一頻帶可能以相同的方法對所有頻道被修改。正如上面所提到的,每一階層可包含一個或更多裝置或程序。第2a和6圖之該三階層範例可被擴展到包括更多階層。例如,並不在一層中將該信號分成複數個頻帶,而可能在一第一頻帶層中將該信號分成兩個頻帶。接著這些頻帶的每一個可能在一第二頻帶層中被進一步分成更多的兩個頻帶等。同樣地,分裂頻道也可能發生於多於一個的階層中。例如,在該總體層之後,該等頻道可能在一第一頻道階層中被分成三組:(1)左側和右側、(2)中心
和(3)左環繞和右環繞。接著在下一頻道階層,該左側和右側組可明確地被分成左側和右側。同樣地,該左環繞和右環繞組可明確地被分成左環繞和右環繞。
具有第2a和2b圖之範例的方式及其變化的限制之一控制路徑層級可應用到廣泛的各種動態處理應用中,諸如壓縮器、限制器、擴充器等。然而,為解釋的簡單,本發明層面之範例以動態範圍控制(DRC)為,背景被描述,其中一音訊信號之原始動態範圍被減少。換句話說,該音訊之響亮部分被弱化和/或輕聲部分被加強了。這樣的處理是有用的,例如,當想要在深夜於一減小的平均音量聆聽一段音訊時。
第3a圖描述一DRC之一典型輸入/輸出曲線或轉換函數,其中水平軸是以對數表示的該輸入信號位準,且垂直軸是以對數表示的所希望的輸出信號位準。信號位準一般地表示任何一些可能的量值;例如rms位準或心理聲學響度位準,正如將於一較佳實施例中所描述的。在該曲線或轉換函數的“零頻帶”區域中,曲線的斜率為一,表示無信號修改被實施。在該零頻帶之上和之下,該斜率小於一,表示壓縮被施加--在該零頻帶之上,該音訊被衰減,且低於該零頻帶,該音訊被增強。第3b圖描述第3a圖輸入/輸出曲線或轉換函數之一等效表示法,其用增益的對數代替垂直軸上的該輸出信號位準,其當被應用到該輸入信號位準時,產生所希望的輸出信號位準。在此背景下,術語“增益”應該一般地代表增強或衰減該信號之一修改。這樣的“增
益”可以是直接與該信號相乘之一值或其可能是一些更複雜的,諸如感知響度的一縮放比例(scaling),正如將於一較佳實施例中所描述的。由於限制被施加到這樣的增益上,所以該動態曲線或轉換函數之此另一表示法(也就是第3b圖表示法)被用於此範例之剩餘部分。
典型地,一音訊動態處理器中之輸入信號位準L是使用一相對短的時間常數之信號位準之一時變量值--例如rms信號位準,在幾毫秒時間段上積分。為了強加限制之目的,一相對應的長期(或平均)信號位準也可被計算。可以是如L的相同的基本量值(例如,rms、峰值等),但具有一明顯較長的時間常數--例如,一秒或更多秒級(order)的。
雖然L與的時間常數並非關鍵性的,但應該瞭解的時間常數大於L的時間常數。在動態範圍控制(DRC)的情況中,該短期時間常數可以是等量於人體響度感知時間解析度(一個人能感知響度變化的最短時間間隔),且該長期可以是等量於足夠一個人將“短期”響度整合成一聲源響度的一心理聲學印象之一時間。
在一個三層控制路徑層級中,諸如第2a圖之範例,被組合的所有音訊頻道之總體、每一個別頻道,和每一頻道中多頻帶的每一個之一短期和一平均(長期)信號位準量值,可於該等對應的動態控制16、20和26中被計算。信號位準的這樣的量值可分別被稱為L T 和、L C 和及L B 和,且可表示對數值,例如,如第3a和3b圖中顯示。
至於一個三階層式控制路徑配置,諸如第2a圖之範例,限制的施加可自為該總體階層指定一所希望的動態處理曲線開始,諸如第3b圖中所顯示的分佈。這樣的一曲線一般可被一函數F T {L}表示,該函數F T {L}將增益G與信號位準L於該總體階層聯繫起來。因此G=F T {L} (1a)
每一信號位準量值L(無論如何量測出的(例如,rms、峰值等))可被認為與從相關動態處理函數F T 所計算的假想(notional)增益G有關。因此增益G T 和可依據以下自L T 和計算出G T =F T {L T } (1b)
下一步,對於在該頻道控制路徑階層之每一頻道,將增益G與信號位準L於該頻道階層聯繫起來之一動態處理函數F C {L}可從F T 獲得,該動態函數F C {L }限制=(這裏G C 和為分別與L C 和相關的假想增益)。獲得具有所希望限制的該動態函數F C {L}可藉由以下來實現:將F T 的輸入自變數移位該平均信號位準和之差(若有的話,依信號條件而定)(看第4b圖):
依信號條件,結果可能是該函數F T 在該增益/位準軸上之一移位,保留所希望動態處理曲線之形狀,但全部都水平移動-,藉此該平均頻道位準和與該頻道函數F C 有關的變化臨限值之間的關係就等同於該總體信號位準
和與該總體函數F T 有關的臨限值之間的關係。這樣的位移被顯示於第4a-c圖中,並在下文做進一步描述。等式2a表示定義F T 和的資訊從該總體階層被傳遞到該頻道階層。
根據該所得頻道動態處理函數F C ,該等增益G C 和可被計算如下:G C =F C {L C } (2b)
根據以上等式可以看出:
在根據該總體動態函數F T 建構該頻道動態函數F C 以使=中,G C 在時間上的平均值等於G T 在時間上的平均值。換句話說,對一頻道的修改,平均來看,等於總體上對該信號所希望的修改。然而,在一短期基礎上,和維持相對常數,且G C 作為該頻道信號位準L C 之一函數,以降低或防止交叉頻道起伏。
作為一範例,再一次考慮該多頻道音訊信號,在所有頻道中都具有音樂且接著一段簡短響亮的對話被引入中心頻道。在該對話的引入之前,該平均總體信號位準與該短期總體信號位準L T 都位於該動態函數F T 的零頻帶中。從而,該函數不需要修改。在所有頻道中,至於F C ,該等信號位準和L C 也是同樣。當該對話被引入時,在該中心頻道中的該短期信號位準L C 明顯增加,高於F C 的壓縮臨限值,導致衰減。然而,在其餘頻道中的該等信號位準的行為保持原狀且無衰減被施加。因此,以一短暫的空間影像
的變更作為代價,交叉起伏被降低或被防止。然而,若該響亮對話繼續,該平均總體信號位準慢慢增加高於該壓縮臨限值。這逐漸導致一慢慢增加的衰減被施加到所有頻道,由於建立該等頻道函數F C 時所使用的該等限制之緣故。這繼續進行直到被施加到所有頻道之平均衰減達到被施加到該中心頻道中的該繼續對話之衰減的位準。因此,依據本發明之層面之一階層式限制配置可提供降低或防止交叉頻道起伏和保持空間影像之間的平衡。
同樣的原理應用於一頻道中的該等個別頻帶。一特定頻帶的動態處理函數F B 可根據該頻道的該函數來建立,其中的一部分正如該頻道函數可根據該總體函數來建立。該函數F B 可藉由以下來實現:將F C 的輸入自變數移位該平均信號位準和之差(若有的話,依信號條件而定)(看第4c圖):
等式3a表示定義F C 和之資訊從該等頻道階層被傳遞到該頻帶階層。
該等頻帶增益依據以下被計算:G B =F B {L B } (3b)
此建立限制=,這在下面被顯示:
因為=,所以頻帶增益G B 在時間上的平均值近似等於G C 在時間上的平均值,但在一短期基礎上,該增益G B
依該頻帶信號位準L B 之函數而變化,以降低或防止交叉頻譜起伏。第4a-c圖描述該所描述之程序:以F T 之一移位版本建立F C 和以F C 之一移位版本建立F B ,藉此==。該總體階層到頻道階層移位被顯示於第4b圖中。該頻道階層到頻帶階層移位被顯示於第4c圖中。第4a-c圖可一起來看以看出該所希望的動態處理曲線是如何從總體層到頻道層再到頻帶層而向下被傳遞的。
理想地,根據F C 建立F B 和根據F T 建立F C 中所使用的該等限制,保證被施加到一頻道中的每一頻帶的平均修改實質上等同於對整個頻道的平均修改,且保證被施加到每一頻道的平均修改實質上等同於對被組合之所有頻道的平均修改。因為這樣的限制並不限定該等修改的範圍於其平均值附近,所以某些情況可能是有問題的。再一次考慮該多頻道音訊信號,在所有頻道中都具有音樂且接著一段簡短響亮的對話被引入中心頻道。當該對話被引入時,該總體信號位準L T 增加一定量,高於該平均總體信號位準,且該動態函數F T 需要對該信號之一全面衰減。在該中心頻道中,該信號位準L C 也增加,高於該平均信號位準,但L C 相對於的增加比L T 相對於的增加大得多,因為具有來自包含音樂之所有其他頻道的貢獻。結果,由F C 所計算的衰減明顯大於由F T 所計算的所希望的全面衰減。為了減少這樣的問題,就希望除了對該等修改的平均行為進行限制以外,還對其等範圍進行限制。
這樣的範圍限制可能被實施於多種方法,但一種簡單且有效的技術涉及限制該頻道增益G C 位於該總體短期增益G T 和平均增益之間,且接著進一步限制該頻帶增益G B 位於該頻道短期增益G C 和平均增益之間。從而,當範圍限制也被實施時,自該總體階層被傳遞到該頻道階層之該資訊不僅包括定義F T 和之資訊,還包括定義G T 和之資訊,且自該頻道階層被傳遞到該頻帶階層之該資訊不僅包括定義F C 和之資訊,還包括定義G C 和之資訊。假設和代表此等範圍受限頻道增益和頻帶增益,該等限制可依據以下邏輯被形式上書寫:
I)總體到頻道限制:
A)若G T <=則
i)若G C <G T 則=G T
ii)否則若G C >則=
iii)否則=G C
B)否則若G T >則
i)若G C >G T 則=G T
ii)否則若G C <則=
iii)否則=G C
II)頻道到頻帶限制:
A)若<=則
i)若G B <則=
ii)否則若G B >則=
iii)否則=G B
B)否則若>則
i)若G B >則=
ii)否則若G B <則=
iii)否則=G B
第5a和5b圖描述從總體到頻道再到頻帶傳遞的範圍限制的兩個範例。在每一情況中,來自該層級的一當前位準之限制區域被向下傳遞到下一層。在上面一列中指明,在該頻道階層,限制I.A.i(依據上面邏輯)被強加。在該頻帶階層,限制II.A.ii接著被強加。在下面一列中,在該頻道階層,限制I.A.iii被強加,且在該頻帶階層,限制II.A.i被強加。
在上面的該等範例中,限制被施加於一“自上而下”方式,從較高到較低階層傳遞(總體到頻道再到頻帶,於第2a和2b圖範例中)。實施本發明之一進一層面也可能是有益的,其中“由下而上”第二限制與自上而下第一限制一起被實施。
依據本發明之另一層面,在第2a圖之範例背景下,第6圖描述除了應用第2a圖之自上而下階層式控制之外,還應用階層式“由下而上”限制之一般概觀。在第2a圖範例中使用自上而下限制的過程當中,該等動態控制的每一個產生一個或更多受限參數,在第6圖中由單虛線表示。
正如對應於第2a圖範例,被施加到第6圖階層式控制路徑之輸入信號可自被施加到一音訊動態處理器之一音訊信號獲得(第6圖控制路徑是該音訊動態處理器之一部分),或
另外自這樣一音訊動態處理器之已處理(輸出)音訊獲得,或自這樣的輸入和音訊信號之一組合獲得。
為了開始施加由下而上限制之程序,該等自上而下參數可首先於一分析裝置或程序(“分析”)27中被分析,遍及所有頻道中的所有頻帶,以產生第二頻帶階層限制,其可在該頻帶層向後被傳遞給所有動態控制,且,可取捨地,在該層級中向上被傳遞給所有頻道。正如下面進一步所描述的,分析27可計算,例如,所有其輸入之一最小值或一平均值。在第6圖中,這樣一個或更多第二頻帶限制被顯示為來自該頻帶階層之分析27的雙虛線輸出。這樣一個或更多第二頻帶限制被施加到該頻帶階層中的每一動態控制26’-1-1到26’-c-n並被其等所利用,以進一步限制第2a圖之自上而下動態控制參數。這樣的雙受限(即,向下受限和向上受限)一個或更多動態控制參數由每一頻帶動態控制26’-1-1到26’-c-n輸出處之雙虛線表示。換句話說,由該等頻帶動態控制26’-1-1到26’-c-n的每一個所產生之該等雙受限動態控制參數(以雙虛線顯示)是由第2a圖之動態控制26-1-1到26-c-n所產生之該等自上而下受限修改參數以進一步被來自分析27之輸出的該一個或更多由下而上第二限制所限制之結果。
可取捨地,來自分析27之輸出的該等第二限制還被於該層級中向上傳遞給該頻道階層。在那種情況中,在該頻道階層,遍及所有頻道的該等自上而下受限動態控制參數(單虛線所表示的)與接收自分析27之該一個或更多第二頻
帶限制一起被一分析器裝置或功能(“分析”)21分析,以產生雙受限修改參數,在該頻道階層,由分析21的雙虛線輸出表示。這樣一第二頻道階層限制被該頻道階層中的每一動態控制20’-1到20’-c所利用,以產生一個或更多雙受限動態控制參數,在該頻道階層,由每一動態控制20’的輸出處之雙虛線表示。
可取捨地,來自分析21輸出之該等第二限制也可於該層級被向上傳遞給該總體階層。在那種情況中,用於該總體階層之該等自上而下受限動態參數與該等第二頻道限制一起被一分析裝置或處理(“分析”)17分析,以產生一第二總體限制,其接著在該總體階層被使用以產生一個或更多雙受限動態控制參數。
在施加這樣的第二、由下而上限制之後,幾個動態控制之輸出處的雙受限修改參數可被使用以修改該音訊。例如,該頻帶階層之該等動態控制26’-1-1到26’-c-n之該等輸出處的該等參數可被使用以修改該音訊信號之每一頻道中的個別頻帶。另外,該頻道階層之該等參數可被使用以一致地(uniformly)修改每一頻道,遍及頻帶,該總體階層之該等參數可被使用以一致地修改所有頻道,或各種階層之參數的一些組合或其功能,可被使用以修改該音訊信號。
這樣的第二由下而上限制當動態處理系統處於“釋放”模式(意思是該短期總體信號位準L T 小於該平均總體信號位準)時是尤其有用的。為了理解這樣限制的需要,再一次考慮該多頻道音訊信號,在所有頻道中都具有音樂且在
中心頻道中具有對話。假設該響亮對話在該中心頻道中已經持續了一明顯時間段。因此,該等自上而下限制已經趨於一穩定狀態行為,使得所有頻道接受近似相同量的衰減。現在假設該對話突然停止,僅留下較低位準之音樂信號於所有頻道中。該總體信號位準L T 瞬間下降,低於該平均總體信號位準,進入該動態函數F T 的零頻帶,意味著與先前衰減比較起來,G T 不需要修改。在對話出現的中心頻道中也是同樣的。然而,在其餘頻道中,L C 的行為對於來說維持不變,意味著先前衰減繼續。因此,對於該等其餘頻道來說,該中心頻道現在被增強了,扭曲了該音樂的空間影像。此扭曲繼續,直到該平均總體信號位準降低到該音樂的平均位準(位於該零頻帶),那時該自上而下限制導致無修改被施加到該等其餘頻道。因此隨著慢慢降低時,該音樂之空間影像被扭曲一明顯時間段。
為了處理此問題,當L T <時,可施加一第二由下而上限制。對於剛剛所描述的特定問題,可對所有頻道分析的值,且對於所有頻道限制這些值和G T 都等於的最小值。這防止任何一個頻道被增強多於任何其他頻道。同樣的原理可被向下擴展到該等頻帶。若L T <,遍及所有頻帶和頻道的值可被限制等於此組值中的最小值。接著此最小值被傳回給頻道,其中所有頻道的被設定等於包括所有頻道的之該組的最小值及來自頻帶限制之最小值。此頻道最小值最終可被傳回給該總體,其中G T 被設定等於G T 的最小值及先前頻道最小值。
該等所述階層限制(自上而下和由下而上)的應用可能在時間上引入突發的不連續於增益軌跡中。若不被修改,這樣的不連續可導致可感知的人工因素於該已處理音訊中。因此,在本發明之一實際實施例中,在該等已處理受限增益被使用於修改該音訊之前,在時間上平滑化該等已處理受限增益是被希望的。這樣的平滑化可被執行於各種方法,且一種這樣的方法將被討論於下面的較佳實施例的描述中。
第1圖是處理一多頻道音訊信號之一單一信號頻道或僅具有一個頻道之一音訊信號的一般習知的音訊動態處理器之一高階方塊圖。
第2a圖是依據本發明之層面的階層式控制路徑結構的一範例之一示意性概觀,其中資訊從頂部到底部被向下傳遞於一控制路徑層級(一“自上而下階層式配置”)。
第2b圖是該音訊路徑的一範例之一示意性概觀,其中一音訊信號可依據於一控制路徑(諸如第2a圖之控制路徑和/或第2a圖和第6圖之控制路徑)中所獲得之資訊被修改。
第3a圖是一動態範圍控制(DRC)之一示範性輸入/輸出曲線或轉換函數,其中水平軸是該輸入位準之一對數表示法,且垂直軸是該所希望的輸出信號位準之一對數表示法。
第3b圖是第3a圖輸入/輸出曲線或轉換函數之一等效表示法,用增益的對數代替垂直軸上的該輸出信號位準,
當其被應用到該輸入信號位準時,產生出該所希望的輸出信號位準。
第4a-c圖是對理解本發明之層面有用的,以第3b圖之方式顯示輸入/輸出曲線或轉換函數之範例,其中在一初始較高階層之一初始曲線版本被重建於較低階層,考慮平均限制。
第5a-b圖是對理解本發明之層面有用的,以第3b圖之方式顯示輸入/輸出曲線或轉換函數之範例,其中在一初始較高階層之一初始曲線版本被重建於較低階層,考慮範圍限制。
第6圖是是依據本發明之層面的階層式控制路徑結構的一範例之一示意性概觀,其中除了第2a圖範例之該自上而下階層式資訊以外,資訊還從底部到頂部被向上傳遞於一控制路徑層級(一“由下而上”階層式配置)。
第7圖描述合適的一組臨界頻帶濾波器響應,其中40個頻帶沿著等效矩形頻寬(ERB)的尺度被均勻地隔開,正如Moore和Glasberg所定義的。
第8圖是一組等響線。
Alan Jeffrey Seefeldt的該國際專利申請案PCT/US 2005/038579(以WO 2006/047600被公開)揭露了透過使用響度感知的一心理聲學模型,用於量測和修改一音訊信號之感知響度和/或感知頻譜平衡之配置。該揭露討論用於音訊
動態處理的這樣的配置之用途,引證了在該感知響度域中執行這樣的處理的一些優勢。然而,Seefeldt之配置藉由本發明之層面可被進一步改良。因此,本發明之一較佳實施例將被描述於一心理聲學響度模型之背景下。
作為第一步,一多頻道數位音訊信號x c [n],c=1...C之特定響度(在頻率和時間上分佈的感知響度之一量測),透過以下步驟來計算。第一,每一頻道之一激發信號E c [b,t]被計算,在時間塊t期間於臨界頻帶b近似於沿著內耳底膜之能量分佈。此激發可根據該音訊信號之短期離散傅利葉轉換(STDFT)來計算,如下:
其中X c [k,t]表示x c [n]在時間塊t和分隔(bin)k上之STDFT。T[k]表示模擬音訊通經外耳和中耳的傳送之一濾波器之頻率響應,且C b [k]表示相對應於臨界頻帶b之一位置處之該耳底膜之頻率回應。第7圖描述一組合適的臨界頻帶濾波器響應,其中40個頻帶依等效矩形頻寬(ERB)的尺度被均勻地隔開,正如Moore和Glasberg(B.C.J.Moore,B.Glasberg,T.Baer,“A Model for the Prediction of Thresholds,Loudness,and Partial Loudness,”Journal of the Audio Engineering Society,Vol.45,No.4,April 1997,pp.224-240)所定義的。每一濾波器形狀由一圓通化(rounded)指數函數來描述,且該等頻帶以1 ERB之一間隔分佈。等式4中的平滑化時間常數可方便地與頻帶b中人體響度感知的整合時間成比例來選取。
除了每頻道激發之外,表示總體音訊信號之一激發也被計算,藉由對所有頻道之該等頻道激發求和:
使用等響線(諸如第8圖中所描繪的),每一頻帶的該等總體和頻道激發接下來被轉換到激發位準,該等激發位準將產生相同響度於1kHz。總體和頻道特定響度譜最終根據這些已轉換激發[b,t]和[b,t]來計算,透過一壓縮的非線性。一般地參考該函數以自該已轉換激發E來計算特定的響度N(N=Φ{E}),一個這樣的合適的函數被給出:
其中TQ 1kHz 是安靜時1kHz處的臨限值,且常數α和β被選取以匹配響度資料之已公開成長。使用此函數,該總體和頻道特定響度頻譜依據以下被計算:
總體響度和頻道響度值接著,藉由對該總體和頻道特定響度頻譜遍及頻帶b求和而被計算:
為了強加動態處理限制之目的,平均特定響度頻譜和平均響度值,藉由使用一大的平滑化時間常數平滑化來自上面的該特定響度頻譜和響度值而被計算:
最後,相對應於被使用於本發明之一般描述中的一般項L T ,,L C ,,L B ,之值,自該等響度值和特定響度頻譜如下被計算:
L T →L T [t]=log(N T [t]) (10a)
L C →L c [t]=log(N c [t]) (10c)
L B →L c [b,t]=log(N c [b,t]) (10e)
以一所希望的總體動態函數F T (輸入對數感知響度,且輸出所希望的感知響度縮放比例之對數)起始,詳述於本發明之一般描述中的該等自上而下和由下而上限制被應用,以產生分別由[t]、[t]和[b,t]所表示之受限總體、頻道和頻帶對數響度縮放比例值。
該受限頻帶對數響度縮放比例[b,t]被使用以修改該音訊信號。然而,此量必須首先在時間上被平滑化以移除經由施加該等限制而引入的任何時間上的不連續性。該平滑化可方便地使用一快的或慢的時間常數(基於L c [b,t]和[b,t]二者同時平滑化來決定使用哪種時間常數)。若L c [b,t]相對於其平滑版本增加,而[b,t]相對於其平滑版本減少,則該快的時間常數被使用。否則,該慢的時間常數被使用。
更特別地,L c [b,t]和[b,t]的時間上平滑化版本如下被計算:
其中
作為計算該修改信號中的下一步驟,每一頻道中之一所希望的修改特定頻譜藉由將該原始特定響度乘以該平滑化頻帶縮放比例[b,t]而計算:
假設該函數Ψ{·}代表從激發到特定響度的轉換,一頻帶變化增益g c [b,m]被計算用於每一頻道,藉此
重新排列(13a),得到解決方案
在Alan Jeffrey Seefeldt的該國際專利申請案PCT/US 2005/038579(以WO 2006/047600被公開)中,計算(13b)中的反函數Ψ-1的一些技術被描述,包括一閉合形式表示、一查找表及疊代搜尋。
最後,該頻帶變化增益g c [b,m]於每一臨界頻帶被施加到該原始STDFT之相對應分隔(bin),以產生一修改STDFT:
該修改STDFT被反轉換且被疊加,以產生最終修改多
頻道數位音訊信號[n]。使用取樣的重疊區塊之一數位音訊處理配置之進一步詳述被提及於Fielder等人的美國專利5,899,969(“Frame-based audio with gain-control words”),其全部在此以參照方式被併入本文。
雖然各種階層式限制(例如==)在此以等式來表示,但這樣的等式是被理想化的範例。本發明考量限制的強加,其趨向於使得這樣的值,較沒有受到這樣的限制的強加時更接近相等。同樣地,雖然動態處理曲線從一個階層到另一階層的傳遞以相同曲線形狀的傳遞被說明(例如第3b圖),但這樣一形狀相同性是被理想化的範例。本發明考量動態處理曲線從一個階層到另一階層的傳遞,其中該所傳遞曲線是一個或更多較高階層曲線之一近似,接近程度是該動態處理裝置或程序之創建者的一實施選擇。
本發明可於硬體或軟體或二者之一組合(例如可程式化邏輯陣列)被實施。除非指明,作為本發明之部分被包括之演算法並非固有地關於任何特定電腦或其他設備。尤其,各種通用機器可使用依據這裏的教示所編寫的程式,或其可更便於建立更特定的設備(例如,積體電路)以執行所需方法步驟。因此,本發明可於一個或更多電腦程式中被實施,該一個或更多電腦程式於一個或更多可程式化電腦系統上執行,每一可程式化電腦系統包含至少一個處理器、至少一個資料儲存系統(包括易失和非易失記憶體和/或儲存元件)、至少一個輸入裝置或埠,以及至少一個輸出
裝置或埠。程式碼被應用於輸入資料,以執行這裏所描述之功能且產生輸出資訊。該輸出資訊被應用於一個或更多輸出裝置,以已知方式。
每一這樣的程式可被實施於任意所希望的電腦語言(包括機器、組合,或高階程序、邏輯或物件導向程式語言),以與一電腦系統溝通。在任何情況中,該語言可以是一編譯或解譯語言。
每一這樣的電腦程式較佳地被儲存在或被下載到一通用或專用可程式化電腦可讀取之一儲存媒體或裝置(例如,固態記憶體或媒體,或磁性或光媒體),用於當該儲存媒體或裝置被該電腦系統讀取以執行這裏所描述的程序時,配置和操作該電腦。本發明系統也可被認為以一被配置了一電腦程式之電腦可讀取媒體被實施,如此配置之該儲存媒體使得一電腦系統運作於一特定且預定的方式來執行這裏所描述之該等功能。
本發明之一些實施例已經被描述。然而,要知道,並不脫離本發明之精神和範圍的各種修改可被進行。例如,這裏所描述的一些步驟可以是順序無關的,且因此可被執行於異於所描述之順序。
2‧‧‧上“信號”路徑
4‧‧‧下“控制”路徑
6‧‧‧量測裝置或程序、位準、位準量測
8‧‧‧動態控制裝置或程序
10、10-1-1、10-c-n‧‧‧延遲裝置或程序
12、12-1-1、12-c-n‧‧‧乘法器
14‧‧‧總體位準、總體位準裝置或程序
16‧‧‧動態控制、動態控制裝置或程序
17‧‧‧分析裝置或程序
18-1、18-c‧‧‧位準量測、位準量測裝置或程序
20-1、20-c‧‧‧動態控制、動態控制裝置或程序
20’-1、20’-c‧‧‧動態控制
21‧‧‧分析、分析裝置或功能
22-1、22-c‧‧‧頻帶分離裝置或功能
24-1-1、24-c-n‧‧‧位準量測、位準量測裝置或程序
26-1-1、26-c-n‧‧‧動態控制、動態控制裝置或程序
26’-1-1、26’-c-n‧‧‧頻帶動態控制、動態控制
27‧‧‧分析、分析裝置或功能
第1圖是處理一多頻道音訊信號之一單一信號頻道或僅具有一個頻道之一音訊信號的一般習知的音訊動態處理器之一高階方塊圖。
第2a圖是依據本發明之層面的階層式控制路徑結構的
一範例之一示意性概觀,其中資訊從頂部到底部被向下傳遞於一控制路徑層級(一“自上而下階層式配置”)。
第2b圖是該音訊路徑的一範例之一示意性概觀,其中一音訊信號可依據於一控制路徑(諸如第2a圖之控制路徑和/或第2a圖和第6圖之控制路徑)中所獲得之資訊被修改。
第3a圖是一動態範圍控制(DRC)之一示範性輸入/輸出曲線或轉換函數,其中水平軸是該輸入位準之一對數表示法,且垂直軸是該所希望的輸出信號位準之一對數表示法。
第3b圖是第3a圖輸入/輸出曲線或轉換函數之一等效表示法,用增益的對數代替垂直軸上的該輸出信號位準,當其被應用到該輸入信號位準時,產生出該所希望的輸出信號位準。
第4a-c圖是對理解本發明之層面有用的,以第3b圖之方式顯示輸入/輸出曲線或轉換函數之範例,其中在一初始較高階層之一初始曲線版本被重建於較低階層,考慮平均限制。
第5a-b圖是對理解本發明之層面有用的,以第3b圖之方式顯示輸入/輸出曲線或轉換函數之範例,其中在一初始較高階層之一初始曲線版本被重建於較低階層,考慮範圍限制。
第6圖是是依據本發明之層面的階層式控制路徑結構的一範例之一示意性概觀,其中除了第2a圖範例之該自上而下階層式資訊以外,資訊還從底部到頂部被向上傳遞於一控制路徑層級(一“由下而上”階層式配置)。
第7圖描述合適的一組臨界頻帶濾波器響應,其中40個頻帶沿著等效矩形頻寬(ERB)的尺度被均勻地隔開,正如Moore和Glasberg所定義的。
第8圖是一組等響線。
10-1-1、10-c-n‧‧‧延遲裝置或程序
14‧‧‧總體位準、總體位準裝置或程序
16‧‧‧動態控制、動態控制裝置或程序
18-1、18-c‧‧‧位準量測、位準量測裝置或程序
20-1、20-c‧‧‧動態控制、動態控制裝置或程序
22-1、22-c‧‧‧頻帶分離裝置或功能
24-1-1、24-c-n‧‧‧位準量測、位準量測裝置或程序
26-1-1、26-c-n‧‧‧動態控制、動態控制裝置或程序
Claims (6)
- 一種使用階層式控制路徑結構來產生音訊信號動態控制信號之方法,包含:接收多個音訊頻道;於具有一根節點之一第一層級內,在該根節點,計算用於所有結合的音訊頻道之總體之信號位準,以及在該根節點,為響應該用於所有結合的音訊頻道之總體之信號位準,計算一或多個第一動態控制參數;以及於具有多個頻道之一第二層級內,每一頻道具有一或多個節點,在該節點或用於每一頻道之節點,計算用於特定音訊頻道之信號位準,以及在該節點或用於每一頻道之節點,為響應用於該特定音訊頻道之該信號位準和該等第一動態控制參數之一或多個,計算一或多個第二動態控制參數。
- 如請求項1之方法,其中該等一或多個第一動態控制參數包含用以影響該計算一或多個第二動態控制參數的操作的控制參數,以及/或用以直接或間接控制音訊信號之動態的修改參數。
- 如請求項1之方法,進一步包含:於一第三層級,分割每一音訊頻道成多個頻帶b1至bn,每一頻 帶具有一或多個節點,在該節點或用於每一頻帶之節點,計算用於特定音訊頻帶之信號位準,以及在該節點或用於每一頻帶之節點,為響應用於該特定音訊頻帶之該信號位準和該等第二動態控制參數之一或多個,計算一或多個第三動態控制參數。
- 如請求項3之方法,其中該等一或多個第二動態控制參數包含用以影響該計算一或多個第三動態控制參數的操作的控制參數,以及/或用以直接或間接控制一音訊信號之動態之修改參數。
- 一種適於執行請求項1到4之任一者之方法的裝置。
- 一種電腦程式,儲存於一非暫時性電腦可讀媒體,用以使電腦執行請求項1到4之任一者之方法。
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US85658606P | 2006-11-01 | 2006-11-01 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW200828792A TW200828792A (en) | 2008-07-01 |
| TWI440301B true TWI440301B (zh) | 2014-06-01 |
Family
ID=39262678
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW096139833A TWI440301B (zh) | 2006-11-01 | 2007-10-24 | 對於音訊動態處理具限制之階層式控制路徑 |
Country Status (7)
| Country | Link |
|---|---|
| US (1) | US8521314B2 (zh) |
| EP (2) | EP2632044B1 (zh) |
| JP (2) | JP2010508758A (zh) |
| CN (1) | CN101606316B (zh) |
| ES (2) | ES2530360T3 (zh) |
| TW (1) | TWI440301B (zh) |
| WO (1) | WO2008057173A1 (zh) |
Families Citing this family (37)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR101261212B1 (ko) | 2004-10-26 | 2013-05-07 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호 처리 방법 및 장치 |
| TWI517562B (zh) | 2006-04-04 | 2016-01-11 | 杜比實驗室特許公司 | 用於將多聲道音訊信號之全面感知響度縮放一期望量的方法、裝置及電腦程式 |
| UA93243C2 (ru) | 2006-04-27 | 2011-01-25 | ДОЛБИ ЛЕБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШи | Регулирование усиления звука c использованием основанного ha конкретной громкости выявления аккустических событий |
| US8849433B2 (en) | 2006-10-20 | 2014-09-30 | Dolby Laboratories Licensing Corporation | Audio dynamics processing using a reset |
| US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
| WO2009011827A1 (en) | 2007-07-13 | 2009-01-22 | Dolby Laboratories Licensing Corporation | Audio processing using auditory scene analysis and spectral skewness |
| US8320741B1 (en) * | 2007-12-17 | 2012-11-27 | Nvidia Corporation | Media capture system, method, and computer program product for assessing processing capabilities |
| WO2009086174A1 (en) | 2007-12-21 | 2009-07-09 | Srs Labs, Inc. | System for adjusting perceived loudness of audio signals |
| US20100057472A1 (en) * | 2008-08-26 | 2010-03-04 | Hanks Zeng | Method and system for frequency compensation in an audio codec |
| EP2237269B1 (en) * | 2009-04-01 | 2013-02-20 | Motorola Mobility LLC | Apparatus and method for processing an encoded audio data signal |
| US8761415B2 (en) | 2009-04-30 | 2014-06-24 | Dolby Laboratories Corporation | Controlling the loudness of an audio signal in response to spectral localization |
| WO2010126709A1 (en) | 2009-04-30 | 2010-11-04 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
| TWI503816B (zh) | 2009-05-06 | 2015-10-11 | Dolby Lab Licensing Corp | 調整音訊信號響度並使其具有感知頻譜平衡保持效果之技術 |
| US8538042B2 (en) | 2009-08-11 | 2013-09-17 | Dts Llc | System for increasing perceived loudness of speakers |
| CN104242853B (zh) * | 2010-03-18 | 2017-05-17 | 杜比实验室特许公司 | 用于具有音质保护的失真减少多频带压缩器的技术 |
| US8510361B2 (en) * | 2010-05-28 | 2013-08-13 | George Massenburg | Variable exponent averaging detector and dynamic range controller |
| TWI581250B (zh) * | 2010-12-03 | 2017-05-01 | 杜比實驗室特許公司 | 利用多媒體處理節點之適應性處理技術 |
| US20120294459A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals in Consumer Audio and Control Signal Processing Function |
| US20120294457A1 (en) * | 2011-05-17 | 2012-11-22 | Fender Musical Instruments Corporation | Audio System and Method of Using Adaptive Intelligence to Distinguish Information Content of Audio Signals and Control Signal Processing Function |
| EP2624449B1 (en) * | 2012-02-01 | 2016-12-07 | Harman Becker Automotive Systems GmbH | Peak detection when adapting a signal gain based on signal loudness |
| US9131313B1 (en) | 2012-02-07 | 2015-09-08 | Star Co. | System and method for audio reproduction |
| US9312829B2 (en) | 2012-04-12 | 2016-04-12 | Dts Llc | System for adjusting loudness of audio signals in real time |
| US20140114456A1 (en) * | 2012-10-22 | 2014-04-24 | Arbitron Inc. | Methods and Systems for Clock Correction and/or Synchronization for Audio Media Measurement Systems |
| US9411881B2 (en) * | 2012-11-13 | 2016-08-09 | Dolby International Ab | System and method for high dynamic range audio distribution |
| CN114566182A (zh) * | 2013-04-05 | 2022-05-31 | 杜比实验室特许公司 | 使用高级频谱延拓降低量化噪声的压扩装置和方法 |
| EP2992605B1 (en) | 2013-04-29 | 2017-06-07 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
| US9191737B2 (en) | 2013-08-07 | 2015-11-17 | Bose Corporation | Crest-factor based gain modification |
| MX355089B (es) * | 2014-03-25 | 2018-04-04 | Fraunhofer Ges Forschung | Dispositivo codificador de audio y un dispositivo decodificador de audio con codificacion de ganancia eficiente en el control de rango dinamico. |
| EP4472074B1 (en) * | 2014-10-01 | 2025-05-28 | Dolby International AB | Decoding an encoded audio signal using drc profiles |
| WO2016155853A1 (en) * | 2015-04-02 | 2016-10-06 | Harman Becker Automotive Systems Gmbh | Multii-band signal compressing |
| EP3089364B1 (en) * | 2015-05-01 | 2019-01-16 | Nxp B.V. | A gain function controller |
| EP3171614B1 (en) | 2015-11-23 | 2020-11-04 | Goodix Technology (HK) Company Limited | A controller for an audio system |
| US9755598B2 (en) * | 2015-12-18 | 2017-09-05 | Ibiquity Digital Corporation | Method and apparatus for level control in blending an audio signal in an in-band on-channel radio system |
| US11290819B2 (en) * | 2016-01-29 | 2022-03-29 | Dolby Laboratories Licensing Corporation | Distributed amplification and control system for immersive audio multi-channel amplifier |
| CN114286248B (zh) * | 2016-06-14 | 2025-08-12 | 杜比实验室特许公司 | 媒体补偿通过和模式切换 |
| CN114503432A (zh) | 2019-09-13 | 2022-05-13 | 杜比实验室特许公司 | 伪声减少的动态范围压缩 |
| JP2024520005A (ja) * | 2021-05-28 | 2024-05-21 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 空間的オーディオ・オブジェクトのダイナミックレンジ調整 |
Family Cites Families (136)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US2808475A (en) * | 1954-10-05 | 1957-10-01 | Bell Telephone Labor Inc | Loudness indicator |
| US4460871A (en) * | 1979-08-06 | 1984-07-17 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
| US4249042A (en) * | 1979-08-06 | 1981-02-03 | Orban Associates, Inc. | Multiband cross-coupled compressor with overshoot protection circuit |
| US4281218A (en) * | 1979-10-26 | 1981-07-28 | Bell Telephone Laboratories, Incorporated | Speech-nonspeech detector-classifier |
| DE3314570A1 (de) * | 1983-04-22 | 1984-10-25 | Philips Patentverwaltung Gmbh, 2000 Hamburg | Verfahren und anordnung zur einstellung der verstaerkung |
| US4922535A (en) * | 1986-03-03 | 1990-05-01 | Dolby Ray Milton | Transient control aspects of circuit arrangements for altering the dynamic range of audio signals |
| US4843626A (en) * | 1986-07-10 | 1989-06-27 | Werrbach Donn R | Multiband limiter with automatic limiting threshold (ALT) compensation |
| US4739514A (en) * | 1986-12-22 | 1988-04-19 | Bose Corporation | Automatic dynamic equalizing |
| US4887299A (en) | 1987-11-12 | 1989-12-12 | Nicolet Instrument Corporation | Adaptive, programmable signal processing hearing aid |
| US4953112A (en) | 1988-05-10 | 1990-08-28 | Minnesota Mining And Manufacturing Company | Method and apparatus for determining acoustic parameters of an auditory prosthesis using software model |
| US5027410A (en) * | 1988-11-10 | 1991-06-25 | Wisconsin Alumni Research Foundation | Adaptive, programmable signal processing and filtering for hearing aids |
| JPH02118322U (zh) | 1989-03-08 | 1990-09-21 | ||
| US5097510A (en) * | 1989-11-07 | 1992-03-17 | Gs Systems, Inc. | Artificial intelligence pattern-recognition-based noise reduction system for speech processing |
| US5369711A (en) | 1990-08-31 | 1994-11-29 | Bellsouth Corporation | Automatic gain control for a headset |
| WO1992012607A1 (en) * | 1991-01-08 | 1992-07-23 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
| US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
| DE69214882T2 (de) | 1991-06-06 | 1997-03-20 | Matsushita Electric Ind Co Ltd | Gerät zur Unterscheidung von Musik und Sprache |
| US5278912A (en) * | 1991-06-28 | 1994-01-11 | Resound Corporation | Multiband programmable compression system |
| US5363147A (en) | 1992-06-01 | 1994-11-08 | North American Philips Corporation | Automatic volume leveler |
| DE4335739A1 (de) | 1992-11-17 | 1994-05-19 | Rudolf Prof Dr Bisping | Verfahren zur Steuerung des Signal-/Rausch-Abstandes bei rauschbehafteten Tonaufnahmen |
| GB2272615A (en) | 1992-11-17 | 1994-05-18 | Rudolf Bisping | Controlling signal-to-noise ratio in noisy recordings |
| FI97758C (fi) * | 1992-11-20 | 1997-02-10 | Nokia Deutschland Gmbh | Järjestelmä audiosignaalin käsittelemiseksi |
| US5548638A (en) | 1992-12-21 | 1996-08-20 | Iwatsu Electric Co., Ltd. | Audio teleconferencing apparatus |
| US5457769A (en) * | 1993-03-30 | 1995-10-10 | Earmark, Inc. | Method and apparatus for detecting the presence of human voice signals in audio signals |
| US5706352A (en) * | 1993-04-07 | 1998-01-06 | K/S Himpp | Adaptive gain and filtering circuit for a sound reproduction system |
| US5434922A (en) * | 1993-04-08 | 1995-07-18 | Miller; Thomas E. | Method and apparatus for dynamic sound optimization |
| BE1007355A3 (nl) * | 1993-07-26 | 1995-05-23 | Philips Electronics Nv | Spraaksignaaldiscriminatieschakeling alsmede een audio-inrichting voorzien van een dergelijke schakeling. |
| IN184794B (zh) * | 1993-09-14 | 2000-09-30 | British Telecomm | |
| JP2986345B2 (ja) * | 1993-10-18 | 1999-12-06 | インターナショナル・ビジネス・マシーンズ・コーポレイション | 音声記録指標化装置及び方法 |
| TW247390B (en) * | 1994-04-29 | 1995-05-11 | Audio Products Int Corp | Apparatus and method for adjusting levels between channels of a sound system |
| US5500902A (en) * | 1994-07-08 | 1996-03-19 | Stockham, Jr.; Thomas G. | Hearing aid device incorporating signal processing techniques |
| GB9419388D0 (en) * | 1994-09-26 | 1994-11-09 | Canon Kk | Speech analysis |
| US5548538A (en) * | 1994-12-07 | 1996-08-20 | Wiltron Company | Internal automatic calibrator for vector network analyzers |
| US5682463A (en) * | 1995-02-06 | 1997-10-28 | Lucent Technologies Inc. | Perceptual audio compression based on loudness uncertainty |
| CA2167748A1 (en) * | 1995-02-09 | 1996-08-10 | Yoav Freund | Apparatus and methods for machine learning hypotheses |
| EP1207718A3 (de) | 1995-03-13 | 2003-02-05 | Phonak Ag | Verfahren zur Anpassung eines Hörgerätes, Vorrichtung hierzu und Hörgerät |
| US5727119A (en) * | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
| AU5663296A (en) | 1995-04-10 | 1996-10-30 | Corporate Computer Systems, Inc. | System for compression and decompression of audio signals fo r digital transmission |
| US6301555B2 (en) * | 1995-04-10 | 2001-10-09 | Corporate Computer Systems | Adjustable psycho-acoustic parameters |
| US5601617A (en) | 1995-04-26 | 1997-02-11 | Advanced Bionics Corporation | Multichannel cochlear prosthesis with flexible control of stimulus waveforms |
| JPH08328599A (ja) | 1995-06-01 | 1996-12-13 | Mitsubishi Electric Corp | Mpegオーディオ復号器 |
| US5663727A (en) * | 1995-06-23 | 1997-09-02 | Hearing Innovations Incorporated | Frequency response analyzer and shaping apparatus and digital hearing enhancement apparatus and method utilizing the same |
| GB9513419D0 (en) * | 1995-06-30 | 1995-09-06 | Philips Electronics Uk Ltd | Audio signal reproduction apparatus |
| US5712954A (en) * | 1995-08-23 | 1998-01-27 | Rockwell International Corp. | System and method for monitoring audio power level of agent speech in a telephonic switch |
| US6002776A (en) | 1995-09-18 | 1999-12-14 | Interval Research Corporation | Directional acoustic signal processor and method therefor |
| US5907622A (en) * | 1995-09-21 | 1999-05-25 | Dougherty; A. Michael | Automatic noise compensation system for audio reproduction equipment |
| US6108431A (en) * | 1996-05-01 | 2000-08-22 | Phonak Ag | Loudness limiter |
| US6327366B1 (en) | 1996-05-01 | 2001-12-04 | Phonak Ag | Method for the adjustment of a hearing device, apparatus to do it and a hearing device |
| US6430533B1 (en) * | 1996-05-03 | 2002-08-06 | Lsi Logic Corporation | Audio decoder core MPEG-1/MPEG-2/AC-3 functional algorithm partitioning and implementation |
| JPH09312540A (ja) * | 1996-05-23 | 1997-12-02 | Pioneer Electron Corp | ラウドネスボリュームコントロール装置 |
| JP3765622B2 (ja) * | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
| EP0820212B1 (de) * | 1996-07-19 | 2010-04-21 | Bernafon AG | Lautheitsgesteuerte Verarbeitung akustischer Signale |
| US5737434A (en) * | 1996-08-26 | 1998-04-07 | Orban, Inc. | Multi-band audio compressor with look-ahead clipper |
| JP2953397B2 (ja) * | 1996-09-13 | 1999-09-27 | 日本電気株式会社 | ディジタル補聴器の聴覚補償処理方法及びディジタル補聴器 |
| US6570991B1 (en) * | 1996-12-18 | 2003-05-27 | Interval Research Corporation | Multi-feature speech/music discrimination system |
| JPH10233692A (ja) * | 1997-01-16 | 1998-09-02 | Sony Corp | オーディオ信号符号化装置および符号化方法並びにオーディオ信号復号装置および復号方法 |
| US5862228A (en) * | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
| US6125343A (en) * | 1997-05-29 | 2000-09-26 | 3Com Corporation | System and method for selecting a loudest speaker by comparing average frame gains |
| US6272360B1 (en) * | 1997-07-03 | 2001-08-07 | Pan Communications, Inc. | Remotely installed transmitter and a hands-free two-way voice terminal device using same |
| US6185309B1 (en) * | 1997-07-11 | 2001-02-06 | The Regents Of The University Of California | Method and apparatus for blind separation of mixed and convolved sources |
| KR100261904B1 (ko) | 1997-08-29 | 2000-07-15 | 윤종용 | 헤드폰 사운드 출력장치 |
| US6088461A (en) * | 1997-09-26 | 2000-07-11 | Crystal Semiconductor Corporation | Dynamic volume control system |
| US5899969A (en) | 1997-10-17 | 1999-05-04 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with gain-control words |
| US6233554B1 (en) * | 1997-12-12 | 2001-05-15 | Qualcomm Incorporated | Audio CODEC with AGC controlled by a VOCODER |
| US6298139B1 (en) * | 1997-12-31 | 2001-10-02 | Transcrypt International, Inc. | Apparatus and method for maintaining a constant speech envelope using variable coefficient automatic gain control |
| US6182033B1 (en) * | 1998-01-09 | 2001-01-30 | At&T Corp. | Modular approach to speech enhancement with an application to speech coding |
| US6353671B1 (en) * | 1998-02-05 | 2002-03-05 | Bioinstco Corp. | Signal processing circuit and method for increasing speech intelligibility |
| US6311155B1 (en) * | 2000-02-04 | 2001-10-30 | Hearing Enhancement Company Llc | Use of voice-to-remaining audio (VRA) in consumer applications |
| US6498855B1 (en) | 1998-04-17 | 2002-12-24 | International Business Machines Corporation | Method and system for selectively and variably attenuating audio data |
| EP1086607B2 (en) * | 1998-06-08 | 2012-04-11 | Cochlear Limited | Hearing instrument |
| EP0980064A1 (de) | 1998-06-26 | 2000-02-16 | Ascom AG | Verfahren zur Durchführung einer maschinengestützten Beurteilung der Uebertragungsqualität von Audiosignalen |
| GB2340351B (en) | 1998-07-29 | 2004-06-09 | British Broadcasting Corp | Data transmission |
| US6351731B1 (en) * | 1998-08-21 | 2002-02-26 | Polycom, Inc. | Adaptive filter featuring spectral gain smoothing and variable noise multiplier for noise reduction, and method therefor |
| US6823303B1 (en) | 1998-08-24 | 2004-11-23 | Conexant Systems, Inc. | Speech encoder using voice activity detection in coding noise |
| US6411927B1 (en) * | 1998-09-04 | 2002-06-25 | Matsushita Electric Corporation Of America | Robust preprocessing signal equalization system and method for normalizing to a target environment |
| FI113935B (fi) | 1998-09-25 | 2004-06-30 | Nokia Corp | Menetelmä äänitason kalibroimiseksi monikanavaisessa äänentoistojärjestelmässä ja monikanavainen äänentoistojärjestelmä |
| DE19848491A1 (de) | 1998-10-21 | 2000-04-27 | Bosch Gmbh Robert | Rundfunkempfänger zum Empfang von Radio-Daten und Verfahren zur Beeinflussung einer Klangcharakteristik eines wiederzugebenden Audiosignals in einem Rundfunkempfänger |
| US6314396B1 (en) | 1998-11-06 | 2001-11-06 | International Business Machines Corporation | Automatic gain control in a speech recognition system |
| EP1089242B1 (en) * | 1999-04-09 | 2006-11-08 | Texas Instruments Incorporated | Supply of digital audio and video products |
| AU4278300A (en) * | 1999-04-26 | 2000-11-10 | Dspfactory Ltd. | Loudness normalization control for a digital hearing aid |
| US6263371B1 (en) * | 1999-06-10 | 2001-07-17 | Cacheflow, Inc. | Method and apparatus for seaming of streaming content |
| US6442278B1 (en) * | 1999-06-15 | 2002-08-27 | Hearing Enhancement Company, Llc | Voice-to-remaining audio (VRA) interactive center channel downmix |
| AR024353A1 (es) * | 1999-06-15 | 2002-10-02 | He Chunhong | Audifono y equipo auxiliar interactivo con relacion de voz a audio remanente |
| US7206420B2 (en) * | 1999-11-29 | 2007-04-17 | Syfx Tekworks | Softclip method and apparatus |
| FR2802329B1 (fr) * | 1999-12-08 | 2003-03-28 | France Telecom | Procede de traitement d'au moins un flux binaire audio code organise sous la forme de trames |
| US6351733B1 (en) * | 2000-03-02 | 2002-02-26 | Hearing Enhancement Company, Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
| US6771828B1 (en) * | 2000-03-03 | 2004-08-03 | Microsoft Corporation | System and method for progessively transform coding digital data |
| DE10018666A1 (de) * | 2000-04-14 | 2001-10-18 | Harman Audio Electronic Sys | Vorrichtung und Verfahren zum geräuschabhängigen Anpassen eines akustischen Nutzsignals |
| US6725110B2 (en) * | 2000-05-26 | 2004-04-20 | Yamaha Corporation | Digital audio decoder |
| US6889186B1 (en) * | 2000-06-01 | 2005-05-03 | Avaya Technology Corp. | Method and apparatus for improving the intelligibility of digitally compressed speech |
| WO2002013572A2 (en) * | 2000-08-07 | 2002-02-14 | Audia Technology, Inc. | Method and apparatus for filtering and compressing sound signals |
| AUPQ952700A0 (en) * | 2000-08-21 | 2000-09-14 | University Of Melbourne, The | Sound-processing strategy for cochlear implants |
| JP3448586B2 (ja) | 2000-08-29 | 2003-09-22 | 独立行政法人産業技術総合研究所 | 聴覚障害を考慮した音の測定方法およびシステム |
| US6625433B1 (en) * | 2000-09-29 | 2003-09-23 | Agere Systems Inc. | Constant compression automatic gain control circuit |
| US6807525B1 (en) | 2000-10-31 | 2004-10-19 | Telogy Networks, Inc. | SID frame detection with human auditory perception compensation |
| DK1206104T3 (da) * | 2000-11-09 | 2006-10-30 | Koninkl Kpn Nv | Måling af en samtalekvalitet af en telefonforbindelse i et telekommunikationsnetværk |
| US7457422B2 (en) * | 2000-11-29 | 2008-11-25 | Ford Global Technologies, Llc | Method and implementation for detecting and characterizing audible transients in noise |
| FR2820573B1 (fr) | 2001-02-02 | 2003-03-28 | France Telecom | Methode et dispositif de traitement d'une pluralite de flux binaires audio |
| DE10107385A1 (de) * | 2001-02-16 | 2002-09-05 | Harman Audio Electronic Sys | Vorrichtung zum geräuschabhängigen Einstellen der Lautstärken |
| US6915264B2 (en) | 2001-02-22 | 2005-07-05 | Lucent Technologies Inc. | Cochlear filter bank structure for determining masked thresholds for use in perceptual audio coding |
| DE50102419D1 (de) * | 2001-04-10 | 2004-07-01 | Phonak Ag | Verfahren zur anpassung eines hörgerätes an ein individuum |
| US7283954B2 (en) * | 2001-04-13 | 2007-10-16 | Dolby Laboratories Licensing Corporation | Comparing audio using characterizations based on auditory events |
| US7461002B2 (en) * | 2001-04-13 | 2008-12-02 | Dolby Laboratories Licensing Corporation | Method for time aligning audio signals using characterizations based on auditory events |
| US7610205B2 (en) * | 2002-02-12 | 2009-10-27 | Dolby Laboratories Licensing Corporation | High quality time-scaling and pitch-scaling of audio signals |
| US7711123B2 (en) * | 2001-04-13 | 2010-05-04 | Dolby Laboratories Licensing Corporation | Segmenting audio signals into auditory events |
| EP1251715B2 (en) | 2001-04-18 | 2010-12-01 | Sound Design Technologies Ltd. | Multi-channel hearing instrument with inter-channel communication |
| JP3700931B2 (ja) * | 2001-06-11 | 2005-09-28 | ヤマハ株式会社 | マルチトラック・ディジタル録音再生装置 |
| US7177803B2 (en) * | 2001-10-22 | 2007-02-13 | Motorola, Inc. | Method and apparatus for enhancing loudness of an audio signal |
| JP2003158800A (ja) | 2001-11-22 | 2003-05-30 | Kenwood Corp | 多チャンネルオーディオ再生装置 |
| JP2003168940A (ja) * | 2001-12-03 | 2003-06-13 | Fujitsu Ten Ltd | 音響調整装置 |
| US20040037421A1 (en) * | 2001-12-17 | 2004-02-26 | Truman Michael Mead | Parital encryption of assembled bitstreams |
| US7068723B2 (en) * | 2002-02-28 | 2006-06-27 | Fuji Xerox Co., Ltd. | Method for automatically producing optimal summaries of linear media |
| JP4404180B2 (ja) * | 2002-04-25 | 2010-01-27 | ソニー株式会社 | データ配信システム、データ処理装置及びデータ処理方法、並びにコンピュータ・プログラム |
| US7155385B2 (en) | 2002-05-16 | 2006-12-26 | Comerica Bank, As Administrative Agent | Automatic gain control for adjusting gain during non-speech portions |
| US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
| JP4257079B2 (ja) | 2002-07-19 | 2009-04-22 | パイオニア株式会社 | 周波数特性調整装置および周波数特性調整方法 |
| DE10236694A1 (de) * | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
| US7454331B2 (en) * | 2002-08-30 | 2008-11-18 | Dolby Laboratories Licensing Corporation | Controlling loudness of speech in signals that contain speech and other types of audio material |
| DE10308483A1 (de) * | 2003-02-26 | 2004-09-09 | Siemens Audiologische Technik Gmbh | Verfahren zur automatischen Verstärkungseinstellung in einem Hörhilfegerät sowie Hörhilfegerät |
| US6784510B1 (en) * | 2003-04-16 | 2004-08-31 | Freescale Semiconductor, Inc. | Magnetoresistive random access memory device structures |
| EP1618559A1 (en) * | 2003-04-24 | 2006-01-25 | Massachusetts Institute Of Technology | System and method for spectral enhancement employing compression and expansion |
| US7551745B2 (en) * | 2003-04-24 | 2009-06-23 | Dolby Laboratories Licensing Corporation | Volume and compression control in movie theaters |
| US20050038579A1 (en) | 2003-08-15 | 2005-02-17 | Lewis Michael W. | Interactive maintenance management alarm handling |
| US7617109B2 (en) * | 2004-07-01 | 2009-11-10 | Dolby Laboratories Licensing Corporation | Method for correcting metadata affecting the playback loudness and dynamic range of audio information |
| KR101261212B1 (ko) | 2004-10-26 | 2013-05-07 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 오디오 신호 처리 방법 및 장치 |
| US7729673B2 (en) * | 2004-12-30 | 2010-06-01 | Sony Ericsson Mobile Communications Ab | Method and apparatus for multichannel signal limiting |
| US8265295B2 (en) * | 2005-03-11 | 2012-09-11 | Rane Corporation | Method and apparatus for identifying feedback in a circuit |
| US7805314B2 (en) * | 2005-07-13 | 2010-09-28 | Samsung Electronics Co., Ltd. | Method and apparatus to quantize/dequantize frequency amplitude data and method and apparatus to audio encode/decode using the method and apparatus to quantize/dequantize frequency amplitude data |
| US7865256B2 (en) * | 2005-11-04 | 2011-01-04 | Yamaha Corporation | Audio playback apparatus |
| JP4747835B2 (ja) * | 2005-12-27 | 2011-08-17 | ヤマハ株式会社 | オーディオ再生の効果付加方法およびその装置 |
| EP2002429B1 (en) | 2006-04-04 | 2012-11-21 | Dolby Laboratories Licensing Corporation | Controlling a perceived loudness characteristic of an audio signal |
| CN101410892B (zh) | 2006-04-04 | 2012-08-08 | 杜比实验室特许公司 | 改进的离散余弦变换域中的音频信号响度测量及修改 |
| UA93243C2 (ru) | 2006-04-27 | 2011-01-25 | ДОЛБИ ЛЕБОРЕТЕРИЗ ЛАЙСЕНСИНГ КОРПОРЕЙШи | Регулирование усиления звука c использованием основанного ha конкретной громкости выявления аккустических событий |
| US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
| US8521314B2 (en) | 2006-11-01 | 2013-08-27 | Dolby Laboratories Licensing Corporation | Hierarchical control path with constraints for audio dynamics processing |
| CN101573866B (zh) | 2007-01-03 | 2012-07-04 | 杜比实验室特许公司 | 响度补偿音量控制方法和装置 |
-
2007
- 2007-10-16 US US12/446,395 patent/US8521314B2/en active Active
- 2007-10-17 JP JP2009535268A patent/JP2010508758A/ja active Pending
- 2007-10-17 CN CN200780040917.2A patent/CN101606316B/zh active Active
- 2007-10-17 EP EP13169247.7A patent/EP2632044B1/en active Active
- 2007-10-17 ES ES13169247T patent/ES2530360T3/es active Active
- 2007-10-17 WO PCT/US2007/022132 patent/WO2008057173A1/en not_active Ceased
- 2007-10-17 EP EP07861425.2A patent/EP1987586B1/en active Active
- 2007-10-17 ES ES07861425.2T patent/ES2482147T3/es active Active
- 2007-10-24 TW TW096139833A patent/TWI440301B/zh active
-
2012
- 2012-07-12 JP JP2012156711A patent/JP5465283B2/ja active Active
Also Published As
| Publication number | Publication date |
|---|---|
| CN101606316B (zh) | 2012-12-19 |
| US8521314B2 (en) | 2013-08-27 |
| ES2530360T3 (es) | 2015-03-02 |
| US20110009987A1 (en) | 2011-01-13 |
| JP2010508758A (ja) | 2010-03-18 |
| EP2632044A1 (en) | 2013-08-28 |
| JP2012239196A (ja) | 2012-12-06 |
| TW200828792A (en) | 2008-07-01 |
| EP1987586B1 (en) | 2014-05-21 |
| JP5465283B2 (ja) | 2014-04-09 |
| ES2482147T3 (es) | 2014-08-01 |
| EP1987586A1 (en) | 2008-11-05 |
| WO2008057173A1 (en) | 2008-05-15 |
| HK1184280A1 (zh) | 2014-01-17 |
| CN101606316A (zh) | 2009-12-16 |
| EP2632044B1 (en) | 2014-12-17 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI440301B (zh) | 對於音訊動態處理具限制之階層式控制路徑 | |
| RU2467406C2 (ru) | Способ и устройство для поддержки воспринимаемости речи в многоканальном звуковом сопровождении с минимальным влиянием на систему объемного звучания | |
| CA2796948C (en) | Apparatus and method for modifying an input audio signal | |
| US7353169B1 (en) | Transient detection and modification in audio signals | |
| US10109288B2 (en) | Dynamic range and peak control in audio using nonlinear filters | |
| CN101048935B (zh) | 控制音频信号的单位响度或部分单位响度的方法和设备 | |
| KR20210020751A (ko) | 복수의 소비자 장치에 개인화된 오디오 재생 기능을 제공하기 위한 시스템 및 방법 | |
| CN112384976B (zh) | 动态eq | |
| Ma et al. | Implementation of an intelligent equalization tool using Yule-Walker for music mixing and mastering | |
| RU2683489C1 (ru) | Устройство и способ обработки аудиосигнала для модификации стереоскопического изображения стереосигнала | |
| EP3896998B1 (en) | Systems and methods for providing content-specific, personalized audio replay on customer devices | |
| Lee et al. | The effect of loudness on the reverberance of music: Reverberance prediction using loudness models | |
| Mason et al. | Adaptive audio reproduction using personalized compression | |
| JP7714572B2 (ja) | オーディオディスクリプションの自動ミキシング | |
| Master et al. | Dialog Enhancement via Spatio-Level Filtering and Classification | |
| WO2024168003A1 (en) | Dialog intelligibility enhancement method and system | |
| US20200258538A1 (en) | Method and electronic device for formant attenuation/amplification | |
| CN115966214A (zh) | 音频处理方法、装置、电子设备和计算机可读存储介质 | |
| HK1184280B (zh) | 用於音频动态处理的控制参数分级生成 | |
| CN118072701A (zh) | 音频处理方法、计算机设备和存储介质 | |
| CN118016034A (zh) | 音量均衡方法、装置、计算机设备和存储介质 |