[go: up one dir, main page]

TW201009812A - Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs - Google Patents

Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs Download PDF

Info

Publication number
TW201009812A
TW201009812A TW098123433A TW98123433A TW201009812A TW 201009812 A TW201009812 A TW 201009812A TW 098123433 A TW098123433 A TW 098123433A TW 98123433 A TW98123433 A TW 98123433A TW 201009812 A TW201009812 A TW 201009812A
Authority
TW
Taiwan
Prior art keywords
time
audio signal
signal
audio
spectral
Prior art date
Application number
TW098123433A
Other languages
English (en)
Other versions
TWI463484B (zh
Inventor
Stefan Bayer
Sascha Disch
Ralf Geiger
Guillaume Fuchs
Max Neuendorf
Gerald Schuller
Bernd Edler
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201009812A publication Critical patent/TW201009812A/zh
Application granted granted Critical
Publication of TWI463484B publication Critical patent/TWI463484B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • G10L21/043Time compression or expansion by changing speed
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/90Pitch determination of speech signals
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/10Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Geophysics And Detection Of Objects (AREA)

Description

201009812 六、發明說明: C 明戶斤屬々員j 本發明係有關於音訊編碼及解碼,且特別針對具有一 諧波或語音内容的音訊信號之編碼/解碼,該諧波或語音内 容可受到一時間扭曲處理。 C先前技術3 在下文中,將給出時間扭曲音訊編碼之領域的一簡要 說明,該編碼之概念町連同本發明一些實施例被應用。 近年來,技術上的發展可將一音訊信號變換為一頻域 表示,且例如考慮到感知遮蔽臨界值,有效地編碼該頻域 表示。如果一組編碼頻谱係數被發送的塊長度很長,且如 果僅相當小數目的頻譜係數遠在該整體遮蔽臨界值之上, 同時一很大數目的頻譜係數在該整體遮蔽臨界附近或之下 且可犯因此被忽略(或以最小碼長被編瑪)時,此一音訊信號 編碼之概念特別有效。 例如,基於餘弦或基於正弦的調處重疊變換通常由於 它們的能量集中性質被用於源編碼之應用。即,對於帶有 恒定基本頻率(基頻)的諧音而言,它們將信號能量集中於一 小數目的頻譜成份(子頻帶),這產生—有效的信號表示。 大體而言’一信號的(基本)基頻應被理解成可與該信號 頻譜區別的最低主頻率。在普通語音模型中,該基頻是由 人喉調處的激勵信號之頻率。如果僅—個單一基頻存在, 該頻譜將極其簡單,僅包含該基本頻率及泛音。此一頻譜 可被尚效地編碼。然而,對於具有變化基頻的信號,對應 201009812 每一諸波成份的能量分佈於數個變換係數’因此導致編碼 效率的降低。 爲了克服編碼效率的降低,要被編碼的音訊信號在一 不均勻時間網格上被有效地重新取樣。在隨後的處理中, 由不均勻重新取樣獲得的取樣位置如同它們表示一均勻時 間網格上之值一般地被處理。該操作由詞組「時間扭曲」 表不。取樣時間可依據該基頻的時間變化被有利地選擇, 使件該音訊信號的時間扭曲版本中的一基頻變化小於該音 。孔l號的原始版本(時間扭曲前)中的一基頻變化。該基頻變 匕也可用顺「時間扭曲輪廓」表示。在該音黯說的時 門扭曲之後’該音_號的時間㈣版本被轉換為頻域。 :依賴於基頻的時間扭曲具有如下效果:該時間扭曲音訊 ft㈣㈣典贱顯示—能f集巾纽小於該原始音 =號(未破時間扭曲)之__頻域表示的頻譜成份數目。 回2解碼器端,該時間扭曲音訊信號的頻域表示被轉換 n /使传辦間扭曲音訊信號的—時域表示可在該解 時:得到。然而’在解碼器端重建時間扭曲音訊信號的 包^在 ^編碼11端輸人音訊信號的原始基頻變化不 因此’藉由重騎樣㈣扭曲音訊信號之解碼 15端重建時域表示的另一時 ^ 媽器處的編竭器端於立曲被施用。爲了獲得該解 :=曲:至少近似對編碼器端時間扭曲= 取得=調:=的時間扭曲,需要有一可在料器處 允斗調整該解碼器端時間扭曲的一資訊。 201009812 因為典型地需要將此一資訊從該音訊信號編碼器傳送 至該曰aTUs號解碼器’需要保持該傳送所需的位元率小, 同時仍允許所需之時間扭曲資訊在解碼 器端可靠重建。 鑑於上述討論,希望能建立 一概念,該概念允許一音 訊編碼器中時間杻曲概念的—位元率有效應用。 【瘦^明内穷—】 本發明之一目的是建立概念,基於可在一時間扭曲音 訊信號編碼器或-時間扭曲音訊信號解竭器中利用之資訊 改進由一編碼音訊信號所提供的聽覺印象。 此目的藉由以下被實現··一依據申請專利範圍第1項的 一時間扭曲致動信號提供器,基於一音訊信號之表示提供 時間扭曲致動信號;一依據申請專利範圍第12項用於編 碼一輸入音訊信號的音訊信號編碼器;一依據申請專利範 圍第14項用於提供一時間扭曲致動信號的方法;一依據申 峭專利範圍第15項用於提供一輸入音訊信號之一編碼表示 的方法;或一依據申請專利範圍第16項的電腦程式。 本發明之另一目的是提供一改進的音訊編碼/解碼方 案,該方案提供一較高的品質或一較低的位元率。 此目的由以下被實現:一依據申請專利範圍第17項、 第26項、第32項、第37項的音訊編碼器、—依據申請專利 範圍第20項的音訊解碼器、一依據申請專利範圍第23項、 第30項、第35項或第37項的音訊編碼方法、一依據申請專 利範圍第24項的解碼方法,或一依據申請專利範圍第25 項、第31項、第36項或第43項的電腦程式。 201009812 依據本發明之諸實施例係有關於一時間扭曲MDCT變 換編碼器之方法。一些實施例係有關於僅編碼器工具。然 而,其他實施例也有關於解碼器工具。 本發明之一實施例建立一時間扭曲致動信號提供器, 基於一音訊信號的一表示提供一時間扭曲致動信號。該時 間扭曲致動信號提供器包含一能量集中資訊提供器,被設 定組態以提供一能量集中資訊,該資訊描述該音訊信號之 一時間扭曲變換頻譜表示中的一能量集中。該時間致動信 號提供器也包含一比較器,被設定組態以將該能量集中資 訊與一參考值相比較,且依據該比較之結果提供該時間扭 曲致動信號。 該實施例基於如下發現:如果該音訊信號的時間扭曲 變換頻譜表示由於能量被集中於一個或多個頻譜區域(或 頻譜線)而包含一充分集中的能量分佈,那麼從該編碼音訊 信號的位元率降低的意義上來說,一音訊信號編碼器中一 時間扭曲功能性的使用典型地帶來一改進。這是由於如下 之事實:一成功的時間扭曲藉由將一模糊頻譜,例如一音 訊框之模糊頻譜變換為具有一個或多個可辨別波峰,且因 此具有比原始(未時間扭曲)音訊信號頻譜較高的能量集中 頻譜,而帶來減少位元率的效果。 關於此問題,應理解一音訊信號之基頻顯著地變化的 音訊信號框包含-模__譜。該音訊信號之時間變化基頻 具有如下效果.在4音信號框上被執行的—時域到頻域 變換導致該信號能量在―,特定地在較高頻域上的—模 201009812 糊分佈。因此,此一原始(未時間扭曲)音訊信號之一頻譜表 示包含一低能量集中,且典型地在該頻譜的一較高頻率部 份未顯示頻譜波峰,或僅在頻譜中較高頻率部份顯示相當 小的頻譜波峰。相比之下,如果時間扭曲成功(就提供該編 碼效率的一改進而言),該原始音訊信號之時間扭曲產生具 有一相對較高且清晰波峰之頻譜(尤其在該頻譜之較高頻 譜部份中)的一時間扭曲音訊信號。這是由於以下事實:具 有一時間變化基頻的一音訊信號被變換為具有一較小基頻 變化或甚至一近似恒定基頻的一時間扭曲音訊信號。因 此,該時間扭曲音訊信號之頻譜表示(其可被看做該音訊信 號的一時間扭曲變換頻譜表示)包含一個或多個清晰頻譜 波峰。換句話說,該原始音訊信號(具有在時間上變化的基 頻)頻譜的模糊藉由一成功的時間扭曲操作被降低,使得該 音訊信號之時間扭曲變換頻譜表示包含比原始音訊信號之 頻譜較高的能量集中。然而,時間扭曲在改進編碼效率中 並不總是成功。例如,如果輸入音訊信號包含很多的雜訊 成份,或如果所擷取的時間扭曲輪廓不精確,那麼時間扭 曲未改進編碼效率。 鑑於此一情況,由能量集中資訊提供器提供的能量集 中資訊就減少位元率而言是判定該時間扭曲是否成功的一 有價值指標。 本發明之一實施例建立一時間扭曲致動信號提供器, 基於一音訊信號之一表示提供一時間扭曲致動信號。該時 間扭曲致動提供器包含兩個時間扭曲表示提供器,被設定 7 201009812 組態以使用不同的時間扭曲輪廓資訊提供該相同音訊信號 的兩個時間扭曲表示。因此,該等時間扭曲表示提供器可 以相同的方式被設定組態(在結構上或功能上),且使用相同 音訊信號但是不同的時間扭曲輪廓資訊。該時間扭曲致動 信號提供器也包含兩個能量集中資訊提供器,被設定組態 以基於該第一時間扭曲表示提供一第一能量集中資訊,且 基於該第二時間扭曲表示提供一第二能量集中資訊。該等 能量集中資訊提供器可以相同方式被設定組態以使用不同 的時間扭曲表示。另外,該時間扭曲致動信號提供器包含 一比較器,將兩個不同能量集中資訊進行比較,且提供相 關於一比較結果的時間扭曲致動信號。 在一較佳實施例中,該能量集中資訊提供器被設定組 態以提供頻譜平坦度的一量度作為該能量集中資訊,該量 度描述該音訊信號之時間扭曲變換頻譜表示。已發現如果 時間扭曲將一輸入音訊信號變換為表示該輸入音訊信號的 一時間扭曲版本的一較不平坦的時間扭曲頻譜時,就減少 一位元率而言,時間扭曲是成功的。因此,頻譜平坦度之 量度可被用以判定時間扭曲應被致動還是停用,而不需執 行一全頻譜編碼處理。 在一較佳實施例中,該能量集中資訊提供器被設定組 態以計算該時間扭曲變換功率頻譜的一幾何平均與該時間 扭曲變換功率頻譜的一算術平均之商,以獲得該頻譜平坦 度之量度。已發現該商是非常適於描述由一時間扭曲可獲 得的可能位元率節約之頻譜平坦度的一量度。 201009812 在另一較佳實施例中,該能量集中資訊提供器被設定 組態以當與時間扭曲變換頻譜表示的一較低頻率部份相比 時,強調時間扭曲變換頻譜表示的一較高頻率部份,以獲 得該能量集中資訊。該概念基於如下發現:該時間扭曲在 較高頻率範圍上典型地比在較低頻率範圍上具有更大的影 響。因此,為使用一頻譜平坦度量測判定時間扭曲之有效 性而主要評估該較高頻率範圍是適當的。另外,典型的音 訊信號顯示一諧波内容(包含一基頻之諧波),其隨頻率之增 加在強度上衰減。當與該時間扭曲變換頻譜表示的一較低 頻率部份相比時,強調該時間扭曲變換頻譜表示的一較高 頻譜部份也有助於補償該等頻譜線隨頻率增加的此一典型 衰減。總而言之,該頻譜之較高頻率部份之被強調的考慮 帶來能量集中資訊的一增加可靠性,且因此允許更可靠地 提供該時間扭曲致動信號。 在另一較佳實施例中,該能量集中資訊提供器被設定 組態以提供頻譜平坦度之複數分頻段量度,且計算頻譜平 坦度的複數分頻段量度的一平均,以獲得該能量集中資 訊。已發現分頻段頻譜平坦度量度之考慮帶來一有關該時 間扭曲是否可有效降低一編碼音訊信號位元率的特別可靠 資訊。首先,該時間扭曲變換頻譜表示之編碼典型地以一 分頻段方式被執行,使得頻譜平坦度之該等分頻段量度的 一組合非常適於該編碼,且因此以良好精確度表示可獲得 的位元率改進。另外,頻譜平坦度之量度的一分頻段計算 實質上消除該能量集中資訊與一諧波分佈之相依性。例 9 201009812 如,即使一較高頻帶包含一相對小的能量(小於較低頻帶之 能量),該較高頻帶可能仍然在感知上是相關的。然而,如 果該頻譜平坦度量度不以一分頻段方式被計算,在該較高 頻帶上的一時間扭曲之積極影響(從該等頻譜線之模糊的 一降低的意義上說)可能僅因該較高頻帶上的能量小而被 看成是微小的。相比之下,藉由施用該分頻段計算,該時 間扭曲的一積極影響可以一適當的權重被考慮到,因為該 等分頻段頻譜平坦度量度獨立於各自頻帶中的絕對能量之 外。 在另一較佳實施例中,該時間扭曲致動信號提供器包 含一參考值計算器,被設定組態以計算頻譜平坦度之一量 度,以獲得該參考值,該量度描述該音訊信號的一未時間 扭曲的頻譜表示。因此,該時間扭曲致動信號可基於該輸 入音訊信號的一未時間扭曲(或「未扭曲的」)版本之頻譜平 坦度與該輸入音訊信號的一時間扭曲版本的一頻譜平坦度 之比較而被提供。 在另一較佳實施例中,該能量集中資訊提供器被設定 組態以提供感知熵的一量度,作為該能量集中資訊,該量 度描述該音訊信號之時間扭曲變換頻譜表示。此概念基於 下述發現:該時間扭曲變換頻譜表示的感知熵是編碼該時 間扭曲變換頻譜需要的位元數目(或一位元率)的一良好估 計。因此,甚而由於如果使用時間扭曲一附加時間扭曲資 訊必須被編碼,該時間扭曲變換頻譜表示的感知熵量度是 位元率減少是否可藉由時間扭曲被預期的一良好量度。 201009812
在另一較佳實施例中,該能量集中資訊提供器被設定 組態以提供—自相關量度作為該能量集巾資訊,該量度描 述該音訊信號的一時間扭曲表示的一自相關。該概念基於 如下發現:該時間扭曲之效率(就減少位元率而言)可基於一 時間扭曲(或—不均勻重新取樣)的時域信號被量度(或至少 被估計)。已發現如果該時間扭曲時域信號包含一由自相關 量度反映相對高度的週期性’那麼時間扭曲是有效的週期 性。相比之下,如果時間扭曲時域信號不包含一相當的週 期性,可以推斷該時間杻曲無效。 該發現基於如下事實:一有效時間扭曲將一變化頻率 (不包含-週期性)的—正弦信號的—部份變換為接近恒定 頻率(包含一高度的週期性)的一正弦信號的一部份。相比之 下,如果時間扭曲不能提供具有一高度週期,险的時域信 號’那麼可預期時間扭曲也不提供_可證明其施用可行的 重要位元率節約。 在-較佳實施例中,該能量集中資訊提供器被設定組 態以判定音訊信號之時間扭曲表示的-正規化自相關函數 的絕對值總和(對多個滯後值),以獲得該能量集中資吼。已 發現在估計該時間㈣之效率上衫要_計算複雜的自相 關峰值欺。另外,已發現-(大)範圍的自相關滞後值上的 自相關之一總評估也產生可靠的結果。這是由於如下事 實:時間扭曲實際上將變化頻率的多個信號成份(例如,基 頻及其諧波)變換為週期信號成份。因此,此一時間扭曲_ 號的自相關顯示多個自相關滞後值的峰值。因此,—纟· 11 201009812 形式是從自相關擷取能量集中資訊的一計算上高效率方 式。 在另一較佳實施例中,該時間扭曲致動信號提供器包 含一參考值計算器,被設定組態以基於該音訊信號的一未 時間扭曲頻譜表示,或基於該音訊信號的一未時間扭曲時 域表示,計算該參考值。在此一情況中,該比較器典型地 被設定組態以使用能量集中資訊及該參考值形成一比值, 該能量集中資訊描述該音訊信號的一時間扭曲變換頻譜的 能量集中。該比較器也被設定組態以將該比值與一個或多 個臨界值進行比較,以獲得該時間扭曲致動信號。已發現 一未時間扭曲情況中的一能量集中資訊與在時間扭曲情況 中的能量集中資訊之比允許一計算上高效率但仍充分可靠 的時間扭曲致動信號產生。 本發明之另一較佳實施例建立一音訊信號編碼器用於 編碼一輸入音訊信號,以獲得該輸入音訊信號的一編碼表 示。該音訊信號編碼器包含一時間扭曲變壓器,被設定組 態以基於該輸入音訊信號,提供一時間扭曲變換頻譜表 示。該音訊信號編碼器也包含一時間扭曲致動信號提供 器,如上所述。該時間扭曲致動信號提供器被設定組態以 接收該輸入音訊信號,且提供該能量集中資訊,使得該能 量集中資訊描述該輸入音訊信號的時間扭曲變換頻譜表示 中之一能量集中。該音訊信號編碼器進一步包含一控制 器,被設定組態以相關於該時間扭曲致動信號,向該時間 扭曲變換器選擇性地提供一發現之非恒定(變化)時間扭曲 201009812 輪廓部份或時間扭曲資訊,或一標準恒定(不變)時間扭曲輪 廓部份或時間扭曲資訊。以此方法,選擇性地接收或拒絕 由該輸入音訊信號的編碼音訊信號表示導出中的一發現非 恒定時間扭曲輪廓部份是可能的。 該概念基於下述發現:將一時間扭曲資訊引入該輸入 音訊信號的一編碼表示並不總是有效,因為編碼該時間扭 曲資訊需要一相當可觀數目的位元被。另外,已發現由該 時間扭曲致動信號提供器計算的能量集中資訊,是判定將 該發現之變化(非恒定)時間扭曲估計部份抑或一標準(不 變、恒定)時間扭曲輪廓提供至該時間扭曲變換器是否有利 的一種計算上高效率量度。已注意到當該時間扭曲變換器 包含一重疊變換時,一發現之時間扭曲輪廓部份可用在兩 個或更多隨後的變換塊的計算中。特別地,已發現為能做 出該時間扭曲是否允許位元率之一節約的判定並無必要使 用新發現的變化時間扭曲輪廓部份完全編碼該輸入音訊信 號的時間扭曲變換頻譜表示版本,及使用一標準(不變)時間 扭曲輪廓部份完全編碼該輸入音訊信號的時間扭曲變換頻 譜表示版本。已發現該輸入音訊信號的時間扭曲變換頻譜 表示之能量集中的一評估形成該判定的一可靠基礎。因 此,一必需的位元率可保持小。 在又一較佳實施例中,該音訊信號編碼器包含一輸出 介面,被設定組態以相關於該時間扭曲致動信號,選擇性 地包括一時間扭曲輪廓資訊,該資訊將一發現之變化時間 扭曲輪廓表示成該音訊信號編碼的表示。因此,一高效之 13 201009812 ,不管該輸入信號是否非常適合於 音§孔彳S號編竭可被獲得 時間扭曲。 本發明之另—實_建立—種基於 供一時間扭曲致動作骑唬k 方法實現該_扭曲致 作號提功能,且可由本文中有關該時間扭曲致動 », ^所描述的任何特徵及功能補充。 依據本發明之另—實施例建立一種用於編碼一輸入音 訊信號,以獲得軸人音訊信制—編碼絲的方法。該
方法可由本对有關該音訊錢編碼料描述的任何特徵 及功能補充。 依據本發明之另—實施例建立一種用於執行本文所提 到方法之電腦程式。
依據本發明之-第一層面,一種音訊信號分析,有關 具有譜波特性抑或—語音特性的之-音訊輯分析被有 利地用於控制編碼器端及/或解碼H端之雜訊注人處理。該 音訊k號分析在—時間扭曲功能被使㈣系統中易於獲 得’因為該時’曲功能上典型地包含-基頻追縱器及/或 號分類1§ ’料區分語音與音樂,及/或區分有聲語音 與無聲語音。因為該資訊可在此-場合帽取不需任何 另外的成本,故可取用之資訊被有利地用於控制該雜訊注 入特徵,使得尤其對於語音信號,諧波線之間的—雜訊注 入可被降低’或特別是甚至消除語音信號間的雜訊注入。 甚至在獲得一強譜波内容但是沒有被直接檢測到—語音的 情況中’雜訊注入之降低仍然將產生一較高的感知品質。 14 201009812 雖然該特徵在至少執行該諧波/語音分析被的系統中特別 有用’且因此該-資訊的取用不需任何附加成,甚至當一 指定信號分析器必須被插人該祕中時,控制基於一信號 具有-财抑或語音特性之㈣分㈣雜訊注人方案也有 效益,因為品質被增強^位元率沒有增加,或換言之位元 率減V ffijw $沒有損失’因為當可從__編碼器被發送到一 解碼器的雜訊注人位準本身被降低時,用於編碼該雜訊注 入位準所需之位元被減少。 在本發明-進-步的層面中,該信號分析結果,即該 仏號是-譜波信號抑或_語音信號,被用於控制一音訊編 碼器的視窗功能處理。已發現在—語音信號或—諧波信號 開始的情況中’-簡單編碼器將從長視窗切換至短視窗的 可能性是很高的。然而料短視窗具有—對應地降低的頻 譜解析度,另-方面,該頻率解析度將減少強諧波信號的 編碼增益,且S此增加編碼此—信號部份所需的位元數 目。鑑於此’當檢_卜語音或諧波㈣開始時,本發明 在此-層面界定使用長於—短視窗的視窗。或者,具有一 大體相似於該等長視窗的長度但具有_較 選擇以有效地減少前回音。大體上,-音訊域的時框具 有-諧波抑或-語音特_信號特性被用於選擇此一時框 的一視窗功能。 依據本發明之-進-步的層面,TNS(時域雜訊修整) 工具基於該基礎信絲於—時間扭曲操作抑或是在一線性 域中而被控制。典型地,已藉由__時間扭曲操作處理的一 15 201009812 信號將具有一強諧波内容。否則,與—時間扭曲級相關聯 的一基頻追蹤器不會輸出一有效基頻輪廓,且在缺少此— 有效基頻輪廓時,一時間扭曲功能會對該音訊信號的時框 被停用。然而,通常諧波信號將不適於接受TNS處理。當 由TNS級處理的信號具有一相當平坦的頻譜時,TNS處理特 別有用且產生位元率/品質上的一重要增益。然而,當該信 號之外觀是音調的,即非平坦的,如同在具有一諧波内容 或有聲内容之頻譜的情況中,由TNS工具提供的品質/位元 率上增益將被減少。因此,不使用該TNS工具之發明改良, ❽ 時間扭曲部份典型地不被TNS處理,但是會在不使用一TNS 濾波下被處理。另一方面,TNS的雜訊修整特徵仍然提供 - 改進的品質,特別是該信號在振幅/功率上變化的情況 _ 中在—諧波信號或語音信號之起始存在,及塊切換特徵 被實施,使得長視窗或者至少長於短視窗的視窗、而非該 起始被維持的情況中,該訊框的時域雜訊修整特徵之致動 將I致圍繞該語音啟動之雜訊的一集中’這有效地減少前 回音,該等前回音可能由於在一隨後的編碼器處理中之訊 © 框量化而在語音開始之前發生。 依據本發明之另一層面,一可變數目之線在一音訊編 碼》又備中由一量化器/熵編碼器處理以計入該可變帶寬該 帶寬藉由以一可變時間扭曲特性/扭曲輪廓執行_時間扭 曲操作而從訊框到訊框地被引入。當該時間扭曲操作導致 包括在一時間扭曲訊框中的訊框時間(以線性)增加時,一 早一頻率線之帶寬被減少,且,就一恒定總帶寬而言,要 16 201009812 被處理的頻譜線數目將在一非時間扭曲情況增加。另一方 面,當該時間扭曲操作導致在該時間扭曲域中音訊信號的 實際時間相對於在線性域中的音訊信號塊長度被減少時, 一單一頻率線的頻率帶寬被增加,且因此由一源編碼器處 理的線數目必須相對一非時間扭曲情況被減少,以具有一 減少的帶寬變化或,最好沒有帶寬變化。 圖式簡單說明 ❹ 第1圖繪示依據本發明一實施例的一時間扭曲致動信 號提供器的一方塊示意圖; 第2a圖繪示依據本發明一實施例的一音訊信號編碼 器的一方塊示意圖; 第2b圖繪示依據本發明一實施例的一時間扭曲致動 信號提供器的另一方塊示意圖; 第3a圖繪示一音訊信號的一未時間扭曲版本的一頻 譜之圖解表示; 第3b圖繪示該音訊信號的一時間扭曲版本的一頻譜 之圖解表示; 第3c圖繪示針對不同頻帶的頻譜平坦度量度的一個 別計算之圖解表示; 第3d圖繪示僅考慮該頻譜之較高頻帶的一頻譜平坦 度量度的一計算之圖解表示; 第3e圖繪示使用一頻譜表示的一頻譜平坦度量度的 一計算之圖解表示,在該頻譜表示中,一較高頻率部份在 一較低頻率部份上被強調; _ 17 201009812 第3f圖繪示依據本發明另一實施例的一能量集中資 訊提供器的方塊示意圖; 第3g圖繪示在該時域中具有一時間上可變基頻的一 音訊信號之圖解表示; 第3h圖繪示第3g圖音訊信號的一時間扭曲(不均勻重 新取樣的)版本之圖解表不, 第3i圖繪示依據第3g圖的音訊信號的一自相關函數 之圖解表示; 第3j圖繪示依據第3h圖的音訊信號的一自相關函數 的圖解表示; 第3k圖繪示依據本發明另一實施例的一能量集中資 訊提供器的方塊示意圖; 第4a圖繪示一種用於基於一音訊信號提供一時間扭 曲致動信號的方法的流程圖; 第4b圖繪示依據本發明一實施例,一種用於編碼一輸 入音訊信號,以獲得該輸入音訊信號的一編碼表示的方法 的流程圖; 第5a圖繪示具有發明之層面的一音訊編碼器的一較 佳實施例; 第5b圖繪示具有發明之層面的一音訊解碼器的一較 佳實施例; 第6a圖繪示本發明之雜訊注入層面的一較佳實施例; 第6b圖繪示界定由該雜訊注入位準調處器執行的控 制操作的一表格; 18 201009812 第7a圖繪示依據本發明用於執行一基於時間扭曲的 塊切換的較佳實施例; 第7b圖繪示影響該視窗功能的一可供選擇的實施例; 第7c圖繪示用於基於時間扭曲資訊說明該視窗功能 的另一可供選擇的實施例; 第7d圖繪示在一有聲啟動處的一正常AAC行為的一 視窗順序; 第7e圖繪示依據本發明之一較佳實施例獲得的可供 選擇的視窗順序; 第8a圖繪示TNS(時域雜訊整修)工具的一基於時間扭 曲的控制的較佳實施例; 第8b圖繪示界定第8a圖的臨界控制信號產生器中被 執行的控制步驟的一表格; 第9a-9e圖繪示不同的時間扭曲特性,及繼一解碼器端 時間扭曲操作之後發生的相對應的音訊信號的帶寬上的影 響; 第10a圖繪示用於控制一編碼處理器中的線之數目的 一控制器之一較佳實施例; 第10b圖繪示要針對一取樣率被廢除/加入的線之數 目之間的一依賴性; 第11圖繪示一線性時間標度與一經扭曲時間標度之 間的一比較; 第12a圖繪示帶寬延伸在該内文中的一實施;及 第12b圖繪示描繪在時間扭曲域中的局部取樣率與頻 19 201009812 譜係數的控制之間的依賴性的一表格。
【實施方式:J 第1圖繪示依據本發明之一實施例的時間扭曲致動信 號提供器的一方塊示意圖。該時間扭曲致動信號提供器100 被設定組態以接收一音訊信號的一表示110,且基於該表示 110,提供一時間扭曲致動信號112。時間扭曲致動信號提 供器100包含一能量集中資訊提供器120,被設定組態以提 供一能量集中資訊122,該資訊122描述該音訊信號的一時 間扭曲變換頻譜表示的能量之一集中。時間扭曲致動信號 提供器100進一步包含一比較器130,被設定組態以將能量 集中資訊122與一參考值132作比較,以依據該比較之結果 提供時間扭曲致動信號112。 如上所述,已發現能量集中資訊是允許一時間扭曲是 否帶來一位元節約的計算上高效率評估的有價值的資訊。 已發現一位元節約的存在與該時間扭曲是否導致一能量集 中之問題密切相關。 第2 a圖繪示依據本發明一實施例的一音訊信號編碼器 200的方塊示意圖。音訊信號編碼器200被設定組態以接收 一輸入音訊信號210(也以a⑴標明),且基於該輸入音訊信號 210提供其之編碼表示212。音訊信號編碼器200包含一時間 扭曲變換器220,被設定組態以接收輸入音訊信號21〇(可在 一時域中被表示),且基於輸入音訊信號210提供其之一時 間扭曲變換頻譜表示222。音訊信號編碼器200進一步包含 一時間扭曲分析器284,被設定組態以分析輸入音訊信號 20 201009812 210,且基於其,提供一時間扭曲輪廓資訊286(例如絕對或 相對時間扭曲輪廓資訊)。 音訊信號編碼器200進一步包含一切換機制,例如以一 受控開關240的形式’以判定找出之時間扭曲輪廓資訊286 抑或一標準時間扭曲輪廓資訊288被用於進一步的處理。因 此’該切換機制240被設定組態以相關於一時間杻曲致動資 訊,選擇性地將找出之時間扭曲輪廓資訊286或一標準時間 ❹ ❺ 扭曲輪廓資訊288作為一新時間扭曲輪廓資訊242,例如提 供給時間扭曲變換器220用於一進一步的處理。應注意,時 間扭曲變換器220例如可就一音訊訊框的時間扭曲使用新 時間扭曲輪廓資訊242(例如一新時間扭曲輪廓部份),且另 外使用一先前獲得的時間扭曲資訊(例如一個或多個先前 獲得的時間扭曲輪廓部份)。該可任選頻譜後處理例如可包 含-時域雜訊整修及/或-雜訊注人分析。音訊信號編碼器 200也包含-量化|§/編碼器260,被設定組態以接收頻譜表 示2D(可選擇地由頻譜後處理挪處理),且量化及編碼^變 換頻譜表示222。為此,#化器/編碼器細可與—感知模型 職接,且從感知模型轉收—感知關物㈣,以考 慮-感知雜且依據人軸知料同的料槽驢量化精 確度。音訊信號編碼器2__步包含一輸出介面⑽,被 設定組態以基於由量化器/編碼器咖提供的已量化且料 頻i昝表不262,提供該音訊信號的編竭表示犯。 音訊信號編碼器200進一步包含—時間扭曲致動传號 提供器23G ’倾定組態以提供—曲致動信號232 Γ 21 201009812 時間扭曲致動信號232例如可,被用於控制切換機制240, 以判定新發現時間扭曲輪廓資訊286抑或一標準時間扭曲 輪廓資訊288被用於進一步的處理步驟中(例如藉由時間扭 曲轉換器220)。另外,時間扭曲致動資訊232可被用於一開 關280中,以判定已選擇新時間扭曲輪廓資訊242(從新發現 時間扭曲輪廓資訊286及標準時間扭曲輪廓資訊中選擇)是 否被包括在輸入音訊信號210的編碼表示212中。典型地, 如果已選擇時間扭曲輪廓資訊描述一非恒定(變化)時間扭 曲輪廓’那麼時間扭曲輪廓資訊僅被包括在該音訊信號的 ® 編碼表示212中。同樣,時間扭曲致動資訊232其本身可包 括在編碼表示212中,例如以指示該時間扭曲致動或停用的 一個一位元旗標的形式。 - 爲利於理解,應注意時間扭曲變換器220典型地包含一 分析視窗器220a、一重新取樣器或「時間扭曲器」220b及 一頻譜域變換器(或時間/頻率轉換器)22〇c。然而,視該實 施而定’時間扭曲器220b可被放置於一以一信號處理方 向一分析視窗器220a之前。然而,時間扭曲及時域到頻譜 ❹ 域變換在一些實施例中可被合併在一單一單元中。 在下文中,關於時間扭曲致動信號提供器23〇之操作的 細節將被描述。應注意時間扭曲致動信號提供器23〇可等同 於時間扭曲致動信號提供器100。 時間扭曲致動心號七供器23〇較佳地被設定組態以接 收時域音訊信號表示210(也以a⑴標明)、新發現時間㈣輪 廓資訊286 ’及標準時間扭曲輪廓資訊288。時間扭曲致動 22 201009812 信號提供器230也被設定組態以使用時域音訊信號210,獲 得新發現時間扭曲輪廓資訊286及標準時間扭曲輪廓資訊 288 ’描述由於新發現時間扭曲輪廓資訊286之一能量集中 的一能量集中資訊,且基於該能量集中資訊提供時間扭曲 致動信號232。 第2b圖繪示依據本發明之一實施例的一時間扭曲致動 信號提供器234的方塊示意圖。時間扭曲致動信號提供器 234可發揮一些實施例中的時間扭曲致動信號提供器23〇的 作用。時間扭曲致動信號提供器234被設定組態以接收一輸 入音訊信號210,及兩個時間扭曲輪廓資訊286與288,且基 於其提供一時間扭曲致動信號234p。時間扭曲致動信號 234p可發揮時間扭曲致動信號232的作用。時間扭曲致動信 號提供器包含兩個相同時間扭曲表示提供器234a、234g, 被設定組態以分別接收輸入音訊信號210及時間扭曲輪廓 資訊286與288,且基於其分別提供兩個時間扭曲表示234e 及234k。時間扭曲致動信號提供器234進一步包含兩個相同 能量集中資訊提供器234f及2341,被設定組態以分別接收時 間扭曲表示234e及234k,且基於其分別提供能量集中資訊 234m及234r^時間扭曲致動信號提供器進一步包含一比較 器234〇 ’被設定組態以接收能量集中資訊234πι及234η,且 基於其提供時間扭曲致動信號234ρ。 爲了利於理解,應注意時間扭曲表示提供器234a與 234g典型地包含(可選)相同的分析視窗器234b及234h、相同 的重新取樣器或時間扭曲器234c及234i,及(可選)相同的頻 23 201009812 譜域變換器234d及234j。 在下文中,用於獲得能量集中資訊的不同概念將被討 論。事先將做一介紹以說明一典型音訊信號上之時間扭曲 效果。 在下文中,一音訊信號上時間扭曲之效果將參考第知 圖及第3b圖被描述。第3a圖緣示—音訊信號的_頻譜的圖 解表不。一橫座標301描述一頻率,一縱座標3〇2描述該音
訊信號之強度。一弧線303以頻率£的一函數描述未時間扭 曲音訊信號的強度。
第3b圖繪不第3竭中表示的音訊信號的一時間扭曲版 本的-頻f#之圖解麵,樣…橫座標獨描述一頻率, -縱座標3〇7描述該音補號之她錄本之強度。—狐線 308描述該音訊信號在頻率上的時間扭曲版本強度。從第3a 圖與第3b_圖解絲的__比較可看出,該音訊信號的未 時間扭曲(未_」)版本包含—模糊頻譜,制在—較高 頻域4目tb<下’該輸人音訊信號的時間扭曲版本包含 具有月晰可區〃頻譜波峰的—頻譜,甚至在較高頻域中。 另外’該等頻譜波峰的—中等銳化甚至可在該輸人音訊信 號的時間扭曲版本的較低頻議域巾被看到。 -叫r所不的該輸入首訊彳§號的時間扭 本之頻谱可’例如由量化器/編碼器260以比第3a圖所示 扭曲輸\ a訊彳5號的頻譜較低的位元率被量化及編喝 是由事實’·—模糊頻譜典型地包含-很大數目 知相關頻譜係敖(即-相對很小數目的被量化為㈣ 24 201009812 化為很小值的頻譜係數),同時如第3圖所示的一「較不平 坦」頻譜典型地包含一較大數目被量化為零或被量化為很 小值的頻譜係數。被量化為零或被量化為很小值的頻譜係 數可以比被量化為較高值的頻譜係數較少的位元被編碼, 使得第3b圖的頻譜可使用比第3a圖的頻譜較少的位元被編 碼。 然而,也應注意到一時間扭曲的使用不總是產生該時 間扭曲信號的編碼效率的一重要的改進。因此,在一些情 況中,依據位元率,被需要用於該時間扭曲資訊(例如時間 扭曲輪廓)之編碼的價格可能超出就位元率而言的節約,用 於編碼時間扭曲變換頻譜(當較之於編碼未時間扭曲變換 頻譜時)。在此情況中,較佳地,使用一標準(不變)時間扭 曲輪廓提供該音訊信號之編碼表示,以控制該時間扭曲變 換。因此,任何時間扭曲資訊(即時間扭曲輪廓資訊)之發送 可被忽略(除指示該時間扭曲之停用的一旗標之外),由此保 持該位元率很低。 在下文中,用於一時間扭曲致動信號112、232、234p 的一可靠且計算上高效率的計算之不同概念將參考第 3c-3k圖被描述。然而,在這之前,所發明的概念之背景將 被簡短概括。 基本假定是以一變化基頻將時間扭曲施用於一諧波信 號使該基頻恒定,且使該基頻恒定改進由一隨後的時間頻 率變化獲得的頻譜之編碼,因為僅一有限數目的重要的線 餘留(見第3b圖),而不是數個頻譜容量上不同諧波之模糊 25 201009812 (見第3a圖)。然而 “ ,甚至當一基頻變化被檢測到時,編碼增 益上的改進(即所節 在1(例如 夕煜铷w 強雜訊’或如果該變化太小以至較高諧波 解n _) ’或可少於需要將時間扭曲輪廓發送至該 解碼态的位元夕金 、 1,或可簡單地是錯的。在該等情況中, 較佳地,拒絕由— 、時間扭曲輪廓編碼器產生的變化時間扭 曲輪扉(例如286),而相反使用—有效的— 一標準(不變)時間扭曲輪廓。
告、:發明,範圍包含一種判定一已獲得的時間扭曲輪廓 P伤疋否提供足夠的編碼增益(例如足以補償時間扭曲輪 廓編碼所f要成本的編碼增益)时法之建立。 .所述,時間扭曲之最重要的層面是一較少數目線 的頻°“b量集中(見第3a圖及第3b圖)。它們繪示—能量集中 也相對應於-較「不平」_譜(見第關及第,因為 該頻4之波峰與波谷之差被增加。誠量被集巾於少數線 上,該等線在具有比之前較少的能量的線之間。
第3a圖與第3b圖繪示具有強諧波及基頻變化的一訊框 的一未扭曲頻譜(第3a圖)與該相同訊框的時間扭曲版本的 頻譜(第3b圖)的一示意性範例。 考慮到該情況,已發現將頻譜平坦度量度用作該時間 扭曲效率的—可能的量度是有利的。 該頻譜平坦度可例如,由該功率頻譜之算術平均除功 率頻譜之幾何平均被計算。例如,該頻譜平坦度(也以「平 坦度」簡短地標明)可依據如下方程式被計算: 26 201009812
Flatness= 在上式中,x(n)表示一容量號碼n的大小。另外,在上 式中’ N表示該頻譜平坦度量度之計算考慮到的頻譜容量之 總數目。
在本發明之一實施例中,可用作一能量集中資訊的上 述「平坦度」的計算可使用時間扭曲變換頻譜表示234e、 234k被執行’使得如下關係被保持: x(n)= | X | tw(n) 在此情況中,N可以等於由頻譜域變換器234d、234j 提供的頻譜線之數目,|x|tw(n)是一经時間扭曲變換頻譜 表示 234e、234k。 儘管該頻譜量度是用於該時間扭曲致動信號之提供的 一有用的量,該頻譜平坦度量度的一個缺點,如信號對雜
汛比(SNR)量度,是如果被施用於整個頻譜,其以較高能量 強調部份頻譜。通常,諧波頻譜具有一定頻譜傾斜,意指 大部份該能量集中於前面的少數部份音調,且接著随增加 的頻率而減少’導致該測量中較高部份的—代表性不足。 這在一些實施例中是不想要的’由於希望改進此等較高部 份的品質’因為它們變得最模糊(見第細)。在下文中,該 頻譜平坦度量度之關聯性的改進之數個可選概念將被討 論。 在依據本發明一實施例中’ 一種與所謂的「分段式 27 2〇l〇〇98l2 量声j度相似的方法被選擇,產生—分頻段頻譜平括声 別朗平坦度4度的—計算在許多頻帶中被(例如 1 具有相等:帶且寬主要::(7均)被採用。該等, 樑度,如臨該等帶寬將跟隨1知 編瑪,:頻帶,或相對應於,例如所謂的「先進音訊 ‘、、」也稱為AAC的量尺因子頻帶。
繪干:述概念將在下文參考第艾圖被簡短的解釋,第艽圖 冋頻帶的頻譜平坦度量度的—個別計算的圖解表 :圖所不’ °亥頻5普可被分為不同的頻帶31卜312、313, =們可具有-相等的帶寬或可具有不同的帶寬。例如,一 第—頻譜平坦度量度可針對第一頻帶3ιι,例如使用上文給 出的「平坦度」方程式被計算。在該計算中,該第一頻帶 的頻率槽可被考慮(遊動變量η可採用該第一頻帶的頻率槽 的頻率槽減),且該第—頻帶3_寬度可被考慮(可變Ν I採用依據該第i帶的頻帶容㈣寬度)。因此,針對第 一頻帶311的—平坦度量度被獲得。相似地,針對第二頻帶 3一12的—平坦度量度’可考慮到第二頻帶312的頻率槽及第 頻帶的寬度而被计算。另外,附加頻帶如第三頻帶312的 平坦度量度可以相同方法被計算。 隨後’對不同頻帶3U、312、313的平坦度量度的一平 均可破計算,且該平均可用作能量集中資訊。 另方法(用於該時間扭曲致動信號的導出之改進)是 將該頻譜平坦度量度僅施用於某1率。此—方法在第如 圖中4月如圖所不’僅在頻譜的一高頻部份別中的頻率 28 201009812 槽針對該頻譜坦平度量度的計算被考慮。該頻譜的一低頻 部份對於該頻講平坦度兩次的計算被忽略。高頻部份316對 於該頻譜平坦度量度的計算可被考慮frequency-分頻段。可 供選擇地,全部高頻部份316可針對該頻譜平坦度量度的計 算在其整體中被考慮。 综上所述,可以說頻譜平坦度的降低(由時間扭曲之施 用產生)可被考慮為該時間扭曲的效果的一第一量度。 例如,時間扭曲致動信號提供器100、230、234(或其 〇 比較器130、234〇)可使用一標準時間扭曲輪廓資訊,將時 間扭曲變換頻譜表示234e的頻譜平坦度量度與時間扭曲變 換頻譜表示234k的一頻譜平坦度量度進行比較,且基於該 比較判定該施加扭曲致動信號是有效還是無效的。例如, 當與沒有時間扭曲的情況相比時,如果該時間扭曲產生該 頻譜平坦度量度的一充分的降低,那麼該時間扭曲藉由該 時間扭曲致動信號的一適當的設定被致動。 除上述方法以外,該頻譜的高頻部份可在低頻部份上 © 針對該頻譜平坦度的計算被強調(例如藉由一適當的定 標)。第3e圖繪示一時間扭曲變換頻譜的圖解表示,在該時 間扭曲變換頻譜中,一高頻部份在一低頻部份上被強調。 因此’該頻譜中的高頻部份的一代表性不足被補償。因此, 該平坦度度量度可在該被完整定標的頻譜中被計算,在該 頻譜中高頻率槽在低頻率槽上被強調,如第3e圖所示。 就位元節約而言,編碼效率的一典型量度將是感知 熵’可以一種方式被界定,使得其與被需要以編碼在下述 29 201009812 文獻中描述的某一頻譜的位元之實際數目很好的聯繫起 來:3GPP TS 26.403 V7.0.0: 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; General audio codec audio processing functions ; Enhanced aacPlus general audio codec ;Encoder specification AAC part: Section 5.6.1.1.3 Relation between bit demand and perceptual entropy。所以,該感知摘的減少是該時間扭 曲之效率的另一量度。 第3f圖繪示一能量集中資訊提供器325,可取代能量集 中資訊提供器120、234f、2341,且可被用在時間扭曲致動 信號提供器100、290、234中。能量集中資訊提供器325被 設定組態以接收該音訊信號的一表示,例如,以一時間扭 曲變換頻譜表示234e、234k的形式,也以|x|tw標明。能量 集中資訊提供器325也被設定組態以提供一感知熵資訊 326,可取代能量集中資訊122、234m、234η。 能量集中資訊提供器325包含一形式因子計算器327, 被設定組態以接收時間扭曲變換頻譜表示234e、234k,且 基於其提供一形式因子資訊328,該形式因子資訊328可與 一頻帶相關聯。能量集中資訊提供器325也包含一頻帶能量 計算器329,被設定組態以基於時間扭曲頻譜表示234e、 234k,計算一頻帶能量資訊en(n)(330)。能量集中資訊提供 器325同樣包含許多線估計器331,被設定組態以對具有指 數η的頻帶提供一經估計數目的線資訊nl(332)。另外,能量 集中資訊提供器325包含一感知熵計算器333,被設定組態 201009812 以基於頻帶能量資訊330及該等經估計數目的線資訊332, 計算感知熵資訊326。例如,形式因子計算器327可被設定 組態以依據下述方程式計算形式因子: kOffset(n+\)~\ 伽⑻=Σ (η k=kOffset(n) ’ ❹
在上述方程式中,ffac(n)表示具有一頻帶指數n的頻帶 之形式因子。k表示一遊動變量,在量尺因子頻帶(或頻帶化 的頻譜容量指數上遊動。X(k)表示具有一頻譜容量指數(或 一頻率槽指數)k的頻譜容量(或頻率槽)的一頻譜值。 線估計器之數目可被設定組態以依據如下方程式估計 非零線之數目,由nl表示: nl = (2) __ffacjn)_ (__) χθ.25 kOffset(n + 1)- kOffset(n) 在上述方程式中’en(n)表示具有指數n的頻帶或量尺因 子頻帶的一能量。kOffset(n+l)-kOffset(n)表示一具頻譜容 量的具指數η的頻帶或量尺因子頻帶的一寬度。 另外,感知摘計算器332可被設定組態以依據如下方程 式計算感知熵資訊sfbPe : sfbPe = nl * 1 ren\ ‘(tit) thr for log2(^-)>cl (c2 + c3 · log 2 ^0Γ 2 < c 1 (3) 在上文中,下述關係將被保持: cl = log2(8) c2 = log2(2.5) c3 = l-c2/cl (4) 一總的感知熵pe可被計算為多個頻帶或量尺因子頻帶 31 201009812 的感知熵之總和。 如上所述,感知熵資訊326可被用作一能量集中資訊。 對於關於感知熵之計算的進一步細節,參考國際標準 「3GPPTS 26.403 V7.0.0(2006-06)」的第 5.6.1.1.3 節。 在下文中,一概念將針對時域中的能量集中資訊之計 算被描述。 再看TW-MDCT(時間扭曲改良型離散餘弦轉換)是以 一種方式改變該信號,以具有一個方塊中的一恒定或幾乎 恒定基頻的基本觀念。如果一恒定基頻被實現,意味著一 個處理塊的自相關之最大值增加。既然找到對於時間扭曲 及未時間扭曲情況之相對應的自相關中的最大值沒有意 義,正規化自相關的絕對值之總和可被用作該改進的一量 度。該總和的一增加相對應於該能量集中的一增加。 該概念將在下文中參考第3g圖、第3h圖、第3i圖、第 3j圖及第3k圖被詳細描述。 第3g圖繪示時域中一未時間扭曲信號的一圖解表示。 一橫座標350描繪時間,一縱座標351描繪該未時間扭曲時 間信號的一位準a(t)。一弧線352描繪未時間扭曲時間信號 的時間上的演變。假定由弧線352描繪的該未時間扭曲時間 信號之頻率隨時間增加,如第3g圖所示。 第3h圖繪示第3g圖的時間信號的一時間扭曲版本的圖 解表示。一橫座標355繪示經扭曲時間(例如以一正規化的 形式),一縱座標356繪示信號a⑴的時間扭曲版本a(tw)的位 準。如第3h圖所示,未時間扭曲時間信號a(t)的時間扭曲版 32 201009812 本a(tw)包含(至少近似地)在經扭曲時域中一時間上恒定的 頻率。 換句話說,第3h圖續·示如下事實:_時間上變化的頻 率的一時間信號藉由一適當的時間扭曲操作被變換為一時 間上恒定頻率的一時間信號,該變換可包含一時間扭曲重 新取樣。 第3i圖繪示未扭曲時間信號a(t)的一自相關函數的一圖 解表示。一橫座標360繪示一自相關滯後τ,一縱座標361繪 示該自相關函數的一大小。標記362繪示自相關函數Ruw(T) 的一演變,作為自相關滯後τ的一函數。如第3i圖所示,未 扭曲時間信號a(t)的自相關函數Ruw包含一 τ=〇的峰值(由信 號a(t)的能量反映),且样〇時為很小值。 第3j圖繪示時間扭曲施加信號a(tw)的自相關函數R…的 圖解表示。如第3j圖所示,自相關函數Rtw包含τ=〇的—峰 值’且也包含自相關滯後τ的其他值々、、A的峰值。此等 τι、τ2、&的附加峰值由時間扭曲之效果獲得,以增加時間 扭曲時間h號a(tw)的週期性。當與自相關函數⑴相比 時”玄週期性由自相關函數‘⑴的附力口波峰反映。因此, δ較之於原始曰δ凡彳§號的自相關函數時,時間扭曲音訊信 號的自相關1^數之附加波峰(或波峰之增加的強度)的存 在,可被用作時間扭曲的效能(就—位元率減少而言)的—指 示。 第处圖緣不一能量集中資訊提供器370的一方塊示意 圖,其被設定組態以接收該音訊信號,例如時間扭曲信號 33 201009812 234e、234k的一時間扭曲時域表示(頻譜域變換234d、23喇 及可選擇的分析視窗器234b及234h被忽略),且,基於其提 供一能量集中資訊374,該資訊374可發揮能量集中資訊122 的作用。第3k圖的能量集中資訊提供器370包含一自相關計 异器371,被設疋組態以計算時間扭曲信號a(tw)在離散值τ 的一預定範圍上的自相關函數Rtw(i:)。能量集中資訊提供器 370也包含一自相關加法器372 ’被設定組態以將自相關函 數Rtw(T)的多個值(例如’在離散值τ的一預定範圍上)相加, 且提供所獲得的總和作為能量集中資訊122、234m、。 © 因此’能莖集中資訊提供器370允許提供指示該時間扭 曲效果的一可靠資訊,而不需實際上執行輸入音訊信號21〇 的時間扭曲時域版本的頻譜域變換。因此,只要發現基於 - 由能量集中資訊提供器370提供的能量集中資訊122、 234m、234η ’時間扭曲實際產生一改進的編碼效率,則執 行輸入音訊信號310之時間扭曲版本的一頻譜域變換即為 可行。 綜上所述’依據本發明之實施例建立用於最終品質檢 〇 測的一概念。一產生的基頻輪廓(用於一時間扭曲音訊信號 編碼器中)依攄其編碼增益被評估,且被接收或拒絕。數個 關於該頻譜之稀疏或編碼增益之量度可被該判定考慮,例 如,一頻譜平坦度量度、一分頻段分段頻譜平坦度量度, 及/或一感知熵。 不同頻譜集中資訊的使用被討論’例如,一頻譜平坦 度量度的使用,一感知烟量度的使用,及—時域自相關量 34 201009812 度的使用。然而,仍有顯示一時間扭曲頻譜中之一能量集 中的其他量度。 所有的該等量度可被使用。較佳地,對於所有該等量 度而言,一未扭曲與一時間扭曲頻譜的量度之比被界定, 且一臨界值對於該編碼器中的該比被設定,以判定已獲得 的時間扭曲輪廓在編碼中是否有利。 所有該等量度可被施用於一全訊框中,在該訊框中僅 三分之一該基頻輪廓是新的(其中,例如,該基頻輪廓的三 部份與該全訊框相關聯),或較佳地僅對於部份該信號,對 於部份該信號,該新部份例如使用以位於該(各自)信號部份 中心的一低重疊視窗的變換被獲得。 自然,一單一量度或上述量度的一合併可被使用,如 所希望的。 第4a圖繪示一種用於基於一音訊信號提供一時間扭曲 致動信號之方法的流程圖。第4a圖的方法400包含提供一能 量集中資訊的一步驟410,該能量集中資訊描述該音訊信號 的一時間扭曲變換頻譜表示中之一能量集中。方法400進一 步包含將該能量集中資訊與一參考值相比較的一步驟 420。方法400也包含依據該比較之結果提供時間扭曲致動 信號的一步驟430。 方法400可由本文描述的任何特徵及功能關於該時間 扭曲致動信號的提供而被補充。 第4b圖繪示一種用於編碼一輸入音訊信號以獲得該輸 入音訊信號的一編碼表示之方法的流程圖。方法450可選擇 35 201009812 地包含基於該輸入音訊信號提供一時間扭曲變換頻譜表示 的一步驟460。方法450也包含提供一時間扭曲致動信號的 一步驟470。步驟470可,例如包含方法4〇〇之功能。因此, 該能量集中資訊可被提供’使得該能量集中資訊描述該輸 入音訊信號的時間扭曲變換頻譜中之一能量集中。方法450 也包含一步驟480,依據該時間扭曲致動信號,使用一新發 現時間扭曲輪廓資訊提供該輸入音訊信號的時間扭曲變換 頻譜表示的一描述,或使用一標準(不變)時間扭曲輪廓資訊 提供該輸入音訊信號的一未時間扭曲變換頻譜表示的描 ❹ 述,以包含在該輸入信號的編碼表示中。 方法45 0可藉由本文討論的任何特徵及功能關於該輸 ' 入音訊信號之編瑪被補充。 - 第5圖繪示依據本發明的一音訊編碼器的一較佳實施 例,其中本發明的數個層面被實施。一音訊信號被提供於 一編碼器輸入500處。該音訊信號將典型地是一離散音訊信 號,該離散音訊信號使用被稱作正常取樣率的一取樣率從 一類比音訊信號被導出。該正常取樣率不同於在一時間扭 n 曲操作中產生的一局部取樣率,且輸入500處的音訊信號之 正常取樣率是產生由一恒定時間部份分離的音訊樣本的恒 定取樣率。該信號被輸入一分析視窗器502,在該實施例 中’分析視窗器502被連接至一視窗功能控制器504。分析 視窗器502被連接至一時間扭曲器506。然而,依據該實施, 時間扭曲器506可被置於—以一信號處理方向—分析視窗 器502之前。當一時間扭曲特性被需要用於方塊5〇2的分析 36 201009812 視窗化時,且當該時間扭曲操作要被執行於時間扭曲樣本 上而非未扭曲樣本上時,該實施是較佳的。特別在國際專 利申明案PCT/EP2009/002118 ’ Bernd Edler等人的「Time
Warped MDCT」所描述的基於mdct的時間扭曲之内文 中。對於其他N•間扭曲施用諸如L.villemoes在2005年11月 提出的國際專利申請案凡:丁/砂細⑽收牝彳耵⑽^^^
Transform Coding 〇f Audio Signals」中描述的,時間扭曲器 506與分析視窗器502之間的佈置可依據所需被設定。此 外,一時間/頻率轉換器508被提供用於執行一時間扭曲音 訊信號到一頻譜表示的一時間/頻率轉換。該頻譜表示可被 輸入至一TNS(時域雜訊修整)級51〇,其提供TNS資訊作為 一輸出51〇a,且提供頻譜殘餘值作為一輸出510b。輸出51〇b 被耦接至-量化器及編碼器塊512,該量化器及編碼器塊 512可由一感知模型514控制,用於量化一信號,使得該量 化雜訊被隱藏在該音訊信號的感知遮蔽臨界值之下。 此外,第5a圖繪示的編碼器包含一時間扭曲分析器 516,可作為一基頻追蹤器被實施,其在輸出518處提供— 時間扭曲資訊。線518上之信號可包含—時間扭曲特性、— 基頻特性、-基頻輪廓,或由時間扭曲分析器分析的信號 疋-諧波信號抑或-非諧波信號的資訊。該時間扭曲分析 器也可實祕财聲語音與無聲語音的魏。然而,依據 該實施’及-信齡㈣5财碰實施,該有聲,無聲判 定也可由信號分類器完成。在此情財,該時間扭曲分 析器沒必要必須執行相同的功能。時間扭曲分析器輸出518 37 201009812 被連接至包含視窗功能控制器5〇4、時間扭曲器506、TNS 級510、量化器與編碼器512及一輸出介面522的功能組中的 至少一個且較佳地多於一個的功能。 類似地,信號分類器52〇的一輸出522可被連接至包含 視窗功能控制器504、TNS級510、一雜訊注入分析器524或 輸出介面522的功能組中的至少一個且較佳地多於一個的 功能。此外,時間扭曲分析器輸出518也可被連接至雜訊注 入分析器524。 雖然第5a圖繪示分析視窗器輸入5〇〇上的該音訊信號 © 被輸入至時間扭曲分析器516及信號分類器520的情況,該 等功能的輸入信號也可擷取自分析視窗器5〇2對於信號分 類器之輸出,甚至可掏取自時間扭曲器5〇6、時間/頻率轉 · 換器508的輸出或TNS級510的輸出。 除由量化器編碼器512在526處指示的一信號輸出外, 輸出介面522接收TNS旁資訊510a、一感知模型旁資訊 528 ’其可包括編碼形式的置尺因子,針對較先進時間扭曲 旁資遠如線518上之基頻輪廊及線522上之信號分類資气 的時間扭曲指示資料。此外,雜訊注入分析器524也可將輸 出530上的輸出雜訊注入資料輸出至輸出介面522中。輸出 介面522被設定組態以在線532上產生編蜂音訊輸出資料, 以發送至一解碼器,或儲存在一儲存裝置諸如記憶體裝置 中。依據該實施’輸出資料532可包括到輪出介面522的所 有輸入,或如果該資訊不被一相對應的具有一減少的功能 的解碼器所需要’或如果該資訊由於經由_不同發送通道 38 201009812 的一發送已在該解碼器處可用時,可包含較少資訊。 第5a圖繪示的編碼器可被實施成mpeg-4標準中所定 義的,除第5圖中發明的編碼器中說明的,由較之於mpeg_4 標準,具有一先進功能的視窗功能控制器504、雜訊注入分 析器524、量化器編碼器512及1^5級51〇所表示的功能之 外。一進一步描述在AAC標準(國際標準13818-7)或3GPP TS 26.403 V7.0.0: Third generation partnership project; technical specification group services and system aspect; general audio codec audio processing functions; enhanced AAC plus general audio codec ° 隨後,第5b圖被討論,第5b圖繪示用於經由輸入540解 碼一編碼的音訊信號的一音訊解碼器的一較佳實施例。該 輸入介面540作用以處理該編碼的音訊信號,使得資訊的不 同資訊項從線540上之信號被擷取。該資訊包含信號分類資 訊541 '時間扭曲資訊542、雜訊注入資料543、量尺因子 544、TNS資料545及編碼頻譜資訊546。該編碼頻譜資訊被 輸入至一熵解碼器547,熵解碼器547可包含一霍夫曼解碼 器或一算術解瑪器,假如第5a圖的方塊512中的編碼器功能 被實施成一相對應的編碼器,諸如一霍夫曼編碼器或—算 術編碼器。該解碼頻譜資訊被輸入至,一重新量化器55〇中, 該重新量化器550被連接至一雜訊注入器552。雜訊注入器 552的輸出被輸入至一反TNS級554中,反TNS級554另外接 收線545上之TNS資料。依據該實施,雜訊注入器552及TNS 級554可以不同的順序被施用,使得雜訊注入器552操作於 39 201009812 入資料上。此外,一
TNS級554輸出資料上而不是在TNs輸 頻率/時間轉換器556被提供,其饋送一 信號處理鏈的輸出,較佳地執行—重? 視窗器被施用成在560處指示的。時 MDCT的編碼/解碼演算法n由於重疊/加人步驟從一 個方塊到下-個的固有交叉淡入淡出操作被有利地用作該 等處理鏈中最後的操作,使得所有的區塊效應被有效蘭 ❹ 此外,一雜訊注入分析器562被提供,被設定組態以控 制雜訊注入器552,且接收時間扭曲資訊542及/或信號分類 · 資訊541及在重新量化頻譜上的資訊,依據可能的情況,作 為一輸入。 較佳地’此後所描述的全部功能被一起施用於一編碼 音訊編碼器/解碼器方案中。然而,此後所描述的功能也可 被獨立地施用於彼此,即,使得僅一個或一組但非全部該 © 等功能在某一編碼器/解碼器中被實施。 隨後’本發明之雜訊注入層面被詳細地描述。 在一實施例中,由第5a圖的時間扭曲/基頻輪廓工具516 提供的附加資訊被有利地用於控制其他編碼解碼工具,且 特定地,由編碼器端雜訊注入分析器524實施及/或由解碼 器端雜訊注入分析器562及雜訊注入器552實施的雜訊注入 工具。 40 201009812 AAC結構中的數個編碼器工具諸如一雜訊注入工具由 基頻輪廓分析收集的資訊及/或由信號分類器520提供的一 信號分類的一附加知識被控制。 一發現的基頻輪廓以一清晰諧波結構指示信號段,所 以雜訊注入諧波線之間可能降低感知品質,特別是語音信 號上的,因此當找出一基頻輪廓時,雜訊位準被降低。否 則,在部份音調之間會有雜訊,此與對一模糊頻譜增加量 化雜訊具有相同的效果。另外,雜訊位準降低量可藉由使 用信號分類器資訊被進一步精化,所以,例如對於語音信 號將不會有雜訊注入,且一中度雜訊注入將以一強諧波結 構被施加於通用信號。 大體上,在複數個零已從一編碼器被發送至一解碼 器’即’第5a圖中的量化器512將頻譜線量化為零的情況, 雜訊注入器552用於將頻譜線插入一解碼頻譜。當然,將頻 譜線量化為零大大降低了已發送信號的位元率,且理論 上’當該等頻譜線由感知模型514判定在感知遮蔽臨界值之 下時,該等(小)頻譜線的消除是不可聽見的。然而,已發現 可包括許多相鄰頻譜線的該等「頻譜孔」產生一相當不自 然的聲音。因此’一雜訊注入工具被提供以在線由一編碼 器端量化器量化為零的位置處插入頻譜線。該等頻譜線可 具有一隨機振幅或相位,且該等解碼器端综合頻譜線使用 如第5a圖所示在蝙碼器端被判定的一雜訊注入量度,或依 第5b圖所示在解碼器端由可選方塊562判定的一量度而定 被比例調整。因此,第5&圖中的雜訊注入分析器524被設定 41 201009812 組態以對於該音訊信號的一時框,估計被量化為零的音訊 值的一能量之一雜訊注入量度。 。在本發明之一實施例中,用於編碼-線5〇〇上之音訊信 號的音訊編石馬器包括量化器512,被設定組態以量化音訊 值此外量化器512被設定組態以將在一量化臨界值之下的 曰訊值量化為零。該量化臨界值可以是一基於階的量化器 的第-階,用於判定是否某—音訊信號被量化為零,即, 被量化為一零的量化指數,抑或被量化為一,即,指示該 音訊值在該第-臨界值以上之「―」的量化指數。雖㈣ © 5a圖的!化器被繪示成執行頻域值之量化,該量化器也可 被用於在-可供選擇的實施例中量化時域值,在該實施例 中,雜讯注入在時域而非在頻域中被執行。 · 雜訊注入分析器524被實施成一雜訊注入計算器,用於 估^該音訊信號的一時框之由量化器512量化為零的音訊 值的一能量之一雜訊注入量度。此外,該音訊編碼器包含 第6a圖所示的—音訊信號分析器6〇〇,被設定組態以分析該 音汛彳s號的時樞具有一諧波特性抑或一語音特性。信號分 © 析器600可’例如包含第&圖的方塊516或第化圖的方塊 520 ’或可包含用於分析一信號是一諧波信號抑或一語音信 號的任何其他裝置。因為時間扭曲分析器516被實施以總是 尋找一基頻輪廓,且因為一基頻輪廓的存在指示該信號的 諧波結構,第6a圖中的信號分析器6〇〇可被實施成一基頻 追蹤器或一時間扭曲分析器的一時間扭曲輪廓計算器。 邊音訊編碼器另包含第6a圖所示的一雜訊注入位準調 42 201009812 處器602,其輸出一經調處雜訊注入量度/位準以被輸出至 第5a圖的530處所指示的輸出介面522。雜訊注入量度調處 器602被設定組態以依據該音訊信號的諧波或語音特性調 處該雜訊注入量度。該音訊編碼器另包含輸出介面522用於 產生一編碼信號供發送或儲存之用,該編碼信號包含由線 530上的方塊602輸出的經調處雜訊注入量度。該值相對應 於由第5b圖所示的解碼器端實施中的方塊562輸出的值。 如第5a圖及第5b圖所示,雜訊注入位準調處可在—編 碼器中被實施或在一解碼器中被實施,或在該等兩個裝置 中被實施。在一解碼器端實施中,用於解碼一編碼音訊信 號的解碼器包含輸入介面539,用於處理該線540上編碼信 號,以獲得一雜訊注入量度,即線543上雜訊注入資料,及 線546上之編碼音訊資料。該解碼器另包含一解碼器547及 重新量化器550用於產生一重新量化的資料。 此外’該解碼器包含一信號分析器6〇〇(第6a圖),可在 第5b圖雜訊注入分析器562中被實施成檢索該音訊資料的 一時框具有一諧波抑或語音特性的資訊。 另外,雜訊注入器552被提供以產生雜訊注入音訊資 料,其中雜訊注入器552被設定組態以產生雜訊注入資料, 以回應經由編碼信號發送且由線543上之輸入介面產生的 雜訊注入量度,及由信號分析器516及/或550在編碼器端定 義的或項562在解碼器端定義的,經由處理及解釋指示某— 時框是否受到一時間扭曲處理的時間扭曲資訊542的音訊 資料的諧波或語音特性。 43 201009812 一此外,該解碼器包含一處理器,用於處理重新量化的 貧料及雜訊注人音訊資料,以獲得__解碼音訊信號。該處 理器可依據可能的情況包括第5b圖中的項554、556、558、 560。此外’依據該編碼器/解碼器演算法的特定實施該 處理器可包括由,例如在-時域編碼器中,諸如AMR WB+ 編碼器或其他語音編料巾提㈣其他處理塊。 囚此
赞月的雜訊注入調處可在該編碼器端僅藉由 計算該簡單雜訊量度,及藉由基於—諧波/語音資訊調處該 雜:量Ϊ ’及藉由發送已被正確調處’可接著由-解碼器 以-簡早方式被施用的雜訊注人量度被實施。可供選擇 j該未調處雜訊注人量度可從-編碼器被發送至-解石馬 器’且該解碼器將進而分析—音訊錢的實際時枢是否己 \ 肖即m皮抑或語音特性,使得該雜訊 /入度的實際調處在該解竭器端發生。 隨後’第你®被討論以解釋⑽喊該雜訊位準估計 的較佳實施例。
,衫-實施例中,當該信號不具有—職或語音特性 時正常雜訊位準被施用。這是當沒有時間扭曲被施用 ^情二此外’當—信號分類器被提供時,那麼區分語音 ’、’、°°曰的“號提供器將指示該情況無語音,在該情況 中時間扭曲無效,即,沒有基頻輪廊被發現。 一然而,當時間扭曲有效時,即,當指示一諧波内容的 基頻輪輪發現時’那麼該雜訊注人位準將被調處為低 於正常以。當-附加錢分類器被提供時,那麼該信號 44 201009812 分類器指示語音,且同時當該時間扭曲資訊指示一基頻輪 廓時,那麼一較低或甚至為零的雜訊注入位準被發信。因 此’第6a圖的雜訊注入位準調處器6〇2將降低調處雜訊位準 至零,或至少為低於第6b圖中指示的很低值的一值。較佳 地,該信號分類器另具有第6b圖左邊指示的一有聲/無聲檢 測器。在有聲語音的情況中,一很低的或零雜訊注入位準 被發k /施用。然而,在無聲音訊的情況中,時間扭曲指示 由於沒有基頻被發現而不指示一時間扭曲處理,但是信號 分類器發信語音内容的情況中,該雜訊注入量度不被調 處’但是一正常雜訊注入位準被施用。 較佳地,該音訊信號分析器包含一基頻追蹤器用於產 生該基頻的一指示,諸如一基頻輪廓或該音訊信號的一時 框之一絕對基頻。接著,該調處器被設定組態以當—基頻 被發現時,降低該雜訊注入量度,且當一基頻未被發現時 不降低該雜訊注入量度。 如第6a圖所示,一信號分析器6〇〇當被施用於該解碼器 端時,不像一基頻追蹤器或一有聲/無聲檢測器那樣執行一 實際信號分析,但是該信號分析器剖析該編碼音訊信號, 以擷取一時間扭曲資訊或一信號分類資訊。因此,信號分 析器600可在第5b圖解碼器的輸入介面539中被實施。 本發明之一進一步的實施例將參考第7a-7e圖被隨後討 論。 對於一有聲語音部份在一相對安靜信號部份後開始的 語音之起始點而言,塊切換演算法可將其分類成—起始 45 201009812 ❹ (attack) ’且可以具有—清晰諧波結構的一信 益損失選擇該料訊框的料。因此,該基頻 聲/無聲分難祕檢财聲絲,賴免賴姆^有 指不圍繞該發現起始點的—㈣起始。該特徵也可盘評 號分類料接㈣止語音錢上㈣切換,且允許 對所有的其他信號。另外,該塊切換的—更精細控制可藉 由不僅允許或不允許起始檢測,且亦使用—基於有聲起始 及信號分類資訊的起始檢測可變臨界值被實施。另外,爷 資訊可被用以檢測類似上述有聲起始的能量突升,而不= 換至短塊,使用仍是較佳頻譜解析度的具短重疊的長視 窗,但是減少前後回音可產生的時間區域。第”圖繪示未 匹配的典型行為,第7e圖繪示匹配的兩個不同可能性(防止 及低重疊視窗)。
依據本發明一實施例的一音訊編碼器操作以產生一音 訊信號,諸如由第5a圖的輸出介面522輸出的信號。該音訊 編碼器包含一音訊信號分析器,諸如第5a圖的時間扭曲分 析器516或一信號分類器520。大體上,該音訊信號分析器 分析該音訊信號的一時框具有一諧波抑或語音特性。為 此’第5a圖的信號分類器520可包括一有聲/無聲檢測器520a 或一語音/無語音檢測器520b。雖然未示於第7a圖,可包括 一基頻追縱器的一時間扭曲分析器,諸如第5a圖的時間扭 曲分析器516也可被提供以不用項520a及520b,或與該等功 能一起被提供。此外,該音訊編碼器包含視窗功能控制器 504,用於依據由該音訊信號分析器判定的該音訊信號之一 46 201009812 6皆波或語音特性’選擇一視窗功能。視窗器5〇2進而視窗化 該音訊信號’或依據該某一實施,使用已選擇視窗功能視 囪化該時間扭曲音訊信號,以獲得一視窗型訊框。該視窗 汛框接著進—步被—處理器處理,以獲得一編碼音訊信 號。该處理器可包含第5a圖所示的項508、510、512,或習
知的音訊編碼器諸如基於變換音訊編碼器,或包含一LPC 慮波器’諸如語音編碼器及’特定地依據AMR-WB+標準被 實施的語音編碼器的基於時域音訊編碼器之差不多的功 能。 在一較佳實施例中,視窗功能控制器504包含一暫態檢 測器700 ’用於檢測該音訊信號中的一暫態,其中該視窗功 月b控制器被設定組態以當一暫態被檢測到,i 一譜波或語 音特性沒有被該音訊信號分析器發現時,將一長塊的一視 由功能切換至一短塊的一視窗功能。然而,當一暫態被檢 測到,且一諧波或語音特性被該音訊信號分析器發現時, 那麼視窗魏控制^ 5G4不㈣視窗魏娜至短塊。指示 沒有暫態賴得時的-長視t及—暫態被該暫態檢測器檢 、J到時的一短視窗之視窗功能輸出如第以圖的7〇1及所 不。由習知AAC編碼器執行的該正常步驟在第7(1中被說 明。在财聲起始的位置上,暫態檢卿7婦剩能量從 —個訊框到下-訊框的増加,且因此,從一長視窗7胸換 至短視窗712。爲了順應該切換’ 一長終止視窗714被使用, 其具有-第-重疊部份714a、一非頻疊部份满、一第二 較短重疊部份714e,及在由2_個樣本指示的時間轴上的 47 201009812 點與點之間延伸的一零值點716。接著,在712被指示的短 視窗之順序被執行,接著由具有與未示於第7d圖中的下一 個長視窗重疊的-長重叠部份718a的-長起始視窗718被 另外,該視窗具有一非頻疊部份718b 胃叫,、f®节卜τ刀/ 、一夺迁室疊^ 伤718c及-在時間轴上在點之間延伸直到第點的一零 值部份720。該部份是—零值部份。 L常至短視®的切換是有用的,以避免會在該暫越 ^間前在-訊財發生的前回音,航框是有聲起始,: 般而β ’疋該語音之開始或具有一譜波内容的一信號之 開始的位置。大體上’當—基頻追蹤器判定—信號具有一 基頻時’刻s號具有—譜波内容。可供選擇地,有其他纪 證波量度諸如在某一最小位準之上的一音調量度與凸出 波峰在-彼此的-諧波關係中的特性。多個進一步的技摘 存在以判定一信號是否為諧波的。
短視由的-缺點是頻率解析度被降低,因為該時間飼 析度被增加。對於語音,且特職有聲語音部份或具有 一很強諧波内容的高品質編碼而已,-好的解析度被f 2因此在516、520或520a、5獅處所示的音訊信號分 :器操作以將—停用信號輸出至暫態檢測器700,使得當一 =語音段或具有~很_波特性的-信號段被檢測至, Μ::::的—切換被防止。這保證,對於編碼這樣纪 音與另-方面對於被維持。這是—方面的㈣ 的基頻之高品質且高::號的基頻或—諧波非語音信餓 析度編碼之間的一折中。已發現售 48 201009812 諧波頻譜較之於會發生的任何前回音沒有被精確地編碼時 更加令人煩擾。爲了進一步降低前回音,一TNS處理有利 於此一情況,該TNS處理將連同第8a圖與第8b圖被討論。 在第7b圖所示的一可供選擇的實施例中,該音訊信號 分析器包含一有聲/無聲及/或語音/非語音檢測器52〇&、 520b。然而,包括在該視窗功能控制器中的暫態檢測器7⑽ 如第7a圖所示被完全致能/去能,但是包括在該暫態檢測器 中的臨界值使用一臨界值控制信號7〇4被控制。在該實施例 中,暫態檢測器700被設定組態以判定該音訊信號的一定量 特性’且將該定量特性與該可控的臨界值相比較,其中當 該定量特性具有與該可控臨界值的一預定關係時,一暫態 被檢測到。該定量特性可以是指示從一個方塊到下一個方 塊的能量增加的一數字’且該臨界值可以是一一定臨界能 量增加。當從一個方塊到下一個的能量增加高於該臨界值 能量增加時,那麼一暫態被檢測到,使得,在這種情況中, 該預定關係是一「高於」關係。在其他實施例中,該預定 關係也可以是一「低於」關係,例如當該定量特性是一反 月&量增加時。在第7b圖的實施例中’該可控臨界值被控制, 使得當該音訊信號分析器已發現一諧波或語音特性時,一 視窗功能到一短塊的切換之似然被降低。在該能量增加實 施例中,臨界值控制信號704將產生該臨界值的一增加,使 得到短塊的切換僅當從一個方塊到下一個的能量增加是一 特別南的能量增加時發生。 在一可供選擇地實施例中,來自有聲/無聲檢測器520a 49 201009812 或g /非曰檢測器520b的輸出信號也可被用以用如下 方法控制視窗魏控制㈣4 ;職至長於該視f功能的的 一視窗功能,而不是切換至一語音起始處的一短塊,因為 該短塊被執行。該㈣功能紐比_短視窗功能較高的— 頻率解析度,但是具有一比長視窗功能較短的長度,使得 一方面的前回音與另一方面的充分的頻率解析度之間的獲 得一良好折衷。在一可供選擇的實施例中,到具有一較小 重疊的視窗功能的一切換可如第7e圖中7〇6處的剖面綫所 指示的被執行。視窗功能706具有如長塊的一 2〇48個樣本的 ❿ 長度,但是該視窗具有一零值部份7〇8及一非頻疊部份 710 ’使得從視窗706到一相對應視窗707的一短重疊長度 712被獲得。視窗功能707再具有區域712的左邊的一零值部 - 份,及區域712右邊的一非頻疊部份,與視窗功能71〇相似。 該低重疊實施例,有效地產生一較短時間長度用於降低由 於視窗706與707的零值部份的前回音,但是另一方面具有 由於重疊部份714及非頻疊部份71〇的一充分的長度,使得 一充足的頻率解析度被維持。 ◎ 在由AAC編碼器實施的較佳MDCT實施中,維持某一 重疊提供如下附加優勢:在該解碼器端,一重疊/加入處理 可被執行,這意味著塊之間的一種交又淡入淡出被執行。 這有效地避免了區塊效應。此外,該重疊/加入特徵提供該 交叉淡入淡出特性’而不增加位元率,即,一精密的經取 樣交叉淡入淡出被獲得。在正對長視窗或短視窗中,該重 整部份是由重疊部份714指示的一 50%的重憂。在視窗功育t 50 201009812 為2048個樣本長的實施例中,該重疊部份是5〇%,即ι〇24 個樣本。具有一較短重疊的視窗功能較佳地少於5〇%,且 在第7e圖實施例巾,僅為128個樣本,是整個視窗長度的 1/16,該較短重疊被用於有效地視窗化一語音起始或一諧 波信號的起始。較佳地,在全部視窗功能長度的1/4與1/32 之間的重疊部份被使用。
❹ 第7c圖繪示該實施例,其中一示範性有聲/無 520a控制包括在視窗功能控制器5〇4中的一視窗形狀選擇 器’以用749處指示的一短重疊選擇一視窗形狀,或用如75〇 處指示的-長重疊選擇一視窗形狀。當有聲,無聲檢測器 500a在751處發出-有聲檢測信號時,該等兩個形狀之—的 選擇被實*,祕分析的音婦射叹帛㈣的輸入5〇〇 處的曰訊信號,或是諸如一時間扭曲信號或已受到任何其 他預處理功能的-音黯號的—預處理音訊信號。較佳 地,當包括在該視窗功能控制器中的_暫態檢測器將檢測 到-暫態,且如連同第7a圖所討論的將命令從_長視窗功 能到-短視窗魏的切換時包括在“竭的㈣功能控制 器504中的第7e圖中的視窗形狀選擇器5似僅使用产號 751。較佳地,該視窗功能切換實施例與連同“圖與^ 圖所討論的-時域雜訊整修實施例結合。然而,該彻(時 域雜訊修整)實施例也可被實施,而不需要塊切換實包* 時間扭曲MDCT的頻譜能量集中性質也二^= 修整(TNS)工具,因為該TNS增益趨於減少時間才丑曲訊柩, 尤其是一些語音信號。然而希望致動^^^ 以例如在不需 51 201009812 要塊切換,但是該語音信號的時間包絡顯示迅速改變的情 況下減少有聲起始或偏移(參考塊切換匹配)的前回音。典型 地,一編碼器使用某一量度以查看TNS對一特定訊框之應 用’例如當應用至頻譜時TNS濾波器之預測增益是否有成 效。所以一可變TNS增益臨界值是較佳地,其對具有一有 效基頻輪廓的片段較低,因此確保TNS對這種類似有聲起 始的重要信號部份更經常地有效。當用其他工具時,此亦 可將信號分類計入考慮而被實施。 依據本實施例用於產生一音訊信號的音訊編碼器包含 © 一可控時間扭曲,諸如扭曲5〇6用於時間扭曲該音訊信號, 以獲得一時間扭曲音訊信號。此外,用於將至少一部份的 時間扭曲音訊信號轉換至一頻譜表示的一時間/頻率轉換 器508被提供。時間/頻率轉換器5〇8如從AAC編碼器習知的
實施-MDCT變換’但是該時間/頻率轉換器也可執行任何 其他種類的變化,諸如一DCT、DST、DFT,FFT或MDST 變換,或可包含一濾波器組諸如一QMF濾波器組。 此外’該編碼器包含一時域雜訊修整級510,用於依據 ❹ 該時域雜訊修整控制指令執行該頻譜表示的頻率上的一預 測渡波’其中當該時域雜訊修整控制指令不存在時,該預 測濾波不被執行。 此外,°亥編竭器包含一時域雜訊修整控制器,用於基 於該頻譜表示產生該時域雜訊修整控制指令。 :特疋地料域雜訊修整控制器被設定組態以當該頻 是基;日夺間扭曲信號上時,增加該似然,用於執 52 201009812 行頻率上之預測濾波,或當該頻譜表示不是基於一時間扭 曲信號上時,減少該似然,以執行頻率上之預測濾波。該 時域雜訊修整控制器的說明連同第8圖被討論。 該音訊編碼器另又包含一處理器,用於進一步處理頻 率上之預測濾波的一結果’以獲得編碼的信號。在一實施 例中,該處理器包含第5a圖中繪示的量化器編碼器級512。 第5a圖中繪示的一 TNS級510在第8圖中被詳細說明。 較佳地’包含在級510中的該時域雜訊修整控制器包含一 TNS增益計算器800、一隨後被連接的TNS判定器802及一臨 界值控制信號產生器804。依據來自時間扭曲分析器516或 信號分類器520或兩者的一信號,該臨界值控制信號產生器 804輸出一臨界值控制信號806至該TNS判定器。TNS判定器 802具有一可控臨界值,依據臨界值控制信號8〇6被增加或 減少。在本實施例中’在TNS判定器802中的該臨界值是一 TNS增益臨界值。當由塊800輸出的實質上以計算的TNS增 益超出該臨界值’接著該TNS控制指令需要一TNS處理作為 輸出,而在其他情況中,當TNS增益在TNS增益臨界值之下 時’沒有TNS指令被輪出’或沒有一指示該tnS處理沒用且 在該特定時框中將不被執行的信號被輸出。 TNS增益計算器800接收從該時間扭曲信號導出的頻 譜表示作為一輸入。典型地,一時間扭曲信號將具有一較 低TNS增益,但是另一方面,由於時域中時域雜訊修整特 徵的一 TNS處理疋該特定情況中的受益者,存在受到一時 間扭曲操作的一有聲/諧波信號。另一方面,該TNS處理在 53 201009812 TNS增益很低的情況中没用,意指線51〇1)上的TNS殘餘信號 具有與TNS級510之前的信號相同的或較高的能量。在線 510d上TNS殘餘信號的能力稍微低於TNS級51〇之前的能量 的情況中’該TNS處理也可能不具優勢,因為由於量化器/ 烟編碼器級512高效地使用的信號中稍小的能量之位元減 少小於由地5a圖中51〇a處指示的tns旁資訊的必要發送引 入的位元增加。雖然一個實施例自動對所有的訊框在TNS 處理上切換,其中一時間扭曲信號是由來自塊516的基頻資 訊或來自塊520的信號分類器資訊指示的輸入,一較佳實施 例同樣維持停用TNS處理的可能性,但僅當該增益確實很 低或至少低於沒有諸波/語音信號被處理的情況。 第8b圖繪示不同的臨界值設定有臨界值控制信號產生 器804/TNS判定器802實施的一實施。當一基頻輪廓不存在 時’且當一信號分類器指示一無聲語音或沒有語音時,那 麼該TNS判定臨界值被設定在需要一相對高的tNS增益用 於致動TNS的一正常狀態中。然而,當一基頻輪廓被檢測 到’但是該信號分類器指示沒有語音或該有聲/無聲檢測器 檢測到一無聲語音時,那麼該TNS判定臨界值被設定至一 較低位準’意指甚至當相對低的TNS增益被第8a圖的塊800 計算時,TNS處理仍被致動。 在一有效基頻輪廓被檢測到且有聲語音被發現的情況 中’那麼該TNS判定臨界值被設定為相同較低值,或被設 定為一甚至更低的狀態,使得甚至很小TNS增益就足以致 動一 TNS處理。 201009812 在-實施例中,當該音訊信號受到頻率上的預測遽波 時,TNS增益控制器800被設定組態以在位- " 任位疋率或品質上估 計一增益。一TNS判定器802將該估計拇Μ也 |曰減與一判定臨界值 進行比較,且有利於該預測濾波的一— U控制資訊被塊802 輸出,當已估計增益與該狀臨界值為—科關係時,該 預定關係可以是-「高於」關係’例如對於—反廳增益 也可以是-「低於」。正如所討論的,該時域雜訊修整^制 e ο 器被進-步設定組態以較佳地使用臨界值控制信號改 變該判疋6s界值,使得對於相同的已估計增益當該頻譜 表示疋基於§亥時間扭曲音訊信號時,該預測慮波被致動, 當該頻譜表示不是基於該時間扭曲音訊信號時,該預測濾 波不被致動。 通常,有聲語音將顯示一基頻輪廓,且無聲語音諸如 摩擦音或齒音不被顯示一基頻輪廓。然而確實存在無語音 信號,且因此強諧波内容具有一基頻輪廓,雖然該語音檢 測器沒有檢測到語音。此外,存在音樂上是一定的語音或 語音信號上的音樂,由該音訊信號分析器(例如第5a圖的 516)判定,以具有一諧波内容,但是沒有作為一語音信號 被信號分類器520檢測到。在此一情況中,對於有聲語音信 號的所有處理操作也可被施用,且也將產生一優勢。 隨後,本發明關於用於編碼一音訊信號的一音訊編碼 器的一進一步較佳實施例被描述。該音訊編碼器在帶寬延 伸的内文中特別有用,且在獨立編碼器施用中也是有用 的,在獨立編碼器施用中,該音訊編碼器被設定以編碼一 55 201009812 定數目的線,以獲得某一帶寬限制/低通濾波操作。在未時 間扭曲施用中,藉由選擇一某一預定數目線的該帶寬限制 將產生一恒定帶寬,因為該音訊信號之取樣頻率是恒定 的。然而,在諸如藉由塊506的一時間扭曲處理被執行的情 況中,依靠一固定數目線的一編碼器將產生一變化帶寬, 該變化的帶寬引入不僅可由經過訓練的收聽者感知且可由 未經訓練收聽者感知的很強的人工因子。 該AAC核心編碼|§通常編碼一固定數目的線,將所有 其他在最大線之上的設為零。在該未扭曲情況中,這產生 0 帶有一恒定截止頻率的一低通影響,且因此產生該解碼 AAC信號的一恒定帶寬。在時間扭曲的情況中,該帶寬由 於該局部取樣頻率、局部時間扭曲估計的一函數的變化而 - 變化,產生可聞人工因子。該等人工因素可藉由適當地選 擇線之數目一以該局部時間扭曲的一函數及其已獲得的平 均取樣率被減少—以在該核心編碼器中依據該局部取樣頻 率被編碼,使得-恒定平均帶寬在該解碼器中對所有訊框 時間重新扭曲后被獲得…附加益處是該編碼H中的位A © 節約。 依據該實施例的音訊編碼器包含時間扭曲器506,用於 使用—可變時間扭曲特性將—音訊信號時間扭曲。此外, 用於將—時間扭曲音訊信號轉換至具有若干頻譜係數的一 頻譜表示的-時間/頻率轉換器被提供。此外用於處 理一可變數目的頻譜係數以產生編碼音訊信號的一處理器 被使用,該處理器包含第5a圖的量化器/編碼器塊512,被設 56 201009812 定組態以基於開訊框的時間扭曲特性,對該音訊信號的時 框設定若干頻譜係數,使得由從訊框到訊框的已處理數目 的頻譜係數表示的一帶寬變化被減少或消除。 由塊512實施的該處理器包含一控制器1000,用於控制 該等數目的線,控制器画的結果是,關於被編碼^有 任何時間扭曲的一時框的情況所設定的許多線某化 數目的線在該頻譜的上端被加入或被廢除。依據該實施, _ ㈣器10⑻可接收某-訊框膽中的-基頻輪廓資訊,及/ 或在1002處指示的訊框中的—局部平均取樣頻率。 . 在第9⑷圖至第(e)圖中,右邊圖片緣示在1框上的 . ㈣錢輪廓的某1紐況,在該訊框上的基頻輪摩針 對時間扭曲被緣示於各自的左邊圖片中,且在時間扭曲後 被繪示於中間圖片中,在此處一實質上恒定的基頻特性被 獲得。時間扭曲功能的目標是,在時間扭曲後,該基頻特 性盡可能的恒定。 Ο 帶寬刪繪不’當由第5a圖的—時間/頻率轉換器508輸 出或由-TNS級510輪出的某—數目的線被採用時,且當一 時間扭曲操作被執行時,即,當時間扭曲器506如由剖面綫 507所指示的被停用時,所獲得的帶寬。然而,當一非恒定 時間扭曲輪廊被獲得,且當該時間扭曲輪庵被帶至引起一 取樣率增加的-較高基頻時(第9⑻、⑷圖),該頻譜之帶寬 關於正常’未時間接曲的情況被減少。這意指要對該訊 框發送的線之數目必須被增加,以平衡該帶寬之損失。 可供選擇地,將基頻帶至第9(b)圖或第9(d)圖所示的一 57 201009812 較低恒疋基頻中導致一取樣率的降低。該取樣率降低導致 關於該線性標度的該訊框之頻譜的一帶寬增加,且該帶寬 增加必須使用關於正常未時間扭曲情況的線之數目值的某 一數目線的一删除或廢除而被平衡。 第9(e)圖緣示-特定情況’其中—基頻輪廓被帶至一中 間位準’使得-訊框巾的平均取樣頻率與沒有任何時間扭 曲的取樣頻率相同,而不是執行該時間扭曲操作。因此, 該信號之帶寬*受影響,且要針對正常情況使^不需要 時間扭曲的該簡單數目之線可被處理,雖然該時間扭曲操 作被執行。從第9圖,執行一時間扭曲操作沒必要影響該頻 帶變得清晰’但是帶寬之影響取決於該基頻輪軌路線, 該時間扭曲如何在—訊框中被執行。因此,較佳地使用一 局部或平均取樣率作為控制值。該局部取樣率的決定繪示 於第11圖巾。第11®的上部料具有等縣樣值的—時間 部伤。-讯框包括’例如在較高目中由Tn指示的七個取樣 值。較低圖繪示一時間扭曲操作之結果,其中—取樣率增 強發生。這意指該時間扭曲訊框的時間長度小於未時間: 曲訊框的時間長度。然而,因為要被引人該時間/頰率轉換 器的時間扭曲訊框的時間長度是固定的,一取樣率增加、 情況導致不屬於由Τη指示的訊框的該時間信號的—附加呷 份被引入該時間扭曲訊框,如線11〇〇所指示的。因此, 時間扭曲訊框覆蓋有Tiin指示的音訊信號的一時間部份,τ 長於時机。如此看來,兩條頻譜線之間的有效距離或 性域中的一單—線的頻率帶寬(是該解析i之相反值)減 58 201009812 少,且當乘以減少的頻率距離時,針對-未時間扭曲情況 設定的該等數目的線^^導致一較小帶寬,即,—帶寬減小。 未示於第11圖中,一取樣率減少由該時間扭曲器執行 的其他情況,在時間扭曲域中的一訊框的有效時間長度小 於該未時間扭曲域中的時間長度,使得一單一線的頻率帶 寬或兩個頻率線之間的距離減少。現在對於正常情況,以 線之數目Nn乘以增加的Af將導致由於兩個相鄰頻率係數之 間的減少的頻率解析度/增加的頻率距離而增加的帶寬。 苐11圖另又緣示·一平均取樣率fsR如何被計算。為此, 兩個時間扭曲樣本之間的時間距離被判定且該相反值被採 用,該相反值被定義為兩個時間扭曲樣本之間的局部取樣 率。此一值可在每對相鄭樣本中被計算,且該算術平均值 可被叶算,且該值最終產生該平均局部取樣率,該平均局 部取樣率被較佳地用於被輸入至第10a圖的控制器1000令。 第10b圖繪示指示多少線必須依據該局部取樣頻率被 加入或廢除的圖表,其巾未扭㈣況的取樣解&與未時 間扭曲情況的線之數目%界定該職的帶寬,對於一系列 時間扭曲訊框或-系列時間扭曲級未時間扭曲訊框該帶 寬應被盡可能的保持為恒定。 第12b圖緣不連同第9[)圖、第丨關及第丨】圖所討論的 不同參數之間的依賴。在根本上,當取樣率,即平均取樣 率fSR關於未時間扭曲情況降低時,線必須被刪除,而當取 樣率Μ於該线取樣率&增加時’線必須被加入’使得從 訊框到訊框的帶寬被減少,或較佳地甚至盡可能地被消除。 59 201009812 由該等數目的線nn及取樣率fN產生帶寬較佳地對一音 訊編碼器界定交又頻率為1200,該音訊編碼器除一源核心 音訊編碼器外,具有一帶寬延伸編碼器(BWE編碼器)。如 該該技藝中所習知的,一帶寬延伸編碼器僅以一高位元率 編碼一頻譜直到該交又頻率,且以一低位元率編碼該高頻 帶,即交叉頻率1200與頻率fMAX之間的頻譜,其中該低位 元率典型地甚至低於一頻率〇與交叉頻率1200之間的低頻 帶所需的位元率的1/10或更少。第12a圖進一步繪示一簡單 AAC音訊編碼器的帶寬BWAAC,其高於該交又頻率。因此, © 線不僅可被廢除,也可被加入。另外,對於一恒定數目線 依據局部取樣率fSR的變化也被說明。較佳地,與正常情況 的線之數目有關的要被加入或要被刪除的線之數目被設 定’使得AAC進編碼資料的每一訊框具有盡可能接近交又 頻率1200的一最大頻率。因此,由於一方面一帶寬減少, 或由於一低頻帶編碼訊框中,在交又頻率之上的一頻率上 發送資訊的一間接費用造成的任何頻譜孔被避免。這一方 面增加解碼音訊信號的品質,且另一方面降低了位元率。 © 與線之一設定數目有關的實際加入線,或與該設定數 目線有關的刪除線可在量化該等線之前,即,在塊512的輸 入處被執行,或可在量化之後被執行,或依據特定熵編碼, 也可在熵編碼後被執行。 另外’較佳地,將該等帶寬變化達到一最小位準,且 甚至消除該等帶寬變化,但是在其他實施例中,藉由依據 該等時間扭曲特性判定線之數目的帶寬變化的一降低,較 60 201009812 之於一恒定數目線被施加而不管某一時間扭曲特性的情 況,提局了該音訊品質,且減少了所需要的位元元率。 雖然一些層面已在—設備的内文中被描述,很明顯, 該等層面也表不相對應的方法之描述,其中一方塊或設備 相對應於一方法步驟或—方法步驟的一特徵。類似地在 -方法步驟的内文中描述的層面也表示_相對應的方塊或 項,或一相對應設備的特徵的一描述。 q 依據某些實施要求,本發明之實施例可在硬體或軟體 中被實施。該實施可使用一數位儲存媒體,例如一磁片、 DVD CD > — ROM > — PR〇M' — EPROM' — EEPROM „ 或FLASH5己憶體被執行,該數位儲存媒體具有電子可讀 控制信號被儲存於其上’該信號與(或能夠與)一可程式電腦 系統配合,使得各自方法被執行。依據本發明的一些實施 例包含-具有電子可讀控制信號的資料載體,該等信號能 夠與一可程式電腦系統配合,使得本文描述的方法之一可 β 肖帛式碼以一電腦程式產品被實施,槽該電腦程式產品 在-電腦上運行時,該程式碼操作以執行該等方法之一。 該程式碼可,例如被儲存於一機器可讀載體上。其他實施 例包含儲存於-機器可讀細上的電腦程式,驗執行本 謂描述的方法之-。@此,換㈣說,贿明的方法的 I實施例是具有-程式碼的—電腦程式,當該電腦程式運 订於-電腦上時’該程式碼用於執行本文所描述的方法之 -。因此’該發明的方法之-進—步的實施例是—資料載 體(或一數位儲存媒體,或一電腦可讀媒體),其包含記錄於 61 201009812 其上的電腦程式,用於執杆 ^ 文所描述的該等方法之一。 因此’該發明的方法之—逸— 1 ^Λ 步的實施例是表示該電腦程 式的一貢料串流或—系列信號,用於執行本文所描述的該
等方法之料串流或料列錢可,例如被設定組 態以經由-資料通信連接,例如經由網際網路被傳送。一 進-步的實施例包含—處理H例如—㈣,或一可程 式邏輯裝置’被設定組態以或適於執行本文所描述的方法 之一。一進—步的實施例包含1腦,具有安裝於其上的 電腦程式,用於執行本文所描述的方法之_。在一些實施 例中,-可程式邏輯裝置(例如_現場可程式閘陣列)可被用 於本文所描述的該等方法之_些或全部功能。在一些實施 例中,一現場可程式閘陣列可與一微處理器配合,以執行 本文所描述的該等方法之一。 【圖式簡單說明的】 第1圖繪示依據本發明一實施例的一時間扭曲致動信 號提供器的一方塊示意圖;
第2a圖繪示依據本發明一實施例的一音訊信號編碼 器的一方塊示意圖; 第2b圖繪示依據本發明一實施例的一時間扭曲致動 信號提供器的另一方塊示意圖; 第3a圖繪示一音訊信號的一未時間扭曲版本的一頻 譜之圖解表示; 第3b圖繪示該音況#號的一時間扭曲版本的一頻譜 之圖解表不, 62 201009812 第3c圖繪示針對不同頻帶的頻譜平坦度量度的一個 別計算之圖解表示; 第3d圖繪示僅考慮該頻譜之較高頻帶的一頻譜平坦 度量度的一計算之圖解表示; 第3e圖繪示使用一頻譜表示的一頻譜平坦度量度的 一計算之圖解表示,在該頻譜表示中,一較高頻率部份在 一較低頻率部份上被強調; 第3f圖繪示依據本發明另一實施例的一能量集中資 訊提供器的方塊示意圖; 第3g圖繪示在該時域中具有一時間上可變基頻的一 音訊信號之圖解表示; 第3h圖繪示第3g圖音訊信號的一時間扭曲(不均勻重 新取樣的)版本之圖解表示; 第3i圖繪示依據第3g圖的音訊信號的一自相關函數 之圖解表示; 第3j圖繪示依據第3h圖的音訊信號的一自相關函數 的圖解表示; 第3k圖繪示依據本發明另一實施例的一能量集中資 訊提供器的方塊示意圖; 第4a圖繪示一種用於基於一音訊信號提供一時間扭 曲致動信號的方法的流程圖; 第4b圖繪示依據本發明一實施例,一種用於編碼一輸 入音訊信號,以獲得該輸入音訊信號的一編碼表示的方法 的流程圖; 63 201009812 第5a圖繪示具有發明之層面的一音訊編碼器的一較 佳實施例; 第5b圖繪示具有發明之層面的一音訊解碼器的一較 佳實施例; 第6a圖繪示本發明之雜訊注入層面的一較佳實施例; 第6b圖繪示界定由該雜訊注入位準調處器執行的控 制操作的一表格; 第7a圖繪示依據本發明用於執行一基於時間扭曲的 塊切換的較佳實施例; 第7b圖繪示影響該視窗功能的一可供選擇的實施例; 第7c圖繪示用於基於時間扭曲資訊說明該視窗功能 的另一可供選擇的實施例; 第7d圖繪示在一有聲啟動處的一正常AAC行為的一 視窗順序; 第7e圖繪示依據本發明之一較佳實施例獲得的可供 選擇的視窗順序; 第8a圖繪示TNS(時域雜訊整修)工具的一基於時間扭 曲的控制的較佳實施例; 第8b圖繪示界定第8a圖的臨界控制信號產生器中被 執行的控制步驟的一表格; 第9a-9e圖繪示不同的時間扭曲特性,及繼一解碼器端 時間扭曲操作之後發生的相對應的音訊信號的帶寬上的影 響; 第10a圖繪示用於控制一編碼處理器中的線之數目的 64 201009812 一控制器之一較佳實施例; 第10b圖繪示要針對一取樣率被廢除/加入的線之數 目之間的一依賴性; 第11圖繪示一線性時間標度與一經扭曲時間標度之 間的一比較;
苐12a圖%示帶寬延伸在該内文中的一實施;及 第12b圖繪示描繪在時間扭曲域中的局部取樣率與頻 譜係數的控制之間的依賴性的一表格。 【主要元件符號說明 100、230、234...時間扭曲致動 信號提供器 110···音訊信號表示 112、232···時間扭曲致動信號 120、234f、2341、325…能量 集中提供器 122、234m、234η、374…能量 集中資訊 130、234〇…比較器 132···參考值 200…音訊信號編碼器 210…輸入音訊信號 212…編碼表示 234a、234g…時間扭曲表示提 供器 1 234b、234h、220a…(可選)分 析視窗器 234c、234i ' 220b…重新取樣 器或時間扭曲器 234d、234j…(可選)頻譜域變換 器 234e、234k…時間扭曲表示 234p…時間扭曲致動信 號 220時間扭曲變換器 220c頻域變換器(時間/頻率轉 換器例如MDCT) 222…時間扭曲頻譜表示 240…受控開關(切換機制) 242…新時間扭曲輪廓資訊 65 201009812 250···頻譜後處理 260…量化器/編碼器 262···已量化且編碼頻譜表示 270···感知模型 272···感知關聯資訊 280···輸出介面 284…時間扭曲分析器 286…時間扭曲輪廓資訊 288···標準時間扭曲輪廓資訊 301、 350、355、360…橫座標 302、 351、356、361·..縱座標 303、 308、352…弧線 31 卜 312、313...頻帶 316···高頻譜的一高頻部份 326…感知熵資訊 327…形式因子計算器 328···形式因子資訊 329…頻帶能量計算器 330…頻帶能量資訊en(n) 331···線估計器 332···經估計數目的線資訊ηι 333···感知熵計算器 362…標記 370···能量集中資訊提供器 371.··自相關計算器 372···自相關加法器 400、450·.·方法 410~430、460~480···步驟 500…編碼器輸入 502…分析視窗器 504…視窗功能(形狀)控制器 506…時間扭曲器 507…剖面殘 508、556...時間/頻率轉換器 510T...NS 級 510a、510b、526、528、530". 輸出 512···量化器及編碼器 514…感知模型 516···時間扭曲分析器 518···時間扭曲分析器輸出 520…信號分類器 520a···有聲/無聲檢測器 520b…語音/無語音檢測器 522…輸出介面 524、562…雜訊注入分析器 530…輸出 539…輸入介面
66 201009812
540…輸入 541···信號分類資訊 542…時間扭曲資訊 543…雜訊注入資料 544…量尺因子 545…TNS資料 546…編碼頻譜資訊 547…熵解碼器 550…重新量化器 552…雜訊注入器 554…反TNS級 558···時間解扭器 560…合成視窗器 564…音訊信號 600…信號分析器 602…雜訊注入位準調處器 700…暫態檢測器 70l·..長視窗功能(無暫態) 702…短視窗功能(暫態) 704…臨界值控制信號 706、707.·.視窗功能 708、720…零值部份 710·..長視窗 712…短視窗 714…長終止視窗 714a…第一重疊部份 714b、718b…非頻疊部份 714c…第二較短重疊部份 716···零值點 718···長起始視窗 718a…長重疊部份 718c…短重疊部份 749…具短重疊視窗形狀 750…具長重疊視窗形狀 751…信號 800…TNS增益計算器 802…TNS判定器 803…TNS控制資訊 804…臨界值控制信號產生器 806…臨界值控制信號 1000…控制器 1001、1002…訊框 1100…線 1200…交叉頻率 f…頻率 Η…高頻 L…低頻 67

Claims (1)

  1. 201009812 七、申請專利範圍·· 1. 一種用於基於一音訊信號之表示提供一時間扭曲致動 信號的時間扭曲致動信號提供器,該時間扭曲致動信號 提供器包含: 一能量集中資訊提供器,被設定組態以提供一能量 集中資訊,該資訊描述該音訊信號的一時間扭曲變換頻 譜表示中的一集中能量;及 一比較器,被設定組態以將該能量集中資訊與一參 考值相比較,且提供與該比較之結果有關的該時間扭曲 致動信號。 2. 如申請專利範圍第1項所述之時間扭曲致動信號提供 器,其中該能量集中資訊提供器被設定組態以提供一將 該音訊信號的該時間扭曲變換頻譜表示描述成該能量 集中資訊的一頻譜平坦度量度。 3. 如申請專利範圍第2項所述之時間扭曲致動信號提供 器,其中該能量集中資訊提供器被設定組態以計算該音 訊信號的該時間扭曲變換功率頻譜的一幾何平均與該 音訊信號的該時間扭曲變換功率頻譜的一算術平均的 商,以獲得該頻譜平坦度的量度。 4. 如申請專利範圍第1-3項中任一項所述之時間扭曲致動 信號提供器,其中該能量集中資訊提供器被設定組態以 強調與該時間扭曲變換頻譜表示的一較低頻率部份相 較下該時間扭曲變換頻譜表示的一較高頻率部份,以獲 得該能量集中資訊。 68 201009812 5. 如申請專利範圍第1-4項中任一項所述之時間扭曲致動 信號提供器,其中該能量集中資訊提供器被設定組態以 獲得頻譜平坦度的複數分頻段量度,且計算該等複數平 坦度的分頻段量度的一平均,以獲得該能量集中資訊。 6. 如申請專利範圍第1項所述之時間扭曲致動信號提供 器,其中該能力集中資訊提供器被設定組態以提供一將 該音訊信號的時間扭曲變換頻譜表示描述成該能量集 中資訊的感知熵量度。 7. 如申請專利範圍第6項所述之時間扭曲致動信號提供 . 器,其中該能量集中資訊提供器被設定組態以基於該量 尺因子頻帶的一形式因子資訊(ffac(n)),計算該音訊信 號的該時間扭曲變換頻譜表示的一個或多個量尺因子 頻帶的估計非零線數目,且使用該估計非零線數目與考 慮中之一量尺因子頻帶能量量度之一乘法計算考慮中 之一量尺因子頻帶的感知嫡量度。 8. 如申請專利範圍第1項所述之時間扭曲致動信號提供 器,其中該能量集中資訊提供器被設定組態以提供一將 該音訊信號的一時間扭曲時域表示之一自相關描述成 該能量集中資訊的一自相關量度。 9. 如申請專利範圍第8項所述之時間扭曲致動信號提供 器,其中該能量集中資訊提供器被設定組態以判定該音 訊信號的該時間扭曲表示的一正規化自相關函數的一 絕對值總和,以獲得該能量集中資訊。 10. 如申請專利範圍第1-9項中任一項所述之時間扭曲致動 69 201009812 信號提供器,其中該時間扭曲致動信號提供器包含一參 考值計算器,其被設定組態以基於該音訊信號的一未扭 曲頻譜表示、或基於該音訊信號的一未扭曲時域表示, 計算該參考值;及 其中該比較器被設定組態以使用描述該音訊信號 的一時間扭曲變換頻譜表示中之一能量集中的能量集 中資訊以及該參考值形成一比值,且將該比值與一個或 多個臨界值進行比較,以獲得作為比較結果的該時間扭 曲致動信號。 11. 如申請專利範圍第1-9項中任一項所述之時間扭曲致動 信號提供器,其中該時間扭曲致動信號提供器包含一參 考值計算器,被設定組態以基於該輸入信號的一時間扭 曲表示計算該參考值,利用一標準時間扭曲輪廓資訊使 時間被扭曲;且 其中該比較器被設定組態以使用描述該音訊信號 的一時間扭曲表示中一能量集中的該能量集中資訊及 該參考值形成一比值,且將該比值與一個或多個臨界值 相比較,以獲得作為比較結果的該時間扭曲致動信號。 12. —種用於編碼一輸入音訊信號以獲得該輸入音訊信號 的一編碼表示的音訊信號編碼器,該音訊信號編碼器包 含: 一時間扭曲變換器,被組態以基於該輸入音訊信 號,使用一時間扭曲輪廓提供該時間扭曲變換頻譜表 · , 70 201009812 如申請專利範圍第ι-ll項中任一項所述之一時間 扭曲致動信號提供器,其中該時間扭曲致動信號提供器 被設定組態以接收該輸入音訊信號,且提供該時間扭曲 致動信號;及 一控制器,被設定組態以選擇性地向該時間扭曲變 換器提供與該時間扭曲致動信號相關的一描述一非恒 定時間扭曲輪廓部份之新找到時間扭曲輪廓資訊,或一 描述恒定時間扭曲執跡部份之一標準時間扭曲輪廓資 ❹ 訊,以描述由該時間扭曲變換器使用的該時間扭曲輪 . 廓。 13. 如申請專利範圍第12項所述之音訊信號編碼器,其中該 音訊信號編碼器包含一輸出介面,被設定組態以將該時 間扭曲變換頻譜表示包含在該音訊信號的該編碼表示 中,且 選擇性地相關於該時間扭曲致動信號將該時間扭 _ 曲輪扉資訊包含在該音訊信號的該編碼表示中。 ❹ 14. 一種基於一音訊信號提供一時間扭曲致動信號的方 法,該方法包含: 提供描述該音訊信號的一時間扭曲變換頻譜表示 之一能量集中的一能量集中資訊; 將該能量集中資訊與一參考值相比較;且 相關於該比較之結果提供該時間扭曲致動信號。 15 · —種用於編碼一輸入音訊信號以獲得該輸入音訊信號 的一編碼表示的方法,該方法包含: 71 201009812 依據申請專利範圍第14項提供一時間扭曲致動信 號,其中該能量集中資訊描述該輸入音訊信號的一時間 扭曲變換頻譜表示中之一能量集中;且 相關於該時間扭曲致動信號,選擇性地提供該輸入 音訊信號的該時間扭曲變換頻譜表示的一描述,或該輸 入音訊信號的一未時間扭曲變換頻譜表示的描述以將 該輸入音訊信號包括在該編碼表示中。 16. —種電腦程式,用於當該電腦程式運行於該電腦上時執 行申請專利範圍第14項或第15項之方法。 17. —種用於編碼一音訊信號的音訊編碼器,包含: 一量化器用於量化音訊值,其中該量化器被設定組 態以量化音訊值至一量化臨界值之下; 一雜訊注入計算器,用於對於該音訊信號的一時框 估計被量化為零的音訊值的一能量的一量度; 一音訊信號分析器,用於分析該音訊信號的時框是 否具有一諧波或語音特性; 一調處器,用於相關於該音訊信號的一諧波或一語 音特性調處該雜訊注入量度,以獲得一調處的雜訊注入 量度;及 一輸出介面,用於產生一編碼信號用以發送或儲 存,該編碼信號包含該調處的雜訊注入量度。 18. 如申請專利範圍第17項所述之音訊編碼器, 其中該音訊信號分析器包含一基頻觸發器,用於當 一基頻在該音訊信號的時框中被發現時,產生一基頻的 72 201009812 一指示,及 其中該調處器被設定組態以當一基頻被發現時,降 低該雜訊注入量度。 19. 如申請專利範圍第17或18項所述之音訊編碼器, 其中該音訊信號分析器包含一有聲/無聲檢測器, 用於檢測是否至少一部份時框是有聲的, 其中當該部份被檢測為有聲時,該調處器被設定組 態以降低該雜訊注入量度,或將該雜訊注入量度歸零, 及 其中該調處器被設定組態以當該部份被檢測為無 聲時,不調處或調處該雜訊注入測量為一較小程度。 20. —種用於解碼一編碼音訊信號的解碼器,包含: 一輸入介面,用於處理該編碼音訊信號,以獲得一 雜訊注入量度及編碼音訊資料; 一解碼器/重新量化器,用於產生重新量化資料; 一信號分析器,用於檢索該音訊資料的一時框具有 諧波抑或語音特性的資訊;及 一雜訊注入器,用於產生雜訊注入音訊資料, 其中該雜訊注入器被設定組態產生雜訊填充資 料,以回應該雜訊填充量測及該音訊資料的該諧波或語 音特性;及 一處理器,用於處理該重新量化資料及該雜訊注入 音訊資料,以獲得一解碼音訊信號。 21. 如申請專利範圍第20項所述之解碼器, 73 201009812 其中該編碼音訊信號包含指示該音訊資料的該時 框具有一諧波抑或語音特性的資料,且 其中該信號分析器被設定組態以分析該編碼音訊 信號,以檢索指示該音訊資料的該時框具有一諧波抑或 語音特性的一資料。 22. 如申請專利範圍第21項所述之解碼器,其中該資料是該 時間部份已受到一時間扭曲處理的一指示,且 其中該處理器包含一時間反扭曲器,用於使從雜訊 注入資料與重新量化資料導出的一音訊信號時間反扭 曲。 23. 用於編碼一音訊信號置之方法,包含: 量化音訊值,其中該量化器被設定組態以將音訊值 量化為一量化臨界值之下的零值; 針對該音訊信號的一時框,估計被量化為零的音訊 值的一能量的一量度; 分析該音訊信號的該時框具有一譜波抑或語音特 性; 相關於該音訊信號的一諧波或語音特性,調處該雜 訊注入量度,以獲得一調處雜訊注入量度;且 產生一編碼信號用於發送或儲存,該編碼信號包含 該調處雜訊注入量度。 24. 用於解碼一編碼音訊信號的方法,包含: 處理該編碼音訊信號,以獲得一雜訊注入量度及編 碼音訊資料; 74 201009812 產生重新量化資料; 檢索該音訊資料的一時框具有諧波抑或語音特性 的資訊;且 產生雜訊注入音訊資料,以回應該雜訊注入量度及 該音訊信號的該諧波或語音特性;且 處理該量化資料及該雜訊注入音訊,以獲得一解碼 音訊信號。 ❹ 25. —種電腦程式,具有一當運行於一電腦上時,執行申請 專利範圍第23項之方法或申請專利範圍第24項之方法 的程式碼。 26. —種用於產生一編碼音訊信號的音訊編碼器,包含: 一音訊信號分析器,用於分析該音訊信號的一時框 具有一諧波抑或語音特性; 一視窗功能控制器,用於相關於該音訊信號的一諧 波或語音特性選擇一視窗功能; 一視窗器,用於使用該選擇視窗功能將該音訊信號 視窗化,以獲得一視窗化訊框;及 一處理器,用於進一步處理該視窗化訊框,以獲得 該編碼音訊信號。 27. 如申請專利範圍第26項所述之音訊編碼器,其中該視窗 功能控制器包含一用於檢測一暫態之暫態檢測器,其中 該視窗功能控制器被設定組態以當一暫態被檢測到且 一諧波或語音特性未被該音訊信號分析器發現時,從一 長塊的一視窗功能切換至一短塊的一視窗功能,且當一 75 201009812 暫態被檢測到且一諧波或語音特性被該音訊信號分析 器發現時,不切換至該短塊的視窗功能。 28. 如申請專利範圍第26或27項所述之音訊編碼器,其中該 暫態檢測器被設定組態以檢測該音訊信號的一定量特 性,且將該定量特性與一可控臨界值相比較,其中當該 定量特性具有與該可控臨界值的一預定關係時,一暫態 被檢測到,且 其中該音訊信號分析器被設定組態以控制該可變 臨界值,使得當該該音訊信號分析器已發現一諧波或語 音特性時,一切換至一短塊之視窗功能的一似然降低。 29. 如申請專利範圍第27或28項所述之音訊編碼器, 其中該視窗功能控制器被設定組態以當一暫態被 檢測到且該信號具有一諧波或語音特性時,切換至一比 一短塊之視窗功能為長的視窗功能,或切換至具有一比 一長塊之視窗功能的重疊為短的一視窗功能。 30. —種用於產生一編碼音訊信號的方法,包含: 分析該音訊信號的一時框具有一諧波抑或語音特 性; 選擇一相關於該音訊信號的一諧波或語音特性的 視窗功能; 使用該選擇視窗功能將該音訊信號視窗化,以獲得 一視窗化訊框;且 處理該視窗化訊框,以獲得該編碼音訊信號。 31. —種電腦程式,具有一當運行於一電腦上時,執行如申 76 2〇1〇〇98l2 32. 專利範圍第30項的該方法的程式碼。 種用於產生—音訊信號的音訊編碼器,包含·· 以獲時間扭曲器’用於將該音訊信號二扭曲, 復得—時間扭曲音訊信號; 曲音:時Γ頻率轉換器,用於將至少—部份該時間扭 號轉換為一頻譜表示;
    令,^時域雜訊修整級,詩依據_時域雜訊修整指 時域雜仃該頻譜表示的頻率上的—預職波,其中當該 行訊修整控制指令不存在時,該預測據波不被執 —時域雜訊修整控制器 s亥時域雜訊修整控制指令, 用於基於該頻譜表示產生 1其中該時域雜訊修整控制器被設定組態以當該頻 譜表示是基於-時間扭曲音訊信號時,增加執行於該頻 率上預測濾波的似然,或當該頻譜表示不是基於一時間
    扭曲a⑽麟,降低執行頻率上之該糊濾波的該似 然;及 一處理器,用於進一步處理該時域雜訊修整級的一 輸出’以獲得該編碼音訊信號。 33.如申請專利範圍第32項所述之音訊編碼器, 其中該時域雜訊修整控制器被設定組態以當該音 訊仏號藉由該時域雜訊修整級而受到該預測爐、波時,估 計一位元率或品質上的一增益,以將該估計增益與一判 疋臨界值相比較,且 77 201009812 當該估計增益與該判定臨界值處於一預定關係 時,判定支援該預測濾波, 其中該時域雜訊修整控制器被進一步設定組態以 改變該判定臨界值,使得對於同一估計增益而言,當該 頻譜表示是基於一時間扭曲信號時,該預測濾波被致 動,且當該頻譜表示不是基於一非時間扭曲音訊信號時 不被致動。 34. 如申請專利範圍第32或33項所述之音訊編碼器,其中該 時間扭曲器包含一信號分類器以供檢測有聲或無聲語 音,且 其中該時域雜訊修整控制器被設定組態以當一有 聲語音被檢測到,或當一無聲語音被檢測到且該頻譜表 示是基於該時間扭曲音訊信號時,增加該似然。 35. —種用於產生一音訊信號之方法,包含: 時間扭曲該音訊信號,以獲得一時間扭曲音訊信 號; 將至少一部份的該時間扭曲音訊信號轉換為一頻 譜表示; 依據一時域雜訊修整控制指令,執行該頻譜表示之 頻率上的一預測濾波,其中當該時域雜訊修整控制指令 不存在時,該預測濾波不被執行; 基於該頻譜表示產生該時域雜訊修整控制指令, 其中該時域雜訊修整控制器被設定組態以當該頻 譜表示是基於一時間扭曲音訊信號時,增加一執行頻率 78 201009812 上之預測濾波的似然,或當該頻譜表示不是基於一非時 間扭曲音訊信號時,降低執行頻率上之預測濾波的該似 然;且 處理該時域雜訊修整級的一輸出,以獲得該編碼音 訊信號。 36. —種電腦程式,具有一當運行於一電腦上時,執行申請 專利範圍第35項之方法的程式碼。 37. —種用於編碼一音訊信號的音訊編碼器,包含: 一時間扭曲器,用於使用一可變時間扭曲特性扭曲 一音訊信號; 一時間/頻率轉換器,用於將一時間扭曲音訊信號 轉換為具有若干頻譜係數的一頻譜表示;及 一處理器,用於處理一可變數目的頻譜係數,以產 生一編碼音訊信號, 其中該處理器被設定組態以基於該訊框的時間扭 曲特性,可變地設定該音訊信號之一訊框的若干頻譜係 數,使得由訊框到訊框的處理數目之頻率係數表示的一 帶寬變量被減少或消除。 38. 如申請專利範圍第37項所述之音訊編碼器, 其中該可變時間扭曲特性包含一訊框的一局部取 樣頻率(fSR),且 其中該處理器被設定組態以當該局部取樣頻率被 增加時,增加頻譜係數之數目,或其中該處理器被設定 組態以當該局部取樣頻率被降低時,減少該等頻譜係數 79 201009812 之數目。 39. 如申請專利範圍第37或38項所述之音訊編碼器,進一步 包含一帶寬延伸編碼器,使用從一交叉頻率上的音訊信 號的一頻帶導出的參數編碼該交叉頻率上之一頻譜 帶,其中該交叉頻率是每一訊框的一目標帶寬的一最大 頻率。 40. 如申請專利範圍第37至39項中任一項所述之音訊編碼 器,其中該音訊信號,在被時間扭曲前,使用一正常取 樣頻率(fN)被取樣,且其中該處理器被設定組態以當該 局部取樣頻率等於該正常取樣頻率時,使用從該交叉頻 率及該正常取樣頻率導出的一預定數目的頻譜係數 (Nn),或該局部取樣頻率高於該正常取樣頻率(fN)時, 使用一比該預定數目頻譜係數為高之數目的頻譜係 數,或當該局部取樣頻率低於該正常取樣頻率(fN)時, 使用一比該預定數目頻譜係數一為低之數目的頻譜係 數。 41. 如申請專利範圍第37至40項中任一項所述之音訊編碼 器, 其中該處理器包含一量化器,用於量化該等頻譜係 數,以獲得量化頻譜係數,及一熵編碼器用於熵編碼該 等量化頻譜係數, 其中該處理器包括一選擇器,用於在量化之前或之 後廢除不包括在該設定數目頻譜係數中的頻譜係數,使 得該編碼音訊信號僅包含未被廢除的該等頻譜係數,或 80 201009812 其中該處理器包括一選擇器,用於在量化之前或之 後加入該設定數目頻譜係數所需要的頻譜係數,使得該 編碼音訊信號另外包含該等加入的頻譜係數。 42. —種用於編碼一音訊信號的方法,包含: 使用一可變時間扭曲特性將一音訊信號時間扭曲; 將一時間扭曲音訊信號轉換為具有若干頻譜係數 的一頻譜表示;及 處理一可變數目的頻譜係數,以產生一編碼的音訊 信號, 其中該音訊信號的一訊框的一可變數目頻譜係數 是基於該訊框的時間扭曲特性被設定,使得由訊框到訊 框之處理頻率係數數目表示的一帶寬變量被減少或消 除。 43. —種電腦程式,具有一當運行於一電腦上時,執行申請 專利範圍第42項的方法的程式碼。
    81
TW098123433A 2008-07-11 2009-07-10 時間扭曲致動信號提供器、音訊信號編碼器、用以提供時間扭曲致動信號之方法、用以編碼音訊信號之方法及電腦程式 TWI463484B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7987308P 2008-07-11 2008-07-11
PCT/EP2009/004874 WO2010003618A2 (en) 2008-07-11 2009-07-06 Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs

Publications (2)

Publication Number Publication Date
TW201009812A true TW201009812A (en) 2010-03-01
TWI463484B TWI463484B (zh) 2014-12-01

Family

ID=41037694

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098123433A TWI463484B (zh) 2008-07-11 2009-07-10 時間扭曲致動信號提供器、音訊信號編碼器、用以提供時間扭曲致動信號之方法、用以編碼音訊信號之方法及電腦程式

Country Status (16)

Country Link
US (7) US9015041B2 (zh)
EP (5) EP2311033B1 (zh)
JP (5) JP5538382B2 (zh)
KR (5) KR101400588B1 (zh)
CN (5) CN103000178B (zh)
AR (8) AR072740A1 (zh)
AT (1) ATE539433T1 (zh)
AU (1) AU2009267433B2 (zh)
CA (5) CA2836858C (zh)
ES (5) ES2758799T3 (zh)
MX (1) MX2011000368A (zh)
PL (4) PL2311033T3 (zh)
PT (3) PT2410521T (zh)
RU (5) RU2536679C2 (zh)
TW (1) TWI463484B (zh)
WO (1) WO2010003618A2 (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103493129A (zh) * 2011-02-14 2014-01-01 弗兰霍菲尔运输应用研究公司 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
TWI549121B (zh) * 2013-07-22 2016-09-11 弗勞恩霍夫爾協會 利用在過渡頻率之交叉濾波器之編碼音頻訊號之解碼裝置與方法
TWI557725B (zh) * 2013-07-22 2016-11-11 弗勞恩霍夫爾協會 頻譜包絡線之取樣值之依鄰近關係熵編碼技術
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US12112765B2 (en) 2015-03-09 2024-10-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Families Citing this family (79)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7720677B2 (en) * 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
EP2107556A1 (en) * 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
MY154452A (en) * 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
RU2536679C2 (ru) 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
CN102770913B (zh) * 2009-12-23 2015-10-07 诺基亚公司 稀疏音频
ES2461183T3 (es) 2010-03-10 2014-05-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V Decodificador de señales de audio, codificador de señales de audio, procedimiento para decodificar una señal de audio, método para codificar una señal de audio y programa de ordenador que utilizan una adaptación dependiente de la frecuencia de un contexto de codificación
CA3105050C (en) 2010-04-09 2021-08-31 Dolby International Ab Audio upmixer operable in prediction or non-prediction mode
US8924222B2 (en) 2010-07-30 2014-12-30 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for coding of harmonic signals
US9208792B2 (en) * 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
US9008811B2 (en) 2010-09-17 2015-04-14 Xiph.org Foundation Methods and systems for adaptive time-frequency resolution in digital data coding
WO2012048472A1 (en) 2010-10-15 2012-04-19 Huawei Technologies Co., Ltd. Signal analyzer, signal analyzing method, signal synthesizer, signal synthesizing method, windower, transformer and inverse transformer
WO2012070668A1 (ja) * 2010-11-25 2012-05-31 日本電気株式会社 信号処理装置、信号処理方法、及び信号処理プログラム
US9324331B2 (en) * 2011-01-14 2016-04-26 Panasonic Intellectual Property Corporation Of America Coding device, communication processing device, and coding method
TWI488176B (zh) 2011-02-14 2015-06-11 Fraunhofer Ges Forschung 音訊信號音軌脈衝位置之編碼與解碼技術
WO2012122297A1 (en) * 2011-03-07 2012-09-13 Xiph. Org. Methods and systems for avoiding partial collapse in multi-block audio coding
WO2012122299A1 (en) 2011-03-07 2012-09-13 Xiph. Org. Bit allocation and partitioning in gain-shape vector quantization for audio coding
WO2012122303A1 (en) 2011-03-07 2012-09-13 Xiph. Org Method and system for two-step spreading for tonal artifact avoidance in audio coding
EP2707873B1 (en) * 2011-05-09 2015-04-08 Dolby International AB Method and encoder for processing a digital stereo audio signal
TWI605448B (zh) 2011-06-30 2017-11-11 三星電子股份有限公司 產生帶寬延伸訊號的裝置
CN102208188B (zh) * 2011-07-13 2013-04-17 华为技术有限公司 音频信号编解码方法和设备
US9548061B2 (en) * 2011-11-30 2017-01-17 Dolby International Ab Audio encoder with parallel architecture
KR20130109793A (ko) * 2012-03-28 2013-10-08 삼성전자주식회사 잡음 감쇄를 위한 오디오 신호 부호화 방법 및 장치
PT3220390T (pt) * 2012-03-29 2018-11-06 Ericsson Telefon Ab L M Codificação/descodificação de transformada de sinais áudio harmónicos
RU2610293C2 (ru) * 2012-03-29 2017-02-08 Телефонактиеболагет Лм Эрикссон (Пабл) Расширение полосы частот гармонического аудиосигнала
EP2709106A1 (en) 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
CN103854653B (zh) 2012-12-06 2016-12-28 华为技术有限公司 信号解码的方法和设备
WO2014096236A2 (en) * 2012-12-19 2014-06-26 Dolby International Ab Signal adaptive fir/iir predictors for minimizing entropy
PT2936486T (pt) 2012-12-21 2018-10-19 Fraunhofer Ges Forschung Adição de ruído de conforto para modelagem do ruído de fundo em baixas taxas de bits
PL2936487T3 (pl) 2012-12-21 2016-12-30 Generowanie szumu komfortu w wysokiej rozdzielczości widmowo-czasowej w nieciągłej transmisji sygnałów audio
CN107452392B (zh) 2013-01-08 2020-09-01 杜比国际公司 临界采样滤波器组中的基于模型的预测
SG11201505893TA (en) * 2013-01-29 2015-08-28 Fraunhofer Ges Forschung Noise filling concept
JP6181773B2 (ja) * 2013-01-29 2017-08-16 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Celp状コーダのためのサイド情報を用いないノイズ充填
ES2635142T3 (es) 2013-01-29 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Énfasis de baja frecuencia para la codificación basada en lpc en el dominio de la frecuencia
KR101775086B1 (ko) * 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
CN103971694B (zh) 2013-01-29 2016-12-28 华为技术有限公司 带宽扩展频带信号的预测方法、解码设备
EA028755B9 (ru) 2013-04-05 2018-04-30 Долби Лабораторис Лайсэнзин Корпорейшн Система компандирования и способ для снижения шума квантования с использованием усовершенствованного спектрального расширения
KR102150496B1 (ko) 2013-04-05 2020-09-01 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
SG10201708531PA (en) * 2013-06-21 2017-12-28 Fraunhofer Ges Forschung Time Scaler, Audio Decoder, Method and a Computer Program using a Quality Control
BR112015031606B1 (pt) 2013-06-21 2021-12-14 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Aparelho e método para desvanecimento de sinal aperfeiçoado em diferentes domínios durante ocultação de erros
MX352748B (es) 2013-06-21 2017-12-06 Fraunhofer Ges Forschung Control de búfer de variabilidad, decodificador de audio, método y programa de computadora.
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
US9363027B2 (en) * 2013-08-16 2016-06-07 Arris Enterprises, Inc. Remote modulation of pre-transformed data
CN106683681B (zh) * 2014-06-25 2020-09-25 华为技术有限公司 处理丢失帧的方法和装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980793A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder, decoder, system and methods for encoding and decoding
EP2980794A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
JP6086999B2 (ja) 2014-07-28 2017-03-01 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン ハーモニクス低減を使用して第1符号化アルゴリズムと第2符号化アルゴリズムの一方を選択する装置及び方法
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
EP2980798A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Harmonicity-dependent controlling of a harmonic filter tool
CA2990891A1 (en) * 2015-06-30 2017-01-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forchung E.V. Method and device for associating noises and for analyzing
US9514766B1 (en) * 2015-07-08 2016-12-06 Continental Automotive Systems, Inc. Computationally efficient data rate mismatch compensation for telephony clocks
JP6705142B2 (ja) * 2015-09-17 2020-06-03 ヤマハ株式会社 音質判定装置及びプログラム
US10186276B2 (en) * 2015-09-25 2019-01-22 Qualcomm Incorporated Adaptive noise suppression for super wideband music
US20170178648A1 (en) * 2015-12-18 2017-06-22 Dolby International Ab Enhanced Block Switching and Bit Allocation for Improved Transform Audio Coding
US9640157B1 (en) * 2015-12-28 2017-05-02 Berggram Development Oy Latency enhanced note recognition method
US9711121B1 (en) * 2015-12-28 2017-07-18 Berggram Development Oy Latency enhanced note recognition method in gaming
JP6412292B2 (ja) 2016-01-22 2018-10-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法
US10281556B2 (en) * 2016-02-29 2019-05-07 Nextnav, Llc Interference detection and rejection for wide area positioning systems
US10397663B2 (en) * 2016-04-08 2019-08-27 Source Digital, Inc. Synchronizing ancillary data to content including audio
CN106093453B (zh) * 2016-06-06 2019-10-22 广东溢达纺织有限公司 整经机经轴密度检测装置及方法
CN106356076B (zh) * 2016-09-09 2019-11-05 北京百度网讯科技有限公司 基于人工智能的语音活动性检测方法和装置
CN114885274B (zh) * 2016-09-14 2023-05-16 奇跃公司 空间化音频系统以及渲染空间化音频的方法
US10242696B2 (en) 2016-10-11 2019-03-26 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications
US10475471B2 (en) * 2016-10-11 2019-11-12 Cirrus Logic, Inc. Detection of acoustic impulse events in voice applications using a neural network
US20180218572A1 (en) 2017-02-01 2018-08-02 Igt Gaming system and method for determining awards based on matching symbols
EP3382703A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and methods for processing an audio signal
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
EP3382701A1 (en) 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using prediction based shaping
US10431242B1 (en) * 2017-11-02 2019-10-01 Gopro, Inc. Systems and methods for identifying speech based on spectral features
EP3483879A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
JP6975928B2 (ja) * 2018-03-20 2021-12-01 パナソニックIpマネジメント株式会社 トリマー刃及び体毛切断装置
CN109448749B (zh) * 2018-12-19 2022-02-15 中国科学院自动化研究所 基于有监督学习听觉注意的语音提取方法、系统、装置
WO2020253941A1 (en) * 2019-06-17 2020-12-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder with a signal-dependent number and precision control, audio decoder, and related methods and computer programs
CN112599139B (zh) * 2020-12-24 2023-11-24 维沃移动通信有限公司 编码方法、装置、电子设备及存储介质
CN113470671B (zh) * 2021-06-28 2024-01-23 安徽大学 一种充分利用视觉与语音联系的视听语音增强方法及系统
CN115148217B (zh) * 2022-06-15 2024-07-09 腾讯科技(深圳)有限公司 音频处理方法、装置、电子设备、存储介质及程序产品
CN121336256A (zh) * 2023-04-21 2026-01-13 弗劳恩霍夫应用研究促进协会 具有子带信号上时间噪声整形的音频信号编解码的装置和方法

Family Cites Families (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07850B2 (ja) * 1986-03-11 1995-01-11 河本製機株式会社 フイラメント糸の経糸糊付乾燥方法と経糸糊付乾燥装置
US5054075A (en) 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
JP3076859B2 (ja) 1992-04-20 2000-08-14 三菱電機株式会社 ディジタルオーディオ信号の信号処理装置
US5408580A (en) 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
FI105001B (fi) * 1995-06-30 2000-05-15 Nokia Mobile Phones Ltd Menetelmä odotusajan selvittämiseksi puhedekooderissa epäjatkuvassa lähetyksessä ja puhedekooderi sekä lähetin-vastaanotin
US5704003A (en) 1995-09-19 1997-12-30 Lucent Technologies Inc. RCELP coder
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5659622A (en) 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US5848391A (en) 1996-07-11 1998-12-08 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Method subband of coding and decoding audio signals using variable length windows
US6134518A (en) 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
US6131084A (en) * 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
KR100261254B1 (ko) 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 데이터 부호화/복호화방법 및 장치
KR100261253B1 (ko) * 1997-04-02 2000-07-01 윤종용 비트율 조절이 가능한 오디오 부호화/복호화 방법및 장치
US6016111A (en) 1997-07-31 2000-01-18 Samsung Electronics Co., Ltd. Digital data coding/decoding method and apparatus
US6070137A (en) 1998-01-07 2000-05-30 Ericsson Inc. Integrated frequency-domain voice coding using an adaptive spectral enhancement filter
ATE302991T1 (de) 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6453285B1 (en) * 1998-08-21 2002-09-17 Polycom, Inc. Speech activity detector for use in noise reduction system, and methods therefor
US6330533B2 (en) 1998-08-24 2001-12-11 Conexant Systems, Inc. Speech encoder adaptively applying pitch preprocessing with warping of target signal
US6449590B1 (en) 1998-08-24 2002-09-10 Conexant Systems, Inc. Speech encoder using warping in long term preprocessing
US7047185B1 (en) * 1998-09-15 2006-05-16 Skyworks Solutions, Inc. Method and apparatus for dynamically switching between speech coders of a mobile unit as a function of received signal quality
US7272556B1 (en) 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
US6424938B1 (en) * 1998-11-23 2002-07-23 Telefonaktiebolaget L M Ericsson Complex signal activity detection for improved speech/noise classification of an audio signal
US6691084B2 (en) 1998-12-21 2004-02-10 Qualcomm Incorporated Multiple mode variable rate speech coding
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6223151B1 (en) 1999-02-10 2001-04-24 Telefon Aktie Bolaget Lm Ericsson Method and apparatus for pre-processing speech signals prior to coding by transform-based speech coders
DE19910833C1 (de) * 1999-03-11 2000-05-31 Mayer Textilmaschf Kurzketten-Schärmaschine
WO2000074039A1 (en) 1999-05-26 2000-12-07 Koninklijke Philips Electronics N.V. Audio signal transmission system
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6581032B1 (en) 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US6366880B1 (en) * 1999-11-30 2002-04-02 Motorola, Inc. Method and apparatus for suppressing acoustic background noise in a communication system by equaliztion of pre-and post-comb-filtered subband spectral energies
US6718309B1 (en) * 2000-07-26 2004-04-06 Ssi Corporation Continuously variable time scale modification of digital audio signals
JP2002149200A (ja) * 2000-08-31 2002-05-24 Matsushita Electric Ind Co Ltd 音声処理装置及び音声処理方法
US6850884B2 (en) 2000-09-15 2005-02-01 Mindspeed Technologies, Inc. Selection of coding parameters based on spectral content of a speech signal
KR20020070374A (ko) * 2000-11-03 2002-09-06 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호들의 매개변수적 코딩
US6925435B1 (en) * 2000-11-27 2005-08-02 Mindspeed Technologies, Inc. Method and apparatus for improved noise reduction in a speech encoder
SE0004818D0 (sv) 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
KR20030009515A (ko) 2001-04-05 2003-01-29 코닌클리케 필립스 일렉트로닉스 엔.브이. 결정된 신호 타입들로 한정된 기술들을 사용하는 신호들의시간 스케일 변경
FI110729B (fi) 2001-04-11 2003-03-14 Nokia Corp Menetelmä pakatun audiosignaalin purkamiseksi
ES2298394T3 (es) 2001-05-10 2008-05-16 Dolby Laboratories Licensing Corporation Mejora de sesiones transitorias de sistemas de codificacion de señales de audiofrecuencia a baja velocidad de transferencia de bits por reduccion de preruidos.
DE20108778U1 (de) 2001-05-25 2001-08-02 Mannesmann VDO AG, 60388 Frankfurt Gehäuse für ein in einem Fahrzeug verwendbares Gerät zur automatischen Ermittlung von Straßenbenutzungsgebühren
US6879955B2 (en) 2001-06-29 2005-04-12 Microsoft Corporation Signal modification based on continuous time warping for low bit rate CELP coding
EP1278185A3 (en) 2001-07-13 2005-02-09 Alcatel Method for improving noise reduction in speech transmission
US6963842B2 (en) 2001-09-05 2005-11-08 Creative Technology Ltd. Efficient system and method for converting between different transform-domain signal representations
WO2003036620A1 (en) 2001-10-26 2003-05-01 Koninklijke Philips Electronics N.V. Tracking of sinusoidal parameters in an audio coder
CA2365203A1 (en) 2001-12-14 2003-06-14 Voiceage Corporation A signal modification method for efficient coding of speech signals
JP2003316392A (ja) 2002-04-22 2003-11-07 Mitsubishi Electric Corp オーディオ信号の復号化及び符号化装置、復号化装置並びに符号化装置
US6950634B2 (en) 2002-05-23 2005-09-27 Freescale Semiconductor, Inc. Transceiver circuit arrangement and method
US7457757B1 (en) 2002-05-30 2008-11-25 Plantronics, Inc. Intelligibility control for speech communications systems
US7447631B2 (en) * 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
TWI288915B (en) 2002-06-17 2007-10-21 Dolby Lab Licensing Corp Improved audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US7043423B2 (en) 2002-07-16 2006-05-09 Dolby Laboratories Licensing Corporation Low bit-rate audio coding systems and methods that use expanding quantizers with arithmetic coding
KR100711280B1 (ko) 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
KR20040058855A (ko) 2002-12-27 2004-07-05 엘지전자 주식회사 음성 변조 장치 및 방법
IL165425A0 (en) * 2004-11-28 2006-01-15 Yeda Res & Dev Methods of treating disease by transplantation of developing allogeneic or xenogeneic organs or tissues
US7529664B2 (en) * 2003-03-15 2009-05-05 Mindspeed Technologies, Inc. Signal decomposition of voiced speech for CELP speech coding
JP4629353B2 (ja) * 2003-04-17 2011-02-09 インベンテイオ・アクテイエンゲゼルシヤフト エスカレータまたは動く歩道のための移動手摺り駆動装置
EP1618557B1 (en) 2003-05-01 2007-07-25 Nokia Corporation Method and device for gain quantization in variable bit rate wideband speech coding
US7363221B2 (en) 2003-08-19 2008-04-22 Microsoft Corporation Method of noise reduction using instantaneous signal-to-noise ratio as the principal quantity for optimal estimation
JP3954552B2 (ja) * 2003-09-18 2007-08-08 有限会社スズキワーパー ヤーンガイドの空転防止機構付サンプル整経機
KR100640893B1 (ko) * 2004-09-07 2006-11-02 엘지전자 주식회사 음성 인식용 베이스밴드 모뎀 및 이동통신용 단말기
KR100604897B1 (ko) * 2004-09-07 2006-07-28 삼성전자주식회사 하드 디스크 드라이브 조립체, 하드 디스크 드라이브의장착 구조 및 이를 채용한 휴대폰
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
JP5143569B2 (ja) 2005-01-27 2013-02-13 シンクロ アーツ リミテッド 音響的特徴の同期化された修正のための方法及び装置
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
CA2602804C (en) 2005-04-01 2013-12-24 Qualcomm Incorporated Systems, methods, and apparatus for highband burst suppression
JP4550652B2 (ja) 2005-04-14 2010-09-22 株式会社東芝 音響信号処理装置、音響信号処理プログラム及び音響信号処理方法
US7885809B2 (en) * 2005-04-20 2011-02-08 Ntt Docomo, Inc. Quantization of speech and audio coding parameters using partial information on atypical subsequences
PL1875463T3 (pl) 2005-04-22 2019-03-29 Qualcomm Incorporated Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia
CN1862969B (zh) * 2005-05-11 2010-06-09 尼禄股份公司 自适应块长、常数变换音频解码方法
US20070079227A1 (en) 2005-08-04 2007-04-05 Toshiba Corporation Processor for creating document binders in a document management system
JP4450324B2 (ja) * 2005-08-15 2010-04-14 日立オートモティブシステムズ株式会社 内燃機関の始動制御装置
JP2007084597A (ja) 2005-09-20 2007-04-05 Fuji Shikiso Kk 表面処理カーボンブラック組成物およびその製造方法
US7720677B2 (en) 2005-11-03 2010-05-18 Coding Technologies Ab Time warped modified transform coding of audio signals
US7366658B2 (en) * 2005-12-09 2008-04-29 Texas Instruments Incorporated Noise pre-processor for enhanced variable rate speech codec
ES2391117T3 (es) 2006-02-23 2012-11-21 Lg Electronics Inc. Método y aparato para procesar una señal de audio
TWI294107B (en) * 2006-04-28 2008-03-01 Univ Nat Kaohsiung 1St Univ Sc A pronunciation-scored method for the application of voice and image in the e-learning
ES2559307T3 (es) 2006-06-30 2016-02-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable
US7873511B2 (en) 2006-06-30 2011-01-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8239190B2 (en) * 2006-08-22 2012-08-07 Qualcomm Incorporated Time-warping frames of wideband vocoder
US8036903B2 (en) 2006-10-18 2011-10-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system
CN101025918B (zh) * 2007-01-19 2011-06-29 清华大学 一种语音/音乐双模编解码无缝切换方法
US9653088B2 (en) 2007-06-13 2017-05-16 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
EP2107556A1 (en) 2008-04-04 2009-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transform coding using pitch correction
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
RU2536679C2 (ru) 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
JP5297891B2 (ja) 2009-05-25 2013-09-25 京楽産業.株式会社 遊技機
US8670990B2 (en) 2009-08-03 2014-03-11 Broadcom Corporation Dynamic time scale modification for reduced bit rate audio coding
JP5530454B2 (ja) 2009-10-21 2014-06-25 パナソニック株式会社 オーディオ符号化装置、復号装置、方法、回路およびプログラム

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9595263B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding and decoding of pulse positions of tracks of an audio signal
US9047859B2 (en) 2011-02-14 2015-06-02 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an audio signal using an aligned look-ahead portion
US9153236B2 (en) 2011-02-14 2015-10-06 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
US9384739B2 (en) 2011-02-14 2016-07-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for error concealment in low-delay unified speech and audio coding
CN103493129B (zh) * 2011-02-14 2016-08-10 弗劳恩霍夫应用研究促进协会 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
CN103493129A (zh) * 2011-02-14 2014-01-01 弗兰霍菲尔运输应用研究公司 用于使用瞬态检测及质量结果将音频信号的部分编码的装置与方法
US9620129B2 (en) 2011-02-14 2017-04-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a portion of an audio signal using a transient detection and a quality result
US9536530B2 (en) 2011-02-14 2017-01-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Information signal representation using lapped transform
US9583110B2 (en) 2011-02-14 2017-02-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing a decoded audio signal in a spectral domain
US9595262B2 (en) 2011-02-14 2017-03-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Linear prediction based coding scheme using spectral domain noise shaping
US10347274B2 (en) 2013-07-22 2019-07-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10984805B2 (en) 2013-07-22 2021-04-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10002621B2 (en) 2013-07-22 2018-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10134404B2 (en) 2013-07-22 2018-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US10147430B2 (en) 2013-07-22 2018-12-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US10311892B2 (en) 2013-07-22 2019-06-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding audio signal with intelligent gap filling in the spectral domain
US10332539B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellscheaft zur Foerderung der angewanften Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10332531B2 (en) 2013-07-22 2019-06-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
TWI549121B (zh) * 2013-07-22 2016-09-11 弗勞恩霍夫爾協會 利用在過渡頻率之交叉濾波器之編碼音頻訊號之解碼裝置與方法
US10515652B2 (en) 2013-07-22 2019-12-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
US10573334B2 (en) 2013-07-22 2020-02-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US10593345B2 (en) 2013-07-22 2020-03-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US10847167B2 (en) 2013-07-22 2020-11-24 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
TWI557725B (zh) * 2013-07-22 2016-11-11 弗勞恩霍夫爾協會 頻譜包絡線之取樣值之依鄰近關係熵編碼技術
US11049506B2 (en) 2013-07-22 2021-06-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US11222643B2 (en) 2013-07-22 2022-01-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus for decoding an encoded audio signal with frequency tile adaption
US11250862B2 (en) 2013-07-22 2022-02-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11257505B2 (en) 2013-07-22 2022-02-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11289104B2 (en) 2013-07-22 2022-03-29 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11735192B2 (en) 2013-07-22 2023-08-22 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US11769513B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding or encoding an audio signal using energy information values for a reconstruction band
US11769512B2 (en) 2013-07-22 2023-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
US11922956B2 (en) 2013-07-22 2024-03-05 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for encoding or decoding an audio signal with intelligent gap filling in the spectral domain
US11996106B2 (en) 2013-07-22 2024-05-28 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US12142284B2 (en) 2013-07-22 2024-11-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and related methods using two-channel processing within an intelligent gap filling framework
US12112765B2 (en) 2015-03-09 2024-10-08 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal

Also Published As

Publication number Publication date
EP2410522A1 (en) 2012-01-25
KR20130090919A (ko) 2013-08-14
CN103077722A (zh) 2013-05-01
CA2836858C (en) 2017-09-12
CA2836871C (en) 2017-07-18
EP2410521A1 (en) 2012-01-25
CN103000177A (zh) 2013-03-27
RU2621965C2 (ru) 2017-06-08
CA2836862A1 (en) 2010-01-14
PT2410521T (pt) 2018-01-09
CN103000186B (zh) 2015-01-14
JP5567191B2 (ja) 2014-08-06
JP5538382B2 (ja) 2014-07-02
ES2654433T3 (es) 2018-02-13
CA2730239A1 (en) 2010-01-14
HK1155551A1 (zh) 2012-05-18
HK1184903A1 (zh) 2014-01-30
CN102150201B (zh) 2013-04-17
CA2836858A1 (en) 2010-01-14
WO2010003618A3 (en) 2010-03-25
AR097966A2 (es) 2016-04-20
KR101400588B1 (ko) 2014-05-28
RU2012150076A (ru) 2014-05-27
PT2410520T (pt) 2019-09-16
EP2410521B1 (en) 2017-10-04
HK1182213A1 (zh) 2013-11-22
EP2410522B1 (en) 2017-10-04
PL2410521T3 (pl) 2018-04-30
BRPI0910790A2 (pt) 2023-02-28
AR097969A2 (es) 2016-04-20
MX2011000368A (es) 2011-03-02
US20110178795A1 (en) 2011-07-21
AU2009267433B2 (en) 2013-06-13
TWI463484B (zh) 2014-12-01
CN103000178A (zh) 2013-03-27
CA2836871A1 (en) 2010-01-14
US20150066492A1 (en) 2015-03-05
JP5591385B2 (ja) 2014-09-17
ES2654432T3 (es) 2018-02-13
CN103000186A (zh) 2013-03-27
CA2836863C (en) 2016-09-13
EP2311033B1 (en) 2011-12-28
US9015041B2 (en) 2015-04-21
AU2009267433A1 (en) 2010-01-14
AR072740A1 (es) 2010-09-15
US20150066490A1 (en) 2015-03-05
JP2013242599A (ja) 2013-12-05
ES2741963T3 (es) 2020-02-12
CA2730239C (en) 2015-12-22
JP2011527458A (ja) 2011-10-27
RU2011104002A (ru) 2012-08-20
CA2836862C (en) 2016-09-13
PT2410522T (pt) 2018-01-09
RU2536679C2 (ru) 2014-12-27
KR101400484B1 (ko) 2014-05-28
AR097968A2 (es) 2016-04-20
ES2758799T3 (es) 2020-05-06
HK1182212A1 (zh) 2013-11-22
EP2410520B1 (en) 2019-06-26
HK1182830A1 (zh) 2013-12-06
RU2012150074A (ru) 2014-05-27
CN103000178B (zh) 2015-04-08
AR097967A2 (es) 2016-04-20
PL2311033T3 (pl) 2012-05-31
KR20130093671A (ko) 2013-08-22
CN102150201A (zh) 2011-08-10
JP5591386B2 (ja) 2014-09-17
ATE539433T1 (de) 2012-01-15
US9502049B2 (en) 2016-11-22
US9431026B2 (en) 2016-08-30
JP2014002403A (ja) 2014-01-09
KR20130093670A (ko) 2013-08-22
CA2836863A1 (en) 2010-01-14
RU2589309C2 (ru) 2016-07-10
KR20130086653A (ko) 2013-08-02
JP2013242600A (ja) 2013-12-05
WO2010003618A2 (en) 2010-01-14
RU2586843C2 (ru) 2016-06-10
US9646632B2 (en) 2017-05-09
US20150066491A1 (en) 2015-03-05
RU2012150077A (ru) 2014-05-27
AR097970A2 (es) 2016-04-20
RU2012150075A (ru) 2014-05-27
JP2014002404A (ja) 2014-01-09
KR101400535B1 (ko) 2014-05-28
US20150066493A1 (en) 2015-03-05
EP2410520A1 (en) 2012-01-25
RU2580096C2 (ru) 2016-04-10
EP2311033A2 (en) 2011-04-20
CN103077722B (zh) 2015-07-22
EP2410519B1 (en) 2019-09-04
ES2379761T3 (es) 2012-05-03
KR101400513B1 (ko) 2014-05-28
US9466313B2 (en) 2016-10-11
US20150066488A1 (en) 2015-03-05
CN103000177B (zh) 2015-03-25
KR101360456B1 (ko) 2014-02-07
US20150066489A1 (en) 2015-03-05
PL2410520T3 (pl) 2019-12-31
PL2410522T3 (pl) 2018-03-30
US9263057B2 (en) 2016-02-16
KR20110043589A (ko) 2011-04-27
US9293149B2 (en) 2016-03-22
JP5567192B2 (ja) 2014-08-06
AR097965A2 (es) 2016-04-20
EP2410519A1 (en) 2012-01-25
AR116330A2 (es) 2021-04-28

Similar Documents

Publication Publication Date Title
TW201009812A (en) Time warp activation signal provider, audio signal encoder, method for providing a time warp activation signal, method for encoding an audio signal and computer programs
AU2013206267B2 (en) Providing a time warp activation signal and encoding an audio signal therewith
HK1182212B (zh) 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
HK1184903B (zh) 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
HK1182213B (zh) 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
HK1166547B (zh) 音频信号编码器、用於对音频信号编码的生成方法以及计算机程序
HK1182830B (zh) 提供时间扭曲激活信号以及使用该时间扭曲激活信号对音频信号编码
HK1166664B (zh) 音频信号编码器,用於对音频信号编码的方法以及计算机程序
HK1166546B (zh) 用於编码及解码音频讯号及电脑程式的方法及装置
HK1166548A (zh) 音频信号编码器、用於对音频信号编码的方法以及计算机程序
HK1166547A (zh) 音频信号编码器、用於对音频信号编码的生成方法以及计算机程序
HK1155551B (zh) 提供时间扭曲启动信号以及使用该时间扭曲启动信号对音频信号编码
HK1218019B (zh) 使用子带的时间平滑来生成频率增强信号的设备和方法