[go: up one dir, main page]

TW201007700A - An apparatus and a method for calculating a number of spectral envelopes - Google Patents

An apparatus and a method for calculating a number of spectral envelopes Download PDF

Info

Publication number
TW201007700A
TW201007700A TW098122397A TW98122397A TW201007700A TW 201007700 A TW201007700 A TW 201007700A TW 098122397 A TW098122397 A TW 098122397A TW 98122397 A TW98122397 A TW 98122397A TW 201007700 A TW201007700 A TW 201007700A
Authority
TW
Taiwan
Prior art keywords
time
envelope
boundary
sbr
threshold
Prior art date
Application number
TW098122397A
Other languages
English (en)
Other versions
TWI415114B (zh
Inventor
Max Neuendorf
Bernhard Grill
Ulrich Kraemer
Markus Multrus
Harald Popp
Nikolaus Rettelbach
Frederik Nagel
Markus Lohwasser
Marc Gayer
Manuel Jander
Virgilio Bacigalupo
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201007700A publication Critical patent/TW201007700A/zh
Application granted granted Critical
Publication of TWI415114B publication Critical patent/TWI415114B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • G10L19/025Detection of transients or attacks for time/frequency resolution switching
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Spectrometry And Color Measurement (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
  • Control Of Amplification And Gain Control (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Dental Tools And Instruments Or Auxiliary Dental Instruments (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Description

201007700 六、發明說明: 【韻'明所屬^技彳軒領】 本發明係㈣於用於計算頻譜包絡數目之襄置與方 法、音訊編碼器及用於編碼音訊信號之方法。 、
【先前技J 自然音訊(_1^1 audio)編碼及語音(speeeh)編碼是編 解碼器針對音贿制_主要料。线音訊編碼一般 地以中等位元率用於音樂或任意信號且大體上提供寬音訊 頻寬。另一方面,語音編碼器基本上限於語音再現,但可 以以一極低的位元率使用。寬頻語音提供優於窄頻語音之 一重要的主觀品質改進。增加頻寬不僅提高了語音的可僅 .度及自然度,而且還提高了對說話者的辨識。因此,寬頻 語音編碼在下一代電話系統中是一重要的課題。而且,由 於多媒體領域巨大的發展,透過電話系統以高品質傳輸音 樂及其它非語音信號是一希望的特徵。 爲了大大地減少位元率,可使用分頻感知音訊編解碼 器來執行信號源編碼。這些自然音訊編解碼器利用信號中 的感知無關及統計冗餘。此外,減少取樣率及從而減少該 音訊頻寬是常見的。減少組成層次數目偶爾地允許音訊的 量化失真及利用透過強度編碼之立體聲場之降級也是常見 的。過多使用此類方法会導致惱人的感知降級。爲了提高 編碼性能,在一基於高頻重建(high frequency reconstruction, HFR)編解碼器中使用頻帶複製作為一有效的方法來產生高 頻信號。 3 201007700 頻帶複製(spectral band replication, SBR)包含作為流行 的感知音訊編碼器(諸如MP3及高級音訊編碼(AAC))的一 附加物獲得普及之一技術。SBR包含頻寬擴展的一方法, 其中使用習知編解碼器之狀態來編碼該頻譜的低頻帶(基 頻带或核心頻帶),而上频带(或高頻带)使用幾個參數來粗 略地參數化。SBR藉由使用該等擷取的高頻带特徵自該較 低頻帶預測該較寬頻帶信號來利用在該低頻帶與該高頻帶 間的一相關。這經常是足夠的,因為人類的耳朵相比較於 該較低頻帶而言對該較高頻帶的失真較不敏感。因此,新 的音訊編碼器使用例如Μ P 3或A A C來編碼該較低頻譜而使 用SBR來編碼該較高頻帶。該SBR演算法的關鍵是用來描述 該仏號之該較尚頻率部分的資訊。此演算法的主要設計目 的是在不引入任何人工失真(artifact)的情況下重建該較高 頻頻谱並提供良好的賴及時間解析度。例如,在該分析 刀及該編碼ϋ使用—64頻帶複值多相遽波器組;使用該 慮波器組來獲得例如該原始輸人信號的高頻帶之能量樣 本接著k些能量樣本可作為供在該解碼器使用的一包絡 調整方案之參考值使用。 頻譜包絡在一般意義上指信號之 一粗略頻譜分佈且包 例如一線性的基於預測的編碼器中之濾波器係數或 子頻帶編石馬器中之子頻帶樣本之一組時頻 (me f’eney)平均值。接著,包絡資料是指該已量化及 碼的頻〜包、絡。特別地,如果該較低頻帶以-低位元率 編碼該包絡資料構成該位元流的—較大部分。因此,當 201007700 特別疋使用較低位元率時,簡潔地表示該頻譜包絡是重要 的。 頻帶複製利用基於例如在編碼期間截斷的諧波序列之 一複製之工具。此外,頻帶複製調整該所產生的高頻帶之 頻5酱包絡且應用反向濾波並加入雜訊及諧波成份以再生該 原始信號之該等頻譜特性 。因此,該SBR工具的輸入包含’ 例如’該已量化的包絡資料、雜項控制資料、來自該核心 編碼器(例如AAC或MP3)之一時域信號。該SBR工具的輸出 i H域錢或例如 一信號之一 QMF域(QMF=正交鏡像濾 : 波器)表示,當例如如果使用該MPEG環繞工具時。可在該 ' 標準ISO/IEC 14496,3 : 2005副條款4.5.2.8中找到針對該 SBR酬載的該等位元流元素之描述,且其中包含SBR擴展資 '^料、一SBR標頭並指示在一SBR訊框中之SBR包絡數目。 對於一SBR在該編碼器端的實施,在該輸入信號上執 行一分析。使用自此分析所獲得的資訊來選擇該目前SBR 訊框之適當的時間/頻率解析度。該演算法計算在該目前 ® SBR訊框中之該等SBR包絡的開始及停止時間邊界、SBR包 絡數目及它們的頻率解析度。不同的頻率解析度如例如在 該ISO/IEC 144963標準、副條款4.6.18.3中所描述的來計 算。該演算法還針對該給定SBR訊框計算雜訊層(n〇ise η〇〇Ι〇 的數目及該等雜訊層之開始及停止時間邊界。該等雜訊層 之開始及停止時間邊界應為該等頻譜包絡之開始及停止時 間邊界的一子集。該演算法將該目前的SBR訊框分成四類: FIXFIX_該前導(leading)及尾部(trailing)時間邊界都等 5 201007700 於標稱的SBR訊框邊界。在該訊框中所有的SBR包絡時間邊 界在時間上一致地分佈6包絡的數目是二的整數次冪(1, 2 , 4 , 8 , .·.) 。 FIXVAR-該前導時間邊界等於該前導標稱訊框邊界。 該尾部時間邊界是可變的且可由位元流元素來定義。在該 如導及该尾部時間邊界間之所有的SBR包絡時間邊界可以 被指疋為以時間槽而計之自該尾部時間邊界開始至前一邊 界之相對距離。 VARFIX-該前導時間邊界是可變的且由位元流元素來 定義。該尾部時間邊界等於該尾部標稱訊框邊界。在該前 導及該尾部時間邊界間之所有的SBR包絡時間邊界在位元 流中被指定為以時間槽而計之自該前導時間邊界開始至前 一邊界之相對距離。 VARVAR- s玄别導及尾部時間邊界都是可變的且可在位 元流中定義。在該前導及尾部時間邊界間之所有的SBR包 絡時間邊界也被指定。自該前導時間邊界開始的該等相對 時間邊界被指定為到前一時間邊界的相對距離。自該尾部 時間邊界開始的該等㈣時間邊界被指定為财一時間邊 界之相對距離。 在SBR訊框類別轉換上沒有限制,即在該標準中允 許類別的任-序列。然、而,依據此標準,對於_ριχΗχ, 每個該SBR訊框的SBR包絡之最大數目限制知及對於類別 VARVAR每個該SBR訊框的SBR包絡之最大數目為$。類別 FIXVAR及VARFIX在語法上限制為四個Sbr包絡。 201007700 在該時間區段上及以由該時間/頻率方格給定之該頻 率解析度來估計該SBR訊框之該等頻譜包絡。藉由在該等 給定的時間/頻率區域上計算該等平方的複數子頻帶樣本 之平均值來估計該SBR包絡。 一般地,在SBR中,透過使用可變長度的特定包絡, 暫態(transient)接受一特定處理。暫態可由習知信號中在一 短時間段内出現能量強勁增加的部分來定義,這可以或可 以不限制在一特定頻率區域。針對暫態的例子是響板及打 ❻ 擊樂器的擊打’而且還有人類發音的某些聲音,例如字母: j p、τ、κ…。目前始終以同一方式或由同一演算法(使用一 . 暫態臨限)來實施對此種暫態之檢測,而與該信號無關,不 5B9 δ玄號疋否被分類為5吾音或分類為音樂。另外,有聲與 無聲的語音間之一可能的區別不影響習知的或傳統的暫態 檢測機制。 因而,如果檢測到一暫態,應該調整該SBR資料以使 得一解碼器可適當地複製該受檢測的暫態。在W001/26095 # 中’揭露了用於頻譜包絡編碼之一装置及一方法,其考慮 了該音訊信號中之一受檢測的暫態。在此習知方法中,藉 由將來自一固定大小的濾波器組之子頻帶樣本分組成為每 個產生一包絡樣本之頻帶與時間區段來獲得該頻譜包絡之 一非一致的時間與頻率取樣。該相對應的系統預設為長時 間區段及高頻率解析度,但在/暫態附近使用較短時間區 段,藉此可使用較大頻率步階以保持該資料大小在限額 内。如果檢測到一暫態,該系統自一 F〗XFIX框切換到一 7 201007700 FIXVAR框,隨之一VARFIX框,以使得一包絡邊界正好定 位在該受檢測暫態前。每當檢測到一暫態時重複此步驟。 如果只是緩慢的能量波動變化,該暫態檢測器將不檢 測該變化。然而,如果處理不當,這些變化可能足以產生 可感知的人工失真。一簡單的解決方案可能是降低該暫態 檢測器中的該臨限。然而,這將導致在不同訊框間(fixfix 至fixvar+varfix)的一頻繁切換。結果,必須傳輸大量 的額外資料’暗示一不佳的編碼效率,特別是如果該緩慢 增長持續超過較長時間(例如,超過多個訊框)的話。這是不 可接受的,因為該信號不包含可證明一較高資料率是正當 之複雜性,因而這不是解決該問題的一選擇。
C 明内J 因此,本發明之一目的是提供一裝置,該裝置允許一 不具有可感知的人工失真之有效的編碼,特別是對包含一 緩慢變化的能量之信號,該緩慢變化的能量太低而不能被 該暫態檢測器所檢測。 該目的由如申請專利範圍第1項所述之裝置、如申請專 利範圍糾項所述之編碼^、如巾請專利範圍第13項所述 之用於計算觸包絡數目之方法或如巾請專職圍第14項 所述之用於產生一資料流之方法來實現。 本發明基於如下發現即:可藉由依據一給定信號以一 靈活的方賴餘—咖贿_頻譜包絡數 目來提高一 傳輸音訊信號之可感知品f。這藉由比較在該SBR訊框内 的相鄰時間部分之該音訊信號來實施。 201007700 該比較藉由決定該音訊信號在該等時間部分内之能量 分佈來實施,及一決策值量測兩相鄰時間部分的該等能量 分佈之一偏差。視该決策值是否違規了一臨限而定,一包 絡邊界位於該等相鄰時間部分之間。該包絡之另一邊界可 在該SBR訊框之開頭或末尾或者,可取捨地,也可在該SBr 訊框内之另兩個相鄰的時間部分之間。 因此,該SBR訊框不像例如在一習知的裝置中那樣被 改作或改變,在習知的裝置中,執行自一 FIXFIX框到一 ® FIXVAR框或到一VARFIX框之一改變以處理暫態。取而代 — 之的是,實施例使用一變化包絡數目(例如,在FIXFIX框内) 以考慮到該音訊信號之變化的波動使得即使是緩慢變化的 " 信號也可產生一變化的包絡數目,於是允許由在一解碼器 - 中之該SBR工具產生一較好的音訊品質。該已決定的包絡 可例如涵蓋在該SBR訊框中之相等時間長度的部分。例 如,該SBR訊框可被劃分成一預定數目之時間部分(例如該 預定數目可包含4、8或2的其它整數次幂)。
® 每個時間部分之該頻譜能量分佈可以只涵蓋藉由S B R 複製的上頻帶。另一方面,該頻譜能量分佈也可與整個頻 帶(上頻帶或下頻帶)有關,其中該上頻帶可以或可以不以大 於該下頻帶之權重來加權。透過此程序,該臨限值之已有 的一違規可能足以增加包絡數目或足以使用該SBR訊框内 之最大包絡數目。 進一步的實施例還可包含一信號分類器工具,該信號 刀類器工具分析該原始輸入信號並由此產生控制資訊該 9 201007700 控制資訊觸發不同編碼模式的選擇。該等不同的編碼模式 了例如包含一語音編碼器及—般音訊編碼器。該輸入信 號之該分析是實施態樣相依的’其目標是針對一給定輪入 ^號框選擇最佳核心編碼模式。當只使用低位元率來編石馬 時該最佳與一可感知高品質之一平衡相關。到該信號分類 器工具之該輸入可以是該原始未修改的輸入信號及/或額 外的實施態樣相依的參數。該信號分類器之該輸出例如可 以是一控制信號以控制該核心編解碼器之該選擇。 例如’如果該信號被識別或分類為語音,該頻寬擴展 (BWE)之類時解析度可增加(例如較多包絡)以使得可較好 的考慮一類時能量波動(緩慢地或強勁地波動)。 此方法考慮到具有不同時間/頻率特性之不同的信號 在關於該頻寬擴展的特性上具有不同的要求。例如,暫態 仏號(例如出現在語音信號中)需要該BWE之一精細的時間 解析度’該交越頻率(意思是該核心編碼器之該上頻率邊界) 應該儘可能的高。特別是在有聲語音中,—失真的時間結 構可降低感知的品質。另—方面,聲調信號經常需要頻譜 成份之-穩定的再生及該再生高頻部分之—匹配諧波圖案 。聲調部分的該穩定再生限制了該核心編碼器頻 寬,其不需要具有精細的時間解析度之__BWE,而是具有 -較精細的頻譜解析度之-BWE。在—切換語音/音訊核心 編碼器設計中,還可能使用該核心編碼器決策來適節該 BWE之該時間及頻譜特如及適節該核心'編碼器頻寬以適 於該等信號特性。 201007700 的達有的包絡包含相同的時間長度,視該所檢測到 哪-時間)而定,包絡數目可因訊框不同而不同。 =:如以如下方式針對一SBR訊框決定包絡數目。可 ::广最大可能包絡數目(例如8)之—分區開始並逐步 於=絡數目,藉此視該輸人信號而定使衫多於使該信 號月匕夠以-可感知高品質再生所需之包絡。
例如,已經在該訊框内之時間部分之該第—邊界被檢 —違規可產生—最大的包絡數目1只在該第二邊 界被檢測到之—違規可產生最大包絡數目的_半。為了減 少要被傳輸的《料’在進__步的實施财,該臨限值可 視該時間瞬時而定(即’視目前所分析是哪—邊界而定)。例 如,在該第-及第二時間部分之間(第—邊界)及在該第三及 第四時間部分之嶋三邊界),該臨限在這兩種情況下可比 在該第二及第三時間部分之間(第二邊界)時較大。因此,統 計上’在該第二邊界比在該第-或第三邊界將存在較多的 違規,因而更可能產生較少的包絡,這將是較佳的(更多細 節見下文)。 在進一步的實施例中,預定數目之後續時間部分之一 時間部分之時間長度等於一最小時間長度,針對該最小時 間長度決d包絡’及其中該決策值計算器適於針對 具有該最小時間長度之兩相鄰的時間部分計算一決策值 更進一步的實施例包含用來提供額外旁侧資訊之—次 訊處理器,該額外旁側資訊包含該音訊信號之該時間序貝 内之該第一包絡邊界及該第二包絡邊界。在進一步的實施 11 201007700 例中該檢測器適於以—時間順序研究相鄰時間部分間之該 等邊界中的每個邊界。 實施例還在一編碼器中使用用於計算包絡數目之該裝 置。該編碼器包含用於計算該頻譜包絡數目之該裝置及用 於使用此數目來計算針對一SBR訊框之該頻If包絡資料之 一包絡計算器。實施例還包含用於計算包絡數目之一方法 及用於編碼一音訊信號之一方法。 因而’使用在FIXHX框内之包絡是爲了較好地模型化 因太緩慢以致未被檢測為暫態或被分類為暫態而未受該等 暫態處理涵蓋之能量波動。在另一方面,如果該等能量波 動由於不足的類時解析度而沒有得到適當的處理’它們足 夠快導致人工失真。因而,依據本發明該包絡處理將考慮 到緩慢變化的能量波動而不僅是暫態之特徵的該強勁或快 速的能量波動。因此,本發明之實施例允許呈一較佳品質 之一較高效的編碼’特別地對於具有一緩慢變化能量的信 號’其波動強度太低而不能被該習知的暫態檢測器檢測到。 圖式簡單說明 本發明現在將透過所說明的例子來予以描述。透過參 考下面詳細的應參考該等附圖考慮之描述將較容易瞭解及 較好的理解本發明之特徵,其中: 第1圖顯示依據本發明之一實施例之用於計算頻譜包 絡數目之一裝置之一方塊圖; 第2圖顯示包含—包絡數目計算器之一 SBR模組之一 方塊圖; 201007700 @ι顯不包含—包絡數 之—器之 方塊圖; ㉟月在預定數目之時間部分中之-SBR訊框之 分區; ^ 冑顯不針對包含三個涵蓋不同數目之時間部 为之匕絡之-SBR赌之進_步的分區; 第如及6b圖說明針對在相鄰時 譜能量分佈;及 7e圖顯不包含肖於一音訊信號產生不同時間解 析度之—可取拾的音訊/語音切換之-編瑪器。 【實施方式】 本發明之詳細說明 下面私述的實施例只是用來說明用於改良例如在—音 訊編碼器中所使用之該頻帶複製之本發明的原理。要明白 的疋本文所描述的該等安排及該等細節之修改及變化對熟 於此技者而言將是明顯的。因而,意圖是不受作為本文的 該等實施例之描述及説明所呈現之該等特定細節所限制。 第1圖顯示用於計算頻譜包絡104之數目102之一裝置 100。該等頻譜包絡1〇4藉由一頻帶複製編碼器來導出,其 中該編碼器適於使用在自一初始時間t〇延伸至一最後時間 tn之一頻帶複製訊框(SBR訊框)中之預定數目之後續時間 部分110内之多個樣本值來編碼一音訊信號105。該預定數 目之後續時間部分110按該音訊信號105給定的一時間序歹4 排列。 13 201007700 該裝置100包含用來決定一決策值125之一決策值計算 器120,其中該決策值125量測一對相鄰時間部分在頻譜能 量分佈上的一偏差。該裝置100進一步包含用來藉由該決策 值125檢測一臨限的一違規135之一違規檢測器130。此外, 該裝置100包含一處理器140(第一邊界決定處理器),該處理 器140用於當檢測到對該臨限的一違規135時決定在該對相 鄰時間部分間之一第一包絡邊界145。該裝置100還包含一 處理器150(第二邊界決定處理器),該處理器150對於具有該 第一包絡邊界145之一包絡104,根據針對其它對的該臨限 之一違規135或根據在該SBR訊框中的該對或其它對之一 時間位置,來決定在一不同對相鄰時間部分間或在該初始 時間tO或在最後時間tn之一第二包絡邊界155。最後,該裝 置100包含一處理器16〇(包絡數目處理器),該處理器160用 來確立具有該第一包絡邊界丨45及該第二包絡邊界155之頻 譜包絡104的數目102。 進一步的實施例包含一裝置100,其中預定數目之後續 時間部分110之一時間部分之時間長度等於一最小時間長 度,針對該最小時間長度決定一單一包絡104。此外,該決 策值計算器120適於針對具有該最小時間長度之兩相鄰時 間部分計算一決策值125。 第2圖顯示針對包含該包絡數目計算器1〇〇(在第1圖中 顯示)之一 SBR工具之一實施例,該實施例藉由處理該音訊 信號105來決定頻譜包絡1〇4之數目1〇2。該數目102被輸入 到计算來自該音訊信號之該包絡資料205之一包絡計算 201007700 器210。使用數目102,該包絡計算器210將把該SBR訊框劃 分成由一頻譜包絡104涵蓋的部分,且對於每個頻譜包絡 104,該包絡计舁器210計算該包絡資料205。該包絡資料包 含例如該已里化及編碼的頻譜包絡,且在該解碼器端需要 此資料來產生該高頻帶信號及應用反向渡波、加入雜訊及 諧波成份以複製該原始信號之該等頻譜特性。 第3a圖顯示針對一編碼器300之一實施例,該編碼器 300包含SBR相關模組310、一分析QMF組320、一降取樣器 〇 330、一 AAC核心編碼器340及一位元流酬載格式器35〇。另 ' 外,該編碼器包含該包絡資料計算器210。該編碼器3〇〇 . 包含針對PCM樣本(音訊信號1〇5 ; PCM=脈衝碼調變)的一
輸入’该輸入連接到該分析QMF組320,且連接到該等§br - 相關模組31〇且連接到該降取樣器330。接著,該分析QMF 組320連接到該包絡資料計算器210,接著該包絡資料計算 器210連接到該位元流酬載格式器350。該降取樣器330連接 到該AAC核心編碼器340,接著’該AAC核心編碼器34〇連 _ 接到該位元流酬載格式器350。最後,該等SBR相關模組31〇 連接到該包絡資料計算器210且連接到該AAC核心編碼器 340 ° 因此,該編碼器300(在該降取樣器取樣器330中)對該音 訊信號105降取樣以產生在該核心頻帶中的成份,該等成份 被輸入到該AAC核心編碼器340中,該AAC核心編碼器34〇 編碼在該核心頻帶中的該音訊信號並轉送該已編碼信號給 該位元流酬載格式器350,其中將該核心頻帶之該已編碼的 15 201007700
音訊信號加入到編碼音訊流355中。在另一方面,由該分析 QMF組320來分析該音訊信號105,該分析QMF組320擷取該 尚頻帶之頻率成份並將這些信號輸入到該包絡資料計算器 210中。例如,一個64子頻帶QMF組32〇執行該輸入信號之 該子頻帶濾波。來自該濾波器組的輸出(即該等子頻帶樣本) 疋複值的,及因此,以一因子2之過取樣相比於一規則qMF 該等SBR相關模組310藉由將例如包絡1〇4的數目1〇2 提供給該包絡資料計算器21〇來控制該包絡資料計算器 囑 210 °該包絡資料計算器21〇使用數目ι〇2及由該分析QMF 組320所產生的該等音訊成份來計算該包絡資料2〇5並將該 包絡資料205轉送到該位元流酬載格式器35〇,該位元流酬 - 載格式器350將該包絡資料205與由該核心編碼器340編碼 . 之該等成份組合到該編碼音訊流355中。 因而第3a圖顯示估計由該高頻重建方法在該解碼器上 所使用的幾個參數之該SBR工具之該編碼器部分。 第3b圖顯示針對SBR相關模組310之一實施例,其包含 φ 該包絡數目計算器1〇〇(在第1圖中顯示)及可取捨地其它 SBR模組360。該等SBR相關模組310接收該音訊信號1 〇5並 輸出包絡104的數目102及由該等其它SBR模組360所產生 的其它資料。 該等其它SBR模組360例如可包含一習知的暫態檢測 器,該暫態檢測器適於檢測在該音訊信號1〇5中的暫態且還 可獲得該等包絡之數目及/或位置以使該等SBR模組可以或 16 201007700 可以不計算由該高頻重建方法在該解碼器上所使用的該等 參數中的一部分參數(SBR參數)。 如前所述,在SBR中,一SBR時間單元(一SBR訊框)可 被分成各種資料塊,所謂的包絡。如果此劃分或分區是一 致的’即所有的包絡104具有相同的大小且該第一包絡以一 訊框邊界開始及該最後包絡以一訊框邊界結束,該SBR訊 框被定義為該FIXFIX框。 第4圖說明這樣的針對一sbr訊框之以一數目1〇2個頻 © 譜包絡104之一分區。該SBR訊框涵蓋在該初始時間t0與一 - 最後時間tn間的一時間段,及在第4圖所示的該實施例中, , 該SBR訊框被劃分為8個時間部分:一第一時間部分in、 一第二時間部分112、…、一第七時間部分117及一第八時 . 間部分U8。這8個時間部分11〇由7個邊界分開,這就是說 一邊界1介於該第一及第二時間部分1U、112之間,一邊界 2位於該第二部分112與一第三部分113之間,如此繼續直到 一邊界7介於該第七部分117與該第八部分118之間。 ❹ 在標準的IS0AEC 14496-3中,在一ΠΧΠΧ框中之包絡 104之最大數目被限制為四(見段落4.6.18.3.6,子部分4)。 一般地’在該FIXFIX框中之包絡1〇4之數目可以是二的冪次 (例如,1、2、4),其中如果在同一訊框中沒有檢測到暫態 時只使用FIXFIX框。另一方面’在習知的高效AAC編碼器 實施態樣中’包絡之該最大數目被限制為二,即使標準 之說明理論上允許多達四個包絡。每訊框之此包絡104數目 可增加到例如八(見第4圖),以使一nXFIX框可包含1、2、 17 201007700 4或8個包絡(或2的另一幂次)。當然,包絡1〇4之任一其它數 目102也是可能的,以使包絡1〇4之該最大數目(預定數目) 可以只受每SBR訊框具有32個QMF時間槽之該qmf濾波器 組之該時間解析度來限制。 包絡104之數目102例如可如下計算。該決策值計算器 120量測在成對的相鄰時間部分11〇之該等頻譜能量分佈中 的偏差。例如,這就是說該決策值計算器12〇針對該第一時 間部分111計算一第一頻譜能量分佈,根據在該第二時間部 分112中的該頻譜資料來計算一第二頻譜能量分佈等。然 後,將該第一頻譜能量分佈與該第二頻譜能量分佈相比 較,並根據此比較導出該決策值125,其中在此例子中該決 策值125與在該第一時間部分in及該第二時間部分112間 - 的該邊界1有關。相同的程序可應用到該第二時間部分112 及該第三時間部分113,以使針對這兩相鄰時間部分也導出 兩頻譜能量分佈,及接著這兩頻譜能量分佈由該決策值計 算器120比較以導出一進一步的決策值125。
下一步,該檢測器130將把該導出的決策值125與一臨 G 限值比較,及如果該臨限值被違規了,該檢測器130將檢測 到一違規135。如果該檢測器130檢測到一違規135,該處理 器140決定一第一包絡邊界145。例如,如果該檢測器130在 該第一時間部分lu與該第二時間部分112間的該邊界1檢 測到一違規,則該第一包絡邊界145a定位在該邊界1之時間 處。 在只有幾種可能性對於區組(granule)/邊界而言是被允 18 201007700 許的該第4圖之實_巾,這就是說完成了 整個過程,且如 由在104a、lG4b指示的該等小包絡指示的那樣來設定所有 的邊界。在此情況下,邊界將在所有的時間G、1、2、...、 nji 〇 然而’當要賴第—邊界設定在例如時晴時4上時, 則必須το成針對㊅第二邊界的搜尋。如在第*圖所指示該 第-邊界可以在3、2、〇。如果該邊界在3,則完成整個程 序’因為設定了 最小的包絡l〇4a、lG4b。如果該邊界 在2,則必須繼續該搜尋,因為還沒有確認可以使用該等中 等包絡(如145a所示)。即使如果該邊界在〇,還沒有決定的 是在後半部中(㈣如之咖存在H如果在後半部中 不存在—邊界’則可設定該等最寬廣的包絡。如果存在一 邊界,例如在5 ’則必須使用該等最小的包絡。如果只在6 存在一邊界,則使用該等中等包絡。 然而’當允許針對該等包絡之—完全靈活或一較靈活 的模式時’當已決定一第一邊界在i時該程序繼續。接著, 該處理器15G決定—第二包絡邊界155,該第二包絡邊界155 在另-對相鄰時間部分之間或與該初始的時_或該最後 的時間比一致。在第4圖所示的該等實施例中,該第二包絡 邊界155a與該初始時_—致(產生―第—包關叫及另 第-包絡邊界l55b與在該第二時間部分⑴及該第三時 間部分113間之該邊界2—致(產生-第二包絡藝)。如果在 »亥第-時間部分m與該第二時間部分ιΐ2間之該邊界1未 檢測到的違規’則該檢測器13G將繼續研究在該第二時間部 19 201007700 分112與該第三時間部分113間之該邊界2。如果存在一違 規’則另一包絡104C自該開始時_延伸至該邊界2。 依據本發明之實施例,對於一對相鄰包絡而言,該決 策值125量測該等頻譜能量分佈之偏差,其中每個頻譜能量 分佈涉及該音訊信號在一時間部分内的一部分。在8個包絡 的該例子中,存在總數為7個的量值(=在相鄰時間部分間的 7個邊界)或,-般地,如果存在n個包絡,則存在n—i個量 值(決策值125)。接著這麵策值125中料—個可與一臨限 比較,且如果該決策值吻量值)違規該臨限,則一包絡邊 ^ 界將被定位在該__包絡之間。視該決策值125及祕 限的定義而定,該違規可以是一決策值125大於或小於該臨 限。如果該決策值小於該臨限,則該頻譜分佈可能不會隨 ' _ 著包絡到包絡強烈改變。因此,在此位置可不需要包絡邊 界(=時間瞬時)。 在一較佳實施例中,包絡104之數目102包含二的冪 次,且此外,每個包絡包含一相等的時間段。這就是說存 在四種可能性:一第一可能性是整個SBR訊框被一單一包 傷 絡涵蓋(在第4圖中未示),該第二可能性是該SBR訊框被2 個包絡涵蓋,該第三可能性是該SBR訊框被4個包絡涵蓋及 最後可能性是該SBR訊框被8個包絡涵蓋(在第4圖中自下而 上顯示)。 以一特定順序研究該等邊界可能是有利的,因為如果 在一奇數邊界(邊界卜邊界3、邊界5、邊界7)存在一違規, 則包絡的數目將始終為八(假設是相同大小的包絡)。另一方 20 201007700 面,如果在邊界2及邊界6存在—違規則存在四個包絡,及 最後,如果只在邊界4存在一包絡則將編碼兩包絡,及如果 在该等7個邊界中的任一個都不存在違規,則整個SBR訊框 被一單一包絡所涵蓋。因此,該裝置1〇〇可首先研究該邊界 1、3、5、7且如果在這些邊界之一處檢測到一違規,則該 裝置100可研究下一SBR訊框,因為在此情況下,整個SBR δΚ框將以最大包絡數目來編碼。在研究這些奇數邊界後且 如果在該等奇數邊界沒有檢測到違規,則作為下一步該檢 測器130可研究該邊界2及邊界6,藉此,如果在這兩邊界之 一中檢測到了 一違規,則包絡數目將為四且該裝置1〇〇可再 一次轉往下一SBR訊框。作為最後一步,如果就該等邊界 1、2、3、5、6、7而言沒有檢測到違規,則該檢測器13〇可 研究該邊界4及如果在邊界4檢測到了 一違規,則包絡數目 被定為二。 對於一般情況(η個時間部分,其中η是一偶數),此程序 也可再敘述如下。如果例如在該等奇數邊界沒有檢測到違 規且因此該決策值125可小於該臨限,意思是(由那些邊界 分開的)該等相鄰包絡就該頻譜能量分佈而言包含不大的 差異,不需要將該SBR訊框劃分成η個包絡,且代之者,劃 分成η/2個包絡可能足夠了。另外,如果該檢測器13〇在是 奇數兩倍(例如在邊界2、6、1〇、…)的邊界處沒有檢測到違 規,也不需要將一包絡邊界放在這些位置及,因此,包絡 之數目可進一步減少一半,即減少到η/4。此程序逐步繼續 (下一步將是一奇數4倍之邊界,即4、12、…)。如果在所有 21 201007700 的這些邊界沒有檢測到違規,則一單—包絡對於SBR 訊框是足夠的。 1 然而’如果在該等奇數邊界的該等決策值當中的一個 決策值大於該臨限,則應該考慮η個包絡,因為〇有在言時 一包絡邊界將被定位在該相對應的位置(由於假定所有的 包絡具有相同的長度)。在此情況下,將計算η個包絡,即 便所有其它的決策值125小於該臨限。
然而,該檢測器130也可針對所有時間部分ιι〇考慮所 有的邊界且考慮所有的決策值125以計算包絡1〇4之數目。
由於包絡數目102的增加還意味著要被傳輸之資料量 增加,所以可增加牽涉多數目個包絡1〇4之該相對應包絡邊 界之該決策臨限。這就是說在邊界〗、3、5及7的該臨限值 可取捨地可高於在邊界2及6的該臨限值,接著,在邊界2及 6的該臨限值可高於在該邊界4的該臨限值。較低或較高臨 限值這裡指該臨限值之一違規較可能或較不可能。例如一 較南臨限值意味著在兩相鄰時間部分間的該頻講能量分佈 的該偏差可比一較低臨限值情況下較可容忍,因此對於一 高臨限值而言,需要該頻譜能量分佈之較嚴重的偏差來要 求進一步的包絡。 該已選擇的臨限值還可能視該信號(關於該信號是否 被分類為一語音信號或般音訊信號)而定。然而,如果 該信號被分類為語音,則並不是一直減少(或增加)該決策臨 限值H視應用而定,如果對於――般音訊信號該臨 限值尚’則這可能是有利的,以使在此情況下包絡之數目 22 201007700 一般地小於針對一語音信號時的包絡之數目。 第5圖說明進—步的實施例,其中該等包絡之長度在該 SBR訊框内變化。在第5a圖中,顯示了具有三_ 一例子,一第一包絡104a、一第二包絡1〇4b及—第三包絡 馳。該第-包絡104a自該初始時間t〇延伸到在時間t2的該 邊界2 ’該第二包絡獅自在時_的該邊界〕延伸到在時 間t5的該邊界5及該第三包絡敝自在時恥的邊界$延伸 到該最後時間tn。如果所有的時間部分又是相同的長度及 φ 如果該SBR訊框又是被劃分成八個時間部分,則該第一包 - 絡104a涵蓋該第一及第二時間部分111、112,該第二包絡 . 104b涵蓋該第三時間部分113、第四時間部分114及第該第 ' 五時間部分115,及該第三包絡涵蓋該第六、該第七及 . 該第八時間部分。因而,該第一包絡104a小於該第二及該 第三包絡104b及l〇4c。 第5b圖顯示只具有兩個包絡之另一實施例,一第一包 絡104a自s玄初始時間t〇延伸到該第—時間ti及一第二包絡 9 104b自該第一時間tl延伸到該最後時間tn。因此,該第二包 絡104b延伸越過7時間部分,而該第一包絡1〇如只延伸越過 一單一時間部分(該第一時間部分lu)。 第5c圖顯示的又是具有三個包絡1〇4的一實施例,其中 該第一包絡1 〇4a自該初始時間t0延伸到該第二時間t2,該第 二包絡104b自該第二時間t2延伸到該第四時間以及該第三 包絡104c自該第四時間t4延伸到該最後時間m。 這些實把例例如可被用在這種情況下:包絡之邊界 23 201007700 只放在其間檢測到該臨限值之一違規之相鄰時間部分之間 或放在該初始to及最後時間tn。這就是說在第5a圖中,在時 間12檢測到了一違規及在時間15檢測到了一違規而在剩餘 的時間瞬時tl、t3、t4、t6及t7沒有檢測到違規。類似地, 在第5b圖中,只在時間tl檢測到一違規,導致針對該第— 包絡104a及針對該第二包絡川牝的―邊界,及在第父圖, 只在該第一時間t2及該第四時間t4檢測到違規。 爲了 一解碼器能夠使用該包絡資料及能夠相應地複製 該頻譜較高頻帶’該解碼器需要該等包絡1〇4及該等相對應 的包絡邊界之位置。錢前所示的依賴該標_之實施例 中,其中所有的包絡刚包含相同的長度並,因此,傳輸包 絡之數目足以使該解碼器可決定—包絡邊界必須在哪里。 然而’在第5圖所示的這些實施例中,該解碼器需要一包絡 邊界位於哪—時間之資訊,及因此可將額外的旁側資訊 (side mforniatiGn)放人該資料流中以便於使用該旁側資 訊’該料器可保留—邊界所處及-包絡開始及結束之該 等時間瞬時。此額外的資訊包含該時間伽5(在第5a圖的 清中)該時間tl(在第5b圖的情況中)及該時間【讀以(在 第5c圖的情況中)。 第如及帥圖透過使用在該音訊信號1〇5中之該頻譜能 量分佈來顯科對舰策值計算器i2G之—實施例。 第圖顯不針對在一給定時間部分(例如,該第一時間 刀111)中之該音訊信號之_第_組樣本值6職將此取 樣的音訊㈣與在該第二時間部分ιΐ2中賴音訊信號之 24 201007700 一第二組樣本620相比較。該音訊信號被轉換到頻域以使該 等組樣本值610、620或他們的位準ρ顯示為頻率5的函數。 該等較低及較高㈣φ賴分開,意味著對概馳高的頻 率將不傳輸樣本值。該解碼器應藉由使用該SBR資料來複 製這些樣本值代之。另一方面,例如由該AAC編碼器來編 碼小於該交越頻率f〇的該等樣本並傳輸到該解碼器。 該解碼器可使用來自該低頻帶的這些樣本值以複製該 等高頻成份。因此,爲了找到針對在該第一時間部分U1中 Φ 的該第一組樣本610與在該第二時間部分112中的該第二組 " 樣本620之偏差的一量值,只考慮在該高頻帶(對於f〉f〇)中 . 的該等樣本值可能不夠,還要考慮在該低頻帶中的頻率成 ' 份。一般地,如果在該高頻中的頻率成份與在該低頻帶中 . 的頻率成份間存在一相關,則將期望一良好品質的複製。 在一第一步中,只考慮在該高頻帶(大於交越頻率扣)中的樣 本值並計算在該第一組樣本值61〇與該第二組樣本值62〇間 的一相關是足夠的。 Φ 該相關可藉由使用標準的統計方法來計算且可包含例 如所謂的交互相關函數的計算或用於兩信號之相似性之其 它統計量測。還有可用來估計兩信號之一相關之皮爾遜積 差相關係數(Pearson s product moment correlation coefficient)。該等皮爾遜係數也稱為一樣本相關係數。一般 地’一相關指示兩隨機變數(本實例中為兩樣本分佈61〇與 620)之間的一線性關係之強度與方向。因此,該相關指兩 隨機變數之無關性之偏離。在此廣泛意義上,存在多個量 25 201007700 測相關度之錄適於資料本f,以便於針對不_情況使 用不同的係數。 第6b圖顯7F-第三組樣本值㈣及—第四組樣本值 640,匕們可例如與在該第三時間部分113及該第四時間部 分114中的該等樣本值有關。再一次,爲了比較這兩組樣本 (或L號)’考慮兩相鄰時間部分。相比於在第副中所顯示 的情況,在第6b圖中,引進—臨限值Μ便只考慮位準p大 於(或較-般的違規m臨限值τ之樣本值({>>1立之樣本 值)。 在此實施例中,可只藉由計數違規此臨限值丁的樣本值 之數目來量測頻譜能量分佈的偏差且該結果可確定該決策 值125。此簡單的方法將產生兩信號之間的一相關而不執行 該等不同時間部分110中的該等不同組樣本值之一詳細的 統計分析。另外,例如如上所述之一統計的分析可僅應用 到違規該臨限值T的該等樣本上。 第7a至7c圖顯示一進一步的實施例,其中該編碼器3〇〇 包含一切換決策單元370及一立體聲編碼單元38(^此外, 該編碼器300還包含該等頻寬擴展工具,例如該包絡資料計 异|§ 210及該等SBR相關模組310。該切換決策單元37〇提供 在一音訊編碼器372與一語音編碼器373之間切換的—切換 決策信號371。這些編碼中的每一編碼可使用不同數目個樣 本值(例如對於一較高解析度使用1024個樣本值或斜於_ 較低解析度使用256個樣本值)來編碼在該核心頻帶巾^ 音訊信號。還可將該切換決策信號371供應給該頻寬擴展 201007700 (BWE)工具210、310。接著’該BWE工具210、310將使用 邊切換決策信號371來例如調整用於決定該等頻譜包絡1〇4 之數目102之該等臨限值且用以開啟/關閉一可取捨的暫態 檢測器。將該音訊信號105輸入到該切換決策單元37〇並輸 入到该立體聲編碼單元38〇以使該立體聲編碼單元38〇可產 生輪入到該頻帶擴展單元210、31〇中之該等樣本值。視由 該切換決策單元370所產生的該決策信號371而定,該頻寬 擴展工具210、310將產生接著被轉送到一音訊編碼器372或 ® —語音編碼器373之頻帶複製資料。 • ^該切換決策信號371是信號相依的且可由該切換決策 . 單7°37()藉由分析該音訊信號(例如透過使用-暫態檢測器 0包含或不包含-可變臨限值之其它檢測器)來獲得。另 外,還可手動地調整該切換決策信號371或自一資料流(包 括在該音訊信號中)獲得該切換決策信號371。 該音訊編碼11372及該語音編㈣373之輸出又可被輸 入到該位元流格式器350(見第3&圖)中。 ® 帛7b圖顯示針對該切換決策信號371之-例子,其在小 於第時間t a及大於一第二時間出之時間段期間檢測到 -音訊信號。在該第-時與該第二時_間,該切換決 策單元370檢測到一語音信號針斜該切換決策信號371暗示 不同的離散值之。 因此如胃㈣所不’ 時間期間檢咖該音訊信 號,這就是說在ta之前的時間,該編碼的該時間解析度是低 的’而在檢測到一語音信號的該時段期間(在該第-時_ 27 201007700 與該第二時間tb之間)’該時間解析度增加。該時間解析度 增加意味著時域内一較短的分析窗。該增加的時間解析度 還意味著前述増加數目之頻譜包絡(見對第4圖之描述 對於需要精確時間表示高頻率之語音信號,由該切換 決策單元370來控制用來傳輸較多數目個參數集之該決策 臨限值(例如在第4圖使用)。對於以該切換核心編碼器之該 語音或時域編碼部分373編碼之語音及類似語音的信號,要 使用較多參數集之該決策臨限值例如可被減小,從而增加 了該時間解析度。然而,情況並不總是如上面提到的這樣。 類時(time-like)解析度按該信號的改作與該基本編碼器結 構(在第4圖未用)無關。這就是說,所描述的方法在其内該 SBR模組只包含一單一核心編碼器之一系統中也可用。 儘管在以一裝置為脈絡的情況下已描述了一些層面, 但是清楚的是這些層面也表示相對應方法的—描述,其中 一方塊或裝置對應於一方法步驟或一方法步驟之一特徵。 類似地,在以一方法步驟為脈絡的情況下描述的層面也表 示一相對應方塊或一相對應裝置之項目或特徵之—描述。 可將本發明編碼音訊信號儲存在一數位儲存媒體上戍 在諸如一無線傳輸媒體或一有線傳輸媒體(如網際網路)之 一傳輸媒體上傳輸。 視某些實施需求而定,本發明之實施例可在硬體或在 軟體中實施。該實施可透過使用具有電子可讀取控制信號 儲存於其上之一數位儲存媒體(例如一軟碟、一dvd、一 CD、一 ROM、一 PROM、一 EPROM、一 EEPROM或一快閃 201007700 記憶艘)來執行,這些數位健存媒體與一可規劃電腦系統協 作(或能夠協作)以便於執行各自的方法。 7些實施例依據本發明包含具有電子可讀取控制信號 之貝料載體,該等電子可讀取控制信號能夠與一可規劃 電腦系統協作’以便於執行本文所描述的該等方法當中之 一方法。 “大體上,本發明之實施例可作為具有一程式碼之一電 财式產品來實施,t該電腦程式產品運行在—電腦上時 ® 姉柄可射叫㈣等方法當巾之-方法。該程式碼 T例如儲存在—機器可讀取載體上。 〜匕實苑例包含儲存在一機器可讀取載體上、用來執 〜本文所&述的該等方法當巾之-方法之該電腦程式。 、、換έ之,當該電腦程式運行在一電腦上時,本發明方 ♦之實施例進而是具有用來執行本文所描述的該等方法 田中之一方法之—程式石馬之一電腦程式。 ® 本發明方法之-進—步的實施例進而是一資料載體 用 之位儲存媒體或一電腦可讀取媒體),該資料載體包含 來執行本文所描述的該等方法當中之一方法記錄於其上 之該電腦程式。 广。本發明方法之一進—步的實施例進而是一資料流或一 歸1序列’表示用來執行本文所描述的該等方法當中之一 去之該電腦程式。該資料流或信號序列例如可遭組配以 胃料通訊連接(例如經由網際網路)被傳輸。 —進一步的實施例包含遭組配用以或遭設計用以執行 29 201007700 本文所描述的該等方法當中之一方法之一處理裝置(例如 一電腦或一可規劃邏輯裝置)。 一進一步的實施例包含具有用來執行本文所描述的該 等方法當中之一方法之該電腦程式安裝在其上之一電腦。 在一些實施例中,一可規劃邏輯裝置(例如一可現場規 劃閘陣列)可用來執行本文所描述的該等方法當中之一些 或所有該等功能。在一些實施例中,一可現場規劃閘陣列 可與一微處理器協作以執行本文所描述的該等方法當中之 一方法。大體上,該等方法較佳地由任何硬體裝置來完成。 _ 上面所描述的該等實施例只是用來說明本發明之該等 - 原理。要明白的是本文所描述的該等安排及該等細節之修 _ 改及變化對熟於此技者而言將是顯而易見的。因此,意圖 · 是只受後附的申請專利範圍之該範圍限制並不受本文中以 - 對實施例之描述及説明所表示的該等特定細節限制。 【圖式簡單說明1 第1圖顯示依據本發明之一實施例之用於計算頻譜包 絡數目之一裝置之一方塊圖; @ 第2圖顯示包含一包絡數目計算器之一 SBR模組之一 方塊圖; 第3a及3b圖顯示包含一包絡數目計算器之一編碼器之 方塊圖; 第4圖說明在預決數目之時間部分中之一 SBR訊框之 分區, 第5a至5c圖顯示針對包含三個涵蓋不同數目之時間部 30 201007700 分之包絡之一SBRgfL框之進—步的分區; 第6a及6b圖s兑明針對在相鄰時間部分中的信號之該頻 譜能量分佈;及 第7a至7c圖顯示包含對於—音訊信號產生不同時間解 析度之一可取捨的音訊/語音切換之一編碼器。 【主要元件符號說明】
❹ 100.. .裝置 102.. .頻譜包絡數目 104.. .頻譜包絡 104a…小包絡、第一包絡 104b…小包絡、第二包絡 KMc…另一包絡、第三包絡 105…音訊信號 110.. .後續時間部分、時間部 分、相鄰時間部分 111~118···第一至第八時間部 分 120…決策值計算器 125.. .決策值 130…違規檢測器、檢測器 135…違規 140…第一邊界決定處理 器、處理器 145…第一包絡邊界 145a.,.第一包絡邊界 150·.·第二邊界決定處理 器、處理器 155···第二包絡邊界 155a…第二包絡邊界 155b...另一第二包絡邊界 160…包絡數目處理器、數目 處理器 205.. .包絡資料 210.. .包絡計算器、包絡資料 計算器 300.. .編碼器 310.. .5.R相關模組 320…分析QMF組、子頻帶 QMF組 330…降取樣器 340.. .AAC核心編碼器、核心 編碼器 35〇…位元流酬載格式器 355...編碼音訊流 360…其它SBR模組 370…切換決策單元 371...切換決策信號 372…音訊編碼器 編碼部件 380…立體聲編碼單元 610…第一組樣本值、 樣本、樣本分佑 620···第二組樣本值、 樣本、樣本分你' 630··.第二組樣本值 640…第四組樣本值 31

Claims (1)

  1. 201007700 七、申請專利範圍: 1. 一種用於計算要由一頻帶複製(SBR)編碼器導出的一頻 譜包絡數目之裝置,其中該SBR編碼器適於使用自一初 始時間(t0)延伸到一最後時間(tn)之一 SBR訊框内的一 預定數目之後續時間部分中的多個樣本值來編碼一音 訊信號,該預定數目之後續時間部分按該音訊信號所給 定的一時間序列排列,該裝置包含: 一決策值計算器,其用於決定一決策值,該決策值 量測一對相鄰時間部分之頻譜能量分佈的一偏差; ® 一檢測器,其用於藉由該決策值檢測對一臨限的一 ‘ 違規; _ 一處理器(140),其用於在檢測到對該臨限的該違規 ' 時決定在該對相鄰時間部分間的一第一包絡邊界; 〃 一處理器(150),其用於針對具有該第一包絡邊界之 一包絡決定在一不同對相鄰時間部分間或在該初始時 間(tO)或在該最後時間(tn)之一第二包絡邊界,基於該另 一對的對該臨限之該違規或者基於在該SBR訊框中的 G 該對或該不同對之一時間位置;及 一數目處理器,其用於確立具有該第一包絡邊界及 該第二包絡邊界之頻譜包絡之該數目。 2. 如申請專利範圍第1項所述之裝置,其中該預定數目之 後續時間部分之一時間部分之一時間長度等於一最小 時間長度,針對該最小時間長度一單一包絡遭決定,及 其中該決策值計算器適於針對具有該最小時間長度之 32 201007700 兩相鄰時間部分計算一決策值。 3. 如申請專利範圍第1項或第2項所述之裝置,其中該第一 包絡邊界決定處理器適於在一第一獲檢測違規處確定 該第一邊界,及其中該第二包絡邊界決定處理器適於在 將至少一另一決策值與該臨限比較後確定該第二包絡 邊界。 4. 如申請專利範圍第3項所述之裝置,其進一步包含用於 提供額外旁側資訊之一資訊處理器,該額外旁側資訊包 〇 含在該音訊信號之該時間序列中之該第一包絡邊界及 - 該第二包絡邊界。 . 5.如前述申請專利範圍項中之任一項所述之裝置,其中該 * 檢測器適於以一時間順序研究相鄰時間部分間的該等 ' 邊界中的每個邊界。 6. 如申請專利範圍第1項或第2項所述之裝置,其中時間部 分之該預定數目等於η,在相鄰時間部分之間具有n_l 個邊界,該等邊界關於時間來編號與排序以使該等邊界 ❹ 包含偶數及奇數邊界,且其中該數目處理器適於如果該 檢測器在一奇數邊界檢測到該違規則確立η為該頻譜包 絡數目。 7. 如申請專利範圍第6項所述之裝置,其中該檢測器適於 首先在奇數邊界上檢測該違規。 8. 如前述申請專利範圍項中之任一項所述之裝置,其中該 檢測器適於決定該第二邊界以使該等頻譜包絡包含一 相同的時間長度且該頻譜包絡數目是二的冪次。 33 201007700 9. 如申請專利範圍第8項所述之裝置,其中該預定數目等 於8,且其中該數目處理器適於確立該頻譜包絡數目為 1、2、4或8以使該等頻譜包絡中的每個頻譜包絡包含一 相同的時間長度。 10. 如申請專利範圍第8項或第9項所述之裝置,其中該檢測 器適於使用一臨限,該臨限視該違規的一時間位置而 定,以使在產生一較大數目之頻譜包絡之一時間位置比 產生一較小數目之頻譜包絡之一時間位置使用一較高 的臨限。 參 11. 如前述申請專利範圍項中之任一項所述之裝置,其進一 , 步包含具有一暫態臨限之一暫態檢測器,該暫態臨限大 _ 於該臨限及/或進一步包含一包絡資料計算器,該包絡 ‘ 資料計算器適於針對自該第一包絡邊界延伸到該第二 - 包絡邊界之一頻譜包絡計算頻譜包絡資料。 12. 如前述申請專利範圍項中之一項所述之裝置,其進一步 包含遭組配以提供一切換決策信號之一切換決策單 元,該切換決策信號發信號通知一類似語音的音訊信號 © 及一類似一般音訊的音訊信號,其中該檢測器適於降低 針對類似語音音訊信號的該臨限。 13. —種用於編碼一音訊信號之編碼器,其包含: 一核心編碼器,其用於編碼在一核心頻帶内的該音 訊信號; 如申請專利範圍第1至12項中的任一項所述之用於 計算一頻譜包絡數目之一裝置;及 34 201007700 一包絡資料計算器,其用於根據該音訊信號及該數 目計算包絡資料。 14. 一種用於計算要由一頻帶複製(sbr)編碼器導出的一頻 譜包絡數目之方法,其中該SBR編碼器適於使用自一初 始時間(to)延伸到一最後時間(tn)之一 SBR訊框内的一 預定數目之後續時間部分中之多個樣本值來編碼一音 訊信號,該預定數目之後續時間部分按該音訊信號所給 定的一時間序列排列,該方法包含以下步驟: 決定一決策值’該決策值量測一對相鄰時間部分之 頻譜能量分佈的一偏差; 藉由該決策值來檢測對一臨限的一違規; 在檢測到對該臨限的該違規時決定在該對相鄰時 間部分間的一第一包絡邊界; 針對具有該第一包絡邊界之一包絡,決定在一不同 對相鄰時間部分間或在該初始時間(tO)或在最後時間(tn) 之一第二包絡邊界,基於該另一對的對該臨限的該違規 或基於在該SBR訊框中的該對或該不同對之一時間位 置;及 確立具有該第一包絡邊界及該第二包絡邊界之頻 譜包絡的該數目。 15. 一種當在〆處理器上執行時用於執行如申請專利範圍 第14項所述之方法之電腦知式。 35
TW098122397A 2008-07-11 2009-07-02 用於計算頻譜包絡數目之裝置與方法 TWI415114B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US7984108P 2008-07-11 2008-07-11
PCT/EP2009/004523 WO2010003546A2 (en) 2008-07-11 2009-06-23 An apparatus and a method for calculating a number of spectral envelopes

Publications (2)

Publication Number Publication Date
TW201007700A true TW201007700A (en) 2010-02-16
TWI415114B TWI415114B (zh) 2013-11-11

Family

ID=40902067

Family Applications (2)

Application Number Title Priority Date Filing Date
TW098122397A TWI415114B (zh) 2008-07-11 2009-07-02 用於計算頻譜包絡數目之裝置與方法
TW098122396A TWI415115B (zh) 2008-07-11 2009-07-02 用以產生帶寬擴展輸出資料之裝置與方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
TW098122396A TWI415115B (zh) 2008-07-11 2009-07-02 用以產生帶寬擴展輸出資料之裝置與方法

Country Status (19)

Country Link
US (2) US8296159B2 (zh)
EP (2) EP2301027B1 (zh)
JP (2) JP5551694B2 (zh)
KR (5) KR101278546B1 (zh)
CN (2) CN102144259B (zh)
AR (3) AR072552A1 (zh)
AU (2) AU2009267532B2 (zh)
BR (2) BRPI0910523B1 (zh)
CA (2) CA2730200C (zh)
CO (2) CO6341676A2 (zh)
ES (2) ES2398627T3 (zh)
IL (2) IL210196A (zh)
MX (2) MX2011000367A (zh)
MY (2) MY155538A (zh)
PL (2) PL2301027T3 (zh)
RU (2) RU2487428C2 (zh)
TW (2) TWI415114B (zh)
WO (2) WO2010003546A2 (zh)
ZA (2) ZA201009207B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI576827B (zh) * 2012-04-27 2017-04-01 Ntt Docomo Inc Sound decoding device
TWI820529B (zh) * 2020-12-08 2023-11-01 聯發科技股份有限公司 揚聲器的信號處理方法和揚聲器電路

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9177569B2 (en) 2007-10-30 2015-11-03 Samsung Electronics Co., Ltd. Apparatus, medium and method to encode and decode high frequency signal
PL2545551T3 (pl) 2010-03-09 2018-03-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Poprawiona charakterystyka amplitudowa i zrównanie czasowe w powiększaniu szerokości pasma na bazie wokodera fazowego dla sygnałów audio
PL2532002T3 (pl) 2010-03-09 2014-06-30 Fraunhofer Ges Forschung Urządzenie, sposób i program komputerowy do przetwarzania sygnału audio
SG183967A1 (en) 2010-03-09 2012-10-30 Fraunhofer Ges Forschung Apparatus and method for processing an input audio signal using cascaded filterbanks
MX2012011802A (es) * 2010-04-13 2013-02-26 Fraunhofer Ges Forschung Metodo y codificador y descodificador para la presentacion precisa de muestra de una señal de audio.
WO2011128399A1 (en) * 2010-04-16 2011-10-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V. Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension
JP6075743B2 (ja) * 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5743137B2 (ja) 2011-01-14 2015-07-01 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5633431B2 (ja) * 2011-03-02 2014-12-03 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
EP2788979A4 (en) 2011-12-06 2015-07-22 Intel Corp LOW POWER SPEECH RECOGNITION
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
KR101629661B1 (ko) * 2012-08-29 2016-06-13 니폰 덴신 덴와 가부시끼가이샤 복호 방법, 복호 장치, 프로그램 및 그 기록매체
EP2709106A1 (en) * 2012-09-17 2014-03-19 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating a bandwidth extended signal from a bandwidth limited audio signal
EP2717263B1 (en) * 2012-10-05 2016-11-02 Nokia Technologies Oy Method, apparatus, and computer program product for categorical spatial analysis-synthesis on the spectrum of a multichannel audio signal
CN110853667B (zh) 2013-01-29 2023-10-27 弗劳恩霍夫应用研究促进协会 音频编码器
JP6181773B2 (ja) * 2013-01-29 2017-08-16 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン Celp状コーダのためのサイド情報を用いないノイズ充填
KR101762225B1 (ko) 2013-01-29 2017-07-28 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 에너지 제한 작업을 이용하여 주파수 향상 신호를 발생시키는 장치 및 방법
ES2934646T3 (es) 2013-04-05 2023-02-23 Dolby Int Ab Sistema de procesamiento de audio
KR102243688B1 (ko) 2013-04-05 2021-04-27 돌비 인터네셔널 에이비 인터리브된 파형 코딩을 위한 오디오 인코더 및 디코더
PT3008726T (pt) 2013-06-10 2017-11-24 Fraunhofer Ges Forschung Aparelho e método de codificação, processamento e descodificação de envelope de sinal de áudio por modelação da representação de soma cumulativa empregando codificação e quantização de distribuição
ES2635026T3 (es) 2013-06-10 2017-10-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento de codificación, procesamiento y decodificación de envolvente de señal de audio por división de la envolvente de la señal de audio utilizando cuantización y codificación de distribución
KR20170124590A (ko) * 2013-06-21 2017-11-10 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 에너지 조정 모듈을 갖는 대역폭 확장 모듈을 구비한 오디오 디코더
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
EP3028274B1 (en) * 2013-07-29 2019-03-20 Dolby Laboratories Licensing Corporation Apparatus and method for reducing temporal artifacts for transient signals in a decorrelator circuit
US9666202B2 (en) * 2013-09-10 2017-05-30 Huawei Technologies Co., Ltd. Adaptive bandwidth extension and apparatus for the same
SG11201602234YA (en) 2013-12-02 2016-05-30 Huawei Tech Co Ltd Encoding method and apparatus
EP2980801A1 (en) * 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for estimating noise in an audio signal, noise estimator, audio encoder, audio decoder, and system for transmitting audio signals
US10120067B2 (en) 2014-08-29 2018-11-06 Leica Geosystems Ag Range data compression
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI771266B (zh) * 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US9837089B2 (en) * 2015-06-18 2017-12-05 Qualcomm Incorporated High-band signal generation
US10847170B2 (en) 2015-06-18 2020-11-24 Qualcomm Incorporated Device and method for generating a high-band signal from non-linearly processed sub-ranges
JP6412292B2 (ja) * 2016-01-22 2018-10-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法
CN105513601A (zh) * 2016-01-27 2016-04-20 武汉大学 一种音频编码带宽扩展中频带复制的方法及装置
EP3288031A1 (en) 2016-08-23 2018-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding an audio signal using a compensation value
US10825467B2 (en) * 2017-04-21 2020-11-03 Qualcomm Incorporated Non-harmonic speech detection and bandwidth extension in a multi-source environment
US10084493B1 (en) * 2017-07-06 2018-09-25 Gogo Llc Systems and methods for facilitating predictive noise mitigation
US20190051286A1 (en) * 2017-08-14 2019-02-14 Microsoft Technology Licensing, Llc Normalization of high band signals in network telephony communications

Family Cites Families (45)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6134518A (en) * 1997-03-04 2000-10-17 International Business Machines Corporation Digital audio signal coding using a CELP coder and a transform coder
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
RU2256293C2 (ru) * 1997-06-10 2005-07-10 Коудинг Технолоджиз Аб Усовершенствование исходного кодирования с использованием дублирования спектральной полосы
RU2128396C1 (ru) * 1997-07-25 1999-03-27 Гриценко Владимир Васильевич Способ передачи и приема информации и устройство для его осуществления
ATE302991T1 (de) * 1998-01-22 2005-09-15 Deutsche Telekom Ag Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
US6618701B2 (en) 1999-04-19 2003-09-09 Motorola, Inc. Method and system for noise suppression using external voice activity detection
US6782360B1 (en) * 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US6901362B1 (en) * 2000-04-19 2005-05-31 Microsoft Corporation Audio segmentation and classification
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004187D0 (sv) 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7941313B2 (en) * 2001-05-17 2011-05-10 Qualcomm Incorporated System and method for transmitting speech activity information ahead of speech features in a distributed voice recognition system
US6658383B2 (en) * 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
EP1423847B1 (en) 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
KR100711280B1 (ko) 2002-10-11 2007-04-25 노키아 코포레이션 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치
JP2004350077A (ja) * 2003-05-23 2004-12-09 Matsushita Electric Ind Co Ltd アナログオーディオ信号送信装置および受信装置並びにアナログオーディオ信号伝送方法
SE0301901L (sv) 2003-06-26 2004-12-27 Abb Research Ltd Metod för att diagnostisera utrustningsstatus
EP1672618B1 (en) * 2003-10-07 2010-12-15 Panasonic Corporation Method for deciding time boundary for encoding spectrum envelope and frequency resolution
KR101008022B1 (ko) * 2004-02-10 2011-01-14 삼성전자주식회사 유성음 및 무성음 검출방법 및 장치
KR20060132697A (ko) * 2004-02-16 2006-12-21 코닌클리케 필립스 일렉트로닉스 엔.브이. 트랜스코더 및 트랜스코딩 방법
CA2457988A1 (en) 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
ATE467204T1 (de) 2004-06-28 2010-05-15 Abb Research Ltd System und verfahren zum unterdrücken redundanter alarme
ATE429698T1 (de) * 2004-09-17 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung von bandbegrenzten tonsignalen
US7715573B1 (en) * 2005-02-28 2010-05-11 Texas Instruments Incorporated Audio bandwidth expansion
KR100803205B1 (ko) * 2005-07-15 2008-02-14 삼성전자주식회사 저비트율 오디오 신호 부호화/복호화 방법 및 장치
JP5089394B2 (ja) * 2005-09-30 2012-12-05 パナソニック株式会社 音声符号化装置および音声符号化方法
KR100647336B1 (ko) 2005-11-08 2006-11-23 삼성전자주식회사 적응적 시간/주파수 기반 오디오 부호화/복호화 장치 및방법
US7546237B2 (en) * 2005-12-23 2009-06-09 Qnx Software Systems (Wavemakers), Inc. Bandwidth extension of narrowband speech
JP5117407B2 (ja) * 2006-02-14 2013-01-16 フランス・テレコム オーディオ符号化/復号化で知覚的に重み付けするための装置
EP1852849A1 (en) 2006-05-05 2007-11-07 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US20070282803A1 (en) * 2006-06-02 2007-12-06 International Business Machines Corporation Methods and systems for inventory policy generation using structured query language
US8532984B2 (en) * 2006-07-31 2013-09-10 Qualcomm Incorporated Systems, methods, and apparatus for wideband encoding and decoding of active frames
EP2062255B1 (en) 2006-09-13 2010-03-31 Telefonaktiebolaget LM Ericsson (PUBL) Methods and arrangements for a speech/audio sender and receiver
US8417532B2 (en) * 2006-10-18 2013-04-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Encoding an information signal
JP4918841B2 (ja) * 2006-10-23 2012-04-18 富士通株式会社 符号化システム
US8639500B2 (en) 2006-11-17 2014-01-28 Samsung Electronics Co., Ltd. Method, medium, and apparatus with bandwidth extension encoding and/or decoding
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
WO2008151408A1 (en) * 2007-06-14 2008-12-18 Voiceage Corporation Device and method for frame erasure concealment in a pcm codec interoperable with the itu-t recommendation g.711
KR101373004B1 (ko) * 2007-10-30 2014-03-26 삼성전자주식회사 고주파수 신호 부호화 및 복호화 장치 및 방법
WO2009081315A1 (en) 2007-12-18 2009-07-02 Koninklijke Philips Electronics N.V. Encoding and decoding audio or speech
EP2077551B1 (en) 2008-01-04 2011-03-02 Dolby Sweden AB Audio encoder and decoder
WO2009110738A2 (ko) * 2008-03-03 2009-09-11 엘지전자(주) 오디오 신호 처리 방법 및 장치
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI576827B (zh) * 2012-04-27 2017-04-01 Ntt Docomo Inc Sound decoding device
US9761240B2 (en) 2012-04-27 2017-09-12 Ntt Docomo, Inc Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US10068584B2 (en) 2012-04-27 2018-09-04 Ntt Docomo, Inc. Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US10714113B2 (en) 2012-04-27 2020-07-14 Ntt Docomo, Inc. Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
US11562760B2 (en) 2012-04-27 2023-01-24 Ntt Docomo, Inc. Audio decoding device, audio coding device, audio decoding method, audio coding method, audio decoding program, and audio coding program
TWI820529B (zh) * 2020-12-08 2023-11-01 聯發科技股份有限公司 揚聲器的信號處理方法和揚聲器電路
US11811686B2 (en) 2020-12-08 2023-11-07 Mediatek Inc. Packet reordering method of sound bar

Also Published As

Publication number Publication date
CA2730200A1 (en) 2010-01-14
CN102089817B (zh) 2013-01-09
CN102144259A (zh) 2011-08-03
TWI415115B (zh) 2013-11-11
AR072552A1 (es) 2010-09-08
KR20130095840A (ko) 2013-08-28
US20110202358A1 (en) 2011-08-18
BRPI0910523B1 (pt) 2021-11-09
EP2301028A2 (en) 2011-03-30
BRPI0910517B1 (pt) 2022-08-23
EP2301028B1 (en) 2012-12-05
AR072480A1 (es) 2010-09-01
PL2301027T3 (pl) 2015-09-30
WO2010003544A1 (en) 2010-01-14
KR101395257B1 (ko) 2014-05-15
TW201007701A (en) 2010-02-16
AU2009267532B2 (en) 2013-04-04
RU2011101617A (ru) 2012-07-27
CA2729971C (en) 2014-11-04
BRPI0910517A2 (pt) 2016-07-26
US8612214B2 (en) 2013-12-17
MX2011000367A (es) 2011-03-02
KR20130095841A (ko) 2013-08-28
ZA201100086B (en) 2011-08-31
ES2539304T3 (es) 2015-06-29
IL210196A0 (en) 2011-03-31
IL210196A (en) 2015-10-29
MX2011000361A (es) 2011-02-25
AR097473A2 (es) 2016-03-16
EP2301027A1 (en) 2011-03-30
JP2011527450A (ja) 2011-10-27
CN102144259B (zh) 2015-01-07
AU2009267530A1 (en) 2010-01-14
CA2730200C (en) 2016-09-27
RU2487428C2 (ru) 2013-07-10
KR20110038029A (ko) 2011-04-13
EP2301027B1 (en) 2015-04-08
KR101395250B1 (ko) 2014-05-15
US8296159B2 (en) 2012-10-23
CA2729971A1 (en) 2010-01-14
MY153594A (en) 2015-02-27
JP2011527448A (ja) 2011-10-27
CN102089817A (zh) 2011-06-08
KR101278546B1 (ko) 2013-06-24
IL210330A0 (en) 2011-03-31
WO2010003546A3 (en) 2010-03-04
HK1156141A1 (zh) 2012-06-01
CO6341677A2 (es) 2011-11-21
ZA201009207B (en) 2011-09-28
CO6341676A2 (es) 2011-11-21
JP5551694B2 (ja) 2014-07-16
KR20130033468A (ko) 2013-04-03
US20110202352A1 (en) 2011-08-18
RU2011103999A (ru) 2012-08-20
TWI415114B (zh) 2013-11-11
AU2009267532A1 (en) 2010-01-14
KR101345695B1 (ko) 2013-12-30
MY155538A (en) 2015-10-30
KR101395252B1 (ko) 2014-05-15
BRPI0910523A2 (pt) 2020-10-20
WO2010003546A2 (en) 2010-01-14
RU2494477C2 (ru) 2013-09-27
ES2398627T3 (es) 2013-03-20
PL2301028T3 (pl) 2013-05-31
KR20110040820A (ko) 2011-04-20
AU2009267532A8 (en) 2011-03-17
HK1156140A1 (zh) 2012-06-01
JP5628163B2 (ja) 2014-11-19

Similar Documents

Publication Publication Date Title
TW201007700A (en) An apparatus and a method for calculating a number of spectral envelopes
AU2003233724B2 (en) Method and device for efficient frame erasure concealment in linear predictive based speech codecs
EP3288026B1 (en) Audio decoder and method for providing a decoded audio information using an error concealment based on a time domain excitation signal
Lecomte et al. Packet-loss concealment technology advances in EVS
TW200912897A (en) Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
TW201250671A (en) Audio codec using noise synthesis during inactive phases
CN107077851A (zh) 使用用于增强隐藏的参数对音频内容进行编码和解码的编码器、解码器和方法
CN102272831A (zh) 基于峰值检测的选择性缩放掩码计算
CA2659197A1 (en) Time-warping frames of wideband vocoder
BR112018067944B1 (pt) Unidade de ocultação de erro, método de ocultação de erro,decodificador de áudio, codificador de áudio, método para fornecer uma representação de áudio codificada e sistema
US20230206930A1 (en) Multi-channel signal generator, audio encoder and related methods relying on a mixing noise signal
Sinder et al. Recent speech coding technologies and standards
HK1156140B (zh) 用於计算频谱包络数目的装置和方法
HK1251710B (zh) 音频解码器以及利用基於时域激励信号的误码掩盖来提供解码的音频信息的方法
HK1227541B (zh) 用於使用基於时域激励信号的错误隐藏来提供解码音频信息的音频解码器及方法
HK1227541A1 (zh) 用於使用基於时域激励信号的错误隐藏来提供解码音频信息的音频解码器及方法
HK1076907B (zh) 用於在基於线性可预见的语音代码内的有效的帧擦除的方法和装置
HK1076907A (zh) 用於在基於线性可预见的语音代码内的有效的帧擦除的方法和装置