[go: up one dir, main page]

TW201009807A - Audio signal synthesizer and audio signal encoder - Google Patents

Audio signal synthesizer and audio signal encoder Download PDF

Info

Publication number
TW201009807A
TW201009807A TW098122891A TW98122891A TW201009807A TW 201009807 A TW201009807 A TW 201009807A TW 098122891 A TW098122891 A TW 098122891A TW 98122891 A TW98122891 A TW 98122891A TW 201009807 A TW201009807 A TW 201009807A
Authority
TW
Taiwan
Prior art keywords
signal
audio signal
frequency band
spectral
frequency
Prior art date
Application number
TW098122891A
Other languages
English (en)
Other versions
TWI441162B (zh
Inventor
Frederik Nagel
Sascha Disch
Nikolaus Rettelbach
Max Neuendorf
Bernhard Grill
Ulrich Kraemer
Stefan Wabnik
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=41120013&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=TW201009807(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of TW201009807A publication Critical patent/TW201009807A/zh
Application granted granted Critical
Publication of TWI441162B publication Critical patent/TWI441162B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

201009807 六、發明說明: 【發明所屬技術領域】 本發明有關於用於產生一合成音訊信號的—音訊信號 合成器、一音訊信號編碼器及包含一經編碼音訊信號的— 資料流。 t先前;j 自然的音訊編碼及語音編碼是音訊信號編解碼的兩個 主要類別。自然的音訊編碼器通常用於在中位元率下的音 樂或任意信號且大體上提供寬音訊頻寬。語音編碼器基本 上限於語音複製且可在極低位元率下使用。寬頻語音在窄 帶語音上提供一主要的主觀品質改良。增加該頻寬不僅改 良了語音的自然度,而且改良了該揚聲器的辨識及可懂 性。因而寬頻語音編碼在下一代的電話系統中將是一重要 的課題。而且,由於多媒體領域的極大發展,音樂及其他 _ 號在電5舌系統以及儲存上的高品質的傳輸及對於 例如無線電/電視(τν)傳輸或其他廣播系統上的傳輸是— 想要的特性。 為了大量地減小位元率,源編碼可使用分帶感知音訊 編解碼H來執行。此等自然音訊編解碼在該信射採用感 头不相關及統叶冗餘。關於所給定的位元率限制,僅單單 利用上述;^不足的,取樣率會被減小。通常也降低合成位 準的量,允許偶爾可聽見的量化失真,且透過二或更多個 通道的聯合立體聲編碼或參數編碼使立料場退化。此等 方法的過多使科致惱人的感知下降。為了改良該編碼性 3 201009807 能’諸如頻譜帶複製(SBR)的頻帶擴展方法作為用以在— (鬲頻重建)式編解碼中產生高頻信號的一有效方法。 在複製該等高頻信號過程中,某一轉換可用於例如低 頻信號且4等經轉換的信號接著作為高頻信號予以插入。 此過程還被稱為修補且可使用不同的轉換。MPEG-4音訊 仏準對所有音訊信號僅使用了 —種修補演算法。因此,其 、乏使該修補適應於不同的信號或編碼方案的靈活性。 另—方面,該MPEG-4標準提供對再生高頻帶的一複 雜處理I中用了許多重要的SBR參數。此等重要的SBR 參數是頻譜包封的資料、用於增加於該再生頻譜部分的雜 訊基準的貝料、使該再生高頻之音調適應於該原始高頻之 音調的反濾波工具的資訊及額外的頻譜帶複製處理資料 (諸如缺漏諧波的資料)等。在濾波器組域内對由連續帶通信 號之一修補所提供之經複製的頻譜的既定處理被證實可有 效地提供鬲品質且在關於處理功率、記憶體需求及功率需 求的合理資源下可實施。 另一方面,如同該經修補信號的另一處理的發生,修 補發生在同一濾波器組中,所以在該修補操作與該修補操 作之結果的另一處理之間具有極大關係。因而,在此結合 的方法中,不同修補演算法的實施是有問題的。 第WO 98/57436號案揭露了用於與頻譜包封調整相結 合之頻譜帶複製中的換位方法。 第WO 02/052545號案教示了信號可被分類為似脈衝 列或似非脈衝列,且基於此分類一適應的切換換位器予以 201009807
提出。該切換換位器平行地執行二修補演算法,且一混合 單元依據該分類(脈衝列或非脈衝列)合併二經修補的信 號。在該等換位器之間的實際切換或混合根據包封及控制 資料執行於一包封調整濾波器組中。另外,對於似脈衝列 組、號,該基帶信號轉換至一濾波器組域内,一頻率變換 操作被執行且該頻率變換之結果的一包封調整被執行。這 疋結合修補/進一步—處理的方法。對於似非脈衝列信號, -頻域換位||(FD換位H)被提供且該頻域換㈣的結果接 著被轉換為該濾波器組域,其巾該包封酿獲執行。因而, 一方面具有結合修補/進一步一處理的方法,且在另一方面 具有位於t、該包封調整發生之該渡波器組外的—頻域換位 器的實現及雜對於彈性及實現的可能性是有問題的。 【發^明内容^】 本發明的一目的是提供一提供改良的品質且允許有效 實施的合成器。 此目的藉由根據申請專利範圍第1項之該合成器、根 據申清專利範圍第9項之—編碼ϋ、根據申請專利範圍第 生—合成音訊健的-方法或根據申請專利 a $之用於產生一資料流的-方法來實現。 =發明是基於—方面該修補操作及另—方面該修補操 這:一:的另二處理必須完全地在獨立域中執行的發現。 s 在修補發生器内最佳化不同的修補演算法, ==本因的修補演算法是什麼總是使用同-包 生因而,在該頻譜域(其中該包封調整發 5 201009807 生)之外任何經修補之信號的產生允許完全地獨立於後續 SBR之另-處理將不同的修補演算法應用於不同的信號部 分’且設計者不必考慮來自包封調整的修補演算法的細節 或不必考慮某-包封調整之修補演算法的細節。相反地, 頻谱帶複製的不同成分,即—方面該修讎作及另一方面 該修補結果的另-操作可相互獨立地料執行。這意味著 在整個頻譜帶複製巾,修補演算法單獨地予域行,而具 有修補及料咖_可相立地予以最佳化的結 果’且因1^對於未來的修補演算法等是有雜的,該等修 補演算法可容易地予以應用而不用改變在__頻譜域中(其 中未發生任何修補)所執行之轉補結果之另—處理的任 何參數。 因為其允許將不同的修補演算法容易地應用於信號部 分’使得該基帶信號的每-信號部分由以最佳方式適於此 信號部分的修補演算法來修補,所以本發明提供一改良的 。《質另外’仍可使肖操作於攄波器組巾且既定及已經存 在於諸如該MPEG-4 ΗΕ·ΑΑ(:之許多應財的直接、有效 且尚品質的包封調整H過將該等修補演算法與進一 步的處理分離,使得沒有修_算法應用於供該修補結果 之進-步處理執行的該纽⑽域巾,該修補結果之既定 的進-步處料應用於所有可得的修補演算法巾。然而, 可取捨地,雜補也可在域波驗及其他域巾予以執行。 另外’因為對於低階的應用可使用要求較少資源的修 補演算法,而對於高階的應时㈣要求較多資源的修補 201009807 演算法,這產生一較好的立 縮放性。可選擇地,該^ j 此特徵提供了可 社、 “ >補演算法可保持相㈤’但該修 、、’。果之進-步處理的複雜性可適用 於不同的需要I例
2對於低階的制,可用該頻譜包封調整之-降低的頻 =析度’而對於高階的應用,可用提供—較好品質的一 =率解析度’但也需要增加記憶體、處理器及電力 =耗的貝源,特別在移動裝置中。因為該修補卫呈不依賴 包封調整工具,且相反亦然,所以所有這些可不 愈透^應之其他工具而予以完成。相反地,該修補產生 與透過糟由諸如一減油μ & 叫^、及轉換為一頻譜表示之該經修補 之原始資料的處理的分離已證實為_最佳的特徵。 =本發明之一第—層面,一音訊信號合成器產生具 頻帶及源於該第—頻帶之—第二經合成頻帶的一 訊信號。該音訊信號合成器包含-修補產生器、一 ^曰轉換器、-原始信號處理器及一結合器。該修補產生 ^行至少二個不同的修補演算法,其中每—修補演算法 $楚有該帛帛帶中之信號成分的一音訊信號產生具有 =第二經合成頻帶中之信號成分的一原始信號。該修補產 I "一適用於祕帛—時間部分的—控制資訊選擇該等至 =二個不同修補演料之—個且根財同於該第 一時間部 刀之-第二時間部分的該控制資訊選擇該等至少二個不同 修補演算法之另一個’以獲得該第-及該第二時間部分的 2信號。該頻譜轉換器將該原始信號轉換為一原始信號 '表示該原始彳5號處理II根據頻譜域頻譜帶複製參數 201009807 處理該原始信號頻譜表示以獲得一經調整的原始信號頻譜 表示。該結合器將具有該第一頻帶中之信號成分的一音訊 信號或源於該音訊信號的一信號與該經調整之原始信號頻 譜表示或與源於該經調整之原始信號頻譜表示的另一信號 相結合以獲得該合成音訊信號。 在另一實施例中,該音訊信號合成器受組配使得該等 至少二個修補演算法因為在該第一頻帶中之一頻率下該音 訊信號的一信號成分被修補為該第二頻帶中的一目標頻率 且目標頻率對於二修補演算法有所不同而相互不同。該修 補產生器可更適用於對於二修補演算法均操作於時域中。 根據本發明之另一層面,一音訊信號編碼器由一音訊 信號產生包含在一第一頻帶中該音訊信號的成分、控制資 訊及頻譜帶複製參數的一資料流。該音訊信號編碼器包含 一頻率選擇濾波器、一產生器及一控制資訊產生器。該頻 率選擇濾波器產生在該第一頻帶中該音訊信號的成分。該 產生器由在一第二頻帶中該音訊信號的成分產生該頻譜帶 複製參數。該控制資訊產生器產生該控制資訊,該控制資 訊從一第一或一第二不同修補演算法中識別一較佳修補演 算法。每一修補演算法使用在該第一頻帶中該音訊信號的 成分產生具有在該第二經複製頻帶中之信號成分的一原始 信號。 根據本發明之又一層面,於連接於一電腦之一傳輸線 上傳輸的一音訊信號位元流,包含在該第一頻帶中一經編 碼之音訊信號、控制資訊及該等頻譜帶複製參數。 201009807 因而’本發明與用於在頻譜帶複製中不同修補演算法 之間之切換的-方法相關,其中所使用的修補演算法在編 碼器端依據該編碼輯做出的—決定而定,且在解碼器端 依據該位元流巾所傳輸的資訊料。透過使用—頻譜帶複 製(SBR),該等高頻成分的產生可例如透過將_ qmf慮波 器組_F=正㈣«波㈣的低龍號成純製於高 頻帶上來完成。此複製也可稱為修補且根據本發明之實施 例,此修補也可由操作於時域切可選擇的方法來替代或 補充。該等可選擇的修補演算法的範例是: (1) .提升取樣(例如透過該頻譜之鏡像); (2) · 相位音訊編碼器; (3) . 非線性失真; ⑷.在該QMF域中透過改變該_頻帶次序鏡像 該頻譜; (5) .模型驅動(特別地對於語音);及 (6) . 調變 該等可選擇的修補演算法也可於該編碼器中執行,以 獲得由例如SBR卫㈣使用的如雜轉充、城波、遺漏 諸波等的該等㈣帶複製參數。根據實施例,在—修補產 生器内的該修補演算法被替代而仍❹鱗剩餘的頻譜帶 複製工具。 修補演算法的具體選擇依據所施予之音訊信號而定。 例如’該相位音訊編碼器極度地改變語音信號的特徵,且 因而該相位音訊編—謂例如語音或賴音信號提供一 201009807 適當的修補演算法。因此,依據該音訊信號類型,一修補 產生器從用於產生該高頻帶之修補的不同可能性中選擇一 修補演算法。例如,該修補產生器可在該習知的SBR工具 (QMF頻帶的複製)與該相位音訊編碼器或任何其他修補演 算法之間切換。 相較於該習知的SBR實施(例如實施於MPEG-4中), 本發明之實施例從而使用用於產生高頻信號的修補產生 器。該修補產生器不僅可操作於該頻率中,而且可操作於 時域中且如下執行修補演算法:鏡像及/或提升取樣及/或一 相位音訊編碼器及/或非線性失真。該頻譜帶複製是否在該 頻域或在該時域中完成,依據具體信號(即其是信號可適應) 而定’下面將詳細解釋。 頻譜帶複製依賴於此事實:對於許多目的,僅傳輸在 一核心頻帶内的一音訊信號且在該解碼器中產生在該較高 頻帶中的信號成分是足夠的。因為例如對於語音及音樂, 高頻率成分通常與在該核心頻帶中的該等低頻帶成分具有 一相關性,所以產生的音訊信號將仍維持一高的感知品 質。因而,透過使用產生遺漏高頻成分的—適當的修補演 算法,可能獲得高感知品質的一音訊信號。同時,因為僅 在該核心頻帶内的音訊信號被壓縮編碼且傳輸至該解褐 器’所以該等較高頻帶的參數驅動產生導致該位元率顯著 降低以編碼一音訊信號。對於該等剩餘的頻率成分,僅傳 輸在產生該原始尚頻帶#號之一估计的過程中控制該解碼 器的控制資訊及頻譜帶複製參數。所以,嚴格來說,這一 201009807 過程包括三層面:⑴參數HF帶的估計(SBR參數的計算), (11)該原始修補的產生(實際修補)及(iii)進一步一處理的提 供(例如雜訊基準調整)。 該核心頻帶可由所謂的交越頻率來定義,其定義了該 頻帶内之一臨界值,且最高至到臨界值,該音訊信號之編
碼被執行。該核心編碼器編碼在由該交越頻率所限制之該 核〜頻帀内的該音訊信號。開始於該交越頻率,該等信號 成分將由該頻譜帶複製產生。在使用用於該頻譜帶複製之 %知的方法中,通常發生一些信號在該核心編碼器之交越 頻率處包含不必要的缺陷。 处礴便用本發明之實施例,1恥列疋丁啊 或至少以不具有一感知影響之方式修改此等缺陷的修補 决算法。例如,透過使用鏡像作為時域中的修補演算法, ”亥頻na帶複製相似於AMR_WB+ _鮮擴展(BWE)(擴展 自適應多率寬頻編解碼)予以執行。此外,依據該信號改變 該修補演算法的可能性提供了有例如對於語音及音樂使用 不同的頻帶擴展的可能。但找於不能明確地識別之如音 樂或扣曰(即齡信號)的—信號,該修補演算法可在短時間 I、又例如對於任何給定的時間區段,一較佳的 器异去可用於修補。此較佳的修補演算法可由該編碼 二方塊·資料 竽立 &唬進仃比較。這顯著地改良了由 成11所產生之生成音訊錢的感知品質。 明的另—優點在於將該修補產生器與可包含標準 11 201009807 SBR工具之該原始信號處理器分離。由於此分離,可使用 可包含一反濾波、增加一雜訊基準或遺漏諧波或其他的通 常的SBR工具。因而,該等標準的SBR工具仍可使用而該 修補可彈性地予以調整。此外,因為該等標準的SBR工具 使用於頻域中,將該修補產生器與該等SBR工具分離,所 以允許該修補在該頻域中或在該時域中計算。 圖式簡單說明 本發明將透過舉例說明來予以描述。參照下面的詳細 描述,以及參照附加圖式,本發明的特徵將更容易予以理 解及明白,其中: 第1圖顯示根據本發明之實施例,一音訊信號處理的 一方塊圖; 第2圖顯示根據實施例,該修補產生器的一方塊圖; 第3圖顯示操作於該時域中的該結合器的一方塊圖; 第4a至4d圖示意地繪示不同修補演算法的範例; 第5a至5b圖繪示該相位語音編碼器及透過複製的該 修補; 第6a至6d圖顯示用於處理該經編碼音訊流以輸出 PCM取樣的方塊圖;及 第7a至7c圖顯示根據另一實施例之一音訊編碼器的 方塊圖。 I:實施方式3 本發明之詳細描述 下面的實施例僅是對用於改良例如與一音訊解碼器一 12 201009807 同使用之頻4帶複製的本發明之原理的說明性描述。應理 解的是在此所描述之安排及細節的修改及變化對於在該技 藝中具有通常知識者而言是清楚的。因而,其不打算由透 過在此對實施例的描述及解釋所呈現的特定細節而被限 制。 第1圖顯不用於產生具有一第一頻帶及源於該第一頻 帶之一第二經複製之頻帶的一合成音訊信號105的一音訊 信號合成器。該音訊合成器包含用於執行至少二個不同修 補演算法的一修補產生器110,其中每一修補演算法使用具 有在該第一頻帶中之信號成分的該音信信號105產生具有 在該第二經複製之頻帶中之信號成分的一原始信號115。該 修補產生器110適用於根據一第一時間部分的一控制資訊 112選擇至少二個不同修補演算法中之一個,且根據不同於 該第一時間部分之一第二時間部分的控制資訊112選擇該 等至少二個不同修補演算法之另一個,以獲得該第一及該 第二時間部分下的原始信號115。該音訊信號合成器更包含 用於將該原始信號115轉換為包含在一第一子帶、一第二 子帶等中之成分的一原始頻譜表示125的一頻譜轉換器 120。該音訊信號合成器更包含用於根據頻譜域頻譜帶複製 參數132處理該原始頻譜表示125以獲得一經調整之原始 信號頻譜表示135的原始信號處理器130。該音訊信號合成 器更包含用於將具有該第一頻帶中之信號成分的該音訊信 號105或源於該音訊信號1〇5之一信號與該經調整之原始 信號頻譜表示135或與源於該經調整之原始信號頻讀表示 13 201009807 135的另一信號相結合以獲得該合成音訊信號145的一結 合器140。 在另一呰實施例中,該結合器140適用於使用如源於 該音訊信號1〇5的彳s號該原始彳&號頻譜表示125。由該結合 器所使用之源於該音訊信號的該信號也可是由諸如一分析 濾波器組之時間/頻δ眷轉換器所處理的音訊信號或由操 作於時域中或頻譜域中的一修補產生器所產生的一低頻帶 信號或一經延遲的信號或透過一提升取樣操作處理過的音 訊信號使得將被結合的該等信號具有相同的基本取樣率。 魯 在又一實施例中,該音訊信號合成器更包含用於分析 具有該第一頻帶201中之信號成分的該音訊信號1〇5的一 特徵且用以提供識別該第一修補演算法或該第二修補演算 法之該控制資訊112的一分析器。 在另些實施例中,该分析器適用於識別具有一定程 度聲音之—時間部分的一非諧波修補演算法或該音訊信號 105令之—可區別時間部分的一諧波修補演算法。 在又一些實施例中,該音訊信號1〇5與元資料一起編 〇 貝料流,且其中該修補產生器11〇適用於從該資料 μ中的元資料中獲得該控制資訊。 …在又—些實施例中,該頻譜轉換II 12G包含-分析遽 或該等至少二個不同修補演算法包含一相位語音編 :角算法或-提升取樣修補演算法或一非線性失真修補 演算法或一複製演算法。 在又—些實施例中,該原始資訊處理器13〇適用於執 14 201009807 行該等頻譜帶的一能量調整或在該等頻譜帶的一反渡波或 用以將一雜訊基準增加至該頻譜帶中或用以將遺漏諧波增 加至該頻譜帶中。 第2圖顯示包含接收該控制資訊ι12及該音訊信號1〇5 的一控制器及修補裝置113的該修補產生器11〇的更多細 節的一方塊圖。該控制器111適用於基於該控制資訊112 選擇一修補演算法。該修補產生器110包含執行一第一演 算法1的一第一修補裝置113a、執行一第二修補演算法2 的一第二修補裝置113b等。大體上,該修補產生器u◎包 含與有用的修補演算法一樣多的修補裝置113,例如,該修 補產生器110可包含二、三、四或多於四的修補裝置113。 在該控制器111已基於該控制資訊112選擇該等修補裝置 113之一之後,該控制器m將該音訊信號1〇5傳輸至該等 修補裝置113中的其中一個,以執行該修補演算法且輸出 包含該經複製之頻帶202、203中之信號成分的該原始信號 115。 第3圖顯示該結合器14〇的更多細節的一方塊圖,其 中該結合器140包含一合成濾波器組ι41、一延遲器143 及一加法器147。該經調整的原始信號135輸入於由該經調 整的原始信號135(例如在該頻譜表示中)產生在該時域i35t 内之一經調整的原始信號(時域原始信號)的該合成濾波器 組141中。該基帶音訊信號ι〇5輸入於該延遲器143中, 該延遲器143適用於藉由一定時段來延遲該基帶信號105 且輸出該經延遲的基帶信號1〇5d。該經延遲的基帶信號 15 201009807 105d及該時域經調整的原始信號135t由該加法器147相 加,產生由該結合器140輸出的該合成音訊信號145。在該 延遲器143中的延遲依據該音訊信號合成器的處理演算法 而定,以實現該時域經調整的原始信號135t與經延遲的基 帶信號105d將對應於同一時間(同步)。 第4a至4d圖顯示由該修補產生器u〇中之該修補裝 置113所使用的不同的修補演算法。如以上所解釋,該修 補演算法產生在該經複製頻域中的一經修補信號。在第4 圖所顯示的該等實施例中,一第一頻帶201延伸至一第二 〇 頻帶202(或第二經複製頻帶)開始時的交越頻率fmax,且該 第二頻帶202延伸至二倍的該交越頻率2*fmax。超過此頻 率,一第三頻帶203(或第三經複製頻帶)開始。該第一頻帶 201可包含前述的核心頻帶。 在第4圖中,四個修補演算法作為範例予以顯示。在 第4a圖中的第一修補演算法包含一鏡像或提升取樣,一第 一修補演算法包含一複製或調製且顯示於第仆圖中,一第 三修補演算法包含—相位音訊編碼器且顯示於第4e圖中, © 且包含一失真的一第四修補演算法顯示於第4d圖中。 顯不於第4a圖中的鏡像被執行使得該第二頻帶2〇2中 的經修補信號透過在該交越頻率處鏡像該第一頻帶 201而獲得。該第三頻域2〇3中之經修補信號依次透過鏡像 在該第二頻帶202中的信號而獲得。因為該第二頻帶2〇2 中的k號已經是-經鏡像的信號’所以在該第三頻帶2〇3 中的信號也可簡單地透過將該第一頻帶2〇1中的音訊信號 16 201009807 105移位至該第三頻帶2〇3中而獲得。 第4圖所顯示的一第二修補演算法實施複製(或調製) 仏號。在此實施例中,該第二頻帶202中的信號透過將該 第一頻帶201中的信號移位(複製)至該第二頻帶202中而獲 得。類似地’該第三頻帶2〇3中的信號也可透過將該第一 頻帶201中的信號移位至該第三頻帶2〇3中而獲得。 第4c圖顯示使用一相位音訊編碼器作為修補演算法的 一實施例。該經修補信號由後續步驟產生,其中一第一步 產生二倍之最高頻率2*fmax以上的信號成分且第二步產生 三倍之最高頻率3*f_以上的信號成分等。-相位音訊編 碼器以一係數η (η = 2、3、4·.·)乘以取樣頻率而產生該取 樣值在核心頻帶(第一頻帶201)的η倍頻率範圍的延展。 使用失真(例如透過將信號平方)的修補演算法顯示於 第4d圖中。失真可透過許多方式獲得,一簡單的方式是平 方該信號位準以產生較高的頻率成分。失真的另一可能做 法是透過剪除(例如透過切除在某一臨界值之上的信號)而 獲得。而且在這種情況下,將產生高頻率成分。基本上習 知之方法中之任何失真處理可用於此處。 第5a圖更詳細地顯示一相位音訊解碼器的修補演算 法。如前所述,該第一頻帶201延伸至該第二頻帶2〇2(其 結束於例如二倍的最高頻率2*fmax處)開始時的最高頻率 fmax(父越頻率)。在該第二頻帶202之後,該第三頻帶203 開始且可延伸至例如三倍的最高頻率3*fmax。 為了簡易性,第5a圖顯示該音訊信號105之具有八個 17 201009807 頻率線105a、l〇5b、…、l〇5h的一頻譜(位準P是頻率f 的函數)。從八個線l〇5a、105b、…、105h中,該相位音訊 編碼器透過根據所顯示之箭頭移位該等線而產生—新信 號。該移位相對應於前述的乘法。詳細來說,該第一線1〇5a 移位至該第二線105b,該第二線移位至該第四線等,以此 類推’直至移位至該第十六線(該第二頻域202中的最後— 條線)的該第八線105h。這相對應於乘二。為了產生達三倍 最高頻率3*fmax的線,該等線的所有頻率可與三相乘,即 第一線105a移位至第三線i〇5c,第二線105b移位至第六 參 線等,以此類推,直到移位至第二十四線(第三頻帶2〇3中 的最後一條線)的第八線l〇5h。顯然地透過此相位音訊編碼 器,該等線不再是等距的,但擴展至較高頻率。 第5b圖更詳細地顯示複製的修補。再次,位準p作為 頻率f的函數予以顯示,其中八線在該第一頻帶2〇1中,
4及5圖所顯示之不同的修補演算 可不同地應用 不同應用中的不同優 於該時域中或該頻域中且包含可用於 點或缺點。 例如, ,頻域中的鏡像顯示於第4a圖中 在時域中,該 18 201009807 鏡像可透過由-整數係數來增加取樣率(其可透過在每— 對現存取樣之間插,外的取樣來完成)㈣以執行。此等 額外的取樣不是從該音訊信號中獲得,而是由該系統引入 且包3例如接近於或等於零的值4最簡單的情況下,如 果僅將{固額外取樣弓丨入二現存取樣之間,那麼一加倍數 量的取樣被實現意味著—加倍的取樣率。如果引入大於一 個的另&取樣(例如以一等距的方式),那麼該取樣率將因 而增加且因此該頻率頻譜也增加。大體上,在每一二個現 存的取樣之間的另-些取樣的數量可是任何數目n&= 2 3 4..·)’其增加了該取樣率⑽倍。額外取樣的插入 產^在奈奎斯特解(其在—給定取樣率下指定可表示的 最南頻率)下對頻譜的鏡像。因而,該基帶頻譜(該第一頻帶 中的頻譜)的賴透過此方核直接賴像於下一頻帶 中。可取捨地,此鏡像可與—可能的低通較及/或一頻譜 成形相結合。 此修補演算法的優點可概括如下。使用這—方法,與 在頻域中使用相似的方法相比更好地保留了信號時間結 構。而且’藉由頻譜鏡像頻率,接近於奈㈣特頻率的線 被映射到也是接近於奈奎斯_率的線上。這是一優點, 因為在鏡像該等頻譜之後’鏡像頻域(即該原始音訊信號 1〇5的奈奎斯_率)周_區域在許多方面上很相似,例 如關於頻譜平坦度雜f、該音姆質、該魏或頻率點 的不同等。透過這-方法,該頻镨例如透過使用複製技術 以-更為適度的方式繼續至下1率帶,其中完全源於該 19 201009807 原始頻譜中之不同區域且因而顯示極為不同之特徵的頻率 區域相互接近地結束。在複製中:該第一取樣再次成為該 經複製帶中的第一取樣,然而在鏡像中該最後取樣成為該 經複製帶中的第一取樣。該頻譜較軟式的連續性可依序降 低由其他修補演算法所產生之經重建頻譜的非連續特徵所 造成的感知缺陷。 最後,包含一大量譜波的信號例如在較低頻率區域(第 一頻帶201)中。此等諧波在該頻譜中以局部高峰的形式出 現。然而,在該頻譜的較高部分僅有極少的諧波存在,或 換句話說,在該頻譜的較高部分中諸波的數量較少。透過 簡單地使用對該頻譜的一複製,這將致使在具有一大量諧 波的該頻譜的較低部分中一經複製的信號被直接地複製到 在該原始信號中僅具有極少諧波的較高頻率區域中。因 此,該原始信號及該經複製信號的較高頻帶中,關於諧波 的數量極為不同,這是不期望的且應當避免。 鏡像的修補演算法也可應用於頻域中(例如於QMF區 域中),在這種情況下’該等頻帶的次序是相反的使得發生 —從後至前的重排序。此外,對於子帶取樣,必須形成— 複數共軛值以使每一取樣的虛部改變符號。這產生在該子 帶内該頻譜的一反相。 此修補演算法包含對於該修補邊界的一高靈活性,因 為該頻譜的-鏡像定在奈#斯_率下完成,而也可 在任何子帶邊界下執行。 然而,在修補邊沿處可能不會發生鄰近QMF頻帶之間 201009807 的頻疊相消,這是可以或不可以容忍的。 透過擴展或透過使用該相位音訊編碼器(參見第4c或 5a圖),頻率結構以諧波形式被正確地延伸至高頻域,因為 該基帶201以頻譜形式以由一或多個相位音訊編碼器所執 行的偶數倍擴展,且因為該基帶201中的頻譜成分與額外 所產生之頻譜成分相結合。 如果該基帶201已經例如透過僅使用一極低的位元率
強制地限制於頻寬中,那麼此修補演算法是較佳的。因此, 該等較高頻率成分的重建已經以一相對低的頻率開始。在 這種情況下,一典型的交越頻率小於大約5 kHz(或更有甚 者小於4 kHz)。在這一區域中,人耳對由於諧波不正確定 位而產生的不諧和音極為敏感。這可導致“非自然,’音調的 印象。此外’頻譜接近地相間隔的音調(具有大於30 Hz至 300 Hz的一頻譜距離)是被感知為刺耳的音調。該基帶2〇1 之頻率結構的—諧波連續避免了此等不正確及不愉悅的聽 覺印象。 在以複製方式的第三修補演算法(參見第4c或5b圖) 中,頻譜區域是以子帶方式被複製到一較高頻率區或被複 製到將被複製的頻率區。而且複製依賴於觀察,其對所有 修補演算法來說都是正確的,即該等較高頻率信號的頻譜 性質在許多方面相似於該等基帶信號的性質。相互僅有極 少的偏差。此外,典型地,人耳在高頻(典型地以大約5kHz 開始)中,尤其對於一不精確的頻譜映射極為不敏感。事實 上’大體上這是頻譜帶複製的主要關鍵點。特別地,複製 21 201009807 包含其可容易且快速實施的優點。 因為該頻譜的複製可在任何子帶邊沿下執行,所以此 修補演算法對於該修補之邊沿也具有—高靈活性。 最後’失真的修補演算法(參見第4d圖)可包含透過剪 除限制平方等產生諧波。如果例如—擴展信號在頻譜 上是非常稀疏的排列(例如在利用了上面所提及的相位音 訊編瑪器修_算法之後),那麼該頻譜可取捨地由_ 失真信號額外地予以填補以避免不想要的頻率空洞,這是 可能的。 % 第6a至6d圖顯示執行於-音訊解碼器中的音訊信號 合成器的不同實施例。 在第6a圖所顯示之實施例中,—經編碼信號流345輪 入一位元流負載解格式器350中,其一方面分離出一經編 碼的音訊信號355且另一方面分離出額外資訊375。該經編 碼的音訊信號335輸入於一例如產生第一頻帶2〇1之經解 碼音訊信號105的AAC核心解碼器360中。該音訊信號 105輸入於一包含例如32個頻帶且產生在頻域中的音訊信 魯 號10532的分析32頻帶QMF組370中。較佳的是該修補產 生器僅輸出一高頻帶信號作為原始信號且不輸出低頻帶信 號。另一方式是,如果方塊110中的修補演算法也產生低 頻帶信號,較佳的是對輸入至方塊130a的輸入信號進行高 通渡波。 該頻域音訊信號10532輸入於在此實施例中產生頻域 (QMF域)之修補的該修補產生器110中。產生的原始信號 22 201009807 頻譜表示125輸入於可例如產生一雜訊基準、重建遺漏諧 波或執行一相反濾波的一 SBR工具130a中。 另一方面,該額外資訊375輸入於一位元流剖析器380 中’其分析該額外資訊以獲得不同的子資訊385且將它們 輸入例如擷取出控制資訊112及頻譜帶複製參數132的一 霍夫曼解碼與反量化單元390中。該控制資訊112輸入於 該SBR工具中,且該等頻譜帶複製參數132輸入於該SBR 0 工具130a和一包封調整器nob中。該包封調整器130b可 • 操作地調整所產生之修補的包封。因此,該包封調整器130b 產生經調整的原始信號135且將其輸入將該經調整之原始 信號135與頻域中的該音訊信號ι〇532相結合的一合成 QMF組140中。該合成qmf組可包含例如64頻帶且透過 結合二信號(該經調整之原始信號135及該頻域音訊信號 1〇532)產生合成音訊信號145(例如pcM取樣的一輸出, PCM=脈衝代碼調變)。 • 此外’第6a圖顯示可實施用於該修補產生器110之 QMF頻譜資料輸出上之習知的頻譜帶複製方法的sbr工 具隱。第6a®_*之麟頻域巾的該修補演算法可例 如對在頻域内的頻譜資料使用簡單的鏡像或複製(參見第 4a圖及第4b圖)。 此通常結構與先前技藝中習知的解碼器一致,但是實 施例中由該修補產生器11〇替代了習知的修·生器,該 修補產生器110受組配以執行用以改良音訊信號的感知品 質之不同的可適性修補演算法。此外,實施例也可使用在 23 201009807 時域内的一修補演算法且不一定要是在第6a圖所顯示之頻 域中的修復。 第6b圖顯示本發明之實施例’其中該修補產生器11〇 可在頻域内以及在時域内使用一修補演算法。第6b圖所顯 示之解碼器同樣包含該位元流負載解格式器350、該AAC 核心解碼器360、該位元流剖析器380及該霍夫曼解碼與反 量化單元390。因而’在第6b圖所顯示之實施例中,該經 編碼音訊流345再次輸入於一方面產生該經編碼音訊信號 355且將其與該額外資訊375分離的該位元流負載解格式 參 器350中,該額外資訊375然後由該位元流剖析器380剖 析以分離出輸入於該霍夫曼解碼與反量化單元390中的不 同資訊385。另一方面,該經編碼音訊信號355輸入於該 AAC核心解碼器360中。 現在,實施例區分出這兩種情況:該修補產生器110 在頻域(以下以點信號線表示)内或在時域(以下以虛線信號 線表示)内操作。 如果該修補產生器操作於時域中,那麼該AAC核心解 碼器360的輸出輸入於該修復產生器11()中(虛線音訊信號 105)且其輸出被傳輸至該分析濾波器組37〇。該分析濾波器 組370的輸出是輸入於SBR工具130a中(其是該原始信號 調整器130的一部分)以及合成QMF組140中的原始信號 頻譜表示125。 如果在另一方面,該修補演算法使用頻域(如第6a圖 所顯示),那麼該AAC核心解碼器360的輸出經由點線的 24 201009807 音訊信號105輸入於分析QMF組360中,該分析qMf組 360依序產生一頻域音訊信號10532且將該音訊信號1〇5 32 傳輸至該修補產生器110及該分析QMF組14〇(點線; 修補產生器110再次產生一原始信號表示125且將此信號 傳輸至SBR工具130a。 因此,該實施例使用該等點線執行一第一處理模式(頻 域修補)或使用該等虛線執行一第二處理模式(時域修補” 其中在其他功能元件之間所有實線均用於二處理模式中。 該修補產生器的時間處理模式(虛線)較佳的是該修補 產生器的輸出包括低頻帶信號及局頻帶信號,即該修補產 生器的輸出信號是由該低頻帶信號及該高頻帶信號組成的 寬頻信號。該低頻帶信號輸入於方塊14〇中且該高頻帶信 5虎輸入於方塊130a中。s亥等頻帶的分離可於該分析組37〇 中執行,但也可以另一方式予以執行。另外,該AAC解碼 器的輸出信號可直接地輸送至方塊370使得該修補產生器 輸出信號的低頻帶部分根本未予以使用且該原始低頻帶部 分用於該結合器104中。 在該頻域處理模式中(點線)’該修補產生器較佳地僅輸 出高頻帶信號’且該原始低頻帶信號直接地輸送至方塊37〇 從而輸送至該合成組140。可選擇地,該修補產生器也可產 生一全頻帶輸出信號且將低頻帶信號輸送至方塊1〇4。 同樣’該霍夫曼解碼與反量化單元390產生頻譜帶複 製參數132及輸入於§亥修補產生器11〇中的控制資訊η?。 此外’該等頻譜帶複製參數132傳輸至該包封調整器丨3〇b 25 201009807 且至該等SBR工具130a。該包封調整器13〇b的輸出是在 該結合器140(合成QMF組)中與該頻譜帶音訊信號 1〇532(對於頻域修補而言)或與原始信號頻譜代表125(對於 時域修補而言)相結合以產生如前所述包含輸出PCM取樣 的合成音訊信號145的經調整原始信號135。 而且,在此實施例中,該修補產生器11〇使用該等修 補演算法之一(例如第4a至4d圖所顯示)以透過使用在該第 一頻帶201中之基帶產生在該第二頻帶202中或在該第三 頻帶203中的音訊信號。僅在該第一頻帶2〇1中的音訊信 參 號取樣於該經編碼出流345中被編碼且該等遺漏取樣透過 使用頻譜帶複製方法而予以產生。 第6c圖顯示在時域中該修補演算法的一實施例。對比 於第6a圖,第6c圖所顯示之該實施例因該修補產生器u〇 及該分析QMF組120的位置而不同。該解碼系統之所有的 剩餘元件與第6a圖所顯示的一樣且因此在此省略了重複的 描述。 該修補產生器110從該AAC核心解碼器360接收音訊 〇 信號1〇5’且執行在時域内之修補以產生輸入於該頻譜轉換 器120(例如包含64頻帶的—分析QMF組)巾的原始信號 115。有許多可能性的是,如果該修補產生器 110透過在現 存的取樣之間引人額外的取樣(例如接近於零值)來執行修 補,那麼由該修補產生器11〇所執行之在時域中的一修補 演异法產生包含加倍取樣率的-原始信號115。該頻譜轉換 器120的輸出是輪人於原始信號調整器 130的原始信號頻 26 201009807 譜代表125,原始信號調整器130如前所述一方面包含SBR 工具130a,另一方面包含包封調整器l30b。如前面該等實 施例所顯示,該包封調整器的輸出包含在該結合琴中 在頻域105f與音訊信號相結合的經調整原始信號135,且 該結合器140如前所述又包含例如64頻帶的合成qMF組。 因此,主要的不同是’例如鏡像執行於時域中且較高 頻率資料在該信號115輸入於該分析64頻帶濾波器組12〇 中之前已經予以重建,這意味著該信號已經包含加倍取樣 率(在雙率SBR中)。在此修補操作之後,可使用又包含一 相反渡波' 增加一雜訊基準或增加遺漏諧波的一常態SBR 工具。雖然高頻區域的重建發生於時域中,但是一分析/合 成執行於QMF域中使得該等剩餘SBR機制仍可予以使用。 在第6c圖之實施例中’該修補產生器較佳地輸出包含 低頻帶信號及高頻帶信號的一全頻帶信號(原始信號)。可選 擇地,該修補產生器僅輸出例如由高通濾波而獲得的高頻 帶部分,且該AAC核心解碼器輸出105直接地輸送至該 QMF 組 120。 在又一實施例中’該修補產生器11〇包含一時域輸入 介面及/或一時域輸出介面(時域介面),此方塊中的處理可 發生於諸如一 QMF域或諸如一 dft、FFT、DCT、DST或 任何其他頻域的任何域中。接著,該時域輸入介面連接於 一時間/頻率轉換器或大體上連接於一轉換器用於從時域 轉換為一頻譜表示。接著,該頻譜表示使用操作於頻域資 料上之至少二個不同修補演算法來處理。可選擇地,一第 27 201009807 一修補演算法操作於頻域中且一第二修補演算法操作於時 域中。該經修補頻域資料被轉換回接著經由該時域輸出介 面輸入於方塊120中的一時域表示。在該實施例中,其中 線上信號115不包含全頻帶,而僅包含低頻帶,該濾波較 佳地在將該頻譜信號轉換於時域之前於頻域中執行。 較佳地’方塊110中的頻譜解析度高於由方塊120所 獲得的頻譜解析度。在一實施例中,方塊110中的頻譜解 析度至少是方塊120中的頻譜解析度的兩倍。 透過將由本實施例所實施的修補演算法隔離於一單獨 功能方塊中,可能完全不依賴於該等SBR工具的使用而應 用任何頻譜複製方法。在一可選擇的實施中,也可能平行 地將該AAC解碼器信號輸入於一 32頻帶的分析濾波器組 中,並透過時域中的修補產生高頻成分。基帶與該等經修 補信號將僅在該等QMF分析之後相結合。 第6d圖顯示這樣一實施例,其中該修補執行於時域 中。相似於第6c圖所顯示之實施例,而在此實施例中與第 6a圖的不同包含該修補產生器110以及該等分析濾波器組 的位置。特別地,該AAC核心解碼器360、該位元流負載 解格式器350以及該位元流剖析器308及該霍夫曼解碼與 反量化單元390與第6a圖所顯示之實施例中的相同且在此 再次省略重複的描述。 第6d圖所顯示之該實施例分支出由該解碼器360所輸 出的音訊信號105且將該音訊信號105輸入於該修補產生 器110以及該分析32頻帶QMF組370中。該分析32頻帶 201009807 QMF組370(更進一步的轉換器370)進一步產生原始信號頻 5普表示123。该修補產生器11〇又執行時域内之—修補且產 生輸入於該頻譜轉換器120(又可包含64頻帶的一分析 QMF濾波器組)中的一原始信號ι15。該頻譜轉換器12〇產 生在本實施例中包含第一頻帶201中之頻率成分及該第二 或第三頻帶202、203中之經複製頻帶的原始信號頻譜表示 125。而且,此實施例包含適用於使該分析32頻帶濾波器 組370的輸出與s亥原始信號頻譜表示125相加以獲得一經 結合的原始4¾號頻s普表示126的一加法器124。該加法器 124也可大體上是受組配以將該等基帶成分(在第一頻帶 201中的成分)從該原始信號頻譜表示125中減去的一結合 器124。因此,該加法器124可受組配以加一反向信號或可 選擇地可包含一可取捨的反相器以使來自該分析32頻帶遽 波器組370的輸出信號反相。 在基頻帶201中的頻率成分被示範地減少之後,該輸 出再次輸入於該頻譜帶複製工具130a中,該產生的信號依 次向前至該包封調整器13〇b中。該包封調整器i3〇b再-欠 產生在該結合器14 0中與該分析3 2頻帶濾波器組3 7 〇的輸 出相結合使得該結合器140將該等經修補頻率成分(例如在 第二及第三頻帶202、203中)與由該分析32頻帶據波器組 370輸出的該等基帶成分相結合的經調整原始信號135。再 次,該結合器140可包含產生合成音訊信號(包含例如輸出 PCM取樣)的64頻帶的一合成QMF濾波器組。 在第6d圖實施例中,該修補產生器較佳地輸出包含低 29 201009807 頻帶信號及高頻帶信號的一全頻帶信號(原始信號)。可選擇 地,該修補產生器僅輸出例如由高通濾波所獲得之用於輸 送至方塊120的頻帶部分,且如第6d圖所顯示直接將該 AAC輸出輸送至該QMF組370。另外,因為此信號僅包含 高頻帶,所以不需要該減法器124且將方塊120的輸出直 接輸送至方塊130a。此外,該方塊370不需要輸出至該減 法器124。 在又一實施例中,該修補產生器110包含一時域輸入 介面及/或一時域輸出介面(時域介面)’且此方塊中的處理 ❻ 可發生於諸如一 QMF域或諸如一 DFT、FFT、DCT、 MDCT、DST或任何其他頻域的任何域中。接著,該時域 輸入介面連接於一時間/頻率轉換器或大體上連接於一轉 換器用於從時域轉換為一頻譜表示。接著,該頻譜表示使 用操作於頻域資料上之至少二個不同修補演算法來處理。 可選擇地,一第一修補演算法操作於頻域中且一第二修補 演算法操作於時域中。該經修補的頻域資料被轉換回接著 經由β亥時域輸出介面輸入於方塊120中的一時域表示。 參 較佳地,方塊110中的頻譜解析度高於由方塊12〇所 獲得的頻譜解析度。在一實施例中,方塊11〇中的頻譜解 析度至少是方塊120中的頻譜解析度的兩倍。 第6a至6d圖涵蓋了該解碼器結構且特別地包含了在 該解碼器結構内的修補產生器110。為了使該解碼器及特別 地該修補產生器110能夠產生或複製較高的頻率成分,該 編碼器可將額外的資訊傳輸至該解碼器,其中該額外資訊 30 201009807 112 -方©提供可例如用以決定修補演算法的控制資訊且 此外提供將由該等頻譜帶複製工具丨施所使用的頻譜帶複 製參數132。
另-些實施例還包含用於產生具有一第一頻帶及源於 該第-頻帶201的-第二經複製頻帶2〇2的—合成音訊信 號145的—方法。該方法包含執行至少二個不同的修補演 算法’將該原始信號115轉換為_原始信號頻譜表示⑵, 處理該原始信號頻譜表示125。每—修補演算法使用具有第 一頻帶2〇1中之信號成分的—音訊信號Κ)5產生具有第二 經複製頻帶202中之信號成分的1始信號ιι5。該修補被 執行,使得該等至少二個修補演算法之—個根據一第一時 間部分的一控制資訊112而選定, 延疋,且該等至少二個修補演 算法之另-個根據不同於該第—時間部分的—第二時間部 分的該控制資訊112而選定,叫得該第-及該第二時間 部分的原始信號115。該原始信號萌 死須4表示125的處理根據 頻譜域頻譜帶複製參數132來執杆 轨仃U獲得一經調整的原始 t號頻譜表示135°最後,該方法包含將具有該第-帶训 錢分的音訊信號1〇5或振於該音訊信號1〇5的-信號與該經調整之原始信號頻譜 ..^ 衣不丨35或與源於該經調 整之原始彳自破頻譜表示135的另一 合成音訊信號145。 1號相結合,以獲得該 第7a、7b及〜圖包含該蝙石馬器的實施例。 第7a圖顯示編碼-音訊信號地以產生依次輸入於第 如至圖所顯示之該等解碼器中的經編碼音訊信號奶 31 201009807 的一編碼器。第7a圖所顯示之編碼器包含供該音訊信號 305輸入的一低通濾波器31〇(或一通用頻率選擇濾波器)及 一高通濾波器320。該低通濾波器310分離該第一頻帶201 内的音訊信號成分,然而該高通濾波器320分離剩餘的頻 率成分,例如該第二頻帶202及另一些頻帶中的頻率成分。 因而’該低通濾波器310產生一低通經濾波信號315且該 高通濾波器320輸出一高通經濾波音訊信號325。該低通經 濾波音訊信號315輸入於可包含例如一 AAC編碼器的一音 訊編碼器330中。 此外,該低通經濾波音訊信號315輸入於適用於產生 該控制資訊112使得依序由該修補產生器11〇所選定的一 較佳修補演算法可獲識別的一控制資訊產生器340中。該 高通經溏波音訊信號325輸入於一頻譜帶資料產生器328 中’該頻譜帶資料產生器328產生一方面輸入於修補選擇 器之頻譜帶參數132。而且,第7a圖的編碼器包含接收來 自該音訊編碼器33〇的經編碼音訊信號、來自該頻譜帶複 裝資料產生器328的頻譜帶複製參數132及來自該控制資 訊產生器340的控制資訊112的一格式器343。 "亥等頻譜帶複製參數132可依據修補方法而定,即對 於不同的修補演算法,該等頻譜帶參數可不同或可相同, 曰"crj™ ♦一定為所有的修補演算法判定該等SBR參數 (下面第7c圖顯示的一實施例僅一組SBR參數132需要 予以汁算)。因而,該頻譜帶產生器328可為不同的修補演 算法產生不同的頻譜帶參數132且因而該等頻譜帶參數 201009807 132可包含適用於該第一修補演算法的第一 SBR參數 i32a、適用於該第二修補演算法的第二SBR參數13%、適 用於該第三修補演算法的第三SBR參數132c等。
第7b圖更詳細地顯示該控制資訊產生器340的一實施 例。該控制資訊產生器340接收該低通經濾波信號315及 該等SBR參數132。該低通經濾波信號315可輸入於一第 一修補單元342a、一第二修補單元342b及其他修補單元(未 顯示)中。修補單元342的數量可例如與由該解碼器中修補 產生器110可執行之修補演算法的數量相一致。該等修補 單元342的輸出包含該第一修補單元342a的一第一經修補 音訊信號344a、該第二修補單元342b的一第二經修補音訊 信號344b等。包含該第二頻帶202中之原始成分的該經修 補音訊信號344輸入於一頻譜帶複製工具方塊346中。同 樣,頻譜帶複製工具方塊346的數量可例如等於修補演算 法的數量或等於修補單元342的數量。該等頻譜帶複製參 數132也輸入於該頻譜帶複製工具方塊346(SBR工具方塊) 中,使得該第一 SBR工具方塊346a接收該等第一 SBR參 數132a及該第一經修補信號344a。該第二SBR工具方塊 346b接收該等第二SBR參數132b及該第二經修補信號 344b。該等頻譜帶複製工具方塊346在該等複製參數132 的基礎產生包含該第二及/或第三頻帶202及203内之較言 的頻率成分的經複製音訊信號347。 最後,該控制資訊產生器340包含適用於將該原始立 訊信號305且特別地是該音訊信號305之較高頻率成分與 33 201009807 該經複製:音訊信號347進行比較的比較單元 比1可對每—修補演算法執行以便ϋ較單元348a; 該音δίΐ#號305鱼由兮笛— ^ R:L具方塊3他所輸出的 〇 曰訊信號347a進行比較。類似地,一第二 比較單7G 348b將該音訊信號3〇5與來自該第二哪工具 方塊3·的-第二經複製之音職號進行比較。該 等比較單το 348判定該等高頻帶中該等經複製音訊信號 347與該原始音訊信號3()5的偏差以便最後—評估單元
349可比較在該原始音訊信號3()5與使用不同修補演算法 之該等經修補音訊信號347之_偏差,且由此判定一較 佳的修補决算法或-些適合的或不適合的修補演算法。該 控制身訊112包含允許識別該等較佳修補演算法之一的資 訊。邊控制資1fl 112可包含例如可在該原始音訊信號3〇5 與該經複製音訊信號347之間之最小偏差的基礎上予以判
定的該較佳修補演算法的一識別號。可選擇地,該控制資 訊112可提供在該音訊信號3〇5與該經修補音訊信號347 之間達成充分一致的多個修補演算法或修補演算法的評 比。該評估可例如針對於感知品質而執行,使得該經複製 音訊信號347在一理想的情況下人類無法區別於或接近無 法區別於該原始音訊信號3〇5。 第7c圖顯示該編碼器的另一實施例,其中同樣,將該 音訊信號305輸入,但是也可取捨地將元資料306輸入於 該編碼器中。該原始音訊信號3〇5再次輸入於一低通濾波 器310中且於一高通濾波器320中。該低通濾波器310的 34 201009807 輸出再次輸入於-音訊編碼器33〇中且該高通滤波器, 的輸出輸人於-咖資料產生器328中。而且,該編碼器 包含-s㈣處理單元_及/或錢出發送至控制資訊產 生器340的刀析單几(或用於分析之裳置卿。元資料處 理單元,受組配以關於-適合的修補演算法分析該元資 料施。該分析單元307可例如判定該音訊信號3〇5内暫態 的或脈衝群__群段量料i基於社資料處
理單元309的輸出及/或該分析工具3〇7的輸出,該控制資 =產生器340可再次判定—較佳的修_算法或產生修補 '臾ί法的找,且編碼難制資訊112⑽此資訊。該格 式器343將再次將該控制資m U2、該頻譜帶複製參數in 乂及該、差編媽音訊信號3 5 5結合於—經編碼音訊流⑷内。 用於刀析的襄置307提供例如該音訊信號的特性且可 適用=識別對於具有—聲音程度之—時間部分的非譜波信 號^或對於—可區別時間部分的—譜波信號成分。如果 /曰訊彳„號3〇5是純粹的語音或聲音,那麼聲音的程度高, ,,、、而對於聲音與例如音樂m,聲音的程度較低。該 SBR參數132的計算可依賴於此特徵及該較佳修補演算法 來執行。 又一實施例包含一方法,該方法產生包含在一第一頻 帶201中—音訊信號205的成分、控制資訊ι12及頻譜帶 複製參數132的—資料流345。該方法包含頻率選擇滤波該 音訊信號305以產生在該第一頻帶201中該音訊信號3〇5 的成分。該方法更包含由在一第二頻帶202中該音訊信號 35 201009807 305的成分產生該頻譜帶複製參數132。最後,該方法包含 產生從一第一或一第二不同修補演算法中識別一較佳修補 演算法的控制資訊112,其中每一修補演算法使用在該第一 頻帶201中該音訊信號305的成分產生具有在該第二經複 製之頻帶202中之信號成分的一原始信號115。 雖然第0a至圖中的一些實施例已予以特別地說明 使得在低頻帶與經調整高頻帶之間的結合執行於頻域中, 但是應注意的是該結合也可執行於時域中。最後,該核心 解碼器輸出信號可用於(在用於補償由於修補及調整所導 致的處理延遲的一可能必要的延遲級的輸出)時域中,且於 濾波器組域中受調整的高頻帶可轉換回時域中成為一不具 有低頻帶部分而具有高頻帶部分的信號。在第6圖的實施 例中,此信號將僅包含最高的32子帶,且此信號至時域的 —轉換產生一時域高頻帶信號。接著,二信號可諸如透過 —逐取樣相加結合於時域中以獲得將予以數位/類比轉換 且輸送至一揚聲器的例如PCM取樣作為—輪出信號。 雖然在一裝置的上下文中已對一些層面予以描述,但 是要清楚的是此等層面也可表現相對應之方法的描述,其 中一方塊或裝置相對應於一方法步驟或一方法步驟的一特 徵。相似地,一方法步驟之上下文中所描述的層面也可表 示對一相對應之方塊或項目或一相對應之裝置之特徵的描 述。 該說明性的經編碼音訊信號或位元流可儲存於一數位 儲存媒體上或玎傳輸至諸如一無線傳輸媒體或諸如網際網 201009807 路之一有線傳輸媒體的一傳輸媒體上。 根據某些實施要求,本發明之實施例可實施於軟體中
或硬體中。該實施可使用具有儲存於其上之電氣可讀控制 信號的例如一軟碟、一 DVD ' — cD、一 r〇m、一 pR()M -EPROM、一 EEPROM或一快閃(FLash)記憶體的一數 位儲存媒體來實施,該數位儲存媒體與—可規劃電腦系統 相協作(或能夠協作)使得各個方法予以執行。
^ g «λ ^ rpy ^ 的-資料載體,該資料載體能夠與_可規劃電腦系統相協 作,使得在此所描述之該等方法之執行。大體上, 本發明之實施例可作為具有一程式碼的—電腦程 予以實施’當《腦產品執行於1腦上_電腦瑪可操 作地用於執行料方法之…_式碼可例如儲存於一機 械可讀載體中。其他實施例包含用於執行在此所描述之該 專方法之-且儲存於-機械可讀載體上的電腦程式。換句 錢,該說紐之綠的-實關從q具有—電腦程式 碼之用於在《腦程式執行於—電腦上魏行在此所描述 Q等方的-電職式。㈣料說雜方法的又 :實施例是包含儲存於其上之用於執行在此所描述之該等 ^法之一的-電腦程式的-資料栽體(或—數位儲存媒體 電腦可讀媒體)。從而該等說明性方法的又—實施例是 〜=用於執行纽職述之料方以―㈣電腦程式的 ,料流或-序列信號。該資料流麵序列信號可例如受 己以經由該—資料通訊連接(例如經由該網際網路)予以 37 201009807 此 例中’一可規劃邏輯裝置(例如一 θ 在一些實施 場可規劃閘陣列)可用以勒 行在此所描述之該等方法的一此每 執 —减所有功能。在一些實祐 例中’二場可_閘_可與1處理器相協作以執行在 此所描述之该等方法之一。大體上, 邊等方法較佳地藉由 任何硬體裝置來執行。 田 上面所描述的實施例僅是對本發明之原理的說明。癖 理解的是在此所描述之料安排料等細節的修改及變化 對於在該技藝巾具有通常知識者是清楚的。因而,其僅打 算由隨後的巾請專利範圍的朗來限制㈣打算由 施例之描述及解釋所呈現的特定細節來限制。 【圖式簡單說明】 第1圖顯示根據本發明之實施例, 一方塊圖; 一音訊信號處理的
第2圖顯示根據實施例,該修補產生器的一方塊圖; 第3圖顯示操作於該時域中的該結合器的一方塊圖; 第4a至4d圖示意地繪示不同修補演算法的範例; 第5a至5b圖繪示該相位語音編碼器及透過複製的該 修補; 第6a至6d圖顯示用於處理該經編碼音訊流以輸出 PCM取樣的方塊圖;及 38 201009807 第7a至7c圖顯示根據另一實施例之一音訊編碼器的
方塊圖。 【主要元件符號說明】 105.. .合成音訊信號 10532…音訊信號 105a...頻率線/第一線 105b...頻率線/第二線 105c...頻率線/第三線 105d...基帶信號 110.. .修補產生器 111.. .控制器 112.. .控制資訊 113a...第一修補裝置 113b...第二修補裝置 115.. .原始信號 120.. .頻譜轉換器 123.. .另一原始信號頻譜表示 124.. .加法器 125.. .原始頻譜表示/原始信號 頻譜表示 126.. .經結合之原始信號頻譜 表示 130.. .原始信號處理器 130a...SBR 工具 130b...包封調整器 132.. .頻譜域頻譜帶複製參數/ 頻譜帶複製參數 135.. .經調整的原始信號 135t...時域 140.. .結合器/合成QMF組 141.. .分析滤波器組 143.. .延遲器 145.. .合成音訊信號 147.. .加法器 201.. .第一頻帶 202.. .第二頻帶 203.. .第三頻帶 305.. .音訊信號 306.. .元資料 307.. .分析單元 309.. .元資料處理單元 310.. .低通濾波器 315.. .低通經滤、波音訊信號 320.. .高通濾波器 325.. .高通經濾波音訊信號 39 201009807 328.. .頻譜帶資料產生器 330.. .音訊編碼器 340…控制資訊產生器 342a...第一修補單元 342b...第二修補單元 343.. .格式器 344a··.第一經修補音訊信號 344b...第二經修補音訊信號 345.. .經編碼信號流/經編碼音 訊信號 346a.··第一 SBR工具方塊 346b·.·第二SBR工具方塊 347a·.·第一經複製之音訊信 號 347b...第二經複製之音訊信 號 348a...第一比較單元 348b...第二比較單元 349.. .評估單元 350.. .位元流負載解格式器 355.. .經編碼的音訊信號 360.. . AAC核心解碼器 370.. .分析QMF組 375.. .額外資訊 380.. .位元流剖析器 385…子資訊 390.. .霍夫曼解碼與反量化單 元 fmax…交越頻率
40

Claims (1)

  1. 201009807 七、申請專利範圍: 1. 一種音訊信號合成器,其用於產生具有一第一頻帶及源 於該第一頻帶的一第二經合成頻帶的一合成音訊信 號,包含: 一修補產生器,其用於執行至少二個不同的修補演 算法,其中每一修補演算法使用具有該第一頻帶中之信 號成分的一音訊信號產生具有該第二經合成頻帶中之 信號成分的一原始信號,且其中該修補產生器適用於根 參 • 據一第一時間部分的一控制資訊選擇該等至少二個不 同修補演算法之其中一個,且根據不同於該第一時間部 分的一第二時間部分的該控制資訊選擇該等至少二個 不同修補演算法之另一個,以獲得該第一及該第二時間 部分的該原始信號; 一頻譜轉換器,其用於將該原始信號轉換為一原始 信號頻譜表示; Φ 一原始信號處理器,其用於根據頻譜域頻譜帶複製 參數處理該原始信號頻譜表示,以獲得一經調整之原始 信號頻譜表示;及 一結合器,其用於將具有該第一頻帶中之信號成分 的該音訊信號或源於該音訊信號之一信號與該經調整 之原始信號頻譜表示或與源於該經調整之原始信號頻 譜表示的另一信號相結合,以獲得該合成音訊信號。 2. 如申請專利範圍第1項所述之音訊信號合成器,其中該 等至少二個修補演算法相互不相同,其不同處在該第一 41 201009807 頻帶中之_ 〇 —頻率下該音訊信號的一信號成分被修補為 _ 帶中的一目標頻率,且對於二修補演算法而 3言’該目標頻率是不同的。 二θ專引範園第1項或申請專利範圍第2項所述之音 號合成器’其中該修補產生器對於二修補演算法均 ^用於操作於時域中,或其中該修補產生器包含用於將 時域4。號轉換為-頻譜表示的-轉換器、用於將該頻 言並| ”曰不的一信號轉換至時域的一轉換器及一時域輸 出介面,其中該修補產生器對於至少一修補演算法是適 Φ 用於操作於頻譜域中。 4·如上述中請專利範圍中之任_項所述之音訊信號合成 器’ ^中該修補產生器適用於產生該原始信號,使得該 原始號包含在該第—頻帶中的另—些信號成分,且該 等仏號成分具有大於輸入於該修補產生器之該音訊信 號的取樣率的_取樣率,且其中該頻譜轉換器適用於將 該第二頻帶中的信號成分及該第—頻帶中的另—些@ 號成分轉換為該原始信號頻譜表示。 參 5.如申4專利範圍第4項所述之音訊信號合成器 ,更包含 另一頻譜轉換器及另一結合器,該另一頻譜轉換器適用 於將具有該第-頻帶中之信號成分的該音訊信號轉換 為另-原始信酬譜表*,且該另—結合器適用於將該 原始信號頻譜表示與該另一原始信號頻譜表示相結合 以獲得-經結合的原始信號頻譜表示,且其中該原始信 號處理器適用於處理該經結合的原始信號頻譜表示。 42 201009807 6. 如上述申請專利範圍中之任一項所述之音訊信號合成 器,其中該結合器適用於使用源於該音訊信號之信號、 該另一原始信號頻譜表示。 7. 如上述申請專利範圍中之任一項所述之音訊信號合成 器,其中該音訊信號及該控制資訊編碼於一資料流中, 更包含一解格式器,該解格式器受組配以從該資料流中 獲得該控制資訊。 8. 如上述申請專利範圍中之任一項所述之音訊信號合成 > 器,其中該音訊信號及該頻譜帶複製參數編碼於一資料 流中,且其中該原始信號處理器適用於從該資料流中獲 得該頻譜帶複製參數。 9. 一種音訊信號編碼器,其用於由一音訊信號產生包含在 一第一頻帶中該音訊信號的成分、控制資訊及頻譜帶複 製參數的一資料流,包含: 一頻率選擇濾波器,其用以產生在該第一頻帶中該 # 音訊信號的該等成分, 一產生器,其用於由在一第二頻帶中該音訊信號的 該等成分產生該頻譜帶複製參數; 一控制資訊產生器,其用以產生該控制資訊,該控 制資訊從一第一或一第二不同的修補演算法中識別一 較佳的修補演算法,其中每一修補演算法使用在該第一 頻帶中該音訊信號之該等成分產生具有該第二經複製 頻帶中之信號成分的一原始信號。 10.如申請專利範圍第9項所述之音訊信號編碼器,更包含 43 201009807 用於分析該音訊信號以提供該音訊信號之特性的一裝 置,用於分析的該裝置適用於識別具有一聲音程度之一 時間部分的非諧波信號成分或一可區分的時間部分的 一諧波信號成分。 11. 如申請專利範圍第9項或申請專利範圍第10項所述之 音訊信號編碼器,其中該控制資訊產生器適用於透過將 該音訊信號與經修補之音訊信號進行比較,以對該第一 及對該第二修補演算法識別較佳的修補演算法,其中透 過根據頻譜帶複製參數由一頻譜帶複製工具施以原始 信號調整,不同地經修補音訊信號從與該等第一及第二 修補演算法相關的不同的原始信號得出。 12. —種資料流,其用於在一傳輸線上傳輸或用於儲存,該 資料流包含: 一經編碼音訊信號,其在該第一頻帶中; 一控制資訊,該控制資訊從一第一或一第二不同的 修補演算法中識別一修補演算法,其中每一修補演算法 使用在該第一頻帶中該經編碼音訊信號的該等成分產 生具有一第二經複製頻帶中之信號成分的一原始信 號;及 頻譜帶複製參數。 13. —種用於產生具有一第一頻帶及源於該第一頻帶之一 第二經複製頻帶的一合成音訊信號的方法,包含以下步 驟: 執行至少二個不同的修補演算法,其中每一修補演 44 201009807 算法使用具有該第一頻帶中之信號成分的一音訊信號 產生具有該第二經複製頻帶中之信號成分的一原始信 號,且其中該修補遭執行使得該等至少二個不同修補演 算法其中之一根據一第一時間部分的一控制資訊而選 定,且該等至少二個不同修補演算法之另一個根據不同 於該第一時間部分之一第二時間部分的該控制資訊而 選定,以獲得該第一及該第二時間部分的該原始信號; 將該原始信號轉換為一原始信號頻譜表示; 根據頻譜域頻譜帶複製參數處理該原始信號頻譜 表示以獲得一經調整之原始信號頻譜表示;及 將具有該第一頻帶中之信號成分的該音訊信號或 源於該音訊信號的一信號與該經調整之原始信號頻譜 表示或與源於該經調整之原始信號頻譜表示的另一信 號相結合,以獲得該合成音訊信號。 14. 一種用於產生包含在一第一頻帶中一音訊信號的成 分、控制資訊及頻譜帶複製參數的一資料流的方法,包 含以下步驟: 頻率選擇過濾該音訊信號以產生在該第一頻帶中 該音訊信號的該等成分; 由在一第二頻帶中該音訊信號的該等成分產生該 頻譜帶複製參數; 產生從一第一或一第二不同修補演算法中識別一 較佳修補演算法的該控制資訊,其中每一修補演算法使 用在該第一頻帶中該音訊信號的該等成分產生具有該 45 201009807 第二經複製之頻帶中之信號成分的一原始信號。 15. —種電腦程式,其用於當於一處理器上執行時,執行申 請專利範圍13項或申請專利範圍14項所述之方法。
    46
TW098122891A 2008-07-11 2009-07-07 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式 TWI441162B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US7983908P 2008-07-11 2008-07-11
US10382008P 2008-10-08 2008-10-08
PCT/EP2009/004451 WO2010003539A1 (en) 2008-07-11 2009-06-19 Audio signal synthesizer and audio signal encoder

Publications (2)

Publication Number Publication Date
TW201009807A true TW201009807A (en) 2010-03-01
TWI441162B TWI441162B (zh) 2014-06-11

Family

ID=41120013

Family Applications (1)

Application Number Title Priority Date Filing Date
TW098122891A TWI441162B (zh) 2008-07-11 2009-07-07 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式

Country Status (16)

Country Link
US (3) US8731948B2 (zh)
EP (1) EP2301026B1 (zh)
JP (1) JP5244971B2 (zh)
KR (1) KR101223835B1 (zh)
CN (1) CN102089816B (zh)
AR (1) AR072864A1 (zh)
AU (1) AU2009267525B2 (zh)
BR (1) BRPI0910792B1 (zh)
CA (1) CA2730198C (zh)
CO (1) CO6341675A2 (zh)
ES (1) ES2796552T3 (zh)
MX (1) MX2011000372A (zh)
RU (1) RU2491658C2 (zh)
TW (1) TWI441162B (zh)
WO (1) WO2010003539A1 (zh)
ZA (1) ZA201009208B (zh)

Families Citing this family (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2871252C (en) * 2008-07-11 2015-11-03 Nikolaus Rettelbach Audio encoder, audio decoder, methods for encoding and decoding an audio signal, audio stream and computer program
JP5244971B2 (ja) 2008-07-11 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号合成器及びオーディオ信号符号器
DK3364414T3 (da) * 2008-12-15 2022-06-27 Fraunhofer Ges Forschung Audiobåndbreddeudvidelsesafkoder, tilsvarende fremgangsmåde og computerprogram
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
EP2239732A1 (en) 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
CO6440537A2 (es) * 2009-04-09 2012-05-15 Fraunhofer Ges Forschung Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio
CN101566940B (zh) * 2009-05-25 2012-02-29 中兴通讯股份有限公司 实现无线数据终端通用串行总线音频传输的方法及装置
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
EP2362376A3 (en) * 2010-02-26 2011-11-02 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using envelope shaping
JP5671823B2 (ja) * 2010-03-24 2015-02-18 株式会社Jvcケンウッド 高調波生成方法、高調波生成装置、及び、プログラム
JP5609737B2 (ja) 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
MX2012011802A (es) * 2010-04-13 2013-02-26 Fraunhofer Ges Forschung Metodo y codificador y descodificador para la presentacion precisa de muestra de una señal de audio.
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
US9558755B1 (en) 2010-05-20 2017-01-31 Knowles Electronics, Llc Noise suppression assisted automatic speech recognition
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
RU2562384C2 (ru) 2010-10-06 2015-09-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для обработки аудио сигнала и для обеспечения большей детализации во времени для комбинированного унифицированного кодека речи и аудио (usac)
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
CN103548077B (zh) 2011-05-19 2016-02-10 杜比实验室特许公司 参数化音频编译码方案的取证检测
CN107103907B (zh) * 2011-08-17 2021-01-26 瑞典爱立信有限公司 编码器能力的动态发信号通知的机制
USRE48258E1 (en) 2011-11-11 2020-10-13 Dolby International Ab Upsampling using oversampled SBR
US9380320B2 (en) * 2012-02-10 2016-06-28 Broadcom Corporation Frequency domain sample adaptive offset (SAO)
US9212946B2 (en) * 2012-06-08 2015-12-15 General Electric Company Campbell diagram displays and methods and systems for implementing same
KR101920029B1 (ko) * 2012-08-03 2018-11-19 삼성전자주식회사 모바일 장치 및 제어방법
EP2704142B1 (en) * 2012-08-27 2015-09-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
KR101775086B1 (ko) * 2013-01-29 2017-09-05 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에.베. 주파수 향상 오디오 신호를 생성하는 디코더, 디코딩 방법, 인코딩된 신호를 생성하는 인코더, 및 컴팩트 선택 사이드 정보를 이용한 인코딩 방법
US9060223B2 (en) * 2013-03-07 2015-06-16 Aphex, Llc Method and circuitry for processing audio signals
BR112015025080B1 (pt) * 2013-04-05 2021-12-21 Dolby International Ab Método de decodificação e decodificador para decodificar dois sinais de áudio, método de codificação e codificador para codificar dois sinais de áudio, e meio legível não transitório
KR102150496B1 (ko) * 2013-04-05 2020-09-01 돌비 인터네셔널 에이비 오디오 인코더 및 디코더
EP2830055A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Context-based entropy coding of sample values of a spectral envelope
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830049A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for efficient object metadata coding
EP2830064A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection
WO2015041070A1 (ja) 2013-09-19 2015-03-26 ソニー株式会社 符号化装置および方法、復号化装置および方法、並びにプログラム
SG11201605015XA (en) 2013-12-27 2016-08-30 Sony Corp Decoding device, method, and program
US20150350784A1 (en) * 2014-04-03 2015-12-03 Uma Satish Doshi Music adaptive speaker system and method
EP2963648A1 (en) * 2014-07-01 2016-01-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio processor and method for processing an audio signal using vertical phase correction
CN106448688B (zh) 2014-07-28 2019-11-05 华为技术有限公司 音频编码方法及相关装置
EP2980792A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating an enhanced signal using independent noise-filling
WO2016040885A1 (en) 2014-09-12 2016-03-17 Audience, Inc. Systems and methods for restoration of speech components
US9668048B2 (en) 2015-01-30 2017-05-30 Knowles Electronics, Llc Contextual switching of microphones
EP4123643B1 (en) 2015-03-03 2024-06-19 Dolby Laboratories Licensing Corporation Enhancement of spatial audio signals by modulated decorrelation
WO2016142002A1 (en) 2015-03-09 2016-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder, method for encoding an audio signal and method for decoding an encoded audio signal
TWI693595B (zh) * 2015-03-13 2020-05-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
TWI771266B (zh) 2015-03-13 2022-07-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
JP6611042B2 (ja) * 2015-12-02 2019-11-27 パナソニックIpマネジメント株式会社 音声信号復号装置及び音声信号復号方法
TWI895201B (zh) 2018-01-26 2025-08-21 瑞典商都比國際公司 用於執行一音訊信號之高頻重建之方法、音訊處理單元及非暫時性電腦可讀媒體
WO2019145955A1 (en) 2018-01-26 2019-08-01 Hadasit Medical Research Services & Development Limited Non-metallic magnetic resonance contrast agent
IL313348B2 (en) * 2018-04-25 2025-08-01 Dolby Int Ab Integration of high frequency reconstruction techniques with reduced post-processing delay
CN118800273A (zh) * 2018-04-25 2024-10-18 杜比国际公司 高频音频重建技术的集成
GB202203733D0 (en) * 2022-03-17 2022-05-04 Samsung Electronics Co Ltd Patched multi-condition training for robust speech recognition
CN114882867B (zh) * 2022-04-13 2024-05-28 天津大学 基于滤波器组频率区分的深度网络波形合成方法及装置
US12469506B2 (en) * 2023-06-13 2025-11-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for audio decoding supporting two spectral band replication modes

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US5898605A (en) * 1997-07-17 1999-04-27 Smarandoiu; George Apparatus and method for simplified analog signal record and playback
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
SE0004818D0 (sv) * 2000-12-22 2000-12-22 Coding Technologies Sweden Ab Enhancing source coding systems by adaptive transposition
EP1423847B1 (en) * 2001-11-29 2005-02-02 Coding Technologies AB Reconstruction of high frequency components
JP3864098B2 (ja) 2002-02-08 2006-12-27 日本電信電話株式会社 動画像符号化方法、動画像復号方法、及びこれらの方法の実行プログラムとこれらの実行プログラムを記録した記録媒体
US7542896B2 (en) 2002-07-16 2009-06-02 Koninklijke Philips Electronics N.V. Audio coding/decoding with spatial parameters and non-uniform segmentation for transients
EP2267698B1 (en) 2002-09-04 2012-01-25 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes.
DE10252327A1 (de) * 2002-11-11 2004-05-27 Siemens Ag Verfahren zur Erweiterung der Bandbreite eines schmalbandig gefilterten Sprachsignals, insbesondere eines von einem Telekommunikationsgerät gesendeten Sprachsignals
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
KR100917464B1 (ko) * 2003-03-07 2009-09-14 삼성전자주식회사 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치
US7460990B2 (en) * 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP4241417B2 (ja) 2004-02-04 2009-03-18 日本ビクター株式会社 算術復号化装置、および算術復号化プログラム
DE602004010188T2 (de) 2004-03-12 2008-09-11 Nokia Corp. Synthese eines mono-audiosignals aus einem mehrkanal-audiosignal
FI119533B (fi) * 2004-04-15 2008-12-15 Nokia Corp Audiosignaalien koodaus
ATE429011T1 (de) * 2005-01-31 2009-05-15 Harman Becker Automotive Sys Bandbreitenerweiterung eines schmalbandigen akustischen signals
JP4438663B2 (ja) 2005-03-28 2010-03-24 日本ビクター株式会社 算術符号化装置及び算術符号化方法
KR100713366B1 (ko) 2005-07-11 2007-05-04 삼성전자주식회사 모폴로지를 이용한 오디오 신호의 피치 정보 추출 방법 및그 장치
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
JP4211780B2 (ja) 2005-12-27 2009-01-21 三菱電機株式会社 デジタル信号符号化装置、デジタル信号復号装置、デジタル信号算術符号化方法、およびデジタル信号算術復号方法
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
JP2007300455A (ja) 2006-05-01 2007-11-15 Victor Co Of Japan Ltd 算術符号化装置、および算術符号化装置におけるコンテキストテーブル初期化方法
WO2007148925A1 (en) * 2006-06-21 2007-12-27 Samsung Electronics Co., Ltd. Method and apparatus for adaptively encoding and decoding high frequency band
JP2008098751A (ja) 2006-10-06 2008-04-24 Matsushita Electric Ind Co Ltd 算術符号化装置及び算術復号化装置
US7912729B2 (en) * 2007-02-23 2011-03-22 Qnx Software Systems Co. High-frequency bandwidth extension in the time domain
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication
JP5244971B2 (ja) 2008-07-11 2013-07-24 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン オーディオ信号合成器及びオーディオ信号符号器
DK3573056T3 (da) 2008-07-11 2022-10-03 Fraunhofer Ges Forschung Audiokoder og audioafkoder

Also Published As

Publication number Publication date
CN102089816A (zh) 2011-06-08
US8731948B2 (en) 2014-05-20
WO2010003539A1 (en) 2010-01-14
RU2491658C2 (ru) 2013-08-27
EP2301026A1 (en) 2011-03-30
TWI441162B (zh) 2014-06-11
CO6341675A2 (es) 2011-11-21
BRPI0910792A2 (pt) 2015-10-06
CA2730198A1 (en) 2010-01-14
AR072864A1 (es) 2010-09-29
CA2730198C (en) 2014-09-16
KR20110040817A (ko) 2011-04-20
CN102089816B (zh) 2013-01-30
JP5244971B2 (ja) 2013-07-24
BRPI0910792B1 (pt) 2020-03-24
AU2009267525B2 (en) 2012-12-20
MX2011000372A (es) 2011-05-19
JP2011527447A (ja) 2011-10-27
US20110173006A1 (en) 2011-07-14
KR101223835B1 (ko) 2013-01-17
US10014000B2 (en) 2018-07-03
ES2796552T3 (es) 2020-11-27
US20140222434A1 (en) 2014-08-07
EP2301026B1 (en) 2020-03-04
US10522168B2 (en) 2019-12-31
US20180350387A1 (en) 2018-12-06
AU2009267525A1 (en) 2010-01-14
RU2011101616A (ru) 2012-07-27
ZA201009208B (en) 2011-10-26

Similar Documents

Publication Publication Date Title
TWI441162B (zh) 音訊信號合成器、音訊信號編碼器、用於產生合成音訊信號及資料流的方法、電腦可讀取媒體及電腦程式
US11646043B2 (en) Audio encoder and bandwidth extension decoder
US9305564B2 (en) Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal
CN105706166B (zh) 对比特流进行解码的音频解码器设备和方法
RU2741379C1 (ru) Оборудование для кодирования или декодирования кодированного многоканального сигнала с использованием заполняющего сигнала, сформированного посредством широкополосного фильтра
JP6535730B2 (ja) 独立したノイズ充填を用いた強化された信号を生成するための装置および方法
KR101430335B1 (ko) 가이드된 대역폭 확장 및 블라인드 대역폭 확장을 이용하여 광대역 신호를 생성하는 장치, 방법 및 컴퓨터 프로그램
KR101387808B1 (ko) 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
AU2015203736B2 (en) Audio encoder and bandwidth extension decoder
HK1155553B (zh) 音频信号合成器及音频信号编码器
HK1155553A (zh) 音频信号合成器及音频信号编码器