TWI488177B - 使用頻譜域雜訊整形之基於線性預測的編碼方案 - Google Patents
使用頻譜域雜訊整形之基於線性預測的編碼方案 Download PDFInfo
- Publication number
- TWI488177B TWI488177B TW101104673A TW101104673A TWI488177B TW I488177 B TWI488177 B TW I488177B TW 101104673 A TW101104673 A TW 101104673A TW 101104673 A TW101104673 A TW 101104673A TW I488177 B TWI488177 B TW I488177B
- Authority
- TW
- Taiwan
- Prior art keywords
- spectrum
- spectral
- autocorrelation
- linear prediction
- audio encoder
- Prior art date
Links
- 230000003595 spectral effect Effects 0.000 title claims description 122
- 238000007493 shaping process Methods 0.000 title claims description 36
- 238000001228 spectrum Methods 0.000 claims description 145
- 238000000034 method Methods 0.000 claims description 26
- 238000001914 filtration Methods 0.000 claims description 18
- 238000006243 chemical reaction Methods 0.000 claims description 13
- 238000013139 quantization Methods 0.000 claims description 13
- 238000004590 computer program Methods 0.000 claims description 11
- 230000001052 transient effect Effects 0.000 claims description 4
- 230000002441 reversible effect Effects 0.000 claims description 3
- 230000005236 sound signal Effects 0.000 description 21
- 230000006870 function Effects 0.000 description 9
- 238000010586 diagram Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 238000012546 transfer Methods 0.000 description 6
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 241001589086 Bellapiscis medius Species 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000002123 temporal effect Effects 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 230000000052 comparative effect Effects 0.000 description 2
- 238000012074 hearing test Methods 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 230000000996 additive effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008450 motivation Effects 0.000 description 1
- 238000011045 prefiltration Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000010085 xinqin Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10K—SOUND-PRODUCING DEVICES; METHODS OR DEVICES FOR PROTECTING AGAINST, OR FOR DAMPING, NOISE OR OTHER ACOUSTIC WAVES IN GENERAL; ACOUSTICS NOT OTHERWISE PROVIDED FOR
- G10K11/00—Methods or devices for transmitting, conducting or directing sound in general; Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
- G10K11/16—Methods or devices for protecting against, or for damping, noise or other acoustic waves in general
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/012—Comfort noise or silence coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
- G10L19/025—Detection of transients or attacks for time/frequency resolution switching
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/03—Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/10—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a multipulse excitation
- G10L19/107—Sparse pulse excitation, e.g. by using algebraic codebook
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
- G10L19/13—Residual excited linear prediction [RELP]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/06—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being correlation coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Mathematical Analysis (AREA)
- Theoretical Computer Science (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Physics (AREA)
- Mathematical Optimization (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本發明有關於使用頻域雜訊整形,諸如得知於USAC的TCX模式之基於線性預測的音訊編解碼器。
作為一相對較新的音訊編解碼器,USAC最近已經完成。USAC是一種支援在若干編碼模式間切換的編解碼器,該等編碼模式諸如一類AAC編碼模式,一使用線性預測編碼的時域編碼模式,即ACELP,及一形成中間編碼模式的轉換編碼激勵編碼,頻譜域整形依據該中間編碼模式利用經由資料流所發送之線性預測係數被控制。在WO 2011147950中,提議藉由排除類AAC編碼模式的可用性且將編碼模式僅局限於ACELP及TCX而使USAC編碼方案更適於低延遲應用。而且,還建議減少訊框長度。
然而,有利的是將有可能減少使用頻譜域整形之一基於線性預測的編碼方案的複雜性同時實現近似的編碼效率,例如就比率/失真比而言。
因此,本發明之目的-提供此一使用頻譜域整形之基於線性預測的編碼方案,允許在類似或甚至增加的編碼效率下降低複雜性。
此目的藉由審查中之獨立申請專利範圍之技術標的來實現。
本發明之基本概念是倘若音訊輸入信號頻譜分解成包
含一頻譜序列之一譜圖是被使用於線性預測係數計算以及基於線性預測係數之一頻譜域整形的輸入兩者,則基於線性預測且使用頻譜域雜訊整形的編碼概念在一類似編碼效率之下,例如就比率/失真比而言,得以具有較低的複雜性。
在這一方面,已發現,即使此一重疊轉換使用於頻譜分解導致混疊,且混疊消除,諸如嚴格取樣之重疊轉換,諸如MDCT需要時間,編碼效率也保持不變。
本發明之層面之有利實施態樣是依附申請專利範圍之主題。
詳言之,本申請案之較佳實施例相關於諸圖而被描述,其中:第1圖繪示依據一比較或實施例的一音訊編碼器的一方塊圖;第2圖繪示依據本申請案之一實施例的一音訊編碼器;第3圖繪示適合於第2圖之音訊編碼器的一可實行的音訊解碼器的一方塊圖;以及第4圖繪示依據本申請案之一實施例的一替代音訊編碼器的一方塊圖。
為了便於理解在下文中進一步描述的本發明之實施例的主要層面及優勢,首先參照第1圖,其繪示使用頻譜域雜訊整形之基於線性預測的音訊編碼器。
詳言之,第1圖之音訊編碼器包含一頻譜分解器10,用
以將一輸入音訊信號12頻譜分解成由一頻譜序列組成的一譜圖,如第1圖中的14所指示者。如第1圖中所示者,頻譜分解器10可使用一MDCT以將輸入音訊信號10由時域轉換到頻譜域。詳言之,一視窗程式16在頻譜分解器10之MDCT模組18之前,以視窗化輸入音訊信號12之互相重疊部分,其視窗化部分在MDCT模組18中單獨接受各自的轉換以獲得譜圖14之頻譜序列之頻譜。然而,頻譜分解器10可替換地使用任何其他導致混疊的重疊轉換,諸如任何其他嚴格取樣的重疊轉換。
而且,第1圖之音訊編碼器包含一線性預測分析器20,用以分析輸入音訊信號12以由此導出線性預測係數。第1圖之音訊編碼器之一頻譜域整形器22被配置成基於由線性預測分析器20所提供之線性預測係數來對譜圖14之頻譜序列之一當前頻譜頻譜整形。詳言之,頻譜域整形器22被配置成依據對應於一線性預測分析濾波器傳送函數的一傳送函數來對進入頻譜域整形器22的一當前頻譜進行頻譜整形,此係藉由將來自分析器20的線性預測係數轉換成頻譜加權值且應用加權值作為除數以頻譜形成或整形該當前頻譜。整形後之頻譜在第1圖之音訊編碼器之一量子化器24中量子化。由於頻譜域整形器22中的整形,在解碼器端對量子化頻譜進行去整形時所產生的量子化雜訊被轉移而被隱藏,即編碼盡可能的是感知透明的。
僅為了完整起見,應指出的是,一時間雜訊整形模組26可以選擇性地使自頻譜分解器10轉發至頻譜域整形器22
之頻譜接受時間雜訊整形,且一低頻加重模組28可以在量子化24之前適應性地過濾由頻譜域整形器22所輸出的每一整形後頻譜。
量子化且頻譜整形後之頻譜連同關於頻譜整形中所使用的線性預測係數的資訊被插入到資料流30中,使得在解碼端,去整形及去量子化可被執行。
除TNS模組26之外,第1圖中所示之音訊編解碼器之絕大部分,例如是在新音訊編解碼器USAC中,且特別是在其TCX模式內被實現及描述。因此,詳情請參照示範性的USAC標準,例如[1]。
然而,下文中更著重於描述線性預測分析器20。如第1圖中所示者,線性預測分析器20直接對輸入音訊信號12運作。一預加重模組32諸如,舉例而言,藉由FIR濾波而對輸入音訊信號12預濾波,且之後,一自相關藉由級聯之一視窗程式34、自相關器36及滯後視窗程式38而被連續導出。視窗程式34從預濾波輸入音訊信號中形成視窗化部分,該視窗化部分可能在時間上互相重疊。自相關器36計算由視窗程式34所輸出的每一視窗化部分的一自相關,且滯後視窗程式38被選擇性地提供,以對自相關應用一滯後視窗函數,以使自相關更加適於下述線性預測參數估計演算法。詳言之,一線性預測參數估計器40接收滯後視窗輸出,且對視窗化自相關執行,例如維納-列文遜-杜賓或其他適合的演算法以導出每一自相關的線性預測係數。在頻譜域整形器22內,所產生的線性預測係數通過一模組鏈42、44、46
及48。模組42負責將關於資料流30內之線性預測係數的資訊傳送到解碼端。如第1圖中所示者,線性預測係數資料流插入器42可被配置成執行線性預測係數之量子化,該線性預測係數是由線性預測分析器20以一線譜對或線譜頻域所決定的,同時將量子化之係數編碼到資料流30中且再次將量子化之預測值重新轉換成LPC係數。可自由選擇地,某種內插可被使用,以降低有關線性預測係數的資訊在資料流30內輸送的更新率。因此,負責使關於進入頻譜域整形器22之當前頻譜的線性預測係數接受某種加權程序的後續模組44可以近用線性預測係數,因為它們也可在解碼端獲得,即近用量子化之線性預測係數。其後的一模組46將加權之線性預測係數轉換成頻譜權重,該等頻譜權重接著由頻域雜訊整形器模組48來應用,以對接收當前頻譜進行頻譜整形。
由上述討論可清楚看出,由分析器20所執行之線性預測分析導致冗餘工作,該冗餘工作完全地增加到方塊10及22中所執行的頻譜分解及頻譜域整形上,且因此,計算冗餘工作是相當大的。
第2图繪示依據本申請案之一實施例的一音訊編碼器,該音訊編碼器提供相當的編碼效率,但是編碼複雜性降低。
簡言之,在代表本申請案之一實施例的第2圖之音訊編碼器中,第1圖之線性預測分析器由一被串連在頻譜分解器10與頻譜域整形器22之間、一級聯之一自相關電腦50及一
線性預測係數電腦52所取代。由第1圖修改成第2圖的動機及揭示模組50及52之詳細功能的數學解釋將在下文中提供。然而,顯而易見的是,鑒于自相關電腦50涉及的計算與自相關及自相關前之視窗化的一系列計算相比較不複雜,第2圖之音訊編碼器之計算冗餘工作較第1圖之音訊編碼器降低。
在描述第2圖之實施例之詳細的數學架構之前,第2圖之音訊編碼器之結構被簡短地描述。詳言之,使用參考符號60概示的第2圖之音訊編碼器包含用以接收輸入音訊信號12的一輸入62及用以輸出資料流30的一輸出64,音訊編碼器將輸入音訊信號12編碼到資料流30中。頻譜分解器10、時間雜訊整形器26、頻譜域整形器22、低頻加重器28及量子化器24在輸入62與輸出64之間以提到的順序串連。時間雜訊整形器26及低頻加重器28是可自由選擇的模組,且依據一替代實施例可被省略。若存在的話,時間雜訊整形器26可被配置成可適應性地啟動,即藉由時間雜訊整形器26進行的時間雜訊整形例如可視輸入音訊信號的特性而啟動或停用,決策之結果例如是經由資料流30被傳送至解碼端,這將在下文中更加詳細地說明。
如第1圖中所示者,第2圖之頻譜域整形器22的內部如同已相關於第1圖所描述地被構建。然而,第2圖之內部結構並不欲被理解為一關鍵點且頻譜域整形器22之內部結構也可能是與第2圖中所示之確實結構不同的。
第2圖之線性預測係數電腦52包含串連在自相關電腦
50與頻譜域整形器22之間的滯後視窗程式38及線性預測係數估計器40。應指出的是,滯後視窗程式,舉例而言,也是一可自由選擇的特徵。若存在的話,由滯後視窗程式38對由自相關電腦50所提供之個別自相關所應用的視窗可以是一高斯或二項分布形狀視窗。有關線性預測係數估計器40,應指出的是,其不一定使用維納-列文遜-杜賓演算法。而是可使用一不同的演算法以計算線性預測係數。
自相關電腦50內部包含一功率譜電腦54,後接一標度扭曲器/頻譜加權器56,其復後接一反轉換器58的一序列。模組54至58之序列之細節及重要性將在下文中更加詳細地加以描述。
為了理解為什麽分解器10之頻譜分解可共同用於整形器22內之頻譜域雜訊整形以及線性預測係數計算,應該考量維納-辛欽定理,該定理表明一自相關可使用一DFT來算出:
其中 k
=0,...,N
-1m
=0,...,N
-1
因此,Rm
是DFT是Xk
時,信號部分xn
之自相關之自相關係數。
因此,若頻譜分解器10將使用一DFT以實施重疊轉換並產生輸入音訊信號12之頻譜序列,則自相關計算器50將能夠僅藉由遵照上文概述之維納-辛欽定理在其輸出執行一較快的自相關計算。
若需要自相關之所有滯後m的值,則頻譜分解器10之DFT可使用一FFT而被執行,且一反FFT可在自相關電腦50內使用,以使用剛才提到之公式由此導出自相關。然而,當僅需要M<<N個滯後時,使用一FFT來頻譜分解將更迅速,且直接應用一反DFT以獲得相關的自相關係數。
當上文提到之DFT被一ODFT,即奇頻DFT所取代時,也是這樣,其中一時間序列x之一般化DFT被定義為:
且對ODFT(奇頻DFT)設定
然而,若一MDCT而非一DFT或FFT被用在第2圖之實施例中,則情況不同。MDCT包括一IV型離散餘弦轉換且僅揭示一實值頻譜。也就是說,相位資訊因此一轉換而失去。MDCT可被寫作:
其中xn
,n=0...2N-1,定義由視窗程式16所輸出的輸入音訊信號12之一當前視窗化部分,且Xk
相應地是對於此視窗化部分所產生的頻譜之第k個頻譜係數。
功率譜電腦54依據下式藉由求每一轉換係數Xk
的平方由MDCT之輸出來計算功率譜:S k
=|X k
|2 k
=0,...,N
-1
由Xk
所定義的一MDCT頻譜與一ODFT譜Xk ODFT
之間的關係可被寫成:
這意味著自相關電腦50使用MDCT而非一ODFT作為輸入來執行MDCT之自相關程序,等效於使用以下之一頻譜加權由ODFT所獲得的自相關:
然而,所決定的自相關之此一失真對解碼端是透通的,因為整形器22內之頻譜域整形在與頻譜分解器10中之一完全相同的頻譜域,即MDCT中進行。換言之,由於藉由第2圖之頻域雜訊整形器48之頻域雜訊整形被應用在MDCT域中,這實際上意指當MDCT被一ODFT所取代時,頻譜加權f k mdct
與MDCT之調變互相抵消且產生如第1圖中所示之一習知LPC的相似結果。
因此,在自相關電腦50中,反轉換器58執行一反ODFT且一對稱的實數輸入之一反ODFT等於一DCT II型:
因此,由於藉反ODFT在反轉換器58之輸出所決定的自相關僅需要較少的計算步驟,諸如上文所概述之求平方,及功率譜電腦54與反轉換器58中的反ODFT,而得到相對較低的計算成本,這允許第2圖之自相關電腦50中之基於MDCT的LPC之一快速計算。
關於標度扭曲器/頻譜加權器56的細節還未被描述。詳言之,此模組是可自由選擇的且可被省略或被一頻域抽取濾波器所取代。關於由模組56所執行之可能的量測的細節在下文中描述。然而,在此之前,關於第2圖中所示之某些其他元件的某些細節被概述。關於滯後視窗程式38,例如,應指出的是,同可執行一白雜訊補償以改良由估計器40所執行之線性預測係數估計之調節。模組44中所執行的LPC加權是可自由選擇的,但是,若存在的話,其可被執行以實現一實際的頻寬擴展。也就是說,LPC的極點以一依據下式的常數因子移向原點,例如,
因此,所執行之LPC加權接近同步遮罩。一常數γ=0.92或0.85到0.95之間,包含二端值的一常數產生良好結果。
關於模組42,應指出的是,可變位元率編碼某一其他熵編碼方案可被使用,以將關於線性預測係數的資訊編碼到資料流30中。如上文所提到者,量子化可在LSP/LSF域中執行,但是ISP/ISF域也是可行的。
關於LPC對MDCT模組46,其將LPC轉換成頻譜加權值,該頻譜加權值在MDCT域情況下,於下文中例如在詳
細說明此轉換提到USAC編解碼器時稱為MDCT增益。簡言之,LPC係數可接受一ODFT,以獲得MDCT增益,其倒數則可被使用作權重以藉由對各自的頻譜帶應用所產生的權重對模組48中的頻譜整形。例如,16個LPC係數被轉換成MDCT增益。當然,在解碼器端是用使用非倒數形式的MDCT增益加權,而非使用倒數加權,以獲得類似一LPC合成濾波器的一傳送函數,俾使形成上文所提到的量子化雜訊。因此,摘要而言,在模組46中,匯總FDNS 48所使用的增益是使用一ODFT由線性預測係數而獲得的,且在使用MDCT的情況下稱作MDCT增益。
為了完整起見,第3圖繪示可用以由資料流30再次重建音訊信號的一音訊解碼器的一可能的實施態樣。第3圖之解碼器包含一可自由選擇的低頻去加重器80,一頻譜域去整形器82,一同為可自由選擇的時間雜訊去整形器84,及一頻譜域對時域轉換器86,它們被串連在資料流30進入音訊解碼器之一資料流輸入88與重建音訊信號被輸出的音訊解碼器之一輸出90之間。低頻去加重器自資料流30接收量子化且頻譜整形後之頻譜且對其執行一濾波,其是第2圖之低頻加重器之傳送函數的反函數。然而,如先前所提到者,去加重器80是可自由選擇的。
頻譜域去整形器82具有一與第2圖之頻譜域整形器22結構非常類似的結構。詳言之,內部同樣包含一級聯的LPC抽取器92、與LPC加權器44等同的LPC加權器94,一同樣與第2圖之模組46相同的LPC對MDCT轉換器96,及一頻域雜
訊整形器98,與第2圖之FDNS 48相反地,頻域雜訊整形器98藉由乘法而非除法對接收(去加重)頻譜應用MDCT增益,以獲得一對應於由LPC抽取器92自資料流30所抽取之線性預測係數之一線性預測合成濾波器的一傳送函數。LPC抽取器92可在一對應的量子化域諸如LSP/LSF或ISP/ISF中執行上文所提到之再轉換,以獲得被編碼至欲被重建的音訊信號之連續相互重疊部分的資料流30中的個別頻譜的線性預測係數。
時域雜訊整形器84逆轉第2圖之模組26之濾波,且這些模組之可能實施態樣在下文中被更加詳細地描述。然而,無論如何,第3圖之TNS模組84都是可自由選擇的,且也可如相關於第2圖之TNS模組26所提到的被省略。
頻譜組合器86內部包含一反轉換器100,例如可用以對接收去整形頻譜個別執行一IMDCT,後接一混疊消除器,諸如一重疊相加相加器102,其被配置成正確地暫時寄存由再轉換器100輸出之重建視窗版本以執行時間混疊消除,且在輸出90輸出重建音訊信號。
如上文所提到者,由於頻譜域整形22依據對應於由在資料流30內傳送的LPC係數所定義的一LPC分析濾波器的一傳送函數,例如具有一頻譜白雜訊之量子化器24中的量子化由頻譜域去整形器82在一解碼端以隱藏於遮罩閾值下的方式被整形。
在解碼器及其逆轉,即模組84中有實施TNS模組26的不同可能性。時間雜訊整形是用以整形由所提到的頻譜域
整形器頻譜形成個別頻譜的時間部分內的時間意義上雜訊。在暫態存在於所指涉當前頻譜的各別時間部分內的情況下時間雜訊整形是特別有用的。依據一特定實施例,時間雜訊整形器26被配置成一頻譜預測器,其被配置成預測性地過濾由頻譜分解器10沿一頻譜維度所輸出之當前頻譜或頻譜序列。也就是說,頻譜預測器26也可決定可插入到資料流30中的預測濾波器係數。這由第2圖中的一虛線繪示。結果,時間雜訊濾波頻譜沿頻譜維度而被平坦化,且由於頻譜域與時域之間的關係,時域雜訊去整形器84內的反濾波與資料流30內發送的時域雜訊整形預測濾波器一致,去整形導致起音或暫態發生時刻的雜訊隱藏或壓縮。所謂的預回音從而被避免。
換言之,藉由在時域雜訊整形器26中預測性地過濾當前頻譜,時域雜訊整形器26獲得頻譜提醒項目,即被轉發至頻譜域整形器22的預測性濾波之頻譜,其中對應的預測係數被插入到資料流30中。時域雜訊去整形器84復自頻譜域去整形器82接收去整形後之頻譜且藉由依據自資料流所接收,或自資料流30所抽取之預測濾波器來反濾波此一頻譜而沿頻譜域逆轉時域濾波。換言之,時域雜訊整形器26使用一分析預測濾波器,諸如線性預測濾波器,而時域雜訊去整形器84使用基於相同預測係數的一對應的合成濾波器。
如先前所提到者,音訊編碼器可被配置成依濾波器預測增益或音訊輸入信號12的一音調或瞬態特性來決定致能或去能在對應於當前頻譜之各自的時間部分的時間雜訊整
形。同樣,關於決策的各別資訊被插入到資料流30中。
在下文中,自相關電腦50被配置成如第2圖中所示,由預測性濾波,即頻譜之TNS濾波版本而非未濾波頻譜來計算自相關的可能性被討論。存在兩種可能性:TNS被應用,或以一方式,例如基於欲編碼之輸入音訊信號12之特性而被音訊編碼器選擇時,TNS濾波頻譜即可被使用。因此,第4圖之音訊編碼器與第2圖之音訊編碼器不同之處在於自相關電腦50之輸入被連接至頻譜分解器10之輸出以及TNS模組26之輸出。
如剛才所述,由頻譜分解器10所輸出之TNS濾波之MDCT頻譜可被用作電腦50內之自相關計算的一輸入或基礎。如剛才所述,當TNS被應用,或音訊編碼器在使用未濾波頻譜或TNS濾波頻譜之間可決定TNS應用於頻譜時,TNS濾波頻譜即可被使用。如上所述者,可依音訊輸入信號之特性做決策。但決筞對於解碼器可能是通透的,該解碼器僅對頻域去整形應用LPC係數資訊。另一可能性是音訊編碼器在TNS所應用之頻譜的TNS濾波頻譜與非濾波頻譜之間切換,即依頻譜分解器10所選擇的轉換長度在這些頻譜的二選項間做決定。
更準確地說,第4圖中的分解器10可被配置成在頻譜分解音訊輸入信號時在不同的轉換長度之間切換,使得由頻譜分解器10所輸出之頻譜將具有不同的頻譜解析度。也就是說,頻譜分解器10例如將使用一重疊轉換,諸如MDCT,以將不同長度之互相重疊時間部分轉換成為轉換版本或同
樣具有不同長度之頻譜,其中頻譜之轉換長度對應於對應的重疊時間部分之長度。在此情況下,若當前頻譜之一頻譜解析度滿足一預定準則,則自相關電腦50可被配置成由預測性濾波或TNS濾波之當前頻譜來計算自相關,或若當前頻譜之頻譜解析度不滿足預定準則,則由未預測性濾波,即未濾波之當前頻譜來計算自相關。預定準則例如可以是當前頻譜之頻譜解析度超過某一閾值。例如,將由TNS模組26所輸出之TNS濾波頻譜使用於自相關計算對較長訊框(時間部分),諸如15ms以上訊框是有利的,但是對較短訊框(時間部分),例如15ms以下者可能不利,且因此,對於較長訊框,自相關電腦50的輸入可以是TNS濾波之MDCT頻譜,而對於較短訊框,由分解器10所輸出之MDCT頻譜可被直接使用。
迄今還未描述哪些感知相關修改可在模組56內之功率譜上執行。現在,各種量測被說明,且它們可被個別或組合應用於到目前為止所述的所有實施例及變異形式。詳言之,一頻譜加權可藉由模組56應用於由功率譜電腦54所輸出之功率譜。頻譜加權可以是:
其中Sk
是上文所提到的功率譜之係數。
頻譜加權可被使用作為一機制以供依據心理聲學方面來分配量子化雜訊。對應於第1圖之意義的一預加重的頻譜加權可藉由下式來定義:
此外,標度扭曲可在模組56內使用。完整的頻譜例如可被分割為對應於樣本長度為l1
的訊框或時間部分的頻譜之M個頻帶,及對應於樣本長度為l2
的訊框之時間部分的頻譜之2M個頻帶,其中l2
可能是l1
的兩倍,其中l1
可以是64、128或256。詳言之,分割可遵照:
頻帶分割可包括頻率依據下式扭曲成巴克頻譜(Bark scale)的一近似值:
可選擇地,頻帶可均等分配以形成依據下式的一線性標度:
對於長度為例如l1
的訊框之頻譜,頻帶數目可能在20到40之間,且對於長度為l2
的訊框之頻譜,在48到72之間,其中32個頻帶對應於長度為l1
的訊框之頻譜,且64個頻帶對應於長度為l2
的訊框之頻譜是較佳的。
由可自由選擇的模組56選擇性執行之頻譜加權及頻率扭曲可被視為一位元分配(量子化雜訊整形)手段。對應於預加重的一線性標度中的頻譜加權可使用一常數μ=0.9或位
於0.8到0.95之間的一常數來執行,使得對應的預加重將接近對應於巴克標度扭曲。
模組56內的功率譜之修改可包括功率譜之擴展,模型化同步遮罩,且因此取代LPC加權模組44及94。
若一線性標度被使用,且對應於預加重的頻譜加權被應用,則在解碼端,即在第3圖之音訊解碼器之輸出所獲得的第4圖之音訊編碼器的結果,在感知上非常類似於依據第1圖之實施例所獲得的習知的重建結果。
某些聽力測試結果已使用上文所確認之實施例而被執行。由該等測試,結果證明第1圖中所示之習知的LPC分析及基於線性標度MDCT之LPC分析產生感知相等結果,當.基於MDCT之LPC分析中的頻譜加權對應於習知的LPC分析中的預加重,.同一視窗化被使用在頻譜分解內,諸如低重疊正弦視窗,及.線性標度被用在基於MDCT之LPC分析中。
習知的LPC分析與基於線性標度MDCT之LPC分析之間的可忽略差異可能源於LPC被用於量子化雜訊整形,以及在48 kbit/s下有足夠的位元來充分精確地編碼MDCT係數。
而且,結果證明在模組56內藉由應用標度扭曲而使用巴克標度或非線性標度產生編碼效率或聽力測試的結果,依據該結果,對於測試音訊片段Applause、Fatboy、RockYou、Waiting、bohemian、fuguepremikres、kraftwerk、lesvoleurs、teardrop,巴克標度勝過線性標度。
巴克標度對hockey及linchpin非常失敗。在巴克標度中有問題的另一項目是bibilolo,但是因其呈現具有特定頻譜結構的一實驗音樂而並不包括在測試內。某些聽眾也表示對bibilolo項目的強烈反感。
然而,第2及4圖之音訊編碼器可以在不同的標度之間切換。也就是說,模組56可依音訊信號之特性,諸如瞬態特性或音調對不同的頻譜應用不同的標度,或使用不同的頻率標度來產生多個量子化信號及一決定哪一量子化信號是感知最佳者的量度。結果證明,標度切換在有暫態,諸如RockYou及linchpin中的暫態存在下產生與非切換版本(巴克及線性標度)相較之下的改良結果。
應提到的是,上文概述之實施例可被用作一多模式音訊編解碼器,諸如支援ACELP的編解碼器中的TCX模式,且上文概述之實施例為一類TCX模式。在成框上,一恆定長度,諸如20ms之訊框可被使用。以此方式,一種USAC編解碼器的低延遲版本可被獲得而非常高效率。在TNS上,來自AAC-ELD的TNS可被使用。為了減少旁側資訊所使用的位元的數目,濾波器的數目可被固定成兩個,一個在600Hz到4500Hz之間運作,且第二個在4500Hz到核心編碼器頻譜之末端間運作。濾波器可獨立地切換成打開及關閉。濾波器可使用偏相關係數以一格點被應用並發送。一濾波器的最大階數可被設定成八且每一濾波器係數可使用四個位元。霍夫曼編碼可用以減少使用於一濾波器之階數及其係數之位元的數目。
儘管有些層面已就一裝置而被描述,但是應清楚的是,這些層面還代表對應方法之說明,其中一方塊或裝置對應於一方法步驟或一方法步驟之一特徵。類似地,就一方法步驟而描述的層面也代表一對應裝置之對應方塊或項目或特徵的說明。某些或全部方法步驟可由一硬體裝置來執行(或使用),像例如微處理器、可程式電腦或電子電路。在某些實施例中,某一個或多個最重要的方法步驟可由此一裝置來執行。
視某些實施要求而定,本發明實施例可以硬體或以軟體來實施。該實施可使用一數位儲存媒體來執行,例如其上儲存有電子可讀取控制信號的軟碟、DVD、藍光光碟、CD、ROM、PROM、EPROM、EEPROM或FLASH記憶體,該等電子可讀取控制信號與一可程式電腦系統協作(或能夠與之協作),使得各別方法得以執行。因此,數位儲存媒體可能是電腦可讀的。
依據本發明的某些實施例包含具有電子可讀取控制信號的一資料載體,該等電子可讀取控制信號能夠與一可程式電腦系統協作,使得本文所述諸方法中的一者得以執行。
一般而言,本發明實施例可被實施為具有一程式碼的一電腦程式產品,當該電腦程式產品在一電腦上運行時,該程式碼可操作以執行該等方法中的一者。該程式碼可以,例如儲存在一機器可讀取載體上。
其他實施例包含儲存在一機器可讀取載體上,用以執行本文所述諸方法中的一者的電腦程式。
因此,換言之,本發明方法的一實施例是具有一程式碼的一電腦程式,當該電腦程式在一電腦上運行時,該程式碼用以執行本文所述諸方法中的一者。
因此,本發明方法的另一實施例是包含記錄在其上用以執行本文所述諸方法中的一者的電腦程式的一資料載體(或一數位儲存媒體,或一電腦可讀取媒體)。該資料載體、該數位儲存媒體或記錄媒體典型地是有實體的及/或非變遷的。
因此,本發明方法的又一實施例是代表用以執行本文所述諸方法中之一者的電腦程式的一資料流或一信號序列。該資料流或信號序列例如可以被配置成經由一資料通訊連接,例如經由網際網路來傳送。
另一實施例包含一處理裝置,例如電腦,或一可程式邏輯裝置,其被配置成或適應於執行本文所述諸方法中的一者。
另一實施例包含安裝有用以執行本文所述諸方法中的一者的電腦程式的一電腦。
依據本發明的又一實施例包含一裝置或一系統,其被配置成傳送(例如,以電子或光學方式)一用以執行本文所述諸方法中之一者的電腦程式至一接收器。該接收器可以是,例如電腦、行動裝置、記憶體裝置等。該裝置或系統例如可包含用以將該電腦程式傳送至該接收器的一檔案伺服器。
在某些實施例中,一可程式邏輯裝置(例如現場可程式
閘陣列)可用以執行本文所述方法的某些或全部功能。在某些實施例中,一現場可程式閘陣列可與一微處理器協作以執行本文所述諸方法中的一者。一般而言,該等方法較佳地由任一硬體裝置來執行。
上述實施例僅說明本發明的原理。應理解的是,本文所述配置及細節的修改及變化對熟於此技者將是顯而易見的。因此,意圖是僅受後附專利申請範圍之範圍的限制而並不受通過說明及解釋本文實施例所提出的特定細節的限制。
[1]:USAC codec(Unified Speech and Audio Codec),ISO/IEC CD 23003-3,2010年9月24日
10‧‧‧頻譜分解器/分解器
12‧‧‧輸入音訊信號/音訊輸入信號
14‧‧‧譜圖
16‧‧‧視窗程式
18‧‧‧MDCT模組
20‧‧‧線性預測分析器/分析器
22‧‧‧頻譜域整形器/整形器/頻譜域整形
24‧‧‧量子化器/量子化
26‧‧‧時間雜訊整形模組/TNS模組/時間雜訊整形器/模組/時域雜訊整形器
28‧‧‧低頻加重模組/低頻加重器
30‧‧‧資料流
32‧‧‧預加重模組
34‧‧‧視窗程式
36‧‧‧自相關器
38‧‧‧滯後視窗程式
40‧‧‧線性預測參數估計器/線性預測係數估計器/估計器
42、44、46、48‧‧‧模組
42‧‧‧模組/線性預測係數資料流插入器
44‧‧‧模組/LPC加權器/LPC加權模組
46‧‧‧模組/LPC對MDCT模組
48‧‧‧模組/頻域雜訊整形器/FDNS
50‧‧‧自相關電腦/模組/自相關計算器/電腦
52‧‧‧線性預測係數電腦/模組
54‧‧‧功率譜電腦
56‧‧‧標度扭曲器/頻譜加權器/模組/可選擇的模組
58‧‧‧反轉換器
60‧‧‧參考符號
62‧‧‧輸入
64‧‧‧輸出
80‧‧‧低頻去加重器
82‧‧‧頻譜域去整形器
84‧‧‧時間雜訊去整形器/時域雜訊整形器/TNS模組/時域雜訊去整形器
86‧‧‧頻譜域到時域轉換器/頻譜組合器
88‧‧‧資料流輸入
90‧‧‧輸出
92‧‧‧LPC抽取器
94‧‧‧LPC加權器/LPC加權模組
96‧‧‧LPC對MDCT轉換器
98‧‧‧頻域雜訊整形器
100‧‧‧反轉換器/再轉換器
102‧‧‧重疊相加相加器
第1圖繪示依據一比較或實施例的一音訊編碼器的一方塊圖;第2圖繪示依據本申請案之一實施例的一音訊編碼器;第3圖繪示適合於第2圖之音訊編碼器的一可實行的音訊解碼器的一方塊圖;以及第4圖繪示依據本申請案之一實施例的一替代音訊編碼器的一方塊圖。
10‧‧‧頻譜分解器/分解器
12‧‧‧輸入音訊信號/音訊輸入信號
14‧‧‧譜圖
16‧‧‧視窗程式
18‧‧‧MDCT模組
20‧‧‧線性預測分析器/分析器
22‧‧‧頻譜域整形器/整形器/頻譜域整形
24‧‧‧量子化器/量子化
26‧‧‧時間雜訊整形模組/TNS模組/時間雜訊整形器/模組/時域雜訊整形器
28‧‧‧低頻加重模組/低頻加重器
30‧‧‧資料流
38‧‧‧滯後視窗程式
40‧‧‧線性預測參數估計器/線性預測係數估計器/估計器
42‧‧‧模組/線性預測係數資料流插入器
42、44、46、48‧‧‧模組
44‧‧‧模組/LPC加權器/LPC加權模組
46‧‧‧模組/LPC對MDCT模組
48‧‧‧模組/頻域雜訊整形器/FDNS
50‧‧‧自相關電腦/模組/自相關計算器/電腦
52‧‧‧線性預測係數電腦/模組
54‧‧‧功率譜電腦
56‧‧‧標度扭曲器/頻譜加權器/模組/可選擇的模組
58‧‧‧反轉換器
60‧‧‧參考符號
62‧‧‧輸入
64‧‧‧輸出
Claims (12)
- 一種音訊編碼器,其包含:一頻譜分解器,用以使用一MDCT將一音訊輸入信號頻譜分解成一序列頻譜之一譜圖;一自相關電腦,被配置成由該序列頻譜之一當前頻譜來計算一自相關;一線性預測係數電腦,被配置成基於該自相關來計算線性預測係數;一頻譜域整形器,被配置成基於該等線性預測係數來頻譜整形該當前頻譜;及一量化級,被配置成量化該頻譜整形頻譜;其中該音訊編碼器被配置成將關於該量化頻譜整形頻譜的資訊及關於該等線性預測係數的資訊插入到一資料流中,其中該自相關電腦被配置以在由該當前頻譜來計算自相關時,由該當前頻譜來計算功率譜,及使該功率譜接受一反ODFT轉換。
- 一種音訊編碼器,其包含:一頻譜分解器,用以將一音訊輸入信號頻譜分解成一序列頻譜之一譜圖;一自相關電腦,被配置成由該序列頻譜之一當前頻譜來計算一自相關;一線性預測係數電腦,被配置成基於該自相關來計算線性預測係數; 一頻譜域整形器,被配置成基於該等線性預測係數來頻譜整形該當前頻譜;及一量化級,被配置成量化該頻譜整形頻譜;其中該音訊編碼器被配置成將關於該量化頻譜整形頻譜的資訊及關於該等線性預測係數的資訊插入到一資料流中,其中該音訊編碼器進一步包含:一頻譜預測器,被配置成沿一頻譜維度預測性濾波該當前頻譜,其中該頻譜域整形器被配置成頻譜整形該預測性濾波之當前頻譜,且該音訊編碼器被配置成將關於如何逆轉預測性濾波的資訊插入到該資料流中,其中該自相關電腦被配置成由該預測性濾波之當前頻譜來計算該自相關。
- 如請求項2所述之音訊編碼器,其中該頻譜預測器被配置成沿該頻譜維度對該當前頻譜執行線性預測濾波,其中該資料流形成器被配置成使得關於如何逆轉該預測性濾波之資訊包含關於沿該頻譜維度對該當前頻譜線性預測濾波的進一步基本的線性預測係數之資訊。
- 如請求項1或2所述之音訊編碼器,其中該音訊編碼器被配置成依該音訊輸入信號的一音調或瞬態特性或一濾波器預測增益來決定致能或去能該頻譜預測器,其中該音訊編碼器被配置成插入關於該決策的資訊。
- 一種音訊編碼器,其包含:一頻譜分解器,用以將一音訊輸入信號頻譜分解成 一頻譜序列之一譜圖;一自相關電腦,被配置成由該頻譜序列之一當前頻譜來計算一自相關;一線性預測係數電腦,被配置成基於該自相關來計算線性預測係數;一頻譜域整形器,被配置成基於該等線性預測係數來頻譜整形該當前頻譜;及一量化級,被配置成量化該頻譜整形頻譜;其中該音訊編碼器被配置成將關於該量化頻譜整形頻譜的資訊及關於該等線性預測係數的資訊插入到一資料流中,其中該音訊編碼器進一步包含:一頻譜預測器,被配置成沿一頻譜維度預測性濾波該當前頻譜,其中該頻譜域整形器被配置成頻譜整形該預測性濾波之當前頻譜,且該音訊編碼器被配置成將關於如何逆轉預測性濾波的資訊插入到該資料流中,其中該頻譜分解器被配置成頻譜分解該音訊輸入信號時在不同的轉換長度之間切換,使得該等頻譜具有不同的頻譜解析度,其中該自相關電腦被配置成若該當前頻譜之一頻譜解析度滿足一預定準則,則由該預測性濾波之當前頻譜來計算該自相關,或若該當前頻譜之該頻譜解析度不滿足該預定準則,則由未預測性濾波之當前頻譜來計算該自相關。
- 如請求項5所述之音訊編碼器,其中該自相關電腦被配 置成使得若該當前頻譜之頻譜解析度高於一頻譜解析度閾值,則該預定準則被滿足。
- 如請求項1或2所述之音訊編碼器,其中該自相關電腦被配置成,在由該當前頻譜來計算自相關中,感知加權該功率譜及使該功率譜隨著感知加權而接受該反ODFT轉換。
- 如請求項7所述之音訊編碼器,其中該自相關電腦被配置成改變該當前頻譜之一頻率標度及以改變之頻率標度來執行該功率譜之感知加權。
- 如請求項1或2所述之音訊編碼器,其中該音訊編碼器被配置成將關於該等線性預測係數的資訊以一量化形式插入到該資料流中,其中該頻譜域整形器被配置成基於該等量化之線性預測係數來頻譜整形該當前頻譜。
- 如請求項9所述之音訊編碼器,其中該音訊編碼器被配置成將關於該等線性預測係數的資訊以該等線性預測係數之量化在LSF或LSP域中所據以發生的一形式插入到該資料流中。
- 一種音訊編碼方法,其包含以下步驟:使用一MDCT將一音訊輸入信號頻譜分解成一序列頻譜之一譜圖;由該序列頻譜之一當前頻譜來計算一自相關;基於該自相關來計算線性預測係數;基於該等線性預測係數來頻譜整形該當前頻譜;量化該頻譜整形頻譜;及 將關於該量化頻譜整形頻譜的資訊及關於該等線性預測係數的資訊插入到一資料流中,其中由該當前頻譜計算該自相關,包含由該當前頻譜來計算功率譜,及使該功率譜接受一反ODFT轉換。
- 一種具有程式碼的電腦程式,當在一電腦上運行時,用以執行如請求項11所述之方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US201161442632P | 2011-02-14 | 2011-02-14 | |
| PCT/EP2012/052455 WO2012110476A1 (en) | 2011-02-14 | 2012-02-14 | Linear prediction based coding scheme using spectral domain noise shaping |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| TW201246189A TW201246189A (en) | 2012-11-16 |
| TWI488177B true TWI488177B (zh) | 2015-06-11 |
Family
ID=71943596
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| TW101104673A TWI488177B (zh) | 2011-02-14 | 2012-02-14 | 使用頻譜域雜訊整形之基於線性預測的編碼方案 |
Country Status (18)
| Country | Link |
|---|---|
| US (1) | US9595262B2 (zh) |
| EP (1) | EP2676266B1 (zh) |
| JP (1) | JP5625126B2 (zh) |
| KR (1) | KR101617816B1 (zh) |
| CN (1) | CN103477387B (zh) |
| AR (1) | AR085794A1 (zh) |
| AU (1) | AU2012217156B2 (zh) |
| BR (2) | BR112013020592B1 (zh) |
| CA (1) | CA2827277C (zh) |
| ES (1) | ES2534972T3 (zh) |
| MX (1) | MX2013009346A (zh) |
| MY (1) | MY165853A (zh) |
| PL (1) | PL2676266T3 (zh) |
| RU (1) | RU2575993C2 (zh) |
| SG (1) | SG192748A1 (zh) |
| TW (1) | TWI488177B (zh) |
| WO (1) | WO2012110476A1 (zh) |
| ZA (1) | ZA201306840B (zh) |
Families Citing this family (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CA2730315C (en) * | 2008-07-11 | 2014-12-16 | Jeremie Lecomte | Audio encoder and decoder for encoding frames of sampled audio signals |
| CN102648494B (zh) * | 2009-10-08 | 2014-07-02 | 弗兰霍菲尔运输应用研究公司 | 多模式音频信号解码器、多模式音频信号编码器、使用基于线性预测编码的噪声塑形的方法 |
| EP2707873B1 (en) * | 2011-05-09 | 2015-04-08 | Dolby International AB | Method and encoder for processing a digital stereo audio signal |
| JP6181773B2 (ja) * | 2013-01-29 | 2017-08-16 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | Celp状コーダのためのサイド情報を用いないノイズ充填 |
| EP4629237A3 (en) * | 2014-04-17 | 2025-12-17 | VoiceAge EVS LLC | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
| EP3699910B1 (en) * | 2014-05-01 | 2021-05-26 | Nippon Telegraph and Telephone Corporation | Periodic-combined-envelope-sequence generation device, periodic-combined-envelope-sequence generation method, periodic-combined-envelope-sequence generation program and recording medium |
| EP2980798A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Harmonicity-dependent controlling of a harmonic filter tool |
| US10310826B2 (en) * | 2015-11-19 | 2019-06-04 | Intel Corporation | Technologies for automatic reordering of sparse matrices |
| SG11201806256SA (en) * | 2016-01-22 | 2018-08-30 | Fraunhofer Ges Forschung | Apparatus and method for mdct m/s stereo with global ild with improved mid/side decision |
| EP3382701A1 (en) | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using prediction based shaping |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| EP3483883A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding and decoding with selective postfiltering |
| WO2019091573A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters |
| EP3483880A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Temporal noise shaping |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| PL3818520T3 (pl) | 2018-07-04 | 2024-06-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Wielo-sygnałowe enkodowanie audio z wykorzystaniem wybielania sygnału jako przetwarzania wstępnego |
| US11527252B2 (en) | 2019-08-30 | 2022-12-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | MDCT M/S stereo |
| CA3184522A1 (en) | 2020-07-07 | 2022-01-13 | Goran MARKOVIC | Audio quantizer and audio dequantizer and related methods |
| US12525248B2 (en) * | 2022-08-11 | 2026-01-13 | Electronics And Telecommunications Research Institute | Apparatus for encoding and decoding audio signal and method of operation thereof |
| TWI864704B (zh) * | 2023-04-26 | 2024-12-01 | 弗勞恩霍夫爾協會 | 用於音訊編碼器中之尺度參數之諧度相依傾斜控制之設備及方法 |
| AU2023445414A1 (en) | 2023-04-26 | 2025-10-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for harmonicity-dependent tilt control of scale parameters in an audio encoder |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5537510A (en) * | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
| US20070016404A1 (en) * | 2005-07-15 | 2007-01-18 | Samsung Electronics Co., Ltd. | Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same |
| EP1852851A1 (en) * | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
| TWI313856B (en) * | 2002-09-19 | 2009-08-21 | Panasonic Corp | Audio decoding apparatus and method |
| TWI333643B (en) * | 2006-01-18 | 2010-11-21 | Lg Electronics Inc | Apparatus and method for encoding and decoding signal |
Family Cites Families (206)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO1992022891A1 (en) | 1991-06-11 | 1992-12-23 | Qualcomm Incorporated | Variable rate vocoder |
| US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
| SE501340C2 (sv) | 1993-06-11 | 1995-01-23 | Ericsson Telefon Ab L M | Döljande av transmissionsfel i en talavkodare |
| BE1007617A3 (nl) | 1993-10-11 | 1995-08-22 | Philips Electronics Nv | Transmissiesysteem met gebruik van verschillende codeerprincipes. |
| US5657422A (en) | 1994-01-28 | 1997-08-12 | Lucent Technologies Inc. | Voice activity detection driven noise remediator |
| US5784532A (en) | 1994-02-16 | 1998-07-21 | Qualcomm Incorporated | Application specific integrated circuit (ASIC) for performing rapid speech compression in a mobile telephone system |
| US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
| US5568588A (en) | 1994-04-29 | 1996-10-22 | Audiocodes Ltd. | Multi-pulse analysis speech processing System and method |
| CN1090409C (zh) | 1994-10-06 | 2002-09-04 | 皇家菲利浦电子有限公司 | 采用不同编码原理的传送系统 |
| SE506379C3 (sv) | 1995-03-22 | 1998-01-19 | Ericsson Telefon Ab L M | Lpc-talkodare med kombinerad excitation |
| US5727119A (en) | 1995-03-27 | 1998-03-10 | Dolby Laboratories Licensing Corporation | Method and apparatus for efficient implementation of single-sideband filter banks providing accurate measures of spectral magnitude and phase |
| JP3317470B2 (ja) | 1995-03-28 | 2002-08-26 | 日本電信電話株式会社 | 音響信号符号化方法、音響信号復号化方法 |
| US5754733A (en) * | 1995-08-01 | 1998-05-19 | Qualcomm Incorporated | Method and apparatus for generating and encoding line spectral square roots |
| US5659622A (en) | 1995-11-13 | 1997-08-19 | Motorola, Inc. | Method and apparatus for suppressing noise in a communication system |
| US5890106A (en) | 1996-03-19 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Analysis-/synthesis-filtering system with efficient oddly-stacked singleband filter bank using time-domain aliasing cancellation |
| US5848391A (en) | 1996-07-11 | 1998-12-08 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Method subband of coding and decoding audio signals using variable length windows |
| JP3259759B2 (ja) | 1996-07-22 | 2002-02-25 | 日本電気株式会社 | 音声信号伝送方法及び音声符号復号化システム |
| US5960389A (en) | 1996-11-15 | 1999-09-28 | Nokia Mobile Phones Limited | Methods for generating comfort noise during discontinuous transmission |
| JPH10214100A (ja) | 1997-01-31 | 1998-08-11 | Sony Corp | 音声合成方法 |
| US6134518A (en) | 1997-03-04 | 2000-10-17 | International Business Machines Corporation | Digital audio signal coding using a CELP coder and a transform coder |
| SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
| JP3223966B2 (ja) | 1997-07-25 | 2001-10-29 | 日本電気株式会社 | 音声符号化/復号化装置 |
| US6070137A (en) | 1998-01-07 | 2000-05-30 | Ericsson Inc. | Integrated frequency-domain voice coding using an adaptive spectral enhancement filter |
| ATE302991T1 (de) | 1998-01-22 | 2005-09-15 | Deutsche Telekom Ag | Verfahren zur signalgesteuerten schaltung zwischen verschiedenen audiokodierungssystemen |
| GB9811019D0 (en) | 1998-05-21 | 1998-07-22 | Univ Surrey | Speech coders |
| US6173257B1 (en) | 1998-08-24 | 2001-01-09 | Conexant Systems, Inc | Completed fixed codebook for speech encoder |
| US6439967B2 (en) | 1998-09-01 | 2002-08-27 | Micron Technology, Inc. | Microelectronic substrate assembly planarizing machines and methods of mechanical and chemical-mechanical planarization of microelectronic substrate assemblies |
| SE521225C2 (sv) | 1998-09-16 | 2003-10-14 | Ericsson Telefon Ab L M | Förfarande och anordning för CELP-kodning/avkodning |
| US7272556B1 (en) | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
| US7124079B1 (en) | 1998-11-23 | 2006-10-17 | Telefonaktiebolaget Lm Ericsson (Publ) | Speech coding with comfort noise variability feature for increased fidelity |
| FI114833B (fi) | 1999-01-08 | 2004-12-31 | Nokia Corp | Menetelmä, puhekooderi ja matkaviestin puheenkoodauskehysten muodostamiseksi |
| DE19921122C1 (de) | 1999-05-07 | 2001-01-25 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verschleiern eines Fehlers in einem codierten Audiosignal und Verfahren und Vorrichtung zum Decodieren eines codierten Audiosignals |
| JP4024427B2 (ja) * | 1999-05-24 | 2007-12-19 | 株式会社リコー | 線形予測係数抽出装置、線形予測係数抽出方法、およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体 |
| DE10084675T1 (de) | 1999-06-07 | 2002-06-06 | Ericsson Inc | Verfahren und Vorrichtung zur Erzeugung von künstlichem Geräusch unter Verwendung von parametrischen Geräuschmodell-Masszahlen |
| JP4464484B2 (ja) | 1999-06-15 | 2010-05-19 | パナソニック株式会社 | 雑音信号符号化装置および音声信号符号化装置 |
| US6236960B1 (en) | 1999-08-06 | 2001-05-22 | Motorola, Inc. | Factorial packing method and apparatus for information coding |
| US6636829B1 (en) | 1999-09-22 | 2003-10-21 | Mindspeed Technologies, Inc. | Speech communication system and method for handling lost frames |
| JP4907826B2 (ja) | 2000-02-29 | 2012-04-04 | クゥアルコム・インコーポレイテッド | 閉ループのマルチモードの混合領域の線形予測音声コーダ |
| JP2002118517A (ja) | 2000-07-31 | 2002-04-19 | Sony Corp | 直交変換装置及び方法、逆直交変換装置及び方法、変換符号化装置及び方法、並びに復号装置及び方法 |
| FR2813722B1 (fr) | 2000-09-05 | 2003-01-24 | France Telecom | Procede et dispositif de dissimulation d'erreurs et systeme de transmission comportant un tel dispositif |
| US6847929B2 (en) | 2000-10-12 | 2005-01-25 | Texas Instruments Incorporated | Algebraic codebook system and method |
| CA2327041A1 (en) | 2000-11-22 | 2002-05-22 | Voiceage Corporation | A method for indexing pulse positions and signs in algebraic codebooks for efficient coding of wideband signals |
| US6636830B1 (en) | 2000-11-22 | 2003-10-21 | Vialta Inc. | System and method for noise reduction using bi-orthogonal modified discrete cosine transform |
| US7901873B2 (en) | 2001-04-23 | 2011-03-08 | Tcp Innovations Limited | Methods for the diagnosis and treatment of bone disorders |
| US7136418B2 (en) | 2001-05-03 | 2006-11-14 | University Of Washington | Scalable and perceptually ranked signal coding and decoding |
| US7206739B2 (en) | 2001-05-23 | 2007-04-17 | Samsung Electronics Co., Ltd. | Excitation codebook search method in a speech coding system |
| US20020184009A1 (en) | 2001-05-31 | 2002-12-05 | Heikkinen Ari P. | Method and apparatus for improved voicing determination in speech signals containing high levels of jitter |
| US20030120484A1 (en) | 2001-06-12 | 2003-06-26 | David Wong | Method and system for generating colored comfort noise in the absence of silence insertion description packets |
| DE10129240A1 (de) | 2001-06-18 | 2003-01-02 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten von zeitdiskreten Audio-Abtastwerten |
| US6879955B2 (en) | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
| DE10140507A1 (de) | 2001-08-17 | 2003-02-27 | Philips Corp Intellectual Pty | Verfahren für die algebraische Codebook-Suche eines Sprachsignalkodierers |
| US7711563B2 (en) | 2001-08-17 | 2010-05-04 | Broadcom Corporation | Method and system for frame erasure concealment for predictive speech coding based on extrapolation of speech waveform |
| KR100438175B1 (ko) | 2001-10-23 | 2004-07-01 | 엘지전자 주식회사 | 코드북 검색방법 |
| CA2365203A1 (en) | 2001-12-14 | 2003-06-14 | Voiceage Corporation | A signal modification method for efficient coding of speech signals |
| US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
| US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
| DE10200653B4 (de) | 2002-01-10 | 2004-05-27 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Skalierbarer Codierer, Verfahren zum Codieren, Decodierer und Verfahren zum Decodieren für einen skalierten Datenstrom |
| CA2388352A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for frequency-selective pitch enhancement of synthesized speed |
| CA2388439A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for efficient frame erasure concealment in linear predictive based speech codecs |
| CA2388358A1 (en) | 2002-05-31 | 2003-11-30 | Voiceage Corporation | A method and device for multi-rate lattice vector quantization |
| US7302387B2 (en) | 2002-06-04 | 2007-11-27 | Texas Instruments Incorporated | Modification of fixed codebook search in G.729 Annex E audio coding |
| US20040010329A1 (en) | 2002-07-09 | 2004-01-15 | Silicon Integrated Systems Corp. | Method for reducing buffer requirements in a digital audio decoder |
| DE10236694A1 (de) | 2002-08-09 | 2004-02-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren |
| US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
| US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
| KR100711280B1 (ko) | 2002-10-11 | 2007-04-25 | 노키아 코포레이션 | 소스 제어되는 가변 비트율 광대역 음성 부호화 방법 및장치 |
| US7343283B2 (en) | 2002-10-23 | 2008-03-11 | Motorola, Inc. | Method and apparatus for coding a noise-suppressed audio signal |
| US7363218B2 (en) | 2002-10-25 | 2008-04-22 | Dilithium Networks Pty. Ltd. | Method and apparatus for fast CELP parameter mapping |
| KR100463559B1 (ko) | 2002-11-11 | 2004-12-29 | 한국전자통신연구원 | 대수 코드북을 이용하는 켈프 보코더의 코드북 검색방법 |
| KR100463419B1 (ko) | 2002-11-11 | 2004-12-23 | 한국전자통신연구원 | 적은 복잡도를 가진 고정 코드북 검색방법 및 장치 |
| KR100465316B1 (ko) | 2002-11-18 | 2005-01-13 | 한국전자통신연구원 | 음성 부호화기 및 이를 이용한 음성 부호화 방법 |
| KR20040058855A (ko) | 2002-12-27 | 2004-07-05 | 엘지전자 주식회사 | 음성 변조 장치 및 방법 |
| AU2003208517A1 (en) | 2003-03-11 | 2004-09-30 | Nokia Corporation | Switching between coding schemes |
| US7249014B2 (en) | 2003-03-13 | 2007-07-24 | Intel Corporation | Apparatus, methods and articles incorporating a fast algebraic codebook search technique |
| US20050021338A1 (en) | 2003-03-17 | 2005-01-27 | Dan Graboi | Recognition device and system |
| KR100556831B1 (ko) | 2003-03-25 | 2006-03-10 | 한국전자통신연구원 | 전역 펄스 교체를 통한 고정 코드북 검색 방법 |
| WO2004090870A1 (ja) | 2003-04-04 | 2004-10-21 | Kabushiki Kaisha Toshiba | 広帯域音声を符号化または復号化するための方法及び装置 |
| DE10321983A1 (de) | 2003-05-15 | 2004-12-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Einbetten einer binären Nutzinformation in ein Trägersignal |
| KR101058062B1 (ko) | 2003-06-30 | 2011-08-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 잡음 부가에 의한 디코딩된 오디오의 품질 개선 |
| DE10331803A1 (de) | 2003-07-14 | 2005-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Umsetzen in eine transformierte Darstellung oder zum inversen Umsetzen der transformierten Darstellung |
| CA2475283A1 (en) | 2003-07-17 | 2005-01-17 | Her Majesty The Queen In Right Of Canada As Represented By The Minister Of Industry Through The Communications Research Centre | Method for recovery of lost speech data |
| DE10345996A1 (de) | 2003-10-02 | 2005-04-28 | Fraunhofer Ges Forschung | Vorrichtung und Verfahren zum Verarbeiten von wenigstens zwei Eingangswerten |
| DE10345995B4 (de) | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
| US7418396B2 (en) | 2003-10-14 | 2008-08-26 | Broadcom Corporation | Reduced memory implementation technique of filterbank and block switching for real-time audio applications |
| US20050091041A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for speech coding |
| US20050091044A1 (en) | 2003-10-23 | 2005-04-28 | Nokia Corporation | Method and system for pitch contour quantization in audio coding |
| US20080249765A1 (en) | 2004-01-28 | 2008-10-09 | Koninklijke Philips Electronic, N.V. | Audio Signal Decoding Using Complex-Valued Data |
| EP1714456B1 (en) | 2004-02-12 | 2014-07-16 | Core Wireless Licensing S.à.r.l. | Classified media quality of experience |
| DE102004007200B3 (de) | 2004-02-13 | 2005-08-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audiocodierung |
| CA2457988A1 (en) | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
| FI118835B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Koodausmallin valinta |
| FI118834B (fi) | 2004-02-23 | 2008-03-31 | Nokia Corp | Audiosignaalien luokittelu |
| CN1930607B (zh) | 2004-03-05 | 2010-11-10 | 松下电器产业株式会社 | 差错隐藏装置以及差错隐藏方法 |
| GB0408856D0 (en) | 2004-04-21 | 2004-05-26 | Nokia Corp | Signal encoding |
| BRPI0418838A (pt) | 2004-05-17 | 2007-11-13 | Nokia Corp | método para suportar uma codificação de um sinal de áudio, módulo para suportar uma codificação de um sinal de áudio, dispositivo eletrÈnico, sistema de codificação de áudio, e, produto de programa de software |
| JP4168976B2 (ja) | 2004-05-28 | 2008-10-22 | ソニー株式会社 | オーディオ信号符号化装置及び方法 |
| US7649988B2 (en) | 2004-06-15 | 2010-01-19 | Acoustic Technologies, Inc. | Comfort noise generator using modified Doblinger noise estimate |
| US8160274B2 (en) | 2006-02-07 | 2012-04-17 | Bongiovi Acoustics Llc. | System and method for digital signal processing |
| US7630902B2 (en) | 2004-09-17 | 2009-12-08 | Digital Rise Technology Co., Ltd. | Apparatus and methods for digital audio coding using codebook application ranges |
| KR100656788B1 (ko) | 2004-11-26 | 2006-12-12 | 한국전자통신연구원 | 비트율 신축성을 갖는 코드벡터 생성 방법 및 그를 이용한 광대역 보코더 |
| JP2008529073A (ja) | 2005-01-31 | 2008-07-31 | ソノリト・アンパルトセルスカブ | 重み付けされたオーバーラップ加算方法 |
| EP1845520A4 (en) | 2005-02-02 | 2011-08-10 | Fujitsu Ltd | SIGNAL PROCESSING METHOD AND SIGNAL PROCESSING DEVICE |
| US20070147518A1 (en) | 2005-02-18 | 2007-06-28 | Bruno Bessette | Methods and devices for low-frequency emphasis during audio compression based on ACELP/TCX |
| US8155965B2 (en) | 2005-03-11 | 2012-04-10 | Qualcomm Incorporated | Time warping frames inside the vocoder by modifying the residual |
| US7707034B2 (en) | 2005-05-31 | 2010-04-27 | Microsoft Corporation | Audio codec post-filter |
| RU2296377C2 (ru) | 2005-06-14 | 2007-03-27 | Михаил Николаевич Гусев | Способ анализа и синтеза речи |
| WO2006136901A2 (en) | 2005-06-18 | 2006-12-28 | Nokia Corporation | System and method for adaptive transmission of comfort noise parameters during discontinuous speech transmission |
| FR2888699A1 (fr) | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
| US7610197B2 (en) | 2005-08-31 | 2009-10-27 | Motorola, Inc. | Method and apparatus for comfort noise generation in speech communication systems |
| RU2312405C2 (ru) | 2005-09-13 | 2007-12-10 | Михаил Николаевич Гусев | Способ осуществления машинной оценки качества звуковых сигналов |
| US20070174047A1 (en) | 2005-10-18 | 2007-07-26 | Anderson Kyle D | Method and apparatus for resynchronizing packetized audio streams |
| US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
| US8255207B2 (en) | 2005-12-28 | 2012-08-28 | Voiceage Corporation | Method and device for efficient frame erasure concealment in speech codecs |
| WO2007080211A1 (en) | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
| CN101371296B (zh) | 2006-01-18 | 2012-08-29 | Lg电子株式会社 | 用于编码和解码信号的设备和方法 |
| US8032369B2 (en) | 2006-01-20 | 2011-10-04 | Qualcomm Incorporated | Arbitrary average data rates for variable rate coders |
| FR2897733A1 (fr) | 2006-02-20 | 2007-08-24 | France Telecom | Procede de discrimination et d'attenuation fiabilisees des echos d'un signal numerique dans un decodeur et dispositif correspondant |
| FR2897977A1 (fr) | 2006-02-28 | 2007-08-31 | France Telecom | Procede de limitation de gain d'excitation adaptative dans un decodeur audio |
| EP1852848A1 (en) | 2006-05-05 | 2007-11-07 | Deutsche Thomson-Brandt GmbH | Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream |
| US7959940B2 (en) | 2006-05-30 | 2011-06-14 | Advanced Cardiovascular Systems, Inc. | Polymer-bioceramic composite implantable medical devices |
| CN101460998A (zh) * | 2006-05-30 | 2009-06-17 | 皇家飞利浦电子股份有限公司 | 音频信号的线性预测编码 |
| JP4810335B2 (ja) | 2006-07-06 | 2011-11-09 | 株式会社東芝 | 広帯域オーディオ信号符号化装置および広帯域オーディオ信号復号装置 |
| JP5052514B2 (ja) | 2006-07-12 | 2012-10-17 | パナソニック株式会社 | 音声復号装置 |
| JP5190363B2 (ja) | 2006-07-12 | 2013-04-24 | パナソニック株式会社 | 音声復号装置、音声符号化装置、および消失フレーム補償方法 |
| US7933770B2 (en) | 2006-07-14 | 2011-04-26 | Siemens Audiologische Technik Gmbh | Method and device for coding audio data based on vector quantisation |
| WO2008013788A2 (en) | 2006-07-24 | 2008-01-31 | Sony Corporation | A hair motion compositor system and optimization techniques for use in a hair/fur pipeline |
| US7987089B2 (en) | 2006-07-31 | 2011-07-26 | Qualcomm Incorporated | Systems and methods for modifying a zero pad region of a windowed frame of an audio signal |
| WO2008022184A2 (en) | 2006-08-15 | 2008-02-21 | Broadcom Corporation | Constrained and controlled decoding after packet loss |
| US7877253B2 (en) | 2006-10-06 | 2011-01-25 | Qualcomm Incorporated | Systems, methods, and apparatus for frame erasure recovery |
| US8041578B2 (en) | 2006-10-18 | 2011-10-18 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| US8036903B2 (en) | 2006-10-18 | 2011-10-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Analysis filterbank, synthesis filterbank, encoder, de-coder, mixer and conferencing system |
| DE102006049154B4 (de) | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
| US8417532B2 (en) | 2006-10-18 | 2013-04-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| US8126721B2 (en) | 2006-10-18 | 2012-02-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Encoding an information signal |
| ES2996584T3 (en) | 2006-10-25 | 2025-02-12 | Fraunhofer Ges Forschung | Method for audio signal processing |
| DE102006051673A1 (de) | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
| PL2052548T3 (pl) | 2006-12-12 | 2012-08-31 | Fraunhofer Ges Forschung | Koder, dekoder oraz sposoby kodowania i dekodowania segmentów danych reprezentujących strumień danych w dziedzinie czasu |
| FR2911228A1 (fr) | 2007-01-05 | 2008-07-11 | France Telecom | Codage par transformee, utilisant des fenetres de ponderation et a faible retard. |
| KR101379263B1 (ko) | 2007-01-12 | 2014-03-28 | 삼성전자주식회사 | 대역폭 확장 복호화 방법 및 장치 |
| FR2911426A1 (fr) | 2007-01-15 | 2008-07-18 | France Telecom | Modification d'un signal de parole |
| US7873064B1 (en) | 2007-02-12 | 2011-01-18 | Marvell International Ltd. | Adaptive jitter buffer-packet loss concealment |
| CN102682778B (zh) | 2007-03-02 | 2014-10-22 | 松下电器(美国)知识产权公司 | 编码装置以及编码方法 |
| JP4708446B2 (ja) | 2007-03-02 | 2011-06-22 | パナソニック株式会社 | 符号化装置、復号装置およびそれらの方法 |
| US8364472B2 (en) | 2007-03-02 | 2013-01-29 | Panasonic Corporation | Voice encoding device and voice encoding method |
| DE102007063635A1 (de) | 2007-03-22 | 2009-04-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zur zeitlichen Segmentierung eines Videos in Videobildfolgen und zur Auswahl von Keyframes für das Auffinden von Bildinhalten unter Einbeziehung einer Subshot-Detektion |
| JP2008261904A (ja) | 2007-04-10 | 2008-10-30 | Matsushita Electric Ind Co Ltd | 符号化装置、復号化装置、符号化方法および復号化方法 |
| US8630863B2 (en) | 2007-04-24 | 2014-01-14 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding and decoding audio/speech signal |
| CN101388210B (zh) | 2007-09-15 | 2012-03-07 | 华为技术有限公司 | 编解码方法及编解码器 |
| PT2827327T (pt) | 2007-04-29 | 2020-08-27 | Huawei Tech Co Ltd | Método para codificação de impulsos de excitação |
| PL2165328T3 (pl) | 2007-06-11 | 2018-06-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodowanie i dekodowanie sygnału audio zawierającego część impulsową i część stacjonarną |
| US9653088B2 (en) | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
| KR101513028B1 (ko) | 2007-07-02 | 2015-04-17 | 엘지전자 주식회사 | 방송 수신기 및 방송신호 처리방법 |
| US8185381B2 (en) | 2007-07-19 | 2012-05-22 | Qualcomm Incorporated | Unified filter bank for performing signal conversions |
| CN101110214B (zh) | 2007-08-10 | 2011-08-17 | 北京理工大学 | 一种基于多描述格型矢量量化技术的语音编码方法 |
| US8428957B2 (en) * | 2007-08-24 | 2013-04-23 | Qualcomm Incorporated | Spectral noise shaping in audio coding based on spectral dynamics in frequency sub-bands |
| EP2186088B1 (en) | 2007-08-27 | 2017-11-15 | Telefonaktiebolaget LM Ericsson (publ) | Low-complexity spectral analysis/synthesis using selectable time resolution |
| JP4886715B2 (ja) | 2007-08-28 | 2012-02-29 | 日本電信電話株式会社 | 定常率算出装置、雑音レベル推定装置、雑音抑圧装置、それらの方法、プログラム及び記録媒体 |
| US8566106B2 (en) | 2007-09-11 | 2013-10-22 | Voiceage Corporation | Method and device for fast algebraic codebook search in speech and audio coding |
| CN100524462C (zh) | 2007-09-15 | 2009-08-05 | 华为技术有限公司 | 对高带信号进行帧错误隐藏的方法及装置 |
| US8576096B2 (en) | 2007-10-11 | 2013-11-05 | Motorola Mobility Llc | Apparatus and method for low complexity combinatorial coding of signals |
| KR101373004B1 (ko) | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
| CN101425292B (zh) | 2007-11-02 | 2013-01-02 | 华为技术有限公司 | 一种音频信号的解码方法及装置 |
| DE102007055830A1 (de) | 2007-12-17 | 2009-06-18 | Zf Friedrichshafen Ag | Verfahren und Vorrichtung zum Betrieb eines Hybridantriebes eines Fahrzeuges |
| CN101483043A (zh) | 2008-01-07 | 2009-07-15 | 中兴通讯股份有限公司 | 基于分类和排列组合的码本索引编码方法 |
| CN101488344B (zh) | 2008-01-16 | 2011-09-21 | 华为技术有限公司 | 一种量化噪声泄漏控制方法及装置 |
| DE102008015702B4 (de) | 2008-01-31 | 2010-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zur Bandbreitenerweiterung eines Audiosignals |
| KR101192241B1 (ko) | 2008-03-04 | 2012-10-17 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 입력 데이터 스트림의 믹싱과 그로부터 출력 데이터 스트림의 생성 |
| US8000487B2 (en) | 2008-03-06 | 2011-08-16 | Starkey Laboratories, Inc. | Frequency translation by high-frequency spectral envelope warping in hearing assistance devices |
| FR2929466A1 (fr) | 2008-03-28 | 2009-10-02 | France Telecom | Dissimulation d'erreur de transmission dans un signal numerique dans une structure de decodage hierarchique |
| EP2107556A1 (en) | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
| US8768690B2 (en) | 2008-06-20 | 2014-07-01 | Qualcomm Incorporated | Coding scheme selection for low-bit-rate applications |
| CA2871498C (en) | 2008-07-11 | 2017-10-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and decoder for encoding and decoding audio samples |
| MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
| EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
| MX2011000375A (es) | 2008-07-11 | 2011-05-19 | Fraunhofer Ges Forschung | Codificador y decodificador de audio para codificar y decodificar tramas de una señal de audio muestreada. |
| CA2730355C (en) | 2008-07-11 | 2016-03-22 | Guillaume Fuchs | Apparatus and method for encoding/decoding an audio signal using an aliasing switch scheme |
| RU2536679C2 (ru) | 2008-07-11 | 2014-12-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
| EP2144230A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme having cascaded switches |
| US8380498B2 (en) | 2008-09-06 | 2013-02-19 | GH Innovation, Inc. | Temporal envelope coding of energy attack signal by using attack point location |
| US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
| WO2010031049A1 (en) | 2008-09-15 | 2010-03-18 | GH Innovation, Inc. | Improving celp post-processing for music signals |
| DE102008042579B4 (de) | 2008-10-02 | 2020-07-23 | Robert Bosch Gmbh | Verfahren zur Fehlerverdeckung bei fehlerhafter Übertragung von Sprachdaten |
| WO2010040522A2 (en) | 2008-10-08 | 2010-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e. V. | Multi-resolution switched audio encoding/decoding scheme |
| KR101315617B1 (ko) | 2008-11-26 | 2013-10-08 | 광운대학교 산학협력단 | 모드 스위칭에 기초하여 윈도우 시퀀스를 처리하는 통합 음성/오디오 부/복호화기 |
| CN101770775B (zh) | 2008-12-31 | 2011-06-22 | 华为技术有限公司 | 信号处理方法及装置 |
| PL3598445T3 (pl) | 2009-01-16 | 2021-12-27 | Dolby International Ab | Transpozycja harmonicznych rozszerzona o iloczyn wektorowy |
| RU2542668C2 (ru) | 2009-01-28 | 2015-02-20 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Звуковое кодирующее устройство, звуковой декодер, кодированная звуковая информация, способы кодирования и декодирования звукового сигнала и компьютерная программа |
| US8457975B2 (en) | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
| EP2214165A3 (en) | 2009-01-30 | 2010-09-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for manipulating an audio signal comprising a transient event |
| ES2374486T3 (es) | 2009-03-26 | 2012-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dispositivo y método para manipular una señal de audio. |
| KR20100115215A (ko) | 2009-04-17 | 2010-10-27 | 삼성전자주식회사 | 가변 비트율 오디오 부호화 및 복호화 장치 및 방법 |
| WO2010148516A1 (en) | 2009-06-23 | 2010-12-29 | Voiceage Corporation | Forward time-domain aliasing cancellation with application in weighted or original signal domain |
| JP5267362B2 (ja) | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
| CN101958119B (zh) | 2009-07-16 | 2012-02-29 | 中兴通讯股份有限公司 | 一种改进的离散余弦变换域音频丢帧补偿器和补偿方法 |
| US8635357B2 (en) | 2009-09-08 | 2014-01-21 | Google Inc. | Dynamic selection of parameter sets for transcoding media data |
| BR112012009490B1 (pt) | 2009-10-20 | 2020-12-01 | Fraunhofer-Gesellschaft zur Föerderung der Angewandten Forschung E.V. | ddecodificador de áudio multimodo e método de decodificação de áudio multimodo para fornecer uma representação decodificada do conteúdo de áudio com base em um fluxo de bits codificados e codificador de áudio multimodo para codificação de um conteúdo de áudio em um fluxo de bits codificados |
| PL2491556T3 (pl) | 2009-10-20 | 2024-08-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder sygnału audio, odpowiadający mu sposób oraz program komputerowy |
| RU2596594C2 (ru) | 2009-10-20 | 2016-09-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Кодер аудиосигнала, декодер аудиосигнала, способ кодированного представления аудиоконтента, способ декодированного представления аудиоконтента и компьютерная программа для приложений с малой задержкой |
| CN102081927B (zh) | 2009-11-27 | 2012-07-18 | 中兴通讯股份有限公司 | 一种可分层音频编码、解码方法及系统 |
| US8423355B2 (en) | 2010-03-05 | 2013-04-16 | Motorola Mobility Llc | Encoder for audio signal including generic audio and speech frames |
| US8428936B2 (en) | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
| WO2011127832A1 (en) | 2010-04-14 | 2011-10-20 | Huawei Technologies Co., Ltd. | Time/frequency two dimension post-processing |
| WO2011147950A1 (en) | 2010-05-28 | 2011-12-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low-delay unified speech and audio codec |
| WO2012110482A2 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Noise generation in audio codecs |
| TWI469136B (zh) | 2011-02-14 | 2015-01-11 | Fraunhofer Ges Forschung | 在一頻譜域中用以處理已解碼音訊信號之裝置及方法 |
| EP2721610A1 (en) | 2011-11-25 | 2014-04-23 | Huawei Technologies Co., Ltd. | An apparatus and a method for encoding an input signal |
-
2012
- 2012-02-14 EP EP12705820.4A patent/EP2676266B1/en active Active
- 2012-02-14 SG SG2013061387A patent/SG192748A1/en unknown
- 2012-02-14 ES ES12705820.4T patent/ES2534972T3/es active Active
- 2012-02-14 BR BR112013020592-0A patent/BR112013020592B1/pt active IP Right Grant
- 2012-02-14 CN CN201280018265.3A patent/CN103477387B/zh active Active
- 2012-02-14 TW TW101104673A patent/TWI488177B/zh active
- 2012-02-14 WO PCT/EP2012/052455 patent/WO2012110476A1/en not_active Ceased
- 2012-02-14 AR ARP120100477A patent/AR085794A1/es active IP Right Grant
- 2012-02-14 RU RU2013142133/08A patent/RU2575993C2/ru active
- 2012-02-14 AU AU2012217156A patent/AU2012217156B2/en active Active
- 2012-02-14 JP JP2013553901A patent/JP5625126B2/ja active Active
- 2012-02-14 MY MYPI2013002982A patent/MY165853A/en unknown
- 2012-02-14 MX MX2013009346A patent/MX2013009346A/es active IP Right Grant
- 2012-02-14 KR KR1020137024237A patent/KR101617816B1/ko active Active
- 2012-02-14 BR BR112013020587-3A patent/BR112013020587B1/pt active IP Right Grant
- 2012-02-14 CA CA2827277A patent/CA2827277C/en active Active
- 2012-02-14 PL PL12705820T patent/PL2676266T3/pl unknown
-
2013
- 2013-08-14 US US13/966,601 patent/US9595262B2/en active Active
- 2013-09-11 ZA ZA2013/06840A patent/ZA201306840B/en unknown
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5537510A (en) * | 1994-12-30 | 1996-07-16 | Daewoo Electronics Co., Ltd. | Adaptive digital audio encoding apparatus and a bit allocation method thereof |
| TWI313856B (en) * | 2002-09-19 | 2009-08-21 | Panasonic Corp | Audio decoding apparatus and method |
| EP1852851A1 (en) * | 2004-04-01 | 2007-11-07 | Beijing Media Works Co., Ltd | An enhanced audio encoding/decoding device and method |
| US20070016404A1 (en) * | 2005-07-15 | 2007-01-18 | Samsung Electronics Co., Ltd. | Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same |
| TWI333643B (en) * | 2006-01-18 | 2010-11-21 | Lg Electronics Inc | Apparatus and method for encoding and decoding signal |
Non-Patent Citations (1)
| Title |
|---|
| Audio Coding Based on Long Temporal Contexts, 2006 * |
Also Published As
| Publication number | Publication date |
|---|---|
| BR112013020592B1 (pt) | 2021-06-22 |
| KR101617816B1 (ko) | 2016-05-03 |
| MY165853A (en) | 2018-05-18 |
| CA2827277C (en) | 2016-08-30 |
| TW201246189A (en) | 2012-11-16 |
| AR085794A1 (es) | 2013-10-30 |
| AU2012217156A1 (en) | 2013-08-29 |
| EP2676266B1 (en) | 2015-03-11 |
| KR20130133848A (ko) | 2013-12-09 |
| RU2013142133A (ru) | 2015-03-27 |
| CN103477387B (zh) | 2015-11-25 |
| BR112013020592A2 (pt) | 2016-10-18 |
| US9595262B2 (en) | 2017-03-14 |
| BR112013020587A2 (pt) | 2018-07-10 |
| RU2575993C2 (ru) | 2016-02-27 |
| EP2676266A1 (en) | 2013-12-25 |
| ES2534972T3 (es) | 2015-04-30 |
| BR112013020587B1 (pt) | 2021-03-09 |
| PL2676266T3 (pl) | 2015-08-31 |
| JP2014510306A (ja) | 2014-04-24 |
| AU2012217156B2 (en) | 2015-03-19 |
| MX2013009346A (es) | 2013-10-01 |
| US20130332153A1 (en) | 2013-12-12 |
| JP5625126B2 (ja) | 2014-11-12 |
| CN103477387A (zh) | 2013-12-25 |
| ZA201306840B (en) | 2014-05-28 |
| CA2827277A1 (en) | 2012-08-23 |
| SG192748A1 (en) | 2013-09-30 |
| WO2012110476A1 (en) | 2012-08-23 |
| HK1192050A1 (zh) | 2014-08-08 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| TWI488177B (zh) | 使用頻譜域雜訊整形之基於線性預測的編碼方案 | |
| JP6173288B2 (ja) | マルチモードオーディオコーデックおよびそれに適応されるcelp符号化 | |
| KR101425155B1 (ko) | 복소 예측을 이용한 다중 채널 오디오 신호를 처리하기 위한 오디오 인코더, 오디오 디코더, 및 관련 방법 | |
| EP2676268B1 (en) | Apparatus and method for processing a decoded audio signal in a spectral domain | |
| TWI466106B (zh) | 音訊或視訊編碼器、音訊或視訊解碼器及用以利用可變預測方向來處理多頻道音訊或視訊信號的相關方法 | |
| KR101698905B1 (ko) | 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법 | |
| EP3693963A1 (en) | Simultaneous time-domain and frequency-domain noise shaping for tdac transforms | |
| AU2013283568B2 (en) | Linear prediction based audio coding using improved probability distribution estimation | |
| HK1192048B (zh) | 在一频谱域中用以处理已解码音讯信号的装置及方法 | |
| HK1192050B (zh) | 使用频谱域杂讯整形的基於线性预测的编码方案 | |
| HK1210316B (zh) | 使用改进的概率分布估计的基於线性预测的音频编码 |