JP6184519B2 - 音声信号復号化または符号化の時間領域レベル調整 - Google Patents
音声信号復号化または符号化の時間領域レベル調整 Download PDFInfo
- Publication number
- JP6184519B2 JP6184519B2 JP2015553045A JP2015553045A JP6184519B2 JP 6184519 B2 JP6184519 B2 JP 6184519B2 JP 2015553045 A JP2015553045 A JP 2015553045A JP 2015553045 A JP2015553045 A JP 2015553045A JP 6184519 B2 JP6184519 B2 JP 6184519B2
- Authority
- JP
- Japan
- Prior art keywords
- frequency band
- audio signal
- level
- level shift
- time domain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0018—Speech coding using phonetic or linguistical decoding of the source; Reconstruction using text-to-speech synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0224—Processing in the time domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L21/0216—Noise filtering characterised by the method used for estimating noise
- G10L21/0232—Processing in the frequency domain
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/0332—Details of processing therefor involving modification of waveforms
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0316—Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
- G10L21/0324—Details of processing therefor
- G10L21/034—Automatic adjustment
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
Description
以下に、本発明の実施例は、図面を参照して、更に詳細に記載されている。
各インデックスは、整数値(x)のシーケンス、例えばスペクトル線を表し、シーケンスの長さは、コードブック、例えばAAC−ELDの2または4の次元に依存する。
コードブックの各コード名のためにコードブックのコード名に関連して数値のシーケンスを決定する工程(ステップ1310)。前述したように、コードブックは数値のシーケンス、例えばコードブックのコード名によって2または4の数値を符号化する。コードブックは、数値の複数のシーケンスを符号化する複数のコードブックを含む。決定される数値のシーケンスは、コードブックの考慮されたコード名によって符号化される数値のシーケンスである。ステップ1310は、コードブックの各コード名のために行われる。たとえば、コードブックが81のコード名を含む場合、数値の81のシーケンスはステップ1310において決定される。
A) 逆量子化器をシーケンスの整数値に適用する(例えば、AAC―ELD:
x^(4/3))
B) A)のシーケンスの各値を2乗することによって、エネルギーを算出する
C) B)のシーケンスの合計を構築する
D) インデックスの所定の確率を有するC)を乗算する
E) スペクトル線につき予想されるエネルギーを得るために、コードブックの次元によって割る。
最後に、E)によって算出されるすべての値は、完全なコードブックの予想されるエネルギーを得るために合計されなければならない。
− 複数の周波数帯域信号を得るために符号化された音声信号表現を前処理する工程;
− 符号化された音声信号表現のための現在のレベル・シフト係数を決定するために周波数帯域信号のゲインに関連してサイド情報を分析する工程;
− レベル・シフトされた周波数帯域信号を得るためのレベル・シフト係数に従って周波数帯域信号のレベルをシフトする工程;
− 周波数帯域信号の時間領域表現への周波数−時間領域変換を実行する工程;および
− レベル・シフトされた周波数帯域信号に適用されるレベル・シフトを少なくとも部分的に補償するために、および十分に補償された時間領域表現を得るために時間領域表現について決定する工程。
− 一時的に、以前のレベル・シフト係数を格納すること、
− 現在のレベル・シフト係数にウィンドウ形状を適用することにより第1の複数のウィンドウ化サンプルを生成すること、
− 以前のレベル・シフト係数の一時的な格納の作用により与えられた以前のレベル・シフト係数に以前のウィンドウ形状を適用することにより第2の複数のウィンドウ化サンプルを生成すること、および
− 複数の複合サンプルを得るために第1の複数のウィンドウ化サンプルの、および第2の複数のウィンドウ化サンプルの相互に対応するウィンドウ化サンプルを結合すること。
− 以前のレベル・シフト係数を以前のフレーム係数シーケンスという結果になっている以前のウィンドウ形状の第2の部分と結合、
− 現在のレベル・シフト係数を現在のフレーム係数シーケンスという結果になっている現在のウィンドウ形状の第1の部分と結合、
− 以前のフレーム係数シーケンスおよび現在のフレーム係数シーケンスに基づいてクロスフェードされたレベル・シフト係数のシーケンスを決定。
Claims (16)
- 符号化された音声信号表現に基づいて復号化された音声信号表現を提供するように構成された音声信号デコーダ(100)であって、音声信号デコーダは:
符号化された音声信号表現から複数の周波数帯域信号を得るように構成されたデコーダ前処理ステージ(110);
サイド情報が符号化された音声信号表現に対する現在のレベル・シフト係数を決定するために、潜在的クリッピングを示すかどうかについて、符号化された音声信号表現の周波数帯域信号のゲインと関連するサイド情報を分析するように構成され、サイド情報が潜在的クリッピングを示す場合、現在のレベル・シフト係数が、複数の周波数帯域信号の情報を、少なくとも1つの最上位ビットにおいてヘッドルームが得られるように、最下位ビットの方へシフトを引き起こすように構成されたクリッピング推定器(120);
レベル・シフトされた周波数帯域信号を得るための現在のレベル・シフト係数に従って周波数帯域信号のレベルをシフトさせるように構成されたレベルシフタ(130);
レベル・シフトされた周波数帯域信号を時間領域表現に変換するように構成された周波数−時間領域コンバータ(140);および
レベルシフタ(130)によってレベル・シフトされた周波数帯域信号に適用されるレベル・シフトを少なくとも部分的に補償し、そして、実質的に補償された時間領域表現を得るように、時間領域表現を決定するように構成されたレベル・シフト補償器(150)を含む、音声信号デコーダ。 - クリッピング推定器(120)がサイド情報および符号化された音声信号表現のうちの少なくとも1つに基づいてクリッピング確率を決定し、クリッピング確率に基づいて現在のレベル・シフト係数を決定するように構成された、請求項1に記載の音声信号デコーダ(100)。
- サイド情報は、複数の周波数帯域信号のための全体的なゲイン係数および複数のスケール係数のうちの少なくとも1つを含み、各スケール係数は複数の周波数帯域信号の中の1つの周波数帯域信号または周波数帯域信号の1つのグループに対応する、請求項1または請求項2に記載の音声信号デコーダ(100)。
- デコーダ前処理ステージ(110)が複数の連続したフレームの形で複数の周波数帯域信号を得るように構成され、クリッピング推定器(120)は、現在のフレームのための現在のレベル・シフト係数を決定するように構成される、請求項1ないし請求項3のいずれかに記載の音声信号デコーダ(100)。
- 復号化された音声信号表現が実質的に補償された時間領域表現に基づいて決定される、請求項1ないし請求項4のいずれかに記載の音声信号デコーダ(100)。
- 更に、レベル・シフト補償器(150)の下流の時間領域リミッタを含む、請求項1ないし請求項5のいずれかに記載の音声信号デコーダ(100)。
- 周波数帯域信号のゲインと関連するサイド情報は、複数の周波数帯域関連ゲイン係数を含む、請求項1ないし請求項6のいずれかに記載の音声信号デコーダ(100)。
- デコーダ前処理ステージ(110)は、複数の周波数帯域に特有の量子化インジケータのうちの周波数帯域に特有の量子化インジケータを用いて各周波数帯域信号を再量子化するように構成される逆量子化器を含む、請求項1ないし請求項7のいずれかに記載の音声信号デコーダ(100)。
- 更に、レベル・シフト補償器(150)による使用のためのクロスフェードされたレベル・シフト係数を得るために、現在のレベル・シフト係数と次のレベル・シフト係数とをクロスフェードさせるように構成された移行形状調整装置を含む、請求項1ないし請求項8のいずれかに記載の音声信号デコーダ(100)。
- 移行形状調整装置は、以前のレベル・シフト係数に対するメモリ(371)、現在のレベル・シフト係数にウィンドウ形状を適用することによって第1の複数のウィンドウ化されたサンプルを生成するように構成される第1のwindower(372)、メモリ(371)によって与えられる以前のレベル・シフト係数に以前のウィンドウ形状を適用することによって第2の複数のウィンドウ化されたサンプルを生成するように構成される第2のwindower(376)、および複数の複合サンプルを得るために相互に対応する第1の複数のウィンドウ化されたサンプルおよび第2の複数のウィンドウ化されたサンプルを結合するように構成されたサンプル・コンバイナ(379)を含む、請求項9に記載の音声信号デコーダ(100)。
- 現在のレベル・シフト係数は複数の周波数帯域信号の現在のフレームに有効であり、以前のレベル・シフト係数は、複数の周波数帯域信号の以前のフレームに有効であり、現在のフレームおよび以前のフレームが重なり合って;
移行形状調整は、
以前のレベル・シフト係数を以前のフレーム係数シーケンスという結果になっている以前のウィンドウ形状の第2の部分と結合するように構成され、
現在のレベル・シフト係数を現在のフレーム係数シーケンスという結果になっている現在のウィンドウ形状の第1の部分と結合するように構成され、および
以前のフレーム係数シーケンスおよび現在のフレーム係数シーケンスに基づいてクロスフェードされたレベル・シフト係数のシーケンスを決定するように構成される、請求項10に記載の音声信号デコーダ(100)。 - クリッピング推定器(120)は、符号化された音声信号表現およびサイド情報のうちの少なくとも1つが、最下位ビットが関連する情報を含まないことを意味する時間領域表現の範囲内における潜在的クリッピングを示すかどうかについて、符号化された音声信号表現およびサイド情報のうちの少なくとも一方を分析するように構成され、この場合、レベルシフタによって適用されるレベル・シフトが、最下位ビットに情報をシフトし、それによって最上位ビットを開放することにより最上位ビットにおいてヘッドルームが得られるように構成された、請求項1ないし請求項11のいずれかに記載の音声信号デコーダ(100)。
- クリッピング推定器(120)は、
確認されたコードブックとして複数のコードブックからコードブックを決定するためのコードブック決定器(1110)を含み、符号化された音声信号表現は確認されたコードブックを使用することにより符号化されたものであり、
推定器(1120)は、引き出されたレベル値として確認されたコードブックと関連したレベル値を引き出すために構成され、引き出されたレベル値を用いて音声信号のレベル推定を評価するために構成される、請求項1ないし請求項12のいずれかに記載の音声信号デコーダ。 - 入力音声信号の時間領域表現に基づいて符号化された音声信号表現を提供するように構成された音声信号エンコーダであって、音声信号エンコーダは、
入力信号表現に対する現在のレベル・シフト係数を決定するために、潜在的クリッピングが示されているかどうかについて入力音声信号の時間領域表現を分析するように構成されるクリッピング推定器であって、潜在的クリッピングが示されるとき、現在のレベル・シフト係数が、入力音声信号の時間領域表現を、少なくとも1つの最上位ビットにおいてヘッドルームが得られるように、最下位ビットの方へシフトを引き起こすものである、クリッピング推定器;
レベル・シフトされた時間領域表現を得るための現在のレベル・シフト係数に従って入力音声信号の時間領域表現のレベルをシフトさせるように構成されたレベルシフタ;
レベル・シフトされた時間領域表現を複数の周波数帯域信号に変換するように構成された時間−周波数領域コンバータ;および
レベルシフタによってレベル・シフトされた時間領域表現に適用されるレベル・シフトを少なくとも部分的に補償し、そして、複数の実質的に補償された周波数帯域信号を得るように、複数の周波数帯域信号を決定するように構成されたレベル・シフト補償器を含む、音声信号エンコーダ。 - 符号化された音声信号表現を復号化し、対応する復号化音声信号表現を提供するための方法であって、前記方法は、
複数の周波数帯域信号を得るために符号化された音声信号表現を前処理するステップ;
符号化された音声信号表現に対する現在のレベル・シフト係数を決定するために、潜在的クリッピングをサイド情報が示唆するどうかについて周波数帯域信号のゲインと関連するサイド情報を分析するステップであって、サイド情報が潜在的クリッピングを示す場合、現在のレベル・シフト係数が、複数の周波数帯域信号の情報を、少なくとも1つの最上位ビットにおいてヘッドルームが得られるように、最下位ビットの方へシフトを引き起こすものであるステップ;
レベル・シフトされた周波数帯域信号を得るためのレベル・シフト係数に従って周波数帯域信号のレベルをシフトさせるステップ;
周波数帯域信号の時間領域表現への周波数−時間領域変換を実行するステップ;および
レベル・シフトされた周波数帯域信号に適用されるレベル・シフトを少なくとも部分的に補償し、そして、実質的に補償された時間領域表現を得るように、時間領域表現を決定するステップを含む、方法。 - コンピュータに請求項15の方法を実行するように指示するためのコンピュータプログラム。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP13151910.0A EP2757558A1 (en) | 2013-01-18 | 2013-01-18 | Time domain level adjustment for audio signal decoding or encoding |
| EP13151910.0 | 2013-01-18 | ||
| PCT/EP2014/050171 WO2014111290A1 (en) | 2013-01-18 | 2014-01-07 | Time domain level adjustment for audio signal decoding or encoding |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2016505168A JP2016505168A (ja) | 2016-02-18 |
| JP6184519B2 true JP6184519B2 (ja) | 2017-08-23 |
Family
ID=47603376
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2015553045A Active JP6184519B2 (ja) | 2013-01-18 | 2014-01-07 | 音声信号復号化または符号化の時間領域レベル調整 |
Country Status (11)
| Country | Link |
|---|---|
| US (1) | US9830915B2 (ja) |
| EP (2) | EP2757558A1 (ja) |
| JP (1) | JP6184519B2 (ja) |
| KR (2) | KR20150106929A (ja) |
| CN (1) | CN105210149B (ja) |
| BR (1) | BR112015017293B1 (ja) |
| CA (1) | CA2898005C (ja) |
| ES (1) | ES2604983T3 (ja) |
| MX (1) | MX346358B (ja) |
| RU (1) | RU2608878C1 (ja) |
| WO (1) | WO2014111290A1 (ja) |
Families Citing this family (44)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| EP2262108B1 (en) | 2004-10-26 | 2017-03-01 | Dolby Laboratories Licensing Corporation | Adjusting the perceived loudness and/or the perceived spectral balance of an audio signal |
| TWI529703B (zh) | 2010-02-11 | 2016-04-11 | 杜比實驗室特許公司 | 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法 |
| CN103325380B (zh) | 2012-03-23 | 2017-09-12 | 杜比实验室特许公司 | 用于信号增强的增益后处理 |
| US10844689B1 (en) | 2019-12-19 | 2020-11-24 | Saudi Arabian Oil Company | Downhole ultrasonic actuator system for mitigating lost circulation |
| CN119495308A (zh) | 2012-05-18 | 2025-02-21 | 杜比实验室特许公司 | 用于维持与参数音频编码器相关联的可逆动态范围控制信息的系统 |
| EP2757558A1 (en) * | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
| UA129991C2 (uk) | 2013-01-21 | 2025-10-08 | Долбі Лабораторіс Лайсензін Корпорейшн | Блок та спосіб обробки звукового сигналу, носій інформації |
| KR20240055146A (ko) | 2013-01-21 | 2024-04-26 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 상이한 재생 디바이스들에 걸친 라우드니스 및 동적 범위의 최적화 |
| CN116665683A (zh) | 2013-02-21 | 2023-08-29 | 杜比国际公司 | 用于参数化多声道编码的方法 |
| CN107093991B (zh) | 2013-03-26 | 2020-10-09 | 杜比实验室特许公司 | 基于目标响度的响度归一化方法和设备 |
| US9635417B2 (en) | 2013-04-05 | 2017-04-25 | Dolby Laboratories Licensing Corporation | Acquisition, recovery, and matching of unique information from file-based media for automated file detection |
| TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
| CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
| JP6476192B2 (ja) | 2013-09-12 | 2019-02-27 | ドルビー ラボラトリーズ ライセンシング コーポレイション | 多様な再生環境のためのダイナミックレンジ制御 |
| CN116741189A (zh) | 2013-09-12 | 2023-09-12 | 杜比实验室特许公司 | 用于下混合音频内容的响度调整 |
| CN105580277B (zh) * | 2013-11-27 | 2019-08-09 | 密克罗奇普技术公司 | 主时钟高精度振荡器 |
| CN110808723B (zh) | 2014-05-26 | 2024-09-17 | 杜比实验室特许公司 | 音频信号响度控制 |
| CN106683681B (zh) | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
| EP4372746B1 (en) | 2014-10-10 | 2025-06-25 | Dolby Laboratories Licensing Corporation | Transmission-agnostic presentation-based program loudness |
| WO2016129412A1 (ja) * | 2015-02-10 | 2016-08-18 | ソニー株式会社 | 送信装置、送信方法、受信装置および受信方法 |
| CN104795072A (zh) * | 2015-03-25 | 2015-07-22 | 无锡天脉聚源传媒科技有限公司 | 一种音频数据的编码方法及装置 |
| CN105662706B (zh) * | 2016-01-07 | 2018-06-05 | 深圳大学 | 增强时域表达的人工耳蜗信号处理方法及系统 |
| CN109328382B (zh) * | 2016-06-22 | 2023-06-16 | 杜比国际公司 | 用于将数字音频信号从第一频域变换到第二频域的音频解码器及方法 |
| US11153594B2 (en) * | 2016-08-29 | 2021-10-19 | Apple Inc. | Multidimensional quantization techniques for video coding/decoding systems |
| KR102709737B1 (ko) * | 2016-11-30 | 2024-09-26 | 삼성전자주식회사 | 오디오 신호를 전송하는 전자 장치 및 오디오 신호를 전송하는 전자 장치의 제어 방법 |
| KR102565447B1 (ko) * | 2017-07-26 | 2023-08-08 | 삼성전자주식회사 | 청각 인지 속성에 기반하여 디지털 오디오 신호의 이득을 조정하는 전자 장치 및 방법 |
| US11086843B2 (en) | 2017-10-19 | 2021-08-10 | Adobe Inc. | Embedding codebooks for resource optimization |
| US11120363B2 (en) | 2017-10-19 | 2021-09-14 | Adobe Inc. | Latency mitigation for encoding data |
| US10942914B2 (en) * | 2017-10-19 | 2021-03-09 | Adobe Inc. | Latency optimization for digital asset compression |
| EP3483884A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signal filtering |
| WO2019091576A1 (en) | 2017-11-10 | 2019-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits |
| EP3483878A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder supporting a set of different loss concealment tools |
| EP3483886A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Selecting pitch lag |
| EP3483882A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Controlling bandwidth in encoders and/or decoders |
| EP3483879A1 (en) | 2017-11-10 | 2019-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Analysis/synthesis windowing function for modulated lapped transformation |
| US10331400B1 (en) * | 2018-02-22 | 2019-06-25 | Cirrus Logic, Inc. | Methods and apparatus for soft clipping |
| CN109286922B (zh) * | 2018-09-27 | 2021-09-17 | 珠海市杰理科技股份有限公司 | 蓝牙提示音处理方法、系统、可读存储介质和蓝牙设备 |
| US11930347B2 (en) * | 2019-02-13 | 2024-03-12 | Dolby Laboratories Licensing Corporation | Adaptive loudness normalization for audio object clustering |
| US11322127B2 (en) | 2019-07-17 | 2022-05-03 | Silencer Devices, LLC. | Noise cancellation with improved frequency resolution |
| CN111342937B (zh) * | 2020-03-17 | 2022-05-06 | 北京百瑞互联技术有限公司 | 一种动态调整编解码处理器电压和/或频率的方法和装置 |
| US11348594B2 (en) * | 2020-06-11 | 2022-05-31 | Qualcomm Incorporated | Stream conformant bit error resilience |
| CN116964964A (zh) * | 2020-12-16 | 2023-10-27 | Gn听力公司 | 音频信号处理系统、扬声器和电子设备 |
| KR102809046B1 (ko) * | 2022-11-11 | 2025-05-19 | 삼성전자주식회사 | 양자화 스케일링 장치 및 양자화를 위한 스케일링 파라미터의 계산 방법 |
| CN120299465B (zh) * | 2025-06-12 | 2025-09-09 | 北京生数科技有限公司 | 音频数据处理方法、装置、设备、存储介质及程序产品 |
Family Cites Families (25)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| GB2311919B (en) | 1994-12-15 | 1999-04-28 | British Telecomm | Speech processing |
| US6280309B1 (en) | 1995-10-19 | 2001-08-28 | Norton Company | Accessories and attachments for angle grinder |
| US5796842A (en) * | 1996-06-07 | 1998-08-18 | That Corporation | BTSC encoder |
| US6289309B1 (en) * | 1998-12-16 | 2001-09-11 | Sarnoff Corporation | Noise spectrum tracking for speech enhancement |
| JP3681105B2 (ja) * | 2000-02-24 | 2005-08-10 | アルパイン株式会社 | データ処理方式 |
| DE60031002T2 (de) * | 2000-02-29 | 2007-05-10 | Qualcomm, Inc., San Diego | Multimodaler mischbereich-sprachkodierer mit geschlossener regelschleife |
| US6651040B1 (en) * | 2000-05-31 | 2003-11-18 | International Business Machines Corporation | Method for dynamic adjustment of audio input gain in a speech system |
| CA2359771A1 (en) * | 2001-10-22 | 2003-04-22 | Dspfactory Ltd. | Low-resource real-time audio synthesis system and method |
| JP2003280691A (ja) * | 2002-03-19 | 2003-10-02 | Sanyo Electric Co Ltd | 音声処理方法および音声処理装置 |
| US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
| DE10345995B4 (de) * | 2003-10-02 | 2005-07-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines Signals mit einer Sequenz von diskreten Werten |
| US7751572B2 (en) * | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
| CN101273404B (zh) * | 2005-09-30 | 2012-07-04 | 松下电器产业株式会社 | 语音编码装置以及语音编码方法 |
| DE102006022346B4 (de) * | 2006-05-12 | 2008-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Informationssignalcodierung |
| TWI396187B (zh) * | 2007-02-14 | 2013-05-11 | Lg Electronics Inc | 用於將以物件為主之音訊信號編碼與解碼之方法與裝置 |
| US9653088B2 (en) * | 2007-06-13 | 2017-05-16 | Qualcomm Incorporated | Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding |
| US8126578B2 (en) * | 2007-09-26 | 2012-02-28 | University Of Washington | Clipped-waveform repair in acoustic signals using generalized linear prediction |
| WO2009074945A1 (en) * | 2007-12-11 | 2009-06-18 | Nxp B.V. | Prevention of audio signal clipping |
| CN101350199A (zh) * | 2008-07-29 | 2009-01-21 | 北京中星微电子有限公司 | 音频编码器及音频编码方法 |
| EP4293665B1 (en) * | 2008-10-29 | 2025-01-22 | Dolby International AB | Signal clipping protection using pre-existing audio gain metadata |
| US8346547B1 (en) * | 2009-05-18 | 2013-01-01 | Marvell International Ltd. | Encoder quantization architecture for advanced audio coding |
| AU2011311543B2 (en) * | 2010-10-07 | 2015-05-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Apparatus and method for level estimation of coded audio frames in a bit stream domain |
| TWI651005B (zh) * | 2011-07-01 | 2019-02-11 | 杜比實驗室特許公司 | 用於適應性音頻信號的產生、譯碼與呈現之系統與方法 |
| EP2791938B8 (en) * | 2011-12-15 | 2016-05-04 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer programm for avoiding clipping artefacts |
| EP2757558A1 (en) * | 2013-01-18 | 2014-07-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Time domain level adjustment for audio signal decoding or encoding |
-
2013
- 2013-01-18 EP EP13151910.0A patent/EP2757558A1/en not_active Withdrawn
-
2014
- 2014-01-07 MX MX2015009171A patent/MX346358B/es active IP Right Grant
- 2014-01-07 CN CN201480016606.2A patent/CN105210149B/zh active Active
- 2014-01-07 ES ES14702195.0T patent/ES2604983T3/es active Active
- 2014-01-07 KR KR1020157021762A patent/KR20150106929A/ko not_active Ceased
- 2014-01-07 WO PCT/EP2014/050171 patent/WO2014111290A1/en not_active Ceased
- 2014-01-07 KR KR1020177024874A patent/KR101953648B1/ko active Active
- 2014-01-07 EP EP14702195.0A patent/EP2946384B1/en active Active
- 2014-01-07 CA CA2898005A patent/CA2898005C/en active Active
- 2014-01-07 JP JP2015553045A patent/JP6184519B2/ja active Active
- 2014-01-07 BR BR112015017293-8A patent/BR112015017293B1/pt active IP Right Grant
- 2014-01-07 RU RU2015134587A patent/RU2608878C1/ru active
-
2015
- 2015-07-09 US US14/795,063 patent/US9830915B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| US9830915B2 (en) | 2017-11-28 |
| EP2946384A1 (en) | 2015-11-25 |
| BR112015017293B1 (pt) | 2021-12-21 |
| EP2757558A1 (en) | 2014-07-23 |
| KR101953648B1 (ko) | 2019-05-23 |
| KR20150106929A (ko) | 2015-09-22 |
| ES2604983T3 (es) | 2017-03-10 |
| BR112015017293A2 (pt) | 2018-05-15 |
| CN105210149A (zh) | 2015-12-30 |
| CA2898005A1 (en) | 2014-07-24 |
| US20160019898A1 (en) | 2016-01-21 |
| CA2898005C (en) | 2018-08-14 |
| EP2946384B1 (en) | 2016-11-02 |
| MX2015009171A (es) | 2015-11-09 |
| JP2016505168A (ja) | 2016-02-18 |
| CN105210149B (zh) | 2019-08-30 |
| WO2014111290A1 (en) | 2014-07-24 |
| MX346358B (es) | 2017-03-15 |
| RU2608878C1 (ru) | 2017-01-25 |
| KR20170104661A (ko) | 2017-09-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6184519B2 (ja) | 音声信号復号化または符号化の時間領域レベル調整 | |
| CN104021795B (zh) | 码簿激励线性预测编码器、译码器及编码、译码方法 | |
| JP5978218B2 (ja) | 低ビットレート低遅延の一般オーディオ信号の符号化 | |
| JP6980871B2 (ja) | 信号符号化方法及びその装置、並びに信号復号方法及びその装置 | |
| CN104321815A (zh) | 用于带宽扩展的高频编码/高频解码方法和设备 | |
| RU2762301C2 (ru) | Устройство и способ для кодирования и декодирования аудиосигнала с использованием понижающей дискретизации или интерполяции масштабных параметров | |
| JP7003253B2 (ja) | エンコーダおよび/またはデコーダの帯域幅の制御 | |
| JP2006145782A (ja) | オーディオ信号符号化装置および方法 | |
| AU2014280256B2 (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding | |
| CN105122358A (zh) | 用于处理编码信号的装置和方法与用于产生编码信号的编码器和方法 | |
| AU2014280258B9 (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding | |
| HK40029859B (en) | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters | |
| HK40029859A (en) | Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters | |
| HK1223725B (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding | |
| HK1223726B (en) | Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20150917 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20161017 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20161025 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20170125 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20170213 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170627 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170725 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6184519 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |