JP2019032543A - スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 - Google Patents
スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 Download PDFInfo
- Publication number
- JP2019032543A JP2019032543A JP2018181254A JP2018181254A JP2019032543A JP 2019032543 A JP2019032543 A JP 2019032543A JP 2018181254 A JP2018181254 A JP 2018181254A JP 2018181254 A JP2018181254 A JP 2018181254A JP 2019032543 A JP2019032543 A JP 2019032543A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- block
- time
- output
- spectrum
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/03—Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Position Fixing By Use Of Radio Waves (AREA)
- Radar Systems Or Details Thereof (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
- Measurement Of The Respiration, Hearing Ability, Form, And Blood Characteristics Of Living Organisms (AREA)
- Measurement Of Unknown Time Intervals (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
- Stereo-Broadcasting Methods (AREA)
- Mobile Radio Communication Systems (AREA)
- Control Of Eletrric Generators (AREA)
- Emergency Protection Circuit Devices (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
Description
[数1]
fy/fx=Ny/Nx
ダウンサンプリングの場合、Nx>Nyである。そのダウンサンプリングは、オリジナルスペクトルXを直接的にスケーリングしかつ切り詰めることで、周波数ドメインにおいて単純に実行され得る。
[数2]
Y[k]=X[k]・Ny/Nx k=0…Ny
アップサンプリングの場合、Nx<Nyである。そのアップサンプリングは、オリジナルスペクトルXを直接的にスケーリングしかつゼロパディングすることで、周波数ドメインにおいて単純に実行され得る。
[数3]
Y[k]=X[k]・Ny/Nx k=0…Nx
Y[k]=0 k=Nx・Ny
[数4]
Y[k]=X[k]・Ny/Nx 全てのk=0…min(Ny,Nx)について
Y[k]=0 全てのk=min(Ny,Nx)…Nyについて、但しNy>Nxの場合
[数5]
y=iDFT(Y)
[数6]
win_ovlp(k) = sin(pi*(k+0.5)/(2* ovlp_size));,k=0…ovlp_size-1について
他方、下降するovlp_size係数は次式により与えられる。
[数7]
win_ovlp(k) = sin(pi*(ovlp_size-1-k+0.5)/(2* ovlp_size));,k=0…ovlp_size-1について
ここで、ovlp_size係数はサンプリングレートの関数であって、図8aで示される。
・オーバーラップ領域は、MDCTコア及びACELP先読みのオーバーラップ領域以下でなくてはならない。好ましい実施形態では、全てのサイズは8.75msに等しい。
・DFTドメインにおけるチャネルの線形シフトの適用を可能にするため、ゼロパディングは少なくとも約2.5msでなければならない。
・窓サイズ、オーバーラップ領域サイズ及びゼロパディングサイズは、異なるサンプリングレート12.8,16,25.6,32,48kHzについて、整数個のサンプルで示さなければならない。
・DFTの複雑性はできるだけ低くしなければならない。即ち、split−radixFFT型におけるDFTの最大基数(maximum radix)はできるだけ低くしなければならない。
・時間分解能は10msに固定される。
1/sin()
がリドレス関数として使用される。
の窓関数となる。これにより、ブロック1922により取得されるリドレス済みの先読み部分が、先読み部分内のオリジナル信号にできるだけ近くなることが保証されるが、当然ながら、オリジナル左信号又はオリジナル右信号ではなく、中央信号を取得するために左と右とを加算することで得られたであろうオリジナル信号である。
−残差信号の二次的符号化による
−前のDFTフレームからの前の復号化済み中央信号スペクトルを用いて残差サイドスペクトルを予測する、ステレオ充填として知られる残差予測による
DFTによって実行される、ステレオ処理からの特殊な時間−周波数分解によって、良好な聴覚的シーン分析をもたらす一方で、符号化システムの全体的な遅延が有意に増加しないようにすることが重要である。デフォルトにより、10msの時間分解能(コアコーダの20msフレーミングの2倍)が使用される。分析窓と合成窓は同じであり、対称形である。窓は図8cの中で16kHzのサンプリングレートで表現される。発生する遅延を低減するためにオーバーラップ領域が制限され、後段で説明するように、ITDを周波数ドメインにおいて適用する際に循環シフトを釣り合わせるためにゼロパディングもまた追加されることが見て取れる。
ステレオパラメータは、ステレオDFTの時間分解能における最大限で伝送され得る。最小限では、ステレオパラメータはコアコーダのフレーミング分解能、即ち20msへと低減され得る。デフォルトにより、過渡が検出されない場合、パラメータは2つのDFT窓にわたり20ms毎に計算される。パラメータ帯域は、等価方形帯域幅(Equivalent Rectangular Bandwidth)(ERB)の凡そ2倍又は4倍の後に続いてスペクトルの非均一かつ非オーバーラップの分解を構成する。デフォルトにより、16kHz(32kbpsのサンプリングレート、スーパーワイドバンド・ステレオ)の周波数帯域幅について、ERBのスケールの4倍が、合計で12個の帯域について使用される。図8は、ステレオサイド情報が約5kbpsで伝送される構成の一例を要約したものである。
ITDは、位相変換を用いた一般化相互相関(Generalized Cross Correlation with Phase Transform)(GCC−PHAT)を使用して、到達時間差(TDOA)を推定することにより計算される。
2つのチャネルの時間アライメントの後で、IPDが計算され、この計算は、各パラメータ帯域又は少なくとも所与のipd_max_bandまで、ステレオ構成に依存して行われる。
であり、bは周波数インデックスkが帰属するパラメータ帯域インデックスである。パラメータβは、2つのチャネル間の位相回転の量を分配し、同時にそれらの位相をアライメントする役割を担う。βはIPDに依存し、またチャネル同士の相対的な振幅レベルILDにも依存する。あるチャネルがより高い振幅を有する場合、それが先導チャネルとして認識され、低い振幅を有するチャネルよりも位相回転によって受ける影響が少なくなるであろう。
和差変換は、2つのチャネルの時間及び位相がアライメントされたスペクトルに対し、中央信号内でエネルギーが保存される方法で実行される。
は 1/1.2と1.2との間、即ち−1.58dBと+1.58dBの間に制限される。この制限により、M及びSのエネルギーを調整するときにアーチファクトを防止できる。このエネルギー保存は、時間及び位相が事前にアライメントされていた場合には重要度が低いことに留意すべきである。代替的に、これら制限は増大又は減少され得る。
であり、かつatan2(x,y)はyに対するxの四象限逆正接(four-quadrant inverse tangent)である。
[請求項1]
少なくとも2つのチャネルを含む多チャネル信号を符号化する装置であって、
前記少なくとも2つのチャネルのサンプル値のブロック系列を前記少なくとも2つのチャネルについてのスペクトル値のブロック系列を有する周波数ドメイン表現へ変換する時間−スペクトル変換部(1000)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の前記ブロック系列のスペクトル値の各ブロックは、前記入力サンプリングレートに関係する最大入力周波数(1211)までのスペクトル値を有する、時間−スペクトル変換部(1000)と、
スペクトル値の前記ブロック系列又はスペクトル値のブロックのリサンプリング済み系列にジョイント多チャネル処理を適用して、前記少なくとも2つのチャネルに関係する情報を含むスペクトル値のブロックの少なくとも1つの結果系列を取得する多チャネル処理部(1010)と、
周波数ドメインで前記結果系列のブロックをリサンプリングするか、又は周波数ドメインで前記少なくとも2つのチャネルについてスペクトル値の前記ブロック系列をリサンプリングして、スペクトル値のブロックのリサンプリング済み系列を取得するスペクトルドメイン・リサンプラ(1020)であって、スペクトル値のブロックのリサンプリング済み系列の各ブロックは前記最大入力周波数(1211)とは異なる最大出力周波数(1231,1221)までのスペクトル値を有する、スペクトルドメイン・リサンプラ(1020)と、
スペクトル値のブロックの前記リサンプリング済み系列を時間ドメイン表現へ変換するか、又はスペクトル値のブロックの前記結果系列を時間ドメイン表現へ変換するスペクトル−時間変換部(1030)であって、前記時間ドメイン表現は、前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの出力系列を含む、スペクトル−時間変換部(1030)と、
サンプリング値のブロックの前記出力系列を符号化して、符号化済み多チャネル信号(1510)を得るコア符号器(1040)と、
を備える符号化装置。
[請求項2]
前記スペクトルドメイン・リサンプラ(1020)は、ダウンサンプリングのために前記ブロックを切り詰めるか、又はアップサンプリングのために前記ブロックをゼロパディングするよう構成されている、請求項1に記載の符号化装置。
[請求項3]
前記スペクトルドメイン・リサンプラ(1020)は、前記最大入力周波数に依存しかつ前記最大出力周波数に依存するスケーリングファクタを使用して、ブロックの前記結果系列のブロックの前記スペクトル値をスケーリング(1322)するよう構成されている、請求項1又は2に記載の符号化装置。
[請求項4]
前記スケーリングファクタはアップサンプリングの場合に1より大きく、前記出力サンプリングレートは前記入力サンプリングレートより大きいか、又は前記スケーリングファクタはダウンサンプリングの場合に1より小さく、前記出力サンプリングレートは前記入力サンプリングレートより小さく、又は
前記時間−スペクトル変換部(1000)は、スペクトル値のブロックのスペクトル値の全体数に関連した正規化を使用せず(1311)に、時間−周波数変換アルゴリズムを実行するよう構成され、前記スケーリングファクタは、リサンプリング済み系列の1ブロックのスペクトル値の数と、リサンプリング前のスペクトル値の1ブロックのスペクトル値の数との商に等しく、前記スペクトル−時間変換部は前記最大出力周波数に基づいて正規化を適用する(1331)よう構成されている、
請求項3に記載の符号化装置。
[請求項5]
前記時間−スペクトル変換部(1000)は離散フーリエ変換アルゴリズムを実行するよう構成されるか、又は前記スペクトル−時間変換部(1030)は逆離散フーリエ変換アルゴリズムを実行するよう構成される、請求項1〜4のいずれか1項に記載の符号化装置。
[請求項6]
前記多チャネル処理部(1010)は、スペクトル値のブロックの追加の結果系列を得るよう構成され、
前記スペクトル−時間変換部(1030)は、スペクトル値の前記追加の結果系列を追加の時間ドメイン表現(1032)へと変換するよう構成され、前記追加の時間ドメイン表現は、前記入力サンプリングレートに等しい出力サンプリングレートを関連して持つサンプリング値のブロックの追加の出力系列を含む、
請求項1に記載の符号化装置。
[請求項7]
前記多チャネル処理部(1010)は、スペクトル値のブロックのさらに追加の結果系列を提供するよう構成され、
前記スペクトルドメイン・リサンプラ(1020)は、周波数ドメインで前記さらに追加の結果系列のブロックをリサンプリングして、スペクトル値のブロックの追加のリサンプリング済み系列を取得するよう構成され、前記追加のリサンプリング済み系列の各ブロックは、前記最大出力周波数と異なるか又は前記最大入力周波数と異なる、追加の最大出力周波数までのスペクトル値を有し、
前記スペクトル−時間変換部(1030)は、スペクトル値のブロックの前記追加のリサンプリング済み系列を、さらに追加の時間ドメイン表現へと変換するよう構成され、前記さらに追加の時間ドメイン表現は、前記出力サンプリングレート又は前記入力サンプリングレートとは異なる追加の出力サンプリングレートを関連して持つサンプリング値のブロックのさらに追加の出力系列を有する、
請求項1〜6のいずれか1項に記載の符号化装置。
[請求項8]
前記多チャネル処理部(1010)は、ダウンミクス操作だけを使用してスペクトル値のブロックの前記少なくとも1つの結果系列として中央信号を生成するか、又はスペクトル値のブロックの追加の結果系列として追加的サイド信号を生成するよう構成されている、請求項1〜7のいずれか1項に記載の符号化装置。
[請求項9]
前記多チャネル処理部(1010)は、前記少なくとも1つの結果系列として中央信号を生成するよう構成され、前記スペクトルドメイン・リサンプラ(1020)は前記中央信号を前記最大入力周波数とは異なる2つの異なる最大出力周波数を有する別個の2つの系列へとリサンプリングするよう構成され、
前記スペクトル−時間変換部(1030)は、リサンプリング済みの前記2つの系列を異なるサンプリングレートを有する2つの出力系列へと変換するよう構成され、
前記コア符号器(1030)は、第1の出力系列を第1サンプリングレートで前処理する第1前処理部(1430c)、又は第2の出力系列を第2サンプリングレートで前処理する第2前処理部(1430d)を有し、かつ
前記コア符号器は、前処理済みの前記第1又は第2の信号をコア符号化するよう構成されるか、
又は、
前記多チャネル処理部は、前記少なくとも1つの結果系列としてサイド信号を生成するよう構成され、前記スペクトルドメイン・リサンプラ(1020)は、前記サイド信号を前記最大入力周波数とは異なる2つの異なる最大出力周波数を有する2つのリサンプリング済み系列へとリサンプリングするよう構成され、
前記スペクトル−時間変換部(1030)は、前記2つのリサンプリング済み系列を異なるサンプリングレートを有する2つの出力系列へと変換するよう構成され、
前記コア符号器は、第1及び第2の前記出力系列を前処理する第1前処理部(1430c)及び第2前処理部(1430d)を有し、かつ
前記コア符号器(1040)は、前処理済みの前記第1又は第2の系列をコア符号化(1430a,1430b)するよう構成されている、
請求項1〜8のいずれか1項に記載の符号化装置。
[請求項10]
前記スペクトル−時間変換部(1030)は、前記少なくとも1つの結果系列を時間ドメイン表現へと、スペクトルドメイン・リサンプリングを行わずに変換するよう構成され、かつ
前記コア符号器(1040)は、リサンプリングされていない出力系列をコア符号化(1430a)して、前記符号化済み多チャネル信号を取得するよう構成されるか、
又は、
前記スペクトル−時間変換部(1030)は、前記少なくとも1つの結果系列を時間ドメイン表現へと、スペクトルドメイン・リサンプリングを行わずかつ前記サイド信号なしで変換するよう構成され、かつ
前記コア符号器(1040)は、前記サイド信号のために、リサンプリングされていない出力系列をコア符号化(1430a)して、前記符号化済み多チャネル信号を取得するよう構成されるか、もしくは、
前記装置は、特異なスペクトルドメイン・サイド信号符号器(1430e)をさらに備える、
請求項1〜9のいずれか1項に記載の符号化装置。
[請求項11]
前記入力サンプリングレートは、8kHz、16kHz、32kHzを含む1グループのサンプリングレートの中の少なくとも1つのサンプリングレートであるか、又は
前記出力サンプリングレートは、8kHz、12.8kHz、16kHz、25.6kHz及び32kHzを含む1グループのサンプリングレートの中の少なくとも1つのサンプリングレートである、
請求項1〜10のいずれか1項に記載の符号化装置。
[請求項12]
前記スペクトル−時間変換部は分析窓を適用するよう構成され、
前記スペクトル−時間変換部(1030)は合成窓を適用するよう構成され、
前記分析窓の時間長は、前記合成窓の時間長と同じ、整数倍、又は整数分の1であるか、又は
前記分析窓及び前記合成窓は、それぞれ初期部分又は終了部分においてゼロパディング部分を有するか、又は
前記時間−スペクトル変換部(1000)によって使用された分析窓又は前記スペクトル−時間変換部(1030)によって使用された合成窓は、それぞれ増加するオーバーラップ部分及び減少するオーバーラップ部分を有し、前記コア符号器(1040)は、先読み(1905)を有する時間ドメイン符号器を含むか、又は1つのコア窓のオーバーラップ部分を有する周波数ドメイン符号器を含み、前記分析窓又は前記合成窓の前記オーバーラップ部分は、前記コア符号器の前記先読み(1905)の部分又は前記コア窓の前記オーバーラップ部分以下であるか、又は
前記分析窓及び前記合成窓は、窓のサイズ、オーバーラップ領域のサイズ及びゼロパディングのサイズが、12.8kHz、16kHz、26.6kHz、32kHz及び48kHzを含む1グループのサンプリングレートの中の少なくとも2つのサンプリングレートについて、それぞれ整数個のサンプルを含むか、又は
split radix構成におけるデジタルフーリエ変換の最大基数が7以下であるか、もしくは時間分解能が前記コア符号器の1フレームレート以下の値に固定されている、
請求項1〜11のいずれか1項に記載の符号化装置。
[請求項13]
前記コア符号器(1040)は、フレーム系列を提供するために第1フレーム制御に従って作動するよう構成され、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とによって仕切られており、かつ
前記時間−スペクトル変換部(1000)又は前記スペクトル−時間変換部(1030)は、前記第1フレーム制御と同期した第2フレーム制御に従って作動するよう構成され、前記フレーム系列の各フレームの前記開始フレーム境界(1901)又は前記終了フレーム境界(1902)は、窓のオーバーラップ部分の開始時点又は終了時点と所定の関係にあり、前記窓は、サンプリング値のブロック系列の各ブロックに対して前記時間−スペクトル変換部(1000)によって使用され、又はサンプリング値のブロックの出力系列の各ブロックのために前記スペクトル−時間変換部(1030)によって使用される、
請求項1〜12のいずれか1項に記載の符号化装置。
[請求項14]
前記コア符号器(1040)は、前記出力サンプリングレートを関連して持つサンプリング値のブロックの出力系列から導出された1フレームをコア符号化する際に、先読み部分(1905)を使用するよう構成され、前記先読み部分(1905)は前記フレームに時間的に後続するよう配置され、
前記時間−スペクトル変換部(1000)は、前記先読み部分(1905)の時間長以下である、時間長を有するオーバーラップ部分を持つ分析窓(1904)を使用するよう構成され、前記分析窓のオーバーラップ部分は窓掛け済み先読み部分(1905)を生成するために使用される、
請求項1〜13のいずれか1項に記載の符号化装置。
[請求項15]
前記スペクトル−時間変換部(1030)は、リドレス関数(1922)を使用して前記窓掛け済み先読み部分に対応する出力先読み部分を処理するよう構成され、前記リドレス関数は前記分析窓の前記オーバーラップ部分の影響が低減又は除去されるよう構成されている、
請求項14に記載の符号化装置。
[請求項16]
前記リドレス関数は、前記分析窓のオーバーラップ部分を定義する関数に対して逆である、
請求項15に記載の符号化装置。
[請求項17]
前記オーバーラップ部分はサイン関数の平方根と比例しており、
前記リドレス関数は前記サイン関数の平方根の逆数と比例しており、かつ
前記スペクトル−時間変換部(1030)は、(sin)1.5関数と比例したオーバーラップ部分を使用するよう構成されている、
請求項15又は16に記載の符号化装置。
[請求項18]
前記スペクトル−時間変換部(1030)は、合成窓を使用して第1出力ブロックを生成し、前記合成窓を使用して第2出力ブロックを生成するよう構成され、前記第2出力ブロックの第2部分は出力先読み部分(1905)であり、
前記スペクトル−時間変換部(1030)は、前記第1出力ブロックと前記出力先読み部分(1905)を除外した前記第2出力ブロックの部分との間のオーバーラップ加算操作を使用して、1フレームのサンプリング値を生成するよう構成され、
前記コア符号器(1040)は、前記フレームをコア符号化するための符号化情報を決定するために、前記出力先読み部分(1905)に対して先読み操作を適用するよう構成され、かつ
前記コア符号器(1040)は、前記先読み操作の結果を使用して前記フレームをコア符号化するよう構成されている、
請求項1〜17のいずれか1項に記載の符号化装置。
[請求項19]
前記スペクトル−時間変換部(1030)は、前記合成窓を使用して、前記第2出力ブロックに後続する第3出力ブロックを生成するよう構成され、前記スペクトル−時間変換部は、前記第3出力ブロックの第1オーバーラップ部分を、前記合成窓を使用して窓掛けされた前記第2出力ブロックの前記第2部分とオーバーラップさせ、時間的に前記フレームに続く追加フレームのサンプルを取得するよう構成されている、
請求項18に記載の符号化装置。
[請求項20]
前記スペクトル−時間変換部(1030)は、前記フレームの前記第2出力ブロックを生成する際に、前記時間−スペクトル変換部(1000)によって使用された分析窓の影響を少なくとも部分的に打ち消すために、前記出力先読み部分を窓掛けせず、又は前記出力先読み部分をリドレス(1922)するよう構成され、かつ
前記スペクトル−時間変換部(1030)は、前記追加フレームについての前記第2出力ブロックと前記第3出力ブロックとの間のオーバーラップ加算操作(1924)を実行し、前記合成窓を用いて前記出力先読み部分を窓掛け(1920)するよう構成されている、
請求項18及び19に記載の符号化装置。
[請求項21]
前記スペクトル−時間変換部(1030)は、
出力サンプルの第1ブロック及び出力サンプルの第2ブロックを生成するために合成窓を使用し、
出力サンプルの一部分を生成するために前記第1ブロックの第2部分と前記第2ブロックの第1部分とをオーバーラップ加算するよう構成され、
前記コア符号器(1040)は、前記出力サンプルの一部分より時間的に前に位置する前記出力サンプルをコア符号化するために、先読み操作を前記出力サンプルの一部分に対して適用するよう構成され、先読み部分は前記第2ブロックのサンプルの第2部分を含まない、
請求項13〜20のいずれか1項に記載の符号化装置。
[請求項22]
前記スペクトル−時間変換部(1030)は、コア符号器フレームの長さの2倍より高い時間分解能を提供する合成窓を使用するよう構成され、
前記スペクトル−時間変換部(1030)は、出力サンプルのブロックを生成するために前記合成窓を使用し、かつオーバーラップ加算操作を実行するよう構成され、前記コア符号器の先読み部分における全てのサンプルが前記オーバーラップ加算操作を使用して計算され、又は
前記スペクトル−時間変換部(1030)は、前記部分より時間的に前に位置する出力サンプルをコア符号化するために、前記出力サンプルに対して先読み操作を適用するよう構成され、前記先読み部分は前記第2ブロックのサンプルの第2部分を含まない、
請求項13に記載の符号化装置。
[請求項23]
前記多チャネル処理部(1010)は、広帯域時間アライメントパラメータ(12)を使用して時間アライメントを取得し、複数の狭帯域位相アライメントパラメータ(14)を使用して狭帯域位相アライメントを取得するように前記ブロック系列を処理し、かつアライメントされた系列を使用して結果系列としての中央信号とサイド信号とを計算するよう構成された、
請求項1〜22のいずれか1項に記載の符号化装置。
[請求項24]
少なくとも2つのチャネルを含む多チャネル信号を符号化する方法であって、
前記少なくとも2つのチャネルのサンプル値のブロック系列を前記少なくとも2つのチャネルについてのスペクトル値のブロック系列を有する周波数ドメイン表現へ変換するステップ(1000)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の前記ブロック系列のスペクトル値の各ブロックは前記入力サンプリングレートに関係する最大入力周波数(1211)までのスペクトル値を有する、ステップ(1000)と、
スペクトル値の前記ブロック系列又はスペクトル値のブロックのリサンプリング済み系列にジョイント多チャネル処理を適用して、前記少なくとも2つのチャネルに関係する情報を含むスペクトル値のブロックの少なくとも1つの結果系列を取得するステップ(1010)と、
周波数ドメインで前記結果系列のブロックをスペクトルドメイン・リサンプリングするか、又は周波数ドメインで前記少なくとも2つのチャネルについてスペクトル値の前記ブロック系列をリサンプリングして、スペクトル値のブロックのリサンプリング済み系列を取得するステップ(1020)であって、スペクトル値のブロックのリサンプリング済み系列の各ブロックは前記最大入力周波数(1211)とは異なる最大出力周波数(1231,1221)までのスペクトル値を有する、ステップ(1020)と、
スペクトル値のブロックの前記リサンプリング済み系列を時間ドメイン表現へ変換するか、又はスペクトル値のブロックの前記結果系列を時間ドメイン表現へ変換するステップ(1640)であって、前記時間ドメイン表現は前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの出力系列を含む、ステップ(1640)と、
サンプリング値のブロックの前記出力系列をコア符号化して、符号化済み多チャネル信号(1510)を得るステップ(1040)と、
を備える符号化方法。
[請求項25]
符号化済み多チャネル信号を復号化する装置であって、
コア復号化済み信号を生成するコア復号器(1600)と、
前記コア復号化済み信号のサンプリング値のブロック系列を前記コア復号化済み信号のスペクトル値のブロック系列を有する周波数ドメイン表現へと変換する時間−スペクトル変換部(1610)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の各ブロックは前記入力サンプリングレートに関係する最大入力周波数までのスペクトル値を有する、時間−スペクトル変換部(1610)と、
前記コア復号化済み信号のスペクトル値のブロック系列(1621)、又は周波数ドメインで逆多チャネル処理によって取得された少なくとも2つの結果系列(1635)のスペクトル値のブロックをリサンプリングして、スペクトル値のブロックのリサンプリング済み系列(1631)又は少なくとも2つのリサンプリング済み系列(1625)を取得する、スペクトルドメイン・リサンプラ(1620)であって、リサンプリング済み系列の各ブロックは前記最大入力周波数とは異なる最大出力周波数までのスペクトル値を有する、スペクトルドメイン・リサンプラ(1620)と、
前記ブロック系列を含む系列(1615)又はブロックの前記リサンプリング済み系列(1621)に逆多チャネル処理を適用して、スペクトル値のブロックの少なくとも2つの結果系列(1631,1632,1635)を取得する多チャネル処理部(1630)と、
スペクトル値のブロックの前記少なくとも2つの結果系列(1631,1632)、又はスペクトル値のブロックの前記少なくとも2つのリサンプリング済み系列(1625)を時間ドメイン表現へ変換する、スペクトル−時間変換部(1640)であって、前記時間ドメイン表現は前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの少なくとも2つの出力系列を含む、スペクトル−時間変換部(1640)と、
を備える復号化装置。
[請求項26]
前記スペクトルドメイン・リサンプラ(1020)は、ダウンサンプリングのために前記ブロックを切り詰めるか、又はアップサンプリングのために前記ブロックをゼロパディングするよう構成されている、請求項25に記載の復号化装置。
[請求項27]
前記スペクトルドメイン・リサンプラ(1020)は、最大入力周波数に応じて及び最大出力周波数に応じて、スケーリングファクタを使用してブロックの前記結果系列のブロックのスペクトル値をスケーリング(1322)するよう構成されている、請求項25又は26に記載の復号化装置。
[請求項28]
前記スケーリングファクタはアップサンプリングの場合には1よりも大きく、前記出力サンプリングレートは前記入力サンプリングレートよりも大きいか、又は前記スケーリングファクタはダウンサンプリングの場合には1よりも低く、前記出力サンプリングレートは前記入力サンプリングレートよりも低く、
前記時間-スペクトル変換部(1000)は、スペクトル値のブロックのスペクトル値の全体数に関する正規化を使用せずに、時間−周波数変換アルゴリズム(1311)を実行するよう構成され、前記スケーリングファクタは、リサンプリング済み系列の1ブロックのスペクトル値の数と、リサンプリング前のスペクトル値の1ブロックのスペクトル値の数との商に等しく、前記スペクトル−時間変換部は前記最大出力周波数に基づいて正規化を適用する(1331)よう構成されている、
請求項25〜27のいずれか1項に記載の復号化装置。
[請求項29]
前記時間-スペクトル変換部(1000)は離散フーリエ変換アルゴリズムを実行するよう構成されているか、又は前記スペクトル−時間変換部(1030)は逆離散フーリエ変換アルゴリズムを実行するよう構成されている、請求項25〜28のいずれか1項に記載の復号化装置。
[請求項30]
前記コア復号器(1600)は、前記入力サンプリングレートとは異なる追加のサンプリングレートを有する追加のコア復号化済み信号(1601)を生成するよう構成され、
前記時間−スペクトル変換部(1610)は、前記追加のコア復号化済み信号を前記追加のコア復号化済み信号についての値のブロックの追加系列(1611)を有する周波数ドメイン表現へと変換するよう構成され、前記追加のコア復号化済み信号のサンプリング値の各ブロックは、前記最大入力周波数とは異なりかつ前記追加のサンプリングレートと関連する追加の最大入力周波数までのスペクトル値を有し、
前記スペクトルドメイン・リサンプラ(1620)は、周波数ドメインで前記追加のコア復号化済み信号についてのブロックの追加系列をリサンプリングして、スペクトル値のブロックの追加のリサンプリング済み系列(1621)を取得するよう構成され、前記追加のリサンプリング済み系列のスペクトル値の各ブロックは、前記追加の最大入力周波数とは異なる最大出力周波数までのスペクトル値を有し、
前記リサンプリング済み系列と前記追加のリサンプリング済み系列とを結合して、前記多チャネル処理部(1630)によって処理されるべき系列(1701)を取得する、結合部(1700)を有する、
請求項25〜29のいずれか1項に記載の復号化装置。
[請求項31]
前記コア復号器(1600)は、前記出力サンプリングレートに等しい追加のサンプリングレートを有するさらに追加のコア復号化済み信号(1603)を生成するよう構成され、
前記時間−スペクトル変換部(1610)は、前記さらなる追加系列を周波数ドメイン表現(1613)へ変換するよう構成され、
前記装置は、前記多チャネル処理部(1630)によって処理されるべきブロック系列を生成する処理の過程で、スペクトル値のブロックの前記さらなる追加系列とブロックのリサンプリング済み系列(1622,1621)とを結合する、結合部(1700)をさらに含む、
請求項25〜30のいずれか1項に記載の復号化装置。
[請求項32]
前記コア復号器(1600)は、MDCTベースの復号化部(1600d)、時間ドメイン帯域幅拡張復号化部(1600c)、ACELP復号化部(1600b)、及びバス・ポストフィルタ復号化部(1600a)のうちの少なくとも1つを含み、
前記MDCTベースの復号化部(1600d)又は前記時間ドメイン帯域幅拡張復号化部(1600c)は、前記出力サンプリングレートを有する前記コア復号化済み信号を生成するよう構成されるか、又は
前記ACELP復号化部(1600b)又は前記バス・ポストフィルタ復号化部(1600a)は、前記出力サンプリングレートとは異なるサンプリングレートでコア復号化済み信号を生成するよう構成される、
請求項25〜31のいずれか1項に記載の復号化装置。
[請求項33]
前記時間−スペクトル変換部(1610)は、複数の異なるコア復号化済み信号の少なくとも2つに対して分析窓を適用するように構成され、前記分析窓は時間的に同一サイズ又は時間に関して同一形状を有し、
前記装置は、少なくとも1つのリサンプリング済み系列と前記最大出力周波数までのスペクトル値のブロックを持つ任意の他の系列とをブロック毎に結合して、前記多チャネル処理部(1630)によって処理されるべき系列を取得する、結合部(1700)をさらに含む、
請求項25〜32のいずれか1項に記載の復号化装置。
[請求項34]
前記多チャネル処理部(1630)によって処理されるべき系列は中央信号に対応し、かつ
前記多チャネル処理部(1630)は、前記符号化済み多チャネル信号に含まれたサイド信号に関する情報を使用して、サイド信号を追加的に生成するよう構成され、かつ
前記多チャネル処理部(1630)は、前記中央信号と前記サイド信号とを使用して、前記少なくとも2つの結果系列を生成するよう構成されている、
請求項25〜33のいずれか1項に記載の復号化装置。
[請求項35]
前記多チャネル処理部(1630)は、パラメータ帯域毎に1つのゲインファクタを使用して、前記系列を第1出力チャネルのための第1系列と第2出力チャネルのための第2系列とに変換(820)し、
各パラメータ帯域についてステレオ充填パラメータを使用しながら、復号化済みサイド信号を用いて前記第1系列と前記第2系列とを更新(830)するか、又は、中央信号についてのブロック系列の前のブロックから予測されたサイド信号を使用して前記第1系列と前記第2系列とを更新し、
前記複数の狭帯域位相アライメントパラメータに関する情報を使用して、位相デ・アライメントとエネルギースケーリングとを実行(910)し、かつ
広帯域時間アライメントパラメータに関する情報を使用して時間デ・アライメントを実行(920)し、前記少なくとも2つの結果系列を取得するよう構成される、
請求項25〜34のいずれか1項に記載の復号化装置。
[請求項36]
前記コア復号器(1600)は、フレーム系列を提供するために第1フレーム制御に従って作動するよう構成され、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とによって仕切られており、
前記時間−スペクトル変換部(1610)又は前記スペクトル−時間変換部(1640)は、前記第1第フレーム制御と同期した第2フレーム制御に従って作動するよう構成され、
前記時間−スペクトル変換部(1610)又は前記スペクトル−時間変換部(1640)は、前記第1第フレーム制御と同期した第2フレーム制御に従って作動するよう構成され、前記フレーム系列の各フレームの前記開始フレーム境界(1901)又は前記終了フレーム境界(1902)は、窓のオーバーラップ部分の開始時点又は終了時点と所定の関係にあり、前記窓は、サンプリング値のブロック系列の各ブロックに対して前記時間−スペクトル変換部(1610)によって使用され、又はサンプリング値のブロックの前記少なくとも2つの出力系列の各ブロックのために前記スペクトル−時間変換部(1640)によって使用される、
請求項25〜35のいずれか1項に記載の復号化装置。
[請求項37]
前記コア復号化済み信号はフレーム系列を有し、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とを有し、
前記フレーム系列のフレームを窓掛けするために前記時間−スペクトル変換部(1610)によって使用される分析窓(1914)は、オーバーラップ部分の終点と前記終了フレーム境界(1902)との間の時間ギャップ(1920)を残して前記終了フレーム境界(1902)の前で終了するオーバーラップ部分を有し、
前記コア復号器(1600)は、前記分析窓(1914)を使用した前記フレームの窓掛けと並行して、前記時間ギャップ(1920)内のサンプルに対してある処理を実行するよう構成されるか、又は前記分析窓(1914)を使用した前記フレームの窓掛けと並行して、前記時間ギャップ(1920)内のサンプルに対してコア復号器後処理が実行される、
請求項25〜36のいずれか1項に記載の復号化装置。
[請求項38]
前記コア復号化済み信号はフレーム系列を有し、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とを有し、
分析窓(1914)の第1オーバーラップ部分の始点は前記開始フレーム境界(1901)と一致し、前記分析窓(1914)の第2オーバーラップ部分の終点は前記終了フレーム境界(1902)の前に位置し、前記第2オーバーラップ部分の終点と前記終了フレーム境界との間には時間ギャップ(1920)が存在しており、
前記コア復号化済み信号の次のブロックのための前記分析窓は、前記分析窓の中央の非オーバーラップ部分が前記時間ギャップ(1920)内に位置するように、配置される、
請求項25〜37のいずれか1項に記載の復号化装置。
[請求項39]
前記時間−スペクトル変換部(1610)によって使用される前記分析窓は、前記スペクトル−時間変換部(1640)によって使用される前記合成窓と、時間的に同一形状及び同一長さを有する、
請求項25〜38のいずれか1項に記載の復号化装置。
[請求項40]
前記コア復号化済み信号はフレーム系列を有し、1フレームはある長さを有し、前記時間−スペクトル変換部(1610)によって適用される任意のゼロパディング部分を除く窓の長さは、前記フレームの長さの半分以下である、
請求項25〜39のいずれか1項に記載の復号化装置。
[請求項41]
前記スペクトル−時間変換部(1640)は、
前記少なくとも2つの出力系列の第1出力系列について窓掛け済みサンプルの第1出力ブロックを得るために、合成窓を適用し、
前記少なくとも2つの出力系列の前記第1出力系列について窓掛け済みサンプルの第2出力ブロックを得るために、前記合成窓を適用し、
前記第1出力ブロックと前記第2出力ブロックとをオーバーラップ加算して、前記第1出力系列のための出力サンプルの第1グループを取得するよう構成され、
前記スペクトル−時間変換部(1640)は、
前記少なくとも2つの出力系列の第2出力系列について窓掛け済みサンプルの第1出力ブロックを得るために、合成窓を適用し、
前記少なくとも2つの出力系列の前記第2出力系列について窓掛け済みサンプルの第2出力ブロックを得るために、前記合成窓を適用し、
前記第1出力ブロックと前記第2出力ブロックとをオーバーラップ加算して、前記第2出力系列のための出力サンプルの第2グループを取得するよう構成され、
前記第1系列のための出力サンプルの第1グループと前記第2系列のための出力サンプルの第2グループとは、前記復号化済み多チャネル信号の同じ時間部分に関係するか、又は前記コア復号化済み信号の同じフレームに関係している、
請求項25〜40のいずれか1項に記載の復号化装置。
[請求項42]
符号化済み多チャネル信号を復号化する方法であって、
コア復号化済み信号を生成するステップ(1600)と、
前記コア復号化済み信号のサンプリング値のブロック系列を前記コア復号化済み信号のスペクトル値のブロック系列を有する周波数ドメイン表現へと変換するステップ(1610)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の各ブロックは前記入力サンプリングレートに関係する最大入力周波数までのスペクトル値を有する、ステップと、
前記コア復号化済み信号についてのスペクトル値のブロック系列(1621)のスペクトル値のブロック、又は周波数ドメインで逆多チャネル処理によって取得された少なくとも2つの結果系列(1635)をリサンプリングして、スペクトル値のブロックのリサンプリング済み系列(1631)又は少なくとも2つのリサンプリング済み系列(1625)を取得するステップ(1620)であって、リサンプリング済み系列の各ブロックは、前記最大入力周波数とは異なる最大出力周波数までのスペクトル値を有する、ステップと、
前記ブロック系列を含む系列(1615)又はブロックの前記リサンプリング済み系列(1621)に逆多チャネル処理を適用して、スペクトル値のブロックの少なくとも2つの結果系列(1631,1632,1635)を取得する、ステップ(1630)と、
スペクトル値のブロックの前記少なくとも2つの結果系列(1631,1632)、又はスペクトル値のブロックの前記少なくとも2つのリサンプリング済み系列(1625)を時間ドメイン表現へ変換するステップ(1640)であって、前記時間ドメイン表現は、前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの少なくとも2つの出力系列を含む、ステップと、
を備える復号化方法。
[請求項43]
コンピュータ又はプロセッサ上で実行されるとき、請求項24に記載の方法又は請求項42に記載の方法を実行するためのコンピュータプログラム。
Claims (44)
- 少なくとも2つのチャネルを含む多チャネル信号を符号化する装置であって、
前記少なくとも2つのチャネルのサンプリング値のブロック系列を前記少なくとも2つのチャネルについてのスペクトル値のブロック系列を有する周波数ドメイン表現へ変換する時間−スペクトル変換部であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の前記ブロック系列のスペクトル値の各ブロックは、前記入力サンプリングレートに関係する最大入力周波数(1211)までのスペクトル値を有する、時間−スペクトル変換部(1000)と、
スペクトル値の前記ブロック系列又はスペクトル値のブロックのリサンプリング済み系列にジョイント多チャネル処理を適用して、前記少なくとも2つのチャネルに関係する情報を含むスペクトル値のブロックの少なくとも1つの結果系列を取得する多チャネル処理部(1010)と、
周波数ドメインで前記結果系列のブロックをリサンプリングするか、又は周波数ドメインで前記少なくとも2つのチャネルについてスペクトル値の前記ブロック系列をリサンプリングして、スペクトル値のブロックのリサンプリング済み系列を取得するスペクトルドメイン・リサンプラ(1020)であって、スペクトル値のブロックのリサンプリング済み系列の各ブロックは前記最大入力周波数(1211)とは異なる最大出力周波数(1231,1221)までのスペクトル値を有する、スペクトルドメイン・リサンプラ(1020)と、
スペクトル値のブロックの前記リサンプリング済み系列を時間ドメイン表現へ変換するか、又はスペクトル値のブロックの前記結果系列を時間ドメイン表現へ変換するスペクトル−時間変換部(1030)であって、前記時間ドメイン表現は、前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの出力系列を含む、スペクトル−時間変換部(1030)と、
サンプリング値のブロックの前記出力系列を符号化して、符号化済み多チャネル信号(1510)を得るコア符号器(1040)と、
を備える符号化装置。 - 前記スペクトルドメイン・リサンプラ(1020)は、ダウンサンプリングのために前記ブロックを切り詰めるか、又はアップサンプリングのために前記ブロックをゼロパディングするよう構成されている、請求項1に記載の符号化装置。
- 前記スペクトルドメイン・リサンプラ(1020)は、前記最大入力周波数に依存しかつ前記最大出力周波数に依存するスケーリングファクタを使用して、ブロックの前記結果系列のブロックの前記スペクトル値をスケーリング(1322)するよう構成されている、請求項1又は2に記載の符号化装置。
- 前記スケーリングファクタはアップサンプリングの場合に1より大きく、前記出力サンプリングレートは前記入力サンプリングレートより大きいか、又は前記スケーリングファクタはダウンサンプリングの場合に1より小さく、前記出力サンプリングレートは前記入力サンプリングレートより小さく、又は
前記時間−スペクトル変換部(1000)は、スペクトル値のブロックのスペクトル値の全体数に関連した正規化を使用せず(1311)に、時間−周波数変換アルゴリズムを実行するよう構成され、前記スケーリングファクタは、リサンプリング済み系列の1ブロックのスペクトル値の数と、リサンプリング前のスペクトル値の1ブロックのスペクトル値の数との商に等しく、前記スペクトル−時間変換部は前記最大出力周波数に基づいて正規化を適用する(1331)よう構成されている、
請求項3に記載の符号化装置。 - 前記時間−スペクトル変換部(1000)は離散フーリエ変換アルゴリズムを実行するよう構成されるか、又は前記スペクトル−時間変換部(1030)は逆離散フーリエ変換アルゴリズムを実行するよう構成される、請求項1〜4のいずれか1項に記載の符号化装置。
- 前記多チャネル処理部(1010)は、スペクトル値のブロックの追加の結果系列を得るよう構成され、
前記スペクトル−時間変換部(1030)は、スペクトル値の前記追加の結果系列を追加の時間ドメイン表現(1032)へと変換するよう構成され、前記追加の時間ドメイン表現は、前記入力サンプリングレートに等しい出力サンプリングレートを関連して持つサンプリング値のブロックの追加の出力系列を含む、
請求項1に記載の符号化装置。 - 前記多チャネル処理部(1010)は、スペクトル値のブロックのさらに追加の結果系列を提供するよう構成され、
前記スペクトルドメイン・リサンプラ(1020)は、周波数ドメインで前記さらに追加の結果系列のブロックをリサンプリングして、スペクトル値のブロックの追加のリサンプリング済み系列を取得するよう構成され、前記追加のリサンプリング済み系列の各ブロックは、前記最大出力周波数と異なるか又は前記最大入力周波数と異なる、追加の最大出力周波数までのスペクトル値を有し、
前記スペクトル−時間変換部(1030)は、スペクトル値のブロックの前記追加のリサンプリング済み系列を、さらに追加の時間ドメイン表現へと変換するよう構成され、前記さらに追加の時間ドメイン表現は、前記出力サンプリングレート又は前記入力サンプリングレートとは異なる追加の出力サンプリングレートを関連して持つサンプリング値のブロックのさらに追加の出力系列を有する、
請求項1〜6のいずれか1項に記載の符号化装置。 - 前記多チャネル処理部(1010)は、ダウンミクス操作だけを使用してスペクトル値のブロックの前記少なくとも1つの結果系列として中央信号を生成するか、又はスペクトル値のブロックの追加の結果系列として追加的サイド信号を生成するよう構成されている、請求項1〜7のいずれか1項に記載の符号化装置。
- 前記多チャネル処理部(1010)は、前記少なくとも1つの結果系列として中央信号を生成するよう構成され、前記スペクトルドメイン・リサンプラ(1020)は前記中央信号を前記最大入力周波数とは異なる2つの異なる最大出力周波数を有する別個の2つの系列へとリサンプリングするよう構成され、
前記スペクトル−時間変換部(1030)は、リサンプリング済みの前記2つの系列を異なるサンプリングレートを有する2つの出力系列へと変換するよう構成され、
前記コア符号器(1040)は、第1の出力系列を第1サンプリングレートで前処理する第1前処理部(1430c)、又は第2の出力系列を第2サンプリングレートで前処理する第2前処理部(1430d)を有し、かつ
前記コア符号器は、前処理済みの前記第1又は第2の出力系列をコア符号化するよう構成されるか、
又は、
前記多チャネル処理部は、前記少なくとも1つの結果系列としてサイド信号を生成するよう構成され、前記スペクトルドメイン・リサンプラ(1020)は、前記サイド信号を前記最大入力周波数とは異なる2つの異なる最大出力周波数を有する2つのリサンプリング済み系列へとリサンプリングするよう構成され、
前記スペクトル−時間変換部(1030)は、前記2つのリサンプリング済み系列を異なるサンプリングレートを有する2つの出力系列へと変換するよう構成され、
前記コア符号器は、第1及び第2の前記出力系列を前処理する第1前処理部(1430c)及び第2前処理部(1430d)を有し、かつ
前記コア符号器(1040)は、前処理済みの前記第1又は第2の出力系列をコア符号化(1430a,1430b)するよう構成されている、
請求項1〜8のいずれか1項に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、前記少なくとも1つの結果系列を時間ドメイン表現へと、スペクトルドメイン・リサンプリングを行わずに変換するよう構成され、かつ
前記コア符号器(1040)は、リサンプリングされていない出力系列をコア符号化(1430a)して、前記符号化済み多チャネル信号を取得するよう構成されるか、
又は、
前記スペクトル−時間変換部(1030)は、前記少なくとも1つの結果系列を時間ドメイン表現へと、スペクトルドメイン・リサンプリングを行わずかつサイド信号なしで変換するよう構成され、かつ
前記コア符号器(1040)は、サイド信号のために、リサンプリングされていない出力系列をコア符号化(1430a)して、前記符号化済み多チャネル信号を取得するよう構成されるか、もしくは、
前記装置は、特異なスペクトルドメイン・サイド信号符号器(1430e)をさらに備える、
請求項1〜9のいずれか1項に記載の符号化装置。 - 前記入力サンプリングレートは、8kHz、16kHz、32kHzを含む1グループのサンプリングレートの中の少なくとも1つのサンプリングレートであるか、又は
前記出力サンプリングレートは、8kHz、12.8kHz、16kHz、25.6kHz及び32kHzを含む1グループのサンプリングレートの中の少なくとも1つのサンプリングレートである、
請求項1〜10のいずれか1項に記載の符号化装置。 - 前記時間−スペクトル変換部(1000)は分析窓を適用するよう構成され、
前記スペクトル−時間変換部(1030)は合成窓を適用するよう構成され、
前記分析窓の時間長は、前記合成窓の時間長と同じ、整数倍、又は整数分の1であるか、又は
前記分析窓及び前記合成窓は、それぞれ初期部分又は終了部分においてゼロパディング部分を有するか、又は
前記時間−スペクトル変換部(1000)によって使用された分析窓又は前記スペクトル−時間変換部(1030)によって使用された合成窓は、それぞれ増加するオーバーラップ部分及び減少するオーバーラップ部分を有し、前記コア符号器(1040)は、先読み(1905)を有する時間ドメイン符号器を含むか、又は1つのコア窓のオーバーラップ部分を有する周波数ドメイン符号器を含み、前記分析窓又は前記合成窓の前記オーバーラップ部分は、前記コア符号器の前記先読み(1905)の部分又は前記コア窓の前記オーバーラップ部分以下であるか、又は
前記分析窓及び前記合成窓は、窓のサイズ、オーバーラップ領域のサイズ及びゼロパディングのサイズが、12.8kHz、16kHz、25.6kHz、32kHz及び48kHzを含む1グループのサンプリングレートの中の少なくとも2つのサンプリングレートについて、それぞれ整数個のサンプルを含むか、又は
split radix構成におけるデジタルフーリエ変換の最大基数が7以下であるか、もしくは時間分解能が前記コア符号器の1フレームレート以下の値に固定されている、
請求項1〜11のいずれか1項に記載の符号化装置。 - 前記コア符号器(1040)は、フレーム系列を提供するために第1フレーム制御に従って作動するよう構成され、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とによって仕切られており、かつ
前記時間−スペクトル変換部(1000)又は前記スペクトル−時間変換部(1030)は、前記第1フレーム制御と同期した第2フレーム制御に従って作動するよう構成され、前記フレーム系列の各フレームの前記開始フレーム境界(1901)又は前記終了フレーム境界(1902)は、窓のオーバーラップ部分の開始時点又は終了時点と所定の関係にあり、前記窓は、サンプリング値のブロック系列の各ブロックに対して前記時間−スペクトル変換部(1000)によって使用され、又はサンプリング値のブロックの出力系列の各ブロックのために前記スペクトル−時間変換部(1030)によって使用される、
請求項1〜12のいずれか1項に記載の符号化装置。 - 前記コア符号器(1040)は、前記出力サンプリングレートを関連して持つサンプリング値のブロックの出力系列から導出された1フレームをコア符号化する際に、先読み部分(1905)を使用するよう構成され、前記先読み部分(1905)は前記フレームに時間的に後続するよう配置され、
前記時間−スペクトル変換部(1000)は、前記先読み部分(1905)の時間長以下である、時間長を有するオーバーラップ部分を持つ分析窓(1904)を使用するよう構成され、前記分析窓のオーバーラップ部分は窓掛け済み先読み部分(1905)を生成するために使用される、
請求項1〜13のいずれか1項に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、リドレス関数(1922)を使用して前記窓掛け済み先読み部分に対応する出力先読み部分を処理するよう構成され、前記リドレス関数は前記分析窓の前記オーバーラップ部分の影響が低減又は除去されるよう構成されている、
請求項14に記載の符号化装置。 - 前記リドレス関数は、前記分析窓のオーバーラップ部分を定義する関数に対して逆である、
請求項15に記載の符号化装置。 - 前記オーバーラップ部分はサイン関数の平方根と比例しており、
前記リドレス関数は前記サイン関数の平方根の逆数と比例しており、かつ
前記スペクトル−時間変換部(1030)は、(sin)1.5関数と比例したオーバーラップ部分を使用するよう構成されている、
請求項15又は16に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、合成窓を使用して第1出力ブロックを生成し、前記合成窓を使用して第2出力ブロックを生成するよう構成され、前記第2出力ブロックの第2部分は出力先読み部分(1905)であり、
前記スペクトル−時間変換部(1030)は、前記第1出力ブロックと前記出力先読み部分(1905)を除外した前記第2出力ブロックの部分との間のオーバーラップ加算操作を使用して、1フレームのサンプリング値を生成するよう構成され、
前記コア符号器(1040)は、前記フレームをコア符号化するための符号化情報を決定するために、前記出力先読み部分(1905)に対して先読み操作を適用するよう構成され、かつ
前記コア符号器(1040)は、前記先読み操作の結果を使用して前記フレームをコア符号化するよう構成されている、
請求項1〜17のいずれか1項に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、前記合成窓を使用して、前記第2出力ブロックに後続する第3出力ブロックを生成するよう構成され、前記スペクトル−時間変換部は、前記第3出力ブロックの第1オーバーラップ部分を、前記合成窓を使用して窓掛けされた前記第2出力ブロックの前記第2部分とオーバーラップさせ、時間的に前記フレームに続く追加フレームのサンプルを取得するよう構成されている、
請求項18に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、前記フレームの前記第2出力ブロックを生成する際に、前記時間−スペクトル変換部(1000)によって使用された分析窓の影響を少なくとも部分的に打ち消すために、前記出力先読み部分を窓掛けせず、又は前記出力先読み部分をリドレス(1922)するよう構成され、かつ
前記スペクトル−時間変換部(1030)は、前記追加フレームについての前記第2出力ブロックと前記第3出力ブロックとの間のオーバーラップ加算操作(1924)を実行し、前記合成窓を用いて前記出力先読み部分を窓掛け(1920)するよう構成されている、
請求項19に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、
出力サンプルの第1ブロック及び出力サンプルの第2ブロックを生成するために合成窓を使用し、
出力サンプルの一部分を生成するために前記第1ブロックの第2部分と前記第2ブロックの第1部分とをオーバーラップ加算するよう構成され、
前記コア符号器(1040)は、前記出力サンプルの一部分より時間的に前に位置する前記出力サンプルをコア符号化するために、先読み操作を前記出力サンプルの一部分に対して適用するよう構成され、先読み部分は前記第2ブロックのサンプルの第2部分を含まない、
請求項13〜20のいずれか1項に記載の符号化装置。 - 前記スペクトル−時間変換部(1030)は、コア符号器フレームの長さの2倍より高い時間分解能を提供する合成窓を使用するよう構成され、
前記スペクトル−時間変換部(1030)は、出力サンプルのブロックを生成するために前記合成窓を使用し、かつオーバーラップ加算操作を実行するよう構成され、前記コア符号器の先読み部分における全てのサンプルが前記オーバーラップ加算操作を使用して計算され、又は
前記スペクトル−時間変換部(1030)は、前記出力サンプルの一部分より時間的に前に位置する出力サンプルをコア符号化するために、前記出力サンプルの一部分に対して先読み操作を適用するよう構成され、前記先読み部分は前記第2ブロックのサンプルの第2部分を含まない、
請求項21に記載の符号化装置。 - 前記多チャネル処理部(1010)は、広帯域時間アライメントパラメータ(12)を使用して時間アライメントを取得し、複数の狭帯域位相アライメントパラメータ(14)を使用して狭帯域位相アライメントを取得するように前記ブロック系列を処理し、かつアライメントされた系列を使用して結果系列としての中央信号とサイド信号とを計算するよう構成された、
請求項1〜22のいずれか1項に記載の符号化装置。 - 少なくとも2つのチャネルを含む多チャネル信号を符号化する方法であって、
前記少なくとも2つのチャネルのサンプリング値のブロック系列を前記少なくとも2つのチャネルについてのスペクトル値のブロック系列を有する周波数ドメイン表現へ変換するステップ(1000)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の前記ブロック系列のスペクトル値の各ブロックは前記入力サンプリングレートに関係する最大入力周波数(1211)までのスペクトル値を有する、ステップ(1000)と、
スペクトル値の前記ブロック系列又はスペクトル値のブロックのリサンプリング済み系列にジョイント多チャネル処理を適用して、前記少なくとも2つのチャネルに関係する情報を含むスペクトル値のブロックの少なくとも1つの結果系列を取得するステップ(1010)と、
周波数ドメインで前記結果系列のブロックをスペクトルドメイン・リサンプリングするか、又は周波数ドメインで前記少なくとも2つのチャネルについてスペクトル値の前記ブロック系列をリサンプリングして、スペクトル値のブロックのリサンプリング済み系列を取得するステップ(1020)であって、スペクトル値のブロックのリサンプリング済み系列の各ブロックは前記最大入力周波数(1211)とは異なる最大出力周波数(1231,1221)までのスペクトル値を有する、ステップ(1020)と、
スペクトル値のブロックの前記リサンプリング済み系列を時間ドメイン表現へ変換するか、又はスペクトル値のブロックの前記結果系列を時間ドメイン表現へ変換するステップ(1030)であって、前記時間ドメイン表現は前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの出力系列を含む、ステップ(1030)と、
サンプリング値のブロックの前記出力系列をコア符号化して、符号化済み多チャネル信号(1510)を得るステップ(1040)と、
を備える符号化方法。 - 符号化済み多チャネル信号を復号化する装置であって、
コア復号化済み信号を生成するコア復号器(1600)と、
前記コア復号化済み信号のサンプリング値のブロック系列を前記コア復号化済み信号のスペクトル値のブロック系列を有する周波数ドメイン表現へと変換する時間−スペクトル変換部(1610)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の各ブロックは前記入力サンプリングレートに関係する最大入力周波数までのスペクトル値を有する、時間−スペクトル変換部(1610)と、
前記コア復号化済み信号のスペクトル値のブロック系列(1611,1612)、又は周波数ドメインで逆多チャネル処理によって取得された少なくとも2つの結果系列(1635)のスペクトル値のブロックをリサンプリングして、スペクトル値のブロックのリサンプリング済み系列(1621,1622)又は少なくとも2つのリサンプリング済み系列(1625)を取得する、スペクトルドメイン・リサンプラ(1620)であって、リサンプリング済み系列の各ブロックは前記最大入力周波数とは異なる最大出力周波数までのスペクトル値を有する、スペクトルドメイン・リサンプラ(1620)と、
前記コア復号化済み信号のスペクトル値のブロック系列を含む系列(1615)又はスペクトル値のブロックの前記リサンプリング済み系列(1621,1622)に逆多チャネル処理を適用して、スペクトル値のブロックの少なくとも2つの結果系列(1631,1632,1635)を取得する多チャネル処理部(1630)と、
スペクトル値のブロックの前記少なくとも2つの結果系列(1631,1632)、又はスペクトル値のブロックの前記少なくとも2つのリサンプリング済み系列(1625)を時間ドメイン表現へ変換する、スペクトル−時間変換部(1640)であって、前記時間ドメイン表現は前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの少なくとも2つの出力系列を含む、スペクトル−時間変換部(1640)と、
を備える復号化装置。 - 前記スペクトルドメイン・リサンプラ(1620)は、ダウンサンプリングのために前記ブロックを切り詰めるか、又はアップサンプリングのために前記ブロックをゼロパディングするよう構成されている、請求項25に記載の復号化装置。
- 前記スペクトルドメイン・リサンプラ(1620)は、最大入力周波数に応じて及び最大出力周波数に応じて、スケーリングファクタを使用してブロックの前記結果系列のブロックのスペクトル値をスケーリング(1322)するよう構成されている、請求項25又は26に記載の復号化装置。
- 前記スケーリングファクタはアップサンプリングの場合には1よりも大きく、前記出力サンプリングレートは前記入力サンプリングレートよりも大きいか、又は前記スケーリングファクタはダウンサンプリングの場合には1よりも低く、前記出力サンプリングレートは前記入力サンプリングレートよりも低く、
前記時間-スペクトル変換部(1610)は、スペクトル値のブロックのスペクトル値の全体数に関する正規化を使用せずに、時間−周波数変換アルゴリズム(1311)を実行するよう構成され、前記スケーリングファクタは、リサンプリング済み系列の1ブロックのスペクトル値の数と、リサンプリング前のスペクトル値の1ブロックのスペクトル値の数との商に等しく、前記スペクトル−時間変換部は前記最大出力周波数に基づいて正規化を適用する(1331)よう構成されている、
請求項27に記載の復号化装置。 - 前記時間-スペクトル変換部(1610)は離散フーリエ変換アルゴリズムを実行するよう構成されているか、又は前記スペクトル−時間変換部(1640)は逆離散フーリエ変換アルゴリズムを実行するよう構成されている、請求項25〜28のいずれか1項に記載の復号化装置。
- 前記コア復号器(1600)は、前記入力サンプリングレートとは異なる追加のサンプリングレートを有する追加のコア復号化済み信号(1601)を生成するよう構成され、
前記時間−スペクトル変換部(1610)は、前記追加のコア復号化済み信号を前記追加のコア復号化済み信号についてのスペクトル値のブロックの追加系列(1611)を有する周波数ドメイン表現へと変換するよう構成され、前記追加のコア復号化済み信号のスペクトル値の各ブロックは、前記最大入力周波数とは異なりかつ前記追加のサンプリングレートと関連する追加の最大入力周波数までのスペクトル値を有し、
前記スペクトルドメイン・リサンプラ(1620)は、周波数ドメインで前記追加のコア復号化済み信号についてのブロックの追加系列(1611)をリサンプリングして、スペクトル値のブロックの追加のリサンプリング済み系列(1621)を取得するよう構成され、前記追加のリサンプリング済み系列のスペクトル値の各ブロックは、前記追加の最大入力周波数とは異なる最大出力周波数までのスペクトル値を有し、
前記装置は、前記リサンプリング済み系列(1622)と前記追加のリサンプリング済み系列(1621)とを結合して、前記多チャネル処理部(1630)によって処理されるべき系列(1701)を取得する、結合部(1700)をさらに有する、
請求項25〜29のいずれか1項に記載の復号化装置。 - 前記コア復号器(1600)は、前記出力サンプリングレートに等しい追加のサンプリングレートを有するさらに追加のコア復号化済み信号(1603)を生成するよう構成され、
前記時間−スペクトル変換部(1610)は、前記さらに追加のコア復号化済み信号(1603)を周波数ドメイン表現へ変換して、スペクトル値のブロックのさらなる追加系列(1613)を得るよう構成され、
前記結合部(1700)は、前記多チャネル処理部(1630)によって処理されるべき系列(1701)を生成する処理の過程で、スペクトル値のブロックの前記さらなる追加系列(1613)と前記リサンプリング済み系列(1622,1621)とを結合する、
請求項30に記載の復号化装置。 - 前記コア復号器(1600)は、MDCTベースの復号化部(1600d)、時間ドメイン帯域幅拡張復号化部(1600c)、ACELP復号化部(1600b)、及びバス・ポストフィルタ復号化部(1600a)のうちの少なくとも1つを含み、
前記MDCTベースの復号化部(1600d)又は前記時間ドメイン帯域幅拡張復号化部(1600c)は、前記出力サンプリングレートを有する前記コア復号化済み信号を生成するよう構成されるか、又は
前記ACELP復号化部(1600b)又は前記バス・ポストフィルタ復号化部(1600a)は、前記出力サンプリングレートとは異なるサンプリングレートでコア復号化済み信号を生成するよう構成される、
請求項25〜31のいずれか1項に記載の復号化装置。 - 前記時間−スペクトル変換部(1610)は、複数の異なるコア復号化済み信号の少なくとも2つに対して分析窓を適用するように構成され、前記分析窓は時間的に同一サイズ又は時間に関して同一形状を有し、
前記装置は、少なくとも1つのリサンプリング済み系列と前記最大出力周波数までのスペクトル値のブロックを持つ任意の他の系列とをブロック毎に結合して、前記多チャネル処理部(1630)によって処理されるべき系列を取得する、結合部(1700)をさらに含む、
請求項25〜32のいずれか1項に記載の復号化装置。 - 前記多チャネル処理部(1630)によって処理されるべき系列は中央信号に対応し、かつ
前記多チャネル処理部(1630)は、前記符号化済み多チャネル信号に含まれたサイド信号に関する情報を使用して、サイド信号を追加的に生成するよう構成され、かつ
前記多チャネル処理部(1630)は、前記中央信号と前記サイド信号とを使用して、前記少なくとも2つの結果系列を生成するよう構成されている、
請求項25〜33のいずれか1項に記載の復号化装置。 - 前記多チャネル処理部(1630)は、パラメータ帯域毎に1つのゲインファクタを使用して、前記系列を第1出力チャネルのための第1系列と第2出力チャネルのための第2系列とに変換(820)し、
各パラメータ帯域についてステレオ充填パラメータを使用しながら、復号化済みサイド信号を用いて前記第1系列と前記第2系列とを更新(830)するか、又は、中央信号についてのブロック系列の前のブロックから予測されたサイド信号を使用して前記第1系列と前記第2系列とを更新し、
複数の狭帯域位相アライメントパラメータに関する情報を使用して、位相デ・アライメントとエネルギースケーリングとを実行(910)し、かつ
広帯域時間アライメントパラメータに関する情報を使用して時間デ・アライメントを実行(920)し、前記少なくとも2つの結果系列を取得するよう構成される、
請求項25〜34のいずれか1項に記載の復号化装置。 - 前記コア復号器(1600)は、フレーム系列を提供するために第1フレーム制御に従って作動するよう構成され、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とによって仕切られており、
前記時間−スペクトル変換部(1610)又は前記スペクトル−時間変換部(1640)は、前記第1フレーム制御と同期した第2フレーム制御に従って作動するよう構成され、
前記フレーム系列の各フレームの前記開始フレーム境界(1901)又は前記終了フレーム境界(1902)は、窓のオーバーラップ部分の開始時点又は終了時点と所定の関係にあり、前記窓は、サンプリング値のブロック系列の各ブロックに対して前記時間−スペクトル変換部(1610)によって使用され、又はサンプリング値のブロックの前記少なくとも2つの出力系列の各ブロックのために前記スペクトル−時間変換部(1640)によって使用される、
請求項25〜35のいずれか1項に記載の復号化装置。 - 前記コア復号化済み信号はフレーム系列を有し、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とを有し、
前記フレーム系列のフレームを窓掛けするために前記時間−スペクトル変換部(1610)によって使用される分析窓(1914)は、オーバーラップ部分の終点と前記終了フレーム境界(1902)との間の時間ギャップ(1920)を残して前記終了フレーム境界(1902)の前で終了するオーバーラップ部分を有し、
前記コア復号器(1600)は、前記分析窓(1914)を使用した前記フレームの窓掛けと並行して、前記時間ギャップ(1920)内のサンプルに対してある処理を実行するよう構成されるか、又は前記分析窓(1914)を使用した前記フレームの窓掛けと並行して、前記時間ギャップ(1920)内のサンプルに対してコア復号器後処理が実行される、
請求項25〜36のいずれか1項に記載の復号化装置。 - 前記コア復号化済み信号はフレーム系列を有し、1フレームは開始フレーム境界(1901)と終了フレーム境界(1902)とを有し、
分析窓(1914)の第1オーバーラップ部分の始点は前記開始フレーム境界(1901)と一致し、前記分析窓(1914)の第2オーバーラップ部分の終点は前記終了フレーム境界(1902)の前に位置し、前記第2オーバーラップ部分の終点と前記終了フレーム境界との間には時間ギャップ(1920)が存在しており、
前記コア復号化済み信号の次のブロックのための前記分析窓は、前記分析窓の中央の非オーバーラップ部分が前記時間ギャップ(1920)内に位置するように、配置される、
請求項25〜37のいずれか1項に記載の復号化装置。 - 前記時間−スペクトル変換部(1610)によって使用される分析窓は、前記スペクトル−時間変換部(1640)によって使用される合成窓と、時間的に同一形状及び同一長さを有する、
請求項25〜38のいずれか1項に記載の復号化装置。 - 前記コア復号化済み信号はフレーム系列を有し、1フレームはある長さを有し、前記時間−スペクトル変換部(1610)によって適用される任意のゼロパディング部分を除く窓の長さは、前記フレームの長さの半分以下である、
請求項25〜39のいずれか1項に記載の復号化装置。 - 前記スペクトル−時間変換部(1640)は、
前記少なくとも2つの出力系列の第1出力系列について窓掛け済みサンプルの第1出力ブロックを得るために、合成窓を適用し、
前記少なくとも2つの出力系列の前記第1出力系列について窓掛け済みサンプルの第2出力ブロックを得るために、前記合成窓を適用し、
前記第1出力ブロックと前記第2出力ブロックとをオーバーラップ加算して、前記第1出力系列のための出力サンプルの第1グループを取得するよう構成され、
前記スペクトル−時間変換部(1640)は、
前記少なくとも2つの出力系列の第2出力系列について窓掛け済みサンプルの第1出力ブロックを得るために、合成窓を適用し、
前記少なくとも2つの出力系列の前記第2出力系列について窓掛け済みサンプルの第2出力ブロックを得るために、前記合成窓を適用し、
前記第1出力ブロックと前記第2出力ブロックとをオーバーラップ加算して、前記第2出力系列のための出力サンプルの第2グループを取得するよう構成され、
前記第1出力系列のための出力サンプルの第1グループと前記第2出力系列のための出力サンプルの第2グループとは、前記符号化済み多チャネル信号の同じ時間部分に関係するか、又は前記コア復号化済み信号の同じフレームに関係している、
請求項25〜40のいずれか1項に記載の復号化装置。 - 符号化済み多チャネル信号を復号化する方法であって、
コア復号化済み信号を生成するステップ(1600)と、
前記コア復号化済み信号のサンプリング値のブロック系列を前記コア復号化済み信号のスペクトル値のブロック系列を有する周波数ドメイン表現へと変換するステップ(1610)であって、サンプリング値の各ブロックは関連する入力サンプリングレートを有し、スペクトル値の各ブロックは前記入力サンプリングレートに関係する最大入力周波数までのスペクトル値を有する、ステップ(1610)と、
前記コア復号化済み信号についてのスペクトル値のブロック系列(1611,1612)、又は周波数ドメインで逆多チャネル処理によって取得された少なくとも2つの結果系列(1635)をリサンプリングして、スペクトル値のブロックのリサンプリング済み系列(1621,1622)又は少なくとも2つのリサンプリング済み系列(1625)を取得するステップ(1620)であって、リサンプリング済み系列の各ブロックは、前記最大入力周波数とは異なる最大出力周波数までのスペクトル値を有する、ステップ(1620)と、
前記コア復号化済み信号のスペクトル値のブロック系列を含む系列(1615)又はスペクトル値のブロックの前記リサンプリング済み系列(1621,1622)に逆多チャネル処理を適用して、スペクトル値のブロックの少なくとも2つの結果系列(1631,1632,1635)を取得する、ステップ(1630)と、
スペクトル値のブロックの前記少なくとも2つの結果系列(1631,1632)、又はスペクトル値のブロックの前記少なくとも2つのリサンプリング済み系列(1625)を時間ドメイン表現へ変換するステップ(1640)であって、前記時間ドメイン表現は、前記入力サンプリングレートとは異なる出力サンプリングレートを関連して持つサンプリング値のブロックの少なくとも2つの出力系列を含む、ステップ(1640)と、
を備える復号化方法。 - コンピュータ又はプロセッサ上で実行されるとき、請求項24に記載の方法を実行するためのコンピュータプログラム。
- コンピュータ又はプロセッサ上で実行されるとき、請求項42に記載の方法を実行するためのコンピュータプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021044222A JP7258935B2 (ja) | 2016-01-22 | 2021-03-18 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
Applications Claiming Priority (4)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| EP16152453.3 | 2016-01-22 | ||
| EP16152450.9 | 2016-01-22 | ||
| EP16152450 | 2016-01-22 | ||
| EP16152453 | 2016-01-22 |
Related Parent Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018510479A Division JP6412292B2 (ja) | 2016-01-22 | 2017-01-20 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021044222A Division JP7258935B2 (ja) | 2016-01-22 | 2021-03-18 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2019032543A true JP2019032543A (ja) | 2019-02-28 |
| JP6856595B2 JP6856595B2 (ja) | 2021-04-07 |
Family
ID=57838406
Family Applications (10)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018538633A Active JP6730438B2 (ja) | 2016-01-22 | 2017-01-20 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2018538602A Active JP6641018B2 (ja) | 2016-01-22 | 2017-01-20 | チャネル間時間差を推定する装置及び方法 |
| JP2018538601A Active JP6626581B2 (ja) | 2016-01-22 | 2017-01-20 | 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2018510479A Active JP6412292B2 (ja) | 2016-01-22 | 2017-01-20 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2018181254A Active JP6856595B2 (ja) | 2016-01-22 | 2018-09-27 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2019235359A Active JP6859423B2 (ja) | 2016-01-22 | 2019-12-26 | チャネル間時間差を推定する装置及び方法 |
| JP2020114535A Active JP7053725B2 (ja) | 2016-01-22 | 2020-07-02 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2021044222A Active JP7258935B2 (ja) | 2016-01-22 | 2021-03-18 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2021051011A Active JP7161564B2 (ja) | 2016-01-22 | 2021-03-25 | チャネル間時間差を推定する装置及び方法 |
| JP2022057862A Active JP7270096B2 (ja) | 2016-01-22 | 2022-03-31 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
Family Applications Before (4)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018538633A Active JP6730438B2 (ja) | 2016-01-22 | 2017-01-20 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2018538602A Active JP6641018B2 (ja) | 2016-01-22 | 2017-01-20 | チャネル間時間差を推定する装置及び方法 |
| JP2018538601A Active JP6626581B2 (ja) | 2016-01-22 | 2017-01-20 | 1つの広帯域アライメント・パラメータと複数の狭帯域アライメント・パラメータとを使用して、多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2018510479A Active JP6412292B2 (ja) | 2016-01-22 | 2017-01-20 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
Family Applications After (5)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2019235359A Active JP6859423B2 (ja) | 2016-01-22 | 2019-12-26 | チャネル間時間差を推定する装置及び方法 |
| JP2020114535A Active JP7053725B2 (ja) | 2016-01-22 | 2020-07-02 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2021044222A Active JP7258935B2 (ja) | 2016-01-22 | 2021-03-18 | スペクトルドメイン・リサンプリングを用いて多チャネル信号を符号化又は復号化する装置及び方法 |
| JP2021051011A Active JP7161564B2 (ja) | 2016-01-22 | 2021-03-25 | チャネル間時間差を推定する装置及び方法 |
| JP2022057862A Active JP7270096B2 (ja) | 2016-01-22 | 2022-03-31 | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 |
Country Status (19)
| Country | Link |
|---|---|
| US (7) | US10535356B2 (ja) |
| EP (5) | EP3284087B1 (ja) |
| JP (10) | JP6730438B2 (ja) |
| KR (4) | KR102219752B1 (ja) |
| CN (6) | CN108780649B (ja) |
| AU (5) | AU2017208580B2 (ja) |
| CA (4) | CA3011915C (ja) |
| ES (5) | ES2727462T3 (ja) |
| HK (1) | HK1244584B (ja) |
| MX (4) | MX375301B (ja) |
| MY (4) | MY181992A (ja) |
| PL (4) | PL3503097T3 (ja) |
| PT (3) | PT3405951T (ja) |
| RU (4) | RU2704733C1 (ja) |
| SG (3) | SG11201806216YA (ja) |
| TR (1) | TR201906475T4 (ja) |
| TW (4) | TWI643487B (ja) |
| WO (4) | WO2017125562A1 (ja) |
| ZA (3) | ZA201804625B (ja) |
Families Citing this family (58)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN102216982A (zh) * | 2008-09-18 | 2011-10-12 | 韩国电子通信研究院 | 在基于修正离散余弦变换的译码器与异质译码器间转换的编码设备和解码设备 |
| SG11201806216YA (en) * | 2016-01-22 | 2018-08-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters |
| CN107731238B (zh) | 2016-08-10 | 2021-07-16 | 华为技术有限公司 | 多声道信号的编码方法和编码器 |
| US10224042B2 (en) * | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
| PL3539126T3 (pl) | 2016-11-08 | 2021-04-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Urządzenie i sposób downmiksu lub upmiksu sygnału wielokanałowego przy wykorzystaniu kompensacji fazy |
| US10475457B2 (en) * | 2017-07-03 | 2019-11-12 | Qualcomm Incorporated | Time-domain inter-channel prediction |
| US10535357B2 (en) * | 2017-10-05 | 2020-01-14 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| US10839814B2 (en) * | 2017-10-05 | 2020-11-17 | Qualcomm Incorporated | Encoding or decoding of audio signals |
| WO2019149845A1 (en) | 2018-02-01 | 2019-08-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio scene encoder, audio scene decoder and related methods using hybrid encoder/decoder spatial analysis |
| US10978091B2 (en) * | 2018-03-19 | 2021-04-13 | Academia Sinica | System and methods for suppression by selecting wavelets for feature compression in distributed speech recognition |
| CA3095971C (en) * | 2018-04-05 | 2023-04-25 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus, method or computer program for estimating an inter-channel time difference |
| CN110556116B (zh) * | 2018-05-31 | 2021-10-22 | 华为技术有限公司 | 计算下混信号和残差信号的方法和装置 |
| EP3588495A1 (en) * | 2018-06-22 | 2020-01-01 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | Multichannel audio coding |
| JP7407110B2 (ja) * | 2018-07-03 | 2023-12-28 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置及び符号化方法 |
| JP7092048B2 (ja) * | 2019-01-17 | 2022-06-28 | 日本電信電話株式会社 | 多地点制御方法、装置及びプログラム |
| EP3719799A1 (en) | 2019-04-04 | 2020-10-07 | FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. | A multi-channel audio encoder, decoder, methods and computer program for switching between a parametric multi-channel operation and an individual channel operation |
| WO2020216459A1 (en) * | 2019-04-23 | 2020-10-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for generating an output downmix representation |
| EP3987731B1 (en) * | 2019-06-18 | 2025-10-01 | Razer (Asia-Pacific) Pte. Ltd. | Method and apparatus for optimizing input latency in a wireless human interface device system |
| EP4026122A1 (en) | 2019-09-03 | 2022-07-13 | Dolby Laboratories Licensing Corporation | Low-latency, low-frequency effects codec |
| CN110459205B (zh) * | 2019-09-24 | 2022-04-12 | 京东科技控股股份有限公司 | 语音识别方法及装置、计算机可存储介质 |
| CN110740416B (zh) * | 2019-09-27 | 2021-04-06 | 广州励丰文化科技股份有限公司 | 一种音频信号处理方法及装置 |
| CN110954866B (zh) * | 2019-11-22 | 2022-04-22 | 达闼机器人有限公司 | 声源定位方法、电子设备及存储介质 |
| US12373374B2 (en) * | 2019-11-22 | 2025-07-29 | STMicroelectronics (Grand Ouest) SAS | Method for managing the operation of a system on chip, and corresponding system on chip |
| CN111131917B (zh) * | 2019-12-26 | 2021-12-28 | 国微集团(深圳)有限公司 | 音频频谱实时同步方法、播放装置 |
| US12062378B2 (en) | 2020-01-09 | 2024-08-13 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, encoding method, and decoding method |
| TWI750565B (zh) * | 2020-01-15 | 2021-12-21 | 原相科技股份有限公司 | 真無線多聲道揚聲裝置及其多音源發聲之方法 |
| CN111402906B (zh) * | 2020-03-06 | 2024-05-14 | 深圳前海微众银行股份有限公司 | 语音解码方法、装置、引擎及存储介质 |
| US11276388B2 (en) * | 2020-03-31 | 2022-03-15 | Nuvoton Technology Corporation | Beamforming system based on delay distribution model using high frequency phase difference |
| CN111525912B (zh) * | 2020-04-03 | 2023-09-19 | 安徽白鹭电子科技有限公司 | 一种数字信号的任意重采样方法及系统 |
| CN113223503B (zh) * | 2020-04-29 | 2022-06-14 | 浙江大学 | 一种基于测试反馈的核心训练语音选择方法 |
| WO2021260825A1 (ja) * | 2020-06-24 | 2021-12-30 | 日本電信電話株式会社 | 音信号符号化方法、音信号符号化装置、プログラム及び記録媒体 |
| JP7485037B2 (ja) * | 2020-06-24 | 2024-05-16 | 日本電信電話株式会社 | 音信号復号方法、音信号復号装置、プログラム及び記録媒体 |
| WO2022022876A1 (en) * | 2020-07-30 | 2022-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for encoding an audio signal or for decoding an encoded audio scene |
| WO2022074202A2 (en) | 2020-10-09 | 2022-04-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter smoothing |
| JP7600386B2 (ja) | 2020-10-09 | 2024-12-16 | フラウンホーファー-ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 帯域幅拡張を用いて符号化されたオーディオシーンを処理するための装置、方法、またはコンピュータプログラム |
| EP4226365A2 (en) | 2020-10-09 | 2023-08-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method, or computer program for processing an encoded audio scene using a parameter conversion |
| US11532312B2 (en) * | 2020-12-15 | 2022-12-20 | Microsoft Technology Licensing, Llc | User-perceived latency while maintaining accuracy |
| JP7743444B2 (ja) * | 2021-01-18 | 2025-09-24 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
| EP4243015A4 (en) | 2021-01-27 | 2024-04-17 | Samsung Electronics Co., Ltd. | AUDIO PROCESSING APPARATUS AND METHOD |
| US20240282319A1 (en) * | 2021-06-15 | 2024-08-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Improved stability of inter-channel time difference (itd) estimator for coincident stereo capture |
| CN113435313A (zh) * | 2021-06-23 | 2021-09-24 | 中国电子科技集团公司第二十九研究所 | 一种基于dft的脉冲频域特征提取方法 |
| CN115691514B (zh) * | 2021-07-29 | 2026-01-02 | 华为技术有限公司 | 一种多声道信号的编解码方法和装置 |
| CN115883306A (zh) * | 2021-09-29 | 2023-03-31 | 中兴通讯股份有限公司 | 数据传输方法、数据调制方法、电子设备和存储介质 |
| WO2023153228A1 (ja) * | 2022-02-08 | 2023-08-17 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 符号化装置、及び、符号化方法 |
| KR20230121431A (ko) * | 2022-02-11 | 2023-08-18 | 한국전자통신연구원 | 복소 신호를 이용한 부호화 방법 및 부호화 장치, 그리고 복호화 방법 및 복호화 장치 |
| US12206874B1 (en) * | 2022-06-27 | 2025-01-21 | Amazon Technologies, Inc. | Spatially lapped encoding |
| CN115691515A (zh) * | 2022-07-12 | 2023-02-03 | 南京拓灵智能科技有限公司 | 一种音频编解码方法及装置 |
| WO2024053353A1 (ja) * | 2022-09-08 | 2024-03-14 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | 信号処理装置、及び、信号処理方法 |
| AU2023355540A1 (en) | 2022-10-05 | 2025-02-20 | Telefonaktiebolaget Lm Ericsson (Publ) | Coherence calculation for stereo discontinuous transmission (dtx) |
| CN115631764B (zh) * | 2022-10-21 | 2025-10-10 | 深圳看到科技有限公司 | 分布式麦克风的音频同步方法、装置和存储介质 |
| EP4383254A1 (en) * | 2022-12-07 | 2024-06-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoder comprising an inter-channel phase difference calculator device and method for operating such encoder |
| WO2024160859A1 (en) | 2023-01-31 | 2024-08-08 | Telefonaktiebolaget Lm Ericsson (Publ) | Refined inter-channel time difference (itd) selection for multi-source stereo signals |
| CN116170720B (zh) * | 2023-02-23 | 2025-12-12 | 展讯通信(上海)有限公司 | 数据传输方法、装置、电子设备及存储介质 |
| JPWO2024202997A1 (ja) * | 2023-03-29 | 2024-10-03 | ||
| WO2024202972A1 (ja) * | 2023-03-29 | 2024-10-03 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | チャネル間時間差推定装置、及び、チャネル間時間差推定方法 |
| CN117476026A (zh) * | 2023-12-26 | 2024-01-30 | 芯瞳半导体技术(山东)有限公司 | 一种多路音频数据混音的方法、系统、装置及存储介质 |
| US20250372107A1 (en) * | 2024-05-31 | 2025-12-04 | Qualcomm Incorporated | Multi-rate audio mixing |
| CN119363284B (zh) * | 2024-12-27 | 2025-03-14 | 南京乐韵瑞信息技术有限公司 | 多房间多声道音频同步方法、装置、设备及存储介质 |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010020333A (ja) * | 2009-09-04 | 2010-01-28 | Panasonic Corp | スケーラブル符号化装置およびスケーラブル復号化装置 |
| JP2013543600A (ja) * | 2010-10-06 | 2013-12-05 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
Family Cites Families (85)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5434948A (en) * | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
| US5526359A (en) | 1993-12-30 | 1996-06-11 | Dsc Communications Corporation | Integrated multi-fabric digital cross-connect timing architecture |
| US6073100A (en) * | 1997-03-31 | 2000-06-06 | Goodridge, Jr.; Alan G | Method and apparatus for synthesizing signals using transform-domain match-output extension |
| US5903872A (en) * | 1997-10-17 | 1999-05-11 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries |
| US6138089A (en) * | 1999-03-10 | 2000-10-24 | Infolio, Inc. | Apparatus system and method for speech compression and decompression |
| US6549884B1 (en) * | 1999-09-21 | 2003-04-15 | Creative Technology Ltd. | Phase-vocoder pitch-shifting |
| EP1199711A1 (en) * | 2000-10-20 | 2002-04-24 | Telefonaktiebolaget Lm Ericsson | Encoding of audio signal using bandwidth expansion |
| US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
| FI119955B (fi) * | 2001-06-21 | 2009-05-15 | Nokia Corp | Menetelmä, kooderi ja laite puheenkoodaukseen synteesi-analyysi puhekoodereissa |
| US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
| US7089178B2 (en) * | 2002-04-30 | 2006-08-08 | Qualcomm Inc. | Multistream network feature processing for a distributed speech recognition system |
| WO2003107591A1 (en) * | 2002-06-14 | 2003-12-24 | Nokia Corporation | Enhanced error concealment for spatial audio |
| CN1233163C (zh) * | 2002-08-21 | 2005-12-21 | 中山正音数字技术有限公司 | 多声道数字音频信号的压缩编码和解码设备及其方法 |
| US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
| US7536305B2 (en) * | 2002-09-04 | 2009-05-19 | Microsoft Corporation | Mixed lossless audio compression |
| US7394903B2 (en) | 2004-01-20 | 2008-07-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal |
| US7596486B2 (en) | 2004-05-19 | 2009-09-29 | Nokia Corporation | Encoding an audio signal using different audio coder modes |
| EP1769491B1 (en) * | 2004-07-14 | 2009-09-30 | Koninklijke Philips Electronics N.V. | Audio channel conversion |
| US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
| US7573912B2 (en) * | 2005-02-22 | 2009-08-11 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. | Near-transparent or transparent multi-channel encoder/decoder scheme |
| US9626973B2 (en) * | 2005-02-23 | 2017-04-18 | Telefonaktiebolaget L M Ericsson (Publ) | Adaptive bit allocation for multi-channel audio encoding |
| US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
| US20070055510A1 (en) * | 2005-07-19 | 2007-03-08 | Johannes Hilpert | Concept for bridging the gap between parametric multi-channel audio coding and matrixed-surround multi-channel coding |
| KR100712409B1 (ko) * | 2005-07-28 | 2007-04-27 | 한국전자통신연구원 | 벡터의 차원변환 방법 |
| TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
| JP5025485B2 (ja) * | 2005-10-31 | 2012-09-12 | パナソニック株式会社 | ステレオ符号化装置およびステレオ信号予測方法 |
| US7720677B2 (en) | 2005-11-03 | 2010-05-18 | Coding Technologies Ab | Time warped modified transform coding of audio signals |
| US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
| US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
| MX2008010836A (es) | 2006-02-24 | 2008-11-26 | France Telecom | Un metodo para codificacion binaria de indices de cuantificacion de una envoltura de señal, un metodo para descodificar una envoltura de señal, y modulos de codificacion y descodificacion correspondiente. |
| DE102006049154B4 (de) * | 2006-10-18 | 2009-07-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Kodierung eines Informationssignals |
| DE102006051673A1 (de) * | 2006-11-02 | 2008-05-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Nachbearbeiten von Spektralwerten und Encodierer und Decodierer für Audiosignale |
| US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
| GB2453117B (en) | 2007-09-25 | 2012-05-23 | Motorola Mobility Inc | Apparatus and method for encoding a multi channel audio signal |
| JP5400059B2 (ja) * | 2007-12-18 | 2014-01-29 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号処理方法及び装置 |
| EP2107556A1 (en) * | 2008-04-04 | 2009-10-07 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transform coding using pitch correction |
| CN101267362B (zh) * | 2008-05-16 | 2010-11-17 | 亿阳信通股份有限公司 | 一种性能指标值正常波动范围的动态确定方法及其装置 |
| WO2009141775A1 (en) * | 2008-05-23 | 2009-11-26 | Koninklijke Philips Electronics N.V. | A parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder |
| US8355921B2 (en) * | 2008-06-13 | 2013-01-15 | Nokia Corporation | Method, apparatus and computer program product for providing improved audio processing |
| EP2144229A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Efficient use of phase information in audio encoding and decoding |
| PT2410522T (pt) | 2008-07-11 | 2018-01-09 | Fraunhofer Ges Forschung | Codificador de sinal de áudio, método para codificar um sinal de áudio e programa de computador |
| MY154452A (en) * | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
| EP2301028B1 (en) | 2008-07-11 | 2012-12-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | An apparatus and a method for calculating a number of spectral envelopes |
| EP2144171B1 (en) * | 2008-07-11 | 2018-05-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder for encoding and decoding frames of a sampled audio signal |
| PT2146344T (pt) * | 2008-07-17 | 2016-10-13 | Fraunhofer Ges Forschung | Esquema de codificação/descodificação de áudio com uma derivação comutável |
| CN102292767B (zh) * | 2009-01-22 | 2013-05-08 | 松下电器产业株式会社 | 立体声音响信号编码装置、立体声音响信号解码装置及它们的编解码方法 |
| US8457975B2 (en) * | 2009-01-28 | 2013-06-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio decoder, audio encoder, methods for decoding and encoding an audio signal and computer program |
| CN102334160B (zh) * | 2009-01-28 | 2014-05-07 | 弗劳恩霍夫应用研究促进协会 | 音频编码器,音频解码器,编码和解码音频信号的方法 |
| AU2010225051B2 (en) * | 2009-03-17 | 2013-06-13 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
| CN102422347B (zh) * | 2009-05-20 | 2013-07-03 | 松下电器产业株式会社 | 编码装置、解码装置及编码和解码方法 |
| CN101989429B (zh) * | 2009-07-31 | 2012-02-01 | 华为技术有限公司 | 转码方法、装置、设备以及系统 |
| PL2486564T3 (pl) * | 2009-10-21 | 2014-09-30 | Dolby Int Ab | Urządzenie i sposób do generowania sygnału audio o wysokiej częstotliwości z użyciem adaptacyjnego nadpróbkowania |
| BR112012022741B1 (pt) * | 2010-03-10 | 2021-09-21 | Fraunhofer-Gesellschaft Zur Fõrderung Der Angewandten Forschung E.V. | Decodificador de sinal de áudio, codificador de sinal de áudio e métodos utilizando uma codificação de contorno da deformação no tempo dependente da taxa de amostragem |
| JP5405373B2 (ja) * | 2010-03-26 | 2014-02-05 | 富士フイルム株式会社 | 電子内視鏡システム |
| KR101698439B1 (ko) * | 2010-04-09 | 2017-01-20 | 돌비 인터네셔널 에이비 | Mdct-기반의 복소수 예측 스테레오 코딩 |
| EP2375409A1 (en) | 2010-04-09 | 2011-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, audio decoder and related methods for processing multi-channel audio signals using complex prediction |
| CA2796292C (en) | 2010-04-13 | 2016-06-07 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio or video encoder, audio or video decoder and related methods for processing multi-channel audio or video signals using a variable prediction direction |
| US8463414B2 (en) * | 2010-08-09 | 2013-06-11 | Motorola Mobility Llc | Method and apparatus for estimating a parameter for low bit rate stereo transmission |
| ES2501493T3 (es) * | 2010-08-12 | 2014-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Re-muestreo de señales de salida de códecs de audio basados en QMF |
| FR2966634A1 (fr) | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
| PL2671222T3 (pl) * | 2011-02-02 | 2016-08-31 | Ericsson Telefon Ab L M | Określanie międzykanałowej różnicy czasu wielokanałowego sygnału audio |
| AU2011357816B2 (en) * | 2011-02-03 | 2016-06-16 | Telefonaktiebolaget L M Ericsson (Publ) | Determining the inter-channel time difference of a multi-channel audio signal |
| EP2676265B1 (en) * | 2011-02-14 | 2019-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using an aligned look-ahead portion |
| MX2013009344A (es) * | 2011-02-14 | 2013-10-01 | Fraunhofer Ges Forschung | Aparato y metodo para procesar una señal de audio decodificada en un dominio espectral. |
| CN103155030B (zh) * | 2011-07-15 | 2015-07-08 | 华为技术有限公司 | 用于处理多声道音频信号的方法及设备 |
| EP2600343A1 (en) * | 2011-12-02 | 2013-06-05 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for merging geometry - based spatial audio coding streams |
| EP3029672B1 (en) * | 2012-02-23 | 2017-09-13 | Dolby International AB | Method and program for efficient recovery of high frequency audio content |
| CN103366749B (zh) * | 2012-03-28 | 2016-01-27 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
| CN103366751B (zh) * | 2012-03-28 | 2015-10-14 | 北京天籁传音数字技术有限公司 | 一种声音编解码装置及其方法 |
| ES2571742T3 (es) | 2012-04-05 | 2016-05-26 | Huawei Tech Co Ltd | Método de determinación de un parámetro de codificación para una señal de audio multicanal y un codificador de audio multicanal |
| WO2013149671A1 (en) | 2012-04-05 | 2013-10-10 | Huawei Technologies Co., Ltd. | Multi-channel audio encoder and method for encoding a multi-channel audio signal |
| KR20150012146A (ko) | 2012-07-24 | 2015-02-03 | 삼성전자주식회사 | 오디오 데이터를 처리하기 위한 방법 및 장치 |
| JP2015534116A (ja) * | 2012-09-14 | 2015-11-26 | ドルビー ラボラトリーズ ライセンシング コーポレイション | マルチチャネル・オーディオ・コンテンツ解析に基づく上方混合検出 |
| EP2898506B1 (en) * | 2012-09-21 | 2018-01-17 | Dolby Laboratories Licensing Corporation | Layered approach to spatial audio coding |
| CN104885383B (zh) * | 2012-12-27 | 2017-08-29 | 松下电器(美国)知识产权公司 | 影像显示方法 |
| SG11201506543WA (en) * | 2013-02-20 | 2015-09-29 | Fraunhofer Ges Forschung | Apparatus and method for generating an encoded signal or for decoding an encoded audio signal using a multi overlap portion |
| CN105074818B (zh) * | 2013-02-21 | 2019-08-13 | 杜比国际公司 | 音频编码系统、用于产生比特流的方法以及音频解码器 |
| TWI546799B (zh) * | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
| EP2830064A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for decoding and encoding an audio signal using adaptive spectral tile selection |
| EP2980795A1 (en) * | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
| WO2016108655A1 (ko) * | 2014-12-31 | 2016-07-07 | 한국전자통신연구원 | 다채널 오디오 신호의 인코딩 방법 및 상기 인코딩 방법을 수행하는 인코딩 장치, 그리고, 다채널 오디오 신호의 디코딩 방법 및 상기 디코딩 방법을 수행하는 디코딩 장치 |
| WO2016108665A1 (ko) | 2014-12-31 | 2016-07-07 | 엘지전자(주) | 무선 통신 시스템에서 자원을 할당하기 위한 방법 및 이를 위한 장치 |
| EP3067887A1 (en) * | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal |
| SG11201806216YA (en) | 2016-01-22 | 2018-08-30 | Fraunhofer Ges Forschung | Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters |
| US10224042B2 (en) | 2016-10-31 | 2019-03-05 | Qualcomm Incorporated | Encoding of multiple audio signals |
-
2017
- 2017-01-20 SG SG11201806216YA patent/SG11201806216YA/en unknown
- 2017-01-20 PL PL19157001.9T patent/PL3503097T3/pl unknown
- 2017-01-20 JP JP2018538633A patent/JP6730438B2/ja active Active
- 2017-01-20 WO PCT/EP2017/051212 patent/WO2017125562A1/en not_active Ceased
- 2017-01-20 WO PCT/EP2017/051205 patent/WO2017125558A1/en not_active Ceased
- 2017-01-20 MX MX2018008887A patent/MX375301B/es active IP Right Grant
- 2017-01-20 RU RU2018130275A patent/RU2704733C1/ru active
- 2017-01-20 SG SG11201806246UA patent/SG11201806246UA/en unknown
- 2017-01-20 KR KR1020187024177A patent/KR102219752B1/ko active Active
- 2017-01-20 ES ES17700706T patent/ES2727462T3/es active Active
- 2017-01-20 PT PT177016698T patent/PT3405951T/pt unknown
- 2017-01-20 AU AU2017208580A patent/AU2017208580B2/en active Active
- 2017-01-20 MX MX2017015009A patent/MX371224B/es active IP Right Grant
- 2017-01-20 JP JP2018538602A patent/JP6641018B2/ja active Active
- 2017-01-20 SG SG11201806241QA patent/SG11201806241QA/en unknown
- 2017-01-20 EP EP17700706.9A patent/EP3284087B1/en active Active
- 2017-01-20 CA CA3011915A patent/CA3011915C/en active Active
- 2017-01-20 CA CA2987808A patent/CA2987808C/en active Active
- 2017-01-20 EP EP17700705.1A patent/EP3405948B1/en active Active
- 2017-01-20 RU RU2018130272A patent/RU2711513C1/ru active
- 2017-01-20 JP JP2018538601A patent/JP6626581B2/ja active Active
- 2017-01-20 ES ES17700705T patent/ES2790404T3/es active Active
- 2017-01-20 KR KR1020187024233A patent/KR102343973B1/ko active Active
- 2017-01-20 MY MYPI2017001705A patent/MY181992A/en unknown
- 2017-01-20 ES ES17700707T patent/ES2773794T3/es active Active
- 2017-01-20 AU AU2017208579A patent/AU2017208579B2/en active Active
- 2017-01-20 CN CN201780018903.4A patent/CN108780649B/zh active Active
- 2017-01-20 MY MYPI2018001323A patent/MY196436A/en unknown
- 2017-01-20 MY MYPI2018001321A patent/MY189205A/en unknown
- 2017-01-20 KR KR1020177037759A patent/KR102083200B1/ko active Active
- 2017-01-20 EP EP17700707.7A patent/EP3405949B1/en active Active
- 2017-01-20 AU AU2017208576A patent/AU2017208576B2/en active Active
- 2017-01-20 MY MYPI2018001318A patent/MY189223A/en unknown
- 2017-01-20 WO PCT/EP2017/051214 patent/WO2017125563A1/en not_active Ceased
- 2017-01-20 MX MX2018008889A patent/MX372605B/es active IP Right Grant
- 2017-01-20 WO PCT/EP2017/051208 patent/WO2017125559A1/en not_active Ceased
- 2017-01-20 PT PT177007077T patent/PT3405949T/pt unknown
- 2017-01-20 KR KR1020187024171A patent/KR102230727B1/ko active Active
- 2017-01-20 AU AU2017208575A patent/AU2017208575B2/en active Active
- 2017-01-20 PT PT17700706T patent/PT3284087T/pt unknown
- 2017-01-20 ES ES19157001T patent/ES2965487T3/es active Active
- 2017-01-20 RU RU2017145250A patent/RU2693648C2/ru active
- 2017-01-20 EP EP19157001.9A patent/EP3503097B1/en active Active
- 2017-01-20 CN CN202210761486.5A patent/CN115148215B/zh active Active
- 2017-01-20 PL PL17700707T patent/PL3405949T3/pl unknown
- 2017-01-20 PL PL17700706T patent/PL3284087T3/pl unknown
- 2017-01-20 CN CN201780018898.7A patent/CN108885877B/zh active Active
- 2017-01-20 ES ES17701669T patent/ES2768052T3/es active Active
- 2017-01-20 CA CA3012159A patent/CA3012159C/en active Active
- 2017-01-20 JP JP2018510479A patent/JP6412292B2/ja active Active
- 2017-01-20 TR TR2019/06475T patent/TR201906475T4/tr unknown
- 2017-01-20 EP EP17701669.8A patent/EP3405951B1/en active Active
- 2017-01-20 MX MX2018008890A patent/MX374982B/es active IP Right Grant
- 2017-01-20 PL PL17701669T patent/PL3405951T3/pl unknown
- 2017-01-20 RU RU2018130151A patent/RU2705007C1/ru active
- 2017-01-20 CN CN201780002248.3A patent/CN107710323B/zh active Active
- 2017-01-20 CN CN201780019674.8A patent/CN108885879B/zh active Active
- 2017-01-20 CA CA3011914A patent/CA3011914C/en active Active
- 2017-01-20 HK HK18103855.8A patent/HK1244584B/en unknown
- 2017-01-20 CN CN202311130088.4A patent/CN117238300A/zh active Pending
- 2017-01-23 TW TW106102410A patent/TWI643487B/zh active
- 2017-01-23 TW TW106102409A patent/TWI629681B/zh active
- 2017-01-23 TW TW106102408A patent/TWI653627B/zh active
- 2017-01-23 TW TW106102398A patent/TWI628651B/zh active
- 2017-11-22 US US15/821,108 patent/US10535356B2/en active Active
-
2018
- 2018-07-11 ZA ZA2018/04625A patent/ZA201804625B/en unknown
- 2018-07-12 US US16/034,206 patent/US10861468B2/en active Active
- 2018-07-13 US US16/035,471 patent/US10424309B2/en active Active
- 2018-07-13 US US16/035,456 patent/US10706861B2/en active Active
- 2018-07-17 ZA ZA2018/04776A patent/ZA201804776B/en unknown
- 2018-07-20 ZA ZA2018/04910A patent/ZA201804910B/en unknown
- 2018-09-27 JP JP2018181254A patent/JP6856595B2/ja active Active
-
2019
- 2019-04-04 US US16/375,437 patent/US10854211B2/en active Active
- 2019-08-09 AU AU2019213424A patent/AU2019213424B8/en active Active
- 2019-12-26 JP JP2019235359A patent/JP6859423B2/ja active Active
-
2020
- 2020-02-19 US US16/795,548 patent/US11410664B2/en active Active
- 2020-07-02 JP JP2020114535A patent/JP7053725B2/ja active Active
-
2021
- 2021-03-18 JP JP2021044222A patent/JP7258935B2/ja active Active
- 2021-03-25 JP JP2021051011A patent/JP7161564B2/ja active Active
-
2022
- 2022-03-31 JP JP2022057862A patent/JP7270096B2/ja active Active
- 2022-05-23 US US17/751,303 patent/US11887609B2/en active Active
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2010020333A (ja) * | 2009-09-04 | 2010-01-28 | Panasonic Corp | スケーラブル符号化装置およびスケーラブル復号化装置 |
| JP2013543600A (ja) * | 2010-10-06 | 2013-12-05 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | オーディオ信号を処理し、音声音響統合符号化方式(usac)のためにより高い時間粒度を供給するための装置および方法 |
Also Published As
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7270096B2 (ja) | フレーム制御同期化を使用して多チャネル信号を符号化又は復号化する装置及び方法 | |
| HK1244584A1 (en) | Apparatuses and methods for encoding or decoding an audio multi-channel signal using spectral-domain resampling | |
| HK40005533A (en) | Apparatus and method for encoding or decoding a multi-channel signal using spectral-domain resampling | |
| HK40005533B (en) | Apparatus and method for encoding or decoding a multi-channel signal using spectral-domain resampling | |
| HK1257034B (en) | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization | |
| HK1257034A1 (en) | Apparatuses and methods for encoding or decoding a multi-channel audio signal using frame control synchronization |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181024 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20181024 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20181203 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20191127 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20191210 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20200304 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20200610 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201006 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20201021 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210216 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210318 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6856595 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |