JP4000261B2 - ステレオ音響信号の処理方法と装置 - Google Patents
ステレオ音響信号の処理方法と装置 Download PDFInfo
- Publication number
- JP4000261B2 JP4000261B2 JP2001543072A JP2001543072A JP4000261B2 JP 4000261 B2 JP4000261 B2 JP 4000261B2 JP 2001543072 A JP2001543072 A JP 2001543072A JP 2001543072 A JP2001543072 A JP 2001543072A JP 4000261 B2 JP4000261 B2 JP 4000261B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- channel
- multiplier
- modified
- stereo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 56
- 238000003672 processing method Methods 0.000 title 1
- 238000012545 processing Methods 0.000 claims abstract description 33
- 230000002238 attenuated effect Effects 0.000 claims abstract description 20
- 230000004048 modification Effects 0.000 claims abstract description 3
- 238000012986 modification Methods 0.000 claims abstract description 3
- 238000012937 correction Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 17
- 238000000926 separation method Methods 0.000 abstract description 20
- 230000009467 reduction Effects 0.000 abstract description 10
- 230000008901 benefit Effects 0.000 abstract description 2
- 238000013139 quantization Methods 0.000 description 31
- 230000003595 spectral effect Effects 0.000 description 19
- 230000000873 masking effect Effects 0.000 description 13
- 238000006243 chemical reaction Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000001228 spectrum Methods 0.000 description 6
- 230000002596 correlated effect Effects 0.000 description 5
- 230000003044 adaptive effect Effects 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000000875 corresponding effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008447 perception Effects 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013016 damping Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- QVRVXSZKCXFBTE-UHFFFAOYSA-N n-[4-(6,7-dimethoxy-3,4-dihydro-1h-isoquinolin-2-yl)butyl]-2-(2-fluoroethoxy)-5-methylbenzamide Chemical compound C1C=2C=C(OC)C(OC)=CC=2CCN1CCCCNC(=O)C1=CC(C)=CC=C1OCCF QVRVXSZKCXFBTE-UHFFFAOYSA-N 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000009527 percussion Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007493 shaping process Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- RYYVLZVUVIJVGH-UHFFFAOYSA-N trimethylxanthine Natural products CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
- Stereo-Broadcasting Methods (AREA)
Description
この発明はステレオ音響信号のコード化に関するものであり、特にステレオ音響信号の処理に関するものである。
【0002】
ステレオ音響信号は左チャンネル信号と右チャンネル信号との少なくとも2個のチャンネル信号を有している。加えてステレオ音響信号は左右のサラウンドチャンネル信号を有している。またステレオ音響信号は5個の異なるチャンネル信号、すなわち前左チャンネル信号、前中央チャンネル信号、前右チャンネル信号、左後チャンネル信号、右後チャンネル信号を有している可能性も有る。
【0003】
ステレオ音響信号のデータ低減符号化(またはコード化)のためには、少なくとも2個のチャンネル信号の同じ部分を利用して、少なくとも2個のチャンネル信号を使ってステレオ音響信号を符号化するのに必要なビット数を低減することもできる。
【0004】
ステレオ音響信号を処理して効果的なコード化を行う公知の方法は中央/側部方法(M/S方法)と呼ばれており、この方法では第1と第2のチャンネル信号が組み合わされて、中央、側部チャンネル信号を形成する。明確にするために、ここで言及されるのは第1、第2チャンネル信号ではなく、左右のチャンネル信号(L、R)である。中央チャンネル信号は0.5のファクターで乗算された左右のチャンネル信号L、Rに等しく、側部チャンネル信号は例えば0.5(他のファクターを用いることもできる)で乗算された左右のチャンネル信号L、Rの差に等しいことが知られている。
【0005】
これは数式で表わすとつぎのようになる。
【式1】
【0006】
左右のチャンネル信号L、Rが比較的等しい場合には、M/S処理によりコード化に必要とされるビット数がかなり省かれる。なぜなら側部チャンネル信号は信号RまたはLより比較的少ないエネルギーを有しているからである。左右のチャンネル信号L、Rが等しい境目のケースにおいては、中央チャンネル信号は左右いずれかのチャンネル信号に等しくなり、側部チャンネル信号は0になる。側部チャンネル信号が0に等しいので、50%のコード化がなされるときには理論的なビット速度が抑制される。なぜなら中央チャンネル信号のみがコード化されるべきだからである。単一のビットのみが側部チャンネル信号で占められなければならないのではないのである。
【0007】
左右のチャンネル信号は小さいほどより等しくなるという一般的な法則がある。すなわちエネルギーにおいて側部チャンネル信号が低くて、側部チャンネル信号をコード化するのに必要なビットは少なくなる。
【0008】
同じチャンネル信号の場合には、聞き手は、話し手またはオーケストラをラウドスピーカの間の中央で知覚し、左右のチャンネル信号の同じ部分を知覚する。他方、聞き手は、彼が明白な音響効果を感じる場合、すなわち、話し手、オーケストラまたはオーケストラの個々の楽器がまさに左および/または右に配置されている場合、同じでないチャンネル信号を知覚する。左のチャンネル信号が高いエネルギー量を有し、右チャンネル信号が小さいエネルギーを有している場合、例えば単一の楽器が室内の非常に左側に配置されて左のチャンネルでのみ可聴であり、右のチャンネルにはノイズがある場合には、M/S処理の後で、中央チャンネル信号はほぼ左チャンネル信号と同じとなる。
【0009】
加えて、側部チャンネル信号はほぼ左チャンネル信号と等しくなる。この場合、中央、側部チャンネル信号は、ともにほぼ等量のエネルギーを有しており、ともに比較的大きな数のビットによりコード化されなければならない。最初の場合と比較して、この信号群に必要とされるビット数はM/Sコード化ビットによっては低減されるべきではないが、際どい場合、左チャンネル信号Lがある量のエネルギーを有していると仮定される場合に倍増されても、右チャンネル信号Rは0に等しい。
【0010】
この場合、M/S処理を行わないのが極めて有利ではあるが、L/R処理のみを行うのがよい。かくしてステレオ音響信号をコード化するのに必要なビット数への影響は、極端な場合に50%の節減から、他の極端な場合に、コード化に必要なビットの倍増に広がる。かくしてM/S方法が適用される場合には、その信号データの項目がM/S処理に適しているか否かがチェックされる。
【0011】
ステレオ音響信号(例えばフレームと呼ばれる20msのテストセクター)がM/S処理に適しない場合には、ビット効率の理由からM/S処理はなしで済ます。左右のチャンネル信号はともに個々にコード化される。この「正常な」ケースもL/R処理と呼ばれる。
【0012】
例えばMPEG標準のいずれかに応じて復号される音響信号のコード化に使われる従来の音響コード化方法は一般にいくつかのステップに分割される。
【0013】
第1に例えばCDプレーヤにより出力される例えばPCMサンプル値の形で存在する音響信号がフィルターバンクまたは時間−周波数変換によるスペクトル表現に変換される。典型的には、ある数のサンプル値を有した「フレーム」と呼ばれるブロックを用いて、音響サンプル値(サンプル)のフレームの短時間スペクトルを形成する複素スペクトル値のブロックが発生される。
【0014】
このブロック形成は例えば長さが1024サンプル値の変換ウィンドーを用いてなされる。例えば重複領域が50%である重複ウィンドーを用いて変換がなされ、1024スペクトル値が1024のサンプル値から形成される。これらのスペクトル値は、公知の反復処理により量子化される。量子化されたスペクトル値は、例えば複数の固定ホフマンコードテーブルを用いて、エントロピーコード化に掛けられ、最終的にはビットストリームが形成される。該ビットストリームは、コード化された量子化スペクトル値を含んでおり、ウィンドー、量子化に際して計算されたスケールファクターおよびビットストリームを復号するのに必要な情報に関連する側部情報をさらに含んでいる。
【0015】
中央/側部処理はスペクトル範囲への変換前にも実行でき、それにはデジタルの時間的に不連続なサンプル値を用いる。これに代えて、中央/側部処理は変換の後でも実行でき、それには複素スペクトル値を用いる。後者の場合には、時間領域の場合のように、中央/側部処理は、全体のスペクトルに使われることはできないが、スペクトル値が中央/側部処理に掛けられたときに、ある周波数帯域に使えるという利点がある。
【0016】
通常音響コーダーは、定常なビット速度(秒当りのビット数)を与えるように、構成されている。限界条件として、量子化により導入された量子化ノイズは、可能なら、そのエネルギーが音響信号の音響心理学マスキングしきい値または聞き手のしきい値を下回るように、選ばれる。周波数範囲中に量子化ノイズをセットする基本的な方法はスケールファクターを用いてノイズを「整形」することからなる。
【0017】
この目的のために、スペクトルはスペクトル係数のいくつかのグループに分割され、これがスケールファクター帯域と呼ばれ、それには個々のスケールファクターが付帯されている。スケールファクターはスケールファクター帯域中の全てのスペクトル係数の振幅を変えるのに用いる乗算値を示している。このメカニズムは、スペクトル範囲内で量子化により発生された量子化ノイズの割当てを設定するために、各スケールファクター帯域中の量子化ノイズのエネルギーがそのスケールファクター帯域中の音響心理学マスキングしきい値を下回るように、用いられる。
【0018】
量子化もエントロピーコード化も定常なビット速度は好ましくない。反対に、いずれも可変ビット速度が好ましい。しかし通信への応用にあっては、コーダーが出力端において定常なビット速度を有していることが必要とされる。定常なビット速度を与えるためには、いわゆるビット貯留器が通常利用される。
【0019】
外部ビット速度によるプリセットよりも少ないビットがコーダーの出力端で必要なようなステレオ音響信号の場合には、ビットはビット貯留器に付帯されて、コード化により多くのビットを必要とするステレオ音響信号セクターの場合により多くのビットを提供することができる。これによりビット貯留器は再び空にされる。
【0020】
そのようなコーダーのひとつの限界条件は定常なビット速度であり、他の限界条件は量子化ノイズが音響心理学マスキングしきい値以下であるということである。これによりステレオ音響信号によりマスクまたは覆われるのである。
【0021】
以下においてはコーダーの「内部ビット速度」が外部定常出力ビット速度とは異なる場合にいかにすべきかについて説明する。ビット貯留器が最大値までみたされるほどに、内 部ビット速度が低い場合には、問題はない。なぜなら、必要より細かく量子化できこれによりより多くのビットが量子化に必要となるように、量子化器が制御され得るからである。これは「外部」定常ビット速度に達するまで行われる。
【0022】
もっと重要なのはコーダーの「内部ビット速度」が出力により必要とされる定常ビット速度より高い場合である。ステレオ音響信号がコード化し難い場合、つまりコーダーがコード化のために多くのビットを充当する必要がある場合(コーダーの「高負荷」とも呼ばれる)に、これが起きる。変換コード化については、音片が比較的効率よくコード化され得る原理があるが、うるさい信号は、比較的高い量のエネルギーを有しており、さらに音声や打楽器やドラム音楽のような比較的複雑なスペクトルを有し、比較的低い程度のみに圧縮されるのである。
【0023】
信号が過渡的であっても、不規則な時間特性値を有した信号は、コード化アーチファクトが得られない場合には、比較的複雑な方法でのみコード化できるのである。過渡的信号の場合には、ウィンドー処理の間、大きなウィンドーから短いウィンドーに切り換えられ、よりよい時間解像度が得られるか、または量子化ノイズが少数の音響サンプル値に亙って「あいまい」となる。短いウィンドーの場合には、顕著に多くの副情報がある。
【0024】
出力ビット速度が充分であると判定しかつビット貯留器を「空に」したコーダーは、その内部ビット速度を「激しく」低減して定常出力ビット速度の基準を満たすいくつかの可能性を有している。ひとつの可能性としては、短いウィンドーへの切換えなしで済ますことである。しかし、これは可聴のコード化アーチファクトを生じる結果となる。
【0025】
他の可能性としては、量子化に際して意図的に音響心理的マスキングしきい値を撹乱して、必要よりも粗く量子化して、低いビットレートを得る方法がある。これもまた可聴撹乱となる。
【0026】
さらなる可能性としては、音響帯域幅を低くすることがある。つまり最早全体の音響帯域幅をコード化せずに、出力ビット速度に応じて、あるしきい値周波数より上のスペクトル値を0にセットして、出力ビット速度を低減する。この方法は可聴量子化撹乱を生じることはないが、ステレオ音響信号中の高周波数の損失につながる。しかしこの損失は可聴量子化ノイズほどには強く知覚されないのである。
【0027】
ステレオ音響信号を復号する際の特別な問題としては「音響アンマスキング」と呼ばれる効果がある。正常なL/Rコード化が使われた場合、左右のチャンネル信号はともにそれぞれ変換され、量子化されかつコード化される。これによりデータ低減のために左右のチャンネルに導入された量子化ノイズは他のチャンネルからは独立となる。つまり左右のチャンネル中の量子化ノイズは相関しないのである。
【0028】
左右のチャンネル信号が比較的同じである場合を考えると、すなわち復号後聞き手は例えば話し手が中央にいるようにこの信号を知覚する。
【0029】
「音響アンマスキング(すなわちマスクしない)」効果とは、2個のチャンネル内の量子化ノイズが相関しないが故に、左チャンネルの量子化ノイズは左側で、右チャンネルの量子化ノイズは右側で知覚される。しかしノイズに対しての高いマスキングは中央においてのみ起き、有用な信号は左右の側にはないのである。
【0030】
M/Sコード化は、そのデータ速度低減効果とは別に、左右のチャンネル中の量子化ノイズが互いに相関される特別な信号には有利であり、量子化ノイズは中央でも起きて、有用な信号でマスクされた非相関の場合におけるよりも基本的、完全または顕著によいのである。
【0031】
左右のチャンネル信号が同じでない場合は異なる。この場合M/Sコード化が使われると、ステレオ効果の故に、有用な信号は左右双方の側にあり、量子化ノイズはM/Sコード化の故に相関されて、中央にある。この場合も音響アンマスキングが起きるのである。
【0032】
最近より多くの拡張性音響コーダーが試されている。拡張性音響コーダーは、その出力側のビットストリームが少なくとも第1と第2のスケーリング層を有するように、構成されている。簡単に作られているデコーターはスケールビットストリームから第1のスケーリング層のみを取り、この層は例えば低減帯域幅のコード化音響信号または簡単なコード化アルゴリズムによりコード化された音響信号を含んでいる。
【0033】
ビットストリームから第1と第2のスケーリング層を取る他のデコーダーは、第1のスケーリング層を第1のデコーダーにより復号し、同様に第2のスケーリング層を復号し、後者の場合には、単独でまたは復号された第1のスケーリング層とともに、全帯域幅の音響信号を与える。
【0034】
拡張性コーダーはステレオ音響信号の分野では特に望まれている。なぜならこの分野では中央チャンネル信号であるモノ信号を第1のスケーリング層として使用でき、側部チャンネル信号は例えば第2のスケーリング層として使用できるからである。迅速な動作のために構成されたデコーダーはモノ信号のみを与えるが、よりよいデコーダーまたは通信速度が決定的なものではないデコーダーはモノまたは中央層とは別に側部層を取って、デコーダーの出力端に全ステレオ音響信号を発生する。
【0035】
スケーリング層の構造には種々の可能性がある。第1のスケーリング層は、第2のスケーリング層からまたは他のスケーリング層から、音響コード化方法自身において、音響帯域幅において、モノ/ステレオまたはそれらの品質基準や他の考えられる基準の組合せに関連する音響品質その他の事項において、異なってよい。高いコード化効率のために、第2のスケーリング層は最も少ない可能なビット数を有してもよく、第2のスケーリング層を復号するデコーダーができる限り第2のスケーリング層を使ってもよい。
【0036】
ステレオ音響信号のための拡張性コーダーを考えると、それは、第1のスケーリング層としてモノ信号である中央信号を与え、第2の層として側部チャンネル信号を与え、M/Sコード化を多く使うほど、その全体の効率がよい。しかしこの要求はある種のステレオ音響信号ではビット効率と両立しない。つまり高ステレオチャンネル信号分離を有したステレオ音響信号では両立しないのである。他方M/S処理はある種の「中立」拡張性を与えて、左右のチャンネルにおける量子化ノイズが相関するようになる。
【0037】
M/Sコード化に関して言及された問題は全て真実であり、より多くのコード化されるステレオ音響信号が急激にそのM/Sコード化に関してその特徴を変化させる。コード化されるステレオ音響信号は急激に左右のチャンネル信号が同じであるという特徴を最早有しない場合、M/Sコード化はそれ以上は施されない。量子化における撹乱の多分音響心理学聴取しきい値を越える増加および/またはコーダーの特定の実行に左右される音響帯域幅の低減が結果となろう。
【0038】
この発明の目的は少ない撹乱でステレオ音響信号を処理する装置と方法とを提供することにある。
【0039】
請求項1の装置および請求項2の方法により、この目的は達成される。
【0040】
この発明は、ステレオ音響信号においては、高い音響帯域幅および/または低い可聴撹乱を得るには、ステレオチャンネル信号分離が保たれていて、音響帯域幅が低減されるかまたは量子化により導入された撹乱が可聴となる場合に比べて、高ステレオチャンネル信号分離なしの方が望ましい、という理解に立脚している。
【0041】
経験的に言って、聞き手は可聴量子化撹乱を低ステレオチャンネル信号分離よりもより不快に知覚する。可聴量子化撹乱は一般に音響信号中で異質の要素であり、この発明により処理されたステレオ音響信号の聞き手は当初の信号のステレオチャンネル信号分離がいかなるものであったかを必ずしも知っている訳ではない。したがって低ステレオチャンネル信号分離をコード化アーチファクタとしては知覚しないのである。
【0042】
かくして、ステレオチャンネル信号分離における低減は、コーダーの出力側ビット速度を所定の値に低減するのに使われる。
【0043】
この発明の第1と第2のチャンネル信号を有したステレオ音響信号の処理装置は分析手段と修正手段とを有しており、分析手段はステレオ音響信号を分析してコード化アルゴリズムによりステレオ音響信号をコード化するのにコーダーが必要とするビット数の推定値を形成する。修正手段は第1、第2のチャンネル信号を修正して、修正第1、第2チャンネル信号を形成する。
【0044】
ビット数推定値が所定の推定値を越えかつ修正手段が、第1、第2の修正チャンネル信号の和信号(少なくとも信号のエネルギーと同様に変化する信号の特性値に応じて)が第1、第2のチャンネル信号の和信号に等しく、かつ第1、第2の差信号が第1、第2のチャンネル信号の差信号に比較して減衰されるように構成されている場合には、修正手段は分析手段に応答して作動する。
【0045】
エネルギーと同じ推移を有する特性値はエネルギーそれ自身であるが、例えばある期間におけるサンプル値の二乗の和、ある周波数範囲におけるスペクトル値の二乗の和、ある期間におけるサンプル値の大きさの和、ある周波数範囲におけるスペクトル値の二乗の和またはそれらの2個以上の組合せでもある。エネルギーはエネルギーと同じ推移を有した特性値と名づけられる。
【0046】
ステレオ音響信号の修正、すなわちチャンネル信号分離の低減は、信号のうるささが変動しない、という条件の下で行われる。低減されたチャンネル信号分離それ自身は復号された信号中に騒がしいアーチファクタを生じるものではないが、うるささの変動は生じる。第1、第2の(つまり左右の)チャンネル信号は、非修正第1、第2チャンネル信号に比べてうるささ(つまり和信号)がエネルギーに関する限りは(かつ、好ましくは信号に関する限りは)定常を保ち差信号が減衰されるように修正される。
【0047】
この発明のステレオ音響信号前処理は、ステレオ音響信号をコード化するのに必要なビット数があまりに高くなるか否かが判定されるか否か、を設定する。ステレオ音響信号をコード化するのに必要なビット数の推定値は違う手法でステレオ音響信号を分析することによりステレオ音響信号から引き出すことができる。
【0048】
まず最初に、ステレオ音響信号の中央、側部チャンネル信号は、エネルギー関係またはエネルギーの対数の差の故に、いかほどのビットが必要かについて判定するものと、考えられる。ビットの正確な数を判定することなしに、中央、側部のエネルギー関係が小さい場合(つまりチャンネル信号がほぼ同じサイズである場合)には、高い数のビットが必要となる。
【0049】
中央、側部チャンネル信号のエネルギー関係が低いほど、ある出力ビット速度を得るには、側部チャンネル信号のより高い減衰が必要となる。当初のステレオ音響信号が高いステレオチャンネル信号分離を有している場合、例えば左のチャンネル信号が高いエネルギーを有しており、右チャンネル信号が実質的にノイズを有している場合には、中央、側部チャンネル信号間の小さいエネルギー関係が存在する。
【0050】
しかし、話し手の音声が左チャンネル信号中にあり、他の話し手の音声が右チャンネル信号中にあり、左右のチャンネル信号が同じ量のエネルギーを有しており、しかし両チャンネル信号が相関していない場合、にも小さなエネルギー関係が存在する。この場合にも高いステレオ信号分離があり、中央、側部チャンネル信号はエネルギー対数の差が比較的小さいのである。
【0051】
中央、側部のチャンネル信号の性質とは独立なビット数の推定値を判定する可能性はコーダーそれ自身を考察することである。コーダーにより必要とされるビット数の推定値はいわゆる知覚的なエントロピー(PE)であって、有用なステレオ音響信号と有用なステレオ音響信号について計算された音響心理学マスキングしきい値との間のエネルギー関係に等しい。
【0052】
PEが大きいと、ステレオ音響信号は比較的低いマスキング能力を有している。しかしPEが小さいと、つまり有用な信号のエネルギーが音響心理学マスキングしきい値より若干上の場合には、有用な信号のみが粗っぽく量子化されて、量子化ノイズは音響心理学可聴しきい値の下に「隠され」る。
【0053】
左チャンネル信号のPEの和が好ましくはある期間に亘って平均され、右チャンネル信号については(好ましくはある期間に亘って平均される)所定の値より上であると判定されたら、この発明に沿って側部チャンネル信号が減衰されて、必要なビット数を低減する。
【0054】
この方法では中央、側部チャンネル信号の個々の態様を扱うものではなく、ステレオ音響信号それ自身を扱うのであって、これはM/Sコード化可能性ではなく、一般的な音響コード化可能性によるものであり、つまりコード化して目的とするビット速度を得る困難性なのである。
【0055】
第2の考え方を一般化すると、ビットの品質について他の量を推定値とするのであって、コーダーの「負荷」を明らかにするのである。そのような量としては例えば、音響信号の過渡的な特徴の故に音響コーダーが短いウィンドーを使うことを示す信号である。なぜなら短いウィンドーは、副情報が多いが故に、高いビット速度を必要とするからである。かくしてこの発明の目的のためには、音響コーダーの制御変数の全ての範囲を用いて、その推定値またはコーダーの出力ビット速度を低減するためにいかに強く側部チャンネル信号を減衰しなければならないかを見出すのである。
【0056】
この発明の好ましき実施例においては、側部チャンネル信号の経時増加または経時低減を行って、聞き手が直接に低減ステレオチャンネル信号分離を知覚することを防止し、ステレオチャンネル信号分離の低減が段々と行われるか、またはステレオチャンネル信号分離の増加が段々と行われるかのようにして、可能な限りステレオ音響信号の側部のコーダー側操作をなくするのである。
【0057】
修正に起因する非変動うるささについては、修正左右チャンネル信号の和信号は必ずしも非修正左右チャンネル信号の和信号に等しい必要はなくて、両和信号のエネルギーが実質的に等しいか、所定の関係にあれば充分である。聞き手は非修正ステレオ音響信号のうるささがいかに大きかったかを知らないから、うるささの高低への変化が前処理によって導入されても、それを攪乱としては知覚しないのである。実行の容易さの故に、この関係は1であるのが望ましい。
【0058】
ついで添付の図面によりこの発明を説明する。
【0059】
図1に示すこの発明の処理装置において、第1と第2のチャンネル信号L、Rの形であるステレオ音響信号は入力端10から装置に供給されて、一方では分析手段12に、他方では修正手段14に送られる。修正手段14は両チャンネル信号を修正して修正第1、第2チャンネル信号L’、R’を形成して出力端16に送り出す。一般に出力端16における修正第1、第2チャンネル信号L’、R’は入力端10における非修正チャンネル信号L、Rとは異なっており、出力端16における修正ステレオ音響信号は入力端10における非修正ステレオ音響信号より低いチャンネル信号分離を有している。
【0060】
分析手段12は図示しないコーダーによるビット数の推定値を見出して、コーダーによって提供されたコード化アルゴリズムによりステレオ音響信号をコード化する。このビット数の推定値は分析手段12から信号路18を介して修正手段14に供給される。このビット数の推定値が所定の推定値を越える場合には、修正手段14が起動して第1と第2のチャンネル信号L、Rを修正する。
【0061】
この発明においては、出力端16における修正ステレオ音響信号の和のエネルギーが入力端10における非修正ステレオ音響信号のエネルギーと所定の関係において望ましくは等しくなり、しかし側部チャンネル信号に対応する例えば0.5のファクターから離れた差信号が入力端10における非修正ステレオ音響信号と異なるように出力端16における修正ステレオ音響信号中に減衰される、ように第1、第2のチャンネル信号の修正が行われる。
【0062】
図1において、分析手段12に供給する2通りの可能性が示されているが、これらは個々に用いても組合せて用いてもよい。
【0063】
第1の可能性は図中左側に矢印15aで示されており、前方結合である。つまり分析手段は非修正信号L、Rが供給される。第2の可能性は修正信号L’、R’を分析手段12に供給するものである。
【0064】
特に側部信号の減衰が一次的に遅い場合には、減衰が現行の非修正信号に基づいて行われるか、それともフィードバック経路中の修正信号の最後に処理したブロックのひとつに基づいて行われるかは重要ではない。したがってステレオ音響信号それ自身が直接に分析されるか先行の修正信号の助けを借りて間接に分析されるかは無関係である。
【0065】
つぎに入力端10における非修正ステレオ音響信号の分析手段12の種々の構成について説明する。分析手段12は中央チャンネル信号と側部チャンネル信号とを形成するもので、中央チャンネル信号と側部チャンネル信号のエネルギーの関係を考察する。
【0066】
両チャンネル信号のエネルギー関係はある期間、例えば10音響フレームの尺度で平均されるのが望ましく、この期間はフレーム長が約20msのMPEG−2−AACコーダーが用いられたときには200msの値に相当する。該コーダーについては標準ISO/IEC13818−7に記載されており、音響コーダー、デコーダーの機能ブロックと相互作用が詳記されている。
【0067】
エネルギー関係または対数の差が応用分野に応じて判定されるある値(例えば6dB)より小さいと判定されたときには、修正手段14が起動されて図2に関して詳記するように側部チャンネル信号の減衰を行う。
【0068】
第1の発明によれば、分析手段12はステレオ音響信号のM/Sコード化可能性の直接審査により機能する。この実行に際しては、例えば両チャンネル信号がそのエネルギーおよび/または信号に関して互いに同じでないが故に、信号がよいM/Sコード化可能性を有していないならば、ステレオ音響信号処理装置は側部チャンネル信号を減衰するのみである。この場合初期のステレオチャンネル信号分離の維持があまりに高い出力ビットになり、ステレオチャンネル信号分離が高いならば、ステレオチャンネル信号分離は常に低減される。
【0069】
さらにこの発明においては、ステレオ音響信号があるM/Sコード化可能性を有しているか否かに拘わらず、側部チャンネル信号の減衰を用いて出力側コード化ビット速度を低減する。これにより低ステレオチャンネル信号分離の場合でも、さらに側部チャンネル信号の減衰を行えて、音響コーダーの所定の出力ビット速度を越えない。このために、音響信号のMSコード化可能性に関係なく、音響信号をコード化するのに必要なビット数が推定される。
【0070】
例えばMPEG−2−AAC音響コーダーなどの最近の音響コーダーは音響心理学的モデルを使って、コード化される音響信号の周波数依存音響心理学的マスキングしきい値を計算する。概説すると、音響心理学的モデルは各目盛係数帯域について音響心理学的マスキングしきい値としてエネルギー値を提供する。量子化器により導入される量子化ノイズがエネルギー値より低いかまたは量子化外乱により導入されるノイズがエネルギー値に等しい場合には、導入されたノイズは音響心理学理論に対応して基本的に非可聴である。
【0071】
エネルギー関係または音響信号の対数の差自身およびその音響心理学マスキングしきい値は知覚エントロピー(PE)とも呼ばれ、音響信号をコード化するのにどのくらい多くのビットが必要かについての推定値を与えるものである。PEが高いと、多くのビットが必要となる。なぜなら音響信号のマスキング能力は比較的低く、繊細な量子化を行わなければならないからである。PEが低いと、必要とされるビットは少ない。なぜなら音響信号が比較的よくマスクされ、粗い量子化のみが必要とされるからである。
【0072】
一実施例にあっては、ビット数の推定値はつぎのようにして判定される。個々のスケールファクター帯域についてのPE値が周波数に組み合わせ、つまり加算される。これは左右のチャンネル信号について行われる。左チャンネル信号についてのPE和は右チャンネル信号についてのPE和に加算される。
【0073】
この左右のチャンネル信号の加算PE値はフレームに必要とされるビットである。ついでこの加算PE値がある数(例えば10個)のフレームについて平均されるのが望ましく、これによりステレオ音響信号についての平均PE値が得られる。この平均PE値が経験的に定められた所定の値に等しいかより大きいと、乗算手段が作動して側部チャンネル信号を減衰する。
【0074】
一般にコーダーにより必要とされるビット数の推定値としてはいかなる他の制御された変数でも使えるのであって、この変数はコーダーの「負荷」の推定値を表わすものである。例えばコーダーの制御信号であって、ウィンドー処理を行うときには短いウィンドーの使用を信号化する。短いウィンドーを用いたウィンドー処理は高い数のビットを必要とする。なぜなら短いウィンドーは長いウィンドーのように多くのビットを省いてコード化できないからである。
【0075】
側部チャンネル信号の減衰量についていうと、種々費用の異なるものがある。一番簡単なのは、例えば経験的に確定できる所定の減衰値を特定する方法である。減衰値を適応可能に判定する方法もあり、所定のインクレメント量により側部チャンネル信号を減衰し、ついでビット数がすでに充分に低減されたか否かを観察する。
【0076】
ついで他のインクレメント減衰量の新たな相互作用ループに入って、ビット数がすでに充分に低くなっているか否かを判定する。コーダーにより必要とされるビット数が目的とする範囲にあるまでもの処理を繰り返す。しかし適応性減衰調整の場合の計算時間と実行経費とは所定の減衰より著しく高いことが知られている。他方適応性減衰調整は最善で最も正確な結果を与える。
【0077】
ついで図2に修正手段14の好ましき実施例を示す。図において、修正手段14は第1のチャンネル信号Lのための第1の入力端20aと第2のチャンネル信号Rのための第2の入力端20bとを有している。また修正手段14は第1のチャンネル信号Lをファクターxで乗算する第1の乗算器22aと第1のチャンネル信号Lをファクターyで乗算する第2の乗算器22bと、第2のチャンネル信号Rをファクターxで乗算する第3の乗算器と、第2のチャンネル信号Rをファクターyで乗算する第4の乗算器22dとを有している。
【0078】
さらに修正手段14は第1の乗算器22aの出力信号と第4の乗算器22dの出力信号とを加算する第1の加算器24aと、第2の乗算器22bの出力信号と第3の乗算器22cの出力信号とを加算する第2の加算器24bとを有している。修正第1チャンネル信号L’は第1の加算器24aの出力端26aに出され、修正第2チャンネル信号R’は第2の加算器24bの出力端26bに出される。
【0079】
減衰側部チャンネル信号を得るための2個の乗算ファクターx、yの判定をつぎに説明する。出力端26a、26bにおける中央チャンネル信号は図2における修正手段14の入力端20a、20bに等しい。修正手段14により実行される信号処理にはつぎの行列が用いられる。
【0080】
【式2】
【0081】
xとyとを判定すべくつぎが行われる。
【0082】
【式3】
【0083】
加えて以下が行われる。
【0084】
【式4】
【0085】
結果はつぎの通りである。
【0086】
【式5】
【0087】
Mは処理により修正されないので、つぎの等式が成り立つ。
【0088】
【式6】
【0089】
側部チャンネル信号に関しては、つぎのようになる。
【0090】
【式7】
【0091】
等式(7)の結果は、Sがファクター(x−y)で減算されるか、または対数的には10・log10(x−y)dB=att.により減衰される。attは減衰を表わし0dBより小である。
【0092】
dBステップにおける減衰についてはつぎが適用される。
【0093】
【式8】
【0094】
この式(8)からつぎのようになる。
【0095】
【式9】
【0096】
等式(6)と(9)の結果は、等式(10)についてはxであり、等式(11)についてはyである。
【0097】
【式10】
【0098】
減衰「att」(dBにおいて)は上記の制御変数のいずれかに基づいて判定される。等式(9)、(10)において、ファクターx、yは図2の減衰行列を結果し、等式の形で、等式(1)、(2)を反映している。
【0099】
実行および計算の経費を省くべく、減衰attの適応性調整を全て行う必要はなく、ビット数の推定値が所定のしきい値を越えていたら、経験的に確立された判定減衰値を使うことができる。
【0100】
この発明では、例えば話し手が最初左側にいて急に中央で聞き取る場合など、チャンネル信号分離の低減が急激に行われると、聴者の側で音響外乱や驚きが生じるので、減衰は急激には増加されない。
【0101】
側部チャンネル信号が減衰されると判定された場合には、側部チャンネル信号の徐々な減衰は、例えば所定の増し分値を用いて行われる。この際には話題の話し手がゆっくりと左側から中央へと「移動」する。
【0102】
これとは反対に、ビット数の推定値が所定の値より小さい場合には、減衰を急激に停止することはなく、ゆっくりとゼロに戻す。この際には例えば話し手が中央から左側にゆっくりと「移動」する。かかる徐々の減衰または段階的な減衰除去はできるだけゆっくりと行って、側部チャンネル信号の減衰が実際には知覚されないようにする。しかし減衰の低減はある程度は早くして、出力端における高いビット速度の故に、コーダーが音響心理学的マスキングしきい値を妨害したりまたは音響帯域幅を除いたりしないようにする。
【0103】
この発明においては、コーダー中にビット貯留機構が有り、これを完全に利用して、目的値に達するまで減衰をゆっくりと増加させる。この際減衰が高いので、コーダーの出力端において所定のビット速度が保たれる。減衰が再び停止されたら、ビット貯留機構が再び空にされる。
【0104】
図2の処理において、x、yを判定する限界条件は、中央チャンネル信号に対応する和信号が、ファクター0.5を除いて、変更されないようなものである。しかし信号は想像可能であって、左右のチャンネル信号は同じであるが、互いに位相が180度ずれている。そのような信号はしばしば見られるものではない。なぜならそれらはモノ再生装置によって表現できないからである。
【0105】
にも拘わらず、そのような信号は想像可能である。この場合、中央チャンネル信号Mは小さくなり、側部チャンネル信号Sはより大きくなる。もし側部チャンネル信号Sが中央チャンネル信号Mより小さくなるほどに強く減衰されると、全体の音の大きさが強く影響される。しかしステレオチャンネル信号分離の低減とは反対に、音響信号そのものには関係なく、音が強く振動すると聞き手は耐えられないものとなり、苦痛と感じるようになる。
【0106】
この問題を除くべく、分析手段12中に、信号LとRとの位相差が180度付近であるか否かを分析することを確立することを追加するのが望ましい。これが確立されたら、信号Rの符号は反転できる。しかし当初望まれた三次元音響効果は失われるが、うるささの低減効果が防止され、聞き手をあまり悩まさない。
【0107】
信号反転に代えて、Mチャンネル信号を修正手段中または下流コーダーステージ中の所定の値に増幅して、修正Mチャンネル信号のエネルギーが非修正ステレオ音響信号のMチャンネル信号のエネルギーと所定の関係になるようにする。エネルギー関係については、1の値が望ましく、修正手段によりある増幅または減衰が行われる。しかし非修正ステレオ音響信号に対する関係は常に実質的に維持されなければならない。これにより聞き手は前処理によるうるささの波動を感じない。実際うるささの小さな波動は問題ではなく、ときには感知されないこともある。しかしうるささの大きな波動は聞き手にとっては苦痛となる。
【0108】
ステレオ音響信号を処理するために時間的に不連続なサンプル値とスペクトル値のいずれがこの発明の装置の入力端10に印加されるかは重要なことではないことが判った。ステレオ音響信号を分析するための全ての処理は不連続なサンプル値とスペクトル値の双方で行えるのである。また修正手段中での処理も全て不連続なサンプル値とスペクトル値の双方で行えるのである。
【0109】
この発明のステレオ音響信号を処理する装置は、例えばMPEG音響コーダーなどの時間/周波数変換型コーダーの時間/周波数変換ステージの後に配置することもできる。このことからして、音響前処理は周波数選択方法でもできるという可能性が出てくる。例えば信号Sの異なる減衰が周波数に応じて行える。
【0110】
人間の聴覚による方向発見の可能性は全ての周波数について等しく敏感ではないから、このことは特に実際的である。この発明の処理がスペクトル値に基づいて行われる場合には、人間の聴覚がある周波数範囲で方向に依存して聞くのが少ないほど、側部チャンネル信号のスペクトル値は強く減衰できる。人間の聴覚がより方向発見を与えるような周波数範囲にあるスペクトル値はほとんど変えられないかまたはほんの少しだけ変えられるのである。
【0111】
最近の音響コーダーでは周波数が関する限りではいわゆるM/Sマスクを用いることが確立されていて、M/Sコード化が行われ、L/Rコード化の方がよいのである。この場合この発明の処理はMSコード化が存在する、すなわちMSマスクがセットされている周波数範囲に適用される。これに代えて、MSマスクはMSコード化が行われるより多くの帯域にもセットされて、公知の方法に比べて、それらの追加のMS帯域において側部チャンネル信号が減衰されてビット速度への要求に応じるようになる。
【0112】
以下図3に示すステレオ音響信号処理装置においては、MSコーダー30とビットストリームBSを出力する拡張性コーダー32とが設けられている。周知のように、MSコーダー30は加算器30aを有しており、これが修正左右のチャンネル信号L’、R’を加算して、乗算器30bによる乗算後に乗算中央チャンネル信号を発生して、これに例えば0.5のファクターが付帯される。
【0113】
加えて、MSコーダー30は減算器30cと乗算器30dとを有していて、修正側部チャンネル信号S’を発生し、入力端10での修正ステレオ音響信号から形成された側部信号とは対照的に、減衰される。中央チャンネル信号M’と側部チャンネル信号S’とはともに好ましくはモノ−ステレオ拡張性を具えた拡張性コーダー32に供給される。第1のスケーリング層はモノ信号M’を表わし、第2のスケーリング層は修正側部チャンネル信 号S’を含んでいる。
【0114】
さらなる拡張の可能性がある。すなわち修正または非修正モノチャンネル信号M’が帯域制限されて、第2のスケーリング層中には修正側部チャンネル信号とは別に上側モノ帯域が含まれる。
【0115】
LRコード化は使われないがMSコード化が使われる場合には、モノ−ステレオコーダー32中における拡張可能性の効果は特に好ましい。分析手段12と修正手段14とによるこの発明の音響信号処理は拡張性コーダー32と組み合せると特に有利である。モノ−ステレオ拡張可能性を得るべく、LRコード化とは比較して好ましくないにしても、MSコード化を利用できる。これはコーダー32の入力端における側部チャンネル信号は非修正信号とは対照的に減衰されるからである。
【0116】
図3においてコーダー32から分析手段12までの破線信号路36が示されている。この信号路36は、入力端10におけるステレオ音響信号をコード化する拡張性コーダーにより必要とされるビット数の推定値を引出して、分析手段12においては直接計算される必要がなく、ウィンドー使用の基準である周辺エントロピーPEのような拡張コーダーから分析手段12に出力される、操作を示している。すなわちそれらの機能ブロックは分析手段12中にもコーダー32中にもある必要はなく、コーダー32における実行だけで充分なのである。
【0117】
この場合、修正手段14はビット数について推定値18を判定するために修正を行わない。ある意味では図3に示す手段は「前モード」にあり、ビットストリームは書き込まれていないが、側部チャンネル信号に必要とされる減衰程度のみが判定される。拡張性コーダーによりビットストリームBSが書き込まれる以下のコード化モードにおいては、修正手段14はファクターx、yを用いて機能する。
【0118】
図3に示す手段が第1と第2のチャンネル信号L、Rについてのスペクトル値で操作され、拡張性コーダーが時間/周波数変換コーダーであるならば、時間/周波数変換を行う拡張性コーダー32の段階は、入力端10の上流側である。分析手段12と修正手段14およびMSコーダー30はコーダー32中に内蔵できる。
【0119】
信号路36a、36bは修正チャンネル信号がM/Sコード化なしに拡張性コーダーに送られ得ることを示しており、これによりM/Sコード化またはL/Rコード化がより好ましいかどうかを確認している。
【図面の簡単な説明】
【図1】 この発明のステレオ音響信号処理装置の原理的構成を示すブロック線図である。
【図2】 修正装置の構成を示す詳細図である。
【図3】 前処理段階における装置を示すブロック線図である。
【符号の説明】
10:入力端
12:分析手段
14:修正手段
16:出力端
Claims (2)
- 第1のチャンネル信号(L)と第2のチャンネル信号(R)とを有したステレオ音響信号を処理して、修正第1のチャンネル信号(L’)と修正第2のチャンネル信号(R’)とを有し符号化アルゴリズムを用いているエンコーダーに入力される修正ステレオ信号を得る装置であって、分析手段(12)と前記分析手段に接続される修正手段(14)とを有し、前記分析手段は前記ステレオ音響信号または前記修正ステレオ信号を分析して符号化アルゴリズムを用いて前記ステレオ音響信号を符号化するエンコーダー(32)により必要とされるビット数の推定値を得て、前記修正手段は前記第1・第2のチャンネル信号(L、R)を修正して修正第1・第2のチャンネル信号(L’、R’)を得て、前記修正手段(14)が前記分析手段(12)に応答してビット数の前記推定値(18)が所定の推定値を越えたときに前記修正手段がアクティブとなり、さらに前記修正手段(14)は、前記修正第1・第2のチャンネル信号を加算することにより得られる和信号の特性値がその和信号のエネルギーに等しく、かつ前記第1・第2のチャンネル信号(L、R)を加算することにより得られる和信号の特性値に基本的に等しく、かつ前記修正第1・第2のチャンネル信号(L’、R’)間の差信号が前記第1・第2のチャンネル信号(L、R)間の差信号と比較して減衰されるように構成され、
前記修正手段(14)は、前記第1のチャンネル信号(L)に第1の因数(x)を乗算する第1の乗算器(22a)と、前記第1のチャンネル信号(L)に第2の因数(y)を乗算する第2の乗算器(22b)と、前記第2のチャンネル信号(R)に第1の因数(x)を乗算する第3の乗算器(22c)と、前記第2のチャンネル信号(R)に第2の因数(y)を乗算する第4の乗算器(22d)と、前記第1の乗算器(22a)の出力信号と前記第4の乗算器(22d)の出力信号とを加算して修正第1のチャンネル信号(L’)を発生する第1の加算器(24a)と、前記第3の乗算器(22c)の出力信号と前記第2の乗算器(22b)の出力信号とを加算して修正第2のチャンネル信号(R’)を発生する第2の加算器(24b)とを有し、かつ前記第1・第2の因数(x、y)は、前記第1・第2のチャンネル信号を加算することにより得られる和信号の特性値と前記修正第1・第2のチャンネル信号を加算することにより得られる和信号の特性値とが実質的に等しくさらに前記修正第1・第2のチャンネル信号間の差信号が前記第1・第2のチャンネル信号間の差信号より減衰されるように、選択されることを特徴とする装置。 - 音響信号処理装置によって第1のチャンネル信号(L)と第2のチャンネル信号(R)とを有したステレオ音響信号を処理して、修正第1のチャンネル信号(L’)と修正第2のチャンネル信号(R’)とを有し符号化アルゴリズムを用いているエンコーダーに入力される修正ステレオ信号を得る方法であって、
前記音響信号処理装置は分析手段(12)と前記分析手段に接続される修正手段(14)とを有し、
前記方法は、
前記分析手段により前記ステレオ音響信号または前記修正ステレオ信号を分析して符号化アルゴリズムを用いて前記ステレオ音響信号を符号化するエンコーダー(32)により必要とされるビット数の推定値を得るステップと、
前記修正手段により前記第1・第2のチャンネル信号(L、R)を修正して修正第1・第2のチャンネル信号(L’、R’)を得るステップであって、前記修正手段(14)が前記分析手段(12)に応答してビット数の前記推定値(18)が所定の推定値を越えたときに前記修正手段がアクティブとなり、さらに前記修正手段(14)により、前記修正第1・第2のチャンネル信号を加算することにより得られる和信号の特性値がその和信号のエネルギーに等しく、かつ前記第1・第2のチャンネル信号(L、R)を加算することにより得られる和信号の特性値に基本的に等しく、かつ前記修正第1・第2のチャンネル信号(L’、R’)間の差信号が前記第1・第2のチャンネル信号(L、R)間の差信号と比較して減衰されるステップとを備え、
前記修正手段(14)は、第1の乗算器(22a)と、第2の乗算器(22b)と、第3の乗算器(22c)と、第4の乗算器(22d)と、第1の加算器(24a)と、第2 の加算器(24b)とを有し、
前記修正第1・第2のチャンネル信号(L’、R’)を得るステップは、前記第1の乗算器(22a)により前記第1のチャンネル信号(L)に第1の因数(x)を乗算するステップと、前記第2の乗算器(22b)により前記第1のチャンネル信号(L)に第2の因数(y)を乗算するステップと、前記第3の乗算器(22c)により前記第2のチャンネル信号(R)に第1の因数(x)を乗算するステップと、前記第4の乗算器(22d)により前記第2のチャンネル信号(R)に第2の因数(y)を乗算するステップと、前記第1の加算器(24a)により前記第1の乗算器(22a)の出力信号と前記第4の乗算器(22d)の出力信号とを加算して修正第1のチャンネル信号(L’)を発生するステップと、前記第2の加算器(24b)により前記第3の乗算器(22c)の出力信号と前記第2の乗算器(22b)の出力信号とを加算して修正第2のチャンネル信号(R’)を発生するステップとを備え、かつ前記第1・第2の因数(x、y)は、前記第1・第2のチャンネル信号を加算することにより得られる和信号の特性値と前記修正第1・第2のチャンネル信号を加算することにより得られる和信号の特性値とが実質的に等しくさらに前記修正第1・第2のチャンネル信号間の差信号が前記第1・第2のチャンネル信号間の差信号より減衰されるように、選択されることを特徴とする方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| DE19959156.3 | 1999-12-08 | ||
| DE19959156A DE19959156C2 (de) | 1999-12-08 | 1999-12-08 | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
| PCT/EP2000/012352 WO2001043503A2 (de) | 1999-12-08 | 2000-12-07 | Verfahren und vorrichtung zum verarbeiten eines stereoaudiosignals |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007165445A Division JP4579273B2 (ja) | 1999-12-08 | 2007-06-22 | ステレオ音響信号の処理方法と装置 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2003516555A JP2003516555A (ja) | 2003-05-13 |
| JP4000261B2 true JP4000261B2 (ja) | 2007-10-31 |
Family
ID=7931846
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001543072A Expired - Lifetime JP4000261B2 (ja) | 1999-12-08 | 2000-12-07 | ステレオ音響信号の処理方法と装置 |
| JP2007165445A Expired - Lifetime JP4579273B2 (ja) | 1999-12-08 | 2007-06-22 | ステレオ音響信号の処理方法と装置 |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007165445A Expired - Lifetime JP4579273B2 (ja) | 1999-12-08 | 2007-06-22 | ステレオ音響信号の処理方法と装置 |
Country Status (6)
| Country | Link |
|---|---|
| US (1) | US7260225B2 (ja) |
| EP (1) | EP1230827B1 (ja) |
| JP (2) | JP4000261B2 (ja) |
| AT (1) | ATE251376T1 (ja) |
| DE (2) | DE19959156C2 (ja) |
| WO (1) | WO2001043503A2 (ja) |
Families Citing this family (29)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE19959156C2 (de) * | 1999-12-08 | 2002-01-31 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
| SE519985C2 (sv) * | 2000-09-15 | 2003-05-06 | Ericsson Telefon Ab L M | Kodning och avkodning av signaler från flera kanaler |
| DE10102159C2 (de) * | 2001-01-18 | 2002-12-12 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen bzw. Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkasse, Codierer und skalierbarer Codierer |
| US7079657B2 (en) * | 2002-02-26 | 2006-07-18 | Broadcom Corporation | System and method of performing digital multi-channel audio signal decoding |
| US6832078B2 (en) * | 2002-02-26 | 2004-12-14 | Broadcom Corporation | Scaling adjustment using pilot signal |
| US6859238B2 (en) * | 2002-02-26 | 2005-02-22 | Broadcom Corporation | Scaling adjustment to enhance stereo separation |
| US8086448B1 (en) * | 2003-06-24 | 2011-12-27 | Creative Technology Ltd | Dynamic modification of a high-order perceptual attribute of an audio signal |
| EP1492084B1 (en) * | 2003-06-25 | 2006-05-17 | Psytechnics Ltd | Binaural quality assessment apparatus and method |
| US7620545B2 (en) * | 2003-07-08 | 2009-11-17 | Industrial Technology Research Institute | Scale factor based bit shifting in fine granularity scalability audio coding |
| SE527670C2 (sv) * | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
| JP4555299B2 (ja) * | 2004-09-28 | 2010-09-29 | パナソニック株式会社 | スケーラブル符号化装置およびスケーラブル符号化方法 |
| RU2007120056A (ru) | 2004-11-30 | 2008-12-10 | Мацусита Электрик Индастриал Ко. | Устройство стереокодирования, устройство стереодекодирования и способы стереокодирования и стереодекодирования |
| EP1818910A4 (en) * | 2004-12-28 | 2009-11-25 | Panasonic Corp | SCALABLE CODING DEVICE AND SCALABLE CODING METHOD |
| KR100682915B1 (ko) * | 2005-01-13 | 2007-02-15 | 삼성전자주식회사 | 다채널 신호 부호화/복호화 방법 및 장치 |
| EP1852689A1 (en) * | 2005-01-26 | 2007-11-07 | Matsushita Electric Industrial Co., Ltd. | Voice encoding device, and voice encoding method |
| ES2347274T3 (es) * | 2005-03-30 | 2010-10-27 | Koninklijke Philips Electronics N.V. | Codificacion de audio multicanal ajustable a escala. |
| EP1949369B1 (en) * | 2005-10-12 | 2012-09-26 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding/decoding audio data and extension data |
| JP2007183528A (ja) * | 2005-12-06 | 2007-07-19 | Fujitsu Ltd | 符号化装置、符号化方法、および符号化プログラム |
| US7734053B2 (en) | 2005-12-06 | 2010-06-08 | Fujitsu Limited | Encoding apparatus, encoding method, and computer product |
| US8332216B2 (en) * | 2006-01-12 | 2012-12-11 | Stmicroelectronics Asia Pacific Pte., Ltd. | System and method for low power stereo perceptual audio coding using adaptive masking threshold |
| US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
| US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
| JP4698688B2 (ja) | 2007-02-27 | 2011-06-08 | シャープ株式会社 | 送受信方法、送受信装置及びプログラム |
| US8064624B2 (en) * | 2007-07-19 | 2011-11-22 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for generating a stereo signal with enhanced perceptual quality |
| BR112012025863B1 (pt) * | 2010-04-09 | 2020-11-17 | Dolby International Ab | sistema decodificador e método de decodificação para codificação estéreo por predição complexa baseada em mdct |
| FR2966634A1 (fr) * | 2010-10-22 | 2012-04-27 | France Telecom | Codage/decodage parametrique stereo ameliore pour les canaux en opposition de phase |
| CN117542365A (zh) | 2016-01-22 | 2024-02-09 | 弗劳恩霍夫应用研究促进协会 | 用于具有全局ild和改进的中/侧决策的mdct m/s立体声的装置和方法 |
| CN109389984B (zh) * | 2017-08-10 | 2021-09-14 | 华为技术有限公司 | 时域立体声编解码方法和相关产品 |
| CN111370032B (zh) * | 2020-02-20 | 2023-02-14 | 厦门快商通科技股份有限公司 | 语音分离方法、系统、移动终端及存储介质 |
Family Cites Families (18)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| DE2511026A1 (de) * | 1975-03-13 | 1976-09-16 | Siemens Ag | Schaltungsanordnung zur kontinuierlichen basisbreiteneinstellung in einem stereodecoder |
| GB2244629B (en) * | 1990-05-30 | 1994-03-16 | Sony Corp | Three channel audio transmission and/or reproduction systems |
| KR100263599B1 (ko) * | 1991-09-02 | 2000-08-01 | 요트.게.아. 롤페즈 | 인코딩 시스템 |
| DE4229654A1 (de) * | 1991-09-25 | 1993-04-22 | Thomson Brandt Gmbh | Verfahren zur uebertragung eines audio- und/oder videosignals |
| US5228093A (en) * | 1991-10-24 | 1993-07-13 | Agnello Anthony M | Method for mixing source audio signals and an audio signal mixing system |
| US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
| US5278909A (en) * | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
| EP0688113A2 (en) * | 1994-06-13 | 1995-12-20 | Sony Corporation | Method and apparatus for encoding and decoding digital audio signals and apparatus for recording digital audio |
| JPH08123488A (ja) * | 1994-10-24 | 1996-05-17 | Sony Corp | 高能率符号化方法、高能率符号記録方法、高能率符号伝送方法、高能率符号化装置及び高能率符号復号化方法 |
| JPH08289900A (ja) | 1995-04-20 | 1996-11-05 | Jiyunko Tairiyou | 遠赤外線放射カイロ |
| GB9509831D0 (en) * | 1995-05-15 | 1995-07-05 | Gerzon Michael A | Lossless coding method for waveform data |
| US5825830A (en) * | 1995-08-17 | 1998-10-20 | Kopf; David A. | Method and apparatus for the compression of audio, video or other data |
| US5870480A (en) * | 1996-07-19 | 1999-02-09 | Lexicon | Multichannel active matrix encoder and decoder with maximum lateral separation |
| US6345246B1 (en) * | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
| JPH1132399A (ja) * | 1997-05-13 | 1999-02-02 | Sony Corp | 符号化方法及び装置、並びに記録媒体 |
| US6356211B1 (en) * | 1997-05-13 | 2002-03-12 | Sony Corporation | Encoding method and apparatus and recording medium |
| EP1057292B1 (en) * | 1998-02-21 | 2004-04-28 | STMicroelectronics Asia Pacific Pte Ltd. | A fast frequency transformation techique for transform audio coders |
| DE19959156C2 (de) * | 1999-12-08 | 2002-01-31 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Verarbeiten eines zu codierenden Stereoaudiosignals |
-
1999
- 1999-12-08 DE DE19959156A patent/DE19959156C2/de not_active Expired - Lifetime
-
2000
- 2000-12-07 US US10/149,248 patent/US7260225B2/en not_active Expired - Lifetime
- 2000-12-07 AT AT00985148T patent/ATE251376T1/de active
- 2000-12-07 JP JP2001543072A patent/JP4000261B2/ja not_active Expired - Lifetime
- 2000-12-07 EP EP00985148A patent/EP1230827B1/de not_active Expired - Lifetime
- 2000-12-07 DE DE50003945T patent/DE50003945D1/de not_active Expired - Lifetime
- 2000-12-07 WO PCT/EP2000/012352 patent/WO2001043503A2/de not_active Ceased
-
2007
- 2007-06-22 JP JP2007165445A patent/JP4579273B2/ja not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| JP2007316658A (ja) | 2007-12-06 |
| US7260225B2 (en) | 2007-08-21 |
| EP1230827B1 (de) | 2003-10-01 |
| JP4579273B2 (ja) | 2010-11-10 |
| WO2001043503A3 (de) | 2002-05-10 |
| DE19959156C2 (de) | 2002-01-31 |
| ATE251376T1 (de) | 2003-10-15 |
| WO2001043503A2 (de) | 2001-06-14 |
| DE50003945D1 (de) | 2003-11-06 |
| JP2003516555A (ja) | 2003-05-13 |
| EP1230827A2 (de) | 2002-08-14 |
| US20030091194A1 (en) | 2003-05-15 |
| DE19959156A1 (de) | 2001-06-28 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4000261B2 (ja) | ステレオ音響信号の処理方法と装置 | |
| KR100666815B1 (ko) | 스테레오 신호 또는 멀티채널 신호의 채널을 발생하는 잔향기 및 잔향방법 | |
| KR100913987B1 (ko) | 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 | |
| CN101816040B (zh) | 生成多声道合成器控制信号的设备和方法及多声道合成的设备和方法 | |
| KR100933548B1 (ko) | 비상관 신호의 시간적 엔벨로프 정형화 | |
| KR101192241B1 (ko) | 입력 데이터 스트림의 믹싱과 그로부터 출력 데이터 스트림의 생성 | |
| US8081764B2 (en) | Audio decoder | |
| JP5140684B2 (ja) | 高齢又は聴覚障害聴取者のための非スピーチオーディオに対するスピーチオーディオの改善された比率 | |
| JPH0816195A (ja) | ディジタルオーディオ符号化方法及び装置 | |
| KR20230084232A (ko) | 오디오 파라미터의 양자화 | |
| JPH0869298A (ja) | 再生装置 | |
| Schuler | Audio Coding |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051027 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051206 |
|
| A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20060227 |
|
| A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20060306 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060605 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20060606 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060711 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20061108 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20070130 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070515 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070622 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070724 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070813 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4000261 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100817 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110817 Year of fee payment: 4 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110817 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120817 Year of fee payment: 5 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120817 Year of fee payment: 5 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130817 Year of fee payment: 6 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| EXPY | Cancellation because of completion of term |