[go: up one dir, main page]

JP4444295B2 - 情報信号を量子化するための方法および装置 - Google Patents

情報信号を量子化するための方法および装置 Download PDF

Info

Publication number
JP4444295B2
JP4444295B2 JP2006552545A JP2006552545A JP4444295B2 JP 4444295 B2 JP4444295 B2 JP 4444295B2 JP 2006552545 A JP2006552545 A JP 2006552545A JP 2006552545 A JP2006552545 A JP 2006552545A JP 4444295 B2 JP4444295 B2 JP 4444295B2
Authority
JP
Japan
Prior art keywords
value
values
speech
filter
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2006552545A
Other languages
English (en)
Other versions
JP2007522509A (ja
Inventor
ゲラルド シューラー
シュテファン ヴァブニック
イェンス ヒルシュフェルト
ヴォルフガング フィーゼル
Original Assignee
フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ filed Critical フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ
Publication of JP2007522509A publication Critical patent/JP2007522509A/ja
Application granted granted Critical
Publication of JP4444295B2 publication Critical patent/JP4444295B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Radar Systems Or Details Thereof (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)

Description

本発明は、一般的に、量子化器あるいは情報信号の量子化に関し、具体的には、例えば音声信号のデータ圧縮、あるいは音声コード化で用いられる音声信号の量子化に関する。もっと具体的に言えば、本発明は短い遅延時間での音声コード化に関する。
現在のところ最もよく知られた音声圧縮方法はMPEG−1レイヤIIIである。この圧縮方法を用いて、音声信号のサンプル値、あるいは音声値が、非可逆的にコード化信号にコード化される。別の言い方をすれば、圧縮されると、当初の音声信号の不要成分や冗長度が減少し、理想的にはそれが取り除かれる。これを達成するため、同時および継時マスキングが心理音響モデルで認識される。すなわち、音声信号に応じ時間的に変化するマスキングしきい値が計算、あるいは判定される。このしきい値は、ある周波数の音調に対しどれくらいの音量から人に聴こえるようになるかを示す値である。この情報は、次に、マスキングしきい値に応じて、さらに正確な、あるいはそれほど正確でない、あるいは全く正確でない方法で音声信号のスペクトル値を量子化し、これをコード化信号に統合することによって、信号のコード化を行うために用いられる。
例えば、MP3様式といった音声圧縮方法では、一方で圧縮方式において、他方でできるだけ遅延時間を小さくするという点で、ビットレート制限送信チャネル経由で音声データが転送される場合の適用性に制限がある。一部の適用例では、遅延時間は、例えば、音声情報を保存する場合に影響を与えない。しかしながら、時に応じて「超低遅延符号器」と呼ばれる遅延の小さな音声符号器は、例えば電話会議、無線ラウドスピーカあるいはマイクロホンといった最優先で音声信号が送信される場合に必要とされる。これらの応用例について、G.シューラ(Schuller)らによる記事「適応性プレ・ポストフィルタを用いた知覚的音声コード化およびロスレス圧縮」,言語および音声処理に関するIEEEトランザクション,vol.10,no.6、2002年9月,379乃至390ページが、不要成分削減および冗長度削減が1つの変換に基づいて行われず、2つの別個の変換に基づいて行なわれる場合の音声コード化を示している。
原理については、図12および13を続けて参照しながら論じる。音声値あるいはサンプル値906の列904として示されているサンプリング済みの音声信号902でコード化が開始されるが、ここでは音声値906の時間順が矢印908で示されている。聴取しきい値は、昇順で「ブロック#」と示されている音声値906の連続ブロックに対し心理音響モデルを用いることによって計算される。例えば、図13は、周波数fに対する図であり、128個の音声値906の信号ブロックのスペクトルを示したものがグラフaであり、心理音響モデルで計算されたマスキングしきい値を対数単位で示したものがグラフbである。マスキングしきい値は、すでに述べたとおり、どの強さまでその周波数が人の耳で聞くことができないのかを示しており、すなわち、マスキングしきい値bより低い全ての音が聞こえないことを示している。各ブロックに対して計算した聴取しきい値に基づき、量子化器の前にある制御パラメータ化可能フィルタを制御することで不要成分を削減することができる。パラメータ化可能フィルタでは、パラメータ化値が、その周波数応答とマスキングしきい値の大きさの逆数とを対応させるように計算される。このパラメータ化値は図12においてx#(i)で示される。
音声値906のフィルタリング後、例えば、次の整数までの丸め操作といった、一定のステップサイズの量子化が行われる。これで発生する量子化ノイズはホワイトノイズである。復号器側では、フィルタ通過信号は、パラメータ化可能フィルタにより再度「再変換」され、その伝達関数は、そのマスキングしきい値の大きさに設定される。フィルタ通過信号がこれで再び復号されるだけでなく、復号器側での量子化ノイズについてもマスキングしきい値の形態あるいは形状に対して調節される。量子化ノイズをできるだけ正確にマスキングしきい値に対応させるため、量子化前にフィルタ通過信号に適用される増幅値a#が各パラメータセットあるいは各パラメータ化値に対し符号器側で計算される。復号器側で再変換を行うために、増幅値aおよびパラメータ化値xが、実際の主データすなわち量子化フィルタ通過音声値912とは別にサイド情報910として符号器に転送される。冗長度削減914では、このデータ、すなわちサイド情報910および主データ912に対し、ロスレス圧縮、すなわちコード化信号が得られる方法であるエントロピーコード化が行われる。
前記ではブロック長として128個のサンプル値906のサイズを示している。このため、32kHzのサンプリングレートで8ミリ秒といった比較的短い遅延が可能になる。詳細な実施を参照すると、そこには、サイド情報コード化の効率を上げるため、サイド情報、すなわち係数x#およびa#は、以前に伝送されたパラメータセットと比較して十分な変化がある場合、すなわち変化が、あるしきい値を超える場合にだけ伝送される点が示されている。さらに、実施の際は、現在のパラメータセットが各ブロックに属するサンプル値すべてに直接適用されないようにしつつ、フィルタ係数x#の直線補間を用いて可聴アーチファクトを避けるようにすることが好ましい点が説明されている。フィルタ係数の直線補間を行なうためには、不安定性の発生を防止するよう、フィルタ係数に対して格子構造が示唆されている。さらに記載には、制御されたビットレートをもつコード化信号が望ましい場合、可聴雑音が起こるよう、1に等しくないファクタで時間依存増幅ファクタaに対応してフィルタ通過信号を選択的に増大させる、あるいは減衰させることが示唆されているが、ビットレートは、コード化するには複雑な音声信号の部分で減少させることができる。
G.シューラ(Schuller)らによる記事「適応性プレ・ポストフィルタを用いた知覚的音声コード化およびロスレス圧縮」,言語および音声処理に関するIEEEトランザクション,vol.10,no.6、2002年9月,379乃至390ページ
上記で説明された音声コード化スキームは、多くの適用例でかなりの程度まで遅延時間を減少させているものの、上述のスキームにおける問題点は、以下プレフィルタと呼ぶ符号器側フィルタのマスキングしきい値、あるいは伝達関数を伝達しなければならないため、所定しきい値を超える場合だけフィルタ係数が伝送されるとしても、伝送チャネルにかなり高い負荷がかかるということである。
上記のコード化スキームの他の欠点は、マスキングしきい値、あるいはその逆数を、伝送されるパラメータセットx#により復号器側で利用可能にしなければならないという事実があるため、可能な限り最も低いビットレート、あるいは高い圧縮率が求められる反面、可能な限り最も正確な近似値あるいはマスキングしきい値あるいはその逆数のパラメータ化値も求められ、その間で妥協を行わなければならないということである。これにより、上記コード化スキームによりマスキングしきい値に対して調節された量子化ノイズが一部の周波数範囲でマスキングしきい値を超え、そのため、聴取者に聞こえる音声雑音が生じることが避けられない。例えば、図13は、グラフcで示す復号器側パラメータ化可能フィルタのパラメータ化された周波数応答である。図でわかるとおり、以下ポストフィルタと呼ぶ復号器側フィルタの伝達関数がマスキングしきい値bを超える領域がある。この問題点は、パラメータ化値と、その間の補間値との間で十分な変化量があるときにのみ断続的にパラメータ化値が伝送される事実によって、さらに悪化する。記載にもあるとおり、増幅値a#がノード間で、あるいは新規パラメータ化値間で一定である場合に、フィルタ係数x#の補間だけが可聴雑音をもたらす。記載に示唆されている補間がサイド情報値a#、すなわち伝送増幅値にも適用されるとしても、可聴音声アーチファクトが復号器側に到着する音声信号に残留する場合がある。
図12および13による音声コード化スキームの他の問題点は、周波数選択性フィルタリングのため、フィルタ通過信号が予測不可能な形態をとり、この形態では特に多数の個々の高調波がランダムに重なっているため、コード化信号の1つ以上の各音声値が非常に大きな値になり、このため、発生がまれである理由から、その後の冗長度削減での圧縮率が小さくなるという結果をもたらすことである。
本発明の目的は、情報信号の高データ圧縮が、当初の情報信号の質をほとんど劣化させることなく実現されるような、情報信号を量子化するための方法および装置を提供することである。
この目的は請求項12による方法と、請求項1による装置とで達成される。
本発明による情報値列の情報信号の量子化は、フィルタ通過情報値列を得るために情報値列を周波数選択性フィルタリングするステップと、フィルタ通過情報値を量子化情報値にマッピングし、そのコースがしきい値情報値超よりもしきい値情報値未満で急勾配となる量子化階段関数により量子化情報値列を得るためにフィルタ通過情報値を量子化するステップとを含む。
結果的に得られるフィルタ通過情報信号で人工的に発生されるアーチファクトは、音声信号の周波数選択性フィルタリングから生じるものであり、ここで、個々の情報値は、高調波のすべて、あるいはその多数のランダムな構成的雑音により、例えば、2倍以上といった、当初の信号の最大値よりかなり大きな値をとる。本発明の中心的な考え方は、適当なしきい値、つまり、代表的にはフィルタを通過する当初の情報信号で取りうる最も大きな値の2倍を超えるフィルタ通過情報信号をカットするものであり、これにより、ポストフィルタリング後、周波数選択性により人工的に生成されるアーチファクトがフィルタ通過情報信号から除去、あるいはスムージングされるが、その結果、量子化後にポストフィルタリングされた情報信号の質が劣化しにくいことの一方、適当なしきい値より大きい量子化ステップサイズをカット、あるいは大きくすることで、フィルタ通過情報信号のビット表示がかなり節減できるというものである。
好ましい実施形態によれば、情報信号は音声信号であり、ここでは、あるしきい値より大きい、あるいはそれより小さい選択性量子化により、音声の質における音声劣化がほとんど起こらず、同時にビット表示値がかなり減少する。
それに代わり、しきい値より大きい最大量子化ステップまですべての音声値を量子化するために量子化階段関数を用いる、あるいは、しきい値より大きい平坦コースをもつ、またはしきい値より大きい量子化ステップサイズをもつ量子化階段関数を用いることで、人工的に生成されたアーチファクトの量子化が粗く行われる。
本発明の好ましい実施形態は、添付図面を参照しながら次に詳細が示される。
図1は、本発明の実施形態による音声符号器を示す。全体として10で示される音声符号器は、図5aを用いて後にさらに詳細が説明されるとおり、音声値またはサンプル値の列で構成されるコード化される音声信号を受け取るデータ入力部12と、情報内容については図5bを参照しながらさらに詳細に論じるコード化信号が出力されるデータ出力部とを含む。
図1の音声符号器10は、不要成分削減部16および冗長度削減部18に分けられる。不要成分削減部16は、聴取しきい値を求めるための手段20と、増幅値を計算するための手段22と、パラメータ化値を計算するための手段24と、ノード比較手段26と、量子化器28およびパラメータ化可能プレフィルタ30およびFIFO(先入れ先出し)バッファ32と、バッファあるいはメモリ38と、乗算器または乗算手段40とを含む。冗長度削減部18は、圧縮器34とビットレート制御装置36とを含む。
不要成分削減部16および冗長度削減部18は、この順番でデータ入力部12とデータ出力部14との間に直列接続される。特に、データ入力部12は、聴取しきい値を求めるための手段20のデータ入力部と、入力バッファ32のデータ入力部とに接続される。聴取しきい値を求めるための手段20のデータ出力部は、パラメータ化値を計算するための手段24の入力部と、増幅値を計算するための手段22のデータ入力部とに、求めた聴取しきい値を送るために接続される。手段22および24は、聴音しきい値に基づいてパラメータ化値、もしくは増幅値を計算し、これらの結果をノード比較手段26に送るために該手段に接続される。比較の結果に応じて、次に論じるとおり、ノード比較手段26は、手段22および24で計算された結果を、入力パラメータ、もしくはパラメータ化値としてパラメータ化可能プレフィルタ30に送る。パラメータ化可能プレフィルタ30は、入力バッファ32のデータ出力部と、バッファ38のデータ入力部との間に接続される。乗算器40は、バッファ38のデータ出力部と量子化器28との間に接続される。量子化器28は、常に量子化されるが乗算もしくは基準化されるフィルタ通過音声値を、冗長度削減部18、さらに正確には、圧縮器34のデータ入力部に送る。ノード比較手段26は、パラメータ化可能プレフィルタ30に送られた入力パラメータが導かれる情報を、冗長度削減部18に、さらに詳細には圧縮器34の他のデータ入力部に送る。ビットレート制御装置は、以下でさらに詳細を論じるとおり、プレフィルタ30から受け取った量子化されるフィルタ通過音声値を適当な被乗数により乗算機40で乗算させるために、制御接続を経由して乗算器40の制御入力部に接続される。ビットレート制御装置36は、適当な方式で乗算器40に対する被乗数を求めるために、圧縮器34と、音声符号器10のデータ出力部14との間に接続される。各音声値が、最初に量子化器40に渡されると、例えば、1といった適当な倍率に被乗数がまず設定される。しかしながら、次に説明するとおり、バッファ38は、ビットレート制御装置36に対して、音声値ブロックの他のパスに対する被乗数を変化させる可能性を与えるために各フィルタ通過音声値を保存し続ける。このような変化がビットレート制御装置36によって示されない場合、バッファ38は、このブロックによって占められていたメモリを解放する。
図1の音声符号器の設定を上述のとおり説明したのに続いて、その機能モードについて、図2乃至7bを参照しながら説明する。
図2からわかるとおり、音声信号は、音声入力部12に到達したときには、アナログ音声信号から音声信号サンプリング50によりすでに取得されている。音声信号サンプリングは、通常の場合、32〜48kHzの所定のサンプリング周波数で行われる。したがって、データ入力部には、サンプル値または音声値の列で構成される音声信号がある。音声信号のコード化はブロックベース方式で行われないが、次の説明で明らかになるように、データ入力部12の音声値は、ステップ52で、最初に結合されて、音声ブロックが構成される。音声ブロックを構成するための結合は、以下の説明で明らかになるとおり、聴取しきい値を求める目的のみのために行われ、聴取しきい値を求めるための手段20の入力段階で行われる。本実施形態では、例示的な仮定として、128個の連続的な音声値がそれぞれ結合されて音声ブロックを構成している。この結合では、連続する音声ブロックが重ならないようにする一方で、お互いに直接隣り合うものになるように結合されている。この代表的な例について、図5aを参照して簡単に説明する。
図5aの54はサンプル値列を示すが、各サンプル値が長方形56で図示される。サンプル値は例示目的のために番号がふられているが、ここでは、わかりやすくするために、列54のサンプル値の一部だけが示されている。列54上の大括弧で示されているとおり、本実施形態では128個の連続サンプル値がそれぞれ結合されて1つのブロックを構成し、すぐ隣に連続する128個のサンプル値が次のブロックを構成する。念のためであるが、重なったブロックまたは離間ブロックおよび別のブロック長をもつブロックなどを種々に結合してブロックを構成することもできるが、順繰りの128個のブロック長は、高音声品質と、できるだけ最小の遅延時間との間で良好なトレードオフをもたらすことから好ましい。
ステップ52において手段20で結合される音声ブロックは、ブロック毎に聴取しきい値を求めるための手段20で処理される一方で、送られてくる音声値は、次に説明するとおり、パラメータ化可能プレフィルタ30がプレフィルタリングを行うためにノード比較手段26から入力パラメータを得るまで、入力バッファ32でバッファリングされる(ステップ54)。
図3でわかるとおり、聴取しきい値を求めるための手段20は、データ入力部12で十分な音声値が受信された直後にその処理を開始し、音声ブロックを構成する、あるいは次の音声ブロックを構成する。これを該手段20はステップ60での検査によって監視する。完全な処理可能音声ブロックがない場合、手段20は待機する。処理される完全な音声ブロックがある場合、聴取しきい値を求めるための手段20は、ステップ62における適当な心理音響モデルに基づいてステップ62で聴取しきい値を計算する。聴取しきい値を例示するため、再び図12、特に、例示として現在の音声ブロックがスペクトルaをもつものとし心理音響モデルに基づいて得られるグラフbを参照する。ステップ62で求めたマスキングしきい値は周波数依存関数であり、連続音声ブロックに対して変動し、さらに、例えば、ロック音楽からクラシック音楽曲といった音声信号ごとにかなり変動するものである。聴取しきい値は、各周波数に対して、それ以下であれば人の聴覚が雑音を認識できないしきい値bを示す。
Figure 0004444295
以下で詳細に示す直線補間でのパラメータ化値間で不安定さが生じないように、フィルタ30に対して格子構造を用いることが好ましいが、このとき、この格子構造のフィルタ係数は再パラメータ化され、反射係数を形成する。プレフィルタ、係数計算、再パラメータ化に関するさらなる詳細については、本説明の序論で述べたシューラ(Schuller)らによる記載、特に第III部のページ381を参照するが、これについてはここで言及することにより組み込まれている。
したがって、手段24は、その伝達関数がマスキングしきい値の逆数に等しくなるようパラメータ化可能プレフィルタ30に対するパラメータ化値を計算するが、手段22は、聴取しきい値に基づくノイズパワーリミット、すなわち、ポストもしくは逆フィルタリング後に復号器側の量子化ノイズが聴取しきい値M(f)未満、もしくは、それとちょうど等しくなるよう、プレフィルタ30でフィルタリングされた音声信号に量子化器28がどのノイズパワーを導入できるかを示す限度を計算する。手段22は、聴取しきい値Mの大きさの平方、すなわちΣ|M(f)|2未満の範囲としてノイズパワーリミットを計算する。手段22は、量子化ノイズパワーをノイズパワーリミットで除した比の根を計算することでノイズパワーリミットから増幅値aを計算する。量子化ノイズは量子化器28により発生するノイズである。量子化器28で発生するノイズは、以下で説明するとおり、ホワイトノイズであるため、周波数依存性である。量子化ノイズパワーは量子化ノイズの出力である。
上の説明で明らかになったとおり、手段22はまた、増幅値aとは別にノイズパワーリミットを計算する。手段22から得られた増幅値aからノイズパワーリミットをノード比較手段26で再び計算することは可能であるが、求められたノイズパワーリミットを手段22が増幅値aとは別にノード比較手段26に送ることも可能である。
増幅値およびパラメータ化値の計算後、ノード比較手段26は、ステップ66において、計算されたパラメータ化値が、パラメータ化可能プレフィルタに送られた現時点の最終パラメータ化値と所定しきい値以上異なるかどうかを確認する。ステップ66の確認の結果、計算されたばかりのパラメータ化値が現在のものと所定しきい値以上異なっている場合、計算されたフィルタ係数や計算された増幅値、あるいはノイズパワーリミットは、次に論じる補間のためのノード比較手段26でバッファリングされ、ノード比較手段26は、ステップ68で計算されたフィルタ係数と、ステップ70で計算された増幅値とをプレフィルタ30に渡す。しかしながら、これが当てはまらない場合や、計算されたパラメータ化値が現在のものと所定しきい値以上異なっていない場合、ノード比較手段26は計算されたばかりのパラメータ化値の代わりに、ステップ72においてプレフィルタ30に対して、現在のノード表示値のみを渡す。すなわち、ステップ66で肯定の結果が最後に出たときのパラメータ化値、すなわち、前のノードパラメータ化値と所定しきい値以上異なっている値だけを渡す。ステップ70および72の後、図3のプロセスは、次の音声ブロックの処理、すなわちクエリ60に戻る。
計算されたパラメータ化値が現在のノードパラメータ化値と異ならず、従って、ステップ72でプレフィルタ30が再び、少なくとも最終の音声ブロックですでに取得されたノードパラメータ化値を得るような場合、以下でさらに詳細に説明するとおり、プレフィルタ30は、このノードパラメータ化値を、FIFO32のこの音声ブロックの全サンプル値に適用する。なお、以下の説明には、現在のブロックがFIFO32からどのように取り出され、量子化器28がプレフィルタ通過音声値で得られた音声ブロックをどのように受け入れるかについて示されている。
図4は、詳細にいうと現在のノードパラメータ化値とはかなり異なっているため、計算されたパラメータ化値と計算された増幅値とを受け入れる場合のパラメータ化可能プレフィルタ30の機能モードを例示するものである。図3を参照しながら説明したとおり、図4による処理は、連続音声ブロックのおのおのに対しては実施されないが、各パラメータ化値が現在のノードパラメータ化値と大きく異なっているような音声ブロックに対してのみ実施される。他の音声ブロックは、今説明したとおり、現在の各ノードパラメータ化値と、関連する現在の各増幅値とをこれらの音声ブロックの全サンプル値に適用することでプレフィルタリングされる。
ステップ80において、パラメータ化可能プレフィルタ30は、ノード比較手段26から計算されたフィルタ係数の譲渡が行われたか、あるいは古いノードパラメータ化値の譲渡が行われたかを確認する。プレフィルタ30は、そのような譲渡が行われるまで確認80を行う。
そのような譲渡が行われるとすぐに、パラメータ化可能プレフィルタ30は、バッファ32でパラメータ化値が計算された音声値の現在の音声ブロックの処理を開始する。図5aにおいて、例えば、数値0の音声値の前の全音声値56がすでに処理され、これによりメモリ32を通過している様子が例示されている。数値0の音声値の前の音声値のブロックの処理が開始されるが、これは、ブロック0の前の音声ブロックに対して計算されたパラメータ化値、すなわちx0(i)が、所定しきい値以上、プレフィルタ30に対して前に渡されたノードパラメータ化値と異なっているためである。パラメータ化値x0(i)は、このように、本発明で説明されたノードパラメータ化値である。音声値0の前の音声ブロックの音声値の処理は、パラメータセットa0,x0(i)に基づいて行なわれた。
図5aにおいて、音声値0−127を持つブロック0に対して計算されたパラメータ化値が、前のブロックについてのパラメータ化値x0(i)から所定しきい値未満しか異なっていないことが仮定されている。このブロック0はプレフィルタ30によりFIFO32から取り出され、同様に、「直接適用」と記載されている矢印81で示されているとおり、ステップ72で供給されるパラメータ化値x0(i)によりそのすべてのサンプル値0−127に関して処理され、その後、量子化器28に渡される。
しかしながら、その一方、ブロック1に対して計算されたパラメータ化値は、図5aの例示によれば、パラメータ化値x0(i)と所定しきい値以上異なって、FIFO32に依然として位置しており、増幅値a1(ステップ70)と、適用可能な場合、関連ノイズパワーリミットとともにパラメータ化値x1(i)としてプレフィルタ30に対してステップ68で渡され、ここで、図5における指数aおよびxは、以下で論じられる補間で用いるノード用指数であるが、この補間は、矢印82で示され、図4のステップ80に続くステップで実現されるブロック1のサンプル値128−255に関して行われる。ステップ80における処理は番号1の音声ブロックの発生で開始される。
パラメータセットa1,x1が送られる時点で、音声値128−255、すなわち、プレフィルタ30で処理された最終音声ブロック0の後の現在の音声ブロックがメモリ32内にある。ステップ80でノードパラメータx1(i)の譲渡を求めた後、プレフィルタ30は、ステップ84で、増幅値a1に対応するノイズパワーリミットq1を求める。これは、ステップ64を参照して上記記載したとおり、ノード比較手段26がこの値をプレフィルタ30に送る、あるいはプレフィルタ30が再びこの値を計算することで行われる。
その後、FIFOメモリ32に残る最も古いサンプル値、あるいは現在の音声ブロック「ブロック1」の最初のサンプル値、すなわち、図5の本例ではサンプル値128を示すために、指数jはステップ86でサンプル値に初期化される。ステップ88において、パラメータ化可能プレフィルタはフィルタ係数x0およびx1間で補間を行い、ここで、パラメータ化値x0が前のブロック0の音声値番号127をもつノードでのノードとして機能し、パラメータ化値x1が現在のブロック1の音声値番号255をもつノードでのノードとして機能する。これらの音声値位置127および255は続けてノード0および1として参照され、ここで図5aでのノードとして参照されるノードパラメータ化値は矢印90および92で示される。
ステップ88において、パラメータ化可能プレフィルタ30は、サンプル位置jにおける補間フィルタ係数、すなわちx(tj)(i),i=1...Nを得るために直線補間形態で2つのノード間のフィルタ係数x0,x1の補間を行う。
その後、すなわちステップ90において、パラメータ化可能プレフィルタ30は、サンプル位置jにおける補間ノイズパワーリミット、すなわちq(tj)を得るためにノイズパワーリミットq1およびq0間で補間を行う。
ステップ92において、パラメータ化可能プレフィルタ30はその後、補間ノイズパワーリミットと量子化ノイズパワーと、好ましくは、さらに、補間フィルタ係数とに基づいて、すなわち、例えば{量子化ノイズパワー/q(tj)}の根に応じてサンプル位置jに対する増幅値を計算するが、この例は、図3のステップ64に説明されている。
ステップ94において、パラメータ化可能プレフィルタ30はその後、このサンプル位置に対するフィルタ通過サンプル値、すなわちs’(tj)を得るために、計算された増幅値および補間フィルタ係数をこのサンプルポジションjにおけるサンプル値に適用する。
ステップ96において、パラメータ化可能プレフィルタ30はその後、サンプル位置jが現在のノード、すなわち図5aのケースではノード1でのサンプル位置255、すなわち、パラメータ化可能プレフィルタ30に送られたパラメータ化値と増幅値とが直接、すなわち、補間なしに有効になるサンプル値に到達したかどうかを確認する。これが当てはまらない場合、パラメータ化可能プレフィルタ30は指数jを1だけ増加させる、すなわち増分させ、ここでステップ88−96が繰り返される。しかしながら、ステップ96における確認が肯定的であれば、パラメータ化可能プレフィルタはステップ100において、ノード比較手段26から送られた増幅値および補間なしでノード比較手段26から直接送られた最後のフィルタ係数を、新規ノードでのサンプル値に適用し、これにより現在のブロック、すなわちこの場合ではブロック1が処理され、この処理が、処理される次のブロックに対してステップ80で再び実施されるが、これは次の音声ブロックであるブロック2がパラメータ化値x1(i)と大きく異なっているかどうかにより、この次の音声ブロックであるブロック2、あるいはその後の音声ブロックになる。
フィルタ通過サンプル値s’の処理が図5を参照しながら説明されるさらなる手順の前に、図3および4の手順の目的および背景を以下で説明する。フィルタリングの目的は、適応フィルタを用いて入力部12で音声信号をフィルタリングすることであり、その伝達関数ができるだけ最良の程度まで聴取しきい値の逆数に対して連続的に調節されるものであるが、これも時間に応じて変化する。この理由は、復号器側では、その伝達関数が、それに対応して連続的に聴取しきい値に対して調節される逆フィルタリングが、フィルタ通過音声信号を量子化することで導入される量子化ホワイトノイズ、すなわち、周波数一定量子化ノイズを、適応フィルタにより形成する、すなわちこれを聴取しきい値の形状に調節するからである。
プレフィルタ30においてステップ94および100での増幅値の適用は、音声信号もしくはフィルタ通過音声信号、すなわちサンプル値sあるいはフィルタ通過サンプル値s’ の増幅係数による乗算である。この目的は、これにより、以下で詳細に説明する量子化でフィルタ通過音声信号に導入される量子化ノイズを設定するものであり、これは、聴取しきい値を超えないできるだけ高い聴取しきい値の形態まで復号器側で逆フィルタリングすることで調整されるものである。これは、関数の大きさの平方がフーリエ変換の大きさの平方に等しくなるパーセバル式により実証できる。復号器側で、プレフィルタでの音声信号の増幅値による乗算が、再び、フィルタ通過音声信号を増幅値で除することで反転され、量子化ノイズパワーも、すなわち、aを増幅値であるとすると、a-2の係数で減少する。従って、量子化ノイズパワーは、プレフィルタ30で増幅値を適用することで最適の高さ程度まで設定できるが、これは増加する量子化ステップサイズと同じものであるため、コード化される量子化ステップ数が減少し、これはさらに次の冗長度削減部での圧縮度を増加させる。
別の言い方をすると、プレフィルタの効果として、信号をそのマスキングしきい値に正規化するものとみなすことができるため、量子化雑音あるいは量子化ノイズのレベルは時間および周波数の両方で一定に維持できる。音声信号が時間領域にあるため、後で説明するとおり、量子化は、これにより、ステップ毎に均一の一定量子化で行なわれる。このように、理想的には、考え得る不要成分が音声信号から除去され、以下で説明するとおり、ロスレス圧縮スキームを用いて、プレフィルタ通過量子化音声信号の残りの冗長度をさらに除去する。
図5aを参照すると、当然ながら、用いられるフィルタ係数や増幅値a0,a1,x0,x1はサイド情報として復号器で利用可能であるが、この伝送の複雑さが、各ブロックに対する新規フィルタ係数や新規増幅値を単に用いるだけで減少するものでないという点を明示的に指摘する必要がある。むしろ、しきい値確認66が、十分なパラメータ化値変化のあるサイド情報としてパラメータ化値を転送するためだけに、また他の場合には、サイド情報あるいはパラメータ化値を転送しないよう行われる。古いパラメータ化値から新規パラメータ化値までの補間は、パラメータ化値が転送される音声ブロックで行われる。フィルタ係数の補間は、ステップ88を参照した上述の方式で行われる。増幅に関する補間は、迂回、すなわちノイズパワーリミットq0,q1の直線補間90経由で行われる。増幅値を通した直接補間と比較すると、直線補間は良好な聴取、またはノイズパワーリミットに対して音響アーチファクトがほとんどないという結果がもたらされる。
続いて、プレフィルタ通過信号のさらなる処理は図6を参照しながら説明されるが、これは基本的に量子化および冗長化減少を含む。第1に、パラメータ化可能プレフィルタ30で出力されたフィルタ通過サンプル値はバッファ38で保存され、同時に、バッファ38から乗算器40に送られ、ここでは、これが最初の通過であることから、まず変更なしで、すなわち乗算器40により量子化器28まで倍率1で通過される。ここで、上限より大きなフィルタ通過音声値はステップ110でカットされ、ステップ112で量子化される。2つのステップ110および112は量子化器28により実行される。特に、2つのステップ110および112は、好ましくは、1つのステップにおいて、浮動小数点図で代表的にあるフィルタ通過音声値s’を複数の整数量子化ステップ値または指数に対してマッピングし、しきい値より大きなフィルタ通過サンプル値が1つの同一量子化ステップに量子化するよう、あるしきい値からフィルタ通過サンプル値に対して平坦なコースをもつ量子化階段関数によりフィルタ通過音声値s’を量子化することで1つのステップで量子化器28によって実行される。そのような量子化階段関数の例が図7aで示されている。
量子化されたフィルタ通過サンプル値は図7aにおいてσ’で示されている。量子化された階段関数は、好ましくは、しきい値より小さな定数であるステップサイズをもつ、すなわち、次の量子化階段への飛越しがつねに入力値S’に沿った一定間隔後に行われる量子化階段関数である。実施において、しきい値へのステップサイズは、量子化階段数が、好ましくは指数2に対応するよう調節される。入射フィルタ通過サンプル値s’の浮動小数点表示と比較すると、浮動小数点図の表示可能範囲の最大値がしきい値を超えるよう、しきい値は小さくなる。
このしきい値の理由は、プレフィルタ30により出力されたフィルタ通過音声信号が、しばしば高調波の好ましくない蓄積のために非常に大きい値まで加算する音声値を含むことが観察されるためである。さらに、図7aで示される量子化階段関数により達成されるとおり、これらの値をカットすることで大きなデータ削減が得られるものの、音声品質の減損はわずかであるということが観察された。むしろ、フィルタ通過音声信号でよく取られる位置は、カットによる音声品質の減損がわずかな範囲になるようパラメータ化可能フィルタ30での周波数選択性フィルタリングにより人工的に形成される。
図7aで示される量子化階段関数のもう少し詳細な例は、すべてのフィルタ通過サンプル値s’を次の整数までのしきい値まで丸め、これから、例えば、256個といった最大の量子化階段までのすべてのフィルタ通過サンプル値を量子化するものである。この例が図7aに示される。
考え得る量子化階段関数の他の例は、図7bで示されるものである。しきい値まで、図7bの量子化階段関数は図7aの量子化階段関数に対応する。しかしながら、しきい値より大きなサンプル値s’に対して突然に平坦なコースをもつ代わりに、量子化階段関数は、しきい値より小さな領域での勾配より小さい勾配で続く。言い換えると、量子化ステップサイズはしきい値より上で大きなものになる。これにより、図7aの量子化関数でも同様の効果が達成されるが、一方で、しきい値の上下の量子化階段関数の異なるステップサイズのため、さらに複雑さが増し、他方で、非常に大きなフィルタ通過音声値s’が完全にカットされず、量子化ステップサイズより大きなaだけで量子化されるため、音声品質が改善される。
前に説明したとおり、復号器側では、量子化されフィルタ通過した音声値σ’が利用可能でなければならないだけでなく、これらの値のフィルタリングのベースになるプレフィルタ30に対する入力パラメータ、すなわち関連増幅値に対するヒントを含むノードパラメータ化値も利用可能でなければならない。ステップ114において、圧縮器34はこれにより、最初の圧縮トライアルを実行し、これにより、ノードにおける増幅値a0およびa1、例えば、127および255や、ノードにおけるフィルタ係数x0およびx1、時間的フィルタ通過信号までの量子化フィルタ通過サンプル値σ’を含むサイド情報を圧縮する。圧縮器34はこのように、例えば、予測および/または適合の有無にかかわらず、ハフマンあるいは算術符号器のように、ロスレス作動符号器である。
サンプル音声値σ’が通過するメモリ38は、量子化器28により出力され、前に説明したように、量子化されてフィルタ通過し、さらにスケーリングされる音声値σ’を圧縮器34が処理する適当なブロック長に対するバッファとして機能する。このブロック長は、手段20で用いられる音声ブロックのブロック長と異なる。
すでに述べたとおり、ビットレート制御装置36は、フィルタ通過音声値がプレフィルタ30から量子化器28まで、また量子化されたフィルタ通過音声値としてそこから圧縮器34まで変化がないように最初の圧縮トライアルに対して1の被乗数により乗算器40を制御した。圧縮器34は、ステップ116で、ある圧縮ブロック長、すなわちある数の量子化されたサンプル音声値が一時的なコード化信号にコード化されたかどうか、またはさらに量子化されたフィルタ通過音声値σ’が現在のコード化信号にコード化されるかどうかを監視する。圧縮ブロック長に到達しなかった場合、圧縮器34は現在の圧縮114の実施を続ける。しかしながら、圧縮ブロック長に到達すると、ビットレート制御装置36はステップ118において、圧縮で必要なビット量が必要ビットレートで示されたビット量より大きいかどうかを確認する。これが当たらない場合、ビットレート制御装置36はステップ120において、必要なビット量が、必要ビットレートで示されたビット量より小さいかどうかを確認する。これが当てはまる場合、ビットレート制御装置36は、ステップ122において、必要ビットレートで示されるビット量に到達するまでフィラービットでコード化信号を満たす。次に、コード化信号がステップ124で出力される。ステップ122の代替法として、ビットレート制御装置36は、メモリ38で保存されたままのフィルタ通過音声値σ’の圧縮ブロックを通過させることができるが、このメモリ上で、最終圧縮が、ステップ125において破線で示されるとおり、必要ビットレートで示されるビット量に到達するまで、再び通過ステップ110−118に対して、量子化器28への乗算器40による1より大きな被乗数での構成被乗数に基づく。
しかしながら、ステップ118での確認により、必要なビット量が必要ビットレートで示されるものよりも大きくなるようといった結果をもたらした場合、ビットレート制御装置36は乗算器40に対する被乗数を0および1の間のファクタに変更する。これはステップ126で実施される。ステップ126の後、ビットレート制御装置36は、メモリ38に対して、圧縮がベースとしているフィルタ通過音声値σ’の最終圧縮ブロックを再び出力させるが、ここで、これらの値は次に、ステップ126で設定されたファクタで乗算され、再び量子化器28に供給され、この上でステップ110−118が再び実施され、それまでに一時的にコード化された信号が廃棄される。
ステップ110−116を再び実施する場合、ステップ114においては、当然ながらステップ126(もしくはステップ125)で用いられるファクタもコード化信号に統合される点を指摘しなければならない。
ステップ126後の手順の目的は、このファクタで量子化器28の実効ステップ長を大きくすることである。つまり、得られる量子化ノイズはマスキングしきい値より均一に大きく、この結果、音響雑音もしくは音響ノイズが発生するものの、ビットレートが減少する。ステップ110−116を再び通過した後、ステップ118において必要ビット量が必要ビットレートで示されるものより大きいと再び判定された場合、ファクタは再びステップ126等で小さくされる。
データが最終的にステップ124でコード化信号として出力されると、次の圧縮ブロックが次の量子化フィルタ通過音声値σ’から実施される。
また、1以外の他の前初期化値を乗算ファクタ、すなわち、例えば1として用いることができる。その際、まず、すなわち図6の最初で、いかなる場合でもスケーリングを行う。
図5bもまた、全体として130で示される結果的に得られるコード化信号を例示する。コード化信号はサイド情報と、その間の主データとを含む。サイド情報は、すでに述べたとおり、特別な音声ブロック、すなわち音声ブロック列でフィルタ係数の大きな変化が起こり、増幅値の値やフィルタ係数の値が導出できる情報を含む。必要な場合、サイド情報は、ビット制御装置で用いられる増幅値に関係するさらなる情報を含む。増幅値およびノイズパワーリミットqの相互依存性のため、サイド情報は、オプションとして、ノード#に対する増幅値a#とは別にノイズパワーリミットq#を含んでもよく、あるいは後者だけを含んでもよい。サイド情報は、好ましくは、フィルタ係数および関連増幅値、あるいは関連ノイズパワーリミットに対するサイド情報が量子化フィルタ通過音声値σ’の音声ブロックに対する主データ前に配置されるようコード化信号内で配置されるが、これから、関連増幅値、あるいは関連ノイズパワーリミットとともにこれらのフィルタ係数、すなわち、ブロック−1後のサイド情報a0,x0(i)およびブロック1後のサイド情報a1,x1(i)が導出されるように設定される。異なる言い方をすると、主データ、すなわち、音声ブロック列で大きな変化が起こってフィルタ係数が得られる種類の音声ブロックを除くことを発端として、この種類の次の音声ブロックを含めるに至るまでの量子化フィルタ通過音声値σ’、図5では例えば、音声値σ’(t0)−σ’(t255)は、常に、これら2つの音声ブロックの第1のブロック(ブロック−1)に対するサイド情報ブロック132と、2つの音声ブロックの第2のブロック(ブロック1)に対する他のサイド情報ブロック134との間に配置される。音声値σ’(t0)−σ’(t127)は、図5aを参照しながら前述したとおり、復号可能である、あるいは復号可能であったが、サイド情報132だけで得られたものであり、その一方、音声値σ’(t128)−σ’(t255)は、サンプル値番号127を用いたノードでのサポート値としてサイド情報132により、さらにサンプル値番号255を用いたノードでのサポート値としてサイド情報134による補間で得られたものであり、これにより、両サイド情報によってのみ復号可能である。
さらに、各サイド情報ブロック132および134における増幅値、あるいはノイズパワーリミットおよびフィルタ係数に関するサイド情報は常にお互いに独立して統合されていない。むしろ、このサイド情報は、前のサイド情報ブロックに対する差で伝送される。例えば、図5bにおいて、サイド情報ブロック132は、時間t-1でのノードに関する増幅値a0およびフィルタ係数x0を含む。サイド情報ブロック132において、これらの値はブロックそのものから導出される。しかしながら、サイド情報ブロック134から、時間t255におけるノードに関するサイド情報はこのブロックだけからはもう導出されない。むしろ、サイド情報ブロック134は、時間t255でのノードの増幅値a1と時間t0でのノードの増幅値との差およびフィルタ係数x1とフィルタ係数x0との差だけを含む。したがって、サイド情報ブロック134は、a1−a0およびx1(i)−x0(i)に関する情報だけを含む。しかしながら、中断時間において、フィルタ係数および増幅値、またはノイズパワーリミットは、以下で論じる通り、例えば、コード化データのランストリームへの受信機もしくは復号器のラッチを可能にするために、各秒といった、前のノードに対する差として完全に、であるが、それだけではない形で伝送される。
この種のサイド情報をサイド情報ブロック132および134へ統合することにより、高い圧縮率の可能性という利点がもたらされる。この理由は、サイド情報は、可能な場合、前のノードのフィルタ係数に対するフィルタ係数の十分な変化が得られた場合だけ伝送されるものの、符号器側での差を計算する、あるいは復号器側での合計を計算する複雑さは、得られる差が、エントロピーコード化での利点を可能にするためにステップ66のクエリに代わって小さいため、ペイオフする。
音声符号器の実施形態が説明された後、図1の音声符号器10により生成されたコード化信号を復号再生可能、もしくは処理可能音声信号に復号する上で適切な音声復号器の実施形態が次に説明される。
この復号器の構成を図8に示す。全体として210で示される復号器は、復元器212と、FIFOメモリ214と、乗算器216と、パラメータ化可能ポストフィルタ218とを含む。復元器212と、FIFOメモリ214と、乗算器216と、パラメータ化可能ポストフィルタ218とは、この順番で、復号器210のデータ入力部220とデータ出力部222との間で接続され、ここで、コード化信号はデータ入力部220で受け入れられ、音声符号器10の量子化器28で生成された量子化ノイズにより音声符号器10のデータ入力部12の当初の音声信号と異なる分だけ復号された音声信号がデータ出力部222で出力される。復元器212は、被乗数を送るための他のデータ出力部における乗算器216の制御入力部と、他のデータ出力部経由でパラメータ化可能ポストフィルタ218のパラメータ化値入力部とに接続される。
図9で示されるとおり、復元器212は、量子化フィルタ通過音声データ、すなわちサンプル値σ’を得るために、最初にステップ224でデータ入力部220での圧縮信号を復元し、既知の通り、サイド情報ブロック132,134の関連サイド情報は、フィルタ係数および増幅値、あるいは増幅値の代わりにノードにおけるノイズパワーリミットを示す。
図10で示されるとおり、復元器212は、ステップ226において、フィルタ係数をもつサイド情報が前のサイド情報ブロックに関係して差がなく、内蔵内包されているかどうかを出現の順番で復元信号を確認する。言い方を変えると、復元器212は第1のサイド情報ブロック132を探す。復元器212が何らかのものを見出すとすぐに、量子化フィルタ通過音声値σ’がステップ228においてFIFOメモリ214でバッファリングされる。量子化されたフィルタ通過音声値σ’の完全な音声ブロックがステップ228でサイド情報ブロックに直接従うことなく保存された場合、まず、ポストフィルタのパラメータ化値および増幅値に関して、ステップ226で受け入れられ、乗算器216で増幅されたサイド情報に含まれる情報によってステップ228でポストフィルタリングされるが、これはどのように復号され、これにより関連する復号音声ブロックが達成されるかというものである。
ステップ230において、復元器212は、任意の種類のサイド情報ブロックの発生に対する復元された信号、すなわち、完全なフィルタ係数、あるいは前のサイド情報ブロックに対するフィルタ係数の差をもつものを監視する。図5bの例において、復元器212は、例えば、ステップ226でサイド情報ブロック132を認識すると同時に、ステップ230でサイド情報ブロック134の発生を認識する。これにより、量子化されたフィルタ通過音声値σ’(t0)−σ’(t127)のブロックは、サイド情報132を用いて、ステップ228で復号されたことになる。復元された信号のサイド情報ブロック134が発生しない限り、ブロックのバッファ、および場合によって復号は、前述のとおり、ステップ226のサイド情報によりステップ228で継続される。
サイド情報ブロック132が発生するとすぐに、復元器212は、ノード1、すなわちa1,x1(i)にあるパラメータ値をステップ232において、サイド情報ブロック134の差の値およびサイド情報ブロック132のパラメータ値を加算することで計算する。ステップ232は、現在のサイド情報ブロックが差のない内蔵サイド情報ブロックである場合、当然ながら無視されるが、これは、前に説明したとおり、代表的には毎秒発生する。復号器210に対する待機時間が長くなりすぎないようにするため、パラメータ値が絶対的に、すなわち他のサイド情報ブロックとの関連なしで導出されるサイド情報ブロック132が十分小さな距離で配置されるため、例えば、無線通信、あるいは放送送信といった場合に音声符号器210のスイッチングにおける入切の時間が大きくなりすぎない。好ましくは、異なる値で間に配列されたサイド情報ブロック132の数は、サイド情報ブロック132間の固定された所定数で配置されるため、復号器はタイプ132のサイド情報ブロックが再びコード化信号でいつ予想されるかを認識する。その他の場合、異なるサイド情報ブロックタイプが、対応するフラグにより示される。
図11で示されているとおり、新規ノードに対するサイド情報ブロックが到達した後、特にステップ226または232の後、サンプル値指数jは、まずステップ234で0に初期化される。この値は、現在のサイド情報が関係するFIFO214で現在残っている音声ブロックにおける第1サンプル値のサンプル位置に対応する。ステップ234はパラメータ化可能ポストフィルタ218によって実行される。ポストフィルタ218はその後、ステップ236で新規ノードでのノイズパワーリミットを計算し、ここでこのステップは、図4のステップ84に対応し、例えば、ノードにおけるノイズパワーリミットが増幅値に追加して伝送される場合には無視される。次のステップ238および240において、ポストフィルタ218は、図4の補間88および90に対応するフィルタ係数およびノイズパワーリミットに関して補間を行う。ステップ242における、ステップ238および240の補間ノイズパワーリミットおよび補間フィルタ係数に基づくサンプル位置jに対する増幅値の次の計算は、図4のステップ92に対応する。ステップ244において、ポストフィルタ218は、ステップ242で計算された増幅値と補間フィルタ係数とをサンプル位置jのサンプル値に適用する。このステップは、パラメータ化可能ポストフィルタの伝達関数が聴取しきい値の逆数に対応せず、聴取しきい値そのものに対応するよう、補間フィルタ係数が量子化されたフィルタ通過サンプル値σ’に適用される点で、図4のステップ94と異なっている。さらに、ポストフィルタは増幅値での乗算を行わず、量子化されたフィルタ通過サンプル値σ’、もしくは位置jですでに逆フィルタリングされた量子化フィルタ通過サンプル値での増幅値による除算を行う。
ポストフィルタ218が、ステップ246で確認するサンプル位置jの現在のノードに到達しない場合、ステップ248でのサンプル位置指数jを増分し、ステップ238−246を再開する。ノードに到達した場合のみ、新規ノードの増幅値およびフィルタ係数がノード、すなわち、ステップ250のサンプル値に適用される。この適用は次に、ステップ218と同様に、増幅値による除算と、聴取しきい値に等しく、乗算の代わりに後者の逆数に等しくない伝達関数を用いたフィルタリングとを含む。ステップ250後、現在の音声ブロックは2つのノードパラメータ化値間の補間により復号される。
すでに述べたとおり、ステップ110または112でのコード化を行う際に量子化で導入されたノイズが、ステップ218および224でのフィルタリングおよび増幅値の適用により聴取しきい値に対して形状および大きさの両方で調節される。
量子化されたフィルタ通過音声値が、コード化信号へのコード化前にビットレート制御装置によりステップ126で他の乗算がなされる場合、このファクタはまた、ステップ218および224で考慮される点も指摘される。また、図11のプロセスで得られた音声値は当然ながら、他の乗算が行われ、相応して、低ビットレートで弱められた音声値を再び増幅する。
図3,4,6および9−11に関して、図1の符号器、または図8の復号器の機能モードを例示するフロー図を示し、説明したとおり、ブロックによるフロー図で例示されたステップのおのおのが、前述のとおり、対応する手段で実施される点が指摘される。各ステップの実施は、ASIC回路部としてハードウェアと、サブルーチンとしてソフトウェアで実現される。特に、これらの図のブロックに書き込まれた説明は、各ブロックに対する各ステップが言及するプロセスを概略で示す一方、ブロック間の矢印は、符号器および復号器をそれぞれ作動させる場合のステップの順番を例示する。
前の説明を参照すると、上で例示されたコード化スキームが多くの点で変わっている点も指摘される。代表的には、ある音声ブロックに対して求めたパラメータ化値および増幅値、またはノイズパワーリミットにとって、前記実施形態での各音声ブロックの最後の各音声値、すなわち、この音声ブロックにおける128番目の値のように、この音声値に対する補間が無視されるように、ある音声値にとって直接有効なものとみなすことは必要でない。むしろ、補間が各音声値に対して必要になるよう、これらのノードパラメータ値を、一時的にこの音声ブロックの音声値のサンプル時間tn,n=0,...,127間にあるノードと関連付けることが可能である。特に、音声ブロックに対して求められるパラメータ化値、あるいはこの音声ブロックに対して求められる増幅値についても、例えば、音声ブロックの中間の音声値、例えば、128個の上述の音声値のブロック長のような場合には64番目の音声値といった他の値に対して間接的に適用される。
さらに、上述の実施形態は、制御されたビットレートを用いてコード化された信号を発生させるために設計された音声コード化スキームとして言及されることが指摘される。しかしながら、ビットレートの制御は、適用の全てのケースで必要とされない。この理由は、対応するステップ116〜122および126または125は無視される可能性があるからである。
ステップ114を参照しながら述べた圧縮スキームを参照すると、完全性という理由のため、説明の導入部で説明したシューラー(Sculler)らによる文書、特に、分冊IVが参照されているが、ロスレスコード化による冗長度削減に関するその内容は、ここでは引用によって組み込まれている。
以下の記述は上述の説明を参照しながら指摘されるものである。本発明は、上記の通り遅延時間を短くできる特別な音声コード化スキームを参照しながら説明されたが、本発明は、当然ながら、異なる音声コード化に適用してもよい。代表的には、音声コード化スキームについて、コード化信号が、冗長度削減が実施されることなく、まさしく量子化されたフィルタ通過音声値で構成される場合も考え得る。したがって、前に説明した方法、すなわち符号器側では伝達関数が聴取しきい値の逆数に等しく、復号器側では伝達関数が聴取しきい値に等しい方法と異なる周波数選択性フィルタリングを行うことも考えられる。
さらに、上記実施形態の個々の観点は無視できる。これにより、例えば、圧縮率を下げる場合、各音声ブロックを参照しながらサイド情報を伝送する、補間を無視する、および/または内蔵サイド情報ブロックのサイド情報のパラメータを、前のサイド情報ブロックに関連する差としてではなく常に伝送することが可能である。
さらに、本発明は音声信号に限られない。本発明はまた、例えば、フレーム列、すなわち画素アレイ列で構成されるビデオ信号といった異なる情報信号にも適用される。
いかなる場合でも、上述の音声コード化スキームにより、遅延時間が非常に短い音声符号器のビットレートを制限する方法がもたらされる。音声信号に応じてコード化する場合に得られるビットレートピークは、プレフィルタの開始値範囲を制限することで避けることができる。従って、これが伝送に対して異なる高ビットレートがもたらされる伝送される音声信号の特性に対応する、すなわち、さらに複雑な音声信号が高ビットレートをもたらし、複雑でない音声信号が低ビットレートをもたらすことから、例えば、無線伝送媒体内にある伝送のビットレートに対する上限を常に満たすことができる。しきい値より大きな量子化階段関数における変化は、認められた最大値までビットレートを制限するための適切な手段である。
上述の実施形態において、符号器は、適切な方式で音声信号を形成するプレフィルタを含み、量子化器はエントロピー符号器に続いて量子化ステップ長をもつ。量子化器は、指標としても言及される発生値をもつ。一般的に、高指数はまた、それに接続された高ビットレートを意味するが、これは、指数の範囲を制限する(図7a)、あるいはそれを間引く(図7b)ことで避けられてきたが、音声品質を悪化させる可能性をはらんでいる。
さらに、以下の記述は、前記実施形態を参照して指摘するものである。量子化を行う場合、あるいは量子化階段関数が常に一定である場合、しきい値は常に一定のままである、すなわちフィルタ通過音声信号で発生するアーチファクトが常に量子化される、あるいはラッファにより量子化値をカットし、これは聴取可能な程度まで音声品質を悪化させうるということを前に説明したが、音声信号の複雑さがこれを必要とする、すなわち、コード化で必要なビットレートが必要ビットレートを超える場合のみ、これらの方策を用いることも可能である。この場合、図7aおよび7bで示される量子化階段関数に加えて、例えば、プレフィルタの出力部で取りうる値の全範囲にわたって一定の量子化ステップ長をもつものを用いて、量子化器が、例えば、常に一定の量子化ステップ長の量子化階段関数、あるいは図7aまたは7bによる量子化階段関数の内の1つのいずれかを用いるよう、ある信号に応答することで、量子化器が信号によって、音声品質の悪化がほとんどないまま、しきい値より大きな量子化階段の低下、あるいはしきい値より大きなもののカットを行わせることができる。その他の場合、しきい値を徐々に減じることも可能である。この場合、しきい値減少を、ステップ126のファクタ減少の代わりに行うことがある。ステップ110なしで第1の圧縮トライアルを行った後、ビットレートが依然として高すぎる(118)場合に、一時的な圧縮信号に対して、改良ステップ126の選択性しきい値量子化だけが行われる。他のケースでは、フィルタ通過音声信号がその後、音声しきい値より大きな平坦コースをもつ量子化階段関数を用いて量子化される。さらなるビットレート減少は、しきい値を低下させ、これにより量子化階段関数の他の改良を行うことで改良ステップ126において実施される。
特に、状況に応じて、本発明の音声コード化スキームをソフトウェア内で実施することができる点を指摘する必要がある。この実施はデジタル保存媒体、特に電子的に読み出される制御信号をもち、当該方法が実行されるようプログラム可能コンピュータシステムと協動するディスクまたはCD上であってもよい。一般に、本発明は、コンピュータプログラム製品がコンピュータ上で実行される際に、本発明を実施するための機械読み込み可能キャリア上に保存されたプログラムコードをもつコンピュータプログラム製品内にある。言い換えると、本発明はまた、コンピュータプログラムがコンピュータ上で作動する際に本発明を実施するためのプログラムコードをもつコンピュータプログラムとして実現される。
特に、フロー図のブロック内の上記方法ステップは、個別に実施される、あるいはサブプログラムルーチンで複数のものとともにグループでも実施される。また、これらのブロックが、例えば、ASICの個々の回路部分として実施される場合、集積回路の形態での本発明の装置の実施も当然ながら可能である。
特に、状況に応じて、本発明のスキームをソフトウェア内で実施することができる点を指摘する必要がある。この実施はデジタル保存媒体、特に電子的に読み出される制御信号をもち、当該方法が実行されるようプログラム可能コンピュータシステムと協動するディスクまたはCD上であってもよい。一般に、本発明は、このように、コンピュータプログラムがコンピュータ上で実行される際に、本発明を実施するための機械読み込み可能キャリア上に保存されたプログラムコードをもつコンピュータプログラム製品内にある。言い換えると、本発明はまた、コンピュータプログラムがコンピュータ上で作動する際に本発明を実施するためのプログラムコードをもつコンピュータプログラムとして実現される。
図1は、本発明の実施形態による音声符号器のブロック回路図である。 図2は、データ入力点における図1の音声符号器の機能モードを示すフロー図である。 図3は、心理音響モデルで送られてくる音声信号の評価に関して、図1の音声符号器の機能モードを示すフロー図である。 図4は、心理音響モデルで得られたパラメータを送られてくる音声信号に適用することに関して、図1の音声符号器の機能モードを示すフロー図である。 図5aは、送られてくる音声信号と、それに含まれる音声値列と、音声値に関する図4の作動ステップとを示す図解図であり、図5bは、コード化信号の構成を示す図解図である。 図6は、コード化信号までの最終処理に関して、図1の音声符号器の機能モードを示すフロー図である。 図7aは、量子化階段関数の実施形態を示す図である。 図7bは、量子化階段関数の他の実施形態を示す図である。 図8は、本発明の実施形態による、図1の音声符号器によりコード化される音声信号を復号できる音声符号器のブロック回路図である。 図9は、データ入力点における図8の復号器の機能モードを示すフロー図である。 図10は、あらかじめ復号された量子化・フィルタ通過音声データのバッファおよび対応サイド情報なしで音声ブロックの処理を行うことに関して、図8の復号器の機能モードを示すフロー図である。 図11は、実際の逆フィルタリングに関して、図8の復号器の機能モードを示すフロー図である。 図12は、短遅延時間の従来の音声コード化スキームを示す図解図である。 図13は、代表的に、音声信号のスペクトルと、その聴取しきい値と、復号器のポストフィルタの伝達関数とを示す図である。

Claims (8)

  1. 音声値列音声信号コード化る装置であって、前記装置は、
    心理音響モデルを用いて、音声値列の中の音声値ブロックに対する第1マスキングしきい値を求める手段と、
    フィルタ通過音声値列を得るためのパラメータ化可能フィルタを示し、それを用いて音声値列を周波数選択性フィルタリングする手段と、
    パラメータ化可能フィルタ(30)の伝達関数が第1マスキングしきい値の大きさの逆数にほぼ対応するよう、前記パラメータ化可能フィルタの計算されたパラメータ化値を計算する手段と、
    前記フィルタ通過音声値を量子化音声値にマッピングし、しきい値情報値を超えるときよりも前記しきい値情報値未満の方が急勾配になるコースをとる量子化階段関数により前記量子化音声値の列を得るために、前記フィルタ通過音声値を量子化する手段とを備え、
    周波数選択性フィルタリングする手段が、
    前記フィルタ通過音声値の所定ブロックを得るために計算されたパラメータ化値に所定方式応じ所定パラメータ化値を用いて、前記パラメータ化可能フィルタを用いることにより前記音声値列の中の音声値の所定ブロックを周波数選択性フィルタリングするように構成される、装置。
  2. マスキングしきい値を求める手段が音声値の他の第2ブロックに対する他の第2マスキングしきい値をさらに求めるように形成され、計算する手段が、前記伝達関数が前記第2マスキングしきい値の大きさの逆数にほぼ対応するよう、パラメータ化可能フィルタの他の第2パラメータ化値を計算するよう形成され、前記所定ブロックは第1および第2ブロックの間にあるかまたは第2ブロックであり、周波数選択性フィルタリングする手段が、
    音声値の前記所定ブロックの所定音声値に対する補間パラメータ化値を得るために第1パラメータ化値と第2パラメータ化値との間で補間する手を含み
    所定音声値に対応するフィルタ通過音声値の所定ブロックのフィルタ通過音声値を得るために、補間パラメータ化値を用いるように構成された、請求項1に記載の装置。
  3. 前記装置がさらに、第1マスキングしきい値に応じて第1量子化ノイズパワーリミットと、第2マスキングしきい値に応じて第2量子化ノイズパワーリミットを求める手段(22)を備え、周波数選択性フィルタリングする手段が、音声値の前記所定ブロックの所定音声値に対する補間量子化ノイズパワーリミットを得るために前記第1量子化ノイズパワーリミットと前記第2量子化ノイズパワーリミットとの間で補間する手段(90)と、量子化手段による量子化および補間量子化ノイズパワーリミットにより生じる量子化ノイズパワーに応じて中間段階値を求める手段(92)とを含み、段階をつけられたフィルタ通過音声値を得るために所定音声値に対応するフィルタ通過音声値に段階をつけるするように構成される、請求項2に記載の装置。
  4. 前記第1量子化ノイズパワーリミットと前記第2量子化ノイズパワーリミットとの間で補間する手段が直線補間を用いるように構成される、請求項3に記載の装置。
  5. 前記中間段階値を求める手段が、前記補間量子化ノイズパワーリミットにより除される前記量子化ノイズパワーの商の根を計算するように構成される、請求項3または請求項4に記載の装置。
  6. 前記しきい値情報値より大きな全てのフィルタ通過音声値が最大量子化階段値に量子化されるよう、前記量子化階段関数が前記しきい値情報値を超えてから平坦になっている、請求項1ないし請求項5のいずれかに記載の装置。
  7. 音声値列の音声信号をコード化る方法であって、前記方法が、
    フィルタ通過音声値列を得るためにパラメータ化可能フィルタを用いて音声値列を周波数選択性フィルタリングするステップと、
    前記フィルタ通過音声値を量子化音声値にマッピングし、しきい値情報値を超えているときよりも、前記しきい値情報値未満の方が急勾配になるコースをとる量子化階段関数により前記量子化音声値の列を得るために、前記フィルタ通過音声値を量子化するステップと、
    心理音響モデルを用いて、前記音声値列の中の音声値ブロックに対する第1マスキングしきい値を求めるステップと、
    パラメータ化可能フィルタの伝達関数が第1マスキングしきい値の大きさの逆数にほぼ対応するよう、前記パラメータ化可能フィルタの計算されたパラメータ化値を計算するステップとを含み、
    周波数選択性フィルタリングのステップは、前記音声値列の中の音声値の所定ブロックが、前記フィルタ通過音声値の所定ブロックを得るために計算されたパラメータ化値に所定方式応じ所定パラメータ化値を用いて、パラメータ化可能フィルタを用いて周波数選択性フィルタリングされるように機能する、方法。
  8. コンピュータに、請求項7に記載の方法を実行させるコンピュータプログラム。
JP2006552545A 2004-02-13 2005-02-10 情報信号を量子化するための方法および装置 Expired - Lifetime JP4444295B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
DE102004007184A DE102004007184B3 (de) 2004-02-13 2004-02-13 Verfahren und Vorrichtung zum Quantisieren eines Informationssignals
PCT/EP2005/001343 WO2005078703A1 (de) 2004-02-13 2005-02-10 Verfahren und vorrichtung zum quantisieren eines informationssignals

Publications (2)

Publication Number Publication Date
JP2007522509A JP2007522509A (ja) 2007-08-09
JP4444295B2 true JP4444295B2 (ja) 2010-03-31

Family

ID=34853461

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006552545A Expired - Lifetime JP4444295B2 (ja) 2004-02-13 2005-02-10 情報信号を量子化するための方法および装置

Country Status (15)

Country Link
US (1) US7464027B2 (ja)
EP (1) EP1697929B1 (ja)
JP (1) JP4444295B2 (ja)
KR (1) KR100813193B1 (ja)
CN (1) CN1918630B (ja)
AT (1) ATE377243T1 (ja)
AU (1) AU2005213767B2 (ja)
BR (1) BRPI0506627B1 (ja)
CA (1) CA2555639C (ja)
DE (2) DE102004007184B3 (ja)
ES (1) ES2294685T3 (ja)
IL (1) IL177164A (ja)
NO (1) NO337836B1 (ja)
RU (1) RU2337413C2 (ja)
WO (1) WO2005078703A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102004009955B3 (de) 2004-03-01 2005-08-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln einer Quantisierer-Schrittweite
US7627481B1 (en) * 2005-04-19 2009-12-01 Apple Inc. Adapting masking thresholds for encoding a low frequency transient signal in audio data
JP4640020B2 (ja) * 2005-07-29 2011-03-02 ソニー株式会社 音声符号化装置及び方法、並びに音声復号装置及び方法
EP1852848A1 (en) * 2006-05-05 2007-11-07 Deutsche Thomson-Brandt GmbH Method and apparatus for lossless encoding of a source signal using a lossy encoded data stream and a lossless extension data stream
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
ATE509347T1 (de) * 2006-10-20 2011-05-15 Dolby Sweden Ab Vorrichtung und verfahren zum codieren eines informationssignals
US7823092B1 (en) * 2007-11-23 2010-10-26 Altera Corporation Method and apparatus for implementing a parameterizable filter block with an electronic design automation tool
EP2830065A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decoding an encoded audio signal using a cross-over filter around a transition frequency
CA2958429C (en) 2014-07-25 2020-03-10 Panasonic Intellectual Property Corporation Of America Audio signal coding apparatus, audio signal decoding apparatus, audio signal coding method, and audio signal decoding method
DE102014220687A1 (de) * 2014-10-13 2016-04-14 Continental Automotive Gmbh Kommunikationsvorrichtung für ein Fahrzeug und Verfahren zum Kommunizieren
RU2754497C1 (ru) * 2020-11-17 2021-09-02 федеральное государственное автономное образовательное учреждение высшего образования "Казанский (Приволжский) федеральный университет" (ФГАОУ ВО КФУ) Способ передачи речевых файлов по зашумленному каналу и устройство для его реализации

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3506912A1 (de) 1985-02-27 1986-08-28 Telefunken Fernseh Und Rundfunk Gmbh, 3000 Hannover Verfahren zur uebertragung eines audiosignals
DE3820037A1 (de) 1988-06-13 1989-12-14 Ant Nachrichtentech Bildcodierverfahren und einrichtung
DE3820038A1 (de) * 1988-06-13 1989-12-14 Ant Nachrichtentech Verfahren zur aufbereitung und uebertragung einer bildsequenz
JP3186290B2 (ja) * 1993-01-20 2001-07-11 ソニー株式会社 符号化方法、符号化装置、復号化装置及び記録媒体
US5581653A (en) 1993-08-31 1996-12-03 Dolby Laboratories Licensing Corporation Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder
DE19549621B4 (de) 1995-10-06 2004-07-01 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung zum Codieren von Audiosignalen
GB2307833B (en) * 1995-12-01 2000-06-07 Geco As A data compression method and apparatus for seismic data
AU3452397A (en) * 1996-07-05 1998-02-02 Victoria University Of Manchester, The Speech synthesis system
US6370477B1 (en) 1996-11-22 2002-04-09 Schlumberger Technology Corporation Compression method and apparatus for seismic data
US6131084A (en) 1997-03-14 2000-10-10 Digital Voice Systems, Inc. Dual subframe quantization of spectral magnitudes
KR100335609B1 (ko) 1997-11-20 2002-10-04 삼성전자 주식회사 비트율조절이가능한오디오부호화/복호화방법및장치
US6195633B1 (en) * 1998-09-09 2001-02-27 Sony Corporation System and method for efficiently implementing a masking function in a psycho-acoustic modeler
KR100440896B1 (ko) * 1998-12-30 2004-09-18 주식회사 대우일렉트로닉스 양자화복호화장치
RU2144222C1 (ru) * 1998-12-30 2000-01-10 Гусихин Артур Владимирович Способ сжатия звуковой информации и система для его реализации
WO2000063886A1 (en) * 1999-04-16 2000-10-26 Dolby Laboratories Licensing Corporation Using gain-adaptive quantization and non-uniform symbol lengths for audio coding
US6370502B1 (en) * 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
EP1228569A1 (en) 1999-10-30 2002-08-07 STMicroelectronics Asia Pacific Pte Ltd. A method of encoding frequency coefficients in an ac-3 encoder
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
WO2002080573A1 (fr) * 2001-03-28 2002-10-10 Sony Corporation Appareil, procede, programme de quantification et support d'enregistrement
DE10217297A1 (de) * 2002-04-18 2003-11-06 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Codieren eines zeitdiskreten Audiosignals und Vorrichtung und Verfahren zum Decodieren von codierten Audiodaten
CA2388352A1 (en) * 2002-05-31 2003-11-30 Voiceage Corporation A method and device for frequency-selective pitch enhancement of synthesized speed

Also Published As

Publication number Publication date
US20070043557A1 (en) 2007-02-22
IL177164A (en) 2010-11-30
JP2007522509A (ja) 2007-08-09
US7464027B2 (en) 2008-12-09
ES2294685T3 (es) 2008-04-01
IL177164A0 (en) 2006-12-10
EP1697929B1 (de) 2007-10-31
BRPI0506627A (pt) 2007-05-02
CN1918630B (zh) 2010-04-14
BRPI0506627B1 (pt) 2018-10-09
CN1918630A (zh) 2007-02-21
WO2005078703A1 (de) 2005-08-25
NO20064091L (no) 2006-11-10
HK1093814A1 (en) 2007-03-09
NO337836B1 (no) 2016-06-27
CA2555639A1 (en) 2005-08-25
RU2006132742A (ru) 2008-03-20
DE102004007184B3 (de) 2005-09-22
AU2005213767B2 (en) 2008-04-10
AU2005213767A1 (en) 2005-08-25
EP1697929A1 (de) 2006-09-06
CA2555639C (en) 2012-07-10
KR100813193B1 (ko) 2008-03-13
DE502005001821D1 (de) 2007-12-13
RU2337413C2 (ru) 2008-10-27
KR20060113999A (ko) 2006-11-03
ATE377243T1 (de) 2007-11-15

Similar Documents

Publication Publication Date Title
JP4444296B2 (ja) オーディオ符号化
KR100859881B1 (ko) 음성 신호 코딩
JP4212591B2 (ja) オーディオ符号化装置
JP2012177939A (ja) 周波数領域のウィナーフィルターを用いた空間オーディオコーディングのための時間エンベロープの整形
JP4444295B2 (ja) 情報信号を量子化するための方法および装置
CN114550732A (zh) 一种高频音频信号的编解码方法和相关装置
JP4444297B2 (ja) オーディオ符号化
JP5491193B2 (ja) 音声コード化の方法および装置
JP4721355B2 (ja) 符号化データの符号化則変換方法および装置
MXPA06009144A (en) Audio encoding
MXPA06009110A (en) Method and device for quantizing a data signal

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090804

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20091102

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20091110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091201

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100113

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

Ref document number: 4444295

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130122

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term