JP2003228399A - 符号化装置、復号化装置および音響データ配信システム - Google Patents
符号化装置、復号化装置および音響データ配信システムInfo
- Publication number
- JP2003228399A JP2003228399A JP2002313216A JP2002313216A JP2003228399A JP 2003228399 A JP2003228399 A JP 2003228399A JP 2002313216 A JP2002313216 A JP 2002313216A JP 2002313216 A JP2002313216 A JP 2002313216A JP 2003228399 A JP2003228399 A JP 2003228399A
- Authority
- JP
- Japan
- Prior art keywords
- data
- band
- spectrum
- spectrum data
- auxiliary information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
符号化装置を提供する。 【解決手段】 符号化装置300の音響データ入力部3
10は音響データ列から、連続する4096個の音響デ
ータを切り出し、変換部320は切り出された音響デー
タを周波数軸上のスペクトルデータに変換する。データ
分離部330は、11.025kHz(f1)を境界と
してスペクトルデータを低域部と高域部とに分離する。
低域部スペクトルデータは、第1の量子化部340、符
号化部350により通常どおり量子化、符号化される。
第2の符号化部355は、高域部周波数スペクトルの特
徴を示す補助情報を生成し、第2の符号化部355は、
補助情報を符号化する。ストリーム出力部390は、第
1の符号化部350で得られた符号と第2の符号化部3
55で得られた符号とを合成して出力する。ここで、f
1は、音響データ列が作成されたときのサンプリング周
波数f2の半分以下である。
Description
圧縮符号化および伸張復号化技術に関する。
質圧縮符号化および伸張復号する様々な方式の技術が開
発されており、「MPEG−2 Advanced A
udio Coding」(以下、「MPEG−2 A
AC」あるいは「AAC」と略称する)」もその方式の
1つである(非特許文献1参照。)。
8−7(MPEG−2 Advanced Audio
Coding,AAC)」、1997年4月 図24は、従来のAAC方式による符号化装置および復
号化装置の機能構成を示すブロック図である。
号をAAC符号化方式に基づいて圧縮符号化する装置で
あって、A/D変換器1050、音響データ入力部11
00、変換部1200、量子化部1400、符号化部1
500およびストリーム出力部1900から構成され
る。
信号を、例えば22.05kHzのサンプリング周波数
でサンプリングし、アナログの音響信号からデジタルの
音響データ列に変換する。音響データ入力部1100
は、入力信号である音響データ列を1024サンプル
(この1024サンプルを以下、「フレーム」とい
う。)読み込むごとに、そのフレームと、そのフレーム
の前後に隣接するフレームの50%のサンプル(51
2)をオーバーラップさせた合計2048サンプルの音
響データ列を切り出す。変換部1200は、MDCT
(Modified Discrete Cosine
Transform)によって、音響データ入力部1
100によって切り出された時間軸上の2048サンプ
ルのデータを周波数軸上のスペクトルデータに変換す
る。なお、変換によって得られたデータの内の半分であ
る1024点のスペクトルデータは、サンプリング周波
数の半分11.025kHz以下の再生帯域を表してお
り、複数のグループに分類される。各グループは、複数
のグループのそれぞれに、1点以上のスペクトルデータ
が含まれるように設定される。また、この各グループ
は、人間の聴覚におけるクリティカルバンドを擬似して
いる。各グループのそれぞれを「スケールファクターバ
ンド」という。量子化部1400は、スケールファクタ
ーバンドごとに1つの正規化係数を用いて、変換部12
00から得られたスケールファクターバンド内のスペク
トルデータを所定ビット数に量子化する。この正規化係
数のことを「スケールファクター」という。また、各ス
ペクトルデータを各スケールファクターで量子化した結
果を「量子化値」という。符号化部1500は、量子化
部1400で量子化されたデータ、すなわち、各スケー
ルファクターと、それを用いて量子化されたスペクトル
データとをハフマン符号化する。ストリーム出力部19
00は、符号化部1500から得られた符号化信号を、
AACビットストリームのストリームフォーマットに変
換し、出力する。符号化装置1000から出力されたビ
ットストリームは、伝送媒体や記録媒体を介して復号化
装置2000に伝達される。
0によって符号化されたビットストリームを復号化する
装置であって、ストリーム入力部2100、復号化部2
200、逆量子化部2300、逆変換部2800、音響
データ出力部2900およびD/A変換器2950から
構成される。
1000によって符号化されたビットストリームを伝送
媒体や記録媒体を介して入力し、入力したビットストリ
ームから符号化信号を取り出す。復号化部2200は、
ハフマン符号化された符号化信号を量子化データに復号
化する。逆量子化部2300は、復号化部2200で復
号化された量子化データをスケールファクターを用いて
逆量子化する。逆変換部2800は、IMDCT(In
verse Modified Discrete C
osine Transform)を用いて、逆量子化
部2300で得られた周波数軸上の1024点のスペク
トルデータを、時間軸上の1024サンプルの音響デー
タに変換する。音響データ出力部2900は、逆変換部
2800で得られた時間軸上の1024サンプルの音響
データを順次組み合わせ、1024サンプルの音響デー
タを時間順に1つずつ出力する。D/A変換器2950
は、22.05kHzのサンプリング周波数でデジタル
の音響データからアナログの音響信号に変換する。
号化装置1000および復号化装置2000によれば、
各点を1ビット以下にまで圧縮率を高めることができ、
しかも、サンプリング周波数の半分11.025kHz
以下の再生帯域を表し、聴覚的に優先度の高い低域部1
024点のスペクトルデータを符号化しているので、比
較的高音質で音響信号を再生することができる。
AAC方式の符号化装置1000および復号化装置20
00(従来例1)によれば、サンプリング周波数が2
2.05kHzであるため、符号化されるスペクトルデ
ータに11.025kHzを超える帯域が全く含まれて
いない。このため、11.025kHzを超える帯域も
視聴したいというさらなる高品質化の要望に応えること
ができないという問題がある。
の符号化装置1000および復号化装置2000のA/
D変換器1050、D/A変換器2950に印可するサ
ンプリング周波数を22.05kHzの2倍、44.1
kHzに高めることが考えられる(この方式を以下、
「従来例2」とも記す。)。
4.1kHzにすると、圧縮率を維持しつつ、11.0
25kHzを超える高域部に512点のスペクトルデー
タを符号化することができるものの、聴覚的に優先度の
高い低域部のスペクトルデータが512点に半減してし
まう。すなわち、サンプリング周波数と低域部のスペク
トル数とはトレード・オフの関係にあり、従来のAAC
では両方を同時に高めることはできない。このため、全
体としての音質がかえって劣化してしまうという別の問
題が発生する。
P3、AC3等)の符号化装置および復号化装置等にお
いても同様である。本発明は上述の技術的課題を解決す
るためになされたものであり、符号化後の情報量を大幅
に増加させることなく、音響信号の高音質な再生を実現
しうる符号化装置および復号化装置等を提供することで
ある。
に、本発明に係る符号化装置は、音響データを符号化す
る符号化装置であって、音響データ列から、連続する一
定個数の音響データを切り出す切り出し手段と、切り出
された音響データを周波数軸上のスペクトルデータに変
換する変換手段と、前記変換で得られたスペクトルデー
タを前記f1Hzまでの低域部スペクトルデータと前記
f1Hzよりも高い高域部スペクトルデータとに分離す
る分離手段と、分離された低域部スペクトルデータを量
子化し、符号化する低域部符号化手段と、分離された高
域部スペクトルデータから、当該高域部周波数スペクト
ルの特徴を示す補助情報を生成する補助情報生成手段
と、生成された補助情報を符号化する高域部符号化手段
と、前記低域部符号化手段で得られた符号と前記高域部
符号化手段で得られた符号とを合成して出力する出力手
段とを備え、前記f1は、前記音響データ列が作成され
たときのサンプリング周波数f2の半分以下であること
を特徴とする。
記変換手段は、前記音響データを0〜2×f1Hzのス
ペクトルデータに変換し、前記分離手段は、0〜f1H
zの低域部スペクトルデータとf1〜2×f1Hzの高
域部スペクトルデータとに分離することを特徴とした
り、前記f1Hzまでの低域部スペクトルデータは、n
個のスペクトルデータから構成され、前記切り出し手段
は、2×n個のスペクトルデータを生成するのに必要な
個数の音響データを切り出し、前記変換手段は、切り出
された音響データを2×n個のスペクトルデータに変換
し、前記分離手段は、n個の低域部スペクトルデータと
n個の高域部スペクトルデータとに分離することを特徴
としたり、前記切り出し手段は、符号化の単位である1
フレームに相当するn個の音響データと、そのフレーム
に隣接する2つのフレームそれぞれに属するn/2個ず
つの音響データとを併せた2×n個のスペクトルデータ
を切り出し、前記変換手段は、切り出された2×n個の
音響データに対してMDCTによって前記変換を行い、
2×n個のスペクトルデータからなる0〜2×f1Hz
のスペクトルに変換することを特徴としたりする構成と
してもよい。
媒体または伝送媒体を介して入力された符号化データを
復号化する復号化装置であって、符号化データに含まれ
る低域部符号化データと高域部符号化データとをそれぞ
れ抽出する抽出手段と、前記抽出手段により抽出された
低域部符号化データを復号化し、逆量子化することによ
り、周波数f1以下の低域部のスペクトルデータを出力
する低域部逆量子化手段と、前記抽出手段により抽出さ
れた高域部データを復号化することにより、高域部スペ
クトルデータの特徴を表す補助情報を生成する補助情報
復号化手段と、前記補助情報復号化手段により生成され
た補助情報に基づいて高域部のスペクトルデータを出力
する高域部逆量子化手段と、前記低域部逆量子化手段に
よって出力された低域部スペクトルデータと、前記高域
部逆量子化手段によって出力された高域部スペクトルデ
ータとを合成する合成手段と、前記合成手段により合成
されたスペクトルデータを時間軸上の音響データに逆変
換する逆変換手段と、逆変換手段により逆変換された音
響データを時間順に出力する音響データ出力手段とを備
えることを特徴とする。
装置とからなる通信システムとして実現したり、上記符
号化装置、復号化装置および通信システムを構成する特
徴的な手段をステップとする符号化方法、復号化方法、
通信方法として実現したり、上記符号化装置、復号化装
置を構成する特徴的な手段やステップをCPUに実行さ
せる符号化プログラム、復号化プログラムとして実現し
たり、これらプログラムが記録されたコンピュータ読み
取り可能な記録媒体として実現したりすることができる
のはいうまでもない。
データ配信システムとしての放送システムに適用した場
合について、図面を用いて詳細に説明する。
の機能構成を示すブロック図である。同図に示される本
実施の形態に係る放送システム1は、放送局に設けら
れ、入力された音響信号を符号化する符号化装置300
と、ユーザの端末に設けられ、符号化装置300により
符号化されたビットストリーム音響信号を復号化する復
号化装置400とを備える。
は、入力された音響信号を符号化する符号化装置であっ
て、A/D変換器305と、音響データ入力部310
と、変換部320と、データ分離部330と、第1およ
び第2の量子化部340,345と、第1および第2の
符号化部350,355と、ストリーム出力部390と
を備える。
号を、例えば従来例1の2倍のサンプリング周波数4
4.1kHzでサンプリングし、アナログの音響信号か
らデジタルの音響データ(例えば、16ビット)に変換
し、時間軸上の音響データ列を生成する。
305によって生成された音響データ列を2048サン
プル(2フレーム)受け取るごとのサイクル(約45.
4msec)、すなわち従来例2の2倍に時間伸張され
たゆっくりとしたサイクルで、この2フレームの204
8サンプルと、これらのフレームの前後に隣接するフレ
ームの50%、1024サンプルをオーバーラップさせ
た音響データ列、すなわち従来の2倍の個数(4096
サンプル)の音響データ列を切り出すものであり、20
48サンプル受け取るごとの切り出しタイミングを検出
するためのカウンタ311と、4096サンプルの音響
データ列を一時的に格納するFIFOバッファ312と
を備える。
によって切り出された2フレーム分、4096サンプル
の音響データを、周波数軸上のスペクトルデータに変換
するものであり、時間軸上の4096サンプルの音響デ
ータを4096点の周波数軸上のスペクトルデータに変
換するMDCT321と、スペクトルデータをスケール
ファクターバンドでグループ分けするグループ分け部3
22とを備える。
サンプルの時間軸上の音響データを4096点のスペク
トルデータ(16ビット)に変換するが、左右対称な2
群のスペクトルデータとなるため、一方の2048サン
プルのスペクトルデータのみ符号化の対象とし、他方を
廃棄する。
換器305、音響データ入力部310および変換部32
0の構成を上記した従来例1の符号化装置1000のも
のと比較すると、A/D変換器305におけるサンプリ
ング周波数を2倍の周波数(44.1kHz)に引き上
げ、音響データ入力部310における切り出し長を2倍
(4096サンプル)に引き上げ、変換部320のMD
CT321における符号化単位を2倍(4096サンプ
ル)に引き上げている点で、大きく異なっている。
00の構成と比較すると、A/D変換器305における
サンプリング周波数が同一であるものの、音響データ入
力部310における切り出し長を2倍(4096サンプ
ル)に引き上げ、変換部320のMDCT321におけ
る符号化単位を2倍(符号化単位4096サンプル)に
引き上げている点で、大きく異なっている。
25kHz以下の低域部に属するスペクトルデータ(以
下、「低域部のスペクトルデータ」と記す。)が102
4個、11.025kHzを超える高域部に属するスペ
クトルデータ(以下、「高域部のスペクトルデータ」と
記す。)が1024個、合計2048個のスペクトルデ
ータが出力されることになる。
符号化の対象とされた一方の2048サンプルのスペク
トルデータを、それぞれ1サンプル以上(実用的には4
の倍数)のスペクトルデータを含む複数のスケールファ
クターバンドに分類する。
AC規格において、各スケールファクターバンドに含ま
れるサンプル(スペクトルデータ)数が周波数に応じて
定められており、低域部においては少数のサンプルごと
に細かく区切られ、高域部になるほど多数のサンプルを
含むよう大きく区切られている。また、AACにおいて
は、1フレームのスペクトルデータに対応するスケール
ファクターバンドの数もサンプリング周波数に応じて定
められている。例えば、サンプリング周波数が44.1
kHzの場合は、1フレームに含まれるスケールファク
ターバンドの数は49個であり、49個のスケールファ
クターバンドの中に1024サンプルのスペクトルデー
タが含まれている。一方、このように定められたスケー
ルファクターバンドのうち、どのスケールファクターバ
ンドを伝送するかはAACで特に規定されておらず、伝
送路の転送レートに応じて、最も好ましいスケールファ
クターバンドを選択して伝送すればよい。例えば、伝送
路の転送レートが96kbpsの場合、1フレームのう
ちの低域部40スケールファクターバンド(640サン
プル)のみを選択して伝送するようにしてもよい。
2フレームのスペクトルデータ(低域部のスペクトルデ
ータが1024個、高域部のスペクトルデータが102
4個)が従来の2倍のサイクル(約45.4msec)
でMDCT321から出力される。このため、伝送路の
転送レートが96kbpsの場合、2フレームのうちの
低域部のスケールファクターバンド(1024サンプ
ル)をすべて伝送対象としても、従来方式による2フレ
ーム分のデータ転送と比べると、AACの2倍(640
×2=1280サンプル)に対して、転送レートに十分
な余裕が生まれる。したがって、本実施の形態において
は、グループ分け部322が、変換後のスペクトルデー
タを、独自に定めた区切り方および数のスケールファク
ターバンドに分類した場合について説明する。
出力された2048個のスペクトルデータを低域部のス
ペクトルデータ(1024個)と、高域部のスペクトル
データ(1024個)とに分離する。そして、データ分
離部330は、分離した低域部のスペクトルデータ(1
024個)を第1の量子化部340に、高帯域のスペク
トルデータ(1024個)を第2の量子化部345に、
それぞれ出力する。
30から転送された低域部のスペクトルデータをスケー
ルファクターバンドごとに、スケールファクターをそれ
ぞれ決定し、決定したスケールファクターでそのスケー
ルファクターバンド内のスペクトルを量子化し、量子化
結果である量子化値と、決定したスケールファクターの
先頭と、スケールファクターの差分とを第1の符号化部
350に出力するものであり、スケールファクター計算
部341を備える。スケールファクター計算部341
は、例えば、公式にしたがって、スケールファクターバ
ンドごとにそのバンド内のスペクトルデータが所定のビ
ット数に収まるように1つの正規化係数(スケールファ
クター、8ビット)を計算し、そのスケールファクター
を用いてスケールファクターバンド内の各スペクトルを
量子化するとともに、スケールファクタの差分を計算す
る。
340により量子化されたデータと、スケールファクタ
ーバンドごとのスケールファクター等とを所定のストリ
ーム用のフォーマットに符号化するものであり、量子化
された各データと各スケールファクター等とをさらに圧
縮するためのハフマン符号化テーブル351を備える。
具体的には、ハフマン符号化テーブル351を用いて量
子化された各データと、各スケールファクター等とが低
ビットレートで伝送されるようにハフマン符号化する。
340において量子化されない帯域、すなわちデータ分
離部330が出力した11.025kHz以上の高域部
のスペクトルデータに基づいて、補助情報を計算して出
力するものであり、補助情報を生成するための補助情報
生成部346を備える。ここで、補助情報とは、高域部
のスペクトルデータに基づいて計算され、高域部のスペ
クトルデータの特徴をわずかな情報量で簡潔に表す簡略
化された情報をいう。つまり、一定時間分の入力音響デ
ータを変換して得られるスペクトルデータのうち、周波
数の高域部の特徴を表す情報であって、具体的な一例
は、高域部のスケールファクターバンド内で絶対最大ス
ペクトルデータ(絶対値が最大となるスペクトルデー
タ)の量子化値を「1」にするような、スケールファク
ターバンドごとの最適なスケールファクターおよびその
量子化値である。
345が出力した補助情報を所定のストリーム用のフォ
ーマットに符号化し、第2の符号化情報として出力する
ものであり、補助情報符号化のためのハフマン符号化テ
ーブル356を備える。
部350から出力される第1の符号化信号にヘッダ情報
およびその他必要に応じた副情報を付加して従来どお
り、AACの符号化ビットストリームに変換し、かつ第
2の符号化部355から出力された第2の符号化信号
を、上記ビットストリーム中の従来の復号化装置では無
視されるまたはその動作が規定されていない領域に格納
する。具体的には、ストリーム出力部390は、第2の
符号化部355から出力される符号化信号を、AACの
符号化ビットストリームにおけるFill Eleme
ntやData Stream Element等に格
納する。
トリームのサンプルリング周波数を示す情報は、音響デ
ータのサンプリング周波数の半分の値を格納しておく。
すなわち、音響データのサンプリング周波数が44.1
kHzの場合、ヘッダには実際の半分22.05kHz
という情報を格納しておく。そして、実際のサンプルリ
ング周波数44.1kHzを示す情報は、上記補助情報
が格納される領域等に格納すればよい。
トリームは、電波や光あるいはメタル等によって構成さ
れるインターネットなどの伝送媒体を介して復号化装置
400に伝送される。
320により得られた周波数軸上のスペクトルデータを
量子化および符号化する際に、データ分離部330によ
り低域部のスペクトルデータ(1024点)と、高域部
のスペクトルデータ(1024点)とに分離し、低域部
のスペクトルデータについては従来と同方式で量子化お
よび符号化し、高域部のスペクトルデータについては従
来とは異なる方式で量子化および符号化し(補助情報を
生成し、補助情報を符号化し)、低域部の符号化ビット
ストリームに高域部の符号化ビットストリームを組み込
んで出力する点が、スペクトルデータの量子化、符号化
を全帯域にわたり同じ方式で行う従来の符号化装置10
00と、大きく異なっている。
大幅に増加しない範囲で高品質の音響信号を符号化する
ことができる。また、ヘッダにサンプリング周波数2
2.05kHzという情報が格納されているので、本実
施の形態における符号化装置300が生成したビットス
トリームを、従来の復号化装置2000でも復号するこ
とができるという効果がある。
復号化装置400は、符号化装置300から出力された
ビットストリームを符号化装置300とほぼ逆の処理を
行って時間軸上の音響信号(再生上限周波数22.05
kHz)を再生するものであって、ストリーム入力部4
10と、第1および第2の復号化部420,425と、
第1および第2の逆量子化部430,435と、逆量子
化データ合成部440と、逆変換部480と、音響デー
タ出力部490と、D/A変換器495とを備える。
00によって符号化されたビットストリームを伝送媒体
を介して入力し、入力したビットストリームから、従来
の復号化装置が使用する領域に格納されている第1の符
号化信号と、従来の復号化装置が無視または動作が規定
されていない領域に格納されている第2の符号化信号と
をそれぞれ取り出し、第1の復号化部420と第2の復
号化部425とにそれぞれ出力する。
部410が出力する第1の符号化信号を入力し、ストリ
ーム用のフォーマットから量子化データに復号化するも
のであって、復号化するためのハフマン復号化テーブル
421を備える。
部420で復号された量子化データを逆量子化し、スペ
クトルデータを出力するものであって、公式に基づいて
量子化データを逆量子化するための処理部431を備え
る。ここで、第1の逆量子化部430が出力するスペク
トルデータのサンプル数は1024であり、これらは1
1.025kHz以下の再生帯域を表す。
部410の出力する第2の符号化信号を入力し、補助情
報を復号するものであって、補助情報を復号するための
ハフマン復号化テーブル426を備える。
づいて、高域部のスペクトルデータを生成するものであ
って、スペクトルデータ生成部436を備える。ここ
で、第2の逆量子化部435が出力するスペクトルデー
タのサンプル数は1024であり、これらは11.02
5kHzを超える再生帯域を表す。
逆量子化部430から出力されたスペクトルデータをも
とにあらかじめ決められた手順でノイズを生成し、第2
の復号化部425の出力する補助情報をもとに上記ノイ
ズを整形して、高域部のスペクトルデータを出力する。
このノイズには、ホワイトノイズや、ピンクノイズなど
の他、低域部スペクトルデータを一部または全部コピー
したスペクトルデータが含まれる。
6は、例えば、第1の逆量子化部430によって出力さ
れる低域部のスペクトルデータを高域部にコピーしてお
き、高域部のスケールファクターバンドごとに、バンド
内にコピーされたスペクトルデータの絶対最大値と、量
子化値「1」を補助情報に記述されているそのバンドに
対応するスケールファクター値を用いて逆量子化した値
との比率を係数として、バンド内の各スペクトルデータ
に乗じることによって高域部のスペクトルを復元する。
量子化部430の出力するスペクトルデータと第2の逆
量子化部435の出力するスペクトルデータを合成する
ものである。ここで、逆量子化データ合成部440が出
力するスペクトルデータのサンプル数は2048であ
り、0〜22.05kHzの再生帯域を表す。
号化装置300によって符号化されたビットストリーム
から、従来の復号化装置が使用する領域に格納されてい
る第1(低域部)の符号化信号と、従来の復号化装置が
無視または動作が規定されていない領域に格納されてい
る第2(高域部)の符号化信号とをそれぞれ分離し、第
1(低域部)の符号化信号だけを従来と同方式で復号化
および逆量子化し、第2(高域部)の符号化信号につい
ては、従来とは異なる方式で復号化および逆量子化し、
低域部のスペクトルデータと高域部のスペクトルデータ
とを合成して出力する点で、ビットストリームの復号
化、逆量子化を全帯域にわたり同じ方式で行う従来例
1,2の復号化装置2000と、その構成が大きく異な
っている。
から、従来と比べて大幅に増加した情報量を復号化する
ことができ、高音質の音響信号の復号化が可能になる。
逆変換部480は、逆量子化データ合成部440より出
力された周波数軸上のスペクトルデータを、IMDCT
を用いて2048サンプル(2フレーム)の時間軸上の
音響データに変換する。
0で得られた時間軸上の2048サンプルの音響データ
を順次組み合わせ、2048サンプルの音響データを時
間順に1つずつ出力する。
サンプリング周波数でデジタルの音響データからアナロ
グの音響信号に変換する。このように、復号化装置40
0は、逆変換部480における逆変換単位が2倍(20
48サンプル)に引き上げられ、音響データ出力部49
0におけるフレーム長が2倍(2048サンプル)にそ
れぞれ引き上げられ、D/A変換器495におけるサン
プリング周波数が2倍の周波数(44.1kHz)に引
き上げられている点で、上記した従来例1の復号化装置
2000とその構成が大きく異なっている。
1.025kHz以下の低域部のスペクトルデータ(1
024個)と、高域部のスペクトルデータ(1024
個)とに基づく、高帯域(0〜22.05kHz)で、
しかも高品質の音響信号が出力されることになる。
れば、従来と比べて大幅に増加しない範囲の情報量に基
づきながら、低域部は従来の符号化を行い、高域部を極
めて少ない情報量で符号化を行うことにより、高品質の
音響信号を符号化および復号化することができる。
00および復号化装置400の構成は、従来の符号化装
置1000にデータ分離部330、第2の量子化部34
5および第2の符号化部355を追加し、かつ従来の復
号化装置2000に第2の復号化部425、第2の逆量
子化部435および逆量子化データ合成部440を追加
しただけであるため、既存の符号化装置1000および
復号化装置2000の構成を大幅に変更することなく実
現できるという効果がある。
00が生成したビットストリームは、従来の復号化装置
2000でも復号することができるという効果がある。
次いで、放送システム1における符号化装置300の各
部の符号化処理を具体的に説明する。
音響データ入力部310および変換部320において処
理される音響信号の状態変化を示す図である。特に、図
2(a)は図1に示した音響データ入力部310によっ
て切り出される時間軸上の2048のサンプルデータを
示す波形図であり、図2(b)は時間軸上のサンプルデ
ータが図1に示した変換部320のMDCT321によ
って変換された後の周波数軸上のスペクトルデータを示
す波形図である。なお、図2(a)および図2(b)に
おいて、サンプルデータおよびスペクトルデータはアナ
ログ波形で示されているが、実際には、いずれもデジタ
ル信号である。以下の波形図においても同様である。
Hzでサンプリングされた音響データが入力される。音
響データ入力部310は、この音響データが2048サ
ンプル入力されるごとのタイミングでその前後1024
サンプルをオーバーラップさせて切り出し、変換部32
0に出力する。
データをMDCTするが、MDCTによって得られるス
ペクトルが左右対称の波形となるため、その半分の20
48サンプルに対応する図2(b)に示すようなスペク
トルデータを出力する。
軸に、周波数スペクトルの値、すなわち、図2(a)に
おいて2048サンプルの電圧値で表されていた音響デ
ータの周波数成分の量(大きさ)を、前記サンプル数に
対応する2048点で表している。また、符号化装置3
00に入力される音響信号をサンプリング周波数44.
1kHzでA/D変換しているので、スペクトルデータ
の再生帯域は、22.05kHzとなっている。さら
に、MDCT321によって得られるスペクトルは図2
(b)に示すように負の値をとる場合があるので、MD
CT321によって得られたスペクトルを符号化する場
合には、スペクトルの正負の符号も合わせて符号化する
必要がある。以下では、符号化の符号との混同を避ける
ため、スペクトルデータの正負の符号を表す情報を「サ
イン情報」という。
ータおよびサイン情報は、データ分離部330におい
て、0〜11.025kHzの低域部と、11.025
kHz〜の高域部とに分離され、低域部のスペクトルデ
ータ等は第1の量子化部340に、高域部のスペクトル
データ等は第2の量子化部345に、それぞれ出力され
る。
0のスケールファクター決定処理における動作を示すフ
ローチャートである。第1の量子化部340は、まず、
スケールファクターの初期値として、各スケールファク
ターバンドに共通のスケールファクターを定め(S9
1)、そのスケールファクターを用いて1フレーム分
(1024サンプル)の音響データとして伝送されるべ
き低域部スペクトルデータをすべて量子化するととも
に、求められたスケールファクターの前後の差分を求
め、その差分と先頭のスケールファクターと各量子化値
とをハフマン符号化する(S92)。なお、ここでの量
子化および符号化は、ビット数のカウントのためだけに
行うので、処理を簡略化するため、データのみについて
行い、ヘッダなどの情報は付加しないものとする。
ン符号化後のデータのビット数が所定のビット数を超え
たか否かを判断し(S93)、超えていれば、スケール
ファクターの初期値を下げ(S101)、そのスケール
ファクターの値を用いて、同じ低域部スペクトルデータ
につき、量子化とハフマン符号化とをやり直した上(S
92)、ハフマン符号化後の1フレーム分の低域部符号
化データのビット数が所定のビット数を超えたか否かを
判断して(S93)、所定ビット数以下になるまでこの
処理を繰り返す。
ータのビット数が所定のビット数を超えていなければ、
スケールファクターバンドごとに以下の処理を繰り返
し、各スケールファクターバンドのスケールファクター
を決定する(S94)。まず、スケールファクターバン
ド内の各量子化値を逆量子化し(S95)、それぞれの
逆量子化値とそれに対応するもとのスペクトルデータと
の各絶対値の差分を求めて合計する(S96)。さら
に、求められた差分の合計が許容範囲内の値であるか否
かを判断し(S97)、許容範囲内であれば、次のスケ
ールファクターバンドにつき、上記の処理を繰り返す
(S94〜S98)。
ファクターの値を大きくして当該スケールファクターバ
ンドのスペクトルデータを量子化するとともに(S10
0)、その量子化値を逆量子化して(S95)、逆量子
化値と対応するスペクトルデータとの絶対値の差分を合
計する(S96)。さらに、差分の合計が許容範囲内か
どうかを判断して(S97)許容範囲を超えていれば、
許容範囲内となるまでスケールファクターを順次大きく
し(S100)、上記の処理(S95〜S97およびS
100)を繰り返す。
ルファクターバンドにつき、スケールファクターバンド
内の量子化値を逆量子化した値ともとのスペクトルデー
タとの絶対値の差分の合計が許容範囲となるようなスケ
ールファクターを決定すると(S98)、決定されたス
ケールファクターを用いて、再度、1フレーム分の低域
部スペクトルデータを量子化し、各スケールファクター
の差分と先頭のスケールファクターと各量子化値とをハ
フマン符号化し、低域部符号化データのビット数が所定
のビット数を超えているか否かを判定する(S99)。
低域部符号化データのビット数が所定のビット数を超え
ていれば、それが所定のビット数以下になるまでスケー
ルファクターの初期値を下げた後(S101)、各スケ
ールファクターバンド内のスケールファクターを決定す
る処理(S94〜S98)を繰り返す。低域部符号化デ
ータのビット数が所定のビット数を超えていなければ
(S99)、そのときの各スケールファクターの値を、
各スケールファクターバンドのスケールファクターに決
定する。
されたスケールファクターを用いて、低域部のスペクト
ルデータを量子化し、量子化値と、決定したスケールフ
ァクターの先頭と、スケールファクターの差分とを、デ
ータ分離部330から受け取ったサイン情報と供に第1
の符号化部350に出力する。
化値を逆量子化した値ともとのスペクトルデータとの絶
対値の差分の合計が許容範囲となるかどうかの判断は、
聴覚心理モデルなどのデータに基づいて行われる。
値を比較的大きな数値に設定し、ハフマン符号化後の低
域部符号化データのビット数が、所定のビット数を超え
た場合には、順次、スケールファクターの初期値を下げ
ていく方法でスケールファクターを決定しているが、必
ずしもこのようにする必要はない。例えば、あらかじめ
スケールファクターの初期値を低い値に設定しておき、
その初期値を徐々に増加していき、低域部符号化データ
の全体のビット数が所定のビット数を最初に超えた段階
で、直前に設定されていたスケールファクターの初期値
を用いて各スケールファクターバンドのスケールファク
ターを決定するようにしてもよい。
号化データ全体のビット数が所定のビット数を超えない
ように各スケールファクターバンドのスケールファクタ
ーを決定したが、必ずしもこのようにしなくてよい。例
えば、各スケールファクターバンドにおいて、スケール
ファクターバンド内の各量子化値が所定のビット数を超
えないようスケールファクターを決定するようにしても
よい。以下に、図4を用いて、この処理における第1の
量子化部340の動作を説明する。
0の他のスケールファクター決定処理における動作を示
すフローチャートである。第1の量子化部340は、符
号化の対象となる低域部のすべてのスケールファクター
バンドについて、以下の手順によりスケールファクター
の計算を行う(S1)。また、第1の量子化部340
は、各スケールファクターバンド内のすべてのスペクト
ルデータにつき、以下の手順によりスケールファクター
の計算を行う(S2)。
ケールファクターの値で、スペクトルデータを公式に基
づいて量子化し(S3)、その量子化値が量子化値を表
すために与えられる所定のビット数、例えば、4ビット
を超えたか否かを判定する(S4)。
いる場合、スケールファクターの値を調整し(S8)、
調整後のスケールファクターの値で同じスペクトルデー
タを量子化する(S3)。第1の量子化部340は、得
られた量子化値が4ビットを超えたか否かを判定し(S
4)、そのスペクトルデータの量化値が4ビット以下の
値になるまで、スケールファクターの調整(S8)と調
整後のスケールファクターによる量子化(S3)とを繰
り返す。
る場合、次のスペクトルデータについて、所定のスケー
ルファクターの値で、量子化を行う(S3)。第1の量
子化部340は、1つのスケールファクターバンド内の
すべてのスペクトルデータの量子化値が4ビット以下と
なると(S5)、そのときのスケールファクターの値
を、そのスケールファクターバンドのスケールファクタ
ーに決定する(S6)。
のスケールファクターバンドにつき、スケールファクタ
ーを決定すると(S7)、処理を終了する。以上の処理
により、符号化の対象となる低域部のすべてのスケール
ファクターバンドにつき、それぞれ1つのスケールファ
クターが決定される。第1の量子化部340は、このよ
うに決定されたスケールファクターを用いて、低域部の
スペクトルデータを量子化し、量子化結果である4ビッ
トの量子化値と、8ビットの前記スケールファクターの
先頭と、スケールファクタの差分とを、データ分離部3
30から受け取ったサイン情報と供に、第1の符号化部
350に出力する。
値およびスケールファクター等は、ハフマン符号化さ
れ、ダウンサンプリングの場合と同等の第1の符号化信
号としてストリーム出力部390に出力される。
スペクトルデータ等に基づいて、補助情報を生成する。
図5は図1に示した第2の量子化部345によって生成
される補助情報(スケールファクター)の具体例を示す
スペクトル波形図であり、図6は図1に示した第2の量
子化部345の補助情報(スケールファクター)計算処
理における動作を示すフローチャートである。
に示す区切りは、それぞれ本実施の形態において定めた
スケールファクターバンドの区切りを示している。ま
た、高域部において周波数方向に破線で示す区切りは、
本実施の形態において定めた高域部のスケールファクタ
ーバンドの区切りを示している。以下の波形図において
も同様である。
ータのうち、図5に実線の波形で示す再生帯域11.0
25kHz以下の低域部は、第1の量子化部340に出
力され、従来どおり量子化される。一方、図5に破線の
波形で示す再生帯域11.025kHzを超える再生帯
域22.05kHzまでの高域部は、第2の量子化部3
45によって計算される補助情報(スケールファクタ
ー)によって表される。
チャートにしたがって第2の量子化部345の補助情報
(スケールファクター)の計算手順を説明する。第2の
量子化部345は、再生帯域11.025kHzを超え
る再生帯域22.05kHzまでの高域部のすべてのス
ケールファクターバンドにつき、各スケールファクター
バンドにおける絶対最大スペクトルデータの量子化値を
「1」にする最適なスケールファクターを、以下の手順
にしたがって計算する(S11)。
025kHzを超える高域部の最初のスケールファクタ
ーバンドにおける絶対最大スペクトルデータ(ピーク)
を特定する(S12)。図5の具体例において、最初の
スケールファクターバンド内で特定されたピークの位置
がで、そのときのピークの値が「256」であったと
する。
ャートに示した手順と同様にして、量子化値を計算する
公式にピークの値「256」と初期値のスケールファク
ター値とをあてはめ、公式から得られる量子化値が
「1」となるスケールファクターsfの値を計算する
(S13)。例えば、この場合、ピーク値「256」の
量子化値を「1」にするスケールファクターsfの値、
例えばsf=24が算出される。
て、ピークの量子化値を「1」にするスケールファクタ
ーの値sf=24が求められると(S14)、第2の量
子化部345は、次のスケールファクターバンドについ
て、スペクトルデータのピークを特定し(S12)、例
えば、特定されたピークの位置がで、その値が「31
2」であった場合、ピーク値「312」の量子化値が
「1」となるスケールファクターsfの値、例えばsf
=32を計算する(S13)。
域部における3番目のスケールファクターバンドについ
て、ピークの値「288」の量子化値を「1」にする
スケールファクターsfの値、例えばsf=26を計算
し、4番目のスケールファクターバンドについて、ピー
クの値「203」の量子化値を「1」にするスケール
ファクターsfの値、例えばsf=18を計算する。
ルファクターバンドについて、ピーク値の量子化値を
「1」にするスケールファクターが計算されると(S1
4)、第2の量子化部345は、計算によって得られた
各スケールファクターバンドのスケールファクターを、
高域部の補助情報として第2の符号化部355に出力
し、処理を終了する。
よって補助情報(スケールファクター)が生成される
が、この補助情報(スケールファクター)は、1024
点のスペクトルデータで表されていた高域部を、各スケ
ールファクターの値を0〜255までの値で表せば、高
域部における各スケールファクターバンド(ここでは4
つ)につき、それぞれ8ビットで表すことができる。ま
た、この各スケールファクターの差分をハフマン符号化
するようにすれば、データ量をさらに低減できる可能性
がある。これに対し、この高域部の1024点のスペク
トルデータを低域部と同様に従来の方法で量子化および
ハフマン符号化したとすると、最低でも300ビット程
度のデータ量になると予測される。したがって、この補
助情報は、高域部の各スケールファクターバンドにつき
1つのスケールファクターを示しているに過ぎないが、
従来の方法にしたがって高域部を量子化する場合に比べ
て、データ量が大きく低減されていることがわかる。
ールファクターバンドにおけるピーク値(絶対値)にほ
ぼ比例した値を示しており、高域部における1024点
で一定値をとるスペクトルデータあるいは低域部のスペ
クトルデータの一部または全部のコピーにスケールファ
クターを乗算して得られるスペクトルデータは、入力音
響信号に基づいて得られたスペクトルデータを大まかに
復元しているといえる。また、スケールファクターバン
ドごとに、バンド内にコピーされたスペクトルデータの
絶対最大値と、そのバンドに対応するスケールファクタ
ー値を用いて量子化値「1」を逆量子化した値との比率
を係数として、バンド内の各スペクトルデータに乗じる
ことにより、より精度よくスペクトルデータを復元する
ことができる。さらに、高域部の波形の相違は、低域部
ほど聴覚的にはっきり識別されるものではないので、こ
のようにして得られた補助情報は、高域部の波形を表す
情報として十分であるといえる。
クターバンド内のスペクトルデータの量子化値が「1」
となるようスケールファクターを計算したが、必ずしも
「1」である必要はなく、他の値に定めておいてもよ
い。
助情報は、第2の符号化部355によりハフマン符号化
され、ストリーム出力部390により第2の符号化信号
としてビットストリーム中の従来の復号化装置では無視
されるまたはその動作が規定されていない領域に格納さ
れる。
90によって補助情報が格納されるビットストリーム中
の位置を示す図である。図7において、高域部のスペク
トルを表す補助情報は、符号化された後、第2の符号化
信号としてビットストリーム中の音響符号化信号として
認識されない領域に格納される。
えば、ビットストリームのデータ長を合わせるために
「0」で埋められる領域(Fill Element)
であって、この領域に、高域部のスペクトルを表す補助
情報、すなわち第2の符号化信号が格納されていても、
従来の復号化装置2000では復号化すべき符号化信号
とは認識されず、無視される。
は、例えば、Data Stream Element
(DSE)という領域であって、この領域は、将来の拡
張のためAACの規格によってビット長などの物理的構
造だけが規定された領域である。この領域は、Fill
Elementと同様、ここに高域部のスペクトルを
表す補助情報が格納されていても、従来の復号化装置2
000では無視されるかまたはそのデータが読み取られ
たとしても読み取られたデータに対する復号化装置20
00の動作が規定されていない領域である。
格によって従来の復号化装置2000では無視されるよ
うなビットストリーム中の領域に第2の符号化信号を格
納するとしたが、それ以外にも、ヘッダ情報の所定の位
置に組み込んでもよいし、第1の符号化信号中の所定の
位置に第2の符号化信号を組み込んでもよいし、その両
方にまたがって組み込んでもよい。またビットストリー
ム中に第2の符号化信号を格納するために、ヘッダにお
いても第1の符号化信号においても、連続した領域を確
保しなくてもよい。すなわち、図7(c)のように、ヘ
ッダ情報と第1の符号化情報との中に、非連続に第2の
符号化信号を組み込んでもよい。
90が補助情報を格納する場合の他の例を示す図であ
る。図8(a)は、第1の符号化信号のみがフレームご
とに連続して格納されているストリーム1を示してい
る。図8(b)は、補助情報が符号化された第2の符号
化信号のみが、ストリーム1に対応するフレームごとに
連続して格納されているストリーム2を示している。
信号を、第1の符号化信号を格納したビットストリーム
であるストリーム1とは全く別のストリーム2に格納し
てもよい。例えば、ストリーム1とストリーム2とは、
異なるチャンネルで伝送されるビットストリームであ
る。
号化信号を全く異なるビットストリームで伝送すること
により、入力音響信号の基本的な情報を表す低域部分を
あらかじめ伝送または蓄積しておき、必要に応じて高域
部情報を後から付加することができるという効果があ
る。
ットにおいて、ヘッダに格納するビットストリームのサ
ンプルリング周波数を示す情報には、実際のサンプルリ
ング周波数の半分である22.05kHzという情報を
格納しておく。これにより、従来例1の復号化装置20
00でも0〜11.025kHz帯のビットストリーム
を復号化し、ダウンサンプリングの場合と同様に再生す
ることができる。
装置300の方式と、従来例1の符号化装置1000の
方式の相違を、図9を用いて説明する。図9は、実施の
形態に係る方式と従来例1に係る方式(ダウンサンプリ
ング方式)とを比較して示す図であり、特に図9(a)
は実施の形態に係る方式を示す図であり、図9(b)は
従来例1に係る方式を示す図である。
プリング周波数を44.1kHzとすることにより、2
2.7μsecごとの音響データ列を取得し、符号化対
象のフレームに含まれる2048個と、その前後の10
24個ずつとの計4096個を切り出し、MDCTする
ことにより2048個のスペクトルデータを取得してい
る。このスペクトルデータの再生帯域は、22.05k
Hzを表している。この2048個のスペクトルデータ
は、11.025kHzを境界として低域部のスペクト
ルデータ(1024個)と、高域部のスペクトルデータ
(1024個)とに分離される。低域部のスペクトルデ
ータ(1024個)は、通常の量子化・符号化が行わ
れ、ダウンサンプリングと同等の高品質で低ビットレー
トの第1の符号化信号が取得される。しかも、高域部に
ついても1024個のスペクトルデータが取得されてい
る。これを、通常の量子化・符号化すると、低ビットレ
ートを実現できない。そこで、本実施の形態に係る方式
においては、高域部の1024個のスペクトルデータか
ら補助情報を生成し、補助情報のみ符号化することによ
り第2の符号化信号を取得している。したがって、情報
量の合計が、大幅に増加しない範囲で高品質の音響信号
を符号化することができる。
ングによる方式においては、サンプリング周波数を2
2.05kHzとすることにより、45μsecごとの
音響データ列を取得し、符号化対象のフレームに含まれ
る1024個と、その前後の512個ずつとの計204
8個を切り出し、MDCTすることにより1024個の
スペクトルデータを取得している。このスペクトルデー
タの再生帯域は、11.025kHzを表している。こ
の1024個のスペクトルデータは、通常の量子化・符
号化が行われる。したがって、11.025kHz以下
については品質の高い符号化信号を取得できるものの、
11.025kHzを超える高域部のスペクトルデータ
が全くないため、高域部の符号化信号を取得できなかっ
た。
装置300の方式と、従来例2の符号化装置1000の
方式の相違を、図10を用いて説明する。図10は、実
施の形態に係る方式と従来例2に係る方式とを比較して
示す図であり、特に図10(a)は実施の形態に係る方
式を示す図であり、図10(b)は従来例2に係る方式
を示す図である。なお、本実施の形態に係る方式につい
ては、上述したので、その説明を省略する。
ては、本実施の形態の場合と同様にサンプリング周波数
を44.1kHzとすることにより、22.7μsec
ごとの音響データ列を取得する一方、符号化対象のフレ
ームに含まれる1024個と、その前後の512個ずつ
との計2048個を切り出し、MDCTすることにより
1024個のスペクトルデータを取得している。このス
ペクトルデータの再生帯域は、22.05kHzを表し
ている。この1024個のスペクトルデータは、通常の
量子化・符号化が行われる。すなわち、本実施の形態の
半分の時間(約22.7msec)ごとに、1024個
のスペクトルデータ(11.025kHz以下の低域で
は512個、11.025kHzを超える高域では51
2個)を取得している。
おいて本発明の実施の形態と同様に11.025〜2
2.05kHzの高域のスペクトルデータから補助情報
を生成した場合を仮定する。この場合において、約2
2.7msecごとに量子化で使用できるビット数をn
とし、補助情報として使用できるビット数をm1とする
と、低域(0〜11.025kHz)の512サンプル
を(n−m1)ビットで量子化する必要がある。これに
対して、本発明の実施の形態の場合、量子化で使用でき
る約45.4msecごとのビット数が2×nとし、補
助情報として使用できるビット数をm2とすると、低域
(0〜11.025kHz)の1024サンプルを(2
×n−m2)ビットで量子化すればよい。
るサンプル数(しきい値)以上集まらないと、高い符号
化効率を得られないことが知られており、従来例2の5
12サンプルの場合にはしきい値に達せず、本実施の形
態の1024サンプルの場合にはしきい値を十分に超え
る。
プルを(n−m1)ビットで量子化するより、本実施の
形態のように1024サンプルを(2×n−m2)ビッ
トで量子化する方が、より高い符号化効率が得られる。
また、本実施の形態の方が高い符号化効率を得られる結
果、m2をより大きくでき(m2>2×m1)、高域部
の音質を高めることが可能となる。
従来例1,2の符号化方式とのスペクトルデータおよび
特徴について、比較した図である。本実施の形態では、
サンプリング周波数44.1kHzで、フレーム長を2
048個としている。このため、スペクトルデータでは
0〜11.025kHzの低域部に1024個のスペク
トルデータと、11.025〜22.05kHzの高域
部の1024個のスペクトルデータに基づく補助情報と
を取得している。この結果、本実施の形態では、帯域の
面では、従来例2に対して略同一であるが、従来例1に
対して広くなる。また、本実施の形態では、音質の面で
は、従来例1に対し、0〜11.025kHzの低域部
については同一品質であるが、11.025〜22.0
5kHzの高域部については補助情報があるため、全体
として高品質となり、従来例2に対し、11.025〜
22.05kHzの高域部については補助情報があるた
め略同一品質を得ることができ、しかも0〜11.02
5kHzの低域部についてはスペクトルデータの数が倍
加されている分高品質であるので、全体として高品質と
なる。
周波数22.05kHzで、フレーム長を1024とし
ており、スペクトルデータでは0〜11.025kHz
の帯域に1024個のスペクトルデータを取得してい
る。この結果従来例1では、本実施の形態に対して、帯
域の面では半減し、狭くなる。このため、音質の面で
は、0〜11.025kHzの低域部については同一品
質であるが、11.025〜22.05kHzの高域部
についてはスペクトルデータが全くないので悪くなり、
全体として低くなる。
44.1kHzで、フレーム長を1024としており、
スペクトルデータでは0〜22.05kHzの全帯域に
1024個のスペクトルデータを取得している。この結
果従来例2では、本実施の形態に対して、帯域の面では
同じであるが、音質の面では、11.025〜22.0
5kHzの高域部についてはスペクトルデータが符号化
されるので高品質となるものの、帯域0〜11.025
kHzの低域部についてはスペクトルデータの個数が半
減するため、品質が落ち、全体として品質は低くなる。
部は従来の符号化を行い、高域部を極めて少ない情報量
で符号化を行うことにより、情報量の合計が、従来と比
べて大幅に増加しない範囲で高品質の音響信号を符号化
することができる。
置400の各部の符号化処理を具体的に説明する。スト
リーム入力部410から出力された第1の符号化信号
は、第1の復号化部420により量子化データ等に復号
化され、第1の逆量子化部430により低域部のスペク
トルデータに符号化される。一方、ストリーム入力部4
10から出力された第2の復号化信号は、第2の復号化
部425により補助情報に復号化される。第2の逆量子
化部435は、補助情報に基づいて高域部のスペクトル
データを生成する。この第2の逆量子化部435におけ
る処理を詳細に説明する。
435によって低域部1024スペクトルが順方向に高
域部にコピーされる手順を示すフローチャートである。
このような低域部のスペクトルデータのコピーは、高域
部のスペクトルデータを生成するに際して実行される。
[i]は、第1の逆量子化部430の出力データのうち
のi番目のスペクトルの値を示し、inv_spec2
[j]は、第2の逆量子化部435の入力データのうち
のj番目のスペクトルの値を示している。
のスペクトルから1023番目のスペクトルまでを同方
向に入力するため、スペクトルの数をカウントするカウ
ンタi、jの初期値をそれぞれ「0」にセットする(S
71)。次いで、第2の逆量子化部435は、カウンタ
iの値が「1024」未満であるか否かを調べ(S7
2)、カウンタiの値が「1024」未満であれば、第
1の逆量子化部430の低域部i番目(この場合、0番
目)のスペクトルの値を、第2の逆量子化部435の高
域部j番目(この場合、0番目)のスペクトルの値とし
て入力する(S73)。この後、第2の逆量子化部43
5は、カウンタi、jの値をそれぞれ「1」だけインク
リメントし(S74)、カウンタiの値が「1024」
未満であるか否かを調べる(S72)。
値が「1024」未満である間、上記処理を繰り返し、
カウンタiの値が「1024」以上になると、処理を終
了する。
子化結果である0〜1023番目の低域部の全スペクト
ルが、そのまま第2の逆量子化部435の高域部のスペ
クトルとしてコピーされる。
ータは、第2の復号化部425によって復号化された補
助情報、すなわちピーク値を「1」にするスケールファ
クターの値に応じてコピーしたスペクトルデータの振幅
が調整され、高域部のスペクトルデータとして出力され
る。なお、振幅の調整は、スケールファクターバンドご
とに、バンド内にコピーされたスペクトルデータの絶対
最大値と、そのバンドに対応するスケールファクター値
を用いて量子化値「1」を逆量子化した値との比率を係
数として、バンド内の各スペクトルデータに乗じること
で達成される。ここで、第2の逆量子化部435が出力
するスペクトルデータの最大サンプル数は1024であ
り、これらは11.025を超える再生帯域を表す。
スペクトルを周波数軸方向の順方向に高域部にコピーさ
れる手順を示したが、図13に示すようにこれと逆方向
にコピーしてもよい。
435によって低域部1024スペクトルが周波数軸方
向の逆方向に高域部にコピーされる手順を示すフローチ
ャートである。図12と同様、図13において、inv
_spec1[i]は、第1の逆量子化部430の出力
データのうちのi番目のスペクトルの値を示し、inv
_spec2[j]は、第2の逆量子化部435の入力
データのうちのj番目のスペクトルの値を示している。
のスペクトルから1023番目のスペクトルまでを逆方
向に入力するため、スペクトルの数をカウントするカウ
ンタiの初期値を「0」に、jの初期値を「1023」
にセットする(S81)。次いで、第2の逆量子化部4
35は、カウンタiの値が「1024」未満であるか否
かを調べ(S82)、カウンタiの値が「1024」未
満であれば、第1の逆量子化部430の低域部i番目
(この場合、0番目)のスペクトルの値を、第2の逆量
子化部435の高域部j番目(この場合、1023番
目)のスペクトルの値として入力する(S83)。この
後、第2の逆量子化部435は、カウンタiの値を
「1」だけインクリメントし、jの値を「1」だけデク
リメントして(S84)、カウンタiの値が「102
4」未満であるか否かを調べる(S82)。
値が「1024」未満である間、上記処理を繰り返し、
カウンタiの値が「1024」以上になると、処理を終
了する。
子化結果である0〜1023番目の低域部の全スペクト
ルが、第2の逆量子化部435の高域部の1023〜0
番目のスペクトルとして逆方向にコピーされる。
トルデータは、第2の復号化部425によって復号化さ
れた補助情報、すなわちピーク値を「1」にするスケー
ルファクターの値に応じてコピーしたスペクトルデータ
の振幅が調整され、高域部のスペクトルデータとして出
力される。なお、振幅の調整は、スケールファクターバ
ンドごとに、バンド内にコピーされたスペクトルデータ
の絶対最大値と、そのバンドに対応するスケールファク
ター値を用いて量子化値「1」を逆量子化した値との比
率を係数として、バンド内の各スペクトルデータに乗じ
ることで達成される。ここで、第2の逆量子化部435
が出力するスペクトルデータの最大サンプル数は102
4であり、これらは11.025を超える再生帯域を表
す。
おけるすべてのスペクトルデータを高域部にコピーした
が、一部のみコピーしてもよい。また、高域部と低域部
の全体を一度にコピーする手順として図12および図1
3の場合を例として挙げたが、一部図12のようにコピ
ーし、一部図13のようにコピーしてもよい。
符号を反転してコピーしてもよい。さらに、これらのコ
ピー手順は、あらかじめ決めておいてもよいし、低域部
のデータに応じて変更してもよいし、補助情報として伝
送してもよい。
ータを高域部側のスペクトルデータとしてコピーしてい
るが、これに限らず、高域部側のスペクトルデータは第
2の符号化情報のみから生成してもよい。
逆量子化部435におけるノイズ生成として、主として
第1の逆量子化部430から得られるスペクトルデータ
をコピーする場合について説明したが、これに限ったも
のでなく、高域部の各スケールファクターバンド内にお
いて一定値をもつスペクトルデータ、ホワイトノイズ、
およびピンクノイズなどを、第2の逆量子化部435で
独自に生成してもよいし、補助情報に応じて生成しても
よい。
024個のスペクトルデータは、逆量子化データ合成部
440において第1の逆量子化部430から出力された
スペクトルデータ(1024個)と合成され、IMDC
Tされることにより時間軸上の音響データに逆変換さ
れ、サンプリング周波数44.1kHzでD/A変換さ
れることにより再生帯域0〜22.05kHzの音声信
号が再生される。
換長をもつMDCTおよびIMDCTを用いて、204
8サンプルのスペクトルデータに対して前半1024サ
ンプルのみを対象として従来の符号化を行い、残りの後
半1024サンプルについては従来と比べて少ない情報
量での符号化を行い、復号時にそれらを合成した。
の符号化に必要な情報量を削減できることで、前半10
24サンプルのスペクトルデータの符号化に必要な情報
量を増加させることができ、低域部の原信号に対する精
度を向上させつつも、広帯域な符号化を行うことができ
た。
たビットストリームは、従来の復号化装置でも復号する
ことができる。次いで、補助情報およびその復号化の種
々変形例について説明する。
45によって生成される他の補助情報(量子化値)の具
体例を示すスペクトル波形図である。また、図15は、
図1に示した第2の量子化部345の他の補助情報(量
子化値)計算処理における動作を示すフローチャートで
ある。
025kHzを超える再生帯域22.05kHzまでの
高域部のすべてのスケールファクターバンドにつき共通
のスケールファクター値、例えば「18」をあらかじめ
定めておき、そのスケールファクター値「18」を用い
て、スケールファクターバンドごとに、そのスケールフ
ァクターバンドにおける絶対最大値スペクトルデータ
(ピーク)の量子化値を計算する(S21)。
025kHzを超える高域部の最初のスケールファクタ
ーバンドにおける絶対最大スペクトルデータ(ピーク)
を特定する(S22)。図14の具体例において、最初
のスケールファクターバンド内で特定されたピークの位
置がで、そのときのピークの値が「256」であった
とする。
する公式に、あらかじめ定めた共通のスケールファクタ
ー値「18」とピークの値「256」とをあてはめ、量
子化値を計算する(S23)。例えば、この場合、ピー
ク値「256」をスケールファクター値「18」で量子
化すると、量子化値「6」が算出される。
て、ピーク値「256」の量子化値「6」が求められる
と(S24)、第2の量子化部345は、次のスケール
ファクターバンドについて、スペクトルデータのピーク
を特定し(S22)、例えば、特定されたピークの位置
がで、その値が「312」であった場合、スケールフ
ァクターの値を「18」とするピーク値「312」の量
子化値、例えば「10」を計算する(S23)。
域部における3番目のスケールファクターバンドについ
て、スケールファクターの値を「18」とするピーク
の値「288」の量子化値「9」を計算し、4番目のス
ケールファクターバンドについて、スケールファクター
の値を「18」とするピークの値「203」の量子化
値「5」を計算する。
ルファクターバンドについて、スケールファクターを
「18」に固定した場合のピーク値の量子化値が計算さ
れると(S24)、第2の量子化部345は、計算によ
って得られた各スケールファクターバンドの量子化値
を、高域部の補助情報として第2の符号化部355に出
力し、処理を終了する。
よって補助情報(量子化値)が生成されるが、この補助
情報(量子化値)は、1024点のスペクトルデータで
表されていた高域部を、4つのスケールファクターバン
ドにつき、それぞれ4ビットの量子化値で表している。
これに対し、前述の補助情報(スケールファクター)で
は、高域部を、4つのスケールファクターバンドにつ
き、それぞれ8ビットのスケールファクターで表してい
たので、これと比較すると、高域部のデータ量がより低
減されている。また、この量子化値は、各スケールファ
クターバンドにおけるピーク値(絶対値)の振幅を大ま
かに表しており、高域部における1024点で一定値を
とるスペクトルデータあるいは低域部のスペクトルデー
タの一部または全部のコピーに、これを単純に乗算して
得られるスペクトルデータであっても、入力音響信号に
基づいて得られたスペクトルデータを大まかに復元して
いるといえる。また、スケールファクターバンドごと
に、バンド内にコピーされたスペクトルデータの絶対最
大値と、あらかじめ定められていたスケールファクター
値を用いてそのバンドに対応する量子化値を逆量子化し
た値との比率を係数として、バンド内の各スペクトルデ
ータに乗じることにより、さらに精度よくスペクトルデ
ータを復元することができる。
情報として伝送される量子化値に対応するスケールファ
クター値は、あらかじめ定めたものにしたが、最適なス
ケールファクター値を計算し、第2の符号化情報に付加
して伝送してもよい。例えば、量子化値の最大値が7と
なるようにスケールファクターを選択すれば、量子化値
を表すビット数が3ビットですむので、量子化値の伝送
に必要な情報量はより少なくてすむ。
45によって生成される他の補助情報(位置情報)の具
体例を示すスペクトル波形図である。また、図17は、
図1に示した第2の量子化部345の他の補助情報(位
置情報)計算処理における動作を示すフローチャートで
ある。
025kHzを超える再生帯域22.05kHzまでの
高域部のすべてのスケールファクターバンドにつき、各
スケールファクターバンドにおける絶対最大スペクトル
データの位置を以下の手順にしたがって特定する(S3
1)。
025kHzを超える高域部の最初のスケールファクタ
ーバンドにおける絶対最大スペクトルデータ(ピーク)
を特定する(S32)。図16の具体例において、最初
のスケールファクターバンド内で特定されたピークの位
置がで、このスケールファクターバンドの先頭から2
2番目のスペクトルデータであったとする。第2の量子
化部345は、特定されたピークの位置「スケールファ
クターバンドの先頭から22番目のスペクトルデータ」
を保持する(S33)。
て、ピークの位置が特定され、保持されると(S3
4)、第2の量子化部345は、次のスケールファクタ
ーバンドについて、スペクトルデータのピークを特定す
る(S32)。例えば、特定されたピークの位置が
で、スケールファクターバンドの先頭から60番目のス
ペクトルデータであったとする。第2の量子化部345
は、特定されたピークの位置「スケールファクターバン
ドの先頭から60番目のスペクトルデータ」を保持する
(S33)。
は、高域部における3番目のスケールファクターバンド
について、ピークの位置「スケールファクターバンド
の先頭のスペクトルデータ」を特定して保持するととも
に、4番目のスケールファクターバンドについて、ピー
クの位置「スケールファクターバンドの先頭から25
番目のスペクトルデータ」を特定して保持する。
ルファクターバンドについて、ピークの位置が特定さ
れ、保持されると(S34)、第2の量子化部345
は、保持していた各スケールファクターバンドのピーク
の位置を、高域部の補助情報として第2の符号化部35
5に出力し、処理を終了する。
よって補助情報(位置情報)が生成されるが、この補助
情報(位置情報)は、1024点のスペクトルデータで
表されていた高域部を、4つのスケールファクターバン
ドにつき、それぞれ6ビットの位置情報で表している。
2の逆量子化部435は、低域部の1024サンプル分
のスペクトルデータの一部または全部を、第2の復号化
部425から入力された補助情報(位置情報)に応じて
高域部側の1024サンプルデータとしてコピーする。
コピーの手順は、1つ以上のスケールファクターバンド
におけるスペクトルデータのピーク情報をもとに、類似
したデータを第1の逆量子化部430より出力されたス
ペクトルデータより抽出し、その一部または全部をコピ
ーすることで達成される。また、第2の逆量子化部43
5においては、必要に応じてコピーしたスペクトルデー
タの振幅を調整する。振幅の調整は各スペクトルデータ
にあらかじめ定められた係数、例えば「0.5」とし
て、この係数を乗じることで達成する。この係数は固定
値でもよいし、帯域ごと、あるいはスケールファクター
バンドごとに変更してもよいし、第1の逆量子化部43
0より出力されるスペクトルデータに応じて変更しても
よい。
いるが、補助情報として、この係数の値を第2の符号化
情報内に付加してもよい。または係数としてスケールフ
ァクター値を第2の符号化情報に付加してもよいし、係
数としてスケールファクターバンド内のピークの量子化
値を第2の符号化情報に付加してもよい。また振幅調整
方法はこれに限ったものではなく、他の方法を用いても
よい。
て位置情報のみ、または位置情報と係数情報のみを符号
化したが、これに限ったものでなくてよく、スケールフ
ァクター、量子化値、スペクトルのサイン情報およびノ
イズ生成方法等を符号化してもよい。また、これらを2
つ以上組み合わせて符号化してもよい。
部側のスペクトルデータとしてコピーしているが、これ
に限らず、高域部側のスペクトルデータは第2の符号化
情報のみから生成してもよい。
45によって生成される他の補助情報(サイン情報)の
具体例を示すスペクトル波形図である。また、図19
は、図1に示した第2の量子化部345の他の補助情報
(サイン情報)計算処理における動作を示すフローチャ
ートである。
025kHzを超える再生帯域22.05kHzまでの
高域部のすべてのスケールファクターバンドにつき、各
スケールファクターバンドのあらかじめ定めた位置、例
えばスケールファクターバンド中央におけるスペクトル
データのサイン情報を以下の手順にしたがって特定する
(S41)。
025kHzを超える高域部の最初のスケールファクタ
ーバンドの中央位置におけるスペクトルデータのサイン
情報を調べ(S42)、その値を保持する。例えば、最
初のスケールファクターバンドの中央位置におけるスペ
クトルデータのサイン符号は、「+」である。第2の量
子化部345は、この符号「+」を1ビットの値「1」
で表して保持する。また、この符号が「−」であった場
合は、「0」で表して保持する。
て、スケールファクターバンドの中央位置におけるスペ
クトルデータのサイン情報が保持されると(S43)、
第2の量子化部345は、次のスケールファクターバン
ドについて、中央位置におけるスペクトルデータの符号
を調べる(S42)。例えば、調べられた符号が「+」
であったとすると、第2の量子化部345は、2番めの
スケールファクターバンドの中央位置におけるスペクト
ルデータのサイン情報として「1」を保持する。
は、高域部における3番目のスケールファクターバンド
中央位置におけるスペクトルデータの符号「+」を調
べ、そのサイン情報「1」を保持するとともに、4番目
のスケールファクターバンド中央位置におけるスペクト
ルデータの符号「+」を調べ、そのサイン情報「1」を
保持する。
ルファクターバンドについて、中央位置のスペクトルデ
ータのサイン情報が保持されると(S43)、第2の量
子化部345は、保持していた各スケールファクターバ
ンドのサイン情報を、高域部の補助情報として第2の符
号化部355に出力し、処理を終了する。
よって補助情報(サイン情報)が生成されるが、この補
助情報(サイン情報)は、1024点のスペクトルデー
タで表されていた高域部を、4つのスケールファクター
バンドにつき、それぞれ1ビットのサイン情報で表して
おり、非常に短いデータ長で高域部のスペクトルを表す
ことができる。
2の逆量子化部435は、低域部の1024サンプル分
のスペクトルデータの一部または全部を高域部側スペク
トルとしてコピーし、第2の復号化部425から入力さ
れたサイン情報に応じて、あらかじめ定められた位置の
スペクトルデータの符号を決定する。
クターバンド中央位置の符号を表したサイン情報を補助
情報(サイン情報)としたが、スケールファクターバン
ド中央の位置に限定されず、例えば、各ピーク位置のサ
イン情報であってもよいし、スケールファクターバンド
先頭のサイン情報であってもよいし、それ以外の所定の
位置でもよい。
報)に対応するスペクトルデータの位置はあらかじめ定
めたものになっているが、これは第1の逆量子化部43
0の出力に応じて変更してもよいし、各スケールファク
ターバンドのサイン情報がどの位置のサイン情報である
かを示す位置情報を、第2の符号化情報に付加して伝送
してもよい。
必要に応じてコピーしたスペクトルデータの振幅を調整
する。振幅の調整は、各スペクトルデータにあらかじめ
決められた係数、例えばその値を「0.5」として、そ
の係数を乗じることで達成できる。
に、あるいはスケールファクターバンドごとに変更して
もよいし、第1の逆量子化部430より出力されるスペ
クトルデータに応じて変更してもよい。また振幅調整方
法はこれに限ったものではなく、他の方法を用いてもよ
い。
じめ定めた係数を用いたが、この係数の値を補助情報と
して第2の符号化情報に付加してもよい。また、その係
数としてスケールファクター値を第2の符号化情報に付
加してもよいし、係数として量子化値を第2の符号化情
報に付加してもよい。
またはサイン情報と係数情報とのみ、またはサイン情報
と位置情報とのみ、またはサイン情報と位置情報と係数
情報とのみを符号化したが、これに限ったものでなく、
量子化値、スケールファクター、特徴的なスペクトルの
位置情報、およびノイズ生成方法等を符号化してもよ
い。またこれらを2つ以上組み合わせて符号化してもよ
い。
のスペクトルデータを高域部側のスペクトルデータとし
てコピーしているが、これに限らず、高域部側のスペク
トルデータは第2の符号化情報のみから生成してもよ
い。
トの値「1」で表し、符号「−」をで「0」で表した
が、補助情報(サイン情報)における符号の表し方は、
これに限定されず、他の値で表してもよい。
45によって生成される他の補助情報(コピー情報)の
作成方法の一例を示すスペクトル波形図である。図20
(a)は、高域部の最初のスケールファクターバンドに
おけるスペクトルを示す波形図である。図20(b)
は、補助情報(コピー情報)によって特定される低域部
のスペクトル波形の一例を示す波形図である。また、図
21は、図1に示した第2の量子化部345の他の補助
情報(コピー情報)計算処理における動作を示すフロー
チャートである。
025kHzを超える再生帯域22.05kHzまでの
高域部のすべてのスケールファクターバンドにつき、そ
のスケールファクターバンド先頭からのピークの位置n
(先頭からn番目)に対し、低域部においてスケールフ
ァクターバンド先頭からのピークの位置がnに最も近い
値となるスケールファクターバンドの番号Nを、以下の
手順にしたがって特定する(S51)。
025kHzを超える高域部の最初のスケールファクタ
ーバンドにおける絶対最大スペクトルデータ(ピーク)
の位置nを特定する(S52)。その結果、例えば、図
20(a)に示すように、特定されたピークの位置が
で、そのスペクトルがこのスケールファクターバンドの
n=22のスペクトルデータであったとする。
波数が再生帯域11.025kHz以下の低域部におけ
るスペクトルのすべての(正負の両方を含む)ピークの
位置を特定する(S53)。
で特定されたすべてのピークについて、ピークからスケ
ールファクターバンドの先頭までの位置がnに最も近い
スケールファクターバンドをサーチし、そのスケールフ
ァクターバンドの番号Nと、そのサーチの方向とピーク
のサイン情報とを特定する(S54)。
定された(正負の両方を含む)全ピークにつき、低周波
側のピークから順次、そのピークからの位置がnに最も
近いスケールファクターバンドの先頭をサーチする。サ
ーチの方向は、ピークからさらに低周波の方向に向かっ
てサーチする場合(1)と、ピークからさらに高周波の
方向に向かってサーチする場合(2)との2通りがあ
る。また、高域部のピークと正負の符号が反転している
低域部のピークについても、ピークからさらに低周波の
方向に向かってサーチする場合(3)と、ピークからさ
らに高周波の方向に向かってサーチする場合(4)との
2通りがある。
(4)の場合には、このピーク情報に基づいて低域部の
スペクトル波形をコピーした場合には、図20(b)に
示すように高域部のピークの位置と低域部のピークの位
置とがスケールファクターバンド内で左右(周波数軸方
向)に反転した波形がコピーされるため、例えば(1)
と(3)とのサーチ方向を順方向とし、(2)と(4)
とを逆方向として、サーチ方向の順逆を表す情報を添付
することが必要である。また、サーチ方向が(3)と
(4)との場合は、図20(b)に示すように高域部の
ピークの位置と低域部のピークの位置とが上下(縦軸方
向)に反転した波形がコピーされるため、高域部のピー
ク値と低域部のピーク値との正負の符号が反転している
か否かを示す情報を添付することが必要である。
れたピークが正の値をとるピークであれば(1)と
(2)とのサーチ方向で、低域部で特定されたピークが
負の値をとるピークであれば(3)と(4)との合わせ
て4通りの方向についてサーチを行い、そのサーチ結果
のうち、ピークからの位置がnに最も近いスケールファ
クターバンドの番号を特定する。この場合、あらかじめ
nとの誤差範囲を所定の値、例えば「5」に設定してお
き、前記4通りのサーチ結果のうちから、ピークからの
位置がnに最も近いスケールファクターバンドを選択し
て、そのスケールファクターバンドの番号Nを特定す
る。併せて、高域部のピーク値と低域部のピーク値との
正負の符号が反転しているか否かを示すサイン情報と、
サーチ方向の順逆を表す情報とを特定する。
(b)の(1)に示すような低域部のスペクトルに対応
して、ピークからの位置の誤差「1」で、スケールファ
クターバンドの番号N=3が特定されたとする。また、
サーチ方向(2)では、図20(b)の(2)に示すよ
うな低域部のスペクトルに対応して、ピークからの位置
の誤差「5」で、スケールファクターバンドの番号N=
18が特定されたとし、同様に、サーチ方向(3)で
は、図20(b)の(3)に示すような低域部のスペク
トルに対応して、誤差「4」で、スケールファクターバ
ンドの番号N=12、サーチ方向(4)では、図20
(b)の(4)に示すような低域部のスペクトルに対応
して、誤差「2」で、スケールファクターバンドの番号
N=10が特定されたとする。第2の量子化部345
は、特定されたスケールファクターバンドの番号4つの
うち、ピークからの位置の誤差が「1」で、ピークから
の位置がnに最も近いスケールファクターバンドの番号
N=3を選択する。これと併せて、低域部のピークの符
号「+」を表すサイン情報「1」と、ピークからさらに
低周波の方向に向かってサーチしたことを表すサーチ方
向情報「1」とを生成する。この場合、ピークの符号が
「−」であればサイン情報を「1」とし、ピークからさ
らに高周波の方向に向かってサーチした場合は、サーチ
方向情報を「0」として表す。
について、スケールファクターバンドの番号N=3とサ
イン情報「1」とサーチ方向情報「1」とが特定される
と(S55)、第2の量子化部345は、上記と同様に
して次のスケールファクターバンドについて、スケール
ファクターバンドの番号Nとそのサイン情報とそのサー
チ方向情報とを特定する。
ルファクターバンドについて、そのスケールファクター
バンドにおける先頭からのピークの位置nに対し、スケ
ールファクターバンド先頭からのピークの位置がnに最
も近い値となる低域部のスケールファクターバンドの番
号Nとそのサイン情報とそのサーチ方向情報とが特定さ
れると(S55)、第2の量子化部345は、特定され
た高域部の各スケールファクターバンドに対応する低域
部のスケールファクターバンドの番号Nとサイン情報と
サーチ方向情報とを高域部の補助情報(コピー情報)と
して第2の符号化部355に出力し、処理を終了する。
1の符号化信号を従来の手順にしたがって復号化する
と、低域部側の1024サンプルのスペクトルデータが
得られる。第2の逆量子化部435では、第2の復号化
部425から出力されたスケールファクターバンド番号
に該当するスペクトルデータの一部または全部を高域部
側スペクトルとしてコピーする。また第2の逆量子化部
435においては、必要に応じてコピーしたスペクトル
データの振幅を調整する。振幅の調整は、各スペクトル
にあらかじめ決められた係数、例えばその値を「0.
5」として、その係数を乗じることで達成できる。
スケールファクターバンドごとに変更してもよいし、第
1の逆量子化部430より出力されるスペクトルデータ
に応じて変更してもよい。
に、あらかじめ定めた係数を用いたが、この係数の値を
補助情報として第2の符号化情報に付加してもよい。ま
た係数としてスケールファクター値を第2の符号化情報
に付加してもよいし、係数として量子化値を第2の符号
化情報に付加してもよい。また振幅調整方法はこれに限
ったものではなく、他の方法を用いてもよい。
してスケールファクターバンドの番号Nの他にそのサイ
ン情報とサーチ方向情報とを抽出したが、高域部につい
て伝送可能な情報量に応じて、サイン情報とサーチ方向
情報とは省略してもよい。また、サイン情報は、低域部
のピークの符号が「+」であれば「1」、「−」であれ
ば「0」とし、サーチ方向情報は、ピークからさらに低
周波の方向に向かってサーチした場合は「1」、ピーク
からさらに高周波の方向に向かってサーチした場合は
「0」として表したが、サイン情報における低域部のピ
ークの符号およびサーチ方向情報のサーチ方向の表し方
は、それぞれこれらに限定されず、他の値で表してもよ
い。
の位置からその距離がnに最も近い値となるスケールフ
ァクターバンドの先頭をサーチしたが、この例に限定さ
れず、低域部の各スケールファクターバンド先頭からそ
の距離がnに最も近い値となるピークをサーチしてもよ
い。
45によって生成される他の補助情報(コピー情報)の
作成方法の第2の例を示すスペクトル波形図である。図
23は、図1に示した第2の量子化部345の他の補助
情報(コピー情報)の第2の計算処理における動作を示
すフローチャートである。
025kHzを超える再生帯域22.05kHzまでの
高域部のすべてのスケールファクターバンドにつき、そ
のスケールファクターバンド内の全スペクトルとのスペ
クトルの差分(エネルギー差)が最小となる低域部のス
ケールファクターバンドの番号Nを、以下の手順にした
がって特定する(S61)。ただし、低域部において高
域部との差分をとるスペクトルの個数は、高域部のスケ
ールファクターバンド内のスペクトルの個数と等しくと
り、特定されるスケールファクターバンドの番号Nは、
そのスペクトルの先頭のスケールファクターバンドの番
号とする。
のスケールファクターバンドにつき(S62)、そのス
ケールファクターバンドの先頭から高域部のスケールフ
ァクターバンド内のスペクトルデータと同数のスペクト
ルデータからなる周波数の幅で、高域部のスペクトルと
低域部のスペクトルとの差分を求める(S63)。例え
ば、図22に示す波形図において、高域部の最初のスケ
ールファクターバンドが、スペクトルデータ数=48の
スケールファクターバンドであったとすると、第2の量
子化部345は、低域部の番号N=1のスケールファク
ターバンドの先頭から48個のスペクトルデータにつ
き、順次、高域部と低域部とのスペクトルの差分を求め
る。
ルファクターバンドと同数のスペクトルについて、高域
部と低域部とのスペクトルの差分が求められると(S6
5)、その値を保持し、次の低域部のスケールファクタ
ーバンドの先頭から、高域部のスケールファクターバン
ド内のスペクトルと同数のスペクトルデータの周波数の
幅で、高域部スペクトルと低域部スペクトルとの差分を
求める(S64)。例えば、低域部の番号N=1のスケ
ールファクターバンドの先頭から48個のスペクトルデ
ータの幅で、スペクトルの差分が求められると、求めら
れた差分の値を保持しておき、低域部の番号N=2のス
ケールファクターバンドの先頭から48個のスペクトル
データの幅で、スペクトルの差分を求める。以下同様
に、低域部の番号N=3のスケールファクターバンド、
番号N=4のスケールファクターバンド、・・・、番号
N=28(低域部の最後)のスケールファクターバンド
というように、低域部のすべてのスケールファクターバ
ンドについて、順次、高域部と低域部との48個のスペ
クトルデータ同士の差分を合計してスペクトルの差分を
求める。
ドについて、そのスケールファクターバンドの先頭か
ら、高域部のスケールファクターバンド内のスペクトル
データと同数のスペクトルデータの幅で、高域部スペク
トルと低域部スペクトルとの差分が求められると(S6
4)、第2の量子化部345は、求められた差分が最小
となるスケールファクターバンドの番号Nを特定する
(S65)。例えば、図22に示すスペクトル波形図に
おいて、低域部の番号N=8のスケールファクターバン
ドが特定されたとする。このことは、低域部の斜線で示
す部分のスペクトルは、高域部の斜線で示す部分のスペ
クトルとの差分が最も少なく、スペクトル同士のエネル
ギー差が最も小さいことを示している。すなわち、番号
N=8のスケールファクターバンドの先頭から48個の
スペクトルデータは、11.25kHzから始まる高域
部の最初のスケールファクターバンドにコピーした場
合、図22の高域部に一点鎖線で示す波形となり、オリ
ジナルのスペクトルに対して近似的に、高域部の当該ス
ケールファクターバンド内のエネルギーを表すことがで
きる。
ルファクターバンドにつき、スペクトルの差分が最小と
なる低域部スケールファクターバンドの番号Nを特定す
ると、特定されたスケールファクターバンドの番号Nを
保持し、上記と同様にして、次の高域部のスケールファ
クターバンドにつき、該当するスケールファクターバン
ドの番号Nを特定する(S66)。以下、高域部の各ス
ケールファクターバンドにつき、順次この処理を繰り返
し、すべての高域部のスケールファクターバンドにい
て、スペクトルの差分が最小となる低域部スケールファ
クターバンドの番号Nを特定すると、保持していた低域
部のスケールファクターバンドの番号Nを、高域部の補
助情報(コピー情報)として第2の符号化部355に出
力し、処理を終了する。
る低域側スペクトルのコピー方法および振幅調整方法
は、図20と図21とを用いて説明した補助情報(コピ
ー情報)の場合と同様である。
と低域部とのエネルギー差を計算する際に、同符号、か
つ、周波数軸上の同方向に計算したが、本発明の符号化
装置はこれに限定されず、図20と図21とを用いて説
明したように、以下の3通りの方法のいずれかを用いて
高域部と低域部とのエネルギー差を計算してもよい。 高域部と低域部との各スペクトルデータの値を、同符
号で、かつ、低周波側から高周波側に向かって順次選択
される高域部スペクトルデータに対し、低域部スケール
ファクターバンドの先頭から高域部と同数のスペクトル
データについて高周波側から低周波側に向かって(すな
わち周波数軸上の逆方向に)スペクトルデータを順次選
択し、差分を計算する。低域部スペクトルの符号を反
転し(マイナスをかけ)、かつ、周波数軸上の同方向に
計算する。低域部スペクトルの符号を反転し(マイナ
スをかけ)、かつ、周波数軸上の逆方向に計算する。ま
た、これら4つのすべての方法で計算を行った後、これ
らのうちのエネルギー差が最小となる低域部スペクトル
のスケールファクターバンドの番号Nを補助情報として
もよい。この場合には、エネルギー差が最小となる低域
部スペクトルを高域部に正しくコピーするために、低域
部スペクトルと高域部スペクトルとの符号の関係を示す
情報と、高域部に低域部スペクトルをコピーする周波数
軸上の方向を示す情報とを、スケールファクターバンド
ごとに補助情報に含める。低域部スペクトルと高域部ス
ペクトルとの符号の関係を示す情報は、例えば、同符号
で差分をとった場合を「1」、逆符号で差分をとった場
合を「0」として1ビットで表される。また、低域部ス
ペクトルを高域部にコピーする場合の周波数軸上の方向
を示す情報は、例えば、順方向にコピーする場合、すな
わち、高域部と低域部とにおいてスペクトルデータを選
択する方向が順方向だった場合を「1」、逆方向にコピ
ーする場合、すなわち、高域部と低域部とにおいてスペ
クトルデータを選択する方向が逆方向だった場合を
「0」として1ビットで表される。
システムの例を放送システムに適用した場合について説
明したが、インターネット等の伝送媒体を介してサーバ
から端末にビットストリームで音響データ配信するよう
な音響データ配信システムに適用してもよく、符号化装
置300から出力されたビットストリームをCDやDV
D等の光ディスク、半導体、ハードディスク等の記録媒
体に一旦記録し、この記録媒体を介して復号化装置40
0で再生するような音響データ配信システムに適用して
もよい。
ックで実施したが、SHORTブロックで実施してもよ
く、このSHORTブロックにおいてもLONGブロッ
クで実施したのと同様の処理を行えばよい。
trolやTNS(TEMPORAL NOISE S
HAPING)、聴覚心理モデル、M/S Stere
o、Intensity Stereo、Predic
tion等のツール利用、およびブロックサイズの切り
替え、ビットリザーバー等を使用してもよい。
330により分離された高域部のスペクトルデータに基
づいて補助情報を生成したが、第1の量子化部340の
出力を逆量子化した値を高域部のスペクトルデータと
し、この高域部のスペクトルデータに基づいて補助情報
を生成してもよい。
ルファクターバンド内のスペクトルデータの量子化値が
「1」となるようなスケールファクターや、量子化値、
特徴的なスペクトルの位置情報、スペクトルの正負の符
号を表すサイン情報等で実施したが、これらを2つ以上
組み合わせたものを補助情報としてもよい。この場合、
補助情報内に、振幅の比率を表す係数や絶対最大スペク
トルデータの位置などを前記スケールファクターと組み
合わせて符号化すれば、特に有効である。また、本実施
の形態においては、第2の符号化信号として、各スケー
ルファクターバンドに1つの補助情報を符号化している
が、2つ以上のスケールファクターバンドごとに1つの
補助情報を符号化してもよいし、1つのスケールファク
ターバンドに2つ以上の補助情報を符号化してもよい。
また、本実施の形態における補助情報は、チャンネルご
とに補助情報を符号化してもよいし、2つ以上のチャン
ネルに対して1つの補助情報を符号化してもよい。
置300における量子化部および符号化部はそれぞれ2
つとしたが、これに限定されるものではなく、3つ以上
の量子化部および復号化部を備えてもよい。
置400における復号化部および逆量子化部はそれぞれ
2つとしたが、これに限定されるものではなく、3つ以
上の復号化部および逆量子化部を備えてもよい。
ろん、ソフトウェアでも実現でき、一部をハードウェ
ア、残りをソフトウェアで実現するという構成でもよ
い。また、上記実施の形態では、サンプリング周波数を
44.1kHzで実施したが、32kHz,48kHz
等で実施してもよく、また、データ分離部330におけ
る分離する境界の周波数を11.025kHz以外の周
波数に変更してもよい。
て実施したが、他の方式(例えば、MP3、AC3等)
の符号化装置および復号化装置等においても同様に実施
してもよい。
もよい。すなわち、音響データを符号化する符号化装置
であって、音響データ列から、要求数m1を超える個数
m2の音響データを連続して切り出す切り出し手段と、
前記切り出す切り出し手段によって切り出された音響デ
ータを周波数軸上のスペクトルデータに変換する変換手
段と、前記変換で得られたm2個のスペクトルデータを
前記m1個の低域部スペクトルデータと(m2−m1)
個の高域部スペクトルデータとに分離する分離手段と、
分離された低域部スペクトルデータを量子化し、符号化
する低域部符号化手段と、分離された高域部スペクトル
データから、当該高域部周波数スペクトルの特徴を示す
補助情報を生成する補助情報生成手段と、生成された補
助情報を符号化する高域部符号化手段と、前記低域部符
号化手段で得られた符号と前記高域部符号化手段で得ら
れた符号とを合成して出力する出力手段とを備えること
を特徴としてもよい。
のグループに分けられた前記スペクトルデータにつき、
高域部の各グループにおいて、ピークとなるスペクトル
データを量子化した値が一定値となる正規化係数を計算
し、計算された正規化係数を前記補助情報として生成す
ることを特徴とする構成とすることができる。
ループに分けられた前記スペクトルデータにつき、高域
部の各グループにおいてピークとなるスペクトルデータ
を、前記各グループに共通の正規化係数を用いて量子化
し、その量子化値を前記補助情報として生成することを
特徴とする構成とするができる。
ループに分けられた前記スペクトルデータにつき、高域
部の各グループにおいてピークとなるスペクトルデータ
の周波数位置を前記補助情報として生成することを特徴
とする構成とするができる。
数であって、前記補助情報生成手段は、複数のグループ
に分けられた前記スペクトルデータにつき、高域部の所
定周波数位置におけるスペクトルデータの正負を示す符
号を前記補助情報として生成することを特徴とする構成
とするができる。
ループに分けられた前記スペクトルデータにつき、高域
部の各グループにおいて、当該グループ内のスペクトル
と最も近似する低域部のスペクトルを特定する情報を前
記補助情報として生成することを特徴とする構成とする
ができる。この場合、前記補助情報生成手段は、前記グ
ループの区切りからそのグループにおける高域部スペク
トルのピークまでの周波数軸上の距離と、低域部のグル
ープの区切りから低域部スペクトルのピークまでの周波
数軸上の距離との差が最小となる低域部スペクトルを特
定することを特徴とする構成とするができる。また、前
記補助情報生成手段は、前記高域部のグループ内のスペ
クトルと同じ周波数幅でエネルギーの差分をとったとき
の差分値が最小となる低域部のスペクトルを特定するこ
とを特徴とする構成とするができる。また、前記低域部
のスペクトルを特定する情報は、特定された低域部スペ
クトルの前記グループを特定する番号であることを特徴
とする構成とするができる。
部スペクトルの振幅の増幅比率を表すあらかじめ定めた
係数を前記補助情報として生成することを特徴とする構
成とするができる。
部符号化手段によって符号化されたデータを所定のフォ
ーマットに定められた符号化音響ストリームに変換する
とともに、前記符号化音響ストリーム内の領域であっ
て、符号化規約では使用が制約されていない領域に、前
記高域部符号化手段によって符号化されたデータを格納
して出力するストリーム出力部を備えることを特徴とす
る構成とするができる。この場合、前記ストリーム出力
部は、サンプリング周波数としてf1Hzを表す情報を
書き込むことを特徴とする構成とするができる。
域部符号化手段によって符号化されたデータを所定のフ
ォーマットに定められた符号化音響ストリームに変換す
るとともに、前記高域部符号化手段によって符号化され
たデータを、前記符号化音響ストリームとは異なるスト
リームに格納して出力する第2ストリーム出力部を備え
ることを特徴とする構成とするができる。
置とからなる通信システムとして実現したり、上記符号
化装置および通信システムを構成する特徴的な手段をス
テップとする符号化方法、通信方法として実現したり、
上記符号化装置を構成する特徴的な手段やステップをC
PUに実行させる符号化プログラムとして実現したり、
これらプログラムが記録されたコンピュータ読み取り可
能な記録媒体として実現したりすることができるのはい
うまでもない。
に係る符号化装置は、音響データを符号化する符号化装
置であって、音響データ列から、連続する一定個数の音
響データを切り出す切り出し手段と、切り出された音響
データを周波数軸上のスペクトルデータに変換する変換
手段と、前記変換で得られたスペクトルデータを前記f
1Hzまでの低域部スペクトルデータと前記f1Hzよ
りも高い高域部スペクトルデータとに分離する分離手段
と、分離された低域部スペクトルデータを量子化し、符
号化する低域部符号化手段と、分離された高域部スペク
トルデータから、当該高域部周波数スペクトルの特徴を
示す補助情報を生成する補助情報生成手段と、生成され
た補助情報を符号化する高域部符号化手段と、前記低域
部符号化手段で得られた符号と前記高域部符号化手段で
得られた符号とを合成して出力する出力手段とを備え、
前記f1は、前記音響データ列が作成されたときのサン
プリング周波数f2の半分以下であることを特徴とす
る。
は、切り出し手段により切り出された音響データ列から
f1以下の多数の低域部スペクトルデータを出力すると
同時に、f1を超える高域部スペクトルデータを出力す
る。そして、分離手段により分離された低域部のスペク
トルデータは量子化、符号化され、高域部のスペクトル
データについては、周波数の高域部の特徴を表す補助情
報に符号化され、高域部符号化手段は、生成された前記
補助情報を符号化する。
しない範囲で、低域部についてはダウンサンプリングと
同等で、しかも高域部を再現可能に音響信号を高品質の
符号化することができる。
記変換手段は、前記音響データを0〜2×f1Hzのス
ペクトルデータに変換し、前記分離手段は、0〜f1H
zの低域部スペクトルデータとf1〜2×f1Hzの高
域部スペクトルデータとに分離することを特徴とした
り、前記f1Hzまでの低域部スペクトルデータは、n
個のスペクトルデータから構成され、前記切り出し手段
は、2×n個のスペクトルデータを生成するのに必要な
個数の音響データを切り出し、前記変換手段は、切り出
された音響データを2×n個のスペクトルデータに変換
し、前記分離手段は、n個の低域部スペクトルデータと
n個の高域部スペクトルデータとに分離することを特徴
としたり、前記切り出し手段は、符号化の単位である1
フレームに相当するn個の音響データと、そのフレーム
に隣接する2つのフレームそれぞれに属するn/2個ず
つの音響データとを併せた2×n個のスペクトルデータ
を切り出し、前記変換手段は、切り出された2×n個の
音響データに対してMDCTによって前記変換を行い、
2×n個のスペクトルデータからなる0〜2×f1Hz
のスペクトルに変換することを特徴としたりする構成と
してもよい。
媒体または伝送媒体を介して入力された符号化データを
復号化する復号化装置であって、符号化データに含まれ
る低域部符号化データと高域部符号化データとをそれぞ
れ抽出する抽出手段と、前記抽出手段により抽出された
低域部符号化データを復号化し、逆量子化することによ
り、周波数f1以下の低域部のスペクトルデータを出力
する低域部逆量子化手段と、前記抽出手段により抽出さ
れた高域部データを復号化することにより、高域部スペ
クトルデータの特徴を表す補助情報を生成する補助情報
復号化手段と、前記補助情報復号化手段により生成され
た補助情報に基づいて高域部のスペクトルデータを出力
する高域部逆量子化手段と、前記低域部逆量子化手段に
よって出力された低域部スペクトルデータと、前記高域
部逆量子化手段によって出力された高域部スペクトルデ
ータとを合成する合成手段と、前記合成手段により合成
されたスペクトルデータを時間軸上の音響データに逆変
換する逆変換手段と、逆変換手段により逆変換された音
響データを時間順に出力する音響データ出力手段とを備
えることを特徴とする。
は、入力された符号化データから低域部の符号化データ
と高域部の符号化データとを抽出し、低域部逆量子化手
段は周波数f1以下の低域部のスペクトルデータを出力
する。補助情報復号化手段は補助情報を復号化し、高域
部逆量子化手段は補助情報に基づいて高域部のスペクト
ルデータを出力する。したがって、従来とほぼ同じわず
かな情報量から、従来と比べて大幅に増加した情報量を
復号化することができ、高音質の音響信号の復号化をす
ることができる。
能構成を示すブロック図である。
響信号の状態変化を示す図である。
ター決定処理における動作を示すフローチャートであ
る。
ター決定処理における他の動作を示すフローチャートで
ある。
る補助情報(スケールファクター)の具体例を示すスペ
クトル波形図である。
ールファクター)計算処理における動作を示すフローチ
ャートである。
報が格納されるビットストリーム中の位置を示す図であ
る。
納する場合の他の例を示す図である。
比較して示す図である。
を比較して示す図である。
スペクトルデータおよび特徴について比較して示す図で
ある。
部1024スペクトルが順方向に高域部にコピーされる
手順を示すフローチャートである。
部1024スペクトルが周波数軸方向の逆方向に高域部
にコピーされる手順を示すフローチャートである。
れる他の補助情報(量子化値)の具体例を示すスペクト
ル波形図である。
(量子化値)計算処理における動作を示すフローチャー
トである。
れる他の補助情報(位置情報)の具体例を示すスペクト
ル波形図である。
(位置情報)計算処理における動作を示すフローチャー
トである。
れる他の補助情報(サイン情報)の具体例を示すスペク
トル波形図である。
(サイン情報)計算処理における動作を示すフローチャ
ートである。
れる他の補助情報(コピー情報)の作成方法の一例を示
すスペクトル波形図である。
(コピー情報)計算処理における動作を示すフローチャ
ートである。
れる他の補助情報(コピー情報)の作成方法の第2の例
を示すスペクトル波形図である。
(コピー情報)の第2の計算処理における動作を示すフ
ローチャートである。
号化装置の構成を示すブロック図である。
Claims (27)
- 【請求項1】 音響データを符号化する符号化装置であ
って、 音響データ列から、連続する一定個数の音響データを切
り出す切り出し手段と、 切り出された音響データを周波数軸上のスペクトルデー
タに変換する変換手段と、 前記変換で得られたスペクトルデータを前記f1Hzま
での低域部スペクトルデータと前記f1Hzよりも高い
高域部スペクトルデータとに分離する分離手段と、 分離された低域部スペクトルデータを量子化し、符号化
する低域部符号化手段と、 分離された高域部スペクトルデータから、当該高域部周
波数スペクトルの特徴を示す補助情報を生成する補助情
報生成手段と、 生成された補助情報を符号化する高域部符号化手段と、 前記低域部符号化手段で得られた符号と前記高域部符号
化手段で得られた符号とを合成して出力する出力手段と
を備え 前記f1は、前記音響データ列が作成されたときのサン
プリング周波数f2の半分以下であることを特徴とする
符号化装置。 - 【請求項2】 前記f1は、f2/4であり、 前記変換手段は、前記音響データを0〜2×f1Hzの
スペクトルデータに変換し、 前記分離手段は、0〜f1Hzの低域部スペクトルデー
タとf1〜2×f1Hzの高域部スペクトルデータとに
分離することを特徴とする請求項1記載の符号化装置。 - 【請求項3】 前記f1Hzまでの低域部スペクトルデ
ータは、n個のスペクトルデータから構成され、 前記切り出し手段は、2×n個のスペクトルデータを生
成するのに必要な個数の音響データを切り出し、 前記変換手段は、切り出された音響データを2×n個の
スペクトルデータに変換し、 前記分離手段は、n個の低域部スペクトルデータとn個
の高域部スペクトルデータとに分離することを特徴とす
る請求項2記載の符号化装置。 - 【請求項4】 前記切り出し手段は、符号化の単位であ
る1フレームに相当するn個の音響データと、そのフレ
ームに隣接する2つのフレームそれぞれに属するn/2
個ずつの音響データとを併せた2×n個のスペクトルデ
ータを切り出し、 前記変換手段は、切り出された2×n個の音響データに
対してMDCTによって前記変換を行い、2×n個のス
ペクトルデータからなる0〜2×f1Hzのスペクトル
に変換することを特徴とする請求項3記載の符号化装
置。 - 【請求項5】 前記補助情報生成手段は、複数のグルー
プに分けられた前記スペクトルデータにつき、高域部の
各グループにおいて、ピークとなるスペクトルデータを
量子化した値が一定値となる正規化係数を計算し、計算
された正規化係数を前記補助情報として生成することを
特徴とする請求項1記載の符号化装置。 - 【請求項6】 前記補助情報生成手段は、複数のグルー
プに分けられた前記スペクトルデータにつき、高域部の
各グループにおいてピークとなるスペクトルデータを、
前記各グループに共通の正規化係数を用いて量子化し、
その量子化値を前記補助情報として生成することを特徴
とする請求項1記載の符号化装置。 - 【請求項7】 前記補助情報生成手段は、複数のグルー
プに分けられた前記スペクトルデータにつき、高域部の
各グループにおいてピークとなるスペクトルデータの周
波数位置を前記補助情報として生成することを特徴とす
る請求項1記載の符号化装置。 - 【請求項8】 前記スペクトルデータはMDCT係数で
あって、 前記補助情報生成手段は、複数のグループに分けられた
前記スペクトルデータにつき、高域部の所定周波数位置
におけるスペクトルデータの正負を示す符号を前記補助
情報として生成することを特徴とする請求項1記載の符
号化装置。 - 【請求項9】 前記補助情報生成手段は、複数のグルー
プに分けられた前記スペクトルデータにつき、高域部の
各グループにおいて、当該グループ内のスペクトルと最
も近似する低域部のスペクトルを特定する情報を前記補
助情報として生成することを特徴とする請求項1記載の
符号化装置。 - 【請求項10】 前記補助情報生成手段は、前記グルー
プの区切りからそのグループにおける高域部スペクトル
のピークまでの周波数軸上の距離と、低域部のグループ
の区切りから低域部スペクトルのピークまでの周波数軸
上の距離との差が最小となる低域部スペクトルを特定す
ることを特徴とする請求項9記載の符号化装置。 - 【請求項11】 前記補助情報生成手段は、前記高域部
のグループ内のスペクトルと同じ周波数幅でエネルギー
の差分をとったときの差分値が最小となる低域部のスペ
クトルを特定することを特徴とする請求項9記載の符号
化装置。 - 【請求項12】 前記低域部のスペクトルを特定する情
報は、特定された低域部スペクトルの前記グループを特
定する番号であることを特徴とする請求項9記載の符号
化装置。 - 【請求項13】 前記補助情報生成手段は、前記高域部
スペクトルの振幅の増幅比率を表すあらかじめ定めた係
数を前記補助情報として生成することを特徴とする請求
項1記載の符号化装置。 - 【請求項14】 前記出力手段は、さらに、 前記低域部符号化手段によって符号化されたデータを所
定のフォーマットに定められた符号化音響ストリームに
変換するとともに、前記符号化音響ストリーム内の領域
であって、符号化規約では使用が制約されていない領域
に、前記高域部符号化手段によって符号化されたデータ
を格納して出力するストリーム出力部を備えることを特
徴とする請求項1記載の符号化装置。 - 【請求項15】 前記ストリーム出力部は、サンプリン
グ周波数としてf2/2Hzを表す情報を書き込むこと
を特徴とする請求項14記載の符号化装置。 - 【請求項16】 前記出力手段は、さらに、 前記低域部符号化手段によって符号化されたデータを所
定のフォーマットに定められた符号化音響ストリームに
変換するとともに、前記高域部符号化手段によって符号
化されたデータを、前記符号化音響ストリームとは異な
るストリームに格納して出力する第2ストリーム出力部
を備えることを特徴とする請求項1記載の符号化装置。 - 【請求項17】 記録媒体または伝送媒体を介して入力
された符号化データを復号化する復号化装置であって、 符号化データに含まれる低域部符号化データと高域部符
号化データとをそれぞれ抽出する抽出手段と、 前記抽出手段により抽出された低域部符号化データを復
号化し、逆量子化することにより、周波数f1Hz以下
の低域部のスペクトルデータを出力する低域部逆量子化
手段と、 前記抽出手段により抽出された高域部データを復号化す
ることにより、高域部スペクトルデータの特徴を表す補
助情報を生成する補助情報復号化手段と、 前記補助情報復号化手段により生成された補助情報に基
づいて高域部のスペクトルデータを出力する高域部逆量
子化手段と、 前記低域部逆量子化手段によって出力された低域部スペ
クトルデータと、前記高域部逆量子化手段によって出力
された高域部スペクトルデータとを合成する合成手段
と、 前記合成手段により合成されたスペクトルデータを時間
軸上の音響データに逆変換する逆変換手段と、 逆変換手段により逆変換された音響データを時間順に出
力する音響データ出力手段とを備えることを特徴とする
復号化装置。 - 【請求項18】 前記補助情報は、複数のグループに分
けられたスペクトルデータにつき、高域部の各グループ
におけるピーク値を量子化したとき、その値が一定値と
なるよう計算された正規化係数であって、 前記高域部逆量子化手段は、生成された前記補助情報中
の前記正規化係数を用い、高域部の各グループに共通し
た一定値であって、前記各グループにおいて所定の周波
数スペクトルデータに対応する量子化値を逆量子化し、
逆量子化された結果のスペクトルデータが各グループの
ピークとなる高域部スペクトルデータを生成することを
特徴とする請求項17記載の復号化装置。 - 【請求項19】 前記補助情報は、複数のグループに分
けられた前記スペクトルデータにつき、高域部の各グル
ープにおいてピークとなるスペクトルデータを、前記各
グループに共通の正規化係数を用いて量子化することに
より得られた量子化値であり、 前記高域部逆量子化手段は、生成された前記補助情報中
の量子化値を、高域部の各グループにおいて共通の正規
化係数を用いて逆量子化し、逆量子化された結果のスペ
クトルデータが前記各グループのピークとなる高域部ス
ペクトルデータを生成することを特徴とする請求項17
記載の復号化装置。 - 【請求項20】 前記補助情報は、複数のグループに分
けられたスペクトルデータにつき、高域部の各グループ
においてピークとなるスペクトルデータの周波数位置で
あり、 前記高域部逆量子化手段は、生成された前記補助情報中
の周波数位置が、高域部の各グループにおいてピークと
なる高域部スペクトルデータを生成することを特徴とす
る請求項17記載の復号化装置。 - 【請求項21】 前記補助情報は、複数のグループに分
けられたスペクトルデータにつき、高域部の所定周波数
位置におけるスペクトルデータの正負を示す符号であ
り、 前記高域部逆量子化手段は、高域部の所定周波数位置に
おけるスペクトルデータが、生成された前記補助情報中
の前記符号をもつ高域部スペクトルデータを生成するこ
とを特徴とする請求項17記載の復号化装置。 - 【請求項22】 前記補助情報は、複数のグループに分
けられたスペクトルデータにつき、高域部の各グループ
において、当該グループ内のスペクトルと最も近似する
低域部のスペクトルを特定する情報であり、 前記高域部逆量子化手段は、前記補助情報に基づいて、
高域部の各グループにおいて所定のノイズを生成し、前
記スペクトルデータに加算して高域部スペクトルデータ
を生成することを特徴とする請求項17記載の復号化装
置。 - 【請求項23】 低ビットレートのビットストリームに
圧縮符号化された音響データを記録媒体または伝送媒体
を介して配信するための音響データ配信システムであっ
て、 請求項1記載の符号化装置と請求項17記載の復号化装
置とから構成されることを特徴とする音響データ配信シ
ステム。 - 【請求項24】 入力された音響信号を符号化する符号
化装置に用いられるプログラムであって、 コンピュータを請求項1記載の符号化装置が備える各手
段として機能させるプログラム。 - 【請求項25】 記録媒体または伝送媒体を介して入力
された符号化データを復号化する復号化装置に用いられ
るプログラムであって、 コンピュータを請求項17記載の復号化装置が備える各
手段として機能させるプログラム。 - 【請求項26】 請求項24記載のプログラムを記録し
たコンピュータ読み取り可能な記録媒体。 - 【請求項27】 請求項25記載のプログラムを記録し
たコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002313216A JP4317355B2 (ja) | 2001-11-30 | 2002-10-28 | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001367008 | 2001-11-30 | ||
| JP2001-367008 | 2001-11-30 | ||
| JP2002313216A JP4317355B2 (ja) | 2001-11-30 | 2002-10-28 | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2003228399A true JP2003228399A (ja) | 2003-08-15 |
| JP4317355B2 JP4317355B2 (ja) | 2009-08-19 |
Family
ID=27759564
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002313216A Expired - Fee Related JP4317355B2 (ja) | 2001-11-30 | 2002-10-28 | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4317355B2 (ja) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007017908A (ja) * | 2005-07-11 | 2007-01-25 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| US7205910B2 (en) | 2002-08-21 | 2007-04-17 | Sony Corporation | Signal encoding apparatus and signal encoding method, and signal decoding apparatus and signal decoding method |
| KR100738077B1 (ko) | 2005-09-28 | 2007-07-12 | 삼성전자주식회사 | 계층적 오디오 부호화 및 복호화 장치와 방법 |
| JP2011043853A (ja) * | 2004-05-14 | 2011-03-03 | Panasonic Corp | 符号化装置、復号化装置、およびこれらの方法 |
| JP2011059714A (ja) * | 2010-12-06 | 2011-03-24 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| JP2011170154A (ja) * | 2010-02-19 | 2011-09-01 | Kddi Corp | ディジタルオーディオ信号の音質劣化装置、音質回復装置、及び音質劣化・回復システム |
| JP2011242788A (ja) * | 2011-07-11 | 2011-12-01 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| CN102483923A (zh) * | 2009-08-24 | 2012-05-30 | 斯灵媒体有限公司 | 音频编码中基于频带信号能量的频带比例因子确定 |
Citations (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63201700A (ja) * | 1987-02-17 | 1988-08-19 | シャープ株式会社 | 音声・楽音の帯域分割符号化装置 |
| JPH05183523A (ja) * | 1992-01-06 | 1993-07-23 | Oki Electric Ind Co Ltd | 音声・楽音符号化装置 |
| JPH05265492A (ja) * | 1991-03-27 | 1993-10-15 | Oki Electric Ind Co Ltd | コード励振線形予測符号化器及び復号化器 |
| JPH0716437U (ja) * | 1993-08-30 | 1995-03-17 | 日本ビクター株式会社 | 音声高能率符号化装置 |
| JPH0784595A (ja) * | 1994-07-21 | 1995-03-31 | Sharp Corp | 音声・楽音の帯域分割符号化装置 |
| JPH09261068A (ja) * | 1996-03-27 | 1997-10-03 | Toshiba Corp | データ圧縮/復号/伝送/受信/記録/再生の方法と装置 |
| WO1998052187A1 (en) * | 1997-05-15 | 1998-11-19 | Hewlett-Packard Company | Audio coding systems and methods |
| JPH11330977A (ja) * | 1998-03-11 | 1999-11-30 | Matsushita Electric Ind Co Ltd | オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置 |
| JP2000206989A (ja) * | 1999-01-08 | 2000-07-28 | Matsushita Electric Ind Co Ltd | オ―ディオ信号符号化装置及び復号化装置 |
| WO2000045379A2 (en) * | 1999-01-27 | 2000-08-03 | Coding Technologies Sweden Ab | Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting |
| JP2001521648A (ja) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | スペクトル帯域複製を用いた原始コーディングの強化 |
-
2002
- 2002-10-28 JP JP2002313216A patent/JP4317355B2/ja not_active Expired - Fee Related
Patent Citations (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS63201700A (ja) * | 1987-02-17 | 1988-08-19 | シャープ株式会社 | 音声・楽音の帯域分割符号化装置 |
| JPH05265492A (ja) * | 1991-03-27 | 1993-10-15 | Oki Electric Ind Co Ltd | コード励振線形予測符号化器及び復号化器 |
| JPH05183523A (ja) * | 1992-01-06 | 1993-07-23 | Oki Electric Ind Co Ltd | 音声・楽音符号化装置 |
| JPH0716437U (ja) * | 1993-08-30 | 1995-03-17 | 日本ビクター株式会社 | 音声高能率符号化装置 |
| JPH0784595A (ja) * | 1994-07-21 | 1995-03-31 | Sharp Corp | 音声・楽音の帯域分割符号化装置 |
| JPH09261068A (ja) * | 1996-03-27 | 1997-10-03 | Toshiba Corp | データ圧縮/復号/伝送/受信/記録/再生の方法と装置 |
| WO1998052187A1 (en) * | 1997-05-15 | 1998-11-19 | Hewlett-Packard Company | Audio coding systems and methods |
| JP2001525079A (ja) * | 1997-05-15 | 2001-12-04 | ヒューレット・パッカード・カンパニー | 音声符号化システム及び方法 |
| JP2001521648A (ja) * | 1997-06-10 | 2001-11-06 | コーディング テクノロジーズ スウェーデン アクチボラゲット | スペクトル帯域複製を用いた原始コーディングの強化 |
| JPH11330977A (ja) * | 1998-03-11 | 1999-11-30 | Matsushita Electric Ind Co Ltd | オ―ディオ信号符号化装置、オ―ディオ信号復号化装置、及び、オ―ディオ信号符号化・復号化装置 |
| JP2000206989A (ja) * | 1999-01-08 | 2000-07-28 | Matsushita Electric Ind Co Ltd | オ―ディオ信号符号化装置及び復号化装置 |
| WO2000045379A2 (en) * | 1999-01-27 | 2000-08-03 | Coding Technologies Sweden Ab | Enhancing perceptual performance of sbr and related hfr coding methods by adaptive noise-floor addition and noise substitution limiting |
| JP2002536679A (ja) * | 1999-01-27 | 2002-10-29 | コーディング テクノロジーズ スウェーデン アクチボラゲット | 情報源符号化システムの性能向上方法と装置 |
Cited By (13)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7205910B2 (en) | 2002-08-21 | 2007-04-17 | Sony Corporation | Signal encoding apparatus and signal encoding method, and signal decoding apparatus and signal decoding method |
| JP2011043853A (ja) * | 2004-05-14 | 2011-03-03 | Panasonic Corp | 符号化装置、復号化装置、およびこれらの方法 |
| US8417515B2 (en) | 2004-05-14 | 2013-04-09 | Panasonic Corporation | Encoding device, decoding device, and method thereof |
| US8340213B2 (en) | 2005-07-11 | 2012-12-25 | Sony Corporation | Signal encoding apparatus and method, signal decoding apparatus and method, programs and recording mediums |
| US8144804B2 (en) | 2005-07-11 | 2012-03-27 | Sony Corporation | Signal encoding apparatus and method, signal decoding apparatus and method, programs and recording mediums |
| JP2007017908A (ja) * | 2005-07-11 | 2007-01-25 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| US8837638B2 (en) | 2005-07-11 | 2014-09-16 | Sony Corporation | Signal encoding apparatus and method, signal decoding apparatus and method, programs and recording mediums |
| KR100738077B1 (ko) | 2005-09-28 | 2007-07-12 | 삼성전자주식회사 | 계층적 오디오 부호화 및 복호화 장치와 방법 |
| CN102483923A (zh) * | 2009-08-24 | 2012-05-30 | 斯灵媒体有限公司 | 音频编码中基于频带信号能量的频带比例因子确定 |
| KR101361933B1 (ko) * | 2009-08-24 | 2014-02-12 | 슬링 미디어 피브이티 엘티디 | 오디오 인코딩에서 주파수 대역 신호 에너지를 기초로 한 주파수 대역 스케일 팩터 결정 |
| JP2011170154A (ja) * | 2010-02-19 | 2011-09-01 | Kddi Corp | ディジタルオーディオ信号の音質劣化装置、音質回復装置、及び音質劣化・回復システム |
| JP2011059714A (ja) * | 2010-12-06 | 2011-03-24 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
| JP2011242788A (ja) * | 2011-07-11 | 2011-12-01 | Sony Corp | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4317355B2 (ja) | 2009-08-19 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| EP1440300B1 (en) | Encoding device, decoding device and audio data distribution system | |
| KR101120911B1 (ko) | 음성신호 복호화 장치 및 음성신호 부호화 장치 | |
| JP4876574B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
| JP4899359B2 (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
| KR20090043983A (ko) | 고주파수 신호 부호화 및 복호화 장치 및 방법 | |
| KR20100086000A (ko) | 오디오 신호 처리 방법 및 장치 | |
| JP2011059714A (ja) | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 | |
| JP3923783B2 (ja) | 符号化装置及び復号化装置 | |
| JP4603485B2 (ja) | 音声・楽音符号化装置及び音声・楽音符号化方法 | |
| US20020169601A1 (en) | Encoding device, decoding device, and broadcast system | |
| JP2003108197A (ja) | オーディオ信号復号化装置およびオーディオ信号符号化装置 | |
| JP2004199075A (ja) | ビット率調節可能なステレオオーディオ符号化・復号化方法及びその装置 | |
| WO2004044891A1 (ja) | 音楽情報符号化装置及び方法、並びに音楽情報復号装置及び方法 | |
| JP4317355B2 (ja) | 符号化装置、符号化方法、復号化装置、復号化方法および音響データ配信システム | |
| JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
| JP3984468B2 (ja) | 符号化装置、復号化装置及び符号化方法 | |
| JP4973397B2 (ja) | 符号化装置および符号化方法、ならびに復号化装置および復号化方法 | |
| JP3348759B2 (ja) | 変換符号化方法および変換復号化方法 | |
| KR20080066537A (ko) | 부가정보를 가지는 오디오신호의 부호화/복호화 방법 및장치 | |
| JP2004246038A (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
| KR100433984B1 (ko) | 디지털 오디오 부호화/복호화 장치 및 방법 | |
| JP2006047561A (ja) | オーディオ信号符号化装置およびオーディオ信号復号化装置 | |
| JP2005004119A (ja) | 音響信号符号化装置及び音響信号復号化装置 | |
| JP2003029797A (ja) | 符号化装置、復号化装置および放送システム | |
| JPH0481199B2 (ja) |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050808 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080229 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080318 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080516 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090303 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090402 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090428 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090522 |
|
| R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 4317355 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120529 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130529 Year of fee payment: 4 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130529 Year of fee payment: 4 |
|
| LAPS | Cancellation because of no payment of annual fees |