JP2003108192A - オーディオ信号符号化方法 - Google Patents
オーディオ信号符号化方法Info
- Publication number
- JP2003108192A JP2003108192A JP2001296836A JP2001296836A JP2003108192A JP 2003108192 A JP2003108192 A JP 2003108192A JP 2001296836 A JP2001296836 A JP 2001296836A JP 2001296836 A JP2001296836 A JP 2001296836A JP 2003108192 A JP2003108192 A JP 2003108192A
- Authority
- JP
- Japan
- Prior art keywords
- spectrum
- variation index
- integrated
- integrated group
- grouping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
クトルデータをグループ化して高能率符号化する時に、
グループ化が適切に行われていないことにより、音質が
劣化することがあるという課題があった。 【解決手段】 隣接するグループを統合した時の統合し
たグループに属する時間ブロック間のスペクトルデータ
の変動の最大あるいは平均を表す統合グループスペクト
ル変動指標を算出するステップ(103)と、すべての
隣接するグループの統合の中で前記統合グループスペク
トル変動指標の最小値を算出するステップ(104)
と、前記最小値が第1の閾値以下の場合に前記統合グル
ープスペクトル変動指標を最小とするグループを統合す
るステップ(106)とを備える。
Description
時間ブロック単位でスペクトルデータに変換し、複数の
時間ブロックのスペクトルデータをグループ化して高能
率符号化するオーディオ信号符号化方法に関する。
位でスペクトルデータに変換し、複数の時間ブロックの
スペクトルデータをグループ化して高能率符号化するこ
とにより、符号化効率を改善する手法が提案されてい
る。
AAC(Advanced Audio Coding)の規格書(ISO/IEC 1
3818-7, Information technology - Generic coding of
moving pictures and associated audio information
- Part 7: Advanced AudioCoding (AAC))や日本国特許
番号第2739377号に記載されたものが知られてい
る。
体的なグループ化の決定方法については、記載されてお
らず、このため、例えば、あらかじめ設定した固定のグ
ループ化方法で対応せざるを得なかった。
ACと略す)のローコンプレキシティプロファイル(Lo
w Complexity Profile)を例にとって、複数の時間ブロ
ックのスペクトルデータをグループ化して高能率符号化
する従来例について説明する。
す。図5において、500と501はフィルタバンク、
510と511はブロック長決定部、520はジョイン
トステレオデータ生成部、530は短時間ブロックグル
ープ化決定部、540は量子化及び符号化部である。以
上のように構成されたAACエンコーダについて、その
動作を以下に述べる。
軸のオーディオ信号は、フィルタバンク500において
ブロック長決定部510で決定された長さのブロックに
分割され、MDCT(Modified Discrete Cosine Trans
form,変形離散コサイン変換)によりスペクトルデータ
(MDCT係数)に変換される。この変換は変換ブロッ
クを50%ずつオーバーラップして実行し、例えば20
48サンプルを1024本のMDCT係数に変換する。
同様に、入力された右チャンネル(Rch)の時間軸の
オーディオ信号は、フィルタバンク501においてブロ
ック長決定部511で決定された長さのブロックに分割
され、MDCTによりスペクトルデータに変換される。
DCTのブロック長を決定し、出力する。ブロック長決
定部510と511で、それぞれのチャンネルの信号の
変化に応じてMDCTのブロック長を変化させることに
より、プリエコーと呼ばれる疑似信号の発生による音質
の劣化を防止する。すなわち、定常的な信号の場合に
は、MDCTのブロック長を2048サンプルの長時間
ブロックとし、1024本のスペクトルデータに変換す
る。一方、過渡的な信号の場合には256サンプルの短
時間ブロックとし、128本のスペクトルデータに変換
する。短時間ブロックでは、8個連続で短いブロック長
を用いて変換することにより、出力のスペクトルデータ
の本数を8×128=1024本として、長時間ブロッ
クと一致させる。この1024本のスペクトルデータか
ら成る符号化の単位をフレームと呼ぶ。
例を示す。同図で、第0フレーム(F0)、第2フレー
ム(F2)、第3フレーム(F3)は、長時間ブロック
のフレームであり、これに対して第1フレーム(F1)
は連続した8個の短時間ブロックから成る短時間ブロッ
クのフレームである。
0では、左右のチャンネルの相関を利用して符号化効率
を向上させるため、左右のチャンネルのスペクトルデー
タを入力として、ジョイントステレオ(ミッド/サイド
ステレオあるいはインテンシティステレオ)符号化に必
要なジョイントステレオスペクトルデータを生成する。
ここで、ジョイントステレオスペクトルデータとは、ミ
ッド/サイド(和差)ステレオ符号化に必要な左チャン
ネルと右チャンネルのスペクトルデータの和と差、ある
いはインテンシティステレオ符号化に必要な左チャンネ
ルと右チャンネルのスペクトルデータの和(左右のチャ
ンネルの位相が逆相の場合には差)である。なお、イン
テンシティステレオ符号化の場合、もう一方のチャンネ
ルのスペクトルデータはゼロに設定される。
0では、短時間ブロックの符号化効率を向上するため、
短時間ブロックのグループ化を行う。短時間ブロックの
グループ化では、複数の連続する短時間ブロックをブロ
ック単位でまとめ、スケールファクタバンドと呼ばれる
複数のスペクトルデータから構成されるバンド単位で共
通のステップサイズを用いて量子化することにより、量
子化ステップサイズを表すスケールファクタ等のサイド
情報を削減し、符号化効率を改善する。AACの規格で
は、1フレーム当り、最小1個から最大8個のグループ
にグループ化することが可能である。ここでは、図7に
示すように、8個の短時間ブロックを2個ずつ1グルー
プとして、合計4個のグループ(G0,G1,G2,G
3)にグループ化する。なお、ジョイントステレオスペ
クトルデータの場合には、2つのチャンネルのスペクト
ルデータが対になっているので、グループ化に際して
も、図8に示すように、2つのチャンネルのグループ化
を共通に設定する必要がある。
ャンネルのスペクトルデータ、あるいはジョイントステ
レオデータ生成部520からのジョイントスペクトルデ
ータをスケールファクタバンド毎にまとめ、聴覚モデル
に基づいてスペクトルデータのマスキングレベル、すな
わち許容量子化ノイズレベルを算出し、算出された許容
量子化ノイズレベルに基づいてスケールファクタバンド
毎にスペクトルデータの量子化を行い、ハフマン符号化
等の符号化処理を行い、高能率符号化データを出力す
る。
来の複数の時間ブロックのスペクトルデータのグループ
化では、スペクトルデータに依存しない固定的なグルー
プ化であるため、符号化効率が劣化し、音質が劣化する
ことがあるという課題があった。すなわち、スペクトル
データの時間変化が緩やかなところでは、本来は、より
多くの時間ブロックを1グループとしてスケールファク
タ等のサイド情報を削減し、符号化効率を改善すべきで
あるのにこれができず、また、スペクトルデータの時間
変化が急激なところが、同一のグループにされると、同
一の量子化ステップサイズを用いるため、小さなレベル
の時間ブロックのスペクトルデータを十分表現すること
ができず、このため音質が劣化するという課題があっ
た。
間ブロック間のスペクトルデータの変動に基づく最適な
グループ化により、スペクトルデータとスケールファク
タ等のサイド情報に割り当てるビット数を最適化し、音
質の向上したオーディオ信号高能率符号化方法を提供す
ることを目的とする。
通に設定する必要のあるジョイントステレオスペクトル
データに対しても最適なグループ化を行い、スペクトル
データとスケールファクタ等のサイド情報に割り当てる
ビット数を最適化し、音質の向上したオーディオ信号高
能率符号化方法を提供することを目的とする。
対して、音質を大幅に劣化させることがないグループ化
を行うオーディオ信号の高能率符号化方法を提供するこ
とを目的とする。
切なグループ化を行い、従来よりも音質の向上したオー
ディオ信号符号化方法を提供することを目的とする。
に、本発明のオーディオ信号符号化方法は、オーディオ
信号を時間ブロック単位でスペクトルデータに変換し、
複数の時間ブロックのスペクトルデータをグループ化し
て高能率符号化する方法であって、隣接するグループを
統合した時の統合したグループに属する時間ブロック間
のスペクトルデータの変動の最大あるいは平均を表す統
合グループスペクトル変動指標を算出するステップと、
すべての隣接するグループの統合の中で前記統合グルー
プスペクトル変動指標の最小値を算出するステップと、
前記最小値が第1の閾値以下の場合に前記統合グループ
スペクトル変動指標を最小とするグループを統合するス
テップとを備えたものである。
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、隣接
するグループを統合した時の統合したグループに属する
時間ブロック間のスペクトルデータの変動の最大あるい
は平均を表す統合グループスペクトル変動指標を算出す
るステップと、すべての隣接するグループの統合の中で
前記統合グループスペクトル変動指標の最小値を算出す
るステップと、前記最小値が第1の閾値以下であるかあ
るいはグループ数が第2の閾値より大きい場合に前記統
合グループスペクトル変動指標を最小とするグループを
統合するステップとを備えたものである。
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、複数
のチャンネルのグループ化を共通に設定する場合に、隣
接するグループを統合した時の統合したグループに属す
る時間ブロック間のスペクトルデータの変動の最大ある
いは平均を表す統合グループスペクトル変動指標を複数
のチャンネルについてそれぞれ算出するステップと、前
記複数のチャンネルの統合グループスペクトル変動指標
の最大あるいは平均を複数チャンネル統合グループスペ
クトル変動指標として算出するステップと、すべての隣
接するグループの統合の中で前記複数チャンネル統合グ
ループスペクトル変動指標の最小値を算出するステップ
と、前記最小値が第1の閾値以下である場合に前記複数
チャンネル統合グループスペクトル変動指標を最小とす
るグループを統合するステップとを備えたものである。
は、オーディオ信号を時間ブロック単位でスペクトルデ
ータに変換し、複数の時間ブロックのスペクトルデータ
をグループ化して高能率符号化する方法であって、複数
のチャンネルのグループ化を共通に設定する場合に、隣
接するグループを統合した時の統合したグループに属す
る時間ブロック間のスペクトルデータの変動の最大ある
いは平均を表す統合グループスペクトル変動指標を複数
のチャンネルについてそれぞれ算出するステップと、前
記複数のチャンネルの統合グループスペクトル変動指標
の最大あるいは平均を複数チャンネル統合グループスペ
クトル変動指標として算出するステップと、すべての隣
接するグループの統合の中で前記複数チャンネル統合グ
ループスペクトル変動指標の最小値を算出するステップ
と、前記最小値が第1の閾値以下であるかあるいはグル
ープ数が第2の閾値より大きい場合に前記複数チャンネ
ル統合グループスペクトル変動指標を最小とするグルー
プを統合するステップとを備えたものである。
は、上記本発明のオーディオ信号符号化方法において、
符号化のビットレートに応じて前記第1あるいは第2の
閾値を設定するステップを備えたものである。
信号符号化方法をコンピュータまたはデジタルシグナル
プロセッサに実行させるためのプログラムを記録したコ
ンピュータ読み取り可能な記録媒体としたものである。
信号符号化方法をコンピュータまたはデジタルシグナル
プロセッサに実行させるためのプログラムとしたもので
ある。
て、図面を用いて説明する。
徴である複数の時間ブロックのスペクトルデータのグル
ープ化の方法について、AACエンコーダに適用した場
合を例として説明する。即ち、オーディオ信号符号化装
置(AACエンコーダ)の構成としては、図5に示した
通りである。
形態1のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
特徴部分としてのグループ化の方法について説明する。
ロックに設定し、1フレームのグループ数を最大の8に
設定する。本実施の形態では、当初の8グループから適
宜グループを統合することにより、グループ化を決定す
る。
う。第1の閾値は、隣接するグループを統合するときの
統合するグループに属する時間ブロックのスペクトルデ
ータの変動を表す統合グループスペクトル変動指標に対
する閾値である。
合した時の統合したグループに属するすべての時間ブロ
ック間のスペクトルデータの変動の最大を表すところの
統合グループスペクトル変動指標を以下のようにして算
出する。
8)でスケールファクタバンド番号k(0≦k<max
_sfb、ただし、max_sfbは最大スケールファ
クタバンド数)のバンドのスペクトルデータの絶対値の
最大であるmaxspec(i)(k)を算出し、次に
統合したグループに属する2つの時間ブロック、iとj
のブロック間のスペクトル変動を表すブロック間スペク
トル変動指標dev(i,j)を(数1)で算出する。
し、また、log10(x)は10を底とするxの対数
を表す。
トル変動指標の算出に時間ブロック番号とスケールファ
クタバンド番号で指定されるバンドのスペクトルデータ
の絶対値の最大を用いる例を示したが、前記スペクトル
データの絶対値の平均や、スペクトルデータの2乗和の
平均の平方根を用いても良い。また、2つのブロックの
前記スペクトルデータの絶対値の最大の比の対数の絶対
値のスケールファクタバンドに関する総和を用いる例を
示したが、前記2つのブロックの前記スペクトルデータ
の絶対値の最大の差の2乗のスケールファクタバンドに
関する総和を用いてもよい。
時間ブロック間のブロック間スペクトル変動指標dev
(i,j)の最大を算出し、統合グループグループ変動
指標とする。
に属するすべてのブロック間スペクトル変動指標の最大
を用いたが、平均を用いてもよい。
グループの統合の中で、統合グループスペクトル変動指
標の最小値を算出する。最初は、1グループ1ブロック
に設定されているので、[0,1]、[1,2]、
[2,3]、[3,4]、[4,5]、[5,6]、
[6,7](ここで[]の内は統合する短時間ブロック
の番号を表す。)の7通りのグループの統合の中で最小
値とそれを与えるグループ統合を算出する。
算出した統合グループスペクトル変動指標の最小値と第
1の閾値とを比較し、上記統合グループスペクトル変動
指標の最小値が第1の閾値以下である場合にはステップ
106に行き、グループ統合を行い、そうでない場合に
はグループ化を終了する。したがって、統合したときの
グループ内の時間ブロックのスペクトル変動が小さい場
合においてのみグループ統合はなされ、前記時間ブロッ
クのスペクトル変動が大きい場合にはグループ統合はな
されない。
出した統合グループスペクトル変動指標を最小とするグ
ループを統合する。
少してステップ103に戻る。
グループを統合した時のグループ内のスペクトルデータ
の変動を表す統合グループスペクトル変動指標に基づ
き、前記統合グループスペクトル変動指標が第1の閾値
以下の場合には、最適な順序で(上記統合グループスペ
クトル変動指標の小さいものから順に)グループ化を行
うことにより、スペクトルデータとスケールファクタ等
のサイド情報に割り当てるビット数を最適化し、音質を
向上することができる。
形態2のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
は、図1に示したステップと同一である。図2と図1の
相違点は、図2では、ステップ201とステップ202
が追加されている点にあるので、以下、これらのステッ
プの処理内容について説明し、それ以外のステップにつ
いては説明を省略する。
行う。第2の閾値は、グループ数に関する閾値であり、
時間変化の極めて激しいフレームでグループ数が大きく
なり過ぎて、サイド情報のビット数が増え、スペクトル
データのビット数が不足することによる音質劣化を抑え
るためのものである。
プ数と第2の閾値を比較し、グループ数が第2の閾値よ
り大きい場合には、ステップ106に行き、グループを
統合する。また、グループ数が第2の閾値以下である場
合にはステップ105に行き、統合グループスペクトル
変動指標の最小値が第1の閾値以下である場合のみ、ス
テップ106に行き、グループを統合する。
化の最大グループ数を第2の閾値で設定し、グループ数
を制限することにより、サイド情報に割り当てるビット
数を制限し、スペクトルデータに割り当てることによ
り、時間変化の極めて激しいフレームでの大幅な音質劣
化を抑えることができる。
形態3のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
は、図2に示したステップと同一である。図3と図2の
相違点は、図3ではステップ301が追加されている点
にあるので、以下、追加されたステップとそれに関連す
るステップについて説明し、それ以外のステップについ
ては説明を省略する。
する。
で入力されたビットレートに応じて第1の閾値の設定を
行う。すなわち、ビットレートが高い場合には、使用可
能なビット数が増加するので、第1の閾値をより小さい
値に設定することにより、グループ数を増加させ、スペ
クトルデータの時間変化をより正確に表現できるように
する。
01で入力されたビットレートに応じて第2の閾値の設
定を行う。すなわち、ビットレートが高い場合には、使
用可能なビット数が増加するので、第2の閾値をより大
きな値に設定することにより、最大グループ数を増加さ
せ、スペクトルデータの時間変化の激しい場合にもスペ
クトルデータをより正確に表現できるようにする。
いは第2の閾値をビットレートに応じて設定することに
より、それぞれのビットレートに適したグループ化を行
い、広い範囲のビットレートに対して音質を向上するこ
とができる。
形態4のオーディオ信号符号化方法における複数の時間
ブロックのスペクトルデータのグループ化の方法のステ
ップを示すフローチャートである。
ブロックのグループ化を共通に設定する場合のグループ
化の方法である。
2つのチャンネルのスペクトルデータを一対として取り
扱うので、2つのチャンネルの時間ブロックのグループ
化を共通に設定する必要がある。すなわち、実施の形態
4は、例えば、ミッド/サイドステレオ符号化やインテ
ンシティステレオ符号化に対して適用される。ただし、
インテンシティステレオ符号化に関しては、一方のチャ
ンネルのスペクトルデータはゼロに設定されているの
で、ゼロに設定されていないチャンネルのスペクトルデ
ータに対して、例えば、実施の形態1〜3のグループ化
を行い、それを2つのチャンネルに対して共通に適用し
てもよい。
グループ化の方法について説明する。
ブロックに設定し、1フレームのグループ数を最大の8
に設定する。本実施の形態では、当初の8グループから
グループを統合することにより、グループ化を決定す
る。
る。
第1の閾値の設定を行う。第1の閾値は、2つのチャン
ネルの隣接するグループを統合した時の統合したグルー
プに属する時間ブロックのスペクトルデータの変動を表
す2チャンネル統合グループスペクトル変動指標に対す
る閾値である。
第2の閾値の設定を行う。第2の閾値は、グループ数に
対する閾値であり、グループ数が大きくなり過ぎて、サ
イド情報のビット数が増え、スペクトルデータのビット
数が不足することによる音質劣化を抑えるためのもので
ある。
合したときの統合したグループに属する時間ブロック間
のスペクトルデータの変動の最大を表す統合グループス
ペクトル変動指標を2つのチャンネルについてそれぞれ
算出する。各チャンネルの統合グループスペクトル変動
指標の算出に関しては、実施の形態1のステップ103
で説明した方法を用いる。
算出した2つのチャンネルの統合グループスペクトル変
動指標の最大を算出し、2チャンネル統合グループスペ
クトルとする。
の統合グループスペクトル変動指標の最大を2チャンネ
ル統合グループスペクトルとして用いる例を示したが、
前記統合グループスペクトル変動指標の平均を用いても
よい。
グループの統合の中で2チャンネル統合グループスペク
トル変動指標の最小値を算出する。最初は、1グループ
1ブロックに設定されているので、[0,1]、[1,
2]、[2,3]、[3,4]、[4,5]、[5,
6]、[6,7](ここで[]の内は統合する短時間ブ
ロックの番号を表す。)の7通りのグループの統合の中
で最小値とそれを与えるグループ統合を算出する。
ープ数と第2の閾値を比較し、グループ数が第2の閾値
より大きい場合には、ステップ410に行き、グループ
を統合する。また、グループ数が第2の閾値以下である
場合にはステップ409に行く。
した2チャンネル統合グループスペクトル変動指標の最
小値と第1の閾値とを比較し、上記2チャンネル統合グ
ループスペクトル変動指標の最小値が第1の閾値以下で
ある場合にはステップ410に行き、グループ統合を行
う。そうでない場合にはグループ化を終了する。したが
って、統合したときのグループ内の時間ブロックのスペ
クトル変動が小さい場合においてのみグループ統合はな
され、前記時間ブロックのスペクトル変動が大きい場合
にはグループ統合はなされない。
出した2チャンネル統合グループスペクトル変動指標を
最小とするグループを統合する。
少してステップ405に戻る。
ャンネルで共通のグループ化を行う場合に、2つのチャ
ンネルの隣接するグループを統合した時のグループ内の
スペクトルデータの変動を表す2チャンネル統合グルー
プスペクトル変動指標に基づき、グループ数が第2の閾
値より大きいかあるいは前記2チャンネル統合グループ
スペクトル変動指標が第1の閾値以下の場合には、最適
な順序で(上記2チャンネル統合グループスペクトル変
動指標の小さいものから順に)グループ化を行うことに
より、スペクトルデータとスケールファクタ等のサイド
情報に割り当てるビット数を最適化し、音質を向上する
ことができる。
し、第2の閾値とグループ数を比較するステップを設け
る例を示したが、実施の形態1のように、これらのステ
ップを省いてもよい。
オ信号符号化方法は、コンピュータまたはデジタルシグ
ナルプロセッサに実行させるためのプログラムとして実
現することができ、これをコンピュータ読み取り可能な
記録媒体に記録してもよい。
グループを統合したときのグループ内の時間ブロックの
スペクトルデータの変動を表す統合グループスペクトル
変動指標に基づき、統合グループスペクトル変動指標が
第1の閾値以下の場合に、最適な順序で(上記統合グル
ープスペクトル変動指標の小さいものから順に)グルー
プ化を行うことにより、スペクトルデータとスケールフ
ァクタ等のサイド情報に割り当てるビット数を最適化
し、音質を向上することができる。
の閾値で設定し、グループ数を制限することにより、サ
イド情報に割り当てるビット数を制限し、スペクトルデ
ータに割り当てることにより、時間変化の極めて激しい
フレームに対する大幅な音質劣化を抑えることができ
る。
ートに応じて設定することにより、それぞれのビットレ
ートに適したグループ化を行い、広い範囲のビットレー
トに対して音質を向上することができる。
うに2つのチャンネルで共通のグループ化を行う場合に
対して、2チャンネル統合グループスペクトル変動指標
に基づき、グループ数が第2の閾値より大きいかあるい
は前記2チャンネル統合グループスペクトル変動指標が
第1の閾値以下の場合には、最適な順序で(上記2チャ
ンネル統合グループスペクトル変動指標の小さいものか
ら順に)グループ化を行うことにより、スペクトルデー
タとスケールファクタ等のサイド情報に割り当てるビッ
ト数を最適化し、音質を向上することができる。
方法における複数の時間ブロックのグループ化の方法の
ステップを示すフローチャート
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
おける複数の時間ブロックのグループ化の方法のステッ
プを示すフローチャート
クの例を説明するための説明図
例を説明するための説明図
短時間ブロックのグループ化の例を説明するための説明
図
Claims (7)
- 【請求項1】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、隣接するグループを統合した時の統合したグルー
プに属する時間ブロック間のスペクトルデータの変動の
最大あるいは平均を表す統合グループスペクトル変動指
標を算出するステップと、すべての隣接するグループの
統合の中で前記統合グループスペクトル変動指標の最小
値を算出するステップと、前記最小値が第1の閾値以下
の場合に前記統合グループスペクトル変動指標を最小と
するグループを統合するステップとを備えたことを特徴
とするオーディオ信号符号化方法。 - 【請求項2】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、隣接するグループを統合した時の統合したグルー
プに属する時間ブロック間のスペクトルデータの変動の
最大あるいは平均を表す統合グループスペクトル変動指
標を算出するステップと、すべての隣接するグループの
統合の中で前記統合グループスペクトル変動指標の最小
値を算出するステップと、前記最小値が第1の閾値以下
であるかあるいはグループ数が第2の閾値より大きい場
合に前記統合グループスペクトル変動指標を最小とする
グループを統合するステップとを備えたことを特徴とす
るオーディオ信号符号化方法。 - 【請求項3】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、複数のチャンネルのグループ化を共通に設定する
場合に、隣接するグループを統合した時の統合したグル
ープに属する時間ブロック間のスペクトルデータの変動
の最大あるいは平均を表す統合グループスペクトル変動
指標を複数のチャンネルについてそれぞれ算出するステ
ップと、前記複数のチャンネルの統合グループスペクト
ル変動指標の最大あるいは平均を複数チャンネル統合グ
ループスペクトル変動指標として算出するステップと、
すべての隣接するグループの統合の中で前記複数チャン
ネル統合グループスペクトル変動指標の最小値を算出す
るステップと、前記最小値が第1の閾値以下である場合
に前記複数チャンネル統合グループスペクトル変動指標
を最小とするグループを統合するステップとを備えたこ
とを特徴とするオーディオ信号符号化方法。 - 【請求項4】 オーディオ信号を時間ブロック単位でス
ペクトルデータに変換し、複数の時間ブロックのスペク
トルデータをグループ化して高能率符号化する方法であ
って、複数のチャンネルのグループ化を共通に設定する
場合に、隣接するグループを統合した時の統合したグル
ープに属する時間ブロック間のスペクトルデータの変動
の最大あるいは平均を表す統合グループスペクトル変動
指標を複数のチャンネルについてそれぞれ算出するステ
ップと、前記複数のチャンネルの統合グループスペクト
ル変動指標の最大あるいは平均を複数チャンネル統合グ
ループスペクトル変動指標として算出するステップと、
すべての隣接するグループの統合の中で前記複数チャン
ネル統合グループスペクトル変動指標の最小値を算出す
るステップと、前記最小値が第1の閾値以下であるかあ
るいはグループ数が第2の閾値より大きい場合に前記複
数チャンネル統合グループスペクトル変動指標を最小と
するグループを統合するステップとを備えたことを特徴
とするオーディオ信号符号化方法。 - 【請求項5】 符号化のビットレートに応じて前記第1
あるいは第2の閾値を設定するステップを備えたことを
特徴とする請求項1から請求項4のいずれかに記載のオ
ーディオ信号符号化方法。 - 【請求項6】 請求項1ないし5のいずれかに記載のオ
ーディオ信号符号化方法をコンピュータまたはデジタル
シグナルプロセッサに実行させるためのプログラムを記
録したコンピュータ読み取り可能な記録媒体。 - 【請求項7】 請求項1ないし5のいずれかに記載のオ
ーディオ信号符号化方法をコンピュータまたはデジタル
シグナルプロセッサに実行させるためのプログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001296836A JP4635400B2 (ja) | 2001-09-27 | 2001-09-27 | オーディオ信号符号化方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001296836A JP4635400B2 (ja) | 2001-09-27 | 2001-09-27 | オーディオ信号符号化方法 |
Publications (3)
| Publication Number | Publication Date |
|---|---|
| JP2003108192A true JP2003108192A (ja) | 2003-04-11 |
| JP2003108192A5 JP2003108192A5 (ja) | 2008-02-21 |
| JP4635400B2 JP4635400B2 (ja) | 2011-02-23 |
Family
ID=19118004
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001296836A Expired - Fee Related JP4635400B2 (ja) | 2001-09-27 | 2001-09-27 | オーディオ信号符号化方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4635400B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003098602A1 (en) * | 2002-05-20 | 2003-11-27 | Sony Corporation | Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device |
| JP2007523366A (ja) * | 2004-01-20 | 2007-08-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | ブロック系列化に基づくオーディオコーディング |
| WO2008004649A1 (fr) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Dispositif de codage audio, procédé de codage audio, et programme de ceux-ci |
Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000137497A (ja) * | 1998-10-29 | 2000-05-16 | Ricoh Co Ltd | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
| JP2001154698A (ja) * | 1999-11-29 | 2001-06-08 | Victor Co Of Japan Ltd | オーディオ符号化装置及びその方法 |
-
2001
- 2001-09-27 JP JP2001296836A patent/JP4635400B2/ja not_active Expired - Fee Related
Patent Citations (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000137497A (ja) * | 1998-10-29 | 2000-05-16 | Ricoh Co Ltd | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
| JP2001154698A (ja) * | 1999-11-29 | 2001-06-08 | Victor Co Of Japan Ltd | オーディオ符号化装置及びその方法 |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2003098602A1 (en) * | 2002-05-20 | 2003-11-27 | Sony Corporation | Acoustic signal encoding method and encoding device, acoustic signal decoding method and decoding device, program, and recording medium image display device |
| US7627482B2 (en) | 2002-05-20 | 2009-12-01 | Sony Corporation | Methods, storage medium, and apparatus for encoding and decoding sound signals from multiple channels |
| US7912731B2 (en) | 2002-05-20 | 2011-03-22 | Sony Corporation | Methods, storage medium and apparatus for encoding and decoding sound signals from multiple channels |
| KR101144696B1 (ko) | 2002-05-20 | 2012-05-25 | 소니 주식회사 | 음향 신호 부호화 방법 및 부호화 장치, 음향 신호 복호 방법 및 복호 장치, 및 기록 매체 화상 표시 장치 |
| JP2007523366A (ja) * | 2004-01-20 | 2007-08-16 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | ブロック系列化に基づくオーディオコーディング |
| WO2008004649A1 (fr) * | 2006-07-07 | 2008-01-10 | Nec Corporation | Dispositif de codage audio, procédé de codage audio, et programme de ceux-ci |
| JP5093514B2 (ja) * | 2006-07-07 | 2012-12-12 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびそのプログラム |
| US8818818B2 (en) | 2006-07-07 | 2014-08-26 | Nec Corporation | Audio encoding device, method, and program which controls the number of time groups in a frame using three successive time group energies |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4635400B2 (ja) | 2011-02-23 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| AU733156B2 (en) | Audio coding method and apparatus | |
| JP4506039B2 (ja) | 符号化装置及び方法、復号装置及び方法、並びに符号化プログラム及び復号プログラム | |
| JP5326465B2 (ja) | オーディオ復号方法、装置、及びプログラム | |
| JP2001053617A (ja) | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 | |
| JP3636094B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
| KR100695125B1 (ko) | 디지털 신호 부호화/복호화 방법 및 장치 | |
| KR102288111B1 (ko) | 스테레오 신호의 인코딩 및 디코딩 방법과, 인코딩 및 디코딩 장치 | |
| JP3900000B2 (ja) | 符号化方法及び装置、復号方法及び装置、並びにプログラム | |
| JPH1084284A (ja) | 信号再生方法および装置 | |
| JP2004309921A (ja) | 符号化装置、符号化方法及びプログラム | |
| JP4062971B2 (ja) | オーディオ信号符号化方法 | |
| US8593321B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
| JP4734859B2 (ja) | 信号符号化装置及び方法、並びに信号復号装置及び方法 | |
| KR100952065B1 (ko) | 부호화 방법 및 장치, 및 복호 방법 및 장치 | |
| JP2004325633A (ja) | 信号符号化方法、信号符号化プログラム及びその記録媒体 | |
| JP2000151413A (ja) | オーディオ符号化における適応ダイナミック可変ビット割り当て方法 | |
| JP2006003580A (ja) | オーディオ信号符号化装置及びオーディオ信号符号化方法 | |
| JP3894722B2 (ja) | ステレオオーディオ信号高能率符号化装置 | |
| US8601039B2 (en) | Computation apparatus and method, quantization apparatus and method, and program | |
| JPH0969781A (ja) | オーディオデータ符号化装置 | |
| US7181079B2 (en) | Time signal analysis and derivation of scale factors | |
| JP4635400B2 (ja) | オーディオ信号符号化方法 | |
| JP2003233397A (ja) | オーディオ符号化装置、オーディオ符号化プログラム及びオーディオ符号化データ伝送装置 | |
| JP4191503B2 (ja) | 音声楽音信号符号化方法、復号化方法、符号化装置、復号化装置、符号化プログラム、および復号化プログラム | |
| JP4369140B2 (ja) | オーディオ高能率符号化装置、オーディオ高能率符号化方法、オーディオ高能率符号化プログラム及びその記録媒体 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071225 |
|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071225 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080115 |
|
| RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20091119 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100531 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100608 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100722 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100817 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20101004 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20101026 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101108 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131203 Year of fee payment: 3 |
|
| S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| LAPS | Cancellation because of no payment of annual fees |