JP2000091920A - Video and audio compression device - Google Patents
Video and audio compression deviceInfo
- Publication number
- JP2000091920A JP2000091920A JP25364298A JP25364298A JP2000091920A JP 2000091920 A JP2000091920 A JP 2000091920A JP 25364298 A JP25364298 A JP 25364298A JP 25364298 A JP25364298 A JP 25364298A JP 2000091920 A JP2000091920 A JP 2000091920A
- Authority
- JP
- Japan
- Prior art keywords
- bit allocation
- scale factor
- unit
- sub
- bit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Television Signal Processing For Recording (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
(57)【要約】 (修正有)
【課題】 画像音声圧縮装置の圧縮処理の約半分を占め
るビット配分の処理をスケールファクタを基にして算出
することによりビット配分算出処理を大幅に処理を削減
する。
【解決手段】 一定間隔でサンプリングされたデータを
32のサブバンドに分割するサブバンド分析部101の
出力の最大振幅を正規化しスケールファクタとするスケ
ーリング部102、スケールファクタの変化量が少ない
ときには共通化するスケールファクタ選択情報算出部1
03、各サブバンドのビット配分算出部104、算出さ
れたビット配分とスケールファクタとを用いてサブバン
ド分析部で処理されたデータを量子化する量子化部10
5、ヘッダ、ビット配分、SCFSI(スケールファク
タ選択情報)、各サブバンドのスケールファクタ、量子
化されたデータとからオーディオストリームを生成する
ビットストリーム生成部106とから構成しスケールフ
ァクタを基にしてビット配分を算出する。
(57) [Summary] (with correction) [PROBLEMS] To significantly reduce the bit allocation calculation processing by calculating the bit allocation processing that occupies about half of the compression processing of the image / audio compression apparatus based on the scale factor. I do. SOLUTION: A scaling section 102 normalizes the maximum amplitude of an output of a subband analysis section 101 to divide data sampled at regular intervals into 32 subbands and uses it as a scale factor. Scale factor selection information calculation unit 1
03, the bit allocation calculation unit 104 for each subband, the quantization unit 10 that quantizes the data processed by the subband analysis unit using the calculated bit allocation and the scale factor.
5, a bit stream generation unit 106 for generating an audio stream from a header, bit allocation, SCFSI (scale factor selection information), scale factor of each sub-band, and quantized data. Calculate the distribution.
Description
【0001】[0001]
【発明の属する技術分野】本発明は、ビデオカメラ、電
子スチルカメラ、電話機等の画像音声圧縮装置に関する
ものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a video / audio compression apparatus such as a video camera, an electronic still camera, and a telephone.
【0002】[0002]
【従来の技術】音声圧縮装置として、例えばISO/IEC 11
172-3:1993(E)(MPEG1 オーディオ)に記載されている音
声圧縮装置(LAYERII)のブロック図を図5に示す
(以下、これを公知例とする)。2. Description of the Related Art As an audio compression device, for example, ISO / IEC 11
FIG. 5 shows a block diagram of an audio compression apparatus (LAYERII) described in 172-3: 1993 (E) (MPEG1 audio) (hereinafter, this is a known example).
【0003】図5において、501は入力された音声デ
ータを32の帯域に分割するサブバンド分析部、502
は各サブバンドの連続する12サンプル毎に最大振幅で
あるスケールファクタを算出するスケーリング部、50
3はスケールファクタの変化量が少ないときには共通化
するスケールファクタ選択情報算出部、504は入力さ
れた音声データを聴覚心理を利用して各サブバンドのビ
ット配分を算出する聴覚心理処理部、505は聴覚心理
処理部504で算出されたビット配分とスケールファク
タ選択情報算出部503で算出されたスケールファクタ
とを用いてサブバンド分析部501で処理されたデータ
を量子化する量子化部、オーディオストリームを生成す
るビットストリーム生成部とから構成される。In FIG. 5, reference numeral 501 denotes a sub-band analyzer which divides input audio data into 32 bands, 502
Is a scaling unit that calculates a scale factor that is the maximum amplitude for every 12 consecutive samples of each subband, 50
Reference numeral 3 denotes a scale factor selection information calculation unit for sharing when the change amount of the scale factor is small. Reference numeral 504 denotes a psychoacoustic processing unit for calculating the bit allocation of each subband using the psychoacoustic input sound data. A quantization unit that quantizes the data processed by the subband analysis unit 501 using the bit allocation calculated by the psychoacoustic processing unit 504 and the scale factor calculated by the scale factor selection information calculation unit 503; And a bit stream generating unit for generating the bit stream.
【0004】[0004]
【発明が解決しようとする課題】上述した公知例におい
て、オーディオの一連の圧縮処理には膨大の演算が必要
である。その膨大な演算量のために、マイコンを使用し
てソフトウエアでリアルタイムにオーディオデータを圧
縮処理することができないため、音声専用のLSIが必要
であった。In the above-mentioned known example, an enormous amount of calculation is required for a series of audio compression processing. Because of the enormous amount of computation, audio data cannot be compressed and processed in real time by software using a microcomputer, so a dedicated LSI for audio was required.
【0005】ここで、先に本発明者が特願平9−360
602号にて出願した音声圧縮伸長装置を図6に示す。
これは、サブバンド分析部601、スケーリング部60
2、スケールファクタ選択情報算出部603、ビット配
分選択部604、ビット配分テーブル部605、量子化
部606、ビットストリーム生成部607から構成され
ており、各サブバンドのビット配分をあらかじめビット
配分テーブル部605とすることにより上記公知例の聴
覚心理処理部504を削除することによりオーディオ処
理の演算量を減少したものである。[0005] Here, the present inventor has previously proposed in Japanese Patent Application No. 9-360.
FIG. 6 shows an audio compression / decompression device filed in Japanese Patent Application No. 602.
This is because the sub-band analysis unit 601 and the scaling unit 60
2, a scale factor selection information calculation unit 603, a bit allocation selection unit 604, a bit allocation table unit 605, a quantization unit 606, and a bit stream generation unit 607. By setting 605, the amount of calculation for audio processing is reduced by eliminating the psychoacoustic processing unit 504 of the above-mentioned known example.
【0006】この特願平9−360602号において、
普段よく使われているビットレート(例えば128kb
ps程度)では1サブバンド当たりのビット数の割り当
てが多くなるため効果的に圧縮処理が行えた。しかし、
1サブバンド当たりのビット数が少なくなる低ビットレ
ートの場合や特定の帯域に偏った音声に対しては、各々
のサブバンドに割り当てられるビット数が少なくなるた
めダイナミックで効率的なビット配分が要求される。In this Japanese Patent Application No. 9-360602,
Bit rates commonly used (for example, 128 kb
(approximately ps), the number of bits per subband is increased, so that the compression process can be performed effectively. But,
In the case of a low bit rate where the number of bits per subband is small, or for voice biased to a specific band, the number of bits allocated to each subband is small, so dynamic and efficient bit allocation is required. Is done.
【0007】[0007]
【課題を解決するための手段】上記課題を達成するため
に、本発明は、スケールファクタを基にしてビット配分
を算出することにより音声圧縮処理の約半分の演算量を
占める図5の聴覚心理処理部504の演算をほとんど削
減し、且つ低ビットレートや特定の帯域に偏った音声に
対しても高音質で高圧縮の音声圧縮が実現できる。In order to attain the above object, the present invention provides a method of calculating the bit allocation based on a scale factor, which occupies about half of the operation amount of the audio compression processing. The operation of the processing unit 504 can be reduced substantially, and high-quality and high-compression audio compression can be realized even for audio having a low bit rate or a bias in a specific band.
【0008】[0008]
【発明の実施の形態】以下、本発明の実施例を図面を用
いて説明する。Embodiments of the present invention will be described below with reference to the drawings.
【0009】まず、本発明の実施例の動作について説明
する。First, the operation of the embodiment of the present invention will be described.
【0010】図4は、本発明の一実施例のシステムブロ
ック図である。同図において、401はレンズ、402
は撮像素子、403は撮像素子402より得られる撮像
信号をテレビジョン等で写す為の映像信号に変換するカ
メラ信号処理部、404はマイク、405は404のマ
イクで集められた音声をデジタルに変換するA/D変換
部、406はカメラ信号処理部403の映像信号を圧縮
しビデオストリームを生成するビデオ処理部、407は
A/D変換部405でデジタルに変換されたオーディオ
データを一時的に蓄えるオーディオバッファ、408は
ビデオ処理部406とオーディオバッファ407とから
構成されるMPEG CODEC部、409はオーディ
オバッファ407のオーディオデータを圧縮しオーディ
オストリームを生成するMPEG Audio部、41
0はビデオ処理部406で生成されたビデオストリーム
とMPEG Audio部409で生成されたオーディ
オストリームとを同期を取りシステムストリームを生成
する多重化部、411はMPEG Audio部409
と多重化部410及び多重化されたシステムストリーム
を記録媒体413に書き込むマイコン、412はビデオ
データとオーディオデータを取込み圧縮しシステムスト
リームを生成するMPEGカメラ、413はMPEGカ
メラ412で生成されたシステムストリームを記録する
記録媒体である。FIG. 4 is a system block diagram of one embodiment of the present invention. In the figure, 401 is a lens, 402
Denotes an image sensor, 403 denotes a camera signal processing unit which converts an image signal obtained from the image sensor 402 into a video signal for photographing on a television or the like, 404 denotes a microphone, and 405 converts audio collected by the microphone 404 to digital. A / D converter 406, a video processor for compressing the video signal of the camera signal processor 403 to generate a video stream, and 407 temporarily store the audio data converted to digital by the A / D converter 405. An audio buffer 408 is an MPEG CODEC unit composed of a video processing unit 406 and an audio buffer 407, and 409 is an MPEG Audio unit 41 for compressing audio data in the audio buffer 407 and generating an audio stream.
A multiplexing unit 0 synchronizes the video stream generated by the video processing unit 406 with the audio stream generated by the MPEG audio unit 409 to generate a system stream, and 411 denotes an MPEG audio unit 409.
And a multiplexing unit 410 and a microcomputer that writes the multiplexed system stream to the recording medium 413, an MPEG camera 412 that takes in video data and audio data and compresses it to generate a system stream, and 413, a system stream generated by the MPEG camera 412. This is a recording medium for recording.
【0011】映像はレンズ401で集光され撮像素子4
02により撮像信号に変換されカメラ信号処理403で
映像信号に変換され、ビデオ処理部406でMPEGに
準拠したビデオストリームに圧縮される。一方音声は、
マイク404で集音されA/D変換部405でデジタル
に変換されオーディオバッファ407を介してMPEG
Audio部409でMPEG Audioに準拠した
オーディオストリームに圧縮される。多重化部410で
ビデオストリームとオーディオストリームとを同期をと
りMPEGシステムストリームに準拠した形式で記録媒
体413に記録する。An image is condensed by a lens 401 and the image pickup device 4
The video signal is converted into a video signal by a camera signal processing 403, and is compressed into a video stream compliant with MPEG by a video processing unit 406. On the other hand, audio
The sound is collected by the microphone 404, converted to digital by the A / D conversion unit 405, and converted to MPEG via the audio buffer 407.
The audio unit 409 compresses the audio stream into an audio stream compliant with MPEG Audio. The multiplexing unit 410 synchronizes the video stream and the audio stream and records them on the recording medium 413 in a format conforming to the MPEG system stream.
【0012】次に、図4のMPEG Audio部40
9での処理の第一の実施例を図1を用いて説明する。Next, the MPEG Audio unit 40 shown in FIG.
A first embodiment of the processing in step 9 will be described with reference to FIG.
【0013】101はA/D変換部405で処理された
オーディオデータを32の帯域に分割するサブバンド分
析部、102は32サブバンドに分割されたデータの最
大振幅をスケールファクタとするスケーリング部、10
3はスケールファクタの変化量が少ないときには共通化
するスケールファクタ選択情報算出部、104はスケー
リング部102が算出したスケールファクタを基にして
各サブバンドのビット配分を算出するビット配分算出
部、105はスケーリング部102で算出したスケール
ファクタをスケールファクタ選択算出部103で共通化
したスケールファクタとビット配分算出部104で算出
したビット配分とを用いてサブバンド分析101で処理
されたデータを量子化する量子化部、106はヘッダ、
ビット配分、SCFSI(SCALEFACTOR SELECTION IMF
ORMATION、スケールファクタ選択情報)、スケールファ
クタ、量子化されたデータからオーディオストリームを
生成するビットストリーム生成部である。Reference numeral 101 denotes a subband analysis unit that divides the audio data processed by the A / D conversion unit 405 into 32 bands, 102 denotes a scaling unit that uses the maximum amplitude of the data divided into 32 subbands as a scale factor, 10
Numeral 3 denotes a scale factor selection information calculation unit for sharing when the amount of change of the scale factor is small, 104 denotes a bit allocation calculation unit for calculating bit allocation of each subband based on the scale factor calculated by the scaling unit 102, and 105 denotes a bit allocation calculation unit. A quantum that quantizes the data processed in the subband analysis 101 using the scale factor calculated by the scaling unit 102 and the scale factor shared by the scale factor selection calculation unit 103 and the bit allocation calculated by the bit allocation calculation unit 104. , A header 106,
Bit allocation, SCFSI (SCALEFACTOR SELECTION IMF
ORMATION, scale factor selection information), a scale factor, and a bit stream generation unit that generates an audio stream from quantized data.
【0014】次に、ビット配分算出部104の一具体例
を図7、図8、図9を用いて説明する。Next, a specific example of the bit allocation calculation unit 104 will be described with reference to FIGS. 7, 8, and 9. FIG.
【0015】701ではスケーリング部102で算出さ
れた各サブバンドのスケールファクタの最大値を求め
る。702ではそのスケールファクタの最大値から各サ
ブバンドのビット配分を算出する。図8に公知例に記載
されてあるスケールファクタのテーブルを示す。テーブ
ル番号は0から62まで63個ありテーブル番号が小さ
くなるにつれスケールファクタの値は大きくなる。この
テーブル番号に対応してビット配分を算出する。一具体
例としてサンプリング周波数32kHz、ビットレート
32kbps、LAYERIIの場合のビット配分算出を
図9を用いて説明する。図9はスケールファクタ番号に
対応したビット配分を示しており、例えば701で算出
されたスケールファクタの最大の番号が10のとき、サ
ブバンド0〜5ではビット配分は4となりサブバンド6
〜11ではビット配分は3となる。人の聴覚は低域に敏
感なためにこのようにサブバンド0〜5までとサブバン
ド6〜11までとを分けている。サンプリング周波数3
2kHz、ビットレート32kbps、LAYERIIの
場合では、使用サブバンドはMPEG Audioの規格書ISO/IE
C 11172-3:1993(E)(MPEG1 オーディオ)により12サブ
バンドである。そのため、12サブバンドに対してそれ
ぞれ算出する。703では1AAU(Audio Access Uni
t、オーディオ復号単位)の総ビットからヘッダ、ビッ
ト配分、SCFSI、スケールファクタを除いたサンプ
ルに割り当て可能ビット数を求める。704では703
で求めたサンプルに割り当て可能ビット数と702での
各サブバンドのビット配分から、各サブバンドに割り当
てたビット配分が1AAU内に収まっているかチェック
する。収まっているときには終了するが収まっていない
ときには705で聴覚心理に基づいてビット配分を減少
する。ビット配分を減少する方法は、ビット配分が多い
サブバンドに着目してビット配分を1ビットずつ減らし
ていく。減らす順番としてはサブバンドの数が大きい順
に行い目標の1AAUに収まるまで繰り返す。In step 701, the maximum value of the scale factor of each subband calculated by the scaling unit 102 is obtained. In 702, the bit allocation of each subband is calculated from the maximum value of the scale factor. FIG. 8 shows a scale factor table described in the known example. There are 63 table numbers from 0 to 62, and the value of the scale factor increases as the table number decreases. The bit allocation is calculated according to the table number. As one specific example, calculation of bit allocation in the case of a sampling frequency of 32 kHz, a bit rate of 32 kbps, and LAYERII will be described with reference to FIG. FIG. 9 shows the bit allocation corresponding to the scale factor number. For example, when the maximum scale factor number calculated in 701 is 10, the bit allocation becomes 4 in subbands 0 to 5, and the subband 6
For 1111, the bit allocation is 3. Since human hearing is sensitive to low frequencies, sub-bands 0 to 5 are separated from sub-bands 6 to 11 in this way. Sampling frequency 3
In the case of 2 kHz, bit rate of 32 kbps and LAYERII, the subband used is MPEG Audio standard ISO / IE
C 11172-3: 12 subbands according to 1993 (E) (MPEG1 audio). Therefore, calculation is performed for each of the 12 subbands. In 703, 1 AAU (Audio Access Uni
(t, audio decoding unit), the number of bits that can be allocated to the sample excluding the header, bit allocation, SCFSI, and scale factor is calculated. 703 for 704
From the number of bits that can be allocated to the sample and the bit allocation of each subband in 702, it is checked whether the bit allocation allocated to each subband is within 1 AAU. When it is within the range, the process ends, but when the range is not within the range, at 705, the bit allocation is reduced based on psychoacoustics. The method of reducing the bit allocation focuses on the sub-bands where the bit allocation is large, and reduces the bit allocation one bit at a time. The order of reduction is in the order of the number of subbands, and is repeated until the number of subbands falls within the target 1 AAU.
【0016】次に、図4のMPEG Audio部40
9での処理の第二の実施例を図2を用いて説明する。Next, the MPEG Audio unit 40 shown in FIG.
A second embodiment of the processing in step 9 will be described with reference to FIG.
【0017】201はA/D変換部405で処理された
オーディオデータを32の帯域に分割するサブバンド分
析部、202は32サブバンドに分割されたデータの最
大振幅をスケールファクタとするスケーリング部、20
3はスケールファクタの変化量が少ないときには共通化
するスケールファクタ選択情報算出部、204は数個の
ビット配分テーブル部、205はスケールファクタ選択
情報算出部203で算出したSCFSIを基にスケール
ファクタの数を求めその数に応じたビット配分テーブル
をビット配分テーブル部204から最適のビット配分テ
ーブルを選択するビット配分テーブル選択部、206は
スケーリング部202が算出したスケールファクタを基
にしてビット配分テーブル選択部205が選択したビッ
ト配分テーブルを各サブバンドに振り分けるビット配分
振り分け部、207はスケールファクタ選択算出部20
3で共通化したスケールファクタとビット配分振り分け
部206で振り分けられたビット配分とを用いてサブバ
ンド分析201で処理されたデータを量子化する量子化
部、208はヘッダ、ビット配分、SCFSI、スケー
ルファクタ、量子化されたデータからオーディオストリ
ームを生成するビットストリーム生成部である。Reference numeral 201 denotes a subband analysis unit that divides the audio data processed by the A / D conversion unit 405 into 32 bands, 202 denotes a scaling unit that uses the maximum amplitude of the data divided into 32 subbands as a scale factor, 20
Reference numeral 3 denotes a scale factor selection information calculation unit that is used in common when the amount of change in the scale factor is small, 204 denotes several bit allocation tables, and 205 denotes the number of scale factors based on the SCFSI calculated by the scale factor selection information calculation unit 203. And a bit allocation table selecting unit for selecting an optimal bit allocation table from the bit allocation table unit 204 according to the number of the bit allocation tables, and a bit allocation table selecting unit 206 based on the scale factor calculated by the scaling unit 202. A bit allocation distribution unit 205 allocates the selected bit allocation table to each subband, and 207 denotes a scale factor selection calculation unit 20
3 and a quantization unit for quantizing the data processed by the sub-band analysis 201 using the scale factor shared by 3 and the bit allocation allocated by the bit allocation allocation unit 206. 208 denotes a header, bit allocation, SCFSI, scale A bit stream generation unit that generates an audio stream from the factor and the quantized data.
【0018】次に、サンプリング周波数32kHz、ビ
ットレート32kbps、LAYERIIにおいて7サブ
バンド使用の場合のビット配分テーブル部204とビッ
ト配分振り分け部206の一具体例を図10、図12を
用いて説明する。Next, a specific example of the bit allocation table unit 204 and the bit allocation distribution unit 206 when the sampling frequency is 32 kHz, the bit rate is 32 kbps, and the LAYER II uses 7 subbands will be described with reference to FIGS.
【0019】図12において、1201で7サブバンド
毎にスケールファクタの最大を算出する。1202で算
出した各々のサブバンドのスケールファクタの最大値を
比較しサブバンドに順番を付ける。1203でスケール
ファクタ選択情報部203の結果からスケールファクタ
の数を算出する。In FIG. 12, at 1201, the maximum scale factor is calculated every seven subbands. The maximum value of the scale factor of each subband calculated in 1202 is compared, and the subbands are ordered. In step 1203, the number of scale factors is calculated from the result of the scale factor selection information unit 203.
【0020】ここで、ビット配分テーブル部204に用
いるビット配分テーブル(A)(B)(C)を図10に
示す。これは、使用可能12サブバンド中7サブバンド
を使用する場合のビット配分テーブルであり、スケール
ファクタ選択情報算出部203のスケールファクタの数
によりビット配分テーブル(A)(B)(C)から選択
する。7サブバンド使用の場合にはスケールファクタの
数は7個〜21個となる。ビット配分テーブル選択部2
05では、スケールファクタの数が7個〜10個のとき
にはビット配分テーブル(C)、11個〜16個のとき
にはビット配分テーブル(B)、17個〜21個のとき
にはビット配分テーブル(A)を選択する。1204で
は、1202で順番をつけた順、つまりスケールファク
タの番号が小さいとビット配分が多くなるようにビット
配分テーブルの値を振り分ける。例えば、205でビッ
ト配分テーブル(A)を選択したとすると、スケールフ
ァクタの番号が最小のサブバンドにビット配分5を割り
当て、2番目に小さいサブバンドにビット配分4を割り
当て3番目に小さいサブバンドにビット配分4を割り当
てるというように選択したビット配分テーブルの値を順
番に割り当てていく。Here, the bit distribution tables (A), (B) and (C) used in the bit distribution table section 204 are shown in FIG. This is a bit allocation table when using 7 subbands out of 12 available subbands, and is selected from the bit allocation tables (A), (B), and (C) according to the number of scale factors of the scale factor selection information calculation unit 203. I do. When 7 sub-bands are used, the number of scale factors is 7 to 21. Bit distribution table selector 2
05, the bit allocation table (C) when the number of scale factors is 7 to 10, the bit allocation table (B) when the number of scale factors is 11 to 16, and the bit allocation table (A) when the number of scale factors is 17 to 21. select. In step 1204, the values in the bit allocation table are sorted in the order of the order in step 1202, that is, the bit allocation increases when the scale factor number is small. For example, if the bit allocation table (A) is selected in 205, the bit allocation 5 is allocated to the subband having the smallest scale factor number, the bit allocation 4 is allocated to the second smallest subband, and the third small subband is allocated. , The values of the selected bit distribution table are sequentially allocated.
【0021】次に、図4のMPEG Audio部40
9での処理の第三の実施例を図3を用いて説明する。Next, the MPEG Audio unit 40 shown in FIG.
A third embodiment of the processing in step 9 will be described with reference to FIG.
【0022】301はA/D変換部405で処理された
オーディオデータを32の帯域に分割するサブバンド分
析部、302は32サブバンドに分割されたデータの最
大振幅をスケールファクタとするスケーリング部、30
3はスケールファクタの変化量が少ないときには共通化
するスケールファクタ選択情報算出部、304はあらか
じめ使用サブバンドの数だけビット配分が収められてい
るビット配分テーブル部、305はスケーリング部30
2が算出したスケールファクタを基にしてビット配分テ
ーブル部304のビット配分を各サブバンドに振り分け
るビット配分振り分け部、306はスケーリング部30
2で算出したスケールファクタをスケールファクタ選択
算出部303で共通化したスケールファクタとビット配
分振り分け部305で振り分けられたビット配分とを用
いてサブバンド分析301で処理されたデータを量子化
する量子化部、307はヘッダ、ビット配分、SCFS
I、スケールファクタ、量子化されたデータからオーデ
ィオストリームを生成するストリーム生成部である。Reference numeral 301 denotes a sub-band analysis unit that divides the audio data processed by the A / D conversion unit 405 into 32 bands, 302 denotes a scaling unit that uses the maximum amplitude of the data divided into 32 sub-bands as a scale factor, 30
Numeral 3 denotes a scale factor selection information calculation unit for sharing when the amount of change in the scale factor is small, 304 denotes a bit allocation table unit in which bit allocations are stored in advance by the number of used subbands, and 305 denotes a scaling unit 30
2 is a bit allocation allocating unit that allocates the bit allocation of the bit allocation table unit 304 to each subband based on the scale factor calculated by
Quantization for quantizing the data processed by the sub-band analysis 301 using the scale factor shared by the scale factor selection calculation unit 303 and the bit allocation allocated by the bit allocation allocation unit 305. Unit, 307 is a header, bit allocation, SCFS
A stream generation unit that generates an audio stream from I, scale factor, and quantized data.
【0023】次に、サンプリング周波数32kHz、ビ
ットレート32kbps、LAYERIIの場合に7サブ
バンド使用の場合のビット配分テーブル部304とビッ
ト配分振り分け部305の一具体例を図11、図12を
用いて説明する。Next, a specific example of the bit allocation table section 304 and the bit allocation distribution section 305 when the sampling frequency is 32 kHz, the bit rate is 32 kbps, and the LAYER II uses 7 subbands will be described with reference to FIGS. I do.
【0024】図12において、1201で7サブバンド
毎にスケールファクタの最大を算出する。1202で算
出した各々のサブバンドのスケールファクタの最大値を
比較しサブバンドに順番を付ける。1203でスケール
ファクタ選択情報部203の結果からスケールファクタ
の数を算出する。In FIG. 12, at 1201, the maximum scale factor is calculated every seven subbands. The maximum value of the scale factor of each subband calculated in 1202 is compared, and the subbands are ordered. In step 1203, the number of scale factors is calculated from the result of the scale factor selection information unit 203.
【0025】ここで、ビット配分テーブル部304を図
11に示す。これは、使用可能12サブバンド中7サブ
バンドを使用する場合のビット配分テーブルであり、ス
ケールファクタの数が最大の21個のときに対応したテ
ーブルとなっている。この1つのテーブルを使って圧縮
処理を行う。1204では、1202で順番をつけた順
にビット配分テーブルを振り分ける。スケールファクタ
の番号が最小のサブバンドにビット配分5を割り当て、
2番目に小さいサブバンドにビット配分4を割り当て3
番目に小さいサブバンドにビット配分4を割り当てると
いうように選択したビット配分テーブルの順番に割り当
てていく。Here, the bit distribution table section 304 is shown in FIG. This is a bit allocation table when using 7 sub-bands out of 12 available sub-bands, and is a table corresponding to a maximum of 21 scale factors. Compression processing is performed using this one table. In step 1204, the bit distribution tables are sorted in the order given in step 1202. Assign bit allocation 5 to the subband with the smallest scale factor number,
Allocate bit allocation 4 to the second smallest subband 3
Bit allocation 4 is allocated to the smallest sub-band in the order of the selected bit allocation table.
【0026】[0026]
【発明の効果】本発明によれば、スケールファクタを基
にビット配分を算出することにより通常のビットレート
ではもちろんのこと低ビットレートの場合や特定の帯域
に偏った音声に対しても複雑な演算を用いることなく高
音質な圧縮処理が行える。According to the present invention, the bit allocation is calculated on the basis of the scale factor, thereby making it possible to perform complicated operations for low bit rates as well as for voices biased to a specific band as well as a normal bit rate. High-quality sound compression processing can be performed without using an operation.
【図1】本発明による画像音声圧縮装置の一実施例を示
すブロック図である。FIG. 1 is a block diagram showing an embodiment of a video and audio compression apparatus according to the present invention.
【図2】本発明による画像音声圧縮装置の一実施例を示
すブロック図である。FIG. 2 is a block diagram showing an embodiment of an image / audio compression apparatus according to the present invention.
【図3】本発明による画像音声圧縮装置の一実施例を示
すブロック図である。FIG. 3 is a block diagram showing an embodiment of a video and audio compression apparatus according to the present invention.
【図4】本発明による画像音声圧縮装置の一実施例を示
すシステムブロック図である。FIG. 4 is a system block diagram showing an embodiment of an image / audio compression apparatus according to the present invention.
【図5】従来例の音声圧縮ブロック図である。FIG. 5 is a conventional audio compression block diagram.
【図6】音声圧縮ブロック図である。FIG. 6 is an audio compression block diagram.
【図7】本発明を説明するフローチャートである。FIG. 7 is a flowchart illustrating the present invention.
【図8】公知例に記載されているスケールファクタテー
ブルである。FIG. 8 is a scale factor table described in a known example.
【図9】ビット配分算出に用いるテーブルの一具体例で
ある。FIG. 9 is a specific example of a table used for calculating bit allocation.
【図10】ビット配分テーブル部の一具体例である。FIG. 10 is a specific example of a bit distribution table unit.
【図11】ビット配分テーブル部の一具体例である。FIG. 11 is a specific example of a bit distribution table unit.
【図12】本発明を説明するフローチャートである。FIG. 12 is a flowchart illustrating the present invention.
101・・・サブバンド分析部 102・・・スケーリング部 103・・・スケールファクタ選択情報算出部 104・・・ビット配分算出部 105・・・量子化部 106・・・ビットストリーム生成部 107・・・ MPEG Audio処理部 101: Subband analysis unit 102: Scaling unit 103: Scale factor selection information calculation unit 104: Bit allocation calculation unit 105: Quantization unit 106: Bit stream generation unit 107・ MPEG Audio processing unit
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 7/24 H04N 7/13 Z (72)発明者 矢沢 富美繁 茨城県ひたちなか市稲田1410番地株式会社 日立製作所AV事業部内──────────────────────────────────────────────────の Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04N 7/24 H04N 7/13 Z (72) Inventor Tomomi Yazawa 1410 Inada, Hitachinaka-shi, Ibaraki Hitachi, Ltd. Within the Manufacturing Division
Claims (13)
一定サンプル数で処理をし32のサブバンドに分割する
サブバンド分析部、サブバンド分析部の出力の最大振幅
を正規化しスケールファクタとするスケーリング部、ス
ケールファクタの変化量が少ないときには共通化するス
ケールファクタ選択情報算出部、各サブバンドのビット
配分を算出するビット配分算出部、算出されたビット配
分とスケールファクタとを用いて前記サブバンド分析部
で処理されたデータを量子化する量子化部、ヘッダ、ビ
ット配分、SCFSI(SCALEFACTOR SELECTION IMFOR
MATION、スケールファクタ選択情報)、各サブバンドの
スケールファクタ、量子化されたデータとからオーディ
オストリームを生成するビットストリーム生成部を有す
ることを特徴とする画像音声圧縮装置。1. A sub-band analyzer for processing data sampled at a fixed interval with a fixed number of samples and dividing the data into 32 sub-bands, and a scaling unit for normalizing the maximum amplitude of the output of the sub-band analyzer to use as a scale factor. A scale factor selection information calculation unit for sharing when the change amount of the scale factor is small, a bit allocation calculation unit for calculating the bit allocation of each subband, and the subband analysis unit using the calculated bit allocation and the scale factor. Quantizer that quantizes the data processed by, header, bit allocation, SCFSI (SCALEFACTOR SELECTION IMFOR
A video / audio compression apparatus comprising: a bit stream generation unit that generates an audio stream from MATION, scale factor selection information), a scale factor of each subband, and quantized data.
前記スケーリング部により出力されたスケールファクタ
を基に算出することを特徴とする画像音声圧縮装置。2. The bit allocation calculation unit according to claim 1,
A video and audio compression apparatus, wherein the calculation is performed based on the scale factor output by the scaling unit.
記スケーリング部により出力されたスケールファクタと
サブバンドの番号に基づいて算出することを特徴とする
画像音声圧縮装置。3. The video / audio compression apparatus according to claim 1, wherein the bit allocation calculation unit calculates the bit allocation based on a scale factor and a subband number output by the scaling unit.
一定サンプル数で処理をし32のサブバンドに分割する
サブバンド分析部、サブバンド分析部の出力の最大振幅
を正規化しスケールファクタとするスケーリング部、ス
ケールファクタの変化量が少ないときには共通化するス
ケールファクタ選択情報算出部、各サブバンドの量子化
ビット数をあらかじめ複数のテーブルとしてあるビット
配分テーブル部、複数のビット配分テーブルから最適な
テーブルを選択するビット配分選択部、ビット配分選択
部により選択されたのビット配分テーブルを各サブバン
ドが最適となるようにビット配分を振り分けるビット配
分振り分け部、選択されたビット配分テーブルとスケー
ルファクタとを用いて前記サブバンド分析部で処理され
たデータを量子化する量子化部、ヘッダ、ビット配分、
SCFSI、各サブバンドのスケールファクタ、量子化
されたデータとからオーディオストリームを生成するビ
ットストリーム生成部を有することを特徴とする画像音
声圧縮装置。4. A sub-band analyzer for processing data sampled at a fixed interval with a fixed number of samples and dividing the data into 32 sub-bands, and a scaling unit for normalizing the maximum amplitude of the output of the sub-band analyzer to use as a scale factor. When the change amount of the scale factor is small, a scale factor selection information calculation unit to be shared, a bit distribution table unit in which the number of quantization bits of each subband is previously stored as a plurality of tables, and an optimal table is selected from a plurality of bit distribution tables A bit allocation selection unit, a bit allocation allocation unit that allocates a bit allocation table selected by the bit allocation selection unit so that each subband is optimized, using the selected bit allocation table and a scale factor. Quantizes the data processed by the sub-band analyzer. Quantizer, header, bit allocation,
A video and audio compression apparatus comprising: a bit stream generation unit that generates an audio stream from SCFSI, a scale factor of each subband, and quantized data.
は最大使用できるサブバンドすべてにビット配分を割り
当ててある複数のテーブルであることを特徴とする画像
音声圧縮装置。5. The video / audio compression apparatus according to claim 4, wherein the bit allocation table section is a plurality of tables in which bit allocation is allocated to all of the maximum usable subbands.
は最大使用できるサブバンドの内の数個にビット配分を
割り当ててある複数のテーブルであることを特徴とする
画像音声圧縮装置。6. The video / audio compression apparatus according to claim 4, wherein the bit allocation table section is a plurality of tables in which bit allocation is assigned to several of the maximum usable subbands.
スケールファクタの数に応じた数個のテーブルとなって
いることを特徴とする画像音声圧縮装置。7. The video and audio compression apparatus according to claim 4, wherein the bit allocation table according to claim 4 comprises several tables corresponding to the number of scale factors.
記スケールファクタ選択情報算出部により出力されたS
CFSIを基にスケールファクタの数を算出し、スケー
ルファクタの数に応じて最適なビット配分テーブルを選
択することを特徴とする画像音声圧縮装置。8. The bit allocation selection unit according to claim 4, wherein the bit allocation selection unit outputs the S output from the scale factor selection information calculation unit.
An image / audio compression apparatus characterized in that the number of scale factors is calculated based on CFSI, and an optimum bit allocation table is selected according to the number of scale factors.
一定サンプル数で処理をし32のサブバンドに分割する
サブバンド分析部、サブバンド分析部の出力の最大振幅
を正規化しスケールファクタとするスケーリング部、ス
ケールファクタの変化量が少ないときには共通化するス
ケールファクタ選択情報算出部、各サブバンドの量子化
ビット数をあらかじめテーブルとしてあるビット配分テ
ーブル部、ビット配分テーブル部のビット配分を各サブ
バンドが最適となるようにビット配分を振り分けるビッ
ト配分振り分け部、前記ビット配分振り分け部により各
サブバンドに振り分けられた選択されたビット配分とス
ケールファクタとを用いて前記サブバンド分析部で処理
されたデータを量子化する量子化部、ヘッダ、ビット配
分、SCFSI、各サブバンドのスケールファクタ、量
子化されたデータとからオーディオストリームを生成す
るビットストリーム生成部を有することを特徴とする画
像音声圧縮装置。9. A sub-band analyzer for processing data sampled at a constant interval with a fixed number of samples and dividing the data into 32 sub-bands, and a scaling unit for normalizing the maximum amplitude of the output of the sub-band analyzer and using the scale as a scale factor. When the change amount of the scale factor is small, the scale factor selection information calculation unit to be commonized, the bit allocation table unit having the quantization bit number of each sub-band as a table in advance, and the sub-band to optimize the bit allocation of the bit allocation table unit A bit allocation allocating unit for allocating a bit allocation so that the data processed by the sub-band analysis unit is quantized using the selected bit allocation and the scale factor allocated to each sub-band by the bit allocation allocating unit. Quantization section, header, bit allocation, SCFSI, An image / audio compression apparatus, comprising: a bit stream generation unit that generates an audio stream from a sub-band scale factor and quantized data.
部は最大使用できるサブバンドすべてにビット配分を割
り当ててある1つのテーブルであることを特徴とする画
像音声圧縮装置。10. The video and audio compression apparatus according to claim 9, wherein the bit allocation table section is a single table in which bit allocation is allocated to all of the maximum usable subbands.
部は最大使用できるサブバンドの内の数個にビット配分
を割り当ててある1つのテーブルであることを特徴とす
る画像音声圧縮装置。11. The video and audio compression apparatus according to claim 9, wherein the bit allocation table section is a single table in which bit allocation is allocated to several of the maximum usable subbands.
配分振り分け部は前記スケーリング部により出力された
スケールファクタを基にしてビット配分テーブルを振り
分けることを特徴とする画像音声圧縮装置。12. The video / audio compression apparatus according to claim 4, wherein the bit allocation distribution unit allocates the bit allocation table based on the scale factor output by the scaling unit.
分振り分け部は前記スケーリング部により出力されたス
ケールファクタを基にしてスケールファクタのテーブル
値が小さい(実際のスケールファクタが大きい)サブバ
ンドに多くのビットを振り分けることを特徴とする画像
音声圧縮装置。13. The sub-band according to claim 4 or 10, wherein the table value of the scale factor is small (the actual scale factor is large) based on the scale factor output from said scaling unit. A video and audio compression apparatus characterized in that a large number of bits are allocated to a video signal.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25364298A JP2000091920A (en) | 1998-09-08 | 1998-09-08 | Video and audio compression device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP25364298A JP2000091920A (en) | 1998-09-08 | 1998-09-08 | Video and audio compression device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2000091920A true JP2000091920A (en) | 2000-03-31 |
Family
ID=17254178
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP25364298A Pending JP2000091920A (en) | 1998-09-08 | 1998-09-08 | Video and audio compression device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2000091920A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005328542A (en) * | 2004-05-12 | 2005-11-24 | Samsung Electronics Co Ltd | Digital signal encoding method using a plurality of lookup tables, digital signal encoding apparatus, and a plurality of lookup table generation methods |
-
1998
- 1998-09-08 JP JP25364298A patent/JP2000091920A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005328542A (en) * | 2004-05-12 | 2005-11-24 | Samsung Electronics Co Ltd | Digital signal encoding method using a plurality of lookup tables, digital signal encoding apparatus, and a plurality of lookup table generation methods |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4742087B2 (en) | Double transform coding of audio signals | |
| KR100242864B1 (en) | Digital signal coder and the method | |
| US5983172A (en) | Method for coding/decoding, coding/decoding device, and videoconferencing apparatus using such device | |
| US5758315A (en) | Encoding/decoding method and apparatus using bit allocation as a function of scale factor | |
| JP3297240B2 (en) | Adaptive coding system | |
| WO1996035269A1 (en) | Non-linearly quantizing an information signal | |
| EP1386310A1 (en) | Device to encode, decode and broadcast audio signal with reduced size spectral information | |
| JP3379610B2 (en) | Encoding and decoding apparatus and method using channel masking characteristic for bit allocation | |
| JP4726445B2 (en) | Wide area audio signal compression apparatus and decompression apparatus, compression method and decompression method | |
| KR100750115B1 (en) | Audio signal encoding and decoding method and apparatus therefor | |
| JP4628861B2 (en) | Digital signal encoding method using a plurality of lookup tables, digital signal encoding apparatus, and a plurality of lookup table generation methods | |
| JP2003150198A (en) | Audio encoding device and audio decoding device | |
| JPH0846516A (en) | Information encoding method and apparatus, information decoding method and apparatus, and recording medium | |
| JPH08307281A (en) | Non-linear quantization method and non-linear inverse quantization method | |
| JP2000091920A (en) | Video and audio compression device | |
| JP3297238B2 (en) | Adaptive coding system and bit allocation method | |
| KR0152016B1 (en) | Coding and Decoding System Using Variable Bit Allocation | |
| JPH11195995A (en) | Video / audio compression / decompression device | |
| JP3010637B2 (en) | Quantization device and quantization method | |
| JPH07295594A (en) | Audio signal encoding method | |
| KR0121164B1 (en) | Coding/decoding method of compression and recurruence of audio | |
| EP1176743A2 (en) | Methods for non-linearly quantizing and dequantizing an information signal | |
| JP3108259B2 (en) | Band division coding device | |
| KR100195707B1 (en) | A digital audio signal converter | |
| JP2001249699A (en) | Audio compression device |