[go: up one dir, main page]

JP2000092489A - Image encoding device, image encoding method, and medium recording program - Google Patents

Image encoding device, image encoding method, and medium recording program

Info

Publication number
JP2000092489A
JP2000092489A JP25541098A JP25541098A JP2000092489A JP 2000092489 A JP2000092489 A JP 2000092489A JP 25541098 A JP25541098 A JP 25541098A JP 25541098 A JP25541098 A JP 25541098A JP 2000092489 A JP2000092489 A JP 2000092489A
Authority
JP
Japan
Prior art keywords
encoding
objects
unit
data
bit rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP25541098A
Other languages
Japanese (ja)
Inventor
Kensuke Uehara
堅助 上原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP25541098A priority Critical patent/JP2000092489A/en
Publication of JP2000092489A publication Critical patent/JP2000092489A/en
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】複数のオブジェクト動画像を符号化し多重化し
て通信回線に伝送する方式では、符号化過程で高アクテ
ィビティのオブジェクトが発生すると予めそのオブジェ
クトに配分したビット量より符号化量が多くなり、通信
回線の伝送容量も増えるため、コマ落しにて伝送容量を
減らすが、コマ落としは抑制したい。 【解決手段】各オブジェクト(obj) に対して優先度をつ
け、高アクティビティなobj が発生したとき各obj の間
でビットを移動させ、優先度の高いobj は画質を低下さ
せずまたは向上させるべくレート制御部117 で制御す
る。これにて通信回線の伝送容量増加させないようにし
てコマ落し回数の増加を抑制する。また各obj の符号化
の際に符号化率に応じたコマ落しによる時間的歪みと量
子化精度による空間的歪みとのバランスがとれ、視覚特
性上最適な動作点で符号化処理が行える。
(57) [Summary] In a method of encoding, multiplexing and transmitting a plurality of object moving images to a communication line, when an object having high activity occurs in an encoding process, encoding is performed based on a bit amount previously allocated to the object. Since the volume increases and the transmission capacity of the communication line increases, the transmission capacity is reduced by dropping frames, but it is desired to suppress dropping frames. A priority is assigned to each object (obj), and when a high activity obj occurs, bits are moved between the objs so that a high priority obj does not reduce or improve the image quality. It is controlled by the rate control unit 117. This suppresses an increase in the number of dropped frames without increasing the transmission capacity of the communication line. Further, at the time of encoding each obj, a balance between temporal distortion due to frame drop according to the encoding rate and spatial distortion due to quantization accuracy can be achieved, and encoding processing can be performed at an operating point that is optimal in visual characteristics.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は動画像を圧縮して得
た動画像データを通信回線に送出する際に、通信回線の
伝送容量対応に伝送量を制御すべく符号発生量を制御す
る技術に係わり、特に、複数のオブジェクトの間で画品
質に優先度を持たせて所望の画質を維持できるようにし
た画像符号化装置および画像符号化方法に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a technique for controlling a code generation amount to control a transmission amount corresponding to a transmission capacity of a communication line when transmitting moving image data obtained by compressing a moving image to a communication line. More particularly, the present invention relates to an image encoding apparatus and an image encoding method that can maintain a desired image quality by giving priority to image quality among a plurality of objects.

【0002】[0002]

【従来の技術】従来、テレビ電話システムの一つとして
H.261方式では、動画像についてそのフレーム毎に
データを8×8画素のブロックとし、このブロックに対
して2次元DCT変換(離散コサイン変換)するフレー
ム内符号化、前フレームと現フレームの同位置の画像ブ
ロックにおいて両者の相関が強いときにフレーム間の差
分をとり、その差分に対して8×8画素のブロックを2
次元DCT変換するフレーム間符号化、前フレームから
現フレームヘ類似した動画像ブロックが相対的に隣接移
動した場合に、これを検知してその動画像ブロックの移
動量と移動方向の情報を送るのみで動画像データそのも
のを送らずに済ませることで発生データ量を減らす動き
補償、DCT変換後の各周波数毎の係数値が低周波数領
域では値が発生するが、高周波領域では値が発生しにく
く、ゼロ値が続くことを利用したゼロ・ランレングス符
号化、データの発生量に応じてデータの量子化ステップ
幅を変更することでデータの発生量を調整する量子化、
発生頻度の高いデータ・パターンに対しては短い符号値
を、発生頻度の低いデータ・パターンに対しては長い符
号量を割り当てることで、トータル的に発生したデータ
量よりも少ないデータ量に変換する可変長符号化、等が
使用されている。
2. Description of the Related Art Conventionally, H.264 has been used as one of videophone systems. In the H.261 system, for a moving image, data is divided into 8 × 8 pixel blocks for each frame, and this block is subjected to two-dimensional DCT (discrete cosine transform) intra-frame encoding. When the correlation between the two is strong in the image block, the difference between the frames is calculated.
Inter-frame coding for dimensional DCT transformation. When a moving image block similar to the current frame moves relatively adjacently from the previous frame, this is detected and only information of the moving amount and moving direction of the moving image block is sent. Motion compensation that reduces the amount of generated data by not sending the moving image data itself. The coefficient value for each frequency after DCT conversion has a value in the low frequency region, but does not easily occur in the high frequency region. Zero run-length encoding using the value that follows, quantization that adjusts the amount of data generation by changing the quantization step width of data according to the amount of data generation,
By assigning a short code value to a frequently occurring data pattern and a long code amount to a less frequently occurring data pattern, the data pattern is converted into a smaller data amount than the total generated data amount. Variable length coding, etc. are used.

【0003】そして、可変長符号化された圧縮データは
一旦、バッファメモリに保持された後、順次読み出され
て通信回線に送出させることになるが、バッファメモリ
がオーバーフローしないようにバッファメモリのデータ
蓄積量を基に、入力動画像の変化、シーン・チェンジに
応じて適応的に、量子化ステップ幅を変え、コマ落とし
を行い、バッファメモリから出力されるビットレートを
一定にしてから、通信回線に送出される。
[0003] The compressed data that has been subjected to the variable-length coding is temporarily stored in a buffer memory and then sequentially read out and sent out to a communication line. Based on the accumulated amount, the quantization step width is adaptively changed according to changes in the input moving image and scene changes, frame skipping is performed, and the bit rate output from the buffer memory is kept constant before the communication line Sent to

【0004】このような、H.261方式の他にも、国
際標準の動画像符号化方式であるMPEG1(Moving P
icture imagecoding Experts Group 1)動画像符号化方
式あるいはMPEG2(Moving Picture imagecoding E
xperts Group 2)動画像符号化方式などがあるが、これ
らはいずれも矩形画面を対象とする符号化方式である。
[0004] Such H. In addition to the H.261 system, MPEG1 (Moving P
icture imagecoding Experts Group 1) Moving picture coding scheme or MPEG2 (Moving Picture imagecoding E)
xperts Group 2) There are moving picture coding methods and the like, and these are all coding methods for rectangular screens.

【0005】しかし近来、MPEG4(Moving Picture
imagecoding Experts Group 4)動画像符号化方式のよ
うに画面に含まれている像をオブジェクト単位で符号化
し、これら複数のオブジェクトの圧縮データを受信側に
伝送して表示する方式が普及しつつある。
However, recently, MPEG4 (Moving Picture)
imagecoding Experts Group 4) A method of encoding an image contained in a screen in units of objects, such as a moving image encoding method, and transmitting and displaying compressed data of the plurality of objects to a receiving side is becoming widespread.

【0006】例えば、図19のようにテレビカメラなど
で撮影した動画像を入力して(100)、原画像101
についてオブジェクト生成部102で領域抽出して、原
画像101からシーン毎に人物および背景などのオブジ
ェクトを切り抜く。そして、各オブジェクトは符号化さ
れてから(103a、103b)、多重化部104で多
重化されて、通信回線106に送出される。すなわち、
人物像は“オブジェクト1”(103a)、背景動画像
は“オブジェクト2”(103b)としてそれぞれ別に
符号化して多重化部104に送る。そして、“オブジェ
クト1”と“オブジェクト2”の符号化データはこの多
重化部104で多重化され、ビットストリューム105
のデータ形式で通信回線106を介して受信側の多重分
離部107に伝送される。受信側では多重化されたオブ
ジェクトは多重分離部107に送られ、この多重分離部
107で“オブジェクト1”と“オブジェクト2”の符
号化データは分離され、更に復号化部において“オブジ
ェクト1”(108a)と“オブジェクト2”(108
b)として復号化される。
For example, as shown in FIG. 19, a moving image captured by a television camera or the like is input (100), and an original image 101 is input.
Are extracted by the object generation unit 102, and objects such as a person and a background are cut out from the original image 101 for each scene. Then, each object is encoded (103a, 103b), multiplexed by the multiplexing unit 104, and transmitted to the communication line 106. That is,
The human image is separately encoded as “object 1” (103a) and the background moving image is separately encoded as “object 2” (103b) and sent to the multiplexing unit 104. Then, the coded data of “Object 1” and “Object 2” are multiplexed by the multiplexing unit 104, and the bit stream 105
Is transmitted to the demultiplexing unit 107 on the receiving side via the communication line 106 in the data format described above. On the receiving side, the multiplexed object is sent to the demultiplexing unit 107, where the coded data of "Object 1" and "Object 2" are separated, and further the "Object 1" ( 108a) and "Object 2" (108
b) is decoded.

【0007】そして、各オブジェクトは複合化されて
(108a、108b)、コンボジター部109で画面
上の各オブジェクトの配置位置などを考慮して、表示部
で再現画像110として表示される。すなわち、複合化
された“オブジェクト1”(108a)と“オブジェク
ト2”(108b)は、コンポジタ部109によって元
の指定された位置に配置されて再現画像110として表
示される。
[0007] Each object is compounded (108a, 108b), and displayed on the display unit as a reproduced image 110 in consideration of the arrangement position of each object on the screen by the convoy unit 109. That is, the composited “object 1” (108a) and “object 2” (108b) are arranged at the original designated position by the compositor unit 109 and displayed as the reproduced image 110.

【0008】この方式の場合、原画像101からオブジ
ェクト単位に動画像を切り出すと、必要とするオブジェ
クトのみ受信側に送ることができる。例えば、“オブジ
ェクト1”のように重要な人物像のみ送り、“オブジェ
クト2”のように必ずしも重要でない背景動画像の伝送
を停止し、受信側で別な背景動画像に“オブジェクト
1”を重ね合わせて表示することができる。背景動画像
を送らないことにより、トータル的な伝送容量が少なく
て済む利点がある。
In the case of this method, when a moving image is cut out from the original image 101 in units of objects, only necessary objects can be sent to the receiving side. For example, only an important person image such as “Object 1” is transmitted, transmission of an unimportant background moving image such as “Object 2” is stopped, and “Object 1” is superimposed on another background moving image on the receiving side. They can be displayed together. By not sending the background moving image, there is an advantage that the total transmission capacity can be reduced.

【0009】また、背景動画像を人物動画像より解像度
を下げて送ることにより、伝送容量を低減させることも
できる。
Further, the transmission capacity can be reduced by transmitting the background moving image at a lower resolution than the person moving image.

【0010】図20は、図19で説明した方式をハード
ウエアとして実現するための機器構成を示した構成図で
ある。図20において、112は形状抽出部、114
a,114b,〜114nは符号化部、117a,〜1
17nはレート制御部、119a,〜119nはバッフ
ァメモリ、121は多重化部である。
FIG. 20 is a configuration diagram showing a device configuration for realizing the method described in FIG. 19 as hardware. In FIG. 20, reference numeral 112 denotes a shape extraction unit;
a, 114b, to 114n are encoding units, 117a, to 1
17n is a rate control unit, 119a to 119n are buffer memories, and 121 is a multiplexing unit.

【0011】この構成において、テレビカメラなどの撮
像装置で撮影した入力動画像111は形状抽出部112
と複数の符号化部114a,114b,〜114nとに
それぞれ入力される。そして、入力動画像111が形状
抽出部112に入力されることにより、必要となる複数
のオブジェクトの各形状情報113a,113b,〜1
13nがこの形状抽出部112によって生成される。そ
して、これらの形状情報113a,113b,〜113
nは符号化部114a,114b,〜114nのうち、
それぞれ所定の符号化部114a,114b,〜114
nに送られて符号化される。符号化部は114a,11
4b,〜114nと複数あるが、これは同時並行して符
号化処理できるようにするためであり、各オブジェクト
毎に専用で符号化するためである。
In this configuration, an input moving image 111 captured by an imaging device such as a television camera is
And a plurality of encoding units 114a, 114b, to 114n. Then, when the input moving image 111 is input to the shape extracting unit 112, the necessary shape information 113a, 113b,.
13n is generated by the shape extraction unit 112. Then, these pieces of shape information 113a, 113b, to 113
n is one of the encoding units 114a, 114b, to 114n.
Each of the predetermined coding units 114a, 114b, to 114
n and encoded. The encoding units are 114a and 11
Although there are a plurality of 4b and -114n, this is to enable simultaneous and parallel encoding processing, and to encode exclusively for each object.

【0012】そして、各オブジェクトは符号化部114
a〜114nで並列に、形状情報113を使用して、入
力動画像111からそれぞれの形状情報に対応する動画
像部分を領域抽出してから符号化(符号化情報123)
する。
Each object is encoded by the encoding unit 114.
a to 114n in parallel, using the shape information 113, extracting a region of a moving image portion corresponding to each shape information from the input moving image 111, and then encoding (encoding information 123)
I do.

【0013】このようにして符号化部114a,114
b,〜114nにて得られた符号化情報123はそれぞ
れ符号化部114a,114b,〜114nに対応する
バッファメモリ119a,119b,〜119nに与え
られる。
In this manner, the encoding units 114a and 114
The encoded information 123 obtained by b, .about.114n is provided to buffer memories 119a, 119b,... 119n corresponding to the encoding units 114a, 114b,.

【0014】バッファメモリ119a,119b,〜1
19nは、上述したように、出力120を一定の伝送レ
ートに平滑化する目的の一時保持用のメモリである。
The buffer memories 119a, 119b,.
19n is a temporary holding memory for smoothing the output 120 to a constant transmission rate, as described above.

【0015】この構成においては、バッファメモリ11
9a,119b,〜119nのデータ蓄積量の情報をそ
れぞれのバッファメモリ119a,119b,〜119
nに対応するレート制御部117a,117b,〜11
7nに与えている。
In this configuration, the buffer memory 11
9a, 119b,... 119n are stored in the respective buffer memories 119a, 119b,.
n corresponding to the rate control units 117a, 117b,.
7n.

【0016】そして、各レート制御部117a,117
b,〜117nは自己の受け取った前記データ蓄積量の
情報から自己の対応するバッファメモリ119a,11
9b,〜119nの出力120a,〜120nを一定レ
ートにするために、符号化部114a〜114nにフィ
ードバックして(115a,〜115n)、符号化部1
14a〜114nの量子化ステップを変化させることで
バッファメモリ119a,119b,〜119nに入力
されるフレームデータのデータ量を制御している。
Then, each of the rate control units 117a, 117
b, .about.117n are based on the information of the data storage amount received by the corresponding buffer memories 119a, 119
In order to make the outputs 120a and 120n of 9b and 119n constant, they are fed back to the encoding units 114a to 114n (115a and 115n), and the encoding unit 1
The amount of frame data input to the buffer memories 119a, 119b, and 119n is controlled by changing the quantization steps of 14a to 114n.

【0017】そして、場合によってはバッファメモリ1
19a,119b,〜119nに送られて一時的に保持
されるフレームデータを、フレームスキップ(コマ落と
し)することにより、全体としてバッファメモリ119
a,119b,〜119nの読み出し出力120a〜1
20nの伝送レートを一定にしている。
In some cases, the buffer memory 1
19a, 119b,..., And 119n, the frame data temporarily stored is subjected to frame skipping (dropping of frames), so that the buffer memory 119 as a whole is skipped.
a, 119b, to 119n read output 120a to 1
The transmission rate of 20n is fixed.

【0018】各バッファメモリ119a,119b,〜
119nの読み出し出力120a〜120nは多重化部
121で多重化されて多重化出力123となり、通信回
線に送出される。各オブジェクトに対応した符号化デー
タの伝送レートが一定ならば、多重化出力123も一定
の伝送レートに制限される。そして、多重化出力123
は通信回線の伝送レートに相当している。
Each of the buffer memories 119a, 119b,.
The read outputs 120a to 120n of 119n are multiplexed by the multiplexing unit 121 to become multiplexed outputs 123, which are sent out to the communication line. If the transmission rate of the encoded data corresponding to each object is constant, the multiplex output 123 is also limited to a constant transmission rate. And the multiplexed output 123
Corresponds to the transmission rate of the communication line.

【0019】また、各バッファメモリ119a,119
b,〜119nの読み出し出力120a〜120nの伝
送レートの割り当ては、対応するオブジェクトをどの程
度圧縮するか、あるいはどの程度コマ落としを許容する
かにかかっている。
Each of the buffer memories 119a, 119
The assignment of the transmission rates of the read outputs 120a to 120n of b, to 119n depends on how much the corresponding object is compressed or how much frame dropping is allowed.

【0020】すなわち、ユーザが各オブジェクトの重要
性、または、優先度をどのように配分するかにかかって
いる。
That is, it depends on how the user allocates importance or priority of each object.

【0021】例えば、あるオブジェクトは動きを忠実に
再現したければ、そのオブジェクト全体について多少圧
縮率を高くし、できるだけコマ落としを避けるようにレ
ート制御部117a,117b,〜117nでレート制
御を行う必要がある。
For example, if it is desired to faithfully reproduce the motion of a certain object, it is necessary to slightly increase the compression ratio for the entire object and perform rate control by the rate control units 117a, 117b, to 117n so as to avoid dropping frames as much as possible. There is.

【0022】反対に、オブジェクトの精細度を重視する
ならば、そのオブジェクトの全体の圧縮率を下げ、ある
程度のコマ落としを許容するようにレート制御部119
でレート制御を行う必要がある。
Conversely, if importance is placed on the definition of the object, the rate control section 119 reduces the overall compression ratio of the object and allows a certain amount of frame dropping.
Need to perform rate control.

【0023】[0023]

【発明が解決しようとする課題】一般に、高品質の動画
像データを伝送するためには、画像データを圧縮する際
に、符号化データが増えたならば、量子化する際にもデ
ータ量を増加させるようにした方が、より自然な動画像
が再現できるようになる。
Generally, in order to transmit high-quality moving image data, if the amount of coded data increases when compressing image data, the amount of data is also reduced when quantizing. When the number is increased, a more natural moving image can be reproduced.

【0024】しかし、符号化データが増加すれば、遅延
なくデータを受信側に伝送するために伝送レートを増加
させなければならず、ATM通信のように通信容量に余
裕のある高速な可変レートの通信が必要になってくる。
However, if the encoded data increases, the transmission rate must be increased in order to transmit the data to the receiving side without delay, and a high-speed variable rate having a sufficient communication capacity such as ATM communication is required. Communication becomes necessary.

【0025】しかし、低速回線を対象としたH.261
などの動画像符号化方式は、符号化データを固定レート
の通信回線を介して伝送することが一般的である。そし
て、低伝送レートの通信回線に動画像データを伝送する
ため、動画像が細かいパターンを含む高アクティビティ
状態のときは符号化データが多くなることから、空間的
な解像度を犠牲にして、量子化の際に符号化データの増
加を抑え、あるいはコマ落しにより時間的な歪みを許容
することで、符号化データの増加も抑えるようにし、こ
れによって一定レートの通信回線で伝送している。
However, H.264 for low-speed lines 261
In such a moving image encoding method, it is general that encoded data is transmitted via a fixed-rate communication line. Since video data is transmitted over a communication line with a low transmission rate, the amount of encoded data increases when the video is in a high activity state including fine patterns, so quantization is sacrificed at the expense of spatial resolution. In this case, the increase of the encoded data is suppressed, or the temporal distortion is allowed by dropping frames, so that the increase of the encoded data is also suppressed, whereby the data is transmitted through a communication line having a constant rate.

【0026】ここで、図19のようなMPEG4による
オブジェクト単位の動画像符号化方式でも、通信回線が
固定レートの場合、各々のオブジェクトに割り当てられ
る伝送レート、すなわち、ビット速度も固定にして配分
し、各オブジェクトの伝送レートを加算し、全体として
の伝送レートを一定に抑えることが一般的である。ま
た、各オブジェクトに対して面積に対する配分レートの
比率に優先度を持たせることで、優先度の高いオブジェ
クトは符号量をより多く割り当てることができるように
し、優先度の低いオブジェクトより精細に表示すること
が可能となる。
Here, even in the moving picture coding method for each object by MPEG4 as shown in FIG. 19, when the communication line has a fixed rate, the transmission rate assigned to each object, that is, the bit rate is also fixed and distributed. In general, the transmission rate of each object is added to keep the overall transmission rate constant. In addition, by giving a priority to the ratio of the distribution rate to the area for each object, a high-priority object can be allocated a larger amount of code, and is displayed more precisely than a low-priority object. It becomes possible.

【0027】例えば、図19で人物像としての“オブジ
ェクト1”に対しては背景の“オブジェクト2”より面
積に対するビット配分を多くして、人物像を背景より、
精細に表示することが可能となる。
For example, in FIG. 19, for "object 1" as a person image, the bit allocation to the area is larger than that for "object 2" in the background, so that the person image is
It is possible to display finely.

【0028】ここで、図19による各オブジェクトのレ
ート制御は図20のブロック構成図で示した方法で行う
ことができる。テレビカメラ等から入力された入力動画
像111から形状抽出部112で人物像および背景など
必要とするオブジェクトについて領域抽出して形状情報
113a〜113nを算出する。各オブジェクトに対応
した符号化部114a〜114nで、前記形状情報11
3a〜113nを使用して、原画像111から対応した
オブジェクトの動画像領域を切り出し、前記領域におけ
るテキスチャ、動き補償フレーム予測および形状情報に
ついて符号化する。
The rate control of each object shown in FIG. 19 can be performed by the method shown in the block diagram of FIG. A shape extraction unit 112 extracts a region of a necessary object such as a human image and a background from an input moving image 111 input from a television camera or the like, and calculates shape information 113a to 113n. The encoding units 114a to 114n corresponding to each object generate the shape information 11
Using 3a to 113n, a moving image region of the corresponding object is cut out from the original image 111, and the texture, motion compensation frame prediction, and shape information in the region are encoded.

【0029】各符号化データ116a〜116nはバッ
ファメモリ119a〜119nに印加される。レート制
御部117a〜117nは符号化部114a〜114n
の量子化精度を制御することで、バッファメモリ119
aに入力された符号化データ116a〜116nビット
量を変えて出力データ120a〜120nが予め各オブ
ジェクトに割り当てられたレートになるように制御す
る。
Each of the encoded data 116a to 116n is applied to buffer memories 119a to 119n. The rate control units 117a to 117n are encoding units 114a to 114n.
Of the buffer memory 119 by controlling the quantization precision of
By changing the bit amount of the encoded data 116a to 116n input to “a”, the output data 120a to 120n is controlled so as to have a rate previously assigned to each object.

【0030】また、レート制御部117a〜117nは
必要ならばフレーム単位でコマ落しを行うことで、バッ
ファメモリ119a〜119nの出力120a〜120
nのレートを一定になるように制御する。そして、バッ
ファメモリ119a〜119nの出力120a〜120
nは多重化部121で多重化され、ビットストリューム
としての出力123に変換されて通信回線に送出され
る。
The rate control units 117a to 117n perform frame dropping on a frame basis if necessary, so that the outputs 120a to 120n of the buffer memories 119a to 119n are output.
The rate of n is controlled to be constant. The outputs 120a-120 of the buffer memories 119a-119n
n is multiplexed by the multiplexing unit 121, converted into an output 123 as a bit stream, and transmitted to the communication line.

【0031】図19でレート制御部117a〜117n
は各オブジェクトに割り当てられたレートについて、バ
ッファメモリ119a〜119nの出力120a〜12
0nのレートを、予め決められたレートに抑えるように
することで、全体としてのレート、すなわち、多重化部
121の出力123を通信回線の伝送レートに適合させ
ている。
In FIG. 19, the rate control units 117a to 117n
Are the outputs 120a-12 of the buffer memories 119a-119n for the rate assigned to each object.
By suppressing the rate of 0n to a predetermined rate, the overall rate, that is, the output 123 of the multiplexing unit 121 is adapted to the transmission rate of the communication line.

【0032】ここで、従来からのH.261方式のよう
な矩形画面での表示の場合、画面全体で低アクティビテ
ィの部分から高アクティビティの部分にビット配分を移
動させることで、全体として一定レートに抑えていると
云える。
Here, the conventional H.264 standard is used. In the case of a display on a rectangular screen as in the H.261 system, it can be said that the bit rate is moved from a low activity portion to a high activity portion on the entire screen, so that the overall rate is suppressed to a constant rate.

【0033】すなわち、動きの大きい部分など高アクテ
ィビティの部分と、動きの少ない低アクティビティ部分
を自動的に抽出してビットをバランス良く配分すること
で、全体として低レートで高画質な表示を実現している
とも云える。
That is, by automatically extracting a high activity portion such as a portion having a large motion and a low activity portion having a small motion and allocating bits in a well-balanced manner, a high-quality display at a low rate as a whole is realized. It can be said that.

【0034】ところが、図19のようにオブジェクトと
して動画像を分割した場合に、そのオブジェクトの形状
内で前記ビット配分を行わなければならない。優先度の
高いオブジェクトにはビット配分を多くしても、そのオ
ブジェクトが高アクティビティ状態になった場合、自身
のオブジェクト内で処理できなくなり、量子化精度を落
としたり、コマ落しをしたりして対処しなければならな
くなり、画質の低下につながる。
However, when a moving image is divided as an object as shown in FIG. 19, the bit distribution must be performed within the shape of the object. Even if the bit allocation is increased for an object with a high priority, if the object enters a high activity state, it cannot be processed in its own object, and the quantization accuracy is reduced or frames are dropped. Must be performed, leading to a decrease in image quality.

【0035】そして、特にこの場合、面積の小さなオブ
ジェクトにあっては、ビット配分のための余裕度が小さ
くなり、高アクティビティ状態になると直ぐに画品質が
低下することになる。
In this case, in particular, in the case of an object having a small area, the margin for bit allocation is reduced, and the image quality is immediately reduced when the high activity state is reached.

【0036】そこで、優先度の高いオブジェクトは最初
から十分に余裕を持ってビットを多く配分しておくこと
になる。しかし、このようにすると、今度は低アクティ
ビティ状態では配分ビット数の余裕があり過ぎ、必要以
上に高画質な動画像を生成することになる。
Therefore, an object with a high priority has to allocate a large number of bits with a sufficient margin from the beginning. However, in this case, in the low activity state, there is too much room for the number of allocated bits, and a moving image with a higher image quality than necessary is generated.

【0037】一方、背景などのオブジェクトは面積が広
いため、量子化精度を落したとしても全体としての配分
ビット数は多くなる。しかし、終始低アクティビティの
ために全体としてもオブジェクト内での配分ビット数の
移動は少なく、配分ビット数の変動に対する余裕があり
過ぎるとも云える。
On the other hand, since objects such as backgrounds have a large area, the number of allocated bits as a whole increases even if quantization accuracy is reduced. However, the movement of the number of allocated bits in the object as a whole is small due to the low activity throughout, and it can be said that there is too much room for the fluctuation of the number of allocated bits.

【0038】それ故、各オブジェクトに如何にして最適
配分できるようにするか、その合理的な技術手法の開発
が急がれる。
Therefore, it is urgently necessary to develop a rational technical method for how to optimally allocate the objects.

【0039】従って、本発明の目的とするところは、複
数オブジェクトの動画像を符号化した画像データを多重
化して通信回線に送出するシステムにおいて、符号化に
あたって、優先度の高いオブジェクトについては画質を
保証できるようにすると共に、視覚特性上、最適な動作
点で符号化処理が行うことができるようにして、各オブ
ジェクトについてバランスのとれた表示を可能とする画
像符号化装置および画像符号化方法を提供することにあ
る。
Accordingly, an object of the present invention is to provide a system for multiplexing image data obtained by encoding moving images of a plurality of objects and transmitting the multiplexed image data to a communication line. An image encoding apparatus and an image encoding method capable of performing an assurance and performing an encoding process at an optimal operating point in terms of visual characteristics, thereby enabling a balanced display for each object. To provide.

【0040】[0040]

【課題を解決するための手段】上記目的を達成するた
め、本発明は次のようにする。すなわち、MPEG4の
如き画面が複数のオブジェクトで構成される動画像を、
オブジェクト単位で符号化し、これら複数のオブジェク
トの各符号化データを多重化して通信回線に送出する符
号化装置において、オブジェクトを符号化する手段であ
って、対象とするオブジェクトについて与えられた画品
質の優先度対応に前記多重化を行うためのビットレート
の配分値とが設定され、配分されたビットレートに見合
う発生符号量で前記対象のオブジェクトを符号化する符
号化手段と、前記オブジェクトを符号化する過程で高ア
クティビティなオブジェクトが発生した場合、前記優先
度の高いオブジェクトの画品質を落さず、または向上さ
せるように前記オブジェクトの間で前記ビットレートを
再配分させるべく、符号化手段のビットレート配分を設
定制御する制御手段とを具備する。
To achieve the above object, the present invention is as follows. That is, a moving image in which a screen such as MPEG4 is composed of a plurality of objects,
In an encoding device that encodes each object and multiplexes each of the encoded data of the plurality of objects and sends the multiplexed data to a communication line, the encoding device encodes the objects. A bit rate distribution value for performing the multiplexing corresponding to the priority is set, and coding means for coding the target object with a generated code amount corresponding to the allocated bit rate; and coding the object. When an object having high activity occurs in the process of performing, the bit rate of the encoding means is set so as to redistribute the bit rate among the objects so that the image quality of the high-priority object is not reduced or improved. Control means for setting and controlling the rate distribution.

【0041】また、前記制御手段には、前記各オブジェ
クトをフレーム毎に符号化する際に、符号化率に応じた
コマ落しによる時間歪みと量子化精度による空間的な歪
みとのバランスがとれた視覚特性上最適な動作点を確保
すべく、ビットレート配分を設定制御する機能を更に具
備する。
Further, when encoding the objects for each frame, the control means balances the time distortion due to frame drop according to the encoding rate and the spatial distortion due to quantization accuracy. It further has a function of setting and controlling the bit rate distribution so as to secure an optimum operating point in terms of visual characteristics.

【0042】また、前記制御手段には、前記オブジェク
トの間で前記ビットレートを移動させる過程で、前記通
信回線に送出する符号化データ全体で時間的歪みが少な
くなるよう、前記ビットレートの配分を設定制御する機
能を更に具備する。
Further, in the control means, in the process of moving the bit rate between the objects, the distribution of the bit rate is reduced so that temporal distortion is reduced in the entire coded data transmitted to the communication line. A function for setting and controlling is further provided.

【0043】このような構成の本システムは、画面が複
数のオブジェクトで構成される動画像を、オブジェクト
単位で符号化し、これら複数のオブジェクトの各符号化
データを多重化して通信回線に送出するが、符号化にあ
たっては、オブジェクトを符号化すると共に、対象とす
るオブジェクトについて、そのオブジェクトの画品質の
優先度対応に前記多重化を行うための与えられたビット
レートの配分値相当となる発生符号量で前記対象のオブ
ジェクトを符号化する。但し、前記オブジェクトを符号
化する過程で高アクティビティなオブジェクトが発生し
た場合、前記優先度の高いオブジェクトの画品質を落さ
ず、または向上させるように前記オブジェクトの間で前
記ビットレートを再配分させるべく、符号化ステップの
ビットレート配分を設定制御する。
In this system having such a configuration, a moving image whose screen is composed of a plurality of objects is encoded in units of objects, and each encoded data of the plurality of objects is multiplexed and transmitted to a communication line. In encoding, the amount of generated code is equivalent to the given bit rate distribution value for performing the multiplexing for encoding the object and performing the multiplexing with respect to the priority of the image quality of the object. Encodes the target object. However, if an object having high activity occurs in the process of encoding the object, the bit rate is redistributed among the objects so that the image quality of the high priority object is not reduced or improved. For this purpose, the bit rate distribution of the encoding step is set and controlled.

【0044】すなわち、伝送にあたってはオブジェクト
を符号化して得たデータをバッファメモリに送り、この
バッファメモリから伝送路の許容伝送レートに従ってデ
ータを順次読み出して伝送路に送るが、画面を構成する
複数のオブジェクトについて全体として1つのバッファ
メモリでレート制御を行うことで、伝送路である通信回
線に対して一定の伝送レートに適合するように制御す
る。その際、初期状態として各オブジェクトに対して優
先度と配分ビットを決め、各オブジェクトは量子化精度
による空間的歪みとコマ落しによる時間的歪みとのバラ
ンスがとれた視覚特性上最適な動作点になるように符号
化処理を行う。そして、動画像符号化の過程で優先度が
高いオブジェクトが高アクティビティ状態になったと
き、全体として通信回線の伝送レートを遵守しながら優
先度の低いオブジェクトから配分ビットを移動させるよ
うにレート制御を行う。また、優先度の低いオブジェク
トが高アクティビティ状態になったとき該当オブジェク
トのレートを下げることで、多重化した場合に、全体と
してコマ落しを少なくする。
That is, upon transmission, data obtained by encoding an object is sent to a buffer memory, and data is sequentially read out from the buffer memory according to an allowable transmission rate of the transmission line and sent to the transmission line. By performing rate control on the object as a whole with a single buffer memory, control is performed so as to conform to a constant transmission rate for a communication line as a transmission path. At that time, the priority and allocation bits are determined for each object as an initial state, and each object is set to the optimal operating point in terms of visual characteristics that balances spatial distortion due to quantization accuracy and temporal distortion due to frame dropping. The encoding process is performed so that Then, when an object with a high priority enters a high activity state in the process of moving image encoding, rate control is performed so as to move the allocation bits from the object with a low priority while observing the transmission rate of the communication line as a whole. Do. Also, when an object with a low priority enters the high activity state, the rate of the object is reduced, so that when frames are multiplexed, dropped frames are reduced as a whole.

【0045】また、複数のオブジェクトについて符号化
の際には、オブジェクト毎に画品質を考慮しながらビッ
卜配分をして、多重化処理を行う。これにより、オブジ
ェクト全体の表示で優先度の高いオブジェクトほど高品
質の動画像表示が実現できるようになり、多重化処理の
際にオブジェクト全体としてのコマ落しの回数も減らす
こともできて、全体としてバランスのとれた符号化処理
を行うことが可能となる。
When encoding a plurality of objects, multiplexing processing is performed by allocating bits while taking into account image quality for each object. As a result, the higher the priority of the object in the display of the entire object, the higher the quality of the moving image can be displayed, and the number of dropped frames of the entire object during the multiplexing process can be reduced. A balanced encoding process can be performed.

【0046】[0046]

【発明の実施の形態】以下、本発明の実施形態につい
て、図面を参照して説明する。本発明は、複数オブジェ
クトの動画像を符号化した画像データを多重化して通信
回線に送出するシステムにおいて、オブジェクトの符号
化の際に優先度をつけ、符号化の際に全体としてコマ落
しが多くなると推定されたとき、オブジェクト間で配分
ビットを移動させ、優先度の高いオブジェクトの画品質
を維持、且つ、向上させるようにし、そして、各オブジ
ェクトの符号化処理の過程で、符号化率に応じたコマ落
しによる時間的歪みと量子化精度による空間的歪みとの
バランスがとれて、しかも、視覚特性上、最適な動作点
で符号化処理が行われるように制御することで、各オブ
ジェクトについてバランスのとれた再生画像が再生側で
表示が可能となるようにするものであり、以下、詳細を
説明する。
Embodiments of the present invention will be described below with reference to the drawings. The present invention provides a system for multiplexing image data obtained by encoding moving images of a plurality of objects and transmitting the multiplexed image data to a communication line, wherein priorities are assigned when encoding objects, and a large number of dropped frames occur when encoding. When it is estimated that the object will be allocated, the allocation bits are moved between the objects to maintain and improve the image quality of the high-priority object, and in the course of the encoding process of each object, according to the encoding rate. The balance between temporal distortion due to dropped frames and spatial distortion due to quantization accuracy is achieved, and the control is performed so that the encoding process is performed at the optimal operating point in terms of visual characteristics. This makes it possible to display the reproduced image on the reproducing side, and the details will be described below.

【0047】<第1の実施形態>ここでは、基本である
矩形画面での符号化制御のための符号化装置の例を説明
する。図1は本発明にかかる符号化装置の構成例を示す
ブロック図であり、また、図2は当該符号化装置におけ
るバッファメモリでの滞留量の時間的変化を示した図で
ある。
<First Embodiment> Here, an example of an encoding apparatus for encoding control on a basic rectangular screen will be described. FIG. 1 is a block diagram illustrating a configuration example of an encoding device according to the present invention, and FIG. 2 is a diagram illustrating a temporal change of a staying amount in a buffer memory in the encoding device.

【0048】図1の符号化装置は、H.261などを実
現する符号化器であって、符号化部128と、この符号
化部128を制御する符号化制御部124とから構成さ
れている。これらのうち、符号化部128は、動き補償
フレーム間予測部129と、DCT変換部130と、量
子化部133と、第1の可変長符号化部135と、第2
の可変長符号化部131と、多重化部137とを含む。
The encoding apparatus shown in FIG. 261 and the like, and includes an encoding unit 128 and an encoding control unit 124 that controls the encoding unit 128. Among these, the encoding unit 128 includes a motion compensation inter-frame prediction unit 129, a DCT transform unit 130, a quantization unit 133, a first variable length encoding unit 135, and a second
And a multiplexing unit 137.

【0049】符号化部128の構成要素である動き補償
フレーム間予測部129は、16×16画素(マクロブ
ロック)の範囲で動き補償が可能であって、フレーム間
の誤差を算出するものであり、符号化部128の構成要
素であるDCT変換部130は、その予測誤差信号を8
×8のブロック単位でDCT変換(離散コサイン変換;
(直交変換))して空間座標データを周波数座標データ
に変換するものである。
The motion-compensated inter-frame prediction unit 129, which is a component of the encoding unit 128, can perform motion compensation within a range of 16 × 16 pixels (macroblock) and calculates an error between frames. , A DCT transform unit 130, which is a component of the encoding unit 128,
DCT transform (discrete cosine transform;
(Orthogonal transformation)) to convert the spatial coordinate data into frequency coordinate data.

【0050】また、符号化部128の構成要素である量
子化部133は、DCT変換部130によってDCT変
換された変換係数を直線量子化(線形量子化)するもの
であり、符号化部128の構成要素である第1の可変長
符号化部135は、量子化部133によって量子化され
た変換係数をハフマン符号化するものである。
The quantization unit 133, which is a component of the encoding unit 128, performs linear quantization (linear quantization) on the transform coefficients DCT-transformed by the DCT transform unit 130. The first variable length coding unit 135, which is a component, performs Huffman coding on the transform coefficient quantized by the quantization unit 133.

【0051】また、符号化部128の構成要素である第
2の可変長符号化部131は、動き補償フレーム間予測
部129が動き補償に用いた動きベクトルをハフマン符
号化するものであり、符号化部128の構成要素である
多重化部137は、第1の可変長符号化部135で符号
化された主情報と第2の可変長符号化部131で符号化
されたサイド情報とを多重化して伝送フレームを構成す
るものである。また、符号化部128の構成要素である
バッファメモリ139は、多重化部137により多重化
された圧縮データを一旦、保持し、その後、順次読み出
して通信回線に送出させるためのものであって、バッフ
ァメモリ139のデータ蓄積量の情報を符号化制御部1
24に与える構成となっている。
The second variable length coding unit 131, which is a component of the coding unit 128, performs Huffman coding on the motion vector used for motion compensation by the motion compensation inter-frame prediction unit 129. A multiplexing unit 137 that is a component of the encoding unit 128 multiplexes the main information encoded by the first variable length encoding unit 135 and the side information encoded by the second variable length encoding unit 131. To form a transmission frame. A buffer memory 139, which is a component of the encoding unit 128, temporarily stores the compressed data multiplexed by the multiplexing unit 137, and then sequentially reads out the compressed data and sends it out to a communication line. The information on the amount of data stored in the buffer memory 139 is stored in the encoding control unit 1
24.

【0052】また、符号化部128の構成要素であるロ
ーカル復号化部134は、DCT変換部130の出力を
逆DCT変換することにより復号して符号化制御部12
4に与えるものである。
The local decoding unit 134, which is a component of the encoding unit 128, decodes the output of the DCT transform unit 130 by performing an inverse DCT transform to decode the output.
4

【0053】符号化制御部124は、このような構成の
符号化部128を制御するためのものであって、バッフ
ァメモリ139のデータ蓄積量の情報と、ローカル復号
化部134の出力する前記DCT変換部130の出力を
復号した出力とを入力とし、バッファメモリ139がオ
ーバーフローしないようにバッファメモリ139のデー
タ蓄積量の情報を基に、入力動画像の変化、シーン・チ
ェンジに応じて適応的に、量子化部133での量子化ス
テップ幅を変えたり、コマ落としをしたり、バッファメ
モリ139から出力されるビットレートが一定になるよ
うに制御しながら、バッファメモリ139の蓄積データ
を通信回線に送出するように制御するものである。
The encoding control unit 124 is for controlling the encoding unit 128 having such a configuration, and includes information on the amount of data stored in the buffer memory 139 and the DCT output from the local decoding unit 134. An output obtained by decoding the output of the conversion unit 130 is used as an input, and based on information on the amount of data stored in the buffer memory 139 so that the buffer memory 139 does not overflow, adaptively in response to a change in an input moving image or a scene change. The data stored in the buffer memory 139 is transmitted to the communication line while changing the quantization step width in the quantization unit 133, dropping frames, and controlling the bit rate output from the buffer memory 139 to be constant. It is controlled so as to be transmitted.

【0054】このような構成において、テレビカメラな
どの撮像装置で撮影した入力動画像データ127を本シ
ステムに入力すると、この入力動画像データ127は、
符号化部128における動き補償フレーム間予測部12
9に与えられる。
In such a configuration, when input moving image data 127 captured by an imaging device such as a television camera is input to the present system, the input moving image data 127
Motion compensation inter-frame prediction unit 12 in encoding unit 128
9 given.

【0055】動き補償フレーム間予測部129ではこの
入力動画像データ127と前入力動画像データとの間
で、フレーム間の誤差を算出し、予測誤差信号を求め
る。DCT変換部130は、この動き補償フレーム間予
測部129からの予測誤差信号を8×8のブロック単位
でDCT変換して空間座標データを周波数座標データに
変換し、量子化部133は、このDCT変換した変換係
数を直線量子化して第1の可変長符号化部135に与え
る。
The motion compensation inter-frame prediction section 129 calculates an error between frames between the input moving image data 127 and the previous input moving image data to obtain a prediction error signal. The DCT transform unit 130 performs DCT transform on the prediction error signal from the motion compensation inter-frame predictive unit 129 in units of 8 × 8 blocks to transform spatial coordinate data into frequency coordinate data. The converted transform coefficients are linearly quantized and provided to the first variable length coding unit 135.

【0056】すると、第1の可変長符号化部135はこ
の量子化した変換係数をハフマン符号化して多重化部1
37に与える。
Then, the first variable-length coding unit 135 performs Huffman coding on the quantized transform coefficients, and
Give 37.

【0057】一方、動き補償フレーム間予測部129か
らの予測誤差信号は第2の可変長符号化部131にも与
えられ、第2の可変長符号化部131はこの予測誤差信
号から動き補償に用いる動きベクトルを得てこれをハフ
マン符号化し、多重化部137に与える。
On the other hand, the prediction error signal from the motion compensation inter-frame prediction unit 129 is also supplied to the second variable length coding unit 131, and the second variable length coding unit 131 converts the prediction error signal into motion compensation. A motion vector to be used is obtained, Huffman-encoded, and provided to the multiplexing unit 137.

【0058】多重化部137は、第1の可変長符号化部
135で符号化された主情報と第2の可変長符号化部1
31で符号化されたサイド情報とを多重化してバッファ
メモリ139に与える。このようにして、多重化部13
7の出力は、バッファメモリ139を介して伝送路14
0に送出される。
The multiplexing section 137 includes the main information coded by the first variable length coding section 135 and the second variable length coding section 1.
31 is multiplexed with the side information coded at 31 and supplied to the buffer memory 139. Thus, the multiplexing unit 13
7 is transmitted to the transmission line 14 via the buffer memory 139.
Sent to 0.

【0059】一方、DCT変換部130の出力はローカ
ル復号化部134にも与えられ、ここで逆DCT変換す
ることにより復号される。そして、これは符号化制御部
124に与えられる。そして、符号化制御部124はロ
ーカル復号化部134からの復号された情報とバッファ
メモリ139からのデータ蓄積量をもとに、量子化での
量子化幅を調整したり、画像のコマ落としをする等の制
御を符号化部128に対して実施することで、バッファ
メモリ139が溢れないように符号量を制御しつつ、所
定のレートで符号化データが伝送路140に送出される
ようにする。
On the other hand, the output of DCT transform section 130 is also supplied to local decoding section 134, where it is decoded by inverse DCT transform. Then, this is given to the encoding control unit 124. Then, the encoding control unit 124 adjusts the quantization width in the quantization based on the decoded information from the local decoding unit 134 and the amount of data stored in the buffer memory 139, and performs image frame skipping. By performing such control as to the encoding unit 128, the encoded data is transmitted to the transmission path 140 at a predetermined rate while controlling the code amount so that the buffer memory 139 does not overflow. .

【0060】ここで、図1の構成における符号化装置で
は、1単位時間当たり、1枚分のフレームが入力動画像
データ127として入力され、これが動き補償フレーム
予測され、更にDCT変換される等の符号化がなされ
る。画像データを符号化すると、これを復号化した場合
での復号画像には空間的歪み(SN比)が残る。
Here, in the coding apparatus having the configuration shown in FIG. 1, one frame is input as input moving image data 127 per unit time, and the input moving image data 127 is subjected to motion compensation frame prediction and further subjected to DCT transformation. Encoding is performed. When image data is encoded, a spatial distortion (S / N ratio) remains in a decoded image obtained by decoding the image data.

【0061】復号画像126の持つ空間的歪み(SN
比)をD、多重化部137で多重化された符号量をRビ
ットと表すとすると、この場合、例えば、時刻tにおけ
る入力画像データを符号化した結果、これを復号化した
場合での復号画像126中の空間的歪み(SN比)はD
(t)であり、多重化部137の出力138すなわち、
多重化部137で多重化されて発生するデータの符号量
はR(t)ビットとなる。
The spatial distortion (SN) of the decoded image 126
Assuming that the ratio is D and the code amount multiplexed by the multiplexing unit 137 is R bits, in this case, for example, as a result of encoding the input image data at the time t, decoding in a case where this is decoded The spatial distortion (SN ratio) in the image 126 is D
(T), and the output 138 of the multiplexing unit 137, that is,
The code amount of the data generated by multiplexing in the multiplexing unit 137 is R (t) bits.

【0062】多重化部137で発生したデータはバッフ
ァメモリ139に蓄積された後、伝送路140へ送出さ
れる。但し、当該バッファメモリ139から伝送路14
0へ送出される符号量は、単位時間当たりLビット分で
ある。従って、バッファメモリ139での滞留量125
をB(t)とすると、時刻t時点の入力動画像が符号化
された場合においてのバッファメモリ139での蓄積情
報量B(t+1)は、 B(t+1)=B(t)+R(t)−L であり、また、当該時刻t時点の入力動画像がコマ落し
された場合においてのバッファメモリ139での蓄積情
報量B(t+1)は、 B(t+1)=B(t)−L となる。
The data generated by the multiplexing unit 137 is stored in the buffer memory 139 and then transmitted to the transmission line 140. However, the transmission path 14
The code amount transmitted to 0 is L bits per unit time. Therefore, the amount of stay 125 in the buffer memory 139
Is B (t), the amount of information B (t + 1) stored in the buffer memory 139 when the input moving image at the time t is encoded is: B (t + 1) = B (t) + R (t) −L, and the amount of information B (t + 1) stored in the buffer memory 139 when the input moving image at the time t is dropped, is B (t + 1) = B (t) −L. .

【0063】ここで、本システムでは、以下に示す方法
でコマ落しを行うものとする。すなわち、 B(t) > L のとき、“コマ落しモード” L ≧ B(t) > 0 のとき、“符号化モード” とし、“コマ落しモード”のときはコマ落としを実施
し、“符号化モード”のときはコマ落しは行わず、符号
化を実施する。
Here, in the present system, it is assumed that frame drop is performed by the following method. That is, when B (t)> L, “frame drop mode” When L ≧ B (t)> 0, “encoding mode” is set. When “frame drop mode”, frame drop is performed, and In the "encoding mode", encoding is performed without performing frame dropping.

【0064】図2に、本発明システムにおけるバッファ
メモリ139での滞留量Bの時間的変化の例を示す。こ
の例では、時刻tの時点(符号142で指し示す位置)
で多重化部137からR(t)の符号量が発生し、これ
がバッファメモリ139に蓄積される。従って、バッフ
ァメモリ139はこの新たなR(t)分のデータが蓄積
される結果、蓄積可能な符号量の余裕が無くなる。その
ため、時刻t+1の時点で符号化制御部124は“コマ
落しモード”とし、以降、符号化部128を当該“コマ
落しモード”で制御することとなって、時刻t+1の時
点(符号143で指し示す位置)、t+2の時点(符号
144で指し示す位置)、t+3の時点(符号145で
指し示す位置)ではコマ落しが行われる。そのため、バ
ッファメモリ139には新たなデータは蓄積されない。
FIG. 2 shows an example of a temporal change of the staying amount B in the buffer memory 139 in the system of the present invention. In this example, the time point t (the position indicated by reference numeral 142)
Then, the multiplexing unit 137 generates a code amount of R (t), which is stored in the buffer memory 139. Therefore, the buffer memory 139 stores the new R (t) data, so that there is no room for the code amount that can be stored. Therefore, at time t + 1, the encoding control unit 124 sets the “frame-drop mode”, and thereafter controls the encoding unit 128 in the “frame-drop mode”, and at the time t + 1 (indicated by reference numeral 143). At the time point t + 2 (position indicated by reference numeral 144) and at the time point t + 3 (position indicated by reference numeral 145), a frame drop is performed. Therefore, no new data is stored in the buffer memory 139.

【0065】しかし、バッファメモリ139からはフレ
ームのタイミング毎にLなる符号量相当分のデータが送
り出されるので時間経過に伴って次第に滞留量Bが減少
する。そして時刻t+4の時点では3×L分の符号量が
無くなり、バッファメモリ139に十分な余裕ができ
る。そのため、当該時刻t+4の時点で符号化制御部1
24は“符号化モード”とし、符号化部128を当該
“符号化モード”で制御することとなって、次の新たな
データが符号化され、バッファメモリ139に蓄積され
る。
However, since the data corresponding to the code amount of L is transmitted from the buffer memory 139 at each frame timing, the staying amount B gradually decreases with time. At time t + 4, the code amount corresponding to 3 × L is lost, so that the buffer memory 139 has a sufficient margin. Therefore, at the time t + 4, the encoding control unit 1
Numeral 24 denotes an “encoding mode”, and the encoding unit 128 is controlled in the “encoding mode”, so that the next new data is encoded and stored in the buffer memory 139.

【0066】このように、バッファメモリ139の蓄積
容量に余裕があるか否かに応じて符号化モードにした
り、コマ落としモードにしたりしてバッファメモリ13
9がオーバフローしないように、一定のレートで符号化
データを伝送するように制御を続ける。
As described above, depending on whether the storage capacity of the buffer memory 139 has a margin or not, the encoding mode or the frame drop mode is set to change the buffer memory 13.
Control is continued so that encoded data is transmitted at a constant rate so that 9 does not overflow.

【0067】ここで、本システムでは、復号した画像の
画質に過剰品質や大きな劣化がないようバランスのとれ
た画質を維持できるように符号化制御部124は符号化
部128を制御している。これは復号動画像の時間的歪
みを示す指標を用いることによって次のようにして実現
している。
Here, in the present system, the encoding control unit 124 controls the encoding unit 128 so that the image quality of the decoded image can be maintained in a balanced manner so that there is no excessive quality or large deterioration. This is realized as follows by using an index indicating the temporal distortion of the decoded moving image.

【0068】すなわち、復号動画像の時間的歪みを示す
指標として、ある時刻tの入力フレームが符号化される
確率を用いる。伝送路140での伝送可能なビットレー
トは、単位時間当たりLビットであり、従って、R
(t)の符号量を持つ情報がある場合に、この情報を伝
送するためには、R(t)/L単位時間を要する。
That is, the probability that an input frame at a certain time t is encoded is used as an index indicating the temporal distortion of a decoded moving image. The bit rate that can be transmitted on the transmission line 140 is L bits per unit time.
When there is information having the code amount of (t), it takes R (t) / L unit time to transmit this information.

【0069】従って、時刻t前後での平均的な入力フレ
ームの符号化確率(以下、符号化率と呼ぶ)をS(t)
とおくと、当該S(t)は、 S(t)=L/R(t) (但し、時刻tは符号化モード)と表わすことができ
る。
Therefore, the average coding probability of the input frame before and after time t (hereinafter referred to as the coding rate) is represented by S (t)
In other words, S (t) can be expressed as S (t) = L / R (t) (where time t is an encoding mode).

【0070】ここで、入力画像を符号化する際、その入
力画像の画像データは量子化をすることになるが、その
際の量子化精度により復号動画像は変化する。すなわ
ち、量子化精度を高めれば高いSN比が確保できて復号
動画像の画質が保持できるが、反面、符号化率が減少す
るので、符号量が増大する。逆に、符号量を少なくする
ために符号化率を高めれば量子化精度を下げてSN比を
落とすことになり、画質が低下する。この関係を、画品
質トレードオフ関数Ss=G[Ds]と呼ぶ。
Here, when encoding the input image, the image data of the input image is quantized, but the decoded moving image changes depending on the quantization precision at that time. That is, if the quantization precision is increased, a high SN ratio can be secured and the image quality of the decoded moving image can be maintained. However, the coding rate decreases, and the code amount increases. Conversely, if the coding rate is increased in order to reduce the code amount, the quantization accuracy will be reduced and the SN ratio will be reduced, and the image quality will be reduced. This relationship is called an image quality trade-off function Ss = G [Ds].

【0071】画品質トレードオフ関数Ss=G[Ds]
の一例を図3に示す。なお、図3において、横軸はSN
比を表し、縦軸は符号化率を表している。画品質トレー
ドオフ関数Ss=G[Ds]は図3に符号148を付し
て示してあるように、符号化率が大きいとSNが悪く、
符号化率が小さくなるとSNが向上する右肩下がりの特
性曲線を描く。従って、入力フレームが大きな動きやパ
ターン等を含むとき、右下に移動し、動きが少ないとき
は左上に移動する。
Image quality trade-off function Ss = G [Ds]
FIG. 3 shows an example. In FIG. 3, the horizontal axis is SN
The vertical axis indicates the coding rate. As shown by reference numeral 148 in FIG. 3, the image quality trade-off function Ss = G [Ds] has a poor SN when the coding rate is large,
A characteristic curve is drawn in which the SN increases as the coding rate decreases. Therefore, when the input frame includes a large motion, a pattern, or the like, it moves to the lower right, and when there is little motion, it moves to the upper left.

【0072】一方、前述した符号化率と量子化精度の組
が視覚的に最適となる点(符号149を付して指し示す
点)が、それぞれの入力画像に対する画品質トレードオ
フ関数Ss=G[Ds]上に1点ずつ存在する。この点
を結んだ線が目的関数So=O[Do]であり、図3に
符号147を付して指し示す曲線がこれである。
On the other hand, the point at which the combination of the above-mentioned coding rate and quantization accuracy is visually optimal (point indicated by reference numeral 149) is the image quality trade-off function Ss = G [ Ds]. The line connecting these points is the objective function So = O [Do], and this is the curve indicated by reference numeral 147 in FIG.

【0073】画品質トレードオフ関数を正確に求めるた
めには、量子化精度を変化させつつ、そのフレームを何
度も実際に符号化し、その都度符号化率を測定する必要
がある。しかし、処理時間の観点からこのような処理は
非現実的である。
In order to accurately determine the picture quality trade-off function, it is necessary to actually encode the frame many times while changing the quantization precision, and to measure the coding rate each time. However, such processing is impractical in terms of processing time.

【0074】そこで、現実的な手法として文献『加藤ら
の“動画像符号化方式における時空間歪み最適配分型符
号化制御アルゴリズム”電子情報通信学会論文誌B V
ol.J71−B No.8 P.945−954 1
988年8月』に開示された手法があり、ここには、現
符号化フレームから画品質トレードオフ関数を決定する
2つの方法が提案されている。
Therefore, as a practical method, the document “Kato et al.,“ Spatio-temporal distortion optimal allocation type coding control algorithm in video coding ”, IEICE Transactions on Communications, BV
ol. J71-B No. 8P. 945-954 1
August 988 ", which proposes two methods for determining a picture quality trade-off function from the current coded frame.

【0075】まず、上記文献に記載された第1の方法に
ついて説明する。動き補償フレーム予測及びDCTを終
えた段階で、現フレームの予測誤差信号DCT係数、動
きベクトルが得られる。このとき、1フレーム分のDC
T係数ヒストグラムおよび動きベクトル符号量から、発
生符号量R(q)と、SN比D(q)とが、量子化精度
qの関数として求められる。
First, the first method described in the above document will be described. After the motion compensation frame prediction and the DCT are completed, a prediction error signal DCT coefficient and a motion vector of the current frame are obtained. At this time, DC for one frame
From the T coefficient histogram and the motion vector code amount, the generated code amount R (q) and the SN ratio D (q) are obtained as functions of the quantization accuracy q.

【0076】従って、符号化率S(q)=L/R(q)
と、SN比D(q)との関係である画品質トレードオフ
関数Ss=G[Ds]が精度よく定まる。
Therefore, the coding rate S (q) = L / R (q)
And the image quality trade-off function Ss = G [Ds], which is the relationship between the image quality and the SN ratio D (q), is determined with high accuracy.

【0077】図4は、上記文献に記載されている画品質
トレードオフ関数Ss=G[Ds]の例を示しており、
いずれも右肩下がりではあるが、図からわかるように異
なる入力フレームに対して異なる曲線になっている。
FIG. 4 shows an example of the image quality trade-off function Ss = G [Ds] described in the above document.
Each of them has a downward slope but has different curves for different input frames as can be seen from the figure.

【0078】次に、上記文献に記載された第2の方法に
ついて説明する。当該第2の方法は、幾つかの符号化率
S(q)およびSN比D(q)の候補を予め定めてお
き、その中から直前の符号化フレームの符号化結果と適
合する特性を選定し、その選定結果に基づいて現符号化
フレームの画品質トレードオフ関数を算出する方法であ
る。
Next, the second method described in the above document will be described. In the second method, several coding rate S (q) and SN ratio D (q) candidates are determined in advance, and a characteristic matching the coding result of the immediately preceding coding frame is selected from the candidates. Then, based on the selection result, a picture quality trade-off function of the current coded frame is calculated.

【0079】図5は、符号化率S(q)を本方法により
推定する方法を示している。図5中、特性曲線に付した
数字[No.1]〜[No.6]は符号化率対量子化ス
テップサイズ特性候補の番号を表し、点Cは前符号化フ
レームの符号化率と量子化ステップサイズを表してい
る。図5の例では、番号[No.3]の特性が最も点C
に近く、番号[No.3]の特性を時刻tの符号化率S
(q)と推定している。SN比Ds(q)も同様の方法
で推定される。
FIG. 5 shows a method for estimating the coding rate S (q) by the present method. In FIG. 5, the numbers [No. 1] to [No. 6] represents the number of the coding rate vs. quantization step size characteristic candidate, and point C represents the coding rate and the quantization step size of the previous encoded frame. In the example of FIG. 3] is the most point C
, And the number [No. 3] is changed to the coding rate S at time t.
(Q). The SN ratio Ds (q) is estimated in a similar manner.

【0080】以上、第1の実施形態の符号化装置は、複
数オブジェクトの動画像を符号化した画像データを多重
化して通信回線に送出するシステムにおいて、オブジェ
クトの符号化の際に優先度をつけ、符号化の際に全体と
してコマ落しが多くなると推定されたとき、オブジェク
ト間で配分ビットを移動させ、優先度の高いオブジェク
トの画品質を維持、且つ、向上させるようにしたもので
あり、各オブジェクトの符号化処理の過程で、符号化率
に応じたコマ落しによる時間的歪みと量子化精度による
空間的歪みとのバランスがとれ、視覚特性上最適な動作
点で符号化処理を行うようにしたことで、各オブジェク
トについてバランスのとれた表示が可能となるものであ
る。
As described above, the encoding apparatus according to the first embodiment assigns priorities when encoding objects in a system for multiplexing image data obtained by encoding moving images of a plurality of objects and transmitting the multiplexed image data to a communication line. In coding, when it is estimated that the number of dropped frames is increased as a whole, the allocation bits are moved between the objects to maintain and improve the image quality of the high-priority object. During the object encoding process, the temporal distortion due to frame dropping according to the encoding rate and the spatial distortion due to quantization accuracy are balanced, and the encoding process is performed at the optimal operating point for visual characteristics. By doing so, a balanced display can be achieved for each object.

【0081】以上、矩形画面での符号化制御のための符
号化装置の例を説明した。次に、本発明の主要な目的で
ある複数オブジェクトにおけるレート制御について第2
の実施形態として説明する。
The example of the coding apparatus for controlling the coding on the rectangular screen has been described above. Next, the second object of the rate control in a plurality of objects, which is the main object of the present invention, is described.
An embodiment will be described.

【0082】<第2の実施形態> 〔複数オブジェクトにおける本発明のレート制御〕図6
は複数オブジェクトにおけるレート制御を、単一のバッ
ファメモリで実施する方式の装置の構成図である。図6
において、112は形状抽出部、114a,114b,
〜114nは符号化部、117はレート制御部、153
はマルチプレクサ、119はバッファメモリである。
<Second Embodiment> [Rate Control of the Present Invention for a Plurality of Objects] FIG. 6
FIG. 1 is a configuration diagram of an apparatus of a system that performs rate control on a plurality of objects with a single buffer memory. FIG.
, 112 is a shape extraction unit, 114a, 114b,
To 114n are an encoding unit, 117 is a rate control unit, 153
Is a multiplexer, and 119 is a buffer memory.

【0083】形状抽出部112は、テレビカメラなどの
撮像装置で撮影して得た入力動画像111から画面を構
成している各オブジェクトについてそれぞれ輪郭を元に
した領域抽出をして、各オブジェクトの形状情報113
a,113b,〜113nをそれぞれ生成するものであ
って、1フレームの画面から複数のオブジェクト形状を
抽出するものである。また、この形状抽出部112には
抽出したオブジェクトの形状情報から相互の輪郭が接触
しているオブジェクト同士を組として分類し、その情報
(分類表)をレート制御部117に出力すると云った機
能を備えている。
The shape extraction unit 112 extracts a region based on the outline of each object constituting the screen from the input moving image 111 obtained by photographing with an imaging device such as a television camera, and extracts the region of each object. Shape information 113
a, 113b,..., and 113n, respectively, for extracting a plurality of object shapes from a screen of one frame. The shape extraction unit 112 also has a function of classifying objects whose outlines are in contact with each other as a set based on the shape information of the extracted objects and outputting the information (classification table) to the rate control unit 117. Have.

【0084】符号化部114a〜114nは前記各オブ
ジェクト毎に対応してそれぞれの受け持ちのオブジェク
トを符号化する符号化部であり、各オブジェクトに対応
した形状情報113a,113b,〜113nを使用
し、当該形状情報の範囲の画像について、レート制御部
117の制御のもとに与えられる割り当て符号量(配分
されるビット量対応の符号量)となるよう、符号化する
ものである。
The coding units 114a to 114n are coding units for coding the respective assigned objects corresponding to the respective objects, and use the shape information 113a, 113b, to 113n corresponding to each object. The image in the range of the shape information is encoded so as to have the assigned code amount (the code amount corresponding to the allocated bit amount) given under the control of the rate control unit 117.

【0085】また、符号化部114a〜114nには、
前記符号化処理により得られた符号化データを復号化し
て元のデータに戻す機能を有しており、この元に戻した
データはローカル復号化データ152a〜152nとし
てレート制御部117に出力する機能を持つ。
The encoding units 114a to 114n include:
It has a function of decoding the coded data obtained by the above-mentioned coding process and returning it to the original data, and a function of outputting the restored data to the rate control unit 117 as local decoded data 152a to 152n. have.

【0086】マルチプレクサ153はデータを多重化す
るためのものであって、符号化部114a〜114nに
より出力されるオブジェクトを符号化した出力データ1
16a,〜116nを受けて、これらを多重化し、バッ
ファメモリ119に送るものである。バッファメモリ1
19の出力120が伝送路への伝送出力となる。
The multiplexer 153 is for multiplexing data. The output data 1 is obtained by encoding the objects output from the encoding units 114a to 114n.
16a, .about.116n, and multiplexes them, and sends them to the buffer memory 119. Buffer memory 1
The output 120 of 19 is the transmission output to the transmission line.

【0087】レート制御部117はローカル復号化デー
タ152a〜152nを受けて各オブジェクトに対する
割り当て符号量をオブジェクト毎の優先度に応じた個別
の画質と、フレーム全体の画質バランスを考慮して適宜
に配分することにより、定めると共に、バッファメモリ
119よりそのデータ蓄積量の情報154を受けて当該
蓄積量の情報154からバッファメモリ119の空き状
態を調べ、バッファメモリ119の出力120が割り当
てレートになるように、符号化部114a,〜114n
の出力データ116a,〜116nについて、コマ落と
ししたりすると云った調整制御をするためのものであ
る。また、このレート制御部117には前記形状抽出部
112からの分類表から各組に属しているオブジェクト
をまとめてレート制御及びコマ落としを行うと云った調
整制御機能をも備えている。
The rate control unit 117 receives the local decoded data 152a to 152n and appropriately allocates the code amount to be assigned to each object in consideration of the balance between the individual image quality according to the priority of each object and the image quality of the entire frame. By doing so, the data storage amount information 154 is received from the buffer memory 119, the empty state of the buffer memory 119 is checked from the storage amount information 154, and the output 120 of the buffer memory 119 is set to the assigned rate. , Encoding units 114a, to 114n
The output data 116a,..., 116n are subjected to adjustment control such as frame skipping. The rate control unit 117 also has an adjustment control function of performing rate control and frame dropping for objects belonging to each group from the classification table from the shape extraction unit 112.

【0088】このような構成において、テレビカメラな
どの撮像装置で撮影した入力動画像111を本システム
に入力すると、この入力動画像111は、形状抽出部1
12と符号化部114a,114b,〜114nとに、
それぞれ与えられる。
In such a configuration, when an input moving image 111 captured by an imaging device such as a television camera is input to the present system, the input moving image 111
12 and the encoding units 114a, 114b, to 114n,
Each given.

【0089】入力動画像111を受けた形状抽出部11
2は、この入力動画像111から画面を構成している各
オブジェクトについてそれぞれ輪郭を元にした領域抽出
をし、各オブジェクト別の形状情報113a,〜113
nを生成する。そして、符号化部114a,114b,
〜114nに対して、生成した各オブジェクト別の形状
情報113a,〜113nのうちの、対応するオブジェ
クトの形状情報をそれぞれ与える。
The shape extracting unit 11 which has received the input moving image 111
2 extracts a region from each of the objects constituting the screen from the input moving image 111 based on the outline, and obtains shape information 113a, 113 to 113 for each object.
Generate n. Then, the encoding units 114a, 114b,
To 114n, the shape information of the corresponding object among the generated shape information 113a, 113n for each object is given.

【0090】また、形状抽出部112は抽出したオブジ
ェクトの形状情報から相互の輪郭が接触しているオブジ
ェクト同士を組として分類する。そして、前記各組に対
してどのオブジェクトが属しているかの分類表情報を、
レート制御部117に送る。
The shape extracting unit 112 classifies the objects whose outlines are in contact with each other as a set based on the extracted object shape information. Then, classification table information indicating which object belongs to each of the sets,
Send to rate control section 117.

【0091】また、入力動画像111を受けた符号化部
114a〜114nでは、それぞれ自己に与えられた形
状情報113a,〜113nを使用して、入力動画像1
11から形状情報に対応する動画像部分を領域抽出し、
その抽出した動画像部分を用いて動き補償情報を求め、
この動き補償情報と前記抽出した動画像部分のテクスチ
ャ情報とを符号化処理して出力する(出力データ116
a,〜116n)。このとき、符号化処理での発生符号
量は、レート制御部117により与えられた割り当て符
号量相当のビット量になるように、量子化幅を設定変更
するなどして、調整制御される(レート制御)。
The encoding units 114a to 114n receiving the input moving image 111 use the input moving image 1 by using the shape information 113a to 113n respectively given to themselves.
Region extraction of a moving image portion corresponding to shape information from 11 is performed,
The motion compensation information is obtained using the extracted moving image portion,
The motion compensation information and the extracted texture information of the moving image portion are encoded and output (output data 116
a, ~ 116n). At this time, the generated code amount in the encoding process is adjusted and controlled by changing the quantization width so as to be a bit amount corresponding to the allocated code amount given by the rate control unit 117 (rate). control).

【0092】また、符号化部114a〜114nは、前
記符号化処理により得られた符号化データを復号化して
元のデータに戻す機能を有しており、この元に戻したデ
ータはローカル復号化データ152a〜152nとして
レート制御部117に出力する。
The encoding units 114a to 114n have a function of decoding the coded data obtained by the above-mentioned encoding process and returning the data to the original data. The data is output to the rate control unit 117 as data 152a to 152n.

【0093】符号化部114a〜114nからの出力デ
ータ116a,〜116nはマルチプレクサ153に送
られてここで多重化される。そして、このマルチプレク
サ153にて多重化された出力155はバッファメモリ
119に与えられる。バッファメモリ119はこれを取
り込み、一定レートで読み出す。
The output data 116a and 116n from the encoders 114a to 114n are sent to the multiplexer 153 where they are multiplexed. The output 155 multiplexed by the multiplexer 153 is supplied to the buffer memory 119. The buffer memory 119 takes in this and reads it out at a constant rate.

【0094】この結果、バッファメモリ119は全ての
オブジェクトの符号化データについて平滑化することに
なり、当該バッファメモリ119から読み出される出力
120は一定レートで回線に出力されることになる。
As a result, the buffer memory 119 smoothes the encoded data of all objects, and the output 120 read from the buffer memory 119 is output to the line at a constant rate.

【0095】また、バッファメモリ119のデータ滞留
量の情報はレート制御部117に送られる。そして、レ
ート制御部117は前記滞留量の情報などから必要に応
じて各符号化部114a〜114nのコマ落としの制御
を行い、発生符号量を調整してバッファメモリ119に
入力される符号化データがオーバーフローしないように
制御する。さらに、レート制御部117は各符号化部1
14a〜114nからのローカル復号化データ152a
〜152nを受けて各オブジェクトに対する割り当て符
号量を、オブジェクト毎の優先度に応じた個別の画質
と、フレーム全体の画質バランスを考慮して適宜に配分
し、その個別の情報を各符号化部114a〜114nの
うち、対応の符号化部に与える。
Information on the amount of data stored in the buffer memory 119 is sent to the rate control unit 117. Then, the rate control unit 117 controls the frame dropping of each of the encoding units 114a to 114n as necessary based on the information of the staying amount and the like, adjusts the generated code amount, and controls the encoded data input to the buffer memory 119. Is controlled not to overflow. Further, the rate control unit 117 controls each encoding unit 1
14a-114n local decrypted data 152a
To 152n, the code amount allocated to each object is appropriately distributed in consideration of the balance between the individual image quality according to the priority of each object and the image quality of the entire frame, and the individual information is encoded by each encoding unit 114a. 114114n to the corresponding encoding unit.

【0096】また一方、形状抽出部112は抽出したオ
ブジェクトの形状情報から相互の輪郭が接触しているオ
ブジェクト同士を組として分類しており、そして、前記
各組に対してどのオブジェクトが属しているかの分類表
を作成してレート制御部117に与えている。そして、
レート制御部117はレート制御及びコマ落としの必要
が生じたときは、この分類表の情報からそれぞれ組み単
位で、その組に属しているオブジェクトをまとめてコマ
落としを行う。
On the other hand, the shape extracting unit 112 classifies the objects whose outlines are in contact with each other as a set based on the extracted shape information of the object, and determines which object belongs to each set. Is created and given to the rate control unit 117. And
When the need for rate control and frame dropping arises, the rate control unit 117 collectively drops objects belonging to the group for each group from the information in this classification table.

【0097】つまり、コマ落としにあたっては、レート
制御部117は分類表の情報をもとに、コマ落としを組
み単位で行うようにする。
In other words, when dropping frames, the rate control unit 117 performs dropping of frames on a group basis based on the information in the classification table.

【0098】図6の構成の符号化装置の動作の概要はこ
のようなものであるが、この符号化装置は複数オブジェ
クトにおけるレート制御を、1つのバッファメモリで実
施すると共に、複数のオブジェクトについて符号化の際
に、オブジェクト毎に画品質を考慮しながらビッ卜配分
をして、多重化処理を行うようにし、オブジェクト全体
の表示で優先度の高いオブジェクトほど高品質の動画像
表示ができ、多重化処理の際にオブジェクト全体として
のコマ落しの回数も減らすこともできるようにして、全
体としてバランスのとれた符号化処理を行うことを可能
にする点に特徴がある。
The outline of the operation of the encoding apparatus having the configuration shown in FIG. 6 is as described above. This encoding apparatus implements rate control for a plurality of objects with one buffer memory, and performs encoding for a plurality of objects. At the time of multiplexing, multiplexing processing is performed by allocating bits while considering image quality for each object, and the higher the priority of the entire object is displayed, the higher the quality of the moving image can be displayed. It is characterized in that the number of dropped frames in the entire object can be reduced during the encoding process, thereby enabling a balanced encoding process as a whole.

【0099】すなわち、複数のオブジェクトについて全
体として1つのバッファメモリでレート制御を行うこと
で、通信回線に対して一定の伝送レートに適合するよう
に制御する。初期状態として各オブジェクトに対して優
先度と配分ビットを決め、各オブジェクトは量子化精度
による空間的歪みとコマ落しによる時間的歪みとのバラ
ンスがとれた視覚特性上最適な動作点になるように符号
化処理を行う。そして、動画像符号化の過程で優先度が
高いオブジェクトが高アクティビティ状態になったと
き、全体として通信回線の伝送レートを遵守しながら優
先度の低いオブジェクトから配分ビットを移動させるよ
うにレート制御を行う。また、優先度の低いオブジェク
トが高アクティビティ状態になったとき該当オブジェク
トのレートを下げることで、多重化した場合に、全体と
してコマ落しを少なくする。
That is, by controlling the rate of a plurality of objects with one buffer memory as a whole, the communication line is controlled to conform to a certain transmission rate. The priority and allocation bits are determined for each object as an initial state, and each object is set to the optimal operating point in terms of visual characteristics that balances spatial distortion due to quantization accuracy and temporal distortion due to frame dropping. Perform encoding processing. Then, when an object with a high priority enters a high activity state in the process of moving image encoding, rate control is performed so as to move the allocation bits from the object with a low priority while observing the transmission rate of the communication line as a whole. Do. Also, when an object with a low priority enters the high activity state, the rate of the object is reduced, so that when frames are multiplexed, dropped frames are reduced as a whole.

【0100】複数のオブジェクトについて符号化の際
に、オブジェクト毎に画品質を考慮しながらビッ卜配分
をして、多重化処理を行うようにすると、オブジェクト
全体の表示で優先度の高いオブジェクトほど高品質の動
画像表示が実現でき、多重化処理の際にオブジェクト全
体としてのコマ落しの回数も減らすこともでき、全体と
してバランスのとれた符号化処理を行うことが可能とな
る。
When encoding a plurality of objects, multiplexing is performed by allocating bits while taking into account image quality for each object. A high-quality moving image display can be realized, the number of dropped frames of the entire object can be reduced during the multiplexing process, and a balanced encoding process can be performed as a whole.

【0101】その制御の詳細を次に説明する。The details of the control will be described below.

【0102】第2の実施形態における符号化装置におい
ては、入力された原画像が、形状抽出部131において
形状抽出処理されることにより、必要なオブジェクトに
ついての領域抽出が行われ、これにより、それらオブジ
ェクトの形状が抽出される。
In the encoding apparatus according to the second embodiment, the input original image is subjected to shape extraction processing by the shape extraction unit 131, thereby extracting a region of a necessary object. The shape of the object is extracted.

【0103】ここで一般的な動画像からオブジェクトの
輪郭を元に、該当の領域を抽出するには、例えば、特開
平6−251148号公報に記載されている如きの手法
を用いることができる。
Here, in order to extract a corresponding area from a general moving image based on the contour of an object, for example, a method described in JP-A-6-251148 can be used.

【0104】そして、符号化部114a〜114nで、
前記領域におけるテキスチャ、動き補償フレーム予測お
よび形状情報について符号化する。そして、符号化部1
14a〜114nで符号化されたテキスチャ、動き補償
フレーム予測および形状情報はマルチプレクサ153に
送られてここで多重化され、バッファメモリ119に送
られる。ここで、各符号化部114a〜114n毎に別
々のオブジェクトを扱っており、従って、各符号化部1
14a〜114n毎にそれぞれ独立のチャネルと考える
と、マルチプレクサ153で多重化された出力155は
各チャネルのデータが多重化されたデータである。
Then, in the encoding units 114a to 114n,
The texture, motion-compensated frame prediction, and shape information in the area are encoded. And the encoding unit 1
The texture, motion-compensated frame prediction, and shape information encoded by 14a to 114n are sent to the multiplexer 153, where they are multiplexed and sent to the buffer memory 119. Here, different objects are handled for each of the encoding units 114a to 114n, and accordingly,
Assuming that channels 14a to 114n are independent channels, the output 155 multiplexed by the multiplexer 153 is data obtained by multiplexing the data of each channel.

【0105】第1の実施形態と同様に、レート制御のた
めに、バッファメモリでの滞留量の情報がレート制御部
117に送られるが、第2の実施形態での本システムで
は、バッファメモリ全体での滞留量ではなく、各チャネ
ル別の滞留量とする。すなわち、バッファメモリ119
での各チャネル毎の現在のデータ量情報がレート制御部
117に送られるようになっている。
As in the first embodiment, information on the amount of data stored in the buffer memory is sent to the rate control unit 117 for rate control. However, in the present system according to the second embodiment, the entire buffer memory is used. Instead of the amount of stagnation in, the amount of stagnation for each channel. That is, the buffer memory 119
The current data amount information for each channel in the above is sent to the rate control unit 117.

【0106】一方、レート制御部117は符号化部11
4a〜114nから与えられたローカル復号化データ1
52a〜152nと前記各チャネル別のデータ量情報か
ら各チャネルのバッファメモリ119の割り当てメモリ
量を算出して、算出結果から量子化精度制御情報151
a〜151nを作成し、符号化部114a〜114nに
対して当該量子化精度制御情報151a〜151nを与
える。符号化部114a〜114nは量子化精度制御情
報151a〜151nにより指定された量子化精度に設
定して符号化を行う。
On the other hand, the rate control section 117
4a to 114n, local decoded data 1 given from
The amount of memory allocated to the buffer memory 119 for each channel is calculated from the data amount information for each channel and the quantization accuracy control information 151 from the calculation result.
a to 151n, and gives the quantization accuracy control information 151a to 151n to the encoding units 114a to 114n. The encoding units 114a to 114n perform encoding by setting the quantization accuracy specified by the quantization accuracy control information 151a to 151n.

【0107】ここで符号化部114の構成例について触
れておく。 <符号化部114の構成例>図7は符号化部114a〜
114nの内部構成を示した構成図である。符号化部1
14は符号化制御部156、符号化被制御部158及び
形状符号化部157および多重化部165とから構成さ
れている。
Here, an example of the configuration of the encoding unit 114 will be described. <Example of Configuration of Encoding Unit 114> FIG.
It is a block diagram showing the internal configuration of 114n. Encoding unit 1
14 comprises an encoding control unit 156, an encoded controlled unit 158, a shape encoding unit 157, and a multiplexing unit 165.

【0108】これらのうち、符号化制御部156は、レ
ート制御部117からの量子化精度制御情報151をも
とに、符号化被制御部158での量子化処理段での量子
化幅を調整したり、コマ落とし制御したり、形状符号化
部157の制御をしたりするものであり、形状符号化部
157は形状抽出部112から与えられる形状情報11
3について符号化するものであって、形状そのものの符
号化を行うものであり、符号化被制御部158は、符号
化制御部156の制御のもとに入力動画像データ111
中から、形状抽出部112の与える形状情報113対応
の形状領域について動き補償フレーム予測を行い、これ
を可変符号化し、また、動き補償フレーム予測情報をD
CT処理してDCT変換係数を得、これを量子化した
後、可変符号化し、また、DCT変換係数を復号化して
ローカル復号化データ152として出力する機能を有す
る。
Among these, the encoding control unit 156 adjusts the quantization width in the quantization processing stage in the encoded controlled unit 158 based on the quantization accuracy control information 151 from the rate control unit 117. The frame encoding control section 157 controls the shape encoding section 157. The shape encoding section 157 controls the shape encoding section 157.
The encoding control unit 158 encodes the input moving image data 111 under the control of the encoding control unit 156.
From among them, motion-compensated frame prediction is performed for a shape area corresponding to the shape information 113 provided by the shape extracting unit 112, and this is variably encoded.
It has a function of obtaining a DCT transform coefficient by performing a CT process, quantizing it, variably encoding it, decoding the DCT transform coefficient, and outputting it as local decoded data 152.

【0109】ここで、符号化被制御部158は、動き補
償フレーム間予測部159、DCT変換部160、第2
の可変長符号化部161、量子化部162、ローカル復
号化部163、第1の可変長符号化部164とから構成
される。
Here, the coded controlled unit 158 includes a motion compensation inter-frame predicting unit 159, a DCT transforming unit 160, a second
, A quantization unit 162, a local decoding unit 163, and a first variable length coding unit 164.

【0110】動き補償フレーム間予測部159は、形状
抽出部112の与える形状情報113対応の形状領域に
ついて16×16画素の範囲で動き補償が可能でフレー
ム間の誤差を算出し、動き補償フレーム予測情報を得る
ものであり、DCT変換部160は、この動き補償フレ
ーム予測情報をDCT処理するものであって、具体的に
は予測誤差情報を8×8のブロック単位でDCT変換し
て空間座標データを周波数座標データに変換するもので
あり、第2の可変長符号化部161は、動き補償フレー
ム予測情報を可変符号化して出力するものである。
The motion-compensated inter-frame predicting section 159 can perform motion compensation within a range of 16 × 16 pixels for a shape area corresponding to the shape information 113 provided by the shape extracting section 112, calculate an inter-frame error, and perform motion-compensated frame prediction. The DCT transform unit 160 performs DCT processing on the motion-compensated frame prediction information. Specifically, the DCT transform unit 160 performs DCT transform on the prediction error information in units of 8 × 8 blocks to obtain spatial coordinate data. Is converted to frequency coordinate data, and the second variable-length encoding unit 161 variably encodes the motion-compensated frame prediction information and outputs the information.

【0111】また、量子化部162は、与えられた量子
化幅でDCT変換部160の変換出力を量子化して出力
するものであり、第1の可変長符号化部164は、この
量子化出力を可変符号化して出力するものであって、具
体的には量子化した変換係数をハフマン符号化するもの
であり、ローカル復号化部163は、量子化部162に
て得たDCT変換係数を復号化してローカル復号化デー
タ152として出力するものである。
The quantizing section 162 quantizes the transform output of the DCT transform section 160 with a given quantization width and outputs the result. The first variable length coding section 164 outputs the quantized output. Is variably encoded and output. Specifically, the quantized transform coefficient is subjected to Huffman encoding, and the local decoding unit 163 decodes the DCT transform coefficient obtained by the quantization unit 162. And outputs it as local decrypted data 152.

【0112】なお、上記多重化部165は形状符号化部
157と第1の可変長符号化部164及び第2の可変長
符号化部161の出力を多重化して出力データ116と
して出力するものである。
The multiplexing section 165 multiplexes the outputs of the shape coding section 157, the first variable length coding section 164, and the second variable length coding section 161 and outputs the multiplexed data as output data 116. is there.

【0113】このような構成の符号化部114i(iは
a,〜nのうちの一つ)は、形状抽出部112から与え
られる形状情報113をもとにオブジェクトの輪郭自体
を符号化する。すなわち、複数ある符号化部114a,
〜114nは、複数あるオブジェクトのうちのそれぞれ
特定オブジェクトを符号化処理の対象として処理する。
従って、符号化部114a,〜114nは、複数ある形
状情報113a,〜113nのうち、それぞれ異なる特
定のオブジェクトの形状情報113i(iはa,〜nの
うちの一つ)をもとにオブジェクトの輪郭自体を符号化
する。
The encoding unit 114i (i is one of a,..., N) having such a configuration encodes the outline of the object itself based on the shape information 113 given from the shape extraction unit 112. That is, a plurality of encoding units 114a,
To 114n process a specific object among a plurality of objects as a target of the encoding process.
Therefore, the encoding units 114a to 114n determine the object based on the shape information 113i (i is one of a and n) of the different specific object from among the plurality of shape information 113a and 113n. Encode the contour itself.

【0114】また、符号化部114iには入力動画像1
11が入力されており、この入力動画像111が符号化
被制御部158に入力される。
Further, the input moving image 1 is
11 is input, and the input moving image 111 is input to the coded controlled unit 158.

【0115】符号化被制御部158では、入力動画像1
11が入力されると、動き補償フレーム間予測部159
はこれと形状抽出部112からの形状情報113とを用
いて16×16画素の範囲で動き補償が可能なフレーム
間の誤差を算出し、予測誤差信号を得る。そして、DC
T変換部160は形状抽出部112からの形状情報11
3を参照して前記予測誤差信号を8×8のブロック単位
でDCT変換することにより、空間座標データを周波数
座標データに変換し、量子化部162は、このDCT変
換部160がDCT変換した変換係数を直線量子化す
る。
In the coded controlled unit 158, the input moving image 1
When 11 is input, the motion compensation inter-frame prediction unit 159
Uses this and the shape information 113 from the shape extraction unit 112 to calculate an error between frames that can be motion compensated in a range of 16 × 16 pixels, and obtain a prediction error signal. And DC
The T conversion unit 160 receives the shape information 11 from the shape extraction unit 112.
3, the spatial error data is converted into frequency coordinate data by subjecting the prediction error signal to DCT transform in units of 8 × 8 blocks, and the quantization unit 162 converts the DCT transform by the DCT transform unit 160. The coefficients are linearly quantized.

【0116】第1の可変長符号化部164は、この量子
化された変換係数を形状抽出部112からの形状情報1
13を参照してハフマン符号化(テクスチャ符号化)
し、多重化部165に与える。
The first variable length coding section 164 uses the quantized transform coefficient as the shape information 1 from the shape extraction section 112.
Huffman coding (texture coding) with reference to FIG.
Then, it is given to the multiplexing unit 165.

【0117】また一方、動き補償フレーム間予測部15
9において動き補償に用いた動きベクトルを第2の可変
長符号化部161は形状抽出部112からの形状情報1
13を参照してハフマン符号化(動き補償符号化)し、
多重化部165に与える。また、形状符号化部157は
形状抽出部112から与えられる形状情報113につい
て符号化することにより、形状そのものの符号化を行
い、多重化部165に与える。
On the other hand, the motion compensation inter-frame prediction unit 15
9, the second variable length coding unit 161 uses the motion vector used for motion compensation in the shape information 1 from the shape extraction unit 112.
Huffman coding (motion compensation coding) with reference to FIG.
This is provided to the multiplexing unit 165. Also, the shape encoding unit 157 encodes the shape itself by encoding the shape information 113 provided from the shape extraction unit 112, and supplies the encoded information to the multiplexing unit 165.

【0118】すると、多重化部165では、第1の可変
長符号化部164で符号化された主情報、第2の可変長
符号化部161で符号化されたサイド情報および形状符
号化部157で符号化された形状符号化情報を多重化し
て伝送フレームを形成し、マルチプレクサ153へと出
力する。
Then, in multiplexing section 165, main information coded in first variable length coding section 164, side information coded in second variable length coding section 161 and shape coding section 157 Are multiplexed to form a transmission frame, and output to the multiplexer 153.

【0119】符号化制御部156は、レート制御部11
7からの量子化精度制御情報151をもとに、符号化被
制御部158での量子化処理段での量子化幅を調整した
り、コマ落とし制御したり、形状符号化部157の制御
をする。
The encoding control section 156 is provided for the rate control section 11
7 based on the quantization accuracy control information 151 from the encoding control unit 158, adjusts the quantization width at the quantization processing stage in the encoding controlled unit 158, controls frame dropping, and controls the shape encoding unit 157. I do.

【0120】このように、入力動画像111が入力され
た符号化被制御部158では、符号化制御部156の制
御のもとに入力動画像111中から、形状抽出部112
の与える形状情報113対応の形状領域について動き補
償フレーム予測を行い、これを可変符号化して多重化部
165に与え、また、動き補償フレーム予測情報をDC
T処理し、さらにこれを量子化した後、可変符号化して
多重化部165に与え、多重化部165は形状符号化部
157および第1の可変長符号化部164および第2の
可変長符号化部161からの出力を多重化しその多重化
出力を、マルチプレクサ153に送出する。
As described above, in the coded control unit 158 to which the input moving image 111 is input, the shape extraction unit 112 is controlled from the input moving image 111 under the control of the coding control unit 156.
Of the shape area corresponding to the shape information 113 given by the motion compensation frame prediction, variably encodes the result, and supplies the result to the multiplexing unit 165.
After performing T processing and further quantizing this, it is variably coded and provided to a multiplexing unit 165. The multiplexing unit 165 comprises a shape coding unit 157, a first variable length coding unit 164, and a second The output from the multiplexing unit 161 is multiplexed, and the multiplexed output is sent to the multiplexer 153.

【0121】また、ローカル復号化部163では、形状
抽出部112から与えられる形状情報113を参照しな
がらDCT変換係数を逆DCT変換することにより、復
号化してローカル復号化データ152として出力し、レ
ート制御部117に与える。
Further, the local decoding section 163 performs inverse DCT transform of the DCT transform coefficient with reference to the shape information 113 given from the shape extracting section 112, thereby decoding and outputting as local decoded data 152, This is given to the control unit 117.

【0122】動作概要はこのようなものであり、動き補
償フレーム間予測部159、第2の可変長符号化部16
1、DCT変換部160、ローカル復号化部163およ
び第1の可変長符号化部164では原画像(入力動画像
111)について形状情報113により指定された領域
についてのみ処理を行う。
The operation summary is as described above. The motion compensation inter-frame prediction unit 159 and the second variable length coding unit 16
1. The DCT transform unit 160, the local decoding unit 163, and the first variable length coding unit 164 perform processing only on the original image (input moving image 111) with respect to the area specified by the shape information 113.

【0123】形状情報の符号化、動き補償およびテキス
チャ符号化の方法は、例えば、ISO/IEC JTC1/SC29/WG11
N1796,"MPEG-4 Video Verfication Model Version 8.
0."July 1997 に詳しく記載されている。
Methods for encoding shape information, motion compensation and texture encoding are described in, for example, ISO / IEC JTC1 / SC29 / WG11.
N1796, "MPEG-4 Video Verfication Model Version 8.
0. "July 1997.

【0124】図8(a)の特性グラフ166と図8
(b)の特性グラフ167は、第1の実施形態での構成
における図1の単一のバッファメモリ139における滞
留量の例を示している。特性グラフ166は B(t+3)=B(t)+R1(t)−3・L1 となり、時刻t+1とt+2でコマ落しが起こってい
る。ここで、L1は単位時間当たりの伝送路へ送出され
るデータの伝送量である。
The characteristic graph 166 of FIG.
The characteristic graph 167 of (b) shows an example of the staying amount in the single buffer memory 139 of FIG. 1 in the configuration according to the first embodiment. In the characteristic graph 166, B (t + 3) = B (t) + R1 (t) −3 · L1, and frames are dropped at times t + 1 and t + 2. Here, L1 is the amount of data transmitted to the transmission path per unit time.

【0125】同様に特性グラフ167は B(t+3)=B(t)+R1(t)−3・L2 となる。Similarly, the characteristic graph 167 becomes B (t + 3) = B (t) + R1 (t) −3 · L2.

【0126】上記特性グラフ166と167の制御形態
を、第2の実施形態での構成における図6の並列符号化
方式のシステムに仮に適用してみる。オブジェクトは2
個と仮定すると、この場合、符号化部は114aと11
4bの2個の構成になり、従来のバッファメモリの制御
形態(図20)を適用すると符号化部114aと符号化
部114bについて2個のバッファメモリによる平滑化
を行う必要が生じることになる。従って、図6のシステ
ム構成の場合、バッファメモリ119で前記2個のバッ
ファメモリの平滑化を行う必要が生じる。この場合、前
記特性グラフ166と特性グラフ167をそのまま、線
形加算してバッファメモリ119で平滑化を行うと、図
8(c)に示した特性グラフ168の如きとなり、この
特性グラフ168は、式で表すと B(t+3)=B(t)+R1(t)+R2(t)−3
・L3 となる。ここで、L3はL3=L1+12としている。
また、このL3は図6におけるバッファメモリ119の
出力120で単位時間当たりの伝送路へ送出されるデー
タの伝送量になる。そして、コマ落しは時刻t+1とt
+2で発生している。
The control modes of the characteristic graphs 166 and 167 will be temporarily applied to the parallel encoding system shown in FIG. 6 in the configuration of the second embodiment. Object is 2
In this case, the encoding units 114a and 11
4b, and applying the conventional buffer memory control mode (FIG. 20), the encoding unit 114a and the encoding unit 114b need to be smoothed by the two buffer memories. Therefore, in the case of the system configuration in FIG. 6, it is necessary to smooth the two buffer memories in the buffer memory 119. In this case, if the characteristic graphs 166 and 167 are linearly added as they are and smoothed by the buffer memory 119, a characteristic graph 168 shown in FIG. 8C is obtained. B (t + 3) = B (t) + R1 (t) + R2 (t) -3
・ It becomes L3. Here, L3 is L3 = L1 + 12.
This L3 is the amount of data transmitted to the transmission line per unit time at the output 120 of the buffer memory 119 in FIG. Then, the frames are dropped at times t + 1 and t
+2.

【0127】図9(a)は特性グラフ166について目
的関数(“So1=O1[Do]”)169と画品質ト
レードオフ関数(“Ss1=G1[Ds]”)170を
示している。目的関数169とトレードオフ関数170
の交点171は時刻tで、視覚的にバランスの良い復号
画像が得られる動作点である。前記動作点については上
記の方法で求めることができる。
FIG. 9A shows an objective function (“So1 = O1 [Do]”) 169 and an image quality trade-off function (“Ss1 = G1 [Ds]”) 170 for the characteristic graph 166. Objective function 169 and trade-off function 170
Is an operating point at which a visually balanced decoded image is obtained at time t. The operating point can be obtained by the above method.

【0128】同様に図9(b)は特性グラフ167につ
いて目的関数(“So2=O2[Do]”)172と画
品質トレードオフ関数(“Ss2=G2[Ds]”)1
73を示している。目的関数172とトレードオフ関数
173の交点174は時刻tで、視覚的にバランスの良
い復号画像が得られる動作点である。そして、バッファ
メモリ119で特性グラフ166と167に従った制御
をそのまま一緒に行うようにすべく、符号化制御部15
6によりこのような制御を実行するようレート制御部1
17で制御すれば、図9における動作点171と174
が保証され、バッファメモリ119の出力120として
は、前記2つのオブジェクトにおける最適な動作点での
動画像データ出力となり、当該動画像データが通信回線
に伝送されることになる。
Similarly, FIG. 9B shows an objective function (“So2 = O2 [Do]”) 172 and an image quality trade-off function (“Ss2 = G2 [Ds])) 1 for the characteristic graph 167.
73 is shown. An intersection 174 of the objective function 172 and the trade-off function 173 is an operating point at time t at which a visually balanced decoded image is obtained. Then, the encoding control unit 15 controls the buffer memory 119 so that the control according to the characteristic graphs 166 and 167 is performed together.
6 to execute such control.
17, the operating points 171 and 174 in FIG.
Is output, and the output 120 of the buffer memory 119 is video data output at the optimal operating point for the two objects, and the video data is transmitted to the communication line.

【0129】ところで、図10(b)の特性グラフ17
6は(“オブジェクト2”)時刻tでの符号化データR
2(t)を時刻t+Lおよびt+2の2回のコマ落しを
行うことにより、通信回線に送出している。
By the way, the characteristic graph 17 in FIG.
6 is (“object 2”) encoded data R at time t
2 (t) is transmitted to the communication line by performing frame dropping twice at times t + L and t + 2.

【0130】しかし、図10(a)の特性グラフ175
(“オブジェクト2”)のように、R1(t)の値が通
常より(例えば時刻t−3など)大きく、時刻t+1、
t+2およびt+3の3回のコマ落しを行わないと時刻
tでの符号化データを通信回線に送出できず、受信側で
の動画像表示での遅延が通常より大きくなる。そして、
図6の1個のバッファメモリ119でレート制御部11
7で制御すると、図10(c)の特性グラフ177のよ
うに時刻t+1、t+2およびt+4でコマ落ちが起こ
ってしまう。
However, the characteristic graph 175 shown in FIG.
(“Object 2”), the value of R1 (t) is larger than usual (for example, time t−3), and the time t + 1,
Unless the frame is dropped three times at t + 2 and t + 3, the encoded data at the time t cannot be transmitted to the communication line, and the delay in displaying a moving image on the receiving side becomes longer than usual. And
In one buffer memory 119 of FIG.
When the control is performed by 7, the frame drop occurs at times t + 1, t + 2, and t + 4 as shown in a characteristic graph 177 of FIG.

【0131】すなわち、特性グラフ176の特性に従っ
た符号化データではコマ落しが2回で済むのに対して、
特性グラフ175の特性に従った符号化データを一緒に
してレート制御を行うようにすると、コマ落しが3回に
なってしまう。
That is, in the case of encoded data according to the characteristics of the characteristic graph 176, the number of dropped frames is only two, whereas
If the encoded data according to the characteristics of the characteristic graph 175 are subjected to the rate control together, the number of dropped frames becomes three.

【0132】そこで、図6のレート制御部117で特性
グラフ175および特性グラフ176の特性に従った符
号化データについて、まとめて制御する場合には、以下
のように行う。
Therefore, when the encoded data according to the characteristics of the characteristic graph 175 and the characteristic graph 176 are collectively controlled by the rate control unit 117 in FIG. 6, the following is performed.

【0133】まず、優先度の高い“オブジェクト1”
(特性グラフ175)の符号化データについては一時的
に時刻tのとき量子化精度を上げ画品質を良くし、符号
化データR1(t)を大きくしてR1′(t)とし、バ
ッファメモリ119から回線に対するデータ伝送量をL
1からL1′に上げて(特性グラフ178)、コマ落し
の回数を時刻t+1とt+2の2回に減少させる。
First, “object 1” having a high priority
For the encoded data of the (characteristic graph 175), the quantization precision is temporarily increased at time t to improve the image quality, the encoded data R1 (t) is increased to R1 '(t), and the buffer memory 119 is used. From the data transmission amount to the line
From 1 to L1 '(characteristic graph 178), the number of dropped frames is reduced to two times t + 1 and t + 2.

【0134】一方、優先度の低い“オブジェクト2”
(特性グラフ176)の符号化データについては一時的
に時刻tのときに符号化データR2(t)を小さくして
R2′(t)とし、量子化精度を下げて画品質を劣化さ
せるのと同時に、バッファメモリ119から回線に対す
るデータ伝送量をL2からL2′に下げる(特性グラフ
179)。
On the other hand, “object 2” having a low priority
Regarding the encoded data of the (characteristic graph 176), at time t, the encoded data R2 (t) is temporarily reduced to R2 ′ (t), and the quantization precision is reduced to degrade the image quality. At the same time, the amount of data transmitted from the buffer memory 119 to the line is reduced from L2 to L2 '(characteristic graph 179).

【0135】上記の“オブジェクト1”と“オブジェク
ト2”による符号化データは図6のバッファメモリ11
9に格納されて個別に行った上記のレート制御と同様に
レート制御部117でまとめて制御する。図11(c)
は特性グラフ178と特性グラフ179の符号化データ
を加算した場合で、バッファメモリ119の伝送量の滞
留状態の時間的変化を示している。
The coded data of the above “Object 1” and “Object 2” is stored in the buffer memory 11 of FIG.
9 and are collectively controlled by the rate control unit 117 in the same manner as the above-described rate control individually performed. FIG. 11 (c)
Represents the temporal change in the stagnant state of the transmission amount of the buffer memory 119 when the encoded data of the characteristic graph 178 and the encoded data of the characteristic graph 179 are added.

【0136】すなわち、フレーム時刻tの時点での符号
化データの量を、R1(t)+R2(t)からR1′
(t)+R2′(t)に下げ、通信回線の単位時間当た
りデータ伝送量はL3として、変化しないようにしてい
る。
That is, the amount of encoded data at the frame time t is calculated from R1 (t) + R2 (t) to R1 '.
(T) + R2 '(t), and the data transmission amount per unit time of the communication line is set to L3 so as not to change.

【0137】以上のように、優先度の高いオブジェクト
でコマ落しが多く発生する可能性がある場合、そのオブ
ジェクトについては量子化精度を変えることで符号化デ
ータ量を変え、同時に通信回線の単位時間当たりのデー
タ伝送量を大きくする。
As described above, when there is a possibility that many frames are dropped in an object having a high priority, the amount of coded data is changed for the object by changing the quantization accuracy, and at the same time, the unit time of the communication line is changed. Increase the amount of data transmission per unit.

【0138】一方、優先度の低いオブジェクトについて
は同時刻で量子化精度を下げ、符号化データ量を少なく
し、同時に通信回線の単位時間当たりのデータ伝送量を
下げる。
On the other hand, for objects with low priorities, the quantization accuracy is reduced at the same time, the amount of coded data is reduced, and at the same time, the data transmission amount per unit time of the communication line is reduced.

【0139】このように制御することで、複数のオブジ
ェクトを1つのバッファメモリでまとめて管理する場合
に、全体として、コマ落しを少なくすることができる。
By performing such control, when a plurality of objects are collectively managed in one buffer memory, the number of dropped frames can be reduced as a whole.

【0140】また、符号化処理を“オブジェクト1”に
ついては特性グラフ175から特性グラフ178に、
“オブジェクト2”については特性グラフ176から特
性179の特性に変更する場合に、以下の視覚的に最適
な動作点を満足するように変える。
For the encoding process of “object 1”, the characteristic graph 175 changes to the characteristic graph 178.
When changing the characteristic of the “object 2” from the characteristic graph 176 to the characteristic of the characteristic 179, the characteristic is changed so as to satisfy the following visually optimum operating point.

【0141】図12(a)における“オブジェクト1”
においては、目的関数が181で、特性グラフ175の
場合ではトレードオフ関数が182、そして、動作点は
184の場合に、視覚的に最適な動作点が得られた。し
かし、特性グラフ178に移動するとトレードオフ関数
は183になり、視覚的に最適な動作点は185に移動
する。
"Object 1" in FIG.
In, when the objective function is 181, the trade-off function is 182 in the case of the characteristic graph 175, and the operating point is 184, a visually optimum operating point is obtained. However, when moving to the characteristic graph 178, the trade-off function becomes 183, and the visually optimum operating point moves to 185.

【0142】すなわち、動作点185は動作点184に
比べて、よりSN比が良くなり、符号化率も大きくなっ
ているから、画質が一時的に向上したことを示してい
る。
That is, the operating point 185 has a higher SN ratio and a higher coding rate than the operating point 184, indicating that the image quality has been temporarily improved.

【0143】一方、図12(b)における“オブジェク
ト2”についてみてみると目的関数は188で、特性グ
ラフ176ではトレードオフ関数が187、そして、動
作点が190の場合に、視覚的に最適な動作点であっ
た。しかし、特性グラフ179に移動するとトレードオ
フ関数は186になり、視覚的に最適な動作点は189
に移動する。すなわち、動作点189は動作点190に
比べてよりSN比が劣化し、符号化率も小さくなってい
るから、画質が一時的に劣化したことを示している。
On the other hand, looking at “object 2” in FIG. 12B, the objective function is 188, the trade-off function is 187 in the characteristic graph 176, and the operating point is 190. It was an operating point. However, when moving to the characteristic graph 179, the trade-off function becomes 186, and the visually optimal operating point is 189.
Go to In other words, the operating point 189 indicates that the image quality has temporarily deteriorated because the SN ratio has deteriorated and the coding rate has decreased as compared with the operating point 190.

【0144】以上のように、“オブジェクト1”と“オ
ブジェクト2”は予め決められたレートに収まるように
配分して符号化処理を行うべく、レート制御部117で
符号化制御部156により制御するようすれば、図6の
構成におけるバッファメモリ119でも、各オブジェク
ト個別に行っていたレート制御を、まとめて行うことが
可能である。そして、各オブジェクトのレート制御は、
各オブジェクトに最適な目的関数とトレードオフ関数と
の交点による動作点で行うようにすることにより、視覚
的に最適な動作点になる。
As described above, the "object 1" and the "object 2" are controlled by the encoding control unit 156 in the rate control unit 117 so as to distribute the encoding so as to be within a predetermined rate and perform the encoding process. In this way, the rate control that has been performed individually for each object can also be collectively performed in the buffer memory 119 in the configuration of FIG. And the rate control of each object is
By performing the operation at the intersection of the optimal objective function and the trade-off function for each object, the operation point becomes visually optimal.

【0145】しかし、優先度の高い“オブジェクト1”
が一時的に符号化量が多くなり、コマ落しが多くなると
推定される場合には、その時刻におけるそのオブジェク
トの符号化データ量R′及びそのオブジェクトについて
の単位時間当たりのデータ伝送量L′を変えることによ
り、画品質を向上させ、コマ落しの回数を減らすことが
できる。
However, “object 1” having a high priority
If it is estimated that the amount of coding temporarily increases and the number of dropped frames increases, the coded data amount R ′ of the object at that time and the data transmission amount L ′ per unit time of the object are calculated. By changing, the image quality can be improved and the number of dropped frames can be reduced.

【0146】一方、優先度の低いオブジェクトは前記時
刻にそのオブジェクトの符号化データ量R′及びそのオ
ブジェクトの単位時間当たりのデータ伝送量L′を変え
て画品質を下げるようにする。このケースでは、“オブ
ジェクト1”と“オブジェクト2”を1つのバッファメ
モリで一緒に管理する場合に、コマ落しの回数が増えな
いと云う特徴がある。
On the other hand, for an object with a low priority, the picture quality is lowered by changing the coded data amount R 'of the object and the data transmission amount L' of the object per unit time at the time. In this case, when "object 1" and "object 2" are managed together in one buffer memory, the feature is that the number of dropped frames does not increase.

【0147】このことについて、説明する。This will be described.

【0148】図13(a)において、“オブジェクト
1”の符号化量R1は特性グラフ191で示している。
コマ落しは時刻t+1とt+2の時点の計2回、起きて
いる。そして、“オブジェクト2”についてはその符号
化量R2は図14(b)に特性グラフ192で示す如き
であって、この図の特性グラフ192で示しているよう
に、コマ落しは時刻t+1の時点、時刻t+2の時点お
よび時刻t+3の時点の計3回、起きている。
In FIG. 13A, the encoding amount R 1 of “object 1” is shown by a characteristic graph 191.
The frame drop has occurred twice in total at the times t + 1 and t + 2. The encoding amount R2 of “object 2” is as shown by a characteristic graph 192 in FIG. 14B, and as shown in the characteristic graph 192 of FIG. , Three times at time t + 2 and at time t + 3.

【0149】従って、“オブジェクト1”と“オブジェ
クト2”の符号化処理を1つのバッファメモリで管理す
ると、特性グラフ193のようにコマ落しが時刻t+1
の時点、時刻t+2の時点および時刻t+3の時点の計
3回起きてしまう。
Therefore, if the encoding processing of “Object 1” and “Object 2” is managed by one buffer memory, the frame drop occurs at time t + 1 as shown in the characteristic graph 193.
, The time t + 2, and the time t + 3, a total of three times.

【0150】そこで、本発明では図14(a),(b)
のように“オブジェクト1”はそのままで、優先度の低
い“オブジェクト2”について、時刻tでの符号化量を
R2(t)からR2′(t)に減少させる(特性グラフ
194)。“オブジェクト1”と“オブジェクト2”に
ついて、1つのバッファメモリでまとめて管理する場合
に、符号化制御部156によりこのような制御を実行す
るようレート制御部117で制御すれば、バッファメモ
リの滞留量を示す特性グラフは図14(c)に示す19
5の如きになり、コマ落しは時刻t+1の時点と時刻t
+2の時点の計2回に減少する。
Therefore, in the present invention, FIGS. 14 (a) and 14 (b)
, The encoding amount at time t is reduced from R2 (t) to R2 ′ (t) for “object 2” having a low priority (characteristic graph 194). When the “object 1” and the “object 2” are collectively managed in one buffer memory, if the encoding control unit 156 controls the rate control unit 117 to execute such control, the buffer memory can be stored. A characteristic graph showing the amount is shown in FIG.
5 and the frame drop occurs at the time t + 1 and the time t
It is reduced to a total of two times at the time of +2.

【0151】そして、この場合での目的関数とトレード
オフ関数との関係は、図15のようになる。すなわち、
図15(a)に示すように、“オブジェクト1”につい
ては目的関数196とトレードオフ関数197の関係は
変わらず、視覚的に最適な動作点は198になる。しか
し、“オブジェクト2”に関しては時刻tの時点で符号
化量を減らしたため、図15(b)に示すように、トレ
ードオフ関数が200から201に移動し、従って、視
覚的に最適な動作点は203に移動し、SNと符号化率
が劣化したことになる。
FIG. 15 shows the relationship between the objective function and the trade-off function in this case. That is,
As shown in FIG. 15A, the relation between the objective function 196 and the trade-off function 197 for “Object 1” does not change, and the visually optimum operating point is 198. However, as for the “object 2”, the coding amount was reduced at the time t, so that the trade-off function moved from 200 to 201 as shown in FIG. Has moved to 203, which means that the SN and the coding rate have deteriorated.

【0152】図16は本発明システムにおけるバッファ
メモリ119でのデータ滞留量を示している。図16
(a)における“オブジェクト1”のバッファメモリ滞
留量の特性グラフ204と、図16(b)における“オ
ブジェクト2”のバッファメモリ滞留量の特性グラフ2
05は、共に時刻t+1の時点、時刻t+2の時点およ
び時刻t+3の時点の計3回、コマ落しが起きている。
従って、“オブジェクト1”と“オブジェクト2”につ
いて一つのバッファメモリで管理した場合、バッファメ
モリ滞留量の変化は図16(c)に示す特性グラフ20
6の如きとなり、時刻t+1、t+2およびt+3の各
時点の計3回、コマ落しが起きる。
FIG. 16 shows the amount of data staying in the buffer memory 119 in the system of the present invention. FIG.
A characteristic graph 204 of the buffer memory retention amount of “Object 1” in (a) and a characteristic graph 2 of the buffer memory retention amount of “Object 2” in FIG.
In the case of 05, the frame drop occurs three times in total at the time t + 1, the time t + 2, and the time t + 3.
Accordingly, when “object 1” and “object 2” are managed by one buffer memory, the change in the buffer memory staying amount is changed by the characteristic graph 20 shown in FIG.
6, and a frame drop occurs three times at each of the times t + 1, t + 2, and t + 3.

【0153】そこで、図17(a)のように特性グラフ
204に関しては符号化データの量R1′(t)と、単
位時間当たりのデータ伝送量L1′を大きくして画品質
を向上させながら特性グラフ207の如きにしてコマ落
しを時刻t+1とt+2の時点の計2回に減らす。
Therefore, as shown in FIG. 17A, regarding the characteristic graph 204, the encoded data amount R1 '(t) and the data transmission amount L1' per unit time are increased to improve the image quality. As shown in a graph 207, the number of dropped frames is reduced to a total of two times at times t + 1 and t + 2.

【0154】図17(b)の特性グラフ205に関して
は、符号化データの量R2′(t)と、単位時間当たり
のデータ伝送量L2′を小さくして画品質を劣化させ、
特性グラフ208の如きにしてコマ落しを時刻t+1と
t+2の時点の計2回に減らす。
Regarding the characteristic graph 205 of FIG. 17B, the encoded data amount R2 '(t) and the data transmission amount L2' per unit time are reduced to degrade image quality.
As shown in the characteristic graph 208, the number of dropped frames is reduced to a total of two times at times t + 1 and t + 2.

【0155】従って、図17(a)の特性グラフ207
と図17(b)の特性グラフ208の動作について1個
のバッファメモリ119で管理すべく、符号化制御部1
56によりこのような制御を実行するようレート制御部
117で制御すれば、バッファメモリ119のデータ滞
留量の特性グラフは図17(c)における209の如き
となり、コマ落しが時刻t+1とt+2の時点の計2回
に減少する。
Therefore, the characteristic graph 207 of FIG.
In order to manage the operation of the characteristic graph 208 of FIG.
If the control is performed by the rate control unit 117 to execute such control by 56, the characteristic graph of the data retention amount in the buffer memory 119 is as shown in 209 in FIG. To a total of two times.

【0156】この場合に、目的関数とトレードオフ関数
の関係を考えてみると、図18に示す如きとなる。すな
わち、この場合、“オブジェクト1”は図18(a)に
示すように、トレードオフ関数が210から211に移
動したことになり、動作点が213から214に移動
し、SN比と符号化率が上昇したことになる。
FIG. 18 shows the relationship between the objective function and the trade-off function in this case. That is, in this case, as shown in FIG. 18A, the trade-off function of “Object 1” has shifted from 210 to 211, the operating point has shifted from 213 to 214, and the S / N ratio and coding rate have been changed. Has risen.

【0157】一方、“オブジェクト2”に関しては図1
8(b)に示すように、トレードオフ関数が216から
217に移動したことになり、動作点が218から21
9に移動し、SN比と符号化率が低下したことになる。
On the other hand, regarding “Object 2”, FIG.
As shown in FIG. 8B, the trade-off function has moved from 216 to 217, and the operating point has changed from 218 to 21.
9, the SN ratio and the coding rate are reduced.

【0158】このように、第2の実施形態においては、
複数のオブジェクトがある場合に、各オブジェクトは予
め決められたレートに収まるように符号化処理を行うべ
く、レート制御部117で符号化制御部156により制
御するようしたことで、一つのバッファメモリしかない
場合でも各オブジェクト個別に行っていたレート制御
を、まとめて行うことができるようにしたものであり、
各オブジェクトのレート制御は、各オブジェクトに最適
な目的関数とトレードオフ関数との交点による動作点で
行うようにすることで、視覚的に最適な動作点になるよ
うに制御できるようになるものである。
As described above, in the second embodiment,
When there are a plurality of objects, each object is controlled by the encoding control unit 156 by the rate control unit 117 in order to perform the encoding process so as to be within a predetermined rate, so that only one buffer memory is used. Even if there is no object, the rate control that had been performed individually for each object can now be performed collectively,
By controlling the rate of each object at the operating point at the intersection of the optimal objective function and trade-off function for each object, it becomes possible to control the visually optimal operating point. is there.

【0159】また、優先度の高いオブジェクトが一時的
に符号化量が多くなって、コマ落しが多くなると推定さ
れるシーンの場合には、その時刻におけるそのオブジェ
クトの符号化データ量R′及びそのオブジェクトについ
ての単位時間当たりのデータ伝送量L′を変えるように
し、これにより、画品質を向上させ、コマ落しの回数を
減らすことができるようにし、他方、優先度の低いオブ
ジェクトは前記時刻にそのオブジェクトの符号化データ
量R′及びそのオブジェクトの単位時間当たりのデータ
伝送量L′を小さくして画品質を下げるように制御する
ことで、コマ落しの回数が増えないように制御できるも
のである。
In the case of a scene in which an object with a high priority is temporarily estimated to have a large amount of coding and a large number of dropped frames, the coded data amount R 'of the object at that time and its coded data amount R' By changing the data transmission amount L 'per unit time for the object, the image quality can be improved and the number of dropped frames can be reduced, while the low priority object is set at the time. By controlling the encoded data amount R 'of the object and the data transmission amount L' of the object per unit time to reduce the image quality, it is possible to control the number of dropped frames so as not to increase. .

【0160】なお、以上の説明は通信回線が固定レート
で、各オブジェクトに対して予め初期にビットを配分を
していて、基本的には各オブジェクトも定レートになっ
ている。そして、符号化の前段階でオブジェクトの内、
あるオブジェクトがアクティブになり、そのオブジェク
トの影響で通信回線に送出されるビットストリュームに
対してコマ落しが多く発生すると推定された場合に、優
先度の高いオブジェクトの画品質を落さず、または向上
させるように各オブジェクトの間でビットの移動をさせ
て、前記通信回線に送出されるビットストリュームに対
するコマ落しも減少させる。そして、各オブジェクトの
符号化処理の過程で、符号化率に応じたコマ落しによる
時間的歪みと量子化精度による空間的歪みとのバランス
がとれ、視覚特性上最適な動作点で符号化処理を行うこ
とを目的としている。
In the above description, the communication line has a fixed rate, bits are initially allocated to each object in advance, and basically each object has a constant rate. And, before the encoding,
If an object is activated and it is estimated that many drop frames occur for the bitstream transmitted to the communication line due to the effect of the object, the image quality of the high-priority object is not reduced, or By moving bits between each object so as to improve, the drop of frames for the bit stream transmitted to the communication line is also reduced. In the process of encoding each object, the temporal distortion due to frame drop according to the encoding rate and the spatial distortion due to quantization accuracy are balanced, and the encoding process is performed at the optimal operating point in terms of visual characteristics. It is intended to do.

【0161】しかし、本発明の適用対象は通信回線が定
レートに限定されるものではない。例えば、無線回線の
ように伝送エラーが頻繁に発生し、実質的に伝送レート
が変化するような通信回線、あるいはATM通信のよう
に可変レート通信回線にも適用できる。
However, the application of the present invention is not limited to a communication line having a constant rate. For example, the present invention can be applied to a communication line in which a transmission error frequently occurs and a transmission rate substantially changes like a wireless line, or a variable rate communication line such as an ATM communication.

【0162】可変レート通信回線の場合、回線のレート
変動の都度、各オブジェクトのビット配分を変える。配
分方法として、優先度の高いオブジェクトと低いオブジ
ェクトについて、配分比率で決める方法がある。また、
優先度の高いオブジェクトの配分ビットを一定とするこ
とで、常時一定の画品質を確保できるようにして、残り
のビットを優先度の低いオブジェクトに配分する方法が
ある。
In the case of a variable rate communication line, the bit allocation of each object is changed each time the line rate changes. As an allocation method, there is a method of determining an object having a high priority and an object having a low priority by an allocation ratio. Also,
There is a method of distributing the remaining bits to low-priority objects by keeping the distribution bits of the high-priority objects constant to ensure a constant image quality at all times.

【0163】上記の方法により各オブジェクトに配分し
たビットから、本発明の方法により、更に通信回線に送
出されるビットストリュームでのコマ落しを減少させ、
且つ優先度の高いオブジェクトの画品質の維持あるいは
向上させるように、各オブジェクトのビット配分を行
い、符号化を実施する。そして、各オブジェクトの符号
化処理の過程で、符号化率に応じたコマ落しによる時間
的歪みと量子化精度による空間的歪みとのバランスがと
れ、視覚特性上最適な動作点で符号化処理を行うこと
で、可変レート通信回線でも、各オブジェクトの動画像
についてバランスのとれた表示が可能となる。
From the bits allocated to each object by the above method, the method of the present invention further reduces the drop of frames in the bit stream transmitted to the communication line,
In addition, bits are allocated to each object and coding is performed so as to maintain or improve the image quality of objects with high priority. In the process of encoding each object, the temporal distortion due to frame drop according to the encoding rate and the spatial distortion due to quantization accuracy are balanced, and the encoding process is performed at the optimal operating point in terms of visual characteristics. By doing so, a well-balanced display of the moving image of each object is possible even with a variable rate communication line.

【0164】尚、本発明は上述した実施形態に限定され
るものではなく、種々変形して実施可能である。また、
本発明の実施形態に記載した手法は、コンピュータに実
行させることのできるプログラムとして、磁気ディスク
(フロッピーディスク、ハードディスクなど)、光ディ
スク(CD−ROM、DVDなど)、半導体メモリなど
の記録媒体に格納して頒布することもできる。
Note that the present invention is not limited to the above-described embodiments, and can be implemented with various modifications. Also,
The method described in the embodiment of the present invention is stored in a recording medium such as a magnetic disk (floppy disk, hard disk, etc.), an optical disk (CD-ROM, DVD, etc.), a semiconductor memory, or the like as a program that can be executed by a computer. Can also be distributed.

【0165】[0165]

【発明の効果】以上、詳述したように本発明は、複数オ
ブジェクトの動画像を符号化した画像データを多重化し
て通信回線に送出するシステムにおいて、オブジェクト
の符号化の際に優先度をつけ、符号化の際に全体として
コマ落しが多くなると推定されたとき、オブジェクト間
で配分ビットを移動させ、優先度の高いオブジェクトの
画品質を維持、且つ、向上させるようにし、そして、各
オブジェクトの符号化処理の過程で、符号化率に応じた
コマ落しによる時間的歪みと量子化精度のよる空間的歪
みとのバランスがとれ、視覚特性上最適な動作点で符号
化処理が行えるようにしたものであり、これにより、各
オブジェクトについて再生側ではバランスのとれた再生
画像の表示が可能となる。
As described above in detail, according to the present invention, in a system for multiplexing image data obtained by encoding moving images of a plurality of objects and transmitting the multiplexed image data to a communication line, priorities are set at the time of object encoding. When it is estimated that the number of dropped frames is increased as a whole during encoding, the allocation bits are moved between the objects to maintain and improve the image quality of the high-priority object, and In the course of the encoding process, the temporal distortion due to frame drop according to the encoding rate and the spatial distortion due to the quantization accuracy are balanced, and the encoding process can be performed at the optimal operating point in terms of visual characteristics. Thus, a balanced reproduced image can be displayed on the reproducing side for each object.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明を説明するための図であって、本発明に
おける第1の実施形態である矩形画面に表示させるため
の符号化方式を説明するための構成図。
FIG. 1 is a diagram for explaining the present invention, and is a configuration diagram for explaining an encoding method for displaying on a rectangular screen according to a first embodiment of the present invention.

【図2】本発明を説明するための図であって、本発明に
おける第1の実施形態である矩形画面に表示させるため
の符号化方式でのバッファメモリのデータ滞留量を示し
たグラフの一例。
FIG. 2 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount of a buffer memory in an encoding method for displaying on a rectangular screen according to the first embodiment of the present invention; .

【図3】本発明を説明するための図であって、本発明に
おける第1の実施形態である矩形画面に表示させるため
の符号化方式での画品質を定義する目的関数とトレード
オフ関数を示したグラフの一例。
FIG. 3 is a diagram for explaining the present invention, and illustrates an objective function and a trade-off function that define image quality in an encoding method for displaying on a rectangular screen according to the first embodiment of the present invention. An example of the graph shown.

【図4】本発明を説明するための図であって、本発明に
おける第1の実施形態である矩形画面に表示させるため
の符号化方式での画品質を定義するトレードオフ関数を
示したグラフの一例。
FIG. 4 is a diagram for explaining the present invention, and is a graph showing a trade-off function that defines image quality in an encoding method for displaying on a rectangular screen according to the first embodiment of the present invention. An example.

【図5】本発明を説明するための図であって、本発明に
おける第1の実施形態である矩形画面に表示させるため
の符号化方式での画品質を定義する符号化率と量子化精
度の関係を示したグラフの一例。
FIG. 5 is a diagram for explaining the present invention, and shows a coding rate and a quantization accuracy that define image quality in a coding method for displaying on a rectangular screen according to the first embodiment of the present invention. 6 is an example of a graph showing the relationship.

【図6】本発明を説明するための図であって、本発明に
おける第2の実施形態である複数オブジェクトの符号化
方式の構成図。
FIG. 6 is a diagram for explaining the present invention, and is a configuration diagram of an encoding method for a plurality of objects according to a second embodiment of the present invention.

【図7】本発明を説明するための図であって、本発明に
おける第2の実施形態である複数オブジェクトの符号化
方式での符号化部の構成図。
FIG. 7 is a diagram for explaining the present invention, and is a configuration diagram of an encoding unit in a multi-object encoding method according to a second embodiment of the present invention.

【図8】本発明を説明するための図であって、本発明に
おける第2の実施形態である複数オブジェクトの符号化
方式でのバッファメモリのデータ滞留量を示したグラフ
の一例。
FIG. 8 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図9】本発明を説明するための図であって、本発明に
おける第2の実施形態である複数オブジェクトの符号化
方式での各オブジェクトの目的関数とトレードオフ関数
を示したグラフの一例。
FIG. 9 is a diagram for explaining the present invention, and is an example of a graph showing an objective function and a trade-off function of each object in a multi-object encoding method according to the second embodiment of the present invention.

【図10】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式でのバッファメモリのデータ滞留量を示したグラ
フの一例。
FIG. 10 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図11】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式でのバッファメモリのデータ滞留量を示したグラ
フの一例。
FIG. 11 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図12】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式での各オブジェクトの目的関数とトレードオフ関
数を示したグラフの一例。
FIG. 12 is a diagram for explaining the present invention, and is an example of a graph showing an objective function and a trade-off function of each object in a multi-object encoding method according to the second embodiment of the present invention.

【図13】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式でのバッファメモリのデータ滞留量を示したグラ
フの一例。
FIG. 13 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図14】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式でのバッファメモリのデータ滞留量を示したグラ
フの一例。
FIG. 14 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図15】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式での各オブジェクトの目的関数とトレードオフ関
数を示したグラフの一例。
FIG. 15 is a diagram for explaining the present invention, and is an example of a graph showing an objective function and a trade-off function of each object in the encoding method of a plurality of objects according to the second embodiment of the present invention.

【図16】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式でのバッファメモリのデータ滞留量を示したグラ
フの一例。
FIG. 16 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図17】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式でのバッファメモリのデータ滞留量を示したグラ
フの一例。
FIG. 17 is a diagram for explaining the present invention, and is an example of a graph showing a data retention amount in a buffer memory in a multi-object encoding method according to the second embodiment of the present invention.

【図18】本発明を説明するための図であって、本発明
における第2の実施形態である複数オブジェクトの符号
化方式での各オブジェクトの目的関数とトレードオフ関
数を示したグラフの一例。
FIG. 18 is a diagram for explaining the present invention, and is an example of a graph showing an objective function and a trade-off function of each object in a multi-object encoding method according to the second embodiment of the present invention.

【図19】従来のオブジェクトに分割された動画像を表
示させる方式の構成図。
FIG. 19 is a configuration diagram of a conventional method of displaying a moving image divided into objects.

【図20】従来のオブジェクトに分割された動画像を表
示させる方式での詳細な構成図。
FIG. 20 is a detailed configuration diagram of a conventional method of displaying a moving image divided into objects.

【符号の説明】[Explanation of symbols]

111…入力動画像 112…形状抽出部 114,114a,144b,〜144n…符号化部 117…レート制御部 119…バッファメモリ 121…多重化部 124、156…符号化制御部 128…符号化部 129,159…動き補償フレーム間予測部 130,160…DCT変換部 131,161…第2の可変長符号化部 133,162…量子化部 134,163…ローカル復号化部 135,164…第1の可変長符号化部 137,165…多重化部 139…バッファメモリ 153…マルチプレクサ 157…形状符号化部 158…符号化被制御部 Reference numeral 111: input moving image 112: shape extraction unit 114, 114a, 144b, to 144n: encoding unit 117: rate control unit 119: buffer memory 121: multiplexing unit 124, 156: encoding control unit 128 , 159... Motion-compensated inter-frame predictors 130 and 160... DCT converters 131 and 161... Second variable-length encoders 133 and 162. Variable length coding units 137, 165: Multiplexing unit 139: Buffer memory 153: Multiplexer 157: Shape coding unit 158: Coding controlled unit

───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5C052 AA17 AB04 DD04 GA01 GA07 GA08 GB06 GC05 GC07 GF06 5C059 KK01 LB07 MA00 MA05 MA23 MB01 MB14 MB16 MC11 ME02 NN01 NN21 NN28 NN43 PP04 RB01 RB18 RC16 RC19 SS07 SS20 TA07 TA46 TB18 TC03 TC10 TC14 TC15 TC37 TC47 TD11 TD16 UA02 UA32 UA38 UA39  ──────────────────────────────────────────────────続 き Continued on the front page F term (reference) 5C052 AA17 AB04 DD04 GA01 GA07 GA08 GB06 GC05 GC07 GF06 5C059 KK01 LB07 MA00 MA05 MA23 MB01 MB14 MB16 MC11 ME02 NN01 NN21 NN28 NN43 PP04 RB01 RB18 RC16 RC19 SS07 SS20 TC07 TB46 TC14 TC15 TC37 TC47 TD11 TD16 UA02 UA32 UA38 UA39

Claims (7)

【特許請求の範囲】[Claims] 【請求項1】画面が複数のオブジェクトで構成される動
画像を、オブジェクト単位で符号化し、これら複数のオ
ブジェクトの各符号化データを多重化して通信回線に送
出する画像符号化装置において、 オブジェクトを符号化する手段であって、対象とするオ
ブジェクトについて与えられた画品質の優先度対応に前
記多重化を行うためのビットレートの配分値とが設定さ
れ、配分されたビットレートに見合う発生符号量で前記
対象のオブジェクトを符号化する符号化手段と、 前記オブジェクトを符号化する過程で高アクティビティ
なオブジェクトが発生した場合、前記優先度の高いオブ
ジェクトの画品質を落さず、または向上させるように前
記オブジェクトの間で前記ビットレートを再配分させる
べく、符号化手段のビットレート配分を設定制御する制
御手段とを具備することを特徴とする画像符号化装置。
An image encoding apparatus for encoding a moving image whose screen is composed of a plurality of objects in units of objects, multiplexing each encoded data of the plurality of objects, and transmitting the multiplexed data to a communication line. Means for encoding, wherein a distribution value of a bit rate for performing the multiplexing is set in accordance with a priority of a given image quality for a target object, and a generated code amount corresponding to the allocated bit rate. Encoding means for encoding the target object, and when an object with high activity occurs in the process of encoding the object, the image quality of the high-priority object is not reduced or improved. Set the bit rate distribution of the encoding means to redistribute the bit rate among the objects Image encoding device characterized by comprising a Gosuru control means.
【請求項2】前記制御手段には、前記各オブジェクトを
フレーム毎に符号化する際に、符号化率に応じたコマ落
しによる時間歪みと量子化精度による空間的な歪みとの
バランスがとれた視覚特性上最適な動作点を確保すべ
く、ビットレート配分を設定制御する機能を更に具備す
ることを特徴とする請求項1記載の画像符号化装置。
2. The encoding device according to claim 1, wherein, when encoding each of the objects on a frame-by-frame basis, a balance between temporal distortion due to frame drop according to a coding rate and spatial distortion due to quantization accuracy is achieved. 2. The image encoding apparatus according to claim 1, further comprising a function of setting and controlling a bit rate distribution so as to secure an optimum operating point in terms of visual characteristics.
【請求項3】前記制御手段には、前記オブジェクトの間
で前記ビットレートを移動させる過程で、前記通信回線
に送出する符号化データ全体で時間的歪みが少なくなる
よう、前記ビットレートの配分を設定制御する機能を更
に具備することを特徴とする請求項1記載の画像符号化
装置。
3. The control means according to claim 1, wherein, in the step of moving the bit rate between the objects, the bit rate distribution is controlled so that temporal distortion is reduced in the entire coded data transmitted to the communication line. 2. The image encoding apparatus according to claim 1, further comprising a function of performing setting control.
【請求項4】画面が複数のオブジェクトで構成される動
画像を、オブジェクト単位で符号化し、これら複数のオ
ブジェクトの各符号化データを多重化して通信回線に送
出する画像符号化方法において、 オブジェクトを符号化すると共に、対象とするオブジェ
クトについて、そのオブジェクトの画品質の優先度対応
に前記多重化を行うための与えられたビットレートの配
分値相当となる発生符号量で前記対象のオブジェクトを
符号化する符号化ステップと、 前記オブジェクトを符号化する過程で高アクティビティ
なオブジェクトが発生した場合、前記優先度の高いオブ
ジェクトの画品質を落さず、または向上させるように前
記オブジェクトの間で前記ビットレートを再配分させる
べく、符号化ステップのビットレート配分を設定制御す
る制御ステップとを具備することを特徴とする画像符号
化方法。
4. An image encoding method for encoding a moving image whose screen is composed of a plurality of objects on an object basis, multiplexing each encoded data of the plurality of objects, and transmitting the multiplexed data to a communication line. In addition to encoding, for the target object, the target object is encoded with a generated code amount corresponding to a given bit rate distribution value for performing the multiplexing in accordance with the priority of the image quality of the object. Encoding step, when a high activity object occurs in the process of encoding the object, the bit rate between the objects so as not to reduce or improve the image quality of the high priority object To set and control the bit rate distribution of the encoding step to redistribute Picture coding method characterized by comprising the steps.
【請求項5】前記制御ステップには、前記各オブジェク
トをフレーム毎に符号化する際に、符号化率に応じたコ
マ落しによる時間歪みと量子化精度による空間的な歪み
とのバランスがとれた視覚特性上最適な動作点を確保す
べく、ビットレート配分を設定制御する機能を更に具備
することを特徴とする請求項4記載の画像符号化方法。
5. In the control step, when each of the objects is encoded for each frame, a balance between time distortion due to frame drop according to a coding rate and spatial distortion due to quantization accuracy is achieved. 5. The image encoding method according to claim 4, further comprising a function of setting and controlling bit rate distribution so as to secure an optimal operating point in terms of visual characteristics.
【請求項6】前記制御ステップには、前記オブジェクト
の間で前記ビットレートを移動させる過程で、前記通信
回線に送出する符号化データ全体で時間的歪みが少なく
なるよう、前記ビットレートの配分を設定制御する機能
を更に具備することを特徴とする請求項4記載の画像符
号化方法。
6. The method according to claim 1, wherein, in the step of moving the bit rate between the objects, the bit rate is distributed so that temporal distortion is reduced in the entire coded data transmitted to the communication line. The image encoding method according to claim 4, further comprising a function of performing setting control.
【請求項7】画面が複数のオブジェクトで構成される動
画像を、オブジェクト単位で符号化し、これら複数のオ
ブジェクトの各符号化データを多重化して通信回線に送
出する画像符号化プログラムであって、 オブジェクトを符号化すると共に、対象とするオブジェ
クトについて、そのオブジェクトの画品質の優先度対応
に前記多重化を行うための与えられたビットレートの配
分値相当となる発生符号量で前記対象のオブジェクトを
符号化する符号化ステップと、 前記オブジェクトを符号化する過程で高アクティビティ
なオブジェクトが発生した場合、前記優先度の高いオブ
ジェクトの画品質を落さず、または向上させるように前
記オブジェクトの間で前記ビットレートを再配分させる
べく、符号化ステップのビットレート配分を設定制御す
る制御ステップと、を具備することを特徴とするコンピ
ュータで読み取り可能で、且つ、実行可能なプログラム
を記録した媒体。
7. An image encoding program for encoding a moving image whose screen is composed of a plurality of objects on an object basis, multiplexing each encoded data of the plurality of objects, and transmitting the multiplexed data to a communication line, Along with encoding the object, for the target object, the target object is generated with a generated code amount equivalent to a given bit rate distribution value for performing the multiplexing in accordance with the priority of the image quality of the object. An encoding step of encoding, and when a high activity object occurs in the process of encoding the object, the object quality is reduced between the objects so as not to reduce or improve the image quality of the high priority object. Set and control the bit rate distribution of the encoding step to redistribute the bit rate. Control and step, readable by a computer, characterized by comprising, and, a medium recording an executable program.
JP25541098A 1998-09-09 1998-09-09 Image encoding device, image encoding method, and medium recording program Pending JP2000092489A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP25541098A JP2000092489A (en) 1998-09-09 1998-09-09 Image encoding device, image encoding method, and medium recording program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25541098A JP2000092489A (en) 1998-09-09 1998-09-09 Image encoding device, image encoding method, and medium recording program

Publications (1)

Publication Number Publication Date
JP2000092489A true JP2000092489A (en) 2000-03-31

Family

ID=17278389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25541098A Pending JP2000092489A (en) 1998-09-09 1998-09-09 Image encoding device, image encoding method, and medium recording program

Country Status (1)

Country Link
JP (1) JP2000092489A (en)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001313938A (en) * 2000-05-01 2001-11-09 Canon Inc Image encoding apparatus, image decoding apparatus, control method thereof, and image communication system
WO2001091467A1 (en) * 2000-05-26 2001-11-29 Mitsubishi Denki Kabushiki Kaisha Method and device for encoding image
JP2003534684A (en) * 2000-04-25 2003-11-18 ヒューレット・パッカード・カンパニー How to edit compressed video downstream
WO2005004487A1 (en) * 2003-06-30 2005-01-13 Mitsubishi Denki Kabushiki Kaisha Image encoding device and image encoding method
JP2009027564A (en) * 2007-07-20 2009-02-05 Fujifilm Corp Image processing apparatus, image processing method, and program
JP4777583B2 (en) * 2000-04-25 2011-09-21 ヒューレット・パッカード・カンパニー Image sequence compression featuring independent coding regions
JP2015162852A (en) * 2014-02-28 2015-09-07 ブラザー工業株式会社 Image processing system and image processing program
CN114385473A (en) * 2022-01-27 2022-04-22 北京蔚领时代科技有限公司 A cloud game fluency evaluation method and system

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003534684A (en) * 2000-04-25 2003-11-18 ヒューレット・パッカード・カンパニー How to edit compressed video downstream
JP4777583B2 (en) * 2000-04-25 2011-09-21 ヒューレット・パッカード・カンパニー Image sequence compression featuring independent coding regions
JP2001313938A (en) * 2000-05-01 2001-11-09 Canon Inc Image encoding apparatus, image decoding apparatus, control method thereof, and image communication system
WO2001091467A1 (en) * 2000-05-26 2001-11-29 Mitsubishi Denki Kabushiki Kaisha Method and device for encoding image
WO2005004487A1 (en) * 2003-06-30 2005-01-13 Mitsubishi Denki Kabushiki Kaisha Image encoding device and image encoding method
CN100361395C (en) * 2003-06-30 2008-01-09 三菱电机株式会社 Image encoding device and image encoding method
US7751474B2 (en) 2003-06-30 2010-07-06 Mitsubishi Denki Kabushiki Kaisha Image encoding device and image encoding method
JP2009027564A (en) * 2007-07-20 2009-02-05 Fujifilm Corp Image processing apparatus, image processing method, and program
JP2015162852A (en) * 2014-02-28 2015-09-07 ブラザー工業株式会社 Image processing system and image processing program
US9788014B2 (en) 2014-02-28 2017-10-10 Brother Kogyo Kabushiki Kaisha Image processing device for reducing data size of object in image data based on target value
CN114385473A (en) * 2022-01-27 2022-04-22 北京蔚领时代科技有限公司 A cloud game fluency evaluation method and system

Similar Documents

Publication Publication Date Title
JP4786114B2 (en) Method and apparatus for encoding video
US5790196A (en) Adaptive video coding method
JP3533282B2 (en) Video compression using multiple processors
US7978920B2 (en) Method and system for processing an image, method and apparatus for decoding, method and apparatus for encoding, and program with fade period detector
KR100610520B1 (en) Video data encoding apparatus, video data encoding method, video data transmission apparatus, and video data recording medium
KR100569613B1 (en) Signal encoding method, signal encoding device, signal recording medium and signal transmission method
US7162096B1 (en) System and method for dynamic perceptual coding of macroblocks in a video frame
KR20000023278A (en) Method for selecting intra-frame quantizer for video compression
JP2001510311A (en) Object-based rate control apparatus and method in coding scheme
JPWO2001091467A1 (en) Method and apparatus for encoding video
JPH11225329A (en) Image encoding apparatus and method, image decoding apparatus and method, computer-readable recording medium on which image encoding program is recorded, and computer-readable recording medium on which image decoding program is recorded
CN104885455A (en) Content adaptive bitrate and quality control by using frame-level sensitive quantization for efficient next generation video coding
JPH10257489A (en) Apparatus and method for adjusting bit generation amount for video encoding
WO2008077119A2 (en) Intelligent video signal encoding utilizing regions of interest information
JPH09214963A (en) Method and encoder for encoding an image signal
US20040234142A1 (en) Apparatus for constant quality rate control in video compression and target bit allocator thereof
EP3329678B1 (en) Method and apparatus for compressing video data
RU2329616C2 (en) Transmission speed bit control method and device for visual image quality improvement
JP3508916B2 (en) Moving image variable bit rate encoding method and apparatus
EP2041984A1 (en) Method and apparatus for adapting a default encoding of a digital video signal during a scene change period
JP2000092489A (en) Image encoding device, image encoding method, and medium recording program
KR20040048289A (en) Transcoding apparatus and method, target bit allocation, complexity prediction apparatus and method of picture therein
JP3815665B2 (en) Variable bit rate video encoding apparatus and recording medium
JP3211778B2 (en) Improved adaptive video coding method
US7006570B2 (en) Video signal coding method and video signal encoder