JP2008011117A - Reference picture determination method for interlaced coding in image coding - Google Patents
Reference picture determination method for interlaced coding in image coding Download PDFInfo
- Publication number
- JP2008011117A JP2008011117A JP2006178684A JP2006178684A JP2008011117A JP 2008011117 A JP2008011117 A JP 2008011117A JP 2006178684 A JP2006178684 A JP 2006178684A JP 2006178684 A JP2006178684 A JP 2006178684A JP 2008011117 A JP2008011117 A JP 2008011117A
- Authority
- JP
- Japan
- Prior art keywords
- picture
- reference picture
- field
- frame
- motion
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
【課題】従来の画像符号化装置では、Bピクチャの符号化のときの参照ピクチャは3枚までしか削減しておらず、さらなるメモリ量削減、消費電力削減の達成には不十分であった。また、動きは大きくはないが、同一フレームを構成するトップフィールドとボトムフィールドとの相関が非常に強い映像には従来の動きの大小のみに基づく参照ピクチャの決定は圧縮効率を低下させるという課題がある。
【解決手段】インターレース映像符号化における参照ピクチャを行う方法である。動きが小さい場合には同一パリティのフィールドを参照ピクチャに含める。動きが大きい場合には距離の近いフィールドを参照ピクチャに含める。同一フレームを構成するフィールド間の相関が強い場合には、第2フィールドは第1フィールドを参照ピクチャに含めるという参照ピクチャの選択を行う。
【選択図】図6In a conventional image encoding apparatus, only three reference pictures are encoded when encoding a B picture, which is insufficient to achieve further reduction in memory amount and power consumption. In addition, although the motion is not large, the determination of the reference picture based only on the magnitude of the conventional motion has a problem that the compression efficiency is lowered for an image having a very strong correlation between the top field and the bottom field constituting the same frame. is there.
A method for performing a reference picture in interlaced video coding. When the motion is small, the same parity field is included in the reference picture. When the motion is large, a field with a short distance is included in the reference picture. When the correlation between the fields constituting the same frame is strong, the second field selects the reference picture to include the first field in the reference picture.
[Selection] Figure 6
Description
本発明は、映像信号の圧縮符号化におけるインターレース符号化時の参照ピクチャ決定方法に関するものであって、映像信号の特徴に応じた参照ピクチャ選択方法を提供し、高能率符号化を維持しつつ、符号化時の処理量やメモリ使用量を削減するものである。 The present invention relates to a method for determining a reference picture at the time of interlace coding in compression coding of a video signal, and provides a reference picture selection method according to the characteristics of the video signal, while maintaining high-efficiency coding, This is to reduce the amount of processing and memory usage during encoding.
近年、音声、画像、その他の情報を統合的に扱うマルチメディア時代を迎え、従来からの情報メディア、つまり新聞、雑誌、テレビ、ラジオ、電話等の情報を人に伝達する手段がマルチメディアの対象として取り上げられるようになってきた。一般に、マルチメディアとは、文字だけでなく、図形、音声、画像等を同時に関連づけて表した情報伝達媒体をいうが、上記従来の情報メディアをマルチメディアの対象とするためには、その情報をディジタル形式で表すことが必須条件となる。 In recent years, the multimedia era of voice, image, and other information has been integrated, and conventional information media, that is, means for transmitting information such as newspapers, magazines, televisions, radios, telephones, etc. to people are targeted for multimedia. It has come to be taken up as. In general, multimedia refers to an information transmission medium in which not only characters but also figures, sounds, images, and the like are associated with each other at the same time. It must be expressed in digital form.
ところが、上記各情報メディアの情報量をディジタル情報量として見積もってみると、文字の場合の1文字当たりの情報量は1〜2Byteであるのに対し、音声の場合は1秒当たり64Kbits(電話品質)、さらに動画については1秒当たり100Mbits(現行テレビ受信品質)以上の情報量が必要となり、このように膨大な情報量の上記情報メディアをディジタル形式でそのまま扱うことは現実的では無い。例えば、テレビ電話は、64Kbps〜1.5Mbpsの伝送速度を持つサービス総合ディジタル網(ISDN : Integrated Services Digital Network)によってすでに実用化されているが、テレビやカメラの映像をそのままISDNで送ることは不可能である。 However, when the information amount of each information medium is estimated as a digital information amount, the information amount per character in the case of characters is 1 to 2 bytes, whereas in the case of voice, 64 Kbits (phone quality) In addition, for a moving image, an information amount of 100 Mbits (current television reception quality) or more per second is required, and it is not realistic to handle the information medium with such an enormous amount of information as it is in a digital format. For example, videophones have already been put into practical use by an integrated services digital network (ISDN) having a transmission rate of 64 Kbps to 1.5 Mbps, but it is not possible to send TV and camera images as they are using ISDN. Is possible.
そこで、必要となってくるのが情報の圧縮符号化技術である。例えば、テレビ電話の場合は、ITU−T(国際電気通信連合 電気通信標準化部門)で勧告されたH.261やH.263という圧縮符号化標準が用いられている。また、MPEG-1の圧縮符号化標準を用いることにより、通常の音楽用CD(Compact Disc)に音声情報と共に画像情報を入れることも可能となる。 Therefore, what is required is information compression encoding technology. For example, in the case of a videophone, H.264 recommended by ITU-T (International Telecommunication Union Telecommunication Standardization Sector). 261 and H.264. A compression coding standard of H.263 is used. Further, by using the MPEG-1 compression coding standard, it is possible to put image information together with audio information on a normal music CD (Compact Disc).
ここで、MPEG(Moving Picture Experts Group)標準とは、ISO/IEC(国際標準化機構 国際電気標準会議)で制定された動画像信号の圧縮方式に関する国際標準である。MPEG-1標準は、動画像信号を1.5Mbpsまで、つまりテレビ信号の情報を約100分の1にまで圧縮する規格である。また、MPEG-1標準では、対象とする品質を伝送速度が主として約1.5Mbpsで実現できる程度の中程度の品質としたことから、さらなる高画質化の要求を満たすべく規格化されたMPEG-2標準では、動画像信号を2〜15MbpsでTV放送品質を実現する。 Here, the MPEG (Moving Picture Experts Group) standard is an international standard regarding a compression method of a moving picture signal established by ISO / IEC (International Electrotechnical Commission). The MPEG-1 standard is a standard for compressing moving picture signals up to 1.5 Mbps, that is, information of television signals to about 1/100. Further, in the MPEG-1 standard, the target quality is a moderate quality that can be realized mainly at a transmission rate of about 1.5 Mbps, so that MPEG-standardized to meet the demand for higher image quality. In the 2 standard, the TV broadcast quality is realized at 2 to 15 Mbps for the moving image signal.
さらにその後、MPEG-1、MPEG-2と標準化を進めてきた作業グループ(ISO/IEC JTC1/SC29/WG11)によって、MPEG-1、MPEG-2を上回る圧縮率を達成し、更に物体単位で符号化、復号化および操作を可能とし、マルチメディア時代に必要な新しい機能を実現するMPEG-4標準が制定された。MPEG-4標準では、当初、低ビットレートの符号化方法の標準化を目指して進められたが、現在はインターレース画像を含む高ビットレートの、より汎用的な符号化に拡張されている。更に、現在は、ISO/IECとITU−Tが共同でより高圧縮率の次世代画像符号化方式として、MPEG-4 AVCおよびITU H.264の標準化がなされた。 After that, the working group (ISO / IEC JTC1 / SC29 / WG11), which has been standardizing with MPEG-1 and MPEG-2, achieved a compression ratio higher than MPEG-1 and MPEG-2, and further encoded in object units. MPEG-4 standard has been established to enable new functions necessary in the multimedia era. In the MPEG-4 standard, it was originally aimed at standardizing a low bit rate encoding method, but now it has been extended to a higher bit rate and more general purpose encoding including interlaced images. Furthermore, at present, MPEG-4 AVC and ITU H.264 have been standardized as a next-generation image encoding method with a higher compression rate jointly by ISO / IEC and ITU-T.
一般に動画像の符号化では、時間的および空間的に信号の冗長性を削減することによって情報量の圧縮を行う。そこで時間的な冗長性の削減を目的とする画面間予測符号化では、前方または後方のピクチャを参照してブロック単位で動きの検出および予測画像の作成を行い、得られた予測画像と符号化対象ピクチャとの差分値に対して符号化を行う。ここで、「ピクチャ」とは1枚の画面を表す用語であり、プログレッシブ画像ではフレームを意味し、インターレース画像ではフレーム又はフィールドを意味する。ここで、「インターレース画像」とは、1つのフレームが時刻の異なる2つのフィールドから構成される画像である。二つのフィールドは空間的には行単位に交互に位置をとる。 In general, in the encoding of moving images, the amount of information is compressed by reducing signal redundancy in terms of time and space. Therefore, in inter-picture predictive coding for the purpose of reducing temporal redundancy, motion is detected and a predicted image is created in units of blocks with reference to the forward or backward picture, and the resulting predicted image and the encoded image are encoded. Encoding is performed on the difference value from the target picture. Here, “picture” is a term representing one screen, which means a frame in a progressive image and a frame or field in an interlaced image. Here, an “interlaced image” is an image in which one frame is composed of two fields having different times. The two fields are alternately positioned in rows.
図7はインターレース信号を説明する図面である。時間的に前にあるフィールドを第1フィールド、時間的に後にあるフィールドを第2フィールドと呼び、図7(a)にあるように、第1フィールドが空間的に第1の行に位置し、第2フィールドが空間的に第2の行に位置する場合には、トップフィールドファーストと呼ぶ。図7(b)のように、第1フィールドが空間的に第2の行に位置し、第1フィールドが空間的に第1の行に位置にする場合には、ボトムフィールドファーストと呼ぶ。本明細書における説明ではトップフィールドファーストの図面を用いるが、ボトムフィールドファーストの映像信号にも適用可能である。 FIG. 7 is a diagram for explaining an interlace signal. The first field is called the first field, the second field is called the second field, and the first field is spatially located in the first row as shown in FIG. If the second field is spatially located in the second row, it is called top field first. When the first field is spatially located in the second row and the first field is spatially located in the first row as shown in FIG. 7B, it is called bottom field first. In the description in this specification, a top field first drawing is used, but the present invention can also be applied to a bottom field first video signal.
インターレース画像の符号化や復号化においては、1つのフレームをフレームのまま処理したり、2つのフィールドとして処理したり、フレーム内のブロック毎にフレーム構造またはフィールド構造で処理したりすることができる。 In encoding and decoding of interlaced images, one frame can be processed as a frame, processed as two fields, or processed in a frame structure or a field structure for each block in the frame.
参照画像を持たず(即ち、他のピクチャを参照せず)画面内予測符号化を行うことによって得られる画像をIピクチャと呼ぶ。また、前方又は後方の1枚のピクチャのみを参照して画面間予測符号化を行うことによって得られる画像をPピクチャと呼ぶ。また、同時に2枚のピクチャを参照して画面間予測符号化を行うことによって得られる画像をBピクチャと呼ぶ。Bピクチャは、表示時間が前方又は後方の任意の2枚のピクチャを参照画像として用いる。ここで、表示時間が前方のピクチャを参照する予測を順方向予測、後方のピクチャを参照する予測を逆方向予測、前方もしくは後方から任意の組み合わせのピクチャ2枚を参照する予測を双方向予測と呼ぶ。参照画像(参照ピクチャ)は、符号化および復号化の基本単位であるブロックごとに指定することができるが、これらのピクチャを符号化および復号化する場合の条件として、参照するピクチャが既に符号化および復号化されている必要がある。 An image obtained by performing intra prediction encoding without a reference image (that is, without referring to another picture) is called an I picture. In addition, an image obtained by performing inter-frame predictive coding with reference to only one picture in front or rear is referred to as a P picture. In addition, an image obtained by performing inter-frame predictive coding with reference to two pictures at the same time is referred to as a B picture. The B picture uses any two pictures whose display time is either forward or backward as reference images. Here, the prediction that refers to the picture whose display time is the forward prediction is the forward prediction, the prediction that refers to the backward picture is the backward prediction, and the prediction that refers to two pictures of any combination from the front or the rear is bidirectional prediction. Call. A reference image (reference picture) can be specified for each block that is a basic unit of encoding and decoding. As a condition for encoding and decoding these pictures, a reference picture has already been encoded. And need to be decrypted.
図8に、MPEG−2のフィールド構造での双方向予測ピクチャ(Bピクチャ)における参照フィールドを示す。MPEG−2の双方向予測ピクチャの参照ピクチャは、時間的に前方及び後方のIまたはPピクチャである。連続するBフレームの枚数は通常2枚であるのでここでもこの前提で説明する。Bフレームが2枚の場合、インターレース符号化をすると、合計4フィールドのBピクチャからなる。それぞれのBピクチャの参照についての説明を(a)から(d)のそれぞれにおいて説明している。連続する2枚のBフレームの中の1枚目のBフレームのトップフィールドのBピクチャの場合(図8(a))では、参照するピクチャは時間的に前方のピクチャでIピクチャまたはPピクチャ(この場合はI1とP1b)、及び、時間的に後方のピクチャでIピクチャまたはPピクチャ(この場合はP2tとP2b)を参照する。同様にして、1枚目のBフレームのボトムフィールドの場合、2枚目のBフレームのトップフィールドの場合、2枚目のBフレームのボトムフィールドの場合についてをそれぞれ、図8(b)、図8(c)、図8(d)に示している。 FIG. 8 shows a reference field in a bidirectional prediction picture (B picture) in the MPEG-2 field structure. The reference pictures of the MPEG-2 bi-predictive picture are temporally forward and backward I or P pictures. Since the number of consecutive B frames is usually two, it will be described here also based on this assumption. In the case of two B frames, when interlace coding is performed, a total of four fields of B pictures are included. The description about the reference of each B picture is described in each of (a) to (d). In the case of the B field of the top field of the first B frame among the two consecutive B frames (FIG. 8A), the picture to be referenced is a temporally forward picture and is an I picture or P picture ( In this case, I1 and P1b) and I picture or P picture (in this case, P2t and P2b) are referred to in the temporally backward picture. Similarly, in the case of the bottom field of the first B frame, the case of the top field of the second B frame, and the case of the bottom field of the second B frame, respectively, FIG. 8 (c) and FIG. 8 (d).
図9はMPEG−2とH.264(MPEG−4AVC)の参照ピクチャの相違点を示している。H.264(MPEG−4AVC)の場合には、MPEG−2とは異なりBピクチャを参照することが可能である。図9(a)は、H.264における2枚目のBフレームのボトムフィールドの参照ピクチャを示している。図9(b)はBピクチャを参照しないMPEG−2における2枚目のBフレームのボトムフィールドの参照ピクチャを示している。同図からわかるように、Bピクチャを参照するほうが、IPピクチャを参照するよりも符号化対象ピクチャと参照ピクチャとの距離が近くなるので、ピクチャ間の相関が強くなり、画面間予測における圧縮効率が向上する。 9 shows MPEG-2 and H.264. 2 shows differences between H.264 (MPEG-4AVC) reference pictures. H. In the case of H.264 (MPEG-4AVC), unlike MPEG-2, it is possible to refer to a B picture. FIG. The reference picture of the bottom field of the second B frame in H.264 is shown. FIG. 9B shows a reference picture of the bottom field of the second B frame in MPEG-2 that does not refer to the B picture. As can be seen from the figure, since the distance between the picture to be encoded and the reference picture is closer when referring to the B picture than when referring to the IP picture, the correlation between pictures becomes stronger, and the compression efficiency in inter-picture prediction Will improve.
図10に、MPEG−2と同様に参照ピクチャを4フィールド参照し、参照可能なBピクチャを用いる場合のH.264の参照ピクチャの一例を示している。 FIG. 10 shows an H.264 format in the case where a reference picture is used by referring to four fields as in MPEG-2 and a referenceable B picture is used. 2 shows an example of a H.264 reference picture.
ピクチャを16×16画素単位に分割した処理単位をマクロブロックと呼ぶが、H.264ではマクロブロックの予測方法がMPEG−2と比べて格段に増加している。多数の予測方法の中から最も圧縮率の良い方法を適切に選ぶことが可能であるが、そのための処理量が膨大であるため、ムービーやレコーダなどの実時間処理の必要な商品向けには処理量を削減しなければならないという問題がある。特にムービーや携帯電話などのバッテリー動作機器無形には処理量削減の要求はさらに厳しい。処理量削減の方法は幾つか考えられるが、H.264では参照可能なBピクチャが使え、画面間の相関が強まっていることから、相対的に相関の小さな参照ピクチャに対する画面予測を行わないという方法が考えられる。 A processing unit obtained by dividing a picture into 16 × 16 pixel units is called a macroblock. In H.264, the macroblock prediction method is significantly increased as compared with MPEG-2. It is possible to properly select the method with the best compression rate from among many prediction methods, but the processing amount for that is enormous, so it is processed for products that require real-time processing such as movies and recorders. There is a problem that the amount must be reduced. Especially for intangible battery-operated devices such as movies and mobile phones, the demand for reducing the amount of processing is even more severe. There are several methods for reducing the processing amount. In H.264, a B picture that can be referred to can be used, and the correlation between screens is strengthened. Therefore, a method of not performing screen prediction on a reference picture having a relatively small correlation is conceivable.
従来、参照ピクチャ数を4枚から3枚へ削減する方法が提案されている(特許文献1参照)。従来技術のなかでは、動きの大小を検出し、動きが大きい場合には時間の近いピクチャを優先し、動きが小さい場合には同一パリティのピクチャを優先するというルールで4枚を3枚に減らしても圧縮効率を落とさないことを示している。 Conventionally, a method of reducing the number of reference pictures from four to three has been proposed (see Patent Document 1). In the prior art, the size of motion is detected, and when the motion is large, the picture with near time is prioritized, and when the motion is small, the picture of the same parity is prioritized to reduce the number of four to three. However, the compression efficiency is not reduced.
しかしながら従来技術が想定していた以上に電力削減・メモリ量削減への要求は強く、参照ピクチャの枚数を3枚からさらに2枚へと削減する必要がある。従来技術は参照ピクチャ枚数が3枚であることを前提にしており2枚の場合の選択方法は開示されていない。また、一部の映像においては、従来技術で分類した、動きの大きい場合、動きの小さい場合、のいずれにも属さない傾向を示しており、新たな方法が求められている。 However, there is a strong demand for power reduction and memory reduction more than expected by the prior art, and it is necessary to reduce the number of reference pictures from three to two. The prior art is based on the premise that the number of reference pictures is three, and the selection method in the case of two is not disclosed. In addition, some videos show a tendency that does not belong to either the case of large movement or the case of small movement classified by the prior art, and a new method is required.
図11は、上記従来の画像符号化装置の一例を示すブロック図である。図11に示すように、画像符号化装置200は、符号化ピクチャメモリ102、直交変換量子化部103、可変長符号化部104、逆可変長符号化部106、逆量子化・逆直交変換部107、参照ピクチャ復号部108、参照ピクチャメモリ109、画面間予測部110を備える。 FIG. 11 is a block diagram showing an example of the conventional image encoding device. As illustrated in FIG. 11, the image encoding device 200 includes an encoded picture memory 102, an orthogonal transform quantization unit 103, a variable length encoding unit 104, an inverse variable length encoding unit 106, an inverse quantization / inverse orthogonal transform unit. 107, a reference picture decoding unit 108, a reference picture memory 109, and an inter-screen prediction unit 110.
入力された映像信号101は符号化ピクチャメモリにはじめに格納される。双方向予測ピクチャを用いる場合には、符号化するピクチャの順番は表示の順番と数フレームほど入れ替わる場合があるが、この並び替え処理はあらかじめ行われているものとする。画面間予測部110において、参照ピクチャメモリ109に格納されている参照ピクチャの中から、最も相関の高い参照ピクチャ・及び・位置を探索して求める。探索手法は多くの種類があるが参照ピクチャ枚数が多いほど処理量が多い傾向がある。画面間予測110が探索した最も相関の高い画像と入力映像信号101との差分をとり、差分信号が直交変換・量子化部103へ出力される。差分信号はには直交変換を行い、変換された差分信号をさらに量子化する。量子化された差分信号は可変長符号化部において可変調符号化され、出力ストリーム105として出力される。また、ピクチャ間予測では、過去の符号化済みピクチャとの予測であることから、符号化装置において符号化ピクチャの復号し画像信号に戻す必要がある。すなわち、出力ストリームは逆可変長符号化部106へ入力され、さらに逆量子化・逆直交変換部へ入力され、差分信号へと戻される。差分信号を参照ピクチャ復号部108は、参照ピクチャメモリ109に格納された参照ピクチャのうちいずれか(あるいは複数)の時間的に過去の参照ピクチャに加算し参照ピクチャメモリを更新する。
The input video signal 101 is first stored in the encoded picture memory. When bi-predictive pictures are used, the order of pictures to be encoded may be changed by the order of display and several frames, but this rearrangement process is assumed to be performed in advance. The inter-screen prediction unit 110 searches for and obtains the reference picture with the highest correlation from the reference pictures stored in the reference picture memory 109. There are many types of search methods, but the amount of processing tends to increase as the number of reference pictures increases. The difference between the image with the highest correlation searched by the inter-screen prediction 110 and the input video signal 101 is taken, and the difference signal is output to the orthogonal transform / quantization unit 103. The difference signal is subjected to orthogonal transformation, and the transformed difference signal is further quantized. The quantized difference signal is modulated and encoded by the variable length encoding unit and output as an
従来技術の符号化装置では、Bピクチャの符号化のとき、参照ピクチャメモリ内部には3枚のフィールドピクチャのメモリが格納され、画面間予測部110の探索対象となっていた。
しかしながら、上記従来の画像符号化装置200では、Bピクチャの符号化のときの参照ピクチャは3枚までしか削減しておらず、さらなるメモリ量削減、消費電力削減の達成には不十分であった。また、動きは大きくはないが、同一フレームを構成するトップフィールドとボトムフィールドとの相関が非常に強い映像には従来の動きの大小のみに基づく参照ピクチャの決定は圧縮効率を低下させるという問題もある。 However, in the conventional image coding apparatus 200 described above, only three reference pictures at the time of coding a B picture are reduced, which is insufficient to achieve further reduction in memory amount and power consumption. . In addition, although the motion is not large, the determination of the reference picture based only on the magnitude of the conventional motion reduces the compression efficiency for video with a very strong correlation between the top field and the bottom field constituting the same frame. is there.
本発明は、上記課題に鑑み、Bピクチャの参照ピクチャの枚数を2枚へ削減すること、及び、映像の特徴に応じて、より細かく参照ピクチャ構造を切り替えることにより高圧縮率を維持可能とする参照ピクチャ決定方法を提供することを目的とする。 In view of the above problems, the present invention makes it possible to maintain a high compression rate by reducing the number of reference pictures of B pictures to two and by switching the reference picture structure more finely according to the video characteristics. It is an object to provide a reference picture determination method.
上記課題を解決するために、本発明に係る参照ピクチャ選択方法は、[請求項1]に記載しており、具体的な参照ピクチャの決定方法は[請求項2]〜[請求項4]に記載している。 In order to solve the above problems, a reference picture selection method according to the present invention is described in [Claim 1], and specific reference picture determination methods are described in [Claim 2] to [Claim 4]. It is described.
なお、本発明は、上記画像符号化装置における特徴的な構成手段をステップとする画像符号化方法として実現したり、それらステップをパーソナルコンピュータ等に実行させるプログラムとして実現したりすることもできる。そして、そのプログラムをDVD等の記録媒体やインターネット等の伝送媒体を介して広く流通させることができるのは云うまでもない。 Note that the present invention can be realized as an image encoding method using characteristic constituent means in the image encoding apparatus as steps, or as a program for causing a personal computer or the like to execute these steps. Needless to say, the program can be widely distributed via a recording medium such as a DVD or a transmission medium such as the Internet.
さらに、本発明は、上記画像符号化装置の主要な各機能を集積回路化したLSI等として実現することもできる。 Furthermore, the present invention can also be realized as an LSI or the like in which the main functions of the image encoding device are integrated circuits.
本発明によれば、映像信号の特徴に基づき高圧縮率を維持したまま、参照ピクチャ枚数を2枚以下へと落とすことができる。これにより、参照ピクチャを格納するメモリの要量削減や、参照ピクチャに対する画面間予測の演算量・データ転送量の削減ができる。 According to the present invention, it is possible to reduce the number of reference pictures to two or less while maintaining a high compression rate based on the characteristics of the video signal. As a result, it is possible to reduce the amount of memory required to store the reference picture, and to reduce the amount of calculation and data transfer for inter-screen prediction for the reference picture.
以下本発明の実施の形態について、図面を参照しながら説明する。なお、本発明について、以下の実施の形態および添付の図面を用いて説明を行うが、これは例示を目的としており、本発明はこれらに限定されることを意図しない。 Embodiments of the present invention will be described below with reference to the drawings. In addition, although this invention is demonstrated using the following embodiment and attached drawing, this is for the purpose of illustration and this invention is not intended to be limited to these.
(実施の形態1)
図1は、本発明の実施の形態1に係る画像符号化装置100の一例を示すブロック図である。図1に示すように、画像符号化装置は、符号化ピクチャメモリ102、直交変換量子化部103、可変長符号化部104、逆可変長符号化部106、逆量子化・逆直交変換部107、参照ピクチャ復号部108、参照ピクチャメモリ109、画面間予測部110を備える。なお、図1において、上記図11と同じ構成要素については同じ符番を用い、その説明は省略する。本実施の形態において特徴的な構成要素は、参照ピクチャ選択部111、参照ピクチャ決定部112、映像信号特徴量113、フィールド位置情報114、制御信号115である。
(Embodiment 1)
FIG. 1 is a block diagram showing an example of an image encoding device 100 according to Embodiment 1 of the present invention. As shown in FIG. 1, the image encoding apparatus includes an encoded picture memory 102, an orthogonal transform quantization unit 103, a variable length encoding unit 104, an inverse variable length encoding unit 106, an inverse quantization / inverse orthogonal transform unit 107. A reference picture decoding unit 108, a reference picture memory 109, and an inter-screen prediction unit 110. In FIG. 1, the same reference numerals are used for the same components as in FIG. 11, and the description thereof is omitted. Characteristic components in the present embodiment are a reference picture selection unit 111, a reference picture determination unit 112, a video signal feature amount 113, field position information 114, and a control signal 115.
入力映像信号101に関する特徴を示す情報である、映像信号特徴量情報113とは、例えば、動きが大きい、動きが小さいなどの状態を表す情報である。符号化ピクチャメモリ102に格納されている入力映像信号101から求めることが可能であるし、画面間予測部110の過去の結果を統計処理することで求めることも可能であるし、あるいは、符号化装置101の外部から与えることも可能である。本発明では、この動きの大小を示す情報に基づき、参照ピクチャ決定部112は、双方向予測ピクチャの参照ピクチャを決定し、参照ピクチャメモリに格納されたピクチャのうちどれを参照するかを示す制御信号115を参照ピクチャ選択部111へ送る。参照ピクチャ選択部111は、制御信号115に基づき、選択されたピクチャのみを画面間予測部110へと出力する。フィールド位置情報114とは、当該符号化ピクチャが表示順で何枚目のBフレームなのか(Pフレームからカウントして)、及び、フレームを構成する第1のフィールドなのか第2のフィールドなのかという情報を示す。 The video signal feature amount information 113, which is information indicating characteristics relating to the input video signal 101, is information representing a state where the movement is large or the movement is small, for example. It can be obtained from the input video signal 101 stored in the coded picture memory 102, can be obtained by statistically processing past results of the inter-screen prediction unit 110, or can be coded. It is also possible to give from the outside of the apparatus 101. In the present invention, based on the information indicating the magnitude of the motion, the reference picture determination unit 112 determines the reference picture of the bi-predictive picture and controls which of the pictures stored in the reference picture memory is to be referred to The signal 115 is sent to the reference picture selection unit 111. Based on the control signal 115, the reference picture selection unit 111 outputs only the selected picture to the inter-screen prediction unit 110. The field position information 114 is the number of B frames in the display order (counted from the P frame) and whether the encoded picture is the first field or the second field constituting the frame. This information is shown.
なお、参照ピクチャ選択部111と参照ピクチャ決定部112は独立の構成要素として説明しているが、両方の機能を備える一つの構成要素であっても良い。 The reference picture selection unit 111 and the reference picture determination unit 112 are described as independent components, but may be a single component having both functions.
図2は入力映像信号101の動きが小さい場合の参照ピクチャの選び方を示している。動きが小さい場合には、符号化ピクチャが第1フィールドの場合には、参照ピクチャも第1フィールドを参照し、符号化ピクチャが第2フィールドの場合には、参照ピクチャも第2フィールドを参照すると、より相関が高いことが多いので、図2のように選択する。 FIG. 2 shows how to select a reference picture when the motion of the input video signal 101 is small. When the motion is small, when the encoded picture is the first field, the reference picture also refers to the first field, and when the encoded picture is the second field, the reference picture also refers to the second field. Since the correlation is often higher, the selection is made as shown in FIG.
図2(a)に示すように、1枚目のBフレームの第1フィールドB1tは、時間的前方のフレームの第1フィールドであるI1を参照し、時間的後方のフレームの第1フィールドであるP2tを参照する。なお、時間的後方のP2tは距離が遠いため、I1と比べて参照は重要ではない。P2tへの参照を省略し別のピクチャを参照することも可能である。 As shown in FIG. 2A, the first field B1t of the first B frame refers to the first field I1 of the temporally forward frame and is the first field of the temporally backward frame. Refer to P2t. In addition, since P2t of time back is far, reference is not important compared with I1. It is also possible to refer to another picture by omitting the reference to P2t.
図2(b)に示すように、1枚目のBフレームの第2フィールドB1bは、時間的前方のフレームの第2フィールドであるP1bを参照し、時間的後方のフレームのP2bを参照する。同様にP2bに対する参照は省略することも可能である。 As shown in FIG. 2B, the second field B1b of the first B frame refers to P1b, which is the second field of the temporally forward frame, and refers to P2b of the temporally backward frame. Similarly, reference to P2b can be omitted.
図2(c)に示すように、2枚目のBフレームの第1フィールドB1tは、時間的前方のB1tと、時間的後方のフレームのPt2を参照する。どちらも距離が近いので省略すると圧縮率の低下懸念があるが、BピクチャよりPピクチャの画質が良い場合が多いので、P2tを参照し、B1tへは参照しなことも考えられる。 As shown in FIG. 2C, the first field B1t of the second B frame refers to the temporally forward B1t and the temporally backward frame Pt2. Since both are short distances and there is a concern that the compression rate will be reduced if omitted, there are many cases where the picture quality of a P picture is better than that of a B picture.
図2(d)に示すように、2枚目のBフレームの第2フィールドB2bは、時間的前方のB1bと、時間的後方のP2bを参照する。Bt2の場合ど同様に、どちらも距離が近いので省略すると圧縮率の低下懸念があるが、BピクチャよりPピクチャの画質が良い場合が多いので、P2bを参照し、B1bへは参照しなことも考えられる。 As shown in FIG. 2D, the second field B2b of the second B frame refers to the temporally forward B1b and the temporally backward P2b. As in the case of Bt2, since both are close to each other, there is a concern that the compression rate will be reduced if omitted. Is also possible.
図3は入力映像信号101の動きが大きい場合の参照ピクチャの選び方を示している。動きが大きい場合には、距離が最も近い参照ピクチャを選択することで高い圧縮率を維持できる。H.264の場合には、参照可能なBピクチャを用いることで、時間的前方の参照ピクチャとの距離は時間的後方の参照ピクチャよりも近くなるので、時間的前方の参照ピクチャの選択が重要である。 FIG. 3 shows how to select a reference picture when the motion of the input video signal 101 is large. When the motion is large, it is possible to maintain a high compression rate by selecting a reference picture with the shortest distance. H. In the case of H.264, the use of the referenceable B picture makes the distance from the temporally forward reference picture closer to that of the temporally backward reference picture, so selection of the temporally forward reference picture is important. .
図3(a)に示すように、1枚目のBフレームの第1フィールドB1tは、時間的前方のフレームの第2フィールドであるP1bを参照する。時間的後方との参照ピクチャとの距離は遠いため相対的に重要度は低いので省略することも可能であるが、時間的後方の参照ピクチャの中では、距離の近いP2tを参照することが望ましい。 As shown in FIG. 3A, the first field B1t of the first B frame refers to the second field P1b of the temporally forward frame. Since the distance from the reference picture to the temporal rear is long, it is relatively less important and can be omitted. However, in the temporal backward reference picture, it is desirable to refer to the P2t having a short distance. .
図3(b)に示すように、1枚目のBフレームの第2フィールドB1bは、距離が最も近い参照ピクチャである、当該フレームの第1フィールドB1tを参照する。時間的後方の参照ピクチャは距離が遠いため相対的に重要度は低いので省略することも可能であるが、時間的後方の参照ピクチャの中で距離の近いP2tを参照することが望ましい。 As shown in FIG. 3B, the second field B1b of the first B frame refers to the first field B1t of the frame, which is the reference picture with the shortest distance. Since the temporally backward reference picture is relatively insignificant because it is far away, it can be omitted. However, it is desirable to refer to P2t having a short distance in the temporally backward reference picture.
図3(c)に示すように、2枚目のBフレームの第1フィールドB2tは、距離が最も近い参照ピクチャである、時間的前方のフレームの第2フィールドであるB1bを参照する。参照ピクチャは距離が遠いため相対的に重要度は低いので省略することも可能であるが、時間的後方の参照ピクチャの中で距離の近いP2tを参照することが望ましい。 As shown in FIG. 3C, the first field B2t of the second B frame refers to B1b, which is the second field of the temporally forward frame, which is the reference picture with the shortest distance. Since the reference picture has a relatively long distance and is relatively low in importance, it can be omitted. However, it is desirable to refer to P2t having a short distance among the reference pictures that are temporally backward.
図3(d)に示すように、2枚目のBフレームの第2フィールドB2bは、距離が最も近い参照ピクチャである、当該フレームの第1フィールドであるB2tと、時間的後方の第1フィールドであるPt2を参照する。どちらも距離が近いので省略すると圧縮率の低下懸念があるが、BピクチャよりPピクチャの画質が良い場合が多いので、P2tを参照し、B2tへは参照しないことも考えられる。 As shown in FIG. 3 (d), the second field B2b of the second B frame is a reference picture having the shortest distance, B2t being the first field of the frame, and the first field behind in time. Reference is made to Pt2. Since both are short distances and there is a concern that the compression rate will be reduced if omitted, there are many cases where the picture quality of the P picture is better than the B picture, so it is conceivable to refer to P2t and not to B2t.
図4は入力映像信号101を3つの特徴で分類したものである。図4(a)は動きの小さな絵であり、空間的に隣接する行間の相関は高いが垂直解像度が高い映像信号を示している。図4(b)は動きの大きな絵であり、空間的に隣接する行間の相関よりも、時間距離の近いフィールド間の相関が強い映像信号である。図4(c)は、フレームを構成する第1フィールドと第2フィールドとの相関が非常に強い映像信号を示している。インターレースの映像信号を垂直フィルタをかけてプログレッシブ映像に変換し、それが伝送や蓄積のシステムの都合で再びインターレース信号に変換された場合に図4(c)に示すような特徴を持つ映像信号もある。あるいは、一度符号化された映像信号を復号し再び符号化装置に入力した場合にも、一度目のインターレース符号化の際にデータ量を抑えるための目的で第2フィールドにわりあてるデータ量を抑え、第1フィールドとよく似ているとの特徴を持つ映像信号もある。 FIG. 4 shows the input video signal 101 classified according to three characteristics. FIG. 4A is a picture with small motion, and shows a video signal having a high vertical resolution but a high correlation between spatially adjacent rows. FIG. 4B is a picture with a large motion, and is a video signal in which the correlation between fields in a short distance is stronger than the correlation between spatially adjacent rows. FIG. 4C shows a video signal in which the correlation between the first field and the second field constituting the frame is very strong. When an interlaced video signal is converted to a progressive video by applying a vertical filter, and converted to an interlaced signal again for the convenience of the transmission and storage system, a video signal having the characteristics shown in FIG. is there. Alternatively, even when a once encoded video signal is decoded and input to the encoding device again, the amount of data assigned to the second field is reduced for the purpose of reducing the amount of data during the first interlaced encoding. Some video signals have characteristics similar to those of the first field.
図4(c)のような特徴を持つ映像信号に対しては、フレームを構成する第2フィールドは、同じフレームを構成する第1フィールドを参照することが必須になる。フレームを構成する第1フィールドの場合には、前述のように動きの大小に応じて参照ピクチャを決定すればよい。 For a video signal having the characteristics as shown in FIG. 4C, it is indispensable that the second field constituting the frame refers to the first field constituting the same frame. In the case of the first field constituting the frame, the reference picture may be determined according to the magnitude of the motion as described above.
図5(a)及び(c)は、同一フレームを構成するフィールドを参照することができないので、圧縮率への寄与度は相対的には高くない。前述のように動きの大小で参照ピクチャを決定すればよい。 In FIGS. 5A and 5C, the fields constituting the same frame cannot be referred to, so the contribution to the compression rate is not relatively high. As described above, the reference picture may be determined based on the magnitude of motion.
図5(b)は一枚目のBフレームの第2フィールドは同一フレームを構成する第1フィールドを参照することが非常に重要であることを示している。時間的に後方の参照ピクチャとしてはこの図では、Pt2を参照しているが、動きの大小に応じて、P2tまたはPtbを参照してもよいし、参照ピクチャ枚数をさらに減らしたいならば、距離が遠いので参照をしなくてもよい。 FIG. 5B shows that it is very important for the second field of the first B frame to refer to the first field constituting the same frame. In this figure, Pt2 is referred to as a temporally backward reference picture, but P2t or Ptb may be referred to depending on the magnitude of motion, and if it is desired to further reduce the number of reference pictures, the distance Because it is far away, there is no need to refer to it.
図5(d)は2枚目のBフレームの第2フィールドの参照ピクチャを示している。1枚目のBフレームの場合と同様に、同一フレームを構成する第1フィールドを参照することが非常に重要である。 FIG. 5D shows the reference picture of the second field of the second B frame. As in the case of the first B frame, it is very important to refer to the first field constituting the same frame.
図6は参照ピクチャ構造を決定するフローの一例を示している。はじめにステップS101において、フレームを構成するフィールドの相関が強いかを調べる。もし相関が強い場合には、同一フレームを構成する第1フィールドを参照ピクチャに含める。なお参照ピクチャが第1フィールドの場合には、ステップS103以降の処理を同様に行うことが考えられる。ない、ステップS103において、動きが大きいかどうかを調べ、動きが大きい場合には、ステップS104において、最も距離の近いピクチャを参照ピクチャに含める。もしステップS105において、動きが小さいと判断された場合には、ステップS105にて、符号化ピクチャ同一のフィールドであって、最も距離の近いピクチャを参照ピクチャに含める。なお、図6では、最初にステップ101の処理を行うこととしたが、はじめにステップS103の動きの大小判定を行う動作としても同等の結果が得られる。図6では映像の特徴に基づいて3種類の参照ピクチャの選び方があること示すことがねらいであり、判定処理S101とS103の時間の前後関係に前提があるわけではない。 FIG. 6 shows an example of a flow for determining the reference picture structure. First, in step S101, it is checked whether the fields constituting the frame have a strong correlation. If the correlation is strong, the first field constituting the same frame is included in the reference picture. If the reference picture is the first field, it can be considered that the processing in step S103 and after is similarly performed. In step S103, it is checked whether the motion is large. If the motion is large, the closest picture is included in the reference picture in step S104. If it is determined in step S105 that the motion is small, in step S105, a picture that is the same field as the encoded picture and has the closest distance is included in the reference picture. In FIG. 6, the process of step 101 is first performed. However, the same result can be obtained as the operation of determining the magnitude of the motion in step S103 first. In FIG. 6, the aim is to indicate that there are three types of reference pictures to be selected based on the video characteristics, and there is no premise of the temporal relationship between the determination processes S101 and S103.
なお、上記実施の形態1の各ブロック図(上記図2および5など)における各構成要素は、典型的には集積回路であるLSIとして実現される。これらは個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されても良い(例えば、メモリ以外の機能ブロックが1チップ化されていても良い。)。 Each component in each block diagram of the first embodiment (FIGS. 2 and 5, etc.) is typically realized as an LSI that is an integrated circuit. These may be individually made into one chip, or may be made into one chip so as to include a part or all of them (for example, functional blocks other than the memory may be made into one chip).
ここでは、LSIとしたが、集積度の違いにより、IC、システムLSI、スーパーLSI、ウルトラLSIと呼称されることもある。 The name used here is LSI, but it may also be called IC, system LSI, super LSI, or ultra LSI depending on the degree of integration.
また、集積回路化の手法はLSIに限るものではなく、専用回路又は汎用プロセッサで実現してもよい。LSI製造後に、プログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサを利用しても良い。 Further, the method of circuit integration is not limited to LSI's, and implementation using dedicated circuitry or general purpose processors is also possible. An FPGA (Field Programmable Gate Array) that can be programmed after manufacturing the LSI or a reconfigurable processor that can reconfigure the connection and setting of circuit cells inside the LSI may be used.
さらには、半導体技術の進歩又は派生する別技術によりLSIに置き換わる集積回路化の技術が登場すれば、当然、その技術を用いて機能ブロックの集積化を行ってもよい。バイオ技術の適応等が可能性としてあり得る。 Further, if integrated circuit technology comes out to replace LSI's as a result of the advancement of semiconductor technology or a derivative other technology, it is naturally also possible to carry out function block integration using this technology. There is a possibility of adaptation of biotechnology.
また、各機能ブロックのうち、符号化または復号化の対象となるデータを格納する手段だけ1チップ化せずに別構成としても良い。 In addition, among the functional blocks, only the means for storing the data to be encoded or decoded may be configured separately instead of being integrated into one chip.
なお、本実施の形態では、双方向予測ピクチャとして説明したが、H.264などの双予測ピクチャにも適用可能である。双予測ピクチャとは、2枚の参照画像から予測画像を生成する点は双方向予測ピクチャと同様であるが、双方向だけでなく同一方向(前方或いは後方)の2枚の参照ピクチャを用いた予測が可能な点が異なる。 In the present embodiment, the bidirectional prediction picture has been described. It is also applicable to bi-predictive pictures such as H.264. The bi-predictive picture is the same as the bi-predictive picture in that a predictive picture is generated from two reference pictures. However, not only bi-directional pictures but also two reference pictures in the same direction (forward or backward) are used. The point that can be predicted is different.
本発明にかかる画像符号化方法は、高効率に画像データを圧縮する手段を有し、蓄積用途としては画像の長時間の記録に、伝送用途としては少ないデータ量の画像の配信等に有用である。またテレビ電話やテレビ放送の録画などの用途にも応用が可能である。 The image coding method according to the present invention has means for compressing image data with high efficiency, and is useful for long-term recording of images for storage purposes and for distributing images with a small amount of data for transmission purposes. is there. It can also be applied to applications such as videophone and TV broadcast recording.
100 従来の画像符号化装置
101 入力映像信号
102 符号化ピクチャメモリ
103 直交変換・量子化部
104 可変長符号化部
105 出力ストリーム
106 逆可変長符号化部
107 逆量子化・逆直交変換部
108 参照ピクチャ復号部
109 参照ピクチャメモリ
110 画面間予測部
200 (発明の参照ピクチャ決定方法を備える)画像符号化装置
111 参照ピクチャ選択部
112 参照ピクチャ決定部
113 映像信号特徴量
114 フィールド位置情報(B1・B2、トップ・ボトムの区別)
115 制御信号
DESCRIPTION OF SYMBOLS 100 Conventional image coding apparatus 101 Input video signal 102 Encoded picture memory 103 Orthogonal transformation / quantization part 104 Variable
115 Control signal
Claims (4)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006178684A JP2008011117A (en) | 2006-06-28 | 2006-06-28 | Reference picture determination method for interlaced coding in image coding |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2006178684A JP2008011117A (en) | 2006-06-28 | 2006-06-28 | Reference picture determination method for interlaced coding in image coding |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2008011117A true JP2008011117A (en) | 2008-01-17 |
Family
ID=39068936
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2006178684A Pending JP2008011117A (en) | 2006-06-28 | 2006-06-28 | Reference picture determination method for interlaced coding in image coding |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2008011117A (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2010109564A1 (en) * | 2009-03-25 | 2010-09-30 | パナソニック株式会社 | Image encoding apparatus and image encoding method |
| US20110001839A1 (en) * | 2009-07-01 | 2011-01-06 | Koji Arimura | Picture coding apparatus, picture coding method and video camera |
| WO2011121731A1 (en) * | 2010-03-30 | 2011-10-06 | 富士通株式会社 | Image processing apparatus and image processing method |
| WO2011155376A1 (en) * | 2010-06-09 | 2011-12-15 | ソニー株式会社 | Encoding device and encoding method |
| JP2011530222A (en) * | 2008-08-01 | 2011-12-15 | ゾラン コーポレイション | Video encoder with integrated temporal filter for noise removal |
| JP2013236392A (en) * | 2008-01-29 | 2013-11-21 | Panasonic Corp | Image coding device and image coding method |
| JP2015524225A (en) * | 2012-06-21 | 2015-08-20 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Apparatus and method for coding a video signal |
| JP2017098601A (en) * | 2015-11-18 | 2017-06-01 | キヤノン株式会社 | Encoding device, imaging device, encoding method, and program |
-
2006
- 2006-06-28 JP JP2006178684A patent/JP2008011117A/en active Pending
Cited By (19)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013236392A (en) * | 2008-01-29 | 2013-11-21 | Panasonic Corp | Image coding device and image coding method |
| US8897368B2 (en) | 2008-01-29 | 2014-11-25 | Panasonic Corporation | Image coding device, image coding method, image coding integrated circuit and image coding program |
| JP2011530222A (en) * | 2008-08-01 | 2011-12-15 | ゾラン コーポレイション | Video encoder with integrated temporal filter for noise removal |
| US9414091B2 (en) | 2008-08-01 | 2016-08-09 | Qualcomm Incorporated | Video encoder with an integrated temporal filter |
| WO2010109564A1 (en) * | 2009-03-25 | 2010-09-30 | パナソニック株式会社 | Image encoding apparatus and image encoding method |
| US20110001839A1 (en) * | 2009-07-01 | 2011-01-06 | Koji Arimura | Picture coding apparatus, picture coding method and video camera |
| US8917766B2 (en) | 2009-07-01 | 2014-12-23 | Panasonic Corporation | Picture coding apparatus, picture coding method and video camera |
| JPWO2011121731A1 (en) * | 2010-03-30 | 2013-07-04 | 富士通株式会社 | Image processing apparatus and image processing method |
| WO2011121731A1 (en) * | 2010-03-30 | 2011-10-06 | 富士通株式会社 | Image processing apparatus and image processing method |
| US9036918B2 (en) | 2010-03-30 | 2015-05-19 | Fujitsu Limited | Image processing apparatus and image processing method |
| EP2582139A4 (en) * | 2010-06-09 | 2014-01-01 | Sony Corp | ENCODING DEVICE AND ENCODING METHOD |
| WO2011155376A1 (en) * | 2010-06-09 | 2011-12-15 | ソニー株式会社 | Encoding device and encoding method |
| CN102934442A (en) * | 2010-06-09 | 2013-02-13 | 索尼公司 | Encoding device and encoding method |
| JP2011259197A (en) * | 2010-06-09 | 2011-12-22 | Sony Corp | Encoding device and encoding method |
| CN102934442B (en) * | 2010-06-09 | 2017-04-26 | 索尼公司 | Encoding device and encoding method |
| US9826227B2 (en) | 2010-06-09 | 2017-11-21 | Sony Corporation | Motion picture encoding apparatus and motion picture encoding method based on bit rate |
| JP2015524225A (en) * | 2012-06-21 | 2015-08-20 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | Apparatus and method for coding a video signal |
| JP2017098601A (en) * | 2015-11-18 | 2017-06-01 | キヤノン株式会社 | Encoding device, imaging device, encoding method, and program |
| US10666970B2 (en) | 2015-11-18 | 2020-05-26 | Canon Kabushiki Kaisha | Encoding apparatus, encoding method, and storage medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Xin et al. | Digital video transcoding | |
| USRE48401E1 (en) | Moving picture coding method and moving picture decoding method | |
| US9338453B2 (en) | Method and device for encoding/decoding video signals using base layer | |
| JP4348209B2 (en) | Image encoding method and image decoding method | |
| US20050185715A1 (en) | Video decoder architecture and method for using same | |
| JP4755093B2 (en) | Image encoding method and image encoding apparatus | |
| JP5232114B2 (en) | Image coding apparatus and image coding method | |
| US8532187B2 (en) | Method and apparatus for scalably encoding/decoding video signal | |
| JP5361896B2 (en) | Moving picture coding method and moving picture coding apparatus | |
| JP2011507461A (en) | Adaptive group of picture (AGOP) structure determination | |
| JP2016092837A (en) | Video compression apparatus, video reproduction apparatus and video distribution system | |
| JP2005510984A (en) | Picture-level adaptive frame / field coding for digital video content | |
| US7826529B2 (en) | H.263/MPEG video encoder for efficiently controlling bit rates and method of controlling the same | |
| JP2010063092A (en) | Image coding apparatus, image coding method, image coding integrated circuit and camera | |
| JP2008011117A (en) | Reference picture determination method for interlaced coding in image coding | |
| JP2007228560A (en) | Moving picture coding method and moving picture coding apparatus | |
| US20060078053A1 (en) | Method for encoding and decoding video signals | |
| KR101371507B1 (en) | System and method for low-delay video telecommunication | |
| Omori et al. | 4K 120fps HEVC temporal scalable encoder with super low delay | |
| KR100734141B1 (en) | Temporal and spatial scalable encoding and decoding method for referencing a plurality of frames and apparatus therefor | |
| JP2003274412A (en) | Image encoding method and image decoding method | |
| Li | Video representation | |
| Li et al. | Video Representation | |
| JP2007020123A (en) | Motion detection device and motion detection method | |
| Fang et al. | Robust group-of-picture architecture for video transmission over error-prone channels |