[go: up one dir, main page]

JP2008167061A - 符号化装置及び符号化方法 - Google Patents

符号化装置及び符号化方法 Download PDF

Info

Publication number
JP2008167061A
JP2008167061A JP2006353184A JP2006353184A JP2008167061A JP 2008167061 A JP2008167061 A JP 2008167061A JP 2006353184 A JP2006353184 A JP 2006353184A JP 2006353184 A JP2006353184 A JP 2006353184A JP 2008167061 A JP2008167061 A JP 2008167061A
Authority
JP
Japan
Prior art keywords
group
govu
pictures
access unit
video
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006353184A
Other languages
English (en)
Inventor
Emi Maruyama
恵美 丸山
Minoru Outa
実 巨田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006353184A priority Critical patent/JP2008167061A/ja
Priority to US11/959,937 priority patent/US20080159636A1/en
Publication of JP2008167061A publication Critical patent/JP2008167061A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/114Adapting the group of pictures [GOP] structure, e.g. number of B-frames between two anchor frames
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/142Detection of scene cut or scene change
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/162User input
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Television Signal Processing For Recording (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】再生時に不具合を起こさない、複数の再生経路を有する映像コンテンツを作成すること。
【解決手段】エンコーダ502のGOVU構成決定部504は、映像データ中の複数の選択可能なコンテンツの各々に含まれる複数のグループ・オブ・ビデオ・アクセス・ユニットのうち、最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を調整することで、最後のグループ・オブ・ビデオ・アクセス・ユニットが所定の数のピクチャを含むように、映像データのGOVU構成を決定する。符号化部506は、GOVU構成決定部504によって決定されたGOVU構成に基づいて、映像データを符号化する。
【選択図】 図5

Description

本発明は一般に、符号化装置及び符号化方法に関し、特に、映像コンテンツの符号化装置及び符号化方法に関する。
DVD等の光ディスクに1本の映画を記録する場合、その映画の複数のバージョンが光ディスクに記録される場合がある。例えば、ある映画の本編(メインストーリー)に加えて、複数のサイドストーリーが光ディスクに記録され得る。このような機能は、マルチストーリー機能と呼ばれている。サイドストーリーの例としては、暴力シーン等の子供に不適当なシーンを含まないサイドストーリー、劇場版には採用されなかったシーンを含むサイドストーリー、国別に用意されるサイドストーリーなどがある。また、例えば、ある映画の劇場公開版、完全版、及びディレクターズカットを含む非公開版の3つのバージョンが、必要シーンをマルチストーリーとすることで、光ディスクに記録されることもあり得る。
このように映画の複数のバージョンが記録された光ディスクを再生する際、ユーザは、複数のバージョンのうちの1つを、例えばメニューからリモコンを操作して選択することができる。いずれのバージョンが選択された場合でも、異なるデータを結合し、映像及び音声をシームレスに再生する必要がある。
従来、異なるデータを結合する種々の技術が提案されている。例えば、入力されたトランスポートストリーム内の各符号化映像データストリームをそれぞれ元のエレメンタリーストリームに分解して記憶手段に記憶し、その複数のエレメンタリーストリームのうち連結対象のストリームの発生符号量を解析し、その解析結果に基づいて連結対象のストリームを連結すると共に連結点に所望量のデータを挿入することにより結合映像データストリームを生成する技術がある(例えば、特許文献1参照)。
特開平11−261958号公報
ところで、DVD規格は映像圧縮規格の一つとしてMPEG2を採用している。MPEG2では、映像ビットストリームが複数のGOP(Group of Pictures)で構成される。このGOPは、複数のピクチャ(アクセス・ユニット)で構成される。構成されるピクチャは、Iピクチャと呼ばれる画面内予測でエンコードされるピクチャ、Pピクチャと呼ばれる順方向画面間予測(過去のIまたはPピクチャ1枚からの予測)でエンコードされるピクチャ、Bピクチャと呼ばれる双方向画面間予測(過去のIまたはPピクチャ1枚と未来のIまたはPピクチャ1枚からの予測)でエンコードされるピクチャの3種類である。多くの場合、GOPのピクチャ数は特異点以外では変動せず、エンコーダ仕様で決められた数が継続する。代表的な特異点は、DVDのチャプタ点である。チャプタとは、再生する全編を複数に区切った単位をいい、チャプタ点とはその開始点を示す。チャプタ点に望まれることは、ランダムアクセス性である。チャプタ点をIピクチャとすることにより、前後のピクチャのデコードをすることなくIピクチャから再生を開始することができる。MPEG2では、映像コンテンツがマルチストーリーを有する場合、各メインストーリー及びサイドストーリーの最後のGOPのピクチャの数を同一とする必要がない。従って、エンコードするピクチャ数が1GOPとして決められたピクチャ数の倍数でない場合の残余のピクチャには、何の特別な考慮もなく、各サイドストーリーの最後のGOPに割り当てられる場合が多い。
一方、HD DVD規格及びBlu−Ray規格は、映像符号化方式としてMPEG4 AVC/H.264(以下、「MPEG4 AVC」と略記する)を採用している。HD DVD規格では、MPEG4 AVCによる映像ビットストリームがグループ・オブ・ビデオ・アクセス・ユニット(Group of Video Access Unit)(以下、「GOVU」と称する)と呼ばれるHD DVD規格で定義された単位で、構成されるように規定されている。1GOVUは1バイト以上のNAL(Network Abstraction Layer)ユニットと呼ばれる一種のパケットで構成される。GOVUの先頭ピクチャは、ピクチャデータの前にヘッダとしてAccess Unit Delimiter、SPS(Sequence Parameter Set)、SEI(Supplemental Enhancement Information)(1)、PPS(Picture Parameter Set)、SEI(2)の順にデータが存在する。2番目以降の各ピクチャは、Access Unit Delimiter、PPS、SEI(3)、ピクチャデータの順にデータが存在する。先頭ピクチャのSEI(2)には、バッファリング期間SEI(Buffering Period SEI)などがあり、SEI(2)にはピクチャタイミングSEI(Picture Timing SEI)などがある。2番目以降のピクチャのSEI(3)にはピクチャタイミングSEIはあるが、バッファリング期間SEIはない。バッファリング期間SEI、ピクチャタイミングSEI共に、バッファ管理のための付加情報を伝送するために存在する。MPEG4 AVCでは、画面内予測でエンコードされるIピクチャ、順方向画面間予測でエンコードされるPピクチャ、MPEG2とは違い過去、未来を問わずに2枚のピクチャからの予測でエンコードされるBピクチャがあるのに加えて、IDRピクチャがある。IDRピクチャはMPEG2におけるIピクチャの役割を果たす。実は、MPEG4 AVCではIピクチャより過去のピクチャから予測してもよく、これではIピクチャからデコード開始しても正しく再生できない可能性がある。IDRピクチャがある場合、IDRより過去のピクチャを予測として使用できない。実際、チャプタ点などランダムアクセスすべきピクチャでは、IDRピクチャとなっている。他ピクチャをエンコードする際に、予測として使用されるピクチャを参照ピクチャと呼び、予測として使用されないピクチャを非参照ピクチャと呼ぶ。MPEG4 AVCでは1GOVUに含まれるピクチャの数は、当該GOVUの全表示時間が0.6006秒以下になるように規定されているので、当然、映画など映像コンテンツは複数GOVUで構成される。このGOVUは、GOPと同様、複数のピクチャ(アクセス・ユニット)で構成されるように規定されている。MPEG4 AVCにおいては、先行するGOVUのピクチャの数の情報を、次のGOVUの先頭のピクチャのバッファ管理情報エリア(cpb_removal_delay)に書き込むことができ、HD DVD規格においてはこれを必須としている。従って、HD DVD規格の映像コンテンツがマルチストーリーを有し、これらの各メインストーリー及びサイドストーリーが、例えば1つのメインストーリーに合流する場合、各メインストーリー及びサイドストーリーの最後のGOVUのピクチャの数を同一にしないと、H.264規格違反となる上、シームレスな再生が困難になる等、再生時に不具合を起こす可能性がある。特許文献1に記載された技術では、記憶手段内のデータ量を調整しているが、上述した問題に対応することはできない。
そこで、本発明は、再生時に不具合を起こさない、複数の再生経路を有する映像コンテンツを作成できる符号化装置及び符号化方法を提供することを目的とする。
上記課題を解決するために、本発明の一つの面によれば、MPEG4 AVCに準拠した、映像データの符号化を行う符号化装置であって、前記映像データ中の、複数の選択可能なコンテンツの各々に含まれる複数のグループ・オブ・ビデオ・アクセス・ユニットのうち、最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を調整することで、最後のグループ・オブ・ビデオ・アクセス・ユニットが所定の数のピクチャを含むように、前記映像データのグループ・オブ・ビデオ・アクセス・ユニット構成を決定するGOVU構成決定部と、前記GOVU構成決定部によって決定されたグループ・オブ・ビデオ・アクセス・ユニット構成に基づいて、前記映像データを符号化する符号化部とを具備することを特徴とする符号化装置が提供される。
また、本発明の別の面によれば、MPEG4 AVCに準拠した、映像データの符号化を行う符号化方法であって、前記映像データ中の、複数の選択可能なコンテンツの各々に含まれる複数のグループ・オブ・ビデオ・アクセス・ユニットのうち、最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を調整することで、最後のグループ・オブ・ビデオ・アクセス・ユニットが所定の数のピクチャを含むように、前記映像データのグループ・オブ・ビデオ・アクセス・ユニット構成を決定するステップと、前記グループ・オブ・ビデオ・アクセス・ユニット構成に基づいて、前記映像データを符号化するステップとを具備することを特徴とする符号化方法が提供される。
本発明によれば、再生時に不具合を起こさない、複数の再生経路を有する映像コンテンツを作成できる符号化装置及び符号化方法を提供することができる。
以下、本発明の実施形態について図面を参照しながら説明する。
まず、図1を参照しつつ、MPEG4 AVCにおける仮想デコーダモデルについて説明する。
MPEG4 AVCでは、仮想デコーダモデルを規定している。仮想デコーダモデルとは、デコーダの動作(バッファの状態)を仮想的にモデル化したものである。エンコーダは、仮想デコーダモデルを破綻させないようにビットストリームを生成する必要がある。また、デコーダ(例えば、HD DVDプレイヤのデコード回路)は、仮想デコーダモデルに準拠する必要がある。
仮想デコーダモデルは、2つのバッファ、即ち、符号化ピクチャバッファ(CodedPicture Buffer:CPB)及び復号ピクチャバッファ(Decoded Picture Buffer:DPB)を含む。符号化ピクチャバッファは、デコーダに入力される前のビットストリームを格納する。復号ピクチャバッファは、デコーダがデコードしたピクチャを格納する。
図1は、MPEG4 AVC標準が規定する仮想デコーダモデルの処理を説明するためのフローチャートである。まず、ビットストリームは、仮想ストリームスケジューラ(Hypothetical Stream Scheduler:HSS)によって、規定の到着時刻に符号化ピクチャバッファに入力される(ステップS102)。入力されたビットストリームは、一定の時間(cpb_removal_delay)後に符号化ピクチャバッファから瞬時に引き抜かれる(ステップS104)。引き抜かれたビットストリームは、仮想デコーダによって瞬時にデコードされる(ステップS106)。デコードされたデータ(ピクチャ)は参照ピクチャか否かが判定される(ステップS108)。
デコードされたピクチャが参照ピクチャである場合(ステップS108でYES)、デコードされたピクチャは復号ピクチャバッファに入力される(ステップS110)。入力されたピクチャは、一定時間の経過(dpb_output_delay)後、復号ピクチャバッファから引き抜かれ、クロッピング処理後に出力される(ステップS112)。また、復号ピクチャバッファに格納されている参照ピクチャは、後から入力されるピクチャをデコードするために利用される(ステップS110からステップS106へ)。一方、デコードされたピクチャが非参照ピクチャの場合(ステップS108でNO)、当該ピクチャはデコード後に瞬時に利用される。即ち、ピクチャはクロッピング処理後に出力される(ステップS112)。
なお、クロッピング処理とは、出力する画像の形態に合わせて、上下左右の画素を取り除く処理をいう。また、cpb_removal_delay及びdpb_output_delayは、ピクチャタイミングSEI(Supplemental Enhancement Information)に記述されている。
次に、図2及び図3を参照しつつ、上記cpb_removal_delayについて、具体例を伴い説明する。
図2は、入力映像データがビデオ(インタレース)の場合におけるcpb_removal_delayを説明するための概略図である。図2中、最上段の数字(0、2、4、…)は、GOVUの先頭ピクチャ(図2に示す例では、I又はI18)が符号化ピクチャバッファに入力されたタイミングを基準(0)として、そこから経過した時間を表し、その単位はClock Tick(CT)である。このCTはVUI(Video Usability Information、ビデオ表示情報)パラメータ中に記載されているnum_units_in_tick及びtime_scaleを用いて、num_units_in_tick/time_caleを計算することで求められる。例えば、出力時のフレームレートがNTSCインタレースの標準である29.97Hz(フィールド周波数が59.94Hz)である場合、CT=1001/60000=16.68msとなる。
上から2段目のアルファベットと数字の組合せ(I、B、B、…)は、符号化順でのピクチャの並びの一例で、IはIピクチャ、PはPピクチャ、BはBピクチャを示す。なお、IからB14までが1GOVUに相当する。
上から3段目の数字(30、2、4、…)は、cpb_removal_delayを表す。MPEG4 AVCにおいて、cpb_removal_delayとは、バッファリング期間SEI(Buffering Period SEI)で指定されるピクチャが符号化ピクチャバッファから引き抜かれる時刻を基準に、現在のピクチャが符号化ピクチャバッファから引き抜かれるまでの時間差をいう。HD DVD規格において、GOVUの先頭ピクチャ(図2の例では、I又はI18)は、バッファリング期間SEIを必ず含んでいる。
上から4段目の数字(6、0、0、…)は、各ピクチャのdpb_output_delayを表す。dpb_output_delayとは、図1を参照しつつ説明したように、ピクチャが復号ピクチャバッファに入力されてから引き抜かれるまでの時間であり、単位はCTである。
最下段の数字(3、3、3、…)は、pic_structを表す。pic_structは、ピクチャタイミングSEI(Picture Timing SEI)に記述されており、デコード後に表示されるフィールド構成を示す。例えば、「3」はフィールド順がトップ−ボトムであることを表す。入力データと表示出力データ(例えば、モニタ、テレビ等)共にインタレース方式であるので、フィールド数の増減はない。
図3は、入力データが映画の場合におけるcpb_removal_delayを説明するための概略図である。また、図3においても、図2と同様に、最上段は、GOVUの先頭ピクチャ(図3に示す例では、I又はI15)が符号化ピクチャバッファに入力されたタイミングを基準(0)として、そこから経過した時間を表す。また、上から2段目のアルファベットと数字の組合せ(I、B、B、…)は、符号化順でのピクチャの並びを表し、上から3段目の数字(30、3、5、…)は、cpb_removal_delayを表す。更に、上から4段目の数字(8、0、0、…)は、各ピクチャのdpb_output_delayを表し、最下段の数字(4、3、5、…)は、pic_structを表す。なお、「4」、「5」及び「6」は、それぞれフィールド順が「ボトム−トップ」、「トップ−ボトム−トップ」、及び「ボトム−トップ−ボトム」であることを表す。
図3中の最下段を見れば分かるように、映画の場合、ビデオとは異なり、「トップ−ボトム−トップ」及び「ボトム−トップ−ボトム」といったフィールド組合せが存在する。ビデオは、30フレーム/秒で記録されるのに対して、映画は24フレーム/秒で記録される。従って、映画のフレーム周期は、ビデオのフレーム周期の4/5となる。このため、映画のデータを符号化する場合、符号化するピクチャの枚数をビデオの枚数と同じにする処理(24フレーム/秒から30フレーム/秒にする)が必要になる。これを3:2プルダウン処理と呼ぶ。
図2及び図3を参照すると、各GOVUの先頭ピクチャ(図2ではI18、図3ではI15)のバッファリング期間SEIにおいて指定されるcpb_removal_delayは、「30」である。つまり、先行するGOVUの先頭ピクチャ(バッファリング期間SEIで指定されるピクチャ、図2及び図3においてI)が符号化ピクチャバッファに入力されてから、続くGOVUの先頭ピクチャが符号化ピクチャバッファに入力されるまで、表示時間で30CTの遅延があることになる。入力データがインタレース方式のビデオである場合、GOVU内のピクチャの数(例えば、15)×2×CTという計算式が成り立つ。一方、入力データが映画である場合、3:2プルダウン処理が発生するために、GOVU内のピクチャの数(例えば、12)×2×5/4×CTという計算式が成り立つ。入力データがビデオと映画のいずれであっても、バッファリング期間SEIで指定されるピクチャのcpb_removal_delayには、先行するGOVUのピクチャの数の情報が必要となる。
次に、図4を参照しつつ、具体的な映像コンテンツの例に対するデコード処理について説明する。
図4は、複数の再生経路(複数の選択可能なコンテンツ)を有する映像コンテンツ(映像データ、ビデオソース)の構成を説明するための概略図である。なお、本明細書において、複数の選択可能なコンテンツとは、同一のコンテンツに結合される複数の選択可能なコンテンツをいう。図4においては、本編Y、サイドストーリーA、サイドストーリーB、及びサイドストーリーCが、複数の選択可能なコンテンツに相当し、これらのコンテンツは同一のコンテンツ、即ち、本編Zに結合される。
図4に示される映像コンテンツは、本編(メインストーリー)Xを再生した後、本編Y、サイドストーリーA、サイドストーリーB、及びサイドストーリーCのうちのいずれか1つのコンテンツを選択して再生することができる。選択されたコンテンツを再生した後は、図4中のポイントPから本編Zの再生に進む。なお、いずれのコンテンツが選択された場合も、そのコンテンツの再生後に本編Zの再生に進む。例えば、ユーザは、「劇場公開版」を選択する代わりに、「完全版」を選択することで、再生機では「劇場公開版」の本編X→本編Y→本編Zという再生順序を、「完全版」の本編X→サイドストーリーB→本編Zという再生順序に変更することができる。また、図4に示されるように、本編Y、サイドストーリーA、サイドストーリーB、及びサイドストーリーCの各々の長さ(ピクチャの数)は、異なり得る。
上述したように、MPEG4 AVCにおいては、先行するGOVUのピクチャの数の情報を、続くGOVUの先頭のピクチャのcpb_removal_delayに書き込む必要がある。従って、図4に示される映像コンテンツの場合、本編Zの先頭のGOVUから見て先行するGOVU、即ち、本編Yの最後のGOVU、サイドストーリーAの最後のGOVU、サイドストーリーBの最後のGOVU、及びサイドストーリーCの最後のGOVU、のピクチャの数の情報を、本編Zの先頭のGOVUの先頭のcpb_removal_delayに記述することになる。このため、本編Yの最後のGOVU、サイドストーリーAの最後のGOVU、サイドストーリーBの最後のGOVU、及びサイドストーリーCの最後のGOVUの各々のピクチャの数を同一にする必要がある。換言すれば、本編Yの最後のGOVU、サイドストーリーAの最後のGOVU、サイドストーリーBの最後のGOVU、及びサイドストーリーCの最後のGOVUの各々のピクチャの数を、本編Zの先頭のGOVUの先頭のピクチャのcpb_removal_delayに記述されるピクチャの数と等しくする処理を行う必要がある。以下、説明の都合上、このような処理をGOVU長さ調整処理と称する。
図5、図6、及び図7を参照しつつ、本発明の一実施形態に係る、GOVU長さ調整処理を実現するための符号化装置について説明する。
図5は、本発明の一実施形態に係る符号化装置の構成を、概略的に示すブロック図である。この符号化装置は、エンコーダ502として実現されている。エンコーダ502は、映像データ(ビデオソース)の圧縮処理を行う装置である。エンコーダ502は、GOVU構成決定部504と符号化部506とを備える。
GOVU構成決定部504は、ユーザにより設定されるパラメータ(例えば、解像度、フレームレート等)、チャプタ点情報、及びIピクチャ挿入箇所等の各種情報を受け取る。GOVU構成決定部504は、受け取った情報に基づいて、映像データのGOVU構成を決定し、決定されたGOVU構成の情報を符号化部506に供給する。より具体的には、GOVU構成決定部504は、映像データ中の、複数の選択可能なコンテンツ(例えば、図4に示す本編Y、サイドストーリーA、B、及びC)の各々に含まれる複数のグループ・オブ・ビデオ・アクセス・ユニットのうち、最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を調整することで、最後のグループ・オブ・ビデオ・アクセス・ユニットが所定の数のピクチャを含むように、映像データのGOVU構成を決定する。決定されたGOVU構成は、GOVU構成決定部504から符号化部506に供給される。
符号化部506は、GOVU構成決定部504によって決定されたGOVU構成に基づいて、映像データ(ビデオソース)を符号化する。より具体的には、GOVU構成決定部504から供給されたGOVU構成に基づいて映像データの圧縮処理を行い、映像ビットストリーム及びログファイルを出力する。このとき、先行するGOVUのピクチャの数の情報を、次のGOVUの先頭ピクチャのcpb_removal_delayに挿入して符号化を行う。なお、DVD、HD DVD等の媒体に映像データを記録する際に行われる圧縮処理では、デジタル放送における圧縮処理とは異なり、可変ビットレート方式が採用される。可変ビットレート方式では、処理対象の映像データの難易度に応じて、ビットレートの割り当てが行われる。このような処理方法は2パスエンコード方式と呼ばれる。更に、一般には、圧縮処理の結果生成された映像ビットストリームを再生し、画質評価を行う。画質評価を行った後、圧縮歪みがあるシーンに対してパラメータ及びビットレート等の再調整を行い、再度圧縮処理が行われる。この再圧縮処理において、最後から2番目のGOVUに含まれるピクチャの数を剰余分と同じくするのではなく、最後及び最後から2番目のGOVU以外のGOVUに含まれるピクチャ数を剰余分とすることも可能である。
図6及び図7を参照しつつ、図5に示されるGOVU構成決定部504について、より詳細に説明する。
図6は、GOVU構成決定部504の構成を概略的に示すブロック図である。図7は、GOVU構成決定部504によって決定された、各サイドストーリーのGOVU構成を説明するための概略図である。
図6に示されるように、GOVU構成決定部504は、第1の算出部(#1)601と第2の算出部(#2)602と、設定部604とを備える。第1の算出部601ではユーザによって設定されたパラメータ及びチャプタ点情報/Iピクチャ挿入箇所の情報から、必要な情報を算出する。MPEG2と同様に、GOVUのピクチャ数はチャプタ点やユーザが指定したIピクチャ挿入箇所などで変更される。最寄りのGOVU位相の変更位置とは、これらの点を示す。第2の算出部602は、最寄りのGOVUの位相の変更位置(A)の情報と、コンテンツの終了位置(B)の情報と、1つのGOVUに含まれるべき所定のピクチャの数(C)の情報とを受け取る。第2の算出部602は、受け取った情報に基づいて、コンテンツの終了位置(B)と最寄りのGOVU位相の変更位置(A)との差を、所定のピクチャの数(C)で除算する。即ち、(B−A)/Cの値を算出する。算出の結果、商及び剰余が得られる。算出の結果得られた商は、コンテンツに含まれるGOVUの数を表す。一方、算出の結果得られた剰余は、残りのピクチャの数を表す。なお、言うまでもなく、この残りのピクチャの数は、所定のピクチャの数(C)よりも小さい。第2の算出部602は、これらの商及び剰余の情報を設定部604に出力する。なお、コンテンツ(例えば、サイドストーリーA)について、(B−A)/Cの値を算出した結果、剰余が得られなかった場合は、当該コンテンツの全てのGOVUが所定の数のピクチャを含むこととなる。従って、この場合、再生時に問題は発生しない。
設定部604は、第2の算出部602から供給された商及び剰余の情報に基づいて、複数の選択可能なコンテンツの各々について、最後から2番目のGOVUに含まれるピクチャの数を、第2の算出部602から出力された剰余に対応する数に設定する。即ち、最後から2番目のGOVUに含まれるピクチャの数は、剰余分のピクチャの数と一致する。従って、各コンテンツにおいて、最後から2番目以外のGOVUの各々は、同一数のピクチャ(所定の数のピクチャ(C))を含むことになる。従って、複数のコンテンツの各々において、最後のGOVUに含まれるピクチャの数は、互いに同一となる。
図7を参照しつつ、設定部604が行う処理を、より詳細に説明する。
図7は、GOVU構成決定部504の設定部604によって決定された、各コンテンツのGOVU構成を説明するための概略図である。図7は、映像コンテンツが複数の再生経路(選択可能なコンテンツ)、即ち、メインストーリー、サイドストーリーA、B、及びCを有する場合を想定している。また、図7を見れば分かるように、メインストーリー、サイドストーリーA、B、及びCは、それぞれ異なる長さ(ピクチャの数)を有する。図7中、2つの菱形の間の実線は、1つのGOVUを表し、2つの菱形の間の点線は、長さ調整が行われたGOVUを表している。
まず、メインストーリーYのGOVU構成について説明する。設定部604は、第2の算出部602から供給される、メインストーリーYのGOVU数(商)及び残りのピクチャの数(剰余)の情報に基づき、メインストーリーYの最後から2番目のGOVU(YL−1)のピクチャの数を、残りのピクチャの数に設定する。換言すれば、メインストーリーYの最後から2番目のGOVUのピクチャの数は、第2の算出部602による算出の結果得られた剰余に対応する数である。従って、メインストーリーYの最後のGOVU(Y)は、メインストーリーYの最後から2番目のGOVU(YL−1)を除く全てのGOVUと同じ数のピクチャを含み、最後から2番目のGOVU(YL−1)は、その他のGOVUとは異なる数のピクチャを含む。
サイドストーリーAのGOVU構成について説明する。設定部604は、第2の算出部602から供給される、サイドストーリーAのGOVU数(商)及び残りのピクチャの数(剰余)の情報に基づき、サイドストーリーAの最後から2番目のGOVU(AL−1)のピクチャの数を、残りのピクチャの数に設定する。換言すれば、サイドストーリーAの最後から2番目のGOVUのピクチャの数は、第2の算出部602による算出の結果得られた剰余に対応する数である。従って、サイドストーリーAの最後のGOVU(A)は、サイドストーリーAの最後から2番目のGOVU(AL−1)を除く全てのGOVUと同じ数のピクチャを含み、最後から2番目のGOVU(AL−1)は、その他のGOVUとは異なる数のピクチャを含む。
同様に、設定部604は、第2の算出部602から供給される、サイドストーリーBのGOVU数(商)及び残りのピクチャの数(剰余)の情報に基づき、サイドストーリーBの最後から2番目のGOVU(BL−1)のピクチャの数を、残りのピクチャの数に設定する。従って、サイドストーリーBの最後のGOVU(B)は、サイドストーリーBの最後から2番目のGOVU(BL−1)を除く全てのGOVUと同じ数のピクチャを含み、最後から2番目のGOVU(BL−1)は、その他のGOVUとは異なる数のピクチャを含む。
また、設定部604は、第2の算出部602から供給される、サイドストーリーCのGOVU数(商)及び残りのピクチャの数(剰余)の情報に基づき、サイドストーリーCの最後から2番目のGOVU(CL−1)のピクチャの数を、残りのピクチャの数に設定する。従って、サイドストーリーCの最後のGOVU(C)は、サイドストーリーCの最後から2番目のGOVU(CL−1)を除く全てのGOVUと同じ数のピクチャを含み、最後から2番目のGOVU(CL−1)は、その他のGOVUとは異なる数のピクチャを含む。
従って、メインストーリーYの最後のGOVU(Y)のピクチャの数、サイドストーリーAの最後のGOVU(A)のピクチャの数、サイドストーリーBの最後のGOVU(B)のピクチャの数、及びサイドストーリーCの最後のGOVU(C)のピクチャの数は、同一となるように設定部604によって制御される。一方で、メインストーリーYの最後から2番目のGOVU(YL−1)のピクチャの数、サイドストーリーAの最後から2番目のGOVU(AL−1)のピクチャの数、サイドストーリーBの最後から2番目のGOVU(BL−1)のピクチャの数、及びサイドストーリーCの最後から2番目のGOVU(CL−1)のピクチャの数は、互いに異なっていても構わない。これは、次のコンテンツ(例えば、図4に示す本編Z)の先頭のGOVUの先頭のピクチャのバッファ管理エリアに格納されるのは、その先頭のGOVUに先行するGOVU、即ち、先行するコンテンツ(例えば、図4に示すサイドストーリーA)の最後のGOVUに含まれるピクチャの数の情報であり、最後から2番目のGOVUに含まれるピクチャの数の情報ではないためである。
以上の説明から分かるように、エンコーダ502は、本編X、Y、及びZ、並びにサイドストーリーA、B、及びC(図4を参照)の各々に対して2パスエンコードを行う際には、本編Y並びにサイドストーリーA、B、及びCの各々の、最後のGOVUの長さ(ピクチャの数)が所定の長さ(所定のピクチャの数)となるように、最後から2番目のGOVUの長さを調整する処理を行う。従って、映像コンテンツが複数の再生経路(選択可能なコンテンツ)を有する場合、各サイドストーリーの最後のGOVUのピクチャの数を同一となるように制御することができる。このため、複数の再生経路のうちのいずれ(例えば、サイドストーリーA)が選択された場合であっても、続くコンテンツ(例えば、本編Z)の再生時に不具合を起こさず、シームレスに再生することができる。
次に、図8を参照しつつ、本発明の一実施形態に係る符号化方法について説明する。
図8は、本発明の一実施形態に係る、符号化方法を説明するためのフローチャートである。この符号化方法は、映像データを符号化する機能を有する任意の装置に適用することができる。以下、説明の都合上、本実施形態に係る符号化方法を、上述したエンコーダ502に適用した場合を例に説明する。
まず、映像データの、最寄りのGOVU位相の変更位置(A)の情報、コンテンツの終了位置(B)の情報、及び1つのGOVUに含まれるべき所定のピクチャの数(C)の情報をエンコーダ502(より具体的には、GOVU構成決定部504)に入力する(ステップS802)。次いで、コンテンツの終了位置(B)と最寄りのGOVU位相の変更位置(A)との差を、所定のピクチャの数(C)で除算し、即ち、「(B−A)/C」をエンコーダ502(より具体的には、第2の算出部602)によって算出し、その商及び剰余を得る(ステップS804)。なお、ステップS804において剰余が発生しない場合は、商のみを求めればよい。剰余が得られなかった場合は、コンテンツの全てのGOVUが所定の数のピクチャを含むこととなり、再生時に問題は発生しないためである。
エンコーダ502(より具体的には、設定部604)は、映像データ中の複数コンテンツの各々に含まれる複数のGOVUのうち、最後から2番目のGOVUに含まれるピクチャの数を、上記剰余に対応する数に設定する(ステップS806)。即ち、コンテンツの最後から2番目のGOVUの長さ(ピクチャの数)を調整する処理を行う。より詳細には、エンコーダ502(より具体的には、設定部604)は、映像コンテンツが有する複数の再生経路(選択可能なコンテンツ)の各々について、最後から2番目のGOVUの長さを調整する処理を行い、最後のGOVUに含まれるピクチャの数が複数の再生経路間で同一となるように制御する。
つまり、ステップS802、S804、及びS806の処理では、映像データ中の、複数の選択可能なコンテンツの各々に含まれる複数のGOVUのうち、最後から2番目のGOVUに含まれるピクチャの数を調整することで、最後のGOVUが所定の数のピクチャを含むように、映像データのGOVU構成が決定される。
ステップS806の処理の後、決定されたGOVU構成に基づいて、映像データが符号化される(ステップS808)。
上述した符号化方法によれば、映像コンテンツが複数の再生経路(選択可能なコンテンツ)を有する場合、各再生経路の最後のGOVUのピクチャの数を同一となるように制御することができる。このため、複数の再生経路のうちのいずれ(例えば、サイドストーリーA)が選択された場合であっても、続くコンテンツ(例えば、本編Z)の再生時に不具合を起こさず、シームレスに再生することができる。
なお、上述した符号化方法は、コンピュータによって実行可能なプログラムとしても実現できる。この場合も、上記の符号化方法を用いた場合と同様の機能及び効果を得ることができる。
なお、本発明は、上記実施形態そのままに限定されるものではない。本発明は、実施段階では、その要旨を逸脱しない範囲で構成要素を変更して具現化できる。
また、上記実施形態に開示されている複数の構成要素を適宜に組み合わせることで、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
MPEG4 AVC標準が規定する仮想デコーダの処理を説明するためのフローチャートである。 入力映像データがビデオの場合におけるcpb_removal_delayを説明するための概略図である。 入力映像データが映画の場合におけるcpb_removal_delayを説明するための概略図である。 複数の再生経路を有する映像コンテンツの構成を説明するための概略図である。 本発明の一実施形態に係る符号化装置の構成を概略的に示すブロック図である。 図5に示すGOVU構成決定部の構成を概略的に示すブロック図である。 GOVU構成決定部の設定部によって決定された、各サイドストーリーのGOVU構成を説明するための概略図である。 本発明の一実施形態に係る符号化方法を説明するためのフローチャートである。
符号の説明
502…エンコーダ、504…GOVU構成決定部、506…符号化部、601…第1の算出部、602…第2の算出部、604…設定部。

Claims (6)

  1. MPEG4 AVCに準拠した、映像データの符号化を行う符号化装置であって、
    前記映像データ中の、複数の選択可能なコンテンツの各々に含まれる複数のグループ・オブ・ビデオ・アクセス・ユニットのうち、最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を調整することで、最後のグループ・オブ・ビデオ・アクセス・ユニットが所定の数のピクチャを含むように、前記映像データのグループ・オブ・ビデオ・アクセス・ユニット構成を決定するGOVU構成決定部と、
    前記GOVU構成決定部によって決定されたグループ・オブ・ビデオ・アクセス・ユニット構成に基づいて、前記映像データを符号化する符号化部と
    を具備することを特徴とする、符号化装置。
  2. 前記GOVU構成決定部は、
    最寄りのグループ・オブ・ビデオ・アクセス・ユニット位相の変更位置(A)の情報と、コンテンツの終了位置(B)の情報と、1つのグループ・オブ・ビデオ・アクセス・ユニットに含まれるべき所定のピクチャの数(C)の情報とを受け取り、前記コンテンツの終了位置(B)と前記最寄りのグループ・オブ・ビデオ・アクセス・ユニット位相の変更位置(A)との差を、前記所定のピクチャの数(C)で除算し、その商及び剰余を出力する算出部と、
    前記最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を、前記算出部から出力された前記剰余に対応する数に設定する設定部と
    を具備することを特徴とする、請求項1記載の符号化装置。
  3. 前記符号化部は、先行するグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数の情報を、次のグループ・オブ・ビデオ・アクセス・ユニットの先頭のピクチャのバッファ管理情報エリアに書き込み、前記映像データを符号化することを特徴とする、請求項1記載の符号化装置。
  4. MPEG4 AVCに準拠した、映像データの符号化を行う符号化方法であって、
    前記映像データ中の、複数の選択可能なコンテンツの各々に含まれる複数のグループ・オブ・ビデオ・アクセス・ユニットのうち、最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を調整することで、最後のグループ・オブ・ビデオ・アクセス・ユニットが所定の数のピクチャを含むように、前記映像データのグループ・オブ・ビデオ・アクセス・ユニット構成を決定するステップと、
    前記グループ・オブ・ビデオ・アクセス・ユニット構成に基づいて、前記映像データを符号化するステップと
    を具備することを特徴とする、符号化方法。
  5. 前記グループ・オブ・ビデオ・アクセス・ユニット構成を決定するステップは、
    最寄りのグループ・オブ・ビデオ・アクセス・ユニット位相の変更位置(A)の情報と、コンテンツの終了位置(B)の情報と、1つのグループ・オブ・ビデオ・アクセス・ユニットに含まれるべき所定のピクチャの数(C)の情報とを受け取るステップと、
    前記コンテンツの終了位置(B)と前記最寄りのグループ・オブ・ビデオ・アクセス・ユニット位相の変更位置(A)との差を、前記所定のピクチャの数(C)で除算し、その商及び剰余を得るステップと、
    前記最後から2番目のグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数を、前記剰余に対応する数に設定するステップと
    含むことを特徴とする、請求項4記載の符号化方法。
  6. 前記符号化を行うステップは、先行するグループ・オブ・ビデオ・アクセス・ユニットに含まれるピクチャの数の情報を、次のグループ・オブ・ビデオ・アクセス・ユニットの先頭のピクチャのバッファ管理情報エリアに書き込んで、前記映像データを符号化するステップを含むことを特徴とする、請求項4記載の符号化方法。
JP2006353184A 2006-12-27 2006-12-27 符号化装置及び符号化方法 Pending JP2008167061A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2006353184A JP2008167061A (ja) 2006-12-27 2006-12-27 符号化装置及び符号化方法
US11/959,937 US20080159636A1 (en) 2006-12-27 2007-12-19 Encoding apparatus and encoding method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006353184A JP2008167061A (ja) 2006-12-27 2006-12-27 符号化装置及び符号化方法

Publications (1)

Publication Number Publication Date
JP2008167061A true JP2008167061A (ja) 2008-07-17

Family

ID=39584105

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006353184A Pending JP2008167061A (ja) 2006-12-27 2006-12-27 符号化装置及び符号化方法

Country Status (2)

Country Link
US (1) US20080159636A1 (ja)
JP (1) JP2008167061A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013243761A (ja) * 2011-06-17 2013-12-05 Panasonic Corp 動画像圧縮復号システム
JP2013243760A (ja) * 2011-06-15 2013-12-05 Panasonic Corp 動画像圧縮復号システム
JP2018142984A (ja) * 2013-08-09 2018-09-13 ソニー株式会社 送信装置および送信方法
US11368744B2 (en) 2013-08-09 2022-06-21 Sony Corporation Device and associated method for using layer description and decoding syntax in multi-layer video

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012151576A (ja) 2011-01-18 2012-08-09 Hitachi Ltd 画像符号化方法、画像符号化装置、画像復号方法及び画像復号装置
US9374585B2 (en) * 2012-12-19 2016-06-21 Qualcomm Incorporated Low-delay buffering model in video coding
US20160345009A1 (en) * 2015-05-19 2016-11-24 ScaleFlux Accelerating image analysis and machine learning through in-flash image preparation and pre-processing
US11595652B2 (en) 2019-01-28 2023-02-28 Op Solutions, Llc Explicit signaling of extended long term reference picture retention
CN119052469A (zh) * 2019-01-28 2024-11-29 Op方案有限责任公司 扩展长期参考图片保留的在线和离线选择

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6570922B1 (en) * 1998-11-24 2003-05-27 General Instrument Corporation Rate control for an MPEG transcoder without a priori knowledge of picture type
JP2006203662A (ja) * 2005-01-21 2006-08-03 Toshiba Corp 動画像符号化装置・復号化装置及び符号化ストリーム生成方法

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013243760A (ja) * 2011-06-15 2013-12-05 Panasonic Corp 動画像圧縮復号システム
JP2016054534A (ja) * 2011-06-15 2016-04-14 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 符号化方法および符号化装置
JP2013243761A (ja) * 2011-06-17 2013-12-05 Panasonic Corp 動画像圧縮復号システム
JP2016042737A (ja) * 2011-06-17 2016-03-31 パナソニック インテレクチュアル プロパティ コーポレーション オブアメリカPanasonic Intellectual Property Corporation of America 復号方法および復号装置
JP2018142984A (ja) * 2013-08-09 2018-09-13 ソニー株式会社 送信装置および送信方法
JP2021132396A (ja) * 2013-08-09 2021-09-09 ソニーグループ株式会社 送信装置および送信方法
US11368744B2 (en) 2013-08-09 2022-06-21 Sony Corporation Device and associated method for using layer description and decoding syntax in multi-layer video
JP7095775B2 (ja) 2013-08-09 2022-07-05 ソニーグループ株式会社 送信装置および送信方法
JP2022126774A (ja) * 2013-08-09 2022-08-30 ソニーグループ株式会社 受信装置
JP7338745B2 (ja) 2013-08-09 2023-09-05 ソニーグループ株式会社 受信装置

Also Published As

Publication number Publication date
US20080159636A1 (en) 2008-07-03

Similar Documents

Publication Publication Date Title
JP4311570B2 (ja) 再生装置、ビデオ復号装置および同期再生方法
JP5568465B2 (ja) 画像復号装置、画像符号化装置、画像復号方法、画像符号化方法およびプログラム
JP4211947B2 (ja) 多重化装置および再生装置
JP6562992B2 (ja) デジタルビデオストリーミングにおけるトリック再生
JP4769717B2 (ja) 画像復号化方法
US20080159636A1 (en) Encoding apparatus and encoding method
US6891547B2 (en) Multimedia data decoding apparatus and method capable of varying capacity of buffers therein
KR100724206B1 (ko) 정보 처리 장치, 방법 및 기록 매체
JP4364176B2 (ja) 映像データ再生装置及び映像データ生成装置
KR100975170B1 (ko) 화상 데이터 재생 장치 및 방법
KR100834322B1 (ko) 이미지 인코딩 장치, 화상 인코딩 방법 및 이미지 편집장치
CN1998242A (zh) 编码流记录介质、图像编码装置和图像解码装置
JP2010161807A (ja) 記録媒体、映像データ再生装置及び映像データ生成装置
US20130287361A1 (en) Methods for storage and access of video data while recording
KR20070049504A (ko) 디지털 콘텐츠 재생 장치 및 그의 역방향 콘텐츠 저장 및재생방법
JP2008258858A (ja) 動画像符号化装置
JP2003179867A (ja) データ処理装置、データ処理方法、および情報記憶媒体、並びにコンピュータ・プログラム
JP2004180282A (ja) ストリーム情報再生装置、ストリーム情報再生方法、プログラム及びデジタル放送受信機
US8401360B2 (en) Apparatus and associated methodology for generating a picture-in-picture display from two video screens
JP2002027362A (ja) 画像処理方法及び装置
JP2007028212A (ja) 再生装置及び再生方法
JP2010206463A (ja) 動画像符号化方法、動画像符号化装置及び動画像符号化プログラム
JP2005159525A (ja) デジタル再生装置または再生方法
JP2007195064A (ja) 画像情報伝送装置、画像情報伝送方法、プログラム及び記憶媒体
JP2006187037A (ja) 画像再生方法