JP2004007571A - Encoding apparatus and method, decoding apparatus and method, editing apparatus and method, recording medium, and program - Google Patents
Encoding apparatus and method, decoding apparatus and method, editing apparatus and method, recording medium, and program Download PDFInfo
- Publication number
- JP2004007571A JP2004007571A JP2003107787A JP2003107787A JP2004007571A JP 2004007571 A JP2004007571 A JP 2004007571A JP 2003107787 A JP2003107787 A JP 2003107787A JP 2003107787 A JP2003107787 A JP 2003107787A JP 2004007571 A JP2004007571 A JP 2004007571A
- Authority
- JP
- Japan
- Prior art keywords
- bitstream
- buffer
- header
- decoding
- encoding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Television Signal Processing For Recording (AREA)
- Television Systems (AREA)
Abstract
【課題】バッファの破綻が発生しないような符号化および復号を行う。
【解決手段】ビットストリーム中のアクセス可能なポイントに含まれるランダムアクセスポイントヘッダ内に、最小ビットレート、最小バッファサイズ、最小初期遅延時間などの情報を含ませる。ビットストリーム解析部72は、入力されたビットストリームを解析し、上述したような情報を設定し、バッファ情報付加部73に出力する。バッファ情報付加部73は、入力されたビットストリームに、入力した情報を付加して出力する。本発明は、ビットストリームを扱う符号化装置や復号装置に適用できる。
【選択図】 図5Encoding and decoding are performed so that a buffer failure does not occur.
Information such as a minimum bit rate, a minimum buffer size, and a minimum initial delay time is included in a random access point header included in an accessible point in a bit stream. The bit stream analyzing unit 72 analyzes the input bit stream, sets information as described above, and outputs the information to the buffer information adding unit 73. The buffer information adding unit 73 adds the input information to the input bit stream and outputs it. The present invention can be applied to an encoding device and a decoding device that handle a bit stream.
[Selection] Figure 5
Description
【0001】
【発明の属する技術分野】
本発明は符号化装置および方法、復号装置および方法、編集装置および方法、記録媒体、並びにプログラムに関し、特に、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償によって圧縮された画像情報(ビットストリーム)を、衛星放送、ケーブルテレビジョン放送、インターネットなどのネットワークメディアを介して送受信する際に、若しくは光ディスク、磁気ディスク、フラッシュメモリのような記憶メディア上で処理する際に用いて好適な符号化装置および方法、復号装置および方法、編集装置および方法、記録媒体、並びにプログラムに関する。
【0002】
【従来の技術】
近年、画像情報をデジタルとして取り扱い、その際、効率の良い情報の伝送、蓄積を目的とし、画像情報特有の冗長性を利用して、離散コサイン変換等の直交変換と動き補償により圧縮するMPEG(Moving Picture Expert Group)などの方式に準拠した装置が、放送局などの情報配信、および一般家庭における情報受信の双方において普及しつつある。
【0003】
特に、MPEG2(ISO/IEC 13818−2)は、汎用画像圧縮方式として定義された規格であり、飛び越し走査画像及び順次走査画像の双方、並びに標準解像度画像及び高精細画像を網羅する標準で、例えばDVD(Digital Versatile Disk)規格に代表されるように、プロフェッショナル用途及びコンシューマ用途の広範なアプリケーションに広く用いられている。
【0004】
このMPEG2圧縮方式を用いることにより、例えば、720×480画素を持つ標準解像度の飛び越し走査画像に対しては4乃至8Mbps、1920×1088画素を持つ高解像度の飛び越し走査画像に対しては18乃至22Mbpsの符号量(ビットレート)を割り当てることで、高い圧縮率と良好な画質の実現が可能である。
【0005】
MPEG2は主として放送用に適合する高画質符号化を対象としていたが、より高い圧縮率の符号化方式には対応していなかったので、MPEG4符号化方式の標準化が行われた。画像符号化方式に関しては、1998年12月にISO/IEC 14496−2としてその規格が国際標準に承認された。
【0006】
さらに、近年、テレビ会議用の画像符号化を当初の目的として、国際電気連合の電気通信標準化部門であるITU−T (International Telecommunication Union − Telecommunication Standardization Sector)によるH.26L(ITU−T Q6/16VCEG)という標準の規格化が進んでいる。H.26Lは、MPEG2やMPEG4といった符号化方式に比べ、その符号化、復号に、より多くの演算量が要求されるものの、より高い符号化効率が実現されることが知られている。
【0007】
また、現在、MPEG4の活動の一環として、このH.26Lに基づいた、より高い符号化効率を実現する符号化技術の標準化がITU−Tと共同でJVT(Joint Video Team)として行われている。
【0008】
ここで、離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換と動き補償とによる画像圧縮について説明する。図1は、従来の画像情報符号化装置の一例の構成を示す図である。
【0009】
図1に示した画像情報符号化装置10において、入力端子11より入力されたアナログ信号からなる画像情報は、A/D変換部12により、デジタル信号に変換される。そして、画面並べ替えバッファ13は、A/D変換部12より供給された画像情報のGOP(Group of Pictures)構造に応じて、フレームの並べ替えを行う。
【0010】
ここで、画面並べ替えバッファ13は、イントラ(画像内)符号化が行われる画像に対しては、フレーム全体の画像情報を直交変換部15に供給する。直交変換部15は、画像情報に対して離散コサイン変換若しくはカルーネン・レーベ変換等の直交変換を施し、変換係数を量子化部16に供給する。量子化部16は、直交変換部15から供給された変換係数に対して量子化処理を施す。
【0011】
可逆符号化部17は、量子化部16から供給された量子化された変換係数や量子化スケール等から符号化モードを決定し、この符号化モードに対して可変長符号化、又は算術符号化等の可逆符号化を施し、画像符号化単位のヘッダ部に挿入される情報を形成する。そして、可逆符号化部17は、符号化された符号化モードを蓄積バッファ18に供給して蓄積させる。この符号化された符号化モードは、画像圧縮情報として出力端子19より出力される。
【0012】
また、可逆符号化部17は、量子化された変換係数に対して可変長符号化、若しくは算術符号化等の可逆符号化を施し、符号化された変換係数を蓄積バッファ18に供給して蓄積させる。この符号化された変換係数は、画像圧縮情報として出力端子19より出力される。
【0013】
量子化部16の挙動は、蓄積バッファ18に蓄積された変換係数のデータ量に基づいて、レート制御部20によって制御される。また、量子化部20は、量子化後の変換係数を逆量子化部21に供給し、逆量子化部21は、その量子化後の変換係数を逆量子化する。逆直交変換部22は、逆量子化された変換係数に対して逆直交変換処理を施して復号画像情報を生成し、その情報をフレームメモリ23に供給して蓄積させる。
【0014】
また、画面並べ替えバッファ13は、インター(画像間)符号化が行われる画像に関しては、画像情報を動き予測・補償部24に供給する。動き予測・補償部24は、同時に参照される画像情報をフレームメモリ23より取り出し、動き予測・補償処理を施して参照画像情報を生成する。動き予測・補償部24は、生成した参照画像情報を加算器14に供給し、加算器14は、参照画像情報を対応する画像情報との差分信号に変換する。また、動き予測・補償部24は、同時に動きベクトル情報を可逆符号化部17に供給する。
【0015】
可逆符号化部17は、量子化部16から供給され量子化された変換係数および量子化スケール、並びに動き予測・補償部24から供給された動きベクトル情報等から符号化モードを決定し、その決定した符号化モードに対して可変長符号化または算術符号化等の可逆符号化を施し、画像符号化単位のヘッダ部に挿入される情報を生成する。そして、可逆符号化部17は、符号化された符号化モードを蓄積バッファ18に供給して蓄積させる。この符号化された符号化モードは、画像圧縮情報として出力される。
【0016】
また、可逆符号化部17は、その動きベクトル情報に対して可変長符号化若しくは算術符号化等の可逆符号化処理を施し、画像符号化単位のヘッダ部に挿入される情報を生成する。
【0017】
また、イントラ符号化と異なり、インター符号化の場合、直交変換部15に入力される画像情報は、加算器14より得られた差分信号である。なお、その他の処理については、イントラ符号化を施される画像圧縮情報と同様であるため、その説明を省略する。
【0018】
次に、上述した画像情報符号化装置10に対応する画像情報復号装置の一例の構成を図2に示す。図2に示した画像情報復号装置40において、入力端子41より入力された画像圧縮情報は、蓄積バッファ42において一時的に格納された後、可逆復号部43に転送される。
【0019】
可逆復号部43は、定められた画像圧縮情報のフォーマットに基づき、画像圧縮情報に対して可変長復号若しくは算術復号等の処理を施し、ヘッダ部に格納された符号化モード情報を取得し逆量子化部44等に供給する。また同様に、可逆復号部43は、量子化された変換係数を取得し逆量子化部44に供給する。さらに、可逆復号部43は、復号するフレームがインター符号化されたものである場合には、画像圧縮情報のヘッダ部に格納された動きベクトル情報についても復号し、その情報を動き予測・補償部51に供給する。
【0020】
逆量子化部44は、可逆復号部43から供給された量子化後の変換係数を逆量子化し、変換係数を逆直交変換部45に供給する。逆直交変換部45は、定められた画像圧縮情報のフォーマットに基づき、変換係数に対して逆離散コサイン変換若しくは逆カルーネン・レーベ変換等の逆直交変換を施す。
【0021】
ここで、対象となるフレームがイントラ符号化されたものである場合、逆直交変換処理が施された画像情報は、画面並べ替えバッファ47に格納され、D/A変換部48におけるD/A変換処理の後に出力端子49から出力される。
【0022】
また、対象となるフレームがインター符号化されたものである場合、動き予測・補償部51は、可逆復号処理が施された動きベクトル情報とフレームメモリ50に格納された画像情報とに基づいて参照画像を生成し、加算器46に供給する。加算器46は、この参照画像と逆直交変換部45からの出力とを合成する。なお、その他の処理については、イントラ符号化されたフレームと同様であるため、説明を省略する。
【0023】
ところで、先に述べたJoint Video Teamで標準化が行われている符号化方式(以下JVT Codec)では、MPEG2やMPEG4などの符号化効率を改善するため、様々な方式が検討されている。例えば、離散コサイン変換の変換方法は、4×4ブロックサイズの整数係数変換が用いられている。そして、動き補償の際のブロックサイズが可変であり、より最適な動き補償が行えるようになっている。しかしながら、基本的な方式は、図1に示した画像情報符号化装置10において行われる符号化方式と同様に行うことが可能であるようにされている。
【0024】
従って、図2に示した画像情報復号装置40において行われる復号方式と、基本的に同じ方式により復号することが可能であるようにされている。
【0025】
ところで異なる復号装置(デコーダ)間での互換性を維持し、バッファをオーバーフローまたはアンダーフローさせないために、MPEGやITU−Tでは、バッファモデルが導入されている。仮想デコーダバッファモデルを標準で定義し、符号化装置(エンコーダ)は、この仮想デコーダバッファを破綻しないように符号化することによりデコーダ側でのバッファオーバーフローまたはアンダーフローを防ぎ、互換性を維持することが可能とされている。
【0026】
MPEGにおける仮想バッファモデルについて、図3を参照して説明する。以下の説明において、デコーダバッファへの入力ビットレートをR、デコーダバッファのサイズをB、デコーダが最初のフレームをバッファから引き抜く時のバッファ占有量をF、その際の遅延時間をDとする。また、時刻t0,t1,t2,・・・における各フレームのビット量をb0,b1,b2・・・とする。
【0027】
ここでフレームレートをMとすると、
ti+1−ti=1/Mが成り立つ。
【0028】
Biを、時刻tiにおけるフレームのビット量biを引き抜く直前のバッファ占有量とすると以下の式(1)が成り立つ。
B0=F
Bi+1=min(B,Bi―bi+R(ti+1−ti)) ・・・(1)
【0029】
ここで、MPEG2における固定ビットレート符号化方式の場合、エンコーダは次式(2)の条件を満たすよう符号化しなければならない。
Bi≦B
Bi−bi≧0 ・・・(2)
このような条件が満たされている間は、エンコーダは、バッファオーバーフローやアンダーフローを発生させてしまうような符号化を行うようなことがないとされている。
【0030】
また、MPEG2における可変ビットレート符号化方式の場合、入力ビットレートRは、プロファイル、レベルで定義される最大ビットレートであり、F=Bである。従って式(1)は、次式(3)のように書き換えられる。
B0=B
Bi+1=min(B,Bi―bi+Rmax(ti+1−ti)) ・・・(3)
【0031】
この時、エンコーダは、次式(4)に表される条件を満たすように符号化を実行しなければならない。
Bi―bi≧0 ・・・(4)
この条件が満たされるとき、エンコーダは、デコーダ側でバッファアンダーフローが起こらないような符号化を行うことになる。デコーダバッファが一杯になった時は、エンコーダバッファは空であり、符号化ビットストリームが発生していないことを意味する。従って、エンコーダは、デコーダのバッファオーバーフローを起こさないように監視する必要は無い。
【0032】
MPEGでは、各プロファイル、レベルで定義されるバッファサイズ、ビットレートに基づいて上述したようなバッファの制約を守るように符号化が行なわれる。各プロファイル、レベルに準拠したデコーダは、そのビットストリームを破綻することなく復号することができる。
【0033】
【発明が解決しようとする課題】
しかしながら、実際にはプロファイル、レベルに規定されたバッファサイズ、ビットレートを用いない場合でも、ビットストリームを復号することが出来る場合がある。
【0034】
例えば、ビットレートR、バッファB、初期遅延時間F(R,B,F)で符号化されたビットストリームは、より大きなバッファサイズB’(B’>B)を持つデコーダによっても復号可能である。また、より高いビットレートR’(R’>R)で復号することも可能である。
【0035】
例えば、デコーダの復号ビットレートが、符号化ビットレートより低い場合においても、十分大きなバッファサイズをもったデコーダであれば復号することが可能である。
【0036】
このように、所定のビットストリームが与えられた場合、各ビットレートにおいて、そのビットストリームを復号するために必要な最小バッファサイズBminが存在する。このような関係を図4に示す。
【0037】
JVT Codecでは、各プロファイル、レベルで固定のビットレート、バッファサイズで復号するだけでなく、図4に示したような条件を有するデコーダで復号できるように標準化が進められている。必ずしもエンコーダの符号化ビットレート、バッファサイズとデコーダの復号ビットレート、バッファサイズが同一でなくとも復号できることを目的としている。この目的が達成されることにより、例えば、復号ビットレートが高いデコーダでは、バッファサイズを削減することなどが可能になる。
【0038】
しかしながら、このような情報は、ビットストリーム中で時間的に変動する。そのため、デコーダ互換のための制約が緩められている分、所定の条件下では復号可能であっても、別の条件下では復号不可能になる場合があるといった問題があった。例えば、このような(R,B)の特性が時間的に変動する場合、所定の時刻で復号可能であっても、別の時刻では復号不可能である可能性があるといった問題があった。
【0039】
ランダムアクセスなどで、別なシーンや、別なチャンネルなどに移行した場合も、必ずしも復号可能であるとは限らなくなるといった問題があった。また、スプライシング(Splicing)などビットストリームレベルでの編集を行った際、デコード可能性を保証できなくなるといった問題があった。
【0040】
本発明はこのような状況に鑑みてなされたものであり、ビットストリームの復号可能性を効率よく判断し、またスプライシングなどビットストリームの編集を簡便に行えるようにすることを目的とする。
【0041】
【課題を解決するための手段】
本発明の符号化装置は、復号時に必要に応じ参照されるヘッダを生成する生成手段と、生成手段により生成されたヘッダと、入力された画像信号をそれぞれ符号化する符号化手段と、符号化手段により符号化されたヘッダと画像信号を多重化し、ビットストリームを出力する出力手段とを含み、生成手段は、ビットストリームを復号する際のバッファに関するバッファ特性情報を含むヘッダを生成することを特徴とする。
【0042】
前記生成手段は、ビットストリーム中でランダムにアクセスが可能な所定区間毎に、バッファ特性情報を含む前記ヘッダを生成するようにすることができる。
【0043】
前記生成手段は、ビットストリームのシーケンス全体のバッファ特性の情報を含むヘッダを生成するようにすることができる。
【0044】
前記バッファ特性情報は、ビットストリームを復号する際の復号可能な最小ビットレート、最小バッファサイズ、および、最小遅延量の全てを含むようにすることができる。
【0045】
本発明の符号化方法は、復号時に必要に応じ参照されるヘッダを生成する生成ステップと、生成ステップの処理で生成されたヘッダと、入力された画像信号をそれぞれ符号化する符号化ステップと、符号化ステップの処理で符号化されたヘッダと画像信号を多重化したビットストリームの出力を制御する出力制御ステップとを含み、生成ステップの処理は、ビットストリームを復号する際のバッファに関するバッファ特性情報を少なくとも含むヘッダを生成することを特徴とする。
【0046】
本発明の第1の記録媒体のプログラムは、復号時に必要に応じ参照されるヘッダを生成する生成ステップと、生成ステップの処理で生成されたヘッダと、入力された画像信号をそれぞれ符号化する符号化ステップと、符号化ステップの処理で符号化されたヘッダと画像信号を多重化したビットストリームの出力を制御する出力制御ステップとを含み、生成ステップの処理は、ビットストリームを復号する際のバッファに関するバッファ特性情報を少なくとも含むヘッダを生成することを特徴とする。
【0047】
本発明の第1のプログラムは、復号時に必要に応じ参照されるヘッダを生成する生成ステップと、生成ステップの処理で生成されたヘッダと、入力された画像信号をそれぞれ符号化する符号化ステップと、符号化ステップの処理で符号化されたヘッダと画像信号を多重化したビットストリームの出力を制御する出力制御ステップとを含む処理をコンピュータに実行させ、生成ステップの処理は、ビットストリームを復号する際のバッファに関するバッファ特性情報を少なくとも含むヘッダを生成することを特徴とする。
【0048】
本発明の復号装置は、入力されたビットストリーム内のヘッダを検索する検索手段と、検索手段により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性情報に基づいてビットストリームを復号する復号手段とを含むことを特徴とする。
【0049】
前記バッファ特性情報は、ビットストリームを復号する際の復号可能な最小ビットレート、最小バッファサイズ、および、最小遅延量の全てを含むようにすることができる。
【0050】
本発明の復号方法は、入力されたビットストリーム内のヘッダを検索する検索ステップと、検索ステップの処理により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性情報に基づいてビットストリームを復号する復号ステップとを含むことを特徴とする。
【0051】
本発明の第2の記録媒体のプログラムは、入力されたビットストリーム内のヘッダを検索する検索ステップと、検索ステップの処理により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性情報に基づいてビットストリームを復号する復号ステップとを含むことを特徴とする。
【0052】
本発明の第2のプログラムは、入力されたビットストリーム内のヘッダを検索する検索ステップと、検索ステップの処理により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性情報に基づいてビットストリームを復号する復号ステップとを含む処理をコンピュータに実行させることを特徴とする。
【0053】
本発明の編集装置は、入力されたビットストリーム内のヘッダを検索する検索手段と、検索手段により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出した情報に基づいてビットストリームの編集が可能であるか否かを判断する判断手段と、判断手段によりビットストリームの編集が可能であると判断された場合、ビットストリームの編集を行う編集手段とを含み、判断手段は、第1のビットストリームのヘッダに含まれる情報により作成される特性曲線が、第2のビットストリームのヘッダに含まれる情報により作成される特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームを用いた編集は可能であると判断することを特徴とする。
【0054】
本発明の編集方法は、入力されたビットストリーム内のヘッダを検索する検索ステップと、検索ステップの処理により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出した情報に基づいてビットストリームの編集が可能であるか否かを判断する判断ステップと、判断ステップの処理でビットストリームの編集が可能であると判断された場合、ビットストリームの編集を行う編集ステップとを含み、判断ステップの処理は、第1のビットストリームのヘッダに含まれる情報により作成される特性曲線が、第2のビットストリームのヘッダに含まれる情報により作成される特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームを用いた編集は可能であると判断することを特徴とする。
【0055】
本発明の第3の記録媒体のプログラムは、入力されたビットストリーム内のヘッダを検索する検索ステップと、検索ステップの処理により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出した情報に基づいてビットストリームの編集が可能であるか否かを判断する判断ステップと、判断ステップの処理でビットストリームの編集が可能であると判断された場合、ビットストリームの編集を行う編集ステップとを含み、判断ステップの処理は、第1のビットストリームのヘッダに含まれる情報により作成される特性曲線が、第2のビットストリームのヘッダに含まれる情報により作成される特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームを用いた編集は可能であると判断することを特徴とする。
【0056】
本発明の第3のプログラムは、入力されたビットストリーム内のヘッダを検索する検索ステップと、検索ステップの処理により検索されたヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出した情報に基づいてビットストリームの編集が可能であるか否かを判断する判断ステップと、判断ステップの処理でビットストリームの編集が可能であると判断された場合、ビットストリームの編集を行う編集ステップとを含む処理をコンピュータに実行させ、判断ステップの処理は、第1のビットストリームのヘッダに含まれる情報により作成される特性曲線が、第2のビットストリームのヘッダに含まれる情報により作成される特性曲線の常に上に位置するか、または、同一である場合、第1のビットストリームと第2のビットストリームを用いた編集は可能であると判断することを特徴とする。
【0057】
本発明の符号化装置および方法、並びに第1のプログラムにおいては、ビットストリームに符号化されて多重化されるヘッダに、そのビットストリームを復号する際のバッファに関するバッファ特性の情報が含まれる。
【0058】
本発明の復号装置および方法、並びに第2のプログラムにおいては、入力されたビットストリームのヘッダに含まれる、復号時のバッファに関するバッファ特性の情報が読み出され、その読み出された情報に基づき復号が行われる。
【0059】
本発明の編集装置および方法、並びに第3のプログラムにおいては、入力されたビットストリームに対して編集が行えるか否かの判断が、第1のビットストリームのヘッダに含まれる情報により作成される特性曲線が、第2のビットストリームのヘッダに含まれる情報により作成される特性曲線の常に上に位置するか、または、同一であるかを判断することにより行われる。
【0060】
【発明の実施の形態】
以下に、本発明の実施の形態について図面を参照して説明する。図5は、本発明を適用した符号化装置の一実施の形態の構成を示す図である。図5に示した符号化装置70は、図1に示した画像情報符号化装置10を含む構成とされている。ここでは、画像情報符号化装置10の構成などについては、既に説明したので、その説明は適宜省略する。
【0061】
画像情報符号化装置10に入力された画像情報は、符号化され、画像圧縮情報(BS:ビットストリーム)としてバッファ71とビットストリーム解析部72に出力される。バッファ71は、入力されたビットストリームを一旦記憶し、必要に応じ、バッファ情報付加部73に出力する。ビットストリーム解析部72は、ビットストリーム中の所定の区間、例えば、GOPやランダムアクセスポイント間でのバッファの占有状態を調べ、その情報をバッファ情報BHとしてバッファ情報付加部73に供給する。ここで、ランダムアクセスポイントとは、JVT規格において、ビットストリーム中でランダムにアクセスが可能な所定の区間のことを言う。また、同様にGOPとは、MPEG2/MPEG4規格において、ランダムにアクセスが可能な所定の区間のことを言う。
【0062】
バッファ情報付加部73は、入力されたバッファ情報BHを、同じく入力されたビットストリームに付加して出力する。
【0063】
ここでは、ビットストリーム解析部72が行う解析の一例として、各ランダムアクセスポイント間でバッファ占有状態を調べ、各ランダムアクセスポイントにヘッダ情報としてバッファ占有状態の情報を符号化してビットストリームを構成する場合を例にあげて説明する。ここでは、このような説明を行うが、GOP単位で求めるようにしても良いし、他の任意の単位で求めるようにしても良く、以下に説明する単位に、他の単位を用いた場合においても、本発明を適用できることは言うまでもない。
【0064】
図6を参照して(Rmin、Bmin)の特性を決定する方法について説明する。ここで、Rminは、バッファへの入力ビットレートRの最小値を示し、Bminは、バッファサイズBの最小値を示すとする。
【0065】
所定のビットストリームのビットレートRが与えられた場合、そのビットストリームを復号ビットレートRで復号する復号装置(例えば、図7に示す構成を有する)で復号可能である最低限のバッファサイズBminは、例えば、以下のようにして決定される。
【0066】
所定のアクセスポイント間のフレーム数をNとする。各フレームの発生ビット量をb(i)(i=1,N)、バッファから各フレームのデータを引き抜く直前のバッファ占有量をB(i)、引き抜いた直後のバッファ占有量をB2(i)とする。符号化装置のバッファ量をBとすれば、
B2(i)=B(i)―b(i)
B(i+1)=B2(i)+R/(Frame Rate) ・・・(5)
ただし、if(B(i+1)>B)B(i+1)=Bとし、B(i)の最大値はBである。また遅延量FはF=Bとする。
【0067】
このとき、Bminは、次式(6)で求められる。
Bmin=B―min(B2(i)) ・・・(6)
このときのRをRminとすれば、上記のような方法により(Rmin、Bmin)を決定することができる。
【0068】
次に、(Rmin、Bmin、Fmin)を決定する方法の一例を説明する。B=Bmin、R=Rminとする。式(5)と同様に、次式(7)が成り立つ。
B2(i)=B(i)−b(i)
B(i+1)=B2(i)+R/(Frame Rate) ・・・(7)
となる。ただし、以下の条件に基づくアンダーフローに対する監視が行われる。
【0069】
Fminは、各ランダムアクセスポイントの先頭で0に初期化される。また、オーバーフローに対する監視も同様に、以下の条件に基づき行われる。
if(B(i+1)>B)B(i+1)=B
ランダムアクセスポイント間の全てのフレームに対して上記した検査が行われることにより、(Rmin、Bmin、Fmin)が決定される。
【0070】
上記した(Rmin、Bmin、Fmin)は、予め定められた所定の個数だけ検査を行うようにしても良いし、その中で独立な組み合わせのみを定義するようにしても良い。上記のようにして求められた特性は、図4に示すようになる。各点の間は線形補間される。上記のようにして求められた、(Rmin、Bmin、Fmin)の値、バッファ情報BHは、バッファ情報付加部73によりビットストリーム中の所定の位置に挿入され、符号化され出力される。
【0071】
ビットストリーム解析部72は、上述したような、各ランダムアクセス間の(Rmin、Bmin、Fmin)と同時にビットストリーム全体に対して同様の解析を行い、ビットストリーム全体に対する特性、(Rmin、Bmin、Fmin)globalを決定し、この値を、バッファ情報付加部73に、バッファ情報BHとして供給する。
【0072】
画像情報符号化装置10から出力されたビットストリームBSは、バッファ71において所定の時間だけ遅延された後、バッファ情報付加部73に入力される。バッファ情報付加部73は、ビットストリーム中の所定の位置にビットストリーム解析部72より供給されるバッファ情報BHを挿入し、最終的な出力ビットストリームBSを出力する。
【0073】
ここで、バッファ情報BH(若しくはバッファ特性情報)は、例えば、(Rmi n、Bmin、Fmin)や(Rmin、Bmin、Fmin)globalである。バッファ情報付加部73は、ビットストリームBS中の所定の位置に、上記情報を挿入する。ここでシンタクスの一例を以下に示し説明する。
【0074】
【0075】
ランダムアクセスポイント間の(Rmin、Bmin、Fmin)は、例えば、その直前のランダムアクセスポイントヘッダに、上記したシンタクスのように記録される。RAP_startcodeは、RAPヘッダが存在し、そのヘッダの開始を示すコードである。
【0076】
closed_GOPは、そのGOP内の全てのピクチャが他のGOPのピクチャを参照することがなく独立であるか、または、他のGOPのピクチャを参照するという依存関係があるかどうかを示すフラグである。broken_linkは、編集などにより、そのGOPの前後でビットストリームの置き換えが行われた場合、予測の参照画像が存在するか否かを示すフラグである。
【0077】
NumBuffer_Paramは、求めた特性セット(Rmin、Bmin、Fmin)の数を示す。Rate[i]、Buffer[i]、F[i]は、それぞれをRmin、Bmin、Fmin示す。ここでは、例えば、Rminは、小さいものから順に記録される。
【0078】
ビットストリーム全体の(Rmin、Bmin、Fmin)globalは、例えば、そのビットストリームの先頭のシーケンスヘッダに、以下のシンタクスのようにして記録される。
【0079】
【0080】
ここで、NumBuffer_Paramは、求めた特性セット(Rmin、Bmin、Fmin)globalの数を示す。Rate[i]、Buffer[i]、F[i]は、それぞれをRmin、Bmin、Fminを示す。ここでは、例えば、Rminは、小さいものから順に記録される。
【0081】
バッファ情報付加部73において、上記のバッファ情報BHが付加された後、最終的な出力ビットストリームBSが出力される。
【0082】
なお、発明の実施の形態ではバッファ情報BHとして、最小ビットレートRmin、最小バッファサイズBminおよび最小遅延量Fminの全てをビットストリームに付加するように説明した。しかし、この例に限らず、最小ビットレートRmin、最小バッファサイズBmin若しくは最小遅延量Fminのうち、少なくとも一つをビットストリームに加えるようにしてもよい。例えば、最小ビットレートRminおよび最小バッファサイズBminの組み合わせをビットストリームに付加するようにしてもよい。
【0083】
図7に本発明を適用した復号装置の一実施の形態の構成を示す。図7に示した復号装置90は、図5に示した符号化装置70に対応するものであり、内部に、図2に示した画像情報復号装置40を含んでいる。復号装置90に入力されたビットストリームBSは、ビットストリーム解析部91と復号可能性判定部92に供給される。
【0084】
ビットストリーム解析部91は、ビットストリーム中のバッファ情報BHを復号し、復号可能性判定部92に出力する。ビットストリーム解析部91は、ビットストリームをパースし、シーケンスヘッダに記録されている、(Rmin、Bmin、Fmin)globalを復号する。また、各ランダムアクセスポイントヘッダに記録されている、(Rmin、Bmin、Fmin)を復号する。これら情報が復号可能性判定部92に出力される。
【0085】
復号可能性判定部92は、バッファ情報BHおよび画像情報復号装置40より供給されるデコーダ情報DIに基づいて、入力されたビットストリームがバッファを破綻させること無く復号可能であるかどうかを判定する。デコーダ情報DIは、例えば、デコーダバッファサイズおよび復号ビットレートなどである。
【0086】
復号可能性判定部92は、(Rmin、Bmin、Fmin)globalから、図4に示したような特性曲線を作成する。各点の間は線形補間する。この時、デコーダ(復号装置90)のバッファおよび復号ビットレートが(Rmin、Bmin、Fmin)globalにより作られる特性曲線より上に位置する場合、入力されたビットストリームは、復号可能であると判断することが可能である。従ってこのようなとき、復号可能性判定部92は、復号可能であると判定し、ビットストリームを画像情報復号装置40に供給する。
【0087】
画像情報復号装置40は、図2に示した画像情報復号装置40と基本的に同様な構成により、同様な処理を実行し、入力されたビットストリームを復号し、画像情報を図示されていないテレビジョン受像機などに出力する。
【0088】
ビットストリーム全体を復号可能であるかどうかは上記のように、(Rmin、Bmin、Fmin)globalの特性曲線、デコーダバッファサイズ、復号ビットレートを調べることによって判定することが可能である。
【0089】
また、ランダムアクセスなどにより、所定のランダムアクセスポイントから特定の区間のみを復号したい場合、同様にして、復号可能性判定部92は、(Rmi n、Bmin、Fmin)から図4に示すような特性曲線を作成する。各点の間は線形補間する。この時、デコーダのバッファおよび復号ビットレートが(Rmin、Bm in、Fmin)により作られる特性曲線より上に位置する場合、ビットストリームは復号可能である。従ってこのようなとき、復号可能性判定部92は、復号可能であると判定し、ビットストリームを画像情報復号装置40に供給する。
【0090】
次にビットストリームの編集を行う際の説明を行う。図8は、本発明を適用したビットストリームの編集を行う編集装置110の一実施の形態の構成を示す図である。編集装置110が行う編集の例として、入力ビットストリーム1の一部を、別の入力ビットストリーム2に置き換えるスプライスを行う場合を例に挙げて説明する。
【0091】
ここで、スプライスについて簡単に説明するに、スプライスとは、所定のビットストリームをランダムアクセスポイントにおいて別のビットストリームに置き換えて編集を行うことである。このようなスプライスは、例えば、テレビジョン放送の番組に、コマーシャルの放送を挿入する際などである。この場合、入力ビットストリーム1がテレビジョン放送の番組のビットストリームであり、入力ビットストリーム2がコマーシャルのビットストリームである。
【0092】
入力ビットストリーム1は、ビットストリーム解析部111−1に入力され、入力ビットストリーム2は、ビットストリーム解析部111−2に入力される。ビットストリーム解析部111−1,111−2は、それぞれ入力されたビットストリーム1,2中に含まれているバッファ情報BH1,2を復号し、ビットストリーム編集部112に出力する。
【0093】
ビットストリーム編集部112は、バッファ情報BH1,2に基づき、所定の編集ポイントで、入力ビットストリーム1に対して入力ビットストリーム2を挿入可能であるか否かを判定する。この時、編集後のビットストリームが、デコーダ(復号装置90)のバッファを破綻させずに復号可能であるためには、ランダムアクセスポイントとその直前のバッファ占有量の値が同一であるという条件が必要である。
【0094】
MPEG2,4方式を用いるデコーダは、特定のビットレート、バッファサイズで動作することが想定されていたが、JVT方式を用いるデコーダにおいては、図4に示すように、その他のビットレート、バッファサイズであっても、(Rmin、Bmin、Fmin)の特性曲線より上にある場合、復号することが可能であるようにバッファに対する制約が緩和されている。
【0095】
ビットストリームの編集により、その編集前後でデコード可能性が変化しないようにするためには、編集区間の(Rmin、Bmin、Fmin)が同一であれば良い。従って、ビットストリーム編集部112は、編集区間に位置するランダムアクセスポイントヘッダにおける(Rmin、Bmin、Fmin)特性を、入力ビットストリーム1,2に対して作成し、これらの値が一致する場合、その区間をビットストリーム2に置換する。一致しない場合、ビットストリーム1または2に対してパディングビットを挿入して、(Rmin、Bmin、Fmin)が一致するようにした後、入力ビットストリーム2に置換する。
【0096】
JVTにおいては、バッファに対する規制が緩和されているが、このことを利用すれば、スプライスにおけるバッファの適合条件を緩和することが可能になる。JVTにおいては、デコーダのバッファサイズおよび復号ビットレートが(Rmin、Bmin、Fmin)の上に位置する場合、復号可能であることがわかる。従って、元の入力ビットストリーム1の所定の編集区間の(Rmin、Bmin、Fmin)に対して、挿入する入力ビットストリーム2の所定編集区間の(Rmin、Bmin、Fmin)が常に下にある場合、入力ビットストリーム1を復号可能なデコーダは、その区間をビットストリーム2に置換しても復号可能であることになる。
【0097】
図9にその関係を図示する。曲線1は、入力ビットストリーム1の編集区間での(Rmin、Bmin、Fmin)特性を示す。曲線2は入力ビットストリーム2の編集区間での(Rmin、Bmin、Fmin)特性を示す。デコーダのバッファ、復号ビットレートが、この曲線の上に来る場合、復号可能であることから、図9に示すように曲線2が常に曲線1の下に来るとき、復号可能であることが保証される。
【0098】
従って、ビットストリーム編集部112は、編集区間に位置するランダムアクセスポイントヘッダにおける(Rmin、Bmin、Fmin)特性を、ビットストリーム1,2に対して作成し、ビットストリーム2の特性曲線が、ビットストリーム1の特性曲線の下に来る場合、その区間をビットストリーム2に置換する。
【0099】
逆に、一致しないような場合、ビットストリーム1または2に対してパディングビットを挿入して、ビットストリーム2の(Rmin、Bmin、Fmin)特性曲線が、ビットストリーム1の特性曲線の下に位置するように変更した後、入力ビットストリーム2に置換する。
【0100】
このような条件を満たすようにスプライスを行った場合、ビットストリーム1を復号可能なデコーダを破綻させることはない。ビットストリーム編集部112はスプライスをした後、最終的なビットストリームを出力する。
【0101】
このように、ビットストリーム中のランダムアクセスが行えるポイントのヘッダに、(Rmin、Bmin、Fmin)といった最小ビットレート、最小バッファサイズ、最小初期遅延時間などの情報を含ませることにより、復号側において、ビットストリームの復号可能性を効率良く判断することが可能となり、また、スプライシングなどのビットストリームの編集を容易に、かつ、復号側のバッファを破綻させることなく復号が常に行えるようにすることが可能となる。
【0102】
図10は、汎用のパーソナルコンピュータの内部構成例を示す図である。パーソナルコンピュータのCPU(Central Processing Unit)211は、ROM(Read Only Memory)212に記憶されているプログラムに従って各種の処理を実行する。RAM(Random Access Memory)213には、CPU211が各種の処理を実行する上において必要なデータやプログラムなどが適宜記憶される。入出力インタフェース215は、キーボードやマウスから構成される入力部216が接続され、入力部216に入力された信号をCPU211に出力する。また、入出力インタフェース215には、ディスプレイやスピーカなどから構成される出力部7も接続されている。
【0103】
さらに、入出力インタフェース215には、ハードディスクなどから構成される記憶部218、および、インターネットなどのネットワークを介して他の装置とデータの授受を行う通信部219も接続されている。ドライブ220は、磁気ディスク231、光ディスク232、光磁気ディスク233、半導体メモリ234などの記録媒体からデータを読み出したり、データを書き込んだりするときに用いられる。
【0104】
記録媒体は、図10に示すように、パーソナルコンピュータとは別に、ユーザにプログラムを提供するために配布される、プログラムが記録されている磁気ディスク231(フレキシブルディスクを含む)、光ディスク232(CD−ROM(Compact Disc−Read Only Memory),DVD(Digital Versatile Disc)を含む)、光磁気ディスク233(MD(Mini−Disc)(登録商標)を含む)、若しくは半導体メモリ234などよりなるパッケージメディアにより構成されるだけでなく、コンピュータに予め組み込まれた状態でユーザに提供される、プログラムが記憶されているROM212や記憶部218が含まれるハードディスクなどで構成される。
【0105】
なお、本明細書において、媒体により提供されるプログラムを記述するステップは、記載された順序に従って、時系列的に行われる処理は勿論、必ずしも時系列的に処理されなくとも、並列的あるいは個別に実行される処理をも含むものである。
【0106】
また、本明細書において、システムとは、複数の装置により構成される装置全体を表すものである。
【0107】
【発明の効果】
以上の如く本発明の符号化装置および方法、並びに第1のプログラムによれば、ビットストリームに符号化されて多重化されるヘッダに、そのビットストリームを復号する際のバッファに関するバッファ特性の情報を含ませるようにしたので、復号側で、バッファが破綻してしまうようなことを防ぐことが可能となる。
【0108】
また、本発明の復号装置および方法、並びに第2のプログラムによれば、入力されたビットストリームのヘッダに含まれる、復号時のバッファに関するバッファ特性の情報が読み出され、その読み出された情報に基づき復号が行われるようにしたので、復号時にバッファが破綻してしまうようなことを防ぐことが可能となる。
【0109】
さらに、本発明の編集装置および方法、並びに第3のプログラムによれば、入力されたビットストリームに対して編集が行えるか否かの判断を、第1のビットストリームのヘッダに含まれる情報により作成される特性曲線が、第2のビットストリームのヘッダに含まれる情報により作成される特性曲線の常に上に位置するか、または、同一であるかを判断することにより行うようにしたので、スプライスなどの編集にかかる処理を軽減させ、容易に編集可能であるか否かを判断することが可能となる。
【図面の簡単な説明】
【図1】従来の画像情報符号化装置の一例の構成を示す図である。
【図2】従来の画像情報復号装置の一例の構成を示す図である。
【図3】バッファ量について説明する図である。
【図4】ビットレートとバッファ量の関係について説明する図である。
【図5】本発明を適用した符号化装置の一実施の形態の構成を示す図である。
【図6】バッファ量について説明する図である。
【図7】本発明を適用した復号装置の一実施の形態の構成を示す図である。
【図8】本発明を適用した編集装置の一実施の形態の構成を示す図である。
【図9】ビットレートとバッファ量の関係について説明する図である。
【図10】媒体を説明する図である。
【符号の説明】
70 符号化装置, 71 バッファ, 72 ビットストリーム解析部, 73 バッファ情報付加部, 90 復号装置, 91 ビットストリーム解析部, 92 復号可能性判定部, 111 ビットストリーム解析部, 112ビットストリーム編集部[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an encoding device and method, a decoding device and method, an editing device and method, a recording medium, and a program, and in particular, image information compressed by orthogonal transform and motion compensation such as discrete cosine transform or Karhunen-Loeve transform. A code suitable for use when transmitting / receiving a bit stream) via a network medium such as satellite broadcast, cable television broadcast, or the Internet, or when processing on a storage medium such as an optical disk, a magnetic disk, or a flash memory. The present invention relates to an encoding device and method, a decoding device and method, an editing device and method, a recording medium, and a program.
[0002]
[Prior art]
In recent years, image information is handled as digital, and at that time, MPEG (compressed by orthogonal transformation such as discrete cosine transformation and motion compensation is used for the purpose of efficient transmission and storage of information, and using redundancy unique to image information. A device compliant with a system such as Moving Picture Expert Group) is becoming popular in both information distribution such as broadcasting stations and information reception in general homes.
[0003]
In particular, MPEG2 (ISO / IEC 13818-2) is a standard defined as a general-purpose image compression system, and is a standard that covers both interlaced scanning images and sequential scanning images, as well as standard resolution images and high-definition images. As represented by the DVD (Digital Versatile Disk) standard, it is widely used in a wide range of applications for professional use and consumer use.
[0004]
By using this MPEG2 compression method, for example, 4 to 8 Mbps for a standard resolution interlaced scanning image having 720 × 480 pixels, and 18 to 22 Mbps for a high resolution interlaced scanning image having 1920 × 1088 pixels, for example. By assigning a code amount (bit rate), it is possible to realize a high compression rate and good image quality.
[0005]
MPEG2 was mainly intended for high-quality encoding suitable for broadcasting, but because it did not support encoding methods with higher compression rates, the MPEG4 encoding method was standardized. Regarding the image encoding system, the standard was approved as an international standard as ISO / IEC 14496-2 in December 1998.
[0006]
Further, in recent years, with the initial purpose of image coding for video conferencing, the ITU-T (International Telecommunication Union-Telecommunication Standardization Sector), which is the telecommunications standardization department of the International Telecommunications Union, has been developed. The standardization of 26L (ITU-T Q6 / 16VCEG) is in progress. H. 26L is known to achieve higher encoding efficiency than the encoding methods such as MPEG2 and MPEG4, although a larger amount of calculation is required for encoding and decoding.
[0007]
In addition, as part of MPEG4 activities, this H.264 The standardization of coding technology that realizes higher coding efficiency based on H.26L is being carried out jointly with ITU-T as JVT (Joint Video Team).
[0008]
Here, image compression by orthogonal transform such as discrete cosine transform or Karhunen-Loeve transform and motion compensation will be described. FIG. 1 is a diagram illustrating a configuration of an example of a conventional image information encoding device.
[0009]
In the image
[0010]
Here, the
[0011]
The lossless encoding unit 17 determines an encoding mode from the quantized transform coefficient, quantization scale, and the like supplied from the
[0012]
The lossless encoding unit 17 performs lossless encoding such as variable length encoding or arithmetic encoding on the quantized transform coefficient, and supplies the encoded transform coefficient to the
[0013]
The behavior of the
[0014]
In addition, the
[0015]
The lossless encoding unit 17 determines the encoding mode from the quantized transform coefficient and quantization scale supplied from the
[0016]
Further, the lossless encoding unit 17 performs lossless encoding processing such as variable length encoding or arithmetic encoding on the motion vector information, and generates information to be inserted into the header portion of the image encoding unit.
[0017]
In contrast to intra coding, in the case of inter coding, the image information input to the
[0018]
Next, FIG. 2 shows a configuration of an example of an image information decoding device corresponding to the image
[0019]
The
[0020]
The
[0021]
Here, when the target frame is intra-coded, the image information subjected to the inverse orthogonal transform process is stored in the
[0022]
When the target frame is inter-coded, the motion prediction /
[0023]
By the way, in the encoding system (hereinafter referred to as JVT Codec) standardized by the above-mentioned Joint Video Team, various systems are being studied in order to improve the encoding efficiency of MPEG2 and MPEG4. For example, the conversion method of the discrete cosine transform uses integer coefficient conversion of 4 × 4 block size. The block size at the time of motion compensation is variable, and more optimal motion compensation can be performed. However, the basic method can be performed in the same manner as the encoding method performed in the image
[0024]
Therefore, it is possible to perform decoding by basically the same method as the decoding method performed in the image
[0025]
By the way, in order to maintain compatibility between different decoding apparatuses (decoders) and prevent the buffer from overflowing or underflowing, a buffer model is introduced in MPEG and ITU-T. A virtual decoder buffer model is defined as a standard, and the encoding device (encoder) encodes the virtual decoder buffer so that it does not fail, thereby preventing buffer overflow or underflow on the decoder side and maintaining compatibility. Is possible.
[0026]
A virtual buffer model in MPEG will be described with reference to FIG. In the following description, the input bit rate to the decoder buffer is R, the size of the decoder buffer is B, the buffer occupation amount when the decoder pulls out the first frame from the buffer is F, and the delay time at that time is D. Further, the bit amount of each frame at times t0, t1, t2,... Is b0, b1, b2,.
[0027]
If the frame rate is M,
ti + 1-Ti= 1 / M holds.
[0028]
BiAt time tiBit amount b of frameiThe following equation (1) is established if the buffer occupancy immediately before is extracted.
B0= F
Bi + 1= Min (B, Bi―Bi+ R (ti + 1-Ti)) ... (1)
[0029]
Here, in the case of the constant bit rate encoding method in MPEG2, the encoder must encode so as to satisfy the condition of the following equation (2).
Bi ≦ B
Bi-bi ≧ 0 (2)
While such a condition is satisfied, the encoder does not perform encoding that causes a buffer overflow or underflow.
[0030]
Further, in the case of the variable bit rate encoding method in MPEG2, the input bit rate R is the maximum bit rate defined by the profile and level, and F = B. Therefore, the equation (1) can be rewritten as the following equation (3).
B0= B
Bi + 1= Min (B, Bi―Bi+ Rmax(Ti + 1-Ti)) ... (3)
[0031]
At this time, the encoder must execute encoding so as to satisfy the condition expressed by the following equation (4).
Bi―Bi≧ 0 (4)
When this condition is satisfied, the encoder performs encoding so that no buffer underflow occurs on the decoder side. When the decoder buffer is full, it means that the encoder buffer is empty and no encoded bit stream has been generated. Thus, the encoder need not monitor the decoder for buffer overflow.
[0032]
In MPEG, encoding is performed so as to observe the above-described buffer restrictions based on the buffer size and bit rate defined by each profile and level. A decoder conforming to each profile and level can decode the bitstream without breaking it.
[0033]
[Problems to be solved by the invention]
However, there are cases where the bit stream can be decoded even when the buffer size and the bit rate specified in the profile and level are not actually used.
[0034]
For example, a bit stream encoded with a bit rate R, a buffer B, and an initial delay time F (R, B, F) can be decoded even by a decoder having a larger buffer size B ′ (B ′> B). . It is also possible to decode at a higher bit rate R ′ (R ′> R).
[0035]
For example, even when the decoding bit rate of the decoder is lower than the encoding bit rate, it is possible to decode the decoder having a sufficiently large buffer size.
[0036]
Thus, given a given bitstream, at each bitrate, the minimum buffer size B required to decode that bitstreamminExists. Such a relationship is shown in FIG.
[0037]
JVT Codec is being standardized so that it can be decoded not only by a fixed bit rate and buffer size for each profile and level, but also by a decoder having the conditions shown in FIG. The purpose is to be able to perform decoding even if the encoding bit rate and buffer size of the encoder are not the same as the decoding bit rate and buffer size of the decoder. By achieving this object, for example, a decoder having a high decoding bit rate can reduce the buffer size.
[0038]
However, such information varies in time in the bitstream. For this reason, there is a problem that even if decoding is possible under a predetermined condition, decoding may not be possible under another condition because restrictions for decoder compatibility are relaxed. For example, when such (R, B) characteristics fluctuate with time, there is a problem that even if decoding is possible at a predetermined time, decoding may not be possible at another time.
[0039]
There has been a problem that even when moving to another scene or another channel due to random access or the like, decoding is not always possible. In addition, when editing at the bit stream level, such as splicing, there is a problem that it is impossible to guarantee the decoding possibility.
[0040]
The present invention has been made in view of such a situation, and an object of the present invention is to efficiently determine the decodability of a bitstream and to easily edit a bitstream such as splicing.
[0041]
[Means for Solving the Problems]
An encoding apparatus according to the present invention includes a generation unit that generates a header to be referred to as necessary at the time of decoding, a header generated by the generation unit, an encoding unit that encodes an input image signal, and an encoding And an output means for outputting a bit stream by multiplexing the header encoded by the means and an image signal, and the generating means generates a header including buffer characteristic information relating to a buffer when decoding the bit stream. And
[0042]
The generation unit may generate the header including buffer characteristic information for each predetermined section that can be accessed randomly in the bitstream.
[0043]
The generating means may generate a header including information on buffer characteristics of the entire sequence of the bitstream.
[0044]
The buffer characteristic information may include all of the minimum decodable bit rate, the minimum buffer size, and the minimum delay amount when decoding the bitstream.
[0045]
The encoding method of the present invention includes a generation step for generating a header to be referred to as necessary at the time of decoding, a header generated by the processing of the generation step, and an encoding step for encoding each input image signal, An output control step for controlling the output of the bit stream obtained by multiplexing the header and the image signal encoded by the processing of the encoding step, and the processing of the generation step includes buffer characteristic information relating to a buffer when decoding the bit stream A header including at least the above is generated.
[0046]
The program of the first recording medium of the present invention includes a generation step for generating a header to be referred to as necessary at the time of decoding, a header generated by the processing of the generation step, and a code for encoding the input image signal. And an output control step for controlling the output of the bit stream obtained by multiplexing the header and the image signal encoded in the encoding step, and the generation step includes a buffer for decoding the bit stream. Generating a header including at least buffer characteristic information.
[0047]
The first program of the present invention includes a generation step for generating a header to be referred to as necessary at the time of decoding, a header generated by the processing of the generation step, and an encoding step for encoding each input image signal. , Causing the computer to execute a process including a header encoded in the process of the encoding step and an output control step for controlling the output of the bit stream obtained by multiplexing the image signal, and the process of the generation step decodes the bit stream A header including at least buffer characteristic information relating to the current buffer is generated.
[0048]
The decoding device according to the present invention reads search means for searching for a header in an input bitstream, and reads buffer characteristic information relating to a buffer included in the header searched by the search means, and based on the read buffer characteristic information, And a decoding means for decoding the stream.
[0049]
The buffer characteristic information may include all of the minimum decodable bit rate, the minimum buffer size, and the minimum delay amount when decoding the bitstream.
[0050]
According to the decoding method of the present invention, a search step for searching for a header in an input bitstream, and buffer characteristic information relating to a buffer included in the header searched by the processing of the search step are read, and based on the read buffer characteristic information And a decoding step of decoding the bitstream.
[0051]
The program of the second recording medium of the present invention reads the buffer step information for searching the header in the input bitstream, and the buffer characteristic information related to the buffer included in the header searched by the processing of the search step. And a decoding step of decoding the bitstream based on the buffer characteristic information.
[0052]
The second program of the present invention reads a buffer step for searching for a header in an input bitstream, and buffer characteristic information relating to a buffer included in the header searched by the processing of the search step, and the read buffer characteristic information And a decoding step of decoding the bitstream based on the computer.
[0053]
The editing apparatus of the present invention reads search means for searching for a header in an input bitstream, and buffer characteristic information relating to a buffer included in the header searched by the search means, and based on the read information, A determination unit that determines whether or not editing is possible; and an editing unit that edits the bitstream when the determination unit determines that the bitstream can be edited. If the characteristic curve created by the information contained in the header of the second bitstream is always above or identical to the characteristic curve created by the information contained in the header of the second bitstream, It is determined that editing using one bit stream and a second bit stream is possible.
[0054]
The editing method of the present invention includes a search step for searching for a header in an input bitstream, and buffer characteristic information relating to a buffer included in the header searched by the processing of the search step, and a bit based on the read information. A determination step that determines whether or not editing of the stream is possible, and an editing step that edits the bitstream when it is determined that the bitstream can be edited in the processing of the determination step, In the processing of the above, the characteristic curve created by the information included in the header of the first bitstream is always above the characteristic curve created by the information included in the header of the second bitstream, or If they are the same, editing using the first bitstream and the second bitstream is possible. Characterized by determining that that.
[0055]
The program of the third recording medium of the present invention reads the buffer step information for searching the header in the input bitstream, and the buffer characteristic information regarding the buffer included in the header searched by the processing of the search step, and reads the read A determination step for determining whether the bitstream can be edited based on the information; an editing step for editing the bitstream if it is determined that the bitstream can be edited in the processing of the determination step; And the processing of the determining step is such that the characteristic curve created by the information contained in the header of the first bitstream is always above the characteristic curve created by the information contained in the header of the second bitstream. Or if they are identical, the first bitstream and the second bitstream Characterized in that it is determined that the editing had is possible.
[0056]
A third program of the present invention reads a header in an input bitstream, and reads buffer characteristic information relating to a buffer included in the header searched by the processing of the search step, and based on the read information A determination step for determining whether or not the bitstream can be edited, and an editing step for editing the bitstream if it is determined in the determination step that the bitstream can be edited In the determination step, the characteristic curve created by the information contained in the header of the first bitstream is always the characteristic curve created by the information contained in the header of the second bitstream. The first bitstream and the second if they are located on or are identical Edited with Tsu preparative stream is characterized in that determines that it is possible to.
[0057]
In the encoding apparatus and method of the present invention and the first program, the header encoded by the bit stream and multiplexed includes information on the buffer characteristics related to the buffer when the bit stream is decoded.
[0058]
In the decoding apparatus and method and the second program of the present invention, the buffer characteristic information related to the buffer at the time of decoding included in the header of the input bit stream is read, and decoding is performed based on the read information. Is done.
[0059]
In the editing apparatus and method of the present invention, and the third program, the determination whether or not the input bitstream can be edited is created based on the information included in the header of the first bitstream This is done by determining whether the curve is always above or identical to the characteristic curve created by the information contained in the header of the second bitstream.
[0060]
DETAILED DESCRIPTION OF THE INVENTION
Embodiments of the present invention will be described below with reference to the drawings. FIG. 5 is a diagram showing a configuration of an embodiment of an encoding apparatus to which the present invention is applied. The
[0061]
The image information input to the image
[0062]
The buffer
[0063]
Here, as an example of analysis performed by the
[0064]
With reference to FIG.min, Bmin) Will be described. Where RminIndicates the minimum value of the input bit rate R to the buffer, and BminIs the minimum buffer size B.
[0065]
When a bit rate R of a predetermined bit stream is given, a minimum buffer size B that can be decoded by a decoding device (for example, having the configuration shown in FIG. 7) that decodes the bit stream at the decoding bit rate RminIs determined as follows, for example.
[0066]
Let N be the number of frames between predetermined access points. The generated bit amount of each frame is b (i) (i = 1, N), the buffer occupancy immediately before extracting data of each frame from the buffer is B (i), and the buffer occupancy immediately after extraction is B2 (i). And If the buffer amount of the encoding device is B,
B2 (i) = B (i) -b (i)
B (i + 1) = B2 (i) + R / (Frame Rate) (5)
However, if (B (i + 1)> B) B (i + 1) = B, and the maximum value of B (i) is B. The delay amount F is F = B.
[0067]
At this time, BminIs obtained by the following equation (6).
Bmin= B-min (B2 (i)) (6)
R at this time is RminIf the above method (Rmin, Bmin) Can be determined.
[0068]
Next, (Rmin, Bmin, Fmin) Will be described. B = Bmin, R = RminAnd Similar to Expression (5), the following Expression (7) is established.
B2 (i) = B (i) -b (i)
B (i + 1) = B2 (i) + R / (Frame Rate) (7)
It becomes. However, underflow is monitored based on the following conditions.
[0069]
FminIs initialized to 0 at the beginning of each random access point. Similarly, monitoring for overflow is performed based on the following conditions.
if (B (i + 1)> B) B (i + 1) = B
By performing the above check on all frames between random access points, (Rmin, Bmin, Fmin) Is determined.
[0070]
(Rmin, Bmin, Fmin) May be inspected by a predetermined number, or only independent combinations may be defined. The characteristics obtained as described above are as shown in FIG. Linear interpolation is performed between the points. (R) obtained as described above.min, Bmin, Fmin) And buffer information BH are inserted into a predetermined position in the bitstream by the buffer
[0071]
The bit stream analysis unit 72 (R) between each random access as described above.min, Bmin, Fmin) At the same time, the same analysis is performed on the entire bitstream, and the characteristics for the entire bitstream are expressed asmin, Bmin, Fmin) Global is determined, and this value is supplied to the buffer
[0072]
The bit stream BS output from the image
[0073]
Here, the buffer information BH (or buffer characteristic information) is, for example, (Rmi n, Bmin, Fmin) And (Rmin, Bmin, Fmin) Global. The buffer
[0074]
[0075]
(R between random access pointsmin, Bmin, Fmin) Is recorded in the random access point header immediately before, for example, like the syntax described above. RAP_startcode is a code indicating the presence of a RAP header and the start of the header.
[0076]
The closed_GOP is a flag indicating whether all the pictures in the GOP are independent without referring to a picture of another GOP, or whether there is a dependency relationship referring to a picture of another GOP. The “broken_link” is a flag indicating whether or not a prediction reference image exists when a bitstream is replaced before and after the GOP by editing or the like.
[0077]
NumBuffer_Param is the property set (Rmin, Bmin, Fmin). Rate [i], Buffer [i], F [i]min, Bmin, FminShow. Here, for example, RminAre recorded in order from the smallest.
[0078]
(R for the entire bitstreammin, Bmin, Fmin) Global is recorded in the sequence header at the head of the bitstream, for example, with the following syntax.
[0079]
[0080]
Here, NumBuffer_Param is the obtained characteristic set (Rmin, Bmin, Fmin) Indicates the number of globals. Rate [i], Buffer [i], F [i]min, Bmin, FminIndicates. Here, for example, RminAre recorded in order from the smallest.
[0081]
In the buffer
[0082]
In the embodiment of the invention, the buffer information BH is described so that all of the minimum bit rate Rmin, the minimum buffer size Bmin, and the minimum delay amount Fmin are added to the bitstream. However, the present invention is not limited to this example, and at least one of the minimum bit rate Rmin, the minimum buffer size Bmin, and the minimum delay amount Fmin may be added to the bitstream. For example, a combination of the minimum bit rate Rmin and the minimum buffer size Bmin may be added to the bitstream.
[0083]
FIG. 7 shows the configuration of an embodiment of a decoding apparatus to which the present invention is applied. The
[0084]
The bit
[0085]
Based on the buffer information BH and the decoder information DI supplied from the image
[0086]
The decryptability determination unit 92 (Rmin, Bmin, Fmin) A characteristic curve as shown in FIG. 4 is created from global. Linear interpolation is performed between the points. At this time, the buffer and decoding bit rate of the decoder (decoding device 90) are (Rmin, Bmin, Fmin) If it is located above the characteristic curve created by global, it can be determined that the input bitstream is decodable. Therefore, in such a case, the decoding
[0087]
The image
[0088]
Whether or not the entire bitstream can be decoded is determined by (Rmin, Bmin, Fmin) It can be determined by examining the global characteristic curve, decoder buffer size, and decoding bit rate.
[0089]
Further, when it is desired to decode only a specific section from a predetermined random access point by random access or the like, the decoding
[0090]
Next, a description will be given of editing a bitstream. FIG. 8 is a diagram showing a configuration of an embodiment of an
[0091]
Here, the splice will be briefly described. The splice is to perform editing by replacing a predetermined bit stream with another bit stream at a random access point. Such a splice is, for example, when a commercial broadcast is inserted into a television broadcast program. In this case, the
[0092]
The
[0093]
Based on the buffer information BH1 and 2, the
[0094]
Decoders using the MPEG2 and 4 schemes were supposed to operate at specific bit rates and buffer sizes. However, decoders using the JVT scheme have other bit rates and buffer sizes as shown in FIG. (Rmin, Bmin, Fmin), The constraints on the buffer are relaxed so that it can be decoded.
[0095]
In order to prevent the possibility of decoding from changing before and after editing by editing the bitstream, (Rmin, Bmin, Fmin) Are the same. Therefore, the bitstream editing unit 112 (R) in the random access point header located in the editing section.min, Bmin, Fmin) A characteristic is created for the
[0096]
In JVT, restrictions on the buffer are relaxed, but if this is utilized, it becomes possible to relax the adaptability condition of the buffer in the splice. In JVT, the buffer size and decoding bit rate of the decoder are (Rmin, Bmin, Fmin), It can be seen that decoding is possible. Therefore, (R) of a predetermined editing section of the
[0097]
FIG. 9 illustrates the relationship.
[0098]
Therefore, the bitstream editing unit 112 (R) in the random access point header located in the editing section.min, Bmin, Fmin) Create a characteristic for the
[0099]
Conversely, if they do not match, padding bits are inserted into
[0100]
When splicing is performed so as to satisfy such a condition, a decoder capable of decoding the
[0101]
Thus, (R) is added to the header of the point where random access in the bitstream can be performed.min, Bmin, Fmin) Including the minimum bit rate, minimum buffer size, minimum initial delay time, and the like, the decoding side can efficiently determine the decoding possibility of the bit stream, and the bit stream such as splicing It is possible to make it possible to always perform decoding without compromising the buffer on the decoding side.
[0102]
FIG. 10 is a diagram illustrating an internal configuration example of a general-purpose personal computer. A CPU (Central Processing Unit) 211 of the personal computer executes various processes according to a program stored in a ROM (Read Only Memory) 212. A RAM (Random Access Memory) 213 appropriately stores data and programs necessary for the
[0103]
Further, a
[0104]
As shown in FIG. 10, the recording medium is distributed to provide a program to the user separately from the personal computer, and a magnetic disk 231 (including a flexible disk) on which the program is recorded, an optical disk 232 (CD- It is composed of ROM (Compact Disc-Read Only Memory), DVD (including Digital Versatile Disc), magneto-optical disk 233 (including MD (Mini-Disc) (registered trademark)) or
[0105]
In this specification, the steps for describing the program provided by the medium are performed in parallel or individually in accordance with the described order, as well as the processing performed in time series, not necessarily in time series. The process to be executed is also included.
[0106]
Further, in this specification, the system represents the entire apparatus constituted by a plurality of apparatuses.
[0107]
【The invention's effect】
As described above, according to the encoding apparatus and method and the first program of the present invention, information on the buffer characteristics related to the buffer used when decoding the bit stream is added to the header encoded and multiplexed into the bit stream. Since it is included, it is possible to prevent the buffer from failing on the decoding side.
[0108]
Further, according to the decoding apparatus and method and the second program of the present invention, the buffer characteristic information relating to the buffer at the time of decoding included in the header of the input bit stream is read, and the read information Therefore, it is possible to prevent the buffer from failing at the time of decoding.
[0109]
Further, according to the editing apparatus and method and the third program of the present invention, the determination as to whether or not the input bitstream can be edited is created based on the information included in the header of the first bitstream. Since it is determined whether the characteristic curve to be generated is always above or identical to the characteristic curve created by the information included in the header of the second bitstream, splicing, etc. Therefore, it is possible to reduce the processing involved in editing and to determine whether editing is easy.
[Brief description of the drawings]
FIG. 1 is a diagram illustrating a configuration of an example of a conventional image information encoding device.
FIG. 2 is a diagram illustrating a configuration of an example of a conventional image information decoding device.
FIG. 3 is a diagram illustrating a buffer amount.
FIG. 4 is a diagram illustrating a relationship between a bit rate and a buffer amount.
FIG. 5 is a diagram showing a configuration of an embodiment of an encoding apparatus to which the present invention is applied.
FIG. 6 is a diagram illustrating a buffer amount.
FIG. 7 is a diagram illustrating the configuration of an embodiment of a decoding device to which the present invention has been applied.
FIG. 8 is a diagram showing a configuration of an embodiment of an editing apparatus to which the present invention is applied.
FIG. 9 is a diagram illustrating a relationship between a bit rate and a buffer amount.
FIG. 10 is a diagram illustrating a medium.
[Explanation of symbols]
70 encoding device, 71 buffer, 72 bitstream analysis unit, 73 buffer information addition unit, 90 decoding device, 91 bitstream analysis unit, 92 decodability determination unit, 111 bitstream analysis unit, 112 bitstream editing unit
Claims (19)
前記生成手段により生成された前記ヘッダと、入力された画像信号をそれぞれ符号化する符号化手段と、
前記符号化手段により符号化された前記ヘッダと前記画像信号を多重化し、ビットストリームを出力する出力手段と
を含み、
前記生成手段は、前記ビットストリームを復号する際のバッファに関するバッファ特性情報を含む前記ヘッダを生成する
ことを特徴とする符号化装置。Generating means for generating a header to be referred to as necessary at the time of decoding;
Encoding means for encoding each of the header generated by the generation means and the input image signal;
Output means for multiplexing the header and the image signal encoded by the encoding means, and outputting a bit stream;
The encoding device generates the header including buffer characteristic information related to a buffer when decoding the bitstream.
ことを特徴とする請求項1に記載の符号化装置。The encoding apparatus according to claim 1, wherein the generation unit generates the header including the buffer characteristic information for each predetermined section that can be randomly accessed in the bitstream.
ことを特徴とする請求項1に記載の符号化装置。The encoding apparatus according to claim 1, wherein the generation unit generates the header including the buffer characteristic information of the entire sequence of the bitstream.
ことを特徴とする請求1に記載の符号化装置。The encoding apparatus according to claim 1, wherein the buffer characteristic information includes all of a minimum decodable bit rate Rmin, a minimum buffer size Bmin, and a minimum delay amount Fmin when decoding the bitstream. .
ことを特徴とする請求項1に記載の符号化装置。The buffer characteristic information includes at least one of a minimum decodable bit rate Rmin, a minimum buffer size Bmin, and a minimum delay amount Fmin when decoding the bitstream. The encoding device described.
前記生成ステップにより生成された前記ヘッダと、入力された画像信号をそれぞれ符号化する符号化ステップと、
前記符号化ステップにより符号化された前記ヘッダと前記画像信号を多重化し、ビットストリームを出力する出力ステップと
を含み、
前記生成ステップの処理は、前記ビットストリームを復号する際のバッファに関するバッファ特性情報を含む前記ヘッダを生成する
ことを特徴とする符号化方法。A generation step for generating a header to be referred to as necessary at the time of decoding;
An encoding step for encoding the header generated by the generation step and an input image signal;
An output step of multiplexing the header encoded by the encoding step and the image signal and outputting a bit stream;
The encoding method according to claim 1, wherein the generating step generates the header including buffer characteristic information related to a buffer when the bitstream is decoded.
前記生成ステップにより生成された前記ヘッダと、入力された画像信号をそれぞれ符号化する符号化ステップと、
前記符号化ステップにより符号化された前記ヘッダと前記画像信号を多重化し、ビットストリームを出力する出力ステップと
を含み、
前記生成ステップの処理は、前記ビットストリームを復号する際のバッファに関するバッファ特性情報を含む前記ヘッダを生成する
ことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。A generation step for generating a header to be referred to as necessary at the time of decoding;
An encoding step for encoding the header generated by the generation step and an input image signal;
An output step of multiplexing the header encoded by the encoding step and the image signal and outputting a bit stream;
A recording medium on which a computer-readable program is recorded, wherein the generation step generates the header including buffer characteristic information relating to a buffer when the bitstream is decoded.
前記生成ステップにより生成された前記ヘッダと、入力された画像信号をそれぞれ符号化する符号化ステップと、
前記符号化ステップにより符号化された前記ヘッダと前記画像信号を多重化し、ビットストリームを出力する出力ステップと
を含む処理をコンピュータに実行させ、
前記生成ステップの処理は、前記ビットストリームを復号する際のバッファに関するバッファ特性情報を含む前記ヘッダを生成する
ことを特徴とするプログラム。A generation step for generating a header to be referred to as necessary at the time of decoding;
An encoding step for encoding the header generated by the generation step and an input image signal;
Causing the computer to execute processing including the header encoded by the encoding step and the output step of multiplexing the image signal and outputting a bitstream;
The processing of the generating step generates the header including buffer characteristic information related to a buffer when the bit stream is decoded.
前記検索手段により検索された前記ヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性情報に基づいて前記ビットストリームを復号する復号手段と
を含むことを特徴とする復号装置。Search means for searching for headers in the input bitstream;
A decoding apparatus comprising: decoding means for reading buffer characteristic information relating to a buffer included in the header searched by the search means, and decoding the bitstream based on the read buffer characteristic information.
ことを特徴とする請求項9に記載の復号装置。The decoding apparatus according to claim 9, wherein the buffer characteristic information is added to the header for each predetermined section that can be randomly accessed in the bitstream.
ことを特徴とする請求項9に記載の復号装置。The decoding apparatus according to claim 9, wherein the buffer characteristic information relating to the entire sequence of the bitstream is added to the header.
ことを特徴とする請求項9に記載の復号装置。The decoding apparatus according to claim 9, wherein the buffer characteristic information includes all of a minimum decodable bit rate Rmin, a minimum buffer size Bmin, and a minimum delay amount Fmin when decoding the bitstream. .
ことを特徴とする請求項9に記載の復号装置。The buffer characteristic information includes at least one of a minimum bit rate Rmin, a minimum buffer size Bmin, and a minimum delay amount Fmin that can be decoded when the bitstream is decoded. The decoding device described.
ことを特徴とする請求項9に記載の復号装置。The decoding means creates a buffer characteristic curve from the information read from the bitstream, and when the decoding apparatus characteristic curve is located above the bitstream characteristic curve, the input bitstream can be decoded. The decoding apparatus according to claim 9, further comprising a determination unit that determines that there is one.
前記検索ステップの処理により検索された前記ヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性情報に基づいて前記ビットストリームを復号する復号ステップと
を含むことを特徴とする復号方法。A search step for searching for a header in the input bitstream;
A decoding method, comprising: a decoding step of reading buffer characteristic information relating to a buffer included in the header searched by the processing of the searching step, and decoding the bitstream based on the read buffer characteristic information.
前記検索ステップの処理により検索された前記ヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性に基づいて前記ビットストリームを復号する復号ステップと
を含むことを特徴とするコンピュータが読み取り可能なプログラムが記録されている記録媒体。A search step for searching for a header in the input bitstream;
And a decoding step of reading buffer characteristic information relating to the buffer included in the header searched by the processing of the searching step, and decoding the bitstream based on the read buffer characteristic. Media on which various programs are recorded.
前記検索ステップの処理により検索された前記ヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出したバッファ特性に基づいて前記ビットストリームを復号する復号ステップと
を含む処理をコンピュータに実行させることを特徴とするプログラム。A search step for searching for a header in the input bitstream;
Reading out buffer characteristic information relating to a buffer included in the header searched by the process of the searching step, and causing the computer to execute a process including a decoding step of decoding the bitstream based on the read buffer characteristic. Program.
前記検索手段により検索された前記ヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出した情報に基づいて前記ビットストリームの編集が可能であるか否かを判断する判断手段と、
前記判断手段により前記ビットストリームの編集が可能であると判断された場合、前記ビットストリームの編集を行う編集手段と
を含み、
前記判断手段は、第1の前記ビットストリームの前記ヘッダに含まれる前記情報により作成される特性曲線が、第2の前記ビットストリームの前記ヘッダに含まれる前記情報により作成される特性曲線の常に上に位置するか、または、同一である場合、前記第1のビットストリームと前記第2のビットストリームを用いた編集は可能であると判断する
ことを特徴とする編集装置。Search means for searching for headers in the input bitstream;
Determination means for reading buffer characteristic information regarding the buffer included in the header searched by the search means, and determining whether or not the bitstream can be edited based on the read information;
Editing means for editing the bitstream if the determination means determines that the bitstream can be edited,
The determination means is characterized in that the characteristic curve created by the information contained in the header of the first bitstream is always above the characteristic curve produced by the information contained in the header of the second bitstream. Or the same, the editing apparatus determines that editing using the first bit stream and the second bit stream is possible.
前記検索ステップの処理により検索された前記ヘッダに含まれるバッファに関するバッファ特性情報を読み出し、その読み出した情報に基づいて前記ビットストリームの編集が可能であるか否かを判断する判断ステップと、
前記判断ステップの処理で前記ビットストリームの編集が可能であると判断された場合、前記ビットストリームの編集を行う編集ステップと
を含み、
前記判断ステップの処理は、第1の前記ビットストリームの前記ヘッダに含まれる前記情報により作成される特性曲線が、第2の前記ビットストリームの前記ヘッダに含まれる前記情報により作成される特性曲線の常に上に位置するか、または、同一である場合、前記第1のビットストリームと前記第2のビットストリームを用いた編集は可能であると判断する
ことを特徴とする編集方法。A search step for searching for a header in the input bitstream;
A determination step of reading buffer characteristic information relating to the buffer included in the header searched by the search step processing, and determining whether the bitstream can be edited based on the read information;
An editing step of editing the bitstream if it is determined that the bitstream can be edited in the process of the determining step,
In the process of the determining step, the characteristic curve created by the information included in the header of the first bitstream is the characteristic curve created by the information included in the header of the second bitstream. An editing method characterized by determining that editing using the first bit stream and the second bit stream is possible when the position is always above or the same.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003107787A JP4875285B2 (en) | 2002-04-26 | 2003-04-11 | Editing apparatus and method |
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002125298 | 2002-04-26 | ||
| JP2002125298 | 2002-04-26 | ||
| JP2003107787A JP4875285B2 (en) | 2002-04-26 | 2003-04-11 | Editing apparatus and method |
Related Child Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009108322A Division JP5223769B2 (en) | 2002-04-26 | 2009-04-27 | Decoding device and method, program, and recording medium |
| JP2010028883A Division JP5206706B2 (en) | 2002-04-26 | 2010-02-12 | Encoding apparatus and method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004007571A true JP2004007571A (en) | 2004-01-08 |
| JP4875285B2 JP4875285B2 (en) | 2012-02-15 |
Family
ID=30447464
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003107787A Expired - Fee Related JP4875285B2 (en) | 2002-04-26 | 2003-04-11 | Editing apparatus and method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4875285B2 (en) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007266830A (en) * | 2006-03-28 | 2007-10-11 | Alpine Electronics Inc | Video output system |
| JP2007531365A (en) * | 2004-03-26 | 2007-11-01 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | Transmitting recorded material |
| JP2010516103A (en) * | 2007-01-08 | 2010-05-13 | トムソン ライセンシング | Method and apparatus for video stream splicing |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08251582A (en) * | 1995-03-07 | 1996-09-27 | Toshiba Corp | Encoded data editing device |
-
2003
- 2003-04-11 JP JP2003107787A patent/JP4875285B2/en not_active Expired - Fee Related
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08251582A (en) * | 1995-03-07 | 1996-09-27 | Toshiba Corp | Encoded data editing device |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2007531365A (en) * | 2004-03-26 | 2007-11-01 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | Transmitting recorded material |
| JP4782770B2 (en) * | 2004-03-26 | 2011-09-28 | ブリティッシュ・テレコミュニケーションズ・パブリック・リミテッド・カンパニー | Transmitting recorded material |
| JP2007266830A (en) * | 2006-03-28 | 2007-10-11 | Alpine Electronics Inc | Video output system |
| JP2010516103A (en) * | 2007-01-08 | 2010-05-13 | トムソン ライセンシング | Method and apparatus for video stream splicing |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4875285B2 (en) | 2012-02-15 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5206706B2 (en) | Encoding apparatus and method | |
| JP4875285B2 (en) | Editing apparatus and method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060323 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20080116 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080129 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080331 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090427 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091112 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100212 |
|
| A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20100301 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100413 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100614 |
|
| A912 | Re-examination (zenchi) completed and case transferred to appeal board |
Free format text: JAPANESE INTERMEDIATE CODE: A912 Effective date: 20100702 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111125 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20141202 Year of fee payment: 3 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4875285 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| LAPS | Cancellation because of no payment of annual fees |