JP2019004360A - 動画像符号化装置及び動画像復号装置 - Google Patents
動画像符号化装置及び動画像復号装置 Download PDFInfo
- Publication number
- JP2019004360A JP2019004360A JP2017118487A JP2017118487A JP2019004360A JP 2019004360 A JP2019004360 A JP 2019004360A JP 2017118487 A JP2017118487 A JP 2017118487A JP 2017118487 A JP2017118487 A JP 2017118487A JP 2019004360 A JP2019004360 A JP 2019004360A
- Authority
- JP
- Japan
- Prior art keywords
- image
- picture
- component
- prediction
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/186—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/17—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
- H04N19/172—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/103—Selection of coding mode or of prediction mode
- H04N19/107—Selection of coding mode or of prediction mode between spatial and temporal predictive coding, e.g. picture refresh
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/157—Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
- H04N19/159—Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/182—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/184—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/42—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/44—Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Processing Of Color Television Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
【課題】マルチスペクトル画像を効率的に符号化圧縮伸張して利用することができる動画像符号化装置及び動画像復号回路を提供する。【解決手段】動画像符号化回路1は、ピクチャに含まれる色成分の各々に対応し各々が異なる波長を持つ複数のコンポーネントを含む複数のピクチャを入力し、当該ピクチャの各コンポーネントの符号化に用いる参照画像を自ピクチャ又は参照メモリに含まれる符号化済みのピクチャのコンポーネントの中から探索し、当該探索された参照画像に含まれる画素の情報に基づいて予測画像を生成する予測画像生成部10と、予測画像生成部10から出力された予測画像を元にビットストリームを生成する符号化部40とを備え、予測画像生成部10は、参照画像が含まれるコンポーネントの情報を示す参照コンポーネントインデックスを出力し、符号化部40は、当該参照コンポーネントインデックスの情報を含むビットストリームを出力する。【選択図】図2
Description
本発明は動画像符号化装置及び動画像復号装置に関する。
デジタルカメラ、ビデオカメラなどの画像は、赤(R)、緑(G)、青(B)の3原色を用いて、人の目が見る色に近い色を再現して映し出している。また、最近は、RGBの3原色の他に、赤外線、紫外線などの人の目に見えない光の情報や、RGBの中の特定の波長を用いて撮影した情報を画像解析して、果物の糖度分析、内臓の病理解析などに役立てる技術が開発されている。
このようなRGB以外の色成分を多数含むマルチスペクトル画像(「マルチバンド画像」、「マルチチャネル画像」ともいう。)は、画像に含まれるスペクトル数が多くなることから、データ量が多くなる傾向にある。そのため、マルチスペクトル画像を通信などで利用したり、媒体に記録したりするときには、画像データを圧縮し、データを軽量化することが求められる。マルチスペクトル画像を圧縮する方法としては、例えば、特許文献1記載の発明が知られている。
しかしながら、特許文献1記載の発明では、マルチスペクトル画像を3バンド画像に変換してから圧縮を行っている。このような方法で情報を圧縮すると、又は、変換した3バンド画像を符号化して情報を圧縮すると、マルチスペクトルの全ての情報を活用する場合には、情報が圧縮されないことがあった。
そこで、マルチスペクトル画像を効率的に符号化圧縮伸張して利用することができる動画像符号化装置及び動画像復号装置が望まれていた。
その他の課題と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。
その他の課題と新規な特徴は、本明細書の記述及び添付図面から明らかになるであろう。
一実施の形態によれば、複数のスペクトル(以下、「コンポーネント」という。)を含むピクチャの符号化について、符号化対象であるピクチャ自身、もしくは、既に符号化されたピクチャに含まれるコンポーネントの情報を参照して予測符号化を行い、参照画像が含まれるコンポーネントを指定するインデックス情報をデータストリームの中に含めるようにするものである。なお、以下の記載において、「コンポーネント」とは、ピクチャに含まれる色成分に対応した要素であり、異なる波長のものを意味する。
上記一実施の形態によれば、多数のコンポーネントを含むピクチャを効率的に符号化圧縮伸張して利用することができる動画像符号化装置及び動画像復号装置を提供することができる。
なお、上記実施の形態の装置を、方法やシステムに置き換えて表現したもの、該装置又は該装置の一部の処理をコンピュータに実行せしめるプログラム、該装置を備えたLSI、車載カメラ、車載周辺監視システム、車載運転補助システム、車載自動運転システム、ARシステム、産業用途映像処理システム、画像処理システムも、本発明の態様として有効である。
説明の明確化のために、以下の記載及び図面は、適宜、省略及び簡略化がなされる。また、様々な処理を行う機能ブロックとして図面に記載する各要素は、ハードウェア的には、CPU、メモリ、その他の回路で構成することができ、ソフトウェア的には、メモリにロードされたプログラムなどによって実現することができる。
したがって、これらの機能ブロックがハードウェアのみ、ソフトウェアのみ、又は、それらの組合せによっていろいろな形で実現できることは当業者に理解されるところであり、いずれかに限定されるものではない。なお、各図面において、同一の要素には同一の符号を付しており、必要に応じて重複説明は省略している。
また、上述したプログラムを、様々なタイプの非一時的なコンピュータ可読媒体(non−transitory computer readable medium)を用いて格納し、コンピュータに供給することができる。
非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。
また、プログラムを、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給してもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び、電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路を介して、又は、無線通信路を介して、プログラムをコンピュータに供給できる。
まず、実施の形態に係る構成がより明確になると思われることから、実施の形態の説明の前に、本発明者らが行った検討について説明する。
図1は、ピクチャに含まれる色成分のコンポーネントの波長の分布を示す図である。
図1では赤(R)、緑(G)、青(B)の3原色のコンポーネントの他に、紫外線や赤外線などの3原色以外のコンポーネントの波長の分布も示されている。3原色のピクチャの符号化を行う場合、通常はRGBの3原色のデータは一旦輝度と色差の2つの成分に変換され、その後、輝度と色差の2つの成分に対してそれぞれ符号化が行われる。
図1では赤(R)、緑(G)、青(B)の3原色のコンポーネントの他に、紫外線や赤外線などの3原色以外のコンポーネントの波長の分布も示されている。3原色のピクチャの符号化を行う場合、通常はRGBの3原色のデータは一旦輝度と色差の2つの成分に変換され、その後、輝度と色差の2つの成分に対してそれぞれ符号化が行われる。
しかし、3原色以外のコンポーネントも含むピクチャの場合、3原色のコンポーネントのみのピクチャの場合とは異なり、各コンポーネントの波長が近接している範囲(例えば、図1のAの範囲)が存在する。波長の分布が近いコンポーネントは、その性質が似ることが想定される。このため、複数のコンポーネントを含むピクチャにおいては、近隣するコンポーネントの情報を利用して、より効率的に符号化できることを本発明者らは見出した。
以下、各実施の形態について詳細に説明する。
(実施の形態1)
本実施の形態1に係る動画像符号化回路及び動画像復号回路は、直交化されていない色空間(例えば、多数のコンポーネントを含むピクチャ)において、3つを超えるコンポーネントの間での相関を利用して情報を圧縮伸張するもので、具体的には、圧縮したデータであるビットストリーム内に、コンポーネントの数の情報、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスを含めることで、符号化対象のコンポーネントとは異なる他のコンポーネントからも画像予測を行うことを可能とする。これにより効率的に符号化処理又は復号処理を行うことができる。
(実施の形態1)
本実施の形態1に係る動画像符号化回路及び動画像復号回路は、直交化されていない色空間(例えば、多数のコンポーネントを含むピクチャ)において、3つを超えるコンポーネントの間での相関を利用して情報を圧縮伸張するもので、具体的には、圧縮したデータであるビットストリーム内に、コンポーネントの数の情報、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスを含めることで、符号化対象のコンポーネントとは異なる他のコンポーネントからも画像予測を行うことを可能とする。これにより効率的に符号化処理又は復号処理を行うことができる。
なお、動画像符号化回路、動画像復号回路は、それぞれ動画像符号化装置、動画像復号装置の全部又は一部を構成する。
また、以下の記載において、ビット列となって伝送路に出力される状態の圧縮データを「ビットストリーム」と呼ぶ。
また、以下の記載において、ビット列となって伝送路に出力される状態の圧縮データを「ビットストリーム」と呼ぶ。
まず、本実施の形態1に係る動画像符号化回路の構成及び動作について説明する。
図2は、本実施の形態1に係る動画像符号化回路1の概略構成を示すブロック図である。
動画像符号化回路1は、予測画像生成部10、符号化部40などを備える。予測画像生成部10は外部よりピクチャを入力し、ピクチャがどの予測方法により予測されたかを示す予測方法選択情報b1、予測残差b2、予測を行うための参照画像が含まれたピクチャ情報を示す参照ピクチャ情報b3、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスb4、及び、画面内予測情報b5を出力する。
図2は、本実施の形態1に係る動画像符号化回路1の概略構成を示すブロック図である。
動画像符号化回路1は、予測画像生成部10、符号化部40などを備える。予測画像生成部10は外部よりピクチャを入力し、ピクチャがどの予測方法により予測されたかを示す予測方法選択情報b1、予測残差b2、予測を行うための参照画像が含まれたピクチャ情報を示す参照ピクチャ情報b3、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスb4、及び、画面内予測情報b5を出力する。
予測方法には画面間予測と画面内予測の2種類があり、選択された予測方法が予測方法選択情報b1として出力される。本実施の形態1においては、画面間予測には同一ピクチャ内における異なるコンポーネントからの予測も含まれる。入力されるピクチャは、時間的に連続する複数のピクチャであって、各ピクチャは複数のコンポーネントを含む。
符号化部40は、予測画像生成部10より出力された情報を可変長符号化し、ビットストリームを生成する。このとき、符号化部40は、予測画像生成部10から出力された予測方法選択情報b1、予測残差b2、参照ピクチャ情報b3、参照コンポーネントインデックスb4、及び、画面内予測情報b5を符号化して、それらの情報を含むビットストリームを生成する。
符号化部40は、予測方法が画面内予測であるときは、ビットストリームに画面内予測情報b5、予測方法選択情報b1、予測残差b2を含める。一方、予測方法が画面間予測であるときは、参照ピクチャ情報b3、参照コンポーネントインデックスb4、予測残差b2を含める。予測方法が画面内予測である場合、動画像符号化回路1は同ピクチャの同コンポーネントから予測を行う。一方、画面間予測である場合は、動画像符号化回路1は同ピクチャ又は他のピクチャに含まれる、同コンポーネント又は他のコンポーネントから予測を行う。
図3は、本実施の形態1に係るピクチャの構成を説明するための図である。
各ピクチャは、複数のコンポーネントを含み、各コンポーネントにはコンポーネントインデックスが付されている。例えば、ピクチャがN個のコンポーネントで構成されている場合には、各コンポーネントには、0〜N−1のコンポーネントインデックスが付されている。また、複数のコンポーネントの中には、赤色よりも波長が長い波長領域、又は、青色よりも波長が短い波長領域のコンポーネントの少なくとも1つが含まれていても良い。
各ピクチャは、複数のコンポーネントを含み、各コンポーネントにはコンポーネントインデックスが付されている。例えば、ピクチャがN個のコンポーネントで構成されている場合には、各コンポーネントには、0〜N−1のコンポーネントインデックスが付されている。また、複数のコンポーネントの中には、赤色よりも波長が長い波長領域、又は、青色よりも波長が短い波長領域のコンポーネントの少なくとも1つが含まれていても良い。
図4は、本実施の形態1に係る予測画像生成部10の概略構成を示すブロック図である。
予測画像生成部10は、画面内予測画像生成部11、類似画像探索部12、画面間予測画像生成部13、選択部14、減算部15、周波数変換・量子化部16、逆周波数変換・逆量子化部17、加算部18、画像メモリ19などを備える。
予測画像生成部10は、画面内予測画像生成部11、類似画像探索部12、画面間予測画像生成部13、選択部14、減算部15、周波数変換・量子化部16、逆周波数変換・逆量子化部17、加算部18、画像メモリ19などを備える。
画面内予測画像生成部11は、ピクチャを入力し、ピクチャを構成するコンポーネント毎に予測画像を生成する。各ピクチャは、各ピクチャを細分化したマクロブロックや、マクロブロックを更に細分化したサブブロックを符号化対象画像の単位とし、マクロブロックやサブブロック毎に画面内予測を用いて予測画像を生成し、選択部14に出力する。画面内予測画像の生成方法は、例えば、符号化対象画像の周囲画素の平均値を用いて予測をする方法や、符号化対象画像に隣接する符号化済みの画素を特定の方向にコピーして予測を行う方法などがあるが、これらに限られるものではない。
画面内予測画像生成部11は、更に、画面内予測に必要な情報(例えば、符号化済みの画素をコピーする方向を示した特定方向情報など)を画面内予測情報b5として符号化部40に出力する。
画面内予測画像生成部11は、更に、画面内予測に必要な情報(例えば、符号化済みの画素をコピーする方向を示した特定方向情報など)を画面内予測情報b5として符号化部40に出力する。
類似画像探索部12は、ピクチャを入力し、ピクチャを構成するコンポーネント毎に、更に、各コンポーネントに含まれる符号化対象画像毎に類似画像を探索する。具体的には、画像メモリ19に記憶された参照ピクチャ(ローカルデコードピクチャ)の中から、符号化対象画像の符号化予測に利用できる最も類似度が高い類似画像をブロックマッチングなどにより探索することで、類似画像を探索する。類似画像が探索された後は、類似画像の位置情報(例えば、類似画像と符号化対象画像との相対的位置を表したベクトルなど)を含む情報を画面間予測画像生成部13に出力する。
符号化予測に利用する最も類似度が高い画像領域(画素群)は、符号化対象画像と同じピクチャの、同じピクチャ内位置の、別コンポーネントであることが多い。そして、最も類似度が高いコンポーネントは、ピクチャやピクチャ内位置によって変化する。
そこで、類似画像探索部12は、符号化対象画像を含むピクチャと同じピクチャの各コンポーネント、及び、符号化対象画像を含むピクチャとは異なるピクチャのコンポーネントについて類似画像を探索する。類似度の計算は絶対値差分の総和(SAD)など一般的に用いられる手法で良く、また、レート歪(RD)最適化などの手法を用いて必要な符号量を考慮に入れても良い。また、類似画像探索部12は、当該類似画像を含むピクチャを示す参照ピクチャ情報b3と、当該類似画像が含まれるコンポーネントを示す参照コンポーネントインデックスb4とを符号化部40に出力する。なお、探索の結果選ばれた類似画像は、後に予測画像生成のため参照画像として使用される。
図5は、本実施の形態1に係る複数のピクチャの参照関係を説明するための図である。
類似画像探索部12は、符号化対象画像が属するピクチャ(ピクチャ1)については、各コンポーネントの、既に符号化が終了して画像メモリ19に記憶されている領域を探索し、また、符号化対象画像が属していないピクチャ(ピクチャ0、2、3)については、既に符号化されて画像メモリ19に記憶された参照ピクチャの各コンポーネントを探索する。
類似画像探索部12は、符号化対象画像が属するピクチャ(ピクチャ1)については、各コンポーネントの、既に符号化が終了して画像メモリ19に記憶されている領域を探索し、また、符号化対象画像が属していないピクチャ(ピクチャ0、2、3)については、既に符号化されて画像メモリ19に記憶された参照ピクチャの各コンポーネントを探索する。
そして、探索の結果得られた類似画像について、当該類似画像を含んだピクチャの番号を示す参照ピクチャ情報b3(例えば、0、1、2又は3)と、当該類似画像を含んだコンポーネントの情報を示す参照コンポーネントインデックス(例えば、0〜N−1のいずれか1つ)を符号化部40に出力する。
再び、図4を参照すると、画面間予測画像生成部13は、類似画像探索部12により探索された類似画像の情報(位置を表したベクトル、画素値など)に基づいて、符号化対象画像毎に予測画像を生成する。探索された類似画像は「参照画像」ともいわれ、予測画像の生成に使用される。そして、画面間予測画像生成部13は、生成した予測画像を選択部14に出力する。
選択部14は、画面内予測画像生成部11から出力された予測画像の符号化対象画像との類似度と、画面間予測画像生成部13から出力された予測画像の符号化対象画像との類似度とを比較して、より類似度の高い予測画像を生成した予測方法を選択し、選択した予測方法の予測画像を減算部15及び加算部18に出力する。また、選択部14は、予測方法選択情報b1を符号化部40に出力する。
減算部15は、入力ピクチャと予測画像との差分を算出して予測残差b2を生成し、周波数変換・量子化部16に出力する。
周波数変換・量子化部16は、予測残差b2に周波数変換及び量子化を行い、量子化された予測残差b2、量子化に使用した変換係数を符号化部40及び逆周波数変換・逆量子化部17に出力する。
周波数変換・量子化部16は、予測残差b2に周波数変換及び量子化を行い、量子化された予測残差b2、量子化に使用した変換係数を符号化部40及び逆周波数変換・逆量子化部17に出力する。
図6は、本実施の形態1に係るビットストリームの階層構造を説明するための図である。
ビットストリームには、例えば、シーケンスレベル、グループオブピクチャ(GOP)レベル、ピクチャレベル、スライスレベル、マクロブロックレベル、ブロックレベルなどの階層が存在する。なお、この階層は一例であり、この構成に限定されるものではない。
シーケンスレベルには複数のGOPパラメータ及びGOPデータが含まれており、GOPレベルには複数のピクチャパラメータ及びピクチャデータが含まれている。スライスレベル、ピクチャレベル、マクロブロックレベル、ブロックレベルについても同様であり、ここでは説明を省略する。
ビットストリームには、例えば、シーケンスレベル、グループオブピクチャ(GOP)レベル、ピクチャレベル、スライスレベル、マクロブロックレベル、ブロックレベルなどの階層が存在する。なお、この階層は一例であり、この構成に限定されるものではない。
シーケンスレベルには複数のGOPパラメータ及びGOPデータが含まれており、GOPレベルには複数のピクチャパラメータ及びピクチャデータが含まれている。スライスレベル、ピクチャレベル、マクロブロックレベル、ブロックレベルについても同様であり、ここでは説明を省略する。
各レベルには、パラメータとデータが含まれる。パラメータは、ビットストリーム中のデータの前にあって、符号化処理に関する設定情報などを含む。例えば、シーケンスパラメータであれば、ピクチャに含まれる画素数、ピクチャの縦と横とのサイズの比を示すアスペクト比、1秒間に再生されるピクチャ数を示すフレーム・レートといった情報が含まれる。
GOPパラメータには動画と音声とを同期させるための時間情報などが含まれ、ピクチャパラメータにはピクチャのタイプ(Iピクチャ、Pピクチャ又はBピクチャ)や動き補償予測に関する情報、GOPにおける表示順序などの情報が含まれる。マクロブロックパラメータには予測方法(画面間予測又は画面内予測)を示す情報や、更に予測方法が画面間予測である場合には参照するピクチャを示す参照ピクチャ情報b3などの情報が含まれる。
GOPパラメータには動画と音声とを同期させるための時間情報などが含まれ、ピクチャパラメータにはピクチャのタイプ(Iピクチャ、Pピクチャ又はBピクチャ)や動き補償予測に関する情報、GOPにおける表示順序などの情報が含まれる。マクロブロックパラメータには予測方法(画面間予測又は画面内予測)を示す情報や、更に予測方法が画面間予測である場合には参照するピクチャを示す参照ピクチャ情報b3などの情報が含まれる。
図7は、本実施の形態1に係るビットストリームの構造の説明図であり、図6における符号単位(ブロック)レベルの構成の詳細図である。
コンポーネントパラメータの中には、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスが含まれる。また、コンポーネントデータの中には、参照コンポーネントインデックスで示した参照画像と予測画像との差分値である予測残差が含まれる。コンポーネントの総数N(例えば、Nは4以上)は、ピクチャレイヤ以上のパラメータ、より具体的にはスライスパラメータ群、ピクチャパラメータ群、GOPパラメータ群のいずれかの群の中に情報が含まれる。
コンポーネントパラメータの中には、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスが含まれる。また、コンポーネントデータの中には、参照コンポーネントインデックスで示した参照画像と予測画像との差分値である予測残差が含まれる。コンポーネントの総数N(例えば、Nは4以上)は、ピクチャレイヤ以上のパラメータ、より具体的にはスライスパラメータ群、ピクチャパラメータ群、GOPパラメータ群のいずれかの群の中に情報が含まれる。
符号化部40は、予測方法選択情報b1、予測残差b2、参照ピクチャ情報b4、参照コンポーネントインデックスb4、及び、画面内予測情報b5を符号化して、それらの情報を含むビットストリームを生成する。更に、符号化部40は、予め定められたコンポーネント数の情報を、ビットストリームのピクチャレイヤ以上の階層のパラメータ群のうちいずれかの群の中に含める。ピクチャレイヤ以上の階層のパラメータ群にコンポーネント数の情報を含めることで、動画像復号回路はビットストリームを受け取った際に、コンポーネント数Nの情報を取得し、復号に必要なメモリ領域をその大きさを決定して確保することができる。
動画像復号回路は、必要な量だけメモリ領域を確保することができるので、メモリ領域を効率的に使用した復号を行うことができる。また、動画像復号回路はコンポーネント数の情報を取得することで、N個のコンポーネントを復号し終えたときに、符号化単位の終了を判定することができる。なお、上記b1〜b5の情報はビットストリームに含まれる代表的な情報を述べたものであり、上記以外の情報(例えば、量子化に使用される変換係数や、その他の符号化に必要な設定値)もビットストリームに含まれることはいうまでもない。
逆周波数変換・逆量子化部17は、量子化に使用した変換係数を使用して、予測残差に逆周波数変換・逆量子化の処理を施し、その処理結果を加算部18に出力する。
加算部18は、当該処理結果と予測画像とを加算して、参照画像(ローカルデコードピクチャ)を生成し、画像メモリ19に出力する。なお、逆周波数変換・逆量子化部17及び加算部18の動作も、従来技術のものと同様であって良い。
画像メモリ19は、参照画像を記憶し、参照画像は他のピクチャの符号化処理に使用される。
加算部18は、当該処理結果と予測画像とを加算して、参照画像(ローカルデコードピクチャ)を生成し、画像メモリ19に出力する。なお、逆周波数変換・逆量子化部17及び加算部18の動作も、従来技術のものと同様であって良い。
画像メモリ19は、参照画像を記憶し、参照画像は他のピクチャの符号化処理に使用される。
このように、多数のコンポーネントを含む画像において、直交化されていないコンポーネント間には相関があることから、本実施の形態1に係る動画像符号化回路1では、圧縮データ内に、コンポーネント数情報、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスを含めて、符号化対象のコンポーネントとは異なる他のコンポーネントからも画像予測を行うことで、多数のコンポーネントを含むピクチャの効率的な符号化圧縮を可能にしている。
次に、本実施の形態1に係る動画像復号回路の構成及び動作について説明する。
図8は、本実施の形態1に係る動画像復号回路5の概略構成を示すブロック図である。
動画像復号回路5は、符号復号部51、画像復元部52などを備えている。また、画像復元部52は、逆周波数変換・逆量子化部53、画面内予測画像生成部54、画面間予測画像生成部55、選択部56、加算部57、画像メモリ58などを備えている。
図8は、本実施の形態1に係る動画像復号回路5の概略構成を示すブロック図である。
動画像復号回路5は、符号復号部51、画像復元部52などを備えている。また、画像復元部52は、逆周波数変換・逆量子化部53、画面内予測画像生成部54、画面間予測画像生成部55、選択部56、加算部57、画像メモリ58などを備えている。
符号復号部51は、ビットストリームを入力して符号復号し、ビットストリームに含まれていたデータのうち、量子化に使用した変換係数と予測残差b2を逆周波数変換・逆量子化部53に、画面内予測情報b5を画面内予測画像生成部54に、参照ピクチャ情報b3及び参照コンポーネントインデックスb4を画面間予測画像生成部55に、予測方法選択情報b1を選択部56にそれぞれ出力する。
逆周波数変換・逆量子化部53は、量子化に使用した変換係数を用いて予測残差b2に逆周波数変換・逆量子化の処理を施し、その処理結果を加算部57に出力する。画面内予測画像生成部54は、画面内予測情報b5に基づいて予測画像を生成する。
画面間予測画像生成部55は、参照ピクチャ情報b3、参照コンポーネントインデックスb4、及び、画像メモリ58に記憶された参照画像に基づいて、予測画像を生成する。
このとき、画面間予測画像生成部55が参照する参照画像には、復号対象画像が属するピクチャの各コンポーネントからの参照画像と、復号対象画像が属していないピクチャの各コンポーネントからの参照画像とが含まれる。
このとき、画面間予測画像生成部55が参照する参照画像には、復号対象画像が属するピクチャの各コンポーネントからの参照画像と、復号対象画像が属していないピクチャの各コンポーネントからの参照画像とが含まれる。
選択部56は、予測方法選択情報b1に基づいて、予測方法選択情報b1の示す予測方法の予測画像が加算部57に出力されるように選択を行う。
加算部57は、逆周波数変換・逆量子化の処理結果と予測画像とを加算して、復号画像を生成する。
加算部57は、逆周波数変換・逆量子化の処理結果と予測画像とを加算して、復号画像を生成する。
このように、本実施の形態1に係る動画像復号回路5では、ビットストリームに含まれるコンポーネント数情報、参照画像が含まれるコンポーネントを示す参照コンポーネントインデックスを用いて、符号化対象のコンポーネントとは異なる他のコンポーネントからも画像予測を行うことで、複数のコンポーネントを含む画像の効率的な伸張を可能にしている。
図9は、実施の形態1に係る半導体装置100の概略構成を示すブロック図である。
半導体装置100は、外部のカメラ110からピクチャを入力するインターフェース回路101、外部メモリ115とデータの読み書きを行うメモリコントローラ102、CPU103、上記説明した動画像符号化回路1、ビットストリームを外部へ出力するインターフェース回路104などを備える。
インターフェース回路101は、カメラ110より複数のコンポーネントを含んだピクチャを入力する。入力されたピクチャは、メモリコントローラ102によって外部メモリ115に格納される。
半導体装置100は、外部のカメラ110からピクチャを入力するインターフェース回路101、外部メモリ115とデータの読み書きを行うメモリコントローラ102、CPU103、上記説明した動画像符号化回路1、ビットストリームを外部へ出力するインターフェース回路104などを備える。
インターフェース回路101は、カメラ110より複数のコンポーネントを含んだピクチャを入力する。入力されたピクチャは、メモリコントローラ102によって外部メモリ115に格納される。
メモリコントローラ102はカメラからのピクチャを外部メモリ115に格納するほか、CPU103からの指令に応じて、動画像符号化回路1の処理に必要な画像データや画像管理データを、外部メモリ115と動画像符号化回路1との間で転送する。CPU103は、動画像符号化回路1の制御、メモリコントローラ102の転送の制御などを行う。インターフェース回路104は、動画像符号化回路1により生成されたビットストリームを、外部の伝送路へ出力する。
なお、図9における半導体装置100は全て回路で構成されているが、動画像符号化回路1はソフトウェアによって構成されても良い。その場合、動画像符号化回路1はプログラムとして外部メモリ115に格納され、CPU103によって制御される。
以上、説明したように、本実施の形態1に係る動画像符号化回路1は、ピクチャに含まれる色成分の各々に対応し各々が異なる波長を持つ複数のコンポーネントを含む複数のピクチャを入力し、当該ピクチャの各コンポーネントの符号化に用いる参照画像を自ピクチャ又は参照メモリに含まれる符号化済みのピクチャのコンポーネントの中から探索し、当該探索された参照画像に含まれる画素の情報に基づいて予測画像を生成する予測画像生成部10と、予測画像生成部10から出力された予測画像を元にビットストリームを生成する符号化部40とを備え、予測画像生成部10は、参照画像が含まれるコンポーネントの情報を示す参照コンポーネントインデックスを出力し、符号化部40は、当該参照コンポーネントインデックスの情報を含むビットストリームを出力するものである。
また、本実施の形態1に係る動画像符号化回路1では、ピクチャに含まれるコンポーネントの数を示す情報を更にビットストリームに含めることが好ましい。
また、本実施の形態1に係る動画像符号化回路1では、ピクチャに含まれるコンポーネントの数Nが4以上であることが好ましい。
また、本実施の形態1に係る動画像符号化回路1では、ピクチャに含まれるコンポーネントの数Nが4以上であることが好ましい。
また、本実施の形態1に係る動画像符号化回路1では、複数のコンポーネントは、赤色よりも波長が長い波長領域のコンポーネント、又は、青色よりも波長が短い波長領域のコンポーネントの少なくとも1つを含むことが好ましい。
また、本実施の形態1に係る動画像復号回路5は、ピクチャに含まれる色成分の各々に対応し、各々が異なる波長を持つ複数のコンポーネントを含む複数のピクチャが符号化されたビットストリームを入力して復号する符号復号部51と、当該復号された情報に基づいて予測画像を生成し、当該予測画像を用いて画像を復元する画像復元部52とを備え、符号復号部51は、ビットストリームから予測画像が含まれるコンポーネントの情報を示す参照コンポーネントインデックスを符号復号し、画像復元部52は、当該参照コンポーネントインデックスが示すコンポーネントに含まれる画素値を用いて予測画像を生成し、当該予測画像を用いて画像を復元するものである。
また、本実施の形態1に係る動画像復号回路5では、復号された情報として、予測画像が生成された方法を示す予測方法選択情報と、当該予測画像とピクチャの差分である予測残差とを含むことが好ましい。
(実施の形態2)
実施の形態1に係る動画像符号化回路1及び動画像復号回路5は、参照画像を含むコンポーネントの番号を参照コンポーネントインデックスとして設定したが、実施の形態2に係る動画像符号化回路及び動画像復号回路では、参照コンポーネントインデックスを、参照画像を含むコンポーネントの番号と、符号化対象画像を含むコンポーネントの番号とを用いて表現するものである。
実施の形態1に係る動画像符号化回路1及び動画像復号回路5は、参照画像を含むコンポーネントの番号を参照コンポーネントインデックスとして設定したが、実施の形態2に係る動画像符号化回路及び動画像復号回路では、参照コンポーネントインデックスを、参照画像を含むコンポーネントの番号と、符号化対象画像を含むコンポーネントの番号とを用いて表現するものである。
実施の形態2では、符号化部40は、各コンポーネントにその波長の短い方から長い方に向けて(又は、波長の長い方から短い方に向けて)0からN−1までのコンポーネント番号を付し、符号化対象画像を含むコンポーネントの番号Xに対し、参照コンポーネントインデックスCIを
CI = 参照画像を含むコンポーネントの番号 − X ・・・式(1)
として表現して符号化する。類似画像を含むコンポーネントを探索するとき、結果として符号化対象画像を含むコンポーネントと波長が近いコンポーネントが選択されることが多い。そこで、式(1)を用いることで、参照コンポーネントインデックスCIをより小さな値に割り当てることができ、効率的に符号化することができる。なお、式(1)を用いると参照コンポーネントインデックスCIは負の値も取りうるが、例えば、正負を表す符号1ビットを別に追加したり、0、1、−1、2、−2…を 0、1、2、3、4…と番号を振るなどして表現することが可能である。
CI = 参照画像を含むコンポーネントの番号 − X ・・・式(1)
として表現して符号化する。類似画像を含むコンポーネントを探索するとき、結果として符号化対象画像を含むコンポーネントと波長が近いコンポーネントが選択されることが多い。そこで、式(1)を用いることで、参照コンポーネントインデックスCIをより小さな値に割り当てることができ、効率的に符号化することができる。なお、式(1)を用いると参照コンポーネントインデックスCIは負の値も取りうるが、例えば、正負を表す符号1ビットを別に追加したり、0、1、−1、2、−2…を 0、1、2、3、4…と番号を振るなどして表現することが可能である。
例えば、コンポーネントの総数Nが8であり、符号化対象画像を含むコンポーネントXが7、参照画像を含むコンポーネントの番号が6であるとき、参照コンポーネントインデックスは1と定まる。参照画像を含むコンポーネントの番号をそのまま参照コンポーネントインデックスとした場合は、参照コンポーネントインデックスは「6」となり、「6」を表現するために最低3ビット必要となる。
一方で、参照コンポーネントインデックスを式(1)を用いて表した場合は、参照コンポーネントインデックスは「1」となり、「1」を表現すために必要なビット数は1ビットで済む。このように、送信する情報量を少なくすることができるため、効率的に符号化することができる。
一方で、参照コンポーネントインデックスを式(1)を用いて表した場合は、参照コンポーネントインデックスは「1」となり、「1」を表現すために必要なビット数は1ビットで済む。このように、送信する情報量を少なくすることができるため、効率的に符号化することができる。
符号復号部51は、ビットストリームから参照コンポーネントインデックスCI及び符号化対象画像を含むコンポーネント番号Xを取得する。そして、復号対象画像を含むコンポーネント番号Xに対し、以下の式(2)を用いて参照コンポーネントインデックスを得る。
参照画像を含むコンポーネントの番号 = CI + X ・・・式(2)
得られた参照コンポーネントインデックスCIは画面間予測画像生成部55に送られ、復号画像が生成される。このようにして、より少ない情報送信量で効率的な復号をすることができる。
参照画像を含むコンポーネントの番号 = CI + X ・・・式(2)
得られた参照コンポーネントインデックスCIは画面間予測画像生成部55に送られ、復号画像が生成される。このようにして、より少ない情報送信量で効率的な復号をすることができる。
以上、説明したように、本実施の形態2に係る動画像符号化回路1では、参照コンポーネントインデックスは、符号化対象画像を含むコンポーネントの番号と、ピクチャに含まれるコンポーネントの数を用いて表されることが好ましい。
また、本実施の形態2に係る動画像復号回路5では、参照コンポーネントインデックスは、符号化対象画像を含むコンポーネントの番号と、ピクチャに含まれるコンポーネントの数を用いて表されることが好ましい。
また、本実施の形態2に係る動画像復号回路5では、参照コンポーネントインデックスは、符号化対象画像を含むコンポーネントの番号と、ピクチャに含まれるコンポーネントの数を用いて表されることが好ましい。
(実施の形態3)
実施の形態1又は実施の形態2に係る動画像符号化回路1及び動画像復号回路5では、マクロブロック毎に参照コンポーネントインデックスを指定し、ビットストリーム内に参照コンポーネントインデックス、及び、コンポーネントの数の情報を含めるようにして、効率的に符号化処理又は復号処理を行うようにしたが、実施の形態3に係る動画像符号化回路及び動画像復号回路では、更にビットストリーム内に符号化単位毎に予測方法を示すフラグ情報を含めることで、符号化単位のコンポーネント毎に画像予測方法を指定して、より効率的に符号化処理又は復号処理を行うようにするものである。
実施の形態1又は実施の形態2に係る動画像符号化回路1及び動画像復号回路5では、マクロブロック毎に参照コンポーネントインデックスを指定し、ビットストリーム内に参照コンポーネントインデックス、及び、コンポーネントの数の情報を含めるようにして、効率的に符号化処理又は復号処理を行うようにしたが、実施の形態3に係る動画像符号化回路及び動画像復号回路では、更にビットストリーム内に符号化単位毎に予測方法を示すフラグ情報を含めることで、符号化単位のコンポーネント毎に画像予測方法を指定して、より効率的に符号化処理又は復号処理を行うようにするものである。
図10は、本実施の形態3に係る符号化部40の出力するビットストリームの構造を示す図である。
実施の形態1又は実施の形態2のものと比べると、コンポーネントパラメータの中に予測方法を示すintra or interフラグを含んでいる。このintra or interフラグは、各コンポーネントを符号化する予測方法が、画面内予測であるか又は画面間予測であるかを示すフラグである。
実施の形態1又は実施の形態2のものと比べると、コンポーネントパラメータの中に予測方法を示すintra or interフラグを含んでいる。このintra or interフラグは、各コンポーネントを符号化する予測方法が、画面内予測であるか又は画面間予測であるかを示すフラグである。
実施の形態1又は実施の形態2では、マクロブロック単位で予測方法が決定され、マクロブロックに含まれる複数のコンポーネント全てに同一の予測方法が使用されていたが、本実施の形態3では符号化単位ブロックの更にコンポーネントパラメータの中に予測方法を指定するintra or interフラグを設けることで、符号化単位ブロックの中の更に各コンポーネント単位で予測方法を切り替えることができる。なお、本実施の形態3に係る動画像符号化回路及び動画像復号回路の構成は、実施の形態1又は実施の形態2に係る動画像符号化回路1及び動画像復号回路5の構成と同様で良く、以下では、これらの図示及び一部の構成の説明を省略する。
まず、本実施の形態3に係る動画像符号化回路1では、選択部14が、符号化対象ブロックのコンポーネント毎に予測方法、すなわち、画面内予測か画面間予測かを選択し、選択した予測方法をintra or interフラグとして符号化部40に出力する。符号化部40は、図10に示すように、intra or interフラグをコンポーネントパラメータの中に含めたビットストリームを生成し、動画像復号回路5へと出力する。多数のコンポーネントを含む画像においては、特定のコンポーネントが同じピクチャの他のコンポーネントと大きく異なることがしばしば起こり得るため、特定のコンポーネントのみ予測方法を変更することで、より効率的な符号化処理、復号処理を行うことができる。
なお、本実施の形態3に限らず、符号化部40が行う符号化方法は固定長符号化を用いても良いし、MPEG−4規格におけるCBP(Constrained Baseline Profile:制約ベースラインプロファイル)のように可変長符号化を用いても良い。
また、図10のようなビットストリームの構成をとる場合には、intra or interフラグによって予測方法を動画像復号回路5に伝達することが可能なため、複数のコンポーネントを含むマクロブロック単位での予測方法を示す予測方法選択情報b1は省略することができる。
図11は、本実施の形態3に係るビットストリームの概略構造を示す図である。
図11に示すように、スライスレベルは、予測方法選択情報b1とintra or interフラグの両方を持つようにしても良い。図11では、マクロブロックパラメータ内に、予測方法選択情報b1に加えてintra or inter override enable フラグを持つ。予測方法選択情報b1とintra or interフラグの両方がビットストリーム内に存在する場合には、どちらの情報を参照して予測方法を決定するか決めなければならない。そのためintra or inter override enableフラグが1である場合にはinter or interフラグの値を参照して予測方法を決定し、フラグが0である場合には予測方法選択情報b1を参照して予測方法を決定するようにする。
図11に示すように、スライスレベルは、予測方法選択情報b1とintra or interフラグの両方を持つようにしても良い。図11では、マクロブロックパラメータ内に、予測方法選択情報b1に加えてintra or inter override enable フラグを持つ。予測方法選択情報b1とintra or interフラグの両方がビットストリーム内に存在する場合には、どちらの情報を参照して予測方法を決定するか決めなければならない。そのためintra or inter override enableフラグが1である場合にはinter or interフラグの値を参照して予測方法を決定し、フラグが0である場合には予測方法選択情報b1を参照して予測方法を決定するようにする。
Intra or inter overrideフラグが0である場合には、inter or intraフラグは参照されないため、inter or intraフラグを送信しないようにしてもよい。この場合は、ビットストリーム内にinter or intraフラグを含まず予測方法選択情報b1のみを含めるため、実施の形態1に係るビットストリーム構造と同様になる。なお、intra or inter override enableフラグの値と参照する情報の例は上記の例に限るものでなく、例えば、0の時にintra or inter フラグを参照し、1の時に予測方法選択情報b1を参照するようにしても良い。
本実施の形態3に係る動画像復号回路5では、符号復号部51がビットストリームを復号して、復号対象のコンポーネント毎に画像予測方法を示す予測方法選択情報b1を選択部56に出力する。
そして、選択部56は、予測方法選択情報b1に基づいて、予測方法選択情報b1の示す予測方法の予測画像が加算部57に出力されるように選択する。
そして、選択部56は、予測方法選択情報b1に基づいて、予測方法選択情報b1の示す予測方法の予測画像が加算部57に出力されるように選択する。
このように、本実施の形態3に係る動画像符号化回路1及び動画像復号回路5では、複数のコンポーネントを含む画像において、特定のコンポーネント、例えば、300nmの波長に対応するコンポーネントの画像のみ、他のコンポーネント、例えば、500nmの波長に対応するコンポーネントの画像と大きく異なるような場合であっても、特定のコンポーネントのみ予測方法を変更することで、より効率的な符号化処理、復号処理を行うことができる。
以上、説明したように、本実施の形態3に係る動画像符号化回路1は、予測画像生成部10は、画面内予測と画面間予測とを切り替える選択部14を更に備え、選択部14はコンポーネント毎に予測方法を決定し、符号化部40は、当該予測方法を示す予測方法選択情報をビットストリームに含めることが好ましい。
また、本実施の形態3に係る動画像復号回路5では、画像復元部52は、画面内予測画像生成部54と画面間予測画像生成部55とを有し、予測方法選択情報に基づいてコンポーネント毎に予測画像を切り替えて画像復元を行うことが好ましい。
また、本実施の形態3に係る動画像復号回路5では、画像復元部52は、画面内予測画像生成部54と画面間予測画像生成部55とを有し、予測方法選択情報に基づいてコンポーネント毎に予測画像を切り替えて画像復元を行うことが好ましい。
(実施の形態4)
実施の形態1に係る動画像符号化回路1及び動画像復号回路5では、画像メモリに記憶した参照画像を参照して予測画像を生成したが、本実施の形態4に係る動画像符号化回路及び動画像復号回路では、参照画像をトーンマッピングで変換した上で予測画像を生成し、ビットストリーム内にコンポーネントを含むピクチャのトーンマッピングテーブルを含めるようにして、より効率的に符号化処理又は復号処理を行うようにするものである。
実施の形態1に係る動画像符号化回路1及び動画像復号回路5では、画像メモリに記憶した参照画像を参照して予測画像を生成したが、本実施の形態4に係る動画像符号化回路及び動画像復号回路では、参照画像をトーンマッピングで変換した上で予測画像を生成し、ビットストリーム内にコンポーネントを含むピクチャのトーンマッピングテーブルを含めるようにして、より効率的に符号化処理又は復号処理を行うようにするものである。
図12は、本実施の形態4に係る予測画像生成部20の概略構成を示すブロック図である。実施の形態1又は実施の形態2に係る予測画像生成部10と比べると、トーンマッピング処理部22、23を新たに設けている。
本実施の形態4に係る予測画像生成部20では、トーンマッピング処理部22は類似画像探索部12より出力された参照画像に対しトーンマッピング処理を行い、画面間予測画像生成部13に出力を行う。なお、本実施の形態4に係るトーンマッピングとは、各画素値を特定のテーブルに従って変換する操作のことをいう。トーンマッピング処理は、トーンマッピング処理部22内部にあるトーンマッピングテーブルを参照して行われる。トーンマッピングテーブルは、一次線形の関数で表されても良いし、非線形の関数で表されても良い。画面間予測画像生成部13は、トーンマッピング処理が施された参照画像を用いて予測画像を生成する。
画面内予測画像生成部21に含まれるトーンマッピング処理部23も、トーンマッピング処理部22と同様に、予測画像を生成するために、画面内の各画素にトーンマッピング処理を行い、予測画像を生成する。このとき、トーンマッピング処理部23は、トーンマッピング処理部22と同様に、トーンマッピングテーブルを符号化部40に出力する(図示せず)。選択部14で選択された予測画像は、加算部18にて逆周波数変換・逆量子化部17の処理結果と加算され、加算結果を画像メモリ19に格納される。
符号化部40は、トーンマッピングテーブルの情報をビットストリームに含めて復号回路に出力する。トーンマッピングテーブルは、図6におけるビットストリーム階層の概略構造のうちの、スライスレベル以上のパラメータ内に含めるようにすると良い。これにより、ビットストリームに含めるトーンマッピングテーブルの数を少なくすることができ、ビットストリームの情報量を削減することができる。
スライスレベルより下のパラメータに含める場合は、例えば、マクロブロック単位、符号化単位などでトーンマッピングテーブルを変更できるという効果がある。だが一方で、トーンマッピングテーブルの情報量が増加する課題も生じる。そのような場合は、実施の形態3に係るIntra or inter override enableフラグのように、トーンマッピングテーブルを参照するか否かを示すフラグをスライスレベル以上に含まれるパラメータに含めると良い。フラグがトーンマッピングテーブルを参照しないことを示す場合、すなわち、フラグがトーンマッピング処理を行わないことを示す場合、ビットストリームにマッピングテーブルの情報を含めないことが可能となる。
このように、トーンマッピングテーブルをスライスレベルより下のレベルのパラメータに含めた場合においても、マクロブロック単位などでトーンマッピング処理を行うか否か選択することを可能とし、ビットストリームの情報量の削減することができる。
図13は、本実施の形態4に係る動画像復号回路6の概略構成を示すブロック図である。
実施の形態1又は実施の形態2に係る動画像復号回路5と比べると、画像復元部61にトーンマッピング処理部62、63を設けている。トーンマッピング処理部62、63は動画像符号化回路より送信されたマッピングテーブルに基づき、予測画像をトーンマッピング変換する。変換された予測画像は、加算部57において、逆周波数変換・逆量子化された予測残差と加算され、復号画像となる。
実施の形態1又は実施の形態2に係る動画像復号回路5と比べると、画像復元部61にトーンマッピング処理部62、63を設けている。トーンマッピング処理部62、63は動画像符号化回路より送信されたマッピングテーブルに基づき、予測画像をトーンマッピング変換する。変換された予測画像は、加算部57において、逆周波数変換・逆量子化された予測残差と加算され、復号画像となる。
なお、トーンマッピング処理部62、63は、図13のように画面内予測画像生成部54及び画面間予測画像生成部55各々の後段に設けることもできるが、選択部56と加算部57との間に設けるようにしても良い。予測画像生成部20では、トーンマッピング処理された後の画像に基づいて予測画像を選択するため選択部14の前段にトーンマッピング処理部22、23が必要であったが、動画像復号回路6ではビットストリーム中に含まれる情報を用いて予測画像を選択するため、選択部56の前段でトーンマッピング処理を行わなくても良い。そのため、選択部56の後段にトーンマッピング処理部を設けることができ、トーンマッピング処理部の数を1つにすることができる。これにより、省電力や回路面積を削減することが可能になる。
このように、本実施の形態4に係る予測画像生成部20及び動画像復号回路6では、複数のコンポーネントを含むピクチャにおいて、類似度が高いコンポーネント間でも平均値が異なる場合や階調分布が異なる場合に、トーンマッピングによる変換によって、より類似度の高い予測画像を生成することができ、より効率的な符号化処理、復号処理を行うことができる。
以上、説明したように、本実施の形態4に係る動画像符号化回路1では、予測画像生成部20は、トーンマッピング処理部22、23を更に有し、トーンマッピング処理部22、23は、参照画像の画素値をトーンマッピングにより変換し、予測画像生成部20は、当該変換された参照画像を元に前記予測画像を生成することが好ましい。
また、本実施の形態4に係る動画像復号回路6では、画像復元部61は、トーンマッピング処理部62、63を更に有し、トーンマッピング処理部62、63は、予測画像にトーンマッピング処理を行い、画像復元を行うことが好ましい。
また、本実施の形態4に係る動画像復号回路6では、画像復元部61は、トーンマッピング処理部62、63を更に有し、トーンマッピング処理部62、63は、予測画像にトーンマッピング処理を行い、画像復元を行うことが好ましい。
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は既に述べた実施の形態に限定されるものではなく、その要旨を逸脱しない範囲において種々の変更が可能であることはいうまでもない。
1 動画像符号化回路
5、6 動画像復号回路
10、20 予測画像生成部
11、21 画面内予測画像生成部
12 類似画像探索部
13 画面間予測画像生成部
14 選択部
15 減算部
16 周波数変換・量子化部
17 逆周波数変換・逆量子化部
18 加算部
19 画像メモリ
22、23 トーンマッピング処理部
40 符号化部
51 符号復号部
52、61 画像復元部
53 逆周波数変換・逆量子化部
54 画面内予測画像生成部
55 画面間予測画像生成部
56 選択部
57 加算部
58 画像メモリ
62、63 トーンマッピング処理部
100 半導体装置
101、104 インターフェース回路
102 メモリコントローラ
103 CPU
110 カメラ
115 外部メモリ
5、6 動画像復号回路
10、20 予測画像生成部
11、21 画面内予測画像生成部
12 類似画像探索部
13 画面間予測画像生成部
14 選択部
15 減算部
16 周波数変換・量子化部
17 逆周波数変換・逆量子化部
18 加算部
19 画像メモリ
22、23 トーンマッピング処理部
40 符号化部
51 符号復号部
52、61 画像復元部
53 逆周波数変換・逆量子化部
54 画面内予測画像生成部
55 画面間予測画像生成部
56 選択部
57 加算部
58 画像メモリ
62、63 トーンマッピング処理部
100 半導体装置
101、104 インターフェース回路
102 メモリコントローラ
103 CPU
110 カメラ
115 外部メモリ
Claims (15)
- ピクチャに含まれる色成分の各々に対応し各々が異なる波長を持つ複数のコンポーネントを含む複数のピクチャを入力し、前記ピクチャの各コンポーネントの符号化に用いる参照画像を自ピクチャ又は参照メモリに含まれる符号化済みのピクチャのコンポーネントの中から探索し、前記探索された参照画像に含まれる画素の情報に基づいて予測画像を生成する予測画像生成部と、
前記予測画像生成部から出力された前記予測画像を元にビットストリームを生成する符号化部とを備え、
前記予測画像生成部は、前記参照画像が含まれるコンポーネントの情報を示す参照コンポーネントインデックスを出力し、
前記符号化部は、前記参照コンポーネントインデックスの情報を含むビットストリームを出力する、
動画像符号化装置。 - 前記符号化部は、前記ピクチャに含まれるコンポーネントの数を示す情報を更に前記ビットストリームに含める
請求項1記載の動画像符号化装置。 - 前記ピクチャに含まれるコンポーネントの数が4以上である
請求項2記載の動画像符号化装置。 - 前記複数のコンポーネントは、赤色よりも波長が長い波長領域のコンポーネント、又は、青色よりも波長が短い波長領域のコンポーネントの少なくとも1つを含む
請求項1記載の動画像符号化装置。 - 前記参照コンポーネントインデックスは、符号化対象画像を含むコンポーネントの番号と、前記ピクチャに含まれるコンポーネントの数を用いて表される
請求項2記載の動画像符号化装置。 - 前記予測画像生成部は、画面内予測と画面間予測とを切り替える選択部を更に備え、
前記選択部は前記コンポーネント毎に前記予測方法を決定し、
前記符号化部は、前記予測方法を示す予測方法選択情報を前記ビットストリームに含める
請求項1記載の動画像符号化装置。 - 前記予測画像生成部は、トーンマッピング処理部を更に有し、
前記トーンマッピング処理部は、参照画像の画素値をトーンマッピングにより変換し、
前記予測画像生成部は、前記変換された参照画像を元に前記予測画像を生成する
請求項1記載の動画像符号化装置。 - ピクチャに含まれる色成分の各々に対応し、各々が異なる波長を持つ複数のコンポーネントを含む複数のピクチャが符号化されたビットストリームを入力して復号する符号復号部と、
前記復号された情報に基づいて予測画像を生成し、前記予測画像を用いて画像を復元する画像復元部とを備え、
前記符号復号部は、前記ビットストリームから前記予測画像が含まれるコンポーネントの情報を示す参照コンポーネントインデックスを符号復号し、
前記画像復元部は、前記参照コンポーネントインデックスが示すコンポーネントに含まれる画素値を用いて前記予測画像を生成し、前記予測画像を用いて画像を復元する
動画像復号装置。 - 前記符号復号部は、前記ピクチャに含まれるコンポーネントの数を示す情報を更に復号する
請求項8記載の動画像復号装置。 - 前記復号された情報として、前記予測画像が生成された方法を示す予測方法選択情報と、前記予測画像と前記ピクチャの差分である予測残差とを含む
請求項8記載の動画像復号装置。 - 前記ピクチャに含まれるコンポーネントの数が4以上である
請求項9記載の動画像復号装置。 - 前記複数のコンポーネントは、赤色よりも波長が長い波長領域のコンポーネント、又は、青色よりも波長が短い波長領域のコンポーネントの少なくとも1つを含む
請求項8記載の動画像復号装置。 - 前記参照コンポーネントインデックスは、符号化対象画像を含むコンポーネントの番号と、前記ピクチャに含まれるコンポーネントの数を用いて表される
請求項9記載の動画像復号装置。 - 前記画像復元部は、画面内予測画像生成部と画面間予測画像生成部とを有し、前記予測方法選択情報に基づいて前記コンポーネント毎に予測画像を切り替えて画像復元を行う
請求項10記載の動画像復号装置。 - 前記画像復元部は、トーンマッピング処理部を更に有し、
前記トーンマッピング処理部は、前記予測画像にトーンマッピング処理を行い、画像復元を行う
請求項8記載の動画像復号装置。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017118487A JP2019004360A (ja) | 2017-06-16 | 2017-06-16 | 動画像符号化装置及び動画像復号装置 |
| US15/950,609 US20180367806A1 (en) | 2017-06-16 | 2018-04-11 | Video encoding apparatus and video decoding apparatus |
| CN201810622158.0A CN109151471A (zh) | 2017-06-16 | 2018-06-15 | 视频编码装置和视频解码装置 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017118487A JP2019004360A (ja) | 2017-06-16 | 2017-06-16 | 動画像符号化装置及び動画像復号装置 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2019004360A true JP2019004360A (ja) | 2019-01-10 |
Family
ID=64657827
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017118487A Pending JP2019004360A (ja) | 2017-06-16 | 2017-06-16 | 動画像符号化装置及び動画像復号装置 |
Country Status (3)
| Country | Link |
|---|---|
| US (1) | US20180367806A1 (ja) |
| JP (1) | JP2019004360A (ja) |
| CN (1) | CN109151471A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022211374A1 (ko) * | 2021-03-31 | 2022-10-06 | 현대자동차주식회사 | 매핑 기반 비디오 코딩방법 및 장치 |
| JP2023107583A (ja) * | 2022-01-24 | 2023-08-03 | キヤノン株式会社 | 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| MX2021010368A (es) | 2019-02-28 | 2021-10-01 | Samsung Electronics Co Ltd | Aparatos para codificar y decodificar imagenes, y metodos para codificar y decodificar imagenes mediante los mismos. |
-
2017
- 2017-06-16 JP JP2017118487A patent/JP2019004360A/ja active Pending
-
2018
- 2018-04-11 US US15/950,609 patent/US20180367806A1/en not_active Abandoned
- 2018-06-15 CN CN201810622158.0A patent/CN109151471A/zh active Pending
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2022211374A1 (ko) * | 2021-03-31 | 2022-10-06 | 현대자동차주식회사 | 매핑 기반 비디오 코딩방법 및 장치 |
| US12445598B2 (en) | 2021-03-31 | 2025-10-14 | Hyundai Motor Company | Method and apparatus for video coding based on mapping |
| JP2023107583A (ja) * | 2022-01-24 | 2023-08-03 | キヤノン株式会社 | 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム |
| JP7762081B2 (ja) | 2022-01-24 | 2025-10-29 | キヤノン株式会社 | 画像符号化装置及び画像復号装置及びそれらの制御方法及びプログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| CN109151471A (zh) | 2019-01-04 |
| US20180367806A1 (en) | 2018-12-20 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP7529348B2 (ja) | エンコーダ、デコーダ、および対応するイントラ予測方法 | |
| KR102794367B1 (ko) | 인코더, 디코더 및 대응하는 인트라 예측을 위한 방법 | |
| US8260069B2 (en) | Color image encoding and decoding method and apparatus using a correlation between chrominance components | |
| KR102621959B1 (ko) | 임의의 ctu 크기에 대한 ibc 검색 범위 최적화를 사용하는 인코더, 디코더 및 대응하는 방법 | |
| JP2023071987A (ja) | ビデオ符号化又は復号の方法及び装置並びにコンピュータプログラム | |
| JP7343668B2 (ja) | Vvcにおける色変換のための方法及び機器 | |
| JP2022521809A (ja) | ビデオコーディングにおける係数領域ブロック差分パルスコード変調 | |
| JP2023133391A (ja) | 適応ループ・フィルタを用いたエンコーダ、デコーダおよび対応する方法 | |
| JP7297918B2 (ja) | ビデオ符号化のための色変換 | |
| CN113615173A (zh) | 对仿射译码块进行光流预测修正的方法及装置 | |
| JP7251882B2 (ja) | Cbfフラグの効率的なシグナリング方法 | |
| JP7508621B2 (ja) | イントラ予測のためのクロスコンポーネント線形モデリングの方法、装置、デコーダ、エンコーダおよびプログラム | |
| CN108353186A (zh) | 用于空间帧内预测的具有帮助数据的视频编码 | |
| CN115699738B (zh) | 视频编解码方法设备、装置以及计算机可读存储介质 | |
| CN115209153A (zh) | 编码器、解码器及对应方法 | |
| JP2019004360A (ja) | 動画像符号化装置及び動画像復号装置 | |
| JP2023100701A (ja) | イントラ予測のためのイントラモードコーディングを使用するエンコーダ、デコーダ、および対応する方法 | |
| CN114830642A (zh) | 图像编码方法和图像解码方法 | |
| RU2800681C2 (ru) | Кодер, декодер и соответствующие способы для внутреннего предсказания | |
| RU2822448C2 (ru) | Кодер, декодер и соответствующие способы интра-предсказания | |
| JP7519767B2 (ja) | 画像符号化方法および画像復号方法 | |
| RU2821012C2 (ru) | Кодер, декодер и соответствующие способы для интра-предсказания | |
| JP2025517260A (ja) | マージされたクロマブロックに基づくルマからのクロマ予測 | |
| KR20250015701A (ko) | 개선된 인트라 예측 구조를 이용한 비디오 부호화 및 복호화를 위한 방법 및 장치 | |
| CN114521325A (zh) | 图像编码方法和图像解码方法 |