[go: up one dir, main page]

JP2014511069A - 低メモリアクセス動きベクトル導出 - Google Patents

低メモリアクセス動きベクトル導出 Download PDF

Info

Publication number
JP2014511069A
JP2014511069A JP2013558003A JP2013558003A JP2014511069A JP 2014511069 A JP2014511069 A JP 2014511069A JP 2013558003 A JP2013558003 A JP 2013558003A JP 2013558003 A JP2013558003 A JP 2013558003A JP 2014511069 A JP2014511069 A JP 2014511069A
Authority
JP
Japan
Prior art keywords
window
value
center
block
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013558003A
Other languages
English (en)
Other versions
JP5911517B2 (ja
Inventor
シュ、リドン
チウ、イ−ジェン
ザン、ウェンハオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Intel Corp
Original Assignee
Intel Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intel Corp filed Critical Intel Corp
Publication of JP2014511069A publication Critical patent/JP2014511069A/ja
Application granted granted Critical
Publication of JP5911517B2 publication Critical patent/JP5911517B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/513Processing of motion vectors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/44Decoders specially adapted therefor, e.g. video decoders which are asymmetric with respect to the encoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/57Motion estimation characterised by a search window with variable size or shape

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

メモリアクセスを少なくしつつ、候補ベースで、デコーダ側動きベクトル導出(DMVD)を実行するシステム、デバイスおよび方法を説明する。MV候補に対応付けられている画素の範囲を所定のウィンドウに限定することによって、検索対象となる動きベクトル(MV)候補の数が限定されるとしてよい。基準ウィンドウは、DMVD処理および動き補償(MC)処理のために、1回のみメモリにロードするとしてよい。基準ウィンドウのサイズは、PUサイズが変化するとそれに合わせて適応的に決定されるとしてよい。さらに、基準ウィンドウの位置を決定する方式として、さまざまな方式を説明している。
【選択図】 図1

Description

<関連出願>
本願は、米国仮特許出願第61/452,843号(出願日:2011年3月15日)に基づく優先権および恩恵を主張する。本願は、以下の米国特許出願および米国仮特許出願に関連する。
第12/566,823号(出願日:2009年9月25日)
第12/567,540号(出願日:2009年9月25日)
第12/582,061号(出願日:2009年10月20日)
第12/657,168号(出願日:2010年1月14日)
第61/390,461号(出願日:2010年10月6日)
ビデオピクチャは、最大符号化単位(Largest Coding Unit(LCU))で符号化されているとしてよい。LCUは、複数のピクセルから構成される128×128、64×64、32×32または16×16のブロックであってよい。さらに、LCUは、直接符号化されるとしてもよいし、または、次のレベルの符号化のために、より小さい単位である符号化単位(CU)に分割されるとしてもよい。あるレベルでのCUは、直接符号化されるとしてもよいし、または、所望に応じて、符号化のために次のレベルにさらに分割されるとしてもよい。また、サイズが2N×2NのCUは、さまざまなサイズの予測ユニット(PU)に分割されるとしてよく、例えば、一の2N×2NのPU、2つの2N×NのPU、2つのN×2NのPU、または、4つのN×NのPUに分割されるとしてよい。CUがインター符号化されている(inter−coded)場合、動きベクトル(MV)は、分割後の各PUに割り当てられるとしてよい。
ビデオコーディングシステムは通常、エンコーダを利用して動き推定(ME)を実行する。エンコーダは、現在符号化ブロックについてMVを推定するとしてよい。MVはこの後、ビットストリーム内に符号化されて、MVを用いて動き補償(MC)を実施するデコーダに送信されるとしてよい。一部のコーディングシステムでは、エンコーダから受信したMVを用いる代わりに、PUについてMEを実行するデコーダを用いるデコーダ側動きベクトル導出(DMVD)を利用するとしてよい。DMVD技術は、限定された一群のMV候補対について検索を行うことによってMEプロセスが制限され得る、候補ベースの技術であってよい。しかし、従来の候補ベースのDMVD技術は、任意に決められる多数のMV候補について検索を行うことを必要とする場合があり、最良候補を特定するためには基準ピクチャウィンドウをメモリに繰り返しロードする必要があった。
本明細書に記載している内容は、添付図面において、一例として挙げているものであり、本発明を限定するものではない。説明を簡潔かつ明確にするべく、図中に図示している構成要素は必ずしも実寸に即したものではない。例えば、一部の構成要素の寸法は、他の構成要素に比べて、分かりやすいように強調されている場合がある。さらに、適切と考えられる場合には、対応する構成要素または同様の構成要素について、複数の図面にわたって参照符号を繰り返し利用している。図面は以下の通りである。
ビデオエンコーダシステムの一例を示す図である。
ビデオデコーダシステムの一例を示す図である。
デコーダにおけるミラーMEの例を示す図である。
デコーダにおける投影MEの一例を示す図である。
デコーダにおける空間隣接ブロックMEの一例を示す図である。
デコーダにおける時間連結ブロックMEの一例を示す図である。
デコーダにおけるMEの一例を示す図である。
基準ウィンドウ仕様の一例を示す図である。
プロセスの一例を示す図である。
システムの一例を示す図である。
本開示の少なくとも一部の実施例に応じて全ての構成要素が配置されたシステムの一例を示す図である。
添付した図面を参照しつつ1以上の実施形態を以下で説明する。具体的な構成および配置を説明しているが、これは例示に過ぎないと理解されたい。当業者であれば、以下の説明の範囲および意図から逸脱することなく、他の構成および配置を利用し得るものと認めるであろう。当業者には、本明細書で説明している技術および/または配置は、本明細書で説明した内容以外にも、さまざまな他のシステムおよび用途で利用可能であり、明らかであろう。
以下の説明では、例えば、システムオンチップ(SoC)アーキテクチャ等のアーキテクチャで実施され得るさまざまな実施形態について説明するが、本明細書で説明する技術および/または配置の実施形態は、特定のアーキテクチャおよび/またはコンピューティングシステムに限定されるものではなく、同様の目的を実現するべく、任意の実行環境で実施され得る。例えば、さまざまなアーキテクチャ、例えば、複数の集積回路(IC)チップおよび/またはパッケージを利用するアーキテクチャ、および/または、セットトップボックス、スマートフォン等のさまざまなコンピューティングデバイスおよび/または消費者向け電子機器(CE)デバイスで、本明細書で説明する技術および/または配置を実施するとしてよい。さらに、以下の説明は、ロジック実装、システムコンポーネントの種類および相関関係、ロジック分割/統合の選択肢等、数多く具体的且つ詳細な内容を記載するが、請求の対象となる主題はこれらの具体的且つ詳細な内容を採用することなく実施するとしてもよい。また、例えば、制御構造および完全ソフトウェア命令シーケンス等の一部の内容は、本明細書に開示する内容をあいまいにすることを避けるべく、詳細な説明を省略するとしてよい。
本明細書に開示している内容は、ハードウェア、ファームウェア、ソフトウェアまたはこれらの任意の組み合わせで実装するとしてよい。また、本明細書に開示している内容は、機械可読媒体に格納されている命令として実装されるとしてよい。当該命令は、1以上のプロセッサによって読み出されて実行されるとしてよい。機械可読媒体は、機械(例えば、コンピューティングデバイス)が読み出し可能な形式で情報を格納または送信する媒体および/またはメカニズムを含むとしてよい。例えば、機械可読媒体は、リードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、磁気ディスク格納媒体、光学格納媒体、フラッシュメモリデバイス、電気、光学、音響またはその他の形式の伝搬信号(例えば、搬送波、赤外信号、デジタル信号等)等を含むとしてよい。
本明細書において、「一実施形態」、「実施形態」、「実施形態例」等の表現を用いた場合、当該実施形態は特定の特徴、構造または特性を含むが、全ての実施形態が必ずしもその特定の特徴、構造または特性を含むとは限らないことを意味する。さらに、当該表現は全てが必ずしも同じ実施形態を意味しているものではない。さらに、特定の特徴、構造または特性がある実施形態に関連付けて説明されている場合、明示的に説明しているか否かに関わらず、当該特徴、構造または特性を他の実施形態に関連付けて実施し得ることは当業者の想到し得るものであると考えられる。
本明細書で説明している内容は、ビデオの圧縮および/または解凍を実行するビデオエンコーダ/デコーダシステムの分野で実施し得る。図1は、自己動きベクトル(MV)導出モジュール140を含むビデオエンコーダ100の一例を示す図である。エンコーダ100は、1以上の高度ビデオコーデック規格、例えば、ITU−T H.264規格(2003年3月に公開)を実装しているとしてよい。現在ビデオ情報は、現在ビデオブロック110から、複数のビデオデータフレームとして、供給されるとしてよい。現在ビデオは、差分部111に供給されるとしてよい。差分部111は、差分パルス符号変調(DPCM)(コアビデオエンコーディングとも呼ばれる)ループの一部であってよい。当該ループは、動き補償(MC)段122および動き推定(ME)段118を含むとしてよい。このループはさらに、内部予測段120および内部補間段124を含むとしてよい。場合によっては、ループ内ブロック解除フィルタ126をさらにDPCMループで利用するとしてよい。
現在ビデオは、差分部111およびME段118に供給されるとしてよい。MC段122または内部補間段124は、スイッチ123を介して出力を製造するとしてよい。当該出力は、現在ビデオ110から減算されて、剰余分を得るとしてよい。剰余分は、変換/量子化段112で変換および量子化されて、ブロック114でエントロピー符号化を実行するとしてよい。ブロック116において、チャネル出力が結果として得られるとしてよい。
動き補償段122または内部補間段124の出力は、加算器133に供給されるとしてよい。加算器133はさらに、逆量子化部130および逆変換部132からの入力も受信するとしてよい。逆量子化部130および逆変換部132は、量子化および変換が解除された情報をループに戻すとしてよい。
自己MV導出モジュール140は、より詳細に後述するが、本明細書で説明しているMVの導出のためのさまざまなDMVD処理方式を、少なくとも部分的に、実装するとしてよい。自己MV導出モジュール140は、ループ内ブロック解除フィルタ126の出力を受信するとしてよく、動き補償段122に出力を供給するとしてよい。
図2は、自己MV導出モジュール210を含むビデオデコーダ200を示す図である。デコーダ200は、例えば、H.264規格等の1以上の高度ビデオコーデック規格を実装するとしてよい。デコーダ200は、エントロピー復号化部240に結合されているチャネル入力238を含むとしてよい。チャネル入力238は、図1のエンコーダ100等のエンコーダのチャネル出力からの入力を受信するとしてよい。復号化部240からの出力は、逆量子化部242、逆変換部244、および、自己MV導出モジュール210に供給するとしてよい。自己MV導出モジュール210は、動き補償(MC)部248に結合されているとしてよい。エントロピー復号化部240の出力は、内部補間部254にも供給されるとしてよい。内部補間部254は、セレクタスイッチ223に出力を供給するとしてよい。逆変換部244と、スイッチ223が選択するMC部248および内部補間部254のうち一方とから得られる情報は、加算されて、ループ内ブロック解除部246に供給されて、内部補間部254に戻されるとしてよい。ループ内ブロック解除部246の出力は、自己MV導出モジュール210に供給されるとしてよい。
さまざまな実施形態によると、図1のエンコーダ100の自己MV導出モジュール140は、より詳細に後述するが、デコーダ200の自己MV導出モジュール210と同期しているとしてよい。さまざまな実施形態によると、自己MV導出モジュール140および/または210は、汎用ビデオコーデックアーキテクチャで実施されるとしてよく、H.264コーディングアーキテクチャ等、任意の特定のコーディングアーキテクチャに限定されるものではない。
上述したエンコーダおよびデコーダ、ならびに、本明細書で説明しているエンコーダおよびデコーダが実行する処理は、ハードウェア、ファームウェア、または、ソフトウェア、または、任意の組み合わせで実施するとしてよい。また、本明細書で開示している任意の1以上の特徴は、ハードウェア、ソフトウェア、ファームウェア、または、これらの組み合わせで実装されるとしてよく、例えば、ディスクリートな回路ロジックおよび集積回路ロジック、特定用途向け集積回路(ASIC)ロジック、および、マイクロコントローラで実装されるとしてよく、ドメイン固有集積回路パッケージの一部、または、複数の集積回路パッケージで実装されるとしてよい。本明細書で用いる場合、「ソフトウェア」という用語は、本明細書で開示している1以上の特徴および/または特徴の組み合わせをコンピュータシステムに実行させるためのコンピュータプログラムロジックが格納されているコンピュータ可読媒体を含むコンピュータプログラム製品を意味する。
<動きベクトル導出>
動きベクトル導出は、少なくとも部分的に、基準ピクチャにおいて、現在符号化ブロックの動きは空間的に隣接するブロックの動きおよび時間的に隣接するブロックの動きと強い相関関係があるという仮定に基づいて行われるとしてよい。例えば、MV候補は、時間的および空間的に隣接するPUのMVから選択されるとしてよい。尚、一のMV候補は、対応する基準ウィンドウを指し示す一対のMVを含む。2つの基準ウィンドウの画素値の絶対差分値(SAD)の合計値の最小値を持つ候補が、最良の候補として選択されるとしてよい。この最良の候補をそのまま利用してPUを符号化するとしてもよいし、または、この最良の候補を改良して、より正確なMVをPU符号化のために取得するとしてもよい。
さまざまな方式を利用して動きベクトル導出を実行するとしてよい。例えば、図3に示すミラーME方式および図4に示す投影ME方式は、時間的動き相関を利用して、2つの基準フレームに対して実行されるとしてよい。図3の実施形態によると、前方基準フレーム320と後方基準フレーム330との間に、2つの両方向予測フレーム(Bフレーム)310および315が設けられているとしてよい。フレーム310は、現在符号化フレームであるとしてよい。現在ブロック340を符号化する際、ミラーME方式は、基準フレーム320の検索ウィンドウ360および基準フレーム330の検索ウィンドウ370において検索を実行することによって、MVを取得するとしてよい。現在入力ブロックがデコーダで利用できない実施形態によると、ミラーME方式は2つの基準フレームで実行するとしてよい。
図4は、2つの前方基準フレームである前方(FW)Ref0(基準フレーム420として図示している)およびFW Ref1(基準フレーム430として図示している)を利用する投影ME方式400の一例を示す図である。基準フレーム420および430は、現在フレームP(フレーム410として図示)における現在ターゲットブロック440のMVを導出するために用いられるとしてよい。検索ウィンドウ470は、基準フレーム420内に特定されているとしてよく、検索経路は検索ウィンドウ470内に特定されているとしてよい。投影MV(MV1)は、検索経路における各動きベクトルMV0について、基準フレーム430の検索ウィンドウ460内に決定されるとしてよい。MV0およびMV1で構成される一対のMV毎に、(1)基準フレーム420内でMV0が指示している基準ブロック480と、(2)基準フレーム430においてMV1が指示している基準ブロック450との間で、SAD等のメトリックを算出するとしてよい。そして、メトリックの最適値、例えば、最小SADを得る動きベクトルMV0を、ターゲットブロック440のMVとして選択するとしてよい。
現在ブロックの出力MVの精度を改善するべく、さまざまな実施形態では、デコーダ側MEのメトリック測定において、再構築された画素のうち空間的に隣接する画素を考慮するとしてよい。図5において、デコーダ側MEは、空間動き相関を利用して、空間的に隣接するブロックに対して実行されるとしてよい。図5は、現在ピクチャ(またはフレーム)510において1以上の隣接するブロック540(ターゲットブロック530の上方および左にあるブロックとして図示されている)を利用する実施形態500の一例を図示する。これによって、先行基準フレーム520および後続基準フレーム560における1以上の対応するブロック550および555に基づいてMVを生成できるようになるとしてよい。尚、「先行」および「後続」という単語は、フレームの時間的な順序を意味している。MVはこの後、ターゲットブロック530に適用されるとしてよい。一部の実施形態によると、ラスタスキャン方式での符号化順序に基づいて、ターゲットブロックの空間的に上方に隣接するブロック、左側に隣接するブロック、上方および左側に隣接するブロック、および、上方および右側に隣接するブロックを決定するとしてよい。この方法は、例えば、復号化の際に先行フレームおよび後続フレームの両方を利用するBフレームで利用されるとしてよい。
図5に図示した方法は、順次走査の符号化順序でターゲットブロックより前に隣接するブロックが復号化された場合に限り、現在フレームにおける空間的に隣接するブロックの利用可能な画素に適用されるとしてよい。さらに、この方法では、現在フレームの基準フレームリストにおける基準フレームに対して動き検索を適用するとしてよい。
図5の実施形態の処理は、以下のようにして行われるとしてよい。第一に、複数の画素から構成される1以上のブロックを現在フレームで特定するとしてよい。特定されたブロックは、現在フレームのターゲットブロックに隣接しているブロックである。続いて、特定されたブロックについて動き検索を実行するとしてよい。これは、時間的に後続の基準フレームにおける対応ブロックおよび時間的に先行する基準フレームにおける対応ブロックに基づいて行われるとしてよい。動き検索を実行すると、特定されたブロックに対応付けられたMVが生成されるとしてよい。これに代えて、隣接するブロックに対応付けられているMVが、これらのブロックを特定する前に、決定されるとしてよい。この後、隣接するブロックに対応付けられているMVを用いてターゲットブロック用のMVを導出するとしてよい。そして、このMVを利用してターゲットブロックについて動き補償を実行するとしてよい。MV導出は、当業者に公知の適切なプロセスであればどのようなプロセスを用いて実行するとしてもよい。このようなプロセスは、例えば、これらに限定されないが、重み付け平均化またはメディアンフィルタリングであってよい。結果として、図5に図示した方式等は、候補ベースのデコーダ側MV導出(DMVD)プロセスの少なくとも一部として実施されるとしてよい。
時間順序で決定される先行および後続の再構築されたフレームの対応ブロックを用いてMVを導出するとしてよい。この方法は、図6に図示している。現在フレーム610内のターゲットブロック630を符号化するべく、既に復号化された画素を利用するとしてよい。これらの画素は、同図ではピクチャ615として図示されている先行ピクチャの対応ブロック640、および、ピクチャ655として図示されている後続フレームの対応ブロック665に含まれているとしてよい。基準フレームであるピクチャ620の1以上のブロック650に動き検索を実行することによって、第1のMVを対応ブロック640について導出するとしてよい。ブロック650は、先行ピクチャ615のブロック640に対応する、基準フレーム620内のブロックに隣接しているとしてよい。基準ピクチャ、つまり、フレーム660の1以上のブロック670に動き検索を実行することによって、後続フレーム655内の対応するブロック665について第2のMVを導出するとしてよい。ブロック670は、後続フレーム655のブロック665に対応する、基準ピクチャ660内のブロックに隣接しているとしてよい。第1および第2のMVに基づき、ターゲットブロック630の前方MVおよび/または後方MVを決定するとしてよい。この後、前方MVおよび/または後方MVを用いて、ターゲットブロックの動き補償を実行するとしてよい。
図6に図示したような方式の場合、ME処理は、以下のように実行されるとしてよい。最初に、先行フレームでブロックを特定するとしてよい。この特定されたブロックは、現在フレームのターゲットブロックに対応するとしてよい。先行フレームで特定されたブロックについて第1のMVを決定するとしてよい。第1のMVは、第1の基準フレームの対応ブロックと相対的に定義されるとしてよい。後続フレームでブロックを特定するとしてよい。このブロックは、現在フレームのターゲットブロックに対応するブロックであるとしてよい。後続フレームで特定されたブロックについて第2のMVを決定するとしてよい。第2のMVは、第2の基準フレームの対応ブロックと相対的に定義されるとしてよい。上述した第1および第2のMVを用いて、ターゲットブロックについて1つまたは2つのMVを決定するとしてよい。同様の処理をデコーダ側でも実行するとしてよい。
図7は、両方向ME方式700の一例を示す図である。方式700は、前方基準フレーム(FW Ref)702の一部分および後方基準フレーム(BW Ref)704の一部分を利用して、現在フレーム706の一部分についてDMVD処理を実行するとしてよい。方式700の一例では、現在フレーム706のターゲットブロックまたはPU708は、基準フレーム702および704に対して導出された1以上のMVを利用して推定されるとしてよい。本開示に応じたDMVDを提供するべく、基準フレーム702および704内にある、特定のサイズの、基準ウィンドウ710および712に対応付けられているPUを指し示すMVに限定されている一群のMVからMV候補を選択するとしてよい。例えば、ウィンドウ710および712の中心は、基準フレーム702および704のPU718および720を指し示すMV714(MV0)および716(MV1)によって特定されるとしてよい。
本開示によると、現在フレームの一部分についてのME処理では、当該部分に対してDMVD処理およびMC処理の両方を実行するべく基準画素ウィンドウをメモリにロードするのは、1回のみであるとしてよい。例えば、現在フレーム706のPU708についてのME処理は、FW基準フレーム702のウィンドウ710に含まれる全ての画素、および、BW基準フレーム704内のウィンドウ712に含まれる全ての画素について画素データ(例えば、画素強度値)をメモリにロードすることを含むとしてよい。続くPU708のME処理では、DMVD技術を用いて最良のMV候補対を特定するべく、そして、その最良のMV候補対を利用してPU708についてMCを実行するべく、格納された画素値にのみアクセスすることを含むとしてよい。
方式700は、正方形(例えば、M×M)のアスペクト比を持つPUのためのME方式を説明しているように見えるが、本開示は、ブロック、CU、PU等を符号化する際に特定のサイズまたはアスペクト比を利用する符号化方式に限定されない。このため、本開示に応じた方式は、PUの配置パターン、サイズおよび/またはアスペクト比が任意に決められる画像フレームを利用するとしてよい。このため、概して、本開示に応じたPUのサイズまたはアスペクト比M×Nは任意に設定されるとしてよい。また、方式700では双方向ME処理として説明しているが、本開示はこれに限定されない。
<動きベクトルの制限>
本開示によると、メモリの利用が、MVを導出するためにDMVDを実行するべく利用される画素値、そして、MCフィルタリング処理を実行するべく利用される画素値を制限することによって、低減されるとしてよい。さまざまな実施形態によると、上述したように、この効果は、DMVDおよび/またはMC処理を2つの基準ウィンドウに対応する画素値にのみ限定することによって、そして、これらの画素値をメモリにロードするのを1回のみにすることによって、得られるとしてよい。このため、例えば、最良のMV候補を特定するべく候補MVのメトリックを計算する処理(例えば、候補MVについてSADを計算する処理)、および、MC処理を実行するべくこの候補MVを利用する処理は、新しい画素値をメモリにロードする処理を繰り返し行うことなく、格納された画素値を読み出すことによって実行されるとしてよい。
図8は、本開示に係る基準ウィンドウ方式800の一例を示す図である。例えば、方式700のウィンドウ710および712のいずれか一方は、方式800に応じたサイズを持つウィンドウを利用するとしてよい。方式800では、現在フレーム(不図示)に含まれるサイズがM×NのPUに対応付けられている一対のMVの一例の動きベクトルMV802は、基準フレーム806内のサイズがM×NのPU804を指し示している。PU804の中心位置808はさらに、特定のサイズの対応する基準ウィンドウ810の中心となる。
本開示に応じると、サイズがM×N(例えば、高さがNで幅がM)のPUに対応付けられている基準ウィンドウのサイズまたは範囲は、一の寸法(例えば、幅M)についてサイズが(M+2L+W)を持ち、直交する寸法(例えば、高さN)についてサイズが(N+2L+W)となるように特定されているとしてよい。尚、M、LおよびWは正の整数である。Wは調整可能な小数MEパラメータに対応し、Lは調整可能なウィンドウサイズパラメータに対応する。より詳細に後述する。例えば、図8の例では、基準ウィンドウ810は、基準フレーム806の範囲は、合計で(M+2L+W)×(N+2L+W)個の画素に及ぶ。例えば、M=8、N=4、L=4およびW=2の例の場合、基準ウィンドウ810は、基準フレーム806において、高さが14個の画素であり、幅が18個の画素であり、合計で252個の画素にわたっているとしてよい。さまざまな実施形態によると、調整可能な小数MEパラメータWの値は、小数MEを実行するための公知の技術に応じて決定されるとしてよい。
M=8、N=4、L=4およびW=2の実施形態例の説明に戻ると、現在フレーム(不図示)のPUについて本開示に応じてME処理を実行することは、基準ウィンドウ810に含まれる252個の画素に対応する値を1回のみメモリにロードすることを含むとしてよい。また、現在フレームのPUについて本開示に応じたME処理を実行することはさらに、第2の基準フレーム(図8には不図示)に位置しているサイズが(M+2L+W)×(N+2L+W)である第2の基準ウィンドウに含まれている画素の252個の値を1回のみメモリにロードすることを含むとしてよい。この例で説明を続けると、現在フレームのPUについてのDMVD処理およびMC処理は、合計で504個の格納した画素値にのみアクセスすることによって、実行されるとしてよい。
図8では、基準ウィンドウ810のサイズが、(部分的に)調整可能なウィンドウサイズパラメータLという単一の値によって定められる方式800を説明しているが、さまざまな実施形態によると、Lの値は、2つの基準ウィンドウの寸法についてそれぞれ異なるとしてもよい。例えば、本開示によると、M×NのPUに対してDMVD処理およびMC処理を実行するプロセスは、サイズが(M+W+2L0)×(N+W+2Ll)である整数の画素ウィンドウをロードすることを含むとしてよい。尚、L0≠L1である。例えば、寸法がM=4およびN=8であるPUについて、対応する基準ウィンドウのサイズが(W=2と仮定して)14×26個の画素となる(例えば、364個の画素を含む)ようにL0=4およびL1=8と値を異ならせるとしてよい。
本開示に応じて基準ウィンドウのサイズを特定することによって、ME処理で利用されるMV候補の数は、規定された基準ウィンドウの境界内の位置を示すMVに限定されるとしてよい。例えば、2つの基準フレームにおけるウィンドウ中心(center_0.x,center_0.y)および(center_1.x,center_1.y)について、一対のMV(Mv_0.x,Mv_0.y)および(Mv_1.x,Mv_1.y)は、それぞれのMVが以下の条件を満たせば利用可能なMV候補と指定されるとしてよい。
Figure 2014511069
およびb(i=0,1)は設定可能なMV制限パラメータである。例えば、MV改善を実行しない実施形態の場合、制限パラメータaおよびbは、a≦Lおよびb≦L+0.75の条件を満たすように選択されるとしてよい。一方、MV改善を実行する実施形態の場合、制限パラメータaおよびbは、a≦L−0.75およびb≦Lの条件を満たすように選択されるとしてよい。いずれの場合であっても、符号化性能は、上述の条件を満たすようにaおよびbの最大値が選択される場合に、改善するとしてよい。さまざまな実施形態では、Lは正の整数であってよく、例えば、正の偶数の整数(例えば、2、4、8、12等)であるとしてよい。
本開示によると、基準ウィンドウサイズは、特定の値に限定されるとしてもよいし、および/または、ME処理の間に動的に決定されるとしてもよい。このため、さまざまな実施形態では、パラメータLの値、したがって基準ウィンドウサイズ(固定値Wと仮定する)は、符号化されているPUのサイズに関わらず、一定であるとしてよい。例えば、PUサイズに関係なく、符号化される全てのPUにL=8を適用するとしてよい。しかし、さまざまな実施形態では、基準ウィンドウサイズは、ウィンドウサイズパラメータLの値を変化させることによって、動的に調整するとしてもよい。このため、例えば、さまざまな実施形態によると、ME処理を実行しているPUのサイズが変化することに応じてL値を調整すると、それぞれ固定のサイズを持つ複数の異なる所定の基準ウィンドウをメモリにロードするとしてよい。例えば、各PUをME処理している間、各PUの高さおよび/または幅の半分に等しくなるようにパラメータLを動的に調整するとしてよい。さらに、一部の実施形態によると、パラメータLは特定の範囲内でのみ調整可能としてよい。このような実施形態によると、例えば、パラメータLは、予め定めた最大値までの範囲内で調整可能であるとしてよい。例えば、Lは、M、N≦8の場合にはL=4、M,N>8の場合にはL=8になるように設定されるとしてよい。
また、本開示によると、ME処理について基準ウィンドウの位置を選択するべく複数の異なる方式を利用するとしてよい。このため、さまざまな実施形態では、基準ウィンドウの位置を決定するために利用されるべき最良MV候補を決定するべく、さまざまな方式を利用するとしてよい。さまざまな実施形態によると、基準画素ウィンドウの位置は、ゼロMV候補、連結MV候補、空間的に隣接するMVの候補、複数の候補の平均MV等の固定MV候補または所定MV候補から選択するとしてよい。
また、さまざまな実施形態によると、特定のMV候補についてラウンディングされたMVを利用して、基準ウィンドウの位置を決定するとしてよい。言い換えると、MVが指し示しているのが整数画素位置でない場合、これらに限定されるものではないが、MVは最も近い整数画素位置にラウンディングされるとしてもよいし、または、左上に隣接する画素位置にラウンディングされるとしてよい。
さらに、一部の実施形態によると、基準画素ウィンドウ位置は、利用可能な候補のうち一部または全てに基づいて位置を導出することによって、適宜決定するとしてもよい。例えば、基準ウィンドウ位置は、それぞれ中心が異なる複数の候補ウィンドウを特定して、上述の数1を満たす候補MVの数が最大になる特定のウィンドウ位置を選択することによって、決定されるとしてよい。また、それぞれ中心が異なる複数のウィンドウの候補の組を複数特定して、上述の数1を満たすMV候補の数が最大になる特定のウィンドウ位置を決定するべくランク付けするとしてよい。
<DMVD処理>
上述したように、本開示に応じて基準ウィンドウのサイズを特定の値に限定することで、ME処理で用いられる候補MVを、定義された基準ウィンドウの範囲内の位置を指し示すMVに限定することになるとしてよい。基準ウィンドウの位置およびサイズが所与のPUについて本明細書で説明するように特定されると、PUは、例えば、当該PUについて上述の数1を満たすMV候補全てについてSAD等のメトリックを算出することによって、DMVD処理されるとしてよい。このようにすることで、メトリックを最も良く満たす(つまり、SAD値が最も小さくなる)MV候補を形成するMVを用いて、さまざまな公知のMC技術に基づきPUのMC処理を実行するとしてよい。
さらに、本開示によると、ロードされた基準画素ウィンドウにおいてMV改良を実行するとしてよい。さまざまな実施形態によると、MV候補は、最も近い全体画素にラウンディングすることによって、強制的に整数画素位置とするとしてよい。続いて、ラウンディングされたMV候補を確認して、メトリック値(例えば、SAD値)が最小値になる候補を最終的に導出されたMVとして用いるとしてよい。一部の実施形態によると、最良のラウンディング済みMV候補に対応する元々のラウンディング前のMVを、最終的に導出されたMVとして利用するとしてよい。
さらに、さまざまな実施形態によると、最良のラウンディング済みMV候補を特定した後、この最良のラウンディング済みMV候補の周囲で小範囲の整数画素改良MEを実行するとしてよい。この検索で得られた最良の改良後の整数MVを、最終的に導出されたMVとして利用するとしてよい。また、さまざまな実施形態によると、小範囲整数画素改良MEを実行して、最良の改良後の整数MVを得た後、中間位置を利用するとしてよい。例えば、最良の改良後の整数MVと最良のラウンディング済み候補MVとの間の中間位置を特定し、この中間位置に対応するベクトルを最終的に導出されたMVとして利用するとしてよい。
さまざまな実施形態によると、エンコーダおよび対応するデコーダは同じMV候補を用いるとしてよい。例えば、図1に示すように、エンコーダ100の自己MV導出モジュール140は、デコーダ200(図2)の自己MV導出モジュール210が用いているのと同じMV候補を利用するとしてよい。エンコーダ100等のエンコーダと、デコーダ200等のデコーダを含むビデオコーディングシステムは、本開示に応じた同期DMVDを実行するとしてよい。さまざまな実施形態によると、エンコーダは、デコーダに制御データを供給するとしてよい。当該制御データは、デコーダに対して、所与のPUについて当該デコーダがDMVD処理を実行すべきである旨を通知するデータである。言い換えると、エンコーダは、当該PUについてデコーダにMVを送信する代わりに、当該PUについてMVを導出すべき旨をデコーダに通知する制御データを送信するとしてよい。例えば、所与のPUについて、エンコーダ100は、当該PUについてDMVD処理を実行すべき旨をデコーダ200に通知するべく、ビデオデータビットストリームにおける1以上の制御ビットとしてデコーダ200に制御データを供給するとしてよい。
図9は、本開示のさまざまな実施形態に係る低メモリアクセス動きベクトル導出プロセス900の一例を説明するためのフローチャートである。プロセス900は、1以上のブロック902、904、906および/または908として図示しているように、1以上の処理、関数または動作を含むとしてよい。さまざまな実施形態によると、プロセス900は、例えば、図2のデコーダ200等のデコーダにおいて実行されるとしてよい。
プロセス900は、本明細書で説明しているように、現在ビデオフレームのPU等のブロックについて基準ウィンドウを特定するブロック902で開始されるとしてよい。ブロック904において、基準ウィンドウの画素値をメモリにロードするとしてよい。本明細書で説明したMV導出処理およびMC処理はそれぞれ、ブロック904でメモリにロードされた画素値を利用して、ブロック906およびブロック908で実行されるとしてよい。図9ではブロック902、904、906および908の順序について特定の順序を図示しているが、本開示は、これに限定されるものではなく、本開示のさまざまな実施形態に係る低メモリアクセス動きベクトル導出処理は、他の順序で行われるとしてもよい。
図10は、本開示に応じたDMVDシステム1000の一例を示す図である。システム1000は、本明細書で説明したさまざまな機能のうち一部またはすべてを実行するために用いられるとしてよく、本開示に係る低メモリアクセス動きベクトル導出処理を実行可能な任意の1以上のデバイスを含むとしてよい。例えば、システム1000は、デスクトップコンピュータ、モバイルコンピュータまたはタブレットコンピュータ、スマートフォン、セットトップボックス等のコンピューティングプラットフォームまたはコンピューティングデバイスの構成要素から選択されたものを含むとしてよいが、本開示はこれに限定されない。
システム1000は、プロセッサ1004およびメモリ1006に動作可能に結合されているビデオデコーダモジュール1002を含むとしてよい。デコーダモジュール1002は、DMVDモジュール1008およびMCモジュール1010を含むとしてよい。DMVDモジュール1008は、基準ウィンドウモジュール1012およびMV導出モジュール1014を含むとしてよく、プロセッサ1004および/またはメモリ1006と共に、本明細書で説明したプロセスのいずれか、および/または、任意の均等物のプロセスを実行するとしてよい。さまざまな実施形態によると、図2のデコーダ200の一例に関連付けて説明すると、DMVDモジュール1008は自己MV導出モジュール210によって、MCモジュール1012はMC部248によって実現されるとしてよい。デコーダモジュール1002は、逆量子化モジュール、逆変換モジュール等の構成要素を追加で備えるとしてもよい。これらの追加構成要素は、分かりやすさを優先して、図10では省略している。プロセッサ1004は、SoCまたはマイクロプロセッサまたは中央演算処理装置(CPU)であってよい。他の実施形態によると、プロセッサ1004は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタルシグナルプロセッサ(DSP)、または、その他の集積素子であるとしてよい。
プロセッサ1004およびモジュール1002は、例えば、有線接続または無線接続等の任意の適切な手段を用いて、両者間で通信を行うとしてよく、そして、メモリ1006との間で通信を行うとしてよい。さらに、システム1000は、図2のデコーダ200を実現するとしてよい。さらに、システム1000は、送受信ロジック、ネットワークインターフェースロジック等の構成要素および/またはデバイスを追加で備えるとしてよい。これらの追加の構成要素および/またはデバイスは、分かりやすさを優先して、図10では図示が省略されている。
図10ではデコーダモジュール1002とプロセッサ1004とを分割して図示しているが、当業者であれば、デコーダモジュール1002は、ハードウェア、ソフトウェアおよび/またはファームウェアを任意に組み合わせて実現すること、そして、デコーダモジュール1002は、少なくとも部分的に、メモリ1006に格納されているソフトウェアロジックによって、および/または、プロセッサ1004が実行する命令として、実現されることを認めるであろう。例えば、デコーダモジュール1002は、機械可読媒体で格納されている命令としてシステム1000に供給されるとしてよい。一部の実施形態によると、デコーダモジュール1002は、プロセッサの内部メモリ(不図示)に格納されている命令を含むとしてよい。
メモリ1006は、本明細書で説明したように、基準ウィンドウ画素値を格納しているとしてよい。例えば、メモリ1006に格納されている画素値は、本明細書で説明しているように、基準ウィンドウモジュール1012が基準ウィンドウのサイズおよび位置を特定することに応じて、メモリ1006にロードされるとしてよい。この後、MV導出モジュール1014およびMCモジュール1010は、MV導出処理およびMC処理を実行する際に、メモリ1006に格納されている画素値にアクセスするとしてよい。このようにして、さまざまな実施形態では、システム1000の特定の構成要素が、本明細書で説明した図9のプロセス900の一例を構成するブロックのうち1以上を実行するとしてよい。例えば、基準ウィンドウモジュール1012は、プロセス900のうちブロック902および904を実行し、MV導出モジュール1014はブロック906を実行し、MCモジュール1010はブロック908を実行するとしてよい。
図11は、本開示に応じたシステム1100の一例を示す図である。システム1100は、本明細書で説明したさまざまな機能のうち一部またはすべてを実行するために用いられるとしてよく、本開示のさまざまな実施形態に係る低メモリアクセス動きベクトル導出処理を実行可能な任意の1以上のデバイスを含むとしてよい。例えば、システム1100は、デスクトップコンピュータ、モバイルコンピュータまたはタブレットコンピュータ、スマートフォン等のコンピューティングプラットフォームまたはコンピューティングデバイスの構成要素から選択されたものを含むとしてよいが、本開示はこれに限定されない。一部の実施形態では、システム1100は、Intel(登録商標)アーキテクチャ(IA)に基づくコンピューティングプラットフォームまたはSoCであってよい。当業者であれば、本明細書で説明している実施形態は、本開示の範囲から逸脱することなく、別の処理システムと共に利用し得るものと容易に想到するであろう。
システム1100は、1以上のプロセッサコア1104を有するプロセッサ1102を備える。プロセッサコア1104は、少なくとも部分的に、ソフトウェア実行および/またはデータ信号処理が可能な任意の種類のプロセッサロジックであるとしてよい。さまざまな例によると、プロセッサコア1104は、複合命令セットコンピュータ(CISC)マイクロプロセッサ、縮小命令セットコンピュータ(RISC)マイクロプロセッサ、超長命令語(VLIW)マイクロプロセッサ、命令セットの組み合わせを実装するプロセッサ、または、任意のその他のプロセッサデバイス、例えば、デジタルシグナルプロセッサまたはマイクロコントローラを含むとしてよい。分かりやすさを優先して図11には図示していないが、プロセッサ1102は、1以上のコプロセッサ(オンチップ型等)に結合されているとしてよい。このように、さまざまな実施形態によると、他のプロセッサコア(不図示)が、本開示に応じたプロセッサ1102と共に、低メモリアクセス動きベクトル導出処理を実行するとしてもよい。
プロセッサ1102はさらに、例えば、表示プロセッサ1108および/またはグラフィクスプロセッサ1110が受信する命令を制御信号および/またはマイクロコードエントリポイントにデコードするべく利用され得るデコーダ1106を有する。システム1100ではコア1104とは別の構成要素として図示されているが、当業者であれば、コア1104のうち1以上がデコーダ1106、表示プロセッサ1108および/またはグラフィクスプロセッサ1110を実現するとしてよい。一部の実施形態によると、コア1104は、図9を参照しつつ説明したプロセスの一例を含む、本明細書で説明したプロセスのいずれを実行するように構成されているとしてもよい。さらに、制御信号および/またはマイクロコードエントリポイントに応じて、コア1104、デコーダ1106、表示プロセッサ1108および/またはグラフィクスプロセッサ1110は、対応する処理を実行するとしてよい。
プロセッサコア1104、デコーダ1106、表示プロセッサ1108および/またはグラフィクスプロセッサ1110は、互いに、および/または、さまざまな他のシステムデバイスと、システムインターコネクト1116で通信可能および/または動作可能に結合されているとしてよい。結合されている他のシステムデバイスは、これらに限定されないが、例えば、メモリコントローラ1114、音声コントローラ1118および/または周辺機器1120を含むとしてよい。周辺機器1120は、例えば、ユニファイド・シリアル・バス(USB)ホストポート、ペリフェラル・コンポーネント・インターコネクト(PCI)エクスプレスポート、シリアル・ペリフェラル・インターフェース(SPI)インターフェース、拡張バス、および/または、その他の周辺機器を含むとしてよい。図11ではメモリコントローラ1114がデコーダ1106、ならびに、プロセッサ1108および1110にインターコネクト1116で結合されている様子が図示されているが、さまざまな実施形態では、メモリコントローラ1114は、デコーダ1106、表示プロセッサ1108および/またはグラフィクスプロセッサ1110に直接結合されているとしてよい。
一部の実施形態では、システム1100は、I/Oバス(不図示)を介して、図11には不図示のさまざまなI/Oデバイスと通信を行うとしてよい。このようなI/Oデバイスは、例えば、これらに限定されないが、ユニバーサル・アシンクロナス・レシーバ/トランスミッタ(UART)デバイス、USBデバイス、I/O拡張インターフェースまたはその他のI/Oデバイスを含むとしてよい。さまざまな実施形態によると、システム1100は、モバイル通信、ネットワーク通信および/または無線通信を実行するシステムの少なくとも一部分を表しているとしてもよい。
システム1100はさらに、メモリ1112を備えるとしてよい。メモリ1112は、ダイナミックランダムアクセスメモリ(DRAM)デバイス、スタティックランダムアクセスメモリ(SRAM)デバイス、フラッシュメモリデバイス、または、その他のメモリデバイス等の1以上のディスクリートメモリ素子であってよい。図11ではメモリ1112をプロセッサ1102の外部素子であるとして図示しているが、さまざまな実施形態によると、メモリ1112はプロセッサ1102の内部素子であってもよい。メモリ1112は、プロセッサ1102が実行し得るデータ信号で表現される命令および/またはデータを格納しているとしてよい。一部の実施形態によると、メモリ1112は基準ウィンドウ画素値を格納しているとしてよい。
上述したシステムおよび当該システムで実行される処理は、本明細書で説明したが、ハードウェア、ファームウェアあるいはソフトウェア、または、これらの任意の組み合わせで実現されるとしてよい。また、本明細書で開示した任意の1以上の特徴は、ハードウェア、ソフトウェア、ファームウェア、および、これらの組み合わせで実現されるとしてよく、ディスクリート回路ロジックおよび集積回路ロジック、特定用途向け集積回路(ASIC)ロジックおよびマイクロコントローラで実現されるとしてよく、ドメイン固有集積回路パッケージまたは複数の集積回路パッケージの組み合わせの一部として実現されるとしてよい。本明細書で用いられる場合、「ソフトウェア」という用語は、本明細書で開示した1以上の特徴および/または複数の特徴の組み合わせをコンピュータシステムに実行させるコンピュータプログラムロジックが格納されているコンピュータ可読媒体を有するコンピュータプログラム製品を意味する。
本明細書に記載した特定の特徴はさまざまな実施形態を参照しつつ説明したが、本明細書は本開示を限定するものと解釈されるべきではない。このため、本明細書で説明した実施形態のさまざまな変形例、および、その他の実施形態は、本開示の関連技術分野の当業者には明らかであり、本開示の範囲および意図に含まれるものとする。

Claims (19)

  1. ビデオデータをデコードする方法であって、
    ビデオデコーダにおいて、
    現在ビデオフレーム内のブロックについて、第1の基準ビデオフレームに対応付けられている複数の画素値で構成される第1のウィンドウ、および、第2の基準ビデオフレームに対応付けられている複数の画素値で構成される第2のウィンドウを特定する段階と、
    前記第1の基準ビデオフレームおよび前記第2の基準ビデオフレームの画素値をメモリに格納して、前記第1のウィンドウの画素値および前記第2のウィンドウの画素値に限定されている格納画素値を提供する段階と、
    前記ブロックについて動きベクトル(MV)を導出するべく前記格納画素値を利用する段階と、
    前記ブロックに対して動き補償(MC)を実行するべく前記MVを利用する段階と
    を備える方法。
  2. 前記ブロックについてMVを導出するべく前記格納画素値を利用する段階は、前記ブロックについて前記MVを導出するべく前記格納画素値のみを利用する段階を有する請求項1に記載の方法。
  3. 前記ブロックについてMVを導出するべく前記格納画素値を利用する段階は、前記ブロックについて前記MVを導出するべく、前記第1の基準ビデオフレームおよび前記第2の基準ビデオフレームの他の画素値を利用することなく、前記ブロックについて前記MVを導出するべく前記格納画素値を利用する段階を有する請求項1または2に記載の方法。
  4. 前記ブロックは、サイズが(M×N)の予測ユニットを含み、
    MおよびNは、ゼロでない正の整数を含み、
    前記第1のウィンドウは、サイズが(M+W+2L)の整数画素ウィンドウを含み、
    WおよびLはゼロでない正の整数を含み、
    前記第1のウィンドウは、サイズが(N+W+2L)の整数画素ウィンドウを含み、
    前記方法はさらに、
    Mの値およびNの値のうち少なくとも一方に応じてLの値を決定する段階を備える請求項1から3のいずれか一項に記載の方法。
  5. Mの値およびNの値のうち少なくとも一方に応じてLの値を決定する段階は、(M×N)の値が異なることに応じて、Lの値を異ならせるように適応的に決定する段階を有する請求項4に記載の方法。
  6. 前記第1のウィンドウを特定することは、MV候補対に応じて第1のウィンドウの中心を特定することを含み、
    前記第2のウィンドウを特定することは、前記MV候補対に応じて第2のウィンドウの中心を特定することを含む請求項1から5のいずれか一項に記載の方法。
  7. 前記MV候補対は、ゼロMV、前記第1の基準ビデオフレームまたは前記第2の基準ビデオフレームの時間的に隣接するブロックのMV、前記現在ビデオフレームの空間的に隣接するブロックのMV、メディアンフィルタリングされたMV、および、平均MVのうち少なくとも1つを含む請求項6に記載の方法。
  8. 前記MV候補対に応じて、前記第1のウィンドウの中心および前記第2のウィンドウの中心を特定することは、前記第1のウィンドウの中心および前記第2のウィンドウの中心を適応的に特定することを含む請求項6または7に記載の方法。
  9. 前記第1のウィンドウの中心および前記第2のウィンドウの中心を適応的に特定することは、
    Figure 2014511069
    の条件を満足させるMV候補対の数が最大になることに応じて、前記第1のウィンドウの中心および前記第2のウィンドウの中心を特定することを含み、
    式中、aおよびb(i=0,1)は、設定可能なMV制限パラメータを含み、
    (Mv_0.x,Mv_0.y)および(Mv_1.x,Mv_1.y)は、MV候補対を含み、
    (center_0.x,center_0.y)は、前記第1のウィンドウの中心を含み、
    (center_1.x,center_1.y)は、前記第2のウィンドウの中心を含む請求項8に記載の方法。
  10. ビデオエンコーダから、前記デコーダは前記第1のウィンドウおよび前記第2のウィンドウを特定すべきである旨を示す制御データを受信する段階をさらに備える請求項1から9のいずれか一項に記載の方法。
  11. ビデオデータをデコードするシステムであって、
    第1の基準ウィンドウおよび第2の基準ウィンドウの画素値を格納するメモリと、
    前記メモリに結合されているプロセッサ手段と
    を備え、
    前記プロセッサ手段は、
    現在ビデオフレーム内のブロックについて、前記第1の基準ウィンドウおよび前記第2の基準ウィンドウを特定し、
    前記画素値を前記メモリに格納し、
    前記ブロックについて動きベクトル(MV)を導出するべく格納された前記画素値を利用し、
    前記ブロックに対して動き補償(MC)を実行するべく前記MVを利用し、
    前記プロセッサ手段は、前記MVを導出するべく、そして、前記ブロックに対してMCを実行するべく利用される前記画素値を、前記メモリに格納されている前記第1の基準ウィンドウおよび前記第2の基準ウィンドウの前記画素値に限定するシステム。
  12. 前記ブロックは、サイズが(M×N)の予測ユニットを含み、
    MおよびNは、ゼロでない正の整数を含み、
    前記第1の基準ウィンドウは、サイズが(M+W+2L)の整数画素ウィンドウを含み、
    WおよびLはゼロでない正の整数を含み、
    前記第1の基準ウィンドウは、サイズが(N+W+2L)の整数画素ウィンドウを含み、
    前記プロセッサ手段は、
    Mの値およびNの値のうち少なくとも一方に応じてLの値を決定する請求項11に記載のシステム。
  13. Mの値およびNの値のうち少なくとも一方に応じてLの値を決定するべく、前記プロセッサ手段は、(M×N)の値が異なることに応じてLの値を異ならせるように適応的に決定する請求項12に記載のシステム。
  14. 前記第1の基準ウィンドウを特定するべく、前記プロセッサ手段は、MV候補対に応じて第1のウィンドウの中心を特定し、
    前記第2の基準ウィンドウを特定するべく、前記プロセッサ手段は、前記MV候補対に応じて第2のウィンドウの中心を特定する請求項11から13のいずれか一項に記載のシステム。
  15. 前記第1の基準ウィンドウの中心および前記第2の基準ウィンドウの中心を特定するべく、前記プロセッサ手段は、前記第1の基準ウィンドウの中心および前記第2の基準ウィンドウの中心を適応的に特定する
    請求項14に記載のシステム。
  16. ビデオデータをデコードするデバイスであって、
    現在ビデオフレーム内のブロックについて、第1の基準ウィンドウおよび第2の基準ウィンドウを特定し、
    前記第1の基準ウィンドウの画素値および前記第2の基準ウィンドウの画素値をメモリに格納し、
    前記ブロックについて動きベクトル(MV)を導出するべく、格納された前記画素値を利用し、
    前記ブロックに対して動き補償(MC)を実行するべく前記MVを利用する
    手段を備え、
    前記手段は、前記MVを導出するべく、そして、前記ブロックに対してMCを実行するべく利用される前記画素値を、前記メモリに格納されている前記第1の基準ウィンドウの前記画素値および前記第2の基準ウィンドウの前記画素値に限定するデバイス。
  17. 前記ブロックは、サイズが(M×N)の予測ユニットを含み、
    MおよびNは、ゼロでない正の整数を含み、
    前記第1の基準ウィンドウは、サイズが(M+W+2L)の整数画素ウィンドウを含み、
    WおよびLはゼロでない正の整数を含み、
    前記第1の基準ウィンドウは、サイズが(N+W+2L)の整数画素ウィンドウを含み、
    前記手段は、
    Mの値およびNの値のうち少なくとも一方に応じて、Lの値を決定する請求項16に記載のデバイス。
  18. Mの値およびNの値のうち少なくとも一方に応じてLの値を決定するべく、前記手段は、(M×N)の値が異なることに応じてLの値を異ならせるように適応的に決定する請求項17に記載のデバイス。
  19. 前記第1の基準ウィンドウの中心および前記第2の基準ウィンドウの中心を特定するべく、前記手段は、前記第1の基準ウィンドウの中心および前記第2の基準ウィンドウの中心を適応的に特定する請求項16から18のいずれか一項に記載のデバイス。
JP2013558003A 2011-03-15 2011-06-29 低メモリアクセス動きベクトル導出 Expired - Fee Related JP5911517B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161452843P 2011-03-15 2011-03-15
US61/452,843 2011-03-15
PCT/US2011/042292 WO2012125178A1 (en) 2011-03-15 2011-06-29 Low memory access motion vector derivation

Publications (2)

Publication Number Publication Date
JP2014511069A true JP2014511069A (ja) 2014-05-01
JP5911517B2 JP5911517B2 (ja) 2016-04-27

Family

ID=46831036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013558003A Expired - Fee Related JP5911517B2 (ja) 2011-03-15 2011-06-29 低メモリアクセス動きベクトル導出

Country Status (6)

Country Link
US (1) US20130287111A1 (ja)
EP (1) EP2687016A4 (ja)
JP (1) JP5911517B2 (ja)
KR (1) KR101596409B1 (ja)
TW (1) TWI559773B (ja)
WO (1) WO2012125178A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021521753A (ja) * 2018-06-14 2021-08-26 テンセント・アメリカ・エルエルシー 双方向予測動きベクトル精密化におけるメモリ帯域幅最適化技術

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6765964B1 (en) 2000-12-06 2004-07-20 Realnetworks, Inc. System and method for intracoding video data
US9654792B2 (en) 2009-07-03 2017-05-16 Intel Corporation Methods and systems for motion vector derivation at a video decoder
US8917769B2 (en) * 2009-07-03 2014-12-23 Intel Corporation Methods and systems to estimate motion based on reconstructed reference frames at a video decoder
CN102986224B (zh) 2010-12-21 2017-05-24 英特尔公司 用于增强的解码器侧运动向量导出处理的系统及方法
KR101616010B1 (ko) 2011-11-04 2016-05-17 구글 테크놀로지 홀딩스 엘엘씨 비균일 움직임 벡터 그리드에 대한 움직임 벡터 스케일링
US9325991B2 (en) * 2012-04-11 2016-04-26 Qualcomm Incorporated Motion vector rounding
US11317101B2 (en) 2012-06-12 2022-04-26 Google Inc. Inter frame candidate selection for a video encoder
WO2014058796A1 (en) * 2012-10-08 2014-04-17 Google Inc Method and apparatus for video coding using reference motion vectors
US9485515B2 (en) 2013-08-23 2016-11-01 Google Inc. Video coding using reference motion vectors
US9503746B2 (en) 2012-10-08 2016-11-22 Google Inc. Determine reference motion vectors
US10958927B2 (en) 2015-03-27 2021-03-23 Qualcomm Incorporated Motion information derivation mode determination in video coding
US10491917B2 (en) 2017-03-22 2019-11-26 Qualcomm Incorporated Decoder-side motion vector derivation
WO2019072368A1 (en) * 2017-10-09 2019-04-18 Huawei Technologies Co., Ltd. LIMITED MEMORY ACCESS WINDOW FOR MOTION VECTOR REFINEMENT
WO2019203513A1 (ko) * 2018-04-16 2019-10-24 엘지전자 주식회사 영상 코딩 시스템에서 dmvd 를 이용한 인터 예측에 따른 영상 디코딩 방법 및 장치
CN112911284B (zh) * 2021-01-14 2023-04-07 北京博雅慧视智能技术研究院有限公司 一种视频编码中跳过模式实现方法及实现电路
WO2023172243A1 (en) * 2022-03-07 2023-09-14 Google Llc Multi-frame motion compensation synthesis for video coding
WO2023215217A1 (en) * 2022-05-06 2023-11-09 Ophillia Holdings, Inc. D/B/A O Analytics Incorporated Fast kinematic construct method for characterizing anthropogenic space objects

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW277010B (ja) * 1993-07-08 1996-06-01 Black & Decker Inc
JPH10164596A (ja) * 1996-11-29 1998-06-19 Sony Corp 動き検出装置
JPH10248067A (ja) * 1996-12-03 1998-09-14 St Microelectron Inc マルチスタンダード脱圧縮及び/又は圧縮装置
US6058142A (en) * 1996-11-29 2000-05-02 Sony Corporation Image processing apparatus
JP2006054600A (ja) * 2004-08-10 2006-02-23 Toshiba Corp 動き検出装置、動き検出方法および動き検出プログラム
US20070053440A1 (en) * 2005-09-08 2007-03-08 Quanta Computer Inc. Motion vector estimation system and method thereof
JP2008011158A (ja) * 2006-06-29 2008-01-17 Matsushita Electric Ind Co Ltd 動きベクトル探索方法及び動きベクトル探索装置
WO2008111451A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 動きベクトル探索方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
WO2010001917A1 (ja) * 2008-07-01 2010-01-07 ソニー株式会社 画像処理装置および方法
WO2010035730A1 (ja) * 2008-09-24 2010-04-01 ソニー株式会社 画像処理装置および方法

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07250328A (ja) * 1994-01-21 1995-09-26 Mitsubishi Electric Corp 動きベクトル検出装置
JP2768646B2 (ja) * 1995-04-05 1998-06-25 株式会社グラフィックス・コミュニケーション・ラボラトリーズ 動きベクトル探索方法および探索装置
WO1998032257A1 (en) * 1997-01-17 1998-07-23 Motorola, Inc. System and device for, and method of, communicating according to a composite code
US6901110B1 (en) 2000-03-10 2005-05-31 Obvious Technology Systems and methods for tracking objects in video sequences
US7313289B2 (en) * 2000-08-30 2007-12-25 Ricoh Company, Ltd. Image processing method and apparatus and computer-readable storage medium using improved distortion correction
US7030356B2 (en) * 2001-12-14 2006-04-18 California Institute Of Technology CMOS imager for pointing and tracking applications
JP4198550B2 (ja) * 2002-09-10 2008-12-17 株式会社東芝 フレーム補間方法およびこのフレーム補間方法を用いた装置
JP4373702B2 (ja) * 2003-05-07 2009-11-25 株式会社エヌ・ティ・ティ・ドコモ 動画像符号化装置、動画像復号化装置、動画像符号化方法、動画像復号化方法、動画像符号化プログラム及び動画像復号化プログラム
US8363721B2 (en) * 2009-03-26 2013-01-29 Cisco Technology, Inc. Reference picture prediction for video coding
US9654792B2 (en) * 2009-07-03 2017-05-16 Intel Corporation Methods and systems for motion vector derivation at a video decoder
US8736767B2 (en) * 2010-09-29 2014-05-27 Sharp Laboratories Of America, Inc. Efficient motion vector field estimation

Patent Citations (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW277010B (ja) * 1993-07-08 1996-06-01 Black & Decker Inc
JPH10164596A (ja) * 1996-11-29 1998-06-19 Sony Corp 動き検出装置
US6058142A (en) * 1996-11-29 2000-05-02 Sony Corporation Image processing apparatus
JPH10248067A (ja) * 1996-12-03 1998-09-14 St Microelectron Inc マルチスタンダード脱圧縮及び/又は圧縮装置
JP2006054600A (ja) * 2004-08-10 2006-02-23 Toshiba Corp 動き検出装置、動き検出方法および動き検出プログラム
US20070053440A1 (en) * 2005-09-08 2007-03-08 Quanta Computer Inc. Motion vector estimation system and method thereof
KR20070029044A (ko) * 2005-09-08 2007-03-13 콴타 컴퓨터 인코포레이티드 움직임 벡터 추정 시스템 및 그 방법
JP2008011158A (ja) * 2006-06-29 2008-01-17 Matsushita Electric Ind Co Ltd 動きベクトル探索方法及び動きベクトル探索装置
WO2008111451A1 (ja) * 2007-03-14 2008-09-18 Nippon Telegraph And Telephone Corporation 動きベクトル探索方法及び装置、そのプログラム並びにプログラムを記録した記録媒体
WO2010001917A1 (ja) * 2008-07-01 2010-01-07 ソニー株式会社 画像処理装置および方法
JP2010016454A (ja) * 2008-07-01 2010-01-21 Sony Corp 画像符号化装置および方法、画像復号装置および方法、並びにプログラム
US20110103485A1 (en) * 2008-07-01 2011-05-05 Kazushi Sato Image Processing Apparatus and Method
CN102077595A (zh) * 2008-07-01 2011-05-25 索尼公司 图像处理装置和方法
WO2010035730A1 (ja) * 2008-09-24 2010-04-01 ソニー株式会社 画像処理装置および方法
US20110170605A1 (en) * 2008-09-24 2011-07-14 Kazushi Sato Image processing apparatus and image processing method
CN102160382A (zh) * 2008-09-24 2011-08-17 索尼公司 图像处理设备和图像处理方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
CSNJ201110037220; 伊谷裕介 他: 'ブロックサイズに基づくダイレクト予測選択手法' 電子情報通信学会2011年総合大会講演論文集 情報・システム2 , 20110228, p.S-3〜S-4, 社団法人電子情報通信学会 *
JPN6014038253; Y.Itani et al.: 'ADAPTIVE DIRECT VECTOR DERIVATION FOR VIDEO CODING' 28th Picture Coding Symposium, PCS2010 , 20101208, p.190-193, IEEE *
JPN6014038254; 伊谷裕介 他: 'ブロックサイズに基づくダイレクト予測選択手法' 電子情報通信学会2011年総合大会講演論文集 情報・システム2 , 20110228, p.S-3〜S-4, 社団法人電子情報通信学会 *
JPN6015013520; Yi-Jen Chiu et al.: 'CE1: Report of self derivation of motion estimation techniques at video decoder side on HM2.0 [onlin' Joint Collaborative Team on Video Coding(JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 5th Me , 20110311, インターネット<URL:http://phenix.it-s&#xFF55 *
JPN6016007386; S.K.Satyanarayana et al.: 'Predictive Search Range and Block Size in Block Matching Motion Estimation Algorithms in Video Codin' Image and Signal Processing, 2009. CISP '09. 2nd International Congress on , 20091017, p.1-5, IEEE *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021521753A (ja) * 2018-06-14 2021-08-26 テンセント・アメリカ・エルエルシー 双方向予測動きベクトル精密化におけるメモリ帯域幅最適化技術
JP7061729B2 (ja) 2018-06-14 2022-04-28 テンセント・アメリカ・エルエルシー 双方向予測動きベクトル精密化におけるメモリ帯域幅最適化技術

Also Published As

Publication number Publication date
KR101596409B1 (ko) 2016-02-23
TWI559773B (zh) 2016-11-21
EP2687016A1 (en) 2014-01-22
US20130287111A1 (en) 2013-10-31
KR20130138301A (ko) 2013-12-18
TW201238355A (en) 2012-09-16
EP2687016A4 (en) 2014-10-01
WO2012125178A1 (en) 2012-09-20
JP5911517B2 (ja) 2016-04-27

Similar Documents

Publication Publication Date Title
JP5911517B2 (ja) 低メモリアクセス動きベクトル導出
JP7004782B2 (ja) 画像予測方法および関連装置
US11202077B2 (en) Motion vector prediction method and device
US11902563B2 (en) Encoding and decoding method and device, encoder side apparatus and decoder side apparatus
EP3545682B1 (en) Decoder-side motion vector restoration for video coding
CN104539963B (zh) 由视频解码装置执行的方法
US10334271B2 (en) Encoding system using motion estimation and encoding method using motion estimation
JP2019013031A (ja) 画像予測方法および関連装置
KR102390162B1 (ko) 데이터 인코딩 장치 및 데이터 인코딩 방법
CN110651477A (zh) 用于运动向量修正的受限存储器访问窗口
CN117501695A (zh) 用于基于深度学习的视频处理的增强体系结构
US11259042B2 (en) Motion vector determining method and apparatus
CN111343465B (zh) 电子电路和电子设备
KR20220052991A (ko) 스위칭가능한 보간 필터들
KR20160064299A (ko) 비디오 프레임 인코딩 회로, 그것의 인코딩 방법 및 그것을 포함하는 비디오 데이터 송수신 장치
WO2021046692A1 (en) Resolution-adaptive video coding with conditional interpolation filters
CN117061753A (zh) 预测帧间编码的运动矢量的方法和装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140813

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140909

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141014

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20150414

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20150714

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160301

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160329

R150 Certificate of patent or registration of utility model

Ref document number: 5911517

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees