[go: up one dir, main page]

JP5638731B1 - 拡張ダイナミックレンジをもつ画像の階層式符号化における適応的な偽輪郭生成防止 - Google Patents

拡張ダイナミックレンジをもつ画像の階層式符号化における適応的な偽輪郭生成防止 Download PDF

Info

Publication number
JP5638731B1
JP5638731B1 JP2014539165A JP2014539165A JP5638731B1 JP 5638731 B1 JP5638731 B1 JP 5638731B1 JP 2014539165 A JP2014539165 A JP 2014539165A JP 2014539165 A JP2014539165 A JP 2014539165A JP 5638731 B1 JP5638731 B1 JP 5638731B1
Authority
JP
Japan
Prior art keywords
image
false contour
dynamic range
calculating
vdr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014539165A
Other languages
English (en)
Other versions
JP2015501603A (ja
Inventor
スー,グアン−ミン
キュ,シェン
ダリー,スコット
Original Assignee
ドルビー ラボラトリーズ ライセンシング コーポレイション
ドルビー ラボラトリーズ ライセンシング コーポレイション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ドルビー ラボラトリーズ ライセンシング コーポレイション, ドルビー ラボラトリーズ ライセンシング コーポレイション filed Critical ドルビー ラボラトリーズ ライセンシング コーポレイション
Application granted granted Critical
Publication of JP5638731B1 publication Critical patent/JP5638731B1/ja
Publication of JP2015501603A publication Critical patent/JP2015501603A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/98Adaptive-dynamic-range coding [ADRC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/154Measured or subjectively estimated visual quality after decoding, e.g. measurement of distortion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/179Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a scene or a shot
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/182Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a pixel
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/192Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding the adaptation method, adaptation tool or adaptation type being iterative or recursive
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

エンコーダが、拡張ダイナミックレンジまたは視覚的ダイナミックレンジ(VDR)において画像のシーケンスを受領する。各画像について、ダイナミックレンジ圧縮機能および関連するパラメータが、入力画像を、より小さなダイナミックレンジをもつ第二の画像に変換するために、選択される。前記入力画像および前記第二の画像を使って、残差画像が計算される。入力VDR画像シーケンスは、前記第二の画像を基本層として使い、前記入力画像および前記第二の画像から導出される残差画像を一つまたは複数の残差層として使う階層式コーデックを使って符号化される。前記残差画像を使って、偽輪郭検出方法(FCD)が、復号されたVDR画像中の潜在的な、知覚的に可視の偽輪郭の数を推定し、偽輪郭を防止するまたは偽輪郭の数を減らすよう逐次反復式にダイナミックレンジ圧縮パラメータを調整する。

Description

関連出願への相互参照
本願はここに参照によって全体において組み込まれる2011年11月1日に出願された米国仮特許出願第61/554,294号の優先権を主張するものである。
発明の分野
本発明は概括的には画像に関する。より詳細には、本発明のある実施形態は、拡張ダイナミックレンジをもつ画像の階層式(layered)符号化における適応的な偽輪郭生成アーチファクトの防止に関する。
本稿での用法では、用語「ダイナミックレンジ」(DR: dynamic range)は人間の心理視覚系(HVS)が画像中のある範囲の、たとえば最も暗い暗部から最も明るい明部までの強度(たとえばルミナンス、ルーマ)を知覚する能力に関することがある。この意味では、DRは「シーン基準の」(scene-referred)強度に関係する。DRはまた、表示装置が特定の幅の強度範囲を十分にまたは適切に表現する能力にも関することがある。この意味では、DRは「ディスプレイ基準の」(display-referred)強度に関係する。本稿の記述における任意の点において特定の意味が特に有意であることが明示的に指定されるのでない限り、上記用語はどちらの意味でも、たとえば交換可能に使用されうると推論されるべきである。
本稿での用法では、用語「高ダイナミックレンジ」(HDR: high dynamic range)は人間の視覚系(HVS: human visual system)の14〜15桁ほどにまたがるDR幅に関係する。たとえば、本質的に正常な(たとえば統計的、バイオメトリックまたは眼科的な意味のうちの一つまたは複数の意味で)、よく順応した人間は約15桁にまたがる強度範囲をもつ。順応した人間は、ほんの一握りの光子ほどの弱い光源を知覚しうる。しかしながら、これらの同じ人間が、砂漠、海または雪における白昼の太陽のほとんど痛々しいほどの明るい強度を感知することがある(あるいは、傷害を防ぐため短時間とはいえ、太陽を見ることさえある)。ただし、この幅は「順応した」人間に利用可能である。たとえばそのような人間のHVSは、リセットし調整するためのある時間期間をもつ。
対照的に、人間が強度範囲の広範な幅を同時に知覚しうるDRは、HDRに対してある程度打ち切られていることがある。本稿での用法では、「拡張ダイナミックレンジ」「視覚的ダイナミックレンジ」または「可変ダイナミックレンジ」(VDR)は、個々にまたは交換可能に、HVSによって同時に知覚可能なDRに関係する。本稿での用法では、VDRは5〜6桁にまたがるDRに関しうる。よって、真のシーン基準のHDRに比べるといくぶん狭いかもしれないが、それでもVDRは幅広いDR幅を表す。本稿での用法では、用語VDR画像またはピクチャーは、各ピクセル成分が8ビットより多くのビットによって表現される画像またはピクチャーに関係しうる。
かなり最近まで、ディスプレイはHDRまたはVDRよりかなり狭いDRを有していた。典型的な陰極線管(CRT)、常時の蛍光白色バックライトをもつ液晶ディスプレイ(LCD)またはプラズマスクリーン技術を使うテレビジョン(TV)およびコンピュータ・モニタ装置は、そのDR表現機能において、約3桁に制約されることがある。このように、そのような従来のディスプレイは、VDRおよびHDRに対して標準ダイナミックレンジ(SDR)とも称される低ダイナミックレンジ(LDR)の典型となる。
スケーラブル・ビデオ符号化およびHDTV技術と同様、画像DRの拡張は典型的には二方向からのアプローチに関わる。たとえば、近代的なHDR機能のあるカメラで取り込まれたシーン基準HDRコンテンツを使って、VDRディスプレイまたは従来のSDRディスプレイ上で表示されうる該コンテンツのVDRバージョンまたはSDRバージョンが生成されうる。帯域幅節約のためまたは他の配慮から、SDR基本層(BL: base layer)および向上層(EL: enhancement layer)を使って層状にされたまたは階層式のアプローチを使ってVDR信号を伝送してもよい。階層式のビットストリームを受領するレガシー・デコーダは、基本層のみを使って、SDRピクチャーを再構成してもよい。しかしながら、VDR互換なデコーダは基本層および向上層両方を使ってVDRストリームを再構成することができる。
そのような階層式のVDR符号化では、画像は異なる空間分解能、ビット深さおよび色空間において表現されうる。たとえば、典型的なVDR信号は、色成分当たり12ビット以上を使って表現される一方、典型的なSDR信号は色成分当たり8ビットを使って表現される。さらに、基本層および向上層信号は、動画像専門家グループ(MPEG)のISO/IEC勧告によって定義されるもの、たとえばMPEG-1、MPEG-2、MPEG-4パート2およびH.264のような多様な画像およびビデオ圧縮方式を使ってさらに圧縮されてもよい。
階層式のVDR符号化は、符号化パイプラインの少なくとも二つのセグメントにおいて量子化を導入する:a)VDR信号を第一のビット深さ(たとえば色成分当たり12ビット)から第二のより低いビット深さ(たとえば色成分当たり8ビット)のSDR信号に変換する間およびb)基本層および向上層の圧縮プロセスの間である。そのような量子化のアーチファクトとして、再構成された画像上に偽輪郭が現われることがある。
上記のセクションで記述されたアプローチは、追求されることができたが必ずしも以前に着想または追求されたアプローチではない。したがって、特に断りのない限り、該セクションにおいて記述されるアプローチはいずれも、該セクションに含まれているというだけのために従来技術の資格をもつと想定されるべきではない。同様に、特に断りのない限り、一つまたは複数のアプローチに関して特定されている問題は、該セクションに基づいて何らかの従来技術において認識されていたと想定されるべきではない。
MONET P ET AL、"Block Adaptive Quantization of Images,", IEEE Transactions on Communications, IEEE Service Center, Piscataway, NJ, USA, vol.41, no.2, 1 February 1993, pp.303-306は画像をブロックに分割し、量子化器を局所的な信号属性に適応させることを開示している。
本発明のある実施形態は、限定ではなく例として、付属の図面の図において例示される。図面において、同様の参照符号は同様の要素を指す。
本発明のある実施形態に基づく階層式符号化システムのための例示的なデータ・フローを描く図である。 本発明のある実施形態に基づく例示的な一様ダイナミックレンジ圧縮機能を描く図である。 本発明のある実施形態に基づく、偽輪郭を検出する例示的なシステムを描く図である。 本発明のある実施形態に基づく、ピクセル・レベルで偽輪郭を検出するための例示的な処理フローを描く図である。 本発明のある実施形態に基づく、ピクチャー・レベルで偽輪郭を検出するための例示的な処理フローを描く図である。 本発明のある実施形態に基づく、ビデオ符号化においてシーン・レベルで偽輪郭を防止するための例示的な処理フローを描く図である。 本発明のある実施形態に基づく、ビデオ符号化においてシーン・レベルで偽輪郭を防止するための例示的な処理フローを描く図である。 本発明のある実施形態に基づく、偽輪郭検出メトリックを計算するための例示的な処理フローを描く図である。 本発明のある実施形態に基づく、偽輪郭検出メトリックを計算するための例示的な処理フローを描く図である。 本発明のある実施形態に基づく、偽輪郭検出メトリックを計算するための例示的な処理フローを描く図である。
VDR階層式符号化における偽輪郭生成アーチファクトの適応的な防止が本稿で記述される。以下の記述では、説明のために、数多くの個別的詳細が、本発明の十全な理解を与えるために記述される。しかしながら、本発明がそうした個別的詳細なしでも実施されうることは明白であろう。他方、よく知られた構造および装置は、本発明を無用に隠蔽し、埋没させ、あるいは曖昧にするのを避けるために、網羅的な詳細さでは記述されない。
〈概観〉
本稿に記載される例示的な実施形態は、階層式符号化における偽輪郭生成アーチファクトを防止するためのVDRビデオ信号の適応的な量子化に関する。ある実施形態では、エンコーダが、拡張ダイナミックレンジまたは視覚的ダイナミックレンジ(VDR)において画像のシーケンスを受領する。各画像について、ダイナミックレンジ圧縮機能および関連するパラメータが、入力画像を、より小さなダイナミックレンジをもつ第二の画像に変換するために、選択される。前記入力画像および前記第二の画像を使って、残差画像が計算される。入力VDR画像シーケンスは、前記第二の画像を基本層として使い、前記入力画像および前記第二の画像から導出される残差画像を一つまたは複数の残差層として使う階層式コーデックを使って符号化される。前記残差画像を使って、偽輪郭検出(false contour detection)方法(FCD)が、復号されたVDR画像中の潜在的な、知覚的に可視の偽輪郭の数を推定し、偽輪郭の数を減らすよう逐次反復式にダイナミックレンジ圧縮パラメータを調整する。
ある例示的な実施形態では、ダイナミックレンジ圧縮機能は一様な量子化器を含む。
ある例示的な実施形態では、FCD方法は、ピクセル・レベルの輪郭検出器およびピクチャー・レベルの輪郭検出器を含む。
もう一つの実施形態では、エンコーダがVDR画像のシーン(たとえばピクチャーのグループ)を受領する。フレーム依存パラメータCL[i]およびCH[i]を有する一様なダイナミックレンジ圧縮関数が各フレームiに適用されて、各VDR画像をSDR画像に変換する。ここで、SDR画像はVDR画像より低いダイナミックレンジをもつ。初期のCL[i]およびCH[i]の値を設定したのち、逐次反復式プロセスにおいて、各VDR画像およびその対応するSDR画像を使って残差画像が計算される。この残差画像を使って、偽輪郭検出方法(FCD)が、該残差画像中の知覚的に可視の偽輪郭の数を計算し、偽輪郭の発生を減らすよう逐次反復式にCL[i]またはCH[i]のいずれかを調整する。シーン内の全フレームを処理したのち、すべてのCH[i]値の最大に基づいてシーン依存のCH値が計算され、すべてのCL[i]値の最小に基づいてシーン依存のCL値が計算される。入力シーンの圧縮の間に、計算されたシーン依存のCHおよびCLの値を使って、シーン内のすべての画像に一様ダイナミックレンジ圧縮機能が適用される。
もう一つの実施形態では、偽輪郭のエッジ・コントラストを、システム・パラメータおよびコントラスト感度関数(CSF: contrast sensitivity function)のモデルに基づく可視性閾値に比較することによって、偽輪郭検出メトリックが計算される。
〈例示的な階層式VDRシステム〉
図1は、ある実施形態に基づく層状にされたまたは階層式のVDRエンコードを実装する例示的な画像処理システム100を描いている。システム100は、階層式エンコーダのある実施形態を表わす。ここで、入力信号V 105は、基本層135および向上層もしくは残差層185という二つの層を使って符号化される。残差エンコーダ185は単層エンコーダまたは多層エンコーダでありうる。
ある実施形態では、入力信号V 105は、高いビット深さ分解能(たとえばRGB4:4:4のような4:4:4カラー・フォーマットでは色成分当たり12ビット以上)によって表わされる入力VDR信号を表わしていてもよい。このVDR信号は、ダイナミックレンジ圧縮プロセス(たとえばトーン・マッピング演算子または量子化器)110によって処理されて、信号S 112を生成してもよい。いくつかの実施形態では、ダイナミックレンジ圧縮プロセスはまた、他の非線形または線形な画像変換プロセスを有していてもよい。信号Sは、信号Vと同じまたはより低い空間分解能であってもよい。信号Sは、Vよりも低いビット深さ分解能、たとえば色成分当たり8ビットで表わされていてもよい。信号Sは、Vと同じカラー・フォーマットであってもよいし、あるいは他の実施形態では、異なるカラー・フォーマット、たとえばYCbCr4:2:0であってもよい。
ある実施形態では、基本層(BL)信号S 112はBLエンコーダ130によって処理されて圧縮された信号135を生成してもよい。ある実施形態では、符号化130は、動画像専門家グループ(MPEG)規格によって規定されるようなMPEG-2またはMPEG-4ビデオ・エンコーダのような既存のビデオ・エンコーダのいずれによって実装されてもよい。
向上層(または残差層)175は、BLデコーダ140において信号135を復号し、もとのVDR信号Vの予測される値(165)を生成し、もとの値から予測される値(165)を引いて残差信号175を生成することによって、生成されうる。ある実施形態では、予測器160は、2012年4月13日に出願された国際特許出願第PCT/US2012/033605号において記述されるような多変量多重回帰モデルを使って実装されてもよい。残差信号175はさらに残差エンコーダ180によって圧縮されて、エンコードされた残差信号185を生成してもよい。ある実施形態では、符号化180は、動画像専門家グループ(MPEG)規格によって規定されるようなMPEG-2またはMPEG-4ビデオ・エンコーダのような既存のビデオ・エンコーダまたはJPEG2000、VP8、フラッシュ・ビデオなどのような他の画像およびビデオ・エンコーダのいずれによって実装されてもよい。エンコード180の前に、色変換および/または非線形量子化のような他の画像処理演算があってもよい。
ダイナミックレンジ圧縮器110またはエンコーダ130および180のいずれかにおける量子化プロセスのため、VDRデコーダでは、再構成されたVDR信号は量子化に関係する、偽輪郭生成アーチファクトのような関連アーチファクトを示すことがある。そうしたアーチファクトを減らす一つのアプローチは、輪郭除去(de-contouring)のような後処理技法を組み込んでもよい。しかしながら、そのような技法は、デコーダの計算量を増すし、偽輪郭を完全には除去しないことがあるし、他の望ましくないアーチファクトを導入することさえありうる。偽輪郭生成を軽減する第二のアプローチは、ディザリングのようなエンコード前処理方法を適用することを組み込んでもよい。しかしながら、事前ディザリングは入力信号のエントロピーを高め、よって全体的な圧縮効率を劣化させる。ある実施形態は、VDRからSDRへのダイナミックレンジ圧縮プロセス110を適応的に調整することによって偽輪郭生成アーチファクトを防止する新規なアプローチを提案する。それにより、潜在的な偽輪郭の数が防止され、最小化される。
ある実施形態では、エンコード・システム100は、復号されたストリームにおける偽輪郭生成アーチファクトの潜在的な深刻さまたは可視性を推定する偽輪郭検出器(FCD)120をも含んでいてもよい。本稿で後述するように、信号VおよびSを与えられて、FCD 120は、潜在的な偽輪郭生成アーチファクトの数が最小になるよう、ダイナミックレンジ圧縮器110のパラメータを調整する。そのようなパラメータは、たとえばメタデータ167を使って符号化されたビットストリームの一部として、デコーダに伝送されてもよいし、あるいは予測器160において使用されている予測パラメータを導出するためにエンコーダによって使用されてもよい。
本稿での定義によれば、用語「メタデータ」は符号化されたビットストリームの一部として伝送されて、デコーダがデコードされた画像をレンダリングするのを支援する任意の補助情報に関係しうる。そのようなメタデータは、これに限られないが、本稿に記載されるもののような、色空間または範囲変換、ダイナミックレンジおよび/または量子化パラメータに関係したデータを含みうる。
〈例示的なダイナミックレンジ圧縮〉
階層式VDR符号化システム100は、もとのVDR信号105を基本層(たとえばSDR)信号112にマッピングするダイナミックレンジ圧縮器110を含む。ある実施形態では、ダイナミックレンジ圧縮器の入力‐出力特性は関数Q()および一組のパラメータPによって定義できる。このように、VDR入力viを与えられて、SDR出力siは次のように表現できる。
Figure 0005638731
図2は、一様量子化器を使うダイナミックレンジ圧縮器の例示的な実施形態を描いている。ここで、
Figure 0005638731
ここで、Oは丸めオフセットであり、P={CH,CL}である。式(2)において、vLおよびvH値は典型的には、入力ビデオ・シーケンスにおけるフレームのグループのダイナミックレンジ特性に基づいて定義される。vLおよびvHを与えられて、{CH,CL}パラメータはダイナミックレンジ量子化の量および潜在的な知覚的に可視の偽輪郭の数を制御する。図2では、VDR入力は16ビットを使って表現されており、一方、SR出力は8ビットを使って表現されている。図2に描かれるように、ある種の実施形態では、ダイナミックレンジ圧縮にはクリッピングが続いてもよい。たとえば、225より高いSDR値は値225にクリッピングされてもよく、0より低いSDRピクセル値は値0にクリッピングされてもよい。
ある実施形態では、量子化器は一様であり、VDR信号のガンマ補正されたルミナンス成分(たとえば、YCbCr信号におけるY成分)にのみ適用される。他の実施形態では、量子化器は非一様であってもよく、入力信号の二つ以上の色成分に独立して作用してもよく、知覚的な量子化領域(perceptual quantization domain)において作用してもよい。
式(2)を与えられると、量子化解除(またはダイナミックレンジ拡張)プロセスのある実施形態は、次のように表現できる。
Figure 0005638731
ある実施形態では、線形量子化されたデータは不可逆圧縮130を介して圧縮され、逆量子化関数は線形回帰を介して、たとえばVDRおよび基本層のデータセットの間で低次多項式をフィッティングすることによって、得られてもよい。ある実施形態では、
Figure 0005638731
のようなダイナミックレンジ拡張関数のパラメトリック・モデルを与えられると、そのようなモデルのパラメータ(たとえばa0、a1、a2)は、下記の式(5)に描かれるように、予測されるVDR値と入力VDR値との間の平均平方誤差(MSE)を最小化することによって解くことができる。
Figure 0005638731
ダイナミックレンジ圧縮にクリッピングが続くときは、VDRデータの予測は、式(5)を計算するためにクリッピングされていないSDRデータを使うことによって改善されうる。
式(1)のダイナミックレンジ圧縮関数を与えられて、ある実施形態は、再構成されたVDR信号中の潜在的な偽輪郭の数を最小にするよう、パラメータの組Pを選択する。たとえば、式(2)の線形量子化を与えられると、VDRピクチャーにおけるピクセル値の分布がゼロ・ピクセル値により近い主ピークおよび最大ピクセル値に向かう長い後引き部(trail)をもつ場合、CLは0に設定されてもよく(CL=0)、次いで最終的な再構成されたVDRにおける偽輪郭生成アーチファクトを最小にするCHについての値が導出されてもよい。より高いCH値は偽輪郭生成アーチファクトを軽減しうるが、高いCH値は残差ストリーム185のビットレートを増大させ、よって全体的な符号化効率に影響しうる。
ある実施形態では、ダイナミックレンジ圧縮パラメータ(たとえば[CL CH])の選択は、あるビデオ・シーン(たとえばピクチャーのグループ)の諸フレームにわたって一定に保持されてもよい。これは、シーン内での一定のルミナンスを維持することをサポートし、基本層および向上層コーデック(たとえば130および180)内での動き推定プロセスを容易にしうる。
〈偽輪郭生成の検出および防止〉
図3は、本発明のある実施形態に基づく偽輪郭生成検出器(FCD)120の例を描いている。FCDシステム300は、ダイナミックレンジ伸張プロセッサ310およびFCDカウンタ320を含む。ダイナミックレンジ伸張プロセッサ310はSDR入力si 305(またはS 112)を受領し、ダイナミックレンジ圧縮ユニット110によって使われる逆プロセスを使って、もとのVDR入力の近似(または予測されるバージョン)を出力する。それはここでは ̄付きのvi 315として表わされている。この信号は、予測されたviまたは量子化解除されたviとも称されてもよい。viおよび ̄付きのviを入力として与えられると、FCDシステム300は予測誤差または残差
Figure 0005638731
を計算する。これはさらなる処理のためにFCDカウンタ320に入力される。残差画像ri 319を与えられると、FCDカウンタ・ユニット320は、(所与の基準に従って)ダイナミックレンジ圧縮のために選ばれたパラメータに起因する、再構成されたVDR信号中の潜在的な知覚的に可視の偽輪郭の数を出力する。
ある実施形態では、式(6)において、残差は
Figure 0005638731
として計算されてもよい。ここで、^付きのviは、予測器160から直接導出される、予測されたVDR信号165を表わす。
FCDカウンタ320では、入力残差における偽輪郭の検出および計数は、ピクセル・レベル検出コンポーネントおよびピクチャー(またはフレーム)・レベル検出コンポーネントとを有する。
〈例示的なピクセル・レベル検出〉
図4は、ある実施形態に基づくピクセル・レベルで偽輪郭を検出するための例示的なプロセスを描いている。残差ピクセルriを与えられたとき(ステップ410)、Aiは、ピクセルriを中心としてピクセルriを囲むN個のピクセルのエリアを表わす(たとえば3×3または5×5)。Ai内の残差ピクセルについての平均μiおよび標準偏差σiの値(ステップ420)が下記の式(7)および(8)に従って計算される。
Figure 0005638731
所与のダイナミックレンジ圧縮器110について、miは、同じsi出力値に対応するvi入力値のレンジを表わす。たとえば、図2に描かれる一様量子化器について、すべてのmiの値は同一であり、式(2)から、
Figure 0005638731
となる。
この実施形態では、一様量子化の結果、次のようになる。
Figure 0005638731
式(8)、(9)および(10)から、関心対象エリア内の残差ピクセルの標準偏差は、一様量子化器の傾きを定義するパラメータ[CL CH]と強く相関している。
Figure 0005638731
が、Ai内のすべての残差ピクセルの正規化された標準偏差を表わすとし(ステップ430)、
Figure 0005638731
がピクセルriを囲むピクセル領域
Figure 0005638731
内のすべての正規化された標準偏差の中央値を表わすとする(ステップ440)。ピクセル・レベル偽輪郭指標をαiと表わすと、閾値TH、TL、LLおよびLHが与えられたとき、αi=1であれば、残差ri 319は潜在的な偽輪郭に関連付けられる。ここで(ステップ450)、
Figure 0005638731
ある実施形態では、式(12)において、エリア
Figure 0005638731
である。他の実施形態では、チルダ付きのエリアAiはAiより大きくてもよい。ある例示的な実施形態では、TH=1/5、TL=1/16であり、16ビットVDR入力について、LL=10,000、LH=60,000である。偽輪郭生成アーチファクトは、チルダ付きのσi
Figure 0005638731
が閾値THより小さいエリアにおいて存在する。しかしながら、チルダ付きσiの非常に小さい値は、すでに非常になめらかであったエリアを示しうる。よって、偽陽性を避けるために、チルダ付きのσiは閾値TLより高い値に設定される。知覚上の観点からは、偽輪郭生成アーチファクトは非常に暗い領域および非常に明るい領域では観察するのが難しい。よって、偽輪郭の検出がそれほど重要でないことがありうる非常に暗い領域および非常に明るい領域をそれぞれ定義するために、閾値LLおよびLHが使われてもよい。
〈例示的なピクチャー・レベル検出〉
式(13)のαiはピクセル・レベルで偽輪郭の指示を与えるが、知覚上の観点からは、ピクチャー・レベルでの偽輪郭の検出がより有意であることがある。たとえば、偽輪郭生成アーチファクトは、大きなピクチャー・エリアがαi=1をもつ複数のピクセルをもち、これらのピクセルがつながっている場合にのみ知覚上可視であろう。図5は、本発明のある実施形態に基づく、ピクチャー・レベルでの偽輪郭を検出する例示的なプロセスを描いている。
ある実施形態では、ピクチャーまたはビデオ・フレームは重なり合わないブロックBj(たとえば16×16または32×32のピクセル・ブロック)に分割される(ステップ510)。βjは、そのブロックにおいて偽輪郭生成アーチファクトがどのくらい気づかれやすいかを表わす二値の、ブロック・レベルの偽輪郭指標を表わす。ある実施形態では、
Figure 0005638731
を与えられたとする。ここで、|Bj|はエリアBjにおけるピクセル数を表わす。すると、
βj=(bj>TB)・(cj<TB) (16)
となる。
式(15)および(16)の変数cjおよび閾値TBは、二つのブロックを横断する偽輪郭検出を補償するために導入されている。ある実施形態ではTB=0.1である。
各ブロックについてβjを計算したのち(ステップ520)、βj=1であるいくつかのブロックがつながっていると考えられる場合に潜在的な偽輪郭がカウントされる(ステップ530)。ある実施形態では、閾値TC(たとえばTC=0)を与えられて、
k}=connected_component{βj} (17)
がβjの集合の間で4連結のコンポーネント(4-connected components)の数を表わすとする。たとえば、MATLABプログラミング言語を使って、{θk}は関数bwconncomp(βj,4)を使って計算できる。次いで、ステップ540において、FCDメトリックの値
Figure 0005638731
は関心対象のピクチャー・エリアにおける潜在的な知覚的に可視の偽輪郭生成アーチファクトの数を表わす。
一般に、閾値LL、LHおよびTCは目標VDRディスプレイ・システムのディスプレイ特性および人間の視覚系の特性両方に依存する。
〈シーン・ベースの偽輪郭防止〉
図6Aおよび図6Bは、本発明のある実施形態に基づいてビデオ・シーケンスを符号化するときの、シーン・レベルでの知覚的に可視の偽輪郭生成アーチファクトを検出および防止するための例示的な処理フローを描いている。先に説明したように、偽輪郭生成アーチファクトの数は、一般に、入力VDR信号のダイナミックレンジの圧縮の際の量子化の度合いと相関している。所与の一組のパラメータPについて、ダイナミックレンジ圧縮関数Q(vi,P)を与えられると、ある実施形態は、潜在的な偽輪郭の数を測る。次いで、逐次反復的に、潜在的に知覚的に可視な偽輪郭の数が最小にされるようPを調整する。たとえば、式(2)の一様量子化器(図2にも描かれている)を与えられると、ビデオのあるシーン内で、ある実施形態はまず該シーン内での最大vHおよび最小vL値を決定し(ステップ610)、次いで逐次反復的に、潜在的な偽輪郭の数を最小にするCHおよびCL値を決定する(ステップ620および630)。
本稿での用法では、用語「シーン」は連続するフレームまたはピクチャーのグループまたは一般に同様のダイナミックレンジおよび色特性をもつ連続するビデオ・フレームまたはピクチャーの集合に関する。
本稿での用法では、「高クリッピング」は、ダイナミックレンジ圧縮の際、たいていは高いピクセル値(たとえばハイライト)のほうでクリップする選好に関する。そのようなクリッピングは、シーン内のピクセル値のヒストグラムがピクセル値の大半が暗いエリアにより近い傾向があることを示し、該ヒストグラムがハイライト(明るい)エリアにおいて長いテール(tail)を示す場合に好ましい。
本稿での用法では、「低クリッピング」は、ダイナミックレンジ圧縮の際、たいていは低いピクセル値(たとえば暗い影)のほうでクリップする選好に関する。そのようなクリッピングは、シーン内のピクセル値のヒストグラムがピクセル値の大半が明るいエリアにより近い傾向があることを示し、該ヒストグラムが暗いエリアにおいて長いテール(tail)を示す場合に好ましい。
ある実施形態では、低クリッピングまたは高クリッピングのどちらを実行するかの決定(620)は、シーン内のピクセル値のヒストグラムのひずみ度(skewedness)を計算することによって決定されうる。シーン内のN個の入力viピクセルすべてのルミナンス値の推定された平均および標準偏差値μおよびσを与えられて、ひずみ度は次のように定義されてもよい。
Figure 0005638731
ひずみ度が負であれば、データは平均の左のほうにより広がる。ひずみ度が正であれば、データは平均の右に広がる。
図6Bは、VDRデコーダの出力における偽輪郭生成アーチファクトを最小にするCHおよびCL値を決定する逐次反復プロセス630のある実施形態をより詳細に描いている。(式(19)のひずみ度推定値を利用してできる)クリッピング決定632に依存して、プロセス600は635または637のいずれかの経路をたどりうる。低クリッピング(637)のもとでは、各フレームiについて、逐次反復プロセスは初期のCL[i]値(たとえばCL[i]=0)をもって始まり(ステップ637−2)、式(18)を使ってFCDメトリックを計算する(ステップ637−3)。検出される知覚的に可視な偽輪郭の数が所与の閾値Tf以下である場合には(たとえばTf=0)、プロセスは、すべてのフレームの処理が終わるまで、次のフレームに進む(ステップ637−1)。そうでなく、検出される知覚的に可視な輪郭の数が前記所与の閾値より大きい場合には、ステップ637−2において、CL[i]値は指定されたきざみだけ減少させられ(たとえば5だけまたは10だけ)、プロセスが繰り返される。シーン内の全フレームが処理され終わったら、そのシーンのダイナミック圧縮についてのCL値が、すべての計算されたCL[i]値のうちの最小値として選択される。
高クリッピング(635)のもとでは、各フレームiについて、逐次反復プロセスは初期のCH[i]値(たとえばCH[i]=235)をもって始まり(ステップ635−2)、式(18)を使ってFCDメトリックを計算する(ステップ635−3)。検出される知覚的に可視な偽輪郭の数が所与の閾値Tf以下である場合には(たとえばTf=0)、プロセスは、すべてのフレームの処理が終わるまで、次のフレームに進む(ステップ635−1)。そうでなく、検出される知覚的に可視な輪郭の数が前記所与の閾値より大きい場合には、ステップ635−2において、CH[i]値は指定されたきざみだけ増加させられ(たとえば5だけまたは10だけ)、プロセスが繰り返される。シーン内の全フレームが処理され終わったら、そのシーンのダイナミック圧縮についてのCH値が、すべての計算されたCL[i]値のうちの最大値として選択される。
〈可視性閾値に基づくFCDメトリック〉
図7A、7Bおよび7Cは、可視性閾値に基づくある実施形態に従ってステップ540、635−3または637−3においてFCDメトリックを計算するもう一つの例示的なプロセスを描いている。先の議論と同様に、このメトリックも、式(17)によって計算される、接続されたβi=1コンポーネント(たとえばθk)に基づくが、すべての接続されたコンポーネントを数える代わりに、局所的な可視性コントラスト閾値より大きなエッジ・コントラストをもつ接続されたコンポーネントのみをカウントする。
図7Aに描かれるように、ステップ720および730は、ステップ520および530と同様に、たとえば式(14)〜(17)を使って接続されたβi=1コンポーネントの数を計算するために使われる。そのような接続されたコンポーネントの例(795)が図7Bに描かれている(790)。
各接続されたコンポーネント(たとえば795)について、図7Bは、そのエッジを横断してガンマ補正されたルミナンス値を計算する例示的なプロセスを描いている(ステップ740)。接続されたコンポーネントの各エッジのまわりのピクセル窓(たとえば3×3または5×5)を使って、ステップ740−1Aおよび740−1Bはまず、エッジのまわりの領域1および2において平均コード(ピクセル)値を計算する。ある例示的な実施形態では、平均コード値は、関連するピクセル値のルミナンス成分(たとえばYCbCrにおけるY)についてのみ計算されてもよい。
次に、ステップ740−2Aおよび740−2Bにおいて、平均コード値がガンマ補正されたルミナンス値L1およびL2に変換される。多様な標準的ディスプレイ構成モデルに基づいてガンマ補正されたルミナンス値を計算する多くの代替がある。ある実施形態では、
Figure 0005638731
であり、ここで、Vavgは平均コード値であり、γはガンマである。
ルミナンス値L1およびL2を与えられて、ステップ750はエッジ・コントラストCEを次のようにして計算しうる。
Figure 0005638731
図7Cは、ステップ760において局所的なコントラスト閾値を計算する例示的なプロセスを描いている。ステップ760−5において、局所的な光適応レベルLAが次にように計算されうる。
Figure 0005638731
この局所的な光適応レベルおよび他のシステム・パラメータに基づいて、ステップ760−10において、コントラスト感度関数(CSF)モデル(たとえばCSF 760−15)が計算される、あるいは好適な事前計算されたモデルのファミリーから選択される。CSFモデルを与えられて(たとえば760−15)、コントラスト感度値SCが導出される。いくつかの実施形態では、SCはピーク・コントラスト感度(たとえば760−15におけるPCS)として定義されてもよい。他の実施形態では、SCはコントラスト感度関数のY切片(たとえば760−15におけるSCS)として定義されてもよい。ステップ760−20では、計算された局所的なコントラスト感度値SCを与えられて、局所的なコントラスト閾値は次のように計算されてもよい。
Figure 0005638731
図7Aに戻ると、接続されたコンポーネントの一つについてCEおよびCTL値が計算されるステップ750および760ののち、ステップ770では、これら二つの値が比較される。CEが局所的なコントラスト閾値より大きい場合には、考察対象の接続されたコンポーネントは知覚的に可視であると考えられ、ピクチャーまたはフレーム全体についてのFCDカウントが1だけインクリメントされ、そうでない場合には、接続されたコンポーネントは知覚的に可視とは考えられず、カウントされず、プロセスはステップ740に戻る。最後には、最終的なFCDメトリックは、ピクチャーにおける潜在的な知覚的に可視の偽輪郭の総数を表わす。
一様量子化器について本稿に記載された方法は、非一様量子化器のような他の型の量子化器に簡単に拡張できる。もとの入力範囲[vL,vH]をi=1,2,……,pについてp個の重なり合わない入力範囲[vLi,vHi]に分割することによって、偽輪郭アーチファクトを防止する問題は、各入力セグメント内のFCDメトリック(たとえばFCDi)が所与の閾値以下となるようi=1,2,……,pについて一組のパラメータPi、たとえばPi={CHi,CLi}を同定する問題として表現できる。
〈例示的なコンピュータ・システム実装〉
本発明の実施形態は、コンピュータ・システム、電子回路およびコンポーネントにおいて構成されたシステム、マイクロコントローラのような集積回路(IC)デバイス、フィールド・プログラマブル・ゲート・アレイ(FPGA)または他の構成設定可能またはプログラム可能な論理デバイス(PLD)、離散時間またはデジタル信号プロセッサ(DSP)、特定用途向けIC(ASIC)および/またはそのようなシステム、デバイスまたはコンポーネントの一つまたは複数を含む装置をもって実装されてもよい。コンピュータおよび/またはICは、本稿に記載されたもののような偽輪郭の検出および防止に関係する命令を実行、制御または執行してもよい。コンピュータおよび/またはICは、本稿に記載されるような偽輪郭の検出および防止に関係する多様なパラメータまたは値の任意のものを計算してもよい。画像およびビデオの実施形態は、ハードウェア、ソフトウェア、ファームウェアおよびそれらのさまざまな組み合わせにおいて実装されてもよい。
本発明のある種の実施形態は、プロセッサに本発明の方法を実行させるソフトウェア命令を実行するコンピュータ・プロセッサを有する。たとえば、ディスプレイ、エンコーダ、セットトップボックス、トランスコーダなどにおける一つまたは複数のプロセッサが、プロセッサにとってアクセス可能なプログラム・メモリ中のソフトウェア命令を実行することによって上記の偽輪郭生成アーチファクトを検出および防止する方法を実装してもよい。本発明は、プログラム・プロダクトの形で提供されてもよい。プログラム・プロダクトは、データ・プロセッサによって実行されるときにデータ・プロセッサに本発明の方法を実行させる命令を含む一組のコンピュータ可読信号を担持する任意の媒体を含んでいてもよい。本発明に基づくプログラム・プロダクトは、幅広い多様な形のいずれであってもよい。プログラム・プロダクトは、たとえば、フロッピーディスケット、ハードディスク・ドライブを含む磁気データ記憶媒体、CD-ROM、DVDを含む光学式データ記憶媒体、ROM、フラッシュRAMを含む電子的データ記憶媒体などといった物理的な媒体であってもよい。プログラム・プロダクト上のコンピュータ可読信号は任意的に、圧縮または暗号化されてもよい。
上記においてコンポーネント(たとえばソフトウェア・モジュール、プロセッサ、組立体、デバイス、回路など)に言及されるとき、特に断りのない限り、そのコンポーネント(「手段」への言及も含め)は、本発明の例解される例示的な実施形態において当該機能を実行する開示されている構造と構造的に等価でないコンポーネントも含め、記載されるコンポーネントの当該機能を実行する(たとえば機能的に等価な)任意のコンポーネントをそのコンポーネントの等価物として含むものと解釈されるべきである。
〈等価物、拡張、代替その他〉
このように、VDRシーケンスを符号化する際に偽輪郭を検出および防止することに関係する例示的な実施形態が記述されている。以上の明細書では、本発明の諸実施形態について、実装によって変わりうる数多くの個別的詳細に言及しつつ述べてきた。このように、何が本発明であるか、何が出願人によって本発明であると意図されているかの唯一にして排他的な指標は、この出願に対して付与される特許の請求項の、その後の訂正があればそれも含めてかかる請求項が特許された特定の形のものである。かかる請求項に含まれる用語について本稿で明示的に記載される定義があったとすればそれは請求項において使用される当該用語の意味を支配する。よって、請求項に明示的に記載されていない限定、要素、属性、特徴、利点もしくは特性は、いかなる仕方であれかかる請求項の範囲を限定すべきではない。よって、明細書および図面は制約する意味ではなく例示的な意味で見なされるべきものである。

Claims (24)

  1. 入力画像を変換する方法であって:
    a)画像のシーケンス内の、第一のダイナミックレンジをもつ入力画像を受領する段階と;
    b)前記入力画像を第二の画像に変換する段階であって、前記第二の画像は前記第一のダイナミックレンジより小さい第二のダイナミックレンジをもち、前記変換は、一つまたは複数のパラメータをもつダイナミックレンジ圧縮関数に基づく、段階と;
    c)前記入力画像および前記第二の画像から残差画像を計算する段階と;
    d)前記残差画像が少なくとも一つの偽輪郭をもつかどうかを判定する段階と;
    e)前記残差画像が少なくとも一つの偽輪郭をもつと判定した際に、前記パラメータのうちの少なくとも一つを調整する段階とを含
    前記判定する段階d)がピクセル・レベルの検出方法およびピクチャー・レベルの検出方法を含み、
    前記ピクセル・レベルの検出方法は、前記残差画像中のそれぞれのピクセルの周辺領域内の全ピクセルの正規化された標準偏差のそれぞれの中央値に基づいてピクセル・レベルの偽輪郭指標を計算することを含み、
    前記ピクチャー・レベルの検出方法は、一つまたは複数のピクセル・レベルの偽輪郭指標に基づいて前記残差画像の諸ブロックについて計算されたブロック・レベルの偽輪郭指標のいくつかの接続されているものに応じて偽輪郭検出(FCD)メトリックを計算することを含む、
    方法。
  2. 前記少なくとも一つの偽輪郭のカウントが最小にされるまで段階b)ないし段階e)を繰り返すことをさらに含む、
    請求項1記載の方法。
  3. 前記少なくとも一つの偽輪郭のカウントがある閾値より下に低下させられる、請求項2記載の方法。
  4. 前記入力画像が視覚的ダイナミックレンジ(VDR)画像である、請求項1記載の方法。
  5. 前記第二の画像を圧縮して基本層信号にする段階と;
    前記入力画像および前記第二の画像から導出される画像を圧縮して一つまたは複数の向上層信号にする段階とをさらに含む、
    請求項1記載の方法。
  6. 前記ダイナミックレンジ圧縮関数が一様量子化器を有し、前記パラメータが低い量子化された値(CL)および高い量子化された値(CH)を有する、請求項1記載の方法。
  7. 前記残差画像を計算する段階が:
    前記第二の画像にダイナミックレンジ伸張関数を適用して予測された入力画像を生成する段階と;
    前記入力画像と前記予測された入力画像との間の差として前記残差画像を計算する段階とを含む、
    請求項1記載の方法。
  8. 前記ピクセル・レベルの検出方法が:
    前記残差画像中の各ピクセルについて:
    当該ピクセルを囲むピクセルの周辺領域を定義する画定する段階と;
    前記周辺領域内の全ピクセルの標準偏差を計算する段階と;
    前記標準偏差に基づいて前記周辺領域内の全ピクセルの正規化された標準偏差を計算する段階と;
    前記周辺領域における前記標準偏差に基づいて中央値標準偏差を計算する段階と;
    前記中央値標準偏差および一つまたは複数の閾値に基づいてピクセル・レベルの偽輪郭指標を計算する段階とを含む、
    請求項記載の方法。
  9. 前記ピクチャー・レベルの検出方法が:
    前記残差画像を重なり合わないブロックに分割する段階と;
    各ブロックについて、一つまたは複数のピクセル・レベルの偽輪郭指標に基づいてブロック・レベルの偽輪郭指標を計算する段階と;
    前記ブロック・レベルの偽輪郭指標に基づいていくつかの接続されたブロック・レベルの偽輪郭指標を導出する段階と;
    前記いくつかの接続されたブロック・レベルの偽輪郭指標および少なくとも一つの閾値の関数として偽輪郭検出(FCD)メトリックを導出する段階とを含む、
    請求項記載の方法。
  10. 少なくとも一つのピクセル・レベルの偽輪郭指標が請求項9記載の方法に従って計算される、請求項記載の方法。
  11. 入力画像を変換する方法であって:
    シーン内の視覚的ダイナミックレンジ(VDR画像のシーケンスを受領する段階と;
    前記シーン内の各VDR画像iについて、
    i番目のVDR画像をi番目の標準ダイナミックレンジ(SDR画像に変換する段階であって、i番目のSDR画像はi番目のVDR画像より小さいダイナミックレンジをもち、前記変換は画像に依存するパラメータCL[i]およびCH[i]をもつ一様なダイナミックレンジ圧縮関数に基づく、段階と;
    a)前記CL[i]およびCH[i]を初期値に設定する段階と;
    b)前記i番目のVDR画像および前記i番目のSDR画像を使ってi番目の残差画像を計算する段階と;
    c)前記i番目の残差画像が少なくとも一つの偽輪郭をもつかどうかを判定する段階と;
    d)前記i番目の残差画像が少なくとも一つの偽輪郭をもつと判定した際に、前記画像に依存するパラメータCL[i]およびCH[i]の少なくとも一方を調整する段階と;
    前記少なくとも一つの偽輪郭のカウントが最小にされるまで段階b)ないし段階d)を繰り返す段階と;
    すべての計算された画像に依存するCH[i]パラメータのうちの最大に基づいて前記シーン全体についてのシーン依存のCH値を計算する段階と;
    すべての計算された画像に依存するCL[i]パラメータのうちの最小に基づいて前記シーン全体についてのシーン依存のCL値を計算する段階と;
    前記一様なダイナミックレンジ圧縮関数および前記シーン依存のCHおよびCLパラメータを使って、前記シーン内のすべてのVDR画像をSDR画像に変換する段階とを含
    前記判定する段階c)が、前記i番目の残差画像内のピクセルの周辺領域内の全ピクセルの正規化された標準偏差の中央値に基づいてピクセル・レベルの偽輪郭指標を計算することを含む、
    方法。
  12. 段階a)の前に、前記シーン内のすべてのVDR画像に高クリッピング・モードまたは低クリッピング・モードを適用するかを決定する段階をさらに含む、
    請求項11記載の方法。
  13. 高クリッピング・モードでは、段階d)において、前記CH[i]パラメータのみが増大させられ、低クリッピング・モードでは、段階d)において、前記CL[i]パラメータのみが減少させられる、請求項12記載の方法。
  14. 高クリッピング・モードを適用するかの前記決定が前記シーンについてのひずみ度の値を計算することに基づき、前記ひずみ度は正である、請求項12記載の方法。
  15. 低クリッピング・モードを適用するかの前記決定が前記シーンについてのひずみ度の値を計算することに基づき、前記ひずみ度は負である、請求項12記載の方法。
  16. 前記i番目のSDR画像に基づく基本層および一つまたは複数の向上層を使って前記シーン内の前記i番目のVDR画像を圧縮する段階をさらに含む、請求項11記載の方法。
  17. 段階d)およびe)において、前記少なくとも一つの偽輪郭が知覚的に可視である、請求項1記載の方法。
  18. 段階c)において、前記少なくとも一つの偽輪郭が知覚的に可視である、請求項11記載の方法。
  19. 前記ピクチャー・レベルの検出方法が:
    前記残差画像を重なり合わないブロックに分割する段階と;
    各ブロックについて、一つまたは複数のピクセル・レベルの偽輪郭指標に基づいてブロック・レベルの偽輪郭指標を計算する段階と;
    前記ブロック・レベルの偽輪郭指標に基づいていくつかの接続されたブロック・レベルの偽輪郭指標を導出する段階と;
    前記いくつかの接続されたブロック・レベルの偽輪郭指標のそれぞれの一偽輪郭指標について、
    エッジ・コントラストおよび局所的なコントラスト閾値を計算する段階と;
    前記エッジ・コントラストが前記局所的なコントラスト閾値より大きい場合に、前記いくつかの接続されたブロック・レベルの偽輪郭指標の前記一偽輪郭指標が知覚的に可視であるかと判定する段階とを含む、
    請求項記載の方法。
  20. 知覚的に可視である前記いくつかの接続されたブロック・レベルの偽輪郭指標および少なくとも一つの閾値の関数として、偽輪郭検出(FCD)メトリックを導出する段階をさらに含む、請求項19記載の方法。
  21. 前記エッジ・コントラストを計算する段階が、前記いくつかの接続されたブロック・レベルの偽輪郭指標の前記一偽輪郭指標のエッジの両側のルミナンスを計算することに基づく、請求項19記載の方法。
  22. 前記局所的なコントラスト閾値を計算する段階が、一つまたは複数のシステム・パラメータおよびコントラスト感度関数に基づく、請求項19記載の方法。
  23. プロセッサを有しており、請求項1ないし22のうちいずれか一項記載の方法を実行するよう構成されている装置。
  24. 請求項1ないし22のうちいずれか一項記載の方法を実行するためのコンピュータ実行可能命令が記憶されているコンピュータ可読記憶媒体。
JP2014539165A 2011-11-01 2012-11-01 拡張ダイナミックレンジをもつ画像の階層式符号化における適応的な偽輪郭生成防止 Active JP5638731B1 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161554294P 2011-11-01 2011-11-01
US61/554,294 2011-11-01
PCT/US2012/062958 WO2013067113A1 (en) 2011-11-01 2012-11-01 Adaptive false contouring prevention in layered coding of images with extended dynamic range

Publications (2)

Publication Number Publication Date
JP5638731B1 true JP5638731B1 (ja) 2014-12-10
JP2015501603A JP2015501603A (ja) 2015-01-15

Family

ID=47148991

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014539165A Active JP5638731B1 (ja) 2011-11-01 2012-11-01 拡張ダイナミックレンジをもつ画像の階層式符号化における適応的な偽輪郭生成防止

Country Status (5)

Country Link
US (1) US8873877B2 (ja)
EP (1) EP2774361B1 (ja)
JP (1) JP5638731B1 (ja)
CN (1) CN103918274B (ja)
WO (1) WO2013067113A1 (ja)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9712834B2 (en) * 2013-10-01 2017-07-18 Dolby Laboratories Licensing Corporation Hardware efficient sparse FIR filtering in video codec
WO2015073373A1 (en) 2013-11-12 2015-05-21 Dolby Laboratories Licensing Corporation Pre-dithering in high dynamic range video coding
US9911179B2 (en) 2014-07-18 2018-03-06 Dolby Laboratories Licensing Corporation Image decontouring in high dynamic range video processing
AU2016209615C1 (en) * 2015-01-19 2018-03-22 Dolby Laboratories Licensing Corporation Display management for high dynamic range video
RU2661309C1 (ru) * 2015-02-17 2018-07-13 Долби Лэборетериз Лайсенсинг Корпорейшн Межслойное предсказание для сигналов с улучшенным динамическим диапазоном
EP3107300A1 (en) 2015-06-15 2016-12-21 Thomson Licensing Method and device for encoding both a high-dynamic range frame and an imposed low-dynamic range frame
CN107852502B (zh) * 2015-07-28 2021-07-20 杜比实验室特许公司 用于增强视频信号的位深的方法、编码器、解码器和系统
US10129558B2 (en) 2015-09-21 2018-11-13 Qualcomm Incorporated Supplement enhancement information (SEI) messages for high dynamic range and wide color gamut video coding
US10244249B2 (en) * 2015-09-21 2019-03-26 Qualcomm Incorporated Fixed point implementation of range adjustment of components in video coding
US10778983B2 (en) * 2015-09-23 2020-09-15 Dolby Laboratories Licensing Corporation Preserving texture/noise consistency in video codecs
WO2017053860A1 (en) * 2015-09-23 2017-03-30 Arris Enterprises Llc High dynamic range adaptation operations at a video decoder
US10133934B2 (en) * 2015-09-30 2018-11-20 Apple Inc. Systems and methods for post processing time-lapse videos
JP6678541B2 (ja) * 2016-08-31 2020-04-08 富士フイルム株式会社 画像処理装置、方法およびプログラム
JP6852411B2 (ja) * 2017-01-19 2021-03-31 ソニー株式会社 映像信号処理装置、映像信号処理方法およびプログラム
US10798321B2 (en) * 2017-08-15 2020-10-06 Dolby Laboratories Licensing Corporation Bit-depth efficient image processing
CN108416059B (zh) * 2018-03-22 2021-05-18 北京市商汤科技开发有限公司 图像描述模型的训练方法和装置、设备、介质
WO2021086024A1 (ko) * 2019-10-28 2021-05-06 엘지전자 주식회사 적응적 색공간 변환을 이용하여 레지듀얼 처리를 수행하는 영상 부호화/복호화 방법, 장치 및 비트스트림을 전송하는 방법
WO2022077489A1 (zh) * 2020-10-16 2022-04-21 深圳市大疆创新科技有限公司 数据处理方法、设备和存储介质
CN114494026B (zh) * 2020-10-23 2025-07-11 澜至电子科技(成都)有限公司 用于消除图像中的伪轮廓的方法、装置以及存储介质
CN112040240B (zh) * 2020-11-03 2021-08-27 深圳市大疆创新科技有限公司 数据处理方法、设备和存储介质
CN113095334B (zh) * 2021-03-26 2022-04-01 广西科技大学 一种基于视网膜明适应机制的轮廓检测方法
CN118283282B (zh) * 2024-04-18 2025-09-09 同济大学 量化图像伪轮廓消除方法、终端设备、存储介质及计算机程序产品
WO2025244900A1 (en) * 2024-05-21 2025-11-27 Apple Inc. Edr-aware, hue-preserving, soft-clip for hdr content

Family Cites Families (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4959730A (en) 1990-01-02 1990-09-25 Eastman Kodak Company False density contour suppression using randomly modified input signals for comparison to threshold values
JPH0662280A (ja) 1992-08-06 1994-03-04 Matsushita Electric Ind Co Ltd 偽輪郭補正回路
KR0170937B1 (ko) 1994-12-14 1999-03-20 배순훈 영상 데이타 부호화 장치
EP1168243B1 (en) * 1995-09-29 2004-06-09 Fuji Photo Film Co., Ltd. Image processing method and apparatus
EP0813336B1 (en) * 1996-06-12 2007-08-08 FUJIFILM Corporation Image processing method and apparatus
JP3700804B2 (ja) * 1996-12-13 2005-09-28 富士写真フイルム株式会社 画像処理方法および装置
DE69914593T2 (de) 1998-04-17 2004-12-16 Matsushita Electric Industrial Co., Ltd., Kadoma Verfahren und vorrichtung zur korrektur von falschen konturen
JP2001136535A (ja) 1999-08-25 2001-05-18 Fuji Xerox Co Ltd 画像符号化装置および量子化特性決定装置
DE60010063T2 (de) 2000-06-09 2004-08-19 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Videobildbearbeitung zur Kompensation des Falschkontureffekts
EP1816603A1 (en) * 2000-11-30 2007-08-08 Canon Kabushiki Kaisha Image processing device, image processing method, storage medium, and program
EP1217826A3 (en) * 2000-12-19 2005-05-25 Konica Corporation Image processing apparatus
US6943831B2 (en) * 2001-01-24 2005-09-13 Eastman Kodak Company Method and apparatus to extend the effective dynamic range of an image sensing device and use residual images
KR100472483B1 (ko) 2002-11-29 2005-03-10 삼성전자주식회사 의사 윤곽 제거 방법 및 이에 적합한 장치
US7580158B2 (en) * 2003-08-28 2009-08-25 Fujifilm Corporation Image processing apparatus, method and program
US8503542B2 (en) 2004-03-18 2013-08-06 Sony Corporation Methods and apparatus to reduce blocking noise and contouring effect in motion compensated compressed video
US8218625B2 (en) * 2004-04-23 2012-07-10 Dolby Laboratories Licensing Corporation Encoding, decoding and representing high dynamic range images
US7990343B2 (en) 2004-05-18 2011-08-02 Panasonic Corporation False contour reduction device, display device, false contour reduction method, and false contour reduction program
KR100718081B1 (ko) 2005-04-18 2007-05-16 삼성전자주식회사 의사윤곽 제거장치 및 그 방법
KR101108435B1 (ko) 2005-05-31 2012-02-16 서강대학교산학협력단 의사윤곽 제거 방법 및 이 방법이 적용되는 디스플레이장치
US20060280242A1 (en) 2005-06-13 2006-12-14 Nokia Corporation System and method for providing one-pass rate control for encoders
US7551795B2 (en) 2005-11-01 2009-06-23 Samsung Electronics Co., Ltd. Method and system for quantization artifact removal using super precision
EP2290983B1 (en) * 2006-01-23 2015-09-02 Max-Planck-Gesellschaft zur Förderung der Wissenschaften e.V. High dynamic range codecs
US8194997B2 (en) * 2006-03-24 2012-06-05 Sharp Laboratories Of America, Inc. Methods and systems for tone mapping messaging
KR20070118755A (ko) 2006-06-13 2007-12-18 삼성전자주식회사 의사 윤곽 제거 방법 및 그 장치
EP2103135A1 (en) * 2006-12-28 2009-09-23 Thomson Licensing Method and apparatus for automatic visual artifact analysis and artifact reduction
US7925086B2 (en) 2007-01-18 2011-04-12 Samsung Electronics Co, Ltd. Method and system for adaptive quantization layer reduction in image processing applications
US7760949B2 (en) * 2007-02-08 2010-07-20 Sharp Laboratories Of America, Inc. Methods and systems for coding multiple dynamic range images
JP4810473B2 (ja) * 2007-03-13 2011-11-09 オリンパス株式会社 画像処理装置および画像処理プログラム
KR101303667B1 (ko) 2007-08-28 2013-09-04 삼성전자주식회사 의사 윤곽을 탐지 및 제거하는 방법 및 장치, 픽셀의 윤곽여부를 확인하는 방법 및 장치 그리고 심플리시티를계산하는 방법 및 장치
US8120679B2 (en) * 2008-08-01 2012-02-21 Nikon Corporation Image processing method
WO2010016820A1 (en) 2008-08-08 2010-02-11 Thomson Licensing Method and apparatus for banding artifact detection
RU2504011C2 (ru) * 2009-03-13 2014-01-10 Долби Лабораторис Лайсэнзин Корпорейшн Многоуровневое сжатие видеоизображения с расширенным динамическим диапазоном, визуальным динамическим диапазоном и широкой цветовой гаммой
EP3324622B1 (en) 2011-04-14 2019-09-11 Dolby Laboratories Licensing Corporation Multiple color channel multiple regression predictor
US8334911B2 (en) * 2011-04-15 2012-12-18 Dolby Laboratories Licensing Corporation Encoding, decoding, and representing high dynamic range images
US9066070B2 (en) * 2011-04-25 2015-06-23 Dolby Laboratories Licensing Corporation Non-linear VDR residual quantizer
WO2012147018A2 (en) 2011-04-28 2012-11-01 Koninklijke Philips Electronics N.V. Apparatuses and methods for hdr image encoding and decoding
EP2603000B1 (en) * 2011-12-08 2017-11-01 Dolby Laboratories Licensing Corporation Guided prediction-filtering in layered vdr image coding

Also Published As

Publication number Publication date
EP2774361A1 (en) 2014-09-10
HK1197956A1 (zh) 2015-02-27
CN103918274B (zh) 2015-08-26
JP2015501603A (ja) 2015-01-15
US8873877B2 (en) 2014-10-28
US20140294313A1 (en) 2014-10-02
CN103918274A (zh) 2014-07-09
EP2774361B1 (en) 2015-09-16
WO2013067113A1 (en) 2013-05-10

Similar Documents

Publication Publication Date Title
JP5638731B1 (ja) 拡張ダイナミックレンジをもつ画像の階層式符号化における適応的な偽輪郭生成防止
US8897581B2 (en) Guided post-prediction filtering in layered VDR coding
US10223774B2 (en) Single-pass and multi-pass-based polynomial approximations for reshaping functions
US11361410B2 (en) Image denoising in SDR to HDR image conversion
EP3834411B1 (en) Reducing banding artifacts in hdr imaging via adaptive sdr-to-hdr reshaping functions
EP3375190B1 (en) High dynamic range color conversion correction
CN108353173B (zh) 用于高动态范围视频编码的分段线性层间预测器
US12177459B2 (en) Rate-control-aware reshaping in HDR imaging
KR101818900B1 (ko) 향상된 동적 범위를 갖는 신호들에 대한 계층간 예측
US10531109B2 (en) Predictive image encoding and decoding with pixel group based quantization
CN109314787B (zh) 用于高动态范围视频编码的增强层掩蔽
Yu et al. HEVC encoder optimization for HDR video coding based on irregularity concealment effect
US10904534B2 (en) Enhancement layer masking for high-dynamic range video coding
HK1197956B (en) Adaptive false contouring prevention in layered coding of images with extended dynamic range

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141007

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20141002

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141022

R150 Certificate of patent or registration of utility model

Ref document number: 5638731

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250