JP2023532228A

JP2023532228A - ノイズ除去および低精度画像処理のための非線形画像強度変換のシステムおよび方法

Info

Publication number: JP2023532228A
Application number: JP2022578793A
Authority: JP
Inventors: ポーチュー，; ハイタオヤン，; リーインシェン，
Original assignee: メタプラットフォームズ，インク．
Priority date: 2020-07-02
Filing date: 2021-07-02
Publication date: 2023-07-27
Also published as: US20220004798A1; EP4154171A1; KR20230034302A; WO2022006556A1; CN117916765A

Abstract

本明細書に記載された技法は、非線形技法を使用して画像を変換することおよび／または画像を量子化することを実現する。変換された画像は、画像強調（たとえば、画像強調を実行する前の前処理ステップであり得る変換および／または量子化）に使用することができる。たとえば、非線形強度変換技法は、元の画像に対して画像処理を実行することと比較して、効率的なノイズ除去、より良い低精度画像処理などを実現することができる。
【選択図】図１

Description

関連出願の相互参照
本出願は、その開示が全体として参照により本明細書に組み込まれる、２０２０年７月２日に出願された、Ｚｈｕらの「ＳｙｓｔｅｍｓａｎｄＭｅｔｈｏｄｓｏｆＮｏｎｌｉｎｅａｒＩｍａｇｅＩｎｔｅｎｓｉｔｙＴｒａｎｓｆｏｒｍａｔｉｏｎｆｏｒＤｅｎｏｉｓｉｎｇａｎｄＬｏｗ－ＰｒｅｃｉｓｉｏｎＩｍａｇｅＰｒｏｃｅｓｓｉｎｇ」と題する米国仮特許出願第６３／０４７，８７５号の優先権を主張する。

本明細書に記載された技法は、一般に、強調されるべき画像を処理する技法に関し、より詳細には、非線形変換を使用してピクセル値を修正することに関する。

画像は画像キャプチャデバイス（たとえば、デジタルカメラの画像センサ）によって取り込まれる場合がある。取り込まれた画像は、画像が取り込まれた条件に起因して品質が不十分な場合がある。たとえば、画像は、不十分な照明、短い露出時間、および／または他の条件に起因してノイズを有する場合がある。さらに、取り込まれた画像は、画像キャプチャデバイスの制限に起因して品質が不十分な場合がある。たとえば、画像キャプチャデバイスは、画像が取り込まれた条件を補償するためのメカニズムをもたない場合がある。

本明細書に記載された技法は、非線形技法を使用して画像の画像強度値（たとえば、ピクセル値）を変換することを実現する。変換された画像は、画像を強調するために（たとえば、画像強調を実行する前の前処理ステップとして）使用することができる。たとえば、非線形強度変換技法は、元の画像に対して画像処理を実行することと比較して、効率的なノイズ除去、より良い低精度画像処理などを実現することができる。

一態様によれば、画像を処理するコンピュータ実装方法。方法は、第１のビット深度のピクセルを含む入力画像を取得することと、第２のビット深度のピクセルを含む量子化入力画像を生成するために、入力画像のピクセル強度に第１の非線形変換を適用することによって少なくとも部分的に入力画像を量子化することであって、第２のビット深度が第１のビット深度よりも小さい、入力画像を量子化することと、画像処理に量子化入力画像を提供することとを実行するために、少なくとも１つのプロセッサを使用することを含む。

一実施形態では、入力画像を量子化することは、入力画像のピクセル強度に第１の非線形変換を適用することから変換された入力画像を取得することと、量子化入力画像を取得するために変換された入力画像のピクセル強度に全射マッピングを適用することであって、全射マッピングが第２のビット深度のピクセル強度に第１のビット深度のピクセル強度をマッピングする、変換された入力画像のピクセル強度に全射マッピングを適用することとを含む。

一実施形態では、第２のビット深度は第１のピクセル強度および第２のピクセル強度を含み、第１のピクセル強度は第２のピクセル強度よりも小さく、入力画像を量子化することは、第２のピクセル強度よりも少ない数の第１のビット深度のピクセル強度を第１のピクセル強度にマッピングすることを含む。

一実施形態では、方法は、画像処理パイプラインから第２のビット深度のピクセルを含む出力画像を取得することと、第１のビット深度のピクセルを含む逆量子化出力画像を生成するために、出力画像のピクセル強度に第２の非線形変換を適用することによって少なくとも部分的に出力画像を逆量子化することとをさらに含む。一実施形態では、第２の非線形変換は第１の非線形変換のインバースを含む。

一実施形態では、画像処理パイプラインに量子化入力画像を提供することは、ニューラルプロセッサに量子化入力画像を提供することを含む。一実施形態では、画像処理パイプラインに量子化入力画像を提供することは、デジタル信号プロセッサ（ＤＳＰ）に量子化入力画像を提供することを含む。一実施形態では、画像処理パイプラインは、少なくとも１つのプロセッサよりも低い電力の１つまたは複数のプロセッサを備える。

一実施形態では、第１のビット深度は、１０ビット、１２ビット、１４ビット、または１６ビットである。一実施形態では、第２のビット深度は８ビットである。一実施形態では、第１のビット深度は、１０ビット、１２ビット、１４ビット、または１６ビットであり、第２のビット深度は８ビットである。

一実施形態では、画像処理パイプラインは、第２のビット深度のピクセルを含む複数の量子化画像を使用して訓練された機械学習モデルを備え、画像処理パイプラインに量子化入力画像を提供することは、強調された出力画像を取得するために機械学習モデルに量子化入力画像を提供することを含む。

別の態様によれば、画像強調のための機械学習モデルを訓練するコンピュータ実装方法が提供される。方法は、第１のビット深度のピクセルを含む複数の画像を取得することと、第２のビット深度のピクセルを含む複数の量子化入力画像を生成するために、複数の画像のピクセル強度に非線形変換を適用することによって少なくとも部分的に複数の画像を量子化することであって、第２のビット深度が第１のビット深度よりも小さい、複数の画像を量子化することと、複数の量子化画像を使用して機械学習モデルを訓練することとを実行するために、少なくとも１つのプロセッサを使用することを含む。

一実施形態によれば、複数の画像は入力画像および目標出力画像を含み、複数の量子化画像を使用して機械学習モデルを訓練することは、量子化入力画像および量子化目標出力画像に教師付き学習アルゴリズムを適用することを含む。

一実施形態によれば、機械学習モデルはニューラルネットワークを備える。一実施形態によれば、複数の量子化画像を使用して機械学習モデルを訓練することは、入力画像をノイズ除去するように機械学習モデルを訓練することを含む。

別の態様によれば、画像を強調するコンピュータ実装方法が提供される。方法は、強調されるべき入力画像を取得することと、変換された入力画像を取得するために入力画像のピクセル強度に非線形変換を適用することと、変換された入力画像を使用して、訓練された機械学習モデルに提供されるべき入力を生成することと、強調された出力画像を取得するために訓練された機械学習モデルに生成された入力を提供することとを実行するために、少なくとも１つのプロセッサを使用することを含む。

一実施形態では、入力画像は、入力画像のピクセル強度にわたるノイズ特性の第１の分散を有し、変換された入力画像は、入力画像のピクセル強度にわたるノイズ特性の第２の分散を有し、第２の分散は第１の分散よりも小さい。一実施形態では、ノイズ特性はノイズ標準偏差である。

一実施形態では、訓練された機械学習モデルは、入力をノイズ除去するように訓練される。一実施形態では、訓練された機械学習モデルは、ニューラルネットワークを備える。一実施形態では、訓練された機械学習モデルは、訓練データに教師付き訓練アルゴリズムを適用することによって生成される。

一実施形態では、入力画像は第１のビット深度のピクセルを含む。

変換された入力画像を使用して入力を生成することは、第２のビット深度のピクセルを含む量子化入力画像を取得するために、変換された入力画像を量子化することを含み、第２のビット深度は第１のビット深度よりも小さく、訓練された機械学習モデルに生成された入力を提供することは、訓練された機械学習モデルへの入力として量子化入力画像を提供することを含む。一実施形態では、変換された入力画像を量子化することは、変換された入力画像のピクセル強度に全射マッピングを適用することを含み、全射マッピングは、第２のビット深度のピクセル強度に第１のビット深度のピクセル強度をマッピングする。

一実施形態では、第２のビット深度は第１のピクセル強度および第２のピクセル強度を含み、第１のピクセル強度は第２のピクセル強度よりも小さい。

入力画像を量子化することは、第２のピクセル強度よりも少ない数の第１のビット深度のピクセル強度を第１のピクセル強度にマッピングすることを含む。

以下の発明を実施するための形態がより良く理解され得るように、かつ当技術分野に対する本寄与がより良く諒解され得るように、開示された主題の特徴がかなり大まかに概説されている。当然、以下に記載され、本明細書に添付された特許請求の範囲の主題を形成する開示された主題のさらなる特徴が存在する。本明細書で使用される述語および用語は、説明目的のためであり、限定するものと見なされるべきでないことを理解されたい。

本出願の様々な態様および実施形態が以下の図を参照して記載される。図は必ずしも縮尺通りに描かれていないことを諒解されたい。複数の図に現れる項目は、それらが現れるすべての図において同じ参照番号によって示されている。

本明細書に記載された本発明のいくつかの実施形態による、本明細書に記載された技法が実装され得る例示的なシステムのブロック図である。本明細書に記載された本発明のいくつかの実施形態による、画像を処理するための例示的なプロセスのフローチャートである。本明細書に記載された本発明のいくつかの実施形態による、画像を量子化するための例示的なプロセスのフローチャートである。本明細書に記載された本発明のいくつかの実施形態による、画像を逆量子化するための例示的なプロセスのフローチャートである。本明細書に記載された本発明のいくつかの実施形態による、画像を強調するための例示的なプロセスのフローチャートである。本明細書に記載された本発明のいくつかの実施形態による、機械学習モデルを訓練するための例示的なシステムのブロック図である。本明細書に記載された本発明のいくつかの実施形態による、画像強調のための機械学習モデルを訓練するための例示的なプロセスのフローチャートである。いくつかの実施形態による、ピクセル強度の線形量子化を示すプロットである。いくつかの実施形態による、対数関数を使用するピクセル強度の非線形量子化を示すプロットである。いくつかの実施形態による、指数関数を使用するピクセル強度の非線形量子化を示すプロットである。いくつかの実施形態による、非線形変換の適用からのノイズ特性分散の減少を示すプロットである。本明細書に記載された本発明のいくつかの実施形態を実装するために使用され得る例示的なコンピューティングデバイスのブロック図である。

次に図面に目を向けると、本発明の実施形態によるノイズ除去および画像処理のための非線形画像強度変換用のシステムおよび方法が記載されている。（たとえば、画像センサを使用して）画像キャプチャデバイスによって取り込まれた画像は、コンピューティングデバイス（たとえば、プロセッサ）が扱うように装備しているよりも高いダイナミックレンジによって表される場合がある。たとえば、ＣＭＯＳ画像センサを使用して取り込まれた画像は、１４ビット深度のピクセルを有する場合があるが、低電力のデジタル信号プロセッサ（ＤＳＰ）、ニューラル処理装置（ＮＰＵ）などは、８ビット深度のピクセルを有する画像を処理することに限定される場合がある。ＤＳＰ、ＮＰＵなどは、８ビット入力に限定される場合があり、かつ／または８ビット演算を実行するように構成される場合がある。従来のシステムは、コンピューティングデバイスによる処理向けに画像のビット深度を低減するために、画像に線形量子化を適用することができる。しかしながら、画像のそのような量子化は、しばしば、処理される画像の情報損失、したがって画像品質の低下につながる可能性がある。

本発明の多くの実施形態は、輝度と人間の視覚との間に非線形関係が存在し得ることを認識する。たとえば、デジタル画像を視ている人間は、通常、高輝度（たとえば、高いピクセル強度）での変化よりも低輝度（たとえば、低いピクセル強度）でのピクセルまたはピクセル領域の絶対強度の変化に敏感である。したがって、本明細書に記載されるのは、量子化画像データに対して動作する画像処理からもたらされる知覚画像品質の損失を軽減することができる、非線形画像強度変換および／または量子化の技法である。本明細書に記載される技法は、画像品質の損失が低い変換された画像を取得するために、輝度と人間の視覚との間の非線形関係を活用する。いくつかの実装形態は、低いピクセル強度の間の相違点を最小化しながら画像のビット深度を低減するために、画像に非線形変換を適用し、画像を量子化する。

ノイズ特性は、画像内のピクセル強度によって異なる場合がある。たとえば、ノイズの標準偏差は、ピクセル強度によって異なる場合がある。本発明のいくつかの実施形態は、画像強調（たとえば、ノイズ除去）向けに訓練された機械学習モデルの複雑度が、強調されるべき画像がピクセル強度にわたるノイズ特性の高い分散（たとえば、標準偏差）を有するときに増大することを認識する。たとえば、（たとえば、画像をノイズ除去することによって）画像を強調するように訓練されているニューラルネットワークモデルは、ピクセル強度にわたるノイズ標準偏差の高い分散を有するとき、複数のノイズレベルからなる必要があるので、より多くのレイヤ、チャネル、したがって重みを必要とする場合がある。機械学習モデルの複雑度が増大するにつれて、コンピューティングデバイスは画像を強調（たとえば、ノイズ除去）するためにより多くの計算、メモリ、および電力を必要とする場合があるので、機械学習モデルを使用するコンピューティングデバイスの効率は減少する。たとえば、ノイズ除去向けに訓練されたニューラルネットワークを実行することによって画像を強調するニューラルプロセッサは、コンピューティングデバイスが画像をノイズ除去するために画像ピクセル当たりより多くの計算、メモリ、および電力を必要とする場合があるために、ニューラルネットワークのレイヤの数が増大するにつれて効率的でなくなる。

したがって、本明細書に記載されたいくつかの技法は、ピクセル強度にわたる画像内のノイズ特性分散を減少させるために、画像のピクセル強度に非線形変換を適用する。ピクセル強度にわたるノイズ特性分散の低下は、画像を強調するために必要な機械学習モデルがより小さい範囲のノイズレベルをノイズ除去することが必要とされるので、モデルの複雑度を低減することができる。このように、機械学習モデルを使用するコンピューティングデバイスは、より効率的に画像を処理することができる。いくつかの実施形態は、画像の量子化または再量子化と連携して、画像のピクセル強度に非線形変換を適用する。いくつかの実施形態は、画像を量子化せずに、画像のピクセル強度に非線形変換を適用する。

本発明のさらなる実施形態では、本明細書に記載された技法などの技法によって準備された１つまたは複数の画像は、機械学習モデル用の訓練データとして使用することができるか、または強調されるべき入力データとして訓練された機械学習モデルに提供することができる。画像を強調し、機械学習モデルを訓練するためのシステムおよび方法は、Ｓｈｅｎらの米国特許公開第２０２０／００５１２１７号（出願整理番号１６／６３４，４２４）（’２１７公開）に開示され、その関連する部分は、それらの全体が参照により本明細書に組み込まれ、そのコピーが付録Ａとして同封されている。

以下の説明では、開示された主題を完全に理解するために、開示された主題のシステムおよび方法、ならびにそのようなシステムおよび方法が動作することができる環境などに関して、多くの具体的な詳細が記載されている。本明細書に記載されたいくつかの実施形態は、従来の画像処理技法に伴う上述された問題に対処する。しかしながら、本明細書に記載されたあらゆる実施形態がこれらの問題のすべてに対処するとは限らないことを諒解されたい。本明細書に記載された本発明の実施形態は、従来の画像処理技法の上述された問題に対処する以外の目的に使用されてもよいことも諒解されたい。加えて、以下に提供される例は例示的であり、開示された主題の範囲内にある他のシステムおよび方法が存在すると考えられることが理解されよう。

画像処理システム
図１は、いくつかの実施形態による、本明細書に記載された技法が実装され得るシステム１００のブロック図を示す。図１に示されたように、システム１００は、（本明細書では「システム１０２」とも呼ばれる）画像前処理システム１０２と、画像キャプチャデバイス１０４と、画像処理システム１０６とを含む。いくつかの実施形態では、画像前処理システム１０２は、’２１７公開（付録Ａ）の図１Ａ～図１Ｂの画像強調システム１１１の構成要素であってもよい。

図１の例に示されたように、画像前処理システム１０２は、画像キャプチャデバイス１０４および画像処理システム１０６と通信している。いくつかの実施形態では、画像前処理システム１０２は、画像キャプチャデバイス１０４からデータを受信するように構成することができる。データは、画像キャプチャデバイス１０４によって取り込まれた１つまたは複数のデジタル画像を含んでもよい。たとえば、画像前処理システム１０２は、（たとえば、画像処理システム１０６による）さらなる画像処理を受けるべき画像を画像キャプチャデバイス１０４から取得することができる。いくつかの実施形態では、画像前処理システム１０２は、（１）画像キャプチャデバイス１０４から画像を取得し、（２）画像を非線形変換および／または量子化し、（３）さらなる処理（たとえば、強調）のために画像処理システム１０６に変換および／または量子化画像を提供するように構成されてもよい。画像量子化は、（１）画像処理システム１０６から処理された画像を取得し、（２）処理された画像を逆変換および／または逆量子化し、（３）画像キャプチャデバイス１０４に逆量子化／逆変換された処理された画像を提供するように構成されてもよい。いくつかの実施形態では、画像前処理システム１０２は、図１２に関して下記でさらに記載される構成要素などの構成要素を有する専用コンピューティグシステムまたはサブシステムである。

図１に示されたように、画像前処理システム１０２は、非線形変換１０２Ａを含むことができる。非線形変換は、本明細書では「非線形マッピング」と呼ばれる場合もあり、たとえば、実行されると、本明細書に記載された１つまたは複数のプロセスを実行するようにプロセッサに指示する、ファームウェアまたはメモリ（揮発性もしくは不揮発性）内のプロセッサ命令として実装されてもよい。画像前処理システム１０２は、（量子化なしに）画像を前処理するため、かつ／または取得された画像を量子化することと連携して、非線形変換１０２Ａを使用することができる。いくつかの実施形態では、非線形変換１０２Ａは、入力としてピクセル強度値を取り込み、対応する変換された値を出力する連続非線形関数を含んでもよい。たとえば、非線形変換１０２Ａは、入力として１０ビットピクセル強度を取り込み、０～１の対応する値を出力する非線形関数であってもよい。いくつかの実施形態では、非線形変換１０２Ａは区分関数であってもよい。いくつかの実施形態では、非線形変換１０２Ａは、非線形である１つまたは複数の部分に加えて線形である１つまたは複数の部分を含んでもよい。たとえば、非線形変換１０２Ａは、第１の範囲のピクセル強度に対する出力が線形であり、第２の範囲のピクセル強度に対する出力が非線形である区分関数であってもよい。

いくつかの実施形態では、非線形変換１０２Ａは対数関数を含んでもよい。いくつかの実施形態では、非線形変換は指数関数を含んでもよい。いくつかの実施形態では、非線形変換は、（線形関数および／または非線形関数の両方の組合せを含む）複数の関数の組合せを含んでもよい。非線形変換１０２Ａに含まれ得る非線形関数の例が本明細書に記載され、それらは例示的であり限定するものではない。したがって、いくつかの実施形態は、本明細書に記載された非線形関数に限定されない。

画像前処理システム１０２によって取得される画像は、第１のビット深度（たとえば、１０ビット深度、１２ビット深度、１４ビット深度、または１６ビット深度）、すなわち、値を表す情報のビット数のピクセル値を有することができる。当業者は、ピクセル値が１つまたは複数の成分を有する場合があり、異なる成分が、明度、輝度、彩度、および／または色チャネル（たとえば、青、赤、緑）などの、特定のピクセルの異なる特性の強度を表すことを認識されよう。

画像前処理システム１０２は、第２のビット深度（たとえば、５ビット深度、６ビット深度、７ビット深度、または８ビット深度）のピクセル値を有する量子化画像を取得するために、画像を量子化するように構成されてもよく、第２のビット深度は第１のビット深度よりも小さい。画像前処理システム１０２は、（たとえば、画像処理システム１０６が、第１のビット深度のピクセルを有する画像を処理することができない場合）画像処理システム１０６に量子化画像を提供することができる。いくつかの実施形態では、画像前処理システム１０２は、（１）変換された画像を取得するために画像のピクセル強度に非線形変換１０２Ａを適用し、（２）量子化入力画像を取得するために変換された入力画像のピクセル強度に全射マッピングを適用することによって画像を量子化するように構成することができ、全射マッピングは第２のビット深度のピクセル強度に第１のビット深度のピクセル強度をマッピングする。全射マッピングの例が以下にさらに記載される。全射マッピングは、数学の全射関数、その像がその変域に等しい関数として定義することができる。以下にさらに記載される実施形態などのいくつかの実施形態では、非線形変換は次の量子化なしに適用される。

いくつかの実施形態では、画像前処理システム１０２は、全射マッピングとともに画像に非線形変換を適用するように構成されてもよく、その結果、量子化画像内の低いピクセル強度の間の相違点は、高いピクセル強度の間の相違点よりも大きい。非線形変換を適用する際に、画像前処理システム１０２は、低いピクセル強度の間の相違点を維持するために、第２のビット深度の範囲のより大きい部分を高いピクセル強度よりも低いピクセル強度に専用に割り当てることができる。たとえば、システムは、（１）入力画像内の０～２００のピクセル強度を量子化画像内の０～２５のピクセル強度にマッピングし、（２）入力画像内の２０１～１０３１のピクセル強度を量子化画像内の２６～３１のピクセル強度にマッピングすることにより、（たとえば、０～３１のピクセル強度を有する）５ビット深度のピクセルを有する量子化画像を取得するために１０ビット深度のピクセルを有する（たとえば、０～１０２３のピクセル強度を有する）入力画像を量子化することができる。この例では、量子化画像内の３０のピクセル強度は、５のピクセル強度よりも多い入力画像のピクセル強度にマッピングされてもよい。したがって、量子化画像は、入力画像内の低いピクセル強度の間のより多くの相違点を維持することができる。

いくつかの実施形態では、画像前処理システム１０２は、画像処理システム１０６から処理された画像を取得するように構成されてもよい。たとえば、処理された画像は、画像キャプチャデバイス１０４によって画像量子化システムに提供された画像の強調バージョンであってもよい。画像前処理システム１０２は、以前に入力画像を受信し、画像処理システム１０６による処理のために入力画像を量子化している場合がある。画像前処理システム１０２は、（１）処理された画像を逆量子化し、（２）画像キャプチャデバイス１０４に逆量子化画像を送信するように構成されてもよい。いくつかの実施形態では、画像前処理システム１０２は、（１）処理された画像のビット深度を第１のビット深度から第２のビット深度まで増大させ、（２）第２のビット深度のピクセルを有する画像に非線形変換を適用することにより、処理された画像を逆量子化するように構成されてもよい。いくつかの実施形態では、この非線形変換は、（処理するために画像キャプチャデバイス１０４によって提供された）入力画像に適用された非線形変換のインバースであり得る。

いくつかの実施形態では、画像前処理システム１０２は、画像を量子化せずに、変換された画像を取得するために画像のピクセル強度に非線形変換１０２Ａを適用するように構成することができる（たとえば、その結果、元の画像と同じビット深度による画像処理に非線形変換された画像が使用される）。いくつかの実施形態では、画像前処理システム１０２は、（たとえば、画像処理システム１０６が入力画像のビット深度を処理することができる場合）入力画像のビット深度を低減せずに、入力画像に非線形変換１０２Ａを適用するように構成されてもよい。いくつかの実施形態では、画像前処理システム１０２は、入力画像に非線形変換１０２Ａを適用することにより、入力画像のピクセル強度にわたるノイズ特性の分散を減少させるように構成されてもよい。画像前処理システム１０２は、ノイズの分散が低い変換された画像を画像処理システム１０６に送信することができる。たとえば、画像前処理システム１０２は、すべてのピクセル強度に対してしきい値を下回るノイズ特性分散を有する画像を強調（たとえば、ノイズ除去）するように訓練された機械学習モデル（たとえば、ニューラルネットワーク）を使用する画像処理システム１０６のプロセッサ（たとえば、ニューラルプロセッサ）に、変換された画像を提供することができる。たとえば、機械学習モデルは、すべてのピクセル強度に対してダイナミックレンジの１％、２％、３％、４％、５％、６％、７％、８％、９％、または１０％未満であるノイズの標準偏差を有する画像を強調するように訓練されてもよい。入力画像内のノイズ特性の分散が減少すると、複雑度が低い機械学習モデル（たとえば、レイヤが少ないニューラルネットワーク）を画像処理システム１０６が使用することが可能になる。

いくつかの実施形態では、画像前処理システム１０２は、（たとえば、画像が画像処理システム１０６による処理の前に量子化されなかった場合）画像を逆量子化せずに、画像に非線形変換を適用することができる。いくつかの実施形態では、この非線形変換は、（たとえば、処理するために画像キャプチャデバイス１０４によって提供された）入力画像に適用された非線形変換のインバースであり得る。たとえば、システムは、以前に入力画像に非線形変換１０２Ａを適用し、画像処理システム１０６に変換された画像を提供している場合がある。次いで、システムは、画像処理システム１０６から画像の処理されたバージョンを取得し、（たとえば、非線形変換１０２Ａのインバースを適用することにより）処理された画像に非線形変換を適用することができる。

いくつかの実施形態では、画像キャプチャデバイス１０４は、デジタルカメラであってもよい。デジタルカメラは、スタンドアロンのデジタルカメラであってもよく、デバイス（たとえば、スマートフォン）に組み込まれたデジタルカメラであってもよい。いくつかの実施形態では、画像キャプチャデバイス１０４は、デジタル画像を取り込むことができる任意のデバイスであってもよい。いくつかの実施形態は、本明細書に記載されたいかなる画像キャプチャデバイスにも限定されない。

図１に示されたように、画像キャプチャデバイス１０４は、画像センサ１０４と、Ａ／Ｄコンバータ１０４Ｂとを含む。いくつかの実施形態では、画像センサ１０４Ａは、画像センサ１０４Ａによって検知された電磁放射（たとえば、光波）に基づいて信号を生成するように構成されてもよい。たとえば、撮像センサ１２４は、光を取り込む相補型金属酸化膜半導体（ＣＭＯＳ）シリコンセンサであってもよい。センサ１２４は、入射光量子を電子に変換する複数のピクセルを有してもよく、電子は次に電気信号を生成する。別の例では、撮像センサ１２４は、電荷結合素子（ＣＣＤ）センサであってもよい。いくつかの実施形態は、本明細書に記載されたいかなる撮像センサにも限定されない。

図１に示されたように、画像キャプチャデバイス１０４は、アナログデジタルコンバータ（Ａ／Ｄコンバータ）１０４Ｂを含むことができる。Ａ／Ｄコンバータ１０４Ｂは、画像センサ１０４Ａから受信されたアナログ電気信号をデジタル値に変換するように構成されてもよい。デジタル値は、画像キャプチャデバイス１０４によって取り込まれた画像のピクセル強度であってもよい。画像キャプチャデバイス１０４は、画像前処理システム１０２に画像を送信することができる。いくつかの実施形態では、画像キャプチャデバイス１０４は、限定はしないが、６ビット深度、７ビット深度、８ビット深度、９ビット深度、１０ビット深度、１１ビット深度、１２ビット深度、１３ビット深度、１４ビット深度、１５ビット深度、１６ビット深度、１７ビット深度、１８ビット深度、１９ビット深度、２０ビット深度、２１ビット深度、２２ビット深度、２３ビット深度、および／または２４ビット深度などの様々なビット深度のいずれかを有するピクセルを有するデジタル画像を生成することができる。いくつかの実施形態は、本明細書に記載されたビット深度に限定されない。

いくつかの実施形態では、画像処理システム１０６は、画像を処理するためのコンピューティングデバイスであってもよい。いくつかの実施形態では、画像処理システム１０６は、図１２に関して下記でさらに記載される構成要素などの構成要素を有する専用コンピューティグシステムまたはサブシステムである。画像処理システム１０６は、１つまたは複数のプロセッサを含んでもよい。いくつかの実施形態では、画像処理システム１０６は、デジタル信号プロセッサ（ＤＳＰ）を含んでもよい。いくつかの実施形態では、画像処理システム１０６は、ニューラルネットワークを実行するように構成されたニューラルプロセッサ（たとえば、ＮＰＵ）を含んでもよい。いくつかの実施形態では、画像処理システム１０６は、機械学習モデルを実行するように構成されたプロセッサを含んでもよい。いくつかの実施形態は、本明細書に記載されたプロセッサに限定されない。いくつかの実施形態では、画像処理システム１０６は、画像を処理する１つまたは複数の構成要素のパイプラインを含んでもよい。たとえば、画像処理システム１０６は、画像を強調するためのプロセッサと、画像の特性（たとえば、明度およびコントラスト）を修正するための１つまたは複数の構成要素とを含んでもよい。別の例では、画像処理システム１０６は、スマートフォンデバイスのデジタルカメラによって取り込まれた画像を処理するために使用されるスマートフォンデバイスの画像処理パイプラインを含んでもよい。

いくつかの実施形態では、画像処理システム１０６は、ある特定のビット深度を超えるピクセルを有する画像を処理することができない場合がある。たとえば、画像処理システム１０６のプロセッサの精度は８ビットの場合があり、したがって、プロセッサは１０ビット深度のピクセルを有する画像を処理することができない。別の例では、プロセッサは、ある特定のビット深度（たとえば、１、２、３、４、５、６、７、８、９、または１０ビット）において計算を実行するように構成されてもよい。いくつかの実施形態では、画像処理システムは、１ビット精度、２ビット精度、３ビット精度、４ビット精度、５ビット精度、６ビット精度、７ビット精度、８ビット精度、９ビット精度、または１０ビット精度を有することができる。いくつかの実施形態では、プロセッサの精度は、画像キャプチャデバイス１０４によって取り込まれたピクセルのビット深度よりも小さい場合がある。それに応じて、画像処理システム１０６は、画像前処理システム１０２から適切なビット深度を有する量子化画像を受信するように構成されてもよい。

いくつかの実施形態では、画像キャプチャデバイス１０４、画像前処理システム１０２、および画像処理システム１０６は、単一デバイスの構成要素であってもよい。１００は、画像前処理システム１０２、画像キャプチャデバイス１０４、および画像処理システム１０６を含むスマートフォンであってもよい。たとえば、画像前処理システム１０２および／または画像処理システム１０６は、（たとえば、スマートフォンに画像を記憶および／または表示する前に）スマートフォン向けの画像を処理するために、スマートフォンの画像処理パイプラインに組み込むことができる。いくつかの実施形態では、画像前処理システム１０２、画像キャプチャデバイス１０４、および画像処理システム１０６は、別個のデバイスであってもよい。たとえば、画像前処理システム１０２および画像処理システム１０６は、ネットワーク（たとえば、インターネット）を介して画像キャプチャデバイス１０４と通信するクラウドベースのコンピュータシステムであってもよい。いくつかの実施形態では、画像前処理システム１０２は、画像処理システム１０６の一部であってもよい。

画像に非線形変換を適用するためのプロセス
図２は、本明細書に記載された本発明のいくつかの実施形態による、画像を処理するための例示的なプロセス２００のフローチャートを示す。プロセス２００は、任意の適切なコンピューティングデバイスによって実行されてもよい。たとえば、プロセス２００は、図１を参照して本明細書に記載された画像前処理システム１０２またはシステム１００によって実行されてもよい。

プロセス２００は、システムが第１のビット深度のピクセルを有する入力画像を取得すること（２０２）を含む。たとえば、システムは、画像キャプチャデバイス（たとえば、デジタルカメラ）から画像を受信することができる。いくつかの実施形態では、画像キャプチャデバイスは、第１のビット深度で画像を取り込むように構成されてもよい。たとえば、画像キャプチャデバイスのＡ／Ｄコンバータは、１０ビット深度のピクセルを有するデジタル画像を作るために１０ビットピクセル強度値を生成することができる。例示的なビット深度が本明細書で説明される。

システムは、第２のビット深度のピクセルを有する量子化入力画像を取得するために入力画像を量子化し（２０４）、第２のビット深度は第１のビット深度よりも小さい。たとえば、システムは、５ビット深度のピクセルを有する量子化入力画像を生成するために、１０ビット深度のピクセルを有する入力画像を量子化することができる。いくつかの実施形態では、システムは、（１）入力画像のピクセル強度に非線形変換を適用し、（２）変換されたピクセル強度を５ビットピクセル値にマッピングすることにより、入力画像を量子化するように構成されてもよい。たとえば、入力画像の１０ビットピクセル強度ごとに、システムは、ピクセル強度に対数関数を適用し、対数関数の出力を５ビットピクセル値にマッピングすることができる。いくつかの実施形態では、非線形変換およびマッピングは単一の関数に組み合わされてもよい。

システムは、さらなる処理のために（たとえば、５ビット深度のピクセルを有する）量子化入力画像を提供する（２０６）。いくつかの実施形態では、システムは、画像を強調するために画像処理パイプラインに量子化入力画像を提供するように構成されてもよい。いくつかの実施形態では、システムは、プロセッサに入力として量子化入力画像を提供するように構成されてもよい。プロセッサは、第１のビット深度よりも小さい精度を有する場合がある。量子化入力画像は、プロセッサの精度よりも小さいかそれに等しいビット深度を有する場合がある。いくつかの実施形態では、プロセッサは、入力画像を強調するために機械学習モデルを実行するように構成されてもよい。たとえば、プロセッサは、取り込まれた画像を強調するために訓練された機械学習モデルを実行するように構成されてもよい。別の例では、プロセッサは、機械学習モデルの訓練パラメータ用の訓練データとして入力画像を使用するように構成されてもよい。いくつかの実施形態では、プロセッサは、ニューラルネットワークを実行するように構成されたニューラルプロセッサであってもよい。いくつかの実施形態では、ニューラルネットワークは、画像を強調するように訓練されてもよい。いくつかの実施形態では、ニューラルネットワークは、画像をノイズ除去することによって画像を強調するように訓練されてもよい。いくつかの実施形態では、プロセッサはデジタル信号プロセッサ（ＤＳＰ）であってもよい。いくつかの実施形態は、本明細書に記載されたプロセッサに限定されない。

システムは、第２のビット深度のピクセルを有する出力画像を生成する（２０８）。いくつかの実施形態では、システムは、処理された（たとえば、画像処理システム１０６によって処理された）画像を受信することによって出力画像を生成するように構成されてもよい。たとえば、システムは、システムが量子化入力画像を提供したプロセッサ（たとえば、ＮＰＵ）から出力画像を受信することができる。いくつかの実施形態では、出力画像は、量子化入力画像の処理されたバージョンであってもよい。たとえば、出力画像は、入力画像の強調された（たとえば、ノイズ除去された）バージョンであってもよい。

システムは、第１のビット深度のピクセルを有する逆量子化出力画像を生成するために出力画像を逆量子化する（２１０）。システムは、取得された（２０２）入力画像のピクセルと同じビット深度の逆量子化出力画像を生成するように構成されてもよい。たとえば、システムは、１０ビット深度のピクセルを有する画像を受信し（２０２）、１０ビット深度のピクセルを有する逆量子化出力画像を生成する（２１０）ことができる。いくつかの実施形態では、システムは、第２のビット深度のピクセル強度を第１のビット深度のピクセル強度にマッピングすることによって出力画像を逆量子化するように構成されてもよい。いくつかの実施形態では、システムは、第２のビット深度のピクセル強度に非線形変換（たとえば、入力画像を量子化するために使用された変換のインバース）を適用することにより、第２のビット深度のピクセル強度を第１のビット深度のピクセル強度にマッピングするように構成されてもよい。

いくつかの実施形態では、システムは、画像キャプチャデバイスに逆量子化出力画像を提供するように構成されてもよい。いくつかの実施形態では、システムは、（たとえば、取得された（２０２）入力画像の強調として）逆量子化出力画像を記憶するように構成されてもよい。いくつかの実施形態では、システムは、機械学習モデルを訓練するために出力画像を使用するように構成されてもよい。たとえば、システムは、逆量子化出力画像を目標出力画像と比較し、目標出力画像と逆量子化出力画像との間の差に基づいて、１つまたは複数の機械学習モデルパラメータを調整することができる。

画像の量子化
図３は、本発明のいくつかの実施形態による、画像を量子化するための例示的なプロセス３００のフローチャートを示す。プロセス３００は、任意の適切なコンピューティングデバイスによって実行されてもよい。たとえば、プロセス３００は、図１を参照して本明細書に記載された画像前処理システム１０２またはシステム１００によって実行されてもよい。たとえば、プロセス３００は、図２を参照して本明細書に記載されたプロセス２００の一部として実行されてもよい。たとえば、プロセス３００は、プロセス２００の量子化（２０４）において実行されてもよい。

プロセス３００は、第１のビット深度の画像を取得すること（３０２）を含む。たとえば、システムは、画像キャプチャデバイス（たとえば、デジタルカメラ）から第１のビット深度のピクセルを有する画像を取得することができる。いくつかの実施形態では、システムは、図２を参照してさらに上述されたプロセス２００において記載されたように画像を取得する（２０２）ことができる。

次に、システムは、画像のピクセル強度に非線形変換を適用する（３０４）。いくつかの実施形態では、システムは、対応する出力を取得するために非線形関数に入力値としてピクセル強度を提供することによって非線形変換を適用するように構成されてもよい。たとえば、システムは、対応する出力値を取得するために対数関数に入力値としてピクセル強度を提供することができる。別の例では、システムは、対応する出力値を取得するために指数関数に入力値としてピクセル強度を提供することができる。いくつかの実施形態では、非線形関数から取得された出力は範囲内であり得る。たとえば、非線形関数は０～１の出力を提供することができる。いくつかの実施形態は、本明細書に記載された非線形関数とは異なる非線形関数を使用することができる。いくつかの実施形態は、非線形関数のタイプに制限されない。本発明の実施形態に従って利用され得る例示的な非線形関数が図９～図１０を参照して下記に記載されるが、当業者は、必要に応じて特定の用途に様々な非線形関数が使用され得ることを認識されよう。

いくつかの実施形態では、システムは、区分関数に入力値としてピクセル強度を提供することによって非線形変換を適用するように構成されてもよい。いくつかの実施形態では、区分関数の第１の部分は非線形であってもよく、区分関数の第２の部分は線形であってもよい。たとえば、（１）０～２０のピクセル強度の場合、関数は１０ビットピクセル強度の線形関数であってもよく、（２）２０よりも大きいピクセル強度の場合、関数は非線形関数（たとえば、対数関数または指数関数）であってもよい。

プロセス３００は、第２のビット深度のピクセルを有する量子化入力画像を取得するために画像のビット深度を低減すること（３０６）を含み、第２のビット深度は第１のビット深度よりも小さい。いくつかの実施形態では、システムは、ピクセル強度への変換関数の適用から取得された（３０４）値に量子化関数を適用することにより、量子化画像を取得するために画像のビット深度を低減するように構成されてもよい。いくつかの実施形態では、量子化関数は、それぞれの入力値に対して５ビットピクセル強度値を出力することができる。たとえば、システムは、画像の１０ビットピクセル強度に非線形変換を適用することによって０～１の値を取得し、５ビットピクセル強度を取得するために量子化関数に取得された値を入力することができる。本発明の実施形態に従って利用され得る例示的な量子化関数は、図９～図１０を参照して下記に記載される。

いくつかの実施形態では、システムは、（たとえば、量子化関数を使用して取得された）第２のビット深度のピクセル強度を使用して、新しい画像を生成するように構成されてもよい。新しい画像は、このように第２のビット深度のピクセルを有する。いくつかの実施形態では、システムは、第１のビット深度のピクセル強度を第２のビット深度のピクセル強度と置き換えることにより、取得された（３０２）画像を修正するように構成されてもよい。

いくつかの実施形態では、システムは、画像処理システム（たとえば、ＤＳＰまたはニューラルプロセッサ）に入力として量子化画像を提供するように構成されてもよい。システムは、図２を参照してさらに上述されたように、量子化画像を提供する（２０６）ことができる。

画像を逆量子化するためのプロセス
図４は、本発明のいくつかの実施形態による、画像を逆量子化するための例示的なプロセス４００のフローチャートを示す。プロセス４００は、任意の適切なコンピューティングデバイスによって実行されてもよい。たとえば、プロセス４００は、図１を参照して上述された画像前処理システム１０２またはシステム１００によって実行されてもよい。たとえば、プロセス４００は、図２を参照して上述されたプロセス２００の一部として実行されてもよい。たとえば、プロセス４００は、プロセス２００の取得（２０８）において実行されてもよい。

プロセス４００は、システムが第１のビット深度（たとえば、５ビット）のピクセルを有する画像を取得すること（４０２）を含む。たとえば、システムは、画像処理システム（たとえば、ＤＳＰまたはニューラルプロセッサ）から画像を受信することができる。いくつかの実施形態では、システムは、（たとえば、プロセス２００の２０６において）画像処理システムに提供された画像の強調されたバージョンを受信するように構成されてもよい。たとえば、画像前処理システムは、（図３を参照して本明細書に記載されたプロセス３００を実行することから）量子化画像を受信し、画像を生成するために画像をノイズ除去している場合がある。システムは、画像前処理システムから生成された画像を受信することができる。

次に、システムは、取得された（４０２）画像のピクセル強度を非線形変換の出力値にマッピングする（４０４）。たとえば、入力画像を量子化する間に、システムは、０～１の正規化された値を取得するために非線形関数を適用している場合がある。この例では、システムは、０～１の正規化された値に画像のピクセル強度をマッピングすることができる。いくつかの実施形態では、システムは、量子化に使用されたマッピングを使用するように構成されてもよい。たとえば、システムは、プロセス３００において使用された量子化関数のインバースを使用することができる。

システムは、第２のビット深度のピクセルを有する逆量子化画像を取得するために、第１のビット深度よりも大きい第２のビット深度まで取得された（４０２）画像のビット深度を増大させる（４０６）。いくつかの実施形態では、システムは、第２のビット深度のピクセル強度を取得するために、（たとえば、画像を量子化する間に使用された）非線形関数のインバースを使用することにより、画像のビット深度を増大させるように構成されてもよい。たとえば、システムは、第２の深度のピクセル強度を取得するために、（たとえば、図９に示された）対数関数または（たとえば、図１０に示された）指数関数のインバースに入力値として取得された（４０４）出力値を使用することができる。

いくつかの実施形態では、システムは、（たとえば、逆非線形関数を使用して取得された）第２のビット深度のピクセル強度を使用して、新しい画像を生成するように構成されてもよい。新しい画像は、このように第２のビット深度のピクセルを有する。いくつかの実施形態では、システムは、第１のビット深度のピクセル強度を第２のビット深度のピクセル強度と置き換えることにより、取得された（４０２）画像を修正するように構成されてもよい。

いくつかの実施形態では、システムは、デバイス（たとえば、スマートフォン）に出力として逆量子化画像を提供するように構成されてもよい。たとえば、逆量子化画像は、プロセス２００において入力として提供された、強調された（たとえば、ノイズ除去された）画像であってもよい。システムは、デバイス上の表示、記憶、または別の機能のための出力として強調された画像を提供することができる。

画像を強調するためのプロセス
図５は、本発明のいくつかの実施形態による、画像を強調するための例示的なプロセス５００のフローチャートを示す。プロセス５００は、任意の適切なコンピューティングデバイスによって実行されてもよい。たとえば、プロセス５００は、図１を参照して本明細書に記載された画像前処理システム１０２および／または画像処理システム１０６によって実行されてもよい。別の例では、プロセス５００は、’２１７公開（付録Ａ）の図１Ａ～図１Ｂの画像強調システム１１１などのシステムによって実行されてもよい。

プロセス５００は、システムが強調されるべき入力画像を取得すること（５０２）を含む。いくつかの実施形態では、システムは、画像をノイズ除去するための入力を取得するように構成されてもよい。たとえば、入力画像は、画像内の低い信号対ノイズ比（ＳＮＲ）をもたらす低い光条件で取り込まれている場合がある。システムは、より高い品質の画像を生成するために、画像をノイズ除去するための入力として画像を受信することができる。いくつかの実施形態では、システムは、画像キャプチャデバイス（たとえば、カメラ）から入力画像を受信するように構成されてもよい。

システムは、変換された入力画像を取得するために入力画像のピクセル強度に非線形変換を適用する（５０４）。いくつかの実施形態では、システムは、画像を量子化せずに非線形変換を適用するように構成されてもよい。いくつかの実施形態では、システムは、（たとえば、図４を参照して本明細書に記載されたように）画像を量子化することに加えて非線形変換を適用するように構成されてもよい。いくつかの実施形態では、システムは、対応する出力を取得するために非線形関数にピクセル強度を入力することにより、入力画像のピクセル強度に非線形変換を適用するように構成されてもよい。たとえば、システムは、（たとえば、図９のプロット９０２に示されたように）対数関数にピクセル強度を入力することができる。別の例では、システムは、（たとえば、図１０のプロット１００２に示されたように）指数関数にピクセル強度を入力することができる。当業者は、必要に応じて特定の用途に、本発明の実施形態に従って様々な非線形関数のいずれかが利用され得ることを認識されよう。

いくつかの実施形態では、システムは、非線形変換の適用から取得された出力を使用して、変換された画像を生成するように構成されてもよい。いくつかの実施形態では、システムは、新しい画像を生成し、非線形変換の適用から取得された値に新しい画像のピクセル強度を設定するように構成されてもよい。たとえば、システムは、変換された画像内のそれぞれのピクセルのピクセル強度として、非線形関数への入力値として入力画像の各ピクセル強度を提供することから取得された出力を使用することができる。いくつかの実施形態では、システムは、入力画像のピクセル強度を非線形変換の適用から取得された値に修正するように構成されてもよい。

システムは、訓練された機械学習モデルに提供されるべき入力を生成する（５０６）。いくつかの実施形態では、訓練された機械学習モデルは、図１Ａ～図１Ｂを参照して記載された機械学習システム１１２などのシステムに組み込まれてもよい。いくつかの実施形態では、システムは、図８を参照して記載されたように、訓練された機械学習モデルへの入力として画像を提供する（８０４）ように構成されてもよい。

いくつかの実施形態では、システムは、入力として変換された入力画像を使用することにより、訓練された機械学習モデルに提供されるべき入力を生成するように構成されてもよい。たとえば、変換された画像のピクセル強度は、訓練された機械学習モデルへの入力として使用されてもよい。いくつかの実施形態では、訓練された機械学習モデルはニューラルネットワークであってもよい。システムは、ニューラルネットワークへの入力として変換された画像のピクセル強度を使用するように構成されてもよい。いくつかの実施形態では、システムは、ニューラルネットワークへの入力としてそれらに提供するために、ピクセル強度値を前処理するように構成されてもよい。たとえば、システムは、（たとえば、０～１になるように）ピクセル強度を正規化することができる。別の例では、システムは、画像のピクセル強度を単一ベクトルのピクセル強度に平滑化することができる。

いくつかの実施形態では、訓練される機械学習モデルは、画像をノイズ除去するように訓練されてもよい。たとえば、訓練される機械学習モデルは、より高い品質の画像を生成するために、低い光条件で取り込まれた画像の品質を向上させるように訓練されてもよい。いくつかの実施形態では、訓練される機械学習モデルは、’２１７公開（付録Ａ）の図２Ａを参照して記載されたプロセス２００、’２１７公開（付録Ａ）の図２Ｂを参照して記載されたプロセス２１０、’２１７公開（付録Ａ）の図２Ｃを参照して記載されたプロセス２３０、’２１７公開（付録Ａ）の図３Ａを参照して記載されたプロセス３００、’２１７公開（付録Ａ）の図４を参照して記載されたプロセス４００、’２１７公開（付録Ａ）の図５を参照して記載されたプロセス５００、および／または’２１７公開（付録Ａ）の図７を参照して記載されたプロセス７００を実行することから取得されている場合がある。

次に、プロセス５００はブロック５０８に進み、そこでシステムは、強調された出力画像を取得するために訓練される機械学習モデルに生成された入力を提供する。いくつかの実施形態では、システムは、’２１７公開（付録Ａ）の図８のブロック８０６に記載されたように画像を提供する。いくつかの実施形態では、システムは、入力を提供したことに応答して、強調された出力画像を受信するように構成されてもよい。たとえば、システムは、入力を提供したことに応答して、機械学習モデルからノイズ除去された画像を受信することができる。いくつかの実施形態では、システムは、逆量子化されるべき強調された画像を取得するように構成されてもよい。システムは、図２および図４を参照して上述されたように、画像を逆量子化することができる。

いくつかの実施形態では、システムは、強調された画像を出力するように構成されてもよい。たとえば、システムは、デバイスに強調された画像を表示し、画像を記憶し、かつ／または機械学習モデルを訓練するために画像を使用することができる。

図１１は、画像に非線形変換を適用することからのピクセル強度にわたるノイズ標準偏差分散の減少を示すプロットを示す。図１１に示されたように、プロット１１０２は、（たとえば、非線形変換の適用がない）線形領域内のノイズ標準偏差対ピクセル強度を示す。プロット１１０３は、（たとえば、図５を参照してブロック５０４に記載されたように）変換された画像を取得するために画像のピクセル強度に適用され得る非線形変換を示す。図１１に示されたように、非線形変換は、入力値としてピクセル強度を取り込み、０～１の値を出力する非線形指数関数を含む。プロット１１０４は、（たとえば、図５を参照して本明細書で説明されたプロセス５００のブロック５０４に記載されたように）画像のピクセル強度へのプロット１１０３の非線形変換の適用後のノイズ標準偏差対ピクセル強度を示す。プロット１１０４に示されたように、変換されたピクセル強度のノイズ標準偏差は、変換された入力画像内のピクセル強度に対して小さく変化する。画像のノイズ標準偏差対ピクセル強度における分散が低下すると、画像強調（たとえば、ノイズ除去）向けの機械学習モデルの必要な複雑度が低下する。たとえば、より低い数のレイヤおよび重みを有するニューラルネットワークが強調に使用されてもよい。機械学習モデルのより低い複雑度により、コンピューティングデバイス（たとえば、プロセッサ）が、（たとえば、より少ない計算、より小さいメモリ、および／またはより低い電力消費を使用して）より効率的に画像を強調することが可能になる。

画像を強調するように機械学習モデルを訓練するためのプロセス
図６は、いくつかの実施形態による、機械学習モデルを訓練するための例示的なシステムのブロック図を示す。図６に示されたように、画像前処理システム６０２は、訓練画像６０６を取得し、訓練画像を非線形変換する。変換された訓練画像は、次いで、訓練された機械学習モデル６１０を取得するために、機械学習モデル６０４を訓練する訓練段階６０８の間に使用される。いくつかの実施形態では、画像前処理システムは、図１～図３を参照して本明細書に記載されたように、訓練画像を非線形変換するように構成されてもよい。いくつかの実施形態では、システム６０２は、訓練画像に非線形変換を適用し、（たとえば、図１～図３を参照して記載されたようにビット深度を低減するために）訓練画像を量子化するように構成されてもよい。いくつかの実施形態では、システム６０２は、（たとえば、図４を参照して記載されたように）訓練画像を量子化せずに訓練画像に非線形変換を適用するように構成されてもよく、その結果、訓練画像のビット深度は修正されない。

いくつかの実施形態では、機械学習モデル６０４（たとえば、ニューラルネットワーク）のパラメータ６０４Ａは、学習されたパラメータ６１０Ａ（たとえば、ニューラルネットワークの重み値）を有する訓練された機械学習モデル６１０を取得するために、訓練段階６０８内で訓練されてもよい。いくつかの実施形態では、訓練された機械学習モデル６１０は、’２１７公開（付録Ａ）の図１Ａの機械学習システム１１２であってもよい。いくつかの実施形態では、訓練段階６０８は、’２１７公開（付録Ａ）の図１Ａの訓練段階１１０であってもよい。いくつかの実施形態では、機械学習モデル６０４は、’２１７公開（付録Ａ）の図２Ａを参照して記載されたプロセス２００、’２１７公開（付録Ａ）の図２Ｂを参照して記載されたプロセス２１０、’２１７公開（付録Ａ）の図２Ｃを参照して記載されたプロセス２３０、’２１７公開（付録Ａ）の図３Ａを参照して記載されたプロセス３００、’２１７公開（付録Ａ）の図４を参照して記載されたプロセス４００、’２１７公開（付録Ａ）の図５を参照して記載されたプロセス５００、および／または’２１７公開（付録Ａ）の図７を参照して記載されたプロセス７００を実行することにより、訓練段階６０８内で訓練されてもよい。

いくつかの実施形態では、画像量子化システムによって生成された量子化された訓練画像は、’２１７公開（付録Ａ）の図１Ａの訓練画像１０４として使用されてもよい。いくつかの実施形態では、機械学習モデル６０４は、’２１７公開（付録Ａ）の図１Ａの機械学習システム１０２として使用されてもよい。’２１７公開（付録Ａ）の図１Ａに示されたように、画像強調システム１１１は、（たとえば、画像前処理システム６０２によって生成された量子化画像を使用して訓練された）機械学習システム１１２を使用して、強調された画像１１８を生成するために画像キャプチャデバイス１１４Ａ～Ｂからの画像を強調することができる。

図７は、本発明のいくつかの実施形態による、画像強調のための機械学習モデルを訓練するための例示的なプロセス７００のフローチャートを示す。プロセス７００は、任意の適切なコンピューティングデバイスによって実行されてもよい。たとえば、プロセス７００は、図６を参照して本明細書に記載された画像前処理システム６０２によって実行されてもよい。別の例では、プロセス７００は、図１を参照して本明細書に記載された画像前処理システム１０２および／または画像処理システム１０６によって実行されてもよい。

プロセス７００は、システムが訓練画像を取得すること（７０２）を含む。いくつかの実施形態では、システムは、単一の画像キャプチャデバイスから訓練画像を取得するように構成されてもよい。いくつかの実施形態では、システムは、複数のキャプチャデバイスから訓練画像を取得するように構成されてもよい。いくつかの実施形態では、訓練画像は、’２１７公開（付録Ａ）に記載されたように生成されてもよい。いくつかの実施形態では、訓練画像は、入力画像および対応する目標出力画像を含んでもよい。いくつかの実施形態では、訓練画像は、対応する目標出力画像なしに入力画像のみを含んでもよい。

次に、プロセス７００はブロック７０４に進み、そこでシステムは、変換された訓練画像を取得するために画像に非線形変換を実行する。いくつかの実施形態では、システムは、第２のビット深度のピクセルを有する量子化入力画像を取得するために、非線形変換と連携して画像を量子化するように構成されてもよく、第２のビット深度は第１のビット深度よりも小さい。いくつかの実施形態では、システムは、図１～図４を参照して記載されたように、非線形変換を適用するように構成されてもよい。いくつかの実施形態では、システムは、第１のビット深度の画像を扱うことができない場合がある画像処理システム（たとえば、ＮＰＵまたはＤＳＰ）によって実行されるべき機械学習モデルを訓練するための訓練画像を量子化するように構成されてもよい。たとえば、第１のビット深度は１０ビットであってもよく、機械学習モデルを実行するべきニューラルプロセッサは、８ビットの精度を有する場合がある。

システムは、変換された訓練画像を使用して機械学習モデルを訓練する（７０６）。いくつかの実施形態では、システムは、’２１７公開（付録Ａ）に記載された訓練技法などの訓練技法を使用して機械学習モデルを訓練するように構成されてもよい。たとえば、システムは、機械学習モデル６０４は、’２１７公開（付録Ａ）の図２Ａを参照して記載されたプロセス２００を実行することにより、’２１７公開（付録Ａ）の図２Ｂを参照して記載されたプロセス２１０を実行することにより、’２１７公開（付録Ａ）の図２Ｃを参照して記載されたプロセス２３０を実行することにより、’２１７公開（付録Ａ）の図３Ａを参照して記載されたプロセス３００を実行することにより、’２１７公開（付録Ａ）の図４を参照して記載されたプロセス４００を実行することにより、’２１７公開（付録Ａ）の図５を参照して記載されたプロセス５００を実行することにより、かつ／または’２１７公開（付録Ａ）の図７を参照して記載されたプロセス７００を実行することにより、’２１７公開（付録Ａ）の図１Ａ～図１Ｂを参照して記載されたように機械学習モデルを訓練することができる。

システムは、画像を強調するために、訓練された機械学習モデルを使用する（７０８）。いくつかの実施形態では、システムは、訓練された機械学習モデルを使用して、画像をノイズ除去するように構成されてもよい。いくつかの実施形態では、システムは、図５を参照してさらに上述されたように、訓練された機械学習モデルを使用して、画像を強調するように構成されてもよい。いくつかの実施形態では、システムは、’２１７公開（付録Ａ）の図１Ａ～図１Ｂ、および／または’２１７公開（付録Ａ）の図８を参照して記載されたように、強調のために訓練された機械学習モデルを使用するように構成されてもよい。

図１～図７を参照して具体的なプロセスが上述されたが、当業者は、本発明の実施形態に従って様々なプロセスのいずれかが利用されてもよいことを認識されよう。

例示的な非線形変換
本発明の実施形態に従って異なる非線形変換または変換が利用されてもよい。図８は、線形量子化の例を示す一組のプロットを示す。図８に示されたように、プロット８０２は線形関数を示し、０～１の正規化された値を出力するために１０ビットピクセル強度が関数に入力される。プロット８０４は、０～１の値に正規化されたピクセル強度の対応する５ビットピクセル強度への線形量子化を示す。プロット８０６は、１０ビットピクセル強度が５ビットピクセル強度にどのようにマッピングすることができるかを示すプロット８０２および８０４の関数の結合を示す。プロット８０６に示されたように、１０ビットピクセル強度は５ビットピクセル強度にわたって均一に分散する。

図９は、本発明のいくつかの実施形態による、対数関数を使用する非線形量子化を示す一組のプロットを示す。プロット９０２は、入力値として１０ビットピクセル強度を受け取り、０～１の対応する値を出力する非線形対数関数を示す。プロット９０４は、０～１に正規化されたピクセル強度の対応する５ビットピクセル強度への線形量子化を示す。プロット９０６は、プロット９０２の非線形マッピングをプロット９０４の非線形量子化と結合することからもたらされた１０ビットピクセル強度の５ビットピクセル強度への非線形量子化を示す。図８のプロット８０６と対照的に、プロット９０６は、１０ビットピクセル強度と５ビットピクセル強度との間の非線形マッピングを示す。プロット９０６に示されたように、非線形量子化は、より高いピクセル強度よりもより低いピクセル強度に対してより多くの相違点を維持する。プロット９０８は、量子化された１０ビットピクセル強度が１０ビット値の間にどのように分散するかを示す。プロット９０８に示されたように、量子化された１０ビットピクセル強度と１０ビット値との間の関係はより線形であり、より低いピクセル強度の間の相違点を維持するためにより低いピクセル強度に対してより多くの粒度を有する。

図１０は、いくつかの実施形態による、指数関数を使用する非線形量子化を示す一組のプロットを示す。プロット１００２は、入力値として１０ビットピクセル強度を受け取り、対数関数を使用して０～１の対応する値を出力する非線形指数関数を示す。プロット１００４は、０～１に正規化されたピクセル強度の対応する５ビットピクセル強度への線形量子化を示す。プロット１００６は、プロット１００２の非線形関数をプロット１００４の非線形量子化と結合することからもたらされた１０ビットピクセル強度の５ビットピクセル強度への非線形量子化を示す。図８のプロット８０６と対照的に、プロット１００６は、１０ビットピクセル強度と５ビットピクセル強度との間の非線形マッピングを示す。プロット１００６に示されたように、非線形量子化は、より高いピクセル強度よりもより低いピクセル強度に対してより多くの相違点を維持する。プロット１００８は、量子化された１０ビットピクセル強度が１０ビット値の間にどのように分散するかを示す。プロット１００８に示されたように、量子化された１０ビットピクセル強度と１０ビット値との間の関係は、より低いピクセル強度の間の相違点を維持するためにより低いピクセル強度に対してより線形である。

コンピューティングシステム
システム１００、１０２、１０４、および／または１０６は、プロセッサ、揮発性および／もしくは不揮発性のメモリ、ならびに／または他の構成要素を含むことができるハードウェアを使用する、１つまたは複数のコンピューティングシステムまたは分散コンピュータシステムに実装されてもよい。図１２は、その中に本発明の実施形態の様々な態様が実装され得る、具体的に構成された分散コンピュータシステム１２００のブロック図を示す。図示されたように、分散コンピュータシステム１２００は、情報を交換する１つまたは複数のコンピュータシステムを含む。より具体的には、分散コンピュータシステム１２００は、コンピュータシステム１２０２、１２０４、および１２０６を含む。図示されたように、コンピュータシステム１２０２、１２０４、および１２０６は、通信ネットワーク１２０８によって相互接続され、通信ネットワーク１２０８を介してデータを交換することができる。ネットワーク１２０８は、それを介してコンピュータシステムがデータを交換することができる任意の通信ネットワークを含んでもよい。ネットワーク１２０８を使用してデータを交換するために、コンピュータシステム１２０２、１２０４、および１２０６ならびにネットワーク１２０８は、とりわけ、ファイバチャネル、トークンリング、イーサネット、ワイヤレスイーサネット、Ｂｌｕｅｔｏｏｔｈ、ＩＰ、ＩＰＶ６、ＴＣＰ／ＩＰ、ＵＤＰ、ＤＴＮ、ＨＴＴＰ、ＦＴＰ、ＳＮＭＰ、ＳＭＳ、ＭＭＳ、ＳＳ６、ＪＳＯＮ、ＳＯＡＰ、ＣＯＲＢＡ、ＲＥＳＴ、およびウェブサービスを含む、様々な方法、プロトコル、および規格を使用することができる。転送が安全であることを保証するために、コンピュータシステム１２０２、１２０４、および１２０６は、たとえば、ＳＳＬ技法またはＶＰＮ技法を含む様々なセキュリティ手段を使用して、ネットワーク１２０８を介してデータを送信することができる。分散コンピュータシステム１２００は、３つのネットワーク化されたコンピュータシステムを示すが、分散コンピュータシステム１２００はそのように限定されず、任意の媒体および通信プロトコルを使用してネットワーク化された任意の数のコンピュータシステムおよびコンピューティングデバイスを含んでもよい。

図１２に示されたように、コンピュータシステム１２０２は、プロセッサ１２１０と、メモリ１２１２と、相互接続要素１２１４と、インターフェース１２１６と、データ記憶要素１２１８とを含む。本明細書に開示された態様、機能、およびプロセスのうちの少なくともいくつかを実施するために、プロセッサ１２１０は、操作されたデータをもたらす一連の命令を実行する。プロセッサ１２１０は、任意のタイプのプロセッサ、マイクロプロセッサ、またはコントローラであってもよい。例示的なプロセッサには、ＩｎｔｅｌのＸｅｏｎ、Ｉｔａｎｉｕｍ、Ｃｏｒｅ、Ｃｅｌｅｒｏｎ、もしくはＰｅｎｔｉｕｍプロセッサ、ＡＭＤのＯｐｔｅｒｏｎプロセッサ、ＡｐｐｌｅのＡ１０もしくはＡ５プロセッサ、ＳｕｎのＵｌｔｒａＳＰＡＲＣプロセッサ、ＩＢＭのＰｏｗｅｒ５＋プロセッサ、ＩＢＭのメインフレームチップ、または量子コンピュータなどの市販のプロセッサが含まれてもよい。プロセッサ１２１０は、相互接続要素１２１４により、１つまたは複数のメモリデバイス１２１２を含む他のシステム構成要素に接続される。

メモリ１２１２は、コンピュータシステム１２０２の動作中にプログラム（たとえば、プロセッサ１２１０によって実行可能であるようにコード化された命令のシーケンス）およびデータを記憶する。したがって、メモリ１２１２は、ダイナミックランダムアクセスメモリ（「ＤＲＡＭ」）またはスタティックメモリ（「ＳＲＡＭ」）などの比較的高い性能の揮発性ランダムアクセスメモリであってもよい。しかしながら、メモリ１２１２は、ディスクドライブまたは他の不揮発性ストレージデバイスなどの、データを記憶するための任意のデバイスを含んでもよい。様々な例が、本明細書に開示された機能を実行するために、特殊化された、場合によっては独自の構造にメモリ１２１２を編成することができる。これらのデータ構造は、特定のデータおよび特定のタイプのデータについての値を記憶するようにサイズが決められ、編成されてもよい。

コンピュータシステム１２０２の構成要素は、相互接続メカニズム１２１４などの相互接続要素によって結合される。相互接続要素１２１４は、ＩＤＥ、ＳＣＳＩ、ＰＣＩ、およびＩｎｆｉｎｉＢａｎｄなどの専門または標準のコンピューティングバス技術に準拠する１つまたは複数の物理バスなどの、システム構成要素間の任意の通信結合を含んでもよい。相互接続要素１２１４により、コンピュータシステム１２０２のシステム構成要素間で交換されるべき命令およびデータを含む通信が可能になる。

コンピュータシステム１２０２はまた、入力デバイス、出力デバイス、および結合入力／出力デバイスなどの、１つまたは複数のインターフェースデバイス１２１６を含む。インターフェースデバイスは、入力を受け取るか、または出力を提供することができる。より詳細には、出力デバイスは外部提示用の情報をレンダリングすることができる。入力デバイスは、外部ソースからの情報を受け入れることができる。インターフェースデバイスの例には、キーボード、マウスデバイス、トラックボール、マイクロフォン、タッチスクリーン、印字デバイス、表示スクリーン、スピーカ、ネットワークインターフェースカードなどが含まれる。インターフェースデバイスにより、コンピュータシステム１２０２が、ユーザおよび他のシステムなどの外部エンティティと情報を交換し、通信することが可能になる。

データ記憶要素１２１８は、その中にプロセッサ１２１０によって実行されるプログラムまたは他のオブジェクトを定義する命令が記憶される、コンピュータ可読および書込可能で不揮発性または非一時的なデータ記憶媒体を含む。データ記憶要素１２１８はまた、媒体上または媒体内に記録され、プログラムの実行中にプロセッサ１２１０によって処理される情報を含んでもよい。より具体的には、情報は、記憶空間を節約するか、またはデータ交換性能を向上させるように具体的に構成された１つまたは複数のデータ構造に記憶されてもよい。命令は符号化信号として永続的に記憶されてもよく、命令は、本明細書に記載された機能のいずれかをプロセッサ１２１０に実行させることができる。媒体は、たとえば、とりわけ、光ディスク、磁気ディスク、またはフラッシュメモリであってもよい。動作中、プロセッサ１２１０または何らかの他のコントローラは、データが不揮発性記録媒体から、データ記憶要素１２１８に含まれる記憶媒体よりもプロセッサ１２１０による情報への高速なアクセスを可能にする、メモリ１２１２などの別のメモリに読み取られるようにする。メモリは、データ記憶要素１２１８またはメモリ１２１２内に位置してもよいが、プロセッサ１２１０は、メモリ内でデータを操作し、次いで、処理が完了した後にデータ記憶要素１２１８に関連付けられた記憶媒体にデータをコピーする。様々な構成要素は、記憶媒体と他のメモリ要素との間のデータ移動を管理することができ、例は特定のデータ管理構成要素に限定されない。さらに、例は、特定のメモリシステムまたはデータ記憶システムに限定されない。

コンピュータシステム１２０２は、例として、そこで様々な態様および機能が実践され得る１つのタイプのコンピュータシステムとして示されているが、態様および機能は、図１２に示されたようにコンピュータシステム１２０２に実装されることに限定されない。様々な態様および機能は、図１２に示されたものとは異なるアーキテクチャまたは構成要素を有する１つまたは複数のコンピュータ上で実践されてもよい。たとえば、コンピュータシステム１２０２は、本明細書に開示された特定の動作を実行するように適応した、特定用途向け集積回路（「ＡＳＩＣ」）などの特別にプログラムされた専用ハードウェアを含んでもよい。その上、ＭｏｔｏｒｏｌａＰｏｗｅｒＰＣプロセッサを用いてＭＡＣＯＳＳｙｓｔｅｍＸを実行するいくつかの汎用コンピューティングデバイス、ならびに専用のハードウェアおよびオペレーティングシステムを実行するいくつかの専用コンピューティングデバイスのグリッドを使用して、別の例が同じ機能を実行することができる。

コンピュータシステム１２０２は、コンピュータシステム１２０２に含まれるハードウェア要素の少なくとも一部分を管理するオペレーティングシステムを含むコンピュータシステムであってもよい。いくつかの例では、プロセッサ１２１０などのプロセッサまたはコントローラがオペレーティングシステムを実行する。実行され得る特定のオペレーティングシステムの例には、ＭｉｃｒｏｓｏｆｔＣｏｒｐｏｒａｔｉｏｎから入手可能なＷｉｎｄｏｗｓＮＴ、Ｗｉｎｄｏｗｓ２０００（ＷｉｎｄｏｗｓＭＥ）、ＷｉｎｄｏｗｓＸＰ、ＷｉｎｄｏｗｓＶｉｓｔａ、またはＷｉｎｄｏｗｓ６、８、もしくは６オペレーティングシステムなどのＷｉｎｄｏｗｓベースのオペレーティングシステム、ＡｐｐｌｅＣｏｍｐｕｔｅｒから入手可能なＭＡＣＯＳＳｙｓｔｅｍＸオペレーティングシステムまたはｉＯＳオペレーティングシステム、多くのＬｉｎｕｘベースのオペレーティングシステムディストリビューションのうちの１つ、たとえば、ＲｅｄＨａｔＩｎｃ．から入手可能なＥｎｔｅｒｐｒｉｓｅＬｉｎｕｘオペレーティングシステム、ＯｒａｃｌｅＣｏｒｐｏｒａｔｉｏｎから入手可能なＳｏｌａｒｉｓオペレーティングシステム、あるいは様々なソースから入手可能なＵＮＩＸオペレーティングシステムが含まれる。多くの他のオペレーティングシステムが使用されてもよく、例はいかなる特定のオペレーティングシステムにも限定されない。

プロセッサ１２１０およびオペレーティングシステムは一緒に、高水準プラグラミング言語のアプリケーションプログラムが書かれたコンピュータプラットフォームを定義する。これらのコンポーネントアプリケーションは、通信プロトコル、たとえばＴＣＰ／ＩＰを使用して通信ネットワーク、たとえばインターネットを介して通信する、実行可能な中間バイトコードまたは解釈されたコードであってもよい。同様に、態様は、．Ｎｅｔ、Ｊａｖａ、Ｃ＋＋、Ａｄａ、Ｃ＃（Ｃ－Ｓｈａｒｐ）、Ｐｙｔｈｏｎ、またはＪａｖａＳｃｒｉｐｔなどの、オブジェクト指向プログラミング言語を使用して実装されてもよい。他のオブジェクト指向プログラミング言語も使用されてもよい。あるいは、関数型、スクリプト、または論理型のプログラミング言語が使用されてもよい。

さらに、様々な態様および機能が非プログラム化環境内に実装されてもよい。たとえば、ＨＴＭＬ、ＸＭＬ、または他のフォーマットで作成された文書は、ブラウザプログラムのウィンドウで見ると、グラフィカルユーザインターフェースの態様をレンダリングするか、または他の機能を実行することができる。さらに、様々な例は、プログラム化要素もしくは非プログラム化要素、またはそれらの任意の組合せとして実装されてもよい。たとえば、ウェブページはＨＴＭＬを使用して実装されてもよいが、ウェブページ内から呼び出されるデータオブジェクトはＣ＋＋で書かれてもよい。このように、例は具体的なプログラミング言語に限定されず、任意の適切なプログラミング言語が使用される可能性がある。したがって、本明細書に開示された機能構成要素は、本明細書に開示された機能を実行するように構成された多種多様の要素（たとえば、専用ハードウェア、実行可能コード、データ構造、またはオブジェクト）を含んでもよい。

いくつかの例では、本明細書に開示された構成要素は、構成要素によって実行される機能に影響を及ぼすパラメータを読み取ることができる。これらのパラメータは、（ＲＡＭなどの）揮発性メモリまたは（磁気ハードドライブなどの）不揮発性メモリを含む、任意の形態の適切なメモリに物理的に記憶されてもよい。加えて、パラメータは、（ユーザ空間アプリケーションによって定義されたデータベースもしくはファイルなどの）専用のデータ構造、または（オペレーティングシステムによって定義されたアプリケーションレジストリなどの）通常共有されるデータ構造に論理的に記憶されてもよい。加えて、いくつかの例は、外部エンティティがパラメータを修正し、それによって構成要素の挙動を構成することを可能にする、システムとユーザインターフェースの両方を実現する。

前述の開示に基づいて、本明細書に開示された実施形態が特定のコンピュータシステムプラットフォーム、プロセッサ、オペレーティングシステム、ネットワーク、または通信プロトコルに限定されないことは、当業者には明らかなはずである。また、本明細書に開示された実施形態が特定のアーキテクチャに限定されことは明らかなはずである。

本明細書に記載された方法および装置の実施形態は、以下の説明に記載され、添付図面に示された構成要素の構築および配置の詳細への適用において限定されないことを諒解されたい。方法および装置は、他の実施形態における実装、および様々な方法で実践または遂行されることが可能である。特定の実装形態の例は、例示目的のみで本明細書において提供され、限定するものではない。詳細には、任意の１つまたは複数の実施形態とともに記載された行為、要素、および特徴は、任意の他の実施形態における同様の役割から排除されるものではない。

「おおよそ」、「実質的に」、および「約」という用語は、いくつかの実施形態では目標値の±２０％以内、いくつかの実施形態では目標値の±１０％以内、いくつかの実施形態では目標値の±５％以内、さらにいくつかの実施形態では目標値の±２％以内を意味するように使用されてもよい。「おおよそ」および「約」という用語は、目標値を含んでもよい。

本発明の少なくとも１つの実施形態のいくつかの態様をこのように記載すると、当業者には様々な変更、修正、および改善が容易に思いつくことを諒解されたい。そのような変更、修正、および改善は、本開示の一部であることが意図され、本発明の趣旨および範囲内であることが意図される。したがって、前述の説明および図面はほんの一例である。

附属書Ａ

Claims

画像を処理するコンピュータ実装方法であって、前記方法が、
少なくとも１つのプロセッサを使用して、
第１のビット深度のピクセル強度値を有するピクセルを含む入力画像を取得することと、
第２のビット深度のピクセル強度値を含む量子化入力画像を生成するために、前記入力画像のピクセル強度値に第１の非線形変換を適用することによって少なくとも部分的に前記入力画像を量子化することであって、前記第２のビット深度が前記第１のビット深度よりも小さい、前記入力画像を量子化することと、
画像処理に前記量子化入力画像を提供することと
を実行すること
を含む、方法。
前記入力画像を量子化することが、
前記入力画像の前記ピクセル強度値に前記第１の非線形変換を適用することから、変換された入力画像を取得することと、
前記量子化入力画像を取得するために前記変換された入力画像のピクセル強度値に全射マッピングを適用することであって、前記全射マッピングが前記第２のビット深度のピクセル強度値に前記第１のビット深度のピクセル強度値をマッピングする、全射マッピングを適用することと
を含む、請求項１に記載の方法。
前記第２のビット深度が第１のピクセル強度および第２のピクセル強度を含み、前記第１のピクセル強度が前記第２のピクセル強度よりも小さく、
前記入力画像を量子化することが、前記第２のピクセル強度よりも少ない数の前記第１のビット深度のピクセル強度を前記第１のピクセル強度にマッピングすることを含む、
請求項２に記載の方法。
画像処理パイプラインから前記第２のビット深度のピクセル強度値を含む出力画像を取得することと、
前記第１のビット深度のピクセル強度値を含む逆量子化出力画像を生成するために、前記出力画像のピクセル強度値に第２の非線形変換を適用することによって少なくとも部分的に前記出力画像を逆量子化することと
をさらに含む、請求項１に記載の方法。
前記第２の非線形変換が前記第１の非線形変換のインバースを含む、請求項４に記載の方法。
画像処理パイプラインに前記量子化入力画像を提供することが、ニューラルプロセッサに前記量子化入力画像を提供することを含む、請求項１に記載の方法。
画像処理パイプラインに前記量子化入力画像を提供することが、デジタル信号プロセッサ（ＤＳＰ）に前記量子化入力画像を提供することを含む、請求項１に記載の方法。
画像処理パイプラインが、前記少なくとも１つのプロセッサよりも低い電力の１つまたは複数のプロセッサを備える、請求項１に記載の方法。
前記第１のビット深度が、１０ビット、１２ビット、１４ビット、または１６ビットである、請求項１に記載の方法。
前記第２のビット深度が８ビットである、請求項１に記載の方法。
前記第１のビット深度が、１０ビット、１２ビット、１４ビット、または１６ビットであり、
前記第２のビット深度が８ビットである、
請求項１に記載の方法。
画像処理パイプラインが、前記第２のビット深度のピクセル強度値を含む複数の量子化画像を使用して訓練された機械学習モデルを備え、
前記画像処理パイプラインに前記量子化入力画像を提供することが、強調された出力画像を取得するために前記機械学習モデルに前記量子化入力画像を提供することを含む、
請求項１に記載の方法。
画像処理システムであって、前記システムが、
画像処理アプリケーション用の命令を含む不揮発性メモリと、
少なくとも１つのプロセッサとを備え、前記プロセッサが、前記画像処理アプリケーションの実行によって、
第１のビット深度のピクセル強度値を有するピクセルを含む入力画像を取得することと、
第２のビット深度のピクセル強度値を含む量子化入力画像を生成するために、前記入力画像のピクセル強度値に第１の非線形変換を適用することによって少なくとも部分的に前記入力画像を量子化することであって、前記第２のビット深度が前記第１のビット深度よりも小さい、前記入力画像を量子化することと、
画像処理に前記量子化入力画像を提供することと、を行うように指示される、
システム。
命令を記憶する非一時的コンピュータ可読記憶媒体をさらに備え、前記命令は、少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに
第１のビット深度のピクセル強度値を有するピクセルを含む入力画像を取得することと、
第２のビット深度のピクセル強度値を含む量子化入力画像を生成するために、前記入力画像のピクセル強度値に第１の非線形変換を適用することによって少なくとも部分的に前記入力画像を量子化することであって、前記第２のビット深度が前記第１のビット深度よりも小さい、前記入力画像を量子化することと、
画像処理に前記量子化入力画像を提供することと、を行わせる、
請求項１に記載の方法。
画像強調のための機械学習モデルを訓練するコンピュータ実装方法であって、前記方法が、
少なくとも１つのプロセッサを使用して、
第１のビット深度のピクセル強度値を含む複数の画像を取得することと、
第２のビット深度のピクセル強度値を含む複数の量子化画像を生成するために、前記複数の画像のピクセル強度値に非線形変換を適用することによって少なくとも部分的に前記複数の画像を量子化することであって、前記第２のビット深度が前記第１のビット深度よりも小さい、前記複数の画像を量子化することと、
前記複数の量子化画像を使用して前記機械学習モデルを訓練することと
を実行すること
を含む、方法。
前記複数の画像が入力画像および目標出力画像を含み、前記複数の量子化画像を使用して前記機械学習モデルを訓練することが、量子化入力画像および量子化目標出力画像に教師付き学習アルゴリズムを適用することを含む、請求項１５に記載の方法。
前記機械学習モデルがニューラルネットワークを含む、請求項１５に記載の方法。
前記複数の量子化画像を使用して前記機械学習モデルを訓練することが、入力画像をノイズ除去するように前記機械学習モデルを訓練することを含む、請求項１５に記載の方法。
画像を強調するコンピュータ実装方法であって、前記方法が、
少なくとも１つのプロセッサを使用して、
強調されるべき入力画像を取得することと、
変換された入力画像を取得するために前記入力画像のピクセル強度値に非線形変換を適用することと、
前記変換された入力画像を使用して、訓練された機械学習モデルに提供されるべき入力を生成することと、
強調された出力画像を取得するために前記訓練された機械学習モデルに生成された前記入力を提供することと
を実行すること
を含む、方法。
前記入力画像が、前記入力画像の前記ピクセル強度値にわたるノイズ特性の第１の分散を有し、
前記変換された入力画像が、前記入力画像の前記ピクセル強度値にわたる前記ノイズ特性の第２の分散を有し、
前記第２の分散が前記第１の分散よりも小さい、
請求項１９に記載の方法。
前記ノイズ特性がノイズ標準偏差である、請求項２０に記載の方法。
前記訓練された機械学習モデルが、前記入力をノイズ除去するように訓練されている、請求項１９に記載の方法。
前記訓練された機械学習モデルが、ニューラルネットワークを含む、請求項１９に記載の方法。
前記訓練された機械学習モデルが、訓練データに教師付き訓練アルゴリズムを適用することによって生成される、請求項１９に記載の方法。
前記入力画像が第１のビット深度のピクセル強度値を含み、
前記変換された入力画像を使用して前記入力を生成することが、
第２のビット深度のピクセル強度値を含む量子化入力画像を取得するために前記変換された入力画像を量子化することであって、前記第２のビット深度が前記第１のビット深度よりも小さい、前記変換された入力画像を量子化すること
を含み、
前記訓練された機械学習モデルに前記生成された入力を提供することが、前記訓練された機械学習モデルへの前記入力として前記量子化入力画像を提供することを含む、
請求項１９に記載の方法。
前記変換された入力画像を量子化することが、前記変換された入力画像のピクセル強度値に全射マッピングを適用することを含み、前記全射マッピングが、前記第２のビット深度のピクセル強度値に前記第１のビット深度の前記ピクセル強度値をマッピングする、請求項２５に記載の方法。
前記第２のビット深度が第１のピクセル強度および第２のピクセル強度を含み、前記第１のピクセル強度が前記第２のピクセル強度よりも小さく、
前記入力画像を量子化することが、前記第２のピクセル強度よりも少ない数の前記第１のビット深度のピクセル強度を前記第１のピクセル強度にマッピングすることを含む、
請求項２６に記載の方法。
画像処理システムであって、前記システムが、
画像処理アプリケーション用の命令を含む不揮発性メモリと、
少なくとも１つのプロセッサとを備え、前記プロセッサが、前記画像処理アプリケーションの実行によって、
強調されるべき入力画像を取得することと、
変換された入力画像を取得するために前記入力画像のピクセル強度値に非線形変換を適用することと、
前記変換された入力画像を使用して、訓練された機械学習モデルに提供されるべき入力を生成することと、
強調された出力画像を取得するために前記訓練された機械学習モデルに生成された前記入力を提供することと
を行うように指示される
システム。
前記方法が、命令を記憶する非一時的コンピュータ可読記憶媒体をさらに備え、前記命令は、少なくとも１つのプロセッサによって実行されると、前記少なくとも１つのプロセッサに
強調されるべき入力画像を取得することと、
変換された入力画像を取得するために前記入力画像のピクセル強度値に非線形変換を適用することと、
前記変換された入力画像を使用して、訓練された機械学習モデルに提供されるべき入力を生成することと、
強調された出力画像を取得するために前記訓練された機械学習モデルに前記生成された入力を提供することと
を行わせる、請求項１９に記載の方法。