概要
本発明の目的は、組織画像を分類する改善された方法および独立請求項に記載の対応する画像分析システムを提供することである。本発明の実施形態は、従属請求項に記載されている。本発明の実施形態は、それらが互いに排他的でない場合、互いに自由に組み合されることができる。
一態様では、本発明は、組織画像を分類する方法に関する。本方法は、
-画像分析システムにより、複数のデジタル画像を受信することであって、デジタル画像のそれぞれが、患者の組織サンプルを示す、複数のデジタル画像を受信することと、
-画像分析システムにより、各受信画像を画像タイルのセットに分割することと、
-タイルのそれぞれについて、画像分析システムにより、タイルから選択的に抽出された画像特徴を含む特徴ベクトルを計算することと、
-前記入力画像の全てのタイルから抽出された特徴ベクトルに基づいて、少なくとも2つの異なるクラスのうちの1つのメンバとして任意の入力画像を分類するためのモデルを使用するように構成されたマルチインスタンス学習(MIL)プログラムを提供することと、
-タイルのそれぞれについて、(本発明の実施形態によれば本明細書では「c」と呼ばれる)確実性値を計算することであって、確実性値が、タイルが導き出された画像の分類に対するタイルの特徴ベクトルの寄与に関するモデルの確実性値を示す、計算することと、
-各画像について、
・MILプログラムにより、画像から抽出された特徴ベクトルを画像のタイルの確実性値の関数としてグローバル特徴ベクトルに集約するための確実性値ベースのプーリング関数を使用し、グローバル特徴ベクトルから集約予測値(本発明の実施形態によれば本明細書では「ah」と呼ばれる)を計算すること、または
・MILプログラムにより、画像の特徴ベクトルのそれぞれからの予測値を計算し、MILプログラムにより、画像の予測値を集約予測値(本発明の実施形態によれば本明細書では「ah」と呼ばれる)に集約するための確実性値ベースのプーリング関数を、画像のタイルの確実性値の関数として使用することと、
-MILプログラムにより、画像のそれぞれを、集約予測値に基づいて少なくとも2つの異なるクラスのうちの1つのメンバとして分類することと、を含む。
これらの特徴は、複数の理由で有益とすることができる。
マルチインスタンス学習(MIL)プログラムは、トレーニングセットから学習するように構成された弱教師あり学習プログラムの一形態であり、トレーニングインスタンスは、バッグと呼ばれるセットに配置され、バッグ内の個々のインスタンスのラベルは知られていないが、ラベルはバッグ全体に提供される。したがって、MILプログラムは、弱く注釈付けされたトレーニングデータのみを必要とする。豊富に注釈付けされたトレーニングデータを提供するための個々の画像領域の注釈付けは非常に時間がかかり、したがって高価であるため、このタイプのデータは、医療撮像において特に一般的である。さらにまた、デジタル画像が特定のクラス(例えば、健常組織を示す画像/原発腫瘍を示す画像/転移を示す画像)のメンバであることを意味する(高い予測値を有する)組織構造は、病理学者に知られていないか、または認識できないことがある。したがって、デジタル組織画像を分類するためにMILプログラムを使用することは、弱く注釈付けされたトレーニングデータが、デジタル組織画像を正確に分類することができるMILプログラムをトレーニングするのに十分であるという利点を有することができる。さらにまた、トレーニングされたMILプログラムは、例えば病理学者などの人間のアノテータが、組織のクラス所属を高度に予測する組織構造を知らず、したがって、この組織構造の有無にかかわらず組織領域の不偏比を有するトレーニング画像を選択することができない場合であっても、デジタル組織画像を正確に分類することができる。
さらにまた、確実性値ベースのプーリング機能を有するMILプログラムを使用すると、モデルの不確実性を分類に組み込む。出願人は、これにより、特に組織スライド画像が全スライド画像である場合に、特に組織スライド画像分析の領域において分類精度が大幅に改善されることを観察した。
MILプログラムが計算病理の問題を解決するために使用される場合、トレーニング画像として使用される全スライド画像(WSI)には、グローバルラベル(例えば、腫瘍細胞が生検に存在するかどうかを示す)が与えられる。次いで、トレーニング用WSIから画像タイルをサンプリングすることによってトレーニング用WSIから複数のインスタンスが抽出され、バッグにグループ化され、各バッグは、特定のトレーニング用WSIから抽出されたタイルを含み、そのスライド画像のグローバルラベルを有する。
多くの場合、例えば腫瘍が生検の小さな部分に局在する場合、インスタンス(タイル)のごく一部にWSI標識の証拠が含まれる。加えて、バッグのサイズ(トレーニング用WSI当たりのタイルの数)は、WSIの組織のサイズがフル解像度で大きい(数千以上のインスタンスのオーダー)ために非常に大きくなることがある。これらの要因は、困難なMIL設定を形成する。バッグが大きくなるにつれて、バッグ内のより大きなネガティブインスタンス集団は、陽性クラスの証拠を見つける機会がより多くなるため、バッグが誤って分類される確率が高くなる。これは、入力画像の小さな変化が非常に異なる出力を引き起こす可能性がある深層学習モデルの不安定な性質によって拡大される。このため、多くの視覚的に類似した外観のインスタンスを含む大きなバッグは、非常に異なる特徴ベクトルならびにそれらのそれぞれの予測および予測値をもたらす可能性がある。出願人は、特定のタイルに描かれた組織テクスチャおよび画像特徴に関するモデルの不確実性が考慮されるため、タイルの特徴値(または特徴ベクトルから導き出された予測値)だけでなく、確実性値も考慮することによってこの問題が大幅に改善されることを観察した。
実施形態によれば、確実性値ベースのプーリング関数は、確実性値ベースの最大プーリング、平均プーリング、またはアテンションプーリング関数である。
プーリング関数は、MILにおける重要な要素である。プーリング関数は、MILモデルのインスタンス、すなわち画像のタイルの予測がどのように組み合わせられてバッグ出力、すなわち画像の分類結果を形成するかを決定する。例えば、最大プーリング、平均プーリングおよびアテンションプーリングなど、いくつかのプーリング機能が存在する。しかしながら、出願人は、低証拠率バッグ(例えば、全インスタンス数と比較して少数の陽性インスタンス)の場合、最大プーリングを使用すると、単一の偽陽性インスタンス予測が結果として得られるバッグ予測を破壊し、偽陽性結果を生成することを観察した。一方、平均プーリングが使用される場合、バッグ内の大きな負のインスタンス集団は、正のインスタンスを覆い隠し、偽の負のバッグ予測を生成する。
学習されたアテンションMILの場合、アテンション学習は、低い証拠率の場合に大きく悪影響を受ける。大きなバッグのポーズのさらなる課題は、主要なインスタンスを選択することによるモデルの解釈性である。より大きなバッグは、潜在的にキーインスタンス選択の誤りにつながるより高い不安定性の確率を提示する。したがって、確実性値ベースのプーリング関数の使用は、デジタル組織画像、特にスライド画像全体の状況において特に有利である。
確実性値ベースのプーリング関数の使用は、現在のプーリング関数の欠点に対処し、(スライド全体の)組織画像の場合によくある、証拠率が低いバッグの場合のMILの性能不足に対処する。例えば、特徴ベクトル(またはそれから導き出された予測値)をこのインスタンスに対して計算された確実性値で加重することによって、全てのインスタンスに対するモデルの不確実性が考慮される。
デジタル組織画像の分類は、疾患に罹患した患者を特定の薬物で首尾よく処置する可能性を評価するために使用されることができる。例えば、がん患者における免疫療法の過程で使用されるいくつかの薬は、特定の免疫細胞が、がん細胞から特定の距離にて見つかる場合にのみ効果がある。この場合では、疾患の存在、および/または、その推奨する処置についてのステートメントを行うことができるようにするために、組織画像における、それらの対象、すなわち、特定の細胞タイプ、または、特定の下位および上位細胞構造を自動的に認識するための試みが行われる。本発明の実施形態は、それらがMILプログラムを利用し、したがって、特定の組織構造と特定の疾患との間の関係またはそれらの処置選択肢が明示的に知られていることを必要としない、という利点を有することができる。トレーニングされたMILプログラムをトレーニングして使用することにより、特定の疾患および/またはその処置に関する未知の予測的特徴を暗黙的に検出することが可能である。したがって、本発明の実施形態は、特定の時点で利用可能な医学的知識に限定されない。
さらなる有益な態様では、画像タイルを事例として扱うMILプログラムを使用することは、スライド組織サンプル画像全体の状況における患者関連特徴を予測するのに特に適している。これは、全体スライド組織サンプルがしばしば、そのいくらかのみが、いずれの予測値を有することができる、多くの異なる組織領域をカバーするからである。例えば、微小転移巣は、数ミリメートルのみの直径とすることができるが、スライドおよびそれぞれの全スライド画像は、数センチメートルの長さとすることができる。全体画像は、「薬Dに対する反応=真」などの特定のラベルを持って、サンプルが導き出された患者に対する経験的観察にしたがって、ラベル付けされているが、多くの免疫細胞を含み、正の反応に対して予測的である、微小転移巣の周りの組織領域はまた、数ミリメートルのみをカバーすることができる。したがって、タイルの大多数は、画像毎の、典型的には、患者毎のラベルに関して、予測的であるいずれの組織領域を含まない。MILプログラムは、インスタンスの大部分が、いずれの予測値のそれではないと推定される、データインスタンスのバッグに基づく予測的特徴を特定することに特に適している。
MILは、前記デジタル画像から導き出される全てのタイルを、同じタイルのバッグのメンバとして扱うように構成されている。
実施形態によれば、本方法は、GUIを介して、分類結果をユーザに出力することをさらに含む。追加的、または代替的に、本方法は、分類結果を別のアプリケーションプログラムに出力することを含む。例えば、MILプログラムは、分類の結果をユーザに表示するGUIを生成するように構成された画像分類アプリケーションプログラムの一部とすることができるか、またはそれと相互運用可能とすることができる。例えば、受信デジタル画像のそれぞれは、MILプログラムによって生成された分類結果にしたがって、それぞれのデジタル画像を含むクラスを示すラベルと関連付けてGUIに表示されることができる。
実施形態によれば、MILプログラムは、バイナリMILプログラムである。少なくとも2つのクラスは、「陽性クラス」と呼ばれる第1のクラスおよび「陰性クラス」と呼ばれる第2のクラスからなる。MILモデルが、この画像のタイルのうちの少なくとも1つについて、このタイルの特徴ベクトルが「陽性クラス」の証拠を含むと予測した場合、画像のいずれか1つが「陽性クラス」に分類される。MILモデルが、この画像の全てのタイルについて、それらのそれぞれの特徴ベクトルが「陽性クラス」の証拠を含まないと予測した場合、画像のいずれか1つが「陰性クラス」に分類される。例えば、十分な数のタイルが「陽性クラス」の十分な証拠を含むか否かの質問は、集約予測値が閾値を超えるか否かを判定するために、確実性値ベースのプーリング関数を使用することを含むことができる。
いくつかの実施形態では、タイルについて計算された特徴ベクトルは、1つ以上の「正の特徴値」および1つ以上の「負の特徴値」を含むことができる。「負の特徴値」は、「負のクラス」の証拠となる特徴の値である。「正の特徴値」は、「正のクラス」の証拠となる特徴の値である。この場合、MILプログラムは、画像を分類するために負および正の特徴値の双方を考慮するように構成される。
特定のクラスにおける画像の予測されたメンバシップは、クラスのメンバシップを示すクラスラベルを画像に割り当てることとして実装されることができる。特定のデジタル画像に割り当てられる「クラスラベル」は、画像が「バッグ」を表し、画像から生成されたタイルがバッグの「インスタンス」を表すため、「バッグラベル」と呼ばれることもできる。
例えば、MILプログラムは、バイナリラベルが全てのバッグに割り当てられるバイナリMILプログラムとすることができる。MILプログラムは、特定のデジタル画像のインスタンス(タイル)の少なくとも1つがラベルの証拠を含む場合、この画像が「陽性」バッグラベルを有することを学習し、予測するように構成される。全てのインスタンスが「陽性」クラスラベルの証拠を含まない場合、画像は「陰性」バッグラベルを有すると予測される。
より正式には、全てのバッグ(画像)は、インスタンスのグループ{x1,...,xK}から構成され、Kはバッグのサイズ、すなわちデジタル画像から生成されたタイルの数である。Kは、バッグ(受信デジタル画像)間で異なることができる。各バッグ(画像)には、二値のクラスラベルY∈{0,1}が関連付けられる。全てのインスタンス(タイル)jはまた、ラベルyj∈{0,1}を有するが、インスタンスラベル(タイルラベル)は、非表示であると仮定される。「0」は陰性インスタンスまたはバッグラベルを表し、「1」は陽性インスタンスまたはバッグラベルを表す。MILプログラムは、バッグラベルを計算/予測するために全てのインスタンスラベルにプーリング関数を適用することによって、バッグ(画像)のバイナリバッグラベル(クラスメンバシップ)Yを予測するように構成される。例えば、最大プーリング関数を使用する最先端のMILプログラムは、以下にしたがってバイナリバッグラベルYを計算する。Y={0,iffΣyK=0、そうでなければ1}。しかしながら、本発明の実施形態にかかるMILプログラムは、モデルの不確実性を考慮した新たなプーリング関数を使用する。
MILプログラムは、インスタンス予測(個々のタイルベースの予測)hを集約してバッグ(画像)の予測(分類結果)を作成するために適用されるプーリング関数を含む。
タイルベースの予測値に基づくアプローチI
実施形態によれば、MILプログラムは、画像のタイルについて計算された予測値を集約予測値に集約するために、確実性値ベースのプーリング関数を使用する。この方法は、MILプログラムによって、タイルのそれぞれについて、予測値のうちの1つ(本発明の実施形態によれば本明細書では「h」と呼ばれる)を計算することを含む。各予測値は、タイルから抽出された特徴ベクトルの関数として計算される。予測値は、タイルが導き出された画像の分類に対するタイルの特徴ベクトルの寄与を示すデータ値である。特定のタイルの予測値を計算するとき、MILプログラムは、好ましくは、特徴ベクトルが導き出されたタイルの特徴ベクトルのみを考慮に入れる(他のタイルの特徴ベクトルは考慮に入れない)。
実施形態によれば、確実性値ベースのプーリング関数は、確実性値ベースの最大プーリング関数である。確実性値ベースのプーリング関数の使用は、画像のそれぞれに対して、サブ方法a)またはbを含み、サブ方法a)またはbは、それぞれ、以下を含む:
-a1)各タイルの予測値(例えば「h」と呼ばれる)を、このタイルに対して計算された確実性値(例えば「c」と呼ばれる)によって加重し、それによって加重予測値(例えば「wh」と呼ばれる)を取得すること;例えば、加重は、タイルの加重予測値(wh)を計算するために、タイルのうちの1つについて計算された確実性値(c)を、その1つのタイルについて計算された予測値(h)と乗算することを含み、例えば、K個のタイルに分割された特定の画像I
mについて、K個のタイルのいずれか1つの加重予測値wh
m_kは、以下のように計算されることができる:wh
m_k=h
m_kXc
m_k、
-a2)画像の全てのタイルに対して計算された全ての加重予測値の最大値(例えば「wh
MAX」と呼ばれる)を特定すること;例えば、最大値は、以下にしたがって計算される:
および
-a3)最大加重予測値(wh
MAX(I
m))を集約予測値として使用すること;または
-b)最大確実性値(c
max)を有するタイルの予測値(h)を集約予測値として使用すること。
最大確実性値(c)を有するタイルの予測値(h)が集約予測値として使用される場合には、予測値hを選択するためにのみ、確実性値cが計算される。この場合、選択された予測値hは、画像のタイルに対して計算された確実性値に応じて集約予測値として選択されるため、確実性値によって「暗黙的に」加重されると見なされる。
次いで、集約予測値は、入力画像を分類するために使用される。例えば、whMAXがトレーニング中に決定された閾値を超える場合、デジタル画像は、「腫瘍を示す画像」として分類されることができる。そうでなければ、画像は、「健常組織を示す画像」として分類される。
確実性値ベースの最大-プーリング関数を使用することは、バッグ(画像)内の大きな陰性インスタンス(「陰性クラス」タイルラベルを有するタイル)集団が、陽性インスタンス(「陽性クラス」ラベルを有するタイル)を潜在的に覆い隠す可能性があり、偽の陰性バッグクラス予測を潜在的に形成する可能性がある場合に、MILプログラムがテストまたはトレーニング時の状況に対してよりロバストである、という利点を有することができる。
実施形態によれば、MILプログラムを提供することは、MILプログラムをトレーニング画像セット上でトレーニングすることを含み、それによって、トレーニングフェーズ中に、確実性値ベースの最大プーリング関数がプーリング関数として使用される。これは、MILのトレーニング中に生成された予測モデルが、バッグのラベルに対して最も高い予測パワーを有する特徴ベクトルを有するタイルに示された組織パターンを強く反映するという利点を有することができる。このモデルは、ラベルに対して無関係な組織領域/タイルによる悪影響を受けない。しかしながら、最大演算は、最も高くスコア付けされたタイルを除き、全てのタイルに含まれる全ての情報を無視する。したがって、関連性があり得るタイル/組織パターンの予測パワーが見逃される場合がある。
実施形態によれば、MILプログラムを提供することは、MILプログラムをトレーニング画像セット上でトレーニングすることを含み、それによって、トレーニングフェーズ中に、確実性値ベースの平均プーリング関数がプーリング関数として使用される。これは、MILプログラムにトレーニングさせる際に生成される予測モデルが、全てのタイルに描かれている組織パターンを考慮するため、有益となり得る。しかしながら、特定のラベルの発生に実際に無関係な組織パターンおよびそれぞれのタイルの考慮は、トレーニング済みMILの予測的正確さの劣化および低下をもたらす場合がある。
実施形態によれば、確実性値ベースのプーリング関数は、確実性値ベースの平均プーリング関数である。確実性値ベースのプーリング関数の使用は、画像のそれぞれについて、以下を含む:
-各タイルの予測値(例えば「h」と呼ばれる)を、このタイルに対して計算された確実性値(例えば「c」と呼ばれる)によって加重し、それによって加重予測値(例えば「wh」と呼ばれる)を取得すること;例えば、加重は、タイルの加重予測値(wh)を計算するために、タイルのうちの1つについて計算された確実性値(c)を、その1つのタイルについて計算された予測値(h)と乗算することを含む;例えば、K個のタイルに分割された特定の画像I
mについて、K個のタイルのいずれか1つの画像I
mのモデルによって生成された加重予測値wh
m_kは、以下のように計算zされることができる:wh
m_k=h
m_kXc
m_k;
-画像の全てのタイルに対して計算された全ての加重予測値whの平均(例えば「wh
MEAN」と呼ばれる)を計算すること;例えば、平均は、以下にしたがって計算される:
別の実施形態によれば、平均は、以下にしたがって計算される:
-および平均加重予測値(wh
MEAN(I
m))を集約予測値として使用すること。
確実性値ベースの平均プーリング関数を使用することは、MILプログラムが、最大オペレータベースのプーリング関数よりも、低証拠率バッグの状況で画像が「陽性クラス」のメンバであるという偽陽性予測に対してよりロバストである、という利点を有することができる。「低証拠率バッグ」は、陽性インスタンス(「陽性クラス」ラベルを有するタイル)の数が、インスタンス(タイル)の総数と比較して非常に少ないインスタンスのバッグである。最大プーリングが使用される場合、単一の偽陽性インスタンス予測は、結果として得られるバッグ予測を破壊し、偽陽性分類結果を作成する。
グローバル集約特徴ベクトルに基づくアプローチII
代替の実施形態によれば、MILプログラムは、画像のタイルから抽出された特徴ベクトルを、集約予測値を計算するために再び使用されるグローバル(「集約」)特徴ベクトルに集約するために、確実性値ベースのプーリング関数を使用する。本方法は、以下を含む:
-画像のグローバル特徴ベクトルを計算するために、画像のタイルについて計算された特徴ベクトルおよび確実性値にプーリング関数を適用することであって、グローバル特徴ベクトルの計算が、タイルの特徴ベクトルおよび確実性値を考慮に入れる、適用すること、および
-集約予測値を計算するためにグローバル特徴ベクトルを使用すること。
実施形態によれば、確実性値ベースのプーリング関数は、確実性値ベースの最大プーリング関数である。
一実施形態によれば、確実性値ベースの最大プーリング関数の使用は、画像のそれぞれについて、サブ方法c)またはd)を含み、それぞれ、
-c1)タイルのそれぞれの特徴ベクトル(例えば「fw」と呼ばれる))を、このタイルについて計算された確実性値(例えば「c」と呼ばれる)によって加重し、それによって加重特徴ベクトル(例えば「wfv」と呼ばれる)を取得すること;例えば、特徴ベクトルの特徴は、数値特徴ベクトルのみから構成されてもよい;加重は、タイルの加重特徴ベクトル(fv)を取得するために、タイルのうちの1つについて計算された確実性値(c)に、1つのタイルについて計算された特徴ベクトル(fv)内の各特徴値を乗算すること;
-c2)画像の全てのタイルについて計算された全ての加重特徴ベクトルの最大値(wfvmax)を特定すること;または
-d)最大の確実性値(cmax)を有するタイルの特徴ベクトル(fv)をグローバル特徴ベクトルとして使用すること、を含む。
例えば、サブ方法d)にかかる実施形態は、特徴ベクトルが単純な乗算によって加重することができない順序値を含む場合に使用されることができる。
他の実施形態によれば、確実性値ベースのプーリング関数は、確実性値ベースの平均プーリング関数である。確実性値ベースのプーリング関数の使用は、画像のそれぞれについて、以下を含む:
-タイルのそれぞれから抽出された特徴ベクトル(例えば「h」と呼ばれる)を、このタイルについて計算された確実性値(例えば「c」と呼ばれる)によって加重し、それによって加重特徴ベクトル(例えば「wfv」と呼ばれる)を取得すること;例えば、各特徴ベクトルは、複数の数値特徴値を含むことができ、特徴ベクトルの各数値特徴値は、特定のタイルの加重特徴ベクトルに記憶された加重特徴ベクトル値を取得するために、確実性値と乗算される;
-画像について計算された全ての加重特徴ベクトル(wfv)から平均加重特徴ベクトルを計算すること;例えば、平均加重特徴ベクトルの特徴値は、同じベクトル位置内の画像の加重特徴ベクトルに記憶された全ての加重特徴値の平均として計算されることができる;
-および、画像について計算された平均加重特徴ベクトルを、集約予測値を計算するために使用される画像のグローバル特徴ベクトルとして使用すること。
さらなる実施形態(アプローチIおよびII)
他の実施形態によれば、本方法は、画像のそれぞれについて、確実性値にソフトマックス関数を適用することによって画像について計算された確実性値を正規化することを含む。確実性値ベースのプーリング関数は、予測値を正規化された確実性値の関数として集約予測値に集約するか、または正規化された確実性値の関数として特徴ベクトルをグローバル特徴ベクトルに集約するように構成され、グローバル特徴値は、集約予測値を計算するために使用される。
ソフトマックス関数は、softargmaxまたは正規化指数関数としても知られており、K個の実数の配列、例えば画像ImのK個のタイルのそれぞれについて計算されたK個の確実性値ckを入力として取り、それを入力数の指数に比例するK個の確率からなる確率分布に正規化する関数である。すなわち、ソフトマックスを適用する前に、いくつかの配列成分は、負、または1よりも大きい可能性があり、合計が1にならない場合もあり、ソフトマックスを適用した後、各成分は、区間(0,1)内にあり、成分は合計1になるため、それらは確率として解釈されることができる。さらに、より大きな入力成分は、より大きな確率に対応する。ソフトマックスは、ネットワークの非正規化出力を、予測された出力クラスまたは範囲にわたる確率分布にマッピングする。
例えば、ソフトマックス関数は、確実性値を0から1の値の範囲の数値に正規化するために使用されることができる。確実性値を正規化するためにソフトマックス関数を使用することは、異なるタイルおよび/または異なる画像について得られた確実性値の比較可能性が増加する、という利点を有することができる。
実施形態によれば、MILプログラムは、以下の(従来の)プーリング機能の1つ以上の代わりに、確実性値ベースのプーリング機能を含み、実行するように構成される:
・画像のタイルから抽出された全ての特徴ベクトルから計算された全ての予測値hの最大値を特定して返すように構成された最大プーリング関数;例えば、特定の画像I
mに対する従来の集約予測値は、
として計算されることができる;
・画像のタイルから抽出された全ての特徴ベクトルから計算された全ての予測値hの平均を特定して返すように構成された平均プーリング関数;例えば、特定の画像I
mに対する従来の集約予測値は、
として計算されることができる;
・画像のタイルから抽出された全ての特徴ベクトルのうち、タイルが導き出された画像のクラスメンバシップに対して最も予測パワーが高いとアテンション学習技術により特定された特徴ベクトルの1つの予測値hを特定して返すアテンションプーリング機能;例えば、特定の画像I
mに対する従来の集約予測値は、
として計算されることができる。
したがって、本発明の実施形態によれば、新たな確実性に基づくプーリング関数は、(一般的にまたは選択的にトレーニングフェーズまたはテストフェーズにおいて)従来のMILプログラムで使用される従来のプーリング関数に取って代わる。本発明の実施形態にかかるMILプログラムは、(一般的にまたは選択的にトレーニングフェーズまたはテストフェーズにおいて)バッグラベルを決定する/画像分類タスクを実行するための上記の3つの従来のプーリング関数のいずれも含まないか、または使用しない。
実施形態によれば、MILプログラムは、ニューラルネットワークである。確実性値は、ニューラルネットワークのモデルのトレーニングおよび/またはテスト時にドロップアウト技術を使用して計算される。
ドロップアウトは、完全接続レイヤからいくつかのニューロンをランダムにオフにする技術である。典型的には、ドロップアウトは、トレーニング中に(のみ)適用される。ドロップアウトは、完全接続レイヤに異なる方法で同じ概念を学習させる。ドロップアウトとは、特定のレイヤの特定の割合のニューロンがランダムに非活性化(「ドロップアウト」)されることを意味する。これにより、ドロップアウトが適用されたレイヤは、相互接続されたニューロンの異なるセットで同じ「概念」を学習することを強いられるため、トレーニングされたモデルの一般化能力が向上する。したがって、ドロップアウトは、トレーニング中にニューラルネットワークのオーバーフィッティングを回避するために使用されることができる技術である。一般的に、モデル/ニューラルネットワークの学習能力が高いほど(より多くのレイヤ、またはより多くのニューロン)、モデル/NNがオーバーフィッティングする傾向がある。
各タイル予測のモデル確実性を計算するためにドロップアウト技術を使用することは、多くのニューラルネットワークアーキテクチャおよびプログラムが既に1つ以上のドロップアウトレイヤを含むため、既存のプログラムライブラリおよびソフトウェアツールがモデル不確実性の計算に使用されることができる、という利点を有することができる。さらに、出願人は、画像分析および分類タスクを実行するために使用されるニューラルネットワークが多くのレイヤことが多く、トレーニングデータセットのサイズが制限されることが多いため、デジタル病理のコンテキストで使用されるニューラルネットワークがオーバーフィッティングの問題に直面することが多いことを観察した。
実施形態によれば、トレーニングフェーズ中にドロップアウトを適用することは、完全接続レイヤノードのランダムに選択されたサブセットをそれぞれ含む多くの異なるドロップアウトレイヤを作成することを意味し、それによって各ドロップアウトレイヤは、マスク(「0」ノードおよび「1」ノードを含む)として機能する。マスクは、順伝播中に作成され、トレーニング中にレイヤ出力にそれぞれ適用され、逆伝播での将来の使用のためにキャッシュされる。レイヤに適用されたドロップアウトマスクは、逆伝播ステップ中に活性化されたニューロンを識別することができるように保存される。ここで、識別されたニューロンが選択されると、ニューロンの出力が逆伝播される。通常、ドロップアウトレイヤは、トレーニングフェーズ中にのみ作成および使用され、トレーニングされたネットワーク内の非活性化された追加のレイヤの形態で保存される。
いくつかの実施形態によれば、ドロップアウトレイヤは、トレーニング中にのみ使用される。
これは、トレーニングされたMILプログラムがトレーニングフェーズ中に既に学習して、ドロップアウトマスクを使用する多くの異なるネットワークアーキテクチャを使用して特定のタイルの特徴ベクトルについて計算された予測値の変動性を評価する、という利点を有することができる。トレーニング画像がテスト時に使用された組織画像と同様である場合、計算されたタイルベースの予測値のモデルの不確実性/変動性は、トレーニングされたMLプログラムに本質的にエンコードされ、テスト画像に示された様々な組織構造に関するモデルの不確実性を正確に反映する。
本発明のいくつかの実施形態は、完全接続レイヤドロップアウトを使用するが、他の実施形態は、さらに最大プーリングレイヤの後にドロップアウトを使用し、それによって何らかの種類の画像ノイズ増強を生成する。
テストフェーズ中、ドロップアウトレイヤは、典型的には、最先端の機械学習プログラムにおいて非活性化される。しかしながら、いくつかの実施形態によれば、ドロップアウト技術は、モデルのトレーニングおよびテスト時に使用される。例えば、ドロップアウトレイヤの作成または再活性化および適用は、多くの異なる方法で同じ概念を(トレーニング時に)学習または(テスト時に)予測することを可能にし、それによって、所与の入力に対してモデルによって生成されたモデルの不確実性および予測の多様性を評価することを可能にする。実施形態によれば、確実性値は、モンテカルロドロップアウト(MCドロップアウト)として計算される。
モンテカルロドロップアウト(MCドロップアウト)の背後にある重要な考え方は、ドロップアウトを使用してモデルの不確実性を評価することである。MCドロップアウトは、ドロップアウト技術を使用して、すなわち、同じ予測タスクについてネットワークから複数の異なる結果を得るためにニューラルネットワークアーキテクチャの異なるサブネットワークをランダムに使用することによってモデルの不確実性(したがって、暗黙的に、モデルの確実性も)を計算し、結果の「一貫性」として「確実性」を評価する。ドロップアウト処理は、ニューロンのサンプリングと同様であるため、MCは、モンテカルロ法を参照している。
例えば、本発明のいくつかの実施形態によれば、テスト時に、毎回異なるドロップアウトマスクを使用して、同じ入力が複数回、例えば数百回のランダムなドロップアウトでネットワークに提供される。次に、各タイルについて得られた複数の予測全ての平均が計算され、これらの予測全てをカバーする予測間隔または予測変動性/モデル不確実性の別の尺度が生成される。
テスト時にドロップアウトを適用することは、全体的なモデル精度を低下させるという欠点を有する可能性がある。しかしながら、組織画像分析のコンテキストでは、このステップは、モデルに不確実性を課すため、実際にはこの欠点が有益であり、オーバーフィッティングをへらすであろう、および減らすことができることが観察されている。例えば、入力データがモデルがトレーニングされたデータから遠く離れている場合、多くの異なるドロップアウトマスクを使用して同じ入力タイルに対してテスト時に得られた予測の変動性は、モデルがこのタイプのタイルをどのように解釈すべきか不明であることを示す。組織画像分析の分野では、非常に多様な健常および疾患誘発性組織構造が存在する。さらなる変動性は、多くの異なる染色プロトコル、多くの異なる染色の存在、および染色プロトコルを実行する個々の人の特徴でさえも染色された組織切片に影響を及ぼすことがあり、したがってデジタル組織画像に影響を及ぼすことがある、という事実によって誘発される。したがって、トレーニングデータセットが、健常組織構造および疾患組織構造ならびに異なる染色方法の考えられる全ての変形および組み合わせを網羅する可能性は非常に低い。したがって、MCドロップアウトを使用すると、テスト時に、タイルのそれぞれについて、この特定のタイルの特徴に基づいて画像の正しいクラスを予測するように構成されたモデルの不確実性を個々に自動的に評価することができるMILプログラムが提供される。
いくつかの実施形態によれば、多数の順方向パス実行にわたってモデルの分散を測定することを含むMCドロップアウト平均-STD(MCドロップアウト平均-標準偏差)は、特定の分類タスクに関するモデルの確実性を計算するために使用され、タイルのそれぞれの確実性値を計算するために使用される。特徴ベクトルが、バッグラベルを確実且つ正確に判定するためのモデルにとって十分および/または適切な情報を含まないタイルは、トレーニング中に低い予測値を生成する。MCドロップアウト平均-STDを計算するための例は、Yarin Galら、「Deep Bayesian Active Learning with Image Data」、2017年3月、arXiv:1703.02910v1に詳細に記載されている。
実施形態によれば、MILプログラムの確実性値ベースのプーリング関数は、画像のタイルのそれぞれについて、以下のようにMCドロップアウト平均-STDによって加重された予測値whを計算するように構成される。
画像I
mのK個のタイルのそれぞれについて、確実性値(「インスタンス確実性」とも呼ばれる)c
k_mは、テスト時におけるソフトマックスレイヤまたはシグモイドレイヤの後のMILプログラムのモデルによって計算されたMCドロップアウトに基づく平均-STDの逆数として計算される。全てのインスタンス(タイル)kの確実性の式c
k_mは、
にしたがって与えられ、ここで、σ(x
k)は、インスタンスkのMCドロップアウト平均-STDであり、εは、0による除算を妨げる小さい数である。
画像の全てのタイルの確実性値ck_mは、本発明の実施形態について上述したように、最大または平均ベースの確実性値ベースのプーリング関数を使用して集約されることができる。確実性値ベースの最大プーリング関数が使用される場合、その確実性値cによって加重されたMILプログラムのモデルによって出力として生成された最も高い予測値hを有するインスタンス(タイル)が選択される。確実性値ベースの平均プーリング関数が使用される場合、本発明の実施形態によれば、K個のタイルのそれぞれの確実性値cは、ソフトマックス関数(ネットワークのレイヤとして実装されることができる)を通過して、合計が1になる平均加重を得る。次に、確実性値cを加重として使用するインスタンス予測hの加重平均whが計算される。したがって、whkは、インスタンス(タイル)kの予測ネットワークの出力である。
本発明の実施形態は、個々のインスタンスに割り当てられた確実性値を使用してバッグインスタンスを集約する新たな確実性値ベースのプーリング機能を提供する。確実性値ベースのプーリング関数は、トレーニング中に適用されることができるが、テスト時にドロップアウトしてトレーニングされた事前トレーニングされたMILプログラムを改善するために使用されることもできる。
実施形態によれば、確実性値ベースのプーリング関数(モデルの不確実性を計算するためにドロップアウト技術を使用することができる)は、テスト時に使用されるが、モデルのトレーニング時には使用されない。
これは、本発明の実施形態によれば、画像分類方法を事前トレーニングされたMILモデルに「既製」で適用してそれらの性能を大幅に改善することができるが、トレーニング中、確実性に基づくプーリング関数は、使用されていない可能性があることを意味する。これは、MILプログラムが(ドロップアウト技術の有無にかかわらず)確実性値ベースのプーリング関数を使用せずにトレーニングされた場合であっても、画像分析方法が画像を分類するために使用されることができ、それによって既存の(しかしながら、テスト時使用のために最初は非活性化された)ドロップアウトレイヤがテスト時に特定の画像タイルの様々な予測を生成するために適用され、それによってタイル関連予測に関するモデルの確実性を評価する、という利点を有することができる。
例えば、トレーニングデータセットでトレーニングされたMILプログラムは、トレーニング時にいかなるドロップアウトレイヤも含まなくてもよく、トレーニング時に使用されるプーリング関数は、モデルの不確実性を考慮しない。例えば、トレーニング時にMILプログラムによって使用されるプーリング関数は、従来の最大プーリング関数または平均プーリング関数とすることができる。テスト時におけるタイルのいずれか1つについての確実性値の計算は、テスト時におけるトレーニングされたMILプログラムに1つ以上のドロップアウトレイヤを追加することを含む。追加されたドロップアウトレイヤがテスト時に使用されて、トレーニングされたモデルの不確実性を反映する各入力タイルの確実性値を計算することができる。
実施形態によれば、ニューラルネットワークは、1つ以上の非活性化されたドロップアウトレイヤを含む。非活性化されたドロップアウトレイヤは、トレーニング時に活性化され、トレーニングの完了時に非活性化されたドロップアウトレイヤである。テスト時におけるタイルのいずれか1つについての確実性値の計算は、テスト時において1つ以上のドロップアウトレイヤを再活性化することを含む。
実施形態によれば、テスト時におけるタイルのいずれか1つについての確実性値の計算は、テスト時において1つ以上のドロップアウトレイヤを追加または再活性化した後に、
-タイルのそれぞれについて、タイルから抽出された特徴ベクトルに基づいて予測値hdを複数回計算することであって、予測値hdが計算されるたびに、ネットワークのノードの異なるサブセットが1つ以上の再活性化または追加されたドロップアウトレイヤによってドロップされる、形成することと、
-タイルのそれぞれについて、タイルについて計算された複数の予測値hdの変動性の関数としてタイルの確実性値cを計算することであって、変動性が大きいほど、確実性値cが低い、計算することと、を含む。
これは、ネットワークの既存のドロップアウトレイヤがトレーニングフェーズの完了後に非活性化された場合、またはトレーニングフェーズ中に著しく異なるデータセットで使用された場合、またはMILプログラムとして使用されるニューラルネットワークがテスト時にドロップアウトレイヤを含まない場合、既存のレイヤの再活性化またはテスト時におけるドロップアウトレイヤの追加により、テスト時における特定の画像タイルの様々な予測を生成することが可能になり、それにより、トレーニングされたモデルのネットワークアーキテクチャが最初にこの変動を計算することを可能にしない場合であっても、タイル関連予測に関してモデルの確実性を評価する、という利点を有することができる。
例えば、MILプログラムは、テスト時に使用された組織画像とは著しく異なるデジタル組織画像でトレーニングされてもよい。例えば、トレーニング時画像およびテスト時画像は、異なる種類のがんを有する患者に由来していてもよく、または類似しているが異なる染色で染色されていてもよく、または同じ種類のがん細胞であるが異なる組織を描写していてもよい。これらの場合、トレーニングされたモデルは、テスト時に分析された組織画像および画像タイルに対して高精度の予測を提供することができない可能性がある。しかしながら、テスト時にドロップアウト技術を適用することにより、タイルから抽出された特徴ベクトルについてトレーニングされたモデルによって生成された予測値hの精度を自動的に評価し、テスト時に入力として提供された組織画像を分類するために考慮に入れることができる。
実施形態によれば、受信したデジタル画像は、画素強度値が非バイオマーカ特異的染色、特にヘマトキシリン染色またはH&E染色の量と相関する組織サンプルのデジタル画像を含む。
例えば、各タイルのバッグは、特定の薬に対するその反応が既知であるそれぞれの患者を表すことができる。この患者特有バッグに含まれるインスタンスは、この特定の患者のそれぞれの組織サンプルの1つ以上の画像から導き出されたタイルであり、組織サンプルは、H&Eなどの、非バイオマーカ特異的染料を用いて染色されている。この患者の全ての組織画像、したがって、それらから導き出された全てのタイルには、ラベル「薬Dに対する反応=真の患者」が割り当てられる。H&Eにて染色された組織画像は、染色された組織画像の最も共通する形態を表し、このタイプの染色はそれ単体で、特定の腫瘍のサブタイプまたはステージなどの患者関連属性値を予測することに使用されることができる、たくさんのデータを既に明らかにする。さらにまた、多くの病院は、過去に長年にわたって処置してきた患者から導き出された、H&Eにて染色された組織画像の大規模データベースを含む。典型的には、病院はまた、特定の患者が特定の処置に反応したか否か、および/または、疾患の進行がどれほど早いか、または、どれほど深刻であるか、に関してのデータを有する。したがって、それぞれの結果がラベル付けされることができる、トレーニング画像の多くのコーパスが利用可能である(例えば、特定の薬による処置の有効性(はい/いいえ)、1年を超えて進行のない生存期間、2年を超えて進行のない生存期間など)。
実施形態によれば、受信したデジタル画像は、それらのピクセル強度値が、バイオマーカ特異的染料の量と相関する、組織サンプルのデジタル画像を含む。バイオマーカ特異的染料は、組織サンプルに含まれるバイオマーカを選択的に染色するよう適合された染色剤である。例えば、バイオマーカは、HER-2、p53、CD3、CD8などの特定のタンパク質とすることができる。バイオマーカ特異的染料は、上記のバイオマーカに選択的に結合する抗体に結合される明視野顕微鏡または蛍光顕微鏡用の染色剤とすることができる。
追加的、または代替的に、受信デジタル画像は、ピクセル強度値がバイオマーカ特異的染色剤の量と相関する組織サンプルのデジタル画像を含み、バイオマーカ特異的染色剤は、組織サンプルに含まれるバイオマーカを選択的に染色するように適合される。
例えば、各タイルのバッグは、特定の薬に対するその反応が既知であるそれぞれの患者を表すことができる。この患者特有バッグに含まれるインスタンスは、この特定の患者のそれぞれの組織サンプルの1つ以上の画像から導き出されたタイルである。1つ以上の組織サンプルが、1つ以上のバイオマーカ特異的染料を用いて染色される。例えば、タイルは、HER2特異的染料を用いて染色された、同じ患者の隣接する組織スライドを全てが描く1つ、2つ、または3つの組織画像から導き出されることができる。別の例によれば、タイルは、HER2特異的染料を用いて染色された第1の組織サンプルを描く第1の組織画像と、p53特異的染料を用いて染色された第2の組織サンプルを描く第2の組織画像と、FAP特異的染料を用いて染色された第3の組織サンプルを描く第3の組織画像と、から導き出されることができる。第1、第2、および第3の組織サンプルは、同じ患者から導き出される。例えば、それらは、隣接する組織サンプルスライスとすることができる。これら3つの組織画像は、3つの異なるバイオマーカを描くが、全ての組織画像は、同じ患者から導き出される。したがって、それらから導き出された全てのタイルには、ラベル「薬Dに対する反応=真の患者」が割り当てられる。MILプログラムに、それらのピクセル強度値が、バイオマーカ特異的染料の量と相関するデジタル画像の画像タイルについてトレーニングさせることは、組織における1つ以上の特定のバイオマーカの存在および位置を特定することが、特定の疾患および疾患のサブ形態に関して、特異な予測的情報を高度に明らかにすることができる、という利点を有することができる。予測的情報は、2つ以上のバイオマーカの存在との、観察される、正および負の相関を含むことができる。例えば、肺がんまたは結腸がんなどのいくつかの疾患の推奨処置スキームおよび予測は、そのがんの変異性シグニチャおよび発現プロファイルに強く依存して観察される。時として、単一のマーカの発現は、それ単体では予測パワーを有しないが、複数のバイオマーカの組み合された発現、および/または、特定のさらなるバイオマーカが存在しないことは、特定の患者関連属性値に関して、高い予測パワーを有することができる。
実施形態によれば、受信したデジタル画像は、それらのピクセル強度値が、第1のバイオマーカ特異的染料の量と相関する組織サンプルのデジタル画像と、それらのピクセル強度値が、非バイオマーカ特異的染料の量と相関する組織サンプルのデジタル画像と、の組み合わせを含む。バイオマーカ特異的染料は、組織サンプルに含まれるバイオマーカを選択的に染色するよう適合された染色剤である。MILプログラムは、同じ組織サンプルを示すおよび/または同じ患者からの隣接組織サンプルを示す全てのデジタル画像を同じクラスに分類するようにトレーニングされる。
このアプローチは、組織における1つ以上の特定のバイオマーカの存在および位置を、H&E染色により明らかにされる、情報の多い組織シグニチャと組み合わせて特定することが、特定の疾患および疾患のサブ形態に関して、非常に特異な予測的情報を提供することができる、という利点を有することができる。予測的情報は、2つ以上のバイオマーカの存在との、および/または、H&E染色により視覚的に明らかにされる組織シグニチャとの、観察される、正および負の相関を含むことができる。
実施形態によれば、MILプログラムを提供することは、MILプログラムのモデルをトレーニングすることを含む。トレーニングは、
-組織サンプルのデジタルトレーニング画像のセットを提供することであって、各デジタルトレーニング画像が、少なくとも2つのクラスのうちの1つを示すクラスラベルを割り当てられている、提供すること、
-各トレーニング画像をトレーニング画像タイルに分割することであって、各トレーニングタイルが、トレーニングタイルが導き出されたデジタルトレーニング画像と同じクラスラベルを割り当てられている、分割すること、
-タイルのそれぞれについて、画像分析システムにより、タイルから選択的に抽出された画像特徴を含むトレーニング特徴ベクトルを計算すること、および/または
-損失関数の誤差が最小になるようにMILプログラムのモデルを繰り返し適応させることであって、損失関数の誤差が、トレーニングタイルの予測クラスラベルと、トレーニングタイルに実際に割り当てられたクラスラベルとの差を示し、予測クラスラベルが、トレーニングタイルの特徴ベクトルに基づいてモデルによって計算されている、適応させることを含む。
実施形態によれば、本方法は、受信されたデジタル画像のそれぞれについて、
-各タイルの予測値hを、このタイルに対して計算された確実性値cで加重し、それによって加重予測値whを取得することと、
-MILプログラムにより、最も高い加重予測値whが計算された画像のタイルのうちの1つを特定することと、
-画像の他のタイルのそれぞれについて、他のタイルの加重予測値whを最も高い加重予測値と比較することによって関連性インジケータを計算することであって、関連性インジケータが、比較された加重予測値の差と負に相関する数値である、関連性インジケータを計算することと、
-関連性インジケータの関数として画像の関連性ヒートマップを計算することであって、関連性ヒートマップのピクセル色および/またはピクセル強度が、画像内のタイルに対して計算された関連性インジケータを示す、計算することと、
-GUI上に関連性ヒートマップを表示することと、をさらに含む。
これは、病理学者が、特定のクラスの画像のメンバシップに関して最も高い予測値を有するタイルおよびその中に描かれた組織構造を識別することを可能にすることができるため、有利とすることができる。これにより、これまで生物医学文献に記載されていなかった新たな生物医学知識を生成することができる。例えば、画像クラスラベル「処置Xの恩恵を受けるであろうがん患者の組織」を高度に予測する特定の組織構造を示す1000個の画像タイルのうちの1つを出力して強調表示することによって、このタイルに示される組織構造と以前に発見および公開されていない可能性がある特定の画像クラスとの間の相関または因果関係を明らかにすることができる。さらにまた、特定の画像クラスを予測する組織構造がそのように知られている場合であっても、ヒートマップまたは最も高い予測値whを有するタイルをグラフィカルに表す任意の他の形態は、病理学者が特定の生物医学的問題に関して最も興味深い組織構造を含む1つ以上のタイルをより迅速且つより正確に識別することを可能にする、という利点を有することができる。
例えば、画像の最高得点タイルの加重予測値と非常に類似する加重予測値whを有する画像領域および各タイルは、第1の色(例えば、「赤色」)または高強度値を有する関連性ヒートマップにおいて表されることができ、画像領域および加重予測値がこの画像の全てのタイルの最高wh値と類似しない各タイルは、第1の色(例えば、「青色」)または低強度値とは異なる第2の色を有する関連性ヒートマップにおいて表されることができる。
これは、GUIが、組織領域の位置およびカバレッジ、ならびにこのタイルに関してモデルの確実性値cで加重された高い予測パワー(または「予後値」)whを有するそれぞれの画像タイルを示す関連性ヒートマップを自動的に計算して提示するため、有利とすることができる。関連性ヒートマップは、高関連性インジケータを有する組織領域をハイライトすることができる。タイルは、通常、スライド全体の画像の小さなサブ領域のみであり、タイルのwh値にしたがってソートされたヒートマップおよび/またはタイルのギャラリは、組織サンプル全体の概観を提供しない場合がある。高い予測的関連性を持つ組織パターンの位置および範囲に関する概要情報は、全体スライド組織画像の元の画像と、高度に直感的でスマートな様式にて好適に組み合された関連性ヒートマップにより提供されることができる。
加重予測値ベースのヒートマップを計算および表示することは、このヒートマップが、MILをトレーニングするために使用されるエンドポイントに対するタイルの予測パワーを示すため、有利とすることができる。したがって、関連性ヒートマップをユーザに表示することは、ユーザが、全スライド画像内の特定のラベルに対して予測的である組織パターンを有するタイルの位置および範囲を迅速に特定することを可能にする。
実施形態によれば、本方法は、受信した画像を画面のGUIに表示するステップをさらに含む。画像は、分類の結果にしたがってGUIにおいて少なくとも2つの異なるクラスにグループ化される。
実施形態によれば、少なくとも2つのクラスのそれぞれは、以下を含むグループから選択される:
-特定の薬物に対して反応性のある患者;
-転移または特定の形態の転移(例えば、微小転移)を発症した患者;
-特定の治療に対する特定の反応、例えば病理学的完全奏効(pCR)を示すがん患者;
-特定の形態学的状態またはマイクロサテライト状態を示すがん患者組織;
-特定の薬物に対する有害反応を発症した患者;
-特定の遺伝的属性、例えば特定の遺伝子シグネチャを有する患者;および/または
-特定のRNA発現プロファイルを有する患者。
これらのラベルは、診断において、ならびに疾患の処置に適した薬を見つけることにおいて役立つことができる。しかしながら、上記のラベルは単なる例である。他の患者関連属性もまた、上述したように、ラベル(すなわち、MILプログラムをトレーニングさせるためのエンドポイント)として使用されることができる。疾患の特定の処置の有効性はまた、処置される患者にも関連するため、「患者関連」という用語はまた、処置関連という言葉を含むことができる。
本発明の実施形態は、患者関連の属性値を示す組織パターンを識別するために使用される。本方法は、生物医学のエキスパートの明確な知識に基づく画像分析方法の利点を、機械学習方法の利点と組み合わせ得るため、好適とすることができる。
実施形態によれば、確実性値ベースのプーリング関数は、確実性値ベースの最大プーリング、平均プーリング、またはアテンションプーリング関数である。
実施形態によれば、本方法は、さらに、
-どのタイル由来特徴ベクトルがタイルのクラスメンバシップを予測するために最も関連するかを学習したトレーニングされたアテンションMILを提供すること、
-タイルのそれぞれのアテンション加重(aw)を、アテンションMILによってそれぞれのタイルの特徴ベクトルの関数として計算することであって、アテンション加重が、クラスに対するこのタイルのメンバシップに関するこのタイルの特徴値の関連性の指標である、アテンション加重(aw)を計算すること、
タイルのアテンション加重(aw)にタイルの特徴ベクトル値を乗算して、タイルのアテンション加重特徴値を有するアテンションベース特徴ベクトルを取得すること、アテンションベースの特徴ベクトルを、スライドの予測値(h)、確実性値(c)および/または加重予測値(wh)を計算するためにMILプログラムに入力される特徴ベクトルとして使用することによって、予測値(h)、確実性値(c)および/または加重予測値(wh)がアテンションベースの予測値、アテンションベースの確実性値および/またはアテンションベースの加重予測値として計算される、使用すること、または
-アテンションベースの予測値、アテンションベースの確実性値、および/またはアテンションベースの加重予測値を取得するために、タイルのアテンション加重(aw)に、タイルの予測値(h)、確実性値(c)を、またはMILによって計算されたタイルの加重予測値(wh)を、乗算することをさらに含む。
例えば、アテンション加重は、例えば、式(9)を参照して記載されるように、組織病理データセットに対するアテンションベースのマルチインスタンス学習器(MIL)の適用について記載しているMAXIMILIAN ILSEら:「Attention-based Deep Multiple Instance Learning」、ARXIV.ORG,CORNELL UNIVERSITY LIBRARY,201 OLIN LIBRARY CORNELL UNIVERSITY ITHACA,NY 14853、2018年2月13日、XP081235680に記載されたように計算されることができる。
アテンション加重と確実性値との組み合わせは、画像データにノイズが多い場合、および/またはトレーニングフェーズ中に使用された画像とは著しく異なる場合、アテンション加重の計算のみでは不十分な(不正確な)分類結果を提供する可能性があるため、特に有利とすることができる。しかしながら、アテンションベースの加重の欠点および堅牢性の欠如は、確実性値も考慮することによって補償されることができ、特定のベクトル/タイルに対して高いアテンション加重が得られた場合であっても、このタイルに対して得られた確実性値が低い場合、このタイル/ベクトルの寄与はほとんど無視され、それによって偽陽性分類結果が回避される。
「アテンション加重」および「確実性値」は、完全に異なる概念に関連することに留意されたい:「確実性値」は、分類結果に対するベクトル/タイルの寄与に関する予測モデルの確実性値を示すが、「アテンション加重」は、分類結果に対する特徴ベクトル/タイルの関連性(予測パワー)を示す。例えば、第1の特徴ベクトルは、画像の第1のタイルから導き出されてもよく、第2のベクトルは、同じ画像の第2のタイルから導き出されてもよい。
例えば、第1の特徴ベクトルは、第1のタイルが組織タイプクラス「腫瘍組織」と非常に強く相関する/高い予測値を有する第1のパターンを含むことを示すため、アテンションMILは、第1の特徴ベクトルに基づいて、画像が「腫瘍組織」を示すと判定することができる。したがって、アテンションMILは、識別されたパターンがクラス「腫瘍組織」を強く予測するため、第1のタイルに対して高いアテンション加重を計算する。
加えて、第2の特徴ベクトルは、第2のタイルが分類「腫瘍組織」と弱く正に相関する別のパターンを含むことを示すため、アテンションMILは、第2の特徴ベクトルに基づいて、画像が「腫瘍組織」を示すと判定することができる。これは、このパターンを有するタイルを含む全ての画像の約60%が実際には腫瘍組織画像であり、それらの画像の約40%がこのパターンを有するタイルを含むことができるが、それにもかかわらず「健常」組織を示すことができることを意味する。
確実性が計算/考慮されない場合、以下の状況が発生する可能性がある:第1のパターンと「腫瘍クラスラベル」との相関は強い可能性がある(第1のパターンを有する少なくとも1つのタイルを有する全てのトレーニング画像は実際に腫瘍組織画像であり、この第1のパターンを有するタイルを含む「健常組織」トレーニング画像はない)が、分類「腫瘍組織」の確実性値は低い可能性がある。例えば、トレーニングセット内の第1のパターンを有するタイルの総数は少なくてもよく、したがって、この第1のパターンに基づく任意の予測の「確実性」は低くてもよい。したがって、アテンションMILは、特定のクラスラベルに関してタイルの高い予測関連性を計算するが、このタイルに対して計算された確実性値は低く、その逆も可能である。第2のタイルに関して、アテンション加重は、第2のパターンがクラスメンバシップの不良な予測子であるように見えるので低くなり、確実性値は、第2のパターンを含むトレーニングデータセット内の例の品質および豊富さに応じて高くても低くてもよい。
アテンション加重と確実性値の双方を考慮に入れることにより、この予測/分類のために計算されたモデルの確実性値で表される、この予測のためのトレーニングデータ基礎が低い場合、特定のクラスメンバシップと強く相関する/高度に予測されるように見えるトレーニングデータセット内のパターンが無視されるか、または少なくともダウンウェイトされることが保証される。
例えば、最大プーリング関数は、確実性値によって加重されたアテンションベースの予測値が所定の閾値を超えた場合にのみ、画像を特定のクラスのメンバであるように分類することができる。
実施形態によれば、個々のタイルについて計算された予測値hおよび/または加重予測値whは、ギャラリ内の関連するタイルのグラフィック表現とともに出力されることができる。例えば、ギャラリ内のタイルは、各タイルに対して計算された数値whにしたがってソートされることができる。この場合では、ギャラリにおけるタイルの位置は、病理学者または他の人であるユーザが、特定のラベルに対して高く予測的であることがわかったタイルのいくつかに描かれている組織パターンを特定することを可能にする。追加的、または代替的に、数値は、そのそれぞれのタイルに空間的に近接して表示されることができ、これにより、ユーザは、特定のラベルに関して、類似する数値を有する1つ以上のタイルに描かれている組織の組織パターンを調べ、理解することができる。
ギャラリは、トレーニングフェーズの終了時にトレーニング画像に基づいて出力されることができ、および/またはテスト時にテスト画像に基づいて出力されることができる。トレーニングされたMILプログラムの出力として生成された画像タイルギャラリは、患者の特定の患者関連の属性値に関して予測的な組織シグネチャを明らかにすることができる。画像タイルと組み合わせて数値を提示することは、少なくとも多くの場合において、予測的組織パターン(これは、「組織シグニチャ」とも呼ばれることがある)が、病理学者により、類似する数値を有する、ギャラリにおけるいくつかのタイルを、より高い、または、より低い数値を有する他のタイルと比較することにより、および、レポートギャラリにおけるそれらのタイルのサブセットに描かれている組織シグニチャを比較することにより、特定されて言語化されることができる、という利点を有することができる。
さらなる態様では、本発明は、組織画像を分類するための画像分析システムに関する。画像分析システムは、少なくとも1つのプロセッサと、揮発性または不揮発性の記憶媒体とを備える。記憶媒体は、患者の組織サンプルをそれぞれ示すデジタル画像を含む。
画像分析システムは、少なくとも1つのプロセッサによって実行可能であり、画像のそれぞれを画像タイルのセットに分割するように構成された画像分割モジュールをさらに備える。
画像分析システムは、少なくとも1つのプロセッサによって実行可能であり、タイルのそれぞれについて、前記タイルから選択的に抽出された画像特徴を含む特徴ベクトルを計算するように構成された特徴抽出モジュールをさらに備える。
画像分析システムは、マルチインスタンス学習(MIL)プログラムをさらに含む。MILプログラムは、少なくとも1つのプロセッサによって実行可能であり、前記入力画像の全てのタイルから抽出された特徴ベクトルに基づいて、少なくとも2つの異なるクラスのうちの1つのメンバとして任意の入力画像を分類するためのモデルを使用するように構成される。MILプログラムは、
-タイルのそれぞれについて、確実性値を計算することであって、確実性値が、タイルが導き出された画像の分類に対するタイルの特徴ベクトルの寄与に関するモデルの確実性値を示す、計算することと、
-各画像について、
・MILプログラムにより、画像から抽出された特徴ベクトルを画像のタイルの確実性値の関数としてグローバル特徴ベクトルに集約するための確実性値ベースのプーリング関数を使用し、グローバル特徴ベクトルから集約予測値(本発明の実施形態によれば本明細書では「ah」と呼ばれる)を計算すること、または
・MILプログラムにより、画像の特徴ベクトルのそれぞれからの予測値を計算し、MILプログラムにより、画像の予測値を集約予測値(「ah」)に集約するための確実性値ベースのプーリング関数を、画像のタイルの確実性値の関数として使用することと、
-集約予測値に基づいて、画像のそれぞれを少なくとも2つの異なるクラスのうちの1つのメンバとして分類することと、のためにさらに構成される。
実施形態によれば、システムは、分類結果を出力するためのインターフェースを備える。例えば、インターフェースは、マシンツーマシンインターフェース、例えば、分類結果をソフトウェアアプリケーションプログラムに送信するためのアプリケーションプログラムインターフェースとすることができる。追加的、または代替的に、インターフェースは、マンマシンインターフェース、例えば、分類結果のグラフィカル表現を含むGUIを表示するように構成された画面とすることができるか、またはそれを含むことができる。例えば、MILプログラムは、分類結果をGUIを介してユーザに出力するように構成されることができる。
実施形態によれば、GUIは、「関連性ヒートマップ」とも呼ばれることがあるヒートマップが、タイルの予測値hに基づいて、またはタイルの加重予測値whに基づいて計算されるかどうかをユーザが選択することを可能にする。これにより、ユーザは、モデルの不確実性を考慮する効果を評価することができる。
特徴抽出アプローチ
実施形態によれば、トレーニング時および/またはテスト時におけるタイルのそれぞれについての特徴ベクトルの計算は、タイルから1つ以上の画像特徴を抽出することと、抽出された特徴を特徴ベクトル内の1つ以上の特徴の形態で表すこととを含む。任意に、特徴ベクトルの計算は、さらに、組織サンプルがタイルに描かれている患者の患者関連データを受信することと、特徴ベクトル内の1つ以上の特徴の形態で患者関連データを表すこととを含む。患者関連データは、例えば、ゲノムデータ、RNAシーケンスデータ、患者の既知の疾患、年齢、性別、体液中の代謝産物濃度、健康パラメータおよび現在の医薬品とすることができる。
実施形態によれば、特徴ベクトルを計算することは、トレーニング済み機械学習ロジック、特に、少なくとも1つのボトルネックレイヤを含むトレーニング済み全畳み込みニューラルネットワークにより行われる。
実施形態によれば、特徴抽出に使用されるトレーニング済み機械学習ロジック(「特徴抽出MLL」)は、UNETなどの、ボトルネックを含む、全畳み込みネットワークのタイプのMLLを採択する教師ありの方法においてトレーニングされる。「Unet」アーキテクチャは、Olaf Ronneberger、Philipp Fischer、およびThomas Broxによって「U-Net:Convolutional Networks for Biomedical Image Segmentation」,Computer Science Department and BIOSS Centre for Biological Signalling Studies,University of Freiburg,Germany(arXiv:1505.04597v1 18 May 2015)に記載されている。本文書は、Cornell University Libraryの、https://arxiv.org/abs/1505.04597からダウンロード可能である。
例えば、特徴抽出MLLは、組織画像セグメンテーションタスクを行うようトレーニングされることができ、これにより、特定されるセグメントは、2つ以上の次の組織画像セグメントタイプ:腫瘍組織、健常組織、壊死した組織、腫瘍細胞、血管、ストローマ、リンパ球などの特定の対象を含む組織などと、背景エリアと、を含む。いくつかの実施形態によれば、特徴抽出MLLは、教師ありの様式にて、Resnet、ImageNet、またはSegNetなどの分類ネットワークを使用して、それを、特定の所定のクラスまたはオブジェクトを持つ画像のタイルに分類するようにトレーニングさせることによりトレーニングされる。
特徴抽出MLLにトレーニングさせた後に、MLLは、(入力レイヤと、1つ以上の中間レイヤと、ボトルネックレイヤと、を含む)「エンコーダ」部と、「デコーダ」、すなわち、出力生成部と、に分割される。トレーニング済みMLLの、ボトルネックレイヤまでの「エンコーダ」部は、本発明の実施形態にしたがって、各入力タイルに対する特徴ベクトルを抽出して計算するために使用される。ボトルネックレイヤは、入力レイヤよりもかなり少ないニューロンを含む、ニューラルネットワークのレイヤである。例えば、ボトルネックレイヤは、入力レイヤの60%未満、または、さらに20%未満の「ニューロン」を含むレイヤとすることができる。異なるレイヤにおけるニューロンの数および比率は、異なるネットワークアーキテクチャに大きく依存して異なる場合がある。ボトルネックレイヤは、隠れレイヤである。
1つの例によれば、特徴抽出MLLのネットワークは、UNETに基づくネットワークアーキテクチャを有する。これは、512*512*3(512×512RGB)のニューロンを持つ入力レイヤと、9*9*128のニューロンを持つボトルネックレイヤと、を有する。したがって、ボトルネックレイヤにおけるニューロンの数は、入力レイヤのニューロンの数の約1.5%である。
1つの例によれば、特徴抽出MLLのネットワークは、教師ありまたは教師なし学習アルゴリズムを実装するResnetアーキテクチャを有する。入力レイヤは、512×512×3のニューロンを含み、ボトルネックレイヤと、ボトルネックレイヤにより出力される対応する特徴ベクトルとは、典型的には、1024または2048の要素(ニューロン/数)を含む。
実施形態によれば、特徴抽出は、ImageNet自然画像データセットについてトレーニングされたResNet-50(Heら、2016)アーキテクチャに基づく特徴抽出プログラムモジュールにより行われる。このアーキテクチャに基づく画像からの特徴抽出のいくつかの詳細な例は、コーネル大学図書館を介してオンラインで入手可能な、2018年2月1日に提出された、Pierre Courtiol、EricW.Tramel、Marc Sanselme、およびGilles Wainrib:「CLASSIFICATION AND DISEASE LOCALIZATION IN HISTOPATHOLOGY USING ONLY GLOBAL LABELS:A WEAKLY-」SUPERVISED APPROACH」,arXiv:1802.02212、https://arxiv.org/pdf/1802.02212.pdfに記載されている。
実施形態によれば、特定のタイルに対する、トレーニング済み特徴抽出MLLのレイヤの1つにより生成される出力は、MILプログラムによりタイルから抽出された特徴ベクトルとして使用される。この1つのレイヤは、特に、ボトルネックレイヤとすることができる。実施形態によれば、特徴抽出MLLは、https://arxiv.org/abs/1807.05520を介して電子的に入手可能なMathilde CaronおよびPiotr BojanowskiおよびArmand JoulinおよびMatthijs Doze:「Deep Clustering for Unsupervised Learning of Visual Features」,CoRR,1807.05520,2018に記載されているように、教師なしまたは自己教師ありの方法でトレーニングされる。
あるいは、特徴抽出MLLは、https://openreview.net/forum?id=S1v4N2l0-を介して電子的に入手可能な、Spyros Gidaris、Praveer Singh、Nikos Komodakisによる「Unsupervised Representation Learning by Predicting Image Rotations」、2018年2月15日、ICLR 2018 Conferenceにしたがってトレーニングされることができる。
さらに代替的に、特徴抽出MLLは、https://openreview.net/forum?id=r1R5Z19leを介して電子的に入手可能な、Elad Hoffer,Nir Ailon「Semi-supervised deep learning by metric embedding」、2016年11月4日、ICLR 2017にしたがってトレーニングされることができる。
特徴抽出MLLをトレーニングさせるためのデータセットは、MILプログラムをトレーニングさせることに後に使用される、別の組織画像データセット、および/または、組織画像のセットとすることができる。特徴抽出MLLは、MILプログラムの学習フェーズのエンドポイントとして使用される、患者の患者関連属性値ではなく、組織タイプおよびそれぞれの画像セグメントを特定するようトレーニングされるため、トレーニング画像に関連付けられたいずれのラベルは、評価されない、または、さもなければ、トレーニングフェーズにおいて、特徴抽出MLLにより使用される。
近接に基づく類似性ラベルの使用を可能にする特徴抽出アプローチ
実施形態によれば、特徴ベクトルは、ラベル付けされたタイルペアを含むトレーニングデータセットについてトレーニングされた特徴抽出機械学習ロジック(「特徴抽出MLL」)により計算され、これにより、各ラベルは、タイルペアにより描かれた2つの組織パターンの類似性を表し、タイルペアの2つのタイルの空間距離の関数として計算される。
好適な実施形態によれば、ラベルは、トレーニングデータセットにおけるタイルペアに完全に自動的に割り当てられる。
このアプローチは、以下の複数の理由について有益となり得る:2つの画像領域の空間的近接は、組織サンプルの全てのデジタル画像において、常に、そして本質的に利用可能な特徴である。問題は、画像およびそれぞれの組織領域そのものの空間的近接は、典型的には、組織タイプの分類、疾患分類、特定の疾患の持続性の予測、または画像セグメンテーションタスクなどの、生物医学的問題に関するいずれの関連情報を明らかにしない、ということである。出願人は驚くべきことに、少なくとも、多数のタイルおよびそれらのそれぞれの距離が、MLLのトレーニングフェーズ中に分析される場合、2つの画像領域(「タイル」)の空間的近接においてもたらされる情報が、2つの画像領域の類似性の正確なインジケータである、ということを観察した。したがって、組織パターン類似性ラベルを、2つの比較されたタイルに自動的に割り当てるために、2つのタイルの本質的に利用可能な情報である「空間的近接」を使用可能にすることにより、MLLをトレーニングさせることに使用されることができる、大規模な注釈付きデータセットが、自動的に提供されることができる。トレーニング済みMLLは、入力として受信された、2つの画像または画像タイルが、類似する組織パターン、または、類似しない組織パターンを描くかについて、自動的に決定することに使用されることができる。しかしながら、データセットは、これに加えて、画像類似性サーチ、画像セグメンテーション、組織タイプの検出、および組織パターンのクラスタ化などの、他のより複雑なタスクに使用されることができる。したがって、出願人は驚くべきことに、タイルの空間的近接においてもたらされる情報が、画像の類似性を確実に決定するMLLにトレーニングさせることを可能にし、これに加えて、デジタル病理学における複数の複雑な画像分析タスクのための追加的なデータ処理ユニットにより使用されることができる特徴ベクトルを出力するMLLにトレーニングさせることを可能にすることができる注釈付きトレーニングデータを自動的に生成することに使用されることができる、ということを観察した。これらのアプローチはどれも、トレーニングデータに手動で注釈を付けるドメインエキスパートを必要としない。
多くの異なる組織パターン(例えば、「非腫瘍」および「腫瘍」)を含むトレーニング画像が、多くの異なるタイルに分割される場合、2つのタイル間の距離が短いほど、比較されたタイルの双方が、「非腫瘍」などの同じ組織パターンを描く確率は高い。しかしながら、異なる組織パターン(例えば、最初のタイルが「腫瘍」であり、他のタイルが「非腫瘍」)を描く2つの異なるパターンの境界のそばには、いくつかのタイルペアがある。これらのタイルペアは、これらが空間的に密接して近接しているものの、異なる組織パターンを描くため、ノイズを生成する。出願人は驚くべきことに、空間的近接が、描かれた組織パターンの類似性を示す、という簡略化する仮定と組み合わせて、異なる組織パターン間の境界に広がるタイルペアにより生成されたこのノイズが、トレーニング済みMLLの正確さを大きく落とすことはない、ということを観察した。実際に、出願人は、本発明の実施形態にしたがってトレーニングされたMLLの正確さが、既存のベンチマーク方法のそれらをしのぐことができる、ということを観察した。
さらに有益な態様では、多くの異なる画像のセットに対して、トレーニングデータを今では、迅速に、完全に、自動的に生成することができる。現在、自然で実際的な変動性を組織病理学の画像に撮像する、利用可能な注釈付きデータセットが足りていない。例えば、Camelyonのような、既存の大規模なデータセットでさえ、1つのタイプの染色(ヘマトキシリンおよびエオシン)と、1つのタイプのがん(乳がん)と、のみからなる。組織病理学の画像のテクスチャおよび物体形状は、異なるがんタイプ、異なる組織染色タイプ、および異なる組織タイプからの画像において大きく異なる場合がある。追加的に、組織病理学の画像は、ドメインに特有の異なる意味(例えば、ストローマ、腫瘍浸潤リンパ球、血管、脂肪、健常組織、壊死など)を持つ、多くの異なるテクスチャおよびオブジェクトタイプを含む。したがって、本発明の実施形態は、複数の異なるがんタイプ、がんサブタイプ、染色方法、および患者グループ(例えば、処置済み/未処置、男性/女性、閾値年齢より高年齢/若年齢、バイオマーカ-陽性/バイオマーカ-陰性など)のそれぞれに対して、注釈付きデータセットを自動的に生成することを可能にすることができる。したがって、本発明の実施形態は、注釈付きトレーニングデータを生成することと、それぞれのMLLに、トレーニングデータについてトレーニングさせることと、を自動的に可能にし、結果としてのトレーニング済みMLLが、複数の異なる患者のグループのそれぞれに対して、特異的な様式にて、生物医学的問題に正確に対処するよう適合されるようにすることができる。手動で注釈が付けられた乳がんデータセットについてトレーニングされたMLLが、結腸がん患者に対して次善の結果を提供する最新のアプローチとは反対に、本発明の実施形態は、MLLを、異なる患者グループのそれぞれに対して個別に生成することを可能にすることができる。
実施形態によれば、2つの組織パターンの類似性の程度を示すラベルは、バイナリデータ値、すなわち、2つの可能なオプションの内の1つを有することができる値である。例えば、ラベルは、「1」または「類似」とすることができ、これは、2つのタイルが、同様の組織パターンを描くことを示す。代替的に、ラベルは、「0」または「非類似」とすることができ、これは、2つのタイルが、類似しない組織パターンを描くことを示す。他の実施形態によれば、ラベルは、よりきめを細かくすることができ、例えば、「非類似」、「類似」、および「高く類似する」などの、3つまたはそれ以上のデータ値の限定されたセットから選択されたデータ値とすることができる。さらなる他の実施形態によれば、ラベルは、よりきめを細かくすることができ、数値の大きさが、類似性の程度と正に相関する数値とすることができる。例えば、数値は、ペアにおける2つのタイル間の空間的距離を、組織パターン類似性を表す数値に線形に変換する、および、逆に変換する関数として計算されることができる。空間的距離が長いほど、組織パターン類似性を示す数値は小さい。非常に多種のMLLアーキテクチャが存在し、これらは、トレーニングデータセット(例えば、序数、または、数値)において、異なるタイプのラベルを処理し、使用することができる。MLLのタイプは、それが、トレーニングデータセットの自動的に生成されたラベルを処理することができるように選ばれる。
実施形態によれば、自動的に注釈が付けられたトレーニングデータセットについてトレーニングされており、特徴抽出に使用されるMLLは、教師あり学習アルゴリズムにしたがって学習するよう適合されている。教師あり学習は、1つ以上の出力データ値のメンバとして入力特徴のセットを変換するマッピングを見つけることに関する。出力データ値は、トレーニング中に、ラベルとして、例えば、バイナリオプションラベル「類似」もしくは「非類似」として、または、類似性に対する定量的尺度である数値として提供される。換言すれば、トレーニング中、予測されなければならないデータ値が、MLLのモデルに、トレーニングデータのラベルの形態にて明示的に提供される。教師あり学習には、各サンプルに対する出力スペースを画定するために、トレーニングデータがラベル付けされる必要があるという問題がつきまとう。
実施形態によれば、タイルペアの少なくともいくつかまたは全ては、それぞれ、同じ組織スライスに含まれる2つの組織領域を描く。組織スライスのそれぞれは、受信したデジタル画像のそれぞれの1つに描かれる。タイル間の距離は、ペアにおけるタイルが導き出された、受信したデジタル画像のx次元およびy次元により画定される、2D座標系内にて計算される。
実施形態によれば、タイルペアは、複数の異なる画像のそれぞれ内のタイルペアをランダムに選択することにより生成される。ランダムに基づく選択は、各ペアにおけるタイル間の空間的距離が異なることを確実にする。例えば、2つのタイル間の距離と逆に相関する数値の形態での類似性ラベルが計算され、各ペアに割り当てられる。
他の実施形態によれば、タイルペアは、各受信した画像のタイルの少なくともいくつかまたは全てを、開始タイルとして選択することと、各開始タイルに対して、全て、または、予め定められた数の「近くのタイル」を選択することであって、「近くのタイル」が、開始タイルを中心とする第1の円内のタイルであり、これにより、この円の半径が、第1の空間的近接閾値と同一となる、「近くのタイル」を選択することと、各開始タイルに対して、全て、または、予め定められた数の「遠くのタイル」を選択することであって、「遠くのタイル」が、開始タイルを中心とする第2の円の外側にあるタイルであり、これにより、前記円の半径が、第2の空間的近接閾値と同一となる、「遠くのタイル」を選択することと、により生成され、予め定められた数の選択が、それぞれの画像エリア内のこの数のタイルをランダムに選ぶことにより行われることができる。第1および第2の近接閾値は、同一であってもよいが、第2の近接閾値が第1の近接閾値よりも大きいことが好ましい。例えば、第1の近接閾値は、1mmとすることができ、第2の近接閾値は、10mmとすることができる。次に、タイルペアの第1のセットが選択され、各タイルペアは、開始タイルと、第1の円内に位置する近くのタイルとを含む。第1のセットにおける各タイルペアには、ラベルが「類似」の組織パターンが割り当てられる。加えて、第2のタイルペアのセットが選択され、これにより、前記セットにおける各ペアは、開始タイルと、「遠くのタイル」の1つと、を含む。第2のセットにおける各タイルペアには、ラベルが「非類似」の組織パターンが割り当てられる。例えば、この実施形態は、「類似」または「非類似」の「バイナリ」ラベルを生成することに使用されることができる。
実施形態によれば、タイル間の距離は、タイルが導き出されるデジタル画像のx軸およびy軸により画定される2D座標系内にて測定される。これらの実施形態は、異なる患者の組織サンプル、および/または、同じ患者内の異なる領域を描く複数の組織サンプル画像が利用可能なシチュエーションにおいて使用されることができ、これにより、前記異なる領域は、互いに離れているか、または、これにより、前記2つの領域の、互いに関する正確な位置は未知である。この場合、タイル間の空間的近接は、デジタル画像により画定される、ピクセルの2D面内のみにて測定される。画像取得デバイス(例えば、顕微鏡のカメラ、または、スライドスキャナ)の既知の分解能係数に基づいて、2つのタイルにより描かれた組織サンプルにおける組織領域間の距離を計算するために、元の画像のタイル間の距離が使用されることができる。
実施形態によれば、タイルペアの少なくともいくつかまたは全ては、隣接する組織スライスの束の2つの異なる組織スライスに含まれる2つの組織領域を描く。組織スライスのそれぞれは、受信したデジタル画像のそれぞれの1つに描かれる。隣接する組織スライスの束の組織スライスを描く受信した画像は、3D座標系において互いに整列される。タイル間の距離は、3D座標系内にて計算される。
例えば、いくつかまたは全ての受信したデジタル画像は、隣接する組織スライスの組織ブロック内のスライスである組織サンプルを描くことができる。この場合、デジタル画像は、3D座標系におけるデジタル画像の位置が、組織ブロック内の、それぞれが描かれた組織スライスの位置を再現するように、共通の3D座標系において互いに整列されることができる。これは、3D座標系におけるタイルの距離を決定することを可能にすることができる。「近くの」および「遠くの」タイルの選択は、2D座標系の場合について上述したように行われることができるが、唯一の違いは、少なくともいくつかのタイルペアにおけるタイルが、受信した画像の異なるいくつかから導き出される、ということである。
いくつかの実施形態によれば、注釈付きトレーニングデータは、同じデジタル画像から導き出されたタイルペア、ならびに共通の3D座標系において互いに整列された異なる画像から導き出されたタイルペアと、の双方を含む。これは、3つ目の次元(異なる組織サンプルにおける組織領域を表すタイルの空間的近接)の考慮が、それぞれの組織サンプルの、少数の画像のみが利用可能である場合に、トレーニングデータにおけるタイルの数を大いに増やすことができ、これにより、組織サンプルが、3D生検細胞ブロックなどの同じ細胞ブロックに属するため、有益となり得る。
実施形態によれば、各タイルは、0.5mm未満、好ましくは、0.3mm未満の最長エッジ長さを有する組織または背景領域を描く。
タイルサイズが小さいということは、異なる組織パターンを混ぜたものを描くタイルの数およびエリアの割合が減る、という利点を有することができる。これは、2つ以上の異なる組織パターンを描くタイルにより、および、2つの異なる組織パターンを描く「組織パターン境界」のそばのタイルペアにより生成されるノイズを減らすことを助けることができる。加えて、タイルサイズが小さいということは、多数のタイルペアを生成して、これらにラベル付けすることを可能にすることができ、これにより、ラベル付けされたトレーニングデータの量が増える。
実施形態によれば、タイルペアの自動生成は、第1のタイルペアのセットを、第1の空間的近接閾値を使用して生成することであって、第1のセットにおける各タイルペアの2つのタイルにより描かれた2つの組織領域が、第1の空間的近接閾値より小さい距離だけ互いに離れている、第1のセットのタイルペアを、第1の空間的近接閾値を使用して生成することと、第2のセットのタイルペアを、第2の空間的近接閾値を使用して生成することであって、第2のセットにおける各タイルペアの2つのタイルにより描かれた2つの組織領域が、第2の空間的近接閾値より大きい距離だけ互いに離れている、第2のセットのタイルペアを、第2の空間的近接閾値を使用して生成することと、を含む。例えば、これは、本発明の実施形態についてすでに上述したように、複数の開始タイルを選択することと、各開始タイルの周りに、第1および第2の空間的近接閾値に基づいて、第1および第2の円を計算することと、開始タイルと、「近くのタイル」(第1のセット)または「遠くのタイル」(第2のセット)と、を含むタイルペアを選択することと、により実施されることができる。
実施形態によれば、第1および第2の空間的近接閾値は同一であり、例えば、1mmである。
好適な実施形態によれば、第2の空間的近接閾値は、第1の空間的近接閾値よりも少なくとも2mm大きい。これは、組織パターンが、あるパターンから別のパターンへと段階的に変わる場合では、「遠くのタイル」に描かれている組織パターンの、「近くの」タイルに描かれている組織パターンと比較しての、これらの間の差異が明確となることができ、学習効果が改善されることができるため、好適となり得る。
実施形態によれば、第1の空間的近接閾値は、2mmよりも短く、好ましくは、1.5mmよりも短く、特に、1.0mmの距離である。
追加的、または代替的に、第2の空間的近接閾値は、4mmよりも長く、好ましくは、8mmよりも長く、特に、10.0mmの距離である。
これらの距離閾値は、デジタル画像およびそれぞれのタイルに描かれている組織領域(または、スライス背景領域)の距離を指す。画像取得デバイスの既知の倍率と、デジタル画像の解像度と、に基づいて、この距離は、デジタル画像の2Dまたは3D座標系内の距離に変換されることができる。
例えば、タイル(および、それらに描かれた組織領域)間の距離は、例えば、2dまたは3D座標系における2つのタイルの中心間にて測定されることができる。代替的な実施変異形によれば、距離は、2Dまたは3D座標系において互いに最も近い2つのタイルエッジ(画像領域エッジ)間にて測定される。
上述した閾値は、乳がん患者に対して類似するおよび類似しない組織パターンを正確に特定することができるトレーニング済みMLLを自動的に生成することを可能にする、ラベル付けされたトレーニングデータを提供するために観察されている。いくつかの他の実施例では、第1および第2の空間的近接閾値は、他の値を有することができる。特に、異なる組織タイプまたはがんタイプを示す、受信したデジタル画像の異なるセットが使用される場合では、第1および第2の空間的近接閾値は、上記に提供される距離閾値とは異なる他の値を有することができる。
実施形態によれば、本方法は、特徴抽出MLLにトレーニングさせるためのトレーニングデータセットを生成することをさらに含む。本方法は、それぞれが組織サンプルを描く複数のデジタルトレーニング画像を受信することと、受信したトレーニング画像のそれぞれを複数のタイル(「特徴抽出トレーニングタイル」)に分割することと、タイルペアを自動的に生成することであって、各タイルペアには、ペアの2つのタイルに描かれている2つの組織パターンの類似性の程度を示すラベルが割り当てられており、類似性の程度が、ペアにおける2つのタイルの空間的近接の関数として計算され、距離が、非類似性と正に相関する、生成することと、機械学習ロジック-MLL-に、ラベル付けされたタイルペアを、トレーニングデータとして使用してトレーニングさせて、トレーニング済みMLLを生成することであって、トレーニング済みMLLが、類似する画像は類似する特徴ベクトルを有し、類似しない画像が類似しない特徴ベクトルを有するようになる画像を表すデジタル組織画像から特徴ベクトルを抽出するよう学習されている、生成することと、前記トレーニング済みMLLまたはそのコンポーネントを、タイルの特徴ベクトルを計算するために使用される特徴抽出MLLとして使用することと、を含む。
このアプローチは、トレーニングデータセットのラベルが、全てのデジタル病理学の画像に本質的に含まれる情報に基づいて自動的に生成されることができるため、有益となり得る。したがって、トレーニング画像を単に選ぶことにより、現在対処している生物医学的問題に具体的に適合された特徴抽出MLLをトレーニングさせるための注釈付きデータセットを生成することができる。分割することと、ラベル付けおよび機械学習ステップなどの全てのさらなるステップは、完全に自動的に、または、半自動的に行われることができる。
実施形態によれば、トレーニング済みMLLは、それらの出力レイヤにより結合されている2つのニューラルサブネットワークを含むシャムネットワークである。トレーニング済みシャムネットワークのサブネットワークの1つは、記憶媒体上に個別に記憶されており、これは、タイルの特徴ベクトルを計算するために使用される、トレーニング済みMLLのコンポーネントとして使用される。
実施形態によれば、MILプログラムは、トレーニングフェーズにおいて、特徴ベクトルを、特定のバッグラベル(すなわち、画像クラスのメンバシップ)の確率を表すことができる予測値hに変換するように学習する。ラベルは、クラス(例えば、特定の薬Dまたは応答の程度を示す数値範囲による処置に応答する患者)を表すことができる。この学習は、特徴値を、トレーニング中に提供されるラベルの1つに変換する非線形変換関数の学習として数学的に記述されることができる。いくつかの実施形態によれば、テスト時において、いくらかのマイナーな構造上の変更(例えば、ドロップアウレイヤを無効にする)が、トレーニング済みMILプログラムに適用され、テストデータのサンプリングは行われない。テスト時においててトレーニング済みMILプログラムを適用する際の主な変更は、テストデータのバッグにおける全てのインスタンス(タイル)が、MILプログラムにより分析され、タイルのそれぞれに対して、および、トレーニングフェーズにおいて提供された複数のラベルのそれぞれに対して、予測パワーを示す最終数値を計算することである。最後に、複数のラベルについて画像のタイルについて計算された(加重された)予測値を集約することによって、画像全体または特定の患者について最終的な数値が計算される。トレーニング済みMILプログラムに、患者の1つ以上の画像を適用することの最終結果は、最も高い確率を有するラベルの1つである(例えば、「薬Dを用いた処置に患者に反応する!」)。加えて、このラベルに関して、最も高い予測パワーを有するタイルの1つが、トレーニングフェーズについて上述するレポート画像タイルギャラリと構造的に同等のレポート画像タイルギャラリに提示されることができる。
実施形態によれば、本方法は、1つ以上の「高予測パワータイル」を自動的に選択すること、または、これをユーザが選択できるようにすることをさらに含む。「高予測パワータイル」は、ラベルの特定の1つに対するその特徴ベクトルの予測パワーを示す予測値または加重予測値が高予測パワー閾値を超えるタイルである。
追加的、または代替的に、本方法は、1つ以上の「アーチファクトタイル」を自動的に選択すること、または、これをユーザが選択することができるようにすることをさらに含む。アーチファクトタイルは、ラベルの特定の1つに関して、その特徴ベクトルの予測パワーを示すその数値が、最小予測パワー閾値未満である、または、1つ以上のアーチファクトを描くタイルである。
1つ以上の高予測パワータイルおよび/またはアーチファクトタイルの選択に応答して、MILプログラムに自動的に再トレーニングさせ、これにより、トレーニングセットから、高予測パワータイルおよびアーチファクトタイルを除外する。
除外されたアーチファクトタイルが、再トレーニング中にはもはや考慮されないため、これらの特徴は、再トレーニング済みMILプログラムが、より正確なものとなり得る、という利点を有することができる。したがって、アーチファクトを描くトレーニングデータセットにおけるタイルにより引き起こされた、学習済み変換におけるいずれのバイアスが、MILプログラムの、アーチファクトタイルを含まないトレーニングデータセットの減少バージョンについての再トレーニングにより回避され、これが取り除かれる。
ユーザが、高い予測的タイルをトレーニングデータセットから取り除くことをできるようにすることは、直感的なものではない場合があるが、それでもなお、重要な恩恵を提供する:すなわち、時として、いくつかのラベルに関して、いくつかの組織パターンの予測パワーが自明である。
例えば、肺がんに特有のバイオマーカを発現する多くの腫瘍細胞を含む組織セクションは、もちろん、肺がん疾患の存在に対する重要な予測的マーカである。しかしながら、病理学者は、例えば、FAP+細胞などの非腫瘍細胞の存在および/または場所などの、いくつかのあまり明らかなものではない組織パターンにより興味を持つ場合がある。
実施形態によれば、このタイルの特徴ベクトルに基づいて特定のタイルのMILプログラムによって計算された予測値hは、バッグ(画像)のラベルに対するタイルの予測パワーを示す。
いくつかの実施形態によれば、タイルの加重予測値whは、タイルに対して計算されたモデルの確実性値cをこのタイルの予測値hと乗算することによって計算される。
他の実施形態によれば、本方法は、タイルのそれぞれに対して、特徴ベクトルを、加重された特徴ベクトルの形態で計算することを含む。加重特徴ベクトルは、特徴抽出プログラムによって前記タイルのモデルの確実性値cとして計算された加重および前記タイルについて計算された特徴ベクトルの関数として計算される。特に、確実性値cは、このタイルの特徴ベクトルと乗算されることができる。
一実施形態によれば、MILプログラムのトレーニングは、バッグのタイルについて計算されたモデルの確実性値csが、MILプログラムの入力としてタイルの特徴ベクトルとともに提供されるように実施される。MILのトレーニングは、MILが、特徴ベクトルがより低い加重を有するタイルからよりも、特徴ベクトルがより高い確実性値(すなわち、「加重」)を有するタイルからより多くを学習するように実施される。換言すれば、トレーニング中、MILプログラムは、タイルの予測値に対するタイルおよびそれらの特徴ベクトルの影響を、加重として使用される特定のタイルについて計算された確実性値と相関させるように学習する。
「組織サンプル」は、本明細書で使用される場合、本発明の方法により分析されることができる細胞の2Dまたは3Dアセンブリである。細胞集合体は、エクスビボ細胞ブロックのスライスとすることができる。例えば、サンプルは、患者から集められた組織、例えば、がん患者からの、肝臓、肺、腎臓、または結腸の組織サンプルから用意されることができる。サンプルは、顕微鏡スライドにおける、全体組織、または、TMAセクションとすることができる。スライド上に置かれた組織サンプルを用意する方法は、当業者によく知られている、本発明での使用に好適なものである。
組織サンプルは、染料もしくは染色剤、または、特定のバイオマーカもしくは様々なタイプの細胞または細胞内コンパートメントに直接反応する組織化学品もしくは免疫組織化学品などの、任意の試薬またはバイオマーカラベルを使用して染色されることができる。染色剤/試薬の全てに相溶性があるわけではない。したがって、採用された染色剤のタイプ、および、それらの一連の適用は、よく考慮されるべきであるが、これは、当業者により容易に決定されることができる。そのような組織化学品は、透過型顕微鏡検査法により検出可能な発色団、または、蛍光顕微鏡検査法により検出可能な発蛍光団であってもよい。一般的に、細胞を含むサンプルは、対象の化学基に直接反応するか、またはそれらと結合する、少なくとも1つの組織化学品を含む溶液を用いて培養されることができる。いくつかの組織化学品は、典型的には、染色を可能にする色止め料または金属を用いてともに培養される。細胞を含むサンプルは、対象のコンポーネントを染色する少なくとも1つの組織化学品と、対比染色剤として作用し、対象のコンポーネントの外側の領域に結合する別の組織化学品と、の混合物を用いて培養されることができる。代替的に、複数のプローブの混合物が、染色において使用されることができ、これが、特定のプローブの位置を特定する方法を提供する。細胞を含むサンプルを染色する手順は、当業者によく知られている。
本明細書で使用される「画像分析システム」は、ユーザーが画像を評価または解釈、例えば分類するのを支援するためにおよび/または画像内に暗黙的にまたは明示的に含まれる生物医学的情報を抽出するために、デジタル画像、特に、組織サンプルの画像を評価し処理するように適合されたシステム、例えば、コンピュータシステムである。例えば、コンピュータシステムは、標準的なデスクトップコンピュータシステム、または、クラウドシステムなどの、分散コンピュータシステムとすることができる。一般的に、コンピュータ化された組織病理学の画像分析システムは、その入力として、カメラにより撮像された、シングルまたはマルチチャネル画像を取得し、診断または処置における補助のための追加的な定量的情報を提供するように試みる。画像は、カメラから直接受信されることができ、あるいはローカルまたはリモートの記憶媒体から読み取られることができる。
本発明の実施形態は、例えば、画像ベースの腫瘍病期分類を実施するために、および/またはより大きな患者群のどの患者サブグループが特定の薬物から利益を得る可能性が高いかを決定するために、組織画像を分類するために使用されることができる。個人化医療(PM)は、新たな医療分野であり、その狙いは、個人のゲノム、エピゲノム、およびプロテオームのプロファイルに基づく、効果の高い、目的に合わせた治療方針を提供することである。PMは、患者を処置しようと試みるだけでなく、効果の低い処置による負の副作用から患者を保護する。腫瘍の進行とともにしばしば生じるいくらかの変異は、特定の処置に対する耐性を引き起こす。したがって、バイオマーカ特有に染色された組織サンプルの組織画像により、少なくとも部分的に明らかになり得る患者の変異性のプロファイルは、特定の処置が、個別の患者に効果があるかについて、トレーニング済みMILプログラムが明確に決めることを可能にする。現在、試行錯誤のアプローチにおいて、処方された薬剤が、患者に効果があるかどうかについて決定する必要がある。この試行錯誤のプロセスは、所望しない、複雑な薬の相互作用、処方する薬の頻繁な変更、効果がある薬を特定するまでの長い遅延、疾患の進行など、多くの負の副次的影響を有することができる。本発明の実施形態にしたがって行われる画像分類は、個体を、その特定の疾患に対する治療剤に対するその応答が異なる亜集団に層別化するために使用されることができる。例えば、数種のALKキナーゼ阻害剤は、ALK遺伝子において発現が増加した、NSCLC肺がん患者の約5%を処置することに便利な薬である。しかしながら、いくらかの時間の経過後、キナーゼ阻害剤は、ALK遺伝子、または、ALKのシグナリングカスケードの下流の他の遺伝子の変異により、効果がなくなる。したがって、肺がん患者のインテリジェントな分子キャラクタリゼーションが、患者の階層化を通して、いくつかの変異に特有の薬の最適な使用を可能にする。したがって、トレーニング画像またはテスト画像が取得される「患者のグループ」は、「100人の乳がん患者」、「100人のHER+乳がん患者」、「200人の結腸がん患者」などのグループとすることができる。
本明細書で使用される「デジタル画像」は、二次元画像の、通常はバイナリの数値表現である。典型的には、組織画像は、ラスタタイプの画像であり、これは、画像が、少なくとも1つの強度値がそれぞれに割り当てられているピクセルのラスタ(「マトリクス」)であることを意味する。いくつかのマルチチャネル画像は、色チャネル毎に1つの強度値を持つピクセルを有することができる。デジタル画像は、固定数の行および列のピクセルを含む。ピクセルは、画像における最小の個別要素であり、いずれの特定のポイントにて与えられた色の輝度を表す、旧来の値を保持する。典型的には、ピクセルは、コンピュータメモリに、小さい整数の二次元アレイであるラスタ画像、またはラスタマップとして記憶される。これらの値は、しばしば、圧縮形態にて送信または記憶される。デジタル画像は、デジタルカメラ、スキャナ、座標測定機器、顕微鏡、スライドスキャニングデバイスなどにより取得されることができる。
本明細書で使用される「ラベル」は、患者関連の属性値および/またはこの属性値を有する患者のクラスを表して指定するデータ値、例えば文字列または数値である。ラベルの例は、「薬Dに対する患者応答=真」、「薬Dに対する患者応答=偽」、「無増悪生存期間>6ヶ月」、「患者は微小転移を有する」などとすることができる。
本明細書で使用される「画像タイル」または「タイル」は、デジタル画像のサブ領域である。一般的に、デジタル画像から生成されるタイルは、円形、楕円形、多角形、矩形、正方形などのいずれの形状を有することができ、および、重なっているもの、または、重なっていないものとすることができる。好適な実施形態によれば、画像から生成されるタイルは矩形であり、好ましくは、重なっているタイルである。重なっているタイルを使用することはまた、タイル生成プロセスによりさもなければ断片化されるであろう組織パターンが、バッグにて表される、という利点をも有することができる。例えば、2つの重なっているタイルの重なりは、単一のタイルの面積の20から30%、例えば、25%とすることができる。
「プーリング関数」は、全てのタイルに基づいてタイルのバッグの単一の集約された数値を生成する順列不変変換である。プーリング関数は、画像分類結果を計算するためのトレーニングおよび/またはテストフェーズ中にバッグの全てのタイルに符号化された情報がどのように考慮されるかを指定することを可能にすることができる。プーリング関数は、トレーニングフェーズにおいてMILプログラムによって使用され、同じまたは異なるプーリング関数は、テストフェーズにおいてトレーニングされたMILプログラムによって使用される。好適な実施形態によれば、トレーニング時およびテスト時においてMILプログラムによって使用されるプーリング関数は、確実性値ベースのプーリング関数である。例えば、トレーニング時に使用されるプーリング関数は、確実性値ベースの平均プーリング関数であり、テスト時に使用されるプーリング関数は、確実性値ベースの最大プーリング関数である。
「確実性値ベースのプーリング関数」は、画像のタイルのそれぞれについてMILプログラムによって計算された確実性値を明示的または暗黙的に考慮に入れるプーリング関数である。
本明細書で使用される「特徴ベクトル」は、オブジェクトの特性を記述する情報を含むデータ構造である。データ構造は、単次元または多次元データ構造とすることができ、ここでは、特定のタイプのデータ値が、そのデータ構造内の位置のそれぞれに記憶されている。例えば、データ構造は、ベクトル、アレイ、マトリクスなどとすることができる。特徴ベクトルは、いくつかの対象を表す数的特徴のn次元ベクトルと見なされることができる。画像分析では、特徴は多くの形態をとることができる。画像のシンプルな特徴表現は、各ピクセルの生の強度値である。しかしながら、より複雑な特徴表現も可能である。例えば、画像または画像タイルから抽出された特徴はまた、SIFTディスクリプタの特徴(スケール不変特徴変換)とすることができる。これらの特徴は、異なる線方位への広がりを取り込む。他の特徴は、画像または画像タイルのコントラスト、勾配の方位、色組成、および他の態様を示すことができる。
「埋め込み」は、高次元ベクトルの低次元空間への変換である。理想的には、埋め込みは、意味的に類似する入力を埋め込み空間内で互いに近接して配置することによって、入力のセマンティクスの一部を取り込む。本出願の文脈内では、埋め込みは、特徴ベクトルの一種であると考えられ、その理由は、埋め込みが、数学的変換によって最初に抽出された特徴ベクトルによって導き出され、したがって、結果として得られる埋め込みにおけるパラメータ値が、特定のタイルから抽出された「特徴値」と考えることもできるためである。
本明細書で使用される「機械学習ロジック(MLL)」は、トレーニングプロセスにおいてトレーニングされた、またはトレーニングされることができ、トレーニングフェーズの結果として、提供されたトレーニングデータに基づいていくつかの予測タスクおよび/またはデータ処理タスク(例えば、画像分類)を実行するように学習した予測モデルを含むプログラムロジック、例えば、ニューロンネットワークまたはサポートベクターマシンなどのようなソフトウェアなどのプログラム論理である。したがって、MLLは、プログラマにより、少なくとも部分的に、明示的に指定されていないものの、サンプルの入力から、1つ以上の暗黙のまたは明確なモデルを構築する、データドリブンの学習プロセスにおいて暗示的に学習しており、変更されている、プログラムコードとすることができる。機械学習は、教師ありまたは教師なし学習を採用することができる。
本明細書で使用される「マルチインスタンス学習」(MIL)という表現は、ある種の(弱)教師あり機械学習アプローチを指す。個別にラベル付けされたインスタンスのセットを受信する代わりに、学習器は、それぞれが多くのインスタンスを含む、ラベル付けされたバッグのセットを受信する。マルチプルインスタンスの二項分類のシンプルな場合では、バッグにおける全てのインスタンスが負であれば、そのバッグは、負にラベル付けされることができる。一方、バッグにおける少なくとも1つのインスタンスが正であれば、そのバッグは、正にラベル付けされる。ラベル付けされたバッグを集めたものから、学習器は、(i)個別のインスタンスに正しくラベル付けするコンセプトを導入するか、または、(ii)そのコンセプトを導入することなく、バッグにラベル付けする方法を学習する、のどちらかを試す。MILの便利で簡単な例は、Babenko、Boris、「Multiple instance learning:algorithms and applications」(2008)与えられている。しかしながら、いくつかの実施形態にかかるMILプログラムもまた、2つを超える異なるラベル(エンドポイント)に基づくトレーニングをカバーする。
本発明の実施形態によれば、MILプログラムは、バッグ(デジタル組織画像の複数のタイルまたは好ましくは全てのタイル)の各インスタンス(タイル)について、したがってタイルにそれぞれ示された組織パターンについても予測値を計算するために使用される。このステップでは、新たな生物医学的知識が、MILプログラムにより特定されることができる。なぜなら、トレーニングデータでは、画像のラベルおよびそれぞれのタイルが、トレーニングに対するエンドポイントとして与えられているからであり、これは、ラベルと強く(正に、または、負に)相関する、したがって、このラベルに対して予測的であるタイルから導き出された特徴ベクトルの個別の特徴ではないからである。
換言すれば、MILは、共通のエンティティに属するトレーニングインスタンスがインスタンスのセットで提供される(弱教師あり)機械学習の形態を指し、セットはバッグと呼ばれる。トレーニング時に、特定のクラスにおけるバッグのメンバシップを示すラベル(「クラスラベル」)がバッグ全体に提供されるが、個々のインスタンスのラベルは知られていない。例えば、クラス内のメンバシップが知られているデジタルトレーニング画像は、画像タイルに分割されることができる。トレーニング画像には、クラスラベルが割り当てられており、トレーニング画像から生成されたタイルには、全て、トレーニング画像のクラスラベルが暗黙的に割り当てられることができるが、この特定のタイルが、その存在がタイルが導き出された画像がクラスラベルに示されたクラスに属することを意味する任意の特徴を含むか否かを示すラベルを割り当てていない。したがって、このトレーニングデータは、弱注釈付きデータを表す。学習の目的は、特定のクラスにおける対応するバッグのメンバシップを高度に予測するインスタンスの特徴を識別することを学習し、したがって、バッグの各インスタンスに対して生成されたクラスラベル予測の関数として、クラスラベルを画像に(すなわち、例のバッグに)正しく割り当てるための各タイルの予測値hを計算することを学習したモデルをトレーニングすることである。バッグの全てのインスタンスによって/それについて生成された複数のクラスラベル予測からバッグのクラスラベルを生成するために、順列不変プーリング関数が、バッグインスタンスのそれぞれについて生成された予測に適用される。
「MILプログラム」は、上述したMILアプローチにしたがってトレーニングされるように構成された、またはトレーニングされたソフトウェアプログラムである。
本明細書で使用される「確実性値」は、タイルが導き出された画像の分類に対するタイルの特徴ベクトルの寄与に関する機械学習プログラムのモデルの確度を示すデータ値、特に数値である。例えば、タイルで観測されたパターンに基づいて、画像が特定の画像クラスに属することをモデルが予測する場合、確実性値は、この予測が正しい確率を示す。確実性値は、例えば、この画像の複数のタイルのうちの1つから抽出された特徴ベクトル(「埋め込み」と呼ばれる特徴ベクトルの正規化されたものを含む)に基づいて算出される。より具体的な例示的な説明を提供するために、予測モデルは、超平面を有する多次元データ空間内のデータ点を分割することによって、タイルをそれぞれ表すデータ点を分類することを学習している場合がある。超平面から遠く離れて位置するデータ点は、「高い確実性値」を有する分類結果を表すことができる一方で、超平面に非常に近い位置にあるデータ点/タイルは、低い確実性値を有する分類結果を表すことができる(データ点の属性/特徴値のわずかな変化により、データ点は、超平面の反対側、したがって別のクラスに位置することができる)。本発明の実施形態によれば、確実性値は、パラメータ「c」によって表される。
本明細書で使用される「予測値」は、タイルが導き出された画像の分類に対するタイルの特徴ベクトルの寄与を示すデータ値、特に数値データ値である。特に、予測値は、タイルが特定のクラス内で導き出された画像のメンバシップに対するタイルの特徴ベクトルの寄与を示す。例えば、「寄与」は、特定のクラス内の画像のメンバシップの証拠の程度として記載されることができる。特定のタイルの予測値を計算するとき、MILプログラムは、好ましくは、特徴ベクトルが導き出されたタイルの特徴ベクトルのみ、および任意にいくつかの非画像ベースの特徴を考慮に入れる(ただし、他のタイルの特徴ベクトルは考慮しない)。本発明の実施形態によれば、予測値は、パラメータ「h」によって表される。特定のタイルに対して計算され、例えばこのタイルに対して得られた確実性値で加重された予測値は、パラメータ「wh」によって表される。予測値は、本発明の実施形態によれば、タイルの特徴ベクトルが、少なくとも2つのクラスのうちの特定の1つにおいてこのタイルの特徴ベクトルが導き出された画像のメンバシップを提供する証拠の程度を示す数値として説明することもできる。
本明細書で使用される「確実性値ベースのプーリング関数」とは、画像の全てのタイルの特徴ベクトルから導き出された特徴ベクトルや予測値を集約予測値に集約し、各タイルについて算出された確実性を考慮するように構成された関数である。
本明細書で使用される「集約予測値」は、複数の入力値に対して集約関数および任意に1つ以上のさらなるデータ処理ステップを適用することによって得られたデータ値、例えば数値である。入力値は、例えば、予測値(h)または特徴ベクトル(fv)またはそれらから導き出された値とすることができる。集約関数は、例えば、複数の特徴ベクトルをグローバル特徴ベクトル(「集約特徴ベクトル」とも呼ばれる)に集約するように、または複数の予測値を集約予測値に集約するように構成されたプーリング関数とすることができ、プーリング関数は確実性値を考慮に入れる。1つ以上のさらなるデータ処理ステップは、例えば、グローバル特徴ベクトルからのトレーニングされた機械学習モデル、例えばMILプログラムのトレーニングされたモデルによる集約予測値の計算とすることができる。例えば、集約予測値は、特定の画像が特定のクラスに属する可能性を示す数値とすることができる。
本明細書で使用される「ヒートマップ」は、データの図形表現であり、ここでは、マトリクスに含まれる個別値が、色および/または強度値として表される。いくつかの実施形態によれば、ヒートマップは不透明であり、それに基づいてヒートマップが生成される、組織スライド画像の少なくともいくつかの構造を含む。他の実施形態によれば、ヒートマップは半透明であり、ヒートマップを生成することに使用された組織画像の上部にオーバレイとして表示される。いくつかの実施形態によれば、ヒートマップは、それぞれの色またはピクセル強度を介して、複数の類似性スコア、または、複数の類似性スコア範囲のそれぞれを示す。
本明細書で使用される「バイオマーカ特異的染料」は、特定のバイオマーカを選択的に染色する染色剤であり、例えば、HERなどの特定のタンパク質、または特定のDNAシーケンスであるが、一般的には、他のバイオマーカまたは組織コンポーネントではない。
本明細書で使用される「非バイオマーカ特異的染料」は、より包括的な結合挙動を有する染色剤である。非バイオマーカ特異的染料は、個別のタンパク質またはDNAシーケンスを選択的に染色しないが、むしろ、特定の物理的または化学的性状を有する、より大きなグループの物質、および、下位細胞構造、同様に、上位細胞構造を染色する。例えば、ヘマトキシリンおよびエオシンは、それぞれ、非バイオマーカ特異的染料である。ヘマトキシリンは、濃い青色または紫色の染色剤であり、これは、塩基/陽性である。これは、好塩基性物質(酸性であり、負に帯電しているDNAおよびRNAなど)に結合する。核酸のリン酸骨格が、負に帯電しているため、核内のDNA/RNA、および、粗面小胞体におけるリボソーム内のRNAは、双方とも酸性である。これらの骨格は、正電荷を含む塩基性染料を持つ塩を形成する。したがって、ヘマトキシリンなどの染料は、DNAおよびRNAに結合し、それらを紫色に染色する。エオシンは、赤色またはピンク色の染色剤であり、これは、酸性であり、陰性である。これは、正に帯電したアミノ酸側鎖(例えば、リシン、アルギニン)などの好酸性物質に結合する。いくつかの細胞の細胞質における多くのタンパク質は、それらがアルギニンおよびリシンアミノ酸残基により、正に帯電しているため、塩基である。これらは、エオシンなどの、負の電荷を含む酸性染料とともに塩を形成する。したがって、エオシンは、これらのアミノ酸/タンパク質に結合し、それらをピンク色に染色する。これは、筋細胞、細胞内膜、および細胞外線維において、細胞質フィラメントを含む。
本明細書で使用される「強度情報」または「ピクセル強度」という用語は、デジタル画像のピクセル上で取り込まれるかまたはそれによって示される電磁放射(「光」)の量の尺度である。本明細書で使用される「強度情報」という用語は、例えば、特定の色チャネルの強度などの、追加的な関連情報を含むことができる。機械学習プログラム、例えばMILプログラムは、この情報を、デジタル画像に含まれる勾配またはテクスチャなどの派生情報を計算的に抽出することに使用し得る。派生情報は、トレーニング中、および/または、トレーニング済み機械学習プログラムによる特徴の抽出中に、デジタル画像から暗示的にまたは明示的に抽出されることができる。例えば、「デジタル画像のピクセル強度値は、1つ以上の特定の染色剤の強さと相関する」という表現は、色情報を含む強度情報が、機械学習プログラムと、また、ユーザと、が、前記1つ以上の染色剤の特定の1つを用いて染色された、組織サンプルにおける領域を特定できるようにするということを暗示することができる。例えば、ヘマトキシリンを用いて染色されたサンプルの領域を描くピクセルは、青色のチャネルにおいて高いピクセル強度を有することができ、fastRedを用いて染色されたサンプルの領域を描くピクセルは、赤色のチャネルにおいて高いピクセル強度を有することができる。
本明細書で使用される「バイオマーカ」という用語は、組織タイプ、正常または病理プロセス、あるいは、治療介入に対する応答の指標として生物サンプルにおいて測定することができる分子である。特定の実施形態では、バイオマーカは、タンパク質、ペプチド、核酸、脂質、および炭水化物からなるグループから選択される。より具体的には、バイオマーカは、EGRF、HER2、p53、CD3、CD8、Ki67などの特定のタンパク質とすることができる。特定のマーカは、特定の細胞の性質である一方、他のマーカは、特定の疾患または状態に関連付けられたものとして特定される。
組織サンプル画像の画像分析に基づいて、特定の腫瘍のステージを決定するために、複数のバイオマーカ特異的染料を用いてサンプルを染色する必要がある場合がある。組織サンプルの、バイオマーカに特有の染色は、典型的には、対象のバイオマーカに選択的に結合する一次抗体の使用を含む。特に、これらの一次抗体は、染色プロトコルの他のコンポーネントも含め、高価である場合があり、したがって、多くのアプリケーションシナリオ、特に、高スループットでのスクリーニングにおいて、コストを理由に、利用可能な画像分析技術の使用を不可能にする場合がある。一般的に、組織サンプルは、大規模な組織形態と、細胞と核との境界と、を明らかにするために、例えば、ヘマトキシリン染色剤、または、ヘマトキシリンとエオシン染色剤との組み合わせ(「H&E」染色剤)などの背景染色剤(「対比染色剤」)を用いて染色される。背景染色剤に加えて、複数のバイオマーカ特異的染料が、例えば、腫瘍の分類および病期、組織における特定の細胞タイプの量および相対分布の検出などの、回答が必要な生物医学的問題に依存して適用されることができる。
本明細書で使用される「全畳み込みニューラルネットワーク」は、いずれの完全接続レイヤ、または、ネットワークの端部にて通常みつかるマルチレイヤパーセプトロンズ(MLPs)のない、畳み込みレイヤからなるニューラルネットワークである。全畳み込みネットは、全てのレイヤにおける学習フィルタである。ネットワークの端部にある意思決定レイヤでさえも、フィルタを学習する。全畳み込みネットは、表現を学習しようと試み、局部的な空間的入力に基づいて意思決定する。
実施形態によれば、全畳み込みネットワークは、その活性化機能が、次のプロパティを満たす特定のレイヤにおける場所(I,j)にて、出力データベクトルy
ijを生成する形態のレイヤのみを持つ畳み込みネットワークである。
ここで、x
ijは、特定のレイヤにおける場所(i,j)におけるデータベクトルであり、y
ijは、これに続くレイヤにおける前記場所におけるデータベクトルであり、ここで、y
ijは、ネットワークの活性化機能により生成される出力であり、ここで、kは、カーネルサイズと呼ばれ、sは、ストライドまたはサブサンプリングファクタであり、f
ksは、次のレイヤタイプを決定する:畳み込みまたは平均プーリングのための行列の乗算、maxプーリングのための空間的max、または、活性化機能のための要素毎の非直線性、他のタイプのレイヤに対するものなど。この関数形態は、次の変換ルールにしたがうカーネルサイズおよびストライドをもってして、組成の下で維持される。
一般的なディープネットが、一般的な非線形関数を計算する一方で、この形態のレイヤのみを持つネットは、非線形フィルタを計算する。これはまた、ディープフィルタまたは全畳み込みネットワークとも呼ばれる。FCNは、いずれのサイズの入力を自然に処理し、(おそらくは再サンプルされた)空間次元に対応する出力を生成する。様々な全畳み込みネットワークの性質のより詳細な説明については、Jonathan Long、Evan Shelhamer、およびTrevor Darrell:「Fully Convolutional Networks for Semantic Segmentation」、CVPR 2015を参照されたい。
本明細書で使用される「アテンション機械学習ロジックプログラム」は、特定のパラメータに加重を割り当てるようトレーニングされたMLLであり、これにより、加重は重要度を示し、他のプログラムのアテンションは、それらのパラメータを分析することに費やすことができる。これらの加重は、「アテンション加重」とも呼ばれ、埋め込みまたはタイルの予測パワーを示す(しかしながら、このタイルの特徴に基づいて実行される分類予測の確実性は示さない)。アテンションMILの背後にあるアイデアとは、現在のコンテキストにおける特定の関連性のものである利用可能なデータのサブセットに選択的に注目する人の脳の能力をシミュレーションすることである。アテンションMILは、例えば、テキストマイニングの分野において、加重および計算リソースを、センテンスから意味を導き出すために特に重要な特定の言葉に選択的に割り当てることに使用される。言葉の全てが等しく重要であるわけではない。それらのいくつかは、文を他のものよりも特徴付ける。アテンションMILに、トレーニングデータセットについてトレーニングさせることにより生成されたアテンションモデルは、センテンスベクトルが、「重要」な言葉により多くのアテンションを有することができる、ということを指定することができる。一実施形態によれば、トレーニング済みアテンションMILは、検査された各特徴ベクトルにおける各特徴値に対して加重を計算し、各特徴ベクトルにおける全ての特徴値の加重された合計を計算するよう適合されている。この加重された合計は、タイルの全体特徴ベクトルを具現化する。
実施形態によれば、MLLは、アテンションMILである。アテンションMILは、ニューラルネットワークにその入力(または特徴)のサブセットに焦点を合わせる能力を装備するように適合されたニューラルアテンション機構を備えるMLLであり、各入力に対してアテンション値agを計算し、アテンション値に基づいて特定の入力を選択する。実施形態によれば、x∈Rdを入力ベクトル、z∈Rkを特徴ベクトル、a∈[0,1]kをアテンションベクトル、g∈Rkをアテンショングリムプス、およびfφ(x)を、パラメータφを用いるアテンションネットワークとする。アテンション値は、
として計算され、式中、
は要素毎の乗算であり、zはパラメータθを有する別のニューラルネットワークfθ(x)の出力である。実施形態によれば、アテンション値は、ソフトアテンションとして使用され、これは、0と1との間のアテンション値の(ソフト)マスク、またはそれらの値が正確に0または1、すなわちa∈{0,1}kであるように制約されている場合のハードアテンションを特徴に乗算する。後者の場合、ハードアテンションマスクが使用されて、特徴ベクトル:g~=z[a](Matlab表記)に直接インデックス付けし、これにより、その次元を変更し、ここでg~∈Rm、m≦kとなる。
[本発明1001]
組織画像(212、712~718、822~282)を分類するための方法(100)であって、
-画像分析システム(200)により、複数のデジタル画像(212、712~718、822~282)を受信すること(102)であって、前記デジタル画像のそれぞれが、患者の組織サンプルを示す、受信すること(102)と、
-前記画像分析システムにより、受信した各画像を画像タイルのセット(216、902~906、940、942)に分割すること(104)と、
-前記タイルのそれぞれについて、前記画像分析システムにより、前記タイルから選択的に抽出された画像特徴を含む特徴ベクトル(220)を計算すること(106)と、
-任意の入力画像を、前記入力画像の全てのタイルから抽出された前記特徴ベクトルに基づいて少なくとも2つの異なるクラスのうちの一つのメンバとして分類するためのモデルを使用するように構成された、マルチインスタンス学習(MIL)プログラム(226)を提供すること(108)と、
-前記タイルのそれぞれについて、前記タイルが導き出された前記画像の分類に対する前記タイルの特徴ベクトルの寄与に関する前記モデルの確実性を示す確実性値(221)を計算すること(110)と、
-各画像について、
・前記MILプログラム(226)により、前記画像から抽出された前記特徴ベクトルを前記画像の前記タイルの前記確実性値(221)の関数としてグローバル特徴ベクトル(995)に集約する(111)ための確実性値ベースのプーリング関数(996)を使用し、前記グローバル特徴ベクトルから集約予測値(997)を計算すること(112)、または
・前記MILプログラムにより、前記画像の前記特徴ベクトル(220)のそれぞれから予測値(998)を計算し(113)、前記MILプログラム(226)により、前記画像の前記予測値を集約予測値(997)に集約するための確実性値ベースのプーリング関数(996)を、前記画像の前記タイルの前記確実性値の関数として使用すること(114)と、
-前記MILプログラムにより、前記画像のそれぞれを、前記集約予測値に基づいて前記少なくとも2つの異なるクラスのうちの一つのメンバとして分類すること(116)と
を含む、方法。
[本発明1002]
-GUIを介して、前記分類結果をユーザに出力すること、および/または
-前記分類結果を他のアプリケーションプログラムに出力すること
をさらに含む、本発明1001の方法。
[本発明1003]
-前記MILプログラムが、バイナリMILプログラムであり、
-前記少なくとも2つのクラスが、「陽性クラス」と呼ばれる第1のクラスおよび「陰性クラス」と呼ばれる第2のクラスからなり、
-前記MILモデルが、当該画像のタイルのうちの少なくとも1つについて、当該タイルの前記特徴ベクトルが前記「陽性クラス」の証拠を含むと予測した場合、前記画像のいずれか1つが前記「陽性クラス」に分類され、
-前記MILモデルが、当該画像の全てのタイルについて、それらのそれぞれの前記特徴ベクトルが前記「陽性クラス」の証拠を含まないと予測した場合、前記画像のいずれか1つが前記「陰性クラス」に分類される、
前記本発明のいずれかの方法。
[本発明1004]
前記確実性値ベースのプーリング関数がテスト時に使用され、
前記MILプログラムを提供すること(108)が、
-トレーニング画像のセットから生成されたトレーニングタイルのセットから特徴ベクトルを抽出することと、
-前記特徴ベクトル上で前記MILプログラムをトレーニングすることによって、トレーニング時に、テスト時に使用されたのと同じ確実性値ベースのプーリング関数を使用するか、またはトレーニング時に、テスト時に使用された確実性値ベースのプーリング関数ではない別の確実性値ベースのプーリング関数を使用することと
を含み、
好ましくは、トレーニング時に使用される前記確実性値ベースのプーリング関数が、確実性値ベースの最大プーリング関数または確実性値ベースの平均プーリング関数であり、テスト時に使用される前記確実性値ベースのプーリング関数が、確実性値ベースの最大プーリング関数である、
前記本発明のいずれかの方法。
[本発明1005]
前記確実性値ベースのプーリング関数が、確実性値ベースの最大プーリング関数であり、前記確実性値ベースのプーリング関数を使用することが、前記画像のそれぞれについて、サブ方法a)、b、c)またはd)を含み、前記サブ方法が、それぞれ、
-a1)各タイルの予測値(h,998)を、当該タイルに対して計算された確実性値(c,221)によって加重し、それによって加重予測値(wh,228)を取得すること、
-a2)前記画像の前記全てのタイルについて計算された全ての加重予測値の最大値(wh
max
)を特定すること、および
-a3)前記最大加重予測値(wh
max
)を前記集約予測値(997)として使用すること、または
-b)前記最大確実性値(c
max
)を有する前記タイルの前記予測値(h,998)を前記集約予測値(997)として使用すること、または
-c1)前記タイルのそれぞれの前記特徴ベクトル(fv,220)を、当該タイルについて計算された前記確実性値(c,221)によって加重し、それによって加重された特徴ベクトル(wfv)を取得すること、
-c2)画像の全てのタイルについて計算された全ての加重特徴ベクトルの最大値(wfv
max
)を特定すること、または
-d)前記最大確実性値(c
max
)を有する前記タイルの前記特徴ベクトル(fv)を前記グローバル特徴ベクトル(995)として使用すること
を含む、前記本発明のいずれかの方法。
[本発明1006]
前記確実性値ベースのプーリング関数が、確実性値ベースの平均プーリング関数であり、
前記確実性値ベースのプーリング関数を使用することが、前記画像のそれぞれについて、
-各タイルの前記特徴ベクトル(fv)を、当該タイルに対して計算された確実性値(c)によって加重し、それによって加重特徴ベクトル(wfv)を取得すること、および前記グローバル特徴ベクトルを、前記画像の全ての前記加重特徴ベクトル(wfv)の平均として計算すること、または
-各タイルの予測値(h)を、当該タイルに対して計算された確実性値(c)によって加重し、それによって加重予測値(wh)を取得すること、前記画像の前記加重予測値の前記平均を計算すること、および前記計算された平均を前記集約予測値として使用すること
を含む、前記本発明のいずれかの方法。
[本発明1007]
前記MILプログラムがニューラルネットワークであり、前記ニューラルネットワークのモデルのトレーニング時および/またはテスト時にドロップアウト技術を使用して前記確実性値が計算される、前記本発明のいずれかの方法。
[本発明1008]
前記確実性値が、モンテカルロドロップアウト(MCドロップアウト)として計算される、本発明1007の方法。
[本発明1009]
前記ドロップアウト技術および/または前記確実性値ベースのプーリング関数が、前記モデルのトレーニング時ではなくテスト時に使用される、前記本発明のいずれかの方法。
[本発明1010]
前記ニューラルネットワークが、1つ以上の非活性化されたドロップアウトレイヤを含み、前記非活性化されたドロップアウトレイヤが、トレーニング時に活性化されかつテスト時に非活性化されたドロップアウトレイヤであり、前記方法が、テスト時に前記1つ以上のドロップアウトレイヤを再活性化することを含み、または
トレーニング時における前記ニューラルネットワークが、いかなるドロップアウトレイヤも含まず、前記方法が、テスト時における1つ以上のドロップアウトレイヤを前記ニューラルネットワークに追加することを含み、
テスト時における前記タイルのいずれか1つについての前記確実性値を計算することが、
-前記タイルのそれぞれについて、前記タイルから抽出された前記特徴ベクトルに基づいて予測値(h
d
)を複数回計算することであって、前記予測値(h
d
)が計算されるたびに、前記ネットワークのノードの異なるサブセットが前記1つ以上の再活性化または追加されたドロップアウトレイヤによってドロップされる、計算することと、
-前記タイルのそれぞれについて、前記タイルについて計算された前記複数の予測値(h
d
)の前記変動性の関数として前記タイルの前記確実性値を計算することであって、前記変動性が大きいほど、前記確実性値(c)が小さくなる、計算することと
をさらに含む、本発明1008または1009の方法。
[本発明1011]
受信された前記デジタル画像が、
-組織サンプルのデジタル画像であって、それらのピクセル強度値が、非バイオマーカ特異的染料、特にヘマトキシリン染色剤またはH&E染色剤の量と相関する、組織サンプルのデジタル画像、および/または
-組織サンプルのデジタル画像であって、それらのピクセル強度値が、前記組織サンプルに含まれるバイオマーカを選択的に染色するよう適合されたバイオマーカ特異的染料の量と相関する、組織サンプルのデジタル画像
を含む、前記本発明のいずれかの方法。
[本発明1012]
前記MILプログラムを提供することが、前記MILプログラムのモデルをトレーニングすることを含み、
前記トレーニングすることが、
-組織サンプルのデジタルトレーニング画像のセットを提供することであって、各デジタルトレーニング画像が、少なくとも2つのクラスのうちの1つを示すクラスラベルが割り当てられている、提供すること、
-各トレーニング画像をトレーニング画像タイルに分割することであって、各トレーニングタイルが、前記トレーニングタイルが導き出された前記デジタルトレーニング画像と同じクラスラベルが割り当てられている、分割すること、
-前記タイルのそれぞれについて、前記画像分析システムにより、前記タイルから選択的に抽出された画像特徴を含むトレーニング特徴ベクトルを計算すること、および/または
-前記トレーニングタイルの予測クラスラベルと、前記トレーニングタイルに実際に割り当てられた前記クラスラベルとの差を示す損失関数の誤差が最小化されるように、前記MILプログラムの前記モデルを繰り返し適応させることであって、前記予測クラスラベルが、前記トレーニングタイルの前記特徴ベクトルに基づいて前記モデルによって計算されている、適応させること
を含む、前記本発明のいずれかの方法。
[本発明1013]
受信された前記デジタル画像のそれぞれについて、
-各タイルの予測値(h)を、当該タイルに対して計算された確実性値(c)によって加重し、それによって加重予測値(wh)を取得することと、
-前記MILプログラムにより、最も高い加重予測値(wh)が計算された前記画像の前記タイルのうちの1つを特定することと、
-前記画像の他のタイルのそれぞれについて、前記他のタイルの前記加重予測値(wh)を前記最も高い加重予測値と比較することによって関連性インジケータを計算することであって、前記関連性インジケータが、比較された前記加重予測値の差と負に相関する数値である、計算することと、
-前記関連性インジケータの関数として前記画像(712~718,812~828)の関連性ヒートマップ(722~728,822~828)を計算することであって、前記関連性ヒートマップの前記ピクセル色および/またはピクセル強度が、前記画像内の前記タイルに対して計算された前記関連性インジケータを示す、計算することと、
-GUI上に前記関連性ヒートマップを表示することと
をさらに含む、前記本発明のいずれかの方法。
[本発明1014]
-受信された前記画像を画面のGUI上に表示することであって、前記画像が、前記分類の結果にしたがって前記GUI内で前記少なくとも2つの異なるクラスにグループ化される、表示すること
をさらに含む、前記本発明のいずれかの方法。
[本発明1015]
前記少なくとも2つのクラスのそれぞれが、
-特定の薬物に対して反応性のある患者、
-転移または特定の形態の転移(例えば、微小転移)を発症した患者、
-特定の治療に対する特定の反応、例えば病理学的完全奏効(pCR)を示すがん患者、
-特定の形態学的状態またはマイクロサテライト状態を示すがん患者組織、
-特定の薬物に対する有害反応を発症した患者、
-特定の遺伝的属性、例えば特定の遺伝子シグネチャを有する患者、および/または
-特定のRNA発現プロファイルを有する患者
を含むグループから選択される、前記本発明のいずれかの方法。
[本発明1016]
前記確実性値ベースのプーリング関数(996)が、確実性値ベースの最大プーリング、平均プーリング、またはアテンションプーリング関数である、前記本発明のいずれかの方法。
[本発明1017]
-どのタイル由来特徴ベクトルがタイルのクラスメンバシップを予測するために最も関連するかを学習したトレーニングされたアテンションMLL(222)を提供すること、
-前記タイルのそれぞれのアテンション加重(aw)を、前記アテンションMLLによって前記それぞれのタイルの前記特徴ベクトルの関数として計算することであって、前記アテンション加重が、クラスに対する当該タイルのメンバシップに関する当該タイルの特徴値の関連性の指標である、計算すること、
-前記タイルのアテンション加重特徴値を有するアテンションベース特徴ベクトルを取得するために、前記タイルのアテンション加重(aw)に前記タイルの特徴ベクトル値を乗算すること;ならびに前記アテンションベースの特徴ベクトルを、前記スライドの前記予測値(h)、前記確実性値(c)、および/または前記加重予測値(wh)を計算するために前記MILプログラムに入力される前記特徴ベクトルとして使用することであって、それによって前記予測値(h)、前記確実性値(c)、および/または前記加重予測値(wh)が、アテンションベースの予測値、アテンションベースの確実性値、および/またはアテンションベースの加重予測値として計算される、使用すること、または
-前記アテンションベースの予測値、前記アテンションベースの確実性値、および/または前記アテンションベースの加重予測値を取得するために、前記タイルの前記アテンション加重(aw)に、前記タイルの前記予測値(h)、前記確実性値(c)を、または前記MILによって計算された前記タイルの前記加重予測値(wh)を、乗算すること
をさらに含む、前記本発明のいずれかの方法。
[本発明1018]
組織画像を分類するための画像分析システムであって、
-少なくとも1つのプロセッサ(202)と、
-患者の組織サンプルをそれぞれ示すデジタル画像を含む揮発性または不揮発性記憶媒体(210)と、
-前記少なくとも1つのプロセッサによって実行可能であり、前記画像のそれぞれを画像タイルのセット(216)に分割するように構成された、画像分割モジュール(214)と、
-前記少なくとも1つのプロセッサにより実行可能であり、前記タイルのそれぞれに対して、前記タイルから選択的に抽出された画像特徴を含む特徴ベクトル(220)を計算するように構成された、特徴抽出モジュール(218)と、
-前記少なくとも1つのプロセッサによって実行可能であり、前記入力画像の全てのタイルから抽出された前記特徴ベクトルに基づいて、少なくとも2つの異なるクラスのうちの一つのメンバとして任意の入力画像を分類するためのモデルを使用するように構成された、マルチインスタンス学習(MIL)プログラム(226)と
を備え、前記MILプログラムが、
-前記タイルのそれぞれについて、前記タイルが導き出された前記画像の分類に対する前記タイルの特徴ベクトルの寄与に関する前記モデルの確実性を示す確実性値を計算すること(110)と、
-各画像について、
・前記MILプログラム(226)により、前記画像から抽出された前記特徴ベクトルを前記画像の前記タイルの前記確実性値(221)の関数としてグローバル特徴ベクトル(995)に集約する(111)ための確実性値ベースのプーリング関数(996)を使用し、前記グローバル特徴ベクトルから集約予測値(997)を計算すること(112)、または
・前記MILプログラムにより、前記画像の前記特徴ベクトル(220)のそれぞれから予測値(998)を計算し(113)、前記MILプログラム(226)により、前記画像の前記予測値を集約予測値(997)に集約するための確実性値ベースのプーリング関数(996)を、前記画像の前記タイルの前記確実性値の関数として使用すること(114)と、
-前記MILプログラムにより、前記画像のそれぞれを、前記集約予測値に基づいて前記少なくとも2つの異なるクラスのうちの一つのメンバとして分類すること(116)と
のためにさらに構成された、画像分析システム。
図1は、本発明の実施形態にかかる方法のフローチャートを示している。本方法は、患者の組織画像を分類するために使用されることができる。分類は、例えば、患者の属性値、例えば、バイオマーカの状態、診断、処置転帰、結腸直腸がんまたは乳がんなどの特定のがんのマイクロサテライト状態(MSS)、リンパ節の微小転移、および診断生検における病理学的完全奏効(pCR)を予測するために行うことができる。予測は、モデルの不確実性を考慮したトレーニングされたMILプログラムを使用した組織学スライドのデジタル画像の分類に基づく。図1の以下の説明では、図2、図15、および図16の要素も参照される。
方法100は、これまで知られていない予測的組織学的シグネチャを同定するために、および/または組織試料を非常に正確に分類するために使用されることができる。
最初のステップ102において、(例えば、図2を参照して説明したような)画像分析システム200は、複数のデジタル組織画像212を受信する。例えば、各組織画像は、患者、例えばがん患者から採取されたスライド全体の組織サンプルを描くことができる。患者群の各患者について、少なくとも1つのデジタル組織画像が受信される。例えば、デジタル組織画像は、ローカルまたはリモートの揮発性または不揮発性記憶媒体210、例えばリレーショナルデータベースから読み取られることができ、または顕微鏡もしくはスライドスキャナなどの画像取得装置から直接受信されることができる。例えば、受信画像は、例えばFFPET組織ブロックスライスの形態で提供される組織標本をそれぞれ描写することができる。テスト時では、各受信画像の「エンドポイント」または「クラスラベル」は不明であり、これは、組織サンプルが由来する患者が特定の疾患もしくは疾患段階を有するか否か、またはこの患者が特定の処置に応答するか否かが不明であることを意味する。
次に、ステップ104において、画像分析システムは、受信した各画像を一組の重なり合うまたは重なり合わない画像タイル216に分割する。例えば、分割は、分割モジュール214によって実行されることができる。
一実施形態によれば、受信した画像ならびに生成されたタイルは、マルチチャネル画像である。
次に、ステップ106において、画像分析システムは、タイルのそれぞれに対して、特徴ベクトル220を計算する。特徴ベクトルは、前記タイルに描かれている組織パターンから選択的に抽出された画像特徴を含む。任意に、特徴ベクトルは、これに加えて、遺伝子的特徴、または画像およびそれぞれのタイルが導き出される、その患者に対して利用可能な他の患者、もしくは、患者関連データを含むことができる。いくつかの実施形態によれば、特徴抽出は、トレーニング済み特徴抽出モジュール218により行われる。特徴抽出モジュールは、トレーニングされたMILプログラムのサブモジュールとすることもでき、別個のアプリケーションプログラムまたはプログラムモジュールとすることもできる。特に、特徴抽出モジュール218は、トレーニングされたMLLとすることができる。特徴抽出MLLは、特徴ベクトル-タイルと特徴ベクトル-画像の関係を維持しながら、タイル毎に特徴ベクトルを生成することができる。他の実施形態は、特徴ベクトルが計算されるタイルに描写された組織領域を記述する多種多様な特徴を提供するための特徴抽出アルゴリズムを含む従来のハンドコーディングされたソフトウェアプログラムとして実装された特徴抽出モジュールを使用することができる。特徴ベクトルの特徴は、それぞれのタイルに含まれる画像情報から完全にまたは少なくとも部分的に抽出され、画像の他のタイルのいずれか1つから抽出された特徴を含まないため、特徴ベクトルは、このタイルに描かれた組織領域の光学特性を表す。したがって、特徴ベクトルは、タイルに描かれた組織の電子組織シグネチャと見なすことができる。
次に、ステップ108において、マルチインスタンス学習(MIL)プログラム226が提供される。例えば、MILプログラムは、画像分析システム200、例えばコンピュータにインストールおよび/またはインスタンス化された既にトレーニングされたMILプログラムとすることができる。次いで、トレーニングされインスタンス化されたMILプログラムは、受信した組織画像を分類するためのテスト時に受信したデジタル組織画像のタイルを処理する。
図1は、テスト時に組織画像を分類するための既にトレーニングされたMILプログラムの使用を示している。ステップ108において提供されるトレーニングされたMILプログラムを生成するために、所定の既知のエンドポイント(例えば、生存、応答、遺伝子シグネチャなど)を有する患者から組織ブロックを採取する必要があり、これらの組織サンプルのデジタルトレーニング画像が取得される。エンドポイントは、MILプログラムのトレーニングに用いられる各トレーニング画像のクラスラベルとして用いられる。例えば、組織ブロックはスライスされ、それらのスライスは、顕微鏡検査法でのスライド上にセットされる。続いて、スライスは、H&E、および/または、各種のバイオマーカ特異的染料などの、1つ以上の組織学的に関連する染色剤を用いて染色される。トレーニング画像は、染色された組織スライスから、スライドスキャナ顕微鏡などを使用して撮像される。トレーニング画像は、何年も前に取得された組織サンプル画像とすることができる。古い画像データセットは、処置の成功、疾患の進行、副次的影響などの、多くの関連するイベントの結果が同時に既知となり、その既知のイベントがラベルとして割り当てられている組織画像を含むトレーニングデータセットを生成することに使用されることができる、という利点を有することができる。いくつかの実施形態では、トレーニング画像データセットは、患者毎に1つ以上のトレーニング画像を含むことができる。例えば、同じ組織サンプルが、異なる染色プロトコルにしたがって複数回染色されることができ、これにより、各染色プロトコルに対して、トレーニング画像が取得される。代替的に、いくつかの隣接する組織サンプルスライスはそれぞれ、同じまたは異なる染色プロトコルを用いて染色されることができ、組織サンプルスライドのそれぞれに対して、トレーニング画像が取得される。受信したトレーニング画像のそれぞれには、少なくとも2つの異なる、予め定められたラベルの内の1つが割り当てられる。各ラベルは、その組織が、ラベル付けされたトレーニング画像に描かれている、患者の患者関連属性値を示す。属性値は、任意のタイプ、例えば、ブール、数値、文字列、順序パラメータ値などとすることができる。ラベルは、受信したトレーニング画像に手動または自動で割り当てることができる。例えば、ユーザは、スライドスキャナのソフトウェアを、取得する画像に、それらの取得中に、特定のラベルが自動的にラベル付けされるように構成してもよい。これは、例えば、特定の薬Dに反応を示すことがわかっている、第1のグループの100人の乳がん患者の100の組織画像、および、この反応を示さないことがわかっている、第2のグループの120人の乳がん患者の120の組織画像など、同じ患者関連属性値/エンドポイントを有する大きなグループの患者の組織サンプル画像が順次取得されるシナリオにおいて助けとなることができる。ユーザは、第1のグループのトレーニング画像が取得される前に一度だけ、そして続いて、第2のグループのトレーニング画像が取得される前に再度、撮像された画像に割り当てられるラベルをセットしなければならない場合がある。次に、各トレーニング画像は、本明細書では「トレーニングタイル」と呼ばれる複数のタイルに分割される。トレーニングタイルの数は、トレーニングデータセットを強化するために、異なるサイズおよび倍率レベルを有する、および/または、いくらかのシミュレーションされたアーチファクトおよびノイズを含む、既存のトレーニングタイルの変更されたコピーを生成することにより、増やされることができる。いくつかの場合では、複数のバッグが、本発明の実施形態について本明細書に記載されるように、バッグにおけるインスタンスを繰り返しサンプリングし、選択されたインスタンスを追加的なバッグに置くことにより生成されることができる。この「サンプリング」はまた、トレーニングデータセットを強化する正の効果を有することができる。MILプログラムは、同じ画像のタイルの各セットを、バッグラベルを決定する必要があるタイルのバッグとして扱う。このラベル決定は、画像クラスが決定されるラベルに対応するため、画像を分類するタスクに対応する。
テスト時に受信した各デジタル組織画像から抽出されたベクトルは、トレーニングされたMILプログラム226への入力として提供される。特徴ベクトルは、最初に取得された特徴ベクトルの形態で、または「埋め込み」とも呼ばれる正規化された形態で提供されることができる。
次に、ステップ110において、MILプログラムは、各タイルの確実性値221を計算する。例えば、特定のタイルkに対するモデル確実性値ckは、a)ドロップアウト技術によって生成されたn個の異なるドロップアウトレイヤを使用して複数の異なる予測値hk1、hk2,...,hknを計算すること、b)予測値hk1、hk2,...,hknの変動性を決定すること、およびc)この変動性の関数として確実性値ckを計算することによって計算されることができ、変動性は確実性値と負に相関する。異なるドロップアウトネットワークアーキテクチャに基づいて計算された予測値hk1、hk2,...,hknの大きな変動性は、トレーニングされたMILプログラムのモデルが、画像分類結果に対するタイルから導き出された特徴の寄与について「確信」がないことを意味する。
予測値hのいずれかを計算するために、MILプログラムは、予測値「h」と呼ばれる数値228をタイルのそれぞれについて計算するためにタイルの特徴ベクトル220を分析する。予測値「h」は、画像に潜在的に割り当てられる特定のクラスラベルに対する、タイルに関連付けられた特徴ベクトルの予測パワーを示す。換言すれば、この数値は、このタイルに描かれた組織パターンを考慮して、特定のクラスにおいてタイルが導き出された画像のメンバシップについての特定の特徴ベクトルの予測パワー、すなわち「予後値/能力」を表す。例えば、トレーニングされたMILプログラムは、タイルが導き出された画像のクラスメンバシップ上のタイルから抽出された特徴値の寄与を予測することを学習することができる。例えば、この「寄与」は、現在分析されているタイルの特徴ベクトルを考慮して、画像が特定のクラスに属する可能性と相関するおよび/またはその可能性を示す数値とすることができる。
画像を分類するための2つのアプローチにしたがうことができる。
1つのアプローチによれば、ステップ113において、分類されるべき画像のタイルのそれぞれについて、予測値h、998が、このタイルから抽出された特徴ベクトルの関数としてMILプログラムによって計算される。このステップ113は、ステップ110の一部として既に実行されていてもよい。しかしながら、予測値hを使用せずに確実性値を計算する必要がある場合、ステップ113が実行される必要がある。次に、ステップ114において、確実性値ベースのプーリング関数996が予測値998に適用され、画像のタイルに対して計算された予測値だけでなく確実性値221も統合する集約予測値997が計算される。ステップ113および114によるこのアプローチは、例えば図15に示されている。
代替的なアプローチによれば、ステップ111において、画像のそれぞれのタイルから抽出された特徴ベクトルは、特徴ベクトル220からグローバル特徴ベクトル995を計算する確実性値ベースのプーリング関数996に入力され、それにより、それぞれのタイルに対して計算された確実性値221が考慮される。グローバル特徴ベクトルは、画像のタイルに対して計算された特徴ベクトルだけでなく、確実性値221も統合する。次に、ステップ112において、集約予測値887を計算するために、グローバル特徴ベクトルがMILプログラムの予測モデル999に入力される。ステップ111および112によるこのアプローチは、例えば図15に示されている。
最後に、ステップ116において、テスト時に受信されたデジタル組織画像212のそれぞれが、集約予測値にしたがって分類される。例えば、プーリング関数が最大プーリング関数である場合、この画像の全てのタイルから得られた最大加重予測値whが所定の閾値を超える場合、画像は、特定の「陽性」クラスのメンバであると分類される。そうでない場合、画像は、この特定のクラスのメンバではないと分類される。バイナリクラス設定では、この結果は、2つの可能なクラスの他方における画像のメンバシップを意味する。
場合によっては、クラスメンバシップを予測するためにどの特徴ベクトルが最も関連するかを学習した追加のトレーニングされたアテンションMIL222が提供される。タイルの関連性は、アテンションMILによって計算された「アテンション加重」awとして表される。場合によっては、各タイルに対してアテンションMILによって計算されたアテンション加重は、各タイルの特徴ベクトル値と乗算される。乗算の結果、加重特徴値を有する特徴ベクトルがタイル毎に取得され、この特徴ベクトルは、予測値h、確実性値c、および加重予測値whを計算するためのMILプログラムへの入力として使用される。他の実施形態では、アテンションMILによって計算されたアテンション加重awは、各タイルの特徴ベクトルについてMILによって計算された予測値hまたは加重予測値whと乗算される。これは、クラスメンバシップに関する特定のタイルの予測パワーおよびその特徴値の指標として使用される加重数値ppを生成する。
実施形態によれば、トレーニングされたMILプログラムおよび画像分類結果は、患者群を層別化するために使用されることができる。これは、所与の処置以外の要因により患者を分けることを意味する。階層化は、MILプログラムにトレーニングさせる際にラベルとして使用されない患者関連属性に基づいて行われることができる。例えば、そのような患者関連属性は、年齢、性別、他の人口統計学的要因、または、特定の遺伝子的もしくは生理的形質とすることができる。GUIは、ユーザが、ラベルとして使用されなかった、前記患者関連属性いずれか1つに基づいて、それらの組織画像が、MILプログラムをトレーニングするために使用された患者のサブグループを選択し、そのサブグループにおける、トレーニング済みMLLの予測の正確さを選択的に計算することを可能にする。例えば、サブグループは、女性患者、または60歳を超える患者からなることができる。女性/男性、または、60歳を超える/未満の患者などのそれぞれのサブグループに対して選択的に取得された正確さは、いくつかのサブグループにおける、トレーニング済みMILの特定の高いまたは低い正確さを明らかにすることができる。これは、変数(リサーチャが検討しているもの以外の変数)を混ぜ合わせることを可能にすることができ、これにより、リサーチャが、変数間の関係を検出して解釈し、特定の薬から最も恩恵を被る患者グループを特定することを容易にする。
図2は、本発明の実施形態にかかる画像分析システム200のブロック図を示している。
画像分析システム200は、1つ以上のプロセッサ202と、揮発性または不揮発性記憶媒体210と、を備える。例えば、記憶媒体は、電磁ドライブまたはフラッシュドライブなどのハードディスクドライブとすることができる。これは、磁気ストレージ、半導体ベースのストレージ、または光学データストレージとすることができる。記憶媒体は、一時的にのみデータを含む、メインメモリなどの揮発性媒体とすることができる。
記憶媒体は、エンドポイントが未知の、患者からの組織サンプルの複数のデジタル画像212を含む。
画像分析システムは、画像212のそれぞれを複数のタイルに分割するように構成されている分割モジュール214を備える。タイルは、バッグ216にグループ化されており、これにより、典型的には、同じバッグにおける全てのタイルは、同じ患者から導き出される。バッグのラベルは、2つ以上の異なるクラスのうちの一つにおける画像のメンバシップを表し、トレーニングされたMILプログラム226によって決定および予測される必要がある。
特徴抽出モジュール218は、タイル216のそれぞれから、複数の画像特徴を抽出するように構成されている。いくつかの実施形態では、特徴抽出モジュール218は、トレーニング済みMLLまたはトレーニング済みMLLのエンコーディング部とすることができる。抽出された特徴は、それらが導き出されたタイルと関連する特徴ベクトル220として、記憶媒体210において記憶される。任意に、特徴ベクトルは、マイクロアレイデータなどのゲノムデータなどの、他のソースから導き出された患者の特徴を用いて強化されることができる。
画像分析システムは、マルチプルインスタンス学習プログラム(MILプログラム226)を含む。トレーニング中、MLLプログラム226は、特徴ベクトル220(または、モデルの不確実性を考慮し、任意にさらにアテンションMIL222によって出力されたアテンションスコアを考慮することによって生成された加重特徴ベクトル)、ならびにそれぞれのトレーニングタイルに割り当てられたラベルを受信する。トレーニングの結果として、トレーニング済みMILプログラム226が提供される。トレーニングされたMILプログラムは、タイルのそれぞれについて、タイルの予測パワーを示す加重予測値wh、およびタイルが導き出された画像のクラスラベルについてそこに示されている組織パターンを計算することを学習しており、加重は、特定のタイルの特徴ベクトルに基づいて計算されたクラスメンバシップ予測に関するモデル確実性(したがって、暗黙的に、モデルの不確実性も)を表す。画像のタイルのこれらの加重予測値は、「数値タイル関連性スコア」と呼ばれることもある。
画像分析システムは、画像分析システムの画面204上に表示されるGUI232を生成するように構成されているモジュール230をさらに備える。
GUIは、1つ以上の受信画像212のそれぞれについてMILプログラムによって生成された分類結果207を表示するように構成される。例えば、GUIは、MILプログラムによって出力されたクラスラベルを有する画像または画像タイルを表示することができる。
任意に、GUIは、タイルの少なくともいくつかと、これらのタイルに対して計算された数値228と、を含むタイルギャラリ206を含む。数値228は、例えば、それぞれのタイル上のオーバレイとして明示的に、および/または、例えば、それらのそれぞれの数値228にしたがってソートされたタイルのソート順の形態にて暗示的に、表示されることができる。ユーザがタイルの1つを選択すると、そこからタイルが元々導き出された画像の全体スライドヒートマップが表示される。他の実施形態では、タイルギャラリ206に加えて、ヒートマップがデフォルト毎に表示される。
プログラムモジュール214、215、218、222、226、230のそれぞれは、大型MILアプリケーションプログラムまたはMILトレーニングフレームワークソフトウェアアプリケーションのサブモジュールとして実装されることができる。代替的に、1つ以上のモジュールは、それぞれ、画像分析システムの他のプログラムおよびモジュールと相互運用可能な、スタンドアローンソフトウェアアプリケーションプログラムとして実装されてもよい。各モジュールおよびプログラムは、例えば、Java、Python、C#、またはいずれの他の好適なプログラミング言語にて記述された1つのソフトウェアとすることができる。
任意に、画像分析システムは、トレーニング済みMILに、画像タイルの残りについてトレーニングさせてテストするために、画像のサンプル(サブセット)を選択するよう適合されているサンプリングモジュール(図示せず)を備えることができる。サンプリングモジュールは、まず、サンプリングを行う前に、それらの特徴ベクトルに基づいて、タイルをクラスタ化することを行うことができる。
任意に、画像分析システムは、モデル確実性ベースの加重に加えて、特徴ベクトルのそれぞれおよびそれぞれのタイルに対して加重を計算するように構成されているアテンションMILプログラム222を含むことができる。アテンションMILプログラムによって計算された重みは、特徴ベクトルとともに、トレーニングフェーズにおけるMILプログラム226への入力として、および/またはMILプログラムによってタイルのそれぞれについてテスト時に計算された予測値hまたは加重された予測値whを加重するために使用されることができる。
図3および図4は、各画像タイルについて計算されたモデル出力に関するモデル不確実性をプーリング関数が考慮するMILベースの画像分類器を使用するための比較テスト結果をそれぞれ示す表を示している。本発明の実施形態は、組織画像を分類するために、例えば最大プーリング関数または平均プーリング関数などの確実に基づくプーリング関数を使用する。図3に示す大きな困難な現実のデータセット(Camelyon16)を含むいくつかのデータセットに対してテストを行った。2つのテストは、本発明の実施形態、特に確実性に基づくプーリング関数の使用が、ほとんどのタスクの予測精度を改善することを示した。Camelyon16データセットでは、本発明の実施形態はまた、インスタンスレベルの予測精度AUCを大幅に改善した。
結果は、さらに、トレーニングおよび/またはテスト時における確実性値も考慮に入れることによって、ほとんどの場合、差分法のテスト時予測を大幅に改善できることを示している。既存のモデルのテスト時予測を改善できることは望ましい特性である。大規模データセットでMIL方法をトレーニングするには、高価なインフラストラクチャが必要である。既存のモデルのテスト時の改善は、それらを再トレーニングする必要性を回避する。確実性値ベースの最大プーリング関数を使用すると、テスト時におけるMILプログラムの精度が向上する。
図3は、Camelyon-16リンパ節転移検出チャレンジの基礎として使用されたデータセットに対して得られた比較テスト結果を示す第1の表300を示している。この実験の目的は、確実性に基づくプーリング関数を使用するMILプログラムを、困難な現実のデータセット上の他のMILプログラムと比較することである。データセットは、https://camelyon16.grand-challenge.org/data/の下で入手可能である。Camelyon16は、健常であるかまたは何らかの形態の転移を示すセンチネルリンパ節から撮影された400個のヘマトキシリンおよびエオシン(H&E)染色全スライド画像(WSI)からなる。WSI自体、ならびにそれらのラベリング(健常、転移含有)に加えて、各WSIに対してピクセルレベルのセグメンテーションマスクが提供される。セグメンテーションマスクを破棄し、グローバルスライドレベルラベルのみを使用してMILプログラムのベンチマークを作成した。単純な染色正規化ステップを、LAB色空間チャネルの平均およびstdをCamelyon16トレーニングセットからの参照画像と同じになるように正規化することによってトレーニング画像に適用した。より高度な正規化は、結果をさらに改善することができる。20×解像度(これは、スライドを検討するために臨床病理医によって使用される作業倍率である)の256×256の重なり合わないトレーニングタイルの大きなセットをトレーニング画像から生成した。背景(白色)タイルを自動的に識別および破棄することによって、トレーニングタイルのセットを削減した。白色タイルの自動化されたバックグラウンド検出は、例えばPierre Courtiolら:「Classification and Disease Localization in Histopathology Using Only Global Labels:A Weakly-Supervised Approach」、2018年2月1日、arXiv:1802.02212に記載されている。トレーニングタイルは、トレーニングタイルのバッグにグループ化され、各バッグはトレーニングデータセット内のスライド/スライド画像に対応する。染色正規化と呼ばれるステップを適用して、異なるスライドおよびそれぞれのトレーニング画像における組織染色を正規化した。
ImageNetで事前トレーニングされたResnet50(Kaiming He、Xiangyu Zhang、Shaoqing Ren、およびJian Sun.Deep residual learning for image recognition.In Proc.IEEE Conf.on Computer Vision and Pattern Recognition,pp.770-778,2016年6月)の形態のMILプログラムが提供され、サイズ2048の特徴ベクトル(埋め込み)がネットワークの第2のレイヤから最終レイヤまでの各タイルについて抽出された。
MILプログラムとして使用された予測ネットワークは、5つの完全接続レイヤからなり、隠れレイヤに1024個のニューロンがあり、30%のドロップアウトおよびReLU活性化がある。アテンションネットワークが適用される場合、隠れレイヤ内の1024、512、および256個のニューロンを有する4つの完全接続レイヤが使用され、それによってネットワークはReLU、バッチ正規化、および30%ドロップアウトでトレーニングされた。全ての場合において、デフォルトパラメータとともにアダムオプティマイザを使用した。トレーニング中に、各バッグから128個のランダムなインスタンスを選択した。このサンプリング戦略は、結果を大幅に改善し、迅速なオーバーフィッティングを防止することが観察された。全ての方法について、保持された検証セット(トレーニングセットの20%)で最もよく機能するモデルを選択し、選択したモデルをCamelyon-16テストセットでテストした。テスト中、実例サンプリングは行わず、バッグ全体を分析した。加えて、腫瘍対非腫瘍タイルを正確に分類する分類器の能力は、Camelyon16データセットからの専門病理学者の腫瘍注釈を使用して、インスタンスレベルの分類器予測精度を測定することによって定量化された。加えて、テストした全ての方法についてテスト時に異なるプーリング関数を適用して、確実性値ベースのプーリング関数法を使用するMILプログラムの性能を、推論中に事前トレーニングされたモデルに適用されたときに他のプール戦略を使用するMILプログラムに対して評価および比較した。「曲線下面積-AUC」として測定された結果の精度を、図3に示す表1に示す。確実性値ベースのプーリング関数は「不確実性(平均または最大)プーリング」と呼ばれ、比較した全てのMILプログラムの中で最も高い精度を有するインスタンスレベル予測を提供する。
図4は、結腸がんデータセット(Sirinukunwattanaら:「Locality sensitive deep learning for detection and classification of nuclei in routine colon cancer histology Images」,IEEE Transactions on Medical Imaging,35(5):1196-1206,2016)で得られた比較テスト結果を示す第2の表400を示している。このデータセットは、100個のH&E画像を含む。データセットは、全てのバッグがトレーニング画像に対応し、トレーニング画像から抽出された27×27タイルを含むMILプログラム用のトレーニングデータセットとして使用された。悪性領域を含むバッグにはラベル1が与えられ、そうでなければ0が与えられる。学習が100エポックに限定されなかったことを除いて、(MaxiMILian Ilse、Jakub M.Tomczak、Max Welling:「Attention-based Deep Multiple Instance Learning」、2018年6月28日(v4)、ICML 2018論文、arXiv:1802.04712)と同じネットワークおよび学習構成を使用した。トレーニングデータセットは、トレーニングおよびテストに使用される30%/70%に分割された。トレーニングセットの20%を検証セットとして残し、最高の検証スコアに基づいてモデルを選択した。結果を表400に示す。確実性値ベースの平均プーリング関数を含むMILは、例およびバッグレベルの双方で最高の精度を達成した。
さらなるテスト(図示せず)では、キーインスタンス検索のための確実性値ベースのプーリング関数を含むMILプログラムの有用性を、合成的に生成されたトレーニングおよびテストセットに基づいて評価した。このテストでは、100個のバッグが作成され、各バッグは224×224個の画像タイルから作成された1,000個のインスタンスを有する。全てのバッグにおいて、100個のインスタンスが無地の赤色画像に設定される。バッグの半分では、100個のインスタンスが青色に設定され、それらのラベルは1に設定される。各バッグの残りのタイルは、Camelyon-16データセットからのランダム画像であるように設定される。画像は、ImageNetで事前トレーニングされたResnet50を使用して2048個の埋め込みに変換される。Yarin Galら、「Deep Bayesian Active Learning with Image Data」、2017年3月、arXiv:1703.02910v1で提案されたアテンションネットワークを使用して、全てのタイルにアテンション値を割り当てた。重要なインスタンスは、これらのスコアに基づいてバッグから検索されたが、これは、これらが出力に対する全てのタイルの寄与に影響を与えるためである。最初に、提案されたアテンションネットワークは、バッグの80%で500エポックについてトレーニングされ、残りの20%で100%のAUCでテストされた。インスタンスは、高いものから低いものまで、アテンションスコアおよび確実性値スコアを使用してランク付けされた。アテンションネットワークについては、驚くべきことに、全てのバッグに共通の赤色インスタンスが最も高いアテンションを受けることが観察された。赤色画像は、ラベルをトリガしないため、キーインスタンスではない。驚くべきことに、青色画像は最も低いアテンションを集めた。したがって、この例では、アテンションスコアの使用は、準最適な結果を提供することが観察された。反対に、確実性値ベースのスコアは、青色画像を上に、赤色画像を下にランク付けした。この合成問題は、現実の問題を表す。組織学データセットでは、主に背景または汚れを含む情報のない画像は、前処理の努力にもかかわらずデータセットのかなりの部分を構成し、全てのクラスのバッグに現れる可能性がある。このようなデータセットでアテンションネットワークをトレーニングし、それらのアテンションスコアによって画像を検索すると、情報価値のない画像が検索される可能性がある。この望ましくない効果は、実際のデジタル病理組織画像において出願人によって実際に観察された。一方、赤色画像は、全てのバッグに現れ、トレーニング中に双方のラベルから勾配を受け取るため、モデルは、それらのラベルについて不確実であると予想され、実際、それらは最も高い不確実性を有する。同様に、青色画像は、単一のラベルのみに関連付けられ、ネットワークをそれらについて非常に確実にする。
図5は、ネットワークレイヤアーキテクチャにドロップアウトを適用する効果を示している。ネットワークアーキテクチャ502は、ニューラルネットワークの3つの完全接続レイヤのニューロンおよびそれらの接続を示す。ネットワーク504は、ドロップアウトレイヤ(マスク)をレイヤのうちの1つ以上に適用した後の同じネットワークを示し、それによって、網掛けを有するノードが非活性化ノードであるネットワークアーキテクチャ504に示すように、各レイヤのノードのランダムに選択されたサブセットを非活性化する。
トレーニング中にドロップアウトレイヤを適用することは、ネットワーク重みを小さく保つことによってオーバーフィッティングを低減する(一般化誤差を低減する)ことを求める技術である(正則化方法)。より具体的には、正則化は、不良の問題をより安定した良好な問題に変換するために追加の情報を追加するアプローチのクラスを指す。ドロップアウトレイヤを適用することは、トレーニング中に1つ以上のネットワークレイヤ内のいくつかのノードおよびそれぞれの入力を確率的に除去することを意味する。
機械学習における一般的な問題は、容量が少なすぎるモデルは問題を学習することができないが、容量が多すぎるモデルは問題を学習することができず、トレーニングデータセットを過適合させる可能性があることである。双方のシナリオにおいて、モデルは十分に一般化されない。ニューラルネットワークをトレーニングする際のオーバーフィッティングを低減するための1つのアプローチは、ネットワークの複雑さを変化させることである。ニューラルネットワークモデルの容量、すなわち複雑さは、ノードおよびレイヤに関するニューラルネットワークモデルの構造と重みに関するパラメータの双方によって定義される。したがって、ネットワーク構造(加重の数)を変更することによって、および/またはネットワークパラメータ(加重の値)を変更することによって、ニューラルネットワークの複雑さを低減してオーバーフィッティングを低減することができる。例えば、構造は、適切な数のノードおよび/またはレイヤが問題に対するオーバーフィッティングを低減または除去することが判明するまで、ニューラルネットワークの完全接続レイヤ上に複数の異なるドロップアウトレイヤを適用することによって調整されることができる。
図6は、特徴ベクトル生成用の教師あり学習アプローチをサポートする、本発明の実施形態にかかる特徴抽出MLLプログラムのネットワークアーキテクチャ600を示している。一連のオートエンコーダ604からなるディープニューラルネットワークは、画像タイルから抽出された複数の特徴について、レイヤ毎の様式にてトレーニングされている。トレーニング済みネットワークは、例えば、タイルに描かれている組織を、画像タイルから抽出された光学的特徴に基づいて、クラス「ストローマ組織」、「背景スライド領域」、「腫瘍細胞」、および「転移組織」の1つのメンバとして分類する分類タスクを後に行うことができる。ネットワークアーキテクチャは、入力レイヤ603よりも大幅に少ないニューロンを有し、さらなる隠れレイヤおよび分類レイヤが続くことができる、ボトルネックレイヤ606を含む。1つの例によれば、ボトルネックレイヤは、入力レイヤのニューロンの数の約1.5%のニューロンを含む。潜在的に、数百または数千の隠れレイヤが、入力レイヤとボトルネックレイヤとの間にある。ボトルネックレイヤにより抽出された特徴は、「ディープボトルネック特徴(DBNF)」と呼ばれる場合がある。
図7は、「レポートタイルギャラリ」とも呼ばれる画像タイルギャラリを有するGUI700を示している。レポートギャラリ(行ラベル702、704、706、および708下のタイルのマトリクス)は、ユーザが、特定のラベルに関して、高い予測パワーを持つものとなると、MILプログラムにより特定された組織パターンを診査することを可能にする。ギャラリは、例えば、MILプログラムにより計算された、「薬Dを用いた処置に対する反応=真」など、対象の特定のラベル(または「クラス」)に関して、最も高い数値を有するタイルのいくつかを含む。タイルは、それらが由来する組織スライド画像(およびそれぞれの患者)に基づいてグループ化され、クラスラベルに関して計算されたそれぞれの予測値にしたがってそれらのグループ内でソートされる。
図7に示す例では、予測値を加重するためにアテンションMILを使用するMILプログラムが加重の計算に使用されたが、モデルの不確実性を考慮して加重された予測スコアにしたがってタイルがソートされている場合、ギャラリは同様に見える。したがって、本発明の実施形態によれば、GUI700は、それぞれ計算された加重予測値whにしたがってタイルが選択およびソートされたレポートタイルギャラリを含み、加重は確実性値cに対応する。図7および図8に示すタイルギャラリは、タイルの並べ替え順序が予測値または加重予測値に基づく並べ替え順序と同様であるため、説明のためだけのものである。それにもかかわらず、出願人は、特定のクラスの最も関連性のある/予測タイルを識別する精度および分類の精度が、確実性値ベースのプーリング関数を含むMILプログラムが使用されるときに最良であることを観察した。
図7に描かれたレポートギャラリは、ギャラリにおけるタイルのそれぞれに対して、トレーニング後に自動的に決定されることができる全体的な予測的正確さを含むことができる。追加的、または代替的に、レポートギャラリは、それぞれの画像に割り当てられたラベルと、このラベルに対して取得された、バッグ毎の予測的正確さと、を含むことができる。例えば、「グラウンドトゥルース=0」は、ラベル「薬Dに反応する患者」を表すことができ、「グラウンドトゥルース=1」は、ラベル「薬Dに反応しない患者」を表すことができる。MILによって計算された特定の画像の全てのタイルの最も高い数値は、前記画像から導き出されたタイルのグループの上に「予測値」hまたは「加重予測値」whとして表示される。
描かれたギャラリでは、タイル行702が、第1の患者の6つのタイルを示す。前記タイルの最初の1つには、ラベルに関して、特定の組織スライド/全スライド画像の予測パワーを示す最も高い予測値(予後値)が割り当てられる。スライドグループ毎の最初のタイルには、これに加えて、または、代替的に、特定の組織スライド画像から導き出された全てのタイルの、(MILにより提供された数値から、および、アテンションMILにより計算された加重から導かれた)最も高い、組み合わされた値が割り当てられる。
最も高い予測値は、図7に示すGUIに描かれるように、患者毎の最も高くスコア付けされたタイルの上部に表示されることができる。
最も高い予測値または最も高い加重予測値を有するタイルのサブセットのみを含むレポートタイルギャラリは、病理学者がスライド全体を検査する必要がないため、有利であり得る。むしろ、病理学者の注意は、対象のラベルに関して、最も高い予測パワーを有するように、その組織パターンが特定されている各全スライド画像の少数のサブ領域(タイル)に自動的に向けられる。
図7に描かれている実施形態によれば、レポート画像タイルギャラリは、H&Eにて染色された画像から導き出された画像タイルを示す。レポート画像タイルギャラリは、次のように整理される。
行702は、第1の患者の特定の全スライド画像712から導き出された全てのタイル内で、アテンションベースのMILプログラムによって計算された最高の数値(予測パワー、すなわち予後値を示す)が割り当てられた6つのタイルを含む。他の実施形態によれば、ソートは、MILによって計算された予測値と同一であるか、またはMILによって計算された数値の微分値、例えば加重予測値whであるスコア値に基づいて実行される。
それらのいくつかが、行712に提示されている、タイルを生成することに使用された、第1の患者の組織サンプルの、それぞれの全スライド画像712は、より高く関連するタイルの、この選択されたセット712に空間的に近接して示されている。
加えて、MILにより計算されたその加重予測値が、予測パワーを示す最も高い数値が計算された、画像712のタイルの1つの数値に類似する、全ての全スライド画像領域をハイライトする、オプションの関連性ヒートマップ722が示される。この場合では、最も高い数値が計算されたタイルの1つが自動的に特定されて選択され(例えば、行712における最初の位置にあるタイル)、関連性ヒートマップ722を計算するための根拠として使用される。代替的な実施によれば、関連性ヒートマップ722は、画像の全てのタイルに対して計算された最も高い数値に対するタイルの数値の類似性を表さないが、これはむしろ、画像の全てのタイルに対して計算された最も高い、組み合されたスコアに対するタイルの類似性を表す。組み合わされたスコアは、例えば、タイルに対して、アテンションMILにより計算された加重と、MILにより計算された、画像のラベルに関しての、タイルの予測パワーを示す数値と、の乗算などの組み合わせとすることができる。依然としてさらなる実施形態によれば、関連性ヒートマップ722は、アテンションMILにより計算されたタイルの加重の、アテンションMILにより、画像の全てのタイルに対して計算された最も高い加重に対する類似性を表す。
列704は、第2の患者の特定の全スライド画像714から導き出された全てのタイル内に、MILプログラムにより計算された、最も高い数値が割り当てられている6つのタイルを含む。それぞれの全スライド画像714は、より高く関連するタイルの、この選択されたセットに空間的に近接して示される。加えて、MILにより計算されたそのそれぞれの数値が、最も高い数値がMILにより計算された全スライド画像714のタイルの1つに高く類似する、全ての全スライド画像領域をハイライトする関連性ヒートマップ724が示される。
列706は、第3の患者の特定の全スライド画像716から導き出された全てのタイル内に、MILプログラムにより計算された、最も高い数値が割り当てられている6つのタイルを含む。それぞれの全スライド画像716は、より高く関連するタイルの、この選択されたセットに空間的に近接して示される。加えて、MILにより計算されたそのそれぞれの数値が、最も高い数値がMILにより計算された全スライド画像716のタイルの1つに高く類似する、全ての全スライド画像領域をハイライトする関連性ヒートマップ726が示される。
列708は、患者の特定の全スライド画像718から導き出された全てのタイル内に、MILプログラムにより計算された、最も高い数値が割り当てられている6つのタイルを含む。それぞれの全スライド画像718は、より高く関連するタイルの、この選択されたセットに空間的に近接して示される。加えて、MILにより計算されたそのそれぞれの数値が、最も高い数値がMILにより計算された全スライド画像718のタイルの1つに高く類似する、全ての全スライド画像領域をハイライトする関連性ヒートマップ728が示される。
実施形態によれば、レポートタイルギャラリに提示される関連性ヒートマップは、予測パワー、または、アテンションベースの加重、および/または確実性ベースの加重、またはそれらの組み合わせを示す。描かれた例では、ヒートマップにおける明るいピクセルは、タイルが、高い予測値、高い確実性値ベースの加重、またはそれらの組み合わせを有する、画像におけるエリアを描く。実施形態によれば、関連性ヒートマップを計算することは、タイルのスコア(例えば、数値、加重、または組み合された値)が、画像の最も高くスコア付けされたタイルのスコアの最小パーセンテージ値を超えているかについて決定することを含む。これが超えている場合は、関連性ヒートマップにおけるそれぞれのタイルは、第1の色または「明るい」強度値、例えば「255」により表される。これが超えていない場合は、関連性ヒートマップにおけるタイルのそれぞれは、第2の色または「暗い」強度値、例えば「0」により表される。
レポートタイルギャラリにおける各タイルは、(例えば、タイル上をダブルクリックすることにより、または、タイルをシングルクリックで選択してから、GUI要素「サーチ」を選択することにより)類似性サーチを開始するために、ユーザにより選択されることができる。続いて、例えば、図8に示すような類似性サーチタイルギャラリが表示される。
選択可能なGUI要素710のセットにおける「ブラックリスト」および「再トレーニング」要素は、ユーザが、タイルのブラックリストを画定し、ブラックリストにおけるタイルと、ブラックリストにおけるタイルに高く類似するタイルと、を除く、全てのタイルに基づいて、MILプログラムに再トレーニングさせることを可能にする。例えば、ブラックリストは、それらがアーチファクトを含むことにより、特に低い数値(予後値)を有する、または、特に高い数値を有する、手動で選択されたタイルのセットを含むことができる(非常に高い予測パワーを持つタイルの除外は、対象のラベルに関しての予測パワーをも有する、追加的な、これまでにまだわかっていない組織パターンを特定する、MILの能力を上げることができる)。画像分析システムは、特定のタイルをブラックリストに加えるユーザに応えて、ブラックリストに加えられたタイルの特徴ベクトルに対する、それらの、特徴ベクトルに基づく類似性が、最小類似性閾値を超える全てのタイルを、自動的に特定するように構成されることができる。特定されたタイルは、同様に、ブラックリストに自動的に加えられる。ユーザが、再トレーニングGUI要素を選択すると、MILは、ブラックリストにおけるタイルを除く、トレーニングデータセットの全てのタイルについて再トレーニングされる。
図8は、本発明の実施形態にかかる類似性サーチ画像タイルギャラリを伴うGUI800を示している。類似性サーチは、レポートギャラリ700におけるタイルの1つ830の、ユーザに基づく選択によりトリガされる。
このサーチは、全スライド画像812から818のそれぞれから生成されたタイル内にて、比較された特徴ベクトルの類似性に基づく、例えば、6つの最も類似するタイルのサブセットを特定する。類似性サーチにおいて特定されたタイルは、全スライド画像毎に、または、患者毎にグループ化され、その選択が類似性サーチをトリガした、タイル830(「クエリタイル」)に対するそれらの類似性にしたがう降順にてソートされる。
全スライド画像812~818と、類似性ヒートマップ822~828と、は、それらの特徴ベクトル(および、したがって、描かれた組織パターン)が、選択されたタイルの特徴ベクトルに最も類似するタイルの場所を示す。
任意に、類似性サーチタイルギャラリは、これに加えて、1つ以上の次のデータを含む:
-描かれたタイルがそこから導き出された画像に割り当てられたラベル、図8に描かれている1つのラベルは、「グラウンドトゥルース:0」、
-バッグのラベルに関して、バッグ(画像)毎にMILプログラムにより計算された予測的正確さ、
-全スライド画像において類似するタイルの数、および/または、(例えば、閾値による)類似しないものと比較しての、類似するタイルのパーセンテージ(割合)、および、
-全スライド画像における全てのタイルの類似性値の平均、中央値、またはヒストグラム。
例えば、ユーザは、最も高い予測値(例えば、最も高いhまたはwh)、したがって画像のラベル/クラスメンバシップに関して最も高い予測パワーを割り当てたレポートギャラリのタイル830のうちの1つを選択することができる。タイルの選択により、ユーザは、タイルに基づく類似性サーチを、現在選択されているタイルとは異なるラベルが割り当てられ得る多くの異なる患者のタイルおよび画像にわたって開始してよい。類似性サーチは、類似する特徴ベクトルに基づいて、類似するタイルおよび類似する組織パターンを決定するための、特徴ベクトルおよびタイルの比較に基づく。これらは、選択されたタイル(および、その組織パターン)に類似するものの、選択されたタイルのラベルとは異なるラベル(例えば、「薬Dに対する反応=真の患者」ではなく、「薬Dに対する反応=偽の患者」)を有するタイル(および、それぞれの組織パターン)の数および/または割合を評価して表示することによる。
したがって、病理学者は、「高く予測的」としてMILプログラムにより返されたタイルを選択することにより、MILプログラムにより特定された組織パターンの予測パワー、特に、過敏性および特異性を容易にチェックし、類似する特徴ベクトルを有するデータセットにおいて、どれほど多くのタイルに、選択されたタイルと同じラベルが割り当てられているかを明らかにする類似性サーチを行うことができる。これは、組織画像の予測的特徴のインジケーションをも提供することができるが、ユーザは、これらの特徴を特定することも検証することも可能ではない、最新の機械学習アプリケーションを超える、大きな利点である。レポートギャラリおよび類似性サーチギャラリに基づき、人であるユーザは、提案された高い予測的組織パターンを検証でき、高い予測パワーを有し、類似する特徴ベクトルに関連付けられている全てのタイルに示される、共通する特徴および構造を言語化することもできる。
レポートギャラリ内のタイルが選択可能であり、選択が、類似の特徴ベクトル/組織パターンを有する他のタイルを識別して表示するための類似性検索の実行をトリガするという特徴は、ユーザが関心のあるレポートタイルギャラリ内の任意の画像タイルをユーザが自由に選択することを可能にすることができる。例えば、病理学者は、組織パターン、および上述したように最も高い予測パワー(MILによって計算された最も高い数値)を有するそれぞれのタイルに関心を持つことができる。代替的に、病理学者は、典型的には、特定の低い予測パワー(特定の低い数値)を有するアーチファクトに興味を持ち得る。さらに代替的に、病理学者は、例えば、それが、薬のいくらかの副次的影響、または、関連するいずれの他の生物医学的情報を明らかにするからといった、いずれの他の理由により、特定の組織パターンに興味を持ち得る。病理学者は、それぞれのレポートタイルギャラリにおけるタイルのいずれの1つを自由に選択する。これにより、病理学者は、類似性サーチと、その結果を、類似性タイルギャラリの形態にて計算して表示することと、をトリガする。この表示と、GUIと、は、類似性サーチの完了後に自動的にリフレッシュされることができる。
いくつかの実施形態によれば、類似性サーチギャラリの計算と表示とは、類似性ヒートマップ822~828の計算と表示とを含む。ヒートマップは、類似するタイルおよびそれぞれの特徴ベクトルを、色および/またはピクセル強度においてエンコードする。類似する特徴ベクトルを有する画像領域およびタイルは、ヒートマップにて、類似する色、および/または、高または低ピクセル強度とともに表される。したがって、ユーザは、全スライド画像における特定の組織パターンシグニチャの分布の概要を迅速に取得できる。ヒートマップは、異なるタイルをシンプルに選択することにより、容易にリフレッシュされることができる。なぜなら、この選択が、新たに選択されたタイルの特徴ベクトルに基づく、特徴ベクトルの類似性の再計算を自動的に誘起するからである。
実施形態によれば、類似性サーチギャラリは、類似性ヒートマップを含む。本方法は、従属的方法により、類似性ヒートマップを生成することを含む。本従属的方法は、
-レポートタイルギャラリにおけるタイルの1つを選択することと、
-受信した画像のいくつかまたは全ての他のタイルのそれぞれに対して、選択されたタイルに関して、類似性スコアを、同じ画像と、選択されたタイルの特徴ベクトルを有する他の画像の、他のタイルの特徴ベクトルを比較することにより計算することと、
-それらのタイルが、それぞれの類似性スコアを計算するために使用された画像のそれぞれに対して、それぞれの類似性ヒートマップを、選択されたタイルに対する、前記画像におけるタイルの類似性を示す類似性ヒートマップの類似性スコア、ピクセルカラー、および/またはピクセル強度の関数として計算することと、
-類似性ヒートマップを表示することと、を含む。
実施形態によれば、類似性サーチギャラリに示す画像タイルもまた、選択可能である。
類似性ヒートマップは、人であるユーザが、特定の組織において、または、特定のラベルを有する患者のサブグループの組織サンプルにおいて、対象の特定の組織パターンがどれほど広がっているかについて容易に認識できる、有益な概要情報を提供することができる。ユーザは、サーチギャラリにおけるタイルのいずれを自由に選択することができ、これにより、現在選択されているタイルに割り当てられた特徴ベクトルに基づく類似性ヒートマップの再計算と、類似性ヒートマップを含むGUIの自動リフレッシュと、が、それぞれ誘起される。
実施形態によれば、レポートギャラリにおける、および/または、類似性サーチタイルギャラリにおける画像タイルは、それらの組織サンプル画像からタイルが導き出されている患者に基づいてグループ化される。代替的な実施形態によれば、レポートギャラリにおける、および/または、類似性サーチタイルギャラリにおける画像タイルは、タイルが導き出されている画像に割り当てられたラベルに基づいてグループ化される。
典型的には、同じ患者から導き出された全ての画像は同じラベルを有することとなり、特定の患者のそれらの画像から導き出された全てのタイルは、MILにより、同じ「バッグ」のメンバとして扱われることとなる。しかしながら、いくつかの例外的な場合では、同じ患者の異なる画像に異なるラベルが割り当てられる場合がある。例えば、第1の画像が、患者の第1の転移巣を描き、第2の画像が、同じ患者の第2の転移巣を描き、薬Dを用いた治療に応えて、第1の転移巣が消失する一方、第2の転移巣が成長し続けることが観察される場合、患者関連属性値は、患者毎の代わりに、画像毎に割り当てられ得る。この場合では、患者毎に、複数のタイルのバッグがあり得る。
別の例によれば、患者の組織サンプルの画像は、特定の薬を用いた処置の前後に取得され、MILプログラムをトレーニングすることに、および/または、トレーニング済みMILプログラムを適用することに使用されるエンドポイント(ラベル)は、属性値「組織の状態=薬Dを用いた処置後」、または、属性値「組織の状態=薬Dを用いた処置前」である。MILプログラムを、前記患者関連属性値についてトレーニングすることは、腫瘍における薬の活性および形態学的効果を示す組織パターンを特定する、という利点を有することができる。そのような特定された薬の効果に関する組織パターンは、薬の作用のモードならびに、潜在的な薬の悪影響を検証して診査することを可能にすることができる。
実施形態によれば、本方法は、追加的なタイルのセットを生成することにより、タイルのバッグの数を計算的に増やすことをさらに含み、各追加的なタイルのセットは、MILプログラムにより、ソースタイルが生成された組織画像と同じラベルが割り当てられている、追加的なタイルのバッグとして扱われる。追加的なタイルのセットの生成は、特に、1つ以上のアーチファクト生成アルゴリズムを、アーチファクトを含む新たなタイルを生成するために、タイルの少なくとも1つのサブセットに適用することを含む。追加的、または代替的に、追加的なタイルのバッグの生成は、それらのそれぞれのソースタイルよりきめが細かい、または、これよりきめが粗い、新たなタイルを生成するために、タイルの少なくとも1つのサブセットの解像度を増やすこと、または、これを減らすことを含むことができる。
例えば、サブセットは、患者のそれぞれに対して、前記患者から取得された1つ以上の組織画像のいくつかまたは全てのタイルをランダムに選択することにより取得されることができる。アーチファクト生成アルゴリズムは、画像のアーチファクトをシミュレーションする。画像のアーチファクトは、例えば、組織の用意、染色、および/または画像の取得中に生成されるタイプのアーチファクトとすることができる(例えば、エッジアーチファクト、過染色、染色不足、ダスト、スペックルアーチファクト、(ガウシアンブラーなどによりシミュレーションされる))。追加的、または代替的に、アーチファクトは、包括的なノイズタイプとすることができる(例えば、閉塞、色のジッタリング、ガウシアンノイズ、ソルト&ペッパー、回転、フリップ、スキュー歪などによりシミュレーションされる)。
追加的なタイルのバッグの生成は、追加的なトレーニングデータが、利用可能なトレーニングデータの限定されたセットから生成される、という利点を有することができる。追加的なトレーニングデータは、サンプルの用意および画像の取得のコンテキストにおいてしばしば起こる一般的な歪、アーチファクト、およびノイズによりその品質が下がる場合がある画像データを表す。したがって、トレーニング中にMILプログラムに内在する、モデルのオーバーフィッティングが回避されることを、拡大されたトレーニングデータセットが確実にすることができる。
実施形態によれば、本方法は、1つ以上の受信したデジタル画像から取得されたタイルのクラスタを計算することをさらに含み、タイルは、それらの特徴ベクトルの類似性に基づいて、クラスタにグループ化される。好ましくは、クラスタは、患者のそれぞれに対して計算される。これは、タイルの特徴ベクトルが十分に類似していれば、同じ患者の異なる組織スライドを描く異なる画像からのタイルが、同じクラスタにグループ化されることができる、ということを意味する。
他の実施形態によれば、クラスタは、全ての患者からの全てのタイルに対してともに計算される。
(異なる患者の全てのタイルをともに、または、患者毎に)クラスタ化する方法の双方では、互いに類似して見えるタイル(すなわち、類似する特徴ベクトルを有する)が、同じクラスタにクラスタ化される。
例えば、「異なる患者の全てのタイルをクラスタ化する」場合では、クラスタ化の結果は、全ての患者に対する全てのタイルに対するタイルの64のグループ(クラスタ)の生成となり得る。64のクラスタのそれぞれは、異なる患者から導き出された類似するタイルを含む。反対に、患者毎にクラスタ化する場合では、各患者が、その患者自身の64のクラスタを有することとなる。
患者毎にクラスタが生成される場合、患者の画像には、脂肪を含むタイルがないか、または、脂肪を含むタイルが非常に少量の場合があり得る。この場合では、その「脂肪」を特徴とする特徴ベクトルの周りのクラスタを学習させるためのデータが十分でないため、「脂肪クラスタ」は生成されない場合がある。しかしながら、全ての患者の全てのタイルをともにクラスタ化する方法を行うことは、多数のクラスタ/組織タイプが、最大量の利用可能なデータを用いて特定されることができる、という利点を有することができる。「全患者タイル」のクラスタ化では、少なくとも数人の患者が、彼らの生体検査において、いくらかの脂肪細胞を有するであろうため、「脂肪」組織パターンに対するクラスタが特定される可能性が高い。したがって、データセットにおいて、脂肪細胞を描くタイルの数が十分である可能性がある場合、脂肪細胞に対するクラスタが生成されるであろう(脂肪細胞含有量が非常に少ない患者に対しても)。クラスタが、全ての患者の全てのタイルに対してともに生成され、1つのクラスタが、脂肪細胞を表す場合は、患者の全てからの、脂肪細胞を持つ全てのタイルが、そのクラスタにグループ化される。これは、特定の患者/バッグについて、脂肪細胞を持つ全てのタイルがともに、前記クラスタにグループ化され、クラスタのサンプリングがそのバッグに対して使用される場合、前記クラスタに属する(現在の患者/バッグからの)タイルのいくつかが選択される、ということを意味する。
タイルをクラスタ化することは、この演算が特定の患者において観察可能な組織パターンの数および/またはタイプを明らかにすることができるため、好適となり得る。いくつかの実施形態によれば、GUIは、ユーザが、タイルのクラスタ化と、タイルクラスタの、クラスタ化されたギャラリビューでの提示と、をトリガすることを可能にする、ユーザによる選択が可能な要素を含む。これは、患者の特定の組織サンプルにおいて観察される、重要なタイプの組織パターンを、ユーザが直感的且つ迅速に理解することをアシストすることができる。
実施形態によれば、MILプログラムのトレーニングは、タイルのセットを繰り返しサンプリングし、タイルのセットから、タイルのサブセットを取り出すことと、MILプログラムを、タイルのサブセットについてトレーニングすることと、を含む。
本明細書で使用される「サンプリング」という用語は、データセット(患者の1つ以上の画像から取得されるタイルの合計)における多数のNデータアイテム(インスタンス、タイル)から、具体的に選ばれた数のLサンプル(ここでは、インスタンス、すなわち、タイル)を取り出すことを含む、データ分析、または、機械学習アルゴリズムにトレーニングさせることのコンテキストにおいて使用される技術である。実施形態によれば、「サンプリング」は、トレーニングデータセットにおけるNタイルの合計を統計的に表すよう推定される確率分布にしたがって、多数のNデータアイテム内からデータアイテムのサブセットを選択することを含む。これは、母集団全体の性質をより正確に学習することを可能にすることができる。確率分布は、機械学習プロセスをガイドし、「データからの学習」を実現可能にする統計的仮定を表す。
いくつかの実施形態によれば、サンプリングは、サンプルしたタイルのバッグを提供するために、タイルのサブセットをランダムに選択することにより行われる。
実施形態によれば、クラスタ化と、サンプリングと、は、次のように組み合わせられる:サンプリングは、患者に対して取得されたタイルクラスタのそれぞれから、サンプリングにおいて生成された各タイルのサブセットにおけるタイルの数が、前記タイルが取得されたクラスタのサイズに対応するように、タイルを選択することを含む。
例えば、特定の患者のデジタル組織画像から、1000のタイルが生成されることができる。クラスタ化は、300のタイルを含む、背景組織スライド領域を示す第1のクラスタと、400のタイルを含む、ストローマ組織領域を示す第2のクラスタと、200のタイルを含む、転移腫瘍組織を示す第3のクラスタと、40のタイルを含む、特定の染色アーチファクトを示す第4のクラスタと、60のタイルを含む、微小血管を持つ組織を示す第5のクラスタと、を生成する。
一実施形態によれば、サンプリングは、クラスタのそれぞれから、50%などの、タイルの特定の割合を選択することを含む。これは、クラスタ1からは150のタイル、クラスタ2からは200のタイル、クラスタ3からは100のタイル、クラスタ4からは20のタイル、クラスタ5からは30のタイル、を意味することとなる。
好適な実施形態によれば、サンプリングは、各クラスタから、等しい数のタイルを選択することを含む。このサンプリングのアプローチは、異なるタイプのクラスタから、同じ数のタイル/組織パターン例が取り出され、これにより、トレーニングデータセットをよりバランスの取れたものとすることができる、という利点を有することができる。これは、トレーニングデータセットにおいて、所望する予測的特徴がまれである場合に、トレーニング済みMIL、および/または、トレーニング済みアテンションMILをさらに正確なものとすることができる。
クラスタ化とサンプリングとの組み合わせは、サンプリングによって実際に高い予測パワーのものであるいくつかのタイルを意図せずに「失う」ことなく、トレーニング用のデータの根拠を増やすことができるため、特に好適となり得る。デジタル病理学のコンテキストでは、しばしば、組織サンプルの圧倒的大多数のエリアは、特定の疾患または他の患者関連属性により変性し、その予測的である、組織領域を含まない。例えば、組織サンプルの小さいサブ領域のみが、腫瘍細胞を実際に含まれることができ、残りは、正常な組織を示すことができる。タイルのクラスタ化をまず行い、続いて、クラスタのそれぞれからタイルを選択することは、腫瘍細胞または微小血管などの予測的組織パターンを示す、少量のタイルの少なくともいくつかが、常に確実に、サンプルの一部となることを確実にすることができる。
図9は、2Dおよび3D座標系におけるタイルの空間的距離を示している。これは、類似性ラベルを、タイルの空間的近接から自動的に導き出された類似性ラベルに基づいて、タイルのペアに自動的に割り当てるために使用される。これにより、ドメインエキスパートによる、画像またはタイルの手動での注釈付けを必要としない、特徴抽出MLLにトレーニングさせるためのトレーニングデータセットが提供される。
図9Aは、デジタル組織サンプルトレーニング画像900のx軸およびy軸により画定される2D座標系におけるタイルの空間距離を示している。トレーニング画像900は、患者の組織サンプルを描く。組織サンプルが患者から取得された後に、サンプルが、顕微鏡検査法のスライド上にセットされ、1つ以上の組織学的に関連する染色剤、例えば、H&E、および/または、各種のバイオマーカ特異的染料を用いて染色された。トレーニング画像900は、染色された組織サンプルから、スライドスキャナ顕微鏡などを使用して撮像される。いくつかの実施変異形によれば、受信したトレーニング画像の少なくともいくつかは、異なる患者から導き出される、および/または、同じ患者の異なる組織領域(生体検査)から導き出され、したがって、3D座標系において互いに整列されることができない。この場合では、タイル距離は、以下に説明するように、画像のx座標およびy座標により画定される2D空間内にて計算されることができる。
トレーニング画像900は、複数のタイルに分割される。説明の目的のために、図9Aにおけるタイルのサイズは、典型的なタイルサイズよりも大きい。
トレーニングデータセットは、次のアプローチにより自動的にラベル付けされることができる:最初に、開始タイル902が選択される。続いて、この開始タイルの周りの第1の円エリアが決定される。第1の円の半径はまた、第1の空間的近接閾値908とも呼ばれる。この第1の円内の全てのタイル、例えば、タイル906は、開始タイル902の「近くの」タイルと見なされる。加えて、この開始タイルの周りの第2の円エリアが決定される。第2の円の半径はまた、第2の空間的近接閾値910とも呼ばれる。この第2の円の外側の全てのタイル、例えば、タイル904は、開始タイル902に関して「遠くの」タイルである。
続いて、第1のセットのタイルペアが生成され、第1のセットの各タイルペアは、開始タイルと、開始タイルの「近くの」タイルと、を含む。例えば、このステップは、第1の円に含まれる近くのタイルと同数のタイルペアを生成することを含むことができる。代替的に、このステップは、利用可能な近くのタイルのサブセットをランダムに選択することと、開始タイルを、選択された近くのタイルに加えることにより、選択された近くのタイルのそれぞれに対してタイルペアを生成することと、を含むことができる。
第2のセットのタイルペアが生成される。第2のセットの各タイルペアは、開始タイルと、開始タイルに関して、「遠くの」タイルと、を含む。例えば、このステップは、第2の円の外側の、画像800に含まれる遠くのタイルと同数のタイルペアを生成することを含むことができる。代替的に、このステップは、利用可能な遠くのタイルのサブセットをランダムに選択することと、開始タイルを、選択された遠くのタイルに加えることにより、選択された遠くのタイルのそれぞれに対してタイルペアを生成することと、を含むことができる。
続いて、画像900内の別のタイルが、開始タイルとして使用されることができ、上記のステップが類似的に行われることができる。これは、第1および第2の円が、新たな開始タイルを中心として使用して再び描かれる、ということを意味する。これにより、新たな開始タイルに関して、近くのタイルと、遠くのタイルと、が特定される。第1のセットのタイルには、新たな開始タイルに基づいて特定された、近くのタイルのペアが追加され、第2のセットのタイルには、新たな開始タイルに基づいて特定された、遠くのタイルのペアが追加される。
続いて、画像900内のさらに別のタイルが、開始タイルとして選択されることができ、上記のステップが、繰り返されることができ、これにより、第1および第2のタイルペアセットに、さらなるタイルペアがさらに追加される。新たな開始タイルの選択は、画像における全てのタイルが開始タイルとして一度選択されるまで、または、予め定められた数のタイルが、開始タイルとして選択されるまで行われることができる。
第1のセットにおけるタイルペアのそれぞれ、例えば、ペア912に対して、ラベル「類似」が割り当てられる。第2のセットにおけるタイルペアのそれぞれ、例えば、ペア914に対して、ラベル「非類似」が割り当てられる。
図9Bは、デジタル組織サンプル画像900のx軸およびy軸と、トレーニング画像900、932、934により描かれた組織ブロックの組織スライスのそれぞれの相対位置にしたがって互いに整列された、画像900、932、934の束の高さに対応するz軸と、により画定される3D座標系におけるタイルの空間距離を示している。トレーニング画像は、それぞれ、特定の患者の単一の組織ブロックから導き出された組織サンプルを描く。描かれた組織サンプルは、複数の隣接する組織スライスの束に属する。例えば、組織スライスのこの束は、FFPET組織ブロックからエクスビボにて用意されることができる。組織ブロックはスライスされ、それらのスライスは、顕微鏡検査法でのスライド上にセットされる。続いて、図8Aを参照して画像900について説明されるように、スライスが染色される。
この束内の組織サンプルは、単一の組織ブロックから導き出されるため、デジタル画像900、932、934は、共通の3D座標系内に整列させることができ、これにより、z軸は、組織スライスに直交する。z軸は、組織スライスに直交する軸である。z方向における画像の距離は、前記画像により描かれた組織スライスの距離に対応する。1つのペアの2つのタイルが同じ画像から導き出される場合、タイルペアのタイル距離は、2D空間内において計算される。加えて、タイルペアが生成されることができ、それらのタイルは、共通の3D座標系において互いに整列された異なる画像から導き出される。この場合では、ペアにおける2つのタイルの距離は、3D座標系を使用して計算される。
整列されたデジタル画像のそれぞれは、複数のタイルに分割される。説明の目的のために、図9Bにおけるタイルのサイズは、典型的なタイルサイズよりも大きい。
トレーニングデータセットは、次のアプローチにより自動的にラベル付けされることができる:最初に、開始タイル902が選択される。続いて、開始タイルと近くのタイルとを含むタイルペアと、開始タイルと遠くのタイルとを含むタイルペアとが、以下に説明するように特定されてラベル付けされる。
この開始タイルの周りの第1の3D球が決定される。説明の目的のために、第1の球の断面のみを示している。第1の球の半径はまた、第1の空間的近接閾値936とも呼ばれる。この第1の球内の全てのタイル、例えば、画像900におけるタイル906だけでなく、画像934におけるタイル940もまた、開始タイル902の「近くの」タイルと見なされる。加えて、この開始タイルの周りの第2の球が決定される。第2の球の半径はまた、第2の空間的近接閾値938とも呼ばれる。この第2の球の外側の全てのタイル、例えば、画像900のタイル904だけでなく、画像934のタイル942もまた、開始タイル902に関して、「遠くの」タイルである。
第1のセットのタイルペアが生成され、第1のセットの各タイルペアは、開始タイルと、開始タイルの「近くの」タイルと、を含む。例えば、このステップは、第1の球に含まれる近くのタイルと同数のタイルペアを生成することを含むことができる。代替的に、このステップは、利用可能な近くのタイルのサブセットをランダムに選択することと、開始タイルを、選択された近くのタイルに加えることにより、選択された近くのタイルのそれぞれに対してタイルペアを生成することと、を含むことができる。
第2のセットのタイルペアが生成される。第2のセットの各タイルペアは、開始タイルと、開始タイルに関して、「遠くの」タイルと、を含む。例えば、このステップは、第2の球の外側の、画像900、932、934に含まれる遠くのタイルと同数のタイルペアを生成することを含むことができる。代替的に、このステップは、利用可能な遠くのタイルのサブセットをランダムに選択することと、開始タイルを、選択された遠くのタイルに加えることにより、選択された遠くのタイルのそれぞれに対してタイルペアを生成することと、を含むことができる。
続いて、画像900内の、または、画像932、934内の別のタイルが、開始タイルとして使用されることができ、上記のステップが類似的に行われることができる。これは、第1および第2の球が、新たな開始タイルを中心として使用して再び描かれる、ということを意味する。これにより、新たな開始タイルに関して、近くのタイルと、遠くのタイルと、が特定される。第1のセットのタイルには、新たな開始タイルに基づいて特定された、近くのタイルのペアが追加され、第2のセットのタイルには、新たな開始タイルに基づいて特定された、遠くのタイルのペアが追加される。
上記のステップは、受信した画像900、932、934のそれぞれにおける全てのタイルが開始タイルとして選択されるまで(または、別の終了基準が満たされるまで)繰り返されることができ、これにより、第1および第2のタイルペアセットには、さらなるタイルペアがさらに追加される。
第1のセットにおけるタイルペアのそれぞれ、例えば、ペア912および913に対して、ラベル「類似」が割り当てられる。第2のセットにおけるタイルペアのそれぞれ、例えば、ペア914および915に対して、ラベル「非類似」が割り当てられる。
図9Aおよび図9Bに示す、円および球に基づく距離計算は、距離に基づく類似性ラベルを計算するための単なる例である。この場合では、「類似」または「非類似」のいずれかのバイナリラベルである。例えば、2Dまたは3D座標系における2つのタイル間のユークリッド距離を計算すること、および、2つのタイルのユークリッド距離と負に相関する数的類似性値を計算すること、などの、他のアプローチが使用されることができることもある。
1mmの組織に対応するピクセルの数は、画像撮像デバイスの倍率、および、デジタル画像の解像度などの各種の要因に依存するため、ここでは、全ての距離閾値は、描かれた実際の物理的対象、すなわち、組織サンプル、または、組織サンプルにより覆われたスライドに関して指定される。
図10は、特徴ベクトルに基づく類似性サーチ、および/または、タイルの、特徴ベクトルに基づくクラスタ化、を行うことに適している、画像タイルから、生物医学的に意味のある特徴ベクトルを抽出することができるサブネットワークを提供するために、本発明の実施形態にしたがってトレーニングされたシャムネットワークのアーキテクチャを示している。シャムネットワーク1000は、例えば、図9Aおよび/または図9Bを参照して説明されるように、自動的に生成された、近接に基づく類似性ラベルを持つタイルペアを含む、したがって、自動的にラベル付けされたトレーニングデータセットについてトレーニングされる。
シャムネットワーク1000は、それらの出力レイヤ1024において結合されている2つの同一のサブネットワーク1002、1003からなる。各ネットワークは、単一のデジタル画像(例えば、タイル)954、914を入力として受信するよう適合されている入力レイヤ1005、1015を含む。サブネットワークのそれぞれは、複数の隠れレイヤ1006、1016、1008、1018を含む。一次元の特徴ベクトル1010、1020は、2つの入力画像の1つから、2つのサブネットワークのそれぞれの1つにより抽出される。これにより、各ネットワークの最後の隠れレイヤ1008、1018は、特徴ベクトルを計算し、その特徴ベクトルを出力レイヤ1024に提供するよう適合される。入力画像の処理は、厳密に分けられている。これは、サブネットワークが入力画像1054のみを処理し、サブネットワークが入力画像1014のみを処理することを意味する。出力レイヤが、ベクトル類似性、したがって、2つの入力画像に描かれている組織パターンの類似性を決定するために、2つのベクトルを比較する際に、2つの入力画像においてもたらされる情報が組み合される唯一のポイントは、出力レイヤの中にある。
実施形態によれば、各サブネットワーク1002、1003は、修正resnet-50アーキテクチャ(Heら、Deep Residual Learning for Image Recognition,2015,CVPR’15)に基づく。実施形態によれば、resnet-50により予めトレーニングされたサブネットワーク902、903は、ImageNetについて予めトレーニングされている。最後のレイヤ(これは、通常、1,000の特徴を出力する)は、特徴ベクトルの所望するサイズ、例えばサイズ128を有するサイズの完全接続レイヤ1008、1018と置き換えられる。例えば、各サブネットワークの最後のレイヤ1008、1018は、最後から二番目のレイヤから特徴を抽出するように構成されることができ、これにより、最後から二番目のレイヤは、最後のレイヤ1008、1018よりも多数の特徴(例えば、2048)を提供することができる。実施形態によれば、例えば、PyTorch(0.001の学習率、および、0.9、0.999のベータ)におけるデフォルトパラメータを持つアダムオプティマイザなどのオプティマイザと、256のバッチサイズとが、トレーニング中に使用された。データ増強について、ランダムの水平および垂直フリップ、および/または、最大で20度までのランダムな回転、および/または、輝度に対して0.075の値を用いた色ジッタ拡大、コントラスト飽和、および/または、色相が、トレーニングデータセットを増やすために、タイルに適用されることができる。
シャムネットワークが、自動的にラベル付けされた画像のペアについてトレーニングされる場合、学習プロセスの目的は、類似する画像が、互いに類似する出力(特徴ベクトル)を有するべきであり、および、類似しない画像が、互いに類似しない出力を有するべきである、ということである。これは、2つのサブネットワークにより抽出された特徴ベクトル間の差異を測定する関数などの損失関数を最小化することにより達成されることができる。
実施形態によれば、シャムニューラルネットワークは、ペアの2つのタイルのそれぞれに対して、2つのサブネットワークにより抽出された特徴ベクトルの類似性が、ペアの2つのタイルに描かれている組織パターンの類似性と相関するよう、タイルのペアについて、損失関数を使用してトレーニングされる。
シャムネットワークは、例えば、Bromleyらによる、「Signature Verification using a ‘Siamese’ Time Delay Neural Network」、1994年、NIPS’1994に記載されるようなシャムネットワークとすることができる。シャムネットワークの各サブネットワークは、多次元特徴ベクトルを、入力として提供された2つの画像タイルのそれぞれ1つから抽出するよう適合される。ネットワークは、同様の組織パターンを描くタイルペアが、互いに近い(類似する)出力(特徴ベクトル)を有するべきであり、類似しない組織パターンを描くタイルペアが、互いに遠い出力を有するべきである、ということを目的として、近接に基づく組織パターン類似性ラベルの注釈が自動的に付けられた複数のタイルペアについてトレーニングされる。一実施形態によれば、これは、例えば、Hadsellらによる、Dimensionality Reduction by Learning an Invariant Mapping、2006年、CVPR’06に記載されるような、対照損失を行うことにより達成される。対照損失は、トレーニング中に最小化される。対比損失CLは、例えば、以下にしたがって計算されることができる。
ここで、f1、f2は、2つの同一のサブネットワークを出力し、yは、以下のタイルペアのグラウンドトゥルースラベルである:それらが「類似」とラベル付けされている場合は0(タイルペアの第1のセット)、それらが「非類似」とラベル付けされている場合は1(タイルペアの第2のセット)。
シャムネットワーク1000のトレーニングは、ネットワーク1000に、複数の自動的にラベル付けされた、類似するタイルペア912、913と、類似しないタイルペア914、915と、をフィードすることを含む。各入力トレーニングデータレコード1028は、タイルペアの2つのタイルと、その自動的に割り当てられた、空間的近接に基づくラベル1007と、を含む。近接に基づくラベル10007は、「グラウンドトゥルース」として提供される。出力レイヤ1024は、2つの比較された特徴ベクトル1008、1018の類似性の関数として、2つの入力画像1004、1014に対する、予測された類似性ラベルを計算するよう適合される。シャムネットワークのトレーニングは、逆伝播プロセスを含む。予測されたラベル926の、入力ラベル1007からのいずれの偏差は、損失関数の形態にて測定される「エラー」または「損失」と見なされる。シャムネットワークのトレーニングは、逆伝播を繰り返し使用することにより、損失関数により計算されるエラーを最小化することを含む。シャムネットワーク1000は、例えば、Bromleyらによる、「Signature Verification using a ‘‘Siamese’’ Time Delay Neural Network」、1994、NIPS’1994によって記載されるように実施されることができる。
図11は、例えば、図10を参照して説明するように、切り捨てられたシャムネットワークとして実装される特徴抽出MLL950を示している。
特徴抽出MLL950は、例えば、トレーニング済みシャムネットワーク1000のサブネットワーク1002、1003の1つを個別に記憶することにより取得されることができる。トレーニング済みシャムネットワークとは対照的に、特徴抽出MLLとして使用されるサブネットワーク1002、1003は、単一の画像952のみを入力として必要とし、類似性ラベルを出力しないが、むしろ、シャムネットワーク1000のトレーニング中に、特に、特定の組織パターンに特に特徴的であり、特徴のこの特定のセットを、2つの画像から抽出して比較することにより、2つの画像に描かれている組織パターンの類似性を決定することに特に適していると特定された、限定された特徴のセットの値を選択的に含む特徴ベクトル954を出力する。
図12は、画像データベースにおいて、特徴ベクトルに基づく類似性サーチを使用するコンピュータシステム980を示している。例えば、類似性サーチは、その一例が図8に描かれているサーチタイルギャラリを計算することに使用されることができる。コンピュータシステム980は、1つ以上のプロセッサ982と、トレーニング済みシャムネットワーク(「切り捨てられたシャムネットワーク」)のサブネットワークとすることができる、トレーニング済み特徴抽出MLL950と、を備える。システム980は、特徴ベクトルを、サーチ画像から、および、サーチした画像(タイル)のそれぞれから、それぞれ抽出するために、特徴抽出MLLを使用して画像類似性サーチを行うよう適合される。
コンピュータシステムは、例えば、データベース992を備える、または、これに操作可能に結合された、スタンダードなコンピュータシステムまたはサーバとすることができる。例えば、データベースは、複数の患者の組織サンプルを描く、数百または数千もの全スライド画像を含むリレーショナルBDSMとすることができる。好ましくは、データベースは、データベースにおける画像のそれぞれに対して、特徴出力MLL950により、データベースにおける前記画像から抽出されたそれぞれの特徴ベクトルを含む。好ましくは、データベースにおける各画像の特徴ベクトルの計算は、いずれのそのようなリクエストが受信される前に、単一の予備処理ステップにおいて行われる。しかしながら、サーチリクエストに応えて、データベースにおける画像に対する特徴ベクトルを動的に計算して抽出することも可能である。サーチは、例えば、サーチ画像986に描かれている組織パターンに類似する組織パターンを描く単一の全スライド画像内のタイルを特定するために、特定のデジタル画像から導き出されたタイルに限定されることができる。サーチ画像986は、例えば、ユーザにより選択されたレポートタイルギャラリに含まれるタイルとすることができる。
コンピュータシステムは、ユーザ984が、サーチ画像986として使用される特定の画像または画像タイルを選択または提供することを可能にするユーザインターフェースを含む。トレーニングされた特徴抽出MLL950は、入力画像から特徴ベクトル988(「サーチ特徴ベクトル」)を抽出するように適合される。サーチエンジン990は、特徴出力MLL950からサーチ特徴ベクトル988を受信し、画像データベース内でベクトルベースの類似性サーチを実行する。類似性サーチは、類似性スコアを、2つの比較された特徴ベクトルの関数として計算するために、サーチ特徴ベクトルを、データベースにおける画像の特徴ベクトルのそれぞれと比較することを含む。類似性スコアは、サーチ特徴ベクトルの、データベースにおける画像の特徴ベクトルとの類似性の程度を示し、したがって、2つの比較された画像に描かれている組織パターンの類似性を示す。サーチエンジン990は、サーチ結果994を、ユーザに返して出力するよう適合される。サーチ結果は、例えば、最も高い類似性スコアが計算された、データベースの1つ以上の画像とすることができる。
例えば、サーチ画像986が、乳がん組織を描くことが既知の画像タイルである場合、システム980は、類似する乳がん組織パターンを描く複数の他のタイル(または、そのようなタイルを含む全スライド画像)を特定することに使用されることができる。
図13は、各マトリクスが3つの列からなり、各列が6つのタイルペアを含む、2つのタイルマトリクスを示している。第1の(上の)マトリクスは、互いに近く、ラベル「類似」タイルペアが自動的に割り当てられたタイルからなる第1のセットのタイルペア(A)を示す。第2の(下の)マトリクスは、互いに遠く、ラベル「非類似」タイルペアが自動的に割り当てられた第2のセットのタイルペア(B)を示す。いくつかの場合では、「類似」とラベル付けされたタイルが類似して見えず、「非類似」とラベル付けされたタイルが類似して見える。このノイズは、2つの異なる組織パターンが出会う境界にて、2つの近くのタイルが異なる組織パターンを描き得るという事実により、および、遠くの組織領域であっても、同じ組織パターンを描き得るという事実により、引き起こされる。これは、データセット生成プロセスにおいて予期される、固有のノイズである。
出願人は、このノイズにも関わらず、自動的にラベル付けされたデータセットについてトレーニングされた特徴抽出MLLが、類似するタイルペアおよび類似しないタイルペアの明確な区別を可能にする特徴を正確に特定して抽出することができることを観察した。出願人は、このノイズに対する、トレーニング済みMLLの観察されたロバスト性は、領域境界が、典型的には、領域非境界エリアよりも狭いエリアを有する、という事実に基づくということを想定する。
実施形態によれば、自動的に生成されるトレーニングデータセットの品質は、第1のステップにおいて、以前にトレーニングされた類似性ネットワーク、または、ImageNetの予めトレーニングされたネットワークを使用して、タイルペアの類似性を査定し、続いて、第2のステップにおいて、本発明の実施形態についてここに説明するような、タイルの空間的近接に基づいて類似性ラベルを生成し、続いて、一方が、第1のステップにおいて、もう一方が、第2のステップにおいて決定された2つのタイルの類似性の強い偏差が観察されたペアラベルを修正する、というものである。
図14は、近接に基づく類似性ラベルについてトレーニングされた特徴抽出MLLにより抽出された、類似性サーチ結果に基づく特徴ベクトルを示している。5つの腫瘍クエリタイルは、A、B、C、D、およびEと呼ばれる。クエリタイルは、クエリスライド(A1からA5、B1からB5、C1からC5、D1からD5、E1からE5)以外の、低から高への距離によりランク付けされた5つのタイルをそれぞれ、近接に基づくラベルを用いて自動的にラベル付けされたデータについてトレーニングされた特徴抽出MLLにより抽出された特徴ベクトルを用いて特定して回収するための画像回収タスクにおいて使用された。対象クラス(例えば、腫瘍)は、サーチされたタイルの3%のみを含む。回収されたいくつかのタイルは、クエリタイル(例えば、C3およびC)とは大きく異なって見えるものの、A4以外の、回収されたタイルの全ては、腫瘍細胞を含むこと(すなわち、正しいクラス回収)が、エキスパート病理学者により検証されている。
図15は、入力画像212を分類するためのアプローチIを示している。画像212は、複数のタイル216に分割され、各タイルから、前述したようにそれぞれの特徴ベクトル220が抽出される。特徴ベクトルは、MILプログラム226の機械学習モデル999に順次入力される。モデルは、モデルに入力された特徴ベクトル毎に予測値h 998および確実性値221を計算して出力するように構成される。
そして、予測値998と確実性値221の双方の関数として集約予測値997を計算するために、プーリング関数997が使用される。例えば、プーリング関数は、加重予測値228、すなわち、予測値が計算されたタイルについてMILモデル999によって計算された確実性値によって加重された予測値を集約することができる。あるいは、特定の予測値、例えば、画像の全てのタイルの中で確実性値が最も高いタイルの予測値を識別するために、プーリング関数によって確実性値を評価することができる。そして、集約予測値は、典型的には0から1の範囲内の値に正規化された数値であり、画像212の分類に用いられる。例えば、集約予測値887が0,75未満である場合、MILプログラムは、画像を「陰性クラス」のメンバであると分類し、そうでなければ「陽性クラス」のメンバであると分類することができる。
図16は、画像212を分類するための代替的なアプローチIIを示している。このアプローチでは、プーリング関数996は、予測値ではなく、画像のタイル216から抽出された特徴ベクトルに適用される。このプーリング関数は、タイルについて計算された確実性値221を考慮に入れる。プーリング関数は、「グローバル特徴ベクトル」995とも呼ばれる集約特徴ベクトルを計算する。このグローバル特徴ベクトルは、画像212のタイルの複数の特徴および複数の確実性値から集約された情報を伝達する。グローバル特徴ベクトル995を計算した後、ベクトルは、画像のタイルの「通常の」特徴ベクトルfv1、fv2,...,fv2と同じ方法でMILプログラムの機械学習モデル999に入力される。MILプログラムは、それぞれのタイル固有の特徴値から予測値998のいずれかを計算したのと同じ方法でグローバル特徴ベクトルから集約予測値997を計算するが、グローバルベクトルは、全てのタイルから導き出された情報を含むため、グローバル値から計算された予測値は集約予測値である。最後に、集約予測値は、画像212を分類するために使用される。