WO2024154379A1

WO2024154379A1 - モデル生成方法、モデル生成システム、モデル生成プログラム、異物検出方法、異物検出システム、異物検出プログラム及び推論モデル

Info

Publication number: WO2024154379A1
Application number: PCT/JP2023/032684
Authority: WO
Inventors: 達也大西; 智土屋
Original assignee: Hamamatsu Photonics KK
Current assignee: Hamamatsu Photonics KK
Priority date: 2023-01-18
Filing date: 2023-09-07
Publication date: 2024-07-25
Anticipated expiration: 2025-07-18
Also published as: TW202445505A

Abstract

精度よく異物を検出する。　モデル生成方法は、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成する方法であって、訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する訓練用取得ステップ（Ｓ０１）と、取得された訓練用の画像を用いた訓練を行って推論モデルを生成するモデル生成ステップ（Ｓ０２）とを含む。

Description

モデル生成方法、モデル生成システム、モデル生成プログラム、異物検出方法、異物検出システム、異物検出プログラム及び推論モデル

　本発明は、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成方法、モデル生成システム及びモデル生成プログラム、生成された推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法、異物検出システム及び異物検出プログラム、並びに生成された推論モデルに関する。

　特許文献１には、機械学習によって生成された推論モデルを用いて検査対象物の外観の検査対象画像から復元画像を生成して、検査対象画像と復元画像との差分から検査対象物を検査することが示されている。特許文献１では、検査に用いられる推論モデルは、良品と判断される検査対象物の外観の良品画像と、良品画像に欠陥を示す画像を合成した疑似欠陥画像とから生成されている。これによって検査精度が向上するとされている。

特開２０１８－２０５１６３号公報

　しかしながら、特許文献１に示される方法では、例えば、包装された物をＸ線で撮像した画像の異物の検出を行う場合には、必ずしも適切に異物の検出が行えない。特に対象物がパスタ等の複数の物体を含むものであり、異物が個々の物体に比べて小さいものである場合には、特許文献１に示される方法で生成された推論モデルを用いても、必ずしも適切に異物の検出が行えない。

　本発明の一実施形態は、上記に鑑みてなされたものであり、精度よく異物を検出することができるモデル生成方法、モデル生成システム、モデル生成プログラム、異物検出方法、異物検出システム、異物検出プログラム及び推論モデルを提供することを目的とする。

　上記の目的を達成するために、本発明の一実施形態に係るモデル生成方法は、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成方法であって、訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する訓練用取得ステップと、訓練用取得ステップにおいて取得された訓練用の画像を用いた訓練を行って推論モデルを生成するモデル生成ステップと、を含み、訓練は、第１の正常画像に基づく情報を推論モデルへの入力とし、当該第１の正常画像に基づく情報を推論モデルからの出力とした訓練、第２の異物画像に基づく情報を推論モデルへの入力とし、第２の正常画像に基づく情報を推論モデルからの出力とした訓練、及び第３の異物画像に基づく情報を推論モデルへの入力とし、第３の正常画像に基づく情報を推論モデルからの出力とした訓練を含む。

　本発明の一実施形態に係るモデル生成方法では、正常画像に加えて、２種類の互いに異なる異物画像が用いられて訓練が行われて、推論モデルが生成される。このように生成された推論モデルは、入力された画像に写っているもののうち、対象物を出力に反映し、異物を出力に反映しないものとなる。従って、生成された推論モデルを用いて異物の検出を行うことで、精度よく異物を検出することができる。

　検出対象として想定されない異物は、自然画像であることとしてもよい。この構成によれば、より適切かつ確実に推論モデルを生成することができる。

　第２の正常画像及び第３の正常画像は、第１の正常画像であり、訓練用取得ステップにおいて、第１の正常画像に対して、検出対象として想定される異物を付加して第２の異物画像を生成して取得し、第１の正常画像に対して、検出対象として想定されない異物を付加して第３の異物画像を生成して取得することとしてもよい。この構成によれば、容易かつ確実に第２の異物画像及び第３の異物画像を取得することができる。その結果、容易かつ確実に推論モデルを生成することができる。

　対象物は、特定の種別の物であり、訓練用取得ステップにおいて取得される第１の正常画像、第２の正常画像、第２の異物画像、第３の正常画像及び第３の異物画像は、特定の種別の物が訓練用の対象物として写っている画像であることとしてもよい。この構成によれば、特定の種別の物について精度よく異物を検出するための推論モデルを生成することができる。

　訓練用取得ステップにおいて取得される第１の正常画像の数、第２の正常画像と第２の異物画像との組み合わせの数、並びに第３の正常画像と第３の異物画像との組み合わせの数の比率は、予め設定された比率であることとしてもよい。この構成によれば、より適切かつ確実に推論モデルを生成することができる。

　検出対象として想定されない異物は、計算式に基づいて描画された画像であることとしてもよい。この構成によれば、より適切かつ確実に推論モデルを生成することができる。

　第３の異物画像は、透過的な付加及び置き換えによる付加の少なくとも何れかによって、検出対象として想定されない異物が第３の正常画像に付加された画像であることとしてもよい。この構成によれば、より適切かつ確実に推論モデルを生成することができる。

　推論モデルは、複数の層を有するニューラルネットワークを含み、層間での連結を行う構造を有し、連結を経由した後の画像と入力した画像とを足し合わせるモデルであることとしてもよい。この構成によれば、精度よく異物を検出するための推論モデルを生成することができる。

　モデル生成ステップにおいて、生成した推論モデルの出力側に、当該推論モデルに入力した画像の位置毎の異物の度合いを示す情報を出力する部分を追加した新たな第２の推論モデルを、新たな訓練を行って生成することとしてもよい。この構成によれば、容易かつ確実に異物を検出するための第２の推論モデルを生成することができる。

　本発明の一実施形態は、上記のようにモデル生成方法の発明として記述できる他に、以下のようにモデル生成システム及びモデル生成プログラムの発明としても記述することができる。これらはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。

　即ち、本発明の一実施形態に係るモデル生成システムは、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成システムであって、訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する取得手段と、取得手段によって取得された訓練用の画像を用いた訓練を行って推論モデルを生成するモデル生成手段と、を備え、訓練は、第１の正常画像に基づく情報を推論モデルへの入力とし、当該第１の正常画像に基づく情報を推論モデルからの出力とした訓練、第２の異物画像に基づく情報を推論モデルへの入力とし、第２の正常画像に基づく情報を推論モデルからの出力とした訓練、及び第３の異物画像に基づく情報を推論モデルへの入力とし、第３の正常画像に基づく情報を推論モデルからの出力とした訓練を含む。

　本発明の一実施形態に係るモデル生成プログラムは、コンピュータを、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成システムとして動作させるモデル生成プログラムであって、当該コンピュータを、訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する取得手段と、取得手段によって取得された訓練用の画像を用いた訓練を行って推論モデルを生成するモデル生成手段と、として機能させ、訓練は、第１の正常画像に基づく情報を推論モデルへの入力とし、当該第１の正常画像に基づく情報を推論モデルからの出力とした訓練、第２の異物画像に基づく情報を推論モデルへの入力とし、第２の正常画像に基づく情報を推論モデルからの出力とした訓練、及び第３の異物画像に基づく情報を推論モデルへの入力とし、第３の正常画像に基づく情報を推論モデルからの出力とした訓練を含む。

　また、上記の目的を達成するために、本発明の一実施形態に係る異物検出方法は、モデル生成方法によって生成された推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法であって、異物の検出対象となる対象画像を取得する検出用取得ステップと、検出用取得ステップにおいて取得された対象画像に基づく情報を、推論モデルに入力して演算を行って、推論モデルからの出力を得る演算ステップと、演算ステップにおける推論モデルへの入力に係る情報と、推論モデルからの出力に係る情報との差分を算出して、算出した差分から対象画像に含まれる異物の検出を行う検出ステップと、を含む。

　本発明の一実施形態に係る異物検出方法では、上記の推論モデルが用いられて異物の検出が行われる。従って、本発明の一実施形態に係る異物検出方法によれば、精度よく異物を検出することができる。

　また、上記の目的を達成するために、本発明の一実施形態に係る異物検出方法は、モデル生成方法によって生成された第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法であって、異物の検出対象となる対象画像を取得する検出用取得ステップと、検出用取得ステップにおいて取得された対象画像に基づく情報を、第２の推論モデルに入力して演算を行って、第２の推論モデルからの出力を得る演算ステップと、演算ステップにおいて得られた第２の推論モデルからの出力から対象画像に含まれる異物の検出を行う検出ステップと、を含む。

　本発明の一実施形態に係る異物検出方法では、上記の第２の推論モデルが用いられて異物の検出が行われる。従って、本発明の一実施形態に係る異物検出方法によれば、精度よく異物を検出することができる。

　本発明の一実施形態は、上記のように異物検出方法の発明として記述できる他に、以下のように異物検出システム及び異物検出プログラムの発明としても記述することができる。これらはカテゴリが異なるだけで、実質的に同一の発明であり、同様の作用及び効果を奏する。

　即ち、本発明の一実施形態に係る異物検出システムは、モデル生成方法によって生成された推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムであって、異物の検出対象となる対象画像を取得する検出用取得手段と、検出用取得手段によって取得された対象画像に基づく情報を、推論モデルに入力して演算を行って、推論モデルからの出力を得る演算手段と、演算手段による推論モデルへの入力に係る情報と、推論モデルからの出力に係る情報との差分を算出して、算出した差分から対象画像に含まれる異物の検出を行う検出手段と、を備える。

　本発明の一実施形態に係る異物検出システムは、モデル生成方法によって生成された第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムであって、異物の検出対象となる対象画像を取得する検出用取得手段と、検出用取得手段によって取得された対象画像に基づく情報を、第２の推論モデルに入力して演算を行って、第２の推論モデルからの出力を得る演算手段と、演算手段によって得られた第２の推論モデルからの出力から対象画像に含まれる異物の検出を行う検出手段と、を備える。

　本発明の一実施形態に係る異物検出プログラムは、コンピュータを、モデル生成方法によって生成された推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムとして動作させる異物検出プログラムであって、当該コンピュータを、異物の検出対象となる対象画像を取得する検出用取得手段と、検出用取得手段によって取得された対象画像に基づく情報を、推論モデルに入力して演算を行って、推論モデルからの出力を得る演算手段と、演算手段による推論モデルへの入力に係る情報と、推論モデルからの出力に係る情報との差分を算出して、算出した差分から対象画像に含まれる異物の検出を行う検出手段と、として機能させる。

　本発明の一実施形態に係る異物検出プログラムは、コンピュータを、モデル生成方法によって生成された推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムとして動作させる異物検出プログラムであって、当該コンピュータを、異物の検出対象となる対象画像を取得する検出用取得手段と、検出用取得手段によって取得された対象画像に基づく情報を、第２の推論モデルに入力して演算を行って、第２の推論モデルからの出力を得る演算手段と、演算手段によって得られた第２の推論モデルからの出力から対象画像に含まれる異物の検出を行う検出手段と、として機能させる。

　本発明の一実施形態に係るモデル生成方法によって生成される推論モデル自体も、新規な構成を有する発明である。即ち、本発明の一実施形態に係る推論モデルは、画像に基づく情報を入力して、入力に応じた演算を行って情報を出力するようコンピュータを機能させるための推論モデルであって、モデル生成方法によって生成されたものである。

　本発明の一実施形態によれば、精度よく異物を検出することができる。

本発明の実施形態に係るモデル生成システム及び異物検出システムの構成を示す図である。異物の検出に用いられる対象画像及び対象画像を推論モデルに入力して出力される画像の例を示す図である。異物の検出結果として生成される異常度マップの例を示す図である。推論モデルを模式的に示す図である。訓練に用いられる第１の正常画像の例を示す図である。訓練に用いられる第２の正常画像と第２の異物画像との組み合わせの例を示す図である。訓練に用いられる第３の正常画像と第３の異物画像との組み合わせの例を示す図である。第３の異物画像の生成に用いられる画像の例を示す図である。本発明の実施形態に係るモデル生成システムで実行される処理であるモデル生成方法を示すフローチャートである。本発明の実施形態に係る異物検出システムで実行される処理である異物検出方法を示すフローチャートである。比較例による検出結果と本発明の実施形態による検出結果との例を示す図である。訓練に用いる画像と、推論モデルから出力される画像及び異常度マップとの例を示す図である。訓練に用いる画像と、推論モデルから出力される画像及び異常度マップとの例を示す図である。ライスを対象物とした場合の画像の例である。グラノーラを対象物とした場合の画像の例である。本発明の実施形態に係るモデル生成プログラム及び異物検出プログラムの構成を、記録媒体と共に示す図である。訓練に用いられる第３の正常画像と第３の異物画像との組み合わせの例を示す図である。訓練に用いられる第３の正常画像と第３の異物画像との組み合わせの例を示す図である。第３の異物画像の生成に用いられる画像の例を示す図である。第３の異物画像の生成に用いられる画像の例を示す図である。第３の異物画像の生成に用いられる画像の例を示す図である。第３の異物画像の生成に用いられる画像の例を示す図である。比較例による検出結果と本発明の実施形態による検出結果との例を示す図である。比較例による検出結果と本発明の実施形態による検出結果との例を示す図である。訓練に用いられる第３の異物画像の例を示す図である。訓練に用いられる第３の正常画像と第３の異物画像との組み合わせの例を示す図である。訓練に用いられる第３の正常画像と第３の異物画像との組み合わせの例を示す図である。本発明の実施形態による検出結果の例を示す図である。本発明の実施形態による検出結果の例を示す図である。推論モデルの例を模式的に示す図である。第２の推論モデルの例を模式的に示す図である。第２の推論モデルの生成のための訓練に用いられる画像の例を示す図である。第２の推論モデルを用いた本発明の実施形態による検出結果の例を示す図である。

　以下、図面と共に本発明に係るモデル生成方法、モデル生成システム、モデル生成プログラム、異物検出方法、異物検出システム、異物検出プログラム及び推論モデルの実施形態について詳細に説明する。なお、図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。

　図１（ａ）に本実施形態に係るモデル生成システム１０を示す。図１（ｂ）に本実施形態に係る異物検出システム２０を示す。モデル生成システム１０は、機械学習の訓練を行って、対象物が写った画像に含まれる異物の検出に用いられる推論モデル（学習モデル、学習済モデル）を生成するシステム（装置）である。異物検出システム２０は、モデル生成システム１０によって生成された推論モデルを用いて、対象物が写った画像に含まれる異物の検出（検知）を行うシステム（装置）である。

　図２に異物の検出に用いられる対象画像３０の例を示す。本実施形態における異物の検出は、商品として包装された食品、例えば、プラスチックの包装袋に入れられた食品に対する異物の検出である。異物の検出は、例えば、食品の商品の製造工程において、製造された商品が良品か否かを判断するために行われる。検出対象の商品の画像から異物が検出されなかったら当該商品が良品とされ、検出対象の商品の画像から異物が検出されたら当該商品が不良品とされる。異物の検出に用いられる画像は、Ｘ線によって検出対象となる商品毎に撮像されたものである。図中の破線で囲った部分は、異物が存在している部分である。

　想定される異物は、例えば、製造工程で含まれる可能性があるものである。本実施形態では、異物として食品と比べて小さな球（ＳＵＳ（Steel　Use　Stainless）の球、ガラスの球）を用いた例を示す。異物の検出対象となる商品は、例えば、ペンネ等のパスタである。また、異物の検出対象となる商品は、パスタ以外のもの、例えば、ライス（米）、グラノーラであってもよい。なお、異物は、食品等の対象物より小さい必要はなく、対象物と同程度の大きさ、又は対象物よりも大きくてもよい。図２の対象画像３０に示すように、通常、パスタ等の商品では同様の形状のものが１つの包装に数多く含まれる。従来の方法では、このような場合の異物の検出を精度よく行うことは困難であるが、本実施形態では精度よく異物の検出を行うことができる。

　なお、異物が含まれる対象物（本実施形態の例では食品の商品）、異物及び画像（本実施形態の例ではＸ線画像）は、本実施形態のものに限られず、本実施形態が適用可能なものであればよい。また、検出対象の異物は、必ずしも対象物（上記の例では食品）とは別の物である必要はなく、対象物上に表れる欠陥、疵等の不良であってもよい。即ち、異物の検出は、対象物が不良品であるかの検出であってもよい。

　モデル生成システム１０及び異物検出システム２０はそれぞれ、ＣＰＵ（Central　Processing　Unit）等のプロセッサ、メモリ、通信モジュール等のハードウェアを含む従来のコンピュータを含んで構成される。モデル生成システム１０及び異物検出システム２０の後述する各機能は、これらの構成要素がプログラム等により動作することによって発揮される。図１では、モデル生成システム１０及び異物検出システム２０は、別々のシステム（装置）として示しているが、同じシステム（装置）によって実現されてもよい。モデル生成システム１０及び異物検出システム２０を構成するコンピュータは、複数のコンピュータを含むコンピュータシステムであってもよい。また、コンピュータは、クラウドコンピューティング又はエッジコンピューティングで構成されていてもよい。

　引き続いて、本実施形態に係るモデル生成システム１０及び異物検出システム２０の機能を説明する。図１に示すようにモデル生成システム１０は、訓練用取得部１１と、モデル生成部１２とを備えて構成される。

　モデル生成システム１０の各機能を説明する前にモデル生成システム１０によって生成される推論モデルを説明する。あわせて推論モデルを用いた異物検出システム２０による異物の検出の概略を説明する。推論モデルは、異物の検出対象の画像を入力して、入力した画像の異物の部分を除去した（と推論される）画像を出力（推論）するモデルである。図２に、推論モデルに入力される、異物の検出対象となる対象画像３０、及び当該対象画像３０を推論モデルに入力して出力される、異物の部分を除去した（と推論される）画像４０の例を示す。対象画像３０中の破線で囲った部分には異物が写っているが、推論モデルから出力される画像４０中の同じ位置の部分には異物が写っていない。

　推論モデルへ入力される画像と推論モデルから出力される画像との差分を取ることで、推論モデルで除去された異物のみを示す画像（情報）を得ることができる。図３に、図２の推論モデルへ入力される対象画像３０と推論モデルから出力される画像４０との差分の画像である異常度マップ５０を示す。異常度マップ５０によって、異物を把握することができる。推論モデルを用いた異物検出システム２０による異物の検出は、例えば、異常度マップの生成に相当する。

　推論モデルは、例えば、ニューラルネットワークを含んで構成される。ニューラルネットワークは、多層のものであってよい。即ち、推論モデルは、深層学習（ディープラーニング）によって生成されたものであってもよい。また、ニューラルネットワークは、畳み込みニューラルネットワーク（ＣＮＮ：Convolutional　Neural　Network）であってもよい。

　図４に、本実施形態の推論モデルを模式的に示す。推論モデルは、入力した画像を特徴量にエンコードするエンコーダと、エンコーダから出力される特徴量を画像にデコードするデコーダとを含んで構成される。

　推論モデルには、エンコーダの入力層に、画像に基づく情報を入力するためのニューロンが設けられる。例えば、推論モデルに入力される情報は、画像の各画素の画素値（輝度値）である。この場合、入力層には、画像の画素の数のニューロンが設けられ、それぞれのニューロンには対応する画素の画素値が入力される。なお、推論モデルに入力される情報は、画像に基づくものであれば各画素の画素値以外であってもよい。

　推論モデルには、デコーダの出力層に、画像を出力するためのニューロンが設けられる。例えば、推論モデルから出力される情報は、画像の各画素の画素値である。この場合、出力層には、画像の画素の数のニューロンが設けられ、それぞれのニューロンから対応する画素の画素値が出力される。なお、推論モデルから出力される情報は、上述した出力画像を生成可能なものであれば各画素の画素値以外であってもよい。

　また、推論モデルは、機械学習の訓練によって生成されて上述した入出力を行うものであれば、ニューラルネットワーク以外によって構成されていてもよい。

　推論モデルは、人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。推論モデルは、例えば、プロセッサ及びメモリを備えるコンピュータにて用いられ、コンピュータのプロセッサが、メモリに記憶されたモデルからの指令に従って動作する。例えば、コンピュータのプロセッサが、当該指令に従って、モデルに対して情報を入力して、モデルに応じた演算を行って、モデルから結果を出力するように動作する。具体的には、コンピュータのプロセッサが、当該指令に従って、ニューラルネットワークの入力層に情報を入力して、ニューラルネットワークにおける学習の重み付け係数等のパラメータに基づく演算を行って、ニューラルネットワークの出力層から結果を出力するように動作する。以上が、モデル生成システム１０によって生成される推論モデル、及び推論モデルを用いた異物検出システム２０による異物の検出の概略である。

　訓練用取得部１１は、訓練用の画像を取得する訓練用取得手段である。訓練用の画像は、訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像である。検出対象として想定されない異物は、自然画像であってもよい。

　第２の正常画像及び第３の正常画像を、第１の正常画像とし、訓練用取得部１１は、第１の正常画像に対して、検出対象として想定される異物を付加して第２の異物画像を生成して取得し、第１の正常画像に対して、検出対象として想定されない異物を付加して第３の異物画像を生成して取得してもよい。対象物は、特定の種別の物であり、訓練用取得部１１によって取得される第１の正常画像、第２の正常画像、第２の異物画像、第３の正常画像及び第３の異物画像は、特定の種別の物が訓練用の対象物として写っている画像であってもよい。訓練用取得部１１によって取得される第１の正常画像の数、第２の正常画像と第２の異物画像との組み合わせの数、並びに第３の正常画像と第３の異物画像との組み合わせの数の比率は、予め設定された比率であってもよい。

　推論モデルは、訓練用取得部１１によって取得される訓練用の画像を用いた機械学習の訓練によって生成される。推論モデルの訓練は、第１の正常画像を用いた訓練、第２の正常画像と第２の異物画像との組み合わせを用いた訓練、及び第３の正常画像と第３の異物画像との組み合わせを用いた訓練の３種類の訓練を含む。

　図５に第１の正常画像６１の例を示す。第１の正常画像６１は、訓練用の対象物が写っており、異物が写っていない画像である。第１の正常画像６１は、例えば、異物が含まれていないと確認が取れている商品を、異物の検出の際と同じ条件で撮像して得られる画像である。異物が含まれていないと確認が取れている商品は、訓練用の対象物である。また、当該商品は、異物の検出対象と同じ種別の物とする。即ち、異物の検出対象がパスタの商品であれば、第１の正常画像６１を同じ種類のパスタの商品の画像とする。

　図６に第２の正常画像６２及び第２の異物画像７２の例を示す。第２の正常画像６２は、訓練用の対象物が写っており、異物が写っていない画像であり、第１の正常画像６１と同様の画像である。第１の正常画像６１を第２の正常画像６２としてもよい。第２の異物画像７２は、検出対象として想定される異物（例えば、上述した小さな球）（の画像）が第２の正常画像６２に付加された画像である。第２の異物画像７２は、例えば、検出対象として想定される異物のみを撮像して得られる画像を第２の正常画像６２に重畳して得られる画像である。あるいは、異物のみを撮像して得られる画像は用いずに、第２の正常画像６２に対して検出対象として想定される異物を想定した画像処理を行って、第２の異物画像７２を生成してもよい。画像処理は、シミュレーション（例えば、Ｘ線画像の画像処理に係るシミュレーション）の技術が用いられて行われてもよい。推論モデルの訓練では、第２の異物画像７２と、第２の異物画像７２の生成に用いられた第２の正常画像６２との組み合わせが用いられる。

　図７に第３の正常画像６３及び第３の異物画像７３の例を示す。第３の正常画像６３は、訓練用の対象物が写っており、異物が写っていない画像であり、第１の正常画像６１と同様の画像である。第１の正常画像６１を第３の正常画像６３としてもよい。第３の異物画像７３は、検出対象として想定されない異物が第３の正常画像６３に付加された画像である。第３の異物画像７３は、例えば、検出対象として想定されない異物の画像を第３の正常画像６３に重畳して得られる画像である。

　図８に、第３の異物画像７３の生成に用いられる異物の画像８０の例を示す。図８に示すように第３の異物画像７３の生成のために第３の正常画像６３に付加される異物は、自然画像である。ここでの自然画像は、検出対象として想定される異物とは全く異なる、風景又は人物等を撮像した画像である。図７に示す第３の異物画像７３は、図８の右上の戦車の画像を第３の正常画像６３に重畳したものである。

　あるいは、異物の画像は用いずに、第３の正常画像６３に対して検出対象として想定される異物を想定しない画像処理を行って、第３の異物画像７３を生成してもよい。画像処理は、シミュレーションの技術が用いられて行われてもよい。推論モデルの訓練では、第３の異物画像７３と、第３の異物画像７３の生成に用いられた第３の正常画像６３との組み合わせが用いられる。

　訓練用取得部１１は、第１の正常画像６１、第２の正常画像６２及び第２の異物画像７２の組み合わせ、並びに第３の正常画像６３及び第３の異物画像７３の組み合わせを取得する。例えば、訓練用取得部１１は、モデル生成システム１０のユーザがモデル生成システム１０に対して入力した各画像を受け付けることで各画像を取得する。また、訓練用取得部１１は、それ以外の任意の方法で各画像を取得してもよい。

　あるいは、訓練用取得部１１は、上記の各画像のうち、第１の正常画像６１のみを上記と同様に取得する。なお、第１の正常画像６１の取得のみであれば、撮像によって画像を得る撮像装置（例えば、Ｘ線画像を得るＸ線撮像装置）から送信される画像を受信して取得してもよい。訓練用取得部１１は、取得した第１の正常画像６１を、第２の正常画像６２及び第３の正常画像６３とする。訓練用取得部１１は、第２の正常画像６２（第１の正常画像６１）から第２の異物画像７２を生成して取得する。例えば、訓練用取得部１１は、検出対象として想定される異物のみを撮像して得られる画像を取得して、取得した画像と第２の正常画像６２とを重畳して第２の異物画像７２を生成する。

　また、訓練用取得部１１は、第３の正常画像６３（第１の正常画像６１）から第３の異物画像７３を生成して取得する。例えば、訓練用取得部１１は、検出対象として想定されない異物の画像８０（例えば、図８に示す自然画像）を取得して、取得した画像と第３の正常画像６３とを重畳して第３の異物画像７３を生成する。第２の異物画像７２及び第３の異物画像７３の生成に用いる画像は、第１の正常画像６１と同じ方法、又はそれ以外の任意の方法で取得されればよい。

　あるいは、訓練用取得部１１は、第２の異物画像７２及び第３の異物画像７３を生成するための、シミュレーションによる画像処理の方法を予め記憶しておき、その方法によって第２の正常画像６２及び第３の正常画像６３に対して画像処理を行って第２の異物画像７２及び第３の異物画像７３を生成してもよい。シミュレーションによる画像処理では、例えば、異物の形状及びコントラストを変更したり、シンチレータに係るボケ及び残光に係るボケを加えたりする処理を行ってもよい。また、上記以外にも、撮像条件の変更に応じた画像処理を行ってもよい。シミュレーションによる画像処理は、従来の方法で実現することができる。また、第２の異物画像７２及び第３の異物画像７３の生成に用いる方法として、画像を重畳させる方法と、シミュレーションによる画像処理を行う方法とを組み合わせてもよい。

　訓練用取得部１１は、モデル生成部１２による訓練を適切に行える程度の数の訓練用の画像を取得する。訓練用取得部１１は、第１の正常画像６１の数、第２の正常画像６２と第２の異物画像７２との組み合わせの数、並びに第３の正常画像６３と第３の異物画像７３との組み合わせの数の比率が、予め設定された比率となるように訓練用の画像を取得する。例えば、訓練用取得部１１は、それらの数が同数となるよう、即ち、それらの数が全体の数の１／３ずつとなるように訓練用の画像を取得する。推論モデルが出力する画像がこの比率に応じたものとなるためである。訓練用取得部１１は、取得した訓練用の画像６１，６２，６３，７２，７３をモデル生成部１２に出力する。

　モデル生成部１２は、訓練用取得部１１によって取得された訓練用の画像を用いた訓練を行って推論モデルを生成するモデル生成手段である。推論モデル生成のための訓練は、第１の正常画像６１に基づく情報を推論モデルへの入力とし、当該第１の正常画像６１に基づく情報を推論モデルからの出力とした訓練、第２の異物画像７２に基づく情報を推論モデルへの入力とし、第２の正常画像６２に基づく情報を推論モデルからの出力とした訓練、及び第３の異物画像７３に基づく情報を推論モデルへの入力とし、第３の正常画像６３に基づく情報を推論モデルからの出力とした訓練を含む。

　モデル生成部１２は、例えば以下のように推論モデルを生成する。モデル生成部１２は、訓練用取得部１１から訓練用の画像６１，６２，６３，７２，７３を入力する。モデル生成部１２は、第１の正常画像６１毎、互いに対応する第２の正常画像６２と第２の異物画像７２との組み合わせ毎、及び互いに対応する第３の正常画像６３と第３の異物画像７３との組み合わせ毎に推論モデル生成のための訓練を行う。

　以下では、推論モデルが、画像自体を入力して、画像自体を出力するものである例を説明する。第１の正常画像６１を用いた訓練を行う場合には、モデル生成部１２は、図５に示すように、第１の正常画像６１を推論モデルへの入力とすると共に、当該第１の正常画像６１を推論モデルからの出力とした訓練を行う。互いに対応する第２の正常画像６２と第２の異物画像７２との組み合わせを用いた訓練を行う場合には、モデル生成部１２は、図６に示すように、第２の異物画像７２を推論モデルへの入力とすると共に、当該第２の異物画像７２に対応する第２の正常画像６２を推論モデルからの出力とした訓練を行う。互いに対応する第３の正常画像６３と第３の異物画像７３との組み合わせを用いた訓練を行う場合には、モデル生成部１２は、図７に示すように、第３の異物画像７３を推論モデルへの入力とすると共に、当該第３の異物画像７３に対応する第３の正常画像６３を推論モデルからの出力とした訓練を行う。

　上記の各訓練自体、即ち、推論モデルのパラメータの更新は、従来の機械学習の訓練と同様に行われればよい。また、訓練は、画像の種別（第１の正常画像６１、互いに対応する第２の正常画像６２と第２の異物画像７２との組み合わせ及び互いに対応する第３の正常画像６３と第３の異物画像７３との組み合わせの別）毎にまとめて行ってもよいし、１回ずつ画像の種別を変えて行ってもよい。

　推論モデルが、画像自体以外の画像に基づく情報を入力するものであれば、モデル生成部１２は、訓練用の画像のうち、推論モデルへの入力に対応する画像６１，７２，７３のそれぞれから、画像６１，７２，７３に基づく情報を生成して、生成した情報を推論モデルへの入力として訓練を行えばよい。また、推論モデルが、画像自体以外の画像に応じた情報を出力するものであれば、モデル生成部１２は、訓練用の画像のうち、推論モデルからの出力に対応する画像６１，６２，６３のそれぞれから、当該画像６１，６２，６３に応じた情報（画像６１，６２，６３に基づく情報）を生成して、生成した情報を推論モデルからの出力として訓練を行えばよい。

　モデル生成部１２は、例えば、訓練用取得部１１から入力した訓練用の画像６１，６２，６３，７２，７３を全て訓練に利用して推論モデルを生成する。あるいは、モデル生成部１２は、上記以外の予め設定した訓練の終了の条件を満たすまで訓練を行って推論モデルを生成してもよい。生成された推論モデルは、異物検出システム２０で用いられる。モデル生成部１２は、生成した推論モデルを出力する。例えば、モデル生成部１２は、推論モデルを異物検出システム２０に送信する。なお、異物検出システム２０への推論モデルの入力は、モデル生成部１２からの出力以外によって行われてもよい。例えば、異物検出システム２０への推論モデルの入力は、モデル生成システム１０又は異物検出システム２０の操作等によって行われてもよい。以上が、本実施形態に係るモデル生成システム１０の機能である。

　図１に示すように異物検出システム２０は、検出用取得部２１と、演算部２２と、検出部２３とを備えて構成される。

　検出用取得部２１は、異物の検出対象となる対象画像３０を取得する検出用取得手段である。検出用取得部２１は、例えば、撮像によって画像を得る撮像装置（例えば、Ｘ線画像を得るＸ線撮像装置）から送信される画像を、対象画像３０として受信して取得する。また、訓練用取得部１１は、それ以外の任意の方法で対象画像３０を取得してもよい。検出用取得部２１は、取得した対象画像３０を演算部２２に出力する。

　演算部２２は、検出用取得部２１によって取得された対象画像３０に基づく情報を、推論モデルに入力して演算を行って、推論モデルからの出力を得る演算部である。演算部２２は、モデル生成システム１０によって生成された推論モデルを入力して記憶しておく。演算部２２は、検出用取得部２１から対象画像３０を入力する。

　演算部２２は、入力した対象画像３０に基づく情報を、記憶した推論モデルに入力して演算を行って、推論モデルからの出力を得る。推論モデルを対象物の種別に応じたものとした場合には、演算部２２は、対象画像３０に係る対象物の種別に応じた推論モデルを演算に用いる。例えば、対象画像３０に写った対象物がパスタである場合には、パスタ用の推論モデルを用いる。

　推論モデルに入力される情報は、推論モデルに応じたものであり、例えば、上記のように対象画像３０自体である。また、推論モデルに入力される情報は、対象画像３０自体以外の対象画像３０に基づく情報でもよい。その場合、演算部２２は、対象画像３０から、推論モデルに入力する情報を生成する。推論モデルから出力される情報は、推論モデルに応じたものであり、例えば、上記のように対象画像３０の異物の部分を除去した（と推論される）画像４０である。また、推論モデルから出力される情報は、当該画像４０以外の当該画像４０に対応する情報でもよい。

　演算部２２は、推論モデルへの入出力に係る情報を検出部２３に出力する。例えば、演算部２２は、推論モデルへの入出力に係る情報として、対象画像３０及び推論モデルからの出力される画像４０を検出部２３に出力する。また、演算部２２は、対象画像３０及び推論モデルからの出力される画像４０以外のそれらに対応する情報を検出部２３に出力してもよい。

　検出部２３は、演算部２２による推論モデルへの入力に係る情報と、推論モデルからの出力に係る情報との差分を算出して、算出した差分から対象画像３０に含まれる異物の検出を行う検出手段である。

　検出部２３は、例えば以下のように異物の検出を行う。検出部２３による異物の検出は、例えば上述したように、図３に示すような検出結果を示す情報である異常度マップ５０の生成である。検出部２３は、演算部２２から推論モデルへの入出力に係る情報、例えば、対象画像３０及び推論モデルからの出力される画像４０を入力する。

　検出部２３は、これらの差分を取って異常度マップ５０を生成する。具体的には、対応する画素毎に対象画像３０と推論モデルからの出力される画像４０との画素値の差分を取って異常度マップ５０を生成する。異常度マップ５０において、０以外の画素値を有する部分、即ち、画像３０，４０間で画素値に差がある部分は異物があると検出（推定）される部分である。

　検出部２３は、検出結果を示す情報である異常度マップ５０を出力する。検出結果を示す情報の出力は、例えば、他のシステム（装置）又は他のモジュールに対して行われてもよいし、異物検出システム２０のユーザが認識できる形式（例えば、表示又は音声出力）で行われてもよい。

　また、検出部２３は、異物の検出として、予め異物の検出の基準を予め記憶しておき、当該基準に基づいて異常度マップ５０から対象画像３０に異物が含まれるか否かの判定を行ってもよい。また、検出部２３は、推論モデルへの入力に係る情報と、推論モデルからの出力に係る情報との差分を算出して、算出した差分から対象画像３０に含まれる異物の検出を行うものであれば、上記以外の処理を行ってもよい。以上が、本実施形態に係る異物検出システム２０の機能である。

　引き続いて、図９及び図１０のフローチャートを用いて、本実施形態に係るモデル生成システム１０及び異物検出システム２０で実行される処理（モデル生成システム１０及び異物検出システム２０が行う動作方法）を説明する。

　まず、図９のフローチャートを用いて、本実施形態に係るモデル生成システム１０で実行される処理であるモデル生成方法を説明する。本処理では、まず、訓練用取得部１１によって、訓練用の画像６１，６２，６３，７２，７３が取得される（Ｓ０１、訓練用取得ステップ）。訓練用の画像は、第１の正常画像６１、第２の正常画像６２及び第２の異物画像７２の組み合わせ、並びに第３の正常画像６３及び第３の異物画像７３の組み合わせである。第１～第３の正常画像６１～６３は、訓練用の対象物が写っている画像である。第２の異物画像７２は、検出対象として想定される異物が第２の正常画像に付加された画像である。第３の異物画像７３は、検出対象として想定されない異物が第３の正常画像に付加された画像である。

　続いて、モデル生成部１２によって、訓練用の画像６１，６２，６３，７２，７３を用いた訓練が行われて推論モデルが生成される（Ｓ０２、モデル生成ステップ）。訓練は、第１の正常画像６１に基づく情報を推論モデルへの入力とし、当該第１の正常画像６１に基づく情報を推論モデルからの出力とした訓練を含む。訓練は、第２の異物画像７２に基づく情報を推論モデルへの入力とし、第２の正常画像６２に基づく情報を推論モデルからの出力とした訓練を含む。訓練は、第３の異物画像７３に基づく情報を推論モデルへの入力とし、第３の正常画像６３に基づく情報を推論モデルからの出力とした訓練を含む。

　生成された推論モデルは、モデル生成部１２から出力される（Ｓ０３）。モデル生成システム１０から出力された推論モデルは、異物検出システム２０に記憶される。以上が、本実施形態に係るモデル生成システム１０で実行される処理であるモデル生成方法である。

　続いて、図１０のフローチャートを用いて、本実施形態に係る異物検出システム２０で実行される処理である異物検出方法を説明する。本処理では、まず、検出用取得部２１によって、対象画像３０が取得される（Ｓ１１、検出用取得ステップ）。続いて、演算部２２によって、対象画像３０に基づく情報が、推論モデルに入力されて演算が行われて、推論モデルからの出力が得られる（Ｓ１２、演算ステップ）。続いて、検出部２３によって、対象画像３０に含まれる異物の検出の処理として、推論モデルへの入力に係る情報と、推論モデルからの出力に係る情報との差分が算出されて、異常度マップとされる（Ｓ１３、検出ステップ）。続いて、異物の検出結果を示す情報として、生成された異常度マップが、検出部２３から出力される（Ｓ１４）。以上が、本実施形態に係る異物検出システム２０で実行される処理である異物検出方法である。

　上述した食品の商品の画像のような、概ね同様の形状の対象物（例えば、パスタ）が多数写っている画像からは、従来の方法では異物の検出が困難な場合がある。例えば、第２の正常画像６２と第２の異物画像７２との組み合わせのみを用いて訓練を行って推論モデルを生成した場合、出力に異物が反映されたり、対象物の一部が欠如したりしてしまう。これは、上記の画像の構造が原因であると考えられる。

　本実施形態に係るモデル生成方法では、正常画像６１～６３に加えて、２種類の互いに異なる異物画像７２，７３が用いられて訓練が行われて、推論モデルが生成される。具体的には、上述したように、第１の正常画像６１を用いた訓練（図５に示す訓練）、第２の正常画像６２及び第２の異物画像７２を用いた訓練（図６に示す訓練）、並びに第３の正常画像６３及び第３の異物画像７３を用いた訓練（図７に示す訓練）の３種類の訓練が行われて、推論モデルが生成される。このように生成された推論モデルは、入力された画像に写っているもののうち、対象物を出力に反映し、異物を出力に反映しないものとなる。即ち、パスタを対象物とする推論モデルは、パスタの構造を通し、異物の構造を通さないパスタパスフィルタとなる。

　従って、本実施形態のようにパスタ等の概ね同一の形状のものが複数写った画像において、小さな異物を検出する場合であっても、出力される画像から異物を除去することができる。従って、本実施形態によれば、生成された推論モデルを用いて異物の検出を行うことで、精度よく異物を検出することができる。

　また、本実施形態のように、第３の異物画像７３の生成に用いる検出対象として想定されない異物は、自然画像であってもよい。この構成によれば、より適切かつ確実に推論モデルを生成することができる。但し、検出対象として想定されない異物は、自然画像以外の様々なテクスチャの画像であってもよい。

　また、本実施形態のように、第２の正常画像６２及び第３の正常画像６３は、第１の正常画像６１であってもよい。また、第１の正常画像６１に対して、検出対象として想定される異物を付加して第２の異物画像７２を生成して取得し、第１の正常画像６１に対して、検出対象として想定されない異物を付加して第３の異物画像７３を生成して取得することとしてもよい。この構成によれば、正常画像６１～６３として第１の正常画像６１が取得できれば、容易かつ確実に第２の異物画像７２及び第３の異物画像７３を取得することができる。その結果、全ての訓練用の画像６１，６２，６３，７２，７３を取得することができ、容易かつ確実に推論モデルを生成することができる。但し、訓練用の画像６１，６２，６３，７２，７３の取得は、上記のように行われる必要はなく、どのように行われてよい。

　また、本実施形態のように、対象物は、特定の種別の物であってもよく、訓練用の画像６１，６２，６３，７２，７３は、特定の種別の物が訓練用の対象物として写っている画像であってもよい。例えば、パスタの商品であってもよい。また、食品の種別毎の推論モデルの生成及び利用が行われてもよい。この構成によれば、特定の種別の物について精度よく異物を検出するための推論モデルを生成することができる。但し、対象物を特定の種別の物に限定しない訓練用の画像６１，６２，６３，７２，７３を用いてもよい。

　また、本実施形態のように、取得され訓練に用いられる第１の正常画像６１の数、第２の正常画像６２と第２の異物画像７２との組み合わせの数、並びに第３の正常画像６３と第３の異物画像７３との組み合わせの数の比率は、予め設定された比率であることとしてもよい。例えば、上述したようにそれらの数は同一であってもよい。この比率を適切なものとすることで、より適切かつ確実に推論モデルを生成することができる。但し、この比率は予め設定されたものとする必要はない。

　なお、モデル生成システム１０と異物検出システム２０とは、同一の主体によって提供されるものであってもよいし、それぞれ別の主体によって提供されるものであってもよい。また、モデル生成システム１０と異物検出システム２０とは、同一のユーザによって用いられてるものであってもよいし、それぞれ別のユーザによって用いられてるものであってもよい。

　図１１に、本実施形態によって実際に異物の検出を行った結果の例を示す。ここでは、従来の２つの手法によって異物の検出を行った結果を比較例として、本実施形態に係る結果と比較する。従来の方法のうちの第１の方法は、以下のものである。異物がない対象物の画像である良品画像（例えば、本実施形態に用いる正常画像６１～６３）を予め用意しておく。異物の検出の対象画像について、画像の部分毎の特徴量（例えば、ベクトルで表される特徴ベクトル）を算出する。良品画像についても、画像の部分毎の特徴量を算出する。対象画像の特徴量と、良品画像の特徴量とを比較して、比較に基づいて部分毎に異物があるかどうかを検出する。例えば、特徴ベクトル同士の距離を算出して、それらの距離が予め設定した閾値以上であれば異物があると判断し、閾値以上でなければ異物がないと判断する。

　従来の方法のうちの第２の方法は、以下のものである。異物がない対象物の画像である良品画像（例えば、本実施形態に用いる正常画像６１～６３）を予め用意しておく。良品画像から、機械学習の訓練によってオートエンコーダを生成する。生成したオートエンコーダを推論モデルとして、本実施形態の異物検出システム２０による方法と同様に異物の検出を行う。

　図１１に示す結果は、パスタの商品にＳＵＳ球及びガラス球を５個ずつ異物として入れて異物の検出を行った結果である。図１１の（ａ）の表は第１の方法による結果を示しており、（ｂ）の表は第２の方法による結果を示しており、（ｃ）の表は本実施形態による結果を示している。第１の方法では、ＳＵＳ球及びガラス球をそれぞれ２個検出し、誤検出（異物がないにもかかわらず異物を検出した）が３個あった。第２の方法では、ＳＵＳ球を３個検出し、ガラス球は検出できず、誤検出はなかった。本実施形態では、ＳＵＳ球及びガラス球をそれぞれ４個検出し、誤検出はなかった。この結果に示すように従来の方法と比べて、本実施形態では精度よく異物を検出することができる。

　また、図１２及び図１３に、訓練に用いる画像と、推論モデルから出力される画像及び異常度マップとの例を示す。図１２（ａ）～（ｆ）及び図１３（ａ）（ｂ）に示す画像及び異常度マップは比較例であり、図１３（ｃ）（ｄ）に示す画像及び異常度マップは本実施形態に係る例である。

　図１２の（ａ）及び（ｂ）に、第１の正常画像６１のみを用いて訓練を行って推論モデルを生成した場合（即ち、推論モデルをオートエンコーダとした場合）の、推論モデルから出力される画像及び異常度マップを示す。この場合、推論モデルから出力される画像は、異物が消されておらず、異常度マップの楕円で囲った異物があるべき部分でも異物が検出されていない。

　図１２の（ｃ）及び（ｄ）に、第２の正常画像６２及び第２の異物画像７２の組み合わせのみを用いて訓練を行って推論モデルを生成した場合の、推論モデルから出力される画像及び異常度マップを示す。この場合、推論モデルから出力される画像は、異物が消されているが、パスタの部分も過剰に除去されている。異常度マップの楕円で囲った異物がない部分でも異物が検出されている。

　図１２の（ｅ）及び（ｆ）に、第３の正常画像６３及び第３の異物画像７３の組み合わせのみを用いて訓練を行って推論モデルを生成した場合の、推論モデルから出力される画像及び異常度マップを示す。この場合、推論モデルから出力される画像は、パスタの部分の構造が全体的に除去され気味となっている。

　図１３の（ａ）及び（ｂ）に、第１の正常画像６１と、第２の正常画像６２及び第２の異物画像７２の組み合わせとを、それぞれ同数ずつ用いて訓練を行って推論モデルを生成した場合の、推論モデルから出力される画像及び異常度マップを示す。この場合、推論モデルから出力される画像は、異物が消されている。しかしながら、若干異物を過学習しており、パスタの構造の中に異物として除去されている部分がある。異常度マップの楕円で囲った異物がない部分でも異物が検出されている。

　図１３の（ｃ）及び（ｄ）に、第１の正常画像６１と、第２の正常画像６２及び第２の異物画像７２の組み合わせと、第３の正常画像６３及び第３の異物画像７３の組み合わせとを、それぞれ同数ずつ用いて訓練を行って推論モデルを生成した場合（即ち、本実施形態の場合）の、推論モデルから出力される画像及び異常度マップを示す。この場合、推論モデルから出力される画像は、他の例に比べて適切に異物が消されており、異常度マップも適切な異物が検出されたことを示すものとなっている。

　以上の説明では、パスタの画像を例としていたが他の種別の物を対象物とした場合の例を示す。図１４は、ライスを対象物とした場合の例である。図１４の（ａ）は、異物の検出に用いられる対象画像の例であり、（ｂ）は、対象画像を推論モデルに入力した際の推論モデルから出力される画像の例であり、（ｃ）は、それらの画像から生成される異常度マップの例である。ライスを対象物とする場合、ライスが対象物として写った訓練用の画像６１，６２，６３，７２，７３が用いられて訓練が行われて推論モデルが生成される。この推論モデルは、ライスの構造を通し、異物の構造を通さないライスパスフィルタとなる。

　図１５は、ドライフルーツを加えたグラノーラを対象物とした場合の例である。図１５の（ａ）は、異物の検出に用いられる対象画像の例であり、（ｂ）は、対象画像を推論モデルに入力した際の推論モデルから出力される画像の例であり、（ｃ）は、それらの画像から生成される異常度マップの例である。図中の破線で囲った部分は、異物が存在する部分である。グラノーラを対象物とする場合、グラノーラが対象物として写った訓練用の画像６１，６２，６３，７２，７３が用いられて訓練が行われて推論モデルが生成される。この推論モデルは、グラノーラの構造を通し、異物の構造を通さないグラノーラパスフィルタとなる。

　引き続いて、上述した一連のモデル生成システム１０及び異物検出システム２０による処理を実行させるためのモデル生成プログラム及び異物検出プログラムを説明する。図１６（ａ）に示すように、モデル生成プログラム１００は、コンピュータに挿入されてアクセスされる、あるいはコンピュータが備える、コンピュータ読み取り可能な記録媒体１１０に形成されたプログラム格納領域１１１内に格納される。記録媒体１１０は、非一時的な記録媒体であってもよい。

　モデル生成プログラム１００は、訓練用取得モジュール１０１と、モデル生成モジュール１０２とを備えて構成される。訓練用取得モジュール１０１と、モデル生成モジュール１０２とを実行させることにより実現される機能は、上述したモデル生成システム１０の訓練用取得部１１と、モデル生成部１２との機能とそれぞれ同様である。

　図１６（ｂ）に示すように、異物検出プログラム２００は、コンピュータに挿入されてアクセスされる、あるいはコンピュータが備える、コンピュータ読み取り可能な記録媒体２１０に形成されたプログラム格納領域２１１内に格納される。記録媒体２１０は、非一時的な記録媒体であってもよい。なお、モデル生成プログラム１００及び異物検出プログラム２００が同一のコンピュータで実行される場合には、記録媒体２１０は、記録媒体１１０と同一であってもよい。

　異物検出プログラム２００は、検出用取得モジュール２０１と、演算モジュール２０２と、検出モジュール２０３とを備えて構成される。検出用取得モジュール２０１と、演算モジュール２０２と、検出モジュール２０３とを実行させることにより実現される機能は、上述した異物検出システム２０の検出用取得部２１と、演算部２２と、検出部２３との機能とそれぞれ同様である。

　なお、モデル生成プログラム１００及び異物検出プログラム２００は、その一部又は全部が、通信回線等の伝送媒体を介して伝送され、他の機器により受信されて記録（インストールを含む）される構成としてもよい。また、モデル生成プログラム１００及び異物検出プログラム２００の各モジュールは、１つのコンピュータでなく、複数のコンピュータの何れかにインストールされてもよい。その場合、当該複数のコンピュータによるコンピュータシステムよって上述した一連の処理が行われる。

　引き続いて、本発明の実施形態の更なる変形例、実施例について説明する。なお、以下に説明する変形例は、上述した実施形態の一部に置き換えられて、あるいは追加されて実施されてもよい。

　図１７に第３の正常画像６３及び第３の異物画像７３の別の例を示す。図１７に示す第３の異物画像７３のように、第３の異物画像７３は、複数の部分的な自然画像が第３の正常画像６３に重畳されたものであってもよい。ここで、部分的な自然画像は、第３の正常画像６３よりもサイズが小さい自然画像である。このような第３の異物画像７３を用いても、異物の検出のために適切な推論モデルを生成することができる。即ち、自然画像の特徴で分類は十分可能であり、あらゆる異物構造（想定外の異物）にも対応可能である。

　第３の異物画像７３に付加されている異物は、計算式に基づいて描画された画像であってもよい。図１８にこの場合の第３の正常画像６３及び第３の異物画像７３の例を示す。図１８に示す第３の異物画像７３のように、異物に係る画像は、例えば、予め用意された計算式に基づいてシミュレーションによって生成される画像である。当該画像は、従来の方法によって生成されてもよい。第３の正常画像６３に付加される異物に係る画像は、モデル生成システム１０（の訓練用取得部１１）によって生成されてもよいし、モデル生成システム１０以外によって生成されてモデル生成システム１０（の訓練用取得部１１）によって取得されてもよい。

　第３の異物画像７３に付加される異物に係ると共に計算式に基づいて描画された画像は、図１９に示すような幾何学模様の画像８１であってもよい。また、当該画像は、図２０に示すようなプロシージャルテクスチャの画像（計算式に基づいて生成される質感等のテクスチャの画像）８２であってもよい。また、当該画像は、図２１に示すような、周波数に係る計算式に基づいて生成される画像である周波数画像８３、又は複数の周波数画像８３を組み合わせたものであってもよい。また、当該画像は、上記の各画像を組み合わせた画像、例えば、図２２に示すような、プロシージャルテクスチャの画像８２に基づいて周波数画像８３を切り取った画像であってもよい。

　第３の異物画像７３として上記の画像に基づくものを用いた構成によっても、より適切かつ確実に推論モデルを生成することができる。

　続いて、コーヒー豆を対象物として画像から異物を検出した例を示す。図２３の（ａ）は、異物の検出に用いられる対象画像３０から、従来の画像の単純２値化によって異物を検出した場合の検出された異物を対象画像３０に重畳したものである。図２３の（ａ）に示すように、従来の方法では、画像上段に２個、画像中段に３個、画像下段に２個の異物が検出された。図２３の（ｂ）は、本実施形態の推論モデルを用いて対象画像３０から得られた異常度マップであり、（ｃ）は異常度マップから検出された異物を対象画像３０に重畳したものである。図２３の（ｃ）に示すように、本実施形態による方法では、画像上段に４個、画像中段に２個、画像下段に６個の異物が検出された。

　図２４の（ａ）は、異物の検出に用いられる対象画像（図２３に示す対象画像とは別の画像）３０から、従来の画像の単純２値化によって異物を検出した場合の検出された異物を対象画像３０に重畳したものである。図２４の（ａ）に示すように、従来の方法では、画像上段に２個、画像中段に３個、画像下段に３個の異物が検出された。図２４の（ｂ）は、本実施形態の推論モデルを用いて対象画像３０から得られた異常度マップであり、（ｃ）は異常度マップから検出された異物を対象画像３０に重畳したものである。図２４の（ｃ）に示すように、本実施形態による方法では、画像上段に３個、画像中段に６個、画像下段に５個の異物が検出された。図２３及び図２４の例にも示すように、本実施形態による方法によれば、従来の方法では検出できなかった実際の異物を検出している。このように本実施形態による方法によれば、高精度での異物の検出が可能である。

　第３の異物画像７３において、異物が付加されている部分は、第３の異物画像７３全体である必要はなく、第３の異物画像７３の一部であってもよい。また、第３の異物画像７３において、異物が付加されている部分の位置は、不規則な位置（ランダムな位置）であってもよい。また、第３の異物画像７３における、個々の異物の大きさも様々な大きさ（マルチサイズ）であってもよい。これによって、推論モデルを、対象画像３０から検出される異物も不規則な位置にあっても、あるいは様々な大きさであっても、適切に異物を検出できるものとすることができる。図２５に、不規則な位置に異物が付加されている第３の異物画像７３の例を示す。

　第３の異物画像７３は、透過的な付加及び置き換えによる付加の少なくとも何れかによって、検出対象として想定されない異物が第３の正常画像６３に付加された画像であってもよい。図２６に、異物の透過的な付加による第３の異物画像７３、及び対応する第３の正常画像６３を示す。図２７に、異物の置き換えによる付加による第３の異物画像７３、及び対応する第３の正常画像６３を示す。

　異物の透過的な付加（ミックスアップ）とは、第３の異物画像７３の異物が付加された部分において、異物と付加前の第３の正常画像６３との両方が見えるように異物を付加することである。即ち、異物の透過的な付加は、付加する部分において、異物を透かして第３の正常画像６３が見える状態（あるいは、第３の正常画像６３を透かして異物が見える状態）で、半透明の異物を付加前の第３の正常画像６３に重畳することである。異物の透過的な付加を行う場合、第３の異物画像７３全体における異物が付加されている部分の大きさの割合は、１０％～１００％としてもよい。この割合を大きくすることで、推論モデルの異物検出性能を高くすることができる。

　図２８に、異物の透過的な付加による第３の異物画像７３を用いて推論モデルを生成した場合に、コーヒー豆を対象物として対象画像３０から異物を検出した例を示す。図２８の（ａ）は、対象画像３０から得られた異常度マップであり、（ｂ）は異常度マップから検出された異物を対象画像３０に重畳したものである。

　異物の透過的な付加による第３の異物画像７３を用いた場合、特に局所的な異物（例えば、テクスチャの変化（疵又は異常））の検出を高精度で行うことができる。また、対象画像３０が、上記の異物の透過的な付加と同様に、異物とそれ以外が透過的に重なり合って写っているものである場合、異物の検出を高精度で行うことができる。例えば、対象画像３０がＸ線画像である場合、異物の検出を高精度で行うことができる。

　異物の置き換えによる付加（ミックスアウト）とは、第３の異物画像７３の異物が付加された部分において、第３の正常画像６３を取り除いて異物を付加することである。即ち、異物の置き換えによる付加は、付加する部分において、異物で第３の正常画像６３を遮蔽した状態で、異物を付加前の第３の正常画像６３に重畳することである。異物の置き換えによる付加を行う場合、第３の異物画像７３全体における異物が付加されている部分の大きさの割合は、１０％～６０％としてもよい。この割合を大きくすることで、推論モデルの異物検出性能を高くすることができる。

　図２９に、異物の置き換えによる付加による第３の異物画像７３を用いて推論モデルを生成した場合に、コーヒー豆を対象物として対象画像３０から異物を検出した例を示す。図２９の（ａ）は、対象画像３０から得られた異常度マップであり、（ｂ）は異常度マップから検出された異物を対象画像３０に重畳したものである。

　異物の置き換えによる付加による第３の異物画像７３を用いた場合、特に大局的な異物（例えば、色が違う、欠損又は曲がり）の検出を高精度で行うことができる。この場合、生成される推論モデルが、遮蔽された第３の正常画像６３の部分を復元し（例えば、異物がない正常品に復元し）、画像に写ったものの位置関係まで学習されて得られたものだからである。例えば、対象画像が、異常検知手法の評価に用いられるデータセットであるＭＶＴｅｃＡＤに類する画像である場合、異物の検出を高精度で行うことができる。

　第３の異物画像７３が、透過的な付加及び置き換えによる付加の少なくとも何れかによるものである場合も、訓練用取得部１１は、上述した方法と同様に第３の異物画像７３を取得すればよい。訓練用取得部１１が、第３の異物画像７３を生成する場合、従来の画像の透過的な付加及び画像の置き換えの技術を用いて第３の異物画像７３を生成すればよい。第３の異物画像７３は、透過的な付加によるもの、置き換えによる付加によるもの、及びそれらの両方によるものの何れかでよい。複数の第３の異物画像７３は、上記の何れか一種類のもので構成されていてもよいし、上記の複数の種類のものを含んでいてもよい。

　上記の通り、透過的な付加及び置き換えによる付加の少なくとも何れかによって第３の異物画像７３を生成する構成によっても、より適切かつ確実に推論モデルを生成することができる。

　また、推論モデルの訓練の際に、推論モデルからの出力とする情報に係る画像は、推論モデルへの入力に係る画像（正常画像）に上記以外の画像加工が行われたものであってもよい。当該画像加工は、予め設定されたものであり、例えば、回転、反転、画素値の変更（輝度振り）、ガンマ補正、エッジ強調及び平滑化処理の何れかである。当該画像加工は、第２の異物画像７２又は第３の異物画像７３に対して行われてもよい。また、上述した訓練用の画像６１，６２，６３，７２，７３以外にも、当該画像加工が行われた画像が、推論モデルの訓練に用いられてもよい。

　モデル生成システム１０によって生成され、異物検出システム２０によって用いられる推論モデルは、複数の層を有するニューラルネットワークを含み、層間での連結（Ｃｏｎｃａｔ，Ｃｏｎｃａｔｅｎａｔｉｏｎ）（結合）を行う構造を有し、連結を経由した後の画像と入力した画像とを加算するモデルであってもよい。例えば、当該推論モデルは、上記の構成を有するニューラルネットワークである。当該ニューラルネットワークを図３０に模式的に示す。

　図３０に示すように、当該ニューラルネットワークは、入力した画像を特徴量にエンコードするエンコーダと、エンコーダから出力される特徴量を画像にデコードするデコーダとを含む。エンコーダは、２次元畳み込み及び活性化が行われる複数の層（Ｃｏｎｖ２Ｄ　Ｌａｙｅｒ，Ａｃｔｉｖａｔｉｏｎ　Ｌａｙｅｒ）を有する。エンコーダの複数の層間では、プーリングが行われる。デコーダは、２次元畳み込み及び活性化が行われる複数の層（Ｃｏｎｖ２Ｄ　Ｌａｙｅｒ，Ａｃｔｉｖａｔｉｏｎ　Ｌａｙｅｒ）を有する。デコーダの複数の層間では、アンプーリングが行われる。エンコーダの層は、エンコーダの層と同一のサイズのデコーダの層に連結（Ｃｏｎｃａｔ）される（Ｃｏｎｃａｔｅｎａｔｉｏｎ　Ｌａｙｅｒ）。連結される２つの層は、互いに隣接していない層である。このように、当該ニューラルネットワークは、プーリング層を持つＵ－Ｎｅｔタイプのモデルである。

　エンコーダに入力される画像と、デコーダの最後の２次元畳み込み及び活性化が行われる層から出力される画像との加算が行われ、加算によって得られた画像がデコーダの出力層（Ｒｅｇｒｅｓｓｉｏｎ　Ｌａｙｅｒ）から出力される。上記の画像の加算は、対応する画素毎の画素値の加算である。

　上記のニューラルネットワークでは、デコーダの最後の２次元畳み込み及び活性化が行われる層から出力される画像を、入力される画像に含まれる異物の画像（正確には、入力した画像に加算することで異物を除去できる異物に係る画素の画素値にマイナスをかけた画像）とすることができる。この構造によれば、推論モデルを、適切に異物の部分を除去した画像を出力するものにできる。その結果、精度よく異物の検出を行うことができる。

　モデル生成システム１０は、上述した推論モデルをベースに新たな訓練を行って第２の推論モデルを生成してもよい。即ち、モデル生成システム１０は、推論モデルを生成する訓練、その後の第２の推論モデルを生成する訓練の２段階の訓練を行ってもよい。異物検出システム２０は、上述した推論モデルではなく、モデル生成システム１０によって生成された第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行ってもよい。なお、以降の説明では、単に推論モデルと記載したら上述した実施形態の推論モデル（１段階目で生成される推論モデル）を指す。

　この場合、モデル生成部１２は、生成した推論モデルの出力側に、当該推論モデルに入力した画像の位置毎の異物の度合いを示す情報を出力する部分を追加した新たな第２の推論モデルを、新たな訓練を行って生成する。即ち、モデル生成部１２は、推論モデルに基づく転移学習を行って第２の推論モデルを生成する。

　第２の推論モデルは、異物の検出対象の画像を入力して、入力した画像の位置毎の異物の度合いを示す情報を出力（推論）するモデル（識別モデル、クラス分けモデル）である。例えば、第２の推論モデルは、異物の検出対象となる対象画像３０の画素毎に、当該画素が異物に係るものであるかの確率（良否の確率、クラスの分類値）の値を出力する。この場合、第２の推論モデルは、当該確率として画素毎に０～１の値を出力してもよい。出力される値が１に近いほど当該画素が異物に係るものである度合いが高く、出力される値が０に近いほど当該画素が異物に係るものである度合いが低いことを示している。

　推論モデルを用いた異物の検出では、推論モデルへ入力される画像と推論モデルから出力される画像との差分を取ることで異物の検出を行っていた。第２の推論モデルを用いた異物の検出では、推論モデルを用いた異物の検出のように画像間の差分を取る必要はない。

　図３１に、本実施形態の第２の推論モデルの例を模式的に示す。例えば、第２の推論モデルは、ニューラルネットワークである。第２の推論モデルは、ニューラルネットワークである推論モデルの出力側に新たな層が追加されて、新たな訓練が行われて生成されたものである。

　図３１に示す例では、推論モデルは、入力した画像を特徴量にエンコードするエンコーダと、エンコーダから出力される特徴量を画像にデコードするデコーダとを含むニューラルネットワークである。エンコーダは、２次元畳み込み及び活性化が行われる複数の層（Ｃｏｎｖ２Ｄ　Ｌａｙｅｒ，Ａｃｔｉｖａｔｉｏｎ　Ｌａｙｅｒ）を有する。エンコーダの複数の層間では、プーリングが行われる。デコーダは、２次元畳み込み及び活性化が行われる複数の層（Ｃｏｎｖ２Ｄ　Ｌａｙｅｒ，Ａｃｔｉｖａｔｉｏｎ　Ｌａｙｅｒ）を有する。デコーダの複数の層間では、アンプーリングが行われる。エンコーダの層は、エンコーダの層と同一のサイズのデコーダの層に連結（Ｃｏｎｃａｔ）される（Ｃｏｎｃａｔｅｎａｔｉｏｎ　Ｌａｙｅｒ）。連結される２つの層は、互いに隣接していない層である。デコーダの２次元畳み込み及び活性化が行われる複数の層のうちの最後の層が、推論モデルの出力層である。なお、第２の推論モデルに用いられる推論モデルは、必ずしも図３１に示すものである必要はなく、第２の推論モデルを構成可能なものであれば任意のものでよい。

　第２の推論モデルにおいて追加される部分は、ニューラルネットワークの複数の層である。例えば、図３１に示すように、互いに隣接する層が接続されている３つの層が追加される。推論モデルの側からの１つめの層は、畳み込み及びＲｅｌｕ関数による演算が行われる層（Ｃｏｎｖ＋Ｒｅｌｕ、Ｃｏｎｖ２Ｄ　Ｌａｙｅｒ，Ａｃｔｉｖａｔｉｏｎ　Ｌａｙｅｒ）である。この層は、第１の推論モデルの出力層に接続される。２つめの層は、ｓｏｆｔｍａｘ関数による演算が行われる層（ｓｏｆｔｍａｘ）である。３つめの層は、上記の確率の値を出力する出力層（Ｐｉｘｅｌ　Ｃｌａｓｓｉｆｉｃａｔｉｏｎ）である。

　第２の推論モデルの入力層は、推論モデルの入力層と同じである。第２の推論モデルには、出力層に、入力層に入力される情報に係る画像の位置毎の異物の度合いを示す情報を出力するためのニューロンが設けられる。例えば、推論モデルから出力される情報は、上述したように画像の各画素の当該画素が異物に係るものであるかの確率の値である。この場合、出力層には、画像の画素の数のニューロンが設けられ、それぞれのニューロンから対応する画素の確率の値が出力される。なお、推論モデルから出力される情報は、上述した画像の位置毎の異物の度合いを示す情報であれば各画素の確率の値以外であってもよい。

　また、第２の推論モデルは、機械学習の訓練によって生成されて上述した入出力を行うものであれば、ニューラルネットワーク以外によって構成されていてもよい。第２の推論モデルも、第１の推論モデルと同様に人工知能ソフトウェアの一部であるプログラムモジュールとしての利用が想定される。

　第２の推論モデルは、推論モデルと同様に対象物の種別に応じたものとしてもよい。この場合、この点において、第２の推論モデルは、推論モデルと同様に扱うことができる。また、上記の点以外においても同様とできる点については、第２の推論モデルと、推論モデルとは同様としてもよい。

　続いて、第２の推論モデルに係るモデル生成システム１０及び異物検出システム２０の機能を説明する。訓練用取得部１１は、第２の推論モデルの訓練用の情報も取得する。第２の推論モデルの訓練用の情報は、第２の推論モデルの訓練用の画像と、当該画像の位置毎の異物の度合いを示す情報の組み合わせである。図３２に、第２の推論モデルの訓練用の画像９１、及び当該画像９１の位置毎の異物の度合いを示す情報９２の例を示す。第２の推論モデルの訓練用の画像９１は、上記の第１の正常画像６１、第２の異物画像７２及び第３の異物画像７３の少なくとも何れかとすることができる。従って、訓練用取得部１１は、推論モデルの訓練用の画像とは別に第２の推論モデルの訓練用の画像９１を取得する必要はない。但し、訓練用取得部１１は、推論モデルの訓練用の画像とは別に第２の推論モデルの訓練用の画像９１を取得してもよい。この場合、訓練用取得部１１は、推論モデルの訓練用の画像の取得方法と同様の方法で当該画像９１を取得すればよい。

　第２の推論モデルの訓練用の情報の一部である、第２の推論モデルの訓練用の画像９１の位置毎の異物の度合いを示す情報９２は、例えば、第２の推論モデルの訓練用の画像９１の画素毎の当該画素が異物に係るものであるかを示す値である。上述した例のように第２の推論モデルからの出力が０～１の値であり、出力される値が１に近いほど当該画素が異物に係るものである度合いが高い場合、当該情報９２の値は、当該画素が異物に係るものであれば１、当該画素が異物に係るものでなければ０である。図３２における当該情報９２は、第２の推論モデルの訓練用の画像９１毎の値を示しており、白い部分が１（即ち、白い部分が異物の部分）であり、黒い部分が０（即ち、黒い部分が異物でない部分）である。なお、当該情報９２の値は、必ずしも上記である必要はなく、第２の推論モデルからの出力も応じたものであればよい。

　訓練用取得部１１は、上記の情報９２を生成して取得してもよい。例えば、第２の推論モデルの訓練用の画像９１と、第１の正常画像６１、第２の異物画像７２及び第３の異物画像７３とする場合、訓練用取得部１１は、これらの画像６１，７２，７３の画素毎に異物の部分を１、異物でない部分を０とした情報を上記の情報９２として生成する。異物の部分は、例えば、異物として正常画像に追加される画像の部分とする。あるいは、異物として正常画像に追加される画像のうち、異物である部分を既存の検出の技術で検出して、検出した部分を上記の情報９２における異物の部分とすればよい。即ち、上記の情報９２は、ユーザによるアノテーションを必要とせずに、即ち、アノテーションフリーで取得され得る。また、訓練用取得部１１は、モデル生成システム１０のユーザがモデル生成システム１０に対して入力した上記の情報９２を受け付けることで上記の情報９２を取得してもよい。

　訓練用取得部１１は、モデル生成部１２による第２の推定モデルの訓練を適切に行える程度の数の第２の推論モデルの訓練用の情報を取得する。訓練用取得部１１は、取得した第２の推論モデルの訓練用の情報をモデル生成部１２に出力する。

　モデル生成部１２は、例えば以下のように第２の推論モデルを生成する。モデル生成部１２は、訓練用取得部１１から第２の推論モデルの訓練用の情報を入力する。モデル生成部１２は、第２の推論モデルの訓練用の情報の上記の組み合わせ毎に第２の推論モデル生成のための訓練を行う。第２の推論モデル生成のための訓練は、訓練によって第１の推論モデルが生成された後に行われる。

　以下では、第２の推論モデルが、画像自体を入力して、上記の確率の値を出力するものである例を説明する。モデル生成部１２は、図３２に示すように、第２の推論モデルの訓練用の画像９１を第２の推論モデルへの入力とすると共に、当該画像９１に対応する確率の値の情報９２を第２の推論モデルからの出力とした訓練を行う。

　第２の推論モデルの訓練の際、第２の推論モデルのうちの推論モデルのエンコーダ部分は、訓練による更新がなされないようにする。即ち、第２の推論モデルのうちの第１のエンコーダ部分は、推論モデルの訓練（１段階目での訓練）でのみ更新されて、第２の推論モデルの訓練（２段階目での訓練）での学習率を０とする。２段階目での訓練の際、第２の推論モデルのうちの推論モデルのデコーダ部分は、追加部分と比べて学習率が低くなるようにする。例えば、デコーダ部分の学習率は、追加部分に対する１／１００の学習率とする。また、学習の際の損失関数は、例えば、交差エントロピー誤差が用いられる。第２の推論モデルの訓練は、上記以外のように行われてもよい。上記の各訓練自体、即ち、第２の推論モデルのパラメータの更新は、従来の機械学習の訓練と同様に行われればよい。

　第２の推論モデルが、画像自体以外の画像に基づく情報を入力するものであれば、モデル生成部１２は、第２の推論モデルへの入力に対応する画像９１から、画像９１に基づく情報を生成して、生成した情報を推論モデルへの入力として訓練を行えばよい。

　モデル生成部１２は、例えば、訓練用取得部１１から入力した第２の推論モデルの訓練用の情報を全て訓練に利用して第２の推論モデルを生成する。あるいは、モデル生成部１２は、上記以外の予め設定した訓練の終了の条件を満たすまで訓練を行って第２の推論モデルを生成してもよい。生成された第２の推論モデルは、異物検出システム２０で用いられる。モデル生成部１２は、生成した第２の推論モデルを出力する。第２の推論モデルの入出力は、上記の推論モデルの入出力と同様に行われればよい。また、異物の検出に第２の推論モデルが用いられる場合には、推論モデルの出力は必要ない。

　第２の推論モデルを用いる場合、異物検出システム２０における異物の検出は、以下のように行われる。検出用取得部２１は、異物の検出対象となる対象画像３０を取得する。検出用取得部２１は、推論モデルを用いる場合と同様に対象画像３０を取得して演算部２２に出力する。

　演算部２２は、検出用取得部２１によって取得された対象画像３０に基づく情報を、第２の推論モデルに入力して演算を行って、第２の推論モデルからの出力を得る。演算部２２は、モデル生成システム１０によって生成された第２の推論モデルを入力して記憶しておく。演算部２２は、検出用取得部２１から対象画像３０を入力する。

　演算部２２は、入力した対象画像３０に基づく情報を、記憶した第２の推論モデルに入力して演算を行って、第２の推論モデルからの出力を得る。第２の推論モデルに入力される情報は、第２の推論モデルに応じたものであり、例えば、上記のように対象画像３０自体である。また、第２の推論モデルに入力される情報は、対象画像３０自体以外の対象画像３０に基づく情報でもよい。その場合、演算部２２は、対象画像３０から、第２の推論モデルに入力する情報を生成する。第２の推論モデルから出力される情報は、第２の推論モデルに応じたものであり、例えば、上記のように対象画像３０の画素毎の確率の値（クラスマップ）である。また、第２の推論モデルから出力される情報は、上記以外の対象画像３０の位置毎の異物の度合いを示す情報でもよい。演算部２２は、第２の推論モデルから出力された情報を検出部２３に出力する。

　検出部２３は、演算部２２によって得られた第２の推論モデルからの出力から対象画像３０に含まれる異物の検出を行う。検出部２３は、例えば以下のように異物の検出を行う。検出部２３は、演算部２２から、第２の推論モデルからの出力である対象画像３０の位置毎の異物の度合いを示す情報、例えば、対象画像３０の画素毎の確率の値を入力する。検出部２３は、予め異物の検出の基準、例えば、検出のための閾値（例えば、０．５）を予め記憶しておく。検出部２３は、対象画像３０の画素毎に、第２の推論モデルからの出力である確率の値と閾値とを比較する。確率が閾値以上である画素について、検出部２３は、当該画素の部分が異物である（当該画素の部分に異物が写っている）と判断する。確率が閾値以上ではない画素について、検出部２３は、当該画素の部分が異物ではない（当該画素の部分に異物が写っておらず正常である）と判断する。また、検出部２３は、演算部２２によって得られた第２の推論モデルからの出力から対象画像３０に含まれる異物の検出を行うものであれば、上記以外の方法で異物を検出してもよい。

　検出部２３は、検出結果を示す情報を出力する。検出結果を示す情報の出力は上述した方法と同様に行われればよい。図３３の（ａ）に、第２の推論モデルからの出力（クラスマップ）の例を示す。また、図３３の（ｂ）に、この出力が用いられて検出された異物を重畳した対象画像を示す。図３３において、横に並んだ複数の丸い部分が異物の部分である。

　上記のように第２の推論モデルを生成して異物の検出に用いることで、容易かつ確実に異物を検出することができる。また、第２の推論モデルから出力される情報は、例えば、上述した異常度マップと比べて、対象画像３０に係る様々な条件、対象物（サンプル）に応じたばらつきが小さいものである。従って、異物を検出する際に用いる基準（例えば、上述した閾値）を、対象画像３０に係る様々な条件、対象物に応じたものにする必要がなく、容易に設定することができる。そのため、第２の推論モデルを用いることで、対象画像３０に係る様々な条件、対象物にかかわらず一律の基準を用いても、安定的かつ適切に異物の検出を行うことができる。

　本開示のモデル生成方法、モデル生成システム、モデル生成プログラム、異物検出方法、異物検出システム、異物検出プログラム及び推論モデルは、以下の構成を有する。
　［１］　対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成方法であって、
　訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する訓練用取得ステップと、
　前記訓練用取得ステップにおいて取得された訓練用の画像を用いた訓練を行って前記推論モデルを生成するモデル生成ステップと、を含み、
　前記訓練は、前記第１の正常画像に基づく情報を前記推論モデルへの入力とし、当該第１の正常画像に基づく情報を前記推論モデルからの出力とした訓練、前記第２の異物画像に基づく情報を前記推論モデルへの入力とし、前記第２の正常画像に基づく情報を前記推論モデルからの出力とした訓練、及び前記第３の異物画像に基づく情報を前記推論モデルへの入力とし、前記第３の正常画像に基づく情報を前記推論モデルからの出力とした訓練を含むモデル生成方法。
　［２］　前記検出対象として想定されない異物は、自然画像である［１］に記載されたモデル生成方法。
　［３］　前記第２の正常画像及び前記第３の正常画像は、前記第１の正常画像であり、
　前記訓練用取得ステップにおいて、前記第１の正常画像に対して、検出対象として想定される異物を付加して前記第２の異物画像を生成して取得し、前記第１の正常画像に対して、検出対象として想定されない異物を付加して前記第３の異物画像を生成して取得する［１］又は［２］に記載されたモデル生成方法。
　［４］　前記対象物は、特定の種別の物であり、
　前記訓練用取得ステップにおいて取得される第１の正常画像、第２の正常画像、第２の異物画像、第３の正常画像及び第３の異物画像は、前記特定の種別の物が前記訓練用の対象物として写っている画像である［１］～［３］の何れかに記載されたモデル生成方法。
　［５］　前記訓練用取得ステップにおいて取得される第１の正常画像の数、第２の正常画像と第２の異物画像との組み合わせの数、並びに第３の正常画像と第３の異物画像との組み合わせの数の比率は、予め設定された比率である［１］～［４］の何れかに記載されたモデル生成方法。
　［６］　前記検出対象として想定されない異物は、計算式に基づいて描画された画像である［１］～［５］の何れかに記載されたモデル生成方法。
　［７］　前記第３の異物画像は、透過的な付加及び置き換えによる付加の少なくとも何れかによって、前記検出対象として想定されない異物が前記第３の正常画像に付加された画像である［１］～［６］の何れかに記載されたモデル生成方法。
　［８］　前記推論モデルは、複数の層を有するニューラルネットワークを含み、層間での連結を行う構造を有し、連結を経由した後の画像と入力した画像とを足し合わせるモデルである［１］～［７］の何れかにに記載されたモデル生成方法。
　［９］　前記モデル生成ステップにおいて、生成した前記推論モデルの出力側に、当該推論モデルに入力した画像の位置毎の異物の度合いを示す情報を出力する部分を追加した新たな第２の推論モデルを、新たな訓練を行って生成する［１］～［８］の何れかに記載されたモデル生成方法。
　［１０］　対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成システムであって、
　訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する取得手段と、
　前記取得手段によって取得された訓練用の画像を用いた訓練を行って前記推論モデルを生成するモデル生成手段と、を備え、
　前記訓練は、前記第１の正常画像に基づく情報を前記推論モデルへの入力とし、当該第１の正常画像に基づく情報を前記推論モデルからの出力とした訓練、前記第２の異物画像に基づく情報を前記推論モデルへの入力とし、前記第２の正常画像に基づく情報を前記推論モデルからの出力とした訓練、及び前記第３の異物画像に基づく情報を前記推論モデルへの入力とし、前記第３の正常画像に基づく情報を前記推論モデルからの出力とした訓練を含むモデル生成システム。
　［１１］　コンピュータを、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成システムとして動作させるモデル生成プログラムであって、
　当該コンピュータを、
　訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する取得手段と、
　前記取得手段によって取得された訓練用の画像を用いた訓練を行って前記推論モデルを生成するモデル生成手段と、として機能させ、
　前記訓練は、前記第１の正常画像に基づく情報を前記推論モデルへの入力とし、当該第１の正常画像に基づく情報を前記推論モデルからの出力とした訓練、前記第２の異物画像に基づく情報を前記推論モデルへの入力とし、前記第２の正常画像に基づく情報を前記推論モデルからの出力とした訓練、及び前記第３の異物画像に基づく情報を前記推論モデルへの入力とし、前記第３の正常画像に基づく情報を前記推論モデルからの出力とした訓練を含むモデル生成プログラム。
　［１２］　［１］～［８］の何れかに記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法であって、
　異物の検出対象となる対象画像を取得する検出用取得ステップと、
　前記検出用取得ステップにおいて取得された前記対象画像に基づく情報を、前記推論モデルに入力して演算を行って、前記推論モデルからの出力を得る演算ステップと、
　前記演算ステップにおける前記推論モデルへの入力に係る情報と、前記推論モデルからの出力に係る情報との差分を算出して、算出した差分から前記対象画像に含まれる異物の検出を行う検出ステップと、
を含む異物検出方法。
　［１３］　［９］に記載のモデル生成方法によって生成された前記第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法であって、
　異物の検出対象となる対象画像を取得する検出用取得ステップと、
　前記検出用取得ステップにおいて取得された前記対象画像に基づく情報を、前記第２の推論モデルに入力して演算を行って、前記第２の推論モデルからの出力を得る演算ステップと、
　前記演算ステップにおいて得られた前記第２の推論モデルからの出力から前記対象画像に含まれる異物の検出を行う検出ステップと、
を含む異物検出方法。
　［１４］　［１］～［８］の何れかに記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムであって、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記推論モデルに入力して演算を行って、前記推論モデルからの出力を得る演算手段と、
　前記演算手段による前記推論モデルへの入力に係る情報と、前記推論モデルからの出力に係る情報との差分を算出して、算出した差分から前記対象画像に含まれる異物の検出を行う検出手段と、
を備える異物検出システム。
　［１５］　［９］に記載のモデル生成方法によって生成された前記第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムであって、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記第２の推論モデルに入力して演算を行って、前記第２の推論モデルからの出力を得る演算手段と、
　前記演算手段によって得られた前記第２の推論モデルからの出力から前記対象画像に含まれる異物の検出を行う検出手段と、
を備える異物検出システム。
　［１６］　コンピュータを、［１］～［８］の何れかに記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムとして動作させる異物検出プログラムであって、
　当該コンピュータを、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記推論モデルに入力して演算を行って、前記推論モデルからの出力を得る演算手段と、
　前記演算手段による前記推論モデルへの入力に係る情報と、前記推論モデルからの出力に係る情報との差分を算出して、算出した差分から前記対象画像に含まれる異物の検出を行う検出手段と、
として機能させる異物検出プログラム。
　［１７］　コンピュータを、［９］に記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムとして動作させる異物検出プログラムであって、
　当該コンピュータを、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記第２の推論モデルに入力して演算を行って、前記第２の推論モデルからの出力を得る演算手段と、
　前記演算手段によって得られた前記第２の推論モデルからの出力から前記対象画像に含まれる異物の検出を行う検出手段と、
として機能させる異物検出プログラム。
　［１８］　画像に基づく情報を入力して、入力に応じた演算を行って情報を出力するようコンピュータを機能させるための推論モデルであって、
　［１］～［８］の何れかに記載のモデル生成方法によって生成されたものである推論モデル。

　１０…モデル生成システム、１１…訓練用取得部、１２…モデル生成部、２０…異物検出システム、２１…検出用取得部、２２…演算部、２３…検出部、１００…モデル生成プログラム、１０１…訓練用取得モジュール、１０２…モデル生成モジュール、１１０…記録媒体、１１１…プログラム格納領域、２０１…検出用取得モジュール、２０２…演算モジュール、２０３…検出モジュール、２００…異物検出プログラム、２１０…記録媒体、２１１…プログラム格納領域。

Claims

　対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成方法であって、
　訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する訓練用取得ステップと、
　前記訓練用取得ステップにおいて取得された訓練用の画像を用いた訓練を行って前記推論モデルを生成するモデル生成ステップと、を含み、
　前記訓練は、前記第１の正常画像に基づく情報を前記推論モデルへの入力とし、当該第１の正常画像に基づく情報を前記推論モデルからの出力とした訓練、前記第２の異物画像に基づく情報を前記推論モデルへの入力とし、前記第２の正常画像に基づく情報を前記推論モデルからの出力とした訓練、及び前記第３の異物画像に基づく情報を前記推論モデルへの入力とし、前記第３の正常画像に基づく情報を前記推論モデルからの出力とした訓練を含むモデル生成方法。
　前記検出対象として想定されない異物は、自然画像である請求項１に記載されたモデル生成方法。
　前記第２の正常画像及び前記第３の正常画像は、前記第１の正常画像であり、
　前記訓練用取得ステップにおいて、前記第１の正常画像に対して、検出対象として想定される異物を付加して前記第２の異物画像を生成して取得し、前記第１の正常画像に対して、検出対象として想定されない異物を付加して前記第３の異物画像を生成して取得する請求項１又は２に記載されたモデル生成方法。
　前記対象物は、特定の種別の物であり、
　前記訓練用取得ステップにおいて取得される第１の正常画像、第２の正常画像、第２の異物画像、第３の正常画像及び第３の異物画像は、前記特定の種別の物が前記訓練用の対象物として写っている画像である請求項１又は２に記載されたモデル生成方法。
　前記訓練用取得ステップにおいて取得される第１の正常画像の数、第２の正常画像と第２の異物画像との組み合わせの数、並びに第３の正常画像と第３の異物画像との組み合わせの数の比率は、予め設定された比率である請求項１又は２に記載されたモデル生成方法。
　前記検出対象として想定されない異物は、計算式に基づいて描画された画像である請求項１又は２に記載されたモデル生成方法。
　前記第３の異物画像は、透過的な付加及び置き換えによる付加の少なくとも何れかによって、前記検出対象として想定されない異物が前記第３の正常画像に付加された画像である請求項１又は２に記載されたモデル生成方法。
　前記推論モデルは、複数の層を有するニューラルネットワークを含み、層間での連結を行う構造を有し、連結を経由した後の画像と入力した画像とを足し合わせるモデルである請求項１又は２に記載されたモデル生成方法。
　前記モデル生成ステップにおいて、生成した前記推論モデルの出力側に、当該推論モデルに入力した画像の位置毎の異物の度合いを示す情報を出力する部分を追加した新たな第２の推論モデルを、新たな訓練を行って生成する請求項１又は２に記載されたモデル生成方法。
　対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成システムであって、
　訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する取得手段と、
　前記取得手段によって取得された訓練用の画像を用いた訓練を行って前記推論モデルを生成するモデル生成手段と、を備え、
　前記訓練は、前記第１の正常画像に基づく情報を前記推論モデルへの入力とし、当該第１の正常画像に基づく情報を前記推論モデルからの出力とした訓練、前記第２の異物画像に基づく情報を前記推論モデルへの入力とし、前記第２の正常画像に基づく情報を前記推論モデルからの出力とした訓練、及び前記第３の異物画像に基づく情報を前記推論モデルへの入力とし、前記第３の正常画像に基づく情報を前記推論モデルからの出力とした訓練を含むモデル生成システム。
　コンピュータを、対象物が写った画像に含まれる異物の検出に用いられる推論モデルを生成するモデル生成システムとして動作させるモデル生成プログラムであって、
　当該コンピュータを、
　訓練用の対象物が写っている第１の正常画像、訓練用の対象物が写っている第２の正常画像、検出対象として想定される異物が第２の正常画像に付加された第２の異物画像、訓練用の対象物が写っている第３の正常画像、及び検出対象として想定されない異物が第３の正常画像に付加された第３の異物画像を訓練用の画像として取得する取得手段と、
　前記取得手段によって取得された訓練用の画像を用いた訓練を行って前記推論モデルを生成するモデル生成手段と、として機能させ、
　前記訓練は、前記第１の正常画像に基づく情報を前記推論モデルへの入力とし、当該第１の正常画像に基づく情報を前記推論モデルからの出力とした訓練、前記第２の異物画像に基づく情報を前記推論モデルへの入力とし、前記第２の正常画像に基づく情報を前記推論モデルからの出力とした訓練、及び前記第３の異物画像に基づく情報を前記推論モデルへの入力とし、前記第３の正常画像に基づく情報を前記推論モデルからの出力とした訓練を含むモデル生成プログラム。
　請求項１又は２に記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法であって、
　異物の検出対象となる対象画像を取得する検出用取得ステップと、
　前記検出用取得ステップにおいて取得された前記対象画像に基づく情報を、前記推論モデルに入力して演算を行って、前記推論モデルからの出力を得る演算ステップと、
　前記演算ステップにおける前記推論モデルへの入力に係る情報と、前記推論モデルからの出力に係る情報との差分を算出して、算出した差分から前記対象画像に含まれる異物の検出を行う検出ステップと、
を含む異物検出方法。
　請求項９に記載のモデル生成方法によって生成された前記第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出方法であって、
　異物の検出対象となる対象画像を取得する検出用取得ステップと、
　前記検出用取得ステップにおいて取得された前記対象画像に基づく情報を、前記第２の推論モデルに入力して演算を行って、前記第２の推論モデルからの出力を得る演算ステップと、
　前記演算ステップにおいて得られた前記第２の推論モデルからの出力から前記対象画像に含まれる異物の検出を行う検出ステップと、
を含む異物検出方法。
　請求項１又は２に記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムであって、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記推論モデルに入力して演算を行って、前記推論モデルからの出力を得る演算手段と、
　前記演算手段による前記推論モデルへの入力に係る情報と、前記推論モデルからの出力に係る情報との差分を算出して、算出した差分から前記対象画像に含まれる異物の検出を行う検出手段と、
を備える異物検出システム。
　請求項９に記載のモデル生成方法によって生成された前記第２の推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムであって、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記第２の推論モデルに入力して演算を行って、前記第２の推論モデルからの出力を得る演算手段と、
　前記演算手段によって得られた前記第２の推論モデルからの出力から前記対象画像に含まれる異物の検出を行う検出手段と、
を備える異物検出システム。
　コンピュータを、請求項１又は２に記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムとして動作させる異物検出プログラムであって、
　当該コンピュータを、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記推論モデルに入力して演算を行って、前記推論モデルからの出力を得る演算手段と、
　前記演算手段による前記推論モデルへの入力に係る情報と、前記推論モデルからの出力に係る情報との差分を算出して、算出した差分から前記対象画像に含まれる異物の検出を行う検出手段と、
として機能させる異物検出プログラム。
　コンピュータを、請求項９に記載のモデル生成方法によって生成された前記推論モデルを用いて、対象物が写った画像に含まれる異物の検出を行う異物検出システムとして動作させる異物検出プログラムであって、
　当該コンピュータを、
　異物の検出対象となる対象画像を取得する検出用取得手段と、
　前記検出用取得手段によって取得された前記対象画像に基づく情報を、前記第２の推論モデルに入力して演算を行って、前記第２の推論モデルからの出力を得る演算手段と、
　前記演算手段によって得られた前記第２の推論モデルからの出力から前記対象画像に含まれる異物の検出を行う検出手段と、
として機能させる異物検出プログラム。
　画像に基づく情報を入力して、入力に応じた演算を行って情報を出力するようコンピュータを機能させるための推論モデルであって、
　請求項１又は２に記載のモデル生成方法によって生成されたものである推論モデル。