[go: up one dir, main page]

JP2019139554A - モデル学習装置、モデル学習方法、プログラム - Google Patents

モデル学習装置、モデル学習方法、プログラム Download PDF

Info

Publication number
JP2019139554A
JP2019139554A JP2018022978A JP2018022978A JP2019139554A JP 2019139554 A JP2019139554 A JP 2019139554A JP 2018022978 A JP2018022978 A JP 2018022978A JP 2018022978 A JP2018022978 A JP 2018022978A JP 2019139554 A JP2019139554 A JP 2019139554A
Authority
JP
Japan
Prior art keywords
data
model learning
abnormal
model
learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2018022978A
Other languages
English (en)
Other versions
JP6874708B2 (ja
Inventor
祐太 河内
Yuta Kawachi
祐太 河内
悠馬 小泉
Yuma Koizumi
悠馬 小泉
登 原田
Noboru Harada
登 原田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2018022978A priority Critical patent/JP6874708B2/ja
Priority to US16/969,145 priority patent/US20200401943A1/en
Priority to PCT/JP2019/004930 priority patent/WO2019159915A1/ja
Publication of JP2019139554A publication Critical patent/JP2019139554A/ja
Application granted granted Critical
Publication of JP6874708B2 publication Critical patent/JP6874708B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/2431Multiple classes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Pure & Applied Mathematics (AREA)
  • Medical Informatics (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Testing And Monitoring For Control Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】AUC最適化基準を用いたモデル学習により、3値に分類するモデルを学習するモデル学習技術を提供する。
【解決手段】正常時に観測される音から生成される正常データと異常時に観測される音から生成される異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習するモデル学習部とを含み、前記AUC値は、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から定義されるものである。
【選択図】図2

Description

本発明は、機械の動作音から故障を検知する等、観測データから異常を検知するために用いるモデルを学習するモデル学習技術に関する。
例えば、機械の故障を故障前に発見することや、故障後に素早く発見することは、業務の継続性の観点で重要である。これを省力化するための方法として、センサを用いて取得したデータ(以下、センサデータという)から、電気回路やプログラムにより、正常状態からの乖離である「異常」を発見する異常検知という技術分野が存在する。特に、マイクロフォン等のように、音を電気信号に変換するセンサを用いるものを異常音検知と呼ぶ。また、音以外の、例えば、温度、圧力、変位等の任意のセンサデータやネットワーク通信量のようなトラフィックデータを対象とする任意の異常検知ドメインについても、同様に異常検知を行うことができる。
異常検知に用いるモデルの学習には、大きく分けて、正常データのみを用いる教師なし学習と、非特許文献1や非特許文献2にあるAUC最適化のような、正常、異常双方のデータを用いる教師あり学習がある。いずれにしても、入力データを正常または異常に分類する2値分類器の学習である。
Akinori Fujino and Naonori Ueda, "A Semi-Supervised AUC Optimization Method with Generative Models", 2016 IEEE 16th International Conference on Data Mining (ICDM), IEEE, pp.883-888, 2016. Alan Herschtal and Bhavani Raskutti, "Optimising area under the ROC curve using gradient descent", ICML '04, Proceedings of the twenty-first international conference on Machine learning, ACM, 2004.
しかし、正常、異常の他に、例えば区別不能といった第3の出力を用意して、第3の出力が出力された場合には、入力データを人が目視で判定するなどの手法が適していることがある。このようなケースでは、正常データと異常データの特徴が似ているため、正常ラベルまたは異常ラベルがデータに付されているが、実際には区別が不能なものが混じっている。このようなデータが混じっている場合、教師あり学習では強引に正常、異常のいずれかに分類するモデルを学習しようとするため、現実とのミスマッチが生じ、検知性能に悪影響を与える。また、教師なし学習では3値に分類するよう学習することは可能であるが、この場合異常ラベルを付したデータ(異常データ)を用いることができないため、学習データ量が減り異常検知性能に悪影響を与える。
そこで本発明では、AUC最適化基準を用いたモデル学習により、3値に分類するモデルを学習するモデル学習技術を提供することを目的とする。
本発明の一態様は、正常時に観測される音から生成される正常データと異常時に観測される音から生成される異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習するモデル学習部とを含み、前記AUC値は、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から定義されるものである。
本発明の一態様は、正常時に観測されるデータから生成される正常データと異常時に観測されるデータから生成される異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習するモデル学習部とを含み、前記AUC値は、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から定義されるものである。
本発明によれば、AUC最適化基準を用いたモデル学習により、3値に分類するモデルを学習することが可能となる。
2段ステップ関数とその近似関数の様子を示す図。 モデル学習装置100の構成の一例を示すブロック図。 モデル学習装置100の動作の一例を示すフローチャート。 異常検知装置200の構成の一例を示すブロック図。 異常検知装置200の動作の一例を示すフローチャート。
以下、本発明の実施の形態について、詳細に説明する。なお、同じ機能を有する構成部には同じ番号を付し、重複説明を省略する。
AUC最適化基準を用いたモデル学習では、正常、異常を正しく判別できたか否かを0と1の2値で表現することができるステップ関数を用いる。そこで、本発明の実施の形態では、0と1の中間の定数を、区別不能を表す第3の状態を表すものとして導入する。具体的には、ステップ関数の代わりに、定義域と値域のずれた2つのステップ関数の最大値として定義される2段ステップ関数を用いる。この2段ステップ関数の構成に用いる最大値関数を微分可能な関数の近似と2段ステップ関数の構成に用いるステップ関数の近似という2つの近似を用いることにより、勾配法・劣勾配法等による連続最適化可能な関数によりAUC値を定義することで、3値分類を実現する。
<技術的背景>
以下の説明に登場する小文字の変数は、特記なき場合、スカラーまたは(縦)ベクトルを表すものとする。
パラメータψを持つモデルを学習するにあたり、異常データの集合X+={xi +| i∈[1, …, N+]}と正常データの集合X-={xj -| j∈[1, …, N-]}を用意する。各集合の要素は特徴量ベクトル等の1サンプルに相当する。
要素数N=N+×N-である異常データ集合X+と正常データ集合X-の直積集合X={(xi +, xj -)| i∈[1, …, N+], j∈[1, …, N-]}を学習データ集合とする。このとき、(経験)AUC値は、次式により与えられる。
ただし、関数H(x)は、(ヘヴィサイド)ステップ関数である。つまり、関数H(x)は、引数xの値が0より大きいときは1を、小さいときは0を返す関数である。また、関数I(x; ψ)は、パラメータψを持つ、引数xに対応する異常度を返す関数である。なお、xに対する関数I(x; ψ)の値は、スカラー値であり、xの異常度ということもある。
式(1)は、任意の異常データと正常データのペアに対して、異常データの異常度が正常データの異常度より大きくなるモデルが好ましいことを表す。また、式(1)の値が最大になるのは、すべてのペアに対して異常データの異常度が正常データの異常度より大きい場合であり、そのとき、値は1となる。このAUC値を最大(つまり、最適)にするパラメータψを求める基準がAUC最適化基準である。
AUC最適化基準におけるステップ関数を、2段ステップ関数で置換することにより、3値分類を実現する。なお、同様にすれば、任意の数の分類も実現することができる。つまり、(n-1)段ステップ関数を用いれば、n値分類が可能となる。
以下、3値分類について説明する。例えば、幅2h(>0)、高さ0.5のステップを設ける2段ステップ関数T(x)は次式のようになる。
ただし、hはハイパーパラメータであり、あらかじめ値を決めておく。
一般に、h1, h2をそれぞれh1>0, h2>0を満たす実数、αを0<α<1を満たす実数として、次式のように2段ステップ関数T(x)を定義することができる。
つまり、2段ステップ関数T(x)は、x>h1において値1、h1>x>h2において値α、h2>xにおいて値0をとる関数であり、幅h1+h2、高さαのステップを設けた関数といえる。
式(1)の関数H(x)の代わりに、式(2)、式(3)の関数T(x)を用いてAUC値を次式のように定義する。
しかし、式(4)は、微分不可能であるため、勾配法等による最適化が困難になる。そこで、式(2)、式(3)で用いた最大値関数max(x, y)に対して、次式のような近似を行う。
もちろん、式(5)や式(5’)以外の近似を用いることもできる。つまり、最大値関数max(x, y)を近似する微分可能な関数であれば、どのような関数を用いてもよい。以下、最大値関数max(x, y)を近似する微分可能な関数をS(x)と表す。
以下、S(x)を式(5)の右辺の関数とし、このS(x)を用いた関数T(x)の近似(式(6))を例に説明する。
ここでは、さらにステップ関数H(x)の近似関数を導入する。ステップ関数の近似法には様々なものが知られている(例えば、参考非特許文献1、参考非特許文献2)が、以下では、ランプ関数とソフトプラス関数を用いた近似法について説明する。
(参考非特許文献1:Charanpal Dhanjal, Romaric Gaudel and Stephan Clemencon, “AUC Optimisation and Collaborative Filtering”, arXiv preprint, arXiv:1508.06091, 2015.)
(参考非特許文献2:Stijn Vanderlooy and Eyke Hullermeier, “A critical analysis of variants of the AUC”, Machine Learning, Vol.72, Issue 3, pp.247-262, 2008.)
最大値を制約するランプ関数(の変形)ramp’(x)は、次式で与えられる。
また、ソフトプラス関数(の変形)softplus’(x)は、次式で与えられる。
式(7)の関数は異常度逆転に対して線形にコストを掛ける関数であり、式(8)の関数は微分可能な近似関数である。
式(8)のソフトプラス関数を用いると、式(6)は、次式のようになる。
また、勾配の大きさを制御するハイパーパラメータCを導入すると、式(9)は次式のようになる。
式(9)、式(10)の右辺の関数は、いずれも最大値が1ではなく、ln(e+√e)であるので、AUC値を算出する際にはこの値で除すことにより最大値が1になるように調整してもよい。図1に2段ステップ関数とその近似関数の様子を示す。
<第一実施形態>
(モデル学習装置100)
以下、図2〜図3を参照してモデル学習装置100を説明する。図2は、モデル学習装置100の構成を示すブロック図である。図3は、モデル学習装置100の動作を示すフローチャートである。図2に示すようにモデル学習装置100は、前処理部110と、モデル学習部120と、記録部190を含む。記録部190は、モデル学習装置100の処理に必要な情報を適宜記録する構成部である。
以下、図3に従いモデル学習装置100の動作について説明する。
S110において、前処理部110は、観測データから学習データを生成する。異常音検知を対象とする場合、観測データは、機械の正常動作音や異常動作音の音波形のような正常時に観測される音や異常時に観測される音である。このように、どのような分野を異常検知の対象としても、観測データは正常時に観測されるデータと異常時に観測されるデータの両方を含む。
また、観測データから生成される学習データは、一般にベクトルとして表現される。異常音検知を対象とする場合、観測データ、つまり正常時に観測される音や異常時に観測される音を適当なサンプリング周波数でAD(アナログデジタル)変換し、量子化した波形データを生成する。このように量子化した波形データをそのまま1次元の値が時系列に並んだデータを学習データとしてもよいし、複数サンプルの連結、離散フーリエ変換、フィルタバンク処理等を用いて多次元に拡張する特徴抽出処理をしたものを学習データとしてもよいし、データの平均、分散を計算して値の取り幅を正規化する等の処理をしたものを学習データとしてもよい。異常音検知以外の分野を対象とする場合、例えば温湿度や電流値のように連続量に対しては、同様の処理を行えばよいし、例えば頻度やテキスト(文字、単語列等)のような離散量に対しては、数値や1-of-K表現を用いて特徴ベクトルを構成し同様の処理を行えばよい。
なお、正常時の観測データから生成される学習データを正常データ、異常時の観測データから生成される学習データを異常データという。異常データ集合をX+={xi +| i∈[1, …, N+]}、正常データ集合をX-={xj -| j∈[1, …, N-]}とする。また、<技術的背景>で説明したように、異常データ集合X+と正常データ集合X-の直積集合X={(xi +, xj -)| i∈[1, …, N+], j∈[1, …, N-]}を学習データ集合という。学習データ集合は正常データと異常データを用いて定義される集合である。
S120において、モデル学習部120は、S110で生成した正常データと異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習する。
ここで、AUC値とは、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から計算されるものであり、例えば、式(4)により計算される。
また、式(9)、式(10)のような関数T(x)の近似を用いてAUC値を計算してもよい。式(9)、式(10)の右辺に現れるハイパーパラメータh及びCは、所定の定数である。なお、h及びCの値は、本ステップと同様の学習をいくつかの候補値に対して行い、AUC最適化基準などに基づき選択した値としてもよいし、経験的に優れていることが分かっている値としてもよい。
モデル学習部120がAUC値を用いてパラメータψ^を学習する際、AUC最適化基準を用いて学習する。これにより、パラメータψを持つモデルについて、ψの最適値であるパラメータψ^を求めることができる。その際、ハイパーパラメータh及びCの値を学習の途中段階で変更するようにしてもよい。例えば、勾配の大きさを制御するハイパーパラメータCを徐々に大きくすることにより、学習を進みやすくすることができる。
(異常検知装置200)
以下、図4〜図5を参照して異常検知装置200を説明する。図4は、異常検知装置200の構成を示すブロック図である。図5は、異常検知装置200の動作を示すフローチャートである。図4に示すように異常検知装置200は、前処理部110と、異常度算出部220と、異常判定部230と、記録部190を含む。記録部190は、異常検知装置200の処理に必要な情報を適宜記録する構成部である。例えば、モデル学習装置100が生成したパラメータψ^を記録しておく。
以下、図5に従い異常検知装置200の動作について説明する。
S110において、前処理部110は、異常検知対象となる観測データから異常検知対象データを生成する。具体的には、モデル学習装置100の前処理部110が学習データを生成するのと同一の方法により、異常検知対象データxを生成する。
S220において、異常度算出部220は、記録部190に記録してあるパラメータψ^を用いて、S110で生成した異常検知対象データxから異常度を算出する。例えば、異常度I(x)は、I(x)=I(x;ψ^)と定義することができる。
S230において、異常判定部230は、S220で算出した異常度から、入力である、異常検知対象となる観測データが正常であるか、異常であるか、区別不能であるかを示す判定結果を生成する。例えば、あらかじめ決められた閾値a, b(a>b)を用いて、異常度が閾値a以上である(または閾値aより大きい)場合に異常を示す判定結果を生成し、異常度が閾値b以下である(または閾値bより小さい)場合に正常を示す判定結果を生成し、それ以外については、区別不能を示す判定結果を生成する。
なお、3値分類のための閾値の決定には、正常、区別不能、異常の3種類の少量データを別に用意しておき、その判別性能(多値分類に対するF1値等)を大きくするように2つの閾値を決めてもよい。また、異常検知に係る業務の要請に応じて手動で閾値を調整、決定するのでもよい。
区別不能を示す判定結果が生成された場合には、熟練者に通知することで人間にエスカレーションを行い、目視等による判断を行ってから判定結果を決定するようにしてもよい。
(変形例)
AUC最適化基準によるモデル学習は、正常データに対する異常度と異常データに対する異常度の差を最適化するようにモデル学習するものである。したがって、AUC最適化に類似するpAUC最適化(参考非特許文献3)やその他異常度の差を用いて定義される(AUC値に相当する)値を最適化する方法に対しても、<技術的背景>で説明した同様の置き換えを行うことで、モデル学習をすることができる。
(参考非特許文献3:Harikrishna Narasimhan and Shivani Agarwal, “A structural SVM based approach for optimizing partial AUC”, Proceeding of the 30th International Conference on Machine Learning, pp.516-524, 2013.)
本実施形態の発明によれば、AUC最適化基準を用いたモデル学習により、3値に分類するモデルを学習することが可能となる。正常、異常の2値分類モデルの学習基準であるAUC最適化基準を、区別不能を含む3値の分類に拡張することで、正常、異常の区別がつきにくいケースでその区別を人に委ねることが可能になる。その際、大規模な学習データとしては2種類のラベルが付されたデータ(つまり、異常データと正常データ)のみを準備すればよく、区別不能に対応する新しいラベルを付けるコストはほとんどかからない。
<補記>
本発明の装置は、例えば単一のハードウェアエンティティとして、キーボードなどが接続可能な入力部、液晶ディスプレイなどが接続可能な出力部、ハードウェアエンティティの外部に通信可能な通信装置(例えば通信ケーブル)が接続可能な通信部、CPU(Central Processing Unit、キャッシュメモリやレジスタなどを備えていてもよい)、メモリであるRAMやROM、ハードディスクである外部記憶装置並びにこれらの入力部、出力部、通信部、CPU、RAM、ROM、外部記憶装置の間のデータのやり取りが可能なように接続するバスを有している。また必要に応じて、ハードウェアエンティティに、CD−ROMなどの記録媒体を読み書きできる装置(ドライブ)などを設けることとしてもよい。このようなハードウェア資源を備えた物理的実体としては、汎用コンピュータなどがある。
ハードウェアエンティティの外部記憶装置には、上述の機能を実現するために必要となるプログラムおよびこのプログラムの処理において必要となるデータなどが記憶されている(外部記憶装置に限らず、例えばプログラムを読み出し専用記憶装置であるROMに記憶させておくこととしてもよい)。また、これらのプログラムの処理によって得られるデータなどは、RAMや外部記憶装置などに適宜に記憶される。
ハードウェアエンティティでは、外部記憶装置(あるいはROMなど)に記憶された各プログラムとこの各プログラムの処理に必要なデータが必要に応じてメモリに読み込まれて、適宜にCPUで解釈実行・処理される。その結果、CPUが所定の機能(上記、…部、…手段などと表した各構成要件)を実現する。
本発明は上述の実施形態に限定されるものではなく、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。また、上記実施形態において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
既述のように、上記実施形態において説明したハードウェアエンティティ(本発明の装置)における処理機能をコンピュータによって実現する場合、ハードウェアエンティティが有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記ハードウェアエンティティにおける処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto-Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録媒体に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、本形態におけるプログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、この形態では、コンピュータ上で所定のプログラムを実行させることにより、ハードウェアエンティティを構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (8)

  1. 正常時に観測される音から生成される正常データと異常時に観測される音から生成される異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習するモデル学習部と
    を含むモデル学習装置であって、
    前記AUC値は、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から定義されるものである
    モデル学習装置。
  2. 請求項1に記載のモデル学習装置であって、
    X+={xi +| i∈[1, …, N+]}を異常データの集合、X-={xj -| j∈[1, …, N-]}を正常データの集合、X={(xi +, xj -)| i∈[1, …, N+], j∈[1, …, N-]}を学習データ集合、N=N+×N-、I(x; ψ)を、パラメータψを持つ、データxの異常度を返す関数とし、
    h1, h2をそれぞれh1>0, h2>0を満たす実数、αを0<α<1を満たす実数とし、
    前記2段ステップ関数T(x)、前記AUC値は、それぞれ次式により定義される
    ことを特徴とするモデル学習装置。
  3. 請求項2に記載のモデル学習装置であって、
    S(x, y)を最大値関数max(x, y)を近似する微分可能な関数とし、
    前記2段ステップ関数T(x)は、次式により近似される
    ことを特徴とするモデル学習装置。
  4. 請求項3に記載のモデル学習装置であって、
    前記関数S(x, y)は、次式により定義される
    ことを特徴とするモデル学習装置。
  5. 請求項3に記載のモデル学習装置であって、
    前記関数S(x, y)は、次式により定義される
    ことを特徴とするモデル学習装置。
  6. 正常時に観測されるデータから生成される正常データと異常時に観測されるデータから生成される異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習するモデル学習部と
    を含むモデル学習装置であって、
    前記AUC値は、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から定義されるものである
    モデル学習装置。
  7. モデル学習装置が、正常時に観測される音から生成される正常データと異常時に観測される音から生成される異常データを用いて定義される学習データ集合を用いて、所定のAUC値を用いた基準に基づいて、モデルのパラメータψ^を学習するモデル学習ステップと
    を含むモデル学習方法であって、
    前記AUC値は、2段ステップ関数T(x)を用いて正常データの異常度と異常データの異常度の差から定義されるものである
    モデル学習方法。
  8. 請求項1ないし6のいずれか1項に記載のモデル学習装置としてコンピュータを機能させるためのプログラム。
JP2018022978A 2018-02-13 2018-02-13 モデル学習装置、モデル学習方法、プログラム Active JP6874708B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2018022978A JP6874708B2 (ja) 2018-02-13 2018-02-13 モデル学習装置、モデル学習方法、プログラム
US16/969,145 US20200401943A1 (en) 2018-02-13 2019-02-13 Model learning apparatus, model learning method, and program
PCT/JP2019/004930 WO2019159915A1 (ja) 2018-02-13 2019-02-13 モデル学習装置、モデル学習方法、プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018022978A JP6874708B2 (ja) 2018-02-13 2018-02-13 モデル学習装置、モデル学習方法、プログラム

Publications (2)

Publication Number Publication Date
JP2019139554A true JP2019139554A (ja) 2019-08-22
JP6874708B2 JP6874708B2 (ja) 2021-05-19

Family

ID=67618577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018022978A Active JP6874708B2 (ja) 2018-02-13 2018-02-13 モデル学習装置、モデル学習方法、プログラム

Country Status (3)

Country Link
US (1) US20200401943A1 (ja)
JP (1) JP6874708B2 (ja)
WO (1) WO2019159915A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021246393A1 (ja) * 2020-06-01 2021-12-09 株式会社クボタ 学習モデル生成装置、推測装置および散気量制御装置
DE112020006911T5 (de) 2020-05-20 2023-01-12 Mitsubishi Electric Corporation Datenerzeugungsvorrichtung, System für maschinelles Lernen und Bearbeitungszustands-Schätzvorrichtung
CN116670076A (zh) * 2020-12-24 2023-08-29 株式会社久保田 膜间差压推测装置以及散气量控制装置

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7136329B2 (ja) * 2019-03-27 2022-09-13 日本電気株式会社 異常検知装置、制御方法、及びプログラム
JPWO2024241383A1 (ja) * 2023-05-19 2024-11-28
TWI863341B (zh) * 2023-06-09 2024-11-21 友達光電股份有限公司 分析方法及分析系統

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017126158A (ja) * 2016-01-13 2017-07-20 日本電信電話株式会社 2値分類学習装置、2値分類装置、方法、及びプログラム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20130109995A1 (en) * 2011-10-28 2013-05-02 Neil S. Rothman Method of building classifiers for real-time classification of neurological states
WO2014036263A1 (en) * 2012-08-29 2014-03-06 Brown University An accurate analysis tool and method for the quantitative acoustic assessment of infant cry
US10346593B2 (en) * 2016-12-13 2019-07-09 Varian Medical Systems International Ag Methods and systems for radiotherapy treatment planning
JP6545728B2 (ja) * 2017-01-11 2019-07-17 株式会社東芝 異常検知装置、異常検知方法、および異常検知プログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017126158A (ja) * 2016-01-13 2017-07-20 日本電信電話株式会社 2値分類学習装置、2値分類装置、方法、及びプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
小泉悠馬ほか: "機器動作音の異常音検知のための音響特徴量自動設計", 日本音響学会 2016年 秋季研究発表会講演論文集 [CD-ROM], JPN6019010495, 2016, pages 365 - 368, ISSN: 0004415997 *
河内祐太ほか: "Lpノルム回帰を用いた異常音検知の検討", 日本音響学会 2017年 秋季研究発表会講演論文集 [CD-ROM], JPN6019010493, 2017, JP, pages 533 - 534, ISSN: 0004415996 *
藤野昭典、上田修功: "不均衡な2値分類のための半教師あり学習法", 電子情報通信学会技術研究報告, vol. 第116巻, 第121号, JPN6019010491, 2016, JP, pages 195 - 200, ISSN: 0004415995 *

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE112020006911T5 (de) 2020-05-20 2023-01-12 Mitsubishi Electric Corporation Datenerzeugungsvorrichtung, System für maschinelles Lernen und Bearbeitungszustands-Schätzvorrichtung
US11762374B2 (en) 2020-05-20 2023-09-19 Mitsubishi Electric Corporation Data generation device, machine learning system, and machining state estimation system
WO2021246393A1 (ja) * 2020-06-01 2021-12-09 株式会社クボタ 学習モデル生成装置、推測装置および散気量制御装置
JP2021186761A (ja) * 2020-06-01 2021-12-13 株式会社クボタ 学習モデル生成装置、推測装置および散気量制御装置
JP7583535B2 (ja) 2020-06-01 2024-11-14 株式会社クボタ 学習モデル生成装置
JP2024167301A (ja) * 2020-06-01 2024-12-03 株式会社クボタ 学習モデル生成装置およびシステム
JP7739556B2 (ja) 2020-06-01 2025-09-16 株式会社クボタ 学習モデル生成装置およびシステム
CN116670076A (zh) * 2020-12-24 2023-08-29 株式会社久保田 膜间差压推测装置以及散气量控制装置

Also Published As

Publication number Publication date
US20200401943A1 (en) 2020-12-24
WO2019159915A1 (ja) 2019-08-22
JP6874708B2 (ja) 2021-05-19

Similar Documents

Publication Publication Date Title
JP6874708B2 (ja) モデル学習装置、モデル学習方法、プログラム
Cremona et al. Structural health monitoring as a big-data problem
JP6821614B2 (ja) モデル学習装置、モデル学習方法、プログラム
JP6881207B2 (ja) 学習装置、プログラム
US20180082215A1 (en) Information processing apparatus and information processing method
JP6299759B2 (ja) 予測関数作成装置、予測関数作成方法、及びプログラム
JP7588653B2 (ja) 不確定区間を有する性能予測の生成
US10733385B2 (en) Behavior inference model building apparatus and behavior inference model building method thereof
CN111932269A (zh) 设备信息处理方法及装置
US20160055496A1 (en) Churn prediction based on existing event data
JP6943067B2 (ja) 異常音検知装置、異常検知装置、プログラム
JP2020144493A (ja) 学習モデル生成支援装置、及び学習モデル生成支援方法
CN110907207A (zh) 非标机械设备的运行状态检测方法及装置
JP2019105871A (ja) 異常候補抽出プログラム、異常候補抽出方法および異常候補抽出装置
EP3499429A1 (en) Behavior inference model building apparatus and method
WO2022009013A1 (en) Automated data linkages across datasets
Musunuri Machine learning model for predicting customer churn in subscription-based business
US20240378445A1 (en) Learning device, learning method, and program
JP2019185207A (ja) モデル学習装置、モデル学習方法、プログラム
JP7283548B2 (ja) 学習装置、予測システム、方法およびプログラム
JP2023061477A (ja) プログラム、データ処理方法及びデータ処理装置
TWI647586B (zh) 行為推論模型生成裝置及其行為推論模型生成方法
CN113723436A (zh) 数据的处理方法、装置、计算机设备和存储介质
JP5379749B2 (ja) 文書分類装置、文書分類方法、そのプログラムおよび記録媒体
WO2020255299A1 (ja) 異常度推定装置、異常度推定方法、プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20210105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210304

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20210323

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20210405

R150 Certificate of patent or registration of utility model

Ref document number: 6874708

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350