[go: up one dir, main page]

JP2018190130A - 分析装置、分析方法及び分析プログラム - Google Patents

分析装置、分析方法及び分析プログラム Download PDF

Info

Publication number
JP2018190130A
JP2018190130A JP2017091187A JP2017091187A JP2018190130A JP 2018190130 A JP2018190130 A JP 2018190130A JP 2017091187 A JP2017091187 A JP 2017091187A JP 2017091187 A JP2017091187 A JP 2017091187A JP 2018190130 A JP2018190130 A JP 2018190130A
Authority
JP
Japan
Prior art keywords
data
unit
search
setting contents
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017091187A
Other languages
English (en)
Other versions
JP6659618B2 (ja
Inventor
哲哉 塩田
Tetsuya Shioda
哲哉 塩田
一樹 及川
Kazuki Oikawa
一樹 及川
雅人 澤田
Masahito Sawada
雅人 澤田
拓郎 宇田川
Takuro Udagawa
拓郎 宇田川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017091187A priority Critical patent/JP6659618B2/ja
Publication of JP2018190130A publication Critical patent/JP2018190130A/ja
Application granted granted Critical
Publication of JP6659618B2 publication Critical patent/JP6659618B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

【課題】パイプラインの探索に要する時間を短縮しつつ、予測精度の高い予測モデルを構築することができる。【解決手段】抽出部151は、入力されたデータからサンプルデータを抽出する。推定部154は、サンプルデータを用いて一部の処理を行った際の所要時間を基に、処理全体の所要時間を推定し、推定した時間が制限時間未満である場合、サンプル率を増加させる。サンプル率が増加した場合、抽出部151は、さらにサンプルデータを抽出する。また、探索部152は、予測モデルを構築する際に実行される複数の処理の設定内容の組合せの候補から、適用された場合に構築されるサンプルデータに基づく予測モデルの予測精度が高くなる組合せを探索する。また、選択部153は、探索された組合せから、適用された場合に構築される入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する。【選択図】図1

Description

本発明は、分析装置、分析方法及び分析プログラムに関する。
近年、機械学習を用いたデータ分析の適用事例が増加している。一方、データ分析に不可欠な統計や機械学習の知識の習得には、中長期的な教育が必要となる。そこで、非専門家が統計や機械学習の知識の習得を行うことなく、容易にデータ分析に従事できるよう、データ分析を支援する技術が開示されている。
例えば、逐次的最適化手法(SMBO:Sequential model-based optimization)を用いてパイプラインごとに精度の評価を行い、最適なパイプラインを探索する手法が知られている(例えば、非特許文献1及び2を参照)。なお、ここでは、パイプラインとは、予測モデルを構築する一連の処理であり、入力されたデータに対する前処理、ハイパーパラメータに基づくデータの学習等が含まれる。また、あらかじめ専門家が設計した多数のパイプラインの中から、分析対象のデータに適合した少数のパイプラインをユーザに提示する技術が知られている。
また、一般的に、パイプラインを構成するデータの前処理や予測アルゴリズムに関する設定内容の候補が増加すると、より予測精度の高い予測モデルを構築可能なパイプラインが見つかる可能性が高くなる一方で、探索に要する時間が増加する。
Matthias Feurer,Aaron Klein,Katharina Eggensperger,Jost Tobias Springenberg,Manuel Blum,Frank Hutter,"Efficient and Robust Automated Machine Learning",NIPS'15 Proceedings of the 28th International Conference on Neural Information Processing Systems,2015年12月,PP.2755-2763 Lisha Li,Kevin Jamieson,Giulia DeSalvo,Afshin Rostamizadeh,Ameet Talwalkar,"Hyperband:A Novel Bandit-Based Approach to Hyperparameter Optimization",arXiv:1603.06560v3,cs.LG,2016年11月
しかしながら、従来のデータ分析を自動化する技術には、パイプラインの探索に要する時間を短縮しつつ、予測精度の高い予測モデルを構築することができない場合があるという問題があった。例えば、単に探索の候補となる設定内容を削減することでパイプラインの探索に要する時間を削減することが考えられるが、この場合、十分な探索が行われず予測モデルの精度が低下する場合がある。
本発明の分析装置は、データが入力された場合、当該入力されたデータから所定の割合のデータをサンプルデータとして抽出し、前記所定の割合が増加した場合、前記入力されたデータから当該増加した所定の割合のデータを前記サンプルデータとしてさらに抽出する抽出部と、前記抽出部によって前記サンプルデータが抽出されるたびに、前記サンプルデータを用いて所定の処理のうちの一部を行った際に要した時間に基づいて、前記入力されたデータを用いて前記所定の処理を行った際に要する時間を推定し、当該推定した時間があらかじめ設定された制限時間未満である場合、前記所定の割合を増加させる推定部と、所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、前記複数の処理に適用された場合に構築される前記サンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する探索部と、前記探索部によって探索された設定内容の組合せから、前記複数の処理に適用された場合に構築される前記入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する選択部と、を有することを特徴とする。
本発明によれば、パイプラインの探索に要する時間を短縮しつつ、予測精度の高い予測モデルを構築することができる。
図1は、第1の実施形態に係る分析装置の構成の一例を示す図である。 図2は、第1の実施形態に係る設定情報のデータ構成の一例を示す図である。 図3は、第1の実施形態に係る予測器情報のデータ構成の一例を示す図である。 図4は、第1の実施形態に係る分析装置の処理概要を説明するための図である。 図5は、第1の実施形態に係るパイプラインの探索について説明するための図である。 図6は、第1の実施形態に係る交差検証について説明するための図である。 図7は、第1の実施形態に係るパイプラインの探索について説明するための図である。 図8は、第1の実施形態に係る有望領域について説明するための図である。 図9は、第1の実施形態に係るパイプラインの選択について説明するための図である。 図10は、第1の実施形態に係る有望領域について説明するための図である。 図11は、第1の実施形態に係る予測モデルの合成について説明するための図である。 図12は、第1の実施形態に係る予測モデルの合成について説明するための図である。 図13は、第1の実施形態に係る分析装置の処理の流れを示すフローチャートである。 図14は、第1の実施形態に係る分析装置の処理の流れを示すフローチャートである。 図15は、第1の実施形態の効果を説明するための図である。 図16は、第1の実施形態の効果を説明するための図である。 図17は、第2の実施形態に係る分析装置の処理の流れを示すフローチャートである。 図18は、分析プログラムを実行するコンピュータの一例を示す図である。
以下、図面を参照して、本発明の実施形態を詳細に説明する。なお、この実施形態により本発明が限定されるものではない。また、図面の記載において、同一部分には同一の符号を付して示している。
[第1の実施形態]
[分析装置の構成]
図1を用いて、分析装置10の構成について説明する。図1は、第1の実施形態に係る分析装置の構成の一例を示す図である。図1に示すように、分析装置10は、ワークステーションやパソコン等の汎用コンピュータで実現され、入力部11と、出力部12と、通信制御部13と、記憶部14と、制御部15とを備える。
入力部11は、キーボードやマウス等の入力デバイスを用いて実現され、操作者による入力操作に対応して、制御部15に対して各種指示情報を入力する。出力部12は、液晶ディスプレイ等の表示装置、プリンター等の印刷装置、情報通信装置等によって実現され、データ分析の結果等を操作者に対して出力する。
通信制御部13は、NIC(Network Interface Card)等で実現され、LAN(Local Area Network)やインターネット等の電気通信回線を介した管理サーバ等の外部の装置と制御部15との通信を制御する。
記憶部14は、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、又は、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部14には、分析装置10を動作させる処理プログラムや、処理プログラムの実行中に使用されるデータ等があらかじめ記憶され、あるいは処理の都度一時的に記憶される。記憶部14は、通信制御部13を介して制御部15と通信する構成でもよい。また、記憶部14は、設定情報141及び予測器情報142を記憶する。
ここで、図2を用いて、設定情報141について説明する。図2は、第1の実施形態に係る設定情報のデータ構成の一例を示す図である。図2に示すように、設定情報141は、ステップごとの実行順序及び設定内容候補を含む。設定内容候補は、各ステップに対応する設定項目の設定内容の候補である。
図2の例では、設定情報141は、ステップとして「欠損値補完手法探索」、「正規化手法探索」及び「特徴選択手法探索」があることを示している。なお、これらのステップは、データの前処理に対応するものである。
図2の例では、設定情報141は、ステップ「特徴選択手法探索」が3番目に実行されるステップであることを示している。また、設定情報141は、ステップ「特徴選択手法探索」に対応する設定項目の設定内容の候補として、「決定木」、「L1正則化」、「分散分析」及び「無処理」があることを示している。なお、図2の例では、ステップ「特徴選択手法探索」に対応する設定項目は、特徴選択で用いられる手法である。
次に、図3を用いて、予測器情報142について説明する。図3は、第1の実施形態に係る予測器情報のデータ構成の一例を示す図である。図3に示すように、予測器情報142は、予測器ごとのデフォルトパラメータを含む。また、デフォルトパラメータは、各予測器のハイパーパラメータのデフォルト値である。例えば、予測器情報142は、予測器AのハイパーパラメータNのデフォルト値が100であることを示している。
制御部15は、CPU(Central Processing Unit)等の演算処理装置がメモリに記憶された処理プログラムを実行することにより、図1に例示するように、抽出部151、探索部152、推定部154、合成部155及び検証部156として機能する。また、探索部152は、ステップ選択部152a、精度計算部152b及び設定内容決定部152cを含む。なお、これらの機能部は、それぞれ、あるいは一部が異なるハードウェアに実装されてもよい。
抽出部151は、データが入力された場合、当該入力されたデータから所定の割合のデータをサンプルデータとして抽出し、所定の割合が増加した場合、入力されたデータから当該増加した所定の割合のデータをサンプルデータとしてさらに抽出する。図4に示すように、抽出部151は、入力された全データである学習用データからサンプルデータを抽出する。図4は、第1の実施形態に係る分析装置の処理概要を説明するための図である。ここで、抽出部151がサンプルデータを抽出する所定の割合、すなわちサンプリングにおけるサンプル率は、あらかじめ設定されているものとする。
探索部152は、所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、複数の処理に適用された場合に構築されるサンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する。
図4に示すように、探索部152は、予測器ごとに探索を行う。また、探索部152は、前処理の有効性判定を行ったうえでパラメータ探索を行い、交差検証による交差検証精度でパイプラインの取捨選択を行う。
ここで、図5を用いて、探索部152の処理について説明する。図5は、第1の実施形態に係るパイプラインの探索について説明するための図である。なお、探索部152における処理は、ステップ選択部152a、精度計算部152b及び設定内容決定部152cによって行われる。
図5に示すように、まず、探索部152は、予測器ごとに、ステップ1〜3を実行することで予測モデルの構築に必要なパイプラインの決定を行う。例えば、探索部152は、予測器Aについてステップ1〜3を実行した後、パラメータ探索を実行する。
ステップ選択部152aは、予測モデルを構築する際に実行される複数の処理、すなわちパイプラインのそれぞれに対応し、対応する処理の設定内容を順次決定するステップにおいて、設定内容が決定されるたびに、次に実行されるステップを選択する。設定内容決定部152cは、各ステップの設定内容を、設定情報141に含まれる設定内容候補の中から決定する。このとき、ステップ選択部152aは、設定情報141に示される実行順序に従って、設定内容が決定された次のステップを選択する。なお、いずれのステップも未実行である場合、ステップ選択部152aは実行順序が最も前であるステップを選択する。
例えば、図5に示すように、ステップ「正規化手法探索」の次のステップは「特徴選択手法探索」なので、ステップ「正規化手法探索」の設定内容が決定された場合、ステップ選択部152aは、次のステップとして「特徴選択手法探索」を選択する。
また、図5のステップ「欠損値補完手法探索」、「正規化手法探索」及び「特徴選択手法探索」は、それぞれ、学習用及び分析用のデータの前処理である欠損値補完、正規化及び特徴選択の設定内容を決定するステップである。また、ステップ「欠損値補完手法探索」、「正規化手法探索」及び「特徴選択手法探索」の設定内容候補は、それぞれ、欠損値補完、正規化及び特徴選択で用いられる手法である。
精度計算部152bは、複数の処理のうち、設定内容が決定済みの処理を当該決定済みの設定内容を適用して行うとともに、ステップ選択部152aによって選択されたステップに対応する処理を設定内容の候補のそれぞれを適用して行った場合に構築される予測モデルのそれぞれについて予測精度を計算する。
例えば、ステップ選択部152aによってステップ「特徴選択手法探索」が選択された場合、ステップ「特徴選択手法探索」よりも実行順序が前であるステップ「欠損値補完手法探索」及び「正規化手法探索」の設定内容は決定済みであるため、ステップ「欠損値補完手法探索」及び「正規化手法探索」で決定された設定内容と、ステップ「特徴選択手法探索」の設定内容の候補のそれぞれを適用した予測モデルの構築が可能である。このとき、ステップ「特徴選択手法探索」の設定内容の候補は4つであるため、ステップ「欠損値補完手法探索」及び「正規化手法探索」の設定内容が1つに決定されている場合、少なくとも4通りの予測モデルが構築可能である。
そして、精度計算部152bは、構築可能な予測モデルそれぞれについて予測精度を計算する。なお、このとき、ステップ「欠損値補完手法探索」及び「正規化手法探索」の設定内容は複数通り決定されていてもよい。例えば、ステップ「欠損値補完手法探索」及び「正規化手法探索」の設定内容が2通り決定されている場合、構築可能な予測モデルの数は少なくとも8通りである。また、精度計算部152bは、所定数に分割した学習用のデータを用いた交差検証を行うことで予測精度を計算することができる。ここで、図6を用いて交差検証について説明する。図6は、第1の実施形態に係る交差検証について説明するための図である。
図6に示すように、まず、精度計算部152bは、サンプルデータを分割データ20a、20b、20c及び20dの4つに分割する。そして、精度計算部152bは、1回目の処理として、予測モデルを用いて、分割データ20b、20c及び20dを予測器に学習させ、分割データ20aを用いて学習済みの予測器の精度を測定する。
同様に、精度計算部152bは、2回目の処理では、分割データ20a、20c及び20dを予測器に学習させ、分割データ20bを用いて学習済みの予測器の精度を測定する。また、精度計算部152bは、3回目の処理では、分割データ20a、20b及び20dを予測器に学習させ、分割データ20cを用いて学習済みの予測器の精度を測定する。また、精度計算部152bは、4回目の処理では、分割データ20a、20b及び20cを予測器に学習させ、分割データ20dを用いて学習済みの予測器の精度を測定する。そして、精度計算部152bは、4回の処理で測定した精度の平均値である交差検証精度を予測精度とする。なお、交差検証における分割数は4に限定されず、任意の数とすることができる。
設定内容決定部152cは、精度計算部152bによって計算された各予測精度を比較し、設定内容の候補のうち予測精度が最も高くなる設定内容の候補を、ステップ選択部152aによって選択されたステップに対応する処理の設定内容に決定する。
例えば、図5に示すように、ステップ「正規化手法探索」では、精度計算部152bは、設定内容「最大最小」に対応する予測モデルの予測精度を72%と計算し、設定内容「標準化」に対応する予測モデルの予測精度を78%と計算し、設定内容「Zスコア」に対応する予測モデルの予測精度を72%と計算し、設定内容「無処理」に対応する予測モデルの予測精度を70%と計算した。このとき、ステップ「正規化手法探索」において最も予測精度が高い予測モデルは設定内容「標準化」に対応する予測モデルであるため、設定内容決定部152cは、ステップ「正規化手法探索」に対応する設定項目の設定内容を「標準化」に決定する。つまり、設定内容決定部152cは、データの前処理である正規化で用いられる手法を標準化に決定する。
そして、前述の通り、ステップ選択部152aは、設定内容決定部152cによって設定内容が決定されたステップの次に実行されるステップを選択する。例えば、設定内容決定部152cによってステップ「正規化手法探索」における設定内容が決定された場合、ステップ選択部152aは、ステップ「特徴選択手法探索」を選択する。
さらに、探索部152は、パラメータ探索を行う。パラメータ探索では、探索部152は、ハイパーパラメータの組合せごとの予測精度を網羅的に計算し、最も予測精度が高くなるベストパラメータを探索する。
探索部152は、最終的に、パイプラインのうち、予測モデルの予測精度が所定の条件を満たすようなパイプラインを探索する。例えば、予測精度の閾値を70%とし、予測精度が閾値以上であるパイプラインのみを探索する場合、図7に示すように、探索部152は、パイプラインP〜Pを探索結果とする。図7は、第1の実施形態に係るパイプラインの探索について説明するための図である。
なお、探索部152によるハイパーパラメータの探索結果は、図8に示すように、領域として表すことができる。図8は、第1の実施形態に係る有望領域について説明するための図である。例えば、図8の(a)の縦軸は第1のハイパーパラメータを表し、横軸は第2のパラメータを表している。そして、図8の(a)は、パターンが密である領域ほど予測精度が高かったことを示している。
このとき、探索部152は、予測精度が70%以上となるパイプラインだけでなく、予測精度が70%と統計的な有意差のない値になるようなパイプラインを探索結果とすることができる。つまり、探索部152は、複数の処理に適用された場合に構築されるサンプルデータに基づく予測モデルの予測精度が70%以上であるような設定内容の組合せ、及び、予測精度と70%以上である予測精度との間に統計的な有意差がないような設定内容の組合せを探索する。なお、ここでの70%は、第2の閾値の一例である。そして、この場合の探索結果に対応するハイパーパラメータの組合せに対応する領域を有望領域とよぶ。
ここで、図8の(a)は、サンプルデータを用いた場合の予測精度の有望領域を表している。また、図8の(b)は、サンプルデータの抽出元である学習用データを用いた場合の予測精度の有望領域を表している。図8に示すように、2つの有望領域は類似する。有望領域は、選択部153による処理で用いられる。
選択部153は、探索部152によって探索された設定内容の組合せから、複数の処理に適用された場合に構築される入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する。
つまり、探索部152がサンプルデータを用いて予測モデルの予測精度を評価していたのに対し、選択部153は学習用データを用いて予測モデルの予測精度を評価する。このとき、選択部153は、探索部152によって探索されたパイプラインごとの予測精度を、さらに閾値を用いて絞り込む。
ここで、選択部153は、単に各予測精度が閾値以上となるパイプラインを選択してもよいし、各予測精度を最大予測精度で割った値が閾値以上となるパイプラインを選択してもよい。例えば、図9に示すように、パイプラインP、P、Pの予測精度が85%、70%、83%である場合、最大予測精度は85%である。図9は、第1の実施形態に係るパイプラインの選択について説明するための図である。
このとき、選択部153は、パイプラインPについては85/85と閾値を比較し、パイプラインPについては83/85と閾値を比較し、パイプラインPについては70/85と閾値を比較した結果を用いてパイプラインの選択を行うことができる。
さらに、選択部153は、選択した組合せのデータの前処理に関する設定内容を固定し、ハイパーパラメータ探索を行う。ここで、探索部152による探索の結果、最も予測精度が高かったハイパーパラメータをベストパラメータ210とすると、有望領域は図10のように表すことができる。図10は、第1の実施形態に係る有望領域について説明するための図である。
図10の塗りつぶされた部分は有望領域を表している。また、図10の斜線部分は、探索部152によるハイパーパラメータ探索の対象であったが、選択部153によるハイパーパラメータ探索の対象から除外された領域である。なお、探索部152は、ベストパラメータ210の場合の予測精度を用いたt検定によって有意差の有無を判定することができる。
推定部154は、抽出部151によってサンプルデータが抽出されるたびに、サンプルデータを用いて所定の処理のうちの一部を行った際に要した時間に基づいて、入力されたデータを用いて所定の処理を行った際に要する時間を推定し、当該推定した時間があらかじめ設定された制限時間未満である場合、所定の割合を増加させる。推定部154による処理は、探索部152の処理の実行中の任意のタイミング、又は、探索部152の処理の実行前、又は、探索部152の処理の実行後であって選択部153の処理が行われる前に実行されてもよい。例えば、推定部154は、図5のステップ「欠損値補完手法探索」についての「平均値」の予測精度が計算された時点で、探索部152及び選択部153の処理時間を推定することができる。
まず、予測器ごとの、データ数が増加した場合の計算量の増加量が既知であることとする。例えば予測器Aの計算量の増加量がO(n)であるとする。また、サンプル率を20%とし、ステップ「欠損値補完手法探索」についての「平均値」の予測精度の計算に要した時間が100秒であったとする。図5に示すように、ステップは3つであり、各ステップには4つずつの設定内容の候補があるため、推定部154は、予測器Aについての探索部152の処理時間を、式(1)のように計算する。
100(秒)×3(ステップ)×4(設定内容)=1200(秒)・・・(1)
また、選択部153では、探索部152の100/20倍、すなわち5倍のデータが対象となるため、推定部154は、予測器Aについての選択部153の処理時間を、式(2)のように計算する。
100(秒)×5(計算量の増加量)×3(ステップ)×1(設定内容)
=7500(秒)・・・(2)
ここで、推定部154によって計算された処理時間((1)と(2)の合計)があらかじめ定められた制限時間未満であるか否かによって、以降の処理が異なる。探索部152は、推定部154によって推定された所要時間があらかじめ定められた制限時間未満である場合、所定の割合よりも高い割合で抽出部151によって抽出されたサンプルデータを用いてさらに探索を行う。
一方、探索部152は、推定部154によって推定された所要時間が制限時間以上である場合、予測方法が類似した予測アルゴリズムを除外して探索を実行する。このとき、探索部152は、推定時間が制限時間未満になるまで、予測アルゴリズムを除外する。
具体的には、まず、予測器情報142は、予測アルゴリズム、すなわち予測器ごとのカテゴリを記憶しておく。そして、探索部152は、推定部154によって推定された所要時間が制限時間以上である場合、予測器情報142を参照し、カテゴリが同一である複数の予測器のうちのいずれかを除外する。例えば、探索部152は、あらかじめ設定された実行時間に関する情報に基づいて、実行時間が長い順に予測器を除外する。
例えば、図3の予測器AをRandom Forest、予測器AをExtra Random Trees、予測器AをLogistic Regression、AをLinear SVMとする。そして、予測器情報142には、A及びAのカテゴリとして「決定木カテゴリ」が設定され、A及びAのカテゴリとして「線形予測器カテゴリ」が設定されていることとする。また、予測器情報142には、実行時間の長さの順序が、A、A、A、Aであることが設定されていることとする。
このとき、探索部152は、推定部154によって推定された所要時間が制限時間以上である場合、まず、同一のカテゴリに複数の予測器が設定されていて、かつ、最も実行時間が長いAを除外する。ここで、Aが除外されても所要時間が制限時間以上であると推定される場合、探索部152は、残った予測器のうち、同一のカテゴリに複数の予測器が設定されていて、かつ、最も実行時間が長いAを除外する。探索部152は、複数の予測器が設定されたカテゴリがなくなるまで、又は、所要時間が制限時間以上であると推定されなくなるまで予測器の除外を繰り返す。
合成部155は、複数の設定内容の組合せが選択部153によって選択された場合、複数の設定内容の組合せのそれぞれに対応する複数の予測モデルを、所定のアンサンブル手法を用いて合成する。例えば、図11に示すように、選択部153によって2つのパイプラインが選択された場合、Model A及びModel Aの2つの予測モデルが構築可能となる。図11は、第1の実施形態に係る予測モデルの合成について説明するための図である。このとき、合成部155は、所定のアンサンブル手法により、Model A及びModel Aにそれぞれ重みw及び重みwを付けて合成する。
さらに、合成部155は、図12に示すように、Model A、Model A、及び合成したEnsemble Modelのうち、汎化性能が最も大きい予測モデルをベストモデルとする。図12は、第1の実施形態に係る予測モデルの合成について説明するための図である。
検証部156は、選択部153によって選択されたパイプラインに基づいて構築される予測モデルの検証を行う。選択部153によってパイプラインが選択されると、検証部156は、決定されたパイプラインに基づいて予測器に学習用データを学習させ、予測モデルを構築する。そして、検証部156は、学習用データとは別のテスト用データを用いて、構築した予測モデルの予測精度をテスト精度として測定する。例えば、分析装置10は、ここで測定されたテスト精度を最終的な出力としてもよい。また、学習用データと異なるテスト用データを用いた検証を行うことで、過学習状態及び未学習状態の確認が可能となる。
[第1の実施形態の処理]
図13及び14を用いて、第1の実施形態に係る分析装置10の処理の流れについて説明する。図13及び14は、第1の実施形態に係る分析装置の処理の流れを示すフローチャートである。図13に示すように、まず、分析装置10は、学習用データを読み込む(ステップS101)。次に、抽出部151は、学習データから所定のサンプルサイズのサンプルデータを抽出する(ステップS102)。
次に、探索部152は、未選択の予測器がある場合(ステップS103、Yes)、予測器情報142を参照し、次の予測器を選択する(ステップS104)。次に、探索部152は、読み込んだ学習用データを用いて、選択した予測器のパイプラインを決定する(ステップS105)。探索部152は、複数のパイプラインを決定してもよい。
次に、図14を用いて、探索部152がパイプラインを決定する処理(図13のステップS105)について詳細に説明する。図14に示すように、ステップ選択部152aは、未選択のステップがある場合(ステップS201、Yes)、設定情報141を参照し、次のステップを選択する(ステップS202)。なお、次のステップとは、未選択のステップのうち、最も実行順序が早いステップである。また、本実施形態では、各ステップはデータの前処理のそれぞれに対応するものである。一方、未選択のステップがない場合(ステップS201、No)、分析装置10は、ハイパーパラメータの探索を行う(ステップS207)。
ステップ選択部152aによって選択されたステップの設定内容候補のうち、未選択の設定内容がある場合(ステップS203、Yes)、精度計算部152bは、次の設定内容を選択する(ステップS204)。一方、未選択の設定内容がない場合(ステップS203、No)、設定内容決定部152cは、精度計算部152bによって計算された予測精度が最も高い設定内容をステップ選択部152aによって選択されたステップの設定内容に決定する(ステップS206)。
精度計算部152bは、設定内容を選択すると、当該選択した設定内容を適用したパイプラインに基づいて構築される予測モデルの予測精度を計算する(ステップS205)。このとき、精度計算部152bは、所定数に分割した学習用データを用いた交差検証によって予測精度の計算を行うことができる。そして、精度計算部152bは、未選択の設定内容がなくなるまで、ステップS203〜S205の処理を繰り返す。
図13に戻り、推定部154は、未選択の予測器がない場合(ステップS103、No)、処理全体の時間を推定する(ステップS106)。推定した時間が制限時間未満である場合(ステップS107、Yes)、推定部154はサンプル率を増加させる(ステップS108)。そして、抽出部151は増加したサンプル率で再度サンプルデータを抽出する(ステップS102)。その後、分析装置10は、推定部154によって推定される時間が制限時間未満でなくなるまで処理を繰り返す。
一方、推定部154によって推定された時間が制限時間未満でない場合(ステップS107、No)、探索部152は、予測アルゴリズムを削減する(ステップS109)。そして、選択部153は、探索部152によって決定されたパイプラインから予測精度が閾値以上であるパイプラインを選択し、さらに、選択したパイプラインについてのハイパーパラメータ探索を行う(ステップS110)。そして、検証部156は、選択されたパイプラインに基づいて予測モデルを構築し(ステップS111)、構築した予測モデルをテスト用データを用いて検証する(ステップS112)。
[第1の実施形態の効果]
抽出部151は、データが入力された場合、当該入力されたデータから所定の割合のデータをサンプルデータとして抽出し、所定の割合が増加した場合、入力されたデータから当該増加した所定の割合のデータをサンプルデータとしてさらに抽出する。推定部154は、抽出部151によってサンプルデータが抽出されるたびに、サンプルデータを用いて所定の処理のうちの一部を行った際に要した時間に基づいて、入力されたデータを用いて所定の処理を行った際に要する時間を推定し、当該推定した時間があらかじめ設定された制限時間未満である場合、所定の割合を増加させる。また、探索部152は、所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、複数の処理に適用された場合に構築されるサンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する。また、選択部153は、探索部152によって探索された設定内容の組合せから、複数の処理に適用された場合に構築される入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する。このように、サンプルデータを用いて予測精度が高くなるようなパイプラインを大まかに決定しておき、全データを用いて最終的なパイプラインを選択することで、パイプラインの探索に要する時間を短縮しつつ、予測精度の高い予測モデルを構築することができる。
図15は、auto−sklearnを用いた場合及び本実施形態を用いた場合についての、同じ実行時間の分析によって構築された予測モデルの予測精度を示している。図15は、第1の実施形態の効果を説明するための図である。図15に示すように、12種類中8種類のデータで、本実施形態の方が予測精度が高くなった。また、残り4種類についても、ほぼ同等の予想精度となった。
また、図16は、サンプルの抽出を行わずに探索部152及び選択部153の処理を行った場合(自動化ルール)、及び本実施形態の場合の、実行時間及び予測精度を示している。図16は、第1の実施形態の効果を説明するための図である。図16に示すように、本実施形態では、予測精度をほとんど低下させることなく、約70%の処理時間を削減することができた。
探索部152は、推定部154によって推定された所要時間が制限時間以上である場合、予測方法が類似した予測アルゴリズムを除外して探索を実行する。これにより、時間に余裕がない場合はさらに処理時間を短縮でき、時間に余裕がある場合はさらに予想精度の高い予測モデルを構築することができる。
探索部152は、複数の処理に適用された場合に構築されるサンプルデータに基づく予測モデルの予測精度が第2の閾値以上であるような設定内容の組合せ、及び、予測精度と第2の閾値以上である予測精度との間に統計的な有意差がないような設定内容の組合せを探索する。これにより、最適なハイパーパラメータを短時間で探索することができるようになる。
合成部155は、複数の設定内容の組合せが選択部153によって選択された場合、複数の設定内容の組合せのそれぞれに対応する複数の予測モデルを、所定のアンサンブル手法を用いて合成する。これにより、各パイプラインを単独で選択する場合と比べて、より予測精度の高い予測モデルを構築できる。
[第2の実施形態]
第1の実施形態では、探索部152によってパイプラインが決定された後に、推定部154による処理時間の推定が行われる場合について説明した。ここで、前述の通り、推定部154による処理は、探索部152の処理の実行中の任意のタイミング、又は、探索部152の処理の実行前に行われてもよい。第2の実施形態では、探索部152によるパイプラインの決定に関する処理が開始される前に、推定部154による処理時間の推定が行われる。
[第2の実施形態の処理]
図17を用いて、第2の実施形態に係る分析装置10の処理の流れについて説明する。図17は、第2の実施形態に係る分析装置の処理の流れを示すフローチャートである。図17に示すように、まず、分析装置10は、学習用データを読み込む(ステップS301)。次に、抽出部151は、学習データから所定のサンプルサイズのサンプルデータを抽出する(ステップS302)。
次に、推定部154は、未選択の予測器がある場合(ステップS303、Yes)、予測器情報142を参照し、次の予測器を選択する(ステップS304)。次に、推定部154は、サンプルデータでの実行時間を実測し、学習用データでの実行時間を予測する(ステップS305)。
ここで、推定部154は、サンプルデータを用いた交差検証を実際に行い、その際に要した時間を計測する。具体的には、推定部154は、図6に示すような、精度計算部152bによる処理と同様の処理を行う。ただし、推定部154は、処理に要した時間を計測することを目的としているため、予測精度の計算は行わなくてもよい。
また、精度計算部152bは、サンプルデータに対し前処理を行ったうえで当該サンプルデータを予測器に学習させる。これに対し、推定部154は、サンプルデータに対し前処理を行わず、直接学習器に学習させる。また、推定部154は、前述の式(1)及び(2)を用いて、学習用データでの実行時間を予測する。
推定部154は、予測器を順次選択し、ステップS305を実行する。推定部154は、未選択の予測器がない場合(ステップS303、No)、処理全体の時間を推定する(ステップS306)。推定した時間が制限時間未満である場合(ステップS307、Yes)、推定部154はサンプル率を増加させる(ステップS308)。そして、抽出部151は増加したサンプル率で再度サンプルデータを抽出する(ステップS302)。その後、分析装置10は、推定部154によって推定される時間が制限時間未満でなくなるまで処理を繰り返す。
一方、推定部154によって推定された時間が制限時間未満でない場合(ステップS307、No)、探索部152は、予測アルゴリズムを削減する(ステップS309)。次に、探索部152は、未選択の予測器がある場合(ステップS310、Yes)、予測器情報142を参照し、次の予測器を選択する(ステップS311)。次に、探索部152は、読み込んだ学習用データを用いて、選択した予測器のパイプラインを決定する(ステップS312)。探索部152は、複数のパイプラインを決定してもよい。なお、探索部152がパイプラインを決定する処理は、図14に示す処理と同様である。
未選択の予測器がない場合(ステップS310、No)、選択部153は、探索部152によって決定されたパイプラインから予測精度が閾値以上であるパイプラインを選択し、さらに、選択したパイプラインについてのハイパーパラメータ探索を行う(ステップS313)。そして、検証部156は、選択されたパイプラインに基づいて予測モデルを構築し(ステップS314)、構築した予測モデルをテスト用データを用いて検証する(ステップS315)。
[その他の実施形態]
探索部152は、入力されたデータの特徴量に所定のデータ特性がある場合、設定内容の組合せの候補のうち、所定のデータ特性にあらかじめ対応付けられた設定内容の組合せの候補から探索を行ってもよい。例えば、テキストデータのように、データに占めるゼロの割合が多いデータの場合、すなわちデータがスパースである場合、線形の予測器でも十分な精度が得られることが多い。このため、探索部152は、学習用データ又はサンプルデータがスパースである場合、予測器のうち、非線形の予測器を除外する。例えば、探索部152は、ゼロの割合が閾値r以上であるスパースな特徴量の、全体に占める割合が閾値r以上である場合、データがスパースであると判定する。閾値r及びrは、例えば0.9とすることができる。
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
[プログラム]
一実施形態として、分析装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の分析を実行する分析プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の分析プログラムを情報処理装置に実行させることにより、情報処理装置を分析装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
また、分析装置10は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の分析に関するサービスを提供する分析サーバ装置として実装することもできる。例えば、分析サーバ装置は、学習用データを入力とし、パイプライン又は予測モデルを出力とする分析サービスを提供するサーバ装置として実装される。この場合、分析サーバ装置は、Webサーバとして実装することとしてもよいし、アウトソーシングによって上記の分析に関するサービスを提供するクラウドとして実装することとしてもかまわない。
図18は、分析プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
メモリ1010は、ROM(Read Only Memory)1011及びRAM1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、分析装置10の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、分析装置10における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSDにより代替されてもよい。
また、上述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020が、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して実行する。
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
10 分析装置
11 入力部
12 出力部
13 通信制御部
14 記憶部
15 制御部
141 設定情報
142 予測器情報
151 抽出部
152 探索部
152a ステップ選択部
152b 精度計算部
152c 設定内容決定部
153 選択部
154 推定部
155 合成部
156 検証部

Claims (7)

  1. データが入力された場合、当該入力されたデータから所定の割合のデータをサンプルデータとして抽出し、前記所定の割合が増加した場合、前記入力されたデータから当該増加した所定の割合のデータを前記サンプルデータとしてさらに抽出する抽出部と、
    前記抽出部によって前記サンプルデータが抽出されるたびに、前記サンプルデータを用いて所定の処理のうちの一部を行った際に要した時間に基づいて、前記入力されたデータを用いて前記所定の処理を行った際に要する時間を推定し、当該推定した時間があらかじめ設定された制限時間未満である場合、前記所定の割合を増加させる推定部と、
    所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、前記複数の処理に適用された場合に構築される前記サンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する探索部と、
    前記探索部によって探索された設定内容の組合せから、前記複数の処理に適用された場合に構築される前記入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する選択部と、
    を有することを特徴とする分析装置。
  2. 前記探索部は、前記入力されたデータの特徴量に所定のデータ特性がある場合、前記設定内容の組合せの候補のうち、前記所定のデータ特性にあらかじめ対応付けられた設定内容の組合せの候補から探索を行うことを特徴とする請求項1に記載の分析装置。
  3. 前記探索部は、前記推定部によって推定された所要時間が前記制限時間以上である場合、予測方法が類似した予測アルゴリズムを除外して探索を実行することを特徴とする請求項1又は2に記載の分析装置。
  4. 複数の設定内容の組合せが前記選択部によって選択された場合、前記複数の設定内容の組合せのそれぞれに対応する複数の予測モデルを、所定のアンサンブル手法を用いて合成する合成部をさらに有することを特徴とする請求項1から3のいずれか1項に記載の分析装置。
  5. 前記探索部は、
    予測モデルを構築する際に実行される複数の処理のそれぞれに対応し、対応する処理の設定内容を順次決定するステップにおいて、設定内容が決定されるたびに、次に実行されるステップを選択し、
    前記複数の処理のうち、設定内容が決定済みの処理を当該決定済みの設定内容を適用して行うとともに、前記次に実行されるステップに対応する処理を設定内容の候補のそれぞれを適用して行った場合に構築される予測モデルのそれぞれについて予測精度を計算し、
    計算した各予測精度を比較し、前記設定内容の候補のうち予測精度が最も高くなる設定内容の候補を、前記次に実行されるステップに対応する処理の設定内容に決定することを特徴とする請求項1に記載の分析装置。
  6. 分析装置で実行される分析方法であって、
    入力されたデータから所定の割合のデータをサンプルデータとして抽出する抽出工程と、
    所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、前記複数の処理に適用された場合に構築される前記サンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する探索工程と、
    前記探索工程によって探索された設定内容の組合せから、前記複数の処理に適用された場合に構築される前記入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する選択工程と、
    を含んだことを特徴とする分析方法。
  7. コンピュータを、請求項1から5のいずれか1項に記載の分析装置として機能させるための分析プログラム。
JP2017091187A 2017-05-01 2017-05-01 分析装置、分析方法及び分析プログラム Active JP6659618B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017091187A JP6659618B2 (ja) 2017-05-01 2017-05-01 分析装置、分析方法及び分析プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017091187A JP6659618B2 (ja) 2017-05-01 2017-05-01 分析装置、分析方法及び分析プログラム

Publications (2)

Publication Number Publication Date
JP2018190130A true JP2018190130A (ja) 2018-11-29
JP6659618B2 JP6659618B2 (ja) 2020-03-04

Family

ID=64478573

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017091187A Active JP6659618B2 (ja) 2017-05-01 2017-05-01 分析装置、分析方法及び分析プログラム

Country Status (1)

Country Link
JP (1) JP6659618B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947974A (zh) * 2019-03-15 2019-06-28 百度在线网络技术(北京)有限公司 一种图片组包方法及装置
JP2021009631A (ja) * 2019-07-03 2021-01-28 株式会社日立物流 情報処理システムおよび情報処理方法
JP2022552466A (ja) * 2019-10-15 2022-12-16 ユーアイパス,インコーポレイテッド ロボティック・プロセス・オートメーション・ワークフローのための再構成可能なワークベンチパイプライン

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049677A (ja) * 2015-08-31 2017-03-09 富士通株式会社 機械学習管理プログラム、機械学習管理装置および機械学習管理方法

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2017049677A (ja) * 2015-08-31 2017-03-09 富士通株式会社 機械学習管理プログラム、機械学習管理装置および機械学習管理方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
内田 真人他: "教師無しアンサンブル学習の定式化とその評価", 電子情報通信学会技術研究報告書, vol. 106, no. 589, JPN6019022737, 8 March 2007 (2007-03-08), JP, pages 135 - 140, ISSN: 0004057914 *
浦 晃: "サブサンプリングを利用した探索領域の限定による機械学習のハイパーパラメータ調整", 電子情報通信学会技術研究報告, vol. 115, no. 224, JPN6019022736, 7 September 2015 (2015-09-07), JP, pages 47 - 54, ISSN: 0004057913 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109947974A (zh) * 2019-03-15 2019-06-28 百度在线网络技术(北京)有限公司 一种图片组包方法及装置
JP2021009631A (ja) * 2019-07-03 2021-01-28 株式会社日立物流 情報処理システムおよび情報処理方法
JP7330783B2 (ja) 2019-07-03 2023-08-22 ロジスティード株式会社 情報処理システムおよび情報処理方法
JP2022552466A (ja) * 2019-10-15 2022-12-16 ユーアイパス,インコーポレイテッド ロボティック・プロセス・オートメーション・ワークフローのための再構成可能なワークベンチパイプライン
JP7712609B2 (ja) 2019-10-15 2025-07-24 ユーアイパス,インコーポレイテッド ロボティック・プロセス・オートメーション・ワークフローのための再構成可能なワークベンチパイプライン

Also Published As

Publication number Publication date
JP6659618B2 (ja) 2020-03-04

Similar Documents

Publication Publication Date Title
JP6585654B2 (ja) 判定装置、分析システム、判定方法および判定プログラム
US12450525B2 (en) Method and system for model auto-selection using an ensemble of machine learning models
US9684634B2 (en) Method and apparatus for evaluating predictive model
CN109657805B (zh) 超参数确定方法、装置、电子设备及计算机可读介质
US20180157965A1 (en) Device and method for determining convolutional neural network model for database
US20160063396A1 (en) Method and apparatus for classification
CN112784961B (zh) 超网络的训练方法、装置、电子设备和存储介质
CN113537630A (zh) 业务预测模型的训练方法及装置
JP6577515B2 (ja) 分析装置、分析方法及び分析プログラム
JP6588495B2 (ja) 分析システム、設定方法および設定プログラム
CN112529319A (zh) 基于多维特征的评分方法、装置、计算机设备及存储介质
JP6659618B2 (ja) 分析装置、分析方法及び分析プログラム
WO2017188048A1 (ja) 作成装置、作成プログラム、および作成方法
JP6611268B2 (ja) 特定装置、分析システム、特定方法及び特定プログラム
CN114969546B (zh) 对象分类方法、网络模型的训练方法及装置
JP7424373B2 (ja) 分析装置、分析方法及び分析プログラム
JP6577516B2 (ja) 判定装置、分析システム、判定方法および判定プログラム
KR20210143460A (ko) 특징 추천 장치 및 그것의 특징 추천 방법
US20230052848A1 (en) Initialize optimized parameter in data processing system
CN119312834A (zh) 一种模型确定方法、装置、设备、介质及产品
JP6588494B2 (ja) 抽出装置、分析システム、抽出方法及び抽出プログラム
US20240104436A1 (en) Chained feature synthesis and dimensional reduction
CN114037057A (zh) 预训练模型的生成方法、装置、电子设备以及存储介质
JP6805313B2 (ja) 特定装置、特定方法及び特定プログラム
CN114037058A (zh) 预训练模型的生成方法、装置、电子设备以及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20180808

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20190606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20190618

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190806

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20200204

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20200206

R150 Certificate of patent or registration of utility model

Ref document number: 6659618

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350