JP2018190130A - 分析装置、分析方法及び分析プログラム - Google Patents
分析装置、分析方法及び分析プログラム Download PDFInfo
- Publication number
- JP2018190130A JP2018190130A JP2017091187A JP2017091187A JP2018190130A JP 2018190130 A JP2018190130 A JP 2018190130A JP 2017091187 A JP2017091187 A JP 2017091187A JP 2017091187 A JP2017091187 A JP 2017091187A JP 2018190130 A JP2018190130 A JP 2018190130A
- Authority
- JP
- Japan
- Prior art keywords
- data
- unit
- search
- setting contents
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
[分析装置の構成]
図1を用いて、分析装置10の構成について説明する。図1は、第1の実施形態に係る分析装置の構成の一例を示す図である。図1に示すように、分析装置10は、ワークステーションやパソコン等の汎用コンピュータで実現され、入力部11と、出力部12と、通信制御部13と、記憶部14と、制御部15とを備える。
100(秒)×3(ステップ)×4(設定内容)=1200(秒)・・・(1)
100(秒)×52(計算量の増加量)×3(ステップ)×1(設定内容)
=7500(秒)・・・(2)
図13及び14を用いて、第1の実施形態に係る分析装置10の処理の流れについて説明する。図13及び14は、第1の実施形態に係る分析装置の処理の流れを示すフローチャートである。図13に示すように、まず、分析装置10は、学習用データを読み込む(ステップS101)。次に、抽出部151は、学習データから所定のサンプルサイズのサンプルデータを抽出する(ステップS102)。
抽出部151は、データが入力された場合、当該入力されたデータから所定の割合のデータをサンプルデータとして抽出し、所定の割合が増加した場合、入力されたデータから当該増加した所定の割合のデータをサンプルデータとしてさらに抽出する。推定部154は、抽出部151によってサンプルデータが抽出されるたびに、サンプルデータを用いて所定の処理のうちの一部を行った際に要した時間に基づいて、入力されたデータを用いて所定の処理を行った際に要する時間を推定し、当該推定した時間があらかじめ設定された制限時間未満である場合、所定の割合を増加させる。また、探索部152は、所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、複数の処理に適用された場合に構築されるサンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する。また、選択部153は、探索部152によって探索された設定内容の組合せから、複数の処理に適用された場合に構築される入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する。このように、サンプルデータを用いて予測精度が高くなるようなパイプラインを大まかに決定しておき、全データを用いて最終的なパイプラインを選択することで、パイプラインの探索に要する時間を短縮しつつ、予測精度の高い予測モデルを構築することができる。
第1の実施形態では、探索部152によってパイプラインが決定された後に、推定部154による処理時間の推定が行われる場合について説明した。ここで、前述の通り、推定部154による処理は、探索部152の処理の実行中の任意のタイミング、又は、探索部152の処理の実行前に行われてもよい。第2の実施形態では、探索部152によるパイプラインの決定に関する処理が開始される前に、推定部154による処理時間の推定が行われる。
図17を用いて、第2の実施形態に係る分析装置10の処理の流れについて説明する。図17は、第2の実施形態に係る分析装置の処理の流れを示すフローチャートである。図17に示すように、まず、分析装置10は、学習用データを読み込む(ステップS301)。次に、抽出部151は、学習データから所定のサンプルサイズのサンプルデータを抽出する(ステップS302)。
探索部152は、入力されたデータの特徴量に所定のデータ特性がある場合、設定内容の組合せの候補のうち、所定のデータ特性にあらかじめ対応付けられた設定内容の組合せの候補から探索を行ってもよい。例えば、テキストデータのように、データに占めるゼロの割合が多いデータの場合、すなわちデータがスパースである場合、線形の予測器でも十分な精度が得られることが多い。このため、探索部152は、学習用データ又はサンプルデータがスパースである場合、予測器のうち、非線形の予測器を除外する。例えば、探索部152は、ゼロの割合が閾値rf以上であるスパースな特徴量の、全体に占める割合が閾値ra以上である場合、データがスパースであると判定する。閾値rf及びraは、例えば0.9とすることができる。
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
一実施形態として、分析装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の分析を実行する分析プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の分析プログラムを情報処理装置に実行させることにより、情報処理装置を分析装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置にはスマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
11 入力部
12 出力部
13 通信制御部
14 記憶部
15 制御部
141 設定情報
142 予測器情報
151 抽出部
152 探索部
152a ステップ選択部
152b 精度計算部
152c 設定内容決定部
153 選択部
154 推定部
155 合成部
156 検証部
Claims (7)
- データが入力された場合、当該入力されたデータから所定の割合のデータをサンプルデータとして抽出し、前記所定の割合が増加した場合、前記入力されたデータから当該増加した所定の割合のデータを前記サンプルデータとしてさらに抽出する抽出部と、
前記抽出部によって前記サンプルデータが抽出されるたびに、前記サンプルデータを用いて所定の処理のうちの一部を行った際に要した時間に基づいて、前記入力されたデータを用いて前記所定の処理を行った際に要する時間を推定し、当該推定した時間があらかじめ設定された制限時間未満である場合、前記所定の割合を増加させる推定部と、
所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、前記複数の処理に適用された場合に構築される前記サンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する探索部と、
前記探索部によって探索された設定内容の組合せから、前記複数の処理に適用された場合に構築される前記入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する選択部と、
を有することを特徴とする分析装置。 - 前記探索部は、前記入力されたデータの特徴量に所定のデータ特性がある場合、前記設定内容の組合せの候補のうち、前記所定のデータ特性にあらかじめ対応付けられた設定内容の組合せの候補から探索を行うことを特徴とする請求項1に記載の分析装置。
- 前記探索部は、前記推定部によって推定された所要時間が前記制限時間以上である場合、予測方法が類似した予測アルゴリズムを除外して探索を実行することを特徴とする請求項1又は2に記載の分析装置。
- 複数の設定内容の組合せが前記選択部によって選択された場合、前記複数の設定内容の組合せのそれぞれに対応する複数の予測モデルを、所定のアンサンブル手法を用いて合成する合成部をさらに有することを特徴とする請求項1から3のいずれか1項に記載の分析装置。
- 前記探索部は、
予測モデルを構築する際に実行される複数の処理のそれぞれに対応し、対応する処理の設定内容を順次決定するステップにおいて、設定内容が決定されるたびに、次に実行されるステップを選択し、
前記複数の処理のうち、設定内容が決定済みの処理を当該決定済みの設定内容を適用して行うとともに、前記次に実行されるステップに対応する処理を設定内容の候補のそれぞれを適用して行った場合に構築される予測モデルのそれぞれについて予測精度を計算し、
計算した各予測精度を比較し、前記設定内容の候補のうち予測精度が最も高くなる設定内容の候補を、前記次に実行されるステップに対応する処理の設定内容に決定することを特徴とする請求項1に記載の分析装置。 - 分析装置で実行される分析方法であって、
入力されたデータから所定の割合のデータをサンプルデータとして抽出する抽出工程と、
所定のデータに基づく予測モデルを構築する際に実行される複数の処理に適用される設定内容の組合せの候補から、前記複数の処理に適用された場合に構築される前記サンプルデータに基づく予測モデルの予測精度が所定の条件を満たすような設定内容の組合せを探索する探索工程と、
前記探索工程によって探索された設定内容の組合せから、前記複数の処理に適用された場合に構築される前記入力されたデータに基づく予測モデルの予測精度が所定の閾値以上となる設定内容の組合せを選択する選択工程と、
を含んだことを特徴とする分析方法。 - コンピュータを、請求項1から5のいずれか1項に記載の分析装置として機能させるための分析プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017091187A JP6659618B2 (ja) | 2017-05-01 | 2017-05-01 | 分析装置、分析方法及び分析プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017091187A JP6659618B2 (ja) | 2017-05-01 | 2017-05-01 | 分析装置、分析方法及び分析プログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018190130A true JP2018190130A (ja) | 2018-11-29 |
| JP6659618B2 JP6659618B2 (ja) | 2020-03-04 |
Family
ID=64478573
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017091187A Active JP6659618B2 (ja) | 2017-05-01 | 2017-05-01 | 分析装置、分析方法及び分析プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6659618B2 (ja) |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109947974A (zh) * | 2019-03-15 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 一种图片组包方法及装置 |
| JP2021009631A (ja) * | 2019-07-03 | 2021-01-28 | 株式会社日立物流 | 情報処理システムおよび情報処理方法 |
| JP2022552466A (ja) * | 2019-10-15 | 2022-12-16 | ユーアイパス,インコーポレイテッド | ロボティック・プロセス・オートメーション・ワークフローのための再構成可能なワークベンチパイプライン |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017049677A (ja) * | 2015-08-31 | 2017-03-09 | 富士通株式会社 | 機械学習管理プログラム、機械学習管理装置および機械学習管理方法 |
-
2017
- 2017-05-01 JP JP2017091187A patent/JP6659618B2/ja active Active
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2017049677A (ja) * | 2015-08-31 | 2017-03-09 | 富士通株式会社 | 機械学習管理プログラム、機械学習管理装置および機械学習管理方法 |
Non-Patent Citations (2)
| Title |
|---|
| 内田 真人他: "教師無しアンサンブル学習の定式化とその評価", 電子情報通信学会技術研究報告書, vol. 106, no. 589, JPN6019022737, 8 March 2007 (2007-03-08), JP, pages 135 - 140, ISSN: 0004057914 * |
| 浦 晃: "サブサンプリングを利用した探索領域の限定による機械学習のハイパーパラメータ調整", 電子情報通信学会技術研究報告, vol. 115, no. 224, JPN6019022736, 7 September 2015 (2015-09-07), JP, pages 47 - 54, ISSN: 0004057913 * |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN109947974A (zh) * | 2019-03-15 | 2019-06-28 | 百度在线网络技术(北京)有限公司 | 一种图片组包方法及装置 |
| JP2021009631A (ja) * | 2019-07-03 | 2021-01-28 | 株式会社日立物流 | 情報処理システムおよび情報処理方法 |
| JP7330783B2 (ja) | 2019-07-03 | 2023-08-22 | ロジスティード株式会社 | 情報処理システムおよび情報処理方法 |
| JP2022552466A (ja) * | 2019-10-15 | 2022-12-16 | ユーアイパス,インコーポレイテッド | ロボティック・プロセス・オートメーション・ワークフローのための再構成可能なワークベンチパイプライン |
| JP7712609B2 (ja) | 2019-10-15 | 2025-07-24 | ユーアイパス,インコーポレイテッド | ロボティック・プロセス・オートメーション・ワークフローのための再構成可能なワークベンチパイプライン |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6659618B2 (ja) | 2020-03-04 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP6585654B2 (ja) | 判定装置、分析システム、判定方法および判定プログラム | |
| US12450525B2 (en) | Method and system for model auto-selection using an ensemble of machine learning models | |
| US9684634B2 (en) | Method and apparatus for evaluating predictive model | |
| CN109657805B (zh) | 超参数确定方法、装置、电子设备及计算机可读介质 | |
| US20180157965A1 (en) | Device and method for determining convolutional neural network model for database | |
| US20160063396A1 (en) | Method and apparatus for classification | |
| CN112784961B (zh) | 超网络的训练方法、装置、电子设备和存储介质 | |
| CN113537630A (zh) | 业务预测模型的训练方法及装置 | |
| JP6577515B2 (ja) | 分析装置、分析方法及び分析プログラム | |
| JP6588495B2 (ja) | 分析システム、設定方法および設定プログラム | |
| CN112529319A (zh) | 基于多维特征的评分方法、装置、计算机设备及存储介质 | |
| JP6659618B2 (ja) | 分析装置、分析方法及び分析プログラム | |
| WO2017188048A1 (ja) | 作成装置、作成プログラム、および作成方法 | |
| JP6611268B2 (ja) | 特定装置、分析システム、特定方法及び特定プログラム | |
| CN114969546B (zh) | 对象分类方法、网络模型的训练方法及装置 | |
| JP7424373B2 (ja) | 分析装置、分析方法及び分析プログラム | |
| JP6577516B2 (ja) | 判定装置、分析システム、判定方法および判定プログラム | |
| KR20210143460A (ko) | 특징 추천 장치 및 그것의 특징 추천 방법 | |
| US20230052848A1 (en) | Initialize optimized parameter in data processing system | |
| CN119312834A (zh) | 一种模型确定方法、装置、设备、介质及产品 | |
| JP6588494B2 (ja) | 抽出装置、分析システム、抽出方法及び抽出プログラム | |
| US20240104436A1 (en) | Chained feature synthesis and dimensional reduction | |
| CN114037057A (zh) | 预训练模型的生成方法、装置、电子设备以及存储介质 | |
| JP6805313B2 (ja) | 特定装置、特定方法及び特定プログラム | |
| CN114037058A (zh) | 预训练模型的生成方法、装置、电子设备以及存储介质 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180808 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190606 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190618 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190806 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200204 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200206 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6659618 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |