JP2020091615A - 強化学習支援装置、保守計画立案装置、及び強化学習支援方法 - Google Patents
強化学習支援装置、保守計画立案装置、及び強化学習支援方法 Download PDFInfo
- Publication number
- JP2020091615A JP2020091615A JP2018227751A JP2018227751A JP2020091615A JP 2020091615 A JP2020091615 A JP 2020091615A JP 2018227751 A JP2018227751 A JP 2018227751A JP 2018227751 A JP2018227751 A JP 2018227751A JP 2020091615 A JP2020091615 A JP 2020091615A
- Authority
- JP
- Japan
- Prior art keywords
- information
- field
- reinforcement learning
- learning support
- reward
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
Description
部、及び、前記抽象化フィールド情報に基づき前記フィールドにおける前記資産の状態分布を示す情報である状態分布情報を生成する状態分布生成部、を備える。
産の管理区分、資産に障害が発生した際の影響範囲等の情報に基づき、フィールドを同一とみなせる範囲(以下、「領域」と称する。)で区分する。
Only Memory)、RAM(Random Access Memory)、不揮発性メモリ(NVRAM(Non Volatile RAM))等である。
)、光学式記憶装置(CD(Compact Disc)、DVD(Digital Versatile Disc)等)、ストレージシステム、ICカード、SDカードや光学式記録媒体等の記録媒体の読取/書込装置、クラウドサーバの記憶領域等である。補助記憶装置13には、記録媒体の読取装置や通信装置16を介してプログラムやデータを読み込むことができる。補助記憶装置13に記憶されているプログラムやデータは主記憶装置12に随時読み込まれる。
段を介した他の装置との間の通信を実現する有線方式又は無線方式の通信インタフェースであり、例えば、NIC(Network Interface Card)、無線通信モジュール、USB(Universal Serial Interface)モジュール、シリアル通信モジュール等である。
入力を受け付けつつ、目標状態に近いほど報酬が多くなるように報酬設計を行う(S712)。尚、設計された報酬に関する情報は、記憶部105が報酬情報156として記憶する(S713)。
ストが発生している場合等)ため、小さめのマイナス報酬「−10」を設定している。
ード、SDカード、DVD(Digital Versatile Disc)の記録媒体に格納することができる。
105 記憶部
110 報酬設計部
111 フィールド抽象化部
112 行動情報生成部
113 状態分布生成部
114 報酬情報生成部
120 強化学習部
151 フィールド情報
152 抽象化フィールド情報
153 行動情報
155 状態分布情報
156 報酬情報
157 行動ポリシー
158 保守計画立案結果
S300 報酬設計処理
S310 フィールド抽象化処理
S320 行動生成処理
S330 状態分布生成処理
S340 報酬情報生成処理
Claims (15)
- 強化学習によりフィールドの保守計画を立案する際の報酬設計を支援する情報処理装置であって、
前記フィールドを特定する情報と前記フィールドに配置される資産に関する情報とを含んだ情報であるフィールド情報を記憶する記憶部、
前記フィールドを複数の領域に区分し、前記領域を単位として前記資産に関する情報を集約した情報である領域集約情報を生成し、前記領域を特定する情報と前記領域集約情報とに基づき、前記フィールドを抽象化して得られる抽象化フィールドについての情報である抽象化フィールド情報を生成するフィールド抽象化部、及び、
前記抽象化フィールド情報に基づき前記フィールドにおける前記資産の状態分布を示す情報である状態分布情報を生成する状態分布生成部、
を備える、強化学習支援装置。 - 請求項1に記載の強化学習支援装置であって、
前記資産に関する情報は前記資産の状態を表すパラメータであり、
前記領域集約情報は前記パラメータを統計的に処理することにより生成される統計情報である、
強化学習支援装置。 - 請求項2に記載の強化学習支援装置であって、
前記統計情報は、前記パラメータの平均値、前記パラメータの最大値または最小値、前記パラメータの分散値、所定の閾値を超える前記パラメータの割合、のうちの少なくともいずれかである、
強化学習支援装置。 - 請求項1に記載の強化学習支援装置であって、
情報を提示する出力装置と通信可能に接続し、
前記状態分布生成部は、前記状態分布を視覚化して前記出力装置に出力する、
強化学習支援装置。 - 請求項4に記載の強化学習支援装置であって、
前記状態分布生成部は、前記状態分布を、前記領域ごとの前記資産の状態を示す情報を横軸とし、前記状態ごとに該当する前記領域の数を縦軸とするヒストグラムとして前記出力装置に出力する、
強化学習支援装置。 - 請求項4または5に記載の強化学習支援装置であって、
ユーザインタフェースを備え、
ユーザとの間の対話処理により報酬設計のための情報の入力を受け付けて報酬に関する情報である報酬情報を生成する報酬情報生成部をさらに備える、
強化学習支援装置。 - 請求項1に記載の強化学習支援装置であって、
前記フィールド抽象化部は、前記フィールド情報に含まれている、前記フィールドの地理的な情報、前記資産の管理区分、前記資産に障害発生した際の影響範囲等の情報、のうちの少なくともいずれかに基づき、前記フィールドを複数の前記領域に区分する、
強化学習支援装置。 - 請求項1に記載の強化学習支援装置であって、
前記強化学習において行動ポリシーが選択する行動に関する情報である行動情報を前記フィールド情報及び前記抽象化フィールド情報に基づき生成する行動情報生成部をさらに備える、
強化学習支援装置。 - 強化学習によりフィールドの保守計画を立案する情報処理装置であって、
前記フィールドを特定する情報と前記フィールドに配置される資産に関する情報とを含んだ情報であるフィールド情報を記憶する記憶部、
前記フィールドを複数の領域に区分し、前記領域を単位として前記資産に関する情報を集約した情報である領域集約情報を生成し、前記領域を特定する情報と前記領域集約情報とに基づき、前記フィールドを抽象化して得られる抽象化フィールドについての情報である抽象化フィールド情報を生成するフィールド抽象化部、及び、
前記抽象化フィールド情報に基づき前記フィールドにおける前記資産の状態分布を示す情報である状態分布情報を生成する状態分布生成部、
ユーザインタフェース、
ユーザとの間の対話処理により報酬設計のための情報の入力を受け付けて報酬に関する情報である報酬情報を生成する報酬情報生成部、
前記強化学習において行動ポリシーが選択する行動に関する情報である行動情報を前記フィールド情報及び前記抽象化フィールド情報に基づき生成する行動情報生成部、及び、
前記報酬情報及び前記行動情報に基づき前記強化学習を行う強化学習部、
を備える、保守計画立案装置。 - 強化学習によりフィールドの保守計画を立案する際の報酬設計を支援する方法であって、
情報処理装置が、
前記フィールドを特定する情報と前記フィールドに配置される資産に関する情報とを含んだ情報であるフィールド情報を記憶するステップ、
前記フィールドを複数の領域に区分し、前記領域を単位として前記資産に関する情報を集約した情報である領域集約情報を生成し、前記領域を特定する情報と前記領域集約情報とに基づき、前記フィールドを抽象化して得られる抽象化フィールドについての情報である抽象化フィールド情報を生成するステップ、及び、
前記抽象化フィールド情報に基づき前記フィールドにおける前記資産の状態分布を示す情報である状態分布情報を生成するステップ、
を実行する、強化学習支援方法。 - 請求項10に記載の強化学習支援方法であって、
前記資産に関する情報は前記資産の状態を表すパラメータであり、
前記領域集約情報は前記パラメータを統計的に処理することにより生成される統計情報である、
強化学習支援方法。 - 請求項11に記載の強化学習支援方法であって、
前記統計情報は、前記パラメータの平均値、前記パラメータの最大値または最小値、前記パラメータの分散値、所定の閾値を超える前記パラメータの割合、のうちの少なくともいずれかである、
強化学習支援装置。 - 請求項10に記載の強化学習支援方法であって、
前記情報処理装置は情報を提示する出力装置と通信可能に接続し、
前記情報処理装置が、前記状態分布を視覚化して前記出力装置に出力するステップ、
をさらに実行する、強化学習支援方法。 - 請求項13に記載の強化学習支援方法であって、
前記情報処理装置は、前記状態分布情報を、前記領域ごとの前記資産の状態を示す情報を横軸とし、前記状態ごとに該当する前記領域の数を縦軸とするヒストグラムとして前記出力装置に出力するステップ、
をさらに実行する、強化学習支援方法。 - 請求項13または14に記載の強化学習支援方法であって、
前記情報処理装置はユーザインタフェースを備え、
前記情報処理装置が、ユーザとの間の対話処理により報酬設計のための情報の入力を受け付けるステップ、
をさらに実行する、強化学習支援方法。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018227751A JP7141320B2 (ja) | 2018-12-05 | 2018-12-05 | 強化学習支援装置、保守計画立案装置、及び強化学習支援方法 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018227751A JP7141320B2 (ja) | 2018-12-05 | 2018-12-05 | 強化学習支援装置、保守計画立案装置、及び強化学習支援方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2020091615A true JP2020091615A (ja) | 2020-06-11 |
| JP7141320B2 JP7141320B2 (ja) | 2022-09-22 |
Family
ID=71012884
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2018227751A Active JP7141320B2 (ja) | 2018-12-05 | 2018-12-05 | 強化学習支援装置、保守計画立案装置、及び強化学習支援方法 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7141320B2 (ja) |
Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004274844A (ja) * | 2003-03-06 | 2004-09-30 | Tokyo Electric Power Co Inc:The | 保守計画立案支援方法及び装置 |
| JP2008224120A (ja) * | 2007-03-12 | 2008-09-25 | Hitachi Ltd | ボイラプラントの制御装置及び運転員訓練用装置 |
| JP2009294731A (ja) * | 2008-06-02 | 2009-12-17 | Toshiba Corp | 運用ノウハウを自動抽出するプラント制御装置 |
| JP2011059756A (ja) * | 2009-09-07 | 2011-03-24 | Toshiba Corp | 電力設備管理システム |
| JP2018106466A (ja) * | 2016-12-27 | 2018-07-05 | 株式会社日立製作所 | 制御装置及び制御方法 |
| JP2018142060A (ja) * | 2017-02-27 | 2018-09-13 | 株式会社東芝 | アイソレーション管理システムおよびアイソレーション管理方法 |
| JP2018185565A (ja) * | 2017-04-24 | 2018-11-22 | 株式会社東芝 | 対話システム、対話方法及び対話プログラム |
-
2018
- 2018-12-05 JP JP2018227751A patent/JP7141320B2/ja active Active
Patent Citations (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2004274844A (ja) * | 2003-03-06 | 2004-09-30 | Tokyo Electric Power Co Inc:The | 保守計画立案支援方法及び装置 |
| JP2008224120A (ja) * | 2007-03-12 | 2008-09-25 | Hitachi Ltd | ボイラプラントの制御装置及び運転員訓練用装置 |
| JP2009294731A (ja) * | 2008-06-02 | 2009-12-17 | Toshiba Corp | 運用ノウハウを自動抽出するプラント制御装置 |
| JP2011059756A (ja) * | 2009-09-07 | 2011-03-24 | Toshiba Corp | 電力設備管理システム |
| JP2018106466A (ja) * | 2016-12-27 | 2018-07-05 | 株式会社日立製作所 | 制御装置及び制御方法 |
| JP2018142060A (ja) * | 2017-02-27 | 2018-09-13 | 株式会社東芝 | アイソレーション管理システムおよびアイソレーション管理方法 |
| JP2018185565A (ja) * | 2017-04-24 | 2018-11-22 | 株式会社東芝 | 対話システム、対話方法及び対話プログラム |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7141320B2 (ja) | 2022-09-22 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US9031914B2 (en) | Tier-based data management | |
| EP4195112A1 (en) | Systems and methods for enriching modeling tools and infrastructure with semantics | |
| US20230129123A1 (en) | Monitoring and Management System for Automatically Generating an Issue Prediction for a Trouble Ticket | |
| US11762720B2 (en) | Information processing apparatus and non-transitory computer-readable storage medium for storing API use history display program | |
| US20240070160A1 (en) | Data processing method and electronic device | |
| CN114444782A (zh) | 企业资产的管理方法、装置、存储介质及计算机设备 | |
| JP2020166829A (ja) | 互換性のあるコンポーネントの非同期選択のシステムおよび方法 | |
| JP7410379B2 (ja) | 資源使用量予測方法および資源使用量予測プログラム | |
| JP2018010523A (ja) | 設備保全計画作成システム及び設備保全計画作成方法 | |
| CN115718806A (zh) | 系统投产问题管理方法、装置、设备、介质和程序产品 | |
| US11468023B2 (en) | Computer-based data collection, management, and forecasting | |
| CN113537519B (zh) | 一种识别异常设备的方法和装置 | |
| JP7141320B2 (ja) | 強化学習支援装置、保守計画立案装置、及び強化学習支援方法 | |
| JP7133496B2 (ja) | 影響範囲特定装置、及び影響範囲特定方法 | |
| JP2020109635A (ja) | 異常があるシステムと互換性のあるシステムを検出する方法 | |
| US11513862B2 (en) | System and method for state management of devices | |
| CN115686895A (zh) | 数据库异常诊断方法、装置、设备、介质和程序产品 | |
| JP7478011B2 (ja) | プロジェクト管理システムにおける管理サーバ、管理方法及びプログラム | |
| Yashchin | Design and implementation of systems for monitoring lifetime data | |
| JP2024029694A (ja) | 情報処理装置及びプログラム | |
| Ruan et al. | Open-access data and toolbox for tracking covid-19 impact on power systems | |
| US20060242125A1 (en) | Method, apparatus, and computer program product for assessing a user's current information management system | |
| JP7660530B2 (ja) | プロジェクト成否予測装置、予測モデルの機械学習方法、およびプロジェクト成否予測方法 | |
| JP7742779B2 (ja) | 計算機システム及び予測モデルの学習方法 | |
| JP7797302B2 (ja) | 倫理性診断装置、及び倫理性診断方法 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20210409 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20220218 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220405 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220422 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220906 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220909 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7141320 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |