JP2018156348A - 障害監視装置、障害監視システムおよびプログラム - Google Patents
障害監視装置、障害監視システムおよびプログラム Download PDFInfo
- Publication number
- JP2018156348A JP2018156348A JP2017052127A JP2017052127A JP2018156348A JP 2018156348 A JP2018156348 A JP 2018156348A JP 2017052127 A JP2017052127 A JP 2017052127A JP 2017052127 A JP2017052127 A JP 2017052127A JP 2018156348 A JP2018156348 A JP 2018156348A
- Authority
- JP
- Japan
- Prior art keywords
- failure
- information processing
- internal
- processing system
- monitoring
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【解決手段】障害監視装置100は、情報処理システム200に対して定期的にアクセスし、その応答の成否を時系列に蓄積する外部監視手段10と、情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段20と、情報処理システムの障害を判定する障害判定手段30とを含む。障害判定手段は、応答の成否の時系列情報を外部メトリクスデータに変換する手段32と、内部状態の時系列情報を内部メトリクスデータに変換する手段34と、外部メトリクスデータの値を出力とし、該値に時間的に対応する内部メトリクスデータの値を入力とする教師データを生成する手段35と、教師データを使用して情報処理システムの障害を判定するための障害判定条件を機械学習する学習器36と、障害判定条件が設定される判定器37とを含む。
【選択図】図2
Description
(1)ニューラルネットワークのネットワーク構造
(2)ノードの活性化関数
(3)重み値
(4)バイアス値
12…外部監視エンジン
14…記憶手段
20…内部監視手段
22…内部監視エンジン
24…記憶手段
30…障害判定手段
32…外部監視情報変換エンジン
34…内部状態情報変換エンジン
35…教師データ生成手段
36…学習エンジン
37…判定エンジン
38…記憶手段
50…ネットワーク
100…障害監視装置
10s…外部監視システム
20s…内部監視システム
30s…障害判定システム
100s…障害監視システム
101…プロセッサ
102…ROM
103…RAM
104…補助記憶装置
105…入出力インタフェース
106…ネットワーク・インターフェース
200…情報処理システム
202…監視エージェント
300…監視シナリオ
301,302,303,304,305,306…フィールド
400…内部監視設定
500…外部監視情報
501,502,503,504…フィールド
600…内部状態情報
601,602,603,604…フィールド
700…外部メトリクスデータ
800…内部メトリクスデータ
Claims (8)
- 情報処理システムの障害を検知するための障害監視装置であって、
前記情報処理システムに対して定期的にアクセスし、その応答の成否を時系列に蓄積する外部監視手段と、
前記情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段と、
前記情報処理システムの障害を判定する障害判定手段と、
を含み、
前記障害判定手段は、
前記応答の成否の時系列情報を外部メトリクスデータに変換する手段と、
前記内部状態の時系列情報を内部メトリクスデータに変換する手段と、
前記外部メトリクスデータの値を出力とし、該値に時間的に対応する前記内部メトリクスデータの値を入力とする教師データを生成する手段と、
前記教師データを使用して前記情報処理システムの障害を判定するための障害判定条件を機械学習する学習器と、
前記障害判定条件が設定される判定器であって、前記内部メトリクスデータを入力として受け取り、前記情報処理システムの障害に係る判定結果を出力する判定器と、
を含む障害監視装置。 - 前記教師データを生成する手段は、
前記外部メトリクスデータの1の値を出力とし、該値に時間的に対応する前記内部メトリクスデータの2以上の値の代表値を入力とする教師データを生成する、
請求項1に記載の障害監視装置。 - 障害監視装置は、
ユーザによるアクセス操作を疑似的に再現するアクセスと応答期待値の組み合せを実行順に記述した監視シナリオを備え、
前記外部監視手段は、
前記情報処理システムに対して各前記アクセスを順番に実行し、該アクセスに対する応答結果と該アクセスに係る前記応答期待値の比較に基づいて前記応答の成否を判定する、
請求項1または2に記載の障害監視装置。 - 情報処理システムの障害を検知するための障害監視装置であって、
前記情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段と、
前記情報処理システムの障害を判定する障害判定手段と、
を含み、
前記障害判定手段は、
前記内部状態を内部メトリクスデータに変換する手段と、
所定の教師データを使用した機械学習により取得された障害判定条件が設定される判定器であって、前記内部メトリクスデータを入力として受け取り、前記情報処理システムの障害に係る判定結果を出力する判定器を含み、
前記所定の教師データは、
外部メトリクスデータの値を出力とし、該値に時間的に対応する内部メトリクスデータの値を入力とする教師データであって、
前記外部メトリクスデータは、
所定の情報処理システムに対して定期的に実行したアクセスに対する応答の成否に係るメトリクスの時系列情報であり、
前記内部メトリクスデータは、
前記所定の情報処理システムを構成する各要素の内部状態に係るメトリクスの時系列情報である、
障害監視装置。 - 情報処理システムの障害を検知するための障害監視システムであって、
前記情報処理システムに対して定期的にアクセスし、その応答の成否を時系列に蓄積する外部監視手段と、
前記情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段と、
前記情報処理システムの障害を判定する障害判定手段と、
を含み、
前記障害判定手段は、
前記応答の成否の時系列情報を外部メトリクスデータに変換する手段と、
前記内部状態の時系列情報を内部メトリクスデータに変換する手段と、
前記外部メトリクスデータの値を出力とし、該値に時間的に対応する前記内部メトリクスデータの値を入力とする教師データを生成する手段と、
前記教師データを使用して前記情報処理システムの障害を判定するための障害判定条件を機械学習する学習器と、
を含む障害監視システム。 - 情報処理システムの障害を検知するための障害監視システムであって、
前記情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段と、
前記情報処理システムの障害を判定する障害判定手段と、
を含み、
前記障害判定手段は、
前記内部状態を内部メトリクスデータに変換する手段と、
所定の教師データを使用した機械学習により取得された障害判定条件が設定される判定器であって、前記内部メトリクスデータを入力として受け取り、前記情報処理システムの障害に係る判定結果を出力する判定器を含み、
前記所定の教師データは、
外部メトリクスデータの値を出力とし、該値に時間的に対応する内部メトリクスデータの値を入力とする教師データであって、
前記外部メトリクスデータは、
所定の情報処理システムに対して定期的に実行したアクセスに対する応答の成否に係るメトリクスの時系列情報であり、
前記内部メトリクスデータは、
前記所定の情報処理システムを構成する各要素の内部状態に係るメトリクスの時系列情報である、
障害監視システム。 - 情報処理システムの障害を検知するためのコンピュータを、
前記情報処理システムに対して定期的にアクセスし、その応答の成否を時系列に蓄積する外部監視手段、
前記情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段、
前記情報処理システムの障害を判定する障害判定手段、
として機能させるためのプログラムであって、
前記障害判定手段は、
前記応答の成否の時系列情報を外部メトリクスデータに変換する手段と、
前記内部状態の時系列情報を内部メトリクスデータに変換する手段と、
前記外部メトリクスデータの値を出力とし、該値に時間的に対応する前記内部メトリクスデータの値を入力とする教師データを生成する手段と、
前記教師データを使用して前記情報処理システムの障害を判定するための障害判定条件を機械学習する学習器と、
を含む、プログラム。 - 情報処理システムの障害を検知するためのコンピュータを、
前記情報処理システムを構成する各要素の内部状態を時系列に蓄積する内部監視手段、
前記情報処理システムの障害を判定する障害判定手段、
として機能させるためのプログラムであって、
前記障害判定手段は、
前記内部状態を内部メトリクスデータに変換する手段と、
所定の教師データを使用した機械学習により取得された障害判定条件が設定される判定器であって、前記内部メトリクスデータを入力として受け取り、前記情報処理システムの障害に係る判定結果を出力する判定器を含み、
前記所定の教師データは、
外部メトリクスデータの値を出力とし、該値に時間的に対応する内部メトリクスデータの値を入力とする教師データであって、
前記外部メトリクスデータは、
所定の情報処理システムに対して定期的に実行したアクセスに対する応答の成否に係るメトリクスの時系列情報であり、
前記内部メトリクスデータは、
前記所定の情報処理システムを構成する各要素の内部状態に係るメトリクスの時系列情報である、
プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017052127A JP6907622B2 (ja) | 2017-03-17 | 2017-03-17 | 障害監視装置、障害監視システムおよびプログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017052127A JP6907622B2 (ja) | 2017-03-17 | 2017-03-17 | 障害監視装置、障害監視システムおよびプログラム |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018156348A true JP2018156348A (ja) | 2018-10-04 |
| JP6907622B2 JP6907622B2 (ja) | 2021-07-21 |
Family
ID=63715643
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017052127A Active JP6907622B2 (ja) | 2017-03-17 | 2017-03-17 | 障害監視装置、障害監視システムおよびプログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6907622B2 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020140317A (ja) * | 2019-02-27 | 2020-09-03 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、プログラム、及び学習済みモデル |
| JP2021128538A (ja) * | 2020-02-13 | 2021-09-02 | 日本電信電話株式会社 | 障害要因推定装置及び障害要因推定方法 |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000029745A (ja) * | 1998-07-10 | 2000-01-28 | Ntt Data Corp | 障害検知方法、コンピュータシステム及び構成装置、記録媒体 |
| JP2014041390A (ja) * | 2010-11-16 | 2014-03-06 | Hitachi Ltd | 設計・開発支援システム |
| JP2015007886A (ja) * | 2013-06-25 | 2015-01-15 | 日本電気株式会社 | 運用管理処理検証装置、運用管理システム、運用管理処理検証方法、および、コンピュータ・プログラム |
| JP2015011365A (ja) * | 2013-06-26 | 2015-01-19 | 日本電信電話株式会社 | プロビジョニング装置、システム、プロビジョニング方法、および、プロビジョニングプログラム |
| JP2016015111A (ja) * | 2014-06-13 | 2016-01-28 | 富士通株式会社 | 評価プログラム、評価方法、および評価装置 |
-
2017
- 2017-03-17 JP JP2017052127A patent/JP6907622B2/ja active Active
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2000029745A (ja) * | 1998-07-10 | 2000-01-28 | Ntt Data Corp | 障害検知方法、コンピュータシステム及び構成装置、記録媒体 |
| JP2014041390A (ja) * | 2010-11-16 | 2014-03-06 | Hitachi Ltd | 設計・開発支援システム |
| JP2015007886A (ja) * | 2013-06-25 | 2015-01-15 | 日本電気株式会社 | 運用管理処理検証装置、運用管理システム、運用管理処理検証方法、および、コンピュータ・プログラム |
| JP2015011365A (ja) * | 2013-06-26 | 2015-01-19 | 日本電信電話株式会社 | プロビジョニング装置、システム、プロビジョニング方法、および、プロビジョニングプログラム |
| JP2016015111A (ja) * | 2014-06-13 | 2016-01-28 | 富士通株式会社 | 評価プログラム、評価方法、および評価装置 |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020140317A (ja) * | 2019-02-27 | 2020-09-03 | レノボ・シンガポール・プライベート・リミテッド | 電子機器、制御方法、プログラム、及び学習済みモデル |
| JP2021128538A (ja) * | 2020-02-13 | 2021-09-02 | 日本電信電話株式会社 | 障害要因推定装置及び障害要因推定方法 |
| JP7384063B2 (ja) | 2020-02-13 | 2023-11-21 | 日本電信電話株式会社 | 障害要因推定装置及び障害要因推定方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| JP6907622B2 (ja) | 2021-07-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10831579B2 (en) | Error detecting device and error detecting method for detecting failure of hierarchical system, computer readable recording medium, and computer program product | |
| US20230016199A1 (en) | Root cause detection of anomalous behavior using network relationships and event correlation | |
| US8930757B2 (en) | Operations management apparatus, operations management method and program | |
| US9672085B2 (en) | Adaptive fault diagnosis | |
| US8601319B2 (en) | Method and apparatus for cause analysis involving configuration changes | |
| JP3922375B2 (ja) | 異常検出システム及びその方法 | |
| US20210064500A1 (en) | System and Method for Detecting Anomalies by Discovering Sequences in Log Entries | |
| US8656219B2 (en) | System and method for determination of the root cause of an overall failure of a business application service | |
| US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
| CN106789306B (zh) | 通信设备软件故障检测收集恢复方法和系统 | |
| Chen et al. | Graph-based incident aggregation for large-scale online service systems | |
| CN110489260B (zh) | 故障识别方法、装置及bmc | |
| CN116684256B (zh) | 节点故障监测方法、装置、系统、电子设备及存储介质 | |
| US20150113337A1 (en) | Failure symptom report device and method for detecting failure symptom | |
| GB2517147A (en) | Performance metrics of a computer system | |
| US10938623B2 (en) | Computing element failure identification mechanism | |
| US12057996B2 (en) | Combination rules creation device, method and program | |
| US8601318B2 (en) | Method, apparatus and computer program product for rule-based directed problem resolution for servers with scalable proactive monitoring | |
| JP6907622B2 (ja) | 障害監視装置、障害監視システムおよびプログラム | |
| US9443196B1 (en) | Method and apparatus for problem analysis using a causal map | |
| CN114490237B (zh) | 基于多数据来源的运维监测方法及装置 | |
| EP3756310B1 (en) | Method and first node for managing transmission of probe messages | |
| US20070086350A1 (en) | Method, system, and computer program product for providing failure detection with minimal bandwidth usage | |
| AU2014200806B1 (en) | Adaptive fault diagnosis | |
| CN118759873A (zh) | 用于智能家居系统的控制方法及装置、电子设备、智能家居系统 |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20191220 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201125 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20201201 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210121 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20210601 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20210614 |
|
| R151 | Written notification of patent or utility model registration |
Ref document number: 6907622 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |