[go: up one dir, main page]

JP2011197817A - Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device - Google Patents

Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device Download PDF

Info

Publication number
JP2011197817A
JP2011197817A JP2010061524A JP2010061524A JP2011197817A JP 2011197817 A JP2011197817 A JP 2011197817A JP 2010061524 A JP2010061524 A JP 2010061524A JP 2010061524 A JP2010061524 A JP 2010061524A JP 2011197817 A JP2011197817 A JP 2011197817A
Authority
JP
Japan
Prior art keywords
monitoring
condition
execution environment
service execution
performance information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2010061524A
Other languages
Japanese (ja)
Inventor
Motoo Kawamura
元夫 河村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010061524A priority Critical patent/JP2011197817A/en
Publication of JP2011197817A publication Critical patent/JP2011197817A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Test And Diagnosis Of Digital Computers (AREA)
  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a monitoring system, for enabling a device user to appropriately correct a monitoring rule without having any huge knowledge or experience related to a service execution environment, or the like.SOLUTION: The monitoring system includes: an analyzing part 11 for determining whether the state of a service execution environment 30 satisfies each monitoring condition of a monitoring rule; and a manager device 10 for detecting the difference of each determination, and for announcing monitoring failure showing that monitoring setting concerning each monitoring condition is unsuitable. The manager device 10 includes: an analysis history storage part 19 for respectively storing the state of a service execution environment 30 (each performance information) corresponding to each monitoring condition used for each determination as a history; and a condition generation part 18 for, when a plurality of respective monitoring conditions are different determination results, calculating a threshold for setting the plurality of respective monitoring conditions to the same determination result based on the history of the performance information of the analysis history storage part 19, and for generating this as monitoring conditions related to the correction of the monitoring failure.

Description

本発明は、サービス実行環境において所定のアプリケーションを実行する装置の運用条件を監視するシステムに関し、特に、実環境に合わせた監視設定を成し得る監視システム、監視装置、サービス実行環境の監視方法、及び監視装置用プログラムに関する。   The present invention relates to a system for monitoring the operating conditions of a device that executes a predetermined application in a service execution environment, and in particular, a monitoring system, a monitoring device, and a service execution environment monitoring method capable of performing monitoring settings according to the actual environment, And a monitoring device program.

各種サーバ群などの監視対象を統合的に管理及び監視する汎用の監視システム(運用監視技術)にあっては、「監視」「分析」「対処」という自律のループをいかに正しく実行処理するかが大きな課題となっている。その中でも、分析結果の正しさを検証する手法は実現されておらず、運用を継続することによって分析結果が適正なものになっていくこと、即ち、監視設定が自動最適化されることが求められている。   In a general-purpose monitoring system (operation monitoring technology) that comprehensively manages and monitors monitoring targets such as various server groups, how to properly execute an autonomous loop of "monitoring", "analysis", and "handling" It has become a big issue. Among them, there is no method to verify the correctness of the analysis results, and it is required that the analysis results become appropriate by continuing operation, that is, the monitoring settings are automatically optimized. It has been.

そのためには、監視設定が適切になされているか否かを監視システム自体が評価して管理者に変更を促す、又は監視設定を自動修正する必要がある。   For this purpose, it is necessary for the monitoring system itself to evaluate whether or not the monitoring setting is appropriately made and to prompt the administrator to make a change or to automatically correct the monitoring setting.

ここで、監視設定が適切になされているか否かを監視システム自体が評価するためには、本当の障害が発生しているのか、又は監視設定が適切ではない“監視不良状態”であるのかを監視システムが区別できなければならない。   Here, in order for the monitoring system itself to evaluate whether or not the monitoring setting is properly made, whether the real failure has occurred or whether the monitoring setting is not appropriate is a “monitoring failure state”. The monitoring system must be distinguishable.

上記のような監視条件の妥当性を確認する監視システムの関連技術として、例えば以下に示す特許文献1、特許文献2などが挙げられる。   As related technologies of the monitoring system for confirming the validity of the monitoring conditions as described above, for example, Patent Document 1 and Patent Document 2 shown below can be cited.

この内、特許文献1には、互いに異なる複数組の処理ルール(条件)に基づいて複数組の情報集約を行うことにより、異常判定の信頼性を向上させて異常レベルの判定等を可能にした火災警報装置に関する技術が開示されている。
この特許文献1では、処理手段が、複数組の処理ルールに対応した複数組の関数値を求めると共に、複数組の関数値毎に情報集約した複数の火災情報を生成する。判定手段が、複数の火災情報に基づいて異常判定を行い、角度を変えた異なる処理ルールに基づく2回目の情報集約により、1回目の異常判定結果を確認すると共に、複数組の火災情報に基づいて最終的な異常判定結果とする。
このような特許文献1では、1回目の関数処理後に異常時の処理ルールを用いて2回目の関数処理を行い、1回目の処理の妥当性を評価するようにして、複数の条件で異常判定を行うことで判定精度を向上させる。
Among these, in Patent Document 1, a plurality of sets of information are aggregated based on different sets of processing rules (conditions), thereby improving the reliability of abnormality determination and enabling determination of abnormality level and the like. Techniques relating to fire alarm devices are disclosed.
In this Patent Document 1, the processing means obtains a plurality of sets of function values corresponding to a plurality of sets of processing rules, and generates a plurality of fire information in which information is aggregated for each of the plurality of sets of function values. The determination means performs abnormality determination based on a plurality of fire information, confirms the first abnormality determination result by the second information aggregation based on different processing rules with different angles, and based on a plurality of sets of fire information The final abnormality judgment result.
In such a patent document 1, after the first function processing, the second function processing is performed using the processing rule at the time of abnormality, and the validity of the first processing is evaluated, and abnormality determination is performed under a plurality of conditions. To improve the determination accuracy.

又、特許文献2では、監視員が評価する評価結果と判定手段の判定結果とを比較することで、整合性を改善する(正答率が向上する)カメラ監視システムが開示されている。
具体的には、この特許文献2のカメラ監視システムでは、まず、評価入力手段から入力された評価結果と、検出手段の第1の検出動作パラメータを含む第1の判定条件により判定手段が弁別して判定した第1の判定結果とを、制御手段が比較照合すると共に、正検出でなかった場合には、更に第2の検出動作パラメータを含む第2の判定条件により前記判定手段が弁別して判定した第2の判定結果と前記入力された評価結果とを比較し、前記第2の判定結果が前記正検出に該当するものであれば、次回の判定条件として、前記第1の判定条件(第1車速データにかかる測定条件:第1測定区間距離と第1測定頻度)から前記第2の判定条件(第2車速データにかかる測定条件:第2測定区間距離と第2測定頻度)に変更する制御を行う構成となっている。
Patent Document 2 discloses a camera monitoring system that improves the consistency (increases the correct answer rate) by comparing the evaluation result evaluated by the monitoring person with the determination result of the determining means.
Specifically, in the camera monitoring system disclosed in Patent Document 2, first, the determination unit discriminates based on the evaluation result input from the evaluation input unit and the first determination condition including the first detection operation parameter of the detection unit. The control means compares and verifies the determined first determination result, and if it is not a positive detection, the determination means discriminates and determines based on a second determination condition including a second detection operation parameter. The second determination result is compared with the inputted evaluation result, and if the second determination result corresponds to the positive detection, the first determination condition (first Control to change from measurement condition for vehicle speed data: first measurement section distance and first measurement frequency) to second determination condition (measurement condition for second vehicle speed data: second measurement section distance and second measurement frequency) Configuration to do You have me.

例えば、監視員がイベントに対して「誤検出」または「未検出」と評価した場合、制御手段は、ログテーブル(第2のテーブル)を参照して「正検出」を行った判定条件(車速データにかかる測定条件:測定区間距離と測定頻度)を探し出し、その正検出の判定条件を次回からの判定条件にする。   For example, when the monitoring person evaluates the event as “false detection” or “not detected”, the control means refers to the log table (second table) and determines the determination condition (vehicle speed) (Measurement conditions concerning data: measurement section distance and measurement frequency) are determined, and the determination condition of the positive detection is set as the determination condition from the next time.

ここで、車両の走行速度は、測定区間距離、測定頻度の組合せからなる判定条件があるので、それに対応して幾つかの異なった測定結果を判定手段にかかるテーブル(第1テーブル)に有する。
例えば、特許文献2の段落番号〔0056〕に示すように、判定に用いるログテーブル(第2テーブル)は、テーブル(第1テーブル)から得られる第1測定区間距離と第1測定頻度とによる第1車速データ(車群速度)、第2測定区間距離と第2測定頻度とによる第2車速データ(車群速度)、第3測定区間距離と第3測定頻度とによる第3車速データ(車群速度)、………、等のように、測定頻度、測定区間距離などのパラメータ(測 定条件)の変化に応じた異なる車速データ群を有する。
Here, since the traveling speed of the vehicle has a determination condition including a combination of the measurement section distance and the measurement frequency, the table (first table) having several different measurement results corresponding to the determination condition is included.
For example, as shown in paragraph number [0056] of Patent Document 2, the log table (second table) used for determination is the first measurement interval distance obtained from the table (first table) and the first measurement frequency. 1 vehicle speed data (vehicle group speed), second vehicle speed data (vehicle group speed) based on the second measurement section distance and the second measurement frequency, third vehicle speed data (vehicle group) based on the third measurement section distance and the third measurement frequency (Velocity), ..., etc., and different vehicle speed data groups corresponding to changes in parameters (measurement conditions) such as measurement frequency and measurement section distance.

この内、第1車速データを用いる設定にした場合、判定手段は、この設定に従う第1車速データと予め別に設定されている「低速」「渋滞」などの判定基準の一つである「車群速度が一定値以下の時を渋滞とする」の一定値とを比較し、例えば「渋滞」の異常事象と判定する。
制御手段は、「渋滞」の異常事象の警報と、第1車速データにかかる測定条件(第1測定区間距離と第1測定頻度)を車速データの判定条件に設定したことと、上記各第1車速データ、第2車速データ、第3車速データ(車群速度)、………を取得する。
Of these, when the first vehicle speed data is set to be used, the determination means is “vehicle group” which is one of the determination criteria such as “low speed” and “congestion” set separately from the first vehicle speed data according to this setting. Compared with a fixed value of “congestion when speed is below a certain value”, for example, it is determined as an abnormal event of “congestion”.
The control means sets an alarm for an abnormal event of “traffic jam” and measurement conditions (first measurement section distance and first measurement frequency) relating to the first vehicle speed data as determination conditions for the vehicle speed data, Vehicle speed data, second vehicle speed data, third vehicle speed data (vehicle group speed), and so on are acquired.

制御手段は、これらの判定条件(測定条件)、車速データ及び警報、異常事象の判定条件の判定結果及び監視員の評価(監視員が監視モニタの映像から経験的感覚に基づいて「正検出」「誤検出」「未検出」で評価した結果)、テーブルにリストされている判定条件候補及び車速等画像処理データを受信し、時刻情報(タイムタグ)と共にログテーブルに記憶する。
そして、制御手段は、ログテーブルを参照して、次回以降の判定条件を選定する制御を行う。
The control means uses these judgment conditions (measurement conditions), vehicle speed data and alarms, judgment results of abnormal event judgment conditions, and the evaluation of the supervisor (the "superdetection" is based on the empirical sense from the video of the monitor by the supervisor. As a result of evaluation based on “false detection” and “not detected”, image processing data such as determination condition candidates and vehicle speed listed in the table are received and stored together with time information (time tag) in the log table.
And a control means performs control which selects the determination conditions after the next with reference to a log table.

ここで、判定条件の選定は、事象判定条件のパラメータ(図4に示すテーブルの検出動作パラメータの事象判定条件)である「測定区間・距離」「測定頻度」「判定使用」、及び抽出動作パラメータの特徴抽出方法である「アルゴリズム」「スレショルド」「追跡ポイント」等の判定対象(例えば車速データ)の変更であり、「渋滞」の判定基準の一つである「車群速度が一定値以下の時を渋滞とする」を変更するものではない(特許文献2には「渋滞」の判定基準の開示はない)。   Here, the selection of the determination condition includes “measurement interval / distance”, “measurement frequency”, “determination use”, which are parameters of the event determination condition (event determination conditions of the detection operation parameter in the table shown in FIG. 4), and extraction operation parameters. This is a change of the judgment target (for example, vehicle speed data) such as “algorithm”, “threshold”, “tracking point”, etc. This does not change “the time is a traffic jam” (Patent Document 2 does not disclose a judgment criterion for “car jam”).

更に、前記制御手段は、イベント毎の監視員の評価結果と、そのイベントに対応する時の各判定条件とその推定評価結果を統計処理し、「正検出」に対応する回数が多い判定条件をログテーブルから探し出し、次回以降の判定に、その判定条件を用いる。   Further, the control means statistically processes the evaluation result of the observer for each event, each determination condition corresponding to the event, and the estimated evaluation result, and determines a determination condition having a large number of times corresponding to “correct detection”. Search from the log table and use the determination conditions for the next and subsequent determinations.

又、前記制御手段は、複数の判断条件から得られる判定結果(例えば「渋滞」)と監視員の判定結果(例えば「誤判定」の評価結果)とを集計して比較すると、複数の判定基準で「渋滞」の判定結果が多い結果が得られ、カメラ監視システムの判定結果が監視員のそれより妥当であると推定される場合、監視員の判定、評価を見直す勧告情報、を監視モニタで表示して通報する。   Further, the control means aggregates and compares the determination results (for example, “congestion”) obtained from a plurality of determination conditions and the determination results of the monitor (for example, the evaluation result of “false determination”), thereby comparing a plurality of determination criteria If the result of the judgment of “traffic jam” is large and the judgment result of the camera surveillance system is estimated to be more appropriate than that of the surveillance staff, the surveillance monitor judges and evaluates the recommendation information to review the evaluation. Display and report.

更に、制御手段は、前記第1又は第2の検出動作パラメータとの組合せを代えることにより、複数の判定条件候補を設定しておき、その各判定条件候補による判定結果を集計して多数決を取り、その結果、例えば「渋滞」を選定し監視員に「渋滞」を通知する。   Further, the control means sets a plurality of judgment condition candidates by changing the combination with the first or second detection operation parameter, and collects the judgment results of the respective judgment condition candidates to take a majority vote. As a result, for example, “congestion” is selected, and the monitoring staff is notified of “congestion”.

特開平06−318292号公報Japanese Patent Laid-Open No. 06-318292 特開2005−176077号公報JP 2005-176077 A

しかしながら、上記特許文献1では、2回目の関数処理によって1回目の処理の妥当性が低いと評価した場合に、1回目の処理に用いた処理ルールは修正対象とはなっておらず、1回目の処理に用いた処理ルールを修正することについて何の開示も無く、示唆さえされていない。   However, in Patent Document 1, when it is evaluated that the validity of the first process is low by the second function process, the processing rule used for the first process is not a correction target, and the first process. There is no disclosure or even suggestion of amending the processing rules used in this processing.

即ち、この特許文献1では、実環境に合わせて監視設定を自動最適化することはできない内容となっている。このため、ある状態において1回目の処理と2回目の処理とで判断結果が一致しなかった場合、それ以降に同じ状態となったとしても、1回目の処理結果と2回目の処理結果は不一致となったままである。   That is, in this patent document 1, the monitoring setting cannot be automatically optimized according to the actual environment. For this reason, if the determination result does not match between the first process and the second process in a certain state, the first process result and the second process result do not match even if the determination result is the same after that. It remains.

このように、特許文献1では、監視ルール全体が管理者による修正対象にならず、条件の変更が適正に行われないという不都合があった。   As described above, in Patent Document 1, the entire monitoring rule is not subject to correction by the administrator, and there is a problem in that the condition is not properly changed.

又、特許文献2では、監視員の経験的感覚に基づき評価結果を入力することを前提とするものであり、判定には誤差が含まれ、判定評価は監視員の経験的感覚に依存せざるを得ないものとなっている。このため、人が下した評価に基づいて条件の変更を行うため、条件の変更が適切に行われないという不都合があった。   Patent Document 2 is based on the premise that an evaluation result is input based on an empirical feeling of a monitoring person, and an error is included in the determination, and the evaluation is not dependent on the empirical feeling of the monitoring person. It has become something that does not get. For this reason, since the condition is changed based on the evaluation made by the person, there is a disadvantage that the condition is not changed appropriately.

更に、特許文献2では、判定条件の選定は、事象判定条件のパラメータ(テーブルの検出動作パラメータの事象判定条件及び抽出動作パラメータの特徴抽出方法等)の判定対象の変更であって、判定基準である「車群速度が一定値以下の時を渋滞とする」を変更するものではないため、判定基準の変更が適切に行われないという不都合があった。   Further, in Patent Document 2, the selection of the determination condition is a change of the determination target of the event determination condition parameters (such as the event detection condition of the detection operation parameter of the table and the feature extraction method of the extraction operation parameter). Since it does not change a certain “congestion when the vehicle group speed is below a certain value”, there is a disadvantage that the determination criterion is not changed appropriately.

更に、判定条件と推定評価結果を統計処理したり、多数決の結果を採ったりしたとしても、人が下した評価が加味されるため、前述した不都合は解消されない。   Further, even if the determination condition and the estimated evaluation result are statistically processed or the result of majority decision is taken, since the evaluation made by the person is taken into account, the above-described inconveniences are not solved.

又、判定部による判定結果が監視員の評価結果よりも妥当であることが判明したとしても、監視員に再検討を依頼するのみであり、当該再検討により設定条件を修正するためには、どの設定条件の項目をどのような値に設定変更(修正)すれば適切に監視条件を修正できるかについては、装置使用者(システム管理者)がサービス実行環境に関する膨大な知識や経験が必要であった。   In addition, even if it is found that the determination result by the determination unit is more appropriate than the evaluation result of the monitoring staff, it is only requested to review the monitoring staff. The device user (system administrator) needs vast knowledge and experience about the service execution environment to determine which setting condition item should be changed (corrected) to what value to properly modify the monitoring condition. there were.

本発明の目的は、上述の関連技術の課題を解決することにあり、監視設定が適切になされているか否かを装置自体が評価して管理者に変更を促すと共に、前記監視設定による監視不良の発生を有効に改善することを可能とした監視システム、監視装置、サービス実行環境の監視方法、及び監視装置用プログラムを提供することにある。   An object of the present invention is to solve the above-described problems of the related art, and the apparatus itself evaluates whether or not the monitoring setting is appropriately made and prompts the administrator to make a change. It is an object of the present invention to provide a monitoring system, a monitoring apparatus, a service execution environment monitoring method, and a monitoring apparatus program that can effectively improve the occurrence of the problem.

上記目的を達成するため、本発明の監視システムは、監視対象となるサービス実行環境の状態を把握するためのエージェント装置と、前記サービス実行環境の監視ルールを管理するためのマネージャ装置とを有し、前記マネージャ装置が、前記サービス実行環境の状態が前記監視ルールに定義された複数の各条件を満たすか否かを判定する分析部を備えると共に、この複数の各監視条件での各判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知可能とした監視システムであって、前記マネージャ装置が、前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積部と、前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな条件として生成する条件生成部と、を備え
る、という構成を採っている。
In order to achieve the above object, a monitoring system of the present invention has an agent device for grasping the state of a service execution environment to be monitored, and a manager device for managing the monitoring rules of the service execution environment. The manager device includes an analysis unit that determines whether the state of the service execution environment satisfies a plurality of conditions defined in the monitoring rule, and a difference between the determinations in the plurality of monitoring conditions The monitoring system can notify a monitoring failure indicating that the monitoring setting related to each monitoring condition is inappropriate by detecting the monitoring condition, and the manager device uses each monitoring condition used for each determination. Each of the plurality of monitoring conditions is different from an analysis history storage unit that stores each performance information as a history corresponding to the state of the service execution environment corresponding to each When a predetermined result is obtained, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result, and the threshold value is corrected for the monitoring failure. And a condition generation unit that generates as a new condition.

上記目的を達成するため、本発明の監視装置は、監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理する機能と、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定する機能と、この複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知する機能とを備えた監視装置であって、前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積部を備えると共に、前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成部を備える、という構成を採っている。   In order to achieve the above object, the monitoring device of the present invention has a function of managing monitoring rules of the service execution environment via an agent device for grasping the state of the service execution environment to be monitored, and the service execution environment A function for determining whether or not the state of each of the monitoring conditions satisfies a plurality of monitoring conditions defined in the monitoring rule, and a difference between the determinations in each of the plurality of monitoring conditions is applied to each monitoring condition. A monitoring device having a function of notifying a monitoring failure indicating that the monitoring setting is inappropriate, and each of the service execution environment states corresponding to each of the monitoring conditions used for each of the determinations An analysis history storage unit for storing each performance information as a history is provided, and when each of the plurality of monitoring conditions results in a different determination result, the performance information of the analysis history storage unit A configuration is provided that includes a condition generation unit that calculates a threshold value that results in the same determination result for each of the plurality of monitoring conditions based on a history, and generates the threshold value as a new monitoring condition for correcting the monitoring failure. Is adopted.

上記目的を達成するため、本発明のサービス実行環境の監視方法は、監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理し、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定し、この複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知可能としたサービス実行環境の監視方法であって、前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として分析履歴蓄積部が各々蓄積処理し、前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな条件として条件生成部が生成する、という構成を採っている。   To achieve the above object, the service execution environment monitoring method of the present invention manages the service execution environment monitoring rules via an agent device for grasping the status of the service execution environment to be monitored, and It is determined whether or not the state of the execution environment satisfies each of the plurality of monitoring conditions defined in the monitoring rule, and each monitoring condition is affected by detecting a difference in each of the plurality of monitoring conditions. A service execution environment monitoring method capable of notifying a monitoring failure indicating that the monitoring setting is inappropriate, wherein the service execution environment is in a state corresponding to each of the monitoring conditions used for each of the determinations. The analysis history storage unit stores each piece of performance information as a history, and when the plurality of monitoring conditions result in different determination results, the performance information of the analysis history storage unit is checked. Based on the above, the threshold value is calculated so that each of the plurality of monitoring conditions has the same determination result, and the condition generation unit generates the threshold value as a new condition for correcting the monitoring failure. Yes.

上記目的を達成するため、本発明の監視装置用プログラムは、監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理する機能と、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定する機能と、この複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知する機能とを備えた監視装置にあって、
前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積処理機能、および前記複数の各監視条件が異なる判定結果となる場合に前記分析履歴蓄積処理機能によって蓄積された前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出すると共にこのしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成機能を、コンピュータに実行させるように構成したことを特徴とする。
In order to achieve the above object, the program for a monitoring device of the present invention includes a function for managing a monitoring rule of the service execution environment via an agent device for grasping a state of the service execution environment to be monitored, and the service A function for determining whether the state of the execution environment satisfies a plurality of monitoring conditions defined in the monitoring rule and each monitoring condition by detecting a difference between the determinations in the plurality of monitoring conditions A monitoring device having a function of notifying a monitoring failure indicating that the monitoring setting is inappropriate.
An analysis history accumulation processing function for accumulating and processing each performance information as a history of the state of the service execution environment corresponding to each of the monitoring conditions used for each of the determinations, and determination results of the plurality of monitoring conditions being different And calculating a threshold value that results in the same determination result for each of the plurality of monitoring conditions based on the performance information history accumulated by the analysis history accumulation processing function. A condition generation function that is generated as a new monitoring condition related to the correction of the above is configured to be executed by a computer.

本発明によれば、分析履歴蓄積部に蓄積されている性能情報に基づいて監視条件の適切なしきい値を条件生成部が提示する構成としたので、監視設定が適切でないことを示す監視不良の状態下にあって監視条件の修正に際しては、監視設定が適切になされているか否かを装置自体が評価し当該監視条件の適切なしきい値を提示して管理者に変更を促すと共に、前記監視設定による監視不良の発生を有効に改善することが可能となり、これがため、装置使用者がサービス実行環境に関する膨大な知識や経験がなくても、監視ルールの修正を行うための適切な運用監視を行うことができるという優れた監視システム、監視装置、サービス実行環境の監視方法、及び監視装置用プログラムを提供することができる。   According to the present invention, since the condition generation unit presents an appropriate threshold value for the monitoring condition based on the performance information accumulated in the analysis history accumulation unit, the monitoring failure indicating that the monitoring setting is not appropriate. When the monitoring condition is corrected under the condition, the device itself evaluates whether or not the monitoring setting is appropriately performed, presents an appropriate threshold value of the monitoring condition, and prompts the administrator to change the monitoring condition. It is possible to effectively improve the occurrence of poor monitoring due to settings, and this enables proper operation monitoring to correct the monitoring rules without the equipment user having vast knowledge and experience about the service execution environment. An excellent monitoring system, a monitoring apparatus, a service execution environment monitoring method, and a monitoring apparatus program that can be performed can be provided.

本発明の一実施形態による監視システムの全体構成の一例を示すブロック図である。It is a block diagram which shows an example of the whole structure of the monitoring system by one Embodiment of this invention. 図1の監視システムにおける監視ルールのデータ構造の一例を示す説明図である。It is explanatory drawing which shows an example of the data structure of the monitoring rule in the monitoring system of FIG. 本発明の一実施形態による監視システムにおける動作手順の一例を示すフローチャートである。It is a flowchart which shows an example of the operation | movement procedure in the monitoring system by one Embodiment of this invention.

以下、本発明の一実施形態を添付図面に基づいて具体的に説明する。   Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings.

(監視システムの基本的構成)
先ず、監視システムの基本的構成について説明する。
本実施形態の監視システム1は、監視対象となるサービス実行環境30の状態を把握するためのエージェント装置20と、サービス実行環境30の監視ルールを管理するための監視装置としてのマネージャ装置10とを備えている。
(Basic configuration of monitoring system)
First, the basic configuration of the monitoring system will be described.
The monitoring system 1 of the present embodiment includes an agent device 20 for grasping the state of the service execution environment 30 to be monitored, and a manager device 10 as a monitoring device for managing the monitoring rules of the service execution environment 30. I have.

このマネージャ装置10は、前記サービス実行環境30の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定し、この複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知する機能を備えている。   The manager device 10 determines whether or not the state of the service execution environment 30 satisfies a plurality of monitoring conditions defined in the monitoring rule, and detects a difference in each determination under the plurality of monitoring conditions. By doing so, it has a function of notifying a monitoring failure indicating that the monitoring setting for each monitoring condition is inappropriate.

又、前記マネージャ装置10は、前記各判定に使用された各監視条件に対応する前記サービス実行環境30の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積部19を備えている。   In addition, the manager device 10 includes an analysis history storage unit 19 that stores each performance information as the history of the service execution environment 30 corresponding to each monitoring condition used for each determination.

更に、このマネージャ装置10は、複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部19の前記性能情報の履歴に基づいて複数の各監視条件が同一の判定結果となるしきい値を算出し、このしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成部18を備えている。   Further, the manager device 10 has the same determination result for each of the plurality of monitoring conditions based on the history of the performance information in the analysis history storage unit 19 when the plurality of monitoring conditions result in different determination results. A condition generation unit 18 is provided for calculating a threshold value and generating this threshold value as a new monitoring condition for correcting the monitoring failure.

この監視システム1における監視装置としてのマネージャ装置10は、監視対象となるサービス実行環境30の状態を把握するためのエージェント装置20を介してサービス実行環境30の監視ルールを管理し、当該サービス実行環境30の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定し、この複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知可能としている。   The manager device 10 as a monitoring device in the monitoring system 1 manages the monitoring rules of the service execution environment 30 via the agent device 20 for grasping the state of the service execution environment 30 to be monitored, and the service execution environment It is determined whether or not the state of 30 satisfies a plurality of monitoring conditions defined in the monitoring rule, and the monitoring according to each of the monitoring conditions is detected by detecting a difference in each determination under the plurality of monitoring conditions. It is possible to notify a monitoring failure indicating that the setting is inappropriate.

このような監視システム1におけるマネージャ装置10の基本的構成によれば、分析履歴蓄積部19に蓄積されている性能情報を元に条件の適切なしきい値を提示する条件生成部18が構成されるため、監視設定が適切でないことを示す監視不良の状態において条件の修正を行うような場合に、条件の適切なしきい値を提示でき、装置使用者がサービス実行環境30に関する膨大な知識や経験がなくても、監視ルールの修正を行い監視システムの適切な運用監視を行うことができる。   According to the basic configuration of the manager device 10 in such a monitoring system 1, the condition generation unit 18 that presents an appropriate threshold value of the condition based on the performance information stored in the analysis history storage unit 19 is configured. Therefore, when the condition is corrected in the state of poor monitoring indicating that the monitoring setting is not appropriate, an appropriate threshold value for the condition can be presented, and the device user has vast knowledge and experience regarding the service execution environment 30. Even without this, it is possible to correct the monitoring rules and perform appropriate operation monitoring of the monitoring system.

(監視システムの全体構成)
図1に、本発明における第1実施形態の監視システム1の全体構成の一例を示す。
(Overall configuration of monitoring system)
In FIG. 1, an example of the whole structure of the monitoring system 1 of 1st Embodiment in this invention is shown.

この図1に示すように、本実施の形態の監視システム1は、監視対象となるサービス実行環境30と、この監視対象となるサービス実行環境30の状態を把握するためのエージェント装置20と、前記サービス実行環境30の監視ルールを管理するための監視装置としてのマネージャ装置10とを備えている。   As shown in FIG. 1, the monitoring system 1 according to the present embodiment includes a service execution environment 30 to be monitored, an agent device 20 for grasping the state of the service execution environment 30 to be monitored, And a manager device 10 as a monitoring device for managing the monitoring rules of the service execution environment 30.

サービス実行環境30は、監視対象となるアプリケーションなどの種々のサービス実行環境を含んでいる。   The service execution environment 30 includes various service execution environments such as applications to be monitored.

エージェント装置20は、サービス実行環境30から性能情報を取り出すとともにこの性能情報を監視しこれをマネージャ装置10に対して送信する監視部21と、マネージャ装置10から送られてくる各種コマンド(例えば障害解消コマンド:障害解消命令など)を受信すると共にこの各種コマンドをサービス実行環境30に対して送信しこれによる動作を実行させるための処理動作を制御する制御部22とを備えている。   The agent device 20 extracts performance information from the service execution environment 30 and monitors the performance information and transmits the performance information to the manager device 10, and various commands (for example, failure resolution) sent from the manager device 10. And a control unit 22 that controls the processing operation for transmitting the various commands to the service execution environment 30 and executing the operation according to the command.

この内、監視部21は、サービス実行環境30から性能情報を取出すと共に、この性能情報に関する情報をイベントとして生成しマネージャ装置10に通知する機能を備えている。   Among these, the monitoring unit 21 has a function of extracting performance information from the service execution environment 30, generating information related to the performance information as an event, and notifying the manager device 10.

制御部22は、マネージャ装置10から障害解消のためのアクションとしてのコマンドを受取ると共に、サービス実行環境30にそのコマンドを発行し障害を解消する機能を備えている。   The control unit 22 has a function of receiving a command as an action for solving a failure from the manager device 10 and issuing the command to the service execution environment 30 to eliminate the failure.

このマネージャ装置10は、サービス実行環境30の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定し、この複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知する機能を備えている。   The manager device 10 determines whether or not the state of the service execution environment 30 satisfies a plurality of monitoring conditions defined in the monitoring rule, and detects a difference in each determination under the plurality of monitoring conditions. Thus, a function of notifying a monitoring failure indicating that the monitoring setting related to each monitoring condition is inappropriate is provided.

又、前記マネージャ装置10は、前記各判定に使用された前記各監視条件に各々対応するサービス実行環境30の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積部19と、前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部19の性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな条件として生成する条件生成部18と、を備えている。   In addition, the manager device 10 includes an analysis history storage unit 19 that stores each performance information as a history, which is the state of the service execution environment 30 corresponding to each of the monitoring conditions used for each determination, When each of the monitoring conditions has a different determination result, a threshold value for calculating the same determination result for each of the plurality of monitoring conditions is calculated based on the performance information history of the analysis history storage unit 19. Is generated as a new condition for correcting the monitoring failure.

更に、マネージャ装置10は、エージェント装置20からサービス実行環境30の性能情報を示すイベントを取得してこれを分析する分析部11と、前記サービス実行環境30の状態にかかる監視ルールを蓄積する監視ルール蓄積部12と、監視ルールの監視設定が適切でない監視不良かどうかを検証する監視不良検証部13と、監視ルールに含まれる主条件が障害アリかどうかを示す障害判定結果情報を表示する障害表示部14とを備えている。   Further, the manager device 10 acquires an event indicating performance information of the service execution environment 30 from the agent device 20 and analyzes the event, and a monitoring rule for accumulating a monitoring rule relating to the state of the service execution environment 30 The storage unit 12, the monitoring failure verification unit 13 that verifies whether the monitoring setting of the monitoring rule is not appropriate, and the failure display that displays failure determination result information indicating whether the main condition included in the monitoring rule is a failure ant Part 14.

このマネージャ装置10は、更に、監視設定が適切でないことを示す監視不良警告を表示する監視不良表示部15と、監視ルールを更新する監視ルール更新部16と、障害解消のためのコマンドを発行するコマンド発行部17と、監視ルールにかかる主条件及び副条件を最適な条件に修正すると共にこの修正後の副条件を生成する条件生成部18と、サービス実行環境30の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積部19とを備えている。   The manager device 10 further issues a monitoring failure display unit 15 that displays a monitoring failure warning indicating that the monitoring setting is not appropriate, a monitoring rule update unit 16 that updates the monitoring rule, and a command for solving the failure. The command issuing unit 17, the condition generating unit 18 that corrects the main condition and the sub-condition for the monitoring rule to the optimum conditions and generates the corrected sub-condition, and each performance information that is the state of the service execution environment 30 An analysis history storage unit 19 for storing each history is provided.

この内、分析部11は、エージェント装置20からイベントを受取り、監視ルール蓄積部12に蓄積されている監視ルールの条件を満たすかどうかを判定する条件判定機能を備えている。   Among these, the analysis unit 11 has a condition determination function that receives an event from the agent device 20 and determines whether the conditions of the monitoring rules stored in the monitoring rule storage unit 12 are satisfied.

又、分析部11は、前記監視条件を満たす場合(障害アリと判定された場合)、当該判定にかかる障害判定結果情報を監視不良検証部13に送信するとともに、これを障害表示部14にも送信し当該障害表示部14により障害がある旨の画面表示を行って管理者にそれを伝える機能を備えている。   In addition, when the monitoring condition is satisfied (when it is determined as a failure ant), the analysis unit 11 transmits failure determination result information related to the determination to the monitoring failure verification unit 13, and also transmits this to the failure display unit 14. It has a function of transmitting and displaying a screen indicating that there is a failure by the failure display unit 14 and notifying the administrator.

監視ルール蓄積部12は、障害の判定のための複数の条件を保持する監視ルールを格納し管理する。   The monitoring rule accumulation unit 12 stores and manages monitoring rules that hold a plurality of conditions for determining a failure.

監視不良検証部13は、分析部11からの障害判定結果情報を受取り、複数存在する条件の判定結果が一致しない場合には、監視設定が適切でないことを示す監視不良警告を監視不良表示部15に表示するようにする機能を備えている。   The monitoring failure verification unit 13 receives the failure determination result information from the analysis unit 11 and, when the determination results of a plurality of conditions do not match, a monitoring failure warning indicating that the monitoring setting is not appropriate is displayed on the monitoring failure display unit 15. It has a function to be displayed on.

又、監視不良検証部13は、判定に使用した性能情報を分析履歴蓄積部19に格納する機能を備えている。
更に、監視不良検証部13は、監視不良警告が発生し監視ルールを変更する必要が生じた場合には、条件生成部18が分析履歴蓄積部19に蓄積されている性能情報の履歴を元に監視ルールの閾値を変更して監視ルール更新部16に表示するようにする機能を備えている。
The monitoring failure verification unit 13 has a function of storing performance information used for determination in the analysis history storage unit 19.
Furthermore, when a monitoring failure warning occurs and the monitoring rule needs to be changed, the monitoring failure verification unit 13 is based on the history of performance information stored in the analysis history storage unit 19 by the condition generation unit 18. A function of changing the threshold value of the monitoring rule and displaying it on the monitoring rule update unit 16 is provided.

監視ルール更新部16は、この監視不良警告が発生し監視ルールを変更する必要が生じた場合に稼働し、監視ルール蓄積部12に蓄積されている監視ルールを変更することでこれを更新する機能を備えている。   The monitoring rule update unit 16 is activated when the monitoring failure warning occurs and the monitoring rule needs to be changed, and the monitoring rule update unit 16 updates the monitoring rule stored in the monitoring rule storage unit 12 by updating it. It has.

更に、監視ルール更新部16は、しきい値が変更された監視ルールを確認できるように管理者に対して提示する機能、しきい値の変更が必要となる場合に管理者の操作入力に基づいて当該監視ルールにかかるしきい値に変更を加えこの変更しきい値を監視ルール蓄積部12に蓄積するようにする機能を備えている。   Furthermore, the monitoring rule update unit 16 is based on a function that is presented to the administrator so that the monitoring rule whose threshold has been changed can be confirmed, and when the threshold needs to be changed, based on the operation input of the administrator. The monitoring threshold storage unit 12 has a function of changing the threshold value for the monitoring rule and storing the changed threshold value in the monitoring rule storage unit 12.

コマンド発行部17は、管理者の操作入力に基づく指令により、障害解消のためのアクションをコマンドとしてエージェント装置20に発行する機能を備えている。   The command issuing unit 17 has a function of issuing an action for solving a failure as a command to the agent device 20 according to a command based on an operation input by the administrator.

(条件生成部18の各種機能)
上記した条件生成部18は、複数の監視条件が主条件と1以上の副条件とを含む場合であって、前記主条件の判定結果と1つの前記副条件の判定結果とが異なる場合に、前記分析履歴蓄積部19の性能情報の履歴に基づいて前記主条件の判定結果と前記1つの副条件の判定結果とが同一となるような1つの副条件にかかる性能情報をしきい値として算出し、このしきい値を新たな1つの副条件として生成する機能を備えている。
(Various functions of the condition generation unit 18)
The condition generation unit 18 described above is a case where a plurality of monitoring conditions include a main condition and one or more subconditions, and when the determination result of the main condition is different from the determination result of one subcondition, Based on the performance information history of the analysis history storage unit 19, the performance information related to one sub condition is calculated as a threshold value so that the determination result of the main condition and the determination result of the one sub condition are the same. The threshold value is generated as a new subcondition.

この条件生成部18は、監視不良の場合には、前記1つの副条件の設定変更が必要であることを示す要設定変更情報(例えば図2に示すAUTO)を、前記1つの副条件に対応づけて前記分析履歴蓄積部19の対応箇所に書き込む機能を備えている。   In the case of a monitoring failure, the condition generation unit 18 corresponds to the one sub-condition with required setting change information (for example, AUTO shown in FIG. 2) indicating that the setting change of the one sub-condition is necessary. In addition, it has a function of writing in corresponding portions of the analysis history storage unit 19.

又、この条件生成部18は、サービス実行環境30の状態が前記主条件を満たす真となる判定結果となる場合に、分析履歴蓄積部19の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、サービス実行環境30の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えている。   Further, the condition generation unit 18 determines that the main condition is true based on the history of the performance information in the analysis history storage unit 19 when the state of the service execution environment 30 is a determination result that the main condition is true. If the performance information indicating the status of the service execution environment 30 is smaller than the sub-condition, the maximum value of the performance information is set. It has a function of calculating as a threshold value and generating this threshold value as a new subcondition.

更に、条件生成部18は、サービス実行環境30の状態が前記主条件を満たす真となる判定結果となる場合に、分析履歴蓄積部19の性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている副条件を取り出して比較し、サービス実行環境30の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えている。   Furthermore, the condition generation unit 18 makes the main condition true based on the performance information history of the analysis history storage unit 19 when the state of the service execution environment 30 is a determination result that the main condition is true. If the performance information indicating the status of the service execution environment 30 is larger than the sub-condition, the minimum value of the performance information is set. It has a function of calculating as a threshold value and generating this threshold value as a new subcondition.

又、条件生成部18は、サービス実行環境30の状態が前記主条件を満たさない偽となる判定結果となる場合に、分析履歴蓄積部19の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、サービス実行環境30の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えている。   In addition, the condition generation unit 18 determines that the main condition is false based on the history of the performance information in the analysis history storage unit 19 when the service execution environment 30 has a false determination result that does not satisfy the main condition. If the performance information indicating the status of the service execution environment 30 is smaller than this sub-condition, the minimum value of the performance information is set. It has a function of calculating as a threshold value and generating this threshold value as a new subcondition.

この条件生成部18は、サービス実行環境30の状態が前記主条件を満たさない偽となる判定結果となる場合に、分析履歴蓄積部19の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている副条件を取り出し、前記サービス実行環境30の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えている。   The condition generation unit 18 determines that the main condition is false based on the history of the performance information in the analysis history storage unit 19 when the service execution environment 30 is determined to be false that does not satisfy the main condition. If the performance condition information indicating the status of the service execution environment 30 is greater than the secondary condition, the maximum value of the performance information is determined. It has a function of calculating as a value and generating this threshold value as a new subcondition.

監視ルール更新部16は、前記新たな副条件を分析履歴蓄積部19の対応箇所に書き込んで情報更新を行うとともに、この新たな副条件を外部に告知する機能を備えている。   The monitoring rule update unit 16 has a function of writing the new sub-condition in the corresponding part of the analysis history storage unit 19 to update information and notifying the new sub-condition to the outside.

(分析履歴蓄積部19のデータ構造)
ここで、図2に示すように、監視ルール12aは、「番号」「ルール名称」「主条件」3つの副条件、アクションから成る。ここでは、副条件は3つとしているが、それに限定されることはなく任意の個数を取りうる。
図2に示す監視ルール12aのうち、最初の行の監視ルールは、3層構成のシステムのうちWebサーバのレスポンスを監視するルールの例であり、最初の行の監視ルールは、「アプリケーションのレスポンスが5000〔ms〕より大きい」とき障害と判定する主条件を備えている。
(Data structure of the analysis history storage unit 19)
Here, as shown in FIG. 2, the monitoring rule 12 a is composed of three subconditions and actions of “number”, “rule name”, and “main condition”. Here, although there are three subconditions, the number of subconditions is not limited to this, and an arbitrary number can be taken.
In the monitoring rule 12a shown in FIG. 2, the first line monitoring rule is an example of a rule for monitoring the response of the Web server in the three-layer system. The first line monitoring rule is “application response”. Has a main condition for determining a failure when “is greater than 5000 [ms]”.

更に、最初の行の監視ルールは、「Webサーバの負荷が80〔%〕より大きいとき」又は「Webサーバのセッション数が100より大きいとき」障害と判定する副条件1(第1の副条件)と、「APサーバの負荷が70〔%〕より大きいとき」又は「APサーバのセッション数が150より大きいとき」障害と判定する副条件2(第2の副条件)と、「 DBサーバの負荷が60〔%〕より大きいとき」 障害と判定する副条件3(第3の副条件)との3つの副条件を備えている。   Furthermore, the monitoring rule in the first line is that sub-condition 1 (first sub-condition) for determining a failure as “when the load of the Web server is greater than 80%” or “when the number of sessions of the Web server is greater than 100”. ), “When the load of the AP server is greater than 70%” or “when the number of sessions of the AP server is greater than 150”, sub-condition 2 (second sub-condition) for determining a failure, When the load is larger than 60 [%] ”, the sub-condition 3 (third sub-condition) for determining a failure is provided.

このように監視ルール12aは、障害状態を示す主条件と、主条件の状態を別の角度から表す複数の副条件とを備えている。
ここで、副条件には、閾値が数字のものとAUTO(数字)のものがあるが、前者は通常の閾値を示し、後者は数字がその時の閾値を示し、監視不良警告の状態の時、条件生成部18が分析履歴蓄積部19の蓄積情報から適切な閾値を自動的に生成し閾値である数字を変更することを示す。
また、本実施形態では副条件は単純な条件か、複数の単純な条件が論理和で結合されたものとする。
As described above, the monitoring rule 12a includes a main condition indicating a failure state and a plurality of subconditions representing the state of the main condition from different angles.
Here, there are sub-conditions in which the threshold is numeric and AUTO (numeric), the former indicates a normal threshold, the latter indicates the threshold at that time, and in the state of a monitoring failure warning, The condition generation unit 18 automatically generates an appropriate threshold value from the accumulated information in the analysis history storage unit 19 and changes the number as the threshold value.
In the present embodiment, the subcondition is a simple condition or a plurality of simple conditions are combined by a logical sum.

(全体的な動作説明)
次に、上述した監視システム1の全体的な動作について、図1乃至図3を参照して説明する。ここで、図3は、図1の監視システム1における動作手順の一例を示すフローチャートである。
(Overall operation description)
Next, the overall operation of the monitoring system 1 will be described with reference to FIGS. Here, FIG. 3 is a flowchart showing an example of an operation procedure in the monitoring system 1 of FIG.

本実施の形態に係る監視システム1にあっては、全体的な監視動作は、監視対象となるサービス実行環境30の状態を把握するため、エージェント装置20を介して前記サービス実行環境30の監視ルールをマネージャ装置10が管理する。このマネージャ装置10は、サービス実行環境30の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定し、この複数の各監視条件での各々の判定の違いを検出することで、当該各監視条件にかかる監視設定が不適切であることを示す監視不良を外部に向けて告知する機能を備えている。   In the monitoring system 1 according to this embodiment, the overall monitoring operation is to monitor the service execution environment 30 via the agent device 20 in order to grasp the state of the service execution environment 30 to be monitored. Is managed by the manager device 10. The manager device 10 determines whether or not the state of the service execution environment 30 satisfies a plurality of monitoring conditions defined in the monitoring rule, and detects a difference in each determination under the plurality of monitoring conditions. Thus, a function of notifying the outside of a monitoring failure indicating that the monitoring setting related to each monitoring condition is inappropriate is provided.

このサービス実行環境30に係る監視における全体の動作手順は、基本的手順として、先ず、前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境30の状態である各性能情報を履歴として分析履歴蓄積部19が各々蓄積処理する(図3に示すステップA23:分析履歴蓄積処理ステップ,分析履歴蓄積処理機能)。   The overall operation procedure in the monitoring related to the service execution environment 30 is as follows. First, each performance information which is the state of the service execution environment 30 corresponding to each of the monitoring conditions used for each determination is obtained. The analysis history storage unit 19 performs a storage process as a history (step A23: analysis history storage processing step, analysis history storage processing function shown in FIG. 3).

続いて、前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部19の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として条件生成部18が生成する(図3に示すステップA41〜ステップA43:条件生成ステップ,条件生成機能)。   Subsequently, when each of the plurality of monitoring conditions has a different determination result, a threshold value at which each of the plurality of monitoring conditions has the same determination result based on the history of the performance information of the analysis history storage unit 19 is set. The condition generation unit 18 generates the calculated threshold value as a new monitoring condition for correcting the monitoring failure (step A41 to step A43 shown in FIG. 3: condition generation step, condition generation function).

更に、このサービス実行環境30に係る監視動作手順では、監視条件を生成するに際しては、前記複数の監視条件が主条件と1以上の副条件とを含む場合であって前記主条件の判定結果と1つの前記副条件の判定結果とが異なる場合に、前記分析履歴蓄積部19の前記性能情報の履歴に基づいて前記主条件の判定結果と前記1つの副条件の判定結果とが同一となるような前記1つの副条件にかかる前記性能情報をしきい値として算出しこのしきい値を新たな1つの副条件として条件生成部18がこれを生成する。   Furthermore, in the monitoring operation procedure according to the service execution environment 30, when generating the monitoring condition, the plurality of monitoring conditions include a main condition and one or more subconditions, and the determination result of the main condition is When the determination result of one sub condition is different, the determination result of the main condition and the determination result of the one sub condition are the same based on the history of the performance information of the analysis history storage unit 19 The performance information related to the one sub-condition is calculated as a threshold value, and the condition generation unit 18 generates the threshold value as a new sub-condition.

又、このサービス実行環境30に係る監視動作手順では、監視条件を生成するに際しては、前記監視不良の場合に前記1つの副条件の設定変更が必要であることを示す要設定変更情報(例えば、図2に示すAUTO)を前記1つの副条件に対応づけて前記分析履歴蓄積部19の対応箇所に書き込む。   Further, in the monitoring operation procedure according to the service execution environment 30, when generating a monitoring condition, required setting change information (for example, indicating that a setting change of the one sub-condition is necessary in the case of the monitoring failure) (AUTO shown in FIG. 2) is written in the corresponding portion of the analysis history storage unit 19 in association with the one sub-condition.

更に、このサービス実行環境30に係る監視動作手順では、監視条件を生成するに際しては、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部19の前記性能情報の履歴に基づいて主条件が真となるものであって前記要設定変更情報が付されている副条件を取り出し、前記サービス実行環境30の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として条件生成部18がこれを生成する。   Furthermore, in the monitoring operation procedure according to the service execution environment 30, when generating the monitoring condition, the analysis history accumulating unit 19 is used when the state of the service execution environment is a determination result that satisfies the main condition. Based on the history of the performance information, the sub-condition that is true for the main condition and has the required setting change information is extracted, and the performance information indicating the state of the service execution environment 30 is obtained from the sub-condition. If it is smaller, the maximum value of the performance information is calculated as a threshold value, and the condition generation unit 18 generates this threshold value as a new subcondition.

また、このサービス実行環境30に係る監視動作手順では、監視条件を生成するに際しては、前記サービス実行環境30の状態が主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部19の性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている副条件を取り出し、サービス実行環境30の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として条件生成部18がこれを生成する。   Further, in the monitoring operation procedure related to the service execution environment 30, when the monitoring condition is generated, if the determination result that the state of the service execution environment 30 is true satisfies the main condition, the analysis history storage unit 19 Based on the history of performance information, the sub-condition that the main condition is true and the setting change information is taken out is extracted, and the performance information indicating the state of the service execution environment 30 is less than this sub-condition. If it is larger, the minimum value of the performance information is calculated as a threshold value, and the condition generation unit 18 generates this threshold value as a new subcondition.

更に、このサービス実行環境30に係る監視動作手順では、監視条件を生成するに際しては、サービス実行環境30の状態が主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部19の性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている副条件を取り出し、サービス実行環境30の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として条件生成部18がこれを生成する。   Furthermore, in the monitoring operation procedure according to the service execution environment 30, when generating the monitoring condition, if the determination result is that the state of the service execution environment 30 is false not satisfying the main condition, the analysis history storage unit 19 Based on the history of performance information, the sub-conditions for which the main condition is false and the required setting change information is taken out, and the performance information indicating the state of the service execution environment 30 is less than this sub-condition. If it is smaller, the minimum value of the performance information is calculated as a threshold value, and the condition generation unit 18 generates this threshold value as a new subcondition.

又、このサービス実行環境30に係る監視動作手順では、監視条件を生成するに際しては、前記サービス実行環境30の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部19の前記性能情報の履歴に基づいて主条件が偽となるものであって前記要設定変更情報が付されている副条件を取り出し、サービス実行環境30の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として条件生成部18がこれを生成する。   Further, in the monitoring operation procedure according to the service execution environment 30, when generating the monitoring condition, the analysis history accumulation is performed when the state of the service execution environment 30 is a false determination result that does not satisfy the main condition. Based on the performance information history of the unit 19, a sub-condition having a false main condition and having the required setting change information is extracted, and the performance information indicating the state of the service execution environment 30 is the sub-condition. If it is greater than the threshold value, the maximum value of the performance information is calculated as a threshold value, and the condition generation unit 18 generates this threshold value as a new subcondition.

更に又、このサービス実行環境30に係る監視動作手順では、前記監視条件を生成した後に、新たな副条件を分析履歴蓄積部19の対応箇所に書き込んで情報更新を行うとともに、この新たな副条件を監視ルール更新部が外部に告知する(図3に示すステップA51:監視ルール更新ステップ,監視ルール更新機能)。   Furthermore, in the monitoring operation procedure according to the service execution environment 30, after the monitoring condition is generated, a new subcondition is written in the corresponding part of the analysis history storage unit 19 to update the information. Is notified to the outside (step A51: monitoring rule updating step, monitoring rule updating function shown in FIG. 3).

(詳細動作)
以下、これを具体的に詳述する。
まず、図3に示すように、エージェント装置20の監視部21は、サービス実行環境30より性能情報を収集する(ステップA01:性能情報収集ステップ,性能情報収集機能)。
(Detailed operation)
This will be described in detail below.
First, as shown in FIG. 3, the monitoring unit 21 of the agent device 20 collects performance information from the service execution environment 30 (step A01: performance information collection step, performance information collection function).

次に、監視部21は、性能情報からイベントを生成し、これをマネージャ装置10に送る(ステップA02:イベント情報生成ステップ,イベント情報生成機能)。   Next, the monitoring unit 21 generates an event from the performance information and sends it to the manager device 10 (step A02: event information generation step, event information generation function).

マネージャ装置10の分析部11では、エージェント装置20からイベントが送られてくるのを待合わせる(ステップA11:イベント情報受信ステップ,イベント情報受信機能))。   The analysis unit 11 of the manager device 10 waits for an event sent from the agent device 20 (step A11: event information reception step, event information reception function).

次に、分析部11では、監視ルール蓄積部12から監視ルールを一つ取出す(ステップA12:監視ルール取得ステップ,監視ルール取得機能)。
分析部11は、取出す監視ルールがなくなった場合にはステップA11に戻り次のイベントを待合わせ、監視ルールが取出せた場合にはステップA14に進む(ステップA13)。
Next, the analysis unit 11 takes out one monitoring rule from the monitoring rule storage unit 12 (step A12: monitoring rule acquisition step, monitoring rule acquisition function).
The analysis unit 11 returns to Step A11 when there are no monitoring rules to be taken out, waits for the next event, and proceeds to Step A14 when the monitoring rules are taken out (Step A13).

分析部11は、監視ルールが取出せた場合には、監視ルールの主条件が満たされているかを判定する(ステップA14:主条件真偽判定ステップ,主条件真偽判定機能)。   When the monitoring rule can be extracted, the analysis unit 11 determines whether the main condition of the monitoring rule is satisfied (step A14: main condition true / false determination step, main condition true / false determination function).

又、この分析部11は、主条件を満たしている場合にはステップA16に進み、満たさない場合にはステップA21に進む(ステップA15)。分析部11は、主条件を満たしていた場合には、障害表示部14で障害状態にあることを表示するように制御する(ステップA16:主条件障害表示制御ステップ,主条件障害表示制御機能)。   The analysis unit 11 proceeds to step A16 when the main condition is satisfied, and proceeds to step A21 when the main condition is not satisfied (step A15). When the main condition is satisfied, the analysis unit 11 performs control so that the failure display unit 14 displays that there is a failure state (step A16: main condition failure display control step, main condition failure display control function). .

監視不良検証部13では、主条件の判定結果と、副条件の判定結果が異なる場合に監視設定が適切でない監視不良状態にあると判断するが、副条件が複数あるため、監視ルールから副条件を一つ取出しそれを副条件i とする(ステップA21)。
この監視不良検証部13は、監視ルールから全ての副条件を取り出した場合にはステップA12に戻って次の監視ルールを処理し、副条件を取出せた場合にはステップA23に進む(ステップA22)。
The monitoring failure verification unit 13 determines that the monitoring setting is in an inappropriate monitoring state when the determination result of the main condition is different from the determination result of the sub condition. Is taken as sub-condition i (step A21).
If all the subconditions are extracted from the monitoring rule, the monitoring failure verification unit 13 returns to step A12 to process the next monitoring rule, and proceeds to step A23 if the subcondition can be extracted (step A22). .

次に、監視不良検証部13は、分析履歴蓄積部19に主条件、副条件の性能情報を格納する(ステップA 23:分析履歴蓄積処理ステップ,分析履歴蓄積処理機能)。
これにより、分析履歴蓄積部19は主条件、副条件の性能情報を蓄積処理する。
ここで、ステップA21で副条件i が取りだせた場合には、監視不良検証部13又は条件生成部18は、主条件の判定結果と副条件i の判定結果が異なるか否かを判定する(ステップA24:主副条件異同判定ステップ,主副条件異同判定機能)。
Next, the monitoring failure verification unit 13 stores the performance information of the main condition and the sub condition in the analysis history storage unit 19 (step A 23: analysis history storage processing step, analysis history storage processing function).
As a result, the analysis history storage unit 19 stores the performance information of the main condition and the sub condition.
Here, when the sub-condition i can be taken out in step A21, the monitoring failure verification unit 13 or the condition generation unit 18 determines whether the determination result of the main condition is different from the determination result of the sub-condition i (step A24: Main / sub condition difference determination step, main / sub condition difference determination function).

前述した監視不良検証部13は、主条件の判定結果と副条件i の判定結果が一致する場合にはステップA21に戻って次の副条件を処理し、一致しない場合にはステップA31に進み監視設定が適切でない監視不良状態の処理を行う(ステップA25)。   The above-described monitoring failure verification unit 13 returns to step A21 to process the next subcondition when the determination result of the main condition and the determination result of the subcondition i match, and proceeds to step A31 when it does not match and monitors. A monitoring failure state in which the setting is not appropriate is performed (step A25).

監視設定が適切でない監視不良状態である場合には、監視不良表示部15が、監視不良警告として主条件と主条件の判定結果と副条件i と副条件i の判定結果を表示し、管理者に警告する(ステップA31:監視不良警告表示制御ステップ、及び主副条件と主副条件判定結果表示制御ステップ,監視不良警告表示制御機能および主副条件と主副条件判定結果表示制御機能)。   If the monitoring setting is in an inappropriate monitoring failure state, the monitoring failure display unit 15 displays the determination result of the main condition and the main condition and the determination result of the subcondition i and the subcondition i as a monitoring failure warning. (Step A31: monitoring failure warning display control step, main / sub condition and main / sub condition determination result display control step, monitoring failure warning display control function, main / sub condition and main / sub condition determination result display control function).

次に、条件生成部18では主条件を満たすか否かを判定し、満たす場合にはステップA42に進み、満たさない場合はステップA43に進む(ステップA41:主条件真偽判定ステップ,主条件真偽判定機能)。   Next, the condition generation unit 18 determines whether or not the main condition is satisfied. If the condition is satisfied, the process proceeds to step A42; otherwise, the process proceeds to step A43 (step A41: main condition true / false determination step, main condition true / false). False judgment function).

主条件を満たす場合(主条件で障害ありの場合)には、条件生成部18が分析履歴蓄積部19から主条件が真のものを全て取り出し、副条件のしきい値にAUTOが指定されているものすべてに対し、条件が<(性能情報<副条件の既設定しきい値:性能情報が副条件の既設定しきい値より小さい)なら性能情報の最大値を新たな閾値とした副条件i を生成し(第1の条件修正ステップ,第1の条件修正機能)、条件が>(性能情報>副条件の既設定しきい値:性能情報が副条件の既設定しきい値より大きい)なら、性能情報の最小値を新たなしきい値とした副条件i を生成し(第2の条件修正ステップ,第2の条件修正機能)、ステップB51に進む(ステップA42)。   When the main condition is satisfied (when the main condition is faulty), the condition generation unit 18 extracts all the true main conditions from the analysis history storage unit 19, and AUTO is specified as the sub-condition threshold value. If the condition is <(performance information <sub-condition's preset threshold: performance information is smaller than the preset threshold of the sub-condition), then the sub-condition with the maximum performance information as the new threshold i is generated (first condition correction step, first condition correction function), and the condition is> (performance information> sub-condition preset threshold: performance information is greater than sub-condition preset threshold) If so, the sub-condition i is generated with the minimum value of the performance information as a new threshold (second condition correction step, second condition correction function), and the process proceeds to step B51 (step A42).

この場合、条件生成部18が前記主条件の判定結果(主条件で障害あり)と1つの前記副条件の判定結果(1つの前記副条件で障害あり)とが同一となるように、修正する(全条件真修正ステップ,全条件真修正機能)。   In this case, the condition generation unit 18 corrects so that the determination result of the main condition (failure in the main condition) and the determination result of one subcondition (failure in the one subcondition) are the same. (All condition true correction step, All condition true correction function).

主条件を満たさない場合(主条件で障害なしの場合)には、条件生成部18が分析履歴蓄積部19から主条件が偽のものを全て取り出し、副条件のしきい値にAUTOが指定されているものすべてに対し、条件が<(性能情報<副条件の既設定しきい値:性能情報が副条件の既設定しきい値より小さい)なら、性能情報の最小値を新たな閾値とした副条件i を生成し(第3の条件修正ステップ,第3の条件修正機能)、条件が>(性能情報>副条件の既設定しきい値:性能情報が副条件の既設定しきい値より大きい)なら、性能情報の 最大値を新たなしきい値とした副条件i を生成し(第4の条件修正ステップ,第4の条件 修正機能)、ステップB51に進む(ステップA43)。   When the main condition is not satisfied (when there is no failure in the main condition), the condition generation unit 18 extracts all false main conditions from the analysis history storage unit 19, and AUTO is specified as the sub-condition threshold value. If the condition is <(performance information <sub-condition's preset threshold: performance information is smaller than the sub-condition's preset threshold), the minimum value of the performance information is set as the new threshold. Sub-condition i is generated (third condition correction step, third condition correction function), and the condition is> (performance information> sub-condition preset threshold value: performance information is the sub-condition preset threshold value If it is greater, a sub-condition i is generated with the maximum value of performance information as a new threshold (fourth condition correction step, fourth condition correction function), and the process proceeds to step B51 (step A43).

この場合、条件生成部18が前記主条件の判定結果(主条件で障害なし)と1つの前記副条件の判定結果(1つの前記副条件で障害なし)とが同一となるように、修正する(全条件偽修正ステップ,全条件偽修正機能)。   In this case, the condition generation unit 18 corrects the determination result of the main condition (no failure in the main condition) and the determination result of one sub-condition (no failure in the one sub-condition) to be the same. (All condition false correction step, all condition false correction function).

監視ルール更新部16は、条件生成部18で新たに生成された副条件i を管理者に提示し、管理者は必要であれば条件の修正を実施し、監視ルール蓄積部12に更新された監視ルールを更新し、ステップA21に戻る(ステップA51:監視ルール更新ステップ,監視ルール更新機能))。   The monitoring rule update unit 16 presents the sub-condition i newly generated by the condition generation unit 18 to the administrator, and the administrator corrects the condition if necessary and is updated in the monitoring rule storage unit 12. The monitoring rule is updated, and the process returns to step A21 (step A51: monitoring rule update step, monitoring rule update function).

このように、この監視システム1におけるマネージャ装置10は、監視ルール蓄積部12の監視ルールに、異なる方法で同一状態を判定する複数の条件を保持し、監視不良検証部13が、この複数条件の判定の違いを検出して管理者に監視設定が適切でない監視不良として警告し、管理者に条件を修正させることで、監視設定を実環境に合ったものに変更できるが、更に、性能情報の履歴を蓄積する分析履歴蓄積部19を有し、複数の条件が異なる判定結果になった場合に、この分析履歴蓄積部19の性能情報の履歴から複数の条件が同じ判定結果となるしきい値を算出して監視条件のしきい値として管理者に提示することにより、管理者が監視条件を修正する際の補助を行うことが可能となっている。   As described above, the manager device 10 in the monitoring system 1 holds a plurality of conditions for determining the same state by different methods in the monitoring rules of the monitoring rule storage unit 12, and the monitoring failure verification unit 13 uses the plurality of conditions. By detecting the difference in judgment and alerting the administrator that the monitoring setting is not appropriate, and by allowing the administrator to correct the condition, the monitoring setting can be changed to match the actual environment. Threshold value that has an analysis history accumulation unit 19 that accumulates history, and when a plurality of conditions result in different determination results, the plurality of conditions have the same determination result from the performance information history of the analysis history accumulation unit 19 Is calculated and presented to the administrator as a threshold value for the monitoring condition, so that the administrator can assist in correcting the monitoring condition.

更に、監視ルール蓄積部12には、監視ルールにしきい値の自動変更が指示できる複数の監視条件を保持しており、監視不良検証部13で複数の監視条件の判定結果の差分を検出し、差があった場合に監視不良とし管理者に警告し、分析履歴蓄積部19に蓄積されている性能情報を元に副条件の適切なしきい値を提示した条件を管理者に提示し監視設定の修正を促すことが可能となっている。   Furthermore, the monitoring rule storage unit 12 holds a plurality of monitoring conditions that can instruct the monitoring rule to automatically change the threshold value, and the monitoring failure verification unit 13 detects the difference between the determination results of the plurality of monitoring conditions. If there is a difference, the manager is warned as a monitoring failure, and the condition for presenting an appropriate threshold value for the sub-condition based on the performance information accumulated in the analysis history accumulation unit 19 is presented to the administrator. It is possible to prompt correction.

ここで、分析履歴蓄積部19に判定の履歴が蓄積されればされるほど、学習が進み提示する閾値の精度が向上する。又、本当に障害が発生しているのか監視設定が適切でない監視不良なのかを区別し、管理者が監視設定を改善することができる手段と、管理者に監視設定の変更を提示することで、監視設定が適切になされているか否かを装置自体が評価して管理者に変更を促すことが可能となっている。   Here, as the determination history is accumulated in the analysis history accumulation unit 19, the learning progresses and the accuracy of the threshold value to be presented is improved. In addition, by distinguishing whether the failure really occurs or the monitoring setting is not appropriate, the administrator can improve the monitoring setting and present the change of the monitoring setting to the administrator. It is possible for the apparatus itself to evaluate whether or not the monitoring setting is appropriately made and to prompt the administrator to make a change.

次に、本実施形態の効果について説明する。
本実施形態では、監視時に主条件と副条件の判定結果に差がある場合、監視設定が適切でないことを示す監視不良の状態として条件の修正を行うよう構成されているが、分析履歴蓄積部19に蓄積されている性能情報を元に副条件の適切な閾値を管理者に提示するように構成されているため、運用を続けて分析履歴蓄積部19の情報が増えるにつれ、学習が進み提示する閾値の精度が向上する。
Next, the effect of this embodiment will be described.
In this embodiment, when there is a difference between the determination result of the main condition and the sub condition at the time of monitoring, the condition is corrected as a monitoring failure state indicating that the monitoring setting is not appropriate. 19 is configured to present an appropriate threshold value for the sub-conditions to the administrator based on the performance information accumulated in 19, so as the information in the analysis history accumulation unit 19 continues to operate, learning progresses and presents The accuracy of the threshold to be improved is improved.

また、監視設定が適切でないことを示す監視不良の状態として条件の修正を行うよう構成されているが、分析履歴蓄積部19に蓄積されている性能情報を元に副条件の適切な閾値を提示できることにある。その理由は、分析履歴蓄積部19に蓄積されている性能情報を元に、副条件の適切な閾値を提示する条件生成部18を備えているからである。   In addition, although it is configured to correct the condition as a monitoring failure state indicating that the monitoring setting is not appropriate, an appropriate threshold value for the sub-condition is presented based on the performance information accumulated in the analysis history accumulation unit 19 There is something you can do. This is because the condition generation unit 18 that presents an appropriate threshold value of the sub-condition based on the performance information stored in the analysis history storage unit 19 is provided.

更に、監視設定を実環境に合わせ改善することができることにある。その理由は、分析履歴蓄積部19に蓄積されている性能情報が増加するに従って学習が進み、条件生成部18が生成する閾値の精度が上がり、運用を続けるうちに監視設定を改善することができるからである。   Furthermore, the monitoring setting can be improved according to the actual environment. The reason is that learning progresses as the performance information stored in the analysis history storage unit 19 increases, the accuracy of the threshold value generated by the condition generation unit 18 increases, and the monitoring setting can be improved as the operation continues. Because.

以上、図1に示すブロック図における構成要素たる各手段及び各部が、電子回路ブロックなどからなるハードウエアであることを前提として述べたが、当該構成要素の一部又は全てが、監視装置としてのマネージャ装置10が備えたコンピュータ、及びエージェント装置20が備えたコンピュータ、により実行可能なプログラムにより機能化された状態を示すソフトウエアモジュール構成であってもよい。   The above description has been made on the assumption that each means and each component as components in the block diagram shown in FIG. 1 is hardware composed of an electronic circuit block or the like, but some or all of the components are used as a monitoring device. It may be a software module configuration that indicates a state functionalized by a program that can be executed by the computer provided in the manager device 10 and the computer provided in the agent device 20.

この場合におけるハードウエア構成にかかるマネージャ装置10が備えたコンピュータは、制御部としてのプロセッサと、記憶部としてのメモリとを備えている。このプロセッサには、分析部11と監視不良検証部13と監視ルール更新部16とコマンド発行部17と条件生成部18とを備えている。又、メモリには分析履歴蓄積部19と監視ルール蓄積部12とを備えている。   The computer included in the manager device 10 according to the hardware configuration in this case includes a processor as a control unit and a memory as a storage unit. This processor includes an analysis unit 11, a monitoring failure verification unit 13, a monitoring rule update unit 16, a command issue unit 17, and a condition generation unit 18. The memory includes an analysis history storage unit 19 and a monitoring rule storage unit 12.

即ち、物理的構成は、例えば一又は複数のプロセッサと一又は複数のメモリ等であるが、各構成要素によるソフトウエア構成は、プログラムの制御によってプロセッサが発揮する複数の機能を、それぞれ複数の構成要素として表現したものとなる。   That is, the physical configuration is, for example, one or a plurality of processors and one or a plurality of memories, etc., but the software configuration by each component has a plurality of functions that the processor exhibits by controlling the program. It is expressed as an element.

プロセッサがプログラムによって実行されている動的状態(プログラムを構成する各手順を実行している状態)を機能表現した場合、プロセッサ内に実行部分にかかる各構成要素が構成されることになる。プログラムが実行されていない静的状態にあっては、各手段の構成を実現するプログラム全体(或いは各手段の構成に含まれるプログラム各部)は、メモリなどの記憶領域に記憶されている。   When the dynamic state in which the processor is executed by the program (the state in which each procedure constituting the program is executed) is functionally expressed, each component related to the execution part is configured in the processor. In a static state in which the program is not executed, the entire program (or each program part included in the configuration of each unit) that realizes the configuration of each unit is stored in a storage area such as a memory.

以上に示した各部(手段)は、プログラムにより機能化されたコンピュータをプログラムの機能と共に実現し得るように構成しても、また、固有のハードウエアにより恒久的に機能化された複数の電子回路ブロックからなる装置で構成してもよい。   Each unit (means) described above may be configured such that a computer functionalized by a program can be realized together with the function of the program, or a plurality of electronic circuits permanently functionalized by specific hardware You may comprise with the apparatus which consists of a block.

また、上記の説明において、上述した各ステップの動作内容及び各部の構成要素並びにそれらによる各機能をプログラム(ソフトウエアプログラム)化し、コンピュータに実行させてもよい。そして、以上説明した方法は、コンピュータがプログラムを記録媒体から読み込んで実行することによっても実現することが出来る。即ち、上述のプログラムを、情報記録媒体に記録した構成であってもよい。   In the above description, the operation content of each step described above, the constituent elements of each unit, and the functions thereof may be programmed (software program) and executed by a computer. The method described above can also be realized by a computer reading a program from a recording medium and executing it. That is, the structure which recorded the above-mentioned program on the information recording medium may be sufficient.

上述した実施形態については、その新規な技術内容の要点をまとめると、以下のようになる。
尚、上記実施形態の一部又全部は、新規な技術としていかのようにまとめられるが、本発明は必ずしもこれに限定されるものではない。
Regarding the above-described embodiment, the main points of the new technical contents are summarized as follows.
Note that a part or all of the above-described embodiments can be summarized as a novel technique, but the present invention is not necessarily limited to this.

〔付記1〕
監視対象となるサービス実行環境の状態を把握するためのエージェント装置と、前記サービス実行環境の監視ルールを管理するためのマネージャ装置とを有し、前記マネージャ装置が、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定する分析部を備えると共に、この複数の各監視条件での各判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知可能とした監視システムであって、
前記マネージャ装置が、
前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積する分析履歴蓄積部と、
前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成部と、を備えていることを特徴とする監視システム。
[Appendix 1]
An agent device for grasping a status of a service execution environment to be monitored; and a manager device for managing a monitoring rule of the service execution environment, wherein the manager device has the status of the service execution environment An analysis unit that determines whether or not each of the plurality of monitoring conditions defined in the monitoring rule is satisfied, and monitoring setting related to each of the monitoring conditions by detecting a difference of each determination in each of the plurality of monitoring conditions Is a monitoring system that can notify of a monitoring failure indicating that the
The manager device is
An analysis history accumulating unit for accumulating each performance information as a history, which is the state of the service execution environment corresponding to each of the monitoring conditions used for each of the determinations;
When each of the plurality of monitoring conditions results in a different determination result, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result. And a condition generation unit that generates a threshold value as a new monitoring condition for correcting the monitoring failure.

〔付記2〕
付記1に記載の監視システムにおいて、
前記複数の各監視条件は、主条件と1以上の副条件とを含み、
前記条件生成部が、前記主条件の判定結果と1つの前記副条件の判定結果とが異なる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件の判定結果と前記1つの副条件の判定結果とが同一となるような前記1つの副条件にかかる前記性能情報をしきい値として算出すると共に、このしきい値を新たな1つの副条件として生成する機能を備えていることを特徴とする監視システム。
[Appendix 2]
In the monitoring system according to attachment 1,
Each of the plurality of monitoring conditions includes a main condition and one or more sub-conditions,
When the condition generation unit is different from the determination result of the main condition and the determination result of one sub-condition, the determination result of the main condition and the 1 of the determination result based on the history of the performance information of the analysis history storage unit A function for calculating, as a threshold value, the performance information relating to the one sub-condition so that the determination results of the two sub-conditions are the same, and generating a threshold value as a new sub-condition A surveillance system characterized by

〔付記3〕
付記2に記載の監視システムにおいて、
前記条件生成部が、前記監視不良の場合に前記1つの副条件の設定変更が必要であることを示す要設定変更情報を、前記1つの副条件に対応づけて前記分析履歴蓄積部の対応箇所に書き込む機能を備えていることを特徴とする監視システム。
[Appendix 3]
In the monitoring system described in Appendix 2,
The condition generation unit associates the required setting change information indicating that it is necessary to change the setting of the one sub-condition in the case of the monitoring failure with the one sub-condition. A monitoring system characterized by having a function of writing to the computer.

〔付記4〕
付記3に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
[Appendix 4]
In the monitoring system according to attachment 3,
When the condition generation unit has a determination result that the condition of the service execution environment is true satisfying the main condition, the main condition is true based on the performance information history of the analysis history storage unit. If the sub-condition with the required setting change information is taken out and the performance information indicating the state of the service execution environment is smaller than the sub-condition, the maximum value of the performance information is used as a threshold value. A monitoring system having a function of calculating and generating this threshold value as a new subcondition.

〔付記5〕
付記4に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
[Appendix 5]
In the monitoring system described in appendix 4,
When the condition generation unit has a determination result that the condition of the service execution environment is true satisfying the main condition, the main condition is true based on the performance information history of the analysis history storage unit. If the sub-condition with the required setting change information is taken out and the performance information indicating the state of the service execution environment is larger than the sub-condition, the minimum value of the performance information is used as a threshold value. A monitoring system having a function of calculating and generating this threshold value as a new subcondition.

〔付記6〕
付記5に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
[Appendix 6]
In the monitoring system according to attachment 5,
When the condition generation unit has a determination result that the state of the service execution environment is false that does not satisfy the main condition, the main condition becomes false based on the performance information history of the analysis history storage unit. If the performance information indicating the status of the service execution environment is smaller than the sub-condition, the minimum value of the performance information is set as a threshold value. And a function of generating the threshold value as a new sub-condition.

〔付記7〕
付記6に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
[Appendix 7]
In the monitoring system according to attachment 6,
When the condition generation unit has a determination result that the state of the service execution environment is false that does not satisfy the main condition, the main condition becomes false based on the performance information history of the analysis history storage unit. If the performance condition information indicating the status of the service execution environment is larger than the secondary condition, the maximum value of the performance information is set as a threshold value. And a function of generating the threshold value as a new sub-condition.

〔付記8〕
付記7に記載の監視システムにおいて、
前記新たな副条件を前記分析履歴蓄積部の対応箇所に書き込んで情報更新を行うとともに、この新たな副条件を外部に告知する監視ルール更新部を更に備えていることを特徴とする監視システム。
[Appendix 8]
In the monitoring system according to attachment 7,
A monitoring system further comprising a monitoring rule update unit for writing the new sub-condition to a corresponding portion of the analysis history storage unit to update information and notifying the outside of the new sub-condition.

〔付記9〕
監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理する機能と、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定する機能と、前記複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知する機能とを備えた監視装置であって、
前記各判定に使用された前記各条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積する分析履歴蓄積部を備えると共に、
前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成部を備えたことを特徴とする監視装置。
[Appendix 9]
A function for managing the monitoring rules of the service execution environment via an agent device for grasping the status of the service execution environment to be monitored, and a plurality of monitors in which the status of the service execution environment is defined in the monitoring rule Announces a monitoring failure indicating that the monitoring setting for each monitoring condition is inappropriate by detecting the difference between the function for determining whether the condition is satisfied and the determination of each of the plurality of monitoring conditions A monitoring device having a function to
An analysis history accumulating unit for accumulating each performance information as a history, which is the state of the service execution environment corresponding to each of the conditions used for each of the determinations;
When each of the plurality of monitoring conditions results in a different determination result, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result. A monitoring apparatus comprising: a condition generation unit that generates a threshold value as a new monitoring condition for correcting the monitoring failure.

〔付記10〕
監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理し、前記サービス実行環境の状態が前記監視ルールに定義された複数の監視条件を満たすか否かを判定し、この複数の監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知するサービス実行環境の監視方法であって、
前記各判定に使用された前記各監視条件に対応する前記サービス実行環境の状態である各性能情報を履歴として分析履歴蓄積部が各々蓄積し、
前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として条件生成部が生成する、ことを特徴とするサービス実行環境の監視方法。
[Appendix 10]
The monitoring rules of the service execution environment are managed via an agent device for grasping the status of the service execution environment to be monitored, and the status of the service execution environment satisfies a plurality of monitoring conditions defined in the monitoring rule Monitoring the service execution environment to notify the monitoring failure indicating that the monitoring setting for each of the monitoring conditions is inappropriate by detecting the difference in the determinations of the plurality of monitoring conditions A method,
The analysis history accumulating unit accumulates each performance information that is the state of the service execution environment corresponding to each monitoring condition used for each determination as a history,
When each of the plurality of monitoring conditions results in a different determination result, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result. A service execution environment monitoring method, characterized in that a condition generation unit generates a threshold value as a new monitoring condition for correcting the monitoring failure.

〔付記11〕
付記10に記載のサービス実行環境の監視方法において、
前記監視条件の生成に際しては、前記複数の監視条件が主条件と1以上の副条件とを含む場合であって前記主条件の判定結果と1つの前記副条件の判定結果とが異なる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件の判定結果と前記1つの副条件の判定結果とが同一となるような前記1つの副条件にかかる前記性能情報を、しきい値として算出し、このしきい値を新たな1つの副条件として生成する、
ことを特徴とするサービス実行環境の監視方法。
[Appendix 11]
In the service execution environment monitoring method according to attachment 10,
In generating the monitoring condition, when the plurality of monitoring conditions include a main condition and one or more subconditions, and the determination result of the main condition is different from the determination result of one subcondition, The performance information relating to the one sub-condition such that the determination result of the main condition and the determination result of the one sub-condition are the same based on the history of the performance information of the analysis history storage unit is a threshold. As a value and generate this threshold as a new sub-condition,
A service execution environment monitoring method.

〔付記12〕
付記11に記載のサービス実行環境の監視方法において、
前記監視条件の生成に際しては、前記監視不良の場合に前記1つの副条件の設定変更が必要であることを示す要設定変更情報を前記1つの副条件に対応づけて前記分析履歴蓄積部の対応箇所に書き込むことを特徴とするサービス実行環境の監視方法。
[Appendix 12]
In the service execution environment monitoring method according to attachment 11,
When generating the monitoring condition, the analysis history storage unit corresponds to the one sub-condition with the required setting change information indicating that the setting change of the one sub-condition is necessary in the case of the monitoring failure. A method for monitoring a service execution environment, characterized by writing in a location.

〔付記13〕
付記12に記載のサービス実行環境の監視方法において、
前記監視条件の生成に際しては、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さい場合に、当該性能情報の最大値をしきい値として算出し、このしきい値を新たな副条件として生成することを特徴とするサービス実行環境の監視方法。
[Appendix 13]
In the service execution environment monitoring method according to attachment 12,
In generating the monitoring condition, if the state of the service execution environment is a determination result that is true for the main condition, the main condition is true based on the history of the performance information in the analysis history storage unit. If the sub-condition to which the required change information is attached is extracted, and the performance information indicating the status of the service execution environment is smaller than the sub-condition, the maximum value of the performance information is set as a threshold. A method for monitoring a service execution environment, characterized in that the threshold value is calculated as a new subcondition.

〔付記14〕
付記13に記載のサービス実行環境の監視方法において、
前記監視条件の生成に際しては、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きい場合には当該性能情報の最小値をしきい値として算出し、このしきい値を新たな副条件として生成する、ことを特徴とするサービス実行環境の監視方法。
[Appendix 14]
In the service execution environment monitoring method according to attachment 13,
In generating the monitoring condition, if the state of the service execution environment is a determination result that is true for the main condition, the main condition is true based on the history of the performance information in the analysis history storage unit. If the performance information indicating the status of the service execution environment is larger than the sub-condition, the minimum value of the performance information is thresholded. A service execution environment monitoring method, characterized in that it is calculated as a value and this threshold value is generated as a new subcondition.

〔付記15〕
付記14に記載のサービス実行環境の監視方法において、
前記監視条件の生成に際しては、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する、ことを特徴とするサービス実行環境の監視方法。
[Appendix 15]
In the service execution environment monitoring method according to attachment 14,
When generating the monitoring condition, if the service execution environment state is a false determination result that does not satisfy the main condition, the main condition is false based on the history of the performance information in the analysis history storage unit. If the performance information indicating the status of the service execution environment is smaller than the sub-condition, the minimum value of the performance information is set. A service execution environment monitoring method, characterized in that it is calculated as a threshold value and this threshold value is generated as a new subcondition.

〔付記16〕
付記15に記載のサービス実行環境の監視方法において、
前記監視条件を生成するに際しては、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する、
ことを特徴とするサービス実行環境の監視方法。
[Appendix 16]
In the service execution environment monitoring method according to attachment 15,
When generating the monitoring condition, when the state of the service execution environment is a false determination result that does not satisfy the main condition, the main condition is based on the performance information history of the analysis history storage unit. If the performance information indicating the status of the service execution environment is larger than the sub-condition, the maximum value of the performance information is set. Calculate as a threshold and generate this threshold as a new sub-condition,
A service execution environment monitoring method.

〔付記17〕
付記16に記載のサービス実行環境の監視方法において、
前記監視条件を生成した後に、前記新たな副条件を前記分析履歴蓄積部の対応箇所に書き込んで情報更新を行うと共に、この新たな副条件を監視ルール更新部が外部に告知する、ことを特徴とするサービス実行環境の監視方法。
[Appendix 17]
In the service execution environment monitoring method according to attachment 16,
After the monitoring condition is generated, the new subcondition is written in the corresponding part of the analysis history storage unit to update the information, and the monitoring rule update unit notifies the new subcondition to the outside. The service execution environment monitoring method.

〔付記18〕
監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理し、前記サービス実行環境の状態が前記監視ルールに定義された複数の各条件を満たすか否かを判定し、この複数の各条件での各々の判定の違いを検出することで当該各条件にかかる監視設定が不適切であることを示す監視不良を告知可能とした監視装置が備えたコンピュータに、
前記各判定に使用された前記各条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積処理機能と、
前記複数の各条件が異なる判定結果となる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記複数の各条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな条件として生成する条件生成機能と、
を実行させることを特徴とする監視装置用プログラム。
[Appendix 18]
The monitoring rules of the service execution environment are managed via an agent device for grasping the status of the service execution environment to be monitored, and the status of the service execution environment satisfies a plurality of conditions defined in the monitoring rule And a monitoring device that can notify a monitoring failure indicating that the monitoring setting for each of the conditions is inappropriate by detecting whether or not each of the plurality of conditions is different. Computer
An analysis history accumulation processing function for accumulating each performance information as a history, which is a state of the service execution environment corresponding to each of the conditions used for each determination;
If the plurality of conditions result in different determination results, a threshold is calculated based on the performance information history of the analysis history storage processing function so that the plurality of conditions have the same determination result. A condition generation function for generating a value as a new condition for correcting the monitoring failure;
A program for a monitoring device, characterized by causing

〔付記19〕
付記18に記載の監視装置用プログラムにおいて、
前記複数の条件は、主条件と1以上の副条件とを含み、
前記条件生成機能では、前記主条件の判定結果と1つの前記副条件の判定結果とが異なる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記主条件の判定結果と前記1つの副条件の判定結果とが同一となるような前記1つの副条件にかかる前記性能情報をしきい値として算出しこのしきい値を新たな1つの副条件として生成する機能をその内容とし、これを前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 19]
In the monitoring apparatus program according to attachment 18,
The plurality of conditions includes a main condition and one or more sub-conditions,
In the condition generation function, when the determination result of the main condition is different from the determination result of one of the sub-conditions, the determination result of the main condition and the determination result of the analysis history accumulation processing function based on the history of the performance information The content of the function is to calculate the performance information related to the one subcondition so that the determination result of one subcondition is the same as a threshold value, and generate the threshold value as a new subcondition. , A program for a monitoring apparatus, which causes the computer to execute this.

〔付記20〕
付記19に記載の監視装置用プログラムにおいて、
前記条件生成機能では、前記監視不良の場合に前記1つの副条件の設定変更が必要であることを示す要設定変更情報を前記1つの副条件に対応づけて前記分析履歴蓄積処理機能の対応箇所に書き込む機能をその内容とし、これを前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 20]
In the monitoring device program according to attachment 19,
In the condition generation function, the setting change information indicating that the setting change of the one sub-condition is necessary in the case of the monitoring failure is associated with the one sub-condition and the corresponding part of the analysis history accumulation processing function A program for a monitoring apparatus, which has the function of writing to the contents as a content and causes the computer to execute the function.

〔付記21〕
付記20に記載の監視装置用プログラムにおいて、
前記条件生成機能では、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能をその内容とし、これを前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 21]
In the monitoring device program according to attachment 20,
In the condition generation function, the main condition becomes true based on the history of the performance information of the analysis history accumulation processing function when the state of the service execution environment is a determination result that the main condition is true. If the performance condition information indicating the status of the service execution environment is smaller than the secondary condition, the maximum value of the performance information is set as a threshold value. A program for a monitoring apparatus, characterized in that a function for generating the threshold value as a new subcondition is included in the content and causing the computer to execute the function.

〔付記22〕
付記21に記載の監視装置用プログラムにおいて、
前記条件生成機能では、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能をその内容とし、これを前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 22]
In the monitoring device program according to attachment 21,
In the condition generation function, the main condition becomes true based on the history of the performance information of the analysis history accumulation processing function when the state of the service execution environment is a determination result that the main condition is true. If the performance information indicating the status of the service execution environment is greater than the sub-condition, the minimum value of the performance information is set as a threshold value. A program for a monitoring apparatus, characterized in that a function for generating the threshold value as a new subcondition is included in the content and causing the computer to execute the function.

〔付記23〕
付記22に記載の監視装置用プログラムにおいて、
前記条件生成機能では、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能をその内容とし、これを前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 23]
In the monitoring device program according to attachment 22,
In the condition generation function, when the state of the service execution environment is a determination result that is false not satisfying the main condition, the main condition is false based on the history of the performance information of the analysis history accumulation processing function. If the performance condition information indicating the status of the service execution environment is smaller than the secondary condition, the minimum value of the performance information is thresholded. A program for a monitoring apparatus, characterized in that a function for generating a threshold value as a new subcondition is calculated as a value, and causing the computer to execute the function.

〔付記24〕
付記23に記載の監視装置用プログラムにおいて、
前記条件生成機能では、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能をその内容とし、これを前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 24]
In the monitoring device program according to attachment 23,
In the condition generation function, when the state of the service execution environment is a determination result that is false not satisfying the main condition, the main condition is false based on the history of the performance information of the analysis history accumulation processing function. If the performance condition information indicating the status of the service execution environment is greater than the secondary condition, the maximum value of the performance information is determined. A program for a monitoring apparatus, characterized in that a function for generating a threshold value as a new subcondition is calculated as a value, and causing the computer to execute the function.

〔付記25〕
付記24に記載の監視装置用プログラムにおいて、
前記新たな副条件を前記分析履歴蓄積処理機能の対応箇所に書き込んで情報更新を行うとともに、この新たな副条件を外部に告知する監視ルール更新機能を更に前記コンピュータに実行させることを特徴とする監視装置用プログラム。
[Appendix 25]
In the monitoring device program according to attachment 24,
The new sub-condition is written in the corresponding part of the analysis history accumulation processing function to update the information, and the monitoring rule update function for notifying the new sub-condition to the outside is further executed by the computer. Monitoring device program.

本発明は、監視システム全般に利用できる。   The present invention can be used in general monitoring systems.

1 監視システム
10 マネージャ装置(監視装置)
11 分析部
12 監視ルール蓄積部
13 監視不良検証部
14 障害表示部
15 監視不良表示部
16 監視ルール更新部
17 コマンド発行部
18 条件生成部
19 分析履歴蓄積部
20 エージェント装置
21 監視部
22 制御部
30 サービス実行環境
1 Monitoring system 10 Manager device (monitoring device)
DESCRIPTION OF SYMBOLS 11 Analysis part 12 Monitoring rule storage part 13 Monitoring failure verification part 14 Fault display part 15 Monitoring failure display part 16 Monitoring rule update part 17 Command issuing part 18 Condition generation part 19 Analysis history storage part 20 Agent apparatus 21 Monitoring part 22 Control part 30 Service execution environment

Claims (10)

監視対象となるサービス実行環境の状態を把握するためのエージェント装置と、前記サービス実行環境の監視ルールを管理するためのマネージャ装置とを有し、前記マネージャ装置が、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定する分析部を備えると共に、この複数の各監視条件での各判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知可能とした監視システムであって、
前記マネージャ装置が、
前記各判定に使用された前記各監視条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積する分析履歴蓄積部と、
前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成部と、を備えていることを特徴とする監視システム。
An agent device for grasping a status of a service execution environment to be monitored; and a manager device for managing a monitoring rule of the service execution environment, wherein the manager device has the status of the service execution environment An analysis unit that determines whether or not each of the plurality of monitoring conditions defined in the monitoring rule is satisfied, and monitoring setting related to each of the monitoring conditions by detecting a difference of each determination in each of the plurality of monitoring conditions Is a monitoring system that can notify of a monitoring failure indicating that the
The manager device is
An analysis history accumulating unit for accumulating each performance information as a history, which is the state of the service execution environment corresponding to each of the monitoring conditions used for each of the determinations;
When each of the plurality of monitoring conditions results in a different determination result, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result. And a condition generation unit that generates a threshold value as a new monitoring condition for correcting the monitoring failure.
請求項1に記載の監視システムにおいて、
前記複数の各監視条件は、主条件と1以上の副条件とを含み、
前記条件生成部が、前記主条件の判定結果と1つの前記副条件の判定結果とが異なる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件の判定結果と前記1つの副条件の判定結果とが同一となるような前記1つの副条件にかかる前記性能情報をしきい値として算出すると共に、このしきい値を新たな1つの副条件として生成する機能を備えていることを特徴とする監視システム。
The monitoring system according to claim 1,
Each of the plurality of monitoring conditions includes a main condition and one or more sub-conditions,
When the condition generation unit is different from the determination result of the main condition and the determination result of one sub-condition, the determination result of the main condition and the 1 of the determination result based on the history of the performance information of the analysis history storage unit A function for calculating, as a threshold value, the performance information relating to the one sub-condition so that the determination results of the two sub-conditions are the same, and generating a threshold value as a new sub-condition A surveillance system characterized by
請求項2に記載の監視システムにおいて、
前記条件生成部が、前記監視不良の場合に前記1つの副条件の設定変更が必要であることを示す要設定変更情報を、前記1つの副条件に対応づけて前記分析履歴蓄積部の対応箇所に書き込む機能を備えていることを特徴とする監視システム。
The monitoring system according to claim 2,
The condition generation unit associates the required setting change information indicating that it is necessary to change the setting of the one sub-condition in the case of the monitoring failure with the one sub-condition. A monitoring system characterized by having a function of writing to the computer.
請求項3に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
The monitoring system according to claim 3,
When the condition generation unit has a determination result that the condition of the service execution environment is true satisfying the main condition, the main condition is true based on the performance information history of the analysis history storage unit. If the sub-condition with the required setting change information is taken out and the performance information indicating the state of the service execution environment is smaller than the sub-condition, the maximum value of the performance information is used as a threshold value. A monitoring system having a function of calculating and generating this threshold value as a new subcondition.
請求項4に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たす真となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が真となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
The monitoring system according to claim 4, wherein
When the condition generation unit has a determination result that the condition of the service execution environment is true satisfying the main condition, the main condition is true based on the performance information history of the analysis history storage unit. If the sub-condition with the required setting change information is taken out and the performance information indicating the state of the service execution environment is larger than the sub-condition, the minimum value of the performance information is used as a threshold value. A monitoring system having a function of calculating and generating this threshold value as a new subcondition.
請求項5に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも小さいならば、当該性能情報の最小値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
The monitoring system according to claim 5, wherein
When the condition generation unit has a determination result that the state of the service execution environment is false that does not satisfy the main condition, the main condition becomes false based on the performance information history of the analysis history storage unit. If the performance information indicating the status of the service execution environment is smaller than the sub-condition, the minimum value of the performance information is set as a threshold value. And a function of generating the threshold value as a new sub-condition.
請求項6に記載の監視システムにおいて、
前記条件生成部が、前記サービス実行環境の状態が前記主条件を満たさない偽となる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記主条件が偽となるものであって前記要設定変更情報が付されている前記副条件を取り出し、前記サービス実行環境の状態を示す性能情報がこの副条件よりも大きいならば、当該性能情報の最大値をしきい値として算出しこのしきい値を新たな副条件として生成する機能を備えていることを特徴とする監視システム。
The monitoring system according to claim 6, wherein
When the condition generation unit has a determination result that the state of the service execution environment is false that does not satisfy the main condition, the main condition becomes false based on the performance information history of the analysis history storage unit. If the performance condition information indicating the status of the service execution environment is larger than the secondary condition, the maximum value of the performance information is set as a threshold value. And a function of generating the threshold value as a new sub-condition.
監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理する機能と、前記サービス実行環境の状態が前記監視ルールに定義された複数の各監視条件を満たすか否かを判定する機能と、前記複数の各監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知する機能とを備えた監視装置であって、
前記各判定に使用された前記各条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積する分析履歴蓄積部を備えると共に、
前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として生成する条件生成部を備えたことを特徴とする監視装置。
A function for managing the monitoring rules of the service execution environment via an agent device for grasping the status of the service execution environment to be monitored, and a plurality of monitors in which the status of the service execution environment is defined in the monitoring rule Announces a monitoring failure indicating that the monitoring setting for each monitoring condition is inappropriate by detecting the difference between the function for determining whether the condition is satisfied and the determination of each of the plurality of monitoring conditions A monitoring device having a function to
An analysis history accumulating unit for accumulating each performance information as a history, which is the state of the service execution environment corresponding to each of the conditions used for each of the determinations;
When each of the plurality of monitoring conditions results in a different determination result, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result. A monitoring apparatus comprising: a condition generation unit that generates a threshold value as a new monitoring condition for correcting the monitoring failure.
監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理し、前記サービス実行環境の状態が前記監視ルールに定義された複数の監視条件を満たすか否かを判定し、この複数の監視条件での各々の判定の違いを検出することで当該各監視条件にかかる監視設定が不適切であることを示す監視不良を告知するサービス実行環境の監視方法であって、
前記各判定に使用された前記各監視条件に対応する前記サービス実行環境の状態である各性能情報を履歴として分析履歴蓄積部が各々蓄積し、
前記複数の各監視条件が異なる判定結果となる場合に、前記分析履歴蓄積部の前記性能情報の履歴に基づいて前記複数の各監視条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな監視条件として条件生成部が生成する、ことを特徴とするサービス実行環境の監視方法。
The monitoring rules of the service execution environment are managed via an agent device for grasping the status of the service execution environment to be monitored, and the status of the service execution environment satisfies a plurality of monitoring conditions defined in the monitoring rule Monitoring the service execution environment to notify the monitoring failure indicating that the monitoring setting for each of the monitoring conditions is inappropriate by detecting the difference in the determinations of the plurality of monitoring conditions A method,
The analysis history accumulating unit accumulates each performance information that is the state of the service execution environment corresponding to each monitoring condition used for each determination as a history,
When each of the plurality of monitoring conditions results in a different determination result, a threshold value is calculated based on the performance information history of the analysis history storage unit so that the plurality of monitoring conditions have the same determination result. A service execution environment monitoring method, characterized in that a condition generation unit generates a threshold value as a new monitoring condition for correcting the monitoring failure.
監視対象となるサービス実行環境の状態を把握するためのエージェント装置を介して前記サービス実行環境の監視ルールを管理し、前記サービス実行環境の状態が前記監視ルールに定義された複数の各条件を満たすか否かを判定し、この複数の各条件での各々の判定の違いを検出することで当該各条件にかかる監視設定が不適切であることを示す監視不良を告知可能とした監視装置が備えたコンピュータに、
前記各判定に使用された前記各条件に各々対応する前記サービス実行環境の状態である各性能情報を履歴として各々蓄積処理する分析履歴蓄積処理機能と、
前記複数の各条件が異なる判定結果となる場合に、前記分析履歴蓄積処理機能の前記性能情報の履歴に基づいて前記複数の各条件が同一の判定結果となるしきい値を算出しこのしきい値を前記監視不良の修正にかかる新たな条件として生成する条件生成機能と、
を実行させることを特徴とする監視装置用プログラム。
The monitoring rules of the service execution environment are managed via an agent device for grasping the status of the service execution environment to be monitored, and the status of the service execution environment satisfies a plurality of conditions defined in the monitoring rule And a monitoring device that can notify a monitoring failure indicating that the monitoring setting for each of the conditions is inappropriate by detecting whether or not each of the plurality of conditions is different. Computer
An analysis history accumulation processing function for accumulating each performance information as a history, which is a state of the service execution environment corresponding to each of the conditions used for each determination;
If the plurality of conditions result in different determination results, a threshold is calculated based on the performance information history of the analysis history storage processing function so that the plurality of conditions have the same determination result. A condition generation function for generating a value as a new condition for correcting the monitoring failure;
A program for a monitoring device, characterized by causing
JP2010061524A 2010-03-17 2010-03-17 Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device Withdrawn JP2011197817A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010061524A JP2011197817A (en) 2010-03-17 2010-03-17 Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010061524A JP2011197817A (en) 2010-03-17 2010-03-17 Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device

Publications (1)

Publication Number Publication Date
JP2011197817A true JP2011197817A (en) 2011-10-06

Family

ID=44875974

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010061524A Withdrawn JP2011197817A (en) 2010-03-17 2010-03-17 Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device

Country Status (1)

Country Link
JP (1) JP2011197817A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5483784B1 (en) * 2013-05-23 2014-05-07 日本電信電話株式会社 CONTROL DEVICE, COMPUTER RESOURCE MANAGEMENT METHOD, AND COMPUTER RESOURCE MANAGEMENT PROGRAM
WO2016016926A1 (en) * 2014-07-28 2016-02-04 株式会社日立製作所 Management calculator and method for evaluating performance threshold value
WO2016129093A1 (en) * 2015-02-13 2016-08-18 三菱電機株式会社 Log trace device and log trace program

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5483784B1 (en) * 2013-05-23 2014-05-07 日本電信電話株式会社 CONTROL DEVICE, COMPUTER RESOURCE MANAGEMENT METHOD, AND COMPUTER RESOURCE MANAGEMENT PROGRAM
WO2016016926A1 (en) * 2014-07-28 2016-02-04 株式会社日立製作所 Management calculator and method for evaluating performance threshold value
WO2016129093A1 (en) * 2015-02-13 2016-08-18 三菱電機株式会社 Log trace device and log trace program
JPWO2016129093A1 (en) * 2015-02-13 2017-06-08 三菱電機株式会社 Log trace device and log trace program
GB2549867A (en) * 2015-02-13 2017-11-01 Mitsubishi Electric Corp Log trace device and log trace program
US9900331B2 (en) 2015-02-13 2018-02-20 Mitsubishi Electric Corporation Log tracing apparatus and non-transitory computer-readable medium storing a log tracing program

Similar Documents

Publication Publication Date Title
US8352789B2 (en) Operation management apparatus and method thereof
US8645769B2 (en) Operation management apparatus, operation management method, and program storage medium
US9778972B2 (en) Operation management device, operation management method
JP5277667B2 (en) Failure analysis system, failure analysis method, failure analysis server, and failure analysis program
WO2014085087A1 (en) Transmission of notifications to multiple devices associated with a user
US10437695B2 (en) Fault information providing server and fault information providing method for users of in-vehicle terminals
WO2018227997A1 (en) Traffic data self-recovery processing method, readable storage medium, server and apparatus
JP6752739B2 (en) Maintenance equipment, presentation system and program
US10581665B2 (en) Content-aware anomaly detection and diagnosis
WO2018216197A1 (en) Anomaly seriousness computation system, anomaly seriousness computation device, and anomaly seriousness computation program
CN111104283A (en) Fault detection method, device, equipment and medium of distributed storage system
JP2012080181A (en) Method and program for fault information management
JP2009159448A (en) Object detecting apparatus, and object detecting method
JP2011197817A (en) Monitoring system, monitoring device, method for monitoring service execution environment, and program for monitoring device
US9356848B2 (en) Monitoring apparatus, monitoring method, and non-transitory storage medium
JP2008288870A (en) Video surveillance system and video surveillance method
JP4867908B2 (en) Monitoring system, network monitoring apparatus, and service execution environment monitoring method
JP2013080354A (en) Monitoring device and monitoring method
JP2014153736A (en) Fault symptom detection method, program and device
US10295965B2 (en) Apparatus and method for model adaptation
JP2011039676A (en) Monitoring device and alarm notifying method
CN115497262A (en) Nuclear power station alarm system and alarm method
CN108880881A (en) The method and apparatus of monitoring resource under a kind of cloud environment
JP2012059151A (en) Monitoring control device
JP2010204924A (en) Monitoring control system and monitoring method for maintenance apparatus

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20130604