JP2024141095A - Event management program, event management method, and information processing device - Google Patents
Event management program, event management method, and information processing device Download PDFInfo
- Publication number
- JP2024141095A JP2024141095A JP2023052558A JP2023052558A JP2024141095A JP 2024141095 A JP2024141095 A JP 2024141095A JP 2023052558 A JP2023052558 A JP 2023052558A JP 2023052558 A JP2023052558 A JP 2023052558A JP 2024141095 A JP2024141095 A JP 2024141095A
- Authority
- JP
- Japan
- Prior art keywords
- event
- past
- handling
- ease
- coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、イベント管理プログラム、イベント管理方法、および情報処理装置に関する。 The present invention relates to an event management program, an event management method, and an information processing device.
運用中のコンピュータシステムは、運用担当者によって動作状況が監視される。システムの監視作業では、複数のシステムから発生する大量のイベントを、例えば複数の運用担当者が確認する。 The operating status of computer systems in operation is monitored by operations personnel. In system monitoring, for example, multiple operations personnel check a large number of events occurring from multiple systems.
システムの監視を支援する技術としては、例えば、状況や目的によって変化する必要なアラートを、容易に設定可能なフィルタ条件で選択して画面に表示するアラート表示装置が提案されている。複数のイベントが複合的に原因となる不具合の発生原因およびその対策を特定することを可能とするネットワーク運用管理システムも提供されている。機器等に発生した事象への対応を、より早く正確に実行できるようにユーザを支援する事象対応支援装置も提案されている。アラートの監視の負荷を軽減することが可能な監視装置も提案されている。情報システムの運用を安定的に行うことが可能な担当者割当装置も提案されている。さらに各トラブル事例情報に記載されているトラブルの様々な要因に立脚したトラブル回避難易度を適切に判定することが可能なトラブル情報分析プログラムも提案されている。 As a technology to support system monitoring, for example, an alert display device has been proposed that uses easily configurable filter conditions to select and display on a screen the necessary alerts that change depending on the situation and purpose. A network operation management system has also been provided that makes it possible to identify the cause of a malfunction caused by a combination of multiple events and how to deal with it. An event response support device has also been proposed that supports users to respond more quickly and accurately to events that occur in equipment, etc. A monitoring device that can reduce the burden of monitoring alerts has also been proposed. A personnel allocation device that can ensure stable operation of information systems has also been proposed. In addition, a trouble information analysis program has also been proposed that can appropriately determine the difficulty of avoiding a trouble based on the various causes of the trouble described in each trouble case information.
システムで発生するイベントの中には対処が容易なものと対処が難しいものとが混在している。そこで、例えばイベントの対処難易度を個別に事前定義しておくことが考えられる。この場合、運用担当者は、発生したイベントに対して予め定義された対処難易度を参照することで、そのイベントへの対処し易さを把握できる。 Events that occur in a system are a mixture of easy and difficult to deal with. For this reason, it may be possible to predefine the difficulty of dealing with each event individually. In this case, operations personnel can refer to the predefined difficulty of dealing with the event that has occurred to understand how easy it is to deal with that event.
しかし、イベントへの対処は、ある運用担当者にとっては難しくても他の運用担当者にとっては簡単など、対処のし易さが人によって異なる。また同じ運用担当者でも、長期間対処していないイベントだと対処難易度は高くなる。そのため、イベントごとに事前定義された対処難易度を運用担当者に提示するだけでは、運用担当者は、発生したイベントに対する対処し易さを正しく把握することができない。 However, the ease with which an event can be dealt with varies from person to person; what may be difficult for one operations staff member is easy for another. Also, even for the same operations staff, the difficulty of dealing with an event can increase if the staff member has not dealt with it for a long time. For this reason, simply presenting operations staff with a predefined level of difficulty for each event will prevent them from correctly understanding the ease with which they can deal with the event that has occurred.
1つの側面では、本件は、イベントに対する運用担当者の対処し易さを容易に把握できるようにすることを目的とする。 In one aspect, the present invention aims to make it easier for operators to understand how easily they can handle an event.
1つの案では、以下の処理をコンピュータに実行させるイベント管理プログラムが提供される。
コンピュータは、コンピュータシステムで発生した新規イベントの発生日時および属性を示す新規イベント情報を取得する。コンピュータは、運用担当者が対処した過去イベントの発生日時および属性を示す過去イベント情報に基づいて、過去イベントのうち、新規イベントと属性に共通性のある第1の過去イベントを特定する。コンピュータは、第1の過去イベントの発生日時と新規イベントの発生日時との差分を計算する。そしてコンピュータは、差分に基づいて、新規イベントへの運用担当者の対処容易度を計算する。
In one proposal, an event management program is provided that causes a computer to perform the following processes.
The computer acquires new event information indicating the occurrence date and attribute of a new event that has occurred in a computer system. The computer identifies a first past event having attributes common to the new event among past events based on past event information indicating the occurrence date and attribute of a past event handled by an operations staff. The computer calculates the difference between the occurrence date and time of the first past event and the occurrence date and time of the new event. The computer then calculates the ease with which the operations staff can handle the new event based on the difference.
1態様によれば、イベントに対する運用担当者の対処し易さを容易に把握することが可能となる。 According to one aspect, it is possible to easily understand the ease with which an operations staff member can handle an event.
以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
〔第1の実施の形態〕
第1の実施の形態は、イベントに対する運用担当者の対処し易さを容易に把握することが可能なイベント管理方法である。
Hereinafter, the present embodiment will be described with reference to the drawings. Note that each embodiment can be implemented in combination with a plurality of other embodiments as long as no contradiction occurs.
First Embodiment
The first embodiment is an event management method that makes it possible to easily grasp the ease with which an operation person can handle an event.
図1は、第1の実施の形態に係るイベント管理方法の一例を示す図である。図1には、イベント管理方法を実現する情報処理装置10が示されている。情報処理装置10は、例えばイベント管理プログラムを実行することにより、イベント管理方法を実施することができる。 FIG. 1 is a diagram showing an example of an event management method according to a first embodiment. FIG. 1 shows an information processing device 10 that realizes the event management method. The information processing device 10 can implement the event management method by, for example, executing an event management program.
情報処理装置10は、記憶部11と処理部12とを有する。記憶部11は、例えば情報処理装置10が有するメモリまたはストレージ装置である。処理部12は、例えば情報処理装置10が有するプロセッサまたは演算回路である。
The information processing device 10 has a memory unit 11 and a
記憶部11は、過去イベント情報11a、第1の係数11b、および第2の係数を記憶する。
過去イベント情報11aは、コンピュータシステム1a,1b,1c(以下、単にシステムと呼ぶこともある)で過去に発生して運用担当者2~4が対処した過去イベントを示す情報である。例えば過去イベント情報11aには、過去イベントの発生日時、イベントの属性(発生元のシステム、発生元のソフトウェアの種別、メッセージ)、対処した担当者名などが含まれる。発生元のシステム、発生元のソフトウェアの種別は、発生元に関する属性である。メッセージは、イベントの発生原因、発生した理由、起きた事象に関する属性である。メッセージに代えて、例えばエラーコードが用いられてもよい。
The storage unit 11 stores past event information 11a, a first coefficient 11b, and a second coefficient.
The past event information 11a is information indicating past events that occurred in the past in
第1の係数11bは、運用担当者2~4それぞれのイベントへの対処能力を示す情報である。第2の係数11cは、新規イベントと過去イベントとの発生元に関する属性の同一性の度合いに応じた値を示す情報である。例えば第2の係数11cとして、発生元のシステムとソフトウェアの種別とが同一の場合、システムのみが同一の場合のそれぞれに対応する値が設定されている。
The first coefficient 11b is information indicating the ability of each of the
処理部12は、コンピュータシステム1a,1b,1cで発生した新規イベントを示す新規イベント情報5を取得する。新規イベント情報5には、イベントが発生した日時、発生元のシステム、発生元のソフトウェアの種別、イベントの内容を示すメッセージなどが含まれる。処理部12は、運用担当者2~4それぞれについて、過去イベント情報11aに基づいて、その運用担当者が対処した過去イベントのうち、新規イベントと属性に共通性のある第1の過去イベントを特定する。属性に共通性のある第1の過去イベントとは、例えば新規イベントと同じソフトウェアによる同じメッセージの過去イベントである。また処理部12は、新規イベントと発生元のシステムが共通の過去イベントを、第1の過去イベントとして特定することもできる。
The
処理部12は、第1の過去イベントの発生日時と新規イベントの発生日時との差分を計算する。そして処理部12は、計算した差分に基づいて、新規イベントへの運用担当者の対処容易度を計算する。例えば処理部12は、差分が大きいほど対処容易度を低い値とする。
The
処理部12は、計算した対処容易度を示す対処容易度情報6を、運用担当者2~4それぞれが使用する端末のモニタに表示させる。対処容易度情報6には、新規イベントに対する運用担当者2~4の対処の優先順位が示されている。対処容易度が高い運用担当者ほど対処の優先順位が高い。運用担当者2~4は、対処容易度情報6を参照することで、新規イベントに対する自身の対処し易さ、および対処するのに適しているのが誰なのかを容易に把握することができる。
The
しかも対処容易度は、新規イベントと属性に共通性のある過去のイベントを対処してから経過した期間が長いほど低い値となる。そのため、同様のイベントへの対処経験の時間による忘却を反映させた対処容易度が得られる。 Moreover, the ease of handling will be lower the longer it has been since a past event with attributes in common with the new event was handled. This means that the ease of handling will reflect forgetting over time of dealing with similar events.
なお処理部12は、運用担当者2~4のイベントへの対処能力を示す第1の係数11bに基づいて、対処容易度を計算することができる。例えば処理部12は、運用担当者2~4それぞれの第1の係数の値(0以上1未満の実数)を底とし、発生日時の差分を冪指数とした冪乗の値を、対処容易度とする。また、対処容易度は、第1の係数の値が大きいほど高い値となる。これにより、運用担当者2~4それぞれについて、イベント全般への対処能力の高さを反映させた対処容易度が得られる。
The
処理部12は、新規イベントと過去イベントとの発生元に関する属性の同一性が高いほど高い値となる第2の係数11cと、第1の係数11bとに基づいて、対処容易度を計算することもできる。例えば処理部12は、運用担当者2~4それぞれの第1の係数の値を底とし、発生日時の差分を冪指数とした冪乗の値を計算する。処理部12は、運用担当者2~4それぞれについて計算した冪乗の値に、その運用担当者が対処した過去イベントと新規イベントとの発生元の属性の同一性に応じた第2の係数の値を乗算し、乗算結果を対処容易度とする。このように処理部12は、イベント間の発生元の属性の同一性を用いて対処容易度を計算することで、発生元の属性の同一性が高い過去イベントに対処した経験のある運用担当者ほど、対処容易度を高くすることができる。
The
図1の例では、「担当者A」は、新規イベント情報5に示される新規イベントと同一のイベントに対処したことがある。そのため「担当者A」が対処した過去イベント(過去イベント情報11aの先頭のイベント)に基づいて、「担当者A」の対処容易度が計算されている。すなわち「担当者A」の第1の係数の値「a1」を底とし、発生日時の差分「n1=T4-T1」を冪指数とした冪乗の値「a1n1」が、「担当者A」の対処容易度となる。 1, "person in charge A" has dealt with the same event as the new event shown in the new event information 5. Therefore, the ease of handling for "person in charge A" is calculated based on the past event that "person in charge A" dealt with (the first event in the past event information 11a). In other words, the ease of handling for "person in charge A" is calculated by taking the value "a1" of the first coefficient for "person in charge A" as the base and exponent "n1=T4-T1", which is the power value "a1 n1 ".
「担当者B」は、新規イベント情報5に示される新規イベントと同じシステムを発生元とするイベントに対処したことがある。そのため「担当者B」が対処した過去イベント(過去イベント情報11aの2つ目のイベント)に基づいて、「担当者B」の対処容易度が計算されている。なお発生元のシステムが同じ場合の第2の係数の値は「0.1」である。そこで「担当者B」の第1の係数の値「a2」を底とし、発生日時の差分「n2=T4-T2」を冪指数とした冪乗の値「a2n2」に第2の係数の値「0.1」を乗算した結果「a2n2×0.1」が、「担当者B」の対処容易度となる。 "Person in charge B" has dealt with an event that originated from the same system as the new event shown in the new event information 5. Therefore, the ease of handling for "person in charge B" is calculated based on the past event that "person in charge B" dealt with (the second event in the past event information 11a). Note that the value of the second coefficient is "0.1" when the originating systems are the same. Therefore, the value of the first coefficient "a2" for "person in charge B" is used as the base, and the difference in occurrence date and time "n2=T4-T2" is used as the exponent. The result of multiplying this value by the value of the second coefficient " 0.1 " is "a2 n2 ×0.1", which is the ease of handling for "person in charge B".
「担当者C」は、新規イベントと同一のイベントも、発生元の属性の同一性を有するイベントも対処した経験がない。そのため、「担当者C」の対処容易度は「0」となる。
なお、処理部12は、ある運用担当者について第1の過去イベントが複数特定された場合、特定された第1の過去イベントそれぞれについて、差分に基づいて、第1の過去イベントの評価値を計算する。そして処理部12は、第1の過去イベントごとの評価値の合計を対処容易度とする。これにより、新規イベントと同じイベントまたは発生元の属性の同一性があるイベントを多く対処した運用担当者ほど、対処容易度が高くなる。
"Person in charge C" has no experience in dealing with either the same event as the new event or an event that has the same source attribute as the new event. Therefore, the handling ease of "Person in charge C" is "0".
When a plurality of first past events are identified for a certain operations staff, the
また、処理部12は、図1に示すように運用担当者2~4が複数存在する場合、第1の過去イベントを特定する処理、差分を計算する処理、および運用担当者ごとの第1の係数に基づいて対処容易度を計算する処理を、運用担当者ごとに実行する。このとき、処理部12は、新規イベントに対して誰が対処したのかにもとづいて、運用担当者ごとの第1の係数11bの値を更新してもよい。例えば処理部12は、対処容易度に基づいて対処するのが適切と判断される第1の運用担当者が新規イベントに対処したのか、第1の運用担当者以外の第2の運用担当者が新規イベントに対処したのかに基づいて、第1の係数11bの値を更新する。これにより第1の係数11bの値が動的に更新され、対処容易度の精度が向上する。
In addition, when there are
〔第2の実施の形態〕
第2の実施の形態は、クラウドコンピューティングシステム(以下、クラウドシステムと呼ぶ)を利用してサービスを提供する企業の運用担当者によるサービスの運用状況の監視を支援する監視システムである。
Second Embodiment
The second embodiment is a monitoring system that supports monitoring of the operational status of a service by an operations person of a company that provides the service using a cloud computing system (hereinafter, referred to as a cloud system).
図2は、監視システムの一例を示す図である。クラウドシステム200は、複数のサーバ210,220,230で構成される。各サーバ210,220,230は、ネットワーク20に接続されている。ネットワーク20には、さらに運用管理サーバ100と端末31~33が接続されている。運用管理サーバ100は、クラウドシステム200上で運用されているサービスを監視するためのコンピュータである。端末31~33は、運用管理サーバ100を利用して、発生したイベントを確認し、そのイベントに対する対処する運用担当者41~43が利用するコンピュータである。
Figure 2 is a diagram showing an example of a monitoring system.
図3は、運用管理サーバのハードウェアの一例を示す図である。運用管理サーバ100は、プロセッサ101によって装置全体が制御されている。プロセッサ101には、バス109を介してメモリ102と複数の周辺機器が接続されている。プロセッサ101は、マルチプロセッサであってもよい。プロセッサ101は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)、またはDSP(Digital Signal Processor)である。プロセッサ101がプログラムを実行することで実現する機能の少なくとも一部を、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)などの電子回路で実現してもよい。
Figure 3 is a diagram showing an example of hardware of an operation management server. The
メモリ102は、運用管理サーバ100の主記憶装置として使用される。メモリ102には、プロセッサ101に実行させるOS(Operating System)のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、メモリ102には、プロセッサ101による処理に利用する各種データが格納される。メモリ102としては、例えばRAM(Random Access Memory)などの揮発性の半導体記憶装置が使用される。
The
バス109に接続されている周辺機器としては、ストレージ装置103、GPU(Graphics Processing Unit)104、入力インタフェース105、光学ドライブ装置106、機器接続インタフェース107およびネットワークインタフェース108がある。
Peripheral devices connected to the bus 109 include a
ストレージ装置103は、内蔵した記録媒体に対して、電気的または磁気的にデータの書き込みおよび読み出しを行う。ストレージ装置103は、運用管理サーバ100の補助記憶装置として使用される。ストレージ装置103には、OSのプログラム、アプリケーションプログラム、および各種データが格納される。なお、ストレージ装置103としては、例えばHDD(Hard Disk Drive)やSSD(Solid State Drive)を使用することができる。
The
GPU104は画像処理を行う演算装置である。GPU104は、グラフィックコントローラの一例である。GPU104には、モニタ21が接続されている。GPU104は、プロセッサ101からの命令に従って、画像をモニタ21の画面に表示させる。モニタ21としては、有機EL(Electro Luminescence)を用いた表示装置や液晶表示装置などがある。
The
入力インタフェース105には、キーボード22とマウス23とが接続されている。入力インタフェース105は、キーボード22やマウス23から送られてくる信号をプロセッサ101に送信する。なお、マウス23は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。
The
光学ドライブ装置106は、レーザ光などを利用して、光ディスク24に記録されたデータの読み取り、または光ディスク24へのデータの書き込みを行う。光ディスク24は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク24には、DVD(Digital Versatile Disc)、DVD-RAM、CD-ROM(Compact Disc Read Only Memory)、CD-R(Recordable)/RW(ReWritable)などがある。
The
機器接続インタフェース107は、運用管理サーバ100に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース107には、メモリ装置25やメモリリーダライタ26を接続することができる。メモリ装置25は、機器接続インタフェース107との通信機能を搭載した記録媒体である。メモリリーダライタ26は、メモリカード27へのデータの書き込み、またはメモリカード27からのデータの読み出しを行う装置である。メモリカード27は、カード型の記録媒体である。
The
ネットワークインタフェース108は、ネットワーク20に接続されている。ネットワークインタフェース108は、ネットワーク20を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。ネットワークインタフェース108は、例えばスイッチやルータなどの有線通信装置にケーブルで接続される有線通信インタフェースである。またネットワークインタフェース108は、基地局やアクセスポイントなどの無線通信装置に電波によって通信接続される無線通信インタフェースであってもよい。
The
運用管理サーバ100は、以上のようなハードウェアによって、第2の実施の形態の処理機能を実現することができる。なお、第1の実施の形態に示した情報処理装置10も、図3に示した運用管理サーバ100と同様のハードウェアにより実現することができる。
The
運用管理サーバ100は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第2の実施の形態の処理機能を実現する。運用管理サーバ100に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、運用管理サーバ100に実行させるプログラムをストレージ装置103に格納しておくことができる。プロセッサ101は、ストレージ装置103内のプログラムの少なくとも一部をメモリ102にロードし、プログラムを実行する。また運用管理サーバ100に実行させるプログラムを、光ディスク24、メモリ装置25、メモリカード27などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ101からの制御により、ストレージ装置103にインストールされた後、実行可能となる。またプロセッサ101が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
The
以上のような監視システムにより、運用担当者41~43は、クラウドシステム200上のサービスの運用状況を監視することができる。システム監視では、複数のサーバ210,220,230から発生する大量のイベントを複数の運用担当者41~43が手分けして確認する。
The above-described monitoring system allows the operations personnel 41-43 to monitor the operational status of services on the
以下、図4を参照し、複数の運用担当者41~43によるシステム監視において、イベントの対処する運用担当者を適切に決定することの困難性について説明する。
図4は、イベントに対処する運用担当者を適切に決定するのが困難となる場合の一例を示す図である。図4の例では、サーバ210でイベントが発生した場合が想定されている。イベントが発生すると、サーバ210は、イベントの発生を示すアラート51を出力する。アラート51には、例えばイベント発生元のアプリケーション(以下、アプリと呼ぶ)の種別、新規イベントを示すメッセージなどが含まれる。
Hereinafter, with reference to FIG. 4, a description will be given of the difficulty in appropriately determining which operator should handle an event when a system is monitored by a plurality of
Fig. 4 is a diagram showing an example of a case where it is difficult to appropriately determine an operations person to handle an event. In the example of Fig. 4, a case is assumed where an event occurs in the
発生するイベントの中には対処が容易なものや対処が難しいものが混在する。そこで、イベントの対処の難易度を個別に事前定義しておくことができる。例えばサーバ210で動作している複数のアプリそれぞれで発生するイベントの種別ごとに、そのイベントメッセージのひな型またはイベントメッセージ内の特定ワードに応じた難易度が事前定義されているものとする。この場合、運用担当者41~43は、アラート51に示されるイベントの情報に基づいて、新規イベントの難易度を判定することが可能である。
Some events that occur are easy to deal with, while others are difficult to deal with. Therefore, the difficulty of dealing with each event can be predefined individually. For example, for each type of event that occurs in each of multiple applications running on
図4の例では、難易度「中」と判定されている。しかしイベントの対処の難易度は、ある担当者にとっては難しくても他の人にとっては簡単など、運用担当者によって異なる。
例えば運用担当者41は業務経験の長いベテランの担当者であり、運用担当者42は、ある程度の経験を積んだ中堅の担当者であり、運用担当者43は経験が浅い新人の担当者であるものとする。このとき運用担当者41は、新規イベントを簡単に対処することができる。他方、運用担当者42は、新規イベントと同様のイベントへの対処経験はあるものの、その経験から時間が経っているものとする。その場合、運用担当者42は、過去に行った対処方法を部分的に忘れてしまっており、対処に時間を要する可能性がある。運用担当者43については、経験と知識が不足しており、新規イベントへの対処ができない。
In the example of Fig. 4, the difficulty level is determined to be "medium." However, the difficulty level of dealing with an event varies depending on the operations staff; for example, what may be difficult for one staff member is easy for another.
For example, assume that
このようにイベントに設定された対処難易度が「中」であっても、実際の難易度は運用担当者ごとに異なる。しかも同じ運用担当者でも、長期間対処していないイベントだと対処難易度は高くなる。そのため、従来の事前定義に基づく固定的な方法では、イベントの難易度を適切に設定することができない。 Even if the difficulty level of an event is set to "medium," the actual difficulty level will vary depending on the operator. Furthermore, even for the same operator, the difficulty level will be higher if the event has not been handled for a long time. For this reason, the conventional method based on a fixed, predefined level of difficulty cannot be used to set the difficulty level of an event appropriately.
発生するイベントの数が少なければ、新規イベントごとにベテランの運用担当者が、そのイベントを対処する運用担当者を決めることも可能である。しかし多くのユーザにサービスを提供するシステムでは、大量のイベントが発生する。大量のイベントの振りわけを人手で行うのは困難である。 If the number of events that occur is small, it is possible for an experienced operator to select an operator to handle each new event. However, in a system that provides services to many users, a large number of events occur. It is difficult to manually sort through a large number of events.
なお、監視システムでは、大量のイベントを監視する場合、事前に定義したフィルタリング定義を適用することにより対処不要なイベントを表示させないことも可能である。ただし、フィルタリングにより対処するイベント数を絞り込むことができたとしても、システムの規模が大きくなれば、発生するイベントの種類が多くなる。そして、新規イベントに対する各運用担当者の対処の難易度の正しい判断は、イベントの種類が多くなるほど困難となる。 When monitoring a large number of events, a monitoring system can apply predefined filtering definitions to prevent events that do not require action from being displayed. However, even if the number of events to be addressed can be narrowed down by filtering, the larger the system, the greater the number of types of events that occur. And the more types of events there are, the more difficult it becomes for each operations staff member to correctly judge the difficulty of dealing with a new event.
図5は、クラウドシステムにおけるイベントの発生元の一例を示す図である。例えばオンプレミスで運用されているサーバ240でVM(Virtual Machine)240aが構築される。そしてVM240a上で動作するアプリ241~243によりサービスが提供される。この場合であれば、1人の運用担当者40が全体を監視することも可能である。
Figure 5 is a diagram showing an example of the source of an event in a cloud system. For example, a VM (Virtual Machine) 240a is constructed on a
それに対して、パブリッククラウドやコンテナなどの仮想化技術の発展によって、クラウドシステム200では、仮想化技術を駆使してサービスを提供している場合が多い。例えばクラウドシステム200でVM201aが構築される。そしてVM201a上でコンテナ204~206が構築され、サービスの実現に用いるアプリ201~203それぞれがコンテナ204~206で実行される。
In contrast, with the development of virtualization technologies such as public clouds and containers,
このような仮想化技術を駆使したクラウドシステム200では、イベントの発生元が多種にわたる。例えばクラウドサービスの運用上のイベント、VMの動作上のイベント、コンテナの動作上のイベント、アプリ動作上のイベントなどである。このように、イベントの発生元が多種となる場合、イベントごとの対処方法も様々となり、1人の運用担当者で対処するのは困難である。
In a
そこで、例えばイベント発生元の種別ごとに対処する運用担当者を割り当てることが考えられる。図5の例では、運用担当者41は主にアプリ201~203の監視を行い、運用担当者42は主に実行環境(VM、コンテナなど)の監視を行い、運用担当者43は、主にサービスの監視を行う。このようにクラウドシステム200では、イベント発生元ごとに、そのイベントを主として対処する運用担当者41~43が割り当てられる。この場合、運用担当者41~43それぞれの端末31~33に、運用担当者41~43ごとに異なるイベントを対処の対象として表示することが求められる。
Therefore, for example, it is conceivable to assign an operator to deal with each type of event source. In the example of FIG. 5,
運用担当者41~43それぞれが主として担当するイベント発生元が固定的であれば、運用担当者41~43とイベント発生元との対応関係を運用管理サーバ100に予め設定することで、新規イベントの振りわけ先を容易に決定できる。しかし、あるイベント発生元からの新規イベントであっても、そのイベント発生元のイベントを主として対処する運用担当者以外の運用担当者が対処するのが適切な場合もある。例えばアプリ201で新規イベントであっても、そのイベントが発生した原因はコンテナ204内に存在する場合、そのイベントについては、主として実行環境監視を行う運用担当者42が対処するのが適切である。
If the event sources for which each of the operators 41-43 is primarily responsible are fixed, the assignment destination of new events can be easily determined by presetting the correspondence between the operators 41-43 and the event sources in the
このように、イベント発生元の種別だけでは、対処するのに適切な運用担当者を正しく判断することは困難である。そこで運用管理サーバ100は、イベント発生元の種別とメッセージとに基づいて、対処するのに適切な運用担当者を判定する。
As such, it is difficult to correctly determine the appropriate operations staff to handle the event based on the type of event source alone. Therefore, the
なお、イベント発生元それぞれからは、多種多様のメッセージのイベントが発生する。またイベント発生元のバージョンアップなどにより、メッセージの内容が変更される場合もあり得る。そのため、発生する可能性のあるイベントのすべてのメッセージについて、そのメッセージのイベントに対する適切な運用担当者を予め設定しておくことは困難である。 In addition, a wide variety of event messages are generated from each event source. Furthermore, the content of the messages may change due to version upgrades of the event source. For this reason, it is difficult to pre-assign appropriate operational personnel for all messages of events that may occur.
ここで、各運用担当者41~43が過去に対処したイベントの情報を、運用管理サーバ100で蓄積することができる。この場合、新規イベントと、イベント発生元のソフトウェアおよびメッセージが同じ過去のイベント(同一イベント)に対処した運用担当者を、新規イベントに対する適切な運用担当者と判定することが考えられる。しかし、新しく発生したイベントが過去に発生したイベントと同一イベントでない限り、イベント発生元の種別とメッセージだけでは、どの運用担当者が担当すべきかを明確に運用管理サーバ100で判断することは難しい。そこで運用管理サーバ100では、新しく発生した新規イベントに対して運用担当者41~43ごとの対処し易さを動的に計算する。また、ある運用担当者が過去に対処したイベントと同一イベントが発生した場合でも、その運用担当者が該当イベントと同一イベントを長期間対処していない場合、対処の難易度は上がる(対処の容易度は下がる)。そこで運用管理サーバ100は、新規イベントと同一イベントについての各運用担当者41~43の過去の対処日時からの経過時間に応じた対処容易度を計算する。
Here, the
例えば運用管理サーバ100は、新規イベントに対して、運用担当者ごとの対処容易度を算出してフィルタリングする。運用管理サーバ100は、対処容易度の算出には「日時係数」と「発生元係数」とを利用する。
For example, the
日時係数は、運用担当者ごとに設定される値であり、その運用担当者のイベント全般への対処能力を数値化したものである。日時係数は、対処実績評価値の算出に利用される。例えばある担当者の日時係数をa、その担当者が対処済みのイベントと新規に発生した同一のイベントとの発生日時の差分をnとしたとき、その担当者の対処実績評価値はanとなる。対処実績評価値は、運用担当者が発生イベントと同一のイベントの対処を過去に行ってからどれくらい時間が経過しているかに応じて、対処容易度を上げるために用いられる。 The date and time coefficient is a value set for each operations staff member, and is a numerical representation of the operations staff member's ability to handle events in general. The date and time coefficient is used to calculate a handling performance evaluation value. For example, when the date and time coefficient of a certain staff member is a and the difference in occurrence date and time between an event that the staff member has handled and a newly occurring identical event is n, the handling performance evaluation value of the staff member is a n . The handling performance evaluation value is used to increase the ease of handling depending on how much time has passed since the operations staff member handled an event identical to the occurring event in the past.
発生元係数は、イベント発生元の同一性の度合いごとに設定される値である。例えばイベント発生元のシステムと種別が同一の場合の発生元係数と、イベント発生元のシステムが同一であるが種別が異なる場合の発生元係数とが設定される。発生元係数は、発生元評価値の算出に利用される。例えば新規イベントについてのある運用担当者の対処実績評価値「an」に発生元係数を乗算した値が、発生元評価値となる。発生元評価値は、運用担当者が過去に対処したイベントと新規のイベントとの同一性が高い場合に対処容易度を上げるために用いられる。 The origin coefficient is a value set for each degree of identity of the event origin. For example, an origin coefficient is set when the system and type of the event origin are the same, and an origin coefficient is set when the system and type of the event origin are the same but the type is different. The origin coefficient is used to calculate the origin evaluation value. For example, the value obtained by multiplying the response performance evaluation value "a n " of an operations staff member for a new event by the origin coefficient becomes the origin evaluation value. The origin evaluation value is used to increase the ease of handling when there is a high degree of identity between an event that an operations staff member has handled in the past and a new event.
図6は、監視システムにおけるイベント監視用の機能の一例を示す図である。サーバ210は、OS211、アプリ212,213、およびエージェント214を有している。エージェント214は、OS211、アプリ212、またはアプリ213で発生したイベントを示すイベントメッセージを発生元から取得する。そしてエージェント214は、取得したイベントメッセージを含むアラートを、運用管理サーバ100に送信する。
Figure 6 is a diagram showing an example of an event monitoring function in a monitoring system.
サーバ220は、OS221、アプリ222,223、およびエージェント224を有している。エージェント224は、OS221、アプリ222、またはアプリ223で発生したイベントを示すイベントメッセージを発生元から取得する。そしてエージェント224は、取得したイベントメッセージを含むアラートを、運用管理サーバ100に送信する。
The
サーバ230は、OS231、アプリ232,233、およびエージェント234を有している。エージェント234は、OS231、アプリ232、またはアプリ233で発生したイベントを示すイベントメッセージを発生元から取得する。そしてエージェント234は、取得したイベントメッセージを含むアラートを、運用管理サーバ100に送信する。
エージェント214,224,234が送信するアラートには、例えばイベント発生日時、イベント発生元のシステム名、イベント発生元のソフトウェアの種別、イベントメッセージなどが含まれる。またエージェント214,224,234は、メッセージのフィルタリングを行ってもよい。例えばエージェント214,224,234は、対処を要しないメッセージが発生してもアラートの送信は行わず、対処を要するメッセージが発生した場合にのみアラートを送信する。
The alerts sent by
運用管理サーバ100は、記憶部110、イベント取得部120、対処容易度計算部130、イベント対処管理部140、および係数管理部150を有する。記憶部110は、日時係数テーブル111、発生元係数テーブル112、およびイベントテーブル113を有する。日時係数テーブル111は、運用担当者41~43ごとの日時係数を管理するためのデータテーブルである。発生元係数テーブル112は、発生元の同一性の高さごとの発生元係数を管理するためのデータテーブルである。イベントテーブル113は、発生したイベントとそのイベントに対処した担当者との対応関係を示すデータテーブルである。
The
イベント取得部120は、サーバ210,220,230それぞれのエージェント214,224,234からイベントメッセージを含むアラートを取得する。イベント取得部120は、取得したアラートを対処容易度計算部130に送信する。
The
対処容易度計算部130は、取得したアラートに示されるイベントの情報に基づいて、そのイベントへの運用担当者ごとの対処容易度を計算する。対処容易度計算部130は、例えば日時係数テーブル111と発生元係数テーブル112とを参照して、対処容易度を計算する。対処容易度計算部130は、計算した対処容易度をイベント対処管理部140に送信する。
The ease of
イベント対処管理部140は、新規イベントの情報を含むイベント詳細画面のデータを、端末31~33に送信する。またイベント対処管理部140は、端末31~33から、イベントへの対処完了を示す通知を受信し、その通知に基づいてイベントテーブル113を更新する。またイベント対処管理部140は、対処が完了したイベントを示す情報を、係数管理部150に送信する。
The event
係数管理部150は、対処が完了したイベントを示す情報に基づいて、日時係数テーブル111内の各運用担当者の日時係数を更新する。
なお、図6に示した各機能要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。また、図6に示した各機能要素が有する機能は、例えば、その機能要素に対応するプログラムモジュールをプロセッサ101に実行させることで実現することができる。
The
Note that the lines connecting the functional elements shown in Fig. 6 indicate a part of the communication paths, and communication paths other than those shown in the figure can also be set. Furthermore, the functions of the functional elements shown in Fig. 6 can be realized, for example, by having the
以下、図7~図9を参照し、記憶部110に格納されている各データテーブルの内容について具体的に説明する。
図7は、日時係数テーブルの一例を示す図である。日時係数テーブル111には、運用担当者ごとのレコードが登録されている。各レコードには、運用担当者と値とのフィールドが含まれる。運用担当者のフィールドには、運用担当者の名称が設定される。値のフィールドには、運用担当者の日時係数を示す値が設定される。
The contents of each data table stored in the
7 is a diagram showing an example of a date and time coefficient table. A record for each manager is registered in the date and time coefficient table 111. Each record includes fields for manager and value. The manager's name is set in the manager field. The value field is set to a value indicating the manager's date and time coefficient.
図8は、発生元係数テーブルの一例を示す図である。発生元係数テーブル112には、発生元の同一性の度合いごとのレコードが登録されている。各レコードには、係数名と値とのフィールドが含まれる。係数名のフィールドには、発生元の同一性の度合いに対応する発生元係数の識別名が設定される。例えば係数名「発生元係数1」は、イベントの発生元のシステムと種別が同じ場合に適用する発生元係数である。また係数名「発生元係数2」は、イベントの発生元のシステムが同じであるが種別は異なるが場合に適用する発生元係数である。値のフィールドには、発生元係数の値が設定される。
Figure 8 is a diagram showing an example of an origin coefficient table. In the origin coefficient table 112, records are registered for each degree of origin identity. Each record includes fields for coefficient name and value. In the coefficient name field, an identification name of the origin coefficient corresponding to the degree of origin identity is set. For example, the coefficient name "
図9は、イベントテーブルの一例を示す図である。イベントテーブル113には、発生したイベントごとのレコードが登録されている。各レコードには、日時、システム、種別、担当者、およびメッセージのフィールドが設けられている。日時のフィールドには、イベントが発生した日時が設定される。システムのフィールドには、イベントの発生元のシステムの名称が設定される。種別のフィールドには、イベントの発生元のソフトウェアの種別が設定される。種別には、「アプリ」、「コンテナ」、「ホスト」などがある。「ホスト」はホストOSを示す。担当者のフィールドには、イベントに対処した担当者の名称が設定される。メッセージのフィールドには、イベントのメッセージが設定される。 Figure 9 is a diagram showing an example of an event table. The event table 113 has a record registered for each event that occurs. Each record has fields for date/time, system, type, person in charge, and message. The date/time field is set to the date and time when the event occurred. The system field is set to the name of the system from which the event occurred. The type field is set to the type of software from which the event occurred. Types include "app," "container," and "host." "Host" refers to the host OS. The person in charge field is set to the name of the person in charge who handled the event. The message field is set to the message of the event.
なお、イベントテーブル113に設定されているシステム、種別、およびメッセージの各フィールドの情報は、対応するイベントの属性を示している。システムと種別は、送信元に関する属性である。メッセージは、そのイベントの発生した理由または原因に関する属性である。 The information in the system, type, and message fields set in the event table 113 indicates the attributes of the corresponding event. System and type are attributes related to the sender. Message is an attribute related to the reason or cause of the event.
運用管理サーバ100は、このようなデータを用いて,イベントに対処する運用担当者41~43それぞれの容易度を動的に計算し、適切な運用担当者に対処を促すことができる。
The
図10は、監視処理の手順の一例を示すフローチャートである。以下、図10に示す処理をステップ番号に沿って説明する。
[ステップS101]イベント取得部120は、いずれかのサーバから、新規イベントの情報を取得する。例えばイベント取得部120は、いずれかのサーバからアラートを取得すると、そのアラートからイベントの情報を抽出する。
10 is a flow chart showing an example of a procedure for a monitoring process. The process shown in FIG. 10 will be described below in order of step number.
[Step S101] The
[ステップS102]対処容易度計算部130は、対処容易度算出処理を実行する。対処容易度算出処理の詳細は後述する(図11参照)。対処容易度算出処理の結果、運用担当者41~43それぞれの対処容易度が得られる。
[Step S102] The management
[ステップS103]イベント対処管理部140は、端末31~33それぞれに、運用担当者41~43の対処容易度を含むイベント詳細画面を表示させる。例えばイベント対処管理部140は、イベント詳細画面を示すデータを、端末31~33に送信する。すると、端末31~33それぞれでイベント詳細画面が表示される。この際、イベント対処管理部140は、イベントテーブル113に、新規イベントに対応するレコードを登録する。登録された時点では、レコードの担当者名のフィールドは空欄である。
[Step S103] The event
[ステップS104]イベント対処管理部140は、イベントに対処する担当者の担当者名の入力を受け付ける。例えば運用担当者41~43は、端末31~33に表示されたイベント詳細画面に基づいて、自身が対処するか否かを判断する。対処する運用担当者は、自身が使用する端末に、対処する担当者として自身の名称を入力する。端末は、対処する担当者の担当者名を、運用管理サーバ100に送信する。イベント対処管理部140は、端末から送られた担当者名を、イベントテーブル113の新規イベントの担当者名のフィールドに設定する。
[Step S104] The event
[ステップS105]イベント対処管理部140は、対処済みを示す情報の入力を受け付ける。例えばイベントの対処を担当した運用担当者は、対処が完了すると、自身が使用する端末に、対処が完了したことを示す入力を行う。入力を受けた端末は、運用管理サーバ100に、対処済みを示す情報を送信する。
[Step S105] The event
[ステップS106]係数管理部150は、日時係数フィードバック処理を実行する。日時係数フィードバック処理の詳細は後述する(図15参照)。
このように、運用管理サーバ100は、対処容易度を含むイベント詳細画面を表示することができる。また、対処が完了すると、日時係数フィードバック処理によって、日時係数が最新の状態に更新される。
[Step S106] The
In this way, the
次に、対処容易度算出処理について具体的に説明する。
図11は、対処容易度算出処理の手順の一例を示すフローチャートである。以下、図11に示す処理をステップ番号に沿って説明する。
Next, the handling ease degree calculation process will be specifically described.
11 is a flowchart showing an example of a procedure for a measureability calculation process. The process shown in FIG. 11 will be described below in order of step numbers.
[ステップS111]対処容易度計算部130は、未選択の運用担当者を選択する。
[ステップS112]対処容易度計算部130は、対処済みのイベント(過去イベント)を、選択した運用担当者が過去に対処したイベントに絞り込む。
[Step S111] The management
[Step S112] The handling
[ステップS113]対処容易度計算部130は、絞り込んだ過去イベントごとに、ステップS114~S118の処理を実行する。
[ステップS114]対処容易度計算部130は、処理対象の過去イベントが、新規イベントと同一イベントか否かを判断する。同一イベントとは、発生元の種別とメッセージが同じイベントである。対処容易度計算部130は、同一イベントであれば、処理をステップS115に進める。また対処容易度計算部130は、同一イベントでなければ、処理をステップS116に進める。
[Step S113] The handling
[Step S114] The ease of
[ステップS115]対処容易度計算部130は、対処実績評価値算出処理を行う。対処実績評価値算出処理の詳細は後述する(図12参照)。その後、対処容易度計算部130は、処理をステップS118に進める。
[Step S115] The management
[ステップS116]対処容易度計算部130は、処理対象の過去イベントについて、新規イベントと発生元のシステムが同じか否かを判断する。対処容易度計算部130は、システムが同じであれば、処理をステップS117に進める。また対処容易度計算部130は、システムが異なれば、処理をステップS119に進める。
[Step S116] The
[ステップS117]対処容易度計算部130は、発生元評価値算出処理を行う。発生元評価値算出処理の詳細は後述する(図13参照)。
[ステップS118]対処容易度計算部130は、評価値(対処実績評価値または発生元評価値)を、選択した運用担当者の対処容易度に加算する。
[Step S117] The
[Step S118] The management
[ステップS119]対処容易度計算部130は、絞り込んだすべてのイベントについてステップS114~S118の処理が終了したら、処理をステップS120に進める。
[ステップS120]対処容易度計算部130は、未選択の運用担当者がいるか否かを判断する。対処容易度計算部130は、未選択の運用担当者がいる場合、処理をステップS111に進める。また対処容易度計算部130は、すべての運用担当者が選択済みであれば、対処容易度算出処理を終了する。
[Step S119] When the process of steps S114 to S118 is completed for all narrowed-down events, the handling
[Step S120] The management
このように、運用担当者が対処した過去イベントごとに計算した対処実績評価値または発生元評価値の合計が、その運用担当者の対処容易度となる。
次に、対処実績評価値算出処理について詳細に説明する。
In this way, the sum of the handling performance evaluation value or the event source evaluation value calculated for each past event handled by the operations staff is the handling easiness degree of that operations staff.
Next, the treatment performance evaluation value calculation process will be described in detail.
図12は、対処実績評価値算出処理の手順の一例を示すフローチャートである。以下、図12に示す処理をステップ番号に沿って説明する。
[ステップS131]対処容易度計算部130は、計算対象の運用担当者が処理した過去イベントと新規イベントの発生日時の差分を算出する。例えば対処容易度計算部130は、過去イベントと新規イベントの発生日時の差分を、月単位(月数)で算出する。例えば、過去イベントの発生日時が1月前であれば、差分は「1」である。
12 is a flowchart showing an example of a procedure for calculating a treatment result evaluation value. The process shown in FIG. 12 will be described below in order of step number.
[Step S131] The management
[ステップS132]対処容易度計算部130は、発生日時の差分に基づいて、過去イベント別日時係数を決定する。例えば対処容易度計算部130は、計算対象の運用担当者の日時係数を、日時係数テーブル111から取得する。そして対処容易度計算部130は、取得した日時係数をaとし、発生日時の差分をnとしたとき、過去イベント別日時係数を「an」とする。
[Step S132] The
[ステップS133]対処容易度計算部130は、過去イベント別日時係数に基づいて、対処実績評価値を決定する。例えば対処容易度計算部130は、過去イベント別日時係数を対処実績評価値とする。なお対処容易度計算部130は、過去イベント別日時係数に所定の実数を乗算した値を対処実績評価値としてもよい。
[Step S133] The countermeasure
このようにして対処実績評価値が算出される。
次に、発生元評価値算出処理について詳細に説明する。
図13は、発生元評価値算出処理の手順の一例を示すフローチャートである。以下、図13に示す処理をステップ番号に沿って説明する。
In this manner, the treatment performance evaluation value is calculated.
Next, the source evaluation value calculation process will be described in detail.
13 is a flowchart showing an example of a procedure for calculating an origin evaluation value. The process shown in FIG. 13 will be described below in order of step number.
[ステップS141]対処容易度計算部130は、計算対象の運用担当者が処理した過去イベントと新規イベントの発生日時の差分(n)を算出する。
[ステップS142]対処容易度計算部130は、発生日時の差分に基づいて、過去イベント別日時係数(an)を決定する。
[Step S141] The
[Step S142] The
[ステップS143]対処容易度計算部130は、過去イベントと新規イベントとの同一性(システムと種別が同一、またはシステムが同一で種別が相違)に応じて発生元係数(b)を決定する。例えば対処容易度計算部130は、発生元係数テーブル112から、イベントの同一性に対応する発生元係数の値を取得する。
[Step S143] The
[ステップS144]対処容易度計算部130は、過去イベント別日時係数と発生元係数とから、発生元評価値を決定する。例えば対処容易度計算部130は、「過去イベント別日時係数×発生元係数」を発生元評価値(an×b)とする。
[Step S144] The
このようにして発生元評価値が算出される。発生元評価値の計算にも過去イベント別日時係数が用いられており、発生日時の差分が大きい程、発生元評価値は小さな値となる。
図11~図13に示した処理により、新規イベントに対する運用担当者41~43それぞれの対処容易度が算出される。以下、対処容易度の計算例を示す。なお、各運用担当者41~43が対処した過去イベントは、図9に示すイベントテーブル113の通りであるものとする。また、各運用担当者41~43の日時係数は、図7に示した日時係数テーブル111に設定されている通りであり、イベントの同一性に応じた発生元係数は、図8に示した発生元係数テーブル112に設定されている通りである。
In this way, the source evaluation value is calculated. The past event date and time coefficient is also used in the calculation of the source evaluation value, and the larger the difference in the occurrence dates and times, the smaller the source evaluation value becomes.
11 to 13, the ease of handling for each of the
<第1の対処容易度計算例>
「2022/08/01 12:00」に「systemA」の「アプリ」で「CPU使用率が閾値を超えました」というメッセージの新規イベントが発生した場合を想定する。
<First example of calculation of ease of handling>
Assume that a new event with the message "CPU usage exceeded the threshold" occurs in "application" of "system A" at "2022/08/01 12:00".
「担当者A」は、「2022/08/01」に、新規イベントと同じ過去イベントに対処している。この過去イベントと新規イベントとの発生日時の差分は「0」である。なお、サーバ210,220,230では様々な種類のアプリが実行されるが、イベントのメッセージの内容が同じであれば、それらのイベントの発生元は同一のアプリ(ソフトウェア)であるものとする。
On "2022/08/01", "Person in Charge A" deals with the same past event as the new event. The difference in the occurrence date and time between this past event and the new event is "0". Note that although various types of applications are executed on the
「担当者A」の日時係数は「0.9」である。この場合、対処実績評価値は「0.90=1」となる。また「担当者A」の発生元評価値は「0」である。そのため「担当者A」の対処容易度は「1+0=1」となる。 The date and time coefficient for "Person in charge A" is "0.9". In this case, the handling performance evaluation value is "0.9 0 = 1". In addition, the source evaluation value for "Person in charge A" is "0". Therefore, the handling ease of "Person in charge A" is "1 + 0 = 1".
「担当者B」は同一のイベントを対処した実績がなく、「担当者B」の対処実績評価値は「0」である。他方、「担当者B」は、「2022/07/01」に「systemA」の「ホスト」の過去イベントに対処している。この過去イベントと新規イベントとの発生日時の差分は「1」であり、「担当者B」の日時係数は「0.8」である。そのため過去イベント別日時係数は「0.81=0.8」となる。また「担当者B」が対処した過去イベントと新規イベントとの発生元の同一性は、システムのみ一致であり、発生元係数は「0.1」が適用される。その結果、「担当者B」の発生元評価値は「0.8×0.1=0.08」となる。そして「担当者B」の対処容易度は「0+0.08=0.08」となる。 "Person in charge B" has no experience of dealing with the same event, and the handling experience evaluation value of "Person in charge B" is "0". On the other hand, "Person in charge B" deals with a past event of "host" of "system A" on "2022/07/01". The difference in the occurrence date and time between this past event and the new event is "1", and the date and time coefficient of "Person in charge B" is "0.8". Therefore, the date and time coefficient for past events is "0.8 1 = 0.8". In addition, the identity of the origin of the past event and the new event handled by "Person in charge B" is only the system, and the origin coefficient is "0.1". As a result, the origin evaluation value of "Person in charge B" is "0.8 x 0.1 = 0.08". And the handling ease of "Person in charge B" is "0 + 0.08 = 0.08".
「担当者C」は、対処実績評価値および発生元評価値が「0」であり、対処容易度も「0」である。
以上の結果、第1の対処容易度計算例において対処容易度が最も高いのは「担当者A」となる。すなわち、「担当者A」が対処するのがよいと判断される。
The "person in charge C" has a handling performance evaluation value and an origin evaluation value of "0", and the handling ease is also "0".
As a result of the above, the person with the highest degree of ease of handling in the first example of calculation of ease of handling is "person in charge A." In other words, it is determined that "person in charge A" should handle the problem.
<第2の対処容易度計算例>
「2022/08/15 00:00」に「systemB」の「ホスト」で「不明なエラーが発生しました」というメッセージの新規イベントが発生した場合を想定する。
<Second example of calculation of ease of handling>
Assume that a new event with the message "An unknown error has occurred" occurs on "host" of "system B" at "2022/08/15 00:00".
「担当者A」は同一のイベントを対処した実績がなく、「担当者A」の対処実績評価値は「0」である。他方、「担当者A」は「2022/06/01 00:00」に「systemB」の「アプリ」の過去イベントに対処している。この過去イベントと新規イベントとの発生日時の差分は「2」であり、「担当者A」の日時係数は「0.9」である。そのため過去イベント別日時係数は「0.92=0.81」となる。また「担当者A」が対処した過去イベントと新規イベントとの発生元の同一性は、システムのみ一致であり、発生元係数は「0.1」が適用される。その結果、「担当者A」の発生元評価値は「0.81×0.1=0.081」となる。そして「担当者A」の対処容易度は「0+0.081=0.081」となる。 "Person in charge A" has no experience of dealing with the same event, and the handling experience evaluation value of "Person in charge A" is "0". On the other hand, "Person in charge A" deals with a past event of "application" of "system B" at "2022/06/01 00:00". The difference in the occurrence date and time between this past event and the new event is "2", and the date and time coefficient of "Person in charge A" is "0.9". Therefore, the date and time coefficient for each past event is "0.9 2 = 0.81". In addition, the identity of the origin of the past event and the new event handled by "Person in charge A" is only the system, and the origin coefficient is "0.1". As a result, the origin evaluation value of "Person in charge A" is "0.81 x 0.1 = 0.081". And the handling ease of "Person in charge A" is "0 + 0.081 = 0.081".
「担当者B」は、対処実績評価値および発生元評価値が「0」であり、対処容易度も「0」である。
「担当者C」は同一のイベントを対処した実績がなく、「担当者C」の対処実績評価値は「0」である。他方、「担当者C」は「2022/02/01 00:00」、「2022/04/01 00:00」、「2022/07/01 00:00」に「systemB」の「ホスト」または「コンテナ」の過去イベントに対処している。「2022/02/01 00:00」に発生した過去イベントと新規イベントとの発生日時の差分は「6」である。「2022/04/01 00:00」に発生した過去イベントと新規イベントとの発生日時の差分は「4」である。「2022/07/01 00:00」に発生した過去イベントと新規イベントとの発生日時の差分は「1」である。「担当者C」が対処した各過去イベントに適用される発生元係数は、いずれも「0.1」である。そのため発生元評価値は「0.96×0.1+0.94×0.1+0.91×0.1=0.0531441+0.06561+0.09=0.2087541」となる。そして「担当者C」の対処容易度は「0+0.2087541=0.2087541」となる。
"Person in charge B" has a handling performance evaluation value and an origin evaluation value of "0", and the handling ease level is also "0".
The "person in charge C" has no experience of dealing with the same event, and the handling experience evaluation value of "person in charge C" is "0". On the other hand, the "person in charge C" has dealt with past events of the "host" or "container" of "system B" at "2022/02/01 00:00", "2022/04/01 00:00", and "2022/07/01 00:00". The difference in the occurrence date and time between the past event that occurred at "2022/02/01 00:00" and the new event is "6". The difference in the occurrence date and time between the past event that occurred at "2022/04/01 00:00" and the new event is "4". The difference in the occurrence date and time between the past event that occurred at "2022/07/01 00:00" and the new event is "1". The occurrence source coefficient applied to each past event dealt with by the "person in charge C" is all "0.1". Therefore, the source evaluation value is " 0.96 x 0.1 + 0.94 x 0.1 + 0.91 x 0.1 = 0.0531441 + 0.06561 + 0.09 = 0.2087541." And the handling ease of "person in charge C" is "0 + 0.2087541 = 0.2087541."
以上の結果、第2の対処容易度計算例において対処容易度が最も高いのは「担当者C」、次に対処容易度が高いのは「担当者A」となる。すなわち、「担当者C」が対処するのが最もよく、次に「担当者A」に対処するのがよいと判断される。 As a result of the above, in the second example of ease of handling calculation, the person with the highest ease of handling is "Person in Charge C," and the person with the next highest ease of handling is "Person in Charge A." In other words, it is determined that "Person in Charge C" is the best person to handle the problem, and then "Person in Charge A" is the next best person to handle the problem.
運用管理サーバ100は、運用担当者41~43が使用する端末31~33に、運用担当者41~43それぞれ対処容易度を含むイベント詳細画面を表示させる。これにより、運用担当者41~43は、対処を要する新規イベントについて、対処するのに適切な担当者を容易に認識することができる。
The
図14は、イベント詳細画面の一例を示す図である。イベント詳細画面60には、番号表示部61、重要度表示部62、状態表示部63、システム表示部64、種別表示部65、表示名表示部66、日時表示部67、メモ表示部68、メッセージ表示部69、および対処者候補表示部70が含まれる。
Figure 14 is a diagram showing an example of an event details screen. The event details screen 60 includes a
番号表示部61には、新規イベントの識別番号が表示される。重要度表示部62には、新規イベントの重要度が設定される。重要度は、例えばイベントの発生元によって設定される。また運用管理サーバ100においてイベントの内容を解析して重要度を設定してもよい。状態表示部63には、新規イベントの対処状態が設定される。例えば、どの運用担当者もそのイベントを確認していなければ、対処状態は「未確認」となる。またいずれかの運用担当者が対処した後は、状態は「対処済」となる。システム表示部64には、イベント発生元のシステムの名称が表示される。種別表示部65には、イベント発生元の種別が表示される。
The
表示名表示部66には、端末にイベントの情報を通知した装置の名称が表示される。例えば表示名表示部66には、運用管理サーバ100の名称が表示される。日時表示部67には、イベントが発生した日時が表示される。メモ表示部68には、いずれかの運用担当者が入力したメモが表示される。例えば対処容易度が最も高い運用担当者は、他の運用担当者の方が対処するのが適切と判断した場合、対処を依頼する文章をメモ表示部68に入力する。入力された文章は、他の運用担当者の端末におけるイベント詳細画面60のメモ表示部68に表示される。メッセージ表示部69には、イベントのメッセージを示す文字列が表示される。
The display
対処者候補表示部70には、運用担当者ごとのイベントの対処容易度が表示される。図14の例では、対処者候補表示部70には、優先順位、担当者、および対処容易度の欄が設けられている。優先順位の欄には、運用担当者41~43を対処容易度によって降順に並べたときの運用担当者41~43それぞれの順番が示される。担当者の欄には、運用担当者41~43それぞれの名称が示される。対処容易度の欄には、運用担当者41~43それぞれの対処容易度が示される。
The candidate
運用担当者41~43それぞれは、イベント詳細画面60を参照することで、新規イベントの対処者ごとの対処容易度を即座に把握することができる。そして運用担当者41~43それぞれが、適切な対処者を容易に判断できる。これにより、対処者決定のための運用担当者間での連絡頻度が減少し、イベント発生から対処までの時間が短縮される。
By referring to the event details screen 60, each of the
例えば優先順位が一位の運用担当者は、イベントの内容を確認し、そのイベントに対処可能であれば対処する。優先順位が一位の運用担当者が検討した結果、他の運用担当者が対処した方が容易であると判断する場合もある。その場合、例えば優先順位が一位の運用担当者から他の運用担当者に対処を依頼することもできる。 For example, the operations staff with the highest priority will check the details of the event and deal with it if it is possible. After considering the matter, the operations staff with the highest priority may decide that it would be easier for another operations staff to deal with the event. In that case, for example, the operations staff with the highest priority can request that another operations staff deal with the event.
新規イベントに対していずれかの運用担当者が対処すると、運用担当者41~43それぞれのイベントへの対処能力は変化する。そこで対処能力の変化が、運用担当者41~43それぞれの日時係数にフィードバックされる。以下、日時係数フィードバック処理について詳細に説明する。
When any of the operators deals with a new event, the ability of each of the
図15は、日時係数フィードバック処理の手順の一例を示すフローチャートである。以下、図15に示す処理をステップ番号に沿って説明する。
[ステップS151]係数管理部150は、未選択の運用担当者を選択する。
15 is a flowchart showing an example of a procedure for date and time coefficient feedback processing. The processing shown in FIG. 15 will be described below in order of step number.
[Step S151] The
[ステップS152]係数管理部150は、選択した運用担当者が、新規イベントを対処済みにした運用担当者か否かを判断する。係数管理部150は、対処済みにした運用担当者であれば、処理をステップS153に進める。また係数管理部150は、対処済みにした運用担当者でなければ、処理をステップS156に進める。
[Step S152] The
[ステップS153]係数管理部150は、選択した運用担当者が、新規イベントに対する対処容易度が最高の担当者か否かを判断する。係数管理部150は、対処容易度が最高の担当者であれば、処理をステップS158に進める。また係数管理部150は、対処容易度が最高の担当者でなければ、処理をステップS154に進める。
[Step S153] The
[ステップS154]係数管理部150は、選択した運用担当者の日時係数が「0.9」未満か否かを判断する。係数管理部150は、日時係数が「0.9」未満であれば、処理をステップS155に進める。また係数管理部150は、日時係数が「0.9」以上であれば、処理をステップS158に進める。
[Step S154] The
[ステップS155]係数管理部150は、選択した運用担当者の日時係数を増加させる。例えば係数管理部150は、現在の日時係数に「1.1」倍した値を、新たな日時係数とする。なお係数管理部150は、日時係数の最大値を定めておくことができる。係数管理部150は、増加させたときの日時係数を計算した結果が最大値を超える場合、最大値を新たな日時係数とする。日時係数の最大値は、例えば「0.9」である。係数管理部150は、日時係数を増加させた後、処理をステップS158に進める。
[Step S155] The
[ステップS156]係数管理部150は、選択した運用担当者が、新規イベントに対する対処容易度が最高の担当者か否かを判断する。係数管理部150は、対処容易度が最高の担当者であれば、処理をステップS157に進める。また係数管理部150は、対処容易度が最高の担当者でなければ、処理をステップS158に進める。
[Step S156] The
[ステップS157]係数管理部150は、選択した運用担当者の日時係数を減少させる。例えば係数管理部150は、現在の日時係数を「0.9」倍した値を、新たな日時係数とする。
[Step S157] The
[ステップS158]係数管理部150は、未選択の運用担当者がいるか否かを判断する。係数管理部150は、未選択の運用担当者がいる場合、処理をステップS151に進める。また係数管理部150は、すべての運用担当者が選択済みであれば、日時係数フィードバック処理を終了する。
[Step S158] The
このようにして、各運用担当者のイベントに対する対処状況が日時係数に反映される。そして各運用担当者の日時係数に基づいて、新規イベントへの運用担当者ごとの対処容易度を計算することで、対処容易度を正確に算出することができる。 In this way, the status of each operator in handling events is reflected in the date and time coefficient. Then, by calculating the ease of handling a new event for each operator based on the date and time coefficient for each operator, the ease of handling can be calculated accurately.
以下、日時係数フィードバック処理による日時係数の計算例について説明する。
<第1の日時係数計算例>
前述の「第1の対処容易度計算例」に示したイベントの対処者が「担当者A」の場合を想定する。「担当者A」の対処容易度が最も高く、対処者も「担当者A」である。そのため、日時係数は変更されない。
An example of calculation of the date and time coefficient by the date and time coefficient feedback process will be described below.
<First Date and Time Coefficient Calculation Example>
Assume that the person who handles the event shown in the above-mentioned "First handling ease calculation example" is "Person in charge A." The handling ease of "Person in charge A" is the highest, and the person who handles the event is also "Person in charge A." Therefore, the date and time coefficient is not changed.
<第2の日時係数計算例>
前述の「第1の対処容易度計算例」に示したイベントの対処者が「担当者B」の場合を想定する。この場合、「担当者B」は、対処容易度が最も高い運用担当者ではない。そこで、対処容易度が最も高い「担当者A」の日時係数は減少し、「0.9×0.9=0.81」となる。他方、「担当者B」の日時係数は増加し、「0.8×1.1=0.88」となる。
<Second Date and Time Coefficient Calculation Example>
Let us assume that the person who handles the event shown in the above-mentioned "First handling ease calculation example" is "Person in charge B". In this case, "Person in charge B" is not the operations person with the highest handling ease. Therefore, the date and time coefficient of "Person in charge A" with the highest handling ease decreases to "0.9 x 0.9 = 0.81". On the other hand, the date and time coefficient of "Person in charge B" increases to "0.8 x 1.1 = 0.88".
このように、優先順位が一位(対処容易度が最高)の運用担当者が対処した場合には、各運用担当者の日時係数に変化はない。他方、優先順位が一位の運用担当者以外が対処した場合には、対処した運用担当者の日時係数が増加し、優先順位が一位の運用担当者の日時係数が減少する。 In this way, if an operator with the highest priority (highest ease of handling) handles the issue, there is no change in the date and time coefficient for each operator. On the other hand, if an operator other than the operator with the highest priority handles the issue, the date and time coefficient for the operator who handled the issue increases, and the date and time coefficient for the operator with the highest priority decreases.
これにより、以後、同様のイベントが発生した場合、対処した運用担当者の対処容易度は高くなる。すなわち、今回のイベントに対しては優先順位が一位ではないが、運用担当者間の判断で対処するのが適切であると判断され、かつ対処した運用担当者は、イベントに対処するための知識と経験が蓄積されたと考えられる。このような知識と経験の蓄積度合いが、その運用担当者の日時係数に反映されている。 As a result, if a similar event occurs in the future, it will be easier for the operations staff who handled it to deal with it. In other words, although this event was not the highest priority, the operations staff judged it appropriate to deal with it, and the operations staff who handled it are likely to have accumulated knowledge and experience in dealing with events. The degree to which this knowledge and experience has been accumulated is reflected in the date and time coefficient for that operations staff.
他方、優先順位が一位でありながら対処しなかった運用担当者は、イベントに対処する知識が古くなっており、最新の技術に対応し切れていない可能性がある。また、経験が不足している他の運用担当者に経験を積ませるために、優先順位が一位の運用担当者が対処しない可能性もある。このように、技術の進歩、運営方針などの様々な事情で優先順位が一位以外の運用担当者が対処した場合、優先順位が一位の運用担当者の日時係数を減少させることで、そのような事情を対処の優先順位に反映させることができる。 On the other hand, an operator with the highest priority who does not take action may have outdated knowledge on how to deal with events and may not be up to date with the latest technology. It is also possible that the operator with the highest priority does not take action in order to allow other operators who lack experience to gain more experience. In this way, if an operator other than the operator with the highest priority takes action due to various reasons such as technological advances or management policies, such circumstances can be reflected in the priority of action by decreasing the date and time coefficient of the operator with the highest priority.
〔その他の実施の形態〕
第2の実施の形態では、クラウドシステム200とは別に運用管理サーバ100を設けているが、運用管理サーバ100の機能をクラウドシステム200内に構築してもよい。例えばクラウドシステム200内の仮想マシンの1つを運用管理サーバ100として動作させることもできる。
Other embodiments
In the second embodiment, the
第2の実施の形態では、イベントへの対処が容易であるほど値が大きくなる対処容易度を計算しているが、運用管理サーバ100は、対処容易度に代えて対処難易度を計算してもよい。対処難易度は、例えばイベントへの対処が困難であるほど値が大きくなる指標である。運用担当者ごとの対処難易度を計算した場合、運用管理サーバ100は、対処難易度が低い運用担当者ほど、対処の優先順位を高くする。
In the second embodiment, the ease of handling is calculated so that the easier it is to handle an event, the higher the value. However, the
以上、実施の形態を例示したが、実施の形態で示した各部の構成は同様の機能を有する他のものに置換することができる。また、他の任意の構成物や工程が付加されてもよい。さらに、前述した実施の形態のうちの任意の2以上の構成(特徴)を組み合わせたものであってもよい。 Although the above is an example of an embodiment, the configuration of each part shown in the embodiment can be replaced with other parts having similar functions. In addition, any other components or processes may be added. Furthermore, any two or more configurations (features) of the above-mentioned embodiments may be combined.
1a,1b,1c コンピュータシステム
2~4 運用担当者
5 新規イベント情報
6 対処容易度情報
10 情報処理装置
11 記憶部
11a 過去イベント情報
11b 第1の係数
11c 第2の係数
12 処理部
Claims (10)
運用担当者が対処した過去イベントの発生日時および属性を示す過去イベント情報に基づいて、前記過去イベントのうち、前記新規イベントと属性に共通性のある第1の過去イベントを特定し、
前記第1の過去イベントの発生日時と前記新規イベントの発生日時との差分を計算し、
前記差分に基づいて、前記新規イベントへの前記運用担当者の対処容易度を計算する、
処理をコンピュータに実行させるイベント管理プログラム。 Acquire new event information indicating the date and time of occurrence and attributes of a new event that has occurred in the computer system;
Identifying a first past event having a common attribute with the new event among the past events based on past event information indicating an occurrence date and attribute of the past event handled by the operations staff;
calculating a difference between an occurrence date and time of the first past event and an occurrence date and time of the new event;
Calculating the ease of handling the new event by the operations staff based on the difference;
An event management program that causes a computer to execute a process.
請求項1記載のイベント管理プログラム。 In the process of calculating the ease of handling, the greater the difference is, the lower the ease of handling is set to.
The event management program of claim 1.
請求項1記載のイベント管理プログラム。 In the process of calculating the ease of handling, the ease of handling is calculated based on a first coefficient indicating an ability of the operations staff to handle the event.
The event management program of claim 1.
請求項3記載のイベント管理プログラム。 In the process of calculating the degree of ease of handling, the degree of ease of handling is calculated based on a second coefficient, the second coefficient being a higher value as the similarity of attributes related to the origins of the new event and the past event becomes higher, and the first coefficient.
4. The event management program according to claim 3.
前記対処容易度に基づいて対処するのが適切と判断される第1の運用担当者が前記新規イベントに対処したのか、前記第1の運用担当者以外の第2の運用担当者が前記新規イベントに対処したのかに基づいて、前記運用担当者ごとの前記第1の係数の値を更新する、
請求項3記載のイベント管理プログラム。 When there are a plurality of operators, the process of identifying the first past event, the process of calculating the difference, and the process of calculating the ease of handling based on the first coefficient for each operator are executed for each operator;
updating a value of the first coefficient for each of the operators based on whether a first operator who is determined to be appropriate for handling the new event based on the handling ease has handled the new event or a second operator other than the first operator has handled the new event;
4. The event management program according to claim 3.
請求項1記載のイベント管理プログラム。 In the process of identifying the first past event, the past event having the same message and generated by the same software as the new event is identified as the first past event.
The event management program of claim 1.
請求項1記載のイベント管理プログラム。 In the process of identifying the first past event, the past event that has a common source system with the new event is identified as the first past event.
The event management program of claim 1.
請求項1記載のイベント管理プログラム。 In the process of calculating the ease of handling, when a plurality of the first past events are identified, an evaluation value of the first past event is calculated for each of the first past events based on the difference, and the sum of the evaluation values for the first past events is set as the ease of handling.
The event management program of claim 1.
運用担当者が対処した過去イベントの発生日時および属性を示す過去イベント情報に基づいて、前記過去イベントのうち、前記新規イベントと属性に共通性のある第1の過去イベントを特定し、
前記第1の過去イベントの発生日時と前記新規イベントの発生日時との差分を計算し、
前記差分に基づいて、前記新規イベントへの前記運用担当者の対処容易度を計算する、
処理をコンピュータが実行するイベント管理方法。 Acquire new event information indicating the date and time of occurrence and attributes of a new event that has occurred in the computer system;
Identifying a first past event having a common attribute with the new event among the past events based on past event information indicating an occurrence date and attribute of the past event handled by the operations staff;
calculating a difference between an occurrence date and time of the first past event and an occurrence date and time of the new event;
Calculating the ease of handling the new event by the operations staff based on the difference;
An event management method in which processing is performed by a computer.
を有する情報処理装置。 a processing unit that acquires new event information indicating an occurrence date/time and attributes of a new event that has occurred in a computer system, identifies a first past event having attributes common to the new event among the past events based on past event information indicating the occurrence date/time and attributes of a past event handled by an operations staff, calculates a difference between the occurrence date/time of the first past event and the occurrence date/time of the new event, and calculates a degree of ease of handling of the new event by the operations staff based on the difference;
An information processing device having the above configuration.
Priority Applications (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023052558A JP2024141095A (en) | 2023-03-29 | 2023-03-29 | Event management program, event management method, and information processing device |
| PCT/JP2024/004232 WO2024202571A1 (en) | 2023-03-29 | 2024-02-08 | Event management program, event management method, and information processing device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2023052558A JP2024141095A (en) | 2023-03-29 | 2023-03-29 | Event management program, event management method, and information processing device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2024141095A true JP2024141095A (en) | 2024-10-10 |
Family
ID=92903973
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2023052558A Pending JP2024141095A (en) | 2023-03-29 | 2023-03-29 | Event management program, event management method, and information processing device |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP2024141095A (en) |
| WO (1) | WO2024202571A1 (en) |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP4913913B2 (en) * | 2010-04-28 | 2012-04-11 | 新日鉄ソリューションズ株式会社 | Information processing system, information processing method, and program |
| JP6655001B2 (en) * | 2016-12-21 | 2020-02-26 | 株式会社日立ビルシステム | Failure support server and failure support method |
-
2023
- 2023-03-29 JP JP2023052558A patent/JP2024141095A/en active Pending
-
2024
- 2024-02-08 WO PCT/JP2024/004232 patent/WO2024202571A1/en active Pending
Also Published As
| Publication number | Publication date |
|---|---|
| WO2024202571A1 (en) | 2024-10-03 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11681785B2 (en) | Detecting and tracking virtual containers | |
| AU2020203653B2 (en) | Integrated monitoring and control of processing environment | |
| US20200358826A1 (en) | Methods and apparatus to assess compliance of a virtual computing environment | |
| US20210157562A1 (en) | Software update compatibility assessment | |
| US8990772B2 (en) | Dynamically recommending changes to an association between an operating system image and an update group | |
| US11329869B2 (en) | Self-monitoring | |
| US11165665B2 (en) | Apparatus and method to improve precision of identifying a range of effects of a failure in a system providing a multilayer structure of services | |
| US20230048513A1 (en) | Intelligent cloud service health communication to customers | |
| JP2016181022A (en) | Information processing apparatus, information processing program, information processing method, and data center system | |
| JP2024141095A (en) | Event management program, event management method, and information processing device | |
| JP6528285B2 (en) | Crisis response management device | |
| CN113849378A (en) | Resource monitoring device, resource monitoring system, resource monitoring method, electronic device, and medium | |
| US20240029841A1 (en) | Consolidation and prioritization of patient critical notifications | |
| WO2020240766A1 (en) | Evaluation device, system, control method, and program | |
| JP2019133246A (en) | Order control program, order control method, and information processing apparatus | |
| JP2024165847A (en) | Problem response support system and problem response support method | |
| JP5847497B2 (en) | System management support apparatus and system management support method | |
| JP2023092548A (en) | USAGE MANAGEMENT SYSTEM, USAGE MANAGEMENT DEVICE, USAGE MANAGEMENT METHOD, AND PROGRAM | |
| JP2020107156A (en) | Monitoring system, monitoring program, and system | |
| HK1229029A1 (en) | Integrated monitoring and control of processing environment | |
| HK1229029B (en) | Integrated monitoring and control of processing environment |