JP2004227084A - Alarm information collection device - Google Patents
Alarm information collection device Download PDFInfo
- Publication number
- JP2004227084A JP2004227084A JP2003011458A JP2003011458A JP2004227084A JP 2004227084 A JP2004227084 A JP 2004227084A JP 2003011458 A JP2003011458 A JP 2003011458A JP 2003011458 A JP2003011458 A JP 2003011458A JP 2004227084 A JP2004227084 A JP 2004227084A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- polling
- alarm information
- unit
- failure
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Alarm Systems (AREA)
- Selective Calling Equipment (AREA)
Abstract
【課題】各監視項目に関する警報情報の発生および解消のタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小する。
【解決手段】複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段112と、ポーリング制御手段110は、障害検出手段112によって障害の発生が検出されるごとに、障害が検出された監視項目についての追加ポーリングに対応する監視タイミングを障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整をスケジュールに対して行う連続挿入手段113を備える。
【選択図】 図1An object of the present invention is to reduce the difference between the timing of generation and cancellation of alarm information on each monitoring item and the timing of collecting reports on these phenomena.
An alarm information collecting apparatus having a configuration in which a polling control unit controls an operation of collecting alarm information by polling of each monitoring item by a polling execution unit based on a schedule regarding monitoring timing of a plurality of monitoring items. The fault detecting means 112 for detecting the occurrence of a fault based on the alarm information obtained by polling each monitoring item, and the polling control means 110 perform a fault detection every time the fault detecting means 112 detects the occurrence of the fault. A continuous insertion unit 113 is provided for adjusting the schedule so as to continuously insert the monitoring timing corresponding to the additional polling of the detected monitoring item into the monitoring timing assigned to the monitoring item in which the failure is detected.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、装置を構成している複数のユニットに関する情報をポーリングによって収集する警報情報収集装置に関する。
【0002】
【従来の技術】
図20に、従来の一般的な警報情報収集装置の構成を示す。
図20に示した警報情報収集装置410と複数のユニット420とは、バスを介して接続されている。警報情報収集装置410において、監視制御部411は、バスに接続された各ユニット420に対して順次にポーリングを行うことにより、各ユニット420の動作状態に関する情報を収集し、必要に応じて、コンピュータなどの上位装置に報告する。このとき、インタフェース制御部(I/F)412は、監視制御部411からの指示に従って、指定されたユニット420に対する要求をバスを介して送信する。一方、各ユニット420のユニット制御部421は、自ユニットに備えられたインタフェース制御部(I/F)422を介して装置情報を要求する旨の要求を受け取ったときに、自ユニットを構成する各部の状態に関する装置情報を収集し、収集した装置情報をI/Oレジスタ423にセットする。その後、ユニット制御部421は、インタフェース制御部422にI/Oレジスタ423に装置情報が格納されたことを通知し、これに応じて、インタフェース制御部422は、I/Oレジスタ423の内容をバスを介して警報情報収集装置410に送信する。
【0003】
図20に示した各ユニット420において、例えば、回線の異常を検出する検出器などの出力は、それぞれ対応するラッチに警報情報として保持され、各ユニット420のユニット制御部421によってこの警報情報が読み取られたときに、クリアされる。このようにラッチに保持しておくことにより、異常が検出されたタイミングや異常が継続した期間の長さにかかわらず、ユニット制御部421により、検出された異常に関する警報情報をもれなく読み取って、I/Oレジスタ423にセットすることができる。各ユニット420にこのような構成が備られているので、一時的な回線の障害のような一過性の障害の発生であっても、障害が発生したという事実は、確実にインタフェース制御部422を介して警報情報収集装置410によって収集されている。
【0004】
また、このようにして警報情報を収集するごとに、警報情報収集装置410に備えられた監視制御部411は、警報情報保持部413の内容を収集した警報情報によって書き換えている。したがって、各監視項目において障害が発生した旨を示す警報情報は、新たに収集された対応する警報情報により、障害状態が解除されたことが示されるまで、警報情報保持部413において保持される。
【0005】
このように、順次ポーリングを用いて装置情報を収集する際に、障害の発生が報告されている装置に関して、ポーリング頻度を変化させる技術も提案されている(例えば、特許文献1参照)。
【特許文献1】
特開平1−151847号公報
【0006】
【発明が解決しようとする課題】
ところで、上述したような一般的な順次ポーリングでは、個々の装置に関する装置情報を収集するために無視できない長さの時間がかかるので、システムを構成している多数の装置情報を収集する場合には、システムの中のあるユニットの装置情報を収集してから次に収集するまでのポーリング間隔が長くなることは避けられない。
このために、警報情報収集装置が各ユニットから収集して保持している装置情報と、各ユニットを構成する各部のその時点における状態とが必ずしも一致しない場合が発生し、しかも、この不一致が長時間継続してしまう。
【0007】
以下、このような不一致が発生する原因を、図21に示した従来の警報情報収集動作を説明するタイミング図に基づいて説明する。
図21(a1)〜(aN)に、図20に示したユニット4201 〜420N に対応する監視タイミングを示す。これらの監視タイミングは、図20に示した監視制御部411により、図21(b)に示すクロック信号に基づいて生成されている。
【0008】
例えば、図20に示したシステムにおいて、図21(c)に示すように、ユニット4201 に対する監視タイミングにおけるポーリングの直後にこのユニット4201 において障害が発生した場合に(図21(c)において符号Aを付した矢印で示す)、障害そのものの継続時間にかかわらず、対応する警報情報はそのユニットに備えられた対応するラッチに保持されたまま次の監視タイミングまで維持される(図21(d)参照)。ここで、上述した障害が継続時間の非常に短い一過性のものであった場合には、図21(a1 )において符号Bを付した矢印で示す次の監視タイミングにおいてはすでに障害そのものは解消しているにもかかわらず、警報情報収集装置は、このときのポーリングで初めてその障害の発生を示す警報情報を収集し、この段階で初めてそのユニットに障害が発生したことを認識する。そして、警報情報収集装置が、当該ユニットにおける障害が解消したことを認識するのは、更に、次の監視タイミングにおけるポーリングで(図21(a1 )において符号Cを付した矢印で示す)、新しい警報情報を得てからとなる(図21(e)参照)。
【0009】
このような各ユニットにおける警報情報の検出および解消タイミングと警報情報収集装置へのこれらの現象を報告するタイミングとのずれは、当然ながら、警報情報収集装置が監視対象とするユニットの数に比例して増大する傾向がある。例えば、通信システムの伝送装置に備えられた警報情報収集装置では、数十ものユニットを一括して監視する構成が一般的であるので、上述したポーリング間隔は数百msにまで延びてしまう場合もある。
【0010】
その一方、伝送装置に接続されている回線の一時的な障害のように、上述したポーリング間隔に比べて非常に継続時間の短い一過性の障害は、伝送装置に限らず、様々なシステムにおいて比較的に頻度の高い障害である。このような一過性の障害の回復タイミングと回復したことが報告されるタイミングとのずれの大きさは、このような障害の発生状況を正確に把握することを妨げる要因であることから、様々なシステムを正常に運用する上で重要な問題となっている。
【0011】
本発明は、多数の監視項目に関する警報情報を順次ポーリングによって収集する際に、各監視項目に関する警報情報の発生および解消のタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小可能な警報情報収集装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
図1に、本発明にかかわる第1の警報情報収集装置の原理ブロック図を示す。請求項1の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段112と、ポーリング制御手段110は、障害検出手段112によって障害の発生が検出されるごとに、障害が検出された監視項目についての追加ポーリングに対応する監視タイミングを障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整をスケジュールに対して行う連続挿入手段113を備えた構成であることを特徴とする。
【0013】
請求項1の発明では、障害検出手段112によってある監視項目に障害が発生したことが検出されるごとに、ポーリング制御手段110に備えられた連続挿入手段113により、障害が検出された監視項目に割り当てられている監視タイミングに連続して、その監視項目に対する追加ポーリングがスケジュールに挿入される。このような追加ポーリングの挿入は、追加ポーリングの実行に伴って収集された警報情報によって、該当する監視項目に関する障害が解消したことが示されるまで繰り返される。
【0014】
したがって、このように構成された第1の警報情報収集装置では、任意の監視項目に関する障害を検出したときに、その監視項目に対して連続して追加的なポーリングを実行することができるので、例えば、一過性の障害の解消したことを示す警報情報を迅速に収集し、上位装置に報告することができる。
【0015】
更に、図1に示した連続挿入手段113は、障害検出手段112によって障害の発生が検出されるごとに、該当する監視項目に関する追加ポーリングをスケジュールに追加する追加手段121と、追加手段121によって追加された追加ポーリングの数が所定の数に到達したときに、追加手段による追加動作を停止する追加停止手段122とを備えて構成してもよい。
【0016】
このような連続挿入手段113を備えた第1の警報情報収集装置では、追加手段121の動作を追加停止手段122が制御することによって、任意の監視項目についてスケジュールに連続的に挿入される追加ポーリングを、所定の数までに制限する。したがって、障害が解消したか否かにかかわらず、所定の数までの追加ポーリングが実行された後に、ポーリング実行手段111は、元のスケジュールで規定された順序に従って次にポーリングするべき監視項目に対するポーリングを実行する。つまり、障害が発生した監視項目について連続して所定の回数だけ追加ポーリングを行った後、通常の順次ポーリングを再開する。これにより、追加ポーリングを挿入することによって発生する他の監視項目に関するポーリング間隔の延長分を制限し、他の監視項目に関するポーリング頻度の著しい低下を避けることができる。
【0017】
また一方、図1に示した第1の警報情報収集装置において、ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、連続挿入手段113は、障害検出手段112によって障害の発生が検出されるごとに、スケジュールに含まれている予備タイミングを、該当する監視項目についての追加ポーリングに対応する監視タイミングとして割り当てる割り当て手段123を備えて構成してもよい。
【0018】
このような構成の警報情報収集装置では、障害検出手段112によって障害の発生が検出されるごとに、割り当て手段123により、スケジュールに予め含まれている予備タイミングが、障害が検出された監視項目に対する監視タイミングとして割り当てられ、この追加的に割り当てられた監視タイミングに追加ポーリングが行われる。この予備タイミングは、監視項目に割り当てられていないときは待ち時間となっているので、障害が検出されている監視項目に対する追加ポーリングのために割り当てても、全ての監視項目に対するポーリング動作が一巡するまでに要する時間は変化しない。したがって、障害が検出されている期間や障害が検出された監視項目の数にかかわらず、正常であることが警報情報で示されている監視項目に関するポーリング間隔を一定に保つことができる。
【0019】
図2に、本発明にかかわる第2の警報情報収集装置の原理ブロック図を示す。請求項2の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングで得られた警報情報に基づいて、障害が発生している監視項目を検出する項目検出手段115と、項目検出手段によって検出された各監視項目について、その監視項目に割り当てられた監視タイミングを基点とするポーリング周期を整数等分した位置を、追加ポーリングを行うタイミングとして算出するタイミング算出手段116とを備え、ポーリング制御手段110は、タイミング算出手段116によって算出されたタイミングに、追加ポーリングをスケジュールに挿入するスケジュール調整手段117を備えた構成であることを特徴とする。
【0020】
請求項2の発明では、項目検出手段115により、それまでに収集された警報情報によって障害が発生しているとされた監視項目の全てが検出され、これらの監視項目について追加ポーリングを行うタイミングがタイミング算出手段116によって算出される。このタイミング算出手段116は、障害が検出されている各監視項目についての追加ポーリングのタイミングを、それぞれの監視項目に関するポーリング周期の中で均等となるように算出するので、スケジュール調整手段117により、これらの追加ポーリングをスケジュールに挿入することにより、1ポーリング周期内において、注目している監視項目に対して複数回のポーリングをほぼ等間隔で実行することができる。
【0021】
また、図2に示したスケジュール調整手段117に、タイミング算出手段116による算出結果に応じてスケジュールに挿入する追加ポーリングの数を予め定めた所定の数までに制限する追加制限手段124を備えて構成してもよい。
このように構成されたスケジュール調整手段117を備えた警報情報収集装置では、障害が検出されたことによってスケジュールに挿入される追加ポーリングの数を所定の数までに制限することができる。これにより、障害が検出された監視項目が多数に上った場合などに、追加ポーリングを含めた全体のポーリング回数に制限を設けることができるので、全ての監視項目に対するポーリング動作が一巡するために要する時間の無制限な延長を防ぐことができる。したがって、障害が検出された監視項目の数にかかわらず、全ての監視項目について適正な頻度で警報情報の収集を実行することができる。
【0022】
また、図2に示した警報情報収集装置において、ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、スケジュール調整手段117は、スケジュールに含まれている予備タイミングを削除して、代わりに該当する監視項目についての追加ポーリングをタイミング算出手段116によって算出されたタイミングに振り替えて設定する振替設定手段125を備えて構成してもよい。
【0023】
このような振替設定手段125を備えた警報情報収集装置では、振替設定手段125により、スケジュールに予め含まれている予備タイミングの代わりに、タイミング算出手段116による算出結果に従って、障害が検出された監視項目に対する監視タイミングがスケジュールに挿入され、この挿入された監視タイミングに該当する監視項目に対する追加ポーリングが行われる。この予備タイミングは、監視項目に割り当てられていないときは待ち時間となっているので、障害が検出されている監視項目に対する追加ポーリングのために割り当てても、全ての監視項目に対するポーリング動作が一巡するまでに要する時間は変化しない。したがって、障害が検出されている期間や障害が検出された監視項目の数にかかわらず、正常であることが警報情報で示されている監視項目に関するポーリング間隔を一定に保つことができる。
【0024】
図3に、本発明にかかわる第3の警報情報収集装置の原理ブロック図を示す。請求項3の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングで得られた警報情報に基づいて、障害の発生および障害の解消を含む動作状態の変化を検出するイベント検出手段118を備え、ポーリング制御手段110は、全ての監視項目について、相互の従属関係を示す従属情報保持手段131と、イベント検出手段118によっていずれかの監視項目に障害の発生が検出されるごとに、従属情報保持手段131を参照し、障害が検出された監視項目に従属するとされた監視項目に対応してスケジュールに設定された監視タイミングを選択的にマスクするマスク設定手段132と、イベント検出手段118によって障害の解消が検出された監視項目について、従属情報保持手段131を参照し、検出された監視項目に従属するとされた監視項目に対応してスケジュールに含まれる監視タイミングに設定されたマスクを解除するマスク解除手段133とを備えた構成であることを特徴とする。
【0025】
請求項3の発明では、イベント検出手段118によってある監視項目について障害の発生が検出されたときに、ポーリング制御手段110に設けられたマスク設定手段132は、従属情報保持手段131に保持された情報に基づいて、この監視項目の下位に位置付けられた監視項目に関してスケジュールに設定されていた監視タイミングをマスクする。その後、イベント検出手段118によって、上述した監視項目に関する障害が解消したことが検出されたときに、マスク解除手段133は、従属情報保持手段131に保持された情報に基づいて、この監視項目の下位に位置付けられた監視項目に対応する監視タイミングに設定されていたマスクを解除する。このように、上位の警報情報の発生に伴って、その下位に位置付けられた警報情報に関する監視タイミングをマスクすることにより、何らかの障害が検出された状態では、必要最小限の監視項目に限定してポーリングを実行し、障害が発生している上位の監視項目に関する警報情報を収集する頻度を一時的に増大させることができる。
【0026】
図4に、本発明にかかわる第4の警報情報収集装置の原理ブロック図を示す。請求項4の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、ポーリング制御手段110は、全ての監視項目について、現用系であるか予備系であるかを示す情報を保持する現用情報保持手段134と、現用情報保持手段134に保持された情報に基づいて、予備系に属する監視項目に対してスケジュールに設定された監視タイミングを所定の割合でスキップするスキップ制御手段135とを備えた構成であることを特徴とする。
【0027】
請求項4の発明では、現用情報保持手段134において予備系であることが示された監視項目に対応してスケジュールに設定された監視タイミングは、スキップ制御手段135により、所定の割合でスキップされる。例えば、予備系に属する各監視項目に割り当てられていた監視タイミングを、2監視周期に一回ずつスキップすれば、全ての監視項目について警報情報の収集動作を2巡する時間で、現用系に属する監視項目についてはそれぞれ3回ポーリングを行い、予備系についてはそれぞれ1回ずつポーリングを行うというように、現用系のポーリング頻度を予備系のポーリング頻度よりも高くすることができる。
【0028】
【発明の実施の形態】
以下、図面に基づいて、本発明の実施形態について詳細に説明する。
図5に、本発明にかかわる警報情報収集装置の第1の実施形態を示す。
なお、図5に示した構成要素のうち、図20に示した各部と同等のものについては、図20に示した符号を付して示し、その説明を省略する。
【0029】
図5に示した警報情報収集装置において、監視制御部210は、図20に示した監視制御部411と同様に、インタフェース制御部412を介して複数のユニット420から警報情報を収集する。
この監視制御部210において、インタフェース制御部412を介してユニットから収集した警報情報は、警報情報保持部211に保持され、この警報情報保持部211に保持された警報情報は、従来と同様にして、報告処理部213により、適切な手順に従って上位装置に通知される。また、上述した警報情報は、同時にアラーム検出部212に送られ、このアラーム検出部212により、障害の発生およびその解消などの状態の変化が検出される。
【0030】
また、図5に示した監視制御部210において、順次制御部214は、従来と同様に、所定のクロック信号に従って、各ユニットを順次に監視対象として指定するための指示を出力する。一方、挿入制御部215は、アラーム検出部212による検出結果およびカウンタ216からの通知に基づいて、上述した順次制御部214の動作を制御するとともに、障害が検出されたユニットに対して追加的なポーリングを行うための指示を出力する。また、図5に示したカウンタ216は、挿入制御部215が上述した指示を出力した回数を計数し、その計数結果が所定の閾値に到達したときに、その旨を挿入制御部215に通知する。
【0031】
ここで、図5に示した各部と図1に示した各手段との対応関係について説明する。
図5に示したインタフェース制御部412が監視制御部210からの指示に応じて動作することにより、図1に示したポーリング実行手段111の機能が果たされる。また、図5に示したアラーム検出部212は、図1に示した障害検出手段112に相当する。同様に、図5に示した挿入制御部215は、図1に示した追加手段121に相当する。一方、図5に示したカウンタ216からの通知に応じて挿入制御部215が動作することにより、図1に示した追加停止手段122の機能が果たされる。したがって、図5においては、挿入制御部215とカウンタ216とによって、図1に示した連続挿入手段114の機能を果たしている。なお、図1に示したスケジュールは、図5に示した順次制御部214の動作を規定する手順に相当する。
【0032】
次に、図5に示した第1の警報情報収集装置の動作について説明する。
図6に、第1の警報情報収集装置の動作を表す流れ図を示す。また、図7に、第1の警報情報収集装置の動作を説明するタイミング図を示す。
【0033】
図5に示した順次制御部214は、各監視周期の初めに、図6に示したステップ301において、監視対象のユニットを示す監視番号iに初期値(例えば、数値「1」)を設定し、また、挿入制御部215は、カウンタ216に計数の初期値(例えば、数値「1」)を設定する。次に、図5に示した順次制御部214は、この監視番号iで示されるi番目のユニット420を指定して、インタフェース制御部412に警報情報の要求を指示し、この指示に応じて、インタフェース制御部412は、上述したi番目のユニット420iに対するポーリングを実行する(ステップ302)。
【0034】
ステップ302において収集された警報情報によって、i番目のユニット420に障害が発生していないことが示された場合(ステップ303の否定判定)に、順次制御部214は、ステップ304に進んで監視番号iをインクリメントする。次に、順次制御部214は、インクリメント後の監視番号iが監視対象のユニットの総数Nを超えているか否かを判定し(ステップ305)、このステップ305の否定判定の場合は、ステップ302に進んで、次のユニットに関する警報情報の収集を行う。
【0035】
このように、アラーム検出部212によって障害が検出されていない状態においては、順次制御部214からの指示に応じて、従来と同様にして、図7において符号(a1)〜(aN)を付して示した各ユニットに対応する監視タイミングに、それぞれのユニット420に関する警報情報が収集される。なお、図7において、順次制御部214および挿入制御部215において、監視タイミングを生成するために利用する内部クロック信号を、図7(b)に示した。
【0036】
このようにして全ユニットに関する監視動作が一巡したときに、上述したステップ305の肯定判定となり、順次制御部214は、一つの監視周期が完了したと判断し、ステップ301に進んで、新たな監視周期に関する監視制御を開始する。
ところで、例えば、ユニット4201 に対応する監視タイミングが終了した後に、ユニット4201 において障害が発生した場合は(図7(a1 )および(c)参照)、次の監視周期のこのユニット4201 に対応する監視タイミングで初めてアラーム検出部212は、このユニット4201 に障害が発生したことを検出する。
【0037】
この場合は、図6に示したステップ303の肯定判定となり、順次制御部214に代わって挿入制御部215が動作を開始し、i番目のユニット(例えば、ユニット4201 )を指定して警報情報を要求し、この指示に応じて、インタフェース制御部412は、ユニット4201 に対するポーリングを行って、このユニットに関する警報情報を収集する(ステップ306)。
【0038】
図7に示したように、ユニット4201 において発生した障害が、アラーム検出部212によって検出された段階ですでに解消している場合は(図7(c)、(d)参照)、上述したようにして、このユニット4201 に対する追加のポーリングで得られる警報情報によって、その障害が解消していることが示される。
【0039】
このように、追加ポーリングで得られた警報情報によって障害が回復したことが示された場合(図6に示したステップ307の肯定判定)に、挿入制御部215は、追加ポーリングの挿入処理を完了して順次制御部214に制御を渡し、順次制御部214は、ステップ304に進み、順次ポーリング動作を再開する。
【0040】
一方、ステップ307の否定判定の場合に、挿入制御部215は、追加ポーリングの挿入がまだ必要であると判断する。この場合に、挿入制御部215は、ステップ308においてカウンタ216に挿入回数kのインクリメントを指示した後に、このカウンタ216の計数値で示される挿入回数kが上限値Mを超えたか否かを判定し(ステップ309)、否定判定の場合は、ステップ306に戻って新たな追加ポーリングを実行する。一方、ステップ309の肯定判定の場合に、挿入制御部215は、上述したステップ307の肯定判定の場合と同様に、追加ポーリングの挿入処理を終了し、順次制御部214に制御を渡す。
【0041】
図5に示した第1の警報情報収集装置では、上述したように、任意のユニットに対応する監視タイミングにおいて、そのユニットにおける障害の発生が検出されたときに、そのユニットに対して連続して追加ポーリングを実行する。したがって、任意のユニットにおいて発生した障害が解消したことを示す警報情報を迅速に収集し、各ユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。これにより、各ユニットにおける障害の発生状況と、警報情報収集装置に収集された警報情報によって示される障害の発生状況との差異を少なくすることができる。
【0042】
例えば、回線の一時的な切断のような一過性の障害を示すアラームが、警報情報収集装置に設けられた警報情報保持部211に保持されている期間を短縮し、上述した一過性の障害が現実に発生している期間に近づけることができるので、監視対象のユニットに関する状態をより正確に把握することが可能となる。
【0043】
また、挿入制御部215が、図6においてステップ306からステップ309に示したように、1監視周期において挿入する追加ポーリングの数に上限を設けて制御することにより、追加ポーリングの挿入によって、監視周期が極端に増大することを防いでいる。
もちろん、挿入制御部215が、アラーム検出部212による検出結果に応じて、追加ポーリングを無制限に挿入する構成を採用することも可能である。
【0044】
次に、追加ポーリングの挿入にかかわらず、一定の監視周期を維持する方法について説明する。
図8に、第1の警報情報収集装置にかかわる別実施形態を示す。
なお、図8に示した各部において、図5に示した各部と同等のものについて、同一の符号を付して示し、説明を省略する。
【0045】
図8に示した警報情報収集装置において、順次制御部217は、カウンタ216の計数値によって示される追加ポーリングの挿入回数を考慮して、順次ポーリング動作を制御する。
なお、この場合に、図8に示したカウンタ216による計数値に応じて挿入制御部215および順次制御部217が追加ポーリングの挿入および順次ポーリング動作の制御を行うことにより、図1に示した割り当て手段123の機能が果たされる。
【0046】
図9に、第1の警報情報収集装置にかかわる別実施形態の動作を表す流れ図を示す。
なお、図9に示す各ステップのうち、図6に示した各ステップと同等のものについては同一の符号を付して示し、その説明を省略する。
図9に示した流れ図においては、ステップ305の肯定判定に応じて、ステップ301に戻る代わりに、ステップ312を実行する。
【0047】
このステップ312において、順次制御部217は、監視番号iとカウンタ216の計数値で示される挿入回数kとの和の値がユニットの総数Nと挿入回数の上限Mとの和の値を超えたか否かに基づいて、監視周期が経過したか否かを判定する。
したがって、どのユニットについての障害が検出されなかった場合には、挿入回数の上限Mに相当する時間は、順次ポーリング動作の待ち時間となる。一方、挿入制御部215によって追加ポーリングが挿入された場合は、追加ポーリングを挿入するごとに、スケジュールに予め設けられていた待ち時間の一部が削除されることになる。このことは、すなわち、スケジュールに設けた予備タイミングを追加ポーリングに割り当てることと同等である。
【0048】
このようにして、予めスケジュールに設けた待ち時間の範囲内で追加ポーリングを実行することにより、監視周期を一定に維持しつつ、任意のユニットにおいて発生した障害が解消したことを示す警報情報を迅速に収集し、各ユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。
【0049】
次に、障害が発生したことが示された監視項目について、ポーリング周期内に均等に追加ポーリングを挿入する方法について説明する。
図10に、本発明にかかわる第2の警報情報収集装置の実施形態を示す。
なお、図10に示す構成要素のうち、図5に示した各部と同等のものについては、図5に示した符号を付して示し、その説明を省略する。
【0050】
図10に示した警報情報収集装置に備えられた監視制御部220において、順次制御部221は、従来と同様に、所定のクロック信号に従って、各ユニットを順次に監視対象として指定するための指示を出力するとともに、監視対象として指定するユニットを示す監視番号iを参照番号算出部222に通知する。この参照番号算出部222は、通知された監視番号i、監視周期を分割する数を示す分割数m、分割された監視周期における位置を示す位相xおよびユニットの総数Nとに関する式(1)を用いて、警報情報保持部211においてアラームの発生を参照すべきユニットを示す参照番号jを算出し、この参照番号jをアラーム判定部223に渡す。
【0051】
j=mod(N,i+(m−x)N/m) ・・・(1)
また、図10に示したアラーム判定部223は、通知された参照番号jで示されるユニットに対応して警報情報保持部211に保持された警報情報を参照し、該当するユニットにおいて障害が発生しているか否かを判定する。このアラーム判定部223による判定結果は、順次制御部221および追加指示部224に通知され、順次制御部221および追加指示部224は、通知された判定結果に応じて、それぞれ後述する処理を行う。
【0052】
ここで、図10に示した各部と図2に示した各手段との対応関係について説明する。
図10に示したインタフェース制御部412が監視制御部220からの指示に応じて動作することにより、図1に示したポーリング実行手段111の機能が果たされる。また、図10に示した警報情報保持部211およびアラーム判定部223は、図2に示した項目検出手段115に相当し、図10に示した参照番号算出部222は、図2に示したタイミング算出手段116に相当する。また、図10に示した追加指示部224がアラーム判定部223による判定結果に応じて追加ポーリングのための指示を出力することにより、図2に示したスケジュール調整手段117の機能が果たされる。
【0053】
以下、図10に示した第2の警報情報収集装置の動作について説明する。
図11に、第2の警報情報収集装置の動作を表す流れ図を示す。また、図12に、第2の警報情報収集装置の動作を説明するタイミング図を示す。
【0054】
警報情報の収集を開始する際に、順次制御部221は、監視番号iに初期値「1」を設定し、また、参照番号算出部222は、位相xに初期値「1」を設定する(ステップ321)。
ステップ322において、順次制御部221は、監視番号iを指定してポーリングを行うための指示を出力し、これに応じて、インタフェース制御部412は、ユニット420i に対するポーリングを行う。このときに得られた警報情報は、警報情報保持部211に保持される。
【0055】
次いで、参照番号算出部222は、上述した式(1)に従って参照番号jを算出し(ステップ323)、アラーム判定部223は、この参照番号jで示されるユニット420j に対応して警報情報保持部211に保持された警報情報を参照し(ステップ324)、この警報情報によって障害が発生しているアラーム状態が示されているか否かを判定する(ステップ325)。
【0056】
例えば、分割数m=2,ユニットの総数N=10とすれば、図12(c)に示すように、監視番号7で示されるユニット4207 に対するポーリングの際に、上述したステップ323において、参照番号算出部222は、式(1)の計算結果としてユニット4202 に対応する参照番号「2」を得る(図12(d)参照)。ここで、図12に示した例においては、図12(a2 )に示したユニット4202 に対するポーリングにおいて、この時点において継続中の障害を示す警報情報が収集され(図12(e)参照)、この警報情報が、すでに警報情報保持部211に保持されている。
【0057】
したがって、この場合に、アラーム判定部223は、参照番号「2」に基づいて警報情報保持部211を参照することにより、このユニット4202 において障害が発生していることを示す警報情報を得るので、これに基づいて、参照番号で示されるユニットがアラーム状態であると判定する。
【0058】
このように、アラーム判定部223によってアラーム状態であると判定された場合(ステップ325の肯定判定)に、順次制御部221は一時的に動作を停止し、代わって、追加指示部224が、上述した参照番号jを指定してポーリングを行うための指示を出力し、これに応じて、インタフェース制御部412が、ユニット420j に対するポーリングを行う(ステップ326)。
【0059】
このようにして、図12に示すように、監視番号が一巡する期間の中間に、監視番号「2」に対応するユニット4202 に対する追加ポーリングを挿入することができる。この追加ポーリングに伴って、図12(f)に示すように、ユニット4202 におけるラッチの解除を促進することができる。
【0060】
ここで、図12(a1)〜(a10)に、ユニット4201 〜42010 に対する順次ポーリングに追加ポーリングを加えた監視タイミングを示し、また、図12(b)に、順次制御部221および追加指示部224の動作を規定するクロック信号を示した。また、図12(c)に、監視番号を示し、図12(d)に、参照番号の系列を示した。また、図13(e)、(f)、(g)に、ユニット4202 における障害検出信号、ラッチ信号および収集された警報情報をした。なお、図12(c)、(d)に示した監視番号および参照番号においては、ユニット42010に対応する番号を符号Aとして示した。
【0061】
上述したようにして追加ポーリングを挿入した後に、追加指示部224は、1監視周期を分割数mで分割して得られた全ての位相について参照番号の算出を完了したか否かを判定する(ステップ327)。このステップ327の否定判定の場合に、追加指示部224は、位相xをインクリメントして(ステップ328)、ステップ323に戻り、これに応じて、参照番号算出部222は、次の位相における参照番号jを算出する。
【0062】
一方、ステップ327の肯定判定の場合に、追加指示部224は、監視番号iに対応する全ての参照番号についての処理を完了したと判断し、追加ポーリングの挿入処理を終了して、順次制御部221に制御を渡す。これに応じて、順次制御部221は、監視番号iをインクリメントし(ステップ329)、また、位相xに初期値を設定して(ステップ330)、ステップ322に戻り、監視番号iで示される次のユニットに関する警報情報を収集する処理を再開する。
【0063】
図12に示した例においては、上述したようにして挿入された追加ポーリングによって、ユニット4202 におけるラッチがすでにクリアされているので、順次制御部221による順次ポーリング動作の再開に伴って、監視番号がインクリメントされていき、再びユニット4202 に対するポーリングが実行されたときには、障害が解消された旨の警報情報が得られ、これに基づいて、警報情報保持部211の内容も更新される。
【0064】
このように、順次制御部221によってインクリメントされる監視番号に対して、位相をずらした参照番号を参照番号算出部222によって算出し、この参照番号に基づいて追加ポーリングを挿入することにより、障害が検出されたユニットそれぞれについて、1監視周期に分割数に応じた数の追加ポーリングを均等に挿入することができる。
【0065】
図13に、分割数m=3、ユニットの総数N=10である場合に、監視番号4および監視番号7で示されるユニットについて追加ポーリングを挿入する例を示す。なお、図13(a4)、(a7)に、ユニット4204 、4207 に対する順次ポーリングに追加ポーリングを加えた監視タイミングを示し、図13(b)に、順次制御部221および追加指示部224の動作を規定するクロック信号を示した。また、図13(c)に、監視番号を示し、図13(d)、(e)に、位相の異なる参照番号の系列を示した。また、図13(f)、(g)、(h)に、ユニット4204 における障害検出信号、ラッチ信号および収集された警報情報を示し、図13(i)、(j)、(k)に、ユニット4207 における障害検出信号、ラッチ信号および収集された警報情報を示した。
【0066】
このように、図10に示した第2の警報情報収集装置では、比較的に継続時間が長い障害が発生する可能性が高いユニット群を監視する場合においても、任意のユニットにおいて発生した障害が解消したことを示す警報情報を迅速に収集し、各ユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。これにより、各ユニットにおける障害の発生状況と、警報情報収集装置に収集された警報情報によって示される障害の発生状況との差異を少なくすることができる。
【0067】
更に、監視番号が一巡する間に挿入される追加ポーリングの数を制限することもできる。
図14に、本発明にかかわる第2の警報情報収集装置の別実施形態を示す。
なお、図14に示した構成要素のうち、図10に示した各部と同等のものについては、図10に示した符号を付して示し、その説明を省略する。
【0068】
図14に示した監視制御部220は、図10に示した各部に加えて、カウンタ225を備えている。このカウンタ225は、追加指示部224が追加ポーリングを行うための指示を出力した回数を計数し、計数結果が所定の閾値cに達したときに、その旨を参照番号算出部222および追加指示部224に通知して、この参照番号算出部222および追加指示部224による追加ポーリングの挿入動作を停止する。
【0069】
このように、図14に示したカウンタ225の計数値に応じて、後述するようにして、参照番号算出部222および追加指示部224が追加ポーリングの挿入動作を停止することにより、図2に示した追加制限手段124の機能が果たされる。
図15に、図14に示した第2の警報情報収集装置の別実施形態の動作を表す流れ図を示す。
【0070】
図15に示したステップ331において、順次制御部221は、図11に示したステップ321と同様の初期化処理とともに、カウンタ225の計数値に初期値「0」を設定する。
一方、参照番号算出部222は、参照番号の算出に先立って、挿入回数kと挿入回数の上限cとを比較し、挿入回数kが上限に達していない場合(ステップ332の否定判定)は、ステップ323に進んで参照番号の算出を行う。一方、ステップ332の肯定判定の場合に、参照番号算出部222は、追加ポーリングをこれ以上挿入することはできないと判断し、順次制御部221に制御を渡す。この場合に、順次制御部221は、図15において符号Aを付した端子で示すようにステップ334に進み、監視番号iのインクリメントおよび位相xの初期化を行う。その後、順次制御部221は、ステップ335において監視番号iがユニットの総数Nを超えたか否かを判定し、このステップ335の否定判定の場合はステップ322に進んで監視番号iで示される次のユニットに関する警報情報の収集を行う。一方、ステップ335の肯定判定の場合に、順次制御部221は、監視番号iが一巡したと判断し、ステップ331に進んで初期化処理を行い、新たな監視周期の処理を開始する。
【0071】
このように、図14に示した第2の警報情報収集装置の別実施形態においては、カウンタ225の計数値が挿入回数の上限cに到達するまでに限って、参照番号算出部222、アラーム判定部223および追加指示部224によって追加ポーリングを挿入することにより、追加ポーリングの挿入によって、監視周期が極端に増大することを防いでいる。
【0072】
更に、図9に示したステップ311に相当する処理をステップ335の肯定判定に応じて行い、順次ポーリングのスケジュールに予め設けた待ち時間を追加ポーリングに割り当てることも可能である。
次に、警報情報相互の従属関係を利用して、主要な警報情報に関する監視間隔を短縮する方法について説明する。
【0073】
図16に、本発明にかかわる第3の警報情報収集装置の実施形態を示す。
なお、図16に示した構成要素のうち、図20あるいは図5に示した各部と同等のものについては、図20あるいは図5に示した符号を付して示し、その説明を省略する。
【0074】
図16に示した監視制御部230において、従属情報保持部231は、各ユニット420に対応する警報情報について、相互の依存関係を示す情報を保持している。また、図16において、インタフェース制御部412を介して入力された警報情報は、アラーム検出部212とともに解消検出部233に入力されている。この解消検出部233は、新たに受け取った警報情報と警報情報保持部211に保持された対応する警報情報とに基づいて、該当するユニットにおける障害が解消したことを検出し、検出結果をマスク制御部232に通知する。図16に示したマスク制御部232は、上述した従属情報保持部231に保持された情報とアラーム検出部212および解消検出部233から通知される検出結果とに基づいて、マスク保持部234に各ユニットに対応して設けられたマスクフラグに適切な値を設定する。また、図16に示したポーリング制御部235は、自身の内部において順次に生成される監視番号ごとに、上述したマスク保持部234を参照し、監視番号に対応するマスクフラグの値に応じて、インタフェース制御部412に適切な指示を送出する。
【0075】
ここで、図16に示した各部と図3に示した各手段との対応関係について説明する。
図16に示したインタフェース制御部412が監視制御部230からの指示に応じて動作することにより、図3に示したポーリング実行手段111の機能が果たされる。また、図16に示した警報情報保持部211、アラーム検出部212および解消検出部233は、図3に示したイベント検出手段118に相当し、図16に示した従属情報保持部231は、図3に示した従属情報保持手段131に相当する。また、図16に示したマスク制御部232がマスク保持部234に設定した情報に従ってポーリング制御部235が後述するようにしてポーリングを行うための指示を出力する動作を制御することにより、図3に示したマスク設定手段132およびマスク解除手段133の機能が果たされる。
【0076】
次に、図16に示した第3の警報情報収集装置の動作について説明する。
図17に、第3の警報情報収集装置の動作を表す流れ図を示す。
図16に示したポーリング制御部235は、各監視周期の初めに監視番号iに初期値「1」を設定する(ステップ341)。次に、ポーリング制御部235は、監視番号iに対応してマスク保持部234に保持されたマスクフラグを参照し、監視番号iに対応する警報情報がマスクされているか否かを判定する(ステップ342)。
【0077】
ステップ342の否定判定の場合に、ポーリング制御部235は、監視番号iを指定してインタフェース制御部412にこの監視番号iで示されるユニット420に対するポーリングを行うための指示を入力し、この指示に応じて、インタフェース制御部412は、上述したユニット420に対するポーリングを行って警報情報を収集する(ステップ343)。
【0078】
このように、ポーリング制御部235が、マスク保持部234に保持されたマスクフラグの値に応じてポーリングを行うことにより、このマスク保持部234にも受けられたマスクフラグによって、対応する警報情報をマスクしない旨が示された警報情報に限って、ポーリングを行うことができる。
【0079】
ステップ343において収集された警報情報は、警報情報保持部211に保持されるとともに、アラーム検出部212および解消検出部233に渡される。
このとき、アラーム検出部212によって、障害の発生が検出された場合(ステップ344の肯定判定)に、マスク制御部232は、従属情報保持部231を参照して、監視番号iに依存することが示された警報情報を検索し(ステップ345)、次いで、ステップ345における検索結果で示された警報情報に対応してマスク保持部234に設けられたマスクフラグに、それぞれ対応する警報情報をマスクする旨の値を設定する(ステップ346)。
【0080】
このようにして、障害が発生したことが検出された警報情報に従属する警報情報に対応して、マスク保持部234に設けられたマスクフラグにそれぞれの警報情報をマスクする旨の値を設定し、以降の処理において、これらの警報情報を監視対象からはずすことができる。これにより、障害が発生したことが検出された主要な警報情報を相対的に高い頻度で収集することができるので、障害が解消したことを示す警報情報を迅速に収集し、該当するユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。これにより、各ユニットにおける障害の発生状況と、警報情報収集装置に収集された警報情報によって示される障害の発生状況との差異を少なくすることができる。この警報情報の変化を迅速に把握することができる。
【0081】
一方、ステップ343において収集された警報情報によって障害が発生していないことが示された場合(ステップ344の否定判定)であって、該当する監視番号iに対応して、警報情報保持部211に保持されていた警報情報によって障害の発生が示されている場合に、解消検出部233は、該当する警報情報に関する障害の解消を検出する(ステップ347)。この場合に、マスク制御部232は、従属情報保持部231を参照して、監視番号iに依存することが示された警報情報を検索し(ステップ348)、次いで、ステップ348における検索結果で示された警報情報に対応してマスク保持部234に設けられたマスクフラグをクリアして、それぞれに対応する警報情報に設定したマスクを解除する(ステップ349)。
【0082】
このようにして、主要な警報情報によって該当する障害の解消が示されたときに、この警報情報に従属する警報情報に関するマスクを解除して、これらの警報情報を監視対象に復帰させることができる。
一方、上述したマスク設定処理(ステップ345,346)あるいはマスク解除処理(ステップ348,349)の終了後に、マスク制御部232は処理をポーリング制御部235に返し、これに応じて、ポーリング制御部235は、監視番号iと監視対象の総数Nとの比較結果に基づいて、監視対象に関するポーリング処理が一巡したか否かを判定する(ステップ350)。監視番号iが総数Nに達していない場合(ステップ350の否定判定)に、ポーリング制御部235は、監視番号iをインクリメントして(ステップ351)、ステップ342に戻り、新たな監視番号に対応するポーリング処理を続ける。一方、ステップ350の肯定判定の場合に、ポーリング制御部235は、ステップ341に戻って監視番号iを初期化し、新たな監視周期に関する処理を開始する。
【0083】
図16に示した第3の警報情報収集装置の特徴は、障害が発生したときに監視対象を絞り込むという点にあり、この特徴は、特に、幾つかの主要な警報情報に従属して、多数の警報情報が位置付けられており、これらの多数の従属する警報情報が、上述した主要な警報情報の変化に応じて変化する場合に有効である。なお、このように警報情報が階層的な構造をもっている場合には、主要な警報情報に対応する障害が発生したときには、下位に位置付けられる警報情報もまた障害の発生を示すので、上述したようにして、従属的な警報情報を監視対象からはずすことによって、収集される情報の実質的な量は変化しないと考えられる。
【0084】
次に、二重化されたシステムにおいて有効な警報情報収集装置について説明する。
図18に、本発明にかかわる第4の警報情報収集装置の実施形態を示す。
なお、図18に示した構成要素のうち、図5あるいは図20に示した各部と同等のものについては、図5あるいは図20に示した符号を付して示し、その説明を省略する。
【0085】
図18に示した警報情報収集装置は、監視制御部240を備えている。この監視制御部240において、現用情報保持部241は、各ユニット420が現用系に属しているか予備系に属しているかを示す情報を上位の装置(図示せず)から受け取り、これらの情報を各ユニット420に対応して保持している。また、図18に示したスキップカウンタ242は、各ユニットに対応して、ポーリング制御部243が後述するポーリングのスキップを行った回数をそれぞれ計数し、計数結果をポーリング制御部243に通知する。このスキップカウンタ242によって得られた各ユニットに対応するスキップ回数と上述した現用情報保持部241に保持された情報とに基づいて、ポーリング制御部243は、各ユニット420に対するポーリングを実行するための指示を出力する動作あるいはポーリングのための指示を出力しないで次のユニットに関する処理に移行するスキップ動作を行う。
【0086】
ここで、図18に示した各部と図4に示した各手段との対応関係について説明する。
図18に示したインタフェース制御部412が監視制御部240からの指示に応じて動作することにより、図4に示したポーリング実行手段111の機能が果たされる。また、図18に示した現用情報保持部241は、図4に示した現用情報保持手段134に相当する。また、図18に示したスキップカウンタ242とポーリング制御部243とは、図4に示したスキップ制御手段135に相当する。
【0087】
次に、図18に示した警報情報収集装置の動作について説明する。
図19に、第4の警報情報収集装置の動作を表す流れ図を示す。
図19に示した警報情報収集動作を開始するのに先立って、図18に示したポーリング制御部243は、スキップカウンタ242の各ユニット420に対応する計数値に初期値(例えば、数値「0」)を設定する。
【0088】
各監視周期を開始する際に、ポーリング制御部243は、監視対象のユニットを示す監視番号iに初期値(例えば、数値「1」)を設定する(ステップ361)。次に、ポーリング制御部243は、上位の装置からの通知に基づいて、現用系と予備系との切り替えが行われたか否かを判定し(ステップ362)、切り替えが発生したことが通知された場合は(ステップ362の肯定判定)、スキップカウンタ242の各ユニット420に対応する計数値を初期化して(ステップ363)、ステップ364に進む。一方、ステップ362の否定判定の場合は、そのままステップ364に進む。
【0089】
ステップ364において、ポーリング制御部243は、現用情報保持部241を参照して、監視番号iで示されるユニット420i が現用系に属するか否かを判定する。
例えば、監視番号iで示されるユニット420i が現用系に属していることが現用情報保持部241に保持された情報によって示されている場合に、ポーリング制御部243は、このステップ364における肯定判定とし、インタフェース制御部412を介して、監視番号iで示されるユニット420i に関する警報情報を収集する(ステップ365)。次いで、ポーリング制御部243は、監視番号iをインクリメントし(ステップ366)、その後、この監視番号iがユニットの総数Nに到達したか否かを判定する(ステップ367)。
【0090】
インクリメント後の監視番号iがユニットの総数n未満であった場合に、ポーリング制御部243は、ステップ367の否定判定としてステップ362に戻り、次の監視番号に関する監視処理を行う。
一方、監視番号iに対応して現用情報保持部241に保持された情報により、該当するユニット420i が予備系に属していることが示された場合に、ポーリング制御部243は、ステップ364の否定判定としてステップ368に進み、ユニット420i に対応するスキップカウンタ242の計数値がスキップ回数の上限値d未満であるか否かを判定する。
【0091】
ユニット420i に対応するスキップカウンタ242の計数値が上述した上限値d未満である場合(ステップ368の肯定判定)に、ポーリング制御部243は、監視番号iで示されるユニット420i に関するポーリングをスキップする。このとき、ポーリング制御部243は、スキップカウンタ242に該当する系数値の加算を指示し、これに応じて、スキップカウンタ242はユニット420i に対応するスキップ回数をインクリメントする(ステップ369)。
【0092】
一方、ユニット420i に対応するスキップカウンタ242の計数値が上述した上限値dに到達した場合(ステップ368の否定判定)に、ポーリング制御部243は、すでに該当するユニットに関するポーリングは十分な回数だけスキップされたと判断し、インタフェース制御部412を介して該当するユニットに対するポーリングを実行し、警報情報を収集する(ステップ370)。次いで、ポーリング制御部243は、スキップカウンタ242に対して、対応する計数値をクリアする旨を指示し、監視番号iに対応するユニット420i に関するスキップ回数を初期化する。
【0093】
このステップ371の処理の終了後、および上述したステップ369の処理の終了後に、ポーリング制御部243は、ステップ366に進んで、次の監視番号に対応する処理に備える。
上述した例において、スキップ回数の上限値d=3とすれば、第1回から第3回までの監視周期においては、予備系に属するユニット420に対するポーリングはスキップされて、現用系に属するユニット420についてのみポーリングが実行され、第4回の監視周期において、全てのユニット420に対するポーリングが実行される。
【0094】
このように、第4の警報情報収集装置によれば、現用系に属するユニット420に関する警報情報を、予備系に属するユニットに対応する警報情報よりも高い頻度で収集することができる。
ここで、2重化されたシステムにおいて、稼動中の現用系に属するユニット420に関する警報情報の変化が発生する確率は、予備系に属するユニット420に関する警報情報の変化が発生する確率に比べて非常に大きいと考えられる。したがって、上述したようにして、予備系に属するユニット420に関する警報情報の収集動作をスキップしたことによって予備系に属するユニット420に関する警報情報の変化を見逃すデメリットよりも、現用系に属するユニット420に関する警報情報を収集する頻度を増大させることによって得られる効果の方がはるかに大きいと考えられる。
【0095】
更に、予備系については、完全に警報情報の収集をスキップしてしまうこともできる。この場合は、図19に示したステップ364の否定判定の場合に、ポーリング制御部243は、そのままステップ366に進んで、次の監視番号に対応する処理に備える。
以上の説明に関して、更に、以下の各項を開示する。
【0096】
(付記1) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段112と、
ポーリング制御手段110は、障害検出手段112によって障害の発生が検出されるごとに、障害が検出された監視項目についての追加ポーリングに対応する監視タイミングを障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整をスケジュールに対して行う連続挿入手段113を備えた構成である
ことを特徴とする警報情報収集装置。
【0097】
(付記2) 付記1記載の警報情報収集装置において、
連続挿入手段113は、
障害検出手段112によって障害の発生が検出されるごとに、該当する監視項目に関する追加ポーリングをスケジュールに追加する追加手段121と、
追加手段121によって追加された追加ポーリングの数が所定の数に到達したときに、追加手段による追加動作を停止する追加停止手段122とを備えた構成である
ことを特徴とする警報情報収集装置。
【0098】
(付記3) 付記1記載の警報情報収集装置において、
ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、
連続挿入手段113は、障害検出手段112によって障害の発生が検出されるごとに、スケジュールに含まれている予備タイミングを、該当する監視項目についての追加ポーリングに対応する監視タイミングとして割り当てる割り当て手段123を備えた構成である
ことを特徴とする警報情報収集装置。
【0099】
(付記4) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングで得られた警報情報に基づいて、障害が発生している監視項目を検出する項目検出手段115と、
項目検出手段115によって検出された各監視項目について、その監視項目に割り当てられた監視タイミングを基点とするポーリング周期を整数等分した位置を、追加ポーリングを行うタイミングとして算出するタイミング算出手段116とを備え、
ポーリング制御手段110は、タイミング算出手段116によって算出されたタイミングに、追加ポーリングをスケジュールに挿入するスケジュール調整手段117を備えた構成である
ことを特徴とする警報情報収集装置。
【0100】
(付記5) 付記4記載の警報情報収集装置において、
スケジュール調整手段117は、タイミング算出手段116による算出結果に応じてスケジュールに挿入する追加ポーリングの数を予め定めた所定の数までに制限する追加制限手段124を備えた構成である
ことを特徴とする警報情報収集装置。
【0101】
(付記6) 付記4記載の警報情報収集装置において、
ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、
スケジュール調整手段117は、スケジュールに含まれている予備タイミングを削除して、代わりに該当する監視項目についての追加ポーリングをタイミング算出手段116によって算出されたタイミングに振り替えて設定する振替設定手段125を備えた構成である
ことを特徴とする警報情報収集装置。
【0102】
(付記7) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングで得られた警報情報に基づいて、障害の発生および障害の解消を含む動作状態の変化を検出するイベント検出手段118を備え、
ポーリング制御手段110は、
全ての監視項目について、相互の従属関係を示す従属情報保持手段131と、イベント検出手段118によっていずれかの監視項目に障害の発生が検出されるごとに、従属情報保持手段131を参照し、障害が検出された監視項目に従属するとされた監視項目に対応してスケジュールに設定された監視タイミングを選択的にマスクするマスク設定手段132と、
イベント検出手段118によって障害の解消が検出された監視項目について、従属情報保持手段131を参照し、検出された監視項目に従属するとされた監視項目に対応してスケジュールに含まれる監視タイミングに設定されたマスクを解除するマスク解除手段133とを備えた構成である
ことを特徴とする警報情報収集装置。
【0103】
(付記8) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
ポーリング制御手段110は、
全ての監視項目について、現用系であるか予備系であるかを示す情報を保持する現用情報保持手段134と、
現用情報保持手段134に保持された情報に基づいて、予備系に属する監視項目に対してスケジュールに設定された監視タイミングを所定の割合でスキップするスキップ制御手段135とを備えた構成である
ことを特徴とする警報情報収集装置。
【0104】
【発明の効果】
以上に説明したように、本発明にかかわる第1の警報情報収集装置によれば、警報情報によって障害が発生したことが示された監視項目について、連続的にポーリングを実行することができるので、監視項目における障害の解消に伴って、その旨を示す警報情報を迅速に収集することができる。これにより、特に、継続時間の短い障害が発生する可能性が高い監視項目を含むシステムにおいて、障害が解消されたタイミングとこれに関する警報情報を収集したタイミングとのずれを縮小することができる。
【0105】
また、本発明にかかわる第2の警報情報収集装置によれば、警報情報によって障害が発生したことが示された監視項目について、1監視周期内で均等に複数回のポーリングを実行することができるので、比較的に継続時間の長い障害が発生する可能性が高い監視項目を含むシステムにおいて、監視項目における障害の解消を示す警報情報を効率よく収集して、障害が解消されたタイミングとこれに関する警報情報を収集したタイミングとのずれを縮小することができる。
【0106】
また、上述した第1および第2の警報情報収集装置において、追加的に実行するポーリングの回数を制限する手段を設けることにより、障害が発生したことが示された監視項目に対する追加ポーリングによって、他の監視項目に対するポーリングを実行する間隔が延長してしまうことを制限することができる。
【0107】
一方、本発明にかかわる第3の警報情報収集装置は、主要な監視項目における障害の発生に伴って、この監視項目の状態に従属して状態が変化する監視項目に関するポーリングをマスクし、必要最小限の監視項目に限定してポーリングを実行することができる。これにより、障害が発生している上位の監視項目に関する警報情報を収集する頻度を一時的に増大させて、障害が解消されたタイミングとこれに関する警報情報を収集したタイミングとのずれを縮小することができる。
【0108】
また、本発明にかかわる第4の警報情報収集装置は、現用系に属する監視項目と予備系に属する監視項目とに対して、それぞれ異なる頻度でポーリングを行うことができる。これにより、障害が発生する可能性の高い現用系の監視項目に関する警報情報を高い頻度で収集することができるので、障害の発生あるいは解消に伴って警報情報が変化するタイミングとこれに関する警報情報を収集するタイミングとのずれを縮小することができる。
【0109】
上述した第1から第4の警報情報収集装置によって、障害の発生あるいは解消に伴って警報情報が変化するタイミングとこれに関する警報情報を収集するタイミングとのずれを縮小することにより、多数の監視項目における障害の発生状況を正確に把握することができる。
【図面の簡単な説明】
【図1】本発明にかかわる第1の警報情報収集装置の原理ブロック図である。
【図2】本発明にかかわる第2の警報情報収集装置の原理ブロック図である。
【図3】本発明にかかわる第3の警報情報収集装置の原理ブロック図である。
【図4】本発明にかかわる第4の警報情報収集装置の原理ブロック図である。
【図5】本発明にかかわる警報情報収集装置の第1の実施形態を示す図である。
【図6】第1の警報情報収集装置の動作を表す流れ図である。
【図7】第1の警報情報収集装置の動作を説明するタイミング図である。
【図8】第1の警報情報収集装置にかかわる別実施形態を示す図である。
【図9】第1の警報情報収集装置にかかわる別実施形態の動作を表す流れ図である。
【図10】本発明にかかわる第2の警報情報収集装置の実施形態を示す図である。
【図11】第2の警報情報収集装置の動作を表す流れ図である。
【図12】第2の警報情報収集装置の動作を説明するタイミング図である。
【図13】追加ポーリングを挿入する動作を説明する図である。
【図14】第2の警報収集装置の別実施形態を示す図である。
【図15】第2の警報情報収集装置の別実施形態の動作を表す流れ図である。
【図16】本発明にかかわる第3の警報情報収集装置の実施形態を示す図である。
【図17】第3の警報情報収集装置の動作を表す流れ図である。
【図18】本発明にかかわる第4の警報情報収集装置の実施形態を示す図である。
【図19】第4の警報情報収集装置の動作を表す流れ図である。
【図20】従来の一般的な警報情報収集装置の構成を示す図である。
【図21】従来の警報情報収集動作を説明するタイミング図である。
【符号の説明】
110 ポーリング制御手段
111 ポーリング実行手段
112 障害検出手段
113 連続挿入手段
121 追加手段
122 追加停止手段
123 割り当て手段
115 項目検出手段
116 タイミング算出手段
117 スケジュール調整手段
124 追加制限手段
125 振替設定手段
118 イベント検出手段
131 従属情報保持手段
132 マスク設定手段
133 マスク解除手段
134 現用情報保持手段
135 スキップ制御手段
210、220、230、240、411 監視制御部
211 警報情報保持部
212 アラーム検出部
214、217 順次制御部
215 挿入制御部
216 カウンタ
222 参照番号算出部
223 アラーム判定部
224 追加指示部
225 カウンタ
231 従属情報保持部
232 マスク制御部
233 解消検出部
234 マスク保持部
235 ポーリング制御部
241 現用情報保持部
242 スキップカウンタ
243 ポーリング制御部
410 警報情報収集装置
412、422 インタフェース制御部(I/F)
420 ユニット
421 ユニット制御部
423 I/Oレジスタ[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an alarm information collection device that collects information on a plurality of units constituting an apparatus by polling.
[0002]
[Prior art]
FIG. 20 shows a configuration of a conventional general alarm information collecting device.
The alarm information collection device 410 and the plurality of
[0003]
In each
[0004]
Further, every time the alarm information is collected in this manner, the
[0005]
As described above, when collecting device information by using sequential polling, a technique of changing the polling frequency of a device for which a failure has been reported has been proposed (for example, see Patent Document 1).
[Patent Document 1]
JP-A-1-151847
[0006]
[Problems to be solved by the invention]
By the way, in the general sequential polling as described above, it takes a considerable amount of time to collect device information on each device, so when collecting a large number of device information constituting the system, Inevitably, the polling interval from the time when the device information of a certain unit in the system is collected to the time when the device information is collected next becomes long.
For this reason, the device information collected and held by the alarm information collecting device from each unit may not always match the state of each unit constituting each unit at that time, and moreover, this mismatch may be long. Continues for hours.
[0007]
Hereinafter, the cause of the occurrence of such inconsistency will be described with reference to a timing chart illustrating a conventional alarm information collecting operation shown in FIG.
FIG. 1 )-(A N ) Shows the
[0008]
For example, in the system shown in FIG. 20, as shown in FIG. 1 Immediately after polling at the monitoring timing for this
[0009]
The difference between the timing of detecting and canceling the alarm information in each unit and the timing of reporting these phenomena to the alarm information collecting device is, of course, proportional to the number of units to be monitored by the alarm information collecting device. Tend to increase. For example, in an alarm information collection device provided in a transmission device of a communication system, a configuration in which dozens of units are collectively monitored is generally used. Therefore, the above-described polling interval may be extended to several hundred ms. is there.
[0010]
On the other hand, a transient failure having a very short duration compared to the polling interval described above, such as a temporary failure of a line connected to the transmission device, is not limited to the transmission device, and is not limited to the transmission device, but in various systems. This is a relatively frequent disorder. Since the magnitude of the difference between the recovery timing of such a transient failure and the timing at which recovery has been reported is a factor that hinders accurate understanding of the occurrence of such a failure, there are various factors. This is an important issue in normal operation of a simple system.
[0011]
The present invention provides an alarm capable of reducing a difference between a timing of generating and canceling alarm information on each monitoring item and a timing of collecting reports on these phenomena when sequentially collecting alarm information on a large number of monitoring items by polling. It is an object to provide an information collecting device.
[0012]
[Means for Solving the Problems]
FIG. 1 shows a principle block diagram of a first alarm information collecting device according to the present invention. The invention of
[0013]
According to the first aspect of the present invention, each time the failure detecting unit 112 detects that a failure has occurred in a certain monitoring item, the continuous insertion unit 113 provided in the
[0014]
Therefore, in the first alarm information collection device configured as described above, when a failure related to an arbitrary monitoring item is detected, additional polling can be continuously performed on the monitoring item. For example, it is possible to quickly collect alarm information indicating that a transient failure has been resolved, and report it to a higher-level device.
[0015]
Further, the continuous insertion unit 113 illustrated in FIG. 1 includes an
[0016]
In the first alarm information collecting apparatus provided with such a continuous insertion unit 113, the additional polling unit continuously inserts an arbitrary monitoring item into the schedule by controlling the operation of the
[0017]
On the other hand, in the first alarm information collecting apparatus shown in FIG. 1, the schedule provided in the polling control means 110 is composed of a fixed monitoring timing previously allocated to each monitoring item and an additional allocation to an arbitrary monitoring item. It is formed from a predetermined number of spare timings that are possible and are waiting time when they are not assigned to the monitoring item, and the continuous insertion unit 113 sets a schedule every time the failure detection unit 112 detects the occurrence of the failure. May be assigned as the monitoring timing corresponding to the additional polling for the corresponding monitoring item.
[0018]
In the alarm information collecting device having such a configuration, each time the failure detection unit 112 detects the occurrence of a failure, the allocating
[0019]
FIG. 2 shows a principle block diagram of a second alarm information collecting apparatus according to the present invention. The invention according to
[0020]
According to the second aspect of the present invention, the item detecting means 115 detects all of the monitoring items which are determined to have failed according to the alarm information collected so far, and determines the timing of performing additional polling for these monitoring items. It is calculated by the timing calculation means 116. The timing calculating means 116 calculates the additional polling timing for each monitoring item in which a failure has been detected so as to be even in the polling cycle for each monitoring item. By inserting the additional polling into the schedule, a plurality of pollings can be executed at substantially equal intervals for the monitored item in one polling cycle.
[0021]
Further, the schedule adjusting means 117 shown in FIG. 2 is provided with an additional limiting
In the alarm information collecting apparatus including the schedule adjusting unit 117 configured as described above, the number of additional polling inserted into the schedule due to the detection of a failure can be limited to a predetermined number. This makes it possible to set a limit on the total number of polling times including additional polling when, for example, a large number of monitoring items have been detected as failures. Unlimited extension of the time required can be prevented. Therefore, regardless of the number of monitoring items in which a failure has been detected, it is possible to collect alarm information at an appropriate frequency for all monitoring items.
[0022]
Further, in the alarm information collecting device shown in FIG. 2, the schedule provided in the polling control means 110 can be fixedly assigned to each monitoring item in advance, and can be additionally assigned to any monitoring item. And a predetermined number of backup timings that become a waiting time when not assigned to a monitoring item, and the schedule adjusting means 117 deletes the backup timing included in the schedule and replaces the corresponding monitoring item with the corresponding monitoring item instead. The transfer setting means 125 may be configured to transfer and set the additional polling to the timing calculated by the timing calculation means 116.
[0023]
In the alarm information collecting apparatus provided with such a
[0024]
FIG. 3 shows a principle block diagram of a third alarm information collecting apparatus according to the present invention. According to the third aspect of the present invention, there is provided an alarm information having a configuration in which the polling control means controls an operation of collecting alarm information by polling of each monitoring item by the polling executing means based on a schedule relating to monitoring timing of a plurality of monitoring items. The collection device includes an
[0025]
According to the third aspect of the present invention, when the occurrence of a failure is detected for a certain monitoring item by the event detecting means 118, the mask setting means 132 provided in the polling control means 110 transmits the information stored in the dependent information storing means 131. , The monitoring timing set in the schedule for the monitoring item positioned below this monitoring item is masked. Thereafter, when the
[0026]
FIG. 4 shows a principle block diagram of a fourth alarm information collecting device according to the present invention. The invention of
[0027]
According to the fourth aspect of the present invention, the monitoring timing set in the schedule corresponding to the monitoring item indicated as the standby system in the active
[0028]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 5 shows a first embodiment of the alarm information collecting device according to the present invention.
In addition, among the components shown in FIG. 5, those equivalent to the respective units shown in FIG. 20 are denoted by the same reference numerals as those shown in FIG. 20, and description thereof will be omitted.
[0029]
In the alarm information collecting device illustrated in FIG. 5, the monitoring control unit 210 collects alarm information from the plurality of
In the monitoring control unit 210, the alarm information collected from the unit via the
[0030]
In the monitoring control unit 210 shown in FIG. 5, the
[0031]
Here, the correspondence between each unit shown in FIG. 5 and each unit shown in FIG. 1 will be described.
When the
[0032]
Next, the operation of the first alarm information collecting device shown in FIG. 5 will be described.
FIG. 6 is a flowchart showing the operation of the first alarm information collecting device. FIG. 7 is a timing chart illustrating the operation of the first alarm information collection device.
[0033]
At the beginning of each monitoring cycle, the
[0034]
If the alarm information collected in
[0035]
As described above, in the state where the failure is not detected by the
[0036]
When the monitoring operation for all the units has completed one cycle in this way, the affirmative determination in
By the way, for example, the
[0037]
In this case, an affirmative determination is made in
[0038]
As shown in FIG. 1 If the trouble that has occurred in is already resolved at the stage when it is detected by the alarm detection unit 212 (see FIGS. 7C and 7D), as described above, this
[0039]
As described above, when the alarm information obtained by the additional polling indicates that the fault has been recovered (the affirmative determination in
[0040]
On the other hand, in the case of a negative determination in
[0041]
In the first alarm information collecting device shown in FIG. 5, as described above, when the occurrence of a failure in a unit is detected at the monitoring timing corresponding to the unit, the unit is continuously connected to the unit. Perform additional polling. Therefore, it is possible to quickly collect alarm information indicating that a fault that has occurred in any unit has been resolved, and to reduce the difference between the timing at which the alarm information for each unit changes and the timing at which reports on these phenomena are collected. it can. As a result, it is possible to reduce the difference between the failure occurrence status of each unit and the failure occurrence status indicated by the alarm information collected by the alarm information collection device.
[0042]
For example, an alarm indicating a temporary failure such as a temporary disconnection of a line shortens a period in which the alarm is held in the alarm
[0043]
Also, as shown in
Of course, it is also possible to adopt a configuration in which the
[0044]
Next, a method for maintaining a constant monitoring cycle regardless of insertion of additional polling will be described.
FIG. 8 shows another embodiment related to the first alarm information collecting device.
In addition, in each unit illustrated in FIG. 8, the same components as those illustrated in FIG. 5 are denoted by the same reference numerals, and description thereof is omitted.
[0045]
In the alarm information collection device shown in FIG. 8, the
In this case, the
[0046]
FIG. 9 is a flowchart showing an operation of another embodiment related to the first alarm information collecting device.
Note that among the steps shown in FIG. 9, those equivalent to the steps shown in FIG. 6 are denoted by the same reference numerals, and description thereof will be omitted.
In the flowchart shown in FIG. 9, in response to an affirmative determination in
[0047]
In step 312, the
Therefore, when no fault is detected for any unit, the time corresponding to the upper limit M of the number of insertions becomes the waiting time for the polling operation sequentially. On the other hand, when the additional polling is inserted by the
[0048]
In this way, by executing additional polling within the waiting time range set in advance in the schedule, the alarm information indicating that the fault that has occurred in any unit has been eliminated can be quickly performed while maintaining the monitoring cycle constant. And the timing at which the alarm information about each unit changes and the timing at which reports on these phenomena are collected can be reduced.
[0049]
Next, a method of equally inserting additional polling within a polling cycle for a monitoring item indicating that a failure has occurred will be described.
FIG. 10 shows an embodiment of a second alarm information collecting device according to the present invention.
Note that among the components illustrated in FIG. 10, components equivalent to the respective portions illustrated in FIG. 5 are denoted by the reference numerals illustrated in FIG. 5, and description thereof will be omitted.
[0050]
In the monitoring control unit 220 provided in the alarm information collection device shown in FIG. 10, the
[0051]
j = mod (N, i + (mx) N / m) (1)
Further, the
[0052]
Here, the correspondence between each unit shown in FIG. 10 and each unit shown in FIG. 2 will be described.
When the
[0053]
Hereinafter, the operation of the second alarm information collection device shown in FIG. 10 will be described.
FIG. 11 is a flowchart showing the operation of the second alarm information collecting device. FIG. 12 is a timing chart illustrating the operation of the second alarm information collection device.
[0054]
When the collection of the alarm information is started, the
In
[0055]
Next, the reference
[0056]
For example, assuming that the number of divisions m = 2 and the total number of units N = 10, as shown in FIG. 7 At the time of polling for, in
[0057]
Therefore, in this case, the
[0058]
As described above, when the
[0059]
In this way, as shown in FIG. 12, the
[0060]
Here, FIG. 1 )-(A 10 ),
[0061]
After inserting the additional polling as described above, the
[0062]
On the other hand, in the case of an affirmative determination in
[0063]
In the example shown in FIG. 12, additional polling inserted as described above causes 2 Are already cleared, the monitoring number is incremented with the restart of the sequential polling operation by the
[0064]
In this way, the reference number with the phase shifted is calculated by the reference
[0065]
FIG. 13 shows an example in which, when the number of divisions m = 3 and the total number of units N = 10, additional polling is inserted for the units indicated by the
[0066]
As described above, in the second alarm information collection device shown in FIG. 10, even when monitoring a group of units in which a failure having a relatively long duration is likely to occur, a failure that has occurred in any unit is not affected. Alarm information indicating that the alarm has been resolved can be quickly collected, and the difference between the timing at which the alarm information of each unit changes and the timing at which reports on these phenomena are collected can be reduced. As a result, it is possible to reduce the difference between the failure occurrence status of each unit and the failure occurrence status indicated by the alarm information collected by the alarm information collection device.
[0067]
Further, the number of additional polls inserted during one cycle of the monitoring number can be limited.
FIG. 14 shows another embodiment of the second alarm information collecting device according to the present invention.
Note that among the components shown in FIG. 14, the same components as those shown in FIG. 10 are denoted by the same reference numerals as those in FIG. 10, and description thereof will be omitted.
[0068]
The monitoring control unit 220 illustrated in FIG. 14 includes a counter 225 in addition to the components illustrated in FIG. The counter 225 counts the number of times the
[0069]
In this manner, the reference
FIG. 15 is a flowchart showing the operation of another embodiment of the second alarm information collecting device shown in FIG.
[0070]
In
On the other hand, before calculating the reference number, the reference
[0071]
As described above, in another embodiment of the second alarm information collection device shown in FIG. 14, the reference
[0072]
Further, it is also possible to perform processing corresponding to step 311 shown in FIG. 9 in response to an affirmative determination in
Next, a description will be given of a method of shortening the monitoring interval for the main alarm information by utilizing the mutual dependency of the alarm information.
[0073]
FIG. 16 shows an embodiment of a third alarm information collecting device according to the present invention.
Note that among the components shown in FIG. 16, those equivalent to the respective units shown in FIG. 20 or FIG. 5 are denoted by the reference numerals shown in FIG. 20 or FIG. 5, and description thereof will be omitted.
[0074]
In the monitoring control unit 230 illustrated in FIG. 16, the dependent
[0075]
Here, the correspondence between each unit shown in FIG. 16 and each unit shown in FIG. 3 will be described.
When the
[0076]
Next, the operation of the third alarm information collecting device shown in FIG. 16 will be described.
FIG. 17 is a flowchart showing the operation of the third alarm information collecting device.
The
[0077]
In the case of a negative determination in
[0078]
As described above, the
[0079]
The alarm information collected in
At this time, when the occurrence of a failure is detected by the alarm detection unit 212 (the affirmative determination in step 344), the
[0080]
In this way, a value indicating that each alarm information is masked is set in the mask flag provided in the
[0081]
On the other hand, when the alarm information collected in
[0082]
In this way, when the elimination of the corresponding fault is indicated by the main alarm information, the masking of the alarm information dependent on the alarm information can be released, and the alarm information can be returned to the monitoring target. .
On the other hand, after completion of the mask setting process (
[0083]
The feature of the third alarm information collecting device shown in FIG. 16 is that the monitoring target is narrowed down when a fault occurs. This feature is particularly important depending on some main alarm information. This is effective when the large number of subordinate alarm information changes according to the change of the main alarm information described above. In the case where the alarm information has a hierarchical structure as described above, when a failure corresponding to the main alarm information occurs, the lower-level alarm information also indicates the occurrence of the failure. By removing the subordinate alarm information from the monitoring target, it is considered that the substantial amount of the collected information does not change.
[0084]
Next, a description will be given of an alarm information collection device that is effective in a duplex system.
FIG. 18 shows an embodiment of a fourth alarm information collecting device according to the present invention.
Note that among the constituent elements shown in FIG. 18, the same components as those shown in FIG. 5 or FIG. 20 are denoted by the same reference numerals shown in FIG. 5 or FIG. 20, and the description thereof is omitted.
[0085]
The alarm information collecting device shown in FIG. In the monitoring control unit 240, the active information holding unit 241 receives information indicating whether each
[0086]
Here, the correspondence relationship between each unit shown in FIG. 18 and each unit shown in FIG. 4 will be described.
When the
[0087]
Next, the operation of the alarm information collecting device shown in FIG. 18 will be described.
FIG. 19 is a flowchart showing the operation of the fourth alarm information collecting device.
Prior to starting the alarm information collecting operation shown in FIG. 19, the
[0088]
When starting each monitoring cycle, the
[0089]
In
For example, the
[0090]
If the monitoring number i after the increment is less than the total number n of units, the
On the other hand, based on the information held in the active information holding unit 241 corresponding to the monitoring number i, the corresponding
[0091]
[0092]
On the other hand,
[0093]
After the end of the processing of
In the above example, if the upper limit value of the number of skips is d = 3, the polling of the
[0094]
As described above, according to the fourth alarm information collecting apparatus, the alarm information on the
Here, in the duplicated system, the probability of a change in the alarm information regarding the
[0095]
Further, for the standby system, the collection of alarm information can be completely skipped. In this case, in the case of a negative determination in
With respect to the above description, the following items are further disclosed.
[0096]
(Supplementary Note 1) In an alarm information collecting apparatus configured to control an operation in which a
Failure detection means 112 for detecting the occurrence of a failure based on alarm information obtained by polling each monitoring item;
Each time the failure detection unit 112 detects the occurrence of a failure, the
An alarm information collecting device, characterized in that:
[0097]
(Supplementary Note 2) In the alarm information collection device described in
The continuous insertion means 113
An adding
When the number of additional polls added by the adding
An alarm information collecting device, characterized in that:
[0098]
(Supplementary Note 3) In the alarm information collection device described in
The schedule provided in the polling control means 110 has a fixed monitoring timing assigned in advance to each monitoring item, and a waiting time when it is not assigned to any monitoring item that can be additionally assigned to any monitoring item. Formed from a predetermined number of preliminary timings,
Each time the failure detecting unit 112 detects the occurrence of a failure, the continuous insertion unit 113 assigns the spare timing included in the schedule as the monitoring timing corresponding to the additional polling for the corresponding monitoring item. It is a configuration with
An alarm information collecting device, characterized in that:
[0099]
(Supplementary Note 4) An alarm information collecting apparatus configured to control an operation in which a
Item detection means 115 for detecting a monitoring item in which a failure has occurred based on alarm information obtained by polling for each monitoring item;
A timing calculating means for calculating a position obtained by equally dividing a polling cycle based on the monitoring timing assigned to the monitoring item for each monitoring item detected by the item detecting means as an additional polling timing; Prepare,
The
An alarm information collecting device, characterized in that:
[0100]
(Supplementary Note 5) In the alarm information collection device described in
The schedule adjusting unit 117 is configured to include an additional limiting
An alarm information collecting device, characterized in that:
[0101]
(Supplementary Note 6) In the alarm information collection device described in
The schedule provided in the polling control means 110 has a fixed monitoring timing assigned in advance to each monitoring item, and a waiting time when it is not assigned to any monitoring item that can be additionally assigned to any monitoring item. Formed from a predetermined number of preliminary timings,
The schedule adjusting unit 117 includes a
An alarm information collecting device, characterized in that:
[0102]
(Supplementary Note 7) In an alarm information collecting apparatus configured to control an operation in which a
An
Polling control means 110
For each of the monitoring items, each time the occurrence of a failure in any one of the monitoring items is detected by the
With respect to the monitoring item whose failure has been resolved by the event detecting means 118, the monitoring information is set to the monitoring timing included in the schedule corresponding to the monitoring item determined to be dependent on the detected monitoring item with reference to the dependent
An alarm information collecting device, characterized in that:
[0103]
(Supplementary Note 8) In an alarm information collecting apparatus configured to control an operation in which a
Polling control means 110
Working information holding means 134 for holding information indicating whether the system is a working system or a standby system for all monitoring items;
A
An alarm information collecting device, characterized in that:
[0104]
【The invention's effect】
As described above, according to the first alarm information collection device according to the present invention, it is possible to continuously execute polling for a monitoring item indicating that a failure has occurred by alarm information. With the elimination of the failure in the monitoring item, it is possible to quickly collect alarm information indicating that. Thereby, especially in a system including a monitoring item in which a failure having a short duration is highly likely to occur, it is possible to reduce the difference between the timing at which the failure is resolved and the timing at which alarm information is collected.
[0105]
Further, according to the second alarm information collection device according to the present invention, it is possible to execute a plurality of polling evenly within one monitoring period for a monitoring item indicated by the alarm information that a failure has occurred. Therefore, in a system including a monitoring item in which a failure having a relatively long duration is highly likely to occur, alarm information indicating the elimination of the failure in the monitoring item is efficiently collected, and the timing at which the failure is resolved and the timing related to the It is possible to reduce the deviation from the timing at which the alarm information is collected.
[0106]
Further, in the first and second alarm information collecting devices described above, by providing means for limiting the number of times of additional polling to be executed, additional polling for a monitoring item indicating that a failure has occurred can be performed by other means. It is possible to limit an increase in the interval at which the polling of the monitoring item is executed.
[0107]
On the other hand, the third alarm information collecting apparatus according to the present invention masks polling for a monitoring item whose status changes according to the status of the monitoring item when a failure occurs in the main monitoring item, and Polling can be executed only for a limited number of monitoring items. As a result, the frequency of collecting the alarm information on the upper monitoring item in which the fault has occurred is temporarily increased, and the difference between the timing when the fault is eliminated and the timing when the alarm information on the fault is collected is reduced. Can be.
[0108]
Further, the fourth alarm information collecting apparatus according to the present invention can perform polling at different frequencies for monitoring items belonging to the active system and monitoring items belonging to the standby system. As a result, it is possible to frequently collect the alarm information on the monitoring items of the active system in which a failure is highly likely to occur. It is possible to reduce the deviation from the timing of collection.
[0109]
The first to fourth alarm information collecting devices described above reduce the difference between the timing at which the alarm information changes due to the occurrence or elimination of the fault and the timing at which the alarm information is collected, thereby increasing the number of monitoring items. It is possible to accurately grasp the state of occurrence of a failure in the system.
[Brief description of the drawings]
FIG. 1 is a principle block diagram of a first alarm information collection device according to the present invention.
FIG. 2 is a principle block diagram of a second alarm information collection device according to the present invention.
FIG. 3 is a principle block diagram of a third alarm information collection device according to the present invention.
FIG. 4 is a principle block diagram of a fourth alarm information collecting device according to the present invention.
FIG. 5 is a diagram showing a first embodiment of an alarm information collection device according to the present invention.
FIG. 6 is a flowchart showing the operation of the first alarm information collecting device.
FIG. 7 is a timing chart for explaining the operation of the first alarm information collecting device.
FIG. 8 is a diagram showing another embodiment related to the first alarm information collecting device.
FIG. 9 is a flowchart illustrating an operation of another embodiment related to the first alarm information collection device.
FIG. 10 is a diagram showing an embodiment of a second alarm information collecting device according to the present invention.
FIG. 11 is a flowchart showing the operation of the second alarm information collecting device.
FIG. 12 is a timing chart for explaining the operation of the second alarm information collecting device.
FIG. 13 is a diagram illustrating an operation of inserting additional polling.
FIG. 14 is a diagram showing another embodiment of the second alarm collection device.
FIG. 15 is a flowchart showing an operation of another embodiment of the second alarm information collecting device.
FIG. 16 is a diagram showing an embodiment of a third alarm information collecting device according to the present invention.
FIG. 17 is a flowchart showing the operation of the third alarm information collecting device.
FIG. 18 is a diagram showing an embodiment of a fourth alarm information collecting device according to the present invention.
FIG. 19 is a flowchart showing the operation of the fourth alarm information collecting device.
FIG. 20 is a diagram showing a configuration of a conventional general alarm information collecting device.
FIG. 21 is a timing chart for explaining a conventional alarm information collecting operation.
[Explanation of symbols]
110 Polling control means
111 Polling execution means
112 Failure detection means
113 Continuous insertion means
121 additional means
122 Additional stopping means
123 Assigning means
115 item detection means
116 Timing Calculation Means
117 Schedule adjustment means
124 Additional restriction means
125 Transfer setting means
118 event detection means
131 Dependent information holding means
132 Mask setting means
133 Mask release means
134 Active information holding means
135 skip control means
210, 220, 230, 240, 411 monitoring control unit
211 Alarm information storage
212 Alarm detector
214, 217 sequential control unit
215 Insertion control unit
216 counter
222 Reference number calculation unit
223 Alarm judgment unit
224 additional instruction section
225 counter
231 Dependent information holding unit
232 Mask control unit
233 Resolution detection unit
234 Mask holder
235 Polling control unit
241 Active information holding unit
242 skip counter
243 Polling control unit
410 Alarm information collection device
412, 422 Interface control unit (I / F)
420 units
421 Unit control unit
423 I / O register
Claims (4)
各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段と、
前記ポーリング制御手段は、前記障害検出手段によって障害の発生が検出されるごとに、前記障害が検出された監視項目についての前記追加ポーリングに対応する監視タイミングを前記障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整を前記スケジュールに対して行う連続挿入手段を備えた構成である
ことを特徴とする警報情報収集装置。An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
Failure detection means for detecting the occurrence of a failure based on alarm information obtained by polling each monitoring item;
The polling control unit assigns a monitoring timing corresponding to the additional polling for the monitoring item in which the failure is detected to the monitoring item in which the failure is detected, each time the occurrence of the failure is detected by the failure detecting unit. An alarm information collecting apparatus, comprising: a continuous insertion unit that adjusts the schedule so as to continuously insert the monitoring timing into the schedule.
各監視項目に対するポーリングで得られた警報情報に基づいて、障害が発生している監視項目を検出する項目検出手段と、
前記項目検出手段によって検出された各監視項目について、その監視項目に割り当てられた監視タイミングを基点とするポーリング周期を整数等分した位置を、追加ポーリングを行うタイミングとして算出するタイミング算出手段とを備え、
前記ポーリング制御手段は、前記タイミング算出手段によって算出されたタイミングに、前記追加ポーリングを前記スケジュールに挿入するスケジュール調整手段を備えた構成である
ことを特徴とする警報情報収集装置。An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
Item detection means for detecting a monitoring item having a failure based on alarm information obtained by polling each monitoring item;
Timing monitoring means for calculating, for each monitoring item detected by the item detecting means, a position obtained by equally dividing a polling cycle based on the monitoring timing assigned to the monitoring item as an additional polling timing; ,
The alarm information collecting apparatus, wherein the polling control means includes a schedule adjusting means for inserting the additional polling into the schedule at the timing calculated by the timing calculating means.
各監視項目に対するポーリングで得られた警報情報に基づいて、障害の発生および障害の解消を含む動作状態の変化を検出するイベント検出手段を備え、
前記ポーリング制御手段は、
全ての監視項目について、相互の従属関係を示す従属情報保持手段と、
前記イベント検出手段によっていずれかの監視項目に障害の発生が検出されるごとに、前記従属情報保持手段を参照し、前記障害が検出された監視項目に従属するとされた監視項目に対応して前記スケジュールに設定された監視タイミングを選択的にマスクするマスク設定手段と、
前記イベント検出手段によって障害の解消が検出された監視項目について、前記従属情報保持手段を参照し、前記検出された監視項目に従属するとされた監視項目に対応して前記スケジュールに含まれる監視タイミングに設定されたマスクを解除するマスク解除手段とを備えた構成である
ことを特徴とする警報情報収集装置。An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
Based on the alarm information obtained by polling each monitoring item, an event detection unit that detects a change in an operation state including occurrence of a failure and elimination of the failure,
The polling control means,
Dependency information holding means indicating a mutual dependency relationship for all monitoring items,
Each time the occurrence of a failure in any of the monitoring items is detected by the event detecting unit, the dependent information holding unit is referenced, and Mask setting means for selectively masking the monitoring timing set in the schedule,
For the monitoring item for which the resolution of the failure has been detected by the event detecting means, refer to the dependent information holding means, and set the monitoring timing included in the schedule in accordance with the monitoring item determined to be dependent on the detected monitoring item. An alarm information collecting apparatus, comprising: a mask release unit for releasing a set mask.
前記ポーリング制御手段は、
全ての監視項目について、現用系であるか予備系であるかを示す情報を保持する現用情報保持手段と、
前記現用情報保持手段に保持された情報に基づいて、予備系に属する監視項目に対して前記スケジュールに設定された監視タイミングを所定の割合でスキップするスキップ制御手段とを備えた構成である
ことを特徴とする警報情報収集装置。An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
The polling control means,
Working information holding means for holding information indicating whether the system is a working system or a standby system for all monitoring items;
A skip control unit that skips a monitoring timing set in the schedule at a predetermined rate for a monitoring item belonging to a standby system based on information held in the working information holding unit. Characteristic alarm information collecting device.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003011458A JP2004227084A (en) | 2003-01-20 | 2003-01-20 | Alarm information collection device |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003011458A JP2004227084A (en) | 2003-01-20 | 2003-01-20 | Alarm information collection device |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004227084A true JP2004227084A (en) | 2004-08-12 |
Family
ID=32900359
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003011458A Withdrawn JP2004227084A (en) | 2003-01-20 | 2003-01-20 | Alarm information collection device |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004227084A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008518291A (en) * | 2004-10-25 | 2008-05-29 | アルカテル−ルーセント | Method for accounting a user accessing a prepaid service via an access control unit |
JP2013187816A (en) * | 2012-03-09 | 2013-09-19 | Fujitsu Telecom Networks Ltd | Monitoring and control system, monitoring and control apparatus, and polling control method |
JP2018093347A (en) * | 2016-12-01 | 2018-06-14 | キヤノン株式会社 | Information processing apparatus, information processing method, and program |
-
2003
- 2003-01-20 JP JP2003011458A patent/JP2004227084A/en not_active Withdrawn
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008518291A (en) * | 2004-10-25 | 2008-05-29 | アルカテル−ルーセント | Method for accounting a user accessing a prepaid service via an access control unit |
JP2013187816A (en) * | 2012-03-09 | 2013-09-19 | Fujitsu Telecom Networks Ltd | Monitoring and control system, monitoring and control apparatus, and polling control method |
JP2018093347A (en) * | 2016-12-01 | 2018-06-14 | キヤノン株式会社 | Information processing apparatus, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109445927B (en) | Task management method and device for storage cluster | |
CN108710544B (en) | Process monitoring method of database system and rail transit comprehensive monitoring system | |
EP2685380A1 (en) | Operations management unit, operations management method, and program | |
US9191296B2 (en) | Network event management | |
US7281238B2 (en) | Method and program for monitoring execution state of program | |
JP5387779B2 (en) | Operation management apparatus, operation management method, and program | |
CN106161090A (en) | The monitoring method of a kind of subregion group system and device | |
CN110190991A (en) | A Fault Tolerance Method for Distributed Stream Processing System in Multiple Application Scenarios | |
CN115543740A (en) | Method, system, equipment and storage medium for monitoring abnormal operation of service | |
US8719626B2 (en) | Proactively removing channel paths in error from a variable scope of I/O devices | |
JP2004227084A (en) | Alarm information collection device | |
CN113268395B (en) | Service data processing method, processing device and terminal | |
US20240037014A1 (en) | Prediction of an anomaly of a resource for programming a checkpoint | |
CN117785526A (en) | Abnormality detection method, device and equipment for time protection and storage medium | |
JP4464655B2 (en) | Computer monitoring apparatus and message processing method related to monitored computer | |
CN107995014B (en) | Method and device for discovering function topology based on alarm information | |
CN108228328B (en) | Stream task implementation method and device and electronic equipment | |
JPH04239242A (en) | Fault detection method | |
JP5586322B2 (en) | Plant monitoring system and plant monitoring method | |
CN113381902A (en) | Method, apparatus and computer storage medium for detecting cross-regional network link | |
JP2005018152A (en) | Control/monitoring system | |
CN114897503B (en) | Business processing method, device, equipment and storage medium | |
CN118277031A (en) | Data processing method, container cluster, electronic equipment and storage medium | |
JP3294108B2 (en) | Power restoration processing method and device | |
CN119201924A (en) | A cluster performance statistical data processing method, device and medium |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20060404 |