[go: up one dir, main page]

JP2004227084A - Alarm information collection device - Google Patents

Alarm information collection device Download PDF

Info

Publication number
JP2004227084A
JP2004227084A JP2003011458A JP2003011458A JP2004227084A JP 2004227084 A JP2004227084 A JP 2004227084A JP 2003011458 A JP2003011458 A JP 2003011458A JP 2003011458 A JP2003011458 A JP 2003011458A JP 2004227084 A JP2004227084 A JP 2004227084A
Authority
JP
Japan
Prior art keywords
monitoring
polling
alarm information
unit
failure
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003011458A
Other languages
Japanese (ja)
Inventor
Yoshihiro Nishioka
祥寛 西岡
Yuji Mori
裕治 森
Yuji Takenaka
裕二 竹中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2003011458A priority Critical patent/JP2004227084A/en
Publication of JP2004227084A publication Critical patent/JP2004227084A/en
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Alarm Systems (AREA)
  • Selective Calling Equipment (AREA)

Abstract

【課題】各監視項目に関する警報情報の発生および解消のタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小する。
【解決手段】複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段112と、ポーリング制御手段110は、障害検出手段112によって障害の発生が検出されるごとに、障害が検出された監視項目についての追加ポーリングに対応する監視タイミングを障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整をスケジュールに対して行う連続挿入手段113を備える。
【選択図】 図1
An object of the present invention is to reduce the difference between the timing of generation and cancellation of alarm information on each monitoring item and the timing of collecting reports on these phenomena.
An alarm information collecting apparatus having a configuration in which a polling control unit controls an operation of collecting alarm information by polling of each monitoring item by a polling execution unit based on a schedule regarding monitoring timing of a plurality of monitoring items. The fault detecting means 112 for detecting the occurrence of a fault based on the alarm information obtained by polling each monitoring item, and the polling control means 110 perform a fault detection every time the fault detecting means 112 detects the occurrence of the fault. A continuous insertion unit 113 is provided for adjusting the schedule so as to continuously insert the monitoring timing corresponding to the additional polling of the detected monitoring item into the monitoring timing assigned to the monitoring item in which the failure is detected.
[Selection diagram] Fig. 1

Description

【0001】
【発明の属する技術分野】
本発明は、装置を構成している複数のユニットに関する情報をポーリングによって収集する警報情報収集装置に関する。
【0002】
【従来の技術】
図20に、従来の一般的な警報情報収集装置の構成を示す。
図20に示した警報情報収集装置410と複数のユニット420とは、バスを介して接続されている。警報情報収集装置410において、監視制御部411は、バスに接続された各ユニット420に対して順次にポーリングを行うことにより、各ユニット420の動作状態に関する情報を収集し、必要に応じて、コンピュータなどの上位装置に報告する。このとき、インタフェース制御部(I/F)412は、監視制御部411からの指示に従って、指定されたユニット420に対する要求をバスを介して送信する。一方、各ユニット420のユニット制御部421は、自ユニットに備えられたインタフェース制御部(I/F)422を介して装置情報を要求する旨の要求を受け取ったときに、自ユニットを構成する各部の状態に関する装置情報を収集し、収集した装置情報をI/Oレジスタ423にセットする。その後、ユニット制御部421は、インタフェース制御部422にI/Oレジスタ423に装置情報が格納されたことを通知し、これに応じて、インタフェース制御部422は、I/Oレジスタ423の内容をバスを介して警報情報収集装置410に送信する。
【0003】
図20に示した各ユニット420において、例えば、回線の異常を検出する検出器などの出力は、それぞれ対応するラッチに警報情報として保持され、各ユニット420のユニット制御部421によってこの警報情報が読み取られたときに、クリアされる。このようにラッチに保持しておくことにより、異常が検出されたタイミングや異常が継続した期間の長さにかかわらず、ユニット制御部421により、検出された異常に関する警報情報をもれなく読み取って、I/Oレジスタ423にセットすることができる。各ユニット420にこのような構成が備られているので、一時的な回線の障害のような一過性の障害の発生であっても、障害が発生したという事実は、確実にインタフェース制御部422を介して警報情報収集装置410によって収集されている。
【0004】
また、このようにして警報情報を収集するごとに、警報情報収集装置410に備えられた監視制御部411は、警報情報保持部413の内容を収集した警報情報によって書き換えている。したがって、各監視項目において障害が発生した旨を示す警報情報は、新たに収集された対応する警報情報により、障害状態が解除されたことが示されるまで、警報情報保持部413において保持される。
【0005】
このように、順次ポーリングを用いて装置情報を収集する際に、障害の発生が報告されている装置に関して、ポーリング頻度を変化させる技術も提案されている(例えば、特許文献1参照)。
【特許文献1】
特開平1−151847号公報
【0006】
【発明が解決しようとする課題】
ところで、上述したような一般的な順次ポーリングでは、個々の装置に関する装置情報を収集するために無視できない長さの時間がかかるので、システムを構成している多数の装置情報を収集する場合には、システムの中のあるユニットの装置情報を収集してから次に収集するまでのポーリング間隔が長くなることは避けられない。
このために、警報情報収集装置が各ユニットから収集して保持している装置情報と、各ユニットを構成する各部のその時点における状態とが必ずしも一致しない場合が発生し、しかも、この不一致が長時間継続してしまう。
【0007】
以下、このような不一致が発生する原因を、図21に示した従来の警報情報収集動作を説明するタイミング図に基づいて説明する。
図21(a)〜(a)に、図20に示したユニット420〜420に対応する監視タイミングを示す。これらの監視タイミングは、図20に示した監視制御部411により、図21(b)に示すクロック信号に基づいて生成されている。
【0008】
例えば、図20に示したシステムにおいて、図21(c)に示すように、ユニット420に対する監視タイミングにおけるポーリングの直後にこのユニット420において障害が発生した場合に(図21(c)において符号Aを付した矢印で示す)、障害そのものの継続時間にかかわらず、対応する警報情報はそのユニットに備えられた対応するラッチに保持されたまま次の監視タイミングまで維持される(図21(d)参照)。ここで、上述した障害が継続時間の非常に短い一過性のものであった場合には、図21(a)において符号Bを付した矢印で示す次の監視タイミングにおいてはすでに障害そのものは解消しているにもかかわらず、警報情報収集装置は、このときのポーリングで初めてその障害の発生を示す警報情報を収集し、この段階で初めてそのユニットに障害が発生したことを認識する。そして、警報情報収集装置が、当該ユニットにおける障害が解消したことを認識するのは、更に、次の監視タイミングにおけるポーリングで(図21(a)において符号Cを付した矢印で示す)、新しい警報情報を得てからとなる(図21(e)参照)。
【0009】
このような各ユニットにおける警報情報の検出および解消タイミングと警報情報収集装置へのこれらの現象を報告するタイミングとのずれは、当然ながら、警報情報収集装置が監視対象とするユニットの数に比例して増大する傾向がある。例えば、通信システムの伝送装置に備えられた警報情報収集装置では、数十ものユニットを一括して監視する構成が一般的であるので、上述したポーリング間隔は数百msにまで延びてしまう場合もある。
【0010】
その一方、伝送装置に接続されている回線の一時的な障害のように、上述したポーリング間隔に比べて非常に継続時間の短い一過性の障害は、伝送装置に限らず、様々なシステムにおいて比較的に頻度の高い障害である。このような一過性の障害の回復タイミングと回復したことが報告されるタイミングとのずれの大きさは、このような障害の発生状況を正確に把握することを妨げる要因であることから、様々なシステムを正常に運用する上で重要な問題となっている。
【0011】
本発明は、多数の監視項目に関する警報情報を順次ポーリングによって収集する際に、各監視項目に関する警報情報の発生および解消のタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小可能な警報情報収集装置を提供することを目的とする。
【0012】
【課題を解決するための手段】
図1に、本発明にかかわる第1の警報情報収集装置の原理ブロック図を示す。請求項1の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段112と、ポーリング制御手段110は、障害検出手段112によって障害の発生が検出されるごとに、障害が検出された監視項目についての追加ポーリングに対応する監視タイミングを障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整をスケジュールに対して行う連続挿入手段113を備えた構成であることを特徴とする。
【0013】
請求項1の発明では、障害検出手段112によってある監視項目に障害が発生したことが検出されるごとに、ポーリング制御手段110に備えられた連続挿入手段113により、障害が検出された監視項目に割り当てられている監視タイミングに連続して、その監視項目に対する追加ポーリングがスケジュールに挿入される。このような追加ポーリングの挿入は、追加ポーリングの実行に伴って収集された警報情報によって、該当する監視項目に関する障害が解消したことが示されるまで繰り返される。
【0014】
したがって、このように構成された第1の警報情報収集装置では、任意の監視項目に関する障害を検出したときに、その監視項目に対して連続して追加的なポーリングを実行することができるので、例えば、一過性の障害の解消したことを示す警報情報を迅速に収集し、上位装置に報告することができる。
【0015】
更に、図1に示した連続挿入手段113は、障害検出手段112によって障害の発生が検出されるごとに、該当する監視項目に関する追加ポーリングをスケジュールに追加する追加手段121と、追加手段121によって追加された追加ポーリングの数が所定の数に到達したときに、追加手段による追加動作を停止する追加停止手段122とを備えて構成してもよい。
【0016】
このような連続挿入手段113を備えた第1の警報情報収集装置では、追加手段121の動作を追加停止手段122が制御することによって、任意の監視項目についてスケジュールに連続的に挿入される追加ポーリングを、所定の数までに制限する。したがって、障害が解消したか否かにかかわらず、所定の数までの追加ポーリングが実行された後に、ポーリング実行手段111は、元のスケジュールで規定された順序に従って次にポーリングするべき監視項目に対するポーリングを実行する。つまり、障害が発生した監視項目について連続して所定の回数だけ追加ポーリングを行った後、通常の順次ポーリングを再開する。これにより、追加ポーリングを挿入することによって発生する他の監視項目に関するポーリング間隔の延長分を制限し、他の監視項目に関するポーリング頻度の著しい低下を避けることができる。
【0017】
また一方、図1に示した第1の警報情報収集装置において、ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、連続挿入手段113は、障害検出手段112によって障害の発生が検出されるごとに、スケジュールに含まれている予備タイミングを、該当する監視項目についての追加ポーリングに対応する監視タイミングとして割り当てる割り当て手段123を備えて構成してもよい。
【0018】
このような構成の警報情報収集装置では、障害検出手段112によって障害の発生が検出されるごとに、割り当て手段123により、スケジュールに予め含まれている予備タイミングが、障害が検出された監視項目に対する監視タイミングとして割り当てられ、この追加的に割り当てられた監視タイミングに追加ポーリングが行われる。この予備タイミングは、監視項目に割り当てられていないときは待ち時間となっているので、障害が検出されている監視項目に対する追加ポーリングのために割り当てても、全ての監視項目に対するポーリング動作が一巡するまでに要する時間は変化しない。したがって、障害が検出されている期間や障害が検出された監視項目の数にかかわらず、正常であることが警報情報で示されている監視項目に関するポーリング間隔を一定に保つことができる。
【0019】
図2に、本発明にかかわる第2の警報情報収集装置の原理ブロック図を示す。請求項2の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングで得られた警報情報に基づいて、障害が発生している監視項目を検出する項目検出手段115と、項目検出手段によって検出された各監視項目について、その監視項目に割り当てられた監視タイミングを基点とするポーリング周期を整数等分した位置を、追加ポーリングを行うタイミングとして算出するタイミング算出手段116とを備え、ポーリング制御手段110は、タイミング算出手段116によって算出されたタイミングに、追加ポーリングをスケジュールに挿入するスケジュール調整手段117を備えた構成であることを特徴とする。
【0020】
請求項2の発明では、項目検出手段115により、それまでに収集された警報情報によって障害が発生しているとされた監視項目の全てが検出され、これらの監視項目について追加ポーリングを行うタイミングがタイミング算出手段116によって算出される。このタイミング算出手段116は、障害が検出されている各監視項目についての追加ポーリングのタイミングを、それぞれの監視項目に関するポーリング周期の中で均等となるように算出するので、スケジュール調整手段117により、これらの追加ポーリングをスケジュールに挿入することにより、1ポーリング周期内において、注目している監視項目に対して複数回のポーリングをほぼ等間隔で実行することができる。
【0021】
また、図2に示したスケジュール調整手段117に、タイミング算出手段116による算出結果に応じてスケジュールに挿入する追加ポーリングの数を予め定めた所定の数までに制限する追加制限手段124を備えて構成してもよい。
このように構成されたスケジュール調整手段117を備えた警報情報収集装置では、障害が検出されたことによってスケジュールに挿入される追加ポーリングの数を所定の数までに制限することができる。これにより、障害が検出された監視項目が多数に上った場合などに、追加ポーリングを含めた全体のポーリング回数に制限を設けることができるので、全ての監視項目に対するポーリング動作が一巡するために要する時間の無制限な延長を防ぐことができる。したがって、障害が検出された監視項目の数にかかわらず、全ての監視項目について適正な頻度で警報情報の収集を実行することができる。
【0022】
また、図2に示した警報情報収集装置において、ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、スケジュール調整手段117は、スケジュールに含まれている予備タイミングを削除して、代わりに該当する監視項目についての追加ポーリングをタイミング算出手段116によって算出されたタイミングに振り替えて設定する振替設定手段125を備えて構成してもよい。
【0023】
このような振替設定手段125を備えた警報情報収集装置では、振替設定手段125により、スケジュールに予め含まれている予備タイミングの代わりに、タイミング算出手段116による算出結果に従って、障害が検出された監視項目に対する監視タイミングがスケジュールに挿入され、この挿入された監視タイミングに該当する監視項目に対する追加ポーリングが行われる。この予備タイミングは、監視項目に割り当てられていないときは待ち時間となっているので、障害が検出されている監視項目に対する追加ポーリングのために割り当てても、全ての監視項目に対するポーリング動作が一巡するまでに要する時間は変化しない。したがって、障害が検出されている期間や障害が検出された監視項目の数にかかわらず、正常であることが警報情報で示されている監視項目に関するポーリング間隔を一定に保つことができる。
【0024】
図3に、本発明にかかわる第3の警報情報収集装置の原理ブロック図を示す。請求項3の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、各監視項目に対するポーリングで得られた警報情報に基づいて、障害の発生および障害の解消を含む動作状態の変化を検出するイベント検出手段118を備え、ポーリング制御手段110は、全ての監視項目について、相互の従属関係を示す従属情報保持手段131と、イベント検出手段118によっていずれかの監視項目に障害の発生が検出されるごとに、従属情報保持手段131を参照し、障害が検出された監視項目に従属するとされた監視項目に対応してスケジュールに設定された監視タイミングを選択的にマスクするマスク設定手段132と、イベント検出手段118によって障害の解消が検出された監視項目について、従属情報保持手段131を参照し、検出された監視項目に従属するとされた監視項目に対応してスケジュールに含まれる監視タイミングに設定されたマスクを解除するマスク解除手段133とを備えた構成であることを特徴とする。
【0025】
請求項3の発明では、イベント検出手段118によってある監視項目について障害の発生が検出されたときに、ポーリング制御手段110に設けられたマスク設定手段132は、従属情報保持手段131に保持された情報に基づいて、この監視項目の下位に位置付けられた監視項目に関してスケジュールに設定されていた監視タイミングをマスクする。その後、イベント検出手段118によって、上述した監視項目に関する障害が解消したことが検出されたときに、マスク解除手段133は、従属情報保持手段131に保持された情報に基づいて、この監視項目の下位に位置付けられた監視項目に対応する監視タイミングに設定されていたマスクを解除する。このように、上位の警報情報の発生に伴って、その下位に位置付けられた警報情報に関する監視タイミングをマスクすることにより、何らかの障害が検出された状態では、必要最小限の監視項目に限定してポーリングを実行し、障害が発生している上位の監視項目に関する警報情報を収集する頻度を一時的に増大させることができる。
【0026】
図4に、本発明にかかわる第4の警報情報収集装置の原理ブロック図を示す。請求項4の発明は、複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、ポーリング制御手段110は、全ての監視項目について、現用系であるか予備系であるかを示す情報を保持する現用情報保持手段134と、現用情報保持手段134に保持された情報に基づいて、予備系に属する監視項目に対してスケジュールに設定された監視タイミングを所定の割合でスキップするスキップ制御手段135とを備えた構成であることを特徴とする。
【0027】
請求項4の発明では、現用情報保持手段134において予備系であることが示された監視項目に対応してスケジュールに設定された監視タイミングは、スキップ制御手段135により、所定の割合でスキップされる。例えば、予備系に属する各監視項目に割り当てられていた監視タイミングを、2監視周期に一回ずつスキップすれば、全ての監視項目について警報情報の収集動作を2巡する時間で、現用系に属する監視項目についてはそれぞれ3回ポーリングを行い、予備系についてはそれぞれ1回ずつポーリングを行うというように、現用系のポーリング頻度を予備系のポーリング頻度よりも高くすることができる。
【0028】
【発明の実施の形態】
以下、図面に基づいて、本発明の実施形態について詳細に説明する。
図5に、本発明にかかわる警報情報収集装置の第1の実施形態を示す。
なお、図5に示した構成要素のうち、図20に示した各部と同等のものについては、図20に示した符号を付して示し、その説明を省略する。
【0029】
図5に示した警報情報収集装置において、監視制御部210は、図20に示した監視制御部411と同様に、インタフェース制御部412を介して複数のユニット420から警報情報を収集する。
この監視制御部210において、インタフェース制御部412を介してユニットから収集した警報情報は、警報情報保持部211に保持され、この警報情報保持部211に保持された警報情報は、従来と同様にして、報告処理部213により、適切な手順に従って上位装置に通知される。また、上述した警報情報は、同時にアラーム検出部212に送られ、このアラーム検出部212により、障害の発生およびその解消などの状態の変化が検出される。
【0030】
また、図5に示した監視制御部210において、順次制御部214は、従来と同様に、所定のクロック信号に従って、各ユニットを順次に監視対象として指定するための指示を出力する。一方、挿入制御部215は、アラーム検出部212による検出結果およびカウンタ216からの通知に基づいて、上述した順次制御部214の動作を制御するとともに、障害が検出されたユニットに対して追加的なポーリングを行うための指示を出力する。また、図5に示したカウンタ216は、挿入制御部215が上述した指示を出力した回数を計数し、その計数結果が所定の閾値に到達したときに、その旨を挿入制御部215に通知する。
【0031】
ここで、図5に示した各部と図1に示した各手段との対応関係について説明する。
図5に示したインタフェース制御部412が監視制御部210からの指示に応じて動作することにより、図1に示したポーリング実行手段111の機能が果たされる。また、図5に示したアラーム検出部212は、図1に示した障害検出手段112に相当する。同様に、図5に示した挿入制御部215は、図1に示した追加手段121に相当する。一方、図5に示したカウンタ216からの通知に応じて挿入制御部215が動作することにより、図1に示した追加停止手段122の機能が果たされる。したがって、図5においては、挿入制御部215とカウンタ216とによって、図1に示した連続挿入手段114の機能を果たしている。なお、図1に示したスケジュールは、図5に示した順次制御部214の動作を規定する手順に相当する。
【0032】
次に、図5に示した第1の警報情報収集装置の動作について説明する。
図6に、第1の警報情報収集装置の動作を表す流れ図を示す。また、図7に、第1の警報情報収集装置の動作を説明するタイミング図を示す。
【0033】
図5に示した順次制御部214は、各監視周期の初めに、図6に示したステップ301において、監視対象のユニットを示す監視番号iに初期値(例えば、数値「1」)を設定し、また、挿入制御部215は、カウンタ216に計数の初期値(例えば、数値「1」)を設定する。次に、図5に示した順次制御部214は、この監視番号iで示されるi番目のユニット420を指定して、インタフェース制御部412に警報情報の要求を指示し、この指示に応じて、インタフェース制御部412は、上述したi番目のユニット420iに対するポーリングを実行する(ステップ302)。
【0034】
ステップ302において収集された警報情報によって、i番目のユニット420に障害が発生していないことが示された場合(ステップ303の否定判定)に、順次制御部214は、ステップ304に進んで監視番号iをインクリメントする。次に、順次制御部214は、インクリメント後の監視番号iが監視対象のユニットの総数Nを超えているか否かを判定し(ステップ305)、このステップ305の否定判定の場合は、ステップ302に進んで、次のユニットに関する警報情報の収集を行う。
【0035】
このように、アラーム検出部212によって障害が検出されていない状態においては、順次制御部214からの指示に応じて、従来と同様にして、図7において符号(a)〜(a)を付して示した各ユニットに対応する監視タイミングに、それぞれのユニット420に関する警報情報が収集される。なお、図7において、順次制御部214および挿入制御部215において、監視タイミングを生成するために利用する内部クロック信号を、図7(b)に示した。
【0036】
このようにして全ユニットに関する監視動作が一巡したときに、上述したステップ305の肯定判定となり、順次制御部214は、一つの監視周期が完了したと判断し、ステップ301に進んで、新たな監視周期に関する監視制御を開始する。
ところで、例えば、ユニット420に対応する監視タイミングが終了した後に、ユニット420において障害が発生した場合は(図7(a)および(c)参照)、次の監視周期のこのユニット420に対応する監視タイミングで初めてアラーム検出部212は、このユニット420に障害が発生したことを検出する。
【0037】
この場合は、図6に示したステップ303の肯定判定となり、順次制御部214に代わって挿入制御部215が動作を開始し、i番目のユニット(例えば、ユニット420)を指定して警報情報を要求し、この指示に応じて、インタフェース制御部412は、ユニット420に対するポーリングを行って、このユニットに関する警報情報を収集する(ステップ306)。
【0038】
図7に示したように、ユニット420において発生した障害が、アラーム検出部212によって検出された段階ですでに解消している場合は(図7(c)、(d)参照)、上述したようにして、このユニット420に対する追加のポーリングで得られる警報情報によって、その障害が解消していることが示される。
【0039】
このように、追加ポーリングで得られた警報情報によって障害が回復したことが示された場合(図6に示したステップ307の肯定判定)に、挿入制御部215は、追加ポーリングの挿入処理を完了して順次制御部214に制御を渡し、順次制御部214は、ステップ304に進み、順次ポーリング動作を再開する。
【0040】
一方、ステップ307の否定判定の場合に、挿入制御部215は、追加ポーリングの挿入がまだ必要であると判断する。この場合に、挿入制御部215は、ステップ308においてカウンタ216に挿入回数kのインクリメントを指示した後に、このカウンタ216の計数値で示される挿入回数kが上限値Mを超えたか否かを判定し(ステップ309)、否定判定の場合は、ステップ306に戻って新たな追加ポーリングを実行する。一方、ステップ309の肯定判定の場合に、挿入制御部215は、上述したステップ307の肯定判定の場合と同様に、追加ポーリングの挿入処理を終了し、順次制御部214に制御を渡す。
【0041】
図5に示した第1の警報情報収集装置では、上述したように、任意のユニットに対応する監視タイミングにおいて、そのユニットにおける障害の発生が検出されたときに、そのユニットに対して連続して追加ポーリングを実行する。したがって、任意のユニットにおいて発生した障害が解消したことを示す警報情報を迅速に収集し、各ユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。これにより、各ユニットにおける障害の発生状況と、警報情報収集装置に収集された警報情報によって示される障害の発生状況との差異を少なくすることができる。
【0042】
例えば、回線の一時的な切断のような一過性の障害を示すアラームが、警報情報収集装置に設けられた警報情報保持部211に保持されている期間を短縮し、上述した一過性の障害が現実に発生している期間に近づけることができるので、監視対象のユニットに関する状態をより正確に把握することが可能となる。
【0043】
また、挿入制御部215が、図6においてステップ306からステップ309に示したように、1監視周期において挿入する追加ポーリングの数に上限を設けて制御することにより、追加ポーリングの挿入によって、監視周期が極端に増大することを防いでいる。
もちろん、挿入制御部215が、アラーム検出部212による検出結果に応じて、追加ポーリングを無制限に挿入する構成を採用することも可能である。
【0044】
次に、追加ポーリングの挿入にかかわらず、一定の監視周期を維持する方法について説明する。
図8に、第1の警報情報収集装置にかかわる別実施形態を示す。
なお、図8に示した各部において、図5に示した各部と同等のものについて、同一の符号を付して示し、説明を省略する。
【0045】
図8に示した警報情報収集装置において、順次制御部217は、カウンタ216の計数値によって示される追加ポーリングの挿入回数を考慮して、順次ポーリング動作を制御する。
なお、この場合に、図8に示したカウンタ216による計数値に応じて挿入制御部215および順次制御部217が追加ポーリングの挿入および順次ポーリング動作の制御を行うことにより、図1に示した割り当て手段123の機能が果たされる。
【0046】
図9に、第1の警報情報収集装置にかかわる別実施形態の動作を表す流れ図を示す。
なお、図9に示す各ステップのうち、図6に示した各ステップと同等のものについては同一の符号を付して示し、その説明を省略する。
図9に示した流れ図においては、ステップ305の肯定判定に応じて、ステップ301に戻る代わりに、ステップ312を実行する。
【0047】
このステップ312において、順次制御部217は、監視番号iとカウンタ216の計数値で示される挿入回数kとの和の値がユニットの総数Nと挿入回数の上限Mとの和の値を超えたか否かに基づいて、監視周期が経過したか否かを判定する。
したがって、どのユニットについての障害が検出されなかった場合には、挿入回数の上限Mに相当する時間は、順次ポーリング動作の待ち時間となる。一方、挿入制御部215によって追加ポーリングが挿入された場合は、追加ポーリングを挿入するごとに、スケジュールに予め設けられていた待ち時間の一部が削除されることになる。このことは、すなわち、スケジュールに設けた予備タイミングを追加ポーリングに割り当てることと同等である。
【0048】
このようにして、予めスケジュールに設けた待ち時間の範囲内で追加ポーリングを実行することにより、監視周期を一定に維持しつつ、任意のユニットにおいて発生した障害が解消したことを示す警報情報を迅速に収集し、各ユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。
【0049】
次に、障害が発生したことが示された監視項目について、ポーリング周期内に均等に追加ポーリングを挿入する方法について説明する。
図10に、本発明にかかわる第2の警報情報収集装置の実施形態を示す。
なお、図10に示す構成要素のうち、図5に示した各部と同等のものについては、図5に示した符号を付して示し、その説明を省略する。
【0050】
図10に示した警報情報収集装置に備えられた監視制御部220において、順次制御部221は、従来と同様に、所定のクロック信号に従って、各ユニットを順次に監視対象として指定するための指示を出力するとともに、監視対象として指定するユニットを示す監視番号iを参照番号算出部222に通知する。この参照番号算出部222は、通知された監視番号i、監視周期を分割する数を示す分割数m、分割された監視周期における位置を示す位相xおよびユニットの総数Nとに関する式(1)を用いて、警報情報保持部211においてアラームの発生を参照すべきユニットを示す参照番号jを算出し、この参照番号jをアラーム判定部223に渡す。
【0051】
j=mod(N,i+(m−x)N/m) ・・・(1)
また、図10に示したアラーム判定部223は、通知された参照番号jで示されるユニットに対応して警報情報保持部211に保持された警報情報を参照し、該当するユニットにおいて障害が発生しているか否かを判定する。このアラーム判定部223による判定結果は、順次制御部221および追加指示部224に通知され、順次制御部221および追加指示部224は、通知された判定結果に応じて、それぞれ後述する処理を行う。
【0052】
ここで、図10に示した各部と図2に示した各手段との対応関係について説明する。
図10に示したインタフェース制御部412が監視制御部220からの指示に応じて動作することにより、図1に示したポーリング実行手段111の機能が果たされる。また、図10に示した警報情報保持部211およびアラーム判定部223は、図2に示した項目検出手段115に相当し、図10に示した参照番号算出部222は、図2に示したタイミング算出手段116に相当する。また、図10に示した追加指示部224がアラーム判定部223による判定結果に応じて追加ポーリングのための指示を出力することにより、図2に示したスケジュール調整手段117の機能が果たされる。
【0053】
以下、図10に示した第2の警報情報収集装置の動作について説明する。
図11に、第2の警報情報収集装置の動作を表す流れ図を示す。また、図12に、第2の警報情報収集装置の動作を説明するタイミング図を示す。
【0054】
警報情報の収集を開始する際に、順次制御部221は、監視番号iに初期値「1」を設定し、また、参照番号算出部222は、位相xに初期値「1」を設定する(ステップ321)。
ステップ322において、順次制御部221は、監視番号iを指定してポーリングを行うための指示を出力し、これに応じて、インタフェース制御部412は、ユニット420に対するポーリングを行う。このときに得られた警報情報は、警報情報保持部211に保持される。
【0055】
次いで、参照番号算出部222は、上述した式(1)に従って参照番号jを算出し(ステップ323)、アラーム判定部223は、この参照番号jで示されるユニット420に対応して警報情報保持部211に保持された警報情報を参照し(ステップ324)、この警報情報によって障害が発生しているアラーム状態が示されているか否かを判定する(ステップ325)。
【0056】
例えば、分割数m=2,ユニットの総数N=10とすれば、図12(c)に示すように、監視番号7で示されるユニット420に対するポーリングの際に、上述したステップ323において、参照番号算出部222は、式(1)の計算結果としてユニット420に対応する参照番号「2」を得る(図12(d)参照)。ここで、図12に示した例においては、図12(a)に示したユニット420に対するポーリングにおいて、この時点において継続中の障害を示す警報情報が収集され(図12(e)参照)、この警報情報が、すでに警報情報保持部211に保持されている。
【0057】
したがって、この場合に、アラーム判定部223は、参照番号「2」に基づいて警報情報保持部211を参照することにより、このユニット420において障害が発生していることを示す警報情報を得るので、これに基づいて、参照番号で示されるユニットがアラーム状態であると判定する。
【0058】
このように、アラーム判定部223によってアラーム状態であると判定された場合(ステップ325の肯定判定)に、順次制御部221は一時的に動作を停止し、代わって、追加指示部224が、上述した参照番号jを指定してポーリングを行うための指示を出力し、これに応じて、インタフェース制御部412が、ユニット420に対するポーリングを行う(ステップ326)。
【0059】
このようにして、図12に示すように、監視番号が一巡する期間の中間に、監視番号「2」に対応するユニット420に対する追加ポーリングを挿入することができる。この追加ポーリングに伴って、図12(f)に示すように、ユニット420におけるラッチの解除を促進することができる。
【0060】
ここで、図12(a)〜(a10)に、ユニット420〜42010 に対する順次ポーリングに追加ポーリングを加えた監視タイミングを示し、また、図12(b)に、順次制御部221および追加指示部224の動作を規定するクロック信号を示した。また、図12(c)に、監視番号を示し、図12(d)に、参照番号の系列を示した。また、図13(e)、(f)、(g)に、ユニット420における障害検出信号、ラッチ信号および収集された警報情報をした。なお、図12(c)、(d)に示した監視番号および参照番号においては、ユニット42010に対応する番号を符号Aとして示した。
【0061】
上述したようにして追加ポーリングを挿入した後に、追加指示部224は、1監視周期を分割数mで分割して得られた全ての位相について参照番号の算出を完了したか否かを判定する(ステップ327)。このステップ327の否定判定の場合に、追加指示部224は、位相xをインクリメントして(ステップ328)、ステップ323に戻り、これに応じて、参照番号算出部222は、次の位相における参照番号jを算出する。
【0062】
一方、ステップ327の肯定判定の場合に、追加指示部224は、監視番号iに対応する全ての参照番号についての処理を完了したと判断し、追加ポーリングの挿入処理を終了して、順次制御部221に制御を渡す。これに応じて、順次制御部221は、監視番号iをインクリメントし(ステップ329)、また、位相xに初期値を設定して(ステップ330)、ステップ322に戻り、監視番号iで示される次のユニットに関する警報情報を収集する処理を再開する。
【0063】
図12に示した例においては、上述したようにして挿入された追加ポーリングによって、ユニット420におけるラッチがすでにクリアされているので、順次制御部221による順次ポーリング動作の再開に伴って、監視番号がインクリメントされていき、再びユニット420に対するポーリングが実行されたときには、障害が解消された旨の警報情報が得られ、これに基づいて、警報情報保持部211の内容も更新される。
【0064】
このように、順次制御部221によってインクリメントされる監視番号に対して、位相をずらした参照番号を参照番号算出部222によって算出し、この参照番号に基づいて追加ポーリングを挿入することにより、障害が検出されたユニットそれぞれについて、1監視周期に分割数に応じた数の追加ポーリングを均等に挿入することができる。
【0065】
図13に、分割数m=3、ユニットの総数N=10である場合に、監視番号4および監視番号7で示されるユニットについて追加ポーリングを挿入する例を示す。なお、図13(a)、(a)に、ユニット420、420に対する順次ポーリングに追加ポーリングを加えた監視タイミングを示し、図13(b)に、順次制御部221および追加指示部224の動作を規定するクロック信号を示した。また、図13(c)に、監視番号を示し、図13(d)、(e)に、位相の異なる参照番号の系列を示した。また、図13(f)、(g)、(h)に、ユニット420における障害検出信号、ラッチ信号および収集された警報情報を示し、図13(i)、(j)、(k)に、ユニット420における障害検出信号、ラッチ信号および収集された警報情報を示した。
【0066】
このように、図10に示した第2の警報情報収集装置では、比較的に継続時間が長い障害が発生する可能性が高いユニット群を監視する場合においても、任意のユニットにおいて発生した障害が解消したことを示す警報情報を迅速に収集し、各ユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。これにより、各ユニットにおける障害の発生状況と、警報情報収集装置に収集された警報情報によって示される障害の発生状況との差異を少なくすることができる。
【0067】
更に、監視番号が一巡する間に挿入される追加ポーリングの数を制限することもできる。
図14に、本発明にかかわる第2の警報情報収集装置の別実施形態を示す。
なお、図14に示した構成要素のうち、図10に示した各部と同等のものについては、図10に示した符号を付して示し、その説明を省略する。
【0068】
図14に示した監視制御部220は、図10に示した各部に加えて、カウンタ225を備えている。このカウンタ225は、追加指示部224が追加ポーリングを行うための指示を出力した回数を計数し、計数結果が所定の閾値cに達したときに、その旨を参照番号算出部222および追加指示部224に通知して、この参照番号算出部222および追加指示部224による追加ポーリングの挿入動作を停止する。
【0069】
このように、図14に示したカウンタ225の計数値に応じて、後述するようにして、参照番号算出部222および追加指示部224が追加ポーリングの挿入動作を停止することにより、図2に示した追加制限手段124の機能が果たされる。
図15に、図14に示した第2の警報情報収集装置の別実施形態の動作を表す流れ図を示す。
【0070】
図15に示したステップ331において、順次制御部221は、図11に示したステップ321と同様の初期化処理とともに、カウンタ225の計数値に初期値「0」を設定する。
一方、参照番号算出部222は、参照番号の算出に先立って、挿入回数kと挿入回数の上限cとを比較し、挿入回数kが上限に達していない場合(ステップ332の否定判定)は、ステップ323に進んで参照番号の算出を行う。一方、ステップ332の肯定判定の場合に、参照番号算出部222は、追加ポーリングをこれ以上挿入することはできないと判断し、順次制御部221に制御を渡す。この場合に、順次制御部221は、図15において符号Aを付した端子で示すようにステップ334に進み、監視番号iのインクリメントおよび位相xの初期化を行う。その後、順次制御部221は、ステップ335において監視番号iがユニットの総数Nを超えたか否かを判定し、このステップ335の否定判定の場合はステップ322に進んで監視番号iで示される次のユニットに関する警報情報の収集を行う。一方、ステップ335の肯定判定の場合に、順次制御部221は、監視番号iが一巡したと判断し、ステップ331に進んで初期化処理を行い、新たな監視周期の処理を開始する。
【0071】
このように、図14に示した第2の警報情報収集装置の別実施形態においては、カウンタ225の計数値が挿入回数の上限cに到達するまでに限って、参照番号算出部222、アラーム判定部223および追加指示部224によって追加ポーリングを挿入することにより、追加ポーリングの挿入によって、監視周期が極端に増大することを防いでいる。
【0072】
更に、図9に示したステップ311に相当する処理をステップ335の肯定判定に応じて行い、順次ポーリングのスケジュールに予め設けた待ち時間を追加ポーリングに割り当てることも可能である。
次に、警報情報相互の従属関係を利用して、主要な警報情報に関する監視間隔を短縮する方法について説明する。
【0073】
図16に、本発明にかかわる第3の警報情報収集装置の実施形態を示す。
なお、図16に示した構成要素のうち、図20あるいは図5に示した各部と同等のものについては、図20あるいは図5に示した符号を付して示し、その説明を省略する。
【0074】
図16に示した監視制御部230において、従属情報保持部231は、各ユニット420に対応する警報情報について、相互の依存関係を示す情報を保持している。また、図16において、インタフェース制御部412を介して入力された警報情報は、アラーム検出部212とともに解消検出部233に入力されている。この解消検出部233は、新たに受け取った警報情報と警報情報保持部211に保持された対応する警報情報とに基づいて、該当するユニットにおける障害が解消したことを検出し、検出結果をマスク制御部232に通知する。図16に示したマスク制御部232は、上述した従属情報保持部231に保持された情報とアラーム検出部212および解消検出部233から通知される検出結果とに基づいて、マスク保持部234に各ユニットに対応して設けられたマスクフラグに適切な値を設定する。また、図16に示したポーリング制御部235は、自身の内部において順次に生成される監視番号ごとに、上述したマスク保持部234を参照し、監視番号に対応するマスクフラグの値に応じて、インタフェース制御部412に適切な指示を送出する。
【0075】
ここで、図16に示した各部と図3に示した各手段との対応関係について説明する。
図16に示したインタフェース制御部412が監視制御部230からの指示に応じて動作することにより、図3に示したポーリング実行手段111の機能が果たされる。また、図16に示した警報情報保持部211、アラーム検出部212および解消検出部233は、図3に示したイベント検出手段118に相当し、図16に示した従属情報保持部231は、図3に示した従属情報保持手段131に相当する。また、図16に示したマスク制御部232がマスク保持部234に設定した情報に従ってポーリング制御部235が後述するようにしてポーリングを行うための指示を出力する動作を制御することにより、図3に示したマスク設定手段132およびマスク解除手段133の機能が果たされる。
【0076】
次に、図16に示した第3の警報情報収集装置の動作について説明する。
図17に、第3の警報情報収集装置の動作を表す流れ図を示す。
図16に示したポーリング制御部235は、各監視周期の初めに監視番号iに初期値「1」を設定する(ステップ341)。次に、ポーリング制御部235は、監視番号iに対応してマスク保持部234に保持されたマスクフラグを参照し、監視番号iに対応する警報情報がマスクされているか否かを判定する(ステップ342)。
【0077】
ステップ342の否定判定の場合に、ポーリング制御部235は、監視番号iを指定してインタフェース制御部412にこの監視番号iで示されるユニット420に対するポーリングを行うための指示を入力し、この指示に応じて、インタフェース制御部412は、上述したユニット420に対するポーリングを行って警報情報を収集する(ステップ343)。
【0078】
このように、ポーリング制御部235が、マスク保持部234に保持されたマスクフラグの値に応じてポーリングを行うことにより、このマスク保持部234にも受けられたマスクフラグによって、対応する警報情報をマスクしない旨が示された警報情報に限って、ポーリングを行うことができる。
【0079】
ステップ343において収集された警報情報は、警報情報保持部211に保持されるとともに、アラーム検出部212および解消検出部233に渡される。
このとき、アラーム検出部212によって、障害の発生が検出された場合(ステップ344の肯定判定)に、マスク制御部232は、従属情報保持部231を参照して、監視番号iに依存することが示された警報情報を検索し(ステップ345)、次いで、ステップ345における検索結果で示された警報情報に対応してマスク保持部234に設けられたマスクフラグに、それぞれ対応する警報情報をマスクする旨の値を設定する(ステップ346)。
【0080】
このようにして、障害が発生したことが検出された警報情報に従属する警報情報に対応して、マスク保持部234に設けられたマスクフラグにそれぞれの警報情報をマスクする旨の値を設定し、以降の処理において、これらの警報情報を監視対象からはずすことができる。これにより、障害が発生したことが検出された主要な警報情報を相対的に高い頻度で収集することができるので、障害が解消したことを示す警報情報を迅速に収集し、該当するユニットに関する警報情報が変化したタイミングとこれらの現象に関する報告を収集するタイミングとのずれを縮小することができる。これにより、各ユニットにおける障害の発生状況と、警報情報収集装置に収集された警報情報によって示される障害の発生状況との差異を少なくすることができる。この警報情報の変化を迅速に把握することができる。
【0081】
一方、ステップ343において収集された警報情報によって障害が発生していないことが示された場合(ステップ344の否定判定)であって、該当する監視番号iに対応して、警報情報保持部211に保持されていた警報情報によって障害の発生が示されている場合に、解消検出部233は、該当する警報情報に関する障害の解消を検出する(ステップ347)。この場合に、マスク制御部232は、従属情報保持部231を参照して、監視番号iに依存することが示された警報情報を検索し(ステップ348)、次いで、ステップ348における検索結果で示された警報情報に対応してマスク保持部234に設けられたマスクフラグをクリアして、それぞれに対応する警報情報に設定したマスクを解除する(ステップ349)。
【0082】
このようにして、主要な警報情報によって該当する障害の解消が示されたときに、この警報情報に従属する警報情報に関するマスクを解除して、これらの警報情報を監視対象に復帰させることができる。
一方、上述したマスク設定処理(ステップ345,346)あるいはマスク解除処理(ステップ348,349)の終了後に、マスク制御部232は処理をポーリング制御部235に返し、これに応じて、ポーリング制御部235は、監視番号iと監視対象の総数Nとの比較結果に基づいて、監視対象に関するポーリング処理が一巡したか否かを判定する(ステップ350)。監視番号iが総数Nに達していない場合(ステップ350の否定判定)に、ポーリング制御部235は、監視番号iをインクリメントして(ステップ351)、ステップ342に戻り、新たな監視番号に対応するポーリング処理を続ける。一方、ステップ350の肯定判定の場合に、ポーリング制御部235は、ステップ341に戻って監視番号iを初期化し、新たな監視周期に関する処理を開始する。
【0083】
図16に示した第3の警報情報収集装置の特徴は、障害が発生したときに監視対象を絞り込むという点にあり、この特徴は、特に、幾つかの主要な警報情報に従属して、多数の警報情報が位置付けられており、これらの多数の従属する警報情報が、上述した主要な警報情報の変化に応じて変化する場合に有効である。なお、このように警報情報が階層的な構造をもっている場合には、主要な警報情報に対応する障害が発生したときには、下位に位置付けられる警報情報もまた障害の発生を示すので、上述したようにして、従属的な警報情報を監視対象からはずすことによって、収集される情報の実質的な量は変化しないと考えられる。
【0084】
次に、二重化されたシステムにおいて有効な警報情報収集装置について説明する。
図18に、本発明にかかわる第4の警報情報収集装置の実施形態を示す。
なお、図18に示した構成要素のうち、図5あるいは図20に示した各部と同等のものについては、図5あるいは図20に示した符号を付して示し、その説明を省略する。
【0085】
図18に示した警報情報収集装置は、監視制御部240を備えている。この監視制御部240において、現用情報保持部241は、各ユニット420が現用系に属しているか予備系に属しているかを示す情報を上位の装置(図示せず)から受け取り、これらの情報を各ユニット420に対応して保持している。また、図18に示したスキップカウンタ242は、各ユニットに対応して、ポーリング制御部243が後述するポーリングのスキップを行った回数をそれぞれ計数し、計数結果をポーリング制御部243に通知する。このスキップカウンタ242によって得られた各ユニットに対応するスキップ回数と上述した現用情報保持部241に保持された情報とに基づいて、ポーリング制御部243は、各ユニット420に対するポーリングを実行するための指示を出力する動作あるいはポーリングのための指示を出力しないで次のユニットに関する処理に移行するスキップ動作を行う。
【0086】
ここで、図18に示した各部と図4に示した各手段との対応関係について説明する。
図18に示したインタフェース制御部412が監視制御部240からの指示に応じて動作することにより、図4に示したポーリング実行手段111の機能が果たされる。また、図18に示した現用情報保持部241は、図4に示した現用情報保持手段134に相当する。また、図18に示したスキップカウンタ242とポーリング制御部243とは、図4に示したスキップ制御手段135に相当する。
【0087】
次に、図18に示した警報情報収集装置の動作について説明する。
図19に、第4の警報情報収集装置の動作を表す流れ図を示す。
図19に示した警報情報収集動作を開始するのに先立って、図18に示したポーリング制御部243は、スキップカウンタ242の各ユニット420に対応する計数値に初期値(例えば、数値「0」)を設定する。
【0088】
各監視周期を開始する際に、ポーリング制御部243は、監視対象のユニットを示す監視番号iに初期値(例えば、数値「1」)を設定する(ステップ361)。次に、ポーリング制御部243は、上位の装置からの通知に基づいて、現用系と予備系との切り替えが行われたか否かを判定し(ステップ362)、切り替えが発生したことが通知された場合は(ステップ362の肯定判定)、スキップカウンタ242の各ユニット420に対応する計数値を初期化して(ステップ363)、ステップ364に進む。一方、ステップ362の否定判定の場合は、そのままステップ364に進む。
【0089】
ステップ364において、ポーリング制御部243は、現用情報保持部241を参照して、監視番号iで示されるユニット420が現用系に属するか否かを判定する。
例えば、監視番号iで示されるユニット420が現用系に属していることが現用情報保持部241に保持された情報によって示されている場合に、ポーリング制御部243は、このステップ364における肯定判定とし、インタフェース制御部412を介して、監視番号iで示されるユニット420に関する警報情報を収集する(ステップ365)。次いで、ポーリング制御部243は、監視番号iをインクリメントし(ステップ366)、その後、この監視番号iがユニットの総数Nに到達したか否かを判定する(ステップ367)。
【0090】
インクリメント後の監視番号iがユニットの総数n未満であった場合に、ポーリング制御部243は、ステップ367の否定判定としてステップ362に戻り、次の監視番号に関する監視処理を行う。
一方、監視番号iに対応して現用情報保持部241に保持された情報により、該当するユニット420が予備系に属していることが示された場合に、ポーリング制御部243は、ステップ364の否定判定としてステップ368に進み、ユニット420に対応するスキップカウンタ242の計数値がスキップ回数の上限値d未満であるか否かを判定する。
【0091】
ユニット420に対応するスキップカウンタ242の計数値が上述した上限値d未満である場合(ステップ368の肯定判定)に、ポーリング制御部243は、監視番号iで示されるユニット420に関するポーリングをスキップする。このとき、ポーリング制御部243は、スキップカウンタ242に該当する系数値の加算を指示し、これに応じて、スキップカウンタ242はユニット420に対応するスキップ回数をインクリメントする(ステップ369)。
【0092】
一方、ユニット420に対応するスキップカウンタ242の計数値が上述した上限値dに到達した場合(ステップ368の否定判定)に、ポーリング制御部243は、すでに該当するユニットに関するポーリングは十分な回数だけスキップされたと判断し、インタフェース制御部412を介して該当するユニットに対するポーリングを実行し、警報情報を収集する(ステップ370)。次いで、ポーリング制御部243は、スキップカウンタ242に対して、対応する計数値をクリアする旨を指示し、監視番号iに対応するユニット420に関するスキップ回数を初期化する。
【0093】
このステップ371の処理の終了後、および上述したステップ369の処理の終了後に、ポーリング制御部243は、ステップ366に進んで、次の監視番号に対応する処理に備える。
上述した例において、スキップ回数の上限値d=3とすれば、第1回から第3回までの監視周期においては、予備系に属するユニット420に対するポーリングはスキップされて、現用系に属するユニット420についてのみポーリングが実行され、第4回の監視周期において、全てのユニット420に対するポーリングが実行される。
【0094】
このように、第4の警報情報収集装置によれば、現用系に属するユニット420に関する警報情報を、予備系に属するユニットに対応する警報情報よりも高い頻度で収集することができる。
ここで、2重化されたシステムにおいて、稼動中の現用系に属するユニット420に関する警報情報の変化が発生する確率は、予備系に属するユニット420に関する警報情報の変化が発生する確率に比べて非常に大きいと考えられる。したがって、上述したようにして、予備系に属するユニット420に関する警報情報の収集動作をスキップしたことによって予備系に属するユニット420に関する警報情報の変化を見逃すデメリットよりも、現用系に属するユニット420に関する警報情報を収集する頻度を増大させることによって得られる効果の方がはるかに大きいと考えられる。
【0095】
更に、予備系については、完全に警報情報の収集をスキップしてしまうこともできる。この場合は、図19に示したステップ364の否定判定の場合に、ポーリング制御部243は、そのままステップ366に進んで、次の監視番号に対応する処理に備える。
以上の説明に関して、更に、以下の各項を開示する。
【0096】
(付記1) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段112と、
ポーリング制御手段110は、障害検出手段112によって障害の発生が検出されるごとに、障害が検出された監視項目についての追加ポーリングに対応する監視タイミングを障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整をスケジュールに対して行う連続挿入手段113を備えた構成である
ことを特徴とする警報情報収集装置。
【0097】
(付記2) 付記1記載の警報情報収集装置において、
連続挿入手段113は、
障害検出手段112によって障害の発生が検出されるごとに、該当する監視項目に関する追加ポーリングをスケジュールに追加する追加手段121と、
追加手段121によって追加された追加ポーリングの数が所定の数に到達したときに、追加手段による追加動作を停止する追加停止手段122とを備えた構成である
ことを特徴とする警報情報収集装置。
【0098】
(付記3) 付記1記載の警報情報収集装置において、
ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、
連続挿入手段113は、障害検出手段112によって障害の発生が検出されるごとに、スケジュールに含まれている予備タイミングを、該当する監視項目についての追加ポーリングに対応する監視タイミングとして割り当てる割り当て手段123を備えた構成である
ことを特徴とする警報情報収集装置。
【0099】
(付記4) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングで得られた警報情報に基づいて、障害が発生している監視項目を検出する項目検出手段115と、
項目検出手段115によって検出された各監視項目について、その監視項目に割り当てられた監視タイミングを基点とするポーリング周期を整数等分した位置を、追加ポーリングを行うタイミングとして算出するタイミング算出手段116とを備え、
ポーリング制御手段110は、タイミング算出手段116によって算出されたタイミングに、追加ポーリングをスケジュールに挿入するスケジュール調整手段117を備えた構成である
ことを特徴とする警報情報収集装置。
【0100】
(付記5) 付記4記載の警報情報収集装置において、
スケジュール調整手段117は、タイミング算出手段116による算出結果に応じてスケジュールに挿入する追加ポーリングの数を予め定めた所定の数までに制限する追加制限手段124を備えた構成である
ことを特徴とする警報情報収集装置。
【0101】
(付記6) 付記4記載の警報情報収集装置において、
ポーリング制御手段110に備えられたスケジュールは、各監視項目に予め割り当てられた固定監視タイミングと、任意の監視項目に追加的に割り当て可能であって、監視項目に割り当てられていないときは待ち時間となる所定数の予備タイミングとから形成し、
スケジュール調整手段117は、スケジュールに含まれている予備タイミングを削除して、代わりに該当する監視項目についての追加ポーリングをタイミング算出手段116によって算出されたタイミングに振り替えて設定する振替設定手段125を備えた構成である
ことを特徴とする警報情報収集装置。
【0102】
(付記7) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングで得られた警報情報に基づいて、障害の発生および障害の解消を含む動作状態の変化を検出するイベント検出手段118を備え、
ポーリング制御手段110は、
全ての監視項目について、相互の従属関係を示す従属情報保持手段131と、イベント検出手段118によっていずれかの監視項目に障害の発生が検出されるごとに、従属情報保持手段131を参照し、障害が検出された監視項目に従属するとされた監視項目に対応してスケジュールに設定された監視タイミングを選択的にマスクするマスク設定手段132と、
イベント検出手段118によって障害の解消が検出された監視項目について、従属情報保持手段131を参照し、検出された監視項目に従属するとされた監視項目に対応してスケジュールに含まれる監視タイミングに設定されたマスクを解除するマスク解除手段133とを備えた構成である
ことを特徴とする警報情報収集装置。
【0103】
(付記8) 複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段110がポーリング実行手段111による各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
ポーリング制御手段110は、
全ての監視項目について、現用系であるか予備系であるかを示す情報を保持する現用情報保持手段134と、
現用情報保持手段134に保持された情報に基づいて、予備系に属する監視項目に対してスケジュールに設定された監視タイミングを所定の割合でスキップするスキップ制御手段135とを備えた構成である
ことを特徴とする警報情報収集装置。
【0104】
【発明の効果】
以上に説明したように、本発明にかかわる第1の警報情報収集装置によれば、警報情報によって障害が発生したことが示された監視項目について、連続的にポーリングを実行することができるので、監視項目における障害の解消に伴って、その旨を示す警報情報を迅速に収集することができる。これにより、特に、継続時間の短い障害が発生する可能性が高い監視項目を含むシステムにおいて、障害が解消されたタイミングとこれに関する警報情報を収集したタイミングとのずれを縮小することができる。
【0105】
また、本発明にかかわる第2の警報情報収集装置によれば、警報情報によって障害が発生したことが示された監視項目について、1監視周期内で均等に複数回のポーリングを実行することができるので、比較的に継続時間の長い障害が発生する可能性が高い監視項目を含むシステムにおいて、監視項目における障害の解消を示す警報情報を効率よく収集して、障害が解消されたタイミングとこれに関する警報情報を収集したタイミングとのずれを縮小することができる。
【0106】
また、上述した第1および第2の警報情報収集装置において、追加的に実行するポーリングの回数を制限する手段を設けることにより、障害が発生したことが示された監視項目に対する追加ポーリングによって、他の監視項目に対するポーリングを実行する間隔が延長してしまうことを制限することができる。
【0107】
一方、本発明にかかわる第3の警報情報収集装置は、主要な監視項目における障害の発生に伴って、この監視項目の状態に従属して状態が変化する監視項目に関するポーリングをマスクし、必要最小限の監視項目に限定してポーリングを実行することができる。これにより、障害が発生している上位の監視項目に関する警報情報を収集する頻度を一時的に増大させて、障害が解消されたタイミングとこれに関する警報情報を収集したタイミングとのずれを縮小することができる。
【0108】
また、本発明にかかわる第4の警報情報収集装置は、現用系に属する監視項目と予備系に属する監視項目とに対して、それぞれ異なる頻度でポーリングを行うことができる。これにより、障害が発生する可能性の高い現用系の監視項目に関する警報情報を高い頻度で収集することができるので、障害の発生あるいは解消に伴って警報情報が変化するタイミングとこれに関する警報情報を収集するタイミングとのずれを縮小することができる。
【0109】
上述した第1から第4の警報情報収集装置によって、障害の発生あるいは解消に伴って警報情報が変化するタイミングとこれに関する警報情報を収集するタイミングとのずれを縮小することにより、多数の監視項目における障害の発生状況を正確に把握することができる。
【図面の簡単な説明】
【図1】本発明にかかわる第1の警報情報収集装置の原理ブロック図である。
【図2】本発明にかかわる第2の警報情報収集装置の原理ブロック図である。
【図3】本発明にかかわる第3の警報情報収集装置の原理ブロック図である。
【図4】本発明にかかわる第4の警報情報収集装置の原理ブロック図である。
【図5】本発明にかかわる警報情報収集装置の第1の実施形態を示す図である。
【図6】第1の警報情報収集装置の動作を表す流れ図である。
【図7】第1の警報情報収集装置の動作を説明するタイミング図である。
【図8】第1の警報情報収集装置にかかわる別実施形態を示す図である。
【図9】第1の警報情報収集装置にかかわる別実施形態の動作を表す流れ図である。
【図10】本発明にかかわる第2の警報情報収集装置の実施形態を示す図である。
【図11】第2の警報情報収集装置の動作を表す流れ図である。
【図12】第2の警報情報収集装置の動作を説明するタイミング図である。
【図13】追加ポーリングを挿入する動作を説明する図である。
【図14】第2の警報収集装置の別実施形態を示す図である。
【図15】第2の警報情報収集装置の別実施形態の動作を表す流れ図である。
【図16】本発明にかかわる第3の警報情報収集装置の実施形態を示す図である。
【図17】第3の警報情報収集装置の動作を表す流れ図である。
【図18】本発明にかかわる第4の警報情報収集装置の実施形態を示す図である。
【図19】第4の警報情報収集装置の動作を表す流れ図である。
【図20】従来の一般的な警報情報収集装置の構成を示す図である。
【図21】従来の警報情報収集動作を説明するタイミング図である。
【符号の説明】
110 ポーリング制御手段
111 ポーリング実行手段
112 障害検出手段
113 連続挿入手段
121 追加手段
122 追加停止手段
123 割り当て手段
115 項目検出手段
116 タイミング算出手段
117 スケジュール調整手段
124 追加制限手段
125 振替設定手段
118 イベント検出手段
131 従属情報保持手段
132 マスク設定手段
133 マスク解除手段
134 現用情報保持手段
135 スキップ制御手段
210、220、230、240、411 監視制御部
211 警報情報保持部
212 アラーム検出部
214、217 順次制御部
215 挿入制御部
216 カウンタ
222 参照番号算出部
223 アラーム判定部
224 追加指示部
225 カウンタ
231 従属情報保持部
232 マスク制御部
233 解消検出部
234 マスク保持部
235 ポーリング制御部
241 現用情報保持部
242 スキップカウンタ
243 ポーリング制御部
410 警報情報収集装置
412、422 インタフェース制御部(I/F)
420 ユニット
421 ユニット制御部
423 I/Oレジスタ
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to an alarm information collection device that collects information on a plurality of units constituting an apparatus by polling.
[0002]
[Prior art]
FIG. 20 shows a configuration of a conventional general alarm information collecting device.
The alarm information collection device 410 and the plurality of units 420 shown in FIG. 20 are connected via a bus. In the alarm information collecting device 410, the monitoring control unit 411 collects information on the operation state of each unit 420 by sequentially polling each unit 420 connected to the bus, and, if necessary, a computer. Report to the host device such as. At this time, the interface control unit (I / F) 412 transmits a request for the specified unit 420 via the bus according to the instruction from the monitoring control unit 411. On the other hand, when a unit control unit 421 of each unit 420 receives a request for requesting device information via an interface control unit (I / F) 422 provided in the unit, each unit constituting the unit is And collects the device information in the I / O register 423. Thereafter, the unit control unit 421 notifies the interface control unit 422 that the device information has been stored in the I / O register 423. In response, the interface control unit 422 transfers the contents of the I / O register 423 to the bus. To the alarm information collection device 410 via the.
[0003]
In each unit 420 shown in FIG. 20, for example, an output of a detector or the like that detects a line abnormality is held as alarm information in a corresponding latch, and the alarm information is read by the unit control unit 421 of each unit 420. When cleared, it is cleared. By holding in the latch in this manner, regardless of the timing at which the abnormality is detected and the length of the period during which the abnormality has continued, the unit control section 421 reads the alarm information relating to the detected abnormality without fail, and / O register 423. Since each unit 420 is provided with such a configuration, even if a temporary failure such as a temporary line failure occurs, the fact that the failure has occurred can be reliably determined by the interface control unit 422. Is collected by the alarm information collecting device 410 via the.
[0004]
Further, every time the alarm information is collected in this manner, the monitoring control unit 411 provided in the alarm information collecting device 410 rewrites the contents of the alarm information holding unit 413 with the collected alarm information. Therefore, the alarm information indicating that a fault has occurred in each monitoring item is held in the alarm information holding unit 413 until the newly collected corresponding alarm information indicates that the fault condition has been cleared.
[0005]
As described above, when collecting device information by using sequential polling, a technique of changing the polling frequency of a device for which a failure has been reported has been proposed (for example, see Patent Document 1).
[Patent Document 1]
JP-A-1-151847
[0006]
[Problems to be solved by the invention]
By the way, in the general sequential polling as described above, it takes a considerable amount of time to collect device information on each device, so when collecting a large number of device information constituting the system, Inevitably, the polling interval from the time when the device information of a certain unit in the system is collected to the time when the device information is collected next becomes long.
For this reason, the device information collected and held by the alarm information collecting device from each unit may not always match the state of each unit constituting each unit at that time, and moreover, this mismatch may be long. Continues for hours.
[0007]
Hereinafter, the cause of the occurrence of such inconsistency will be described with reference to a timing chart illustrating a conventional alarm information collecting operation shown in FIG.
FIG. 1 )-(A N ) Shows the unit 420 shown in FIG. 1 ~ 420 N Shows the monitoring timing corresponding to. These monitoring timings are generated by the monitoring control unit 411 shown in FIG. 20 based on the clock signal shown in FIG.
[0008]
For example, in the system shown in FIG. 20, as shown in FIG. 1 Immediately after polling at the monitoring timing for this unit 420 1 In the case where a failure has occurred in (2) (indicated by the arrow labeled A in FIG. 21 (c)), regardless of the duration of the failure itself, the corresponding alarm information is held in the corresponding latch provided in the unit. It is maintained as it is until the next monitoring timing (see FIG. 21D). Here, if the above-mentioned fault is a transient one having a very short duration, FIG. 1 In the next monitoring timing indicated by the arrow with the symbol B in ()), the alarm information collecting apparatus firstly outputs the alarm information indicating the occurrence of the fault by polling at this time, even though the fault itself has been resolved. Collect and, at this stage, recognize for the first time that the unit has failed. Then, the alarm information collection device recognizes that the failure in the unit has been resolved by polling at the next monitoring timing (see FIG. 1 )), Indicated by the arrow with the symbol C), and new alarm information is obtained (see FIG. 21 (e)).
[0009]
The difference between the timing of detecting and canceling the alarm information in each unit and the timing of reporting these phenomena to the alarm information collecting device is, of course, proportional to the number of units to be monitored by the alarm information collecting device. Tend to increase. For example, in an alarm information collection device provided in a transmission device of a communication system, a configuration in which dozens of units are collectively monitored is generally used. Therefore, the above-described polling interval may be extended to several hundred ms. is there.
[0010]
On the other hand, a transient failure having a very short duration compared to the polling interval described above, such as a temporary failure of a line connected to the transmission device, is not limited to the transmission device, and is not limited to the transmission device, but in various systems. This is a relatively frequent disorder. Since the magnitude of the difference between the recovery timing of such a transient failure and the timing at which recovery has been reported is a factor that hinders accurate understanding of the occurrence of such a failure, there are various factors. This is an important issue in normal operation of a simple system.
[0011]
The present invention provides an alarm capable of reducing a difference between a timing of generating and canceling alarm information on each monitoring item and a timing of collecting reports on these phenomena when sequentially collecting alarm information on a large number of monitoring items by polling. It is an object to provide an information collecting device.
[0012]
[Means for Solving the Problems]
FIG. 1 shows a principle block diagram of a first alarm information collecting device according to the present invention. The invention of claim 1 is an alarm information having a configuration in which the polling control means 110 controls an operation of collecting alarm information by polling of each monitoring item by the polling execution means 111 based on a schedule relating to monitoring timing of a plurality of monitoring items. In the collection device, the failure detection means 112 for detecting the occurrence of a failure based on the alarm information obtained by polling each monitoring item, and the polling control means 110 are provided each time the occurrence of the failure is detected by the failure detection means 112. Continuous insertion means 113 for adjusting the schedule so as to continuously insert the monitoring timing corresponding to the additional polling for the monitoring item in which the failure is detected to the monitoring timing assigned to the monitoring item in which the failure is detected. It is characterized by having a configuration with .
[0013]
According to the first aspect of the present invention, each time the failure detecting unit 112 detects that a failure has occurred in a certain monitoring item, the continuous insertion unit 113 provided in the polling control unit 110 adds the monitoring item to which the failure has been detected. Subsequent to the assigned monitoring timing, additional polling for the monitoring item is inserted into the schedule. Such insertion of the additional polling is repeated until the alarm information collected as a result of the execution of the additional polling indicates that the fault relating to the relevant monitoring item has been resolved.
[0014]
Therefore, in the first alarm information collection device configured as described above, when a failure related to an arbitrary monitoring item is detected, additional polling can be continuously performed on the monitoring item. For example, it is possible to quickly collect alarm information indicating that a transient failure has been resolved, and report it to a higher-level device.
[0015]
Further, the continuous insertion unit 113 illustrated in FIG. 1 includes an additional unit 121 that adds an additional polling for a corresponding monitoring item to the schedule every time a failure occurrence is detected by the failure detection unit 112, and an additional unit 121 that adds the additional polling to the schedule. When the number of added polls reaches a predetermined number, an additional stop unit 122 for stopping the adding operation by the adding unit may be provided.
[0016]
In the first alarm information collecting apparatus provided with such a continuous insertion unit 113, the additional polling unit continuously inserts an arbitrary monitoring item into the schedule by controlling the operation of the addition unit 121 by the addition stop unit 122. To a predetermined number. Therefore, regardless of whether the fault has been resolved or not, after the additional polling is performed up to the predetermined number, the polling execution unit 111 performs polling for the next monitoring item to be polled in accordance with the order defined in the original schedule. Execute That is, after the additional polling is continuously performed a predetermined number of times for the monitoring item in which the failure has occurred, the normal sequential polling is restarted. As a result, it is possible to limit the extension of the polling interval for other monitoring items caused by inserting additional polling, and to avoid a remarkable decrease in the polling frequency for other monitoring items.
[0017]
On the other hand, in the first alarm information collecting apparatus shown in FIG. 1, the schedule provided in the polling control means 110 is composed of a fixed monitoring timing previously allocated to each monitoring item and an additional allocation to an arbitrary monitoring item. It is formed from a predetermined number of spare timings that are possible and are waiting time when they are not assigned to the monitoring item, and the continuous insertion unit 113 sets a schedule every time the failure detection unit 112 detects the occurrence of the failure. May be assigned as the monitoring timing corresponding to the additional polling for the corresponding monitoring item.
[0018]
In the alarm information collecting device having such a configuration, each time the failure detection unit 112 detects the occurrence of a failure, the allocating unit 123 sets the spare timing included in the schedule in advance for the monitoring item in which the failure is detected. The monitoring timing is assigned, and additional polling is performed at the additionally assigned monitoring timing. This spare timing is a waiting time when it is not assigned to a monitoring item, so even if it is assigned for additional polling for a monitoring item in which a failure is detected, the polling operation for all monitoring items goes through one cycle. The time required to do so does not change. Therefore, regardless of the period during which a failure is detected and the number of monitoring items in which a failure is detected, it is possible to maintain a constant polling interval for monitoring items that are indicated as normal by the alarm information.
[0019]
FIG. 2 shows a principle block diagram of a second alarm information collecting apparatus according to the present invention. The invention according to claim 2 is configured so that the polling control means 110 controls the operation of collecting alarm information by polling of each monitoring item by the polling execution means 111 based on a schedule relating to monitoring timing of a plurality of monitoring items. In the collection device, based on alarm information obtained by polling of each monitoring item, an item detecting unit 115 for detecting a monitoring item in which a failure has occurred, and monitoring of each monitoring item detected by the item detecting unit is performed. Timing calculating means for calculating a position obtained by equally dividing a polling cycle based on the monitoring timing assigned to the item as an additional polling timing, and the polling control means 110 is calculated by the timing calculating means 116 Added to the timing Wherein the-ring is configured to include a schedule adjusting means 117 to be inserted into the schedule.
[0020]
According to the second aspect of the present invention, the item detecting means 115 detects all of the monitoring items which are determined to have failed according to the alarm information collected so far, and determines the timing of performing additional polling for these monitoring items. It is calculated by the timing calculation means 116. The timing calculating means 116 calculates the additional polling timing for each monitoring item in which a failure has been detected so as to be even in the polling cycle for each monitoring item. By inserting the additional polling into the schedule, a plurality of pollings can be executed at substantially equal intervals for the monitored item in one polling cycle.
[0021]
Further, the schedule adjusting means 117 shown in FIG. 2 is provided with an additional limiting means 124 for limiting the number of additional polling inserted into the schedule to a predetermined number in accordance with the calculation result by the timing calculating means 116. May be.
In the alarm information collecting apparatus including the schedule adjusting unit 117 configured as described above, the number of additional polling inserted into the schedule due to the detection of a failure can be limited to a predetermined number. This makes it possible to set a limit on the total number of polling times including additional polling when, for example, a large number of monitoring items have been detected as failures. Unlimited extension of the time required can be prevented. Therefore, regardless of the number of monitoring items in which a failure has been detected, it is possible to collect alarm information at an appropriate frequency for all monitoring items.
[0022]
Further, in the alarm information collecting device shown in FIG. 2, the schedule provided in the polling control means 110 can be fixedly assigned to each monitoring item in advance, and can be additionally assigned to any monitoring item. And a predetermined number of backup timings that become a waiting time when not assigned to a monitoring item, and the schedule adjusting means 117 deletes the backup timing included in the schedule and replaces the corresponding monitoring item with the corresponding monitoring item instead. The transfer setting means 125 may be configured to transfer and set the additional polling to the timing calculated by the timing calculation means 116.
[0023]
In the alarm information collecting apparatus provided with such a transfer setting unit 125, the transfer setting unit 125 monitors the failure detected according to the calculation result by the timing calculation unit 116 instead of the preliminary timing included in the schedule in advance. The monitoring timing for the item is inserted into the schedule, and additional polling for the monitoring item corresponding to the inserted monitoring timing is performed. This spare timing is a waiting time when it is not assigned to a monitoring item, so even if it is assigned for additional polling for a monitoring item in which a failure is detected, the polling operation for all monitoring items goes through one cycle. The time required to do so does not change. Therefore, regardless of the period during which a failure is detected and the number of monitoring items in which a failure is detected, it is possible to maintain a constant polling interval for monitoring items that are indicated as normal by the alarm information.
[0024]
FIG. 3 shows a principle block diagram of a third alarm information collecting apparatus according to the present invention. According to the third aspect of the present invention, there is provided an alarm information having a configuration in which the polling control means controls an operation of collecting alarm information by polling of each monitoring item by the polling executing means based on a schedule relating to monitoring timing of a plurality of monitoring items. The collection device includes an event detection unit 118 that detects a change in an operation state including occurrence of a failure and elimination of the failure based on alarm information obtained by polling each monitoring item. Each time a failure is detected in any of the monitoring items by the event detecting means 118, the dependent information holding means 131 indicating the mutual dependency of the monitoring items is referred to, and the failure is detected. Schedules corresponding to the monitored items The mask setting means 132 for selectively masking the monitoring timing set in the event list, and the monitoring items for which the elimination of the failure has been detected by the event detecting means 118, refer to the dependent information holding means 131, and determine the detected monitoring items. It is characterized by comprising a mask release means 133 for releasing a mask set at a monitoring timing included in a schedule corresponding to a monitoring item determined to be dependent.
[0025]
According to the third aspect of the present invention, when the occurrence of a failure is detected for a certain monitoring item by the event detecting means 118, the mask setting means 132 provided in the polling control means 110 transmits the information stored in the dependent information storing means 131. , The monitoring timing set in the schedule for the monitoring item positioned below this monitoring item is masked. Thereafter, when the event detection unit 118 detects that the above-described failure related to the monitoring item has been resolved, the mask release unit 133 uses the information held in the dependent information holding unit 131 to determine the lower level of this monitoring item. The mask set at the monitoring timing corresponding to the monitoring item positioned in is released. In this way, by masking the monitoring timing of the lower-level alarm information with the occurrence of the higher-level alarm information, in a state where some trouble is detected, the monitoring items are limited to the minimum necessary monitoring items. It is possible to temporarily increase the frequency of executing the polling and collecting the alarm information on the higher-order monitoring item in which the fault has occurred.
[0026]
FIG. 4 shows a principle block diagram of a fourth alarm information collecting device according to the present invention. The invention of claim 4 is an alarm information having a configuration in which the polling control means 110 controls an operation of collecting alarm information by polling of each monitoring item by the polling execution means 111 based on a schedule relating to monitoring timings of a plurality of monitoring items. In the collection device, the polling control unit 110 includes, for all monitoring items, a working information holding unit 134 that holds information indicating whether the system is a working system or a standby system, and information stored in the working information holding unit 134. And a skip control unit 135 for skipping the monitoring timing set in the schedule for the monitoring items belonging to the standby system at a predetermined rate.
[0027]
According to the fourth aspect of the present invention, the monitoring timing set in the schedule corresponding to the monitoring item indicated as the standby system in the active information holding unit 134 is skipped by the skip control unit 135 at a predetermined rate. . For example, if the monitoring timing assigned to each monitoring item belonging to the standby system is skipped once every two monitoring periods, the monitoring information collection operation for all the monitoring items will be performed twice in the alarm information collection operation. The polling frequency of the active system can be made higher than the polling frequency of the standby system, such that polling is performed three times for each monitoring item and once for each standby system.
[0028]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
FIG. 5 shows a first embodiment of the alarm information collecting device according to the present invention.
In addition, among the components shown in FIG. 5, those equivalent to the respective units shown in FIG. 20 are denoted by the same reference numerals as those shown in FIG. 20, and description thereof will be omitted.
[0029]
In the alarm information collecting device illustrated in FIG. 5, the monitoring control unit 210 collects alarm information from the plurality of units 420 via the interface control unit 412, similarly to the monitoring control unit 411 illustrated in FIG.
In the monitoring control unit 210, the alarm information collected from the unit via the interface control unit 412 is held in the alarm information holding unit 211, and the alarm information held in the alarm information holding unit 211 is the same as the conventional one. Then, the report processing unit 213 notifies the higher-level device according to an appropriate procedure. In addition, the above-described alarm information is simultaneously sent to the alarm detection unit 212, and the alarm detection unit 212 detects a change in state, such as occurrence of a failure and elimination thereof.
[0030]
In the monitoring control unit 210 shown in FIG. 5, the sequential control unit 214 outputs an instruction for sequentially designating each unit as a monitoring target in accordance with a predetermined clock signal, as in the related art. On the other hand, the insertion control unit 215 controls the operation of the above-described sequential control unit 214 based on the detection result of the alarm detection unit 212 and the notification from the counter 216, and additionally performs an additional operation on the unit in which the failure is detected. Outputs an instruction to perform polling. The counter 216 shown in FIG. 5 counts the number of times that the insertion control unit 215 outputs the above-described instruction, and notifies the insertion control unit 215 when the count result reaches a predetermined threshold. .
[0031]
Here, the correspondence between each unit shown in FIG. 5 and each unit shown in FIG. 1 will be described.
When the interface control unit 412 shown in FIG. 5 operates according to the instruction from the monitoring control unit 210, the function of the polling execution unit 111 shown in FIG. 1 is performed. 1. The alarm detection unit 212 shown in FIG. 5 corresponds to the failure detection unit 112 shown in FIG. Similarly, the insertion control unit 215 illustrated in FIG. 5 corresponds to the adding unit 121 illustrated in FIG. On the other hand, when the insertion control unit 215 operates in response to the notification from the counter 216 shown in FIG. 5, the function of the additional stop unit 122 shown in FIG. 1 is performed. Therefore, in FIG. 5, the function of the continuous insertion unit 114 shown in FIG. 1 is performed by the insertion control unit 215 and the counter 216. Note that the schedule shown in FIG. 1 corresponds to the procedure for defining the operation of the sequential control unit 214 shown in FIG.
[0032]
Next, the operation of the first alarm information collecting device shown in FIG. 5 will be described.
FIG. 6 is a flowchart showing the operation of the first alarm information collecting device. FIG. 7 is a timing chart illustrating the operation of the first alarm information collection device.
[0033]
At the beginning of each monitoring cycle, the sequential control unit 214 shown in FIG. 5 sets an initial value (for example, a numerical value “1”) to the monitoring number i indicating the unit to be monitored in step 301 shown in FIG. Further, the insertion control unit 215 sets an initial value of the count (for example, a numerical value “1”) in the counter 216. Next, the sequential control unit 214 illustrated in FIG. 5 designates the i-th unit 420 indicated by the monitoring number i, instructs the interface control unit 412 to request alarm information, and responds to this instruction. The interface control unit 412 performs polling for the ith unit 420i described above (step 302).
[0034]
If the alarm information collected in step 302 indicates that no failure has occurred in the i-th unit 420 (negative determination in step 303), the control unit 214 proceeds to step 304 and sequentially proceeds to step 304. Increment i. Next, the sequential control unit 214 determines whether or not the incremented monitoring number i exceeds the total number N of units to be monitored (step 305). If the determination in step 305 is negative, the process proceeds to step 302. Proceed to collect alarm information for the next unit.
[0035]
As described above, in the state where the failure is not detected by the alarm detecting unit 212, the reference numeral (a) in FIG. 1 )-(A N At the monitoring timing corresponding to each unit indicated by (), alarm information on each unit 420 is collected. In FIG. 7, FIG. 7B shows an internal clock signal used for generating the monitoring timing in the sequential control unit 214 and the insertion control unit 215.
[0036]
When the monitoring operation for all the units has completed one cycle in this way, the affirmative determination in step 305 described above is made, and the control unit 214 sequentially determines that one monitoring cycle has been completed, and proceeds to step 301 to perform new monitoring. Start monitoring and control related to the cycle.
By the way, for example, the unit 420 1 After the monitoring timing corresponding to 1 If a failure occurs in ( 1 ) And (c)), this unit 420 in the next monitoring period 1 For the first time at the monitoring timing corresponding to 1 Detects that a failure has occurred.
[0037]
In this case, an affirmative determination is made in step 303 shown in FIG. 1 ) To request the alarm information, and in response to this instruction, the interface control unit 412 1 Is polled to collect alarm information on this unit (step 306).
[0038]
As shown in FIG. 1 If the trouble that has occurred in is already resolved at the stage when it is detected by the alarm detection unit 212 (see FIGS. 7C and 7D), as described above, this unit 420 1 The alert information obtained from the additional polling for indicates that the fault has been resolved.
[0039]
As described above, when the alarm information obtained by the additional polling indicates that the fault has been recovered (the affirmative determination in step 307 shown in FIG. 6), the insertion control unit 215 completes the additional polling insertion process. Then, the control is sequentially passed to the control unit 214, and the sequence control unit 214 proceeds to step 304 and restarts the polling operation sequentially.
[0040]
On the other hand, in the case of a negative determination in step 307, the insertion control unit 215 determines that insertion of additional polling is still necessary. In this case, after instructing the counter 216 to increment the number of insertions k in step 308, the insertion control unit 215 determines whether or not the number of insertions k indicated by the count value of the counter 216 exceeds the upper limit M. (Step 309) In the case of a negative determination, the process returns to Step 306 to execute new additional polling. On the other hand, in the case of an affirmative determination in step 309, the insertion control unit 215 ends the additional polling insertion process, and sequentially passes control to the control unit 214, as in the case of the affirmative determination in step 307 described above.
[0041]
In the first alarm information collecting device shown in FIG. 5, as described above, when the occurrence of a failure in a unit is detected at the monitoring timing corresponding to the unit, the unit is continuously connected to the unit. Perform additional polling. Therefore, it is possible to quickly collect alarm information indicating that a fault that has occurred in any unit has been resolved, and to reduce the difference between the timing at which the alarm information for each unit changes and the timing at which reports on these phenomena are collected. it can. As a result, it is possible to reduce the difference between the failure occurrence status of each unit and the failure occurrence status indicated by the alarm information collected by the alarm information collection device.
[0042]
For example, an alarm indicating a temporary failure such as a temporary disconnection of a line shortens a period in which the alarm is held in the alarm information holding unit 211 provided in the alarm information collection device, and the above-described temporary Since it is possible to approach the period in which the failure actually occurs, it is possible to more accurately grasp the state of the unit to be monitored.
[0043]
Also, as shown in steps 306 to 309 in FIG. 6, the insertion control unit 215 sets an upper limit on the number of additional polls to be inserted in one monitoring period, and controls the number of additional polls. Is prevented from increasing excessively.
Of course, it is also possible to adopt a configuration in which the insertion control unit 215 inserts additional polling indefinitely according to the detection result by the alarm detection unit 212.
[0044]
Next, a method for maintaining a constant monitoring cycle regardless of insertion of additional polling will be described.
FIG. 8 shows another embodiment related to the first alarm information collecting device.
In addition, in each unit illustrated in FIG. 8, the same components as those illustrated in FIG. 5 are denoted by the same reference numerals, and description thereof is omitted.
[0045]
In the alarm information collection device shown in FIG. 8, the sequential control unit 217 controls the sequential polling operation in consideration of the number of times of additional polling insertion indicated by the count value of the counter 216.
In this case, the insertion control unit 215 and the sequential control unit 217 perform the insertion of the additional polling and the control of the sequential polling operation in accordance with the count value of the counter 216 shown in FIG. The function of the means 123 is performed.
[0046]
FIG. 9 is a flowchart showing an operation of another embodiment related to the first alarm information collecting device.
Note that among the steps shown in FIG. 9, those equivalent to the steps shown in FIG. 6 are denoted by the same reference numerals, and description thereof will be omitted.
In the flowchart shown in FIG. 9, in response to an affirmative determination in step 305, step 312 is executed instead of returning to step 301.
[0047]
In step 312, the sequential control unit 217 determines whether the value of the sum of the monitoring number i and the number of insertions k indicated by the count value of the counter 216 exceeds the value of the sum of the total number N of units and the upper limit M of the number of insertions. It is determined whether or not the monitoring cycle has elapsed based on whether or not.
Therefore, when no fault is detected for any unit, the time corresponding to the upper limit M of the number of insertions becomes the waiting time for the polling operation sequentially. On the other hand, when the additional polling is inserted by the insertion control unit 215, every time the additional polling is inserted, a part of the waiting time provided in the schedule is deleted. This is equivalent to assigning the preliminary timing provided in the schedule to additional polling.
[0048]
In this way, by executing additional polling within the waiting time range set in advance in the schedule, the alarm information indicating that the fault that has occurred in any unit has been eliminated can be quickly performed while maintaining the monitoring cycle constant. And the timing at which the alarm information about each unit changes and the timing at which reports on these phenomena are collected can be reduced.
[0049]
Next, a method of equally inserting additional polling within a polling cycle for a monitoring item indicating that a failure has occurred will be described.
FIG. 10 shows an embodiment of a second alarm information collecting device according to the present invention.
Note that among the components illustrated in FIG. 10, components equivalent to the respective portions illustrated in FIG. 5 are denoted by the reference numerals illustrated in FIG. 5, and description thereof will be omitted.
[0050]
In the monitoring control unit 220 provided in the alarm information collection device shown in FIG. 10, the sequential control unit 221 issues an instruction for sequentially designating each unit as a monitoring target according to a predetermined clock signal as in the related art. In addition to the output, the monitoring number i indicating the unit designated as the monitoring target is notified to the reference number calculating unit 222. The reference number calculation unit 222 calculates the expression (1) regarding the notified monitoring number i, the division number m indicating the number of divisions of the monitoring period, the phase x indicating the position in the divided monitoring period, and the total number N of units. Then, the alarm information holding unit 211 calculates a reference number j indicating a unit to which the occurrence of an alarm is to be referred, and transfers the reference number j to the alarm determination unit 223.
[0051]
j = mod (N, i + (mx) N / m) (1)
Further, the alarm determination unit 223 illustrated in FIG. 10 refers to the alarm information held in the alarm information holding unit 211 corresponding to the unit indicated by the notified reference number j, and a failure occurs in the corresponding unit. Is determined. The determination result by the alarm determination unit 223 is notified to the sequential control unit 221 and the addition instruction unit 224, and the sequential control unit 221 and the addition instruction unit 224 respectively perform processing to be described later according to the notified determination result.
[0052]
Here, the correspondence between each unit shown in FIG. 10 and each unit shown in FIG. 2 will be described.
When the interface control unit 412 shown in FIG. 10 operates according to the instruction from the monitoring control unit 220, the function of the polling execution unit 111 shown in FIG. 1 is performed. The alarm information holding unit 211 and the alarm determination unit 223 illustrated in FIG. 10 correspond to the item detection unit 115 illustrated in FIG. 2, and the reference number calculation unit 222 illustrated in FIG. It corresponds to the calculating means 116. Also, the function of the schedule adjustment unit 117 shown in FIG. 2 is performed by the addition instruction unit 224 shown in FIG. 10 outputting an instruction for additional polling according to the determination result by the alarm determination unit 223.
[0053]
Hereinafter, the operation of the second alarm information collection device shown in FIG. 10 will be described.
FIG. 11 is a flowchart showing the operation of the second alarm information collecting device. FIG. 12 is a timing chart illustrating the operation of the second alarm information collection device.
[0054]
When the collection of the alarm information is started, the control unit 221 sequentially sets the initial value “1” to the monitoring number i, and the reference number calculating unit 222 sets the initial value “1” to the phase x ( Step 321).
In step 322, the sequential control unit 221 outputs an instruction to perform polling by specifying the monitoring number i, and in response, the interface control unit 412 causes the unit 420 i Polling for. The alarm information obtained at this time is held in the alarm information holding unit 211.
[0055]
Next, the reference number calculation unit 222 calculates the reference number j according to the above-described equation (1) (step 323), and the alarm determination unit 223 determines the unit 420 indicated by the reference number j. j With reference to the alarm information held in the alarm information holding unit 211 corresponding to (step 324), it is determined whether or not the alarm information indicates an alarm state in which a failure has occurred (step 325).
[0056]
For example, assuming that the number of divisions m = 2 and the total number of units N = 10, as shown in FIG. 7 At the time of polling for, in step 323 described above, the reference number calculation unit 222 calculates the unit 420 2 Is obtained (see FIG. 12D). Here, in the example shown in FIG. 2 Unit 420 shown in) 2 At the time of polling, the alarm information indicating the ongoing failure at this point is collected (see FIG. 12E), and the alarm information is already held in the alarm information holding unit 211.
[0057]
Therefore, in this case, the alarm determination unit 223 refers to the alarm information holding unit 211 based on the reference number “2”, and thereby, 2 Since the alarm information indicating that a fault has occurred is obtained, it is determined based on this that the unit indicated by the reference number is in the alarm state.
[0058]
As described above, when the alarm determining unit 223 determines that the state is the alarm state (the affirmative determination in step 325), the control unit 221 temporarily stops the operation, and instead, the addition instructing unit 224 performs the above-described operation. And outputs an instruction to perform polling by designating the reference number j. In response to this, the interface control unit 412 causes the unit 420 j Is polled (step 326).
[0059]
In this way, as shown in FIG. 12, the unit 420 corresponding to the monitoring number "2" 2 An additional poll for can be inserted. Along with this additional polling, as shown in FIG. 2 Can be facilitated.
[0060]
Here, FIG. 1 )-(A 10 ), Unit 420 1 ~ 420 10 FIG. 12 (b) shows a monitoring signal obtained by adding the additional polling to the sequential polling, and FIG. 12 (b) shows a clock signal defining the operation of the sequential controller 221 and the additional instructing unit 224. FIG. 12C shows monitoring numbers, and FIG. 12D shows a series of reference numbers. 13 (e), (f) and (g) show the unit 420. 2 The fault detection signal, the latch signal, and the collected alarm information were collected. It should be noted that the monitoring numbers and reference numbers shown in FIGS. 10 Is indicated by the symbol A.
[0061]
After inserting the additional polling as described above, the addition instruction unit 224 determines whether or not the calculation of the reference numbers has been completed for all the phases obtained by dividing one monitoring cycle by the division number m ( Step 327). In the case of a negative determination in step 327, the addition instruction unit 224 increments the phase x (step 328), and returns to step 323. In response, the reference number calculation unit 222 determines the reference number in the next phase. j is calculated.
[0062]
On the other hand, in the case of an affirmative determination in step 327, the addition instructing unit 224 determines that processing for all reference numbers corresponding to the monitoring number i has been completed, ends the additional polling insertion processing, and sequentially proceeds to the control unit. Control is passed to 221. In response, the control unit 221 sequentially increments the monitoring number i (step 329), sets an initial value for the phase x (step 330), returns to step 322, and returns to the next step indicated by the monitoring number i. The process of collecting the alarm information for the unit is restarted.
[0063]
In the example shown in FIG. 12, additional polling inserted as described above causes 2 Are already cleared, the monitoring number is incremented with the restart of the sequential polling operation by the sequential control unit 221, and the unit 420 is reset again. 2 Is executed, alarm information indicating that the fault has been resolved is obtained, and the contents of the alarm information holding unit 211 are updated based on the alarm information.
[0064]
In this way, the reference number with the phase shifted is calculated by the reference number calculating unit 222 with respect to the monitoring number sequentially incremented by the control unit 221, and the additional polling is inserted based on the reference number, so that a failure occurs. For each detected unit, the number of additional polls corresponding to the number of divisions can be equally inserted in one monitoring cycle.
[0065]
FIG. 13 shows an example in which, when the number of divisions m = 3 and the total number of units N = 10, additional polling is inserted for the units indicated by the monitoring numbers 4 and 7. FIG. 13 (a) 4 ), (A 7 ), Unit 420 4 , 420 7 FIG. 13B shows a clock signal that defines the operation of the sequential control unit 221 and the addition instruction unit 224. FIG. Further, FIG. 13C shows monitoring numbers, and FIGS. 13D and 13E show sequences of reference numbers having different phases. 13 (f), (g) and (h) show the unit 420. 4 13 (i), (j) and (k) show a failure detection signal, a latch signal and collected alarm information in FIG. 7 3 shows the failure detection signal, the latch signal, and the collected alarm information.
[0066]
As described above, in the second alarm information collection device shown in FIG. 10, even when monitoring a group of units in which a failure having a relatively long duration is likely to occur, a failure that has occurred in any unit is not affected. Alarm information indicating that the alarm has been resolved can be quickly collected, and the difference between the timing at which the alarm information of each unit changes and the timing at which reports on these phenomena are collected can be reduced. As a result, it is possible to reduce the difference between the failure occurrence status of each unit and the failure occurrence status indicated by the alarm information collected by the alarm information collection device.
[0067]
Further, the number of additional polls inserted during one cycle of the monitoring number can be limited.
FIG. 14 shows another embodiment of the second alarm information collecting device according to the present invention.
Note that among the components shown in FIG. 14, the same components as those shown in FIG. 10 are denoted by the same reference numerals as those in FIG. 10, and description thereof will be omitted.
[0068]
The monitoring control unit 220 illustrated in FIG. 14 includes a counter 225 in addition to the components illustrated in FIG. The counter 225 counts the number of times the addition instruction unit 224 has output an instruction for performing additional polling. 224, and stops the insertion operation of the additional polling by the reference number calculation unit 222 and the addition instruction unit 224.
[0069]
In this manner, the reference number calculation unit 222 and the addition instruction unit 224 stop the insertion operation of the additional polling in accordance with the count value of the counter 225 illustrated in FIG. The function of the additional restriction means 124 is performed.
FIG. 15 is a flowchart showing the operation of another embodiment of the second alarm information collecting device shown in FIG.
[0070]
In step 331 shown in FIG. 15, the sequential control unit 221 sets the count value of the counter 225 to an initial value “0” together with the initialization processing similar to step 321 shown in FIG. 11.
On the other hand, before calculating the reference number, the reference number calculation unit 222 compares the number of insertions k with the upper limit c of the number of insertions, and if the number of insertions k has not reached the upper limit (negative determination in step 332), Proceeding to step 323, a reference number is calculated. On the other hand, in the case of an affirmative determination in step 332, the reference number calculation unit 222 determines that additional polling cannot be inserted any more, and sequentially passes control to the control unit 221. In this case, the control unit 221 proceeds to step 334 as shown by the terminal denoted by the symbol A in FIG. 15, and increments the monitoring number i and initializes the phase x. Thereafter, the control unit 221 sequentially determines whether or not the monitoring number i has exceeded the total number N of units in step 335, and if the determination in step 335 is negative, the process proceeds to step 322 and the next step indicated by the monitoring number i Collects alarm information on units. On the other hand, in the case of an affirmative determination in step 335, the control unit 221 sequentially determines that the monitoring number i has completed one cycle, proceeds to step 331 to perform initialization processing, and starts processing of a new monitoring cycle.
[0071]
As described above, in another embodiment of the second alarm information collection device shown in FIG. 14, the reference number calculation unit 222 and the alarm determination unit 222 determine only when the count value of the counter 225 reaches the upper limit c of the number of insertions. The insertion of the additional polling by the unit 223 and the additional instruction unit 224 prevents the monitoring period from being extremely increased due to the insertion of the additional polling.
[0072]
Further, it is also possible to perform processing corresponding to step 311 shown in FIG. 9 in response to an affirmative determination in step 335, and to assign a waiting time previously set in the polling schedule to additional polling.
Next, a description will be given of a method of shortening the monitoring interval for the main alarm information by utilizing the mutual dependency of the alarm information.
[0073]
FIG. 16 shows an embodiment of a third alarm information collecting device according to the present invention.
Note that among the components shown in FIG. 16, those equivalent to the respective units shown in FIG. 20 or FIG. 5 are denoted by the reference numerals shown in FIG. 20 or FIG. 5, and description thereof will be omitted.
[0074]
In the monitoring control unit 230 illustrated in FIG. 16, the dependent information holding unit 231 holds information indicating the mutual dependency of the alarm information corresponding to each unit 420. In FIG. 16, the alarm information input via the interface control unit 412 has been input to the cancellation detection unit 233 together with the alarm detection unit 212. Based on the newly received alarm information and the corresponding alarm information held in the alarm information holding unit 211, the cancellation detection unit 233 detects that the fault in the corresponding unit has been eliminated, and masks the detection result with mask control. Notify unit 232. The mask control unit 232 illustrated in FIG. 16 sends the mask information to the mask storage unit 234 based on the information stored in the above-described dependent information storage unit 231 and the detection result notified from the alarm detection unit 212 and the cancellation detection unit 233. An appropriate value is set to a mask flag provided corresponding to the unit. The polling control unit 235 illustrated in FIG. 16 refers to the above-described mask holding unit 234 for each monitoring number sequentially generated in the polling control unit 235, and according to the value of the mask flag corresponding to the monitoring number, An appropriate instruction is sent to the interface control unit 412.
[0075]
Here, the correspondence between each unit shown in FIG. 16 and each unit shown in FIG. 3 will be described.
When the interface control unit 412 shown in FIG. 16 operates according to the instruction from the monitoring control unit 230, the function of the polling execution unit 111 shown in FIG. 3 is performed. Further, the alarm information holding unit 211, the alarm detection unit 212, and the cancellation detection unit 233 illustrated in FIG. 16 correspond to the event detection unit 118 illustrated in FIG. 3, and the dependent information storage unit 231 illustrated in FIG. 3 corresponds to the dependent information holding means 131 shown in FIG. In addition, the polling control unit 235 controls the operation of outputting an instruction for performing polling as described later by the polling control unit 235 according to the information set in the mask holding unit 234 by the mask control unit 232 illustrated in FIG. The functions of the mask setting means 132 and the mask releasing means 133 shown are fulfilled.
[0076]
Next, the operation of the third alarm information collecting device shown in FIG. 16 will be described.
FIG. 17 is a flowchart showing the operation of the third alarm information collecting device.
The polling control unit 235 illustrated in FIG. 16 sets an initial value “1” to the monitoring number i at the beginning of each monitoring cycle (Step 341). Next, the polling control unit 235 refers to the mask flag held in the mask holding unit 234 corresponding to the monitoring number i, and determines whether the alarm information corresponding to the monitoring number i is masked (step 342).
[0077]
In the case of a negative determination in step 342, the polling control unit 235 specifies the monitoring number i, and inputs an instruction to perform polling to the unit 420 indicated by the monitoring number i to the interface control unit 412. In response, the interface control unit 412 polls the above-described unit 420 to collect alarm information (step 343).
[0078]
As described above, the polling control unit 235 performs polling in accordance with the value of the mask flag held in the mask holding unit 234, so that the corresponding alarm information is output by the mask flag received in the mask holding unit 234. Polling can be performed only for alarm information indicating that no masking is performed.
[0079]
The alarm information collected in step 343 is held in the alarm information holding unit 211 and passed to the alarm detection unit 212 and the cancellation detection unit 233.
At this time, when the occurrence of a failure is detected by the alarm detection unit 212 (the affirmative determination in step 344), the mask control unit 232 refers to the dependent information storage unit 231 and may depend on the monitoring number i. The indicated alarm information is searched (step 345), and then the corresponding alarm information is masked in the mask flag provided in the mask holding unit 234 corresponding to the alarm information indicated by the search result in step 345. The value of the effect is set (step 346).
[0080]
In this way, a value indicating that each alarm information is masked is set in the mask flag provided in the mask holding unit 234 in accordance with the alarm information dependent on the alarm information detected that the failure has occurred. In the subsequent processing, these pieces of alarm information can be excluded from monitoring targets. As a result, it is possible to collect, at a relatively high frequency, main alarm information that has been detected as having a failure, so that warning information indicating that the failure has been resolved can be quickly collected, and an alarm relating to the corresponding unit can be collected. The difference between the timing at which the information has changed and the timing at which reports on these phenomena are collected can be reduced. As a result, it is possible to reduce the difference between the failure occurrence status of each unit and the failure occurrence status indicated by the alarm information collected by the alarm information collection device. This change in the alarm information can be quickly grasped.
[0081]
On the other hand, when the alarm information collected in step 343 indicates that no failure has occurred (negative determination in step 344), the alarm information holding unit 211 When the occurrence of a failure is indicated by the held alarm information, the elimination detection unit 233 detects the elimination of the failure related to the corresponding alarm information (step 347). In this case, the mask control unit 232 refers to the dependent information holding unit 231 to search for alarm information indicated to be dependent on the monitoring number i (step 348), and then displays the alarm information in the search result in step 348. The mask flag provided in the mask holding unit 234 is cleared in accordance with the set alarm information, and the mask set in the corresponding alarm information is released (step 349).
[0082]
In this way, when the elimination of the corresponding fault is indicated by the main alarm information, the masking of the alarm information dependent on the alarm information can be released, and the alarm information can be returned to the monitoring target. .
On the other hand, after completion of the mask setting process (steps 345 and 346) or the mask release process (steps 348 and 349), the mask control unit 232 returns the process to the polling control unit 235, and accordingly, the polling control unit 235 Determines whether the polling process for the monitoring target has completed one cycle based on the comparison result of the monitoring number i and the total number N of the monitoring targets (step 350). When the monitoring number i has not reached the total number N (negative determination in step 350), the polling control unit 235 increments the monitoring number i (step 351), returns to step 342, and corresponds to the new monitoring number. Continue polling. On the other hand, in the case of an affirmative determination in step 350, the polling control unit 235 returns to step 341 to initialize the monitoring number i, and starts processing relating to a new monitoring cycle.
[0083]
The feature of the third alarm information collecting device shown in FIG. 16 is that the monitoring target is narrowed down when a fault occurs. This feature is particularly important depending on some main alarm information. This is effective when the large number of subordinate alarm information changes according to the change of the main alarm information described above. In the case where the alarm information has a hierarchical structure as described above, when a failure corresponding to the main alarm information occurs, the lower-level alarm information also indicates the occurrence of the failure. By removing the subordinate alarm information from the monitoring target, it is considered that the substantial amount of the collected information does not change.
[0084]
Next, a description will be given of an alarm information collection device that is effective in a duplex system.
FIG. 18 shows an embodiment of a fourth alarm information collecting device according to the present invention.
Note that among the constituent elements shown in FIG. 18, the same components as those shown in FIG. 5 or FIG. 20 are denoted by the same reference numerals shown in FIG. 5 or FIG. 20, and the description thereof is omitted.
[0085]
The alarm information collecting device shown in FIG. In the monitoring control unit 240, the active information holding unit 241 receives information indicating whether each unit 420 belongs to the active system or the standby system from a higher-level device (not shown), and It is held corresponding to the unit 420. Also, the skip counter 242 shown in FIG. 18 counts the number of times that the polling control unit 243 skips polling, which will be described later, for each unit, and notifies the polling control unit 243 of the counting result. Based on the skip count corresponding to each unit obtained by the skip counter 242 and the information held in the working information holding unit 241 described above, the polling control unit 243 issues an instruction to execute polling to each unit 420. Is performed, or a skip operation is performed to shift to processing for the next unit without outputting an instruction for polling.
[0086]
Here, the correspondence relationship between each unit shown in FIG. 18 and each unit shown in FIG. 4 will be described.
When the interface control unit 412 shown in FIG. 18 operates according to the instruction from the monitoring control unit 240, the function of the polling execution unit 111 shown in FIG. 4 is performed. The active information holding unit 241 illustrated in FIG. 18 corresponds to the active information holding unit 134 illustrated in FIG. The skip counter 242 and the polling control unit 243 shown in FIG. 18 correspond to the skip control unit 135 shown in FIG.
[0087]
Next, the operation of the alarm information collecting device shown in FIG. 18 will be described.
FIG. 19 is a flowchart showing the operation of the fourth alarm information collecting device.
Prior to starting the alarm information collecting operation shown in FIG. 19, the polling control unit 243 shown in FIG. 18 sets the count value corresponding to each unit 420 of the skip counter 242 to an initial value (for example, a numerical value “0”). ) Is set.
[0088]
When starting each monitoring cycle, the polling control unit 243 sets an initial value (for example, a numerical value “1”) to the monitoring number i indicating the unit to be monitored (step 361). Next, the polling control unit 243 determines whether switching between the active system and the standby system has been performed based on the notification from the higher-level device (step 362), and is notified that the switching has occurred. In this case (Yes in step 362), the count value corresponding to each unit 420 of the skip counter 242 is initialized (step 363), and the process proceeds to step 364. On the other hand, in the case of a negative determination in step 362, the process proceeds to step 364 as it is.
[0089]
In step 364, the polling control unit 243 refers to the active information holding unit 241 and refers to the unit 420 indicated by the monitoring number i. i It is determined whether or not belongs to the active system.
For example, the unit 420 indicated by the monitoring number i i Is indicated by the information held in the active information holding unit 241, the polling control unit 243 makes an affirmative determination in step 364, and performs monitoring via the interface control unit 412. Unit 420 indicated by number i i (Step 365). Next, the polling control unit 243 increments the monitoring number i (step 366), and thereafter determines whether the monitoring number i has reached the total number N of units (step 367).
[0090]
If the monitoring number i after the increment is less than the total number n of units, the polling control unit 243 returns to step 362 as a negative determination in step 367, and performs monitoring processing for the next monitoring number.
On the other hand, based on the information held in the active information holding unit 241 corresponding to the monitoring number i, the corresponding unit 420 i , The polling control unit 243 proceeds to step 368 as a negative determination in step 364 and proceeds to step 420. i It is determined whether or not the count value of the skip counter 242 corresponding to is smaller than the upper limit value d of the skip count.
[0091]
Unit 420 i When the count value of the skip counter 242 corresponding to the above is less than the above-described upper limit value d (affirmative determination in step 368), the polling control unit 243 sets the unit 420 indicated by the monitoring number i. i Skip polling for. At this time, the polling control unit 243 instructs the skip counter 242 to add the corresponding system value, and accordingly, the skip counter 242 sets the unit 420 i Is incremented (step 369).
[0092]
On the other hand, unit 420 i When the count value of the skip counter 242 corresponding to the above has reached the above-described upper limit value d (negative determination in step 368), the polling control unit 243 determines that the polling for the corresponding unit has already been skipped a sufficient number of times. Then, polling is performed for the corresponding unit via the interface control unit 412, and alarm information is collected (step 370). Next, the polling control unit 243 instructs the skip counter 242 to clear the corresponding count value, and the unit 420 corresponding to the monitoring number i. i Initialize the skip count for
[0093]
After the end of the processing of step 371 and the end of the processing of step 369 described above, the polling control section 243 proceeds to step 366 and prepares for the processing corresponding to the next monitoring number.
In the above example, if the upper limit value of the number of skips is d = 3, the polling of the unit 420 belonging to the standby system is skipped in the first to third monitoring periods, and the unit 420 belonging to the active system is skipped. Are polled, and in the fourth monitoring cycle, polling is performed on all the units 420.
[0094]
As described above, according to the fourth alarm information collecting apparatus, the alarm information on the unit 420 belonging to the active system can be collected more frequently than the alarm information corresponding to the unit belonging to the standby system.
Here, in the duplicated system, the probability of a change in the alarm information regarding the unit 420 belonging to the active system in operation is much higher than the probability of a change in the alarm information regarding the unit 420 belonging to the standby system. It is considered to be large. Therefore, as described above, the alarm information relating to the unit 420 belonging to the active system is more than the disadvantage of skipping the operation of collecting the alarm information relating to the unit 420 belonging to the standby system, thereby overlooking the change in the alarm information relating to the unit 420 belonging to the standby system. The effect obtained by increasing the frequency with which information is collected is likely to be much greater.
[0095]
Further, for the standby system, the collection of alarm information can be completely skipped. In this case, in the case of a negative determination in step 364 shown in FIG. 19, the polling control unit 243 proceeds to step 366 and prepares for the process corresponding to the next monitoring number.
With respect to the above description, the following items are further disclosed.
[0096]
(Supplementary Note 1) In an alarm information collecting apparatus configured to control an operation in which a polling control unit 110 collects alarm information by polling of each monitoring item by a polling execution unit 111 based on a schedule regarding monitoring timings of a plurality of monitoring items. ,
Failure detection means 112 for detecting the occurrence of a failure based on alarm information obtained by polling each monitoring item;
Each time the failure detection unit 112 detects the occurrence of a failure, the polling control unit 110 sets a monitoring timing corresponding to the additional polling for the monitoring item in which the failure is detected, to a monitoring timing assigned to the monitoring item in which the failure is detected. The configuration includes a continuous insertion unit 113 that performs adjustment for continuous insertion at a timing with respect to a schedule.
An alarm information collecting device, characterized in that:
[0097]
(Supplementary Note 2) In the alarm information collection device described in Supplementary Note 1,
The continuous insertion means 113
An adding unit 121 for adding an additional polling for a corresponding monitoring item to a schedule every time the occurrence of a failure is detected by the failure detecting unit 112;
When the number of additional polls added by the adding unit 121 reaches a predetermined number, an additional stopping unit 122 for stopping the adding operation by the adding unit is provided.
An alarm information collecting device, characterized in that:
[0098]
(Supplementary Note 3) In the alarm information collection device described in Supplementary Note 1,
The schedule provided in the polling control means 110 has a fixed monitoring timing assigned in advance to each monitoring item, and a waiting time when it is not assigned to any monitoring item that can be additionally assigned to any monitoring item. Formed from a predetermined number of preliminary timings,
Each time the failure detecting unit 112 detects the occurrence of a failure, the continuous insertion unit 113 assigns the spare timing included in the schedule as the monitoring timing corresponding to the additional polling for the corresponding monitoring item. It is a configuration with
An alarm information collecting device, characterized in that:
[0099]
(Supplementary Note 4) An alarm information collecting apparatus configured to control an operation in which a polling control unit 110 collects alarm information by polling of each monitoring item by a polling execution unit 111 based on a schedule regarding monitoring timings of a plurality of monitoring items. ,
Item detection means 115 for detecting a monitoring item in which a failure has occurred based on alarm information obtained by polling for each monitoring item;
A timing calculating means for calculating a position obtained by equally dividing a polling cycle based on the monitoring timing assigned to the monitoring item for each monitoring item detected by the item detecting means as an additional polling timing; Prepare,
The polling control unit 110 includes a schedule adjustment unit 117 that inserts additional polling into the schedule at the timing calculated by the timing calculation unit 116.
An alarm information collecting device, characterized in that:
[0100]
(Supplementary Note 5) In the alarm information collection device described in Supplementary Note 4,
The schedule adjusting unit 117 is configured to include an additional limiting unit 124 that limits the number of additional polling inserted into the schedule to a predetermined number in accordance with the calculation result of the timing calculating unit 116.
An alarm information collecting device, characterized in that:
[0101]
(Supplementary Note 6) In the alarm information collection device described in Supplementary Note 4,
The schedule provided in the polling control means 110 has a fixed monitoring timing assigned in advance to each monitoring item, and a waiting time when it is not assigned to any monitoring item that can be additionally assigned to any monitoring item. Formed from a predetermined number of preliminary timings,
The schedule adjusting unit 117 includes a transfer setting unit 125 that deletes the preliminary timing included in the schedule and replaces the additional polling for the corresponding monitoring item with the timing calculated by the timing calculating unit 116 and sets the polling. Configuration
An alarm information collecting device, characterized in that:
[0102]
(Supplementary Note 7) In an alarm information collecting apparatus configured to control an operation in which a polling control unit 110 collects alarm information by polling of each monitoring item by a polling execution unit 111 based on a schedule regarding monitoring timings of a plurality of monitoring items. ,
An event detecting unit 118 that detects a change in an operation state including occurrence of a failure and elimination of the failure based on alarm information obtained by polling each monitoring item;
Polling control means 110
For each of the monitoring items, each time the occurrence of a failure in any one of the monitoring items is detected by the event detecting unit 118, the dependent information holding unit 131 refers to the dependent information holding unit 131 indicating the mutual dependency relationship. Mask setting means 132 for selectively masking the monitoring timing set in the schedule corresponding to the monitoring item determined to be dependent on the detected monitoring item;
With respect to the monitoring item whose failure has been resolved by the event detecting means 118, the monitoring information is set to the monitoring timing included in the schedule corresponding to the monitoring item determined to be dependent on the detected monitoring item with reference to the dependent information holding means 131. And a mask releasing means 133 for releasing the mask.
An alarm information collecting device, characterized in that:
[0103]
(Supplementary Note 8) In an alarm information collecting apparatus configured to control an operation in which a polling control unit 110 collects alarm information by polling of each monitoring item by a polling execution unit 111 based on a schedule regarding monitoring timing of a plurality of monitoring items. ,
Polling control means 110
Working information holding means 134 for holding information indicating whether the system is a working system or a standby system for all monitoring items;
A skip control unit 135 for skipping a monitoring timing set in a schedule for a monitoring item belonging to the standby system at a predetermined rate based on the information held in the working information holding unit 134.
An alarm information collecting device, characterized in that:
[0104]
【The invention's effect】
As described above, according to the first alarm information collection device according to the present invention, it is possible to continuously execute polling for a monitoring item indicating that a failure has occurred by alarm information. With the elimination of the failure in the monitoring item, it is possible to quickly collect alarm information indicating that. Thereby, especially in a system including a monitoring item in which a failure having a short duration is highly likely to occur, it is possible to reduce the difference between the timing at which the failure is resolved and the timing at which alarm information is collected.
[0105]
Further, according to the second alarm information collection device according to the present invention, it is possible to execute a plurality of polling evenly within one monitoring period for a monitoring item indicated by the alarm information that a failure has occurred. Therefore, in a system including a monitoring item in which a failure having a relatively long duration is highly likely to occur, alarm information indicating the elimination of the failure in the monitoring item is efficiently collected, and the timing at which the failure is resolved and the timing related to the It is possible to reduce the deviation from the timing at which the alarm information is collected.
[0106]
Further, in the first and second alarm information collecting devices described above, by providing means for limiting the number of times of additional polling to be executed, additional polling for a monitoring item indicating that a failure has occurred can be performed by other means. It is possible to limit an increase in the interval at which the polling of the monitoring item is executed.
[0107]
On the other hand, the third alarm information collecting apparatus according to the present invention masks polling for a monitoring item whose status changes according to the status of the monitoring item when a failure occurs in the main monitoring item, and Polling can be executed only for a limited number of monitoring items. As a result, the frequency of collecting the alarm information on the upper monitoring item in which the fault has occurred is temporarily increased, and the difference between the timing when the fault is eliminated and the timing when the alarm information on the fault is collected is reduced. Can be.
[0108]
Further, the fourth alarm information collecting apparatus according to the present invention can perform polling at different frequencies for monitoring items belonging to the active system and monitoring items belonging to the standby system. As a result, it is possible to frequently collect the alarm information on the monitoring items of the active system in which a failure is highly likely to occur. It is possible to reduce the deviation from the timing of collection.
[0109]
The first to fourth alarm information collecting devices described above reduce the difference between the timing at which the alarm information changes due to the occurrence or elimination of the fault and the timing at which the alarm information is collected, thereby increasing the number of monitoring items. It is possible to accurately grasp the state of occurrence of a failure in the system.
[Brief description of the drawings]
FIG. 1 is a principle block diagram of a first alarm information collection device according to the present invention.
FIG. 2 is a principle block diagram of a second alarm information collection device according to the present invention.
FIG. 3 is a principle block diagram of a third alarm information collection device according to the present invention.
FIG. 4 is a principle block diagram of a fourth alarm information collecting device according to the present invention.
FIG. 5 is a diagram showing a first embodiment of an alarm information collection device according to the present invention.
FIG. 6 is a flowchart showing the operation of the first alarm information collecting device.
FIG. 7 is a timing chart for explaining the operation of the first alarm information collecting device.
FIG. 8 is a diagram showing another embodiment related to the first alarm information collecting device.
FIG. 9 is a flowchart illustrating an operation of another embodiment related to the first alarm information collection device.
FIG. 10 is a diagram showing an embodiment of a second alarm information collecting device according to the present invention.
FIG. 11 is a flowchart showing the operation of the second alarm information collecting device.
FIG. 12 is a timing chart for explaining the operation of the second alarm information collecting device.
FIG. 13 is a diagram illustrating an operation of inserting additional polling.
FIG. 14 is a diagram showing another embodiment of the second alarm collection device.
FIG. 15 is a flowchart showing an operation of another embodiment of the second alarm information collecting device.
FIG. 16 is a diagram showing an embodiment of a third alarm information collecting device according to the present invention.
FIG. 17 is a flowchart showing the operation of the third alarm information collecting device.
FIG. 18 is a diagram showing an embodiment of a fourth alarm information collecting device according to the present invention.
FIG. 19 is a flowchart showing the operation of the fourth alarm information collecting device.
FIG. 20 is a diagram showing a configuration of a conventional general alarm information collecting device.
FIG. 21 is a timing chart for explaining a conventional alarm information collecting operation.
[Explanation of symbols]
110 Polling control means
111 Polling execution means
112 Failure detection means
113 Continuous insertion means
121 additional means
122 Additional stopping means
123 Assigning means
115 item detection means
116 Timing Calculation Means
117 Schedule adjustment means
124 Additional restriction means
125 Transfer setting means
118 event detection means
131 Dependent information holding means
132 Mask setting means
133 Mask release means
134 Active information holding means
135 skip control means
210, 220, 230, 240, 411 monitoring control unit
211 Alarm information storage
212 Alarm detector
214, 217 sequential control unit
215 Insertion control unit
216 counter
222 Reference number calculation unit
223 Alarm judgment unit
224 additional instruction section
225 counter
231 Dependent information holding unit
232 Mask control unit
233 Resolution detection unit
234 Mask holder
235 Polling control unit
241 Active information holding unit
242 skip counter
243 Polling control unit
410 Alarm information collection device
412, 422 Interface control unit (I / F)
420 units
421 Unit control unit
423 I / O register

Claims (4)

複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段がポーリング実行手段による前記各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングによって得られる警報情報に基づいて、障害の発生を検出する障害検出手段と、
前記ポーリング制御手段は、前記障害検出手段によって障害の発生が検出されるごとに、前記障害が検出された監視項目についての前記追加ポーリングに対応する監視タイミングを前記障害が検出された監視項目に割り当てられた監視タイミングに連続して挿入するための調整を前記スケジュールに対して行う連続挿入手段を備えた構成である
ことを特徴とする警報情報収集装置。
An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
Failure detection means for detecting the occurrence of a failure based on alarm information obtained by polling each monitoring item;
The polling control unit assigns a monitoring timing corresponding to the additional polling for the monitoring item in which the failure is detected to the monitoring item in which the failure is detected, each time the occurrence of the failure is detected by the failure detecting unit. An alarm information collecting apparatus, comprising: a continuous insertion unit that adjusts the schedule so as to continuously insert the monitoring timing into the schedule.
複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段がポーリング実行手段による前記各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングで得られた警報情報に基づいて、障害が発生している監視項目を検出する項目検出手段と、
前記項目検出手段によって検出された各監視項目について、その監視項目に割り当てられた監視タイミングを基点とするポーリング周期を整数等分した位置を、追加ポーリングを行うタイミングとして算出するタイミング算出手段とを備え、
前記ポーリング制御手段は、前記タイミング算出手段によって算出されたタイミングに、前記追加ポーリングを前記スケジュールに挿入するスケジュール調整手段を備えた構成である
ことを特徴とする警報情報収集装置。
An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
Item detection means for detecting a monitoring item having a failure based on alarm information obtained by polling each monitoring item;
Timing monitoring means for calculating, for each monitoring item detected by the item detecting means, a position obtained by equally dividing a polling cycle based on the monitoring timing assigned to the monitoring item as an additional polling timing; ,
The alarm information collecting apparatus, wherein the polling control means includes a schedule adjusting means for inserting the additional polling into the schedule at the timing calculated by the timing calculating means.
複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段がポーリング実行手段による前記各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
各監視項目に対するポーリングで得られた警報情報に基づいて、障害の発生および障害の解消を含む動作状態の変化を検出するイベント検出手段を備え、
前記ポーリング制御手段は、
全ての監視項目について、相互の従属関係を示す従属情報保持手段と、
前記イベント検出手段によっていずれかの監視項目に障害の発生が検出されるごとに、前記従属情報保持手段を参照し、前記障害が検出された監視項目に従属するとされた監視項目に対応して前記スケジュールに設定された監視タイミングを選択的にマスクするマスク設定手段と、
前記イベント検出手段によって障害の解消が検出された監視項目について、前記従属情報保持手段を参照し、前記検出された監視項目に従属するとされた監視項目に対応して前記スケジュールに含まれる監視タイミングに設定されたマスクを解除するマスク解除手段とを備えた構成である
ことを特徴とする警報情報収集装置。
An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
Based on the alarm information obtained by polling each monitoring item, an event detection unit that detects a change in an operation state including occurrence of a failure and elimination of the failure,
The polling control means,
Dependency information holding means indicating a mutual dependency relationship for all monitoring items,
Each time the occurrence of a failure in any of the monitoring items is detected by the event detecting unit, the dependent information holding unit is referenced, and Mask setting means for selectively masking the monitoring timing set in the schedule,
For the monitoring item for which the resolution of the failure has been detected by the event detecting means, refer to the dependent information holding means, and set the monitoring timing included in the schedule in accordance with the monitoring item determined to be dependent on the detected monitoring item. An alarm information collecting apparatus, comprising: a mask release unit for releasing a set mask.
複数の監視項目についての監視タイミングに関するスケジュールに基づいて、ポーリング制御手段がポーリング実行手段による前記各監視項目に対するポーリングによって警報情報を収集する動作を制御する構成の警報情報収集装置において、
前記ポーリング制御手段は、
全ての監視項目について、現用系であるか予備系であるかを示す情報を保持する現用情報保持手段と、
前記現用情報保持手段に保持された情報に基づいて、予備系に属する監視項目に対して前記スケジュールに設定された監視タイミングを所定の割合でスキップするスキップ制御手段とを備えた構成である
ことを特徴とする警報情報収集装置。
An alarm information collection device configured to control an operation of collecting alarm information by polling for each of the monitoring items by a polling execution unit based on a schedule related to monitoring timings of a plurality of monitoring items,
The polling control means,
Working information holding means for holding information indicating whether the system is a working system or a standby system for all monitoring items;
A skip control unit that skips a monitoring timing set in the schedule at a predetermined rate for a monitoring item belonging to a standby system based on information held in the working information holding unit. Characteristic alarm information collecting device.
JP2003011458A 2003-01-20 2003-01-20 Alarm information collection device Withdrawn JP2004227084A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003011458A JP2004227084A (en) 2003-01-20 2003-01-20 Alarm information collection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003011458A JP2004227084A (en) 2003-01-20 2003-01-20 Alarm information collection device

Publications (1)

Publication Number Publication Date
JP2004227084A true JP2004227084A (en) 2004-08-12

Family

ID=32900359

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003011458A Withdrawn JP2004227084A (en) 2003-01-20 2003-01-20 Alarm information collection device

Country Status (1)

Country Link
JP (1) JP2004227084A (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518291A (en) * 2004-10-25 2008-05-29 アルカテル−ルーセント Method for accounting a user accessing a prepaid service via an access control unit
JP2013187816A (en) * 2012-03-09 2013-09-19 Fujitsu Telecom Networks Ltd Monitoring and control system, monitoring and control apparatus, and polling control method
JP2018093347A (en) * 2016-12-01 2018-06-14 キヤノン株式会社 Information processing apparatus, information processing method, and program

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008518291A (en) * 2004-10-25 2008-05-29 アルカテル−ルーセント Method for accounting a user accessing a prepaid service via an access control unit
JP2013187816A (en) * 2012-03-09 2013-09-19 Fujitsu Telecom Networks Ltd Monitoring and control system, monitoring and control apparatus, and polling control method
JP2018093347A (en) * 2016-12-01 2018-06-14 キヤノン株式会社 Information processing apparatus, information processing method, and program

Similar Documents

Publication Publication Date Title
CN109445927B (en) Task management method and device for storage cluster
CN108710544B (en) Process monitoring method of database system and rail transit comprehensive monitoring system
EP2685380A1 (en) Operations management unit, operations management method, and program
US9191296B2 (en) Network event management
US7281238B2 (en) Method and program for monitoring execution state of program
JP5387779B2 (en) Operation management apparatus, operation management method, and program
CN106161090A (en) The monitoring method of a kind of subregion group system and device
CN110190991A (en) A Fault Tolerance Method for Distributed Stream Processing System in Multiple Application Scenarios
CN115543740A (en) Method, system, equipment and storage medium for monitoring abnormal operation of service
US8719626B2 (en) Proactively removing channel paths in error from a variable scope of I/O devices
JP2004227084A (en) Alarm information collection device
CN113268395B (en) Service data processing method, processing device and terminal
US20240037014A1 (en) Prediction of an anomaly of a resource for programming a checkpoint
CN117785526A (en) Abnormality detection method, device and equipment for time protection and storage medium
JP4464655B2 (en) Computer monitoring apparatus and message processing method related to monitored computer
CN107995014B (en) Method and device for discovering function topology based on alarm information
CN108228328B (en) Stream task implementation method and device and electronic equipment
JPH04239242A (en) Fault detection method
JP5586322B2 (en) Plant monitoring system and plant monitoring method
CN113381902A (en) Method, apparatus and computer storage medium for detecting cross-regional network link
JP2005018152A (en) Control/monitoring system
CN114897503B (en) Business processing method, device, equipment and storage medium
CN118277031A (en) Data processing method, container cluster, electronic equipment and storage medium
JP3294108B2 (en) Power restoration processing method and device
CN119201924A (en) A cluster performance statistical data processing method, device and medium

Legal Events

Date Code Title Description
A300 Withdrawal of application because of no request for examination

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060404