[go: up one dir, main page]

JP2010062844A - ネットワーク監視システムとそのノード装置および監視装置 - Google Patents

ネットワーク監視システムとそのノード装置および監視装置 Download PDF

Info

Publication number
JP2010062844A
JP2010062844A JP2008226140A JP2008226140A JP2010062844A JP 2010062844 A JP2010062844 A JP 2010062844A JP 2008226140 A JP2008226140 A JP 2008226140A JP 2008226140 A JP2008226140 A JP 2008226140A JP 2010062844 A JP2010062844 A JP 2010062844A
Authority
JP
Japan
Prior art keywords
monitoring device
alarm
test signal
load
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008226140A
Other languages
English (en)
Other versions
JP4455658B2 (ja
Inventor
Takahiro Ozaki
高弘 尾崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2008226140A priority Critical patent/JP4455658B2/ja
Priority to US12/552,143 priority patent/US20100057901A1/en
Publication of JP2010062844A publication Critical patent/JP2010062844A/ja
Application granted granted Critical
Publication of JP4455658B2 publication Critical patent/JP4455658B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/02Standardisation; Integration
    • H04L41/0213Standardised network management protocols, e.g. simple network management protocol [SNMP]

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】アラーム情報の通知に係わるトラフィックを効果的に抑圧すること。
【解決手段】ネットワークノードN1〜Nmにアラームレベル別にバッファ151〜15nを備え、アラーム抑制中フラグがオンの場合にはアラーム情報をバッファに格納する。各バッファは定期的にチェックされ、レベルの高いアラーム情報を優先して通知する。その際、キープアライブメッセージの送信、到達、返信および受信時刻を同メッセージにタイムスタンプで付与し、各時刻情報から監視装置3およびネットワークNWの負荷を計測して、これを反映してバッファ151〜15nのバッファリング期間を可変制御する。
【選択図】 図2

Description

この発明は、ネットワークを形成する被監視装置(ネットワークノード)と、これらの被監視装置をネットワークを介して監視する監視装置とを備える、ネットワーク監視システムと、このシステムに備わるノード装置および監視装置に関する。
ネットワークを健全な状態に保ち、円滑な運用を図るために、ネットワークの構成要素(以下、ネットワークノードと称する)の状態を監視する装置(以下、監視装置と称する)が設けられる。障害の発生、あるいは障害からの復旧といったイベントが生じると、ネットワークノードはアラームなどのメッセージを監視装置に通知する。監視装置はこのようなメッセージ(以下アラーム情報と総称する)に基づいてネットワークの状態を把握する。この種のプロトコルではインプリメントの容易なSNMP(Simple Network Management Protocol)が代表的であるが、このほかにも多様な技術が用いられている。この種の技術ではマネジメントに関わる負荷の軽減が大きなテーマであり、例えば特許文献1〜3に関連技術が開示される。
特許文献1には、イベントが一定期間にわたり継続することを通知の条件にすることで同じアラーム状態のバタつきを防止し、イベント通知トラフィックを最小にするという技術が開示される。
特許文献2には、監視装置(NMSサーバ)において単位時間の負荷をモニタし、負荷が過度になればアラーム通知サーバ(NEサーバ)のアラーム通知処理を抑制するようにしている。これによれば監視装置の負荷を考慮したアラーム通知を行うことができる。
特許文献3では、ネットワークノード(被監視装置)は監視装置の許可を受けた状態でなければアラームを通知できない。監視装置が、自らモニタした受信パケット数と処理能力とを比較して許可を出すことで、監視装置の負荷を考慮したアラーム通知を行うことができる。特にこの文献では不許可時にはアラーム通知が完全にストップする。
特開2000−278361号公報 特開2001−223694号公報 特開平9−214494号公報
ネットワークノードから監視装置にアラームを通知するにあたり、主にトラフィックを削減することで監視装置の負担を軽減する手法が種々模索されている。しかし近年では通信システムの大規模化に伴って監視対象の数も多くなってきており、監視装置の負荷が高くなる傾向にある。発生した障害の形態によっては多くのノードから短期間のうちに多量のアラームが通知されることがあり(バースト)、このようなケースでは処理能力が追いつかずアラーム通知が欠落したり、ネットワーク輻そうも起こり得る。アラーム通知に基づいてネットワークを監視するにあたりさらに効果的な手法が望まれている。
この発明は上記事情によりなされたもので、その目的は、アラーム情報の通知に係わるトラフィックを効果的に抑圧することの可能なネットワーク監視システムとそのノード装置および監視装置を提供することにある。
上記目的を達成するためにこの発明の一態様によれば、複数のノード装置を接続する通信ネットワークを備えるシステムを、前記複数のノード装置から前記通信ネットワーク経由で通知される通知メッセージに基づいて監視する監視装置を具備するネットワーク監視システムにおいて、前記ノード装置の各々は、自装置に生じたアラームの種別に応じてレベルの異なる通知メッセージを生成するメッセージ生成部と、前記異なるレベルごとに設けられ前記通知メッセージをそのレベルに応じた保持期間で一時的に保持する複数のバッファ部と、前記保持された通知メッセージを前記監視装置に通知する通知部と、前記監視装置の負荷と前記通信ネットワークの負荷とを計測するための試験信号を前記監視装置に送信する試験信号送信部と、前記試験信号に対する前記監視装置からの返信の受信時刻に基づいて前記監視装置および前記通信ネットワークの負荷を個別に計測する計測部と、前記計測された前記監視装置の負荷および前記通信ネットワークの負荷に基づいて、前記複数のバッファ部における保持期間を前記レベルごとに変化させる保持期間制御部とを備え、前記監視装置は、前記試験信号を受信し、この試験信号に対する応答を当該試験信号に記載して返信する送受信部を備えることを特徴とするネットワーク監視システムが提供される。
このような手段を講じることにより、ノード装置は通知メッセージをアラームレベルごとにバッファリングし、障害の発生から時間差をもって通知する。いわば通知メッセージはアラームの発生から即座に送出されるのではなく、アラームレベルに応じて通知を抑制される。つまり緊急度の高いアラームほど即座に通知され、それほど重要でないアラームは後回しにされることで、突発的なトラフィックの増大を抑圧することができる。
その一方で、ノード装置は例えばキープアライブメッセージを定期的に監視装置に送出する。このキープアライブメッセージの送信時刻と、監視装置から戻ってきた受信時刻との差から、監視装置および通信ネットワークの負荷を計測することができる。さらには、キープアライブメッセージが監視装置にとどまっていた時間の長短に応じて、監視装置の負荷の大小を計測することもできる。これらがわかれば、前者から後者を差し引けばネットワークの負荷を単独で評価することもできる。発明者はこの点に着目し、特にネットワーク負荷に応じてバッファのバッファリング期間(保持期間)を可変することにより、ネットワーク負荷が高い状態では重要なアラームを通知しない、といった運用を実現することができるようになる。このことから、より効果的なかたちでアラーム通知を実施することが可能になる。
この発明によれば、アラーム情報の通知に係わるトラフィックを効果的に抑圧することの可能なネットワーク監視システムとそのノード装置および監視装置を提供することができる。
図1は、この発明に関わるネットワーク監視システムの実施の形態を示すシステム図である。図1において、ネットワークNWに複数のネットワークノードN1〜Nmが属し、これらはルータ2を介して監視装置3と双方向に通信する。監視装置3はネットワークノードN1〜Nmから通知される通知情報に基づいて各ネットワークノードN1〜Nmの動作状態、ネットワークNWの状態、さらには、これらによって形成されるシステムの状態を監視する。監視プロトコルとしては例えばSNMPが代表的であるがこれに限られるものではない。
図2は、図1の監視装置3、およびネットワークノードN1〜Nmの実施の形態を示す機能ブロック図である。このうちネットワークノードN1〜Nmは、障害検出部23、障害−アラーム変換テーブル22、アラーム情報生成部21、アラーム抑制可否テーブル20、アラームバッファ15、アラーム抑制判断部19、アラーム結合部14、非抑制用バッファ16、非抑制用バッファ管理部17、タイマ管理部18、タイマ値テーブル12、アラーム送信部10、送信バッファ13、および、キープアライブ送受信部11を備える。
障害検出部23は、自ノード内における障害の発生、および復旧を検出する、アラーム情報生成部21は、検出された障害を図3に示すような障害−アラーム変換テーブル22を用いてアラーム情報に変換する。アラーム情報は通知メッセージとして監視装置3に通知される。なお各アラーム情報には発生順にシーケンシャルな番号が付与される。このシーケンシャル番号を用いてアラーム情報の欠落の有無を判定する。
図3に示す障害−アラーム変換テーブル22は、個々の障害ごとに、アラーム情報(メッセージ)とレベルとを対応付けたテーブルである。レベルとは監視装置3に通知するにあたっての優先順位であり、アラーム情報ごとに定義される。例えば Major / Minor / Warning の3段階のレベルがあり、このうちWarningが最高レベル(level-1)であり、Major(level-2)、Minor(level-3)の順でレベルが下がってゆく。
アラームバッファ15は、アラーム情報を一時的に保持するために設けられるバッファメモリであり、アラーム情報のレベルごとに設けられる複数のバッファ151〜15nを備える。各バッファ151〜15nにおけるアラーム情報を保持する期間(バッファリングタイム)はレベルごとに異なる値をもつ。さらに各バッファ151〜15nごとに、アラームの発生の有無を示すフラグが対応付けられる。
アラーム抑制可否テーブル20は、監視装置3へのアラーム情報送信を抑制するか否かをアラームごとに指定するためのテーブルである。すなわち図4に示すように、各アラームは通知抑制を行うか否かを個別に指定される。監視装置3へのアラーム情報の送信を抑制している状態では、その区別のためアラーム発生中フラグが立てられる。
アラーム抑制判断部19は、アラーム抑制可否テーブル20と、アラームバッファ15の状態と、アラーム発生中フラグの状態と、ネットワークノード内で発生しているアラームの状態とから、監視装置3へのアラーム情報の送信を抑制するか否かを判断する。
アラーム結合部14は、各バッファ151〜15nにおけるアラーム情報の有無を定期的にチェックする。同じバッファに複数のアラーム情報がバッファリングされていれば、アラーム結合部14はこれらのアラーム情報を結合して監視装置3に送信するアラームメッセージとする。
非抑制用バッファ16は、送信を抑制する必要無しと判断されたアラーム情報を一時的に保持するためのバッファである。すなわち、アラームレベルに基づきアラーム抑制判断部19で送信を抑制しないと判断されたアラーム情報も、一旦ここでバッファリングされる。この実施形態では、監視装置3に加えてネットワーク負荷も考慮してアラーム情報の送信抑制制御を行う。いわばアラーム情報の送信抑制を2段構えで制御するようにする。なお例えば無負荷時におけるバッファ期間は0とする。
非抑制用バッファ管理部17は、非抑制用バッファ16に発生中のアラーム情報が存在するかを定期的にチェックして、アラーム情報が存在する場合にはその情報を加工して監視装置3へのアラームメッセージを生成する。タイマ管理部18は、アラームバッファ15の定期チェックのタイミングをアラーム結合部14に通知する。またタイマ管理部18は、非抑制用バッファ16の定期チェックのタイミングを非抑制用バッファ管理部17に通知する。アラームバッファ15、および非抑制用バッファ16の定期チェックのタイミングは、タイマ値テーブル12でアラームレベル別に指定された間隔で実施される。
アラーム送信部10はアラームメッセージを監視装置3に送信する。その際、送信されたアラームメッセージは送信バッファ13に一時的に保持される。キープアライブ送受信部11はキープアライブの実施のため、キープアライブメッセージを定期的に監視装置3に送信する。またキープアライブ送受信部11はキープアライブ応答を受信し、チェックすることで監視装置3の生存確認を行う。なおキープアライブ機能とはネットワークデバイスの動作チェックなどのためデバイスに実装されるアプリケーションの一つであり、IP(Internet Protocol)電話システムなどにおいてはよく知られた技術である。
特にこの実施形態では、キープアライブ送受信部11はキープアライブメッセージに時刻情報を記載し、これをもとに監視装置3の負荷、およびネットワークNWの負荷とを計測する。いわばこの実施形態ではキープアライブメッセージを、負荷の計測のための試験信号として流用する。
監視装置3は、アラーム受信部31、アラーム分解部32、アラームソート部33、アラーム表示部34、および、キープアライブ送受信部35を備える。このうちアラーム受信部31は、ネットワークノードN1〜Nmから送信されたアラームメッセージを受信する。受信したアラームメッセージに複数のアラーム情報が結合されていれば、アラーム分解部32はこれを分解して個々のアラーム情報を抽出する。アラームソート部33は、個々のアラーム情報をタイムスタンプ順に並べ替える。アラーム表示部34は、アラーム情報をモニタ画面(図示しない)などに表示して保守者に通知する。キープアライブ送受信部35は、ネットワークノードN1〜Nmからキープアライブメッセージを受信し、応答メッセージを送出元のネットワークノードに返信する。
図5は、この実施形態で用いられるキープアライブメッセージのメッセージフォーマットの一例を示す図である。この実施形態では、キープアライブメッセージはメッセージ識別子(ID)およびキープアライブのための既知のデータを記載するフィールドに加え、時刻情報(タイムスタンプ)を記載するためのフィールドを備える。
すなわちネットワークノードN1〜Nmのキープアライブ送受信部11は、送信時刻フィールドにそのキープアライブメッセージの送信時刻を記載して監視装置に送信する。これを受けた監視装置3のキープアライブ送受信部35は、このメッセージがネットワークNWを介して到達した時刻(到達時刻)と、送出元のネットワークノードに返信した時刻(返信時刻)とを付加した応答メッセージを、送出元のネットワークノードに返信する。これを受けたネットワークノードはその受信時刻をメッセージフィールドに記載したのち、次の処理に移る。なお最後の受信時刻の記載は必ずしも必要でなく、ようするに応答メッセージの受信時刻をネットワークノードが把握していれば良い。このようにネットワークノードがキープアライブメッセージを介して時刻データを取得することで、監視装置3の負荷状態に加えてネットワークNWの負荷に関する知見をも得ることができる。
図6は、キープアライブメッセージに記載される時刻情報の一例を示す図である。図6には3つのキープアライブメッセージに記載された送信時刻(T1)、到達時刻(T2)、返信時刻(T3)、および受信時刻(T4)の例が示される。なお単位は例えばミリ秒である。
監視装置3の処理負荷は、キープアライブメッセージを受信したのち処理し、返信するまでの時間によって見積もれる。つまりこの処理時間(T3−T2)が長ければ長いほど高い負荷がかかっていることになる。ネットワークNWの負荷はキープアライブメッセージの伝送時間によって見積もれる。つまり伝送にかかる時間が長ければ長いほどネットNWの負荷が高いことになる。伝送時間は、キープアライブ送信時の伝送時間(T2−T1)と返信時の伝送時間(T4−T3)とを足せば算出できる。あるいは、要するに受信時刻T4と送信時刻T1との差(T4−T1)から、監視装置の処理時間(T3−T2)を差し引けば算出できる。
図6において、例えば処理時間、伝送時間に10ミリ秒の閾値を設定し、これを境に負荷の高低を見積もることができる。図6の最初のケースでは処理時間、伝送時間のいずれも閾値を超えており、何らかの要因で監視装置3、ネットワークNWの双方に高い負荷がかかっていることがわかる。次のケースでは監視装置3、ネットワークNWのいずれの負荷も軽く、3番目のケースではネットワークNWの負荷は軽いものの、監視装置3の負荷が高いことがわかる。このような情報はキープアライブ送受信部11により計測され、その結果に基づいて、タイマ管理部18はバッファ151〜15nの保持期間を可変制御する。これにより、負荷の形態に応じてきめ細かなアラーム送信抑制制御を行うことができる。
図7は、ネットワークノードN1〜Nmにおける障害の発生からアラーム情報をバッファに格納するまでの処理手順を示すフローチャートである。図7において、障害の発生が障害検出部23により検出されると(ステップB1)、アラーム情報生成部21は障害−アラーム変換テーブル22を参照して障害情報からアラーム情報を生成する(ステップB2)。このアラーム情報には、アラーム種別、アラームレベル、タイムスタンプ、検出場所などが含まれる。このアラーム情報はアラーム抑制判断部19に渡される。
アラーム抑制判断部19は、渡されたアラーム情報のレベルのアラーム発生中フラグをオンに変更する(ステップB3)。これにより、このレベルよりもレベルの低いアラームの送出が抑制される。次にアラーム抑制判断部19はアラーム抑制可否テーブル20を参照し、発生したアラーム情報のレベルに基づき通知抑制を行うか否かを判断する(ステップB4)。通知抑制の必要がなければ、アラーム抑制判断部19はこのアラーム情報を非抑制用バッファ16に格納する(ステップB10)。
通知抑制が必要であれば、アラーム抑制判断部19はそのアラームのレベルよりも高いレベルのアラーム発生中フラグを全てチェックする(ステップB6)。何れかのアラーム発生中フラグがオンであればより高レベルのアラームが発生中であるので、アラーム抑制判断部19は渡されたアラーム情報の送信も抑制すると判断する(ステップB7)。これにより、このアラーム情報は対応するレベルのアラームバッファ15に格納される(ステップB8)。
一方、ステップB7でより高レベルのアラーム発生中フラグが全てオフであれば、アラーム抑制判断部19は対象アラームレベルのアラームバッファ15の状態をチェックする(ステップB12)。対象アラームレベルのアラームバッファ15が空きであれば(ステップB12でYES)、アラーム抑制判断部19は対象アラーム情報の送信を抑制する必要無しと判断してこのアラーム情報を非抑制用バッファ16に格納する(ステップB10)。
ステップB12でアラームバッファ15が空きでなければ(NO)、渡されたアラーム情報のレベルでは送信抑制中と判断し、アラーム抑制判断部19はこのアラーム情報をそのレベルのアラームバッファ15に格納する(ステップB8)。ステップB8、B10のいずれにおいても、バッファ用の定期チェックタイマが起動されていなければ、アラーム抑制判断部19は定期チェックタイマの起動をタイマ管理部18に要求する(ステップB9、B11)。
図8は、ネットワークノードN1〜Nmにおける障害の復旧からアラーム解除を送信するまでの処理手順を示すフローチャートである。図8において、障害の復旧が障害検出部23により検出されると(ステップB21)、アラーム情報生成部21は障害−アラーム変換テーブル22を参照して、障害情報からアラーム解除情報を生成する(ステップB22)。このアラーム解除情報には、アラーム種別、アラームレベル、タイムスタンプ、検出場所などが含まれる。このアラーム解除情報はアラーム抑制判断部19に渡される。
アラーム抑制判断部19は、渡されたアラーム解除情報に記されたアラームレベルに対応するアラームバッファ15の状態をチェックする(ステップB23)。アラームバッファ15に既にアラーム情報が有れば、アラーム抑制判断部19は、対象アラームレベルのアラーム送信が発生中、すなわち送信タイミングを待っている状態であると判断し、このアラーム解除情報をアラームバッファ15に格納する(ステップB25)。
アラームバッファ15にアラーム情報が無ければ、アラーム抑制判断部19は解除すべきアラームよりも高レベルのアラーム発生中フラグを参照する(ステップB26)。何れかのアラーム発生中フラグがオンであればより高レベルのアラームの送信が発生中であるので(ステップB26でON)、アラーム抑制判断部19は渡されたアラーム解除情報の送信も抑制すると判断する。これにより、このアラーム解除情報は対応するレベルのアラームバッファ15に格納される(ステップB25)。より高レベルのアラーム発生中フラグが全てオフであれば、アラーム抑制判断部19は、対象アラームを解除することで対象レベルの全てのアラームが解除になるか否かを判定する(ステップB27)。
全アラームが解除にならない場合には(ステップB27でNO)、アラーム抑制判断部19はそのレベルのアラーム送信抑制を継続するため、そのアラーム解除情報を対象アラームバッファ15に格納する(ステップB25)。全アラームが解除になるのであれば(ステップB27でYES)、アラーム抑制判断部19は、対象のレベルのアラーム送信抑制を継続する必要がなくなると判断する。よってアラーム抑制判断部19は対象レベルのアラーム発生中フラグをオフとし(ステップB28)、対象アラームレベルの定期チェックタイマの停止をタイマ管理部18に要求するとともに(ステップB29)、このアラーム解除情報を非抑制用バッファ16に格納する(ステップB30)。
図9は、ネットワークノードN1〜Nmにおける定期タイマのタイムアウト発生時における処理手順を示すフローチャートである。各バッファ151〜15nはそれぞれタイマにより定期的にチェックされる。そのタイマのタイムアウトが発生すると(ステップB41)、タイマ管理部18は次回のチェックのため、アラームレベル別のタイマ値テーブル12を参照して定期タイマを起動する(ステップB42)。次にタイマ管理部18はアラームバッファ15のチェックをアラーム抑制判断部19に要求したうえで、次のタイムアウトを待つ。
アラーム抑制判断部19は、定期チェック対象のレベルのアラームバッファ15の状態をチェックする(ステップB43)。アラームバッファ15にアラーム情報が無ければ処理は終了する。アラームバッファ15にアラーム情報が有れば(ステップB44で「あり」)、アラーム抑制判断部19は、アラームバッファ15に格納されているアラーム解除情報を含め、対象アラームレベルの全アラームが解除しているか否かを確認する(ステップB45、B46)。
全アラームが解除されていれば、アラーム抑制判断部19は今回の定期チェック後は対象アラームレベルのアラーム送信抑制を継続する必要がなくなると判断する。よってアラーム抑制判断部19は対象アラームレベルのアラーム発生中フラグをオフとし(ステップB47)、タイマ管理部18に対象アラームレベルの定期チェックタイマの停止を要求する(ステップB48)。対象アラームレベルの全アラームが解除されていなければ(ステップB46でNO)、アラーム抑制判断部19は今回の定期チェック後も対象アラームレベルのアラーム送信抑制を継続すると判断する。
次にアラーム抑制判断部19は、対象アラームバッファ15に格納されているアラーム情報の数を確認する(ステップB49)。アラーム情報が1つ、つまり複数でなければ(NO)、アラーム抑制判断部19はアラーム送信部10にアラームの送信を要求するとともに、対象アラームバッファ15をクリアする(ステップB51)。アラーム情報が複数であれば、アラーム抑制判断部19はアラーム結合部14にアラーム情報の結合を要求する(ステップB50)。これを受けてアラーム結合部14は複数のアラーム情報を1つのアラームメッセージに結合し、アラーム送信部10にアラームの送信を要求すると共に、対象アラームバッファ15をクリアする(ステップB52)。
図10は、ネットワークノードN1〜Nmにおけるキープアライブメッセージ送信時の処理手順を示すフローチャートである。ネットワークノードはキープアライブの開始タイミングが到来すると(ステップB61)、現在時刻を取得し(ステップB62)、その値をキープアライブメッセージの送信時刻フィールドに記載したうえで監視装置に向け送信する(ステップB63)。
図11は、ネットワークノードN1〜Nmにおけるキープアライブメッセージ受信時の処理手順を示すフローチャートである。ネットワークノードはキープアライブメッセージを受信すると(ステップB71)、各フィールドから時刻情報を取得する(ステップB72)。そして各数値から、図6に示されるように、ネットワークNWの負荷、および監視装置3の負荷を個別に算出する(ステップB73)。その結果に応じてネットワークノードは各バッファに設定されているアラームレベルごとのタイマ値を変更する(ステップB74)。
またネットワークノードは、監視装置3から返送されたキープアライブメッセージのアラーム通知欠落情報を取得し(ステップB75)、欠落有りの旨が記載されていれば(ステップB76で「あり」)、該当するアラーム情報を送信バッファ13から取得して(ステップB77)監視装置3に再送する(ステップB78)。アラーム情報の再送が完了すると、ネットワークノードは送信バッファ13をクリアする(ステップB79)。
図12は監視装置3におけるキープアライブメッセージ受信、および再送に関わる処理手順を示すフローチャートである。監視装置3はネットワークノードからのキープアライブメッセージを受信すると(ステップB91)、到達時刻フィールドにこの受信時刻を追記し(ステップB92)、各アラーム情報に付与されたシーケンシャル番号をチェックすることによりアラームの通知の欠落の有無をチェックする(ステップB93)。欠落があれば、監視装置3はネットワークノードに返信するキープアライブメッセージに、欠落したアラームに該当するシーケンシャル番号を追加する(ステップB95)。次に監視装置3は、返信時刻フィールドに現在時刻を追記したのち(ステップB96)、キープアライブ応答メッセージをネットワークノードに返信する(ステップB97)。
図13は、この実施形態におけるアラーム発生中フラグ、アラームバッファ15の状態、およびアラーム送信の時系列を示すタイムチャートである。最初に、例えばレベル2のアラーム(Alarm2-1)が単独で生じると、レベル2のフラグがオンされバッファリングタイマが起動されたのち、直ちにアラーム情報が監視装置3に送信される。
この状態から各レベルのアラーム(Alarm1-1,Alarm2-2,Alarm3-1)が同時に発生すると、レベル1および3のフラグもオンされたのちタイマも起動する。既存技術ではこの時点でいずれのアラーム情報も送信されるが、この実施形態では最高レベルのAlarm1-1のみが送信される。この状態はレベル2のバッファがクリアされるまで継続し、クリアされるとAlarm2-2が送信される。アラームの解除についても同様の手順が実施され、アラームレベルに対応するバッファがクリアされるまでアラーム情報の送信が抑制される。特に、最低レベル(レベル3)のバッファはタイマ期間が最も長く、これがクリアされるまで送信が抑制される。この実施形態では監視装置3の負荷に加え、ネットワークNWの負荷をも加味して各バッファのタイマチェック期間(バッファリング期間)が可変制御される。
以上述べたようにこの実施形態では、ネットワークノードN1〜Nmにアラームレベル別にバッファ151〜15nを備え、アラーム抑制中フラグがオンの場合にはアラーム情報をバッファに格納する。各バッファは定期的にチェックされ、レベルの高いアラーム情報を優先して通知する。その際、キープアライブメッセージの送信、到達、返信および受信時刻を同メッセージにタイムスタンプで付与し、各時刻情報から監視装置3およびネットワークNWの負荷を計測して、これを反映してバッファ151〜15nのバッファリング期間を可変制御するようにしている。
またこの実施形態では、バッファ151〜15nごとに、複数のアラーム情報があればこれらを結合した状態で監視装置3に通知するようにしている。さらに、アラーム情報にシーケンシャル番号を付加し、この番号の欠落の有無によりアラーム情報の欠落の有無を判定して、欠落があれば監視装置3からネットワークノードに再送を要求するようにしている。
既存の技術では監視装置3の負荷のみをモニタし、アラーム情報の通知に関わるトラフィックを監視装置3の主導のもとに抑圧するようにしている。しかしながらアラーム情報を受信する監視装置3だけではなく、そこに至るまでのネットワークの状態にも配慮したシステムは知られていない。ネットワークの負荷が過度であるとアラームメッセージが破棄される可能性があり、重篤なアラームが監視装置3に通知されなくなることもあり得る。このようなケースではネットワークの運用に支障をきたすばかりか、システムダウンを引き起こすこともあるので事態は深刻である。
これに対しこの実施形態によれば、ネットワークNWの状態をも加味したかたちでの送信抑制制御を実現することが可能になる。とりわけ、ネットワークのトラフィックが混んでいる状態ではパケット紛失のおそれがあるために、却って重要なアラームを通知しないほうが良い場合がある。この実施形態によればこのような事態にもきめ細かく対応することができる。
またこの実施形態によれば、複数アラーム発生時、ネットワーク高負荷時、または監視装置高負荷時には通知タイミングを間引くと共に、アラーム情報も結合して通知するようにしているので、監視装置3の更なる過負荷を防止できると共にネットワークトラフィックの輻そうも防止できる。さらには、欠落したアラーム通知の再送、レベルの高いアラームの優先的通知により、監視装置3は緊急処理を遅延なく行うこともできる。これらのことから、アラーム情報の通知に係わるトラフィックを効果的に抑圧することの可能なネットワーク監視システムとそのノード装置および監視装置を提供することが可能となる。
なお、この発明は上記実施形態そのままに限定されるものではない。例えばこの実施形態では負荷を計測するための信号としてキープアライブメッセージを流用するようにしたが、これに限らず専用のプローブ信号を設定しても良い。
またこの発明は、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。
この発明に関わるネットワーク監視システムの実施の形態を示すシステム図。 図1の監視装置3、およびネットワークノードN1〜Nmの実施の形態を示す機能ブロック図。 障害−アラーム変換テーブル22の一例を示す図。 アラーム抑制可否テーブル20の一例を示す図。 この発明の実施形態で用いられるキープアライブメッセージのメッセージフォーマットの一例を示す図。 図5のキープアライブメッセージに記載される時刻情報の一例を示す図。 ネットワークノードN1〜Nmにおける障害の発生からアラーム情報をバッファに格納するまでの処理手順を示すフローチャート。 ネットワークノードN1〜Nmにおける障害の復旧からアラーム解除を送信するまでの処理手順を示すフローチャート。 ネットワークノードN1〜Nmにおける定期タイマのタイムアウト発生時における処理手順を示すフローチャート。 ネットワークノードN1〜Nmにおけるキープアライブメッセージ送信時の処理手順を示すフローチャート。 ネットワークノードN1〜Nmにおけるキープアライブメッセージ受信時の処理手順を示すフローチャート。 監視装置3におけるキープアライブメッセージ受信、および再送に関わる処理手順を示すフローチャート。 この発明の実施形態におけるアラーム発生中フラグ、アラームバッファ15の状態、およびアラーム送信の時系列を示すタイムチャート。
符号の説明
NW…ネットワーク、N1〜Nm…ネットワークノード、2…ルータ、3…監視装置、10…アラーム送信部、11…キープアライブ送受信部、12…タイマ値テーブル、13…送信バッファ、14…アラーム結合部、15…アラームバッファ、151〜15n…バッファ、16…非抑制用バッファ、17…非抑制用バッファ管理部、18…タイマ管理部、19…アラーム抑制判断部、20…アラーム抑制可否テーブル、21…アラーム情報生成部、22…障害−アラーム変換テーブル、23…障害検出部

Claims (12)

  1. 複数のノード装置を接続する通信ネットワークを備えるシステムを、前記複数のノード装置から前記通信ネットワーク経由で通知される通知メッセージに基づいて監視する監視装置を具備するネットワーク監視システムにおいて、
    前記ノード装置の各々は、
    自装置に生じたアラームの種別に応じてレベルの異なる通知メッセージを生成するメッセージ生成部と、
    前記異なるレベルごとに設けられ前記通知メッセージをそのレベルに応じた保持期間で一時的に保持する複数のバッファ部と、
    前記保持された通知メッセージを前記監視装置に通知する通知部と、
    前記監視装置の負荷と前記通信ネットワークの負荷とを計測するための試験信号を前記監視装置に送信する試験信号送信部と、
    前記試験信号に対する前記監視装置からの返信の受信時刻に基づいて前記監視装置および前記通信ネットワークの負荷を個別に計測する計測部と、
    前記計測された前記監視装置の負荷および前記通信ネットワークの負荷に基づいて、前記複数のバッファ部における保持期間を前記レベルごとに変化させる保持期間制御部とを備え、
    前記監視装置は、
    前記試験信号を受信し、この試験信号に対する応答を当該試験信号に記載して返信する送受信部を備えることを特徴とするネットワーク監視システム。
  2. 前記試験信号は、前記ノード装置からの送信時刻を記載するための第1フィールドと、前記監視装置への到達時刻を記載するための第2フィールドと、前記監視装置からの返信時刻を記載するための第3フィールドとを有し、
    前記試験信号送信部は、前記第1フィールドに前記送信時刻を記載して前記試験信号を送信し、
    前記送受信部は、前記第2フィールドに当該監視装置への到達時刻を記載し、前記第3フィールドに当該監視装置からの返信時刻を記載して前記試験信号を返信し、
    前記計測部は、前記返信された試験信号に記載された返信時刻と到達時刻との差分から前記監視装置の負荷を計測し、前記受信時刻と当該試験信号に記載された送信時刻との差から前記差分を減算した量から前記通信ネットワークの負荷を計測することを特徴とする請求項1に記載のネットワーク監視システム。
  3. 前記試験信号は、前記通信ネットワークの管理プロトコルで用いられるキープアライブメッセージであることを特徴とする請求項1に記載のネットワーク監視システム。
  4. 前記ノード装置の各々は、さらに、複数の通知メッセージを前記バッファ部ごとに結合させる結合部を備え、
    前記通知部は、前記結合された通知メッセージを前記監視装置に通知し、
    前記監視装置は、さらに、前記結合された状態で通知された通知メッセージを分解して個々の通知メッセージを抽出する分解部を備えることを特徴とする請求項1に記載のネットワーク監視システム。
  5. 複数のノード装置を接続する通信ネットワークを備えるシステムを、前記複数のノード装置から前記通信ネットワーク経由で通知される通知メッセージに基づいて監視する監視装置を具備するネットワーク監視システムに設けられる前記ノード装置において、
    自装置に生じたアラームの種別に応じてレベルの異なる通知メッセージを生成するメッセージ生成部と、
    前記異なるレベルごとに設けられ前記通知メッセージをそのレベルに応じた保持期間で一時的に保持する複数のバッファ部と、
    前記保持された通知メッセージを前記監視装置に通知する通知部と、
    前記監視装置の負荷と前記通信ネットワークの負荷とを計測するための試験信号を前記監視装置に送信する試験信号送信部と、
    前記試験信号に対する前記監視装置からの返信の受信時刻に基づいて前記監視装置および前記通信ネットワークの負荷を個別に計測する計測部と、
    前記計測された前記監視装置の負荷および前記通信ネットワークの負荷に基づいて、前記複数のバッファ部における保持期間を前記レベルごとに変化させる保持期間制御部とを具備することを特徴とするノード装置。
  6. 前記試験信号は、前記ノード装置からの送信時刻を記載するための第1フィールドと、前記監視装置への到達時刻を記載するための第2フィールドと、前記監視装置からの返信時刻を記載するための第3フィールドとを有し、
    前記試験信号送信部は、前記第1フィールドに前記送信時刻を記載して前記試験信号を送信し、
    前記計測部は、前記返信された試験信号に記載された返信時刻と到達時刻との差分から前記監視装置の負荷を計測し、前記受信時刻と当該試験信号に記載された送信時刻との差から前記差分を減算した量から前記通信ネットワークの負荷を計測することを特徴とする請求項5に記載のノード装置。
  7. 前記試験信号は、前記通信ネットワークの管理プロトコルで用いられるキープアライブメッセージであることを特徴とする請求項5に記載のノード装置。
  8. さらに、複数の通知メッセージを前記バッファ部ごとに結合させる結合部を具備することを特徴とする請求項5に記載のノード装置。
  9. 複数のノード装置を接続する通信ネットワークを備えるシステムを、前記複数のノード装置から前記通信ネットワーク経由で通知される通知メッセージに基づいて監視する監視装置において、
    前記監視装置の負荷と前記通信ネットワークの負荷とを計測するために前記ノード装置から送信される試験信号を受信し、この試験信号に対する応答を当該試験信号に記載して返信する送受信部を備えることを特徴とする監視装置。
  10. 前記試験信号は、前記ノード装置からの送信時刻を記載するための第1フィールドと、前記監視装置への到達時刻を記載するための第2フィールドと、前記監視装置からの返信時刻を記載するための第3フィールドとを有し、
    前記送受信部は、前記第2フィールドに当該監視装置への到達時刻を記載し、前記第3フィールドに当該監視装置からの返信時刻を記載して前記試験信号を返信することを特徴とする請求項9に記載の監視装置。
  11. 前記試験信号は、前記通信ネットワークの管理プロトコルで用いられるキープアライブメッセージであることを特徴とする請求項9に記載の監視装置。
  12. さらに、結合された状態で通知された通知メッセージを分解して個々の通知メッセージを抽出する分解部を備えることを特徴とする請求項9に記載の監視装置。
JP2008226140A 2008-09-03 2008-09-03 ネットワーク監視システムとそのノード装置および監視装置 Expired - Fee Related JP4455658B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008226140A JP4455658B2 (ja) 2008-09-03 2008-09-03 ネットワーク監視システムとそのノード装置および監視装置
US12/552,143 US20100057901A1 (en) 2008-09-03 2009-09-01 Network management system and node device and management apparatus thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008226140A JP4455658B2 (ja) 2008-09-03 2008-09-03 ネットワーク監視システムとそのノード装置および監視装置

Publications (2)

Publication Number Publication Date
JP2010062844A true JP2010062844A (ja) 2010-03-18
JP4455658B2 JP4455658B2 (ja) 2010-04-21

Family

ID=41726940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008226140A Expired - Fee Related JP4455658B2 (ja) 2008-09-03 2008-09-03 ネットワーク監視システムとそのノード装置および監視装置

Country Status (2)

Country Link
US (1) US20100057901A1 (ja)
JP (1) JP4455658B2 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011146989A (ja) * 2010-01-15 2011-07-28 Fujitsu Telecom Networks Ltd 監視制御システム、被監視制御装置およびサーバ
JP2011155344A (ja) * 2010-01-26 2011-08-11 Hitachi Ltd ネットワークシステム、接続装置、及び、データ送信方法
JP2012008689A (ja) * 2010-06-23 2012-01-12 Nec Corp アラーム制御装置
JP2016072679A (ja) * 2014-09-26 2016-05-09 日本電気株式会社 コンピュータネットワークシステム、サーバ、及び通信制御方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103370904B (zh) * 2010-09-30 2018-01-12 瑞典爱立信有限公司 用于确定网络意外事件的严重性的方法、网络实体
JP5754283B2 (ja) * 2011-07-25 2015-07-29 富士通株式会社 ネットワーク監視制御装置及び管理情報取得方法
WO2017097356A1 (en) * 2015-12-09 2017-06-15 Telefonaktiebolaget Lm Ericsson (Publ) Technique for reporting and processing alarm conditions occurring in a communication network
CN111314116A (zh) * 2020-01-20 2020-06-19 广州芯德通信科技股份有限公司 一种管理网络设备的协议方法及装置
CN113886197B (zh) * 2021-09-26 2023-04-07 广东信通通信有限公司 一种告警抑制方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214494A (ja) * 1996-01-31 1997-08-15 Nec Corp ネットワーク監視システム及び輻輳回避方法
JPH1028151A (ja) * 1996-07-10 1998-01-27 Matsushita Electric Ind Co Ltd ネットワーク負荷適応型イベント報告装置
JPH1196091A (ja) * 1997-09-22 1999-04-09 Nippon Telegr & Teleph Corp <Ntt> 通信制御方法、通信制御装置及び通信制御プログラムを記録した記録媒体
JPH11308271A (ja) * 1998-04-21 1999-11-05 Canon Inc データ通信装置及び受信装置及び制御方法及び記憶媒体及びデータ通信システム
JP2000278361A (ja) * 1999-03-23 2000-10-06 Nec Corp ネットワーク管理システム及びその方法
JP2001223694A (ja) * 2000-02-07 2001-08-17 Fujitsu Ltd ネットワーク監視システム

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6363477B1 (en) * 1998-08-28 2002-03-26 3Com Corporation Method for analyzing network application flows in an encrypted environment
JP4039195B2 (ja) * 2001-12-27 2008-01-30 富士ゼロックス株式会社 ネットワークシステム
US8792487B2 (en) * 2007-08-21 2014-07-29 Cisco Technology, Inc. Communication path selection
US8521866B2 (en) * 2007-09-27 2013-08-27 Tellabs San Jose, Inc. Reporting multiple events in a trap message

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09214494A (ja) * 1996-01-31 1997-08-15 Nec Corp ネットワーク監視システム及び輻輳回避方法
JPH1028151A (ja) * 1996-07-10 1998-01-27 Matsushita Electric Ind Co Ltd ネットワーク負荷適応型イベント報告装置
JPH1196091A (ja) * 1997-09-22 1999-04-09 Nippon Telegr & Teleph Corp <Ntt> 通信制御方法、通信制御装置及び通信制御プログラムを記録した記録媒体
JPH11308271A (ja) * 1998-04-21 1999-11-05 Canon Inc データ通信装置及び受信装置及び制御方法及び記憶媒体及びデータ通信システム
JP2000278361A (ja) * 1999-03-23 2000-10-06 Nec Corp ネットワーク管理システム及びその方法
JP2001223694A (ja) * 2000-02-07 2001-08-17 Fujitsu Ltd ネットワーク監視システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011146989A (ja) * 2010-01-15 2011-07-28 Fujitsu Telecom Networks Ltd 監視制御システム、被監視制御装置およびサーバ
JP2011155344A (ja) * 2010-01-26 2011-08-11 Hitachi Ltd ネットワークシステム、接続装置、及び、データ送信方法
JP2012008689A (ja) * 2010-06-23 2012-01-12 Nec Corp アラーム制御装置
JP2016072679A (ja) * 2014-09-26 2016-05-09 日本電気株式会社 コンピュータネットワークシステム、サーバ、及び通信制御方法

Also Published As

Publication number Publication date
JP4455658B2 (ja) 2010-04-21
US20100057901A1 (en) 2010-03-04

Similar Documents

Publication Publication Date Title
JP4455658B2 (ja) ネットワーク監視システムとそのノード装置および監視装置
CN102724065B (zh) 一种网络通信系统及包括该系统的工程机械设备
CN103684835B (zh) 链路故障上报方法、处理方法、传输节点及主节点
US7974188B2 (en) Repeater and communication method
WO2015131548A1 (zh) 保护bfd的方法和设备
CN103607302A (zh) 故障信息上报方法、监控设备及管理设备
JPWO2013011545A1 (ja) 送信装置、受信装置、通信装置、通信システムおよび送信方法
Kathuria et al. Quality of service provisioning transport layer protocol for WBAN system
JP5229007B2 (ja) 監視システム、ネットワーク機器、監視情報提供方法およびプログラム
CN101056194B (zh) 一种简单网络管理协议消息传送方法及装置
JP4919935B2 (ja) 警備システム
CN105490837B (zh) 一种网络监控处理方法以及装置
JP2009284254A (ja) 通報装置およびエレベータ遠隔監視システム
US20090238068A1 (en) Method, system and computer program product involving congestion and fault notification in ethernet
US20110238819A1 (en) Apparatus and method for transmitting information on an operational state of the same
CN104429025A (zh) 代理装置、通信系统以及程序
CN109275156B (zh) 一种wifi网络告警信息控制方法及系统
CN106961344A (zh) 一种网络故障检测方法及装置
JP2010086095A (ja) 監視サーバ、ネットワーク監視方法
CA2562182C (en) Method for handling communications over a non-permanent communication link
KR101620522B1 (ko) 수신자 장치로 전자 콘텐츠를 라우팅하기 위한 시스템 및 방법
JP3395897B2 (ja) 集中障害監視方式
JP2015029194A (ja) ネットワークのアラーム処理システム
JP5884918B2 (ja) ネットワーク管理装置、システム、および方法
JP2005071007A (ja) センサシステムおよびそのプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100105

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130212

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees