JP2010141655A - Network monitoring device - Google Patents
Network monitoring device Download PDFInfo
- Publication number
- JP2010141655A JP2010141655A JP2008316681A JP2008316681A JP2010141655A JP 2010141655 A JP2010141655 A JP 2010141655A JP 2008316681 A JP2008316681 A JP 2008316681A JP 2008316681 A JP2008316681 A JP 2008316681A JP 2010141655 A JP2010141655 A JP 2010141655A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- network
- prediction
- policy
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Computer And Data Communications (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、各種機器が接続されるネットワークシステムの性能を把握するネットワーク監視装置に関し、特にネットワークの性能の変動をより精度高く予測することに関する。 The present invention relates to a network monitoring apparatus that grasps the performance of a network system to which various devices are connected, and more particularly to predicting fluctuations in network performance with higher accuracy.
ネットワークを介して複数のサーバ、ルータやスイッチなどの中継機器(以下、ネットワーク機器という)やサーバマシン、クライアントマシンなどの各種端末が接続されるネットワークシステムでは、サーバへの過大な要求や攻撃、故障の発生などによりその性能が劣化してしまうことがある。そこで、従来から、このようなネットワークシステムを理想的に稼動させるために、ネットワークシステムの性能を測定・監視・モニタリングするネットワーク監視装置が提案されている。 In a network system in which multiple servers, relay devices such as routers and switches (hereinafter referred to as network devices), and various terminals such as server machines and client machines are connected via a network, excessive requests to servers, attacks, and failures The performance may be deteriorated due to the occurrence of the above. Therefore, conventionally, in order to ideally operate such a network system, a network monitoring apparatus that measures, monitors, and monitors the performance of the network system has been proposed.
従来のネットワーク監視装置は、事前に定義されたモニタリング条件などの監視内容である監視ポリシーに従ってモニタリングを実行する。この監視ポリシーは監視対象、その監視対象に関する監視項目、監視する所定のインターバルなどがあらかじめ定められたものであり、ネットワーク・ネットワークシステムの状態が変化した場合でも不変のままモニタリングが実行されていた。 A conventional network monitoring apparatus performs monitoring according to a monitoring policy that is monitoring content such as a monitoring condition defined in advance. In this monitoring policy, a monitoring target, a monitoring item related to the monitoring target, a predetermined interval for monitoring, and the like are determined in advance, and monitoring is performed without change even when the state of the network / network system changes.
ところで、従来のネットワーク監視装置は、監視ポリシーの変更が必要となる場合は、ネットワーク管理者が手動で監視ポリシーの設定・変更を行っていた。しかしながら刻一刻と変化するネットワークに対する監視では、ネットワーク管理者が手動で設定・変更を行っていると、その時々の状況に応じて柔軟に適切な監視ポリシーを設定することが難しいという問題があった。 By the way, in the conventional network monitoring apparatus, when the monitoring policy needs to be changed, the network administrator manually sets and changes the monitoring policy. However, when monitoring a network that changes every moment, there is a problem that it is difficult to set an appropriate monitoring policy flexibly according to the situation when the network administrator manually sets and changes it. .
一方、可能な限りの監視対象および監視項目をあらかじめ設定しておき、常にネットワークの情報を漏れなくモニタリングする方法がある。しかしながら、監視対象であるネットワーク機器やネットワーク、ネットワークシステム全体に多大な負荷をかけてしまうといった新たな問題がある。 On the other hand, there is a method in which monitoring targets and monitoring items as much as possible are set in advance, and network information is always monitored without omission. However, there is a new problem that a large load is applied to the network device, the network, and the entire network system to be monitored.
他方、従来のネットワーク監視装置では、ネットワークの状態に応じて動的に監視項目を変更する方法がある。この場合、監視対象機器などに与える負荷を最小限に抑えつつ、ネットワーク管理者による監視設定が行われるまでのタイムラグが無くなり、監視を常に効率良く行うことができるといったメリットがある。 On the other hand, in the conventional network monitoring device, there is a method of dynamically changing the monitoring item according to the network state. In this case, there is a merit that monitoring can always be performed efficiently because there is no time lag until the monitoring setting by the network administrator is performed while minimizing the load applied to the monitoring target device.
このようなネットワーク監視装置に関連する先行技術文献として、下記の特許文献1がある。
As a prior art document related to such a network monitoring apparatus, there is the following
図6は従来のネットワーク監視装置の構成例を示す構成図であり、図6において、ネットワーク監視装置1は、イーサネット(登録商標)などの有線ネットワークであるネットワーク2を介してたとえばWebサーバなどを提供するサーバまたはネットワーク機器等である被監視対象装置3と接続されている。また特に図示していないが、ネットワーク2と、被監視対象装置3と、図示しないその他のネットワーク機器・各種端末装置とは、ネットワークシステムを構成する。
FIG. 6 is a block diagram showing a configuration example of a conventional network monitoring apparatus. In FIG. 6, the
ネットワーク監視装置1は、ネットワーク2を介して被監視対象装置3とデータ通信を行う通信手段11、各部・各手段の動作を制御する演算制御部12、記憶手段13などから構成され、ネットワーク2およびネットワークシステム全体の動作を監視する。演算制御部12は、監視手段12Aと、監視設定手段12Bと、監視設定管理手段12Cとを有する。
The
監視手段12Aは、あらかじめ設定されている監視ポリシーに基づいて通信手段11を介して得られる監視対象である被監視対象装置3からのデータを収集し、被監視対象装置3、ネットワーク2およびネットワークシステムの挙動を監視・モニタリングする。
The
これらのデータに基づいてネットワーク2およびネットワークシステム全体の性能を示す性能評価値の基となる性能基礎データを算出し記憶手段13に記憶する。いいかえれば監視手段12Aはネットワーク2およびネットワークシステムの挙動を監視・モニタリングする。
Based on these data, basic performance data serving as a basis for a performance evaluation value indicating the performance of the
監視設定手段12Bは、記憶手段13に記憶されている監視ポリシーを設定する。監視設定管理手段12Cは、監視手段12Aにより得られた監視結果に基づいて最適な監視内容を導き出し、記憶手段13に記憶されている監視ポリシーの再設定・変更を実行する。
The
記憶手段13は、監視対象・その監視対象に関する監視項目・監視する所定のインターバルなどが関連づけて格納されている監視ポリシー13Aと、監視手段12Aにより収集・算出された、たとえばレスポンスタイム、トラフィック量、エラーパケット数などの監視データと測定時の年月日などが関連づけて格納されている監視データDB13Bと、を有する。
The
図7は従来のネットワーク監視装置の動作を説明するフロー図である。ステップSP101において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視設定手段12Aにより設定された監視ポリシーに基づき被監視対象装置3の挙動を監視し、監視データを収集し得られたデータを記憶手段13に記憶する。
FIG. 7 is a flowchart for explaining the operation of the conventional network monitoring apparatus. In step SP101, the
具体的には、監視手段12Aは監視ポリシーに基づき、図示しないWEBクライアント(またはネットワーク監視装置1)からのリクエストに応じてWEBサーバ(被監視対象装置3)が対応する処理を実行し、WEBクライアントが処理結果を受信するまでの時間(以下、レスポンスタイムという)を、当該WEBサーバにインストールされたソフトウエアなどを利用して10分間隔で測定し、得られたレスポンスタイムを記憶手段13に記憶する。
Specifically, the
ステップSP102において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、収集した監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP103に移行し、それ以外の場合はステップSP101に移行する。
In step SP102, the
ステップSP103において、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、障害が検知された監視データに基づき、新たに監視すべき監視項目を抽出し記憶手段13に記憶されている監視ポリシーに追加する。
In step SP103, the monitoring setting management unit 12C of the
具体的には、監視設定管理手段12Cは、図示しないクライアント(またはネットワーク監視装置1)から被監視対象装置3までのネットワーク経路のトラフィック量と被監視対象装置3のCPU使用率を監視項目として自動的に追加する。 Specifically, the monitoring setting management unit 12C automatically monitors the traffic amount of the network path from the client (or the network monitoring device 1) (not shown) to the monitored device 3 and the CPU usage rate of the monitored device 3 as monitoring items. To add.
ステップSP104において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視ポリシーに基づき、レスポンスタイムに加えてトラフィック量と被監視対象装置3のCPU使用率のモニタリングを開始し、得られた監視データを記憶手段13に記憶する。
In step SP104, the
ここで、ネットワーク管理者が新たに追加された監視項目であるトラフィック量の監視値に基づき検討すれば、あるネットワーク経路上での輻輳を見つけ出し、それを解決することが可能となる。 Here, if the network administrator examines based on the monitoring value of the traffic amount, which is a newly added monitoring item, it is possible to find out the congestion on a certain network route and solve it.
ステップSP105において、監視手段12Aは、収集した通信データに基づいて、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP103に移行し、それ以外の場合はステップSP106に移行する。
In step SP105, the
ステップSP106において、監視設定管理手段12Cは、被監視対象装置3における障害がないものと判断されると、ステップSP104にて新たに追加した監視項目を削除する。 In step SP106, when it is determined that there is no failure in the monitored apparatus 3, the monitoring setting management unit 12C deletes the newly added monitoring item in step SP104.
具体的には、監視設定管理手段12Cは、レスポンスタイム(たとえば40ミリ秒など)が閾値(たとえば50ミリ秒など)を下回れば、ステップSP104にて新たに追加した監視項目である、トラフィック量とCPU使用率を監視ポリシーから削除する。 Specifically, when the response time (for example, 40 milliseconds) falls below a threshold value (for example, 50 milliseconds), the monitoring setting management unit 12C determines the traffic amount that is a monitoring item newly added in step SP104. Delete the CPU usage rate from the monitoring policy.
このように、従来のネットワーク監視装置では、ネットワークの状態に応じて動的に監視項目を変更できる。 As described above, in the conventional network monitoring apparatus, the monitoring item can be dynamically changed according to the network state.
しかしながら、従来のネットワーク監視装置は、障害を検知してから監視項目の追加を行うので、被監視対象装置3の障害が起きた時点での状況(いいかえればリアルタイムの状況)およびそれ以前の状況が分からないという問題点があった。そうすると、障害解析に必要な情報が抜けてしまい、適切な解析および監視項目の設定が行えないという問題点があった。 However, since the conventional network monitoring apparatus adds a monitoring item after detecting a failure, the situation (in other words, the real-time situation) at the time when the failure of the monitored apparatus 3 occurs and the situation before that are detected. There was a problem of not knowing. Then, information necessary for failure analysis is lost, and there is a problem that appropriate analysis and monitoring item setting cannot be performed.
図8は従来のネットワーク監視装置の問題点の説明図であり、図8において、たとえば、以下のように状態推移していた場合であると障害の原因(輻輳発生)が特定できないという問題点があった。
時刻A) ネットワーク2上で輻輳が発生
時刻B) ネットワーク監視装置1がWebサーバである被監視対象装置3にHTTPリクエスト送信し、被監視対象装置3を監視
時刻B) ネットワーク監視装置1がHTTPレスポンスを受信しレスポンスタイムを取得。また監視手段12AはHTTPレスポンスタイムが閾値を超えたものと判断し障害を検知。
時刻D) ネットワーク2上に発生していた輻輳が一時的に解消
時刻E) 監視設定管理手段12Cは、監視ポリシーにトラフィック量とCPU使用率を監視項目として追加
時刻F) 監視手段12Aは、追加された監視項目についてもモニタリングを開始
時刻G) 監視手段12Aによりモニタリングされたトラフィック量は、輻輳が一時的に解消されているので、自動的に新たに追加された監視項目は削除される。
FIG. 8 is an explanatory diagram of problems of the conventional network monitoring device. In FIG. 8, for example, if the state has changed as follows, the cause of the failure (congestion occurrence) cannot be specified. there were.
Time A) Congestion occurs on the
Time D) Congestion occurring on the
このように、監視手段12Aが障害を検知した後で一時的にネットワーク2上での輻輳が解消すると、問題無い監視データを取得することになるので、HTTPレスポンスタイムが閾値を超えた原因が特定できないという問題点があった。
As described above, when congestion on the
そうすると、従来のネットワーク監視装置では、図8(B)のように、ネットワーク2上で短期間に繰り返し生じる輻輳(バースト的に発生する輻輳)についても、監視手段12Aが障害を検知した後で一時的にネットワーク2上での輻輳が解消するとあたかも問題無い監視データを取得することになり(これを繰り返すことになってしまい)障害の原因が特定できないという問題点があった。
Then, in the conventional network monitoring device, as shown in FIG. 8B, even for congestion that repeatedly occurs in a short time on the network 2 (congestion that occurs in a burst manner), the monitoring means 12A temporarily detects the failure. When congestion on the
本発明は上述の問題点を解決するものであり、その目的は、障害解析に必要な監視データを適切に把握できるネットワーク監視装置を実現することにある。 The present invention solves the above-described problems, and an object thereof is to realize a network monitoring apparatus that can appropriately grasp monitoring data necessary for failure analysis.
このような課題を達成するために、本発明のうち請求項1記載の発明は、
ネットワークを介し被監視対象装置と接続され、監視ポリシーを設定する監視設定手段と、前記監視ポリシーに基づき前記ネットワークまたは前記被監視対象装置の状態を示す監視データを取得する監視手段とを有するネットワーク監視装置において、
前記監視手段により得られた過去および/または現在の監視データに基づき、前記ネットワークまたは前記被監視対象装置の将来の状態を示す予測監視データを予測・算出する監視予測手段と、
前記監視予測手段により算出された前記予測監視データに基づき前記監視ポリシーを変更する監視設定管理手段と、
を具備することを特徴とするネットワーク監視装置である。
In order to achieve such a problem, the invention according to
Network monitoring having monitoring setting means connected to a monitored device via a network and setting a monitoring policy, and monitoring means for acquiring monitoring data indicating a state of the network or the monitored device based on the monitoring policy In the device
Monitoring and predicting means for predicting and calculating predicted monitoring data indicating the future state of the network or the monitored device based on past and / or current monitoring data obtained by the monitoring means;
Monitoring setting management means for changing the monitoring policy based on the predicted monitoring data calculated by the monitoring prediction means;
A network monitoring device.
請求項2記載の発明は、請求項1記載のネットワーク監視装置において
前記監視予測手段は、
任意の予測モデルに基づき前記予測監視データを算出し、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする。
The invention according to
The prediction monitoring data is calculated based on an arbitrary prediction model, and the monitoring policy is changed to increase the monitoring frequency and expand the monitoring target and the monitoring items.
請求項3記載の発明は、請求項2記載のネットワーク監視装置において
前記監視設定管理手段は、
前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置に将来障害が検出されるものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする。
The invention according to claim 3 is the network monitoring device according to
If it is predicted that a future failure will be detected in the network or the monitored device based on the predicted monitoring data calculated by the monitoring prediction means, the monitoring policy is changed to change the monitoring frequency. It is characterized by expanding and expanding the monitoring target and monitoring items.
請求項4記載の発明は、請求項1〜請求項3いずれかに記載のネットワーク監視装置において、
前記監視設定管理手段は、
前前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置のサービスレベルが将来低下するものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする。
The invention according to claim 4 is the network monitoring apparatus according to any one of
The monitoring setting management means includes:
If it is predicted that the service level of the network or the monitored device will be reduced in the future based on the prediction monitoring data calculated by the monitoring prediction unit before, the monitoring frequency is changed by changing the monitoring policy. And increase the number of monitoring targets and monitoring items.
請求項5記載の発明は、請求項1〜請求項4いずれかに記載のネットワーク監視装置において、
前記監視予測手段は、
前記監視データに基づいてあらかじめ記憶されている複数の予測モデルを用いて同時に計算し、予測精度が最も高い予測モデルを選択して予測監視データを予測・算出することを特徴とする。
The invention according to claim 5 is the network monitoring device according to any one of
The monitoring prediction means includes
The calculation is performed simultaneously using a plurality of prediction models stored in advance based on the monitoring data, and the prediction monitoring data is predicted and calculated by selecting the prediction model having the highest prediction accuracy.
このように、本発明に係るネットワーク監視装置は、本発明に係るネットワーク監視装置は、監視手段が監視設定手段によって設定された監視ポリシーに基づき、ネットワークまたは被監視対象装置の状態を示す監視データを取得し、監視予測手段が得られた過去および現在の監視データから予測監視データを算出・予測し、監視設定管理手段がこの予測データに基づき監視ポリシーを変更することにより、ネットワークの状態を予測しこの予測された状態に応じて動的に監視項目を変更でき、障害解析に必要な監視データを適切に把握できる。 As described above, the network monitoring apparatus according to the present invention is configured such that the network monitoring apparatus according to the present invention receives monitoring data indicating the state of the network or the monitored apparatus based on the monitoring policy set by the monitoring setting means by the monitoring setting means. The monitoring and prediction means calculates and predicts prediction monitoring data from the past and current monitoring data obtained, and the monitoring setting management means changes the monitoring policy based on this prediction data to predict the network status. Monitoring items can be dynamically changed according to the predicted state, and monitoring data necessary for failure analysis can be appropriately grasped.
図1は本発明に係るネットワーク監視装置の一実施例を示す構成図であり、図6などと共通する部分には同一の符号を付けて適宜説明を省略する。図1と図6との相違点は、図1では監視手段12Aにより監視された過去の監視データおよび現在の監視データに基づき将来の監視データを予測する監視予測手段12Dを有する点、監視設定管理手段12Cが監視予測手段12Dで予測された将来の監視データに基づき将来検知されうる障害に応じた監視ポリシーの監視項目を設定する点などである。
FIG. 1 is a block diagram showing an embodiment of a network monitoring apparatus according to the present invention. Parts common to those in FIG. The difference between FIG. 1 and FIG. 6 is that, in FIG. 1, there is a monitoring prediction unit 12D for predicting future monitoring data based on past monitoring data and current monitoring data monitored by the
図1において、ネットワーク監視装置1は、イーサネット(登録商標)などの有線ネットワークであるネットワーク2を介してたとえばWebサーバなどを提供するサーバまたはネットワーク機器等である被監視対象装置3と接続されている。また特に図示していないが、ネットワーク2と、被監視対象装置3と、図示しないその他のネットワーク機器・各種端末装置とは、ネットワークシステムを構成する。
In FIG. 1, a
ネットワーク監視装置1は、ネットワーク2を介して被監視対象装置3とデータ通信を行う通信手段11、各部・各手段の動作を制御する演算制御部12、記憶手段13などから構成され、ネットワーク2およびネットワークシステム全体の動作を監視する。演算制御部12は、監視手段12Aと、監視設定手段12Bと、監視設定管理手段12C、監視予測手段12Dとを有する。
The
監視手段12Aは、あらかじめ設定されている監視ポリシーに基づいて通信手段11を制御してネットワーク2を介して被監視対象装置3から監視データを収集し、被監視対象装置3、ネットワーク2およびネットワークシステムの挙動を監視・モニタリングする。
The
また監視手段12Aは、これらのデータに基づいてネットワーク2およびネットワークシステム全体の性能を示す性能評価値の基となる性能基礎データを算出し記憶手段13に記憶してネットワーク2およびネットワークシステムの挙動を監視・モニタリングするものでもよい。
Further, the
監視設定手段12Bは、記憶手段13に記憶されている監視ポリシーを設定する。監視設定管理手段12Cは、監視手段12Aにより得られた監視結果に基づき最適な監視内容を導き出して記憶手段13に記憶されている監視ポリシーの再設定・変更を実行し、また監視予測手段12Dで予測された将来の監視データに基づき将来検知されうる障害に応じた監視ポリシーの監視項目を設定する。
The
たとえば、監視設定管理手段12Cは、監視予測手段12Dによりネットワーク2または被監視対象装置3のサービスレベルが低下するものと予測される場合は、監視ポリシー13Aで設定されている監視内容を変更して監視の頻度の増大、および監視対象と監視項目とを拡大するものでもよい。
For example, the monitoring setting management unit 12C changes the monitoring content set in the
監視予測手段12Dは、記憶手段13に記憶されている監視手段12Aが監視した過去の監視データおよび現在の監視データに基づき将来のネットワークまたは被監視対象装置3の状態を予測する、つまり将来得られる監視データ(以下予測監視データという)を予測する。
The monitoring prediction unit 12D predicts the state of the future network or the monitored device 3 based on the past monitoring data monitored by the
記憶手段13は、監視対象・その監視対象に関する監視項目・監視する所定のインターバルなどが関連づけて格納されている監視ポリシー13Aと、監視手段12Aにより収集・算出された、たとえばレスポンスタイム、トラフィック量、エラーパケット数などの監視データと測定時の年月日などが関連づけて格納されている監視データDB13Bと、を有する。
The
図2は本発明のネットワーク監視装置の動作を説明するフロー図である。ステップSP201において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視設定手段12Aにより設定された監視ポリシーに基づき被監視対象装置3の挙動を監視し、監視データを収集し得られたデータを記憶手段13に記憶する。
FIG. 2 is a flowchart for explaining the operation of the network monitoring apparatus of the present invention. In step SP201, the
具体的には、監視手段12Aは監視ポリシーに基づき、図示しないWEBクライアント(またはネットワーク監視装置1)からのリクエストに応じてWEBサーバ(被監視対象装置3)が対応する処理を実行し、WEBクライアントが処理結果を受信するまでの時間(以下、レスポンスタイムという)を、当該WEBサーバにインストールされたソフトウエアなどを利用して10分間隔で測定し、得られたレスポンスタイムを記憶手段13に記憶する。
Specifically, the
ステップSP202において、ネットワーク監視装置1の演算制御部12の監視予測手段12Dは、記憶手段13に格納されている監視手段12Aにより収集・監視した過去の監視データおよび現在の監視データに基づき将来の監視データ(以下、予測監視データという)を予測・算出する。(具体的な動作の一例については図3にて後述する。)
In step SP202, the monitoring prediction unit 12D of the
ステップSP203において、ネットワーク監視装置1の演算制御部12の監視予測手段12Dは、予測監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで将来障害が検知されるか否か判定する。障害が検知されればステップSP204に移行し、それ以外の場合はステップSP201に移行する。
In step SP203, the monitoring prediction unit 12D of the
たとえば監視予測手段12Dは、予測監視データに基づいて、予測監視データの一例である、レスポンスタイムが3時間後にあらかじめ記憶手段13に設定記憶されている閾値(例えば50ミリ秒など)を超えた場合には障害が検知されたものとして判定する。
For example, the monitoring prediction unit 12D is an example of the prediction monitoring data based on the prediction monitoring data, and when the response time exceeds a threshold value (for example, 50 milliseconds) set and stored in the
ステップSP204において、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、将来障害が検知されうる予測監視データに基づき、新たに監視すべき監視項目を抽出し記憶手段13に記憶されている監視ポリシーに追加する。または監視ポリシーを変更するものでもよい。
In step SP204, the monitoring setting management unit 12C of the
具体的には、監視設定管理手段12Cは、図示しないクライアント(またはネットワーク監視装置1)から被監視対象装置3までのネットワーク経路のトラフィック量と被監視対象装置3のCPU使用率を監視項目として自動的に追加する。レスポンスタイムはデータ転送時間(リクエストにかかる時間+レスポンスにかかる時間)とWebサーバでの処理時間の和であるため、レスポンスタイムはトラフィック量とCPU使用率の影響を受けるためである。 Specifically, the monitoring setting management unit 12C automatically monitors the traffic amount of the network path from the client (or the network monitoring device 1) (not shown) to the monitored device 3 and the CPU usage rate of the monitored device 3 as monitoring items. To add. This is because the response time is the sum of the data transfer time (time required for the request + time required for the response) and the processing time in the Web server, and the response time is affected by the traffic volume and the CPU usage rate.
なお、監視設定管理手段12Cは、監視予測手段12Dが将来ネットワークまたは前記被監視対象装置のサービスレベルが低下するものと予測する場合は、監視ポリシーを変更して監視の頻度を増大させ、監視対象および監視項目を拡大する。 When the monitoring prediction unit 12D predicts that the service level of the future network or the device to be monitored will decrease in the future, the monitoring setting management unit 12C changes the monitoring policy to increase the frequency of monitoring. And expand monitoring items.
また、監視設定管理手段12Cは、将来障害が検知されうる予測監視データおよび記憶手段13の監視ポリシー13Aに基づき、新たに監視すべき監視項目を抽出するものでもよい。
Further, the monitoring setting management unit 12C may extract a monitoring item to be newly monitored based on the predicted monitoring data in which a future failure can be detected and the
たとえば、あらかじめ監視ポリシー13Aには、ポリシーのひとつとしてレスポンスタイムの詳細な監視にはトラフィック量・CPU使用率などの監視項目を監視すべき旨が記憶されており、監視設定管理手段12Cは、レスポンスタイムに基づき障害検知がなされた場合は、監視ポリシー13Aに基づいて新たに監視すべき監視項目トラフィック量・CPU使用率を抽出するものでもよい。
For example, the
ステップSP205において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、監視ポリシーに基づき、レスポンスタイムに加え、トラフィック量と被監視対象装置3のCPU使用率のモニタリングを開始し、得られた監視データを記憶手段13に記憶する。
In step SP205, the
ステップSP206において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、収集した監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP207に移行し、それ以外の場合はステップSP209に移行する。
In step SP206, the
ステップSP207において、ネットワーク監視装置1の監視手段12Aは、通信手段11を制御しネットワーク2を介して接続されている特に図示していないユーザのネットワーク管理用の端末に、ネットワークシステムなどで障害が検知された旨を知らせるメッセージ(メールなど)を送信する。または、ネットワーク監視装置1の演算制御手段12は、ネットワーク監視装置1に備えられている表示手段(図示せず)に障害が検知された旨を表示する。
In step SP207, the
ここで、この通知/表示により、ネットワーク管理者が新たに追加された監視項目であるトラフィック量の監視データに基づき検討して、あるネットワーク経路上での輻輳を見つけ出し、それを解決する。 Here, based on this notification / display, the network administrator examines based on the monitoring data of the traffic amount which is a newly added monitoring item, finds out the congestion on a certain network route, and solves it.
ステップSP208において、ネットワーク監視装置1の演算制御部12の監視手段12Aは、収集した監視データに基づいて、ネットワーク2、被監視対象装置3、ネットワークシステムで障害が検知されたか否か判定する。障害が検知されればステップSP207に移行し、それ以外の場合はステップSP209に移行する。
In step SP208, the
ステップSP209において、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、被監視対象装置3における障害がなくなったものと判断し、ステップSP204にて新たに追加した監視項目を削除する。
In step SP209, the monitoring setting management unit 12C of the
具体的には、ネットワーク監視装置1の演算制御部12の監視設定管理手段12Cは、レスポンスタイム(たとえば4秒など)が閾値(たとえば50ミリ秒など)を下回れば、ステップSP204にて新たに追加した監視項目である、トラフィック量とCPU使用率を監視ポリシーから削除する。
Specifically, the monitoring setting management unit 12C of the
この結果、本発明に係るネットワーク監視装置は、監視手段が監視設定手段によって設定された監視ポリシーに基づき、ネットワークまたは被監視対象装置の状態を示す監視データを取得し、監視予測手段が得られた過去および現在の監視データから予測監視データを算出・予測し、監視設定管理手段がこの予測データに基づき監視ポリシーを変更することにより、ネットワークの状態を予測しこの予測された状態に応じて動的に監視項目を変更でき、障害解析に必要な監視データを適切に把握できる。 As a result, the network monitoring apparatus according to the present invention obtains monitoring data indicating the state of the network or the monitored apparatus based on the monitoring policy set by the monitoring setting means by the monitoring means, and the monitoring prediction means is obtained. Predictive monitoring data is calculated / predicted from past and current monitoring data, and the monitoring setting management means changes the monitoring policy based on the prediction data, thereby predicting the network state and dynamically responding to the predicted state. Monitoring items can be changed and monitoring data necessary for failure analysis can be properly grasped.
なお、本発明に係るネットワーク監視装置は、監視予測手段12Dが予測した監視データにより問題発生が予測されうる場合は、その旨およびその監視データをネットワーク管理者に通知する予測監視データ通知手段を有するものであってもよい。この場合、予測監視データ通知手段は、通信手段12を制御してネットワーク2を介し接続されている特に図示していないユーザのネットワーク管理用の端末に、ネットワークシステムなどで障害が検知された旨を知らせるメッセージ(メールなど)を送信する。
Note that the network monitoring apparatus according to the present invention has a predicted monitoring data notification means for notifying the network manager of the fact and the monitoring data when the occurrence of a problem can be predicted by the monitoring data predicted by the monitoring prediction means 12D. It may be a thing. In this case, the prediction monitoring data notification means controls the communication means 12 to indicate that a failure has been detected in the network management terminal of the user (not shown) connected via the
このため、監視データにより問題発生が予測されうる場合に、監視データを障害発生前に事前にネットワーク管理者に通知することにより、障害の予知保全が可能となる。また、このような本発明による問題が生じうる予測監視データによる予知保全は、障害自体の予測に加えてさらにその障害解析に必要な情報を必要なタイミングで自動的に(効率良く)取得してできる点で、単なる未来予測による通常の予知保全よりも障害解析、障害の予防に有効である。これにより、障害が予知されてから実際に対応するまでの時間を短縮できる。 For this reason, when the occurrence of a problem can be predicted by the monitoring data, it is possible to predict and maintain the failure by notifying the monitoring data to the network administrator in advance before the failure occurs. In addition, predictive maintenance based on predictive monitoring data that may cause problems according to the present invention automatically obtains information necessary for failure analysis in addition to prediction of the failure itself automatically (efficiently) at a necessary timing. In that respect, it is more effective for failure analysis and prevention than normal predictive maintenance based on future prediction. As a result, it is possible to shorten the time from when a failure is predicted until actually responding.
ここで、本発明に係るネットワーク監視装置は、監視予測手段12Dが過去の監視データおよび現在の監視データに基づき予測監視データを予測する一例について説明する。図3は本発明のネットワーク性能監視装置の動作を説明するフロー図である。 Here, the network monitoring apparatus according to the present invention will describe an example in which the monitoring prediction unit 12D predicts the predicted monitoring data based on the past monitoring data and the current monitoring data. FIG. 3 is a flowchart for explaining the operation of the network performance monitoring apparatus of the present invention.
図3において、ステップSP301において、ネットワーク性能監視装置1の演算制御部12の監視手段12Aは、ネットワーク機器3の監視データ(たとえばレスポンスタイム)を収集する。
In FIG. 3, in step SP301, the
ステップSP302において、ネットワーク性能監視装置1の監視手段12Aは、監視データ(たとえばレスポンスタイム)とその測定を行った年月日などを関連づけて記憶手段13の蓄積情報DB13Bに蓄積・記憶する。
In step SP302, the
ステップSP303において、ネットワーク性能監視装置の監視予測手段12Cは、蓄積情報DB13Aに蓄積・記憶された複数の監視データ(たとえばレスポンスタイム)に基づいて、記憶手段13に格納されている特に図示しない予測モデルDBに格納されている複数の予測モデルを用いて将来の応答時間を予測する。
In step SP303, the monitoring predicting unit 12C of the network performance monitoring apparatus, based on a plurality of monitoring data (for example, response times) stored / stored in the
たとえば、監視予測手段12Cは、蓄積情報DB13Bに記憶されているレスポンスタイムに基づいて1ヶ月の平均レスポンスタイムを算出し、次月度の平均レスポンスタイムを算出(予測)する。図4は、過去の月間レスポンスタイムを示す説明図である。図5は各予測モデルによる予測監視データ(レスポンスタイム)を示す説明図であり、(A)は線形近似を用いたモデルによる予測結果、(B)は対数近似を用いたモデルによる予測結果、(C)は多項式近似を用いたモデルによる予測結果、(D)は累乗近似を用いたモデルによる予測結果、(E)は指数近似を用いたモデルによる予測結果である。 For example, the monitoring prediction unit 12C calculates an average response time for one month based on the response time stored in the accumulated information DB 13B, and calculates (predicts) an average response time for the next month. FIG. 4 is an explanatory diagram showing past monthly response times. FIG. 5 is an explanatory diagram showing prediction monitoring data (response time) by each prediction model, (A) is a prediction result by a model using linear approximation, (B) is a prediction result by a model using logarithmic approximation, C) is a prediction result based on a model using polynomial approximation, (D) is a prediction result based on a model using power approximation, and (E) is a prediction result based on a model using exponential approximation.
監視予測手段12Dは、図8のように過去7ヶ月分の月間平均レスポンスタイム(1月:14ミリ秒、2月:18ミリ秒、3月:24ミリ秒・・・)を算出して記憶手段13に記憶し、図5のように各予測モデルを用いて次月度(8月度)のレスポンスタイムを予測して(たとえば(A)線形近似:34ミリ秒、(B)対数近似:30.6ミリ秒、(C)多項式近似:31.7ミリ秒、(D)累乗近似:31.9ミリ秒、(E)指数近似:36.8ミリ秒)記憶手段13に記憶する。 As shown in FIG. 8, the monitoring predicting means 12D calculates and stores the average monthly response time (January: 14 milliseconds, February: 18 milliseconds, March: 24 milliseconds,...) For the past seven months. The response time of the next month degree (August degree) is predicted using each prediction model as shown in FIG. 5 (for example, (A) linear approximation: 34 milliseconds, (B) logarithmic approximation: 30. 6 milliseconds, (C) polynomial approximation: 31.7 milliseconds, (D) power approximation: 31.9 milliseconds, (E) exponential approximation: 36.8 milliseconds).
ステップSP304において、監視予測手段12Dは、各モデルを用いて算出された予測結果の各予測精度を比較する。 In step SP304, the monitoring prediction unit 12D compares each prediction accuracy of the prediction result calculated using each model.
具体的には、監視予測手段12Dは、各予測モデルにおけるR−2乗値を算出し、このR−2乗値を用いて予測精度を比較する。このR−2乗値は、値が1に近づくほど信頼性が高くなることを示す。 Specifically, the monitoring prediction unit 12D calculates an R-2 power value in each prediction model, and compares the prediction accuracy using the R-2 power value. This R-2 power value indicates that the closer the value is to 1, the higher the reliability.
ステップSP305において、監視予測手段12Dは、予測精度を比較した結果、最も予測精度の高かった予測モデルを選択し、これより以降、応答時間の予測データを算出するための予測モデルとして設定・記憶する。たとえば図8の例では、R−2乗値が最も高い累乗近似を用いた予測モデルを選択する。 In step SP305, the monitoring prediction unit 12D selects the prediction model with the highest prediction accuracy as a result of comparing the prediction accuracy, and thereafter sets and stores it as a prediction model for calculating response time prediction data. . For example, in the example of FIG. 8, the prediction model using the power approximation with the highest R-2 power value is selected.
ステップSP306において、監視予測手段12Dは、ステップSP305で選択された予測モデルを用いてレスポンスタイムの予測データを算出し、記憶手段13に記憶する。また図示しない表示部などに表示する。
In step SP306, the monitoring prediction unit 12D calculates response time prediction data using the prediction model selected in step SP305, and stores it in the
具体的には、監視予測手段12Dは、累乗近似を用いた予測モデルを用いて月間レスポンスタイムの予測値(31.9ミリ秒)を算出し、記憶手段13に記憶する。
Specifically, the monitoring prediction unit 12D calculates a predicted value (31.9 milliseconds) of the monthly response time using a prediction model using power approximation and stores it in the
このように本発明のネットワーク性能監視装置は、ネットワークシステムの将来の監視データを予測することができる。 Thus, the network performance monitoring apparatus of the present invention can predict future monitoring data of the network system.
また、上述の実施例のネットワーク性能監視装置では、被監視対象装置3(Webサーバ)が提供するWebサイトのリソースの取得にかかるレスポンスタイムに基づきネットワークの性能を把握すると説明しているが、特にこれに限定するものではなく、ICMPパケットを用いて応答時間を測定しネットワークの性能を把握するものであってもよい。 In the network performance monitoring apparatus according to the above-described embodiment, it is described that the network performance is grasped based on the response time required to acquire the resources of the website provided by the monitored apparatus 3 (Web server). However, the present invention is not limited to this, and the response time may be measured using an ICMP packet to grasp the network performance.
また、本発明のネットワーク監視装置の演算制御部12は、記憶部13に格納されているOSなどを起動して、このOS上で格納されたプログラムを読み出して実行することによりネットワーク監視装置1全体(たとえば、演算制御部12はプログラムを読み出し実行することにより監視手段12A、監視設定手段12B、監視設定管理手段12C、監視予測手段12Dなどの各手段)を制御し、ネットワーク監視装置固有の動作を行うものでもよい。
In addition, the
このとき記憶手段13は、演算制御手段12によって実行されるプログラムやアプリケーションをプログラム格納エリアに展開し、入力されたデータや、プログラムやアプリケーションの実行時に生じる処理結果などのデータをワークエリアに一時的に記憶する。
At this time, the
以上説明したように、本発明では、ネットワーク監視装置が、ネットワークの状態を予測しこの予測された状態に応じて動的に監視項目を変更でき、障害解析に必要な監視データを適切に把握できるので、ネットワークの障害をより精度高く解析でき、解析結果に基づいて最適に通信資源を制御してネットワークシステム全体の障害の除去および適切な運転に貢献することができる。 As described above, according to the present invention, the network monitoring apparatus can predict the network state, dynamically change the monitoring item according to the predicted state, and can appropriately grasp the monitoring data necessary for failure analysis. Therefore, the failure of the network can be analyzed with higher accuracy, and communication resources can be optimally controlled based on the analysis result, thereby contributing to the removal of the failure of the entire network system and appropriate operation.
1 ネットワーク監視装置
11 通信手段
12 演算制御部
12A 監視手段
12B 監視設定手段
12C 監視変更手段
12D 監視予測手段
13 記憶手段
13A 監視ポリシー
13B 監視データDB
2 ネットワーク
3 ネットワーク機器
DESCRIPTION OF
2 Network 3 Network equipment
Claims (5)
前記監視手段により得られた過去および/または現在の監視データに基づき、前記ネットワークまたは前記被監視対象装置の将来の状態を示す予測監視データを予測・算出する監視予測手段と、
前記監視予測手段により算出された前記予測監視データに基づき前記監視ポリシーを変更する監視設定管理手段と、
を具備することを特徴とするネットワーク監視装置。 Network monitoring having monitoring setting means connected to a monitored device via a network and setting a monitoring policy, and monitoring means for acquiring monitoring data indicating a state of the network or the monitored device based on the monitoring policy In the device
Monitoring and predicting means for predicting and calculating predicted monitoring data indicating the future state of the network or the monitored device based on past and / or current monitoring data obtained by the monitoring means;
Monitoring setting management means for changing the monitoring policy based on the predicted monitoring data calculated by the monitoring prediction means;
A network monitoring apparatus comprising:
任意の予測モデルに基づき前記予測監視データを算出し、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする
請求項1記載のネットワーク監視装置。 The monitoring prediction means includes
The network monitoring apparatus according to claim 1, wherein the predictive monitoring data is calculated based on an arbitrary predictive model, and the monitoring policy is changed to increase the monitoring frequency and expand the monitoring target and the monitoring items.
前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置に将来障害が検出されるものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする
請求項1または請求項2記載のネットワーク監視装置。 The monitoring setting management means includes:
If it is predicted that a future failure will be detected in the network or the monitored device based on the predicted monitoring data calculated by the monitoring prediction means, the monitoring policy is changed to change the monitoring frequency. 3. The network monitoring apparatus according to claim 1, wherein the increase and the monitoring target and the monitoring item are expanded.
前前記監視予測手段により算出された前記予測監視データに基づいて、前記ネットワークまたは前記被監視対象装置のサービスレベルが将来低下するものと予測される場合は、前記監視ポリシーを変更して監視の頻度の増大および監視対象と監視項目とを拡大することを特徴とする
請求項1〜請求項3いずれかに記載のネットワーク監視装置。 The monitoring setting management means includes:
If it is predicted that the service level of the network or the monitored device will be reduced in the future based on the prediction monitoring data calculated by the monitoring prediction unit before, the monitoring frequency is changed by changing the monitoring policy. The network monitoring apparatus according to claim 1, wherein the number of monitoring targets and monitoring items are expanded.
前記監視データに基づいてあらかじめ記憶されている複数の予測モデルを用いて同時に計算し、予測精度が最も高い予測モデルを選択して予測監視データを予測・算出することを特徴とする
請求項1〜請求項4いずれかに記載のネットワーク監視装置。 The monitoring prediction means includes
The prediction monitoring data is predicted and calculated by simultaneously calculating using a plurality of prediction models stored in advance based on the monitoring data, and selecting a prediction model having the highest prediction accuracy. The network monitoring apparatus according to claim 4.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008316681A JP2010141655A (en) | 2008-12-12 | 2008-12-12 | Network monitoring device |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008316681A JP2010141655A (en) | 2008-12-12 | 2008-12-12 | Network monitoring device |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010141655A true JP2010141655A (en) | 2010-06-24 |
Family
ID=42351379
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008316681A Pending JP2010141655A (en) | 2008-12-12 | 2008-12-12 | Network monitoring device |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2010141655A (en) |
Cited By (8)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014507898A (en) * | 2011-01-31 | 2014-03-27 | トムソン ライセンシング | Diagnostic information logging |
| JP2016525828A (en) * | 2013-08-13 | 2016-08-25 | エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. | Transparent network management via software-defined |
| KR101782390B1 (en) * | 2011-06-30 | 2017-10-23 | 에스케이텔레콤 주식회사 | System and method for network information gathering |
| JP2018018251A (en) * | 2016-07-27 | 2018-02-01 | ファナック株式会社 | Numerical controller |
| US20180091541A1 (en) * | 2016-09-28 | 2018-03-29 | International Business Machines Corporation | Providing efficient information tracking with dynamically selected precision |
| US9948532B2 (en) | 2013-12-11 | 2018-04-17 | Mitsubishi Electric Corporation | Information processing apparatus, information processing method, and computer readable medium |
| KR20180130295A (en) * | 2017-05-29 | 2018-12-07 | 주식회사 케이티 | Apparatus for predicting failure of communication network and method thereof |
| JP2019004249A (en) * | 2017-06-13 | 2019-01-10 | 日本電信電話株式会社 | Black list setting apparatus, black list setting method, and black list setting program |
-
2008
- 2008-12-12 JP JP2008316681A patent/JP2010141655A/en active Pending
Cited By (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2014507898A (en) * | 2011-01-31 | 2014-03-27 | トムソン ライセンシング | Diagnostic information logging |
| US10425277B2 (en) | 2011-01-31 | 2019-09-24 | Thomson Licensing | Diagnostic information logging |
| KR101782390B1 (en) * | 2011-06-30 | 2017-10-23 | 에스케이텔레콤 주식회사 | System and method for network information gathering |
| JP2016525828A (en) * | 2013-08-13 | 2016-08-25 | エヌイーシー ラボラトリーズ アメリカ インクNEC Laboratories America, Inc. | Transparent network management via software-defined |
| US9948532B2 (en) | 2013-12-11 | 2018-04-17 | Mitsubishi Electric Corporation | Information processing apparatus, information processing method, and computer readable medium |
| JP2018018251A (en) * | 2016-07-27 | 2018-02-01 | ファナック株式会社 | Numerical controller |
| US20180091541A1 (en) * | 2016-09-28 | 2018-03-29 | International Business Machines Corporation | Providing efficient information tracking with dynamically selected precision |
| US10701099B2 (en) * | 2016-09-28 | 2020-06-30 | International Business Machines Corporation | Providing efficient information tracking with dynamically selected precision |
| KR20180130295A (en) * | 2017-05-29 | 2018-12-07 | 주식회사 케이티 | Apparatus for predicting failure of communication network and method thereof |
| KR102291615B1 (en) * | 2017-05-29 | 2021-08-18 | 주식회사 케이티 | Apparatus for predicting failure of communication network and method thereof |
| JP2019004249A (en) * | 2017-06-13 | 2019-01-10 | 日本電信電話株式会社 | Black list setting apparatus, black list setting method, and black list setting program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2010141655A (en) | Network monitoring device | |
| JP5418250B2 (en) | Abnormality detection apparatus, program, and abnormality detection method | |
| EP2815538B1 (en) | Method and apparatus for rapid disaster recovery preparation in a cloud network | |
| US8161058B2 (en) | Performance degradation root cause prediction in a distributed computing system | |
| JP4720295B2 (en) | Abnormality detection system and maintenance system | |
| US9781040B2 (en) | Congestion detection based on resource utilization information and user quality-of-experience indicators | |
| KR20160042616A (en) | System and method for detecting and predicting anomalies based on analysis of time-series data | |
| JP2010231368A (en) | Monitoring method and monitoring program | |
| US11582154B2 (en) | Method, apparatus, and system for adjusting routing of network traffic or utilization of network nodes | |
| CN106487612A (en) | A kind of server node monitoring method, monitoring server and system | |
| US20160226714A1 (en) | Method and device for monitoring network link and storage medium therefor | |
| JP2004145536A (en) | Management system | |
| JP5874234B2 (en) | Device management apparatus, device management method, and device management program | |
| JP6454133B2 (en) | Quality analysis method, quality analysis apparatus, and network system | |
| US20130227135A1 (en) | Monitoring resource congestion in a network processor | |
| JP2009193238A (en) | System load monitoring method | |
| JP2014112779A (en) | Data transmission controller, data transmission control method, and computer program | |
| JP6792532B2 (en) | Anomaly detection device and abnormality detection method | |
| JP6973405B2 (en) | Measurement control server, communication quality measurement system, measurement agent, method and program | |
| WO2019142414A1 (en) | Network monitoring system and method, and non-transitory computer-readable medium containing program | |
| JP2010068367A (en) | Device for monitoring network performance | |
| JP5677524B2 (en) | COMMUNICATION CONTROL DEVICE, COMMUNICATION CONTROL SYSTEM, AND COMMUNICATION CONTROL METHOD | |
| JP2014010538A (en) | Operation management device, operation management system, and operation management method | |
| JP2005236813A (en) | Network device control device, communication system, and abnormality detection method | |
| JP2011114822A (en) | Device and method for managing network |