JP2004088153A - How to identify network bottlenecks - Google Patents
How to identify network bottlenecks Download PDFInfo
- Publication number
- JP2004088153A JP2004088153A JP2002242416A JP2002242416A JP2004088153A JP 2004088153 A JP2004088153 A JP 2004088153A JP 2002242416 A JP2002242416 A JP 2002242416A JP 2002242416 A JP2002242416 A JP 2002242416A JP 2004088153 A JP2004088153 A JP 2004088153A
- Authority
- JP
- Japan
- Prior art keywords
- network
- bottleneck
- service quality
- determined
- regression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
【課題】ネットワークにおけるボトルネックを一層高い精度で特定できるボトルネック特定方法を提供する。
【解決手段】本発明では、ネットワークの複数の箇所iについてリソースの使用状況Xiを測定すると共にネットワークの特定の箇所のサービス品質Yを測定する。次に、回帰式のモデル関数を決定し、回帰式Yi=fi(Xi)を用いてサービス品質のリソースの使用状況Xiへの回帰分析を行い、さらに、 前記回帰分析工程において得られたサービス品質の推定値Yiとサービス品質の測定値Yとを用いて、寄与率Ri=var(Yi)/var(Y)を求め、寄与率Riが最大となる箇所をボトルネックとして特定する工程とを具える。
【選択図】 図1A bottleneck identification method capable of identifying a bottleneck in a network with higher accuracy is provided.
According to the present invention, a resource use status Xi is measured for a plurality of locations i of a network, and a service quality Y at a specific location of the network is measured. Next, a model function of the regression equation is determined, a regression analysis is performed on the service quality of the service using the regression equation Yi = fi (Xi), and the service quality obtained in the regression analysis step is obtained. Determining the contribution ratio Ri = var (Yi) / var (Y) by using the estimated value Yi of the above and the measured value Y of the service quality, and specifying a position where the contribution ratio Ri is maximum as a bottleneck. I can.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、複数の要素からなるコンピュータシステム及びコンピュータネットワークの性能管理、特にネットワークのボトルネック特定方法及び装置に関するものである。
【0002】
【従来の技術】
コンピュータシステム、およびコンピュータネットワークでは、負荷が高くなると性能劣化が起こり、その結果それらが提供しているサービス品質の劣化を引き起こす。そのため、構築したシステムの提供するサービス品質を維持するには、システム管理者は、
1.システムの性能を定常的に監視し、性能劣化を検知する。
2.性能劣化を検知した際には、改善を施すと最も性能が大きく向上する個所、すなわちボトルネック箇所を特定し、改善策をとる。
の2点を行う必要がある。
【0003】
[システムの性能を定常的に監視する手法]
システムの性能を定常的に監視する手法は、大きく以下の2通りに分類できる。
(リソース使用状況の監視)
システムの各構成要素におけるリソース使用状況のデータを収集し、そのデータからその構成要素の性能、そしてサービス全体の品質を推定し、監視する手法。
この手法では測定のために新たにトラヒックを発生させることはない(パッシブ測定)ため、システムに対する負荷は軽く他のユーザの性能劣化をほとんど引き起こさない。またデータ収集のためプロトコル、項目などの標準化が進んでおり、必要な機能が標準実装されている場合が多く、これまで広く用いられてきた。
【0004】
この手法を用いるためには、事前に各構成要素におけるリソース使用状況とシステムが提供するサービスの品質との関係を明らかにしておく必要がある。その関係は、システムのモデル化を行い、そのモデルに対して解析またはシミュレーションなどを適用することにより求めることができる。その際、モデルが複雑で関係を導き出すことが困難であったり十分モデル化できていないため、モデル上で求めた関係が実システム上の関係と食い違ってくる場合がある。特に近年の研究成果として、インターネットのトラヒックは自己相似性を持っていることが明らかになっており、そのためシステムの性能が従来の検討結果より劣化する傾向にあることが示されている。
【0005】
(サービの品質そのものの推定)
管理対象となるシステム全体の性能、すなわちユーザに提供するサービスの品質そのもの測定し、監視する手法。この測定のためには、ユーザを模擬した測定装置を用いるか、またはユーザがサービスを利用した時の品質をシステム管理者に報告する仕組みを導入する必要がある。
ユーザを模擬した測定装置を用いる場合は、測定のためのトラヒックを流す必要がある(アクティブ測定)。そのため、システムの性能を低下させる可能性があり、また多くの機器を設置しなければならずコストも増大する。しかし近年、社会的に重要な役割を担うシステムや、サービス品質を厳密に保たなくてはいけないサービスを提供するシステムが増加してきており、正確にサービス品質を把握するため本手法を用いられるケースが増えてきている。
ユーザがサービスを利用した時の品質をシステム管理者に報告する仕組みを導入する場合、汎用的な手法が存在しない。ユーザ側の装置やソフトウェアをサービス提供者が配布、または改造する必要があるため、一部の限られたサービスでしか適用できない。
【0006】
[性能劣化の原因となったボトルネック箇所を特定する手法]
システムの構成要素毎のデータを用いず、サービス品質の測定値だけを測定していた場合、ボトルネックの特定はできない。一方、システムの構成要素のリソースの使用状況の監視のみを行っておりサービス品質の測定を行っていない場合、事前に求めた各構成要素におけるリソース使用状況とシステムが提供するサービスの品質との関係から、各要素がサービス品質に与える影響の大きさが見積もられている。
【0007】
【発明が解決しようとする課題】
しかし、前述したように、モデルが複雑であるため、リソースの使用状況とサービス品質との関係を導き出すことが困難な場合も多い。さらに、十分にモデル化できていないためモデル上で求めた関係と実際のシステムとの関係との間に相違点が多く、信頼性が低い欠点もある。
【0008】
さらに、システム全体のサービス品質を各部分毎に分け、各部分に対して行った品質測定の結果を比較してボトルネックを特定する手法もある。しかし、この手法はアクティブ測定の短所(システム性能を低下させる可能性、多くの機器を設置するためのコスト)を大きくする上、サービスの最小単位以上に細かくボトルネックを特定することはできない。例えば、通信経路上で一部分を暗号化している場合、実サービスと同一条件で復号化を行う機器のみをアクティブ測定することは不可能である。
【0009】
従って、本発明の目的は、ネットワークにおけるボトルネックを一層高い精度で特定できるボトルネック特定方法を提供することにある。
【0010】
【課題を解決する手段】
サービス品質が低下した際、ボトルネックにおけるリソースの使用率が高くなるなど、ボトルネックとなるリソースの使用状況の変化とサービス品質の変化には相関があることが見出されている。そこで、各リソースの使用状況とサービス品質の相関の最も強い箇所をボトルネックとすることができる。
【0011】
本発明では、ある時刻におけるサービス品質と各リソースの使用状況を表す数値の組が、多くの時刻区間に対して存在することが前提である。尚、これらの数値は、それぞれを反映しているものであれば測定値そのものであっても加工をしたものであっても良い。尚、加工した値とは、多くの測定の平均値などの統計値などが例としてあげられる。また、データが「多く」存在するとは、以下で行なう回帰分析において、残差の自由度が0でない程度とする。
【0012】
性能管理すべきネットワークの特定の箇所のサービス品質を測定すると共に、当該ネットワークの複数の箇所のリソースの使用状況を測定し、これらリソースの使用状況が測定されたシステムの構成要素(ネットワークの箇所)に順に識別番号を付け、その番号をiとする。サービス品質の測定値をY、リソースの使用率や待ち行列長など使用状況を反映した属性をXiで表し、その測定値をy(t),xi(t)で表す。ただし、Nをリソースを測定したシステム構成要素の数、Tをサンプル数とするとi∈1,2,−−−,N},t∈{l,2,−−−,T}である。
【0013】
ステップ1 回帰式のモデル関数を決定した後、各iに関しYのXiへの回帰分析を行い、回帰式Y=fi(Xi)を導出する。また、回帰式により得られるサービス品質の推定値Yiを、Yi=fi(Xi)とする。また、回帰の残差Eiを、Ei=Y−Yiとする。さらに、それぞれの時刻tにおける値をYi(t),Ei(t)とする。
【0014】
ステップ2 回帰式を用い各箇所毎に求めた値Yiのサービス品質の測定値Yに対する適合度Riを求め、適合度により最も適合していると判定された箇所をボトルネックとして特定する。この適合度として、例えば寄与率を用いることができ、ネットワークの各箇所iに関し寄与率Ri=var(Yi)/var(Y)を求める。ただし、varは分散の不偏推定量を表すものとする。Riが最大となるときXiを用いて良くYが説明できている、すなわち最もボトルネックである可能性が高い箇所であると特定し、出力する。
【0015】
ネットワークの箇所ないし構成要素i毎に異なるモデル関数を用いた場合、特に自由度の異なるモデル関数を用いた場合、自由度の高いモデル関数を用いた方が当てはまり度合が良くなることが明らかになっているため、寄与率を評価基準として用いた場合自由度の影響を受けてしまう。従って、各箇所の自由度が異なる場合、かわりにAIC、BIC,AICCなどの自由度の影響が軽減された評価基準を用いる事ができる。ここで、ネットワークの各箇所iのAIC、BIC及びAICCは以下の式で表される。
【数1】
ここで、miはfiの自由度であり、多項式の場合は次数+1、
Liは尤度であり、
【数2】
これらAIC、BIC、AICCを用いてボトルネックを特定する場合、求められた値が最小となる箇所iをボトルネックとして特定することができる。
なお、ここで求めたボトルネックの識別番号iをIとおく。
【0016】
ステップ3 トラヒックが確率的に発生すると考えた場合、各測定値も確率的に変動するため、ボトルネックを誤判定する確率も存在する。また、XIとXj(j∈{1,−−−,N},j≠I)間で相関が強い場合、回帰式や相関係数が近いものとなるため、さらにボトルネックを誤判定する確率が増加するおそれがある。そこで、本発明の一例として、確率検定手法を用いてボトルネックの特定が誤判定か否かを判断する工程を具える。そして、この判断工程において、構成要素I以外の構成要素についてボトルネックとなる確率が構成要素Iと同程度であるかどうかの判定を次の様に行う。
各j(j∈{1,−−−,N},j≠I)に開し、Ej,EIが正規分布をなしていると仮定し、fiの自由度をdfiとおくと、Fj,I =var (Ej )/var(EI)は自由度(T−dfj,T−dfI)のF分布に従う。そこでFが事前に決めた有意度より大きければEjと EIは同一分布でありfj,fIは同程度に精度良く回帰できている。そのため、構成要素j又はIのどちらがボトルネックであるかは測定結果からは判定できないと判断し、構成要素jもボトルネック候補として出力する。
回帰モデルとして局所回帰など、モデルの自由度が容易に求められない場合は、dfiとして等価自由度を用いることによりFj,I =var (Ej) 9var(EI)に対して同様の検定を行うことができる。従って、箇所i及びjの回帰の残差Ei及びEjの分散が同一か否かをF検定を用いて判断し、得られたF値の結果に基づいてボトルネックの特定が誤判定か否かを判断することができる。
なお、回帰式として線形モデル(1次多項式)を用いた場合、YとXiの相関係数をρY,Xi とおくと、寄与率はρ2Y,Xiと表される。よって、寄与率に基づいた順位づけは相関係数に基づいた順位づけと同義である。
【0017】
【発明の実施の形態】
シミュレーションにより測定したデータに対して、本発明を適用した結果について説明する。
[シミュレーションモデル]
シミュレーションモデルとして用いたネットワークの構成を図1に示す。事業者は、ルータ1、ルータ2に接続された顧客にサーバからファイルをダウンロードするための回線1、回線2を提供している。管理対象は回線1、回線2であり、リソースの使用状況として回線の使用率、サービス品質としてルータ2に接続された疑似顧客が測定したダウンロード時間を測定している。その他の条件を表1に示す。
【0018】
【表1】
【0019】
分析には、サービス品質の測定値(Y)として10秒毎に3KByteのファイルをダウンロードするのに要する時間を測定したものの1分間の平均値を用い、リソース使用状況の測定値(X1,X2)として1分毎の各回線の使用帯域を用いた。シミュレーションは7200秒行い、サンプル数(T)は120である。
【0020】
ソースの使用状況である回線使用率の測定値は、回線1についてはX1=39.1%であり、回線2についてはX2=37.1%であった。
【0021】
尚、実際のボトルネックを明らかにするため、回線1の帯域を十分大きいと考えられる225Mbpsとした場合、回線2の帯域を十分大きいと考えられる225Mbpsとした場合のそれぞれについて個別にシミュレーションを行った。その結果、サービス品質の平均値は表2に示す様になった。この結果より、回線2を十分大きくした場合の方がサービス品質の改善が大きく、回線2がボトルネックであることがわかる。しかし表1に示す条件で行ったシミュレーションでは、回線1、回線2の使用率はそれぞれ39.1%、37.1%であり、単純な回線使用率の比較では回線1がボトルネックであると誤った判断をするおそれがある。すなわち、回線使用率だけを用いて判断したのでは、ボトルネックを正確に特定できないことになる。
【0022】
【表2】
個別シュミレーションによるボトルネックの特定
回線1の帯域を充分大きくした場合 0.0837sec
回線2の帯域を充分大きくした場合 0.00413sec
【0023】
次に、回帰分析の結果について説明する。本例では、ネットワークの複雑性に柔軟に対応するため、5次の回帰式を用いて回帰分析を行う。ここで、回線1及び2の利用率の測定値X1及びX2を用いて得られたサービス品質の推定値Y1及びY2は以下の回帰式から得た。
Y1=f1(X1)=−2.93+(3.35e−06)X1+(−1.31e−12)X1 2+(2.38e−19)X1 3+(−1.95e−26)X1 4+(5.90e−34)X1 5
Y2=f2(X2)=0.163+(8.29e−08)X2+(−1.96e−13)X2 2+(2.59e−19)X2 3+(−1.18e−25)X2 4+(2.22e−32)X2 5
【0024】
回帰分析の結果により得られたサービス品質の回帰曲線、すなわち回帰分析により得られたサービス品質の推定値を測定値と共に図2、3に示す。図2は回線1の回線利用率X1に回帰した結果を示し、図3は回線2の回線利用率X2に回帰した結果を示す。図2及び図3において、横軸は回線使用率を示し、縦軸はサービス品質すなわちファイルのダウンロード所要時間を示し、十字印は測定値を示し、破線は回帰曲線を示す。これらの図からX2の方がYと相関が強く回線2の使用帯域がボトルネックであることは直感的にもわかるが、以降では数値計算によりそれを示す。
【0025】
次に、サービス品質の測定値と回帰分析により得られたサービス品質の推定値について寄与率の計算結果を示す。回線1の回線利用率X1に回帰して得られた推定値に対する寄与率R1及回線2の回線利用率X2に回帰して得られた推定値に対する寄与率びR2は以下の通りである。
R1=0.374 (3)
R1=0.908 (4)
この結果から、回線2の寄与率が最大となり、回線2がボトルネックである旨を出力する。この寄与率から得られた結果は、前述した回線帯域を極めて大きくした個別シミュレーション結果に強く相関しており、ネットワーク中で発生したボトルネックの箇所を高い精度で特定することができることが実証された。
【0026】
X1も X2と同様にボトルネックであるかどうかを、回帰の残差E1とE2が同一分布であるかどうか検定することにより行うこともできる。「E1とE2は同一分布である」と言う帰無仮説に対して回帰の残差のF値F1,2を求めると、
有意度1%で両側検定するときのFの値は1.625であり、帰無仮説は十分棄却でき、E1とE2の差には十分優位な差があると言える。よって、回線1はボトルネックではないと判断する。
【0027】
次に、本発明によるネットワークのボトルネック特定装置について説明する。本発明による装置は、管理すべきネットワークの複数の箇所のリソース使用状況、例えばネットワーク中の複数の回線の回線使用率を測定する手段と、ネットワーク中の特定の箇所のサービス品質を測定する手段、例えばネットワークに接続した模擬端末装置とを具える。そして、性能管理すべきネットワークに応じてモデル関数を決定し、回帰式を用いて測定されたリソースの使用状況について回帰処理を実行し、得られたサービス品質の推定値とサービス品質の測定値との間の寄与率を求め、寄与率が最大となる箇所にボトルネックが発生したものと特定する手段とを具える。
【0028】
【発明の効果】
以上説明したように、本発明によれば、管理すべきネットワーク中の複数箇所のリソース使用状況を測定し、回帰式を用いて得られた測定値に対して回帰分析処理を実行し、得られたサービス品質の推定値とサービス品質の測定値とを用いて寄与率を算出し、寄与率が最大になる箇所をボトルネックとして特定しているので、一層高い精度でボトルネックの発生箇所を特定することができる。
【図面の簡単な説明】
【図1】本発明によるボトルネック特定方法を実証するためのシミュレーションモデルとして用いたネットワークの構成を示す線図である。
【図2】シミュレーションモデルにおいてサービス品質Yを回線1の測定値に回帰した場合の回帰分析結果及び測定値を示すグラフである。
【図3】シミュレーションモデルにおいてサービス品質Yを回線2の測定値に回帰した場合の回帰分析結果及びサービス品質の測定値を示すグラフである。
【符号の説明】
S サーバ
C 顧客端末装置
P 模擬顧客端末装置[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a computer system including a plurality of elements and a performance management of a computer network, and more particularly to a method and apparatus for identifying a bottleneck of a network.
[0002]
[Prior art]
In computer systems and computer networks, performance increases when the load increases, resulting in deterioration in the quality of service provided by them. Therefore, in order to maintain the quality of service provided by the built system,
1. It constantly monitors system performance and detects performance degradation.
2. When the performance degradation is detected, a location where the performance is most greatly improved by improvement is identified, that is, a bottleneck location is specified, and an improvement measure is taken.
It is necessary to perform the following two points.
[0003]
[Method for regularly monitoring system performance]
Methods for constantly monitoring the performance of the system can be roughly classified into the following two methods.
(Monitor resource usage status)
A method that collects data on resource usage in each component of the system, and estimates and monitors the performance of the component and the quality of the entire service from the data.
In this method, no new traffic is generated for the measurement (passive measurement), so that the load on the system is light and the performance of other users is hardly degraded. Standardization of protocols, items, etc. for data collection is progressing, and necessary functions are often implemented as standard, and have been widely used so far.
[0004]
In order to use this method, it is necessary to clarify in advance the relationship between the resource usage status of each component and the quality of service provided by the system. The relationship can be obtained by modeling the system and applying analysis or simulation to the model. At this time, the relationship obtained on the model may be different from the relationship on the real system because the model is complicated and it is difficult to derive the relationship or the model is not sufficiently modeled. In particular, recent research results have shown that Internet traffic has self-similarity, which indicates that the performance of the system tends to be lower than the results of conventional studies.
[0005]
(Estimation of service quality itself)
A method of measuring and monitoring the performance of the entire system to be managed, that is, the quality of the service provided to the user. For this measurement, it is necessary to use a measuring device that simulates a user or to introduce a mechanism for reporting the quality when the user uses the service to a system administrator.
When a measurement device simulating a user is used, it is necessary to flow traffic for measurement (active measurement). As a result, the performance of the system may be reduced, and more equipment must be installed, which increases the cost. However, in recent years, systems that play an important role in society and systems that provide services that require strict service quality are increasing, and cases where this method is used to accurately grasp service quality Is increasing.
When introducing a mechanism for reporting the quality when a user uses a service to a system administrator, there is no general-purpose method. Since the service provider needs to distribute or modify the device and software on the user side, it can be applied only to some limited services.
[0006]
[Method to identify bottleneck location that caused performance degradation]
If only the measured value of the service quality is measured without using the data for each component of the system, the bottleneck cannot be specified. On the other hand, if we only monitor the usage of resources of the system components and do not measure the service quality, the relationship between the resource usage status of each component obtained in advance and the quality of service provided by the system Thus, the magnitude of the influence of each element on the service quality is estimated.
[0007]
[Problems to be solved by the invention]
However, as described above, since the model is complicated, it is often difficult to derive the relationship between the resource usage status and the service quality. Furthermore, since the model cannot be sufficiently modeled, there are many differences between the relationship obtained on the model and the relationship with the actual system, and there is a disadvantage that reliability is low.
[0008]
Further, there is a method of dividing the service quality of the entire system into each part, and comparing the results of the quality measurement performed on each part to identify a bottleneck. However, this method increases the disadvantages of active measurement (possibility of deteriorating system performance, the cost of installing many devices), and cannot identify a bottleneck more than the minimum unit of service. For example, when a part is encrypted on a communication path, it is impossible to perform active measurement only on a device that performs decryption under the same conditions as an actual service.
[0009]
Accordingly, an object of the present invention is to provide a bottleneck identification method capable of identifying a bottleneck in a network with higher accuracy.
[0010]
[Means to solve the problem]
It has been found that, when the service quality is reduced, a change in the usage state of the bottleneck resource and a change in the service quality are correlated, such as an increase in the resource usage rate at the bottleneck. Therefore, a location where the correlation between the usage status of each resource and the service quality is strongest can be set as a bottleneck.
[0011]
The present invention is based on the premise that a set of a service quality at a certain time and a numerical value representing the use state of each resource exists for many time sections. Note that these numerical values may be measured values themselves or processed values as long as they reflect the respective values. The processed value is exemplified by a statistical value such as an average value of many measurements. In addition, the presence of “many” data means that the degree of freedom of the residual is not zero in the regression analysis performed below.
[0012]
The service quality of a specific portion of the network to be performance-managed is measured, the usage of resources at a plurality of locations in the network is measured, and the components of the system in which the usage of these resources is measured (network locations) Are sequentially assigned an identification number, and the number is set to i. Represents a measure of service quality Y, attributes reflecting the usage and queue length, such as resource usage Xi, representing the measured value y (t), x i ( t). Here, if N is the number of system components measuring the resources, and T is the number of samples, i {1,2, ---, N}, t {1,2, ---, T}.
[0013]
Step 1 After determining the regression model function performs regression analysis to X i of Y For each i, derive the regression equation Y = f i a (X i). Further, the estimated value Yi of the service quality obtained by the regression equation is defined as Y i = f i (X i ). Further, the residuals Ei regression, and E i = Y-Y i. Further, let the values at each time t be Y i (t) and E i (t).
[0014]
Step 2 The relevance equation is used to determine the degree of conformity Ri of the value Yi obtained for each point to the measured value Y of the service quality, and the point determined to be the most suitable by the degree of conformity is specified as a bottleneck. For example, a contribution rate can be used as the degree of adaptation, and a contribution rate R i = var (Y i ) / var (Y) is obtained for each point i of the network. Here, var represents an unbiased estimator of the variance. Identify and R i is made describes well Y with X i when the maximum, i.e. be a most bottleneck has a high point, and outputs.
[0015]
It is clear that when a different model function is used for each location or component i of the network, particularly when a model function having a different degree of freedom is used, the use of a model function having a higher degree of freedom is more applicable and better. Therefore, when the contribution rate is used as an evaluation criterion, the degree of freedom is affected. Therefore, when the degrees of freedom of the respective portions are different, an evaluation criterion in which the influence of the degrees of freedom such as AIC, BIC, and AICC is reduced can be used instead. Here, AIC, BIC, and AICC at each point i of the network are represented by the following equations.
(Equation 1)
Here, mi is the degree of freedom of fi, and in the case of a polynomial, the order is +1;
Li is the likelihood,
(Equation 2)
When a bottleneck is specified using these AIC, BIC, and AICC, the location i where the obtained value is minimum can be specified as the bottleneck.
The bottleneck identification number i obtained here is set to I.
[0016]
Step 3 When it is considered that traffic occurs stochastically, each measurement value also fluctuates stochastically, and there is also a probability of erroneously determining a bottleneck. Further, X I and X j (j∈ {1, --- , N}, j ≠ I) When is a strong correlation between, for regression equation and correlation coefficient is close, the more bottlenecks misjudgment There is a possibility that the probability of doing this will increase. Therefore, as an example of the present invention, the method includes a step of determining whether or not the bottleneck is erroneously determined using a probability test method. Then, in this determination step, it is determined whether or not the probability of becoming a bottleneck with respect to the components other than the component I is about the same as that of the component I as follows.
Each j (j∈ {1, ---, N}, j ≠ I) is opened, E j, assuming E I have no normal distribution, placing the freedom of fi and df i, F j, I = var (E j ) / var (E I ) follows an F distribution with degrees of freedom (T-df j , T-df I ). Therefore, if F is greater than the significance determined in advance, E j and E I have the same distribution, and f j and f I can be regressed to the same degree of accuracy. Therefore, it is determined that it is impossible to determine which of the components j or I is the bottleneck from the measurement result, and the component j is also output as a bottleneck candidate.
Such as local regression as a regression model, if the degree of freedom of the model is not easily sought is, F j by using the equivalent freedom as df i, similarly with respect to I = var (E j) 9 var (E I) Can be tested. Therefore, it is determined using the F test whether or not the variances of the regression residuals Ei and Ej of the regression at the points i and j are the same, and whether the bottleneck is erroneously determined based on the obtained F-value result. Can be determined.
In the case of using a linear model (first order polynomial) as a regression equation, RoY correlation coefficients Y and X i, by placing the X i, the contribution rate is expressed as [rho 2 Y, X i. Therefore, the ranking based on the contribution rate is synonymous with the ranking based on the correlation coefficient.
[0017]
BEST MODE FOR CARRYING OUT THE INVENTION
The result of applying the present invention to data measured by simulation will be described.
[Simulation model]
FIG. 1 shows the configuration of a network used as a simulation model. The business operator provides a line 1 and a line 2 for downloading a file from a server to a customer connected to the router 1 and the router 2. The line 1 and line 2 are managed, and the line usage rate is measured as the resource use status, and the download time measured by the pseudo customer connected to the router 2 is measured as the service quality. Table 1 shows other conditions.
[0018]
[Table 1]
[0019]
In the analysis, the measured value of the resource use status (X 1 , X 1 , X 1) The bandwidth used for each line every minute was used as 2 ). The simulation was performed for 7200 seconds, and the number of samples (T) was 120.
[0020]
The measured value of the line utilization rate, which is the source use status, was X1 = 39.1% for line 1, and X2 = 37.1% for line 2.
[0021]
Note that in order to clarify the actual bottleneck, simulations were individually performed for the case where the bandwidth of the line 1 was set to 225 Mbps, which is considered to be sufficiently large, and for the case where the band of the line 2 was set to 225 Mbps, which was considered to be sufficiently large. . As a result, the average value of the service quality was as shown in Table 2. From this result, it can be seen that when the line 2 is sufficiently large, the improvement in service quality is greater, and the line 2 is a bottleneck. However, in the simulations performed under the conditions shown in Table 1, the usage rates of the line 1 and the line 2 are 39.1% and 37.1%, respectively, and a simple comparison of the line usage rates indicates that the line 1 is a bottleneck. There is a risk of making an incorrect decision. In other words, a bottleneck cannot be specified accurately by making a determination using only the line usage rate.
[0022]
[Table 2]
0.0837 sec when the bandwidth of the specific line 1 which is the bottleneck due to individual simulation is made sufficiently large
When the bandwidth of line 2 is sufficiently increased 0.00413 sec
[0023]
Next, the result of the regression analysis will be described. In this example, a regression analysis is performed using a fifth-order regression equation in order to flexibly respond to the complexity of the network. Here, the estimated values Y1 and Y2 of the service quality obtained using the measured values X1 and X2 of the utilization rates of the lines 1 and 2 were obtained from the following regression formula.
Y 1 = f 1 (X 1 ) = - 2.93+ (3.35e-06) X 1 + (- 1.31e-12) X 1 2 + (2.38e-19) X 1 3 + (- 1 .95e-26) X 1 4 + (5.90e-34) X 1 5
Y 2 = f 2 (X 2 ) = 0.163 + (8.29e-08) X 2 + (- 1.96e-13) X 2 2 + (2.59e-19) X 2 3 + (- 1. 18e-25) X 2 4 + (2.22e-32) X 2 5
[0024]
The regression curve of the service quality obtained by the result of the regression analysis, that is, the estimated value of the service quality obtained by the regression analysis is shown in FIGS. FIG. 2 shows the result of returning to the line utilization X1 of the line 1, and FIG. 3 shows the result of returning to the line utilization X2 of the line 2. 2 and 3, the horizontal axis indicates the line usage rate, the vertical axis indicates the service quality, that is, the time required for downloading the file, the cross mark indicates the measured value, and the broken line indicates the regression curve. From these figures, it can be intuitively understood that X2 has a stronger correlation with Y and the band used by the line 2 is a bottleneck, but it will be shown by numerical calculations hereinafter.
[0025]
Next, the calculation results of the contribution ratio for the measured value of the service quality and the estimated value of the service quality obtained by the regression analysis will be described. The contribution ratio R1 to the estimated value obtained by returning to the line utilization ratio X1 of the line 1 and the contribution ratio R2 to the estimated value obtained by returning to the line utilization ratio X2 of the line 2 are as follows.
R 1 = 0.374 (3)
R 1 = 0.908 (4)
From this result, the contribution rate of the line 2 is maximized, and it is output that the line 2 is a bottleneck. The results obtained from this contribution rate are strongly correlated with the individual simulation results described above in which the line bandwidth was extremely large, and it was demonstrated that the location of the bottleneck that occurred in the network could be specified with high accuracy. .
[0026]
Whether X 1 is a bottleneck as well as X 2 can be determined by testing whether the regression residuals E 1 and E 2 have the same distribution. When the F-values F 1 and F 2 of the regression residual are obtained for the null hypothesis that “E 1 and E 2 have the same distribution”,
The value of F when the two-tailed test with a significance level of 1% is 1.625, the null hypothesis is sufficiently rejected, it can be said that the difference between E 1 and E 2 have enough significant difference. Therefore, it is determined that the line 1 is not a bottleneck.
[0027]
Next, a network bottleneck identification device according to the present invention will be described. The apparatus according to the present invention comprises: means for measuring resource use status of a plurality of points in a network to be managed, for example, a line utilization rate of a plurality of lines in the network; and means for measuring a service quality of a specific point in the network. For example, a simulation terminal device connected to a network is provided. Then, a model function is determined according to the network to be performance-managed, regression processing is performed on the resource usage measured using the regression equation, and the obtained service quality estimation value and service quality measurement value are obtained. And a means for determining that a bottleneck has occurred at a position where the contribution ratio is maximum.
[0028]
【The invention's effect】
As described above, according to the present invention, a resource use situation at a plurality of locations in a network to be managed is measured, and a regression analysis process is performed on a measurement value obtained by using a regression equation. The contribution rate is calculated using the estimated value of service quality and the measured value of service quality, and the location where the contribution rate becomes maximum is identified as the bottleneck, so the location where the bottleneck occurred can be identified with higher accuracy can do.
[Brief description of the drawings]
FIG. 1 is a diagram showing a configuration of a network used as a simulation model for demonstrating a bottleneck identification method according to the present invention.
FIG. 2 is a graph showing a regression analysis result and a measured value when service quality Y is regressed to a measured value of a line 1 in a simulation model.
FIG. 3 is a graph showing a regression analysis result and a measured value of service quality when the service quality Y is regressed to a measured value of the line 2 in the simulation model.
[Explanation of symbols]
S Server C Customer terminal device P Simulated customer terminal device
Claims (8)
ネットワークの複数の箇所iについてリソースの使用状況Xiを測定する工程と、
ネットワークの特定の箇所のサービス品質Yを測定する工程と、
回帰式のモデル関数を決定し、回帰式Yi=fi(Xi)を用いてサービス品質のリソースの使用状況Xiへの回帰分析を行う工程と、
前記回帰式を用いて各箇所毎に求めた値Yiのサービス品質の測定値Yに対する適合度Riを求め、適合度Riにより最も適合していると判定された箇所をボトルネックとして特定する工程とを具えることを特徴とするネットワークのボトルネック特定方法。A method for identifying network bottlenecks to be performance-managed,
Measuring the resource usage Xi for a plurality of locations i in the network;
Measuring the quality of service Y at a particular point in the network;
Determining a model function of the regression equation, and performing a regression analysis of the service quality resource usage state Xi using the regression equation Yi = fi (Xi);
A step of determining a fitness level Ri of the value Yi determined for each location with respect to the service quality measurement value Y using the regression equation, and identifying a location determined to be most suitable by the fitness level Ri as a bottleneck; A method for identifying a bottleneck in a network, comprising:
ネットワークの複数の箇所のリソースの使用状況Xiを測定する手段と、
当該ネットワークの特定の箇所のサービス品質Yを測定する手段と、
回帰式Yi=fi(Xi)を用いて、サービス品質Yiのリソースの使用状況Xiへの回帰分析を行い、前記回帰式を用いて各箇所毎に求めた値Yiのサービス品質の測定値Yに対する適合度Riを求め、適合度Riにより最も適合していると判定された箇所をボトルネックとして特定する処理手段とを具えることを特徴とするボトルネック特定装置。An apparatus for identifying a network bottleneck for performance management,
Means for measuring resource usage Xi at a plurality of locations in the network;
Means for measuring the quality of service Y at a particular point in the network;
The regression equation Yi = fi (Xi) is used to perform a regression analysis on the service usage Xi of the service quality Yi, and the value Yi obtained for each location using the regression equation is compared with the measured value Y of the service quality. A bottleneck identification device, comprising: a processing unit that obtains a degree of fitness Ri and identifies a location determined to be most suitable by the degree of fitness Ri as a bottleneck.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002242416A JP2004088153A (en) | 2002-08-22 | 2002-08-22 | How to identify network bottlenecks |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2002242416A JP2004088153A (en) | 2002-08-22 | 2002-08-22 | How to identify network bottlenecks |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2004088153A true JP2004088153A (en) | 2004-03-18 |
Family
ID=32051501
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2002242416A Pending JP2004088153A (en) | 2002-08-22 | 2002-08-22 | How to identify network bottlenecks |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2004088153A (en) |
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN100438451C (en) * | 2004-04-05 | 2008-11-26 | 北京邮电大学 | Judgement detection method of network bottleneck link based on fuzzying mathematics quality estimation model |
| JP2009199533A (en) * | 2008-02-25 | 2009-09-03 | Nec Corp | Operation management device, operation management system, information processing method, and operation management program |
| JP2009199534A (en) * | 2008-02-25 | 2009-09-03 | Nec Corp | Operation management device, operation management system, information processing method, and operation management program |
| JP2011146074A (en) * | 2011-04-26 | 2011-07-28 | Nec Corp | Device and system for managing operation, information processing method, and operation management program |
| JP2013242902A (en) * | 2013-07-22 | 2013-12-05 | Nec Corp | Operation management device, operation management system, information processing method, and operation management program |
-
2002
- 2002-08-22 JP JP2002242416A patent/JP2004088153A/en active Pending
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN100438451C (en) * | 2004-04-05 | 2008-11-26 | 北京邮电大学 | Judgement detection method of network bottleneck link based on fuzzying mathematics quality estimation model |
| JP2009199533A (en) * | 2008-02-25 | 2009-09-03 | Nec Corp | Operation management device, operation management system, information processing method, and operation management program |
| JP2009199534A (en) * | 2008-02-25 | 2009-09-03 | Nec Corp | Operation management device, operation management system, information processing method, and operation management program |
| JP2011146074A (en) * | 2011-04-26 | 2011-07-28 | Nec Corp | Device and system for managing operation, information processing method, and operation management program |
| JP2013242902A (en) * | 2013-07-22 | 2013-12-05 | Nec Corp | Operation management device, operation management system, information processing method, and operation management program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11425049B2 (en) | Selectively monitoring a network of network function chains based on probability of service level agreement violation | |
| US7437611B2 (en) | System and method for problem determination using dependency graphs and run-time behavior models | |
| CN102257520B (en) | Application performance analysis | |
| US8015139B2 (en) | Inferring candidates that are potentially responsible for user-perceptible network problems | |
| CN104584483B (en) | Method and apparatus for automatically determining causes of quality of service degradation | |
| RU2439823C2 (en) | Using filtration and active probing to assess data transfer channel | |
| WO2022055575A1 (en) | It monitoring recommendation service | |
| US7082381B1 (en) | Method for performance monitoring and modeling | |
| CN101485145A (en) | Data transfer path evaluation using filtering and change detection | |
| US7369967B1 (en) | System and method for monitoring and modeling system performance | |
| CN109120463A (en) | Method for predicting and device | |
| US20140115400A1 (en) | Device and method for fault management of smart device | |
| CN115225455B (en) | Abnormal device detection method and device, electronic device and storage medium | |
| CN108322452A (en) | Network closes rule detection method, device, equipment and medium | |
| US7636051B2 (en) | Status monitor apparatus | |
| US7305005B1 (en) | Correlation system and method for monitoring high-speed networks | |
| US8671183B2 (en) | System for internet scale visualization and detection of performance events | |
| WO2006031460A2 (en) | Network testing agent with integrated microkernel operating system | |
| Goseva-Popstojanova et al. | A contribution towards solving the web workload puzzle | |
| JP2004088153A (en) | How to identify network bottlenecks | |
| CN105554786A (en) | Method and device for positioning network problem | |
| EP3345344B1 (en) | Evaluation of network condition | |
| CN112260903A (en) | Link monitoring method and device | |
| Taibi et al. | Leveraging Web browsing performance data for network monitoring: a data-driven approach | |
| JP2017224181A (en) | Analyzer supervising monitored object system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040723 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060216 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060307 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060718 |