JP2002342182A - Operation management support system for network systems - Google Patents
Operation management support system for network systemsInfo
- Publication number
- JP2002342182A JP2002342182A JP2001150272A JP2001150272A JP2002342182A JP 2002342182 A JP2002342182 A JP 2002342182A JP 2001150272 A JP2001150272 A JP 2001150272A JP 2001150272 A JP2001150272 A JP 2001150272A JP 2002342182 A JP2002342182 A JP 2002342182A
- Authority
- JP
- Japan
- Prior art keywords
- operation information
- variable
- managed
- support system
- information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Data Exchanges In Wide-Area Networks (AREA)
- Selective Calling Equipment (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
(57)【要約】
【課題】性能のボトルネックや障害の原因となる構成要
素の一覧を報告し、原因の特定を早期に実現する。
【解決手段】管理対象システム200と、ネットワーク
000と、運用管理サーバ100を備え、管理対象シス
テム200から稼動情報収集アダプタ120を介して収
集された各構成要素の稼動情報は稼動情報格納部140
に格納される。分析演算部150では、任意の、もしく
はあらかじめ設定した値の範囲を越えた稼動情報を1つ
選択し、それ以外の稼動情報との関連の大きさを定量化
する。定量化の演算の際には、稼動情報収集部140か
ら逐次必要な稼動情報を抽出する。演算の対象となった
稼動情報のうち、定量化された関連の値があらかじめ設
定した値の範囲を越えたものについて、性能のボトルネ
ックや障害の原因となっている可能性が高いとし、入出
力部180に報告する。
(57) [Summary] [Problem] To report a list of components causing a performance bottleneck or a failure, and to quickly identify the cause. An operating information storage unit includes an managed system, a network, and an operation management server. The operating information of each component collected from the managed system through an operating information collection adapter is stored in an operating information storage unit.
Is stored in The analysis operation unit 150 selects one piece of operation information that is arbitrarily or out of a predetermined value range, and quantifies the magnitude of the relation with the other pieces of operation information. At the time of the calculation for quantification, necessary operation information is sequentially extracted from the operation information collection unit 140. Of the operation information subject to the calculation, if the quantified related value exceeds the range of the preset value, it is highly likely that it causes a performance bottleneck or failure. This is reported to the output unit 180.
Description
【0001】[0001]
【発明の属する技術分野】本発明はネットワークに接続
された複数のハードウェアとソフトウェアからなるネッ
トワークシステムにおいて稼動状況を管理する方法に関
し、特に性能上のボトルネックとなる構成要素の特定
や、障害の原因となる構成要素の特定において有効な技
術に関するものである。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method for managing an operation status in a network system including a plurality of hardware and software connected to a network, and more particularly to a method for specifying a component which is a bottleneck in performance and for identifying a failure. It relates to technology that is effective in identifying the causal component.
【0002】[0002]
【従来の技術】企業情報システムやiDC(Internet Data
Center)など比較的大規模なネットワークシステムにお
いては、システム管理にかかるコストが高いため、シス
テムの構成要素の稼動状況を集中して管理する統合管理
システムが導入されることが多い。この統合管理システ
ムでは、管理対象となる複数のハードウェアまたはソフ
トウェアの稼動状況に関する情報をオンラインで取得
し、統合管理システムに接続した表示装置に出力する。
管理対象となるシステムの障害を判別するには、あらか
じめ稼動情報に閾値を設定しておく方法や、平均値から
のずれを評価する方法などがあり、障害と判定された場
合、該箇所が報告される。2. Description of the Related Art Corporate information systems and iDC (Internet Data
In a relatively large-scale network system such as the (Center), since the cost of system management is high, an integrated management system for centrally managing the operation status of the components of the system is often introduced. In this integrated management system, information on the operating status of a plurality of hardware or software to be managed is acquired online and output to a display device connected to the integrated management system.
In order to determine the failure of the system to be managed, there are methods such as setting a threshold value in operation information in advance and evaluating the deviation from the average value. If a failure is determined, the location is reported. Is done.
【0003】障害箇所としてあるプログラムのエラー率
が特定されたような場合、それがメモリ容量不足が原因
なのか、CPU負荷が原因なのか、ネットワーク負荷が原
因なのか等、解決のために原因を絞り込む必要がある。
一般に原因の解明には関係がありそうな計算機のシステ
ムログやパラメータの調査、さらにはシステムエンジニ
アの経験と勘に頼る必要があり、解決に時間と労力を要
する。特開平8−65302号公報では、構成要素ごと
に予め関連の大きさを決めておき、障害時には関連の高
い構成要素について稼動情報を追加収集する技術が記述
されている。しかし前記技術では、構成要素どうしの関
連の大きさを予め設定しているために、実際の稼動状況
に応じた関連の大きさは加味されず、必ずしも原因が特
定できなかったり、原因を特定する効率があまり良くな
い。また、従来技術では、管理対象システムの性能を改
善したい場合について、どのハードウェア、もしくはソ
フトウェアが性能上のボトルネックとなっているかを特
定することは、ネットワークシステムの規模が大きくな
るほど難しく、往々にして過剰投資、過少投資を招く。When the error rate of a certain program is identified as a failure point, the cause of the problem is determined as to whether it is due to insufficient memory capacity, CPU load, or network load. It is necessary to narrow down.
In general, it is necessary to investigate the system logs and parameters of a computer that are likely to be related to the elucidation of the cause, and to rely on the experience and intuition of the system engineer, and it takes time and effort to solve the problem. Japanese Patent Application Laid-Open No. 8-65302 describes a technique in which the size of a relationship is determined in advance for each component, and additional operation information is collected for components having a high relationship in the event of a failure. However, in the above-described technology, the magnitude of the relationship between the components is set in advance, so the magnitude of the relationship according to the actual operation status is not taken into account, and the cause cannot always be specified or the cause is specified. Not very efficient. Also, in the prior art, when it is desired to improve the performance of a managed system, it is difficult to identify which hardware or software is a performance bottleneck as the size of the network system increases. Over-investment and under-investment.
【0004】[0004]
【発明が解決しようとする課題】前述の如く、比較的規
模の大きなネットワークシステムにおいては、性能のボ
トルネックや障害の原因の絞込みを行うために、複数の
構成要素の稼動情報を調査する必要があった。本発明が
解決しようとする課題は、管理対象となるシステムの構
成要素間の関係について稼動情報を元に定量化すること
により、性能のボトルネックや障害の原因となる構成要
素を絞り込み、原因の特定を早期に実現できるようにす
ることである。As described above, in a relatively large-scale network system, it is necessary to investigate operation information of a plurality of components in order to narrow down a performance bottleneck or a cause of a failure. there were. The problem to be solved by the present invention is to quantify the relationship between the components of the system to be managed based on the operation information, thereby narrowing down the components causing a performance bottleneck or failure, and This is to enable the identification to be realized early.
【0005】[0005]
【課題を解決するための手段】上記目的を達成するため
に、本発明のネットワークシステムにおける運用管理の
支援システムは、(1)管理機器と通信する手段と、取
得可能な稼動状態を有する1つ以上の構成要素を備える
1台以上の管理対象機器と、前記管理対象機器と通信す
る通信手段と、前記通信手段によって管理対象機器から
構成要素の稼動情報を収集する収集手段と、前記収集手
段により収集された稼動情報を蓄積しておく記憶手段
と、前記記憶手段により蓄積された稼動情報を元に任意
の1つの稼動情報と他の1つ以上の稼動情報の関連の大
きさを定量化する演算手段と、演算結果を元に関連があ
る構成要素を特定する判定手段を備える管理機器と、か
ら構成されることを特徴とする。また、(2)上記
(1)に記載の支援システムにおいて、収集された稼動
情報が、予め各稼動情報に対して設定した閾値の範囲を
逸脱した場合、該当する稼動情報を前記任意の1つの稼
動情報として演算をおこなうことを特徴とする。また、
(3)上記(1)に記載の支援システムにおける演算手
段について、任意の1つの稼動情報を目的変数に、他の
1つ以上の稼動情報を説明変数として重回帰分析を行
い、各説明変数について偏相関係数やF値などの目的変
数に対する寄与を表す統計量を算出することで、関連の
大きさを定量化することを特徴とする。また、(4)上
記(1)に記載の支援システムにおける演算手段につい
て、任意の1つの稼動情報を目的変数、他の1つ以上の
稼動情報を説明変数、予め各稼動情報に対して任意に設
定した値の範囲を異常値域、と定義した場合、目的変数
が異常値域であった時間に対する、前記時間の内説明変
数が同時に異常値域であった時間の割合を、各説明変数
ごとに算出することで、関連の大きさを定量化すること
を特徴とする。また、(5)上記(1)に記載の支援シ
ステムにおける演算手段について、任意の1つの稼動情
報を目的変数、他の1つ以上の稼動情報を説明変数と定
義した場合、管理対象機器の構成要素間の既知の依存関
係を元に、依存の有無に応じて説明変数を演算対象から
除外することを特徴とする。また、(6)上記(1)に
記載の支援システムにおける判定手段について、演算手
段によって定量化された関連の値に対し予め値の範囲を
設定し、前記値の範囲を逸脱しない稼動情報を有する構
成要素について、関連があるとみなし報告することを特
徴とする。また、(7)上記(1)に記載の支援システ
ムにおける判定手段について、演算手段によって定量化
された関連の値が複数ある場合、構成要素を前記関連の
値に応じて順位付けして報告することを特徴とする。In order to achieve the above object, an operation management support system in a network system according to the present invention comprises: (1) means for communicating with a management device; One or more devices to be managed comprising the above components, communication means for communicating with the devices to be managed, collection means for collecting operation information of the components from the devices to be managed by the communication means, and Storage means for storing the collected operation information; and quantifying the magnitude of the relationship between any one of the operation information and one or more other operation information based on the operation information accumulated by the storage means. It is characterized by comprising an arithmetic means and a management device provided with a judging means for specifying a related component based on the arithmetic result. (2) In the support system according to the above (1), when the collected operation information deviates from a threshold range set in advance for each operation information, the corresponding operation information is replaced with the one of the arbitrary ones. The calculation is performed as the operation information. Also,
(3) For the calculation means in the support system according to (1), a multiple regression analysis is performed using any one piece of operation information as an objective variable and one or more other pieces of operation information as an explanatory variable. It is characterized in that the magnitude of the association is quantified by calculating a statistic representing a contribution to an objective variable such as a partial correlation coefficient or an F value. (4) Regarding the calculation means in the support system described in the above (1), any one of the operation information is a target variable, one or more other operation information is an explanatory variable, and any one of the operation information is arbitrarily determined in advance for each operation information. When the set value range is defined as an abnormal value range, the ratio of the time during which the explanatory variable in the time is simultaneously the abnormal value range to the time when the target variable is the abnormal value range is calculated for each explanatory variable. Thus, the size of the association is quantified. (5) Regarding the calculation means in the support system described in (1) above, when any one piece of operation information is defined as a target variable and at least one other piece of operation information is defined as an explanatory variable, It is characterized in that an explanatory variable is excluded from a calculation target depending on the presence or absence of a dependency based on a known dependency between elements. (6) The determination means in the support system according to (1) has a value range set in advance for the related value quantified by the calculation means, and has operation information that does not deviate from the value range. It is characterized by reporting that components are related. (7) Regarding the determination means in the support system according to (1), when there are a plurality of related values quantified by the calculation means, the components are ranked and reported according to the related values. It is characterized by the following.
【0006】[0006]
【発明の実施の形態】図1〜図10は発明を実施する形
態の一例であって、図中同一の符号を付した部分は同一
物を表わし、基本的な構成は図に示す従来のものと同様
である。以下、本発明の実施の形態を添付図面を参照し
て説明する。図1は本発明の実施形態を示すネットワー
クシステムのブロック図である。このシステムは、管理
対象システム200と、ネットワーク000と、運用管
理サーバ100を備えている。DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS FIGS. 1 to 10 show an embodiment of the present invention. In the drawings, the same reference numerals denote the same parts, and the basic structure is the conventional one shown in the drawings. Is the same as Hereinafter, embodiments of the present invention will be described with reference to the accompanying drawings. FIG. 1 is a block diagram of a network system showing an embodiment of the present invention. This system includes a management target system 200, a network 000, and an operation management server 100.
【0007】管理対象システム200は、一台以上の計
算機もしくは一台以上のネットワーク機器を備えてお
り、運用の間稼動情報が稼動情報収集アダプタによって
収集される。ネットワーク機器はネットワークプリン
タ、インテリジェントハブなど固有のIPアドレスを備え
ているがOSを有さない機器である。管理対象システム2
00は通信回線001を用いてネットワーク000と接
続する。図1では便宜上、一本の通信回線001で接続
しているが、管理対象計算機210, 230とネットワ
ーク000が直接複数の通信回線で接続する構成として
も良い。通信回線001は有線、無線どちらでもよい。The managed system 200 includes one or more computers or one or more network devices, and operation information is collected by an operation information collection adapter during operation. Network devices are devices that have unique IP addresses such as network printers and intelligent hubs but do not have an OS. Managed system 2
00 is connected to the network 000 using the communication line 001. In FIG. 1, the connection is made by a single communication line 001 for the sake of convenience. The communication line 001 may be wired or wireless.
【0008】図2は本発明における情報の伝達経路を表
すブロック図である。管理対象システム200から稼動
情報収集アダプタ120によって収集された稼動情報
は、整形され経路52で稼動情報格納部140に格納さ
れる。稼動情報の収集方法には、経路50で稼動情報収
集アダプタ120が収集する方法と、経路51で管理対
象システム200が収集し定期的に稼動収集アダプタに
送る方法があり、どちらでもよい。分析演算部150は
分析を行う際、経路53で稼動情報を稼動情報格納部1
40に取得しに行き、経路54で必要な情報を抽出す
る。入出力部180では経路56で分析の対象を指定
し、経路55で分析結果を表示する。図2における経路
は情報の流れを抽象化して表した物であり、具体的な機
器を要求するものではない。FIG. 2 is a block diagram showing an information transmission path according to the present invention. The operation information collected by the operation information collection adapter 120 from the management target system 200 is formatted and stored in the operation information storage unit 140 via the path 52. As a method of collecting the operation information, there is a method in which the operation information collection adapter 120 collects the information on the path 50 and a method in which the managed system 200 collects the information on the path 51 and periodically sends the collected information to the operation collection adapter. When performing the analysis, the analysis operation unit 150 stores the operation information in the operation information storage unit 1 through the path 53.
At 40, the information is obtained, and necessary information is extracted through a route 54. The input / output unit 180 specifies an analysis target through the path 56 and displays the analysis result through the path 55. The path in FIG. 2 is an abstract representation of the information flow, and does not require a specific device.
【0009】運用管理サーバ100は、稼動情報収集ア
ダプタ120を介して管理対象システムから稼動情報を
収集する手段と、分析部130において収集した稼動情
報を分析する手段と、入出力部180において分析結果
の出力および分析内容を設定する手段を備えている。分
析部130は稼動情報収集アダプタ120から出力され
る稼動情報を格納しておく稼動情報格納部140および
構成要素間の関連の大きさを定量化するための分析演算
部150からなる。図1では便宜上、一台の運用管理サ
ーバ100において上記手段を構成しているが、稼動情
報収集アダプタ120、稼動情報格納部140、分析演
算部150、入出力部180をそれぞれ別のサーバで構
成することも可能である。The operation management server 100 collects operation information from the system to be managed via the operation information collection adapter 120, analyzes the operation information collected by the analysis unit 130, and analyzes the operation result by the input / output unit 180. Means for setting the output and analysis contents. The analysis unit 130 includes an operation information storage unit 140 for storing operation information output from the operation information collection adapter 120 and an analysis operation unit 150 for quantifying the magnitude of the relationship between the components. In FIG. 1, for convenience, the above means are configured in one operation management server 100. However, the operation information collection adapter 120, the operation information storage unit 140, the analysis operation unit 150, and the input / output unit 180 are configured by separate servers. It is also possible.
【0010】ネットワーク000は、管理対象システム
200と運用管理サーバ100との通信を行うための通
信回線であり、有線・無線を問わない。管理対象システ
ム200と運用管理サーバ100が直接通信を行う場合
には、ネットワーク000がない構成も可能である。な
おネットワーク000がインターネットである場合な
ど、複数のファイアーウォールを内包する構成とするこ
ともできる。[0010] The network 000 is a communication line for performing communication between the managed system 200 and the operation management server 100, and may be wired or wireless. When the managed system 200 and the operation management server 100 communicate directly, a configuration without the network 000 is also possible. Note that, for example, when the network 000 is the Internet, a configuration including a plurality of firewalls may be included.
【0011】以下、管理対象システム200の各構成部
の詳細を説明する。図3は図1に示す管理対象システム
の詳細の図である。計算機210はプログラムを解釈、
実行するCPU213、プログラムやデータを読み込むた
めのメモリ214、ネットワークとの接続を行うための
通信インターフェース212、プログラムやデータを格
納する外部記憶装置216から構成される。通信インタ
ーフェース212、CPU213、外部記憶装置216、
メモリ214は相互にデータを送受するためのバス21
1で結合されている。メモリ214には、計算機210
上で動作する一つ以上のプログラムがロードされる。計
算機210が複数のネットワークを仲介する機能を有す
る場合など、一台の管理対象計算機に複数の通信インタ
ーフェースを搭載する構成としてもよい。外部記憶装置
を搭載しない、もしくは複数搭載する構成としても良
い。計算機230も計算機210と同様の構成である。
また、計算機210は、小型のノートパソコンや携帯電
話などネットワークに常時接続せず、利用時のみネット
ワークに接続するような断続的な利用形態を有する移動
端末機器としても良い。Hereinafter, each component of the managed system 200 will be described in detail. FIG. 3 is a detailed diagram of the managed system shown in FIG. The computer 210 interprets the program,
It comprises a CPU 213 to be executed, a memory 214 for reading programs and data, a communication interface 212 for connecting to a network, and an external storage device 216 for storing programs and data. Communication interface 212, CPU 213, external storage device 216,
The memory 214 is a bus 21 for transmitting and receiving data to and from each other.
They are joined by 1. The memory 210 has a computer 210
One or more programs running on it are loaded. For example, when the computer 210 has a function of mediating a plurality of networks, a configuration may be adopted in which a plurality of communication interfaces are mounted on one managed computer. An external storage device may not be mounted, or a plurality of external storage devices may be mounted. The computer 230 has the same configuration as the computer 210.
In addition, the computer 210 may be a mobile terminal device having an intermittent usage mode such as a small notebook personal computer or a mobile phone that does not always connect to the network but connects to the network only when using it.
【0012】サービスとプログラムの関係の一例を図4
に示すサービスはインターネット/イントラネットにお
ける検索サービスなど、ユーザがプログラムの動作を意
識することなく提供される機能である。サービスは、一
つ以上のプログラムから構築される機能であり、一つの
サービスを構築するプログラムが複数の計算機で動作し
ていても良い。プログラムは計算機のメモリにロードさ
れプロセス単位での管理が可能な構成要素である。一つ
のプログラムが複数のサービスを構成しても良い。図4
においてサービス311は計算機210で動作するプロ
グラム215と、計算機230で動作するプログラム2
35から構成されている。FIG. 4 shows an example of the relationship between a service and a program.
Are functions provided without the user being aware of the operation of the program, such as a search service on the Internet / intranet. A service is a function constructed from one or more programs, and a program for constructing one service may be operated by a plurality of computers. The program is a component that is loaded into the memory of the computer and can be managed in process units. One program may constitute a plurality of services. FIG.
, The service 311 includes a program 215 operating on the computer 210 and a program 2 operating on the computer 230.
35.
【0013】図3における管理対象構成要素220は計
算機210を構成するハードウェア要素およびソフトウ
ェア要素のうち稼動情報を収集することによって稼動状
態を監視する要素の範囲を示している。すなわち、ここ
でプログラムC, プログラムE, 通信インターフェースお
よび外部記憶装置は稼動情報を取得しない構成要素であ
る。管理対象構成要素はすべての構成要素を範囲とする
ことができると同時に、任意の構成要素を範囲としない
ことができる。図4における管理対象サービス310
は、図3における管理対象構成要素と同様、稼動状態を
監視するサービスの範囲を示しており、ここでサービス
311を管理対象としている。管理対象サービス310
の範囲は任意であり、管理対象システムで稼動している
すべてのサービス300を含めることが可能であると同
時に、すべてのサービス300を含めないこともでき
る。A managed component 220 in FIG. 3 indicates a range of components of the hardware component and software component of the computer 210 for monitoring the operating state by collecting the operating information. That is, here, the program C, the program E, the communication interface, and the external storage device are components that do not acquire operation information. The managed components can cover all components, but not any components. Managed service 310 in FIG.
3 shows the range of services for monitoring the operation status, similar to the managed components in FIG. 3, and the service 311 is managed here. Managed service 310
Is arbitrary, and it is possible to include all the services 300 operating in the managed system, and not to include all the services 300.
【0014】図5の表420は、図1における稼動情報
収集アダプタ120が稼動情報421を収集する際の収
集対象と収集手段を示している。稼動情報収集アダプタ
120は管理対象構成要素220および管理対象サービ
ス310の範囲内における構成要素の稼動情報について
収集を行い、集計を行った上で稼動情報格納部140に
格納する手段を有する。図5におけるCPU使用率431
について稼動情報収集アダプタ120の動作の詳細を以
下に示す。稼動情報収集アダプタ120は計算機1に対
して、収集ツールAを用いてCPU使用率の収集を行う。収
集ツールAは収集周期5分おきに稼動情報収集アダプタ1
20から起動され、収集した5分毎のCPU使用率をメモリ
もしくは外部記憶装置に格納しておく。稼動情報収集ア
ダプタ120は、5分間隔で収集されたメモリ使用率1時
間分の12個のデータについて平均をとり、稼動情報格納
部140に格納する。図5において、稼動情報収集アダ
プタ120は収集手段として収集ツールを呼び出す記述
となっているが、計算機1が収集ツールをプログラムと
して持ち、自身の収集ツールを自立的に動作させる方法
も可能である。また、収集周期と集計周期が同じ場合な
ど、集計処理を行わず直接稼動情報を稼動情報格納部1
40に格納する方法も可能である。図5は稼動情報収集
アダプタ120の動作定義情報の例であって、収集手段
423、収集周期424、集計周期425、集計方法4
26の項目については必ずしも含まなくても良く、運用
管理サーバ100から接続可能な外部記憶装置に同様の
情報を格納すればよい。自動的に報告を行うための閾値
など、任意の判定条件を表420で定義することも可能
である。A table 420 in FIG. 5 shows collection targets and collection means when the operation information collection adapter 120 in FIG. 1 collects the operation information 421. The operation information collection adapter 120 has a unit that collects operation information of components within the range of the managed component 220 and the managed service 310, collects the information, and stores it in the operation information storage unit 140. CPU usage rate 431 in FIG.
The details of the operation of the operation information collection adapter 120 are described below. The operation information collection adapter 120 collects the CPU usage rate of the computer 1 using the collection tool A. Collection tool A is an operation information collection adapter 1 every 5 minutes
20 and stores the collected CPU usage rate every 5 minutes in a memory or an external storage device. The operation information collection adapter 120 averages twelve data for one hour of the memory usage rate collected at 5-minute intervals, and stores the average in the operation information storage unit 140. In FIG. 5, the operation information collection adapter 120 is described as calling a collection tool as a collection means, but a method in which the computer 1 has the collection tool as a program and operates its own collection tool independently is also possible. Also, when the collection cycle and the aggregation cycle are the same, the operation information is directly stored in the operation information storage unit 1 without performing the aggregation processing.
It is also possible to store the data at 40. FIG. 5 shows an example of the operation definition information of the operation information collection adapter 120. The collection means 423, the collection period 424, the total period 425, and the total method 4 are shown.
The 26 items need not necessarily be included, and similar information may be stored in an external storage device connectable from the operation management server 100. Arbitrary determination conditions, such as a threshold for automatically reporting, can be defined in the table 420.
【0015】稼動情報格納部140は分析演算部150
において演算に利用する稼動情報を格納する。図6に稼
動情報格納部140に格納される稼動情報の一覧を、示
す。表440の行451は、2001年1月17日の12時10分
に計算機1から収集されたCPU使用率の値が22%である
ことを示している。稼動情報格納部140に格納されて
いるデータ量は、管理対象システムを管理する時間が長
いほど稼動情報が蓄積され、多くなる。稼動情報格納部
140には、分析演算において対象とする時間内のすべ
ての稼動情報が、同じ時間幅かつ同じ時刻で格納されて
いる必要がある。すなわち、行451については、2001
年1月17日12時10分の稼動情報が、計算機1のCPU使用率
およびメモリ使用率だけではなく、すべての対象構成要
素について格納されていなければならないということで
ある。ただし、実際の運用においては、ある時刻におい
て収集できなかった稼動情報があることがあるため、そ
の際には稼動情報の該格納場所に直前の値や0や100
など適当な値を格納しておく。図6は稼動情報格納部1
40に格納される稼動情報の一例であって、データ構造
は問わず、運用管理サーバ100から接続可能な外部記
憶装置に同様の情報を格納すればよい。The operation information storage unit 140 includes an analysis operation unit 150
Stores operation information used for calculation. FIG. 6 shows a list of operation information stored in the operation information storage unit 140. Row 451 of Table 440 indicates that the value of the CPU usage rate collected from Computer 1 at 12:10 on January 17, 2001 is 22%. As for the amount of data stored in the operation information storage unit 140, the operation information is accumulated and increases as the time for managing the managed system increases. In the operation information storage unit 140, it is necessary that all operation information within the time targeted in the analysis operation be stored at the same time width and at the same time. That is, for row 451, 2001
That is, the operation information on January 17, 12:10 must be stored not only for the CPU usage rate and the memory usage rate of the computer 1 but also for all target components. However, in actual operation, there may be operation information that could not be collected at a certain time, and in that case, the last value, 0 or 100 is stored in the storage location of the operation information.
And other appropriate values. FIG. 6 shows the operation information storage unit 1
This is an example of operation information stored in the storage 40, and the same information may be stored in an external storage device connectable from the operation management server 100 regardless of the data structure.
【0016】以下で、図1における分析演算部150の
動作の詳細について説明する。図7は、図6の稼動情報
を時刻を軸にグラフ化した図である。管理対象システム
200から収集された稼動情報にはサービス応答時間4
61など合計7つある。分析演算部150は、着目した
稼動情報と他の稼動情報の間の関連の強さを定量化する
手段と、着目した稼動情報に強い関連がある稼動情報を
選択する手段を具備する。着目した稼動情報には、入出
力部180において人間が指定するもの、およびあらか
じめ設定した閾値を越えたものの二通りがある。図8
は、入出力部180においてサービス応答時間461に
ついて分析を行うよう指示した場合の動作について示し
たブロック図である。以下で関連の強さを定量化する手
段として、重回帰分析を用いた方法と、異常時における
寄与率の算出による方法の二通りの分析方法を取り上げ
詳細について説明するが、定量化する手段を複数組み合
わせて用いることも可能である。Hereinafter, the operation of the analysis operation unit 150 in FIG. 1 will be described in detail. FIG. 7 is a diagram in which the operation information of FIG. 6 is graphed with time as an axis. The operation information collected from the managed system 200 includes the service response time 4
There are a total of seven, such as 61. The analysis operation unit 150 includes a unit for quantifying the strength of association between the operation information of interest and other operation information, and a unit for selecting operation information having a strong association with the operation information of interest. There are two types of operation information of interest, one specified by a human in the input / output unit 180 and one exceeding a preset threshold. FIG.
FIG. 9 is a block diagram showing an operation when an instruction is given to perform an analysis on the service response time 461 in the input / output unit 180. The following two methods are used to quantify the strength of the association: a method that uses multiple regression analysis and a method that calculates the contribution rate at the time of abnormality. It is also possible to use a plurality of them in combination.
【0017】重回帰分析を用いて他の稼動情報の中から
サービス応答時間461に関連の大きい稼動情報を選定
する方法を説明する。重回帰分析では、数1に示す重回
帰式を求める。数1においてyは目的変数を、xは説明
変数を、αは回帰係数を、f(x)はxを従属変数とする
任意の関数を表す。f(x)=xである場合、数1は線形
重回帰式であるが、当てはめのよい任意の関数を使用す
ることも可能である。入出力部180では、重回帰分析
を行うための分析条件501として目的変数と説明変数
を指定する。重回帰分析を行う説明変数は任意に選択す
ることができるが、必ず一つ以上選ばなければならな
い。重回帰分析演算部150は分析条件501を解釈
し、指定された稼動情報を稼動情報格納部140から抽
出する。抽出された稼動情報470は、各時刻ごとに一
つの稼動情報の集合として扱う。すなわち数1において
は、ある時刻のyおよびその時刻におけるすべてのxと
して扱うことを意味する。A method of selecting operation information having a high relation to the service response time 461 from other operation information using multiple regression analysis will be described. In the multiple regression analysis, a multiple regression equation shown in Expression 1 is obtained. In Equation 1, y represents an objective variable, x represents an explanatory variable, α represents a regression coefficient, and f (x) represents an arbitrary function having x as a dependent variable. When f (x) = x, Equation 1 is a linear multiple regression equation, but it is also possible to use any function that fits well. The input / output unit 180 specifies an objective variable and an explanatory variable as analysis conditions 501 for performing multiple regression analysis. The explanatory variables for performing multiple regression analysis can be arbitrarily selected, but at least one must be selected. The multiple regression analysis operation unit 150 interprets the analysis condition 501 and extracts specified operation information from the operation information storage unit 140. The extracted operation information 470 is treated as one set of operation information at each time. That is, in Expression 1, it means that it is treated as y at a certain time and all x at that time.
【0018】[0018]
【数1】 稼動情報格納部140から抽出した稼動情報470にお
ける目的変数472と説明変数473の値を用いて重回
帰分析を行い、重回帰式および分析結果を得る。図9は
図8における重回帰式による分析結果の詳細な内容であ
る。説明変数毎の分析結果520から数2の重回帰式が
記述できる。数2の重回帰式を構成する説明変数521
が目的変数472の予測に必要であるかはF値522を
用いて決定する。有意水準α=0.05において説明変
数として採用されるためにはF値が18.513を越えなけれ
ばならず、説明変数521のうちこれに該当するものは
計算機2のメモリ使用率462のみである。すなわち稼
動情報を分析した結果、特許検索サービスのサービス応
答時間461と関連が高い稼動情報は計算機2のメモリ
使用率462であった。分析演算部150は重回帰式と
分析結果のすべてもしくは一部と、十分な関連があると
判定された稼動情報、ここでは計算機2のメモリ使用
率、を入出力部180に出力する。数2の重回帰式の決
定では、ステップワイズ法など、より最適な説明変数を
取捨選択する手段を用いることも可能である。また、説
明変数の選定の際には検定統計量としてF値ではなく、t
値や、赤池情報量基準(AIC)、偏相関係数など他の基準
を用いることも可能であり、その際の選定基準値につい
ても任意の値を指定することができる。(Equation 1) Multiple regression analysis is performed using the values of the objective variable 472 and the explanatory variable 473 in the operation information 470 extracted from the operation information storage unit 140, and a multiple regression equation and an analysis result are obtained. FIG. 9 shows the detailed contents of the analysis result by the multiple regression equation in FIG. The multiple regression equation of Expression 2 can be described from the analysis result 520 for each explanatory variable. Explanatory variables 521 constituting the multiple regression equation of Expression 2
Is necessary for predicting the target variable 472, using the F value 522. In order to be adopted as an explanatory variable at the significance level α = 0.05, the F value must exceed 18.513, and the only one of the explanatory variables 521 that corresponds to this is the memory usage rate 462 of the computer 2. That is, as a result of analyzing the operation information, the operation information closely related to the service response time 461 of the patent search service is the memory usage rate 462 of the computer 2. The analysis operation unit 150 outputs, to the input / output unit 180, the operation information determined to be sufficiently related to all or a part of the multiple regression equation and the analysis result, here, the memory usage rate of the computer 2. In determining the multiple regression equation of Expression 2, it is also possible to use a means for selecting more optimal explanatory variables, such as a stepwise method. In addition, when selecting the explanatory variables, t
It is also possible to use other criteria such as a value, Akaike information criterion (AIC), and partial correlation coefficient, and any value can be designated as a selection reference value at that time.
【0019】[0019]
【数2】 管理対象システム200から収集された図6の稼動情報
を異常時における寄与率による算定方法を用いて分析す
る方法を以下で説明する。異常寄与率の算定における動
作の流れは基本的に重回帰分析のそれに順ずる。入出力
部180において、目的変数に指定された特許検索サー
ビスのサービス応答時間と関連の高い説明変数を異常寄
与率を元に決定する。説明変数は目的変数以外の稼動情
報について、管理対象システム200のすべての構成要
素を対象とすること、もしくは任意に選択することが可
能である。稼動情報470が異常であるということは、
平均値との差が大きいことや、機器の性能・容量限界に
近いこと、機器が正常に動作していないことなどがある
が、いずれにせよ、異常の判定のため任意の閾値を設定
する。数3に異常寄与率の算出式を示す。稼動情報47
0から、目的変数が異常であった時間と、その時間にお
いて説明変数が異常であった時間の合計を算出し、異常
寄与率を各説明変数ごとに求める。異常寄与率は目的変
数が異常の時、説明変数が同時に異常である割合であ
り、関連の可能性を表す指標である。(Equation 2) A method of analyzing the operation information of FIG. 6 collected from the management target system 200 using the calculation method based on the contribution ratio at the time of abnormality will be described below. The flow of operation in calculating the anomalous contribution rate basically follows that of multiple regression analysis. The input / output unit 180 determines an explanatory variable that is highly relevant to the service response time of the patent search service specified as the objective variable based on the abnormal contribution rate. Regarding the operation information other than the objective variable, the explanatory variable can be used for all the components of the managed system 200 or can be arbitrarily selected. If the operation information 470 is abnormal,
The difference from the average value is large, the device is close to the performance / capacity limit, or the device is not operating normally. In any case, an arbitrary threshold value is set to determine an abnormality. Equation 3 shows a formula for calculating the abnormal contribution rate. Operation information 47
From 0, the sum of the time during which the objective variable was abnormal and the time during which the explanatory variable was abnormal at that time is calculated, and the abnormal contribution rate is determined for each explanatory variable. The abnormal contribution rate is a rate at which the explanatory variable is abnormal at the same time when the objective variable is abnormal, and is an index indicating the possibility of association.
【0020】[0020]
【数3】 図10に異常寄与率による分析結果を示す。ここでは異
常判定の手段として、閾値542においてあらかじめ異
常である値の範囲を指定することと、偏差の閾値543
において稼動情報の平均値からの偏差の範囲を指定する
ことを用いたが、任意の閾値を任意の組み合わせで指定
することが可能である。閾値は、図5の稼動情報収集ア
ダプタの動作定義において指定すること、もしくは分析
演算部150や入出力部180で直接指定することがで
きる。図14の異常であった時間544において目的変
数が異常であった時間は4時間であり、この時間の内説
明変数が同時に異常であった時間を数3から算出した値
が異常寄与率545である。関連が高いと決定するため
の異常寄与率の閾値を40%とすると、特許検索サービ
スのサービス応答時間461と関連が高い稼動情報は、
計算機2のメモリ使用率と計算機2のCPU使用率であ
る。分析演算部150は分析結果のすべてもしくは一部
と、十分な関連があると判定された稼動情報、ここでは
計算機2のメモリ使用率と計算機2のCPU使用率、を入
出力部180に出力する。異常寄与率の閾値は、指定し
ないことおよび任意の値を指定することができる。(Equation 3) FIG. 10 shows an analysis result based on the abnormal contribution rate. Here, as a means for determining an abnormality, a range of a value that is abnormal in the threshold 542 is designated in advance, and a threshold 543 for the deviation is set.
Although the specification of the range of deviation from the average value of the operation information is used in the above, any threshold value can be specified in any combination. The threshold can be specified in the operation definition of the operation information collection adapter in FIG. 5, or can be specified directly by the analysis operation unit 150 or the input / output unit 180. The time during which the target variable was abnormal in the abnormal time 544 in FIG. 14 is 4 hours, and the value of the time during which the explanatory variable was abnormal at the same time from Equation 3 is the abnormal contribution rate 545. is there. Assuming that the threshold of the abnormal contribution rate for determining that the relation is high is 40%, the operation information that is highly relevant to the service response time 461 of the patent search service is:
The memory usage rate of the computer 2 and the CPU usage rate of the computer 2 are shown. The analysis calculation unit 150 outputs to the input / output unit 180 operation information determined to be sufficiently related to all or a part of the analysis result, here, the memory usage rate of the computer 2 and the CPU usage rate of the computer 2. . The threshold value of the abnormal contribution rate can be left unspecified and can be set to any value.
【0021】入出力部180は、目的変数と説明変数指
定する手段と、分析結果を表示する手段を備える。稼動
対象システム200の機器構成情報の表示または設定
と、図5における稼動情報収集アダプタの動作定義情報
の表示または設定と、図7における稼動情報のグラフ表
示など付加的な入出力機能を有することも可能である。
入出力部180において、目的変数と説明変数を直接指
定しない場合、閾値を逸脱した場合自動的に分析を行う
ように、閾値の情報を運用管理サーバ内で保持する必要
がある。分析結果の表示の際には、目的変数に関して関
連が高いとみなされた説明変数を一覧表示する。目的変
数もしくは説明変数は本来稼動情報であり、構成要素の
稼動状況を表す指標であることから、ここで表示された
一覧は目的変数が属する構成要素の、性能のボトルネッ
クや障害の原因となっている可能性が高い構成要素の稼
動情報である。サービス応答時間461を目的変数とし
て重回帰分析によって演算した結果である図9を例にと
ると、サービスの性能に影響を与えている稼動情報は計
算機2のメモリ使用率であるとなる。なお、分析演算部
150で関連を定量化する演算方法を複数使用した場合
についても、関連が高いとみなされた説明変数をすべて
表示する。The input / output unit 180 includes means for designating an objective variable and an explanatory variable, and means for displaying an analysis result. It may have additional input / output functions such as display or setting of device configuration information of the operation target system 200, display or setting of operation definition information of the operation information collection adapter in FIG. 5, and graph display of operation information in FIG. It is possible.
In the input / output unit 180, the threshold information needs to be stored in the operation management server so that the analysis is automatically performed when the target variable and the explanatory variable are not directly specified or when the threshold value is exceeded. When displaying the analysis result, a list of explanatory variables considered to be highly related to the objective variable is displayed. Since the target variable or explanatory variable is essentially operating information and an index indicating the operating status of the component, the list displayed here may cause a performance bottleneck or failure of the component to which the objective variable belongs. This is operation information of a component that is highly likely to be in operation. In the example of FIG. 9, which is a result of performing a multiple regression analysis using the service response time 461 as an objective variable, the operation information affecting the service performance is the memory usage rate of the computer 2. Even when a plurality of calculation methods for quantifying the relationship are used in the analysis calculation unit 150, all the explanatory variables regarded as having a high relationship are displayed.
【0022】尚、本発明のネットワークシステムにおけ
る運用管理の支援システムは、上記した実施の形態に限
定されるものではなく、本発明の要旨を逸脱しない範囲
内において種々変更を加え得ることは勿論である。Incidentally, the operation management support system in the network system of the present invention is not limited to the above-described embodiment, and it is needless to say that various changes can be made without departing from the gist of the present invention. is there.
【0023】[0023]
【発明の効果】本発明によれば、ネットワークシステム
の構成要素間の関係の大きさを定量化することにより、
性能のボトルネックや障害の原因となる構成要素の一覧
を報告し、原因の特定を早期に実現することができる。According to the present invention, by quantifying the magnitude of the relationship between the components of the network system,
By reporting a list of components that cause performance bottlenecks and failures, the cause can be identified early.
【図1】本発明のネットワークシステムにおける運用管
理の支援システムの本発明に係る構成の一実施例を示す
ブロック図である。FIG. 1 is a block diagram showing one embodiment of a configuration according to the present invention of an operation management support system in a network system of the present invention.
【図2】図1における情報の伝達経路を表すブロック図
である。FIG. 2 is a block diagram showing a transmission path of information in FIG.
【図3】図1における管理対象システムの各構成部の詳
細図である。FIG. 3 is a detailed diagram of each component of the managed system in FIG. 1;
【図4】図1における管理対象計算機で動作するプログ
ラムとサービスの関係を表すブロック図である。FIG. 4 is a block diagram showing a relationship between a program operating on a managed computer in FIG. 1 and a service.
【図5】図1における稼動情報収集アダプタの動作定義
の一例を示した一覧図である。FIG. 5 is a list showing an example of an operation definition of the operation information collection adapter in FIG. 1;
【図6】図1における稼動情報格納部に格納される稼動
情報の一例を示した一覧図である。FIG. 6 is a list diagram showing an example of operation information stored in an operation information storage unit in FIG. 1;
【図7】図1における管理対象システムから収集された
稼動情報を、時刻を横軸として表示したグラフの一例を
示す図である。FIG. 7 is a diagram illustrating an example of a graph in which operation information collected from the management target system in FIG. 1 is displayed with time as a horizontal axis.
【図8】図1における運用管理サーバについて、分析演
算部における処理の流れを示す説明図である。FIG. 8 is an explanatory diagram showing a flow of processing in an analysis operation unit with respect to the operation management server in FIG. 1;
【図9】図1における分析演算部において、演算手法と
して重回帰分析を用いた場合の分析結果の一例を示す図
である。9 is a diagram illustrating an example of an analysis result when multiple regression analysis is used as a calculation method in the analysis calculation unit in FIG. 1;
【図10】図1における分析演算部において、演算手法
として異常寄与率を算出する方法を用いた場合の分析結
果の一例を示す図である。FIG. 10 is a diagram illustrating an example of an analysis result in a case where a method of calculating an abnormal contribution rate is used as a calculation method in the analysis calculation unit in FIG. 1;
000…ネットワーク、001…通信回線、100…運
用管理サーバ、120…稼動情報収集アダプタ、130
…分析部、140…稼動情報格納部、150…分析演算
部、180…入出力部、200…管理対象システム、2
10…管理対象計算機、211…バス、212…通信イ
ンターフェース、213…CPU、214…メモリ、21
5…プログラム、220…管理対象構成要素、300…
ネットワークシステムが提供するサービス群、310…
管理対象サービス、311…サービスα。000 network, 001 communication line, 100 operation management server, 120 operation information collection adapter, 130
... Analysis unit, 140 ... Operation information storage unit, 150 ... Analysis operation unit, 180 ... Input / output unit, 200 ... Managed system, 2
10: Computer to be managed, 211: Bus, 212: Communication interface, 213: CPU, 214: Memory, 21
5 Program, 220 Management target component, 300
Services provided by the network system, 310 ...
Managed service, 311... Service α.
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04L 12/24 H04L 12/24 12/26 12/26 H04Q 9/00 301 H04Q 9/00 301B 311 311H 321 321E (72)発明者 宮原 次人 神奈川県横浜市中区日本大通5番地の2 日立アイ・エヌ・エス・ソフトウェア株式 会社内 (72)発明者 赤津 雅晴 神奈川県川崎市麻生区王禅寺1099番地 株 式会社日立製作所システム開発研究所内 Fターム(参考) 5B042 GA12 HH20 JJ29 MA14 MC30 5B089 JA35 JA36 JB15 JB16 KA12 KA13 KB04 KC28 MC01 5K030 GA11 HB19 HC01 KA01 KA02 MA01 MB09 5K048 BA21 DA02 DB01 DC01 DC03 EB06 EB11 EB12 GB05 HA01 HA02 ──────────────────────────────────────────────────続 き Continued on the front page (51) Int.Cl. 7 Identification symbol FI Theme coat ゛ (Reference) H04L 12/24 H04L 12/24 12/26 12/26 H04Q 9/00 301 H04Q 9/00 301B 311 311H 321 321E (72) Inventor Tsutomu Miyahara 5-2 Nihon Odori, Naka-ku, Yokohama-shi, Kanagawa Prefecture Inside Hitachi I.S.S. Software Co., Ltd. (72) Masaharu Akatsu 1099 Ozenji Temple, Aso-ku, Kawasaki-shi, Kanagawa Stock Company GA term HB20 JJ29 MA14 MC30 5B089 JA35 JA36 JB15 JB16 KA12 KA13 KB04 KC28 MC01 5K030 GA11 HB19 HC01 KA01 KA02 MA01 MB09 5K048 BA21 DA02 DB01 DC01 DC03 EB06 EB01 HA01
Claims (7)
稼動状態を有する1つ以上の構成要素を備える1台以上
の管理対象機器と、前記管理対象機器と通信する通信手
段と、前記通信手段によって管理対象機器から構成要素
の稼動情報を収集する収集手段と、前記収集手段により
収集された稼動情報を蓄積しておく記憶手段と、前記記
憶手段により蓄積された稼動情報を元に任意の1つの稼
動情報と他の1つ以上の稼動情報の関連の大きさを定量
化する演算手段と、演算結果を元に関連がある構成要素
を特定する判定手段を備える管理機器と、から構成され
ることを特徴とするネットワークシステムにおける運用
管理の支援システム。A communication unit configured to communicate with the managed device; a communication device configured to communicate with the managed device, the communication device configured to communicate with the managed device, the communication device configured to communicate with the managed device; Collecting means for collecting operation information of components from the device to be managed by the means, storage means for storing the operation information collected by the collection means, and arbitrary information based on the operation information accumulated by the storage means. It is composed of arithmetic means for quantifying the magnitude of the association between one piece of operation information and one or more other pieces of operation information, and a management device provided with a judgment means for specifying a related component based on the operation result. An operation management support system for a network system.
情報が、予め各稼動情報に対して設定した閾値の範囲を
逸脱した場合、該当する稼動情報を前記任意の1つの稼
動情報として演算をおこなうことを特徴とするネットワ
ークシステムにおける運用管理の支援システム。2. The method according to claim 1, wherein when the collected operation information deviates from a threshold range set in advance for each operation information, a corresponding operation information is calculated as the arbitrary one operation information. An operation management support system for a network system characterized by performing:
段について、任意の1つの稼動情報を目的変数に、他の
1つ以上の稼動情報を説明変数として重回帰分析を行
い、各説明変数について偏相関係数やF値などの目的変
数に対する寄与を表す統計量を算出することで、関連の
大きさを定量化することを特徴とするネットワークシス
テムにおける運用管理の支援システム。3. A multiple regression analysis is performed on the calculation means in the management device according to claim 1, using any one of the operation information as an objective variable and one or more other operation information as an explanatory variable. An operation management support system for a network system, characterized in that a statistic representing a contribution to an objective variable such as a partial correlation coefficient or an F value is calculated to quantify the magnitude of the association.
段について、任意の1つの稼動情報を目的変数、他の1
つ以上の稼動情報を説明変数、予め各稼動情報に対して
任意に設定した値の範囲を異常値域、と定義した場合、
目的変数が異常値域であった時間に対する、前記時間の
内説明変数が同時に異常値域であった時間の割合を、各
説明変数ごとに算出することで、関連の大きさを定量化
することを特徴とするネットワークシステムにおける運
用管理の支援システム。4. The operation means in the management device according to claim 1, wherein any one of the operation information is a target variable, and
When one or more operation information is defined as an explanatory variable, and a value range arbitrarily set in advance for each operation information is defined as an abnormal value range,
It is characterized in that the ratio of the time during which the explanatory variable is simultaneously in the abnormal value range to the time when the objective variable is in the abnormal value range is calculated for each explanatory variable, thereby quantifying the magnitude of the association. Operation management support system in a network system.
段について、任意の1つの稼動情報を目的変数、他の1
つ以上の稼動情報を説明変数と定義した場合、管理対象
機器の構成要素間の既知の依存関係を元に、依存の有無
に応じて説明変数を演算対象から除外することを特徴と
するネットワークシステムにおける運用管理の支援シス
テム。5. The arithmetic means in the management device according to claim 1, wherein any one piece of operation information is used as a target variable, and
When one or more operation information is defined as an explanatory variable, a network system is characterized in that the explanatory variable is excluded from a calculation target according to the presence or absence of a dependency based on a known dependency between components of the managed device. Operation management support system.
段について、演算手段によって定量化された関連の値に
対し予め値の範囲を設定し、前記値の範囲を逸脱しない
稼動情報を有する構成要素について、関連があるとみな
し報告することを特徴とするネットワークシステムにお
ける運用管理の支援システム。6. A constituent element having operation information that does not deviate from the value range, in which the determination means in the management device according to claim 1 sets a value range in advance for a related value quantified by the calculation means. And an operation management support system in a network system, characterized in that it is reported as relevant.
段について、演算手段によって定量化された関連の値が
複数ある場合、構成要素を前記関連の値に応じて順位付
けして報告することを特徴とするネットワークシステム
における運用管理の支援システム。7. The determining means in the management device according to claim 1, wherein when there are a plurality of related values quantified by the calculating means, the constituent elements are ranked and reported according to the related values. An operation management support system for network systems.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001150272A JP2002342182A (en) | 2001-05-21 | 2001-05-21 | Operation management support system for network systems |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2001150272A JP2002342182A (en) | 2001-05-21 | 2001-05-21 | Operation management support system for network systems |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2002342182A true JP2002342182A (en) | 2002-11-29 |
Family
ID=18995310
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2001150272A Pending JP2002342182A (en) | 2001-05-21 | 2001-05-21 | Operation management support system for network systems |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2002342182A (en) |
Cited By (21)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2006046297A1 (en) * | 2004-10-28 | 2006-05-04 | Fujitsu Limited | Analyzing method and device |
| JP2006227999A (en) * | 2005-02-18 | 2006-08-31 | Nec Corp | Bottleneck detecting system, measured object server, bottleneck detecting method and program |
| WO2007052327A1 (en) | 2005-10-31 | 2007-05-10 | Fujitsu Limited | Performance failure analysis device, method, program, and performance failure analysis device analysis result display method |
| JP2007122330A (en) * | 2005-10-27 | 2007-05-17 | Nec Corp | Cluster fault estimation system |
| WO2007060721A1 (en) * | 2005-11-24 | 2007-05-31 | Hewlett-Packard Development Company, L.P. | Network administrating device and method of administrating network |
| JP2007323193A (en) * | 2006-05-30 | 2007-12-13 | Nec Corp | System, method and program for detecting abnormality of performance load |
| WO2008007669A1 (en) * | 2006-07-10 | 2008-01-17 | Nec Corporation | Computer system managing device, and computer system managing method |
| WO2008072674A1 (en) * | 2006-12-12 | 2008-06-19 | International Business Machines Corporation | Detection device, program, and detection method |
| WO2008114323A1 (en) * | 2007-03-20 | 2008-09-25 | Fujitsu Microelectronics Limited | Processor/system optimization support apparatus and support method |
| US7506195B2 (en) | 2002-12-26 | 2009-03-17 | Fujitsu Limited | Operation management method and operation management server |
| EP2043297A1 (en) | 2007-09-27 | 2009-04-01 | Fujitsu Limited | System and method for managing devices connected to a computer network |
| WO2009087986A1 (en) * | 2008-01-10 | 2009-07-16 | Nec Corporation | Information providing system, information providing device, information providing method, and program |
| JP2010073151A (en) * | 2008-09-22 | 2010-04-02 | Nec Corp | Method for locating cause of performance degradation in cluster system, and the cluster system |
| JP2010079811A (en) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | Computer system, method of detecting predictor of failure of computer system, and program |
| US7975186B2 (en) | 2008-02-25 | 2011-07-05 | Nec Corporation | Operations management apparatus, operations management system, data processing method, and operations management program |
| US8225144B2 (en) | 2008-02-25 | 2012-07-17 | Nec Corporation | Operations management apparatus, operations management system, data processing method, and operations management program |
| JP2013114439A (en) * | 2011-11-29 | 2013-06-10 | Nomura Research Institute Ltd | Analysis device and analysis method |
| JP2013242899A (en) * | 2013-07-18 | 2013-12-05 | Nec Corp | Monitoring control system, monitoring control method, monitoring control server, and monitoring control program |
| US9049079B2 (en) | 2011-12-21 | 2015-06-02 | International Business Machines Corporation | Optimizing software configuration values using CMDB |
| JP2019046407A (en) * | 2017-09-07 | 2019-03-22 | 株式会社日立製作所 | Performance management system, management apparatus, and performance management method |
| JP2019091199A (en) * | 2017-11-14 | 2019-06-13 | 株式会社日立製作所 | Computer, bottleneck identification method, and program |
-
2001
- 2001-05-21 JP JP2001150272A patent/JP2002342182A/en active Pending
Cited By (32)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7506195B2 (en) | 2002-12-26 | 2009-03-17 | Fujitsu Limited | Operation management method and operation management server |
| US8560667B2 (en) | 2004-10-28 | 2013-10-15 | Fujitsu Limited | Analysis method and apparatus |
| WO2006046297A1 (en) * | 2004-10-28 | 2006-05-04 | Fujitsu Limited | Analyzing method and device |
| JP2006227999A (en) * | 2005-02-18 | 2006-08-31 | Nec Corp | Bottleneck detecting system, measured object server, bottleneck detecting method and program |
| JP2007122330A (en) * | 2005-10-27 | 2007-05-17 | Nec Corp | Cluster fault estimation system |
| US7970584B2 (en) | 2005-10-31 | 2011-06-28 | Fujitsu Limited | Performance abnormality analysis apparatus, method, and program, and analysis result display method for performance abnormality analysis apparatus |
| EP1944699A4 (en) * | 2005-10-31 | 2009-04-08 | Fujitsu Ltd | DEVICE, METHOD AND PROGRAM FOR PERFORMANCE FAILURE ANALYSIS AND METHOD FOR DISPLAYING THE RESULT OF PERFORMANCE FAILURE ANALYSIS ANALYSIS |
| WO2007052327A1 (en) | 2005-10-31 | 2007-05-10 | Fujitsu Limited | Performance failure analysis device, method, program, and performance failure analysis device analysis result display method |
| US8359378B2 (en) | 2005-11-24 | 2013-01-22 | Hewlett-Packard Development Company, L.P. | Network system and method of administrating networks |
| WO2007060721A1 (en) * | 2005-11-24 | 2007-05-31 | Hewlett-Packard Development Company, L.P. | Network administrating device and method of administrating network |
| JP2007323193A (en) * | 2006-05-30 | 2007-12-13 | Nec Corp | System, method and program for detecting abnormality of performance load |
| US8171133B2 (en) | 2006-07-10 | 2012-05-01 | Nec Corporation | Management apparatus and management method for computer system |
| WO2008007669A1 (en) * | 2006-07-10 | 2008-01-17 | Nec Corporation | Computer system managing device, and computer system managing method |
| KR101006122B1 (en) | 2006-12-12 | 2011-01-07 | 인터내셔널 비지네스 머신즈 코포레이션 | Detection device, program and detection method |
| WO2008072674A1 (en) * | 2006-12-12 | 2008-06-19 | International Business Machines Corporation | Detection device, program, and detection method |
| JP4996623B2 (en) * | 2006-12-12 | 2012-08-08 | インターナショナル・ビジネス・マシーンズ・コーポレーション | Detection apparatus, program, and detection method |
| US8271981B2 (en) | 2006-12-12 | 2012-09-18 | International Business Machines Corporation | Detecting an extraordinary behavior |
| WO2008114323A1 (en) * | 2007-03-20 | 2008-09-25 | Fujitsu Microelectronics Limited | Processor/system optimization support apparatus and support method |
| US8972795B2 (en) | 2007-03-20 | 2015-03-03 | Spansion Llc | Processor system optimization |
| US8612805B2 (en) | 2007-03-20 | 2013-12-17 | Spansion Llc | Processor system optimization supporting apparatus and supporting method |
| EP2043297A1 (en) | 2007-09-27 | 2009-04-01 | Fujitsu Limited | System and method for managing devices connected to a computer network |
| WO2009087986A1 (en) * | 2008-01-10 | 2009-07-16 | Nec Corporation | Information providing system, information providing device, information providing method, and program |
| US7975186B2 (en) | 2008-02-25 | 2011-07-05 | Nec Corporation | Operations management apparatus, operations management system, data processing method, and operations management program |
| US8225144B2 (en) | 2008-02-25 | 2012-07-17 | Nec Corporation | Operations management apparatus, operations management system, data processing method, and operations management program |
| US8621284B2 (en) | 2008-02-25 | 2013-12-31 | Nec Corporation | Operations management apparatus, operations management system, data processing method, and operations management program |
| JP2010073151A (en) * | 2008-09-22 | 2010-04-02 | Nec Corp | Method for locating cause of performance degradation in cluster system, and the cluster system |
| JP2010079811A (en) * | 2008-09-29 | 2010-04-08 | Hitachi Ltd | Computer system, method of detecting predictor of failure of computer system, and program |
| JP2013114439A (en) * | 2011-11-29 | 2013-06-10 | Nomura Research Institute Ltd | Analysis device and analysis method |
| US9049079B2 (en) | 2011-12-21 | 2015-06-02 | International Business Machines Corporation | Optimizing software configuration values using CMDB |
| JP2013242899A (en) * | 2013-07-18 | 2013-12-05 | Nec Corp | Monitoring control system, monitoring control method, monitoring control server, and monitoring control program |
| JP2019046407A (en) * | 2017-09-07 | 2019-03-22 | 株式会社日立製作所 | Performance management system, management apparatus, and performance management method |
| JP2019091199A (en) * | 2017-11-14 | 2019-06-13 | 株式会社日立製作所 | Computer, bottleneck identification method, and program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2002342182A (en) | Operation management support system for network systems | |
| US6856942B2 (en) | System, method and model for autonomic management of enterprise applications | |
| JP4980581B2 (en) | Performance monitoring device, performance monitoring method and program | |
| CN109412870B (en) | Alarm monitoring method and platform, server and storage medium | |
| US8135824B2 (en) | Method and system to detect a network deficiency | |
| JP5659108B2 (en) | Operation monitoring device, operation monitoring program, and recording medium | |
| JP2004206495A (en) | Management system, management computer, management method and program | |
| EP4583426A1 (en) | Fault root cause location method and apparatus for fronthaul link | |
| CN113204692A (en) | Method and device for monitoring execution progress of data processing task | |
| CN111078503B (en) | Abnormality monitoring method and system | |
| US20090164618A1 (en) | Network system and method of administrating networks | |
| CN119440954A (en) | Server failure prediction method, device, storage medium and electronic device | |
| CN113760634A (en) | A data processing method and device | |
| CN120358147A (en) | Monitoring index dependency analysis and topology establishment method and device and computer equipment | |
| CN118413435A (en) | Distributed cluster node state intelligent monitoring processing method and device | |
| CN115499302A (en) | Monitoring method and device of business system, readable storage medium and electronic equipment | |
| CN120045314A (en) | Resource processing method, system, storage medium and electronic equipment | |
| US20160218913A1 (en) | Method and apparatus of establishing computer network monitoring criteria | |
| CN114726649B (en) | Evaluation method, device, terminal device and storage medium for situational awareness | |
| CN114168405B (en) | Data monitoring method, device, terminal equipment and storage medium | |
| KR20250062908A (en) | A remote monitoring system and method Thereof based on computer's resource usage pattern | |
| CN117336228A (en) | IGP simulation recommendation method, device and medium based on machine learning | |
| CN102567470A (en) | System-level performance data processing method and equipment utilizing same | |
| CN115080363A (en) | System capacity evaluation method and device based on service log | |
| CN119697131B (en) | Industrial Internet data transmission method and system |