[go: up one dir, main page]

WO2012067031A1 - 違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム - Google Patents

違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム Download PDF

Info

Publication number
WO2012067031A1
WO2012067031A1 PCT/JP2011/076054 JP2011076054W WO2012067031A1 WO 2012067031 A1 WO2012067031 A1 WO 2012067031A1 JP 2011076054 W JP2011076054 W JP 2011076054W WO 2012067031 A1 WO2012067031 A1 WO 2012067031A1
Authority
WO
WIPO (PCT)
Prior art keywords
violation
condition
similarity
sign
setting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2011/076054
Other languages
English (en)
French (fr)
Inventor
允裕 大野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012544217A priority Critical patent/JP5831849B2/ja
Priority to US13/823,694 priority patent/US9331912B2/en
Publication of WO2012067031A1 publication Critical patent/WO2012067031A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/16Threshold monitoring
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Definitions

  • the present invention relates to a violation sign condition setting support system, a violation sign condition setting support method, and a violation sign condition setting support program.
  • platform service providers provide customers who want to use IT devices with servers and routers via routers and switching hubs.
  • a server system connected to storage is provided as a service via the network.
  • the system configuration such as the server system software configuration, the server configuration, the network configuration, and the storage configuration is frequently changed due to the introduction of virtualization technology.
  • the platform service provider concludes a service level agreement with the target value such as the availability rate, processing performance, and environmental load of IT equipment as a service level, and manages the operation to maintain the service level.
  • target values such as an operating rate of 99.95% or higher, an average response time compliance rate of 90% or higher, and a power usage efficiency compliance rate of 80% or higher are applicable.
  • the platform service provider needs to detect and promptly detect a sign of a service level violation as soon as possible.
  • Patent Document 1 discloses a technique in which, when the transition of monitoring data deviates from the range based on the statistical processing results of past monitoring data, the transition of the monitoring data is used as a sign of violation.
  • Patent Document 2 discloses a technique in which monitoring data whose rate of coincidence with monitoring data for service level violation reaches a threshold value or more is used as a sign of violation.
  • the present invention has been made to solve the above-described problems, and provides a violation sign condition setting support system, a violation sign condition setting support method, and a violation sign that can reduce the work burden when setting a violation sign condition.
  • the purpose is to provide a condition setting support program.
  • the violation sign condition setting support system of the present invention is a violation sign condition setting support system for supporting setting of a sign of violation condition for determining whether or not a sign of a service level violation has appeared.
  • a first similarity calculating unit that calculates a similarity; a similarity that is calculated between the monitoring data used for the violation condition and the violation predictor condition in the target system and the monitoring data in the other system; Calculated by the second similarity calculator, the similarity calculated by the first similarity calculator, and the second similarity calculator
  • the determination unit that determines whether the violation sign condition set in the other system can be applied to the setting of the violation sign condition of the target system, and the determination unit can apply the condition
  • a display control unit that displays the violation sign condition set in the other system determined to be.
  • the violation sign condition setting support method of the present invention is a violation that controls a violation sign condition setting support system that supports setting of a violation sign condition for determining whether or not a sign of a service level violation has appeared.
  • a predictive condition setting support method which is required in a target system for setting the pre-existing violation condition, a violation condition for determining whether or not the service level is in a violation state, and a request in a system other than the target system
  • a first similarity calculating step for calculating a similarity between the violation condition, monitoring data used for the violation condition and the violation predictor condition in the target system, and the monitoring data in the other system; Calculated in the second similarity calculating step for calculating the similarity between and the first similarity calculating step Whether the violation sign condition set in the other system can be applied to the setting of the violation sign condition in the target system based on the similarity and the similarity calculated in the second similarity calculation step
  • the violation sign condition setting support program of the present invention causes a computer to execute each step included in the violation sign condition setting support method.
  • the violation sign condition setting support system, the violation sign condition setting support method, and the violation sign condition setting support program according to the present invention support setting work of a violation sign condition in a monitored system whose system configuration has been changed.
  • the violation sign condition is a condition for determining whether or not a sign of a service level violation appears in the monitored system.
  • the violation sign condition setting support system 1 is connected to one or a plurality of monitoring devices 3 via a network such as a LAN.
  • the monitoring device 3 is a device that monitors the state of one or a plurality of monitoring target systems 5.
  • the monitoring device 3 includes a data collection unit that collects monitoring data from the monitoring target system 5, a violation determination unit that determines whether or not the monitoring target system 5 is in a service level violation state, and monitoring data of the monitoring target system 5 And a violation predictor condition estimating unit for estimating a violation predictor condition of the monitored system 5 from the determination result of the violation state, a violation sign determining unit for determining whether or not the monitored system 5 is in a violation predictor state, and a monitoring target A notification unit for notifying the administrator that the system 5 is in a violation state or a violation sign state.
  • the monitored system 5 is a server system in which a plurality of servers and storages are connected via a router and a switching hub.
  • the monitoring target system 5 includes, for example, a Web server, a WebAP (Web application) server, a DB (database) server, and a storage.
  • the Web server is a server that forms an interface with the user's computer.
  • the WebAP server is a server that processes application programs provided by websites.
  • the DB server is a database server that references, searches, and updates data stored in the storage in response to a request from the WebAP server.
  • the storage is a storage device that stores application program data.
  • the violation sign condition setting support system 1 physically includes, for example, a CPU (Central Processing Unit), a storage device, and an input / output interface.
  • the storage device includes, for example, a ROM (Read Only Memory) and HDD (Hard Disk Drive) for storing programs and data processed by the CPU, and a RAM (Random Access Memory) mainly used as various work areas for control processing. ) Etc. are included. These elements are connected to each other via a bus.
  • the CPU executes a program stored in the ROM and processes messages received via the input / output interface and data expanded in the RAM, thereby realizing functions of each unit described later.
  • the violation sign condition setting support system 1 functionally includes, for example, a violation condition similarity calculation unit 11, a first similarity determination unit 12, and a monitoring data similarity calculation unit 13. , A second similarity determination unit 14 and a screen generation display unit 15.
  • the violation sign condition setting support system 1 includes a violation condition database 21, a monitoring data database 22, and a violation sign condition database 23 that are referred to by the above-described units.
  • the violation condition similarity calculation unit 11 includes violation conditions required in the monitoring target system 5 (hereinafter referred to as “the set monitoring target system”) that is a setting target of the violation predictive condition and other than the set monitoring target system.
  • the degree of similarity with the violation condition required in each of the monitoring target systems (hereinafter referred to as “other monitoring systems”) is calculated.
  • the violation condition is a condition for determining whether or not the service level is in violation. Examples of the violation condition include, for example, conditions such as an operating rate of 99.95% or higher, an average response time compliance rate of 90% or higher, and a power usage efficiency compliance rate of 80% or higher.
  • the similarity of the violation condition is calculated using, for example, a set similarity calculation method such as a Jackard coefficient, soybean coefficient, or Simpson coefficient, or a vector similarity calculation method such as cosine similarity or Pearson correlation coefficient.
  • the similarity is calculated using the Jackard coefficient
  • the operation rate is 99.9% or more
  • the response time compliance rate at normal time is 95% or more
  • the compliance rate at peak response time is 90% or more
  • power Four conditions that the compliance rate of usage efficiency is 80% or more are set
  • the operation rate is 99.9% or more
  • the compliance rate of response time in normal time is 90% or more
  • three conditions are set such that the compliance rate of power usage efficiency is 80% or more.
  • the degree of similarity is obtained by dividing by “5”, which is a value obtained by subtracting “2”, which is the number of violation conditions common to the monitoring target system A and the other monitoring target system B.
  • the first similarity determination unit 12 determines whether the similarity calculated by the violation condition similarity calculation unit 11 is equal to or higher than the first threshold and / or whether the similarity falls within the first rank from the top. Determine.
  • the first similarity determination unit 12 extracts another monitoring target system that satisfies this condition as a primary candidate.
  • the administrator can set the first threshold value and the first order as appropriate by experiments or the like.
  • the first threshold a lower limit value of a range in which it can be determined that the violation conditions are similar can be set according to the content of the similarity calculated by the violation condition similarity calculation unit 11.
  • the first order it is possible to set the order in which at least the violation sign condition applicable to the set monitoring target system is not excluded.
  • the monitoring data similarity calculation unit 13 calculates the similarity between the monitoring data of the other monitoring target system extracted as the primary candidate and the monitoring data of the set monitoring target system.
  • the monitoring data is time series data that can be used as a determination element when determining the violation condition and the violation sign condition in the monitoring target system.
  • data relating to service levels such as operating rate, average response time, power usage efficiency, data indicating operating status such as availability of hardware and software, availability of communication, CPU usage rate and DISK input / output
  • Data indicating server resource status such as the number of times, DISK free capacity, memory usage, etc.
  • data indicating network performance such as the number of requests, line usage rate, packet discard rate, number of error packets, and the like.
  • the similarity of the monitoring data is obtained by converting time-series monitoring data into a vector sequence every predetermined time, and all combinations between the vector sequences of the two monitored systems are cosine-like. It is calculated by comparing with a vector similarity calculation method such as degree and Pearson correlation coefficient.
  • the vector string a 1 of the set monitoring target system A is (0, 1)
  • the vector string b 1 of the other monitoring target system B is (1, 1).
  • is “ ⁇ / 4”
  • the similarity is “0.71” from the equation (1).
  • the vector string a 1 of the set monitoring target system A is (0, 1)
  • the vector string b 2 of the other monitoring target system B is ( ⁇ 3, 1).
  • is “ ⁇ / 3”
  • the similarity is “0.5” from the equation (1).
  • the vector sequence a 1 of the set monitoring target system A is (0, 1)
  • the vector sequence b 3 of the other monitoring target system B is (1, 0).
  • is “ ⁇ / 2”
  • the similarity is “0” from the equation (1).
  • the second similarity determination unit 14 shown in FIG. 1 has a similarity calculated by the monitoring data similarity calculation unit 13 equal to or higher than the second threshold and / or the similarity is within the second rank from the top. Judge whether it fits.
  • the second similarity determination unit 14 determines that the violation sign condition set in the other monitoring target system that satisfies this condition can be applied to the setting of the violation sign condition of the set monitoring target system.
  • the administrator can set the second threshold and the second order as appropriate by experiments or the like.
  • the second threshold value a lower limit value of a range in which it can be determined that the monitoring data is similar can be set according to the content of the similarity calculated by the monitoring data similarity calculation unit 13.
  • the second order it is possible to set an order in which at least the violation predictor condition applicable to the set monitoring target system is not excluded.
  • the screen generation / display unit 15 sets the violation predictor condition set in the other monitoring target system determined to be applicable by the second similarity determination unit 14 as a candidate for the predictive violation condition set in the set monitoring target system. Generate various screens to display.
  • the screen generation display unit 15 displays the generated various screens on, for example, a display (display device) of the monitoring device 4 that monitors the set monitoring target system.
  • FIG. 4 is a violation sign condition setting screen
  • FIG. 5 is a violation sign condition setting support screen.
  • a description will be given as an example of a screen displayed when the system configuration is changed in the monitoring target system A monitored by the monitoring apparatus A and the violation predictive condition of the monitoring target system A is reset.
  • the violation sign condition setting screen shown in FIG. 4 has an applicability column, a violation sign condition column, and a registration record column.
  • a selection column for selecting whether to apply the violation predictor condition displayed in the violation predictor condition column of the same row to the violation predictor condition of the monitoring target system A is displayed.
  • each violation predictor condition column one of the violation predictor conditions of the monitoring target system A set by the administrator is displayed.
  • the violation sign condition displayed in each violation sign condition column can be reset on a correction screen (not shown) that can be changed by pressing a correction button.
  • each registration record column it is displayed whether or not the same violation predictor condition as the violation predictor condition displayed in the violation predictor condition column on the same line is registered in the other monitoring target system.
  • a link for transition to the violation sign condition setting support screen shown in FIG. 5 is embedded.
  • a list of the pre-existing violation conditions of the monitored systems that have the same pre-existing violation condition displayed in the pre-existing violation condition column on the same line as “Yes” is displayed.
  • the monitoring target system that has a violation predictor condition similar to the violation predictor condition displayed in the violation predictor condition column of the same line as “with similar condition” is set.
  • a list of predictive violation conditions is displayed.
  • the violation sign condition setting support screen shown in FIG. 5 has a monitoring target system name field, a monitoring device name field, a violation sign condition field, and a detailed button field.
  • a name for identifying the monitoring target system is displayed.
  • a name for identifying the monitoring device is displayed.
  • Each violation predictor condition set in the monitoring target system displayed in the monitoring target system name column on the same line is displayed in the violation predicting condition column.
  • the detail button column is a button for displaying, for example, a pop-up screen on the monitoring condition similarity and the monitoring data similarity between the monitoring target system and the monitoring target system A displayed in the monitoring target system name column on the same line. .
  • the display content of the violation sign condition setting support screen shown in FIG. 5 is an example of a transition from “Yes” displayed in the registration result column of the violation sign condition setting screen shown in FIG.
  • a violation predicting condition of “operation rate> 99.95%” is displayed. Therefore, the violation predictor condition setting support screen shown in FIG. 5 displays a list of violation predictor conditions of the monitoring target system in which “operation rate> 99.95%” is set as the violation predictor condition.
  • the violation sign condition setting support system 1 detects the change. Start with that.
  • the violation predictor condition setting support system 1 stores the identifier of the set monitoring target system whose violation condition or system configuration has been changed in the variable X, and the identifiers of all other monitoring target systems other than the set monitoring target system. Are stored in the set S (step S101).
  • the violation condition similarity calculation unit 11 of the violation sign condition setting support system 1 extracts one identifier of the other monitoring target system from the set S (step S102). If no identifier can be extracted from the set S, that is, if there is no identifier extracted from the set S (step S103; NO), the process proceeds to step S107 described later.
  • the violation condition similarity calculation unit 11 stores the extracted identifier of the other monitored system in the variable Y (step S104).
  • the violation condition similarity calculation unit 11 uses the identifier of the set monitoring target system stored in the variable X as a search key and the violation condition acquired from the violation condition database 21 and the other stored in the variable Y. The similarity between the violation condition acquired from the violation condition database 21 using the identifier of the monitoring target system as a search key is calculated (step S105).
  • the violation condition similarity calculation unit 11 sets the identifier of the other monitoring target system stored in the variable Y and the violation condition similarity calculated in step S105 as a set and stores them in the set T (step S106). And it returns to step S102 mentioned above.
  • the first similarity determination unit 12 rearranges each set of data stored in the set T in descending order of the violation condition similarity, and the violation condition similarity is equal to or greater than a first threshold (for example, 0.8).
  • a first threshold for example, 0.8
  • pair data that falls within the first rank (for example, the tenth rank) from the top is extracted and stored in the set T ′ (step S107).
  • the monitoring data similarity calculation unit 13 extracts one identifier of the other monitoring target system from the set T ′ (step S ⁇ b> 108).
  • the monitoring data similarity calculation unit 13 stores the extracted identifier of the other monitoring target system in the variable Y (step S110).
  • the monitoring data similarity calculation unit 13 uses the identifier of the set monitoring target system stored in the variable X as a search key and the monitoring data acquired from the monitoring data database 22 and the other stored in the variable Y. Using the identifier of the monitoring target system as a search key, the similarity between the monitoring data acquired from the monitoring data database 22 is calculated (step S111).
  • the monitoring data similarity calculation unit 13 stores the identifier of the other monitoring target system stored in the variable Y, the violation condition similarity calculated in step S105, and the monitoring data similarity calculated in step S111. Are stored in the set U (step S112). And it returns to step S108 mentioned above.
  • step S109 when the identifier cannot be extracted from the set T ′, that is, when there is no identifier extracted from the set T ′ (step S109; NO), the second similarity determination The unit 14 rearranges each set of data stored in the set U in descending order of the monitoring data similarity, and the monitoring data similarity is equal to or higher than a second threshold (for example, 0.8), and the second order from the top
  • a second threshold for example, 0.8
  • the screen generation display unit 15 generates the violation sign condition setting screen shown in FIG. 4 and the violation sign condition setting support screen shown in FIG. 5 using the variable X and the set U ′ (step S114). It is displayed on the display of the monitoring device 4 that monitors the setting monitoring target system (step S115).
  • the violation sign condition setting support system 1 in the embodiment when the violation condition or the system configuration of the monitoring target system is changed, the violation condition and monitoring data of the set monitoring target system are the same or similar. It is possible to present to the administrator the violation predictive condition set in the other monitoring target system having the violation condition and the monitoring data.
  • the administrator sets the validity of the violation predictor condition to be set for the monitored target system whose violation condition or system configuration has been changed to another monitored system that has the same or similar violation condition and monitoring data. It can be verified with reference to the pre-existing violation condition. Therefore, it is possible to reduce the work burden when setting the violation predictive condition of the monitored system whose violation condition or system configuration has been changed.
  • the method for calculating the similarity of the monitoring data is not limited to this.
  • the monitoring data to be calculated may be filtered and reduced.
  • the similarity of the monitoring data may be calculated using only the monitoring data that does not change with the monitoring data of the set monitoring target system.
  • An invariant relationship refers to a relationship having a degree of correlation greater than or equal to a predetermined threshold.
  • Monitoring data in an invariant relationship can be extracted as follows, for example. First, as shown in FIG. 8, the time-series monitoring data of the set monitoring target system A and the other monitoring target system B are converted into vector sequences for each predetermined time. Subsequently, among the combinations between the vector strings of the two monitored systems, only the combinations between the vector strings in the same time zone are targeted, and a vector similarity calculation method such as cosine similarity or Pearson correlation coefficient is used. Compare and calculate the similarity. Subsequently, when the calculated similarity is greater than or equal to a predetermined threshold value, it is determined that there is an invariant relationship, and is extracted as target data when calculating the similarity of monitoring data. In this extraction, since the similarity is calculated by comparing only the combinations between the vector sequences in the same time period, compared to the case where the similarity is calculated by comparing all the combinations between the vector sequences described in the embodiment. The processing time can be greatly shortened.
  • the first modified example it is possible to filter and reduce the processing target when calculating the similarity of the monitoring data, and therefore it is possible to reduce the time required for calculating the similarity of the monitoring data. it can.
  • the violation condition or the system configuration of the monitoring target system it is possible to promptly present the administrator with a violation predictor condition serving as a reference candidate. Therefore, it is possible to reduce the work burden when setting the violation predictive condition of the monitored system whose violation condition or system configuration has been changed.
  • the violation condition similarity and the monitoring data similarity are calculated again for all data.
  • the present invention is not limited to this.
  • the data is stored as a history, and when calculating the violation condition similarity and the monitoring data similarity, the history is referred to and already calculated. May be skipped and skipped from the similarity calculation process.
  • a violation sign condition setting support system that supports setting of a sign of violation condition for determining whether or not a sign of a service level violation has appeared, and sets the condition for predicting violation First calculating a similarity between a violation condition required in the target system for determining whether or not the service level is in a violation state and the violation condition required in a system other than the target system
  • a similarity calculation unit, a second similarity calculation unit that calculates a similarity between the monitoring data used for the violation condition and the violation sign condition in the target system, and the monitoring data in the other system; , Based on the similarity calculated by the first similarity calculation unit and the similarity calculated by the second similarity calculation unit.
  • a violation predictor condition setting support system comprising: a display control unit configured to display the set violation sign condition.
  • the determination unit has the similarity calculated by the first similarity calculation unit equal to or higher than a first threshold and / or the similarity falls within the first rank from the top.
  • the second system is extracted as a primary candidate, and the second similarity calculation unit includes the monitoring data and the target system of the other system extracted as the primary candidate.
  • the violation sign condition setting support system according to appendix 1, wherein a similarity between the monitoring data and the monitoring data is calculated.
  • the determination unit is such that the similarity calculated by the second similarity calculation unit is greater than or equal to a second threshold and / or the similarity falls within the second rank from the top.
  • the violation sign condition setting support system according to claim 2, wherein the violation sign condition set in the other system satisfying the condition is determined to be applicable to the setting of the sign of violation condition of the target system. .
  • a violation condition for determining whether or not the service level violation state is required in the target system for setting the warning sign condition, and the violation condition required in another system other than the target system.
  • the second similarity calculation step, the similarity calculated in the first similarity calculation step, and the second similarity A determination step of determining whether the violation predictor condition set in the other system is applicable to the setting of the violation predictor condition of the target system based on the similarity calculated in the similarity calculating step; And a display control step for displaying the violation predictor condition set in the other system determined to be applicable in the determination step, and a violation predictor condition setting support method.
  • Appendix 5 A violation warning condition setting support program for causing a computer to execute each step described in Appendix 4.
  • the violation sign condition setting support system, the violation sign condition setting support method, and the violation sign condition setting support program according to the present invention are suitable for reducing the work load when setting the violation sign condition.
  • SYMBOLS 1 Violation precursor condition setting support system, 3 ... Monitoring apparatus, 5 ... Monitoring object system, 11 ... Violation condition similarity calculation part, 12 ... 1st similarity determination part, 13 ... Monitoring data similarity calculation part, 14 ... 2nd similarity determination part, 15 ... Screen generation display part, 21 ... Violation condition database, 22 ... Monitoring data database, 23 ... Violation precursor condition database.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Debugging And Monitoring (AREA)

Abstract

違反予兆条件を設定する際の作業負担を軽減する。被設定監視対象システムの違反条件と他監視対象システムの違反条件との間の類似度を算出する違反条件類似度算出部11と、被設定監視対象システムの監視データと他監視対象システムの監視データとの間の類似度を算出する監視データ類似度算出部13と、違反条件類似度算出部11により算出された類似度および監視データ類似度算出部13により算出された類似度に基づいて、他監視対象システムの違反予兆条件が被設定監視対象システムの違反予兆条件の設定に適用できるか否かを判定する第一および第二の類似度判定部12、14と、適用可能と判定された他監視対象システムの違反予兆条件を監視装置3に表示させる画面生成表示部15と、を備える。

Description

違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム
 本発明は、違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラムに関する。
 サーバやルータ、スイッチングハブ、ストレージなどのIT機器を大量に設置しているデータセンタにおいて、プラットフォームサービス提供者は、IT機器の利用を希望する顧客に対して、ルータやスイッチングハブを介してサーバやストレージを接続したサーバシステムを、ネットワーク経由のサービスとして提供している。データセンタでは、仮想化技術の導入等により、サーバシステムのソフトウェア構成やサーバ構成、ネットワーク構成、ストレージ構成等のシステム構成の変更が頻繁に行われる。
 一方、サーバシステムには、継続して安定した処理を提供する運用管理が要求されている。したがって、プラットフォームサービス提供者は、IT機器の稼働率や処理性能、環境負荷等の目標値をサービスレベルとして定めたサービスレベル契約を顧客との間で締結し、サービスレベルを維持するように運用管理する。サービスレベルとしては、例えば、稼働率が99.95%以上や、平均応答時間の遵守率が90%以上、電力使用効率の遵守率が80%以上等の目標値が該当する。プラットフォームサービス提供者は、サービスレベルを維持するために、サービスレベル違反の予兆をできるだけ早く正確に検出して迅速に対応する必要がある。
 特許文献1には、監視データの推移が、過去の監視データの統計処理結果による範囲から逸脱する場合に、その監視データの推移を違反予兆とする技術が開示されている。また、特許文献2には、サービスレベル違反の監視データとの一致割合が閾値以上に達した監視データを違反予兆とする技術が開示されている。
特開2005-285040号公報 特開2009-289221号公報
 特許文献1の技術では、通常とは異なる監視データの推移を全て違反予兆とする。したがって、例えば、監視データの統計処理が確定しない初期段階や周期的な違反が発生する過渡期段階のサーバシステム、監視データが大きく変動して統計結果が定まらないサーバシステムでは、誤って違反予兆としてしまう誤判断が多くなる。違反予兆の誤りを少なくし正確性を向上させるためには、監視データの統計処理方法や違反予兆条件を適切に設定する必要がある。しかしながら、監視データの統計処理方法や違反予兆条件を適切に設定しようとすると、様々なテストを繰り返し行う等の試行錯誤が伴うため、多大な作業期間や作業工数を要する。
 また、特許文献2の技術では、一致割合の閾値を高くし過ぎると、違反予兆を見逃す原因となり、一致割合の閾値を低くし過ぎると、誤って違反予兆としてしまう誤判断が増加する原因となる。違反予兆の誤りを少なくし正確性を向上させるためには、一致割合の閾値を適切に設定する必要がある。しかしながら、一致割合の閾値を適切に設定しようとすると、様々なテストを繰り返し行う等の試行錯誤が伴うため、多大な作業期間や作業工数を要する。
 本発明は、上述した課題を解決するためになされたものであり、違反予兆条件を設定する際の作業負担を軽減することができる違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラムを提供することを目的とする。
 本発明の違反予兆条件設定支援システムは、サービスレベル違反への予兆が出現している状態であるかどうかを判断するための違反予兆条件の設定を支援する違反予兆条件設定支援システムであって、前記違反予兆条件を設定する対象システムにおいて要求される、サービスレベルの違反状態であるかどうかを判断するための違反条件と、前記対象システム以外の他システムにおいて要求される前記違反条件との間の類似度を算出する第一の類似度算出部と、前記対象システムにおいて前記違反条件および前記違反予兆条件に利用する監視データと、前記他システムにおける前記監視データとの間の類似度を算出する第二の類似度算出部と、前記第一の類似度算出部により算出された類似度、および前記第二の類似度算出部により算出された類似度に基づいて、前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できるか否かを判定する判定部と、前記判定部により前記適用できると判定された前記他システムにおいて設定されている前記違反予兆条件を表示させる表示制御部と、を備える。
 本発明の違反予兆条件設定支援方法は、サービスレベル違反への予兆が出現している状態であるかどうかを判断するための違反予兆条件の設定を支援する違反予兆条件設定支援システムを制御する違反予兆条件設定支援方法であって、前記違反予兆条件を設定する対象システムにおいて要求される、サービスレベルの違反状態であるかどうかを判断するための違反条件と、前記対象システム以外の他システムにおいて要求される前記違反条件との間の類似度を算出する第一の類似度算出ステップと、前記対象システムにおいて前記違反条件および前記違反予兆条件に利用する監視データと、前記他システムにおける前記監視データとの間の類似度を算出する第二の類似度算出ステップと、前記第一の類似度算出ステップにおいて算出された類似度、および前記第二の類似度算出ステップにおいて算出された類似度に基づいて、前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できるか否かを判定する判定ステップと、前記判定ステップにおいて前記適用できると判定された前記他システムにおいて設定されている前記違反予兆条件を表示させる表示制御ステップと、を含む。
 本発明の違反予兆条件設定支援プログラムは、上記違反予兆条件設定支援方法に含まれる各ステップをコンピュータに実行させる。
 本発明によれば、違反予兆条件を設定する際の作業負担を軽減することができる。
実施形態における違反予兆条件設定支援システムの構成を例示するブロック図である。 監視データの類似度を算出する方法を説明するための図である。 監視データの類似度を算出する方法を説明するための図である。 違反予兆条件設定画面の表示画面を例示する図である。 違反予兆条件設定支援画面の表示画面を例示する図である。 実施形態における違反予兆条件設定支援システムの動作を説明するためのフローチャート(その1)である。 実施形態における違反予兆条件設定支援システムの動作を説明するためのフローチャート(その2)である。 第1変形例における監視データの類似度を算出する方法を説明するための図である。
 以下、添付図面を参照して、本発明に係る違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラムの好適な実施形態について説明する。本発明に係る違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラムは、システム構成を変更した監視対象システムにおける違反予兆条件の設定作業を支援するものである。違反予兆条件とは、監視対象システムにおいてサービスレベル違反への予兆が出現している状態であるかどうかを判断するための条件である。
 まず、図1を参照して、実施形態における違反予兆条件設定支援システムの構成について説明する。図1に示すように、違反予兆条件設定支援システム1は、LAN等のネットワークを介して一または複数の監視装置3と接続される。監視装置3は、一または複数の監視対象システム5の状態を監視する装置である。
 監視装置3は、監視対象システム5から監視データを収集するデータ収集部と、監視対象システム5がサービスレベルの違反状態にあるか否かを判定する違反判定部と、監視対象システム5の監視データと違反状態の判定結果とから監視対象システム5の違反予兆条件を推定する違反予兆条件推定部と、監視対象システム5が違反予兆状態にあるか否かを判定する違反予兆判定部と、監視対象システム5が違反状態または違反予兆状態にあることを管理者に通知する通知部と、を有する。
 監視対象システム5は、ルータやスイッチングハブを介して複数のサーバやストレージを接続したサーバシステムである。監視対象システム5は、例えば、Webサーバと、WebAP(Webアプリケーション)サーバと、DB(データベース)サーバと、ストレージとを含む。Webサーバは、ユーザのコンピュータとのインターフェースを成すサーバである。WebAPサーバは、ウェブサイトが提供するアプリケーションプログラムを処理するサーバである。DBサーバは、WebAPサーバの要求に応じてストレージに格納しているデータを参照、検索、更新するデータベースサーバである。ストレージは、アプリケーションプログラムのデータを記憶する記憶装置である。
 違反予兆条件設定支援システム1は、物理的には、例えば、CPU(Central Processing Unit)、記憶装置および入出力インターフェースを含んで構成される。記憶装置には、例えば、CPUで処理されるプログラムやデータを記憶するROM(Read Only Memory)やHDD(Hard Disk Drive)、主として制御処理のための各種作業領域として使用されるRAM(Random Access Memory)等の要素が含まれる。これらの要素は、互いにバスを介して接続されている。CPUが、ROMに記憶されたプログラムを実行し、入出力インターフェースを介して受信されるメッセージや、RAMに展開されたデータを処理することで、後述する各部の機能を実現することができる。
 図1に示すように、違反予兆条件設定支援システム1は、機能的には、例えば、違反条件類似度算出部11と、第一の類似度判定部12と、監視データ類似度算出部13と、第二の類似度判定部14と、画面生成表示部15と、を有する。また、違反予兆条件設定支援システム1は、上記各部によって参照される違反条件データベース21、監視データデータベース22および違反予兆条件データベース23を備える。
 違反条件類似度算出部11は、違反予兆条件の設定対象となる監視対象システム5(以下、「被設定監視対象システム」という。)において要求される違反条件と、被設定監視対象システム以外の他の監視対象システム(以下、「他監視システム」という。)において要求される違反条件との間の類似度を、それぞれ算出する。違反条件は、サービスレベルの違反状態であるかどうかを判断するための条件である。違反条件としては、例えば、例えば、稼働率が99・95%以上、平均応答時間の遵守率が90%以上、電力使用効率の遵守率が80%以上等の条件が該当する。
 違反条件の類似度は、例えば、ジャッカード係数やダイズ係数、シンプソン係数等の集合の類似度計算方法、コサイン類似度やピアソン相関係数等のベクトル類似度計算方法を用いて算出する。
 ジャッカード係数を用いて類似度を算出する場合について、具体例を挙げて説明する。例えば、被設定監視対象システムAでは、違反条件として、稼働率が99.9%以上、通常時の応答時間の遵守率が95%以上、ピーク時の応答時間の遵守率が90%以上、電力使用効率の遵守率が80%以上という4つの条件が設定され、他監視対象システムBでは、違反条件として、稼働率が99.9%以上、通常時の応答時間の遵守率が90%以上、電力使用効率の遵守率が80%以上という3つの条件が設定されているとする。
 この場合の類似度は、“2/(7-2)=0.4”となる。つまり、被設定監視対象システムAおよび他監視対象システムBの共通の違反条件数である“2”を、被設定監視対象システムAおよび他監視対象システムBの違反条件の総数である“7”から被設定監視対象システムAおよび他監視対象システムBの共通の違反条件数である“2”を減算した値である“5”で除算することで類似度が求められる。
 第一の類似度判定部12は、違反条件類似度算出部11により算出された類似度が第一の閾値以上、および/または、この類似度が上位から第一の順位以内に収まるか否かを判定する。第一の類似度判定部12は、この条件を満たす他監視対象システムを第一次候補として抽出する。
 上記第一の閾値および第一の順位は、実験等により管理者が適宜設定することができる。例えば、第一の閾値として、違反条件類似度算出部11により算出される類似度の内容に応じて、違反条件同士が類似していると判定可能な範囲の下限値を設定することができる。また、第一の順位として、少なくとも被設定監視対象システムに適用可能な違反予兆条件が排除されることのない順位を設定することができる。
 監視データ類似度算出部13は、第一次候補として抽出された他監視対象システムの監視データと、被設定監視対象システムの監視データとの間の類似度を、それぞれ算出する。監視データは、監視対象システムにおいて違反条件および違反予兆条件を判定する際の判定要素として利用可能な時系列データである。監視データとしては、例えば、稼働率や平均応答時間、電力使用効率等のサービスレベルに関わるデータ、ハードウェアやソフトウェアの稼働可否や通信可否等の稼働状態を示すデータ、CPU使用率やDISK入出力回数、DISK空き容量、メモリ使用等のサーバのリソース状態を示すデータ、リスエスト数や回線使用率、パケット破棄率、エラーパケット数等のネットワーク性能を示すデータが該当する。
 監視データの類似度は、例えば、図2に示すように、時系列の監視データを、所定時間ごとのベクトル列に変換し、二つの監視対象システムのベクトル列間の全ての組合せを、コサイン類似度やピアソン相関係数等のベクトル類似度計算方法で比較して算出する。
 コサイン類似度を用いて類似度を算出する場合について、具体例を挙げて説明する。コサイン類似度は、下記式(1)または式(2)を用いて算出する。
 θ≦(π/2)の場合
Figure JPOXMLDOC01-appb-M000001
 θ>(π/2)の場合
Figure JPOXMLDOC01-appb-M000002
 例えば、図3(A)に示すように、被設定監視対象システムAのベクトル列aが(0、1)であり、他監視対象システムBのベクトル列bが(1、1)である場合には、θが“π/4”となり、式(1)より、類似度は“0.71”となる。また、図3(B)に示すように、被設定監視対象システムAのベクトル列aが(0、1)であり、他監視対象システムBのベクトル列bが(√3、1)である場合には、θが“π/3”となり、式(1)より、類似度は“0.5”となる。また、図3(C)に示すように、被設定監視対象システムAのベクトル列aが(0、1)であり、他監視対象システムBのベクトル列bが(1、0)である場合には、θが“π/2”となり、式(1)より、類似度は“0”となる。
 図1に示す第二の類似度判定部14は、監視データ類似度算出部13により算出された類似度が第二の閾値以上、および/または、この類似度が上位から第二の順位以内に収まるか否かを判定する。第二の類似度判定部14は、この条件を満たす他監視対象システムにおいて設定されている違反予兆条件が、被設定監視対象システムの違反予兆条件の設定に適用できると判定する。
 上記第二の閾値および第二の順位は、実験等により管理者が適宜設定することができる。例えば、第二の閾値として、監視データ類似度算出部13により算出される類似度の内容に応じて、監視データ同士が類似していると判定可能な範囲の下限値を設定することができる。また、第二の順位として、少なくとも被設定監視対象システムに適用可能な違反予兆条件が排除されることのない順位を設定することができる。
 画面生成表示部15は、第二の類似度判定部14によって適用できると判定された他監視対象システムに設定されている違反予兆条件を、被設定監視対象システムに設定する違反予兆条件の候補として表示するための各種画面を生成する。画面生成表示部15は、生成した各種画面を、例えば被設定監視対象システムを監視する監視装置4のディスプレイ(表示装置)に表示させる。
 図4および図5を参照して、画面生成表示部15が生成する各種画面について説明する。図4は、違反予兆条件設定画面であり、図5は、違反予兆条件設定支援画面である。ここでは、監視装置Aが監視する監視対象システムAでシステム構成が変更され、その監視対象システムAの違反予兆条件を再設定する際に表示される画面例として説明する。
 図4に示す違反予兆条件設定画面は、適用可否欄と違反予兆条件欄と登録実績欄とを有する。各適用可否欄には、同一行の違反予兆条件欄に表示されている違反予兆条件を監視対象システムAの違反予兆条件に適用するか否かを選択するための選択欄が表示される。
 各違反予兆条件欄には、管理者によって設定される監視対象システムAの違反予兆条件の一つが表示される。各違反予兆条件欄に表示される違反予兆条件は、修正ボタンを押下して遷移可能な修正画面(不図示)で再設定することができる。
 各登録実績欄には、同一行の違反予兆条件欄に表示されている違反予兆条件と同一の違反予兆条件が他監視対象システムに登録されているか否かが表示される。登録実績欄に“あり”または“類似条件あり”が表示されている場合には、図5に示す違反予兆条件設定支援画面に遷移するためのリンクが埋め込まれている。
 “あり”のリンク先では、“あり”と同一行の違反予兆条件欄に表示されている違反予兆条件と同一の違反予兆条件が設定されている監視対象システムの違反予兆条件が一覧表示される。また、“類似条件あり”のリンク先では、“類似条件あり”と同一行の違反予兆条件欄に表示されている違反予兆条件と類似している違反予兆条件が設定されている監視対象システムの違反予兆条件が一覧表示される。
 図5に示す違反予兆条件設定支援画面は、監視対象システム名欄と監視装置名欄と違反予兆条件欄と詳細ボタン欄とを有する。監視対象システム名欄には、監視対象システムを識別する名称が表示される。監視装置名欄には、監視装置を識別する名称が表示される。違反予兆条件欄には、同一行の監視対象システム名欄に表示されている監視対象システムに設定されている各違反予兆条件が表示される。詳細ボタン欄には、同一行の監視対象システム名欄に表示されている監視対象システムと監視対象システムAとの間の監視条件類似度および監視データ類似度を例えばポップアップ画面に表示させるボタンである。
 図5に示す違反予兆条件設定支援画面の表示内容は、図4に示す違反予兆条件設定画面の登録実績欄に表示されている“あり”から遷移した場合を例示している。図4に示す“あり”と同一行の違反予兆条件欄には“稼働率>99.95%”という違反予兆条件が表示されている。したがって、図5に示す違反予兆条件設定支援画面には、違反予兆条件に“稼働率>99.95%”が設定されている監視対象システムの違反予兆条件が一覧表示されている。
 次に、図6および図7を参照して、実施形態における違反予兆条件設定支援システムの動作について説明する。本動作は、例えば、違反予兆条件設定支援システム1と通信可能な何れかの監視対象システム5において違反条件やシステム構成が変更された場合に、その変更を違反予兆条件設定支援システム1が検知することで開始する。
 最初に、違反予兆条件設定支援システム1は、違反条件またはシステム構成が変更された被設定監視対象システムの識別子を変数Xに格納し、被設定監視対象システム以外の全ての他監視対象システムの識別子を集合Sに格納する(ステップS101)。
 続いて、違反予兆条件設定支援システム1の違反条件類似度算出部11は、集合Sから他監視対象システムの識別子を一つ取り出す(ステップS102)。集合Sから識別子を取り出すことができなかった場合、つまり集合Sから取り出す識別子が一つも存在しない場合(ステップS103;NO)には、後述するステップS107に移行する。
 一方、集合Sから識別子を取り出せた場合(ステップS103;YES)に、違反条件類似度算出部11は、取り出した他監視対象システムの識別子を変数Yに格納する(ステップS104)。
 続いて、違反条件類似度算出部11は、変数Xに格納されている被設定監視対象システムの識別子を検索キーにして違反条件データベース21から取得した違反条件と、変数Yに格納されている他監視対象システムの識別子を検索キーにして違反条件データベース21から取得した違反条件と、の間の類似度を算出する(ステップS105)。
 続いて、違反条件類似度算出部11は、変数Yに格納されている他監視対象システムの識別子と、上記ステップS105で算出した違反条件類似度と、を組にして集合Tに格納する(ステップS106)。そして、上述したステップS102に戻る。
 続いて、第一の類似度判定部12は、集合Tに格納されている各組データを違反条件類似度の降順に並べ替え、違反条件類似度が第一の閾値(例えば0.8)以上、かつ、上位から第一の順位(例えば10位)以内に収まる組データを抽出し、集合T’に格納する(ステップS107)。
 続いて、監視データ類似度算出部13は、集合T’から他監視対象システムの識別子を一つ取り出す(ステップS108)。集合T’から識別子を取り出せた場合(ステップS109;YES)に、監視データ類似度算出部13は、取り出した他監視対象システムの識別子を変数Yに格納する(ステップS110)。
 続いて、監視データ類似度算出部13は、変数Xに格納されている被設定監視対象システムの識別子を検索キーにして監視データデータベース22から取得した監視データと、変数Yに格納されている他監視対象システムの識別子を検索キーにして監視データデータベース22から取得した監視データと、の間の類似度を算出する(ステップS111)。
 続いて、監視データ類似度算出部13は、変数Yに格納されている他監視対象システムの識別子と、上記ステップS105で算出した違反条件類似度と、上記ステップS111で算出した監視データ類似度と、を組にして集合Uに格納する(ステップS112)。そして、上述したステップS108に戻る。
 一方、上記ステップS109の判定において、集合T’から識別子を取り出すことができなかった場合、つまり集合T’から取り出す識別子が一つも存在しない場合(ステップS109;NO)に、第二の類似度判定部14は、集合Uに格納されている各組データを監視データ類似度の降順に並べ替え、監視データ類似度が第二の閾値(例えば0.8)以上、かつ、上位から第二の順位(例えば10位)以内に収まる組データを抽出し、集合U’に格納する(ステップS113)。
 続いて、画面生成表示部15は、変数Xと集合U’とを用いて、図4に示す違反予兆条件設定画面や図5に示す違反予兆条件設定支援画面を生成し(ステップS114)、被設定監視対象システムを監視する監視装置4のディスプレイに表示させる(ステップS115)。
 上述したように、実施形態における違反予兆条件設定支援システム1によれば、監視対象システムの違反条件やシステム構成を変更した場合に、被設定監視対象システムの違反条件および監視データと同一または類似の違反条件および監視データを有する他監視対象システムに設定されている違反予兆条件を管理者に提示することができる。
 これにより、管理者は、違反条件やシステム構成を変更した被設定監視対象システムに設定する違反予兆条件の妥当性を、同一または類似の違反条件および監視データを有する他監視対象システムに設定されている違反予兆条件を参照しながら検証することができる。それゆえに、違反条件やシステム構成を変更した監視対象システムの違反予兆条件を設定する際の作業負担を軽減させることができる。
 [変形例]
 なお、上述した実施形態は、単なる例示に過ぎず、実施形態に明示していない種々の変形や技術の適用を排除するものではない。すなわち、本発明は、その趣旨を逸脱しない範囲で様々な形態に変形して実施することができる。
 (第1変形例)
 上述した実施形態では、監視データの類似度を算出する際の具体例として、二つの監視対象システムのベクトル列間の全ての組合せをベクトル類似度計算方法で比較する方法(図2参照)を挙げて説明しているが、監視データの類似度を算出する方法は、これに限定されない。例えば、監視データの類似度を算出する前に、算出対象となる監視データをフィルタリングして削減してもよい。具体的には、被設定監視対象システムの監視データと不変関係にある監視データのみを用いて監視データの類似度を算出することとしてもよい。不変関係とは、所定閾値以上の相関度を有する関係をいう。
 不変関係にある監視データは、例えば以下のようにして抽出することができる。最初に、図8に示すように、被設定監視対象システムAおよび他監視対象システムBの時系列の監視データを、それぞれ所定時間ごとのベクトル列に変換する。続いて、二つの監視対象システムのベクトル列間の組合せのうち、同一時間帯のベクトル列間の組合せのみを対象にして、コサイン類似度やピアソン相関係数等のベクトル類似度計算方法を用いて比較し、類似度を算出する。続いて、算出した類似度が所定閾値以上である場合に、不変関係にあると判定し、監視データの類似度を算出する際の対象データとして抽出する。この抽出では、同一時間帯のベクトル列間の組合せのみを比較して類似度を算出するため、実施形態で説明したベクトル列間の全ての組合せを比較して類似度を算出する場合に比べて、処理時間を大幅に短縮することができる。
 したがって、第1変形例によれば、監視データの類似度を算出する際の処理対象をフィルタリングして削減することができるため、監視データの類似度を算出する際に要する時間を短縮することができる。これにより、監視対象システムの違反条件やシステム構成を変更した場合に、参照候補となる違反予兆条件を管理者に迅速に提示することが可能となる。それゆえに、違反条件やシステム構成を変更した監視対象システムの違反予兆条件を設定する際の作業負担を軽減させることが可能となる。
 (第2変形例)
 上述した実施形態では、違反条件やシステム構成が変更されるたびに、全てのデータを対象にして再度違反条件類似度や監視データ類似度を算出しているが、これに限定されない。例えば、違反条件類似度や監視データ類似度を算出したときのデータを履歴として保存し、違反条件類似度や監視データ類似度を算出する際に、その履歴を参照し、既に算出済であることが判明した場合には、類似度の算出処理をスキップして省略してもよい。
 これにより、類似度の算出に要する時間を削減することができるため、参照候補となる違反予兆条件を管理者に提示する時間を短縮することが可能となる。それゆえに、違反条件やシステム構成を変更した監視対象システムの違反予兆条件を設定する際の作業負担を軽減させることが可能となる。
 また、上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、本発明を以下に限定するものではない。
 (付記1) サービスレベル違反への予兆が出現している状態であるかどうかを判断するための違反予兆条件の設定を支援する違反予兆条件設定支援システムであって、前記違反予兆条件を設定する対象システムにおいて要求される、サービスレベルの違反状態であるかどうかを判断するための違反条件と、前記対象システム以外の他システムにおいて要求される前記違反条件との間の類似度を算出する第一の類似度算出部と、前記対象システムにおいて前記違反条件および前記違反予兆条件に利用する監視データと、前記他システムにおける前記監視データとの間の類似度を算出する第二の類似度算出部と、前記第一の類似度算出部により算出された類似度、および前記第二の類似度算出部により算出された類似度に基づいて、前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できるか否かを判定する判定部と、前記判定部により前記適用できると判定された前記他システムにおいて設定されている前記違反予兆条件を表示させる表示制御部と、を備えることを特徴とする違反予兆条件設定支援システム。
 (付記2) 前記判定部は、前記第一の類似度算出部により算出された類似度が第一の閾値以上であること、および/または、当該類似度が上位から第一の順位以内に収まること、を満たす前記他システムを第一次候補として抽出する抽出部を含み、前記第二の類似度算出部は、前記第一次候補として抽出された前記他システムの前記監視データと前記対象システムの前記監視データとの間の類似度を算出する、ことを特徴とする付記1記載の違反予兆条件設定支援システム。
 (付記3) 前記判定部は、前記第二の類似度算出部により算出された類似度が第二の閾値以上であること、および/または、当該類似度が上位から第二の順位以内に収まること、を満たす前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できると判定する、ことを特徴とする付記2記載の違反予兆条件設定支援システム。
 (付記4) サービスレベル違反への予兆が出現している状態であるかどうかを判断するための違反予兆条件の設定を支援する違反予兆条件設定支援システムを制御する違反予兆条件設定支援方法であって、前記違反予兆条件を設定する対象システムにおいて要求される、サービスレベルの違反状態であるかどうかを判断するための違反条件と、前記対象システム以外の他システムにおいて要求される前記違反条件との間の類似度を算出する第一の類似度算出ステップと、前記対象システムにおいて前記違反条件および前記違反予兆条件に利用する監視データと、前記他システムにおける前記監視データとの間の類似度を算出する第二の類似度算出ステップと、前記第一の類似度算出ステップにおいて算出された類似度、および前記第二の類似度算出ステップにおいて算出された類似度に基づいて、前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できるか否かを判定する判定ステップと、前記判定ステップにおいて前記適用できると判定された前記他システムにおいて設定されている前記違反予兆条件を表示させる表示制御ステップと、を含むことを特徴とする違反予兆条件設定支援方法。
 (付記5) 付記4に記載の各ステップをコンピュータに実行させるための違反予兆条件設定支援プログラム。
 この出願は、2010年11月17日に出願された日本出願特願2010-256830を基礎とする優先権を主張し、その開示の全てをここに取り込む。
 本発明に係る違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラムは、違反予兆条件を設定する際の作業負担を軽減することに適している。
 1…違反予兆条件設定支援システム、3…監視装置、5…監視対象システム、11…違反条件類似度算出部、12…第一の類似度判定部、13…監視データ類似度算出部、14…第二の類似度判定部、15…画面生成表示部、21…違反条件データベース、22…監視データデータベース、23…違反予兆条件データベース。

Claims (5)

  1.  サービスレベル違反への予兆が出現している状態であるかどうかを判断するための違反予兆条件の設定を支援する違反予兆条件設定支援システムであって、
     前記違反予兆条件を設定する対象システムにおいて要求される、サービスレベルの違反状態であるかどうかを判断するための違反条件と、前記対象システム以外の他システムにおいて要求される前記違反条件との間の類似度を算出する第一の類似度算出部と、
     前記対象システムにおいて前記違反条件および前記違反予兆条件に利用する監視データと、前記他システムにおける前記監視データとの間の類似度を算出する第二の類似度算出部と、
     前記第一の類似度算出部により算出された類似度、および前記第二の類似度算出部により算出された類似度に基づいて、前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できるか否かを判定する判定部と、
     前記判定部により前記適用できると判定された前記他システムにおいて設定されている前記違反予兆条件を表示させる表示制御部と、
     を備えることを特徴とする違反予兆条件設定支援システム。
  2.  前記判定部は、前記第一の類似度算出部により算出された類似度が第一の閾値以上であること、および/または、当該類似度が上位から第一の順位以内に収まること、を満たす前記他システムを第一次候補として抽出する抽出部を含み、
     前記第二の類似度算出部は、前記第一次候補として抽出された前記他システムの前記監視データと前記対象システムの前記監視データとの間の類似度を算出する、
     ことを特徴とする請求項1記載の違反予兆条件設定支援システム。
  3.  前記判定部は、前記第二の類似度算出部により算出された類似度が第二の閾値以上であること、および/または、当該類似度が上位から第二の順位以内に収まること、を満たす前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できると判定する、ことを特徴とする請求項2記載の違反予兆条件設定支援システム。
  4.  サービスレベル違反への予兆が出現している状態であるかどうかを判断するための違反予兆条件の設定を支援する違反予兆条件設定支援システムを制御する違反予兆条件設定支援方法であって、
     前記違反予兆条件を設定する対象システムにおいて要求される、サービスレベルの違反状態であるかどうかを判断するための違反条件と、前記対象システム以外の他システムにおいて要求される前記違反条件との間の類似度を算出する第一の類似度算出ステップと、
     前記対象システムにおいて前記違反条件および前記違反予兆条件に利用する監視データと、前記他システムにおける前記監視データとの間の類似度を算出する第二の類似度算出ステップと、
     前記第一の類似度算出ステップにおいて算出された類似度、および前記第二の類似度算出ステップにおいて算出された類似度に基づいて、前記他システムにおいて設定されている前記違反予兆条件が、前記対象システムの前記違反予兆条件の設定に適用できるか否かを判定する判定ステップと、
     前記判定ステップにおいて前記適用できると判定された前記他システムにおいて設定されている前記違反予兆条件を表示させる表示制御ステップと、
     を含むことを特徴とする違反予兆条件設定支援方法。
  5.  請求項4に記載の各ステップをコンピュータに実行させるための違反予兆条件設定支援プログラム。
PCT/JP2011/076054 2010-11-17 2011-11-11 違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム Ceased WO2012067031A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2012544217A JP5831849B2 (ja) 2010-11-17 2011-11-11 違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム
US13/823,694 US9331912B2 (en) 2010-11-17 2011-11-11 Violation sign condition setting supporting system, violation sign condition setting supporting method, and violation sign condition setting supporting program

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2010-256830 2010-11-17
JP2010256830 2010-11-17

Publications (1)

Publication Number Publication Date
WO2012067031A1 true WO2012067031A1 (ja) 2012-05-24

Family

ID=46083963

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2011/076054 Ceased WO2012067031A1 (ja) 2010-11-17 2011-11-11 違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム

Country Status (3)

Country Link
US (1) US9331912B2 (ja)
JP (1) JP5831849B2 (ja)
WO (1) WO2012067031A1 (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014102661A (ja) * 2012-11-19 2014-06-05 Fujitsu Ltd 適用判定プログラム、障害検出装置および適用判定方法
JP2017068748A (ja) * 2015-10-01 2017-04-06 富士通株式会社 クラスタリングプログラム、クラスタリング方法、および情報処理装置
US9753801B2 (en) 2015-10-05 2017-09-05 Fujitsu Limited Detection method and information processing device
CN111314178A (zh) * 2020-02-25 2020-06-19 国网湖南省电力有限公司 一种电力监控系统设备违规外联检测方法、系统及介质

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR3058810A1 (fr) * 2016-11-14 2018-05-18 Orange Procede et dispositif d'actualisation d'un modele predictif d'une variable relative a un terminal mobile
JP7485934B2 (ja) * 2020-06-30 2024-05-17 富士通株式会社 情報処理プログラム、情報処理装置及び情報処理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053728A (ja) * 2004-08-11 2006-02-23 Nec Corp 障害対処ルール伝播方法、障害復旧装置およびプログラム
JP2009176203A (ja) * 2008-01-28 2009-08-06 Nec Corp 監視装置、監視システム、監視方法およびプログラム
WO2009144780A1 (ja) * 2008-05-27 2009-12-03 富士通株式会社 システム運用管理支援プログラム,方法及び装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4412031B2 (ja) 2004-03-31 2010-02-10 日本電気株式会社 ネットワーク監視システム及びその方法、プログラム
KR100826884B1 (ko) * 2006-11-27 2008-05-06 한국전자통신연구원 보안큐브를 이용한 네트워크 상태 표시장치 및 방법
JP5098821B2 (ja) 2008-06-02 2012-12-12 富士通株式会社 監視対象システムの障害等の予兆を検出する監視装置及び監視方法
TWI430212B (zh) * 2010-06-08 2014-03-11 Gorilla Technology Inc 利用多特徵自動集群法之異常行為偵測系統與方法
US9071510B2 (en) * 2012-10-25 2015-06-30 Hewlett-Packard Development Company, L.P. Determining root causes of network issues

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006053728A (ja) * 2004-08-11 2006-02-23 Nec Corp 障害対処ルール伝播方法、障害復旧装置およびプログラム
JP2009176203A (ja) * 2008-01-28 2009-08-06 Nec Corp 監視装置、監視システム、監視方法およびプログラム
WO2009144780A1 (ja) * 2008-05-27 2009-12-03 富士通株式会社 システム運用管理支援プログラム,方法及び装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
TAKESHI MATSUMURA: "Tokushu: SLA to Service Level Kanri", IT MEDIA KABUSHIKI KAISHA, 8 April 2004 (2004-04-08), Retrieved from the Internet <URL:http://web.archive.org/web/20040417203329/http://www.atmarkit.co.jp/fnetwork/tokusyuu/24sla/01.html> [retrieved on 20111214] *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014102661A (ja) * 2012-11-19 2014-06-05 Fujitsu Ltd 適用判定プログラム、障害検出装置および適用判定方法
JP2017068748A (ja) * 2015-10-01 2017-04-06 富士通株式会社 クラスタリングプログラム、クラスタリング方法、および情報処理装置
US10572512B2 (en) 2015-10-01 2020-02-25 Fujitsu Limited Detection method and information processing device
US9753801B2 (en) 2015-10-05 2017-09-05 Fujitsu Limited Detection method and information processing device
CN111314178A (zh) * 2020-02-25 2020-06-19 国网湖南省电力有限公司 一种电力监控系统设备违规外联检测方法、系统及介质
CN111314178B (zh) * 2020-02-25 2021-06-25 国网湖南省电力有限公司 一种电力监控系统设备违规外联检测方法、系统及介质

Also Published As

Publication number Publication date
JPWO2012067031A1 (ja) 2014-05-12
US20130198380A1 (en) 2013-08-01
JP5831849B2 (ja) 2015-12-09
US9331912B2 (en) 2016-05-03

Similar Documents

Publication Publication Date Title
JP5831849B2 (ja) 違反予兆条件設定支援システム、違反予兆条件設定支援方法および違反予兆条件設定支援プログラム
TWI603266B (zh) 虛擬機器之資源調整方法及系統
JP5418250B2 (ja) 異常検出装置、プログラム、及び異常検出方法
JP5874936B2 (ja) 運用管理装置、運用管理方法、及びプログラム
JP4527642B2 (ja) ネットワーク障害診断装置、ネットワーク障害診断方法およびネットワーク障害診断プログラム
EP2523115A1 (en) Operation management device, operation management method, and program storage medium
US20160315837A1 (en) Group server performance correction via actions to server subset
US20160055044A1 (en) Fault analysis method, fault analysis system, and storage medium
US9774654B2 (en) Service call graphs for website performance
US20170068581A1 (en) System and method for relationship based root cause recommendation
JP6160064B2 (ja) 適用判定プログラム、障害検出装置および適用判定方法
US20110307742A1 (en) Method and apparatus for cause analysis involving configuration changes
JP2008158628A (ja) 運用実績評価装置、運用実績評価方法、およびプログラム
US9417949B1 (en) Generic alarm correlation by means of normalized alarm codes
WO2007142053A1 (ja) 監視装置、監視システム、監視方法およびプログラム
JP6413537B2 (ja) 障害予兆通報装置および予兆通報方法、予兆通報プログラム
JP4939654B2 (ja) サービスレベル目標を有するコンピュータネットワークリソースの監視
US12113675B1 (en) Forced upgrade for network management system
WO2011155308A1 (ja) 契約違反予測システム、契約違反予測方法および契約違反予測プログラム
CN110990245A (zh) 基于调用链数据的微服务运行状态判断方法及装置
CN112347394A (zh) 网页信息的获取方法、装置、计算机设备和存储介质
US20160124957A1 (en) Managing Big Data for Services
CN114760190B (zh) 一种面向服务的融合网络性能异常检测方法
JP2019079120A (ja) 情報処理装置、情報処理方法、及びプログラム
WO2018163280A1 (ja) 予兆検知装置及び予兆検知方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 11842128

Country of ref document: EP

Kind code of ref document: A1

WWE Wipo information: entry into national phase

Ref document number: 13823694

Country of ref document: US

ENP Entry into the national phase

Ref document number: 2012544217

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 11842128

Country of ref document: EP

Kind code of ref document: A1